Diff 474701

llvm/lib/Target/RISCV/RISCVISelLowering.cpp

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 1,872 Lines • ▼ Show 20 Lines	getDefaultScalableVLOps(MVT VecVT, SDLoc DL, SelectionDAG &DAG,
return getDefaultVLOps(VecVT, VecVT, DL, DAG, Subtarget);		return getDefaultVLOps(VecVT, VecVT, DL, DAG, Subtarget);
}		}

// The state of RVV BUILD_VECTOR and VECTOR_SHUFFLE lowering is that very few		// The state of RVV BUILD_VECTOR and VECTOR_SHUFFLE lowering is that very few
// of either is (currently) supported. This can get us into an infinite loop		// of either is (currently) supported. This can get us into an infinite loop
// where we try to lower a BUILD_VECTOR as a VECTOR_SHUFFLE as a BUILD_VECTOR		// where we try to lower a BUILD_VECTOR as a VECTOR_SHUFFLE as a BUILD_VECTOR
// as a ..., etc.		// as a ..., etc.
// Until either (or both) of these can reliably lower any node, reporting that		// Until either (or both) of these can reliably lower any node, reporting that
// we don't want to expand BUILD_VECTORs via VECTOR_SHUFFLEs at least breaks		// we don't want to expand BUILD_VECTORs via VECTOR_SHUFFLEs at least breaks
		craig.topperUnsubmitted Done Reply Inline Actions AVL is unsigned. Why getSExtValue? craig.topper: AVL is unsigned. Why getSExtValue?
// the infinite loop. Note that this lowers BUILD_VECTOR through the stack,		// the infinite loop. Note that this lowers BUILD_VECTOR through the stack,
// which is not desirable.		// which is not desirable.
bool RISCVTargetLowering::shouldExpandBuildVectorWithShuffles(		bool RISCVTargetLowering::shouldExpandBuildVectorWithShuffles(
EVT VT, unsigned DefinedValues) const {		EVT VT, unsigned DefinedValues) const {
return false;		return false;
}		}

static SDValue lowerFP_TO_INT_SAT(SDValue Op, SelectionDAG &DAG,		static SDValue lowerFP_TO_INT_SAT(SDValue Op, SelectionDAG &DAG,
▲ Show 20 Lines • Show All 3,824 Lines • ▼ Show 20 Lines	SDValue RISCVTargetLowering::lowerVECREDUCE(SDValue Op,
}		}

MVT M1VT = getLMUL1VT(ContainerVT);		MVT M1VT = getLMUL1VT(ContainerVT);
MVT XLenVT = Subtarget.getXLenVT();		MVT XLenVT = Subtarget.getXLenVT();

auto [Mask, VL] = getDefaultVLOps(VecVT, ContainerVT, DL, DAG, Subtarget);		auto [Mask, VL] = getDefaultVLOps(VecVT, ContainerVT, DL, DAG, Subtarget);

SDValue NeutralElem =		SDValue NeutralElem =
DAG.getNeutralElement(BaseOpc, DL, VecEltVT, SDNodeFlags());		DAG.getNeutralElement(BaseOpc, DL, VecEltVT, SDNodeFlags());
SDValue IdentitySplat =		SDValue IdentitySplat;
		craig.topperUnsubmitted Done Reply Inline Actions Move this into an `else`. We shouldn't create nodes if they are going to end up dead. craig.topper: Move this into an `else`. We shouldn't create nodes if they are going to end up dead.
		if (ElementCount::isKnownGT(ContainerVT.getVectorElementCount(),
		M1VT.getVectorElementCount()))
		craig.topperUnsubmitted Done Reply Inline Actions Add curly braces. LLVM coding standards say that if/else should both uses braces if one does. craig.topper: Add curly braces. LLVM coding standards say that if/else should both uses braces if one does.
		IdentitySplat =
lowerScalarSplat(SDValue(), NeutralElem, DAG.getConstant(1, DL, XLenVT),		lowerScalarSplat(SDValue(), NeutralElem, DAG.getConstant(1, DL, XLenVT),
M1VT, DL, DAG, Subtarget);		M1VT, DL, DAG, Subtarget);
		else {
		IdentitySplat = lowerScalarSplat(SDValue(), NeutralElem, VL, ContainerVT,
		DL, DAG, Subtarget);
		// Make sure that it is of LMUL=1 type.
		IdentitySplat =
		DAG.getNode(ISD::INSERT_SUBVECTOR, DL, M1VT, DAG.getUNDEF(M1VT),
		IdentitySplat, DAG.getConstant(0, DL, XLenVT));
		}

SDValue Reduction = DAG.getNode(RVVOpcode, DL, M1VT, DAG.getUNDEF(M1VT), Vec,		SDValue Reduction = DAG.getNode(RVVOpcode, DL, M1VT, DAG.getUNDEF(M1VT), Vec,
IdentitySplat, Mask, VL);		IdentitySplat, Mask, VL);
SDValue Elt0 = DAG.getNode(ISD::EXTRACT_VECTOR_ELT, DL, VecEltVT, Reduction,		SDValue Elt0 = DAG.getNode(ISD::EXTRACT_VECTOR_ELT, DL, VecEltVT, Reduction,
DAG.getConstant(0, DL, XLenVT));		DAG.getConstant(0, DL, XLenVT));
return DAG.getSExtOrTrunc(Elt0, DL, Op.getValueType());		return DAG.getSExtOrTrunc(Elt0, DL, Op.getValueType());
}		}

// Given a reduction op, this function returns the matching reduction opcode,		// Given a reduction op, this function returns the matching reduction opcode,
Show All 38 Lines	SDValue RISCVTargetLowering::lowerFPVECREDUCE(SDValue Op,
MVT VecVT = VectorVal.getSimpleValueType();		MVT VecVT = VectorVal.getSimpleValueType();

MVT ContainerVT = VecVT;		MVT ContainerVT = VecVT;
if (VecVT.isFixedLengthVector()) {		if (VecVT.isFixedLengthVector()) {
ContainerVT = getContainerForFixedLengthVector(VecVT);		ContainerVT = getContainerForFixedLengthVector(VecVT);
VectorVal = convertToScalableVector(ContainerVT, VectorVal, DAG, Subtarget);		VectorVal = convertToScalableVector(ContainerVT, VectorVal, DAG, Subtarget);
}		}

MVT M1VT = getLMUL1VT(VectorVal.getSimpleValueType());		MVT M1VT = getLMUL1VT(ContainerVT);
MVT XLenVT = Subtarget.getXLenVT();		MVT XLenVT = Subtarget.getXLenVT();

auto [Mask, VL] = getDefaultVLOps(VecVT, ContainerVT, DL, DAG, Subtarget);		auto [Mask, VL] = getDefaultVLOps(VecVT, ContainerVT, DL, DAG, Subtarget);

SDValue ScalarSplat =		SDValue ScalarSplat;
		if (ElementCount::isKnownGT(ContainerVT.getVectorElementCount(),
		M1VT.getVectorElementCount()))
		craig.topperUnsubmitted Done Reply Inline Actions Curly braces craig.topper: Curly braces
		ScalarSplat =
lowerScalarSplat(SDValue(), ScalarVal, DAG.getConstant(1, DL, XLenVT),		lowerScalarSplat(SDValue(), ScalarVal, DAG.getConstant(1, DL, XLenVT),
M1VT, DL, DAG, Subtarget);		M1VT, DL, DAG, Subtarget);
		else {
		ScalarSplat = lowerScalarSplat(SDValue(), ScalarVal, VL, ContainerVT, DL,
		DAG, Subtarget);
		// Make sure that it is of LMUL=1 type.
		ScalarSplat =
		DAG.getNode(ISD::INSERT_SUBVECTOR, DL, M1VT, DAG.getUNDEF(M1VT),
		ScalarSplat, DAG.getConstant(0, DL, XLenVT));
		}

SDValue Reduction = DAG.getNode(RVVOpcode, DL, M1VT, DAG.getUNDEF(M1VT),		SDValue Reduction = DAG.getNode(RVVOpcode, DL, M1VT, DAG.getUNDEF(M1VT),
VectorVal, ScalarSplat, Mask, VL);		VectorVal, ScalarSplat, Mask, VL);
return DAG.getNode(ISD::EXTRACT_VECTOR_ELT, DL, VecEltVT, Reduction,		return DAG.getNode(ISD::EXTRACT_VECTOR_ELT, DL, VecEltVT, Reduction,
DAG.getConstant(0, DL, XLenVT));		DAG.getConstant(0, DL, XLenVT));
}		}

static unsigned getRVVVPReductionOp(unsigned ISDOpcode) {		static unsigned getRVVVPReductionOp(unsigned ISDOpcode) {
switch (ISDOpcode) {		switch (ISDOpcode) {
▲ Show 20 Lines • Show All 49 Lines • ▼ Show 20 Lines	SDValue RISCVTargetLowering::lowerVPREDUCE(SDValue Op,

SDValue VL = Op.getOperand(3);		SDValue VL = Op.getOperand(3);
SDValue Mask = Op.getOperand(2);		SDValue Mask = Op.getOperand(2);

MVT M1VT = getLMUL1VT(ContainerVT);		MVT M1VT = getLMUL1VT(ContainerVT);
MVT XLenVT = Subtarget.getXLenVT();		MVT XLenVT = Subtarget.getXLenVT();
MVT ResVT = !VecVT.isInteger() \|\| VecEltVT.bitsGE(XLenVT) ? VecEltVT : XLenVT;		MVT ResVT = !VecVT.isInteger() \|\| VecEltVT.bitsGE(XLenVT) ? VecEltVT : XLenVT;

SDValue StartSplat = lowerScalarSplat(SDValue(), Op.getOperand(0),		SDValue StartSplat;
DAG.getConstant(1, DL, XLenVT), M1VT,		if (ElementCount::isKnownGT(ContainerVT.getVectorElementCount(),
		M1VT.getVectorElementCount()))
		StartSplat = lowerScalarSplat(SDValue(), Op.getOperand(0),
		craig.topperUnsubmitted Done Reply Inline Actions Curly braces craig.topper: Curly braces
		DAG.getConstant(1, DL, XLenVT), M1VT, DL, DAG,
		Subtarget);
		else {
		StartSplat = lowerScalarSplat(SDValue(), Op.getOperand(0), VL, ContainerVT,
DL, DAG, Subtarget);		DL, DAG, Subtarget);
		// Make sure that it is of LMUL=1 type.
		StartSplat =
		DAG.getNode(ISD::INSERT_SUBVECTOR, DL, M1VT, DAG.getUNDEF(M1VT),
		StartSplat, DAG.getConstant(0, DL, XLenVT));
		}

SDValue Reduction =		SDValue Reduction =
DAG.getNode(RVVOpcode, DL, M1VT, StartSplat, Vec, StartSplat, Mask, VL);		DAG.getNode(RVVOpcode, DL, M1VT, StartSplat, Vec, StartSplat, Mask, VL);
SDValue Elt0 = DAG.getNode(ISD::EXTRACT_VECTOR_ELT, DL, ResVT, Reduction,		SDValue Elt0 = DAG.getNode(ISD::EXTRACT_VECTOR_ELT, DL, ResVT, Reduction,
DAG.getConstant(0, DL, XLenVT));		DAG.getConstant(0, DL, XLenVT));
if (!VecVT.isInteger())		if (!VecVT.isInteger())
return Elt0;		return Elt0;
return DAG.getSExtOrTrunc(Elt0, DL, Op.getValueType());		return DAG.getSExtOrTrunc(Elt0, DL, Op.getValueType());
}		}
▲ Show 20 Lines • Show All 2,013 Lines • ▼ Show 20 Lines	if (Opc == ISD::FADD && !N->getFlags().hasAllowReassociation())
return SDValue();		return SDValue();

SDValue Extract = N->getOperand(ReduceIdx);		SDValue Extract = N->getOperand(ReduceIdx);
SDValue Reduce = Extract.getOperand(0);		SDValue Reduce = Extract.getOperand(0);
if (!Reduce.hasOneUse())		if (!Reduce.hasOneUse())
return SDValue();		return SDValue();

SDValue ScalarV = Reduce.getOperand(2);		SDValue ScalarV = Reduce.getOperand(2);
		EVT SplatVT = ScalarV.getValueType();

		// ScalarV may be a widened vector.
		if (ScalarV.getOpcode() == ISD::INSERT_SUBVECTOR &&
		ScalarV.getOperand(0)->isUndef())
		ScalarV = ScalarV.getOperand(1);

// Make sure that ScalarV is a splat with VL=1.		// Make sure that ScalarV is a splat with VL>=1.
if (ScalarV.getOpcode() != RISCVISD::VFMV_S_F_VL &&		if (ScalarV.getOpcode() != RISCVISD::VFMV_S_F_VL &&
		ScalarV.getOpcode() != RISCVISD::VFMV_V_F_VL &&
ScalarV.getOpcode() != RISCVISD::VMV_S_X_VL &&		ScalarV.getOpcode() != RISCVISD::VMV_S_X_VL &&
ScalarV.getOpcode() != RISCVISD::VMV_V_X_VL)		ScalarV.getOpcode() != RISCVISD::VMV_V_X_VL)
return SDValue();		return SDValue();

if (!isOneConstant(ScalarV.getOperand(2)))		auto *RegisterVL = dyn_cast<RegisterSDNode>(ScalarV.getOperand(2));
		auto *ConstVL = dyn_cast<ConstantSDNode>(ScalarV.getOperand(2));
		if (!((RegisterVL && RegisterVL->getReg() == RISCV::X0) \|\|
		(ConstVL && ConstVL->getSExtValue() >= 1)))
return SDValue();		return SDValue();

// Check the scalar of ScalarV is neutral element		// Check the scalar of ScalarV is neutral element
// TODO: Deal with value other than neutral element.		// TODO: Deal with value other than neutral element.
if (!isNeutralConstant(N->getOpcode(), N->getFlags(), ScalarV.getOperand(1),		if (!isNeutralConstant(N->getOpcode(), N->getFlags(), ScalarV.getOperand(1),
0))		0))
return SDValue();		return SDValue();

if (!ScalarV.hasOneUse())		if (!ScalarV.hasOneUse())
return SDValue();		return SDValue();

EVT SplatVT = ScalarV.getValueType();
SDValue NewStart = N->getOperand(1 - ReduceIdx);		SDValue NewStart = N->getOperand(1 - ReduceIdx);
unsigned SplatOpc = RISCVISD::VFMV_S_F_VL;		unsigned SplatOpc = RISCVISD::VFMV_S_F_VL;
if (SplatVT.isInteger()) {		if (SplatVT.isInteger()) {
auto *C = dyn_cast<ConstantSDNode>(NewStart.getNode());		auto *C = dyn_cast<ConstantSDNode>(NewStart.getNode());
if (!C \|\| C->isZero() \|\| !isInt<5>(C->getSExtValue()))		if (!C \|\| C->isZero() \|\| !isInt<5>(C->getSExtValue()))
SplatOpc = RISCVISD::VMV_S_X_VL;		SplatOpc = RISCVISD::VMV_S_X_VL;
else		else
SplatOpc = RISCVISD::VMV_V_X_VL;		SplatOpc = RISCVISD::VMV_V_X_VL;
▲ Show 20 Lines • Show All 5,393 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-reduction-fp-vp.ll

; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py		; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
; RUN: llc -mtriple=riscv32 -mattr=+d,+zfh,+experimental-zvfh,+v -target-abi=ilp32d -riscv-v-vector-bits-min=128 \		; RUN: llc -mtriple=riscv32 -mattr=+d,+zfh,+experimental-zvfh,+v -target-abi=ilp32d -riscv-v-vector-bits-min=128 \
; RUN: -verify-machineinstrs < %s \| FileCheck %s		; RUN: -verify-machineinstrs < %s \| FileCheck %s
; RUN: llc -mtriple=riscv64 -mattr=+d,+zfh,+experimental-zvfh,+v -target-abi=lp64d -riscv-v-vector-bits-min=128 \		; RUN: llc -mtriple=riscv64 -mattr=+d,+zfh,+experimental-zvfh,+v -target-abi=lp64d -riscv-v-vector-bits-min=128 \
; RUN: -verify-machineinstrs < %s \| FileCheck %s		; RUN: -verify-machineinstrs < %s \| FileCheck %s

declare half @llvm.vp.reduce.fadd.v2f16(half, <2 x half>, <2 x i1>, i32)		declare half @llvm.vp.reduce.fadd.v2f16(half, <2 x half>, <2 x i1>, i32)

define half @vpreduce_fadd_v2f16(half %s, <2 x half> %v, <2 x i1> %m, i32 zeroext %evl) {		define half @vpreduce_fadd_v2f16(half %s, <2 x half> %v, <2 x i1> %m, i32 zeroext %evl) {
; CHECK-LABEL: vpreduce_fadd_v2f16:		; CHECK-LABEL: vpreduce_fadd_v2f16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma		; CHECK-NEXT: vsetvli zero, a0, e16, mf4, ta, ma
		reamesUnsubmitted Done Reply Inline Actions There's a subtle semantic distinction between the old and proposed code here where a0 is zero. The old code would unconditionally insert the neutral element into v9, and then the vfredusum would see a VL=0, and not update the destination register. As a result, the final return value is the neutral element. The new code leaves v9 unchanged, and thus the result is whatever lane 0 of the v9 register happened to contain previously. reames: There's a subtle semantic distinction between the old and proposed code here where a0 is zero.
; CHECK-NEXT: vfmv.s.f v9, fa0		; CHECK-NEXT: vfmv.v.f v9, fa0
; CHECK-NEXT: vsetvli zero, a0, e16, mf4, tu, ma		; CHECK-NEXT: vsetvli zero, zero, e16, mf4, tu, ma
; CHECK-NEXT: vfredusum.vs v9, v8, v9, v0.t		; CHECK-NEXT: vfredusum.vs v9, v8, v9, v0.t
; CHECK-NEXT: vfmv.f.s fa0, v9		; CHECK-NEXT: vfmv.f.s fa0, v9
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%r = call reassoc half @llvm.vp.reduce.fadd.v2f16(half %s, <2 x half> %v, <2 x i1> %m, i32 %evl)		%r = call reassoc half @llvm.vp.reduce.fadd.v2f16(half %s, <2 x half> %v, <2 x i1> %m, i32 %evl)
ret half %r		ret half %r
}		}

define half @vpreduce_ord_fadd_v2f16(half %s, <2 x half> %v, <2 x i1> %m, i32 zeroext %evl) {		define half @vpreduce_ord_fadd_v2f16(half %s, <2 x half> %v, <2 x i1> %m, i32 zeroext %evl) {
; CHECK-LABEL: vpreduce_ord_fadd_v2f16:		; CHECK-LABEL: vpreduce_ord_fadd_v2f16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma		; CHECK-NEXT: vsetvli zero, a0, e16, mf4, ta, ma
; CHECK-NEXT: vfmv.s.f v9, fa0		; CHECK-NEXT: vfmv.v.f v9, fa0
; CHECK-NEXT: vsetvli zero, a0, e16, mf4, tu, ma		; CHECK-NEXT: vsetvli zero, zero, e16, mf4, tu, ma
; CHECK-NEXT: vfredosum.vs v9, v8, v9, v0.t		; CHECK-NEXT: vfredosum.vs v9, v8, v9, v0.t
; CHECK-NEXT: vfmv.f.s fa0, v9		; CHECK-NEXT: vfmv.f.s fa0, v9
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%r = call half @llvm.vp.reduce.fadd.v2f16(half %s, <2 x half> %v, <2 x i1> %m, i32 %evl)		%r = call half @llvm.vp.reduce.fadd.v2f16(half %s, <2 x half> %v, <2 x i1> %m, i32 %evl)
ret half %r		ret half %r
}		}

declare half @llvm.vp.reduce.fadd.v4f16(half, <4 x half>, <4 x i1>, i32)		declare half @llvm.vp.reduce.fadd.v4f16(half, <4 x half>, <4 x i1>, i32)

define half @vpreduce_fadd_v4f16(half %s, <4 x half> %v, <4 x i1> %m, i32 zeroext %evl) {		define half @vpreduce_fadd_v4f16(half %s, <4 x half> %v, <4 x i1> %m, i32 zeroext %evl) {
; CHECK-LABEL: vpreduce_fadd_v4f16:		; CHECK-LABEL: vpreduce_fadd_v4f16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma		; CHECK-NEXT: vsetvli zero, a0, e16, mf2, ta, ma
; CHECK-NEXT: vfmv.s.f v9, fa0		; CHECK-NEXT: vfmv.v.f v9, fa0
; CHECK-NEXT: vsetvli zero, a0, e16, mf2, tu, ma		; CHECK-NEXT: vsetvli zero, zero, e16, mf2, tu, ma
; CHECK-NEXT: vfredusum.vs v9, v8, v9, v0.t		; CHECK-NEXT: vfredusum.vs v9, v8, v9, v0.t
; CHECK-NEXT: vfmv.f.s fa0, v9		; CHECK-NEXT: vfmv.f.s fa0, v9
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%r = call reassoc half @llvm.vp.reduce.fadd.v4f16(half %s, <4 x half> %v, <4 x i1> %m, i32 %evl)		%r = call reassoc half @llvm.vp.reduce.fadd.v4f16(half %s, <4 x half> %v, <4 x i1> %m, i32 %evl)
ret half %r		ret half %r
}		}

define half @vpreduce_ord_fadd_v4f16(half %s, <4 x half> %v, <4 x i1> %m, i32 zeroext %evl) {		define half @vpreduce_ord_fadd_v4f16(half %s, <4 x half> %v, <4 x i1> %m, i32 zeroext %evl) {
; CHECK-LABEL: vpreduce_ord_fadd_v4f16:		; CHECK-LABEL: vpreduce_ord_fadd_v4f16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma		; CHECK-NEXT: vsetvli zero, a0, e16, mf2, ta, ma
; CHECK-NEXT: vfmv.s.f v9, fa0		; CHECK-NEXT: vfmv.v.f v9, fa0
; CHECK-NEXT: vsetvli zero, a0, e16, mf2, tu, ma		; CHECK-NEXT: vsetvli zero, zero, e16, mf2, tu, ma
; CHECK-NEXT: vfredosum.vs v9, v8, v9, v0.t		; CHECK-NEXT: vfredosum.vs v9, v8, v9, v0.t
; CHECK-NEXT: vfmv.f.s fa0, v9		; CHECK-NEXT: vfmv.f.s fa0, v9
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%r = call half @llvm.vp.reduce.fadd.v4f16(half %s, <4 x half> %v, <4 x i1> %m, i32 %evl)		%r = call half @llvm.vp.reduce.fadd.v4f16(half %s, <4 x half> %v, <4 x i1> %m, i32 %evl)
ret half %r		ret half %r
}		}

declare float @llvm.vp.reduce.fadd.v2f32(float, <2 x float>, <2 x i1>, i32)		declare float @llvm.vp.reduce.fadd.v2f32(float, <2 x float>, <2 x i1>, i32)

define float @vpreduce_fadd_v2f32(float %s, <2 x float> %v, <2 x i1> %m, i32 zeroext %evl) {		define float @vpreduce_fadd_v2f32(float %s, <2 x float> %v, <2 x i1> %m, i32 zeroext %evl) {
; CHECK-LABEL: vpreduce_fadd_v2f32:		; CHECK-LABEL: vpreduce_fadd_v2f32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vsetvli zero, a0, e32, mf2, ta, ma
; CHECK-NEXT: vfmv.s.f v9, fa0		; CHECK-NEXT: vfmv.v.f v9, fa0
; CHECK-NEXT: vsetvli zero, a0, e32, mf2, tu, ma		; CHECK-NEXT: vsetvli zero, zero, e32, mf2, tu, ma
; CHECK-NEXT: vfredusum.vs v9, v8, v9, v0.t		; CHECK-NEXT: vfredusum.vs v9, v8, v9, v0.t
; CHECK-NEXT: vfmv.f.s fa0, v9		; CHECK-NEXT: vfmv.f.s fa0, v9
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%r = call reassoc float @llvm.vp.reduce.fadd.v2f32(float %s, <2 x float> %v, <2 x i1> %m, i32 %evl)		%r = call reassoc float @llvm.vp.reduce.fadd.v2f32(float %s, <2 x float> %v, <2 x i1> %m, i32 %evl)
ret float %r		ret float %r
}		}

define float @vpreduce_ord_fadd_v2f32(float %s, <2 x float> %v, <2 x i1> %m, i32 zeroext %evl) {		define float @vpreduce_ord_fadd_v2f32(float %s, <2 x float> %v, <2 x i1> %m, i32 zeroext %evl) {
; CHECK-LABEL: vpreduce_ord_fadd_v2f32:		; CHECK-LABEL: vpreduce_ord_fadd_v2f32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vsetvli zero, a0, e32, mf2, ta, ma
; CHECK-NEXT: vfmv.s.f v9, fa0		; CHECK-NEXT: vfmv.v.f v9, fa0
; CHECK-NEXT: vsetvli zero, a0, e32, mf2, tu, ma		; CHECK-NEXT: vsetvli zero, zero, e32, mf2, tu, ma
; CHECK-NEXT: vfredosum.vs v9, v8, v9, v0.t		; CHECK-NEXT: vfredosum.vs v9, v8, v9, v0.t
; CHECK-NEXT: vfmv.f.s fa0, v9		; CHECK-NEXT: vfmv.f.s fa0, v9
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%r = call float @llvm.vp.reduce.fadd.v2f32(float %s, <2 x float> %v, <2 x i1> %m, i32 %evl)		%r = call float @llvm.vp.reduce.fadd.v2f32(float %s, <2 x float> %v, <2 x i1> %m, i32 %evl)
ret float %r		ret float %r
}		}

declare float @llvm.vp.reduce.fadd.v4f32(float, <4 x float>, <4 x i1>, i32)		declare float @llvm.vp.reduce.fadd.v4f32(float, <4 x float>, <4 x i1>, i32)

define float @vpreduce_fadd_v4f32(float %s, <4 x float> %v, <4 x i1> %m, i32 zeroext %evl) {		define float @vpreduce_fadd_v4f32(float %s, <4 x float> %v, <4 x i1> %m, i32 zeroext %evl) {
; CHECK-LABEL: vpreduce_fadd_v4f32:		; CHECK-LABEL: vpreduce_fadd_v4f32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vsetvli zero, a0, e32, m1, ta, ma
; CHECK-NEXT: vfmv.s.f v9, fa0		; CHECK-NEXT: vfmv.v.f v9, fa0
; CHECK-NEXT: vsetvli zero, a0, e32, m1, tu, ma		; CHECK-NEXT: vsetvli zero, zero, e32, m1, tu, ma
; CHECK-NEXT: vfredusum.vs v9, v8, v9, v0.t		; CHECK-NEXT: vfredusum.vs v9, v8, v9, v0.t
; CHECK-NEXT: vfmv.f.s fa0, v9		; CHECK-NEXT: vfmv.f.s fa0, v9
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%r = call reassoc float @llvm.vp.reduce.fadd.v4f32(float %s, <4 x float> %v, <4 x i1> %m, i32 %evl)		%r = call reassoc float @llvm.vp.reduce.fadd.v4f32(float %s, <4 x float> %v, <4 x i1> %m, i32 %evl)
ret float %r		ret float %r
}		}

define float @vpreduce_ord_fadd_v4f32(float %s, <4 x float> %v, <4 x i1> %m, i32 zeroext %evl) {		define float @vpreduce_ord_fadd_v4f32(float %s, <4 x float> %v, <4 x i1> %m, i32 zeroext %evl) {
; CHECK-LABEL: vpreduce_ord_fadd_v4f32:		; CHECK-LABEL: vpreduce_ord_fadd_v4f32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vsetvli zero, a0, e32, m1, ta, ma
; CHECK-NEXT: vfmv.s.f v9, fa0		; CHECK-NEXT: vfmv.v.f v9, fa0
; CHECK-NEXT: vsetvli zero, a0, e32, m1, tu, ma		; CHECK-NEXT: vsetvli zero, zero, e32, m1, tu, ma
; CHECK-NEXT: vfredosum.vs v9, v8, v9, v0.t		; CHECK-NEXT: vfredosum.vs v9, v8, v9, v0.t
; CHECK-NEXT: vfmv.f.s fa0, v9		; CHECK-NEXT: vfmv.f.s fa0, v9
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%r = call float @llvm.vp.reduce.fadd.v4f32(float %s, <4 x float> %v, <4 x i1> %m, i32 %evl)		%r = call float @llvm.vp.reduce.fadd.v4f32(float %s, <4 x float> %v, <4 x i1> %m, i32 %evl)
ret float %r		ret float %r
}		}

declare float @llvm.vp.reduce.fadd.v64f32(float, <64 x float>, <64 x i1>, i32)		declare float @llvm.vp.reduce.fadd.v64f32(float, <64 x float>, <64 x i1>, i32)
▲ Show 20 Lines • Show All 60 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
ret float %r		ret float %r
}		}

declare double @llvm.vp.reduce.fadd.v2f64(double, <2 x double>, <2 x i1>, i32)		declare double @llvm.vp.reduce.fadd.v2f64(double, <2 x double>, <2 x i1>, i32)

define double @vpreduce_fadd_v2f64(double %s, <2 x double> %v, <2 x i1> %m, i32 zeroext %evl) {		define double @vpreduce_fadd_v2f64(double %s, <2 x double> %v, <2 x i1> %m, i32 zeroext %evl) {
; CHECK-LABEL: vpreduce_fadd_v2f64:		; CHECK-LABEL: vpreduce_fadd_v2f64:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 1, e64, m1, ta, ma		; CHECK-NEXT: vsetvli zero, a0, e64, m1, ta, ma
; CHECK-NEXT: vfmv.s.f v9, fa0		; CHECK-NEXT: vfmv.v.f v9, fa0
; CHECK-NEXT: vsetvli zero, a0, e64, m1, tu, ma		; CHECK-NEXT: vsetvli zero, zero, e64, m1, tu, ma
; CHECK-NEXT: vfredusum.vs v9, v8, v9, v0.t		; CHECK-NEXT: vfredusum.vs v9, v8, v9, v0.t
; CHECK-NEXT: vfmv.f.s fa0, v9		; CHECK-NEXT: vfmv.f.s fa0, v9
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%r = call reassoc double @llvm.vp.reduce.fadd.v2f64(double %s, <2 x double> %v, <2 x i1> %m, i32 %evl)		%r = call reassoc double @llvm.vp.reduce.fadd.v2f64(double %s, <2 x double> %v, <2 x i1> %m, i32 %evl)
ret double %r		ret double %r
}		}

define double @vpreduce_ord_fadd_v2f64(double %s, <2 x double> %v, <2 x i1> %m, i32 zeroext %evl) {		define double @vpreduce_ord_fadd_v2f64(double %s, <2 x double> %v, <2 x i1> %m, i32 zeroext %evl) {
; CHECK-LABEL: vpreduce_ord_fadd_v2f64:		; CHECK-LABEL: vpreduce_ord_fadd_v2f64:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 1, e64, m1, ta, ma		; CHECK-NEXT: vsetvli zero, a0, e64, m1, ta, ma
; CHECK-NEXT: vfmv.s.f v9, fa0		; CHECK-NEXT: vfmv.v.f v9, fa0
; CHECK-NEXT: vsetvli zero, a0, e64, m1, tu, ma		; CHECK-NEXT: vsetvli zero, zero, e64, m1, tu, ma
; CHECK-NEXT: vfredosum.vs v9, v8, v9, v0.t		; CHECK-NEXT: vfredosum.vs v9, v8, v9, v0.t
; CHECK-NEXT: vfmv.f.s fa0, v9		; CHECK-NEXT: vfmv.f.s fa0, v9
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%r = call double @llvm.vp.reduce.fadd.v2f64(double %s, <2 x double> %v, <2 x i1> %m, i32 %evl)		%r = call double @llvm.vp.reduce.fadd.v2f64(double %s, <2 x double> %v, <2 x i1> %m, i32 %evl)
ret double %r		ret double %r
}		}

declare double @llvm.vp.reduce.fadd.v3f64(double, <3 x double>, <3 x i1>, i32)		declare double @llvm.vp.reduce.fadd.v3f64(double, <3 x double>, <3 x i1>, i32)
▲ Show 20 Lines • Show All 54 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-reduction-fp.ll

Show All 32 Lines

declare half @llvm.vector.reduce.fadd.v2f16(half, <2 x half>)		declare half @llvm.vector.reduce.fadd.v2f16(half, <2 x half>)

define half @vreduce_fadd_v2f16(<2 x half>* %x, half %s) {		define half @vreduce_fadd_v2f16(<2 x half>* %x, half %s) {
; CHECK-LABEL: vreduce_fadd_v2f16:		; CHECK-LABEL: vreduce_fadd_v2f16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 2, e16, mf4, ta, ma		; CHECK-NEXT: vsetivli zero, 2, e16, mf4, ta, ma
; CHECK-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; CHECK-NEXT: vfmv.s.f v9, fa0		; CHECK-NEXT: vfmv.s.f v9, fa0
		pcwang-theadAuthorUnsubmitted Done Reply Inline Actions Floating-point regressions here. pcwang-thead: Floating-point regressions here.
; CHECK-NEXT: vfredusum.vs v8, v8, v9		; CHECK-NEXT: vfredusum.vs v8, v8, v9
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <2 x half>, <2 x half>* %x		%v = load <2 x half>, <2 x half>* %x
%red = call reassoc half @llvm.vector.reduce.fadd.v2f16(half %s, <2 x half> %v)		%red = call reassoc half @llvm.vector.reduce.fadd.v2f16(half %s, <2 x half> %v)
ret half %red		ret half %red
}		}

define half @vreduce_ord_fadd_v2f16(<2 x half>* %x, half %s) {		define half @vreduce_ord_fadd_v2f16(<2 x half>* %x, half %s) {
; CHECK-LABEL: vreduce_ord_fadd_v2f16:		; CHECK-LABEL: vreduce_ord_fadd_v2f16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 2, e16, mf4, ta, ma		; CHECK-NEXT: vsetivli zero, 2, e16, mf4, ta, ma
; CHECK-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; CHECK-NEXT: vfmv.s.f v9, fa0		; CHECK-NEXT: vfmv.v.f v9, fa0
; CHECK-NEXT: vfredosum.vs v8, v8, v9		; CHECK-NEXT: vfredosum.vs v8, v8, v9
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <2 x half>, <2 x half>* %x		%v = load <2 x half>, <2 x half>* %x
%red = call half @llvm.vector.reduce.fadd.v2f16(half %s, <2 x half> %v)		%red = call half @llvm.vector.reduce.fadd.v2f16(half %s, <2 x half> %v)
ret half %red		ret half %red
}		}

Show All 13 Lines	; CHECK-NEXT: ret
ret half %red		ret half %red
}		}

define half @vreduce_ord_fadd_v4f16(<4 x half>* %x, half %s) {		define half @vreduce_ord_fadd_v4f16(<4 x half>* %x, half %s) {
; CHECK-LABEL: vreduce_ord_fadd_v4f16:		; CHECK-LABEL: vreduce_ord_fadd_v4f16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
; CHECK-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; CHECK-NEXT: vfmv.s.f v9, fa0		; CHECK-NEXT: vfmv.v.f v9, fa0
; CHECK-NEXT: vfredosum.vs v8, v8, v9		; CHECK-NEXT: vfredosum.vs v8, v8, v9
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <4 x half>, <4 x half>* %x		%v = load <4 x half>, <4 x half>* %x
%red = call half @llvm.vector.reduce.fadd.v4f16(half %s, <4 x half> %v)		%red = call half @llvm.vector.reduce.fadd.v4f16(half %s, <4 x half> %v)
ret half %red		ret half %red
}		}

Show All 13 Lines	; CHECK-NEXT: ret
ret half %red		ret half %red
}		}

define half @vreduce_ord_fadd_v8f16(<8 x half>* %x, half %s) {		define half @vreduce_ord_fadd_v8f16(<8 x half>* %x, half %s) {
; CHECK-LABEL: vreduce_ord_fadd_v8f16:		; CHECK-LABEL: vreduce_ord_fadd_v8f16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 8, e16, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 8, e16, m1, ta, ma
; CHECK-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; CHECK-NEXT: vfmv.s.f v9, fa0		; CHECK-NEXT: vfmv.v.f v9, fa0
; CHECK-NEXT: vfredosum.vs v8, v8, v9		; CHECK-NEXT: vfredosum.vs v8, v8, v9
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <8 x half>, <8 x half>* %x		%v = load <8 x half>, <8 x half>* %x
%red = call half @llvm.vector.reduce.fadd.v8f16(half %s, <8 x half> %v)		%red = call half @llvm.vector.reduce.fadd.v8f16(half %s, <8 x half> %v)
ret half %red		ret half %red
}		}

▲ Show 20 Lines • Show All 188 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%e = fpext <1 x half> %v to <1 x float>		%e = fpext <1 x half> %v to <1 x float>
%red = call reassoc float @llvm.vector.reduce.fadd.v1f32(float %s, <1 x float> %e)		%red = call reassoc float @llvm.vector.reduce.fadd.v1f32(float %s, <1 x float> %e)
ret float %red		ret float %red
}		}

define float @vreduce_ord_fwadd_v1f32(<1 x half>* %x, float %s) {		define float @vreduce_ord_fwadd_v1f32(<1 x half>* %x, float %s) {
; CHECK-LABEL: vreduce_ord_fwadd_v1f32:		; CHECK-LABEL: vreduce_ord_fwadd_v1f32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 1, e16, mf4, ta, ma		; CHECK-NEXT: vsetivli zero, 1, e32, mf2, ta, ma
; CHECK-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma
; CHECK-NEXT: vfmv.s.f v9, fa0		; CHECK-NEXT: vfmv.s.f v9, fa0
; CHECK-NEXT: vsetivli zero, 1, e16, mf4, ta, ma		; CHECK-NEXT: vsetvli zero, zero, e16, mf4, ta, ma
; CHECK-NEXT: vfwredosum.vs v8, v8, v9		; CHECK-NEXT: vfwredosum.vs v8, v8, v9
; CHECK-NEXT: vsetivli zero, 0, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 0, e32, m1, ta, ma
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <1 x half>, <1 x half>* %x		%v = load <1 x half>, <1 x half>* %x
%e = fpext <1 x half> %v to <1 x float>		%e = fpext <1 x half> %v to <1 x float>
%red = call float @llvm.vector.reduce.fadd.v1f32(float %s, <1 x float> %e)		%red = call float @llvm.vector.reduce.fadd.v1f32(float %s, <1 x float> %e)
ret float %red		ret float %red
Show All 15 Lines	; CHECK-NEXT: ret
ret float %red		ret float %red
}		}

define float @vreduce_ord_fadd_v2f32(<2 x float>* %x, float %s) {		define float @vreduce_ord_fadd_v2f32(<2 x float>* %x, float %s) {
; CHECK-LABEL: vreduce_ord_fadd_v2f32:		; CHECK-LABEL: vreduce_ord_fadd_v2f32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 2, e32, mf2, ta, ma		; CHECK-NEXT: vsetivli zero, 2, e32, mf2, ta, ma
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vfmv.s.f v9, fa0		; CHECK-NEXT: vfmv.v.f v9, fa0
; CHECK-NEXT: vfredosum.vs v8, v8, v9		; CHECK-NEXT: vfredosum.vs v8, v8, v9
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <2 x float>, <2 x float>* %x		%v = load <2 x float>, <2 x float>* %x
%red = call float @llvm.vector.reduce.fadd.v2f32(float %s, <2 x float> %v)		%red = call float @llvm.vector.reduce.fadd.v2f32(float %s, <2 x float> %v)
ret float %red		ret float %red
}		}

define float @vreduce_fwadd_v2f32(<2 x half>* %x, float %s) {		define float @vreduce_fwadd_v2f32(<2 x half>* %x, float %s) {
; CHECK-LABEL: vreduce_fwadd_v2f32:		; CHECK-LABEL: vreduce_fwadd_v2f32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 2, e16, mf4, ta, ma		; CHECK-NEXT: vsetivli zero, 2, e16, mf4, ta, ma
; CHECK-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 2, e32, m1, ta, ma
		craig.topperUnsubmitted Done Reply Inline Actions Why is this e32,m1 instead of e32, mf2? craig.topper: Why is this e32,m1 instead of e32, mf2?
		pcwang-theadAuthorUnsubmitted Done Reply Inline Actions Good catch! Fixed. pcwang-thead: Good catch! Fixed.
; CHECK-NEXT: vfmv.s.f v9, fa0		; CHECK-NEXT: vfmv.s.f v9, fa0
; CHECK-NEXT: vsetivli zero, 2, e16, mf4, ta, ma		; CHECK-NEXT: vsetivli zero, 2, e16, mf4, ta, ma
; CHECK-NEXT: vfwredusum.vs v8, v8, v9		; CHECK-NEXT: vfwredusum.vs v8, v8, v9
; CHECK-NEXT: vsetivli zero, 0, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 0, e32, m1, ta, ma
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <2 x half>, <2 x half>* %x		%v = load <2 x half>, <2 x half>* %x
%e = fpext <2 x half> %v to <2 x float>		%e = fpext <2 x half> %v to <2 x float>
%red = call reassoc float @llvm.vector.reduce.fadd.v2f32(float %s, <2 x float> %e)		%red = call reassoc float @llvm.vector.reduce.fadd.v2f32(float %s, <2 x float> %e)
ret float %red		ret float %red
}		}

define float @vreduce_ord_fwadd_v2f32(<2 x half>* %x, float %s) {		define float @vreduce_ord_fwadd_v2f32(<2 x half>* %x, float %s) {
; CHECK-LABEL: vreduce_ord_fwadd_v2f32:		; CHECK-LABEL: vreduce_ord_fwadd_v2f32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 2, e16, mf4, ta, ma		; CHECK-NEXT: vsetivli zero, 2, e32, mf2, ta, ma
; CHECK-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vfmv.v.f v9, fa0
; CHECK-NEXT: vfmv.s.f v9, fa0		; CHECK-NEXT: vsetvli zero, zero, e16, mf4, ta, ma
; CHECK-NEXT: vsetivli zero, 2, e16, mf4, ta, ma
; CHECK-NEXT: vfwredosum.vs v8, v8, v9		; CHECK-NEXT: vfwredosum.vs v8, v8, v9
; CHECK-NEXT: vsetivli zero, 0, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 0, e32, m1, ta, ma
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <2 x half>, <2 x half>* %x		%v = load <2 x half>, <2 x half>* %x
%e = fpext <2 x half> %v to <2 x float>		%e = fpext <2 x half> %v to <2 x float>
%red = call float @llvm.vector.reduce.fadd.v2f32(float %s, <2 x float> %e)		%red = call float @llvm.vector.reduce.fadd.v2f32(float %s, <2 x float> %e)
ret float %red		ret float %red
Show All 15 Lines	; CHECK-NEXT: ret
ret float %red		ret float %red
}		}

define float @vreduce_ord_fadd_v4f32(<4 x float>* %x, float %s) {		define float @vreduce_ord_fadd_v4f32(<4 x float>* %x, float %s) {
; CHECK-LABEL: vreduce_ord_fadd_v4f32:		; CHECK-LABEL: vreduce_ord_fadd_v4f32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vfmv.s.f v9, fa0		; CHECK-NEXT: vfmv.v.f v9, fa0
; CHECK-NEXT: vfredosum.vs v8, v8, v9		; CHECK-NEXT: vfredosum.vs v8, v8, v9
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <4 x float>, <4 x float>* %x		%v = load <4 x float>, <4 x float>* %x
%red = call float @llvm.vector.reduce.fadd.v4f32(float %s, <4 x float> %v)		%red = call float @llvm.vector.reduce.fadd.v4f32(float %s, <4 x float> %v)
ret float %red		ret float %red
}		}

Show All 14 Lines	; CHECK-NEXT: ret
ret float %red		ret float %red
}		}

define float @vreduce_ord_fwadd_v4f32(<4 x half>* %x, float %s) {		define float @vreduce_ord_fwadd_v4f32(<4 x half>* %x, float %s) {
; CHECK-LABEL: vreduce_ord_fwadd_v4f32:		; CHECK-LABEL: vreduce_ord_fwadd_v4f32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; CHECK-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; CHECK-NEXT: vfmv.s.f v9, fa0		; CHECK-NEXT: vfmv.v.f v9, fa0
; CHECK-NEXT: vsetvli zero, zero, e16, mf2, ta, ma		; CHECK-NEXT: vsetvli zero, zero, e16, mf2, ta, ma
; CHECK-NEXT: vfwredosum.vs v8, v8, v9		; CHECK-NEXT: vfwredosum.vs v8, v8, v9
; CHECK-NEXT: vsetvli zero, zero, e32, m1, ta, ma		; CHECK-NEXT: vsetvli zero, zero, e32, m1, ta, ma
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <4 x half>, <4 x half>* %x		%v = load <4 x half>, <4 x half>* %x
%e = fpext <4 x half> %v to <4 x float>		%e = fpext <4 x half> %v to <4 x float>
%red = call float @llvm.vector.reduce.fadd.v4f32(float %s, <4 x float> %e)		%red = call float @llvm.vector.reduce.fadd.v4f32(float %s, <4 x float> %e)
▲ Show 20 Lines • Show All 381 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
ret double %red		ret double %red
}		}

define double @vreduce_ord_fadd_v2f64(<2 x double>* %x, double %s) {		define double @vreduce_ord_fadd_v2f64(<2 x double>* %x, double %s) {
; CHECK-LABEL: vreduce_ord_fadd_v2f64:		; CHECK-LABEL: vreduce_ord_fadd_v2f64:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 2, e64, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 2, e64, m1, ta, ma
; CHECK-NEXT: vle64.v v8, (a0)		; CHECK-NEXT: vle64.v v8, (a0)
; CHECK-NEXT: vfmv.s.f v9, fa0		; CHECK-NEXT: vfmv.v.f v9, fa0
; CHECK-NEXT: vfredosum.vs v8, v8, v9		; CHECK-NEXT: vfredosum.vs v8, v8, v9
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <2 x double>, <2 x double>* %x		%v = load <2 x double>, <2 x double>* %x
%red = call double @llvm.vector.reduce.fadd.v2f64(double %s, <2 x double> %v)		%red = call double @llvm.vector.reduce.fadd.v2f64(double %s, <2 x double> %v)
ret double %red		ret double %red
}		}

Show All 14 Lines	; CHECK-NEXT: ret
ret double %red		ret double %red
}		}

define double @vreduce_ord_fwadd_v2f64(<2 x float>* %x, double %s) {		define double @vreduce_ord_fwadd_v2f64(<2 x float>* %x, double %s) {
; CHECK-LABEL: vreduce_ord_fwadd_v2f64:		; CHECK-LABEL: vreduce_ord_fwadd_v2f64:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 2, e64, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 2, e64, m1, ta, ma
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vfmv.s.f v9, fa0		; CHECK-NEXT: vfmv.v.f v9, fa0
; CHECK-NEXT: vsetvli zero, zero, e32, mf2, ta, ma		; CHECK-NEXT: vsetvli zero, zero, e32, mf2, ta, ma
; CHECK-NEXT: vfwredosum.vs v8, v8, v9		; CHECK-NEXT: vfwredosum.vs v8, v8, v9
; CHECK-NEXT: vsetvli zero, zero, e64, m1, ta, ma		; CHECK-NEXT: vsetvli zero, zero, e64, m1, ta, ma
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <2 x float>, <2 x float>* %x		%v = load <2 x float>, <2 x float>* %x
%e = fpext <2 x float> %v to <2 x double>		%e = fpext <2 x float> %v to <2 x double>
%red = call double @llvm.vector.reduce.fadd.v2f64(double %s, <2 x double> %e)		%red = call double @llvm.vector.reduce.fadd.v2f64(double %s, <2 x double> %e)
▲ Show 20 Lines • Show All 289 Lines • ▼ Show 20 Lines

define half @vreduce_fmin_v2f16(<2 x half>* %x) {		define half @vreduce_fmin_v2f16(<2 x half>* %x) {
; CHECK-LABEL: vreduce_fmin_v2f16:		; CHECK-LABEL: vreduce_fmin_v2f16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 2, e16, mf4, ta, ma		; CHECK-NEXT: vsetivli zero, 2, e16, mf4, ta, ma
; CHECK-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; CHECK-NEXT: lui a0, %hi(.LCPI68_0)		; CHECK-NEXT: lui a0, %hi(.LCPI68_0)
; CHECK-NEXT: addi a0, a0, %lo(.LCPI68_0)		; CHECK-NEXT: addi a0, a0, %lo(.LCPI68_0)
; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma
; CHECK-NEXT: vlse16.v v9, (a0), zero		; CHECK-NEXT: vlse16.v v9, (a0), zero
; CHECK-NEXT: vsetivli zero, 2, e16, mf4, ta, ma
; CHECK-NEXT: vfredmin.vs v8, v8, v9		; CHECK-NEXT: vfredmin.vs v8, v8, v9
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <2 x half>, <2 x half>* %x		%v = load <2 x half>, <2 x half>* %x
%red = call half @llvm.vector.reduce.fmin.v2f16(<2 x half> %v)		%red = call half @llvm.vector.reduce.fmin.v2f16(<2 x half> %v)
ret half %red		ret half %red
}		}

declare half @llvm.vector.reduce.fmin.v4f16(<4 x half>)		declare half @llvm.vector.reduce.fmin.v4f16(<4 x half>)

define half @vreduce_fmin_v4f16(<4 x half>* %x) {		define half @vreduce_fmin_v4f16(<4 x half>* %x) {
; CHECK-LABEL: vreduce_fmin_v4f16:		; CHECK-LABEL: vreduce_fmin_v4f16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
; CHECK-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; CHECK-NEXT: lui a0, %hi(.LCPI69_0)		; CHECK-NEXT: lui a0, %hi(.LCPI69_0)
; CHECK-NEXT: addi a0, a0, %lo(.LCPI69_0)		; CHECK-NEXT: addi a0, a0, %lo(.LCPI69_0)
; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma
; CHECK-NEXT: vlse16.v v9, (a0), zero		; CHECK-NEXT: vlse16.v v9, (a0), zero
; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
; CHECK-NEXT: vfredmin.vs v8, v8, v9		; CHECK-NEXT: vfredmin.vs v8, v8, v9
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <4 x half>, <4 x half>* %x		%v = load <4 x half>, <4 x half>* %x
%red = call half @llvm.vector.reduce.fmin.v4f16(<4 x half> %v)		%red = call half @llvm.vector.reduce.fmin.v4f16(<4 x half> %v)
ret half %red		ret half %red
}		}

define half @vreduce_fmin_v4f16_nonans(<4 x half>* %x) {		define half @vreduce_fmin_v4f16_nonans(<4 x half>* %x) {
; CHECK-LABEL: vreduce_fmin_v4f16_nonans:		; CHECK-LABEL: vreduce_fmin_v4f16_nonans:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
; CHECK-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; CHECK-NEXT: lui a0, %hi(.LCPI70_0)		; CHECK-NEXT: lui a0, %hi(.LCPI70_0)
; CHECK-NEXT: addi a0, a0, %lo(.LCPI70_0)		; CHECK-NEXT: addi a0, a0, %lo(.LCPI70_0)
; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma
; CHECK-NEXT: vlse16.v v9, (a0), zero		; CHECK-NEXT: vlse16.v v9, (a0), zero
; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
; CHECK-NEXT: vfredmin.vs v8, v8, v9		; CHECK-NEXT: vfredmin.vs v8, v8, v9
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <4 x half>, <4 x half>* %x		%v = load <4 x half>, <4 x half>* %x
%red = call nnan half @llvm.vector.reduce.fmin.v4f16(<4 x half> %v)		%red = call nnan half @llvm.vector.reduce.fmin.v4f16(<4 x half> %v)
ret half %red		ret half %red
}		}

define half @vreduce_fmin_v4f16_nonans_noinfs(<4 x half>* %x) {		define half @vreduce_fmin_v4f16_nonans_noinfs(<4 x half>* %x) {
; CHECK-LABEL: vreduce_fmin_v4f16_nonans_noinfs:		; CHECK-LABEL: vreduce_fmin_v4f16_nonans_noinfs:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
; CHECK-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; CHECK-NEXT: lui a0, %hi(.LCPI71_0)		; CHECK-NEXT: lui a0, %hi(.LCPI71_0)
; CHECK-NEXT: addi a0, a0, %lo(.LCPI71_0)		; CHECK-NEXT: addi a0, a0, %lo(.LCPI71_0)
; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma
; CHECK-NEXT: vlse16.v v9, (a0), zero		; CHECK-NEXT: vlse16.v v9, (a0), zero
; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
; CHECK-NEXT: vfredmin.vs v8, v8, v9		; CHECK-NEXT: vfredmin.vs v8, v8, v9
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <4 x half>, <4 x half>* %x		%v = load <4 x half>, <4 x half>* %x
%red = call nnan ninf half @llvm.vector.reduce.fmin.v4f16(<4 x half> %v)		%red = call nnan ninf half @llvm.vector.reduce.fmin.v4f16(<4 x half> %v)
ret half %red		ret half %red
}		}

Show All 25 Lines

define float @vreduce_fmin_v2f32(<2 x float>* %x) {		define float @vreduce_fmin_v2f32(<2 x float>* %x) {
; CHECK-LABEL: vreduce_fmin_v2f32:		; CHECK-LABEL: vreduce_fmin_v2f32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 2, e32, mf2, ta, ma		; CHECK-NEXT: vsetivli zero, 2, e32, mf2, ta, ma
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: lui a0, %hi(.LCPI73_0)		; CHECK-NEXT: lui a0, %hi(.LCPI73_0)
; CHECK-NEXT: addi a0, a0, %lo(.LCPI73_0)		; CHECK-NEXT: addi a0, a0, %lo(.LCPI73_0)
; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma
; CHECK-NEXT: vlse32.v v9, (a0), zero		; CHECK-NEXT: vlse32.v v9, (a0), zero
; CHECK-NEXT: vsetivli zero, 2, e32, mf2, ta, ma
; CHECK-NEXT: vfredmin.vs v8, v8, v9		; CHECK-NEXT: vfredmin.vs v8, v8, v9
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <2 x float>, <2 x float>* %x		%v = load <2 x float>, <2 x float>* %x
%red = call float @llvm.vector.reduce.fmin.v2f32(<2 x float> %v)		%red = call float @llvm.vector.reduce.fmin.v2f32(<2 x float> %v)
ret float %red		ret float %red
}		}

declare float @llvm.vector.reduce.fmin.v4f32(<4 x float>)		declare float @llvm.vector.reduce.fmin.v4f32(<4 x float>)

define float @vreduce_fmin_v4f32(<4 x float>* %x) {		define float @vreduce_fmin_v4f32(<4 x float>* %x) {
; CHECK-LABEL: vreduce_fmin_v4f32:		; CHECK-LABEL: vreduce_fmin_v4f32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: lui a0, %hi(.LCPI74_0)		; CHECK-NEXT: lui a0, %hi(.LCPI74_0)
; CHECK-NEXT: addi a0, a0, %lo(.LCPI74_0)		; CHECK-NEXT: addi a0, a0, %lo(.LCPI74_0)
; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma
; CHECK-NEXT: vlse32.v v9, (a0), zero		; CHECK-NEXT: vlse32.v v9, (a0), zero
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; CHECK-NEXT: vfredmin.vs v8, v8, v9		; CHECK-NEXT: vfredmin.vs v8, v8, v9
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <4 x float>, <4 x float>* %x		%v = load <4 x float>, <4 x float>* %x
%red = call float @llvm.vector.reduce.fmin.v4f32(<4 x float> %v)		%red = call float @llvm.vector.reduce.fmin.v4f32(<4 x float> %v)
ret float %red		ret float %red
}		}

define float @vreduce_fmin_v4f32_nonans(<4 x float>* %x) {		define float @vreduce_fmin_v4f32_nonans(<4 x float>* %x) {
; CHECK-LABEL: vreduce_fmin_v4f32_nonans:		; CHECK-LABEL: vreduce_fmin_v4f32_nonans:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: lui a0, %hi(.LCPI75_0)		; CHECK-NEXT: lui a0, %hi(.LCPI75_0)
; CHECK-NEXT: addi a0, a0, %lo(.LCPI75_0)		; CHECK-NEXT: addi a0, a0, %lo(.LCPI75_0)
; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma
; CHECK-NEXT: vlse32.v v9, (a0), zero		; CHECK-NEXT: vlse32.v v9, (a0), zero
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; CHECK-NEXT: vfredmin.vs v8, v8, v9		; CHECK-NEXT: vfredmin.vs v8, v8, v9
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <4 x float>, <4 x float>* %x		%v = load <4 x float>, <4 x float>* %x
%red = call nnan float @llvm.vector.reduce.fmin.v4f32(<4 x float> %v)		%red = call nnan float @llvm.vector.reduce.fmin.v4f32(<4 x float> %v)
ret float %red		ret float %red
}		}

define float @vreduce_fmin_v4f32_nonans_noinfs(<4 x float>* %x) {		define float @vreduce_fmin_v4f32_nonans_noinfs(<4 x float>* %x) {
; CHECK-LABEL: vreduce_fmin_v4f32_nonans_noinfs:		; CHECK-LABEL: vreduce_fmin_v4f32_nonans_noinfs:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: lui a0, %hi(.LCPI76_0)		; CHECK-NEXT: lui a0, %hi(.LCPI76_0)
; CHECK-NEXT: addi a0, a0, %lo(.LCPI76_0)		; CHECK-NEXT: addi a0, a0, %lo(.LCPI76_0)
; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma
; CHECK-NEXT: vlse32.v v9, (a0), zero		; CHECK-NEXT: vlse32.v v9, (a0), zero
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; CHECK-NEXT: vfredmin.vs v8, v8, v9		; CHECK-NEXT: vfredmin.vs v8, v8, v9
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <4 x float>, <4 x float>* %x		%v = load <4 x float>, <4 x float>* %x
%red = call nnan ninf float @llvm.vector.reduce.fmin.v4f32(<4 x float> %v)		%red = call nnan ninf float @llvm.vector.reduce.fmin.v4f32(<4 x float> %v)
ret float %red		ret float %red
}		}

declare float @llvm.vector.reduce.fmin.v128f32(<128 x float>)		declare float @llvm.vector.reduce.fmin.v128f32(<128 x float>)

define float @vreduce_fmin_v128f32(<128 x float>* %x) {		define float @vreduce_fmin_v128f32(<128 x float>* %x) {
; CHECK-LABEL: vreduce_fmin_v128f32:		; CHECK-LABEL: vreduce_fmin_v128f32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: li a1, 32		; CHECK-NEXT: li a1, 32
; CHECK-NEXT: vsetvli zero, a1, e32, m8, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e32, m8, ta, ma
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: addi a2, a0, 384		; CHECK-NEXT: addi a2, a0, 384
; CHECK-NEXT: vle32.v v16, (a2)		; CHECK-NEXT: vle32.v v16, (a2)
; CHECK-NEXT: addi a2, a0, 256		; CHECK-NEXT: addi a2, a0, 256
; CHECK-NEXT: addi a0, a0, 128		; CHECK-NEXT: addi a0, a0, 128
		pcwang-theadAuthorUnsubmitted Done Reply Inline Actions Spilling because of increasing of register pressure. pcwang-thead: Spilling because of increasing of register pressure.
; CHECK-NEXT: vle32.v v24, (a0)		; CHECK-NEXT: vle32.v v24, (a0)
; CHECK-NEXT: vle32.v v0, (a2)		; CHECK-NEXT: vle32.v v0, (a2)
; CHECK-NEXT: vfmin.vv v16, v24, v16		; CHECK-NEXT: vfmin.vv v16, v24, v16
; CHECK-NEXT: vfmin.vv v8, v8, v0		; CHECK-NEXT: vfmin.vv v8, v8, v0
; CHECK-NEXT: vfmin.vv v8, v8, v16		; CHECK-NEXT: vfmin.vv v8, v8, v16
; CHECK-NEXT: lui a0, %hi(.LCPI77_0)		; CHECK-NEXT: lui a0, %hi(.LCPI77_0)
; CHECK-NEXT: addi a0, a0, %lo(.LCPI77_0)		; CHECK-NEXT: addi a0, a0, %lo(.LCPI77_0)
; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma
Show All 11 Lines

define double @vreduce_fmin_v2f64(<2 x double>* %x) {		define double @vreduce_fmin_v2f64(<2 x double>* %x) {
; CHECK-LABEL: vreduce_fmin_v2f64:		; CHECK-LABEL: vreduce_fmin_v2f64:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 2, e64, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 2, e64, m1, ta, ma
; CHECK-NEXT: vle64.v v8, (a0)		; CHECK-NEXT: vle64.v v8, (a0)
; CHECK-NEXT: lui a0, %hi(.LCPI78_0)		; CHECK-NEXT: lui a0, %hi(.LCPI78_0)
; CHECK-NEXT: addi a0, a0, %lo(.LCPI78_0)		; CHECK-NEXT: addi a0, a0, %lo(.LCPI78_0)
; CHECK-NEXT: vsetivli zero, 1, e64, m1, ta, ma
; CHECK-NEXT: vlse64.v v9, (a0), zero		; CHECK-NEXT: vlse64.v v9, (a0), zero
; CHECK-NEXT: vsetivli zero, 2, e64, m1, ta, ma
; CHECK-NEXT: vfredmin.vs v8, v8, v9		; CHECK-NEXT: vfredmin.vs v8, v8, v9
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <2 x double>, <2 x double>* %x		%v = load <2 x double>, <2 x double>* %x
%red = call double @llvm.vector.reduce.fmin.v2f64(<2 x double> %v)		%red = call double @llvm.vector.reduce.fmin.v2f64(<2 x double> %v)
ret double %red		ret double %red
}		}

▲ Show 20 Lines • Show All 80 Lines • ▼ Show 20 Lines

define half @vreduce_fmax_v2f16(<2 x half>* %x) {		define half @vreduce_fmax_v2f16(<2 x half>* %x) {
; CHECK-LABEL: vreduce_fmax_v2f16:		; CHECK-LABEL: vreduce_fmax_v2f16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 2, e16, mf4, ta, ma		; CHECK-NEXT: vsetivli zero, 2, e16, mf4, ta, ma
; CHECK-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; CHECK-NEXT: lui a0, %hi(.LCPI83_0)		; CHECK-NEXT: lui a0, %hi(.LCPI83_0)
; CHECK-NEXT: addi a0, a0, %lo(.LCPI83_0)		; CHECK-NEXT: addi a0, a0, %lo(.LCPI83_0)
; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma
; CHECK-NEXT: vlse16.v v9, (a0), zero		; CHECK-NEXT: vlse16.v v9, (a0), zero
; CHECK-NEXT: vsetivli zero, 2, e16, mf4, ta, ma
; CHECK-NEXT: vfredmax.vs v8, v8, v9		; CHECK-NEXT: vfredmax.vs v8, v8, v9
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <2 x half>, <2 x half>* %x		%v = load <2 x half>, <2 x half>* %x
%red = call half @llvm.vector.reduce.fmax.v2f16(<2 x half> %v)		%red = call half @llvm.vector.reduce.fmax.v2f16(<2 x half> %v)
ret half %red		ret half %red
}		}

declare half @llvm.vector.reduce.fmax.v4f16(<4 x half>)		declare half @llvm.vector.reduce.fmax.v4f16(<4 x half>)

define half @vreduce_fmax_v4f16(<4 x half>* %x) {		define half @vreduce_fmax_v4f16(<4 x half>* %x) {
; CHECK-LABEL: vreduce_fmax_v4f16:		; CHECK-LABEL: vreduce_fmax_v4f16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
; CHECK-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; CHECK-NEXT: lui a0, %hi(.LCPI84_0)		; CHECK-NEXT: lui a0, %hi(.LCPI84_0)
; CHECK-NEXT: addi a0, a0, %lo(.LCPI84_0)		; CHECK-NEXT: addi a0, a0, %lo(.LCPI84_0)
; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma
; CHECK-NEXT: vlse16.v v9, (a0), zero		; CHECK-NEXT: vlse16.v v9, (a0), zero
; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
; CHECK-NEXT: vfredmax.vs v8, v8, v9		; CHECK-NEXT: vfredmax.vs v8, v8, v9
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <4 x half>, <4 x half>* %x		%v = load <4 x half>, <4 x half>* %x
%red = call half @llvm.vector.reduce.fmax.v4f16(<4 x half> %v)		%red = call half @llvm.vector.reduce.fmax.v4f16(<4 x half> %v)
ret half %red		ret half %red
}		}

define half @vreduce_fmax_v4f16_nonans(<4 x half>* %x) {		define half @vreduce_fmax_v4f16_nonans(<4 x half>* %x) {
; CHECK-LABEL: vreduce_fmax_v4f16_nonans:		; CHECK-LABEL: vreduce_fmax_v4f16_nonans:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
; CHECK-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; CHECK-NEXT: lui a0, %hi(.LCPI85_0)		; CHECK-NEXT: lui a0, %hi(.LCPI85_0)
; CHECK-NEXT: addi a0, a0, %lo(.LCPI85_0)		; CHECK-NEXT: addi a0, a0, %lo(.LCPI85_0)
; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma
; CHECK-NEXT: vlse16.v v9, (a0), zero		; CHECK-NEXT: vlse16.v v9, (a0), zero
; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
; CHECK-NEXT: vfredmax.vs v8, v8, v9		; CHECK-NEXT: vfredmax.vs v8, v8, v9
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <4 x half>, <4 x half>* %x		%v = load <4 x half>, <4 x half>* %x
%red = call nnan half @llvm.vector.reduce.fmax.v4f16(<4 x half> %v)		%red = call nnan half @llvm.vector.reduce.fmax.v4f16(<4 x half> %v)
ret half %red		ret half %red
}		}

define half @vreduce_fmax_v4f16_nonans_noinfs(<4 x half>* %x) {		define half @vreduce_fmax_v4f16_nonans_noinfs(<4 x half>* %x) {
; CHECK-LABEL: vreduce_fmax_v4f16_nonans_noinfs:		; CHECK-LABEL: vreduce_fmax_v4f16_nonans_noinfs:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
; CHECK-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; CHECK-NEXT: lui a0, %hi(.LCPI86_0)		; CHECK-NEXT: lui a0, %hi(.LCPI86_0)
; CHECK-NEXT: addi a0, a0, %lo(.LCPI86_0)		; CHECK-NEXT: addi a0, a0, %lo(.LCPI86_0)
; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma
; CHECK-NEXT: vlse16.v v9, (a0), zero		; CHECK-NEXT: vlse16.v v9, (a0), zero
; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
; CHECK-NEXT: vfredmax.vs v8, v8, v9		; CHECK-NEXT: vfredmax.vs v8, v8, v9
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <4 x half>, <4 x half>* %x		%v = load <4 x half>, <4 x half>* %x
%red = call nnan ninf half @llvm.vector.reduce.fmax.v4f16(<4 x half> %v)		%red = call nnan ninf half @llvm.vector.reduce.fmax.v4f16(<4 x half> %v)
ret half %red		ret half %red
}		}

Show All 25 Lines

define float @vreduce_fmax_v2f32(<2 x float>* %x) {		define float @vreduce_fmax_v2f32(<2 x float>* %x) {
; CHECK-LABEL: vreduce_fmax_v2f32:		; CHECK-LABEL: vreduce_fmax_v2f32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 2, e32, mf2, ta, ma		; CHECK-NEXT: vsetivli zero, 2, e32, mf2, ta, ma
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: lui a0, %hi(.LCPI88_0)		; CHECK-NEXT: lui a0, %hi(.LCPI88_0)
; CHECK-NEXT: addi a0, a0, %lo(.LCPI88_0)		; CHECK-NEXT: addi a0, a0, %lo(.LCPI88_0)
; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma
; CHECK-NEXT: vlse32.v v9, (a0), zero		; CHECK-NEXT: vlse32.v v9, (a0), zero
; CHECK-NEXT: vsetivli zero, 2, e32, mf2, ta, ma
; CHECK-NEXT: vfredmax.vs v8, v8, v9		; CHECK-NEXT: vfredmax.vs v8, v8, v9
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <2 x float>, <2 x float>* %x		%v = load <2 x float>, <2 x float>* %x
%red = call float @llvm.vector.reduce.fmax.v2f32(<2 x float> %v)		%red = call float @llvm.vector.reduce.fmax.v2f32(<2 x float> %v)
ret float %red		ret float %red
}		}

declare float @llvm.vector.reduce.fmax.v4f32(<4 x float>)		declare float @llvm.vector.reduce.fmax.v4f32(<4 x float>)

define float @vreduce_fmax_v4f32(<4 x float>* %x) {		define float @vreduce_fmax_v4f32(<4 x float>* %x) {
; CHECK-LABEL: vreduce_fmax_v4f32:		; CHECK-LABEL: vreduce_fmax_v4f32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: lui a0, %hi(.LCPI89_0)		; CHECK-NEXT: lui a0, %hi(.LCPI89_0)
; CHECK-NEXT: addi a0, a0, %lo(.LCPI89_0)		; CHECK-NEXT: addi a0, a0, %lo(.LCPI89_0)
; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma
; CHECK-NEXT: vlse32.v v9, (a0), zero		; CHECK-NEXT: vlse32.v v9, (a0), zero
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; CHECK-NEXT: vfredmax.vs v8, v8, v9		; CHECK-NEXT: vfredmax.vs v8, v8, v9
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <4 x float>, <4 x float>* %x		%v = load <4 x float>, <4 x float>* %x
%red = call float @llvm.vector.reduce.fmax.v4f32(<4 x float> %v)		%red = call float @llvm.vector.reduce.fmax.v4f32(<4 x float> %v)
ret float %red		ret float %red
}		}

define float @vreduce_fmax_v4f32_nonans(<4 x float>* %x) {		define float @vreduce_fmax_v4f32_nonans(<4 x float>* %x) {
; CHECK-LABEL: vreduce_fmax_v4f32_nonans:		; CHECK-LABEL: vreduce_fmax_v4f32_nonans:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: lui a0, %hi(.LCPI90_0)		; CHECK-NEXT: lui a0, %hi(.LCPI90_0)
; CHECK-NEXT: addi a0, a0, %lo(.LCPI90_0)		; CHECK-NEXT: addi a0, a0, %lo(.LCPI90_0)
; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma
; CHECK-NEXT: vlse32.v v9, (a0), zero		; CHECK-NEXT: vlse32.v v9, (a0), zero
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; CHECK-NEXT: vfredmax.vs v8, v8, v9		; CHECK-NEXT: vfredmax.vs v8, v8, v9
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <4 x float>, <4 x float>* %x		%v = load <4 x float>, <4 x float>* %x
%red = call nnan float @llvm.vector.reduce.fmax.v4f32(<4 x float> %v)		%red = call nnan float @llvm.vector.reduce.fmax.v4f32(<4 x float> %v)
ret float %red		ret float %red
}		}

define float @vreduce_fmax_v4f32_nonans_noinfs(<4 x float>* %x) {		define float @vreduce_fmax_v4f32_nonans_noinfs(<4 x float>* %x) {
; CHECK-LABEL: vreduce_fmax_v4f32_nonans_noinfs:		; CHECK-LABEL: vreduce_fmax_v4f32_nonans_noinfs:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: lui a0, %hi(.LCPI91_0)		; CHECK-NEXT: lui a0, %hi(.LCPI91_0)
; CHECK-NEXT: addi a0, a0, %lo(.LCPI91_0)		; CHECK-NEXT: addi a0, a0, %lo(.LCPI91_0)
; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma
; CHECK-NEXT: vlse32.v v9, (a0), zero		; CHECK-NEXT: vlse32.v v9, (a0), zero
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; CHECK-NEXT: vfredmax.vs v8, v8, v9		; CHECK-NEXT: vfredmax.vs v8, v8, v9
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <4 x float>, <4 x float>* %x		%v = load <4 x float>, <4 x float>* %x
%red = call nnan ninf float @llvm.vector.reduce.fmax.v4f32(<4 x float> %v)		%red = call nnan ninf float @llvm.vector.reduce.fmax.v4f32(<4 x float> %v)
ret float %red		ret float %red
}		}

Show All 31 Lines

define double @vreduce_fmax_v2f64(<2 x double>* %x) {		define double @vreduce_fmax_v2f64(<2 x double>* %x) {
; CHECK-LABEL: vreduce_fmax_v2f64:		; CHECK-LABEL: vreduce_fmax_v2f64:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 2, e64, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 2, e64, m1, ta, ma
; CHECK-NEXT: vle64.v v8, (a0)		; CHECK-NEXT: vle64.v v8, (a0)
; CHECK-NEXT: lui a0, %hi(.LCPI93_0)		; CHECK-NEXT: lui a0, %hi(.LCPI93_0)
; CHECK-NEXT: addi a0, a0, %lo(.LCPI93_0)		; CHECK-NEXT: addi a0, a0, %lo(.LCPI93_0)
; CHECK-NEXT: vsetivli zero, 1, e64, m1, ta, ma
; CHECK-NEXT: vlse64.v v9, (a0), zero		; CHECK-NEXT: vlse64.v v9, (a0), zero
; CHECK-NEXT: vsetivli zero, 2, e64, m1, ta, ma
; CHECK-NEXT: vfredmax.vs v8, v8, v9		; CHECK-NEXT: vfredmax.vs v8, v8, v9
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <2 x double>, <2 x double>* %x		%v = load <2 x double>, <2 x double>* %x
%red = call double @llvm.vector.reduce.fmax.v2f64(<2 x double> %v)		%red = call double @llvm.vector.reduce.fmax.v2f64(<2 x double> %v)
ret double %red		ret double %red
}		}

▲ Show 20 Lines • Show All 92 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-reduction-int-vp.ll

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: llc -mtriple=riscv32 -mattr=+v -riscv-v-vector-bits-min=128 -verify-machineinstrs < %s \			; RUN: llc -mtriple=riscv32 -mattr=+v -riscv-v-vector-bits-min=128 -verify-machineinstrs < %s \
	; RUN: \| FileCheck %s --check-prefixes=CHECK,RV32			; RUN: \| FileCheck %s --check-prefixes=CHECK,RV32
	; RUN: llc -mtriple=riscv64 -mattr=+v -riscv-v-vector-bits-min=128 -verify-machineinstrs < %s \			; RUN: llc -mtriple=riscv64 -mattr=+v -riscv-v-vector-bits-min=128 -verify-machineinstrs < %s \
	; RUN: \| FileCheck %s --check-prefixes=CHECK,RV64			; RUN: \| FileCheck %s --check-prefixes=CHECK,RV64

	declare i8 @llvm.vp.reduce.add.v2i8(i8, <2 x i8>, <2 x i1>, i32)			declare i8 @llvm.vp.reduce.add.v2i8(i8, <2 x i8>, <2 x i1>, i32)

	define signext i8 @vpreduce_add_v2i8(i8 signext %s, <2 x i8> %v, <2 x i1> %m, i32 zeroext %evl) {			define signext i8 @vpreduce_add_v2i8(i8 signext %s, <2 x i8> %v, <2 x i1> %m, i32 zeroext %evl) {
	; CHECK-LABEL: vpreduce_add_v2i8:			; CHECK-LABEL: vpreduce_add_v2i8:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e8, m1, ta, ma			; CHECK-NEXT: vsetvli zero, a1, e8, mf8, ta, ma
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.v.x v9, a0
	; CHECK-NEXT: vsetvli zero, a1, e8, mf8, tu, ma			; CHECK-NEXT: vsetvli zero, zero, e8, mf8, tu, ma
	; CHECK-NEXT: vredsum.vs v9, v8, v9, v0.t			; CHECK-NEXT: vredsum.vs v9, v8, v9, v0.t
	; CHECK-NEXT: vmv.x.s a0, v9			; CHECK-NEXT: vmv.x.s a0, v9
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call i8 @llvm.vp.reduce.add.v2i8(i8 %s, <2 x i8> %v, <2 x i1> %m, i32 %evl)			%r = call i8 @llvm.vp.reduce.add.v2i8(i8 %s, <2 x i8> %v, <2 x i1> %m, i32 %evl)
	ret i8 %r			ret i8 %r
	}			}

	declare i8 @llvm.vp.reduce.umax.v2i8(i8, <2 x i8>, <2 x i1>, i32)			declare i8 @llvm.vp.reduce.umax.v2i8(i8, <2 x i8>, <2 x i1>, i32)

	define signext i8 @vpreduce_umax_v2i8(i8 signext %s, <2 x i8> %v, <2 x i1> %m, i32 zeroext %evl) {			define signext i8 @vpreduce_umax_v2i8(i8 signext %s, <2 x i8> %v, <2 x i1> %m, i32 zeroext %evl) {
	; CHECK-LABEL: vpreduce_umax_v2i8:			; CHECK-LABEL: vpreduce_umax_v2i8:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: andi a0, a0, 255			; CHECK-NEXT: vsetvli zero, a1, e8, mf8, ta, ma
	; CHECK-NEXT: vsetivli zero, 1, e8, m1, ta, ma			; CHECK-NEXT: vmv.v.x v9, a0
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vsetvli zero, zero, e8, mf8, tu, ma
	; CHECK-NEXT: vsetvli zero, a1, e8, mf8, tu, ma
	; CHECK-NEXT: vredmaxu.vs v9, v8, v9, v0.t			; CHECK-NEXT: vredmaxu.vs v9, v8, v9, v0.t
	; CHECK-NEXT: vmv.x.s a0, v9			; CHECK-NEXT: vmv.x.s a0, v9
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call i8 @llvm.vp.reduce.umax.v2i8(i8 %s, <2 x i8> %v, <2 x i1> %m, i32 %evl)			%r = call i8 @llvm.vp.reduce.umax.v2i8(i8 %s, <2 x i8> %v, <2 x i1> %m, i32 %evl)
	ret i8 %r			ret i8 %r
	}			}

	declare i8 @llvm.vp.reduce.smax.v2i8(i8, <2 x i8>, <2 x i1>, i32)			declare i8 @llvm.vp.reduce.smax.v2i8(i8, <2 x i8>, <2 x i1>, i32)

	define signext i8 @vpreduce_smax_v2i8(i8 signext %s, <2 x i8> %v, <2 x i1> %m, i32 zeroext %evl) {			define signext i8 @vpreduce_smax_v2i8(i8 signext %s, <2 x i8> %v, <2 x i1> %m, i32 zeroext %evl) {
	; CHECK-LABEL: vpreduce_smax_v2i8:			; CHECK-LABEL: vpreduce_smax_v2i8:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e8, m1, ta, ma			; CHECK-NEXT: vsetvli zero, a1, e8, mf8, ta, ma
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.v.x v9, a0
	; CHECK-NEXT: vsetvli zero, a1, e8, mf8, tu, ma			; CHECK-NEXT: vsetvli zero, zero, e8, mf8, tu, ma
	; CHECK-NEXT: vredmax.vs v9, v8, v9, v0.t			; CHECK-NEXT: vredmax.vs v9, v8, v9, v0.t
	; CHECK-NEXT: vmv.x.s a0, v9			; CHECK-NEXT: vmv.x.s a0, v9
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call i8 @llvm.vp.reduce.smax.v2i8(i8 %s, <2 x i8> %v, <2 x i1> %m, i32 %evl)			%r = call i8 @llvm.vp.reduce.smax.v2i8(i8 %s, <2 x i8> %v, <2 x i1> %m, i32 %evl)
	ret i8 %r			ret i8 %r
	}			}

	declare i8 @llvm.vp.reduce.umin.v2i8(i8, <2 x i8>, <2 x i1>, i32)			declare i8 @llvm.vp.reduce.umin.v2i8(i8, <2 x i8>, <2 x i1>, i32)

	define signext i8 @vpreduce_umin_v2i8(i8 signext %s, <2 x i8> %v, <2 x i1> %m, i32 zeroext %evl) {			define signext i8 @vpreduce_umin_v2i8(i8 signext %s, <2 x i8> %v, <2 x i1> %m, i32 zeroext %evl) {
	; CHECK-LABEL: vpreduce_umin_v2i8:			; CHECK-LABEL: vpreduce_umin_v2i8:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: andi a0, a0, 255			; CHECK-NEXT: vsetvli zero, a1, e8, mf8, ta, ma
	; CHECK-NEXT: vsetivli zero, 1, e8, m1, ta, ma			; CHECK-NEXT: vmv.v.x v9, a0
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vsetvli zero, zero, e8, mf8, tu, ma
	; CHECK-NEXT: vsetvli zero, a1, e8, mf8, tu, ma
	; CHECK-NEXT: vredminu.vs v9, v8, v9, v0.t			; CHECK-NEXT: vredminu.vs v9, v8, v9, v0.t
	; CHECK-NEXT: vmv.x.s a0, v9			; CHECK-NEXT: vmv.x.s a0, v9
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call i8 @llvm.vp.reduce.umin.v2i8(i8 %s, <2 x i8> %v, <2 x i1> %m, i32 %evl)			%r = call i8 @llvm.vp.reduce.umin.v2i8(i8 %s, <2 x i8> %v, <2 x i1> %m, i32 %evl)
	ret i8 %r			ret i8 %r
	}			}

	declare i8 @llvm.vp.reduce.smin.v2i8(i8, <2 x i8>, <2 x i1>, i32)			declare i8 @llvm.vp.reduce.smin.v2i8(i8, <2 x i8>, <2 x i1>, i32)

	define signext i8 @vpreduce_smin_v2i8(i8 signext %s, <2 x i8> %v, <2 x i1> %m, i32 zeroext %evl) {			define signext i8 @vpreduce_smin_v2i8(i8 signext %s, <2 x i8> %v, <2 x i1> %m, i32 zeroext %evl) {
	; CHECK-LABEL: vpreduce_smin_v2i8:			; CHECK-LABEL: vpreduce_smin_v2i8:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e8, m1, ta, ma			; CHECK-NEXT: vsetvli zero, a1, e8, mf8, ta, ma
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.v.x v9, a0
	; CHECK-NEXT: vsetvli zero, a1, e8, mf8, tu, ma			; CHECK-NEXT: vsetvli zero, zero, e8, mf8, tu, ma
	; CHECK-NEXT: vredmin.vs v9, v8, v9, v0.t			; CHECK-NEXT: vredmin.vs v9, v8, v9, v0.t
	; CHECK-NEXT: vmv.x.s a0, v9			; CHECK-NEXT: vmv.x.s a0, v9
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call i8 @llvm.vp.reduce.smin.v2i8(i8 %s, <2 x i8> %v, <2 x i1> %m, i32 %evl)			%r = call i8 @llvm.vp.reduce.smin.v2i8(i8 %s, <2 x i8> %v, <2 x i1> %m, i32 %evl)
	ret i8 %r			ret i8 %r
	}			}

	declare i8 @llvm.vp.reduce.and.v2i8(i8, <2 x i8>, <2 x i1>, i32)			declare i8 @llvm.vp.reduce.and.v2i8(i8, <2 x i8>, <2 x i1>, i32)

	define signext i8 @vpreduce_and_v2i8(i8 signext %s, <2 x i8> %v, <2 x i1> %m, i32 zeroext %evl) {			define signext i8 @vpreduce_and_v2i8(i8 signext %s, <2 x i8> %v, <2 x i1> %m, i32 zeroext %evl) {
	; CHECK-LABEL: vpreduce_and_v2i8:			; CHECK-LABEL: vpreduce_and_v2i8:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e8, m1, ta, ma			; CHECK-NEXT: vsetvli zero, a1, e8, mf8, ta, ma
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.v.x v9, a0
	; CHECK-NEXT: vsetvli zero, a1, e8, mf8, tu, ma			; CHECK-NEXT: vsetvli zero, zero, e8, mf8, tu, ma
	; CHECK-NEXT: vredand.vs v9, v8, v9, v0.t			; CHECK-NEXT: vredand.vs v9, v8, v9, v0.t
	; CHECK-NEXT: vmv.x.s a0, v9			; CHECK-NEXT: vmv.x.s a0, v9
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call i8 @llvm.vp.reduce.and.v2i8(i8 %s, <2 x i8> %v, <2 x i1> %m, i32 %evl)			%r = call i8 @llvm.vp.reduce.and.v2i8(i8 %s, <2 x i8> %v, <2 x i1> %m, i32 %evl)
	ret i8 %r			ret i8 %r
	}			}

	declare i8 @llvm.vp.reduce.or.v2i8(i8, <2 x i8>, <2 x i1>, i32)			declare i8 @llvm.vp.reduce.or.v2i8(i8, <2 x i8>, <2 x i1>, i32)

	define signext i8 @vpreduce_or_v2i8(i8 signext %s, <2 x i8> %v, <2 x i1> %m, i32 zeroext %evl) {			define signext i8 @vpreduce_or_v2i8(i8 signext %s, <2 x i8> %v, <2 x i1> %m, i32 zeroext %evl) {
	; CHECK-LABEL: vpreduce_or_v2i8:			; CHECK-LABEL: vpreduce_or_v2i8:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e8, m1, ta, ma			; CHECK-NEXT: vsetvli zero, a1, e8, mf8, ta, ma
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.v.x v9, a0
	; CHECK-NEXT: vsetvli zero, a1, e8, mf8, tu, ma			; CHECK-NEXT: vsetvli zero, zero, e8, mf8, tu, ma
	; CHECK-NEXT: vredor.vs v9, v8, v9, v0.t			; CHECK-NEXT: vredor.vs v9, v8, v9, v0.t
	; CHECK-NEXT: vmv.x.s a0, v9			; CHECK-NEXT: vmv.x.s a0, v9
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call i8 @llvm.vp.reduce.or.v2i8(i8 %s, <2 x i8> %v, <2 x i1> %m, i32 %evl)			%r = call i8 @llvm.vp.reduce.or.v2i8(i8 %s, <2 x i8> %v, <2 x i1> %m, i32 %evl)
	ret i8 %r			ret i8 %r
	}			}

	declare i8 @llvm.vp.reduce.xor.v2i8(i8, <2 x i8>, <2 x i1>, i32)			declare i8 @llvm.vp.reduce.xor.v2i8(i8, <2 x i8>, <2 x i1>, i32)

	define signext i8 @vpreduce_xor_v2i8(i8 signext %s, <2 x i8> %v, <2 x i1> %m, i32 zeroext %evl) {			define signext i8 @vpreduce_xor_v2i8(i8 signext %s, <2 x i8> %v, <2 x i1> %m, i32 zeroext %evl) {
	; CHECK-LABEL: vpreduce_xor_v2i8:			; CHECK-LABEL: vpreduce_xor_v2i8:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e8, m1, ta, ma			; CHECK-NEXT: vsetvli zero, a1, e8, mf8, ta, ma
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.v.x v9, a0
	; CHECK-NEXT: vsetvli zero, a1, e8, mf8, tu, ma			; CHECK-NEXT: vsetvli zero, zero, e8, mf8, tu, ma
	; CHECK-NEXT: vredxor.vs v9, v8, v9, v0.t			; CHECK-NEXT: vredxor.vs v9, v8, v9, v0.t
	; CHECK-NEXT: vmv.x.s a0, v9			; CHECK-NEXT: vmv.x.s a0, v9
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call i8 @llvm.vp.reduce.xor.v2i8(i8 %s, <2 x i8> %v, <2 x i1> %m, i32 %evl)			%r = call i8 @llvm.vp.reduce.xor.v2i8(i8 %s, <2 x i8> %v, <2 x i1> %m, i32 %evl)
	ret i8 %r			ret i8 %r
	}			}

	declare i8 @llvm.vp.reduce.umin.v3i8(i8, <3 x i8>, <3 x i1>, i32)			declare i8 @llvm.vp.reduce.umin.v3i8(i8, <3 x i8>, <3 x i1>, i32)

	define signext i8 @vpreduce_umin_v3i8(i8 signext %s, <3 x i8> %v, <3 x i1> %m, i32 zeroext %evl) {			define signext i8 @vpreduce_umin_v3i8(i8 signext %s, <3 x i8> %v, <3 x i1> %m, i32 zeroext %evl) {
	; CHECK-LABEL: vpreduce_umin_v3i8:			; CHECK-LABEL: vpreduce_umin_v3i8:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: andi a0, a0, 255			; CHECK-NEXT: vsetvli zero, a1, e8, mf4, ta, ma
	; CHECK-NEXT: vsetivli zero, 1, e8, m1, ta, ma			; CHECK-NEXT: vmv.v.x v9, a0
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vsetvli zero, zero, e8, mf4, tu, ma
	; CHECK-NEXT: vsetvli zero, a1, e8, mf4, tu, ma
	; CHECK-NEXT: vredminu.vs v9, v8, v9, v0.t			; CHECK-NEXT: vredminu.vs v9, v8, v9, v0.t
	; CHECK-NEXT: vmv.x.s a0, v9			; CHECK-NEXT: vmv.x.s a0, v9
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call i8 @llvm.vp.reduce.umin.v3i8(i8 %s, <3 x i8> %v, <3 x i1> %m, i32 %evl)			%r = call i8 @llvm.vp.reduce.umin.v3i8(i8 %s, <3 x i8> %v, <3 x i1> %m, i32 %evl)
	ret i8 %r			ret i8 %r
	}			}

	declare i8 @llvm.vp.reduce.add.v4i8(i8, <4 x i8>, <4 x i1>, i32)			declare i8 @llvm.vp.reduce.add.v4i8(i8, <4 x i8>, <4 x i1>, i32)

	define signext i8 @vpreduce_add_v4i8(i8 signext %s, <4 x i8> %v, <4 x i1> %m, i32 zeroext %evl) {			define signext i8 @vpreduce_add_v4i8(i8 signext %s, <4 x i8> %v, <4 x i1> %m, i32 zeroext %evl) {
	; CHECK-LABEL: vpreduce_add_v4i8:			; CHECK-LABEL: vpreduce_add_v4i8:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e8, m1, ta, ma			; CHECK-NEXT: vsetvli zero, a1, e8, mf4, ta, ma
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.v.x v9, a0
	; CHECK-NEXT: vsetvli zero, a1, e8, mf4, tu, ma			; CHECK-NEXT: vsetvli zero, zero, e8, mf4, tu, ma
	; CHECK-NEXT: vredsum.vs v9, v8, v9, v0.t			; CHECK-NEXT: vredsum.vs v9, v8, v9, v0.t
	; CHECK-NEXT: vmv.x.s a0, v9			; CHECK-NEXT: vmv.x.s a0, v9
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call i8 @llvm.vp.reduce.add.v4i8(i8 %s, <4 x i8> %v, <4 x i1> %m, i32 %evl)			%r = call i8 @llvm.vp.reduce.add.v4i8(i8 %s, <4 x i8> %v, <4 x i1> %m, i32 %evl)
	ret i8 %r			ret i8 %r
	}			}

	declare i8 @llvm.vp.reduce.umax.v4i8(i8, <4 x i8>, <4 x i1>, i32)			declare i8 @llvm.vp.reduce.umax.v4i8(i8, <4 x i8>, <4 x i1>, i32)

	define signext i8 @vpreduce_umax_v4i8(i8 signext %s, <4 x i8> %v, <4 x i1> %m, i32 zeroext %evl) {			define signext i8 @vpreduce_umax_v4i8(i8 signext %s, <4 x i8> %v, <4 x i1> %m, i32 zeroext %evl) {
	; CHECK-LABEL: vpreduce_umax_v4i8:			; CHECK-LABEL: vpreduce_umax_v4i8:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: andi a0, a0, 255			; CHECK-NEXT: vsetvli zero, a1, e8, mf4, ta, ma
	; CHECK-NEXT: vsetivli zero, 1, e8, m1, ta, ma			; CHECK-NEXT: vmv.v.x v9, a0
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vsetvli zero, zero, e8, mf4, tu, ma
	; CHECK-NEXT: vsetvli zero, a1, e8, mf4, tu, ma
	; CHECK-NEXT: vredmaxu.vs v9, v8, v9, v0.t			; CHECK-NEXT: vredmaxu.vs v9, v8, v9, v0.t
	; CHECK-NEXT: vmv.x.s a0, v9			; CHECK-NEXT: vmv.x.s a0, v9
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call i8 @llvm.vp.reduce.umax.v4i8(i8 %s, <4 x i8> %v, <4 x i1> %m, i32 %evl)			%r = call i8 @llvm.vp.reduce.umax.v4i8(i8 %s, <4 x i8> %v, <4 x i1> %m, i32 %evl)
	ret i8 %r			ret i8 %r
	}			}

	declare i8 @llvm.vp.reduce.smax.v4i8(i8, <4 x i8>, <4 x i1>, i32)			declare i8 @llvm.vp.reduce.smax.v4i8(i8, <4 x i8>, <4 x i1>, i32)

	define signext i8 @vpreduce_smax_v4i8(i8 signext %s, <4 x i8> %v, <4 x i1> %m, i32 zeroext %evl) {			define signext i8 @vpreduce_smax_v4i8(i8 signext %s, <4 x i8> %v, <4 x i1> %m, i32 zeroext %evl) {
	; CHECK-LABEL: vpreduce_smax_v4i8:			; CHECK-LABEL: vpreduce_smax_v4i8:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e8, m1, ta, ma			; CHECK-NEXT: vsetvli zero, a1, e8, mf4, ta, ma
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.v.x v9, a0
	; CHECK-NEXT: vsetvli zero, a1, e8, mf4, tu, ma			; CHECK-NEXT: vsetvli zero, zero, e8, mf4, tu, ma
	; CHECK-NEXT: vredmax.vs v9, v8, v9, v0.t			; CHECK-NEXT: vredmax.vs v9, v8, v9, v0.t
	; CHECK-NEXT: vmv.x.s a0, v9			; CHECK-NEXT: vmv.x.s a0, v9
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call i8 @llvm.vp.reduce.smax.v4i8(i8 %s, <4 x i8> %v, <4 x i1> %m, i32 %evl)			%r = call i8 @llvm.vp.reduce.smax.v4i8(i8 %s, <4 x i8> %v, <4 x i1> %m, i32 %evl)
	ret i8 %r			ret i8 %r
	}			}

	declare i8 @llvm.vp.reduce.umin.v4i8(i8, <4 x i8>, <4 x i1>, i32)			declare i8 @llvm.vp.reduce.umin.v4i8(i8, <4 x i8>, <4 x i1>, i32)

	define signext i8 @vpreduce_umin_v4i8(i8 signext %s, <4 x i8> %v, <4 x i1> %m, i32 zeroext %evl) {			define signext i8 @vpreduce_umin_v4i8(i8 signext %s, <4 x i8> %v, <4 x i1> %m, i32 zeroext %evl) {
	; CHECK-LABEL: vpreduce_umin_v4i8:			; CHECK-LABEL: vpreduce_umin_v4i8:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: andi a0, a0, 255			; CHECK-NEXT: vsetvli zero, a1, e8, mf4, ta, ma
	; CHECK-NEXT: vsetivli zero, 1, e8, m1, ta, ma			; CHECK-NEXT: vmv.v.x v9, a0
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vsetvli zero, zero, e8, mf4, tu, ma
	; CHECK-NEXT: vsetvli zero, a1, e8, mf4, tu, ma
	; CHECK-NEXT: vredminu.vs v9, v8, v9, v0.t			; CHECK-NEXT: vredminu.vs v9, v8, v9, v0.t
	; CHECK-NEXT: vmv.x.s a0, v9			; CHECK-NEXT: vmv.x.s a0, v9
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call i8 @llvm.vp.reduce.umin.v4i8(i8 %s, <4 x i8> %v, <4 x i1> %m, i32 %evl)			%r = call i8 @llvm.vp.reduce.umin.v4i8(i8 %s, <4 x i8> %v, <4 x i1> %m, i32 %evl)
	ret i8 %r			ret i8 %r
	}			}

	declare i8 @llvm.vp.reduce.smin.v4i8(i8, <4 x i8>, <4 x i1>, i32)			declare i8 @llvm.vp.reduce.smin.v4i8(i8, <4 x i8>, <4 x i1>, i32)

	define signext i8 @vpreduce_smin_v4i8(i8 signext %s, <4 x i8> %v, <4 x i1> %m, i32 zeroext %evl) {			define signext i8 @vpreduce_smin_v4i8(i8 signext %s, <4 x i8> %v, <4 x i1> %m, i32 zeroext %evl) {
	; CHECK-LABEL: vpreduce_smin_v4i8:			; CHECK-LABEL: vpreduce_smin_v4i8:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e8, m1, ta, ma			; CHECK-NEXT: vsetvli zero, a1, e8, mf4, ta, ma
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.v.x v9, a0
	; CHECK-NEXT: vsetvli zero, a1, e8, mf4, tu, ma			; CHECK-NEXT: vsetvli zero, zero, e8, mf4, tu, ma
	; CHECK-NEXT: vredmin.vs v9, v8, v9, v0.t			; CHECK-NEXT: vredmin.vs v9, v8, v9, v0.t
	; CHECK-NEXT: vmv.x.s a0, v9			; CHECK-NEXT: vmv.x.s a0, v9
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call i8 @llvm.vp.reduce.smin.v4i8(i8 %s, <4 x i8> %v, <4 x i1> %m, i32 %evl)			%r = call i8 @llvm.vp.reduce.smin.v4i8(i8 %s, <4 x i8> %v, <4 x i1> %m, i32 %evl)
	ret i8 %r			ret i8 %r
	}			}

	declare i8 @llvm.vp.reduce.and.v4i8(i8, <4 x i8>, <4 x i1>, i32)			declare i8 @llvm.vp.reduce.and.v4i8(i8, <4 x i8>, <4 x i1>, i32)

	define signext i8 @vpreduce_and_v4i8(i8 signext %s, <4 x i8> %v, <4 x i1> %m, i32 zeroext %evl) {			define signext i8 @vpreduce_and_v4i8(i8 signext %s, <4 x i8> %v, <4 x i1> %m, i32 zeroext %evl) {
	; CHECK-LABEL: vpreduce_and_v4i8:			; CHECK-LABEL: vpreduce_and_v4i8:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e8, m1, ta, ma			; CHECK-NEXT: vsetvli zero, a1, e8, mf4, ta, ma
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.v.x v9, a0
	; CHECK-NEXT: vsetvli zero, a1, e8, mf4, tu, ma			; CHECK-NEXT: vsetvli zero, zero, e8, mf4, tu, ma
	; CHECK-NEXT: vredand.vs v9, v8, v9, v0.t			; CHECK-NEXT: vredand.vs v9, v8, v9, v0.t
	; CHECK-NEXT: vmv.x.s a0, v9			; CHECK-NEXT: vmv.x.s a0, v9
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call i8 @llvm.vp.reduce.and.v4i8(i8 %s, <4 x i8> %v, <4 x i1> %m, i32 %evl)			%r = call i8 @llvm.vp.reduce.and.v4i8(i8 %s, <4 x i8> %v, <4 x i1> %m, i32 %evl)
	ret i8 %r			ret i8 %r
	}			}

	declare i8 @llvm.vp.reduce.or.v4i8(i8, <4 x i8>, <4 x i1>, i32)			declare i8 @llvm.vp.reduce.or.v4i8(i8, <4 x i8>, <4 x i1>, i32)

	define signext i8 @vpreduce_or_v4i8(i8 signext %s, <4 x i8> %v, <4 x i1> %m, i32 zeroext %evl) {			define signext i8 @vpreduce_or_v4i8(i8 signext %s, <4 x i8> %v, <4 x i1> %m, i32 zeroext %evl) {
	; CHECK-LABEL: vpreduce_or_v4i8:			; CHECK-LABEL: vpreduce_or_v4i8:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e8, m1, ta, ma			; CHECK-NEXT: vsetvli zero, a1, e8, mf4, ta, ma
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.v.x v9, a0
	; CHECK-NEXT: vsetvli zero, a1, e8, mf4, tu, ma			; CHECK-NEXT: vsetvli zero, zero, e8, mf4, tu, ma
	; CHECK-NEXT: vredor.vs v9, v8, v9, v0.t			; CHECK-NEXT: vredor.vs v9, v8, v9, v0.t
	; CHECK-NEXT: vmv.x.s a0, v9			; CHECK-NEXT: vmv.x.s a0, v9
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call i8 @llvm.vp.reduce.or.v4i8(i8 %s, <4 x i8> %v, <4 x i1> %m, i32 %evl)			%r = call i8 @llvm.vp.reduce.or.v4i8(i8 %s, <4 x i8> %v, <4 x i1> %m, i32 %evl)
	ret i8 %r			ret i8 %r
	}			}

	declare i8 @llvm.vp.reduce.xor.v4i8(i8, <4 x i8>, <4 x i1>, i32)			declare i8 @llvm.vp.reduce.xor.v4i8(i8, <4 x i8>, <4 x i1>, i32)

	define signext i8 @vpreduce_xor_v4i8(i8 signext %s, <4 x i8> %v, <4 x i1> %m, i32 zeroext %evl) {			define signext i8 @vpreduce_xor_v4i8(i8 signext %s, <4 x i8> %v, <4 x i1> %m, i32 zeroext %evl) {
	; CHECK-LABEL: vpreduce_xor_v4i8:			; CHECK-LABEL: vpreduce_xor_v4i8:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e8, m1, ta, ma			; CHECK-NEXT: vsetvli zero, a1, e8, mf4, ta, ma
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.v.x v9, a0
	; CHECK-NEXT: vsetvli zero, a1, e8, mf4, tu, ma			; CHECK-NEXT: vsetvli zero, zero, e8, mf4, tu, ma
	; CHECK-NEXT: vredxor.vs v9, v8, v9, v0.t			; CHECK-NEXT: vredxor.vs v9, v8, v9, v0.t
	; CHECK-NEXT: vmv.x.s a0, v9			; CHECK-NEXT: vmv.x.s a0, v9
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call i8 @llvm.vp.reduce.xor.v4i8(i8 %s, <4 x i8> %v, <4 x i1> %m, i32 %evl)			%r = call i8 @llvm.vp.reduce.xor.v4i8(i8 %s, <4 x i8> %v, <4 x i1> %m, i32 %evl)
	ret i8 %r			ret i8 %r
	}			}

	declare i16 @llvm.vp.reduce.add.v2i16(i16, <2 x i16>, <2 x i1>, i32)			declare i16 @llvm.vp.reduce.add.v2i16(i16, <2 x i16>, <2 x i1>, i32)

	define signext i16 @vpreduce_add_v2i16(i16 signext %s, <2 x i16> %v, <2 x i1> %m, i32 zeroext %evl) {			define signext i16 @vpreduce_add_v2i16(i16 signext %s, <2 x i16> %v, <2 x i1> %m, i32 zeroext %evl) {
	; CHECK-LABEL: vpreduce_add_v2i16:			; CHECK-LABEL: vpreduce_add_v2i16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma			; CHECK-NEXT: vsetvli zero, a1, e16, mf4, ta, ma
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.v.x v9, a0
	; CHECK-NEXT: vsetvli zero, a1, e16, mf4, tu, ma			; CHECK-NEXT: vsetvli zero, zero, e16, mf4, tu, ma
	; CHECK-NEXT: vredsum.vs v9, v8, v9, v0.t			; CHECK-NEXT: vredsum.vs v9, v8, v9, v0.t
	; CHECK-NEXT: vmv.x.s a0, v9			; CHECK-NEXT: vmv.x.s a0, v9
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call i16 @llvm.vp.reduce.add.v2i16(i16 %s, <2 x i16> %v, <2 x i1> %m, i32 %evl)			%r = call i16 @llvm.vp.reduce.add.v2i16(i16 %s, <2 x i16> %v, <2 x i1> %m, i32 %evl)
	ret i16 %r			ret i16 %r
	}			}

	declare i16 @llvm.vp.reduce.umax.v2i16(i16, <2 x i16>, <2 x i1>, i32)			declare i16 @llvm.vp.reduce.umax.v2i16(i16, <2 x i16>, <2 x i1>, i32)

	define signext i16 @vpreduce_umax_v2i16(i16 signext %s, <2 x i16> %v, <2 x i1> %m, i32 zeroext %evl) {			define signext i16 @vpreduce_umax_v2i16(i16 signext %s, <2 x i16> %v, <2 x i1> %m, i32 zeroext %evl) {
	; RV32-LABEL: vpreduce_umax_v2i16:			; CHECK-LABEL: vpreduce_umax_v2i16:
	; RV32: # %bb.0:			; CHECK: # %bb.0:
	; RV32-NEXT: slli a0, a0, 16			; CHECK-NEXT: vsetvli zero, a1, e16, mf4, ta, ma
	; RV32-NEXT: srli a0, a0, 16			; CHECK-NEXT: vmv.v.x v9, a0
	; RV32-NEXT: vsetivli zero, 1, e16, m1, ta, ma			; CHECK-NEXT: vsetvli zero, zero, e16, mf4, tu, ma
	; RV32-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vredmaxu.vs v9, v8, v9, v0.t
	; RV32-NEXT: vsetvli zero, a1, e16, mf4, tu, ma			; CHECK-NEXT: vmv.x.s a0, v9
	; RV32-NEXT: vredmaxu.vs v9, v8, v9, v0.t			; CHECK-NEXT: ret
	; RV32-NEXT: vmv.x.s a0, v9
	; RV32-NEXT: ret
	;
	; RV64-LABEL: vpreduce_umax_v2i16:
	; RV64: # %bb.0:
	; RV64-NEXT: slli a0, a0, 48
	; RV64-NEXT: srli a0, a0, 48
	; RV64-NEXT: vsetivli zero, 1, e16, m1, ta, ma
	; RV64-NEXT: vmv.s.x v9, a0
	; RV64-NEXT: vsetvli zero, a1, e16, mf4, tu, ma
	; RV64-NEXT: vredmaxu.vs v9, v8, v9, v0.t
	; RV64-NEXT: vmv.x.s a0, v9
	; RV64-NEXT: ret
	%r = call i16 @llvm.vp.reduce.umax.v2i16(i16 %s, <2 x i16> %v, <2 x i1> %m, i32 %evl)			%r = call i16 @llvm.vp.reduce.umax.v2i16(i16 %s, <2 x i16> %v, <2 x i1> %m, i32 %evl)
	ret i16 %r			ret i16 %r
	}			}

	declare i16 @llvm.vp.reduce.smax.v2i16(i16, <2 x i16>, <2 x i1>, i32)			declare i16 @llvm.vp.reduce.smax.v2i16(i16, <2 x i16>, <2 x i1>, i32)

	define signext i16 @vpreduce_smax_v2i16(i16 signext %s, <2 x i16> %v, <2 x i1> %m, i32 zeroext %evl) {			define signext i16 @vpreduce_smax_v2i16(i16 signext %s, <2 x i16> %v, <2 x i1> %m, i32 zeroext %evl) {
	; CHECK-LABEL: vpreduce_smax_v2i16:			; CHECK-LABEL: vpreduce_smax_v2i16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma			; CHECK-NEXT: vsetvli zero, a1, e16, mf4, ta, ma
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.v.x v9, a0
	; CHECK-NEXT: vsetvli zero, a1, e16, mf4, tu, ma			; CHECK-NEXT: vsetvli zero, zero, e16, mf4, tu, ma
	; CHECK-NEXT: vredmax.vs v9, v8, v9, v0.t			; CHECK-NEXT: vredmax.vs v9, v8, v9, v0.t
	; CHECK-NEXT: vmv.x.s a0, v9			; CHECK-NEXT: vmv.x.s a0, v9
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call i16 @llvm.vp.reduce.smax.v2i16(i16 %s, <2 x i16> %v, <2 x i1> %m, i32 %evl)			%r = call i16 @llvm.vp.reduce.smax.v2i16(i16 %s, <2 x i16> %v, <2 x i1> %m, i32 %evl)
	ret i16 %r			ret i16 %r
	}			}

	declare i16 @llvm.vp.reduce.umin.v2i16(i16, <2 x i16>, <2 x i1>, i32)			declare i16 @llvm.vp.reduce.umin.v2i16(i16, <2 x i16>, <2 x i1>, i32)

	define signext i16 @vpreduce_umin_v2i16(i16 signext %s, <2 x i16> %v, <2 x i1> %m, i32 zeroext %evl) {			define signext i16 @vpreduce_umin_v2i16(i16 signext %s, <2 x i16> %v, <2 x i1> %m, i32 zeroext %evl) {
	; RV32-LABEL: vpreduce_umin_v2i16:			; CHECK-LABEL: vpreduce_umin_v2i16:
	; RV32: # %bb.0:			; CHECK: # %bb.0:
	; RV32-NEXT: slli a0, a0, 16			; CHECK-NEXT: vsetvli zero, a1, e16, mf4, ta, ma
	; RV32-NEXT: srli a0, a0, 16			; CHECK-NEXT: vmv.v.x v9, a0
	; RV32-NEXT: vsetivli zero, 1, e16, m1, ta, ma			; CHECK-NEXT: vsetvli zero, zero, e16, mf4, tu, ma
	; RV32-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vredminu.vs v9, v8, v9, v0.t
	; RV32-NEXT: vsetvli zero, a1, e16, mf4, tu, ma			; CHECK-NEXT: vmv.x.s a0, v9
	; RV32-NEXT: vredminu.vs v9, v8, v9, v0.t			; CHECK-NEXT: ret
	; RV32-NEXT: vmv.x.s a0, v9
	; RV32-NEXT: ret
	;
	; RV64-LABEL: vpreduce_umin_v2i16:
	; RV64: # %bb.0:
	; RV64-NEXT: slli a0, a0, 48
	; RV64-NEXT: srli a0, a0, 48
	; RV64-NEXT: vsetivli zero, 1, e16, m1, ta, ma
	; RV64-NEXT: vmv.s.x v9, a0
	; RV64-NEXT: vsetvli zero, a1, e16, mf4, tu, ma
	; RV64-NEXT: vredminu.vs v9, v8, v9, v0.t
	; RV64-NEXT: vmv.x.s a0, v9
	; RV64-NEXT: ret
	%r = call i16 @llvm.vp.reduce.umin.v2i16(i16 %s, <2 x i16> %v, <2 x i1> %m, i32 %evl)			%r = call i16 @llvm.vp.reduce.umin.v2i16(i16 %s, <2 x i16> %v, <2 x i1> %m, i32 %evl)
	ret i16 %r			ret i16 %r
	}			}

	declare i16 @llvm.vp.reduce.smin.v2i16(i16, <2 x i16>, <2 x i1>, i32)			declare i16 @llvm.vp.reduce.smin.v2i16(i16, <2 x i16>, <2 x i1>, i32)

	define signext i16 @vpreduce_smin_v2i16(i16 signext %s, <2 x i16> %v, <2 x i1> %m, i32 zeroext %evl) {			define signext i16 @vpreduce_smin_v2i16(i16 signext %s, <2 x i16> %v, <2 x i1> %m, i32 zeroext %evl) {
	; CHECK-LABEL: vpreduce_smin_v2i16:			; CHECK-LABEL: vpreduce_smin_v2i16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma			; CHECK-NEXT: vsetvli zero, a1, e16, mf4, ta, ma
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.v.x v9, a0
	; CHECK-NEXT: vsetvli zero, a1, e16, mf4, tu, ma			; CHECK-NEXT: vsetvli zero, zero, e16, mf4, tu, ma
	; CHECK-NEXT: vredmin.vs v9, v8, v9, v0.t			; CHECK-NEXT: vredmin.vs v9, v8, v9, v0.t
	; CHECK-NEXT: vmv.x.s a0, v9			; CHECK-NEXT: vmv.x.s a0, v9
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call i16 @llvm.vp.reduce.smin.v2i16(i16 %s, <2 x i16> %v, <2 x i1> %m, i32 %evl)			%r = call i16 @llvm.vp.reduce.smin.v2i16(i16 %s, <2 x i16> %v, <2 x i1> %m, i32 %evl)
	ret i16 %r			ret i16 %r
	}			}

	declare i16 @llvm.vp.reduce.and.v2i16(i16, <2 x i16>, <2 x i1>, i32)			declare i16 @llvm.vp.reduce.and.v2i16(i16, <2 x i16>, <2 x i1>, i32)

	define signext i16 @vpreduce_and_v2i16(i16 signext %s, <2 x i16> %v, <2 x i1> %m, i32 zeroext %evl) {			define signext i16 @vpreduce_and_v2i16(i16 signext %s, <2 x i16> %v, <2 x i1> %m, i32 zeroext %evl) {
	; CHECK-LABEL: vpreduce_and_v2i16:			; CHECK-LABEL: vpreduce_and_v2i16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma			; CHECK-NEXT: vsetvli zero, a1, e16, mf4, ta, ma
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.v.x v9, a0
	; CHECK-NEXT: vsetvli zero, a1, e16, mf4, tu, ma			; CHECK-NEXT: vsetvli zero, zero, e16, mf4, tu, ma
	; CHECK-NEXT: vredand.vs v9, v8, v9, v0.t			; CHECK-NEXT: vredand.vs v9, v8, v9, v0.t
	; CHECK-NEXT: vmv.x.s a0, v9			; CHECK-NEXT: vmv.x.s a0, v9
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call i16 @llvm.vp.reduce.and.v2i16(i16 %s, <2 x i16> %v, <2 x i1> %m, i32 %evl)			%r = call i16 @llvm.vp.reduce.and.v2i16(i16 %s, <2 x i16> %v, <2 x i1> %m, i32 %evl)
	ret i16 %r			ret i16 %r
	}			}

	declare i16 @llvm.vp.reduce.or.v2i16(i16, <2 x i16>, <2 x i1>, i32)			declare i16 @llvm.vp.reduce.or.v2i16(i16, <2 x i16>, <2 x i1>, i32)

	define signext i16 @vpreduce_or_v2i16(i16 signext %s, <2 x i16> %v, <2 x i1> %m, i32 zeroext %evl) {			define signext i16 @vpreduce_or_v2i16(i16 signext %s, <2 x i16> %v, <2 x i1> %m, i32 zeroext %evl) {
	; CHECK-LABEL: vpreduce_or_v2i16:			; CHECK-LABEL: vpreduce_or_v2i16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma			; CHECK-NEXT: vsetvli zero, a1, e16, mf4, ta, ma
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.v.x v9, a0
	; CHECK-NEXT: vsetvli zero, a1, e16, mf4, tu, ma			; CHECK-NEXT: vsetvli zero, zero, e16, mf4, tu, ma
	; CHECK-NEXT: vredor.vs v9, v8, v9, v0.t			; CHECK-NEXT: vredor.vs v9, v8, v9, v0.t
	; CHECK-NEXT: vmv.x.s a0, v9			; CHECK-NEXT: vmv.x.s a0, v9
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call i16 @llvm.vp.reduce.or.v2i16(i16 %s, <2 x i16> %v, <2 x i1> %m, i32 %evl)			%r = call i16 @llvm.vp.reduce.or.v2i16(i16 %s, <2 x i16> %v, <2 x i1> %m, i32 %evl)
	ret i16 %r			ret i16 %r
	}			}

	declare i16 @llvm.vp.reduce.xor.v2i16(i16, <2 x i16>, <2 x i1>, i32)			declare i16 @llvm.vp.reduce.xor.v2i16(i16, <2 x i16>, <2 x i1>, i32)

	define signext i16 @vpreduce_xor_v2i16(i16 signext %s, <2 x i16> %v, <2 x i1> %m, i32 zeroext %evl) {			define signext i16 @vpreduce_xor_v2i16(i16 signext %s, <2 x i16> %v, <2 x i1> %m, i32 zeroext %evl) {
	; CHECK-LABEL: vpreduce_xor_v2i16:			; CHECK-LABEL: vpreduce_xor_v2i16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma			; CHECK-NEXT: vsetvli zero, a1, e16, mf4, ta, ma
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.v.x v9, a0
	; CHECK-NEXT: vsetvli zero, a1, e16, mf4, tu, ma			; CHECK-NEXT: vsetvli zero, zero, e16, mf4, tu, ma
	; CHECK-NEXT: vredxor.vs v9, v8, v9, v0.t			; CHECK-NEXT: vredxor.vs v9, v8, v9, v0.t
	; CHECK-NEXT: vmv.x.s a0, v9			; CHECK-NEXT: vmv.x.s a0, v9
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call i16 @llvm.vp.reduce.xor.v2i16(i16 %s, <2 x i16> %v, <2 x i1> %m, i32 %evl)			%r = call i16 @llvm.vp.reduce.xor.v2i16(i16 %s, <2 x i16> %v, <2 x i1> %m, i32 %evl)
	ret i16 %r			ret i16 %r
	}			}

	declare i16 @llvm.vp.reduce.add.v4i16(i16, <4 x i16>, <4 x i1>, i32)			declare i16 @llvm.vp.reduce.add.v4i16(i16, <4 x i16>, <4 x i1>, i32)

	define signext i16 @vpreduce_add_v4i16(i16 signext %s, <4 x i16> %v, <4 x i1> %m, i32 zeroext %evl) {			define signext i16 @vpreduce_add_v4i16(i16 signext %s, <4 x i16> %v, <4 x i1> %m, i32 zeroext %evl) {
	; CHECK-LABEL: vpreduce_add_v4i16:			; CHECK-LABEL: vpreduce_add_v4i16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma			; CHECK-NEXT: vsetvli zero, a1, e16, mf2, ta, ma
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.v.x v9, a0
	; CHECK-NEXT: vsetvli zero, a1, e16, mf2, tu, ma			; CHECK-NEXT: vsetvli zero, zero, e16, mf2, tu, ma
	; CHECK-NEXT: vredsum.vs v9, v8, v9, v0.t			; CHECK-NEXT: vredsum.vs v9, v8, v9, v0.t
	; CHECK-NEXT: vmv.x.s a0, v9			; CHECK-NEXT: vmv.x.s a0, v9
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call i16 @llvm.vp.reduce.add.v4i16(i16 %s, <4 x i16> %v, <4 x i1> %m, i32 %evl)			%r = call i16 @llvm.vp.reduce.add.v4i16(i16 %s, <4 x i16> %v, <4 x i1> %m, i32 %evl)
	ret i16 %r			ret i16 %r
	}			}

	declare i16 @llvm.vp.reduce.umax.v4i16(i16, <4 x i16>, <4 x i1>, i32)			declare i16 @llvm.vp.reduce.umax.v4i16(i16, <4 x i16>, <4 x i1>, i32)

	define signext i16 @vpreduce_umax_v4i16(i16 signext %s, <4 x i16> %v, <4 x i1> %m, i32 zeroext %evl) {			define signext i16 @vpreduce_umax_v4i16(i16 signext %s, <4 x i16> %v, <4 x i1> %m, i32 zeroext %evl) {
	; RV32-LABEL: vpreduce_umax_v4i16:			; CHECK-LABEL: vpreduce_umax_v4i16:
	; RV32: # %bb.0:			; CHECK: # %bb.0:
	; RV32-NEXT: slli a0, a0, 16			; CHECK-NEXT: vsetvli zero, a1, e16, mf2, ta, ma
	; RV32-NEXT: srli a0, a0, 16			; CHECK-NEXT: vmv.v.x v9, a0
	; RV32-NEXT: vsetivli zero, 1, e16, m1, ta, ma			; CHECK-NEXT: vsetvli zero, zero, e16, mf2, tu, ma
	; RV32-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vredmaxu.vs v9, v8, v9, v0.t
	; RV32-NEXT: vsetvli zero, a1, e16, mf2, tu, ma			; CHECK-NEXT: vmv.x.s a0, v9
	; RV32-NEXT: vredmaxu.vs v9, v8, v9, v0.t			; CHECK-NEXT: ret
	; RV32-NEXT: vmv.x.s a0, v9
	; RV32-NEXT: ret
	;
	; RV64-LABEL: vpreduce_umax_v4i16:
	; RV64: # %bb.0:
	; RV64-NEXT: slli a0, a0, 48
	; RV64-NEXT: srli a0, a0, 48
	; RV64-NEXT: vsetivli zero, 1, e16, m1, ta, ma
	; RV64-NEXT: vmv.s.x v9, a0
	; RV64-NEXT: vsetvli zero, a1, e16, mf2, tu, ma
	; RV64-NEXT: vredmaxu.vs v9, v8, v9, v0.t
	; RV64-NEXT: vmv.x.s a0, v9
	; RV64-NEXT: ret
	%r = call i16 @llvm.vp.reduce.umax.v4i16(i16 %s, <4 x i16> %v, <4 x i1> %m, i32 %evl)			%r = call i16 @llvm.vp.reduce.umax.v4i16(i16 %s, <4 x i16> %v, <4 x i1> %m, i32 %evl)
	ret i16 %r			ret i16 %r
	}			}

	declare i16 @llvm.vp.reduce.smax.v4i16(i16, <4 x i16>, <4 x i1>, i32)			declare i16 @llvm.vp.reduce.smax.v4i16(i16, <4 x i16>, <4 x i1>, i32)

	define signext i16 @vpreduce_smax_v4i16(i16 signext %s, <4 x i16> %v, <4 x i1> %m, i32 zeroext %evl) {			define signext i16 @vpreduce_smax_v4i16(i16 signext %s, <4 x i16> %v, <4 x i1> %m, i32 zeroext %evl) {
	; CHECK-LABEL: vpreduce_smax_v4i16:			; CHECK-LABEL: vpreduce_smax_v4i16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma			; CHECK-NEXT: vsetvli zero, a1, e16, mf2, ta, ma
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.v.x v9, a0
	; CHECK-NEXT: vsetvli zero, a1, e16, mf2, tu, ma			; CHECK-NEXT: vsetvli zero, zero, e16, mf2, tu, ma
	; CHECK-NEXT: vredmax.vs v9, v8, v9, v0.t			; CHECK-NEXT: vredmax.vs v9, v8, v9, v0.t
	; CHECK-NEXT: vmv.x.s a0, v9			; CHECK-NEXT: vmv.x.s a0, v9
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call i16 @llvm.vp.reduce.smax.v4i16(i16 %s, <4 x i16> %v, <4 x i1> %m, i32 %evl)			%r = call i16 @llvm.vp.reduce.smax.v4i16(i16 %s, <4 x i16> %v, <4 x i1> %m, i32 %evl)
	ret i16 %r			ret i16 %r
	}			}

	declare i16 @llvm.vp.reduce.umin.v4i16(i16, <4 x i16>, <4 x i1>, i32)			declare i16 @llvm.vp.reduce.umin.v4i16(i16, <4 x i16>, <4 x i1>, i32)

	define signext i16 @vpreduce_umin_v4i16(i16 signext %s, <4 x i16> %v, <4 x i1> %m, i32 zeroext %evl) {			define signext i16 @vpreduce_umin_v4i16(i16 signext %s, <4 x i16> %v, <4 x i1> %m, i32 zeroext %evl) {
	; RV32-LABEL: vpreduce_umin_v4i16:			; CHECK-LABEL: vpreduce_umin_v4i16:
	; RV32: # %bb.0:			; CHECK: # %bb.0:
	; RV32-NEXT: slli a0, a0, 16			; CHECK-NEXT: vsetvli zero, a1, e16, mf2, ta, ma
	; RV32-NEXT: srli a0, a0, 16			; CHECK-NEXT: vmv.v.x v9, a0
	; RV32-NEXT: vsetivli zero, 1, e16, m1, ta, ma			; CHECK-NEXT: vsetvli zero, zero, e16, mf2, tu, ma
	; RV32-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vredminu.vs v9, v8, v9, v0.t
	; RV32-NEXT: vsetvli zero, a1, e16, mf2, tu, ma			; CHECK-NEXT: vmv.x.s a0, v9
	; RV32-NEXT: vredminu.vs v9, v8, v9, v0.t			; CHECK-NEXT: ret
	; RV32-NEXT: vmv.x.s a0, v9
	; RV32-NEXT: ret
	;
	; RV64-LABEL: vpreduce_umin_v4i16:
	; RV64: # %bb.0:
	; RV64-NEXT: slli a0, a0, 48
	; RV64-NEXT: srli a0, a0, 48
	; RV64-NEXT: vsetivli zero, 1, e16, m1, ta, ma
	; RV64-NEXT: vmv.s.x v9, a0
	; RV64-NEXT: vsetvli zero, a1, e16, mf2, tu, ma
	; RV64-NEXT: vredminu.vs v9, v8, v9, v0.t
	; RV64-NEXT: vmv.x.s a0, v9
	; RV64-NEXT: ret
	%r = call i16 @llvm.vp.reduce.umin.v4i16(i16 %s, <4 x i16> %v, <4 x i1> %m, i32 %evl)			%r = call i16 @llvm.vp.reduce.umin.v4i16(i16 %s, <4 x i16> %v, <4 x i1> %m, i32 %evl)
	ret i16 %r			ret i16 %r
	}			}

	declare i16 @llvm.vp.reduce.smin.v4i16(i16, <4 x i16>, <4 x i1>, i32)			declare i16 @llvm.vp.reduce.smin.v4i16(i16, <4 x i16>, <4 x i1>, i32)

	define signext i16 @vpreduce_smin_v4i16(i16 signext %s, <4 x i16> %v, <4 x i1> %m, i32 zeroext %evl) {			define signext i16 @vpreduce_smin_v4i16(i16 signext %s, <4 x i16> %v, <4 x i1> %m, i32 zeroext %evl) {
	; CHECK-LABEL: vpreduce_smin_v4i16:			; CHECK-LABEL: vpreduce_smin_v4i16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma			; CHECK-NEXT: vsetvli zero, a1, e16, mf2, ta, ma
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.v.x v9, a0
	; CHECK-NEXT: vsetvli zero, a1, e16, mf2, tu, ma			; CHECK-NEXT: vsetvli zero, zero, e16, mf2, tu, ma
	; CHECK-NEXT: vredmin.vs v9, v8, v9, v0.t			; CHECK-NEXT: vredmin.vs v9, v8, v9, v0.t
	; CHECK-NEXT: vmv.x.s a0, v9			; CHECK-NEXT: vmv.x.s a0, v9
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call i16 @llvm.vp.reduce.smin.v4i16(i16 %s, <4 x i16> %v, <4 x i1> %m, i32 %evl)			%r = call i16 @llvm.vp.reduce.smin.v4i16(i16 %s, <4 x i16> %v, <4 x i1> %m, i32 %evl)
	ret i16 %r			ret i16 %r
	}			}

	declare i16 @llvm.vp.reduce.and.v4i16(i16, <4 x i16>, <4 x i1>, i32)			declare i16 @llvm.vp.reduce.and.v4i16(i16, <4 x i16>, <4 x i1>, i32)

	define signext i16 @vpreduce_and_v4i16(i16 signext %s, <4 x i16> %v, <4 x i1> %m, i32 zeroext %evl) {			define signext i16 @vpreduce_and_v4i16(i16 signext %s, <4 x i16> %v, <4 x i1> %m, i32 zeroext %evl) {
	; CHECK-LABEL: vpreduce_and_v4i16:			; CHECK-LABEL: vpreduce_and_v4i16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma			; CHECK-NEXT: vsetvli zero, a1, e16, mf2, ta, ma
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.v.x v9, a0
	; CHECK-NEXT: vsetvli zero, a1, e16, mf2, tu, ma			; CHECK-NEXT: vsetvli zero, zero, e16, mf2, tu, ma
	; CHECK-NEXT: vredand.vs v9, v8, v9, v0.t			; CHECK-NEXT: vredand.vs v9, v8, v9, v0.t
	; CHECK-NEXT: vmv.x.s a0, v9			; CHECK-NEXT: vmv.x.s a0, v9
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call i16 @llvm.vp.reduce.and.v4i16(i16 %s, <4 x i16> %v, <4 x i1> %m, i32 %evl)			%r = call i16 @llvm.vp.reduce.and.v4i16(i16 %s, <4 x i16> %v, <4 x i1> %m, i32 %evl)
	ret i16 %r			ret i16 %r
	}			}

	declare i16 @llvm.vp.reduce.or.v4i16(i16, <4 x i16>, <4 x i1>, i32)			declare i16 @llvm.vp.reduce.or.v4i16(i16, <4 x i16>, <4 x i1>, i32)

	define signext i16 @vpreduce_or_v4i16(i16 signext %s, <4 x i16> %v, <4 x i1> %m, i32 zeroext %evl) {			define signext i16 @vpreduce_or_v4i16(i16 signext %s, <4 x i16> %v, <4 x i1> %m, i32 zeroext %evl) {
	; CHECK-LABEL: vpreduce_or_v4i16:			; CHECK-LABEL: vpreduce_or_v4i16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma			; CHECK-NEXT: vsetvli zero, a1, e16, mf2, ta, ma
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.v.x v9, a0
	; CHECK-NEXT: vsetvli zero, a1, e16, mf2, tu, ma			; CHECK-NEXT: vsetvli zero, zero, e16, mf2, tu, ma
	; CHECK-NEXT: vredor.vs v9, v8, v9, v0.t			; CHECK-NEXT: vredor.vs v9, v8, v9, v0.t
	; CHECK-NEXT: vmv.x.s a0, v9			; CHECK-NEXT: vmv.x.s a0, v9
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call i16 @llvm.vp.reduce.or.v4i16(i16 %s, <4 x i16> %v, <4 x i1> %m, i32 %evl)			%r = call i16 @llvm.vp.reduce.or.v4i16(i16 %s, <4 x i16> %v, <4 x i1> %m, i32 %evl)
	ret i16 %r			ret i16 %r
	}			}

	declare i16 @llvm.vp.reduce.xor.v4i16(i16, <4 x i16>, <4 x i1>, i32)			declare i16 @llvm.vp.reduce.xor.v4i16(i16, <4 x i16>, <4 x i1>, i32)

	define signext i16 @vpreduce_xor_v4i16(i16 signext %s, <4 x i16> %v, <4 x i1> %m, i32 zeroext %evl) {			define signext i16 @vpreduce_xor_v4i16(i16 signext %s, <4 x i16> %v, <4 x i1> %m, i32 zeroext %evl) {
	; CHECK-LABEL: vpreduce_xor_v4i16:			; CHECK-LABEL: vpreduce_xor_v4i16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma			; CHECK-NEXT: vsetvli zero, a1, e16, mf2, ta, ma
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.v.x v9, a0
	; CHECK-NEXT: vsetvli zero, a1, e16, mf2, tu, ma			; CHECK-NEXT: vsetvli zero, zero, e16, mf2, tu, ma
	; CHECK-NEXT: vredxor.vs v9, v8, v9, v0.t			; CHECK-NEXT: vredxor.vs v9, v8, v9, v0.t
	; CHECK-NEXT: vmv.x.s a0, v9			; CHECK-NEXT: vmv.x.s a0, v9
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call i16 @llvm.vp.reduce.xor.v4i16(i16 %s, <4 x i16> %v, <4 x i1> %m, i32 %evl)			%r = call i16 @llvm.vp.reduce.xor.v4i16(i16 %s, <4 x i16> %v, <4 x i1> %m, i32 %evl)
	ret i16 %r			ret i16 %r
	}			}

	declare i32 @llvm.vp.reduce.add.v2i32(i32, <2 x i32>, <2 x i1>, i32)			declare i32 @llvm.vp.reduce.add.v2i32(i32, <2 x i32>, <2 x i1>, i32)

	define signext i32 @vpreduce_add_v2i32(i32 signext %s, <2 x i32> %v, <2 x i1> %m, i32 zeroext %evl) {			define signext i32 @vpreduce_add_v2i32(i32 signext %s, <2 x i32> %v, <2 x i1> %m, i32 zeroext %evl) {
	; CHECK-LABEL: vpreduce_add_v2i32:			; CHECK-LABEL: vpreduce_add_v2i32:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma			; CHECK-NEXT: vsetvli zero, a1, e32, mf2, ta, ma
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.v.x v9, a0
	; CHECK-NEXT: vsetvli zero, a1, e32, mf2, tu, ma			; CHECK-NEXT: vsetvli zero, zero, e32, mf2, tu, ma
	; CHECK-NEXT: vredsum.vs v9, v8, v9, v0.t			; CHECK-NEXT: vredsum.vs v9, v8, v9, v0.t
	; CHECK-NEXT: vmv.x.s a0, v9			; CHECK-NEXT: vmv.x.s a0, v9
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call i32 @llvm.vp.reduce.add.v2i32(i32 %s, <2 x i32> %v, <2 x i1> %m, i32 %evl)			%r = call i32 @llvm.vp.reduce.add.v2i32(i32 %s, <2 x i32> %v, <2 x i1> %m, i32 %evl)
	ret i32 %r			ret i32 %r
	}			}

	declare i32 @llvm.vp.reduce.umax.v2i32(i32, <2 x i32>, <2 x i1>, i32)			declare i32 @llvm.vp.reduce.umax.v2i32(i32, <2 x i32>, <2 x i1>, i32)

	define signext i32 @vpreduce_umax_v2i32(i32 signext %s, <2 x i32> %v, <2 x i1> %m, i32 zeroext %evl) {			define signext i32 @vpreduce_umax_v2i32(i32 signext %s, <2 x i32> %v, <2 x i1> %m, i32 zeroext %evl) {
	; RV32-LABEL: vpreduce_umax_v2i32:			; CHECK-LABEL: vpreduce_umax_v2i32:
	; RV32: # %bb.0:			; CHECK: # %bb.0:
	; RV32-NEXT: vsetivli zero, 1, e32, m1, ta, ma			; CHECK-NEXT: vsetvli zero, a1, e32, mf2, ta, ma
	; RV32-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.v.x v9, a0
	; RV32-NEXT: vsetvli zero, a1, e32, mf2, tu, ma			; CHECK-NEXT: vsetvli zero, zero, e32, mf2, tu, ma
	; RV32-NEXT: vredmaxu.vs v9, v8, v9, v0.t			; CHECK-NEXT: vredmaxu.vs v9, v8, v9, v0.t
	; RV32-NEXT: vmv.x.s a0, v9			; CHECK-NEXT: vmv.x.s a0, v9
	; RV32-NEXT: ret			; CHECK-NEXT: ret
	;
	; RV64-LABEL: vpreduce_umax_v2i32:
	; RV64: # %bb.0:
	; RV64-NEXT: slli a0, a0, 32
	; RV64-NEXT: srli a0, a0, 32
	; RV64-NEXT: vsetivli zero, 1, e32, m1, ta, ma
	; RV64-NEXT: vmv.s.x v9, a0
	; RV64-NEXT: vsetvli zero, a1, e32, mf2, tu, ma
	; RV64-NEXT: vredmaxu.vs v9, v8, v9, v0.t
	; RV64-NEXT: vmv.x.s a0, v9
	; RV64-NEXT: ret
	%r = call i32 @llvm.vp.reduce.umax.v2i32(i32 %s, <2 x i32> %v, <2 x i1> %m, i32 %evl)			%r = call i32 @llvm.vp.reduce.umax.v2i32(i32 %s, <2 x i32> %v, <2 x i1> %m, i32 %evl)
	ret i32 %r			ret i32 %r
	}			}

	declare i32 @llvm.vp.reduce.smax.v2i32(i32, <2 x i32>, <2 x i1>, i32)			declare i32 @llvm.vp.reduce.smax.v2i32(i32, <2 x i32>, <2 x i1>, i32)

	define signext i32 @vpreduce_smax_v2i32(i32 signext %s, <2 x i32> %v, <2 x i1> %m, i32 zeroext %evl) {			define signext i32 @vpreduce_smax_v2i32(i32 signext %s, <2 x i32> %v, <2 x i1> %m, i32 zeroext %evl) {
	; CHECK-LABEL: vpreduce_smax_v2i32:			; CHECK-LABEL: vpreduce_smax_v2i32:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma			; CHECK-NEXT: vsetvli zero, a1, e32, mf2, ta, ma
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.v.x v9, a0
	; CHECK-NEXT: vsetvli zero, a1, e32, mf2, tu, ma			; CHECK-NEXT: vsetvli zero, zero, e32, mf2, tu, ma
	; CHECK-NEXT: vredmax.vs v9, v8, v9, v0.t			; CHECK-NEXT: vredmax.vs v9, v8, v9, v0.t
	; CHECK-NEXT: vmv.x.s a0, v9			; CHECK-NEXT: vmv.x.s a0, v9
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call i32 @llvm.vp.reduce.smax.v2i32(i32 %s, <2 x i32> %v, <2 x i1> %m, i32 %evl)			%r = call i32 @llvm.vp.reduce.smax.v2i32(i32 %s, <2 x i32> %v, <2 x i1> %m, i32 %evl)
	ret i32 %r			ret i32 %r
	}			}

	declare i32 @llvm.vp.reduce.umin.v2i32(i32, <2 x i32>, <2 x i1>, i32)			declare i32 @llvm.vp.reduce.umin.v2i32(i32, <2 x i32>, <2 x i1>, i32)

	define signext i32 @vpreduce_umin_v2i32(i32 signext %s, <2 x i32> %v, <2 x i1> %m, i32 zeroext %evl) {			define signext i32 @vpreduce_umin_v2i32(i32 signext %s, <2 x i32> %v, <2 x i1> %m, i32 zeroext %evl) {
	; RV32-LABEL: vpreduce_umin_v2i32:			; CHECK-LABEL: vpreduce_umin_v2i32:
	; RV32: # %bb.0:			; CHECK: # %bb.0:
	; RV32-NEXT: vsetivli zero, 1, e32, m1, ta, ma			; CHECK-NEXT: vsetvli zero, a1, e32, mf2, ta, ma
	; RV32-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.v.x v9, a0
	; RV32-NEXT: vsetvli zero, a1, e32, mf2, tu, ma			; CHECK-NEXT: vsetvli zero, zero, e32, mf2, tu, ma
	; RV32-NEXT: vredminu.vs v9, v8, v9, v0.t			; CHECK-NEXT: vredminu.vs v9, v8, v9, v0.t
	; RV32-NEXT: vmv.x.s a0, v9			; CHECK-NEXT: vmv.x.s a0, v9
	; RV32-NEXT: ret			; CHECK-NEXT: ret
	;
	; RV64-LABEL: vpreduce_umin_v2i32:
	; RV64: # %bb.0:
	; RV64-NEXT: slli a0, a0, 32
	; RV64-NEXT: srli a0, a0, 32
	; RV64-NEXT: vsetivli zero, 1, e32, m1, ta, ma
	; RV64-NEXT: vmv.s.x v9, a0
	; RV64-NEXT: vsetvli zero, a1, e32, mf2, tu, ma
	; RV64-NEXT: vredminu.vs v9, v8, v9, v0.t
	; RV64-NEXT: vmv.x.s a0, v9
	; RV64-NEXT: ret
	%r = call i32 @llvm.vp.reduce.umin.v2i32(i32 %s, <2 x i32> %v, <2 x i1> %m, i32 %evl)			%r = call i32 @llvm.vp.reduce.umin.v2i32(i32 %s, <2 x i32> %v, <2 x i1> %m, i32 %evl)
	ret i32 %r			ret i32 %r
	}			}

	declare i32 @llvm.vp.reduce.smin.v2i32(i32, <2 x i32>, <2 x i1>, i32)			declare i32 @llvm.vp.reduce.smin.v2i32(i32, <2 x i32>, <2 x i1>, i32)

	define signext i32 @vpreduce_smin_v2i32(i32 signext %s, <2 x i32> %v, <2 x i1> %m, i32 zeroext %evl) {			define signext i32 @vpreduce_smin_v2i32(i32 signext %s, <2 x i32> %v, <2 x i1> %m, i32 zeroext %evl) {
	; CHECK-LABEL: vpreduce_smin_v2i32:			; CHECK-LABEL: vpreduce_smin_v2i32:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma			; CHECK-NEXT: vsetvli zero, a1, e32, mf2, ta, ma
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.v.x v9, a0
	; CHECK-NEXT: vsetvli zero, a1, e32, mf2, tu, ma			; CHECK-NEXT: vsetvli zero, zero, e32, mf2, tu, ma
	; CHECK-NEXT: vredmin.vs v9, v8, v9, v0.t			; CHECK-NEXT: vredmin.vs v9, v8, v9, v0.t
	; CHECK-NEXT: vmv.x.s a0, v9			; CHECK-NEXT: vmv.x.s a0, v9
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call i32 @llvm.vp.reduce.smin.v2i32(i32 %s, <2 x i32> %v, <2 x i1> %m, i32 %evl)			%r = call i32 @llvm.vp.reduce.smin.v2i32(i32 %s, <2 x i32> %v, <2 x i1> %m, i32 %evl)
	ret i32 %r			ret i32 %r
	}			}

	declare i32 @llvm.vp.reduce.and.v2i32(i32, <2 x i32>, <2 x i1>, i32)			declare i32 @llvm.vp.reduce.and.v2i32(i32, <2 x i32>, <2 x i1>, i32)

	define signext i32 @vpreduce_and_v2i32(i32 signext %s, <2 x i32> %v, <2 x i1> %m, i32 zeroext %evl) {			define signext i32 @vpreduce_and_v2i32(i32 signext %s, <2 x i32> %v, <2 x i1> %m, i32 zeroext %evl) {
	; CHECK-LABEL: vpreduce_and_v2i32:			; CHECK-LABEL: vpreduce_and_v2i32:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma			; CHECK-NEXT: vsetvli zero, a1, e32, mf2, ta, ma
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.v.x v9, a0
	; CHECK-NEXT: vsetvli zero, a1, e32, mf2, tu, ma			; CHECK-NEXT: vsetvli zero, zero, e32, mf2, tu, ma
	; CHECK-NEXT: vredand.vs v9, v8, v9, v0.t			; CHECK-NEXT: vredand.vs v9, v8, v9, v0.t
	; CHECK-NEXT: vmv.x.s a0, v9			; CHECK-NEXT: vmv.x.s a0, v9
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call i32 @llvm.vp.reduce.and.v2i32(i32 %s, <2 x i32> %v, <2 x i1> %m, i32 %evl)			%r = call i32 @llvm.vp.reduce.and.v2i32(i32 %s, <2 x i32> %v, <2 x i1> %m, i32 %evl)
	ret i32 %r			ret i32 %r
	}			}

	declare i32 @llvm.vp.reduce.or.v2i32(i32, <2 x i32>, <2 x i1>, i32)			declare i32 @llvm.vp.reduce.or.v2i32(i32, <2 x i32>, <2 x i1>, i32)

	define signext i32 @vpreduce_or_v2i32(i32 signext %s, <2 x i32> %v, <2 x i1> %m, i32 zeroext %evl) {			define signext i32 @vpreduce_or_v2i32(i32 signext %s, <2 x i32> %v, <2 x i1> %m, i32 zeroext %evl) {
	; CHECK-LABEL: vpreduce_or_v2i32:			; CHECK-LABEL: vpreduce_or_v2i32:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma			; CHECK-NEXT: vsetvli zero, a1, e32, mf2, ta, ma
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.v.x v9, a0
	; CHECK-NEXT: vsetvli zero, a1, e32, mf2, tu, ma			; CHECK-NEXT: vsetvli zero, zero, e32, mf2, tu, ma
	; CHECK-NEXT: vredor.vs v9, v8, v9, v0.t			; CHECK-NEXT: vredor.vs v9, v8, v9, v0.t
	; CHECK-NEXT: vmv.x.s a0, v9			; CHECK-NEXT: vmv.x.s a0, v9
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call i32 @llvm.vp.reduce.or.v2i32(i32 %s, <2 x i32> %v, <2 x i1> %m, i32 %evl)			%r = call i32 @llvm.vp.reduce.or.v2i32(i32 %s, <2 x i32> %v, <2 x i1> %m, i32 %evl)
	ret i32 %r			ret i32 %r
	}			}

	declare i32 @llvm.vp.reduce.xor.v2i32(i32, <2 x i32>, <2 x i1>, i32)			declare i32 @llvm.vp.reduce.xor.v2i32(i32, <2 x i32>, <2 x i1>, i32)

	define signext i32 @vpreduce_xor_v2i32(i32 signext %s, <2 x i32> %v, <2 x i1> %m, i32 zeroext %evl) {			define signext i32 @vpreduce_xor_v2i32(i32 signext %s, <2 x i32> %v, <2 x i1> %m, i32 zeroext %evl) {
	; CHECK-LABEL: vpreduce_xor_v2i32:			; CHECK-LABEL: vpreduce_xor_v2i32:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma			; CHECK-NEXT: vsetvli zero, a1, e32, mf2, ta, ma
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.v.x v9, a0
	; CHECK-NEXT: vsetvli zero, a1, e32, mf2, tu, ma			; CHECK-NEXT: vsetvli zero, zero, e32, mf2, tu, ma
	; CHECK-NEXT: vredxor.vs v9, v8, v9, v0.t			; CHECK-NEXT: vredxor.vs v9, v8, v9, v0.t
	; CHECK-NEXT: vmv.x.s a0, v9			; CHECK-NEXT: vmv.x.s a0, v9
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call i32 @llvm.vp.reduce.xor.v2i32(i32 %s, <2 x i32> %v, <2 x i1> %m, i32 %evl)			%r = call i32 @llvm.vp.reduce.xor.v2i32(i32 %s, <2 x i32> %v, <2 x i1> %m, i32 %evl)
	ret i32 %r			ret i32 %r
	}			}

	declare i32 @llvm.vp.reduce.add.v4i32(i32, <4 x i32>, <4 x i1>, i32)			declare i32 @llvm.vp.reduce.add.v4i32(i32, <4 x i32>, <4 x i1>, i32)

	define signext i32 @vpreduce_add_v4i32(i32 signext %s, <4 x i32> %v, <4 x i1> %m, i32 zeroext %evl) {			define signext i32 @vpreduce_add_v4i32(i32 signext %s, <4 x i32> %v, <4 x i1> %m, i32 zeroext %evl) {
	; CHECK-LABEL: vpreduce_add_v4i32:			; CHECK-LABEL: vpreduce_add_v4i32:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma			; CHECK-NEXT: vsetvli zero, a1, e32, m1, ta, ma
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.v.x v9, a0
	; CHECK-NEXT: vsetvli zero, a1, e32, m1, tu, ma			; CHECK-NEXT: vsetvli zero, zero, e32, m1, tu, ma
	; CHECK-NEXT: vredsum.vs v9, v8, v9, v0.t			; CHECK-NEXT: vredsum.vs v9, v8, v9, v0.t
	; CHECK-NEXT: vmv.x.s a0, v9			; CHECK-NEXT: vmv.x.s a0, v9
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call i32 @llvm.vp.reduce.add.v4i32(i32 %s, <4 x i32> %v, <4 x i1> %m, i32 %evl)			%r = call i32 @llvm.vp.reduce.add.v4i32(i32 %s, <4 x i32> %v, <4 x i1> %m, i32 %evl)
	ret i32 %r			ret i32 %r
	}			}

	declare i32 @llvm.vp.reduce.umax.v4i32(i32, <4 x i32>, <4 x i1>, i32)			declare i32 @llvm.vp.reduce.umax.v4i32(i32, <4 x i32>, <4 x i1>, i32)

	define signext i32 @vpreduce_umax_v4i32(i32 signext %s, <4 x i32> %v, <4 x i1> %m, i32 zeroext %evl) {			define signext i32 @vpreduce_umax_v4i32(i32 signext %s, <4 x i32> %v, <4 x i1> %m, i32 zeroext %evl) {
	; RV32-LABEL: vpreduce_umax_v4i32:			; CHECK-LABEL: vpreduce_umax_v4i32:
	; RV32: # %bb.0:			; CHECK: # %bb.0:
	; RV32-NEXT: vsetivli zero, 1, e32, m1, ta, ma			; CHECK-NEXT: vsetvli zero, a1, e32, m1, ta, ma
	; RV32-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.v.x v9, a0
	; RV32-NEXT: vsetvli zero, a1, e32, m1, tu, ma			; CHECK-NEXT: vsetvli zero, zero, e32, m1, tu, ma
	; RV32-NEXT: vredmaxu.vs v9, v8, v9, v0.t			; CHECK-NEXT: vredmaxu.vs v9, v8, v9, v0.t
	; RV32-NEXT: vmv.x.s a0, v9			; CHECK-NEXT: vmv.x.s a0, v9
	; RV32-NEXT: ret			; CHECK-NEXT: ret
	;
	; RV64-LABEL: vpreduce_umax_v4i32:
	; RV64: # %bb.0:
	; RV64-NEXT: slli a0, a0, 32
	; RV64-NEXT: srli a0, a0, 32
	; RV64-NEXT: vsetivli zero, 1, e32, m1, ta, ma
	; RV64-NEXT: vmv.s.x v9, a0
	; RV64-NEXT: vsetvli zero, a1, e32, m1, tu, ma
	; RV64-NEXT: vredmaxu.vs v9, v8, v9, v0.t
	; RV64-NEXT: vmv.x.s a0, v9
	; RV64-NEXT: ret
	%r = call i32 @llvm.vp.reduce.umax.v4i32(i32 %s, <4 x i32> %v, <4 x i1> %m, i32 %evl)			%r = call i32 @llvm.vp.reduce.umax.v4i32(i32 %s, <4 x i32> %v, <4 x i1> %m, i32 %evl)
	ret i32 %r			ret i32 %r
	}			}

	declare i32 @llvm.vp.reduce.smax.v4i32(i32, <4 x i32>, <4 x i1>, i32)			declare i32 @llvm.vp.reduce.smax.v4i32(i32, <4 x i32>, <4 x i1>, i32)

	define signext i32 @vpreduce_smax_v4i32(i32 signext %s, <4 x i32> %v, <4 x i1> %m, i32 zeroext %evl) {			define signext i32 @vpreduce_smax_v4i32(i32 signext %s, <4 x i32> %v, <4 x i1> %m, i32 zeroext %evl) {
	; CHECK-LABEL: vpreduce_smax_v4i32:			; CHECK-LABEL: vpreduce_smax_v4i32:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma			; CHECK-NEXT: vsetvli zero, a1, e32, m1, ta, ma
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.v.x v9, a0
	; CHECK-NEXT: vsetvli zero, a1, e32, m1, tu, ma			; CHECK-NEXT: vsetvli zero, zero, e32, m1, tu, ma
	; CHECK-NEXT: vredmax.vs v9, v8, v9, v0.t			; CHECK-NEXT: vredmax.vs v9, v8, v9, v0.t
	; CHECK-NEXT: vmv.x.s a0, v9			; CHECK-NEXT: vmv.x.s a0, v9
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call i32 @llvm.vp.reduce.smax.v4i32(i32 %s, <4 x i32> %v, <4 x i1> %m, i32 %evl)			%r = call i32 @llvm.vp.reduce.smax.v4i32(i32 %s, <4 x i32> %v, <4 x i1> %m, i32 %evl)
	ret i32 %r			ret i32 %r
	}			}

	declare i32 @llvm.vp.reduce.umin.v4i32(i32, <4 x i32>, <4 x i1>, i32)			declare i32 @llvm.vp.reduce.umin.v4i32(i32, <4 x i32>, <4 x i1>, i32)

	define signext i32 @vpreduce_umin_v4i32(i32 signext %s, <4 x i32> %v, <4 x i1> %m, i32 zeroext %evl) {			define signext i32 @vpreduce_umin_v4i32(i32 signext %s, <4 x i32> %v, <4 x i1> %m, i32 zeroext %evl) {
	; RV32-LABEL: vpreduce_umin_v4i32:			; CHECK-LABEL: vpreduce_umin_v4i32:
	; RV32: # %bb.0:			; CHECK: # %bb.0:
	; RV32-NEXT: vsetivli zero, 1, e32, m1, ta, ma			; CHECK-NEXT: vsetvli zero, a1, e32, m1, ta, ma
	; RV32-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.v.x v9, a0
	; RV32-NEXT: vsetvli zero, a1, e32, m1, tu, ma			; CHECK-NEXT: vsetvli zero, zero, e32, m1, tu, ma
	; RV32-NEXT: vredminu.vs v9, v8, v9, v0.t			; CHECK-NEXT: vredminu.vs v9, v8, v9, v0.t
	; RV32-NEXT: vmv.x.s a0, v9			; CHECK-NEXT: vmv.x.s a0, v9
	; RV32-NEXT: ret			; CHECK-NEXT: ret
	;
	; RV64-LABEL: vpreduce_umin_v4i32:
	; RV64: # %bb.0:
	; RV64-NEXT: slli a0, a0, 32
	; RV64-NEXT: srli a0, a0, 32
	; RV64-NEXT: vsetivli zero, 1, e32, m1, ta, ma
	; RV64-NEXT: vmv.s.x v9, a0
	; RV64-NEXT: vsetvli zero, a1, e32, m1, tu, ma
	; RV64-NEXT: vredminu.vs v9, v8, v9, v0.t
	; RV64-NEXT: vmv.x.s a0, v9
	; RV64-NEXT: ret
	%r = call i32 @llvm.vp.reduce.umin.v4i32(i32 %s, <4 x i32> %v, <4 x i1> %m, i32 %evl)			%r = call i32 @llvm.vp.reduce.umin.v4i32(i32 %s, <4 x i32> %v, <4 x i1> %m, i32 %evl)
	ret i32 %r			ret i32 %r
	}			}

	declare i32 @llvm.vp.reduce.smin.v4i32(i32, <4 x i32>, <4 x i1>, i32)			declare i32 @llvm.vp.reduce.smin.v4i32(i32, <4 x i32>, <4 x i1>, i32)

	define signext i32 @vpreduce_smin_v4i32(i32 signext %s, <4 x i32> %v, <4 x i1> %m, i32 zeroext %evl) {			define signext i32 @vpreduce_smin_v4i32(i32 signext %s, <4 x i32> %v, <4 x i1> %m, i32 zeroext %evl) {
	; CHECK-LABEL: vpreduce_smin_v4i32:			; CHECK-LABEL: vpreduce_smin_v4i32:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma			; CHECK-NEXT: vsetvli zero, a1, e32, m1, ta, ma
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.v.x v9, a0
	; CHECK-NEXT: vsetvli zero, a1, e32, m1, tu, ma			; CHECK-NEXT: vsetvli zero, zero, e32, m1, tu, ma
	; CHECK-NEXT: vredmin.vs v9, v8, v9, v0.t			; CHECK-NEXT: vredmin.vs v9, v8, v9, v0.t
	; CHECK-NEXT: vmv.x.s a0, v9			; CHECK-NEXT: vmv.x.s a0, v9
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call i32 @llvm.vp.reduce.smin.v4i32(i32 %s, <4 x i32> %v, <4 x i1> %m, i32 %evl)			%r = call i32 @llvm.vp.reduce.smin.v4i32(i32 %s, <4 x i32> %v, <4 x i1> %m, i32 %evl)
	ret i32 %r			ret i32 %r
	}			}

	declare i32 @llvm.vp.reduce.and.v4i32(i32, <4 x i32>, <4 x i1>, i32)			declare i32 @llvm.vp.reduce.and.v4i32(i32, <4 x i32>, <4 x i1>, i32)

	define signext i32 @vpreduce_and_v4i32(i32 signext %s, <4 x i32> %v, <4 x i1> %m, i32 zeroext %evl) {			define signext i32 @vpreduce_and_v4i32(i32 signext %s, <4 x i32> %v, <4 x i1> %m, i32 zeroext %evl) {
	; CHECK-LABEL: vpreduce_and_v4i32:			; CHECK-LABEL: vpreduce_and_v4i32:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma			; CHECK-NEXT: vsetvli zero, a1, e32, m1, ta, ma
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.v.x v9, a0
	; CHECK-NEXT: vsetvli zero, a1, e32, m1, tu, ma			; CHECK-NEXT: vsetvli zero, zero, e32, m1, tu, ma
	; CHECK-NEXT: vredand.vs v9, v8, v9, v0.t			; CHECK-NEXT: vredand.vs v9, v8, v9, v0.t
	; CHECK-NEXT: vmv.x.s a0, v9			; CHECK-NEXT: vmv.x.s a0, v9
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call i32 @llvm.vp.reduce.and.v4i32(i32 %s, <4 x i32> %v, <4 x i1> %m, i32 %evl)			%r = call i32 @llvm.vp.reduce.and.v4i32(i32 %s, <4 x i32> %v, <4 x i1> %m, i32 %evl)
	ret i32 %r			ret i32 %r
	}			}

	declare i32 @llvm.vp.reduce.or.v4i32(i32, <4 x i32>, <4 x i1>, i32)			declare i32 @llvm.vp.reduce.or.v4i32(i32, <4 x i32>, <4 x i1>, i32)

	define signext i32 @vpreduce_or_v4i32(i32 signext %s, <4 x i32> %v, <4 x i1> %m, i32 zeroext %evl) {			define signext i32 @vpreduce_or_v4i32(i32 signext %s, <4 x i32> %v, <4 x i1> %m, i32 zeroext %evl) {
	; CHECK-LABEL: vpreduce_or_v4i32:			; CHECK-LABEL: vpreduce_or_v4i32:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma			; CHECK-NEXT: vsetvli zero, a1, e32, m1, ta, ma
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.v.x v9, a0
	; CHECK-NEXT: vsetvli zero, a1, e32, m1, tu, ma			; CHECK-NEXT: vsetvli zero, zero, e32, m1, tu, ma
	; CHECK-NEXT: vredor.vs v9, v8, v9, v0.t			; CHECK-NEXT: vredor.vs v9, v8, v9, v0.t
	; CHECK-NEXT: vmv.x.s a0, v9			; CHECK-NEXT: vmv.x.s a0, v9
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call i32 @llvm.vp.reduce.or.v4i32(i32 %s, <4 x i32> %v, <4 x i1> %m, i32 %evl)			%r = call i32 @llvm.vp.reduce.or.v4i32(i32 %s, <4 x i32> %v, <4 x i1> %m, i32 %evl)
	ret i32 %r			ret i32 %r
	}			}

	declare i32 @llvm.vp.reduce.xor.v4i32(i32, <4 x i32>, <4 x i1>, i32)			declare i32 @llvm.vp.reduce.xor.v4i32(i32, <4 x i32>, <4 x i1>, i32)

	define signext i32 @vpreduce_xor_v4i32(i32 signext %s, <4 x i32> %v, <4 x i1> %m, i32 zeroext %evl) {			define signext i32 @vpreduce_xor_v4i32(i32 signext %s, <4 x i32> %v, <4 x i1> %m, i32 zeroext %evl) {
	; CHECK-LABEL: vpreduce_xor_v4i32:			; CHECK-LABEL: vpreduce_xor_v4i32:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma			; CHECK-NEXT: vsetvli zero, a1, e32, m1, ta, ma
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.v.x v9, a0
	; CHECK-NEXT: vsetvli zero, a1, e32, m1, tu, ma			; CHECK-NEXT: vsetvli zero, zero, e32, m1, tu, ma
	; CHECK-NEXT: vredxor.vs v9, v8, v9, v0.t			; CHECK-NEXT: vredxor.vs v9, v8, v9, v0.t
	; CHECK-NEXT: vmv.x.s a0, v9			; CHECK-NEXT: vmv.x.s a0, v9
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call i32 @llvm.vp.reduce.xor.v4i32(i32 %s, <4 x i32> %v, <4 x i1> %m, i32 %evl)			%r = call i32 @llvm.vp.reduce.xor.v4i32(i32 %s, <4 x i32> %v, <4 x i1> %m, i32 %evl)
	ret i32 %r			ret i32 %r
	}			}

	declare i32 @llvm.vp.reduce.xor.v64i32(i32, <64 x i32>, <64 x i1>, i32)			declare i32 @llvm.vp.reduce.xor.v64i32(i32, <64 x i32>, <64 x i1>, i32)
	Show All 34 Lines
	define signext i64 @vpreduce_add_v2i64(i64 signext %s, <2 x i64> %v, <2 x i1> %m, i32 zeroext %evl) {			define signext i64 @vpreduce_add_v2i64(i64 signext %s, <2 x i64> %v, <2 x i1> %m, i32 zeroext %evl) {
	; RV32-LABEL: vpreduce_add_v2i64:			; RV32-LABEL: vpreduce_add_v2i64:
	; RV32: # %bb.0:			; RV32: # %bb.0:
	; RV32-NEXT: addi sp, sp, -16			; RV32-NEXT: addi sp, sp, -16
	; RV32-NEXT: .cfi_def_cfa_offset 16			; RV32-NEXT: .cfi_def_cfa_offset 16
	; RV32-NEXT: sw a1, 12(sp)			; RV32-NEXT: sw a1, 12(sp)
	; RV32-NEXT: sw a0, 8(sp)			; RV32-NEXT: sw a0, 8(sp)
	; RV32-NEXT: addi a0, sp, 8			; RV32-NEXT: addi a0, sp, 8
	; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV32-NEXT: vsetvli zero, a2, e64, m1, ta, ma
	; RV32-NEXT: vlse64.v v9, (a0), zero			; RV32-NEXT: vlse64.v v9, (a0), zero
	; RV32-NEXT: vsetvli zero, a2, e64, m1, tu, ma			; RV32-NEXT: vsetvli zero, zero, e64, m1, tu, ma
	; RV32-NEXT: vredsum.vs v9, v8, v9, v0.t			; RV32-NEXT: vredsum.vs v9, v8, v9, v0.t
	; RV32-NEXT: vmv.x.s a0, v9			; RV32-NEXT: vmv.x.s a0, v9
	; RV32-NEXT: li a1, 32			; RV32-NEXT: li a1, 32
	; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma
	; RV32-NEXT: vsrl.vx v8, v9, a1			; RV32-NEXT: vsrl.vx v8, v9, a1
	; RV32-NEXT: vmv.x.s a1, v8			; RV32-NEXT: vmv.x.s a1, v8
	; RV32-NEXT: addi sp, sp, 16			; RV32-NEXT: addi sp, sp, 16
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: vpreduce_add_v2i64:			; RV64-LABEL: vpreduce_add_v2i64:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV64-NEXT: vsetvli zero, a1, e64, m1, ta, ma
	; RV64-NEXT: vmv.s.x v9, a0			; RV64-NEXT: vmv.v.x v9, a0
	; RV64-NEXT: vsetvli zero, a1, e64, m1, tu, ma			; RV64-NEXT: vsetvli zero, zero, e64, m1, tu, ma
	; RV64-NEXT: vredsum.vs v9, v8, v9, v0.t			; RV64-NEXT: vredsum.vs v9, v8, v9, v0.t
	; RV64-NEXT: vmv.x.s a0, v9			; RV64-NEXT: vmv.x.s a0, v9
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%r = call i64 @llvm.vp.reduce.add.v2i64(i64 %s, <2 x i64> %v, <2 x i1> %m, i32 %evl)			%r = call i64 @llvm.vp.reduce.add.v2i64(i64 %s, <2 x i64> %v, <2 x i1> %m, i32 %evl)
	ret i64 %r			ret i64 %r
	}			}

	declare i64 @llvm.vp.reduce.umax.v2i64(i64, <2 x i64>, <2 x i1>, i32)			declare i64 @llvm.vp.reduce.umax.v2i64(i64, <2 x i64>, <2 x i1>, i32)

	define signext i64 @vpreduce_umax_v2i64(i64 signext %s, <2 x i64> %v, <2 x i1> %m, i32 zeroext %evl) {			define signext i64 @vpreduce_umax_v2i64(i64 signext %s, <2 x i64> %v, <2 x i1> %m, i32 zeroext %evl) {
	; RV32-LABEL: vpreduce_umax_v2i64:			; RV32-LABEL: vpreduce_umax_v2i64:
	; RV32: # %bb.0:			; RV32: # %bb.0:
	; RV32-NEXT: addi sp, sp, -16			; RV32-NEXT: addi sp, sp, -16
	; RV32-NEXT: .cfi_def_cfa_offset 16			; RV32-NEXT: .cfi_def_cfa_offset 16
	; RV32-NEXT: sw a1, 12(sp)			; RV32-NEXT: sw a1, 12(sp)
	; RV32-NEXT: sw a0, 8(sp)			; RV32-NEXT: sw a0, 8(sp)
	; RV32-NEXT: addi a0, sp, 8			; RV32-NEXT: addi a0, sp, 8
	; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV32-NEXT: vsetvli zero, a2, e64, m1, ta, ma
	; RV32-NEXT: vlse64.v v9, (a0), zero			; RV32-NEXT: vlse64.v v9, (a0), zero
	; RV32-NEXT: vsetvli zero, a2, e64, m1, tu, ma			; RV32-NEXT: vsetvli zero, zero, e64, m1, tu, ma
	; RV32-NEXT: vredmaxu.vs v9, v8, v9, v0.t			; RV32-NEXT: vredmaxu.vs v9, v8, v9, v0.t
	; RV32-NEXT: vmv.x.s a0, v9			; RV32-NEXT: vmv.x.s a0, v9
	; RV32-NEXT: li a1, 32			; RV32-NEXT: li a1, 32
	; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma
	; RV32-NEXT: vsrl.vx v8, v9, a1			; RV32-NEXT: vsrl.vx v8, v9, a1
	; RV32-NEXT: vmv.x.s a1, v8			; RV32-NEXT: vmv.x.s a1, v8
	; RV32-NEXT: addi sp, sp, 16			; RV32-NEXT: addi sp, sp, 16
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: vpreduce_umax_v2i64:			; RV64-LABEL: vpreduce_umax_v2i64:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV64-NEXT: vsetvli zero, a1, e64, m1, ta, ma
	; RV64-NEXT: vmv.s.x v9, a0			; RV64-NEXT: vmv.v.x v9, a0
	; RV64-NEXT: vsetvli zero, a1, e64, m1, tu, ma			; RV64-NEXT: vsetvli zero, zero, e64, m1, tu, ma
	; RV64-NEXT: vredmaxu.vs v9, v8, v9, v0.t			; RV64-NEXT: vredmaxu.vs v9, v8, v9, v0.t
	; RV64-NEXT: vmv.x.s a0, v9			; RV64-NEXT: vmv.x.s a0, v9
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%r = call i64 @llvm.vp.reduce.umax.v2i64(i64 %s, <2 x i64> %v, <2 x i1> %m, i32 %evl)			%r = call i64 @llvm.vp.reduce.umax.v2i64(i64 %s, <2 x i64> %v, <2 x i1> %m, i32 %evl)
	ret i64 %r			ret i64 %r
	}			}

	declare i64 @llvm.vp.reduce.smax.v2i64(i64, <2 x i64>, <2 x i1>, i32)			declare i64 @llvm.vp.reduce.smax.v2i64(i64, <2 x i64>, <2 x i1>, i32)

	define signext i64 @vpreduce_smax_v2i64(i64 signext %s, <2 x i64> %v, <2 x i1> %m, i32 zeroext %evl) {			define signext i64 @vpreduce_smax_v2i64(i64 signext %s, <2 x i64> %v, <2 x i1> %m, i32 zeroext %evl) {
	; RV32-LABEL: vpreduce_smax_v2i64:			; RV32-LABEL: vpreduce_smax_v2i64:
	; RV32: # %bb.0:			; RV32: # %bb.0:
	; RV32-NEXT: addi sp, sp, -16			; RV32-NEXT: addi sp, sp, -16
	; RV32-NEXT: .cfi_def_cfa_offset 16			; RV32-NEXT: .cfi_def_cfa_offset 16
	; RV32-NEXT: sw a1, 12(sp)			; RV32-NEXT: sw a1, 12(sp)
	; RV32-NEXT: sw a0, 8(sp)			; RV32-NEXT: sw a0, 8(sp)
	; RV32-NEXT: addi a0, sp, 8			; RV32-NEXT: addi a0, sp, 8
	; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV32-NEXT: vsetvli zero, a2, e64, m1, ta, ma
	; RV32-NEXT: vlse64.v v9, (a0), zero			; RV32-NEXT: vlse64.v v9, (a0), zero
	; RV32-NEXT: vsetvli zero, a2, e64, m1, tu, ma			; RV32-NEXT: vsetvli zero, zero, e64, m1, tu, ma
	; RV32-NEXT: vredmax.vs v9, v8, v9, v0.t			; RV32-NEXT: vredmax.vs v9, v8, v9, v0.t
	; RV32-NEXT: vmv.x.s a0, v9			; RV32-NEXT: vmv.x.s a0, v9
	; RV32-NEXT: li a1, 32			; RV32-NEXT: li a1, 32
	; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma
	; RV32-NEXT: vsrl.vx v8, v9, a1			; RV32-NEXT: vsrl.vx v8, v9, a1
	; RV32-NEXT: vmv.x.s a1, v8			; RV32-NEXT: vmv.x.s a1, v8
	; RV32-NEXT: addi sp, sp, 16			; RV32-NEXT: addi sp, sp, 16
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: vpreduce_smax_v2i64:			; RV64-LABEL: vpreduce_smax_v2i64:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV64-NEXT: vsetvli zero, a1, e64, m1, ta, ma
	; RV64-NEXT: vmv.s.x v9, a0			; RV64-NEXT: vmv.v.x v9, a0
	; RV64-NEXT: vsetvli zero, a1, e64, m1, tu, ma			; RV64-NEXT: vsetvli zero, zero, e64, m1, tu, ma
	; RV64-NEXT: vredmax.vs v9, v8, v9, v0.t			; RV64-NEXT: vredmax.vs v9, v8, v9, v0.t
	; RV64-NEXT: vmv.x.s a0, v9			; RV64-NEXT: vmv.x.s a0, v9
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%r = call i64 @llvm.vp.reduce.smax.v2i64(i64 %s, <2 x i64> %v, <2 x i1> %m, i32 %evl)			%r = call i64 @llvm.vp.reduce.smax.v2i64(i64 %s, <2 x i64> %v, <2 x i1> %m, i32 %evl)
	ret i64 %r			ret i64 %r
	}			}

	declare i64 @llvm.vp.reduce.umin.v2i64(i64, <2 x i64>, <2 x i1>, i32)			declare i64 @llvm.vp.reduce.umin.v2i64(i64, <2 x i64>, <2 x i1>, i32)

	define signext i64 @vpreduce_umin_v2i64(i64 signext %s, <2 x i64> %v, <2 x i1> %m, i32 zeroext %evl) {			define signext i64 @vpreduce_umin_v2i64(i64 signext %s, <2 x i64> %v, <2 x i1> %m, i32 zeroext %evl) {
	; RV32-LABEL: vpreduce_umin_v2i64:			; RV32-LABEL: vpreduce_umin_v2i64:
	; RV32: # %bb.0:			; RV32: # %bb.0:
	; RV32-NEXT: addi sp, sp, -16			; RV32-NEXT: addi sp, sp, -16
	; RV32-NEXT: .cfi_def_cfa_offset 16			; RV32-NEXT: .cfi_def_cfa_offset 16
	; RV32-NEXT: sw a1, 12(sp)			; RV32-NEXT: sw a1, 12(sp)
	; RV32-NEXT: sw a0, 8(sp)			; RV32-NEXT: sw a0, 8(sp)
	; RV32-NEXT: addi a0, sp, 8			; RV32-NEXT: addi a0, sp, 8
	; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV32-NEXT: vsetvli zero, a2, e64, m1, ta, ma
	; RV32-NEXT: vlse64.v v9, (a0), zero			; RV32-NEXT: vlse64.v v9, (a0), zero
	; RV32-NEXT: vsetvli zero, a2, e64, m1, tu, ma			; RV32-NEXT: vsetvli zero, zero, e64, m1, tu, ma
	; RV32-NEXT: vredminu.vs v9, v8, v9, v0.t			; RV32-NEXT: vredminu.vs v9, v8, v9, v0.t
	; RV32-NEXT: vmv.x.s a0, v9			; RV32-NEXT: vmv.x.s a0, v9
	; RV32-NEXT: li a1, 32			; RV32-NEXT: li a1, 32
	; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma
	; RV32-NEXT: vsrl.vx v8, v9, a1			; RV32-NEXT: vsrl.vx v8, v9, a1
	; RV32-NEXT: vmv.x.s a1, v8			; RV32-NEXT: vmv.x.s a1, v8
	; RV32-NEXT: addi sp, sp, 16			; RV32-NEXT: addi sp, sp, 16
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: vpreduce_umin_v2i64:			; RV64-LABEL: vpreduce_umin_v2i64:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV64-NEXT: vsetvli zero, a1, e64, m1, ta, ma
	; RV64-NEXT: vmv.s.x v9, a0			; RV64-NEXT: vmv.v.x v9, a0
	; RV64-NEXT: vsetvli zero, a1, e64, m1, tu, ma			; RV64-NEXT: vsetvli zero, zero, e64, m1, tu, ma
	; RV64-NEXT: vredminu.vs v9, v8, v9, v0.t			; RV64-NEXT: vredminu.vs v9, v8, v9, v0.t
	; RV64-NEXT: vmv.x.s a0, v9			; RV64-NEXT: vmv.x.s a0, v9
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%r = call i64 @llvm.vp.reduce.umin.v2i64(i64 %s, <2 x i64> %v, <2 x i1> %m, i32 %evl)			%r = call i64 @llvm.vp.reduce.umin.v2i64(i64 %s, <2 x i64> %v, <2 x i1> %m, i32 %evl)
	ret i64 %r			ret i64 %r
	}			}

	declare i64 @llvm.vp.reduce.smin.v2i64(i64, <2 x i64>, <2 x i1>, i32)			declare i64 @llvm.vp.reduce.smin.v2i64(i64, <2 x i64>, <2 x i1>, i32)

	define signext i64 @vpreduce_smin_v2i64(i64 signext %s, <2 x i64> %v, <2 x i1> %m, i32 zeroext %evl) {			define signext i64 @vpreduce_smin_v2i64(i64 signext %s, <2 x i64> %v, <2 x i1> %m, i32 zeroext %evl) {
	; RV32-LABEL: vpreduce_smin_v2i64:			; RV32-LABEL: vpreduce_smin_v2i64:
	; RV32: # %bb.0:			; RV32: # %bb.0:
	; RV32-NEXT: addi sp, sp, -16			; RV32-NEXT: addi sp, sp, -16
	; RV32-NEXT: .cfi_def_cfa_offset 16			; RV32-NEXT: .cfi_def_cfa_offset 16
	; RV32-NEXT: sw a1, 12(sp)			; RV32-NEXT: sw a1, 12(sp)
	; RV32-NEXT: sw a0, 8(sp)			; RV32-NEXT: sw a0, 8(sp)
	; RV32-NEXT: addi a0, sp, 8			; RV32-NEXT: addi a0, sp, 8
	; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV32-NEXT: vsetvli zero, a2, e64, m1, ta, ma
	; RV32-NEXT: vlse64.v v9, (a0), zero			; RV32-NEXT: vlse64.v v9, (a0), zero
	; RV32-NEXT: vsetvli zero, a2, e64, m1, tu, ma			; RV32-NEXT: vsetvli zero, zero, e64, m1, tu, ma
	; RV32-NEXT: vredmin.vs v9, v8, v9, v0.t			; RV32-NEXT: vredmin.vs v9, v8, v9, v0.t
	; RV32-NEXT: vmv.x.s a0, v9			; RV32-NEXT: vmv.x.s a0, v9
	; RV32-NEXT: li a1, 32			; RV32-NEXT: li a1, 32
	; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma
	; RV32-NEXT: vsrl.vx v8, v9, a1			; RV32-NEXT: vsrl.vx v8, v9, a1
	; RV32-NEXT: vmv.x.s a1, v8			; RV32-NEXT: vmv.x.s a1, v8
	; RV32-NEXT: addi sp, sp, 16			; RV32-NEXT: addi sp, sp, 16
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: vpreduce_smin_v2i64:			; RV64-LABEL: vpreduce_smin_v2i64:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV64-NEXT: vsetvli zero, a1, e64, m1, ta, ma
	; RV64-NEXT: vmv.s.x v9, a0			; RV64-NEXT: vmv.v.x v9, a0
	; RV64-NEXT: vsetvli zero, a1, e64, m1, tu, ma			; RV64-NEXT: vsetvli zero, zero, e64, m1, tu, ma
	; RV64-NEXT: vredmin.vs v9, v8, v9, v0.t			; RV64-NEXT: vredmin.vs v9, v8, v9, v0.t
	; RV64-NEXT: vmv.x.s a0, v9			; RV64-NEXT: vmv.x.s a0, v9
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%r = call i64 @llvm.vp.reduce.smin.v2i64(i64 %s, <2 x i64> %v, <2 x i1> %m, i32 %evl)			%r = call i64 @llvm.vp.reduce.smin.v2i64(i64 %s, <2 x i64> %v, <2 x i1> %m, i32 %evl)
	ret i64 %r			ret i64 %r
	}			}

	declare i64 @llvm.vp.reduce.and.v2i64(i64, <2 x i64>, <2 x i1>, i32)			declare i64 @llvm.vp.reduce.and.v2i64(i64, <2 x i64>, <2 x i1>, i32)

	define signext i64 @vpreduce_and_v2i64(i64 signext %s, <2 x i64> %v, <2 x i1> %m, i32 zeroext %evl) {			define signext i64 @vpreduce_and_v2i64(i64 signext %s, <2 x i64> %v, <2 x i1> %m, i32 zeroext %evl) {
	; RV32-LABEL: vpreduce_and_v2i64:			; RV32-LABEL: vpreduce_and_v2i64:
	; RV32: # %bb.0:			; RV32: # %bb.0:
	; RV32-NEXT: addi sp, sp, -16			; RV32-NEXT: addi sp, sp, -16
	; RV32-NEXT: .cfi_def_cfa_offset 16			; RV32-NEXT: .cfi_def_cfa_offset 16
	; RV32-NEXT: sw a1, 12(sp)			; RV32-NEXT: sw a1, 12(sp)
	; RV32-NEXT: sw a0, 8(sp)			; RV32-NEXT: sw a0, 8(sp)
	; RV32-NEXT: addi a0, sp, 8			; RV32-NEXT: addi a0, sp, 8
	; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV32-NEXT: vsetvli zero, a2, e64, m1, ta, ma
	; RV32-NEXT: vlse64.v v9, (a0), zero			; RV32-NEXT: vlse64.v v9, (a0), zero
	; RV32-NEXT: vsetvli zero, a2, e64, m1, tu, ma			; RV32-NEXT: vsetvli zero, zero, e64, m1, tu, ma
	; RV32-NEXT: vredand.vs v9, v8, v9, v0.t			; RV32-NEXT: vredand.vs v9, v8, v9, v0.t
	; RV32-NEXT: vmv.x.s a0, v9			; RV32-NEXT: vmv.x.s a0, v9
	; RV32-NEXT: li a1, 32			; RV32-NEXT: li a1, 32
	; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma
	; RV32-NEXT: vsrl.vx v8, v9, a1			; RV32-NEXT: vsrl.vx v8, v9, a1
	; RV32-NEXT: vmv.x.s a1, v8			; RV32-NEXT: vmv.x.s a1, v8
	; RV32-NEXT: addi sp, sp, 16			; RV32-NEXT: addi sp, sp, 16
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: vpreduce_and_v2i64:			; RV64-LABEL: vpreduce_and_v2i64:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV64-NEXT: vsetvli zero, a1, e64, m1, ta, ma
	; RV64-NEXT: vmv.s.x v9, a0			; RV64-NEXT: vmv.v.x v9, a0
	; RV64-NEXT: vsetvli zero, a1, e64, m1, tu, ma			; RV64-NEXT: vsetvli zero, zero, e64, m1, tu, ma
	; RV64-NEXT: vredand.vs v9, v8, v9, v0.t			; RV64-NEXT: vredand.vs v9, v8, v9, v0.t
	; RV64-NEXT: vmv.x.s a0, v9			; RV64-NEXT: vmv.x.s a0, v9
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%r = call i64 @llvm.vp.reduce.and.v2i64(i64 %s, <2 x i64> %v, <2 x i1> %m, i32 %evl)			%r = call i64 @llvm.vp.reduce.and.v2i64(i64 %s, <2 x i64> %v, <2 x i1> %m, i32 %evl)
	ret i64 %r			ret i64 %r
	}			}

	declare i64 @llvm.vp.reduce.or.v2i64(i64, <2 x i64>, <2 x i1>, i32)			declare i64 @llvm.vp.reduce.or.v2i64(i64, <2 x i64>, <2 x i1>, i32)

	define signext i64 @vpreduce_or_v2i64(i64 signext %s, <2 x i64> %v, <2 x i1> %m, i32 zeroext %evl) {			define signext i64 @vpreduce_or_v2i64(i64 signext %s, <2 x i64> %v, <2 x i1> %m, i32 zeroext %evl) {
	; RV32-LABEL: vpreduce_or_v2i64:			; RV32-LABEL: vpreduce_or_v2i64:
	; RV32: # %bb.0:			; RV32: # %bb.0:
	; RV32-NEXT: addi sp, sp, -16			; RV32-NEXT: addi sp, sp, -16
	; RV32-NEXT: .cfi_def_cfa_offset 16			; RV32-NEXT: .cfi_def_cfa_offset 16
	; RV32-NEXT: sw a1, 12(sp)			; RV32-NEXT: sw a1, 12(sp)
	; RV32-NEXT: sw a0, 8(sp)			; RV32-NEXT: sw a0, 8(sp)
	; RV32-NEXT: addi a0, sp, 8			; RV32-NEXT: addi a0, sp, 8
	; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV32-NEXT: vsetvli zero, a2, e64, m1, ta, ma
	; RV32-NEXT: vlse64.v v9, (a0), zero			; RV32-NEXT: vlse64.v v9, (a0), zero
	; RV32-NEXT: vsetvli zero, a2, e64, m1, tu, ma			; RV32-NEXT: vsetvli zero, zero, e64, m1, tu, ma
	; RV32-NEXT: vredor.vs v9, v8, v9, v0.t			; RV32-NEXT: vredor.vs v9, v8, v9, v0.t
	; RV32-NEXT: vmv.x.s a0, v9			; RV32-NEXT: vmv.x.s a0, v9
	; RV32-NEXT: li a1, 32			; RV32-NEXT: li a1, 32
	; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma
	; RV32-NEXT: vsrl.vx v8, v9, a1			; RV32-NEXT: vsrl.vx v8, v9, a1
	; RV32-NEXT: vmv.x.s a1, v8			; RV32-NEXT: vmv.x.s a1, v8
	; RV32-NEXT: addi sp, sp, 16			; RV32-NEXT: addi sp, sp, 16
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: vpreduce_or_v2i64:			; RV64-LABEL: vpreduce_or_v2i64:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV64-NEXT: vsetvli zero, a1, e64, m1, ta, ma
	; RV64-NEXT: vmv.s.x v9, a0			; RV64-NEXT: vmv.v.x v9, a0
	; RV64-NEXT: vsetvli zero, a1, e64, m1, tu, ma			; RV64-NEXT: vsetvli zero, zero, e64, m1, tu, ma
	; RV64-NEXT: vredor.vs v9, v8, v9, v0.t			; RV64-NEXT: vredor.vs v9, v8, v9, v0.t
	; RV64-NEXT: vmv.x.s a0, v9			; RV64-NEXT: vmv.x.s a0, v9
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%r = call i64 @llvm.vp.reduce.or.v2i64(i64 %s, <2 x i64> %v, <2 x i1> %m, i32 %evl)			%r = call i64 @llvm.vp.reduce.or.v2i64(i64 %s, <2 x i64> %v, <2 x i1> %m, i32 %evl)
	ret i64 %r			ret i64 %r
	}			}

	declare i64 @llvm.vp.reduce.xor.v2i64(i64, <2 x i64>, <2 x i1>, i32)			declare i64 @llvm.vp.reduce.xor.v2i64(i64, <2 x i64>, <2 x i1>, i32)

	define signext i64 @vpreduce_xor_v2i64(i64 signext %s, <2 x i64> %v, <2 x i1> %m, i32 zeroext %evl) {			define signext i64 @vpreduce_xor_v2i64(i64 signext %s, <2 x i64> %v, <2 x i1> %m, i32 zeroext %evl) {
	; RV32-LABEL: vpreduce_xor_v2i64:			; RV32-LABEL: vpreduce_xor_v2i64:
	; RV32: # %bb.0:			; RV32: # %bb.0:
	; RV32-NEXT: addi sp, sp, -16			; RV32-NEXT: addi sp, sp, -16
	; RV32-NEXT: .cfi_def_cfa_offset 16			; RV32-NEXT: .cfi_def_cfa_offset 16
	; RV32-NEXT: sw a1, 12(sp)			; RV32-NEXT: sw a1, 12(sp)
	; RV32-NEXT: sw a0, 8(sp)			; RV32-NEXT: sw a0, 8(sp)
	; RV32-NEXT: addi a0, sp, 8			; RV32-NEXT: addi a0, sp, 8
	; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV32-NEXT: vsetvli zero, a2, e64, m1, ta, ma
	; RV32-NEXT: vlse64.v v9, (a0), zero			; RV32-NEXT: vlse64.v v9, (a0), zero
	; RV32-NEXT: vsetvli zero, a2, e64, m1, tu, ma			; RV32-NEXT: vsetvli zero, zero, e64, m1, tu, ma
	; RV32-NEXT: vredxor.vs v9, v8, v9, v0.t			; RV32-NEXT: vredxor.vs v9, v8, v9, v0.t
	; RV32-NEXT: vmv.x.s a0, v9			; RV32-NEXT: vmv.x.s a0, v9
	; RV32-NEXT: li a1, 32			; RV32-NEXT: li a1, 32
	; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma
	; RV32-NEXT: vsrl.vx v8, v9, a1			; RV32-NEXT: vsrl.vx v8, v9, a1
	; RV32-NEXT: vmv.x.s a1, v8			; RV32-NEXT: vmv.x.s a1, v8
	; RV32-NEXT: addi sp, sp, 16			; RV32-NEXT: addi sp, sp, 16
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: vpreduce_xor_v2i64:			; RV64-LABEL: vpreduce_xor_v2i64:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV64-NEXT: vsetvli zero, a1, e64, m1, ta, ma
	; RV64-NEXT: vmv.s.x v9, a0			; RV64-NEXT: vmv.v.x v9, a0
	; RV64-NEXT: vsetvli zero, a1, e64, m1, tu, ma			; RV64-NEXT: vsetvli zero, zero, e64, m1, tu, ma
	; RV64-NEXT: vredxor.vs v9, v8, v9, v0.t			; RV64-NEXT: vredxor.vs v9, v8, v9, v0.t
	; RV64-NEXT: vmv.x.s a0, v9			; RV64-NEXT: vmv.x.s a0, v9
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%r = call i64 @llvm.vp.reduce.xor.v2i64(i64 %s, <2 x i64> %v, <2 x i1> %m, i32 %evl)			%r = call i64 @llvm.vp.reduce.xor.v2i64(i64 %s, <2 x i64> %v, <2 x i1> %m, i32 %evl)
	ret i64 %r			ret i64 %r
	}			}

	declare i64 @llvm.vp.reduce.add.v4i64(i64, <4 x i64>, <4 x i1>, i32)			declare i64 @llvm.vp.reduce.add.v4i64(i64, <4 x i64>, <4 x i1>, i32)
	▲ Show 20 Lines • Show All 270 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-reduction-int.ll

	Show All 17 Lines

	declare i8 @llvm.vector.reduce.add.v2i8(<2 x i8>)			declare i8 @llvm.vector.reduce.add.v2i8(<2 x i8>)

	define i8 @vreduce_add_v2i8(<2 x i8>* %x) {			define i8 @vreduce_add_v2i8(<2 x i8>* %x) {
	; CHECK-LABEL: vreduce_add_v2i8:			; CHECK-LABEL: vreduce_add_v2i8:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 2, e8, mf8, ta, ma			; CHECK-NEXT: vsetivli zero, 2, e8, mf8, ta, ma
	; CHECK-NEXT: vle8.v v8, (a0)			; CHECK-NEXT: vle8.v v8, (a0)
	; CHECK-NEXT: vmv.s.x v9, zero			; CHECK-NEXT: vmv.v.i v9, 0
	; CHECK-NEXT: vredsum.vs v8, v8, v9			; CHECK-NEXT: vredsum.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%v = load <2 x i8>, <2 x i8>* %x			%v = load <2 x i8>, <2 x i8>* %x
	%red = call i8 @llvm.vector.reduce.add.v2i8(<2 x i8> %v)			%red = call i8 @llvm.vector.reduce.add.v2i8(<2 x i8> %v)
	ret i8 %red			ret i8 %red
	}			}

	declare i8 @llvm.vector.reduce.add.v4i8(<4 x i8>)			declare i8 @llvm.vector.reduce.add.v4i8(<4 x i8>)

	define i8 @vreduce_add_v4i8(<4 x i8>* %x) {			define i8 @vreduce_add_v4i8(<4 x i8>* %x) {
	; CHECK-LABEL: vreduce_add_v4i8:			; CHECK-LABEL: vreduce_add_v4i8:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 4, e8, mf4, ta, ma			; CHECK-NEXT: vsetivli zero, 4, e8, mf4, ta, ma
	; CHECK-NEXT: vle8.v v8, (a0)			; CHECK-NEXT: vle8.v v8, (a0)
	; CHECK-NEXT: vmv.s.x v9, zero			; CHECK-NEXT: vmv.v.i v9, 0
	; CHECK-NEXT: vredsum.vs v8, v8, v9			; CHECK-NEXT: vredsum.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%v = load <4 x i8>, <4 x i8>* %x			%v = load <4 x i8>, <4 x i8>* %x
	%red = call i8 @llvm.vector.reduce.add.v4i8(<4 x i8> %v)			%red = call i8 @llvm.vector.reduce.add.v4i8(<4 x i8> %v)
	ret i8 %red			ret i8 %red
	}			}

	declare i8 @llvm.vector.reduce.add.v8i8(<8 x i8>)			declare i8 @llvm.vector.reduce.add.v8i8(<8 x i8>)

	define i8 @vreduce_add_v8i8(<8 x i8>* %x) {			define i8 @vreduce_add_v8i8(<8 x i8>* %x) {
	; CHECK-LABEL: vreduce_add_v8i8:			; CHECK-LABEL: vreduce_add_v8i8:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, ma			; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, ma
	; CHECK-NEXT: vle8.v v8, (a0)			; CHECK-NEXT: vle8.v v8, (a0)
	; CHECK-NEXT: vmv.s.x v9, zero			; CHECK-NEXT: vmv.v.i v9, 0
	; CHECK-NEXT: vredsum.vs v8, v8, v9			; CHECK-NEXT: vredsum.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%v = load <8 x i8>, <8 x i8>* %x			%v = load <8 x i8>, <8 x i8>* %x
	%red = call i8 @llvm.vector.reduce.add.v8i8(<8 x i8> %v)			%red = call i8 @llvm.vector.reduce.add.v8i8(<8 x i8> %v)
	ret i8 %red			ret i8 %red
	}			}

	declare i8 @llvm.vector.reduce.add.v16i8(<16 x i8>)			declare i8 @llvm.vector.reduce.add.v16i8(<16 x i8>)

	define i8 @vreduce_add_v16i8(<16 x i8>* %x) {			define i8 @vreduce_add_v16i8(<16 x i8>* %x) {
	; CHECK-LABEL: vreduce_add_v16i8:			; CHECK-LABEL: vreduce_add_v16i8:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 16, e8, m1, ta, ma			; CHECK-NEXT: vsetivli zero, 16, e8, m1, ta, ma
	; CHECK-NEXT: vle8.v v8, (a0)			; CHECK-NEXT: vle8.v v8, (a0)
	; CHECK-NEXT: vmv.s.x v9, zero			; CHECK-NEXT: vmv.v.i v9, 0
	; CHECK-NEXT: vredsum.vs v8, v8, v9			; CHECK-NEXT: vredsum.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%v = load <16 x i8>, <16 x i8>* %x			%v = load <16 x i8>, <16 x i8>* %x
	%red = call i8 @llvm.vector.reduce.add.v16i8(<16 x i8> %v)			%red = call i8 @llvm.vector.reduce.add.v16i8(<16 x i8> %v)
	ret i8 %red			ret i8 %red
	}			}

	▲ Show 20 Lines • Show All 120 Lines • ▼ Show 20 Lines

	declare i16 @llvm.vector.reduce.add.v2i16(<2 x i16>)			declare i16 @llvm.vector.reduce.add.v2i16(<2 x i16>)

	define i16 @vreduce_add_v2i16(<2 x i16>* %x) {			define i16 @vreduce_add_v2i16(<2 x i16>* %x) {
	; CHECK-LABEL: vreduce_add_v2i16:			; CHECK-LABEL: vreduce_add_v2i16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 2, e16, mf4, ta, ma			; CHECK-NEXT: vsetivli zero, 2, e16, mf4, ta, ma
	; CHECK-NEXT: vle16.v v8, (a0)			; CHECK-NEXT: vle16.v v8, (a0)
	; CHECK-NEXT: vmv.s.x v9, zero			; CHECK-NEXT: vmv.v.i v9, 0
	; CHECK-NEXT: vredsum.vs v8, v8, v9			; CHECK-NEXT: vredsum.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%v = load <2 x i16>, <2 x i16>* %x			%v = load <2 x i16>, <2 x i16>* %x
	%red = call i16 @llvm.vector.reduce.add.v2i16(<2 x i16> %v)			%red = call i16 @llvm.vector.reduce.add.v2i16(<2 x i16> %v)
	ret i16 %red			ret i16 %red
	}			}

	define i16 @vwreduce_add_v2i16(<2 x i8>* %x) {			define i16 @vwreduce_add_v2i16(<2 x i8>* %x) {
	; CHECK-LABEL: vwreduce_add_v2i16:			; CHECK-LABEL: vwreduce_add_v2i16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 2, e8, mf8, ta, ma			; CHECK-NEXT: vsetivli zero, 2, e16, mf4, ta, ma
	; CHECK-NEXT: vle8.v v8, (a0)			; CHECK-NEXT: vle8.v v8, (a0)
	; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma			; CHECK-NEXT: vmv.v.i v9, 0
	; CHECK-NEXT: vmv.s.x v9, zero			; CHECK-NEXT: vsetvli zero, zero, e8, mf8, ta, ma
	; CHECK-NEXT: vsetivli zero, 2, e8, mf8, ta, ma
	; CHECK-NEXT: vwredsum.vs v8, v8, v9			; CHECK-NEXT: vwredsum.vs v8, v8, v9
	; CHECK-NEXT: vsetivli zero, 0, e16, m1, ta, ma			; CHECK-NEXT: vsetivli zero, 0, e16, m1, ta, ma
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%v = load <2 x i8>, <2 x i8>* %x			%v = load <2 x i8>, <2 x i8>* %x
	%e = sext <2 x i8> %v to <2 x i16>			%e = sext <2 x i8> %v to <2 x i16>
	%red = call i16 @llvm.vector.reduce.add.v2i16(<2 x i16> %e)			%red = call i16 @llvm.vector.reduce.add.v2i16(<2 x i16> %e)
	ret i16 %red			ret i16 %red
	}			}

	define i16 @vwreduce_uadd_v2i16(<2 x i8>* %x) {			define i16 @vwreduce_uadd_v2i16(<2 x i8>* %x) {
	; CHECK-LABEL: vwreduce_uadd_v2i16:			; CHECK-LABEL: vwreduce_uadd_v2i16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 2, e8, mf8, ta, ma			; CHECK-NEXT: vsetivli zero, 2, e16, mf4, ta, ma
	; CHECK-NEXT: vle8.v v8, (a0)			; CHECK-NEXT: vle8.v v8, (a0)
	; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma			; CHECK-NEXT: vmv.v.i v9, 0
	; CHECK-NEXT: vmv.s.x v9, zero			; CHECK-NEXT: vsetvli zero, zero, e8, mf8, ta, ma
	; CHECK-NEXT: vsetivli zero, 2, e8, mf8, ta, ma
	; CHECK-NEXT: vwredsumu.vs v8, v8, v9			; CHECK-NEXT: vwredsumu.vs v8, v8, v9
	; CHECK-NEXT: vsetivli zero, 0, e16, m1, ta, ma			; CHECK-NEXT: vsetivli zero, 0, e16, m1, ta, ma
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%v = load <2 x i8>, <2 x i8>* %x			%v = load <2 x i8>, <2 x i8>* %x
	%e = zext <2 x i8> %v to <2 x i16>			%e = zext <2 x i8> %v to <2 x i16>
	%red = call i16 @llvm.vector.reduce.add.v2i16(<2 x i16> %e)			%red = call i16 @llvm.vector.reduce.add.v2i16(<2 x i16> %e)
	ret i16 %red			ret i16 %red
	}			}

	declare i16 @llvm.vector.reduce.add.v4i16(<4 x i16>)			declare i16 @llvm.vector.reduce.add.v4i16(<4 x i16>)

	define i16 @vreduce_add_v4i16(<4 x i16>* %x) {			define i16 @vreduce_add_v4i16(<4 x i16>* %x) {
	; CHECK-LABEL: vreduce_add_v4i16:			; CHECK-LABEL: vreduce_add_v4i16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, ma			; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
	; CHECK-NEXT: vle16.v v8, (a0)			; CHECK-NEXT: vle16.v v8, (a0)
	; CHECK-NEXT: vmv.s.x v9, zero			; CHECK-NEXT: vmv.v.i v9, 0
	; CHECK-NEXT: vredsum.vs v8, v8, v9			; CHECK-NEXT: vredsum.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%v = load <4 x i16>, <4 x i16>* %x			%v = load <4 x i16>, <4 x i16>* %x
	%red = call i16 @llvm.vector.reduce.add.v4i16(<4 x i16> %v)			%red = call i16 @llvm.vector.reduce.add.v4i16(<4 x i16> %v)
	ret i16 %red			ret i16 %red
	}			}

	define i16 @vwreduce_add_v4i16(<4 x i8>* %x) {			define i16 @vwreduce_add_v4i16(<4 x i8>* %x) {
	; CHECK-LABEL: vwreduce_add_v4i16:			; CHECK-LABEL: vwreduce_add_v4i16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 4, e8, mf4, ta, ma			; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
	; CHECK-NEXT: vle8.v v8, (a0)			; CHECK-NEXT: vle8.v v8, (a0)
	; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma			; CHECK-NEXT: vmv.v.i v9, 0
	; CHECK-NEXT: vmv.s.x v9, zero			; CHECK-NEXT: vsetvli zero, zero, e8, mf4, ta, ma
	; CHECK-NEXT: vsetivli zero, 4, e8, mf4, ta, ma
	; CHECK-NEXT: vwredsum.vs v8, v8, v9			; CHECK-NEXT: vwredsum.vs v8, v8, v9
	; CHECK-NEXT: vsetivli zero, 0, e16, m1, ta, ma			; CHECK-NEXT: vsetivli zero, 0, e16, m1, ta, ma
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%v = load <4 x i8>, <4 x i8>* %x			%v = load <4 x i8>, <4 x i8>* %x
	%e = sext <4 x i8> %v to <4 x i16>			%e = sext <4 x i8> %v to <4 x i16>
	%red = call i16 @llvm.vector.reduce.add.v4i16(<4 x i16> %e)			%red = call i16 @llvm.vector.reduce.add.v4i16(<4 x i16> %e)
	ret i16 %red			ret i16 %red
	}			}

	define i16 @vwreduce_uadd_v4i16(<4 x i8>* %x) {			define i16 @vwreduce_uadd_v4i16(<4 x i8>* %x) {
	; CHECK-LABEL: vwreduce_uadd_v4i16:			; CHECK-LABEL: vwreduce_uadd_v4i16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 4, e8, mf4, ta, ma			; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
	; CHECK-NEXT: vle8.v v8, (a0)			; CHECK-NEXT: vle8.v v8, (a0)
	; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma			; CHECK-NEXT: vmv.v.i v9, 0
	; CHECK-NEXT: vmv.s.x v9, zero			; CHECK-NEXT: vsetvli zero, zero, e8, mf4, ta, ma
	; CHECK-NEXT: vsetivli zero, 4, e8, mf4, ta, ma
	; CHECK-NEXT: vwredsumu.vs v8, v8, v9			; CHECK-NEXT: vwredsumu.vs v8, v8, v9
	; CHECK-NEXT: vsetivli zero, 0, e16, m1, ta, ma			; CHECK-NEXT: vsetivli zero, 0, e16, m1, ta, ma
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%v = load <4 x i8>, <4 x i8>* %x			%v = load <4 x i8>, <4 x i8>* %x
	%e = zext <4 x i8> %v to <4 x i16>			%e = zext <4 x i8> %v to <4 x i16>
	%red = call i16 @llvm.vector.reduce.add.v4i16(<4 x i16> %e)			%red = call i16 @llvm.vector.reduce.add.v4i16(<4 x i16> %e)
	ret i16 %red			ret i16 %red
	}			}

	declare i16 @llvm.vector.reduce.add.v8i16(<8 x i16>)			declare i16 @llvm.vector.reduce.add.v8i16(<8 x i16>)

	define i16 @vreduce_add_v8i16(<8 x i16>* %x) {			define i16 @vreduce_add_v8i16(<8 x i16>* %x) {
	; CHECK-LABEL: vreduce_add_v8i16:			; CHECK-LABEL: vreduce_add_v8i16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 8, e16, m1, ta, ma			; CHECK-NEXT: vsetivli zero, 8, e16, m1, ta, ma
	; CHECK-NEXT: vle16.v v8, (a0)			; CHECK-NEXT: vle16.v v8, (a0)
	; CHECK-NEXT: vmv.s.x v9, zero			; CHECK-NEXT: vmv.v.i v9, 0
	; CHECK-NEXT: vredsum.vs v8, v8, v9			; CHECK-NEXT: vredsum.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%v = load <8 x i16>, <8 x i16>* %x			%v = load <8 x i16>, <8 x i16>* %x
	%red = call i16 @llvm.vector.reduce.add.v8i16(<8 x i16> %v)			%red = call i16 @llvm.vector.reduce.add.v8i16(<8 x i16> %v)
	ret i16 %red			ret i16 %red
	}			}

	define i16 @vwreduce_add_v8i16(<8 x i8>* %x) {			define i16 @vwreduce_add_v8i16(<8 x i8>* %x) {
	; CHECK-LABEL: vwreduce_add_v8i16:			; CHECK-LABEL: vwreduce_add_v8i16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 8, e16, m1, ta, ma			; CHECK-NEXT: vsetivli zero, 8, e16, m1, ta, ma
	; CHECK-NEXT: vle8.v v8, (a0)			; CHECK-NEXT: vle8.v v8, (a0)
	; CHECK-NEXT: vmv.s.x v9, zero			; CHECK-NEXT: vmv.v.i v9, 0
	; CHECK-NEXT: vsetvli zero, zero, e8, mf2, ta, ma			; CHECK-NEXT: vsetvli zero, zero, e8, mf2, ta, ma
	; CHECK-NEXT: vwredsum.vs v8, v8, v9			; CHECK-NEXT: vwredsum.vs v8, v8, v9
	; CHECK-NEXT: vsetvli zero, zero, e16, m1, ta, ma			; CHECK-NEXT: vsetvli zero, zero, e16, m1, ta, ma
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%v = load <8 x i8>, <8 x i8>* %x			%v = load <8 x i8>, <8 x i8>* %x
	%e = sext <8 x i8> %v to <8 x i16>			%e = sext <8 x i8> %v to <8 x i16>
	%red = call i16 @llvm.vector.reduce.add.v8i16(<8 x i16> %e)			%red = call i16 @llvm.vector.reduce.add.v8i16(<8 x i16> %e)
	ret i16 %red			ret i16 %red
	}			}

	define i16 @vwreduce_uadd_v8i16(<8 x i8>* %x) {			define i16 @vwreduce_uadd_v8i16(<8 x i8>* %x) {
	; CHECK-LABEL: vwreduce_uadd_v8i16:			; CHECK-LABEL: vwreduce_uadd_v8i16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 8, e16, m1, ta, ma			; CHECK-NEXT: vsetivli zero, 8, e16, m1, ta, ma
	; CHECK-NEXT: vle8.v v8, (a0)			; CHECK-NEXT: vle8.v v8, (a0)
	; CHECK-NEXT: vmv.s.x v9, zero			; CHECK-NEXT: vmv.v.i v9, 0
	; CHECK-NEXT: vsetvli zero, zero, e8, mf2, ta, ma			; CHECK-NEXT: vsetvli zero, zero, e8, mf2, ta, ma
	; CHECK-NEXT: vwredsumu.vs v8, v8, v9			; CHECK-NEXT: vwredsumu.vs v8, v8, v9
	; CHECK-NEXT: vsetvli zero, zero, e16, m1, ta, ma			; CHECK-NEXT: vsetvli zero, zero, e16, m1, ta, ma
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%v = load <8 x i8>, <8 x i8>* %x			%v = load <8 x i8>, <8 x i8>* %x
	%e = zext <8 x i8> %v to <8 x i16>			%e = zext <8 x i8> %v to <8 x i16>
	%red = call i16 @llvm.vector.reduce.add.v8i16(<8 x i16> %e)			%red = call i16 @llvm.vector.reduce.add.v8i16(<8 x i16> %e)
	▲ Show 20 Lines • Show All 278 Lines • ▼ Show 20 Lines

	declare i32 @llvm.vector.reduce.add.v2i32(<2 x i32>)			declare i32 @llvm.vector.reduce.add.v2i32(<2 x i32>)

	define i32 @vreduce_add_v2i32(<2 x i32>* %x) {			define i32 @vreduce_add_v2i32(<2 x i32>* %x) {
	; CHECK-LABEL: vreduce_add_v2i32:			; CHECK-LABEL: vreduce_add_v2i32:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 2, e32, mf2, ta, ma			; CHECK-NEXT: vsetivli zero, 2, e32, mf2, ta, ma
	; CHECK-NEXT: vle32.v v8, (a0)			; CHECK-NEXT: vle32.v v8, (a0)
	; CHECK-NEXT: vmv.s.x v9, zero			; CHECK-NEXT: vmv.v.i v9, 0
	; CHECK-NEXT: vredsum.vs v8, v8, v9			; CHECK-NEXT: vredsum.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%v = load <2 x i32>, <2 x i32>* %x			%v = load <2 x i32>, <2 x i32>* %x
	%red = call i32 @llvm.vector.reduce.add.v2i32(<2 x i32> %v)			%red = call i32 @llvm.vector.reduce.add.v2i32(<2 x i32> %v)
	ret i32 %red			ret i32 %red
	}			}

	define i32 @vwreduce_add_v2i32(<2 x i16>* %x) {			define i32 @vwreduce_add_v2i32(<2 x i16>* %x) {
	; CHECK-LABEL: vwreduce_add_v2i32:			; CHECK-LABEL: vwreduce_add_v2i32:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 2, e16, mf4, ta, ma			; CHECK-NEXT: vsetivli zero, 2, e32, mf2, ta, ma
	; CHECK-NEXT: vle16.v v8, (a0)			; CHECK-NEXT: vle16.v v8, (a0)
	; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma			; CHECK-NEXT: vmv.v.i v9, 0
	; CHECK-NEXT: vmv.s.x v9, zero			; CHECK-NEXT: vsetvli zero, zero, e16, mf4, ta, ma
	; CHECK-NEXT: vsetivli zero, 2, e16, mf4, ta, ma
	; CHECK-NEXT: vwredsum.vs v8, v8, v9			; CHECK-NEXT: vwredsum.vs v8, v8, v9
	; CHECK-NEXT: vsetivli zero, 0, e32, m1, ta, ma			; CHECK-NEXT: vsetivli zero, 0, e32, m1, ta, ma
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%v = load <2 x i16>, <2 x i16>* %x			%v = load <2 x i16>, <2 x i16>* %x
	%e = sext <2 x i16> %v to <2 x i32>			%e = sext <2 x i16> %v to <2 x i32>
	%red = call i32 @llvm.vector.reduce.add.v2i32(<2 x i32> %e)			%red = call i32 @llvm.vector.reduce.add.v2i32(<2 x i32> %e)
	ret i32 %red			ret i32 %red
	}			}

	define i32 @vwreduce_uadd_v2i32(<2 x i16>* %x) {			define i32 @vwreduce_uadd_v2i32(<2 x i16>* %x) {
	; CHECK-LABEL: vwreduce_uadd_v2i32:			; CHECK-LABEL: vwreduce_uadd_v2i32:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 2, e16, mf4, ta, ma			; CHECK-NEXT: vsetivli zero, 2, e32, mf2, ta, ma
	; CHECK-NEXT: vle16.v v8, (a0)			; CHECK-NEXT: vle16.v v8, (a0)
	; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma			; CHECK-NEXT: vmv.v.i v9, 0
	; CHECK-NEXT: vmv.s.x v9, zero			; CHECK-NEXT: vsetvli zero, zero, e16, mf4, ta, ma
	; CHECK-NEXT: vsetivli zero, 2, e16, mf4, ta, ma
	; CHECK-NEXT: vwredsumu.vs v8, v8, v9			; CHECK-NEXT: vwredsumu.vs v8, v8, v9
	; CHECK-NEXT: vsetivli zero, 0, e32, m1, ta, ma			; CHECK-NEXT: vsetivli zero, 0, e32, m1, ta, ma
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%v = load <2 x i16>, <2 x i16>* %x			%v = load <2 x i16>, <2 x i16>* %x
	%e = zext <2 x i16> %v to <2 x i32>			%e = zext <2 x i16> %v to <2 x i32>
	%red = call i32 @llvm.vector.reduce.add.v2i32(<2 x i32> %e)			%red = call i32 @llvm.vector.reduce.add.v2i32(<2 x i32> %e)
	ret i32 %red			ret i32 %red
	}			}

	declare i32 @llvm.vector.reduce.add.v4i32(<4 x i32>)			declare i32 @llvm.vector.reduce.add.v4i32(<4 x i32>)

	define i32 @vreduce_add_v4i32(<4 x i32>* %x) {			define i32 @vreduce_add_v4i32(<4 x i32>* %x) {
	; CHECK-LABEL: vreduce_add_v4i32:			; CHECK-LABEL: vreduce_add_v4i32:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma			; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
	; CHECK-NEXT: vle32.v v8, (a0)			; CHECK-NEXT: vle32.v v8, (a0)
	; CHECK-NEXT: vmv.s.x v9, zero			; CHECK-NEXT: vmv.v.i v9, 0
	; CHECK-NEXT: vredsum.vs v8, v8, v9			; CHECK-NEXT: vredsum.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%v = load <4 x i32>, <4 x i32>* %x			%v = load <4 x i32>, <4 x i32>* %x
	%red = call i32 @llvm.vector.reduce.add.v4i32(<4 x i32> %v)			%red = call i32 @llvm.vector.reduce.add.v4i32(<4 x i32> %v)
	ret i32 %red			ret i32 %red
	}			}

	define i32 @vwreduce_add_v4i32(<4 x i16>* %x) {			define i32 @vwreduce_add_v4i32(<4 x i16>* %x) {
	; CHECK-LABEL: vwreduce_add_v4i32:			; CHECK-LABEL: vwreduce_add_v4i32:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma			; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
	; CHECK-NEXT: vle16.v v8, (a0)			; CHECK-NEXT: vle16.v v8, (a0)
	; CHECK-NEXT: vmv.s.x v9, zero			; CHECK-NEXT: vmv.v.i v9, 0
	; CHECK-NEXT: vsetvli zero, zero, e16, mf2, ta, ma			; CHECK-NEXT: vsetvli zero, zero, e16, mf2, ta, ma
	; CHECK-NEXT: vwredsum.vs v8, v8, v9			; CHECK-NEXT: vwredsum.vs v8, v8, v9
	; CHECK-NEXT: vsetvli zero, zero, e32, m1, ta, ma			; CHECK-NEXT: vsetvli zero, zero, e32, m1, ta, ma
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%v = load <4 x i16>, <4 x i16>* %x			%v = load <4 x i16>, <4 x i16>* %x
	%e = sext <4 x i16> %v to <4 x i32>			%e = sext <4 x i16> %v to <4 x i32>
	%red = call i32 @llvm.vector.reduce.add.v4i32(<4 x i32> %e)			%red = call i32 @llvm.vector.reduce.add.v4i32(<4 x i32> %e)
	ret i32 %red			ret i32 %red
	}			}

	define i32 @vwreduce_uadd_v4i32(<4 x i16>* %x) {			define i32 @vwreduce_uadd_v4i32(<4 x i16>* %x) {
	; CHECK-LABEL: vwreduce_uadd_v4i32:			; CHECK-LABEL: vwreduce_uadd_v4i32:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma			; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
	; CHECK-NEXT: vle16.v v8, (a0)			; CHECK-NEXT: vle16.v v8, (a0)
	; CHECK-NEXT: vmv.s.x v9, zero			; CHECK-NEXT: vmv.v.i v9, 0
	; CHECK-NEXT: vsetvli zero, zero, e16, mf2, ta, ma			; CHECK-NEXT: vsetvli zero, zero, e16, mf2, ta, ma
	; CHECK-NEXT: vwredsumu.vs v8, v8, v9			; CHECK-NEXT: vwredsumu.vs v8, v8, v9
	; CHECK-NEXT: vsetvli zero, zero, e32, m1, ta, ma			; CHECK-NEXT: vsetvli zero, zero, e32, m1, ta, ma
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%v = load <4 x i16>, <4 x i16>* %x			%v = load <4 x i16>, <4 x i16>* %x
	%e = zext <4 x i16> %v to <4 x i32>			%e = zext <4 x i16> %v to <4 x i32>
	%red = call i32 @llvm.vector.reduce.add.v4i32(<4 x i32> %e)			%red = call i32 @llvm.vector.reduce.add.v4i32(<4 x i32> %e)
	▲ Show 20 Lines • Show All 305 Lines • ▼ Show 20 Lines

	declare i64 @llvm.vector.reduce.add.v2i64(<2 x i64>)			declare i64 @llvm.vector.reduce.add.v2i64(<2 x i64>)

	define i64 @vreduce_add_v2i64(<2 x i64>* %x) {			define i64 @vreduce_add_v2i64(<2 x i64>* %x) {
	; RV32-LABEL: vreduce_add_v2i64:			; RV32-LABEL: vreduce_add_v2i64:
	; RV32: # %bb.0:			; RV32: # %bb.0:
	; RV32-NEXT: vsetivli zero, 2, e64, m1, ta, ma			; RV32-NEXT: vsetivli zero, 2, e64, m1, ta, ma
	; RV32-NEXT: vle64.v v8, (a0)			; RV32-NEXT: vle64.v v8, (a0)
	; RV32-NEXT: vmv.s.x v9, zero			; RV32-NEXT: vmv.v.i v9, 0
	; RV32-NEXT: vredsum.vs v8, v8, v9			; RV32-NEXT: vredsum.vs v8, v8, v9
	; RV32-NEXT: vmv.x.s a0, v8			; RV32-NEXT: vmv.x.s a0, v8
	; RV32-NEXT: li a1, 32			; RV32-NEXT: li a1, 32
	; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma
	; RV32-NEXT: vsrl.vx v8, v8, a1			; RV32-NEXT: vsrl.vx v8, v8, a1
	; RV32-NEXT: vmv.x.s a1, v8			; RV32-NEXT: vmv.x.s a1, v8
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: vreduce_add_v2i64:			; RV64-LABEL: vreduce_add_v2i64:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: vsetivli zero, 2, e64, m1, ta, ma			; RV64-NEXT: vsetivli zero, 2, e64, m1, ta, ma
	; RV64-NEXT: vle64.v v8, (a0)			; RV64-NEXT: vle64.v v8, (a0)
	; RV64-NEXT: vmv.s.x v9, zero			; RV64-NEXT: vmv.v.i v9, 0
	; RV64-NEXT: vredsum.vs v8, v8, v9			; RV64-NEXT: vredsum.vs v8, v8, v9
	; RV64-NEXT: vmv.x.s a0, v8			; RV64-NEXT: vmv.x.s a0, v8
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%v = load <2 x i64>, <2 x i64>* %x			%v = load <2 x i64>, <2 x i64>* %x
	%red = call i64 @llvm.vector.reduce.add.v2i64(<2 x i64> %v)			%red = call i64 @llvm.vector.reduce.add.v2i64(<2 x i64> %v)
	ret i64 %red			ret i64 %red
	}			}

	define i64 @vwreduce_add_v2i64(<2 x i32>* %x) {			define i64 @vwreduce_add_v2i64(<2 x i32>* %x) {
	; RV32-LABEL: vwreduce_add_v2i64:			; RV32-LABEL: vwreduce_add_v2i64:
	; RV32: # %bb.0:			; RV32: # %bb.0:
	; RV32-NEXT: vsetivli zero, 2, e64, m1, ta, ma			; RV32-NEXT: vsetivli zero, 2, e64, m1, ta, ma
	; RV32-NEXT: vle32.v v8, (a0)			; RV32-NEXT: vle32.v v8, (a0)
	; RV32-NEXT: vmv.s.x v9, zero			; RV32-NEXT: vmv.v.i v9, 0
	; RV32-NEXT: vsetvli zero, zero, e32, mf2, ta, ma			; RV32-NEXT: vsetvli zero, zero, e32, mf2, ta, ma
	; RV32-NEXT: vwredsum.vs v8, v8, v9			; RV32-NEXT: vwredsum.vs v8, v8, v9
	; RV32-NEXT: vsetvli zero, zero, e64, m1, ta, ma			; RV32-NEXT: vsetvli zero, zero, e64, m1, ta, ma
	; RV32-NEXT: vmv.x.s a0, v8			; RV32-NEXT: vmv.x.s a0, v8
	; RV32-NEXT: li a1, 32			; RV32-NEXT: li a1, 32
	; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma
	; RV32-NEXT: vsrl.vx v8, v8, a1			; RV32-NEXT: vsrl.vx v8, v8, a1
	; RV32-NEXT: vmv.x.s a1, v8			; RV32-NEXT: vmv.x.s a1, v8
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: vwreduce_add_v2i64:			; RV64-LABEL: vwreduce_add_v2i64:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: vsetivli zero, 2, e64, m1, ta, ma			; RV64-NEXT: vsetivli zero, 2, e64, m1, ta, ma
	; RV64-NEXT: vle32.v v8, (a0)			; RV64-NEXT: vle32.v v8, (a0)
	; RV64-NEXT: vmv.s.x v9, zero			; RV64-NEXT: vmv.v.i v9, 0
	; RV64-NEXT: vsetvli zero, zero, e32, mf2, ta, ma			; RV64-NEXT: vsetvli zero, zero, e32, mf2, ta, ma
	; RV64-NEXT: vwredsum.vs v8, v8, v9			; RV64-NEXT: vwredsum.vs v8, v8, v9
	; RV64-NEXT: vsetvli zero, zero, e64, m1, ta, ma			; RV64-NEXT: vsetvli zero, zero, e64, m1, ta, ma
	; RV64-NEXT: vmv.x.s a0, v8			; RV64-NEXT: vmv.x.s a0, v8
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%v = load <2 x i32>, <2 x i32>* %x			%v = load <2 x i32>, <2 x i32>* %x
	%e = sext <2 x i32> %v to <2 x i64>			%e = sext <2 x i32> %v to <2 x i64>
	%red = call i64 @llvm.vector.reduce.add.v2i64(<2 x i64> %e)			%red = call i64 @llvm.vector.reduce.add.v2i64(<2 x i64> %e)
	ret i64 %red			ret i64 %red
	}			}

	define i64 @vwreduce_uadd_v2i64(<2 x i32>* %x) {			define i64 @vwreduce_uadd_v2i64(<2 x i32>* %x) {
	; RV32-LABEL: vwreduce_uadd_v2i64:			; RV32-LABEL: vwreduce_uadd_v2i64:
	; RV32: # %bb.0:			; RV32: # %bb.0:
	; RV32-NEXT: vsetivli zero, 2, e64, m1, ta, ma			; RV32-NEXT: vsetivli zero, 2, e64, m1, ta, ma
	; RV32-NEXT: vle32.v v8, (a0)			; RV32-NEXT: vle32.v v8, (a0)
	; RV32-NEXT: vmv.s.x v9, zero			; RV32-NEXT: vmv.v.i v9, 0
	; RV32-NEXT: vsetvli zero, zero, e32, mf2, ta, ma			; RV32-NEXT: vsetvli zero, zero, e32, mf2, ta, ma
	; RV32-NEXT: vwredsumu.vs v8, v8, v9			; RV32-NEXT: vwredsumu.vs v8, v8, v9
	; RV32-NEXT: vsetvli zero, zero, e64, m1, ta, ma			; RV32-NEXT: vsetvli zero, zero, e64, m1, ta, ma
	; RV32-NEXT: vmv.x.s a0, v8			; RV32-NEXT: vmv.x.s a0, v8
	; RV32-NEXT: li a1, 32			; RV32-NEXT: li a1, 32
	; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma
	; RV32-NEXT: vsrl.vx v8, v8, a1			; RV32-NEXT: vsrl.vx v8, v8, a1
	; RV32-NEXT: vmv.x.s a1, v8			; RV32-NEXT: vmv.x.s a1, v8
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: vwreduce_uadd_v2i64:			; RV64-LABEL: vwreduce_uadd_v2i64:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: vsetivli zero, 2, e64, m1, ta, ma			; RV64-NEXT: vsetivli zero, 2, e64, m1, ta, ma
	; RV64-NEXT: vle32.v v8, (a0)			; RV64-NEXT: vle32.v v8, (a0)
	; RV64-NEXT: vmv.s.x v9, zero			; RV64-NEXT: vmv.v.i v9, 0
	; RV64-NEXT: vsetvli zero, zero, e32, mf2, ta, ma			; RV64-NEXT: vsetvli zero, zero, e32, mf2, ta, ma
	; RV64-NEXT: vwredsumu.vs v8, v8, v9			; RV64-NEXT: vwredsumu.vs v8, v8, v9
	; RV64-NEXT: vsetvli zero, zero, e64, m1, ta, ma			; RV64-NEXT: vsetvli zero, zero, e64, m1, ta, ma
	; RV64-NEXT: vmv.x.s a0, v8			; RV64-NEXT: vmv.x.s a0, v8
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%v = load <2 x i32>, <2 x i32>* %x			%v = load <2 x i32>, <2 x i32>* %x
	%e = zext <2 x i32> %v to <2 x i64>			%e = zext <2 x i32> %v to <2 x i64>
	%red = call i64 @llvm.vector.reduce.add.v2i64(<2 x i64> %e)			%red = call i64 @llvm.vector.reduce.add.v2i64(<2 x i64> %e)
	▲ Show 20 Lines • Show All 749 Lines • ▼ Show 20 Lines

	declare i8 @llvm.vector.reduce.and.v2i8(<2 x i8>)			declare i8 @llvm.vector.reduce.and.v2i8(<2 x i8>)

	define i8 @vreduce_and_v2i8(<2 x i8>* %x) {			define i8 @vreduce_and_v2i8(<2 x i8>* %x) {
	; CHECK-LABEL: vreduce_and_v2i8:			; CHECK-LABEL: vreduce_and_v2i8:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 2, e8, mf8, ta, ma			; CHECK-NEXT: vsetivli zero, 2, e8, mf8, ta, ma
	; CHECK-NEXT: vle8.v v8, (a0)			; CHECK-NEXT: vle8.v v8, (a0)
	; CHECK-NEXT: vsetivli zero, 1, e8, m1, ta, ma
	; CHECK-NEXT: vmv.v.i v9, -1			; CHECK-NEXT: vmv.v.i v9, -1
	; CHECK-NEXT: vsetivli zero, 2, e8, mf8, ta, ma
	; CHECK-NEXT: vredand.vs v8, v8, v9			; CHECK-NEXT: vredand.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%v = load <2 x i8>, <2 x i8>* %x			%v = load <2 x i8>, <2 x i8>* %x
	%red = call i8 @llvm.vector.reduce.and.v2i8(<2 x i8> %v)			%red = call i8 @llvm.vector.reduce.and.v2i8(<2 x i8> %v)
	ret i8 %red			ret i8 %red
	}			}

	declare i8 @llvm.vector.reduce.and.v4i8(<4 x i8>)			declare i8 @llvm.vector.reduce.and.v4i8(<4 x i8>)

	define i8 @vreduce_and_v4i8(<4 x i8>* %x) {			define i8 @vreduce_and_v4i8(<4 x i8>* %x) {
	; CHECK-LABEL: vreduce_and_v4i8:			; CHECK-LABEL: vreduce_and_v4i8:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 4, e8, mf4, ta, ma			; CHECK-NEXT: vsetivli zero, 4, e8, mf4, ta, ma
	; CHECK-NEXT: vle8.v v8, (a0)			; CHECK-NEXT: vle8.v v8, (a0)
	; CHECK-NEXT: vsetivli zero, 1, e8, m1, ta, ma
	; CHECK-NEXT: vmv.v.i v9, -1			; CHECK-NEXT: vmv.v.i v9, -1
	; CHECK-NEXT: vsetivli zero, 4, e8, mf4, ta, ma
	; CHECK-NEXT: vredand.vs v8, v8, v9			; CHECK-NEXT: vredand.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%v = load <4 x i8>, <4 x i8>* %x			%v = load <4 x i8>, <4 x i8>* %x
	%red = call i8 @llvm.vector.reduce.and.v4i8(<4 x i8> %v)			%red = call i8 @llvm.vector.reduce.and.v4i8(<4 x i8> %v)
	ret i8 %red			ret i8 %red
	}			}

	declare i8 @llvm.vector.reduce.and.v8i8(<8 x i8>)			declare i8 @llvm.vector.reduce.and.v8i8(<8 x i8>)

	define i8 @vreduce_and_v8i8(<8 x i8>* %x) {			define i8 @vreduce_and_v8i8(<8 x i8>* %x) {
	; CHECK-LABEL: vreduce_and_v8i8:			; CHECK-LABEL: vreduce_and_v8i8:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, ma			; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, ma
	; CHECK-NEXT: vle8.v v8, (a0)			; CHECK-NEXT: vle8.v v8, (a0)
	; CHECK-NEXT: vsetivli zero, 1, e8, m1, ta, ma
	; CHECK-NEXT: vmv.v.i v9, -1			; CHECK-NEXT: vmv.v.i v9, -1
	; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, ma
	; CHECK-NEXT: vredand.vs v8, v8, v9			; CHECK-NEXT: vredand.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%v = load <8 x i8>, <8 x i8>* %x			%v = load <8 x i8>, <8 x i8>* %x
	%red = call i8 @llvm.vector.reduce.and.v8i8(<8 x i8> %v)			%red = call i8 @llvm.vector.reduce.and.v8i8(<8 x i8> %v)
	ret i8 %red			ret i8 %red
	}			}

	declare i8 @llvm.vector.reduce.and.v16i8(<16 x i8>)			declare i8 @llvm.vector.reduce.and.v16i8(<16 x i8>)

	define i8 @vreduce_and_v16i8(<16 x i8>* %x) {			define i8 @vreduce_and_v16i8(<16 x i8>* %x) {
	; CHECK-LABEL: vreduce_and_v16i8:			; CHECK-LABEL: vreduce_and_v16i8:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 16, e8, m1, ta, ma			; CHECK-NEXT: vsetivli zero, 16, e8, m1, ta, ma
	; CHECK-NEXT: vle8.v v8, (a0)			; CHECK-NEXT: vle8.v v8, (a0)
	; CHECK-NEXT: vsetivli zero, 1, e8, m1, ta, ma
	; CHECK-NEXT: vmv.v.i v9, -1			; CHECK-NEXT: vmv.v.i v9, -1
	; CHECK-NEXT: vsetivli zero, 16, e8, m1, ta, ma
	; CHECK-NEXT: vredand.vs v8, v8, v9			; CHECK-NEXT: vredand.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%v = load <16 x i8>, <16 x i8>* %x			%v = load <16 x i8>, <16 x i8>* %x
	%red = call i8 @llvm.vector.reduce.and.v16i8(<16 x i8> %v)			%red = call i8 @llvm.vector.reduce.and.v16i8(<16 x i8> %v)
	ret i8 %red			ret i8 %red
	}			}

	▲ Show 20 Lines • Show All 92 Lines • ▼ Show 20 Lines

	declare i16 @llvm.vector.reduce.and.v2i16(<2 x i16>)			declare i16 @llvm.vector.reduce.and.v2i16(<2 x i16>)

	define i16 @vreduce_and_v2i16(<2 x i16>* %x) {			define i16 @vreduce_and_v2i16(<2 x i16>* %x) {
	; CHECK-LABEL: vreduce_and_v2i16:			; CHECK-LABEL: vreduce_and_v2i16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 2, e16, mf4, ta, ma			; CHECK-NEXT: vsetivli zero, 2, e16, mf4, ta, ma
	; CHECK-NEXT: vle16.v v8, (a0)			; CHECK-NEXT: vle16.v v8, (a0)
	; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma
	; CHECK-NEXT: vmv.v.i v9, -1			; CHECK-NEXT: vmv.v.i v9, -1
	; CHECK-NEXT: vsetivli zero, 2, e16, mf4, ta, ma
	; CHECK-NEXT: vredand.vs v8, v8, v9			; CHECK-NEXT: vredand.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%v = load <2 x i16>, <2 x i16>* %x			%v = load <2 x i16>, <2 x i16>* %x
	%red = call i16 @llvm.vector.reduce.and.v2i16(<2 x i16> %v)			%red = call i16 @llvm.vector.reduce.and.v2i16(<2 x i16> %v)
	ret i16 %red			ret i16 %red
	}			}

	declare i16 @llvm.vector.reduce.and.v4i16(<4 x i16>)			declare i16 @llvm.vector.reduce.and.v4i16(<4 x i16>)

	define i16 @vreduce_and_v4i16(<4 x i16>* %x) {			define i16 @vreduce_and_v4i16(<4 x i16>* %x) {
	; CHECK-LABEL: vreduce_and_v4i16:			; CHECK-LABEL: vreduce_and_v4i16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, ma			; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
	; CHECK-NEXT: vle16.v v8, (a0)			; CHECK-NEXT: vle16.v v8, (a0)
	; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma
	; CHECK-NEXT: vmv.v.i v9, -1			; CHECK-NEXT: vmv.v.i v9, -1
	; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
	; CHECK-NEXT: vredand.vs v8, v8, v9			; CHECK-NEXT: vredand.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%v = load <4 x i16>, <4 x i16>* %x			%v = load <4 x i16>, <4 x i16>* %x
	%red = call i16 @llvm.vector.reduce.and.v4i16(<4 x i16> %v)			%red = call i16 @llvm.vector.reduce.and.v4i16(<4 x i16> %v)
	ret i16 %red			ret i16 %red
	}			}

	declare i16 @llvm.vector.reduce.and.v8i16(<8 x i16>)			declare i16 @llvm.vector.reduce.and.v8i16(<8 x i16>)

	define i16 @vreduce_and_v8i16(<8 x i16>* %x) {			define i16 @vreduce_and_v8i16(<8 x i16>* %x) {
	; CHECK-LABEL: vreduce_and_v8i16:			; CHECK-LABEL: vreduce_and_v8i16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 8, e16, m1, ta, ma			; CHECK-NEXT: vsetivli zero, 8, e16, m1, ta, ma
	; CHECK-NEXT: vle16.v v8, (a0)			; CHECK-NEXT: vle16.v v8, (a0)
	; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma
	; CHECK-NEXT: vmv.v.i v9, -1			; CHECK-NEXT: vmv.v.i v9, -1
	; CHECK-NEXT: vsetivli zero, 8, e16, m1, ta, ma
	; CHECK-NEXT: vredand.vs v8, v8, v9			; CHECK-NEXT: vredand.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%v = load <8 x i16>, <8 x i16>* %x			%v = load <8 x i16>, <8 x i16>* %x
	%red = call i16 @llvm.vector.reduce.and.v8i16(<8 x i16> %v)			%red = call i16 @llvm.vector.reduce.and.v8i16(<8 x i16> %v)
	ret i16 %red			ret i16 %red
	}			}

	▲ Show 20 Lines • Show All 91 Lines • ▼ Show 20 Lines

	declare i32 @llvm.vector.reduce.and.v2i32(<2 x i32>)			declare i32 @llvm.vector.reduce.and.v2i32(<2 x i32>)

	define i32 @vreduce_and_v2i32(<2 x i32>* %x) {			define i32 @vreduce_and_v2i32(<2 x i32>* %x) {
	; CHECK-LABEL: vreduce_and_v2i32:			; CHECK-LABEL: vreduce_and_v2i32:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 2, e32, mf2, ta, ma			; CHECK-NEXT: vsetivli zero, 2, e32, mf2, ta, ma
	; CHECK-NEXT: vle32.v v8, (a0)			; CHECK-NEXT: vle32.v v8, (a0)
	; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma
	; CHECK-NEXT: vmv.v.i v9, -1			; CHECK-NEXT: vmv.v.i v9, -1
	; CHECK-NEXT: vsetivli zero, 2, e32, mf2, ta, ma
	; CHECK-NEXT: vredand.vs v8, v8, v9			; CHECK-NEXT: vredand.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%v = load <2 x i32>, <2 x i32>* %x			%v = load <2 x i32>, <2 x i32>* %x
	%red = call i32 @llvm.vector.reduce.and.v2i32(<2 x i32> %v)			%red = call i32 @llvm.vector.reduce.and.v2i32(<2 x i32> %v)
	ret i32 %red			ret i32 %red
	}			}

	declare i32 @llvm.vector.reduce.and.v4i32(<4 x i32>)			declare i32 @llvm.vector.reduce.and.v4i32(<4 x i32>)

	define i32 @vreduce_and_v4i32(<4 x i32>* %x) {			define i32 @vreduce_and_v4i32(<4 x i32>* %x) {
	; CHECK-LABEL: vreduce_and_v4i32:			; CHECK-LABEL: vreduce_and_v4i32:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma			; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
	; CHECK-NEXT: vle32.v v8, (a0)			; CHECK-NEXT: vle32.v v8, (a0)
	; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma
	; CHECK-NEXT: vmv.v.i v9, -1			; CHECK-NEXT: vmv.v.i v9, -1
	; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
	; CHECK-NEXT: vredand.vs v8, v8, v9			; CHECK-NEXT: vredand.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%v = load <4 x i32>, <4 x i32>* %x			%v = load <4 x i32>, <4 x i32>* %x
	%red = call i32 @llvm.vector.reduce.and.v4i32(<4 x i32> %v)			%red = call i32 @llvm.vector.reduce.and.v4i32(<4 x i32> %v)
	ret i32 %red			ret i32 %red
	}			}

	▲ Show 20 Lines • Show All 100 Lines • ▼ Show 20 Lines

	declare i64 @llvm.vector.reduce.and.v2i64(<2 x i64>)			declare i64 @llvm.vector.reduce.and.v2i64(<2 x i64>)

	define i64 @vreduce_and_v2i64(<2 x i64>* %x) {			define i64 @vreduce_and_v2i64(<2 x i64>* %x) {
	; RV32-LABEL: vreduce_and_v2i64:			; RV32-LABEL: vreduce_and_v2i64:
	; RV32: # %bb.0:			; RV32: # %bb.0:
	; RV32-NEXT: vsetivli zero, 2, e64, m1, ta, ma			; RV32-NEXT: vsetivli zero, 2, e64, m1, ta, ma
	; RV32-NEXT: vle64.v v8, (a0)			; RV32-NEXT: vle64.v v8, (a0)
	; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma
	; RV32-NEXT: vmv.v.i v9, -1			; RV32-NEXT: vmv.v.i v9, -1
	; RV32-NEXT: vsetivli zero, 2, e64, m1, ta, ma
	; RV32-NEXT: vredand.vs v8, v8, v9			; RV32-NEXT: vredand.vs v8, v8, v9
	; RV32-NEXT: vmv.x.s a0, v8			; RV32-NEXT: vmv.x.s a0, v8
	; RV32-NEXT: li a1, 32			; RV32-NEXT: li a1, 32
	; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma
	; RV32-NEXT: vsrl.vx v8, v8, a1			; RV32-NEXT: vsrl.vx v8, v8, a1
	; RV32-NEXT: vmv.x.s a1, v8			; RV32-NEXT: vmv.x.s a1, v8
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: vreduce_and_v2i64:			; RV64-LABEL: vreduce_and_v2i64:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: vsetivli zero, 2, e64, m1, ta, ma			; RV64-NEXT: vsetivli zero, 2, e64, m1, ta, ma
	; RV64-NEXT: vle64.v v8, (a0)			; RV64-NEXT: vle64.v v8, (a0)
	; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma
	; RV64-NEXT: vmv.v.i v9, -1			; RV64-NEXT: vmv.v.i v9, -1
	; RV64-NEXT: vsetivli zero, 2, e64, m1, ta, ma
	; RV64-NEXT: vredand.vs v8, v8, v9			; RV64-NEXT: vredand.vs v8, v8, v9
	; RV64-NEXT: vmv.x.s a0, v8			; RV64-NEXT: vmv.x.s a0, v8
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%v = load <2 x i64>, <2 x i64>* %x			%v = load <2 x i64>, <2 x i64>* %x
	%red = call i64 @llvm.vector.reduce.and.v2i64(<2 x i64> %v)			%red = call i64 @llvm.vector.reduce.and.v2i64(<2 x i64> %v)
	ret i64 %red			ret i64 %red
	}			}

	▲ Show 20 Lines • Show All 202 Lines • ▼ Show 20 Lines

	declare i8 @llvm.vector.reduce.or.v2i8(<2 x i8>)			declare i8 @llvm.vector.reduce.or.v2i8(<2 x i8>)

	define i8 @vreduce_or_v2i8(<2 x i8>* %x) {			define i8 @vreduce_or_v2i8(<2 x i8>* %x) {
	; CHECK-LABEL: vreduce_or_v2i8:			; CHECK-LABEL: vreduce_or_v2i8:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 2, e8, mf8, ta, ma			; CHECK-NEXT: vsetivli zero, 2, e8, mf8, ta, ma
	; CHECK-NEXT: vle8.v v8, (a0)			; CHECK-NEXT: vle8.v v8, (a0)
	; CHECK-NEXT: vmv.s.x v9, zero			; CHECK-NEXT: vmv.v.i v9, 0
	; CHECK-NEXT: vredor.vs v8, v8, v9			; CHECK-NEXT: vredor.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%v = load <2 x i8>, <2 x i8>* %x			%v = load <2 x i8>, <2 x i8>* %x
	%red = call i8 @llvm.vector.reduce.or.v2i8(<2 x i8> %v)			%red = call i8 @llvm.vector.reduce.or.v2i8(<2 x i8> %v)
	ret i8 %red			ret i8 %red
	}			}

	declare i8 @llvm.vector.reduce.or.v4i8(<4 x i8>)			declare i8 @llvm.vector.reduce.or.v4i8(<4 x i8>)

	define i8 @vreduce_or_v4i8(<4 x i8>* %x) {			define i8 @vreduce_or_v4i8(<4 x i8>* %x) {
	; CHECK-LABEL: vreduce_or_v4i8:			; CHECK-LABEL: vreduce_or_v4i8:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 4, e8, mf4, ta, ma			; CHECK-NEXT: vsetivli zero, 4, e8, mf4, ta, ma
	; CHECK-NEXT: vle8.v v8, (a0)			; CHECK-NEXT: vle8.v v8, (a0)
	; CHECK-NEXT: vmv.s.x v9, zero			; CHECK-NEXT: vmv.v.i v9, 0
	; CHECK-NEXT: vredor.vs v8, v8, v9			; CHECK-NEXT: vredor.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%v = load <4 x i8>, <4 x i8>* %x			%v = load <4 x i8>, <4 x i8>* %x
	%red = call i8 @llvm.vector.reduce.or.v4i8(<4 x i8> %v)			%red = call i8 @llvm.vector.reduce.or.v4i8(<4 x i8> %v)
	ret i8 %red			ret i8 %red
	}			}

	declare i8 @llvm.vector.reduce.or.v8i8(<8 x i8>)			declare i8 @llvm.vector.reduce.or.v8i8(<8 x i8>)

	define i8 @vreduce_or_v8i8(<8 x i8>* %x) {			define i8 @vreduce_or_v8i8(<8 x i8>* %x) {
	; CHECK-LABEL: vreduce_or_v8i8:			; CHECK-LABEL: vreduce_or_v8i8:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, ma			; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, ma
	; CHECK-NEXT: vle8.v v8, (a0)			; CHECK-NEXT: vle8.v v8, (a0)
	; CHECK-NEXT: vmv.s.x v9, zero			; CHECK-NEXT: vmv.v.i v9, 0
	; CHECK-NEXT: vredor.vs v8, v8, v9			; CHECK-NEXT: vredor.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%v = load <8 x i8>, <8 x i8>* %x			%v = load <8 x i8>, <8 x i8>* %x
	%red = call i8 @llvm.vector.reduce.or.v8i8(<8 x i8> %v)			%red = call i8 @llvm.vector.reduce.or.v8i8(<8 x i8> %v)
	ret i8 %red			ret i8 %red
	}			}

	declare i8 @llvm.vector.reduce.or.v16i8(<16 x i8>)			declare i8 @llvm.vector.reduce.or.v16i8(<16 x i8>)

	define i8 @vreduce_or_v16i8(<16 x i8>* %x) {			define i8 @vreduce_or_v16i8(<16 x i8>* %x) {
	; CHECK-LABEL: vreduce_or_v16i8:			; CHECK-LABEL: vreduce_or_v16i8:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 16, e8, m1, ta, ma			; CHECK-NEXT: vsetivli zero, 16, e8, m1, ta, ma
	; CHECK-NEXT: vle8.v v8, (a0)			; CHECK-NEXT: vle8.v v8, (a0)
	; CHECK-NEXT: vmv.s.x v9, zero			; CHECK-NEXT: vmv.v.i v9, 0
	; CHECK-NEXT: vredor.vs v8, v8, v9			; CHECK-NEXT: vredor.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%v = load <16 x i8>, <16 x i8>* %x			%v = load <16 x i8>, <16 x i8>* %x
	%red = call i8 @llvm.vector.reduce.or.v16i8(<16 x i8> %v)			%red = call i8 @llvm.vector.reduce.or.v16i8(<16 x i8> %v)
	ret i8 %red			ret i8 %red
	}			}

	▲ Show 20 Lines • Show All 92 Lines • ▼ Show 20 Lines

	declare i16 @llvm.vector.reduce.or.v2i16(<2 x i16>)			declare i16 @llvm.vector.reduce.or.v2i16(<2 x i16>)

	define i16 @vreduce_or_v2i16(<2 x i16>* %x) {			define i16 @vreduce_or_v2i16(<2 x i16>* %x) {
	; CHECK-LABEL: vreduce_or_v2i16:			; CHECK-LABEL: vreduce_or_v2i16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 2, e16, mf4, ta, ma			; CHECK-NEXT: vsetivli zero, 2, e16, mf4, ta, ma
	; CHECK-NEXT: vle16.v v8, (a0)			; CHECK-NEXT: vle16.v v8, (a0)
	; CHECK-NEXT: vmv.s.x v9, zero			; CHECK-NEXT: vmv.v.i v9, 0
	; CHECK-NEXT: vredor.vs v8, v8, v9			; CHECK-NEXT: vredor.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%v = load <2 x i16>, <2 x i16>* %x			%v = load <2 x i16>, <2 x i16>* %x
	%red = call i16 @llvm.vector.reduce.or.v2i16(<2 x i16> %v)			%red = call i16 @llvm.vector.reduce.or.v2i16(<2 x i16> %v)
	ret i16 %red			ret i16 %red
	}			}

	declare i16 @llvm.vector.reduce.or.v4i16(<4 x i16>)			declare i16 @llvm.vector.reduce.or.v4i16(<4 x i16>)

	define i16 @vreduce_or_v4i16(<4 x i16>* %x) {			define i16 @vreduce_or_v4i16(<4 x i16>* %x) {
	; CHECK-LABEL: vreduce_or_v4i16:			; CHECK-LABEL: vreduce_or_v4i16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, ma			; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
	; CHECK-NEXT: vle16.v v8, (a0)			; CHECK-NEXT: vle16.v v8, (a0)
	; CHECK-NEXT: vmv.s.x v9, zero			; CHECK-NEXT: vmv.v.i v9, 0
	; CHECK-NEXT: vredor.vs v8, v8, v9			; CHECK-NEXT: vredor.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%v = load <4 x i16>, <4 x i16>* %x			%v = load <4 x i16>, <4 x i16>* %x
	%red = call i16 @llvm.vector.reduce.or.v4i16(<4 x i16> %v)			%red = call i16 @llvm.vector.reduce.or.v4i16(<4 x i16> %v)
	ret i16 %red			ret i16 %red
	}			}

	declare i16 @llvm.vector.reduce.or.v8i16(<8 x i16>)			declare i16 @llvm.vector.reduce.or.v8i16(<8 x i16>)

	define i16 @vreduce_or_v8i16(<8 x i16>* %x) {			define i16 @vreduce_or_v8i16(<8 x i16>* %x) {
	; CHECK-LABEL: vreduce_or_v8i16:			; CHECK-LABEL: vreduce_or_v8i16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 8, e16, m1, ta, ma			; CHECK-NEXT: vsetivli zero, 8, e16, m1, ta, ma
	; CHECK-NEXT: vle16.v v8, (a0)			; CHECK-NEXT: vle16.v v8, (a0)
	; CHECK-NEXT: vmv.s.x v9, zero			; CHECK-NEXT: vmv.v.i v9, 0
	; CHECK-NEXT: vredor.vs v8, v8, v9			; CHECK-NEXT: vredor.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%v = load <8 x i16>, <8 x i16>* %x			%v = load <8 x i16>, <8 x i16>* %x
	%red = call i16 @llvm.vector.reduce.or.v8i16(<8 x i16> %v)			%red = call i16 @llvm.vector.reduce.or.v8i16(<8 x i16> %v)
	ret i16 %red			ret i16 %red
	}			}

	▲ Show 20 Lines • Show All 89 Lines • ▼ Show 20 Lines

	declare i32 @llvm.vector.reduce.or.v2i32(<2 x i32>)			declare i32 @llvm.vector.reduce.or.v2i32(<2 x i32>)

	define i32 @vreduce_or_v2i32(<2 x i32>* %x) {			define i32 @vreduce_or_v2i32(<2 x i32>* %x) {
	; CHECK-LABEL: vreduce_or_v2i32:			; CHECK-LABEL: vreduce_or_v2i32:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 2, e32, mf2, ta, ma			; CHECK-NEXT: vsetivli zero, 2, e32, mf2, ta, ma
	; CHECK-NEXT: vle32.v v8, (a0)			; CHECK-NEXT: vle32.v v8, (a0)
	; CHECK-NEXT: vmv.s.x v9, zero			; CHECK-NEXT: vmv.v.i v9, 0
	; CHECK-NEXT: vredor.vs v8, v8, v9			; CHECK-NEXT: vredor.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%v = load <2 x i32>, <2 x i32>* %x			%v = load <2 x i32>, <2 x i32>* %x
	%red = call i32 @llvm.vector.reduce.or.v2i32(<2 x i32> %v)			%red = call i32 @llvm.vector.reduce.or.v2i32(<2 x i32> %v)
	ret i32 %red			ret i32 %red
	}			}

	declare i32 @llvm.vector.reduce.or.v4i32(<4 x i32>)			declare i32 @llvm.vector.reduce.or.v4i32(<4 x i32>)

	define i32 @vreduce_or_v4i32(<4 x i32>* %x) {			define i32 @vreduce_or_v4i32(<4 x i32>* %x) {
	; CHECK-LABEL: vreduce_or_v4i32:			; CHECK-LABEL: vreduce_or_v4i32:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma			; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
	; CHECK-NEXT: vle32.v v8, (a0)			; CHECK-NEXT: vle32.v v8, (a0)
	; CHECK-NEXT: vmv.s.x v9, zero			; CHECK-NEXT: vmv.v.i v9, 0
	; CHECK-NEXT: vredor.vs v8, v8, v9			; CHECK-NEXT: vredor.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%v = load <4 x i32>, <4 x i32>* %x			%v = load <4 x i32>, <4 x i32>* %x
	%red = call i32 @llvm.vector.reduce.or.v4i32(<4 x i32> %v)			%red = call i32 @llvm.vector.reduce.or.v4i32(<4 x i32> %v)
	ret i32 %red			ret i32 %red
	}			}

	▲ Show 20 Lines • Show All 96 Lines • ▼ Show 20 Lines

	declare i64 @llvm.vector.reduce.or.v2i64(<2 x i64>)			declare i64 @llvm.vector.reduce.or.v2i64(<2 x i64>)

	define i64 @vreduce_or_v2i64(<2 x i64>* %x) {			define i64 @vreduce_or_v2i64(<2 x i64>* %x) {
	; RV32-LABEL: vreduce_or_v2i64:			; RV32-LABEL: vreduce_or_v2i64:
	; RV32: # %bb.0:			; RV32: # %bb.0:
	; RV32-NEXT: vsetivli zero, 2, e64, m1, ta, ma			; RV32-NEXT: vsetivli zero, 2, e64, m1, ta, ma
	; RV32-NEXT: vle64.v v8, (a0)			; RV32-NEXT: vle64.v v8, (a0)
	; RV32-NEXT: vmv.s.x v9, zero			; RV32-NEXT: vmv.v.i v9, 0
	; RV32-NEXT: vredor.vs v8, v8, v9			; RV32-NEXT: vredor.vs v8, v8, v9
	; RV32-NEXT: vmv.x.s a0, v8			; RV32-NEXT: vmv.x.s a0, v8
	; RV32-NEXT: li a1, 32			; RV32-NEXT: li a1, 32
	; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma
	; RV32-NEXT: vsrl.vx v8, v8, a1			; RV32-NEXT: vsrl.vx v8, v8, a1
	; RV32-NEXT: vmv.x.s a1, v8			; RV32-NEXT: vmv.x.s a1, v8
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: vreduce_or_v2i64:			; RV64-LABEL: vreduce_or_v2i64:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: vsetivli zero, 2, e64, m1, ta, ma			; RV64-NEXT: vsetivli zero, 2, e64, m1, ta, ma
	; RV64-NEXT: vle64.v v8, (a0)			; RV64-NEXT: vle64.v v8, (a0)
	; RV64-NEXT: vmv.s.x v9, zero			; RV64-NEXT: vmv.v.i v9, 0
	; RV64-NEXT: vredor.vs v8, v8, v9			; RV64-NEXT: vredor.vs v8, v8, v9
	; RV64-NEXT: vmv.x.s a0, v8			; RV64-NEXT: vmv.x.s a0, v8
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%v = load <2 x i64>, <2 x i64>* %x			%v = load <2 x i64>, <2 x i64>* %x
	%red = call i64 @llvm.vector.reduce.or.v2i64(<2 x i64> %v)			%red = call i64 @llvm.vector.reduce.or.v2i64(<2 x i64> %v)
	ret i64 %red			ret i64 %red
	}			}

	▲ Show 20 Lines • Show All 182 Lines • ▼ Show 20 Lines

	declare i8 @llvm.vector.reduce.xor.v2i8(<2 x i8>)			declare i8 @llvm.vector.reduce.xor.v2i8(<2 x i8>)

	define i8 @vreduce_xor_v2i8(<2 x i8>* %x) {			define i8 @vreduce_xor_v2i8(<2 x i8>* %x) {
	; CHECK-LABEL: vreduce_xor_v2i8:			; CHECK-LABEL: vreduce_xor_v2i8:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 2, e8, mf8, ta, ma			; CHECK-NEXT: vsetivli zero, 2, e8, mf8, ta, ma
	; CHECK-NEXT: vle8.v v8, (a0)			; CHECK-NEXT: vle8.v v8, (a0)
	; CHECK-NEXT: vmv.s.x v9, zero			; CHECK-NEXT: vmv.v.i v9, 0
	; CHECK-NEXT: vredxor.vs v8, v8, v9			; CHECK-NEXT: vredxor.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%v = load <2 x i8>, <2 x i8>* %x			%v = load <2 x i8>, <2 x i8>* %x
	%red = call i8 @llvm.vector.reduce.xor.v2i8(<2 x i8> %v)			%red = call i8 @llvm.vector.reduce.xor.v2i8(<2 x i8> %v)
	ret i8 %red			ret i8 %red
	}			}

	declare i8 @llvm.vector.reduce.xor.v4i8(<4 x i8>)			declare i8 @llvm.vector.reduce.xor.v4i8(<4 x i8>)

	define i8 @vreduce_xor_v4i8(<4 x i8>* %x) {			define i8 @vreduce_xor_v4i8(<4 x i8>* %x) {
	; CHECK-LABEL: vreduce_xor_v4i8:			; CHECK-LABEL: vreduce_xor_v4i8:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 4, e8, mf4, ta, ma			; CHECK-NEXT: vsetivli zero, 4, e8, mf4, ta, ma
	; CHECK-NEXT: vle8.v v8, (a0)			; CHECK-NEXT: vle8.v v8, (a0)
	; CHECK-NEXT: vmv.s.x v9, zero			; CHECK-NEXT: vmv.v.i v9, 0
	; CHECK-NEXT: vredxor.vs v8, v8, v9			; CHECK-NEXT: vredxor.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%v = load <4 x i8>, <4 x i8>* %x			%v = load <4 x i8>, <4 x i8>* %x
	%red = call i8 @llvm.vector.reduce.xor.v4i8(<4 x i8> %v)			%red = call i8 @llvm.vector.reduce.xor.v4i8(<4 x i8> %v)
	ret i8 %red			ret i8 %red
	}			}

	declare i8 @llvm.vector.reduce.xor.v8i8(<8 x i8>)			declare i8 @llvm.vector.reduce.xor.v8i8(<8 x i8>)

	define i8 @vreduce_xor_v8i8(<8 x i8>* %x) {			define i8 @vreduce_xor_v8i8(<8 x i8>* %x) {
	; CHECK-LABEL: vreduce_xor_v8i8:			; CHECK-LABEL: vreduce_xor_v8i8:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, ma			; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, ma
	; CHECK-NEXT: vle8.v v8, (a0)			; CHECK-NEXT: vle8.v v8, (a0)
	; CHECK-NEXT: vmv.s.x v9, zero			; CHECK-NEXT: vmv.v.i v9, 0
	; CHECK-NEXT: vredxor.vs v8, v8, v9			; CHECK-NEXT: vredxor.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%v = load <8 x i8>, <8 x i8>* %x			%v = load <8 x i8>, <8 x i8>* %x
	%red = call i8 @llvm.vector.reduce.xor.v8i8(<8 x i8> %v)			%red = call i8 @llvm.vector.reduce.xor.v8i8(<8 x i8> %v)
	ret i8 %red			ret i8 %red
	}			}

	declare i8 @llvm.vector.reduce.xor.v16i8(<16 x i8>)			declare i8 @llvm.vector.reduce.xor.v16i8(<16 x i8>)

	define i8 @vreduce_xor_v16i8(<16 x i8>* %x) {			define i8 @vreduce_xor_v16i8(<16 x i8>* %x) {
	; CHECK-LABEL: vreduce_xor_v16i8:			; CHECK-LABEL: vreduce_xor_v16i8:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 16, e8, m1, ta, ma			; CHECK-NEXT: vsetivli zero, 16, e8, m1, ta, ma
	; CHECK-NEXT: vle8.v v8, (a0)			; CHECK-NEXT: vle8.v v8, (a0)
	; CHECK-NEXT: vmv.s.x v9, zero			; CHECK-NEXT: vmv.v.i v9, 0
	; CHECK-NEXT: vredxor.vs v8, v8, v9			; CHECK-NEXT: vredxor.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%v = load <16 x i8>, <16 x i8>* %x			%v = load <16 x i8>, <16 x i8>* %x
	%red = call i8 @llvm.vector.reduce.xor.v16i8(<16 x i8> %v)			%red = call i8 @llvm.vector.reduce.xor.v16i8(<16 x i8> %v)
	ret i8 %red			ret i8 %red
	}			}

	▲ Show 20 Lines • Show All 92 Lines • ▼ Show 20 Lines

	declare i16 @llvm.vector.reduce.xor.v2i16(<2 x i16>)			declare i16 @llvm.vector.reduce.xor.v2i16(<2 x i16>)

	define i16 @vreduce_xor_v2i16(<2 x i16>* %x) {			define i16 @vreduce_xor_v2i16(<2 x i16>* %x) {
	; CHECK-LABEL: vreduce_xor_v2i16:			; CHECK-LABEL: vreduce_xor_v2i16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 2, e16, mf4, ta, ma			; CHECK-NEXT: vsetivli zero, 2, e16, mf4, ta, ma
	; CHECK-NEXT: vle16.v v8, (a0)			; CHECK-NEXT: vle16.v v8, (a0)
	; CHECK-NEXT: vmv.s.x v9, zero			; CHECK-NEXT: vmv.v.i v9, 0
	; CHECK-NEXT: vredxor.vs v8, v8, v9			; CHECK-NEXT: vredxor.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%v = load <2 x i16>, <2 x i16>* %x			%v = load <2 x i16>, <2 x i16>* %x
	%red = call i16 @llvm.vector.reduce.xor.v2i16(<2 x i16> %v)			%red = call i16 @llvm.vector.reduce.xor.v2i16(<2 x i16> %v)
	ret i16 %red			ret i16 %red
	}			}

	declare i16 @llvm.vector.reduce.xor.v4i16(<4 x i16>)			declare i16 @llvm.vector.reduce.xor.v4i16(<4 x i16>)

	define i16 @vreduce_xor_v4i16(<4 x i16>* %x) {			define i16 @vreduce_xor_v4i16(<4 x i16>* %x) {
	; CHECK-LABEL: vreduce_xor_v4i16:			; CHECK-LABEL: vreduce_xor_v4i16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, ma			; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
	; CHECK-NEXT: vle16.v v8, (a0)			; CHECK-NEXT: vle16.v v8, (a0)
	; CHECK-NEXT: vmv.s.x v9, zero			; CHECK-NEXT: vmv.v.i v9, 0
	; CHECK-NEXT: vredxor.vs v8, v8, v9			; CHECK-NEXT: vredxor.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%v = load <4 x i16>, <4 x i16>* %x			%v = load <4 x i16>, <4 x i16>* %x
	%red = call i16 @llvm.vector.reduce.xor.v4i16(<4 x i16> %v)			%red = call i16 @llvm.vector.reduce.xor.v4i16(<4 x i16> %v)
	ret i16 %red			ret i16 %red
	}			}

	declare i16 @llvm.vector.reduce.xor.v8i16(<8 x i16>)			declare i16 @llvm.vector.reduce.xor.v8i16(<8 x i16>)

	define i16 @vreduce_xor_v8i16(<8 x i16>* %x) {			define i16 @vreduce_xor_v8i16(<8 x i16>* %x) {
	; CHECK-LABEL: vreduce_xor_v8i16:			; CHECK-LABEL: vreduce_xor_v8i16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 8, e16, m1, ta, ma			; CHECK-NEXT: vsetivli zero, 8, e16, m1, ta, ma
	; CHECK-NEXT: vle16.v v8, (a0)			; CHECK-NEXT: vle16.v v8, (a0)
	; CHECK-NEXT: vmv.s.x v9, zero			; CHECK-NEXT: vmv.v.i v9, 0
	; CHECK-NEXT: vredxor.vs v8, v8, v9			; CHECK-NEXT: vredxor.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%v = load <8 x i16>, <8 x i16>* %x			%v = load <8 x i16>, <8 x i16>* %x
	%red = call i16 @llvm.vector.reduce.xor.v8i16(<8 x i16> %v)			%red = call i16 @llvm.vector.reduce.xor.v8i16(<8 x i16> %v)
	ret i16 %red			ret i16 %red
	}			}

	▲ Show 20 Lines • Show All 89 Lines • ▼ Show 20 Lines

	declare i32 @llvm.vector.reduce.xor.v2i32(<2 x i32>)			declare i32 @llvm.vector.reduce.xor.v2i32(<2 x i32>)

	define i32 @vreduce_xor_v2i32(<2 x i32>* %x) {			define i32 @vreduce_xor_v2i32(<2 x i32>* %x) {
	; CHECK-LABEL: vreduce_xor_v2i32:			; CHECK-LABEL: vreduce_xor_v2i32:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 2, e32, mf2, ta, ma			; CHECK-NEXT: vsetivli zero, 2, e32, mf2, ta, ma
	; CHECK-NEXT: vle32.v v8, (a0)			; CHECK-NEXT: vle32.v v8, (a0)
	; CHECK-NEXT: vmv.s.x v9, zero			; CHECK-NEXT: vmv.v.i v9, 0
	; CHECK-NEXT: vredxor.vs v8, v8, v9			; CHECK-NEXT: vredxor.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%v = load <2 x i32>, <2 x i32>* %x			%v = load <2 x i32>, <2 x i32>* %x
	%red = call i32 @llvm.vector.reduce.xor.v2i32(<2 x i32> %v)			%red = call i32 @llvm.vector.reduce.xor.v2i32(<2 x i32> %v)
	ret i32 %red			ret i32 %red
	}			}

	declare i32 @llvm.vector.reduce.xor.v4i32(<4 x i32>)			declare i32 @llvm.vector.reduce.xor.v4i32(<4 x i32>)

	define i32 @vreduce_xor_v4i32(<4 x i32>* %x) {			define i32 @vreduce_xor_v4i32(<4 x i32>* %x) {
	; CHECK-LABEL: vreduce_xor_v4i32:			; CHECK-LABEL: vreduce_xor_v4i32:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma			; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
	; CHECK-NEXT: vle32.v v8, (a0)			; CHECK-NEXT: vle32.v v8, (a0)
	; CHECK-NEXT: vmv.s.x v9, zero			; CHECK-NEXT: vmv.v.i v9, 0
	; CHECK-NEXT: vredxor.vs v8, v8, v9			; CHECK-NEXT: vredxor.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%v = load <4 x i32>, <4 x i32>* %x			%v = load <4 x i32>, <4 x i32>* %x
	%red = call i32 @llvm.vector.reduce.xor.v4i32(<4 x i32> %v)			%red = call i32 @llvm.vector.reduce.xor.v4i32(<4 x i32> %v)
	ret i32 %red			ret i32 %red
	}			}

	▲ Show 20 Lines • Show All 96 Lines • ▼ Show 20 Lines

	declare i64 @llvm.vector.reduce.xor.v2i64(<2 x i64>)			declare i64 @llvm.vector.reduce.xor.v2i64(<2 x i64>)

	define i64 @vreduce_xor_v2i64(<2 x i64>* %x) {			define i64 @vreduce_xor_v2i64(<2 x i64>* %x) {
	; RV32-LABEL: vreduce_xor_v2i64:			; RV32-LABEL: vreduce_xor_v2i64:
	; RV32: # %bb.0:			; RV32: # %bb.0:
	; RV32-NEXT: vsetivli zero, 2, e64, m1, ta, ma			; RV32-NEXT: vsetivli zero, 2, e64, m1, ta, ma
	; RV32-NEXT: vle64.v v8, (a0)			; RV32-NEXT: vle64.v v8, (a0)
	; RV32-NEXT: vmv.s.x v9, zero			; RV32-NEXT: vmv.v.i v9, 0
	; RV32-NEXT: vredxor.vs v8, v8, v9			; RV32-NEXT: vredxor.vs v8, v8, v9
	; RV32-NEXT: vmv.x.s a0, v8			; RV32-NEXT: vmv.x.s a0, v8
	; RV32-NEXT: li a1, 32			; RV32-NEXT: li a1, 32
	; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma
	; RV32-NEXT: vsrl.vx v8, v8, a1			; RV32-NEXT: vsrl.vx v8, v8, a1
	; RV32-NEXT: vmv.x.s a1, v8			; RV32-NEXT: vmv.x.s a1, v8
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: vreduce_xor_v2i64:			; RV64-LABEL: vreduce_xor_v2i64:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: vsetivli zero, 2, e64, m1, ta, ma			; RV64-NEXT: vsetivli zero, 2, e64, m1, ta, ma
	; RV64-NEXT: vle64.v v8, (a0)			; RV64-NEXT: vle64.v v8, (a0)
	; RV64-NEXT: vmv.s.x v9, zero			; RV64-NEXT: vmv.v.i v9, 0
	; RV64-NEXT: vredxor.vs v8, v8, v9			; RV64-NEXT: vredxor.vs v8, v8, v9
	; RV64-NEXT: vmv.x.s a0, v8			; RV64-NEXT: vmv.x.s a0, v8
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%v = load <2 x i64>, <2 x i64>* %x			%v = load <2 x i64>, <2 x i64>* %x
	%red = call i64 @llvm.vector.reduce.xor.v2i64(<2 x i64> %v)			%red = call i64 @llvm.vector.reduce.xor.v2i64(<2 x i64> %v)
	ret i64 %red			ret i64 %red
	}			}

	▲ Show 20 Lines • Show All 183 Lines • ▼ Show 20 Lines
	declare i8 @llvm.vector.reduce.smin.v2i8(<2 x i8>)			declare i8 @llvm.vector.reduce.smin.v2i8(<2 x i8>)

	define i8 @vreduce_smin_v2i8(<2 x i8>* %x) {			define i8 @vreduce_smin_v2i8(<2 x i8>* %x) {
	; CHECK-LABEL: vreduce_smin_v2i8:			; CHECK-LABEL: vreduce_smin_v2i8:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 2, e8, mf8, ta, ma			; CHECK-NEXT: vsetivli zero, 2, e8, mf8, ta, ma
	; CHECK-NEXT: vle8.v v8, (a0)			; CHECK-NEXT: vle8.v v8, (a0)
	; CHECK-NEXT: li a0, 127			; CHECK-NEXT: li a0, 127
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.v.x v9, a0
	; CHECK-NEXT: vredmin.vs v8, v8, v9			; CHECK-NEXT: vredmin.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%v = load <2 x i8>, <2 x i8>* %x			%v = load <2 x i8>, <2 x i8>* %x
	%red = call i8 @llvm.vector.reduce.smin.v2i8(<2 x i8> %v)			%red = call i8 @llvm.vector.reduce.smin.v2i8(<2 x i8> %v)
	ret i8 %red			ret i8 %red
	}			}

	declare i8 @llvm.vector.reduce.smin.v4i8(<4 x i8>)			declare i8 @llvm.vector.reduce.smin.v4i8(<4 x i8>)

	define i8 @vreduce_smin_v4i8(<4 x i8>* %x) {			define i8 @vreduce_smin_v4i8(<4 x i8>* %x) {
	; CHECK-LABEL: vreduce_smin_v4i8:			; CHECK-LABEL: vreduce_smin_v4i8:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 4, e8, mf4, ta, ma			; CHECK-NEXT: vsetivli zero, 4, e8, mf4, ta, ma
	; CHECK-NEXT: vle8.v v8, (a0)			; CHECK-NEXT: vle8.v v8, (a0)
	; CHECK-NEXT: li a0, 127			; CHECK-NEXT: li a0, 127
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.v.x v9, a0
	; CHECK-NEXT: vredmin.vs v8, v8, v9			; CHECK-NEXT: vredmin.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%v = load <4 x i8>, <4 x i8>* %x			%v = load <4 x i8>, <4 x i8>* %x
	%red = call i8 @llvm.vector.reduce.smin.v4i8(<4 x i8> %v)			%red = call i8 @llvm.vector.reduce.smin.v4i8(<4 x i8> %v)
	ret i8 %red			ret i8 %red
	}			}

	declare i8 @llvm.vector.reduce.smin.v8i8(<8 x i8>)			declare i8 @llvm.vector.reduce.smin.v8i8(<8 x i8>)

	define i8 @vreduce_smin_v8i8(<8 x i8>* %x) {			define i8 @vreduce_smin_v8i8(<8 x i8>* %x) {
	; CHECK-LABEL: vreduce_smin_v8i8:			; CHECK-LABEL: vreduce_smin_v8i8:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, ma			; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, ma
	; CHECK-NEXT: vle8.v v8, (a0)			; CHECK-NEXT: vle8.v v8, (a0)
	; CHECK-NEXT: li a0, 127			; CHECK-NEXT: li a0, 127
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.v.x v9, a0
	; CHECK-NEXT: vredmin.vs v8, v8, v9			; CHECK-NEXT: vredmin.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%v = load <8 x i8>, <8 x i8>* %x			%v = load <8 x i8>, <8 x i8>* %x
	%red = call i8 @llvm.vector.reduce.smin.v8i8(<8 x i8> %v)			%red = call i8 @llvm.vector.reduce.smin.v8i8(<8 x i8> %v)
	ret i8 %red			ret i8 %red
	}			}

	declare i8 @llvm.vector.reduce.smin.v16i8(<16 x i8>)			declare i8 @llvm.vector.reduce.smin.v16i8(<16 x i8>)

	define i8 @vreduce_smin_v16i8(<16 x i8>* %x) {			define i8 @vreduce_smin_v16i8(<16 x i8>* %x) {
	; CHECK-LABEL: vreduce_smin_v16i8:			; CHECK-LABEL: vreduce_smin_v16i8:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 16, e8, m1, ta, ma			; CHECK-NEXT: vsetivli zero, 16, e8, m1, ta, ma
	; CHECK-NEXT: vle8.v v8, (a0)			; CHECK-NEXT: vle8.v v8, (a0)
	; CHECK-NEXT: li a0, 127			; CHECK-NEXT: li a0, 127
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.v.x v9, a0
	; CHECK-NEXT: vredmin.vs v8, v8, v9			; CHECK-NEXT: vredmin.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%v = load <16 x i8>, <16 x i8>* %x			%v = load <16 x i8>, <16 x i8>* %x
	%red = call i8 @llvm.vector.reduce.smin.v16i8(<16 x i8> %v)			%red = call i8 @llvm.vector.reduce.smin.v16i8(<16 x i8> %v)
	ret i8 %red			ret i8 %red
	}			}

	▲ Show 20 Lines • Show All 98 Lines • ▼ Show 20 Lines

	define i16 @vreduce_smin_v2i16(<2 x i16>* %x) {			define i16 @vreduce_smin_v2i16(<2 x i16>* %x) {
	; RV32-LABEL: vreduce_smin_v2i16:			; RV32-LABEL: vreduce_smin_v2i16:
	; RV32: # %bb.0:			; RV32: # %bb.0:
	; RV32-NEXT: vsetivli zero, 2, e16, mf4, ta, ma			; RV32-NEXT: vsetivli zero, 2, e16, mf4, ta, ma
	; RV32-NEXT: vle16.v v8, (a0)			; RV32-NEXT: vle16.v v8, (a0)
	; RV32-NEXT: lui a0, 8			; RV32-NEXT: lui a0, 8
	; RV32-NEXT: addi a0, a0, -1			; RV32-NEXT: addi a0, a0, -1
	; RV32-NEXT: vmv.s.x v9, a0			; RV32-NEXT: vmv.v.x v9, a0
	; RV32-NEXT: vredmin.vs v8, v8, v9			; RV32-NEXT: vredmin.vs v8, v8, v9
	; RV32-NEXT: vmv.x.s a0, v8			; RV32-NEXT: vmv.x.s a0, v8
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: vreduce_smin_v2i16:			; RV64-LABEL: vreduce_smin_v2i16:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: vsetivli zero, 2, e16, mf4, ta, ma			; RV64-NEXT: vsetivli zero, 2, e16, mf4, ta, ma
	; RV64-NEXT: vle16.v v8, (a0)			; RV64-NEXT: vle16.v v8, (a0)
	; RV64-NEXT: lui a0, 8			; RV64-NEXT: lui a0, 8
	; RV64-NEXT: addiw a0, a0, -1			; RV64-NEXT: addiw a0, a0, -1
	; RV64-NEXT: vmv.s.x v9, a0			; RV64-NEXT: vmv.v.x v9, a0
	; RV64-NEXT: vredmin.vs v8, v8, v9			; RV64-NEXT: vredmin.vs v8, v8, v9
	; RV64-NEXT: vmv.x.s a0, v8			; RV64-NEXT: vmv.x.s a0, v8
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%v = load <2 x i16>, <2 x i16>* %x			%v = load <2 x i16>, <2 x i16>* %x
	%red = call i16 @llvm.vector.reduce.smin.v2i16(<2 x i16> %v)			%red = call i16 @llvm.vector.reduce.smin.v2i16(<2 x i16> %v)
	ret i16 %red			ret i16 %red
	}			}

	declare i16 @llvm.vector.reduce.smin.v4i16(<4 x i16>)			declare i16 @llvm.vector.reduce.smin.v4i16(<4 x i16>)

	define i16 @vreduce_smin_v4i16(<4 x i16>* %x) {			define i16 @vreduce_smin_v4i16(<4 x i16>* %x) {
	; RV32-LABEL: vreduce_smin_v4i16:			; RV32-LABEL: vreduce_smin_v4i16:
	; RV32: # %bb.0:			; RV32: # %bb.0:
	; RV32-NEXT: vsetivli zero, 4, e16, mf2, ta, ma			; RV32-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
	; RV32-NEXT: vle16.v v8, (a0)			; RV32-NEXT: vle16.v v8, (a0)
	; RV32-NEXT: lui a0, 8			; RV32-NEXT: lui a0, 8
	; RV32-NEXT: addi a0, a0, -1			; RV32-NEXT: addi a0, a0, -1
	; RV32-NEXT: vmv.s.x v9, a0			; RV32-NEXT: vmv.v.x v9, a0
	; RV32-NEXT: vredmin.vs v8, v8, v9			; RV32-NEXT: vredmin.vs v8, v8, v9
	; RV32-NEXT: vmv.x.s a0, v8			; RV32-NEXT: vmv.x.s a0, v8
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: vreduce_smin_v4i16:			; RV64-LABEL: vreduce_smin_v4i16:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: vsetivli zero, 4, e16, mf2, ta, ma			; RV64-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
	; RV64-NEXT: vle16.v v8, (a0)			; RV64-NEXT: vle16.v v8, (a0)
	; RV64-NEXT: lui a0, 8			; RV64-NEXT: lui a0, 8
	; RV64-NEXT: addiw a0, a0, -1			; RV64-NEXT: addiw a0, a0, -1
	; RV64-NEXT: vmv.s.x v9, a0			; RV64-NEXT: vmv.v.x v9, a0
	; RV64-NEXT: vredmin.vs v8, v8, v9			; RV64-NEXT: vredmin.vs v8, v8, v9
	; RV64-NEXT: vmv.x.s a0, v8			; RV64-NEXT: vmv.x.s a0, v8
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%v = load <4 x i16>, <4 x i16>* %x			%v = load <4 x i16>, <4 x i16>* %x
	%red = call i16 @llvm.vector.reduce.smin.v4i16(<4 x i16> %v)			%red = call i16 @llvm.vector.reduce.smin.v4i16(<4 x i16> %v)
	ret i16 %red			ret i16 %red
	}			}

	declare i16 @llvm.vector.reduce.smin.v8i16(<8 x i16>)			declare i16 @llvm.vector.reduce.smin.v8i16(<8 x i16>)

	define i16 @vreduce_smin_v8i16(<8 x i16>* %x) {			define i16 @vreduce_smin_v8i16(<8 x i16>* %x) {
	; RV32-LABEL: vreduce_smin_v8i16:			; RV32-LABEL: vreduce_smin_v8i16:
	; RV32: # %bb.0:			; RV32: # %bb.0:
	; RV32-NEXT: vsetivli zero, 8, e16, m1, ta, ma			; RV32-NEXT: vsetivli zero, 8, e16, m1, ta, ma
	; RV32-NEXT: vle16.v v8, (a0)			; RV32-NEXT: vle16.v v8, (a0)
	; RV32-NEXT: lui a0, 8			; RV32-NEXT: lui a0, 8
	; RV32-NEXT: addi a0, a0, -1			; RV32-NEXT: addi a0, a0, -1
	; RV32-NEXT: vmv.s.x v9, a0			; RV32-NEXT: vmv.v.x v9, a0
	; RV32-NEXT: vredmin.vs v8, v8, v9			; RV32-NEXT: vredmin.vs v8, v8, v9
	; RV32-NEXT: vmv.x.s a0, v8			; RV32-NEXT: vmv.x.s a0, v8
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: vreduce_smin_v8i16:			; RV64-LABEL: vreduce_smin_v8i16:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: vsetivli zero, 8, e16, m1, ta, ma			; RV64-NEXT: vsetivli zero, 8, e16, m1, ta, ma
	; RV64-NEXT: vle16.v v8, (a0)			; RV64-NEXT: vle16.v v8, (a0)
	; RV64-NEXT: lui a0, 8			; RV64-NEXT: lui a0, 8
	; RV64-NEXT: addiw a0, a0, -1			; RV64-NEXT: addiw a0, a0, -1
	; RV64-NEXT: vmv.s.x v9, a0			; RV64-NEXT: vmv.v.x v9, a0
	; RV64-NEXT: vredmin.vs v8, v8, v9			; RV64-NEXT: vredmin.vs v8, v8, v9
	; RV64-NEXT: vmv.x.s a0, v8			; RV64-NEXT: vmv.x.s a0, v8
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%v = load <8 x i16>, <8 x i16>* %x			%v = load <8 x i16>, <8 x i16>* %x
	%red = call i16 @llvm.vector.reduce.smin.v8i16(<8 x i16> %v)			%red = call i16 @llvm.vector.reduce.smin.v8i16(<8 x i16> %v)
	ret i16 %red			ret i16 %red
	}			}

	▲ Show 20 Lines • Show All 155 Lines • ▼ Show 20 Lines

	define i32 @vreduce_smin_v2i32(<2 x i32>* %x) {			define i32 @vreduce_smin_v2i32(<2 x i32>* %x) {
	; RV32-LABEL: vreduce_smin_v2i32:			; RV32-LABEL: vreduce_smin_v2i32:
	; RV32: # %bb.0:			; RV32: # %bb.0:
	; RV32-NEXT: vsetivli zero, 2, e32, mf2, ta, ma			; RV32-NEXT: vsetivli zero, 2, e32, mf2, ta, ma
	; RV32-NEXT: vle32.v v8, (a0)			; RV32-NEXT: vle32.v v8, (a0)
	; RV32-NEXT: lui a0, 524288			; RV32-NEXT: lui a0, 524288
	; RV32-NEXT: addi a0, a0, -1			; RV32-NEXT: addi a0, a0, -1
	; RV32-NEXT: vmv.s.x v9, a0			; RV32-NEXT: vmv.v.x v9, a0
	; RV32-NEXT: vredmin.vs v8, v8, v9			; RV32-NEXT: vredmin.vs v8, v8, v9
	; RV32-NEXT: vmv.x.s a0, v8			; RV32-NEXT: vmv.x.s a0, v8
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: vreduce_smin_v2i32:			; RV64-LABEL: vreduce_smin_v2i32:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: vsetivli zero, 2, e32, mf2, ta, ma			; RV64-NEXT: vsetivli zero, 2, e32, mf2, ta, ma
	; RV64-NEXT: vle32.v v8, (a0)			; RV64-NEXT: vle32.v v8, (a0)
	; RV64-NEXT: lui a0, 524288			; RV64-NEXT: lui a0, 524288
	; RV64-NEXT: addiw a0, a0, -1			; RV64-NEXT: addiw a0, a0, -1
	; RV64-NEXT: vmv.s.x v9, a0			; RV64-NEXT: vmv.v.x v9, a0
	; RV64-NEXT: vredmin.vs v8, v8, v9			; RV64-NEXT: vredmin.vs v8, v8, v9
	; RV64-NEXT: vmv.x.s a0, v8			; RV64-NEXT: vmv.x.s a0, v8
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%v = load <2 x i32>, <2 x i32>* %x			%v = load <2 x i32>, <2 x i32>* %x
	%red = call i32 @llvm.vector.reduce.smin.v2i32(<2 x i32> %v)			%red = call i32 @llvm.vector.reduce.smin.v2i32(<2 x i32> %v)
	ret i32 %red			ret i32 %red
	}			}

	declare i32 @llvm.vector.reduce.smin.v4i32(<4 x i32>)			declare i32 @llvm.vector.reduce.smin.v4i32(<4 x i32>)

	define i32 @vreduce_smin_v4i32(<4 x i32>* %x) {			define i32 @vreduce_smin_v4i32(<4 x i32>* %x) {
	; RV32-LABEL: vreduce_smin_v4i32:			; RV32-LABEL: vreduce_smin_v4i32:
	; RV32: # %bb.0:			; RV32: # %bb.0:
	; RV32-NEXT: vsetivli zero, 4, e32, m1, ta, ma			; RV32-NEXT: vsetivli zero, 4, e32, m1, ta, ma
	; RV32-NEXT: vle32.v v8, (a0)			; RV32-NEXT: vle32.v v8, (a0)
	; RV32-NEXT: lui a0, 524288			; RV32-NEXT: lui a0, 524288
	; RV32-NEXT: addi a0, a0, -1			; RV32-NEXT: addi a0, a0, -1
	; RV32-NEXT: vmv.s.x v9, a0			; RV32-NEXT: vmv.v.x v9, a0
	; RV32-NEXT: vredmin.vs v8, v8, v9			; RV32-NEXT: vredmin.vs v8, v8, v9
	; RV32-NEXT: vmv.x.s a0, v8			; RV32-NEXT: vmv.x.s a0, v8
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: vreduce_smin_v4i32:			; RV64-LABEL: vreduce_smin_v4i32:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: vsetivli zero, 4, e32, m1, ta, ma			; RV64-NEXT: vsetivli zero, 4, e32, m1, ta, ma
	; RV64-NEXT: vle32.v v8, (a0)			; RV64-NEXT: vle32.v v8, (a0)
	; RV64-NEXT: lui a0, 524288			; RV64-NEXT: lui a0, 524288
	; RV64-NEXT: addiw a0, a0, -1			; RV64-NEXT: addiw a0, a0, -1
	; RV64-NEXT: vmv.s.x v9, a0			; RV64-NEXT: vmv.v.x v9, a0
	; RV64-NEXT: vredmin.vs v8, v8, v9			; RV64-NEXT: vredmin.vs v8, v8, v9
	; RV64-NEXT: vmv.x.s a0, v8			; RV64-NEXT: vmv.x.s a0, v8
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%v = load <4 x i32>, <4 x i32>* %x			%v = load <4 x i32>, <4 x i32>* %x
	%red = call i32 @llvm.vector.reduce.smin.v4i32(<4 x i32> %v)			%red = call i32 @llvm.vector.reduce.smin.v4i32(<4 x i32> %v)
	ret i32 %red			ret i32 %red
	}			}

	▲ Show 20 Lines • Show All 165 Lines • ▼ Show 20 Lines
	; RV32-NEXT: vsetivli zero, 2, e64, m1, ta, ma			; RV32-NEXT: vsetivli zero, 2, e64, m1, ta, ma
	; RV32-NEXT: vle64.v v8, (a0)			; RV32-NEXT: vle64.v v8, (a0)
	; RV32-NEXT: li a0, -1			; RV32-NEXT: li a0, -1
	; RV32-NEXT: sw a0, 8(sp)			; RV32-NEXT: sw a0, 8(sp)
	; RV32-NEXT: lui a0, 524288			; RV32-NEXT: lui a0, 524288
	; RV32-NEXT: addi a0, a0, -1			; RV32-NEXT: addi a0, a0, -1
	; RV32-NEXT: sw a0, 12(sp)			; RV32-NEXT: sw a0, 12(sp)
	; RV32-NEXT: addi a0, sp, 8			; RV32-NEXT: addi a0, sp, 8
	; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma
	; RV32-NEXT: vlse64.v v9, (a0), zero			; RV32-NEXT: vlse64.v v9, (a0), zero
	; RV32-NEXT: vsetivli zero, 2, e64, m1, ta, ma
	; RV32-NEXT: vredmin.vs v8, v8, v9			; RV32-NEXT: vredmin.vs v8, v8, v9
	; RV32-NEXT: vmv.x.s a0, v8			; RV32-NEXT: vmv.x.s a0, v8
	; RV32-NEXT: li a1, 32			; RV32-NEXT: li a1, 32
	; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma
	; RV32-NEXT: vsrl.vx v8, v8, a1			; RV32-NEXT: vsrl.vx v8, v8, a1
	; RV32-NEXT: vmv.x.s a1, v8			; RV32-NEXT: vmv.x.s a1, v8
	; RV32-NEXT: addi sp, sp, 16			; RV32-NEXT: addi sp, sp, 16
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: vreduce_smin_v2i64:			; RV64-LABEL: vreduce_smin_v2i64:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: vsetivli zero, 2, e64, m1, ta, ma			; RV64-NEXT: vsetivli zero, 2, e64, m1, ta, ma
	; RV64-NEXT: vle64.v v8, (a0)			; RV64-NEXT: vle64.v v8, (a0)
	; RV64-NEXT: li a0, -1			; RV64-NEXT: li a0, -1
	; RV64-NEXT: srli a0, a0, 1			; RV64-NEXT: srli a0, a0, 1
	; RV64-NEXT: vmv.s.x v9, a0			; RV64-NEXT: vmv.v.x v9, a0
	; RV64-NEXT: vredmin.vs v8, v8, v9			; RV64-NEXT: vredmin.vs v8, v8, v9
	; RV64-NEXT: vmv.x.s a0, v8			; RV64-NEXT: vmv.x.s a0, v8
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%v = load <2 x i64>, <2 x i64>* %x			%v = load <2 x i64>, <2 x i64>* %x
	%red = call i64 @llvm.vector.reduce.smin.v2i64(<2 x i64> %v)			%red = call i64 @llvm.vector.reduce.smin.v2i64(<2 x i64> %v)
	ret i64 %red			ret i64 %red
	}			}

	▲ Show 20 Lines • Show All 247 Lines • ▼ Show 20 Lines
	declare i8 @llvm.vector.reduce.smax.v2i8(<2 x i8>)			declare i8 @llvm.vector.reduce.smax.v2i8(<2 x i8>)

	define i8 @vreduce_smax_v2i8(<2 x i8>* %x) {			define i8 @vreduce_smax_v2i8(<2 x i8>* %x) {
	; CHECK-LABEL: vreduce_smax_v2i8:			; CHECK-LABEL: vreduce_smax_v2i8:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 2, e8, mf8, ta, ma			; CHECK-NEXT: vsetivli zero, 2, e8, mf8, ta, ma
	; CHECK-NEXT: vle8.v v8, (a0)			; CHECK-NEXT: vle8.v v8, (a0)
	; CHECK-NEXT: li a0, -128			; CHECK-NEXT: li a0, -128
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.v.x v9, a0
	; CHECK-NEXT: vredmax.vs v8, v8, v9			; CHECK-NEXT: vredmax.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%v = load <2 x i8>, <2 x i8>* %x			%v = load <2 x i8>, <2 x i8>* %x
	%red = call i8 @llvm.vector.reduce.smax.v2i8(<2 x i8> %v)			%red = call i8 @llvm.vector.reduce.smax.v2i8(<2 x i8> %v)
	ret i8 %red			ret i8 %red
	}			}

	declare i8 @llvm.vector.reduce.smax.v4i8(<4 x i8>)			declare i8 @llvm.vector.reduce.smax.v4i8(<4 x i8>)

	define i8 @vreduce_smax_v4i8(<4 x i8>* %x) {			define i8 @vreduce_smax_v4i8(<4 x i8>* %x) {
	; CHECK-LABEL: vreduce_smax_v4i8:			; CHECK-LABEL: vreduce_smax_v4i8:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 4, e8, mf4, ta, ma			; CHECK-NEXT: vsetivli zero, 4, e8, mf4, ta, ma
	; CHECK-NEXT: vle8.v v8, (a0)			; CHECK-NEXT: vle8.v v8, (a0)
	; CHECK-NEXT: li a0, -128			; CHECK-NEXT: li a0, -128
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.v.x v9, a0
	; CHECK-NEXT: vredmax.vs v8, v8, v9			; CHECK-NEXT: vredmax.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%v = load <4 x i8>, <4 x i8>* %x			%v = load <4 x i8>, <4 x i8>* %x
	%red = call i8 @llvm.vector.reduce.smax.v4i8(<4 x i8> %v)			%red = call i8 @llvm.vector.reduce.smax.v4i8(<4 x i8> %v)
	ret i8 %red			ret i8 %red
	}			}

	declare i8 @llvm.vector.reduce.smax.v8i8(<8 x i8>)			declare i8 @llvm.vector.reduce.smax.v8i8(<8 x i8>)

	define i8 @vreduce_smax_v8i8(<8 x i8>* %x) {			define i8 @vreduce_smax_v8i8(<8 x i8>* %x) {
	; CHECK-LABEL: vreduce_smax_v8i8:			; CHECK-LABEL: vreduce_smax_v8i8:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, ma			; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, ma
	; CHECK-NEXT: vle8.v v8, (a0)			; CHECK-NEXT: vle8.v v8, (a0)
	; CHECK-NEXT: li a0, -128			; CHECK-NEXT: li a0, -128
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.v.x v9, a0
	; CHECK-NEXT: vredmax.vs v8, v8, v9			; CHECK-NEXT: vredmax.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%v = load <8 x i8>, <8 x i8>* %x			%v = load <8 x i8>, <8 x i8>* %x
	%red = call i8 @llvm.vector.reduce.smax.v8i8(<8 x i8> %v)			%red = call i8 @llvm.vector.reduce.smax.v8i8(<8 x i8> %v)
	ret i8 %red			ret i8 %red
	}			}

	declare i8 @llvm.vector.reduce.smax.v16i8(<16 x i8>)			declare i8 @llvm.vector.reduce.smax.v16i8(<16 x i8>)

	define i8 @vreduce_smax_v16i8(<16 x i8>* %x) {			define i8 @vreduce_smax_v16i8(<16 x i8>* %x) {
	; CHECK-LABEL: vreduce_smax_v16i8:			; CHECK-LABEL: vreduce_smax_v16i8:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 16, e8, m1, ta, ma			; CHECK-NEXT: vsetivli zero, 16, e8, m1, ta, ma
	; CHECK-NEXT: vle8.v v8, (a0)			; CHECK-NEXT: vle8.v v8, (a0)
	; CHECK-NEXT: li a0, -128			; CHECK-NEXT: li a0, -128
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.v.x v9, a0
	; CHECK-NEXT: vredmax.vs v8, v8, v9			; CHECK-NEXT: vredmax.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%v = load <16 x i8>, <16 x i8>* %x			%v = load <16 x i8>, <16 x i8>* %x
	%red = call i8 @llvm.vector.reduce.smax.v16i8(<16 x i8> %v)			%red = call i8 @llvm.vector.reduce.smax.v16i8(<16 x i8> %v)
	ret i8 %red			ret i8 %red
	}			}

	▲ Show 20 Lines • Show All 97 Lines • ▼ Show 20 Lines
	declare i16 @llvm.vector.reduce.smax.v2i16(<2 x i16>)			declare i16 @llvm.vector.reduce.smax.v2i16(<2 x i16>)

	define i16 @vreduce_smax_v2i16(<2 x i16>* %x) {			define i16 @vreduce_smax_v2i16(<2 x i16>* %x) {
	; CHECK-LABEL: vreduce_smax_v2i16:			; CHECK-LABEL: vreduce_smax_v2i16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 2, e16, mf4, ta, ma			; CHECK-NEXT: vsetivli zero, 2, e16, mf4, ta, ma
	; CHECK-NEXT: vle16.v v8, (a0)			; CHECK-NEXT: vle16.v v8, (a0)
	; CHECK-NEXT: lui a0, 1048568			; CHECK-NEXT: lui a0, 1048568
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.v.x v9, a0
	; CHECK-NEXT: vredmax.vs v8, v8, v9			; CHECK-NEXT: vredmax.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%v = load <2 x i16>, <2 x i16>* %x			%v = load <2 x i16>, <2 x i16>* %x
	%red = call i16 @llvm.vector.reduce.smax.v2i16(<2 x i16> %v)			%red = call i16 @llvm.vector.reduce.smax.v2i16(<2 x i16> %v)
	ret i16 %red			ret i16 %red
	}			}

	declare i16 @llvm.vector.reduce.smax.v4i16(<4 x i16>)			declare i16 @llvm.vector.reduce.smax.v4i16(<4 x i16>)

	define i16 @vreduce_smax_v4i16(<4 x i16>* %x) {			define i16 @vreduce_smax_v4i16(<4 x i16>* %x) {
	; CHECK-LABEL: vreduce_smax_v4i16:			; CHECK-LABEL: vreduce_smax_v4i16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, ma			; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
	; CHECK-NEXT: vle16.v v8, (a0)			; CHECK-NEXT: vle16.v v8, (a0)
	; CHECK-NEXT: lui a0, 1048568			; CHECK-NEXT: lui a0, 1048568
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.v.x v9, a0
	; CHECK-NEXT: vredmax.vs v8, v8, v9			; CHECK-NEXT: vredmax.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%v = load <4 x i16>, <4 x i16>* %x			%v = load <4 x i16>, <4 x i16>* %x
	%red = call i16 @llvm.vector.reduce.smax.v4i16(<4 x i16> %v)			%red = call i16 @llvm.vector.reduce.smax.v4i16(<4 x i16> %v)
	ret i16 %red			ret i16 %red
	}			}

	declare i16 @llvm.vector.reduce.smax.v8i16(<8 x i16>)			declare i16 @llvm.vector.reduce.smax.v8i16(<8 x i16>)

	define i16 @vreduce_smax_v8i16(<8 x i16>* %x) {			define i16 @vreduce_smax_v8i16(<8 x i16>* %x) {
	; CHECK-LABEL: vreduce_smax_v8i16:			; CHECK-LABEL: vreduce_smax_v8i16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 8, e16, m1, ta, ma			; CHECK-NEXT: vsetivli zero, 8, e16, m1, ta, ma
	; CHECK-NEXT: vle16.v v8, (a0)			; CHECK-NEXT: vle16.v v8, (a0)
	; CHECK-NEXT: lui a0, 1048568			; CHECK-NEXT: lui a0, 1048568
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.v.x v9, a0
	; CHECK-NEXT: vredmax.vs v8, v8, v9			; CHECK-NEXT: vredmax.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%v = load <8 x i16>, <8 x i16>* %x			%v = load <8 x i16>, <8 x i16>* %x
	%red = call i16 @llvm.vector.reduce.smax.v8i16(<8 x i16> %v)			%red = call i16 @llvm.vector.reduce.smax.v8i16(<8 x i16> %v)
	ret i16 %red			ret i16 %red
	}			}

	▲ Show 20 Lines • Show All 94 Lines • ▼ Show 20 Lines
	declare i32 @llvm.vector.reduce.smax.v2i32(<2 x i32>)			declare i32 @llvm.vector.reduce.smax.v2i32(<2 x i32>)

	define i32 @vreduce_smax_v2i32(<2 x i32>* %x) {			define i32 @vreduce_smax_v2i32(<2 x i32>* %x) {
	; CHECK-LABEL: vreduce_smax_v2i32:			; CHECK-LABEL: vreduce_smax_v2i32:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 2, e32, mf2, ta, ma			; CHECK-NEXT: vsetivli zero, 2, e32, mf2, ta, ma
	; CHECK-NEXT: vle32.v v8, (a0)			; CHECK-NEXT: vle32.v v8, (a0)
	; CHECK-NEXT: lui a0, 524288			; CHECK-NEXT: lui a0, 524288
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.v.x v9, a0
	; CHECK-NEXT: vredmax.vs v8, v8, v9			; CHECK-NEXT: vredmax.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%v = load <2 x i32>, <2 x i32>* %x			%v = load <2 x i32>, <2 x i32>* %x
	%red = call i32 @llvm.vector.reduce.smax.v2i32(<2 x i32> %v)			%red = call i32 @llvm.vector.reduce.smax.v2i32(<2 x i32> %v)
	ret i32 %red			ret i32 %red
	}			}

	declare i32 @llvm.vector.reduce.smax.v4i32(<4 x i32>)			declare i32 @llvm.vector.reduce.smax.v4i32(<4 x i32>)

	define i32 @vreduce_smax_v4i32(<4 x i32>* %x) {			define i32 @vreduce_smax_v4i32(<4 x i32>* %x) {
	; CHECK-LABEL: vreduce_smax_v4i32:			; CHECK-LABEL: vreduce_smax_v4i32:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma			; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
	; CHECK-NEXT: vle32.v v8, (a0)			; CHECK-NEXT: vle32.v v8, (a0)
	; CHECK-NEXT: lui a0, 524288			; CHECK-NEXT: lui a0, 524288
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.v.x v9, a0
	; CHECK-NEXT: vredmax.vs v8, v8, v9			; CHECK-NEXT: vredmax.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%v = load <4 x i32>, <4 x i32>* %x			%v = load <4 x i32>, <4 x i32>* %x
	%red = call i32 @llvm.vector.reduce.smax.v4i32(<4 x i32> %v)			%red = call i32 @llvm.vector.reduce.smax.v4i32(<4 x i32> %v)
	ret i32 %red			ret i32 %red
	}			}

	▲ Show 20 Lines • Show All 106 Lines • ▼ Show 20 Lines
	; RV32-NEXT: addi sp, sp, -16			; RV32-NEXT: addi sp, sp, -16
	; RV32-NEXT: .cfi_def_cfa_offset 16			; RV32-NEXT: .cfi_def_cfa_offset 16
	; RV32-NEXT: vsetivli zero, 2, e64, m1, ta, ma			; RV32-NEXT: vsetivli zero, 2, e64, m1, ta, ma
	; RV32-NEXT: vle64.v v8, (a0)			; RV32-NEXT: vle64.v v8, (a0)
	; RV32-NEXT: lui a0, 524288			; RV32-NEXT: lui a0, 524288
	; RV32-NEXT: sw a0, 12(sp)			; RV32-NEXT: sw a0, 12(sp)
	; RV32-NEXT: sw zero, 8(sp)			; RV32-NEXT: sw zero, 8(sp)
	; RV32-NEXT: addi a0, sp, 8			; RV32-NEXT: addi a0, sp, 8
	; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma
	; RV32-NEXT: vlse64.v v9, (a0), zero			; RV32-NEXT: vlse64.v v9, (a0), zero
	; RV32-NEXT: vsetivli zero, 2, e64, m1, ta, ma
	; RV32-NEXT: vredmax.vs v8, v8, v9			; RV32-NEXT: vredmax.vs v8, v8, v9
	; RV32-NEXT: vmv.x.s a0, v8			; RV32-NEXT: vmv.x.s a0, v8
	; RV32-NEXT: li a1, 32			; RV32-NEXT: li a1, 32
	; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma
	; RV32-NEXT: vsrl.vx v8, v8, a1			; RV32-NEXT: vsrl.vx v8, v8, a1
	; RV32-NEXT: vmv.x.s a1, v8			; RV32-NEXT: vmv.x.s a1, v8
	; RV32-NEXT: addi sp, sp, 16			; RV32-NEXT: addi sp, sp, 16
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: vreduce_smax_v2i64:			; RV64-LABEL: vreduce_smax_v2i64:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: vsetivli zero, 2, e64, m1, ta, ma			; RV64-NEXT: vsetivli zero, 2, e64, m1, ta, ma
	; RV64-NEXT: vle64.v v8, (a0)			; RV64-NEXT: vle64.v v8, (a0)
	; RV64-NEXT: li a0, -1			; RV64-NEXT: li a0, -1
	; RV64-NEXT: slli a0, a0, 63			; RV64-NEXT: slli a0, a0, 63
	; RV64-NEXT: vmv.s.x v9, a0			; RV64-NEXT: vmv.v.x v9, a0
	; RV64-NEXT: vredmax.vs v8, v8, v9			; RV64-NEXT: vredmax.vs v8, v8, v9
	; RV64-NEXT: vmv.x.s a0, v8			; RV64-NEXT: vmv.x.s a0, v8
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%v = load <2 x i64>, <2 x i64>* %x			%v = load <2 x i64>, <2 x i64>* %x
	%red = call i64 @llvm.vector.reduce.smax.v2i64(<2 x i64> %v)			%red = call i64 @llvm.vector.reduce.smax.v2i64(<2 x i64> %v)
	ret i64 %red			ret i64 %red
	}			}

	▲ Show 20 Lines • Show All 236 Lines • ▼ Show 20 Lines

	declare i8 @llvm.vector.reduce.umin.v2i8(<2 x i8>)			declare i8 @llvm.vector.reduce.umin.v2i8(<2 x i8>)

	define i8 @vreduce_umin_v2i8(<2 x i8>* %x) {			define i8 @vreduce_umin_v2i8(<2 x i8>* %x) {
	; CHECK-LABEL: vreduce_umin_v2i8:			; CHECK-LABEL: vreduce_umin_v2i8:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 2, e8, mf8, ta, ma			; CHECK-NEXT: vsetivli zero, 2, e8, mf8, ta, ma
	; CHECK-NEXT: vle8.v v8, (a0)			; CHECK-NEXT: vle8.v v8, (a0)
	; CHECK-NEXT: vsetivli zero, 1, e8, m1, ta, ma
	; CHECK-NEXT: vmv.v.i v9, -1			; CHECK-NEXT: vmv.v.i v9, -1
	; CHECK-NEXT: vsetivli zero, 2, e8, mf8, ta, ma
	; CHECK-NEXT: vredminu.vs v8, v8, v9			; CHECK-NEXT: vredminu.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%v = load <2 x i8>, <2 x i8>* %x			%v = load <2 x i8>, <2 x i8>* %x
	%red = call i8 @llvm.vector.reduce.umin.v2i8(<2 x i8> %v)			%red = call i8 @llvm.vector.reduce.umin.v2i8(<2 x i8> %v)
	ret i8 %red			ret i8 %red
	}			}

	declare i8 @llvm.vector.reduce.umin.v4i8(<4 x i8>)			declare i8 @llvm.vector.reduce.umin.v4i8(<4 x i8>)

	define i8 @vreduce_umin_v4i8(<4 x i8>* %x) {			define i8 @vreduce_umin_v4i8(<4 x i8>* %x) {
	; CHECK-LABEL: vreduce_umin_v4i8:			; CHECK-LABEL: vreduce_umin_v4i8:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 4, e8, mf4, ta, ma			; CHECK-NEXT: vsetivli zero, 4, e8, mf4, ta, ma
	; CHECK-NEXT: vle8.v v8, (a0)			; CHECK-NEXT: vle8.v v8, (a0)
	; CHECK-NEXT: vsetivli zero, 1, e8, m1, ta, ma
	; CHECK-NEXT: vmv.v.i v9, -1			; CHECK-NEXT: vmv.v.i v9, -1
	; CHECK-NEXT: vsetivli zero, 4, e8, mf4, ta, ma
	; CHECK-NEXT: vredminu.vs v8, v8, v9			; CHECK-NEXT: vredminu.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%v = load <4 x i8>, <4 x i8>* %x			%v = load <4 x i8>, <4 x i8>* %x
	%red = call i8 @llvm.vector.reduce.umin.v4i8(<4 x i8> %v)			%red = call i8 @llvm.vector.reduce.umin.v4i8(<4 x i8> %v)
	ret i8 %red			ret i8 %red
	}			}

	declare i8 @llvm.vector.reduce.umin.v8i8(<8 x i8>)			declare i8 @llvm.vector.reduce.umin.v8i8(<8 x i8>)

	define i8 @vreduce_umin_v8i8(<8 x i8>* %x) {			define i8 @vreduce_umin_v8i8(<8 x i8>* %x) {
	; CHECK-LABEL: vreduce_umin_v8i8:			; CHECK-LABEL: vreduce_umin_v8i8:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, ma			; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, ma
	; CHECK-NEXT: vle8.v v8, (a0)			; CHECK-NEXT: vle8.v v8, (a0)
	; CHECK-NEXT: vsetivli zero, 1, e8, m1, ta, ma
	; CHECK-NEXT: vmv.v.i v9, -1			; CHECK-NEXT: vmv.v.i v9, -1
	; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, ma
	; CHECK-NEXT: vredminu.vs v8, v8, v9			; CHECK-NEXT: vredminu.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%v = load <8 x i8>, <8 x i8>* %x			%v = load <8 x i8>, <8 x i8>* %x
	%red = call i8 @llvm.vector.reduce.umin.v8i8(<8 x i8> %v)			%red = call i8 @llvm.vector.reduce.umin.v8i8(<8 x i8> %v)
	ret i8 %red			ret i8 %red
	}			}

	declare i8 @llvm.vector.reduce.umin.v16i8(<16 x i8>)			declare i8 @llvm.vector.reduce.umin.v16i8(<16 x i8>)

	define i8 @vreduce_umin_v16i8(<16 x i8>* %x) {			define i8 @vreduce_umin_v16i8(<16 x i8>* %x) {
	; CHECK-LABEL: vreduce_umin_v16i8:			; CHECK-LABEL: vreduce_umin_v16i8:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 16, e8, m1, ta, ma			; CHECK-NEXT: vsetivli zero, 16, e8, m1, ta, ma
	; CHECK-NEXT: vle8.v v8, (a0)			; CHECK-NEXT: vle8.v v8, (a0)
	; CHECK-NEXT: vsetivli zero, 1, e8, m1, ta, ma
	; CHECK-NEXT: vmv.v.i v9, -1			; CHECK-NEXT: vmv.v.i v9, -1
	; CHECK-NEXT: vsetivli zero, 16, e8, m1, ta, ma
	; CHECK-NEXT: vredminu.vs v8, v8, v9			; CHECK-NEXT: vredminu.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%v = load <16 x i8>, <16 x i8>* %x			%v = load <16 x i8>, <16 x i8>* %x
	%red = call i8 @llvm.vector.reduce.umin.v16i8(<16 x i8> %v)			%red = call i8 @llvm.vector.reduce.umin.v16i8(<16 x i8> %v)
	ret i8 %red			ret i8 %red
	}			}

	▲ Show 20 Lines • Show All 92 Lines • ▼ Show 20 Lines

	declare i16 @llvm.vector.reduce.umin.v2i16(<2 x i16>)			declare i16 @llvm.vector.reduce.umin.v2i16(<2 x i16>)

	define i16 @vreduce_umin_v2i16(<2 x i16>* %x) {			define i16 @vreduce_umin_v2i16(<2 x i16>* %x) {
	; CHECK-LABEL: vreduce_umin_v2i16:			; CHECK-LABEL: vreduce_umin_v2i16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 2, e16, mf4, ta, ma			; CHECK-NEXT: vsetivli zero, 2, e16, mf4, ta, ma
	; CHECK-NEXT: vle16.v v8, (a0)			; CHECK-NEXT: vle16.v v8, (a0)
	; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma
	; CHECK-NEXT: vmv.v.i v9, -1			; CHECK-NEXT: vmv.v.i v9, -1
	; CHECK-NEXT: vsetivli zero, 2, e16, mf4, ta, ma
	; CHECK-NEXT: vredminu.vs v8, v8, v9			; CHECK-NEXT: vredminu.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%v = load <2 x i16>, <2 x i16>* %x			%v = load <2 x i16>, <2 x i16>* %x
	%red = call i16 @llvm.vector.reduce.umin.v2i16(<2 x i16> %v)			%red = call i16 @llvm.vector.reduce.umin.v2i16(<2 x i16> %v)
	ret i16 %red			ret i16 %red
	}			}

	declare i16 @llvm.vector.reduce.umin.v4i16(<4 x i16>)			declare i16 @llvm.vector.reduce.umin.v4i16(<4 x i16>)

	define i16 @vreduce_umin_v4i16(<4 x i16>* %x) {			define i16 @vreduce_umin_v4i16(<4 x i16>* %x) {
	; CHECK-LABEL: vreduce_umin_v4i16:			; CHECK-LABEL: vreduce_umin_v4i16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, ma			; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
	; CHECK-NEXT: vle16.v v8, (a0)			; CHECK-NEXT: vle16.v v8, (a0)
	; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma
	; CHECK-NEXT: vmv.v.i v9, -1			; CHECK-NEXT: vmv.v.i v9, -1
	; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
	; CHECK-NEXT: vredminu.vs v8, v8, v9			; CHECK-NEXT: vredminu.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%v = load <4 x i16>, <4 x i16>* %x			%v = load <4 x i16>, <4 x i16>* %x
	%red = call i16 @llvm.vector.reduce.umin.v4i16(<4 x i16> %v)			%red = call i16 @llvm.vector.reduce.umin.v4i16(<4 x i16> %v)
	ret i16 %red			ret i16 %red
	}			}

	declare i16 @llvm.vector.reduce.umin.v8i16(<8 x i16>)			declare i16 @llvm.vector.reduce.umin.v8i16(<8 x i16>)

	define i16 @vreduce_umin_v8i16(<8 x i16>* %x) {			define i16 @vreduce_umin_v8i16(<8 x i16>* %x) {
	; CHECK-LABEL: vreduce_umin_v8i16:			; CHECK-LABEL: vreduce_umin_v8i16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 8, e16, m1, ta, ma			; CHECK-NEXT: vsetivli zero, 8, e16, m1, ta, ma
	; CHECK-NEXT: vle16.v v8, (a0)			; CHECK-NEXT: vle16.v v8, (a0)
	; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma
	; CHECK-NEXT: vmv.v.i v9, -1			; CHECK-NEXT: vmv.v.i v9, -1
	; CHECK-NEXT: vsetivli zero, 8, e16, m1, ta, ma
	; CHECK-NEXT: vredminu.vs v8, v8, v9			; CHECK-NEXT: vredminu.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%v = load <8 x i16>, <8 x i16>* %x			%v = load <8 x i16>, <8 x i16>* %x
	%red = call i16 @llvm.vector.reduce.umin.v8i16(<8 x i16> %v)			%red = call i16 @llvm.vector.reduce.umin.v8i16(<8 x i16> %v)
	ret i16 %red			ret i16 %red
	}			}

	▲ Show 20 Lines • Show All 91 Lines • ▼ Show 20 Lines

	declare i32 @llvm.vector.reduce.umin.v2i32(<2 x i32>)			declare i32 @llvm.vector.reduce.umin.v2i32(<2 x i32>)

	define i32 @vreduce_umin_v2i32(<2 x i32>* %x) {			define i32 @vreduce_umin_v2i32(<2 x i32>* %x) {
	; CHECK-LABEL: vreduce_umin_v2i32:			; CHECK-LABEL: vreduce_umin_v2i32:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 2, e32, mf2, ta, ma			; CHECK-NEXT: vsetivli zero, 2, e32, mf2, ta, ma
	; CHECK-NEXT: vle32.v v8, (a0)			; CHECK-NEXT: vle32.v v8, (a0)
	; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma
	; CHECK-NEXT: vmv.v.i v9, -1			; CHECK-NEXT: vmv.v.i v9, -1
	; CHECK-NEXT: vsetivli zero, 2, e32, mf2, ta, ma
	; CHECK-NEXT: vredminu.vs v8, v8, v9			; CHECK-NEXT: vredminu.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%v = load <2 x i32>, <2 x i32>* %x			%v = load <2 x i32>, <2 x i32>* %x
	%red = call i32 @llvm.vector.reduce.umin.v2i32(<2 x i32> %v)			%red = call i32 @llvm.vector.reduce.umin.v2i32(<2 x i32> %v)
	ret i32 %red			ret i32 %red
	}			}

	declare i32 @llvm.vector.reduce.umin.v4i32(<4 x i32>)			declare i32 @llvm.vector.reduce.umin.v4i32(<4 x i32>)

	define i32 @vreduce_umin_v4i32(<4 x i32>* %x) {			define i32 @vreduce_umin_v4i32(<4 x i32>* %x) {
	; CHECK-LABEL: vreduce_umin_v4i32:			; CHECK-LABEL: vreduce_umin_v4i32:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma			; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
	; CHECK-NEXT: vle32.v v8, (a0)			; CHECK-NEXT: vle32.v v8, (a0)
	; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma
	; CHECK-NEXT: vmv.v.i v9, -1			; CHECK-NEXT: vmv.v.i v9, -1
	; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
	; CHECK-NEXT: vredminu.vs v8, v8, v9			; CHECK-NEXT: vredminu.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%v = load <4 x i32>, <4 x i32>* %x			%v = load <4 x i32>, <4 x i32>* %x
	%red = call i32 @llvm.vector.reduce.umin.v4i32(<4 x i32> %v)			%red = call i32 @llvm.vector.reduce.umin.v4i32(<4 x i32> %v)
	ret i32 %red			ret i32 %red
	}			}

	▲ Show 20 Lines • Show All 100 Lines • ▼ Show 20 Lines

	declare i64 @llvm.vector.reduce.umin.v2i64(<2 x i64>)			declare i64 @llvm.vector.reduce.umin.v2i64(<2 x i64>)

	define i64 @vreduce_umin_v2i64(<2 x i64>* %x) {			define i64 @vreduce_umin_v2i64(<2 x i64>* %x) {
	; RV32-LABEL: vreduce_umin_v2i64:			; RV32-LABEL: vreduce_umin_v2i64:
	; RV32: # %bb.0:			; RV32: # %bb.0:
	; RV32-NEXT: vsetivli zero, 2, e64, m1, ta, ma			; RV32-NEXT: vsetivli zero, 2, e64, m1, ta, ma
	; RV32-NEXT: vle64.v v8, (a0)			; RV32-NEXT: vle64.v v8, (a0)
	; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma
	; RV32-NEXT: vmv.v.i v9, -1			; RV32-NEXT: vmv.v.i v9, -1
	; RV32-NEXT: vsetivli zero, 2, e64, m1, ta, ma
	; RV32-NEXT: vredminu.vs v8, v8, v9			; RV32-NEXT: vredminu.vs v8, v8, v9
	; RV32-NEXT: vmv.x.s a0, v8			; RV32-NEXT: vmv.x.s a0, v8
	; RV32-NEXT: li a1, 32			; RV32-NEXT: li a1, 32
	; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma
	; RV32-NEXT: vsrl.vx v8, v8, a1			; RV32-NEXT: vsrl.vx v8, v8, a1
	; RV32-NEXT: vmv.x.s a1, v8			; RV32-NEXT: vmv.x.s a1, v8
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: vreduce_umin_v2i64:			; RV64-LABEL: vreduce_umin_v2i64:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: vsetivli zero, 2, e64, m1, ta, ma			; RV64-NEXT: vsetivli zero, 2, e64, m1, ta, ma
	; RV64-NEXT: vle64.v v8, (a0)			; RV64-NEXT: vle64.v v8, (a0)
	; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma
	; RV64-NEXT: vmv.v.i v9, -1			; RV64-NEXT: vmv.v.i v9, -1
	; RV64-NEXT: vsetivli zero, 2, e64, m1, ta, ma
	; RV64-NEXT: vredminu.vs v8, v8, v9			; RV64-NEXT: vredminu.vs v8, v8, v9
	; RV64-NEXT: vmv.x.s a0, v8			; RV64-NEXT: vmv.x.s a0, v8
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%v = load <2 x i64>, <2 x i64>* %x			%v = load <2 x i64>, <2 x i64>* %x
	%red = call i64 @llvm.vector.reduce.umin.v2i64(<2 x i64> %v)			%red = call i64 @llvm.vector.reduce.umin.v2i64(<2 x i64> %v)
	ret i64 %red			ret i64 %red
	}			}

	▲ Show 20 Lines • Show All 202 Lines • ▼ Show 20 Lines

	declare i8 @llvm.vector.reduce.umax.v2i8(<2 x i8>)			declare i8 @llvm.vector.reduce.umax.v2i8(<2 x i8>)

	define i8 @vreduce_umax_v2i8(<2 x i8>* %x) {			define i8 @vreduce_umax_v2i8(<2 x i8>* %x) {
	; CHECK-LABEL: vreduce_umax_v2i8:			; CHECK-LABEL: vreduce_umax_v2i8:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 2, e8, mf8, ta, ma			; CHECK-NEXT: vsetivli zero, 2, e8, mf8, ta, ma
	; CHECK-NEXT: vle8.v v8, (a0)			; CHECK-NEXT: vle8.v v8, (a0)
	; CHECK-NEXT: vmv.s.x v9, zero			; CHECK-NEXT: vmv.v.i v9, 0
	; CHECK-NEXT: vredmaxu.vs v8, v8, v9			; CHECK-NEXT: vredmaxu.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%v = load <2 x i8>, <2 x i8>* %x			%v = load <2 x i8>, <2 x i8>* %x
	%red = call i8 @llvm.vector.reduce.umax.v2i8(<2 x i8> %v)			%red = call i8 @llvm.vector.reduce.umax.v2i8(<2 x i8> %v)
	ret i8 %red			ret i8 %red
	}			}

	declare i8 @llvm.vector.reduce.umax.v4i8(<4 x i8>)			declare i8 @llvm.vector.reduce.umax.v4i8(<4 x i8>)

	define i8 @vreduce_umax_v4i8(<4 x i8>* %x) {			define i8 @vreduce_umax_v4i8(<4 x i8>* %x) {
	; CHECK-LABEL: vreduce_umax_v4i8:			; CHECK-LABEL: vreduce_umax_v4i8:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 4, e8, mf4, ta, ma			; CHECK-NEXT: vsetivli zero, 4, e8, mf4, ta, ma
	; CHECK-NEXT: vle8.v v8, (a0)			; CHECK-NEXT: vle8.v v8, (a0)
	; CHECK-NEXT: vmv.s.x v9, zero			; CHECK-NEXT: vmv.v.i v9, 0
	; CHECK-NEXT: vredmaxu.vs v8, v8, v9			; CHECK-NEXT: vredmaxu.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%v = load <4 x i8>, <4 x i8>* %x			%v = load <4 x i8>, <4 x i8>* %x
	%red = call i8 @llvm.vector.reduce.umax.v4i8(<4 x i8> %v)			%red = call i8 @llvm.vector.reduce.umax.v4i8(<4 x i8> %v)
	ret i8 %red			ret i8 %red
	}			}

	declare i8 @llvm.vector.reduce.umax.v8i8(<8 x i8>)			declare i8 @llvm.vector.reduce.umax.v8i8(<8 x i8>)

	define i8 @vreduce_umax_v8i8(<8 x i8>* %x) {			define i8 @vreduce_umax_v8i8(<8 x i8>* %x) {
	; CHECK-LABEL: vreduce_umax_v8i8:			; CHECK-LABEL: vreduce_umax_v8i8:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, ma			; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, ma
	; CHECK-NEXT: vle8.v v8, (a0)			; CHECK-NEXT: vle8.v v8, (a0)
	; CHECK-NEXT: vmv.s.x v9, zero			; CHECK-NEXT: vmv.v.i v9, 0
	; CHECK-NEXT: vredmaxu.vs v8, v8, v9			; CHECK-NEXT: vredmaxu.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%v = load <8 x i8>, <8 x i8>* %x			%v = load <8 x i8>, <8 x i8>* %x
	%red = call i8 @llvm.vector.reduce.umax.v8i8(<8 x i8> %v)			%red = call i8 @llvm.vector.reduce.umax.v8i8(<8 x i8> %v)
	ret i8 %red			ret i8 %red
	}			}

	declare i8 @llvm.vector.reduce.umax.v16i8(<16 x i8>)			declare i8 @llvm.vector.reduce.umax.v16i8(<16 x i8>)

	define i8 @vreduce_umax_v16i8(<16 x i8>* %x) {			define i8 @vreduce_umax_v16i8(<16 x i8>* %x) {
	; CHECK-LABEL: vreduce_umax_v16i8:			; CHECK-LABEL: vreduce_umax_v16i8:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 16, e8, m1, ta, ma			; CHECK-NEXT: vsetivli zero, 16, e8, m1, ta, ma
	; CHECK-NEXT: vle8.v v8, (a0)			; CHECK-NEXT: vle8.v v8, (a0)
	; CHECK-NEXT: vmv.s.x v9, zero			; CHECK-NEXT: vmv.v.i v9, 0
	; CHECK-NEXT: vredmaxu.vs v8, v8, v9			; CHECK-NEXT: vredmaxu.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%v = load <16 x i8>, <16 x i8>* %x			%v = load <16 x i8>, <16 x i8>* %x
	%red = call i8 @llvm.vector.reduce.umax.v16i8(<16 x i8> %v)			%red = call i8 @llvm.vector.reduce.umax.v16i8(<16 x i8> %v)
	ret i8 %red			ret i8 %red
	}			}

	▲ Show 20 Lines • Show All 92 Lines • ▼ Show 20 Lines

	declare i16 @llvm.vector.reduce.umax.v2i16(<2 x i16>)			declare i16 @llvm.vector.reduce.umax.v2i16(<2 x i16>)

	define i16 @vreduce_umax_v2i16(<2 x i16>* %x) {			define i16 @vreduce_umax_v2i16(<2 x i16>* %x) {
	; CHECK-LABEL: vreduce_umax_v2i16:			; CHECK-LABEL: vreduce_umax_v2i16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 2, e16, mf4, ta, ma			; CHECK-NEXT: vsetivli zero, 2, e16, mf4, ta, ma
	; CHECK-NEXT: vle16.v v8, (a0)			; CHECK-NEXT: vle16.v v8, (a0)
	; CHECK-NEXT: vmv.s.x v9, zero			; CHECK-NEXT: vmv.v.i v9, 0
	; CHECK-NEXT: vredmaxu.vs v8, v8, v9			; CHECK-NEXT: vredmaxu.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%v = load <2 x i16>, <2 x i16>* %x			%v = load <2 x i16>, <2 x i16>* %x
	%red = call i16 @llvm.vector.reduce.umax.v2i16(<2 x i16> %v)			%red = call i16 @llvm.vector.reduce.umax.v2i16(<2 x i16> %v)
	ret i16 %red			ret i16 %red
	}			}

	declare i16 @llvm.vector.reduce.umax.v4i16(<4 x i16>)			declare i16 @llvm.vector.reduce.umax.v4i16(<4 x i16>)

	define i16 @vreduce_umax_v4i16(<4 x i16>* %x) {			define i16 @vreduce_umax_v4i16(<4 x i16>* %x) {
	; CHECK-LABEL: vreduce_umax_v4i16:			; CHECK-LABEL: vreduce_umax_v4i16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, ma			; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
	; CHECK-NEXT: vle16.v v8, (a0)			; CHECK-NEXT: vle16.v v8, (a0)
	; CHECK-NEXT: vmv.s.x v9, zero			; CHECK-NEXT: vmv.v.i v9, 0
	; CHECK-NEXT: vredmaxu.vs v8, v8, v9			; CHECK-NEXT: vredmaxu.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%v = load <4 x i16>, <4 x i16>* %x			%v = load <4 x i16>, <4 x i16>* %x
	%red = call i16 @llvm.vector.reduce.umax.v4i16(<4 x i16> %v)			%red = call i16 @llvm.vector.reduce.umax.v4i16(<4 x i16> %v)
	ret i16 %red			ret i16 %red
	}			}

	declare i16 @llvm.vector.reduce.umax.v8i16(<8 x i16>)			declare i16 @llvm.vector.reduce.umax.v8i16(<8 x i16>)

	define i16 @vreduce_umax_v8i16(<8 x i16>* %x) {			define i16 @vreduce_umax_v8i16(<8 x i16>* %x) {
	; CHECK-LABEL: vreduce_umax_v8i16:			; CHECK-LABEL: vreduce_umax_v8i16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 8, e16, m1, ta, ma			; CHECK-NEXT: vsetivli zero, 8, e16, m1, ta, ma
	; CHECK-NEXT: vle16.v v8, (a0)			; CHECK-NEXT: vle16.v v8, (a0)
	; CHECK-NEXT: vmv.s.x v9, zero			; CHECK-NEXT: vmv.v.i v9, 0
	; CHECK-NEXT: vredmaxu.vs v8, v8, v9			; CHECK-NEXT: vredmaxu.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%v = load <8 x i16>, <8 x i16>* %x			%v = load <8 x i16>, <8 x i16>* %x
	%red = call i16 @llvm.vector.reduce.umax.v8i16(<8 x i16> %v)			%red = call i16 @llvm.vector.reduce.umax.v8i16(<8 x i16> %v)
	ret i16 %red			ret i16 %red
	}			}

	▲ Show 20 Lines • Show All 89 Lines • ▼ Show 20 Lines

	declare i32 @llvm.vector.reduce.umax.v2i32(<2 x i32>)			declare i32 @llvm.vector.reduce.umax.v2i32(<2 x i32>)

	define i32 @vreduce_umax_v2i32(<2 x i32>* %x) {			define i32 @vreduce_umax_v2i32(<2 x i32>* %x) {
	; CHECK-LABEL: vreduce_umax_v2i32:			; CHECK-LABEL: vreduce_umax_v2i32:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 2, e32, mf2, ta, ma			; CHECK-NEXT: vsetivli zero, 2, e32, mf2, ta, ma
	; CHECK-NEXT: vle32.v v8, (a0)			; CHECK-NEXT: vle32.v v8, (a0)
	; CHECK-NEXT: vmv.s.x v9, zero			; CHECK-NEXT: vmv.v.i v9, 0
	; CHECK-NEXT: vredmaxu.vs v8, v8, v9			; CHECK-NEXT: vredmaxu.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%v = load <2 x i32>, <2 x i32>* %x			%v = load <2 x i32>, <2 x i32>* %x
	%red = call i32 @llvm.vector.reduce.umax.v2i32(<2 x i32> %v)			%red = call i32 @llvm.vector.reduce.umax.v2i32(<2 x i32> %v)
	ret i32 %red			ret i32 %red
	}			}

	declare i32 @llvm.vector.reduce.umax.v4i32(<4 x i32>)			declare i32 @llvm.vector.reduce.umax.v4i32(<4 x i32>)

	define i32 @vreduce_umax_v4i32(<4 x i32>* %x) {			define i32 @vreduce_umax_v4i32(<4 x i32>* %x) {
	; CHECK-LABEL: vreduce_umax_v4i32:			; CHECK-LABEL: vreduce_umax_v4i32:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma			; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
	; CHECK-NEXT: vle32.v v8, (a0)			; CHECK-NEXT: vle32.v v8, (a0)
	; CHECK-NEXT: vmv.s.x v9, zero			; CHECK-NEXT: vmv.v.i v9, 0
	; CHECK-NEXT: vredmaxu.vs v8, v8, v9			; CHECK-NEXT: vredmaxu.vs v8, v8, v9
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%v = load <4 x i32>, <4 x i32>* %x			%v = load <4 x i32>, <4 x i32>* %x
	%red = call i32 @llvm.vector.reduce.umax.v4i32(<4 x i32> %v)			%red = call i32 @llvm.vector.reduce.umax.v4i32(<4 x i32> %v)
	ret i32 %red			ret i32 %red
	}			}

	▲ Show 20 Lines • Show All 96 Lines • ▼ Show 20 Lines

	declare i64 @llvm.vector.reduce.umax.v2i64(<2 x i64>)			declare i64 @llvm.vector.reduce.umax.v2i64(<2 x i64>)

	define i64 @vreduce_umax_v2i64(<2 x i64>* %x) {			define i64 @vreduce_umax_v2i64(<2 x i64>* %x) {
	; RV32-LABEL: vreduce_umax_v2i64:			; RV32-LABEL: vreduce_umax_v2i64:
	; RV32: # %bb.0:			; RV32: # %bb.0:
	; RV32-NEXT: vsetivli zero, 2, e64, m1, ta, ma			; RV32-NEXT: vsetivli zero, 2, e64, m1, ta, ma
	; RV32-NEXT: vle64.v v8, (a0)			; RV32-NEXT: vle64.v v8, (a0)
	; RV32-NEXT: vmv.s.x v9, zero			; RV32-NEXT: vmv.v.i v9, 0
	; RV32-NEXT: vredmaxu.vs v8, v8, v9			; RV32-NEXT: vredmaxu.vs v8, v8, v9
	; RV32-NEXT: vmv.x.s a0, v8			; RV32-NEXT: vmv.x.s a0, v8
	; RV32-NEXT: li a1, 32			; RV32-NEXT: li a1, 32
	; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma
	; RV32-NEXT: vsrl.vx v8, v8, a1			; RV32-NEXT: vsrl.vx v8, v8, a1
	; RV32-NEXT: vmv.x.s a1, v8			; RV32-NEXT: vmv.x.s a1, v8
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: vreduce_umax_v2i64:			; RV64-LABEL: vreduce_umax_v2i64:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: vsetivli zero, 2, e64, m1, ta, ma			; RV64-NEXT: vsetivli zero, 2, e64, m1, ta, ma
	; RV64-NEXT: vle64.v v8, (a0)			; RV64-NEXT: vle64.v v8, (a0)
	; RV64-NEXT: vmv.s.x v9, zero			; RV64-NEXT: vmv.v.i v9, 0
	; RV64-NEXT: vredmaxu.vs v8, v8, v9			; RV64-NEXT: vredmaxu.vs v8, v8, v9
	; RV64-NEXT: vmv.x.s a0, v8			; RV64-NEXT: vmv.x.s a0, v8
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%v = load <2 x i64>, <2 x i64>* %x			%v = load <2 x i64>, <2 x i64>* %x
	%red = call i64 @llvm.vector.reduce.umax.v2i64(<2 x i64> %v)			%red = call i64 @llvm.vector.reduce.umax.v2i64(<2 x i64> %v)
	ret i64 %red			ret i64 %red
	}			}

	▲ Show 20 Lines • Show All 964 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/rvv/fold-binary-reduce.ll

Show First 20 Lines • Show All 239 Lines • ▼ Show 20 Lines	entry:
%rdx = call i64 @llvm.vector.reduce.smin.v4i64(<4 x i64> %v)		%rdx = call i64 @llvm.vector.reduce.smin.v4i64(<4 x i64> %v)
%res = call i64 @llvm.smin.i64(i64 %rdx, i64 8)		%res = call i64 @llvm.smin.i64(i64 %rdx, i64 8)
ret i64 %res		ret i64 %res
}		}

define float @reduce_fadd(float %x, <4 x float> %v) {		define float @reduce_fadd(float %x, <4 x float> %v) {
; CHECK-LABEL: reduce_fadd:		; CHECK-LABEL: reduce_fadd:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma
; CHECK-NEXT: vfmv.s.f v9, fa0
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
		; CHECK-NEXT: vfmv.s.f v9, fa0
; CHECK-NEXT: vfredusum.vs v8, v8, v9		; CHECK-NEXT: vfredusum.vs v8, v8, v9
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%rdx = call fast float @llvm.vector.reduce.fadd.v4f32(float %x, <4 x float> %v)		%rdx = call fast float @llvm.vector.reduce.fadd.v4f32(float %x, <4 x float> %v)
ret float %rdx		ret float %rdx
}		}

define float @reduce_fadd2(float %x, <4 x float> %v) {		define float @reduce_fadd2(float %x, <4 x float> %v) {
; CHECK-LABEL: reduce_fadd2:		; CHECK-LABEL: reduce_fadd2:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma
; CHECK-NEXT: vfmv.s.f v9, fa0
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
		; CHECK-NEXT: vfmv.s.f v9, fa0
; CHECK-NEXT: vfredusum.vs v8, v8, v9		; CHECK-NEXT: vfredusum.vs v8, v8, v9
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%rdx = call fast float @llvm.vector.reduce.fadd.v4f32(float 0.0, <4 x float> %v)		%rdx = call fast float @llvm.vector.reduce.fadd.v4f32(float 0.0, <4 x float> %v)
%res = fadd fast float %rdx, %x		%res = fadd fast float %rdx, %x
ret float %res		ret float %res
}		}

define float @reduce_fmax(float %x, <4 x float> %v) {		define float @reduce_fmax(float %x, <4 x float> %v) {
; CHECK-LABEL: reduce_fmax:		; CHECK-LABEL: reduce_fmax:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma
; CHECK-NEXT: vfmv.s.f v9, fa0
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
		; CHECK-NEXT: vfmv.s.f v9, fa0
; CHECK-NEXT: vfredmax.vs v8, v8, v9		; CHECK-NEXT: vfredmax.vs v8, v8, v9
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%rdx = call float @llvm.vector.reduce.fmax.v4f32(<4 x float> %v)		%rdx = call float @llvm.vector.reduce.fmax.v4f32(<4 x float> %v)
%res = call float @llvm.maxnum.f32(float %x, float %rdx)		%res = call float @llvm.maxnum.f32(float %x, float %rdx)
ret float %res		ret float %res
}		}

define float @reduce_fmin(float %x, <4 x float> %v) {		define float @reduce_fmin(float %x, <4 x float> %v) {
; CHECK-LABEL: reduce_fmin:		; CHECK-LABEL: reduce_fmin:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma
; CHECK-NEXT: vfmv.s.f v9, fa0
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
		; CHECK-NEXT: vfmv.s.f v9, fa0
; CHECK-NEXT: vfredmin.vs v8, v8, v9		; CHECK-NEXT: vfredmin.vs v8, v8, v9
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%rdx = call float @llvm.vector.reduce.fmin.v4f32(<4 x float> %v)		%rdx = call float @llvm.vector.reduce.fmin.v4f32(<4 x float> %v)
%res = call float @llvm.minnum.f32(float %x, float %rdx)		%res = call float @llvm.minnum.f32(float %x, float %rdx)
ret float %res		ret float %res
}		}
Show All 19 Lines

llvm/test/CodeGen/RISCV/rvv/vreductions-fp-sdnode.ll

; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py		; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
; RUN: llc -mtriple=riscv32 -mattr=+d,+zfh,+experimental-zvfh,+v,+m -target-abi=ilp32d \		; RUN: llc -mtriple=riscv32 -mattr=+d,+zfh,+experimental-zvfh,+v,+m -target-abi=ilp32d \
; RUN: -verify-machineinstrs < %s \| FileCheck %s		; RUN: -verify-machineinstrs < %s \| FileCheck %s
; RUN: llc -mtriple=riscv64 -mattr=+d,+zfh,+experimental-zvfh,+v,+m -target-abi=lp64d \		; RUN: llc -mtriple=riscv64 -mattr=+d,+zfh,+experimental-zvfh,+v,+m -target-abi=lp64d \
; RUN: -verify-machineinstrs < %s \| FileCheck %s		; RUN: -verify-machineinstrs < %s \| FileCheck %s

declare half @llvm.vector.reduce.fadd.nxv1f16(half, <vscale x 1 x half>)		declare half @llvm.vector.reduce.fadd.nxv1f16(half, <vscale x 1 x half>)

define half @vreduce_fadd_nxv1f16(<vscale x 1 x half> %v, half %s) {		define half @vreduce_fadd_nxv1f16(<vscale x 1 x half> %v, half %s) {
; CHECK-LABEL: vreduce_fadd_nxv1f16:		; CHECK-LABEL: vreduce_fadd_nxv1f16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma		; CHECK-NEXT: vsetvli a0, zero, e16, m1, ta, ma
; CHECK-NEXT: vfmv.s.f v9, fa0		; CHECK-NEXT: vfmv.s.f v9, fa0
; CHECK-NEXT: vsetvli a0, zero, e16, mf4, ta, ma		; CHECK-NEXT: vsetvli a0, zero, e16, mf4, ta, ma
; CHECK-NEXT: vfredusum.vs v8, v8, v9		; CHECK-NEXT: vfredusum.vs v8, v8, v9
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%red = call reassoc half @llvm.vector.reduce.fadd.nxv1f16(half %s, <vscale x 1 x half> %v)		%red = call reassoc half @llvm.vector.reduce.fadd.nxv1f16(half %s, <vscale x 1 x half> %v)
ret half %red		ret half %red
}		}

define half @vreduce_ord_fadd_nxv1f16(<vscale x 1 x half> %v, half %s) {		define half @vreduce_ord_fadd_nxv1f16(<vscale x 1 x half> %v, half %s) {
; CHECK-LABEL: vreduce_ord_fadd_nxv1f16:		; CHECK-LABEL: vreduce_ord_fadd_nxv1f16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma
; CHECK-NEXT: vfmv.s.f v9, fa0
; CHECK-NEXT: vsetvli a0, zero, e16, mf4, ta, ma		; CHECK-NEXT: vsetvli a0, zero, e16, mf4, ta, ma
		; CHECK-NEXT: vfmv.v.f v9, fa0
; CHECK-NEXT: vfredosum.vs v8, v8, v9		; CHECK-NEXT: vfredosum.vs v8, v8, v9
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%red = call half @llvm.vector.reduce.fadd.nxv1f16(half %s, <vscale x 1 x half> %v)		%red = call half @llvm.vector.reduce.fadd.nxv1f16(half %s, <vscale x 1 x half> %v)
ret half %red		ret half %red
}		}

declare half @llvm.vector.reduce.fadd.nxv2f16(half, <vscale x 2 x half>)		declare half @llvm.vector.reduce.fadd.nxv2f16(half, <vscale x 2 x half>)

define half @vreduce_fadd_nxv2f16(<vscale x 2 x half> %v, half %s) {		define half @vreduce_fadd_nxv2f16(<vscale x 2 x half> %v, half %s) {
; CHECK-LABEL: vreduce_fadd_nxv2f16:		; CHECK-LABEL: vreduce_fadd_nxv2f16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma		; CHECK-NEXT: vsetvli a0, zero, e16, m1, ta, ma
; CHECK-NEXT: vfmv.s.f v9, fa0		; CHECK-NEXT: vfmv.s.f v9, fa0
; CHECK-NEXT: vsetvli a0, zero, e16, mf2, ta, ma		; CHECK-NEXT: vsetvli a0, zero, e16, mf2, ta, ma
; CHECK-NEXT: vfredusum.vs v8, v8, v9		; CHECK-NEXT: vfredusum.vs v8, v8, v9
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%red = call reassoc half @llvm.vector.reduce.fadd.nxv2f16(half %s, <vscale x 2 x half> %v)		%red = call reassoc half @llvm.vector.reduce.fadd.nxv2f16(half %s, <vscale x 2 x half> %v)
ret half %red		ret half %red
}		}

define half @vreduce_ord_fadd_nxv2f16(<vscale x 2 x half> %v, half %s) {		define half @vreduce_ord_fadd_nxv2f16(<vscale x 2 x half> %v, half %s) {
; CHECK-LABEL: vreduce_ord_fadd_nxv2f16:		; CHECK-LABEL: vreduce_ord_fadd_nxv2f16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma
; CHECK-NEXT: vfmv.s.f v9, fa0
; CHECK-NEXT: vsetvli a0, zero, e16, mf2, ta, ma		; CHECK-NEXT: vsetvli a0, zero, e16, mf2, ta, ma
		; CHECK-NEXT: vfmv.v.f v9, fa0
; CHECK-NEXT: vfredosum.vs v8, v8, v9		; CHECK-NEXT: vfredosum.vs v8, v8, v9
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%red = call half @llvm.vector.reduce.fadd.nxv2f16(half %s, <vscale x 2 x half> %v)		%red = call half @llvm.vector.reduce.fadd.nxv2f16(half %s, <vscale x 2 x half> %v)
ret half %red		ret half %red
}		}

declare half @llvm.vector.reduce.fadd.nxv4f16(half, <vscale x 4 x half>)		declare half @llvm.vector.reduce.fadd.nxv4f16(half, <vscale x 4 x half>)

define half @vreduce_fadd_nxv4f16(<vscale x 4 x half> %v, half %s) {		define half @vreduce_fadd_nxv4f16(<vscale x 4 x half> %v, half %s) {
; CHECK-LABEL: vreduce_fadd_nxv4f16:		; CHECK-LABEL: vreduce_fadd_nxv4f16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma
; CHECK-NEXT: vfmv.s.f v9, fa0
; CHECK-NEXT: vsetvli a0, zero, e16, m1, ta, ma		; CHECK-NEXT: vsetvli a0, zero, e16, m1, ta, ma
		; CHECK-NEXT: vfmv.s.f v9, fa0
; CHECK-NEXT: vfredusum.vs v8, v8, v9		; CHECK-NEXT: vfredusum.vs v8, v8, v9
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%red = call reassoc half @llvm.vector.reduce.fadd.nxv4f16(half %s, <vscale x 4 x half> %v)		%red = call reassoc half @llvm.vector.reduce.fadd.nxv4f16(half %s, <vscale x 4 x half> %v)
ret half %red		ret half %red
}		}

define half @vreduce_ord_fadd_nxv4f16(<vscale x 4 x half> %v, half %s) {		define half @vreduce_ord_fadd_nxv4f16(<vscale x 4 x half> %v, half %s) {
; CHECK-LABEL: vreduce_ord_fadd_nxv4f16:		; CHECK-LABEL: vreduce_ord_fadd_nxv4f16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma
; CHECK-NEXT: vfmv.s.f v9, fa0
; CHECK-NEXT: vsetvli a0, zero, e16, m1, ta, ma		; CHECK-NEXT: vsetvli a0, zero, e16, m1, ta, ma
		; CHECK-NEXT: vfmv.v.f v9, fa0
; CHECK-NEXT: vfredosum.vs v8, v8, v9		; CHECK-NEXT: vfredosum.vs v8, v8, v9
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%red = call half @llvm.vector.reduce.fadd.nxv4f16(half %s, <vscale x 4 x half> %v)		%red = call half @llvm.vector.reduce.fadd.nxv4f16(half %s, <vscale x 4 x half> %v)
ret half %red		ret half %red
}		}

declare float @llvm.vector.reduce.fadd.nxv1f32(float, <vscale x 1 x float>)		declare float @llvm.vector.reduce.fadd.nxv1f32(float, <vscale x 1 x float>)

define float @vreduce_fadd_nxv1f32(<vscale x 1 x float> %v, float %s) {		define float @vreduce_fadd_nxv1f32(<vscale x 1 x float> %v, float %s) {
; CHECK-LABEL: vreduce_fadd_nxv1f32:		; CHECK-LABEL: vreduce_fadd_nxv1f32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vsetvli a0, zero, e32, m1, ta, ma
; CHECK-NEXT: vfmv.s.f v9, fa0		; CHECK-NEXT: vfmv.s.f v9, fa0
; CHECK-NEXT: vsetvli a0, zero, e32, mf2, ta, ma		; CHECK-NEXT: vsetvli a0, zero, e32, mf2, ta, ma
; CHECK-NEXT: vfredusum.vs v8, v8, v9		; CHECK-NEXT: vfredusum.vs v8, v8, v9
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%red = call reassoc float @llvm.vector.reduce.fadd.nxv1f32(float %s, <vscale x 1 x float> %v)		%red = call reassoc float @llvm.vector.reduce.fadd.nxv1f32(float %s, <vscale x 1 x float> %v)
ret float %red		ret float %red
}		}

define float @vreduce_ord_fadd_nxv1f32(<vscale x 1 x float> %v, float %s) {		define float @vreduce_ord_fadd_nxv1f32(<vscale x 1 x float> %v, float %s) {
; CHECK-LABEL: vreduce_ord_fadd_nxv1f32:		; CHECK-LABEL: vreduce_ord_fadd_nxv1f32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma
; CHECK-NEXT: vfmv.s.f v9, fa0
; CHECK-NEXT: vsetvli a0, zero, e32, mf2, ta, ma		; CHECK-NEXT: vsetvli a0, zero, e32, mf2, ta, ma
		; CHECK-NEXT: vfmv.v.f v9, fa0
; CHECK-NEXT: vfredosum.vs v8, v8, v9		; CHECK-NEXT: vfredosum.vs v8, v8, v9
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%red = call float @llvm.vector.reduce.fadd.nxv1f32(float %s, <vscale x 1 x float> %v)		%red = call float @llvm.vector.reduce.fadd.nxv1f32(float %s, <vscale x 1 x float> %v)
ret float %red		ret float %red
}		}

define float @vreduce_fwadd_nxv1f32(<vscale x 1 x half> %v, float %s) {		define float @vreduce_fwadd_nxv1f32(<vscale x 1 x half> %v, float %s) {
; CHECK-LABEL: vreduce_fwadd_nxv1f32:		; CHECK-LABEL: vreduce_fwadd_nxv1f32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vsetvli a0, zero, e32, m1, ta, ma
; CHECK-NEXT: vfmv.s.f v9, fa0		; CHECK-NEXT: vfmv.s.f v9, fa0
; CHECK-NEXT: vsetvli a0, zero, e16, mf4, ta, ma		; CHECK-NEXT: vsetvli a0, zero, e16, mf4, ta, ma
; CHECK-NEXT: vfwredusum.vs v8, v8, v9		; CHECK-NEXT: vfwredusum.vs v8, v8, v9
; CHECK-NEXT: vsetivli zero, 0, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 0, e32, m1, ta, ma
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%e = fpext <vscale x 1 x half> %v to <vscale x 1 x float>		%e = fpext <vscale x 1 x half> %v to <vscale x 1 x float>
%red = call reassoc float @llvm.vector.reduce.fadd.nxv1f32(float %s, <vscale x 1 x float> %e)		%red = call reassoc float @llvm.vector.reduce.fadd.nxv1f32(float %s, <vscale x 1 x float> %e)
ret float %red		ret float %red
}		}

define float @vreduce_ord_fwadd_nxv1f32(<vscale x 1 x half> %v, float %s) {		define float @vreduce_ord_fwadd_nxv1f32(<vscale x 1 x half> %v, float %s) {
; CHECK-LABEL: vreduce_ord_fwadd_nxv1f32:		; CHECK-LABEL: vreduce_ord_fwadd_nxv1f32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vsetvli a0, zero, e32, mf2, ta, ma
; CHECK-NEXT: vfmv.s.f v9, fa0		; CHECK-NEXT: vfmv.v.f v9, fa0
; CHECK-NEXT: vsetvli a0, zero, e16, mf4, ta, ma		; CHECK-NEXT: vsetvli zero, zero, e16, mf4, ta, ma
; CHECK-NEXT: vfwredosum.vs v8, v8, v9		; CHECK-NEXT: vfwredosum.vs v8, v8, v9
; CHECK-NEXT: vsetivli zero, 0, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 0, e32, m1, ta, ma
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%e = fpext <vscale x 1 x half> %v to <vscale x 1 x float>		%e = fpext <vscale x 1 x half> %v to <vscale x 1 x float>
%red = call float @llvm.vector.reduce.fadd.nxv1f32(float %s, <vscale x 1 x float> %e)		%red = call float @llvm.vector.reduce.fadd.nxv1f32(float %s, <vscale x 1 x float> %e)
ret float %red		ret float %red
}		}

declare float @llvm.vector.reduce.fadd.nxv2f32(float, <vscale x 2 x float>)		declare float @llvm.vector.reduce.fadd.nxv2f32(float, <vscale x 2 x float>)

define float @vreduce_fadd_nxv2f32(<vscale x 2 x float> %v, float %s) {		define float @vreduce_fadd_nxv2f32(<vscale x 2 x float> %v, float %s) {
; CHECK-LABEL: vreduce_fadd_nxv2f32:		; CHECK-LABEL: vreduce_fadd_nxv2f32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma
; CHECK-NEXT: vfmv.s.f v9, fa0
; CHECK-NEXT: vsetvli a0, zero, e32, m1, ta, ma		; CHECK-NEXT: vsetvli a0, zero, e32, m1, ta, ma
		; CHECK-NEXT: vfmv.s.f v9, fa0
; CHECK-NEXT: vfredusum.vs v8, v8, v9		; CHECK-NEXT: vfredusum.vs v8, v8, v9
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%red = call reassoc float @llvm.vector.reduce.fadd.nxv2f32(float %s, <vscale x 2 x float> %v)		%red = call reassoc float @llvm.vector.reduce.fadd.nxv2f32(float %s, <vscale x 2 x float> %v)
ret float %red		ret float %red
}		}

define float @vreduce_ord_fadd_nxv2f32(<vscale x 2 x float> %v, float %s) {		define float @vreduce_ord_fadd_nxv2f32(<vscale x 2 x float> %v, float %s) {
; CHECK-LABEL: vreduce_ord_fadd_nxv2f32:		; CHECK-LABEL: vreduce_ord_fadd_nxv2f32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma
; CHECK-NEXT: vfmv.s.f v9, fa0
; CHECK-NEXT: vsetvli a0, zero, e32, m1, ta, ma		; CHECK-NEXT: vsetvli a0, zero, e32, m1, ta, ma
		; CHECK-NEXT: vfmv.v.f v9, fa0
; CHECK-NEXT: vfredosum.vs v8, v8, v9		; CHECK-NEXT: vfredosum.vs v8, v8, v9
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%red = call float @llvm.vector.reduce.fadd.nxv2f32(float %s, <vscale x 2 x float> %v)		%red = call float @llvm.vector.reduce.fadd.nxv2f32(float %s, <vscale x 2 x float> %v)
ret float %red		ret float %red
}		}

define float @vreduce_fwadd_nxv2f32(<vscale x 2 x half> %v, float %s) {		define float @vreduce_fwadd_nxv2f32(<vscale x 2 x half> %v, float %s) {
; CHECK-LABEL: vreduce_fwadd_nxv2f32:		; CHECK-LABEL: vreduce_fwadd_nxv2f32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vsetvli a0, zero, e32, m1, ta, ma
; CHECK-NEXT: vfmv.s.f v9, fa0		; CHECK-NEXT: vfmv.s.f v9, fa0
; CHECK-NEXT: vsetvli a0, zero, e16, mf2, ta, ma		; CHECK-NEXT: vsetvli zero, zero, e16, mf2, ta, ma
; CHECK-NEXT: vfwredusum.vs v8, v8, v9		; CHECK-NEXT: vfwredusum.vs v8, v8, v9
; CHECK-NEXT: vsetvli zero, zero, e32, m1, ta, ma		; CHECK-NEXT: vsetvli zero, zero, e32, m1, ta, ma
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%e = fpext <vscale x 2 x half> %v to <vscale x 2 x float>		%e = fpext <vscale x 2 x half> %v to <vscale x 2 x float>
%red = call reassoc float @llvm.vector.reduce.fadd.nxv2f32(float %s, <vscale x 2 x float> %e)		%red = call reassoc float @llvm.vector.reduce.fadd.nxv2f32(float %s, <vscale x 2 x float> %e)
ret float %red		ret float %red
}		}

define float @vreduce_ord_fwadd_nxv2f32(<vscale x 2 x half> %v, float %s) {		define float @vreduce_ord_fwadd_nxv2f32(<vscale x 2 x half> %v, float %s) {
; CHECK-LABEL: vreduce_ord_fwadd_nxv2f32:		; CHECK-LABEL: vreduce_ord_fwadd_nxv2f32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vsetvli a0, zero, e32, m1, ta, ma
; CHECK-NEXT: vfmv.s.f v9, fa0		; CHECK-NEXT: vfmv.v.f v9, fa0
; CHECK-NEXT: vsetvli a0, zero, e16, mf2, ta, ma		; CHECK-NEXT: vsetvli zero, zero, e16, mf2, ta, ma
; CHECK-NEXT: vfwredosum.vs v8, v8, v9		; CHECK-NEXT: vfwredosum.vs v8, v8, v9
; CHECK-NEXT: vsetvli zero, zero, e32, m1, ta, ma		; CHECK-NEXT: vsetvli zero, zero, e32, m1, ta, ma
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%e = fpext <vscale x 2 x half> %v to <vscale x 2 x float>		%e = fpext <vscale x 2 x half> %v to <vscale x 2 x float>
%red = call float @llvm.vector.reduce.fadd.nxv2f32(float %s, <vscale x 2 x float> %e)		%red = call float @llvm.vector.reduce.fadd.nxv2f32(float %s, <vscale x 2 x float> %e)
ret float %red		ret float %red
}		}
▲ Show 20 Lines • Show All 56 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
ret float %red		ret float %red
}		}

declare double @llvm.vector.reduce.fadd.nxv1f64(double, <vscale x 1 x double>)		declare double @llvm.vector.reduce.fadd.nxv1f64(double, <vscale x 1 x double>)

define double @vreduce_fadd_nxv1f64(<vscale x 1 x double> %v, double %s) {		define double @vreduce_fadd_nxv1f64(<vscale x 1 x double> %v, double %s) {
; CHECK-LABEL: vreduce_fadd_nxv1f64:		; CHECK-LABEL: vreduce_fadd_nxv1f64:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 1, e64, m1, ta, ma
; CHECK-NEXT: vfmv.s.f v9, fa0
; CHECK-NEXT: vsetvli a0, zero, e64, m1, ta, ma		; CHECK-NEXT: vsetvli a0, zero, e64, m1, ta, ma
		; CHECK-NEXT: vfmv.s.f v9, fa0
; CHECK-NEXT: vfredusum.vs v8, v8, v9		; CHECK-NEXT: vfredusum.vs v8, v8, v9
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%red = call reassoc double @llvm.vector.reduce.fadd.nxv1f64(double %s, <vscale x 1 x double> %v)		%red = call reassoc double @llvm.vector.reduce.fadd.nxv1f64(double %s, <vscale x 1 x double> %v)
ret double %red		ret double %red
}		}

define double @vreduce_ord_fadd_nxv1f64(<vscale x 1 x double> %v, double %s) {		define double @vreduce_ord_fadd_nxv1f64(<vscale x 1 x double> %v, double %s) {
; CHECK-LABEL: vreduce_ord_fadd_nxv1f64:		; CHECK-LABEL: vreduce_ord_fadd_nxv1f64:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 1, e64, m1, ta, ma
; CHECK-NEXT: vfmv.s.f v9, fa0
; CHECK-NEXT: vsetvli a0, zero, e64, m1, ta, ma		; CHECK-NEXT: vsetvli a0, zero, e64, m1, ta, ma
		; CHECK-NEXT: vfmv.v.f v9, fa0
; CHECK-NEXT: vfredosum.vs v8, v8, v9		; CHECK-NEXT: vfredosum.vs v8, v8, v9
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%red = call double @llvm.vector.reduce.fadd.nxv1f64(double %s, <vscale x 1 x double> %v)		%red = call double @llvm.vector.reduce.fadd.nxv1f64(double %s, <vscale x 1 x double> %v)
ret double %red		ret double %red
}		}

define double @vreduce_fwadd_nxv1f64(<vscale x 1 x float> %v, double %s) {		define double @vreduce_fwadd_nxv1f64(<vscale x 1 x float> %v, double %s) {
; CHECK-LABEL: vreduce_fwadd_nxv1f64:		; CHECK-LABEL: vreduce_fwadd_nxv1f64:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 1, e64, m1, ta, ma		; CHECK-NEXT: vsetvli a0, zero, e64, m1, ta, ma
; CHECK-NEXT: vfmv.s.f v9, fa0		; CHECK-NEXT: vfmv.s.f v9, fa0
; CHECK-NEXT: vsetvli a0, zero, e32, mf2, ta, ma		; CHECK-NEXT: vsetvli zero, zero, e32, mf2, ta, ma
; CHECK-NEXT: vfwredusum.vs v8, v8, v9		; CHECK-NEXT: vfwredusum.vs v8, v8, v9
; CHECK-NEXT: vsetvli zero, zero, e64, m1, ta, ma		; CHECK-NEXT: vsetvli zero, zero, e64, m1, ta, ma
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%e = fpext <vscale x 1 x float> %v to <vscale x 1 x double>		%e = fpext <vscale x 1 x float> %v to <vscale x 1 x double>
%red = call reassoc double @llvm.vector.reduce.fadd.nxv1f64(double %s, <vscale x 1 x double> %e)		%red = call reassoc double @llvm.vector.reduce.fadd.nxv1f64(double %s, <vscale x 1 x double> %e)
ret double %red		ret double %red
}		}

define double @vreduce_ord_fwadd_nxv1f64(<vscale x 1 x float> %v, double %s) {		define double @vreduce_ord_fwadd_nxv1f64(<vscale x 1 x float> %v, double %s) {
; CHECK-LABEL: vreduce_ord_fwadd_nxv1f64:		; CHECK-LABEL: vreduce_ord_fwadd_nxv1f64:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 1, e64, m1, ta, ma		; CHECK-NEXT: vsetvli a0, zero, e64, m1, ta, ma
; CHECK-NEXT: vfmv.s.f v9, fa0		; CHECK-NEXT: vfmv.v.f v9, fa0
; CHECK-NEXT: vsetvli a0, zero, e32, mf2, ta, ma		; CHECK-NEXT: vsetvli zero, zero, e32, mf2, ta, ma
; CHECK-NEXT: vfwredosum.vs v8, v8, v9		; CHECK-NEXT: vfwredosum.vs v8, v8, v9
; CHECK-NEXT: vsetvli zero, zero, e64, m1, ta, ma		; CHECK-NEXT: vsetvli zero, zero, e64, m1, ta, ma
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%e = fpext <vscale x 1 x float> %v to <vscale x 1 x double>		%e = fpext <vscale x 1 x float> %v to <vscale x 1 x double>
%red = call double @llvm.vector.reduce.fadd.nxv1f64(double %s, <vscale x 1 x double> %e)		%red = call double @llvm.vector.reduce.fadd.nxv1f64(double %s, <vscale x 1 x double> %e)
ret double %red		ret double %red
}		}
▲ Show 20 Lines • Show All 116 Lines • ▼ Show 20 Lines

declare half @llvm.vector.reduce.fmin.nxv1f16(<vscale x 1 x half>)		declare half @llvm.vector.reduce.fmin.nxv1f16(<vscale x 1 x half>)

define half @vreduce_fmin_nxv1f16(<vscale x 1 x half> %v) {		define half @vreduce_fmin_nxv1f16(<vscale x 1 x half> %v) {
; CHECK-LABEL: vreduce_fmin_nxv1f16:		; CHECK-LABEL: vreduce_fmin_nxv1f16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: lui a0, %hi(.LCPI30_0)		; CHECK-NEXT: lui a0, %hi(.LCPI30_0)
; CHECK-NEXT: addi a0, a0, %lo(.LCPI30_0)		; CHECK-NEXT: addi a0, a0, %lo(.LCPI30_0)
; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma		; CHECK-NEXT: vsetvli a1, zero, e16, mf4, ta, ma
; CHECK-NEXT: vlse16.v v9, (a0), zero		; CHECK-NEXT: vlse16.v v9, (a0), zero
; CHECK-NEXT: vsetvli a0, zero, e16, mf4, ta, ma
; CHECK-NEXT: vfredmin.vs v8, v8, v9		; CHECK-NEXT: vfredmin.vs v8, v8, v9
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%red = call half @llvm.vector.reduce.fmin.nxv1f16(<vscale x 1 x half> %v)		%red = call half @llvm.vector.reduce.fmin.nxv1f16(<vscale x 1 x half> %v)
ret half %red		ret half %red
}		}

define half @vreduce_fmin_nxv1f16_nonans(<vscale x 1 x half> %v) #0 {		define half @vreduce_fmin_nxv1f16_nonans(<vscale x 1 x half> %v) #0 {
; CHECK-LABEL: vreduce_fmin_nxv1f16_nonans:		; CHECK-LABEL: vreduce_fmin_nxv1f16_nonans:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: lui a0, %hi(.LCPI31_0)		; CHECK-NEXT: lui a0, %hi(.LCPI31_0)
; CHECK-NEXT: addi a0, a0, %lo(.LCPI31_0)		; CHECK-NEXT: addi a0, a0, %lo(.LCPI31_0)
; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma		; CHECK-NEXT: vsetvli a1, zero, e16, mf4, ta, ma
; CHECK-NEXT: vlse16.v v9, (a0), zero		; CHECK-NEXT: vlse16.v v9, (a0), zero
; CHECK-NEXT: vsetvli a0, zero, e16, mf4, ta, ma
; CHECK-NEXT: vfredmin.vs v8, v8, v9		; CHECK-NEXT: vfredmin.vs v8, v8, v9
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%red = call nnan half @llvm.vector.reduce.fmin.nxv1f16(<vscale x 1 x half> %v)		%red = call nnan half @llvm.vector.reduce.fmin.nxv1f16(<vscale x 1 x half> %v)
ret half %red		ret half %red
}		}

define half @vreduce_fmin_nxv1f16_nonans_noinfs(<vscale x 1 x half> %v) #1 {		define half @vreduce_fmin_nxv1f16_nonans_noinfs(<vscale x 1 x half> %v) #1 {
; CHECK-LABEL: vreduce_fmin_nxv1f16_nonans_noinfs:		; CHECK-LABEL: vreduce_fmin_nxv1f16_nonans_noinfs:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: lui a0, %hi(.LCPI32_0)		; CHECK-NEXT: lui a0, %hi(.LCPI32_0)
; CHECK-NEXT: addi a0, a0, %lo(.LCPI32_0)		; CHECK-NEXT: addi a0, a0, %lo(.LCPI32_0)
; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma		; CHECK-NEXT: vsetvli a1, zero, e16, mf4, ta, ma
; CHECK-NEXT: vlse16.v v9, (a0), zero		; CHECK-NEXT: vlse16.v v9, (a0), zero
; CHECK-NEXT: vsetvli a0, zero, e16, mf4, ta, ma
; CHECK-NEXT: vfredmin.vs v8, v8, v9		; CHECK-NEXT: vfredmin.vs v8, v8, v9
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%red = call nnan ninf half @llvm.vector.reduce.fmin.nxv1f16(<vscale x 1 x half> %v)		%red = call nnan ninf half @llvm.vector.reduce.fmin.nxv1f16(<vscale x 1 x half> %v)
ret half %red		ret half %red
}		}

declare half @llvm.vector.reduce.fmin.nxv2f16(<vscale x 2 x half>)		declare half @llvm.vector.reduce.fmin.nxv2f16(<vscale x 2 x half>)

define half @vreduce_fmin_nxv2f16(<vscale x 2 x half> %v) {		define half @vreduce_fmin_nxv2f16(<vscale x 2 x half> %v) {
; CHECK-LABEL: vreduce_fmin_nxv2f16:		; CHECK-LABEL: vreduce_fmin_nxv2f16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: lui a0, %hi(.LCPI33_0)		; CHECK-NEXT: lui a0, %hi(.LCPI33_0)
; CHECK-NEXT: addi a0, a0, %lo(.LCPI33_0)		; CHECK-NEXT: addi a0, a0, %lo(.LCPI33_0)
; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma		; CHECK-NEXT: vsetvli a1, zero, e16, mf2, ta, ma
; CHECK-NEXT: vlse16.v v9, (a0), zero		; CHECK-NEXT: vlse16.v v9, (a0), zero
; CHECK-NEXT: vsetvli a0, zero, e16, mf2, ta, ma
; CHECK-NEXT: vfredmin.vs v8, v8, v9		; CHECK-NEXT: vfredmin.vs v8, v8, v9
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%red = call half @llvm.vector.reduce.fmin.nxv2f16(<vscale x 2 x half> %v)		%red = call half @llvm.vector.reduce.fmin.nxv2f16(<vscale x 2 x half> %v)
ret half %red		ret half %red
}		}

declare half @llvm.vector.reduce.fmin.nxv4f16(<vscale x 4 x half>)		declare half @llvm.vector.reduce.fmin.nxv4f16(<vscale x 4 x half>)

define half @vreduce_fmin_nxv4f16(<vscale x 4 x half> %v) {		define half @vreduce_fmin_nxv4f16(<vscale x 4 x half> %v) {
; CHECK-LABEL: vreduce_fmin_nxv4f16:		; CHECK-LABEL: vreduce_fmin_nxv4f16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: lui a0, %hi(.LCPI34_0)		; CHECK-NEXT: lui a0, %hi(.LCPI34_0)
; CHECK-NEXT: addi a0, a0, %lo(.LCPI34_0)		; CHECK-NEXT: addi a0, a0, %lo(.LCPI34_0)
; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma		; CHECK-NEXT: vsetvli a1, zero, e16, m1, ta, ma
; CHECK-NEXT: vlse16.v v9, (a0), zero		; CHECK-NEXT: vlse16.v v9, (a0), zero
; CHECK-NEXT: vsetvli a0, zero, e16, m1, ta, ma
; CHECK-NEXT: vfredmin.vs v8, v8, v9		; CHECK-NEXT: vfredmin.vs v8, v8, v9
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%red = call half @llvm.vector.reduce.fmin.nxv4f16(<vscale x 4 x half> %v)		%red = call half @llvm.vector.reduce.fmin.nxv4f16(<vscale x 4 x half> %v)
ret half %red		ret half %red
}		}

declare half @llvm.vector.reduce.fmin.nxv64f16(<vscale x 64 x half>)		declare half @llvm.vector.reduce.fmin.nxv64f16(<vscale x 64 x half>)
Show All 17 Lines

declare float @llvm.vector.reduce.fmin.nxv1f32(<vscale x 1 x float>)		declare float @llvm.vector.reduce.fmin.nxv1f32(<vscale x 1 x float>)

define float @vreduce_fmin_nxv1f32(<vscale x 1 x float> %v) {		define float @vreduce_fmin_nxv1f32(<vscale x 1 x float> %v) {
; CHECK-LABEL: vreduce_fmin_nxv1f32:		; CHECK-LABEL: vreduce_fmin_nxv1f32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: lui a0, %hi(.LCPI36_0)		; CHECK-NEXT: lui a0, %hi(.LCPI36_0)
; CHECK-NEXT: addi a0, a0, %lo(.LCPI36_0)		; CHECK-NEXT: addi a0, a0, %lo(.LCPI36_0)
; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vsetvli a1, zero, e32, mf2, ta, ma
; CHECK-NEXT: vlse32.v v9, (a0), zero		; CHECK-NEXT: vlse32.v v9, (a0), zero
; CHECK-NEXT: vsetvli a0, zero, e32, mf2, ta, ma
; CHECK-NEXT: vfredmin.vs v8, v8, v9		; CHECK-NEXT: vfredmin.vs v8, v8, v9
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%red = call float @llvm.vector.reduce.fmin.nxv1f32(<vscale x 1 x float> %v)		%red = call float @llvm.vector.reduce.fmin.nxv1f32(<vscale x 1 x float> %v)
ret float %red		ret float %red
}		}

define float @vreduce_fmin_nxv1f32_nonans(<vscale x 1 x float> %v) {		define float @vreduce_fmin_nxv1f32_nonans(<vscale x 1 x float> %v) {
; CHECK-LABEL: vreduce_fmin_nxv1f32_nonans:		; CHECK-LABEL: vreduce_fmin_nxv1f32_nonans:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: lui a0, %hi(.LCPI37_0)		; CHECK-NEXT: lui a0, %hi(.LCPI37_0)
; CHECK-NEXT: addi a0, a0, %lo(.LCPI37_0)		; CHECK-NEXT: addi a0, a0, %lo(.LCPI37_0)
; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vsetvli a1, zero, e32, mf2, ta, ma
; CHECK-NEXT: vlse32.v v9, (a0), zero		; CHECK-NEXT: vlse32.v v9, (a0), zero
; CHECK-NEXT: vsetvli a0, zero, e32, mf2, ta, ma
; CHECK-NEXT: vfredmin.vs v8, v8, v9		; CHECK-NEXT: vfredmin.vs v8, v8, v9
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%red = call nnan float @llvm.vector.reduce.fmin.nxv1f32(<vscale x 1 x float> %v)		%red = call nnan float @llvm.vector.reduce.fmin.nxv1f32(<vscale x 1 x float> %v)
ret float %red		ret float %red
}		}

define float @vreduce_fmin_nxv1f32_nonans_noinfs(<vscale x 1 x float> %v) {		define float @vreduce_fmin_nxv1f32_nonans_noinfs(<vscale x 1 x float> %v) {
; CHECK-LABEL: vreduce_fmin_nxv1f32_nonans_noinfs:		; CHECK-LABEL: vreduce_fmin_nxv1f32_nonans_noinfs:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: lui a0, %hi(.LCPI38_0)		; CHECK-NEXT: lui a0, %hi(.LCPI38_0)
; CHECK-NEXT: addi a0, a0, %lo(.LCPI38_0)		; CHECK-NEXT: addi a0, a0, %lo(.LCPI38_0)
; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vsetvli a1, zero, e32, mf2, ta, ma
; CHECK-NEXT: vlse32.v v9, (a0), zero		; CHECK-NEXT: vlse32.v v9, (a0), zero
; CHECK-NEXT: vsetvli a0, zero, e32, mf2, ta, ma
; CHECK-NEXT: vfredmin.vs v8, v8, v9		; CHECK-NEXT: vfredmin.vs v8, v8, v9
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%red = call nnan ninf float @llvm.vector.reduce.fmin.nxv1f32(<vscale x 1 x float> %v)		%red = call nnan ninf float @llvm.vector.reduce.fmin.nxv1f32(<vscale x 1 x float> %v)
ret float %red		ret float %red
}		}

declare float @llvm.vector.reduce.fmin.nxv2f32(<vscale x 2 x float>)		declare float @llvm.vector.reduce.fmin.nxv2f32(<vscale x 2 x float>)

define float @vreduce_fmin_nxv2f32(<vscale x 2 x float> %v) {		define float @vreduce_fmin_nxv2f32(<vscale x 2 x float> %v) {
; CHECK-LABEL: vreduce_fmin_nxv2f32:		; CHECK-LABEL: vreduce_fmin_nxv2f32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: lui a0, %hi(.LCPI39_0)		; CHECK-NEXT: lui a0, %hi(.LCPI39_0)
; CHECK-NEXT: addi a0, a0, %lo(.LCPI39_0)		; CHECK-NEXT: addi a0, a0, %lo(.LCPI39_0)
; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vsetvli a1, zero, e32, m1, ta, ma
; CHECK-NEXT: vlse32.v v9, (a0), zero		; CHECK-NEXT: vlse32.v v9, (a0), zero
; CHECK-NEXT: vsetvli a0, zero, e32, m1, ta, ma
; CHECK-NEXT: vfredmin.vs v8, v8, v9		; CHECK-NEXT: vfredmin.vs v8, v8, v9
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%red = call float @llvm.vector.reduce.fmin.nxv2f32(<vscale x 2 x float> %v)		%red = call float @llvm.vector.reduce.fmin.nxv2f32(<vscale x 2 x float> %v)
ret float %red		ret float %red
}		}

declare float @llvm.vector.reduce.fmin.nxv4f32(<vscale x 4 x float>)		declare float @llvm.vector.reduce.fmin.nxv4f32(<vscale x 4 x float>)
Show All 34 Lines

declare double @llvm.vector.reduce.fmin.nxv1f64(<vscale x 1 x double>)		declare double @llvm.vector.reduce.fmin.nxv1f64(<vscale x 1 x double>)

define double @vreduce_fmin_nxv1f64(<vscale x 1 x double> %v) {		define double @vreduce_fmin_nxv1f64(<vscale x 1 x double> %v) {
; CHECK-LABEL: vreduce_fmin_nxv1f64:		; CHECK-LABEL: vreduce_fmin_nxv1f64:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: lui a0, %hi(.LCPI42_0)		; CHECK-NEXT: lui a0, %hi(.LCPI42_0)
; CHECK-NEXT: addi a0, a0, %lo(.LCPI42_0)		; CHECK-NEXT: addi a0, a0, %lo(.LCPI42_0)
; CHECK-NEXT: vsetivli zero, 1, e64, m1, ta, ma		; CHECK-NEXT: vsetvli a1, zero, e64, m1, ta, ma
; CHECK-NEXT: vlse64.v v9, (a0), zero		; CHECK-NEXT: vlse64.v v9, (a0), zero
; CHECK-NEXT: vsetvli a0, zero, e64, m1, ta, ma
; CHECK-NEXT: vfredmin.vs v8, v8, v9		; CHECK-NEXT: vfredmin.vs v8, v8, v9
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%red = call double @llvm.vector.reduce.fmin.nxv1f64(<vscale x 1 x double> %v)		%red = call double @llvm.vector.reduce.fmin.nxv1f64(<vscale x 1 x double> %v)
ret double %red		ret double %red
}		}

define double @vreduce_fmin_nxv1f64_nonans(<vscale x 1 x double> %v) {		define double @vreduce_fmin_nxv1f64_nonans(<vscale x 1 x double> %v) {
; CHECK-LABEL: vreduce_fmin_nxv1f64_nonans:		; CHECK-LABEL: vreduce_fmin_nxv1f64_nonans:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: lui a0, %hi(.LCPI43_0)		; CHECK-NEXT: lui a0, %hi(.LCPI43_0)
; CHECK-NEXT: addi a0, a0, %lo(.LCPI43_0)		; CHECK-NEXT: addi a0, a0, %lo(.LCPI43_0)
; CHECK-NEXT: vsetivli zero, 1, e64, m1, ta, ma		; CHECK-NEXT: vsetvli a1, zero, e64, m1, ta, ma
; CHECK-NEXT: vlse64.v v9, (a0), zero		; CHECK-NEXT: vlse64.v v9, (a0), zero
; CHECK-NEXT: vsetvli a0, zero, e64, m1, ta, ma
; CHECK-NEXT: vfredmin.vs v8, v8, v9		; CHECK-NEXT: vfredmin.vs v8, v8, v9
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%red = call nnan double @llvm.vector.reduce.fmin.nxv1f64(<vscale x 1 x double> %v)		%red = call nnan double @llvm.vector.reduce.fmin.nxv1f64(<vscale x 1 x double> %v)
ret double %red		ret double %red
}		}

define double @vreduce_fmin_nxv1f64_nonans_noinfs(<vscale x 1 x double> %v) {		define double @vreduce_fmin_nxv1f64_nonans_noinfs(<vscale x 1 x double> %v) {
; CHECK-LABEL: vreduce_fmin_nxv1f64_nonans_noinfs:		; CHECK-LABEL: vreduce_fmin_nxv1f64_nonans_noinfs:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: lui a0, %hi(.LCPI44_0)		; CHECK-NEXT: lui a0, %hi(.LCPI44_0)
; CHECK-NEXT: addi a0, a0, %lo(.LCPI44_0)		; CHECK-NEXT: addi a0, a0, %lo(.LCPI44_0)
; CHECK-NEXT: vsetivli zero, 1, e64, m1, ta, ma		; CHECK-NEXT: vsetvli a1, zero, e64, m1, ta, ma
; CHECK-NEXT: vlse64.v v9, (a0), zero		; CHECK-NEXT: vlse64.v v9, (a0), zero
; CHECK-NEXT: vsetvli a0, zero, e64, m1, ta, ma
; CHECK-NEXT: vfredmin.vs v8, v8, v9		; CHECK-NEXT: vfredmin.vs v8, v8, v9
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%red = call nnan ninf double @llvm.vector.reduce.fmin.nxv1f64(<vscale x 1 x double> %v)		%red = call nnan ninf double @llvm.vector.reduce.fmin.nxv1f64(<vscale x 1 x double> %v)
ret double %red		ret double %red
}		}

declare double @llvm.vector.reduce.fmin.nxv2f64(<vscale x 2 x double>)		declare double @llvm.vector.reduce.fmin.nxv2f64(<vscale x 2 x double>)
▲ Show 20 Lines • Show All 51 Lines • ▼ Show 20 Lines

declare half @llvm.vector.reduce.fmax.nxv1f16(<vscale x 1 x half>)		declare half @llvm.vector.reduce.fmax.nxv1f16(<vscale x 1 x half>)

define half @vreduce_fmax_nxv1f16(<vscale x 1 x half> %v) {		define half @vreduce_fmax_nxv1f16(<vscale x 1 x half> %v) {
; CHECK-LABEL: vreduce_fmax_nxv1f16:		; CHECK-LABEL: vreduce_fmax_nxv1f16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: lui a0, %hi(.LCPI48_0)		; CHECK-NEXT: lui a0, %hi(.LCPI48_0)
; CHECK-NEXT: addi a0, a0, %lo(.LCPI48_0)		; CHECK-NEXT: addi a0, a0, %lo(.LCPI48_0)
; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma		; CHECK-NEXT: vsetvli a1, zero, e16, mf4, ta, ma
; CHECK-NEXT: vlse16.v v9, (a0), zero		; CHECK-NEXT: vlse16.v v9, (a0), zero
; CHECK-NEXT: vsetvli a0, zero, e16, mf4, ta, ma
; CHECK-NEXT: vfredmax.vs v8, v8, v9		; CHECK-NEXT: vfredmax.vs v8, v8, v9
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%red = call half @llvm.vector.reduce.fmax.nxv1f16(<vscale x 1 x half> %v)		%red = call half @llvm.vector.reduce.fmax.nxv1f16(<vscale x 1 x half> %v)
ret half %red		ret half %red
}		}

define half @vreduce_fmax_nxv1f16_nonans(<vscale x 1 x half> %v) #0 {		define half @vreduce_fmax_nxv1f16_nonans(<vscale x 1 x half> %v) #0 {
; CHECK-LABEL: vreduce_fmax_nxv1f16_nonans:		; CHECK-LABEL: vreduce_fmax_nxv1f16_nonans:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: lui a0, %hi(.LCPI49_0)		; CHECK-NEXT: lui a0, %hi(.LCPI49_0)
; CHECK-NEXT: addi a0, a0, %lo(.LCPI49_0)		; CHECK-NEXT: addi a0, a0, %lo(.LCPI49_0)
; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma		; CHECK-NEXT: vsetvli a1, zero, e16, mf4, ta, ma
; CHECK-NEXT: vlse16.v v9, (a0), zero		; CHECK-NEXT: vlse16.v v9, (a0), zero
; CHECK-NEXT: vsetvli a0, zero, e16, mf4, ta, ma
; CHECK-NEXT: vfredmax.vs v8, v8, v9		; CHECK-NEXT: vfredmax.vs v8, v8, v9
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%red = call nnan half @llvm.vector.reduce.fmax.nxv1f16(<vscale x 1 x half> %v)		%red = call nnan half @llvm.vector.reduce.fmax.nxv1f16(<vscale x 1 x half> %v)
ret half %red		ret half %red
}		}

define half @vreduce_fmax_nxv1f16_nonans_noinfs(<vscale x 1 x half> %v) #1 {		define half @vreduce_fmax_nxv1f16_nonans_noinfs(<vscale x 1 x half> %v) #1 {
; CHECK-LABEL: vreduce_fmax_nxv1f16_nonans_noinfs:		; CHECK-LABEL: vreduce_fmax_nxv1f16_nonans_noinfs:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: lui a0, %hi(.LCPI50_0)		; CHECK-NEXT: lui a0, %hi(.LCPI50_0)
; CHECK-NEXT: addi a0, a0, %lo(.LCPI50_0)		; CHECK-NEXT: addi a0, a0, %lo(.LCPI50_0)
; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma		; CHECK-NEXT: vsetvli a1, zero, e16, mf4, ta, ma
; CHECK-NEXT: vlse16.v v9, (a0), zero		; CHECK-NEXT: vlse16.v v9, (a0), zero
; CHECK-NEXT: vsetvli a0, zero, e16, mf4, ta, ma
; CHECK-NEXT: vfredmax.vs v8, v8, v9		; CHECK-NEXT: vfredmax.vs v8, v8, v9
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%red = call nnan ninf half @llvm.vector.reduce.fmax.nxv1f16(<vscale x 1 x half> %v)		%red = call nnan ninf half @llvm.vector.reduce.fmax.nxv1f16(<vscale x 1 x half> %v)
ret half %red		ret half %red
}		}

declare half @llvm.vector.reduce.fmax.nxv2f16(<vscale x 2 x half>)		declare half @llvm.vector.reduce.fmax.nxv2f16(<vscale x 2 x half>)

define half @vreduce_fmax_nxv2f16(<vscale x 2 x half> %v) {		define half @vreduce_fmax_nxv2f16(<vscale x 2 x half> %v) {
; CHECK-LABEL: vreduce_fmax_nxv2f16:		; CHECK-LABEL: vreduce_fmax_nxv2f16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: lui a0, %hi(.LCPI51_0)		; CHECK-NEXT: lui a0, %hi(.LCPI51_0)
; CHECK-NEXT: addi a0, a0, %lo(.LCPI51_0)		; CHECK-NEXT: addi a0, a0, %lo(.LCPI51_0)
; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma		; CHECK-NEXT: vsetvli a1, zero, e16, mf2, ta, ma
; CHECK-NEXT: vlse16.v v9, (a0), zero		; CHECK-NEXT: vlse16.v v9, (a0), zero
; CHECK-NEXT: vsetvli a0, zero, e16, mf2, ta, ma
; CHECK-NEXT: vfredmax.vs v8, v8, v9		; CHECK-NEXT: vfredmax.vs v8, v8, v9
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%red = call half @llvm.vector.reduce.fmax.nxv2f16(<vscale x 2 x half> %v)		%red = call half @llvm.vector.reduce.fmax.nxv2f16(<vscale x 2 x half> %v)
ret half %red		ret half %red
}		}

declare half @llvm.vector.reduce.fmax.nxv4f16(<vscale x 4 x half>)		declare half @llvm.vector.reduce.fmax.nxv4f16(<vscale x 4 x half>)

define half @vreduce_fmax_nxv4f16(<vscale x 4 x half> %v) {		define half @vreduce_fmax_nxv4f16(<vscale x 4 x half> %v) {
; CHECK-LABEL: vreduce_fmax_nxv4f16:		; CHECK-LABEL: vreduce_fmax_nxv4f16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: lui a0, %hi(.LCPI52_0)		; CHECK-NEXT: lui a0, %hi(.LCPI52_0)
; CHECK-NEXT: addi a0, a0, %lo(.LCPI52_0)		; CHECK-NEXT: addi a0, a0, %lo(.LCPI52_0)
; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma		; CHECK-NEXT: vsetvli a1, zero, e16, m1, ta, ma
; CHECK-NEXT: vlse16.v v9, (a0), zero		; CHECK-NEXT: vlse16.v v9, (a0), zero
; CHECK-NEXT: vsetvli a0, zero, e16, m1, ta, ma
; CHECK-NEXT: vfredmax.vs v8, v8, v9		; CHECK-NEXT: vfredmax.vs v8, v8, v9
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%red = call half @llvm.vector.reduce.fmax.nxv4f16(<vscale x 4 x half> %v)		%red = call half @llvm.vector.reduce.fmax.nxv4f16(<vscale x 4 x half> %v)
ret half %red		ret half %red
}		}

declare half @llvm.vector.reduce.fmax.nxv64f16(<vscale x 64 x half>)		declare half @llvm.vector.reduce.fmax.nxv64f16(<vscale x 64 x half>)
Show All 17 Lines

declare float @llvm.vector.reduce.fmax.nxv1f32(<vscale x 1 x float>)		declare float @llvm.vector.reduce.fmax.nxv1f32(<vscale x 1 x float>)

define float @vreduce_fmax_nxv1f32(<vscale x 1 x float> %v) {		define float @vreduce_fmax_nxv1f32(<vscale x 1 x float> %v) {
; CHECK-LABEL: vreduce_fmax_nxv1f32:		; CHECK-LABEL: vreduce_fmax_nxv1f32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: lui a0, %hi(.LCPI54_0)		; CHECK-NEXT: lui a0, %hi(.LCPI54_0)
; CHECK-NEXT: addi a0, a0, %lo(.LCPI54_0)		; CHECK-NEXT: addi a0, a0, %lo(.LCPI54_0)
; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vsetvli a1, zero, e32, mf2, ta, ma
; CHECK-NEXT: vlse32.v v9, (a0), zero		; CHECK-NEXT: vlse32.v v9, (a0), zero
; CHECK-NEXT: vsetvli a0, zero, e32, mf2, ta, ma
; CHECK-NEXT: vfredmax.vs v8, v8, v9		; CHECK-NEXT: vfredmax.vs v8, v8, v9
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%red = call float @llvm.vector.reduce.fmax.nxv1f32(<vscale x 1 x float> %v)		%red = call float @llvm.vector.reduce.fmax.nxv1f32(<vscale x 1 x float> %v)
ret float %red		ret float %red
}		}

define float @vreduce_fmax_nxv1f32_nonans(<vscale x 1 x float> %v) {		define float @vreduce_fmax_nxv1f32_nonans(<vscale x 1 x float> %v) {
; CHECK-LABEL: vreduce_fmax_nxv1f32_nonans:		; CHECK-LABEL: vreduce_fmax_nxv1f32_nonans:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: lui a0, %hi(.LCPI55_0)		; CHECK-NEXT: lui a0, %hi(.LCPI55_0)
; CHECK-NEXT: addi a0, a0, %lo(.LCPI55_0)		; CHECK-NEXT: addi a0, a0, %lo(.LCPI55_0)
; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vsetvli a1, zero, e32, mf2, ta, ma
; CHECK-NEXT: vlse32.v v9, (a0), zero		; CHECK-NEXT: vlse32.v v9, (a0), zero
; CHECK-NEXT: vsetvli a0, zero, e32, mf2, ta, ma
; CHECK-NEXT: vfredmax.vs v8, v8, v9		; CHECK-NEXT: vfredmax.vs v8, v8, v9
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%red = call nnan float @llvm.vector.reduce.fmax.nxv1f32(<vscale x 1 x float> %v)		%red = call nnan float @llvm.vector.reduce.fmax.nxv1f32(<vscale x 1 x float> %v)
ret float %red		ret float %red
}		}

define float @vreduce_fmax_nxv1f32_nonans_noinfs(<vscale x 1 x float> %v) {		define float @vreduce_fmax_nxv1f32_nonans_noinfs(<vscale x 1 x float> %v) {
; CHECK-LABEL: vreduce_fmax_nxv1f32_nonans_noinfs:		; CHECK-LABEL: vreduce_fmax_nxv1f32_nonans_noinfs:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: lui a0, %hi(.LCPI56_0)		; CHECK-NEXT: lui a0, %hi(.LCPI56_0)
; CHECK-NEXT: addi a0, a0, %lo(.LCPI56_0)		; CHECK-NEXT: addi a0, a0, %lo(.LCPI56_0)
; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vsetvli a1, zero, e32, mf2, ta, ma
; CHECK-NEXT: vlse32.v v9, (a0), zero		; CHECK-NEXT: vlse32.v v9, (a0), zero
; CHECK-NEXT: vsetvli a0, zero, e32, mf2, ta, ma
; CHECK-NEXT: vfredmax.vs v8, v8, v9		; CHECK-NEXT: vfredmax.vs v8, v8, v9
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%red = call nnan ninf float @llvm.vector.reduce.fmax.nxv1f32(<vscale x 1 x float> %v)		%red = call nnan ninf float @llvm.vector.reduce.fmax.nxv1f32(<vscale x 1 x float> %v)
ret float %red		ret float %red
}		}

declare float @llvm.vector.reduce.fmax.nxv2f32(<vscale x 2 x float>)		declare float @llvm.vector.reduce.fmax.nxv2f32(<vscale x 2 x float>)

define float @vreduce_fmax_nxv2f32(<vscale x 2 x float> %v) {		define float @vreduce_fmax_nxv2f32(<vscale x 2 x float> %v) {
; CHECK-LABEL: vreduce_fmax_nxv2f32:		; CHECK-LABEL: vreduce_fmax_nxv2f32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: lui a0, %hi(.LCPI57_0)		; CHECK-NEXT: lui a0, %hi(.LCPI57_0)
; CHECK-NEXT: addi a0, a0, %lo(.LCPI57_0)		; CHECK-NEXT: addi a0, a0, %lo(.LCPI57_0)
; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vsetvli a1, zero, e32, m1, ta, ma
; CHECK-NEXT: vlse32.v v9, (a0), zero		; CHECK-NEXT: vlse32.v v9, (a0), zero
; CHECK-NEXT: vsetvli a0, zero, e32, m1, ta, ma
; CHECK-NEXT: vfredmax.vs v8, v8, v9		; CHECK-NEXT: vfredmax.vs v8, v8, v9
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%red = call float @llvm.vector.reduce.fmax.nxv2f32(<vscale x 2 x float> %v)		%red = call float @llvm.vector.reduce.fmax.nxv2f32(<vscale x 2 x float> %v)
ret float %red		ret float %red
}		}

declare float @llvm.vector.reduce.fmax.nxv4f32(<vscale x 4 x float>)		declare float @llvm.vector.reduce.fmax.nxv4f32(<vscale x 4 x float>)
Show All 34 Lines

declare double @llvm.vector.reduce.fmax.nxv1f64(<vscale x 1 x double>)		declare double @llvm.vector.reduce.fmax.nxv1f64(<vscale x 1 x double>)

define double @vreduce_fmax_nxv1f64(<vscale x 1 x double> %v) {		define double @vreduce_fmax_nxv1f64(<vscale x 1 x double> %v) {
; CHECK-LABEL: vreduce_fmax_nxv1f64:		; CHECK-LABEL: vreduce_fmax_nxv1f64:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: lui a0, %hi(.LCPI60_0)		; CHECK-NEXT: lui a0, %hi(.LCPI60_0)
; CHECK-NEXT: addi a0, a0, %lo(.LCPI60_0)		; CHECK-NEXT: addi a0, a0, %lo(.LCPI60_0)
; CHECK-NEXT: vsetivli zero, 1, e64, m1, ta, ma		; CHECK-NEXT: vsetvli a1, zero, e64, m1, ta, ma
; CHECK-NEXT: vlse64.v v9, (a0), zero		; CHECK-NEXT: vlse64.v v9, (a0), zero
; CHECK-NEXT: vsetvli a0, zero, e64, m1, ta, ma
; CHECK-NEXT: vfredmax.vs v8, v8, v9		; CHECK-NEXT: vfredmax.vs v8, v8, v9
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%red = call double @llvm.vector.reduce.fmax.nxv1f64(<vscale x 1 x double> %v)		%red = call double @llvm.vector.reduce.fmax.nxv1f64(<vscale x 1 x double> %v)
ret double %red		ret double %red
}		}

define double @vreduce_fmax_nxv1f64_nonans(<vscale x 1 x double> %v) {		define double @vreduce_fmax_nxv1f64_nonans(<vscale x 1 x double> %v) {
; CHECK-LABEL: vreduce_fmax_nxv1f64_nonans:		; CHECK-LABEL: vreduce_fmax_nxv1f64_nonans:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: lui a0, %hi(.LCPI61_0)		; CHECK-NEXT: lui a0, %hi(.LCPI61_0)
; CHECK-NEXT: addi a0, a0, %lo(.LCPI61_0)		; CHECK-NEXT: addi a0, a0, %lo(.LCPI61_0)
; CHECK-NEXT: vsetivli zero, 1, e64, m1, ta, ma		; CHECK-NEXT: vsetvli a1, zero, e64, m1, ta, ma
; CHECK-NEXT: vlse64.v v9, (a0), zero		; CHECK-NEXT: vlse64.v v9, (a0), zero
; CHECK-NEXT: vsetvli a0, zero, e64, m1, ta, ma
; CHECK-NEXT: vfredmax.vs v8, v8, v9		; CHECK-NEXT: vfredmax.vs v8, v8, v9
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%red = call nnan double @llvm.vector.reduce.fmax.nxv1f64(<vscale x 1 x double> %v)		%red = call nnan double @llvm.vector.reduce.fmax.nxv1f64(<vscale x 1 x double> %v)
ret double %red		ret double %red
}		}

define double @vreduce_fmax_nxv1f64_nonans_noinfs(<vscale x 1 x double> %v) {		define double @vreduce_fmax_nxv1f64_nonans_noinfs(<vscale x 1 x double> %v) {
; CHECK-LABEL: vreduce_fmax_nxv1f64_nonans_noinfs:		; CHECK-LABEL: vreduce_fmax_nxv1f64_nonans_noinfs:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: lui a0, %hi(.LCPI62_0)		; CHECK-NEXT: lui a0, %hi(.LCPI62_0)
; CHECK-NEXT: addi a0, a0, %lo(.LCPI62_0)		; CHECK-NEXT: addi a0, a0, %lo(.LCPI62_0)
; CHECK-NEXT: vsetivli zero, 1, e64, m1, ta, ma		; CHECK-NEXT: vsetvli a1, zero, e64, m1, ta, ma
; CHECK-NEXT: vlse64.v v9, (a0), zero		; CHECK-NEXT: vlse64.v v9, (a0), zero
; CHECK-NEXT: vsetvli a0, zero, e64, m1, ta, ma
; CHECK-NEXT: vfredmax.vs v8, v8, v9		; CHECK-NEXT: vfredmax.vs v8, v8, v9
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%red = call nnan ninf double @llvm.vector.reduce.fmax.nxv1f64(<vscale x 1 x double> %v)		%red = call nnan ninf double @llvm.vector.reduce.fmax.nxv1f64(<vscale x 1 x double> %v)
ret double %red		ret double %red
}		}

declare double @llvm.vector.reduce.fmax.nxv2f64(<vscale x 2 x double>)		declare double @llvm.vector.reduce.fmax.nxv2f64(<vscale x 2 x double>)
▲ Show 20 Lines • Show All 47 Lines • ▼ Show 20 Lines
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%red = call double @llvm.vector.reduce.fmax.nxv16f64(<vscale x 16 x double> %v)		%red = call double @llvm.vector.reduce.fmax.nxv16f64(<vscale x 16 x double> %v)
ret double %red		ret double %red
}		}

define float @vreduce_nsz_fadd_nxv1f32(<vscale x 1 x float> %v, float %s) {		define float @vreduce_nsz_fadd_nxv1f32(<vscale x 1 x float> %v, float %s) {
; CHECK-LABEL: vreduce_nsz_fadd_nxv1f32:		; CHECK-LABEL: vreduce_nsz_fadd_nxv1f32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vsetvli a0, zero, e32, m1, ta, ma
; CHECK-NEXT: vfmv.s.f v9, fa0		; CHECK-NEXT: vfmv.s.f v9, fa0
; CHECK-NEXT: vsetvli a0, zero, e32, mf2, ta, ma		; CHECK-NEXT: vsetvli a0, zero, e32, mf2, ta, ma
; CHECK-NEXT: vfredusum.vs v8, v8, v9		; CHECK-NEXT: vfredusum.vs v8, v8, v9
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%red = call reassoc nsz float @llvm.vector.reduce.fadd.nxv1f32(float %s, <vscale x 1 x float> %v)		%red = call reassoc nsz float @llvm.vector.reduce.fadd.nxv1f32(float %s, <vscale x 1 x float> %v)
ret float %red		ret float %red
}		}
Show All 10 Lines
; CHECK-NEXT: add a1, a1, a0		; CHECK-NEXT: add a1, a1, a0
; CHECK-NEXT: add a0, a1, a0		; CHECK-NEXT: add a0, a1, a0
; CHECK-NEXT: fmv.h.x ft0, zero		; CHECK-NEXT: fmv.h.x ft0, zero
; CHECK-NEXT: fneg.h ft0, ft0		; CHECK-NEXT: fneg.h ft0, ft0
; CHECK-NEXT: vsetvli a2, zero, e16, m1, ta, ma		; CHECK-NEXT: vsetvli a2, zero, e16, m1, ta, ma
; CHECK-NEXT: vfmv.v.f v9, ft0		; CHECK-NEXT: vfmv.v.f v9, ft0
; CHECK-NEXT: vsetvli zero, a0, e16, m1, tu, ma		; CHECK-NEXT: vsetvli zero, a0, e16, m1, tu, ma
; CHECK-NEXT: vslideup.vx v8, v9, a1		; CHECK-NEXT: vslideup.vx v8, v9, a1
; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma
; CHECK-NEXT: vfmv.s.f v9, fa0
; CHECK-NEXT: vsetvli a0, zero, e16, m1, ta, ma		; CHECK-NEXT: vsetvli a0, zero, e16, m1, ta, ma
		; CHECK-NEXT: vfmv.v.f v9, fa0
; CHECK-NEXT: vfredosum.vs v8, v8, v9		; CHECK-NEXT: vfredosum.vs v8, v8, v9
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%red = call half @llvm.vector.reduce.fadd.nxv3f16(half %s, <vscale x 3 x half> %v)		%red = call half @llvm.vector.reduce.fadd.nxv3f16(half %s, <vscale x 3 x half> %v)
ret half %red		ret half %red
}		}

declare half @llvm.vector.reduce.fadd.nxv6f16(half, <vscale x 6 x half>)		declare half @llvm.vector.reduce.fadd.nxv6f16(half, <vscale x 6 x half>)
▲ Show 20 Lines • Show All 77 Lines • ▼ Show 20 Lines
; CHECK-NEXT: add a1, a1, a0		; CHECK-NEXT: add a1, a1, a0
; CHECK-NEXT: add a0, a1, a0		; CHECK-NEXT: add a0, a1, a0
; CHECK-NEXT: fmv.h.x ft0, zero		; CHECK-NEXT: fmv.h.x ft0, zero
; CHECK-NEXT: fneg.h ft0, ft0		; CHECK-NEXT: fneg.h ft0, ft0
; CHECK-NEXT: vsetvli a2, zero, e16, m1, ta, ma		; CHECK-NEXT: vsetvli a2, zero, e16, m1, ta, ma
; CHECK-NEXT: vfmv.v.f v9, ft0		; CHECK-NEXT: vfmv.v.f v9, ft0
; CHECK-NEXT: vsetvli zero, a0, e16, m1, tu, ma		; CHECK-NEXT: vsetvli zero, a0, e16, m1, tu, ma
; CHECK-NEXT: vslideup.vx v8, v9, a1		; CHECK-NEXT: vslideup.vx v8, v9, a1
; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma
; CHECK-NEXT: vfmv.s.f v9, fa0
; CHECK-NEXT: vsetvli a0, zero, e16, m1, ta, ma		; CHECK-NEXT: vsetvli a0, zero, e16, m1, ta, ma
		; CHECK-NEXT: vfmv.s.f v9, fa0
; CHECK-NEXT: vfredusum.vs v8, v8, v9		; CHECK-NEXT: vfredusum.vs v8, v8, v9
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%red = call reassoc half @llvm.vector.reduce.fadd.nxv3f16(half %s, <vscale x 3 x half> %v)		%red = call reassoc half @llvm.vector.reduce.fadd.nxv3f16(half %s, <vscale x 3 x half> %v)
ret half %red		ret half %red
}		}

define half @vreduce_fadd_nxv6f16(<vscale x 6 x half> %v, half %s) {		define half @vreduce_fadd_nxv6f16(<vscale x 6 x half> %v, half %s) {
▲ Show 20 Lines • Show All 67 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/rvv/vreductions-fp-vp.ll

; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py		; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
; RUN: llc -mtriple=riscv32 -mattr=+d,+zfh,+experimental-zvfh,+v -target-abi=ilp32d \		; RUN: llc -mtriple=riscv32 -mattr=+d,+zfh,+experimental-zvfh,+v -target-abi=ilp32d \
; RUN: -verify-machineinstrs < %s \| FileCheck %s		; RUN: -verify-machineinstrs < %s \| FileCheck %s
; RUN: llc -mtriple=riscv64 -mattr=+d,+zfh,+experimental-zvfh,+v -target-abi=lp64d \		; RUN: llc -mtriple=riscv64 -mattr=+d,+zfh,+experimental-zvfh,+v -target-abi=lp64d \
; RUN: -verify-machineinstrs < %s \| FileCheck %s		; RUN: -verify-machineinstrs < %s \| FileCheck %s

declare half @llvm.vp.reduce.fadd.nxv1f16(half, <vscale x 1 x half>, <vscale x 1 x i1>, i32)		declare half @llvm.vp.reduce.fadd.nxv1f16(half, <vscale x 1 x half>, <vscale x 1 x i1>, i32)

define half @vpreduce_fadd_nxv1f16(half %s, <vscale x 1 x half> %v, <vscale x 1 x i1> %m, i32 zeroext %evl) {		define half @vpreduce_fadd_nxv1f16(half %s, <vscale x 1 x half> %v, <vscale x 1 x i1> %m, i32 zeroext %evl) {
; CHECK-LABEL: vpreduce_fadd_nxv1f16:		; CHECK-LABEL: vpreduce_fadd_nxv1f16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma		; CHECK-NEXT: vsetvli zero, a0, e16, mf4, ta, ma
; CHECK-NEXT: vfmv.s.f v9, fa0		; CHECK-NEXT: vfmv.v.f v9, fa0
; CHECK-NEXT: vsetvli zero, a0, e16, mf4, tu, ma		; CHECK-NEXT: vsetvli zero, zero, e16, mf4, tu, ma
; CHECK-NEXT: vfredusum.vs v9, v8, v9, v0.t		; CHECK-NEXT: vfredusum.vs v9, v8, v9, v0.t
; CHECK-NEXT: vfmv.f.s fa0, v9		; CHECK-NEXT: vfmv.f.s fa0, v9
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%r = call reassoc half @llvm.vp.reduce.fadd.nxv1f16(half %s, <vscale x 1 x half> %v, <vscale x 1 x i1> %m, i32 %evl)		%r = call reassoc half @llvm.vp.reduce.fadd.nxv1f16(half %s, <vscale x 1 x half> %v, <vscale x 1 x i1> %m, i32 %evl)
ret half %r		ret half %r
}		}

define half @vpreduce_ord_fadd_nxv1f16(half %s, <vscale x 1 x half> %v, <vscale x 1 x i1> %m, i32 zeroext %evl) {		define half @vpreduce_ord_fadd_nxv1f16(half %s, <vscale x 1 x half> %v, <vscale x 1 x i1> %m, i32 zeroext %evl) {
; CHECK-LABEL: vpreduce_ord_fadd_nxv1f16:		; CHECK-LABEL: vpreduce_ord_fadd_nxv1f16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma		; CHECK-NEXT: vsetvli zero, a0, e16, mf4, ta, ma
; CHECK-NEXT: vfmv.s.f v9, fa0		; CHECK-NEXT: vfmv.v.f v9, fa0
; CHECK-NEXT: vsetvli zero, a0, e16, mf4, tu, ma		; CHECK-NEXT: vsetvli zero, zero, e16, mf4, tu, ma
; CHECK-NEXT: vfredosum.vs v9, v8, v9, v0.t		; CHECK-NEXT: vfredosum.vs v9, v8, v9, v0.t
; CHECK-NEXT: vfmv.f.s fa0, v9		; CHECK-NEXT: vfmv.f.s fa0, v9
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%r = call half @llvm.vp.reduce.fadd.nxv1f16(half %s, <vscale x 1 x half> %v, <vscale x 1 x i1> %m, i32 %evl)		%r = call half @llvm.vp.reduce.fadd.nxv1f16(half %s, <vscale x 1 x half> %v, <vscale x 1 x i1> %m, i32 %evl)
ret half %r		ret half %r
}		}

declare half @llvm.vp.reduce.fadd.nxv2f16(half, <vscale x 2 x half>, <vscale x 2 x i1>, i32)		declare half @llvm.vp.reduce.fadd.nxv2f16(half, <vscale x 2 x half>, <vscale x 2 x i1>, i32)

define half @vpreduce_fadd_nxv2f16(half %s, <vscale x 2 x half> %v, <vscale x 2 x i1> %m, i32 zeroext %evl) {		define half @vpreduce_fadd_nxv2f16(half %s, <vscale x 2 x half> %v, <vscale x 2 x i1> %m, i32 zeroext %evl) {
; CHECK-LABEL: vpreduce_fadd_nxv2f16:		; CHECK-LABEL: vpreduce_fadd_nxv2f16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma		; CHECK-NEXT: vsetvli zero, a0, e16, mf2, ta, ma
; CHECK-NEXT: vfmv.s.f v9, fa0		; CHECK-NEXT: vfmv.v.f v9, fa0
; CHECK-NEXT: vsetvli zero, a0, e16, mf2, tu, ma		; CHECK-NEXT: vsetvli zero, zero, e16, mf2, tu, ma
; CHECK-NEXT: vfredusum.vs v9, v8, v9, v0.t		; CHECK-NEXT: vfredusum.vs v9, v8, v9, v0.t
; CHECK-NEXT: vfmv.f.s fa0, v9		; CHECK-NEXT: vfmv.f.s fa0, v9
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%r = call reassoc half @llvm.vp.reduce.fadd.nxv2f16(half %s, <vscale x 2 x half> %v, <vscale x 2 x i1> %m, i32 %evl)		%r = call reassoc half @llvm.vp.reduce.fadd.nxv2f16(half %s, <vscale x 2 x half> %v, <vscale x 2 x i1> %m, i32 %evl)
ret half %r		ret half %r
}		}

define half @vpreduce_ord_fadd_nxv2f16(half %s, <vscale x 2 x half> %v, <vscale x 2 x i1> %m, i32 zeroext %evl) {		define half @vpreduce_ord_fadd_nxv2f16(half %s, <vscale x 2 x half> %v, <vscale x 2 x i1> %m, i32 zeroext %evl) {
; CHECK-LABEL: vpreduce_ord_fadd_nxv2f16:		; CHECK-LABEL: vpreduce_ord_fadd_nxv2f16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma		; CHECK-NEXT: vsetvli zero, a0, e16, mf2, ta, ma
; CHECK-NEXT: vfmv.s.f v9, fa0		; CHECK-NEXT: vfmv.v.f v9, fa0
; CHECK-NEXT: vsetvli zero, a0, e16, mf2, tu, ma		; CHECK-NEXT: vsetvli zero, zero, e16, mf2, tu, ma
; CHECK-NEXT: vfredosum.vs v9, v8, v9, v0.t		; CHECK-NEXT: vfredosum.vs v9, v8, v9, v0.t
; CHECK-NEXT: vfmv.f.s fa0, v9		; CHECK-NEXT: vfmv.f.s fa0, v9
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%r = call half @llvm.vp.reduce.fadd.nxv2f16(half %s, <vscale x 2 x half> %v, <vscale x 2 x i1> %m, i32 %evl)		%r = call half @llvm.vp.reduce.fadd.nxv2f16(half %s, <vscale x 2 x half> %v, <vscale x 2 x i1> %m, i32 %evl)
ret half %r		ret half %r
}		}

declare half @llvm.vp.reduce.fadd.nxv4f16(half, <vscale x 4 x half>, <vscale x 4 x i1>, i32)		declare half @llvm.vp.reduce.fadd.nxv4f16(half, <vscale x 4 x half>, <vscale x 4 x i1>, i32)

define half @vpreduce_fadd_nxv4f16(half %s, <vscale x 4 x half> %v, <vscale x 4 x i1> %m, i32 zeroext %evl) {		define half @vpreduce_fadd_nxv4f16(half %s, <vscale x 4 x half> %v, <vscale x 4 x i1> %m, i32 zeroext %evl) {
; CHECK-LABEL: vpreduce_fadd_nxv4f16:		; CHECK-LABEL: vpreduce_fadd_nxv4f16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma		; CHECK-NEXT: vsetvli zero, a0, e16, m1, ta, ma
; CHECK-NEXT: vfmv.s.f v9, fa0		; CHECK-NEXT: vfmv.v.f v9, fa0
; CHECK-NEXT: vsetvli zero, a0, e16, m1, tu, ma		; CHECK-NEXT: vsetvli zero, zero, e16, m1, tu, ma
; CHECK-NEXT: vfredusum.vs v9, v8, v9, v0.t		; CHECK-NEXT: vfredusum.vs v9, v8, v9, v0.t
; CHECK-NEXT: vfmv.f.s fa0, v9		; CHECK-NEXT: vfmv.f.s fa0, v9
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%r = call reassoc half @llvm.vp.reduce.fadd.nxv4f16(half %s, <vscale x 4 x half> %v, <vscale x 4 x i1> %m, i32 %evl)		%r = call reassoc half @llvm.vp.reduce.fadd.nxv4f16(half %s, <vscale x 4 x half> %v, <vscale x 4 x i1> %m, i32 %evl)
ret half %r		ret half %r
}		}

define half @vpreduce_ord_fadd_nxv4f16(half %s, <vscale x 4 x half> %v, <vscale x 4 x i1> %m, i32 zeroext %evl) {		define half @vpreduce_ord_fadd_nxv4f16(half %s, <vscale x 4 x half> %v, <vscale x 4 x i1> %m, i32 zeroext %evl) {
; CHECK-LABEL: vpreduce_ord_fadd_nxv4f16:		; CHECK-LABEL: vpreduce_ord_fadd_nxv4f16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma		; CHECK-NEXT: vsetvli zero, a0, e16, m1, ta, ma
; CHECK-NEXT: vfmv.s.f v9, fa0		; CHECK-NEXT: vfmv.v.f v9, fa0
; CHECK-NEXT: vsetvli zero, a0, e16, m1, tu, ma		; CHECK-NEXT: vsetvli zero, zero, e16, m1, tu, ma
; CHECK-NEXT: vfredosum.vs v9, v8, v9, v0.t		; CHECK-NEXT: vfredosum.vs v9, v8, v9, v0.t
; CHECK-NEXT: vfmv.f.s fa0, v9		; CHECK-NEXT: vfmv.f.s fa0, v9
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%r = call half @llvm.vp.reduce.fadd.nxv4f16(half %s, <vscale x 4 x half> %v, <vscale x 4 x i1> %m, i32 %evl)		%r = call half @llvm.vp.reduce.fadd.nxv4f16(half %s, <vscale x 4 x half> %v, <vscale x 4 x i1> %m, i32 %evl)
ret half %r		ret half %r
}		}

declare half @llvm.vp.reduce.fadd.nxv64f16(half, <vscale x 64 x half>, <vscale x 64 x i1>, i32)		declare half @llvm.vp.reduce.fadd.nxv64f16(half, <vscale x 64 x half>, <vscale x 64 x i1>, i32)
▲ Show 20 Lines • Show All 62 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
ret half %r		ret half %r
}		}

declare float @llvm.vp.reduce.fadd.nxv1f32(float, <vscale x 1 x float>, <vscale x 1 x i1>, i32)		declare float @llvm.vp.reduce.fadd.nxv1f32(float, <vscale x 1 x float>, <vscale x 1 x i1>, i32)

define float @vpreduce_fadd_nxv1f32(float %s, <vscale x 1 x float> %v, <vscale x 1 x i1> %m, i32 zeroext %evl) {		define float @vpreduce_fadd_nxv1f32(float %s, <vscale x 1 x float> %v, <vscale x 1 x i1> %m, i32 zeroext %evl) {
; CHECK-LABEL: vpreduce_fadd_nxv1f32:		; CHECK-LABEL: vpreduce_fadd_nxv1f32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vsetvli zero, a0, e32, mf2, ta, ma
; CHECK-NEXT: vfmv.s.f v9, fa0		; CHECK-NEXT: vfmv.v.f v9, fa0
; CHECK-NEXT: vsetvli zero, a0, e32, mf2, tu, ma		; CHECK-NEXT: vsetvli zero, zero, e32, mf2, tu, ma
; CHECK-NEXT: vfredusum.vs v9, v8, v9, v0.t		; CHECK-NEXT: vfredusum.vs v9, v8, v9, v0.t
; CHECK-NEXT: vfmv.f.s fa0, v9		; CHECK-NEXT: vfmv.f.s fa0, v9
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%r = call reassoc float @llvm.vp.reduce.fadd.nxv1f32(float %s, <vscale x 1 x float> %v, <vscale x 1 x i1> %m, i32 %evl)		%r = call reassoc float @llvm.vp.reduce.fadd.nxv1f32(float %s, <vscale x 1 x float> %v, <vscale x 1 x i1> %m, i32 %evl)
ret float %r		ret float %r
}		}

define float @vpreduce_ord_fadd_nxv1f32(float %s, <vscale x 1 x float> %v, <vscale x 1 x i1> %m, i32 zeroext %evl) {		define float @vpreduce_ord_fadd_nxv1f32(float %s, <vscale x 1 x float> %v, <vscale x 1 x i1> %m, i32 zeroext %evl) {
; CHECK-LABEL: vpreduce_ord_fadd_nxv1f32:		; CHECK-LABEL: vpreduce_ord_fadd_nxv1f32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vsetvli zero, a0, e32, mf2, ta, ma
; CHECK-NEXT: vfmv.s.f v9, fa0		; CHECK-NEXT: vfmv.v.f v9, fa0
; CHECK-NEXT: vsetvli zero, a0, e32, mf2, tu, ma		; CHECK-NEXT: vsetvli zero, zero, e32, mf2, tu, ma
; CHECK-NEXT: vfredosum.vs v9, v8, v9, v0.t		; CHECK-NEXT: vfredosum.vs v9, v8, v9, v0.t
; CHECK-NEXT: vfmv.f.s fa0, v9		; CHECK-NEXT: vfmv.f.s fa0, v9
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%r = call float @llvm.vp.reduce.fadd.nxv1f32(float %s, <vscale x 1 x float> %v, <vscale x 1 x i1> %m, i32 %evl)		%r = call float @llvm.vp.reduce.fadd.nxv1f32(float %s, <vscale x 1 x float> %v, <vscale x 1 x i1> %m, i32 %evl)
ret float %r		ret float %r
}		}

declare float @llvm.vp.reduce.fadd.nxv2f32(float, <vscale x 2 x float>, <vscale x 2 x i1>, i32)		declare float @llvm.vp.reduce.fadd.nxv2f32(float, <vscale x 2 x float>, <vscale x 2 x i1>, i32)

define float @vpreduce_fadd_nxv2f32(float %s, <vscale x 2 x float> %v, <vscale x 2 x i1> %m, i32 zeroext %evl) {		define float @vpreduce_fadd_nxv2f32(float %s, <vscale x 2 x float> %v, <vscale x 2 x i1> %m, i32 zeroext %evl) {
; CHECK-LABEL: vpreduce_fadd_nxv2f32:		; CHECK-LABEL: vpreduce_fadd_nxv2f32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vsetvli zero, a0, e32, m1, ta, ma
; CHECK-NEXT: vfmv.s.f v9, fa0		; CHECK-NEXT: vfmv.v.f v9, fa0
; CHECK-NEXT: vsetvli zero, a0, e32, m1, tu, ma		; CHECK-NEXT: vsetvli zero, zero, e32, m1, tu, ma
; CHECK-NEXT: vfredusum.vs v9, v8, v9, v0.t		; CHECK-NEXT: vfredusum.vs v9, v8, v9, v0.t
; CHECK-NEXT: vfmv.f.s fa0, v9		; CHECK-NEXT: vfmv.f.s fa0, v9
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%r = call reassoc float @llvm.vp.reduce.fadd.nxv2f32(float %s, <vscale x 2 x float> %v, <vscale x 2 x i1> %m, i32 %evl)		%r = call reassoc float @llvm.vp.reduce.fadd.nxv2f32(float %s, <vscale x 2 x float> %v, <vscale x 2 x i1> %m, i32 %evl)
ret float %r		ret float %r
}		}

define float @vpreduce_ord_fadd_nxv2f32(float %s, <vscale x 2 x float> %v, <vscale x 2 x i1> %m, i32 zeroext %evl) {		define float @vpreduce_ord_fadd_nxv2f32(float %s, <vscale x 2 x float> %v, <vscale x 2 x i1> %m, i32 zeroext %evl) {
; CHECK-LABEL: vpreduce_ord_fadd_nxv2f32:		; CHECK-LABEL: vpreduce_ord_fadd_nxv2f32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vsetvli zero, a0, e32, m1, ta, ma
; CHECK-NEXT: vfmv.s.f v9, fa0		; CHECK-NEXT: vfmv.v.f v9, fa0
; CHECK-NEXT: vsetvli zero, a0, e32, m1, tu, ma		; CHECK-NEXT: vsetvli zero, zero, e32, m1, tu, ma
; CHECK-NEXT: vfredosum.vs v9, v8, v9, v0.t		; CHECK-NEXT: vfredosum.vs v9, v8, v9, v0.t
; CHECK-NEXT: vfmv.f.s fa0, v9		; CHECK-NEXT: vfmv.f.s fa0, v9
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%r = call float @llvm.vp.reduce.fadd.nxv2f32(float %s, <vscale x 2 x float> %v, <vscale x 2 x i1> %m, i32 %evl)		%r = call float @llvm.vp.reduce.fadd.nxv2f32(float %s, <vscale x 2 x float> %v, <vscale x 2 x i1> %m, i32 %evl)
ret float %r		ret float %r
}		}

declare float @llvm.vp.reduce.fadd.nxv4f32(float, <vscale x 4 x float>, <vscale x 4 x i1>, i32)		declare float @llvm.vp.reduce.fadd.nxv4f32(float, <vscale x 4 x float>, <vscale x 4 x i1>, i32)
Show All 24 Lines	; CHECK-NEXT: ret
ret float %r		ret float %r
}		}

declare double @llvm.vp.reduce.fadd.nxv1f64(double, <vscale x 1 x double>, <vscale x 1 x i1>, i32)		declare double @llvm.vp.reduce.fadd.nxv1f64(double, <vscale x 1 x double>, <vscale x 1 x i1>, i32)

define double @vpreduce_fadd_nxv1f64(double %s, <vscale x 1 x double> %v, <vscale x 1 x i1> %m, i32 zeroext %evl) {		define double @vpreduce_fadd_nxv1f64(double %s, <vscale x 1 x double> %v, <vscale x 1 x i1> %m, i32 zeroext %evl) {
; CHECK-LABEL: vpreduce_fadd_nxv1f64:		; CHECK-LABEL: vpreduce_fadd_nxv1f64:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 1, e64, m1, ta, ma		; CHECK-NEXT: vsetvli zero, a0, e64, m1, ta, ma
; CHECK-NEXT: vfmv.s.f v9, fa0		; CHECK-NEXT: vfmv.v.f v9, fa0
; CHECK-NEXT: vsetvli zero, a0, e64, m1, tu, ma		; CHECK-NEXT: vsetvli zero, zero, e64, m1, tu, ma
; CHECK-NEXT: vfredusum.vs v9, v8, v9, v0.t		; CHECK-NEXT: vfredusum.vs v9, v8, v9, v0.t
; CHECK-NEXT: vfmv.f.s fa0, v9		; CHECK-NEXT: vfmv.f.s fa0, v9
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%r = call reassoc double @llvm.vp.reduce.fadd.nxv1f64(double %s, <vscale x 1 x double> %v, <vscale x 1 x i1> %m, i32 %evl)		%r = call reassoc double @llvm.vp.reduce.fadd.nxv1f64(double %s, <vscale x 1 x double> %v, <vscale x 1 x i1> %m, i32 %evl)
ret double %r		ret double %r
}		}

define double @vpreduce_ord_fadd_nxv1f64(double %s, <vscale x 1 x double> %v, <vscale x 1 x i1> %m, i32 zeroext %evl) {		define double @vpreduce_ord_fadd_nxv1f64(double %s, <vscale x 1 x double> %v, <vscale x 1 x i1> %m, i32 zeroext %evl) {
; CHECK-LABEL: vpreduce_ord_fadd_nxv1f64:		; CHECK-LABEL: vpreduce_ord_fadd_nxv1f64:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 1, e64, m1, ta, ma		; CHECK-NEXT: vsetvli zero, a0, e64, m1, ta, ma
; CHECK-NEXT: vfmv.s.f v9, fa0		; CHECK-NEXT: vfmv.v.f v9, fa0
; CHECK-NEXT: vsetvli zero, a0, e64, m1, tu, ma		; CHECK-NEXT: vsetvli zero, zero, e64, m1, tu, ma
; CHECK-NEXT: vfredosum.vs v9, v8, v9, v0.t		; CHECK-NEXT: vfredosum.vs v9, v8, v9, v0.t
; CHECK-NEXT: vfmv.f.s fa0, v9		; CHECK-NEXT: vfmv.f.s fa0, v9
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%r = call double @llvm.vp.reduce.fadd.nxv1f64(double %s, <vscale x 1 x double> %v, <vscale x 1 x i1> %m, i32 %evl)		%r = call double @llvm.vp.reduce.fadd.nxv1f64(double %s, <vscale x 1 x double> %v, <vscale x 1 x i1> %m, i32 %evl)
ret double %r		ret double %r
}		}

declare double @llvm.vp.reduce.fadd.nxv2f64(double, <vscale x 2 x double>, <vscale x 2 x i1>, i32)		declare double @llvm.vp.reduce.fadd.nxv2f64(double, <vscale x 2 x double>, <vscale x 2 x i1>, i32)
▲ Show 20 Lines • Show All 82 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/rvv/vreductions-int-vp.ll

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: llc -mtriple=riscv32 -mattr=+v -verify-machineinstrs < %s \			; RUN: llc -mtriple=riscv32 -mattr=+v -verify-machineinstrs < %s \
	; RUN: \| FileCheck %s --check-prefixes=CHECK,RV32			; RUN: \| FileCheck %s --check-prefixes=CHECK,RV32
	; RUN: llc -mtriple=riscv64 -mattr=+v -verify-machineinstrs < %s \			; RUN: llc -mtriple=riscv64 -mattr=+v -verify-machineinstrs < %s \
	; RUN: \| FileCheck %s --check-prefixes=CHECK,RV64			; RUN: \| FileCheck %s --check-prefixes=CHECK,RV64

	declare i8 @llvm.vp.reduce.add.nxv1i8(i8, <vscale x 1 x i8>, <vscale x 1 x i1>, i32)			declare i8 @llvm.vp.reduce.add.nxv1i8(i8, <vscale x 1 x i8>, <vscale x 1 x i1>, i32)

	define signext i8 @vpreduce_add_nxv1i8(i8 signext %s, <vscale x 1 x i8> %v, <vscale x 1 x i1> %m, i32 zeroext %evl) {			define signext i8 @vpreduce_add_nxv1i8(i8 signext %s, <vscale x 1 x i8> %v, <vscale x 1 x i1> %m, i32 zeroext %evl) {
	; CHECK-LABEL: vpreduce_add_nxv1i8:			; CHECK-LABEL: vpreduce_add_nxv1i8:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e8, m1, ta, ma			; CHECK-NEXT: vsetvli zero, a1, e8, mf8, ta, ma
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.v.x v9, a0
	; CHECK-NEXT: vsetvli zero, a1, e8, mf8, tu, ma			; CHECK-NEXT: vsetvli zero, zero, e8, mf8, tu, ma
	; CHECK-NEXT: vredsum.vs v9, v8, v9, v0.t			; CHECK-NEXT: vredsum.vs v9, v8, v9, v0.t
	; CHECK-NEXT: vmv.x.s a0, v9			; CHECK-NEXT: vmv.x.s a0, v9
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call i8 @llvm.vp.reduce.add.nxv1i8(i8 %s, <vscale x 1 x i8> %v, <vscale x 1 x i1> %m, i32 %evl)			%r = call i8 @llvm.vp.reduce.add.nxv1i8(i8 %s, <vscale x 1 x i8> %v, <vscale x 1 x i1> %m, i32 %evl)
	ret i8 %r			ret i8 %r
	}			}

	declare i8 @llvm.vp.reduce.umax.nxv1i8(i8, <vscale x 1 x i8>, <vscale x 1 x i1>, i32)			declare i8 @llvm.vp.reduce.umax.nxv1i8(i8, <vscale x 1 x i8>, <vscale x 1 x i1>, i32)

	define signext i8 @vpreduce_umax_nxv1i8(i8 signext %s, <vscale x 1 x i8> %v, <vscale x 1 x i1> %m, i32 zeroext %evl) {			define signext i8 @vpreduce_umax_nxv1i8(i8 signext %s, <vscale x 1 x i8> %v, <vscale x 1 x i1> %m, i32 zeroext %evl) {
	; CHECK-LABEL: vpreduce_umax_nxv1i8:			; CHECK-LABEL: vpreduce_umax_nxv1i8:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: andi a0, a0, 255			; CHECK-NEXT: vsetvli zero, a1, e8, mf8, ta, ma
	; CHECK-NEXT: vsetivli zero, 1, e8, m1, ta, ma			; CHECK-NEXT: vmv.v.x v9, a0
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vsetvli zero, zero, e8, mf8, tu, ma
	; CHECK-NEXT: vsetvli zero, a1, e8, mf8, tu, ma
	; CHECK-NEXT: vredmaxu.vs v9, v8, v9, v0.t			; CHECK-NEXT: vredmaxu.vs v9, v8, v9, v0.t
	; CHECK-NEXT: vmv.x.s a0, v9			; CHECK-NEXT: vmv.x.s a0, v9
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call i8 @llvm.vp.reduce.umax.nxv1i8(i8 %s, <vscale x 1 x i8> %v, <vscale x 1 x i1> %m, i32 %evl)			%r = call i8 @llvm.vp.reduce.umax.nxv1i8(i8 %s, <vscale x 1 x i8> %v, <vscale x 1 x i1> %m, i32 %evl)
	ret i8 %r			ret i8 %r
	}			}

	declare i8 @llvm.vp.reduce.smax.nxv1i8(i8, <vscale x 1 x i8>, <vscale x 1 x i1>, i32)			declare i8 @llvm.vp.reduce.smax.nxv1i8(i8, <vscale x 1 x i8>, <vscale x 1 x i1>, i32)

	define signext i8 @vpreduce_smax_nxv1i8(i8 signext %s, <vscale x 1 x i8> %v, <vscale x 1 x i1> %m, i32 zeroext %evl) {			define signext i8 @vpreduce_smax_nxv1i8(i8 signext %s, <vscale x 1 x i8> %v, <vscale x 1 x i1> %m, i32 zeroext %evl) {
	; CHECK-LABEL: vpreduce_smax_nxv1i8:			; CHECK-LABEL: vpreduce_smax_nxv1i8:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e8, m1, ta, ma			; CHECK-NEXT: vsetvli zero, a1, e8, mf8, ta, ma
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.v.x v9, a0
	; CHECK-NEXT: vsetvli zero, a1, e8, mf8, tu, ma			; CHECK-NEXT: vsetvli zero, zero, e8, mf8, tu, ma
	; CHECK-NEXT: vredmax.vs v9, v8, v9, v0.t			; CHECK-NEXT: vredmax.vs v9, v8, v9, v0.t
	; CHECK-NEXT: vmv.x.s a0, v9			; CHECK-NEXT: vmv.x.s a0, v9
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call i8 @llvm.vp.reduce.smax.nxv1i8(i8 %s, <vscale x 1 x i8> %v, <vscale x 1 x i1> %m, i32 %evl)			%r = call i8 @llvm.vp.reduce.smax.nxv1i8(i8 %s, <vscale x 1 x i8> %v, <vscale x 1 x i1> %m, i32 %evl)
	ret i8 %r			ret i8 %r
	}			}

	declare i8 @llvm.vp.reduce.umin.nxv1i8(i8, <vscale x 1 x i8>, <vscale x 1 x i1>, i32)			declare i8 @llvm.vp.reduce.umin.nxv1i8(i8, <vscale x 1 x i8>, <vscale x 1 x i1>, i32)

	define signext i8 @vpreduce_umin_nxv1i8(i8 signext %s, <vscale x 1 x i8> %v, <vscale x 1 x i1> %m, i32 zeroext %evl) {			define signext i8 @vpreduce_umin_nxv1i8(i8 signext %s, <vscale x 1 x i8> %v, <vscale x 1 x i1> %m, i32 zeroext %evl) {
	; CHECK-LABEL: vpreduce_umin_nxv1i8:			; CHECK-LABEL: vpreduce_umin_nxv1i8:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: andi a0, a0, 255			; CHECK-NEXT: vsetvli zero, a1, e8, mf8, ta, ma
	; CHECK-NEXT: vsetivli zero, 1, e8, m1, ta, ma			; CHECK-NEXT: vmv.v.x v9, a0
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vsetvli zero, zero, e8, mf8, tu, ma
	; CHECK-NEXT: vsetvli zero, a1, e8, mf8, tu, ma
	; CHECK-NEXT: vredminu.vs v9, v8, v9, v0.t			; CHECK-NEXT: vredminu.vs v9, v8, v9, v0.t
	; CHECK-NEXT: vmv.x.s a0, v9			; CHECK-NEXT: vmv.x.s a0, v9
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call i8 @llvm.vp.reduce.umin.nxv1i8(i8 %s, <vscale x 1 x i8> %v, <vscale x 1 x i1> %m, i32 %evl)			%r = call i8 @llvm.vp.reduce.umin.nxv1i8(i8 %s, <vscale x 1 x i8> %v, <vscale x 1 x i1> %m, i32 %evl)
	ret i8 %r			ret i8 %r
	}			}

	declare i8 @llvm.vp.reduce.smin.nxv1i8(i8, <vscale x 1 x i8>, <vscale x 1 x i1>, i32)			declare i8 @llvm.vp.reduce.smin.nxv1i8(i8, <vscale x 1 x i8>, <vscale x 1 x i1>, i32)

	define signext i8 @vpreduce_smin_nxv1i8(i8 signext %s, <vscale x 1 x i8> %v, <vscale x 1 x i1> %m, i32 zeroext %evl) {			define signext i8 @vpreduce_smin_nxv1i8(i8 signext %s, <vscale x 1 x i8> %v, <vscale x 1 x i1> %m, i32 zeroext %evl) {
	; CHECK-LABEL: vpreduce_smin_nxv1i8:			; CHECK-LABEL: vpreduce_smin_nxv1i8:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e8, m1, ta, ma			; CHECK-NEXT: vsetvli zero, a1, e8, mf8, ta, ma
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.v.x v9, a0
	; CHECK-NEXT: vsetvli zero, a1, e8, mf8, tu, ma			; CHECK-NEXT: vsetvli zero, zero, e8, mf8, tu, ma
	; CHECK-NEXT: vredmin.vs v9, v8, v9, v0.t			; CHECK-NEXT: vredmin.vs v9, v8, v9, v0.t
	; CHECK-NEXT: vmv.x.s a0, v9			; CHECK-NEXT: vmv.x.s a0, v9
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call i8 @llvm.vp.reduce.smin.nxv1i8(i8 %s, <vscale x 1 x i8> %v, <vscale x 1 x i1> %m, i32 %evl)			%r = call i8 @llvm.vp.reduce.smin.nxv1i8(i8 %s, <vscale x 1 x i8> %v, <vscale x 1 x i1> %m, i32 %evl)
	ret i8 %r			ret i8 %r
	}			}

	declare i8 @llvm.vp.reduce.and.nxv1i8(i8, <vscale x 1 x i8>, <vscale x 1 x i1>, i32)			declare i8 @llvm.vp.reduce.and.nxv1i8(i8, <vscale x 1 x i8>, <vscale x 1 x i1>, i32)

	define signext i8 @vpreduce_and_nxv1i8(i8 signext %s, <vscale x 1 x i8> %v, <vscale x 1 x i1> %m, i32 zeroext %evl) {			define signext i8 @vpreduce_and_nxv1i8(i8 signext %s, <vscale x 1 x i8> %v, <vscale x 1 x i1> %m, i32 zeroext %evl) {
	; CHECK-LABEL: vpreduce_and_nxv1i8:			; CHECK-LABEL: vpreduce_and_nxv1i8:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e8, m1, ta, ma			; CHECK-NEXT: vsetvli zero, a1, e8, mf8, ta, ma
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.v.x v9, a0
	; CHECK-NEXT: vsetvli zero, a1, e8, mf8, tu, ma			; CHECK-NEXT: vsetvli zero, zero, e8, mf8, tu, ma
	; CHECK-NEXT: vredand.vs v9, v8, v9, v0.t			; CHECK-NEXT: vredand.vs v9, v8, v9, v0.t
	; CHECK-NEXT: vmv.x.s a0, v9			; CHECK-NEXT: vmv.x.s a0, v9
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call i8 @llvm.vp.reduce.and.nxv1i8(i8 %s, <vscale x 1 x i8> %v, <vscale x 1 x i1> %m, i32 %evl)			%r = call i8 @llvm.vp.reduce.and.nxv1i8(i8 %s, <vscale x 1 x i8> %v, <vscale x 1 x i1> %m, i32 %evl)
	ret i8 %r			ret i8 %r
	}			}

	declare i8 @llvm.vp.reduce.or.nxv1i8(i8, <vscale x 1 x i8>, <vscale x 1 x i1>, i32)			declare i8 @llvm.vp.reduce.or.nxv1i8(i8, <vscale x 1 x i8>, <vscale x 1 x i1>, i32)

	define signext i8 @vpreduce_or_nxv1i8(i8 signext %s, <vscale x 1 x i8> %v, <vscale x 1 x i1> %m, i32 zeroext %evl) {			define signext i8 @vpreduce_or_nxv1i8(i8 signext %s, <vscale x 1 x i8> %v, <vscale x 1 x i1> %m, i32 zeroext %evl) {
	; CHECK-LABEL: vpreduce_or_nxv1i8:			; CHECK-LABEL: vpreduce_or_nxv1i8:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e8, m1, ta, ma			; CHECK-NEXT: vsetvli zero, a1, e8, mf8, ta, ma
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.v.x v9, a0
	; CHECK-NEXT: vsetvli zero, a1, e8, mf8, tu, ma			; CHECK-NEXT: vsetvli zero, zero, e8, mf8, tu, ma
	; CHECK-NEXT: vredor.vs v9, v8, v9, v0.t			; CHECK-NEXT: vredor.vs v9, v8, v9, v0.t
	; CHECK-NEXT: vmv.x.s a0, v9			; CHECK-NEXT: vmv.x.s a0, v9
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call i8 @llvm.vp.reduce.or.nxv1i8(i8 %s, <vscale x 1 x i8> %v, <vscale x 1 x i1> %m, i32 %evl)			%r = call i8 @llvm.vp.reduce.or.nxv1i8(i8 %s, <vscale x 1 x i8> %v, <vscale x 1 x i1> %m, i32 %evl)
	ret i8 %r			ret i8 %r
	}			}

	declare i8 @llvm.vp.reduce.xor.nxv1i8(i8, <vscale x 1 x i8>, <vscale x 1 x i1>, i32)			declare i8 @llvm.vp.reduce.xor.nxv1i8(i8, <vscale x 1 x i8>, <vscale x 1 x i1>, i32)

	define signext i8 @vpreduce_xor_nxv1i8(i8 signext %s, <vscale x 1 x i8> %v, <vscale x 1 x i1> %m, i32 zeroext %evl) {			define signext i8 @vpreduce_xor_nxv1i8(i8 signext %s, <vscale x 1 x i8> %v, <vscale x 1 x i1> %m, i32 zeroext %evl) {
	; CHECK-LABEL: vpreduce_xor_nxv1i8:			; CHECK-LABEL: vpreduce_xor_nxv1i8:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e8, m1, ta, ma			; CHECK-NEXT: vsetvli zero, a1, e8, mf8, ta, ma
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.v.x v9, a0
	; CHECK-NEXT: vsetvli zero, a1, e8, mf8, tu, ma			; CHECK-NEXT: vsetvli zero, zero, e8, mf8, tu, ma
	; CHECK-NEXT: vredxor.vs v9, v8, v9, v0.t			; CHECK-NEXT: vredxor.vs v9, v8, v9, v0.t
	; CHECK-NEXT: vmv.x.s a0, v9			; CHECK-NEXT: vmv.x.s a0, v9
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call i8 @llvm.vp.reduce.xor.nxv1i8(i8 %s, <vscale x 1 x i8> %v, <vscale x 1 x i1> %m, i32 %evl)			%r = call i8 @llvm.vp.reduce.xor.nxv1i8(i8 %s, <vscale x 1 x i8> %v, <vscale x 1 x i1> %m, i32 %evl)
	ret i8 %r			ret i8 %r
	}			}

	declare i8 @llvm.vp.reduce.add.nxv2i8(i8, <vscale x 2 x i8>, <vscale x 2 x i1>, i32)			declare i8 @llvm.vp.reduce.add.nxv2i8(i8, <vscale x 2 x i8>, <vscale x 2 x i1>, i32)

	define signext i8 @vpreduce_add_nxv2i8(i8 signext %s, <vscale x 2 x i8> %v, <vscale x 2 x i1> %m, i32 zeroext %evl) {			define signext i8 @vpreduce_add_nxv2i8(i8 signext %s, <vscale x 2 x i8> %v, <vscale x 2 x i1> %m, i32 zeroext %evl) {
	; CHECK-LABEL: vpreduce_add_nxv2i8:			; CHECK-LABEL: vpreduce_add_nxv2i8:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e8, m1, ta, ma			; CHECK-NEXT: vsetvli zero, a1, e8, mf4, ta, ma
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.v.x v9, a0
	; CHECK-NEXT: vsetvli zero, a1, e8, mf4, tu, ma			; CHECK-NEXT: vsetvli zero, zero, e8, mf4, tu, ma
	; CHECK-NEXT: vredsum.vs v9, v8, v9, v0.t			; CHECK-NEXT: vredsum.vs v9, v8, v9, v0.t
	; CHECK-NEXT: vmv.x.s a0, v9			; CHECK-NEXT: vmv.x.s a0, v9
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call i8 @llvm.vp.reduce.add.nxv2i8(i8 %s, <vscale x 2 x i8> %v, <vscale x 2 x i1> %m, i32 %evl)			%r = call i8 @llvm.vp.reduce.add.nxv2i8(i8 %s, <vscale x 2 x i8> %v, <vscale x 2 x i1> %m, i32 %evl)
	ret i8 %r			ret i8 %r
	}			}

	declare i8 @llvm.vp.reduce.umax.nxv2i8(i8, <vscale x 2 x i8>, <vscale x 2 x i1>, i32)			declare i8 @llvm.vp.reduce.umax.nxv2i8(i8, <vscale x 2 x i8>, <vscale x 2 x i1>, i32)

	define signext i8 @vpreduce_umax_nxv2i8(i8 signext %s, <vscale x 2 x i8> %v, <vscale x 2 x i1> %m, i32 zeroext %evl) {			define signext i8 @vpreduce_umax_nxv2i8(i8 signext %s, <vscale x 2 x i8> %v, <vscale x 2 x i1> %m, i32 zeroext %evl) {
	; CHECK-LABEL: vpreduce_umax_nxv2i8:			; CHECK-LABEL: vpreduce_umax_nxv2i8:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: andi a0, a0, 255			; CHECK-NEXT: vsetvli zero, a1, e8, mf4, ta, ma
	; CHECK-NEXT: vsetivli zero, 1, e8, m1, ta, ma			; CHECK-NEXT: vmv.v.x v9, a0
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vsetvli zero, zero, e8, mf4, tu, ma
	; CHECK-NEXT: vsetvli zero, a1, e8, mf4, tu, ma
	; CHECK-NEXT: vredmaxu.vs v9, v8, v9, v0.t			; CHECK-NEXT: vredmaxu.vs v9, v8, v9, v0.t
	; CHECK-NEXT: vmv.x.s a0, v9			; CHECK-NEXT: vmv.x.s a0, v9
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call i8 @llvm.vp.reduce.umax.nxv2i8(i8 %s, <vscale x 2 x i8> %v, <vscale x 2 x i1> %m, i32 %evl)			%r = call i8 @llvm.vp.reduce.umax.nxv2i8(i8 %s, <vscale x 2 x i8> %v, <vscale x 2 x i1> %m, i32 %evl)
	ret i8 %r			ret i8 %r
	}			}

	declare i8 @llvm.vp.reduce.smax.nxv2i8(i8, <vscale x 2 x i8>, <vscale x 2 x i1>, i32)			declare i8 @llvm.vp.reduce.smax.nxv2i8(i8, <vscale x 2 x i8>, <vscale x 2 x i1>, i32)

	define signext i8 @vpreduce_smax_nxv2i8(i8 signext %s, <vscale x 2 x i8> %v, <vscale x 2 x i1> %m, i32 zeroext %evl) {			define signext i8 @vpreduce_smax_nxv2i8(i8 signext %s, <vscale x 2 x i8> %v, <vscale x 2 x i1> %m, i32 zeroext %evl) {
	; CHECK-LABEL: vpreduce_smax_nxv2i8:			; CHECK-LABEL: vpreduce_smax_nxv2i8:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e8, m1, ta, ma			; CHECK-NEXT: vsetvli zero, a1, e8, mf4, ta, ma
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.v.x v9, a0
	; CHECK-NEXT: vsetvli zero, a1, e8, mf4, tu, ma			; CHECK-NEXT: vsetvli zero, zero, e8, mf4, tu, ma
	; CHECK-NEXT: vredmax.vs v9, v8, v9, v0.t			; CHECK-NEXT: vredmax.vs v9, v8, v9, v0.t
	; CHECK-NEXT: vmv.x.s a0, v9			; CHECK-NEXT: vmv.x.s a0, v9
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call i8 @llvm.vp.reduce.smax.nxv2i8(i8 %s, <vscale x 2 x i8> %v, <vscale x 2 x i1> %m, i32 %evl)			%r = call i8 @llvm.vp.reduce.smax.nxv2i8(i8 %s, <vscale x 2 x i8> %v, <vscale x 2 x i1> %m, i32 %evl)
	ret i8 %r			ret i8 %r
	}			}

	declare i8 @llvm.vp.reduce.umin.nxv2i8(i8, <vscale x 2 x i8>, <vscale x 2 x i1>, i32)			declare i8 @llvm.vp.reduce.umin.nxv2i8(i8, <vscale x 2 x i8>, <vscale x 2 x i1>, i32)

	define signext i8 @vpreduce_umin_nxv2i8(i8 signext %s, <vscale x 2 x i8> %v, <vscale x 2 x i1> %m, i32 zeroext %evl) {			define signext i8 @vpreduce_umin_nxv2i8(i8 signext %s, <vscale x 2 x i8> %v, <vscale x 2 x i1> %m, i32 zeroext %evl) {
	; CHECK-LABEL: vpreduce_umin_nxv2i8:			; CHECK-LABEL: vpreduce_umin_nxv2i8:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: andi a0, a0, 255			; CHECK-NEXT: vsetvli zero, a1, e8, mf4, ta, ma
	; CHECK-NEXT: vsetivli zero, 1, e8, m1, ta, ma			; CHECK-NEXT: vmv.v.x v9, a0
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vsetvli zero, zero, e8, mf4, tu, ma
	; CHECK-NEXT: vsetvli zero, a1, e8, mf4, tu, ma
	; CHECK-NEXT: vredminu.vs v9, v8, v9, v0.t			; CHECK-NEXT: vredminu.vs v9, v8, v9, v0.t
	; CHECK-NEXT: vmv.x.s a0, v9			; CHECK-NEXT: vmv.x.s a0, v9
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call i8 @llvm.vp.reduce.umin.nxv2i8(i8 %s, <vscale x 2 x i8> %v, <vscale x 2 x i1> %m, i32 %evl)			%r = call i8 @llvm.vp.reduce.umin.nxv2i8(i8 %s, <vscale x 2 x i8> %v, <vscale x 2 x i1> %m, i32 %evl)
	ret i8 %r			ret i8 %r
	}			}

	declare i8 @llvm.vp.reduce.smin.nxv2i8(i8, <vscale x 2 x i8>, <vscale x 2 x i1>, i32)			declare i8 @llvm.vp.reduce.smin.nxv2i8(i8, <vscale x 2 x i8>, <vscale x 2 x i1>, i32)

	define signext i8 @vpreduce_smin_nxv2i8(i8 signext %s, <vscale x 2 x i8> %v, <vscale x 2 x i1> %m, i32 zeroext %evl) {			define signext i8 @vpreduce_smin_nxv2i8(i8 signext %s, <vscale x 2 x i8> %v, <vscale x 2 x i1> %m, i32 zeroext %evl) {
	; CHECK-LABEL: vpreduce_smin_nxv2i8:			; CHECK-LABEL: vpreduce_smin_nxv2i8:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e8, m1, ta, ma			; CHECK-NEXT: vsetvli zero, a1, e8, mf4, ta, ma
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.v.x v9, a0
	; CHECK-NEXT: vsetvli zero, a1, e8, mf4, tu, ma			; CHECK-NEXT: vsetvli zero, zero, e8, mf4, tu, ma
	; CHECK-NEXT: vredmin.vs v9, v8, v9, v0.t			; CHECK-NEXT: vredmin.vs v9, v8, v9, v0.t
	; CHECK-NEXT: vmv.x.s a0, v9			; CHECK-NEXT: vmv.x.s a0, v9
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call i8 @llvm.vp.reduce.smin.nxv2i8(i8 %s, <vscale x 2 x i8> %v, <vscale x 2 x i1> %m, i32 %evl)			%r = call i8 @llvm.vp.reduce.smin.nxv2i8(i8 %s, <vscale x 2 x i8> %v, <vscale x 2 x i1> %m, i32 %evl)
	ret i8 %r			ret i8 %r
	}			}

	declare i8 @llvm.vp.reduce.and.nxv2i8(i8, <vscale x 2 x i8>, <vscale x 2 x i1>, i32)			declare i8 @llvm.vp.reduce.and.nxv2i8(i8, <vscale x 2 x i8>, <vscale x 2 x i1>, i32)

	define signext i8 @vpreduce_and_nxv2i8(i8 signext %s, <vscale x 2 x i8> %v, <vscale x 2 x i1> %m, i32 zeroext %evl) {			define signext i8 @vpreduce_and_nxv2i8(i8 signext %s, <vscale x 2 x i8> %v, <vscale x 2 x i1> %m, i32 zeroext %evl) {
	; CHECK-LABEL: vpreduce_and_nxv2i8:			; CHECK-LABEL: vpreduce_and_nxv2i8:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e8, m1, ta, ma			; CHECK-NEXT: vsetvli zero, a1, e8, mf4, ta, ma
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.v.x v9, a0
	; CHECK-NEXT: vsetvli zero, a1, e8, mf4, tu, ma			; CHECK-NEXT: vsetvli zero, zero, e8, mf4, tu, ma
	; CHECK-NEXT: vredand.vs v9, v8, v9, v0.t			; CHECK-NEXT: vredand.vs v9, v8, v9, v0.t
	; CHECK-NEXT: vmv.x.s a0, v9			; CHECK-NEXT: vmv.x.s a0, v9
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call i8 @llvm.vp.reduce.and.nxv2i8(i8 %s, <vscale x 2 x i8> %v, <vscale x 2 x i1> %m, i32 %evl)			%r = call i8 @llvm.vp.reduce.and.nxv2i8(i8 %s, <vscale x 2 x i8> %v, <vscale x 2 x i1> %m, i32 %evl)
	ret i8 %r			ret i8 %r
	}			}

	declare i8 @llvm.vp.reduce.or.nxv2i8(i8, <vscale x 2 x i8>, <vscale x 2 x i1>, i32)			declare i8 @llvm.vp.reduce.or.nxv2i8(i8, <vscale x 2 x i8>, <vscale x 2 x i1>, i32)

	define signext i8 @vpreduce_or_nxv2i8(i8 signext %s, <vscale x 2 x i8> %v, <vscale x 2 x i1> %m, i32 zeroext %evl) {			define signext i8 @vpreduce_or_nxv2i8(i8 signext %s, <vscale x 2 x i8> %v, <vscale x 2 x i1> %m, i32 zeroext %evl) {
	; CHECK-LABEL: vpreduce_or_nxv2i8:			; CHECK-LABEL: vpreduce_or_nxv2i8:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e8, m1, ta, ma			; CHECK-NEXT: vsetvli zero, a1, e8, mf4, ta, ma
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.v.x v9, a0
	; CHECK-NEXT: vsetvli zero, a1, e8, mf4, tu, ma			; CHECK-NEXT: vsetvli zero, zero, e8, mf4, tu, ma
	; CHECK-NEXT: vredor.vs v9, v8, v9, v0.t			; CHECK-NEXT: vredor.vs v9, v8, v9, v0.t
	; CHECK-NEXT: vmv.x.s a0, v9			; CHECK-NEXT: vmv.x.s a0, v9
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call i8 @llvm.vp.reduce.or.nxv2i8(i8 %s, <vscale x 2 x i8> %v, <vscale x 2 x i1> %m, i32 %evl)			%r = call i8 @llvm.vp.reduce.or.nxv2i8(i8 %s, <vscale x 2 x i8> %v, <vscale x 2 x i1> %m, i32 %evl)
	ret i8 %r			ret i8 %r
	}			}

	declare i8 @llvm.vp.reduce.xor.nxv2i8(i8, <vscale x 2 x i8>, <vscale x 2 x i1>, i32)			declare i8 @llvm.vp.reduce.xor.nxv2i8(i8, <vscale x 2 x i8>, <vscale x 2 x i1>, i32)

	define signext i8 @vpreduce_xor_nxv2i8(i8 signext %s, <vscale x 2 x i8> %v, <vscale x 2 x i1> %m, i32 zeroext %evl) {			define signext i8 @vpreduce_xor_nxv2i8(i8 signext %s, <vscale x 2 x i8> %v, <vscale x 2 x i1> %m, i32 zeroext %evl) {
	; CHECK-LABEL: vpreduce_xor_nxv2i8:			; CHECK-LABEL: vpreduce_xor_nxv2i8:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e8, m1, ta, ma			; CHECK-NEXT: vsetvli zero, a1, e8, mf4, ta, ma
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.v.x v9, a0
	; CHECK-NEXT: vsetvli zero, a1, e8, mf4, tu, ma			; CHECK-NEXT: vsetvli zero, zero, e8, mf4, tu, ma
	; CHECK-NEXT: vredxor.vs v9, v8, v9, v0.t			; CHECK-NEXT: vredxor.vs v9, v8, v9, v0.t
	; CHECK-NEXT: vmv.x.s a0, v9			; CHECK-NEXT: vmv.x.s a0, v9
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call i8 @llvm.vp.reduce.xor.nxv2i8(i8 %s, <vscale x 2 x i8> %v, <vscale x 2 x i1> %m, i32 %evl)			%r = call i8 @llvm.vp.reduce.xor.nxv2i8(i8 %s, <vscale x 2 x i8> %v, <vscale x 2 x i1> %m, i32 %evl)
	ret i8 %r			ret i8 %r
	}			}

	declare i8 @llvm.vp.reduce.smax.nxv3i8(i8, <vscale x 3 x i8>, <vscale x 3 x i1>, i32)			declare i8 @llvm.vp.reduce.smax.nxv3i8(i8, <vscale x 3 x i8>, <vscale x 3 x i1>, i32)

	define signext i8 @vpreduce_smax_nxv3i8(i8 signext %s, <vscale x 3 x i8> %v, <vscale x 3 x i1> %m, i32 zeroext %evl) {			define signext i8 @vpreduce_smax_nxv3i8(i8 signext %s, <vscale x 3 x i8> %v, <vscale x 3 x i1> %m, i32 zeroext %evl) {
	; CHECK-LABEL: vpreduce_smax_nxv3i8:			; CHECK-LABEL: vpreduce_smax_nxv3i8:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e8, m1, ta, ma			; CHECK-NEXT: vsetvli zero, a1, e8, mf2, ta, ma
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.v.x v9, a0
	; CHECK-NEXT: vsetvli zero, a1, e8, mf2, tu, ma			; CHECK-NEXT: vsetvli zero, zero, e8, mf2, tu, ma
	; CHECK-NEXT: vredmax.vs v9, v8, v9, v0.t			; CHECK-NEXT: vredmax.vs v9, v8, v9, v0.t
	; CHECK-NEXT: vmv.x.s a0, v9			; CHECK-NEXT: vmv.x.s a0, v9
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call i8 @llvm.vp.reduce.smax.nxv3i8(i8 %s, <vscale x 3 x i8> %v, <vscale x 3 x i1> %m, i32 %evl)			%r = call i8 @llvm.vp.reduce.smax.nxv3i8(i8 %s, <vscale x 3 x i8> %v, <vscale x 3 x i1> %m, i32 %evl)
	ret i8 %r			ret i8 %r
	}			}

	declare i8 @llvm.vp.reduce.add.nxv4i8(i8, <vscale x 4 x i8>, <vscale x 4 x i1>, i32)			declare i8 @llvm.vp.reduce.add.nxv4i8(i8, <vscale x 4 x i8>, <vscale x 4 x i1>, i32)

	define signext i8 @vpreduce_add_nxv4i8(i8 signext %s, <vscale x 4 x i8> %v, <vscale x 4 x i1> %m, i32 zeroext %evl) {			define signext i8 @vpreduce_add_nxv4i8(i8 signext %s, <vscale x 4 x i8> %v, <vscale x 4 x i1> %m, i32 zeroext %evl) {
	; CHECK-LABEL: vpreduce_add_nxv4i8:			; CHECK-LABEL: vpreduce_add_nxv4i8:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e8, m1, ta, ma			; CHECK-NEXT: vsetvli zero, a1, e8, mf2, ta, ma
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.v.x v9, a0
	; CHECK-NEXT: vsetvli zero, a1, e8, mf2, tu, ma			; CHECK-NEXT: vsetvli zero, zero, e8, mf2, tu, ma
	; CHECK-NEXT: vredsum.vs v9, v8, v9, v0.t			; CHECK-NEXT: vredsum.vs v9, v8, v9, v0.t
	; CHECK-NEXT: vmv.x.s a0, v9			; CHECK-NEXT: vmv.x.s a0, v9
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call i8 @llvm.vp.reduce.add.nxv4i8(i8 %s, <vscale x 4 x i8> %v, <vscale x 4 x i1> %m, i32 %evl)			%r = call i8 @llvm.vp.reduce.add.nxv4i8(i8 %s, <vscale x 4 x i8> %v, <vscale x 4 x i1> %m, i32 %evl)
	ret i8 %r			ret i8 %r
	}			}

	declare i8 @llvm.vp.reduce.umax.nxv4i8(i8, <vscale x 4 x i8>, <vscale x 4 x i1>, i32)			declare i8 @llvm.vp.reduce.umax.nxv4i8(i8, <vscale x 4 x i8>, <vscale x 4 x i1>, i32)

	define signext i8 @vpreduce_umax_nxv4i8(i8 signext %s, <vscale x 4 x i8> %v, <vscale x 4 x i1> %m, i32 zeroext %evl) {			define signext i8 @vpreduce_umax_nxv4i8(i8 signext %s, <vscale x 4 x i8> %v, <vscale x 4 x i1> %m, i32 zeroext %evl) {
	; CHECK-LABEL: vpreduce_umax_nxv4i8:			; CHECK-LABEL: vpreduce_umax_nxv4i8:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: andi a0, a0, 255			; CHECK-NEXT: vsetvli zero, a1, e8, mf2, ta, ma
	; CHECK-NEXT: vsetivli zero, 1, e8, m1, ta, ma			; CHECK-NEXT: vmv.v.x v9, a0
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vsetvli zero, zero, e8, mf2, tu, ma
	; CHECK-NEXT: vsetvli zero, a1, e8, mf2, tu, ma
	; CHECK-NEXT: vredmaxu.vs v9, v8, v9, v0.t			; CHECK-NEXT: vredmaxu.vs v9, v8, v9, v0.t
	; CHECK-NEXT: vmv.x.s a0, v9			; CHECK-NEXT: vmv.x.s a0, v9
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call i8 @llvm.vp.reduce.umax.nxv4i8(i8 %s, <vscale x 4 x i8> %v, <vscale x 4 x i1> %m, i32 %evl)			%r = call i8 @llvm.vp.reduce.umax.nxv4i8(i8 %s, <vscale x 4 x i8> %v, <vscale x 4 x i1> %m, i32 %evl)
	ret i8 %r			ret i8 %r
	}			}

	declare i8 @llvm.vp.reduce.smax.nxv4i8(i8, <vscale x 4 x i8>, <vscale x 4 x i1>, i32)			declare i8 @llvm.vp.reduce.smax.nxv4i8(i8, <vscale x 4 x i8>, <vscale x 4 x i1>, i32)

	define signext i8 @vpreduce_smax_nxv4i8(i8 signext %s, <vscale x 4 x i8> %v, <vscale x 4 x i1> %m, i32 zeroext %evl) {			define signext i8 @vpreduce_smax_nxv4i8(i8 signext %s, <vscale x 4 x i8> %v, <vscale x 4 x i1> %m, i32 zeroext %evl) {
	; CHECK-LABEL: vpreduce_smax_nxv4i8:			; CHECK-LABEL: vpreduce_smax_nxv4i8:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e8, m1, ta, ma			; CHECK-NEXT: vsetvli zero, a1, e8, mf2, ta, ma
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.v.x v9, a0
	; CHECK-NEXT: vsetvli zero, a1, e8, mf2, tu, ma			; CHECK-NEXT: vsetvli zero, zero, e8, mf2, tu, ma
	; CHECK-NEXT: vredmax.vs v9, v8, v9, v0.t			; CHECK-NEXT: vredmax.vs v9, v8, v9, v0.t
	; CHECK-NEXT: vmv.x.s a0, v9			; CHECK-NEXT: vmv.x.s a0, v9
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call i8 @llvm.vp.reduce.smax.nxv4i8(i8 %s, <vscale x 4 x i8> %v, <vscale x 4 x i1> %m, i32 %evl)			%r = call i8 @llvm.vp.reduce.smax.nxv4i8(i8 %s, <vscale x 4 x i8> %v, <vscale x 4 x i1> %m, i32 %evl)
	ret i8 %r			ret i8 %r
	}			}

	declare i8 @llvm.vp.reduce.umin.nxv4i8(i8, <vscale x 4 x i8>, <vscale x 4 x i1>, i32)			declare i8 @llvm.vp.reduce.umin.nxv4i8(i8, <vscale x 4 x i8>, <vscale x 4 x i1>, i32)

	define signext i8 @vpreduce_umin_nxv4i8(i8 signext %s, <vscale x 4 x i8> %v, <vscale x 4 x i1> %m, i32 zeroext %evl) {			define signext i8 @vpreduce_umin_nxv4i8(i8 signext %s, <vscale x 4 x i8> %v, <vscale x 4 x i1> %m, i32 zeroext %evl) {
	; CHECK-LABEL: vpreduce_umin_nxv4i8:			; CHECK-LABEL: vpreduce_umin_nxv4i8:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: andi a0, a0, 255			; CHECK-NEXT: vsetvli zero, a1, e8, mf2, ta, ma
	; CHECK-NEXT: vsetivli zero, 1, e8, m1, ta, ma			; CHECK-NEXT: vmv.v.x v9, a0
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vsetvli zero, zero, e8, mf2, tu, ma
	; CHECK-NEXT: vsetvli zero, a1, e8, mf2, tu, ma
	; CHECK-NEXT: vredminu.vs v9, v8, v9, v0.t			; CHECK-NEXT: vredminu.vs v9, v8, v9, v0.t
	; CHECK-NEXT: vmv.x.s a0, v9			; CHECK-NEXT: vmv.x.s a0, v9
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call i8 @llvm.vp.reduce.umin.nxv4i8(i8 %s, <vscale x 4 x i8> %v, <vscale x 4 x i1> %m, i32 %evl)			%r = call i8 @llvm.vp.reduce.umin.nxv4i8(i8 %s, <vscale x 4 x i8> %v, <vscale x 4 x i1> %m, i32 %evl)
	ret i8 %r			ret i8 %r
	}			}

	declare i8 @llvm.vp.reduce.smin.nxv4i8(i8, <vscale x 4 x i8>, <vscale x 4 x i1>, i32)			declare i8 @llvm.vp.reduce.smin.nxv4i8(i8, <vscale x 4 x i8>, <vscale x 4 x i1>, i32)

	define signext i8 @vpreduce_smin_nxv4i8(i8 signext %s, <vscale x 4 x i8> %v, <vscale x 4 x i1> %m, i32 zeroext %evl) {			define signext i8 @vpreduce_smin_nxv4i8(i8 signext %s, <vscale x 4 x i8> %v, <vscale x 4 x i1> %m, i32 zeroext %evl) {
	; CHECK-LABEL: vpreduce_smin_nxv4i8:			; CHECK-LABEL: vpreduce_smin_nxv4i8:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e8, m1, ta, ma			; CHECK-NEXT: vsetvli zero, a1, e8, mf2, ta, ma
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.v.x v9, a0
	; CHECK-NEXT: vsetvli zero, a1, e8, mf2, tu, ma			; CHECK-NEXT: vsetvli zero, zero, e8, mf2, tu, ma
	; CHECK-NEXT: vredmin.vs v9, v8, v9, v0.t			; CHECK-NEXT: vredmin.vs v9, v8, v9, v0.t
	; CHECK-NEXT: vmv.x.s a0, v9			; CHECK-NEXT: vmv.x.s a0, v9
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call i8 @llvm.vp.reduce.smin.nxv4i8(i8 %s, <vscale x 4 x i8> %v, <vscale x 4 x i1> %m, i32 %evl)			%r = call i8 @llvm.vp.reduce.smin.nxv4i8(i8 %s, <vscale x 4 x i8> %v, <vscale x 4 x i1> %m, i32 %evl)
	ret i8 %r			ret i8 %r
	}			}

	declare i8 @llvm.vp.reduce.and.nxv4i8(i8, <vscale x 4 x i8>, <vscale x 4 x i1>, i32)			declare i8 @llvm.vp.reduce.and.nxv4i8(i8, <vscale x 4 x i8>, <vscale x 4 x i1>, i32)

	define signext i8 @vpreduce_and_nxv4i8(i8 signext %s, <vscale x 4 x i8> %v, <vscale x 4 x i1> %m, i32 zeroext %evl) {			define signext i8 @vpreduce_and_nxv4i8(i8 signext %s, <vscale x 4 x i8> %v, <vscale x 4 x i1> %m, i32 zeroext %evl) {
	; CHECK-LABEL: vpreduce_and_nxv4i8:			; CHECK-LABEL: vpreduce_and_nxv4i8:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e8, m1, ta, ma			; CHECK-NEXT: vsetvli zero, a1, e8, mf2, ta, ma
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.v.x v9, a0
	; CHECK-NEXT: vsetvli zero, a1, e8, mf2, tu, ma			; CHECK-NEXT: vsetvli zero, zero, e8, mf2, tu, ma
	; CHECK-NEXT: vredand.vs v9, v8, v9, v0.t			; CHECK-NEXT: vredand.vs v9, v8, v9, v0.t
	; CHECK-NEXT: vmv.x.s a0, v9			; CHECK-NEXT: vmv.x.s a0, v9
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call i8 @llvm.vp.reduce.and.nxv4i8(i8 %s, <vscale x 4 x i8> %v, <vscale x 4 x i1> %m, i32 %evl)			%r = call i8 @llvm.vp.reduce.and.nxv4i8(i8 %s, <vscale x 4 x i8> %v, <vscale x 4 x i1> %m, i32 %evl)
	ret i8 %r			ret i8 %r
	}			}

	declare i8 @llvm.vp.reduce.or.nxv4i8(i8, <vscale x 4 x i8>, <vscale x 4 x i1>, i32)			declare i8 @llvm.vp.reduce.or.nxv4i8(i8, <vscale x 4 x i8>, <vscale x 4 x i1>, i32)

	define signext i8 @vpreduce_or_nxv4i8(i8 signext %s, <vscale x 4 x i8> %v, <vscale x 4 x i1> %m, i32 zeroext %evl) {			define signext i8 @vpreduce_or_nxv4i8(i8 signext %s, <vscale x 4 x i8> %v, <vscale x 4 x i1> %m, i32 zeroext %evl) {
	; CHECK-LABEL: vpreduce_or_nxv4i8:			; CHECK-LABEL: vpreduce_or_nxv4i8:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e8, m1, ta, ma			; CHECK-NEXT: vsetvli zero, a1, e8, mf2, ta, ma
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.v.x v9, a0
	; CHECK-NEXT: vsetvli zero, a1, e8, mf2, tu, ma			; CHECK-NEXT: vsetvli zero, zero, e8, mf2, tu, ma
	; CHECK-NEXT: vredor.vs v9, v8, v9, v0.t			; CHECK-NEXT: vredor.vs v9, v8, v9, v0.t
	; CHECK-NEXT: vmv.x.s a0, v9			; CHECK-NEXT: vmv.x.s a0, v9
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call i8 @llvm.vp.reduce.or.nxv4i8(i8 %s, <vscale x 4 x i8> %v, <vscale x 4 x i1> %m, i32 %evl)			%r = call i8 @llvm.vp.reduce.or.nxv4i8(i8 %s, <vscale x 4 x i8> %v, <vscale x 4 x i1> %m, i32 %evl)
	ret i8 %r			ret i8 %r
	}			}

	declare i8 @llvm.vp.reduce.xor.nxv4i8(i8, <vscale x 4 x i8>, <vscale x 4 x i1>, i32)			declare i8 @llvm.vp.reduce.xor.nxv4i8(i8, <vscale x 4 x i8>, <vscale x 4 x i1>, i32)

	define signext i8 @vpreduce_xor_nxv4i8(i8 signext %s, <vscale x 4 x i8> %v, <vscale x 4 x i1> %m, i32 zeroext %evl) {			define signext i8 @vpreduce_xor_nxv4i8(i8 signext %s, <vscale x 4 x i8> %v, <vscale x 4 x i1> %m, i32 zeroext %evl) {
	; CHECK-LABEL: vpreduce_xor_nxv4i8:			; CHECK-LABEL: vpreduce_xor_nxv4i8:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e8, m1, ta, ma			; CHECK-NEXT: vsetvli zero, a1, e8, mf2, ta, ma
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.v.x v9, a0
	; CHECK-NEXT: vsetvli zero, a1, e8, mf2, tu, ma			; CHECK-NEXT: vsetvli zero, zero, e8, mf2, tu, ma
	; CHECK-NEXT: vredxor.vs v9, v8, v9, v0.t			; CHECK-NEXT: vredxor.vs v9, v8, v9, v0.t
	; CHECK-NEXT: vmv.x.s a0, v9			; CHECK-NEXT: vmv.x.s a0, v9
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call i8 @llvm.vp.reduce.xor.nxv4i8(i8 %s, <vscale x 4 x i8> %v, <vscale x 4 x i1> %m, i32 %evl)			%r = call i8 @llvm.vp.reduce.xor.nxv4i8(i8 %s, <vscale x 4 x i8> %v, <vscale x 4 x i1> %m, i32 %evl)
	ret i8 %r			ret i8 %r
	}			}

	declare i16 @llvm.vp.reduce.add.nxv1i16(i16, <vscale x 1 x i16>, <vscale x 1 x i1>, i32)			declare i16 @llvm.vp.reduce.add.nxv1i16(i16, <vscale x 1 x i16>, <vscale x 1 x i1>, i32)

	define signext i16 @vpreduce_add_nxv1i16(i16 signext %s, <vscale x 1 x i16> %v, <vscale x 1 x i1> %m, i32 zeroext %evl) {			define signext i16 @vpreduce_add_nxv1i16(i16 signext %s, <vscale x 1 x i16> %v, <vscale x 1 x i1> %m, i32 zeroext %evl) {
	; CHECK-LABEL: vpreduce_add_nxv1i16:			; CHECK-LABEL: vpreduce_add_nxv1i16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma			; CHECK-NEXT: vsetvli zero, a1, e16, mf4, ta, ma
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.v.x v9, a0
	; CHECK-NEXT: vsetvli zero, a1, e16, mf4, tu, ma			; CHECK-NEXT: vsetvli zero, zero, e16, mf4, tu, ma
	; CHECK-NEXT: vredsum.vs v9, v8, v9, v0.t			; CHECK-NEXT: vredsum.vs v9, v8, v9, v0.t
	; CHECK-NEXT: vmv.x.s a0, v9			; CHECK-NEXT: vmv.x.s a0, v9
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call i16 @llvm.vp.reduce.add.nxv1i16(i16 %s, <vscale x 1 x i16> %v, <vscale x 1 x i1> %m, i32 %evl)			%r = call i16 @llvm.vp.reduce.add.nxv1i16(i16 %s, <vscale x 1 x i16> %v, <vscale x 1 x i1> %m, i32 %evl)
	ret i16 %r			ret i16 %r
	}			}

	declare i16 @llvm.vp.reduce.umax.nxv1i16(i16, <vscale x 1 x i16>, <vscale x 1 x i1>, i32)			declare i16 @llvm.vp.reduce.umax.nxv1i16(i16, <vscale x 1 x i16>, <vscale x 1 x i1>, i32)

	define signext i16 @vpreduce_umax_nxv1i16(i16 signext %s, <vscale x 1 x i16> %v, <vscale x 1 x i1> %m, i32 zeroext %evl) {			define signext i16 @vpreduce_umax_nxv1i16(i16 signext %s, <vscale x 1 x i16> %v, <vscale x 1 x i1> %m, i32 zeroext %evl) {
	; RV32-LABEL: vpreduce_umax_nxv1i16:			; CHECK-LABEL: vpreduce_umax_nxv1i16:
	; RV32: # %bb.0:			; CHECK: # %bb.0:
	; RV32-NEXT: slli a0, a0, 16			; CHECK-NEXT: vsetvli zero, a1, e16, mf4, ta, ma
	; RV32-NEXT: srli a0, a0, 16			; CHECK-NEXT: vmv.v.x v9, a0
	; RV32-NEXT: vsetivli zero, 1, e16, m1, ta, ma			; CHECK-NEXT: vsetvli zero, zero, e16, mf4, tu, ma
	; RV32-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vredmaxu.vs v9, v8, v9, v0.t
	; RV32-NEXT: vsetvli zero, a1, e16, mf4, tu, ma			; CHECK-NEXT: vmv.x.s a0, v9
	; RV32-NEXT: vredmaxu.vs v9, v8, v9, v0.t			; CHECK-NEXT: ret
	; RV32-NEXT: vmv.x.s a0, v9
	; RV32-NEXT: ret
	;
	; RV64-LABEL: vpreduce_umax_nxv1i16:
	; RV64: # %bb.0:
	; RV64-NEXT: slli a0, a0, 48
	; RV64-NEXT: srli a0, a0, 48
	; RV64-NEXT: vsetivli zero, 1, e16, m1, ta, ma
	; RV64-NEXT: vmv.s.x v9, a0
	; RV64-NEXT: vsetvli zero, a1, e16, mf4, tu, ma
	; RV64-NEXT: vredmaxu.vs v9, v8, v9, v0.t
	; RV64-NEXT: vmv.x.s a0, v9
	; RV64-NEXT: ret
	%r = call i16 @llvm.vp.reduce.umax.nxv1i16(i16 %s, <vscale x 1 x i16> %v, <vscale x 1 x i1> %m, i32 %evl)			%r = call i16 @llvm.vp.reduce.umax.nxv1i16(i16 %s, <vscale x 1 x i16> %v, <vscale x 1 x i1> %m, i32 %evl)
	ret i16 %r			ret i16 %r
	}			}

	declare i16 @llvm.vp.reduce.smax.nxv1i16(i16, <vscale x 1 x i16>, <vscale x 1 x i1>, i32)			declare i16 @llvm.vp.reduce.smax.nxv1i16(i16, <vscale x 1 x i16>, <vscale x 1 x i1>, i32)

	define signext i16 @vpreduce_smax_nxv1i16(i16 signext %s, <vscale x 1 x i16> %v, <vscale x 1 x i1> %m, i32 zeroext %evl) {			define signext i16 @vpreduce_smax_nxv1i16(i16 signext %s, <vscale x 1 x i16> %v, <vscale x 1 x i1> %m, i32 zeroext %evl) {
	; CHECK-LABEL: vpreduce_smax_nxv1i16:			; CHECK-LABEL: vpreduce_smax_nxv1i16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma			; CHECK-NEXT: vsetvli zero, a1, e16, mf4, ta, ma
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.v.x v9, a0
	; CHECK-NEXT: vsetvli zero, a1, e16, mf4, tu, ma			; CHECK-NEXT: vsetvli zero, zero, e16, mf4, tu, ma
	; CHECK-NEXT: vredmax.vs v9, v8, v9, v0.t			; CHECK-NEXT: vredmax.vs v9, v8, v9, v0.t
	; CHECK-NEXT: vmv.x.s a0, v9			; CHECK-NEXT: vmv.x.s a0, v9
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call i16 @llvm.vp.reduce.smax.nxv1i16(i16 %s, <vscale x 1 x i16> %v, <vscale x 1 x i1> %m, i32 %evl)			%r = call i16 @llvm.vp.reduce.smax.nxv1i16(i16 %s, <vscale x 1 x i16> %v, <vscale x 1 x i1> %m, i32 %evl)
	ret i16 %r			ret i16 %r
	}			}

	declare i16 @llvm.vp.reduce.umin.nxv1i16(i16, <vscale x 1 x i16>, <vscale x 1 x i1>, i32)			declare i16 @llvm.vp.reduce.umin.nxv1i16(i16, <vscale x 1 x i16>, <vscale x 1 x i1>, i32)

	define signext i16 @vpreduce_umin_nxv1i16(i16 signext %s, <vscale x 1 x i16> %v, <vscale x 1 x i1> %m, i32 zeroext %evl) {			define signext i16 @vpreduce_umin_nxv1i16(i16 signext %s, <vscale x 1 x i16> %v, <vscale x 1 x i1> %m, i32 zeroext %evl) {
	; RV32-LABEL: vpreduce_umin_nxv1i16:			; CHECK-LABEL: vpreduce_umin_nxv1i16:
	; RV32: # %bb.0:			; CHECK: # %bb.0:
	; RV32-NEXT: slli a0, a0, 16			; CHECK-NEXT: vsetvli zero, a1, e16, mf4, ta, ma
	; RV32-NEXT: srli a0, a0, 16			; CHECK-NEXT: vmv.v.x v9, a0
	; RV32-NEXT: vsetivli zero, 1, e16, m1, ta, ma			; CHECK-NEXT: vsetvli zero, zero, e16, mf4, tu, ma
	; RV32-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vredminu.vs v9, v8, v9, v0.t
	; RV32-NEXT: vsetvli zero, a1, e16, mf4, tu, ma			; CHECK-NEXT: vmv.x.s a0, v9
	; RV32-NEXT: vredminu.vs v9, v8, v9, v0.t			; CHECK-NEXT: ret
	; RV32-NEXT: vmv.x.s a0, v9
	; RV32-NEXT: ret
	;
	; RV64-LABEL: vpreduce_umin_nxv1i16:
	; RV64: # %bb.0:
	; RV64-NEXT: slli a0, a0, 48
	; RV64-NEXT: srli a0, a0, 48
	; RV64-NEXT: vsetivli zero, 1, e16, m1, ta, ma
	; RV64-NEXT: vmv.s.x v9, a0
	; RV64-NEXT: vsetvli zero, a1, e16, mf4, tu, ma
	; RV64-NEXT: vredminu.vs v9, v8, v9, v0.t
	; RV64-NEXT: vmv.x.s a0, v9
	; RV64-NEXT: ret
	%r = call i16 @llvm.vp.reduce.umin.nxv1i16(i16 %s, <vscale x 1 x i16> %v, <vscale x 1 x i1> %m, i32 %evl)			%r = call i16 @llvm.vp.reduce.umin.nxv1i16(i16 %s, <vscale x 1 x i16> %v, <vscale x 1 x i1> %m, i32 %evl)
	ret i16 %r			ret i16 %r
	}			}

	declare i16 @llvm.vp.reduce.smin.nxv1i16(i16, <vscale x 1 x i16>, <vscale x 1 x i1>, i32)			declare i16 @llvm.vp.reduce.smin.nxv1i16(i16, <vscale x 1 x i16>, <vscale x 1 x i1>, i32)

	define signext i16 @vpreduce_smin_nxv1i16(i16 signext %s, <vscale x 1 x i16> %v, <vscale x 1 x i1> %m, i32 zeroext %evl) {			define signext i16 @vpreduce_smin_nxv1i16(i16 signext %s, <vscale x 1 x i16> %v, <vscale x 1 x i1> %m, i32 zeroext %evl) {
	; CHECK-LABEL: vpreduce_smin_nxv1i16:			; CHECK-LABEL: vpreduce_smin_nxv1i16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma			; CHECK-NEXT: vsetvli zero, a1, e16, mf4, ta, ma
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.v.x v9, a0
	; CHECK-NEXT: vsetvli zero, a1, e16, mf4, tu, ma			; CHECK-NEXT: vsetvli zero, zero, e16, mf4, tu, ma
	; CHECK-NEXT: vredmin.vs v9, v8, v9, v0.t			; CHECK-NEXT: vredmin.vs v9, v8, v9, v0.t
	; CHECK-NEXT: vmv.x.s a0, v9			; CHECK-NEXT: vmv.x.s a0, v9
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call i16 @llvm.vp.reduce.smin.nxv1i16(i16 %s, <vscale x 1 x i16> %v, <vscale x 1 x i1> %m, i32 %evl)			%r = call i16 @llvm.vp.reduce.smin.nxv1i16(i16 %s, <vscale x 1 x i16> %v, <vscale x 1 x i1> %m, i32 %evl)
	ret i16 %r			ret i16 %r
	}			}

	declare i16 @llvm.vp.reduce.and.nxv1i16(i16, <vscale x 1 x i16>, <vscale x 1 x i1>, i32)			declare i16 @llvm.vp.reduce.and.nxv1i16(i16, <vscale x 1 x i16>, <vscale x 1 x i1>, i32)

	define signext i16 @vpreduce_and_nxv1i16(i16 signext %s, <vscale x 1 x i16> %v, <vscale x 1 x i1> %m, i32 zeroext %evl) {			define signext i16 @vpreduce_and_nxv1i16(i16 signext %s, <vscale x 1 x i16> %v, <vscale x 1 x i1> %m, i32 zeroext %evl) {
	; CHECK-LABEL: vpreduce_and_nxv1i16:			; CHECK-LABEL: vpreduce_and_nxv1i16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma			; CHECK-NEXT: vsetvli zero, a1, e16, mf4, ta, ma
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.v.x v9, a0
	; CHECK-NEXT: vsetvli zero, a1, e16, mf4, tu, ma			; CHECK-NEXT: vsetvli zero, zero, e16, mf4, tu, ma
	; CHECK-NEXT: vredand.vs v9, v8, v9, v0.t			; CHECK-NEXT: vredand.vs v9, v8, v9, v0.t
	; CHECK-NEXT: vmv.x.s a0, v9			; CHECK-NEXT: vmv.x.s a0, v9
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call i16 @llvm.vp.reduce.and.nxv1i16(i16 %s, <vscale x 1 x i16> %v, <vscale x 1 x i1> %m, i32 %evl)			%r = call i16 @llvm.vp.reduce.and.nxv1i16(i16 %s, <vscale x 1 x i16> %v, <vscale x 1 x i1> %m, i32 %evl)
	ret i16 %r			ret i16 %r
	}			}

	declare i16 @llvm.vp.reduce.or.nxv1i16(i16, <vscale x 1 x i16>, <vscale x 1 x i1>, i32)			declare i16 @llvm.vp.reduce.or.nxv1i16(i16, <vscale x 1 x i16>, <vscale x 1 x i1>, i32)

	define signext i16 @vpreduce_or_nxv1i16(i16 signext %s, <vscale x 1 x i16> %v, <vscale x 1 x i1> %m, i32 zeroext %evl) {			define signext i16 @vpreduce_or_nxv1i16(i16 signext %s, <vscale x 1 x i16> %v, <vscale x 1 x i1> %m, i32 zeroext %evl) {
	; CHECK-LABEL: vpreduce_or_nxv1i16:			; CHECK-LABEL: vpreduce_or_nxv1i16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma			; CHECK-NEXT: vsetvli zero, a1, e16, mf4, ta, ma
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.v.x v9, a0
	; CHECK-NEXT: vsetvli zero, a1, e16, mf4, tu, ma			; CHECK-NEXT: vsetvli zero, zero, e16, mf4, tu, ma
	; CHECK-NEXT: vredor.vs v9, v8, v9, v0.t			; CHECK-NEXT: vredor.vs v9, v8, v9, v0.t
	; CHECK-NEXT: vmv.x.s a0, v9			; CHECK-NEXT: vmv.x.s a0, v9
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call i16 @llvm.vp.reduce.or.nxv1i16(i16 %s, <vscale x 1 x i16> %v, <vscale x 1 x i1> %m, i32 %evl)			%r = call i16 @llvm.vp.reduce.or.nxv1i16(i16 %s, <vscale x 1 x i16> %v, <vscale x 1 x i1> %m, i32 %evl)
	ret i16 %r			ret i16 %r
	}			}

	declare i16 @llvm.vp.reduce.xor.nxv1i16(i16, <vscale x 1 x i16>, <vscale x 1 x i1>, i32)			declare i16 @llvm.vp.reduce.xor.nxv1i16(i16, <vscale x 1 x i16>, <vscale x 1 x i1>, i32)

	define signext i16 @vpreduce_xor_nxv1i16(i16 signext %s, <vscale x 1 x i16> %v, <vscale x 1 x i1> %m, i32 zeroext %evl) {			define signext i16 @vpreduce_xor_nxv1i16(i16 signext %s, <vscale x 1 x i16> %v, <vscale x 1 x i1> %m, i32 zeroext %evl) {
	; CHECK-LABEL: vpreduce_xor_nxv1i16:			; CHECK-LABEL: vpreduce_xor_nxv1i16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma			; CHECK-NEXT: vsetvli zero, a1, e16, mf4, ta, ma
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.v.x v9, a0
	; CHECK-NEXT: vsetvli zero, a1, e16, mf4, tu, ma			; CHECK-NEXT: vsetvli zero, zero, e16, mf4, tu, ma
	; CHECK-NEXT: vredxor.vs v9, v8, v9, v0.t			; CHECK-NEXT: vredxor.vs v9, v8, v9, v0.t
	; CHECK-NEXT: vmv.x.s a0, v9			; CHECK-NEXT: vmv.x.s a0, v9
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call i16 @llvm.vp.reduce.xor.nxv1i16(i16 %s, <vscale x 1 x i16> %v, <vscale x 1 x i1> %m, i32 %evl)			%r = call i16 @llvm.vp.reduce.xor.nxv1i16(i16 %s, <vscale x 1 x i16> %v, <vscale x 1 x i1> %m, i32 %evl)
	ret i16 %r			ret i16 %r
	}			}

	declare i16 @llvm.vp.reduce.add.nxv2i16(i16, <vscale x 2 x i16>, <vscale x 2 x i1>, i32)			declare i16 @llvm.vp.reduce.add.nxv2i16(i16, <vscale x 2 x i16>, <vscale x 2 x i1>, i32)

	define signext i16 @vpreduce_add_nxv2i16(i16 signext %s, <vscale x 2 x i16> %v, <vscale x 2 x i1> %m, i32 zeroext %evl) {			define signext i16 @vpreduce_add_nxv2i16(i16 signext %s, <vscale x 2 x i16> %v, <vscale x 2 x i1> %m, i32 zeroext %evl) {
	; CHECK-LABEL: vpreduce_add_nxv2i16:			; CHECK-LABEL: vpreduce_add_nxv2i16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma			; CHECK-NEXT: vsetvli zero, a1, e16, mf2, ta, ma
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.v.x v9, a0
	; CHECK-NEXT: vsetvli zero, a1, e16, mf2, tu, ma			; CHECK-NEXT: vsetvli zero, zero, e16, mf2, tu, ma
	; CHECK-NEXT: vredsum.vs v9, v8, v9, v0.t			; CHECK-NEXT: vredsum.vs v9, v8, v9, v0.t
	; CHECK-NEXT: vmv.x.s a0, v9			; CHECK-NEXT: vmv.x.s a0, v9
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call i16 @llvm.vp.reduce.add.nxv2i16(i16 %s, <vscale x 2 x i16> %v, <vscale x 2 x i1> %m, i32 %evl)			%r = call i16 @llvm.vp.reduce.add.nxv2i16(i16 %s, <vscale x 2 x i16> %v, <vscale x 2 x i1> %m, i32 %evl)
	ret i16 %r			ret i16 %r
	}			}

	declare i16 @llvm.vp.reduce.umax.nxv2i16(i16, <vscale x 2 x i16>, <vscale x 2 x i1>, i32)			declare i16 @llvm.vp.reduce.umax.nxv2i16(i16, <vscale x 2 x i16>, <vscale x 2 x i1>, i32)

	define signext i16 @vpreduce_umax_nxv2i16(i16 signext %s, <vscale x 2 x i16> %v, <vscale x 2 x i1> %m, i32 zeroext %evl) {			define signext i16 @vpreduce_umax_nxv2i16(i16 signext %s, <vscale x 2 x i16> %v, <vscale x 2 x i1> %m, i32 zeroext %evl) {
	; RV32-LABEL: vpreduce_umax_nxv2i16:			; CHECK-LABEL: vpreduce_umax_nxv2i16:
	; RV32: # %bb.0:			; CHECK: # %bb.0:
	; RV32-NEXT: slli a0, a0, 16			; CHECK-NEXT: vsetvli zero, a1, e16, mf2, ta, ma
	; RV32-NEXT: srli a0, a0, 16			; CHECK-NEXT: vmv.v.x v9, a0
	; RV32-NEXT: vsetivli zero, 1, e16, m1, ta, ma			; CHECK-NEXT: vsetvli zero, zero, e16, mf2, tu, ma
	; RV32-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vredmaxu.vs v9, v8, v9, v0.t
	; RV32-NEXT: vsetvli zero, a1, e16, mf2, tu, ma			; CHECK-NEXT: vmv.x.s a0, v9
	; RV32-NEXT: vredmaxu.vs v9, v8, v9, v0.t			; CHECK-NEXT: ret
	; RV32-NEXT: vmv.x.s a0, v9
	; RV32-NEXT: ret
	;
	; RV64-LABEL: vpreduce_umax_nxv2i16:
	; RV64: # %bb.0:
	; RV64-NEXT: slli a0, a0, 48
	; RV64-NEXT: srli a0, a0, 48
	; RV64-NEXT: vsetivli zero, 1, e16, m1, ta, ma
	; RV64-NEXT: vmv.s.x v9, a0
	; RV64-NEXT: vsetvli zero, a1, e16, mf2, tu, ma
	; RV64-NEXT: vredmaxu.vs v9, v8, v9, v0.t
	; RV64-NEXT: vmv.x.s a0, v9
	; RV64-NEXT: ret
	%r = call i16 @llvm.vp.reduce.umax.nxv2i16(i16 %s, <vscale x 2 x i16> %v, <vscale x 2 x i1> %m, i32 %evl)			%r = call i16 @llvm.vp.reduce.umax.nxv2i16(i16 %s, <vscale x 2 x i16> %v, <vscale x 2 x i1> %m, i32 %evl)
	ret i16 %r			ret i16 %r
	}			}

	declare i16 @llvm.vp.reduce.smax.nxv2i16(i16, <vscale x 2 x i16>, <vscale x 2 x i1>, i32)			declare i16 @llvm.vp.reduce.smax.nxv2i16(i16, <vscale x 2 x i16>, <vscale x 2 x i1>, i32)

	define signext i16 @vpreduce_smax_nxv2i16(i16 signext %s, <vscale x 2 x i16> %v, <vscale x 2 x i1> %m, i32 zeroext %evl) {			define signext i16 @vpreduce_smax_nxv2i16(i16 signext %s, <vscale x 2 x i16> %v, <vscale x 2 x i1> %m, i32 zeroext %evl) {
	; CHECK-LABEL: vpreduce_smax_nxv2i16:			; CHECK-LABEL: vpreduce_smax_nxv2i16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma			; CHECK-NEXT: vsetvli zero, a1, e16, mf2, ta, ma
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.v.x v9, a0
	; CHECK-NEXT: vsetvli zero, a1, e16, mf2, tu, ma			; CHECK-NEXT: vsetvli zero, zero, e16, mf2, tu, ma
	; CHECK-NEXT: vredmax.vs v9, v8, v9, v0.t			; CHECK-NEXT: vredmax.vs v9, v8, v9, v0.t
	; CHECK-NEXT: vmv.x.s a0, v9			; CHECK-NEXT: vmv.x.s a0, v9
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call i16 @llvm.vp.reduce.smax.nxv2i16(i16 %s, <vscale x 2 x i16> %v, <vscale x 2 x i1> %m, i32 %evl)			%r = call i16 @llvm.vp.reduce.smax.nxv2i16(i16 %s, <vscale x 2 x i16> %v, <vscale x 2 x i1> %m, i32 %evl)
	ret i16 %r			ret i16 %r
	}			}

	declare i16 @llvm.vp.reduce.umin.nxv2i16(i16, <vscale x 2 x i16>, <vscale x 2 x i1>, i32)			declare i16 @llvm.vp.reduce.umin.nxv2i16(i16, <vscale x 2 x i16>, <vscale x 2 x i1>, i32)

	define signext i16 @vpreduce_umin_nxv2i16(i16 signext %s, <vscale x 2 x i16> %v, <vscale x 2 x i1> %m, i32 zeroext %evl) {			define signext i16 @vpreduce_umin_nxv2i16(i16 signext %s, <vscale x 2 x i16> %v, <vscale x 2 x i1> %m, i32 zeroext %evl) {
	; RV32-LABEL: vpreduce_umin_nxv2i16:			; CHECK-LABEL: vpreduce_umin_nxv2i16:
	; RV32: # %bb.0:			; CHECK: # %bb.0:
	; RV32-NEXT: slli a0, a0, 16			; CHECK-NEXT: vsetvli zero, a1, e16, mf2, ta, ma
	; RV32-NEXT: srli a0, a0, 16			; CHECK-NEXT: vmv.v.x v9, a0
	; RV32-NEXT: vsetivli zero, 1, e16, m1, ta, ma			; CHECK-NEXT: vsetvli zero, zero, e16, mf2, tu, ma
	; RV32-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vredminu.vs v9, v8, v9, v0.t
	; RV32-NEXT: vsetvli zero, a1, e16, mf2, tu, ma			; CHECK-NEXT: vmv.x.s a0, v9
	; RV32-NEXT: vredminu.vs v9, v8, v9, v0.t			; CHECK-NEXT: ret
	; RV32-NEXT: vmv.x.s a0, v9
	; RV32-NEXT: ret
	;
	; RV64-LABEL: vpreduce_umin_nxv2i16:
	; RV64: # %bb.0:
	; RV64-NEXT: slli a0, a0, 48
	; RV64-NEXT: srli a0, a0, 48
	; RV64-NEXT: vsetivli zero, 1, e16, m1, ta, ma
	; RV64-NEXT: vmv.s.x v9, a0
	; RV64-NEXT: vsetvli zero, a1, e16, mf2, tu, ma
	; RV64-NEXT: vredminu.vs v9, v8, v9, v0.t
	; RV64-NEXT: vmv.x.s a0, v9
	; RV64-NEXT: ret
	%r = call i16 @llvm.vp.reduce.umin.nxv2i16(i16 %s, <vscale x 2 x i16> %v, <vscale x 2 x i1> %m, i32 %evl)			%r = call i16 @llvm.vp.reduce.umin.nxv2i16(i16 %s, <vscale x 2 x i16> %v, <vscale x 2 x i1> %m, i32 %evl)
	ret i16 %r			ret i16 %r
	}			}

	declare i16 @llvm.vp.reduce.smin.nxv2i16(i16, <vscale x 2 x i16>, <vscale x 2 x i1>, i32)			declare i16 @llvm.vp.reduce.smin.nxv2i16(i16, <vscale x 2 x i16>, <vscale x 2 x i1>, i32)

	define signext i16 @vpreduce_smin_nxv2i16(i16 signext %s, <vscale x 2 x i16> %v, <vscale x 2 x i1> %m, i32 zeroext %evl) {			define signext i16 @vpreduce_smin_nxv2i16(i16 signext %s, <vscale x 2 x i16> %v, <vscale x 2 x i1> %m, i32 zeroext %evl) {
	; CHECK-LABEL: vpreduce_smin_nxv2i16:			; CHECK-LABEL: vpreduce_smin_nxv2i16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma			; CHECK-NEXT: vsetvli zero, a1, e16, mf2, ta, ma
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.v.x v9, a0
	; CHECK-NEXT: vsetvli zero, a1, e16, mf2, tu, ma			; CHECK-NEXT: vsetvli zero, zero, e16, mf2, tu, ma
	; CHECK-NEXT: vredmin.vs v9, v8, v9, v0.t			; CHECK-NEXT: vredmin.vs v9, v8, v9, v0.t
	; CHECK-NEXT: vmv.x.s a0, v9			; CHECK-NEXT: vmv.x.s a0, v9
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call i16 @llvm.vp.reduce.smin.nxv2i16(i16 %s, <vscale x 2 x i16> %v, <vscale x 2 x i1> %m, i32 %evl)			%r = call i16 @llvm.vp.reduce.smin.nxv2i16(i16 %s, <vscale x 2 x i16> %v, <vscale x 2 x i1> %m, i32 %evl)
	ret i16 %r			ret i16 %r
	}			}

	declare i16 @llvm.vp.reduce.and.nxv2i16(i16, <vscale x 2 x i16>, <vscale x 2 x i1>, i32)			declare i16 @llvm.vp.reduce.and.nxv2i16(i16, <vscale x 2 x i16>, <vscale x 2 x i1>, i32)

	define signext i16 @vpreduce_and_nxv2i16(i16 signext %s, <vscale x 2 x i16> %v, <vscale x 2 x i1> %m, i32 zeroext %evl) {			define signext i16 @vpreduce_and_nxv2i16(i16 signext %s, <vscale x 2 x i16> %v, <vscale x 2 x i1> %m, i32 zeroext %evl) {
	; CHECK-LABEL: vpreduce_and_nxv2i16:			; CHECK-LABEL: vpreduce_and_nxv2i16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma			; CHECK-NEXT: vsetvli zero, a1, e16, mf2, ta, ma
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.v.x v9, a0
	; CHECK-NEXT: vsetvli zero, a1, e16, mf2, tu, ma			; CHECK-NEXT: vsetvli zero, zero, e16, mf2, tu, ma
	; CHECK-NEXT: vredand.vs v9, v8, v9, v0.t			; CHECK-NEXT: vredand.vs v9, v8, v9, v0.t
	; CHECK-NEXT: vmv.x.s a0, v9			; CHECK-NEXT: vmv.x.s a0, v9
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call i16 @llvm.vp.reduce.and.nxv2i16(i16 %s, <vscale x 2 x i16> %v, <vscale x 2 x i1> %m, i32 %evl)			%r = call i16 @llvm.vp.reduce.and.nxv2i16(i16 %s, <vscale x 2 x i16> %v, <vscale x 2 x i1> %m, i32 %evl)
	ret i16 %r			ret i16 %r
	}			}

	declare i16 @llvm.vp.reduce.or.nxv2i16(i16, <vscale x 2 x i16>, <vscale x 2 x i1>, i32)			declare i16 @llvm.vp.reduce.or.nxv2i16(i16, <vscale x 2 x i16>, <vscale x 2 x i1>, i32)

	define signext i16 @vpreduce_or_nxv2i16(i16 signext %s, <vscale x 2 x i16> %v, <vscale x 2 x i1> %m, i32 zeroext %evl) {			define signext i16 @vpreduce_or_nxv2i16(i16 signext %s, <vscale x 2 x i16> %v, <vscale x 2 x i1> %m, i32 zeroext %evl) {
	; CHECK-LABEL: vpreduce_or_nxv2i16:			; CHECK-LABEL: vpreduce_or_nxv2i16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma			; CHECK-NEXT: vsetvli zero, a1, e16, mf2, ta, ma
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.v.x v9, a0
	; CHECK-NEXT: vsetvli zero, a1, e16, mf2, tu, ma			; CHECK-NEXT: vsetvli zero, zero, e16, mf2, tu, ma
	; CHECK-NEXT: vredor.vs v9, v8, v9, v0.t			; CHECK-NEXT: vredor.vs v9, v8, v9, v0.t
	; CHECK-NEXT: vmv.x.s a0, v9			; CHECK-NEXT: vmv.x.s a0, v9
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call i16 @llvm.vp.reduce.or.nxv2i16(i16 %s, <vscale x 2 x i16> %v, <vscale x 2 x i1> %m, i32 %evl)			%r = call i16 @llvm.vp.reduce.or.nxv2i16(i16 %s, <vscale x 2 x i16> %v, <vscale x 2 x i1> %m, i32 %evl)
	ret i16 %r			ret i16 %r
	}			}

	declare i16 @llvm.vp.reduce.xor.nxv2i16(i16, <vscale x 2 x i16>, <vscale x 2 x i1>, i32)			declare i16 @llvm.vp.reduce.xor.nxv2i16(i16, <vscale x 2 x i16>, <vscale x 2 x i1>, i32)

	define signext i16 @vpreduce_xor_nxv2i16(i16 signext %s, <vscale x 2 x i16> %v, <vscale x 2 x i1> %m, i32 zeroext %evl) {			define signext i16 @vpreduce_xor_nxv2i16(i16 signext %s, <vscale x 2 x i16> %v, <vscale x 2 x i1> %m, i32 zeroext %evl) {
	; CHECK-LABEL: vpreduce_xor_nxv2i16:			; CHECK-LABEL: vpreduce_xor_nxv2i16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma			; CHECK-NEXT: vsetvli zero, a1, e16, mf2, ta, ma
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.v.x v9, a0
	; CHECK-NEXT: vsetvli zero, a1, e16, mf2, tu, ma			; CHECK-NEXT: vsetvli zero, zero, e16, mf2, tu, ma
	; CHECK-NEXT: vredxor.vs v9, v8, v9, v0.t			; CHECK-NEXT: vredxor.vs v9, v8, v9, v0.t
	; CHECK-NEXT: vmv.x.s a0, v9			; CHECK-NEXT: vmv.x.s a0, v9
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call i16 @llvm.vp.reduce.xor.nxv2i16(i16 %s, <vscale x 2 x i16> %v, <vscale x 2 x i1> %m, i32 %evl)			%r = call i16 @llvm.vp.reduce.xor.nxv2i16(i16 %s, <vscale x 2 x i16> %v, <vscale x 2 x i1> %m, i32 %evl)
	ret i16 %r			ret i16 %r
	}			}

	declare i16 @llvm.vp.reduce.add.nxv4i16(i16, <vscale x 4 x i16>, <vscale x 4 x i1>, i32)			declare i16 @llvm.vp.reduce.add.nxv4i16(i16, <vscale x 4 x i16>, <vscale x 4 x i1>, i32)

	define signext i16 @vpreduce_add_nxv4i16(i16 signext %s, <vscale x 4 x i16> %v, <vscale x 4 x i1> %m, i32 zeroext %evl) {			define signext i16 @vpreduce_add_nxv4i16(i16 signext %s, <vscale x 4 x i16> %v, <vscale x 4 x i1> %m, i32 zeroext %evl) {
	; CHECK-LABEL: vpreduce_add_nxv4i16:			; CHECK-LABEL: vpreduce_add_nxv4i16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma			; CHECK-NEXT: vsetvli zero, a1, e16, m1, ta, ma
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.v.x v9, a0
	; CHECK-NEXT: vsetvli zero, a1, e16, m1, tu, ma			; CHECK-NEXT: vsetvli zero, zero, e16, m1, tu, ma
	; CHECK-NEXT: vredsum.vs v9, v8, v9, v0.t			; CHECK-NEXT: vredsum.vs v9, v8, v9, v0.t
	; CHECK-NEXT: vmv.x.s a0, v9			; CHECK-NEXT: vmv.x.s a0, v9
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call i16 @llvm.vp.reduce.add.nxv4i16(i16 %s, <vscale x 4 x i16> %v, <vscale x 4 x i1> %m, i32 %evl)			%r = call i16 @llvm.vp.reduce.add.nxv4i16(i16 %s, <vscale x 4 x i16> %v, <vscale x 4 x i1> %m, i32 %evl)
	ret i16 %r			ret i16 %r
	}			}

	declare i16 @llvm.vp.reduce.umax.nxv4i16(i16, <vscale x 4 x i16>, <vscale x 4 x i1>, i32)			declare i16 @llvm.vp.reduce.umax.nxv4i16(i16, <vscale x 4 x i16>, <vscale x 4 x i1>, i32)

	define signext i16 @vpreduce_umax_nxv4i16(i16 signext %s, <vscale x 4 x i16> %v, <vscale x 4 x i1> %m, i32 zeroext %evl) {			define signext i16 @vpreduce_umax_nxv4i16(i16 signext %s, <vscale x 4 x i16> %v, <vscale x 4 x i1> %m, i32 zeroext %evl) {
	; RV32-LABEL: vpreduce_umax_nxv4i16:			; CHECK-LABEL: vpreduce_umax_nxv4i16:
	; RV32: # %bb.0:			; CHECK: # %bb.0:
	; RV32-NEXT: slli a0, a0, 16			; CHECK-NEXT: vsetvli zero, a1, e16, m1, ta, ma
	; RV32-NEXT: srli a0, a0, 16			; CHECK-NEXT: vmv.v.x v9, a0
	; RV32-NEXT: vsetivli zero, 1, e16, m1, ta, ma			; CHECK-NEXT: vsetvli zero, zero, e16, m1, tu, ma
	; RV32-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vredmaxu.vs v9, v8, v9, v0.t
	; RV32-NEXT: vsetvli zero, a1, e16, m1, tu, ma			; CHECK-NEXT: vmv.x.s a0, v9
	; RV32-NEXT: vredmaxu.vs v9, v8, v9, v0.t			; CHECK-NEXT: ret
	; RV32-NEXT: vmv.x.s a0, v9
	; RV32-NEXT: ret
	;
	; RV64-LABEL: vpreduce_umax_nxv4i16:
	; RV64: # %bb.0:
	; RV64-NEXT: slli a0, a0, 48
	; RV64-NEXT: srli a0, a0, 48
	; RV64-NEXT: vsetivli zero, 1, e16, m1, ta, ma
	; RV64-NEXT: vmv.s.x v9, a0
	; RV64-NEXT: vsetvli zero, a1, e16, m1, tu, ma
	; RV64-NEXT: vredmaxu.vs v9, v8, v9, v0.t
	; RV64-NEXT: vmv.x.s a0, v9
	; RV64-NEXT: ret
	%r = call i16 @llvm.vp.reduce.umax.nxv4i16(i16 %s, <vscale x 4 x i16> %v, <vscale x 4 x i1> %m, i32 %evl)			%r = call i16 @llvm.vp.reduce.umax.nxv4i16(i16 %s, <vscale x 4 x i16> %v, <vscale x 4 x i1> %m, i32 %evl)
	ret i16 %r			ret i16 %r
	}			}

	declare i16 @llvm.vp.reduce.smax.nxv4i16(i16, <vscale x 4 x i16>, <vscale x 4 x i1>, i32)			declare i16 @llvm.vp.reduce.smax.nxv4i16(i16, <vscale x 4 x i16>, <vscale x 4 x i1>, i32)

	define signext i16 @vpreduce_smax_nxv4i16(i16 signext %s, <vscale x 4 x i16> %v, <vscale x 4 x i1> %m, i32 zeroext %evl) {			define signext i16 @vpreduce_smax_nxv4i16(i16 signext %s, <vscale x 4 x i16> %v, <vscale x 4 x i1> %m, i32 zeroext %evl) {
	; CHECK-LABEL: vpreduce_smax_nxv4i16:			; CHECK-LABEL: vpreduce_smax_nxv4i16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma			; CHECK-NEXT: vsetvli zero, a1, e16, m1, ta, ma
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.v.x v9, a0
	; CHECK-NEXT: vsetvli zero, a1, e16, m1, tu, ma			; CHECK-NEXT: vsetvli zero, zero, e16, m1, tu, ma
	; CHECK-NEXT: vredmax.vs v9, v8, v9, v0.t			; CHECK-NEXT: vredmax.vs v9, v8, v9, v0.t
	; CHECK-NEXT: vmv.x.s a0, v9			; CHECK-NEXT: vmv.x.s a0, v9
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call i16 @llvm.vp.reduce.smax.nxv4i16(i16 %s, <vscale x 4 x i16> %v, <vscale x 4 x i1> %m, i32 %evl)			%r = call i16 @llvm.vp.reduce.smax.nxv4i16(i16 %s, <vscale x 4 x i16> %v, <vscale x 4 x i1> %m, i32 %evl)
	ret i16 %r			ret i16 %r
	}			}

	declare i16 @llvm.vp.reduce.umin.nxv4i16(i16, <vscale x 4 x i16>, <vscale x 4 x i1>, i32)			declare i16 @llvm.vp.reduce.umin.nxv4i16(i16, <vscale x 4 x i16>, <vscale x 4 x i1>, i32)

	define signext i16 @vpreduce_umin_nxv4i16(i16 signext %s, <vscale x 4 x i16> %v, <vscale x 4 x i1> %m, i32 zeroext %evl) {			define signext i16 @vpreduce_umin_nxv4i16(i16 signext %s, <vscale x 4 x i16> %v, <vscale x 4 x i1> %m, i32 zeroext %evl) {
	; RV32-LABEL: vpreduce_umin_nxv4i16:			; CHECK-LABEL: vpreduce_umin_nxv4i16:
	; RV32: # %bb.0:			; CHECK: # %bb.0:
	; RV32-NEXT: slli a0, a0, 16			; CHECK-NEXT: vsetvli zero, a1, e16, m1, ta, ma
	; RV32-NEXT: srli a0, a0, 16			; CHECK-NEXT: vmv.v.x v9, a0
	; RV32-NEXT: vsetivli zero, 1, e16, m1, ta, ma			; CHECK-NEXT: vsetvli zero, zero, e16, m1, tu, ma
	; RV32-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vredminu.vs v9, v8, v9, v0.t
	; RV32-NEXT: vsetvli zero, a1, e16, m1, tu, ma			; CHECK-NEXT: vmv.x.s a0, v9
	; RV32-NEXT: vredminu.vs v9, v8, v9, v0.t			; CHECK-NEXT: ret
	; RV32-NEXT: vmv.x.s a0, v9
	; RV32-NEXT: ret
	;
	; RV64-LABEL: vpreduce_umin_nxv4i16:
	; RV64: # %bb.0:
	; RV64-NEXT: slli a0, a0, 48
	; RV64-NEXT: srli a0, a0, 48
	; RV64-NEXT: vsetivli zero, 1, e16, m1, ta, ma
	; RV64-NEXT: vmv.s.x v9, a0
	; RV64-NEXT: vsetvli zero, a1, e16, m1, tu, ma
	; RV64-NEXT: vredminu.vs v9, v8, v9, v0.t
	; RV64-NEXT: vmv.x.s a0, v9
	; RV64-NEXT: ret
	%r = call i16 @llvm.vp.reduce.umin.nxv4i16(i16 %s, <vscale x 4 x i16> %v, <vscale x 4 x i1> %m, i32 %evl)			%r = call i16 @llvm.vp.reduce.umin.nxv4i16(i16 %s, <vscale x 4 x i16> %v, <vscale x 4 x i1> %m, i32 %evl)
	ret i16 %r			ret i16 %r
	}			}

	declare i16 @llvm.vp.reduce.smin.nxv4i16(i16, <vscale x 4 x i16>, <vscale x 4 x i1>, i32)			declare i16 @llvm.vp.reduce.smin.nxv4i16(i16, <vscale x 4 x i16>, <vscale x 4 x i1>, i32)

	define signext i16 @vpreduce_smin_nxv4i16(i16 signext %s, <vscale x 4 x i16> %v, <vscale x 4 x i1> %m, i32 zeroext %evl) {			define signext i16 @vpreduce_smin_nxv4i16(i16 signext %s, <vscale x 4 x i16> %v, <vscale x 4 x i1> %m, i32 zeroext %evl) {
	; CHECK-LABEL: vpreduce_smin_nxv4i16:			; CHECK-LABEL: vpreduce_smin_nxv4i16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma			; CHECK-NEXT: vsetvli zero, a1, e16, m1, ta, ma
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.v.x v9, a0
	; CHECK-NEXT: vsetvli zero, a1, e16, m1, tu, ma			; CHECK-NEXT: vsetvli zero, zero, e16, m1, tu, ma
	; CHECK-NEXT: vredmin.vs v9, v8, v9, v0.t			; CHECK-NEXT: vredmin.vs v9, v8, v9, v0.t
	; CHECK-NEXT: vmv.x.s a0, v9			; CHECK-NEXT: vmv.x.s a0, v9
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call i16 @llvm.vp.reduce.smin.nxv4i16(i16 %s, <vscale x 4 x i16> %v, <vscale x 4 x i1> %m, i32 %evl)			%r = call i16 @llvm.vp.reduce.smin.nxv4i16(i16 %s, <vscale x 4 x i16> %v, <vscale x 4 x i1> %m, i32 %evl)
	ret i16 %r			ret i16 %r
	}			}

	declare i16 @llvm.vp.reduce.and.nxv4i16(i16, <vscale x 4 x i16>, <vscale x 4 x i1>, i32)			declare i16 @llvm.vp.reduce.and.nxv4i16(i16, <vscale x 4 x i16>, <vscale x 4 x i1>, i32)

	define signext i16 @vpreduce_and_nxv4i16(i16 signext %s, <vscale x 4 x i16> %v, <vscale x 4 x i1> %m, i32 zeroext %evl) {			define signext i16 @vpreduce_and_nxv4i16(i16 signext %s, <vscale x 4 x i16> %v, <vscale x 4 x i1> %m, i32 zeroext %evl) {
	; CHECK-LABEL: vpreduce_and_nxv4i16:			; CHECK-LABEL: vpreduce_and_nxv4i16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma			; CHECK-NEXT: vsetvli zero, a1, e16, m1, ta, ma
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.v.x v9, a0
	; CHECK-NEXT: vsetvli zero, a1, e16, m1, tu, ma			; CHECK-NEXT: vsetvli zero, zero, e16, m1, tu, ma
	; CHECK-NEXT: vredand.vs v9, v8, v9, v0.t			; CHECK-NEXT: vredand.vs v9, v8, v9, v0.t
	; CHECK-NEXT: vmv.x.s a0, v9			; CHECK-NEXT: vmv.x.s a0, v9
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call i16 @llvm.vp.reduce.and.nxv4i16(i16 %s, <vscale x 4 x i16> %v, <vscale x 4 x i1> %m, i32 %evl)			%r = call i16 @llvm.vp.reduce.and.nxv4i16(i16 %s, <vscale x 4 x i16> %v, <vscale x 4 x i1> %m, i32 %evl)
	ret i16 %r			ret i16 %r
	}			}

	declare i16 @llvm.vp.reduce.or.nxv4i16(i16, <vscale x 4 x i16>, <vscale x 4 x i1>, i32)			declare i16 @llvm.vp.reduce.or.nxv4i16(i16, <vscale x 4 x i16>, <vscale x 4 x i1>, i32)

	define signext i16 @vpreduce_or_nxv4i16(i16 signext %s, <vscale x 4 x i16> %v, <vscale x 4 x i1> %m, i32 zeroext %evl) {			define signext i16 @vpreduce_or_nxv4i16(i16 signext %s, <vscale x 4 x i16> %v, <vscale x 4 x i1> %m, i32 zeroext %evl) {
	; CHECK-LABEL: vpreduce_or_nxv4i16:			; CHECK-LABEL: vpreduce_or_nxv4i16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma			; CHECK-NEXT: vsetvli zero, a1, e16, m1, ta, ma
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.v.x v9, a0
	; CHECK-NEXT: vsetvli zero, a1, e16, m1, tu, ma			; CHECK-NEXT: vsetvli zero, zero, e16, m1, tu, ma
	; CHECK-NEXT: vredor.vs v9, v8, v9, v0.t			; CHECK-NEXT: vredor.vs v9, v8, v9, v0.t
	; CHECK-NEXT: vmv.x.s a0, v9			; CHECK-NEXT: vmv.x.s a0, v9
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call i16 @llvm.vp.reduce.or.nxv4i16(i16 %s, <vscale x 4 x i16> %v, <vscale x 4 x i1> %m, i32 %evl)			%r = call i16 @llvm.vp.reduce.or.nxv4i16(i16 %s, <vscale x 4 x i16> %v, <vscale x 4 x i1> %m, i32 %evl)
	ret i16 %r			ret i16 %r
	}			}

	declare i16 @llvm.vp.reduce.xor.nxv4i16(i16, <vscale x 4 x i16>, <vscale x 4 x i1>, i32)			declare i16 @llvm.vp.reduce.xor.nxv4i16(i16, <vscale x 4 x i16>, <vscale x 4 x i1>, i32)

	define signext i16 @vpreduce_xor_nxv4i16(i16 signext %s, <vscale x 4 x i16> %v, <vscale x 4 x i1> %m, i32 zeroext %evl) {			define signext i16 @vpreduce_xor_nxv4i16(i16 signext %s, <vscale x 4 x i16> %v, <vscale x 4 x i1> %m, i32 zeroext %evl) {
	; CHECK-LABEL: vpreduce_xor_nxv4i16:			; CHECK-LABEL: vpreduce_xor_nxv4i16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma			; CHECK-NEXT: vsetvli zero, a1, e16, m1, ta, ma
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.v.x v9, a0
	; CHECK-NEXT: vsetvli zero, a1, e16, m1, tu, ma			; CHECK-NEXT: vsetvli zero, zero, e16, m1, tu, ma
	; CHECK-NEXT: vredxor.vs v9, v8, v9, v0.t			; CHECK-NEXT: vredxor.vs v9, v8, v9, v0.t
	; CHECK-NEXT: vmv.x.s a0, v9			; CHECK-NEXT: vmv.x.s a0, v9
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call i16 @llvm.vp.reduce.xor.nxv4i16(i16 %s, <vscale x 4 x i16> %v, <vscale x 4 x i1> %m, i32 %evl)			%r = call i16 @llvm.vp.reduce.xor.nxv4i16(i16 %s, <vscale x 4 x i16> %v, <vscale x 4 x i1> %m, i32 %evl)
	ret i16 %r			ret i16 %r
	}			}

	declare i32 @llvm.vp.reduce.add.nxv1i32(i32, <vscale x 1 x i32>, <vscale x 1 x i1>, i32)			declare i32 @llvm.vp.reduce.add.nxv1i32(i32, <vscale x 1 x i32>, <vscale x 1 x i1>, i32)

	define signext i32 @vpreduce_add_nxv1i32(i32 signext %s, <vscale x 1 x i32> %v, <vscale x 1 x i1> %m, i32 zeroext %evl) {			define signext i32 @vpreduce_add_nxv1i32(i32 signext %s, <vscale x 1 x i32> %v, <vscale x 1 x i1> %m, i32 zeroext %evl) {
	; CHECK-LABEL: vpreduce_add_nxv1i32:			; CHECK-LABEL: vpreduce_add_nxv1i32:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma			; CHECK-NEXT: vsetvli zero, a1, e32, mf2, ta, ma
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.v.x v9, a0
	; CHECK-NEXT: vsetvli zero, a1, e32, mf2, tu, ma			; CHECK-NEXT: vsetvli zero, zero, e32, mf2, tu, ma
	; CHECK-NEXT: vredsum.vs v9, v8, v9, v0.t			; CHECK-NEXT: vredsum.vs v9, v8, v9, v0.t
	; CHECK-NEXT: vmv.x.s a0, v9			; CHECK-NEXT: vmv.x.s a0, v9
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call i32 @llvm.vp.reduce.add.nxv1i32(i32 %s, <vscale x 1 x i32> %v, <vscale x 1 x i1> %m, i32 %evl)			%r = call i32 @llvm.vp.reduce.add.nxv1i32(i32 %s, <vscale x 1 x i32> %v, <vscale x 1 x i1> %m, i32 %evl)
	ret i32 %r			ret i32 %r
	}			}

	declare i32 @llvm.vp.reduce.umax.nxv1i32(i32, <vscale x 1 x i32>, <vscale x 1 x i1>, i32)			declare i32 @llvm.vp.reduce.umax.nxv1i32(i32, <vscale x 1 x i32>, <vscale x 1 x i1>, i32)

	define signext i32 @vpreduce_umax_nxv1i32(i32 signext %s, <vscale x 1 x i32> %v, <vscale x 1 x i1> %m, i32 zeroext %evl) {			define signext i32 @vpreduce_umax_nxv1i32(i32 signext %s, <vscale x 1 x i32> %v, <vscale x 1 x i1> %m, i32 zeroext %evl) {
	; RV32-LABEL: vpreduce_umax_nxv1i32:			; CHECK-LABEL: vpreduce_umax_nxv1i32:
	; RV32: # %bb.0:			; CHECK: # %bb.0:
	; RV32-NEXT: vsetivli zero, 1, e32, m1, ta, ma			; CHECK-NEXT: vsetvli zero, a1, e32, mf2, ta, ma
	; RV32-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.v.x v9, a0
	; RV32-NEXT: vsetvli zero, a1, e32, mf2, tu, ma			; CHECK-NEXT: vsetvli zero, zero, e32, mf2, tu, ma
	; RV32-NEXT: vredmaxu.vs v9, v8, v9, v0.t			; CHECK-NEXT: vredmaxu.vs v9, v8, v9, v0.t
	; RV32-NEXT: vmv.x.s a0, v9			; CHECK-NEXT: vmv.x.s a0, v9
	; RV32-NEXT: ret			; CHECK-NEXT: ret
	;
	; RV64-LABEL: vpreduce_umax_nxv1i32:
	; RV64: # %bb.0:
	; RV64-NEXT: slli a0, a0, 32
	; RV64-NEXT: srli a0, a0, 32
	; RV64-NEXT: vsetivli zero, 1, e32, m1, ta, ma
	; RV64-NEXT: vmv.s.x v9, a0
	; RV64-NEXT: vsetvli zero, a1, e32, mf2, tu, ma
	; RV64-NEXT: vredmaxu.vs v9, v8, v9, v0.t
	; RV64-NEXT: vmv.x.s a0, v9
	; RV64-NEXT: ret
	%r = call i32 @llvm.vp.reduce.umax.nxv1i32(i32 %s, <vscale x 1 x i32> %v, <vscale x 1 x i1> %m, i32 %evl)			%r = call i32 @llvm.vp.reduce.umax.nxv1i32(i32 %s, <vscale x 1 x i32> %v, <vscale x 1 x i1> %m, i32 %evl)
	ret i32 %r			ret i32 %r
	}			}

	declare i32 @llvm.vp.reduce.smax.nxv1i32(i32, <vscale x 1 x i32>, <vscale x 1 x i1>, i32)			declare i32 @llvm.vp.reduce.smax.nxv1i32(i32, <vscale x 1 x i32>, <vscale x 1 x i1>, i32)

	define signext i32 @vpreduce_smax_nxv1i32(i32 signext %s, <vscale x 1 x i32> %v, <vscale x 1 x i1> %m, i32 zeroext %evl) {			define signext i32 @vpreduce_smax_nxv1i32(i32 signext %s, <vscale x 1 x i32> %v, <vscale x 1 x i1> %m, i32 zeroext %evl) {
	; CHECK-LABEL: vpreduce_smax_nxv1i32:			; CHECK-LABEL: vpreduce_smax_nxv1i32:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma			; CHECK-NEXT: vsetvli zero, a1, e32, mf2, ta, ma
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.v.x v9, a0
	; CHECK-NEXT: vsetvli zero, a1, e32, mf2, tu, ma			; CHECK-NEXT: vsetvli zero, zero, e32, mf2, tu, ma
	; CHECK-NEXT: vredmax.vs v9, v8, v9, v0.t			; CHECK-NEXT: vredmax.vs v9, v8, v9, v0.t
	; CHECK-NEXT: vmv.x.s a0, v9			; CHECK-NEXT: vmv.x.s a0, v9
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call i32 @llvm.vp.reduce.smax.nxv1i32(i32 %s, <vscale x 1 x i32> %v, <vscale x 1 x i1> %m, i32 %evl)			%r = call i32 @llvm.vp.reduce.smax.nxv1i32(i32 %s, <vscale x 1 x i32> %v, <vscale x 1 x i1> %m, i32 %evl)
	ret i32 %r			ret i32 %r
	}			}

	declare i32 @llvm.vp.reduce.umin.nxv1i32(i32, <vscale x 1 x i32>, <vscale x 1 x i1>, i32)			declare i32 @llvm.vp.reduce.umin.nxv1i32(i32, <vscale x 1 x i32>, <vscale x 1 x i1>, i32)

	define signext i32 @vpreduce_umin_nxv1i32(i32 signext %s, <vscale x 1 x i32> %v, <vscale x 1 x i1> %m, i32 zeroext %evl) {			define signext i32 @vpreduce_umin_nxv1i32(i32 signext %s, <vscale x 1 x i32> %v, <vscale x 1 x i1> %m, i32 zeroext %evl) {
	; RV32-LABEL: vpreduce_umin_nxv1i32:			; CHECK-LABEL: vpreduce_umin_nxv1i32:
	; RV32: # %bb.0:			; CHECK: # %bb.0:
	; RV32-NEXT: vsetivli zero, 1, e32, m1, ta, ma			; CHECK-NEXT: vsetvli zero, a1, e32, mf2, ta, ma
	; RV32-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.v.x v9, a0
	; RV32-NEXT: vsetvli zero, a1, e32, mf2, tu, ma			; CHECK-NEXT: vsetvli zero, zero, e32, mf2, tu, ma
	; RV32-NEXT: vredminu.vs v9, v8, v9, v0.t			; CHECK-NEXT: vredminu.vs v9, v8, v9, v0.t
	; RV32-NEXT: vmv.x.s a0, v9			; CHECK-NEXT: vmv.x.s a0, v9
	; RV32-NEXT: ret			; CHECK-NEXT: ret
	;
	; RV64-LABEL: vpreduce_umin_nxv1i32:
	; RV64: # %bb.0:
	; RV64-NEXT: slli a0, a0, 32
	; RV64-NEXT: srli a0, a0, 32
	; RV64-NEXT: vsetivli zero, 1, e32, m1, ta, ma
	; RV64-NEXT: vmv.s.x v9, a0
	; RV64-NEXT: vsetvli zero, a1, e32, mf2, tu, ma
	; RV64-NEXT: vredminu.vs v9, v8, v9, v0.t
	; RV64-NEXT: vmv.x.s a0, v9
	; RV64-NEXT: ret
	%r = call i32 @llvm.vp.reduce.umin.nxv1i32(i32 %s, <vscale x 1 x i32> %v, <vscale x 1 x i1> %m, i32 %evl)			%r = call i32 @llvm.vp.reduce.umin.nxv1i32(i32 %s, <vscale x 1 x i32> %v, <vscale x 1 x i1> %m, i32 %evl)
	ret i32 %r			ret i32 %r
	}			}

	declare i32 @llvm.vp.reduce.smin.nxv1i32(i32, <vscale x 1 x i32>, <vscale x 1 x i1>, i32)			declare i32 @llvm.vp.reduce.smin.nxv1i32(i32, <vscale x 1 x i32>, <vscale x 1 x i1>, i32)

	define signext i32 @vpreduce_smin_nxv1i32(i32 signext %s, <vscale x 1 x i32> %v, <vscale x 1 x i1> %m, i32 zeroext %evl) {			define signext i32 @vpreduce_smin_nxv1i32(i32 signext %s, <vscale x 1 x i32> %v, <vscale x 1 x i1> %m, i32 zeroext %evl) {
	; CHECK-LABEL: vpreduce_smin_nxv1i32:			; CHECK-LABEL: vpreduce_smin_nxv1i32:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma			; CHECK-NEXT: vsetvli zero, a1, e32, mf2, ta, ma
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.v.x v9, a0
	; CHECK-NEXT: vsetvli zero, a1, e32, mf2, tu, ma			; CHECK-NEXT: vsetvli zero, zero, e32, mf2, tu, ma
	; CHECK-NEXT: vredmin.vs v9, v8, v9, v0.t			; CHECK-NEXT: vredmin.vs v9, v8, v9, v0.t
	; CHECK-NEXT: vmv.x.s a0, v9			; CHECK-NEXT: vmv.x.s a0, v9
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call i32 @llvm.vp.reduce.smin.nxv1i32(i32 %s, <vscale x 1 x i32> %v, <vscale x 1 x i1> %m, i32 %evl)			%r = call i32 @llvm.vp.reduce.smin.nxv1i32(i32 %s, <vscale x 1 x i32> %v, <vscale x 1 x i1> %m, i32 %evl)
	ret i32 %r			ret i32 %r
	}			}

	declare i32 @llvm.vp.reduce.and.nxv1i32(i32, <vscale x 1 x i32>, <vscale x 1 x i1>, i32)			declare i32 @llvm.vp.reduce.and.nxv1i32(i32, <vscale x 1 x i32>, <vscale x 1 x i1>, i32)

	define signext i32 @vpreduce_and_nxv1i32(i32 signext %s, <vscale x 1 x i32> %v, <vscale x 1 x i1> %m, i32 zeroext %evl) {			define signext i32 @vpreduce_and_nxv1i32(i32 signext %s, <vscale x 1 x i32> %v, <vscale x 1 x i1> %m, i32 zeroext %evl) {
	; CHECK-LABEL: vpreduce_and_nxv1i32:			; CHECK-LABEL: vpreduce_and_nxv1i32:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma			; CHECK-NEXT: vsetvli zero, a1, e32, mf2, ta, ma
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.v.x v9, a0
	; CHECK-NEXT: vsetvli zero, a1, e32, mf2, tu, ma			; CHECK-NEXT: vsetvli zero, zero, e32, mf2, tu, ma
	; CHECK-NEXT: vredand.vs v9, v8, v9, v0.t			; CHECK-NEXT: vredand.vs v9, v8, v9, v0.t
	; CHECK-NEXT: vmv.x.s a0, v9			; CHECK-NEXT: vmv.x.s a0, v9
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call i32 @llvm.vp.reduce.and.nxv1i32(i32 %s, <vscale x 1 x i32> %v, <vscale x 1 x i1> %m, i32 %evl)			%r = call i32 @llvm.vp.reduce.and.nxv1i32(i32 %s, <vscale x 1 x i32> %v, <vscale x 1 x i1> %m, i32 %evl)
	ret i32 %r			ret i32 %r
	}			}

	declare i32 @llvm.vp.reduce.or.nxv1i32(i32, <vscale x 1 x i32>, <vscale x 1 x i1>, i32)			declare i32 @llvm.vp.reduce.or.nxv1i32(i32, <vscale x 1 x i32>, <vscale x 1 x i1>, i32)

	define signext i32 @vpreduce_or_nxv1i32(i32 signext %s, <vscale x 1 x i32> %v, <vscale x 1 x i1> %m, i32 zeroext %evl) {			define signext i32 @vpreduce_or_nxv1i32(i32 signext %s, <vscale x 1 x i32> %v, <vscale x 1 x i1> %m, i32 zeroext %evl) {
	; CHECK-LABEL: vpreduce_or_nxv1i32:			; CHECK-LABEL: vpreduce_or_nxv1i32:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma			; CHECK-NEXT: vsetvli zero, a1, e32, mf2, ta, ma
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.v.x v9, a0
	; CHECK-NEXT: vsetvli zero, a1, e32, mf2, tu, ma			; CHECK-NEXT: vsetvli zero, zero, e32, mf2, tu, ma
	; CHECK-NEXT: vredor.vs v9, v8, v9, v0.t			; CHECK-NEXT: vredor.vs v9, v8, v9, v0.t
	; CHECK-NEXT: vmv.x.s a0, v9			; CHECK-NEXT: vmv.x.s a0, v9
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call i32 @llvm.vp.reduce.or.nxv1i32(i32 %s, <vscale x 1 x i32> %v, <vscale x 1 x i1> %m, i32 %evl)			%r = call i32 @llvm.vp.reduce.or.nxv1i32(i32 %s, <vscale x 1 x i32> %v, <vscale x 1 x i1> %m, i32 %evl)
	ret i32 %r			ret i32 %r
	}			}

	declare i32 @llvm.vp.reduce.xor.nxv1i32(i32, <vscale x 1 x i32>, <vscale x 1 x i1>, i32)			declare i32 @llvm.vp.reduce.xor.nxv1i32(i32, <vscale x 1 x i32>, <vscale x 1 x i1>, i32)

	define signext i32 @vpreduce_xor_nxv1i32(i32 signext %s, <vscale x 1 x i32> %v, <vscale x 1 x i1> %m, i32 zeroext %evl) {			define signext i32 @vpreduce_xor_nxv1i32(i32 signext %s, <vscale x 1 x i32> %v, <vscale x 1 x i1> %m, i32 zeroext %evl) {
	; CHECK-LABEL: vpreduce_xor_nxv1i32:			; CHECK-LABEL: vpreduce_xor_nxv1i32:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma			; CHECK-NEXT: vsetvli zero, a1, e32, mf2, ta, ma
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.v.x v9, a0
	; CHECK-NEXT: vsetvli zero, a1, e32, mf2, tu, ma			; CHECK-NEXT: vsetvli zero, zero, e32, mf2, tu, ma
	; CHECK-NEXT: vredxor.vs v9, v8, v9, v0.t			; CHECK-NEXT: vredxor.vs v9, v8, v9, v0.t
	; CHECK-NEXT: vmv.x.s a0, v9			; CHECK-NEXT: vmv.x.s a0, v9
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call i32 @llvm.vp.reduce.xor.nxv1i32(i32 %s, <vscale x 1 x i32> %v, <vscale x 1 x i1> %m, i32 %evl)			%r = call i32 @llvm.vp.reduce.xor.nxv1i32(i32 %s, <vscale x 1 x i32> %v, <vscale x 1 x i1> %m, i32 %evl)
	ret i32 %r			ret i32 %r
	}			}

	declare i32 @llvm.vp.reduce.add.nxv2i32(i32, <vscale x 2 x i32>, <vscale x 2 x i1>, i32)			declare i32 @llvm.vp.reduce.add.nxv2i32(i32, <vscale x 2 x i32>, <vscale x 2 x i1>, i32)

	define signext i32 @vpreduce_add_nxv2i32(i32 signext %s, <vscale x 2 x i32> %v, <vscale x 2 x i1> %m, i32 zeroext %evl) {			define signext i32 @vpreduce_add_nxv2i32(i32 signext %s, <vscale x 2 x i32> %v, <vscale x 2 x i1> %m, i32 zeroext %evl) {
	; CHECK-LABEL: vpreduce_add_nxv2i32:			; CHECK-LABEL: vpreduce_add_nxv2i32:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma			; CHECK-NEXT: vsetvli zero, a1, e32, m1, ta, ma
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.v.x v9, a0
	; CHECK-NEXT: vsetvli zero, a1, e32, m1, tu, ma			; CHECK-NEXT: vsetvli zero, zero, e32, m1, tu, ma
	; CHECK-NEXT: vredsum.vs v9, v8, v9, v0.t			; CHECK-NEXT: vredsum.vs v9, v8, v9, v0.t
	; CHECK-NEXT: vmv.x.s a0, v9			; CHECK-NEXT: vmv.x.s a0, v9
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call i32 @llvm.vp.reduce.add.nxv2i32(i32 %s, <vscale x 2 x i32> %v, <vscale x 2 x i1> %m, i32 %evl)			%r = call i32 @llvm.vp.reduce.add.nxv2i32(i32 %s, <vscale x 2 x i32> %v, <vscale x 2 x i1> %m, i32 %evl)
	ret i32 %r			ret i32 %r
	}			}

	declare i32 @llvm.vp.reduce.umax.nxv2i32(i32, <vscale x 2 x i32>, <vscale x 2 x i1>, i32)			declare i32 @llvm.vp.reduce.umax.nxv2i32(i32, <vscale x 2 x i32>, <vscale x 2 x i1>, i32)

	define signext i32 @vpreduce_umax_nxv2i32(i32 signext %s, <vscale x 2 x i32> %v, <vscale x 2 x i1> %m, i32 zeroext %evl) {			define signext i32 @vpreduce_umax_nxv2i32(i32 signext %s, <vscale x 2 x i32> %v, <vscale x 2 x i1> %m, i32 zeroext %evl) {
	; RV32-LABEL: vpreduce_umax_nxv2i32:			; CHECK-LABEL: vpreduce_umax_nxv2i32:
	; RV32: # %bb.0:			; CHECK: # %bb.0:
	; RV32-NEXT: vsetivli zero, 1, e32, m1, ta, ma			; CHECK-NEXT: vsetvli zero, a1, e32, m1, ta, ma
	; RV32-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.v.x v9, a0
	; RV32-NEXT: vsetvli zero, a1, e32, m1, tu, ma			; CHECK-NEXT: vsetvli zero, zero, e32, m1, tu, ma
	; RV32-NEXT: vredmaxu.vs v9, v8, v9, v0.t			; CHECK-NEXT: vredmaxu.vs v9, v8, v9, v0.t
	; RV32-NEXT: vmv.x.s a0, v9			; CHECK-NEXT: vmv.x.s a0, v9
	; RV32-NEXT: ret			; CHECK-NEXT: ret
	;
	; RV64-LABEL: vpreduce_umax_nxv2i32:
	; RV64: # %bb.0:
	; RV64-NEXT: slli a0, a0, 32
	; RV64-NEXT: srli a0, a0, 32
	; RV64-NEXT: vsetivli zero, 1, e32, m1, ta, ma
	; RV64-NEXT: vmv.s.x v9, a0
	; RV64-NEXT: vsetvli zero, a1, e32, m1, tu, ma
	; RV64-NEXT: vredmaxu.vs v9, v8, v9, v0.t
	; RV64-NEXT: vmv.x.s a0, v9
	; RV64-NEXT: ret
	%r = call i32 @llvm.vp.reduce.umax.nxv2i32(i32 %s, <vscale x 2 x i32> %v, <vscale x 2 x i1> %m, i32 %evl)			%r = call i32 @llvm.vp.reduce.umax.nxv2i32(i32 %s, <vscale x 2 x i32> %v, <vscale x 2 x i1> %m, i32 %evl)
	ret i32 %r			ret i32 %r
	}			}

	declare i32 @llvm.vp.reduce.smax.nxv2i32(i32, <vscale x 2 x i32>, <vscale x 2 x i1>, i32)			declare i32 @llvm.vp.reduce.smax.nxv2i32(i32, <vscale x 2 x i32>, <vscale x 2 x i1>, i32)

	define signext i32 @vpreduce_smax_nxv2i32(i32 signext %s, <vscale x 2 x i32> %v, <vscale x 2 x i1> %m, i32 zeroext %evl) {			define signext i32 @vpreduce_smax_nxv2i32(i32 signext %s, <vscale x 2 x i32> %v, <vscale x 2 x i1> %m, i32 zeroext %evl) {
	; CHECK-LABEL: vpreduce_smax_nxv2i32:			; CHECK-LABEL: vpreduce_smax_nxv2i32:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma			; CHECK-NEXT: vsetvli zero, a1, e32, m1, ta, ma
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.v.x v9, a0
	; CHECK-NEXT: vsetvli zero, a1, e32, m1, tu, ma			; CHECK-NEXT: vsetvli zero, zero, e32, m1, tu, ma
	; CHECK-NEXT: vredmax.vs v9, v8, v9, v0.t			; CHECK-NEXT: vredmax.vs v9, v8, v9, v0.t
	; CHECK-NEXT: vmv.x.s a0, v9			; CHECK-NEXT: vmv.x.s a0, v9
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call i32 @llvm.vp.reduce.smax.nxv2i32(i32 %s, <vscale x 2 x i32> %v, <vscale x 2 x i1> %m, i32 %evl)			%r = call i32 @llvm.vp.reduce.smax.nxv2i32(i32 %s, <vscale x 2 x i32> %v, <vscale x 2 x i1> %m, i32 %evl)
	ret i32 %r			ret i32 %r
	}			}

	declare i32 @llvm.vp.reduce.umin.nxv2i32(i32, <vscale x 2 x i32>, <vscale x 2 x i1>, i32)			declare i32 @llvm.vp.reduce.umin.nxv2i32(i32, <vscale x 2 x i32>, <vscale x 2 x i1>, i32)

	define signext i32 @vpreduce_umin_nxv2i32(i32 signext %s, <vscale x 2 x i32> %v, <vscale x 2 x i1> %m, i32 zeroext %evl) {			define signext i32 @vpreduce_umin_nxv2i32(i32 signext %s, <vscale x 2 x i32> %v, <vscale x 2 x i1> %m, i32 zeroext %evl) {
	; RV32-LABEL: vpreduce_umin_nxv2i32:			; CHECK-LABEL: vpreduce_umin_nxv2i32:
	; RV32: # %bb.0:			; CHECK: # %bb.0:
	; RV32-NEXT: vsetivli zero, 1, e32, m1, ta, ma			; CHECK-NEXT: vsetvli zero, a1, e32, m1, ta, ma
	; RV32-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.v.x v9, a0
	; RV32-NEXT: vsetvli zero, a1, e32, m1, tu, ma			; CHECK-NEXT: vsetvli zero, zero, e32, m1, tu, ma
	; RV32-NEXT: vredminu.vs v9, v8, v9, v0.t			; CHECK-NEXT: vredminu.vs v9, v8, v9, v0.t
	; RV32-NEXT: vmv.x.s a0, v9			; CHECK-NEXT: vmv.x.s a0, v9
	; RV32-NEXT: ret			; CHECK-NEXT: ret
	;
	; RV64-LABEL: vpreduce_umin_nxv2i32:
	; RV64: # %bb.0:
	; RV64-NEXT: slli a0, a0, 32
	; RV64-NEXT: srli a0, a0, 32
	; RV64-NEXT: vsetivli zero, 1, e32, m1, ta, ma
	; RV64-NEXT: vmv.s.x v9, a0
	; RV64-NEXT: vsetvli zero, a1, e32, m1, tu, ma
	; RV64-NEXT: vredminu.vs v9, v8, v9, v0.t
	; RV64-NEXT: vmv.x.s a0, v9
	; RV64-NEXT: ret
	%r = call i32 @llvm.vp.reduce.umin.nxv2i32(i32 %s, <vscale x 2 x i32> %v, <vscale x 2 x i1> %m, i32 %evl)			%r = call i32 @llvm.vp.reduce.umin.nxv2i32(i32 %s, <vscale x 2 x i32> %v, <vscale x 2 x i1> %m, i32 %evl)
	ret i32 %r			ret i32 %r
	}			}

	declare i32 @llvm.vp.reduce.smin.nxv2i32(i32, <vscale x 2 x i32>, <vscale x 2 x i1>, i32)			declare i32 @llvm.vp.reduce.smin.nxv2i32(i32, <vscale x 2 x i32>, <vscale x 2 x i1>, i32)

	define signext i32 @vpreduce_smin_nxv2i32(i32 signext %s, <vscale x 2 x i32> %v, <vscale x 2 x i1> %m, i32 zeroext %evl) {			define signext i32 @vpreduce_smin_nxv2i32(i32 signext %s, <vscale x 2 x i32> %v, <vscale x 2 x i1> %m, i32 zeroext %evl) {
	; CHECK-LABEL: vpreduce_smin_nxv2i32:			; CHECK-LABEL: vpreduce_smin_nxv2i32:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma			; CHECK-NEXT: vsetvli zero, a1, e32, m1, ta, ma
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.v.x v9, a0
	; CHECK-NEXT: vsetvli zero, a1, e32, m1, tu, ma			; CHECK-NEXT: vsetvli zero, zero, e32, m1, tu, ma
	; CHECK-NEXT: vredmin.vs v9, v8, v9, v0.t			; CHECK-NEXT: vredmin.vs v9, v8, v9, v0.t
	; CHECK-NEXT: vmv.x.s a0, v9			; CHECK-NEXT: vmv.x.s a0, v9
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call i32 @llvm.vp.reduce.smin.nxv2i32(i32 %s, <vscale x 2 x i32> %v, <vscale x 2 x i1> %m, i32 %evl)			%r = call i32 @llvm.vp.reduce.smin.nxv2i32(i32 %s, <vscale x 2 x i32> %v, <vscale x 2 x i1> %m, i32 %evl)
	ret i32 %r			ret i32 %r
	}			}

	declare i32 @llvm.vp.reduce.and.nxv2i32(i32, <vscale x 2 x i32>, <vscale x 2 x i1>, i32)			declare i32 @llvm.vp.reduce.and.nxv2i32(i32, <vscale x 2 x i32>, <vscale x 2 x i1>, i32)

	define signext i32 @vpreduce_and_nxv2i32(i32 signext %s, <vscale x 2 x i32> %v, <vscale x 2 x i1> %m, i32 zeroext %evl) {			define signext i32 @vpreduce_and_nxv2i32(i32 signext %s, <vscale x 2 x i32> %v, <vscale x 2 x i1> %m, i32 zeroext %evl) {
	; CHECK-LABEL: vpreduce_and_nxv2i32:			; CHECK-LABEL: vpreduce_and_nxv2i32:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma			; CHECK-NEXT: vsetvli zero, a1, e32, m1, ta, ma
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.v.x v9, a0
	; CHECK-NEXT: vsetvli zero, a1, e32, m1, tu, ma			; CHECK-NEXT: vsetvli zero, zero, e32, m1, tu, ma
	; CHECK-NEXT: vredand.vs v9, v8, v9, v0.t			; CHECK-NEXT: vredand.vs v9, v8, v9, v0.t
	; CHECK-NEXT: vmv.x.s a0, v9			; CHECK-NEXT: vmv.x.s a0, v9
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call i32 @llvm.vp.reduce.and.nxv2i32(i32 %s, <vscale x 2 x i32> %v, <vscale x 2 x i1> %m, i32 %evl)			%r = call i32 @llvm.vp.reduce.and.nxv2i32(i32 %s, <vscale x 2 x i32> %v, <vscale x 2 x i1> %m, i32 %evl)
	ret i32 %r			ret i32 %r
	}			}

	declare i32 @llvm.vp.reduce.or.nxv2i32(i32, <vscale x 2 x i32>, <vscale x 2 x i1>, i32)			declare i32 @llvm.vp.reduce.or.nxv2i32(i32, <vscale x 2 x i32>, <vscale x 2 x i1>, i32)

	define signext i32 @vpreduce_or_nxv2i32(i32 signext %s, <vscale x 2 x i32> %v, <vscale x 2 x i1> %m, i32 zeroext %evl) {			define signext i32 @vpreduce_or_nxv2i32(i32 signext %s, <vscale x 2 x i32> %v, <vscale x 2 x i1> %m, i32 zeroext %evl) {
	; CHECK-LABEL: vpreduce_or_nxv2i32:			; CHECK-LABEL: vpreduce_or_nxv2i32:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma			; CHECK-NEXT: vsetvli zero, a1, e32, m1, ta, ma
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.v.x v9, a0
	; CHECK-NEXT: vsetvli zero, a1, e32, m1, tu, ma			; CHECK-NEXT: vsetvli zero, zero, e32, m1, tu, ma
	; CHECK-NEXT: vredor.vs v9, v8, v9, v0.t			; CHECK-NEXT: vredor.vs v9, v8, v9, v0.t
	; CHECK-NEXT: vmv.x.s a0, v9			; CHECK-NEXT: vmv.x.s a0, v9
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call i32 @llvm.vp.reduce.or.nxv2i32(i32 %s, <vscale x 2 x i32> %v, <vscale x 2 x i1> %m, i32 %evl)			%r = call i32 @llvm.vp.reduce.or.nxv2i32(i32 %s, <vscale x 2 x i32> %v, <vscale x 2 x i1> %m, i32 %evl)
	ret i32 %r			ret i32 %r
	}			}

	declare i32 @llvm.vp.reduce.xor.nxv2i32(i32, <vscale x 2 x i32>, <vscale x 2 x i1>, i32)			declare i32 @llvm.vp.reduce.xor.nxv2i32(i32, <vscale x 2 x i32>, <vscale x 2 x i1>, i32)

	define signext i32 @vpreduce_xor_nxv2i32(i32 signext %s, <vscale x 2 x i32> %v, <vscale x 2 x i1> %m, i32 zeroext %evl) {			define signext i32 @vpreduce_xor_nxv2i32(i32 signext %s, <vscale x 2 x i32> %v, <vscale x 2 x i1> %m, i32 zeroext %evl) {
	; CHECK-LABEL: vpreduce_xor_nxv2i32:			; CHECK-LABEL: vpreduce_xor_nxv2i32:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma			; CHECK-NEXT: vsetvli zero, a1, e32, m1, ta, ma
	; CHECK-NEXT: vmv.s.x v9, a0			; CHECK-NEXT: vmv.v.x v9, a0
	; CHECK-NEXT: vsetvli zero, a1, e32, m1, tu, ma			; CHECK-NEXT: vsetvli zero, zero, e32, m1, tu, ma
	; CHECK-NEXT: vredxor.vs v9, v8, v9, v0.t			; CHECK-NEXT: vredxor.vs v9, v8, v9, v0.t
	; CHECK-NEXT: vmv.x.s a0, v9			; CHECK-NEXT: vmv.x.s a0, v9
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call i32 @llvm.vp.reduce.xor.nxv2i32(i32 %s, <vscale x 2 x i32> %v, <vscale x 2 x i1> %m, i32 %evl)			%r = call i32 @llvm.vp.reduce.xor.nxv2i32(i32 %s, <vscale x 2 x i32> %v, <vscale x 2 x i1> %m, i32 %evl)
	ret i32 %r			ret i32 %r
	}			}

	declare i32 @llvm.vp.reduce.add.nxv4i32(i32, <vscale x 4 x i32>, <vscale x 4 x i1>, i32)			declare i32 @llvm.vp.reduce.add.nxv4i32(i32, <vscale x 4 x i32>, <vscale x 4 x i1>, i32)
	▲ Show 20 Lines • Show All 207 Lines • ▼ Show 20 Lines
	define signext i64 @vpreduce_add_nxv1i64(i64 signext %s, <vscale x 1 x i64> %v, <vscale x 1 x i1> %m, i32 zeroext %evl) {			define signext i64 @vpreduce_add_nxv1i64(i64 signext %s, <vscale x 1 x i64> %v, <vscale x 1 x i1> %m, i32 zeroext %evl) {
	; RV32-LABEL: vpreduce_add_nxv1i64:			; RV32-LABEL: vpreduce_add_nxv1i64:
	; RV32: # %bb.0:			; RV32: # %bb.0:
	; RV32-NEXT: addi sp, sp, -16			; RV32-NEXT: addi sp, sp, -16
	; RV32-NEXT: .cfi_def_cfa_offset 16			; RV32-NEXT: .cfi_def_cfa_offset 16
	; RV32-NEXT: sw a1, 12(sp)			; RV32-NEXT: sw a1, 12(sp)
	; RV32-NEXT: sw a0, 8(sp)			; RV32-NEXT: sw a0, 8(sp)
	; RV32-NEXT: addi a0, sp, 8			; RV32-NEXT: addi a0, sp, 8
	; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV32-NEXT: vsetvli zero, a2, e64, m1, ta, ma
	; RV32-NEXT: vlse64.v v9, (a0), zero			; RV32-NEXT: vlse64.v v9, (a0), zero
	; RV32-NEXT: vsetvli zero, a2, e64, m1, tu, ma			; RV32-NEXT: vsetvli zero, zero, e64, m1, tu, ma
	; RV32-NEXT: vredsum.vs v9, v8, v9, v0.t			; RV32-NEXT: vredsum.vs v9, v8, v9, v0.t
	; RV32-NEXT: vmv.x.s a0, v9			; RV32-NEXT: vmv.x.s a0, v9
	; RV32-NEXT: li a1, 32			; RV32-NEXT: li a1, 32
	; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma
	; RV32-NEXT: vsrl.vx v8, v9, a1			; RV32-NEXT: vsrl.vx v8, v9, a1
	; RV32-NEXT: vmv.x.s a1, v8			; RV32-NEXT: vmv.x.s a1, v8
	; RV32-NEXT: addi sp, sp, 16			; RV32-NEXT: addi sp, sp, 16
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: vpreduce_add_nxv1i64:			; RV64-LABEL: vpreduce_add_nxv1i64:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV64-NEXT: vsetvli zero, a1, e64, m1, ta, ma
	; RV64-NEXT: vmv.s.x v9, a0			; RV64-NEXT: vmv.v.x v9, a0
	; RV64-NEXT: vsetvli zero, a1, e64, m1, tu, ma			; RV64-NEXT: vsetvli zero, zero, e64, m1, tu, ma
	; RV64-NEXT: vredsum.vs v9, v8, v9, v0.t			; RV64-NEXT: vredsum.vs v9, v8, v9, v0.t
	; RV64-NEXT: vmv.x.s a0, v9			; RV64-NEXT: vmv.x.s a0, v9
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%r = call i64 @llvm.vp.reduce.add.nxv1i64(i64 %s, <vscale x 1 x i64> %v, <vscale x 1 x i1> %m, i32 %evl)			%r = call i64 @llvm.vp.reduce.add.nxv1i64(i64 %s, <vscale x 1 x i64> %v, <vscale x 1 x i1> %m, i32 %evl)
	ret i64 %r			ret i64 %r
	}			}

	define signext i64 @vpwreduce_add_nxv1i32(i64 signext %s, <vscale x 1 x i32> %v, <vscale x 1 x i1> %m, i32 zeroext %evl) {			define signext i64 @vpwreduce_add_nxv1i32(i64 signext %s, <vscale x 1 x i32> %v, <vscale x 1 x i1> %m, i32 zeroext %evl) {
	; RV32-LABEL: vpwreduce_add_nxv1i32:			; RV32-LABEL: vpwreduce_add_nxv1i32:
	; RV32: # %bb.0:			; RV32: # %bb.0:
	; RV32-NEXT: addi sp, sp, -16			; RV32-NEXT: addi sp, sp, -16
	; RV32-NEXT: .cfi_def_cfa_offset 16			; RV32-NEXT: .cfi_def_cfa_offset 16
	; RV32-NEXT: sw a1, 12(sp)			; RV32-NEXT: sw a1, 12(sp)
	; RV32-NEXT: sw a0, 8(sp)			; RV32-NEXT: sw a0, 8(sp)
	; RV32-NEXT: addi a0, sp, 8			; RV32-NEXT: addi a0, sp, 8
	; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV32-NEXT: vsetvli zero, a2, e64, m1, ta, ma
	; RV32-NEXT: vlse64.v v9, (a0), zero			; RV32-NEXT: vlse64.v v9, (a0), zero
	; RV32-NEXT: vsetvli zero, a2, e32, mf2, tu, ma			; RV32-NEXT: vsetvli zero, zero, e32, mf2, tu, ma
	; RV32-NEXT: vwredsum.vs v9, v8, v9, v0.t			; RV32-NEXT: vwredsum.vs v9, v8, v9, v0.t
	; RV32-NEXT: vsetvli zero, zero, e64, m1, ta, ma			; RV32-NEXT: vsetvli zero, zero, e64, m1, ta, ma
	; RV32-NEXT: vmv.x.s a0, v9			; RV32-NEXT: vmv.x.s a0, v9
	; RV32-NEXT: li a1, 32			; RV32-NEXT: li a1, 32
	; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma
	; RV32-NEXT: vsrl.vx v8, v9, a1			; RV32-NEXT: vsrl.vx v8, v9, a1
	; RV32-NEXT: vmv.x.s a1, v8			; RV32-NEXT: vmv.x.s a1, v8
	; RV32-NEXT: addi sp, sp, 16			; RV32-NEXT: addi sp, sp, 16
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: vpwreduce_add_nxv1i32:			; RV64-LABEL: vpwreduce_add_nxv1i32:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV64-NEXT: vsetvli zero, a1, e64, m1, ta, ma
	; RV64-NEXT: vmv.s.x v9, a0			; RV64-NEXT: vmv.v.x v9, a0
	; RV64-NEXT: vsetvli zero, a1, e32, mf2, tu, ma			; RV64-NEXT: vsetvli zero, zero, e32, mf2, tu, ma
	; RV64-NEXT: vwredsum.vs v9, v8, v9, v0.t			; RV64-NEXT: vwredsum.vs v9, v8, v9, v0.t
	; RV64-NEXT: vsetvli zero, zero, e64, m1, ta, ma			; RV64-NEXT: vsetvli zero, zero, e64, m1, ta, ma
	; RV64-NEXT: vmv.x.s a0, v9			; RV64-NEXT: vmv.x.s a0, v9
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%e = sext <vscale x 1 x i32> %v to <vscale x 1 x i64>			%e = sext <vscale x 1 x i32> %v to <vscale x 1 x i64>
	%r = call i64 @llvm.vp.reduce.add.nxv1i64(i64 %s, <vscale x 1 x i64> %e, <vscale x 1 x i1> %m, i32 %evl)			%r = call i64 @llvm.vp.reduce.add.nxv1i64(i64 %s, <vscale x 1 x i64> %e, <vscale x 1 x i1> %m, i32 %evl)
	ret i64 %r			ret i64 %r
	}			}

	define signext i64 @vpwreduce_uadd_nxv1i32(i64 signext %s, <vscale x 1 x i32> %v, <vscale x 1 x i1> %m, i32 zeroext %evl) {			define signext i64 @vpwreduce_uadd_nxv1i32(i64 signext %s, <vscale x 1 x i32> %v, <vscale x 1 x i1> %m, i32 zeroext %evl) {
	; RV32-LABEL: vpwreduce_uadd_nxv1i32:			; RV32-LABEL: vpwreduce_uadd_nxv1i32:
	; RV32: # %bb.0:			; RV32: # %bb.0:
	; RV32-NEXT: addi sp, sp, -16			; RV32-NEXT: addi sp, sp, -16
	; RV32-NEXT: .cfi_def_cfa_offset 16			; RV32-NEXT: .cfi_def_cfa_offset 16
	; RV32-NEXT: sw a1, 12(sp)			; RV32-NEXT: sw a1, 12(sp)
	; RV32-NEXT: sw a0, 8(sp)			; RV32-NEXT: sw a0, 8(sp)
	; RV32-NEXT: addi a0, sp, 8			; RV32-NEXT: addi a0, sp, 8
	; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV32-NEXT: vsetvli zero, a2, e64, m1, ta, ma
	; RV32-NEXT: vlse64.v v9, (a0), zero			; RV32-NEXT: vlse64.v v9, (a0), zero
	; RV32-NEXT: vsetvli zero, a2, e32, mf2, tu, ma			; RV32-NEXT: vsetvli zero, zero, e32, mf2, tu, ma
	; RV32-NEXT: vwredsum.vs v9, v8, v9, v0.t			; RV32-NEXT: vwredsum.vs v9, v8, v9, v0.t
	; RV32-NEXT: vsetvli zero, zero, e64, m1, ta, ma			; RV32-NEXT: vsetvli zero, zero, e64, m1, ta, ma
	; RV32-NEXT: vmv.x.s a0, v9			; RV32-NEXT: vmv.x.s a0, v9
	; RV32-NEXT: li a1, 32			; RV32-NEXT: li a1, 32
	; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma
	; RV32-NEXT: vsrl.vx v8, v9, a1			; RV32-NEXT: vsrl.vx v8, v9, a1
	; RV32-NEXT: vmv.x.s a1, v8			; RV32-NEXT: vmv.x.s a1, v8
	; RV32-NEXT: addi sp, sp, 16			; RV32-NEXT: addi sp, sp, 16
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: vpwreduce_uadd_nxv1i32:			; RV64-LABEL: vpwreduce_uadd_nxv1i32:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV64-NEXT: vsetvli zero, a1, e64, m1, ta, ma
	; RV64-NEXT: vmv.s.x v9, a0			; RV64-NEXT: vmv.v.x v9, a0
	; RV64-NEXT: vsetvli zero, a1, e32, mf2, tu, ma			; RV64-NEXT: vsetvli zero, zero, e32, mf2, tu, ma
	; RV64-NEXT: vwredsum.vs v9, v8, v9, v0.t			; RV64-NEXT: vwredsum.vs v9, v8, v9, v0.t
	; RV64-NEXT: vsetvli zero, zero, e64, m1, ta, ma			; RV64-NEXT: vsetvli zero, zero, e64, m1, ta, ma
	; RV64-NEXT: vmv.x.s a0, v9			; RV64-NEXT: vmv.x.s a0, v9
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%e = sext <vscale x 1 x i32> %v to <vscale x 1 x i64>			%e = sext <vscale x 1 x i32> %v to <vscale x 1 x i64>
	%r = call i64 @llvm.vp.reduce.add.nxv1i64(i64 %s, <vscale x 1 x i64> %e, <vscale x 1 x i1> %m, i32 %evl)			%r = call i64 @llvm.vp.reduce.add.nxv1i64(i64 %s, <vscale x 1 x i64> %e, <vscale x 1 x i1> %m, i32 %evl)
	ret i64 %r			ret i64 %r
	}			}

	declare i64 @llvm.vp.reduce.umax.nxv1i64(i64, <vscale x 1 x i64>, <vscale x 1 x i1>, i32)			declare i64 @llvm.vp.reduce.umax.nxv1i64(i64, <vscale x 1 x i64>, <vscale x 1 x i1>, i32)

	define signext i64 @vpreduce_umax_nxv1i64(i64 signext %s, <vscale x 1 x i64> %v, <vscale x 1 x i1> %m, i32 zeroext %evl) {			define signext i64 @vpreduce_umax_nxv1i64(i64 signext %s, <vscale x 1 x i64> %v, <vscale x 1 x i1> %m, i32 zeroext %evl) {
	; RV32-LABEL: vpreduce_umax_nxv1i64:			; RV32-LABEL: vpreduce_umax_nxv1i64:
	; RV32: # %bb.0:			; RV32: # %bb.0:
	; RV32-NEXT: addi sp, sp, -16			; RV32-NEXT: addi sp, sp, -16
	; RV32-NEXT: .cfi_def_cfa_offset 16			; RV32-NEXT: .cfi_def_cfa_offset 16
	; RV32-NEXT: sw a1, 12(sp)			; RV32-NEXT: sw a1, 12(sp)
	; RV32-NEXT: sw a0, 8(sp)			; RV32-NEXT: sw a0, 8(sp)
	; RV32-NEXT: addi a0, sp, 8			; RV32-NEXT: addi a0, sp, 8
	; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV32-NEXT: vsetvli zero, a2, e64, m1, ta, ma
	; RV32-NEXT: vlse64.v v9, (a0), zero			; RV32-NEXT: vlse64.v v9, (a0), zero
	; RV32-NEXT: vsetvli zero, a2, e64, m1, tu, ma			; RV32-NEXT: vsetvli zero, zero, e64, m1, tu, ma
	; RV32-NEXT: vredmaxu.vs v9, v8, v9, v0.t			; RV32-NEXT: vredmaxu.vs v9, v8, v9, v0.t
	; RV32-NEXT: vmv.x.s a0, v9			; RV32-NEXT: vmv.x.s a0, v9
	; RV32-NEXT: li a1, 32			; RV32-NEXT: li a1, 32
	; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma
	; RV32-NEXT: vsrl.vx v8, v9, a1			; RV32-NEXT: vsrl.vx v8, v9, a1
	; RV32-NEXT: vmv.x.s a1, v8			; RV32-NEXT: vmv.x.s a1, v8
	; RV32-NEXT: addi sp, sp, 16			; RV32-NEXT: addi sp, sp, 16
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: vpreduce_umax_nxv1i64:			; RV64-LABEL: vpreduce_umax_nxv1i64:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV64-NEXT: vsetvli zero, a1, e64, m1, ta, ma
	; RV64-NEXT: vmv.s.x v9, a0			; RV64-NEXT: vmv.v.x v9, a0
	; RV64-NEXT: vsetvli zero, a1, e64, m1, tu, ma			; RV64-NEXT: vsetvli zero, zero, e64, m1, tu, ma
	; RV64-NEXT: vredmaxu.vs v9, v8, v9, v0.t			; RV64-NEXT: vredmaxu.vs v9, v8, v9, v0.t
	; RV64-NEXT: vmv.x.s a0, v9			; RV64-NEXT: vmv.x.s a0, v9
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%r = call i64 @llvm.vp.reduce.umax.nxv1i64(i64 %s, <vscale x 1 x i64> %v, <vscale x 1 x i1> %m, i32 %evl)			%r = call i64 @llvm.vp.reduce.umax.nxv1i64(i64 %s, <vscale x 1 x i64> %v, <vscale x 1 x i1> %m, i32 %evl)
	ret i64 %r			ret i64 %r
	}			}

	declare i64 @llvm.vp.reduce.smax.nxv1i64(i64, <vscale x 1 x i64>, <vscale x 1 x i1>, i32)			declare i64 @llvm.vp.reduce.smax.nxv1i64(i64, <vscale x 1 x i64>, <vscale x 1 x i1>, i32)

	define signext i64 @vpreduce_smax_nxv1i64(i64 signext %s, <vscale x 1 x i64> %v, <vscale x 1 x i1> %m, i32 zeroext %evl) {			define signext i64 @vpreduce_smax_nxv1i64(i64 signext %s, <vscale x 1 x i64> %v, <vscale x 1 x i1> %m, i32 zeroext %evl) {
	; RV32-LABEL: vpreduce_smax_nxv1i64:			; RV32-LABEL: vpreduce_smax_nxv1i64:
	; RV32: # %bb.0:			; RV32: # %bb.0:
	; RV32-NEXT: addi sp, sp, -16			; RV32-NEXT: addi sp, sp, -16
	; RV32-NEXT: .cfi_def_cfa_offset 16			; RV32-NEXT: .cfi_def_cfa_offset 16
	; RV32-NEXT: sw a1, 12(sp)			; RV32-NEXT: sw a1, 12(sp)
	; RV32-NEXT: sw a0, 8(sp)			; RV32-NEXT: sw a0, 8(sp)
	; RV32-NEXT: addi a0, sp, 8			; RV32-NEXT: addi a0, sp, 8
	; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV32-NEXT: vsetvli zero, a2, e64, m1, ta, ma
	; RV32-NEXT: vlse64.v v9, (a0), zero			; RV32-NEXT: vlse64.v v9, (a0), zero
	; RV32-NEXT: vsetvli zero, a2, e64, m1, tu, ma			; RV32-NEXT: vsetvli zero, zero, e64, m1, tu, ma
	; RV32-NEXT: vredmax.vs v9, v8, v9, v0.t			; RV32-NEXT: vredmax.vs v9, v8, v9, v0.t
	; RV32-NEXT: vmv.x.s a0, v9			; RV32-NEXT: vmv.x.s a0, v9
	; RV32-NEXT: li a1, 32			; RV32-NEXT: li a1, 32
	; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma
	; RV32-NEXT: vsrl.vx v8, v9, a1			; RV32-NEXT: vsrl.vx v8, v9, a1
	; RV32-NEXT: vmv.x.s a1, v8			; RV32-NEXT: vmv.x.s a1, v8
	; RV32-NEXT: addi sp, sp, 16			; RV32-NEXT: addi sp, sp, 16
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: vpreduce_smax_nxv1i64:			; RV64-LABEL: vpreduce_smax_nxv1i64:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV64-NEXT: vsetvli zero, a1, e64, m1, ta, ma
	; RV64-NEXT: vmv.s.x v9, a0			; RV64-NEXT: vmv.v.x v9, a0
	; RV64-NEXT: vsetvli zero, a1, e64, m1, tu, ma			; RV64-NEXT: vsetvli zero, zero, e64, m1, tu, ma
	; RV64-NEXT: vredmax.vs v9, v8, v9, v0.t			; RV64-NEXT: vredmax.vs v9, v8, v9, v0.t
	; RV64-NEXT: vmv.x.s a0, v9			; RV64-NEXT: vmv.x.s a0, v9
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%r = call i64 @llvm.vp.reduce.smax.nxv1i64(i64 %s, <vscale x 1 x i64> %v, <vscale x 1 x i1> %m, i32 %evl)			%r = call i64 @llvm.vp.reduce.smax.nxv1i64(i64 %s, <vscale x 1 x i64> %v, <vscale x 1 x i1> %m, i32 %evl)
	ret i64 %r			ret i64 %r
	}			}

	declare i64 @llvm.vp.reduce.umin.nxv1i64(i64, <vscale x 1 x i64>, <vscale x 1 x i1>, i32)			declare i64 @llvm.vp.reduce.umin.nxv1i64(i64, <vscale x 1 x i64>, <vscale x 1 x i1>, i32)

	define signext i64 @vpreduce_umin_nxv1i64(i64 signext %s, <vscale x 1 x i64> %v, <vscale x 1 x i1> %m, i32 zeroext %evl) {			define signext i64 @vpreduce_umin_nxv1i64(i64 signext %s, <vscale x 1 x i64> %v, <vscale x 1 x i1> %m, i32 zeroext %evl) {
	; RV32-LABEL: vpreduce_umin_nxv1i64:			; RV32-LABEL: vpreduce_umin_nxv1i64:
	; RV32: # %bb.0:			; RV32: # %bb.0:
	; RV32-NEXT: addi sp, sp, -16			; RV32-NEXT: addi sp, sp, -16
	; RV32-NEXT: .cfi_def_cfa_offset 16			; RV32-NEXT: .cfi_def_cfa_offset 16
	; RV32-NEXT: sw a1, 12(sp)			; RV32-NEXT: sw a1, 12(sp)
	; RV32-NEXT: sw a0, 8(sp)			; RV32-NEXT: sw a0, 8(sp)
	; RV32-NEXT: addi a0, sp, 8			; RV32-NEXT: addi a0, sp, 8
	; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV32-NEXT: vsetvli zero, a2, e64, m1, ta, ma
	; RV32-NEXT: vlse64.v v9, (a0), zero			; RV32-NEXT: vlse64.v v9, (a0), zero
	; RV32-NEXT: vsetvli zero, a2, e64, m1, tu, ma			; RV32-NEXT: vsetvli zero, zero, e64, m1, tu, ma
	; RV32-NEXT: vredminu.vs v9, v8, v9, v0.t			; RV32-NEXT: vredminu.vs v9, v8, v9, v0.t
	; RV32-NEXT: vmv.x.s a0, v9			; RV32-NEXT: vmv.x.s a0, v9
	; RV32-NEXT: li a1, 32			; RV32-NEXT: li a1, 32
	; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma
	; RV32-NEXT: vsrl.vx v8, v9, a1			; RV32-NEXT: vsrl.vx v8, v9, a1
	; RV32-NEXT: vmv.x.s a1, v8			; RV32-NEXT: vmv.x.s a1, v8
	; RV32-NEXT: addi sp, sp, 16			; RV32-NEXT: addi sp, sp, 16
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: vpreduce_umin_nxv1i64:			; RV64-LABEL: vpreduce_umin_nxv1i64:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV64-NEXT: vsetvli zero, a1, e64, m1, ta, ma
	; RV64-NEXT: vmv.s.x v9, a0			; RV64-NEXT: vmv.v.x v9, a0
	; RV64-NEXT: vsetvli zero, a1, e64, m1, tu, ma			; RV64-NEXT: vsetvli zero, zero, e64, m1, tu, ma
	; RV64-NEXT: vredminu.vs v9, v8, v9, v0.t			; RV64-NEXT: vredminu.vs v9, v8, v9, v0.t
	; RV64-NEXT: vmv.x.s a0, v9			; RV64-NEXT: vmv.x.s a0, v9
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%r = call i64 @llvm.vp.reduce.umin.nxv1i64(i64 %s, <vscale x 1 x i64> %v, <vscale x 1 x i1> %m, i32 %evl)			%r = call i64 @llvm.vp.reduce.umin.nxv1i64(i64 %s, <vscale x 1 x i64> %v, <vscale x 1 x i1> %m, i32 %evl)
	ret i64 %r			ret i64 %r
	}			}

	declare i64 @llvm.vp.reduce.smin.nxv1i64(i64, <vscale x 1 x i64>, <vscale x 1 x i1>, i32)			declare i64 @llvm.vp.reduce.smin.nxv1i64(i64, <vscale x 1 x i64>, <vscale x 1 x i1>, i32)

	define signext i64 @vpreduce_smin_nxv1i64(i64 signext %s, <vscale x 1 x i64> %v, <vscale x 1 x i1> %m, i32 zeroext %evl) {			define signext i64 @vpreduce_smin_nxv1i64(i64 signext %s, <vscale x 1 x i64> %v, <vscale x 1 x i1> %m, i32 zeroext %evl) {
	; RV32-LABEL: vpreduce_smin_nxv1i64:			; RV32-LABEL: vpreduce_smin_nxv1i64:
	; RV32: # %bb.0:			; RV32: # %bb.0:
	; RV32-NEXT: addi sp, sp, -16			; RV32-NEXT: addi sp, sp, -16
	; RV32-NEXT: .cfi_def_cfa_offset 16			; RV32-NEXT: .cfi_def_cfa_offset 16
	; RV32-NEXT: sw a1, 12(sp)			; RV32-NEXT: sw a1, 12(sp)
	; RV32-NEXT: sw a0, 8(sp)			; RV32-NEXT: sw a0, 8(sp)
	; RV32-NEXT: addi a0, sp, 8			; RV32-NEXT: addi a0, sp, 8
	; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV32-NEXT: vsetvli zero, a2, e64, m1, ta, ma
	; RV32-NEXT: vlse64.v v9, (a0), zero			; RV32-NEXT: vlse64.v v9, (a0), zero
	; RV32-NEXT: vsetvli zero, a2, e64, m1, tu, ma			; RV32-NEXT: vsetvli zero, zero, e64, m1, tu, ma
	; RV32-NEXT: vredmin.vs v9, v8, v9, v0.t			; RV32-NEXT: vredmin.vs v9, v8, v9, v0.t
	; RV32-NEXT: vmv.x.s a0, v9			; RV32-NEXT: vmv.x.s a0, v9
	; RV32-NEXT: li a1, 32			; RV32-NEXT: li a1, 32
	; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma
	; RV32-NEXT: vsrl.vx v8, v9, a1			; RV32-NEXT: vsrl.vx v8, v9, a1
	; RV32-NEXT: vmv.x.s a1, v8			; RV32-NEXT: vmv.x.s a1, v8
	; RV32-NEXT: addi sp, sp, 16			; RV32-NEXT: addi sp, sp, 16
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: vpreduce_smin_nxv1i64:			; RV64-LABEL: vpreduce_smin_nxv1i64:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV64-NEXT: vsetvli zero, a1, e64, m1, ta, ma
	; RV64-NEXT: vmv.s.x v9, a0			; RV64-NEXT: vmv.v.x v9, a0
	; RV64-NEXT: vsetvli zero, a1, e64, m1, tu, ma			; RV64-NEXT: vsetvli zero, zero, e64, m1, tu, ma
	; RV64-NEXT: vredmin.vs v9, v8, v9, v0.t			; RV64-NEXT: vredmin.vs v9, v8, v9, v0.t
	; RV64-NEXT: vmv.x.s a0, v9			; RV64-NEXT: vmv.x.s a0, v9
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%r = call i64 @llvm.vp.reduce.smin.nxv1i64(i64 %s, <vscale x 1 x i64> %v, <vscale x 1 x i1> %m, i32 %evl)			%r = call i64 @llvm.vp.reduce.smin.nxv1i64(i64 %s, <vscale x 1 x i64> %v, <vscale x 1 x i1> %m, i32 %evl)
	ret i64 %r			ret i64 %r
	}			}

	declare i64 @llvm.vp.reduce.and.nxv1i64(i64, <vscale x 1 x i64>, <vscale x 1 x i1>, i32)			declare i64 @llvm.vp.reduce.and.nxv1i64(i64, <vscale x 1 x i64>, <vscale x 1 x i1>, i32)

	define signext i64 @vpreduce_and_nxv1i64(i64 signext %s, <vscale x 1 x i64> %v, <vscale x 1 x i1> %m, i32 zeroext %evl) {			define signext i64 @vpreduce_and_nxv1i64(i64 signext %s, <vscale x 1 x i64> %v, <vscale x 1 x i1> %m, i32 zeroext %evl) {
	; RV32-LABEL: vpreduce_and_nxv1i64:			; RV32-LABEL: vpreduce_and_nxv1i64:
	; RV32: # %bb.0:			; RV32: # %bb.0:
	; RV32-NEXT: addi sp, sp, -16			; RV32-NEXT: addi sp, sp, -16
	; RV32-NEXT: .cfi_def_cfa_offset 16			; RV32-NEXT: .cfi_def_cfa_offset 16
	; RV32-NEXT: sw a1, 12(sp)			; RV32-NEXT: sw a1, 12(sp)
	; RV32-NEXT: sw a0, 8(sp)			; RV32-NEXT: sw a0, 8(sp)
	; RV32-NEXT: addi a0, sp, 8			; RV32-NEXT: addi a0, sp, 8
	; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV32-NEXT: vsetvli zero, a2, e64, m1, ta, ma
	; RV32-NEXT: vlse64.v v9, (a0), zero			; RV32-NEXT: vlse64.v v9, (a0), zero
	; RV32-NEXT: vsetvli zero, a2, e64, m1, tu, ma			; RV32-NEXT: vsetvli zero, zero, e64, m1, tu, ma
	; RV32-NEXT: vredand.vs v9, v8, v9, v0.t			; RV32-NEXT: vredand.vs v9, v8, v9, v0.t
	; RV32-NEXT: vmv.x.s a0, v9			; RV32-NEXT: vmv.x.s a0, v9
	; RV32-NEXT: li a1, 32			; RV32-NEXT: li a1, 32
	; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma
	; RV32-NEXT: vsrl.vx v8, v9, a1			; RV32-NEXT: vsrl.vx v8, v9, a1
	; RV32-NEXT: vmv.x.s a1, v8			; RV32-NEXT: vmv.x.s a1, v8
	; RV32-NEXT: addi sp, sp, 16			; RV32-NEXT: addi sp, sp, 16
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: vpreduce_and_nxv1i64:			; RV64-LABEL: vpreduce_and_nxv1i64:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV64-NEXT: vsetvli zero, a1, e64, m1, ta, ma
	; RV64-NEXT: vmv.s.x v9, a0			; RV64-NEXT: vmv.v.x v9, a0
	; RV64-NEXT: vsetvli zero, a1, e64, m1, tu, ma			; RV64-NEXT: vsetvli zero, zero, e64, m1, tu, ma
	; RV64-NEXT: vredand.vs v9, v8, v9, v0.t			; RV64-NEXT: vredand.vs v9, v8, v9, v0.t
	; RV64-NEXT: vmv.x.s a0, v9			; RV64-NEXT: vmv.x.s a0, v9
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%r = call i64 @llvm.vp.reduce.and.nxv1i64(i64 %s, <vscale x 1 x i64> %v, <vscale x 1 x i1> %m, i32 %evl)			%r = call i64 @llvm.vp.reduce.and.nxv1i64(i64 %s, <vscale x 1 x i64> %v, <vscale x 1 x i1> %m, i32 %evl)
	ret i64 %r			ret i64 %r
	}			}

	declare i64 @llvm.vp.reduce.or.nxv1i64(i64, <vscale x 1 x i64>, <vscale x 1 x i1>, i32)			declare i64 @llvm.vp.reduce.or.nxv1i64(i64, <vscale x 1 x i64>, <vscale x 1 x i1>, i32)

	define signext i64 @vpreduce_or_nxv1i64(i64 signext %s, <vscale x 1 x i64> %v, <vscale x 1 x i1> %m, i32 zeroext %evl) {			define signext i64 @vpreduce_or_nxv1i64(i64 signext %s, <vscale x 1 x i64> %v, <vscale x 1 x i1> %m, i32 zeroext %evl) {
	; RV32-LABEL: vpreduce_or_nxv1i64:			; RV32-LABEL: vpreduce_or_nxv1i64:
	; RV32: # %bb.0:			; RV32: # %bb.0:
	; RV32-NEXT: addi sp, sp, -16			; RV32-NEXT: addi sp, sp, -16
	; RV32-NEXT: .cfi_def_cfa_offset 16			; RV32-NEXT: .cfi_def_cfa_offset 16
	; RV32-NEXT: sw a1, 12(sp)			; RV32-NEXT: sw a1, 12(sp)
	; RV32-NEXT: sw a0, 8(sp)			; RV32-NEXT: sw a0, 8(sp)
	; RV32-NEXT: addi a0, sp, 8			; RV32-NEXT: addi a0, sp, 8
	; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV32-NEXT: vsetvli zero, a2, e64, m1, ta, ma
	; RV32-NEXT: vlse64.v v9, (a0), zero			; RV32-NEXT: vlse64.v v9, (a0), zero
	; RV32-NEXT: vsetvli zero, a2, e64, m1, tu, ma			; RV32-NEXT: vsetvli zero, zero, e64, m1, tu, ma
	; RV32-NEXT: vredor.vs v9, v8, v9, v0.t			; RV32-NEXT: vredor.vs v9, v8, v9, v0.t
	; RV32-NEXT: vmv.x.s a0, v9			; RV32-NEXT: vmv.x.s a0, v9
	; RV32-NEXT: li a1, 32			; RV32-NEXT: li a1, 32
	; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma
	; RV32-NEXT: vsrl.vx v8, v9, a1			; RV32-NEXT: vsrl.vx v8, v9, a1
	; RV32-NEXT: vmv.x.s a1, v8			; RV32-NEXT: vmv.x.s a1, v8
	; RV32-NEXT: addi sp, sp, 16			; RV32-NEXT: addi sp, sp, 16
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: vpreduce_or_nxv1i64:			; RV64-LABEL: vpreduce_or_nxv1i64:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV64-NEXT: vsetvli zero, a1, e64, m1, ta, ma
	; RV64-NEXT: vmv.s.x v9, a0			; RV64-NEXT: vmv.v.x v9, a0
	; RV64-NEXT: vsetvli zero, a1, e64, m1, tu, ma			; RV64-NEXT: vsetvli zero, zero, e64, m1, tu, ma
	; RV64-NEXT: vredor.vs v9, v8, v9, v0.t			; RV64-NEXT: vredor.vs v9, v8, v9, v0.t
	; RV64-NEXT: vmv.x.s a0, v9			; RV64-NEXT: vmv.x.s a0, v9
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%r = call i64 @llvm.vp.reduce.or.nxv1i64(i64 %s, <vscale x 1 x i64> %v, <vscale x 1 x i1> %m, i32 %evl)			%r = call i64 @llvm.vp.reduce.or.nxv1i64(i64 %s, <vscale x 1 x i64> %v, <vscale x 1 x i1> %m, i32 %evl)
	ret i64 %r			ret i64 %r
	}			}

	declare i64 @llvm.vp.reduce.xor.nxv1i64(i64, <vscale x 1 x i64>, <vscale x 1 x i1>, i32)			declare i64 @llvm.vp.reduce.xor.nxv1i64(i64, <vscale x 1 x i64>, <vscale x 1 x i1>, i32)

	define signext i64 @vpreduce_xor_nxv1i64(i64 signext %s, <vscale x 1 x i64> %v, <vscale x 1 x i1> %m, i32 zeroext %evl) {			define signext i64 @vpreduce_xor_nxv1i64(i64 signext %s, <vscale x 1 x i64> %v, <vscale x 1 x i1> %m, i32 zeroext %evl) {
	; RV32-LABEL: vpreduce_xor_nxv1i64:			; RV32-LABEL: vpreduce_xor_nxv1i64:
	; RV32: # %bb.0:			; RV32: # %bb.0:
	; RV32-NEXT: addi sp, sp, -16			; RV32-NEXT: addi sp, sp, -16
	; RV32-NEXT: .cfi_def_cfa_offset 16			; RV32-NEXT: .cfi_def_cfa_offset 16
	; RV32-NEXT: sw a1, 12(sp)			; RV32-NEXT: sw a1, 12(sp)
	; RV32-NEXT: sw a0, 8(sp)			; RV32-NEXT: sw a0, 8(sp)
	; RV32-NEXT: addi a0, sp, 8			; RV32-NEXT: addi a0, sp, 8
	; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV32-NEXT: vsetvli zero, a2, e64, m1, ta, ma
	; RV32-NEXT: vlse64.v v9, (a0), zero			; RV32-NEXT: vlse64.v v9, (a0), zero
	; RV32-NEXT: vsetvli zero, a2, e64, m1, tu, ma			; RV32-NEXT: vsetvli zero, zero, e64, m1, tu, ma
	; RV32-NEXT: vredxor.vs v9, v8, v9, v0.t			; RV32-NEXT: vredxor.vs v9, v8, v9, v0.t
	; RV32-NEXT: vmv.x.s a0, v9			; RV32-NEXT: vmv.x.s a0, v9
	; RV32-NEXT: li a1, 32			; RV32-NEXT: li a1, 32
	; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma
	; RV32-NEXT: vsrl.vx v8, v9, a1			; RV32-NEXT: vsrl.vx v8, v9, a1
	; RV32-NEXT: vmv.x.s a1, v8			; RV32-NEXT: vmv.x.s a1, v8
	; RV32-NEXT: addi sp, sp, 16			; RV32-NEXT: addi sp, sp, 16
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: vpreduce_xor_nxv1i64:			; RV64-LABEL: vpreduce_xor_nxv1i64:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV64-NEXT: vsetvli zero, a1, e64, m1, ta, ma
	; RV64-NEXT: vmv.s.x v9, a0			; RV64-NEXT: vmv.v.x v9, a0
	; RV64-NEXT: vsetvli zero, a1, e64, m1, tu, ma			; RV64-NEXT: vsetvli zero, zero, e64, m1, tu, ma
	; RV64-NEXT: vredxor.vs v9, v8, v9, v0.t			; RV64-NEXT: vredxor.vs v9, v8, v9, v0.t
	; RV64-NEXT: vmv.x.s a0, v9			; RV64-NEXT: vmv.x.s a0, v9
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%r = call i64 @llvm.vp.reduce.xor.nxv1i64(i64 %s, <vscale x 1 x i64> %v, <vscale x 1 x i1> %m, i32 %evl)			%r = call i64 @llvm.vp.reduce.xor.nxv1i64(i64 %s, <vscale x 1 x i64> %v, <vscale x 1 x i1> %m, i32 %evl)
	ret i64 %r			ret i64 %r
	}			}

	declare i64 @llvm.vp.reduce.add.nxv2i64(i64, <vscale x 2 x i64>, <vscale x 2 x i1>, i32)			declare i64 @llvm.vp.reduce.add.nxv2i64(i64, <vscale x 2 x i64>, <vscale x 2 x i1>, i32)
	▲ Show 20 Lines • Show All 682 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/rvv/vreductions-int.ll

; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py		; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
; RUN: sed 's/iXLen/i32/g' %s \| llc -mtriple=riscv32 -mattr=+v \		; RUN: sed 's/iXLen/i32/g' %s \| llc -mtriple=riscv32 -mattr=+v \
; RUN: -verify-machineinstrs \| FileCheck %s --check-prefixes=CHECK,RV32		; RUN: -verify-machineinstrs \| FileCheck %s --check-prefixes=CHECK,RV32
; RUN: sed 's/iXLen/i64/g' %s \| llc -mtriple=riscv64 -mattr=+v \		; RUN: sed 's/iXLen/i64/g' %s \| llc -mtriple=riscv64 -mattr=+v \
; RUN: -verify-machineinstrs \| FileCheck %s --check-prefixes=CHECK,RV64		; RUN: -verify-machineinstrs \| FileCheck %s --check-prefixes=CHECK,RV64

declare i8 @llvm.vector.reduce.add.nxv1i8(<vscale x 1 x i8>)		declare i8 @llvm.vector.reduce.add.nxv1i8(<vscale x 1 x i8>)

define signext i8 @vreduce_add_nxv1i8(<vscale x 1 x i8> %v) {		define signext i8 @vreduce_add_nxv1i8(<vscale x 1 x i8> %v) {
; CHECK-LABEL: vreduce_add_nxv1i8:		; CHECK-LABEL: vreduce_add_nxv1i8:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 1, e8, m1, ta, ma
; CHECK-NEXT: vmv.s.x v9, zero
; CHECK-NEXT: vsetvli a0, zero, e8, mf8, ta, ma		; CHECK-NEXT: vsetvli a0, zero, e8, mf8, ta, ma
		; CHECK-NEXT: vmv.v.i v9, 0
; CHECK-NEXT: vredsum.vs v8, v8, v9		; CHECK-NEXT: vredsum.vs v8, v8, v9
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%red = call i8 @llvm.vector.reduce.add.nxv1i8(<vscale x 1 x i8> %v)		%red = call i8 @llvm.vector.reduce.add.nxv1i8(<vscale x 1 x i8> %v)
ret i8 %red		ret i8 %red
}		}

declare i8 @llvm.vector.reduce.umax.nxv1i8(<vscale x 1 x i8>)		declare i8 @llvm.vector.reduce.umax.nxv1i8(<vscale x 1 x i8>)

define signext i8 @vreduce_umax_nxv1i8(<vscale x 1 x i8> %v) {		define signext i8 @vreduce_umax_nxv1i8(<vscale x 1 x i8> %v) {
; CHECK-LABEL: vreduce_umax_nxv1i8:		; CHECK-LABEL: vreduce_umax_nxv1i8:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 1, e8, m1, ta, ma
; CHECK-NEXT: vmv.s.x v9, zero
; CHECK-NEXT: vsetvli a0, zero, e8, mf8, ta, ma		; CHECK-NEXT: vsetvli a0, zero, e8, mf8, ta, ma
		; CHECK-NEXT: vmv.v.i v9, 0
; CHECK-NEXT: vredmaxu.vs v8, v8, v9		; CHECK-NEXT: vredmaxu.vs v8, v8, v9
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%red = call i8 @llvm.vector.reduce.umax.nxv1i8(<vscale x 1 x i8> %v)		%red = call i8 @llvm.vector.reduce.umax.nxv1i8(<vscale x 1 x i8> %v)
ret i8 %red		ret i8 %red
}		}

declare i8 @llvm.vector.reduce.smax.nxv1i8(<vscale x 1 x i8>)		declare i8 @llvm.vector.reduce.smax.nxv1i8(<vscale x 1 x i8>)

define signext i8 @vreduce_smax_nxv1i8(<vscale x 1 x i8> %v) {		define signext i8 @vreduce_smax_nxv1i8(<vscale x 1 x i8> %v) {
; CHECK-LABEL: vreduce_smax_nxv1i8:		; CHECK-LABEL: vreduce_smax_nxv1i8:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: li a0, -128		; CHECK-NEXT: li a0, -128
; CHECK-NEXT: vsetivli zero, 1, e8, m1, ta, ma		; CHECK-NEXT: vsetvli a1, zero, e8, mf8, ta, ma
; CHECK-NEXT: vmv.s.x v9, a0		; CHECK-NEXT: vmv.v.x v9, a0
; CHECK-NEXT: vsetvli a0, zero, e8, mf8, ta, ma
; CHECK-NEXT: vredmax.vs v8, v8, v9		; CHECK-NEXT: vredmax.vs v8, v8, v9
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%red = call i8 @llvm.vector.reduce.smax.nxv1i8(<vscale x 1 x i8> %v)		%red = call i8 @llvm.vector.reduce.smax.nxv1i8(<vscale x 1 x i8> %v)
ret i8 %red		ret i8 %red
}		}

declare i8 @llvm.vector.reduce.umin.nxv1i8(<vscale x 1 x i8>)		declare i8 @llvm.vector.reduce.umin.nxv1i8(<vscale x 1 x i8>)

define signext i8 @vreduce_umin_nxv1i8(<vscale x 1 x i8> %v) {		define signext i8 @vreduce_umin_nxv1i8(<vscale x 1 x i8> %v) {
; CHECK-LABEL: vreduce_umin_nxv1i8:		; CHECK-LABEL: vreduce_umin_nxv1i8:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 1, e8, m1, ta, ma
; CHECK-NEXT: vmv.v.i v9, -1
; CHECK-NEXT: vsetvli a0, zero, e8, mf8, ta, ma		; CHECK-NEXT: vsetvli a0, zero, e8, mf8, ta, ma
		; CHECK-NEXT: vmv.v.i v9, -1
; CHECK-NEXT: vredminu.vs v8, v8, v9		; CHECK-NEXT: vredminu.vs v8, v8, v9
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%red = call i8 @llvm.vector.reduce.umin.nxv1i8(<vscale x 1 x i8> %v)		%red = call i8 @llvm.vector.reduce.umin.nxv1i8(<vscale x 1 x i8> %v)
ret i8 %red		ret i8 %red
}		}

declare i8 @llvm.vector.reduce.smin.nxv1i8(<vscale x 1 x i8>)		declare i8 @llvm.vector.reduce.smin.nxv1i8(<vscale x 1 x i8>)

define signext i8 @vreduce_smin_nxv1i8(<vscale x 1 x i8> %v) {		define signext i8 @vreduce_smin_nxv1i8(<vscale x 1 x i8> %v) {
; CHECK-LABEL: vreduce_smin_nxv1i8:		; CHECK-LABEL: vreduce_smin_nxv1i8:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: li a0, 127		; CHECK-NEXT: li a0, 127
; CHECK-NEXT: vsetivli zero, 1, e8, m1, ta, ma		; CHECK-NEXT: vsetvli a1, zero, e8, mf8, ta, ma
; CHECK-NEXT: vmv.s.x v9, a0		; CHECK-NEXT: vmv.v.x v9, a0
; CHECK-NEXT: vsetvli a0, zero, e8, mf8, ta, ma
; CHECK-NEXT: vredmin.vs v8, v8, v9		; CHECK-NEXT: vredmin.vs v8, v8, v9
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%red = call i8 @llvm.vector.reduce.smin.nxv1i8(<vscale x 1 x i8> %v)		%red = call i8 @llvm.vector.reduce.smin.nxv1i8(<vscale x 1 x i8> %v)
ret i8 %red		ret i8 %red
}		}

declare i8 @llvm.vector.reduce.and.nxv1i8(<vscale x 1 x i8>)		declare i8 @llvm.vector.reduce.and.nxv1i8(<vscale x 1 x i8>)

define signext i8 @vreduce_and_nxv1i8(<vscale x 1 x i8> %v) {		define signext i8 @vreduce_and_nxv1i8(<vscale x 1 x i8> %v) {
; CHECK-LABEL: vreduce_and_nxv1i8:		; CHECK-LABEL: vreduce_and_nxv1i8:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 1, e8, m1, ta, ma
; CHECK-NEXT: vmv.v.i v9, -1
; CHECK-NEXT: vsetvli a0, zero, e8, mf8, ta, ma		; CHECK-NEXT: vsetvli a0, zero, e8, mf8, ta, ma
		; CHECK-NEXT: vmv.v.i v9, -1
; CHECK-NEXT: vredand.vs v8, v8, v9		; CHECK-NEXT: vredand.vs v8, v8, v9
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%red = call i8 @llvm.vector.reduce.and.nxv1i8(<vscale x 1 x i8> %v)		%red = call i8 @llvm.vector.reduce.and.nxv1i8(<vscale x 1 x i8> %v)
ret i8 %red		ret i8 %red
}		}

declare i8 @llvm.vector.reduce.or.nxv1i8(<vscale x 1 x i8>)		declare i8 @llvm.vector.reduce.or.nxv1i8(<vscale x 1 x i8>)

define signext i8 @vreduce_or_nxv1i8(<vscale x 1 x i8> %v) {		define signext i8 @vreduce_or_nxv1i8(<vscale x 1 x i8> %v) {
; CHECK-LABEL: vreduce_or_nxv1i8:		; CHECK-LABEL: vreduce_or_nxv1i8:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 1, e8, m1, ta, ma
; CHECK-NEXT: vmv.s.x v9, zero
; CHECK-NEXT: vsetvli a0, zero, e8, mf8, ta, ma		; CHECK-NEXT: vsetvli a0, zero, e8, mf8, ta, ma
		; CHECK-NEXT: vmv.v.i v9, 0
; CHECK-NEXT: vredor.vs v8, v8, v9		; CHECK-NEXT: vredor.vs v8, v8, v9
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%red = call i8 @llvm.vector.reduce.or.nxv1i8(<vscale x 1 x i8> %v)		%red = call i8 @llvm.vector.reduce.or.nxv1i8(<vscale x 1 x i8> %v)
ret i8 %red		ret i8 %red
}		}

declare i8 @llvm.vector.reduce.xor.nxv1i8(<vscale x 1 x i8>)		declare i8 @llvm.vector.reduce.xor.nxv1i8(<vscale x 1 x i8>)

define signext i8 @vreduce_xor_nxv1i8(<vscale x 1 x i8> %v) {		define signext i8 @vreduce_xor_nxv1i8(<vscale x 1 x i8> %v) {
; CHECK-LABEL: vreduce_xor_nxv1i8:		; CHECK-LABEL: vreduce_xor_nxv1i8:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 1, e8, m1, ta, ma
; CHECK-NEXT: vmv.s.x v9, zero
; CHECK-NEXT: vsetvli a0, zero, e8, mf8, ta, ma		; CHECK-NEXT: vsetvli a0, zero, e8, mf8, ta, ma
		; CHECK-NEXT: vmv.v.i v9, 0
; CHECK-NEXT: vredxor.vs v8, v8, v9		; CHECK-NEXT: vredxor.vs v8, v8, v9
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%red = call i8 @llvm.vector.reduce.xor.nxv1i8(<vscale x 1 x i8> %v)		%red = call i8 @llvm.vector.reduce.xor.nxv1i8(<vscale x 1 x i8> %v)
ret i8 %red		ret i8 %red
}		}

declare i8 @llvm.vector.reduce.add.nxv2i8(<vscale x 2 x i8>)		declare i8 @llvm.vector.reduce.add.nxv2i8(<vscale x 2 x i8>)

define signext i8 @vreduce_add_nxv2i8(<vscale x 2 x i8> %v) {		define signext i8 @vreduce_add_nxv2i8(<vscale x 2 x i8> %v) {
; CHECK-LABEL: vreduce_add_nxv2i8:		; CHECK-LABEL: vreduce_add_nxv2i8:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 1, e8, m1, ta, ma
; CHECK-NEXT: vmv.s.x v9, zero
; CHECK-NEXT: vsetvli a0, zero, e8, mf4, ta, ma		; CHECK-NEXT: vsetvli a0, zero, e8, mf4, ta, ma
		; CHECK-NEXT: vmv.v.i v9, 0
; CHECK-NEXT: vredsum.vs v8, v8, v9		; CHECK-NEXT: vredsum.vs v8, v8, v9
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%red = call i8 @llvm.vector.reduce.add.nxv2i8(<vscale x 2 x i8> %v)		%red = call i8 @llvm.vector.reduce.add.nxv2i8(<vscale x 2 x i8> %v)
ret i8 %red		ret i8 %red
}		}

declare i8 @llvm.vector.reduce.umax.nxv2i8(<vscale x 2 x i8>)		declare i8 @llvm.vector.reduce.umax.nxv2i8(<vscale x 2 x i8>)

define signext i8 @vreduce_umax_nxv2i8(<vscale x 2 x i8> %v) {		define signext i8 @vreduce_umax_nxv2i8(<vscale x 2 x i8> %v) {
; CHECK-LABEL: vreduce_umax_nxv2i8:		; CHECK-LABEL: vreduce_umax_nxv2i8:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 1, e8, m1, ta, ma
; CHECK-NEXT: vmv.s.x v9, zero
; CHECK-NEXT: vsetvli a0, zero, e8, mf4, ta, ma		; CHECK-NEXT: vsetvli a0, zero, e8, mf4, ta, ma
		; CHECK-NEXT: vmv.v.i v9, 0
; CHECK-NEXT: vredmaxu.vs v8, v8, v9		; CHECK-NEXT: vredmaxu.vs v8, v8, v9
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%red = call i8 @llvm.vector.reduce.umax.nxv2i8(<vscale x 2 x i8> %v)		%red = call i8 @llvm.vector.reduce.umax.nxv2i8(<vscale x 2 x i8> %v)
ret i8 %red		ret i8 %red
}		}

declare i8 @llvm.vector.reduce.smax.nxv2i8(<vscale x 2 x i8>)		declare i8 @llvm.vector.reduce.smax.nxv2i8(<vscale x 2 x i8>)

define signext i8 @vreduce_smax_nxv2i8(<vscale x 2 x i8> %v) {		define signext i8 @vreduce_smax_nxv2i8(<vscale x 2 x i8> %v) {
; CHECK-LABEL: vreduce_smax_nxv2i8:		; CHECK-LABEL: vreduce_smax_nxv2i8:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: li a0, -128		; CHECK-NEXT: li a0, -128
; CHECK-NEXT: vsetivli zero, 1, e8, m1, ta, ma		; CHECK-NEXT: vsetvli a1, zero, e8, mf4, ta, ma
; CHECK-NEXT: vmv.s.x v9, a0		; CHECK-NEXT: vmv.v.x v9, a0
; CHECK-NEXT: vsetvli a0, zero, e8, mf4, ta, ma
; CHECK-NEXT: vredmax.vs v8, v8, v9		; CHECK-NEXT: vredmax.vs v8, v8, v9
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%red = call i8 @llvm.vector.reduce.smax.nxv2i8(<vscale x 2 x i8> %v)		%red = call i8 @llvm.vector.reduce.smax.nxv2i8(<vscale x 2 x i8> %v)
ret i8 %red		ret i8 %red
}		}

declare i8 @llvm.vector.reduce.umin.nxv2i8(<vscale x 2 x i8>)		declare i8 @llvm.vector.reduce.umin.nxv2i8(<vscale x 2 x i8>)

define signext i8 @vreduce_umin_nxv2i8(<vscale x 2 x i8> %v) {		define signext i8 @vreduce_umin_nxv2i8(<vscale x 2 x i8> %v) {
; CHECK-LABEL: vreduce_umin_nxv2i8:		; CHECK-LABEL: vreduce_umin_nxv2i8:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 1, e8, m1, ta, ma
; CHECK-NEXT: vmv.v.i v9, -1
; CHECK-NEXT: vsetvli a0, zero, e8, mf4, ta, ma		; CHECK-NEXT: vsetvli a0, zero, e8, mf4, ta, ma
		; CHECK-NEXT: vmv.v.i v9, -1
; CHECK-NEXT: vredminu.vs v8, v8, v9		; CHECK-NEXT: vredminu.vs v8, v8, v9
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%red = call i8 @llvm.vector.reduce.umin.nxv2i8(<vscale x 2 x i8> %v)		%red = call i8 @llvm.vector.reduce.umin.nxv2i8(<vscale x 2 x i8> %v)
ret i8 %red		ret i8 %red
}		}

declare i8 @llvm.vector.reduce.smin.nxv2i8(<vscale x 2 x i8>)		declare i8 @llvm.vector.reduce.smin.nxv2i8(<vscale x 2 x i8>)

define signext i8 @vreduce_smin_nxv2i8(<vscale x 2 x i8> %v) {		define signext i8 @vreduce_smin_nxv2i8(<vscale x 2 x i8> %v) {
; CHECK-LABEL: vreduce_smin_nxv2i8:		; CHECK-LABEL: vreduce_smin_nxv2i8:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: li a0, 127		; CHECK-NEXT: li a0, 127
; CHECK-NEXT: vsetivli zero, 1, e8, m1, ta, ma		; CHECK-NEXT: vsetvli a1, zero, e8, mf4, ta, ma
; CHECK-NEXT: vmv.s.x v9, a0		; CHECK-NEXT: vmv.v.x v9, a0
; CHECK-NEXT: vsetvli a0, zero, e8, mf4, ta, ma
; CHECK-NEXT: vredmin.vs v8, v8, v9		; CHECK-NEXT: vredmin.vs v8, v8, v9
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%red = call i8 @llvm.vector.reduce.smin.nxv2i8(<vscale x 2 x i8> %v)		%red = call i8 @llvm.vector.reduce.smin.nxv2i8(<vscale x 2 x i8> %v)
ret i8 %red		ret i8 %red
}		}

declare i8 @llvm.vector.reduce.and.nxv2i8(<vscale x 2 x i8>)		declare i8 @llvm.vector.reduce.and.nxv2i8(<vscale x 2 x i8>)

define signext i8 @vreduce_and_nxv2i8(<vscale x 2 x i8> %v) {		define signext i8 @vreduce_and_nxv2i8(<vscale x 2 x i8> %v) {
; CHECK-LABEL: vreduce_and_nxv2i8:		; CHECK-LABEL: vreduce_and_nxv2i8:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 1, e8, m1, ta, ma
; CHECK-NEXT: vmv.v.i v9, -1
; CHECK-NEXT: vsetvli a0, zero, e8, mf4, ta, ma		; CHECK-NEXT: vsetvli a0, zero, e8, mf4, ta, ma
		; CHECK-NEXT: vmv.v.i v9, -1
; CHECK-NEXT: vredand.vs v8, v8, v9		; CHECK-NEXT: vredand.vs v8, v8, v9
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%red = call i8 @llvm.vector.reduce.and.nxv2i8(<vscale x 2 x i8> %v)		%red = call i8 @llvm.vector.reduce.and.nxv2i8(<vscale x 2 x i8> %v)
ret i8 %red		ret i8 %red
}		}

declare i8 @llvm.vector.reduce.or.nxv2i8(<vscale x 2 x i8>)		declare i8 @llvm.vector.reduce.or.nxv2i8(<vscale x 2 x i8>)

define signext i8 @vreduce_or_nxv2i8(<vscale x 2 x i8> %v) {		define signext i8 @vreduce_or_nxv2i8(<vscale x 2 x i8> %v) {
; CHECK-LABEL: vreduce_or_nxv2i8:		; CHECK-LABEL: vreduce_or_nxv2i8:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 1, e8, m1, ta, ma
; CHECK-NEXT: vmv.s.x v9, zero
; CHECK-NEXT: vsetvli a0, zero, e8, mf4, ta, ma		; CHECK-NEXT: vsetvli a0, zero, e8, mf4, ta, ma
		; CHECK-NEXT: vmv.v.i v9, 0
; CHECK-NEXT: vredor.vs v8, v8, v9		; CHECK-NEXT: vredor.vs v8, v8, v9
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%red = call i8 @llvm.vector.reduce.or.nxv2i8(<vscale x 2 x i8> %v)		%red = call i8 @llvm.vector.reduce.or.nxv2i8(<vscale x 2 x i8> %v)
ret i8 %red		ret i8 %red
}		}

declare i8 @llvm.vector.reduce.xor.nxv2i8(<vscale x 2 x i8>)		declare i8 @llvm.vector.reduce.xor.nxv2i8(<vscale x 2 x i8>)

define signext i8 @vreduce_xor_nxv2i8(<vscale x 2 x i8> %v) {		define signext i8 @vreduce_xor_nxv2i8(<vscale x 2 x i8> %v) {
; CHECK-LABEL: vreduce_xor_nxv2i8:		; CHECK-LABEL: vreduce_xor_nxv2i8:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 1, e8, m1, ta, ma
; CHECK-NEXT: vmv.s.x v9, zero
; CHECK-NEXT: vsetvli a0, zero, e8, mf4, ta, ma		; CHECK-NEXT: vsetvli a0, zero, e8, mf4, ta, ma
		; CHECK-NEXT: vmv.v.i v9, 0
; CHECK-NEXT: vredxor.vs v8, v8, v9		; CHECK-NEXT: vredxor.vs v8, v8, v9
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%red = call i8 @llvm.vector.reduce.xor.nxv2i8(<vscale x 2 x i8> %v)		%red = call i8 @llvm.vector.reduce.xor.nxv2i8(<vscale x 2 x i8> %v)
ret i8 %red		ret i8 %red
}		}

declare i8 @llvm.vector.reduce.add.nxv4i8(<vscale x 4 x i8>)		declare i8 @llvm.vector.reduce.add.nxv4i8(<vscale x 4 x i8>)

define signext i8 @vreduce_add_nxv4i8(<vscale x 4 x i8> %v) {		define signext i8 @vreduce_add_nxv4i8(<vscale x 4 x i8> %v) {
; CHECK-LABEL: vreduce_add_nxv4i8:		; CHECK-LABEL: vreduce_add_nxv4i8:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 1, e8, m1, ta, ma
; CHECK-NEXT: vmv.s.x v9, zero
; CHECK-NEXT: vsetvli a0, zero, e8, mf2, ta, ma		; CHECK-NEXT: vsetvli a0, zero, e8, mf2, ta, ma
		; CHECK-NEXT: vmv.v.i v9, 0
; CHECK-NEXT: vredsum.vs v8, v8, v9		; CHECK-NEXT: vredsum.vs v8, v8, v9
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%red = call i8 @llvm.vector.reduce.add.nxv4i8(<vscale x 4 x i8> %v)		%red = call i8 @llvm.vector.reduce.add.nxv4i8(<vscale x 4 x i8> %v)
ret i8 %red		ret i8 %red
}		}

declare i8 @llvm.vector.reduce.umax.nxv4i8(<vscale x 4 x i8>)		declare i8 @llvm.vector.reduce.umax.nxv4i8(<vscale x 4 x i8>)

define signext i8 @vreduce_umax_nxv4i8(<vscale x 4 x i8> %v) {		define signext i8 @vreduce_umax_nxv4i8(<vscale x 4 x i8> %v) {
; CHECK-LABEL: vreduce_umax_nxv4i8:		; CHECK-LABEL: vreduce_umax_nxv4i8:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 1, e8, m1, ta, ma
; CHECK-NEXT: vmv.s.x v9, zero
; CHECK-NEXT: vsetvli a0, zero, e8, mf2, ta, ma		; CHECK-NEXT: vsetvli a0, zero, e8, mf2, ta, ma
		; CHECK-NEXT: vmv.v.i v9, 0
; CHECK-NEXT: vredmaxu.vs v8, v8, v9		; CHECK-NEXT: vredmaxu.vs v8, v8, v9
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%red = call i8 @llvm.vector.reduce.umax.nxv4i8(<vscale x 4 x i8> %v)		%red = call i8 @llvm.vector.reduce.umax.nxv4i8(<vscale x 4 x i8> %v)
ret i8 %red		ret i8 %red
}		}

declare i8 @llvm.vector.reduce.smax.nxv4i8(<vscale x 4 x i8>)		declare i8 @llvm.vector.reduce.smax.nxv4i8(<vscale x 4 x i8>)

define signext i8 @vreduce_smax_nxv4i8(<vscale x 4 x i8> %v) {		define signext i8 @vreduce_smax_nxv4i8(<vscale x 4 x i8> %v) {
; CHECK-LABEL: vreduce_smax_nxv4i8:		; CHECK-LABEL: vreduce_smax_nxv4i8:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: li a0, -128		; CHECK-NEXT: li a0, -128
; CHECK-NEXT: vsetivli zero, 1, e8, m1, ta, ma		; CHECK-NEXT: vsetvli a1, zero, e8, mf2, ta, ma
; CHECK-NEXT: vmv.s.x v9, a0		; CHECK-NEXT: vmv.v.x v9, a0
; CHECK-NEXT: vsetvli a0, zero, e8, mf2, ta, ma
; CHECK-NEXT: vredmax.vs v8, v8, v9		; CHECK-NEXT: vredmax.vs v8, v8, v9
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%red = call i8 @llvm.vector.reduce.smax.nxv4i8(<vscale x 4 x i8> %v)		%red = call i8 @llvm.vector.reduce.smax.nxv4i8(<vscale x 4 x i8> %v)
ret i8 %red		ret i8 %red
}		}

declare i8 @llvm.vector.reduce.umin.nxv4i8(<vscale x 4 x i8>)		declare i8 @llvm.vector.reduce.umin.nxv4i8(<vscale x 4 x i8>)

define signext i8 @vreduce_umin_nxv4i8(<vscale x 4 x i8> %v) {		define signext i8 @vreduce_umin_nxv4i8(<vscale x 4 x i8> %v) {
; CHECK-LABEL: vreduce_umin_nxv4i8:		; CHECK-LABEL: vreduce_umin_nxv4i8:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 1, e8, m1, ta, ma
; CHECK-NEXT: vmv.v.i v9, -1
; CHECK-NEXT: vsetvli a0, zero, e8, mf2, ta, ma		; CHECK-NEXT: vsetvli a0, zero, e8, mf2, ta, ma
		; CHECK-NEXT: vmv.v.i v9, -1
; CHECK-NEXT: vredminu.vs v8, v8, v9		; CHECK-NEXT: vredminu.vs v8, v8, v9
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%red = call i8 @llvm.vector.reduce.umin.nxv4i8(<vscale x 4 x i8> %v)		%red = call i8 @llvm.vector.reduce.umin.nxv4i8(<vscale x 4 x i8> %v)
ret i8 %red		ret i8 %red
}		}

declare i8 @llvm.vector.reduce.smin.nxv4i8(<vscale x 4 x i8>)		declare i8 @llvm.vector.reduce.smin.nxv4i8(<vscale x 4 x i8>)

define signext i8 @vreduce_smin_nxv4i8(<vscale x 4 x i8> %v) {		define signext i8 @vreduce_smin_nxv4i8(<vscale x 4 x i8> %v) {
; CHECK-LABEL: vreduce_smin_nxv4i8:		; CHECK-LABEL: vreduce_smin_nxv4i8:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: li a0, 127		; CHECK-NEXT: li a0, 127
; CHECK-NEXT: vsetivli zero, 1, e8, m1, ta, ma		; CHECK-NEXT: vsetvli a1, zero, e8, mf2, ta, ma
; CHECK-NEXT: vmv.s.x v9, a0		; CHECK-NEXT: vmv.v.x v9, a0
; CHECK-NEXT: vsetvli a0, zero, e8, mf2, ta, ma
; CHECK-NEXT: vredmin.vs v8, v8, v9		; CHECK-NEXT: vredmin.vs v8, v8, v9
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%red = call i8 @llvm.vector.reduce.smin.nxv4i8(<vscale x 4 x i8> %v)		%red = call i8 @llvm.vector.reduce.smin.nxv4i8(<vscale x 4 x i8> %v)
ret i8 %red		ret i8 %red
}		}

declare i8 @llvm.vector.reduce.and.nxv4i8(<vscale x 4 x i8>)		declare i8 @llvm.vector.reduce.and.nxv4i8(<vscale x 4 x i8>)

define signext i8 @vreduce_and_nxv4i8(<vscale x 4 x i8> %v) {		define signext i8 @vreduce_and_nxv4i8(<vscale x 4 x i8> %v) {
; CHECK-LABEL: vreduce_and_nxv4i8:		; CHECK-LABEL: vreduce_and_nxv4i8:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 1, e8, m1, ta, ma
; CHECK-NEXT: vmv.v.i v9, -1
; CHECK-NEXT: vsetvli a0, zero, e8, mf2, ta, ma		; CHECK-NEXT: vsetvli a0, zero, e8, mf2, ta, ma
		; CHECK-NEXT: vmv.v.i v9, -1
; CHECK-NEXT: vredand.vs v8, v8, v9		; CHECK-NEXT: vredand.vs v8, v8, v9
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%red = call i8 @llvm.vector.reduce.and.nxv4i8(<vscale x 4 x i8> %v)		%red = call i8 @llvm.vector.reduce.and.nxv4i8(<vscale x 4 x i8> %v)
ret i8 %red		ret i8 %red
}		}

declare i8 @llvm.vector.reduce.or.nxv4i8(<vscale x 4 x i8>)		declare i8 @llvm.vector.reduce.or.nxv4i8(<vscale x 4 x i8>)

define signext i8 @vreduce_or_nxv4i8(<vscale x 4 x i8> %v) {		define signext i8 @vreduce_or_nxv4i8(<vscale x 4 x i8> %v) {
; CHECK-LABEL: vreduce_or_nxv4i8:		; CHECK-LABEL: vreduce_or_nxv4i8:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 1, e8, m1, ta, ma
; CHECK-NEXT: vmv.s.x v9, zero
; CHECK-NEXT: vsetvli a0, zero, e8, mf2, ta, ma		; CHECK-NEXT: vsetvli a0, zero, e8, mf2, ta, ma
		; CHECK-NEXT: vmv.v.i v9, 0
; CHECK-NEXT: vredor.vs v8, v8, v9		; CHECK-NEXT: vredor.vs v8, v8, v9
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%red = call i8 @llvm.vector.reduce.or.nxv4i8(<vscale x 4 x i8> %v)		%red = call i8 @llvm.vector.reduce.or.nxv4i8(<vscale x 4 x i8> %v)
ret i8 %red		ret i8 %red
}		}

declare i8 @llvm.vector.reduce.xor.nxv4i8(<vscale x 4 x i8>)		declare i8 @llvm.vector.reduce.xor.nxv4i8(<vscale x 4 x i8>)

define signext i8 @vreduce_xor_nxv4i8(<vscale x 4 x i8> %v) {		define signext i8 @vreduce_xor_nxv4i8(<vscale x 4 x i8> %v) {
; CHECK-LABEL: vreduce_xor_nxv4i8:		; CHECK-LABEL: vreduce_xor_nxv4i8:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 1, e8, m1, ta, ma
; CHECK-NEXT: vmv.s.x v9, zero
; CHECK-NEXT: vsetvli a0, zero, e8, mf2, ta, ma		; CHECK-NEXT: vsetvli a0, zero, e8, mf2, ta, ma
		; CHECK-NEXT: vmv.v.i v9, 0
; CHECK-NEXT: vredxor.vs v8, v8, v9		; CHECK-NEXT: vredxor.vs v8, v8, v9
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%red = call i8 @llvm.vector.reduce.xor.nxv4i8(<vscale x 4 x i8> %v)		%red = call i8 @llvm.vector.reduce.xor.nxv4i8(<vscale x 4 x i8> %v)
ret i8 %red		ret i8 %red
}		}

declare i16 @llvm.vector.reduce.add.nxv1i16(<vscale x 1 x i16>)		declare i16 @llvm.vector.reduce.add.nxv1i16(<vscale x 1 x i16>)

define signext i16 @vreduce_add_nxv1i16(<vscale x 1 x i16> %v) {		define signext i16 @vreduce_add_nxv1i16(<vscale x 1 x i16> %v) {
; CHECK-LABEL: vreduce_add_nxv1i16:		; CHECK-LABEL: vreduce_add_nxv1i16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma
; CHECK-NEXT: vmv.s.x v9, zero
; CHECK-NEXT: vsetvli a0, zero, e16, mf4, ta, ma		; CHECK-NEXT: vsetvli a0, zero, e16, mf4, ta, ma
		; CHECK-NEXT: vmv.v.i v9, 0
; CHECK-NEXT: vredsum.vs v8, v8, v9		; CHECK-NEXT: vredsum.vs v8, v8, v9
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%red = call i16 @llvm.vector.reduce.add.nxv1i16(<vscale x 1 x i16> %v)		%red = call i16 @llvm.vector.reduce.add.nxv1i16(<vscale x 1 x i16> %v)
ret i16 %red		ret i16 %red
}		}

define signext i16 @vwreduce_add_nxv1i8(<vscale x 1 x i8> %v) {		define signext i16 @vwreduce_add_nxv1i8(<vscale x 1 x i8> %v) {
; CHECK-LABEL: vwreduce_add_nxv1i8:		; CHECK-LABEL: vwreduce_add_nxv1i8:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma		; CHECK-NEXT: vsetvli a0, zero, e16, mf4, ta, ma
; CHECK-NEXT: vmv.s.x v9, zero		; CHECK-NEXT: vmv.v.i v9, 0
; CHECK-NEXT: vsetvli a0, zero, e8, mf8, ta, ma		; CHECK-NEXT: vsetvli zero, zero, e8, mf8, ta, ma
; CHECK-NEXT: vwredsum.vs v8, v8, v9		; CHECK-NEXT: vwredsum.vs v8, v8, v9
; CHECK-NEXT: vsetivli zero, 0, e16, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 0, e16, m1, ta, ma
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%e = sext <vscale x 1 x i8> %v to <vscale x 1 x i16>		%e = sext <vscale x 1 x i8> %v to <vscale x 1 x i16>
%red = call i16 @llvm.vector.reduce.add.nxv1i16(<vscale x 1 x i16> %e)		%red = call i16 @llvm.vector.reduce.add.nxv1i16(<vscale x 1 x i16> %e)
ret i16 %red		ret i16 %red
}		}

define signext i16 @vwreduce_uadd_nxv1i8(<vscale x 1 x i8> %v) {		define signext i16 @vwreduce_uadd_nxv1i8(<vscale x 1 x i8> %v) {
; CHECK-LABEL: vwreduce_uadd_nxv1i8:		; CHECK-LABEL: vwreduce_uadd_nxv1i8:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma		; CHECK-NEXT: vsetvli a0, zero, e16, mf4, ta, ma
; CHECK-NEXT: vmv.s.x v9, zero		; CHECK-NEXT: vmv.v.i v9, 0
; CHECK-NEXT: vsetvli a0, zero, e8, mf8, ta, ma		; CHECK-NEXT: vsetvli zero, zero, e8, mf8, ta, ma
; CHECK-NEXT: vwredsum.vs v8, v8, v9		; CHECK-NEXT: vwredsum.vs v8, v8, v9
; CHECK-NEXT: vsetivli zero, 0, e16, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 0, e16, m1, ta, ma
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%e = sext <vscale x 1 x i8> %v to <vscale x 1 x i16>		%e = sext <vscale x 1 x i8> %v to <vscale x 1 x i16>
%red = call i16 @llvm.vector.reduce.add.nxv1i16(<vscale x 1 x i16> %e)		%red = call i16 @llvm.vector.reduce.add.nxv1i16(<vscale x 1 x i16> %e)
ret i16 %red		ret i16 %red
}		}

declare i16 @llvm.vector.reduce.umax.nxv1i16(<vscale x 1 x i16>)		declare i16 @llvm.vector.reduce.umax.nxv1i16(<vscale x 1 x i16>)

define signext i16 @vreduce_umax_nxv1i16(<vscale x 1 x i16> %v) {		define signext i16 @vreduce_umax_nxv1i16(<vscale x 1 x i16> %v) {
; CHECK-LABEL: vreduce_umax_nxv1i16:		; CHECK-LABEL: vreduce_umax_nxv1i16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma
; CHECK-NEXT: vmv.s.x v9, zero
; CHECK-NEXT: vsetvli a0, zero, e16, mf4, ta, ma		; CHECK-NEXT: vsetvli a0, zero, e16, mf4, ta, ma
		; CHECK-NEXT: vmv.v.i v9, 0
; CHECK-NEXT: vredmaxu.vs v8, v8, v9		; CHECK-NEXT: vredmaxu.vs v8, v8, v9
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%red = call i16 @llvm.vector.reduce.umax.nxv1i16(<vscale x 1 x i16> %v)		%red = call i16 @llvm.vector.reduce.umax.nxv1i16(<vscale x 1 x i16> %v)
ret i16 %red		ret i16 %red
}		}

declare i16 @llvm.vector.reduce.smax.nxv1i16(<vscale x 1 x i16>)		declare i16 @llvm.vector.reduce.smax.nxv1i16(<vscale x 1 x i16>)

define signext i16 @vreduce_smax_nxv1i16(<vscale x 1 x i16> %v) {		define signext i16 @vreduce_smax_nxv1i16(<vscale x 1 x i16> %v) {
; CHECK-LABEL: vreduce_smax_nxv1i16:		; CHECK-LABEL: vreduce_smax_nxv1i16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: lui a0, 1048568		; CHECK-NEXT: lui a0, 1048568
; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma		; CHECK-NEXT: vsetvli a1, zero, e16, mf4, ta, ma
; CHECK-NEXT: vmv.s.x v9, a0		; CHECK-NEXT: vmv.v.x v9, a0
; CHECK-NEXT: vsetvli a0, zero, e16, mf4, ta, ma
; CHECK-NEXT: vredmax.vs v8, v8, v9		; CHECK-NEXT: vredmax.vs v8, v8, v9
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%red = call i16 @llvm.vector.reduce.smax.nxv1i16(<vscale x 1 x i16> %v)		%red = call i16 @llvm.vector.reduce.smax.nxv1i16(<vscale x 1 x i16> %v)
ret i16 %red		ret i16 %red
}		}

declare i16 @llvm.vector.reduce.umin.nxv1i16(<vscale x 1 x i16>)		declare i16 @llvm.vector.reduce.umin.nxv1i16(<vscale x 1 x i16>)

define signext i16 @vreduce_umin_nxv1i16(<vscale x 1 x i16> %v) {		define signext i16 @vreduce_umin_nxv1i16(<vscale x 1 x i16> %v) {
; CHECK-LABEL: vreduce_umin_nxv1i16:		; CHECK-LABEL: vreduce_umin_nxv1i16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma
; CHECK-NEXT: vmv.v.i v9, -1
; CHECK-NEXT: vsetvli a0, zero, e16, mf4, ta, ma		; CHECK-NEXT: vsetvli a0, zero, e16, mf4, ta, ma
		; CHECK-NEXT: vmv.v.i v9, -1
; CHECK-NEXT: vredminu.vs v8, v8, v9		; CHECK-NEXT: vredminu.vs v8, v8, v9
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%red = call i16 @llvm.vector.reduce.umin.nxv1i16(<vscale x 1 x i16> %v)		%red = call i16 @llvm.vector.reduce.umin.nxv1i16(<vscale x 1 x i16> %v)
ret i16 %red		ret i16 %red
}		}

declare i16 @llvm.vector.reduce.smin.nxv1i16(<vscale x 1 x i16>)		declare i16 @llvm.vector.reduce.smin.nxv1i16(<vscale x 1 x i16>)

define signext i16 @vreduce_smin_nxv1i16(<vscale x 1 x i16> %v) {		define signext i16 @vreduce_smin_nxv1i16(<vscale x 1 x i16> %v) {
; RV32-LABEL: vreduce_smin_nxv1i16:		; RV32-LABEL: vreduce_smin_nxv1i16:
; RV32: # %bb.0:		; RV32: # %bb.0:
; RV32-NEXT: lui a0, 8		; RV32-NEXT: lui a0, 8
; RV32-NEXT: addi a0, a0, -1		; RV32-NEXT: addi a0, a0, -1
; RV32-NEXT: vsetivli zero, 1, e16, m1, ta, ma		; RV32-NEXT: vsetvli a1, zero, e16, mf4, ta, ma
; RV32-NEXT: vmv.s.x v9, a0		; RV32-NEXT: vmv.v.x v9, a0
; RV32-NEXT: vsetvli a0, zero, e16, mf4, ta, ma
; RV32-NEXT: vredmin.vs v8, v8, v9		; RV32-NEXT: vredmin.vs v8, v8, v9
; RV32-NEXT: vmv.x.s a0, v8		; RV32-NEXT: vmv.x.s a0, v8
; RV32-NEXT: ret		; RV32-NEXT: ret
;		;
; RV64-LABEL: vreduce_smin_nxv1i16:		; RV64-LABEL: vreduce_smin_nxv1i16:
; RV64: # %bb.0:		; RV64: # %bb.0:
; RV64-NEXT: lui a0, 8		; RV64-NEXT: lui a0, 8
; RV64-NEXT: addiw a0, a0, -1		; RV64-NEXT: addiw a0, a0, -1
; RV64-NEXT: vsetivli zero, 1, e16, m1, ta, ma		; RV64-NEXT: vsetvli a1, zero, e16, mf4, ta, ma
; RV64-NEXT: vmv.s.x v9, a0		; RV64-NEXT: vmv.v.x v9, a0
; RV64-NEXT: vsetvli a0, zero, e16, mf4, ta, ma
; RV64-NEXT: vredmin.vs v8, v8, v9		; RV64-NEXT: vredmin.vs v8, v8, v9
; RV64-NEXT: vmv.x.s a0, v8		; RV64-NEXT: vmv.x.s a0, v8
; RV64-NEXT: ret		; RV64-NEXT: ret
%red = call i16 @llvm.vector.reduce.smin.nxv1i16(<vscale x 1 x i16> %v)		%red = call i16 @llvm.vector.reduce.smin.nxv1i16(<vscale x 1 x i16> %v)
ret i16 %red		ret i16 %red
}		}

declare i16 @llvm.vector.reduce.and.nxv1i16(<vscale x 1 x i16>)		declare i16 @llvm.vector.reduce.and.nxv1i16(<vscale x 1 x i16>)

define signext i16 @vreduce_and_nxv1i16(<vscale x 1 x i16> %v) {		define signext i16 @vreduce_and_nxv1i16(<vscale x 1 x i16> %v) {
; CHECK-LABEL: vreduce_and_nxv1i16:		; CHECK-LABEL: vreduce_and_nxv1i16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma
; CHECK-NEXT: vmv.v.i v9, -1
; CHECK-NEXT: vsetvli a0, zero, e16, mf4, ta, ma		; CHECK-NEXT: vsetvli a0, zero, e16, mf4, ta, ma
		; CHECK-NEXT: vmv.v.i v9, -1
; CHECK-NEXT: vredand.vs v8, v8, v9		; CHECK-NEXT: vredand.vs v8, v8, v9
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%red = call i16 @llvm.vector.reduce.and.nxv1i16(<vscale x 1 x i16> %v)		%red = call i16 @llvm.vector.reduce.and.nxv1i16(<vscale x 1 x i16> %v)
ret i16 %red		ret i16 %red
}		}

declare i16 @llvm.vector.reduce.or.nxv1i16(<vscale x 1 x i16>)		declare i16 @llvm.vector.reduce.or.nxv1i16(<vscale x 1 x i16>)

define signext i16 @vreduce_or_nxv1i16(<vscale x 1 x i16> %v) {		define signext i16 @vreduce_or_nxv1i16(<vscale x 1 x i16> %v) {
; CHECK-LABEL: vreduce_or_nxv1i16:		; CHECK-LABEL: vreduce_or_nxv1i16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma
; CHECK-NEXT: vmv.s.x v9, zero
; CHECK-NEXT: vsetvli a0, zero, e16, mf4, ta, ma		; CHECK-NEXT: vsetvli a0, zero, e16, mf4, ta, ma
		; CHECK-NEXT: vmv.v.i v9, 0
; CHECK-NEXT: vredor.vs v8, v8, v9		; CHECK-NEXT: vredor.vs v8, v8, v9
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%red = call i16 @llvm.vector.reduce.or.nxv1i16(<vscale x 1 x i16> %v)		%red = call i16 @llvm.vector.reduce.or.nxv1i16(<vscale x 1 x i16> %v)
ret i16 %red		ret i16 %red
}		}

declare i16 @llvm.vector.reduce.xor.nxv1i16(<vscale x 1 x i16>)		declare i16 @llvm.vector.reduce.xor.nxv1i16(<vscale x 1 x i16>)

define signext i16 @vreduce_xor_nxv1i16(<vscale x 1 x i16> %v) {		define signext i16 @vreduce_xor_nxv1i16(<vscale x 1 x i16> %v) {
; CHECK-LABEL: vreduce_xor_nxv1i16:		; CHECK-LABEL: vreduce_xor_nxv1i16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma
; CHECK-NEXT: vmv.s.x v9, zero
; CHECK-NEXT: vsetvli a0, zero, e16, mf4, ta, ma		; CHECK-NEXT: vsetvli a0, zero, e16, mf4, ta, ma
		; CHECK-NEXT: vmv.v.i v9, 0
; CHECK-NEXT: vredxor.vs v8, v8, v9		; CHECK-NEXT: vredxor.vs v8, v8, v9
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%red = call i16 @llvm.vector.reduce.xor.nxv1i16(<vscale x 1 x i16> %v)		%red = call i16 @llvm.vector.reduce.xor.nxv1i16(<vscale x 1 x i16> %v)
ret i16 %red		ret i16 %red
}		}

declare i16 @llvm.vector.reduce.add.nxv2i16(<vscale x 2 x i16>)		declare i16 @llvm.vector.reduce.add.nxv2i16(<vscale x 2 x i16>)

define signext i16 @vreduce_add_nxv2i16(<vscale x 2 x i16> %v) {		define signext i16 @vreduce_add_nxv2i16(<vscale x 2 x i16> %v) {
; CHECK-LABEL: vreduce_add_nxv2i16:		; CHECK-LABEL: vreduce_add_nxv2i16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma
; CHECK-NEXT: vmv.s.x v9, zero
; CHECK-NEXT: vsetvli a0, zero, e16, mf2, ta, ma		; CHECK-NEXT: vsetvli a0, zero, e16, mf2, ta, ma
		; CHECK-NEXT: vmv.v.i v9, 0
; CHECK-NEXT: vredsum.vs v8, v8, v9		; CHECK-NEXT: vredsum.vs v8, v8, v9
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%red = call i16 @llvm.vector.reduce.add.nxv2i16(<vscale x 2 x i16> %v)		%red = call i16 @llvm.vector.reduce.add.nxv2i16(<vscale x 2 x i16> %v)
ret i16 %red		ret i16 %red
}		}

define signext i16 @vwreduce_add_nxv2i8(<vscale x 2 x i8> %v) {		define signext i16 @vwreduce_add_nxv2i8(<vscale x 2 x i8> %v) {
; CHECK-LABEL: vwreduce_add_nxv2i8:		; CHECK-LABEL: vwreduce_add_nxv2i8:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma		; CHECK-NEXT: vsetvli a0, zero, e16, mf2, ta, ma
; CHECK-NEXT: vmv.s.x v9, zero		; CHECK-NEXT: vmv.v.i v9, 0
; CHECK-NEXT: vsetvli a0, zero, e8, mf4, ta, ma		; CHECK-NEXT: vsetvli zero, zero, e8, mf4, ta, ma
; CHECK-NEXT: vwredsum.vs v8, v8, v9		; CHECK-NEXT: vwredsum.vs v8, v8, v9
; CHECK-NEXT: vsetivli zero, 0, e16, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 0, e16, m1, ta, ma
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%e = sext <vscale x 2 x i8> %v to <vscale x 2 x i16>		%e = sext <vscale x 2 x i8> %v to <vscale x 2 x i16>
%red = call i16 @llvm.vector.reduce.add.nxv2i16(<vscale x 2 x i16> %e)		%red = call i16 @llvm.vector.reduce.add.nxv2i16(<vscale x 2 x i16> %e)
ret i16 %red		ret i16 %red
}		}

define signext i16 @vwreduce_uadd_nxv2i8(<vscale x 2 x i8> %v) {		define signext i16 @vwreduce_uadd_nxv2i8(<vscale x 2 x i8> %v) {
; CHECK-LABEL: vwreduce_uadd_nxv2i8:		; CHECK-LABEL: vwreduce_uadd_nxv2i8:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma		; CHECK-NEXT: vsetvli a0, zero, e16, mf2, ta, ma
; CHECK-NEXT: vmv.s.x v9, zero		; CHECK-NEXT: vmv.v.i v9, 0
; CHECK-NEXT: vsetvli a0, zero, e8, mf4, ta, ma		; CHECK-NEXT: vsetvli zero, zero, e8, mf4, ta, ma
; CHECK-NEXT: vwredsum.vs v8, v8, v9		; CHECK-NEXT: vwredsum.vs v8, v8, v9
; CHECK-NEXT: vsetivli zero, 0, e16, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 0, e16, m1, ta, ma
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%e = sext <vscale x 2 x i8> %v to <vscale x 2 x i16>		%e = sext <vscale x 2 x i8> %v to <vscale x 2 x i16>
%red = call i16 @llvm.vector.reduce.add.nxv2i16(<vscale x 2 x i16> %e)		%red = call i16 @llvm.vector.reduce.add.nxv2i16(<vscale x 2 x i16> %e)
ret i16 %red		ret i16 %red
}		}

declare i16 @llvm.vector.reduce.umax.nxv2i16(<vscale x 2 x i16>)		declare i16 @llvm.vector.reduce.umax.nxv2i16(<vscale x 2 x i16>)

define signext i16 @vreduce_umax_nxv2i16(<vscale x 2 x i16> %v) {		define signext i16 @vreduce_umax_nxv2i16(<vscale x 2 x i16> %v) {
; CHECK-LABEL: vreduce_umax_nxv2i16:		; CHECK-LABEL: vreduce_umax_nxv2i16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma
; CHECK-NEXT: vmv.s.x v9, zero
; CHECK-NEXT: vsetvli a0, zero, e16, mf2, ta, ma		; CHECK-NEXT: vsetvli a0, zero, e16, mf2, ta, ma
		; CHECK-NEXT: vmv.v.i v9, 0
; CHECK-NEXT: vredmaxu.vs v8, v8, v9		; CHECK-NEXT: vredmaxu.vs v8, v8, v9
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%red = call i16 @llvm.vector.reduce.umax.nxv2i16(<vscale x 2 x i16> %v)		%red = call i16 @llvm.vector.reduce.umax.nxv2i16(<vscale x 2 x i16> %v)
ret i16 %red		ret i16 %red
}		}

declare i16 @llvm.vector.reduce.smax.nxv2i16(<vscale x 2 x i16>)		declare i16 @llvm.vector.reduce.smax.nxv2i16(<vscale x 2 x i16>)

define signext i16 @vreduce_smax_nxv2i16(<vscale x 2 x i16> %v) {		define signext i16 @vreduce_smax_nxv2i16(<vscale x 2 x i16> %v) {
; CHECK-LABEL: vreduce_smax_nxv2i16:		; CHECK-LABEL: vreduce_smax_nxv2i16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: lui a0, 1048568		; CHECK-NEXT: lui a0, 1048568
; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma		; CHECK-NEXT: vsetvli a1, zero, e16, mf2, ta, ma
; CHECK-NEXT: vmv.s.x v9, a0		; CHECK-NEXT: vmv.v.x v9, a0
; CHECK-NEXT: vsetvli a0, zero, e16, mf2, ta, ma
; CHECK-NEXT: vredmax.vs v8, v8, v9		; CHECK-NEXT: vredmax.vs v8, v8, v9
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%red = call i16 @llvm.vector.reduce.smax.nxv2i16(<vscale x 2 x i16> %v)		%red = call i16 @llvm.vector.reduce.smax.nxv2i16(<vscale x 2 x i16> %v)
ret i16 %red		ret i16 %red
}		}

declare i16 @llvm.vector.reduce.umin.nxv2i16(<vscale x 2 x i16>)		declare i16 @llvm.vector.reduce.umin.nxv2i16(<vscale x 2 x i16>)

define signext i16 @vreduce_umin_nxv2i16(<vscale x 2 x i16> %v) {		define signext i16 @vreduce_umin_nxv2i16(<vscale x 2 x i16> %v) {
; CHECK-LABEL: vreduce_umin_nxv2i16:		; CHECK-LABEL: vreduce_umin_nxv2i16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma
; CHECK-NEXT: vmv.v.i v9, -1
; CHECK-NEXT: vsetvli a0, zero, e16, mf2, ta, ma		; CHECK-NEXT: vsetvli a0, zero, e16, mf2, ta, ma
		; CHECK-NEXT: vmv.v.i v9, -1
; CHECK-NEXT: vredminu.vs v8, v8, v9		; CHECK-NEXT: vredminu.vs v8, v8, v9
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%red = call i16 @llvm.vector.reduce.umin.nxv2i16(<vscale x 2 x i16> %v)		%red = call i16 @llvm.vector.reduce.umin.nxv2i16(<vscale x 2 x i16> %v)
ret i16 %red		ret i16 %red
}		}

declare i16 @llvm.vector.reduce.smin.nxv2i16(<vscale x 2 x i16>)		declare i16 @llvm.vector.reduce.smin.nxv2i16(<vscale x 2 x i16>)

define signext i16 @vreduce_smin_nxv2i16(<vscale x 2 x i16> %v) {		define signext i16 @vreduce_smin_nxv2i16(<vscale x 2 x i16> %v) {
; RV32-LABEL: vreduce_smin_nxv2i16:		; RV32-LABEL: vreduce_smin_nxv2i16:
; RV32: # %bb.0:		; RV32: # %bb.0:
; RV32-NEXT: lui a0, 8		; RV32-NEXT: lui a0, 8
; RV32-NEXT: addi a0, a0, -1		; RV32-NEXT: addi a0, a0, -1
; RV32-NEXT: vsetivli zero, 1, e16, m1, ta, ma		; RV32-NEXT: vsetvli a1, zero, e16, mf2, ta, ma
; RV32-NEXT: vmv.s.x v9, a0		; RV32-NEXT: vmv.v.x v9, a0
; RV32-NEXT: vsetvli a0, zero, e16, mf2, ta, ma
; RV32-NEXT: vredmin.vs v8, v8, v9		; RV32-NEXT: vredmin.vs v8, v8, v9
; RV32-NEXT: vmv.x.s a0, v8		; RV32-NEXT: vmv.x.s a0, v8
; RV32-NEXT: ret		; RV32-NEXT: ret
;		;
; RV64-LABEL: vreduce_smin_nxv2i16:		; RV64-LABEL: vreduce_smin_nxv2i16:
; RV64: # %bb.0:		; RV64: # %bb.0:
; RV64-NEXT: lui a0, 8		; RV64-NEXT: lui a0, 8
; RV64-NEXT: addiw a0, a0, -1		; RV64-NEXT: addiw a0, a0, -1
; RV64-NEXT: vsetivli zero, 1, e16, m1, ta, ma		; RV64-NEXT: vsetvli a1, zero, e16, mf2, ta, ma
; RV64-NEXT: vmv.s.x v9, a0		; RV64-NEXT: vmv.v.x v9, a0
; RV64-NEXT: vsetvli a0, zero, e16, mf2, ta, ma
; RV64-NEXT: vredmin.vs v8, v8, v9		; RV64-NEXT: vredmin.vs v8, v8, v9
; RV64-NEXT: vmv.x.s a0, v8		; RV64-NEXT: vmv.x.s a0, v8
; RV64-NEXT: ret		; RV64-NEXT: ret
%red = call i16 @llvm.vector.reduce.smin.nxv2i16(<vscale x 2 x i16> %v)		%red = call i16 @llvm.vector.reduce.smin.nxv2i16(<vscale x 2 x i16> %v)
ret i16 %red		ret i16 %red
}		}

declare i16 @llvm.vector.reduce.and.nxv2i16(<vscale x 2 x i16>)		declare i16 @llvm.vector.reduce.and.nxv2i16(<vscale x 2 x i16>)

define signext i16 @vreduce_and_nxv2i16(<vscale x 2 x i16> %v) {		define signext i16 @vreduce_and_nxv2i16(<vscale x 2 x i16> %v) {
; CHECK-LABEL: vreduce_and_nxv2i16:		; CHECK-LABEL: vreduce_and_nxv2i16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma
; CHECK-NEXT: vmv.v.i v9, -1
; CHECK-NEXT: vsetvli a0, zero, e16, mf2, ta, ma		; CHECK-NEXT: vsetvli a0, zero, e16, mf2, ta, ma
		; CHECK-NEXT: vmv.v.i v9, -1
; CHECK-NEXT: vredand.vs v8, v8, v9		; CHECK-NEXT: vredand.vs v8, v8, v9
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%red = call i16 @llvm.vector.reduce.and.nxv2i16(<vscale x 2 x i16> %v)		%red = call i16 @llvm.vector.reduce.and.nxv2i16(<vscale x 2 x i16> %v)
ret i16 %red		ret i16 %red
}		}

declare i16 @llvm.vector.reduce.or.nxv2i16(<vscale x 2 x i16>)		declare i16 @llvm.vector.reduce.or.nxv2i16(<vscale x 2 x i16>)

define signext i16 @vreduce_or_nxv2i16(<vscale x 2 x i16> %v) {		define signext i16 @vreduce_or_nxv2i16(<vscale x 2 x i16> %v) {
; CHECK-LABEL: vreduce_or_nxv2i16:		; CHECK-LABEL: vreduce_or_nxv2i16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma
; CHECK-NEXT: vmv.s.x v9, zero
; CHECK-NEXT: vsetvli a0, zero, e16, mf2, ta, ma		; CHECK-NEXT: vsetvli a0, zero, e16, mf2, ta, ma
		; CHECK-NEXT: vmv.v.i v9, 0
; CHECK-NEXT: vredor.vs v8, v8, v9		; CHECK-NEXT: vredor.vs v8, v8, v9
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%red = call i16 @llvm.vector.reduce.or.nxv2i16(<vscale x 2 x i16> %v)		%red = call i16 @llvm.vector.reduce.or.nxv2i16(<vscale x 2 x i16> %v)
ret i16 %red		ret i16 %red
}		}

declare i16 @llvm.vector.reduce.xor.nxv2i16(<vscale x 2 x i16>)		declare i16 @llvm.vector.reduce.xor.nxv2i16(<vscale x 2 x i16>)

define signext i16 @vreduce_xor_nxv2i16(<vscale x 2 x i16> %v) {		define signext i16 @vreduce_xor_nxv2i16(<vscale x 2 x i16> %v) {
; CHECK-LABEL: vreduce_xor_nxv2i16:		; CHECK-LABEL: vreduce_xor_nxv2i16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma
; CHECK-NEXT: vmv.s.x v9, zero
; CHECK-NEXT: vsetvli a0, zero, e16, mf2, ta, ma		; CHECK-NEXT: vsetvli a0, zero, e16, mf2, ta, ma
		; CHECK-NEXT: vmv.v.i v9, 0
; CHECK-NEXT: vredxor.vs v8, v8, v9		; CHECK-NEXT: vredxor.vs v8, v8, v9
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%red = call i16 @llvm.vector.reduce.xor.nxv2i16(<vscale x 2 x i16> %v)		%red = call i16 @llvm.vector.reduce.xor.nxv2i16(<vscale x 2 x i16> %v)
ret i16 %red		ret i16 %red
}		}

declare i16 @llvm.vector.reduce.add.nxv4i16(<vscale x 4 x i16>)		declare i16 @llvm.vector.reduce.add.nxv4i16(<vscale x 4 x i16>)

define signext i16 @vreduce_add_nxv4i16(<vscale x 4 x i16> %v) {		define signext i16 @vreduce_add_nxv4i16(<vscale x 4 x i16> %v) {
; CHECK-LABEL: vreduce_add_nxv4i16:		; CHECK-LABEL: vreduce_add_nxv4i16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma
; CHECK-NEXT: vmv.s.x v9, zero
; CHECK-NEXT: vsetvli a0, zero, e16, m1, ta, ma		; CHECK-NEXT: vsetvli a0, zero, e16, m1, ta, ma
		; CHECK-NEXT: vmv.v.i v9, 0
; CHECK-NEXT: vredsum.vs v8, v8, v9		; CHECK-NEXT: vredsum.vs v8, v8, v9
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%red = call i16 @llvm.vector.reduce.add.nxv4i16(<vscale x 4 x i16> %v)		%red = call i16 @llvm.vector.reduce.add.nxv4i16(<vscale x 4 x i16> %v)
ret i16 %red		ret i16 %red
}		}

define signext i16 @vwreduce_add_nxv4i8(<vscale x 4 x i8> %v) {		define signext i16 @vwreduce_add_nxv4i8(<vscale x 4 x i8> %v) {
; CHECK-LABEL: vwreduce_add_nxv4i8:		; CHECK-LABEL: vwreduce_add_nxv4i8:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma		; CHECK-NEXT: vsetvli a0, zero, e16, m1, ta, ma
; CHECK-NEXT: vmv.s.x v9, zero		; CHECK-NEXT: vmv.v.i v9, 0
; CHECK-NEXT: vsetvli a0, zero, e8, mf2, ta, ma		; CHECK-NEXT: vsetvli zero, zero, e8, mf2, ta, ma
; CHECK-NEXT: vwredsum.vs v8, v8, v9		; CHECK-NEXT: vwredsum.vs v8, v8, v9
; CHECK-NEXT: vsetvli zero, zero, e16, m1, ta, ma		; CHECK-NEXT: vsetvli zero, zero, e16, m1, ta, ma
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%e = sext <vscale x 4 x i8> %v to <vscale x 4 x i16>		%e = sext <vscale x 4 x i8> %v to <vscale x 4 x i16>
%red = call i16 @llvm.vector.reduce.add.nxv4i16(<vscale x 4 x i16> %e)		%red = call i16 @llvm.vector.reduce.add.nxv4i16(<vscale x 4 x i16> %e)
ret i16 %red		ret i16 %red
}		}

define signext i16 @vwreduce_uadd_nxv4i8(<vscale x 4 x i8> %v) {		define signext i16 @vwreduce_uadd_nxv4i8(<vscale x 4 x i8> %v) {
; CHECK-LABEL: vwreduce_uadd_nxv4i8:		; CHECK-LABEL: vwreduce_uadd_nxv4i8:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma		; CHECK-NEXT: vsetvli a0, zero, e16, m1, ta, ma
; CHECK-NEXT: vmv.s.x v9, zero		; CHECK-NEXT: vmv.v.i v9, 0
; CHECK-NEXT: vsetvli a0, zero, e8, mf2, ta, ma		; CHECK-NEXT: vsetvli zero, zero, e8, mf2, ta, ma
; CHECK-NEXT: vwredsum.vs v8, v8, v9		; CHECK-NEXT: vwredsum.vs v8, v8, v9
; CHECK-NEXT: vsetvli zero, zero, e16, m1, ta, ma		; CHECK-NEXT: vsetvli zero, zero, e16, m1, ta, ma
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%e = sext <vscale x 4 x i8> %v to <vscale x 4 x i16>		%e = sext <vscale x 4 x i8> %v to <vscale x 4 x i16>
%red = call i16 @llvm.vector.reduce.add.nxv4i16(<vscale x 4 x i16> %e)		%red = call i16 @llvm.vector.reduce.add.nxv4i16(<vscale x 4 x i16> %e)
ret i16 %red		ret i16 %red
}		}

declare i16 @llvm.vector.reduce.umax.nxv4i16(<vscale x 4 x i16>)		declare i16 @llvm.vector.reduce.umax.nxv4i16(<vscale x 4 x i16>)

define signext i16 @vreduce_umax_nxv4i16(<vscale x 4 x i16> %v) {		define signext i16 @vreduce_umax_nxv4i16(<vscale x 4 x i16> %v) {
; CHECK-LABEL: vreduce_umax_nxv4i16:		; CHECK-LABEL: vreduce_umax_nxv4i16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma
; CHECK-NEXT: vmv.s.x v9, zero
; CHECK-NEXT: vsetvli a0, zero, e16, m1, ta, ma		; CHECK-NEXT: vsetvli a0, zero, e16, m1, ta, ma
		; CHECK-NEXT: vmv.v.i v9, 0
; CHECK-NEXT: vredmaxu.vs v8, v8, v9		; CHECK-NEXT: vredmaxu.vs v8, v8, v9
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%red = call i16 @llvm.vector.reduce.umax.nxv4i16(<vscale x 4 x i16> %v)		%red = call i16 @llvm.vector.reduce.umax.nxv4i16(<vscale x 4 x i16> %v)
ret i16 %red		ret i16 %red
}		}

declare i16 @llvm.vector.reduce.smax.nxv4i16(<vscale x 4 x i16>)		declare i16 @llvm.vector.reduce.smax.nxv4i16(<vscale x 4 x i16>)

define signext i16 @vreduce_smax_nxv4i16(<vscale x 4 x i16> %v) {		define signext i16 @vreduce_smax_nxv4i16(<vscale x 4 x i16> %v) {
; CHECK-LABEL: vreduce_smax_nxv4i16:		; CHECK-LABEL: vreduce_smax_nxv4i16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: lui a0, 1048568		; CHECK-NEXT: lui a0, 1048568
; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma		; CHECK-NEXT: vsetvli a1, zero, e16, m1, ta, ma
; CHECK-NEXT: vmv.s.x v9, a0		; CHECK-NEXT: vmv.v.x v9, a0
; CHECK-NEXT: vsetvli a0, zero, e16, m1, ta, ma
; CHECK-NEXT: vredmax.vs v8, v8, v9		; CHECK-NEXT: vredmax.vs v8, v8, v9
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%red = call i16 @llvm.vector.reduce.smax.nxv4i16(<vscale x 4 x i16> %v)		%red = call i16 @llvm.vector.reduce.smax.nxv4i16(<vscale x 4 x i16> %v)
ret i16 %red		ret i16 %red
}		}

declare i16 @llvm.vector.reduce.umin.nxv4i16(<vscale x 4 x i16>)		declare i16 @llvm.vector.reduce.umin.nxv4i16(<vscale x 4 x i16>)

define signext i16 @vreduce_umin_nxv4i16(<vscale x 4 x i16> %v) {		define signext i16 @vreduce_umin_nxv4i16(<vscale x 4 x i16> %v) {
; CHECK-LABEL: vreduce_umin_nxv4i16:		; CHECK-LABEL: vreduce_umin_nxv4i16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma
; CHECK-NEXT: vmv.v.i v9, -1
; CHECK-NEXT: vsetvli a0, zero, e16, m1, ta, ma		; CHECK-NEXT: vsetvli a0, zero, e16, m1, ta, ma
		; CHECK-NEXT: vmv.v.i v9, -1
; CHECK-NEXT: vredminu.vs v8, v8, v9		; CHECK-NEXT: vredminu.vs v8, v8, v9
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%red = call i16 @llvm.vector.reduce.umin.nxv4i16(<vscale x 4 x i16> %v)		%red = call i16 @llvm.vector.reduce.umin.nxv4i16(<vscale x 4 x i16> %v)
ret i16 %red		ret i16 %red
}		}

declare i16 @llvm.vector.reduce.smin.nxv4i16(<vscale x 4 x i16>)		declare i16 @llvm.vector.reduce.smin.nxv4i16(<vscale x 4 x i16>)

define signext i16 @vreduce_smin_nxv4i16(<vscale x 4 x i16> %v) {		define signext i16 @vreduce_smin_nxv4i16(<vscale x 4 x i16> %v) {
; RV32-LABEL: vreduce_smin_nxv4i16:		; RV32-LABEL: vreduce_smin_nxv4i16:
; RV32: # %bb.0:		; RV32: # %bb.0:
; RV32-NEXT: lui a0, 8		; RV32-NEXT: lui a0, 8
; RV32-NEXT: addi a0, a0, -1		; RV32-NEXT: addi a0, a0, -1
; RV32-NEXT: vsetivli zero, 1, e16, m1, ta, ma		; RV32-NEXT: vsetvli a1, zero, e16, m1, ta, ma
; RV32-NEXT: vmv.s.x v9, a0		; RV32-NEXT: vmv.v.x v9, a0
; RV32-NEXT: vsetvli a0, zero, e16, m1, ta, ma
; RV32-NEXT: vredmin.vs v8, v8, v9		; RV32-NEXT: vredmin.vs v8, v8, v9
; RV32-NEXT: vmv.x.s a0, v8		; RV32-NEXT: vmv.x.s a0, v8
; RV32-NEXT: ret		; RV32-NEXT: ret
;		;
; RV64-LABEL: vreduce_smin_nxv4i16:		; RV64-LABEL: vreduce_smin_nxv4i16:
; RV64: # %bb.0:		; RV64: # %bb.0:
; RV64-NEXT: lui a0, 8		; RV64-NEXT: lui a0, 8
; RV64-NEXT: addiw a0, a0, -1		; RV64-NEXT: addiw a0, a0, -1
; RV64-NEXT: vsetivli zero, 1, e16, m1, ta, ma		; RV64-NEXT: vsetvli a1, zero, e16, m1, ta, ma
; RV64-NEXT: vmv.s.x v9, a0		; RV64-NEXT: vmv.v.x v9, a0
; RV64-NEXT: vsetvli a0, zero, e16, m1, ta, ma
; RV64-NEXT: vredmin.vs v8, v8, v9		; RV64-NEXT: vredmin.vs v8, v8, v9
; RV64-NEXT: vmv.x.s a0, v8		; RV64-NEXT: vmv.x.s a0, v8
; RV64-NEXT: ret		; RV64-NEXT: ret
%red = call i16 @llvm.vector.reduce.smin.nxv4i16(<vscale x 4 x i16> %v)		%red = call i16 @llvm.vector.reduce.smin.nxv4i16(<vscale x 4 x i16> %v)
ret i16 %red		ret i16 %red
}		}

declare i16 @llvm.vector.reduce.and.nxv4i16(<vscale x 4 x i16>)		declare i16 @llvm.vector.reduce.and.nxv4i16(<vscale x 4 x i16>)

define signext i16 @vreduce_and_nxv4i16(<vscale x 4 x i16> %v) {		define signext i16 @vreduce_and_nxv4i16(<vscale x 4 x i16> %v) {
; CHECK-LABEL: vreduce_and_nxv4i16:		; CHECK-LABEL: vreduce_and_nxv4i16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma
; CHECK-NEXT: vmv.v.i v9, -1
; CHECK-NEXT: vsetvli a0, zero, e16, m1, ta, ma		; CHECK-NEXT: vsetvli a0, zero, e16, m1, ta, ma
		; CHECK-NEXT: vmv.v.i v9, -1
; CHECK-NEXT: vredand.vs v8, v8, v9		; CHECK-NEXT: vredand.vs v8, v8, v9
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%red = call i16 @llvm.vector.reduce.and.nxv4i16(<vscale x 4 x i16> %v)		%red = call i16 @llvm.vector.reduce.and.nxv4i16(<vscale x 4 x i16> %v)
ret i16 %red		ret i16 %red
}		}

declare i16 @llvm.vector.reduce.or.nxv4i16(<vscale x 4 x i16>)		declare i16 @llvm.vector.reduce.or.nxv4i16(<vscale x 4 x i16>)

define signext i16 @vreduce_or_nxv4i16(<vscale x 4 x i16> %v) {		define signext i16 @vreduce_or_nxv4i16(<vscale x 4 x i16> %v) {
; CHECK-LABEL: vreduce_or_nxv4i16:		; CHECK-LABEL: vreduce_or_nxv4i16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma
; CHECK-NEXT: vmv.s.x v9, zero
; CHECK-NEXT: vsetvli a0, zero, e16, m1, ta, ma		; CHECK-NEXT: vsetvli a0, zero, e16, m1, ta, ma
		; CHECK-NEXT: vmv.v.i v9, 0
; CHECK-NEXT: vredor.vs v8, v8, v9		; CHECK-NEXT: vredor.vs v8, v8, v9
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%red = call i16 @llvm.vector.reduce.or.nxv4i16(<vscale x 4 x i16> %v)		%red = call i16 @llvm.vector.reduce.or.nxv4i16(<vscale x 4 x i16> %v)
ret i16 %red		ret i16 %red
}		}

declare i16 @llvm.vector.reduce.xor.nxv4i16(<vscale x 4 x i16>)		declare i16 @llvm.vector.reduce.xor.nxv4i16(<vscale x 4 x i16>)

define signext i16 @vreduce_xor_nxv4i16(<vscale x 4 x i16> %v) {		define signext i16 @vreduce_xor_nxv4i16(<vscale x 4 x i16> %v) {
; CHECK-LABEL: vreduce_xor_nxv4i16:		; CHECK-LABEL: vreduce_xor_nxv4i16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, ma
; CHECK-NEXT: vmv.s.x v9, zero
; CHECK-NEXT: vsetvli a0, zero, e16, m1, ta, ma		; CHECK-NEXT: vsetvli a0, zero, e16, m1, ta, ma
		; CHECK-NEXT: vmv.v.i v9, 0
; CHECK-NEXT: vredxor.vs v8, v8, v9		; CHECK-NEXT: vredxor.vs v8, v8, v9
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%red = call i16 @llvm.vector.reduce.xor.nxv4i16(<vscale x 4 x i16> %v)		%red = call i16 @llvm.vector.reduce.xor.nxv4i16(<vscale x 4 x i16> %v)
ret i16 %red		ret i16 %red
}		}

declare i32 @llvm.vector.reduce.add.nxv1i32(<vscale x 1 x i32>)		declare i32 @llvm.vector.reduce.add.nxv1i32(<vscale x 1 x i32>)

define signext i32 @vreduce_add_nxv1i32(<vscale x 1 x i32> %v) {		define signext i32 @vreduce_add_nxv1i32(<vscale x 1 x i32> %v) {
; CHECK-LABEL: vreduce_add_nxv1i32:		; CHECK-LABEL: vreduce_add_nxv1i32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma
; CHECK-NEXT: vmv.s.x v9, zero
; CHECK-NEXT: vsetvli a0, zero, e32, mf2, ta, ma		; CHECK-NEXT: vsetvli a0, zero, e32, mf2, ta, ma
		; CHECK-NEXT: vmv.v.i v9, 0
; CHECK-NEXT: vredsum.vs v8, v8, v9		; CHECK-NEXT: vredsum.vs v8, v8, v9
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%red = call i32 @llvm.vector.reduce.add.nxv1i32(<vscale x 1 x i32> %v)		%red = call i32 @llvm.vector.reduce.add.nxv1i32(<vscale x 1 x i32> %v)
ret i32 %red		ret i32 %red
}		}

define signext i32 @vwreduce_add_nxv1i16(<vscale x 1 x i16> %v) {		define signext i32 @vwreduce_add_nxv1i16(<vscale x 1 x i16> %v) {
; CHECK-LABEL: vwreduce_add_nxv1i16:		; CHECK-LABEL: vwreduce_add_nxv1i16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vsetvli a0, zero, e32, mf2, ta, ma
; CHECK-NEXT: vmv.s.x v9, zero		; CHECK-NEXT: vmv.v.i v9, 0
; CHECK-NEXT: vsetvli a0, zero, e16, mf4, ta, ma		; CHECK-NEXT: vsetvli zero, zero, e16, mf4, ta, ma
; CHECK-NEXT: vwredsum.vs v8, v8, v9		; CHECK-NEXT: vwredsum.vs v8, v8, v9
; CHECK-NEXT: vsetivli zero, 0, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 0, e32, m1, ta, ma
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%e = sext <vscale x 1 x i16> %v to <vscale x 1 x i32>		%e = sext <vscale x 1 x i16> %v to <vscale x 1 x i32>
%red = call i32 @llvm.vector.reduce.add.nxv1i32(<vscale x 1 x i32> %e)		%red = call i32 @llvm.vector.reduce.add.nxv1i32(<vscale x 1 x i32> %e)
ret i32 %red		ret i32 %red
}		}

define signext i32 @vwreduce_uadd_nxv1i16(<vscale x 1 x i16> %v) {		define signext i32 @vwreduce_uadd_nxv1i16(<vscale x 1 x i16> %v) {
; CHECK-LABEL: vwreduce_uadd_nxv1i16:		; CHECK-LABEL: vwreduce_uadd_nxv1i16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vsetvli a0, zero, e32, mf2, ta, ma
; CHECK-NEXT: vmv.s.x v9, zero		; CHECK-NEXT: vmv.v.i v9, 0
; CHECK-NEXT: vsetvli a0, zero, e16, mf4, ta, ma		; CHECK-NEXT: vsetvli zero, zero, e16, mf4, ta, ma
; CHECK-NEXT: vwredsumu.vs v8, v8, v9		; CHECK-NEXT: vwredsumu.vs v8, v8, v9
; CHECK-NEXT: vsetivli zero, 0, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 0, e32, m1, ta, ma
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%e = zext <vscale x 1 x i16> %v to <vscale x 1 x i32>		%e = zext <vscale x 1 x i16> %v to <vscale x 1 x i32>
%red = call i32 @llvm.vector.reduce.add.nxv1i32(<vscale x 1 x i32> %e)		%red = call i32 @llvm.vector.reduce.add.nxv1i32(<vscale x 1 x i32> %e)
ret i32 %red		ret i32 %red
}		}

declare i32 @llvm.vector.reduce.umax.nxv1i32(<vscale x 1 x i32>)		declare i32 @llvm.vector.reduce.umax.nxv1i32(<vscale x 1 x i32>)

define signext i32 @vreduce_umax_nxv1i32(<vscale x 1 x i32> %v) {		define signext i32 @vreduce_umax_nxv1i32(<vscale x 1 x i32> %v) {
; CHECK-LABEL: vreduce_umax_nxv1i32:		; CHECK-LABEL: vreduce_umax_nxv1i32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma
; CHECK-NEXT: vmv.s.x v9, zero
; CHECK-NEXT: vsetvli a0, zero, e32, mf2, ta, ma		; CHECK-NEXT: vsetvli a0, zero, e32, mf2, ta, ma
		; CHECK-NEXT: vmv.v.i v9, 0
; CHECK-NEXT: vredmaxu.vs v8, v8, v9		; CHECK-NEXT: vredmaxu.vs v8, v8, v9
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%red = call i32 @llvm.vector.reduce.umax.nxv1i32(<vscale x 1 x i32> %v)		%red = call i32 @llvm.vector.reduce.umax.nxv1i32(<vscale x 1 x i32> %v)
ret i32 %red		ret i32 %red
}		}

declare i32 @llvm.vector.reduce.smax.nxv1i32(<vscale x 1 x i32>)		declare i32 @llvm.vector.reduce.smax.nxv1i32(<vscale x 1 x i32>)

define signext i32 @vreduce_smax_nxv1i32(<vscale x 1 x i32> %v) {		define signext i32 @vreduce_smax_nxv1i32(<vscale x 1 x i32> %v) {
; CHECK-LABEL: vreduce_smax_nxv1i32:		; CHECK-LABEL: vreduce_smax_nxv1i32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: lui a0, 524288		; CHECK-NEXT: lui a0, 524288
; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vsetvli a1, zero, e32, mf2, ta, ma
; CHECK-NEXT: vmv.s.x v9, a0		; CHECK-NEXT: vmv.v.x v9, a0
; CHECK-NEXT: vsetvli a0, zero, e32, mf2, ta, ma
; CHECK-NEXT: vredmax.vs v8, v8, v9		; CHECK-NEXT: vredmax.vs v8, v8, v9
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%red = call i32 @llvm.vector.reduce.smax.nxv1i32(<vscale x 1 x i32> %v)		%red = call i32 @llvm.vector.reduce.smax.nxv1i32(<vscale x 1 x i32> %v)
ret i32 %red		ret i32 %red
}		}

declare i32 @llvm.vector.reduce.umin.nxv1i32(<vscale x 1 x i32>)		declare i32 @llvm.vector.reduce.umin.nxv1i32(<vscale x 1 x i32>)

define signext i32 @vreduce_umin_nxv1i32(<vscale x 1 x i32> %v) {		define signext i32 @vreduce_umin_nxv1i32(<vscale x 1 x i32> %v) {
; CHECK-LABEL: vreduce_umin_nxv1i32:		; CHECK-LABEL: vreduce_umin_nxv1i32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma
; CHECK-NEXT: vmv.v.i v9, -1
; CHECK-NEXT: vsetvli a0, zero, e32, mf2, ta, ma		; CHECK-NEXT: vsetvli a0, zero, e32, mf2, ta, ma
		; CHECK-NEXT: vmv.v.i v9, -1
; CHECK-NEXT: vredminu.vs v8, v8, v9		; CHECK-NEXT: vredminu.vs v8, v8, v9
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%red = call i32 @llvm.vector.reduce.umin.nxv1i32(<vscale x 1 x i32> %v)		%red = call i32 @llvm.vector.reduce.umin.nxv1i32(<vscale x 1 x i32> %v)
ret i32 %red		ret i32 %red
}		}

declare i32 @llvm.vector.reduce.smin.nxv1i32(<vscale x 1 x i32>)		declare i32 @llvm.vector.reduce.smin.nxv1i32(<vscale x 1 x i32>)

define signext i32 @vreduce_smin_nxv1i32(<vscale x 1 x i32> %v) {		define signext i32 @vreduce_smin_nxv1i32(<vscale x 1 x i32> %v) {
; RV32-LABEL: vreduce_smin_nxv1i32:		; RV32-LABEL: vreduce_smin_nxv1i32:
; RV32: # %bb.0:		; RV32: # %bb.0:
; RV32-NEXT: lui a0, 524288		; RV32-NEXT: lui a0, 524288
; RV32-NEXT: addi a0, a0, -1		; RV32-NEXT: addi a0, a0, -1
; RV32-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; RV32-NEXT: vsetvli a1, zero, e32, mf2, ta, ma
; RV32-NEXT: vmv.s.x v9, a0		; RV32-NEXT: vmv.v.x v9, a0
; RV32-NEXT: vsetvli a0, zero, e32, mf2, ta, ma
; RV32-NEXT: vredmin.vs v8, v8, v9		; RV32-NEXT: vredmin.vs v8, v8, v9
; RV32-NEXT: vmv.x.s a0, v8		; RV32-NEXT: vmv.x.s a0, v8
; RV32-NEXT: ret		; RV32-NEXT: ret
;		;
; RV64-LABEL: vreduce_smin_nxv1i32:		; RV64-LABEL: vreduce_smin_nxv1i32:
; RV64: # %bb.0:		; RV64: # %bb.0:
; RV64-NEXT: lui a0, 524288		; RV64-NEXT: lui a0, 524288
; RV64-NEXT: addiw a0, a0, -1		; RV64-NEXT: addiw a0, a0, -1
; RV64-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; RV64-NEXT: vsetvli a1, zero, e32, mf2, ta, ma
; RV64-NEXT: vmv.s.x v9, a0		; RV64-NEXT: vmv.v.x v9, a0
; RV64-NEXT: vsetvli a0, zero, e32, mf2, ta, ma
; RV64-NEXT: vredmin.vs v8, v8, v9		; RV64-NEXT: vredmin.vs v8, v8, v9
; RV64-NEXT: vmv.x.s a0, v8		; RV64-NEXT: vmv.x.s a0, v8
; RV64-NEXT: ret		; RV64-NEXT: ret
%red = call i32 @llvm.vector.reduce.smin.nxv1i32(<vscale x 1 x i32> %v)		%red = call i32 @llvm.vector.reduce.smin.nxv1i32(<vscale x 1 x i32> %v)
ret i32 %red		ret i32 %red
}		}

declare i32 @llvm.vector.reduce.and.nxv1i32(<vscale x 1 x i32>)		declare i32 @llvm.vector.reduce.and.nxv1i32(<vscale x 1 x i32>)

define signext i32 @vreduce_and_nxv1i32(<vscale x 1 x i32> %v) {		define signext i32 @vreduce_and_nxv1i32(<vscale x 1 x i32> %v) {
; CHECK-LABEL: vreduce_and_nxv1i32:		; CHECK-LABEL: vreduce_and_nxv1i32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma
; CHECK-NEXT: vmv.v.i v9, -1
; CHECK-NEXT: vsetvli a0, zero, e32, mf2, ta, ma		; CHECK-NEXT: vsetvli a0, zero, e32, mf2, ta, ma
		; CHECK-NEXT: vmv.v.i v9, -1
; CHECK-NEXT: vredand.vs v8, v8, v9		; CHECK-NEXT: vredand.vs v8, v8, v9
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%red = call i32 @llvm.vector.reduce.and.nxv1i32(<vscale x 1 x i32> %v)		%red = call i32 @llvm.vector.reduce.and.nxv1i32(<vscale x 1 x i32> %v)
ret i32 %red		ret i32 %red
}		}

declare i32 @llvm.vector.reduce.or.nxv1i32(<vscale x 1 x i32>)		declare i32 @llvm.vector.reduce.or.nxv1i32(<vscale x 1 x i32>)

define signext i32 @vreduce_or_nxv1i32(<vscale x 1 x i32> %v) {		define signext i32 @vreduce_or_nxv1i32(<vscale x 1 x i32> %v) {
; CHECK-LABEL: vreduce_or_nxv1i32:		; CHECK-LABEL: vreduce_or_nxv1i32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma
; CHECK-NEXT: vmv.s.x v9, zero
; CHECK-NEXT: vsetvli a0, zero, e32, mf2, ta, ma		; CHECK-NEXT: vsetvli a0, zero, e32, mf2, ta, ma
		; CHECK-NEXT: vmv.v.i v9, 0
; CHECK-NEXT: vredor.vs v8, v8, v9		; CHECK-NEXT: vredor.vs v8, v8, v9
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%red = call i32 @llvm.vector.reduce.or.nxv1i32(<vscale x 1 x i32> %v)		%red = call i32 @llvm.vector.reduce.or.nxv1i32(<vscale x 1 x i32> %v)
ret i32 %red		ret i32 %red
}		}

declare i32 @llvm.vector.reduce.xor.nxv1i32(<vscale x 1 x i32>)		declare i32 @llvm.vector.reduce.xor.nxv1i32(<vscale x 1 x i32>)

define signext i32 @vreduce_xor_nxv1i32(<vscale x 1 x i32> %v) {		define signext i32 @vreduce_xor_nxv1i32(<vscale x 1 x i32> %v) {
; CHECK-LABEL: vreduce_xor_nxv1i32:		; CHECK-LABEL: vreduce_xor_nxv1i32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma
; CHECK-NEXT: vmv.s.x v9, zero
; CHECK-NEXT: vsetvli a0, zero, e32, mf2, ta, ma		; CHECK-NEXT: vsetvli a0, zero, e32, mf2, ta, ma
		; CHECK-NEXT: vmv.v.i v9, 0
; CHECK-NEXT: vredxor.vs v8, v8, v9		; CHECK-NEXT: vredxor.vs v8, v8, v9
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%red = call i32 @llvm.vector.reduce.xor.nxv1i32(<vscale x 1 x i32> %v)		%red = call i32 @llvm.vector.reduce.xor.nxv1i32(<vscale x 1 x i32> %v)
ret i32 %red		ret i32 %red
}		}

declare i32 @llvm.vector.reduce.add.nxv2i32(<vscale x 2 x i32>)		declare i32 @llvm.vector.reduce.add.nxv2i32(<vscale x 2 x i32>)

define signext i32 @vreduce_add_nxv2i32(<vscale x 2 x i32> %v) {		define signext i32 @vreduce_add_nxv2i32(<vscale x 2 x i32> %v) {
; CHECK-LABEL: vreduce_add_nxv2i32:		; CHECK-LABEL: vreduce_add_nxv2i32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma
; CHECK-NEXT: vmv.s.x v9, zero
; CHECK-NEXT: vsetvli a0, zero, e32, m1, ta, ma		; CHECK-NEXT: vsetvli a0, zero, e32, m1, ta, ma
		; CHECK-NEXT: vmv.v.i v9, 0
; CHECK-NEXT: vredsum.vs v8, v8, v9		; CHECK-NEXT: vredsum.vs v8, v8, v9
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%red = call i32 @llvm.vector.reduce.add.nxv2i32(<vscale x 2 x i32> %v)		%red = call i32 @llvm.vector.reduce.add.nxv2i32(<vscale x 2 x i32> %v)
ret i32 %red		ret i32 %red
}		}

define signext i32 @vwreduce_add_nxv2i16(<vscale x 2 x i16> %v) {		define signext i32 @vwreduce_add_nxv2i16(<vscale x 2 x i16> %v) {
; CHECK-LABEL: vwreduce_add_nxv2i16:		; CHECK-LABEL: vwreduce_add_nxv2i16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vsetvli a0, zero, e32, m1, ta, ma
; CHECK-NEXT: vmv.s.x v9, zero		; CHECK-NEXT: vmv.v.i v9, 0
; CHECK-NEXT: vsetvli a0, zero, e16, mf2, ta, ma		; CHECK-NEXT: vsetvli zero, zero, e16, mf2, ta, ma
; CHECK-NEXT: vwredsum.vs v8, v8, v9		; CHECK-NEXT: vwredsum.vs v8, v8, v9
; CHECK-NEXT: vsetvli zero, zero, e32, m1, ta, ma		; CHECK-NEXT: vsetvli zero, zero, e32, m1, ta, ma
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%e = sext <vscale x 2 x i16> %v to <vscale x 2 x i32>		%e = sext <vscale x 2 x i16> %v to <vscale x 2 x i32>
%red = call i32 @llvm.vector.reduce.add.nxv2i32(<vscale x 2 x i32> %e)		%red = call i32 @llvm.vector.reduce.add.nxv2i32(<vscale x 2 x i32> %e)
ret i32 %red		ret i32 %red
}		}

define signext i32 @vwreduce_uadd_nxv2i16(<vscale x 2 x i16> %v) {		define signext i32 @vwreduce_uadd_nxv2i16(<vscale x 2 x i16> %v) {
; CHECK-LABEL: vwreduce_uadd_nxv2i16:		; CHECK-LABEL: vwreduce_uadd_nxv2i16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vsetvli a0, zero, e32, m1, ta, ma
; CHECK-NEXT: vmv.s.x v9, zero		; CHECK-NEXT: vmv.v.i v9, 0
; CHECK-NEXT: vsetvli a0, zero, e16, mf2, ta, ma		; CHECK-NEXT: vsetvli zero, zero, e16, mf2, ta, ma
; CHECK-NEXT: vwredsumu.vs v8, v8, v9		; CHECK-NEXT: vwredsumu.vs v8, v8, v9
; CHECK-NEXT: vsetvli zero, zero, e32, m1, ta, ma		; CHECK-NEXT: vsetvli zero, zero, e32, m1, ta, ma
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%e = zext <vscale x 2 x i16> %v to <vscale x 2 x i32>		%e = zext <vscale x 2 x i16> %v to <vscale x 2 x i32>
%red = call i32 @llvm.vector.reduce.add.nxv2i32(<vscale x 2 x i32> %e)		%red = call i32 @llvm.vector.reduce.add.nxv2i32(<vscale x 2 x i32> %e)
ret i32 %red		ret i32 %red
}		}

declare i32 @llvm.vector.reduce.umax.nxv2i32(<vscale x 2 x i32>)		declare i32 @llvm.vector.reduce.umax.nxv2i32(<vscale x 2 x i32>)

define signext i32 @vreduce_umax_nxv2i32(<vscale x 2 x i32> %v) {		define signext i32 @vreduce_umax_nxv2i32(<vscale x 2 x i32> %v) {
; CHECK-LABEL: vreduce_umax_nxv2i32:		; CHECK-LABEL: vreduce_umax_nxv2i32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma
; CHECK-NEXT: vmv.s.x v9, zero
; CHECK-NEXT: vsetvli a0, zero, e32, m1, ta, ma		; CHECK-NEXT: vsetvli a0, zero, e32, m1, ta, ma
		; CHECK-NEXT: vmv.v.i v9, 0
; CHECK-NEXT: vredmaxu.vs v8, v8, v9		; CHECK-NEXT: vredmaxu.vs v8, v8, v9
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%red = call i32 @llvm.vector.reduce.umax.nxv2i32(<vscale x 2 x i32> %v)		%red = call i32 @llvm.vector.reduce.umax.nxv2i32(<vscale x 2 x i32> %v)
ret i32 %red		ret i32 %red
}		}

declare i32 @llvm.vector.reduce.smax.nxv2i32(<vscale x 2 x i32>)		declare i32 @llvm.vector.reduce.smax.nxv2i32(<vscale x 2 x i32>)

define signext i32 @vreduce_smax_nxv2i32(<vscale x 2 x i32> %v) {		define signext i32 @vreduce_smax_nxv2i32(<vscale x 2 x i32> %v) {
; CHECK-LABEL: vreduce_smax_nxv2i32:		; CHECK-LABEL: vreduce_smax_nxv2i32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: lui a0, 524288		; CHECK-NEXT: lui a0, 524288
; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vsetvli a1, zero, e32, m1, ta, ma
; CHECK-NEXT: vmv.s.x v9, a0		; CHECK-NEXT: vmv.v.x v9, a0
; CHECK-NEXT: vsetvli a0, zero, e32, m1, ta, ma
; CHECK-NEXT: vredmax.vs v8, v8, v9		; CHECK-NEXT: vredmax.vs v8, v8, v9
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%red = call i32 @llvm.vector.reduce.smax.nxv2i32(<vscale x 2 x i32> %v)		%red = call i32 @llvm.vector.reduce.smax.nxv2i32(<vscale x 2 x i32> %v)
ret i32 %red		ret i32 %red
}		}

declare i32 @llvm.vector.reduce.umin.nxv2i32(<vscale x 2 x i32>)		declare i32 @llvm.vector.reduce.umin.nxv2i32(<vscale x 2 x i32>)

define signext i32 @vreduce_umin_nxv2i32(<vscale x 2 x i32> %v) {		define signext i32 @vreduce_umin_nxv2i32(<vscale x 2 x i32> %v) {
; CHECK-LABEL: vreduce_umin_nxv2i32:		; CHECK-LABEL: vreduce_umin_nxv2i32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma
; CHECK-NEXT: vmv.v.i v9, -1
; CHECK-NEXT: vsetvli a0, zero, e32, m1, ta, ma		; CHECK-NEXT: vsetvli a0, zero, e32, m1, ta, ma
		; CHECK-NEXT: vmv.v.i v9, -1
; CHECK-NEXT: vredminu.vs v8, v8, v9		; CHECK-NEXT: vredminu.vs v8, v8, v9
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%red = call i32 @llvm.vector.reduce.umin.nxv2i32(<vscale x 2 x i32> %v)		%red = call i32 @llvm.vector.reduce.umin.nxv2i32(<vscale x 2 x i32> %v)
ret i32 %red		ret i32 %red
}		}

declare i32 @llvm.vector.reduce.smin.nxv2i32(<vscale x 2 x i32>)		declare i32 @llvm.vector.reduce.smin.nxv2i32(<vscale x 2 x i32>)

define signext i32 @vreduce_smin_nxv2i32(<vscale x 2 x i32> %v) {		define signext i32 @vreduce_smin_nxv2i32(<vscale x 2 x i32> %v) {
; RV32-LABEL: vreduce_smin_nxv2i32:		; RV32-LABEL: vreduce_smin_nxv2i32:
; RV32: # %bb.0:		; RV32: # %bb.0:
; RV32-NEXT: lui a0, 524288		; RV32-NEXT: lui a0, 524288
; RV32-NEXT: addi a0, a0, -1		; RV32-NEXT: addi a0, a0, -1
; RV32-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; RV32-NEXT: vsetvli a1, zero, e32, m1, ta, ma
; RV32-NEXT: vmv.s.x v9, a0		; RV32-NEXT: vmv.v.x v9, a0
; RV32-NEXT: vsetvli a0, zero, e32, m1, ta, ma
; RV32-NEXT: vredmin.vs v8, v8, v9		; RV32-NEXT: vredmin.vs v8, v8, v9
; RV32-NEXT: vmv.x.s a0, v8		; RV32-NEXT: vmv.x.s a0, v8
; RV32-NEXT: ret		; RV32-NEXT: ret
;		;
; RV64-LABEL: vreduce_smin_nxv2i32:		; RV64-LABEL: vreduce_smin_nxv2i32:
; RV64: # %bb.0:		; RV64: # %bb.0:
; RV64-NEXT: lui a0, 524288		; RV64-NEXT: lui a0, 524288
; RV64-NEXT: addiw a0, a0, -1		; RV64-NEXT: addiw a0, a0, -1
; RV64-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; RV64-NEXT: vsetvli a1, zero, e32, m1, ta, ma
; RV64-NEXT: vmv.s.x v9, a0		; RV64-NEXT: vmv.v.x v9, a0
; RV64-NEXT: vsetvli a0, zero, e32, m1, ta, ma
; RV64-NEXT: vredmin.vs v8, v8, v9		; RV64-NEXT: vredmin.vs v8, v8, v9
; RV64-NEXT: vmv.x.s a0, v8		; RV64-NEXT: vmv.x.s a0, v8
; RV64-NEXT: ret		; RV64-NEXT: ret
%red = call i32 @llvm.vector.reduce.smin.nxv2i32(<vscale x 2 x i32> %v)		%red = call i32 @llvm.vector.reduce.smin.nxv2i32(<vscale x 2 x i32> %v)
ret i32 %red		ret i32 %red
}		}

declare i32 @llvm.vector.reduce.and.nxv2i32(<vscale x 2 x i32>)		declare i32 @llvm.vector.reduce.and.nxv2i32(<vscale x 2 x i32>)

define signext i32 @vreduce_and_nxv2i32(<vscale x 2 x i32> %v) {		define signext i32 @vreduce_and_nxv2i32(<vscale x 2 x i32> %v) {
; CHECK-LABEL: vreduce_and_nxv2i32:		; CHECK-LABEL: vreduce_and_nxv2i32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma
; CHECK-NEXT: vmv.v.i v9, -1
; CHECK-NEXT: vsetvli a0, zero, e32, m1, ta, ma		; CHECK-NEXT: vsetvli a0, zero, e32, m1, ta, ma
		; CHECK-NEXT: vmv.v.i v9, -1
; CHECK-NEXT: vredand.vs v8, v8, v9		; CHECK-NEXT: vredand.vs v8, v8, v9
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%red = call i32 @llvm.vector.reduce.and.nxv2i32(<vscale x 2 x i32> %v)		%red = call i32 @llvm.vector.reduce.and.nxv2i32(<vscale x 2 x i32> %v)
ret i32 %red		ret i32 %red
}		}

declare i32 @llvm.vector.reduce.or.nxv2i32(<vscale x 2 x i32>)		declare i32 @llvm.vector.reduce.or.nxv2i32(<vscale x 2 x i32>)

define signext i32 @vreduce_or_nxv2i32(<vscale x 2 x i32> %v) {		define signext i32 @vreduce_or_nxv2i32(<vscale x 2 x i32> %v) {
; CHECK-LABEL: vreduce_or_nxv2i32:		; CHECK-LABEL: vreduce_or_nxv2i32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma
; CHECK-NEXT: vmv.s.x v9, zero
; CHECK-NEXT: vsetvli a0, zero, e32, m1, ta, ma		; CHECK-NEXT: vsetvli a0, zero, e32, m1, ta, ma
		; CHECK-NEXT: vmv.v.i v9, 0
; CHECK-NEXT: vredor.vs v8, v8, v9		; CHECK-NEXT: vredor.vs v8, v8, v9
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%red = call i32 @llvm.vector.reduce.or.nxv2i32(<vscale x 2 x i32> %v)		%red = call i32 @llvm.vector.reduce.or.nxv2i32(<vscale x 2 x i32> %v)
ret i32 %red		ret i32 %red
}		}

declare i32 @llvm.vector.reduce.xor.nxv2i32(<vscale x 2 x i32>)		declare i32 @llvm.vector.reduce.xor.nxv2i32(<vscale x 2 x i32>)

define signext i32 @vreduce_xor_nxv2i32(<vscale x 2 x i32> %v) {		define signext i32 @vreduce_xor_nxv2i32(<vscale x 2 x i32> %v) {
; CHECK-LABEL: vreduce_xor_nxv2i32:		; CHECK-LABEL: vreduce_xor_nxv2i32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, ma
; CHECK-NEXT: vmv.s.x v9, zero
; CHECK-NEXT: vsetvli a0, zero, e32, m1, ta, ma		; CHECK-NEXT: vsetvli a0, zero, e32, m1, ta, ma
		; CHECK-NEXT: vmv.v.i v9, 0
; CHECK-NEXT: vredxor.vs v8, v8, v9		; CHECK-NEXT: vredxor.vs v8, v8, v9
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%red = call i32 @llvm.vector.reduce.xor.nxv2i32(<vscale x 2 x i32> %v)		%red = call i32 @llvm.vector.reduce.xor.nxv2i32(<vscale x 2 x i32> %v)
ret i32 %red		ret i32 %red
}		}

declare i32 @llvm.vector.reduce.add.nxv4i32(<vscale x 4 x i32>)		declare i32 @llvm.vector.reduce.add.nxv4i32(<vscale x 4 x i32>)
▲ Show 20 Lines • Show All 160 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
ret i32 %red		ret i32 %red
}		}

declare i64 @llvm.vector.reduce.add.nxv1i64(<vscale x 1 x i64>)		declare i64 @llvm.vector.reduce.add.nxv1i64(<vscale x 1 x i64>)

define i64 @vreduce_add_nxv1i64(<vscale x 1 x i64> %v) {		define i64 @vreduce_add_nxv1i64(<vscale x 1 x i64> %v) {
; RV32-LABEL: vreduce_add_nxv1i64:		; RV32-LABEL: vreduce_add_nxv1i64:
; RV32: # %bb.0:		; RV32: # %bb.0:
; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma
; RV32-NEXT: vmv.s.x v9, zero
; RV32-NEXT: vsetvli a0, zero, e64, m1, ta, ma		; RV32-NEXT: vsetvli a0, zero, e64, m1, ta, ma
		; RV32-NEXT: vmv.v.i v9, 0
; RV32-NEXT: vredsum.vs v8, v8, v9		; RV32-NEXT: vredsum.vs v8, v8, v9
; RV32-NEXT: vmv.x.s a0, v8		; RV32-NEXT: vmv.x.s a0, v8
; RV32-NEXT: li a1, 32		; RV32-NEXT: li a1, 32
; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma		; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma
; RV32-NEXT: vsrl.vx v8, v8, a1		; RV32-NEXT: vsrl.vx v8, v8, a1
; RV32-NEXT: vmv.x.s a1, v8		; RV32-NEXT: vmv.x.s a1, v8
; RV32-NEXT: ret		; RV32-NEXT: ret
;		;
; RV64-LABEL: vreduce_add_nxv1i64:		; RV64-LABEL: vreduce_add_nxv1i64:
; RV64: # %bb.0:		; RV64: # %bb.0:
; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma
; RV64-NEXT: vmv.s.x v9, zero
; RV64-NEXT: vsetvli a0, zero, e64, m1, ta, ma		; RV64-NEXT: vsetvli a0, zero, e64, m1, ta, ma
		; RV64-NEXT: vmv.v.i v9, 0
; RV64-NEXT: vredsum.vs v8, v8, v9		; RV64-NEXT: vredsum.vs v8, v8, v9
; RV64-NEXT: vmv.x.s a0, v8		; RV64-NEXT: vmv.x.s a0, v8
; RV64-NEXT: ret		; RV64-NEXT: ret
%red = call i64 @llvm.vector.reduce.add.nxv1i64(<vscale x 1 x i64> %v)		%red = call i64 @llvm.vector.reduce.add.nxv1i64(<vscale x 1 x i64> %v)
ret i64 %red		ret i64 %red
}		}

define i64 @vwreduce_add_nxv1i32(<vscale x 1 x i32> %v) {		define i64 @vwreduce_add_nxv1i32(<vscale x 1 x i32> %v) {
; RV32-LABEL: vwreduce_add_nxv1i32:		; RV32-LABEL: vwreduce_add_nxv1i32:
; RV32: # %bb.0:		; RV32: # %bb.0:
; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma		; RV32-NEXT: vsetvli a0, zero, e64, m1, ta, ma
; RV32-NEXT: vmv.s.x v9, zero		; RV32-NEXT: vmv.v.i v9, 0
; RV32-NEXT: vsetvli a0, zero, e32, mf2, ta, ma		; RV32-NEXT: vsetvli zero, zero, e32, mf2, ta, ma
; RV32-NEXT: vwredsum.vs v8, v8, v9		; RV32-NEXT: vwredsum.vs v8, v8, v9
; RV32-NEXT: vsetvli zero, zero, e64, m1, ta, ma		; RV32-NEXT: vsetvli zero, zero, e64, m1, ta, ma
; RV32-NEXT: vmv.x.s a0, v8		; RV32-NEXT: vmv.x.s a0, v8
; RV32-NEXT: li a1, 32		; RV32-NEXT: li a1, 32
; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma		; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma
; RV32-NEXT: vsrl.vx v8, v8, a1		; RV32-NEXT: vsrl.vx v8, v8, a1
; RV32-NEXT: vmv.x.s a1, v8		; RV32-NEXT: vmv.x.s a1, v8
; RV32-NEXT: ret		; RV32-NEXT: ret
;		;
; RV64-LABEL: vwreduce_add_nxv1i32:		; RV64-LABEL: vwreduce_add_nxv1i32:
; RV64: # %bb.0:		; RV64: # %bb.0:
; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma		; RV64-NEXT: vsetvli a0, zero, e64, m1, ta, ma
; RV64-NEXT: vmv.s.x v9, zero		; RV64-NEXT: vmv.v.i v9, 0
; RV64-NEXT: vsetvli a0, zero, e32, mf2, ta, ma		; RV64-NEXT: vsetvli zero, zero, e32, mf2, ta, ma
; RV64-NEXT: vwredsum.vs v8, v8, v9		; RV64-NEXT: vwredsum.vs v8, v8, v9
; RV64-NEXT: vsetvli zero, zero, e64, m1, ta, ma		; RV64-NEXT: vsetvli zero, zero, e64, m1, ta, ma
; RV64-NEXT: vmv.x.s a0, v8		; RV64-NEXT: vmv.x.s a0, v8
; RV64-NEXT: ret		; RV64-NEXT: ret
%e = sext <vscale x 1 x i32> %v to <vscale x 1 x i64>		%e = sext <vscale x 1 x i32> %v to <vscale x 1 x i64>
%red = call i64 @llvm.vector.reduce.add.nxv1i64(<vscale x 1 x i64> %e)		%red = call i64 @llvm.vector.reduce.add.nxv1i64(<vscale x 1 x i64> %e)
ret i64 %red		ret i64 %red
}		}

define i64 @vwreduce_uadd_nxv1i32(<vscale x 1 x i32> %v) {		define i64 @vwreduce_uadd_nxv1i32(<vscale x 1 x i32> %v) {
; RV32-LABEL: vwreduce_uadd_nxv1i32:		; RV32-LABEL: vwreduce_uadd_nxv1i32:
; RV32: # %bb.0:		; RV32: # %bb.0:
; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma		; RV32-NEXT: vsetvli a0, zero, e64, m1, ta, ma
; RV32-NEXT: vmv.s.x v9, zero		; RV32-NEXT: vmv.v.i v9, 0
; RV32-NEXT: vsetvli a0, zero, e32, mf2, ta, ma		; RV32-NEXT: vsetvli zero, zero, e32, mf2, ta, ma
; RV32-NEXT: vwredsumu.vs v8, v8, v9		; RV32-NEXT: vwredsumu.vs v8, v8, v9
; RV32-NEXT: vsetvli zero, zero, e64, m1, ta, ma		; RV32-NEXT: vsetvli zero, zero, e64, m1, ta, ma
; RV32-NEXT: vmv.x.s a0, v8		; RV32-NEXT: vmv.x.s a0, v8
; RV32-NEXT: li a1, 32		; RV32-NEXT: li a1, 32
; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma		; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma
; RV32-NEXT: vsrl.vx v8, v8, a1		; RV32-NEXT: vsrl.vx v8, v8, a1
; RV32-NEXT: vmv.x.s a1, v8		; RV32-NEXT: vmv.x.s a1, v8
; RV32-NEXT: ret		; RV32-NEXT: ret
;		;
; RV64-LABEL: vwreduce_uadd_nxv1i32:		; RV64-LABEL: vwreduce_uadd_nxv1i32:
; RV64: # %bb.0:		; RV64: # %bb.0:
; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma		; RV64-NEXT: vsetvli a0, zero, e64, m1, ta, ma
; RV64-NEXT: vmv.s.x v9, zero		; RV64-NEXT: vmv.v.i v9, 0
; RV64-NEXT: vsetvli a0, zero, e32, mf2, ta, ma		; RV64-NEXT: vsetvli zero, zero, e32, mf2, ta, ma
; RV64-NEXT: vwredsumu.vs v8, v8, v9		; RV64-NEXT: vwredsumu.vs v8, v8, v9
; RV64-NEXT: vsetvli zero, zero, e64, m1, ta, ma		; RV64-NEXT: vsetvli zero, zero, e64, m1, ta, ma
; RV64-NEXT: vmv.x.s a0, v8		; RV64-NEXT: vmv.x.s a0, v8
; RV64-NEXT: ret		; RV64-NEXT: ret
%e = zext <vscale x 1 x i32> %v to <vscale x 1 x i64>		%e = zext <vscale x 1 x i32> %v to <vscale x 1 x i64>
%red = call i64 @llvm.vector.reduce.add.nxv1i64(<vscale x 1 x i64> %e)		%red = call i64 @llvm.vector.reduce.add.nxv1i64(<vscale x 1 x i64> %e)
ret i64 %red		ret i64 %red
}		}

declare i64 @llvm.vector.reduce.umax.nxv1i64(<vscale x 1 x i64>)		declare i64 @llvm.vector.reduce.umax.nxv1i64(<vscale x 1 x i64>)

define i64 @vreduce_umax_nxv1i64(<vscale x 1 x i64> %v) {		define i64 @vreduce_umax_nxv1i64(<vscale x 1 x i64> %v) {
; RV32-LABEL: vreduce_umax_nxv1i64:		; RV32-LABEL: vreduce_umax_nxv1i64:
; RV32: # %bb.0:		; RV32: # %bb.0:
; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma
; RV32-NEXT: vmv.s.x v9, zero
; RV32-NEXT: vsetvli a0, zero, e64, m1, ta, ma		; RV32-NEXT: vsetvli a0, zero, e64, m1, ta, ma
		; RV32-NEXT: vmv.v.i v9, 0
; RV32-NEXT: vredmaxu.vs v8, v8, v9		; RV32-NEXT: vredmaxu.vs v8, v8, v9
; RV32-NEXT: vmv.x.s a0, v8		; RV32-NEXT: vmv.x.s a0, v8
; RV32-NEXT: li a1, 32		; RV32-NEXT: li a1, 32
; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma		; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma
; RV32-NEXT: vsrl.vx v8, v8, a1		; RV32-NEXT: vsrl.vx v8, v8, a1
; RV32-NEXT: vmv.x.s a1, v8		; RV32-NEXT: vmv.x.s a1, v8
; RV32-NEXT: ret		; RV32-NEXT: ret
;		;
; RV64-LABEL: vreduce_umax_nxv1i64:		; RV64-LABEL: vreduce_umax_nxv1i64:
; RV64: # %bb.0:		; RV64: # %bb.0:
; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma
; RV64-NEXT: vmv.s.x v9, zero
; RV64-NEXT: vsetvli a0, zero, e64, m1, ta, ma		; RV64-NEXT: vsetvli a0, zero, e64, m1, ta, ma
		; RV64-NEXT: vmv.v.i v9, 0
; RV64-NEXT: vredmaxu.vs v8, v8, v9		; RV64-NEXT: vredmaxu.vs v8, v8, v9
; RV64-NEXT: vmv.x.s a0, v8		; RV64-NEXT: vmv.x.s a0, v8
; RV64-NEXT: ret		; RV64-NEXT: ret
%red = call i64 @llvm.vector.reduce.umax.nxv1i64(<vscale x 1 x i64> %v)		%red = call i64 @llvm.vector.reduce.umax.nxv1i64(<vscale x 1 x i64> %v)
ret i64 %red		ret i64 %red
}		}

declare i64 @llvm.vector.reduce.smax.nxv1i64(<vscale x 1 x i64>)		declare i64 @llvm.vector.reduce.smax.nxv1i64(<vscale x 1 x i64>)

define i64 @vreduce_smax_nxv1i64(<vscale x 1 x i64> %v) {		define i64 @vreduce_smax_nxv1i64(<vscale x 1 x i64> %v) {
; RV32-LABEL: vreduce_smax_nxv1i64:		; RV32-LABEL: vreduce_smax_nxv1i64:
; RV32: # %bb.0:		; RV32: # %bb.0:
; RV32-NEXT: addi sp, sp, -16		; RV32-NEXT: addi sp, sp, -16
; RV32-NEXT: .cfi_def_cfa_offset 16		; RV32-NEXT: .cfi_def_cfa_offset 16
; RV32-NEXT: lui a0, 524288		; RV32-NEXT: lui a0, 524288
; RV32-NEXT: sw a0, 12(sp)		; RV32-NEXT: sw a0, 12(sp)
; RV32-NEXT: sw zero, 8(sp)		; RV32-NEXT: sw zero, 8(sp)
; RV32-NEXT: addi a0, sp, 8		; RV32-NEXT: addi a0, sp, 8
; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma		; RV32-NEXT: vsetvli a1, zero, e64, m1, ta, ma
; RV32-NEXT: vlse64.v v9, (a0), zero		; RV32-NEXT: vlse64.v v9, (a0), zero
; RV32-NEXT: vsetvli a0, zero, e64, m1, ta, ma
; RV32-NEXT: vredmax.vs v8, v8, v9		; RV32-NEXT: vredmax.vs v8, v8, v9
; RV32-NEXT: vmv.x.s a0, v8		; RV32-NEXT: vmv.x.s a0, v8
; RV32-NEXT: li a1, 32		; RV32-NEXT: li a1, 32
; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma		; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma
; RV32-NEXT: vsrl.vx v8, v8, a1		; RV32-NEXT: vsrl.vx v8, v8, a1
; RV32-NEXT: vmv.x.s a1, v8		; RV32-NEXT: vmv.x.s a1, v8
; RV32-NEXT: addi sp, sp, 16		; RV32-NEXT: addi sp, sp, 16
; RV32-NEXT: ret		; RV32-NEXT: ret
;		;
; RV64-LABEL: vreduce_smax_nxv1i64:		; RV64-LABEL: vreduce_smax_nxv1i64:
; RV64: # %bb.0:		; RV64: # %bb.0:
; RV64-NEXT: li a0, -1		; RV64-NEXT: li a0, -1
; RV64-NEXT: slli a0, a0, 63		; RV64-NEXT: slli a0, a0, 63
; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma		; RV64-NEXT: vsetvli a1, zero, e64, m1, ta, ma
; RV64-NEXT: vmv.s.x v9, a0		; RV64-NEXT: vmv.v.x v9, a0
; RV64-NEXT: vsetvli a0, zero, e64, m1, ta, ma
; RV64-NEXT: vredmax.vs v8, v8, v9		; RV64-NEXT: vredmax.vs v8, v8, v9
; RV64-NEXT: vmv.x.s a0, v8		; RV64-NEXT: vmv.x.s a0, v8
; RV64-NEXT: ret		; RV64-NEXT: ret
%red = call i64 @llvm.vector.reduce.smax.nxv1i64(<vscale x 1 x i64> %v)		%red = call i64 @llvm.vector.reduce.smax.nxv1i64(<vscale x 1 x i64> %v)
ret i64 %red		ret i64 %red
}		}

declare i64 @llvm.vector.reduce.umin.nxv1i64(<vscale x 1 x i64>)		declare i64 @llvm.vector.reduce.umin.nxv1i64(<vscale x 1 x i64>)

define i64 @vreduce_umin_nxv1i64(<vscale x 1 x i64> %v) {		define i64 @vreduce_umin_nxv1i64(<vscale x 1 x i64> %v) {
; RV32-LABEL: vreduce_umin_nxv1i64:		; RV32-LABEL: vreduce_umin_nxv1i64:
; RV32: # %bb.0:		; RV32: # %bb.0:
; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma
; RV32-NEXT: vmv.v.i v9, -1
; RV32-NEXT: vsetvli a0, zero, e64, m1, ta, ma		; RV32-NEXT: vsetvli a0, zero, e64, m1, ta, ma
		; RV32-NEXT: vmv.v.i v9, -1
; RV32-NEXT: vredminu.vs v8, v8, v9		; RV32-NEXT: vredminu.vs v8, v8, v9
; RV32-NEXT: vmv.x.s a0, v8		; RV32-NEXT: vmv.x.s a0, v8
; RV32-NEXT: li a1, 32		; RV32-NEXT: li a1, 32
; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma		; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma
; RV32-NEXT: vsrl.vx v8, v8, a1		; RV32-NEXT: vsrl.vx v8, v8, a1
; RV32-NEXT: vmv.x.s a1, v8		; RV32-NEXT: vmv.x.s a1, v8
; RV32-NEXT: ret		; RV32-NEXT: ret
;		;
; RV64-LABEL: vreduce_umin_nxv1i64:		; RV64-LABEL: vreduce_umin_nxv1i64:
; RV64: # %bb.0:		; RV64: # %bb.0:
; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma
; RV64-NEXT: vmv.v.i v9, -1
; RV64-NEXT: vsetvli a0, zero, e64, m1, ta, ma		; RV64-NEXT: vsetvli a0, zero, e64, m1, ta, ma
		; RV64-NEXT: vmv.v.i v9, -1
; RV64-NEXT: vredminu.vs v8, v8, v9		; RV64-NEXT: vredminu.vs v8, v8, v9
; RV64-NEXT: vmv.x.s a0, v8		; RV64-NEXT: vmv.x.s a0, v8
; RV64-NEXT: ret		; RV64-NEXT: ret
%red = call i64 @llvm.vector.reduce.umin.nxv1i64(<vscale x 1 x i64> %v)		%red = call i64 @llvm.vector.reduce.umin.nxv1i64(<vscale x 1 x i64> %v)
ret i64 %red		ret i64 %red
}		}

declare i64 @llvm.vector.reduce.smin.nxv1i64(<vscale x 1 x i64>)		declare i64 @llvm.vector.reduce.smin.nxv1i64(<vscale x 1 x i64>)

define i64 @vreduce_smin_nxv1i64(<vscale x 1 x i64> %v) {		define i64 @vreduce_smin_nxv1i64(<vscale x 1 x i64> %v) {
; RV32-LABEL: vreduce_smin_nxv1i64:		; RV32-LABEL: vreduce_smin_nxv1i64:
; RV32: # %bb.0:		; RV32: # %bb.0:
; RV32-NEXT: addi sp, sp, -16		; RV32-NEXT: addi sp, sp, -16
; RV32-NEXT: .cfi_def_cfa_offset 16		; RV32-NEXT: .cfi_def_cfa_offset 16
; RV32-NEXT: li a0, -1		; RV32-NEXT: li a0, -1
; RV32-NEXT: sw a0, 8(sp)		; RV32-NEXT: sw a0, 8(sp)
; RV32-NEXT: lui a0, 524288		; RV32-NEXT: lui a0, 524288
; RV32-NEXT: addi a0, a0, -1		; RV32-NEXT: addi a0, a0, -1
; RV32-NEXT: sw a0, 12(sp)		; RV32-NEXT: sw a0, 12(sp)
; RV32-NEXT: addi a0, sp, 8		; RV32-NEXT: addi a0, sp, 8
; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma		; RV32-NEXT: vsetvli a1, zero, e64, m1, ta, ma
; RV32-NEXT: vlse64.v v9, (a0), zero		; RV32-NEXT: vlse64.v v9, (a0), zero
; RV32-NEXT: vsetvli a0, zero, e64, m1, ta, ma
; RV32-NEXT: vredmin.vs v8, v8, v9		; RV32-NEXT: vredmin.vs v8, v8, v9
; RV32-NEXT: vmv.x.s a0, v8		; RV32-NEXT: vmv.x.s a0, v8
; RV32-NEXT: li a1, 32		; RV32-NEXT: li a1, 32
; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma		; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma
; RV32-NEXT: vsrl.vx v8, v8, a1		; RV32-NEXT: vsrl.vx v8, v8, a1
; RV32-NEXT: vmv.x.s a1, v8		; RV32-NEXT: vmv.x.s a1, v8
; RV32-NEXT: addi sp, sp, 16		; RV32-NEXT: addi sp, sp, 16
; RV32-NEXT: ret		; RV32-NEXT: ret
;		;
; RV64-LABEL: vreduce_smin_nxv1i64:		; RV64-LABEL: vreduce_smin_nxv1i64:
; RV64: # %bb.0:		; RV64: # %bb.0:
; RV64-NEXT: li a0, -1		; RV64-NEXT: li a0, -1
; RV64-NEXT: srli a0, a0, 1		; RV64-NEXT: srli a0, a0, 1
; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma		; RV64-NEXT: vsetvli a1, zero, e64, m1, ta, ma
; RV64-NEXT: vmv.s.x v9, a0		; RV64-NEXT: vmv.v.x v9, a0
; RV64-NEXT: vsetvli a0, zero, e64, m1, ta, ma
; RV64-NEXT: vredmin.vs v8, v8, v9		; RV64-NEXT: vredmin.vs v8, v8, v9
; RV64-NEXT: vmv.x.s a0, v8		; RV64-NEXT: vmv.x.s a0, v8
; RV64-NEXT: ret		; RV64-NEXT: ret
%red = call i64 @llvm.vector.reduce.smin.nxv1i64(<vscale x 1 x i64> %v)		%red = call i64 @llvm.vector.reduce.smin.nxv1i64(<vscale x 1 x i64> %v)
ret i64 %red		ret i64 %red
}		}

declare i64 @llvm.vector.reduce.and.nxv1i64(<vscale x 1 x i64>)		declare i64 @llvm.vector.reduce.and.nxv1i64(<vscale x 1 x i64>)

define i64 @vreduce_and_nxv1i64(<vscale x 1 x i64> %v) {		define i64 @vreduce_and_nxv1i64(<vscale x 1 x i64> %v) {
; RV32-LABEL: vreduce_and_nxv1i64:		; RV32-LABEL: vreduce_and_nxv1i64:
; RV32: # %bb.0:		; RV32: # %bb.0:
; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma
; RV32-NEXT: vmv.v.i v9, -1
; RV32-NEXT: vsetvli a0, zero, e64, m1, ta, ma		; RV32-NEXT: vsetvli a0, zero, e64, m1, ta, ma
		; RV32-NEXT: vmv.v.i v9, -1
; RV32-NEXT: vredand.vs v8, v8, v9		; RV32-NEXT: vredand.vs v8, v8, v9
; RV32-NEXT: vmv.x.s a0, v8		; RV32-NEXT: vmv.x.s a0, v8
; RV32-NEXT: li a1, 32		; RV32-NEXT: li a1, 32
; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma		; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma
; RV32-NEXT: vsrl.vx v8, v8, a1		; RV32-NEXT: vsrl.vx v8, v8, a1
; RV32-NEXT: vmv.x.s a1, v8		; RV32-NEXT: vmv.x.s a1, v8
; RV32-NEXT: ret		; RV32-NEXT: ret
;		;
; RV64-LABEL: vreduce_and_nxv1i64:		; RV64-LABEL: vreduce_and_nxv1i64:
; RV64: # %bb.0:		; RV64: # %bb.0:
; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma
; RV64-NEXT: vmv.v.i v9, -1
; RV64-NEXT: vsetvli a0, zero, e64, m1, ta, ma		; RV64-NEXT: vsetvli a0, zero, e64, m1, ta, ma
		; RV64-NEXT: vmv.v.i v9, -1
; RV64-NEXT: vredand.vs v8, v8, v9		; RV64-NEXT: vredand.vs v8, v8, v9
; RV64-NEXT: vmv.x.s a0, v8		; RV64-NEXT: vmv.x.s a0, v8
; RV64-NEXT: ret		; RV64-NEXT: ret
%red = call i64 @llvm.vector.reduce.and.nxv1i64(<vscale x 1 x i64> %v)		%red = call i64 @llvm.vector.reduce.and.nxv1i64(<vscale x 1 x i64> %v)
ret i64 %red		ret i64 %red
}		}

declare i64 @llvm.vector.reduce.or.nxv1i64(<vscale x 1 x i64>)		declare i64 @llvm.vector.reduce.or.nxv1i64(<vscale x 1 x i64>)

define i64 @vreduce_or_nxv1i64(<vscale x 1 x i64> %v) {		define i64 @vreduce_or_nxv1i64(<vscale x 1 x i64> %v) {
; RV32-LABEL: vreduce_or_nxv1i64:		; RV32-LABEL: vreduce_or_nxv1i64:
; RV32: # %bb.0:		; RV32: # %bb.0:
; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma
; RV32-NEXT: vmv.s.x v9, zero
; RV32-NEXT: vsetvli a0, zero, e64, m1, ta, ma		; RV32-NEXT: vsetvli a0, zero, e64, m1, ta, ma
		; RV32-NEXT: vmv.v.i v9, 0
; RV32-NEXT: vredor.vs v8, v8, v9		; RV32-NEXT: vredor.vs v8, v8, v9
; RV32-NEXT: vmv.x.s a0, v8		; RV32-NEXT: vmv.x.s a0, v8
; RV32-NEXT: li a1, 32		; RV32-NEXT: li a1, 32
; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma		; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma
; RV32-NEXT: vsrl.vx v8, v8, a1		; RV32-NEXT: vsrl.vx v8, v8, a1
; RV32-NEXT: vmv.x.s a1, v8		; RV32-NEXT: vmv.x.s a1, v8
; RV32-NEXT: ret		; RV32-NEXT: ret
;		;
; RV64-LABEL: vreduce_or_nxv1i64:		; RV64-LABEL: vreduce_or_nxv1i64:
; RV64: # %bb.0:		; RV64: # %bb.0:
; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma
; RV64-NEXT: vmv.s.x v9, zero
; RV64-NEXT: vsetvli a0, zero, e64, m1, ta, ma		; RV64-NEXT: vsetvli a0, zero, e64, m1, ta, ma
		; RV64-NEXT: vmv.v.i v9, 0
; RV64-NEXT: vredor.vs v8, v8, v9		; RV64-NEXT: vredor.vs v8, v8, v9
; RV64-NEXT: vmv.x.s a0, v8		; RV64-NEXT: vmv.x.s a0, v8
; RV64-NEXT: ret		; RV64-NEXT: ret
%red = call i64 @llvm.vector.reduce.or.nxv1i64(<vscale x 1 x i64> %v)		%red = call i64 @llvm.vector.reduce.or.nxv1i64(<vscale x 1 x i64> %v)
ret i64 %red		ret i64 %red
}		}

declare i64 @llvm.vector.reduce.xor.nxv1i64(<vscale x 1 x i64>)		declare i64 @llvm.vector.reduce.xor.nxv1i64(<vscale x 1 x i64>)

define i64 @vreduce_xor_nxv1i64(<vscale x 1 x i64> %v) {		define i64 @vreduce_xor_nxv1i64(<vscale x 1 x i64> %v) {
; RV32-LABEL: vreduce_xor_nxv1i64:		; RV32-LABEL: vreduce_xor_nxv1i64:
; RV32: # %bb.0:		; RV32: # %bb.0:
; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma
; RV32-NEXT: vmv.s.x v9, zero
; RV32-NEXT: vsetvli a0, zero, e64, m1, ta, ma		; RV32-NEXT: vsetvli a0, zero, e64, m1, ta, ma
		; RV32-NEXT: vmv.v.i v9, 0
; RV32-NEXT: vredxor.vs v8, v8, v9		; RV32-NEXT: vredxor.vs v8, v8, v9
; RV32-NEXT: vmv.x.s a0, v8		; RV32-NEXT: vmv.x.s a0, v8
; RV32-NEXT: li a1, 32		; RV32-NEXT: li a1, 32
; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma		; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma
; RV32-NEXT: vsrl.vx v8, v8, a1		; RV32-NEXT: vsrl.vx v8, v8, a1
; RV32-NEXT: vmv.x.s a1, v8		; RV32-NEXT: vmv.x.s a1, v8
; RV32-NEXT: ret		; RV32-NEXT: ret
;		;
; RV64-LABEL: vreduce_xor_nxv1i64:		; RV64-LABEL: vreduce_xor_nxv1i64:
; RV64: # %bb.0:		; RV64: # %bb.0:
; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma
; RV64-NEXT: vmv.s.x v9, zero
; RV64-NEXT: vsetvli a0, zero, e64, m1, ta, ma		; RV64-NEXT: vsetvli a0, zero, e64, m1, ta, ma
		; RV64-NEXT: vmv.v.i v9, 0
; RV64-NEXT: vredxor.vs v8, v8, v9		; RV64-NEXT: vredxor.vs v8, v8, v9
; RV64-NEXT: vmv.x.s a0, v8		; RV64-NEXT: vmv.x.s a0, v8
; RV64-NEXT: ret		; RV64-NEXT: ret
%red = call i64 @llvm.vector.reduce.xor.nxv1i64(<vscale x 1 x i64> %v)		%red = call i64 @llvm.vector.reduce.xor.nxv1i64(<vscale x 1 x i64> %v)
ret i64 %red		ret i64 %red
}		}

declare i64 @llvm.vector.reduce.add.nxv2i64(<vscale x 2 x i64>)		declare i64 @llvm.vector.reduce.add.nxv2i64(<vscale x 2 x i64>)
▲ Show 20 Lines • Show All 602 Lines • Show Last 20 Lines

This is an archive of the discontinued LLVM Phabricator instance.

[RISCV] Splat scalar to be of length VL instead of 1 for reductions
AbandonedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 474701

llvm/lib/Target/RISCV/RISCVISelLowering.cpp

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-reduction-fp-vp.ll

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-reduction-fp.ll

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-reduction-int-vp.ll

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-reduction-int.ll

llvm/test/CodeGen/RISCV/rvv/fold-binary-reduce.ll

llvm/test/CodeGen/RISCV/rvv/vreductions-fp-sdnode.ll

llvm/test/CodeGen/RISCV/rvv/vreductions-fp-vp.ll

llvm/test/CodeGen/RISCV/rvv/vreductions-int-vp.ll

llvm/test/CodeGen/RISCV/rvv/vreductions-int.ll

This is an archive of the discontinued LLVM Phabricator instance.

[RISCV] Splat scalar to be of length VL instead of 1 for reductionsAbandonedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 474701

llvm/lib/Target/RISCV/RISCVISelLowering.cpp

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-reduction-fp-vp.ll

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-reduction-fp.ll

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-reduction-int-vp.ll

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-reduction-int.ll

llvm/test/CodeGen/RISCV/rvv/fold-binary-reduce.ll

llvm/test/CodeGen/RISCV/rvv/vreductions-fp-sdnode.ll

llvm/test/CodeGen/RISCV/rvv/vreductions-fp-vp.ll

llvm/test/CodeGen/RISCV/rvv/vreductions-int-vp.ll

llvm/test/CodeGen/RISCV/rvv/vreductions-int.ll

[RISCV] Splat scalar to be of length VL instead of 1 for reductions
AbandonedPublic