This is an archive of the discontinued LLVM Phabricator instance.

Paths

Table of Contentst

-
llvm/
-
lib/CodeGen/SelectionDAG/
-
CodeGen/
-
SelectionDAG/
-
LegalizeTypes.h
1/1
LegalizeVectorTypes.cpp
-
test/CodeGen/
-
CodeGen/
-
RISCV/rvv/
-
rvv/
-
fixed-vectors-abs.ll
-
fixed-vectors-extract.ll
-
fixed-vectors-fp.ll
-
fixed-vectors-fp2i.ll
-
fixed-vectors-i2fp.ll
-
fixed-vectors-insert.ll
-
fixed-vectors-int-buildvec.ll
1/2
fixed-vectors-int.ll
-
fixed-vectors-interleaved-access.ll
-
fixed-vectors-load.ll
-
fixed-vectors-store.ll
-
fixed-vectors-vselect.ll
-
VE/Vector/
-
Vector/
-
vec_add.ll
-
vec_and.ll

Differential D148523

[LegalizeTypes][VP] Widen arithmetic ops of fixed length vectors to VP nodes
AbandonedPublic

Authored by luke on Apr 17 2023, 6:12 AM.

Download Raw Diff

Details

Reviewers

fakepaper56
craig.topper
frasercrmck
reames

Summary

If we have a node with an illegal fixed length vector result type that
needs widened, e.g. x:v6i32 = add a, b
Instead of just widening it to: x:v8i32 = add a, b
We can widen it to the equivalent VP operation and set the EVL to the
exact number of elements needed: x:v8i32 = vp_add a, b, mask=true, evl=6
Provided that the target supports the equivalent VP operation on the
widened type.

This patch applies this technique when widening unary, binary and
ternary ops, as well as selects, but there are more
places this could be applied.

This is an extension of https://reviews.llvm.org/D148713

Diff Detail

Repository: rG LLVM Github Monorepo

Event Timeline

luke created this revision.Apr 17 2023, 6:12 AM

Herald added a project: Restricted Project. · View Herald TranscriptApr 17 2023, 6:12 AM

Herald added subscribers: asb, pmatos, luismarques and 19 others. · View Herald Transcript

luke requested review of this revision.Apr 17 2023, 6:12 AM

Herald added a project: Restricted Project. · View Herald TranscriptApr 17 2023, 6:12 AM

Herald added subscribers: llvm-commits, alextsao1999, • pcwang-thead, MaskRay. · View Herald Transcript

Harbormaster completed remote builds in B226076: Diff 514193.Apr 17 2023, 6:12 AM

luke added parent revisions: D148521: [VP] Change getVPForBaseOpcode to return std::optional, D148520: [VP] Add more functional SD opcodes to definitions, D148518: [RISCV] Add tests for illegal fixed length vectors that need widened.Apr 17 2023, 6:13 AM

luke added a child revision: D148524: [RISCV] Check for COPY_TO_REGCLASS in usesAllOnesMask.

luke added inline comments.Apr 17 2023, 6:16 AM

llvm/lib/CodeGen/SelectionDAG/LegalizeVectorTypes.cpp
4320	This was changed so that it can reuse the `ShouldWidenToVP` logic.

Fix optional check

Harbormaster completed remote builds in B226115: Diff 514256.Apr 17 2023, 10:33 AM

Where do non-power of 2 vectors come from?

In D148523#4274636, @craig.topper wrote:

Where do non-power of 2 vectors come from?

Languages like SYCL, OpenCL, and shader languages certainly provide vectors of length 3 (which are usually sized as 4 for allocations and such). I've never seen vector lengths other than 3 in the real world.

I've had a long-standing task in my backlog to see if we can make those 3-element vectors legal in the RISC-V backend for better code. For that reason, I find this patch quite elegant.

I don't know if we want a target override to control this behaviour on top of the legality of the VP operations themselves. Just in case a target has legal VP nodes but prefers the widening for whatever reason. I'd suggest we keep this approach as-is, and let other targets tweak the behaviour if it's not suitable.

In D148523#4277104, @frasercrmck wrote:

In D148523#4274636, @craig.topper wrote:

Where do non-power of 2 vectors come from?

Languages like SYCL, OpenCL, and shader languages certainly provide vectors of length 3 (which are usually sized as 4 for allocations and such). I've never seen vector lengths other than 3 in the real world.

The two cases I had in mind:

If the vector interleave/deinterleave intrinsics are extended to support interleave groups > 2, the loop vectorizer can emit non-power of 2 vectors loads/stores, e.g. 3 groups and a VF of 4 would result in a 12-element load
It might be interesting to explore loosening the restriction on SLP that it must vectorise bundles by powers of 2.

Neither of these actually exist in main yet though. I thought it would be interesting to submit this patch anyway as a proof of concept, and am happy to wait until we have some concrete use cases for it.

I've had a long-standing task in my backlog to see if we can make those 3-element vectors legal in the RISC-V backend for better code.

Credit where credit is due, the basis of this patch came from your comment about fixed-length vectors in https://reviews.llvm.org/D111248!

Do you still remember where were the regressions you saw?
I can confirm that vp_load/vp_store are at least missing one optimisation, in insertelt_v3i64 in fixed-vectors-insert.ll. I'm not sure if it's as a result of not scalarizing or because DAGCombiner doesn't have enough aliasing information.

luke mentioned this in D148518: [RISCV] Add tests for illegal fixed length vectors that need widened.Apr 18 2023, 3:31 AM

Can we split load/stores to their own patch? I'm happy to approve those.

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-int.ll
949	Can't we use a VL=6 vdivu.vv?

I'm a little concerned about the lack of DAG combines on VP nodes. Will using VP prevent optimizations?

In D148523#4278108, @craig.topper wrote:

Can we split load/stores to their own patch? I'm happy to approve those.

Of course, will do.

In D148523#4278114, @craig.topper wrote:

I'm a little concerned about the lack of DAG combines on VP nodes. Will using VP prevent optimizations?

I believe so. Long term I presume we'll have to flesh out https://reviews.llvm.org/D141891 to cover every combine under the sun, which sounds like a lot of work. (This is the "Incrementally lift DAGCombiner to work on VP SDNodes as well as on regular vector instructions." step of the VP roadmap)
(cc @fakepaper56 do you have any other plans to extend the use of VPMatchContext?)

I'll look into the quality of non-combined-VP-widened code vs combined-but-non-VP-widened code in the wild and get back to you on this.

As a side note, I think loads and stores might be the some of the most affected, since FindBetterChain and friends in DAGCombine would need to be updated to reason about aliasing etc. in the presence of VP nodes.

luke added inline comments.Apr 19 2023, 4:52 AM

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-int.ll
949	I think so, this patch just didn't handle the case for ops that can trap like udiv/urem etc.

Split out loads and stores

luke added a parent revision: D148713: [LegalizeTypes][VP] Widen load/store of fixed length vectors to VP ops.Apr 19 2023, 6:54 AM

luke edited the summary of this revision. (Show Details)

luke retitled this revision from [LegalizeTypes][VP] Widen fixed length vectors to VP nodes to [LegalizeTypes][VP] Widen arithmetic ops of fixed length vectors to VP nodes.Jun 6 2023, 2:12 AM

Just a brief update from the last time I visited this patch:
Using VP nodes for unary/binary/ternary ops worked well, but unless we're able to use VP nodes for all nodes in a sequence we end up generating extra vsetvli toggles.
In particular, I haven't been able to come up with a VP equivalent sequence for build_vector nodes, and I'm not sure how possible it will be.

After discussing offline with @reames, I think the issue of reducing the VL of arithmetic ops to match the smaller VLs of memory ops from D148713 might be better handled in the vsetvli pass.

luke mentioned this in D148713: [LegalizeTypes][VP] Widen load/store of fixed length vectors to VP ops.Jun 6 2023, 2:41 AM

luke abandoned this revision.Jun 22 2023, 4:11 AM

Herald added a subscriber: wangpc. · View Herald TranscriptJun 22 2023, 4:11 AM

luke mentioned this in D148524: [RISCV] Check for COPY_TO_REGCLASS in usesAllOnesMask.Jun 29 2023, 4:57 AM

luke mentioned this in D148521: [VP] Change getVPForBaseOpcode to return std::optional.

Revision Contents

Path

Size

llvm/

lib/

CodeGen/

SelectionDAG/

LegalizeTypes.h

7 lines

LegalizeVectorTypes.cpp

186 lines

test/

CodeGen/

RISCV/

rvv/

fixed-vectors-abs.ll

37 lines

fixed-vectors-extract.ll

10 lines

fixed-vectors-fp.ll

1138 lines

fixed-vectors-fp2i.ll

126 lines

fixed-vectors-i2fp.ll

144 lines

fixed-vectors-insert.ll

20 lines

fixed-vectors-int-buildvec.ll

40 lines

fixed-vectors-int.ll

1131 lines

fixed-vectors-interleaved-access.ll

2 lines

fixed-vectors-load.ll

114 lines

fixed-vectors-store.ll

111 lines

fixed-vectors-vselect.ll

126 lines

VE/

Vector/

vec_add.ll

4 lines

vec_and.ll

4 lines

Diff 514193

llvm/lib/CodeGen/SelectionDAG/LegalizeTypes.h

Show First 20 Lines • Show All 1,045 Lines • ▼ Show 20 Lines	private:
/// When FillWithZeroes is "on" the vector will be widened with zeroes.		/// When FillWithZeroes is "on" the vector will be widened with zeroes.
/// By default, the vector will be widened with undefined values.		/// By default, the vector will be widened with undefined values.
SDValue ModifyToType(SDValue InOp, EVT NVT, bool FillWithZeroes = false);		SDValue ModifyToType(SDValue InOp, EVT NVT, bool FillWithZeroes = false);

/// Return a mask of vector type MaskVT to replace InMask. Also adjust		/// Return a mask of vector type MaskVT to replace InMask. Also adjust
/// MaskVT to ToMaskVT if needed with vector extension or truncation.		/// MaskVT to ToMaskVT if needed with vector extension or truncation.
SDValue convertMask(SDValue InMask, EVT MaskVT, EVT ToMaskVT);		SDValue convertMask(SDValue InMask, EVT MaskVT, EVT ToMaskVT);

		/// Return whether or not we should use the equivalent VP node to widen N to
		/// WidenVT. Currently this means if N is already a VP node, or if N is a
		/// fixed length vector and the target supports the equivalent VP node. If we
		/// should widen to a VP node, then returns a tuple of <VP opcode, Mask, EVL>.
		std::optional<std::tuple<unsigned, SDValue, SDValue>>
		ShouldWidenToVP(SDNode *N, EVT WidenVT);

//===--------------------------------------------------------------------===//		//===--------------------------------------------------------------------===//
// Generic Splitting: LegalizeTypesGeneric.cpp		// Generic Splitting: LegalizeTypesGeneric.cpp
//===--------------------------------------------------------------------===//		//===--------------------------------------------------------------------===//

// Legalization methods which only use that the illegal type is split into two		// Legalization methods which only use that the illegal type is split into two
// not necessarily identical types. As such they can be used for splitting		// not necessarily identical types. As such they can be used for splitting
// vectors and expanding integers and floats.		// vectors and expanding integers and floats.

▲ Show 20 Lines • Show All 66 Lines • Show Last 20 Lines

llvm/lib/CodeGen/SelectionDAG/LegalizeVectorTypes.cpp

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 4,179 Lines • ▼ Show 20 Lines

SDValue DAGTypeLegalizer::WidenVecRes_Ternary(SDNode *N) {		SDValue DAGTypeLegalizer::WidenVecRes_Ternary(SDNode *N) {
// Ternary op widening.		// Ternary op widening.
SDLoc dl(N);		SDLoc dl(N);
EVT WidenVT = TLI.getTypeToTransformTo(*DAG.getContext(), N->getValueType(0));		EVT WidenVT = TLI.getTypeToTransformTo(*DAG.getContext(), N->getValueType(0));
SDValue InOp1 = GetWidenedVector(N->getOperand(0));		SDValue InOp1 = GetWidenedVector(N->getOperand(0));
SDValue InOp2 = GetWidenedVector(N->getOperand(1));		SDValue InOp2 = GetWidenedVector(N->getOperand(1));
SDValue InOp3 = GetWidenedVector(N->getOperand(2));		SDValue InOp3 = GetWidenedVector(N->getOperand(2));
if (N->getNumOperands() == 3)
return DAG.getNode(N->getOpcode(), dl, WidenVT, InOp1, InOp2, InOp3);

assert(N->getNumOperands() == 5 && "Unexpected number of operands!");		if (auto VPOps = ShouldWidenToVP(N, WidenVT)) {
assert(N->isVPOpcode() && "Expected VP opcode");		auto [Opcode, Mask, EVL] = *VPOps;
		return DAG.getNode(Opcode, dl, WidenVT, {InOp1, InOp2, InOp3, Mask, EVL});
		}

SDValue Mask =		return DAG.getNode(N->getOpcode(), dl, WidenVT, InOp1, InOp2, InOp3);
GetWidenedMask(N->getOperand(3), WidenVT.getVectorElementCount());
return DAG.getNode(N->getOpcode(), dl, WidenVT,
{InOp1, InOp2, InOp3, Mask, N->getOperand(4)});
}		}

SDValue DAGTypeLegalizer::WidenVecRes_Binary(SDNode *N) {		SDValue DAGTypeLegalizer::WidenVecRes_Binary(SDNode *N) {
// Binary op widening.		// Binary op widening.
SDLoc dl(N);		SDLoc dl(N);
EVT WidenVT = TLI.getTypeToTransformTo(*DAG.getContext(), N->getValueType(0));		EVT WidenVT = TLI.getTypeToTransformTo(*DAG.getContext(), N->getValueType(0));
SDValue InOp1 = GetWidenedVector(N->getOperand(0));		SDValue InOp1 = GetWidenedVector(N->getOperand(0));
SDValue InOp2 = GetWidenedVector(N->getOperand(1));		SDValue InOp2 = GetWidenedVector(N->getOperand(1));
if (N->getNumOperands() == 2)
return DAG.getNode(N->getOpcode(), dl, WidenVT, InOp1, InOp2,
N->getFlags());

assert(N->getNumOperands() == 4 && "Unexpected number of operands!");		if (auto VPOps = ShouldWidenToVP(N, WidenVT)) {
assert(N->isVPOpcode() && "Expected VP opcode");		auto [Opcode, Mask, EVL] = *VPOps;
		return DAG.getNode(Opcode, dl, WidenVT, {InOp1, InOp2, Mask, EVL},
		N->getFlags());
		}

SDValue Mask =		return DAG.getNode(N->getOpcode(), dl, WidenVT, InOp1, InOp2, N->getFlags());
GetWidenedMask(N->getOperand(2), WidenVT.getVectorElementCount());
return DAG.getNode(N->getOpcode(), dl, WidenVT,
{InOp1, InOp2, Mask, N->getOperand(3)}, N->getFlags());
}		}

SDValue DAGTypeLegalizer::WidenVecRes_BinaryWithExtraScalarOp(SDNode *N) {		SDValue DAGTypeLegalizer::WidenVecRes_BinaryWithExtraScalarOp(SDNode *N) {
// Binary op widening, but with an extra operand that shouldn't be widened.		// Binary op widening, but with an extra operand that shouldn't be widened.
SDLoc dl(N);		SDLoc dl(N);
EVT WidenVT = TLI.getTypeToTransformTo(*DAG.getContext(), N->getValueType(0));		EVT WidenVT = TLI.getTypeToTransformTo(*DAG.getContext(), N->getValueType(0));
SDValue InOp1 = GetWidenedVector(N->getOperand(0));		SDValue InOp1 = GetWidenedVector(N->getOperand(0));
SDValue InOp2 = GetWidenedVector(N->getOperand(1));		SDValue InOp2 = GetWidenedVector(N->getOperand(1));
▲ Show 20 Lines • Show All 93 Lines • ▼ Show 20 Lines	SDValue DAGTypeLegalizer::WidenVecRes_BinaryCanTrap(SDNode *N) {
const SDNodeFlags Flags = N->getFlags();		const SDNodeFlags Flags = N->getFlags();
while (!TLI.isTypeLegal(VT) && NumElts != 1) {		while (!TLI.isTypeLegal(VT) && NumElts != 1) {
NumElts = NumElts / 2;		NumElts = NumElts / 2;
VT = EVT::getVectorVT(*DAG.getContext(), WidenEltVT, NumElts);		VT = EVT::getVectorVT(*DAG.getContext(), WidenEltVT, NumElts);
}		}

if (NumElts != 1 && !TLI.canOpTrap(N->getOpcode(), VT)) {		if (NumElts != 1 && !TLI.canOpTrap(N->getOpcode(), VT)) {
// Operation doesn't trap so just widen as normal.		// Operation doesn't trap so just widen as normal.
SDValue InOp1 = GetWidenedVector(N->getOperand(0));		return WidenVecRes_Binary(N);
		lukeAuthorUnsubmitted Done Reply Inline Actions This was changed so that it can reuse the `ShouldWidenToVP` logic. luke: This was changed so that it can reuse the `ShouldWidenToVP` logic.
SDValue InOp2 = GetWidenedVector(N->getOperand(1));
return DAG.getNode(N->getOpcode(), dl, WidenVT, InOp1, InOp2, Flags);
}		}

// FIXME: Improve support for scalable vectors.		// FIXME: Improve support for scalable vectors.
assert(!VT.isScalableVector() && "Scalable vectors not handled yet.");		assert(!VT.isScalableVector() && "Scalable vectors not handled yet.");

// No legal vector version so unroll the vector operation and then widen.		// No legal vector version so unroll the vector operation and then widen.
if (NumElts == 1)		if (NumElts == 1)
return DAG.UnrollVectorOp(N, WidenVT.getVectorNumElements());		return DAG.UnrollVectorOp(N, WidenVT.getVectorNumElements());
▲ Show 20 Lines • Show All 247 Lines • ▼ Show 20 Lines	SDValue DAGTypeLegalizer::WidenVecRes_Convert(SDNode *N) {
EVT InWidenVT = EVT::getVectorVT(Ctx, InEltVT, WidenEC);		EVT InWidenVT = EVT::getVectorVT(Ctx, InEltVT, WidenEC);
ElementCount InVTEC = InVT.getVectorElementCount();		ElementCount InVTEC = InVT.getVectorElementCount();

if (getTypeAction(InVT) == TargetLowering::TypeWidenVector) {		if (getTypeAction(InVT) == TargetLowering::TypeWidenVector) {
InOp = GetWidenedVector(N->getOperand(0));		InOp = GetWidenedVector(N->getOperand(0));
InVT = InOp.getValueType();		InVT = InOp.getValueType();
InVTEC = InVT.getVectorElementCount();		InVTEC = InVT.getVectorElementCount();
if (InVTEC == WidenEC) {		if (InVTEC == WidenEC) {
		if (auto VPOps = ShouldWidenToVP(N, WidenVT)) {
		auto [Opcode, Mask, EVL] = *VPOps;
		return DAG.getNode(Opcode, DL, WidenVT, InOp, Mask, EVL);
		}
if (N->getNumOperands() == 1)		if (N->getNumOperands() == 1)
return DAG.getNode(Opcode, DL, WidenVT, InOp);		return DAG.getNode(Opcode, DL, WidenVT, InOp);
if (N->getNumOperands() == 3) {
assert(N->isVPOpcode() && "Expected VP opcode");
SDValue Mask =
GetWidenedMask(N->getOperand(1), WidenVT.getVectorElementCount());
return DAG.getNode(Opcode, DL, WidenVT, InOp, Mask, N->getOperand(2));
}
return DAG.getNode(Opcode, DL, WidenVT, InOp, N->getOperand(1), Flags);		return DAG.getNode(Opcode, DL, WidenVT, InOp, N->getOperand(1), Flags);
}		}
if (WidenVT.getSizeInBits() == InVT.getSizeInBits()) {		if (WidenVT.getSizeInBits() == InVT.getSizeInBits()) {
// If both input and result vector types are of same width, extend		// If both input and result vector types are of same width, extend
// operations should be done with SIGN/ZERO_EXTEND_VECTOR_INREG, which		// operations should be done with SIGN/ZERO_EXTEND_VECTOR_INREG, which
// accepts fewer elements in the result than in the input.		// accepts fewer elements in the result than in the input.
if (Opcode == ISD::ANY_EXTEND)		if (Opcode == ISD::ANY_EXTEND)
return DAG.getNode(ISD::ANY_EXTEND_VECTOR_INREG, DL, WidenVT, InOp);		return DAG.getNode(ISD::ANY_EXTEND_VECTOR_INREG, DL, WidenVT, InOp);
▲ Show 20 Lines • Show All 182 Lines • ▼ Show 20 Lines

SDValue DAGTypeLegalizer::WidenVecRes_POWI(SDNode *N) {		SDValue DAGTypeLegalizer::WidenVecRes_POWI(SDNode *N) {
EVT WidenVT = TLI.getTypeToTransformTo(*DAG.getContext(), N->getValueType(0));		EVT WidenVT = TLI.getTypeToTransformTo(*DAG.getContext(), N->getValueType(0));
SDValue InOp = GetWidenedVector(N->getOperand(0));		SDValue InOp = GetWidenedVector(N->getOperand(0));
SDValue ShOp = N->getOperand(1);		SDValue ShOp = N->getOperand(1);
return DAG.getNode(N->getOpcode(), SDLoc(N), WidenVT, InOp, ShOp);		return DAG.getNode(N->getOpcode(), SDLoc(N), WidenVT, InOp, ShOp);
}		}

		std::optional<std::tuple<unsigned, SDValue, SDValue>>
		DAGTypeLegalizer::ShouldWidenToVP(SDNode *N, EVT WidenVT) {
		SDLoc DL(N);
		unsigned Opcode;
		SDValue EVL, Mask;
		if (N->isVPOpcode()) {
		// If we need to widen a VP operation, widen the mask and keep the EVL as
		// normal.
		Opcode = N->getOpcode();
		if (auto MaskIdx = ISD::getVPMaskIdx(Opcode))
		Mask = GetWidenedMask(N->getOperand(*MaskIdx),
		WidenVT.getVectorElementCount());
		if (auto EVLIdx = ISD::getVPExplicitVectorLengthIdx(Opcode))
		EVL = N->getOperand(*EVLIdx);
		} else if (auto VPOpc = ISD::getVPForBaseOpcode(N->getOpcode());
		WidenVT.isFixedLengthVector() &&
		TLI.isOperationLegalOrCustom(*VPOpc, WidenVT)) {
		// Or if we have an illegal fixed length vector that needs to be widened,
		// and the target supports the equivalent VP operation, use that instead and
		// set the EVL to the exact number of elements needed.
		Opcode = *VPOpc;
		EVT WideMaskVT = EVT::getVectorVT(*DAG.getContext(), MVT::i1,
		WidenVT.getVectorNumElements());
		Mask = DAG.getAllOnesConstant(DL, WideMaskVT);
		unsigned NumElts = N->getValueType(0).getVectorNumElements();
		EVL = DAG.getConstant(NumElts, DL, TLI.getVPExplicitVectorLengthTy());
		} else {
		// Otherwise, don't widen to a VP operation.
		return std::nullopt;
		}

		return std::make_tuple(Opcode, Mask, EVL);
		}

SDValue DAGTypeLegalizer::WidenVecRes_Unary(SDNode *N) {		SDValue DAGTypeLegalizer::WidenVecRes_Unary(SDNode *N) {
// Unary op widening.		// Unary op widening.
EVT WidenVT = TLI.getTypeToTransformTo(*DAG.getContext(), N->getValueType(0));		EVT WidenVT = TLI.getTypeToTransformTo(*DAG.getContext(), N->getValueType(0));
SDValue InOp = GetWidenedVector(N->getOperand(0));		SDValue InOp = GetWidenedVector(N->getOperand(0));
if (N->getNumOperands() == 1)		if (auto VPOps = ShouldWidenToVP(N, WidenVT)) {
		auto [Opcode, Mask, EVL] = *VPOps;
		return DAG.getNode(Opcode, SDLoc(N), WidenVT, {InOp, Mask, EVL});
		}
return DAG.getNode(N->getOpcode(), SDLoc(N), WidenVT, InOp);		return DAG.getNode(N->getOpcode(), SDLoc(N), WidenVT, InOp);

assert(N->getNumOperands() == 3 && "Unexpected number of operands!");
assert(N->isVPOpcode() && "Expected VP opcode");

SDValue Mask =
GetWidenedMask(N->getOperand(1), WidenVT.getVectorElementCount());
return DAG.getNode(N->getOpcode(), SDLoc(N), WidenVT,
{InOp, Mask, N->getOperand(2)});
}		}

SDValue DAGTypeLegalizer::WidenVecRes_InregOp(SDNode *N) {		SDValue DAGTypeLegalizer::WidenVecRes_InregOp(SDNode *N) {
EVT WidenVT = TLI.getTypeToTransformTo(*DAG.getContext(), N->getValueType(0));		EVT WidenVT = TLI.getTypeToTransformTo(*DAG.getContext(), N->getValueType(0));
EVT ExtVT = EVT::getVectorVT(*DAG.getContext(),		EVT ExtVT = EVT::getVectorVT(*DAG.getContext(),
cast<VTSDNode>(N->getOperand(1))->getVT()		cast<VTSDNode>(N->getOperand(1))->getVT()
.getVectorElementType(),		.getVectorElementType(),
WidenVT.getVectorNumElements());		WidenVT.getVectorNumElements());
▲ Show 20 Lines • Show All 326 Lines • ▼ Show 20 Lines	SDValue DAGTypeLegalizer::WidenVecRes_LOAD(SDNode *N) {
if (!LD->getMemoryVT().isByteSized()) {		if (!LD->getMemoryVT().isByteSized()) {
SDValue Value, NewChain;		SDValue Value, NewChain;
std::tie(Value, NewChain) = TLI.scalarizeVectorLoad(LD, DAG);		std::tie(Value, NewChain) = TLI.scalarizeVectorLoad(LD, DAG);
ReplaceValueWith(SDValue(LD, 0), Value);		ReplaceValueWith(SDValue(LD, 0), Value);
ReplaceValueWith(SDValue(LD, 1), NewChain);		ReplaceValueWith(SDValue(LD, 1), NewChain);
return SDValue();		return SDValue();
}		}

SDValue Result;
SmallVector<SDValue, 16> LdChain; // Chain for the series of load
if (ExtType != ISD::NON_EXTLOAD)
Result = GenWidenVectorExtLoads(LdChain, LD, ExtType);
else
Result = GenWidenVectorLoads(LdChain, LD);

if (Result) {
// If we generate a single load, we can use that for the chain. Otherwise,
// build a factor node to remember the multiple loads are independent and
// chain to that.
SDValue NewChain;
if (LdChain.size() == 1)
NewChain = LdChain[0];
else
NewChain = DAG.getNode(ISD::TokenFactor, SDLoc(LD), MVT::Other, LdChain);

// Modified the chain - switch anything that used the old chain to use
// the new one.
ReplaceValueWith(SDValue(N, 1), NewChain);

return Result;
}

// Generate a vector-predicated load if it is custom/legal on the target. To		// Generate a vector-predicated load if it is custom/legal on the target. To
// avoid possible recursion, only do this if the widened mask type is legal.		// avoid possible recursion, only do this if the widened mask type is legal.
// FIXME: Not all targets may support EVL in VP_LOAD. These will have been		// FIXME: Not all targets may support EVL in VP_LOAD. These will have been
// removed from the IR by the ExpandVectorPredication pass but we're		// removed from the IR by the ExpandVectorPredication pass but we're
// reintroducing them here.		// reintroducing them here.
EVT LdVT = LD->getMemoryVT();		EVT LdVT = LD->getMemoryVT();
EVT WideVT = TLI.getTypeToTransformTo(*DAG.getContext(), LdVT);		EVT WideVT = TLI.getTypeToTransformTo(*DAG.getContext(), LdVT);
EVT WideMaskVT = EVT::getVectorVT(*DAG.getContext(), MVT::i1,		EVT WideMaskVT = EVT::getVectorVT(*DAG.getContext(), MVT::i1,
WideVT.getVectorElementCount());		WideVT.getVectorElementCount());
if (ExtType == ISD::NON_EXTLOAD && WideVT.isScalableVector() &&		if (ExtType == ISD::NON_EXTLOAD &&
TLI.isOperationLegalOrCustom(ISD::VP_LOAD, WideVT) &&		TLI.isOperationLegalOrCustom(ISD::VP_LOAD, WideVT) &&
TLI.isTypeLegal(WideMaskVT)) {		TLI.isTypeLegal(WideMaskVT)) {
SDLoc DL(N);		SDLoc DL(N);
SDValue Mask = DAG.getAllOnesConstant(DL, WideMaskVT);		SDValue Mask = DAG.getAllOnesConstant(DL, WideMaskVT);
MVT EVLVT = TLI.getVPExplicitVectorLengthTy();		MVT EVLVT = TLI.getVPExplicitVectorLengthTy();
unsigned NumVTElts = LdVT.getVectorMinNumElements();		unsigned NumVTElts = LdVT.getVectorMinNumElements();
SDValue EVL =		SDValue EVL;
DAG.getVScale(DL, EVLVT, APInt(EVLVT.getScalarSizeInBits(), NumVTElts));		if (LdVT.isScalableVector())
		EVL = DAG.getVScale(DL, EVLVT,
		APInt(EVLVT.getScalarSizeInBits(), NumVTElts));
		else
		EVL = DAG.getConstant(NumVTElts, DL, EVLVT);
const auto *MMO = LD->getMemOperand();		const auto *MMO = LD->getMemOperand();
SDValue NewLoad =		SDValue NewLoad =
DAG.getLoadVP(WideVT, DL, LD->getChain(), LD->getBasePtr(), Mask, EVL,		DAG.getLoadVP(WideVT, DL, LD->getChain(), LD->getBasePtr(), Mask, EVL,
MMO->getPointerInfo(), MMO->getAlign(), MMO->getFlags(),		MMO->getPointerInfo(), MMO->getAlign(), MMO->getFlags(),
MMO->getAAInfo());		MMO->getAAInfo());

// Modified the chain - switch anything that used the old chain to use		// Modified the chain - switch anything that used the old chain to use
// the new one.		// the new one.
ReplaceValueWith(SDValue(N, 1), NewLoad.getValue(1));		ReplaceValueWith(SDValue(N, 1), NewLoad.getValue(1));

return NewLoad;		return NewLoad;
}		}

		SDValue Result;
		SmallVector<SDValue, 16> LdChain; // Chain for the series of load
		if (ExtType != ISD::NON_EXTLOAD)
		Result = GenWidenVectorExtLoads(LdChain, LD, ExtType);
		else
		Result = GenWidenVectorLoads(LdChain, LD);

		if (Result) {
		// If we generate a single load, we can use that for the chain. Otherwise,
		// build a factor node to remember the multiple loads are independent and
		// chain to that.
		SDValue NewChain;
		if (LdChain.size() == 1)
		NewChain = LdChain[0];
		else
		NewChain = DAG.getNode(ISD::TokenFactor, SDLoc(LD), MVT::Other, LdChain);

		// Modified the chain - switch anything that used the old chain to use
		// the new one.
		ReplaceValueWith(SDValue(N, 1), NewChain);

		return Result;
		}

report_fatal_error("Unable to widen vector load");		report_fatal_error("Unable to widen vector load");
}		}

SDValue DAGTypeLegalizer::WidenVecRes_VP_LOAD(VPLoadSDNode *N) {		SDValue DAGTypeLegalizer::WidenVecRes_VP_LOAD(VPLoadSDNode *N) {
EVT WidenVT = TLI.getTypeToTransformTo(*DAG.getContext(), N->getValueType(0));		EVT WidenVT = TLI.getTypeToTransformTo(*DAG.getContext(), N->getValueType(0));
SDValue Mask = N->getMask();		SDValue Mask = N->getMask();
SDValue EVL = N->getVectorLength();		SDValue EVL = N->getVectorLength();
ISD::LoadExtType ExtType = N->getExtensionType();		ISD::LoadExtType ExtType = N->getExtensionType();
▲ Show 20 Lines • Show All 398 Lines • ▼ Show 20 Lines	if (CondVT.isVector()) {

if (Cond1.getValueType() != CondWidenVT)		if (Cond1.getValueType() != CondWidenVT)
Cond1 = ModifyToType(Cond1, CondWidenVT);		Cond1 = ModifyToType(Cond1, CondWidenVT);
}		}

SDValue InOp1 = GetWidenedVector(N->getOperand(1));		SDValue InOp1 = GetWidenedVector(N->getOperand(1));
SDValue InOp2 = GetWidenedVector(N->getOperand(2));		SDValue InOp2 = GetWidenedVector(N->getOperand(2));
assert(InOp1.getValueType() == WidenVT && InOp2.getValueType() == WidenVT);		assert(InOp1.getValueType() == WidenVT && InOp2.getValueType() == WidenVT);
if (Opcode == ISD::VP_SELECT \|\| Opcode == ISD::VP_MERGE)		if (auto VPOps = ShouldWidenToVP(N, WidenVT)) {
return DAG.getNode(Opcode, SDLoc(N), WidenVT, Cond1, InOp1, InOp2,		auto [Opcode, _, EVL] = *VPOps;
N->getOperand(3));		return DAG.getNode(Opcode, SDLoc(N), WidenVT, Cond1, InOp1, InOp2, EVL);
		}
return DAG.getNode(Opcode, SDLoc(N), WidenVT, Cond1, InOp1, InOp2);		return DAG.getNode(Opcode, SDLoc(N), WidenVT, Cond1, InOp1, InOp2);
}		}

SDValue DAGTypeLegalizer::WidenVecRes_SELECT_CC(SDNode *N) {		SDValue DAGTypeLegalizer::WidenVecRes_SELECT_CC(SDNode *N) {
SDValue InOp1 = GetWidenedVector(N->getOperand(2));		SDValue InOp1 = GetWidenedVector(N->getOperand(2));
SDValue InOp2 = GetWidenedVector(N->getOperand(3));		SDValue InOp2 = GetWidenedVector(N->getOperand(3));
return DAG.getNode(ISD::SELECT_CC, SDLoc(N),		return DAG.getNode(ISD::SELECT_CC, SDLoc(N),
InOp1.getValueType(), N->getOperand(0),		InOp1.getValueType(), N->getOperand(0),
▲ Show 20 Lines • Show All 599 Lines • ▼ Show 20 Lines	SDValue DAGTypeLegalizer::WidenVecOp_STORE(SDNode *N) {
StoreSDNode *ST = cast<StoreSDNode>(N);		StoreSDNode *ST = cast<StoreSDNode>(N);

if (!ST->getMemoryVT().getScalarType().isByteSized())		if (!ST->getMemoryVT().getScalarType().isByteSized())
return TLI.scalarizeVectorStore(ST, DAG);		return TLI.scalarizeVectorStore(ST, DAG);

if (ST->isTruncatingStore())		if (ST->isTruncatingStore())
return TLI.scalarizeVectorStore(ST, DAG);		return TLI.scalarizeVectorStore(ST, DAG);

SmallVector<SDValue, 16> StChain;
if (GenWidenVectorStores(StChain, ST)) {
if (StChain.size() == 1)
return StChain[0];

return DAG.getNode(ISD::TokenFactor, SDLoc(ST), MVT::Other, StChain);
}

// Generate a vector-predicated store if it is custom/legal on the target.		// Generate a vector-predicated store if it is custom/legal on the target.
// To avoid possible recursion, only do this if the widened mask type is		// To avoid possible recursion, only do this if the widened mask type is
// legal.		// legal.
// FIXME: Not all targets may support EVL in VP_STORE. These will have been		// FIXME: Not all targets may support EVL in VP_STORE. These will have been
// removed from the IR by the ExpandVectorPredication pass but we're		// removed from the IR by the ExpandVectorPredication pass but we're
// reintroducing them here.		// reintroducing them here.
SDValue StVal = ST->getValue();		SDValue StVal = ST->getValue();
EVT StVT = StVal.getValueType();		EVT StVT = StVal.getValueType();
EVT WideVT = TLI.getTypeToTransformTo(*DAG.getContext(), StVT);		EVT WideVT = TLI.getTypeToTransformTo(*DAG.getContext(), StVT);
EVT WideMaskVT = EVT::getVectorVT(*DAG.getContext(), MVT::i1,		EVT WideMaskVT = EVT::getVectorVT(*DAG.getContext(), MVT::i1,
WideVT.getVectorElementCount());		WideVT.getVectorElementCount());
if (WideVT.isScalableVector() &&
TLI.isOperationLegalOrCustom(ISD::VP_STORE, WideVT) &&		if (TLI.isOperationLegalOrCustom(ISD::VP_STORE, WideVT) &&
TLI.isTypeLegal(WideMaskVT)) {		TLI.isTypeLegal(WideMaskVT)) {
// Widen the value.		// Widen the value.
SDLoc DL(N);		SDLoc DL(N);
StVal = GetWidenedVector(StVal);		StVal = GetWidenedVector(StVal);
SDValue Mask = DAG.getAllOnesConstant(DL, WideMaskVT);		SDValue Mask = DAG.getAllOnesConstant(DL, WideMaskVT);
MVT EVLVT = TLI.getVPExplicitVectorLengthTy();		MVT EVLVT = TLI.getVPExplicitVectorLengthTy();
unsigned NumVTElts = StVT.getVectorMinNumElements();		unsigned NumVTElts = StVT.getVectorMinNumElements();
SDValue EVL =		SDValue EVL;
DAG.getVScale(DL, EVLVT, APInt(EVLVT.getScalarSizeInBits(), NumVTElts));		if (StVT.isScalableVector())
		EVL = DAG.getVScale(DL, EVLVT,
		APInt(EVLVT.getScalarSizeInBits(), NumVTElts));
		else
		EVL = DAG.getConstant(NumVTElts, DL, EVLVT);
return DAG.getStoreVP(ST->getChain(), DL, StVal, ST->getBasePtr(),		return DAG.getStoreVP(ST->getChain(), DL, StVal, ST->getBasePtr(),
DAG.getUNDEF(ST->getBasePtr().getValueType()), Mask,		DAG.getUNDEF(ST->getBasePtr().getValueType()), Mask,
EVL, StVal.getValueType(), ST->getMemOperand(),		EVL, StVT, ST->getMemOperand(),
ST->getAddressingMode());		ST->getAddressingMode());
}		}

		SmallVector<SDValue, 16> StChain;
		if (GenWidenVectorStores(StChain, ST)) {
		if (StChain.size() == 1)
		return StChain[0];

		return DAG.getNode(ISD::TokenFactor, SDLoc(ST), MVT::Other, StChain);
		}

report_fatal_error("Unable to widen vector store");		report_fatal_error("Unable to widen vector store");
}		}

SDValue DAGTypeLegalizer::WidenVecOp_VP_STORE(SDNode *N, unsigned OpNo) {		SDValue DAGTypeLegalizer::WidenVecOp_VP_STORE(SDNode *N, unsigned OpNo) {
assert((OpNo == 1 \|\| OpNo == 3) &&		assert((OpNo == 1 \|\| OpNo == 3) &&
"Can widen only data or mask operand of vp_store");		"Can widen only data or mask operand of vp_store");
VPStoreSDNode *ST = cast<VPStoreSDNode>(N);		VPStoreSDNode *ST = cast<VPStoreSDNode>(N);
SDValue Mask = ST->getMask();		SDValue Mask = ST->getMask();
▲ Show 20 Lines • Show All 869 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-abs.ll

Show All 31 Lines	; CHECK-NEXT: ret
%a = load <8 x i16>, ptr %x		%a = load <8 x i16>, ptr %x
%b = call <8 x i16> @llvm.abs.v8i16(<8 x i16> %a, i1 false)		%b = call <8 x i16> @llvm.abs.v8i16(<8 x i16> %a, i1 false)
store <8 x i16> %b, ptr %x		store <8 x i16> %b, ptr %x
ret void		ret void
}		}
declare <8 x i16> @llvm.abs.v8i16(<8 x i16>, i1)		declare <8 x i16> @llvm.abs.v8i16(<8 x i16>, i1)

define void @abs_v6i16(ptr %x) {		define void @abs_v6i16(ptr %x) {
; LMULMAX1-RV32-LABEL: abs_v6i16:		; CHECK-LABEL: abs_v6i16:
; LMULMAX1-RV32: # %bb.0:		; CHECK: # %bb.0:
; LMULMAX1-RV32-NEXT: vsetivli zero, 8, e16, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, ma
; LMULMAX1-RV32-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vmset.m v0
; LMULMAX1-RV32-NEXT: vrsub.vi v9, v8, 0		; CHECK-NEXT: vsetivli zero, 6, e16, m1, ta, ma
; LMULMAX1-RV32-NEXT: vmax.vv v8, v8, v9		; CHECK-NEXT: vle16.v v8, (a0)
; LMULMAX1-RV32-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vrsub.vi v9, v8, 0, v0.t
; LMULMAX1-RV32-NEXT: vslidedown.vi v9, v8, 2		; CHECK-NEXT: vmax.vv v8, v8, v9, v0.t
; LMULMAX1-RV32-NEXT: addi a1, a0, 8		; CHECK-NEXT: vse16.v v8, (a0)
; LMULMAX1-RV32-NEXT: vse32.v v9, (a1)		; CHECK-NEXT: ret
; LMULMAX1-RV32-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
; LMULMAX1-RV32-NEXT: vse16.v v8, (a0)
; LMULMAX1-RV32-NEXT: ret
;
; LMULMAX1-RV64-LABEL: abs_v6i16:
; LMULMAX1-RV64: # %bb.0:
; LMULMAX1-RV64-NEXT: vsetivli zero, 8, e16, m1, ta, ma
; LMULMAX1-RV64-NEXT: vle16.v v8, (a0)
; LMULMAX1-RV64-NEXT: vrsub.vi v9, v8, 0
; LMULMAX1-RV64-NEXT: vmax.vv v8, v8, v9
; LMULMAX1-RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma
; LMULMAX1-RV64-NEXT: vse64.v v8, (a0)
; LMULMAX1-RV64-NEXT: vsetivli zero, 1, e32, m1, ta, ma
; LMULMAX1-RV64-NEXT: vslidedown.vi v8, v8, 2
; LMULMAX1-RV64-NEXT: addi a0, a0, 8
; LMULMAX1-RV64-NEXT: vse32.v v8, (a0)
; LMULMAX1-RV64-NEXT: ret
%a = load <6 x i16>, ptr %x		%a = load <6 x i16>, ptr %x
%b = call <6 x i16> @llvm.abs.v6i16(<6 x i16> %a, i1 false)		%b = call <6 x i16> @llvm.abs.v6i16(<6 x i16> %a, i1 false)
store <6 x i16> %b, ptr %x		store <6 x i16> %b, ptr %x
ret void		ret void
}		}
declare <6 x i16> @llvm.abs.v6i16(<6 x i16>, i1)		declare <6 x i16> @llvm.abs.v6i16(<6 x i16>, i1)

define void @abs_v4i32(ptr %x) {		define void @abs_v4i32(ptr %x) {
▲ Show 20 Lines • Show All 207 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-extract.ll

	Show First 20 Lines • Show All 219 Lines • ▼ Show 20 Lines

	; This uses a non-power of 2 type so that it isn't an MVT to catch an			; This uses a non-power of 2 type so that it isn't an MVT to catch an
	; incorrect use of getSimpleValueType().			; incorrect use of getSimpleValueType().
	; NOTE: Type legalization is bitcasting to vXi32 and doing 2 independent			; NOTE: Type legalization is bitcasting to vXi32 and doing 2 independent
	; slidedowns and extracts.			; slidedowns and extracts.
	define i64 @extractelt_v3i64(ptr %x) nounwind {			define i64 @extractelt_v3i64(ptr %x) nounwind {
	; RV32-LABEL: extractelt_v3i64:			; RV32-LABEL: extractelt_v3i64:
	; RV32: # %bb.0:			; RV32: # %bb.0:
	; RV32-NEXT: vsetivli zero, 8, e32, m2, ta, ma			; RV32-NEXT: vsetivli zero, 3, e64, m2, ta, ma
	; RV32-NEXT: vle32.v v8, (a0)			; RV32-NEXT: vle64.v v8, (a0)
	; RV32-NEXT: vsetivli zero, 1, e32, m2, ta, ma			; RV32-NEXT: vsetivli zero, 1, e32, m2, ta, ma
	; RV32-NEXT: vslidedown.vi v10, v8, 4			; RV32-NEXT: vslidedown.vi v10, v8, 4
	; RV32-NEXT: vmv.x.s a0, v10			; RV32-NEXT: vmv.x.s a0, v10
	; RV32-NEXT: vslidedown.vi v8, v8, 5			; RV32-NEXT: vslidedown.vi v8, v8, 5
	; RV32-NEXT: vmv.x.s a1, v8			; RV32-NEXT: vmv.x.s a1, v8
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: extractelt_v3i64:			; RV64-LABEL: extractelt_v3i64:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: vsetivli zero, 4, e64, m2, ta, ma			; RV64-NEXT: vsetivli zero, 3, e64, m2, ta, ma
	; RV64-NEXT: vle64.v v8, (a0)			; RV64-NEXT: vle64.v v8, (a0)
	; RV64-NEXT: vsetivli zero, 1, e64, m2, ta, ma			; RV64-NEXT: vsetivli zero, 1, e64, m2, ta, ma
	; RV64-NEXT: vslidedown.vi v8, v8, 2			; RV64-NEXT: vslidedown.vi v8, v8, 2
	; RV64-NEXT: vmv.x.s a0, v8			; RV64-NEXT: vmv.x.s a0, v8
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%a = load <3 x i64>, ptr %x			%a = load <3 x i64>, ptr %x
	%b = extractelement <3 x i64> %a, i32 2			%b = extractelement <3 x i64> %a, i32 2
	ret i64 %b			ret i64 %b
	▲ Show 20 Lines • Show All 244 Lines • ▼ Show 20 Lines

	; This uses a non-power of 2 type so that it isn't an MVT to catch an			; This uses a non-power of 2 type so that it isn't an MVT to catch an
	; incorrect use of getSimpleValueType_idx(, i32 zeroext %idx).			; incorrect use of getSimpleValueType_idx(, i32 zeroext %idx).
	; NOTE: Type legalization is bitcasting to vXi32 and doing 2 independent			; NOTE: Type legalization is bitcasting to vXi32 and doing 2 independent
	; slidedowns and extracts.			; slidedowns and extracts.
	define i64 @extractelt_v3i64_idx(ptr %x, i32 zeroext %idx) nounwind {			define i64 @extractelt_v3i64_idx(ptr %x, i32 zeroext %idx) nounwind {
	; RV32-LABEL: extractelt_v3i64_idx:			; RV32-LABEL: extractelt_v3i64_idx:
	; RV32: # %bb.0:			; RV32: # %bb.0:
	; RV32-NEXT: vsetivli zero, 4, e64, m2, ta, ma			; RV32-NEXT: vsetivli zero, 3, e64, m2, ta, ma
	; RV32-NEXT: vle64.v v8, (a0)			; RV32-NEXT: vle64.v v8, (a0)
	; RV32-NEXT: vadd.vv v8, v8, v8			; RV32-NEXT: vadd.vv v8, v8, v8
	; RV32-NEXT: add a1, a1, a1			; RV32-NEXT: add a1, a1, a1
	; RV32-NEXT: vsetivli zero, 1, e32, m2, ta, ma			; RV32-NEXT: vsetivli zero, 1, e32, m2, ta, ma
	; RV32-NEXT: vslidedown.vx v10, v8, a1			; RV32-NEXT: vslidedown.vx v10, v8, a1
	; RV32-NEXT: vmv.x.s a0, v10			; RV32-NEXT: vmv.x.s a0, v10
	; RV32-NEXT: addi a1, a1, 1			; RV32-NEXT: addi a1, a1, 1
	; RV32-NEXT: vslidedown.vx v8, v8, a1			; RV32-NEXT: vslidedown.vx v8, v8, a1
	; RV32-NEXT: vmv.x.s a1, v8			; RV32-NEXT: vmv.x.s a1, v8
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: extractelt_v3i64_idx:			; RV64-LABEL: extractelt_v3i64_idx:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: vsetivli zero, 4, e64, m2, ta, ma			; RV64-NEXT: vsetivli zero, 3, e64, m2, ta, ma
	; RV64-NEXT: vle64.v v8, (a0)			; RV64-NEXT: vle64.v v8, (a0)
	; RV64-NEXT: vadd.vv v8, v8, v8			; RV64-NEXT: vadd.vv v8, v8, v8
	; RV64-NEXT: vsetivli zero, 1, e64, m2, ta, ma			; RV64-NEXT: vsetivli zero, 1, e64, m2, ta, ma
	; RV64-NEXT: vslidedown.vx v8, v8, a1			; RV64-NEXT: vslidedown.vx v8, v8, a1
	; RV64-NEXT: vmv.x.s a0, v8			; RV64-NEXT: vmv.x.s a0, v8
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%a = load <3 x i64>, ptr %x			%a = load <3 x i64>, ptr %x
	%b = add <3 x i64> %a, %a			%b = add <3 x i64> %a, %a
	▲ Show 20 Lines • Show All 338 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-fp.ll

Show All 19 Lines	; CHECK-NEXT: ret
%a = load <8 x half>, ptr %x		%a = load <8 x half>, ptr %x
%b = load <8 x half>, ptr %y		%b = load <8 x half>, ptr %y
%c = fadd <8 x half> %a, %b		%c = fadd <8 x half> %a, %b
store <8 x half> %c, ptr %x		store <8 x half> %c, ptr %x
ret void		ret void
}		}

define void @fadd_v6f16(ptr %x, ptr %y) {		define void @fadd_v6f16(ptr %x, ptr %y) {
; LMULMAX1-RV32-LABEL: fadd_v6f16:		; CHECK-LABEL: fadd_v6f16:
; LMULMAX1-RV32: # %bb.0:		; CHECK: # %bb.0:
; LMULMAX1-RV32-NEXT: vsetivli zero, 8, e16, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 6, e16, m1, ta, ma
; LMULMAX1-RV32-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; LMULMAX1-RV32-NEXT: vle16.v v9, (a1)		; CHECK-NEXT: vle16.v v9, (a1)
; LMULMAX1-RV32-NEXT: vfadd.vv v8, v8, v9		; CHECK-NEXT: vfadd.vv v8, v8, v9
; LMULMAX1-RV32-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vse16.v v8, (a0)
; LMULMAX1-RV32-NEXT: vslidedown.vi v9, v8, 2		; CHECK-NEXT: ret
; LMULMAX1-RV32-NEXT: addi a1, a0, 8
; LMULMAX1-RV32-NEXT: vse32.v v9, (a1)
; LMULMAX1-RV32-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
; LMULMAX1-RV32-NEXT: vse16.v v8, (a0)
; LMULMAX1-RV32-NEXT: ret
;
; LMULMAX1-RV64-LABEL: fadd_v6f16:
; LMULMAX1-RV64: # %bb.0:
; LMULMAX1-RV64-NEXT: vsetivli zero, 8, e16, m1, ta, ma
; LMULMAX1-RV64-NEXT: vle16.v v8, (a0)
; LMULMAX1-RV64-NEXT: vle16.v v9, (a1)
; LMULMAX1-RV64-NEXT: vfadd.vv v8, v8, v9
; LMULMAX1-RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma
; LMULMAX1-RV64-NEXT: vse64.v v8, (a0)
; LMULMAX1-RV64-NEXT: vsetivli zero, 1, e32, m1, ta, ma
; LMULMAX1-RV64-NEXT: vslidedown.vi v8, v8, 2
; LMULMAX1-RV64-NEXT: addi a0, a0, 8
; LMULMAX1-RV64-NEXT: vse32.v v8, (a0)
; LMULMAX1-RV64-NEXT: ret
%a = load <6 x half>, ptr %x		%a = load <6 x half>, ptr %x
%b = load <6 x half>, ptr %y		%b = load <6 x half>, ptr %y
%c = fadd <6 x half> %a, %b		%c = fadd <6 x half> %a, %b
store <6 x half> %c, ptr %x		store <6 x half> %c, ptr %x
ret void		ret void
}		}

define void @fadd_v4f32(ptr %x, ptr %y) {		define void @fadd_v4f32(ptr %x, ptr %y) {
Show All 40 Lines	; CHECK-NEXT: ret
%a = load <8 x half>, ptr %x		%a = load <8 x half>, ptr %x
%b = load <8 x half>, ptr %y		%b = load <8 x half>, ptr %y
%c = fsub <8 x half> %a, %b		%c = fsub <8 x half> %a, %b
store <8 x half> %c, ptr %x		store <8 x half> %c, ptr %x
ret void		ret void
}		}

define void @fsub_v6f16(ptr %x, ptr %y) {		define void @fsub_v6f16(ptr %x, ptr %y) {
; LMULMAX1-RV32-LABEL: fsub_v6f16:		; CHECK-LABEL: fsub_v6f16:
; LMULMAX1-RV32: # %bb.0:		; CHECK: # %bb.0:
; LMULMAX1-RV32-NEXT: vsetivli zero, 8, e16, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 6, e16, m1, ta, ma
; LMULMAX1-RV32-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; LMULMAX1-RV32-NEXT: vle16.v v9, (a1)		; CHECK-NEXT: vle16.v v9, (a1)
; LMULMAX1-RV32-NEXT: vfsub.vv v8, v8, v9		; CHECK-NEXT: vfsub.vv v8, v8, v9
; LMULMAX1-RV32-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vse16.v v8, (a0)
; LMULMAX1-RV32-NEXT: vslidedown.vi v9, v8, 2		; CHECK-NEXT: ret
; LMULMAX1-RV32-NEXT: addi a1, a0, 8
; LMULMAX1-RV32-NEXT: vse32.v v9, (a1)
; LMULMAX1-RV32-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
; LMULMAX1-RV32-NEXT: vse16.v v8, (a0)
; LMULMAX1-RV32-NEXT: ret
;
; LMULMAX1-RV64-LABEL: fsub_v6f16:
; LMULMAX1-RV64: # %bb.0:
; LMULMAX1-RV64-NEXT: vsetivli zero, 8, e16, m1, ta, ma
; LMULMAX1-RV64-NEXT: vle16.v v8, (a0)
; LMULMAX1-RV64-NEXT: vle16.v v9, (a1)
; LMULMAX1-RV64-NEXT: vfsub.vv v8, v8, v9
; LMULMAX1-RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma
; LMULMAX1-RV64-NEXT: vse64.v v8, (a0)
; LMULMAX1-RV64-NEXT: vsetivli zero, 1, e32, m1, ta, ma
; LMULMAX1-RV64-NEXT: vslidedown.vi v8, v8, 2
; LMULMAX1-RV64-NEXT: addi a0, a0, 8
; LMULMAX1-RV64-NEXT: vse32.v v8, (a0)
; LMULMAX1-RV64-NEXT: ret
%a = load <6 x half>, ptr %x		%a = load <6 x half>, ptr %x
%b = load <6 x half>, ptr %y		%b = load <6 x half>, ptr %y
%c = fsub <6 x half> %a, %b		%c = fsub <6 x half> %a, %b
store <6 x half> %c, ptr %x		store <6 x half> %c, ptr %x
ret void		ret void
}		}

define void @fsub_v4f32(ptr %x, ptr %y) {		define void @fsub_v4f32(ptr %x, ptr %y) {
Show All 40 Lines	; CHECK-NEXT: ret
%a = load <8 x half>, ptr %x		%a = load <8 x half>, ptr %x
%b = load <8 x half>, ptr %y		%b = load <8 x half>, ptr %y
%c = fmul <8 x half> %a, %b		%c = fmul <8 x half> %a, %b
store <8 x half> %c, ptr %x		store <8 x half> %c, ptr %x
ret void		ret void
}		}

define void @fmul_v6f16(ptr %x, ptr %y) {		define void @fmul_v6f16(ptr %x, ptr %y) {
; LMULMAX1-RV32-LABEL: fmul_v6f16:		; CHECK-LABEL: fmul_v6f16:
; LMULMAX1-RV32: # %bb.0:		; CHECK: # %bb.0:
; LMULMAX1-RV32-NEXT: vsetivli zero, 8, e16, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 6, e16, m1, ta, ma
; LMULMAX1-RV32-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; LMULMAX1-RV32-NEXT: vle16.v v9, (a1)		; CHECK-NEXT: vle16.v v9, (a1)
; LMULMAX1-RV32-NEXT: vfmul.vv v8, v8, v9		; CHECK-NEXT: vfmul.vv v8, v8, v9
; LMULMAX1-RV32-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vse16.v v8, (a0)
; LMULMAX1-RV32-NEXT: vslidedown.vi v9, v8, 2		; CHECK-NEXT: ret
; LMULMAX1-RV32-NEXT: addi a1, a0, 8
; LMULMAX1-RV32-NEXT: vse32.v v9, (a1)
; LMULMAX1-RV32-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
; LMULMAX1-RV32-NEXT: vse16.v v8, (a0)
; LMULMAX1-RV32-NEXT: ret
;
; LMULMAX1-RV64-LABEL: fmul_v6f16:
; LMULMAX1-RV64: # %bb.0:
; LMULMAX1-RV64-NEXT: vsetivli zero, 8, e16, m1, ta, ma
; LMULMAX1-RV64-NEXT: vle16.v v8, (a0)
; LMULMAX1-RV64-NEXT: vle16.v v9, (a1)
; LMULMAX1-RV64-NEXT: vfmul.vv v8, v8, v9
; LMULMAX1-RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma
; LMULMAX1-RV64-NEXT: vse64.v v8, (a0)
; LMULMAX1-RV64-NEXT: vsetivli zero, 1, e32, m1, ta, ma
; LMULMAX1-RV64-NEXT: vslidedown.vi v8, v8, 2
; LMULMAX1-RV64-NEXT: addi a0, a0, 8
; LMULMAX1-RV64-NEXT: vse32.v v8, (a0)
; LMULMAX1-RV64-NEXT: ret
%a = load <6 x half>, ptr %x		%a = load <6 x half>, ptr %x
%b = load <6 x half>, ptr %y		%b = load <6 x half>, ptr %y
%c = fmul <6 x half> %a, %b		%c = fmul <6 x half> %a, %b
store <6 x half> %c, ptr %x		store <6 x half> %c, ptr %x
ret void		ret void
}		}

define void @fmul_v4f32(ptr %x, ptr %y) {		define void @fmul_v4f32(ptr %x, ptr %y) {
Show All 40 Lines	; CHECK-NEXT: ret
%a = load <8 x half>, ptr %x		%a = load <8 x half>, ptr %x
%b = load <8 x half>, ptr %y		%b = load <8 x half>, ptr %y
%c = fdiv <8 x half> %a, %b		%c = fdiv <8 x half> %a, %b
store <8 x half> %c, ptr %x		store <8 x half> %c, ptr %x
ret void		ret void
}		}

define void @fdiv_v6f16(ptr %x, ptr %y) {		define void @fdiv_v6f16(ptr %x, ptr %y) {
; LMULMAX1-RV32-LABEL: fdiv_v6f16:		; CHECK-LABEL: fdiv_v6f16:
; LMULMAX1-RV32: # %bb.0:		; CHECK: # %bb.0:
; LMULMAX1-RV32-NEXT: vsetivli zero, 8, e16, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 6, e16, m1, ta, ma
; LMULMAX1-RV32-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; LMULMAX1-RV32-NEXT: vle16.v v9, (a1)		; CHECK-NEXT: vle16.v v9, (a1)
; LMULMAX1-RV32-NEXT: vfdiv.vv v8, v8, v9		; CHECK-NEXT: vfdiv.vv v8, v8, v9
; LMULMAX1-RV32-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vse16.v v8, (a0)
; LMULMAX1-RV32-NEXT: vslidedown.vi v9, v8, 2		; CHECK-NEXT: ret
; LMULMAX1-RV32-NEXT: addi a1, a0, 8
; LMULMAX1-RV32-NEXT: vse32.v v9, (a1)
; LMULMAX1-RV32-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
; LMULMAX1-RV32-NEXT: vse16.v v8, (a0)
; LMULMAX1-RV32-NEXT: ret
;
; LMULMAX1-RV64-LABEL: fdiv_v6f16:
; LMULMAX1-RV64: # %bb.0:
; LMULMAX1-RV64-NEXT: vsetivli zero, 8, e16, m1, ta, ma
; LMULMAX1-RV64-NEXT: vle16.v v8, (a0)
; LMULMAX1-RV64-NEXT: vle16.v v9, (a1)
; LMULMAX1-RV64-NEXT: vfdiv.vv v8, v8, v9
; LMULMAX1-RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma
; LMULMAX1-RV64-NEXT: vse64.v v8, (a0)
; LMULMAX1-RV64-NEXT: vsetivli zero, 1, e32, m1, ta, ma
; LMULMAX1-RV64-NEXT: vslidedown.vi v8, v8, 2
; LMULMAX1-RV64-NEXT: addi a0, a0, 8
; LMULMAX1-RV64-NEXT: vse32.v v8, (a0)
; LMULMAX1-RV64-NEXT: ret
%a = load <6 x half>, ptr %x		%a = load <6 x half>, ptr %x
%b = load <6 x half>, ptr %y		%b = load <6 x half>, ptr %y
%c = fdiv <6 x half> %a, %b		%c = fdiv <6 x half> %a, %b
store <6 x half> %c, ptr %x		store <6 x half> %c, ptr %x
ret void		ret void
}		}

define void @fdiv_v4f32(ptr %x, ptr %y) {		define void @fdiv_v4f32(ptr %x, ptr %y) {
Show All 38 Lines
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = load <8 x half>, ptr %x		%a = load <8 x half>, ptr %x
%b = fneg <8 x half> %a		%b = fneg <8 x half> %a
store <8 x half> %b, ptr %x		store <8 x half> %b, ptr %x
ret void		ret void
}		}

define void @fneg_v6f16(ptr %x) {		define void @fneg_v6f16(ptr %x) {
; LMULMAX1-RV32-LABEL: fneg_v6f16:		; CHECK-LABEL: fneg_v6f16:
; LMULMAX1-RV32: # %bb.0:		; CHECK: # %bb.0:
; LMULMAX1-RV32-NEXT: vsetivli zero, 8, e16, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 6, e16, m1, ta, ma
; LMULMAX1-RV32-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; LMULMAX1-RV32-NEXT: vfneg.v v8, v8		; CHECK-NEXT: vfneg.v v8, v8
; LMULMAX1-RV32-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vse16.v v8, (a0)
; LMULMAX1-RV32-NEXT: vslidedown.vi v9, v8, 2		; CHECK-NEXT: ret
; LMULMAX1-RV32-NEXT: addi a1, a0, 8
; LMULMAX1-RV32-NEXT: vse32.v v9, (a1)
; LMULMAX1-RV32-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
; LMULMAX1-RV32-NEXT: vse16.v v8, (a0)
; LMULMAX1-RV32-NEXT: ret
;
; LMULMAX1-RV64-LABEL: fneg_v6f16:
; LMULMAX1-RV64: # %bb.0:
; LMULMAX1-RV64-NEXT: vsetivli zero, 8, e16, m1, ta, ma
; LMULMAX1-RV64-NEXT: vle16.v v8, (a0)
; LMULMAX1-RV64-NEXT: vfneg.v v8, v8
; LMULMAX1-RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma
; LMULMAX1-RV64-NEXT: vse64.v v8, (a0)
; LMULMAX1-RV64-NEXT: vsetivli zero, 1, e32, m1, ta, ma
; LMULMAX1-RV64-NEXT: vslidedown.vi v8, v8, 2
; LMULMAX1-RV64-NEXT: addi a0, a0, 8
; LMULMAX1-RV64-NEXT: vse32.v v8, (a0)
; LMULMAX1-RV64-NEXT: ret
%a = load <6 x half>, ptr %x		%a = load <6 x half>, ptr %x
%b = fneg <6 x half> %a		%b = fneg <6 x half> %a
store <6 x half> %b, ptr %x		store <6 x half> %b, ptr %x
ret void		ret void
}		}

define void @fneg_v4f32(ptr %x) {		define void @fneg_v4f32(ptr %x) {
; CHECK-LABEL: fneg_v4f32:		; CHECK-LABEL: fneg_v4f32:
Show All 34 Lines	; CHECK-NEXT: ret
%a = load <8 x half>, ptr %x		%a = load <8 x half>, ptr %x
%b = call <8 x half> @llvm.fabs.v8f16(<8 x half> %a)		%b = call <8 x half> @llvm.fabs.v8f16(<8 x half> %a)
store <8 x half> %b, ptr %x		store <8 x half> %b, ptr %x
ret void		ret void
}		}
declare <8 x half> @llvm.fabs.v8f16(<8 x half>)		declare <8 x half> @llvm.fabs.v8f16(<8 x half>)

define void @fabs_v6f16(ptr %x) {		define void @fabs_v6f16(ptr %x) {
; LMULMAX1-RV32-LABEL: fabs_v6f16:		; CHECK-LABEL: fabs_v6f16:
; LMULMAX1-RV32: # %bb.0:		; CHECK: # %bb.0:
; LMULMAX1-RV32-NEXT: vsetivli zero, 8, e16, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 6, e16, m1, ta, ma
; LMULMAX1-RV32-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; LMULMAX1-RV32-NEXT: vfabs.v v8, v8		; CHECK-NEXT: vfabs.v v8, v8
; LMULMAX1-RV32-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vse16.v v8, (a0)
; LMULMAX1-RV32-NEXT: vslidedown.vi v9, v8, 2		; CHECK-NEXT: ret
; LMULMAX1-RV32-NEXT: addi a1, a0, 8
; LMULMAX1-RV32-NEXT: vse32.v v9, (a1)
; LMULMAX1-RV32-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
; LMULMAX1-RV32-NEXT: vse16.v v8, (a0)
; LMULMAX1-RV32-NEXT: ret
;
; LMULMAX1-RV64-LABEL: fabs_v6f16:
; LMULMAX1-RV64: # %bb.0:
; LMULMAX1-RV64-NEXT: vsetivli zero, 8, e16, m1, ta, ma
; LMULMAX1-RV64-NEXT: vle16.v v8, (a0)
; LMULMAX1-RV64-NEXT: vfabs.v v8, v8
; LMULMAX1-RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma
; LMULMAX1-RV64-NEXT: vse64.v v8, (a0)
; LMULMAX1-RV64-NEXT: vsetivli zero, 1, e32, m1, ta, ma
; LMULMAX1-RV64-NEXT: vslidedown.vi v8, v8, 2
; LMULMAX1-RV64-NEXT: addi a0, a0, 8
; LMULMAX1-RV64-NEXT: vse32.v v8, (a0)
; LMULMAX1-RV64-NEXT: ret
%a = load <6 x half>, ptr %x		%a = load <6 x half>, ptr %x
%b = call <6 x half> @llvm.fabs.v6f16(<6 x half> %a)		%b = call <6 x half> @llvm.fabs.v6f16(<6 x half> %a)
store <6 x half> %b, ptr %x		store <6 x half> %b, ptr %x
ret void		ret void
}		}
declare <6 x half> @llvm.fabs.v6f16(<6 x half>)		declare <6 x half> @llvm.fabs.v6f16(<6 x half>)

define void @fabs_v4f32(ptr %x) {		define void @fabs_v4f32(ptr %x) {
Show All 39 Lines	; CHECK-NEXT: ret
%b = load <8 x half>, ptr %y		%b = load <8 x half>, ptr %y
%c = call <8 x half> @llvm.copysign.v8f16(<8 x half> %a, <8 x half> %b)		%c = call <8 x half> @llvm.copysign.v8f16(<8 x half> %a, <8 x half> %b)
store <8 x half> %c, ptr %x		store <8 x half> %c, ptr %x
ret void		ret void
}		}
declare <8 x half> @llvm.copysign.v8f16(<8 x half>, <8 x half>)		declare <8 x half> @llvm.copysign.v8f16(<8 x half>, <8 x half>)

define void @copysign_v6f16(ptr %x, ptr %y) {		define void @copysign_v6f16(ptr %x, ptr %y) {
; LMULMAX1-RV32-LABEL: copysign_v6f16:		; CHECK-LABEL: copysign_v6f16:
; LMULMAX1-RV32: # %bb.0:		; CHECK: # %bb.0:
; LMULMAX1-RV32-NEXT: vsetivli zero, 8, e16, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 6, e16, m1, ta, ma
; LMULMAX1-RV32-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; LMULMAX1-RV32-NEXT: vle16.v v9, (a1)		; CHECK-NEXT: vle16.v v9, (a1)
; LMULMAX1-RV32-NEXT: vfsgnj.vv v8, v8, v9		; CHECK-NEXT: vfsgnj.vv v8, v8, v9
; LMULMAX1-RV32-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vse16.v v8, (a0)
; LMULMAX1-RV32-NEXT: vslidedown.vi v9, v8, 2		; CHECK-NEXT: ret
; LMULMAX1-RV32-NEXT: addi a1, a0, 8
; LMULMAX1-RV32-NEXT: vse32.v v9, (a1)
; LMULMAX1-RV32-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
; LMULMAX1-RV32-NEXT: vse16.v v8, (a0)
; LMULMAX1-RV32-NEXT: ret
;
; LMULMAX1-RV64-LABEL: copysign_v6f16:
; LMULMAX1-RV64: # %bb.0:
; LMULMAX1-RV64-NEXT: vsetivli zero, 8, e16, m1, ta, ma
; LMULMAX1-RV64-NEXT: vle16.v v8, (a0)
; LMULMAX1-RV64-NEXT: vle16.v v9, (a1)
; LMULMAX1-RV64-NEXT: vfsgnj.vv v8, v8, v9
; LMULMAX1-RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma
; LMULMAX1-RV64-NEXT: vse64.v v8, (a0)
; LMULMAX1-RV64-NEXT: vsetivli zero, 1, e32, m1, ta, ma
; LMULMAX1-RV64-NEXT: vslidedown.vi v8, v8, 2
; LMULMAX1-RV64-NEXT: addi a0, a0, 8
; LMULMAX1-RV64-NEXT: vse32.v v8, (a0)
; LMULMAX1-RV64-NEXT: ret
%a = load <6 x half>, ptr %x		%a = load <6 x half>, ptr %x
%b = load <6 x half>, ptr %y		%b = load <6 x half>, ptr %y
%c = call <6 x half> @llvm.copysign.v6f16(<6 x half> %a, <6 x half> %b)		%c = call <6 x half> @llvm.copysign.v6f16(<6 x half> %a, <6 x half> %b)
store <6 x half> %c, ptr %x		store <6 x half> %c, ptr %x
ret void		ret void
}		}
declare <6 x half> @llvm.copysign.v6f16(<6 x half>, <6 x half>)		declare <6 x half> @llvm.copysign.v6f16(<6 x half>, <6 x half>)

▲ Show 20 Lines • Show All 43 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%b = insertelement <8 x half> poison, half %y, i32 0		%b = insertelement <8 x half> poison, half %y, i32 0
%c = shufflevector <8 x half> %b, <8 x half> poison, <8 x i32> zeroinitializer		%c = shufflevector <8 x half> %b, <8 x half> poison, <8 x i32> zeroinitializer
%d = call <8 x half> @llvm.copysign.v8f16(<8 x half> %a, <8 x half> %c)		%d = call <8 x half> @llvm.copysign.v8f16(<8 x half> %a, <8 x half> %c)
store <8 x half> %d, ptr %x		store <8 x half> %d, ptr %x
ret void		ret void
}		}

define void @copysign_vf_v6f16(ptr %x, half %y) {		define void @copysign_vf_v6f16(ptr %x, half %y) {
; LMULMAX1-RV32-LABEL: copysign_vf_v6f16:		; CHECK-LABEL: copysign_vf_v6f16:
; LMULMAX1-RV32: # %bb.0:		; CHECK: # %bb.0:
; LMULMAX1-RV32-NEXT: vsetivli zero, 8, e16, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 6, e16, m1, ta, ma
; LMULMAX1-RV32-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; LMULMAX1-RV32-NEXT: vfsgnj.vf v8, v8, fa0		; CHECK-NEXT: vfsgnj.vf v8, v8, fa0
; LMULMAX1-RV32-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vse16.v v8, (a0)
; LMULMAX1-RV32-NEXT: vslidedown.vi v9, v8, 2		; CHECK-NEXT: ret
; LMULMAX1-RV32-NEXT: addi a1, a0, 8
; LMULMAX1-RV32-NEXT: vse32.v v9, (a1)
; LMULMAX1-RV32-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
; LMULMAX1-RV32-NEXT: vse16.v v8, (a0)
; LMULMAX1-RV32-NEXT: ret
;
; LMULMAX1-RV64-LABEL: copysign_vf_v6f16:
; LMULMAX1-RV64: # %bb.0:
; LMULMAX1-RV64-NEXT: vsetivli zero, 8, e16, m1, ta, ma
; LMULMAX1-RV64-NEXT: vle16.v v8, (a0)
; LMULMAX1-RV64-NEXT: vfsgnj.vf v8, v8, fa0
; LMULMAX1-RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma
; LMULMAX1-RV64-NEXT: vse64.v v8, (a0)
; LMULMAX1-RV64-NEXT: vsetivli zero, 1, e32, m1, ta, ma
; LMULMAX1-RV64-NEXT: vslidedown.vi v8, v8, 2
; LMULMAX1-RV64-NEXT: addi a0, a0, 8
; LMULMAX1-RV64-NEXT: vse32.v v8, (a0)
; LMULMAX1-RV64-NEXT: ret
%a = load <6 x half>, ptr %x		%a = load <6 x half>, ptr %x
%b = insertelement <6 x half> poison, half %y, i32 0		%b = insertelement <6 x half> poison, half %y, i32 0
%c = shufflevector <6 x half> %b, <6 x half> poison, <6 x i32> zeroinitializer		%c = shufflevector <6 x half> %b, <6 x half> poison, <6 x i32> zeroinitializer
%d = call <6 x half> @llvm.copysign.v6f16(<6 x half> %a, <6 x half> %c)		%d = call <6 x half> @llvm.copysign.v6f16(<6 x half> %a, <6 x half> %c)
store <6 x half> %d, ptr %x		store <6 x half> %d, ptr %x
ret void		ret void
}		}

▲ Show 20 Lines • Show All 42 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%b = load <8 x half>, ptr %y		%b = load <8 x half>, ptr %y
%c = fneg <8 x half> %b		%c = fneg <8 x half> %b
%d = call <8 x half> @llvm.copysign.v8f16(<8 x half> %a, <8 x half> %c)		%d = call <8 x half> @llvm.copysign.v8f16(<8 x half> %a, <8 x half> %c)
store <8 x half> %d, ptr %x		store <8 x half> %d, ptr %x
ret void		ret void
}		}

define void @copysign_neg_v6f16(ptr %x, ptr %y) {		define void @copysign_neg_v6f16(ptr %x, ptr %y) {
; LMULMAX1-RV32-LABEL: copysign_neg_v6f16:		; CHECK-LABEL: copysign_neg_v6f16:
; LMULMAX1-RV32: # %bb.0:		; CHECK: # %bb.0:
; LMULMAX1-RV32-NEXT: vsetivli zero, 8, e16, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 6, e16, m1, ta, ma
; LMULMAX1-RV32-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; LMULMAX1-RV32-NEXT: vle16.v v9, (a1)		; CHECK-NEXT: vle16.v v9, (a1)
; LMULMAX1-RV32-NEXT: vfsgnjn.vv v8, v8, v9		; CHECK-NEXT: vfsgnjn.vv v8, v8, v9
; LMULMAX1-RV32-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vse16.v v8, (a0)
; LMULMAX1-RV32-NEXT: vslidedown.vi v9, v8, 2		; CHECK-NEXT: ret
; LMULMAX1-RV32-NEXT: addi a1, a0, 8
; LMULMAX1-RV32-NEXT: vse32.v v9, (a1)
; LMULMAX1-RV32-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
; LMULMAX1-RV32-NEXT: vse16.v v8, (a0)
; LMULMAX1-RV32-NEXT: ret
;
; LMULMAX1-RV64-LABEL: copysign_neg_v6f16:
; LMULMAX1-RV64: # %bb.0:
; LMULMAX1-RV64-NEXT: vsetivli zero, 8, e16, m1, ta, ma
; LMULMAX1-RV64-NEXT: vle16.v v8, (a0)
; LMULMAX1-RV64-NEXT: vle16.v v9, (a1)
; LMULMAX1-RV64-NEXT: vfsgnjn.vv v8, v8, v9
; LMULMAX1-RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma
; LMULMAX1-RV64-NEXT: vse64.v v8, (a0)
; LMULMAX1-RV64-NEXT: vsetivli zero, 1, e32, m1, ta, ma
; LMULMAX1-RV64-NEXT: vslidedown.vi v8, v8, 2
; LMULMAX1-RV64-NEXT: addi a0, a0, 8
; LMULMAX1-RV64-NEXT: vse32.v v8, (a0)
; LMULMAX1-RV64-NEXT: ret
%a = load <6 x half>, ptr %x		%a = load <6 x half>, ptr %x
%b = load <6 x half>, ptr %y		%b = load <6 x half>, ptr %y
%c = fneg <6 x half> %b		%c = fneg <6 x half> %b
%d = call <6 x half> @llvm.copysign.v6f16(<6 x half> %a, <6 x half> %c)		%d = call <6 x half> @llvm.copysign.v6f16(<6 x half> %a, <6 x half> %c)
store <6 x half> %d, ptr %x		store <6 x half> %d, ptr %x
ret void		ret void
}		}

▲ Show 20 Lines • Show All 47 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%d = fptrunc <4 x float> %c to <4 x half>		%d = fptrunc <4 x float> %c to <4 x half>
%e = call <4 x half> @llvm.copysign.v4f16(<4 x half> %a, <4 x half> %d)		%e = call <4 x half> @llvm.copysign.v4f16(<4 x half> %a, <4 x half> %d)
store <4 x half> %e, ptr %x		store <4 x half> %e, ptr %x
ret void		ret void
}		}
declare <4 x half> @llvm.copysign.v4f16(<4 x half>, <4 x half>)		declare <4 x half> @llvm.copysign.v4f16(<4 x half>, <4 x half>)

define void @copysign_neg_trunc_v3f16_v3f32(ptr %x, ptr %y) {		define void @copysign_neg_trunc_v3f16_v3f32(ptr %x, ptr %y) {
; LMULMAX1-RV32-LABEL: copysign_neg_trunc_v3f16_v3f32:		; CHECK-LABEL: copysign_neg_trunc_v3f16_v3f32:
; LMULMAX1-RV32: # %bb.0:		; CHECK: # %bb.0:
; LMULMAX1-RV32-NEXT: vsetivli zero, 4, e16, mf2, ta, ma		; CHECK-NEXT: vsetivli zero, 3, e16, mf2, ta, ma
; LMULMAX1-RV32-NEXT: vle32.v v8, (a1)		; CHECK-NEXT: vle32.v v8, (a1)
; LMULMAX1-RV32-NEXT: vle16.v v9, (a0)		; CHECK-NEXT: vle16.v v9, (a0)
; LMULMAX1-RV32-NEXT: vfncvt.f.f.w v10, v8		; CHECK-NEXT: vfncvt.f.f.w v10, v8
; LMULMAX1-RV32-NEXT: vfsgnjn.vv v8, v9, v10		; CHECK-NEXT: vfsgnjn.vv v8, v9, v10
; LMULMAX1-RV32-NEXT: vsetivli zero, 1, e16, mf2, ta, ma		; CHECK-NEXT: vse16.v v8, (a0)
; LMULMAX1-RV32-NEXT: vslidedown.vi v9, v8, 2		; CHECK-NEXT: ret
; LMULMAX1-RV32-NEXT: addi a1, a0, 4
; LMULMAX1-RV32-NEXT: vse16.v v9, (a1)
; LMULMAX1-RV32-NEXT: vsetivli zero, 1, e32, mf2, ta, ma
; LMULMAX1-RV32-NEXT: vse32.v v8, (a0)
; LMULMAX1-RV32-NEXT: ret
;
; LMULMAX1-RV64-LABEL: copysign_neg_trunc_v3f16_v3f32:
; LMULMAX1-RV64: # %bb.0:
; LMULMAX1-RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma
; LMULMAX1-RV64-NEXT: vle64.v v8, (a0)
; LMULMAX1-RV64-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
; LMULMAX1-RV64-NEXT: vle32.v v9, (a1)
; LMULMAX1-RV64-NEXT: vfncvt.f.f.w v10, v9
; LMULMAX1-RV64-NEXT: vfsgnjn.vv v8, v8, v10
; LMULMAX1-RV64-NEXT: vsetivli zero, 1, e16, mf2, ta, ma
; LMULMAX1-RV64-NEXT: vslidedown.vi v9, v8, 2
; LMULMAX1-RV64-NEXT: addi a1, a0, 4
; LMULMAX1-RV64-NEXT: vse16.v v9, (a1)
; LMULMAX1-RV64-NEXT: vsetivli zero, 1, e32, mf2, ta, ma
; LMULMAX1-RV64-NEXT: vse32.v v8, (a0)
; LMULMAX1-RV64-NEXT: ret
%a = load <3 x half>, ptr %x		%a = load <3 x half>, ptr %x
%b = load <3 x float>, ptr %y		%b = load <3 x float>, ptr %y
%c = fneg <3 x float> %b		%c = fneg <3 x float> %b
%d = fptrunc <3 x float> %c to <3 x half>		%d = fptrunc <3 x float> %c to <3 x half>
%e = call <3 x half> @llvm.copysign.v3f16(<3 x half> %a, <3 x half> %d)		%e = call <3 x half> @llvm.copysign.v3f16(<3 x half> %a, <3 x half> %d)
store <3 x half> %e, ptr %x		store <3 x half> %e, ptr %x
ret void		ret void
}		}
Show All 30 Lines	; CHECK-NEXT: ret
%a = load <8 x half>, ptr %x		%a = load <8 x half>, ptr %x
%b = call <8 x half> @llvm.sqrt.v8f16(<8 x half> %a)		%b = call <8 x half> @llvm.sqrt.v8f16(<8 x half> %a)
store <8 x half> %b, ptr %x		store <8 x half> %b, ptr %x
ret void		ret void
}		}
declare <8 x half> @llvm.sqrt.v8f16(<8 x half>)		declare <8 x half> @llvm.sqrt.v8f16(<8 x half>)

define void @sqrt_v6f16(ptr %x) {		define void @sqrt_v6f16(ptr %x) {
; LMULMAX1-RV32-LABEL: sqrt_v6f16:		; CHECK-LABEL: sqrt_v6f16:
; LMULMAX1-RV32: # %bb.0:		; CHECK: # %bb.0:
; LMULMAX1-RV32-NEXT: vsetivli zero, 8, e16, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 6, e16, m1, ta, ma
; LMULMAX1-RV32-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; LMULMAX1-RV32-NEXT: vfsqrt.v v8, v8		; CHECK-NEXT: vfsqrt.v v8, v8
; LMULMAX1-RV32-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vse16.v v8, (a0)
; LMULMAX1-RV32-NEXT: vslidedown.vi v9, v8, 2		; CHECK-NEXT: ret
; LMULMAX1-RV32-NEXT: addi a1, a0, 8
; LMULMAX1-RV32-NEXT: vse32.v v9, (a1)
; LMULMAX1-RV32-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
; LMULMAX1-RV32-NEXT: vse16.v v8, (a0)
; LMULMAX1-RV32-NEXT: ret
;
; LMULMAX1-RV64-LABEL: sqrt_v6f16:
; LMULMAX1-RV64: # %bb.0:
; LMULMAX1-RV64-NEXT: vsetivli zero, 8, e16, m1, ta, ma
; LMULMAX1-RV64-NEXT: vle16.v v8, (a0)
; LMULMAX1-RV64-NEXT: vfsqrt.v v8, v8
; LMULMAX1-RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma
; LMULMAX1-RV64-NEXT: vse64.v v8, (a0)
; LMULMAX1-RV64-NEXT: vsetivli zero, 1, e32, m1, ta, ma
; LMULMAX1-RV64-NEXT: vslidedown.vi v8, v8, 2
; LMULMAX1-RV64-NEXT: addi a0, a0, 8
; LMULMAX1-RV64-NEXT: vse32.v v8, (a0)
; LMULMAX1-RV64-NEXT: ret
%a = load <6 x half>, ptr %x		%a = load <6 x half>, ptr %x
%b = call <6 x half> @llvm.sqrt.v6f16(<6 x half> %a)		%b = call <6 x half> @llvm.sqrt.v6f16(<6 x half> %a)
store <6 x half> %b, ptr %x		store <6 x half> %b, ptr %x
ret void		ret void
}		}
declare <6 x half> @llvm.sqrt.v6f16(<6 x half>)		declare <6 x half> @llvm.sqrt.v6f16(<6 x half>)

define void @sqrt_v4f32(ptr %x) {		define void @sqrt_v4f32(ptr %x) {
▲ Show 20 Lines • Show All 41 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%c = load <8 x half>, ptr %z		%c = load <8 x half>, ptr %z
%d = call <8 x half> @llvm.fma.v8f16(<8 x half> %a, <8 x half> %b, <8 x half> %c)		%d = call <8 x half> @llvm.fma.v8f16(<8 x half> %a, <8 x half> %b, <8 x half> %c)
store <8 x half> %d, ptr %x		store <8 x half> %d, ptr %x
ret void		ret void
}		}
declare <8 x half> @llvm.fma.v8f16(<8 x half>, <8 x half>, <8 x half>)		declare <8 x half> @llvm.fma.v8f16(<8 x half>, <8 x half>, <8 x half>)

define void @fma_v6f16(ptr %x, ptr %y, ptr %z) {		define void @fma_v6f16(ptr %x, ptr %y, ptr %z) {
; LMULMAX1-RV32-LABEL: fma_v6f16:		; CHECK-LABEL: fma_v6f16:
; LMULMAX1-RV32: # %bb.0:		; CHECK: # %bb.0:
; LMULMAX1-RV32-NEXT: vsetivli zero, 8, e16, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 6, e16, m1, ta, ma
; LMULMAX1-RV32-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; LMULMAX1-RV32-NEXT: vle16.v v9, (a1)		; CHECK-NEXT: vle16.v v9, (a1)
; LMULMAX1-RV32-NEXT: vle16.v v10, (a2)		; CHECK-NEXT: vle16.v v10, (a2)
; LMULMAX1-RV32-NEXT: vfmacc.vv v10, v8, v9		; CHECK-NEXT: vfmacc.vv v10, v8, v9
; LMULMAX1-RV32-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vse16.v v10, (a0)
; LMULMAX1-RV32-NEXT: vslidedown.vi v8, v10, 2		; CHECK-NEXT: ret
; LMULMAX1-RV32-NEXT: addi a1, a0, 8
; LMULMAX1-RV32-NEXT: vse32.v v8, (a1)
; LMULMAX1-RV32-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
; LMULMAX1-RV32-NEXT: vse16.v v10, (a0)
; LMULMAX1-RV32-NEXT: ret
;
; LMULMAX1-RV64-LABEL: fma_v6f16:
; LMULMAX1-RV64: # %bb.0:
; LMULMAX1-RV64-NEXT: vsetivli zero, 8, e16, m1, ta, ma
; LMULMAX1-RV64-NEXT: vle16.v v8, (a0)
; LMULMAX1-RV64-NEXT: vle16.v v9, (a1)
; LMULMAX1-RV64-NEXT: vle16.v v10, (a2)
; LMULMAX1-RV64-NEXT: vfmacc.vv v10, v8, v9
; LMULMAX1-RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma
; LMULMAX1-RV64-NEXT: vse64.v v10, (a0)
; LMULMAX1-RV64-NEXT: vsetivli zero, 1, e32, m1, ta, ma
; LMULMAX1-RV64-NEXT: vslidedown.vi v8, v10, 2
; LMULMAX1-RV64-NEXT: addi a0, a0, 8
; LMULMAX1-RV64-NEXT: vse32.v v8, (a0)
; LMULMAX1-RV64-NEXT: ret
%a = load <6 x half>, ptr %x		%a = load <6 x half>, ptr %x
%b = load <6 x half>, ptr %y		%b = load <6 x half>, ptr %y
%c = load <6 x half>, ptr %z		%c = load <6 x half>, ptr %z
%d = call <6 x half> @llvm.fma.v6f16(<6 x half> %a, <6 x half> %b, <6 x half> %c)		%d = call <6 x half> @llvm.fma.v6f16(<6 x half> %a, <6 x half> %b, <6 x half> %c)
store <6 x half> %d, ptr %x		store <6 x half> %d, ptr %x
ret void		ret void
}		}
declare <6 x half> @llvm.fma.v6f16(<6 x half>, <6 x half>, <6 x half>)		declare <6 x half> @llvm.fma.v6f16(<6 x half>, <6 x half>, <6 x half>)
▲ Show 20 Lines • Show All 51 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%c = load <8 x half>, ptr %z		%c = load <8 x half>, ptr %z
%neg = fneg <8 x half> %c		%neg = fneg <8 x half> %c
%d = call <8 x half> @llvm.fma.v8f16(<8 x half> %a, <8 x half> %b, <8 x half> %neg)		%d = call <8 x half> @llvm.fma.v8f16(<8 x half> %a, <8 x half> %b, <8 x half> %neg)
store <8 x half> %d, ptr %x		store <8 x half> %d, ptr %x
ret void		ret void
}		}

define void @fmsub_v6f16(ptr %x, ptr %y, ptr %z) {		define void @fmsub_v6f16(ptr %x, ptr %y, ptr %z) {
; LMULMAX1-RV32-LABEL: fmsub_v6f16:		; CHECK-LABEL: fmsub_v6f16:
; LMULMAX1-RV32: # %bb.0:		; CHECK: # %bb.0:
; LMULMAX1-RV32-NEXT: vsetivli zero, 8, e16, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 6, e16, m1, ta, ma
; LMULMAX1-RV32-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; LMULMAX1-RV32-NEXT: vle16.v v9, (a1)		; CHECK-NEXT: vle16.v v9, (a1)
; LMULMAX1-RV32-NEXT: vle16.v v10, (a2)		; CHECK-NEXT: vle16.v v10, (a2)
; LMULMAX1-RV32-NEXT: vfmsac.vv v10, v8, v9		; CHECK-NEXT: vfmsac.vv v10, v8, v9
; LMULMAX1-RV32-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vse16.v v10, (a0)
; LMULMAX1-RV32-NEXT: vslidedown.vi v8, v10, 2		; CHECK-NEXT: ret
; LMULMAX1-RV32-NEXT: addi a1, a0, 8
; LMULMAX1-RV32-NEXT: vse32.v v8, (a1)
; LMULMAX1-RV32-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
; LMULMAX1-RV32-NEXT: vse16.v v10, (a0)
; LMULMAX1-RV32-NEXT: ret
;
; LMULMAX1-RV64-LABEL: fmsub_v6f16:
; LMULMAX1-RV64: # %bb.0:
; LMULMAX1-RV64-NEXT: vsetivli zero, 8, e16, m1, ta, ma
; LMULMAX1-RV64-NEXT: vle16.v v8, (a0)
; LMULMAX1-RV64-NEXT: vle16.v v9, (a1)
; LMULMAX1-RV64-NEXT: vle16.v v10, (a2)
; LMULMAX1-RV64-NEXT: vfmsac.vv v10, v8, v9
; LMULMAX1-RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma
; LMULMAX1-RV64-NEXT: vse64.v v10, (a0)
; LMULMAX1-RV64-NEXT: vsetivli zero, 1, e32, m1, ta, ma
; LMULMAX1-RV64-NEXT: vslidedown.vi v8, v10, 2
; LMULMAX1-RV64-NEXT: addi a0, a0, 8
; LMULMAX1-RV64-NEXT: vse32.v v8, (a0)
; LMULMAX1-RV64-NEXT: ret
%a = load <6 x half>, ptr %x		%a = load <6 x half>, ptr %x
%b = load <6 x half>, ptr %y		%b = load <6 x half>, ptr %y
%c = load <6 x half>, ptr %z		%c = load <6 x half>, ptr %z
%neg = fneg <6 x half> %c		%neg = fneg <6 x half> %c
%d = call <6 x half> @llvm.fma.v6f16(<6 x half> %a, <6 x half> %b, <6 x half> %neg)		%d = call <6 x half> @llvm.fma.v6f16(<6 x half> %a, <6 x half> %b, <6 x half> %neg)
store <6 x half> %d, ptr %x		store <6 x half> %d, ptr %x
ret void		ret void
}		}
▲ Show 20 Lines • Show All 790 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%b = insertelement <8 x half> poison, half %y, i32 0		%b = insertelement <8 x half> poison, half %y, i32 0
%c = shufflevector <8 x half> %b, <8 x half> poison, <8 x i32> zeroinitializer		%c = shufflevector <8 x half> %b, <8 x half> poison, <8 x i32> zeroinitializer
%d = fadd <8 x half> %a, %c		%d = fadd <8 x half> %a, %c
store <8 x half> %d, ptr %x		store <8 x half> %d, ptr %x
ret void		ret void
}		}

define void @fadd_vf_v6f16(ptr %x, half %y) {		define void @fadd_vf_v6f16(ptr %x, half %y) {
; LMULMAX1-RV32-LABEL: fadd_vf_v6f16:		; CHECK-LABEL: fadd_vf_v6f16:
; LMULMAX1-RV32: # %bb.0:		; CHECK: # %bb.0:
; LMULMAX1-RV32-NEXT: vsetivli zero, 8, e16, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 6, e16, m1, ta, ma
; LMULMAX1-RV32-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; LMULMAX1-RV32-NEXT: vfadd.vf v8, v8, fa0		; CHECK-NEXT: vfadd.vf v8, v8, fa0
; LMULMAX1-RV32-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vse16.v v8, (a0)
; LMULMAX1-RV32-NEXT: vslidedown.vi v9, v8, 2		; CHECK-NEXT: ret
; LMULMAX1-RV32-NEXT: addi a1, a0, 8
; LMULMAX1-RV32-NEXT: vse32.v v9, (a1)
; LMULMAX1-RV32-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
; LMULMAX1-RV32-NEXT: vse16.v v8, (a0)
; LMULMAX1-RV32-NEXT: ret
;
; LMULMAX1-RV64-LABEL: fadd_vf_v6f16:
; LMULMAX1-RV64: # %bb.0:
; LMULMAX1-RV64-NEXT: vsetivli zero, 8, e16, m1, ta, ma
; LMULMAX1-RV64-NEXT: vle16.v v8, (a0)
; LMULMAX1-RV64-NEXT: vfadd.vf v8, v8, fa0
; LMULMAX1-RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma
; LMULMAX1-RV64-NEXT: vse64.v v8, (a0)
; LMULMAX1-RV64-NEXT: vsetivli zero, 1, e32, m1, ta, ma
; LMULMAX1-RV64-NEXT: vslidedown.vi v8, v8, 2
; LMULMAX1-RV64-NEXT: addi a0, a0, 8
; LMULMAX1-RV64-NEXT: vse32.v v8, (a0)
; LMULMAX1-RV64-NEXT: ret
%a = load <6 x half>, ptr %x		%a = load <6 x half>, ptr %x
%b = insertelement <6 x half> poison, half %y, i32 0		%b = insertelement <6 x half> poison, half %y, i32 0
%c = shufflevector <6 x half> %b, <6 x half> poison, <6 x i32> zeroinitializer		%c = shufflevector <6 x half> %b, <6 x half> poison, <6 x i32> zeroinitializer
%d = fadd <6 x half> %a, %c		%d = fadd <6 x half> %a, %c
store <6 x half> %d, ptr %x		store <6 x half> %d, ptr %x
ret void		ret void
}		}

▲ Show 20 Lines • Show All 41 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%b = insertelement <8 x half> poison, half %y, i32 0		%b = insertelement <8 x half> poison, half %y, i32 0
%c = shufflevector <8 x half> %b, <8 x half> poison, <8 x i32> zeroinitializer		%c = shufflevector <8 x half> %b, <8 x half> poison, <8 x i32> zeroinitializer
%d = fadd <8 x half> %c, %a		%d = fadd <8 x half> %c, %a
store <8 x half> %d, ptr %x		store <8 x half> %d, ptr %x
ret void		ret void
}		}

define void @fadd_fv_v6f16(ptr %x, half %y) {		define void @fadd_fv_v6f16(ptr %x, half %y) {
; LMULMAX1-RV32-LABEL: fadd_fv_v6f16:		; CHECK-LABEL: fadd_fv_v6f16:
; LMULMAX1-RV32: # %bb.0:		; CHECK: # %bb.0:
; LMULMAX1-RV32-NEXT: vsetivli zero, 8, e16, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 6, e16, m1, ta, ma
; LMULMAX1-RV32-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; LMULMAX1-RV32-NEXT: vfadd.vf v8, v8, fa0		; CHECK-NEXT: vfadd.vf v8, v8, fa0
; LMULMAX1-RV32-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vse16.v v8, (a0)
; LMULMAX1-RV32-NEXT: vslidedown.vi v9, v8, 2		; CHECK-NEXT: ret
; LMULMAX1-RV32-NEXT: addi a1, a0, 8
; LMULMAX1-RV32-NEXT: vse32.v v9, (a1)
; LMULMAX1-RV32-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
; LMULMAX1-RV32-NEXT: vse16.v v8, (a0)
; LMULMAX1-RV32-NEXT: ret
;
; LMULMAX1-RV64-LABEL: fadd_fv_v6f16:
; LMULMAX1-RV64: # %bb.0:
; LMULMAX1-RV64-NEXT: vsetivli zero, 8, e16, m1, ta, ma
; LMULMAX1-RV64-NEXT: vle16.v v8, (a0)
; LMULMAX1-RV64-NEXT: vfadd.vf v8, v8, fa0
; LMULMAX1-RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma
; LMULMAX1-RV64-NEXT: vse64.v v8, (a0)
; LMULMAX1-RV64-NEXT: vsetivli zero, 1, e32, m1, ta, ma
; LMULMAX1-RV64-NEXT: vslidedown.vi v8, v8, 2
; LMULMAX1-RV64-NEXT: addi a0, a0, 8
; LMULMAX1-RV64-NEXT: vse32.v v8, (a0)
; LMULMAX1-RV64-NEXT: ret
%a = load <6 x half>, ptr %x		%a = load <6 x half>, ptr %x
%b = insertelement <6 x half> poison, half %y, i32 0		%b = insertelement <6 x half> poison, half %y, i32 0
%c = shufflevector <6 x half> %b, <6 x half> poison, <6 x i32> zeroinitializer		%c = shufflevector <6 x half> %b, <6 x half> poison, <6 x i32> zeroinitializer
%d = fadd <6 x half> %c, %a		%d = fadd <6 x half> %c, %a
store <6 x half> %d, ptr %x		store <6 x half> %d, ptr %x
ret void		ret void
}		}

▲ Show 20 Lines • Show All 41 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%b = insertelement <8 x half> poison, half %y, i32 0		%b = insertelement <8 x half> poison, half %y, i32 0
%c = shufflevector <8 x half> %b, <8 x half> poison, <8 x i32> zeroinitializer		%c = shufflevector <8 x half> %b, <8 x half> poison, <8 x i32> zeroinitializer
%d = fsub <8 x half> %a, %c		%d = fsub <8 x half> %a, %c
store <8 x half> %d, ptr %x		store <8 x half> %d, ptr %x
ret void		ret void
}		}

define void @fsub_vf_v6f16(ptr %x, half %y) {		define void @fsub_vf_v6f16(ptr %x, half %y) {
; LMULMAX1-RV32-LABEL: fsub_vf_v6f16:		; CHECK-LABEL: fsub_vf_v6f16:
; LMULMAX1-RV32: # %bb.0:		; CHECK: # %bb.0:
; LMULMAX1-RV32-NEXT: vsetivli zero, 8, e16, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 6, e16, m1, ta, ma
; LMULMAX1-RV32-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; LMULMAX1-RV32-NEXT: vfsub.vf v8, v8, fa0		; CHECK-NEXT: vfsub.vf v8, v8, fa0
; LMULMAX1-RV32-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vse16.v v8, (a0)
; LMULMAX1-RV32-NEXT: vslidedown.vi v9, v8, 2		; CHECK-NEXT: ret
; LMULMAX1-RV32-NEXT: addi a1, a0, 8
; LMULMAX1-RV32-NEXT: vse32.v v9, (a1)
; LMULMAX1-RV32-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
; LMULMAX1-RV32-NEXT: vse16.v v8, (a0)
; LMULMAX1-RV32-NEXT: ret
;
; LMULMAX1-RV64-LABEL: fsub_vf_v6f16:
; LMULMAX1-RV64: # %bb.0:
; LMULMAX1-RV64-NEXT: vsetivli zero, 8, e16, m1, ta, ma
; LMULMAX1-RV64-NEXT: vle16.v v8, (a0)
; LMULMAX1-RV64-NEXT: vfsub.vf v8, v8, fa0
; LMULMAX1-RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma
; LMULMAX1-RV64-NEXT: vse64.v v8, (a0)
; LMULMAX1-RV64-NEXT: vsetivli zero, 1, e32, m1, ta, ma
; LMULMAX1-RV64-NEXT: vslidedown.vi v8, v8, 2
; LMULMAX1-RV64-NEXT: addi a0, a0, 8
; LMULMAX1-RV64-NEXT: vse32.v v8, (a0)
; LMULMAX1-RV64-NEXT: ret
%a = load <6 x half>, ptr %x		%a = load <6 x half>, ptr %x
%b = insertelement <6 x half> poison, half %y, i32 0		%b = insertelement <6 x half> poison, half %y, i32 0
%c = shufflevector <6 x half> %b, <6 x half> poison, <6 x i32> zeroinitializer		%c = shufflevector <6 x half> %b, <6 x half> poison, <6 x i32> zeroinitializer
%d = fsub <6 x half> %a, %c		%d = fsub <6 x half> %a, %c
store <6 x half> %d, ptr %x		store <6 x half> %d, ptr %x
ret void		ret void
}		}

▲ Show 20 Lines • Show All 41 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%b = insertelement <8 x half> poison, half %y, i32 0		%b = insertelement <8 x half> poison, half %y, i32 0
%c = shufflevector <8 x half> %b, <8 x half> poison, <8 x i32> zeroinitializer		%c = shufflevector <8 x half> %b, <8 x half> poison, <8 x i32> zeroinitializer
%d = fsub <8 x half> %c, %a		%d = fsub <8 x half> %c, %a
store <8 x half> %d, ptr %x		store <8 x half> %d, ptr %x
ret void		ret void
}		}

define void @fsub_fv_v6f16(ptr %x, half %y) {		define void @fsub_fv_v6f16(ptr %x, half %y) {
; LMULMAX1-RV32-LABEL: fsub_fv_v6f16:		; CHECK-LABEL: fsub_fv_v6f16:
; LMULMAX1-RV32: # %bb.0:		; CHECK: # %bb.0:
; LMULMAX1-RV32-NEXT: vsetivli zero, 8, e16, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 6, e16, m1, ta, ma
; LMULMAX1-RV32-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; LMULMAX1-RV32-NEXT: vfrsub.vf v8, v8, fa0		; CHECK-NEXT: vfrsub.vf v8, v8, fa0
; LMULMAX1-RV32-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vse16.v v8, (a0)
; LMULMAX1-RV32-NEXT: vslidedown.vi v9, v8, 2		; CHECK-NEXT: ret
; LMULMAX1-RV32-NEXT: addi a1, a0, 8
; LMULMAX1-RV32-NEXT: vse32.v v9, (a1)
; LMULMAX1-RV32-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
; LMULMAX1-RV32-NEXT: vse16.v v8, (a0)
; LMULMAX1-RV32-NEXT: ret
;
; LMULMAX1-RV64-LABEL: fsub_fv_v6f16:
; LMULMAX1-RV64: # %bb.0:
; LMULMAX1-RV64-NEXT: vsetivli zero, 8, e16, m1, ta, ma
; LMULMAX1-RV64-NEXT: vle16.v v8, (a0)
; LMULMAX1-RV64-NEXT: vfrsub.vf v8, v8, fa0
; LMULMAX1-RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma
; LMULMAX1-RV64-NEXT: vse64.v v8, (a0)
; LMULMAX1-RV64-NEXT: vsetivli zero, 1, e32, m1, ta, ma
; LMULMAX1-RV64-NEXT: vslidedown.vi v8, v8, 2
; LMULMAX1-RV64-NEXT: addi a0, a0, 8
; LMULMAX1-RV64-NEXT: vse32.v v8, (a0)
; LMULMAX1-RV64-NEXT: ret
%a = load <6 x half>, ptr %x		%a = load <6 x half>, ptr %x
%b = insertelement <6 x half> poison, half %y, i32 0		%b = insertelement <6 x half> poison, half %y, i32 0
%c = shufflevector <6 x half> %b, <6 x half> poison, <6 x i32> zeroinitializer		%c = shufflevector <6 x half> %b, <6 x half> poison, <6 x i32> zeroinitializer
%d = fsub <6 x half> %c, %a		%d = fsub <6 x half> %c, %a
store <6 x half> %d, ptr %x		store <6 x half> %d, ptr %x
ret void		ret void
}		}

▲ Show 20 Lines • Show All 41 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%b = insertelement <8 x half> poison, half %y, i32 0		%b = insertelement <8 x half> poison, half %y, i32 0
%c = shufflevector <8 x half> %b, <8 x half> poison, <8 x i32> zeroinitializer		%c = shufflevector <8 x half> %b, <8 x half> poison, <8 x i32> zeroinitializer
%d = fmul <8 x half> %a, %c		%d = fmul <8 x half> %a, %c
store <8 x half> %d, ptr %x		store <8 x half> %d, ptr %x
ret void		ret void
}		}

define void @fmul_vf_v6f16(ptr %x, half %y) {		define void @fmul_vf_v6f16(ptr %x, half %y) {
; LMULMAX1-RV32-LABEL: fmul_vf_v6f16:		; CHECK-LABEL: fmul_vf_v6f16:
; LMULMAX1-RV32: # %bb.0:		; CHECK: # %bb.0:
; LMULMAX1-RV32-NEXT: vsetivli zero, 8, e16, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 6, e16, m1, ta, ma
; LMULMAX1-RV32-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; LMULMAX1-RV32-NEXT: vfmul.vf v8, v8, fa0		; CHECK-NEXT: vfmul.vf v8, v8, fa0
; LMULMAX1-RV32-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vse16.v v8, (a0)
; LMULMAX1-RV32-NEXT: vslidedown.vi v9, v8, 2		; CHECK-NEXT: ret
; LMULMAX1-RV32-NEXT: addi a1, a0, 8
; LMULMAX1-RV32-NEXT: vse32.v v9, (a1)
; LMULMAX1-RV32-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
; LMULMAX1-RV32-NEXT: vse16.v v8, (a0)
; LMULMAX1-RV32-NEXT: ret
;
; LMULMAX1-RV64-LABEL: fmul_vf_v6f16:
; LMULMAX1-RV64: # %bb.0:
; LMULMAX1-RV64-NEXT: vsetivli zero, 8, e16, m1, ta, ma
; LMULMAX1-RV64-NEXT: vle16.v v8, (a0)
; LMULMAX1-RV64-NEXT: vfmul.vf v8, v8, fa0
; LMULMAX1-RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma
; LMULMAX1-RV64-NEXT: vse64.v v8, (a0)
; LMULMAX1-RV64-NEXT: vsetivli zero, 1, e32, m1, ta, ma
; LMULMAX1-RV64-NEXT: vslidedown.vi v8, v8, 2
; LMULMAX1-RV64-NEXT: addi a0, a0, 8
; LMULMAX1-RV64-NEXT: vse32.v v8, (a0)
; LMULMAX1-RV64-NEXT: ret
%a = load <6 x half>, ptr %x		%a = load <6 x half>, ptr %x
%b = insertelement <6 x half> poison, half %y, i32 0		%b = insertelement <6 x half> poison, half %y, i32 0
%c = shufflevector <6 x half> %b, <6 x half> poison, <6 x i32> zeroinitializer		%c = shufflevector <6 x half> %b, <6 x half> poison, <6 x i32> zeroinitializer
%d = fmul <6 x half> %a, %c		%d = fmul <6 x half> %a, %c
store <6 x half> %d, ptr %x		store <6 x half> %d, ptr %x
ret void		ret void
}		}

▲ Show 20 Lines • Show All 41 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%b = insertelement <8 x half> poison, half %y, i32 0		%b = insertelement <8 x half> poison, half %y, i32 0
%c = shufflevector <8 x half> %b, <8 x half> poison, <8 x i32> zeroinitializer		%c = shufflevector <8 x half> %b, <8 x half> poison, <8 x i32> zeroinitializer
%d = fmul <8 x half> %c, %a		%d = fmul <8 x half> %c, %a
store <8 x half> %d, ptr %x		store <8 x half> %d, ptr %x
ret void		ret void
}		}

define void @fmul_fv_v6f16(ptr %x, half %y) {		define void @fmul_fv_v6f16(ptr %x, half %y) {
; LMULMAX1-RV32-LABEL: fmul_fv_v6f16:		; CHECK-LABEL: fmul_fv_v6f16:
; LMULMAX1-RV32: # %bb.0:		; CHECK: # %bb.0:
; LMULMAX1-RV32-NEXT: vsetivli zero, 8, e16, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 6, e16, m1, ta, ma
; LMULMAX1-RV32-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; LMULMAX1-RV32-NEXT: vfmul.vf v8, v8, fa0		; CHECK-NEXT: vfmul.vf v8, v8, fa0
; LMULMAX1-RV32-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vse16.v v8, (a0)
; LMULMAX1-RV32-NEXT: vslidedown.vi v9, v8, 2		; CHECK-NEXT: ret
; LMULMAX1-RV32-NEXT: addi a1, a0, 8
; LMULMAX1-RV32-NEXT: vse32.v v9, (a1)
; LMULMAX1-RV32-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
; LMULMAX1-RV32-NEXT: vse16.v v8, (a0)
; LMULMAX1-RV32-NEXT: ret
;
; LMULMAX1-RV64-LABEL: fmul_fv_v6f16:
; LMULMAX1-RV64: # %bb.0:
; LMULMAX1-RV64-NEXT: vsetivli zero, 8, e16, m1, ta, ma
; LMULMAX1-RV64-NEXT: vle16.v v8, (a0)
; LMULMAX1-RV64-NEXT: vfmul.vf v8, v8, fa0
; LMULMAX1-RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma
; LMULMAX1-RV64-NEXT: vse64.v v8, (a0)
; LMULMAX1-RV64-NEXT: vsetivli zero, 1, e32, m1, ta, ma
; LMULMAX1-RV64-NEXT: vslidedown.vi v8, v8, 2
; LMULMAX1-RV64-NEXT: addi a0, a0, 8
; LMULMAX1-RV64-NEXT: vse32.v v8, (a0)
; LMULMAX1-RV64-NEXT: ret
%a = load <6 x half>, ptr %x		%a = load <6 x half>, ptr %x
%b = insertelement <6 x half> poison, half %y, i32 0		%b = insertelement <6 x half> poison, half %y, i32 0
%c = shufflevector <6 x half> %b, <6 x half> poison, <6 x i32> zeroinitializer		%c = shufflevector <6 x half> %b, <6 x half> poison, <6 x i32> zeroinitializer
%d = fmul <6 x half> %c, %a		%d = fmul <6 x half> %c, %a
store <6 x half> %d, ptr %x		store <6 x half> %d, ptr %x
ret void		ret void
}		}

▲ Show 20 Lines • Show All 41 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%b = insertelement <8 x half> poison, half %y, i32 0		%b = insertelement <8 x half> poison, half %y, i32 0
%c = shufflevector <8 x half> %b, <8 x half> poison, <8 x i32> zeroinitializer		%c = shufflevector <8 x half> %b, <8 x half> poison, <8 x i32> zeroinitializer
%d = fdiv <8 x half> %a, %c		%d = fdiv <8 x half> %a, %c
store <8 x half> %d, ptr %x		store <8 x half> %d, ptr %x
ret void		ret void
}		}

define void @fdiv_vf_v6f16(ptr %x, half %y) {		define void @fdiv_vf_v6f16(ptr %x, half %y) {
; LMULMAX1-RV32-LABEL: fdiv_vf_v6f16:		; CHECK-LABEL: fdiv_vf_v6f16:
; LMULMAX1-RV32: # %bb.0:		; CHECK: # %bb.0:
; LMULMAX1-RV32-NEXT: vsetivli zero, 8, e16, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 6, e16, m1, ta, ma
; LMULMAX1-RV32-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; LMULMAX1-RV32-NEXT: vfdiv.vf v8, v8, fa0		; CHECK-NEXT: vfdiv.vf v8, v8, fa0
; LMULMAX1-RV32-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vse16.v v8, (a0)
; LMULMAX1-RV32-NEXT: vslidedown.vi v9, v8, 2		; CHECK-NEXT: ret
; LMULMAX1-RV32-NEXT: addi a1, a0, 8
; LMULMAX1-RV32-NEXT: vse32.v v9, (a1)
; LMULMAX1-RV32-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
; LMULMAX1-RV32-NEXT: vse16.v v8, (a0)
; LMULMAX1-RV32-NEXT: ret
;
; LMULMAX1-RV64-LABEL: fdiv_vf_v6f16:
; LMULMAX1-RV64: # %bb.0:
; LMULMAX1-RV64-NEXT: vsetivli zero, 8, e16, m1, ta, ma
; LMULMAX1-RV64-NEXT: vle16.v v8, (a0)
; LMULMAX1-RV64-NEXT: vfdiv.vf v8, v8, fa0
; LMULMAX1-RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma
; LMULMAX1-RV64-NEXT: vse64.v v8, (a0)
; LMULMAX1-RV64-NEXT: vsetivli zero, 1, e32, m1, ta, ma
; LMULMAX1-RV64-NEXT: vslidedown.vi v8, v8, 2
; LMULMAX1-RV64-NEXT: addi a0, a0, 8
; LMULMAX1-RV64-NEXT: vse32.v v8, (a0)
; LMULMAX1-RV64-NEXT: ret
%a = load <6 x half>, ptr %x		%a = load <6 x half>, ptr %x
%b = insertelement <6 x half> poison, half %y, i32 0		%b = insertelement <6 x half> poison, half %y, i32 0
%c = shufflevector <6 x half> %b, <6 x half> poison, <6 x i32> zeroinitializer		%c = shufflevector <6 x half> %b, <6 x half> poison, <6 x i32> zeroinitializer
%d = fdiv <6 x half> %a, %c		%d = fdiv <6 x half> %a, %c
store <6 x half> %d, ptr %x		store <6 x half> %d, ptr %x
ret void		ret void
}		}

▲ Show 20 Lines • Show All 41 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%b = insertelement <8 x half> poison, half %y, i32 0		%b = insertelement <8 x half> poison, half %y, i32 0
%c = shufflevector <8 x half> %b, <8 x half> poison, <8 x i32> zeroinitializer		%c = shufflevector <8 x half> %b, <8 x half> poison, <8 x i32> zeroinitializer
%d = fdiv <8 x half> %c, %a		%d = fdiv <8 x half> %c, %a
store <8 x half> %d, ptr %x		store <8 x half> %d, ptr %x
ret void		ret void
}		}

define void @fdiv_fv_v6f16(ptr %x, half %y) {		define void @fdiv_fv_v6f16(ptr %x, half %y) {
; LMULMAX1-RV32-LABEL: fdiv_fv_v6f16:		; CHECK-LABEL: fdiv_fv_v6f16:
; LMULMAX1-RV32: # %bb.0:		; CHECK: # %bb.0:
; LMULMAX1-RV32-NEXT: vsetivli zero, 8, e16, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 6, e16, m1, ta, ma
; LMULMAX1-RV32-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; LMULMAX1-RV32-NEXT: vfrdiv.vf v8, v8, fa0		; CHECK-NEXT: vfrdiv.vf v8, v8, fa0
; LMULMAX1-RV32-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vse16.v v8, (a0)
; LMULMAX1-RV32-NEXT: vslidedown.vi v9, v8, 2		; CHECK-NEXT: ret
; LMULMAX1-RV32-NEXT: addi a1, a0, 8
; LMULMAX1-RV32-NEXT: vse32.v v9, (a1)
; LMULMAX1-RV32-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
; LMULMAX1-RV32-NEXT: vse16.v v8, (a0)
; LMULMAX1-RV32-NEXT: ret
;
; LMULMAX1-RV64-LABEL: fdiv_fv_v6f16:
; LMULMAX1-RV64: # %bb.0:
; LMULMAX1-RV64-NEXT: vsetivli zero, 8, e16, m1, ta, ma
; LMULMAX1-RV64-NEXT: vle16.v v8, (a0)
; LMULMAX1-RV64-NEXT: vfrdiv.vf v8, v8, fa0
; LMULMAX1-RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma
; LMULMAX1-RV64-NEXT: vse64.v v8, (a0)
; LMULMAX1-RV64-NEXT: vsetivli zero, 1, e32, m1, ta, ma
; LMULMAX1-RV64-NEXT: vslidedown.vi v8, v8, 2
; LMULMAX1-RV64-NEXT: addi a0, a0, 8
; LMULMAX1-RV64-NEXT: vse32.v v8, (a0)
; LMULMAX1-RV64-NEXT: ret
%a = load <6 x half>, ptr %x		%a = load <6 x half>, ptr %x
%b = insertelement <6 x half> poison, half %y, i32 0		%b = insertelement <6 x half> poison, half %y, i32 0
%c = shufflevector <6 x half> %b, <6 x half> poison, <6 x i32> zeroinitializer		%c = shufflevector <6 x half> %b, <6 x half> poison, <6 x i32> zeroinitializer
%d = fdiv <6 x half> %c, %a		%d = fdiv <6 x half> %c, %a
store <6 x half> %d, ptr %x		store <6 x half> %d, ptr %x
ret void		ret void
}		}

▲ Show 20 Lines • Show All 43 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%c = insertelement <8 x half> poison, half %z, i32 0		%c = insertelement <8 x half> poison, half %z, i32 0
%d = shufflevector <8 x half> %c, <8 x half> poison, <8 x i32> zeroinitializer		%d = shufflevector <8 x half> %c, <8 x half> poison, <8 x i32> zeroinitializer
%e = call <8 x half> @llvm.fma.v8f16(<8 x half> %a, <8 x half> %d, <8 x half> %b)		%e = call <8 x half> @llvm.fma.v8f16(<8 x half> %a, <8 x half> %d, <8 x half> %b)
store <8 x half> %e, ptr %x		store <8 x half> %e, ptr %x
ret void		ret void
}		}

define void @fma_vf_v6f16(ptr %x, ptr %y, half %z) {		define void @fma_vf_v6f16(ptr %x, ptr %y, half %z) {
; LMULMAX1-RV32-LABEL: fma_vf_v6f16:		; CHECK-LABEL: fma_vf_v6f16:
; LMULMAX1-RV32: # %bb.0:		; CHECK: # %bb.0:
; LMULMAX1-RV32-NEXT: vsetivli zero, 8, e16, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 6, e16, m1, ta, ma
; LMULMAX1-RV32-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; LMULMAX1-RV32-NEXT: vle16.v v9, (a1)		; CHECK-NEXT: vle16.v v9, (a1)
; LMULMAX1-RV32-NEXT: vfmacc.vf v9, fa0, v8		; CHECK-NEXT: vfmacc.vf v9, fa0, v8
; LMULMAX1-RV32-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vse16.v v9, (a0)
; LMULMAX1-RV32-NEXT: vslidedown.vi v8, v9, 2		; CHECK-NEXT: ret
; LMULMAX1-RV32-NEXT: addi a1, a0, 8
; LMULMAX1-RV32-NEXT: vse32.v v8, (a1)
; LMULMAX1-RV32-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
; LMULMAX1-RV32-NEXT: vse16.v v9, (a0)
; LMULMAX1-RV32-NEXT: ret
;
; LMULMAX1-RV64-LABEL: fma_vf_v6f16:
; LMULMAX1-RV64: # %bb.0:
; LMULMAX1-RV64-NEXT: vsetivli zero, 8, e16, m1, ta, ma
; LMULMAX1-RV64-NEXT: vle16.v v8, (a0)
; LMULMAX1-RV64-NEXT: vle16.v v9, (a1)
; LMULMAX1-RV64-NEXT: vfmacc.vf v9, fa0, v8
; LMULMAX1-RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma
; LMULMAX1-RV64-NEXT: vse64.v v9, (a0)
; LMULMAX1-RV64-NEXT: vsetivli zero, 1, e32, m1, ta, ma
; LMULMAX1-RV64-NEXT: vslidedown.vi v8, v9, 2
; LMULMAX1-RV64-NEXT: addi a0, a0, 8
; LMULMAX1-RV64-NEXT: vse32.v v8, (a0)
; LMULMAX1-RV64-NEXT: ret
%a = load <6 x half>, ptr %x		%a = load <6 x half>, ptr %x
%b = load <6 x half>, ptr %y		%b = load <6 x half>, ptr %y
%c = insertelement <6 x half> poison, half %z, i32 0		%c = insertelement <6 x half> poison, half %z, i32 0
%d = shufflevector <6 x half> %c, <6 x half> poison, <6 x i32> zeroinitializer		%d = shufflevector <6 x half> %c, <6 x half> poison, <6 x i32> zeroinitializer
%e = call <6 x half> @llvm.fma.v6f16(<6 x half> %a, <6 x half> %d, <6 x half> %b)		%e = call <6 x half> @llvm.fma.v6f16(<6 x half> %a, <6 x half> %d, <6 x half> %b)
store <6 x half> %e, ptr %x		store <6 x half> %e, ptr %x
ret void		ret void
}		}
▲ Show 20 Lines • Show All 48 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%c = insertelement <8 x half> poison, half %z, i32 0		%c = insertelement <8 x half> poison, half %z, i32 0
%d = shufflevector <8 x half> %c, <8 x half> poison, <8 x i32> zeroinitializer		%d = shufflevector <8 x half> %c, <8 x half> poison, <8 x i32> zeroinitializer
%e = call <8 x half> @llvm.fma.v8f16(<8 x half> %d, <8 x half> %a, <8 x half> %b)		%e = call <8 x half> @llvm.fma.v8f16(<8 x half> %d, <8 x half> %a, <8 x half> %b)
store <8 x half> %e, ptr %x		store <8 x half> %e, ptr %x
ret void		ret void
}		}

define void @fma_fv_v6f16(ptr %x, ptr %y, half %z) {		define void @fma_fv_v6f16(ptr %x, ptr %y, half %z) {
; LMULMAX1-RV32-LABEL: fma_fv_v6f16:		; CHECK-LABEL: fma_fv_v6f16:
; LMULMAX1-RV32: # %bb.0:		; CHECK: # %bb.0:
; LMULMAX1-RV32-NEXT: vsetivli zero, 8, e16, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 6, e16, m1, ta, ma
; LMULMAX1-RV32-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; LMULMAX1-RV32-NEXT: vle16.v v9, (a1)		; CHECK-NEXT: vle16.v v9, (a1)
; LMULMAX1-RV32-NEXT: vfmacc.vf v9, fa0, v8		; CHECK-NEXT: vfmacc.vf v9, fa0, v8
; LMULMAX1-RV32-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vse16.v v9, (a0)
; LMULMAX1-RV32-NEXT: vslidedown.vi v8, v9, 2		; CHECK-NEXT: ret
; LMULMAX1-RV32-NEXT: addi a1, a0, 8
; LMULMAX1-RV32-NEXT: vse32.v v8, (a1)
; LMULMAX1-RV32-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
; LMULMAX1-RV32-NEXT: vse16.v v9, (a0)
; LMULMAX1-RV32-NEXT: ret
;
; LMULMAX1-RV64-LABEL: fma_fv_v6f16:
; LMULMAX1-RV64: # %bb.0:
; LMULMAX1-RV64-NEXT: vsetivli zero, 8, e16, m1, ta, ma
; LMULMAX1-RV64-NEXT: vle16.v v8, (a0)
; LMULMAX1-RV64-NEXT: vle16.v v9, (a1)
; LMULMAX1-RV64-NEXT: vfmacc.vf v9, fa0, v8
; LMULMAX1-RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma
; LMULMAX1-RV64-NEXT: vse64.v v9, (a0)
; LMULMAX1-RV64-NEXT: vsetivli zero, 1, e32, m1, ta, ma
; LMULMAX1-RV64-NEXT: vslidedown.vi v8, v9, 2
; LMULMAX1-RV64-NEXT: addi a0, a0, 8
; LMULMAX1-RV64-NEXT: vse32.v v8, (a0)
; LMULMAX1-RV64-NEXT: ret
%a = load <6 x half>, ptr %x		%a = load <6 x half>, ptr %x
%b = load <6 x half>, ptr %y		%b = load <6 x half>, ptr %y
%c = insertelement <6 x half> poison, half %z, i32 0		%c = insertelement <6 x half> poison, half %z, i32 0
%d = shufflevector <6 x half> %c, <6 x half> poison, <6 x i32> zeroinitializer		%d = shufflevector <6 x half> %c, <6 x half> poison, <6 x i32> zeroinitializer
%e = call <6 x half> @llvm.fma.v6f16(<6 x half> %d, <6 x half> %a, <6 x half> %b)		%e = call <6 x half> @llvm.fma.v6f16(<6 x half> %d, <6 x half> %a, <6 x half> %b)
store <6 x half> %e, ptr %x		store <6 x half> %e, ptr %x
ret void		ret void
}		}
▲ Show 20 Lines • Show All 49 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%d = shufflevector <8 x half> %c, <8 x half> poison, <8 x i32> zeroinitializer		%d = shufflevector <8 x half> %c, <8 x half> poison, <8 x i32> zeroinitializer
%neg = fneg <8 x half> %b		%neg = fneg <8 x half> %b
%e = call <8 x half> @llvm.fma.v8f16(<8 x half> %a, <8 x half> %d, <8 x half> %neg)		%e = call <8 x half> @llvm.fma.v8f16(<8 x half> %a, <8 x half> %d, <8 x half> %neg)
store <8 x half> %e, ptr %x		store <8 x half> %e, ptr %x
ret void		ret void
}		}

define void @fmsub_vf_v6f16(ptr %x, ptr %y, half %z) {		define void @fmsub_vf_v6f16(ptr %x, ptr %y, half %z) {
; LMULMAX1-RV32-LABEL: fmsub_vf_v6f16:		; CHECK-LABEL: fmsub_vf_v6f16:
; LMULMAX1-RV32: # %bb.0:		; CHECK: # %bb.0:
; LMULMAX1-RV32-NEXT: vsetivli zero, 8, e16, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 6, e16, m1, ta, ma
; LMULMAX1-RV32-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; LMULMAX1-RV32-NEXT: vle16.v v9, (a1)		; CHECK-NEXT: vle16.v v9, (a1)
; LMULMAX1-RV32-NEXT: vfmsac.vf v9, fa0, v8		; CHECK-NEXT: vfmsac.vf v9, fa0, v8
; LMULMAX1-RV32-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vse16.v v9, (a0)
; LMULMAX1-RV32-NEXT: vslidedown.vi v8, v9, 2		; CHECK-NEXT: ret
; LMULMAX1-RV32-NEXT: addi a1, a0, 8
; LMULMAX1-RV32-NEXT: vse32.v v8, (a1)
; LMULMAX1-RV32-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
; LMULMAX1-RV32-NEXT: vse16.v v9, (a0)
; LMULMAX1-RV32-NEXT: ret
;
; LMULMAX1-RV64-LABEL: fmsub_vf_v6f16:
; LMULMAX1-RV64: # %bb.0:
; LMULMAX1-RV64-NEXT: vsetivli zero, 8, e16, m1, ta, ma
; LMULMAX1-RV64-NEXT: vle16.v v8, (a0)
; LMULMAX1-RV64-NEXT: vle16.v v9, (a1)
; LMULMAX1-RV64-NEXT: vfmsac.vf v9, fa0, v8
; LMULMAX1-RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma
; LMULMAX1-RV64-NEXT: vse64.v v9, (a0)
; LMULMAX1-RV64-NEXT: vsetivli zero, 1, e32, m1, ta, ma
; LMULMAX1-RV64-NEXT: vslidedown.vi v8, v9, 2
; LMULMAX1-RV64-NEXT: addi a0, a0, 8
; LMULMAX1-RV64-NEXT: vse32.v v8, (a0)
; LMULMAX1-RV64-NEXT: ret
%a = load <6 x half>, ptr %x		%a = load <6 x half>, ptr %x
%b = load <6 x half>, ptr %y		%b = load <6 x half>, ptr %y
%c = insertelement <6 x half> poison, half %z, i32 0		%c = insertelement <6 x half> poison, half %z, i32 0
%d = shufflevector <6 x half> %c, <6 x half> poison, <6 x i32> zeroinitializer		%d = shufflevector <6 x half> %c, <6 x half> poison, <6 x i32> zeroinitializer
%neg = fneg <6 x half> %b		%neg = fneg <6 x half> %b
%e = call <6 x half> @llvm.fma.v6f16(<6 x half> %a, <6 x half> %d, <6 x half> %neg)		%e = call <6 x half> @llvm.fma.v6f16(<6 x half> %a, <6 x half> %d, <6 x half> %neg)
store <6 x half> %e, ptr %x		store <6 x half> %e, ptr %x
ret void		ret void
▲ Show 20 Lines • Show All 95 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%a = load <8 x half>, ptr %x		%a = load <8 x half>, ptr %x
%b = call <8 x half> @llvm.trunc.v8f16(<8 x half> %a)		%b = call <8 x half> @llvm.trunc.v8f16(<8 x half> %a)
store <8 x half> %b, ptr %x		store <8 x half> %b, ptr %x
ret void		ret void
}		}
declare <8 x half> @llvm.trunc.v8f16(<8 x half>)		declare <8 x half> @llvm.trunc.v8f16(<8 x half>)

define void @trunc_v6f16(ptr %x) {		define void @trunc_v6f16(ptr %x) {
; LMULMAX1-RV32-LABEL: trunc_v6f16:		; CHECK-LABEL: trunc_v6f16:
; LMULMAX1-RV32: # %bb.0:		; CHECK: # %bb.0:
; LMULMAX1-RV32-NEXT: vsetivli zero, 8, e16, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, ma
; LMULMAX1-RV32-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vmset.m v0
; LMULMAX1-RV32-NEXT: lui a1, %hi(.LCPI116_0)		; CHECK-NEXT: vsetivli zero, 6, e16, m1, ta, ma
; LMULMAX1-RV32-NEXT: flh fa5, %lo(.LCPI116_0)(a1)		; CHECK-NEXT: vle16.v v8, (a0)
; LMULMAX1-RV32-NEXT: vfabs.v v9, v8		; CHECK-NEXT: lui a1, %hi(.LCPI116_0)
; LMULMAX1-RV32-NEXT: vmflt.vf v0, v9, fa5		; CHECK-NEXT: flh fa5, %lo(.LCPI116_0)(a1)
; LMULMAX1-RV32-NEXT: vfcvt.rtz.x.f.v v9, v8, v0.t		; CHECK-NEXT: vfabs.v v9, v8, v0.t
; LMULMAX1-RV32-NEXT: vfcvt.f.x.v v9, v9, v0.t		; CHECK-NEXT: vsetvli zero, zero, e16, m1, ta, mu
; LMULMAX1-RV32-NEXT: vsetvli zero, zero, e16, m1, ta, mu		; CHECK-NEXT: vmflt.vf v0, v9, fa5, v0.t
; LMULMAX1-RV32-NEXT: vfsgnj.vv v8, v9, v8, v0.t		; CHECK-NEXT: fsrmi a1, 1
; LMULMAX1-RV32-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vsetvli zero, zero, e16, m1, ta, ma
; LMULMAX1-RV32-NEXT: vslidedown.vi v9, v8, 2		; CHECK-NEXT: vfcvt.x.f.v v9, v8, v0.t
; LMULMAX1-RV32-NEXT: addi a1, a0, 8		; CHECK-NEXT: fsrm a1
; LMULMAX1-RV32-NEXT: vse32.v v9, (a1)		; CHECK-NEXT: vfcvt.f.x.v v9, v9, v0.t
; LMULMAX1-RV32-NEXT: vsetivli zero, 4, e16, mf2, ta, ma		; CHECK-NEXT: vsetvli zero, zero, e16, m1, ta, mu
; LMULMAX1-RV32-NEXT: vse16.v v8, (a0)		; CHECK-NEXT: vfsgnj.vv v8, v9, v8, v0.t
; LMULMAX1-RV32-NEXT: ret		; CHECK-NEXT: vse16.v v8, (a0)
;		; CHECK-NEXT: ret
; LMULMAX1-RV64-LABEL: trunc_v6f16:
; LMULMAX1-RV64: # %bb.0:
; LMULMAX1-RV64-NEXT: vsetivli zero, 8, e16, m1, ta, ma
; LMULMAX1-RV64-NEXT: vle16.v v8, (a0)
; LMULMAX1-RV64-NEXT: lui a1, %hi(.LCPI116_0)
; LMULMAX1-RV64-NEXT: flh fa5, %lo(.LCPI116_0)(a1)
; LMULMAX1-RV64-NEXT: vfabs.v v9, v8
; LMULMAX1-RV64-NEXT: vmflt.vf v0, v9, fa5
; LMULMAX1-RV64-NEXT: vfcvt.rtz.x.f.v v9, v8, v0.t
; LMULMAX1-RV64-NEXT: vfcvt.f.x.v v9, v9, v0.t
; LMULMAX1-RV64-NEXT: vsetvli zero, zero, e16, m1, ta, mu
; LMULMAX1-RV64-NEXT: vfsgnj.vv v8, v9, v8, v0.t
; LMULMAX1-RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma
; LMULMAX1-RV64-NEXT: vse64.v v8, (a0)
; LMULMAX1-RV64-NEXT: vsetivli zero, 1, e32, m1, ta, ma
; LMULMAX1-RV64-NEXT: vslidedown.vi v8, v8, 2
; LMULMAX1-RV64-NEXT: addi a0, a0, 8
; LMULMAX1-RV64-NEXT: vse32.v v8, (a0)
; LMULMAX1-RV64-NEXT: ret
%a = load <6 x half>, ptr %x		%a = load <6 x half>, ptr %x
%b = call <6 x half> @llvm.trunc.v6f16(<6 x half> %a)		%b = call <6 x half> @llvm.trunc.v6f16(<6 x half> %a)
store <6 x half> %b, ptr %x		store <6 x half> %b, ptr %x
ret void		ret void
}		}
declare <6 x half> @llvm.trunc.v6f16(<6 x half>)		declare <6 x half> @llvm.trunc.v6f16(<6 x half>)

define void @trunc_v4f32(ptr %x) {		define void @trunc_v4f32(ptr %x) {
▲ Show 20 Lines • Show All 60 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%a = load <8 x half>, ptr %x		%a = load <8 x half>, ptr %x
%b = call <8 x half> @llvm.ceil.v8f16(<8 x half> %a)		%b = call <8 x half> @llvm.ceil.v8f16(<8 x half> %a)
store <8 x half> %b, ptr %x		store <8 x half> %b, ptr %x
ret void		ret void
}		}
declare <8 x half> @llvm.ceil.v8f16(<8 x half>)		declare <8 x half> @llvm.ceil.v8f16(<8 x half>)

define void @ceil_v6f16(ptr %x) {		define void @ceil_v6f16(ptr %x) {
; LMULMAX1-RV32-LABEL: ceil_v6f16:		; CHECK-LABEL: ceil_v6f16:
; LMULMAX1-RV32: # %bb.0:		; CHECK: # %bb.0:
; LMULMAX1-RV32-NEXT: vsetivli zero, 8, e16, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, ma
; LMULMAX1-RV32-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vmset.m v0
; LMULMAX1-RV32-NEXT: lui a1, %hi(.LCPI120_0)		; CHECK-NEXT: vsetivli zero, 6, e16, m1, ta, ma
; LMULMAX1-RV32-NEXT: flh fa5, %lo(.LCPI120_0)(a1)		; CHECK-NEXT: vle16.v v8, (a0)
; LMULMAX1-RV32-NEXT: vfabs.v v9, v8		; CHECK-NEXT: lui a1, %hi(.LCPI120_0)
; LMULMAX1-RV32-NEXT: vmflt.vf v0, v9, fa5		; CHECK-NEXT: flh fa5, %lo(.LCPI120_0)(a1)
; LMULMAX1-RV32-NEXT: fsrmi a1, 3		; CHECK-NEXT: vfabs.v v9, v8, v0.t
; LMULMAX1-RV32-NEXT: vfcvt.x.f.v v9, v8, v0.t		; CHECK-NEXT: vsetvli zero, zero, e16, m1, ta, mu
; LMULMAX1-RV32-NEXT: fsrm a1		; CHECK-NEXT: vmflt.vf v0, v9, fa5, v0.t
; LMULMAX1-RV32-NEXT: vfcvt.f.x.v v9, v9, v0.t		; CHECK-NEXT: fsrmi a1, 3
; LMULMAX1-RV32-NEXT: vsetvli zero, zero, e16, m1, ta, mu		; CHECK-NEXT: vsetvli zero, zero, e16, m1, ta, ma
; LMULMAX1-RV32-NEXT: vfsgnj.vv v8, v9, v8, v0.t		; CHECK-NEXT: vfcvt.x.f.v v9, v8, v0.t
; LMULMAX1-RV32-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: fsrm a1
; LMULMAX1-RV32-NEXT: vslidedown.vi v9, v8, 2		; CHECK-NEXT: vfcvt.f.x.v v9, v9, v0.t
; LMULMAX1-RV32-NEXT: addi a1, a0, 8		; CHECK-NEXT: vsetvli zero, zero, e16, m1, ta, mu
; LMULMAX1-RV32-NEXT: vse32.v v9, (a1)		; CHECK-NEXT: vfsgnj.vv v8, v9, v8, v0.t
; LMULMAX1-RV32-NEXT: vsetivli zero, 4, e16, mf2, ta, ma		; CHECK-NEXT: vse16.v v8, (a0)
; LMULMAX1-RV32-NEXT: vse16.v v8, (a0)		; CHECK-NEXT: ret
; LMULMAX1-RV32-NEXT: ret
;
; LMULMAX1-RV64-LABEL: ceil_v6f16:
; LMULMAX1-RV64: # %bb.0:
; LMULMAX1-RV64-NEXT: vsetivli zero, 8, e16, m1, ta, ma
; LMULMAX1-RV64-NEXT: vle16.v v8, (a0)
; LMULMAX1-RV64-NEXT: lui a1, %hi(.LCPI120_0)
; LMULMAX1-RV64-NEXT: flh fa5, %lo(.LCPI120_0)(a1)
; LMULMAX1-RV64-NEXT: vfabs.v v9, v8
; LMULMAX1-RV64-NEXT: vmflt.vf v0, v9, fa5
; LMULMAX1-RV64-NEXT: fsrmi a1, 3
; LMULMAX1-RV64-NEXT: vfcvt.x.f.v v9, v8, v0.t
; LMULMAX1-RV64-NEXT: fsrm a1
; LMULMAX1-RV64-NEXT: vfcvt.f.x.v v9, v9, v0.t
; LMULMAX1-RV64-NEXT: vsetvli zero, zero, e16, m1, ta, mu
; LMULMAX1-RV64-NEXT: vfsgnj.vv v8, v9, v8, v0.t
; LMULMAX1-RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma
; LMULMAX1-RV64-NEXT: vse64.v v8, (a0)
; LMULMAX1-RV64-NEXT: vsetivli zero, 1, e32, m1, ta, ma
; LMULMAX1-RV64-NEXT: vslidedown.vi v8, v8, 2
; LMULMAX1-RV64-NEXT: addi a0, a0, 8
; LMULMAX1-RV64-NEXT: vse32.v v8, (a0)
; LMULMAX1-RV64-NEXT: ret
%a = load <6 x half>, ptr %x		%a = load <6 x half>, ptr %x
%b = call <6 x half> @llvm.ceil.v6f16(<6 x half> %a)		%b = call <6 x half> @llvm.ceil.v6f16(<6 x half> %a)
store <6 x half> %b, ptr %x		store <6 x half> %b, ptr %x
ret void		ret void
}		}
declare <6 x half> @llvm.ceil.v6f16(<6 x half>)		declare <6 x half> @llvm.ceil.v6f16(<6 x half>)

define void @ceil_v4f32(ptr %x) {		define void @ceil_v4f32(ptr %x) {
▲ Show 20 Lines • Show All 64 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%a = load <8 x half>, ptr %x		%a = load <8 x half>, ptr %x
%b = call <8 x half> @llvm.floor.v8f16(<8 x half> %a)		%b = call <8 x half> @llvm.floor.v8f16(<8 x half> %a)
store <8 x half> %b, ptr %x		store <8 x half> %b, ptr %x
ret void		ret void
}		}
declare <8 x half> @llvm.floor.v8f16(<8 x half>)		declare <8 x half> @llvm.floor.v8f16(<8 x half>)

define void @floor_v6f16(ptr %x) {		define void @floor_v6f16(ptr %x) {
; LMULMAX1-RV32-LABEL: floor_v6f16:		; CHECK-LABEL: floor_v6f16:
; LMULMAX1-RV32: # %bb.0:		; CHECK: # %bb.0:
; LMULMAX1-RV32-NEXT: vsetivli zero, 8, e16, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, ma
; LMULMAX1-RV32-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vmset.m v0
; LMULMAX1-RV32-NEXT: lui a1, %hi(.LCPI124_0)		; CHECK-NEXT: vsetivli zero, 6, e16, m1, ta, ma
; LMULMAX1-RV32-NEXT: flh fa5, %lo(.LCPI124_0)(a1)		; CHECK-NEXT: vle16.v v8, (a0)
; LMULMAX1-RV32-NEXT: vfabs.v v9, v8		; CHECK-NEXT: lui a1, %hi(.LCPI124_0)
; LMULMAX1-RV32-NEXT: vmflt.vf v0, v9, fa5		; CHECK-NEXT: flh fa5, %lo(.LCPI124_0)(a1)
; LMULMAX1-RV32-NEXT: fsrmi a1, 2		; CHECK-NEXT: vfabs.v v9, v8, v0.t
; LMULMAX1-RV32-NEXT: vfcvt.x.f.v v9, v8, v0.t		; CHECK-NEXT: vsetvli zero, zero, e16, m1, ta, mu
; LMULMAX1-RV32-NEXT: fsrm a1		; CHECK-NEXT: vmflt.vf v0, v9, fa5, v0.t
; LMULMAX1-RV32-NEXT: vfcvt.f.x.v v9, v9, v0.t		; CHECK-NEXT: fsrmi a1, 2
; LMULMAX1-RV32-NEXT: vsetvli zero, zero, e16, m1, ta, mu		; CHECK-NEXT: vsetvli zero, zero, e16, m1, ta, ma
; LMULMAX1-RV32-NEXT: vfsgnj.vv v8, v9, v8, v0.t		; CHECK-NEXT: vfcvt.x.f.v v9, v8, v0.t
; LMULMAX1-RV32-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: fsrm a1
; LMULMAX1-RV32-NEXT: vslidedown.vi v9, v8, 2		; CHECK-NEXT: vfcvt.f.x.v v9, v9, v0.t
; LMULMAX1-RV32-NEXT: addi a1, a0, 8		; CHECK-NEXT: vsetvli zero, zero, e16, m1, ta, mu
; LMULMAX1-RV32-NEXT: vse32.v v9, (a1)		; CHECK-NEXT: vfsgnj.vv v8, v9, v8, v0.t
; LMULMAX1-RV32-NEXT: vsetivli zero, 4, e16, mf2, ta, ma		; CHECK-NEXT: vse16.v v8, (a0)
; LMULMAX1-RV32-NEXT: vse16.v v8, (a0)		; CHECK-NEXT: ret
; LMULMAX1-RV32-NEXT: ret
;
; LMULMAX1-RV64-LABEL: floor_v6f16:
; LMULMAX1-RV64: # %bb.0:
; LMULMAX1-RV64-NEXT: vsetivli zero, 8, e16, m1, ta, ma
; LMULMAX1-RV64-NEXT: vle16.v v8, (a0)
; LMULMAX1-RV64-NEXT: lui a1, %hi(.LCPI124_0)
; LMULMAX1-RV64-NEXT: flh fa5, %lo(.LCPI124_0)(a1)
; LMULMAX1-RV64-NEXT: vfabs.v v9, v8
; LMULMAX1-RV64-NEXT: vmflt.vf v0, v9, fa5
; LMULMAX1-RV64-NEXT: fsrmi a1, 2
; LMULMAX1-RV64-NEXT: vfcvt.x.f.v v9, v8, v0.t
; LMULMAX1-RV64-NEXT: fsrm a1
; LMULMAX1-RV64-NEXT: vfcvt.f.x.v v9, v9, v0.t
; LMULMAX1-RV64-NEXT: vsetvli zero, zero, e16, m1, ta, mu
; LMULMAX1-RV64-NEXT: vfsgnj.vv v8, v9, v8, v0.t
; LMULMAX1-RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma
; LMULMAX1-RV64-NEXT: vse64.v v8, (a0)
; LMULMAX1-RV64-NEXT: vsetivli zero, 1, e32, m1, ta, ma
; LMULMAX1-RV64-NEXT: vslidedown.vi v8, v8, 2
; LMULMAX1-RV64-NEXT: addi a0, a0, 8
; LMULMAX1-RV64-NEXT: vse32.v v8, (a0)
; LMULMAX1-RV64-NEXT: ret
%a = load <6 x half>, ptr %x		%a = load <6 x half>, ptr %x
%b = call <6 x half> @llvm.floor.v6f16(<6 x half> %a)		%b = call <6 x half> @llvm.floor.v6f16(<6 x half> %a)
store <6 x half> %b, ptr %x		store <6 x half> %b, ptr %x
ret void		ret void
}		}
declare <6 x half> @llvm.floor.v6f16(<6 x half>)		declare <6 x half> @llvm.floor.v6f16(<6 x half>)

define void @floor_v4f32(ptr %x) {		define void @floor_v4f32(ptr %x) {
▲ Show 20 Lines • Show All 64 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%a = load <8 x half>, ptr %x		%a = load <8 x half>, ptr %x
%b = call <8 x half> @llvm.round.v8f16(<8 x half> %a)		%b = call <8 x half> @llvm.round.v8f16(<8 x half> %a)
store <8 x half> %b, ptr %x		store <8 x half> %b, ptr %x
ret void		ret void
}		}
declare <8 x half> @llvm.round.v8f16(<8 x half>)		declare <8 x half> @llvm.round.v8f16(<8 x half>)

define void @round_v6f16(ptr %x) {		define void @round_v6f16(ptr %x) {
; LMULMAX1-RV32-LABEL: round_v6f16:		; CHECK-LABEL: round_v6f16:
; LMULMAX1-RV32: # %bb.0:		; CHECK: # %bb.0:
; LMULMAX1-RV32-NEXT: vsetivli zero, 8, e16, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, ma
; LMULMAX1-RV32-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vmset.m v0
; LMULMAX1-RV32-NEXT: lui a1, %hi(.LCPI128_0)		; CHECK-NEXT: vsetivli zero, 6, e16, m1, ta, ma
; LMULMAX1-RV32-NEXT: flh fa5, %lo(.LCPI128_0)(a1)		; CHECK-NEXT: vle16.v v8, (a0)
; LMULMAX1-RV32-NEXT: vfabs.v v9, v8		; CHECK-NEXT: lui a1, %hi(.LCPI128_0)
; LMULMAX1-RV32-NEXT: vmflt.vf v0, v9, fa5		; CHECK-NEXT: flh fa5, %lo(.LCPI128_0)(a1)
; LMULMAX1-RV32-NEXT: fsrmi a1, 4		; CHECK-NEXT: vfabs.v v9, v8, v0.t
; LMULMAX1-RV32-NEXT: vfcvt.x.f.v v9, v8, v0.t		; CHECK-NEXT: vsetvli zero, zero, e16, m1, ta, mu
; LMULMAX1-RV32-NEXT: fsrm a1		; CHECK-NEXT: vmflt.vf v0, v9, fa5, v0.t
; LMULMAX1-RV32-NEXT: vfcvt.f.x.v v9, v9, v0.t		; CHECK-NEXT: fsrmi a1, 4
; LMULMAX1-RV32-NEXT: vsetvli zero, zero, e16, m1, ta, mu		; CHECK-NEXT: vsetvli zero, zero, e16, m1, ta, ma
; LMULMAX1-RV32-NEXT: vfsgnj.vv v8, v9, v8, v0.t		; CHECK-NEXT: vfcvt.x.f.v v9, v8, v0.t
; LMULMAX1-RV32-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: fsrm a1
; LMULMAX1-RV32-NEXT: vslidedown.vi v9, v8, 2		; CHECK-NEXT: vfcvt.f.x.v v9, v9, v0.t
; LMULMAX1-RV32-NEXT: addi a1, a0, 8		; CHECK-NEXT: vsetvli zero, zero, e16, m1, ta, mu
; LMULMAX1-RV32-NEXT: vse32.v v9, (a1)		; CHECK-NEXT: vfsgnj.vv v8, v9, v8, v0.t
; LMULMAX1-RV32-NEXT: vsetivli zero, 4, e16, mf2, ta, ma		; CHECK-NEXT: vse16.v v8, (a0)
; LMULMAX1-RV32-NEXT: vse16.v v8, (a0)		; CHECK-NEXT: ret
; LMULMAX1-RV32-NEXT: ret
;
; LMULMAX1-RV64-LABEL: round_v6f16:
; LMULMAX1-RV64: # %bb.0:
; LMULMAX1-RV64-NEXT: vsetivli zero, 8, e16, m1, ta, ma
; LMULMAX1-RV64-NEXT: vle16.v v8, (a0)
; LMULMAX1-RV64-NEXT: lui a1, %hi(.LCPI128_0)
; LMULMAX1-RV64-NEXT: flh fa5, %lo(.LCPI128_0)(a1)
; LMULMAX1-RV64-NEXT: vfabs.v v9, v8
; LMULMAX1-RV64-NEXT: vmflt.vf v0, v9, fa5
; LMULMAX1-RV64-NEXT: fsrmi a1, 4
; LMULMAX1-RV64-NEXT: vfcvt.x.f.v v9, v8, v0.t
; LMULMAX1-RV64-NEXT: fsrm a1
; LMULMAX1-RV64-NEXT: vfcvt.f.x.v v9, v9, v0.t
; LMULMAX1-RV64-NEXT: vsetvli zero, zero, e16, m1, ta, mu
; LMULMAX1-RV64-NEXT: vfsgnj.vv v8, v9, v8, v0.t
; LMULMAX1-RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma
; LMULMAX1-RV64-NEXT: vse64.v v8, (a0)
; LMULMAX1-RV64-NEXT: vsetivli zero, 1, e32, m1, ta, ma
; LMULMAX1-RV64-NEXT: vslidedown.vi v8, v8, 2
; LMULMAX1-RV64-NEXT: addi a0, a0, 8
; LMULMAX1-RV64-NEXT: vse32.v v8, (a0)
; LMULMAX1-RV64-NEXT: ret
%a = load <6 x half>, ptr %x		%a = load <6 x half>, ptr %x
%b = call <6 x half> @llvm.round.v6f16(<6 x half> %a)		%b = call <6 x half> @llvm.round.v6f16(<6 x half> %a)
store <6 x half> %b, ptr %x		store <6 x half> %b, ptr %x
ret void		ret void
}		}
declare <6 x half> @llvm.round.v6f16(<6 x half>)		declare <6 x half> @llvm.round.v6f16(<6 x half>)

define void @round_v4f32(ptr %x) {		define void @round_v4f32(ptr %x) {
▲ Show 20 Lines • Show All 59 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%c = load <8 x half>, ptr %z		%c = load <8 x half>, ptr %z
%d = call <8 x half> @llvm.fmuladd.v8f16(<8 x half> %a, <8 x half> %b, <8 x half> %c)		%d = call <8 x half> @llvm.fmuladd.v8f16(<8 x half> %a, <8 x half> %b, <8 x half> %c)
store <8 x half> %d, ptr %x		store <8 x half> %d, ptr %x
ret void		ret void
}		}
declare <8 x half> @llvm.fmuladd.v8f16(<8 x half>, <8 x half>, <8 x half>)		declare <8 x half> @llvm.fmuladd.v8f16(<8 x half>, <8 x half>, <8 x half>)

define void @fmuladd_v6f16(ptr %x, ptr %y, ptr %z) {		define void @fmuladd_v6f16(ptr %x, ptr %y, ptr %z) {
; LMULMAX1-RV32-LABEL: fmuladd_v6f16:		; CHECK-LABEL: fmuladd_v6f16:
; LMULMAX1-RV32: # %bb.0:		; CHECK: # %bb.0:
; LMULMAX1-RV32-NEXT: vsetivli zero, 8, e16, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 6, e16, m1, ta, ma
; LMULMAX1-RV32-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; LMULMAX1-RV32-NEXT: vle16.v v9, (a1)		; CHECK-NEXT: vle16.v v9, (a1)
; LMULMAX1-RV32-NEXT: vle16.v v10, (a2)		; CHECK-NEXT: vle16.v v10, (a2)
; LMULMAX1-RV32-NEXT: vfmacc.vv v10, v8, v9		; CHECK-NEXT: vfmacc.vv v10, v8, v9
; LMULMAX1-RV32-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vse16.v v10, (a0)
; LMULMAX1-RV32-NEXT: vslidedown.vi v8, v10, 2		; CHECK-NEXT: ret
; LMULMAX1-RV32-NEXT: addi a1, a0, 8
; LMULMAX1-RV32-NEXT: vse32.v v8, (a1)
; LMULMAX1-RV32-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
; LMULMAX1-RV32-NEXT: vse16.v v10, (a0)
; LMULMAX1-RV32-NEXT: ret
;
; LMULMAX1-RV64-LABEL: fmuladd_v6f16:
; LMULMAX1-RV64: # %bb.0:
; LMULMAX1-RV64-NEXT: vsetivli zero, 8, e16, m1, ta, ma
; LMULMAX1-RV64-NEXT: vle16.v v8, (a0)
; LMULMAX1-RV64-NEXT: vle16.v v9, (a1)
; LMULMAX1-RV64-NEXT: vle16.v v10, (a2)
; LMULMAX1-RV64-NEXT: vfmacc.vv v10, v8, v9
; LMULMAX1-RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma
; LMULMAX1-RV64-NEXT: vse64.v v10, (a0)
; LMULMAX1-RV64-NEXT: vsetivli zero, 1, e32, m1, ta, ma
; LMULMAX1-RV64-NEXT: vslidedown.vi v8, v10, 2
; LMULMAX1-RV64-NEXT: addi a0, a0, 8
; LMULMAX1-RV64-NEXT: vse32.v v8, (a0)
; LMULMAX1-RV64-NEXT: ret
%a = load <6 x half>, ptr %x		%a = load <6 x half>, ptr %x
%b = load <6 x half>, ptr %y		%b = load <6 x half>, ptr %y
%c = load <6 x half>, ptr %z		%c = load <6 x half>, ptr %z
%d = call <6 x half> @llvm.fmuladd.v6f16(<6 x half> %a, <6 x half> %b, <6 x half> %c)		%d = call <6 x half> @llvm.fmuladd.v6f16(<6 x half> %a, <6 x half> %b, <6 x half> %c)
store <6 x half> %d, ptr %x		store <6 x half> %d, ptr %x
ret void		ret void
}		}
declare <6 x half> @llvm.fmuladd.v6f16(<6 x half>, <6 x half>, <6 x half>)		declare <6 x half> @llvm.fmuladd.v6f16(<6 x half>, <6 x half>, <6 x half>)
▲ Show 20 Lines • Show All 51 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%c = load <8 x half>, ptr %z		%c = load <8 x half>, ptr %z
%neg = fneg <8 x half> %c		%neg = fneg <8 x half> %c
%d = call <8 x half> @llvm.fmuladd.v8f16(<8 x half> %a, <8 x half> %b, <8 x half> %neg)		%d = call <8 x half> @llvm.fmuladd.v8f16(<8 x half> %a, <8 x half> %b, <8 x half> %neg)
store <8 x half> %d, ptr %x		store <8 x half> %d, ptr %x
ret void		ret void
}		}

define void @fmsub_fmuladd_v6f16(ptr %x, ptr %y, ptr %z) {		define void @fmsub_fmuladd_v6f16(ptr %x, ptr %y, ptr %z) {
; LMULMAX1-RV32-LABEL: fmsub_fmuladd_v6f16:		; CHECK-LABEL: fmsub_fmuladd_v6f16:
; LMULMAX1-RV32: # %bb.0:		; CHECK: # %bb.0:
; LMULMAX1-RV32-NEXT: vsetivli zero, 8, e16, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 6, e16, m1, ta, ma
; LMULMAX1-RV32-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; LMULMAX1-RV32-NEXT: vle16.v v9, (a1)		; CHECK-NEXT: vle16.v v9, (a1)
; LMULMAX1-RV32-NEXT: vle16.v v10, (a2)		; CHECK-NEXT: vle16.v v10, (a2)
; LMULMAX1-RV32-NEXT: vfmsac.vv v10, v8, v9		; CHECK-NEXT: vfmsac.vv v10, v8, v9
; LMULMAX1-RV32-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vse16.v v10, (a0)
; LMULMAX1-RV32-NEXT: vslidedown.vi v8, v10, 2		; CHECK-NEXT: ret
; LMULMAX1-RV32-NEXT: addi a1, a0, 8
; LMULMAX1-RV32-NEXT: vse32.v v8, (a1)
; LMULMAX1-RV32-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
; LMULMAX1-RV32-NEXT: vse16.v v10, (a0)
; LMULMAX1-RV32-NEXT: ret
;
; LMULMAX1-RV64-LABEL: fmsub_fmuladd_v6f16:
; LMULMAX1-RV64: # %bb.0:
; LMULMAX1-RV64-NEXT: vsetivli zero, 8, e16, m1, ta, ma
; LMULMAX1-RV64-NEXT: vle16.v v8, (a0)
; LMULMAX1-RV64-NEXT: vle16.v v9, (a1)
; LMULMAX1-RV64-NEXT: vle16.v v10, (a2)
; LMULMAX1-RV64-NEXT: vfmsac.vv v10, v8, v9
; LMULMAX1-RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma
; LMULMAX1-RV64-NEXT: vse64.v v10, (a0)
; LMULMAX1-RV64-NEXT: vsetivli zero, 1, e32, m1, ta, ma
; LMULMAX1-RV64-NEXT: vslidedown.vi v8, v10, 2
; LMULMAX1-RV64-NEXT: addi a0, a0, 8
; LMULMAX1-RV64-NEXT: vse32.v v8, (a0)
; LMULMAX1-RV64-NEXT: ret
%a = load <6 x half>, ptr %x		%a = load <6 x half>, ptr %x
%b = load <6 x half>, ptr %y		%b = load <6 x half>, ptr %y
%c = load <6 x half>, ptr %z		%c = load <6 x half>, ptr %z
%neg = fneg <6 x half> %c		%neg = fneg <6 x half> %c
%d = call <6 x half> @llvm.fmuladd.v6f16(<6 x half> %a, <6 x half> %b, <6 x half> %neg)		%d = call <6 x half> @llvm.fmuladd.v6f16(<6 x half> %a, <6 x half> %b, <6 x half> %neg)
store <6 x half> %d, ptr %x		store <6 x half> %d, ptr %x
ret void		ret void
}		}
Show All 39 Lines

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-fp2i.ll

	Show First 20 Lines • Show All 73 Lines • ▼ Show 20 Lines
	; CHECK-NEXT: vand.vi v8, v9, 1			; CHECK-NEXT: vand.vi v8, v9, 1
	; CHECK-NEXT: vmsne.vi v0, v8, 0			; CHECK-NEXT: vmsne.vi v0, v8, 0
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%z = fptoui <2 x float> %x to <2 x i1>			%z = fptoui <2 x float> %x to <2 x i1>
	ret <2 x i1> %z			ret <2 x i1> %z
	}			}

	define void @fp2si_v3f32_v3i32(ptr %x, ptr %y) {			define void @fp2si_v3f32_v3i32(ptr %x, ptr %y) {
	; LMULMAX8RV32-LABEL: fp2si_v3f32_v3i32:			; CHECK-LABEL: fp2si_v3f32_v3i32:
	; LMULMAX8RV32: # %bb.0:			; CHECK: # %bb.0:
	; LMULMAX8RV32-NEXT: vsetivli zero, 4, e32, m1, ta, ma			; CHECK-NEXT: vsetivli zero, 3, e32, m1, ta, ma
	; LMULMAX8RV32-NEXT: vle32.v v8, (a0)			; CHECK-NEXT: vle32.v v8, (a0)
	; LMULMAX8RV32-NEXT: vfcvt.rtz.x.f.v v8, v8			; CHECK-NEXT: vfcvt.rtz.x.f.v v8, v8
	; LMULMAX8RV32-NEXT: vsetivli zero, 1, e32, m1, ta, ma			; CHECK-NEXT: vse32.v v8, (a1)
	; LMULMAX8RV32-NEXT: vslidedown.vi v9, v8, 2			; CHECK-NEXT: ret
	; LMULMAX8RV32-NEXT: addi a0, a1, 8
	; LMULMAX8RV32-NEXT: vse32.v v9, (a0)
	; LMULMAX8RV32-NEXT: vsetivli zero, 2, e32, mf2, ta, ma
	; LMULMAX8RV32-NEXT: vse32.v v8, (a1)
	; LMULMAX8RV32-NEXT: ret
	;
	; LMULMAX8RV64-LABEL: fp2si_v3f32_v3i32:
	; LMULMAX8RV64: # %bb.0:
	; LMULMAX8RV64-NEXT: vsetivli zero, 4, e32, m1, ta, ma
	; LMULMAX8RV64-NEXT: vle32.v v8, (a0)
	; LMULMAX8RV64-NEXT: vfcvt.rtz.x.f.v v8, v8
	; LMULMAX8RV64-NEXT: vsetivli zero, 1, e32, m1, ta, ma
	; LMULMAX8RV64-NEXT: vslidedown.vi v9, v8, 2
	; LMULMAX8RV64-NEXT: addi a0, a1, 8
	; LMULMAX8RV64-NEXT: vse32.v v9, (a0)
	; LMULMAX8RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma
	; LMULMAX8RV64-NEXT: vse64.v v8, (a1)
	; LMULMAX8RV64-NEXT: ret
	;
	; LMULMAX1RV32-LABEL: fp2si_v3f32_v3i32:
	; LMULMAX1RV32: # %bb.0:
	; LMULMAX1RV32-NEXT: vsetivli zero, 4, e32, m1, ta, ma
	; LMULMAX1RV32-NEXT: vle32.v v8, (a0)
	; LMULMAX1RV32-NEXT: vfcvt.rtz.x.f.v v8, v8
	; LMULMAX1RV32-NEXT: vsetivli zero, 1, e32, m1, ta, ma
	; LMULMAX1RV32-NEXT: vslidedown.vi v9, v8, 2
	; LMULMAX1RV32-NEXT: addi a0, a1, 8
	; LMULMAX1RV32-NEXT: vse32.v v9, (a0)
	; LMULMAX1RV32-NEXT: vsetivli zero, 2, e32, mf2, ta, ma
	; LMULMAX1RV32-NEXT: vse32.v v8, (a1)
	; LMULMAX1RV32-NEXT: ret
	;
	; LMULMAX1RV64-LABEL: fp2si_v3f32_v3i32:
	; LMULMAX1RV64: # %bb.0:
	; LMULMAX1RV64-NEXT: vsetivli zero, 4, e32, m1, ta, ma
	; LMULMAX1RV64-NEXT: vle32.v v8, (a0)
	; LMULMAX1RV64-NEXT: vfcvt.rtz.x.f.v v8, v8
	; LMULMAX1RV64-NEXT: vsetivli zero, 1, e32, m1, ta, ma
	; LMULMAX1RV64-NEXT: vslidedown.vi v9, v8, 2
	; LMULMAX1RV64-NEXT: addi a0, a1, 8
	; LMULMAX1RV64-NEXT: vse32.v v9, (a0)
	; LMULMAX1RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma
	; LMULMAX1RV64-NEXT: vse64.v v8, (a1)
	; LMULMAX1RV64-NEXT: ret
	%a = load <3 x float>, ptr %x			%a = load <3 x float>, ptr %x
	%d = fptosi <3 x float> %a to <3 x i32>			%d = fptosi <3 x float> %a to <3 x i32>
	store <3 x i32> %d, ptr %y			store <3 x i32> %d, ptr %y
	ret void			ret void
	}			}

	define void @fp2ui_v3f32_v3i32(ptr %x, ptr %y) {			define void @fp2ui_v3f32_v3i32(ptr %x, ptr %y) {
	; LMULMAX8RV32-LABEL: fp2ui_v3f32_v3i32:			; CHECK-LABEL: fp2ui_v3f32_v3i32:
	; LMULMAX8RV32: # %bb.0:			; CHECK: # %bb.0:
	; LMULMAX8RV32-NEXT: vsetivli zero, 4, e32, m1, ta, ma			; CHECK-NEXT: vsetivli zero, 3, e32, m1, ta, ma
	; LMULMAX8RV32-NEXT: vle32.v v8, (a0)			; CHECK-NEXT: vle32.v v8, (a0)
	; LMULMAX8RV32-NEXT: vfcvt.rtz.xu.f.v v8, v8			; CHECK-NEXT: vfcvt.rtz.xu.f.v v8, v8
	; LMULMAX8RV32-NEXT: vsetivli zero, 1, e32, m1, ta, ma			; CHECK-NEXT: vse32.v v8, (a1)
	; LMULMAX8RV32-NEXT: vslidedown.vi v9, v8, 2			; CHECK-NEXT: ret
	; LMULMAX8RV32-NEXT: addi a0, a1, 8
	; LMULMAX8RV32-NEXT: vse32.v v9, (a0)
	; LMULMAX8RV32-NEXT: vsetivli zero, 2, e32, mf2, ta, ma
	; LMULMAX8RV32-NEXT: vse32.v v8, (a1)
	; LMULMAX8RV32-NEXT: ret
	;
	; LMULMAX8RV64-LABEL: fp2ui_v3f32_v3i32:
	; LMULMAX8RV64: # %bb.0:
	; LMULMAX8RV64-NEXT: vsetivli zero, 4, e32, m1, ta, ma
	; LMULMAX8RV64-NEXT: vle32.v v8, (a0)
	; LMULMAX8RV64-NEXT: vfcvt.rtz.xu.f.v v8, v8
	; LMULMAX8RV64-NEXT: vsetivli zero, 1, e32, m1, ta, ma
	; LMULMAX8RV64-NEXT: vslidedown.vi v9, v8, 2
	; LMULMAX8RV64-NEXT: addi a0, a1, 8
	; LMULMAX8RV64-NEXT: vse32.v v9, (a0)
	; LMULMAX8RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma
	; LMULMAX8RV64-NEXT: vse64.v v8, (a1)
	; LMULMAX8RV64-NEXT: ret
	;
	; LMULMAX1RV32-LABEL: fp2ui_v3f32_v3i32:
	; LMULMAX1RV32: # %bb.0:
	; LMULMAX1RV32-NEXT: vsetivli zero, 4, e32, m1, ta, ma
	; LMULMAX1RV32-NEXT: vle32.v v8, (a0)
	; LMULMAX1RV32-NEXT: vfcvt.rtz.xu.f.v v8, v8
	; LMULMAX1RV32-NEXT: vsetivli zero, 1, e32, m1, ta, ma
	; LMULMAX1RV32-NEXT: vslidedown.vi v9, v8, 2
	; LMULMAX1RV32-NEXT: addi a0, a1, 8
	; LMULMAX1RV32-NEXT: vse32.v v9, (a0)
	; LMULMAX1RV32-NEXT: vsetivli zero, 2, e32, mf2, ta, ma
	; LMULMAX1RV32-NEXT: vse32.v v8, (a1)
	; LMULMAX1RV32-NEXT: ret
	;
	; LMULMAX1RV64-LABEL: fp2ui_v3f32_v3i32:
	; LMULMAX1RV64: # %bb.0:
	; LMULMAX1RV64-NEXT: vsetivli zero, 4, e32, m1, ta, ma
	; LMULMAX1RV64-NEXT: vle32.v v8, (a0)
	; LMULMAX1RV64-NEXT: vfcvt.rtz.xu.f.v v8, v8
	; LMULMAX1RV64-NEXT: vsetivli zero, 1, e32, m1, ta, ma
	; LMULMAX1RV64-NEXT: vslidedown.vi v9, v8, 2
	; LMULMAX1RV64-NEXT: addi a0, a1, 8
	; LMULMAX1RV64-NEXT: vse32.v v9, (a0)
	; LMULMAX1RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma
	; LMULMAX1RV64-NEXT: vse64.v v8, (a1)
	; LMULMAX1RV64-NEXT: ret
	%a = load <3 x float>, ptr %x			%a = load <3 x float>, ptr %x
	%d = fptoui <3 x float> %a to <3 x i32>			%d = fptoui <3 x float> %a to <3 x i32>
	store <3 x i32> %d, ptr %y			store <3 x i32> %d, ptr %y
	ret void			ret void
	}			}

	define <3 x i1> @fp2si_v3f32_v3i1(<3 x float> %x) {			define <3 x i1> @fp2si_v3f32_v3i1(<3 x float> %x) {
	; CHECK-LABEL: fp2si_v3f32_v3i1:			; CHECK-LABEL: fp2si_v3f32_v3i1:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, ma			; CHECK-NEXT: vsetivli zero, 3, e32, m1, ta, ma
	; CHECK-NEXT: vfncvt.rtz.x.f.w v9, v8			; CHECK-NEXT: vfcvt.rtz.x.f.v v8, v8
	; CHECK-NEXT: vand.vi v8, v9, 1
	; CHECK-NEXT: vmsne.vi v0, v8, 0			; CHECK-NEXT: vmsne.vi v0, v8, 0
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%z = fptosi <3 x float> %x to <3 x i1>			%z = fptosi <3 x float> %x to <3 x i1>
	ret <3 x i1> %z			ret <3 x i1> %z
	}			}

	; FIXME: This is expanded when they could be widened + promoted			; FIXME: This is expanded when they could be widened + promoted
	define <3 x i15> @fp2si_v3f32_v3i15(<3 x float> %x) {			define <3 x i15> @fp2si_v3f32_v3i15(<3 x float> %x) {
	▲ Show 20 Lines • Show All 195 Lines • ▼ Show 20 Lines
	; LMULMAX1RV64-NEXT: ret			; LMULMAX1RV64-NEXT: ret
	%z = fptoui <3 x float> %x to <3 x i15>			%z = fptoui <3 x float> %x to <3 x i15>
	ret <3 x i15> %z			ret <3 x i15> %z
	}			}

	define <3 x i1> @fp2ui_v3f32_v3i1(<3 x float> %x) {			define <3 x i1> @fp2ui_v3f32_v3i1(<3 x float> %x) {
	; CHECK-LABEL: fp2ui_v3f32_v3i1:			; CHECK-LABEL: fp2ui_v3f32_v3i1:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, ma			; CHECK-NEXT: vsetivli zero, 3, e32, m1, ta, ma
	; CHECK-NEXT: vfncvt.rtz.xu.f.w v9, v8			; CHECK-NEXT: vfcvt.rtz.xu.f.v v8, v8
	; CHECK-NEXT: vand.vi v8, v9, 1
	; CHECK-NEXT: vmsne.vi v0, v8, 0			; CHECK-NEXT: vmsne.vi v0, v8, 0
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%z = fptoui <3 x float> %x to <3 x i1>			%z = fptoui <3 x float> %x to <3 x i1>
	ret <3 x i1> %z			ret <3 x i1> %z
	}			}

	define void @fp2si_v8f32_v8i32(ptr %x, ptr %y) {			define void @fp2si_v8f32_v8i32(ptr %x, ptr %y) {
	; LMULMAX8-LABEL: fp2si_v8f32_v8i32:			; LMULMAX8-LABEL: fp2si_v8f32_v8i32:
	▲ Show 20 Lines • Show All 569 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-i2fp.ll

	Show First 20 Lines • Show All 79 Lines • ▼ Show 20 Lines
	; CHECK-NEXT: vmerge.vim v9, v8, 1, v0			; CHECK-NEXT: vmerge.vim v9, v8, 1, v0
	; CHECK-NEXT: vfwcvt.f.xu.v v8, v9			; CHECK-NEXT: vfwcvt.f.xu.v v8, v9
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%z = uitofp <2 x i1> %x to <2 x float>			%z = uitofp <2 x i1> %x to <2 x float>
	ret <2 x float> %z			ret <2 x float> %z
	}			}

	define void @si2fp_v3i32_v3f32(ptr %x, ptr %y) {			define void @si2fp_v3i32_v3f32(ptr %x, ptr %y) {
	; LMULMAX8RV32-LABEL: si2fp_v3i32_v3f32:			; CHECK-LABEL: si2fp_v3i32_v3f32:
	; LMULMAX8RV32: # %bb.0:			; CHECK: # %bb.0:
	; LMULMAX8RV32-NEXT: vsetivli zero, 4, e32, m1, ta, ma			; CHECK-NEXT: vsetivli zero, 3, e32, m1, ta, ma
	; LMULMAX8RV32-NEXT: vle32.v v8, (a0)			; CHECK-NEXT: vle32.v v8, (a0)
	; LMULMAX8RV32-NEXT: vfcvt.f.x.v v8, v8			; CHECK-NEXT: vfcvt.f.x.v v8, v8
	; LMULMAX8RV32-NEXT: vsetivli zero, 1, e32, m1, ta, ma			; CHECK-NEXT: vse32.v v8, (a1)
	; LMULMAX8RV32-NEXT: vslidedown.vi v9, v8, 2			; CHECK-NEXT: ret
	; LMULMAX8RV32-NEXT: addi a0, a1, 8
	; LMULMAX8RV32-NEXT: vse32.v v9, (a0)
	; LMULMAX8RV32-NEXT: vsetivli zero, 2, e32, mf2, ta, ma
	; LMULMAX8RV32-NEXT: vse32.v v8, (a1)
	; LMULMAX8RV32-NEXT: ret
	;
	; LMULMAX8RV64-LABEL: si2fp_v3i32_v3f32:
	; LMULMAX8RV64: # %bb.0:
	; LMULMAX8RV64-NEXT: vsetivli zero, 4, e32, m1, ta, ma
	; LMULMAX8RV64-NEXT: vle32.v v8, (a0)
	; LMULMAX8RV64-NEXT: vfcvt.f.x.v v8, v8
	; LMULMAX8RV64-NEXT: vsetivli zero, 1, e32, m1, ta, ma
	; LMULMAX8RV64-NEXT: vslidedown.vi v9, v8, 2
	; LMULMAX8RV64-NEXT: addi a0, a1, 8
	; LMULMAX8RV64-NEXT: vse32.v v9, (a0)
	; LMULMAX8RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma
	; LMULMAX8RV64-NEXT: vse64.v v8, (a1)
	; LMULMAX8RV64-NEXT: ret
	;
	; LMULMAX1RV32-LABEL: si2fp_v3i32_v3f32:
	; LMULMAX1RV32: # %bb.0:
	; LMULMAX1RV32-NEXT: vsetivli zero, 4, e32, m1, ta, ma
	; LMULMAX1RV32-NEXT: vle32.v v8, (a0)
	; LMULMAX1RV32-NEXT: vfcvt.f.x.v v8, v8
	; LMULMAX1RV32-NEXT: vsetivli zero, 1, e32, m1, ta, ma
	; LMULMAX1RV32-NEXT: vslidedown.vi v9, v8, 2
	; LMULMAX1RV32-NEXT: addi a0, a1, 8
	; LMULMAX1RV32-NEXT: vse32.v v9, (a0)
	; LMULMAX1RV32-NEXT: vsetivli zero, 2, e32, mf2, ta, ma
	; LMULMAX1RV32-NEXT: vse32.v v8, (a1)
	; LMULMAX1RV32-NEXT: ret
	;
	; LMULMAX1RV64-LABEL: si2fp_v3i32_v3f32:
	; LMULMAX1RV64: # %bb.0:
	; LMULMAX1RV64-NEXT: vsetivli zero, 4, e32, m1, ta, ma
	; LMULMAX1RV64-NEXT: vle32.v v8, (a0)
	; LMULMAX1RV64-NEXT: vfcvt.f.x.v v8, v8
	; LMULMAX1RV64-NEXT: vsetivli zero, 1, e32, m1, ta, ma
	; LMULMAX1RV64-NEXT: vslidedown.vi v9, v8, 2
	; LMULMAX1RV64-NEXT: addi a0, a1, 8
	; LMULMAX1RV64-NEXT: vse32.v v9, (a0)
	; LMULMAX1RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma
	; LMULMAX1RV64-NEXT: vse64.v v8, (a1)
	; LMULMAX1RV64-NEXT: ret
	%a = load <3 x i32>, ptr %x			%a = load <3 x i32>, ptr %x
	%d = sitofp <3 x i32> %a to <3 x float>			%d = sitofp <3 x i32> %a to <3 x float>
	store <3 x float> %d, ptr %y			store <3 x float> %d, ptr %y
	ret void			ret void
	}			}

	define void @ui2fp_v3i32_v3f32(ptr %x, ptr %y) {			define void @ui2fp_v3i32_v3f32(ptr %x, ptr %y) {
	; LMULMAX8RV32-LABEL: ui2fp_v3i32_v3f32:			; CHECK-LABEL: ui2fp_v3i32_v3f32:
	; LMULMAX8RV32: # %bb.0:			; CHECK: # %bb.0:
	; LMULMAX8RV32-NEXT: vsetivli zero, 4, e32, m1, ta, ma			; CHECK-NEXT: vsetivli zero, 3, e32, m1, ta, ma
	; LMULMAX8RV32-NEXT: vle32.v v8, (a0)			; CHECK-NEXT: vle32.v v8, (a0)
	; LMULMAX8RV32-NEXT: vfcvt.f.xu.v v8, v8			; CHECK-NEXT: vfcvt.f.xu.v v8, v8
	; LMULMAX8RV32-NEXT: vsetivli zero, 1, e32, m1, ta, ma			; CHECK-NEXT: vse32.v v8, (a1)
	; LMULMAX8RV32-NEXT: vslidedown.vi v9, v8, 2			; CHECK-NEXT: ret
	; LMULMAX8RV32-NEXT: addi a0, a1, 8
	; LMULMAX8RV32-NEXT: vse32.v v9, (a0)
	; LMULMAX8RV32-NEXT: vsetivli zero, 2, e32, mf2, ta, ma
	; LMULMAX8RV32-NEXT: vse32.v v8, (a1)
	; LMULMAX8RV32-NEXT: ret
	;
	; LMULMAX8RV64-LABEL: ui2fp_v3i32_v3f32:
	; LMULMAX8RV64: # %bb.0:
	; LMULMAX8RV64-NEXT: vsetivli zero, 4, e32, m1, ta, ma
	; LMULMAX8RV64-NEXT: vle32.v v8, (a0)
	; LMULMAX8RV64-NEXT: vfcvt.f.xu.v v8, v8
	; LMULMAX8RV64-NEXT: vsetivli zero, 1, e32, m1, ta, ma
	; LMULMAX8RV64-NEXT: vslidedown.vi v9, v8, 2
	; LMULMAX8RV64-NEXT: addi a0, a1, 8
	; LMULMAX8RV64-NEXT: vse32.v v9, (a0)
	; LMULMAX8RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma
	; LMULMAX8RV64-NEXT: vse64.v v8, (a1)
	; LMULMAX8RV64-NEXT: ret
	;
	; LMULMAX1RV32-LABEL: ui2fp_v3i32_v3f32:
	; LMULMAX1RV32: # %bb.0:
	; LMULMAX1RV32-NEXT: vsetivli zero, 4, e32, m1, ta, ma
	; LMULMAX1RV32-NEXT: vle32.v v8, (a0)
	; LMULMAX1RV32-NEXT: vfcvt.f.xu.v v8, v8
	; LMULMAX1RV32-NEXT: vsetivli zero, 1, e32, m1, ta, ma
	; LMULMAX1RV32-NEXT: vslidedown.vi v9, v8, 2
	; LMULMAX1RV32-NEXT: addi a0, a1, 8
	; LMULMAX1RV32-NEXT: vse32.v v9, (a0)
	; LMULMAX1RV32-NEXT: vsetivli zero, 2, e32, mf2, ta, ma
	; LMULMAX1RV32-NEXT: vse32.v v8, (a1)
	; LMULMAX1RV32-NEXT: ret
	;
	; LMULMAX1RV64-LABEL: ui2fp_v3i32_v3f32:
	; LMULMAX1RV64: # %bb.0:
	; LMULMAX1RV64-NEXT: vsetivli zero, 4, e32, m1, ta, ma
	; LMULMAX1RV64-NEXT: vle32.v v8, (a0)
	; LMULMAX1RV64-NEXT: vfcvt.f.xu.v v8, v8
	; LMULMAX1RV64-NEXT: vsetivli zero, 1, e32, m1, ta, ma
	; LMULMAX1RV64-NEXT: vslidedown.vi v9, v8, 2
	; LMULMAX1RV64-NEXT: addi a0, a1, 8
	; LMULMAX1RV64-NEXT: vse32.v v9, (a0)
	; LMULMAX1RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma
	; LMULMAX1RV64-NEXT: vse64.v v8, (a1)
	; LMULMAX1RV64-NEXT: ret
	%a = load <3 x i32>, ptr %x			%a = load <3 x i32>, ptr %x
	%d = uitofp <3 x i32> %a to <3 x float>			%d = uitofp <3 x i32> %a to <3 x float>
	store <3 x float> %d, ptr %y			store <3 x float> %d, ptr %y
	ret void			ret void
	}			}

	define <3 x float> @si2fp_v3i1_v3f32(<3 x i1> %x) {			define <3 x float> @si2fp_v3i1_v3f32(<3 x i1> %x) {
	; CHECK-LABEL: si2fp_v3i1_v3f32:			; CHECK-LABEL: si2fp_v3i1_v3f32:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, ma			; CHECK-NEXT: vsetivli zero, 3, e32, m1, ta, ma
	; CHECK-NEXT: vmv.v.i v8, 0			; CHECK-NEXT: vmv.v.i v8, 0
	; CHECK-NEXT: vmerge.vim v9, v8, -1, v0			; CHECK-NEXT: vmerge.vim v8, v8, -1, v0
	; CHECK-NEXT: vfwcvt.f.x.v v8, v9			; CHECK-NEXT: vfcvt.f.x.v v8, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%z = sitofp <3 x i1> %x to <3 x float>			%z = sitofp <3 x i1> %x to <3 x float>
	ret <3 x float> %z			ret <3 x float> %z
	}			}

	; FIXME: This gets expanded instead of widened + promoted			; FIXME: This gets expanded instead of widened + promoted
	define <3 x float> @si2fp_v3i7_v3f32(<3 x i7> %x) {			define <3 x float> @si2fp_v3i7_v3f32(<3 x i7> %x) {
	; LMULMAX8RV32-LABEL: si2fp_v3i7_v3f32:			; LMULMAX8RV32-LABEL: si2fp_v3i7_v3f32:
	; LMULMAX8RV32: # %bb.0:			; LMULMAX8RV32: # %bb.0:
	; LMULMAX8RV32-NEXT: addi sp, sp, -16			; LMULMAX8RV32-NEXT: addi sp, sp, -16
	; LMULMAX8RV32-NEXT: .cfi_def_cfa_offset 16			; LMULMAX8RV32-NEXT: .cfi_def_cfa_offset 16
	; LMULMAX8RV32-NEXT: lw a1, 8(a0)			; LMULMAX8RV32-NEXT: lw a1, 8(a0)
	; LMULMAX8RV32-NEXT: sb a1, 14(sp)			; LMULMAX8RV32-NEXT: sb a1, 14(sp)
	; LMULMAX8RV32-NEXT: lw a1, 4(a0)			; LMULMAX8RV32-NEXT: lw a1, 4(a0)
	; LMULMAX8RV32-NEXT: sb a1, 13(sp)			; LMULMAX8RV32-NEXT: sb a1, 13(sp)
	; LMULMAX8RV32-NEXT: lw a0, 0(a0)			; LMULMAX8RV32-NEXT: lw a0, 0(a0)
	; LMULMAX8RV32-NEXT: sb a0, 12(sp)			; LMULMAX8RV32-NEXT: sb a0, 12(sp)
	; LMULMAX8RV32-NEXT: addi a0, sp, 12			; LMULMAX8RV32-NEXT: addi a0, sp, 12
	; LMULMAX8RV32-NEXT: vsetivli zero, 4, e8, mf4, ta, ma			; LMULMAX8RV32-NEXT: vsetivli zero, 4, e8, mf4, ta, ma
	; LMULMAX8RV32-NEXT: vle8.v v8, (a0)			; LMULMAX8RV32-NEXT: vle8.v v8, (a0)
	; LMULMAX8RV32-NEXT: vadd.vv v8, v8, v8			; LMULMAX8RV32-NEXT: vadd.vv v8, v8, v8
	; LMULMAX8RV32-NEXT: vsra.vi v8, v8, 1			; LMULMAX8RV32-NEXT: vsra.vi v8, v8, 1
	; LMULMAX8RV32-NEXT: vsetvli zero, zero, e16, mf2, ta, ma			; LMULMAX8RV32-NEXT: vsetivli zero, 3, e16, mf2, ta, ma
	; LMULMAX8RV32-NEXT: vsext.vf2 v9, v8			; LMULMAX8RV32-NEXT: vsext.vf2 v9, v8
	; LMULMAX8RV32-NEXT: vfwcvt.f.x.v v8, v9			; LMULMAX8RV32-NEXT: vfwcvt.f.x.v v8, v9
	; LMULMAX8RV32-NEXT: addi sp, sp, 16			; LMULMAX8RV32-NEXT: addi sp, sp, 16
	; LMULMAX8RV32-NEXT: ret			; LMULMAX8RV32-NEXT: ret
	;			;
	; LMULMAX8RV64-LABEL: si2fp_v3i7_v3f32:			; LMULMAX8RV64-LABEL: si2fp_v3i7_v3f32:
	; LMULMAX8RV64: # %bb.0:			; LMULMAX8RV64: # %bb.0:
	; LMULMAX8RV64-NEXT: addi sp, sp, -16			; LMULMAX8RV64-NEXT: addi sp, sp, -16
	; LMULMAX8RV64-NEXT: .cfi_def_cfa_offset 16			; LMULMAX8RV64-NEXT: .cfi_def_cfa_offset 16
	; LMULMAX8RV64-NEXT: ld a1, 16(a0)			; LMULMAX8RV64-NEXT: ld a1, 16(a0)
	; LMULMAX8RV64-NEXT: sb a1, 14(sp)			; LMULMAX8RV64-NEXT: sb a1, 14(sp)
	; LMULMAX8RV64-NEXT: ld a1, 8(a0)			; LMULMAX8RV64-NEXT: ld a1, 8(a0)
	; LMULMAX8RV64-NEXT: sb a1, 13(sp)			; LMULMAX8RV64-NEXT: sb a1, 13(sp)
	; LMULMAX8RV64-NEXT: ld a0, 0(a0)			; LMULMAX8RV64-NEXT: ld a0, 0(a0)
	; LMULMAX8RV64-NEXT: sb a0, 12(sp)			; LMULMAX8RV64-NEXT: sb a0, 12(sp)
	; LMULMAX8RV64-NEXT: addi a0, sp, 12			; LMULMAX8RV64-NEXT: addi a0, sp, 12
	; LMULMAX8RV64-NEXT: vsetivli zero, 4, e8, mf4, ta, ma			; LMULMAX8RV64-NEXT: vsetivli zero, 4, e8, mf4, ta, ma
	; LMULMAX8RV64-NEXT: vle8.v v8, (a0)			; LMULMAX8RV64-NEXT: vle8.v v8, (a0)
	; LMULMAX8RV64-NEXT: vadd.vv v8, v8, v8			; LMULMAX8RV64-NEXT: vadd.vv v8, v8, v8
	; LMULMAX8RV64-NEXT: vsra.vi v8, v8, 1			; LMULMAX8RV64-NEXT: vsra.vi v8, v8, 1
	; LMULMAX8RV64-NEXT: vsetvli zero, zero, e16, mf2, ta, ma			; LMULMAX8RV64-NEXT: vsetivli zero, 3, e16, mf2, ta, ma
	; LMULMAX8RV64-NEXT: vsext.vf2 v9, v8			; LMULMAX8RV64-NEXT: vsext.vf2 v9, v8
	; LMULMAX8RV64-NEXT: vfwcvt.f.x.v v8, v9			; LMULMAX8RV64-NEXT: vfwcvt.f.x.v v8, v9
	; LMULMAX8RV64-NEXT: addi sp, sp, 16			; LMULMAX8RV64-NEXT: addi sp, sp, 16
	; LMULMAX8RV64-NEXT: ret			; LMULMAX8RV64-NEXT: ret
	;			;
	; LMULMAX1RV32-LABEL: si2fp_v3i7_v3f32:			; LMULMAX1RV32-LABEL: si2fp_v3i7_v3f32:
	; LMULMAX1RV32: # %bb.0:			; LMULMAX1RV32: # %bb.0:
	; LMULMAX1RV32-NEXT: addi sp, sp, -16			; LMULMAX1RV32-NEXT: addi sp, sp, -16
	; LMULMAX1RV32-NEXT: .cfi_def_cfa_offset 16			; LMULMAX1RV32-NEXT: .cfi_def_cfa_offset 16
	; LMULMAX1RV32-NEXT: lw a1, 8(a0)			; LMULMAX1RV32-NEXT: lw a1, 8(a0)
	; LMULMAX1RV32-NEXT: sb a1, 14(sp)			; LMULMAX1RV32-NEXT: sb a1, 14(sp)
	; LMULMAX1RV32-NEXT: lw a1, 4(a0)			; LMULMAX1RV32-NEXT: lw a1, 4(a0)
	; LMULMAX1RV32-NEXT: sb a1, 13(sp)			; LMULMAX1RV32-NEXT: sb a1, 13(sp)
	; LMULMAX1RV32-NEXT: lw a0, 0(a0)			; LMULMAX1RV32-NEXT: lw a0, 0(a0)
	; LMULMAX1RV32-NEXT: sb a0, 12(sp)			; LMULMAX1RV32-NEXT: sb a0, 12(sp)
	; LMULMAX1RV32-NEXT: addi a0, sp, 12			; LMULMAX1RV32-NEXT: addi a0, sp, 12
	; LMULMAX1RV32-NEXT: vsetivli zero, 4, e8, mf4, ta, ma			; LMULMAX1RV32-NEXT: vsetivli zero, 4, e8, mf4, ta, ma
	; LMULMAX1RV32-NEXT: vle8.v v8, (a0)			; LMULMAX1RV32-NEXT: vle8.v v8, (a0)
	; LMULMAX1RV32-NEXT: vadd.vv v8, v8, v8			; LMULMAX1RV32-NEXT: vadd.vv v8, v8, v8
	; LMULMAX1RV32-NEXT: vsra.vi v8, v8, 1			; LMULMAX1RV32-NEXT: vsra.vi v8, v8, 1
	; LMULMAX1RV32-NEXT: vsetvli zero, zero, e16, mf2, ta, ma			; LMULMAX1RV32-NEXT: vsetivli zero, 3, e16, mf2, ta, ma
	; LMULMAX1RV32-NEXT: vsext.vf2 v9, v8			; LMULMAX1RV32-NEXT: vsext.vf2 v9, v8
	; LMULMAX1RV32-NEXT: vfwcvt.f.x.v v8, v9			; LMULMAX1RV32-NEXT: vfwcvt.f.x.v v8, v9
	; LMULMAX1RV32-NEXT: addi sp, sp, 16			; LMULMAX1RV32-NEXT: addi sp, sp, 16
	; LMULMAX1RV32-NEXT: ret			; LMULMAX1RV32-NEXT: ret
	;			;
	; LMULMAX1RV64-LABEL: si2fp_v3i7_v3f32:			; LMULMAX1RV64-LABEL: si2fp_v3i7_v3f32:
	; LMULMAX1RV64: # %bb.0:			; LMULMAX1RV64: # %bb.0:
	; LMULMAX1RV64-NEXT: addi sp, sp, -16			; LMULMAX1RV64-NEXT: addi sp, sp, -16
	; LMULMAX1RV64-NEXT: .cfi_def_cfa_offset 16			; LMULMAX1RV64-NEXT: .cfi_def_cfa_offset 16
	; LMULMAX1RV64-NEXT: ld a1, 16(a0)			; LMULMAX1RV64-NEXT: ld a1, 16(a0)
	; LMULMAX1RV64-NEXT: sb a1, 14(sp)			; LMULMAX1RV64-NEXT: sb a1, 14(sp)
	; LMULMAX1RV64-NEXT: ld a1, 8(a0)			; LMULMAX1RV64-NEXT: ld a1, 8(a0)
	; LMULMAX1RV64-NEXT: sb a1, 13(sp)			; LMULMAX1RV64-NEXT: sb a1, 13(sp)
	; LMULMAX1RV64-NEXT: ld a0, 0(a0)			; LMULMAX1RV64-NEXT: ld a0, 0(a0)
	; LMULMAX1RV64-NEXT: sb a0, 12(sp)			; LMULMAX1RV64-NEXT: sb a0, 12(sp)
	; LMULMAX1RV64-NEXT: addi a0, sp, 12			; LMULMAX1RV64-NEXT: addi a0, sp, 12
	; LMULMAX1RV64-NEXT: vsetivli zero, 4, e8, mf4, ta, ma			; LMULMAX1RV64-NEXT: vsetivli zero, 4, e8, mf4, ta, ma
	; LMULMAX1RV64-NEXT: vle8.v v8, (a0)			; LMULMAX1RV64-NEXT: vle8.v v8, (a0)
	; LMULMAX1RV64-NEXT: vadd.vv v8, v8, v8			; LMULMAX1RV64-NEXT: vadd.vv v8, v8, v8
	; LMULMAX1RV64-NEXT: vsra.vi v8, v8, 1			; LMULMAX1RV64-NEXT: vsra.vi v8, v8, 1
	; LMULMAX1RV64-NEXT: vsetvli zero, zero, e16, mf2, ta, ma			; LMULMAX1RV64-NEXT: vsetivli zero, 3, e16, mf2, ta, ma
	; LMULMAX1RV64-NEXT: vsext.vf2 v9, v8			; LMULMAX1RV64-NEXT: vsext.vf2 v9, v8
	; LMULMAX1RV64-NEXT: vfwcvt.f.x.v v8, v9			; LMULMAX1RV64-NEXT: vfwcvt.f.x.v v8, v9
	; LMULMAX1RV64-NEXT: addi sp, sp, 16			; LMULMAX1RV64-NEXT: addi sp, sp, 16
	; LMULMAX1RV64-NEXT: ret			; LMULMAX1RV64-NEXT: ret
	%z = sitofp <3 x i7> %x to <3 x float>			%z = sitofp <3 x i7> %x to <3 x float>
	ret <3 x float> %z			ret <3 x float> %z
	}			}

	Show All 9 Lines
	; LMULMAX8RV32-NEXT: sb a1, 13(sp)			; LMULMAX8RV32-NEXT: sb a1, 13(sp)
	; LMULMAX8RV32-NEXT: lw a0, 0(a0)			; LMULMAX8RV32-NEXT: lw a0, 0(a0)
	; LMULMAX8RV32-NEXT: sb a0, 12(sp)			; LMULMAX8RV32-NEXT: sb a0, 12(sp)
	; LMULMAX8RV32-NEXT: addi a0, sp, 12			; LMULMAX8RV32-NEXT: addi a0, sp, 12
	; LMULMAX8RV32-NEXT: vsetivli zero, 4, e8, mf4, ta, ma			; LMULMAX8RV32-NEXT: vsetivli zero, 4, e8, mf4, ta, ma
	; LMULMAX8RV32-NEXT: vle8.v v8, (a0)			; LMULMAX8RV32-NEXT: vle8.v v8, (a0)
	; LMULMAX8RV32-NEXT: li a0, 127			; LMULMAX8RV32-NEXT: li a0, 127
	; LMULMAX8RV32-NEXT: vand.vx v8, v8, a0			; LMULMAX8RV32-NEXT: vand.vx v8, v8, a0
	; LMULMAX8RV32-NEXT: vsetvli zero, zero, e16, mf2, ta, ma			; LMULMAX8RV32-NEXT: vsetivli zero, 3, e16, mf2, ta, ma
	; LMULMAX8RV32-NEXT: vzext.vf2 v9, v8			; LMULMAX8RV32-NEXT: vzext.vf2 v9, v8
	; LMULMAX8RV32-NEXT: vfwcvt.f.xu.v v8, v9			; LMULMAX8RV32-NEXT: vfwcvt.f.xu.v v8, v9
	; LMULMAX8RV32-NEXT: addi sp, sp, 16			; LMULMAX8RV32-NEXT: addi sp, sp, 16
	; LMULMAX8RV32-NEXT: ret			; LMULMAX8RV32-NEXT: ret
	;			;
	; LMULMAX8RV64-LABEL: ui2fp_v3i7_v3f32:			; LMULMAX8RV64-LABEL: ui2fp_v3i7_v3f32:
	; LMULMAX8RV64: # %bb.0:			; LMULMAX8RV64: # %bb.0:
	; LMULMAX8RV64-NEXT: addi sp, sp, -16			; LMULMAX8RV64-NEXT: addi sp, sp, -16
	; LMULMAX8RV64-NEXT: .cfi_def_cfa_offset 16			; LMULMAX8RV64-NEXT: .cfi_def_cfa_offset 16
	; LMULMAX8RV64-NEXT: ld a1, 16(a0)			; LMULMAX8RV64-NEXT: ld a1, 16(a0)
	; LMULMAX8RV64-NEXT: sb a1, 14(sp)			; LMULMAX8RV64-NEXT: sb a1, 14(sp)
	; LMULMAX8RV64-NEXT: ld a1, 8(a0)			; LMULMAX8RV64-NEXT: ld a1, 8(a0)
	; LMULMAX8RV64-NEXT: sb a1, 13(sp)			; LMULMAX8RV64-NEXT: sb a1, 13(sp)
	; LMULMAX8RV64-NEXT: ld a0, 0(a0)			; LMULMAX8RV64-NEXT: ld a0, 0(a0)
	; LMULMAX8RV64-NEXT: sb a0, 12(sp)			; LMULMAX8RV64-NEXT: sb a0, 12(sp)
	; LMULMAX8RV64-NEXT: addi a0, sp, 12			; LMULMAX8RV64-NEXT: addi a0, sp, 12
	; LMULMAX8RV64-NEXT: vsetivli zero, 4, e8, mf4, ta, ma			; LMULMAX8RV64-NEXT: vsetivli zero, 4, e8, mf4, ta, ma
	; LMULMAX8RV64-NEXT: vle8.v v8, (a0)			; LMULMAX8RV64-NEXT: vle8.v v8, (a0)
	; LMULMAX8RV64-NEXT: li a0, 127			; LMULMAX8RV64-NEXT: li a0, 127
	; LMULMAX8RV64-NEXT: vand.vx v8, v8, a0			; LMULMAX8RV64-NEXT: vand.vx v8, v8, a0
	; LMULMAX8RV64-NEXT: vsetvli zero, zero, e16, mf2, ta, ma			; LMULMAX8RV64-NEXT: vsetivli zero, 3, e16, mf2, ta, ma
	; LMULMAX8RV64-NEXT: vzext.vf2 v9, v8			; LMULMAX8RV64-NEXT: vzext.vf2 v9, v8
	; LMULMAX8RV64-NEXT: vfwcvt.f.xu.v v8, v9			; LMULMAX8RV64-NEXT: vfwcvt.f.xu.v v8, v9
	; LMULMAX8RV64-NEXT: addi sp, sp, 16			; LMULMAX8RV64-NEXT: addi sp, sp, 16
	; LMULMAX8RV64-NEXT: ret			; LMULMAX8RV64-NEXT: ret
	;			;
	; LMULMAX1RV32-LABEL: ui2fp_v3i7_v3f32:			; LMULMAX1RV32-LABEL: ui2fp_v3i7_v3f32:
	; LMULMAX1RV32: # %bb.0:			; LMULMAX1RV32: # %bb.0:
	; LMULMAX1RV32-NEXT: addi sp, sp, -16			; LMULMAX1RV32-NEXT: addi sp, sp, -16
	; LMULMAX1RV32-NEXT: .cfi_def_cfa_offset 16			; LMULMAX1RV32-NEXT: .cfi_def_cfa_offset 16
	; LMULMAX1RV32-NEXT: lw a1, 8(a0)			; LMULMAX1RV32-NEXT: lw a1, 8(a0)
	; LMULMAX1RV32-NEXT: sb a1, 14(sp)			; LMULMAX1RV32-NEXT: sb a1, 14(sp)
	; LMULMAX1RV32-NEXT: lw a1, 4(a0)			; LMULMAX1RV32-NEXT: lw a1, 4(a0)
	; LMULMAX1RV32-NEXT: sb a1, 13(sp)			; LMULMAX1RV32-NEXT: sb a1, 13(sp)
	; LMULMAX1RV32-NEXT: lw a0, 0(a0)			; LMULMAX1RV32-NEXT: lw a0, 0(a0)
	; LMULMAX1RV32-NEXT: sb a0, 12(sp)			; LMULMAX1RV32-NEXT: sb a0, 12(sp)
	; LMULMAX1RV32-NEXT: addi a0, sp, 12			; LMULMAX1RV32-NEXT: addi a0, sp, 12
	; LMULMAX1RV32-NEXT: vsetivli zero, 4, e8, mf4, ta, ma			; LMULMAX1RV32-NEXT: vsetivli zero, 4, e8, mf4, ta, ma
	; LMULMAX1RV32-NEXT: vle8.v v8, (a0)			; LMULMAX1RV32-NEXT: vle8.v v8, (a0)
	; LMULMAX1RV32-NEXT: li a0, 127			; LMULMAX1RV32-NEXT: li a0, 127
	; LMULMAX1RV32-NEXT: vand.vx v8, v8, a0			; LMULMAX1RV32-NEXT: vand.vx v8, v8, a0
	; LMULMAX1RV32-NEXT: vsetvli zero, zero, e16, mf2, ta, ma			; LMULMAX1RV32-NEXT: vsetivli zero, 3, e16, mf2, ta, ma
	; LMULMAX1RV32-NEXT: vzext.vf2 v9, v8			; LMULMAX1RV32-NEXT: vzext.vf2 v9, v8
	; LMULMAX1RV32-NEXT: vfwcvt.f.xu.v v8, v9			; LMULMAX1RV32-NEXT: vfwcvt.f.xu.v v8, v9
	; LMULMAX1RV32-NEXT: addi sp, sp, 16			; LMULMAX1RV32-NEXT: addi sp, sp, 16
	; LMULMAX1RV32-NEXT: ret			; LMULMAX1RV32-NEXT: ret
	;			;
	; LMULMAX1RV64-LABEL: ui2fp_v3i7_v3f32:			; LMULMAX1RV64-LABEL: ui2fp_v3i7_v3f32:
	; LMULMAX1RV64: # %bb.0:			; LMULMAX1RV64: # %bb.0:
	; LMULMAX1RV64-NEXT: addi sp, sp, -16			; LMULMAX1RV64-NEXT: addi sp, sp, -16
	; LMULMAX1RV64-NEXT: .cfi_def_cfa_offset 16			; LMULMAX1RV64-NEXT: .cfi_def_cfa_offset 16
	; LMULMAX1RV64-NEXT: ld a1, 16(a0)			; LMULMAX1RV64-NEXT: ld a1, 16(a0)
	; LMULMAX1RV64-NEXT: sb a1, 14(sp)			; LMULMAX1RV64-NEXT: sb a1, 14(sp)
	; LMULMAX1RV64-NEXT: ld a1, 8(a0)			; LMULMAX1RV64-NEXT: ld a1, 8(a0)
	; LMULMAX1RV64-NEXT: sb a1, 13(sp)			; LMULMAX1RV64-NEXT: sb a1, 13(sp)
	; LMULMAX1RV64-NEXT: ld a0, 0(a0)			; LMULMAX1RV64-NEXT: ld a0, 0(a0)
	; LMULMAX1RV64-NEXT: sb a0, 12(sp)			; LMULMAX1RV64-NEXT: sb a0, 12(sp)
	; LMULMAX1RV64-NEXT: addi a0, sp, 12			; LMULMAX1RV64-NEXT: addi a0, sp, 12
	; LMULMAX1RV64-NEXT: vsetivli zero, 4, e8, mf4, ta, ma			; LMULMAX1RV64-NEXT: vsetivli zero, 4, e8, mf4, ta, ma
	; LMULMAX1RV64-NEXT: vle8.v v8, (a0)			; LMULMAX1RV64-NEXT: vle8.v v8, (a0)
	; LMULMAX1RV64-NEXT: li a0, 127			; LMULMAX1RV64-NEXT: li a0, 127
	; LMULMAX1RV64-NEXT: vand.vx v8, v8, a0			; LMULMAX1RV64-NEXT: vand.vx v8, v8, a0
	; LMULMAX1RV64-NEXT: vsetvli zero, zero, e16, mf2, ta, ma			; LMULMAX1RV64-NEXT: vsetivli zero, 3, e16, mf2, ta, ma
	; LMULMAX1RV64-NEXT: vzext.vf2 v9, v8			; LMULMAX1RV64-NEXT: vzext.vf2 v9, v8
	; LMULMAX1RV64-NEXT: vfwcvt.f.xu.v v8, v9			; LMULMAX1RV64-NEXT: vfwcvt.f.xu.v v8, v9
	; LMULMAX1RV64-NEXT: addi sp, sp, 16			; LMULMAX1RV64-NEXT: addi sp, sp, 16
	; LMULMAX1RV64-NEXT: ret			; LMULMAX1RV64-NEXT: ret
	%z = uitofp <3 x i7> %x to <3 x float>			%z = uitofp <3 x i7> %x to <3 x float>
	ret <3 x float> %z			ret <3 x float> %z
	}			}

	define <3 x float> @ui2fp_v3i1_v3f32(<3 x i1> %x) {			define <3 x float> @ui2fp_v3i1_v3f32(<3 x i1> %x) {
	; CHECK-LABEL: ui2fp_v3i1_v3f32:			; CHECK-LABEL: ui2fp_v3i1_v3f32:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, ma			; CHECK-NEXT: vsetivli zero, 3, e32, m1, ta, ma
	; CHECK-NEXT: vmv.v.i v8, 0			; CHECK-NEXT: vmv.v.i v8, 0
	; CHECK-NEXT: vmerge.vim v9, v8, 1, v0			; CHECK-NEXT: vmerge.vim v8, v8, 1, v0
	; CHECK-NEXT: vfwcvt.f.xu.v v8, v9			; CHECK-NEXT: vfcvt.f.xu.v v8, v8
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%z = uitofp <3 x i1> %x to <3 x float>			%z = uitofp <3 x i1> %x to <3 x float>
	ret <3 x float> %z			ret <3 x float> %z
	}			}

	define void @si2fp_v8i32_v8f32(ptr %x, ptr %y) {			define void @si2fp_v8i32_v8f32(ptr %x, ptr %y) {
	; LMULMAX8-LABEL: si2fp_v8i32_v8f32:			; LMULMAX8-LABEL: si2fp_v8i32_v8f32:
	; LMULMAX8: # %bb.0:			; LMULMAX8: # %bb.0:
	▲ Show 20 Lines • Show All 510 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-insert.ll

	Show All 33 Lines

	; This uses a non-power of 2 type so that it isn't an MVT.			; This uses a non-power of 2 type so that it isn't an MVT.
	; The align keeps the type legalizer from using a 256 bit load so we must split			; The align keeps the type legalizer from using a 256 bit load so we must split
	; it. This some operations that weren't support for scalable vectors when			; it. This some operations that weren't support for scalable vectors when
	; this test was written.			; this test was written.
	define void @insertelt_v3i64(ptr %x, i64 %y) {			define void @insertelt_v3i64(ptr %x, i64 %y) {
	; RV32-LABEL: insertelt_v3i64:			; RV32-LABEL: insertelt_v3i64:
	; RV32: # %bb.0:			; RV32: # %bb.0:
	; RV32-NEXT: vsetivli zero, 2, e64, m1, ta, ma			; RV32-NEXT: vsetivli zero, 3, e64, m2, ta, ma
	; RV32-NEXT: vle64.v v8, (a0)			; RV32-NEXT: vle64.v v8, (a0)
	; RV32-NEXT: lw a3, 16(a0)
	; RV32-NEXT: addi a4, a0, 20
	; RV32-NEXT: vsetivli zero, 4, e32, m1, ta, ma
	; RV32-NEXT: vlse32.v v10, (a4), zero
	; RV32-NEXT: vsetvli zero, zero, e32, m1, tu, ma
	; RV32-NEXT: vmv.s.x v10, a3
	; RV32-NEXT: vsetvli zero, zero, e64, m2, ta, ma
	; RV32-NEXT: vslideup.vi v8, v10, 2
	; RV32-NEXT: vsetivli zero, 2, e32, m2, ta, ma			; RV32-NEXT: vsetivli zero, 2, e32, m2, ta, ma
	; RV32-NEXT: vslide1down.vx v10, v8, a1			; RV32-NEXT: vslide1down.vx v10, v8, a1
	; RV32-NEXT: vslide1down.vx v10, v10, a2			; RV32-NEXT: vslide1down.vx v10, v10, a2
	; RV32-NEXT: vsetivli zero, 3, e64, m2, tu, ma			; RV32-NEXT: vsetivli zero, 3, e64, m2, tu, ma
	; RV32-NEXT: vslideup.vi v8, v10, 2			; RV32-NEXT: vslideup.vi v8, v10, 2
	; RV32-NEXT: sw a1, 16(a0)
	; RV32-NEXT: sw a2, 20(a0)
	; RV32-NEXT: vsetivli zero, 2, e64, m1, ta, ma
	; RV32-NEXT: vse64.v v8, (a0)			; RV32-NEXT: vse64.v v8, (a0)
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: insertelt_v3i64:			; RV64-LABEL: insertelt_v3i64:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: sd a1, 16(a0)			; RV64-NEXT: vsetivli zero, 3, e64, m2, ta, ma
				; RV64-NEXT: vle64.v v8, (a0)
				; RV64-NEXT: vmv.s.x v10, a1
				; RV64-NEXT: vsetvli zero, zero, e64, m2, tu, ma
				; RV64-NEXT: vslideup.vi v8, v10, 2
				; RV64-NEXT: vse64.v v8, (a0)
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%a = load <3 x i64>, ptr %x, align 8			%a = load <3 x i64>, ptr %x, align 8
	%b = insertelement <3 x i64> %a, i64 %y, i32 2			%b = insertelement <3 x i64> %a, i64 %y, i32 2
	store <3 x i64> %b, ptr %x			store <3 x i64> %b, ptr %x
	ret void			ret void
	}			}

	define void @insertelt_v16i8(ptr %x, i8 %y) {			define void @insertelt_v16i8(ptr %x, i8 %y) {
	▲ Show 20 Lines • Show All 204 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-int-buildvec.ll

	Show First 20 Lines • Show All 456 Lines • ▼ Show 20 Lines
	; RV64-NEXT: vsetivli zero, 16, e8, m1, ta, ma			; RV64-NEXT: vsetivli zero, 16, e8, m1, ta, ma
	; RV64-NEXT: vse8.v v8, (a0)			; RV64-NEXT: vse8.v v8, (a0)
	; RV64-NEXT: ret			; RV64-NEXT: ret
	store <16 x i8> <i8 1, i8 2, i8 3, i8 129, i8 -1, i8 -1, i8 -1, i8 -1, i8 1, i8 2, i8 3, i8 129, i8 -1, i8 -1, i8 -1, i8 -1>, ptr %x			store <16 x i8> <i8 1, i8 2, i8 3, i8 129, i8 -1, i8 -1, i8 -1, i8 -1, i8 1, i8 2, i8 3, i8 129, i8 -1, i8 -1, i8 -1, i8 -1>, ptr %x
	ret void			ret void
	}			}

	define void @buildvec_seq_v9i8(ptr %x) {			define void @buildvec_seq_v9i8(ptr %x) {
	; RV32-LABEL: buildvec_seq_v9i8:			; CHECK-LABEL: buildvec_seq_v9i8:
	; RV32: # %bb.0:			; CHECK: # %bb.0:
	; RV32-NEXT: li a1, 3			; CHECK-NEXT: li a1, 73
	; RV32-NEXT: sb a1, 8(a0)			; CHECK-NEXT: vsetivli zero, 1, e16, mf4, ta, ma
	; RV32-NEXT: li a1, 73			; CHECK-NEXT: vmv.s.x v0, a1
	; RV32-NEXT: vsetivli zero, 8, e8, mf2, ta, ma			; CHECK-NEXT: vsetivli zero, 16, e8, m1, ta, ma
	; RV32-NEXT: vmv.s.x v0, a1			; CHECK-NEXT: vmv.v.i v8, 3
	; RV32-NEXT: vmv.v.i v9, 2			; CHECK-NEXT: vmerge.vim v8, v8, 1, v0
	; RV32-NEXT: li a1, 36			; CHECK-NEXT: li a1, 146
	; RV32-NEXT: vmv.s.x v8, a1			; CHECK-NEXT: vsetivli zero, 1, e16, mf4, ta, ma
	; RV32-NEXT: vmerge.vim v9, v9, 1, v0			; CHECK-NEXT: vmv.s.x v0, a1
	; RV32-NEXT: vmv1r.v v0, v8			; CHECK-NEXT: vsetivli zero, 16, e8, m1, ta, ma
	; RV32-NEXT: vmerge.vim v8, v9, 3, v0			; CHECK-NEXT: vmerge.vim v8, v8, 2, v0
	; RV32-NEXT: vse8.v v8, (a0)			; CHECK-NEXT: vsetivli zero, 9, e8, m1, ta, ma
	; RV32-NEXT: ret			; CHECK-NEXT: vse8.v v8, (a0)
	;			; CHECK-NEXT: ret
	; RV64-LABEL: buildvec_seq_v9i8:
	; RV64: # %bb.0:
	; RV64-NEXT: lui a1, %hi(.LCPI26_0)
	; RV64-NEXT: ld a1, %lo(.LCPI26_0)(a1)
	; RV64-NEXT: li a2, 3
	; RV64-NEXT: sb a2, 8(a0)
	; RV64-NEXT: sd a1, 0(a0)
	; RV64-NEXT: ret
	store <9 x i8> <i8 1, i8 2, i8 3, i8 1, i8 2, i8 3, i8 1, i8 2, i8 3>, ptr %x			store <9 x i8> <i8 1, i8 2, i8 3, i8 1, i8 2, i8 3, i8 1, i8 2, i8 3>, ptr %x
	ret void			ret void
	}			}

	define void @buildvec_seq_v4i16_v2i32(ptr %x) {			define void @buildvec_seq_v4i16_v2i32(ptr %x) {
	; CHECK-LABEL: buildvec_seq_v4i16_v2i32:			; CHECK-LABEL: buildvec_seq_v4i16_v2i32:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: li a1, -127			; CHECK-NEXT: li a1, -127
	▲ Show 20 Lines • Show All 202 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-int.ll

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show All 33 Lines	; CHECK-NEXT: ret
%a = load <8 x i16>, ptr %x		%a = load <8 x i16>, ptr %x
%b = load <8 x i16>, ptr %y		%b = load <8 x i16>, ptr %y
%c = add <8 x i16> %a, %b		%c = add <8 x i16> %a, %b
store <8 x i16> %c, ptr %x		store <8 x i16> %c, ptr %x
ret void		ret void
}		}

define void @add_v6i16(ptr %x, ptr %y) {		define void @add_v6i16(ptr %x, ptr %y) {
; RV32-LABEL: add_v6i16:		; CHECK-LABEL: add_v6i16:
; RV32: # %bb.0:		; CHECK: # %bb.0:
; RV32-NEXT: vsetivli zero, 8, e16, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 6, e16, m1, ta, ma
; RV32-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; RV32-NEXT: vle16.v v9, (a1)		; CHECK-NEXT: vle16.v v9, (a1)
; RV32-NEXT: vadd.vv v8, v8, v9		; CHECK-NEXT: vadd.vv v8, v8, v9
; RV32-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vse16.v v8, (a0)
; RV32-NEXT: vslidedown.vi v9, v8, 2		; CHECK-NEXT: ret
; RV32-NEXT: addi a1, a0, 8
; RV32-NEXT: vse32.v v9, (a1)
; RV32-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
; RV32-NEXT: vse16.v v8, (a0)
; RV32-NEXT: ret
;
; RV64-LABEL: add_v6i16:
; RV64: # %bb.0:
; RV64-NEXT: vsetivli zero, 8, e16, m1, ta, ma
; RV64-NEXT: vle16.v v8, (a0)
; RV64-NEXT: vle16.v v9, (a1)
; RV64-NEXT: vadd.vv v8, v8, v9
; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma
; RV64-NEXT: vse64.v v8, (a0)
; RV64-NEXT: vsetivli zero, 1, e32, m1, ta, ma
; RV64-NEXT: vslidedown.vi v8, v8, 2
; RV64-NEXT: addi a0, a0, 8
; RV64-NEXT: vse32.v v8, (a0)
; RV64-NEXT: ret
%a = load <6 x i16>, ptr %x		%a = load <6 x i16>, ptr %x
%b = load <6 x i16>, ptr %y		%b = load <6 x i16>, ptr %y
%c = add <6 x i16> %a, %b		%c = add <6 x i16> %a, %b
store <6 x i16> %c, ptr %x		store <6 x i16> %c, ptr %x
ret void		ret void
}		}

define void @add_v4i32(ptr %x, ptr %y) {		define void @add_v4i32(ptr %x, ptr %y) {
▲ Show 20 Lines • Show All 56 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%a = load <8 x i16>, ptr %x		%a = load <8 x i16>, ptr %x
%b = load <8 x i16>, ptr %y		%b = load <8 x i16>, ptr %y
%c = sub <8 x i16> %a, %b		%c = sub <8 x i16> %a, %b
store <8 x i16> %c, ptr %x		store <8 x i16> %c, ptr %x
ret void		ret void
}		}

define void @sub_v6i16(ptr %x, ptr %y) {		define void @sub_v6i16(ptr %x, ptr %y) {
; RV32-LABEL: sub_v6i16:		; CHECK-LABEL: sub_v6i16:
; RV32: # %bb.0:		; CHECK: # %bb.0:
; RV32-NEXT: vsetivli zero, 8, e16, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 6, e16, m1, ta, ma
; RV32-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; RV32-NEXT: vle16.v v9, (a1)		; CHECK-NEXT: vle16.v v9, (a1)
; RV32-NEXT: vsub.vv v8, v8, v9		; CHECK-NEXT: vsub.vv v8, v8, v9
; RV32-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vse16.v v8, (a0)
; RV32-NEXT: vslidedown.vi v9, v8, 2		; CHECK-NEXT: ret
; RV32-NEXT: addi a1, a0, 8
; RV32-NEXT: vse32.v v9, (a1)
; RV32-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
; RV32-NEXT: vse16.v v8, (a0)
; RV32-NEXT: ret
;
; RV64-LABEL: sub_v6i16:
; RV64: # %bb.0:
; RV64-NEXT: vsetivli zero, 8, e16, m1, ta, ma
; RV64-NEXT: vle16.v v8, (a0)
; RV64-NEXT: vle16.v v9, (a1)
; RV64-NEXT: vsub.vv v8, v8, v9
; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma
; RV64-NEXT: vse64.v v8, (a0)
; RV64-NEXT: vsetivli zero, 1, e32, m1, ta, ma
; RV64-NEXT: vslidedown.vi v8, v8, 2
; RV64-NEXT: addi a0, a0, 8
; RV64-NEXT: vse32.v v8, (a0)
; RV64-NEXT: ret
%a = load <6 x i16>, ptr %x		%a = load <6 x i16>, ptr %x
%b = load <6 x i16>, ptr %y		%b = load <6 x i16>, ptr %y
%c = sub <6 x i16> %a, %b		%c = sub <6 x i16> %a, %b
store <6 x i16> %c, ptr %x		store <6 x i16> %c, ptr %x
ret void		ret void
}		}

define void @sub_v4i32(ptr %x, ptr %y) {		define void @sub_v4i32(ptr %x, ptr %y) {
▲ Show 20 Lines • Show All 56 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%a = load <8 x i16>, ptr %x		%a = load <8 x i16>, ptr %x
%b = load <8 x i16>, ptr %y		%b = load <8 x i16>, ptr %y
%c = mul <8 x i16> %a, %b		%c = mul <8 x i16> %a, %b
store <8 x i16> %c, ptr %x		store <8 x i16> %c, ptr %x
ret void		ret void
}		}

define void @mul_v6i16(ptr %x, ptr %y) {		define void @mul_v6i16(ptr %x, ptr %y) {
; RV32-LABEL: mul_v6i16:		; CHECK-LABEL: mul_v6i16:
; RV32: # %bb.0:		; CHECK: # %bb.0:
; RV32-NEXT: vsetivli zero, 8, e16, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 6, e16, m1, ta, ma
; RV32-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; RV32-NEXT: vle16.v v9, (a1)		; CHECK-NEXT: vle16.v v9, (a1)
; RV32-NEXT: vmul.vv v8, v8, v9		; CHECK-NEXT: vmul.vv v8, v8, v9
; RV32-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vse16.v v8, (a0)
; RV32-NEXT: vslidedown.vi v9, v8, 2		; CHECK-NEXT: ret
; RV32-NEXT: addi a1, a0, 8
; RV32-NEXT: vse32.v v9, (a1)
; RV32-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
; RV32-NEXT: vse16.v v8, (a0)
; RV32-NEXT: ret
;
; RV64-LABEL: mul_v6i16:
; RV64: # %bb.0:
; RV64-NEXT: vsetivli zero, 8, e16, m1, ta, ma
; RV64-NEXT: vle16.v v8, (a0)
; RV64-NEXT: vle16.v v9, (a1)
; RV64-NEXT: vmul.vv v8, v8, v9
; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma
; RV64-NEXT: vse64.v v8, (a0)
; RV64-NEXT: vsetivli zero, 1, e32, m1, ta, ma
; RV64-NEXT: vslidedown.vi v8, v8, 2
; RV64-NEXT: addi a0, a0, 8
; RV64-NEXT: vse32.v v8, (a0)
; RV64-NEXT: ret
%a = load <6 x i16>, ptr %x		%a = load <6 x i16>, ptr %x
%b = load <6 x i16>, ptr %y		%b = load <6 x i16>, ptr %y
%c = mul <6 x i16> %a, %b		%c = mul <6 x i16> %a, %b
store <6 x i16> %c, ptr %x		store <6 x i16> %c, ptr %x
ret void		ret void
}		}

define void @mul_v4i32(ptr %x, ptr %y) {		define void @mul_v4i32(ptr %x, ptr %y) {
▲ Show 20 Lines • Show All 56 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%a = load <8 x i16>, ptr %x		%a = load <8 x i16>, ptr %x
%b = load <8 x i16>, ptr %y		%b = load <8 x i16>, ptr %y
%c = and <8 x i16> %a, %b		%c = and <8 x i16> %a, %b
store <8 x i16> %c, ptr %x		store <8 x i16> %c, ptr %x
ret void		ret void
}		}

define void @and_v6i16(ptr %x, ptr %y) {		define void @and_v6i16(ptr %x, ptr %y) {
; RV32-LABEL: and_v6i16:		; CHECK-LABEL: and_v6i16:
; RV32: # %bb.0:		; CHECK: # %bb.0:
; RV32-NEXT: vsetivli zero, 8, e16, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 6, e16, m1, ta, ma
; RV32-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; RV32-NEXT: vle16.v v9, (a1)		; CHECK-NEXT: vle16.v v9, (a1)
; RV32-NEXT: vand.vv v8, v8, v9		; CHECK-NEXT: vand.vv v8, v8, v9
; RV32-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vse16.v v8, (a0)
; RV32-NEXT: vslidedown.vi v9, v8, 2		; CHECK-NEXT: ret
; RV32-NEXT: addi a1, a0, 8
; RV32-NEXT: vse32.v v9, (a1)
; RV32-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
; RV32-NEXT: vse16.v v8, (a0)
; RV32-NEXT: ret
;
; RV64-LABEL: and_v6i16:
; RV64: # %bb.0:
; RV64-NEXT: vsetivli zero, 8, e16, m1, ta, ma
; RV64-NEXT: vle16.v v8, (a0)
; RV64-NEXT: vle16.v v9, (a1)
; RV64-NEXT: vand.vv v8, v8, v9
; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma
; RV64-NEXT: vse64.v v8, (a0)
; RV64-NEXT: vsetivli zero, 1, e32, m1, ta, ma
; RV64-NEXT: vslidedown.vi v8, v8, 2
; RV64-NEXT: addi a0, a0, 8
; RV64-NEXT: vse32.v v8, (a0)
; RV64-NEXT: ret
%a = load <6 x i16>, ptr %x		%a = load <6 x i16>, ptr %x
%b = load <6 x i16>, ptr %y		%b = load <6 x i16>, ptr %y
%c = and <6 x i16> %a, %b		%c = and <6 x i16> %a, %b
store <6 x i16> %c, ptr %x		store <6 x i16> %c, ptr %x
ret void		ret void
}		}

define void @and_v4i32(ptr %x, ptr %y) {		define void @and_v4i32(ptr %x, ptr %y) {
▲ Show 20 Lines • Show All 56 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%a = load <8 x i16>, ptr %x		%a = load <8 x i16>, ptr %x
%b = load <8 x i16>, ptr %y		%b = load <8 x i16>, ptr %y
%c = or <8 x i16> %a, %b		%c = or <8 x i16> %a, %b
store <8 x i16> %c, ptr %x		store <8 x i16> %c, ptr %x
ret void		ret void
}		}

define void @or_v6i16(ptr %x, ptr %y) {		define void @or_v6i16(ptr %x, ptr %y) {
; RV32-LABEL: or_v6i16:		; CHECK-LABEL: or_v6i16:
; RV32: # %bb.0:		; CHECK: # %bb.0:
; RV32-NEXT: vsetivli zero, 8, e16, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 6, e16, m1, ta, ma
; RV32-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; RV32-NEXT: vle16.v v9, (a1)		; CHECK-NEXT: vle16.v v9, (a1)
; RV32-NEXT: vor.vv v8, v8, v9		; CHECK-NEXT: vor.vv v8, v8, v9
; RV32-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vse16.v v8, (a0)
; RV32-NEXT: vslidedown.vi v9, v8, 2		; CHECK-NEXT: ret
; RV32-NEXT: addi a1, a0, 8
; RV32-NEXT: vse32.v v9, (a1)
; RV32-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
; RV32-NEXT: vse16.v v8, (a0)
; RV32-NEXT: ret
;
; RV64-LABEL: or_v6i16:
; RV64: # %bb.0:
; RV64-NEXT: vsetivli zero, 8, e16, m1, ta, ma
; RV64-NEXT: vle16.v v8, (a0)
; RV64-NEXT: vle16.v v9, (a1)
; RV64-NEXT: vor.vv v8, v8, v9
; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma
; RV64-NEXT: vse64.v v8, (a0)
; RV64-NEXT: vsetivli zero, 1, e32, m1, ta, ma
; RV64-NEXT: vslidedown.vi v8, v8, 2
; RV64-NEXT: addi a0, a0, 8
; RV64-NEXT: vse32.v v8, (a0)
; RV64-NEXT: ret
%a = load <6 x i16>, ptr %x		%a = load <6 x i16>, ptr %x
%b = load <6 x i16>, ptr %y		%b = load <6 x i16>, ptr %y
%c = or <6 x i16> %a, %b		%c = or <6 x i16> %a, %b
store <6 x i16> %c, ptr %x		store <6 x i16> %c, ptr %x
ret void		ret void
}		}

define void @or_v4i32(ptr %x, ptr %y) {		define void @or_v4i32(ptr %x, ptr %y) {
▲ Show 20 Lines • Show All 56 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%a = load <8 x i16>, ptr %x		%a = load <8 x i16>, ptr %x
%b = load <8 x i16>, ptr %y		%b = load <8 x i16>, ptr %y
%c = xor <8 x i16> %a, %b		%c = xor <8 x i16> %a, %b
store <8 x i16> %c, ptr %x		store <8 x i16> %c, ptr %x
ret void		ret void
}		}

define void @xor_v6i16(ptr %x, ptr %y) {		define void @xor_v6i16(ptr %x, ptr %y) {
; RV32-LABEL: xor_v6i16:		; CHECK-LABEL: xor_v6i16:
; RV32: # %bb.0:		; CHECK: # %bb.0:
; RV32-NEXT: vsetivli zero, 8, e16, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 6, e16, m1, ta, ma
; RV32-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; RV32-NEXT: vle16.v v9, (a1)		; CHECK-NEXT: vle16.v v9, (a1)
; RV32-NEXT: vxor.vv v8, v8, v9		; CHECK-NEXT: vxor.vv v8, v8, v9
; RV32-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vse16.v v8, (a0)
; RV32-NEXT: vslidedown.vi v9, v8, 2		; CHECK-NEXT: ret
; RV32-NEXT: addi a1, a0, 8
; RV32-NEXT: vse32.v v9, (a1)
; RV32-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
; RV32-NEXT: vse16.v v8, (a0)
; RV32-NEXT: ret
;
; RV64-LABEL: xor_v6i16:
; RV64: # %bb.0:
; RV64-NEXT: vsetivli zero, 8, e16, m1, ta, ma
; RV64-NEXT: vle16.v v8, (a0)
; RV64-NEXT: vle16.v v9, (a1)
; RV64-NEXT: vxor.vv v8, v8, v9
; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma
; RV64-NEXT: vse64.v v8, (a0)
; RV64-NEXT: vsetivli zero, 1, e32, m1, ta, ma
; RV64-NEXT: vslidedown.vi v8, v8, 2
; RV64-NEXT: addi a0, a0, 8
; RV64-NEXT: vse32.v v8, (a0)
; RV64-NEXT: ret
%a = load <6 x i16>, ptr %x		%a = load <6 x i16>, ptr %x
%b = load <6 x i16>, ptr %y		%b = load <6 x i16>, ptr %y
%c = xor <6 x i16> %a, %b		%c = xor <6 x i16> %a, %b
store <6 x i16> %c, ptr %x		store <6 x i16> %c, ptr %x
ret void		ret void
}		}

define void @xor_v4i32(ptr %x, ptr %y) {		define void @xor_v4i32(ptr %x, ptr %y) {
▲ Show 20 Lines • Show All 56 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%a = load <8 x i16>, ptr %x		%a = load <8 x i16>, ptr %x
%b = load <8 x i16>, ptr %y		%b = load <8 x i16>, ptr %y
%c = lshr <8 x i16> %a, %b		%c = lshr <8 x i16> %a, %b
store <8 x i16> %c, ptr %x		store <8 x i16> %c, ptr %x
ret void		ret void
}		}

define void @lshr_v6i16(ptr %x, ptr %y) {		define void @lshr_v6i16(ptr %x, ptr %y) {
; RV32-LABEL: lshr_v6i16:		; CHECK-LABEL: lshr_v6i16:
; RV32: # %bb.0:		; CHECK: # %bb.0:
; RV32-NEXT: vsetivli zero, 8, e16, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 6, e16, m1, ta, ma
; RV32-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; RV32-NEXT: vle16.v v9, (a1)		; CHECK-NEXT: vle16.v v9, (a1)
; RV32-NEXT: vsrl.vv v8, v8, v9		; CHECK-NEXT: vsrl.vv v8, v8, v9
; RV32-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vse16.v v8, (a0)
; RV32-NEXT: vslidedown.vi v9, v8, 2		; CHECK-NEXT: ret
; RV32-NEXT: addi a1, a0, 8
; RV32-NEXT: vse32.v v9, (a1)
; RV32-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
; RV32-NEXT: vse16.v v8, (a0)
; RV32-NEXT: ret
;
; RV64-LABEL: lshr_v6i16:
; RV64: # %bb.0:
; RV64-NEXT: vsetivli zero, 8, e16, m1, ta, ma
; RV64-NEXT: vle16.v v8, (a0)
; RV64-NEXT: vle16.v v9, (a1)
; RV64-NEXT: vsrl.vv v8, v8, v9
; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma
; RV64-NEXT: vse64.v v8, (a0)
; RV64-NEXT: vsetivli zero, 1, e32, m1, ta, ma
; RV64-NEXT: vslidedown.vi v8, v8, 2
; RV64-NEXT: addi a0, a0, 8
; RV64-NEXT: vse32.v v8, (a0)
; RV64-NEXT: ret
%a = load <6 x i16>, ptr %x		%a = load <6 x i16>, ptr %x
%b = load <6 x i16>, ptr %y		%b = load <6 x i16>, ptr %y
%c = lshr <6 x i16> %a, %b		%c = lshr <6 x i16> %a, %b
store <6 x i16> %c, ptr %x		store <6 x i16> %c, ptr %x
ret void		ret void
}		}

define void @lshr_v4i32(ptr %x, ptr %y) {		define void @lshr_v4i32(ptr %x, ptr %y) {
▲ Show 20 Lines • Show All 56 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%a = load <8 x i16>, ptr %x		%a = load <8 x i16>, ptr %x
%b = load <8 x i16>, ptr %y		%b = load <8 x i16>, ptr %y
%c = ashr <8 x i16> %a, %b		%c = ashr <8 x i16> %a, %b
store <8 x i16> %c, ptr %x		store <8 x i16> %c, ptr %x
ret void		ret void
}		}

define void @ashr_v6i16(ptr %x, ptr %y) {		define void @ashr_v6i16(ptr %x, ptr %y) {
; RV32-LABEL: ashr_v6i16:		; CHECK-LABEL: ashr_v6i16:
; RV32: # %bb.0:		; CHECK: # %bb.0:
; RV32-NEXT: vsetivli zero, 8, e16, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 6, e16, m1, ta, ma
; RV32-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; RV32-NEXT: vle16.v v9, (a1)		; CHECK-NEXT: vle16.v v9, (a1)
; RV32-NEXT: vsra.vv v8, v8, v9		; CHECK-NEXT: vsra.vv v8, v8, v9
; RV32-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vse16.v v8, (a0)
; RV32-NEXT: vslidedown.vi v9, v8, 2		; CHECK-NEXT: ret
; RV32-NEXT: addi a1, a0, 8
; RV32-NEXT: vse32.v v9, (a1)
; RV32-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
; RV32-NEXT: vse16.v v8, (a0)
; RV32-NEXT: ret
;
; RV64-LABEL: ashr_v6i16:
; RV64: # %bb.0:
; RV64-NEXT: vsetivli zero, 8, e16, m1, ta, ma
; RV64-NEXT: vle16.v v8, (a0)
; RV64-NEXT: vle16.v v9, (a1)
; RV64-NEXT: vsra.vv v8, v8, v9
; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma
; RV64-NEXT: vse64.v v8, (a0)
; RV64-NEXT: vsetivli zero, 1, e32, m1, ta, ma
; RV64-NEXT: vslidedown.vi v8, v8, 2
; RV64-NEXT: addi a0, a0, 8
; RV64-NEXT: vse32.v v8, (a0)
; RV64-NEXT: ret
%a = load <6 x i16>, ptr %x		%a = load <6 x i16>, ptr %x
%b = load <6 x i16>, ptr %y		%b = load <6 x i16>, ptr %y
%c = ashr <6 x i16> %a, %b		%c = ashr <6 x i16> %a, %b
store <6 x i16> %c, ptr %x		store <6 x i16> %c, ptr %x
ret void		ret void
}		}

define void @ashr_v4i32(ptr %x, ptr %y) {		define void @ashr_v4i32(ptr %x, ptr %y) {
▲ Show 20 Lines • Show All 56 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%a = load <8 x i16>, ptr %x		%a = load <8 x i16>, ptr %x
%b = load <8 x i16>, ptr %y		%b = load <8 x i16>, ptr %y
%c = shl <8 x i16> %a, %b		%c = shl <8 x i16> %a, %b
store <8 x i16> %c, ptr %x		store <8 x i16> %c, ptr %x
ret void		ret void
}		}

define void @shl_v6i16(ptr %x, ptr %y) {		define void @shl_v6i16(ptr %x, ptr %y) {
; RV32-LABEL: shl_v6i16:		; CHECK-LABEL: shl_v6i16:
; RV32: # %bb.0:		; CHECK: # %bb.0:
; RV32-NEXT: vsetivli zero, 8, e16, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 6, e16, m1, ta, ma
; RV32-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; RV32-NEXT: vle16.v v9, (a1)		; CHECK-NEXT: vle16.v v9, (a1)
; RV32-NEXT: vsll.vv v8, v8, v9		; CHECK-NEXT: vsll.vv v8, v8, v9
; RV32-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vse16.v v8, (a0)
; RV32-NEXT: vslidedown.vi v9, v8, 2		; CHECK-NEXT: ret
; RV32-NEXT: addi a1, a0, 8
; RV32-NEXT: vse32.v v9, (a1)
; RV32-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
; RV32-NEXT: vse16.v v8, (a0)
; RV32-NEXT: ret
;
; RV64-LABEL: shl_v6i16:
; RV64: # %bb.0:
; RV64-NEXT: vsetivli zero, 8, e16, m1, ta, ma
; RV64-NEXT: vle16.v v8, (a0)
; RV64-NEXT: vle16.v v9, (a1)
; RV64-NEXT: vsll.vv v8, v8, v9
; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma
; RV64-NEXT: vse64.v v8, (a0)
; RV64-NEXT: vsetivli zero, 1, e32, m1, ta, ma
; RV64-NEXT: vslidedown.vi v8, v8, 2
; RV64-NEXT: addi a0, a0, 8
; RV64-NEXT: vse32.v v8, (a0)
; RV64-NEXT: ret
%a = load <6 x i16>, ptr %x		%a = load <6 x i16>, ptr %x
%b = load <6 x i16>, ptr %y		%b = load <6 x i16>, ptr %y
%c = shl <6 x i16> %a, %b		%c = shl <6 x i16> %a, %b
store <6 x i16> %c, ptr %x		store <6 x i16> %c, ptr %x
ret void		ret void
}		}

define void @shl_v4i32(ptr %x, ptr %y) {		define void @shl_v4i32(ptr %x, ptr %y) {
▲ Show 20 Lines • Show All 56 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%a = load <8 x i16>, ptr %x		%a = load <8 x i16>, ptr %x
%b = load <8 x i16>, ptr %y		%b = load <8 x i16>, ptr %y
%c = sdiv <8 x i16> %a, %b		%c = sdiv <8 x i16> %a, %b
store <8 x i16> %c, ptr %x		store <8 x i16> %c, ptr %x
ret void		ret void
}		}

define void @sdiv_v6i16(ptr %x, ptr %y) {		define void @sdiv_v6i16(ptr %x, ptr %y) {
; RV32-LABEL: sdiv_v6i16:		; CHECK-LABEL: sdiv_v6i16:
; RV32: # %bb.0:		; CHECK: # %bb.0:
; RV32-NEXT: vsetivli zero, 8, e16, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 6, e16, m1, ta, ma
; RV32-NEXT: vle16.v v8, (a1)		; CHECK-NEXT: vle16.v v8, (a1)
; RV32-NEXT: vle16.v v9, (a0)		; CHECK-NEXT: vle16.v v9, (a0)
; RV32-NEXT: vsetivli zero, 2, e16, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 2, e16, m1, ta, ma
; RV32-NEXT: vslidedown.vi v10, v8, 4		; CHECK-NEXT: vslidedown.vi v10, v8, 4
; RV32-NEXT: vslidedown.vi v11, v9, 4		; CHECK-NEXT: vslidedown.vi v11, v9, 4
; RV32-NEXT: vsetivli zero, 2, e16, mf4, ta, ma		; CHECK-NEXT: vsetivli zero, 2, e16, mf4, ta, ma
; RV32-NEXT: vdiv.vv v10, v11, v10		; CHECK-NEXT: vdiv.vv v10, v11, v10
; RV32-NEXT: vsetivli zero, 6, e16, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
; RV32-NEXT: vslideup.vi v11, v10, 4		; CHECK-NEXT: vdiv.vv v8, v9, v8
; RV32-NEXT: vsetivli zero, 4, e16, mf2, ta, ma		; CHECK-NEXT: vsetivli zero, 8, e16, m1, ta, ma
; RV32-NEXT: vdiv.vv v8, v9, v8		; CHECK-NEXT: vslideup.vi v8, v10, 4
; RV32-NEXT: vse16.v v8, (a0)		; CHECK-NEXT: vsetivli zero, 6, e16, m1, ta, ma
; RV32-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vse16.v v8, (a0)
; RV32-NEXT: vslidedown.vi v8, v11, 2		; CHECK-NEXT: ret
; RV32-NEXT: addi a0, a0, 8
; RV32-NEXT: vse32.v v8, (a0)
; RV32-NEXT: ret
;
; RV64-LABEL: sdiv_v6i16:
; RV64: # %bb.0:
; RV64-NEXT: vsetivli zero, 8, e16, m1, ta, ma
; RV64-NEXT: vle16.v v8, (a1)
; RV64-NEXT: vle16.v v9, (a0)
; RV64-NEXT: vsetivli zero, 2, e16, m1, ta, ma
; RV64-NEXT: vslidedown.vi v10, v8, 4
; RV64-NEXT: vslidedown.vi v11, v9, 4
; RV64-NEXT: vsetivli zero, 2, e16, mf4, ta, ma
; RV64-NEXT: vdiv.vv v10, v11, v10
; RV64-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
; RV64-NEXT: vdiv.vv v8, v9, v8
; RV64-NEXT: vsetivli zero, 8, e16, m1, ta, ma
; RV64-NEXT: vslideup.vi v8, v10, 4
; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma
; RV64-NEXT: vse64.v v8, (a0)
; RV64-NEXT: vsetivli zero, 1, e32, m1, ta, ma
; RV64-NEXT: vslidedown.vi v8, v8, 2
; RV64-NEXT: addi a0, a0, 8
; RV64-NEXT: vse32.v v8, (a0)
; RV64-NEXT: ret
%a = load <6 x i16>, ptr %x		%a = load <6 x i16>, ptr %x
%b = load <6 x i16>, ptr %y		%b = load <6 x i16>, ptr %y
%c = sdiv <6 x i16> %a, %b		%c = sdiv <6 x i16> %a, %b
store <6 x i16> %c, ptr %x		store <6 x i16> %c, ptr %x
ret void		ret void
}		}

define void @sdiv_v4i32(ptr %x, ptr %y) {		define void @sdiv_v4i32(ptr %x, ptr %y) {
▲ Show 20 Lines • Show All 56 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%a = load <8 x i16>, ptr %x		%a = load <8 x i16>, ptr %x
%b = load <8 x i16>, ptr %y		%b = load <8 x i16>, ptr %y
%c = srem <8 x i16> %a, %b		%c = srem <8 x i16> %a, %b
store <8 x i16> %c, ptr %x		store <8 x i16> %c, ptr %x
ret void		ret void
}		}

define void @srem_v6i16(ptr %x, ptr %y) {		define void @srem_v6i16(ptr %x, ptr %y) {
; RV32-LABEL: srem_v6i16:		; CHECK-LABEL: srem_v6i16:
; RV32: # %bb.0:		; CHECK: # %bb.0:
; RV32-NEXT: vsetivli zero, 8, e16, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 6, e16, m1, ta, ma
; RV32-NEXT: vle16.v v8, (a1)		; CHECK-NEXT: vle16.v v8, (a1)
; RV32-NEXT: vle16.v v9, (a0)		; CHECK-NEXT: vle16.v v9, (a0)
; RV32-NEXT: vsetivli zero, 2, e16, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 2, e16, m1, ta, ma
; RV32-NEXT: vslidedown.vi v10, v8, 4		; CHECK-NEXT: vslidedown.vi v10, v8, 4
; RV32-NEXT: vslidedown.vi v11, v9, 4		; CHECK-NEXT: vslidedown.vi v11, v9, 4
; RV32-NEXT: vsetivli zero, 2, e16, mf4, ta, ma		; CHECK-NEXT: vsetivli zero, 2, e16, mf4, ta, ma
; RV32-NEXT: vrem.vv v10, v11, v10		; CHECK-NEXT: vrem.vv v10, v11, v10
; RV32-NEXT: vsetivli zero, 6, e16, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
; RV32-NEXT: vslideup.vi v11, v10, 4		; CHECK-NEXT: vrem.vv v8, v9, v8
; RV32-NEXT: vsetivli zero, 4, e16, mf2, ta, ma		; CHECK-NEXT: vsetivli zero, 8, e16, m1, ta, ma
; RV32-NEXT: vrem.vv v8, v9, v8		; CHECK-NEXT: vslideup.vi v8, v10, 4
; RV32-NEXT: vse16.v v8, (a0)		; CHECK-NEXT: vsetivli zero, 6, e16, m1, ta, ma
; RV32-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vse16.v v8, (a0)
; RV32-NEXT: vslidedown.vi v8, v11, 2		; CHECK-NEXT: ret
; RV32-NEXT: addi a0, a0, 8
; RV32-NEXT: vse32.v v8, (a0)
; RV32-NEXT: ret
;
; RV64-LABEL: srem_v6i16:
; RV64: # %bb.0:
; RV64-NEXT: vsetivli zero, 8, e16, m1, ta, ma
; RV64-NEXT: vle16.v v8, (a1)
; RV64-NEXT: vle16.v v9, (a0)
; RV64-NEXT: vsetivli zero, 2, e16, m1, ta, ma
; RV64-NEXT: vslidedown.vi v10, v8, 4
; RV64-NEXT: vslidedown.vi v11, v9, 4
; RV64-NEXT: vsetivli zero, 2, e16, mf4, ta, ma
; RV64-NEXT: vrem.vv v10, v11, v10
; RV64-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
; RV64-NEXT: vrem.vv v8, v9, v8
; RV64-NEXT: vsetivli zero, 8, e16, m1, ta, ma
; RV64-NEXT: vslideup.vi v8, v10, 4
; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma
; RV64-NEXT: vse64.v v8, (a0)
; RV64-NEXT: vsetivli zero, 1, e32, m1, ta, ma
; RV64-NEXT: vslidedown.vi v8, v8, 2
; RV64-NEXT: addi a0, a0, 8
; RV64-NEXT: vse32.v v8, (a0)
; RV64-NEXT: ret
%a = load <6 x i16>, ptr %x		%a = load <6 x i16>, ptr %x
%b = load <6 x i16>, ptr %y		%b = load <6 x i16>, ptr %y
%c = srem <6 x i16> %a, %b		%c = srem <6 x i16> %a, %b
store <6 x i16> %c, ptr %x		store <6 x i16> %c, ptr %x
ret void		ret void
}		}

define void @srem_v4i32(ptr %x, ptr %y) {		define void @srem_v4i32(ptr %x, ptr %y) {
▲ Show 20 Lines • Show All 56 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%a = load <8 x i16>, ptr %x		%a = load <8 x i16>, ptr %x
%b = load <8 x i16>, ptr %y		%b = load <8 x i16>, ptr %y
%c = udiv <8 x i16> %a, %b		%c = udiv <8 x i16> %a, %b
store <8 x i16> %c, ptr %x		store <8 x i16> %c, ptr %x
ret void		ret void
}		}

define void @udiv_v6i16(ptr %x, ptr %y) {		define void @udiv_v6i16(ptr %x, ptr %y) {
; RV32-LABEL: udiv_v6i16:		; CHECK-LABEL: udiv_v6i16:
; RV32: # %bb.0:		; CHECK: # %bb.0:
; RV32-NEXT: vsetivli zero, 8, e16, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 6, e16, m1, ta, ma
; RV32-NEXT: vle16.v v8, (a1)		; CHECK-NEXT: vle16.v v8, (a1)
; RV32-NEXT: vle16.v v9, (a0)		; CHECK-NEXT: vle16.v v9, (a0)
; RV32-NEXT: vsetivli zero, 2, e16, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 2, e16, m1, ta, ma
; RV32-NEXT: vslidedown.vi v10, v8, 4		; CHECK-NEXT: vslidedown.vi v10, v8, 4
; RV32-NEXT: vslidedown.vi v11, v9, 4		; CHECK-NEXT: vslidedown.vi v11, v9, 4
; RV32-NEXT: vsetivli zero, 2, e16, mf4, ta, ma		; CHECK-NEXT: vsetivli zero, 2, e16, mf4, ta, ma
; RV32-NEXT: vdivu.vv v10, v11, v10		; CHECK-NEXT: vdivu.vv v10, v11, v10
		craig.topperUnsubmitted Not Done Reply Inline Actions Can't we use a VL=6 vdivu.vv? craig.topper: Can't we use a VL=6 vdivu.vv?
		lukeAuthorUnsubmitted Done Reply Inline Actions I think so, this patch just didn't handle the case for ops that can trap like udiv/urem etc. luke: I think so, this patch just didn't handle the case for ops that can trap like udiv/urem etc.
; RV32-NEXT: vsetivli zero, 6, e16, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
; RV32-NEXT: vslideup.vi v11, v10, 4		; CHECK-NEXT: vdivu.vv v8, v9, v8
; RV32-NEXT: vsetivli zero, 4, e16, mf2, ta, ma		; CHECK-NEXT: vsetivli zero, 8, e16, m1, ta, ma
; RV32-NEXT: vdivu.vv v8, v9, v8		; CHECK-NEXT: vslideup.vi v8, v10, 4
; RV32-NEXT: vse16.v v8, (a0)		; CHECK-NEXT: vsetivli zero, 6, e16, m1, ta, ma
; RV32-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vse16.v v8, (a0)
; RV32-NEXT: vslidedown.vi v8, v11, 2		; CHECK-NEXT: ret
; RV32-NEXT: addi a0, a0, 8
; RV32-NEXT: vse32.v v8, (a0)
; RV32-NEXT: ret
;
; RV64-LABEL: udiv_v6i16:
; RV64: # %bb.0:
; RV64-NEXT: vsetivli zero, 8, e16, m1, ta, ma
; RV64-NEXT: vle16.v v8, (a1)
; RV64-NEXT: vle16.v v9, (a0)
; RV64-NEXT: vsetivli zero, 2, e16, m1, ta, ma
; RV64-NEXT: vslidedown.vi v10, v8, 4
; RV64-NEXT: vslidedown.vi v11, v9, 4
; RV64-NEXT: vsetivli zero, 2, e16, mf4, ta, ma
; RV64-NEXT: vdivu.vv v10, v11, v10
; RV64-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
; RV64-NEXT: vdivu.vv v8, v9, v8
; RV64-NEXT: vsetivli zero, 8, e16, m1, ta, ma
; RV64-NEXT: vslideup.vi v8, v10, 4
; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma
; RV64-NEXT: vse64.v v8, (a0)
; RV64-NEXT: vsetivli zero, 1, e32, m1, ta, ma
; RV64-NEXT: vslidedown.vi v8, v8, 2
; RV64-NEXT: addi a0, a0, 8
; RV64-NEXT: vse32.v v8, (a0)
; RV64-NEXT: ret
%a = load <6 x i16>, ptr %x		%a = load <6 x i16>, ptr %x
%b = load <6 x i16>, ptr %y		%b = load <6 x i16>, ptr %y
%c = udiv <6 x i16> %a, %b		%c = udiv <6 x i16> %a, %b
store <6 x i16> %c, ptr %x		store <6 x i16> %c, ptr %x
ret void		ret void
}		}

define void @udiv_v4i32(ptr %x, ptr %y) {		define void @udiv_v4i32(ptr %x, ptr %y) {
▲ Show 20 Lines • Show All 56 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%a = load <8 x i16>, ptr %x		%a = load <8 x i16>, ptr %x
%b = load <8 x i16>, ptr %y		%b = load <8 x i16>, ptr %y
%c = urem <8 x i16> %a, %b		%c = urem <8 x i16> %a, %b
store <8 x i16> %c, ptr %x		store <8 x i16> %c, ptr %x
ret void		ret void
}		}

define void @urem_v6i16(ptr %x, ptr %y) {		define void @urem_v6i16(ptr %x, ptr %y) {
; RV32-LABEL: urem_v6i16:		; CHECK-LABEL: urem_v6i16:
; RV32: # %bb.0:		; CHECK: # %bb.0:
; RV32-NEXT: vsetivli zero, 8, e16, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 6, e16, m1, ta, ma
; RV32-NEXT: vle16.v v8, (a1)		; CHECK-NEXT: vle16.v v8, (a1)
; RV32-NEXT: vle16.v v9, (a0)		; CHECK-NEXT: vle16.v v9, (a0)
; RV32-NEXT: vsetivli zero, 2, e16, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 2, e16, m1, ta, ma
; RV32-NEXT: vslidedown.vi v10, v8, 4		; CHECK-NEXT: vslidedown.vi v10, v8, 4
; RV32-NEXT: vslidedown.vi v11, v9, 4		; CHECK-NEXT: vslidedown.vi v11, v9, 4
; RV32-NEXT: vsetivli zero, 2, e16, mf4, ta, ma		; CHECK-NEXT: vsetivli zero, 2, e16, mf4, ta, ma
; RV32-NEXT: vremu.vv v10, v11, v10		; CHECK-NEXT: vremu.vv v10, v11, v10
; RV32-NEXT: vsetivli zero, 6, e16, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
; RV32-NEXT: vslideup.vi v11, v10, 4		; CHECK-NEXT: vremu.vv v8, v9, v8
; RV32-NEXT: vsetivli zero, 4, e16, mf2, ta, ma		; CHECK-NEXT: vsetivli zero, 8, e16, m1, ta, ma
; RV32-NEXT: vremu.vv v8, v9, v8		; CHECK-NEXT: vslideup.vi v8, v10, 4
; RV32-NEXT: vse16.v v8, (a0)		; CHECK-NEXT: vsetivli zero, 6, e16, m1, ta, ma
; RV32-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vse16.v v8, (a0)
; RV32-NEXT: vslidedown.vi v8, v11, 2		; CHECK-NEXT: ret
; RV32-NEXT: addi a0, a0, 8
; RV32-NEXT: vse32.v v8, (a0)
; RV32-NEXT: ret
;
; RV64-LABEL: urem_v6i16:
; RV64: # %bb.0:
; RV64-NEXT: vsetivli zero, 8, e16, m1, ta, ma
; RV64-NEXT: vle16.v v8, (a1)
; RV64-NEXT: vle16.v v9, (a0)
; RV64-NEXT: vsetivli zero, 2, e16, m1, ta, ma
; RV64-NEXT: vslidedown.vi v10, v8, 4
; RV64-NEXT: vslidedown.vi v11, v9, 4
; RV64-NEXT: vsetivli zero, 2, e16, mf4, ta, ma
; RV64-NEXT: vremu.vv v10, v11, v10
; RV64-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
; RV64-NEXT: vremu.vv v8, v9, v8
; RV64-NEXT: vsetivli zero, 8, e16, m1, ta, ma
; RV64-NEXT: vslideup.vi v8, v10, 4
; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma
; RV64-NEXT: vse64.v v8, (a0)
; RV64-NEXT: vsetivli zero, 1, e32, m1, ta, ma
; RV64-NEXT: vslidedown.vi v8, v8, 2
; RV64-NEXT: addi a0, a0, 8
; RV64-NEXT: vse32.v v8, (a0)
; RV64-NEXT: ret
%a = load <6 x i16>, ptr %x		%a = load <6 x i16>, ptr %x
%b = load <6 x i16>, ptr %y		%b = load <6 x i16>, ptr %y
%c = urem <6 x i16> %a, %b		%c = urem <6 x i16> %a, %b
store <6 x i16> %c, ptr %x		store <6 x i16> %c, ptr %x
ret void		ret void
}		}

define void @urem_v4i32(ptr %x, ptr %y) {		define void @urem_v4i32(ptr %x, ptr %y) {
▲ Show 20 Lines • Show All 163 Lines • ▼ Show 20 Lines
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = load <8 x i16>, ptr %x		%a = load <8 x i16>, ptr %x
%b = udiv <8 x i16> %a, <i16 7, i16 9, i16 10, i16 11, i16 12, i16 13, i16 14, i16 15>		%b = udiv <8 x i16> %a, <i16 7, i16 9, i16 10, i16 11, i16 12, i16 13, i16 14, i16 15>
store <8 x i16> %b, ptr %x		store <8 x i16> %b, ptr %x
ret void		ret void
}		}

define void @mulhu_v6i16(ptr %x) {		define void @mulhu_v6i16(ptr %x) {
; RV32-LABEL: mulhu_v6i16:		; CHECK-LABEL: mulhu_v6i16:
; RV32: # %bb.0:		; CHECK: # %bb.0:
; RV32-NEXT: vsetivli zero, 8, e16, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 6, e16, m1, ta, ma
; RV32-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; RV32-NEXT: vsetivli zero, 2, e16, m1, ta, ma		; CHECK-NEXT: lui a1, %hi(.LCPI67_0)
; RV32-NEXT: vslidedown.vi v9, v8, 4		; CHECK-NEXT: addi a1, a1, %lo(.LCPI67_0)
; RV32-NEXT: vsetivli zero, 2, e16, mf4, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
; RV32-NEXT: vid.v v10		; CHECK-NEXT: vle16.v v9, (a1)
; RV32-NEXT: vadd.vi v10, v10, 12		; CHECK-NEXT: vdivu.vv v9, v8, v9
; RV32-NEXT: vdivu.vv v9, v9, v10		; CHECK-NEXT: vsetivli zero, 2, e16, m1, ta, ma
; RV32-NEXT: vsetivli zero, 6, e16, m1, ta, ma		; CHECK-NEXT: vslidedown.vi v8, v8, 4
; RV32-NEXT: vslideup.vi v10, v9, 4		; CHECK-NEXT: vsetivli zero, 2, e16, mf4, ta, ma
; RV32-NEXT: lui a1, %hi(.LCPI67_0)		; CHECK-NEXT: vid.v v10
; RV32-NEXT: addi a1, a1, %lo(.LCPI67_0)		; CHECK-NEXT: vadd.vi v10, v10, 12
; RV32-NEXT: vsetivli zero, 4, e16, mf2, ta, ma		; CHECK-NEXT: vdivu.vv v8, v8, v10
; RV32-NEXT: vle16.v v9, (a1)		; CHECK-NEXT: vsetivli zero, 8, e16, m1, ta, ma
; RV32-NEXT: vdivu.vv v8, v8, v9		; CHECK-NEXT: vslideup.vi v9, v8, 4
; RV32-NEXT: vse16.v v8, (a0)		; CHECK-NEXT: vsetivli zero, 6, e16, m1, ta, ma
; RV32-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vse16.v v9, (a0)
; RV32-NEXT: vslidedown.vi v8, v10, 2		; CHECK-NEXT: ret
; RV32-NEXT: addi a0, a0, 8
; RV32-NEXT: vse32.v v8, (a0)
; RV32-NEXT: ret
;
; RV64-LABEL: mulhu_v6i16:
; RV64: # %bb.0:
; RV64-NEXT: vsetivli zero, 8, e16, m1, ta, ma
; RV64-NEXT: vle16.v v8, (a0)
; RV64-NEXT: lui a1, %hi(.LCPI67_0)
; RV64-NEXT: addi a1, a1, %lo(.LCPI67_0)
; RV64-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
; RV64-NEXT: vle16.v v9, (a1)
; RV64-NEXT: vdivu.vv v9, v8, v9
; RV64-NEXT: vsetivli zero, 2, e16, m1, ta, ma
; RV64-NEXT: vslidedown.vi v8, v8, 4
; RV64-NEXT: vsetivli zero, 2, e16, mf4, ta, ma
; RV64-NEXT: vid.v v10
; RV64-NEXT: vadd.vi v10, v10, 12
; RV64-NEXT: vdivu.vv v8, v8, v10
; RV64-NEXT: vsetivli zero, 8, e16, m1, ta, ma
; RV64-NEXT: vslideup.vi v9, v8, 4
; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma
; RV64-NEXT: vse64.v v9, (a0)
; RV64-NEXT: vsetivli zero, 1, e32, m1, ta, ma
; RV64-NEXT: vslidedown.vi v8, v9, 2
; RV64-NEXT: addi a0, a0, 8
; RV64-NEXT: vse32.v v8, (a0)
; RV64-NEXT: ret
%a = load <6 x i16>, ptr %x		%a = load <6 x i16>, ptr %x
%b = udiv <6 x i16> %a, <i16 7, i16 9, i16 10, i16 11, i16 12, i16 13>		%b = udiv <6 x i16> %a, <i16 7, i16 9, i16 10, i16 11, i16 12, i16 13>
store <6 x i16> %b, ptr %x		store <6 x i16> %b, ptr %x
ret void		ret void
}		}

define void @mulhu_v4i32(ptr %x) {		define void @mulhu_v4i32(ptr %x) {
; CHECK-LABEL: mulhu_v4i32:		; CHECK-LABEL: mulhu_v4i32:
▲ Show 20 Lines • Show All 155 Lines • ▼ Show 20 Lines
; RV64-NEXT: ret		; RV64-NEXT: ret
%a = load <8 x i16>, ptr %x		%a = load <8 x i16>, ptr %x
%b = sdiv <8 x i16> %a, <i16 -7, i16 7, i16 7, i16 -7, i16 7, i16 -7, i16 -7, i16 7>		%b = sdiv <8 x i16> %a, <i16 -7, i16 7, i16 7, i16 -7, i16 7, i16 -7, i16 -7, i16 7>
store <8 x i16> %b, ptr %x		store <8 x i16> %b, ptr %x
ret void		ret void
}		}

define void @mulhs_v6i16(ptr %x) {		define void @mulhs_v6i16(ptr %x) {
; RV32-LABEL: mulhs_v6i16:		; CHECK-LABEL: mulhs_v6i16:
; RV32: # %bb.0:		; CHECK: # %bb.0:
; RV32-NEXT: vsetivli zero, 8, e16, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 6, e16, m1, ta, ma
; RV32-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; RV32-NEXT: vsetivli zero, 2, e16, mf4, ta, ma		; CHECK-NEXT: vsetivli zero, 2, e16, mf4, ta, ma
; RV32-NEXT: vmv.v.i v9, 7		; CHECK-NEXT: vmv.v.i v9, 7
; RV32-NEXT: vid.v v10		; CHECK-NEXT: vid.v v10
; RV32-NEXT: li a1, -14		; CHECK-NEXT: li a1, -14
; RV32-NEXT: vmadd.vx v10, a1, v9		; CHECK-NEXT: vmadd.vx v10, a1, v9
; RV32-NEXT: vsetivli zero, 2, e16, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 2, e16, m1, ta, ma
; RV32-NEXT: vslidedown.vi v9, v8, 4		; CHECK-NEXT: vslidedown.vi v9, v8, 4
; RV32-NEXT: vsetivli zero, 2, e16, mf4, ta, ma		; CHECK-NEXT: vsetivli zero, 2, e16, mf4, ta, ma
; RV32-NEXT: vdiv.vv v9, v9, v10		; CHECK-NEXT: vdiv.vv v9, v9, v10
; RV32-NEXT: vsetivli zero, 6, e16, m1, ta, ma		; CHECK-NEXT: li a1, 6
; RV32-NEXT: vslideup.vi v10, v9, 4		; CHECK-NEXT: vmv.s.x v0, a1
; RV32-NEXT: li a1, 6		; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
; RV32-NEXT: vmv.s.x v0, a1		; CHECK-NEXT: vmv.v.i v10, -7
; RV32-NEXT: vsetivli zero, 4, e16, mf2, ta, ma		; CHECK-NEXT: vmerge.vim v10, v10, 7, v0
; RV32-NEXT: vmv.v.i v9, -7		; CHECK-NEXT: vdiv.vv v8, v8, v10
; RV32-NEXT: vmerge.vim v9, v9, 7, v0		; CHECK-NEXT: vsetivli zero, 8, e16, m1, ta, ma
; RV32-NEXT: vdiv.vv v8, v8, v9		; CHECK-NEXT: vslideup.vi v8, v9, 4
; RV32-NEXT: vse16.v v8, (a0)		; CHECK-NEXT: vsetivli zero, 6, e16, m1, ta, ma
; RV32-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vse16.v v8, (a0)
; RV32-NEXT: vslidedown.vi v8, v10, 2		; CHECK-NEXT: ret
; RV32-NEXT: addi a0, a0, 8
; RV32-NEXT: vse32.v v8, (a0)
; RV32-NEXT: ret
;
; RV64-LABEL: mulhs_v6i16:
; RV64: # %bb.0:
; RV64-NEXT: vsetivli zero, 8, e16, m1, ta, ma
; RV64-NEXT: vle16.v v8, (a0)
; RV64-NEXT: vsetivli zero, 2, e16, mf4, ta, ma
; RV64-NEXT: vmv.v.i v9, 7
; RV64-NEXT: vid.v v10
; RV64-NEXT: li a1, -14
; RV64-NEXT: vmadd.vx v10, a1, v9
; RV64-NEXT: vsetivli zero, 2, e16, m1, ta, ma
; RV64-NEXT: vslidedown.vi v9, v8, 4
; RV64-NEXT: vsetivli zero, 2, e16, mf4, ta, ma
; RV64-NEXT: vdiv.vv v9, v9, v10
; RV64-NEXT: li a1, 6
; RV64-NEXT: vmv.s.x v0, a1
; RV64-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
; RV64-NEXT: vmv.v.i v10, -7
; RV64-NEXT: vmerge.vim v10, v10, 7, v0
; RV64-NEXT: vdiv.vv v8, v8, v10
; RV64-NEXT: vsetivli zero, 8, e16, m1, ta, ma
; RV64-NEXT: vslideup.vi v8, v9, 4
; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma
; RV64-NEXT: vse64.v v8, (a0)
; RV64-NEXT: vsetivli zero, 1, e32, m1, ta, ma
; RV64-NEXT: vslidedown.vi v8, v8, 2
; RV64-NEXT: addi a0, a0, 8
; RV64-NEXT: vse32.v v8, (a0)
; RV64-NEXT: ret
%a = load <6 x i16>, ptr %x		%a = load <6 x i16>, ptr %x
%b = sdiv <6 x i16> %a, <i16 -7, i16 7, i16 7, i16 -7, i16 7, i16 -7>		%b = sdiv <6 x i16> %a, <i16 -7, i16 7, i16 7, i16 -7, i16 7, i16 -7>
store <6 x i16> %b, ptr %x		store <6 x i16> %b, ptr %x
ret void		ret void
}		}

define void @mulhs_v4i32(ptr %x) {		define void @mulhs_v4i32(ptr %x) {
; RV32-LABEL: mulhs_v4i32:		; RV32-LABEL: mulhs_v4i32:
▲ Show 20 Lines • Show All 127 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%b = load <8 x i16>, ptr %y		%b = load <8 x i16>, ptr %y
%cc = icmp slt <8 x i16> %a, %b		%cc = icmp slt <8 x i16> %a, %b
%c = select <8 x i1> %cc, <8 x i16> %a, <8 x i16> %b		%c = select <8 x i1> %cc, <8 x i16> %a, <8 x i16> %b
store <8 x i16> %c, ptr %x		store <8 x i16> %c, ptr %x
ret void		ret void
}		}

define void @smin_v6i16(ptr %x, ptr %y) {		define void @smin_v6i16(ptr %x, ptr %y) {
; RV32-LABEL: smin_v6i16:		; CHECK-LABEL: smin_v6i16:
; RV32: # %bb.0:		; CHECK: # %bb.0:
; RV32-NEXT: vsetivli zero, 8, e16, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 6, e16, m1, ta, ma
; RV32-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; RV32-NEXT: vle16.v v9, (a1)		; CHECK-NEXT: vle16.v v9, (a1)
; RV32-NEXT: vmin.vv v8, v8, v9		; CHECK-NEXT: vmin.vv v8, v8, v9
; RV32-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vse16.v v8, (a0)
; RV32-NEXT: vslidedown.vi v9, v8, 2		; CHECK-NEXT: ret
; RV32-NEXT: addi a1, a0, 8
; RV32-NEXT: vse32.v v9, (a1)
; RV32-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
; RV32-NEXT: vse16.v v8, (a0)
; RV32-NEXT: ret
;
; RV64-LABEL: smin_v6i16:
; RV64: # %bb.0:
; RV64-NEXT: vsetivli zero, 8, e16, m1, ta, ma
; RV64-NEXT: vle16.v v8, (a0)
; RV64-NEXT: vle16.v v9, (a1)
; RV64-NEXT: vmin.vv v8, v8, v9
; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma
; RV64-NEXT: vse64.v v8, (a0)
; RV64-NEXT: vsetivli zero, 1, e32, m1, ta, ma
; RV64-NEXT: vslidedown.vi v8, v8, 2
; RV64-NEXT: addi a0, a0, 8
; RV64-NEXT: vse32.v v8, (a0)
; RV64-NEXT: ret
%a = load <6 x i16>, ptr %x		%a = load <6 x i16>, ptr %x
%b = load <6 x i16>, ptr %y		%b = load <6 x i16>, ptr %y
%cc = icmp slt <6 x i16> %a, %b		%cc = icmp slt <6 x i16> %a, %b
%c = select <6 x i1> %cc, <6 x i16> %a, <6 x i16> %b		%c = select <6 x i1> %cc, <6 x i16> %a, <6 x i16> %b
store <6 x i16> %c, ptr %x		store <6 x i16> %c, ptr %x
ret void		ret void
}		}

▲ Show 20 Lines • Show All 61 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%c = shufflevector <8 x i16> %b, <8 x i16> poison, <8 x i32> zeroinitializer		%c = shufflevector <8 x i16> %b, <8 x i16> poison, <8 x i32> zeroinitializer
%d = call <8 x i16> @llvm.smin.v8i16(<8 x i16> %a, <8 x i16> %c)		%d = call <8 x i16> @llvm.smin.v8i16(<8 x i16> %a, <8 x i16> %c)
store <8 x i16> %d, ptr %x		store <8 x i16> %d, ptr %x
ret void		ret void
}		}
declare <8 x i16> @llvm.smin.v8i16(<8 x i16>, <8 x i16>)		declare <8 x i16> @llvm.smin.v8i16(<8 x i16>, <8 x i16>)

define void @smin_vx_v6i16(ptr %x, i16 %y) {		define void @smin_vx_v6i16(ptr %x, i16 %y) {
; RV32-LABEL: smin_vx_v6i16:		; CHECK-LABEL: smin_vx_v6i16:
; RV32: # %bb.0:		; CHECK: # %bb.0:
; RV32-NEXT: vsetivli zero, 8, e16, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 6, e16, m1, ta, ma
; RV32-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; RV32-NEXT: vmin.vx v8, v8, a1		; CHECK-NEXT: vmin.vx v8, v8, a1
; RV32-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vse16.v v8, (a0)
; RV32-NEXT: vslidedown.vi v9, v8, 2		; CHECK-NEXT: ret
; RV32-NEXT: addi a1, a0, 8
; RV32-NEXT: vse32.v v9, (a1)
; RV32-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
; RV32-NEXT: vse16.v v8, (a0)
; RV32-NEXT: ret
;
; RV64-LABEL: smin_vx_v6i16:
; RV64: # %bb.0:
; RV64-NEXT: vsetivli zero, 8, e16, m1, ta, ma
; RV64-NEXT: vle16.v v8, (a0)
; RV64-NEXT: vmin.vx v8, v8, a1
; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma
; RV64-NEXT: vse64.v v8, (a0)
; RV64-NEXT: vsetivli zero, 1, e32, m1, ta, ma
; RV64-NEXT: vslidedown.vi v8, v8, 2
; RV64-NEXT: addi a0, a0, 8
; RV64-NEXT: vse32.v v8, (a0)
; RV64-NEXT: ret
%a = load <6 x i16>, ptr %x		%a = load <6 x i16>, ptr %x
%b = insertelement <6 x i16> poison, i16 %y, i32 0		%b = insertelement <6 x i16> poison, i16 %y, i32 0
%c = shufflevector <6 x i16> %b, <6 x i16> poison, <6 x i32> zeroinitializer		%c = shufflevector <6 x i16> %b, <6 x i16> poison, <6 x i32> zeroinitializer
%d = call <6 x i16> @llvm.smin.v6i16(<6 x i16> %a, <6 x i16> %c)		%d = call <6 x i16> @llvm.smin.v6i16(<6 x i16> %a, <6 x i16> %c)
store <6 x i16> %d, ptr %x		store <6 x i16> %d, ptr %x
ret void		ret void
}		}
declare <6 x i16> @llvm.smin.v6i16(<6 x i16>, <6 x i16>)		declare <6 x i16> @llvm.smin.v6i16(<6 x i16>, <6 x i16>)
▲ Show 20 Lines • Show All 43 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%b = insertelement <8 x i16> poison, i16 %y, i32 0		%b = insertelement <8 x i16> poison, i16 %y, i32 0
%c = shufflevector <8 x i16> %b, <8 x i16> poison, <8 x i32> zeroinitializer		%c = shufflevector <8 x i16> %b, <8 x i16> poison, <8 x i32> zeroinitializer
%d = call <8 x i16> @llvm.smin.v8i16(<8 x i16> %c, <8 x i16> %a)		%d = call <8 x i16> @llvm.smin.v8i16(<8 x i16> %c, <8 x i16> %a)
store <8 x i16> %d, ptr %x		store <8 x i16> %d, ptr %x
ret void		ret void
}		}

define void @smin_xv_v6i16(ptr %x, i16 %y) {		define void @smin_xv_v6i16(ptr %x, i16 %y) {
; RV32-LABEL: smin_xv_v6i16:		; CHECK-LABEL: smin_xv_v6i16:
; RV32: # %bb.0:		; CHECK: # %bb.0:
; RV32-NEXT: vsetivli zero, 8, e16, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 6, e16, m1, ta, ma
; RV32-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; RV32-NEXT: vmin.vx v8, v8, a1		; CHECK-NEXT: vmin.vx v8, v8, a1
; RV32-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vse16.v v8, (a0)
; RV32-NEXT: vslidedown.vi v9, v8, 2		; CHECK-NEXT: ret
; RV32-NEXT: addi a1, a0, 8
; RV32-NEXT: vse32.v v9, (a1)
; RV32-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
; RV32-NEXT: vse16.v v8, (a0)
; RV32-NEXT: ret
;
; RV64-LABEL: smin_xv_v6i16:
; RV64: # %bb.0:
; RV64-NEXT: vsetivli zero, 8, e16, m1, ta, ma
; RV64-NEXT: vle16.v v8, (a0)
; RV64-NEXT: vmin.vx v8, v8, a1
; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma
; RV64-NEXT: vse64.v v8, (a0)
; RV64-NEXT: vsetivli zero, 1, e32, m1, ta, ma
; RV64-NEXT: vslidedown.vi v8, v8, 2
; RV64-NEXT: addi a0, a0, 8
; RV64-NEXT: vse32.v v8, (a0)
; RV64-NEXT: ret
%a = load <6 x i16>, ptr %x		%a = load <6 x i16>, ptr %x
%b = insertelement <6 x i16> poison, i16 %y, i32 0		%b = insertelement <6 x i16> poison, i16 %y, i32 0
%c = shufflevector <6 x i16> %b, <6 x i16> poison, <6 x i32> zeroinitializer		%c = shufflevector <6 x i16> %b, <6 x i16> poison, <6 x i32> zeroinitializer
%d = call <6 x i16> @llvm.smin.v6i16(<6 x i16> %c, <6 x i16> %a)		%d = call <6 x i16> @llvm.smin.v6i16(<6 x i16> %c, <6 x i16> %a)
store <6 x i16> %d, ptr %x		store <6 x i16> %d, ptr %x
ret void		ret void
}		}

▲ Show 20 Lines • Show All 43 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%b = load <8 x i16>, ptr %y		%b = load <8 x i16>, ptr %y
%cc = icmp sgt <8 x i16> %a, %b		%cc = icmp sgt <8 x i16> %a, %b
%c = select <8 x i1> %cc, <8 x i16> %a, <8 x i16> %b		%c = select <8 x i1> %cc, <8 x i16> %a, <8 x i16> %b
store <8 x i16> %c, ptr %x		store <8 x i16> %c, ptr %x
ret void		ret void
}		}

define void @smax_v6i16(ptr %x, ptr %y) {		define void @smax_v6i16(ptr %x, ptr %y) {
; RV32-LABEL: smax_v6i16:		; CHECK-LABEL: smax_v6i16:
; RV32: # %bb.0:		; CHECK: # %bb.0:
; RV32-NEXT: vsetivli zero, 8, e16, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 6, e16, m1, ta, ma
; RV32-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; RV32-NEXT: vle16.v v9, (a1)		; CHECK-NEXT: vle16.v v9, (a1)
; RV32-NEXT: vmax.vv v8, v8, v9		; CHECK-NEXT: vmax.vv v8, v8, v9
; RV32-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vse16.v v8, (a0)
; RV32-NEXT: vslidedown.vi v9, v8, 2		; CHECK-NEXT: ret
; RV32-NEXT: addi a1, a0, 8
; RV32-NEXT: vse32.v v9, (a1)
; RV32-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
; RV32-NEXT: vse16.v v8, (a0)
; RV32-NEXT: ret
;
; RV64-LABEL: smax_v6i16:
; RV64: # %bb.0:
; RV64-NEXT: vsetivli zero, 8, e16, m1, ta, ma
; RV64-NEXT: vle16.v v8, (a0)
; RV64-NEXT: vle16.v v9, (a1)
; RV64-NEXT: vmax.vv v8, v8, v9
; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma
; RV64-NEXT: vse64.v v8, (a0)
; RV64-NEXT: vsetivli zero, 1, e32, m1, ta, ma
; RV64-NEXT: vslidedown.vi v8, v8, 2
; RV64-NEXT: addi a0, a0, 8
; RV64-NEXT: vse32.v v8, (a0)
; RV64-NEXT: ret
%a = load <6 x i16>, ptr %x		%a = load <6 x i16>, ptr %x
%b = load <6 x i16>, ptr %y		%b = load <6 x i16>, ptr %y
%cc = icmp sgt <6 x i16> %a, %b		%cc = icmp sgt <6 x i16> %a, %b
%c = select <6 x i1> %cc, <6 x i16> %a, <6 x i16> %b		%c = select <6 x i1> %cc, <6 x i16> %a, <6 x i16> %b
store <6 x i16> %c, ptr %x		store <6 x i16> %c, ptr %x
ret void		ret void
}		}

▲ Show 20 Lines • Show All 61 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%c = shufflevector <8 x i16> %b, <8 x i16> poison, <8 x i32> zeroinitializer		%c = shufflevector <8 x i16> %b, <8 x i16> poison, <8 x i32> zeroinitializer
%d = call <8 x i16> @llvm.smax.v8i16(<8 x i16> %a, <8 x i16> %c)		%d = call <8 x i16> @llvm.smax.v8i16(<8 x i16> %a, <8 x i16> %c)
store <8 x i16> %d, ptr %x		store <8 x i16> %d, ptr %x
ret void		ret void
}		}
declare <8 x i16> @llvm.smax.v8i16(<8 x i16>, <8 x i16>)		declare <8 x i16> @llvm.smax.v8i16(<8 x i16>, <8 x i16>)

define void @smax_vx_v6i16(ptr %x, i16 %y) {		define void @smax_vx_v6i16(ptr %x, i16 %y) {
; RV32-LABEL: smax_vx_v6i16:		; CHECK-LABEL: smax_vx_v6i16:
; RV32: # %bb.0:		; CHECK: # %bb.0:
; RV32-NEXT: vsetivli zero, 8, e16, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 6, e16, m1, ta, ma
; RV32-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; RV32-NEXT: vmax.vx v8, v8, a1		; CHECK-NEXT: vmax.vx v8, v8, a1
; RV32-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vse16.v v8, (a0)
; RV32-NEXT: vslidedown.vi v9, v8, 2		; CHECK-NEXT: ret
; RV32-NEXT: addi a1, a0, 8
; RV32-NEXT: vse32.v v9, (a1)
; RV32-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
; RV32-NEXT: vse16.v v8, (a0)
; RV32-NEXT: ret
;
; RV64-LABEL: smax_vx_v6i16:
; RV64: # %bb.0:
; RV64-NEXT: vsetivli zero, 8, e16, m1, ta, ma
; RV64-NEXT: vle16.v v8, (a0)
; RV64-NEXT: vmax.vx v8, v8, a1
; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma
; RV64-NEXT: vse64.v v8, (a0)
; RV64-NEXT: vsetivli zero, 1, e32, m1, ta, ma
; RV64-NEXT: vslidedown.vi v8, v8, 2
; RV64-NEXT: addi a0, a0, 8
; RV64-NEXT: vse32.v v8, (a0)
; RV64-NEXT: ret
%a = load <6 x i16>, ptr %x		%a = load <6 x i16>, ptr %x
%b = insertelement <6 x i16> poison, i16 %y, i32 0		%b = insertelement <6 x i16> poison, i16 %y, i32 0
%c = shufflevector <6 x i16> %b, <6 x i16> poison, <6 x i32> zeroinitializer		%c = shufflevector <6 x i16> %b, <6 x i16> poison, <6 x i32> zeroinitializer
%d = call <6 x i16> @llvm.smax.v6i16(<6 x i16> %a, <6 x i16> %c)		%d = call <6 x i16> @llvm.smax.v6i16(<6 x i16> %a, <6 x i16> %c)
store <6 x i16> %d, ptr %x		store <6 x i16> %d, ptr %x
ret void		ret void
}		}
declare <6 x i16> @llvm.smax.v6i16(<6 x i16>, <6 x i16>)		declare <6 x i16> @llvm.smax.v6i16(<6 x i16>, <6 x i16>)
▲ Show 20 Lines • Show All 43 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%b = insertelement <8 x i16> poison, i16 %y, i32 0		%b = insertelement <8 x i16> poison, i16 %y, i32 0
%c = shufflevector <8 x i16> %b, <8 x i16> poison, <8 x i32> zeroinitializer		%c = shufflevector <8 x i16> %b, <8 x i16> poison, <8 x i32> zeroinitializer
%d = call <8 x i16> @llvm.smax.v8i16(<8 x i16> %c, <8 x i16> %a)		%d = call <8 x i16> @llvm.smax.v8i16(<8 x i16> %c, <8 x i16> %a)
store <8 x i16> %d, ptr %x		store <8 x i16> %d, ptr %x
ret void		ret void
}		}

define void @smax_xv_v6i16(ptr %x, i16 %y) {		define void @smax_xv_v6i16(ptr %x, i16 %y) {
; RV32-LABEL: smax_xv_v6i16:		; CHECK-LABEL: smax_xv_v6i16:
; RV32: # %bb.0:		; CHECK: # %bb.0:
; RV32-NEXT: vsetivli zero, 8, e16, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 6, e16, m1, ta, ma
; RV32-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; RV32-NEXT: vmax.vx v8, v8, a1		; CHECK-NEXT: vmax.vx v8, v8, a1
; RV32-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vse16.v v8, (a0)
; RV32-NEXT: vslidedown.vi v9, v8, 2		; CHECK-NEXT: ret
; RV32-NEXT: addi a1, a0, 8
; RV32-NEXT: vse32.v v9, (a1)
; RV32-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
; RV32-NEXT: vse16.v v8, (a0)
; RV32-NEXT: ret
;
; RV64-LABEL: smax_xv_v6i16:
; RV64: # %bb.0:
; RV64-NEXT: vsetivli zero, 8, e16, m1, ta, ma
; RV64-NEXT: vle16.v v8, (a0)
; RV64-NEXT: vmax.vx v8, v8, a1
; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma
; RV64-NEXT: vse64.v v8, (a0)
; RV64-NEXT: vsetivli zero, 1, e32, m1, ta, ma
; RV64-NEXT: vslidedown.vi v8, v8, 2
; RV64-NEXT: addi a0, a0, 8
; RV64-NEXT: vse32.v v8, (a0)
; RV64-NEXT: ret
%a = load <6 x i16>, ptr %x		%a = load <6 x i16>, ptr %x
%b = insertelement <6 x i16> poison, i16 %y, i32 0		%b = insertelement <6 x i16> poison, i16 %y, i32 0
%c = shufflevector <6 x i16> %b, <6 x i16> poison, <6 x i32> zeroinitializer		%c = shufflevector <6 x i16> %b, <6 x i16> poison, <6 x i32> zeroinitializer
%d = call <6 x i16> @llvm.smax.v6i16(<6 x i16> %c, <6 x i16> %a)		%d = call <6 x i16> @llvm.smax.v6i16(<6 x i16> %c, <6 x i16> %a)
store <6 x i16> %d, ptr %x		store <6 x i16> %d, ptr %x
ret void		ret void
}		}

▲ Show 20 Lines • Show All 43 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%b = load <8 x i16>, ptr %y		%b = load <8 x i16>, ptr %y
%cc = icmp ult <8 x i16> %a, %b		%cc = icmp ult <8 x i16> %a, %b
%c = select <8 x i1> %cc, <8 x i16> %a, <8 x i16> %b		%c = select <8 x i1> %cc, <8 x i16> %a, <8 x i16> %b
store <8 x i16> %c, ptr %x		store <8 x i16> %c, ptr %x
ret void		ret void
}		}

define void @umin_v6i16(ptr %x, ptr %y) {		define void @umin_v6i16(ptr %x, ptr %y) {
; RV32-LABEL: umin_v6i16:		; CHECK-LABEL: umin_v6i16:
; RV32: # %bb.0:		; CHECK: # %bb.0:
; RV32-NEXT: vsetivli zero, 8, e16, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 6, e16, m1, ta, ma
; RV32-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; RV32-NEXT: vle16.v v9, (a1)		; CHECK-NEXT: vle16.v v9, (a1)
; RV32-NEXT: vminu.vv v8, v8, v9		; CHECK-NEXT: vminu.vv v8, v8, v9
; RV32-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vse16.v v8, (a0)
; RV32-NEXT: vslidedown.vi v9, v8, 2		; CHECK-NEXT: ret
; RV32-NEXT: addi a1, a0, 8
; RV32-NEXT: vse32.v v9, (a1)
; RV32-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
; RV32-NEXT: vse16.v v8, (a0)
; RV32-NEXT: ret
;
; RV64-LABEL: umin_v6i16:
; RV64: # %bb.0:
; RV64-NEXT: vsetivli zero, 8, e16, m1, ta, ma
; RV64-NEXT: vle16.v v8, (a0)
; RV64-NEXT: vle16.v v9, (a1)
; RV64-NEXT: vminu.vv v8, v8, v9
; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma
; RV64-NEXT: vse64.v v8, (a0)
; RV64-NEXT: vsetivli zero, 1, e32, m1, ta, ma
; RV64-NEXT: vslidedown.vi v8, v8, 2
; RV64-NEXT: addi a0, a0, 8
; RV64-NEXT: vse32.v v8, (a0)
; RV64-NEXT: ret
%a = load <6 x i16>, ptr %x		%a = load <6 x i16>, ptr %x
%b = load <6 x i16>, ptr %y		%b = load <6 x i16>, ptr %y
%cc = icmp ult <6 x i16> %a, %b		%cc = icmp ult <6 x i16> %a, %b
%c = select <6 x i1> %cc, <6 x i16> %a, <6 x i16> %b		%c = select <6 x i1> %cc, <6 x i16> %a, <6 x i16> %b
store <6 x i16> %c, ptr %x		store <6 x i16> %c, ptr %x
ret void		ret void
}		}

▲ Show 20 Lines • Show All 61 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%c = shufflevector <8 x i16> %b, <8 x i16> poison, <8 x i32> zeroinitializer		%c = shufflevector <8 x i16> %b, <8 x i16> poison, <8 x i32> zeroinitializer
%d = call <8 x i16> @llvm.umin.v8i16(<8 x i16> %a, <8 x i16> %c)		%d = call <8 x i16> @llvm.umin.v8i16(<8 x i16> %a, <8 x i16> %c)
store <8 x i16> %d, ptr %x		store <8 x i16> %d, ptr %x
ret void		ret void
}		}
declare <8 x i16> @llvm.umin.v8i16(<8 x i16>, <8 x i16>)		declare <8 x i16> @llvm.umin.v8i16(<8 x i16>, <8 x i16>)

define void @umin_vx_v6i16(ptr %x, i16 %y) {		define void @umin_vx_v6i16(ptr %x, i16 %y) {
; RV32-LABEL: umin_vx_v6i16:		; CHECK-LABEL: umin_vx_v6i16:
; RV32: # %bb.0:		; CHECK: # %bb.0:
; RV32-NEXT: vsetivli zero, 8, e16, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 6, e16, m1, ta, ma
; RV32-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; RV32-NEXT: vminu.vx v8, v8, a1		; CHECK-NEXT: vminu.vx v8, v8, a1
; RV32-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vse16.v v8, (a0)
; RV32-NEXT: vslidedown.vi v9, v8, 2		; CHECK-NEXT: ret
; RV32-NEXT: addi a1, a0, 8
; RV32-NEXT: vse32.v v9, (a1)
; RV32-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
; RV32-NEXT: vse16.v v8, (a0)
; RV32-NEXT: ret
;
; RV64-LABEL: umin_vx_v6i16:
; RV64: # %bb.0:
; RV64-NEXT: vsetivli zero, 8, e16, m1, ta, ma
; RV64-NEXT: vle16.v v8, (a0)
; RV64-NEXT: vminu.vx v8, v8, a1
; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma
; RV64-NEXT: vse64.v v8, (a0)
; RV64-NEXT: vsetivli zero, 1, e32, m1, ta, ma
; RV64-NEXT: vslidedown.vi v8, v8, 2
; RV64-NEXT: addi a0, a0, 8
; RV64-NEXT: vse32.v v8, (a0)
; RV64-NEXT: ret
%a = load <6 x i16>, ptr %x		%a = load <6 x i16>, ptr %x
%b = insertelement <6 x i16> poison, i16 %y, i32 0		%b = insertelement <6 x i16> poison, i16 %y, i32 0
%c = shufflevector <6 x i16> %b, <6 x i16> poison, <6 x i32> zeroinitializer		%c = shufflevector <6 x i16> %b, <6 x i16> poison, <6 x i32> zeroinitializer
%d = call <6 x i16> @llvm.umin.v6i16(<6 x i16> %a, <6 x i16> %c)		%d = call <6 x i16> @llvm.umin.v6i16(<6 x i16> %a, <6 x i16> %c)
store <6 x i16> %d, ptr %x		store <6 x i16> %d, ptr %x
ret void		ret void
}		}
declare <6 x i16> @llvm.umin.v6i16(<6 x i16>, <6 x i16>)		declare <6 x i16> @llvm.umin.v6i16(<6 x i16>, <6 x i16>)
▲ Show 20 Lines • Show All 43 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%b = insertelement <8 x i16> poison, i16 %y, i32 0		%b = insertelement <8 x i16> poison, i16 %y, i32 0
%c = shufflevector <8 x i16> %b, <8 x i16> poison, <8 x i32> zeroinitializer		%c = shufflevector <8 x i16> %b, <8 x i16> poison, <8 x i32> zeroinitializer
%d = call <8 x i16> @llvm.umin.v8i16(<8 x i16> %c, <8 x i16> %a)		%d = call <8 x i16> @llvm.umin.v8i16(<8 x i16> %c, <8 x i16> %a)
store <8 x i16> %d, ptr %x		store <8 x i16> %d, ptr %x
ret void		ret void
}		}

define void @umin_xv_v6i16(ptr %x, i16 %y) {		define void @umin_xv_v6i16(ptr %x, i16 %y) {
; RV32-LABEL: umin_xv_v6i16:		; CHECK-LABEL: umin_xv_v6i16:
; RV32: # %bb.0:		; CHECK: # %bb.0:
; RV32-NEXT: vsetivli zero, 8, e16, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 6, e16, m1, ta, ma
; RV32-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; RV32-NEXT: vminu.vx v8, v8, a1		; CHECK-NEXT: vminu.vx v8, v8, a1
; RV32-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vse16.v v8, (a0)
; RV32-NEXT: vslidedown.vi v9, v8, 2		; CHECK-NEXT: ret
; RV32-NEXT: addi a1, a0, 8
; RV32-NEXT: vse32.v v9, (a1)
; RV32-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
; RV32-NEXT: vse16.v v8, (a0)
; RV32-NEXT: ret
;
; RV64-LABEL: umin_xv_v6i16:
; RV64: # %bb.0:
; RV64-NEXT: vsetivli zero, 8, e16, m1, ta, ma
; RV64-NEXT: vle16.v v8, (a0)
; RV64-NEXT: vminu.vx v8, v8, a1
; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma
; RV64-NEXT: vse64.v v8, (a0)
; RV64-NEXT: vsetivli zero, 1, e32, m1, ta, ma
; RV64-NEXT: vslidedown.vi v8, v8, 2
; RV64-NEXT: addi a0, a0, 8
; RV64-NEXT: vse32.v v8, (a0)
; RV64-NEXT: ret
%a = load <6 x i16>, ptr %x		%a = load <6 x i16>, ptr %x
%b = insertelement <6 x i16> poison, i16 %y, i32 0		%b = insertelement <6 x i16> poison, i16 %y, i32 0
%c = shufflevector <6 x i16> %b, <6 x i16> poison, <6 x i32> zeroinitializer		%c = shufflevector <6 x i16> %b, <6 x i16> poison, <6 x i32> zeroinitializer
%d = call <6 x i16> @llvm.umin.v6i16(<6 x i16> %c, <6 x i16> %a)		%d = call <6 x i16> @llvm.umin.v6i16(<6 x i16> %c, <6 x i16> %a)
store <6 x i16> %d, ptr %x		store <6 x i16> %d, ptr %x
ret void		ret void
}		}

▲ Show 20 Lines • Show All 43 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%b = load <8 x i16>, ptr %y		%b = load <8 x i16>, ptr %y
%cc = icmp ugt <8 x i16> %a, %b		%cc = icmp ugt <8 x i16> %a, %b
%c = select <8 x i1> %cc, <8 x i16> %a, <8 x i16> %b		%c = select <8 x i1> %cc, <8 x i16> %a, <8 x i16> %b
store <8 x i16> %c, ptr %x		store <8 x i16> %c, ptr %x
ret void		ret void
}		}

define void @umax_v6i16(ptr %x, ptr %y) {		define void @umax_v6i16(ptr %x, ptr %y) {
; RV32-LABEL: umax_v6i16:		; CHECK-LABEL: umax_v6i16:
; RV32: # %bb.0:		; CHECK: # %bb.0:
; RV32-NEXT: vsetivli zero, 8, e16, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 6, e16, m1, ta, ma
; RV32-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; RV32-NEXT: vle16.v v9, (a1)		; CHECK-NEXT: vle16.v v9, (a1)
; RV32-NEXT: vmaxu.vv v8, v8, v9		; CHECK-NEXT: vmaxu.vv v8, v8, v9
; RV32-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vse16.v v8, (a0)
; RV32-NEXT: vslidedown.vi v9, v8, 2		; CHECK-NEXT: ret
; RV32-NEXT: addi a1, a0, 8
; RV32-NEXT: vse32.v v9, (a1)
; RV32-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
; RV32-NEXT: vse16.v v8, (a0)
; RV32-NEXT: ret
;
; RV64-LABEL: umax_v6i16:
; RV64: # %bb.0:
; RV64-NEXT: vsetivli zero, 8, e16, m1, ta, ma
; RV64-NEXT: vle16.v v8, (a0)
; RV64-NEXT: vle16.v v9, (a1)
; RV64-NEXT: vmaxu.vv v8, v8, v9
; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma
; RV64-NEXT: vse64.v v8, (a0)
; RV64-NEXT: vsetivli zero, 1, e32, m1, ta, ma
; RV64-NEXT: vslidedown.vi v8, v8, 2
; RV64-NEXT: addi a0, a0, 8
; RV64-NEXT: vse32.v v8, (a0)
; RV64-NEXT: ret
%a = load <6 x i16>, ptr %x		%a = load <6 x i16>, ptr %x
%b = load <6 x i16>, ptr %y		%b = load <6 x i16>, ptr %y
%cc = icmp ugt <6 x i16> %a, %b		%cc = icmp ugt <6 x i16> %a, %b
%c = select <6 x i1> %cc, <6 x i16> %a, <6 x i16> %b		%c = select <6 x i1> %cc, <6 x i16> %a, <6 x i16> %b
store <6 x i16> %c, ptr %x		store <6 x i16> %c, ptr %x
ret void		ret void
}		}

▲ Show 20 Lines • Show All 61 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%c = shufflevector <8 x i16> %b, <8 x i16> poison, <8 x i32> zeroinitializer		%c = shufflevector <8 x i16> %b, <8 x i16> poison, <8 x i32> zeroinitializer
%d = call <8 x i16> @llvm.umax.v8i16(<8 x i16> %a, <8 x i16> %c)		%d = call <8 x i16> @llvm.umax.v8i16(<8 x i16> %a, <8 x i16> %c)
store <8 x i16> %d, ptr %x		store <8 x i16> %d, ptr %x
ret void		ret void
}		}
declare <8 x i16> @llvm.umax.v8i16(<8 x i16>, <8 x i16>)		declare <8 x i16> @llvm.umax.v8i16(<8 x i16>, <8 x i16>)

define void @umax_vx_v6i16(ptr %x, i16 %y) {		define void @umax_vx_v6i16(ptr %x, i16 %y) {
; RV32-LABEL: umax_vx_v6i16:		; CHECK-LABEL: umax_vx_v6i16:
; RV32: # %bb.0:		; CHECK: # %bb.0:
; RV32-NEXT: vsetivli zero, 8, e16, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 6, e16, m1, ta, ma
; RV32-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; RV32-NEXT: vmaxu.vx v8, v8, a1		; CHECK-NEXT: vmaxu.vx v8, v8, a1
; RV32-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vse16.v v8, (a0)
; RV32-NEXT: vslidedown.vi v9, v8, 2		; CHECK-NEXT: ret
; RV32-NEXT: addi a1, a0, 8
; RV32-NEXT: vse32.v v9, (a1)
; RV32-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
; RV32-NEXT: vse16.v v8, (a0)
; RV32-NEXT: ret
;
; RV64-LABEL: umax_vx_v6i16:
; RV64: # %bb.0:
; RV64-NEXT: vsetivli zero, 8, e16, m1, ta, ma
; RV64-NEXT: vle16.v v8, (a0)
; RV64-NEXT: vmaxu.vx v8, v8, a1
; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma
; RV64-NEXT: vse64.v v8, (a0)
; RV64-NEXT: vsetivli zero, 1, e32, m1, ta, ma
; RV64-NEXT: vslidedown.vi v8, v8, 2
; RV64-NEXT: addi a0, a0, 8
; RV64-NEXT: vse32.v v8, (a0)
; RV64-NEXT: ret
%a = load <6 x i16>, ptr %x		%a = load <6 x i16>, ptr %x
%b = insertelement <6 x i16> poison, i16 %y, i32 0		%b = insertelement <6 x i16> poison, i16 %y, i32 0
%c = shufflevector <6 x i16> %b, <6 x i16> poison, <6 x i32> zeroinitializer		%c = shufflevector <6 x i16> %b, <6 x i16> poison, <6 x i32> zeroinitializer
%d = call <6 x i16> @llvm.umax.v6i16(<6 x i16> %a, <6 x i16> %c)		%d = call <6 x i16> @llvm.umax.v6i16(<6 x i16> %a, <6 x i16> %c)
store <6 x i16> %d, ptr %x		store <6 x i16> %d, ptr %x
ret void		ret void
}		}
declare <6 x i16> @llvm.umax.v6i16(<6 x i16>, <6 x i16>)		declare <6 x i16> @llvm.umax.v6i16(<6 x i16>, <6 x i16>)
▲ Show 20 Lines • Show All 43 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%b = insertelement <8 x i16> poison, i16 %y, i32 0		%b = insertelement <8 x i16> poison, i16 %y, i32 0
%c = shufflevector <8 x i16> %b, <8 x i16> poison, <8 x i32> zeroinitializer		%c = shufflevector <8 x i16> %b, <8 x i16> poison, <8 x i32> zeroinitializer
%d = call <8 x i16> @llvm.umax.v8i16(<8 x i16> %c, <8 x i16> %a)		%d = call <8 x i16> @llvm.umax.v8i16(<8 x i16> %c, <8 x i16> %a)
store <8 x i16> %d, ptr %x		store <8 x i16> %d, ptr %x
ret void		ret void
}		}

define void @umax_xv_v6i16(ptr %x, i16 %y) {		define void @umax_xv_v6i16(ptr %x, i16 %y) {
; RV32-LABEL: umax_xv_v6i16:		; CHECK-LABEL: umax_xv_v6i16:
; RV32: # %bb.0:		; CHECK: # %bb.0:
; RV32-NEXT: vsetivli zero, 8, e16, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 6, e16, m1, ta, ma
; RV32-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; RV32-NEXT: vmaxu.vx v8, v8, a1		; CHECK-NEXT: vmaxu.vx v8, v8, a1
; RV32-NEXT: vsetivli zero, 1, e32, m1, ta, ma		; CHECK-NEXT: vse16.v v8, (a0)
; RV32-NEXT: vslidedown.vi v9, v8, 2		; CHECK-NEXT: ret
; RV32-NEXT: addi a1, a0, 8
; RV32-NEXT: vse32.v v9, (a1)
; RV32-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
; RV32-NEXT: vse16.v v8, (a0)
; RV32-NEXT: ret
;
; RV64-LABEL: umax_xv_v6i16:
; RV64: # %bb.0:
; RV64-NEXT: vsetivli zero, 8, e16, m1, ta, ma
; RV64-NEXT: vle16.v v8, (a0)
; RV64-NEXT: vmaxu.vx v8, v8, a1
; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma
; RV64-NEXT: vse64.v v8, (a0)
; RV64-NEXT: vsetivli zero, 1, e32, m1, ta, ma
; RV64-NEXT: vslidedown.vi v8, v8, 2
; RV64-NEXT: addi a0, a0, 8
; RV64-NEXT: vse32.v v8, (a0)
; RV64-NEXT: ret
%a = load <6 x i16>, ptr %x		%a = load <6 x i16>, ptr %x
%b = insertelement <6 x i16> poison, i16 %y, i32 0		%b = insertelement <6 x i16> poison, i16 %y, i32 0
%c = shufflevector <6 x i16> %b, <6 x i16> poison, <6 x i32> zeroinitializer		%c = shufflevector <6 x i16> %b, <6 x i16> poison, <6 x i32> zeroinitializer
%d = call <6 x i16> @llvm.umax.v6i16(<6 x i16> %c, <6 x i16> %a)		%d = call <6 x i16> @llvm.umax.v6i16(<6 x i16> %c, <6 x i16> %a)
store <6 x i16> %d, ptr %x		store <6 x i16> %d, ptr %x
ret void		ret void
}		}

▲ Show 20 Lines • Show All 148 Lines • ▼ Show 20 Lines	; LMULMAX1-RV64-NEXT: ret
%a = load <8 x i32>, ptr %x		%a = load <8 x i32>, ptr %x
%b = load <8 x i32>, ptr %y		%b = load <8 x i32>, ptr %y
%c = add <8 x i32> %a, %b		%c = add <8 x i32> %a, %b
store <8 x i32> %c, ptr %x		store <8 x i32> %c, ptr %x
ret void		ret void
}		}

define void @add_v6i32(ptr %x, ptr %y) {		define void @add_v6i32(ptr %x, ptr %y) {
; LMULMAX2-RV32-LABEL: add_v6i32:		; LMULMAX2-LABEL: add_v6i32:
; LMULMAX2-RV32: # %bb.0:		; LMULMAX2: # %bb.0:
; LMULMAX2-RV32-NEXT: vsetivli zero, 8, e32, m2, ta, ma		; LMULMAX2-NEXT: vsetivli zero, 6, e32, m2, ta, ma
; LMULMAX2-RV32-NEXT: vle32.v v8, (a0)		; LMULMAX2-NEXT: vle32.v v8, (a0)
; LMULMAX2-RV32-NEXT: vle32.v v10, (a1)		; LMULMAX2-NEXT: vle32.v v10, (a1)
; LMULMAX2-RV32-NEXT: vadd.vv v8, v8, v10		; LMULMAX2-NEXT: vadd.vv v8, v8, v10
; LMULMAX2-RV32-NEXT: vsetivli zero, 2, e32, m2, ta, ma		; LMULMAX2-NEXT: vse32.v v8, (a0)
; LMULMAX2-RV32-NEXT: vslidedown.vi v10, v8, 4		; LMULMAX2-NEXT: ret
; LMULMAX2-RV32-NEXT: addi a1, a0, 16
; LMULMAX2-RV32-NEXT: vsetivli zero, 2, e32, mf2, ta, ma
; LMULMAX2-RV32-NEXT: vse32.v v10, (a1)
; LMULMAX2-RV32-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; LMULMAX2-RV32-NEXT: vse32.v v8, (a0)
; LMULMAX2-RV32-NEXT: ret
;
; LMULMAX2-RV64-LABEL: add_v6i32:
; LMULMAX2-RV64: # %bb.0:
; LMULMAX2-RV64-NEXT: vsetivli zero, 8, e32, m2, ta, ma
; LMULMAX2-RV64-NEXT: vle32.v v8, (a0)
; LMULMAX2-RV64-NEXT: vle32.v v10, (a1)
; LMULMAX2-RV64-NEXT: vadd.vv v8, v8, v10
; LMULMAX2-RV64-NEXT: vsetivli zero, 1, e64, m2, ta, ma
; LMULMAX2-RV64-NEXT: vslidedown.vi v10, v8, 2
; LMULMAX2-RV64-NEXT: addi a1, a0, 16
; LMULMAX2-RV64-NEXT: vse64.v v10, (a1)
; LMULMAX2-RV64-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; LMULMAX2-RV64-NEXT: vse32.v v8, (a0)
; LMULMAX2-RV64-NEXT: ret
;		;
; LMULMAX1-RV32-LABEL: add_v6i32:		; LMULMAX1-RV32-LABEL: add_v6i32:
; LMULMAX1-RV32: # %bb.0:		; LMULMAX1-RV32: # %bb.0:
; LMULMAX1-RV32-NEXT: addi a2, a0, 16		; LMULMAX1-RV32-NEXT: addi a2, a0, 16
; LMULMAX1-RV32-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; LMULMAX1-RV32-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; LMULMAX1-RV32-NEXT: vle32.v v8, (a0)		; LMULMAX1-RV32-NEXT: vle32.v v8, (a0)
; LMULMAX1-RV32-NEXT: vle32.v v9, (a1)		; LMULMAX1-RV32-NEXT: vle32.v v9, (a1)
; LMULMAX1-RV32-NEXT: vle32.v v10, (a2)		; LMULMAX1-RV32-NEXT: vle32.v v10, (a2)
▲ Show 20 Lines • Show All 5,822 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-interleaved-access.ll

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: llc < %s -mtriple=riscv32 -mattr=+v,m -O2 \| FileCheck -check-prefixes=CHECK,RV32 %s			; RUN: llc < %s -mtriple=riscv32 -mattr=+v,m -O2 \| FileCheck -check-prefixes=CHECK,RV32 %s
	; RUN: llc < %s -mtriple=riscv64 -mattr=+v,m -O2 \| FileCheck -check-prefixes=CHECK,RV64 %s			; RUN: llc < %s -mtriple=riscv64 -mattr=+v,m -O2 \| FileCheck -check-prefixes=CHECK,RV64 %s

	; ------------------------------------------------------------------------------			; ------------------------------------------------------------------------------
	; Loads			; Loads
	; ------------------------------------------------------------------------------			; ------------------------------------------------------------------------------

	; FIXME: This should be widened to a vlseg2 of <4 x i32> with VL set to 3			; FIXME: This should be widened to a vlseg2 of <4 x i32> with VL set to 3
	define {<3 x i32>, <3 x i32>} @load_factor2_v3(ptr %ptr) {			define {<3 x i32>, <3 x i32>} @load_factor2_v3(ptr %ptr) {
	; CHECK-LABEL: load_factor2_v3:			; CHECK-LABEL: load_factor2_v3:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 8, e32, m2, ta, ma			; CHECK-NEXT: vsetivli zero, 6, e32, m2, ta, ma
	; CHECK-NEXT: vle32.v v10, (a0)			; CHECK-NEXT: vle32.v v10, (a0)
	; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma			; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
	; CHECK-NEXT: vid.v v8			; CHECK-NEXT: vid.v v8
	; CHECK-NEXT: vadd.vv v9, v8, v8			; CHECK-NEXT: vadd.vv v9, v8, v8
	; CHECK-NEXT: vrgather.vv v8, v10, v9			; CHECK-NEXT: vrgather.vv v8, v10, v9
	; CHECK-NEXT: li a0, 4			; CHECK-NEXT: li a0, 4
	; CHECK-NEXT: vmv.s.x v0, a0			; CHECK-NEXT: vmv.s.x v0, a0
	; CHECK-NEXT: vsetivli zero, 4, e32, m2, ta, ma			; CHECK-NEXT: vsetivli zero, 4, e32, m2, ta, ma
	▲ Show 20 Lines • Show All 1,217 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-load.ll

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py UTC_ARGS: --version 2			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py UTC_ARGS: --version 2
	; RUN: llc -mtriple=riscv32 -mattr=+v -verify-machineinstrs < %s \| FileCheck -check-prefixes=CHECK,RV32 %s			; RUN: llc -mtriple=riscv32 -mattr=+v -verify-machineinstrs < %s \| FileCheck -check-prefixes=CHECK,RV32 %s
	; RUN: llc -mtriple=riscv64 -mattr=+v -verify-machineinstrs < %s \| FileCheck -check-prefixes=CHECK,RV64 %s			; RUN: llc -mtriple=riscv64 -mattr=+v -verify-machineinstrs < %s \| FileCheck -check-prefixes=CHECK,RV64 %s

	define <5 x i8> @load_v5i8(ptr %p) {			define <5 x i8> @load_v5i8(ptr %p) {
	; RV32-LABEL: load_v5i8:			; CHECK-LABEL: load_v5i8:
	; RV32: # %bb.0:			; CHECK: # %bb.0:
	; RV32-NEXT: vsetivli zero, 8, e8, mf2, ta, ma			; CHECK-NEXT: vsetivli zero, 5, e8, mf2, ta, ma
	; RV32-NEXT: vle8.v v8, (a0)			; CHECK-NEXT: vle8.v v8, (a0)
	; RV32-NEXT: ret			; CHECK-NEXT: ret
	;
	; RV64-LABEL: load_v5i8:
	; RV64: # %bb.0:
	; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma
	; RV64-NEXT: vle64.v v8, (a0)
	; RV64-NEXT: ret
	%x = load <5 x i8>, ptr %p			%x = load <5 x i8>, ptr %p
	ret <5 x i8> %x			ret <5 x i8> %x
	}			}

	define <5 x i8> @load_v5i8_align1(ptr %p) {			define <5 x i8> @load_v5i8_align1(ptr %p) {
	; RV32-LABEL: load_v5i8_align1:			; CHECK-LABEL: load_v5i8_align1:
	; RV32: # %bb.0:			; CHECK: # %bb.0:
	; RV32-NEXT: addi sp, sp, -16			; CHECK-NEXT: vsetivli zero, 5, e8, mf2, ta, ma
	; RV32-NEXT: .cfi_def_cfa_offset 16			; CHECK-NEXT: vle8.v v8, (a0)
	; RV32-NEXT: lbu a1, 1(a0)			; CHECK-NEXT: ret
	; RV32-NEXT: lbu a2, 0(a0)
	; RV32-NEXT: lbu a3, 2(a0)
	; RV32-NEXT: lbu a4, 3(a0)
	; RV32-NEXT: slli a1, a1, 8
	; RV32-NEXT: or a1, a1, a2
	; RV32-NEXT: slli a3, a3, 16
	; RV32-NEXT: slli a4, a4, 24
	; RV32-NEXT: or a3, a4, a3
	; RV32-NEXT: or a1, a3, a1
	; RV32-NEXT: vsetivli zero, 2, e32, mf2, ta, ma
	; RV32-NEXT: vmv.s.x v8, a1
	; RV32-NEXT: vsetivli zero, 1, e8, mf2, ta, ma
	; RV32-NEXT: vslidedown.vi v9, v8, 1
	; RV32-NEXT: vslidedown.vi v10, v8, 2
	; RV32-NEXT: vslidedown.vi v11, v8, 3
	; RV32-NEXT: lb a0, 4(a0)
	; RV32-NEXT: addi a1, sp, 8
	; RV32-NEXT: vse8.v v8, (a1)
	; RV32-NEXT: addi a2, sp, 11
	; RV32-NEXT: vse8.v v11, (a2)
	; RV32-NEXT: addi a2, sp, 10
	; RV32-NEXT: vse8.v v10, (a2)
	; RV32-NEXT: addi a2, sp, 9
	; RV32-NEXT: vse8.v v9, (a2)
	; RV32-NEXT: sb a0, 12(sp)
	; RV32-NEXT: vsetivli zero, 8, e8, mf2, ta, ma
	; RV32-NEXT: vle8.v v8, (a1)
	; RV32-NEXT: addi sp, sp, 16
	; RV32-NEXT: ret
	;
	; RV64-LABEL: load_v5i8_align1:
	; RV64: # %bb.0:
	; RV64-NEXT: addi sp, sp, -16
	; RV64-NEXT: .cfi_def_cfa_offset 16
	; RV64-NEXT: lbu a1, 1(a0)
	; RV64-NEXT: lbu a2, 0(a0)
	; RV64-NEXT: lbu a3, 2(a0)
	; RV64-NEXT: lb a4, 3(a0)
	; RV64-NEXT: slli a1, a1, 8
	; RV64-NEXT: or a1, a1, a2
	; RV64-NEXT: slli a3, a3, 16
	; RV64-NEXT: slli a4, a4, 24
	; RV64-NEXT: or a3, a4, a3
	; RV64-NEXT: or a1, a3, a1
	; RV64-NEXT: vsetivli zero, 2, e32, mf2, ta, ma
	; RV64-NEXT: vmv.s.x v8, a1
	; RV64-NEXT: vsetivli zero, 1, e8, mf2, ta, ma
	; RV64-NEXT: vslidedown.vi v9, v8, 1
	; RV64-NEXT: vslidedown.vi v10, v8, 2
	; RV64-NEXT: vslidedown.vi v11, v8, 3
	; RV64-NEXT: lb a0, 4(a0)
	; RV64-NEXT: addi a1, sp, 8
	; RV64-NEXT: vse8.v v8, (a1)
	; RV64-NEXT: addi a2, sp, 11
	; RV64-NEXT: vse8.v v11, (a2)
	; RV64-NEXT: addi a2, sp, 10
	; RV64-NEXT: vse8.v v10, (a2)
	; RV64-NEXT: addi a2, sp, 9
	; RV64-NEXT: vse8.v v9, (a2)
	; RV64-NEXT: sb a0, 12(sp)
	; RV64-NEXT: vsetivli zero, 8, e8, mf2, ta, ma
	; RV64-NEXT: vle8.v v8, (a1)
	; RV64-NEXT: addi sp, sp, 16
	; RV64-NEXT: ret
	%x = load <5 x i8>, ptr %p, align 1			%x = load <5 x i8>, ptr %p, align 1
	ret <5 x i8> %x			ret <5 x i8> %x
	}			}

	define <6 x i8> @load_v6i8(ptr %p) {			define <6 x i8> @load_v6i8(ptr %p) {
	; RV32-LABEL: load_v6i8:			; CHECK-LABEL: load_v6i8:
	; RV32: # %bb.0:			; CHECK: # %bb.0:
	; RV32-NEXT: vsetivli zero, 8, e8, mf2, ta, ma			; CHECK-NEXT: vsetivli zero, 6, e8, mf2, ta, ma
	; RV32-NEXT: vle8.v v8, (a0)			; CHECK-NEXT: vle8.v v8, (a0)
	; RV32-NEXT: ret			; CHECK-NEXT: ret
	;
	; RV64-LABEL: load_v6i8:
	; RV64: # %bb.0:
	; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma
	; RV64-NEXT: vle64.v v8, (a0)
	; RV64-NEXT: ret
	%x = load <6 x i8>, ptr %p			%x = load <6 x i8>, ptr %p
	ret <6 x i8> %x			ret <6 x i8> %x
	}			}

	define <12 x i8> @load_v12i8(ptr %p) {			define <12 x i8> @load_v12i8(ptr %p) {
	; CHECK-LABEL: load_v12i8:			; CHECK-LABEL: load_v12i8:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 16, e8, m1, ta, ma			; CHECK-NEXT: vsetivli zero, 12, e8, m1, ta, ma
	; CHECK-NEXT: vle8.v v8, (a0)			; CHECK-NEXT: vle8.v v8, (a0)
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%x = load <12 x i8>, ptr %p			%x = load <12 x i8>, ptr %p
	ret <12 x i8> %x			ret <12 x i8> %x
	}			}

	define <6 x i16> @load_v6i16(ptr %p) {			define <6 x i16> @load_v6i16(ptr %p) {
	; CHECK-LABEL: load_v6i16:			; CHECK-LABEL: load_v6i16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 8, e16, m1, ta, ma			; CHECK-NEXT: vsetivli zero, 6, e16, m1, ta, ma
	; CHECK-NEXT: vle16.v v8, (a0)			; CHECK-NEXT: vle16.v v8, (a0)
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%x = load <6 x i16>, ptr %p			%x = load <6 x i16>, ptr %p
	ret <6 x i16> %x			ret <6 x i16> %x
	}			}

	define <6 x half> @load_v6f16(ptr %p) {			define <6 x half> @load_v6f16(ptr %p) {
	; RV32-LABEL: load_v6f16:			; RV32-LABEL: load_v6f16:
	Show All 22 Lines
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%x = load <6 x half>, ptr %p			%x = load <6 x half>, ptr %p
	ret <6 x half> %x			ret <6 x half> %x
	}			}

	define <6 x float> @load_v6f32(ptr %p) {			define <6 x float> @load_v6f32(ptr %p) {
	; CHECK-LABEL: load_v6f32:			; CHECK-LABEL: load_v6f32:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 8, e32, m2, ta, ma			; CHECK-NEXT: vsetivli zero, 6, e32, m2, ta, ma
	; CHECK-NEXT: vle32.v v8, (a0)			; CHECK-NEXT: vle32.v v8, (a0)
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%x = load <6 x float>, ptr %p			%x = load <6 x float>, ptr %p
	ret <6 x float> %x			ret <6 x float> %x
	}			}

	define <6 x double> @load_v6f64(ptr %p) {			define <6 x double> @load_v6f64(ptr %p) {
	; CHECK-LABEL: load_v6f64:			; CHECK-LABEL: load_v6f64:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 8, e64, m4, ta, ma			; CHECK-NEXT: vsetivli zero, 6, e64, m4, ta, ma
	; CHECK-NEXT: vle64.v v8, (a0)			; CHECK-NEXT: vle64.v v8, (a0)
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%x = load <6 x double>, ptr %p			%x = load <6 x double>, ptr %p
	ret <6 x double> %x			ret <6 x double> %x
	}			}

	define <6 x i1> @load_v6i1(ptr %p) {			define <6 x i1> @load_v6i1(ptr %p) {
	; RV32-LABEL: load_v6i1:			; RV32-LABEL: load_v6i1:
	▲ Show 20 Lines • Show All 59 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-store.ll

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py UTC_ARGS: --version 2			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py UTC_ARGS: --version 2
	; RUN: llc -mtriple=riscv32 -mattr=+v -verify-machineinstrs < %s \| FileCheck -check-prefixes=CHECK,RV32 %s			; RUN: llc -mtriple=riscv32 -mattr=+v -verify-machineinstrs < %s \| FileCheck -check-prefixes=CHECK,RV32 %s
	; RUN: llc -mtriple=riscv64 -mattr=+v -verify-machineinstrs < %s \| FileCheck -check-prefixes=CHECK,RV64 %s			; RUN: llc -mtriple=riscv64 -mattr=+v -verify-machineinstrs < %s \| FileCheck -check-prefixes=CHECK,RV64 %s

	define void @store_v5i8(ptr %p, <5 x i8> %v) {			define void @store_v5i8(ptr %p, <5 x i8> %v) {
	; CHECK-LABEL: store_v5i8:			; CHECK-LABEL: store_v5i8:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e8, mf2, ta, ma			; CHECK-NEXT: vsetivli zero, 5, e8, mf2, ta, ma
	; CHECK-NEXT: vslidedown.vi v9, v8, 4			; CHECK-NEXT: vse8.v v8, (a0)
	; CHECK-NEXT: addi a1, a0, 4
	; CHECK-NEXT: vse8.v v9, (a1)
	; CHECK-NEXT: vsetivli zero, 1, e32, mf2, ta, ma
	; CHECK-NEXT: vse32.v v8, (a0)
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	store <5 x i8> %v, ptr %p			store <5 x i8> %v, ptr %p
	ret void			ret void
	}			}

	define void @store_v5i8_align1(ptr %p, <5 x i8> %v) {			define void @store_v5i8_align1(ptr %p, <5 x i8> %v) {
	; CHECK-LABEL: store_v5i8_align1:			; CHECK-LABEL: store_v5i8_align1:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e8, mf2, ta, ma			; CHECK-NEXT: vsetivli zero, 5, e8, mf2, ta, ma
	; CHECK-NEXT: vslidedown.vi v9, v8, 4			; CHECK-NEXT: vse8.v v8, (a0)
	; CHECK-NEXT: addi a1, a0, 4
	; CHECK-NEXT: vse8.v v9, (a1)
	; CHECK-NEXT: vsetivli zero, 0, e32, mf2, ta, ma
	; CHECK-NEXT: vmv.x.s a1, v8
	; CHECK-NEXT: sb a1, 0(a0)
	; CHECK-NEXT: srli a2, a1, 24
	; CHECK-NEXT: sb a2, 3(a0)
	; CHECK-NEXT: srli a2, a1, 16
	; CHECK-NEXT: sb a2, 2(a0)
	; CHECK-NEXT: srli a1, a1, 8
	; CHECK-NEXT: sb a1, 1(a0)
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	store <5 x i8> %v, ptr %p, align 1			store <5 x i8> %v, ptr %p, align 1
	ret void			ret void
	}			}


	define void @store_v6i8(ptr %p, <6 x i8> %v) {			define void @store_v6i8(ptr %p, <6 x i8> %v) {
	; CHECK-LABEL: store_v6i8:			; CHECK-LABEL: store_v6i8:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 1, e32, mf2, ta, ma			; CHECK-NEXT: vsetivli zero, 6, e8, mf2, ta, ma
	; CHECK-NEXT: vse32.v v8, (a0)			; CHECK-NEXT: vse8.v v8, (a0)
	; CHECK-NEXT: vsetivli zero, 1, e16, mf2, ta, ma
	; CHECK-NEXT: vslidedown.vi v8, v8, 2
	; CHECK-NEXT: addi a0, a0, 4
	; CHECK-NEXT: vse16.v v8, (a0)
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	store <6 x i8> %v, ptr %p			store <6 x i8> %v, ptr %p
	ret void			ret void
	}			}

	define void @store_v12i8(ptr %p, <12 x i8> %v) {			define void @store_v12i8(ptr %p, <12 x i8> %v) {
	; RV32-LABEL: store_v12i8:			; CHECK-LABEL: store_v12i8:
	; RV32: # %bb.0:			; CHECK: # %bb.0:
	; RV32-NEXT: vsetivli zero, 1, e32, m1, ta, ma			; CHECK-NEXT: vsetivli zero, 12, e8, m1, ta, ma
	; RV32-NEXT: vslidedown.vi v9, v8, 2			; CHECK-NEXT: vse8.v v8, (a0)
	; RV32-NEXT: addi a1, a0, 8			; CHECK-NEXT: ret
	; RV32-NEXT: vse32.v v9, (a1)
	; RV32-NEXT: vsetivli zero, 8, e8, mf2, ta, ma
	; RV32-NEXT: vse8.v v8, (a0)
	; RV32-NEXT: ret
	;
	; RV64-LABEL: store_v12i8:
	; RV64: # %bb.0:
	; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma
	; RV64-NEXT: vse64.v v8, (a0)
	; RV64-NEXT: vsetivli zero, 1, e32, m1, ta, ma
	; RV64-NEXT: vslidedown.vi v8, v8, 2
	; RV64-NEXT: addi a0, a0, 8
	; RV64-NEXT: vse32.v v8, (a0)
	; RV64-NEXT: ret
	store <12 x i8> %v, ptr %p			store <12 x i8> %v, ptr %p
	ret void			ret void
	}			}

	define void @store_v6i16(ptr %p, <6 x i16> %v) {			define void @store_v6i16(ptr %p, <6 x i16> %v) {
	; RV32-LABEL: store_v6i16:			; CHECK-LABEL: store_v6i16:
	; RV32: # %bb.0:			; CHECK: # %bb.0:
	; RV32-NEXT: vsetivli zero, 1, e32, m1, ta, ma			; CHECK-NEXT: vsetivli zero, 6, e16, m1, ta, ma
	; RV32-NEXT: vslidedown.vi v9, v8, 2			; CHECK-NEXT: vse16.v v8, (a0)
	; RV32-NEXT: addi a1, a0, 8			; CHECK-NEXT: ret
	; RV32-NEXT: vse32.v v9, (a1)
	; RV32-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
	; RV32-NEXT: vse16.v v8, (a0)
	; RV32-NEXT: ret
	;
	; RV64-LABEL: store_v6i16:
	; RV64: # %bb.0:
	; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma
	; RV64-NEXT: vse64.v v8, (a0)
	; RV64-NEXT: vsetivli zero, 1, e32, m1, ta, ma
	; RV64-NEXT: vslidedown.vi v8, v8, 2
	; RV64-NEXT: addi a0, a0, 8
	; RV64-NEXT: vse32.v v8, (a0)
	; RV64-NEXT: ret
	store <6 x i16> %v, ptr %p			store <6 x i16> %v, ptr %p
	ret void			ret void
	}			}

	define void @store_v6f16(ptr %p, <6 x half> %v) {			define void @store_v6f16(ptr %p, <6 x half> %v) {
	; RV32-LABEL: store_v6f16:			; RV32-LABEL: store_v6f16:
	; RV32: # %bb.0:			; RV32: # %bb.0:
	; RV32-NEXT: addi sp, sp, -16			; RV32-NEXT: addi sp, sp, -16
	▲ Show 20 Lines • Show All 58 Lines • ▼ Show 20 Lines
	; RV64-NEXT: addi a0, a0, 8			; RV64-NEXT: addi a0, a0, 8
	; RV64-NEXT: vse32.v v8, (a0)			; RV64-NEXT: vse32.v v8, (a0)
	; RV64-NEXT: ret			; RV64-NEXT: ret
	store <6 x half> %v, ptr %p			store <6 x half> %v, ptr %p
	ret void			ret void
	}			}

	define void @store_v6f32(ptr %p, <6 x float> %v) {			define void @store_v6f32(ptr %p, <6 x float> %v) {
	; RV32-LABEL: store_v6f32:			; CHECK-LABEL: store_v6f32:
	; RV32: # %bb.0:			; CHECK: # %bb.0:
	; RV32-NEXT: vsetivli zero, 2, e32, m2, ta, ma			; CHECK-NEXT: vsetivli zero, 6, e32, m2, ta, ma
	; RV32-NEXT: vslidedown.vi v10, v8, 4			; CHECK-NEXT: vse32.v v8, (a0)
	; RV32-NEXT: addi a1, a0, 16			; CHECK-NEXT: ret
	; RV32-NEXT: vsetivli zero, 2, e32, mf2, ta, ma
	; RV32-NEXT: vse32.v v10, (a1)
	; RV32-NEXT: vsetivli zero, 4, e32, m1, ta, ma
	; RV32-NEXT: vse32.v v8, (a0)
	; RV32-NEXT: ret
	;
	; RV64-LABEL: store_v6f32:
	; RV64: # %bb.0:
	; RV64-NEXT: vsetivli zero, 1, e64, m2, ta, ma
	; RV64-NEXT: vslidedown.vi v10, v8, 2
	; RV64-NEXT: addi a1, a0, 16
	; RV64-NEXT: vse64.v v10, (a1)
	; RV64-NEXT: vsetivli zero, 4, e32, m1, ta, ma
	; RV64-NEXT: vse32.v v8, (a0)
	; RV64-NEXT: ret
	store <6 x float> %v, ptr %p			store <6 x float> %v, ptr %p
	ret void			ret void
	}			}

	define void @store_v6f64(ptr %p, <6 x double> %v) {			define void @store_v6f64(ptr %p, <6 x double> %v) {
	; CHECK-LABEL: store_v6f64:			; CHECK-LABEL: store_v6f64:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 2, e64, m4, ta, ma			; CHECK-NEXT: vsetivli zero, 6, e64, m4, ta, ma
	; CHECK-NEXT: vslidedown.vi v12, v8, 4
	; CHECK-NEXT: addi a1, a0, 32
	; CHECK-NEXT: vsetivli zero, 2, e64, m1, ta, ma
	; CHECK-NEXT: vse64.v v12, (a1)
	; CHECK-NEXT: vsetivli zero, 4, e64, m2, ta, ma
	; CHECK-NEXT: vse64.v v8, (a0)			; CHECK-NEXT: vse64.v v8, (a0)
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	store <6 x double> %v, ptr %p			store <6 x double> %v, ptr %p
	ret void			ret void
	}			}

	define void @store_v6i1(ptr %p, <6 x i1> %v) {			define void @store_v6i1(ptr %p, <6 x i1> %v) {
	; CHECK-LABEL: store_v6i1:			; CHECK-LABEL: store_v6i1:
	Show All 21 Lines

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-vselect.ll

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: llc -mtriple=riscv32 -target-abi=ilp32d -mattr=+v,+zfh,+experimental-zvfh,+f,+d -riscv-v-vector-bits-min=128 -verify-machineinstrs < %s \| FileCheck %s -check-prefixes=CHECK,RV32			; RUN: llc -mtriple=riscv32 -target-abi=ilp32d -mattr=+v,+zfh,+experimental-zvfh,+f,+d -riscv-v-vector-bits-min=128 -verify-machineinstrs < %s \| FileCheck %s -check-prefixes=CHECK,RV32
	; RUN: llc -mtriple=riscv64 -target-abi=lp64d -mattr=+v,+zfh,+experimental-zvfh,+f,+d -riscv-v-vector-bits-min=128 -verify-machineinstrs < %s \| FileCheck %s -check-prefixes=CHECK,RV64			; RUN: llc -mtriple=riscv64 -target-abi=lp64d -mattr=+v,+zfh,+experimental-zvfh,+f,+d -riscv-v-vector-bits-min=128 -verify-machineinstrs < %s \| FileCheck %s -check-prefixes=CHECK,RV64

	define void @vselect_vv_v6i32(ptr %a, ptr %b, ptr %cc, ptr %z) {			define void @vselect_vv_v6i32(ptr %a, ptr %b, ptr %cc, ptr %z) {
	; RV32-LABEL: vselect_vv_v6i32:			; RV32-LABEL: vselect_vv_v6i32:
	; RV32: # %bb.0:			; RV32: # %bb.0:
	; RV32-NEXT: addi sp, sp, -16			; RV32-NEXT: addi sp, sp, -16
	; RV32-NEXT: .cfi_def_cfa_offset 16			; RV32-NEXT: .cfi_def_cfa_offset 16
	; RV32-NEXT: vsetivli zero, 8, e8, mf2, ta, ma			; RV32-NEXT: vsetivli zero, 6, e32, m2, ta, ma
	; RV32-NEXT: lbu a2, 0(a2)			; RV32-NEXT: lbu a2, 0(a2)
	; RV32-NEXT: vle32.v v8, (a1)			; RV32-NEXT: vle32.v v8, (a1)
	; RV32-NEXT: srli a1, a2, 5			; RV32-NEXT: srli a1, a2, 5
	; RV32-NEXT: sb a1, 13(sp)			; RV32-NEXT: sb a1, 13(sp)
	; RV32-NEXT: andi a1, a2, 1			; RV32-NEXT: andi a1, a2, 1
	; RV32-NEXT: sb a1, 8(sp)			; RV32-NEXT: sb a1, 8(sp)
	; RV32-NEXT: slli a1, a2, 27			; RV32-NEXT: slli a1, a2, 27
	; RV32-NEXT: srli a1, a1, 31			; RV32-NEXT: srli a1, a1, 31
	; RV32-NEXT: sb a1, 12(sp)			; RV32-NEXT: sb a1, 12(sp)
	; RV32-NEXT: slli a1, a2, 28			; RV32-NEXT: slli a1, a2, 28
	; RV32-NEXT: srli a1, a1, 31			; RV32-NEXT: srli a1, a1, 31
	; RV32-NEXT: sb a1, 11(sp)			; RV32-NEXT: sb a1, 11(sp)
	; RV32-NEXT: slli a1, a2, 29			; RV32-NEXT: slli a1, a2, 29
	; RV32-NEXT: srli a1, a1, 31			; RV32-NEXT: srli a1, a1, 31
	; RV32-NEXT: sb a1, 10(sp)			; RV32-NEXT: sb a1, 10(sp)
	; RV32-NEXT: slli a2, a2, 30			; RV32-NEXT: slli a2, a2, 30
	; RV32-NEXT: srli a2, a2, 31			; RV32-NEXT: srli a2, a2, 31
	; RV32-NEXT: sb a2, 9(sp)			; RV32-NEXT: sb a2, 9(sp)
	; RV32-NEXT: addi a1, sp, 8			; RV32-NEXT: addi a1, sp, 8
				; RV32-NEXT: vsetivli zero, 8, e8, mf2, ta, ma
	; RV32-NEXT: vle8.v v10, (a1)			; RV32-NEXT: vle8.v v10, (a1)
	; RV32-NEXT: vand.vi v10, v10, 1			; RV32-NEXT: vand.vi v10, v10, 1
	; RV32-NEXT: vmsne.vi v0, v10, 0			; RV32-NEXT: vmsne.vi v0, v10, 0
	; RV32-NEXT: vsetvli zero, zero, e32, m2, ta, mu			; RV32-NEXT: vsetivli zero, 6, e32, m2, ta, mu
	; RV32-NEXT: vle32.v v8, (a0), v0.t			; RV32-NEXT: vle32.v v8, (a0), v0.t
	; RV32-NEXT: vsetivli zero, 2, e32, m2, ta, ma
	; RV32-NEXT: vslidedown.vi v10, v8, 4
	; RV32-NEXT: addi a0, a3, 16
	; RV32-NEXT: vsetivli zero, 2, e32, mf2, ta, ma
	; RV32-NEXT: vse32.v v10, (a0)
	; RV32-NEXT: vsetivli zero, 4, e32, m1, ta, ma
	; RV32-NEXT: vse32.v v8, (a3)			; RV32-NEXT: vse32.v v8, (a3)
	; RV32-NEXT: addi sp, sp, 16			; RV32-NEXT: addi sp, sp, 16
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: vselect_vv_v6i32:			; RV64-LABEL: vselect_vv_v6i32:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: addi sp, sp, -16			; RV64-NEXT: addi sp, sp, -16
	; RV64-NEXT: .cfi_def_cfa_offset 16			; RV64-NEXT: .cfi_def_cfa_offset 16
	; RV64-NEXT: vsetivli zero, 8, e8, mf2, ta, ma			; RV64-NEXT: vsetivli zero, 6, e32, m2, ta, ma
	; RV64-NEXT: lbu a2, 0(a2)			; RV64-NEXT: lbu a2, 0(a2)
	; RV64-NEXT: vle32.v v8, (a1)			; RV64-NEXT: vle32.v v8, (a1)
	; RV64-NEXT: srli a1, a2, 5			; RV64-NEXT: srli a1, a2, 5
	; RV64-NEXT: sb a1, 13(sp)			; RV64-NEXT: sb a1, 13(sp)
	; RV64-NEXT: andi a1, a2, 1			; RV64-NEXT: andi a1, a2, 1
	; RV64-NEXT: sb a1, 8(sp)			; RV64-NEXT: sb a1, 8(sp)
	; RV64-NEXT: slli a1, a2, 59			; RV64-NEXT: slli a1, a2, 59
	; RV64-NEXT: srli a1, a1, 63			; RV64-NEXT: srli a1, a1, 63
	; RV64-NEXT: sb a1, 12(sp)			; RV64-NEXT: sb a1, 12(sp)
	; RV64-NEXT: slli a1, a2, 60			; RV64-NEXT: slli a1, a2, 60
	; RV64-NEXT: srli a1, a1, 63			; RV64-NEXT: srli a1, a1, 63
	; RV64-NEXT: sb a1, 11(sp)			; RV64-NEXT: sb a1, 11(sp)
	; RV64-NEXT: slli a1, a2, 61			; RV64-NEXT: slli a1, a2, 61
	; RV64-NEXT: srli a1, a1, 63			; RV64-NEXT: srli a1, a1, 63
	; RV64-NEXT: sb a1, 10(sp)			; RV64-NEXT: sb a1, 10(sp)
	; RV64-NEXT: slli a2, a2, 62			; RV64-NEXT: slli a2, a2, 62
	; RV64-NEXT: srli a2, a2, 63			; RV64-NEXT: srli a2, a2, 63
	; RV64-NEXT: sb a2, 9(sp)			; RV64-NEXT: sb a2, 9(sp)
	; RV64-NEXT: addi a1, sp, 8			; RV64-NEXT: addi a1, sp, 8
				; RV64-NEXT: vsetivli zero, 8, e8, mf2, ta, ma
	; RV64-NEXT: vle8.v v10, (a1)			; RV64-NEXT: vle8.v v10, (a1)
	; RV64-NEXT: vand.vi v10, v10, 1			; RV64-NEXT: vand.vi v10, v10, 1
	; RV64-NEXT: vmsne.vi v0, v10, 0			; RV64-NEXT: vmsne.vi v0, v10, 0
	; RV64-NEXT: vsetvli zero, zero, e32, m2, ta, mu			; RV64-NEXT: vsetivli zero, 6, e32, m2, ta, mu
	; RV64-NEXT: vle32.v v8, (a0), v0.t			; RV64-NEXT: vle32.v v8, (a0), v0.t
	; RV64-NEXT: vsetivli zero, 1, e64, m2, ta, ma
	; RV64-NEXT: vslidedown.vi v10, v8, 2
	; RV64-NEXT: addi a0, a3, 16
	; RV64-NEXT: vse64.v v10, (a0)
	; RV64-NEXT: vsetivli zero, 4, e32, m1, ta, ma
	; RV64-NEXT: vse32.v v8, (a3)			; RV64-NEXT: vse32.v v8, (a3)
	; RV64-NEXT: addi sp, sp, 16			; RV64-NEXT: addi sp, sp, 16
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%va = load <6 x i32>, ptr %a			%va = load <6 x i32>, ptr %a
	%vb = load <6 x i32>, ptr %b			%vb = load <6 x i32>, ptr %b
	%vcc = load <6 x i1>, ptr %cc			%vcc = load <6 x i1>, ptr %cc
	%vsel = select <6 x i1> %vcc, <6 x i32> %va, <6 x i32> %vb			%vsel = select <6 x i1> %vcc, <6 x i32> %va, <6 x i32> %vb
	store <6 x i32> %vsel, ptr %z			store <6 x i32> %vsel, ptr %z
	ret void			ret void
	}			}

	define void @vselect_vx_v6i32(i32 %a, ptr %b, ptr %cc, ptr %z) {			define void @vselect_vx_v6i32(i32 %a, ptr %b, ptr %cc, ptr %z) {
	; RV32-LABEL: vselect_vx_v6i32:			; RV32-LABEL: vselect_vx_v6i32:
	; RV32: # %bb.0:			; RV32: # %bb.0:
	; RV32-NEXT: addi sp, sp, -16			; RV32-NEXT: addi sp, sp, -16
	; RV32-NEXT: .cfi_def_cfa_offset 16			; RV32-NEXT: .cfi_def_cfa_offset 16
	; RV32-NEXT: vsetivli zero, 8, e8, mf2, ta, ma			; RV32-NEXT: vsetivli zero, 6, e32, m2, ta, ma
	; RV32-NEXT: lbu a2, 0(a2)			; RV32-NEXT: lbu a2, 0(a2)
	; RV32-NEXT: vle32.v v8, (a1)			; RV32-NEXT: vle32.v v8, (a1)
	; RV32-NEXT: srli a1, a2, 5			; RV32-NEXT: srli a1, a2, 5
	; RV32-NEXT: sb a1, 13(sp)			; RV32-NEXT: sb a1, 13(sp)
	; RV32-NEXT: andi a1, a2, 1			; RV32-NEXT: andi a1, a2, 1
	; RV32-NEXT: sb a1, 8(sp)			; RV32-NEXT: sb a1, 8(sp)
	; RV32-NEXT: slli a1, a2, 27			; RV32-NEXT: slli a1, a2, 27
	; RV32-NEXT: srli a1, a1, 31			; RV32-NEXT: srli a1, a1, 31
	; RV32-NEXT: sb a1, 12(sp)			; RV32-NEXT: sb a1, 12(sp)
	; RV32-NEXT: slli a1, a2, 28			; RV32-NEXT: slli a1, a2, 28
	; RV32-NEXT: srli a1, a1, 31			; RV32-NEXT: srli a1, a1, 31
	; RV32-NEXT: sb a1, 11(sp)			; RV32-NEXT: sb a1, 11(sp)
	; RV32-NEXT: slli a1, a2, 29			; RV32-NEXT: slli a1, a2, 29
	; RV32-NEXT: srli a1, a1, 31			; RV32-NEXT: srli a1, a1, 31
	; RV32-NEXT: sb a1, 10(sp)			; RV32-NEXT: sb a1, 10(sp)
	; RV32-NEXT: slli a2, a2, 30			; RV32-NEXT: slli a2, a2, 30
	; RV32-NEXT: srli a2, a2, 31			; RV32-NEXT: srli a2, a2, 31
	; RV32-NEXT: sb a2, 9(sp)			; RV32-NEXT: sb a2, 9(sp)
	; RV32-NEXT: addi a1, sp, 8			; RV32-NEXT: addi a1, sp, 8
				; RV32-NEXT: vsetivli zero, 8, e8, mf2, ta, ma
	; RV32-NEXT: vle8.v v10, (a1)			; RV32-NEXT: vle8.v v10, (a1)
	; RV32-NEXT: vand.vi v10, v10, 1			; RV32-NEXT: vand.vi v10, v10, 1
	; RV32-NEXT: vmsne.vi v0, v10, 0			; RV32-NEXT: vmsne.vi v0, v10, 0
	; RV32-NEXT: vsetvli zero, zero, e32, m2, ta, ma			; RV32-NEXT: vsetivli zero, 6, e32, m2, ta, ma
	; RV32-NEXT: vmerge.vxm v8, v8, a0, v0			; RV32-NEXT: vmerge.vxm v8, v8, a0, v0
	; RV32-NEXT: vsetivli zero, 2, e32, m2, ta, ma
	; RV32-NEXT: vslidedown.vi v10, v8, 4
	; RV32-NEXT: addi a0, a3, 16
	; RV32-NEXT: vsetivli zero, 2, e32, mf2, ta, ma
	; RV32-NEXT: vse32.v v10, (a0)
	; RV32-NEXT: vsetivli zero, 4, e32, m1, ta, ma
	; RV32-NEXT: vse32.v v8, (a3)			; RV32-NEXT: vse32.v v8, (a3)
	; RV32-NEXT: addi sp, sp, 16			; RV32-NEXT: addi sp, sp, 16
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: vselect_vx_v6i32:			; RV64-LABEL: vselect_vx_v6i32:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: addi sp, sp, -16			; RV64-NEXT: addi sp, sp, -16
	; RV64-NEXT: .cfi_def_cfa_offset 16			; RV64-NEXT: .cfi_def_cfa_offset 16
	; RV64-NEXT: vsetivli zero, 8, e8, mf2, ta, ma			; RV64-NEXT: vsetivli zero, 6, e32, m2, ta, ma
	; RV64-NEXT: lbu a2, 0(a2)			; RV64-NEXT: lbu a2, 0(a2)
	; RV64-NEXT: vle32.v v8, (a1)			; RV64-NEXT: vle32.v v8, (a1)
	; RV64-NEXT: srli a1, a2, 5			; RV64-NEXT: srli a1, a2, 5
	; RV64-NEXT: sb a1, 13(sp)			; RV64-NEXT: sb a1, 13(sp)
	; RV64-NEXT: andi a1, a2, 1			; RV64-NEXT: andi a1, a2, 1
	; RV64-NEXT: sb a1, 8(sp)			; RV64-NEXT: sb a1, 8(sp)
	; RV64-NEXT: slli a1, a2, 59			; RV64-NEXT: slli a1, a2, 59
	; RV64-NEXT: srli a1, a1, 63			; RV64-NEXT: srli a1, a1, 63
	; RV64-NEXT: sb a1, 12(sp)			; RV64-NEXT: sb a1, 12(sp)
	; RV64-NEXT: slli a1, a2, 60			; RV64-NEXT: slli a1, a2, 60
	; RV64-NEXT: srli a1, a1, 63			; RV64-NEXT: srli a1, a1, 63
	; RV64-NEXT: sb a1, 11(sp)			; RV64-NEXT: sb a1, 11(sp)
	; RV64-NEXT: slli a1, a2, 61			; RV64-NEXT: slli a1, a2, 61
	; RV64-NEXT: srli a1, a1, 63			; RV64-NEXT: srli a1, a1, 63
	; RV64-NEXT: sb a1, 10(sp)			; RV64-NEXT: sb a1, 10(sp)
	; RV64-NEXT: slli a2, a2, 62			; RV64-NEXT: slli a2, a2, 62
	; RV64-NEXT: srli a2, a2, 63			; RV64-NEXT: srli a2, a2, 63
	; RV64-NEXT: sb a2, 9(sp)			; RV64-NEXT: sb a2, 9(sp)
	; RV64-NEXT: addi a1, sp, 8			; RV64-NEXT: addi a1, sp, 8
				; RV64-NEXT: vsetivli zero, 8, e8, mf2, ta, ma
	; RV64-NEXT: vle8.v v10, (a1)			; RV64-NEXT: vle8.v v10, (a1)
	; RV64-NEXT: vand.vi v10, v10, 1			; RV64-NEXT: vand.vi v10, v10, 1
	; RV64-NEXT: vmsne.vi v0, v10, 0			; RV64-NEXT: vmsne.vi v0, v10, 0
	; RV64-NEXT: vsetvli zero, zero, e32, m2, ta, ma			; RV64-NEXT: vsetivli zero, 6, e32, m2, ta, ma
	; RV64-NEXT: vmerge.vxm v8, v8, a0, v0			; RV64-NEXT: vmerge.vxm v8, v8, a0, v0
	; RV64-NEXT: vsetivli zero, 1, e64, m2, ta, ma
	; RV64-NEXT: vslidedown.vi v10, v8, 2
	; RV64-NEXT: addi a0, a3, 16
	; RV64-NEXT: vse64.v v10, (a0)
	; RV64-NEXT: vsetivli zero, 4, e32, m1, ta, ma
	; RV64-NEXT: vse32.v v8, (a3)			; RV64-NEXT: vse32.v v8, (a3)
	; RV64-NEXT: addi sp, sp, 16			; RV64-NEXT: addi sp, sp, 16
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%vb = load <6 x i32>, ptr %b			%vb = load <6 x i32>, ptr %b
	%ahead = insertelement <6 x i32> poison, i32 %a, i32 0			%ahead = insertelement <6 x i32> poison, i32 %a, i32 0
	%va = shufflevector <6 x i32> %ahead, <6 x i32> poison, <6 x i32> zeroinitializer			%va = shufflevector <6 x i32> %ahead, <6 x i32> poison, <6 x i32> zeroinitializer
	%vcc = load <6 x i1>, ptr %cc			%vcc = load <6 x i1>, ptr %cc
	%vsel = select <6 x i1> %vcc, <6 x i32> %va, <6 x i32> %vb			%vsel = select <6 x i1> %vcc, <6 x i32> %va, <6 x i32> %vb
	store <6 x i32> %vsel, ptr %z			store <6 x i32> %vsel, ptr %z
	ret void			ret void
	}			}

	define void @vselect_vi_v6i32(ptr %b, ptr %cc, ptr %z) {			define void @vselect_vi_v6i32(ptr %b, ptr %cc, ptr %z) {
	; RV32-LABEL: vselect_vi_v6i32:			; RV32-LABEL: vselect_vi_v6i32:
	; RV32: # %bb.0:			; RV32: # %bb.0:
	; RV32-NEXT: addi sp, sp, -16			; RV32-NEXT: addi sp, sp, -16
	; RV32-NEXT: .cfi_def_cfa_offset 16			; RV32-NEXT: .cfi_def_cfa_offset 16
	; RV32-NEXT: vsetivli zero, 8, e8, mf2, ta, ma			; RV32-NEXT: vsetivli zero, 6, e32, m2, ta, ma
	; RV32-NEXT: lbu a1, 0(a1)			; RV32-NEXT: lbu a1, 0(a1)
	; RV32-NEXT: vle32.v v8, (a0)			; RV32-NEXT: vle32.v v8, (a0)
	; RV32-NEXT: srli a0, a1, 5			; RV32-NEXT: srli a0, a1, 5
	; RV32-NEXT: sb a0, 13(sp)			; RV32-NEXT: sb a0, 13(sp)
	; RV32-NEXT: andi a0, a1, 1			; RV32-NEXT: andi a0, a1, 1
	; RV32-NEXT: sb a0, 8(sp)			; RV32-NEXT: sb a0, 8(sp)
	; RV32-NEXT: slli a0, a1, 27			; RV32-NEXT: slli a0, a1, 27
	; RV32-NEXT: srli a0, a0, 31			; RV32-NEXT: srli a0, a0, 31
	; RV32-NEXT: sb a0, 12(sp)			; RV32-NEXT: sb a0, 12(sp)
	; RV32-NEXT: slli a0, a1, 28			; RV32-NEXT: slli a0, a1, 28
	; RV32-NEXT: srli a0, a0, 31			; RV32-NEXT: srli a0, a0, 31
	; RV32-NEXT: sb a0, 11(sp)			; RV32-NEXT: sb a0, 11(sp)
	; RV32-NEXT: slli a0, a1, 29			; RV32-NEXT: slli a0, a1, 29
	; RV32-NEXT: srli a0, a0, 31			; RV32-NEXT: srli a0, a0, 31
	; RV32-NEXT: sb a0, 10(sp)			; RV32-NEXT: sb a0, 10(sp)
	; RV32-NEXT: slli a1, a1, 30			; RV32-NEXT: slli a1, a1, 30
	; RV32-NEXT: srli a1, a1, 31			; RV32-NEXT: srli a1, a1, 31
	; RV32-NEXT: sb a1, 9(sp)			; RV32-NEXT: sb a1, 9(sp)
	; RV32-NEXT: addi a0, sp, 8			; RV32-NEXT: addi a0, sp, 8
				; RV32-NEXT: vsetivli zero, 8, e8, mf2, ta, ma
	; RV32-NEXT: vle8.v v10, (a0)			; RV32-NEXT: vle8.v v10, (a0)
	; RV32-NEXT: vand.vi v10, v10, 1			; RV32-NEXT: vand.vi v10, v10, 1
	; RV32-NEXT: vmsne.vi v0, v10, 0			; RV32-NEXT: vmsne.vi v0, v10, 0
	; RV32-NEXT: vsetvli zero, zero, e32, m2, ta, ma			; RV32-NEXT: vsetivli zero, 6, e32, m2, ta, ma
	; RV32-NEXT: vmerge.vim v8, v8, -1, v0			; RV32-NEXT: vmerge.vim v8, v8, -1, v0
	; RV32-NEXT: vsetivli zero, 2, e32, m2, ta, ma
	; RV32-NEXT: vslidedown.vi v10, v8, 4
	; RV32-NEXT: addi a0, a2, 16
	; RV32-NEXT: vsetivli zero, 2, e32, mf2, ta, ma
	; RV32-NEXT: vse32.v v10, (a0)
	; RV32-NEXT: vsetivli zero, 4, e32, m1, ta, ma
	; RV32-NEXT: vse32.v v8, (a2)			; RV32-NEXT: vse32.v v8, (a2)
	; RV32-NEXT: addi sp, sp, 16			; RV32-NEXT: addi sp, sp, 16
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: vselect_vi_v6i32:			; RV64-LABEL: vselect_vi_v6i32:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: addi sp, sp, -16			; RV64-NEXT: addi sp, sp, -16
	; RV64-NEXT: .cfi_def_cfa_offset 16			; RV64-NEXT: .cfi_def_cfa_offset 16
	; RV64-NEXT: vsetivli zero, 8, e8, mf2, ta, ma			; RV64-NEXT: vsetivli zero, 6, e32, m2, ta, ma
	; RV64-NEXT: lbu a1, 0(a1)			; RV64-NEXT: lbu a1, 0(a1)
	; RV64-NEXT: vle32.v v8, (a0)			; RV64-NEXT: vle32.v v8, (a0)
	; RV64-NEXT: srli a0, a1, 5			; RV64-NEXT: srli a0, a1, 5
	; RV64-NEXT: sb a0, 13(sp)			; RV64-NEXT: sb a0, 13(sp)
	; RV64-NEXT: andi a0, a1, 1			; RV64-NEXT: andi a0, a1, 1
	; RV64-NEXT: sb a0, 8(sp)			; RV64-NEXT: sb a0, 8(sp)
	; RV64-NEXT: slli a0, a1, 59			; RV64-NEXT: slli a0, a1, 59
	; RV64-NEXT: srli a0, a0, 63			; RV64-NEXT: srli a0, a0, 63
	; RV64-NEXT: sb a0, 12(sp)			; RV64-NEXT: sb a0, 12(sp)
	; RV64-NEXT: slli a0, a1, 60			; RV64-NEXT: slli a0, a1, 60
	; RV64-NEXT: srli a0, a0, 63			; RV64-NEXT: srli a0, a0, 63
	; RV64-NEXT: sb a0, 11(sp)			; RV64-NEXT: sb a0, 11(sp)
	; RV64-NEXT: slli a0, a1, 61			; RV64-NEXT: slli a0, a1, 61
	; RV64-NEXT: srli a0, a0, 63			; RV64-NEXT: srli a0, a0, 63
	; RV64-NEXT: sb a0, 10(sp)			; RV64-NEXT: sb a0, 10(sp)
	; RV64-NEXT: slli a1, a1, 62			; RV64-NEXT: slli a1, a1, 62
	; RV64-NEXT: srli a1, a1, 63			; RV64-NEXT: srli a1, a1, 63
	; RV64-NEXT: sb a1, 9(sp)			; RV64-NEXT: sb a1, 9(sp)
	; RV64-NEXT: addi a0, sp, 8			; RV64-NEXT: addi a0, sp, 8
				; RV64-NEXT: vsetivli zero, 8, e8, mf2, ta, ma
	; RV64-NEXT: vle8.v v10, (a0)			; RV64-NEXT: vle8.v v10, (a0)
	; RV64-NEXT: vand.vi v10, v10, 1			; RV64-NEXT: vand.vi v10, v10, 1
	; RV64-NEXT: vmsne.vi v0, v10, 0			; RV64-NEXT: vmsne.vi v0, v10, 0
	; RV64-NEXT: vsetvli zero, zero, e32, m2, ta, ma			; RV64-NEXT: vsetivli zero, 6, e32, m2, ta, ma
	; RV64-NEXT: vmerge.vim v8, v8, -1, v0			; RV64-NEXT: vmerge.vim v8, v8, -1, v0
	; RV64-NEXT: vsetivli zero, 1, e64, m2, ta, ma
	; RV64-NEXT: vslidedown.vi v10, v8, 2
	; RV64-NEXT: addi a0, a2, 16
	; RV64-NEXT: vse64.v v10, (a0)
	; RV64-NEXT: vsetivli zero, 4, e32, m1, ta, ma
	; RV64-NEXT: vse32.v v8, (a2)			; RV64-NEXT: vse32.v v8, (a2)
	; RV64-NEXT: addi sp, sp, 16			; RV64-NEXT: addi sp, sp, 16
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%vb = load <6 x i32>, ptr %b			%vb = load <6 x i32>, ptr %b
	%a = insertelement <6 x i32> poison, i32 -1, i32 0			%a = insertelement <6 x i32> poison, i32 -1, i32 0
	%va = shufflevector <6 x i32> %a, <6 x i32> poison, <6 x i32> zeroinitializer			%va = shufflevector <6 x i32> %a, <6 x i32> poison, <6 x i32> zeroinitializer
	%vcc = load <6 x i1>, ptr %cc			%vcc = load <6 x i1>, ptr %cc
	%vsel = select <6 x i1> %vcc, <6 x i32> %va, <6 x i32> %vb			%vsel = select <6 x i1> %vcc, <6 x i32> %va, <6 x i32> %vb
	store <6 x i32> %vsel, ptr %z			store <6 x i32> %vsel, ptr %z
	ret void			ret void
	}			}


	define void @vselect_vv_v6f32(ptr %a, ptr %b, ptr %cc, ptr %z) {			define void @vselect_vv_v6f32(ptr %a, ptr %b, ptr %cc, ptr %z) {
	; RV32-LABEL: vselect_vv_v6f32:			; RV32-LABEL: vselect_vv_v6f32:
	; RV32: # %bb.0:			; RV32: # %bb.0:
	; RV32-NEXT: addi sp, sp, -16			; RV32-NEXT: addi sp, sp, -16
	; RV32-NEXT: .cfi_def_cfa_offset 16			; RV32-NEXT: .cfi_def_cfa_offset 16
	; RV32-NEXT: vsetivli zero, 8, e8, mf2, ta, ma			; RV32-NEXT: vsetivli zero, 6, e32, m2, ta, ma
	; RV32-NEXT: lbu a2, 0(a2)			; RV32-NEXT: lbu a2, 0(a2)
	; RV32-NEXT: vle32.v v8, (a1)			; RV32-NEXT: vle32.v v8, (a1)
	; RV32-NEXT: srli a1, a2, 5			; RV32-NEXT: srli a1, a2, 5
	; RV32-NEXT: sb a1, 13(sp)			; RV32-NEXT: sb a1, 13(sp)
	; RV32-NEXT: andi a1, a2, 1			; RV32-NEXT: andi a1, a2, 1
	; RV32-NEXT: sb a1, 8(sp)			; RV32-NEXT: sb a1, 8(sp)
	; RV32-NEXT: slli a1, a2, 27			; RV32-NEXT: slli a1, a2, 27
	; RV32-NEXT: srli a1, a1, 31			; RV32-NEXT: srli a1, a1, 31
	; RV32-NEXT: sb a1, 12(sp)			; RV32-NEXT: sb a1, 12(sp)
	; RV32-NEXT: slli a1, a2, 28			; RV32-NEXT: slli a1, a2, 28
	; RV32-NEXT: srli a1, a1, 31			; RV32-NEXT: srli a1, a1, 31
	; RV32-NEXT: sb a1, 11(sp)			; RV32-NEXT: sb a1, 11(sp)
	; RV32-NEXT: slli a1, a2, 29			; RV32-NEXT: slli a1, a2, 29
	; RV32-NEXT: srli a1, a1, 31			; RV32-NEXT: srli a1, a1, 31
	; RV32-NEXT: sb a1, 10(sp)			; RV32-NEXT: sb a1, 10(sp)
	; RV32-NEXT: slli a2, a2, 30			; RV32-NEXT: slli a2, a2, 30
	; RV32-NEXT: srli a2, a2, 31			; RV32-NEXT: srli a2, a2, 31
	; RV32-NEXT: sb a2, 9(sp)			; RV32-NEXT: sb a2, 9(sp)
	; RV32-NEXT: addi a1, sp, 8			; RV32-NEXT: addi a1, sp, 8
				; RV32-NEXT: vsetivli zero, 8, e8, mf2, ta, ma
	; RV32-NEXT: vle8.v v10, (a1)			; RV32-NEXT: vle8.v v10, (a1)
	; RV32-NEXT: vand.vi v10, v10, 1			; RV32-NEXT: vand.vi v10, v10, 1
	; RV32-NEXT: vmsne.vi v0, v10, 0			; RV32-NEXT: vmsne.vi v0, v10, 0
	; RV32-NEXT: vsetvli zero, zero, e32, m2, ta, mu			; RV32-NEXT: vsetivli zero, 6, e32, m2, ta, mu
	; RV32-NEXT: vle32.v v8, (a0), v0.t			; RV32-NEXT: vle32.v v8, (a0), v0.t
	; RV32-NEXT: vsetivli zero, 2, e32, m2, ta, ma
	; RV32-NEXT: vslidedown.vi v10, v8, 4
	; RV32-NEXT: addi a0, a3, 16
	; RV32-NEXT: vsetivli zero, 2, e32, mf2, ta, ma
	; RV32-NEXT: vse32.v v10, (a0)
	; RV32-NEXT: vsetivli zero, 4, e32, m1, ta, ma
	; RV32-NEXT: vse32.v v8, (a3)			; RV32-NEXT: vse32.v v8, (a3)
	; RV32-NEXT: addi sp, sp, 16			; RV32-NEXT: addi sp, sp, 16
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: vselect_vv_v6f32:			; RV64-LABEL: vselect_vv_v6f32:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: addi sp, sp, -16			; RV64-NEXT: addi sp, sp, -16
	; RV64-NEXT: .cfi_def_cfa_offset 16			; RV64-NEXT: .cfi_def_cfa_offset 16
	; RV64-NEXT: vsetivli zero, 8, e8, mf2, ta, ma			; RV64-NEXT: vsetivli zero, 6, e32, m2, ta, ma
	; RV64-NEXT: lbu a2, 0(a2)			; RV64-NEXT: lbu a2, 0(a2)
	; RV64-NEXT: vle32.v v8, (a1)			; RV64-NEXT: vle32.v v8, (a1)
	; RV64-NEXT: srli a1, a2, 5			; RV64-NEXT: srli a1, a2, 5
	; RV64-NEXT: sb a1, 13(sp)			; RV64-NEXT: sb a1, 13(sp)
	; RV64-NEXT: andi a1, a2, 1			; RV64-NEXT: andi a1, a2, 1
	; RV64-NEXT: sb a1, 8(sp)			; RV64-NEXT: sb a1, 8(sp)
	; RV64-NEXT: slli a1, a2, 59			; RV64-NEXT: slli a1, a2, 59
	; RV64-NEXT: srli a1, a1, 63			; RV64-NEXT: srli a1, a1, 63
	; RV64-NEXT: sb a1, 12(sp)			; RV64-NEXT: sb a1, 12(sp)
	; RV64-NEXT: slli a1, a2, 60			; RV64-NEXT: slli a1, a2, 60
	; RV64-NEXT: srli a1, a1, 63			; RV64-NEXT: srli a1, a1, 63
	; RV64-NEXT: sb a1, 11(sp)			; RV64-NEXT: sb a1, 11(sp)
	; RV64-NEXT: slli a1, a2, 61			; RV64-NEXT: slli a1, a2, 61
	; RV64-NEXT: srli a1, a1, 63			; RV64-NEXT: srli a1, a1, 63
	; RV64-NEXT: sb a1, 10(sp)			; RV64-NEXT: sb a1, 10(sp)
	; RV64-NEXT: slli a2, a2, 62			; RV64-NEXT: slli a2, a2, 62
	; RV64-NEXT: srli a2, a2, 63			; RV64-NEXT: srli a2, a2, 63
	; RV64-NEXT: sb a2, 9(sp)			; RV64-NEXT: sb a2, 9(sp)
	; RV64-NEXT: addi a1, sp, 8			; RV64-NEXT: addi a1, sp, 8
				; RV64-NEXT: vsetivli zero, 8, e8, mf2, ta, ma
	; RV64-NEXT: vle8.v v10, (a1)			; RV64-NEXT: vle8.v v10, (a1)
	; RV64-NEXT: vand.vi v10, v10, 1			; RV64-NEXT: vand.vi v10, v10, 1
	; RV64-NEXT: vmsne.vi v0, v10, 0			; RV64-NEXT: vmsne.vi v0, v10, 0
	; RV64-NEXT: vsetvli zero, zero, e32, m2, ta, mu			; RV64-NEXT: vsetivli zero, 6, e32, m2, ta, mu
	; RV64-NEXT: vle32.v v8, (a0), v0.t			; RV64-NEXT: vle32.v v8, (a0), v0.t
	; RV64-NEXT: vsetivli zero, 1, e64, m2, ta, ma
	; RV64-NEXT: vslidedown.vi v10, v8, 2
	; RV64-NEXT: addi a0, a3, 16
	; RV64-NEXT: vse64.v v10, (a0)
	; RV64-NEXT: vsetivli zero, 4, e32, m1, ta, ma
	; RV64-NEXT: vse32.v v8, (a3)			; RV64-NEXT: vse32.v v8, (a3)
	; RV64-NEXT: addi sp, sp, 16			; RV64-NEXT: addi sp, sp, 16
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%va = load <6 x float>, ptr %a			%va = load <6 x float>, ptr %a
	%vb = load <6 x float>, ptr %b			%vb = load <6 x float>, ptr %b
	%vcc = load <6 x i1>, ptr %cc			%vcc = load <6 x i1>, ptr %cc
	%vsel = select <6 x i1> %vcc, <6 x float> %va, <6 x float> %vb			%vsel = select <6 x i1> %vcc, <6 x float> %va, <6 x float> %vb
	store <6 x float> %vsel, ptr %z			store <6 x float> %vsel, ptr %z
	ret void			ret void
	}			}

	define void @vselect_vx_v6f32(float %a, ptr %b, ptr %cc, ptr %z) {			define void @vselect_vx_v6f32(float %a, ptr %b, ptr %cc, ptr %z) {
	; RV32-LABEL: vselect_vx_v6f32:			; RV32-LABEL: vselect_vx_v6f32:
	; RV32: # %bb.0:			; RV32: # %bb.0:
	; RV32-NEXT: addi sp, sp, -16			; RV32-NEXT: addi sp, sp, -16
	; RV32-NEXT: .cfi_def_cfa_offset 16			; RV32-NEXT: .cfi_def_cfa_offset 16
	; RV32-NEXT: vsetivli zero, 8, e8, mf2, ta, ma			; RV32-NEXT: vsetivli zero, 6, e32, m2, ta, ma
	; RV32-NEXT: lbu a1, 0(a1)			; RV32-NEXT: lbu a1, 0(a1)
	; RV32-NEXT: vle32.v v8, (a0)			; RV32-NEXT: vle32.v v8, (a0)
	; RV32-NEXT: srli a0, a1, 5			; RV32-NEXT: srli a0, a1, 5
	; RV32-NEXT: sb a0, 13(sp)			; RV32-NEXT: sb a0, 13(sp)
	; RV32-NEXT: andi a0, a1, 1			; RV32-NEXT: andi a0, a1, 1
	; RV32-NEXT: sb a0, 8(sp)			; RV32-NEXT: sb a0, 8(sp)
	; RV32-NEXT: slli a0, a1, 27			; RV32-NEXT: slli a0, a1, 27
	; RV32-NEXT: srli a0, a0, 31			; RV32-NEXT: srli a0, a0, 31
	; RV32-NEXT: sb a0, 12(sp)			; RV32-NEXT: sb a0, 12(sp)
	; RV32-NEXT: slli a0, a1, 28			; RV32-NEXT: slli a0, a1, 28
	; RV32-NEXT: srli a0, a0, 31			; RV32-NEXT: srli a0, a0, 31
	; RV32-NEXT: sb a0, 11(sp)			; RV32-NEXT: sb a0, 11(sp)
	; RV32-NEXT: slli a0, a1, 29			; RV32-NEXT: slli a0, a1, 29
	; RV32-NEXT: srli a0, a0, 31			; RV32-NEXT: srli a0, a0, 31
	; RV32-NEXT: sb a0, 10(sp)			; RV32-NEXT: sb a0, 10(sp)
	; RV32-NEXT: slli a1, a1, 30			; RV32-NEXT: slli a1, a1, 30
	; RV32-NEXT: srli a1, a1, 31			; RV32-NEXT: srli a1, a1, 31
	; RV32-NEXT: sb a1, 9(sp)			; RV32-NEXT: sb a1, 9(sp)
	; RV32-NEXT: addi a0, sp, 8			; RV32-NEXT: addi a0, sp, 8
				; RV32-NEXT: vsetivli zero, 8, e8, mf2, ta, ma
	; RV32-NEXT: vle8.v v10, (a0)			; RV32-NEXT: vle8.v v10, (a0)
	; RV32-NEXT: vand.vi v10, v10, 1			; RV32-NEXT: vand.vi v10, v10, 1
	; RV32-NEXT: vmsne.vi v0, v10, 0			; RV32-NEXT: vmsne.vi v0, v10, 0
	; RV32-NEXT: vsetvli zero, zero, e32, m2, ta, ma			; RV32-NEXT: vsetivli zero, 6, e32, m2, ta, ma
	; RV32-NEXT: vfmerge.vfm v8, v8, fa0, v0			; RV32-NEXT: vfmerge.vfm v8, v8, fa0, v0
	; RV32-NEXT: vsetivli zero, 2, e32, m2, ta, ma
	; RV32-NEXT: vslidedown.vi v10, v8, 4
	; RV32-NEXT: addi a0, a2, 16
	; RV32-NEXT: vsetivli zero, 2, e32, mf2, ta, ma
	; RV32-NEXT: vse32.v v10, (a0)
	; RV32-NEXT: vsetivli zero, 4, e32, m1, ta, ma
	; RV32-NEXT: vse32.v v8, (a2)			; RV32-NEXT: vse32.v v8, (a2)
	; RV32-NEXT: addi sp, sp, 16			; RV32-NEXT: addi sp, sp, 16
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: vselect_vx_v6f32:			; RV64-LABEL: vselect_vx_v6f32:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: addi sp, sp, -16			; RV64-NEXT: addi sp, sp, -16
	; RV64-NEXT: .cfi_def_cfa_offset 16			; RV64-NEXT: .cfi_def_cfa_offset 16
	; RV64-NEXT: vsetivli zero, 8, e8, mf2, ta, ma			; RV64-NEXT: vsetivli zero, 6, e32, m2, ta, ma
	; RV64-NEXT: lbu a1, 0(a1)			; RV64-NEXT: lbu a1, 0(a1)
	; RV64-NEXT: vle32.v v8, (a0)			; RV64-NEXT: vle32.v v8, (a0)
	; RV64-NEXT: srli a0, a1, 5			; RV64-NEXT: srli a0, a1, 5
	; RV64-NEXT: sb a0, 13(sp)			; RV64-NEXT: sb a0, 13(sp)
	; RV64-NEXT: andi a0, a1, 1			; RV64-NEXT: andi a0, a1, 1
	; RV64-NEXT: sb a0, 8(sp)			; RV64-NEXT: sb a0, 8(sp)
	; RV64-NEXT: slli a0, a1, 59			; RV64-NEXT: slli a0, a1, 59
	; RV64-NEXT: srli a0, a0, 63			; RV64-NEXT: srli a0, a0, 63
	; RV64-NEXT: sb a0, 12(sp)			; RV64-NEXT: sb a0, 12(sp)
	; RV64-NEXT: slli a0, a1, 60			; RV64-NEXT: slli a0, a1, 60
	; RV64-NEXT: srli a0, a0, 63			; RV64-NEXT: srli a0, a0, 63
	; RV64-NEXT: sb a0, 11(sp)			; RV64-NEXT: sb a0, 11(sp)
	; RV64-NEXT: slli a0, a1, 61			; RV64-NEXT: slli a0, a1, 61
	; RV64-NEXT: srli a0, a0, 63			; RV64-NEXT: srli a0, a0, 63
	; RV64-NEXT: sb a0, 10(sp)			; RV64-NEXT: sb a0, 10(sp)
	; RV64-NEXT: slli a1, a1, 62			; RV64-NEXT: slli a1, a1, 62
	; RV64-NEXT: srli a1, a1, 63			; RV64-NEXT: srli a1, a1, 63
	; RV64-NEXT: sb a1, 9(sp)			; RV64-NEXT: sb a1, 9(sp)
	; RV64-NEXT: addi a0, sp, 8			; RV64-NEXT: addi a0, sp, 8
				; RV64-NEXT: vsetivli zero, 8, e8, mf2, ta, ma
	; RV64-NEXT: vle8.v v10, (a0)			; RV64-NEXT: vle8.v v10, (a0)
	; RV64-NEXT: vand.vi v10, v10, 1			; RV64-NEXT: vand.vi v10, v10, 1
	; RV64-NEXT: vmsne.vi v0, v10, 0			; RV64-NEXT: vmsne.vi v0, v10, 0
	; RV64-NEXT: vsetvli zero, zero, e32, m2, ta, ma			; RV64-NEXT: vsetivli zero, 6, e32, m2, ta, ma
	; RV64-NEXT: vfmerge.vfm v8, v8, fa0, v0			; RV64-NEXT: vfmerge.vfm v8, v8, fa0, v0
	; RV64-NEXT: vsetivli zero, 1, e64, m2, ta, ma
	; RV64-NEXT: vslidedown.vi v10, v8, 2
	; RV64-NEXT: addi a0, a2, 16
	; RV64-NEXT: vse64.v v10, (a0)
	; RV64-NEXT: vsetivli zero, 4, e32, m1, ta, ma
	; RV64-NEXT: vse32.v v8, (a2)			; RV64-NEXT: vse32.v v8, (a2)
	; RV64-NEXT: addi sp, sp, 16			; RV64-NEXT: addi sp, sp, 16
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%vb = load <6 x float>, ptr %b			%vb = load <6 x float>, ptr %b
	%ahead = insertelement <6 x float> poison, float %a, i32 0			%ahead = insertelement <6 x float> poison, float %a, i32 0
	%va = shufflevector <6 x float> %ahead, <6 x float> poison, <6 x i32> zeroinitializer			%va = shufflevector <6 x float> %ahead, <6 x float> poison, <6 x i32> zeroinitializer
	%vcc = load <6 x i1>, ptr %cc			%vcc = load <6 x i1>, ptr %cc
	%vsel = select <6 x i1> %vcc, <6 x float> %va, <6 x float> %vb			%vsel = select <6 x i1> %vcc, <6 x float> %va, <6 x float> %vb
	store <6 x float> %vsel, ptr %z			store <6 x float> %vsel, ptr %z
	ret void			ret void
	}			}

	define void @vselect_vfpzero_v6f32(ptr %b, ptr %cc, ptr %z) {			define void @vselect_vfpzero_v6f32(ptr %b, ptr %cc, ptr %z) {
	; RV32-LABEL: vselect_vfpzero_v6f32:			; RV32-LABEL: vselect_vfpzero_v6f32:
	; RV32: # %bb.0:			; RV32: # %bb.0:
	; RV32-NEXT: addi sp, sp, -16			; RV32-NEXT: addi sp, sp, -16
	; RV32-NEXT: .cfi_def_cfa_offset 16			; RV32-NEXT: .cfi_def_cfa_offset 16
	; RV32-NEXT: vsetivli zero, 8, e8, mf2, ta, ma			; RV32-NEXT: vsetivli zero, 6, e32, m2, ta, ma
	; RV32-NEXT: lbu a1, 0(a1)			; RV32-NEXT: lbu a1, 0(a1)
	; RV32-NEXT: vle32.v v8, (a0)			; RV32-NEXT: vle32.v v8, (a0)
	; RV32-NEXT: srli a0, a1, 5			; RV32-NEXT: srli a0, a1, 5
	; RV32-NEXT: sb a0, 13(sp)			; RV32-NEXT: sb a0, 13(sp)
	; RV32-NEXT: andi a0, a1, 1			; RV32-NEXT: andi a0, a1, 1
	; RV32-NEXT: sb a0, 8(sp)			; RV32-NEXT: sb a0, 8(sp)
	; RV32-NEXT: slli a0, a1, 27			; RV32-NEXT: slli a0, a1, 27
	; RV32-NEXT: srli a0, a0, 31			; RV32-NEXT: srli a0, a0, 31
	; RV32-NEXT: sb a0, 12(sp)			; RV32-NEXT: sb a0, 12(sp)
	; RV32-NEXT: slli a0, a1, 28			; RV32-NEXT: slli a0, a1, 28
	; RV32-NEXT: srli a0, a0, 31			; RV32-NEXT: srli a0, a0, 31
	; RV32-NEXT: sb a0, 11(sp)			; RV32-NEXT: sb a0, 11(sp)
	; RV32-NEXT: slli a0, a1, 29			; RV32-NEXT: slli a0, a1, 29
	; RV32-NEXT: srli a0, a0, 31			; RV32-NEXT: srli a0, a0, 31
	; RV32-NEXT: sb a0, 10(sp)			; RV32-NEXT: sb a0, 10(sp)
	; RV32-NEXT: slli a1, a1, 30			; RV32-NEXT: slli a1, a1, 30
	; RV32-NEXT: srli a1, a1, 31			; RV32-NEXT: srli a1, a1, 31
	; RV32-NEXT: sb a1, 9(sp)			; RV32-NEXT: sb a1, 9(sp)
	; RV32-NEXT: addi a0, sp, 8			; RV32-NEXT: addi a0, sp, 8
				; RV32-NEXT: vsetivli zero, 8, e8, mf2, ta, ma
	; RV32-NEXT: vle8.v v10, (a0)			; RV32-NEXT: vle8.v v10, (a0)
	; RV32-NEXT: vand.vi v10, v10, 1			; RV32-NEXT: vand.vi v10, v10, 1
	; RV32-NEXT: vmsne.vi v0, v10, 0			; RV32-NEXT: vmsne.vi v0, v10, 0
	; RV32-NEXT: vsetvli zero, zero, e32, m2, ta, ma			; RV32-NEXT: vsetivli zero, 6, e32, m2, ta, ma
	; RV32-NEXT: vmerge.vim v8, v8, 0, v0			; RV32-NEXT: vmerge.vim v8, v8, 0, v0
	; RV32-NEXT: vsetivli zero, 2, e32, m2, ta, ma
	; RV32-NEXT: vslidedown.vi v10, v8, 4
	; RV32-NEXT: addi a0, a2, 16
	; RV32-NEXT: vsetivli zero, 2, e32, mf2, ta, ma
	; RV32-NEXT: vse32.v v10, (a0)
	; RV32-NEXT: vsetivli zero, 4, e32, m1, ta, ma
	; RV32-NEXT: vse32.v v8, (a2)			; RV32-NEXT: vse32.v v8, (a2)
	; RV32-NEXT: addi sp, sp, 16			; RV32-NEXT: addi sp, sp, 16
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: vselect_vfpzero_v6f32:			; RV64-LABEL: vselect_vfpzero_v6f32:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: addi sp, sp, -16			; RV64-NEXT: addi sp, sp, -16
	; RV64-NEXT: .cfi_def_cfa_offset 16			; RV64-NEXT: .cfi_def_cfa_offset 16
	; RV64-NEXT: vsetivli zero, 8, e8, mf2, ta, ma			; RV64-NEXT: vsetivli zero, 6, e32, m2, ta, ma
	; RV64-NEXT: lbu a1, 0(a1)			; RV64-NEXT: lbu a1, 0(a1)
	; RV64-NEXT: vle32.v v8, (a0)			; RV64-NEXT: vle32.v v8, (a0)
	; RV64-NEXT: srli a0, a1, 5			; RV64-NEXT: srli a0, a1, 5
	; RV64-NEXT: sb a0, 13(sp)			; RV64-NEXT: sb a0, 13(sp)
	; RV64-NEXT: andi a0, a1, 1			; RV64-NEXT: andi a0, a1, 1
	; RV64-NEXT: sb a0, 8(sp)			; RV64-NEXT: sb a0, 8(sp)
	; RV64-NEXT: slli a0, a1, 59			; RV64-NEXT: slli a0, a1, 59
	; RV64-NEXT: srli a0, a0, 63			; RV64-NEXT: srli a0, a0, 63
	; RV64-NEXT: sb a0, 12(sp)			; RV64-NEXT: sb a0, 12(sp)
	; RV64-NEXT: slli a0, a1, 60			; RV64-NEXT: slli a0, a1, 60
	; RV64-NEXT: srli a0, a0, 63			; RV64-NEXT: srli a0, a0, 63
	; RV64-NEXT: sb a0, 11(sp)			; RV64-NEXT: sb a0, 11(sp)
	; RV64-NEXT: slli a0, a1, 61			; RV64-NEXT: slli a0, a1, 61
	; RV64-NEXT: srli a0, a0, 63			; RV64-NEXT: srli a0, a0, 63
	; RV64-NEXT: sb a0, 10(sp)			; RV64-NEXT: sb a0, 10(sp)
	; RV64-NEXT: slli a1, a1, 62			; RV64-NEXT: slli a1, a1, 62
	; RV64-NEXT: srli a1, a1, 63			; RV64-NEXT: srli a1, a1, 63
	; RV64-NEXT: sb a1, 9(sp)			; RV64-NEXT: sb a1, 9(sp)
	; RV64-NEXT: addi a0, sp, 8			; RV64-NEXT: addi a0, sp, 8
				; RV64-NEXT: vsetivli zero, 8, e8, mf2, ta, ma
	; RV64-NEXT: vle8.v v10, (a0)			; RV64-NEXT: vle8.v v10, (a0)
	; RV64-NEXT: vand.vi v10, v10, 1			; RV64-NEXT: vand.vi v10, v10, 1
	; RV64-NEXT: vmsne.vi v0, v10, 0			; RV64-NEXT: vmsne.vi v0, v10, 0
	; RV64-NEXT: vsetvli zero, zero, e32, m2, ta, ma			; RV64-NEXT: vsetivli zero, 6, e32, m2, ta, ma
	; RV64-NEXT: vmerge.vim v8, v8, 0, v0			; RV64-NEXT: vmerge.vim v8, v8, 0, v0
	; RV64-NEXT: vsetivli zero, 1, e64, m2, ta, ma
	; RV64-NEXT: vslidedown.vi v10, v8, 2
	; RV64-NEXT: addi a0, a2, 16
	; RV64-NEXT: vse64.v v10, (a0)
	; RV64-NEXT: vsetivli zero, 4, e32, m1, ta, ma
	; RV64-NEXT: vse32.v v8, (a2)			; RV64-NEXT: vse32.v v8, (a2)
	; RV64-NEXT: addi sp, sp, 16			; RV64-NEXT: addi sp, sp, 16
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%vb = load <6 x float>, ptr %b			%vb = load <6 x float>, ptr %b
	%a = insertelement <6 x float> poison, float 0.0, i32 0			%a = insertelement <6 x float> poison, float 0.0, i32 0
	%va = shufflevector <6 x float> %a, <6 x float> poison, <6 x i32> zeroinitializer			%va = shufflevector <6 x float> %a, <6 x float> poison, <6 x i32> zeroinitializer
	%vcc = load <6 x i1>, ptr %cc			%vcc = load <6 x i1>, ptr %cc
	%vsel = select <6 x i1> %vcc, <6 x float> %va, <6 x float> %vb			%vsel = select <6 x i1> %vcc, <6 x float> %va, <6 x float> %vb
	▲ Show 20 Lines • Show All 292 Lines • Show Last 20 Lines

llvm/test/CodeGen/VE/Vector/vec_add.ll

	Show First 20 Lines • Show All 83 Lines • ▼ Show 20 Lines
	; CHECK-NEXT: b.l.t (, %s10)			; CHECK-NEXT: b.l.t (, %s10)
	%yins = insertelement <256 x i64> undef, i64 %y, i32 0			%yins = insertelement <256 x i64> undef, i64 %y, i32 0
	%vy = shufflevector <256 x i64> %yins, <256 x i64> undef, <256 x i32> zeroinitializer			%vy = shufflevector <256 x i64> %yins, <256 x i64> undef, <256 x i32> zeroinitializer
	%z = add <256 x i64> %x, %vy			%z = add <256 x i64> %x, %vy
	ret <256 x i64> %z			ret <256 x i64> %z
	}			}

	; <128 x i64>			; <128 x i64>
	; We expect this to be widened.			; We expect this to be widened (into a VP op, with EVL set to 128).

	; Function Attrs: nounwind			; Function Attrs: nounwind
	define fastcc <128 x i64> @add_vv_v128i64(<128 x i64> %x, <128 x i64> %y) {			define fastcc <128 x i64> @add_vv_v128i64(<128 x i64> %x, <128 x i64> %y) {
	; CHECK-LABEL: add_vv_v128i64:			; CHECK-LABEL: add_vv_v128i64:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: lea %s0, 256			; CHECK-NEXT: lea %s0, 128
	; CHECK-NEXT: lvl %s0			; CHECK-NEXT: lvl %s0
	; CHECK-NEXT: vadds.l %v0, %v0, %v1			; CHECK-NEXT: vadds.l %v0, %v0, %v1
	; CHECK-NEXT: b.l.t (, %s10)			; CHECK-NEXT: b.l.t (, %s10)
	%z = add <128 x i64> %x, %y			%z = add <128 x i64> %x, %y
	ret <128 x i64> %z			ret <128 x i64> %z
	}			}

	; <256 x i16>			; <256 x i16>
	Show All 25 Lines

llvm/test/CodeGen/VE/Vector/vec_and.ll

	Show First 20 Lines • Show All 84 Lines • ▼ Show 20 Lines
	; CHECK-NEXT: b.l.t (, %s10)			; CHECK-NEXT: b.l.t (, %s10)
	%yins = insertelement <256 x i64> undef, i64 %y, i32 0			%yins = insertelement <256 x i64> undef, i64 %y, i32 0
	%vy = shufflevector <256 x i64> %yins, <256 x i64> undef, <256 x i32> zeroinitializer			%vy = shufflevector <256 x i64> %yins, <256 x i64> undef, <256 x i32> zeroinitializer
	%z = and <256 x i64> %x, %vy			%z = and <256 x i64> %x, %vy
	ret <256 x i64> %z			ret <256 x i64> %z
	}			}

	; <128 x i64>			; <128 x i64>
	; We expect this to be widened.			; We expect this to be widened (into a VP op, with EVL set to 128).

	; Function Attrs: nounwind			; Function Attrs: nounwind
	define fastcc <128 x i64> @and_vv_v128i64(<128 x i64> %x, <128 x i64> %y) {			define fastcc <128 x i64> @and_vv_v128i64(<128 x i64> %x, <128 x i64> %y) {
	; CHECK-LABEL: and_vv_v128i64:			; CHECK-LABEL: and_vv_v128i64:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: lea %s0, 256			; CHECK-NEXT: lea %s0, 128
	; CHECK-NEXT: lvl %s0			; CHECK-NEXT: lvl %s0
	; CHECK-NEXT: vand %v0, %v0, %v1			; CHECK-NEXT: vand %v0, %v0, %v1
	; CHECK-NEXT: b.l.t (, %s10)			; CHECK-NEXT: b.l.t (, %s10)
	%z = and <128 x i64> %x, %y			%z = and <128 x i64> %x, %y
	ret <128 x i64> %z			ret <128 x i64> %z
	}			}

	; <256 x i16>			; <256 x i16>
	Show All 25 Lines