This is an archive of the discontinued LLVM Phabricator instance.

Paths

Table of Contentst

-
llvm/
-
lib/Target/RISCV/
-
Target/
-
RISCV/
-
RISCVISelLowering.h
7/7
RISCVISelLowering.cpp
1/1
RISCVInstrInfoVVLPatterns.td
-
test/CodeGen/RISCV/rvv/
-
CodeGen/
-
RISCV/
-
rvv/
-
fixed-vectors-vwmulsu.ll

Differential D118215

[RISCV] Add support for matching vwmulsu from fixed vectors.
ClosedPublic

Authored by Chenbing.Zheng on Jan 25 2022, 11:43 PM.

Download Raw Diff

Details

Reviewers

craig.topper
arcbbb
HsiangKai
frasercrmck
benshi001

Commits

rG6d6c44a3f36f: [RISCV] Add support for matching vwmulsu from fixed vectors

Summary

According to riscv-v-spec-1.0, widening signed(vs2)-unsigned integer multiply
vwmulsu.vv vd, vs2, vs1, vm # vector-vector
vwmulsu.vx vd, vs2, rs1, vm # vector-scalar

It is worth noting that signed op is only for vs2.
For vwmulsu.vv, we can swap two ops, and don't care which is sign extension,
but for vwmulsu.vx signExt can not be a vector extended from scalar (rs1).
I specifically added two functions ending with _swap in the test case.

Diff Detail

Repository: rG LLVM Github Monorepo

Event Timeline

Chenbing.Zheng created this revision.Jan 25 2022, 11:43 PM

Herald added subscribers: VincentWu, luke957, achieveartificialintelligence and 26 others. · View Herald TranscriptJan 25 2022, 11:43 PM

Chenbing.Zheng requested review of this revision.Jan 25 2022, 11:43 PM

Herald added subscribers: llvm-commits, • pcwang-thead, eopXD and 2 others. · View Herald TranscriptJan 25 2022, 11:43 PM

craig.topper added inline comments.Jan 25 2022, 11:54 PM

llvm/lib/Target/RISCV/RISCVISelLowering.cpp
7313	i'm not sure what Op0.getOperand(0).getOperand(1) is. `Op0` is the RISCVISD::VSEXT_VL `Op0.getOperand(0)` is the input to the RISCVISD::VSEXT_VL `Op0.getOperand(0).getOperand(1)` is the input to the input that, but we don't even know the opcode or how many inputs it has. But I don't know why we need to check anything special here.

Chenbing.Zheng added inline comments.Jan 26 2022, 12:15 AM

llvm/lib/Target/RISCV/RISCVISelLowering.cpp
7313	For this case, I think we couldn't combine it to vwmulsu.vx v8, v9, a1, because vwmulsu.vx signed op is only for v9 here. So I check some specil opcode here , which generate during the process of build_vec from scalar. define <2 x i16> @vwmulsu_vx_v2i16_swap(<2 x i8>* %x, i8 %y) { %a = load <2 x i8>, <2 x i8>* %x %b = insertelement <2 x i8> undef, i8 %y, i32 0 %c = shufflevector <2 x i8> %b, <2 x i8> undef, <2 x i32> zeroinitializer %d = zext <2 x i8> %a to <2 x i16> %e = sext <2 x i8> %c to <2 x i16> // here sext for %c it is build from %y %f = mul <2 x i16> %d, %e ret <2 x i16> %f }

craig.topper added inline comments.Jan 26 2022, 12:18 AM

llvm/lib/Target/RISCV/RISCVInstrInfoVVLPatterns.td
231	Remove `, [SDNPCommutative]` that's your real bug.

Remove , [SDNPCommutative]
rewrite some code

Chenbing.Zheng marked an inline comment as done.Jan 26 2022, 12:59 AM

Chenbing.Zheng added inline comments.

llvm/lib/Target/RISCV/RISCVISelLowering.cpp
7313	I rewrite here, is it better now?

craig.topper added inline comments.Jan 26 2022, 1:03 AM

llvm/lib/Target/RISCV/RISCVISelLowering.cpp
7310	This code doesn't make sense to me. Is it still needed even after removing the `SDNPCommutative` flag? Once you've identified a VSEXT and VZEXT everything should be fine. Tablegen should only be able to select the splat on zero extend operand.

Chenbing.Zheng added inline comments.Jan 26 2022, 1:37 AM

llvm/lib/Target/RISCV/RISCVISelLowering.cpp

7310

I try to delete it after removing the SDNPCommutative flag. "vwmulsu_vx_v2i16_swap" test failed and genetate vwmulsu.vx v8, v9, a1.
This code I add here for blocking combine this stuation in "vwmulsu_vx_v2i16_swap" func.
Is there any other better way to block it ?

Optimized vector-legalized selection DAG: %bb.0 'vwmulsu_vx_v2i16_swap:'
SelectionDAG has 20 nodes:

t0: ch = EntryToken
t4: i32,ch = CopyFromReg t0, Register:i32 %1
          t2: i32,ch = CopyFromReg t0, Register:i32 %0
        t8: v2i8,ch = load<(load (s16) from %ir.x)> t0, t2, undef:i32
      t25: nxv1i8 = insert_subvector undef:nxv1i8, t8, Constant:i32<0>
    t28: nxv1i16 = RISCVISD::VZEXT_VL t25, t27, Constant:i32<2>
        t23: v2i8 = BUILD_VECTOR t4, t4
      t30: nxv1i8 = insert_subvector undef:nxv1i8, t23, Constant:i32<0>
    t31: nxv1i16 = RISCVISD::VSEXT_VL t30, t27, Constant:i32<2>
  t33: nxv1i16 = RISCVISD::MUL_VL t28, t31, t27, Constant:i32<2>
t18: ch,glue = CopyToReg t0, Register:nxv1i16 $v8, t33
t27: nxv1i1 = RISCVISD::VMSET_VL Constant:i32<2>
t19: ch = RISCVISD::RET_FLAG t18, Register:nxv1i16 $v8, t18:1

After combine:

SelectionDAG has 18 nodes:

t0: ch = EntryToken
t4: i32,ch = CopyFromReg t0, Register:i32 %1
      t23: v2i8 = BUILD_VECTOR t4, t4
    t30: nxv1i8 = insert_subvector undef:nxv1i8, t23, Constant:i32<0>
        t2: i32,ch = CopyFromReg t0, Register:i32 %0
      t8: v2i8,ch = load<(load (s16) from %ir.x)> t0, t2, undef:i32
    t25: nxv1i8 = insert_subvector undef:nxv1i8, t8, Constant:i32<0>
    t27: nxv1i1 = RISCVISD::VMSET_VL Constant:i32<2>
  t35: nxv1i16 = RISCVISD::VWMULSU_VL t30, t25, t27, Constant:i32<2>
t18: ch,glue = CopyToReg t0, Register:nxv1i16 $v8, t35
t19: ch = RISCVISD::RET_FLAG t18, Register:nxv1i16 $v8, t18:1

craig.topper added inline comments.Jan 26 2022, 9:01 AM

llvm/lib/Target/RISCV/RISCVISelLowering.cpp
7310	With this code removed I get this vwmulsu_vx_v2i16_swap: # @vwmulsu_vx_v2i16_swap .cfi_startproc # %bb.0: vsetivli zero, 2, e8, mf8, ta, mu vle8.v v9, (a0) vmv.v.x v10, a1 vwmulsu.vv v8, v10, v9 ret That looks correct to me. The splat is done as a separate vmv.v.x.

del useless code and update test

Chenbing.Zheng marked 3 inline comments as done.Jan 26 2022, 10:50 PM

Chenbing.Zheng added inline comments.

llvm/lib/Target/RISCV/RISCVISelLowering.cpp
7310	Thanks，you are right ~

Harbormaster completed remote builds in B145921: Diff 403504.Jan 27 2022, 8:55 AM

LGTM

This revision is now accepted and ready to land.Jan 27 2022, 9:26 AM

This revision was landed with ongoing or failed builds.Jan 27 2022, 6:33 PM

Closed by commit rG6d6c44a3f36f: [RISCV] Add support for matching vwmulsu from fixed vectors (authored by Chenbing.Zheng, committed by benshi001). · Explain Why

This revision was automatically updated to reflect the committed changes.

benshi001 added a commit: rG6d6c44a3f36f: [RISCV] Add support for matching vwmulsu from fixed vectors.

Revision Contents

Path

Size

llvm/

lib/

Target/

RISCV/

RISCVISelLowering.h

1 line

RISCVISelLowering.cpp

12 lines

RISCVInstrInfoVVLPatterns.td

2 lines

test/

CodeGen/

RISCV/

rvv/

fixed-vectors-vwmulsu.ll

683 lines

Diff 403856

llvm/lib/Target/RISCV/RISCVISelLowering.h

Show First 20 Lines • Show All 239 Lines • ▼ Show 20 Lines	enum NodeType : unsigned {
SINT_TO_FP_VL,		SINT_TO_FP_VL,
UINT_TO_FP_VL,		UINT_TO_FP_VL,
FP_ROUND_VL,		FP_ROUND_VL,
FP_EXTEND_VL,		FP_EXTEND_VL,

// Widening instructions		// Widening instructions
VWMUL_VL,		VWMUL_VL,
VWMULU_VL,		VWMULU_VL,
		VWMULSU_VL,
VWADDU_VL,		VWADDU_VL,

// Vector compare producing a mask. Fourth operand is input mask. Fifth		// Vector compare producing a mask. Fourth operand is input mask. Fifth
// operand is VL.		// operand is VL.
SETCC_VL,		SETCC_VL,

// Vector select with an additional VL operand. This operation is unmasked.		// Vector select with an additional VL operand. This operation is unmasked.
VSELECT_VL,		VSELECT_VL,
▲ Show 20 Lines • Show All 443 Lines • Show Last 20 Lines

llvm/lib/Target/RISCV/RISCVISelLowering.cpp

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 7,278 Lines • ▼ Show 20 Lines	for (SDNode *SetCC : SetCCs) {

Ops.push_back(SetCC->getOperand(2));		Ops.push_back(SetCC->getOperand(2));
DCI.CombineTo(SetCC,		DCI.CombineTo(SetCC,
DAG.getNode(ISD::SETCC, DL, SetCC->getValueType(0), Ops));		DAG.getNode(ISD::SETCC, DL, SetCC->getValueType(0), Ops));
}		}
return SDValue(N, 0);		return SDValue(N, 0);
}		}

// Try to form VWMUL or VWMULU.		// Try to form VWMUL, VWMULU or VWMULSU.
// FIXME: Support VWMULSU.		// TODO: Support VWMULSU.vx with a sign extend Op and a splat of scalar Op.
static SDValue combineMUL_VLToVWMUL_VL(SDNode *N, SelectionDAG &DAG,		static SDValue combineMUL_VLToVWMUL_VL(SDNode *N, SelectionDAG &DAG,
bool Commute) {		bool Commute) {
assert(N->getOpcode() == RISCVISD::MUL_VL && "Unexpected opcode");		assert(N->getOpcode() == RISCVISD::MUL_VL && "Unexpected opcode");
SDValue Op0 = N->getOperand(0);		SDValue Op0 = N->getOperand(0);
SDValue Op1 = N->getOperand(1);		SDValue Op1 = N->getOperand(1);
if (Commute)		if (Commute)
std::swap(Op0, Op1);		std::swap(Op0, Op1);

bool IsSignExt = Op0.getOpcode() == RISCVISD::VSEXT_VL;		bool IsSignExt = Op0.getOpcode() == RISCVISD::VSEXT_VL;
bool IsZeroExt = Op0.getOpcode() == RISCVISD::VZEXT_VL;		bool IsZeroExt = Op0.getOpcode() == RISCVISD::VZEXT_VL;
		bool IsVWMULSU = IsSignExt && Op1.getOpcode() == RISCVISD::VZEXT_VL;
if ((!IsSignExt && !IsZeroExt) \|\| !Op0.hasOneUse())		if ((!IsSignExt && !IsZeroExt) \|\| !Op0.hasOneUse())
return SDValue();		return SDValue();

SDValue Mask = N->getOperand(2);		SDValue Mask = N->getOperand(2);
SDValue VL = N->getOperand(3);		SDValue VL = N->getOperand(3);

// Make sure the mask and VL match.		// Make sure the mask and VL match.
if (Op0.getOperand(1) != Mask \|\| Op0.getOperand(2) != VL)		if (Op0.getOperand(1) != Mask \|\| Op0.getOperand(2) != VL)
return SDValue();		return SDValue();

MVT VT = N->getSimpleValueType(0);		MVT VT = N->getSimpleValueType(0);
		craig.topperUnsubmitted Done Reply Inline Actions This code doesn't make sense to me. Is it still needed even after removing the `SDNPCommutative` flag? Once you've identified a VSEXT and VZEXT everything should be fine. Tablegen should only be able to select the splat on zero extend operand. craig.topper: This code doesn't make sense to me. Is it still needed even after removing the…
		Chenbing.ZhengAuthorUnsubmitted Done Reply Inline Actions I try to delete it after removing the SDNPCommutative flag. "vwmulsu_vx_v2i16_swap" test failed and genetate vwmulsu.vx v8, v9, a1. This code I add here for blocking combine this stuation in "vwmulsu_vx_v2i16_swap" func. Is there any other better way to block it ? Optimized vector-legalized selection DAG: %bb.0 'vwmulsu_vx_v2i16_swap:' SelectionDAG has 20 nodes: t0: ch = EntryToken t4: i32,ch = CopyFromReg t0, Register:i32 %1 t2: i32,ch = CopyFromReg t0, Register:i32 %0 t8: v2i8,ch = load<(load (s16) from %ir.x)> t0, t2, undef:i32 t25: nxv1i8 = insert_subvector undef:nxv1i8, t8, Constant:i32<0> t28: nxv1i16 = RISCVISD::VZEXT_VL t25, t27, Constant:i32<2> t23: v2i8 = BUILD_VECTOR t4, t4 t30: nxv1i8 = insert_subvector undef:nxv1i8, t23, Constant:i32<0> t31: nxv1i16 = RISCVISD::VSEXT_VL t30, t27, Constant:i32<2> t33: nxv1i16 = RISCVISD::MUL_VL t28, t31, t27, Constant:i32<2> t18: ch,glue = CopyToReg t0, Register:nxv1i16 $v8, t33 t27: nxv1i1 = RISCVISD::VMSET_VL Constant:i32<2> t19: ch = RISCVISD::RET_FLAG t18, Register:nxv1i16 $v8, t18:1 After combine: SelectionDAG has 18 nodes: t0: ch = EntryToken t4: i32,ch = CopyFromReg t0, Register:i32 %1 t23: v2i8 = BUILD_VECTOR t4, t4 t30: nxv1i8 = insert_subvector undef:nxv1i8, t23, Constant:i32<0> t2: i32,ch = CopyFromReg t0, Register:i32 %0 t8: v2i8,ch = load<(load (s16) from %ir.x)> t0, t2, undef:i32 t25: nxv1i8 = insert_subvector undef:nxv1i8, t8, Constant:i32<0> t27: nxv1i1 = RISCVISD::VMSET_VL Constant:i32<2> t35: nxv1i16 = RISCVISD::VWMULSU_VL t30, t25, t27, Constant:i32<2> t18: ch,glue = CopyToReg t0, Register:nxv1i16 $v8, t35 t19: ch = RISCVISD::RET_FLAG t18, Register:nxv1i16 $v8, t18:1 Chenbing.Zheng: I try to delete it after removing the SDNPCommutative flag. "vwmulsu_vx_v2i16_swap" test…
		craig.topperUnsubmitted Not Done Reply Inline Actions With this code removed I get this vwmulsu_vx_v2i16_swap: # @vwmulsu_vx_v2i16_swap .cfi_startproc # %bb.0: vsetivli zero, 2, e8, mf8, ta, mu vle8.v v9, (a0) vmv.v.x v10, a1 vwmulsu.vv v8, v10, v9 ret That looks correct to me. The splat is done as a separate vmv.v.x. craig.topper: With this code removed I get this ``` vwmulsu_vx_v2i16_swap: #…
		Chenbing.ZhengAuthorUnsubmitted Done Reply Inline Actions Thanks，you are right ~ Chenbing.Zheng: Thanks，you are right ~

// Determine the narrow size for a widening multiply.		// Determine the narrow size for a widening multiply.
unsigned NarrowSize = VT.getScalarSizeInBits() / 2;		unsigned NarrowSize = VT.getScalarSizeInBits() / 2;
		craig.topperUnsubmitted Done Reply Inline Actions i'm not sure what Op0.getOperand(0).getOperand(1) is. `Op0` is the RISCVISD::VSEXT_VL `Op0.getOperand(0)` is the input to the RISCVISD::VSEXT_VL `Op0.getOperand(0).getOperand(1)` is the input to the input that, but we don't even know the opcode or how many inputs it has. But I don't know why we need to check anything special here. craig.topper: i'm not sure what Op0.getOperand(0).getOperand(1) is. `Op0` is the RISCVISD::VSEXT_VL `Op0.
		Chenbing.ZhengAuthorUnsubmitted Done Reply Inline Actions For this case, I think we couldn't combine it to vwmulsu.vx v8, v9, a1, because vwmulsu.vx signed op is only for v9 here. So I check some specil opcode here , which generate during the process of build_vec from scalar. define <2 x i16> @vwmulsu_vx_v2i16_swap(<2 x i8>* %x, i8 %y) { %a = load <2 x i8>, <2 x i8>* %x %b = insertelement <2 x i8> undef, i8 %y, i32 0 %c = shufflevector <2 x i8> %b, <2 x i8> undef, <2 x i32> zeroinitializer %d = zext <2 x i8> %a to <2 x i16> %e = sext <2 x i8> %c to <2 x i16> // here sext for %c it is build from %y %f = mul <2 x i16> %d, %e ret <2 x i16> %f } Chenbing.Zheng: For this case, I think we couldn't combine it to vwmulsu.vx v8, v9, a1, because vwmulsu.vx…
		Chenbing.ZhengAuthorUnsubmitted Done Reply Inline Actions I rewrite here, is it better now? Chenbing.Zheng: I rewrite here, is it better now?
MVT NarrowVT = MVT::getVectorVT(MVT::getIntegerVT(NarrowSize),		MVT NarrowVT = MVT::getVectorVT(MVT::getIntegerVT(NarrowSize),
VT.getVectorElementCount());		VT.getVectorElementCount());

SDLoc DL(N);		SDLoc DL(N);

// See if the other operand is the same opcode.		// See if the other operand is the same opcode.
if (Op0.getOpcode() == Op1.getOpcode()) {		if (IsVWMULSU \|\| Op0.getOpcode() == Op1.getOpcode()) {
if (!Op1.hasOneUse())		if (!Op1.hasOneUse())
return SDValue();		return SDValue();

// Make sure the mask and VL match.		// Make sure the mask and VL match.
if (Op1.getOperand(1) != Mask \|\| Op1.getOperand(2) != VL)		if (Op1.getOperand(1) != Mask \|\| Op1.getOperand(2) != VL)
return SDValue();		return SDValue();

Op1 = Op1.getOperand(0);		Op1 = Op1.getOperand(0);
Show All 33 Lines	static SDValue combineMUL_VLToVWMUL_VL(SDNode *N, SelectionDAG &DAG,

// Re-introduce narrower extends if needed.		// Re-introduce narrower extends if needed.
unsigned ExtOpc = IsSignExt ? RISCVISD::VSEXT_VL : RISCVISD::VZEXT_VL;		unsigned ExtOpc = IsSignExt ? RISCVISD::VSEXT_VL : RISCVISD::VZEXT_VL;
if (Op0.getValueType() != NarrowVT)		if (Op0.getValueType() != NarrowVT)
Op0 = DAG.getNode(ExtOpc, DL, NarrowVT, Op0, Mask, VL);		Op0 = DAG.getNode(ExtOpc, DL, NarrowVT, Op0, Mask, VL);
if (Op1.getValueType() != NarrowVT)		if (Op1.getValueType() != NarrowVT)
Op1 = DAG.getNode(ExtOpc, DL, NarrowVT, Op1, Mask, VL);		Op1 = DAG.getNode(ExtOpc, DL, NarrowVT, Op1, Mask, VL);

unsigned WMulOpc = IsSignExt ? RISCVISD::VWMUL_VL : RISCVISD::VWMULU_VL;		unsigned WMulOpc = RISCVISD::VWMULSU_VL;
		if (!IsVWMULSU)
		WMulOpc = IsSignExt ? RISCVISD::VWMUL_VL : RISCVISD::VWMULU_VL;
return DAG.getNode(WMulOpc, DL, VT, Op0, Op1, Mask, VL);		return DAG.getNode(WMulOpc, DL, VT, Op0, Op1, Mask, VL);
}		}

static RISCVFPRndMode::RoundingMode matchRoundingOp(SDValue Op) {		static RISCVFPRndMode::RoundingMode matchRoundingOp(SDValue Op) {
switch (Op.getOpcode()) {		switch (Op.getOpcode()) {
case ISD::FROUNDEVEN: return RISCVFPRndMode::RNE;		case ISD::FROUNDEVEN: return RISCVFPRndMode::RNE;
case ISD::FTRUNC: return RISCVFPRndMode::RTZ;		case ISD::FTRUNC: return RISCVFPRndMode::RTZ;
case ISD::FFLOOR: return RISCVFPRndMode::RDN;		case ISD::FFLOOR: return RISCVFPRndMode::RDN;
▲ Show 20 Lines • Show All 2,746 Lines • ▼ Show 20 Lines	#define NODE_NAME_CASE(NODE) \
NODE_NAME_CASE(FP_TO_SINT_VL)		NODE_NAME_CASE(FP_TO_SINT_VL)
NODE_NAME_CASE(FP_TO_UINT_VL)		NODE_NAME_CASE(FP_TO_UINT_VL)
NODE_NAME_CASE(SINT_TO_FP_VL)		NODE_NAME_CASE(SINT_TO_FP_VL)
NODE_NAME_CASE(UINT_TO_FP_VL)		NODE_NAME_CASE(UINT_TO_FP_VL)
NODE_NAME_CASE(FP_EXTEND_VL)		NODE_NAME_CASE(FP_EXTEND_VL)
NODE_NAME_CASE(FP_ROUND_VL)		NODE_NAME_CASE(FP_ROUND_VL)
NODE_NAME_CASE(VWMUL_VL)		NODE_NAME_CASE(VWMUL_VL)
NODE_NAME_CASE(VWMULU_VL)		NODE_NAME_CASE(VWMULU_VL)
		NODE_NAME_CASE(VWMULSU_VL)
NODE_NAME_CASE(VWADDU_VL)		NODE_NAME_CASE(VWADDU_VL)
NODE_NAME_CASE(SETCC_VL)		NODE_NAME_CASE(SETCC_VL)
NODE_NAME_CASE(VSELECT_VL)		NODE_NAME_CASE(VSELECT_VL)
NODE_NAME_CASE(VP_MERGE_VL)		NODE_NAME_CASE(VP_MERGE_VL)
NODE_NAME_CASE(VMAND_VL)		NODE_NAME_CASE(VMAND_VL)
NODE_NAME_CASE(VMOR_VL)		NODE_NAME_CASE(VMOR_VL)
NODE_NAME_CASE(VMXOR_VL)		NODE_NAME_CASE(VMXOR_VL)
NODE_NAME_CASE(VMCLR_VL)		NODE_NAME_CASE(VMCLR_VL)
▲ Show 20 Lines • Show All 795 Lines • Show Last 20 Lines

llvm/lib/Target/RISCV/RISCVInstrInfoVVLPatterns.td

	Show First 20 Lines • Show All 222 Lines • ▼ Show 20 Lines
	def SDT_RISCVVWBinOp_VL : SDTypeProfile<1, 4, [SDTCisVec<0>,			def SDT_RISCVVWBinOp_VL : SDTypeProfile<1, 4, [SDTCisVec<0>,
	SDTCisSameNumEltsAs<0, 1>,			SDTCisSameNumEltsAs<0, 1>,
	SDTCisSameAs<1, 2>,			SDTCisSameAs<1, 2>,
	SDTCisSameNumEltsAs<1, 3>,			SDTCisSameNumEltsAs<1, 3>,
	SDTCVecEltisVT<3, i1>,			SDTCVecEltisVT<3, i1>,
	SDTCisVT<4, XLenVT>]>;			SDTCisVT<4, XLenVT>]>;
	def riscv_vwmul_vl : SDNode<"RISCVISD::VWMUL_VL", SDT_RISCVVWBinOp_VL, [SDNPCommutative]>;			def riscv_vwmul_vl : SDNode<"RISCVISD::VWMUL_VL", SDT_RISCVVWBinOp_VL, [SDNPCommutative]>;
	def riscv_vwmulu_vl : SDNode<"RISCVISD::VWMULU_VL", SDT_RISCVVWBinOp_VL, [SDNPCommutative]>;			def riscv_vwmulu_vl : SDNode<"RISCVISD::VWMULU_VL", SDT_RISCVVWBinOp_VL, [SDNPCommutative]>;
				def riscv_vwmulsu_vl : SDNode<"RISCVISD::VWMULSU_VL", SDT_RISCVVWBinOp_VL>;
				craig.topperUnsubmitted Done Reply Inline Actions Remove `, [SDNPCommutative]` that's your real bug. craig.topper: Remove `, [SDNPCommutative]` that's your real bug.
	def riscv_vwaddu_vl : SDNode<"RISCVISD::VWADDU_VL", SDT_RISCVVWBinOp_VL, [SDNPCommutative]>;			def riscv_vwaddu_vl : SDNode<"RISCVISD::VWADDU_VL", SDT_RISCVVWBinOp_VL, [SDNPCommutative]>;

	def SDTRVVVecReduce : SDTypeProfile<1, 5, [			def SDTRVVVecReduce : SDTypeProfile<1, 5, [
	SDTCisVec<0>, SDTCisVec<1>, SDTCisVec<2>, SDTCisSameAs<0, 3>,			SDTCisVec<0>, SDTCisVec<1>, SDTCisVec<2>, SDTCisSameAs<0, 3>,
	SDTCVecEltisVT<4, i1>, SDTCisSameNumEltsAs<2, 4>, SDTCisVT<5, XLenVT>			SDTCVecEltisVT<4, i1>, SDTCisSameNumEltsAs<2, 4>, SDTCisVT<5, XLenVT>
	]>;			]>;

	def riscv_mul_vl_oneuse : PatFrag<(ops node:$A, node:$B, node:$C, node:$D),			def riscv_mul_vl_oneuse : PatFrag<(ops node:$A, node:$B, node:$C, node:$D),
	▲ Show 20 Lines • Show All 617 Lines • ▼ Show 20 Lines
	defm : VPatBinaryVL_VV_VX<riscv_udiv_vl, "PseudoVDIVU">;			defm : VPatBinaryVL_VV_VX<riscv_udiv_vl, "PseudoVDIVU">;
	defm : VPatBinaryVL_VV_VX<riscv_sdiv_vl, "PseudoVDIV">;			defm : VPatBinaryVL_VV_VX<riscv_sdiv_vl, "PseudoVDIV">;
	defm : VPatBinaryVL_VV_VX<riscv_urem_vl, "PseudoVREMU">;			defm : VPatBinaryVL_VV_VX<riscv_urem_vl, "PseudoVREMU">;
	defm : VPatBinaryVL_VV_VX<riscv_srem_vl, "PseudoVREM">;			defm : VPatBinaryVL_VV_VX<riscv_srem_vl, "PseudoVREM">;

	// 12.12. Vector Widening Integer Multiply Instructions			// 12.12. Vector Widening Integer Multiply Instructions
	defm : VPatBinaryWVL_VV_VX<riscv_vwmul_vl, "PseudoVWMUL">;			defm : VPatBinaryWVL_VV_VX<riscv_vwmul_vl, "PseudoVWMUL">;
	defm : VPatBinaryWVL_VV_VX<riscv_vwmulu_vl, "PseudoVWMULU">;			defm : VPatBinaryWVL_VV_VX<riscv_vwmulu_vl, "PseudoVWMULU">;
				defm : VPatBinaryWVL_VV_VX<riscv_vwmulsu_vl, "PseudoVWMULSU">;

	// 12.13 Vector Single-Width Integer Multiply-Add Instructions			// 12.13 Vector Single-Width Integer Multiply-Add Instructions
	foreach vti = AllIntegerVectors in {			foreach vti = AllIntegerVectors in {
	// NOTE: We choose VMADD because it has the most commuting freedom. So it			// NOTE: We choose VMADD because it has the most commuting freedom. So it
	// works best with how TwoAddressInstructionPass tries commuting.			// works best with how TwoAddressInstructionPass tries commuting.
	defvar suffix = vti.LMul.MX;			defvar suffix = vti.LMul.MX;
	def : Pat<(vti.Vector			def : Pat<(vti.Vector
	(riscv_add_vl vti.RegClass:$rs2,			(riscv_add_vl vti.RegClass:$rs2,
	▲ Show 20 Lines • Show All 776 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-vwmulsu.ll

This file was added.

				; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
				; RUN: llc -mtriple=riscv32 -mattr=+v -riscv-v-vector-bits-min=128 -verify-machineinstrs < %s \| FileCheck %s --check-prefixes=CHECK
				; RUN: llc -mtriple=riscv64 -mattr=+v -riscv-v-vector-bits-min=128 -verify-machineinstrs < %s \| FileCheck %s --check-prefixes=CHECK

				define <2 x i16> @vwmulsu_v2i16(<2 x i8>* %x, <2 x i8>* %y) {
				; CHECK-LABEL: vwmulsu_v2i16:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetivli zero, 2, e8, mf8, ta, mu
				; CHECK-NEXT: vle8.v v9, (a0)
				; CHECK-NEXT: vle8.v v10, (a1)
				; CHECK-NEXT: vwmulsu.vv v8, v10, v9
				; CHECK-NEXT: ret
				%a = load <2 x i8>, <2 x i8>* %x
				%b = load <2 x i8>, <2 x i8>* %y
				%c = zext <2 x i8> %a to <2 x i16>
				%d = sext <2 x i8> %b to <2 x i16>
				%e = mul <2 x i16> %c, %d
				ret <2 x i16> %e
				}

				define <2 x i16> @vwmulsu_v2i16_swap(<2 x i8>* %x, <2 x i8>* %y) {
				; CHECK-LABEL: vwmulsu_v2i16_swap:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetivli zero, 2, e8, mf8, ta, mu
				; CHECK-NEXT: vle8.v v9, (a0)
				; CHECK-NEXT: vle8.v v10, (a1)
				; CHECK-NEXT: vwmulsu.vv v8, v9, v10
				; CHECK-NEXT: ret
				%a = load <2 x i8>, <2 x i8>* %x
				%b = load <2 x i8>, <2 x i8>* %y
				%c = sext <2 x i8> %a to <2 x i16>
				%d = zext <2 x i8> %b to <2 x i16>
				%e = mul <2 x i16> %c, %d
				ret <2 x i16> %e
				}

				define <4 x i16> @vwmulsu_v4i16(<4 x i8>* %x, <4 x i8>* %y) {
				; CHECK-LABEL: vwmulsu_v4i16:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetivli zero, 4, e8, mf4, ta, mu
				; CHECK-NEXT: vle8.v v9, (a0)
				; CHECK-NEXT: vle8.v v10, (a1)
				; CHECK-NEXT: vwmulsu.vv v8, v10, v9
				; CHECK-NEXT: ret
				%a = load <4 x i8>, <4 x i8>* %x
				%b = load <4 x i8>, <4 x i8>* %y
				%c = zext <4 x i8> %a to <4 x i16>
				%d = sext <4 x i8> %b to <4 x i16>
				%e = mul <4 x i16> %c, %d
				ret <4 x i16> %e
				}

				define <2 x i32> @vwmulsu_v2i32(<2 x i16>* %x, <2 x i16>* %y) {
				; CHECK-LABEL: vwmulsu_v2i32:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetivli zero, 2, e16, mf4, ta, mu
				; CHECK-NEXT: vle16.v v9, (a0)
				; CHECK-NEXT: vle16.v v10, (a1)
				; CHECK-NEXT: vwmulsu.vv v8, v10, v9
				; CHECK-NEXT: ret
				%a = load <2 x i16>, <2 x i16>* %x
				%b = load <2 x i16>, <2 x i16>* %y
				%c = zext <2 x i16> %a to <2 x i32>
				%d = sext <2 x i16> %b to <2 x i32>
				%e = mul <2 x i32> %c, %d
				ret <2 x i32> %e
				}

				define <8 x i16> @vwmulsu_v8i16(<8 x i8>* %x, <8 x i8>* %y) {
				; CHECK-LABEL: vwmulsu_v8i16:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu
				; CHECK-NEXT: vle8.v v9, (a0)
				; CHECK-NEXT: vle8.v v10, (a1)
				; CHECK-NEXT: vwmulsu.vv v8, v10, v9
				; CHECK-NEXT: ret
				%a = load <8 x i8>, <8 x i8>* %x
				%b = load <8 x i8>, <8 x i8>* %y
				%c = zext <8 x i8> %a to <8 x i16>
				%d = sext <8 x i8> %b to <8 x i16>
				%e = mul <8 x i16> %c, %d
				ret <8 x i16> %e
				}

				define <4 x i32> @vwmulsu_v4i32(<4 x i16>* %x, <4 x i16>* %y) {
				; CHECK-LABEL: vwmulsu_v4i32:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, mu
				; CHECK-NEXT: vle16.v v9, (a0)
				; CHECK-NEXT: vle16.v v10, (a1)
				; CHECK-NEXT: vwmulsu.vv v8, v10, v9
				; CHECK-NEXT: ret
				%a = load <4 x i16>, <4 x i16>* %x
				%b = load <4 x i16>, <4 x i16>* %y
				%c = zext <4 x i16> %a to <4 x i32>
				%d = sext <4 x i16> %b to <4 x i32>
				%e = mul <4 x i32> %c, %d
				ret <4 x i32> %e
				}

				define <2 x i64> @vwmulsu_v2i64(<2 x i32>* %x, <2 x i32>* %y) {
				; CHECK-LABEL: vwmulsu_v2i64:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
				; CHECK-NEXT: vle32.v v9, (a0)
				; CHECK-NEXT: vle32.v v10, (a1)
				; CHECK-NEXT: vwmulsu.vv v8, v10, v9
				; CHECK-NEXT: ret
				%a = load <2 x i32>, <2 x i32>* %x
				%b = load <2 x i32>, <2 x i32>* %y
				%c = zext <2 x i32> %a to <2 x i64>
				%d = sext <2 x i32> %b to <2 x i64>
				%e = mul <2 x i64> %c, %d
				ret <2 x i64> %e
				}

				define <16 x i16> @vwmulsu_v16i16(<16 x i8>* %x, <16 x i8>* %y) {
				; CHECK-LABEL: vwmulsu_v16i16:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetivli zero, 16, e8, m1, ta, mu
				; CHECK-NEXT: vle8.v v10, (a0)
				; CHECK-NEXT: vle8.v v11, (a1)
				; CHECK-NEXT: vwmulsu.vv v8, v11, v10
				; CHECK-NEXT: ret
				%a = load <16 x i8>, <16 x i8>* %x
				%b = load <16 x i8>, <16 x i8>* %y
				%c = zext <16 x i8> %a to <16 x i16>
				%d = sext <16 x i8> %b to <16 x i16>
				%e = mul <16 x i16> %c, %d
				ret <16 x i16> %e
				}

				define <8 x i32> @vwmulsu_v8i32(<8 x i16>* %x, <8 x i16>* %y) {
				; CHECK-LABEL: vwmulsu_v8i32:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetivli zero, 8, e16, m1, ta, mu
				; CHECK-NEXT: vle16.v v10, (a0)
				; CHECK-NEXT: vle16.v v11, (a1)
				; CHECK-NEXT: vwmulsu.vv v8, v11, v10
				; CHECK-NEXT: ret
				%a = load <8 x i16>, <8 x i16>* %x
				%b = load <8 x i16>, <8 x i16>* %y
				%c = zext <8 x i16> %a to <8 x i32>
				%d = sext <8 x i16> %b to <8 x i32>
				%e = mul <8 x i32> %c, %d
				ret <8 x i32> %e
				}

				define <4 x i64> @vwmulsu_v4i64(<4 x i32>* %x, <4 x i32>* %y) {
				; CHECK-LABEL: vwmulsu_v4i64:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
				; CHECK-NEXT: vle32.v v10, (a0)
				; CHECK-NEXT: vle32.v v11, (a1)
				; CHECK-NEXT: vwmulsu.vv v8, v11, v10
				; CHECK-NEXT: ret
				%a = load <4 x i32>, <4 x i32>* %x
				%b = load <4 x i32>, <4 x i32>* %y
				%c = zext <4 x i32> %a to <4 x i64>
				%d = sext <4 x i32> %b to <4 x i64>
				%e = mul <4 x i64> %c, %d
				ret <4 x i64> %e
				}

				define <32 x i16> @vwmulsu_v32i16(<32 x i8>* %x, <32 x i8>* %y) {
				; CHECK-LABEL: vwmulsu_v32i16:
				; CHECK: # %bb.0:
				; CHECK-NEXT: li a2, 32
				; CHECK-NEXT: vsetvli zero, a2, e8, m2, ta, mu
				; CHECK-NEXT: vle8.v v12, (a0)
				; CHECK-NEXT: vle8.v v14, (a1)
				; CHECK-NEXT: vwmulsu.vv v8, v14, v12
				; CHECK-NEXT: ret
				%a = load <32 x i8>, <32 x i8>* %x
				%b = load <32 x i8>, <32 x i8>* %y
				%c = zext <32 x i8> %a to <32 x i16>
				%d = sext <32 x i8> %b to <32 x i16>
				%e = mul <32 x i16> %c, %d
				ret <32 x i16> %e
				}

				define <16 x i32> @vwmulsu_v16i32(<16 x i16>* %x, <16 x i16>* %y) {
				; CHECK-LABEL: vwmulsu_v16i32:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetivli zero, 16, e16, m2, ta, mu
				; CHECK-NEXT: vle16.v v12, (a0)
				; CHECK-NEXT: vle16.v v14, (a1)
				; CHECK-NEXT: vwmulsu.vv v8, v14, v12
				; CHECK-NEXT: ret
				%a = load <16 x i16>, <16 x i16>* %x
				%b = load <16 x i16>, <16 x i16>* %y
				%c = zext <16 x i16> %a to <16 x i32>
				%d = sext <16 x i16> %b to <16 x i32>
				%e = mul <16 x i32> %c, %d
				ret <16 x i32> %e
				}

				define <8 x i64> @vwmulsu_v8i64(<8 x i32>* %x, <8 x i32>* %y) {
				; CHECK-LABEL: vwmulsu_v8i64:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetivli zero, 8, e32, m2, ta, mu
				; CHECK-NEXT: vle32.v v12, (a0)
				; CHECK-NEXT: vle32.v v14, (a1)
				; CHECK-NEXT: vwmulsu.vv v8, v14, v12
				; CHECK-NEXT: ret
				%a = load <8 x i32>, <8 x i32>* %x
				%b = load <8 x i32>, <8 x i32>* %y
				%c = zext <8 x i32> %a to <8 x i64>
				%d = sext <8 x i32> %b to <8 x i64>
				%e = mul <8 x i64> %c, %d
				ret <8 x i64> %e
				}

				define <64 x i16> @vwmulsu_v64i16(<64 x i8>* %x, <64 x i8>* %y) {
				; CHECK-LABEL: vwmulsu_v64i16:
				; CHECK: # %bb.0:
				; CHECK-NEXT: li a2, 64
				; CHECK-NEXT: vsetvli zero, a2, e8, m4, ta, mu
				; CHECK-NEXT: vle8.v v16, (a0)
				; CHECK-NEXT: vle8.v v20, (a1)
				; CHECK-NEXT: vwmulsu.vv v8, v20, v16
				; CHECK-NEXT: ret
				%a = load <64 x i8>, <64 x i8>* %x
				%b = load <64 x i8>, <64 x i8>* %y
				%c = zext <64 x i8> %a to <64 x i16>
				%d = sext <64 x i8> %b to <64 x i16>
				%e = mul <64 x i16> %c, %d
				ret <64 x i16> %e
				}

				define <32 x i32> @vwmulsu_v32i32(<32 x i16>* %x, <32 x i16>* %y) {
				; CHECK-LABEL: vwmulsu_v32i32:
				; CHECK: # %bb.0:
				; CHECK-NEXT: li a2, 32
				; CHECK-NEXT: vsetvli zero, a2, e16, m4, ta, mu
				; CHECK-NEXT: vle16.v v16, (a0)
				; CHECK-NEXT: vle16.v v20, (a1)
				; CHECK-NEXT: vwmulsu.vv v8, v20, v16
				; CHECK-NEXT: ret
				%a = load <32 x i16>, <32 x i16>* %x
				%b = load <32 x i16>, <32 x i16>* %y
				%c = zext <32 x i16> %a to <32 x i32>
				%d = sext <32 x i16> %b to <32 x i32>
				%e = mul <32 x i32> %c, %d
				ret <32 x i32> %e
				}

				define <16 x i64> @vwmulsu_v16i64(<16 x i32>* %x, <16 x i32>* %y) {
				; CHECK-LABEL: vwmulsu_v16i64:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetivli zero, 16, e32, m4, ta, mu
				; CHECK-NEXT: vle32.v v16, (a0)
				; CHECK-NEXT: vle32.v v20, (a1)
				; CHECK-NEXT: vwmulsu.vv v8, v20, v16
				; CHECK-NEXT: ret
				%a = load <16 x i32>, <16 x i32>* %x
				%b = load <16 x i32>, <16 x i32>* %y
				%c = zext <16 x i32> %a to <16 x i64>
				%d = sext <16 x i32> %b to <16 x i64>
				%e = mul <16 x i64> %c, %d
				ret <16 x i64> %e
				}

				define <128 x i16> @vwmulsu_v128i16(<128 x i8>* %x, <128 x i8>* %y) {
				; CHECK-LABEL: vwmulsu_v128i16:
				; CHECK: # %bb.0:
				; CHECK-NEXT: addi sp, sp, -16
				; CHECK-NEXT: .cfi_def_cfa_offset 16
				; CHECK-NEXT: csrr a2, vlenb
				; CHECK-NEXT: slli a2, a2, 3
				; CHECK-NEXT: sub sp, sp, a2
				; CHECK-NEXT: li a2, 128
				; CHECK-NEXT: vsetvli zero, a2, e8, m8, ta, mu
				; CHECK-NEXT: vle8.v v16, (a0)
				; CHECK-NEXT: vle8.v v24, (a1)
				; CHECK-NEXT: li a0, 64
				; CHECK-NEXT: vsetvli zero, a0, e8, m8, ta, mu
				; CHECK-NEXT: vslidedown.vx v8, v16, a0
				; CHECK-NEXT: addi a1, sp, 16
				; CHECK-NEXT: vs8r.v v8, (a1) # Unknown-size Folded Spill
				; CHECK-NEXT: vslidedown.vx v0, v24, a0
				; CHECK-NEXT: vsetvli zero, a0, e8, m4, ta, mu
				; CHECK-NEXT: vwmulsu.vv v8, v24, v16
				; CHECK-NEXT: addi a0, sp, 16
				; CHECK-NEXT: vl8re8.v v24, (a0) # Unknown-size Folded Reload
				; CHECK-NEXT: vwmulsu.vv v16, v0, v24
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: slli a0, a0, 3
				; CHECK-NEXT: add sp, sp, a0
				; CHECK-NEXT: addi sp, sp, 16
				; CHECK-NEXT: ret
				%a = load <128 x i8>, <128 x i8>* %x
				%b = load <128 x i8>, <128 x i8>* %y
				%c = zext <128 x i8> %a to <128 x i16>
				%d = sext <128 x i8> %b to <128 x i16>
				%e = mul <128 x i16> %c, %d
				ret <128 x i16> %e
				}

				define <64 x i32> @vwmulsu_v64i32(<64 x i16>* %x, <64 x i16>* %y) {
				; CHECK-LABEL: vwmulsu_v64i32:
				; CHECK: # %bb.0:
				; CHECK-NEXT: addi sp, sp, -16
				; CHECK-NEXT: .cfi_def_cfa_offset 16
				; CHECK-NEXT: csrr a2, vlenb
				; CHECK-NEXT: slli a2, a2, 3
				; CHECK-NEXT: sub sp, sp, a2
				; CHECK-NEXT: li a2, 64
				; CHECK-NEXT: vsetvli zero, a2, e16, m8, ta, mu
				; CHECK-NEXT: vle16.v v16, (a0)
				; CHECK-NEXT: vle16.v v24, (a1)
				; CHECK-NEXT: li a0, 32
				; CHECK-NEXT: vsetvli zero, a0, e16, m8, ta, mu
				; CHECK-NEXT: vslidedown.vx v8, v16, a0
				; CHECK-NEXT: addi a1, sp, 16
				; CHECK-NEXT: vs8r.v v8, (a1) # Unknown-size Folded Spill
				; CHECK-NEXT: vslidedown.vx v0, v24, a0
				; CHECK-NEXT: vsetvli zero, a0, e16, m4, ta, mu
				; CHECK-NEXT: vwmulsu.vv v8, v24, v16
				; CHECK-NEXT: addi a0, sp, 16
				; CHECK-NEXT: vl8re8.v v24, (a0) # Unknown-size Folded Reload
				; CHECK-NEXT: vwmulsu.vv v16, v0, v24
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: slli a0, a0, 3
				; CHECK-NEXT: add sp, sp, a0
				; CHECK-NEXT: addi sp, sp, 16
				; CHECK-NEXT: ret
				%a = load <64 x i16>, <64 x i16>* %x
				%b = load <64 x i16>, <64 x i16>* %y
				%c = zext <64 x i16> %a to <64 x i32>
				%d = sext <64 x i16> %b to <64 x i32>
				%e = mul <64 x i32> %c, %d
				ret <64 x i32> %e
				}

				define <32 x i64> @vwmulsu_v32i64(<32 x i32>* %x, <32 x i32>* %y) {
				; CHECK-LABEL: vwmulsu_v32i64:
				; CHECK: # %bb.0:
				; CHECK-NEXT: addi sp, sp, -16
				; CHECK-NEXT: .cfi_def_cfa_offset 16
				; CHECK-NEXT: csrr a2, vlenb
				; CHECK-NEXT: slli a2, a2, 3
				; CHECK-NEXT: sub sp, sp, a2
				; CHECK-NEXT: li a2, 32
				; CHECK-NEXT: vsetvli zero, a2, e32, m8, ta, mu
				; CHECK-NEXT: vle32.v v16, (a0)
				; CHECK-NEXT: vle32.v v24, (a1)
				; CHECK-NEXT: vsetivli zero, 16, e32, m8, ta, mu
				; CHECK-NEXT: vslidedown.vi v8, v16, 16
				; CHECK-NEXT: addi a0, sp, 16
				; CHECK-NEXT: vs8r.v v8, (a0) # Unknown-size Folded Spill
				; CHECK-NEXT: vslidedown.vi v0, v24, 16
				; CHECK-NEXT: vsetivli zero, 16, e32, m4, ta, mu
				; CHECK-NEXT: vwmulsu.vv v8, v24, v16
				; CHECK-NEXT: addi a0, sp, 16
				; CHECK-NEXT: vl8re8.v v24, (a0) # Unknown-size Folded Reload
				; CHECK-NEXT: vwmulsu.vv v16, v0, v24
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: slli a0, a0, 3
				; CHECK-NEXT: add sp, sp, a0
				; CHECK-NEXT: addi sp, sp, 16
				; CHECK-NEXT: ret
				%a = load <32 x i32>, <32 x i32>* %x
				%b = load <32 x i32>, <32 x i32>* %y
				%c = zext <32 x i32> %a to <32 x i64>
				%d = sext <32 x i32> %b to <32 x i64>
				%e = mul <32 x i64> %c, %d
				ret <32 x i64> %e
				}

				define <2 x i32> @vwmulsu_v2i32_v2i8(<2 x i8>* %x, <2 x i8>* %y) {
				; CHECK-LABEL: vwmulsu_v2i32_v2i8:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetivli zero, 2, e8, mf8, ta, mu
				; CHECK-NEXT: vle8.v v8, (a0)
				; CHECK-NEXT: vle8.v v9, (a1)
				; CHECK-NEXT: vsetvli zero, zero, e16, mf4, ta, mu
				; CHECK-NEXT: vsext.vf2 v10, v8
				; CHECK-NEXT: vsext.vf2 v11, v9
				; CHECK-NEXT: vwmulsu.vv v8, v11, v10
				; CHECK-NEXT: ret
				%a = load <2 x i8>, <2 x i8>* %x
				%b = load <2 x i8>, <2 x i8>* %y
				%c = zext <2 x i8> %a to <2 x i32>
				%d = sext <2 x i8> %b to <2 x i32>
				%e = mul <2 x i32> %c, %d
				ret <2 x i32> %e
				}

				define <4 x i32> @vwmulsu_v4i32_v4i8_v4i16(<4 x i8>* %x, <4 x i16>* %y) {
				; CHECK-LABEL: vwmulsu_v4i32_v4i8_v4i16:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetivli zero, 4, e8, mf4, ta, mu
				; CHECK-NEXT: vle8.v v8, (a0)
				; CHECK-NEXT: vle16.v v9, (a1)
				; CHECK-NEXT: vsetvli zero, zero, e16, mf2, ta, mu
				; CHECK-NEXT: vsext.vf2 v10, v8
				; CHECK-NEXT: vwmulsu.vv v8, v9, v10
				; CHECK-NEXT: ret
				%a = load <4 x i8>, <4 x i8>* %x
				%b = load <4 x i16>, <4 x i16>* %y
				%c = zext <4 x i8> %a to <4 x i32>
				%d = sext <4 x i16> %b to <4 x i32>
				%e = mul <4 x i32> %c, %d
				ret <4 x i32> %e
				}

				define <4 x i64> @vwmulsu_v4i64_v4i32_v4i8(<4 x i32>* %x, <4 x i8>* %y) {
				; CHECK-LABEL: vwmulsu_v4i64_v4i32_v4i8:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
				; CHECK-NEXT: vle8.v v8, (a1)
				; CHECK-NEXT: vle32.v v10, (a0)
				; CHECK-NEXT: vsext.vf4 v11, v8
				; CHECK-NEXT: vwmulsu.vv v8, v11, v10
				; CHECK-NEXT: ret
				%a = load <4 x i32>, <4 x i32>* %x
				%b = load <4 x i8>, <4 x i8>* %y
				%c = zext <4 x i32> %a to <4 x i64>
				%d = sext <4 x i8> %b to <4 x i64>
				%e = mul <4 x i64> %c, %d
				ret <4 x i64> %e
				}

				define <2 x i16> @vwmulsu_vx_v2i16(<2 x i8>* %x, i8 %y) {
				; CHECK-LABEL: vwmulsu_vx_v2i16:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetivli zero, 2, e8, mf8, ta, mu
				; CHECK-NEXT: vle8.v v9, (a0)
				; CHECK-NEXT: vwmulsu.vx v8, v9, a1
				; CHECK-NEXT: ret
				%a = load <2 x i8>, <2 x i8>* %x
				%b = insertelement <2 x i8> undef, i8 %y, i32 0
				%c = shufflevector <2 x i8> %b, <2 x i8> undef, <2 x i32> zeroinitializer
				%d = sext <2 x i8> %a to <2 x i16>
				%e = zext <2 x i8> %c to <2 x i16>
				%f = mul <2 x i16> %d, %e
				ret <2 x i16> %f
				}

				define <2 x i16> @vwmulsu_vx_v2i16_swap(<2 x i8>* %x, i8 %y) {
				; CHECK-LABEL: vwmulsu_vx_v2i16_swap:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetivli zero, 2, e8, mf8, ta, mu
				; CHECK-NEXT: vle8.v v9, (a0)
				; CHECK-NEXT: vmv.v.x v10, a1
				; CHECK-NEXT: vwmulsu.vv v8, v10, v9
				; CHECK-NEXT: ret
				%a = load <2 x i8>, <2 x i8>* %x
				%b = insertelement <2 x i8> undef, i8 %y, i32 0
				%c = shufflevector <2 x i8> %b, <2 x i8> undef, <2 x i32> zeroinitializer
				%d = zext <2 x i8> %a to <2 x i16>
				%e = sext <2 x i8> %c to <2 x i16>
				%f = mul <2 x i16> %d, %e
				ret <2 x i16> %f
				}

				define <4 x i16> @vwmulsu_vx_v4i16(<4 x i8>* %x, i8 %y) {
				; CHECK-LABEL: vwmulsu_vx_v4i16:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetivli zero, 4, e8, mf4, ta, mu
				; CHECK-NEXT: vle8.v v9, (a0)
				; CHECK-NEXT: vwmulsu.vx v8, v9, a1
				; CHECK-NEXT: ret
				%a = load <4 x i8>, <4 x i8>* %x
				%b = insertelement <4 x i8> undef, i8 %y, i32 0
				%c = shufflevector <4 x i8> %b, <4 x i8> undef, <4 x i32> zeroinitializer
				%d = sext <4 x i8> %a to <4 x i16>
				%e = zext <4 x i8> %c to <4 x i16>
				%f = mul <4 x i16> %d, %e
				ret <4 x i16> %f
				}

				define <2 x i32> @vwmulsu_vx_v2i32(<2 x i16>* %x, i16 %y) {
				; CHECK-LABEL: vwmulsu_vx_v2i32:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetivli zero, 2, e16, mf4, ta, mu
				; CHECK-NEXT: vle16.v v9, (a0)
				; CHECK-NEXT: vwmulsu.vx v8, v9, a1
				; CHECK-NEXT: ret
				%a = load <2 x i16>, <2 x i16>* %x
				%b = insertelement <2 x i16> undef, i16 %y, i32 0
				%c = shufflevector <2 x i16> %b, <2 x i16> undef, <2 x i32> zeroinitializer
				%d = sext <2 x i16> %a to <2 x i32>
				%e = zext <2 x i16> %c to <2 x i32>
				%f = mul <2 x i32> %d, %e
				ret <2 x i32> %f
				}

				define <8 x i16> @vwmulsu_vx_v8i16(<8 x i8>* %x, i8 %y) {
				; CHECK-LABEL: vwmulsu_vx_v8i16:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu
				; CHECK-NEXT: vle8.v v9, (a0)
				; CHECK-NEXT: vwmulsu.vx v8, v9, a1
				; CHECK-NEXT: ret
				%a = load <8 x i8>, <8 x i8>* %x
				%b = insertelement <8 x i8> undef, i8 %y, i32 0
				%c = shufflevector <8 x i8> %b, <8 x i8> undef, <8 x i32> zeroinitializer
				%d = sext <8 x i8> %a to <8 x i16>
				%e = zext <8 x i8> %c to <8 x i16>
				%f = mul <8 x i16> %d, %e
				ret <8 x i16> %f
				}

				define <4 x i32> @vwmulsu_vx_v4i32(<4 x i16>* %x, i16 %y) {
				; CHECK-LABEL: vwmulsu_vx_v4i32:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, mu
				; CHECK-NEXT: vle16.v v9, (a0)
				; CHECK-NEXT: vwmulsu.vx v8, v9, a1
				; CHECK-NEXT: ret
				%a = load <4 x i16>, <4 x i16>* %x
				%b = insertelement <4 x i16> undef, i16 %y, i32 0
				%c = shufflevector <4 x i16> %b, <4 x i16> undef, <4 x i32> zeroinitializer
				%d = sext <4 x i16> %a to <4 x i32>
				%e = zext <4 x i16> %c to <4 x i32>
				%f = mul <4 x i32> %d, %e
				ret <4 x i32> %f
				}

				define <2 x i64> @vwmulsu_vx_v2i64(<2 x i32>* %x, i32 %y) {
				; CHECK-LABEL: vwmulsu_vx_v2i64:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
				; CHECK-NEXT: vle32.v v9, (a0)
				; CHECK-NEXT: vwmulsu.vx v8, v9, a1
				; CHECK-NEXT: ret
				%a = load <2 x i32>, <2 x i32>* %x
				%b = insertelement <2 x i32> undef, i32 %y, i64 0
				%c = shufflevector <2 x i32> %b, <2 x i32> undef, <2 x i32> zeroinitializer
				%d = sext <2 x i32> %a to <2 x i64>
				%e = zext <2 x i32> %c to <2 x i64>
				%f = mul <2 x i64> %d, %e
				ret <2 x i64> %f
				}

				define <16 x i16> @vwmulsu_vx_v16i16(<16 x i8>* %x, i8 %y) {
				; CHECK-LABEL: vwmulsu_vx_v16i16:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetivli zero, 16, e8, m1, ta, mu
				; CHECK-NEXT: vle8.v v10, (a0)
				; CHECK-NEXT: vwmulsu.vx v8, v10, a1
				; CHECK-NEXT: ret
				%a = load <16 x i8>, <16 x i8>* %x
				%b = insertelement <16 x i8> undef, i8 %y, i32 0
				%c = shufflevector <16 x i8> %b, <16 x i8> undef, <16 x i32> zeroinitializer
				%d = sext <16 x i8> %a to <16 x i16>
				%e = zext <16 x i8> %c to <16 x i16>
				%f = mul <16 x i16> %d, %e
				ret <16 x i16> %f
				}

				define <8 x i32> @vwmulsu_vx_v8i32(<8 x i16>* %x, i16 %y) {
				; CHECK-LABEL: vwmulsu_vx_v8i32:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetivli zero, 8, e16, m1, ta, mu
				; CHECK-NEXT: vle16.v v10, (a0)
				; CHECK-NEXT: vwmulsu.vx v8, v10, a1
				; CHECK-NEXT: ret
				%a = load <8 x i16>, <8 x i16>* %x
				%b = insertelement <8 x i16> undef, i16 %y, i32 0
				%c = shufflevector <8 x i16> %b, <8 x i16> undef, <8 x i32> zeroinitializer
				%d = sext <8 x i16> %a to <8 x i32>
				%e = zext <8 x i16> %c to <8 x i32>
				%f = mul <8 x i32> %d, %e
				ret <8 x i32> %f
				}

				define <4 x i64> @vwmulsu_vx_v4i64(<4 x i32>* %x, i32 %y) {
				; CHECK-LABEL: vwmulsu_vx_v4i64:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
				; CHECK-NEXT: vle32.v v10, (a0)
				; CHECK-NEXT: vwmulsu.vx v8, v10, a1
				; CHECK-NEXT: ret
				%a = load <4 x i32>, <4 x i32>* %x
				%b = insertelement <4 x i32> undef, i32 %y, i64 0
				%c = shufflevector <4 x i32> %b, <4 x i32> undef, <4 x i32> zeroinitializer
				%d = sext <4 x i32> %a to <4 x i64>
				%e = zext <4 x i32> %c to <4 x i64>
				%f = mul <4 x i64> %d, %e
				ret <4 x i64> %f
				}

				define <32 x i16> @vwmulsu_vx_v32i16(<32 x i8>* %x, i8 %y) {
				; CHECK-LABEL: vwmulsu_vx_v32i16:
				; CHECK: # %bb.0:
				; CHECK-NEXT: li a2, 32
				; CHECK-NEXT: vsetvli zero, a2, e8, m2, ta, mu
				; CHECK-NEXT: vle8.v v12, (a0)
				; CHECK-NEXT: vwmulsu.vx v8, v12, a1
				; CHECK-NEXT: ret
				%a = load <32 x i8>, <32 x i8>* %x
				%b = insertelement <32 x i8> undef, i8 %y, i32 0
				%c = shufflevector <32 x i8> %b, <32 x i8> undef, <32 x i32> zeroinitializer
				%d = sext <32 x i8> %a to <32 x i16>
				%e = zext <32 x i8> %c to <32 x i16>
				%f = mul <32 x i16> %d, %e
				ret <32 x i16> %f
				}

				define <16 x i32> @vwmulsu_vx_v16i32(<16 x i16>* %x, i16 %y) {
				; CHECK-LABEL: vwmulsu_vx_v16i32:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetivli zero, 16, e16, m2, ta, mu
				; CHECK-NEXT: vle16.v v12, (a0)
				; CHECK-NEXT: vwmulsu.vx v8, v12, a1
				; CHECK-NEXT: ret
				%a = load <16 x i16>, <16 x i16>* %x
				%b = insertelement <16 x i16> undef, i16 %y, i32 0
				%c = shufflevector <16 x i16> %b, <16 x i16> undef, <16 x i32> zeroinitializer
				%d = sext <16 x i16> %a to <16 x i32>
				%e = zext <16 x i16> %c to <16 x i32>
				%f = mul <16 x i32> %d, %e
				ret <16 x i32> %f
				}

				define <8 x i64> @vwmulsu_vx_v8i64(<8 x i32>* %x, i32 %y) {
				; CHECK-LABEL: vwmulsu_vx_v8i64:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetivli zero, 8, e32, m2, ta, mu
				; CHECK-NEXT: vle32.v v12, (a0)
				; CHECK-NEXT: vwmulsu.vx v8, v12, a1
				; CHECK-NEXT: ret
				%a = load <8 x i32>, <8 x i32>* %x
				%b = insertelement <8 x i32> undef, i32 %y, i64 0
				%c = shufflevector <8 x i32> %b, <8 x i32> undef, <8 x i32> zeroinitializer
				%d = sext <8 x i32> %a to <8 x i64>
				%e = zext <8 x i32> %c to <8 x i64>
				%f = mul <8 x i64> %d, %e
				ret <8 x i64> %f
				}

				define <64 x i16> @vwmulsu_vx_v64i16(<64 x i8>* %x, i8 %y) {
				; CHECK-LABEL: vwmulsu_vx_v64i16:
				; CHECK: # %bb.0:
				; CHECK-NEXT: li a2, 64
				; CHECK-NEXT: vsetvli zero, a2, e8, m4, ta, mu
				; CHECK-NEXT: vle8.v v16, (a0)
				; CHECK-NEXT: vwmulsu.vx v8, v16, a1
				; CHECK-NEXT: ret
				%a = load <64 x i8>, <64 x i8>* %x
				%b = insertelement <64 x i8> undef, i8 %y, i32 0
				%c = shufflevector <64 x i8> %b, <64 x i8> undef, <64 x i32> zeroinitializer
				%d = sext <64 x i8> %a to <64 x i16>
				%e = zext <64 x i8> %c to <64 x i16>
				%f = mul <64 x i16> %d, %e
				ret <64 x i16> %f
				}

				define <32 x i32> @vwmulsu_vx_v32i32(<32 x i16>* %x, i16 %y) {
				; CHECK-LABEL: vwmulsu_vx_v32i32:
				; CHECK: # %bb.0:
				; CHECK-NEXT: li a2, 32
				; CHECK-NEXT: vsetvli zero, a2, e16, m4, ta, mu
				; CHECK-NEXT: vle16.v v16, (a0)
				; CHECK-NEXT: vwmulsu.vx v8, v16, a1
				; CHECK-NEXT: ret
				%a = load <32 x i16>, <32 x i16>* %x
				%b = insertelement <32 x i16> undef, i16 %y, i32 0
				%c = shufflevector <32 x i16> %b, <32 x i16> undef, <32 x i32> zeroinitializer
				%d = sext <32 x i16> %a to <32 x i32>
				%e = zext <32 x i16> %c to <32 x i32>
				%f = mul <32 x i32> %d, %e
				ret <32 x i32> %f
				}

				define <16 x i64> @vwmulsu_vx_v16i64(<16 x i32>* %x, i32 %y) {
				; CHECK-LABEL: vwmulsu_vx_v16i64:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetivli zero, 16, e32, m4, ta, mu
				; CHECK-NEXT: vle32.v v16, (a0)
				; CHECK-NEXT: vwmulsu.vx v8, v16, a1
				; CHECK-NEXT: ret
				%a = load <16 x i32>, <16 x i32>* %x
				%b = insertelement <16 x i32> undef, i32 %y, i64 0
				%c = shufflevector <16 x i32> %b, <16 x i32> undef, <16 x i32> zeroinitializer
				%d = sext <16 x i32> %a to <16 x i64>
				%e = zext <16 x i32> %c to <16 x i64>
				%f = mul <16 x i64> %d, %e
				ret <16 x i64> %f
				}

This is an archive of the discontinued LLVM Phabricator instance.

[RISCV] Add support for matching vwmulsu from fixed vectors.ClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 403856

llvm/lib/Target/RISCV/RISCVISelLowering.h

llvm/lib/Target/RISCV/RISCVISelLowering.cpp

llvm/lib/Target/RISCV/RISCVInstrInfoVVLPatterns.td

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-vwmulsu.ll

[RISCV] Add support for matching vwmulsu from fixed vectors.
ClosedPublic