This is an archive of the discontinued LLVM Phabricator instance.

Paths

Table of Contentst

-
llvm/lib/Target/RISCV/
-
lib/
-
Target/
-
RISCV/
-
RISCVISelDAGToDAG.h
-
RISCVISelDAGToDAG.cpp
-
RISCVInstrInfoVPseudos.td

Differential D97033

[RISCV] Use custom isel for vector indexed load/store intrinsics.
ClosedPublic

Authored by craig.topper on Feb 18 2021, 10:03 PM.

Download Raw Diff

Details

Reviewers

frasercrmck
evandro
HsiangKai
khchen
arcbbb
rogfer01

Commits

rGd056d5decfb5: [RISCV] Use custom isel for vector indexed load/store intrinsics.

Summary

There are many legal combinations of index and data VTs supported
for these intrinsics. This results in a lot of isel patterns in
RISCVGenDAGISel.inc.

By adding a separate table similar to what we use for segment
load/stores, we can more efficiently manually select these
intrinsics. We should also be able to reuse this table scalable
vector gather/scatter.

This reduces the llc binary size by ~56K.

Diff Detail

Repository: rG LLVM Github Monorepo

Event Timeline

craig.topper created this revision.Feb 18 2021, 10:03 PM

Herald added subscribers: StephenFan, vkmr, luismarques and 24 others. · View Herald TranscriptFeb 18 2021, 10:03 PM

craig.topper requested review of this revision.Feb 18 2021, 10:03 PM

Herald added a project: Restricted Project. · View Herald TranscriptFeb 18 2021, 10:03 PM

Herald added a subscriber: MaskRay. · View Herald Transcript

Harbormaster completed remote builds in B89868: Diff 324881.Feb 19 2021, 12:00 AM

LGTM!!

I'm little curious, what's benefit to have two GenericTables for load/store?
Why not add a isLoad field in FilterClass and using one GenericTable for VLX and VSX?
because we have two identical FilterClass, RISCVVLX and RISCVVSX.

This revision is now accepted and ready to land.Feb 19 2021, 12:41 AM

I'm wondering if this has any implications on the masked scatter/gather intrinsics. I had previously copied this TableGen, knowing that we only use a small subset of the valid permutation of VTs for scatter/gather. I was going to look at that later. However, with this change I can see that an alternative lowering scheme would be to lower them to the intrinsics. Any thoughts about that?

In D97033#2574011, @khchen wrote:

LGTM!!

I'm little curious, what's benefit to have two GenericTables for load/store?
Why not add a isLoad field in FilterClass and using one GenericTable for VLX and VSX?
because we have two identical FilterClass, RISCVVLX and RISCVVSX.

I might do that. I think there is a free byte of padding in each row of the table so it doesn’t cost anything.

In D97033#2574046, @frasercrmck wrote:

I'm wondering if this has any implications on the masked scatter/gather intrinsics. I had previously copied this TableGen, knowing that we only use a small subset of the valid permutation of VTs for scatter/gather. I was going to look at that later. However, with this change I can see that an alternative lowering scheme would be to lower them to the intrinsics. Any thoughts about that?

That’s a good idea. I’ve been thinking about the same thing for the other ISD opcodes we’ve added. But I haven’t come to any conclusions. Having 3 different ways of selecting the same instruction seems wasteful for the isel table. The isel table isn’t very efficient either for the number of types we have.

This revision was landed with ongoing or failed builds.Feb 19 2021, 10:18 AM

Closed by commit rGd056d5decfb5: [RISCV] Use custom isel for vector indexed load/store intrinsics. (authored by craig.topper). · Explain Why

This revision was automatically updated to reflect the committed changes.

craig.topper added a commit: rGd056d5decfb5: [RISCV] Use custom isel for vector indexed load/store intrinsics..

In D97033#2574061, @craig.topper wrote:

In D97033#2574046, @frasercrmck wrote:

I'm wondering if this has any implications on the masked scatter/gather intrinsics. I had previously copied this TableGen, knowing that we only use a small subset of the valid permutation of VTs for scatter/gather. I was going to look at that later. However, with this change I can see that an alternative lowering scheme would be to lower them to the intrinsics. Any thoughts about that?

That’s a good idea. I’ve been thinking about the same thing for the other ISD opcodes we’ve added. But I haven’t come to any conclusions. Having 3 different ways of selecting the same instruction seems wasteful for the isel table. The isel table isn’t very efficient either for the number of types we have.

If we go the route of reusing these intrinsics for gather/scatter we should probably fix them to carry a memory operand into machine IR properly so we don't drop the one from the gather/scatter node.

liaolucy added a subscriber: liaolucy.Jun 25 2021, 12:35 AM

Revision Contents

Path

Size

llvm/

lib/

Target/

RISCV/

RISCVISelDAGToDAG.h

11 lines

RISCVISelDAGToDAG.cpp

89 lines

RISCVInstrInfoVPseudos.td

119 lines

Diff 325030

llvm/lib/Target/RISCV/RISCVISelDAGToDAG.h

Show First 20 Lines • Show All 120 Lines • ▼ Show 20 Lines	struct VSXSEGPseudo {
uint8_t Masked;		uint8_t Masked;
uint8_t Ordered;		uint8_t Ordered;
uint8_t SEW;		uint8_t SEW;
uint8_t LMUL;		uint8_t LMUL;
uint8_t IndexLMUL;		uint8_t IndexLMUL;
uint16_t Pseudo;		uint16_t Pseudo;
};		};

		struct VLX_VSXPseudo {
		uint8_t Masked;
		uint8_t Ordered;
		uint8_t SEW;
		uint8_t LMUL;
		uint8_t IndexLMUL;
		uint16_t Pseudo;
		};

#define GET_RISCVVSSEGTable_DECL		#define GET_RISCVVSSEGTable_DECL
#define GET_RISCVVLSEGTable_DECL		#define GET_RISCVVLSEGTable_DECL
#define GET_RISCVVLXSEGTable_DECL		#define GET_RISCVVLXSEGTable_DECL
#define GET_RISCVVSXSEGTable_DECL		#define GET_RISCVVSXSEGTable_DECL
		#define GET_RISCVVLXTable_DECL
		#define GET_RISCVVSXTable_DECL
#include "RISCVGenSearchableTables.inc"		#include "RISCVGenSearchableTables.inc"
} // namespace RISCV		} // namespace RISCV

} // namespace llvm		} // namespace llvm

#endif		#endif

llvm/lib/Target/RISCV/RISCVISelDAGToDAG.cpp

Show All 25 Lines
#define DEBUG_TYPE "riscv-isel"		#define DEBUG_TYPE "riscv-isel"

namespace llvm {		namespace llvm {
namespace RISCV {		namespace RISCV {
#define GET_RISCVVSSEGTable_IMPL		#define GET_RISCVVSSEGTable_IMPL
#define GET_RISCVVLSEGTable_IMPL		#define GET_RISCVVLSEGTable_IMPL
#define GET_RISCVVLXSEGTable_IMPL		#define GET_RISCVVLXSEGTable_IMPL
#define GET_RISCVVSXSEGTable_IMPL		#define GET_RISCVVSXSEGTable_IMPL
		#define GET_RISCVVLXTable_IMPL
		#define GET_RISCVVSXTable_IMPL
#include "RISCVGenSearchableTables.inc"		#include "RISCVGenSearchableTables.inc"
} // namespace RISCV		} // namespace RISCV
} // namespace llvm		} // namespace llvm

void RISCVDAGToDAGISel::PostprocessISelDAG() {		void RISCVDAGToDAGISel::PostprocessISelDAG() {
doPeepholeLoadStoreADDI();		doPeepholeLoadStoreADDI();
}		}

▲ Show 20 Lines • Show All 619 Lines • ▼ Show 20 Lines	case ISD::INTRINSIC_W_CHAIN: {
case Intrinsic::riscv_vlseg6ff_mask:		case Intrinsic::riscv_vlseg6ff_mask:
case Intrinsic::riscv_vlseg5ff_mask:		case Intrinsic::riscv_vlseg5ff_mask:
case Intrinsic::riscv_vlseg4ff_mask:		case Intrinsic::riscv_vlseg4ff_mask:
case Intrinsic::riscv_vlseg3ff_mask:		case Intrinsic::riscv_vlseg3ff_mask:
case Intrinsic::riscv_vlseg2ff_mask: {		case Intrinsic::riscv_vlseg2ff_mask: {
selectVLSEGFF(Node, /IsMasked/ true);		selectVLSEGFF(Node, /IsMasked/ true);
return;		return;
}		}
		case Intrinsic::riscv_vloxei:
		case Intrinsic::riscv_vloxei_mask:
		case Intrinsic::riscv_vluxei:
		case Intrinsic::riscv_vluxei_mask: {
		bool IsMasked = IntNo == Intrinsic::riscv_vloxei_mask \|\|
		IntNo == Intrinsic::riscv_vluxei_mask;
		bool IsOrdered = IntNo == Intrinsic::riscv_vloxei \|\|
		IntNo == Intrinsic::riscv_vloxei_mask;

		SDLoc DL(Node);
		MVT VT = Node->getSimpleValueType(0);
		unsigned ScalarSize = VT.getScalarSizeInBits();
		MVT XLenVT = Subtarget->getXLenVT();
		SDValue SEW = CurDAG->getTargetConstant(ScalarSize, DL, XLenVT);

		unsigned CurOp = 2;
		SmallVector<SDValue, 7> Operands;
		if (IsMasked)
		Operands.push_back(Node->getOperand(CurOp++));
		Operands.push_back(Node->getOperand(CurOp++)); // Base pointer.
		Operands.push_back(Node->getOperand(CurOp++)); // Index.
		MVT IndexVT = Operands.back()->getSimpleValueType(0);
		if (IsMasked)
		Operands.push_back(Node->getOperand(CurOp++)); // Mask.
		SDValue VL;
		selectVLOp(Node->getOperand(CurOp++), VL);
		Operands.push_back(VL);
		Operands.push_back(SEW);
		Operands.push_back(Node->getOperand(0)); // Chain.

		assert(VT.getVectorElementCount() == IndexVT.getVectorElementCount() &&
		"Element count mismatch");

		RISCVVLMUL LMUL = getLMUL(VT);
		RISCVVLMUL IndexLMUL = getLMUL(IndexVT);
		unsigned IndexScalarSize = IndexVT.getScalarSizeInBits();
		const RISCV::VLX_VSXPseudo *P = RISCV::getVLXPseudo(
		IsMasked, IsOrdered, IndexScalarSize, static_cast<unsigned>(LMUL),
		static_cast<unsigned>(IndexLMUL));
		SDNode *Load =
		CurDAG->getMachineNode(P->Pseudo, DL, Node->getVTList(), Operands);
		ReplaceNode(Node, Load);
		return;
		}
}		}
break;		break;
}		}
case ISD::INTRINSIC_VOID: {		case ISD::INTRINSIC_VOID: {
unsigned IntNo = cast<ConstantSDNode>(Node->getOperand(1))->getZExtValue();		unsigned IntNo = cast<ConstantSDNode>(Node->getOperand(1))->getZExtValue();
switch (IntNo) {		switch (IntNo) {
case Intrinsic::riscv_vsseg2:		case Intrinsic::riscv_vsseg2:
case Intrinsic::riscv_vsseg3:		case Intrinsic::riscv_vsseg3:
▲ Show 20 Lines • Show All 66 Lines • ▼ Show 20 Lines	case ISD::INTRINSIC_VOID: {
case Intrinsic::riscv_vsuxseg3_mask:		case Intrinsic::riscv_vsuxseg3_mask:
case Intrinsic::riscv_vsuxseg4_mask:		case Intrinsic::riscv_vsuxseg4_mask:
case Intrinsic::riscv_vsuxseg5_mask:		case Intrinsic::riscv_vsuxseg5_mask:
case Intrinsic::riscv_vsuxseg6_mask:		case Intrinsic::riscv_vsuxseg6_mask:
case Intrinsic::riscv_vsuxseg7_mask:		case Intrinsic::riscv_vsuxseg7_mask:
case Intrinsic::riscv_vsuxseg8_mask:		case Intrinsic::riscv_vsuxseg8_mask:
selectVSXSEG(Node, /IsMasked/ true, /IsOrdered/ false);		selectVSXSEG(Node, /IsMasked/ true, /IsOrdered/ false);
return;		return;
		case Intrinsic::riscv_vsoxei:
		case Intrinsic::riscv_vsoxei_mask:
		case Intrinsic::riscv_vsuxei:
		case Intrinsic::riscv_vsuxei_mask: {
		bool IsMasked = IntNo == Intrinsic::riscv_vsoxei_mask \|\|
		IntNo == Intrinsic::riscv_vsuxei_mask;
		bool IsOrdered = IntNo == Intrinsic::riscv_vsoxei \|\|
		IntNo == Intrinsic::riscv_vsoxei_mask;

		SDLoc DL(Node);
		MVT VT = Node->getOperand(2)->getSimpleValueType(0);
		unsigned ScalarSize = VT.getScalarSizeInBits();
		MVT XLenVT = Subtarget->getXLenVT();
		SDValue SEW = CurDAG->getTargetConstant(ScalarSize, DL, XLenVT);

		unsigned CurOp = 2;
		SmallVector<SDValue, 6> Operands;
		Operands.push_back(Node->getOperand(CurOp++)); // Store value.
		Operands.push_back(Node->getOperand(CurOp++)); // Base pointer.
		Operands.push_back(Node->getOperand(CurOp++)); // Index.
		MVT IndexVT = Operands.back()->getSimpleValueType(0);
		if (IsMasked)
		Operands.push_back(Node->getOperand(CurOp++)); // Mask.
		SDValue VL;
		selectVLOp(Node->getOperand(CurOp++), VL);
		Operands.push_back(VL);
		Operands.push_back(SEW);
		Operands.push_back(Node->getOperand(0)); // Chain.

		assert(VT.getVectorElementCount() == IndexVT.getVectorElementCount() &&
		"Element count mismatch");

		RISCVVLMUL LMUL = getLMUL(VT);
		RISCVVLMUL IndexLMUL = getLMUL(IndexVT);
		unsigned IndexScalarSize = IndexVT.getScalarSizeInBits();
		const RISCV::VLX_VSXPseudo *P = RISCV::getVSXPseudo(
		IsMasked, IsOrdered, IndexScalarSize, static_cast<unsigned>(LMUL),
		static_cast<unsigned>(IndexLMUL));
		SDNode *Store =
		CurDAG->getMachineNode(P->Pseudo, DL, Node->getVTList(), Operands);
		ReplaceNode(Node, Store);
		return;
		}
}		}
break;		break;
}		}
case ISD::BITCAST:		case ISD::BITCAST:
// Just drop bitcasts between scalable vectors.		// Just drop bitcasts between scalable vectors.
if (VT.isScalableVector() &&		if (VT.isScalableVector() &&
Node->getOperand(0).getSimpleValueType().isScalableVector()) {		Node->getOperand(0).getSimpleValueType().isScalableVector()) {
ReplaceUses(SDValue(Node, 0), Node->getOperand(0));		ReplaceUses(SDValue(Node, 0), Node->getOperand(0));
▲ Show 20 Lines • Show All 478 Lines • Show Last 20 Lines

llvm/lib/Target/RISCV/RISCVInstrInfoVPseudos.td

Show First 20 Lines • Show All 407 Lines • ▼ Show 20 Lines
def RISCVVIntrinsicsTable : GenericTable {		def RISCVVIntrinsicsTable : GenericTable {
let FilterClass = "RISCVVIntrinsic";		let FilterClass = "RISCVVIntrinsic";
let CppTypeName = "RISCVVIntrinsicInfo";		let CppTypeName = "RISCVVIntrinsicInfo";
let Fields = ["IntrinsicID", "ExtendOperand"];		let Fields = ["IntrinsicID", "ExtendOperand"];
let PrimaryKey = ["IntrinsicID"];		let PrimaryKey = ["IntrinsicID"];
let PrimaryKeyName = "getRISCVVIntrinsicInfo";		let PrimaryKeyName = "getRISCVVIntrinsicInfo";
}		}

		class RISCVVLX<bit M, bit O, bits<7> S, bits<3> L, bits<3> IL> {
		bits<1> Masked = M;
		bits<1> Ordered = O;
		bits<7> SEW = S;
		bits<3> LMUL = L;
		bits<3> IndexLMUL = IL;
		Pseudo Pseudo = !cast<Pseudo>(NAME);
		}

		def RISCVVLXTable : GenericTable {
		let FilterClass = "RISCVVLX";
		let CppTypeName = "VLX_VSXPseudo";
		let Fields = ["Masked", "Ordered", "SEW", "LMUL", "IndexLMUL", "Pseudo"];
		let PrimaryKey = ["Masked", "Ordered", "SEW", "LMUL", "IndexLMUL"];
		let PrimaryKeyName = "getVLXPseudo";
		}

		class RISCVVSX<bit M, bit O, bits<7> S, bits<3> L, bits<3> IL> {
		bits<1> Masked = M;
		bits<1> Ordered = O;
		bits<7> SEW = S;
		bits<3> LMUL = L;
		bits<3> IndexLMUL = IL;
		Pseudo Pseudo = !cast<Pseudo>(NAME);
		}

		def RISCVVSXTable : GenericTable {
		let FilterClass = "RISCVVSX";
		let CppTypeName = "VLX_VSXPseudo";
		let Fields = ["Masked", "Ordered", "SEW", "LMUL", "IndexLMUL", "Pseudo"];
		let PrimaryKey = ["Masked", "Ordered", "SEW", "LMUL", "IndexLMUL"];
		let PrimaryKeyName = "getVSXPseudo";
		}

class RISCVVLSEG<bits<4> N, bit M, bit Str, bit F, bits<7> S, bits<3> L> {		class RISCVVLSEG<bits<4> N, bit M, bit Str, bit F, bits<7> S, bits<3> L> {
bits<4> NF = N;		bits<4> NF = N;
bits<1> Masked = M;		bits<1> Masked = M;
bits<1> Strided = Str;		bits<1> Strided = Str;
bits<1> FF = F;		bits<1> FF = F;
bits<7> SEW = S;		bits<7> SEW = S;
bits<3> LMUL = L;		bits<3> LMUL = L;
Pseudo Pseudo = !cast<Pseudo>(NAME);		Pseudo Pseudo = !cast<Pseudo>(NAME);
▲ Show 20 Lines • Show All 187 Lines • ▼ Show 20 Lines	class VPseudoSLoadMask<VReg RetClass>:
let Constraints = "$rd = $merge";		let Constraints = "$rd = $merge";
let Uses = [VL, VTYPE];		let Uses = [VL, VTYPE];
let HasVLOp = 1;		let HasVLOp = 1;
let HasSEWOp = 1;		let HasSEWOp = 1;
let HasMergeOp = 1;		let HasMergeOp = 1;
let BaseInstr = !cast<Instruction>(PseudoToVInst<NAME>.VInst);		let BaseInstr = !cast<Instruction>(PseudoToVInst<NAME>.VInst);
}		}

class VPseudoILoadNoMask<VReg RetClass, VReg IdxClass>:		class VPseudoILoadNoMask<VReg RetClass, VReg IdxClass, bits<7> EEW, bits<3> LMUL,
		bit Ordered>:
Pseudo<(outs RetClass:$rd),		Pseudo<(outs RetClass:$rd),
(ins GPR:$rs1, IdxClass:$rs2, GPR:$vl, ixlenimm:$sew),[]>,		(ins GPR:$rs1, IdxClass:$rs2, GPR:$vl, ixlenimm:$sew),[]>,
RISCVVPseudo {		RISCVVPseudo,
		RISCVVLX</Masked/0, Ordered, EEW, VLMul, LMUL> {
let mayLoad = 1;		let mayLoad = 1;
let mayStore = 0;		let mayStore = 0;
let hasSideEffects = 0;		let hasSideEffects = 0;
let usesCustomInserter = 1;		let usesCustomInserter = 1;
let Uses = [VL, VTYPE];		let Uses = [VL, VTYPE];
let HasVLOp = 1;		let HasVLOp = 1;
let HasSEWOp = 1;		let HasSEWOp = 1;
let HasDummyMask = 1;		let HasDummyMask = 1;
let BaseInstr = !cast<Instruction>(PseudoToVInst<NAME>.VInst);		let BaseInstr = !cast<Instruction>(PseudoToVInst<NAME>.VInst);
}		}

class VPseudoILoadMask<VReg RetClass, VReg IdxClass>:		class VPseudoILoadMask<VReg RetClass, VReg IdxClass, bits<7> EEW, bits<3> LMUL,
		bit Ordered>:
Pseudo<(outs GetVRegNoV0<RetClass>.R:$rd),		Pseudo<(outs GetVRegNoV0<RetClass>.R:$rd),
(ins GetVRegNoV0<RetClass>.R:$merge,		(ins GetVRegNoV0<RetClass>.R:$merge,
GPR:$rs1, IdxClass:$rs2,		GPR:$rs1, IdxClass:$rs2,
VMaskOp:$vm, GPR:$vl, ixlenimm:$sew),[]>,		VMaskOp:$vm, GPR:$vl, ixlenimm:$sew),[]>,
RISCVVPseudo {		RISCVVPseudo,
		RISCVVLX</Masked/1, Ordered, EEW, VLMul, LMUL> {
let mayLoad = 1;		let mayLoad = 1;
let mayStore = 0;		let mayStore = 0;
let hasSideEffects = 0;		let hasSideEffects = 0;
let usesCustomInserter = 1;		let usesCustomInserter = 1;
let Constraints = "$rd = $merge";		let Constraints = "$rd = $merge";
let Uses = [VL, VTYPE];		let Uses = [VL, VTYPE];
let HasVLOp = 1;		let HasVLOp = 1;
let HasSEWOp = 1;		let HasSEWOp = 1;
▲ Show 20 Lines • Show All 224 Lines • ▼ Show 20 Lines	class VPseudoBinaryNoMask<VReg RetClass,
let Constraints = Constraint;		let Constraints = Constraint;
let Uses = [VL, VTYPE];		let Uses = [VL, VTYPE];
let HasVLOp = 1;		let HasVLOp = 1;
let HasSEWOp = 1;		let HasSEWOp = 1;
let HasDummyMask = 1;		let HasDummyMask = 1;
let BaseInstr = !cast<Instruction>(PseudoToVInst<NAME>.VInst);		let BaseInstr = !cast<Instruction>(PseudoToVInst<NAME>.VInst);
}		}

class VPseudoIStoreNoMask<VReg StClass, VReg IdxClass>:		class VPseudoIStoreNoMask<VReg StClass, VReg IdxClass, bits<7> EEW, bits<3> LMUL,
		bit Ordered>:
Pseudo<(outs),		Pseudo<(outs),
(ins StClass:$rd, GPR:$rs1, IdxClass:$rs2, GPR:$vl, ixlenimm:$sew),[]>,		(ins StClass:$rd, GPR:$rs1, IdxClass:$rs2, GPR:$vl, ixlenimm:$sew),[]>,
RISCVVPseudo {		RISCVVPseudo,
		RISCVVSX</Masked/0, Ordered, EEW, VLMul, LMUL> {
let mayLoad = 0;		let mayLoad = 0;
let mayStore = 1;		let mayStore = 1;
let hasSideEffects = 0;		let hasSideEffects = 0;
let usesCustomInserter = 1;		let usesCustomInserter = 1;
let Uses = [VL, VTYPE];		let Uses = [VL, VTYPE];
let HasVLOp = 1;		let HasVLOp = 1;
let HasSEWOp = 1;		let HasSEWOp = 1;
let HasDummyMask = 1;		let HasDummyMask = 1;
let BaseInstr = !cast<Instruction>(PseudoToVInst<NAME>.VInst);		let BaseInstr = !cast<Instruction>(PseudoToVInst<NAME>.VInst);
}		}

class VPseudoIStoreMask<VReg StClass, VReg IdxClass>:		class VPseudoIStoreMask<VReg StClass, VReg IdxClass, bits<7> EEW, bits<3> LMUL,
		bit Ordered>:
Pseudo<(outs),		Pseudo<(outs),
(ins StClass:$rd, GPR:$rs1, IdxClass:$rs2, VMaskOp:$vm, GPR:$vl, ixlenimm:$sew),[]>,		(ins StClass:$rd, GPR:$rs1, IdxClass:$rs2, VMaskOp:$vm, GPR:$vl, ixlenimm:$sew),[]>,
RISCVVPseudo {		RISCVVPseudo,
		RISCVVSX</Masked/1, Ordered, EEW, VLMul, LMUL> {
let mayLoad = 0;		let mayLoad = 0;
let mayStore = 1;		let mayStore = 1;
let hasSideEffects = 0;		let hasSideEffects = 0;
let usesCustomInserter = 1;		let usesCustomInserter = 1;
let Uses = [VL, VTYPE];		let Uses = [VL, VTYPE];
let HasVLOp = 1;		let HasVLOp = 1;
let HasSEWOp = 1;		let HasSEWOp = 1;
let BaseInstr = !cast<Instruction>(PseudoToVInst<NAME>.VInst);		let BaseInstr = !cast<Instruction>(PseudoToVInst<NAME>.VInst);
▲ Show 20 Lines • Show All 372 Lines • ▼ Show 20 Lines	foreach lmul = MxSet<eew>.m in {
let VLMul = lmul.value in {		let VLMul = lmul.value in {
def "E" # eew # "_V_" # LInfo : VPseudoSLoadNoMask<vreg>;		def "E" # eew # "_V_" # LInfo : VPseudoSLoadNoMask<vreg>;
def "E" # eew # "_V_" # LInfo # "_MASK" : VPseudoSLoadMask<vreg>;		def "E" # eew # "_V_" # LInfo # "_MASK" : VPseudoSLoadMask<vreg>;
}		}
}		}
}		}
}		}

multiclass VPseudoILoad {		multiclass VPseudoILoad<bit Ordered> {
foreach eew = EEWList in {		foreach eew = EEWList in {
foreach sew = EEWList in {		foreach sew = EEWList in {
foreach lmul = MxSet<sew>.m in {		foreach lmul = MxSet<sew>.m in {
defvar octuple_lmul = octuple_from_str<lmul.MX>.ret;		defvar octuple_lmul = octuple_from_str<lmul.MX>.ret;
// Calculate emul = eew * lmul / sew		// Calculate emul = eew * lmul / sew
defvar octuple_emul = !srl(!mul(eew, octuple_lmul), shift_amount<sew>.val);		defvar octuple_emul = !srl(!mul(eew, octuple_lmul), shift_amount<sew>.val);
if !and(!ge(octuple_emul, 1), !le(octuple_emul, 64)) then {		if !and(!ge(octuple_emul, 1), !le(octuple_emul, 64)) then {
defvar LInfo = lmul.MX;		defvar LInfo = lmul.MX;
defvar IdxLInfo = octuple_to_str<octuple_emul>.ret;		defvar IdxLInfo = octuple_to_str<octuple_emul>.ret;
defvar idx_lmul = !cast<LMULInfo>("V_" # IdxLInfo);		defvar idx_lmul = !cast<LMULInfo>("V_" # IdxLInfo);
defvar Vreg = lmul.vrclass;		defvar Vreg = lmul.vrclass;
defvar IdxVreg = idx_lmul.vrclass;		defvar IdxVreg = idx_lmul.vrclass;
let VLMul = lmul.value in {		let VLMul = lmul.value in {
def "EI" # eew # "_V_" # IdxLInfo # "_" # LInfo : VPseudoILoadNoMask<Vreg, IdxVreg>;		def "EI" # eew # "_V_" # IdxLInfo # "_" # LInfo :
def "EI" # eew # "_V_" # IdxLInfo # "_" # LInfo # "_MASK" : VPseudoILoadMask<Vreg, IdxVreg>;		VPseudoILoadNoMask<Vreg, IdxVreg, eew, idx_lmul.value, Ordered>;
		def "EI" # eew # "_V_" # IdxLInfo # "_" # LInfo # "_MASK" :
		VPseudoILoadMask<Vreg, IdxVreg, eew, idx_lmul.value, Ordered>;
}		}
}		}
}		}
}		}
}		}
}		}

multiclass VPseudoUSStore {		multiclass VPseudoUSStore {
Show All 25 Lines	foreach lmul = MxSet<eew>.m in {
let VLMul = lmul.value in {		let VLMul = lmul.value in {
def "E" # eew # "_V_" # LInfo : VPseudoSStoreNoMask<vreg>;		def "E" # eew # "_V_" # LInfo : VPseudoSStoreNoMask<vreg>;
def "E" # eew # "_V_" # LInfo # "_MASK" : VPseudoSStoreMask<vreg>;		def "E" # eew # "_V_" # LInfo # "_MASK" : VPseudoSStoreMask<vreg>;
}		}
}		}
}		}
}		}

multiclass VPseudoIStore {		multiclass VPseudoIStore<bit Ordered> {
foreach eew = EEWList in {		foreach eew = EEWList in {
foreach sew = EEWList in {		foreach sew = EEWList in {
foreach lmul = MxSet<sew>.m in {		foreach lmul = MxSet<sew>.m in {
defvar octuple_lmul = octuple_from_str<lmul.MX>.ret;		defvar octuple_lmul = octuple_from_str<lmul.MX>.ret;
// Calculate emul = eew * lmul / sew		// Calculate emul = eew * lmul / sew
defvar octuple_emul = !srl(!mul(eew, octuple_lmul), shift_amount<sew>.val);		defvar octuple_emul = !srl(!mul(eew, octuple_lmul), shift_amount<sew>.val);
if !and(!ge(octuple_emul, 1), !le(octuple_emul, 64)) then {		if !and(!ge(octuple_emul, 1), !le(octuple_emul, 64)) then {
defvar LInfo = lmul.MX;		defvar LInfo = lmul.MX;
defvar IdxLInfo = octuple_to_str<octuple_emul>.ret;		defvar IdxLInfo = octuple_to_str<octuple_emul>.ret;
defvar idx_lmul = !cast<LMULInfo>("V_" # IdxLInfo);		defvar idx_lmul = !cast<LMULInfo>("V_" # IdxLInfo);
defvar Vreg = lmul.vrclass;		defvar Vreg = lmul.vrclass;
defvar IdxVreg = idx_lmul.vrclass;		defvar IdxVreg = idx_lmul.vrclass;
let VLMul = lmul.value in {		let VLMul = lmul.value in {
def "EI" # eew # "_V_" # IdxLInfo # "_" # LInfo :		def "EI" # eew # "_V_" # IdxLInfo # "_" # LInfo :
VPseudoIStoreNoMask<Vreg, IdxVreg>;		VPseudoIStoreNoMask<Vreg, IdxVreg, eew, idx_lmul.value, Ordered>;
def "EI" # eew # "_V_" # IdxLInfo # "_" # LInfo # "_MASK" :		def "EI" # eew # "_V_" # IdxLInfo # "_" # LInfo # "_MASK" :
VPseudoIStoreMask<Vreg, IdxVreg>;		VPseudoIStoreMask<Vreg, IdxVreg, eew, idx_lmul.value, Ordered>;
}		}
}		}
}		}
}		}
}		}
}		}

multiclass VPseudoUnaryS_M {		multiclass VPseudoUnaryS_M {
▲ Show 20 Lines • Show All 1,888 Lines • ▼ Show 20 Lines
defm PseudoVLS : VPseudoSLoad;		defm PseudoVLS : VPseudoSLoad;
defm PseudoVSS : VPseudoSStore;		defm PseudoVSS : VPseudoSStore;

//===----------------------------------------------------------------------===//		//===----------------------------------------------------------------------===//
// 7.6 Vector Indexed Instructions		// 7.6 Vector Indexed Instructions
//===----------------------------------------------------------------------===//		//===----------------------------------------------------------------------===//

// Vector Indexed Loads and Stores		// Vector Indexed Loads and Stores
defm PseudoVLUX : VPseudoILoad;		defm PseudoVLUX : VPseudoILoad</Ordered=/false>;
defm PseudoVLOX : VPseudoILoad;		defm PseudoVLOX : VPseudoILoad</Ordered=/true>;
defm PseudoVSOX : VPseudoIStore;		defm PseudoVSOX : VPseudoIStore</Ordered=/true>;
defm PseudoVSUX : VPseudoIStore;		defm PseudoVSUX : VPseudoIStore</Ordered=/false>;

//===----------------------------------------------------------------------===//		//===----------------------------------------------------------------------===//
// 7.7. Unit-stride Fault-Only-First Loads		// 7.7. Unit-stride Fault-Only-First Loads
//===----------------------------------------------------------------------===//		//===----------------------------------------------------------------------===//

// vleff may update VL register		// vleff may update VL register
let hasSideEffects = 1, Defs = [VL] in		let hasSideEffects = 1, Defs = [VL] in
defm PseudoVL : VPseudoUSLoad</isFF=/true>;		defm PseudoVL : VPseudoUSLoad</isFF=/true>;
▲ Show 20 Lines • Show All 561 Lines • ▼ Show 20 Lines	foreach vti = AllVectors in
defm : VPatSLoad<"int_riscv_vlse",		defm : VPatSLoad<"int_riscv_vlse",
"PseudoVLSE" # vti.SEW,		"PseudoVLSE" # vti.SEW,
vti.Vector, vti.Mask, vti.SEW, vti.LMul, vti.RegClass>;		vti.Vector, vti.Mask, vti.SEW, vti.LMul, vti.RegClass>;
defm : VPatSStore<"int_riscv_vsse",		defm : VPatSStore<"int_riscv_vsse",
"PseudoVSSE" # vti.SEW,		"PseudoVSSE" # vti.SEW,
vti.Vector, vti.Mask, vti.SEW, vti.LMul, vti.RegClass>;		vti.Vector, vti.Mask, vti.SEW, vti.LMul, vti.RegClass>;
}		}

//===----------------------------------------------------------------------===//
// 7.6 Vector Indexed Instructions
//===----------------------------------------------------------------------===//

foreach vti = AllVectors in
foreach eew = EEWList in {
defvar vlmul = vti.LMul;
defvar octuple_lmul = octuple_from_str<vti.LMul.MX>.ret;
defvar log_sew = shift_amount<vti.SEW>.val;
// The data vector register group has EEW=SEW, EMUL=LMUL, while the offset
// vector register group has EEW encoding in the instruction and EMUL=(EEW/SEW)*LMUL.
// calculate octuple elmul which is (eew * octuple_lmul) >> log_sew
defvar octuple_elmul = !srl(!mul(eew, octuple_lmul), log_sew);
// legal octuple elmul should be more than 0 and less than equal 64
if !gt(octuple_elmul, 0) then {
if !le(octuple_elmul, 64) then {
defvar elmul_str = octuple_to_str<octuple_elmul>.ret;
defvar elmul =!cast<LMULInfo>("V_" # elmul_str);
defvar idx_vti = !cast<VTypeInfo>("VI" # eew # elmul_str);

defm : VPatILoad<"int_riscv_vluxei",
"PseudoVLUXEI"#eew,
vti.Vector, idx_vti.Vector, vti.Mask, vti.SEW,
vlmul, elmul, vti.RegClass, idx_vti.RegClass>;
defm : VPatILoad<"int_riscv_vloxei",
"PseudoVLOXEI"#eew,
vti.Vector, idx_vti.Vector, vti.Mask, vti.SEW,
vlmul, elmul, vti.RegClass, idx_vti.RegClass>;
defm : VPatIStore<"int_riscv_vsoxei",
"PseudoVSOXEI"#eew,
vti.Vector, idx_vti.Vector, vti.Mask, vti.SEW,
vlmul, elmul, vti.RegClass, idx_vti.RegClass>;
defm : VPatIStore<"int_riscv_vsuxei",
"PseudoVSUXEI"#eew,
vti.Vector, idx_vti.Vector, vti.Mask, vti.SEW,
vlmul, elmul, vti.RegClass, idx_vti.RegClass>;
}
}
}
} // Predicates = [HasStdExtV]		} // Predicates = [HasStdExtV]

//===----------------------------------------------------------------------===//		//===----------------------------------------------------------------------===//
// 8. Vector AMO Operations		// 8. Vector AMO Operations
//===----------------------------------------------------------------------===//		//===----------------------------------------------------------------------===//
let Predicates = [HasStdExtZvamo] in {		let Predicates = [HasStdExtZvamo] in {
defm "" : VPatAMOV_WD<"int_riscv_vamoswap", "PseudoVAMOSWAP", AllIntegerVectors>;		defm "" : VPatAMOV_WD<"int_riscv_vamoswap", "PseudoVAMOSWAP", AllIntegerVectors>;
defm "" : VPatAMOV_WD<"int_riscv_vamoadd", "PseudoVAMOADD", AllIntegerVectors>;		defm "" : VPatAMOV_WD<"int_riscv_vamoadd", "PseudoVAMOADD", AllIntegerVectors>;
▲ Show 20 Lines • Show All 592 Lines • Show Last 20 Lines