This is an archive of the discontinued LLVM Phabricator instance.

Paths

Table of Contentst

-
llvm/
-
lib/Target/RISCV/
-
Target/
-
RISCV/
2
RISCVInsertVSETVLI.cpp
-
test/CodeGen/RISCV/rvv/
-
CodeGen/
-
RISCV/
-
rvv/
-
fixed-vectors-fp-conv.ll
-
fixed-vectors-fp-shuffles.ll
-
fixed-vectors-fp.ll
-
fixed-vectors-fp2i.ll
-
fixed-vectors-vwmul.ll
-
fixed-vectors-vwmulu.ll

Differential D106601

[RISCV] Teach vsetvli insertion pass that it doesn't need to insert vsetvli for unit-stride or strided loads/stores in some cases.
ClosedPublic

Authored by craig.topper on Jul 22 2021, 2:51 PM.

Download Raw Diff

Details

Reviewers

frasercrmck
rogfer01
khchen
HsiangKai
arcbbb
evandro

Commits

rG79fbddbea0c6: [RISCV] Teach vsetvli insertion pass that it doesn't need to insert vsetvli for…

Summary

For unit-stride and strided load/stores we set the SEW operand of
the pseudo instruction equal the EEW in the opcode. The LMUL
of the pseudo instruction is the LMUL we want.

These instructions calculate EMUL=(EEW/SEW) * LMUL. We can use
this to avoid changing vtype if the SEW/LMUL of the previous
vtype matches the EEW/EMUL ratio we need for the instruction.

Due to how the global analysis works, we can only do this
optimization when the previous vsetvli was produced in the block
containing the store. We need to know in the first phase if the
vsetvli will be inserted so we can propagate information to
the successors in the second phase correctly. This means we can't
depend on predecessors.

Diff Detail

Repository: rG LLVM Github Monorepo

Event Timeline

craig.topper created this revision.Jul 22 2021, 2:51 PM

Herald added subscribers: StephenFan, vkmr, luismarques and 23 others. · View Herald TranscriptJul 22 2021, 2:51 PM

craig.topper requested review of this revision.Jul 22 2021, 2:51 PM

Herald added a project: Restricted Project. · View Herald TranscriptJul 22 2021, 2:51 PM

Herald added a subscriber: MaskRay. · View Herald Transcript

Harbormaster completed remote builds in B115703: Diff 360986.Jul 22 2021, 5:21 PM

I'm curious: why can't we apply a similar approach to loads as well? Don't they compute the EEW and EMUL in a similar way?

Also I think this could be applied to non-unit stride. I understand indexed memory accesses are the odd ones here.

vsetivli zero, 2, e32, mf2, ta, mu
vle32.v v25, (a0)
vfwcvt.rtz.xu.f.v v26, v25
vsetvli zero, zero, e64, m1, ta, mu
# the previous vsetvli can be removed because
# a vle64 under SEW=32 and LMUL=1/2
# will be executed as
# EEW=64
# EMUL=(EEW/SEW) * LMUL=(64/32)*(1/2)=1
vle64.v v26, (a1)

-Add loads
-Add strided loads/stores
-Add missing check for AVL being the same.

craig.topper retitled this revision from [RISCV] Teach vsetvli insertion pass that it doesn't need to insert vsetvli for unit strided stores in some cases. to [RISCV] Teach vsetvli insertion pass that it doesn't need to insert vsetvli for unit-stride or strided loads/stores in some cases..Jul 28 2021, 9:54 AM

craig.topper edited the summary of this revision. (Show Details)

In D106601#2909717, @rogfer01 wrote:

I'm curious: why can't we apply a similar approach to loads as well? Don't they compute the EEW and EMUL in a similar way?

I initially didn't do it because I figured in most cases you'd still end up with a vsetvli after the load anyway. But there do seem to be some improvements in the test changes so I've added it.

Also I think this could be applied to non-unit stride. I understand indexed memory accesses are the odd ones here.

You're right. I've added those now. I think we could also do segment load/stores, but I think the switch statement would become even more ridiculous and we should move to TSFlags. So I'd like to look at that as a follow up.

vsetivli zero, 2, e32, mf2, ta, mu
vle32.v v25, (a0)
vfwcvt.rtz.xu.f.v v26, v25
vsetvli zero, zero, e64, m1, ta, mu
# the previous vsetvli can be removed because
# a vle64 under SEW=32 and LMUL=1/2
# will be executed as
# EEW=64
# EMUL=(EEW/SEW) * LMUL=(64/32)*(1/2)=1
vle64.v v26, (a1)

Harbormaster completed remote builds in B116727: Diff 362432.Jul 28 2021, 12:08 PM

Ping

Sorry for the delay. LGTM.

You're right. I've added those now. I think we could also do segment load/stores, but I think the switch statement would become even more ridiculous and we should move to TSFlags. So I'd like to look at that as a follow up.

Sure, thanks!

This revision is now accepted and ready to land.Aug 11 2021, 11:15 PM

rogfer01 added inline comments.Aug 11 2021, 11:18 PM

llvm/lib/Target/RISCV/RISCVInsertVSETVLI.cpp
764–770	I think this comment block may need updating `store` → `load/store`.
923–929	Ditto.

Closed by commit rG79fbddbea0c6: [RISCV] Teach vsetvli insertion pass that it doesn't need to insert vsetvli for… (authored by craig.topper). · Explain WhyAug 12 2021, 10:06 AM

This revision was automatically updated to reflect the committed changes.

craig.topper added a commit: rG79fbddbea0c6: [RISCV] Teach vsetvli insertion pass that it doesn't need to insert vsetvli for….

Revision Contents

Path

Size

llvm/

lib/

Target/

RISCV/

RISCVInsertVSETVLI.cpp

246 lines

test/

CodeGen/

RISCV/

rvv/

fixed-vectors-fp-conv.ll

6 lines

fixed-vectors-fp-shuffles.ll

5 lines

fixed-vectors-fp.ll

18 lines

fixed-vectors-fp2i.ll

8 lines

fixed-vectors-vwmul.ll

12 lines

fixed-vectors-vwmulu.ll

12 lines

Diff 366025

llvm/lib/Target/RISCV/RISCVInsertVSETVLI.cpp

Show First 20 Lines • Show All 142 Lines • ▼ Show 20 Lines	assert(!isUnknown() && !Other.isUnknown() &&
"Can't compare VTYPE in unknown state");		"Can't compare VTYPE in unknown state");
assert(!SEWLMULRatioOnly && !Other.SEWLMULRatioOnly &&		assert(!SEWLMULRatioOnly && !Other.SEWLMULRatioOnly &&
"Can't compare when only LMUL/SEW ratio is valid.");		"Can't compare when only LMUL/SEW ratio is valid.");
return std::tie(VLMul, SEW, TailAgnostic, MaskAgnostic) ==		return std::tie(VLMul, SEW, TailAgnostic, MaskAgnostic) ==
std::tie(Other.VLMul, Other.SEW, Other.TailAgnostic,		std::tie(Other.VLMul, Other.SEW, Other.TailAgnostic,
Other.MaskAgnostic);		Other.MaskAgnostic);
}		}

// Convert VLMUL to a fixed point value with 3 bits of fraction.		static unsigned getSEWLMULRatio(unsigned SEW, RISCVII::VLMUL VLMul) {
unsigned getSEWLMULRatio() const {
assert(isValid() && !isUnknown() &&
"Can't use VTYPE for uninitialized or unknown");
unsigned LMul;		unsigned LMul;
bool Fractional;		bool Fractional;
std::tie(LMul, Fractional) = RISCVVType::decodeVLMUL(VLMul);		std::tie(LMul, Fractional) = RISCVVType::decodeVLMUL(VLMul);

// Convert LMul to a fixed point value with 3 fractional bits.		// Convert LMul to a fixed point value with 3 fractional bits.
LMul = Fractional ? (8 / LMul) : (LMul * 8);		LMul = Fractional ? (8 / LMul) : (LMul * 8);

assert(SEW >= 8 && "Unexpected SEW value");		assert(SEW >= 8 && "Unexpected SEW value");
return (SEW * 8) / LMul;		return (SEW * 8) / LMul;
}		}

		unsigned getSEWLMULRatio() const {
		assert(isValid() && !isUnknown() &&
		"Can't use VTYPE for uninitialized or unknown");
		return getSEWLMULRatio(SEW, VLMul);
		}

// Check if the VTYPE for these two VSETVLIInfos produce the same VLMAX.		// Check if the VTYPE for these two VSETVLIInfos produce the same VLMAX.
bool hasSameVLMAX(const VSETVLIInfo &Other) const {		bool hasSameVLMAX(const VSETVLIInfo &Other) const {
assert(isValid() && Other.isValid() &&		assert(isValid() && Other.isValid() &&
"Can't compare invalid VSETVLIInfos");		"Can't compare invalid VSETVLIInfos");
assert(!isUnknown() && !Other.isUnknown() &&		assert(!isUnknown() && !Other.isUnknown() &&
"Can't compare VTYPE in unknown state");		"Can't compare VTYPE in unknown state");
return getSEWLMULRatio() == Other.getSEWLMULRatio();		return getSEWLMULRatio() == Other.getSEWLMULRatio();
}		}
Show All 29 Lines	if (!hasSameVTYPE(InstrInfo) &&
!(InstrInfo.MaskRegOp && hasSameVLMAX(InstrInfo) &&		!(InstrInfo.MaskRegOp && hasSameVLMAX(InstrInfo) &&
TailAgnostic == InstrInfo.TailAgnostic &&		TailAgnostic == InstrInfo.TailAgnostic &&
MaskAgnostic == InstrInfo.MaskAgnostic))		MaskAgnostic == InstrInfo.MaskAgnostic))
return false;		return false;

return hasSameAVL(InstrInfo);		return hasSameAVL(InstrInfo);
}		}

		bool isCompatibleWithLoadStoreEEW(unsigned EEW,
		const VSETVLIInfo &InstrInfo) const {
		assert(isValid() && InstrInfo.isValid() &&
		"Can't compare invalid VSETVLIInfos");
		assert(!InstrInfo.SEWLMULRatioOnly &&
		"Expected a valid VTYPE for instruction!");
		assert(EEW == InstrInfo.SEW && "Mismatched EEW/SEW for store");

		if (isUnknown() \|\| hasSEWLMULRatioOnly())
		return false;

		if (!hasSameAVL(InstrInfo))
		return false;

		// TODO: This check isn't required for stores. But we should ignore for all
		// stores not just unit-stride and strided so leaving it for now.
		if (TailAgnostic != InstrInfo.TailAgnostic \|\|
		MaskAgnostic != InstrInfo.MaskAgnostic)
		return false;

		return getSEWLMULRatio() == getSEWLMULRatio(EEW, InstrInfo.VLMul);
		}

bool operator==(const VSETVLIInfo &Other) const {		bool operator==(const VSETVLIInfo &Other) const {
// Uninitialized is only equal to another Uninitialized.		// Uninitialized is only equal to another Uninitialized.
if (!isValid())		if (!isValid())
return !Other.isValid();		return !Other.isValid();
if (!Other.isValid())		if (!Other.isValid())
return !isValid();		return !isValid();

// Unknown is only equal to another Unknown.		// Unknown is only equal to another Unknown.
▲ Show 20 Lines • Show All 291 Lines • ▼ Show 20 Lines	if (MachineInstr *DefMI = MRI->getVRegDef(Require.getAVLReg())) {
return false;		return false;
}		}
}		}
}		}

return true;		return true;
}		}

		bool canSkipVSETVLIForLoadStore(const MachineInstr &MI,
		const VSETVLIInfo &Require,
		const VSETVLIInfo &CurInfo) {
		unsigned EEW;
		switch (MI.getOpcode()) {
		default:
		return false;
		case RISCV::PseudoVLE8_V_M1:
		case RISCV::PseudoVLE8_V_M1_MASK:
		case RISCV::PseudoVLE8_V_M2:
		case RISCV::PseudoVLE8_V_M2_MASK:
		case RISCV::PseudoVLE8_V_M4:
		case RISCV::PseudoVLE8_V_M4_MASK:
		case RISCV::PseudoVLE8_V_M8:
		case RISCV::PseudoVLE8_V_M8_MASK:
		case RISCV::PseudoVLE8_V_MF2:
		case RISCV::PseudoVLE8_V_MF2_MASK:
		case RISCV::PseudoVLE8_V_MF4:
		case RISCV::PseudoVLE8_V_MF4_MASK:
		case RISCV::PseudoVLE8_V_MF8:
		case RISCV::PseudoVLE8_V_MF8_MASK:
		case RISCV::PseudoVLSE8_V_M1:
		case RISCV::PseudoVLSE8_V_M1_MASK:
		case RISCV::PseudoVLSE8_V_M2:
		case RISCV::PseudoVLSE8_V_M2_MASK:
		case RISCV::PseudoVLSE8_V_M4:
		case RISCV::PseudoVLSE8_V_M4_MASK:
		case RISCV::PseudoVLSE8_V_M8:
		case RISCV::PseudoVLSE8_V_M8_MASK:
		case RISCV::PseudoVLSE8_V_MF2:
		case RISCV::PseudoVLSE8_V_MF2_MASK:
		case RISCV::PseudoVLSE8_V_MF4:
		case RISCV::PseudoVLSE8_V_MF4_MASK:
		case RISCV::PseudoVLSE8_V_MF8:
		case RISCV::PseudoVLSE8_V_MF8_MASK:
		case RISCV::PseudoVSE8_V_M1:
		case RISCV::PseudoVSE8_V_M1_MASK:
		case RISCV::PseudoVSE8_V_M2:
		case RISCV::PseudoVSE8_V_M2_MASK:
		case RISCV::PseudoVSE8_V_M4:
		case RISCV::PseudoVSE8_V_M4_MASK:
		case RISCV::PseudoVSE8_V_M8:
		case RISCV::PseudoVSE8_V_M8_MASK:
		case RISCV::PseudoVSE8_V_MF2:
		case RISCV::PseudoVSE8_V_MF2_MASK:
		case RISCV::PseudoVSE8_V_MF4:
		case RISCV::PseudoVSE8_V_MF4_MASK:
		case RISCV::PseudoVSE8_V_MF8:
		case RISCV::PseudoVSE8_V_MF8_MASK:
		case RISCV::PseudoVSSE8_V_M1:
		case RISCV::PseudoVSSE8_V_M1_MASK:
		case RISCV::PseudoVSSE8_V_M2:
		case RISCV::PseudoVSSE8_V_M2_MASK:
		case RISCV::PseudoVSSE8_V_M4:
		case RISCV::PseudoVSSE8_V_M4_MASK:
		case RISCV::PseudoVSSE8_V_M8:
		case RISCV::PseudoVSSE8_V_M8_MASK:
		case RISCV::PseudoVSSE8_V_MF2:
		case RISCV::PseudoVSSE8_V_MF2_MASK:
		case RISCV::PseudoVSSE8_V_MF4:
		case RISCV::PseudoVSSE8_V_MF4_MASK:
		case RISCV::PseudoVSSE8_V_MF8:
		case RISCV::PseudoVSSE8_V_MF8_MASK:
		EEW = 8;
		break;
		case RISCV::PseudoVLE16_V_M1:
		case RISCV::PseudoVLE16_V_M1_MASK:
		case RISCV::PseudoVLE16_V_M2:
		case RISCV::PseudoVLE16_V_M2_MASK:
		case RISCV::PseudoVLE16_V_M4:
		case RISCV::PseudoVLE16_V_M4_MASK:
		case RISCV::PseudoVLE16_V_M8:
		case RISCV::PseudoVLE16_V_M8_MASK:
		case RISCV::PseudoVLE16_V_MF2:
		case RISCV::PseudoVLE16_V_MF2_MASK:
		case RISCV::PseudoVLE16_V_MF4:
		case RISCV::PseudoVLE16_V_MF4_MASK:
		case RISCV::PseudoVLSE16_V_M1:
		case RISCV::PseudoVLSE16_V_M1_MASK:
		case RISCV::PseudoVLSE16_V_M2:
		case RISCV::PseudoVLSE16_V_M2_MASK:
		case RISCV::PseudoVLSE16_V_M4:
		case RISCV::PseudoVLSE16_V_M4_MASK:
		case RISCV::PseudoVLSE16_V_M8:
		case RISCV::PseudoVLSE16_V_M8_MASK:
		case RISCV::PseudoVLSE16_V_MF2:
		case RISCV::PseudoVLSE16_V_MF2_MASK:
		case RISCV::PseudoVLSE16_V_MF4:
		case RISCV::PseudoVLSE16_V_MF4_MASK:
		case RISCV::PseudoVSE16_V_M1:
		case RISCV::PseudoVSE16_V_M1_MASK:
		case RISCV::PseudoVSE16_V_M2:
		case RISCV::PseudoVSE16_V_M2_MASK:
		case RISCV::PseudoVSE16_V_M4:
		case RISCV::PseudoVSE16_V_M4_MASK:
		case RISCV::PseudoVSE16_V_M8:
		case RISCV::PseudoVSE16_V_M8_MASK:
		case RISCV::PseudoVSE16_V_MF2:
		case RISCV::PseudoVSE16_V_MF2_MASK:
		case RISCV::PseudoVSE16_V_MF4:
		case RISCV::PseudoVSE16_V_MF4_MASK:
		case RISCV::PseudoVSSE16_V_M1:
		case RISCV::PseudoVSSE16_V_M1_MASK:
		case RISCV::PseudoVSSE16_V_M2:
		case RISCV::PseudoVSSE16_V_M2_MASK:
		case RISCV::PseudoVSSE16_V_M4:
		case RISCV::PseudoVSSE16_V_M4_MASK:
		case RISCV::PseudoVSSE16_V_M8:
		case RISCV::PseudoVSSE16_V_M8_MASK:
		case RISCV::PseudoVSSE16_V_MF2:
		case RISCV::PseudoVSSE16_V_MF2_MASK:
		case RISCV::PseudoVSSE16_V_MF4:
		case RISCV::PseudoVSSE16_V_MF4_MASK:
		EEW = 16;
		break;
		case RISCV::PseudoVLE32_V_M1:
		case RISCV::PseudoVLE32_V_M1_MASK:
		case RISCV::PseudoVLE32_V_M2:
		case RISCV::PseudoVLE32_V_M2_MASK:
		case RISCV::PseudoVLE32_V_M4:
		case RISCV::PseudoVLE32_V_M4_MASK:
		case RISCV::PseudoVLE32_V_M8:
		case RISCV::PseudoVLE32_V_M8_MASK:
		case RISCV::PseudoVLE32_V_MF2:
		case RISCV::PseudoVLE32_V_MF2_MASK:
		case RISCV::PseudoVLSE32_V_M1:
		case RISCV::PseudoVLSE32_V_M1_MASK:
		case RISCV::PseudoVLSE32_V_M2:
		case RISCV::PseudoVLSE32_V_M2_MASK:
		case RISCV::PseudoVLSE32_V_M4:
		case RISCV::PseudoVLSE32_V_M4_MASK:
		case RISCV::PseudoVLSE32_V_M8:
		case RISCV::PseudoVLSE32_V_M8_MASK:
		case RISCV::PseudoVLSE32_V_MF2:
		case RISCV::PseudoVLSE32_V_MF2_MASK:
		case RISCV::PseudoVSE32_V_M1:
		case RISCV::PseudoVSE32_V_M1_MASK:
		case RISCV::PseudoVSE32_V_M2:
		case RISCV::PseudoVSE32_V_M2_MASK:
		case RISCV::PseudoVSE32_V_M4:
		case RISCV::PseudoVSE32_V_M4_MASK:
		case RISCV::PseudoVSE32_V_M8:
		case RISCV::PseudoVSE32_V_M8_MASK:
		case RISCV::PseudoVSE32_V_MF2:
		case RISCV::PseudoVSE32_V_MF2_MASK:
		case RISCV::PseudoVSSE32_V_M1:
		case RISCV::PseudoVSSE32_V_M1_MASK:
		case RISCV::PseudoVSSE32_V_M2:
		case RISCV::PseudoVSSE32_V_M2_MASK:
		case RISCV::PseudoVSSE32_V_M4:
		case RISCV::PseudoVSSE32_V_M4_MASK:
		case RISCV::PseudoVSSE32_V_M8:
		case RISCV::PseudoVSSE32_V_M8_MASK:
		case RISCV::PseudoVSSE32_V_MF2:
		case RISCV::PseudoVSSE32_V_MF2_MASK:
		EEW = 32;
		break;
		case RISCV::PseudoVLE64_V_M1:
		case RISCV::PseudoVLE64_V_M1_MASK:
		case RISCV::PseudoVLE64_V_M2:
		case RISCV::PseudoVLE64_V_M2_MASK:
		case RISCV::PseudoVLE64_V_M4:
		case RISCV::PseudoVLE64_V_M4_MASK:
		case RISCV::PseudoVLE64_V_M8:
		case RISCV::PseudoVLE64_V_M8_MASK:
		case RISCV::PseudoVLSE64_V_M1:
		case RISCV::PseudoVLSE64_V_M1_MASK:
		case RISCV::PseudoVLSE64_V_M2:
		case RISCV::PseudoVLSE64_V_M2_MASK:
		case RISCV::PseudoVLSE64_V_M4:
		case RISCV::PseudoVLSE64_V_M4_MASK:
		case RISCV::PseudoVLSE64_V_M8:
		case RISCV::PseudoVLSE64_V_M8_MASK:
		case RISCV::PseudoVSE64_V_M1:
		case RISCV::PseudoVSE64_V_M1_MASK:
		case RISCV::PseudoVSE64_V_M2:
		case RISCV::PseudoVSE64_V_M2_MASK:
		case RISCV::PseudoVSE64_V_M4:
		case RISCV::PseudoVSE64_V_M4_MASK:
		case RISCV::PseudoVSE64_V_M8:
		case RISCV::PseudoVSE64_V_M8_MASK:
		case RISCV::PseudoVSSE64_V_M1:
		case RISCV::PseudoVSSE64_V_M1_MASK:
		case RISCV::PseudoVSSE64_V_M2:
		case RISCV::PseudoVSSE64_V_M2_MASK:
		case RISCV::PseudoVSSE64_V_M4:
		case RISCV::PseudoVSSE64_V_M4_MASK:
		case RISCV::PseudoVSSE64_V_M8:
		case RISCV::PseudoVSSE64_V_M8_MASK:
		EEW = 64;
		break;
		}

		return CurInfo.isCompatibleWithLoadStoreEEW(EEW, Require);
		}

bool RISCVInsertVSETVLI::computeVLVTYPEChanges(const MachineBasicBlock &MBB) {		bool RISCVInsertVSETVLI::computeVLVTYPEChanges(const MachineBasicBlock &MBB) {
bool HadVectorOp = false;		bool HadVectorOp = false;

BlockData &BBInfo = BlockInfo[MBB.getNumber()];		BlockData &BBInfo = BlockInfo[MBB.getNumber()];
for (const MachineInstr &MI : MBB) {		for (const MachineInstr &MI : MBB) {
// If this is an explicit VSETVLI or VSETIVLI, update our state.		// If this is an explicit VSETVLI or VSETIVLI, update our state.
if (MI.getOpcode() == RISCV::PseudoVSETVLI \|\|		if (MI.getOpcode() == RISCV::PseudoVSETVLI \|\|
MI.getOpcode() == RISCV::PseudoVSETIVLI) {		MI.getOpcode() == RISCV::PseudoVSETIVLI) {
HadVectorOp = true;		HadVectorOp = true;
BBInfo.Change = getInfoForVSETVLI(MI);		BBInfo.Change = getInfoForVSETVLI(MI);
continue;		continue;
}		}

uint64_t TSFlags = MI.getDesc().TSFlags;		uint64_t TSFlags = MI.getDesc().TSFlags;
if (RISCVII::hasSEWOp(TSFlags)) {		if (RISCVII::hasSEWOp(TSFlags)) {
HadVectorOp = true;		HadVectorOp = true;

VSETVLIInfo NewInfo = computeInfoForInstr(MI, TSFlags, MRI);		VSETVLIInfo NewInfo = computeInfoForInstr(MI, TSFlags, MRI);

if (!BBInfo.Change.isValid()) {		if (!BBInfo.Change.isValid()) {
BBInfo.Change = NewInfo;		BBInfo.Change = NewInfo;
} else {		} else {
// If this instruction isn't compatible with the previous VL/VTYPE		// If this instruction isn't compatible with the previous VL/VTYPE
// we need to insert a VSETVLI.		// we need to insert a VSETVLI.
if (needVSETVLI(NewInfo, BBInfo.Change))		// If this is a unit-stride or strided load/store, we may be able to use
		// the EMUL=(EEW/SEW)*LMUL relationship to avoid changing vtype.
		// NOTE: We only do this if the vtype we're comparing against was
		// created in this block. We need the first and third phase to treat
		// the store the same way.
		if (!canSkipVSETVLIForLoadStore(MI, NewInfo, BBInfo.Change) &&
		needVSETVLI(NewInfo, BBInfo.Change))
		rogfer01Unsubmitted Not Done Reply Inline Actions I think this comment block may need updating `store` → `load/store`. rogfer01: I think this comment block may need updating `store` → `load/store`.
BBInfo.Change = NewInfo;		BBInfo.Change = NewInfo;
}		}
}		}

// If this is something that updates VL/VTYPE that we don't know about, set		// If this is something that updates VL/VTYPE that we don't know about, set
// the state to unknown.		// the state to unknown.
if (MI.isCall() \|\| MI.isInlineAsm() \|\| MI.modifiesRegister(RISCV::VL) \|\|		if (MI.isCall() \|\| MI.isInlineAsm() \|\| MI.modifiesRegister(RISCV::VL) \|\|
MI.modifiesRegister(RISCV::VTYPE)) {		MI.modifiesRegister(RISCV::VTYPE)) {
▲ Show 20 Lines • Show All 136 Lines • ▼ Show 20 Lines	if (RISCVII::hasSEWOp(TSFlags)) {
if (needVSETVLI(NewInfo, BlockInfo[MBB.getNumber()].Pred) &&		if (needVSETVLI(NewInfo, BlockInfo[MBB.getNumber()].Pred) &&
needVSETVLIPHI(NewInfo, MBB)) {		needVSETVLIPHI(NewInfo, MBB)) {
insertVSETVLI(MBB, MI, NewInfo, BlockInfo[MBB.getNumber()].Pred);		insertVSETVLI(MBB, MI, NewInfo, BlockInfo[MBB.getNumber()].Pred);
CurInfo = NewInfo;		CurInfo = NewInfo;
}		}
} else {		} else {
// If this instruction isn't compatible with the previous VL/VTYPE		// If this instruction isn't compatible with the previous VL/VTYPE
// we need to insert a VSETVLI.		// we need to insert a VSETVLI.
if (needVSETVLI(NewInfo, CurInfo)) {		// If this is a unit-stride or strided load/store, we may be able to use
		// the EMUL=(EEW/SEW)*LMUL relationship to avoid changing vtype.
		// NOTE: We can't use predecessor information for the store. We must
		// treat it the same as the first phase so that we produce the correct
		// vl/vtype for succesor blocks.
		if (!canSkipVSETVLIForLoadStore(MI, NewInfo, CurInfo) &&
		needVSETVLI(NewInfo, CurInfo)) {
		rogfer01Unsubmitted Not Done Reply Inline Actions Ditto. rogfer01: Ditto.
// If the previous VL/VTYPE is set by VSETVLI and do not use, Merge it		// If the previous VL/VTYPE is set by VSETVLI and do not use, Merge it
// with current VL/VTYPE.		// with current VL/VTYPE.
bool NeedInsertVSETVLI = true;		bool NeedInsertVSETVLI = true;
if (PrevVSETVLIMI) {		if (PrevVSETVLIMI) {
bool HasSameAVL =		bool HasSameAVL =
CurInfo.hasSameAVL(NewInfo) \|\|		CurInfo.hasSameAVL(NewInfo) \|\|
(NewInfo.hasAVLReg() && NewInfo.getAVLReg().isVirtual() &&		(NewInfo.hasAVLReg() && NewInfo.getAVLReg().isVirtual() &&
NewInfo.getAVLReg() == PrevVSETVLIMI->getOperand(0).getReg());		NewInfo.getAVLReg() == PrevVSETVLIMI->getOperand(0).getReg());
▲ Show 20 Lines • Show All 76 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-fp-conv.ll

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: llc -mtriple=riscv32 -target-abi=ilp32d -mattr=+experimental-v,+experimental-zfh,+f,+d -riscv-v-vector-bits-min=128 -riscv-v-fixed-length-vector-lmul-max=8 -verify-machineinstrs < %s \| FileCheck %s --check-prefixes=CHECK,LMULMAX8			; RUN: llc -mtriple=riscv32 -target-abi=ilp32d -mattr=+experimental-v,+experimental-zfh,+f,+d -riscv-v-vector-bits-min=128 -riscv-v-fixed-length-vector-lmul-max=8 -verify-machineinstrs < %s \| FileCheck %s --check-prefixes=CHECK,LMULMAX8
	; RUN: llc -mtriple=riscv64 -target-abi=lp64d -mattr=+experimental-v,+experimental-zfh,+f,+d -riscv-v-vector-bits-min=128 -riscv-v-fixed-length-vector-lmul-max=8 -verify-machineinstrs < %s \| FileCheck %s --check-prefixes=CHECK,LMULMAX8			; RUN: llc -mtriple=riscv64 -target-abi=lp64d -mattr=+experimental-v,+experimental-zfh,+f,+d -riscv-v-vector-bits-min=128 -riscv-v-fixed-length-vector-lmul-max=8 -verify-machineinstrs < %s \| FileCheck %s --check-prefixes=CHECK,LMULMAX8
	; RUN: llc -mtriple=riscv32 -target-abi=ilp32d -mattr=+experimental-v,+experimental-zfh,+f,+d -riscv-v-vector-bits-min=128 -riscv-v-fixed-length-vector-lmul-max=1 -verify-machineinstrs < %s \| FileCheck %s --check-prefixes=CHECK,LMULMAX1			; RUN: llc -mtriple=riscv32 -target-abi=ilp32d -mattr=+experimental-v,+experimental-zfh,+f,+d -riscv-v-vector-bits-min=128 -riscv-v-fixed-length-vector-lmul-max=1 -verify-machineinstrs < %s \| FileCheck %s --check-prefixes=CHECK,LMULMAX1
	; RUN: llc -mtriple=riscv64 -target-abi=lp64d -mattr=+experimental-v,+experimental-zfh,+f,+d -riscv-v-vector-bits-min=128 -riscv-v-fixed-length-vector-lmul-max=1 -verify-machineinstrs < %s \| FileCheck %s --check-prefixes=CHECK,LMULMAX1			; RUN: llc -mtriple=riscv64 -target-abi=lp64d -mattr=+experimental-v,+experimental-zfh,+f,+d -riscv-v-vector-bits-min=128 -riscv-v-fixed-length-vector-lmul-max=1 -verify-machineinstrs < %s \| FileCheck %s --check-prefixes=CHECK,LMULMAX1

	define void @fpext_v2f16_v2f32(<2 x half>* %x, <2 x float>* %y) {			define void @fpext_v2f16_v2f32(<2 x half>* %x, <2 x float>* %y) {
	; CHECK-LABEL: fpext_v2f16_v2f32:			; CHECK-LABEL: fpext_v2f16_v2f32:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 2, e16, mf4, ta, mu			; CHECK-NEXT: vsetivli zero, 2, e16, mf4, ta, mu
	; CHECK-NEXT: vle16.v v25, (a0)			; CHECK-NEXT: vle16.v v25, (a0)
	; CHECK-NEXT: vfwcvt.f.f.v v26, v25			; CHECK-NEXT: vfwcvt.f.f.v v26, v25
	; CHECK-NEXT: vsetvli zero, zero, e32, mf2, ta, mu
	; CHECK-NEXT: vse32.v v26, (a1)			; CHECK-NEXT: vse32.v v26, (a1)
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%a = load <2 x half>, <2 x half>* %x			%a = load <2 x half>, <2 x half>* %x
	%d = fpext <2 x half> %a to <2 x float>			%d = fpext <2 x half> %a to <2 x float>
	store <2 x float> %d, <2 x float>* %y			store <2 x float> %d, <2 x float>* %y
	ret void			ret void
	}			}

	define void @fpext_v2f16_v2f64(<2 x half>* %x, <2 x double>* %y) {			define void @fpext_v2f16_v2f64(<2 x half>* %x, <2 x double>* %y) {
	; CHECK-LABEL: fpext_v2f16_v2f64:			; CHECK-LABEL: fpext_v2f16_v2f64:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 2, e16, mf4, ta, mu			; CHECK-NEXT: vsetivli zero, 2, e16, mf4, ta, mu
	; CHECK-NEXT: vle16.v v25, (a0)			; CHECK-NEXT: vle16.v v25, (a0)
	; CHECK-NEXT: vfwcvt.f.f.v v26, v25			; CHECK-NEXT: vfwcvt.f.f.v v26, v25
	; CHECK-NEXT: vsetvli zero, zero, e32, mf2, ta, mu			; CHECK-NEXT: vsetvli zero, zero, e32, mf2, ta, mu
	; CHECK-NEXT: vfwcvt.f.f.v v25, v26			; CHECK-NEXT: vfwcvt.f.f.v v25, v26
	; CHECK-NEXT: vsetvli zero, zero, e64, m1, ta, mu
	; CHECK-NEXT: vse64.v v25, (a1)			; CHECK-NEXT: vse64.v v25, (a1)
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%a = load <2 x half>, <2 x half>* %x			%a = load <2 x half>, <2 x half>* %x
	%d = fpext <2 x half> %a to <2 x double>			%d = fpext <2 x half> %a to <2 x double>
	store <2 x double> %d, <2 x double>* %y			store <2 x double> %d, <2 x double>* %y
	ret void			ret void
	}			}

	define void @fpext_v8f16_v8f32(<8 x half>* %x, <8 x float>* %y) {			define void @fpext_v8f16_v8f32(<8 x half>* %x, <8 x float>* %y) {
	; LMULMAX8-LABEL: fpext_v8f16_v8f32:			; LMULMAX8-LABEL: fpext_v8f16_v8f32:
	; LMULMAX8: # %bb.0:			; LMULMAX8: # %bb.0:
	; LMULMAX8-NEXT: vsetivli zero, 8, e16, m1, ta, mu			; LMULMAX8-NEXT: vsetivli zero, 8, e16, m1, ta, mu
	; LMULMAX8-NEXT: vle16.v v25, (a0)			; LMULMAX8-NEXT: vle16.v v25, (a0)
	; LMULMAX8-NEXT: vfwcvt.f.f.v v26, v25			; LMULMAX8-NEXT: vfwcvt.f.f.v v26, v25
	; LMULMAX8-NEXT: vsetvli zero, zero, e32, m2, ta, mu
	; LMULMAX8-NEXT: vse32.v v26, (a1)			; LMULMAX8-NEXT: vse32.v v26, (a1)
	; LMULMAX8-NEXT: ret			; LMULMAX8-NEXT: ret
	;			;
	; LMULMAX1-LABEL: fpext_v8f16_v8f32:			; LMULMAX1-LABEL: fpext_v8f16_v8f32:
	; LMULMAX1: # %bb.0:			; LMULMAX1: # %bb.0:
	; LMULMAX1-NEXT: vsetivli zero, 8, e16, m1, ta, mu			; LMULMAX1-NEXT: vsetivli zero, 8, e16, m1, ta, mu
	; LMULMAX1-NEXT: vle16.v v25, (a0)			; LMULMAX1-NEXT: vle16.v v25, (a0)
	; LMULMAX1-NEXT: vsetivli zero, 4, e16, m1, ta, mu			; LMULMAX1-NEXT: vsetivli zero, 4, e16, m1, ta, mu
	; LMULMAX1-NEXT: vslidedown.vi v26, v25, 4			; LMULMAX1-NEXT: vslidedown.vi v26, v25, 4
	; LMULMAX1-NEXT: vsetivli zero, 4, e16, mf2, ta, mu			; LMULMAX1-NEXT: vsetivli zero, 4, e16, mf2, ta, mu
	; LMULMAX1-NEXT: vfwcvt.f.f.v v27, v26			; LMULMAX1-NEXT: vfwcvt.f.f.v v27, v26
	; LMULMAX1-NEXT: vfwcvt.f.f.v v26, v25			; LMULMAX1-NEXT: vfwcvt.f.f.v v26, v25
	; LMULMAX1-NEXT: addi a0, a1, 16			; LMULMAX1-NEXT: addi a0, a1, 16
	; LMULMAX1-NEXT: vsetvli zero, zero, e32, m1, ta, mu
	; LMULMAX1-NEXT: vse32.v v27, (a0)			; LMULMAX1-NEXT: vse32.v v27, (a0)
	; LMULMAX1-NEXT: vse32.v v26, (a1)			; LMULMAX1-NEXT: vse32.v v26, (a1)
	; LMULMAX1-NEXT: ret			; LMULMAX1-NEXT: ret
	%a = load <8 x half>, <8 x half>* %x			%a = load <8 x half>, <8 x half>* %x
	%d = fpext <8 x half> %a to <8 x float>			%d = fpext <8 x half> %a to <8 x float>
	store <8 x float> %d, <8 x float>* %y			store <8 x float> %d, <8 x float>* %y
	ret void			ret void
	}			}

	define void @fpext_v8f16_v8f64(<8 x half>* %x, <8 x double>* %y) {			define void @fpext_v8f16_v8f64(<8 x half>* %x, <8 x double>* %y) {
	; LMULMAX8-LABEL: fpext_v8f16_v8f64:			; LMULMAX8-LABEL: fpext_v8f16_v8f64:
	; LMULMAX8: # %bb.0:			; LMULMAX8: # %bb.0:
	; LMULMAX8-NEXT: vsetivli zero, 8, e16, m1, ta, mu			; LMULMAX8-NEXT: vsetivli zero, 8, e16, m1, ta, mu
	; LMULMAX8-NEXT: vle16.v v25, (a0)			; LMULMAX8-NEXT: vle16.v v25, (a0)
	; LMULMAX8-NEXT: vfwcvt.f.f.v v26, v25			; LMULMAX8-NEXT: vfwcvt.f.f.v v26, v25
	; LMULMAX8-NEXT: vsetvli zero, zero, e32, m2, ta, mu			; LMULMAX8-NEXT: vsetvli zero, zero, e32, m2, ta, mu
	; LMULMAX8-NEXT: vfwcvt.f.f.v v28, v26			; LMULMAX8-NEXT: vfwcvt.f.f.v v28, v26
	; LMULMAX8-NEXT: vsetvli zero, zero, e64, m4, ta, mu
	; LMULMAX8-NEXT: vse64.v v28, (a1)			; LMULMAX8-NEXT: vse64.v v28, (a1)
	; LMULMAX8-NEXT: ret			; LMULMAX8-NEXT: ret
	;			;
	; LMULMAX1-LABEL: fpext_v8f16_v8f64:			; LMULMAX1-LABEL: fpext_v8f16_v8f64:
	; LMULMAX1: # %bb.0:			; LMULMAX1: # %bb.0:
	; LMULMAX1-NEXT: vsetivli zero, 8, e16, m1, ta, mu			; LMULMAX1-NEXT: vsetivli zero, 8, e16, m1, ta, mu
	; LMULMAX1-NEXT: vle16.v v25, (a0)			; LMULMAX1-NEXT: vle16.v v25, (a0)
	; LMULMAX1-NEXT: vsetivli zero, 2, e16, mf2, ta, mu			; LMULMAX1-NEXT: vsetivli zero, 2, e16, mf2, ta, mu
	Show All 14 Lines
	; LMULMAX1-NEXT: vfwcvt.f.f.v v29, v27			; LMULMAX1-NEXT: vfwcvt.f.f.v v29, v27
	; LMULMAX1-NEXT: vsetvli zero, zero, e32, mf2, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e32, mf2, ta, mu
	; LMULMAX1-NEXT: vfwcvt.f.f.v v27, v29			; LMULMAX1-NEXT: vfwcvt.f.f.v v27, v29
	; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu
	; LMULMAX1-NEXT: vfwcvt.f.f.v v29, v25			; LMULMAX1-NEXT: vfwcvt.f.f.v v29, v25
	; LMULMAX1-NEXT: vsetvli zero, zero, e32, mf2, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e32, mf2, ta, mu
	; LMULMAX1-NEXT: vfwcvt.f.f.v v25, v29			; LMULMAX1-NEXT: vfwcvt.f.f.v v25, v29
	; LMULMAX1-NEXT: addi a0, a1, 32			; LMULMAX1-NEXT: addi a0, a1, 32
	; LMULMAX1-NEXT: vsetvli zero, zero, e64, m1, ta, mu
	; LMULMAX1-NEXT: vse64.v v27, (a0)			; LMULMAX1-NEXT: vse64.v v27, (a0)
	; LMULMAX1-NEXT: vse64.v v25, (a1)			; LMULMAX1-NEXT: vse64.v v25, (a1)
	; LMULMAX1-NEXT: addi a0, a1, 48			; LMULMAX1-NEXT: addi a0, a1, 48
	; LMULMAX1-NEXT: vse64.v v28, (a0)			; LMULMAX1-NEXT: vse64.v v28, (a0)
	; LMULMAX1-NEXT: addi a0, a1, 16			; LMULMAX1-NEXT: addi a0, a1, 16
	; LMULMAX1-NEXT: vse64.v v26, (a0)			; LMULMAX1-NEXT: vse64.v v26, (a0)
	; LMULMAX1-NEXT: ret			; LMULMAX1-NEXT: ret
	%a = load <8 x half>, <8 x half>* %x			%a = load <8 x half>, <8 x half>* %x
	▲ Show 20 Lines • Show All 143 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-fp-shuffles.ll

	Show First 20 Lines • Show All 166 Lines • ▼ Show 20 Lines

	define <4 x double> @vrgather_shuffle_xv_v4f64(<4 x double> %x) {			define <4 x double> @vrgather_shuffle_xv_v4f64(<4 x double> %x) {
	; RV32-LABEL: vrgather_shuffle_xv_v4f64:			; RV32-LABEL: vrgather_shuffle_xv_v4f64:
	; RV32: # %bb.0:			; RV32: # %bb.0:
	; RV32-NEXT: addi a0, zero, 12			; RV32-NEXT: addi a0, zero, 12
	; RV32-NEXT: vsetivli zero, 1, e8, mf8, ta, mu			; RV32-NEXT: vsetivli zero, 1, e8, mf8, ta, mu
	; RV32-NEXT: vmv.s.x v0, a0			; RV32-NEXT: vmv.s.x v0, a0
	; RV32-NEXT: vsetivli zero, 4, e16, mf2, ta, mu			; RV32-NEXT: vsetivli zero, 4, e16, mf2, ta, mu
	; RV32-NEXT: vid.v v25
	; RV32-NEXT: vrsub.vi v25, v25, 4
	; RV32-NEXT: lui a0, %hi(.LCPI7_0)			; RV32-NEXT: lui a0, %hi(.LCPI7_0)
	; RV32-NEXT: addi a0, a0, %lo(.LCPI7_0)			; RV32-NEXT: addi a0, a0, %lo(.LCPI7_0)
	; RV32-NEXT: vsetvli zero, zero, e64, m2, ta, mu
	; RV32-NEXT: vlse64.v v26, (a0), zero			; RV32-NEXT: vlse64.v v26, (a0), zero
				; RV32-NEXT: vid.v v25
				; RV32-NEXT: vrsub.vi v25, v25, 4
	; RV32-NEXT: vsetvli zero, zero, e64, m2, tu, mu			; RV32-NEXT: vsetvli zero, zero, e64, m2, tu, mu
	; RV32-NEXT: vrgatherei16.vv v26, v8, v25, v0.t			; RV32-NEXT: vrgatherei16.vv v26, v8, v25, v0.t
	; RV32-NEXT: vmv2r.v v8, v26			; RV32-NEXT: vmv2r.v v8, v26
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: vrgather_shuffle_xv_v4f64:			; RV64-LABEL: vrgather_shuffle_xv_v4f64:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: addi a0, zero, 12			; RV64-NEXT: addi a0, zero, 12
	▲ Show 20 Lines • Show All 53 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-fp.ll

Show First 20 Lines • Show All 431 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
store <2 x double> %d, <2 x double>* %x		store <2 x double> %d, <2 x double>* %x
ret void		ret void
}		}

define void @copysign_neg_trunc_v4f16_v4f32(<4 x half>* %x, <4 x float>* %y) {		define void @copysign_neg_trunc_v4f16_v4f32(<4 x half>* %x, <4 x float>* %y) {
; CHECK-LABEL: copysign_neg_trunc_v4f16_v4f32:		; CHECK-LABEL: copysign_neg_trunc_v4f16_v4f32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, mu		; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, mu
; CHECK-NEXT: vle16.v v25, (a0)		; CHECK-NEXT: vle32.v v25, (a1)
; CHECK-NEXT: vsetvli zero, zero, e32, m1, ta, mu		; CHECK-NEXT: vle16.v v26, (a0)
; CHECK-NEXT: vle32.v v26, (a1)		; CHECK-NEXT: vfncvt.f.f.w v27, v25
; CHECK-NEXT: vsetvli zero, zero, e16, mf2, ta, mu		; CHECK-NEXT: vfsgnjn.vv v25, v26, v27
; CHECK-NEXT: vfncvt.f.f.w v27, v26
; CHECK-NEXT: vfsgnjn.vv v25, v25, v27
; CHECK-NEXT: vse16.v v25, (a0)		; CHECK-NEXT: vse16.v v25, (a0)
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = load <4 x half>, <4 x half>* %x		%a = load <4 x half>, <4 x half>* %x
%b = load <4 x float>, <4 x float>* %y		%b = load <4 x float>, <4 x float>* %y
%c = fneg <4 x float> %b		%c = fneg <4 x float> %b
%d = fptrunc <4 x float> %c to <4 x half>		%d = fptrunc <4 x float> %c to <4 x half>
%e = call <4 x half> @llvm.copysign.v4f16(<4 x half> %a, <4 x half> %d)		%e = call <4 x half> @llvm.copysign.v4f16(<4 x half> %a, <4 x half> %d)
store <4 x half> %e, <4 x half>* %x		store <4 x half> %e, <4 x half>* %x
ret void		ret void
}		}
declare <4 x half> @llvm.copysign.v4f16(<4 x half>, <4 x half>)		declare <4 x half> @llvm.copysign.v4f16(<4 x half>, <4 x half>)

define void @copysign_neg_ext_v2f64_v2f32(<2 x double>* %x, <2 x float>* %y) {		define void @copysign_neg_ext_v2f64_v2f32(<2 x double>* %x, <2 x float>* %y) {
; CHECK-LABEL: copysign_neg_ext_v2f64_v2f32:		; CHECK-LABEL: copysign_neg_ext_v2f64_v2f32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 2, e64, m1, ta, mu		; CHECK-NEXT: vsetivli zero, 2, e64, m1, ta, mu
; CHECK-NEXT: vle64.v v25, (a0)		; CHECK-NEXT: vle32.v v25, (a1)
		; CHECK-NEXT: vle64.v v26, (a0)
; CHECK-NEXT: vsetvli zero, zero, e32, mf2, ta, mu		; CHECK-NEXT: vsetvli zero, zero, e32, mf2, ta, mu
; CHECK-NEXT: vle32.v v26, (a1)		; CHECK-NEXT: vfwcvt.f.f.v v27, v25
; CHECK-NEXT: vfwcvt.f.f.v v27, v26
; CHECK-NEXT: vsetvli zero, zero, e64, m1, ta, mu		; CHECK-NEXT: vsetvli zero, zero, e64, m1, ta, mu
; CHECK-NEXT: vfsgnjn.vv v25, v25, v27		; CHECK-NEXT: vfsgnjn.vv v25, v26, v27
; CHECK-NEXT: vse64.v v25, (a0)		; CHECK-NEXT: vse64.v v25, (a0)
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = load <2 x double>, <2 x double>* %x		%a = load <2 x double>, <2 x double>* %x
%b = load <2 x float>, <2 x float>* %y		%b = load <2 x float>, <2 x float>* %y
%c = fneg <2 x float> %b		%c = fneg <2 x float> %b
%d = fpext <2 x float> %c to <2 x double>		%d = fpext <2 x float> %c to <2 x double>
%e = call <2 x double> @llvm.copysign.v2f64(<2 x double> %a, <2 x double> %d)		%e = call <2 x double> @llvm.copysign.v2f64(<2 x double> %a, <2 x double> %d)
store <2 x double> %e, <2 x double>* %x		store <2 x double> %e, <2 x double>* %x
▲ Show 20 Lines • Show All 1,492 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-fp2i.ll

	Show First 20 Lines • Show All 194 Lines • ▼ Show 20 Lines
	}			}

	define void @fp2si_v2f32_v2i64(<2 x float>* %x, <2 x i64>* %y) {			define void @fp2si_v2f32_v2i64(<2 x float>* %x, <2 x i64>* %y) {
	; CHECK-LABEL: fp2si_v2f32_v2i64:			; CHECK-LABEL: fp2si_v2f32_v2i64:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 2, e32, mf2, ta, mu			; CHECK-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
	; CHECK-NEXT: vle32.v v25, (a0)			; CHECK-NEXT: vle32.v v25, (a0)
	; CHECK-NEXT: vfwcvt.rtz.x.f.v v26, v25			; CHECK-NEXT: vfwcvt.rtz.x.f.v v26, v25
	; CHECK-NEXT: vsetvli zero, zero, e64, m1, ta, mu
	; CHECK-NEXT: vse64.v v26, (a1)			; CHECK-NEXT: vse64.v v26, (a1)
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%a = load <2 x float>, <2 x float>* %x			%a = load <2 x float>, <2 x float>* %x
	%d = fptosi <2 x float> %a to <2 x i64>			%d = fptosi <2 x float> %a to <2 x i64>
	store <2 x i64> %d, <2 x i64>* %y			store <2 x i64> %d, <2 x i64>* %y
	ret void			ret void
	}			}

	define void @fp2ui_v2f32_v2i64(<2 x float>* %x, <2 x i64>* %y) {			define void @fp2ui_v2f32_v2i64(<2 x float>* %x, <2 x i64>* %y) {
	; CHECK-LABEL: fp2ui_v2f32_v2i64:			; CHECK-LABEL: fp2ui_v2f32_v2i64:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 2, e32, mf2, ta, mu			; CHECK-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
	; CHECK-NEXT: vle32.v v25, (a0)			; CHECK-NEXT: vle32.v v25, (a0)
	; CHECK-NEXT: vfwcvt.rtz.xu.f.v v26, v25			; CHECK-NEXT: vfwcvt.rtz.xu.f.v v26, v25
	; CHECK-NEXT: vsetvli zero, zero, e64, m1, ta, mu
	; CHECK-NEXT: vse64.v v26, (a1)			; CHECK-NEXT: vse64.v v26, (a1)
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%a = load <2 x float>, <2 x float>* %x			%a = load <2 x float>, <2 x float>* %x
	%d = fptoui <2 x float> %a to <2 x i64>			%d = fptoui <2 x float> %a to <2 x i64>
	store <2 x i64> %d, <2 x i64>* %y			store <2 x i64> %d, <2 x i64>* %y
	ret void			ret void
	}			}

	define void @fp2si_v8f32_v8i64(<8 x float>* %x, <8 x i64>* %y) {			define void @fp2si_v8f32_v8i64(<8 x float>* %x, <8 x i64>* %y) {
	; LMULMAX8-LABEL: fp2si_v8f32_v8i64:			; LMULMAX8-LABEL: fp2si_v8f32_v8i64:
	; LMULMAX8: # %bb.0:			; LMULMAX8: # %bb.0:
	; LMULMAX8-NEXT: vsetivli zero, 8, e32, m2, ta, mu			; LMULMAX8-NEXT: vsetivli zero, 8, e32, m2, ta, mu
	; LMULMAX8-NEXT: vle32.v v26, (a0)			; LMULMAX8-NEXT: vle32.v v26, (a0)
	; LMULMAX8-NEXT: vfwcvt.rtz.x.f.v v28, v26			; LMULMAX8-NEXT: vfwcvt.rtz.x.f.v v28, v26
	; LMULMAX8-NEXT: vsetvli zero, zero, e64, m4, ta, mu
	; LMULMAX8-NEXT: vse64.v v28, (a1)			; LMULMAX8-NEXT: vse64.v v28, (a1)
	; LMULMAX8-NEXT: ret			; LMULMAX8-NEXT: ret
	;			;
	; LMULMAX1-LABEL: fp2si_v8f32_v8i64:			; LMULMAX1-LABEL: fp2si_v8f32_v8i64:
	; LMULMAX1: # %bb.0:			; LMULMAX1: # %bb.0:
	; LMULMAX1-NEXT: vsetivli zero, 4, e32, m1, ta, mu			; LMULMAX1-NEXT: vsetivli zero, 4, e32, m1, ta, mu
	; LMULMAX1-NEXT: addi a2, a0, 16			; LMULMAX1-NEXT: addi a2, a0, 16
	; LMULMAX1-NEXT: vle32.v v25, (a2)			; LMULMAX1-NEXT: vle32.v v25, (a2)
	; LMULMAX1-NEXT: vle32.v v26, (a0)			; LMULMAX1-NEXT: vle32.v v26, (a0)
	; LMULMAX1-NEXT: vsetivli zero, 2, e32, m1, ta, mu			; LMULMAX1-NEXT: vsetivli zero, 2, e32, m1, ta, mu
	; LMULMAX1-NEXT: vslidedown.vi v27, v25, 2			; LMULMAX1-NEXT: vslidedown.vi v27, v25, 2
	; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu			; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
	; LMULMAX1-NEXT: vfwcvt.rtz.x.f.v v28, v27			; LMULMAX1-NEXT: vfwcvt.rtz.x.f.v v28, v27
	; LMULMAX1-NEXT: vsetivli zero, 2, e32, m1, ta, mu			; LMULMAX1-NEXT: vsetivli zero, 2, e32, m1, ta, mu
	; LMULMAX1-NEXT: vslidedown.vi v27, v26, 2			; LMULMAX1-NEXT: vslidedown.vi v27, v26, 2
	; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu			; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
	; LMULMAX1-NEXT: vfwcvt.rtz.x.f.v v29, v27			; LMULMAX1-NEXT: vfwcvt.rtz.x.f.v v29, v27
	; LMULMAX1-NEXT: vfwcvt.rtz.x.f.v v27, v25			; LMULMAX1-NEXT: vfwcvt.rtz.x.f.v v27, v25
	; LMULMAX1-NEXT: vfwcvt.rtz.x.f.v v25, v26			; LMULMAX1-NEXT: vfwcvt.rtz.x.f.v v25, v26
	; LMULMAX1-NEXT: addi a0, a1, 16			; LMULMAX1-NEXT: addi a0, a1, 16
	; LMULMAX1-NEXT: vsetvli zero, zero, e64, m1, ta, mu
	; LMULMAX1-NEXT: vse64.v v29, (a0)			; LMULMAX1-NEXT: vse64.v v29, (a0)
	; LMULMAX1-NEXT: vse64.v v25, (a1)			; LMULMAX1-NEXT: vse64.v v25, (a1)
	; LMULMAX1-NEXT: addi a0, a1, 48			; LMULMAX1-NEXT: addi a0, a1, 48
	; LMULMAX1-NEXT: vse64.v v28, (a0)			; LMULMAX1-NEXT: vse64.v v28, (a0)
	; LMULMAX1-NEXT: addi a0, a1, 32			; LMULMAX1-NEXT: addi a0, a1, 32
	; LMULMAX1-NEXT: vse64.v v27, (a0)			; LMULMAX1-NEXT: vse64.v v27, (a0)
	; LMULMAX1-NEXT: ret			; LMULMAX1-NEXT: ret
	%a = load <8 x float>, <8 x float>* %x			%a = load <8 x float>, <8 x float>* %x
	%d = fptosi <8 x float> %a to <8 x i64>			%d = fptosi <8 x float> %a to <8 x i64>
	store <8 x i64> %d, <8 x i64>* %y			store <8 x i64> %d, <8 x i64>* %y
	ret void			ret void
	}			}

	define void @fp2ui_v8f32_v8i64(<8 x float>* %x, <8 x i64>* %y) {			define void @fp2ui_v8f32_v8i64(<8 x float>* %x, <8 x i64>* %y) {
	; LMULMAX8-LABEL: fp2ui_v8f32_v8i64:			; LMULMAX8-LABEL: fp2ui_v8f32_v8i64:
	; LMULMAX8: # %bb.0:			; LMULMAX8: # %bb.0:
	; LMULMAX8-NEXT: vsetivli zero, 8, e32, m2, ta, mu			; LMULMAX8-NEXT: vsetivli zero, 8, e32, m2, ta, mu
	; LMULMAX8-NEXT: vle32.v v26, (a0)			; LMULMAX8-NEXT: vle32.v v26, (a0)
	; LMULMAX8-NEXT: vfwcvt.rtz.xu.f.v v28, v26			; LMULMAX8-NEXT: vfwcvt.rtz.xu.f.v v28, v26
	; LMULMAX8-NEXT: vsetvli zero, zero, e64, m4, ta, mu
	; LMULMAX8-NEXT: vse64.v v28, (a1)			; LMULMAX8-NEXT: vse64.v v28, (a1)
	; LMULMAX8-NEXT: ret			; LMULMAX8-NEXT: ret
	;			;
	; LMULMAX1-LABEL: fp2ui_v8f32_v8i64:			; LMULMAX1-LABEL: fp2ui_v8f32_v8i64:
	; LMULMAX1: # %bb.0:			; LMULMAX1: # %bb.0:
	; LMULMAX1-NEXT: vsetivli zero, 4, e32, m1, ta, mu			; LMULMAX1-NEXT: vsetivli zero, 4, e32, m1, ta, mu
	; LMULMAX1-NEXT: addi a2, a0, 16			; LMULMAX1-NEXT: addi a2, a0, 16
	; LMULMAX1-NEXT: vle32.v v25, (a2)			; LMULMAX1-NEXT: vle32.v v25, (a2)
	; LMULMAX1-NEXT: vle32.v v26, (a0)			; LMULMAX1-NEXT: vle32.v v26, (a0)
	; LMULMAX1-NEXT: vsetivli zero, 2, e32, m1, ta, mu			; LMULMAX1-NEXT: vsetivli zero, 2, e32, m1, ta, mu
	; LMULMAX1-NEXT: vslidedown.vi v27, v25, 2			; LMULMAX1-NEXT: vslidedown.vi v27, v25, 2
	; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu			; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
	; LMULMAX1-NEXT: vfwcvt.rtz.xu.f.v v28, v27			; LMULMAX1-NEXT: vfwcvt.rtz.xu.f.v v28, v27
	; LMULMAX1-NEXT: vsetivli zero, 2, e32, m1, ta, mu			; LMULMAX1-NEXT: vsetivli zero, 2, e32, m1, ta, mu
	; LMULMAX1-NEXT: vslidedown.vi v27, v26, 2			; LMULMAX1-NEXT: vslidedown.vi v27, v26, 2
	; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu			; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
	; LMULMAX1-NEXT: vfwcvt.rtz.xu.f.v v29, v27			; LMULMAX1-NEXT: vfwcvt.rtz.xu.f.v v29, v27
	; LMULMAX1-NEXT: vfwcvt.rtz.xu.f.v v27, v25			; LMULMAX1-NEXT: vfwcvt.rtz.xu.f.v v27, v25
	; LMULMAX1-NEXT: vfwcvt.rtz.xu.f.v v25, v26			; LMULMAX1-NEXT: vfwcvt.rtz.xu.f.v v25, v26
	; LMULMAX1-NEXT: addi a0, a1, 16			; LMULMAX1-NEXT: addi a0, a1, 16
	; LMULMAX1-NEXT: vsetvli zero, zero, e64, m1, ta, mu
	; LMULMAX1-NEXT: vse64.v v29, (a0)			; LMULMAX1-NEXT: vse64.v v29, (a0)
	; LMULMAX1-NEXT: vse64.v v25, (a1)			; LMULMAX1-NEXT: vse64.v v25, (a1)
	; LMULMAX1-NEXT: addi a0, a1, 48			; LMULMAX1-NEXT: addi a0, a1, 48
	; LMULMAX1-NEXT: vse64.v v28, (a0)			; LMULMAX1-NEXT: vse64.v v28, (a0)
	; LMULMAX1-NEXT: addi a0, a1, 32			; LMULMAX1-NEXT: addi a0, a1, 32
	; LMULMAX1-NEXT: vse64.v v27, (a0)			; LMULMAX1-NEXT: vse64.v v27, (a0)
	; LMULMAX1-NEXT: ret			; LMULMAX1-NEXT: ret
	%a = load <8 x float>, <8 x float>* %x			%a = load <8 x float>, <8 x float>* %x
	%d = fptoui <8 x float> %a to <8 x i64>			%d = fptoui <8 x float> %a to <8 x i64>
	store <8 x i64> %d, <8 x i64>* %y			store <8 x i64> %d, <8 x i64>* %y
	ret void			ret void
	}			}

	define void @fp2si_v2f16_v2i64(<2 x half>* %x, <2 x i64>* %y) {			define void @fp2si_v2f16_v2i64(<2 x half>* %x, <2 x i64>* %y) {
	; CHECK-LABEL: fp2si_v2f16_v2i64:			; CHECK-LABEL: fp2si_v2f16_v2i64:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 2, e16, mf4, ta, mu			; CHECK-NEXT: vsetivli zero, 2, e16, mf4, ta, mu
	; CHECK-NEXT: vle16.v v25, (a0)			; CHECK-NEXT: vle16.v v25, (a0)
	; CHECK-NEXT: vfwcvt.f.f.v v26, v25			; CHECK-NEXT: vfwcvt.f.f.v v26, v25
	; CHECK-NEXT: vsetvli zero, zero, e32, mf2, ta, mu			; CHECK-NEXT: vsetvli zero, zero, e32, mf2, ta, mu
	; CHECK-NEXT: vfwcvt.rtz.x.f.v v25, v26			; CHECK-NEXT: vfwcvt.rtz.x.f.v v25, v26
	; CHECK-NEXT: vsetvli zero, zero, e64, m1, ta, mu
	; CHECK-NEXT: vse64.v v25, (a1)			; CHECK-NEXT: vse64.v v25, (a1)
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%a = load <2 x half>, <2 x half>* %x			%a = load <2 x half>, <2 x half>* %x
	%d = fptosi <2 x half> %a to <2 x i64>			%d = fptosi <2 x half> %a to <2 x i64>
	store <2 x i64> %d, <2 x i64>* %y			store <2 x i64> %d, <2 x i64>* %y
	ret void			ret void
	}			}

	define void @fp2ui_v2f16_v2i64(<2 x half>* %x, <2 x i64>* %y) {			define void @fp2ui_v2f16_v2i64(<2 x half>* %x, <2 x i64>* %y) {
	; CHECK-LABEL: fp2ui_v2f16_v2i64:			; CHECK-LABEL: fp2ui_v2f16_v2i64:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 2, e16, mf4, ta, mu			; CHECK-NEXT: vsetivli zero, 2, e16, mf4, ta, mu
	; CHECK-NEXT: vle16.v v25, (a0)			; CHECK-NEXT: vle16.v v25, (a0)
	; CHECK-NEXT: vfwcvt.f.f.v v26, v25			; CHECK-NEXT: vfwcvt.f.f.v v26, v25
	; CHECK-NEXT: vsetvli zero, zero, e32, mf2, ta, mu			; CHECK-NEXT: vsetvli zero, zero, e32, mf2, ta, mu
	; CHECK-NEXT: vfwcvt.rtz.xu.f.v v25, v26			; CHECK-NEXT: vfwcvt.rtz.xu.f.v v25, v26
	; CHECK-NEXT: vsetvli zero, zero, e64, m1, ta, mu
	; CHECK-NEXT: vse64.v v25, (a1)			; CHECK-NEXT: vse64.v v25, (a1)
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%a = load <2 x half>, <2 x half>* %x			%a = load <2 x half>, <2 x half>* %x
	%d = fptoui <2 x half> %a to <2 x i64>			%d = fptoui <2 x half> %a to <2 x i64>
	store <2 x i64> %d, <2 x i64>* %y			store <2 x i64> %d, <2 x i64>* %y
	ret void			ret void
	}			}

	▲ Show 20 Lines • Show All 391 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-vwmul.ll

Show First 20 Lines • Show All 370 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
ret <2 x i32> %e		ret <2 x i32> %e
}		}

define <4 x i32> @vwmul_v4i32_v4i8_v4i16(<4 x i8>* %x, <4 x i16>* %y) {		define <4 x i32> @vwmul_v4i32_v4i8_v4i16(<4 x i8>* %x, <4 x i16>* %y) {
; CHECK-LABEL: vwmul_v4i32_v4i8_v4i16:		; CHECK-LABEL: vwmul_v4i32_v4i8_v4i16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 4, e8, mf4, ta, mu		; CHECK-NEXT: vsetivli zero, 4, e8, mf4, ta, mu
; CHECK-NEXT: vle8.v v25, (a0)		; CHECK-NEXT: vle8.v v25, (a0)
; CHECK-NEXT: vsetvli zero, zero, e16, mf2, ta, mu
; CHECK-NEXT: vle16.v v26, (a1)		; CHECK-NEXT: vle16.v v26, (a1)
		; CHECK-NEXT: vsetvli zero, zero, e16, mf2, ta, mu
; CHECK-NEXT: vsext.vf2 v27, v25		; CHECK-NEXT: vsext.vf2 v27, v25
; CHECK-NEXT: vwmul.vv v8, v27, v26		; CHECK-NEXT: vwmul.vv v8, v27, v26
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = load <4 x i8>, <4 x i8>* %x		%a = load <4 x i8>, <4 x i8>* %x
%b = load <4 x i16>, <4 x i16>* %y		%b = load <4 x i16>, <4 x i16>* %y
%c = sext <4 x i8> %a to <4 x i32>		%c = sext <4 x i8> %a to <4 x i32>
%d = sext <4 x i16> %b to <4 x i32>		%d = sext <4 x i16> %b to <4 x i32>
%e = mul <4 x i32> %c, %d		%e = mul <4 x i32> %c, %d
ret <4 x i32> %e		ret <4 x i32> %e
}		}

define <4 x i64> @vwmul_v4i64_v4i32_v4i8(<4 x i32>* %x, <4 x i8>* %y) {		define <4 x i64> @vwmul_v4i64_v4i32_v4i8(<4 x i32>* %x, <4 x i8>* %y) {
; CHECK-LABEL: vwmul_v4i64_v4i32_v4i8:		; CHECK-LABEL: vwmul_v4i64_v4i32_v4i8:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: vle32.v v25, (a0)		; CHECK-NEXT: vle8.v v25, (a1)
; CHECK-NEXT: vsetvli zero, zero, e8, mf4, ta, mu		; CHECK-NEXT: vle32.v v26, (a0)
; CHECK-NEXT: vle8.v v26, (a1)		; CHECK-NEXT: vsext.vf4 v27, v25
; CHECK-NEXT: vsetvli zero, zero, e32, m1, ta, mu		; CHECK-NEXT: vwmul.vv v8, v26, v27
; CHECK-NEXT: vsext.vf4 v27, v26
; CHECK-NEXT: vwmul.vv v8, v25, v27
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = load <4 x i32>, <4 x i32>* %x		%a = load <4 x i32>, <4 x i32>* %x
%b = load <4 x i8>, <4 x i8>* %y		%b = load <4 x i8>, <4 x i8>* %y
%c = sext <4 x i32> %a to <4 x i64>		%c = sext <4 x i32> %a to <4 x i64>
%d = sext <4 x i8> %b to <4 x i64>		%d = sext <4 x i8> %b to <4 x i64>
%e = mul <4 x i64> %c, %d		%e = mul <4 x i64> %c, %d
ret <4 x i64> %e		ret <4 x i64> %e
}		}
▲ Show 20 Lines • Show All 244 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-vwmulu.ll

Show First 20 Lines • Show All 370 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
ret <2 x i32> %e		ret <2 x i32> %e
}		}

define <4 x i32> @vwmulu_v4i32_v4i8_v4i16(<4 x i8>* %x, <4 x i16>* %y) {		define <4 x i32> @vwmulu_v4i32_v4i8_v4i16(<4 x i8>* %x, <4 x i16>* %y) {
; CHECK-LABEL: vwmulu_v4i32_v4i8_v4i16:		; CHECK-LABEL: vwmulu_v4i32_v4i8_v4i16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 4, e8, mf4, ta, mu		; CHECK-NEXT: vsetivli zero, 4, e8, mf4, ta, mu
; CHECK-NEXT: vle8.v v25, (a0)		; CHECK-NEXT: vle8.v v25, (a0)
; CHECK-NEXT: vsetvli zero, zero, e16, mf2, ta, mu
; CHECK-NEXT: vle16.v v26, (a1)		; CHECK-NEXT: vle16.v v26, (a1)
		; CHECK-NEXT: vsetvli zero, zero, e16, mf2, ta, mu
; CHECK-NEXT: vzext.vf2 v27, v25		; CHECK-NEXT: vzext.vf2 v27, v25
; CHECK-NEXT: vwmulu.vv v8, v27, v26		; CHECK-NEXT: vwmulu.vv v8, v27, v26
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = load <4 x i8>, <4 x i8>* %x		%a = load <4 x i8>, <4 x i8>* %x
%b = load <4 x i16>, <4 x i16>* %y		%b = load <4 x i16>, <4 x i16>* %y
%c = zext <4 x i8> %a to <4 x i32>		%c = zext <4 x i8> %a to <4 x i32>
%d = zext <4 x i16> %b to <4 x i32>		%d = zext <4 x i16> %b to <4 x i32>
%e = mul <4 x i32> %c, %d		%e = mul <4 x i32> %c, %d
ret <4 x i32> %e		ret <4 x i32> %e
}		}

define <4 x i64> @vwmulu_v4i64_v4i32_v4i8(<4 x i32>* %x, <4 x i8>* %y) {		define <4 x i64> @vwmulu_v4i64_v4i32_v4i8(<4 x i32>* %x, <4 x i8>* %y) {
; CHECK-LABEL: vwmulu_v4i64_v4i32_v4i8:		; CHECK-LABEL: vwmulu_v4i64_v4i32_v4i8:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: vle32.v v25, (a0)		; CHECK-NEXT: vle8.v v25, (a1)
; CHECK-NEXT: vsetvli zero, zero, e8, mf4, ta, mu		; CHECK-NEXT: vle32.v v26, (a0)
; CHECK-NEXT: vle8.v v26, (a1)		; CHECK-NEXT: vzext.vf4 v27, v25
; CHECK-NEXT: vsetvli zero, zero, e32, m1, ta, mu		; CHECK-NEXT: vwmulu.vv v8, v26, v27
; CHECK-NEXT: vzext.vf4 v27, v26
; CHECK-NEXT: vwmulu.vv v8, v25, v27
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = load <4 x i32>, <4 x i32>* %x		%a = load <4 x i32>, <4 x i32>* %x
%b = load <4 x i8>, <4 x i8>* %y		%b = load <4 x i8>, <4 x i8>* %y
%c = zext <4 x i32> %a to <4 x i64>		%c = zext <4 x i32> %a to <4 x i64>
%d = zext <4 x i8> %b to <4 x i64>		%d = zext <4 x i8> %b to <4 x i64>
%e = mul <4 x i64> %c, %d		%e = mul <4 x i64> %c, %d
ret <4 x i64> %e		ret <4 x i64> %e
}		}
▲ Show 20 Lines • Show All 244 Lines • Show Last 20 Lines