This is an archive of the discontinued LLVM Phabricator instance.

[RISCV] Extend demanded field transform in InsertVSETVLI to VTYPE subfeilds
ClosedPublic

Authored by reames on Jun 14 2022, 1:25 PM.

Download Raw Diff

Details

Reviewers

craig.topper
kito-cheng
frasercrmck

Commits

rG4a3e46115a7f: [RISCV] Extend demanded field transform in InsertVSETVLI to VTYPE subfeilds

Summary

The motivating case, and the only one actually enabled by this patch, is a load or store followed by another op with the same SEW/LMUL ratio.

As an example, consider:

define void @test1(ptr %in, ptr %out) {
entry:
  %0 = load <8 x i16>, ptr %in, align 2
  %1 = sext <8 x i16> %0 to <8 x i32>
  store <8 x i32> %1, ptr %out, align 4
  ret void
}

Without this patch, we get:

	vsetivli	zero, 8, e16, mf4, ta, mu
	vle16.v	v8, (a0)
	vsetvli	zero, zero, e32, mf2, ta, mu
	vsext.vf2	v9, v8
	vse32.v	v9, (a1)
	ret

Whereas with the patch we get:

	vsetivli	zero, 8, e32, mf2, ta, mu
	vle16.v	v8, (a0)
	vsext.vf2	v9, v8
	vse32.v	v9, (a1)
	ret

We have rewritten the first vsetvli and thus removed the second one.

As is strongly hinted by the code structure and todos, I am planning on communing this with all (or most all?) of the cases from isCompatible used in the forward data flow. This will be done in a series of following changes - some NFC reworks, and some reviewed optimization extensions.

Diff Detail

Event Timeline

reames created this revision.Jun 14 2022, 1:25 PM

Herald added a project: Restricted Project. · View Herald TranscriptJun 14 2022, 1:25 PM

Herald added subscribers: sunshaoce, VincentWu, luke957 and 30 others. · View Herald Transcript

reames requested review of this revision.Jun 14 2022, 1:25 PM

Herald added a project: Restricted Project. · View Herald TranscriptJun 14 2022, 1:25 PM

Herald added subscribers: • pcwang-thead, eopXD, MaskRay. · View Herald Transcript

Harbormaster completed remote builds in B169814: Diff 436907.Jun 14 2022, 3:16 PM

LGTM

This revision is now accepted and ready to land.Jun 15 2022, 4:43 PM

This revision was landed with ongoing or failed builds.Jun 16 2022, 8:01 AM

Closed by commit rG4a3e46115a7f: [RISCV] Extend demanded field transform in InsertVSETVLI to VTYPE subfeilds (authored by reames). · Explain Why

This revision was automatically updated to reflect the committed changes.

reames added a commit: rG4a3e46115a7f: [RISCV] Extend demanded field transform in InsertVSETVLI to VTYPE subfeilds.

Revision Contents

Path

Size

llvm/

lib/

Target/

RISCV/

RISCVInsertVSETVLI.cpp

68 lines

test/

CodeGen/

RISCV/

rvv/

extload-truncstore.ll

84 lines

fixed-vectors-ctlz.ll

6 lines

fixed-vectors-extload-truncstore.ll

126 lines

fixed-vectors-fp-conv.ll

42 lines

fixed-vectors-fp-shuffles.ll

9 lines

fixed-vectors-fp.ll

3 lines

fixed-vectors-fp2i.ll

74 lines

fixed-vectors-i2fp.ll

78 lines

fixed-vectors-int-exttrunc.ll

27 lines

fixed-vectors-int-shuffles.ll

29 lines

fixed-vectors-int-splat.ll

3 lines

fixed-vectors-reduction-fp.ll

15 lines

fixed-vectors-reduction-int.ll

48 lines

fixed-vectors-vfwadd.ll

51 lines

fixed-vectors-vfwsub.ll

51 lines

fixed-vectors-vwadd.ll

6 lines

fixed-vectors-vwaddu.ll

6 lines

fixed-vectors-vwmul.ll

27 lines

fixed-vectors-vwmulsu.ll

18 lines

fixed-vectors-vwmulu.ll

12 lines

fixed-vectors-vwsub.ll

24 lines

fixed-vectors-vwsubu.ll

24 lines

vsetvli-insert.mir

3 lines

Diff 436907

llvm/lib/Target/RISCV/RISCVInsertVSETVLI.cpp

Show First 20 Lines • Show All 1,394 Lines • ▼ Show 20 Lines	static DemandedFields getDemanded(const MachineInstr &MI) {
if (MI.isCall() \|\| MI.isInlineAsm() \|\| MI.readsRegister(RISCV::VTYPE)) {		if (MI.isCall() \|\| MI.isInlineAsm() \|\| MI.readsRegister(RISCV::VTYPE)) {
Res.SEW = true;		Res.SEW = true;
Res.LMUL = true;		Res.LMUL = true;
Res.SEWLMULRatio = true;		Res.SEWLMULRatio = true;
Res.TailPolicy = true;		Res.TailPolicy = true;
Res.MaskPolicy = true;		Res.MaskPolicy = true;
}		}

		// Loads and stores with implicit EEW do not demand SEW or LMUL directly.
		// They instead demand the ratio of the two which is used in computing
		// EMUL, but which allows us the flexibility to change SEW and LMUL
		// provided we don't change the ratio.
		if (getEEWForLoadStore(MI)) {
		Res.SEW = false;
		Res.LMUL = false;
		}

return Res;		return Res;
}		}

		// Return true if we can mutate PrevMI's VTYPE to match MI's
		// without changing any the fields which have been used.
		// TODO: Restructure code to allow code reuse between this and isCompatible
		// above.
		static bool canMutatePriorConfig(const MachineInstr &PrevMI,
		const MachineInstr &MI,
		const DemandedFields &Used) {
		// TODO: Extend this to handle cases where VL does change, but VL
		// has not been used. (e.g. over a vmv.x.s)
		if (!isVLPreservingConfig(MI))
		// Note: `vsetvli x0, x0, vtype' is the canonical instruction
		// for this case. If you find yourself wanting to add other forms
		// to this "unused VTYPE" case, we're probably missing a
		// canonicalization earlier.
		return false;

		if (!PrevMI.getOperand(2).isImm() \|\| !MI.getOperand(2).isImm())
		return false;

		auto PriorVType = PrevMI.getOperand(2).getImm();
		auto VType = MI.getOperand(2).getImm();

		if (Used.SEW &&
		RISCVVType::getSEW(VType) != RISCVVType::getSEW(PriorVType))
		return false;

		if (Used.LMUL &&
		RISCVVType::getVLMUL(VType) != RISCVVType::getVLMUL(PriorVType))
		return false;

		if (Used.SEWLMULRatio) {
		auto PriorRatio =
		VSETVLIInfo::getSEWLMULRatio(RISCVVType::getSEW(PriorVType),
		RISCVVType::getVLMUL(PriorVType));
		auto Ratio =
		VSETVLIInfo::getSEWLMULRatio(RISCVVType::getSEW(VType),
		RISCVVType::getVLMUL(VType));
		if (PriorRatio != Ratio)
		return false;
		}

		if (Used.TailPolicy &&
		RISCVVType::isTailAgnostic(VType) != RISCVVType::isTailAgnostic(PriorVType))
		return false;
		if (Used.MaskPolicy &&
		RISCVVType::isMaskAgnostic(VType) != RISCVVType::isMaskAgnostic(PriorVType))
		return false;
		return true;
		}

void RISCVInsertVSETVLI::doLocalPostpass(MachineBasicBlock &MBB) {		void RISCVInsertVSETVLI::doLocalPostpass(MachineBasicBlock &MBB) {
MachineInstr *PrevMI = nullptr;		MachineInstr *PrevMI = nullptr;
DemandedFields Used;		DemandedFields Used;
SmallVector<MachineInstr*> ToDelete;		SmallVector<MachineInstr*> ToDelete;
for (MachineInstr &MI : MBB) {		for (MachineInstr &MI : MBB) {
// Note: Must be before vsetvli handling to account for config cases		// Note: Must be before vsetvli handling to account for config cases
// which only change some subfields.		// which only change some subfields.
doUnion(Used, getDemanded(MI));		doUnion(Used, getDemanded(MI));

if (!isVectorConfigInstr(MI))		if (!isVectorConfigInstr(MI))
continue;		continue;

if (PrevMI) {		if (PrevMI) {
if (!Used.VL && !Used.usedVTYPE()) {		if (!Used.VL && !Used.usedVTYPE()) {
ToDelete.push_back(PrevMI);		ToDelete.push_back(PrevMI);
// fallthrough		// fallthrough
} else if (!Used.usedVTYPE() && isVLPreservingConfig(MI)) {		} else if (canMutatePriorConfig(*PrevMI, MI, Used)) {
// Note: `vsetvli x0, x0, vtype' is the canonical instruction
// for this case. If you find yourself wanting to add other forms
// to this "unused VTYPE" case, we're probably missing a
// canonicalization earlier.
// Note: We don't need to explicitly check vtype compatibility
// here because this form is only legal (per ISA) when not
// changing VL.
PrevMI->getOperand(2).setImm(MI.getOperand(2).getImm());		PrevMI->getOperand(2).setImm(MI.getOperand(2).getImm());
ToDelete.push_back(&MI);		ToDelete.push_back(&MI);
// Leave PrevMI unchanged		// Leave PrevMI unchanged
continue;		continue;
}		}
}		}
PrevMI = &MI;		PrevMI = &MI;
Used = getDemanded(MI);		Used = getDemanded(MI);
▲ Show 20 Lines • Show All 127 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/rvv/extload-truncstore.ll

Show All 12 Lines	; CHECK-NEXT: ret
%y = load <vscale x 1 x i1>, <vscale x 1 x i1>* %x		%y = load <vscale x 1 x i1>, <vscale x 1 x i1>* %x
%z = sext <vscale x 1 x i1> %y to <vscale x 1 x i8>		%z = sext <vscale x 1 x i1> %y to <vscale x 1 x i8>
ret <vscale x 1 x i8> %z		ret <vscale x 1 x i8> %z
}		}

define <vscale x 1 x i16> @sextload_nxv1i8_nxv1i16(<vscale x 1 x i8>* %x) {		define <vscale x 1 x i16> @sextload_nxv1i8_nxv1i16(<vscale x 1 x i8>* %x) {
; CHECK-LABEL: sextload_nxv1i8_nxv1i16:		; CHECK-LABEL: sextload_nxv1i8_nxv1i16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetvli a1, zero, e8, mf8, ta, mu		; CHECK-NEXT: vsetvli a1, zero, e16, mf4, ta, mu
; CHECK-NEXT: vle8.v v9, (a0)		; CHECK-NEXT: vle8.v v9, (a0)
; CHECK-NEXT: vsetvli zero, zero, e16, mf4, ta, mu
; CHECK-NEXT: vsext.vf2 v8, v9		; CHECK-NEXT: vsext.vf2 v8, v9
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%y = load <vscale x 1 x i8>, <vscale x 1 x i8>* %x		%y = load <vscale x 1 x i8>, <vscale x 1 x i8>* %x
%z = sext <vscale x 1 x i8> %y to <vscale x 1 x i16>		%z = sext <vscale x 1 x i8> %y to <vscale x 1 x i16>
ret <vscale x 1 x i16> %z		ret <vscale x 1 x i16> %z
}		}

define <vscale x 1 x i16> @zextload_nxv1i8_nxv1i16(<vscale x 1 x i8>* %x) {		define <vscale x 1 x i16> @zextload_nxv1i8_nxv1i16(<vscale x 1 x i8>* %x) {
; CHECK-LABEL: zextload_nxv1i8_nxv1i16:		; CHECK-LABEL: zextload_nxv1i8_nxv1i16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetvli a1, zero, e8, mf8, ta, mu		; CHECK-NEXT: vsetvli a1, zero, e16, mf4, ta, mu
; CHECK-NEXT: vle8.v v9, (a0)		; CHECK-NEXT: vle8.v v9, (a0)
; CHECK-NEXT: vsetvli zero, zero, e16, mf4, ta, mu
; CHECK-NEXT: vzext.vf2 v8, v9		; CHECK-NEXT: vzext.vf2 v8, v9
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%y = load <vscale x 1 x i8>, <vscale x 1 x i8>* %x		%y = load <vscale x 1 x i8>, <vscale x 1 x i8>* %x
%z = zext <vscale x 1 x i8> %y to <vscale x 1 x i16>		%z = zext <vscale x 1 x i8> %y to <vscale x 1 x i16>
ret <vscale x 1 x i16> %z		ret <vscale x 1 x i16> %z
}		}

define <vscale x 1 x i32> @sextload_nxv1i8_nxv1i32(<vscale x 1 x i8>* %x) {		define <vscale x 1 x i32> @sextload_nxv1i8_nxv1i32(<vscale x 1 x i8>* %x) {
; CHECK-LABEL: sextload_nxv1i8_nxv1i32:		; CHECK-LABEL: sextload_nxv1i8_nxv1i32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetvli a1, zero, e8, mf8, ta, mu		; CHECK-NEXT: vsetvli a1, zero, e32, mf2, ta, mu
; CHECK-NEXT: vle8.v v9, (a0)		; CHECK-NEXT: vle8.v v9, (a0)
; CHECK-NEXT: vsetvli zero, zero, e32, mf2, ta, mu
; CHECK-NEXT: vsext.vf4 v8, v9		; CHECK-NEXT: vsext.vf4 v8, v9
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%y = load <vscale x 1 x i8>, <vscale x 1 x i8>* %x		%y = load <vscale x 1 x i8>, <vscale x 1 x i8>* %x
%z = sext <vscale x 1 x i8> %y to <vscale x 1 x i32>		%z = sext <vscale x 1 x i8> %y to <vscale x 1 x i32>
ret <vscale x 1 x i32> %z		ret <vscale x 1 x i32> %z
}		}

define <vscale x 1 x i32> @zextload_nxv1i8_nxv1i32(<vscale x 1 x i8>* %x) {		define <vscale x 1 x i32> @zextload_nxv1i8_nxv1i32(<vscale x 1 x i8>* %x) {
; CHECK-LABEL: zextload_nxv1i8_nxv1i32:		; CHECK-LABEL: zextload_nxv1i8_nxv1i32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetvli a1, zero, e8, mf8, ta, mu		; CHECK-NEXT: vsetvli a1, zero, e32, mf2, ta, mu
; CHECK-NEXT: vle8.v v9, (a0)		; CHECK-NEXT: vle8.v v9, (a0)
; CHECK-NEXT: vsetvli zero, zero, e32, mf2, ta, mu
; CHECK-NEXT: vzext.vf4 v8, v9		; CHECK-NEXT: vzext.vf4 v8, v9
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%y = load <vscale x 1 x i8>, <vscale x 1 x i8>* %x		%y = load <vscale x 1 x i8>, <vscale x 1 x i8>* %x
%z = zext <vscale x 1 x i8> %y to <vscale x 1 x i32>		%z = zext <vscale x 1 x i8> %y to <vscale x 1 x i32>
ret <vscale x 1 x i32> %z		ret <vscale x 1 x i32> %z
}		}

define <vscale x 1 x i64> @sextload_nxv1i8_nxv1i64(<vscale x 1 x i8>* %x) {		define <vscale x 1 x i64> @sextload_nxv1i8_nxv1i64(<vscale x 1 x i8>* %x) {
; CHECK-LABEL: sextload_nxv1i8_nxv1i64:		; CHECK-LABEL: sextload_nxv1i8_nxv1i64:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetvli a1, zero, e8, mf8, ta, mu		; CHECK-NEXT: vsetvli a1, zero, e64, m1, ta, mu
; CHECK-NEXT: vle8.v v9, (a0)		; CHECK-NEXT: vle8.v v9, (a0)
; CHECK-NEXT: vsetvli zero, zero, e64, m1, ta, mu
; CHECK-NEXT: vsext.vf8 v8, v9		; CHECK-NEXT: vsext.vf8 v8, v9
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%y = load <vscale x 1 x i8>, <vscale x 1 x i8>* %x		%y = load <vscale x 1 x i8>, <vscale x 1 x i8>* %x
%z = sext <vscale x 1 x i8> %y to <vscale x 1 x i64>		%z = sext <vscale x 1 x i8> %y to <vscale x 1 x i64>
ret <vscale x 1 x i64> %z		ret <vscale x 1 x i64> %z
}		}

define <vscale x 1 x i64> @zextload_nxv1i8_nxv1i64(<vscale x 1 x i8>* %x) {		define <vscale x 1 x i64> @zextload_nxv1i8_nxv1i64(<vscale x 1 x i8>* %x) {
; CHECK-LABEL: zextload_nxv1i8_nxv1i64:		; CHECK-LABEL: zextload_nxv1i8_nxv1i64:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetvli a1, zero, e8, mf8, ta, mu		; CHECK-NEXT: vsetvli a1, zero, e64, m1, ta, mu
; CHECK-NEXT: vle8.v v9, (a0)		; CHECK-NEXT: vle8.v v9, (a0)
; CHECK-NEXT: vsetvli zero, zero, e64, m1, ta, mu
; CHECK-NEXT: vzext.vf8 v8, v9		; CHECK-NEXT: vzext.vf8 v8, v9
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%y = load <vscale x 1 x i8>, <vscale x 1 x i8>* %x		%y = load <vscale x 1 x i8>, <vscale x 1 x i8>* %x
%z = zext <vscale x 1 x i8> %y to <vscale x 1 x i64>		%z = zext <vscale x 1 x i8> %y to <vscale x 1 x i64>
ret <vscale x 1 x i64> %z		ret <vscale x 1 x i64> %z
}		}

define <vscale x 2 x i16> @sextload_nxv2i8_nxv2i16(<vscale x 2 x i8>* %x) {		define <vscale x 2 x i16> @sextload_nxv2i8_nxv2i16(<vscale x 2 x i8>* %x) {
; CHECK-LABEL: sextload_nxv2i8_nxv2i16:		; CHECK-LABEL: sextload_nxv2i8_nxv2i16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetvli a1, zero, e8, mf4, ta, mu		; CHECK-NEXT: vsetvli a1, zero, e16, mf2, ta, mu
; CHECK-NEXT: vle8.v v9, (a0)		; CHECK-NEXT: vle8.v v9, (a0)
; CHECK-NEXT: vsetvli zero, zero, e16, mf2, ta, mu
; CHECK-NEXT: vsext.vf2 v8, v9		; CHECK-NEXT: vsext.vf2 v8, v9
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%y = load <vscale x 2 x i8>, <vscale x 2 x i8>* %x		%y = load <vscale x 2 x i8>, <vscale x 2 x i8>* %x
%z = sext <vscale x 2 x i8> %y to <vscale x 2 x i16>		%z = sext <vscale x 2 x i8> %y to <vscale x 2 x i16>
ret <vscale x 2 x i16> %z		ret <vscale x 2 x i16> %z
}		}

define <vscale x 2 x i16> @zextload_nxv2i8_nxv2i16(<vscale x 2 x i8>* %x) {		define <vscale x 2 x i16> @zextload_nxv2i8_nxv2i16(<vscale x 2 x i8>* %x) {
; CHECK-LABEL: zextload_nxv2i8_nxv2i16:		; CHECK-LABEL: zextload_nxv2i8_nxv2i16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetvli a1, zero, e8, mf4, ta, mu		; CHECK-NEXT: vsetvli a1, zero, e16, mf2, ta, mu
; CHECK-NEXT: vle8.v v9, (a0)		; CHECK-NEXT: vle8.v v9, (a0)
; CHECK-NEXT: vsetvli zero, zero, e16, mf2, ta, mu
; CHECK-NEXT: vzext.vf2 v8, v9		; CHECK-NEXT: vzext.vf2 v8, v9
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%y = load <vscale x 2 x i8>, <vscale x 2 x i8>* %x		%y = load <vscale x 2 x i8>, <vscale x 2 x i8>* %x
%z = zext <vscale x 2 x i8> %y to <vscale x 2 x i16>		%z = zext <vscale x 2 x i8> %y to <vscale x 2 x i16>
ret <vscale x 2 x i16> %z		ret <vscale x 2 x i16> %z
}		}

define <vscale x 2 x i32> @sextload_nxv2i8_nxv2i32(<vscale x 2 x i8>* %x) {		define <vscale x 2 x i32> @sextload_nxv2i8_nxv2i32(<vscale x 2 x i8>* %x) {
; CHECK-LABEL: sextload_nxv2i8_nxv2i32:		; CHECK-LABEL: sextload_nxv2i8_nxv2i32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetvli a1, zero, e8, mf4, ta, mu		; CHECK-NEXT: vsetvli a1, zero, e32, m1, ta, mu
; CHECK-NEXT: vle8.v v9, (a0)		; CHECK-NEXT: vle8.v v9, (a0)
; CHECK-NEXT: vsetvli zero, zero, e32, m1, ta, mu
; CHECK-NEXT: vsext.vf4 v8, v9		; CHECK-NEXT: vsext.vf4 v8, v9
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%y = load <vscale x 2 x i8>, <vscale x 2 x i8>* %x		%y = load <vscale x 2 x i8>, <vscale x 2 x i8>* %x
%z = sext <vscale x 2 x i8> %y to <vscale x 2 x i32>		%z = sext <vscale x 2 x i8> %y to <vscale x 2 x i32>
ret <vscale x 2 x i32> %z		ret <vscale x 2 x i32> %z
}		}

define <vscale x 2 x i32> @zextload_nxv2i8_nxv2i32(<vscale x 2 x i8>* %x) {		define <vscale x 2 x i32> @zextload_nxv2i8_nxv2i32(<vscale x 2 x i8>* %x) {
; CHECK-LABEL: zextload_nxv2i8_nxv2i32:		; CHECK-LABEL: zextload_nxv2i8_nxv2i32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetvli a1, zero, e8, mf4, ta, mu		; CHECK-NEXT: vsetvli a1, zero, e32, m1, ta, mu
; CHECK-NEXT: vle8.v v9, (a0)		; CHECK-NEXT: vle8.v v9, (a0)
; CHECK-NEXT: vsetvli zero, zero, e32, m1, ta, mu
; CHECK-NEXT: vzext.vf4 v8, v9		; CHECK-NEXT: vzext.vf4 v8, v9
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%y = load <vscale x 2 x i8>, <vscale x 2 x i8>* %x		%y = load <vscale x 2 x i8>, <vscale x 2 x i8>* %x
%z = zext <vscale x 2 x i8> %y to <vscale x 2 x i32>		%z = zext <vscale x 2 x i8> %y to <vscale x 2 x i32>
ret <vscale x 2 x i32> %z		ret <vscale x 2 x i32> %z
}		}

define <vscale x 2 x i64> @sextload_nxv2i8_nxv2i64(<vscale x 2 x i8>* %x) {		define <vscale x 2 x i64> @sextload_nxv2i8_nxv2i64(<vscale x 2 x i8>* %x) {
; CHECK-LABEL: sextload_nxv2i8_nxv2i64:		; CHECK-LABEL: sextload_nxv2i8_nxv2i64:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetvli a1, zero, e8, mf4, ta, mu		; CHECK-NEXT: vsetvli a1, zero, e64, m2, ta, mu
; CHECK-NEXT: vle8.v v10, (a0)		; CHECK-NEXT: vle8.v v10, (a0)
; CHECK-NEXT: vsetvli zero, zero, e64, m2, ta, mu
; CHECK-NEXT: vsext.vf8 v8, v10		; CHECK-NEXT: vsext.vf8 v8, v10
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%y = load <vscale x 2 x i8>, <vscale x 2 x i8>* %x		%y = load <vscale x 2 x i8>, <vscale x 2 x i8>* %x
%z = sext <vscale x 2 x i8> %y to <vscale x 2 x i64>		%z = sext <vscale x 2 x i8> %y to <vscale x 2 x i64>
ret <vscale x 2 x i64> %z		ret <vscale x 2 x i64> %z
}		}

define <vscale x 2 x i64> @zextload_nxv2i8_nxv2i64(<vscale x 2 x i8>* %x) {		define <vscale x 2 x i64> @zextload_nxv2i8_nxv2i64(<vscale x 2 x i8>* %x) {
; CHECK-LABEL: zextload_nxv2i8_nxv2i64:		; CHECK-LABEL: zextload_nxv2i8_nxv2i64:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetvli a1, zero, e8, mf4, ta, mu		; CHECK-NEXT: vsetvli a1, zero, e64, m2, ta, mu
; CHECK-NEXT: vle8.v v10, (a0)		; CHECK-NEXT: vle8.v v10, (a0)
; CHECK-NEXT: vsetvli zero, zero, e64, m2, ta, mu
; CHECK-NEXT: vzext.vf8 v8, v10		; CHECK-NEXT: vzext.vf8 v8, v10
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%y = load <vscale x 2 x i8>, <vscale x 2 x i8>* %x		%y = load <vscale x 2 x i8>, <vscale x 2 x i8>* %x
%z = zext <vscale x 2 x i8> %y to <vscale x 2 x i64>		%z = zext <vscale x 2 x i8> %y to <vscale x 2 x i64>
ret <vscale x 2 x i64> %z		ret <vscale x 2 x i64> %z
}		}

define <vscale x 4 x i16> @sextload_nxv4i8_nxv4i16(<vscale x 4 x i8>* %x) {		define <vscale x 4 x i16> @sextload_nxv4i8_nxv4i16(<vscale x 4 x i8>* %x) {
; CHECK-LABEL: sextload_nxv4i8_nxv4i16:		; CHECK-LABEL: sextload_nxv4i8_nxv4i16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetvli a1, zero, e8, mf2, ta, mu		; CHECK-NEXT: vsetvli a1, zero, e16, m1, ta, mu
; CHECK-NEXT: vle8.v v9, (a0)		; CHECK-NEXT: vle8.v v9, (a0)
; CHECK-NEXT: vsetvli zero, zero, e16, m1, ta, mu
; CHECK-NEXT: vsext.vf2 v8, v9		; CHECK-NEXT: vsext.vf2 v8, v9
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%y = load <vscale x 4 x i8>, <vscale x 4 x i8>* %x		%y = load <vscale x 4 x i8>, <vscale x 4 x i8>* %x
%z = sext <vscale x 4 x i8> %y to <vscale x 4 x i16>		%z = sext <vscale x 4 x i8> %y to <vscale x 4 x i16>
ret <vscale x 4 x i16> %z		ret <vscale x 4 x i16> %z
}		}

define <vscale x 4 x i16> @zextload_nxv4i8_nxv4i16(<vscale x 4 x i8>* %x) {		define <vscale x 4 x i16> @zextload_nxv4i8_nxv4i16(<vscale x 4 x i8>* %x) {
; CHECK-LABEL: zextload_nxv4i8_nxv4i16:		; CHECK-LABEL: zextload_nxv4i8_nxv4i16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetvli a1, zero, e8, mf2, ta, mu		; CHECK-NEXT: vsetvli a1, zero, e16, m1, ta, mu
; CHECK-NEXT: vle8.v v9, (a0)		; CHECK-NEXT: vle8.v v9, (a0)
; CHECK-NEXT: vsetvli zero, zero, e16, m1, ta, mu
; CHECK-NEXT: vzext.vf2 v8, v9		; CHECK-NEXT: vzext.vf2 v8, v9
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%y = load <vscale x 4 x i8>, <vscale x 4 x i8>* %x		%y = load <vscale x 4 x i8>, <vscale x 4 x i8>* %x
%z = zext <vscale x 4 x i8> %y to <vscale x 4 x i16>		%z = zext <vscale x 4 x i8> %y to <vscale x 4 x i16>
ret <vscale x 4 x i16> %z		ret <vscale x 4 x i16> %z
}		}

define <vscale x 4 x i32> @sextload_nxv4i8_nxv4i32(<vscale x 4 x i8>* %x) {		define <vscale x 4 x i32> @sextload_nxv4i8_nxv4i32(<vscale x 4 x i8>* %x) {
; CHECK-LABEL: sextload_nxv4i8_nxv4i32:		; CHECK-LABEL: sextload_nxv4i8_nxv4i32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetvli a1, zero, e8, mf2, ta, mu		; CHECK-NEXT: vsetvli a1, zero, e32, m2, ta, mu
; CHECK-NEXT: vle8.v v10, (a0)		; CHECK-NEXT: vle8.v v10, (a0)
; CHECK-NEXT: vsetvli zero, zero, e32, m2, ta, mu
; CHECK-NEXT: vsext.vf4 v8, v10		; CHECK-NEXT: vsext.vf4 v8, v10
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%y = load <vscale x 4 x i8>, <vscale x 4 x i8>* %x		%y = load <vscale x 4 x i8>, <vscale x 4 x i8>* %x
%z = sext <vscale x 4 x i8> %y to <vscale x 4 x i32>		%z = sext <vscale x 4 x i8> %y to <vscale x 4 x i32>
ret <vscale x 4 x i32> %z		ret <vscale x 4 x i32> %z
}		}

define <vscale x 4 x i32> @zextload_nxv4i8_nxv4i32(<vscale x 4 x i8>* %x) {		define <vscale x 4 x i32> @zextload_nxv4i8_nxv4i32(<vscale x 4 x i8>* %x) {
; CHECK-LABEL: zextload_nxv4i8_nxv4i32:		; CHECK-LABEL: zextload_nxv4i8_nxv4i32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetvli a1, zero, e8, mf2, ta, mu		; CHECK-NEXT: vsetvli a1, zero, e32, m2, ta, mu
; CHECK-NEXT: vle8.v v10, (a0)		; CHECK-NEXT: vle8.v v10, (a0)
; CHECK-NEXT: vsetvli zero, zero, e32, m2, ta, mu
; CHECK-NEXT: vzext.vf4 v8, v10		; CHECK-NEXT: vzext.vf4 v8, v10
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%y = load <vscale x 4 x i8>, <vscale x 4 x i8>* %x		%y = load <vscale x 4 x i8>, <vscale x 4 x i8>* %x
%z = zext <vscale x 4 x i8> %y to <vscale x 4 x i32>		%z = zext <vscale x 4 x i8> %y to <vscale x 4 x i32>
ret <vscale x 4 x i32> %z		ret <vscale x 4 x i32> %z
}		}

define <vscale x 4 x i64> @sextload_nxv4i8_nxv4i64(<vscale x 4 x i8>* %x) {		define <vscale x 4 x i64> @sextload_nxv4i8_nxv4i64(<vscale x 4 x i8>* %x) {
; CHECK-LABEL: sextload_nxv4i8_nxv4i64:		; CHECK-LABEL: sextload_nxv4i8_nxv4i64:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetvli a1, zero, e8, mf2, ta, mu		; CHECK-NEXT: vsetvli a1, zero, e64, m4, ta, mu
; CHECK-NEXT: vle8.v v12, (a0)		; CHECK-NEXT: vle8.v v12, (a0)
; CHECK-NEXT: vsetvli zero, zero, e64, m4, ta, mu
; CHECK-NEXT: vsext.vf8 v8, v12		; CHECK-NEXT: vsext.vf8 v8, v12
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%y = load <vscale x 4 x i8>, <vscale x 4 x i8>* %x		%y = load <vscale x 4 x i8>, <vscale x 4 x i8>* %x
%z = sext <vscale x 4 x i8> %y to <vscale x 4 x i64>		%z = sext <vscale x 4 x i8> %y to <vscale x 4 x i64>
ret <vscale x 4 x i64> %z		ret <vscale x 4 x i64> %z
}		}

define <vscale x 4 x i64> @zextload_nxv4i8_nxv4i64(<vscale x 4 x i8>* %x) {		define <vscale x 4 x i64> @zextload_nxv4i8_nxv4i64(<vscale x 4 x i8>* %x) {
; CHECK-LABEL: zextload_nxv4i8_nxv4i64:		; CHECK-LABEL: zextload_nxv4i8_nxv4i64:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetvli a1, zero, e8, mf2, ta, mu		; CHECK-NEXT: vsetvli a1, zero, e64, m4, ta, mu
; CHECK-NEXT: vle8.v v12, (a0)		; CHECK-NEXT: vle8.v v12, (a0)
; CHECK-NEXT: vsetvli zero, zero, e64, m4, ta, mu
; CHECK-NEXT: vzext.vf8 v8, v12		; CHECK-NEXT: vzext.vf8 v8, v12
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%y = load <vscale x 4 x i8>, <vscale x 4 x i8>* %x		%y = load <vscale x 4 x i8>, <vscale x 4 x i8>* %x
%z = zext <vscale x 4 x i8> %y to <vscale x 4 x i64>		%z = zext <vscale x 4 x i8> %y to <vscale x 4 x i64>
ret <vscale x 4 x i64> %z		ret <vscale x 4 x i64> %z
}		}

define <vscale x 8 x i16> @sextload_nxv8i8_nxv8i16(<vscale x 8 x i8>* %x) {		define <vscale x 8 x i16> @sextload_nxv8i8_nxv8i16(<vscale x 8 x i8>* %x) {
▲ Show 20 Lines • Show All 163 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%y = trunc <vscale x 1 x i16> %x to <vscale x 1 x i8>		%y = trunc <vscale x 1 x i16> %x to <vscale x 1 x i8>
store <vscale x 1 x i8> %y, <vscale x 1 x i8>* %z		store <vscale x 1 x i8> %y, <vscale x 1 x i8>* %z
ret void		ret void
}		}

define <vscale x 1 x i32> @sextload_nxv1i16_nxv1i32(<vscale x 1 x i16>* %x) {		define <vscale x 1 x i32> @sextload_nxv1i16_nxv1i32(<vscale x 1 x i16>* %x) {
; CHECK-LABEL: sextload_nxv1i16_nxv1i32:		; CHECK-LABEL: sextload_nxv1i16_nxv1i32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetvli a1, zero, e16, mf4, ta, mu		; CHECK-NEXT: vsetvli a1, zero, e32, mf2, ta, mu
; CHECK-NEXT: vle16.v v9, (a0)		; CHECK-NEXT: vle16.v v9, (a0)
; CHECK-NEXT: vsetvli zero, zero, e32, mf2, ta, mu
; CHECK-NEXT: vsext.vf2 v8, v9		; CHECK-NEXT: vsext.vf2 v8, v9
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%y = load <vscale x 1 x i16>, <vscale x 1 x i16>* %x		%y = load <vscale x 1 x i16>, <vscale x 1 x i16>* %x
%z = sext <vscale x 1 x i16> %y to <vscale x 1 x i32>		%z = sext <vscale x 1 x i16> %y to <vscale x 1 x i32>
ret <vscale x 1 x i32> %z		ret <vscale x 1 x i32> %z
}		}

define <vscale x 1 x i32> @zextload_nxv1i16_nxv1i32(<vscale x 1 x i16>* %x) {		define <vscale x 1 x i32> @zextload_nxv1i16_nxv1i32(<vscale x 1 x i16>* %x) {
; CHECK-LABEL: zextload_nxv1i16_nxv1i32:		; CHECK-LABEL: zextload_nxv1i16_nxv1i32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetvli a1, zero, e16, mf4, ta, mu		; CHECK-NEXT: vsetvli a1, zero, e32, mf2, ta, mu
; CHECK-NEXT: vle16.v v9, (a0)		; CHECK-NEXT: vle16.v v9, (a0)
; CHECK-NEXT: vsetvli zero, zero, e32, mf2, ta, mu
; CHECK-NEXT: vzext.vf2 v8, v9		; CHECK-NEXT: vzext.vf2 v8, v9
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%y = load <vscale x 1 x i16>, <vscale x 1 x i16>* %x		%y = load <vscale x 1 x i16>, <vscale x 1 x i16>* %x
%z = zext <vscale x 1 x i16> %y to <vscale x 1 x i32>		%z = zext <vscale x 1 x i16> %y to <vscale x 1 x i32>
ret <vscale x 1 x i32> %z		ret <vscale x 1 x i32> %z
}		}

define <vscale x 1 x i64> @sextload_nxv1i16_nxv1i64(<vscale x 1 x i16>* %x) {		define <vscale x 1 x i64> @sextload_nxv1i16_nxv1i64(<vscale x 1 x i16>* %x) {
; CHECK-LABEL: sextload_nxv1i16_nxv1i64:		; CHECK-LABEL: sextload_nxv1i16_nxv1i64:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetvli a1, zero, e16, mf4, ta, mu		; CHECK-NEXT: vsetvli a1, zero, e64, m1, ta, mu
; CHECK-NEXT: vle16.v v9, (a0)		; CHECK-NEXT: vle16.v v9, (a0)
; CHECK-NEXT: vsetvli zero, zero, e64, m1, ta, mu
; CHECK-NEXT: vsext.vf4 v8, v9		; CHECK-NEXT: vsext.vf4 v8, v9
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%y = load <vscale x 1 x i16>, <vscale x 1 x i16>* %x		%y = load <vscale x 1 x i16>, <vscale x 1 x i16>* %x
%z = sext <vscale x 1 x i16> %y to <vscale x 1 x i64>		%z = sext <vscale x 1 x i16> %y to <vscale x 1 x i64>
ret <vscale x 1 x i64> %z		ret <vscale x 1 x i64> %z
}		}

define <vscale x 1 x i64> @zextload_nxv1i16_nxv1i64(<vscale x 1 x i16>* %x) {		define <vscale x 1 x i64> @zextload_nxv1i16_nxv1i64(<vscale x 1 x i16>* %x) {
; CHECK-LABEL: zextload_nxv1i16_nxv1i64:		; CHECK-LABEL: zextload_nxv1i16_nxv1i64:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetvli a1, zero, e16, mf4, ta, mu		; CHECK-NEXT: vsetvli a1, zero, e64, m1, ta, mu
; CHECK-NEXT: vle16.v v9, (a0)		; CHECK-NEXT: vle16.v v9, (a0)
; CHECK-NEXT: vsetvli zero, zero, e64, m1, ta, mu
; CHECK-NEXT: vzext.vf4 v8, v9		; CHECK-NEXT: vzext.vf4 v8, v9
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%y = load <vscale x 1 x i16>, <vscale x 1 x i16>* %x		%y = load <vscale x 1 x i16>, <vscale x 1 x i16>* %x
%z = zext <vscale x 1 x i16> %y to <vscale x 1 x i64>		%z = zext <vscale x 1 x i16> %y to <vscale x 1 x i64>
ret <vscale x 1 x i64> %z		ret <vscale x 1 x i64> %z
}		}

define void @truncstore_nxv2i16_nxv2i8(<vscale x 2 x i16> %x, <vscale x 2 x i8>* %z) {		define void @truncstore_nxv2i16_nxv2i8(<vscale x 2 x i16> %x, <vscale x 2 x i8>* %z) {
; CHECK-LABEL: truncstore_nxv2i16_nxv2i8:		; CHECK-LABEL: truncstore_nxv2i16_nxv2i8:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetvli a1, zero, e8, mf4, ta, mu		; CHECK-NEXT: vsetvli a1, zero, e8, mf4, ta, mu
; CHECK-NEXT: vncvt.x.x.w v8, v8		; CHECK-NEXT: vncvt.x.x.w v8, v8
; CHECK-NEXT: vse8.v v8, (a0)		; CHECK-NEXT: vse8.v v8, (a0)
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%y = trunc <vscale x 2 x i16> %x to <vscale x 2 x i8>		%y = trunc <vscale x 2 x i16> %x to <vscale x 2 x i8>
store <vscale x 2 x i8> %y, <vscale x 2 x i8>* %z		store <vscale x 2 x i8> %y, <vscale x 2 x i8>* %z
ret void		ret void
}		}

define <vscale x 2 x i32> @sextload_nxv2i16_nxv2i32(<vscale x 2 x i16>* %x) {		define <vscale x 2 x i32> @sextload_nxv2i16_nxv2i32(<vscale x 2 x i16>* %x) {
; CHECK-LABEL: sextload_nxv2i16_nxv2i32:		; CHECK-LABEL: sextload_nxv2i16_nxv2i32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetvli a1, zero, e16, mf2, ta, mu		; CHECK-NEXT: vsetvli a1, zero, e32, m1, ta, mu
; CHECK-NEXT: vle16.v v9, (a0)		; CHECK-NEXT: vle16.v v9, (a0)
; CHECK-NEXT: vsetvli zero, zero, e32, m1, ta, mu
; CHECK-NEXT: vsext.vf2 v8, v9		; CHECK-NEXT: vsext.vf2 v8, v9
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%y = load <vscale x 2 x i16>, <vscale x 2 x i16>* %x		%y = load <vscale x 2 x i16>, <vscale x 2 x i16>* %x
%z = sext <vscale x 2 x i16> %y to <vscale x 2 x i32>		%z = sext <vscale x 2 x i16> %y to <vscale x 2 x i32>
ret <vscale x 2 x i32> %z		ret <vscale x 2 x i32> %z
}		}

define <vscale x 2 x i32> @zextload_nxv2i16_nxv2i32(<vscale x 2 x i16>* %x) {		define <vscale x 2 x i32> @zextload_nxv2i16_nxv2i32(<vscale x 2 x i16>* %x) {
; CHECK-LABEL: zextload_nxv2i16_nxv2i32:		; CHECK-LABEL: zextload_nxv2i16_nxv2i32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetvli a1, zero, e16, mf2, ta, mu		; CHECK-NEXT: vsetvli a1, zero, e32, m1, ta, mu
; CHECK-NEXT: vle16.v v9, (a0)		; CHECK-NEXT: vle16.v v9, (a0)
; CHECK-NEXT: vsetvli zero, zero, e32, m1, ta, mu
; CHECK-NEXT: vzext.vf2 v8, v9		; CHECK-NEXT: vzext.vf2 v8, v9
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%y = load <vscale x 2 x i16>, <vscale x 2 x i16>* %x		%y = load <vscale x 2 x i16>, <vscale x 2 x i16>* %x
%z = zext <vscale x 2 x i16> %y to <vscale x 2 x i32>		%z = zext <vscale x 2 x i16> %y to <vscale x 2 x i32>
ret <vscale x 2 x i32> %z		ret <vscale x 2 x i32> %z
}		}

define <vscale x 2 x i64> @sextload_nxv2i16_nxv2i64(<vscale x 2 x i16>* %x) {		define <vscale x 2 x i64> @sextload_nxv2i16_nxv2i64(<vscale x 2 x i16>* %x) {
; CHECK-LABEL: sextload_nxv2i16_nxv2i64:		; CHECK-LABEL: sextload_nxv2i16_nxv2i64:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetvli a1, zero, e16, mf2, ta, mu		; CHECK-NEXT: vsetvli a1, zero, e64, m2, ta, mu
; CHECK-NEXT: vle16.v v10, (a0)		; CHECK-NEXT: vle16.v v10, (a0)
; CHECK-NEXT: vsetvli zero, zero, e64, m2, ta, mu
; CHECK-NEXT: vsext.vf4 v8, v10		; CHECK-NEXT: vsext.vf4 v8, v10
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%y = load <vscale x 2 x i16>, <vscale x 2 x i16>* %x		%y = load <vscale x 2 x i16>, <vscale x 2 x i16>* %x
%z = sext <vscale x 2 x i16> %y to <vscale x 2 x i64>		%z = sext <vscale x 2 x i16> %y to <vscale x 2 x i64>
ret <vscale x 2 x i64> %z		ret <vscale x 2 x i64> %z
}		}

define <vscale x 2 x i64> @zextload_nxv2i16_nxv2i64(<vscale x 2 x i16>* %x) {		define <vscale x 2 x i64> @zextload_nxv2i16_nxv2i64(<vscale x 2 x i16>* %x) {
; CHECK-LABEL: zextload_nxv2i16_nxv2i64:		; CHECK-LABEL: zextload_nxv2i16_nxv2i64:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetvli a1, zero, e16, mf2, ta, mu		; CHECK-NEXT: vsetvli a1, zero, e64, m2, ta, mu
; CHECK-NEXT: vle16.v v10, (a0)		; CHECK-NEXT: vle16.v v10, (a0)
; CHECK-NEXT: vsetvli zero, zero, e64, m2, ta, mu
; CHECK-NEXT: vzext.vf4 v8, v10		; CHECK-NEXT: vzext.vf4 v8, v10
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%y = load <vscale x 2 x i16>, <vscale x 2 x i16>* %x		%y = load <vscale x 2 x i16>, <vscale x 2 x i16>* %x
%z = zext <vscale x 2 x i16> %y to <vscale x 2 x i64>		%z = zext <vscale x 2 x i16> %y to <vscale x 2 x i64>
ret <vscale x 2 x i64> %z		ret <vscale x 2 x i64> %z
}		}

define void @truncstore_nxv4i16_nxv4i8(<vscale x 4 x i16> %x, <vscale x 4 x i8>* %z) {		define void @truncstore_nxv4i16_nxv4i8(<vscale x 4 x i16> %x, <vscale x 4 x i8>* %z) {
▲ Show 20 Lines • Show All 188 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%y = trunc <vscale x 1 x i32> %x to <vscale x 1 x i16>		%y = trunc <vscale x 1 x i32> %x to <vscale x 1 x i16>
store <vscale x 1 x i16> %y, <vscale x 1 x i16>* %z		store <vscale x 1 x i16> %y, <vscale x 1 x i16>* %z
ret void		ret void
}		}

define <vscale x 1 x i64> @sextload_nxv1i32_nxv1i64(<vscale x 1 x i32>* %x) {		define <vscale x 1 x i64> @sextload_nxv1i32_nxv1i64(<vscale x 1 x i32>* %x) {
; CHECK-LABEL: sextload_nxv1i32_nxv1i64:		; CHECK-LABEL: sextload_nxv1i32_nxv1i64:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetvli a1, zero, e32, mf2, ta, mu		; CHECK-NEXT: vsetvli a1, zero, e64, m1, ta, mu
; CHECK-NEXT: vle32.v v9, (a0)		; CHECK-NEXT: vle32.v v9, (a0)
; CHECK-NEXT: vsetvli zero, zero, e64, m1, ta, mu
; CHECK-NEXT: vsext.vf2 v8, v9		; CHECK-NEXT: vsext.vf2 v8, v9
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%y = load <vscale x 1 x i32>, <vscale x 1 x i32>* %x		%y = load <vscale x 1 x i32>, <vscale x 1 x i32>* %x
%z = sext <vscale x 1 x i32> %y to <vscale x 1 x i64>		%z = sext <vscale x 1 x i32> %y to <vscale x 1 x i64>
ret <vscale x 1 x i64> %z		ret <vscale x 1 x i64> %z
}		}

define <vscale x 1 x i64> @zextload_nxv1i32_nxv1i64(<vscale x 1 x i32>* %x) {		define <vscale x 1 x i64> @zextload_nxv1i32_nxv1i64(<vscale x 1 x i32>* %x) {
; CHECK-LABEL: zextload_nxv1i32_nxv1i64:		; CHECK-LABEL: zextload_nxv1i32_nxv1i64:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetvli a1, zero, e32, mf2, ta, mu		; CHECK-NEXT: vsetvli a1, zero, e64, m1, ta, mu
; CHECK-NEXT: vle32.v v9, (a0)		; CHECK-NEXT: vle32.v v9, (a0)
; CHECK-NEXT: vsetvli zero, zero, e64, m1, ta, mu
; CHECK-NEXT: vzext.vf2 v8, v9		; CHECK-NEXT: vzext.vf2 v8, v9
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%y = load <vscale x 1 x i32>, <vscale x 1 x i32>* %x		%y = load <vscale x 1 x i32>, <vscale x 1 x i32>* %x
%z = zext <vscale x 1 x i32> %y to <vscale x 1 x i64>		%z = zext <vscale x 1 x i32> %y to <vscale x 1 x i64>
ret <vscale x 1 x i64> %z		ret <vscale x 1 x i64> %z
}		}

define void @truncstore_nxv2i32_nxv2i8(<vscale x 2 x i32> %x, <vscale x 2 x i8>* %z) {		define void @truncstore_nxv2i32_nxv2i8(<vscale x 2 x i32> %x, <vscale x 2 x i8>* %z) {
▲ Show 20 Lines • Show All 670 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-ctlz.ll

	Show All 33 Lines
	; CHECK-NEXT: vsrl.vi v9, v8, 4			; CHECK-NEXT: vsrl.vi v9, v8, 4
	; CHECK-NEXT: vadd.vv v8, v8, v9			; CHECK-NEXT: vadd.vv v8, v8, v9
	; CHECK-NEXT: vand.vi v8, v8, 15			; CHECK-NEXT: vand.vi v8, v8, 15
	; CHECK-NEXT: vse8.v v8, (a0)			; CHECK-NEXT: vse8.v v8, (a0)
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	;			;
	; LMULMAX8-LABEL: ctlz_v16i8:			; LMULMAX8-LABEL: ctlz_v16i8:
	; LMULMAX8: # %bb.0:			; LMULMAX8: # %bb.0:
	; LMULMAX8-NEXT: vsetivli zero, 16, e8, m1, ta, mu			; LMULMAX8-NEXT: vsetivli zero, 16, e32, m4, ta, mu
	; LMULMAX8-NEXT: vle8.v v8, (a0)			; LMULMAX8-NEXT: vle8.v v8, (a0)
	; LMULMAX8-NEXT: vsetvli zero, zero, e32, m4, ta, mu
	; LMULMAX8-NEXT: vzext.vf4 v12, v8			; LMULMAX8-NEXT: vzext.vf4 v12, v8
	; LMULMAX8-NEXT: vfcvt.f.xu.v v12, v12			; LMULMAX8-NEXT: vfcvt.f.xu.v v12, v12
	; LMULMAX8-NEXT: vsetvli zero, zero, e16, m2, ta, mu			; LMULMAX8-NEXT: vsetvli zero, zero, e16, m2, ta, mu
	; LMULMAX8-NEXT: vnsrl.wi v10, v12, 23			; LMULMAX8-NEXT: vnsrl.wi v10, v12, 23
	; LMULMAX8-NEXT: vsetvli zero, zero, e8, m1, ta, mu			; LMULMAX8-NEXT: vsetvli zero, zero, e8, m1, ta, mu
	; LMULMAX8-NEXT: vncvt.x.x.w v9, v10			; LMULMAX8-NEXT: vncvt.x.x.w v9, v10
	; LMULMAX8-NEXT: li a1, 134			; LMULMAX8-NEXT: li a1, 134
	; LMULMAX8-NEXT: vmseq.vi v0, v8, 0			; LMULMAX8-NEXT: vmseq.vi v0, v8, 0
	▲ Show 20 Lines • Show All 781 Lines • ▼ Show 20 Lines
	; LMULMAX1-NEXT: vand.vi v9, v9, 15			; LMULMAX1-NEXT: vand.vi v9, v9, 15
	; LMULMAX1-NEXT: vse8.v v9, (a0)			; LMULMAX1-NEXT: vse8.v v9, (a0)
	; LMULMAX1-NEXT: vse8.v v8, (a1)			; LMULMAX1-NEXT: vse8.v v8, (a1)
	; LMULMAX1-NEXT: ret			; LMULMAX1-NEXT: ret
	;			;
	; LMULMAX8-LABEL: ctlz_v32i8:			; LMULMAX8-LABEL: ctlz_v32i8:
	; LMULMAX8: # %bb.0:			; LMULMAX8: # %bb.0:
	; LMULMAX8-NEXT: li a1, 32			; LMULMAX8-NEXT: li a1, 32
	; LMULMAX8-NEXT: vsetvli zero, a1, e8, m2, ta, mu			; LMULMAX8-NEXT: vsetvli zero, a1, e32, m8, ta, mu
	; LMULMAX8-NEXT: vle8.v v8, (a0)			; LMULMAX8-NEXT: vle8.v v8, (a0)
	; LMULMAX8-NEXT: vsetvli zero, zero, e32, m8, ta, mu
	; LMULMAX8-NEXT: vzext.vf4 v16, v8			; LMULMAX8-NEXT: vzext.vf4 v16, v8
	; LMULMAX8-NEXT: vfcvt.f.xu.v v16, v16			; LMULMAX8-NEXT: vfcvt.f.xu.v v16, v16
	; LMULMAX8-NEXT: vsetvli zero, zero, e16, m4, ta, mu			; LMULMAX8-NEXT: vsetvli zero, zero, e16, m4, ta, mu
	; LMULMAX8-NEXT: vnsrl.wi v12, v16, 23			; LMULMAX8-NEXT: vnsrl.wi v12, v16, 23
	; LMULMAX8-NEXT: vsetvli zero, zero, e8, m2, ta, mu			; LMULMAX8-NEXT: vsetvli zero, zero, e8, m2, ta, mu
	; LMULMAX8-NEXT: vncvt.x.x.w v10, v12			; LMULMAX8-NEXT: vncvt.x.x.w v10, v12
	; LMULMAX8-NEXT: li a1, 134			; LMULMAX8-NEXT: li a1, 134
	; LMULMAX8-NEXT: vmseq.vi v0, v8, 0			; LMULMAX8-NEXT: vmseq.vi v0, v8, 0
	▲ Show 20 Lines • Show All 809 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-extload-truncstore.ll

Show All 15 Lines	; CHECK-NEXT: ret
%y = load <2 x i1>, <2 x i1>* %x		%y = load <2 x i1>, <2 x i1>* %x
%z = sext <2 x i1> %y to <2 x i16>		%z = sext <2 x i1> %y to <2 x i16>
ret <2 x i16> %z		ret <2 x i16> %z
}		}

define <2 x i16> @sextload_v2i8_v2i16(<2 x i8>* %x) {		define <2 x i16> @sextload_v2i8_v2i16(<2 x i8>* %x) {
; CHECK-LABEL: sextload_v2i8_v2i16:		; CHECK-LABEL: sextload_v2i8_v2i16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 2, e8, mf8, ta, mu		; CHECK-NEXT: vsetivli zero, 2, e16, mf4, ta, mu
; CHECK-NEXT: vle8.v v9, (a0)		; CHECK-NEXT: vle8.v v9, (a0)
; CHECK-NEXT: vsetvli zero, zero, e16, mf4, ta, mu
; CHECK-NEXT: vsext.vf2 v8, v9		; CHECK-NEXT: vsext.vf2 v8, v9
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%y = load <2 x i8>, <2 x i8>* %x		%y = load <2 x i8>, <2 x i8>* %x
%z = sext <2 x i8> %y to <2 x i16>		%z = sext <2 x i8> %y to <2 x i16>
ret <2 x i16> %z		ret <2 x i16> %z
}		}

define <2 x i16> @zextload_v2i8_v2i16(<2 x i8>* %x) {		define <2 x i16> @zextload_v2i8_v2i16(<2 x i8>* %x) {
; CHECK-LABEL: zextload_v2i8_v2i16:		; CHECK-LABEL: zextload_v2i8_v2i16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 2, e8, mf8, ta, mu		; CHECK-NEXT: vsetivli zero, 2, e16, mf4, ta, mu
; CHECK-NEXT: vle8.v v9, (a0)		; CHECK-NEXT: vle8.v v9, (a0)
; CHECK-NEXT: vsetvli zero, zero, e16, mf4, ta, mu
; CHECK-NEXT: vzext.vf2 v8, v9		; CHECK-NEXT: vzext.vf2 v8, v9
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%y = load <2 x i8>, <2 x i8>* %x		%y = load <2 x i8>, <2 x i8>* %x
%z = zext <2 x i8> %y to <2 x i16>		%z = zext <2 x i8> %y to <2 x i16>
ret <2 x i16> %z		ret <2 x i16> %z
}		}

define <2 x i32> @sextload_v2i8_v2i32(<2 x i8>* %x) {		define <2 x i32> @sextload_v2i8_v2i32(<2 x i8>* %x) {
; CHECK-LABEL: sextload_v2i8_v2i32:		; CHECK-LABEL: sextload_v2i8_v2i32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 2, e8, mf8, ta, mu		; CHECK-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
; CHECK-NEXT: vle8.v v9, (a0)		; CHECK-NEXT: vle8.v v9, (a0)
; CHECK-NEXT: vsetvli zero, zero, e32, mf2, ta, mu
; CHECK-NEXT: vsext.vf4 v8, v9		; CHECK-NEXT: vsext.vf4 v8, v9
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%y = load <2 x i8>, <2 x i8>* %x		%y = load <2 x i8>, <2 x i8>* %x
%z = sext <2 x i8> %y to <2 x i32>		%z = sext <2 x i8> %y to <2 x i32>
ret <2 x i32> %z		ret <2 x i32> %z
}		}

define <2 x i32> @zextload_v2i8_v2i32(<2 x i8>* %x) {		define <2 x i32> @zextload_v2i8_v2i32(<2 x i8>* %x) {
; CHECK-LABEL: zextload_v2i8_v2i32:		; CHECK-LABEL: zextload_v2i8_v2i32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 2, e8, mf8, ta, mu		; CHECK-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
; CHECK-NEXT: vle8.v v9, (a0)		; CHECK-NEXT: vle8.v v9, (a0)
; CHECK-NEXT: vsetvli zero, zero, e32, mf2, ta, mu
; CHECK-NEXT: vzext.vf4 v8, v9		; CHECK-NEXT: vzext.vf4 v8, v9
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%y = load <2 x i8>, <2 x i8>* %x		%y = load <2 x i8>, <2 x i8>* %x
%z = zext <2 x i8> %y to <2 x i32>		%z = zext <2 x i8> %y to <2 x i32>
ret <2 x i32> %z		ret <2 x i32> %z
}		}

define <2 x i64> @sextload_v2i8_v2i64(<2 x i8>* %x) {		define <2 x i64> @sextload_v2i8_v2i64(<2 x i8>* %x) {
; CHECK-LABEL: sextload_v2i8_v2i64:		; CHECK-LABEL: sextload_v2i8_v2i64:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 2, e8, mf8, ta, mu		; CHECK-NEXT: vsetivli zero, 2, e64, m1, ta, mu
; CHECK-NEXT: vle8.v v9, (a0)		; CHECK-NEXT: vle8.v v9, (a0)
; CHECK-NEXT: vsetvli zero, zero, e64, m1, ta, mu
; CHECK-NEXT: vsext.vf8 v8, v9		; CHECK-NEXT: vsext.vf8 v8, v9
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%y = load <2 x i8>, <2 x i8>* %x		%y = load <2 x i8>, <2 x i8>* %x
%z = sext <2 x i8> %y to <2 x i64>		%z = sext <2 x i8> %y to <2 x i64>
ret <2 x i64> %z		ret <2 x i64> %z
}		}

define <2 x i64> @zextload_v2i8_v2i64(<2 x i8>* %x) {		define <2 x i64> @zextload_v2i8_v2i64(<2 x i8>* %x) {
; CHECK-LABEL: zextload_v2i8_v2i64:		; CHECK-LABEL: zextload_v2i8_v2i64:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 2, e8, mf8, ta, mu		; CHECK-NEXT: vsetivli zero, 2, e64, m1, ta, mu
; CHECK-NEXT: vle8.v v9, (a0)		; CHECK-NEXT: vle8.v v9, (a0)
; CHECK-NEXT: vsetvli zero, zero, e64, m1, ta, mu
; CHECK-NEXT: vzext.vf8 v8, v9		; CHECK-NEXT: vzext.vf8 v8, v9
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%y = load <2 x i8>, <2 x i8>* %x		%y = load <2 x i8>, <2 x i8>* %x
%z = zext <2 x i8> %y to <2 x i64>		%z = zext <2 x i8> %y to <2 x i64>
ret <2 x i64> %z		ret <2 x i64> %z
}		}

define <4 x i16> @sextload_v4i8_v4i16(<4 x i8>* %x) {		define <4 x i16> @sextload_v4i8_v4i16(<4 x i8>* %x) {
; CHECK-LABEL: sextload_v4i8_v4i16:		; CHECK-LABEL: sextload_v4i8_v4i16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 4, e8, mf4, ta, mu		; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, mu
; CHECK-NEXT: vle8.v v9, (a0)		; CHECK-NEXT: vle8.v v9, (a0)
; CHECK-NEXT: vsetvli zero, zero, e16, mf2, ta, mu
; CHECK-NEXT: vsext.vf2 v8, v9		; CHECK-NEXT: vsext.vf2 v8, v9
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%y = load <4 x i8>, <4 x i8>* %x		%y = load <4 x i8>, <4 x i8>* %x
%z = sext <4 x i8> %y to <4 x i16>		%z = sext <4 x i8> %y to <4 x i16>
ret <4 x i16> %z		ret <4 x i16> %z
}		}

define <4 x i16> @zextload_v4i8_v4i16(<4 x i8>* %x) {		define <4 x i16> @zextload_v4i8_v4i16(<4 x i8>* %x) {
; CHECK-LABEL: zextload_v4i8_v4i16:		; CHECK-LABEL: zextload_v4i8_v4i16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 4, e8, mf4, ta, mu		; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, mu
; CHECK-NEXT: vle8.v v9, (a0)		; CHECK-NEXT: vle8.v v9, (a0)
; CHECK-NEXT: vsetvli zero, zero, e16, mf2, ta, mu
; CHECK-NEXT: vzext.vf2 v8, v9		; CHECK-NEXT: vzext.vf2 v8, v9
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%y = load <4 x i8>, <4 x i8>* %x		%y = load <4 x i8>, <4 x i8>* %x
%z = zext <4 x i8> %y to <4 x i16>		%z = zext <4 x i8> %y to <4 x i16>
ret <4 x i16> %z		ret <4 x i16> %z
}		}

define <4 x i32> @sextload_v4i8_v4i32(<4 x i8>* %x) {		define <4 x i32> @sextload_v4i8_v4i32(<4 x i8>* %x) {
; CHECK-LABEL: sextload_v4i8_v4i32:		; CHECK-LABEL: sextload_v4i8_v4i32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 4, e8, mf4, ta, mu		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: vle8.v v9, (a0)		; CHECK-NEXT: vle8.v v9, (a0)
; CHECK-NEXT: vsetvli zero, zero, e32, m1, ta, mu
; CHECK-NEXT: vsext.vf4 v8, v9		; CHECK-NEXT: vsext.vf4 v8, v9
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%y = load <4 x i8>, <4 x i8>* %x		%y = load <4 x i8>, <4 x i8>* %x
%z = sext <4 x i8> %y to <4 x i32>		%z = sext <4 x i8> %y to <4 x i32>
ret <4 x i32> %z		ret <4 x i32> %z
}		}

define <4 x i32> @zextload_v4i8_v4i32(<4 x i8>* %x) {		define <4 x i32> @zextload_v4i8_v4i32(<4 x i8>* %x) {
; CHECK-LABEL: zextload_v4i8_v4i32:		; CHECK-LABEL: zextload_v4i8_v4i32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 4, e8, mf4, ta, mu		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: vle8.v v9, (a0)		; CHECK-NEXT: vle8.v v9, (a0)
; CHECK-NEXT: vsetvli zero, zero, e32, m1, ta, mu
; CHECK-NEXT: vzext.vf4 v8, v9		; CHECK-NEXT: vzext.vf4 v8, v9
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%y = load <4 x i8>, <4 x i8>* %x		%y = load <4 x i8>, <4 x i8>* %x
%z = zext <4 x i8> %y to <4 x i32>		%z = zext <4 x i8> %y to <4 x i32>
ret <4 x i32> %z		ret <4 x i32> %z
}		}

define <4 x i64> @sextload_v4i8_v4i64(<4 x i8>* %x) {		define <4 x i64> @sextload_v4i8_v4i64(<4 x i8>* %x) {
; LMULMAX1-LABEL: sextload_v4i8_v4i64:		; LMULMAX1-LABEL: sextload_v4i8_v4i64:
; LMULMAX1: # %bb.0:		; LMULMAX1: # %bb.0:
; LMULMAX1-NEXT: vsetivli zero, 4, e8, mf4, ta, mu		; LMULMAX1-NEXT: vsetivli zero, 4, e8, mf4, ta, mu
; LMULMAX1-NEXT: vle8.v v10, (a0)		; LMULMAX1-NEXT: vle8.v v10, (a0)
; LMULMAX1-NEXT: vsetivli zero, 2, e8, mf4, ta, mu		; LMULMAX1-NEXT: vsetivli zero, 2, e8, mf4, ta, mu
; LMULMAX1-NEXT: vslidedown.vi v8, v10, 2		; LMULMAX1-NEXT: vslidedown.vi v8, v10, 2
; LMULMAX1-NEXT: vsetivli zero, 2, e64, m1, ta, mu		; LMULMAX1-NEXT: vsetivli zero, 2, e64, m1, ta, mu
; LMULMAX1-NEXT: vsext.vf8 v9, v8		; LMULMAX1-NEXT: vsext.vf8 v9, v8
; LMULMAX1-NEXT: vsext.vf8 v8, v10		; LMULMAX1-NEXT: vsext.vf8 v8, v10
; LMULMAX1-NEXT: ret		; LMULMAX1-NEXT: ret
;		;
; LMULMAX4-LABEL: sextload_v4i8_v4i64:		; LMULMAX4-LABEL: sextload_v4i8_v4i64:
; LMULMAX4: # %bb.0:		; LMULMAX4: # %bb.0:
; LMULMAX4-NEXT: vsetivli zero, 4, e8, mf4, ta, mu		; LMULMAX4-NEXT: vsetivli zero, 4, e64, m2, ta, mu
; LMULMAX4-NEXT: vle8.v v10, (a0)		; LMULMAX4-NEXT: vle8.v v10, (a0)
; LMULMAX4-NEXT: vsetvli zero, zero, e64, m2, ta, mu
; LMULMAX4-NEXT: vsext.vf8 v8, v10		; LMULMAX4-NEXT: vsext.vf8 v8, v10
; LMULMAX4-NEXT: ret		; LMULMAX4-NEXT: ret
%y = load <4 x i8>, <4 x i8>* %x		%y = load <4 x i8>, <4 x i8>* %x
%z = sext <4 x i8> %y to <4 x i64>		%z = sext <4 x i8> %y to <4 x i64>
ret <4 x i64> %z		ret <4 x i64> %z
}		}

define <4 x i64> @zextload_v4i8_v4i64(<4 x i8>* %x) {		define <4 x i64> @zextload_v4i8_v4i64(<4 x i8>* %x) {
; LMULMAX1-LABEL: zextload_v4i8_v4i64:		; LMULMAX1-LABEL: zextload_v4i8_v4i64:
; LMULMAX1: # %bb.0:		; LMULMAX1: # %bb.0:
; LMULMAX1-NEXT: vsetivli zero, 4, e8, mf4, ta, mu		; LMULMAX1-NEXT: vsetivli zero, 4, e8, mf4, ta, mu
; LMULMAX1-NEXT: vle8.v v10, (a0)		; LMULMAX1-NEXT: vle8.v v10, (a0)
; LMULMAX1-NEXT: vsetivli zero, 2, e8, mf4, ta, mu		; LMULMAX1-NEXT: vsetivli zero, 2, e8, mf4, ta, mu
; LMULMAX1-NEXT: vslidedown.vi v8, v10, 2		; LMULMAX1-NEXT: vslidedown.vi v8, v10, 2
; LMULMAX1-NEXT: vsetivli zero, 2, e64, m1, ta, mu		; LMULMAX1-NEXT: vsetivli zero, 2, e64, m1, ta, mu
; LMULMAX1-NEXT: vzext.vf8 v9, v8		; LMULMAX1-NEXT: vzext.vf8 v9, v8
; LMULMAX1-NEXT: vzext.vf8 v8, v10		; LMULMAX1-NEXT: vzext.vf8 v8, v10
; LMULMAX1-NEXT: ret		; LMULMAX1-NEXT: ret
;		;
; LMULMAX4-LABEL: zextload_v4i8_v4i64:		; LMULMAX4-LABEL: zextload_v4i8_v4i64:
; LMULMAX4: # %bb.0:		; LMULMAX4: # %bb.0:
; LMULMAX4-NEXT: vsetivli zero, 4, e8, mf4, ta, mu		; LMULMAX4-NEXT: vsetivli zero, 4, e64, m2, ta, mu
; LMULMAX4-NEXT: vle8.v v10, (a0)		; LMULMAX4-NEXT: vle8.v v10, (a0)
; LMULMAX4-NEXT: vsetvli zero, zero, e64, m2, ta, mu
; LMULMAX4-NEXT: vzext.vf8 v8, v10		; LMULMAX4-NEXT: vzext.vf8 v8, v10
; LMULMAX4-NEXT: ret		; LMULMAX4-NEXT: ret
%y = load <4 x i8>, <4 x i8>* %x		%y = load <4 x i8>, <4 x i8>* %x
%z = zext <4 x i8> %y to <4 x i64>		%z = zext <4 x i8> %y to <4 x i64>
ret <4 x i64> %z		ret <4 x i64> %z
}		}

define <8 x i16> @sextload_v8i8_v8i16(<8 x i8>* %x) {		define <8 x i16> @sextload_v8i8_v8i16(<8 x i8>* %x) {
; CHECK-LABEL: sextload_v8i8_v8i16:		; CHECK-LABEL: sextload_v8i8_v8i16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu		; CHECK-NEXT: vsetivli zero, 8, e16, m1, ta, mu
; CHECK-NEXT: vle8.v v9, (a0)		; CHECK-NEXT: vle8.v v9, (a0)
; CHECK-NEXT: vsetvli zero, zero, e16, m1, ta, mu
; CHECK-NEXT: vsext.vf2 v8, v9		; CHECK-NEXT: vsext.vf2 v8, v9
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%y = load <8 x i8>, <8 x i8>* %x		%y = load <8 x i8>, <8 x i8>* %x
%z = sext <8 x i8> %y to <8 x i16>		%z = sext <8 x i8> %y to <8 x i16>
ret <8 x i16> %z		ret <8 x i16> %z
}		}

define <8 x i16> @zextload_v8i8_v8i16(<8 x i8>* %x) {		define <8 x i16> @zextload_v8i8_v8i16(<8 x i8>* %x) {
; CHECK-LABEL: zextload_v8i8_v8i16:		; CHECK-LABEL: zextload_v8i8_v8i16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu		; CHECK-NEXT: vsetivli zero, 8, e16, m1, ta, mu
; CHECK-NEXT: vle8.v v9, (a0)		; CHECK-NEXT: vle8.v v9, (a0)
; CHECK-NEXT: vsetvli zero, zero, e16, m1, ta, mu
; CHECK-NEXT: vzext.vf2 v8, v9		; CHECK-NEXT: vzext.vf2 v8, v9
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%y = load <8 x i8>, <8 x i8>* %x		%y = load <8 x i8>, <8 x i8>* %x
%z = zext <8 x i8> %y to <8 x i16>		%z = zext <8 x i8> %y to <8 x i16>
ret <8 x i16> %z		ret <8 x i16> %z
}		}

define <8 x i32> @sextload_v8i8_v8i32(<8 x i8>* %x) {		define <8 x i32> @sextload_v8i8_v8i32(<8 x i8>* %x) {
; LMULMAX1-LABEL: sextload_v8i8_v8i32:		; LMULMAX1-LABEL: sextload_v8i8_v8i32:
; LMULMAX1: # %bb.0:		; LMULMAX1: # %bb.0:
; LMULMAX1-NEXT: vsetivli zero, 8, e8, mf2, ta, mu		; LMULMAX1-NEXT: vsetivli zero, 8, e8, mf2, ta, mu
; LMULMAX1-NEXT: vle8.v v10, (a0)		; LMULMAX1-NEXT: vle8.v v10, (a0)
; LMULMAX1-NEXT: vsetivli zero, 4, e8, mf2, ta, mu		; LMULMAX1-NEXT: vsetivli zero, 4, e8, mf2, ta, mu
; LMULMAX1-NEXT: vslidedown.vi v8, v10, 4		; LMULMAX1-NEXT: vslidedown.vi v8, v10, 4
; LMULMAX1-NEXT: vsetivli zero, 4, e32, m1, ta, mu		; LMULMAX1-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; LMULMAX1-NEXT: vsext.vf4 v9, v8		; LMULMAX1-NEXT: vsext.vf4 v9, v8
; LMULMAX1-NEXT: vsext.vf4 v8, v10		; LMULMAX1-NEXT: vsext.vf4 v8, v10
; LMULMAX1-NEXT: ret		; LMULMAX1-NEXT: ret
;		;
; LMULMAX4-LABEL: sextload_v8i8_v8i32:		; LMULMAX4-LABEL: sextload_v8i8_v8i32:
; LMULMAX4: # %bb.0:		; LMULMAX4: # %bb.0:
; LMULMAX4-NEXT: vsetivli zero, 8, e8, mf2, ta, mu		; LMULMAX4-NEXT: vsetivli zero, 8, e32, m2, ta, mu
; LMULMAX4-NEXT: vle8.v v10, (a0)		; LMULMAX4-NEXT: vle8.v v10, (a0)
; LMULMAX4-NEXT: vsetvli zero, zero, e32, m2, ta, mu
; LMULMAX4-NEXT: vsext.vf4 v8, v10		; LMULMAX4-NEXT: vsext.vf4 v8, v10
; LMULMAX4-NEXT: ret		; LMULMAX4-NEXT: ret
%y = load <8 x i8>, <8 x i8>* %x		%y = load <8 x i8>, <8 x i8>* %x
%z = sext <8 x i8> %y to <8 x i32>		%z = sext <8 x i8> %y to <8 x i32>
ret <8 x i32> %z		ret <8 x i32> %z
}		}

define <8 x i32> @zextload_v8i8_v8i32(<8 x i8>* %x) {		define <8 x i32> @zextload_v8i8_v8i32(<8 x i8>* %x) {
; LMULMAX1-LABEL: zextload_v8i8_v8i32:		; LMULMAX1-LABEL: zextload_v8i8_v8i32:
; LMULMAX1: # %bb.0:		; LMULMAX1: # %bb.0:
; LMULMAX1-NEXT: vsetivli zero, 8, e8, mf2, ta, mu		; LMULMAX1-NEXT: vsetivli zero, 8, e8, mf2, ta, mu
; LMULMAX1-NEXT: vle8.v v10, (a0)		; LMULMAX1-NEXT: vle8.v v10, (a0)
; LMULMAX1-NEXT: vsetivli zero, 4, e8, mf2, ta, mu		; LMULMAX1-NEXT: vsetivli zero, 4, e8, mf2, ta, mu
; LMULMAX1-NEXT: vslidedown.vi v8, v10, 4		; LMULMAX1-NEXT: vslidedown.vi v8, v10, 4
; LMULMAX1-NEXT: vsetivli zero, 4, e32, m1, ta, mu		; LMULMAX1-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; LMULMAX1-NEXT: vzext.vf4 v9, v8		; LMULMAX1-NEXT: vzext.vf4 v9, v8
; LMULMAX1-NEXT: vzext.vf4 v8, v10		; LMULMAX1-NEXT: vzext.vf4 v8, v10
; LMULMAX1-NEXT: ret		; LMULMAX1-NEXT: ret
;		;
; LMULMAX4-LABEL: zextload_v8i8_v8i32:		; LMULMAX4-LABEL: zextload_v8i8_v8i32:
; LMULMAX4: # %bb.0:		; LMULMAX4: # %bb.0:
; LMULMAX4-NEXT: vsetivli zero, 8, e8, mf2, ta, mu		; LMULMAX4-NEXT: vsetivli zero, 8, e32, m2, ta, mu
; LMULMAX4-NEXT: vle8.v v10, (a0)		; LMULMAX4-NEXT: vle8.v v10, (a0)
; LMULMAX4-NEXT: vsetvli zero, zero, e32, m2, ta, mu
; LMULMAX4-NEXT: vzext.vf4 v8, v10		; LMULMAX4-NEXT: vzext.vf4 v8, v10
; LMULMAX4-NEXT: ret		; LMULMAX4-NEXT: ret
%y = load <8 x i8>, <8 x i8>* %x		%y = load <8 x i8>, <8 x i8>* %x
%z = zext <8 x i8> %y to <8 x i32>		%z = zext <8 x i8> %y to <8 x i32>
ret <8 x i32> %z		ret <8 x i32> %z
}		}

define <8 x i64> @sextload_v8i8_v8i64(<8 x i8>* %x) {		define <8 x i64> @sextload_v8i8_v8i64(<8 x i8>* %x) {
Show All 13 Lines
; LMULMAX1-NEXT: vslidedown.vi v8, v8, 2		; LMULMAX1-NEXT: vslidedown.vi v8, v8, 2
; LMULMAX1-NEXT: vsetivli zero, 2, e64, m1, ta, mu		; LMULMAX1-NEXT: vsetivli zero, 2, e64, m1, ta, mu
; LMULMAX1-NEXT: vsext.vf8 v11, v8		; LMULMAX1-NEXT: vsext.vf8 v11, v8
; LMULMAX1-NEXT: vsext.vf8 v8, v12		; LMULMAX1-NEXT: vsext.vf8 v8, v12
; LMULMAX1-NEXT: ret		; LMULMAX1-NEXT: ret
;		;
; LMULMAX4-LABEL: sextload_v8i8_v8i64:		; LMULMAX4-LABEL: sextload_v8i8_v8i64:
; LMULMAX4: # %bb.0:		; LMULMAX4: # %bb.0:
; LMULMAX4-NEXT: vsetivli zero, 8, e8, mf2, ta, mu		; LMULMAX4-NEXT: vsetivli zero, 8, e64, m4, ta, mu
; LMULMAX4-NEXT: vle8.v v12, (a0)		; LMULMAX4-NEXT: vle8.v v12, (a0)
; LMULMAX4-NEXT: vsetvli zero, zero, e64, m4, ta, mu
; LMULMAX4-NEXT: vsext.vf8 v8, v12		; LMULMAX4-NEXT: vsext.vf8 v8, v12
; LMULMAX4-NEXT: ret		; LMULMAX4-NEXT: ret
%y = load <8 x i8>, <8 x i8>* %x		%y = load <8 x i8>, <8 x i8>* %x
%z = sext <8 x i8> %y to <8 x i64>		%z = sext <8 x i8> %y to <8 x i64>
ret <8 x i64> %z		ret <8 x i64> %z
}		}

define <8 x i64> @zextload_v8i8_v8i64(<8 x i8>* %x) {		define <8 x i64> @zextload_v8i8_v8i64(<8 x i8>* %x) {
Show All 13 Lines
; LMULMAX1-NEXT: vslidedown.vi v8, v8, 2		; LMULMAX1-NEXT: vslidedown.vi v8, v8, 2
; LMULMAX1-NEXT: vsetivli zero, 2, e64, m1, ta, mu		; LMULMAX1-NEXT: vsetivli zero, 2, e64, m1, ta, mu
; LMULMAX1-NEXT: vzext.vf8 v11, v8		; LMULMAX1-NEXT: vzext.vf8 v11, v8
; LMULMAX1-NEXT: vzext.vf8 v8, v12		; LMULMAX1-NEXT: vzext.vf8 v8, v12
; LMULMAX1-NEXT: ret		; LMULMAX1-NEXT: ret
;		;
; LMULMAX4-LABEL: zextload_v8i8_v8i64:		; LMULMAX4-LABEL: zextload_v8i8_v8i64:
; LMULMAX4: # %bb.0:		; LMULMAX4: # %bb.0:
; LMULMAX4-NEXT: vsetivli zero, 8, e8, mf2, ta, mu		; LMULMAX4-NEXT: vsetivli zero, 8, e64, m4, ta, mu
; LMULMAX4-NEXT: vle8.v v12, (a0)		; LMULMAX4-NEXT: vle8.v v12, (a0)
; LMULMAX4-NEXT: vsetvli zero, zero, e64, m4, ta, mu
; LMULMAX4-NEXT: vzext.vf8 v8, v12		; LMULMAX4-NEXT: vzext.vf8 v8, v12
; LMULMAX4-NEXT: ret		; LMULMAX4-NEXT: ret
%y = load <8 x i8>, <8 x i8>* %x		%y = load <8 x i8>, <8 x i8>* %x
%z = zext <8 x i8> %y to <8 x i64>		%z = zext <8 x i8> %y to <8 x i64>
ret <8 x i64> %z		ret <8 x i64> %z
}		}

define <16 x i16> @sextload_v16i8_v16i16(<16 x i8>* %x) {		define <16 x i16> @sextload_v16i8_v16i16(<16 x i8>* %x) {
; LMULMAX1-LABEL: sextload_v16i8_v16i16:		; LMULMAX1-LABEL: sextload_v16i8_v16i16:
; LMULMAX1: # %bb.0:		; LMULMAX1: # %bb.0:
; LMULMAX1-NEXT: vsetivli zero, 16, e8, m1, ta, mu		; LMULMAX1-NEXT: vsetivli zero, 16, e8, m1, ta, mu
; LMULMAX1-NEXT: vle8.v v10, (a0)		; LMULMAX1-NEXT: vle8.v v10, (a0)
; LMULMAX1-NEXT: vsetivli zero, 8, e8, m1, ta, mu		; LMULMAX1-NEXT: vsetivli zero, 8, e8, m1, ta, mu
; LMULMAX1-NEXT: vslidedown.vi v8, v10, 8		; LMULMAX1-NEXT: vslidedown.vi v8, v10, 8
; LMULMAX1-NEXT: vsetivli zero, 8, e16, m1, ta, mu		; LMULMAX1-NEXT: vsetivli zero, 8, e16, m1, ta, mu
; LMULMAX1-NEXT: vsext.vf2 v9, v8		; LMULMAX1-NEXT: vsext.vf2 v9, v8
; LMULMAX1-NEXT: vsext.vf2 v8, v10		; LMULMAX1-NEXT: vsext.vf2 v8, v10
; LMULMAX1-NEXT: ret		; LMULMAX1-NEXT: ret
;		;
; LMULMAX4-LABEL: sextload_v16i8_v16i16:		; LMULMAX4-LABEL: sextload_v16i8_v16i16:
; LMULMAX4: # %bb.0:		; LMULMAX4: # %bb.0:
; LMULMAX4-NEXT: vsetivli zero, 16, e8, m1, ta, mu		; LMULMAX4-NEXT: vsetivli zero, 16, e16, m2, ta, mu
; LMULMAX4-NEXT: vle8.v v10, (a0)		; LMULMAX4-NEXT: vle8.v v10, (a0)
; LMULMAX4-NEXT: vsetvli zero, zero, e16, m2, ta, mu
; LMULMAX4-NEXT: vsext.vf2 v8, v10		; LMULMAX4-NEXT: vsext.vf2 v8, v10
; LMULMAX4-NEXT: ret		; LMULMAX4-NEXT: ret
%y = load <16 x i8>, <16 x i8>* %x		%y = load <16 x i8>, <16 x i8>* %x
%z = sext <16 x i8> %y to <16 x i16>		%z = sext <16 x i8> %y to <16 x i16>
ret <16 x i16> %z		ret <16 x i16> %z
}		}

define <16 x i16> @zextload_v16i8_v16i16(<16 x i8>* %x) {		define <16 x i16> @zextload_v16i8_v16i16(<16 x i8>* %x) {
; LMULMAX1-LABEL: zextload_v16i8_v16i16:		; LMULMAX1-LABEL: zextload_v16i8_v16i16:
; LMULMAX1: # %bb.0:		; LMULMAX1: # %bb.0:
; LMULMAX1-NEXT: vsetivli zero, 16, e8, m1, ta, mu		; LMULMAX1-NEXT: vsetivli zero, 16, e8, m1, ta, mu
; LMULMAX1-NEXT: vle8.v v10, (a0)		; LMULMAX1-NEXT: vle8.v v10, (a0)
; LMULMAX1-NEXT: vsetivli zero, 8, e8, m1, ta, mu		; LMULMAX1-NEXT: vsetivli zero, 8, e8, m1, ta, mu
; LMULMAX1-NEXT: vslidedown.vi v8, v10, 8		; LMULMAX1-NEXT: vslidedown.vi v8, v10, 8
; LMULMAX1-NEXT: vsetivli zero, 8, e16, m1, ta, mu		; LMULMAX1-NEXT: vsetivli zero, 8, e16, m1, ta, mu
; LMULMAX1-NEXT: vzext.vf2 v9, v8		; LMULMAX1-NEXT: vzext.vf2 v9, v8
; LMULMAX1-NEXT: vzext.vf2 v8, v10		; LMULMAX1-NEXT: vzext.vf2 v8, v10
; LMULMAX1-NEXT: ret		; LMULMAX1-NEXT: ret
;		;
; LMULMAX4-LABEL: zextload_v16i8_v16i16:		; LMULMAX4-LABEL: zextload_v16i8_v16i16:
; LMULMAX4: # %bb.0:		; LMULMAX4: # %bb.0:
; LMULMAX4-NEXT: vsetivli zero, 16, e8, m1, ta, mu		; LMULMAX4-NEXT: vsetivli zero, 16, e16, m2, ta, mu
; LMULMAX4-NEXT: vle8.v v10, (a0)		; LMULMAX4-NEXT: vle8.v v10, (a0)
; LMULMAX4-NEXT: vsetvli zero, zero, e16, m2, ta, mu
; LMULMAX4-NEXT: vzext.vf2 v8, v10		; LMULMAX4-NEXT: vzext.vf2 v8, v10
; LMULMAX4-NEXT: ret		; LMULMAX4-NEXT: ret
%y = load <16 x i8>, <16 x i8>* %x		%y = load <16 x i8>, <16 x i8>* %x
%z = zext <16 x i8> %y to <16 x i16>		%z = zext <16 x i8> %y to <16 x i16>
ret <16 x i16> %z		ret <16 x i16> %z
}		}

define <16 x i32> @sextload_v16i8_v16i32(<16 x i8>* %x) {		define <16 x i32> @sextload_v16i8_v16i32(<16 x i8>* %x) {
Show All 13 Lines
; LMULMAX1-NEXT: vslidedown.vi v8, v8, 4		; LMULMAX1-NEXT: vslidedown.vi v8, v8, 4
; LMULMAX1-NEXT: vsetivli zero, 4, e32, m1, ta, mu		; LMULMAX1-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; LMULMAX1-NEXT: vsext.vf4 v11, v8		; LMULMAX1-NEXT: vsext.vf4 v11, v8
; LMULMAX1-NEXT: vsext.vf4 v8, v12		; LMULMAX1-NEXT: vsext.vf4 v8, v12
; LMULMAX1-NEXT: ret		; LMULMAX1-NEXT: ret
;		;
; LMULMAX4-LABEL: sextload_v16i8_v16i32:		; LMULMAX4-LABEL: sextload_v16i8_v16i32:
; LMULMAX4: # %bb.0:		; LMULMAX4: # %bb.0:
; LMULMAX4-NEXT: vsetivli zero, 16, e8, m1, ta, mu		; LMULMAX4-NEXT: vsetivli zero, 16, e32, m4, ta, mu
; LMULMAX4-NEXT: vle8.v v12, (a0)		; LMULMAX4-NEXT: vle8.v v12, (a0)
; LMULMAX4-NEXT: vsetvli zero, zero, e32, m4, ta, mu
; LMULMAX4-NEXT: vsext.vf4 v8, v12		; LMULMAX4-NEXT: vsext.vf4 v8, v12
; LMULMAX4-NEXT: ret		; LMULMAX4-NEXT: ret
%y = load <16 x i8>, <16 x i8>* %x		%y = load <16 x i8>, <16 x i8>* %x
%z = sext <16 x i8> %y to <16 x i32>		%z = sext <16 x i8> %y to <16 x i32>
ret <16 x i32> %z		ret <16 x i32> %z
}		}

define <16 x i32> @zextload_v16i8_v16i32(<16 x i8>* %x) {		define <16 x i32> @zextload_v16i8_v16i32(<16 x i8>* %x) {
Show All 13 Lines
; LMULMAX1-NEXT: vslidedown.vi v8, v8, 4		; LMULMAX1-NEXT: vslidedown.vi v8, v8, 4
; LMULMAX1-NEXT: vsetivli zero, 4, e32, m1, ta, mu		; LMULMAX1-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; LMULMAX1-NEXT: vzext.vf4 v11, v8		; LMULMAX1-NEXT: vzext.vf4 v11, v8
; LMULMAX1-NEXT: vzext.vf4 v8, v12		; LMULMAX1-NEXT: vzext.vf4 v8, v12
; LMULMAX1-NEXT: ret		; LMULMAX1-NEXT: ret
;		;
; LMULMAX4-LABEL: zextload_v16i8_v16i32:		; LMULMAX4-LABEL: zextload_v16i8_v16i32:
; LMULMAX4: # %bb.0:		; LMULMAX4: # %bb.0:
; LMULMAX4-NEXT: vsetivli zero, 16, e8, m1, ta, mu		; LMULMAX4-NEXT: vsetivli zero, 16, e32, m4, ta, mu
; LMULMAX4-NEXT: vle8.v v12, (a0)		; LMULMAX4-NEXT: vle8.v v12, (a0)
; LMULMAX4-NEXT: vsetvli zero, zero, e32, m4, ta, mu
; LMULMAX4-NEXT: vzext.vf4 v8, v12		; LMULMAX4-NEXT: vzext.vf4 v8, v12
; LMULMAX4-NEXT: ret		; LMULMAX4-NEXT: ret
%y = load <16 x i8>, <16 x i8>* %x		%y = load <16 x i8>, <16 x i8>* %x
%z = zext <16 x i8> %y to <16 x i32>		%z = zext <16 x i8> %y to <16 x i32>
ret <16 x i32> %z		ret <16 x i32> %z
}		}

define <16 x i64> @sextload_v16i8_v16i64(<16 x i8>* %x) {		define <16 x i64> @sextload_v16i8_v16i64(<16 x i8>* %x) {
▲ Show 20 Lines • Show All 129 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%y = trunc <2 x i16> %x to <2 x i8>		%y = trunc <2 x i16> %x to <2 x i8>
store <2 x i8> %y, <2 x i8>* %z		store <2 x i8> %y, <2 x i8>* %z
ret void		ret void
}		}

define <2 x i32> @sextload_v2i16_v2i32(<2 x i16>* %x) {		define <2 x i32> @sextload_v2i16_v2i32(<2 x i16>* %x) {
; CHECK-LABEL: sextload_v2i16_v2i32:		; CHECK-LABEL: sextload_v2i16_v2i32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 2, e16, mf4, ta, mu		; CHECK-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
; CHECK-NEXT: vle16.v v9, (a0)		; CHECK-NEXT: vle16.v v9, (a0)
; CHECK-NEXT: vsetvli zero, zero, e32, mf2, ta, mu
; CHECK-NEXT: vsext.vf2 v8, v9		; CHECK-NEXT: vsext.vf2 v8, v9
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%y = load <2 x i16>, <2 x i16>* %x		%y = load <2 x i16>, <2 x i16>* %x
%z = sext <2 x i16> %y to <2 x i32>		%z = sext <2 x i16> %y to <2 x i32>
ret <2 x i32> %z		ret <2 x i32> %z
}		}

define <2 x i32> @zextload_v2i16_v2i32(<2 x i16>* %x) {		define <2 x i32> @zextload_v2i16_v2i32(<2 x i16>* %x) {
; CHECK-LABEL: zextload_v2i16_v2i32:		; CHECK-LABEL: zextload_v2i16_v2i32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 2, e16, mf4, ta, mu		; CHECK-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
; CHECK-NEXT: vle16.v v9, (a0)		; CHECK-NEXT: vle16.v v9, (a0)
; CHECK-NEXT: vsetvli zero, zero, e32, mf2, ta, mu
; CHECK-NEXT: vzext.vf2 v8, v9		; CHECK-NEXT: vzext.vf2 v8, v9
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%y = load <2 x i16>, <2 x i16>* %x		%y = load <2 x i16>, <2 x i16>* %x
%z = zext <2 x i16> %y to <2 x i32>		%z = zext <2 x i16> %y to <2 x i32>
ret <2 x i32> %z		ret <2 x i32> %z
}		}

define <2 x i64> @sextload_v2i16_v2i64(<2 x i16>* %x) {		define <2 x i64> @sextload_v2i16_v2i64(<2 x i16>* %x) {
; CHECK-LABEL: sextload_v2i16_v2i64:		; CHECK-LABEL: sextload_v2i16_v2i64:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 2, e16, mf4, ta, mu		; CHECK-NEXT: vsetivli zero, 2, e64, m1, ta, mu
; CHECK-NEXT: vle16.v v9, (a0)		; CHECK-NEXT: vle16.v v9, (a0)
; CHECK-NEXT: vsetvli zero, zero, e64, m1, ta, mu
; CHECK-NEXT: vsext.vf4 v8, v9		; CHECK-NEXT: vsext.vf4 v8, v9
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%y = load <2 x i16>, <2 x i16>* %x		%y = load <2 x i16>, <2 x i16>* %x
%z = sext <2 x i16> %y to <2 x i64>		%z = sext <2 x i16> %y to <2 x i64>
ret <2 x i64> %z		ret <2 x i64> %z
}		}

define <2 x i64> @zextload_v2i16_v2i64(<2 x i16>* %x) {		define <2 x i64> @zextload_v2i16_v2i64(<2 x i16>* %x) {
; CHECK-LABEL: zextload_v2i16_v2i64:		; CHECK-LABEL: zextload_v2i16_v2i64:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 2, e16, mf4, ta, mu		; CHECK-NEXT: vsetivli zero, 2, e64, m1, ta, mu
; CHECK-NEXT: vle16.v v9, (a0)		; CHECK-NEXT: vle16.v v9, (a0)
; CHECK-NEXT: vsetvli zero, zero, e64, m1, ta, mu
; CHECK-NEXT: vzext.vf4 v8, v9		; CHECK-NEXT: vzext.vf4 v8, v9
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%y = load <2 x i16>, <2 x i16>* %x		%y = load <2 x i16>, <2 x i16>* %x
%z = zext <2 x i16> %y to <2 x i64>		%z = zext <2 x i16> %y to <2 x i64>
ret <2 x i64> %z		ret <2 x i64> %z
}		}

define void @truncstore_v4i16_v4i8(<4 x i16> %x, <4 x i8>* %z) {		define void @truncstore_v4i16_v4i8(<4 x i16> %x, <4 x i8>* %z) {
; CHECK-LABEL: truncstore_v4i16_v4i8:		; CHECK-LABEL: truncstore_v4i16_v4i8:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 4, e8, mf4, ta, mu		; CHECK-NEXT: vsetivli zero, 4, e8, mf4, ta, mu
; CHECK-NEXT: vncvt.x.x.w v8, v8		; CHECK-NEXT: vncvt.x.x.w v8, v8
; CHECK-NEXT: vse8.v v8, (a0)		; CHECK-NEXT: vse8.v v8, (a0)
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%y = trunc <4 x i16> %x to <4 x i8>		%y = trunc <4 x i16> %x to <4 x i8>
store <4 x i8> %y, <4 x i8>* %z		store <4 x i8> %y, <4 x i8>* %z
ret void		ret void
}		}

define <4 x i32> @sextload_v4i16_v4i32(<4 x i16>* %x) {		define <4 x i32> @sextload_v4i16_v4i32(<4 x i16>* %x) {
; CHECK-LABEL: sextload_v4i16_v4i32:		; CHECK-LABEL: sextload_v4i16_v4i32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, mu		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: vle16.v v9, (a0)		; CHECK-NEXT: vle16.v v9, (a0)
; CHECK-NEXT: vsetvli zero, zero, e32, m1, ta, mu
; CHECK-NEXT: vsext.vf2 v8, v9		; CHECK-NEXT: vsext.vf2 v8, v9
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%y = load <4 x i16>, <4 x i16>* %x		%y = load <4 x i16>, <4 x i16>* %x
%z = sext <4 x i16> %y to <4 x i32>		%z = sext <4 x i16> %y to <4 x i32>
ret <4 x i32> %z		ret <4 x i32> %z
}		}

define <4 x i32> @zextload_v4i16_v4i32(<4 x i16>* %x) {		define <4 x i32> @zextload_v4i16_v4i32(<4 x i16>* %x) {
; CHECK-LABEL: zextload_v4i16_v4i32:		; CHECK-LABEL: zextload_v4i16_v4i32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, mu		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: vle16.v v9, (a0)		; CHECK-NEXT: vle16.v v9, (a0)
; CHECK-NEXT: vsetvli zero, zero, e32, m1, ta, mu
; CHECK-NEXT: vzext.vf2 v8, v9		; CHECK-NEXT: vzext.vf2 v8, v9
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%y = load <4 x i16>, <4 x i16>* %x		%y = load <4 x i16>, <4 x i16>* %x
%z = zext <4 x i16> %y to <4 x i32>		%z = zext <4 x i16> %y to <4 x i32>
ret <4 x i32> %z		ret <4 x i32> %z
}		}

define <4 x i64> @sextload_v4i16_v4i64(<4 x i16>* %x) {		define <4 x i64> @sextload_v4i16_v4i64(<4 x i16>* %x) {
; LMULMAX1-LABEL: sextload_v4i16_v4i64:		; LMULMAX1-LABEL: sextload_v4i16_v4i64:
; LMULMAX1: # %bb.0:		; LMULMAX1: # %bb.0:
; LMULMAX1-NEXT: vsetivli zero, 4, e16, mf2, ta, mu		; LMULMAX1-NEXT: vsetivli zero, 4, e16, mf2, ta, mu
; LMULMAX1-NEXT: vle16.v v10, (a0)		; LMULMAX1-NEXT: vle16.v v10, (a0)
; LMULMAX1-NEXT: vsetivli zero, 2, e16, mf2, ta, mu		; LMULMAX1-NEXT: vsetivli zero, 2, e16, mf2, ta, mu
; LMULMAX1-NEXT: vslidedown.vi v8, v10, 2		; LMULMAX1-NEXT: vslidedown.vi v8, v10, 2
; LMULMAX1-NEXT: vsetivli zero, 2, e64, m1, ta, mu		; LMULMAX1-NEXT: vsetivli zero, 2, e64, m1, ta, mu
; LMULMAX1-NEXT: vsext.vf4 v9, v8		; LMULMAX1-NEXT: vsext.vf4 v9, v8
; LMULMAX1-NEXT: vsext.vf4 v8, v10		; LMULMAX1-NEXT: vsext.vf4 v8, v10
; LMULMAX1-NEXT: ret		; LMULMAX1-NEXT: ret
;		;
; LMULMAX4-LABEL: sextload_v4i16_v4i64:		; LMULMAX4-LABEL: sextload_v4i16_v4i64:
; LMULMAX4: # %bb.0:		; LMULMAX4: # %bb.0:
; LMULMAX4-NEXT: vsetivli zero, 4, e16, mf2, ta, mu		; LMULMAX4-NEXT: vsetivli zero, 4, e64, m2, ta, mu
; LMULMAX4-NEXT: vle16.v v10, (a0)		; LMULMAX4-NEXT: vle16.v v10, (a0)
; LMULMAX4-NEXT: vsetvli zero, zero, e64, m2, ta, mu
; LMULMAX4-NEXT: vsext.vf4 v8, v10		; LMULMAX4-NEXT: vsext.vf4 v8, v10
; LMULMAX4-NEXT: ret		; LMULMAX4-NEXT: ret
%y = load <4 x i16>, <4 x i16>* %x		%y = load <4 x i16>, <4 x i16>* %x
%z = sext <4 x i16> %y to <4 x i64>		%z = sext <4 x i16> %y to <4 x i64>
ret <4 x i64> %z		ret <4 x i64> %z
}		}

define <4 x i64> @zextload_v4i16_v4i64(<4 x i16>* %x) {		define <4 x i64> @zextload_v4i16_v4i64(<4 x i16>* %x) {
; LMULMAX1-LABEL: zextload_v4i16_v4i64:		; LMULMAX1-LABEL: zextload_v4i16_v4i64:
; LMULMAX1: # %bb.0:		; LMULMAX1: # %bb.0:
; LMULMAX1-NEXT: vsetivli zero, 4, e16, mf2, ta, mu		; LMULMAX1-NEXT: vsetivli zero, 4, e16, mf2, ta, mu
; LMULMAX1-NEXT: vle16.v v10, (a0)		; LMULMAX1-NEXT: vle16.v v10, (a0)
; LMULMAX1-NEXT: vsetivli zero, 2, e16, mf2, ta, mu		; LMULMAX1-NEXT: vsetivli zero, 2, e16, mf2, ta, mu
; LMULMAX1-NEXT: vslidedown.vi v8, v10, 2		; LMULMAX1-NEXT: vslidedown.vi v8, v10, 2
; LMULMAX1-NEXT: vsetivli zero, 2, e64, m1, ta, mu		; LMULMAX1-NEXT: vsetivli zero, 2, e64, m1, ta, mu
; LMULMAX1-NEXT: vzext.vf4 v9, v8		; LMULMAX1-NEXT: vzext.vf4 v9, v8
; LMULMAX1-NEXT: vzext.vf4 v8, v10		; LMULMAX1-NEXT: vzext.vf4 v8, v10
; LMULMAX1-NEXT: ret		; LMULMAX1-NEXT: ret
;		;
; LMULMAX4-LABEL: zextload_v4i16_v4i64:		; LMULMAX4-LABEL: zextload_v4i16_v4i64:
; LMULMAX4: # %bb.0:		; LMULMAX4: # %bb.0:
; LMULMAX4-NEXT: vsetivli zero, 4, e16, mf2, ta, mu		; LMULMAX4-NEXT: vsetivli zero, 4, e64, m2, ta, mu
; LMULMAX4-NEXT: vle16.v v10, (a0)		; LMULMAX4-NEXT: vle16.v v10, (a0)
; LMULMAX4-NEXT: vsetvli zero, zero, e64, m2, ta, mu
; LMULMAX4-NEXT: vzext.vf4 v8, v10		; LMULMAX4-NEXT: vzext.vf4 v8, v10
; LMULMAX4-NEXT: ret		; LMULMAX4-NEXT: ret
%y = load <4 x i16>, <4 x i16>* %x		%y = load <4 x i16>, <4 x i16>* %x
%z = zext <4 x i16> %y to <4 x i64>		%z = zext <4 x i16> %y to <4 x i64>
ret <4 x i64> %z		ret <4 x i64> %z
}		}

define void @truncstore_v8i16_v8i8(<8 x i16> %x, <8 x i8>* %z) {		define void @truncstore_v8i16_v8i8(<8 x i16> %x, <8 x i8>* %z) {
Show All 17 Lines
; LMULMAX1-NEXT: vslidedown.vi v8, v10, 4		; LMULMAX1-NEXT: vslidedown.vi v8, v10, 4
; LMULMAX1-NEXT: vsetivli zero, 4, e32, m1, ta, mu		; LMULMAX1-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; LMULMAX1-NEXT: vsext.vf2 v9, v8		; LMULMAX1-NEXT: vsext.vf2 v9, v8
; LMULMAX1-NEXT: vsext.vf2 v8, v10		; LMULMAX1-NEXT: vsext.vf2 v8, v10
; LMULMAX1-NEXT: ret		; LMULMAX1-NEXT: ret
;		;
; LMULMAX4-LABEL: sextload_v8i16_v8i32:		; LMULMAX4-LABEL: sextload_v8i16_v8i32:
; LMULMAX4: # %bb.0:		; LMULMAX4: # %bb.0:
; LMULMAX4-NEXT: vsetivli zero, 8, e16, m1, ta, mu		; LMULMAX4-NEXT: vsetivli zero, 8, e32, m2, ta, mu
; LMULMAX4-NEXT: vle16.v v10, (a0)		; LMULMAX4-NEXT: vle16.v v10, (a0)
; LMULMAX4-NEXT: vsetvli zero, zero, e32, m2, ta, mu
; LMULMAX4-NEXT: vsext.vf2 v8, v10		; LMULMAX4-NEXT: vsext.vf2 v8, v10
; LMULMAX4-NEXT: ret		; LMULMAX4-NEXT: ret
%y = load <8 x i16>, <8 x i16>* %x		%y = load <8 x i16>, <8 x i16>* %x
%z = sext <8 x i16> %y to <8 x i32>		%z = sext <8 x i16> %y to <8 x i32>
ret <8 x i32> %z		ret <8 x i32> %z
}		}

define <8 x i32> @zextload_v8i16_v8i32(<8 x i16>* %x) {		define <8 x i32> @zextload_v8i16_v8i32(<8 x i16>* %x) {
; LMULMAX1-LABEL: zextload_v8i16_v8i32:		; LMULMAX1-LABEL: zextload_v8i16_v8i32:
; LMULMAX1: # %bb.0:		; LMULMAX1: # %bb.0:
; LMULMAX1-NEXT: vsetivli zero, 8, e16, m1, ta, mu		; LMULMAX1-NEXT: vsetivli zero, 8, e16, m1, ta, mu
; LMULMAX1-NEXT: vle16.v v10, (a0)		; LMULMAX1-NEXT: vle16.v v10, (a0)
; LMULMAX1-NEXT: vsetivli zero, 4, e16, m1, ta, mu		; LMULMAX1-NEXT: vsetivli zero, 4, e16, m1, ta, mu
; LMULMAX1-NEXT: vslidedown.vi v8, v10, 4		; LMULMAX1-NEXT: vslidedown.vi v8, v10, 4
; LMULMAX1-NEXT: vsetivli zero, 4, e32, m1, ta, mu		; LMULMAX1-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; LMULMAX1-NEXT: vzext.vf2 v9, v8		; LMULMAX1-NEXT: vzext.vf2 v9, v8
; LMULMAX1-NEXT: vzext.vf2 v8, v10		; LMULMAX1-NEXT: vzext.vf2 v8, v10
; LMULMAX1-NEXT: ret		; LMULMAX1-NEXT: ret
;		;
; LMULMAX4-LABEL: zextload_v8i16_v8i32:		; LMULMAX4-LABEL: zextload_v8i16_v8i32:
; LMULMAX4: # %bb.0:		; LMULMAX4: # %bb.0:
; LMULMAX4-NEXT: vsetivli zero, 8, e16, m1, ta, mu		; LMULMAX4-NEXT: vsetivli zero, 8, e32, m2, ta, mu
; LMULMAX4-NEXT: vle16.v v10, (a0)		; LMULMAX4-NEXT: vle16.v v10, (a0)
; LMULMAX4-NEXT: vsetvli zero, zero, e32, m2, ta, mu
; LMULMAX4-NEXT: vzext.vf2 v8, v10		; LMULMAX4-NEXT: vzext.vf2 v8, v10
; LMULMAX4-NEXT: ret		; LMULMAX4-NEXT: ret
%y = load <8 x i16>, <8 x i16>* %x		%y = load <8 x i16>, <8 x i16>* %x
%z = zext <8 x i16> %y to <8 x i32>		%z = zext <8 x i16> %y to <8 x i32>
ret <8 x i32> %z		ret <8 x i32> %z
}		}

define <8 x i64> @sextload_v8i16_v8i64(<8 x i16>* %x) {		define <8 x i64> @sextload_v8i16_v8i64(<8 x i16>* %x) {
Show All 13 Lines
; LMULMAX1-NEXT: vslidedown.vi v8, v8, 2		; LMULMAX1-NEXT: vslidedown.vi v8, v8, 2
; LMULMAX1-NEXT: vsetivli zero, 2, e64, m1, ta, mu		; LMULMAX1-NEXT: vsetivli zero, 2, e64, m1, ta, mu
; LMULMAX1-NEXT: vsext.vf4 v11, v8		; LMULMAX1-NEXT: vsext.vf4 v11, v8
; LMULMAX1-NEXT: vsext.vf4 v8, v12		; LMULMAX1-NEXT: vsext.vf4 v8, v12
; LMULMAX1-NEXT: ret		; LMULMAX1-NEXT: ret
;		;
; LMULMAX4-LABEL: sextload_v8i16_v8i64:		; LMULMAX4-LABEL: sextload_v8i16_v8i64:
; LMULMAX4: # %bb.0:		; LMULMAX4: # %bb.0:
; LMULMAX4-NEXT: vsetivli zero, 8, e16, m1, ta, mu		; LMULMAX4-NEXT: vsetivli zero, 8, e64, m4, ta, mu
; LMULMAX4-NEXT: vle16.v v12, (a0)		; LMULMAX4-NEXT: vle16.v v12, (a0)
; LMULMAX4-NEXT: vsetvli zero, zero, e64, m4, ta, mu
; LMULMAX4-NEXT: vsext.vf4 v8, v12		; LMULMAX4-NEXT: vsext.vf4 v8, v12
; LMULMAX4-NEXT: ret		; LMULMAX4-NEXT: ret
%y = load <8 x i16>, <8 x i16>* %x		%y = load <8 x i16>, <8 x i16>* %x
%z = sext <8 x i16> %y to <8 x i64>		%z = sext <8 x i16> %y to <8 x i64>
ret <8 x i64> %z		ret <8 x i64> %z
}		}

define <8 x i64> @zextload_v8i16_v8i64(<8 x i16>* %x) {		define <8 x i64> @zextload_v8i16_v8i64(<8 x i16>* %x) {
Show All 13 Lines
; LMULMAX1-NEXT: vslidedown.vi v8, v8, 2		; LMULMAX1-NEXT: vslidedown.vi v8, v8, 2
; LMULMAX1-NEXT: vsetivli zero, 2, e64, m1, ta, mu		; LMULMAX1-NEXT: vsetivli zero, 2, e64, m1, ta, mu
; LMULMAX1-NEXT: vzext.vf4 v11, v8		; LMULMAX1-NEXT: vzext.vf4 v11, v8
; LMULMAX1-NEXT: vzext.vf4 v8, v12		; LMULMAX1-NEXT: vzext.vf4 v8, v12
; LMULMAX1-NEXT: ret		; LMULMAX1-NEXT: ret
;		;
; LMULMAX4-LABEL: zextload_v8i16_v8i64:		; LMULMAX4-LABEL: zextload_v8i16_v8i64:
; LMULMAX4: # %bb.0:		; LMULMAX4: # %bb.0:
; LMULMAX4-NEXT: vsetivli zero, 8, e16, m1, ta, mu		; LMULMAX4-NEXT: vsetivli zero, 8, e64, m4, ta, mu
; LMULMAX4-NEXT: vle16.v v12, (a0)		; LMULMAX4-NEXT: vle16.v v12, (a0)
; LMULMAX4-NEXT: vsetvli zero, zero, e64, m4, ta, mu
; LMULMAX4-NEXT: vzext.vf4 v8, v12		; LMULMAX4-NEXT: vzext.vf4 v8, v12
; LMULMAX4-NEXT: ret		; LMULMAX4-NEXT: ret
%y = load <8 x i16>, <8 x i16>* %x		%y = load <8 x i16>, <8 x i16>* %x
%z = zext <8 x i16> %y to <8 x i64>		%z = zext <8 x i16> %y to <8 x i64>
ret <8 x i64> %z		ret <8 x i64> %z
}		}

define void @truncstore_v16i16_v16i8(<16 x i16> %x, <16 x i8>* %z) {		define void @truncstore_v16i16_v16i8(<16 x i16> %x, <16 x i8>* %z) {
Show All 34 Lines
; LMULMAX1-NEXT: vsetivli zero, 4, e32, m1, ta, mu		; LMULMAX1-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; LMULMAX1-NEXT: vsext.vf2 v11, v8		; LMULMAX1-NEXT: vsext.vf2 v11, v8
; LMULMAX1-NEXT: vsext.vf2 v8, v10		; LMULMAX1-NEXT: vsext.vf2 v8, v10
; LMULMAX1-NEXT: vsext.vf2 v10, v12		; LMULMAX1-NEXT: vsext.vf2 v10, v12
; LMULMAX1-NEXT: ret		; LMULMAX1-NEXT: ret
;		;
; LMULMAX4-LABEL: sextload_v16i16_v16i32:		; LMULMAX4-LABEL: sextload_v16i16_v16i32:
; LMULMAX4: # %bb.0:		; LMULMAX4: # %bb.0:
; LMULMAX4-NEXT: vsetivli zero, 16, e16, m2, ta, mu		; LMULMAX4-NEXT: vsetivli zero, 16, e32, m4, ta, mu
; LMULMAX4-NEXT: vle16.v v12, (a0)		; LMULMAX4-NEXT: vle16.v v12, (a0)
; LMULMAX4-NEXT: vsetvli zero, zero, e32, m4, ta, mu
; LMULMAX4-NEXT: vsext.vf2 v8, v12		; LMULMAX4-NEXT: vsext.vf2 v8, v12
; LMULMAX4-NEXT: ret		; LMULMAX4-NEXT: ret
%y = load <16 x i16>, <16 x i16>* %x		%y = load <16 x i16>, <16 x i16>* %x
%z = sext <16 x i16> %y to <16 x i32>		%z = sext <16 x i16> %y to <16 x i32>
ret <16 x i32> %z		ret <16 x i32> %z
}		}

define <16 x i32> @zextload_v16i16_v16i32(<16 x i16>* %x) {		define <16 x i32> @zextload_v16i16_v16i32(<16 x i16>* %x) {
Show All 12 Lines
; LMULMAX1-NEXT: vsetivli zero, 4, e32, m1, ta, mu		; LMULMAX1-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; LMULMAX1-NEXT: vzext.vf2 v11, v8		; LMULMAX1-NEXT: vzext.vf2 v11, v8
; LMULMAX1-NEXT: vzext.vf2 v8, v10		; LMULMAX1-NEXT: vzext.vf2 v8, v10
; LMULMAX1-NEXT: vzext.vf2 v10, v12		; LMULMAX1-NEXT: vzext.vf2 v10, v12
; LMULMAX1-NEXT: ret		; LMULMAX1-NEXT: ret
;		;
; LMULMAX4-LABEL: zextload_v16i16_v16i32:		; LMULMAX4-LABEL: zextload_v16i16_v16i32:
; LMULMAX4: # %bb.0:		; LMULMAX4: # %bb.0:
; LMULMAX4-NEXT: vsetivli zero, 16, e16, m2, ta, mu		; LMULMAX4-NEXT: vsetivli zero, 16, e32, m4, ta, mu
; LMULMAX4-NEXT: vle16.v v12, (a0)		; LMULMAX4-NEXT: vle16.v v12, (a0)
; LMULMAX4-NEXT: vsetvli zero, zero, e32, m4, ta, mu
; LMULMAX4-NEXT: vzext.vf2 v8, v12		; LMULMAX4-NEXT: vzext.vf2 v8, v12
; LMULMAX4-NEXT: ret		; LMULMAX4-NEXT: ret
%y = load <16 x i16>, <16 x i16>* %x		%y = load <16 x i16>, <16 x i16>* %x
%z = zext <16 x i16> %y to <16 x i32>		%z = zext <16 x i16> %y to <16 x i32>
ret <16 x i32> %z		ret <16 x i32> %z
}		}

define <16 x i64> @sextload_v16i16_v16i64(<16 x i16>* %x) {		define <16 x i64> @sextload_v16i16_v16i64(<16 x i16>* %x) {
▲ Show 20 Lines • Show All 120 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%y = trunc <2 x i32> %x to <2 x i16>		%y = trunc <2 x i32> %x to <2 x i16>
store <2 x i16> %y, <2 x i16>* %z		store <2 x i16> %y, <2 x i16>* %z
ret void		ret void
}		}

define <2 x i64> @sextload_v2i32_v2i64(<2 x i32>* %x) {		define <2 x i64> @sextload_v2i32_v2i64(<2 x i32>* %x) {
; CHECK-LABEL: sextload_v2i32_v2i64:		; CHECK-LABEL: sextload_v2i32_v2i64:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 2, e32, mf2, ta, mu		; CHECK-NEXT: vsetivli zero, 2, e64, m1, ta, mu
; CHECK-NEXT: vle32.v v9, (a0)		; CHECK-NEXT: vle32.v v9, (a0)
; CHECK-NEXT: vsetvli zero, zero, e64, m1, ta, mu
; CHECK-NEXT: vsext.vf2 v8, v9		; CHECK-NEXT: vsext.vf2 v8, v9
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%y = load <2 x i32>, <2 x i32>* %x		%y = load <2 x i32>, <2 x i32>* %x
%z = sext <2 x i32> %y to <2 x i64>		%z = sext <2 x i32> %y to <2 x i64>
ret <2 x i64> %z		ret <2 x i64> %z
}		}

define <2 x i64> @zextload_v2i32_v2i64(<2 x i32>* %x) {		define <2 x i64> @zextload_v2i32_v2i64(<2 x i32>* %x) {
; CHECK-LABEL: zextload_v2i32_v2i64:		; CHECK-LABEL: zextload_v2i32_v2i64:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 2, e32, mf2, ta, mu		; CHECK-NEXT: vsetivli zero, 2, e64, m1, ta, mu
; CHECK-NEXT: vle32.v v9, (a0)		; CHECK-NEXT: vle32.v v9, (a0)
; CHECK-NEXT: vsetvli zero, zero, e64, m1, ta, mu
; CHECK-NEXT: vzext.vf2 v8, v9		; CHECK-NEXT: vzext.vf2 v8, v9
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%y = load <2 x i32>, <2 x i32>* %x		%y = load <2 x i32>, <2 x i32>* %x
%z = zext <2 x i32> %y to <2 x i64>		%z = zext <2 x i32> %y to <2 x i64>
ret <2 x i64> %z		ret <2 x i64> %z
}		}

define void @truncstore_v4i32_v4i8(<4 x i32> %x, <4 x i8>* %z) {		define void @truncstore_v4i32_v4i8(<4 x i32> %x, <4 x i8>* %z) {
Show All 31 Lines
; LMULMAX1-NEXT: vslidedown.vi v8, v10, 2		; LMULMAX1-NEXT: vslidedown.vi v8, v10, 2
; LMULMAX1-NEXT: vsetivli zero, 2, e64, m1, ta, mu		; LMULMAX1-NEXT: vsetivli zero, 2, e64, m1, ta, mu
; LMULMAX1-NEXT: vsext.vf2 v9, v8		; LMULMAX1-NEXT: vsext.vf2 v9, v8
; LMULMAX1-NEXT: vsext.vf2 v8, v10		; LMULMAX1-NEXT: vsext.vf2 v8, v10
; LMULMAX1-NEXT: ret		; LMULMAX1-NEXT: ret
;		;
; LMULMAX4-LABEL: sextload_v4i32_v4i64:		; LMULMAX4-LABEL: sextload_v4i32_v4i64:
; LMULMAX4: # %bb.0:		; LMULMAX4: # %bb.0:
; LMULMAX4-NEXT: vsetivli zero, 4, e32, m1, ta, mu		; LMULMAX4-NEXT: vsetivli zero, 4, e64, m2, ta, mu
; LMULMAX4-NEXT: vle32.v v10, (a0)		; LMULMAX4-NEXT: vle32.v v10, (a0)
; LMULMAX4-NEXT: vsetvli zero, zero, e64, m2, ta, mu
; LMULMAX4-NEXT: vsext.vf2 v8, v10		; LMULMAX4-NEXT: vsext.vf2 v8, v10
; LMULMAX4-NEXT: ret		; LMULMAX4-NEXT: ret
%y = load <4 x i32>, <4 x i32>* %x		%y = load <4 x i32>, <4 x i32>* %x
%z = sext <4 x i32> %y to <4 x i64>		%z = sext <4 x i32> %y to <4 x i64>
ret <4 x i64> %z		ret <4 x i64> %z
}		}

define <4 x i64> @zextload_v4i32_v4i64(<4 x i32>* %x) {		define <4 x i64> @zextload_v4i32_v4i64(<4 x i32>* %x) {
; LMULMAX1-LABEL: zextload_v4i32_v4i64:		; LMULMAX1-LABEL: zextload_v4i32_v4i64:
; LMULMAX1: # %bb.0:		; LMULMAX1: # %bb.0:
; LMULMAX1-NEXT: vsetivli zero, 4, e32, m1, ta, mu		; LMULMAX1-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; LMULMAX1-NEXT: vle32.v v10, (a0)		; LMULMAX1-NEXT: vle32.v v10, (a0)
; LMULMAX1-NEXT: vsetivli zero, 2, e32, m1, ta, mu		; LMULMAX1-NEXT: vsetivli zero, 2, e32, m1, ta, mu
; LMULMAX1-NEXT: vslidedown.vi v8, v10, 2		; LMULMAX1-NEXT: vslidedown.vi v8, v10, 2
; LMULMAX1-NEXT: vsetivli zero, 2, e64, m1, ta, mu		; LMULMAX1-NEXT: vsetivli zero, 2, e64, m1, ta, mu
; LMULMAX1-NEXT: vzext.vf2 v9, v8		; LMULMAX1-NEXT: vzext.vf2 v9, v8
; LMULMAX1-NEXT: vzext.vf2 v8, v10		; LMULMAX1-NEXT: vzext.vf2 v8, v10
; LMULMAX1-NEXT: ret		; LMULMAX1-NEXT: ret
;		;
; LMULMAX4-LABEL: zextload_v4i32_v4i64:		; LMULMAX4-LABEL: zextload_v4i32_v4i64:
; LMULMAX4: # %bb.0:		; LMULMAX4: # %bb.0:
; LMULMAX4-NEXT: vsetivli zero, 4, e32, m1, ta, mu		; LMULMAX4-NEXT: vsetivli zero, 4, e64, m2, ta, mu
; LMULMAX4-NEXT: vle32.v v10, (a0)		; LMULMAX4-NEXT: vle32.v v10, (a0)
; LMULMAX4-NEXT: vsetvli zero, zero, e64, m2, ta, mu
; LMULMAX4-NEXT: vzext.vf2 v8, v10		; LMULMAX4-NEXT: vzext.vf2 v8, v10
; LMULMAX4-NEXT: ret		; LMULMAX4-NEXT: ret
%y = load <4 x i32>, <4 x i32>* %x		%y = load <4 x i32>, <4 x i32>* %x
%z = zext <4 x i32> %y to <4 x i64>		%z = zext <4 x i32> %y to <4 x i64>
ret <4 x i64> %z		ret <4 x i64> %z
}		}

define void @truncstore_v8i32_v8i8(<8 x i32> %x, <8 x i8>* %z) {		define void @truncstore_v8i32_v8i8(<8 x i32> %x, <8 x i8>* %z) {
▲ Show 20 Lines • Show All 63 Lines • ▼ Show 20 Lines
; LMULMAX1-NEXT: vsetivli zero, 2, e64, m1, ta, mu		; LMULMAX1-NEXT: vsetivli zero, 2, e64, m1, ta, mu
; LMULMAX1-NEXT: vsext.vf2 v11, v8		; LMULMAX1-NEXT: vsext.vf2 v11, v8
; LMULMAX1-NEXT: vsext.vf2 v8, v10		; LMULMAX1-NEXT: vsext.vf2 v8, v10
; LMULMAX1-NEXT: vsext.vf2 v10, v12		; LMULMAX1-NEXT: vsext.vf2 v10, v12
; LMULMAX1-NEXT: ret		; LMULMAX1-NEXT: ret
;		;
; LMULMAX4-LABEL: sextload_v8i32_v8i64:		; LMULMAX4-LABEL: sextload_v8i32_v8i64:
; LMULMAX4: # %bb.0:		; LMULMAX4: # %bb.0:
; LMULMAX4-NEXT: vsetivli zero, 8, e32, m2, ta, mu		; LMULMAX4-NEXT: vsetivli zero, 8, e64, m4, ta, mu
; LMULMAX4-NEXT: vle32.v v12, (a0)		; LMULMAX4-NEXT: vle32.v v12, (a0)
; LMULMAX4-NEXT: vsetvli zero, zero, e64, m4, ta, mu
; LMULMAX4-NEXT: vsext.vf2 v8, v12		; LMULMAX4-NEXT: vsext.vf2 v8, v12
; LMULMAX4-NEXT: ret		; LMULMAX4-NEXT: ret
%y = load <8 x i32>, <8 x i32>* %x		%y = load <8 x i32>, <8 x i32>* %x
%z = sext <8 x i32> %y to <8 x i64>		%z = sext <8 x i32> %y to <8 x i64>
ret <8 x i64> %z		ret <8 x i64> %z
}		}

define <8 x i64> @zextload_v8i32_v8i64(<8 x i32>* %x) {		define <8 x i64> @zextload_v8i32_v8i64(<8 x i32>* %x) {
Show All 12 Lines
; LMULMAX1-NEXT: vsetivli zero, 2, e64, m1, ta, mu		; LMULMAX1-NEXT: vsetivli zero, 2, e64, m1, ta, mu
; LMULMAX1-NEXT: vzext.vf2 v11, v8		; LMULMAX1-NEXT: vzext.vf2 v11, v8
; LMULMAX1-NEXT: vzext.vf2 v8, v10		; LMULMAX1-NEXT: vzext.vf2 v8, v10
; LMULMAX1-NEXT: vzext.vf2 v10, v12		; LMULMAX1-NEXT: vzext.vf2 v10, v12
; LMULMAX1-NEXT: ret		; LMULMAX1-NEXT: ret
;		;
; LMULMAX4-LABEL: zextload_v8i32_v8i64:		; LMULMAX4-LABEL: zextload_v8i32_v8i64:
; LMULMAX4: # %bb.0:		; LMULMAX4: # %bb.0:
; LMULMAX4-NEXT: vsetivli zero, 8, e32, m2, ta, mu		; LMULMAX4-NEXT: vsetivli zero, 8, e64, m4, ta, mu
; LMULMAX4-NEXT: vle32.v v12, (a0)		; LMULMAX4-NEXT: vle32.v v12, (a0)
; LMULMAX4-NEXT: vsetvli zero, zero, e64, m4, ta, mu
; LMULMAX4-NEXT: vzext.vf2 v8, v12		; LMULMAX4-NEXT: vzext.vf2 v8, v12
; LMULMAX4-NEXT: ret		; LMULMAX4-NEXT: ret
%y = load <8 x i32>, <8 x i32>* %x		%y = load <8 x i32>, <8 x i32>* %x
%z = zext <8 x i32> %y to <8 x i64>		%z = zext <8 x i32> %y to <8 x i64>
ret <8 x i64> %z		ret <8 x i64> %z
}		}

define void @truncstore_v16i32_v16i8(<16 x i32> %x, <16 x i8>* %z) {		define void @truncstore_v16i32_v16i8(<16 x i32> %x, <16 x i8>* %z) {
▲ Show 20 Lines • Show All 935 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-fp-conv.ll

Show First 20 Lines • Show All 110 Lines • ▼ Show 20 Lines	; LMULMAX1-NEXT: ret
%d = fpext <8 x half> %a to <8 x double>		%d = fpext <8 x half> %a to <8 x double>
store <8 x double> %d, <8 x double>* %y		store <8 x double> %d, <8 x double>* %y
ret void		ret void
}		}

define void @fpround_v2f32_v2f16(<2 x float>* %x, <2 x half>* %y) {		define void @fpround_v2f32_v2f16(<2 x float>* %x, <2 x half>* %y) {
; CHECK-LABEL: fpround_v2f32_v2f16:		; CHECK-LABEL: fpround_v2f32_v2f16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 2, e32, mf2, ta, mu		; CHECK-NEXT: vsetivli zero, 2, e16, mf4, ta, mu
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vsetvli zero, zero, e16, mf4, ta, mu
; CHECK-NEXT: vfncvt.f.f.w v9, v8		; CHECK-NEXT: vfncvt.f.f.w v9, v8
; CHECK-NEXT: vse16.v v9, (a1)		; CHECK-NEXT: vse16.v v9, (a1)
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = load <2 x float>, <2 x float>* %x		%a = load <2 x float>, <2 x float>* %x
%d = fptrunc <2 x float> %a to <2 x half>		%d = fptrunc <2 x float> %a to <2 x half>
store <2 x half> %d, <2 x half>* %y		store <2 x half> %d, <2 x half>* %y
ret void		ret void
}		}

define void @fpround_v2f64_v2f16(<2 x double>* %x, <2 x half>* %y) {		define void @fpround_v2f64_v2f16(<2 x double>* %x, <2 x half>* %y) {
; CHECK-LABEL: fpround_v2f64_v2f16:		; CHECK-LABEL: fpround_v2f64_v2f16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 2, e64, m1, ta, mu		; CHECK-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
; CHECK-NEXT: vle64.v v8, (a0)		; CHECK-NEXT: vle64.v v8, (a0)
; CHECK-NEXT: vsetvli zero, zero, e32, mf2, ta, mu
; CHECK-NEXT: vfncvt.rod.f.f.w v9, v8		; CHECK-NEXT: vfncvt.rod.f.f.w v9, v8
; CHECK-NEXT: vsetvli zero, zero, e16, mf4, ta, mu		; CHECK-NEXT: vsetvli zero, zero, e16, mf4, ta, mu
; CHECK-NEXT: vfncvt.f.f.w v8, v9		; CHECK-NEXT: vfncvt.f.f.w v8, v9
; CHECK-NEXT: vse16.v v8, (a1)		; CHECK-NEXT: vse16.v v8, (a1)
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = load <2 x double>, <2 x double>* %x		%a = load <2 x double>, <2 x double>* %x
%d = fptrunc <2 x double> %a to <2 x half>		%d = fptrunc <2 x double> %a to <2 x half>
store <2 x half> %d, <2 x half>* %y		store <2 x half> %d, <2 x half>* %y
ret void		ret void
}		}

define void @fpround_v8f32_v8f16(<8 x float>* %x, <8 x half>* %y) {		define void @fpround_v8f32_v8f16(<8 x float>* %x, <8 x half>* %y) {
; LMULMAX8-LABEL: fpround_v8f32_v8f16:		; LMULMAX8-LABEL: fpround_v8f32_v8f16:
; LMULMAX8: # %bb.0:		; LMULMAX8: # %bb.0:
; LMULMAX8-NEXT: vsetivli zero, 8, e32, m2, ta, mu		; LMULMAX8-NEXT: vsetivli zero, 8, e16, m1, ta, mu
; LMULMAX8-NEXT: vle32.v v8, (a0)		; LMULMAX8-NEXT: vle32.v v8, (a0)
; LMULMAX8-NEXT: vsetvli zero, zero, e16, m1, ta, mu
; LMULMAX8-NEXT: vfncvt.f.f.w v10, v8		; LMULMAX8-NEXT: vfncvt.f.f.w v10, v8
; LMULMAX8-NEXT: vse16.v v10, (a1)		; LMULMAX8-NEXT: vse16.v v10, (a1)
; LMULMAX8-NEXT: ret		; LMULMAX8-NEXT: ret
;		;
; LMULMAX1-LABEL: fpround_v8f32_v8f16:		; LMULMAX1-LABEL: fpround_v8f32_v8f16:
; LMULMAX1: # %bb.0:		; LMULMAX1: # %bb.0:
; LMULMAX1-NEXT: addi a2, a0, 16		; LMULMAX1-NEXT: addi a2, a0, 16
; LMULMAX1-NEXT: vsetivli zero, 4, e32, m1, ta, mu		; LMULMAX1-NEXT: vsetivli zero, 4, e16, mf2, ta, mu
; LMULMAX1-NEXT: vle32.v v8, (a0)		; LMULMAX1-NEXT: vle32.v v8, (a0)
; LMULMAX1-NEXT: vle32.v v9, (a2)		; LMULMAX1-NEXT: vle32.v v9, (a2)
; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf2, ta, mu
; LMULMAX1-NEXT: vfncvt.f.f.w v10, v8		; LMULMAX1-NEXT: vfncvt.f.f.w v10, v8
; LMULMAX1-NEXT: vfncvt.f.f.w v8, v9		; LMULMAX1-NEXT: vfncvt.f.f.w v8, v9
; LMULMAX1-NEXT: vsetivli zero, 8, e16, m1, tu, mu		; LMULMAX1-NEXT: vsetivli zero, 8, e16, m1, tu, mu
; LMULMAX1-NEXT: vslideup.vi v10, v8, 4		; LMULMAX1-NEXT: vslideup.vi v10, v8, 4
; LMULMAX1-NEXT: vse16.v v10, (a1)		; LMULMAX1-NEXT: vse16.v v10, (a1)
; LMULMAX1-NEXT: ret		; LMULMAX1-NEXT: ret
%a = load <8 x float>, <8 x float>* %x		%a = load <8 x float>, <8 x float>* %x
%d = fptrunc <8 x float> %a to <8 x half>		%d = fptrunc <8 x float> %a to <8 x half>
store <8 x half> %d, <8 x half>* %y		store <8 x half> %d, <8 x half>* %y
ret void		ret void
}		}

define void @fpround_v8f64_v8f16(<8 x double>* %x, <8 x half>* %y) {		define void @fpround_v8f64_v8f16(<8 x double>* %x, <8 x half>* %y) {
; LMULMAX8-LABEL: fpround_v8f64_v8f16:		; LMULMAX8-LABEL: fpround_v8f64_v8f16:
; LMULMAX8: # %bb.0:		; LMULMAX8: # %bb.0:
; LMULMAX8-NEXT: vsetivli zero, 8, e64, m4, ta, mu		; LMULMAX8-NEXT: vsetivli zero, 8, e32, m2, ta, mu
; LMULMAX8-NEXT: vle64.v v8, (a0)		; LMULMAX8-NEXT: vle64.v v8, (a0)
; LMULMAX8-NEXT: vsetvli zero, zero, e32, m2, ta, mu
; LMULMAX8-NEXT: vfncvt.rod.f.f.w v12, v8		; LMULMAX8-NEXT: vfncvt.rod.f.f.w v12, v8
; LMULMAX8-NEXT: vsetvli zero, zero, e16, m1, ta, mu		; LMULMAX8-NEXT: vsetvli zero, zero, e16, m1, ta, mu
; LMULMAX8-NEXT: vfncvt.f.f.w v8, v12		; LMULMAX8-NEXT: vfncvt.f.f.w v8, v12
; LMULMAX8-NEXT: vse16.v v8, (a1)		; LMULMAX8-NEXT: vse16.v v8, (a1)
; LMULMAX8-NEXT: ret		; LMULMAX8-NEXT: ret
;		;
; LMULMAX1-LABEL: fpround_v8f64_v8f16:		; LMULMAX1-LABEL: fpround_v8f64_v8f16:
; LMULMAX1: # %bb.0:		; LMULMAX1: # %bb.0:
; LMULMAX1-NEXT: addi a2, a0, 48		; LMULMAX1-NEXT: addi a2, a0, 48
; LMULMAX1-NEXT: vsetivli zero, 2, e64, m1, ta, mu		; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
; LMULMAX1-NEXT: vle64.v v8, (a2)		; LMULMAX1-NEXT: vle64.v v8, (a2)
; LMULMAX1-NEXT: addi a2, a0, 32		; LMULMAX1-NEXT: addi a2, a0, 32
; LMULMAX1-NEXT: vle64.v v9, (a2)		; LMULMAX1-NEXT: vle64.v v9, (a0)
; LMULMAX1-NEXT: vle64.v v10, (a0)		; LMULMAX1-NEXT: vle64.v v10, (a2)
; LMULMAX1-NEXT: addi a0, a0, 16		; LMULMAX1-NEXT: addi a0, a0, 16
; LMULMAX1-NEXT: vle64.v v11, (a0)		; LMULMAX1-NEXT: vle64.v v11, (a0)
; LMULMAX1-NEXT: vsetvli zero, zero, e32, mf2, ta, mu		; LMULMAX1-NEXT: vfncvt.rod.f.f.w v12, v9
; LMULMAX1-NEXT: vfncvt.rod.f.f.w v12, v10
; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu		; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu
; LMULMAX1-NEXT: vfncvt.f.f.w v10, v12		; LMULMAX1-NEXT: vfncvt.f.f.w v9, v12
; LMULMAX1-NEXT: vsetvli zero, zero, e32, mf2, ta, mu		; LMULMAX1-NEXT: vsetvli zero, zero, e32, mf2, ta, mu
; LMULMAX1-NEXT: vfncvt.rod.f.f.w v12, v11		; LMULMAX1-NEXT: vfncvt.rod.f.f.w v12, v11
; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu		; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu
; LMULMAX1-NEXT: vfncvt.f.f.w v11, v12		; LMULMAX1-NEXT: vfncvt.f.f.w v11, v12
; LMULMAX1-NEXT: vsetivli zero, 4, e16, m1, tu, mu		; LMULMAX1-NEXT: vsetivli zero, 4, e16, m1, tu, mu
; LMULMAX1-NEXT: vslideup.vi v10, v11, 2		; LMULMAX1-NEXT: vslideup.vi v9, v11, 2
; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu		; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
; LMULMAX1-NEXT: vfncvt.rod.f.f.w v11, v9		; LMULMAX1-NEXT: vfncvt.rod.f.f.w v11, v10
; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu		; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu
; LMULMAX1-NEXT: vfncvt.f.f.w v9, v11		; LMULMAX1-NEXT: vfncvt.f.f.w v10, v11
; LMULMAX1-NEXT: vsetivli zero, 6, e16, m1, tu, mu		; LMULMAX1-NEXT: vsetivli zero, 6, e16, m1, tu, mu
; LMULMAX1-NEXT: vslideup.vi v10, v9, 4		; LMULMAX1-NEXT: vslideup.vi v9, v10, 4
; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu		; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
; LMULMAX1-NEXT: vfncvt.rod.f.f.w v9, v8		; LMULMAX1-NEXT: vfncvt.rod.f.f.w v10, v8
; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu		; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu
; LMULMAX1-NEXT: vfncvt.f.f.w v8, v9		; LMULMAX1-NEXT: vfncvt.f.f.w v8, v10
; LMULMAX1-NEXT: vsetivli zero, 8, e16, m1, tu, mu		; LMULMAX1-NEXT: vsetivli zero, 8, e16, m1, tu, mu
; LMULMAX1-NEXT: vslideup.vi v10, v8, 6		; LMULMAX1-NEXT: vslideup.vi v9, v8, 6
; LMULMAX1-NEXT: vse16.v v10, (a1)		; LMULMAX1-NEXT: vse16.v v9, (a1)
; LMULMAX1-NEXT: ret		; LMULMAX1-NEXT: ret
%a = load <8 x double>, <8 x double>* %x		%a = load <8 x double>, <8 x double>* %x
%d = fptrunc <8 x double> %a to <8 x half>		%d = fptrunc <8 x double> %a to <8 x half>
store <8 x half> %d, <8 x half>* %y		store <8 x half> %d, <8 x half>* %y
ret void		ret void
}		}

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-fp-shuffles.ll

Show First 20 Lines • Show All 79 Lines • ▼ Show 20 Lines	; RV64-NEXT: ret
ret <4 x double> %s		ret <4 x double> %s
}		}

define <4 x double> @vrgather_permute_shuffle_vu_v4f64(<4 x double> %x) {		define <4 x double> @vrgather_permute_shuffle_vu_v4f64(<4 x double> %x) {
; RV32-LABEL: vrgather_permute_shuffle_vu_v4f64:		; RV32-LABEL: vrgather_permute_shuffle_vu_v4f64:
; RV32: # %bb.0:		; RV32: # %bb.0:
; RV32-NEXT: lui a0, %hi(.LCPI4_0)		; RV32-NEXT: lui a0, %hi(.LCPI4_0)
; RV32-NEXT: addi a0, a0, %lo(.LCPI4_0)		; RV32-NEXT: addi a0, a0, %lo(.LCPI4_0)
; RV32-NEXT: vsetivli zero, 4, e16, mf2, ta, mu		; RV32-NEXT: vsetivli zero, 4, e64, m2, ta, mu
; RV32-NEXT: vle16.v v12, (a0)		; RV32-NEXT: vle16.v v12, (a0)
; RV32-NEXT: vsetvli zero, zero, e64, m2, ta, mu
; RV32-NEXT: vrgatherei16.vv v10, v8, v12		; RV32-NEXT: vrgatherei16.vv v10, v8, v12
; RV32-NEXT: vmv.v.v v8, v10		; RV32-NEXT: vmv.v.v v8, v10
; RV32-NEXT: ret		; RV32-NEXT: ret
;		;
; RV64-LABEL: vrgather_permute_shuffle_vu_v4f64:		; RV64-LABEL: vrgather_permute_shuffle_vu_v4f64:
; RV64: # %bb.0:		; RV64: # %bb.0:
; RV64-NEXT: lui a0, %hi(.LCPI4_0)		; RV64-NEXT: lui a0, %hi(.LCPI4_0)
; RV64-NEXT: addi a0, a0, %lo(.LCPI4_0)		; RV64-NEXT: addi a0, a0, %lo(.LCPI4_0)
; RV64-NEXT: vsetivli zero, 4, e64, m2, ta, mu		; RV64-NEXT: vsetivli zero, 4, e64, m2, ta, mu
; RV64-NEXT: vle64.v v12, (a0)		; RV64-NEXT: vle64.v v12, (a0)
; RV64-NEXT: vrgather.vv v10, v8, v12		; RV64-NEXT: vrgather.vv v10, v8, v12
; RV64-NEXT: vmv.v.v v8, v10		; RV64-NEXT: vmv.v.v v8, v10
; RV64-NEXT: ret		; RV64-NEXT: ret
%s = shufflevector <4 x double> %x, <4 x double> poison, <4 x i32> <i32 1, i32 2, i32 0, i32 1>		%s = shufflevector <4 x double> %x, <4 x double> poison, <4 x i32> <i32 1, i32 2, i32 0, i32 1>
ret <4 x double> %s		ret <4 x double> %s
}		}

define <4 x double> @vrgather_permute_shuffle_uv_v4f64(<4 x double> %x) {		define <4 x double> @vrgather_permute_shuffle_uv_v4f64(<4 x double> %x) {
; RV32-LABEL: vrgather_permute_shuffle_uv_v4f64:		; RV32-LABEL: vrgather_permute_shuffle_uv_v4f64:
; RV32: # %bb.0:		; RV32: # %bb.0:
; RV32-NEXT: lui a0, %hi(.LCPI5_0)		; RV32-NEXT: lui a0, %hi(.LCPI5_0)
; RV32-NEXT: addi a0, a0, %lo(.LCPI5_0)		; RV32-NEXT: addi a0, a0, %lo(.LCPI5_0)
; RV32-NEXT: vsetivli zero, 4, e16, mf2, ta, mu		; RV32-NEXT: vsetivli zero, 4, e64, m2, ta, mu
; RV32-NEXT: vle16.v v12, (a0)		; RV32-NEXT: vle16.v v12, (a0)
; RV32-NEXT: vsetvli zero, zero, e64, m2, ta, mu
; RV32-NEXT: vrgatherei16.vv v10, v8, v12		; RV32-NEXT: vrgatherei16.vv v10, v8, v12
; RV32-NEXT: vmv.v.v v8, v10		; RV32-NEXT: vmv.v.v v8, v10
; RV32-NEXT: ret		; RV32-NEXT: ret
;		;
; RV64-LABEL: vrgather_permute_shuffle_uv_v4f64:		; RV64-LABEL: vrgather_permute_shuffle_uv_v4f64:
; RV64: # %bb.0:		; RV64: # %bb.0:
; RV64-NEXT: lui a0, %hi(.LCPI5_0)		; RV64-NEXT: lui a0, %hi(.LCPI5_0)
; RV64-NEXT: addi a0, a0, %lo(.LCPI5_0)		; RV64-NEXT: addi a0, a0, %lo(.LCPI5_0)
; RV64-NEXT: vsetivli zero, 4, e64, m2, ta, mu		; RV64-NEXT: vsetivli zero, 4, e64, m2, ta, mu
; RV64-NEXT: vle64.v v12, (a0)		; RV64-NEXT: vle64.v v12, (a0)
; RV64-NEXT: vrgather.vv v10, v8, v12		; RV64-NEXT: vrgather.vv v10, v8, v12
; RV64-NEXT: vmv.v.v v8, v10		; RV64-NEXT: vmv.v.v v8, v10
; RV64-NEXT: ret		; RV64-NEXT: ret
%s = shufflevector <4 x double> poison, <4 x double> %x, <4 x i32> <i32 5, i32 6, i32 4, i32 5>		%s = shufflevector <4 x double> poison, <4 x double> %x, <4 x i32> <i32 5, i32 6, i32 4, i32 5>
ret <4 x double> %s		ret <4 x double> %s
}		}

define <4 x double> @vrgather_shuffle_vv_v4f64(<4 x double> %x, <4 x double> %y) {		define <4 x double> @vrgather_shuffle_vv_v4f64(<4 x double> %x, <4 x double> %y) {
; RV32-LABEL: vrgather_shuffle_vv_v4f64:		; RV32-LABEL: vrgather_shuffle_vv_v4f64:
; RV32: # %bb.0:		; RV32: # %bb.0:
; RV32-NEXT: lui a0, %hi(.LCPI6_0)		; RV32-NEXT: lui a0, %hi(.LCPI6_0)
; RV32-NEXT: addi a0, a0, %lo(.LCPI6_0)		; RV32-NEXT: addi a0, a0, %lo(.LCPI6_0)
; RV32-NEXT: vsetivli zero, 4, e16, mf2, ta, mu		; RV32-NEXT: vsetivli zero, 4, e64, m2, ta, mu
; RV32-NEXT: vle16.v v14, (a0)		; RV32-NEXT: vle16.v v14, (a0)
; RV32-NEXT: vsetvli zero, zero, e64, m2, ta, mu
; RV32-NEXT: vrgatherei16.vv v12, v8, v14		; RV32-NEXT: vrgatherei16.vv v12, v8, v14
; RV32-NEXT: li a0, 8		; RV32-NEXT: li a0, 8
; RV32-NEXT: vsetivli zero, 1, e8, mf8, ta, mu		; RV32-NEXT: vsetivli zero, 1, e8, mf8, ta, mu
; RV32-NEXT: vmv.s.x v0, a0		; RV32-NEXT: vmv.s.x v0, a0
; RV32-NEXT: vsetivli zero, 4, e64, m2, ta, mu		; RV32-NEXT: vsetivli zero, 4, e64, m2, ta, mu
; RV32-NEXT: vrgather.vi v12, v10, 1, v0.t		; RV32-NEXT: vrgather.vi v12, v10, 1, v0.t
; RV32-NEXT: vmv.v.v v8, v12		; RV32-NEXT: vmv.v.v v8, v12
; RV32-NEXT: ret		; RV32-NEXT: ret
▲ Show 20 Lines • Show All 182 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-fp.ll

Show First 20 Lines • Show All 450 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
store <4 x half> %e, <4 x half>* %x		store <4 x half> %e, <4 x half>* %x
ret void		ret void
}		}
declare <4 x half> @llvm.copysign.v4f16(<4 x half>, <4 x half>)		declare <4 x half> @llvm.copysign.v4f16(<4 x half>, <4 x half>)

define void @copysign_neg_ext_v2f64_v2f32(<2 x double>* %x, <2 x float>* %y) {		define void @copysign_neg_ext_v2f64_v2f32(<2 x double>* %x, <2 x float>* %y) {
; CHECK-LABEL: copysign_neg_ext_v2f64_v2f32:		; CHECK-LABEL: copysign_neg_ext_v2f64_v2f32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 2, e64, m1, ta, mu		; CHECK-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
; CHECK-NEXT: vle32.v v8, (a1)		; CHECK-NEXT: vle32.v v8, (a1)
; CHECK-NEXT: vle64.v v9, (a0)		; CHECK-NEXT: vle64.v v9, (a0)
; CHECK-NEXT: vsetvli zero, zero, e32, mf2, ta, mu
; CHECK-NEXT: vfwcvt.f.f.v v10, v8		; CHECK-NEXT: vfwcvt.f.f.v v10, v8
; CHECK-NEXT: vsetvli zero, zero, e64, m1, ta, mu		; CHECK-NEXT: vsetvli zero, zero, e64, m1, ta, mu
; CHECK-NEXT: vfsgnjn.vv v8, v9, v10		; CHECK-NEXT: vfsgnjn.vv v8, v9, v10
; CHECK-NEXT: vse64.v v8, (a0)		; CHECK-NEXT: vse64.v v8, (a0)
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = load <2 x double>, <2 x double>* %x		%a = load <2 x double>, <2 x double>* %x
%b = load <2 x float>, <2 x float>* %y		%b = load <2 x float>, <2 x float>* %y
%c = fneg <2 x float> %b		%c = fneg <2 x float> %b
▲ Show 20 Lines • Show All 1,913 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-fp2i.ll

	Show First 20 Lines • Show All 359 Lines • ▼ Show 20 Lines
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%z = fptoui <2 x half> %x to <2 x i1>			%z = fptoui <2 x half> %x to <2 x i1>
	ret <2 x i1> %z			ret <2 x i1> %z
	}			}

	define void @fp2si_v2f64_v2i8(<2 x double>* %x, <2 x i8>* %y) {			define void @fp2si_v2f64_v2i8(<2 x double>* %x, <2 x i8>* %y) {
	; CHECK-LABEL: fp2si_v2f64_v2i8:			; CHECK-LABEL: fp2si_v2f64_v2i8:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 2, e64, m1, ta, mu			; CHECK-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
	; CHECK-NEXT: vle64.v v8, (a0)			; CHECK-NEXT: vle64.v v8, (a0)
	; CHECK-NEXT: vsetvli zero, zero, e32, mf2, ta, mu
	; CHECK-NEXT: vfncvt.rtz.x.f.w v9, v8			; CHECK-NEXT: vfncvt.rtz.x.f.w v9, v8
	; CHECK-NEXT: vsetvli zero, zero, e16, mf4, ta, mu			; CHECK-NEXT: vsetvli zero, zero, e16, mf4, ta, mu
	; CHECK-NEXT: vncvt.x.x.w v8, v9			; CHECK-NEXT: vncvt.x.x.w v8, v9
	; CHECK-NEXT: vsetvli zero, zero, e8, mf8, ta, mu			; CHECK-NEXT: vsetvli zero, zero, e8, mf8, ta, mu
	; CHECK-NEXT: vncvt.x.x.w v8, v8			; CHECK-NEXT: vncvt.x.x.w v8, v8
	; CHECK-NEXT: vse8.v v8, (a1)			; CHECK-NEXT: vse8.v v8, (a1)
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%a = load <2 x double>, <2 x double>* %x			%a = load <2 x double>, <2 x double>* %x
	%d = fptosi <2 x double> %a to <2 x i8>			%d = fptosi <2 x double> %a to <2 x i8>
	store <2 x i8> %d, <2 x i8>* %y			store <2 x i8> %d, <2 x i8>* %y
	ret void			ret void
	}			}

	define void @fp2ui_v2f64_v2i8(<2 x double>* %x, <2 x i8>* %y) {			define void @fp2ui_v2f64_v2i8(<2 x double>* %x, <2 x i8>* %y) {
	; CHECK-LABEL: fp2ui_v2f64_v2i8:			; CHECK-LABEL: fp2ui_v2f64_v2i8:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 2, e64, m1, ta, mu			; CHECK-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
	; CHECK-NEXT: vle64.v v8, (a0)			; CHECK-NEXT: vle64.v v8, (a0)
	; CHECK-NEXT: vsetvli zero, zero, e32, mf2, ta, mu
	; CHECK-NEXT: vfncvt.rtz.xu.f.w v9, v8			; CHECK-NEXT: vfncvt.rtz.xu.f.w v9, v8
	; CHECK-NEXT: vsetvli zero, zero, e16, mf4, ta, mu			; CHECK-NEXT: vsetvli zero, zero, e16, mf4, ta, mu
	; CHECK-NEXT: vncvt.x.x.w v8, v9			; CHECK-NEXT: vncvt.x.x.w v8, v9
	; CHECK-NEXT: vsetvli zero, zero, e8, mf8, ta, mu			; CHECK-NEXT: vsetvli zero, zero, e8, mf8, ta, mu
	; CHECK-NEXT: vncvt.x.x.w v8, v8			; CHECK-NEXT: vncvt.x.x.w v8, v8
	; CHECK-NEXT: vse8.v v8, (a1)			; CHECK-NEXT: vse8.v v8, (a1)
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%a = load <2 x double>, <2 x double>* %x			%a = load <2 x double>, <2 x double>* %x
	Show All 24 Lines
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%z = fptoui <2 x double> %x to <2 x i1>			%z = fptoui <2 x double> %x to <2 x i1>
	ret <2 x i1> %z			ret <2 x i1> %z
	}			}

	define void @fp2si_v8f64_v8i8(<8 x double>* %x, <8 x i8>* %y) {			define void @fp2si_v8f64_v8i8(<8 x double>* %x, <8 x i8>* %y) {
	; LMULMAX8-LABEL: fp2si_v8f64_v8i8:			; LMULMAX8-LABEL: fp2si_v8f64_v8i8:
	; LMULMAX8: # %bb.0:			; LMULMAX8: # %bb.0:
	; LMULMAX8-NEXT: vsetivli zero, 8, e64, m4, ta, mu			; LMULMAX8-NEXT: vsetivli zero, 8, e32, m2, ta, mu
	; LMULMAX8-NEXT: vle64.v v8, (a0)			; LMULMAX8-NEXT: vle64.v v8, (a0)
	; LMULMAX8-NEXT: vsetvli zero, zero, e32, m2, ta, mu
	; LMULMAX8-NEXT: vfncvt.rtz.x.f.w v12, v8			; LMULMAX8-NEXT: vfncvt.rtz.x.f.w v12, v8
	; LMULMAX8-NEXT: vsetvli zero, zero, e16, m1, ta, mu			; LMULMAX8-NEXT: vsetvli zero, zero, e16, m1, ta, mu
	; LMULMAX8-NEXT: vncvt.x.x.w v8, v12			; LMULMAX8-NEXT: vncvt.x.x.w v8, v12
	; LMULMAX8-NEXT: vsetvli zero, zero, e8, mf2, ta, mu			; LMULMAX8-NEXT: vsetvli zero, zero, e8, mf2, ta, mu
	; LMULMAX8-NEXT: vncvt.x.x.w v8, v8			; LMULMAX8-NEXT: vncvt.x.x.w v8, v8
	; LMULMAX8-NEXT: vse8.v v8, (a1)			; LMULMAX8-NEXT: vse8.v v8, (a1)
	; LMULMAX8-NEXT: ret			; LMULMAX8-NEXT: ret
	;			;
	; LMULMAX1-LABEL: fp2si_v8f64_v8i8:			; LMULMAX1-LABEL: fp2si_v8f64_v8i8:
	; LMULMAX1: # %bb.0:			; LMULMAX1: # %bb.0:
	; LMULMAX1-NEXT: addi a2, a0, 48			; LMULMAX1-NEXT: addi a2, a0, 48
	; LMULMAX1-NEXT: vsetivli zero, 2, e64, m1, ta, mu			; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
	; LMULMAX1-NEXT: vle64.v v8, (a2)			; LMULMAX1-NEXT: vle64.v v8, (a2)
	; LMULMAX1-NEXT: addi a2, a0, 32			; LMULMAX1-NEXT: addi a2, a0, 32
	; LMULMAX1-NEXT: vle64.v v9, (a2)			; LMULMAX1-NEXT: vle64.v v9, (a0)
	; LMULMAX1-NEXT: vle64.v v10, (a0)			; LMULMAX1-NEXT: vle64.v v10, (a2)
	; LMULMAX1-NEXT: addi a0, a0, 16			; LMULMAX1-NEXT: addi a0, a0, 16
	; LMULMAX1-NEXT: vle64.v v11, (a0)			; LMULMAX1-NEXT: vle64.v v11, (a0)
	; LMULMAX1-NEXT: vsetvli zero, zero, e32, mf2, ta, mu			; LMULMAX1-NEXT: vfncvt.rtz.x.f.w v12, v9
	; LMULMAX1-NEXT: vfncvt.rtz.x.f.w v12, v10
	; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu
	; LMULMAX1-NEXT: vncvt.x.x.w v10, v12			; LMULMAX1-NEXT: vncvt.x.x.w v9, v12
	; LMULMAX1-NEXT: vsetvli zero, zero, e8, mf8, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e8, mf8, ta, mu
	; LMULMAX1-NEXT: vncvt.x.x.w v10, v10			; LMULMAX1-NEXT: vncvt.x.x.w v9, v9
	; LMULMAX1-NEXT: vsetvli zero, zero, e32, mf2, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e32, mf2, ta, mu
	; LMULMAX1-NEXT: vfncvt.rtz.x.f.w v12, v11			; LMULMAX1-NEXT: vfncvt.rtz.x.f.w v12, v11
	; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu
	; LMULMAX1-NEXT: vncvt.x.x.w v11, v12			; LMULMAX1-NEXT: vncvt.x.x.w v11, v12
	; LMULMAX1-NEXT: vsetvli zero, zero, e8, mf8, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e8, mf8, ta, mu
	; LMULMAX1-NEXT: vncvt.x.x.w v11, v11			; LMULMAX1-NEXT: vncvt.x.x.w v11, v11
	; LMULMAX1-NEXT: vsetivli zero, 4, e8, mf2, tu, mu			; LMULMAX1-NEXT: vsetivli zero, 4, e8, mf2, tu, mu
	; LMULMAX1-NEXT: vslideup.vi v10, v11, 2			; LMULMAX1-NEXT: vslideup.vi v9, v11, 2
	; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu			; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
	; LMULMAX1-NEXT: vfncvt.rtz.x.f.w v11, v9			; LMULMAX1-NEXT: vfncvt.rtz.x.f.w v11, v10
	; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu
	; LMULMAX1-NEXT: vncvt.x.x.w v9, v11			; LMULMAX1-NEXT: vncvt.x.x.w v10, v11
	; LMULMAX1-NEXT: vsetvli zero, zero, e8, mf8, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e8, mf8, ta, mu
	; LMULMAX1-NEXT: vncvt.x.x.w v9, v9			; LMULMAX1-NEXT: vncvt.x.x.w v10, v10
	; LMULMAX1-NEXT: vsetivli zero, 6, e8, mf2, tu, mu			; LMULMAX1-NEXT: vsetivli zero, 6, e8, mf2, tu, mu
	; LMULMAX1-NEXT: vslideup.vi v10, v9, 4			; LMULMAX1-NEXT: vslideup.vi v9, v10, 4
	; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu			; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
	; LMULMAX1-NEXT: vfncvt.rtz.x.f.w v9, v8			; LMULMAX1-NEXT: vfncvt.rtz.x.f.w v10, v8
	; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu
	; LMULMAX1-NEXT: vncvt.x.x.w v8, v9			; LMULMAX1-NEXT: vncvt.x.x.w v8, v10
	; LMULMAX1-NEXT: vsetvli zero, zero, e8, mf8, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e8, mf8, ta, mu
	; LMULMAX1-NEXT: vncvt.x.x.w v8, v8			; LMULMAX1-NEXT: vncvt.x.x.w v8, v8
	; LMULMAX1-NEXT: vsetivli zero, 8, e8, mf2, tu, mu			; LMULMAX1-NEXT: vsetivli zero, 8, e8, mf2, tu, mu
	; LMULMAX1-NEXT: vslideup.vi v10, v8, 6			; LMULMAX1-NEXT: vslideup.vi v9, v8, 6
	; LMULMAX1-NEXT: vse8.v v10, (a1)			; LMULMAX1-NEXT: vse8.v v9, (a1)
	; LMULMAX1-NEXT: ret			; LMULMAX1-NEXT: ret
	%a = load <8 x double>, <8 x double>* %x			%a = load <8 x double>, <8 x double>* %x
	%d = fptosi <8 x double> %a to <8 x i8>			%d = fptosi <8 x double> %a to <8 x i8>
	store <8 x i8> %d, <8 x i8>* %y			store <8 x i8> %d, <8 x i8>* %y
	ret void			ret void
	}			}

	define void @fp2ui_v8f64_v8i8(<8 x double>* %x, <8 x i8>* %y) {			define void @fp2ui_v8f64_v8i8(<8 x double>* %x, <8 x i8>* %y) {
	; LMULMAX8-LABEL: fp2ui_v8f64_v8i8:			; LMULMAX8-LABEL: fp2ui_v8f64_v8i8:
	; LMULMAX8: # %bb.0:			; LMULMAX8: # %bb.0:
	; LMULMAX8-NEXT: vsetivli zero, 8, e64, m4, ta, mu			; LMULMAX8-NEXT: vsetivli zero, 8, e32, m2, ta, mu
	; LMULMAX8-NEXT: vle64.v v8, (a0)			; LMULMAX8-NEXT: vle64.v v8, (a0)
	; LMULMAX8-NEXT: vsetvli zero, zero, e32, m2, ta, mu
	; LMULMAX8-NEXT: vfncvt.rtz.xu.f.w v12, v8			; LMULMAX8-NEXT: vfncvt.rtz.xu.f.w v12, v8
	; LMULMAX8-NEXT: vsetvli zero, zero, e16, m1, ta, mu			; LMULMAX8-NEXT: vsetvli zero, zero, e16, m1, ta, mu
	; LMULMAX8-NEXT: vncvt.x.x.w v8, v12			; LMULMAX8-NEXT: vncvt.x.x.w v8, v12
	; LMULMAX8-NEXT: vsetvli zero, zero, e8, mf2, ta, mu			; LMULMAX8-NEXT: vsetvli zero, zero, e8, mf2, ta, mu
	; LMULMAX8-NEXT: vncvt.x.x.w v8, v8			; LMULMAX8-NEXT: vncvt.x.x.w v8, v8
	; LMULMAX8-NEXT: vse8.v v8, (a1)			; LMULMAX8-NEXT: vse8.v v8, (a1)
	; LMULMAX8-NEXT: ret			; LMULMAX8-NEXT: ret
	;			;
	; LMULMAX1-LABEL: fp2ui_v8f64_v8i8:			; LMULMAX1-LABEL: fp2ui_v8f64_v8i8:
	; LMULMAX1: # %bb.0:			; LMULMAX1: # %bb.0:
	; LMULMAX1-NEXT: addi a2, a0, 48			; LMULMAX1-NEXT: addi a2, a0, 48
	; LMULMAX1-NEXT: vsetivli zero, 2, e64, m1, ta, mu			; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
	; LMULMAX1-NEXT: vle64.v v8, (a2)			; LMULMAX1-NEXT: vle64.v v8, (a2)
	; LMULMAX1-NEXT: addi a2, a0, 32			; LMULMAX1-NEXT: addi a2, a0, 32
	; LMULMAX1-NEXT: vle64.v v9, (a2)			; LMULMAX1-NEXT: vle64.v v9, (a0)
	; LMULMAX1-NEXT: vle64.v v10, (a0)			; LMULMAX1-NEXT: vle64.v v10, (a2)
	; LMULMAX1-NEXT: addi a0, a0, 16			; LMULMAX1-NEXT: addi a0, a0, 16
	; LMULMAX1-NEXT: vle64.v v11, (a0)			; LMULMAX1-NEXT: vle64.v v11, (a0)
	; LMULMAX1-NEXT: vsetvli zero, zero, e32, mf2, ta, mu			; LMULMAX1-NEXT: vfncvt.rtz.xu.f.w v12, v9
	; LMULMAX1-NEXT: vfncvt.rtz.xu.f.w v12, v10
	; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu
	; LMULMAX1-NEXT: vncvt.x.x.w v10, v12			; LMULMAX1-NEXT: vncvt.x.x.w v9, v12
	; LMULMAX1-NEXT: vsetvli zero, zero, e8, mf8, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e8, mf8, ta, mu
	; LMULMAX1-NEXT: vncvt.x.x.w v10, v10			; LMULMAX1-NEXT: vncvt.x.x.w v9, v9
	; LMULMAX1-NEXT: vsetvli zero, zero, e32, mf2, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e32, mf2, ta, mu
	; LMULMAX1-NEXT: vfncvt.rtz.xu.f.w v12, v11			; LMULMAX1-NEXT: vfncvt.rtz.xu.f.w v12, v11
	; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu
	; LMULMAX1-NEXT: vncvt.x.x.w v11, v12			; LMULMAX1-NEXT: vncvt.x.x.w v11, v12
	; LMULMAX1-NEXT: vsetvli zero, zero, e8, mf8, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e8, mf8, ta, mu
	; LMULMAX1-NEXT: vncvt.x.x.w v11, v11			; LMULMAX1-NEXT: vncvt.x.x.w v11, v11
	; LMULMAX1-NEXT: vsetivli zero, 4, e8, mf2, tu, mu			; LMULMAX1-NEXT: vsetivli zero, 4, e8, mf2, tu, mu
	; LMULMAX1-NEXT: vslideup.vi v10, v11, 2			; LMULMAX1-NEXT: vslideup.vi v9, v11, 2
	; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu			; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
	; LMULMAX1-NEXT: vfncvt.rtz.xu.f.w v11, v9			; LMULMAX1-NEXT: vfncvt.rtz.xu.f.w v11, v10
	; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu
	; LMULMAX1-NEXT: vncvt.x.x.w v9, v11			; LMULMAX1-NEXT: vncvt.x.x.w v10, v11
	; LMULMAX1-NEXT: vsetvli zero, zero, e8, mf8, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e8, mf8, ta, mu
	; LMULMAX1-NEXT: vncvt.x.x.w v9, v9			; LMULMAX1-NEXT: vncvt.x.x.w v10, v10
	; LMULMAX1-NEXT: vsetivli zero, 6, e8, mf2, tu, mu			; LMULMAX1-NEXT: vsetivli zero, 6, e8, mf2, tu, mu
	; LMULMAX1-NEXT: vslideup.vi v10, v9, 4			; LMULMAX1-NEXT: vslideup.vi v9, v10, 4
	; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu			; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
	; LMULMAX1-NEXT: vfncvt.rtz.xu.f.w v9, v8			; LMULMAX1-NEXT: vfncvt.rtz.xu.f.w v10, v8
	; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu
	; LMULMAX1-NEXT: vncvt.x.x.w v8, v9			; LMULMAX1-NEXT: vncvt.x.x.w v8, v10
	; LMULMAX1-NEXT: vsetvli zero, zero, e8, mf8, ta, mu			; LMULMAX1-NEXT: vsetvli zero, zero, e8, mf8, ta, mu
	; LMULMAX1-NEXT: vncvt.x.x.w v8, v8			; LMULMAX1-NEXT: vncvt.x.x.w v8, v8
	; LMULMAX1-NEXT: vsetivli zero, 8, e8, mf2, tu, mu			; LMULMAX1-NEXT: vsetivli zero, 8, e8, mf2, tu, mu
	; LMULMAX1-NEXT: vslideup.vi v10, v8, 6			; LMULMAX1-NEXT: vslideup.vi v9, v8, 6
	; LMULMAX1-NEXT: vse8.v v10, (a1)			; LMULMAX1-NEXT: vse8.v v9, (a1)
	; LMULMAX1-NEXT: ret			; LMULMAX1-NEXT: ret
	%a = load <8 x double>, <8 x double>* %x			%a = load <8 x double>, <8 x double>* %x
	%d = fptoui <8 x double> %a to <8 x i8>			%d = fptoui <8 x double> %a to <8 x i8>
	store <8 x i8> %d, <8 x i8>* %y			store <8 x i8> %d, <8 x i8>* %y
	ret void			ret void
	}			}

	define <8 x i1> @fp2si_v8f64_v8i1(<8 x double> %x) {			define <8 x i1> @fp2si_v8f64_v8i1(<8 x double> %x) {
	▲ Show 20 Lines • Show All 110 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-i2fp.ll

Show First 20 Lines • Show All 195 Lines • ▼ Show 20 Lines
; LMULMAX1-NEXT: ret		; LMULMAX1-NEXT: ret
%z = uitofp <8 x i1> %x to <8 x float>		%z = uitofp <8 x i1> %x to <8 x float>
ret <8 x float> %z		ret <8 x float> %z
}		}

define void @si2fp_v2i16_v2f64(<2 x i16>* %x, <2 x double>* %y) {		define void @si2fp_v2i16_v2f64(<2 x i16>* %x, <2 x double>* %y) {
; CHECK-LABEL: si2fp_v2i16_v2f64:		; CHECK-LABEL: si2fp_v2i16_v2f64:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 2, e16, mf4, ta, mu		; CHECK-NEXT: vsetivli zero, 2, e64, m1, ta, mu
; CHECK-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; CHECK-NEXT: vsetvli zero, zero, e64, m1, ta, mu
; CHECK-NEXT: vsext.vf4 v9, v8		; CHECK-NEXT: vsext.vf4 v9, v8
; CHECK-NEXT: vfcvt.f.x.v v8, v9		; CHECK-NEXT: vfcvt.f.x.v v8, v9
; CHECK-NEXT: vse64.v v8, (a1)		; CHECK-NEXT: vse64.v v8, (a1)
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = load <2 x i16>, <2 x i16>* %x		%a = load <2 x i16>, <2 x i16>* %x
%d = sitofp <2 x i16> %a to <2 x double>		%d = sitofp <2 x i16> %a to <2 x double>
store <2 x double> %d, <2 x double>* %y		store <2 x double> %d, <2 x double>* %y
ret void		ret void
}		}

define void @ui2fp_v2i16_v2f64(<2 x i16>* %x, <2 x double>* %y) {		define void @ui2fp_v2i16_v2f64(<2 x i16>* %x, <2 x double>* %y) {
; CHECK-LABEL: ui2fp_v2i16_v2f64:		; CHECK-LABEL: ui2fp_v2i16_v2f64:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 2, e16, mf4, ta, mu		; CHECK-NEXT: vsetivli zero, 2, e64, m1, ta, mu
; CHECK-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; CHECK-NEXT: vsetvli zero, zero, e64, m1, ta, mu
; CHECK-NEXT: vzext.vf4 v9, v8		; CHECK-NEXT: vzext.vf4 v9, v8
; CHECK-NEXT: vfcvt.f.xu.v v8, v9		; CHECK-NEXT: vfcvt.f.xu.v v8, v9
; CHECK-NEXT: vse64.v v8, (a1)		; CHECK-NEXT: vse64.v v8, (a1)
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = load <2 x i16>, <2 x i16>* %x		%a = load <2 x i16>, <2 x i16>* %x
%d = uitofp <2 x i16> %a to <2 x double>		%d = uitofp <2 x i16> %a to <2 x double>
store <2 x double> %d, <2 x double>* %y		store <2 x double> %d, <2 x double>* %y
ret void		ret void
}		}

define void @si2fp_v8i16_v8f64(<8 x i16>* %x, <8 x double>* %y) {		define void @si2fp_v8i16_v8f64(<8 x i16>* %x, <8 x double>* %y) {
; LMULMAX8-LABEL: si2fp_v8i16_v8f64:		; LMULMAX8-LABEL: si2fp_v8i16_v8f64:
; LMULMAX8: # %bb.0:		; LMULMAX8: # %bb.0:
; LMULMAX8-NEXT: vsetivli zero, 8, e16, m1, ta, mu		; LMULMAX8-NEXT: vsetivli zero, 8, e64, m4, ta, mu
; LMULMAX8-NEXT: vle16.v v8, (a0)		; LMULMAX8-NEXT: vle16.v v8, (a0)
; LMULMAX8-NEXT: vsetvli zero, zero, e64, m4, ta, mu
; LMULMAX8-NEXT: vsext.vf4 v12, v8		; LMULMAX8-NEXT: vsext.vf4 v12, v8
; LMULMAX8-NEXT: vfcvt.f.x.v v8, v12		; LMULMAX8-NEXT: vfcvt.f.x.v v8, v12
; LMULMAX8-NEXT: vse64.v v8, (a1)		; LMULMAX8-NEXT: vse64.v v8, (a1)
; LMULMAX8-NEXT: ret		; LMULMAX8-NEXT: ret
;		;
; LMULMAX1-LABEL: si2fp_v8i16_v8f64:		; LMULMAX1-LABEL: si2fp_v8i16_v8f64:
; LMULMAX1: # %bb.0:		; LMULMAX1: # %bb.0:
; LMULMAX1-NEXT: vsetivli zero, 8, e16, m1, ta, mu		; LMULMAX1-NEXT: vsetivli zero, 8, e16, m1, ta, mu
Show All 26 Lines	; LMULMAX1-NEXT: ret
%d = sitofp <8 x i16> %a to <8 x double>		%d = sitofp <8 x i16> %a to <8 x double>
store <8 x double> %d, <8 x double>* %y		store <8 x double> %d, <8 x double>* %y
ret void		ret void
}		}

define void @ui2fp_v8i16_v8f64(<8 x i16>* %x, <8 x double>* %y) {		define void @ui2fp_v8i16_v8f64(<8 x i16>* %x, <8 x double>* %y) {
; LMULMAX8-LABEL: ui2fp_v8i16_v8f64:		; LMULMAX8-LABEL: ui2fp_v8i16_v8f64:
; LMULMAX8: # %bb.0:		; LMULMAX8: # %bb.0:
; LMULMAX8-NEXT: vsetivli zero, 8, e16, m1, ta, mu		; LMULMAX8-NEXT: vsetivli zero, 8, e64, m4, ta, mu
; LMULMAX8-NEXT: vle16.v v8, (a0)		; LMULMAX8-NEXT: vle16.v v8, (a0)
; LMULMAX8-NEXT: vsetvli zero, zero, e64, m4, ta, mu
; LMULMAX8-NEXT: vzext.vf4 v12, v8		; LMULMAX8-NEXT: vzext.vf4 v12, v8
; LMULMAX8-NEXT: vfcvt.f.xu.v v8, v12		; LMULMAX8-NEXT: vfcvt.f.xu.v v8, v12
; LMULMAX8-NEXT: vse64.v v8, (a1)		; LMULMAX8-NEXT: vse64.v v8, (a1)
; LMULMAX8-NEXT: ret		; LMULMAX8-NEXT: ret
;		;
; LMULMAX1-LABEL: ui2fp_v8i16_v8f64:		; LMULMAX1-LABEL: ui2fp_v8i16_v8f64:
; LMULMAX1: # %bb.0:		; LMULMAX1: # %bb.0:
; LMULMAX1-NEXT: vsetivli zero, 8, e16, m1, ta, mu		; LMULMAX1-NEXT: vsetivli zero, 8, e16, m1, ta, mu
▲ Show 20 Lines • Show All 128 Lines • ▼ Show 20 Lines
; LMULMAX1-NEXT: ret		; LMULMAX1-NEXT: ret
%z = uitofp <8 x i1> %x to <8 x double>		%z = uitofp <8 x i1> %x to <8 x double>
ret <8 x double> %z		ret <8 x double> %z
}		}

define void @si2fp_v2i64_v2f16(<2 x i64>* %x, <2 x half>* %y) {		define void @si2fp_v2i64_v2f16(<2 x i64>* %x, <2 x half>* %y) {
; CHECK-LABEL: si2fp_v2i64_v2f16:		; CHECK-LABEL: si2fp_v2i64_v2f16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 2, e64, m1, ta, mu		; CHECK-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
; CHECK-NEXT: vle64.v v8, (a0)		; CHECK-NEXT: vle64.v v8, (a0)
; CHECK-NEXT: vsetvli zero, zero, e32, mf2, ta, mu
; CHECK-NEXT: vfncvt.f.x.w v9, v8		; CHECK-NEXT: vfncvt.f.x.w v9, v8
; CHECK-NEXT: vsetvli zero, zero, e16, mf4, ta, mu		; CHECK-NEXT: vsetvli zero, zero, e16, mf4, ta, mu
; CHECK-NEXT: vfncvt.f.f.w v8, v9		; CHECK-NEXT: vfncvt.f.f.w v8, v9
; CHECK-NEXT: vse16.v v8, (a1)		; CHECK-NEXT: vse16.v v8, (a1)
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = load <2 x i64>, <2 x i64>* %x		%a = load <2 x i64>, <2 x i64>* %x
%d = sitofp <2 x i64> %a to <2 x half>		%d = sitofp <2 x i64> %a to <2 x half>
store <2 x half> %d, <2 x half>* %y		store <2 x half> %d, <2 x half>* %y
ret void		ret void
}		}

define void @ui2fp_v2i64_v2f16(<2 x i64>* %x, <2 x half>* %y) {		define void @ui2fp_v2i64_v2f16(<2 x i64>* %x, <2 x half>* %y) {
; CHECK-LABEL: ui2fp_v2i64_v2f16:		; CHECK-LABEL: ui2fp_v2i64_v2f16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 2, e64, m1, ta, mu		; CHECK-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
; CHECK-NEXT: vle64.v v8, (a0)		; CHECK-NEXT: vle64.v v8, (a0)
; CHECK-NEXT: vsetvli zero, zero, e32, mf2, ta, mu
; CHECK-NEXT: vfncvt.f.xu.w v9, v8		; CHECK-NEXT: vfncvt.f.xu.w v9, v8
; CHECK-NEXT: vsetvli zero, zero, e16, mf4, ta, mu		; CHECK-NEXT: vsetvli zero, zero, e16, mf4, ta, mu
; CHECK-NEXT: vfncvt.f.f.w v8, v9		; CHECK-NEXT: vfncvt.f.f.w v8, v9
; CHECK-NEXT: vse16.v v8, (a1)		; CHECK-NEXT: vse16.v v8, (a1)
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = load <2 x i64>, <2 x i64>* %x		%a = load <2 x i64>, <2 x i64>* %x
%d = uitofp <2 x i64> %a to <2 x half>		%d = uitofp <2 x i64> %a to <2 x half>
store <2 x half> %d, <2 x half>* %y		store <2 x half> %d, <2 x half>* %y
Show All 22 Lines
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%z = uitofp <2 x i1> %x to <2 x half>		%z = uitofp <2 x i1> %x to <2 x half>
ret <2 x half> %z		ret <2 x half> %z
}		}

define void @si2fp_v8i64_v8f16(<8 x i64>* %x, <8 x half>* %y) {		define void @si2fp_v8i64_v8f16(<8 x i64>* %x, <8 x half>* %y) {
; LMULMAX8-LABEL: si2fp_v8i64_v8f16:		; LMULMAX8-LABEL: si2fp_v8i64_v8f16:
; LMULMAX8: # %bb.0:		; LMULMAX8: # %bb.0:
; LMULMAX8-NEXT: vsetivli zero, 8, e64, m4, ta, mu		; LMULMAX8-NEXT: vsetivli zero, 8, e32, m2, ta, mu
; LMULMAX8-NEXT: vle64.v v8, (a0)		; LMULMAX8-NEXT: vle64.v v8, (a0)
; LMULMAX8-NEXT: vsetvli zero, zero, e32, m2, ta, mu
; LMULMAX8-NEXT: vfncvt.f.x.w v12, v8		; LMULMAX8-NEXT: vfncvt.f.x.w v12, v8
; LMULMAX8-NEXT: vsetvli zero, zero, e16, m1, ta, mu		; LMULMAX8-NEXT: vsetvli zero, zero, e16, m1, ta, mu
; LMULMAX8-NEXT: vfncvt.f.f.w v8, v12		; LMULMAX8-NEXT: vfncvt.f.f.w v8, v12
; LMULMAX8-NEXT: vse16.v v8, (a1)		; LMULMAX8-NEXT: vse16.v v8, (a1)
; LMULMAX8-NEXT: ret		; LMULMAX8-NEXT: ret
;		;
; LMULMAX1-LABEL: si2fp_v8i64_v8f16:		; LMULMAX1-LABEL: si2fp_v8i64_v8f16:
; LMULMAX1: # %bb.0:		; LMULMAX1: # %bb.0:
; LMULMAX1-NEXT: addi a2, a0, 48		; LMULMAX1-NEXT: addi a2, a0, 48
; LMULMAX1-NEXT: vsetivli zero, 2, e64, m1, ta, mu		; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
; LMULMAX1-NEXT: vle64.v v8, (a2)		; LMULMAX1-NEXT: vle64.v v8, (a2)
; LMULMAX1-NEXT: addi a2, a0, 32		; LMULMAX1-NEXT: addi a2, a0, 32
; LMULMAX1-NEXT: vle64.v v9, (a2)		; LMULMAX1-NEXT: vle64.v v9, (a0)
; LMULMAX1-NEXT: vle64.v v10, (a0)		; LMULMAX1-NEXT: vle64.v v10, (a2)
; LMULMAX1-NEXT: addi a0, a0, 16		; LMULMAX1-NEXT: addi a0, a0, 16
; LMULMAX1-NEXT: vle64.v v11, (a0)		; LMULMAX1-NEXT: vle64.v v11, (a0)
; LMULMAX1-NEXT: vsetvli zero, zero, e32, mf2, ta, mu		; LMULMAX1-NEXT: vfncvt.f.x.w v12, v9
; LMULMAX1-NEXT: vfncvt.f.x.w v12, v10
; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu		; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu
; LMULMAX1-NEXT: vfncvt.f.f.w v10, v12		; LMULMAX1-NEXT: vfncvt.f.f.w v9, v12
; LMULMAX1-NEXT: vsetvli zero, zero, e32, mf2, ta, mu		; LMULMAX1-NEXT: vsetvli zero, zero, e32, mf2, ta, mu
; LMULMAX1-NEXT: vfncvt.f.x.w v12, v11		; LMULMAX1-NEXT: vfncvt.f.x.w v12, v11
; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu		; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu
; LMULMAX1-NEXT: vfncvt.f.f.w v11, v12		; LMULMAX1-NEXT: vfncvt.f.f.w v11, v12
; LMULMAX1-NEXT: vsetivli zero, 4, e16, m1, tu, mu		; LMULMAX1-NEXT: vsetivli zero, 4, e16, m1, tu, mu
; LMULMAX1-NEXT: vslideup.vi v10, v11, 2		; LMULMAX1-NEXT: vslideup.vi v9, v11, 2
; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu		; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
; LMULMAX1-NEXT: vfncvt.f.x.w v11, v9		; LMULMAX1-NEXT: vfncvt.f.x.w v11, v10
; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu		; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu
; LMULMAX1-NEXT: vfncvt.f.f.w v9, v11		; LMULMAX1-NEXT: vfncvt.f.f.w v10, v11
; LMULMAX1-NEXT: vsetivli zero, 6, e16, m1, tu, mu		; LMULMAX1-NEXT: vsetivli zero, 6, e16, m1, tu, mu
; LMULMAX1-NEXT: vslideup.vi v10, v9, 4		; LMULMAX1-NEXT: vslideup.vi v9, v10, 4
; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu		; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
; LMULMAX1-NEXT: vfncvt.f.x.w v9, v8		; LMULMAX1-NEXT: vfncvt.f.x.w v10, v8
; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu		; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu
; LMULMAX1-NEXT: vfncvt.f.f.w v8, v9		; LMULMAX1-NEXT: vfncvt.f.f.w v8, v10
; LMULMAX1-NEXT: vsetivli zero, 8, e16, m1, tu, mu		; LMULMAX1-NEXT: vsetivli zero, 8, e16, m1, tu, mu
; LMULMAX1-NEXT: vslideup.vi v10, v8, 6		; LMULMAX1-NEXT: vslideup.vi v9, v8, 6
; LMULMAX1-NEXT: vse16.v v10, (a1)		; LMULMAX1-NEXT: vse16.v v9, (a1)
; LMULMAX1-NEXT: ret		; LMULMAX1-NEXT: ret
%a = load <8 x i64>, <8 x i64>* %x		%a = load <8 x i64>, <8 x i64>* %x
%d = sitofp <8 x i64> %a to <8 x half>		%d = sitofp <8 x i64> %a to <8 x half>
store <8 x half> %d, <8 x half>* %y		store <8 x half> %d, <8 x half>* %y
ret void		ret void
}		}

define void @ui2fp_v8i64_v8f16(<8 x i64>* %x, <8 x half>* %y) {		define void @ui2fp_v8i64_v8f16(<8 x i64>* %x, <8 x half>* %y) {
; LMULMAX8-LABEL: ui2fp_v8i64_v8f16:		; LMULMAX8-LABEL: ui2fp_v8i64_v8f16:
; LMULMAX8: # %bb.0:		; LMULMAX8: # %bb.0:
; LMULMAX8-NEXT: vsetivli zero, 8, e64, m4, ta, mu		; LMULMAX8-NEXT: vsetivli zero, 8, e32, m2, ta, mu
; LMULMAX8-NEXT: vle64.v v8, (a0)		; LMULMAX8-NEXT: vle64.v v8, (a0)
; LMULMAX8-NEXT: vsetvli zero, zero, e32, m2, ta, mu
; LMULMAX8-NEXT: vfncvt.f.xu.w v12, v8		; LMULMAX8-NEXT: vfncvt.f.xu.w v12, v8
; LMULMAX8-NEXT: vsetvli zero, zero, e16, m1, ta, mu		; LMULMAX8-NEXT: vsetvli zero, zero, e16, m1, ta, mu
; LMULMAX8-NEXT: vfncvt.f.f.w v8, v12		; LMULMAX8-NEXT: vfncvt.f.f.w v8, v12
; LMULMAX8-NEXT: vse16.v v8, (a1)		; LMULMAX8-NEXT: vse16.v v8, (a1)
; LMULMAX8-NEXT: ret		; LMULMAX8-NEXT: ret
;		;
; LMULMAX1-LABEL: ui2fp_v8i64_v8f16:		; LMULMAX1-LABEL: ui2fp_v8i64_v8f16:
; LMULMAX1: # %bb.0:		; LMULMAX1: # %bb.0:
; LMULMAX1-NEXT: addi a2, a0, 48		; LMULMAX1-NEXT: addi a2, a0, 48
; LMULMAX1-NEXT: vsetivli zero, 2, e64, m1, ta, mu		; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
; LMULMAX1-NEXT: vle64.v v8, (a2)		; LMULMAX1-NEXT: vle64.v v8, (a2)
; LMULMAX1-NEXT: addi a2, a0, 32		; LMULMAX1-NEXT: addi a2, a0, 32
; LMULMAX1-NEXT: vle64.v v9, (a2)		; LMULMAX1-NEXT: vle64.v v9, (a0)
; LMULMAX1-NEXT: vle64.v v10, (a0)		; LMULMAX1-NEXT: vle64.v v10, (a2)
; LMULMAX1-NEXT: addi a0, a0, 16		; LMULMAX1-NEXT: addi a0, a0, 16
; LMULMAX1-NEXT: vle64.v v11, (a0)		; LMULMAX1-NEXT: vle64.v v11, (a0)
; LMULMAX1-NEXT: vsetvli zero, zero, e32, mf2, ta, mu		; LMULMAX1-NEXT: vfncvt.f.xu.w v12, v9
; LMULMAX1-NEXT: vfncvt.f.xu.w v12, v10
; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu		; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu
; LMULMAX1-NEXT: vfncvt.f.f.w v10, v12		; LMULMAX1-NEXT: vfncvt.f.f.w v9, v12
; LMULMAX1-NEXT: vsetvli zero, zero, e32, mf2, ta, mu		; LMULMAX1-NEXT: vsetvli zero, zero, e32, mf2, ta, mu
; LMULMAX1-NEXT: vfncvt.f.xu.w v12, v11		; LMULMAX1-NEXT: vfncvt.f.xu.w v12, v11
; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu		; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu
; LMULMAX1-NEXT: vfncvt.f.f.w v11, v12		; LMULMAX1-NEXT: vfncvt.f.f.w v11, v12
; LMULMAX1-NEXT: vsetivli zero, 4, e16, m1, tu, mu		; LMULMAX1-NEXT: vsetivli zero, 4, e16, m1, tu, mu
; LMULMAX1-NEXT: vslideup.vi v10, v11, 2		; LMULMAX1-NEXT: vslideup.vi v9, v11, 2
; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu		; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
; LMULMAX1-NEXT: vfncvt.f.xu.w v11, v9		; LMULMAX1-NEXT: vfncvt.f.xu.w v11, v10
; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu		; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu
; LMULMAX1-NEXT: vfncvt.f.f.w v9, v11		; LMULMAX1-NEXT: vfncvt.f.f.w v10, v11
; LMULMAX1-NEXT: vsetivli zero, 6, e16, m1, tu, mu		; LMULMAX1-NEXT: vsetivli zero, 6, e16, m1, tu, mu
; LMULMAX1-NEXT: vslideup.vi v10, v9, 4		; LMULMAX1-NEXT: vslideup.vi v9, v10, 4
; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu		; LMULMAX1-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
; LMULMAX1-NEXT: vfncvt.f.xu.w v9, v8		; LMULMAX1-NEXT: vfncvt.f.xu.w v10, v8
; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu		; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf4, ta, mu
; LMULMAX1-NEXT: vfncvt.f.f.w v8, v9		; LMULMAX1-NEXT: vfncvt.f.f.w v8, v10
; LMULMAX1-NEXT: vsetivli zero, 8, e16, m1, tu, mu		; LMULMAX1-NEXT: vsetivli zero, 8, e16, m1, tu, mu
; LMULMAX1-NEXT: vslideup.vi v10, v8, 6		; LMULMAX1-NEXT: vslideup.vi v9, v8, 6
; LMULMAX1-NEXT: vse16.v v10, (a1)		; LMULMAX1-NEXT: vse16.v v9, (a1)
; LMULMAX1-NEXT: ret		; LMULMAX1-NEXT: ret
%a = load <8 x i64>, <8 x i64>* %x		%a = load <8 x i64>, <8 x i64>* %x
%d = uitofp <8 x i64> %a to <8 x half>		%d = uitofp <8 x i64> %a to <8 x half>
store <8 x half> %d, <8 x half>* %y		store <8 x half> %d, <8 x half>* %y
ret void		ret void
}		}

define <8 x half> @si2fp_v8i1_v8f16(<8 x i1> %x) {		define <8 x half> @si2fp_v8i1_v8f16(<8 x i1> %x) {
Show All 22 Lines

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-int-exttrunc.ll

; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py		; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
; RUN: llc -mtriple=riscv32 -mattr=+m,+v -riscv-v-vector-bits-min=128 -riscv-v-fixed-length-vector-lmul-max=8 -verify-machineinstrs < %s \| FileCheck %s --check-prefixes=CHECK,LMULMAX8		; RUN: llc -mtriple=riscv32 -mattr=+m,+v -riscv-v-vector-bits-min=128 -riscv-v-fixed-length-vector-lmul-max=8 -verify-machineinstrs < %s \| FileCheck %s --check-prefixes=CHECK,LMULMAX8
; RUN: llc -mtriple=riscv64 -mattr=+m,+v -riscv-v-vector-bits-min=128 -riscv-v-fixed-length-vector-lmul-max=8 -verify-machineinstrs < %s \| FileCheck %s --check-prefixes=CHECK,LMULMAX8		; RUN: llc -mtriple=riscv64 -mattr=+m,+v -riscv-v-vector-bits-min=128 -riscv-v-fixed-length-vector-lmul-max=8 -verify-machineinstrs < %s \| FileCheck %s --check-prefixes=CHECK,LMULMAX8
; RUN: llc -mtriple=riscv32 -mattr=+m,+v -riscv-v-vector-bits-min=128 -riscv-v-fixed-length-vector-lmul-max=2 -verify-machineinstrs < %s \| FileCheck %s --check-prefixes=CHECK,LMULMAX2		; RUN: llc -mtriple=riscv32 -mattr=+m,+v -riscv-v-vector-bits-min=128 -riscv-v-fixed-length-vector-lmul-max=2 -verify-machineinstrs < %s \| FileCheck %s --check-prefixes=CHECK,LMULMAX2
; RUN: llc -mtriple=riscv64 -mattr=+m,+v -riscv-v-vector-bits-min=128 -riscv-v-fixed-length-vector-lmul-max=2 -verify-machineinstrs < %s \| FileCheck %s --check-prefixes=CHECK,LMULMAX2		; RUN: llc -mtriple=riscv64 -mattr=+m,+v -riscv-v-vector-bits-min=128 -riscv-v-fixed-length-vector-lmul-max=2 -verify-machineinstrs < %s \| FileCheck %s --check-prefixes=CHECK,LMULMAX2
; RUN: llc -mtriple=riscv32 -mattr=+m,+v -riscv-v-vector-bits-min=128 -riscv-v-fixed-length-vector-lmul-max=1 -verify-machineinstrs < %s \| FileCheck %s --check-prefixes=CHECK,LMULMAX1		; RUN: llc -mtriple=riscv32 -mattr=+m,+v -riscv-v-vector-bits-min=128 -riscv-v-fixed-length-vector-lmul-max=1 -verify-machineinstrs < %s \| FileCheck %s --check-prefixes=CHECK,LMULMAX1
; RUN: llc -mtriple=riscv64 -mattr=+m,+v -riscv-v-vector-bits-min=128 -riscv-v-fixed-length-vector-lmul-max=1 -verify-machineinstrs < %s \| FileCheck %s --check-prefixes=CHECK,LMULMAX1		; RUN: llc -mtriple=riscv64 -mattr=+m,+v -riscv-v-vector-bits-min=128 -riscv-v-fixed-length-vector-lmul-max=1 -verify-machineinstrs < %s \| FileCheck %s --check-prefixes=CHECK,LMULMAX1

define void @sext_v4i8_v4i32(<4 x i8>* %x, <4 x i32>* %z) {		define void @sext_v4i8_v4i32(<4 x i8>* %x, <4 x i32>* %z) {
; CHECK-LABEL: sext_v4i8_v4i32:		; CHECK-LABEL: sext_v4i8_v4i32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 4, e8, mf4, ta, mu		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: vle8.v v8, (a0)		; CHECK-NEXT: vle8.v v8, (a0)
; CHECK-NEXT: vsetvli zero, zero, e32, m1, ta, mu
; CHECK-NEXT: vsext.vf4 v9, v8		; CHECK-NEXT: vsext.vf4 v9, v8
; CHECK-NEXT: vse32.v v9, (a1)		; CHECK-NEXT: vse32.v v9, (a1)
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = load <4 x i8>, <4 x i8>* %x		%a = load <4 x i8>, <4 x i8>* %x
%b = sext <4 x i8> %a to <4 x i32>		%b = sext <4 x i8> %a to <4 x i32>
store <4 x i32> %b, <4 x i32>* %z		store <4 x i32> %b, <4 x i32>* %z
ret void		ret void
}		}

define void @zext_v4i8_v4i32(<4 x i8>* %x, <4 x i32>* %z) {		define void @zext_v4i8_v4i32(<4 x i8>* %x, <4 x i32>* %z) {
; CHECK-LABEL: zext_v4i8_v4i32:		; CHECK-LABEL: zext_v4i8_v4i32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 4, e8, mf4, ta, mu		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: vle8.v v8, (a0)		; CHECK-NEXT: vle8.v v8, (a0)
; CHECK-NEXT: vsetvli zero, zero, e32, m1, ta, mu
; CHECK-NEXT: vzext.vf4 v9, v8		; CHECK-NEXT: vzext.vf4 v9, v8
; CHECK-NEXT: vse32.v v9, (a1)		; CHECK-NEXT: vse32.v v9, (a1)
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = load <4 x i8>, <4 x i8>* %x		%a = load <4 x i8>, <4 x i8>* %x
%b = zext <4 x i8> %a to <4 x i32>		%b = zext <4 x i8> %a to <4 x i32>
store <4 x i32> %b, <4 x i32>* %z		store <4 x i32> %b, <4 x i32>* %z
ret void		ret void
}		}

define void @sext_v8i8_v8i32(<8 x i8>* %x, <8 x i32>* %z) {		define void @sext_v8i8_v8i32(<8 x i8>* %x, <8 x i32>* %z) {
; LMULMAX8-LABEL: sext_v8i8_v8i32:		; LMULMAX8-LABEL: sext_v8i8_v8i32:
; LMULMAX8: # %bb.0:		; LMULMAX8: # %bb.0:
; LMULMAX8-NEXT: vsetivli zero, 8, e8, mf2, ta, mu		; LMULMAX8-NEXT: vsetivli zero, 8, e32, m2, ta, mu
; LMULMAX8-NEXT: vle8.v v8, (a0)		; LMULMAX8-NEXT: vle8.v v8, (a0)
; LMULMAX8-NEXT: vsetvli zero, zero, e32, m2, ta, mu
; LMULMAX8-NEXT: vsext.vf4 v10, v8		; LMULMAX8-NEXT: vsext.vf4 v10, v8
; LMULMAX8-NEXT: vse32.v v10, (a1)		; LMULMAX8-NEXT: vse32.v v10, (a1)
; LMULMAX8-NEXT: ret		; LMULMAX8-NEXT: ret
;		;
; LMULMAX2-LABEL: sext_v8i8_v8i32:		; LMULMAX2-LABEL: sext_v8i8_v8i32:
; LMULMAX2: # %bb.0:		; LMULMAX2: # %bb.0:
; LMULMAX2-NEXT: vsetivli zero, 8, e8, mf2, ta, mu		; LMULMAX2-NEXT: vsetivli zero, 8, e32, m2, ta, mu
; LMULMAX2-NEXT: vle8.v v8, (a0)		; LMULMAX2-NEXT: vle8.v v8, (a0)
; LMULMAX2-NEXT: vsetvli zero, zero, e32, m2, ta, mu
; LMULMAX2-NEXT: vsext.vf4 v10, v8		; LMULMAX2-NEXT: vsext.vf4 v10, v8
; LMULMAX2-NEXT: vse32.v v10, (a1)		; LMULMAX2-NEXT: vse32.v v10, (a1)
; LMULMAX2-NEXT: ret		; LMULMAX2-NEXT: ret
;		;
; LMULMAX1-LABEL: sext_v8i8_v8i32:		; LMULMAX1-LABEL: sext_v8i8_v8i32:
; LMULMAX1: # %bb.0:		; LMULMAX1: # %bb.0:
; LMULMAX1-NEXT: vsetivli zero, 8, e8, mf2, ta, mu		; LMULMAX1-NEXT: vsetivli zero, 8, e8, mf2, ta, mu
; LMULMAX1-NEXT: vle8.v v8, (a0)		; LMULMAX1-NEXT: vle8.v v8, (a0)
Show All 11 Lines	; LMULMAX1-NEXT: ret
store <8 x i32> %b, <8 x i32>* %z		store <8 x i32> %b, <8 x i32>* %z
ret void		ret void
}		}

define void @sext_v32i8_v32i32(<32 x i8>* %x, <32 x i32>* %z) {		define void @sext_v32i8_v32i32(<32 x i8>* %x, <32 x i32>* %z) {
; LMULMAX8-LABEL: sext_v32i8_v32i32:		; LMULMAX8-LABEL: sext_v32i8_v32i32:
; LMULMAX8: # %bb.0:		; LMULMAX8: # %bb.0:
; LMULMAX8-NEXT: li a2, 32		; LMULMAX8-NEXT: li a2, 32
; LMULMAX8-NEXT: vsetvli zero, a2, e8, m2, ta, mu		; LMULMAX8-NEXT: vsetvli zero, a2, e32, m8, ta, mu
; LMULMAX8-NEXT: vle8.v v8, (a0)		; LMULMAX8-NEXT: vle8.v v8, (a0)
; LMULMAX8-NEXT: vsetvli zero, zero, e32, m8, ta, mu
; LMULMAX8-NEXT: vsext.vf4 v16, v8		; LMULMAX8-NEXT: vsext.vf4 v16, v8
; LMULMAX8-NEXT: vse32.v v16, (a1)		; LMULMAX8-NEXT: vse32.v v16, (a1)
; LMULMAX8-NEXT: ret		; LMULMAX8-NEXT: ret
;		;
; LMULMAX2-LABEL: sext_v32i8_v32i32:		; LMULMAX2-LABEL: sext_v32i8_v32i32:
; LMULMAX2: # %bb.0:		; LMULMAX2: # %bb.0:
; LMULMAX2-NEXT: li a2, 32		; LMULMAX2-NEXT: li a2, 32
; LMULMAX2-NEXT: vsetvli zero, a2, e8, m2, ta, mu		; LMULMAX2-NEXT: vsetvli zero, a2, e8, m2, ta, mu
▲ Show 20 Lines • Show All 69 Lines • ▼ Show 20 Lines	; LMULMAX1-NEXT: ret
%b = sext <32 x i8> %a to <32 x i32>		%b = sext <32 x i8> %a to <32 x i32>
store <32 x i32> %b, <32 x i32>* %z		store <32 x i32> %b, <32 x i32>* %z
ret void		ret void
}		}

define void @trunc_v4i8_v4i32(<4 x i32>* %x, <4 x i8>* %z) {		define void @trunc_v4i8_v4i32(<4 x i32>* %x, <4 x i8>* %z) {
; CHECK-LABEL: trunc_v4i8_v4i32:		; CHECK-LABEL: trunc_v4i8_v4i32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu		; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, mu
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vsetvli zero, zero, e16, mf2, ta, mu
; CHECK-NEXT: vncvt.x.x.w v8, v8		; CHECK-NEXT: vncvt.x.x.w v8, v8
; CHECK-NEXT: vsetvli zero, zero, e8, mf4, ta, mu		; CHECK-NEXT: vsetvli zero, zero, e8, mf4, ta, mu
; CHECK-NEXT: vncvt.x.x.w v8, v8		; CHECK-NEXT: vncvt.x.x.w v8, v8
; CHECK-NEXT: vse8.v v8, (a1)		; CHECK-NEXT: vse8.v v8, (a1)
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = load <4 x i32>, <4 x i32>* %x		%a = load <4 x i32>, <4 x i32>* %x
%b = trunc <4 x i32> %a to <4 x i8>		%b = trunc <4 x i32> %a to <4 x i8>
store <4 x i8> %b, <4 x i8>* %z		store <4 x i8> %b, <4 x i8>* %z
ret void		ret void
}		}

define void @trunc_v8i8_v8i32(<8 x i32>* %x, <8 x i8>* %z) {		define void @trunc_v8i8_v8i32(<8 x i32>* %x, <8 x i8>* %z) {
; LMULMAX8-LABEL: trunc_v8i8_v8i32:		; LMULMAX8-LABEL: trunc_v8i8_v8i32:
; LMULMAX8: # %bb.0:		; LMULMAX8: # %bb.0:
; LMULMAX8-NEXT: vsetivli zero, 8, e32, m2, ta, mu		; LMULMAX8-NEXT: vsetivli zero, 8, e16, m1, ta, mu
; LMULMAX8-NEXT: vle32.v v8, (a0)		; LMULMAX8-NEXT: vle32.v v8, (a0)
; LMULMAX8-NEXT: vsetvli zero, zero, e16, m1, ta, mu
; LMULMAX8-NEXT: vncvt.x.x.w v10, v8		; LMULMAX8-NEXT: vncvt.x.x.w v10, v8
; LMULMAX8-NEXT: vsetvli zero, zero, e8, mf2, ta, mu		; LMULMAX8-NEXT: vsetvli zero, zero, e8, mf2, ta, mu
; LMULMAX8-NEXT: vncvt.x.x.w v8, v10		; LMULMAX8-NEXT: vncvt.x.x.w v8, v10
; LMULMAX8-NEXT: vse8.v v8, (a1)		; LMULMAX8-NEXT: vse8.v v8, (a1)
; LMULMAX8-NEXT: ret		; LMULMAX8-NEXT: ret
;		;
; LMULMAX2-LABEL: trunc_v8i8_v8i32:		; LMULMAX2-LABEL: trunc_v8i8_v8i32:
; LMULMAX2: # %bb.0:		; LMULMAX2: # %bb.0:
; LMULMAX2-NEXT: vsetivli zero, 8, e32, m2, ta, mu		; LMULMAX2-NEXT: vsetivli zero, 8, e16, m1, ta, mu
; LMULMAX2-NEXT: vle32.v v8, (a0)		; LMULMAX2-NEXT: vle32.v v8, (a0)
; LMULMAX2-NEXT: vsetvli zero, zero, e16, m1, ta, mu
; LMULMAX2-NEXT: vncvt.x.x.w v10, v8		; LMULMAX2-NEXT: vncvt.x.x.w v10, v8
; LMULMAX2-NEXT: vsetvli zero, zero, e8, mf2, ta, mu		; LMULMAX2-NEXT: vsetvli zero, zero, e8, mf2, ta, mu
; LMULMAX2-NEXT: vncvt.x.x.w v8, v10		; LMULMAX2-NEXT: vncvt.x.x.w v8, v10
; LMULMAX2-NEXT: vse8.v v8, (a1)		; LMULMAX2-NEXT: vse8.v v8, (a1)
; LMULMAX2-NEXT: ret		; LMULMAX2-NEXT: ret
;		;
; LMULMAX1-LABEL: trunc_v8i8_v8i32:		; LMULMAX1-LABEL: trunc_v8i8_v8i32:
; LMULMAX1: # %bb.0:		; LMULMAX1: # %bb.0:
; LMULMAX1-NEXT: vsetivli zero, 4, e32, m1, ta, mu		; LMULMAX1-NEXT: vsetivli zero, 4, e16, mf2, ta, mu
; LMULMAX1-NEXT: vle32.v v8, (a0)		; LMULMAX1-NEXT: vle32.v v8, (a0)
; LMULMAX1-NEXT: addi a0, a0, 16		; LMULMAX1-NEXT: addi a0, a0, 16
; LMULMAX1-NEXT: vle32.v v9, (a0)		; LMULMAX1-NEXT: vle32.v v9, (a0)
; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf2, ta, mu
; LMULMAX1-NEXT: vncvt.x.x.w v8, v8		; LMULMAX1-NEXT: vncvt.x.x.w v8, v8
; LMULMAX1-NEXT: vsetvli zero, zero, e8, mf4, ta, mu		; LMULMAX1-NEXT: vsetvli zero, zero, e8, mf4, ta, mu
; LMULMAX1-NEXT: vncvt.x.x.w v8, v8		; LMULMAX1-NEXT: vncvt.x.x.w v8, v8
; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf2, ta, mu		; LMULMAX1-NEXT: vsetvli zero, zero, e16, mf2, ta, mu
; LMULMAX1-NEXT: vncvt.x.x.w v9, v9		; LMULMAX1-NEXT: vncvt.x.x.w v9, v9
; LMULMAX1-NEXT: vsetvli zero, zero, e8, mf4, ta, mu		; LMULMAX1-NEXT: vsetvli zero, zero, e8, mf4, ta, mu
; LMULMAX1-NEXT: vncvt.x.x.w v9, v9		; LMULMAX1-NEXT: vncvt.x.x.w v9, v9
; LMULMAX1-NEXT: vsetivli zero, 8, e8, mf2, tu, mu		; LMULMAX1-NEXT: vsetivli zero, 8, e8, mf2, tu, mu
; LMULMAX1-NEXT: vslideup.vi v8, v9, 4		; LMULMAX1-NEXT: vslideup.vi v8, v9, 4
; LMULMAX1-NEXT: vse8.v v8, (a1)		; LMULMAX1-NEXT: vse8.v v8, (a1)
; LMULMAX1-NEXT: ret		; LMULMAX1-NEXT: ret
%a = load <8 x i32>, <8 x i32>* %x		%a = load <8 x i32>, <8 x i32>* %x
%b = trunc <8 x i32> %a to <8 x i8>		%b = trunc <8 x i32> %a to <8 x i8>
store <8 x i8> %b, <8 x i8>* %z		store <8 x i8> %b, <8 x i8>* %z
ret void		ret void
}		}

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-int-shuffles.ll

Show First 20 Lines • Show All 135 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
ret <4 x i16> %s		ret <4 x i16> %s
}		}

define <8 x i64> @vrgather_permute_shuffle_vu_v8i64(<8 x i64> %x) {		define <8 x i64> @vrgather_permute_shuffle_vu_v8i64(<8 x i64> %x) {
; RV32-LABEL: vrgather_permute_shuffle_vu_v8i64:		; RV32-LABEL: vrgather_permute_shuffle_vu_v8i64:
; RV32: # %bb.0:		; RV32: # %bb.0:
; RV32-NEXT: lui a0, %hi(.LCPI9_0)		; RV32-NEXT: lui a0, %hi(.LCPI9_0)
; RV32-NEXT: addi a0, a0, %lo(.LCPI9_0)		; RV32-NEXT: addi a0, a0, %lo(.LCPI9_0)
; RV32-NEXT: vsetivli zero, 8, e16, m1, ta, mu		; RV32-NEXT: vsetivli zero, 8, e64, m4, ta, mu
; RV32-NEXT: vle16.v v16, (a0)		; RV32-NEXT: vle16.v v16, (a0)
; RV32-NEXT: vsetvli zero, zero, e64, m4, ta, mu
; RV32-NEXT: vrgatherei16.vv v12, v8, v16		; RV32-NEXT: vrgatherei16.vv v12, v8, v16
; RV32-NEXT: vmv.v.v v8, v12		; RV32-NEXT: vmv.v.v v8, v12
; RV32-NEXT: ret		; RV32-NEXT: ret
;		;
; RV64-LABEL: vrgather_permute_shuffle_vu_v8i64:		; RV64-LABEL: vrgather_permute_shuffle_vu_v8i64:
; RV64: # %bb.0:		; RV64: # %bb.0:
; RV64-NEXT: lui a0, %hi(.LCPI9_0)		; RV64-NEXT: lui a0, %hi(.LCPI9_0)
; RV64-NEXT: addi a0, a0, %lo(.LCPI9_0)		; RV64-NEXT: addi a0, a0, %lo(.LCPI9_0)
; RV64-NEXT: vsetivli zero, 8, e64, m4, ta, mu		; RV64-NEXT: vsetivli zero, 8, e64, m4, ta, mu
; RV64-NEXT: vle64.v v16, (a0)		; RV64-NEXT: vle64.v v16, (a0)
; RV64-NEXT: vrgather.vv v12, v8, v16		; RV64-NEXT: vrgather.vv v12, v8, v16
; RV64-NEXT: vmv.v.v v8, v12		; RV64-NEXT: vmv.v.v v8, v12
; RV64-NEXT: ret		; RV64-NEXT: ret
%s = shufflevector <8 x i64> %x, <8 x i64> poison, <8 x i32> <i32 1, i32 2, i32 0, i32 1, i32 7, i32 6, i32 0, i32 1>		%s = shufflevector <8 x i64> %x, <8 x i64> poison, <8 x i32> <i32 1, i32 2, i32 0, i32 1, i32 7, i32 6, i32 0, i32 1>
ret <8 x i64> %s		ret <8 x i64> %s
}		}

define <8 x i64> @vrgather_permute_shuffle_uv_v8i64(<8 x i64> %x) {		define <8 x i64> @vrgather_permute_shuffle_uv_v8i64(<8 x i64> %x) {
; RV32-LABEL: vrgather_permute_shuffle_uv_v8i64:		; RV32-LABEL: vrgather_permute_shuffle_uv_v8i64:
; RV32: # %bb.0:		; RV32: # %bb.0:
; RV32-NEXT: lui a0, %hi(.LCPI10_0)		; RV32-NEXT: lui a0, %hi(.LCPI10_0)
; RV32-NEXT: addi a0, a0, %lo(.LCPI10_0)		; RV32-NEXT: addi a0, a0, %lo(.LCPI10_0)
; RV32-NEXT: vsetivli zero, 8, e16, m1, ta, mu		; RV32-NEXT: vsetivli zero, 8, e64, m4, ta, mu
; RV32-NEXT: vle16.v v16, (a0)		; RV32-NEXT: vle16.v v16, (a0)
; RV32-NEXT: vsetvli zero, zero, e64, m4, ta, mu
; RV32-NEXT: vrgatherei16.vv v12, v8, v16		; RV32-NEXT: vrgatherei16.vv v12, v8, v16
; RV32-NEXT: vmv.v.v v8, v12		; RV32-NEXT: vmv.v.v v8, v12
; RV32-NEXT: ret		; RV32-NEXT: ret
;		;
; RV64-LABEL: vrgather_permute_shuffle_uv_v8i64:		; RV64-LABEL: vrgather_permute_shuffle_uv_v8i64:
; RV64: # %bb.0:		; RV64: # %bb.0:
; RV64-NEXT: lui a0, %hi(.LCPI10_0)		; RV64-NEXT: lui a0, %hi(.LCPI10_0)
; RV64-NEXT: addi a0, a0, %lo(.LCPI10_0)		; RV64-NEXT: addi a0, a0, %lo(.LCPI10_0)
Show All 12 Lines
; RV32-NEXT: li a0, 5		; RV32-NEXT: li a0, 5
; RV32-NEXT: vsetivli zero, 8, e16, m1, ta, mu		; RV32-NEXT: vsetivli zero, 8, e16, m1, ta, mu
; RV32-NEXT: vmv.s.x v16, a0		; RV32-NEXT: vmv.s.x v16, a0
; RV32-NEXT: vmv.v.i v20, 2		; RV32-NEXT: vmv.v.i v20, 2
; RV32-NEXT: vsetvli zero, zero, e16, m1, tu, mu		; RV32-NEXT: vsetvli zero, zero, e16, m1, tu, mu
; RV32-NEXT: vslideup.vi v20, v16, 7		; RV32-NEXT: vslideup.vi v20, v16, 7
; RV32-NEXT: lui a0, %hi(.LCPI11_0)		; RV32-NEXT: lui a0, %hi(.LCPI11_0)
; RV32-NEXT: addi a0, a0, %lo(.LCPI11_0)		; RV32-NEXT: addi a0, a0, %lo(.LCPI11_0)
; RV32-NEXT: vsetvli zero, zero, e16, m1, ta, mu
; RV32-NEXT: vle16.v v21, (a0)
; RV32-NEXT: vsetvli zero, zero, e64, m4, ta, mu		; RV32-NEXT: vsetvli zero, zero, e64, m4, ta, mu
		; RV32-NEXT: vle16.v v21, (a0)
; RV32-NEXT: vrgatherei16.vv v16, v8, v21		; RV32-NEXT: vrgatherei16.vv v16, v8, v21
; RV32-NEXT: li a0, 164		; RV32-NEXT: li a0, 164
; RV32-NEXT: vsetivli zero, 1, e8, mf8, ta, mu		; RV32-NEXT: vsetivli zero, 1, e8, mf8, ta, mu
; RV32-NEXT: vmv.s.x v0, a0		; RV32-NEXT: vmv.s.x v0, a0
; RV32-NEXT: vsetivli zero, 8, e64, m4, ta, mu		; RV32-NEXT: vsetivli zero, 8, e64, m4, ta, mu
; RV32-NEXT: vrgatherei16.vv v16, v12, v20, v0.t		; RV32-NEXT: vrgatherei16.vv v16, v12, v20, v0.t
; RV32-NEXT: vmv.v.v v8, v16		; RV32-NEXT: vmv.v.v v8, v16
; RV32-NEXT: ret		; RV32-NEXT: ret
Show All 22 Lines	; RV64-NEXT: ret
ret <8 x i64> %s		ret <8 x i64> %s
}		}

define <8 x i64> @vrgather_shuffle_xv_v8i64(<8 x i64> %x) {		define <8 x i64> @vrgather_shuffle_xv_v8i64(<8 x i64> %x) {
; RV32-LABEL: vrgather_shuffle_xv_v8i64:		; RV32-LABEL: vrgather_shuffle_xv_v8i64:
; RV32: # %bb.0:		; RV32: # %bb.0:
; RV32-NEXT: lui a0, %hi(.LCPI12_0)		; RV32-NEXT: lui a0, %hi(.LCPI12_0)
; RV32-NEXT: addi a0, a0, %lo(.LCPI12_0)		; RV32-NEXT: addi a0, a0, %lo(.LCPI12_0)
; RV32-NEXT: vsetivli zero, 8, e16, m1, ta, mu		; RV32-NEXT: vsetivli zero, 8, e64, m4, ta, mu
; RV32-NEXT: vle16.v v16, (a0)		; RV32-NEXT: vle16.v v16, (a0)
; RV32-NEXT: vsetvli zero, zero, e64, m4, ta, mu
; RV32-NEXT: vmv.v.i v20, -1		; RV32-NEXT: vmv.v.i v20, -1
; RV32-NEXT: vrgatherei16.vv v12, v20, v16		; RV32-NEXT: vrgatherei16.vv v12, v20, v16
; RV32-NEXT: li a0, 113		; RV32-NEXT: li a0, 113
; RV32-NEXT: vsetivli zero, 1, e8, mf8, ta, mu		; RV32-NEXT: vsetivli zero, 1, e8, mf8, ta, mu
; RV32-NEXT: vmv.s.x v0, a0		; RV32-NEXT: vmv.s.x v0, a0
; RV32-NEXT: lui a0, %hi(.LCPI12_1)		; RV32-NEXT: lui a0, %hi(.LCPI12_1)
; RV32-NEXT: addi a0, a0, %lo(.LCPI12_1)		; RV32-NEXT: addi a0, a0, %lo(.LCPI12_1)
; RV32-NEXT: vsetivli zero, 8, e16, m1, ta, mu		; RV32-NEXT: vsetivli zero, 8, e64, m4, ta, mu
; RV32-NEXT: vle16.v v16, (a0)		; RV32-NEXT: vle16.v v16, (a0)
; RV32-NEXT: vsetvli zero, zero, e64, m4, ta, mu
; RV32-NEXT: vrgatherei16.vv v12, v8, v16, v0.t		; RV32-NEXT: vrgatherei16.vv v12, v8, v16, v0.t
; RV32-NEXT: vmv.v.v v8, v12		; RV32-NEXT: vmv.v.v v8, v12
; RV32-NEXT: ret		; RV32-NEXT: ret
;		;
; RV64-LABEL: vrgather_shuffle_xv_v8i64:		; RV64-LABEL: vrgather_shuffle_xv_v8i64:
; RV64: # %bb.0:		; RV64: # %bb.0:
; RV64-NEXT: li a0, 113		; RV64-NEXT: li a0, 113
; RV64-NEXT: vsetivli zero, 1, e8, mf8, ta, mu		; RV64-NEXT: vsetivli zero, 1, e8, mf8, ta, mu
Show All 10 Lines	; RV64-NEXT: ret
ret <8 x i64> %s		ret <8 x i64> %s
}		}

define <8 x i64> @vrgather_shuffle_vx_v8i64(<8 x i64> %x) {		define <8 x i64> @vrgather_shuffle_vx_v8i64(<8 x i64> %x) {
; RV32-LABEL: vrgather_shuffle_vx_v8i64:		; RV32-LABEL: vrgather_shuffle_vx_v8i64:
; RV32: # %bb.0:		; RV32: # %bb.0:
; RV32-NEXT: lui a0, %hi(.LCPI13_0)		; RV32-NEXT: lui a0, %hi(.LCPI13_0)
; RV32-NEXT: addi a0, a0, %lo(.LCPI13_0)		; RV32-NEXT: addi a0, a0, %lo(.LCPI13_0)
; RV32-NEXT: vsetivli zero, 8, e16, m1, ta, mu		; RV32-NEXT: vsetivli zero, 8, e64, m4, ta, mu
; RV32-NEXT: vle16.v v16, (a0)		; RV32-NEXT: vle16.v v16, (a0)
; RV32-NEXT: vmv4r.v v12, v8		; RV32-NEXT: vrgatherei16.vv v12, v8, v16
; RV32-NEXT: vsetvli zero, zero, e64, m4, ta, mu
; RV32-NEXT: vrgatherei16.vv v8, v12, v16
; RV32-NEXT: li a0, 140		; RV32-NEXT: li a0, 140
; RV32-NEXT: vsetivli zero, 1, e8, mf8, ta, mu		; RV32-NEXT: vsetivli zero, 1, e8, mf8, ta, mu
; RV32-NEXT: vmv.s.x v0, a0		; RV32-NEXT: vmv.s.x v0, a0
; RV32-NEXT: lui a0, %hi(.LCPI13_1)		; RV32-NEXT: lui a0, %hi(.LCPI13_1)
; RV32-NEXT: addi a0, a0, %lo(.LCPI13_1)		; RV32-NEXT: addi a0, a0, %lo(.LCPI13_1)
; RV32-NEXT: vsetivli zero, 8, e16, m1, ta, mu		; RV32-NEXT: vsetivli zero, 8, e64, m4, ta, mu
; RV32-NEXT: vle16.v v12, (a0)		; RV32-NEXT: vle16.v v8, (a0)
; RV32-NEXT: vsetvli zero, zero, e64, m4, ta, mu
; RV32-NEXT: vmv.v.i v16, 5		; RV32-NEXT: vmv.v.i v16, 5
; RV32-NEXT: vrgatherei16.vv v8, v16, v12, v0.t		; RV32-NEXT: vrgatherei16.vv v12, v16, v8, v0.t
		; RV32-NEXT: vmv.v.v v8, v12
; RV32-NEXT: ret		; RV32-NEXT: ret
;		;
; RV64-LABEL: vrgather_shuffle_vx_v8i64:		; RV64-LABEL: vrgather_shuffle_vx_v8i64:
; RV64: # %bb.0:		; RV64: # %bb.0:
; RV64-NEXT: li a0, 115		; RV64-NEXT: li a0, 115
; RV64-NEXT: vsetivli zero, 1, e8, mf8, ta, mu		; RV64-NEXT: vsetivli zero, 1, e8, mf8, ta, mu
; RV64-NEXT: vmv.s.x v0, a0		; RV64-NEXT: vmv.s.x v0, a0
; RV64-NEXT: lui a0, %hi(.LCPI13_0)		; RV64-NEXT: lui a0, %hi(.LCPI13_0)
▲ Show 20 Lines • Show All 326 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-int-splat.ll

	Show First 20 Lines • Show All 726 Lines • ▼ Show 20 Lines
	; LMULMAX2-RV32-NEXT: vse64.v v12, (a3)			; LMULMAX2-RV32-NEXT: vse64.v v12, (a3)
	; LMULMAX2-RV32-NEXT: addi a0, a3, 32			; LMULMAX2-RV32-NEXT: addi a0, a3, 32
	; LMULMAX2-RV32-NEXT: vse64.v v14, (a0)			; LMULMAX2-RV32-NEXT: vse64.v v14, (a0)
	; LMULMAX2-RV32-NEXT: ret			; LMULMAX2-RV32-NEXT: ret
	;			;
	; LMULMAX1-RV32-LABEL: vadd_vx_v16i64:			; LMULMAX1-RV32-LABEL: vadd_vx_v16i64:
	; LMULMAX1-RV32: # %bb.0:			; LMULMAX1-RV32: # %bb.0:
	; LMULMAX1-RV32-NEXT: addi a4, a0, 96			; LMULMAX1-RV32-NEXT: addi a4, a0, 96
	; LMULMAX1-RV32-NEXT: vsetivli zero, 2, e64, m1, ta, mu			; LMULMAX1-RV32-NEXT: vsetivli zero, 2, e8, mf8, ta, mu
	; LMULMAX1-RV32-NEXT: vle64.v v8, (a4)			; LMULMAX1-RV32-NEXT: vle64.v v8, (a4)
	; LMULMAX1-RV32-NEXT: addi a4, a0, 112			; LMULMAX1-RV32-NEXT: addi a4, a0, 112
	; LMULMAX1-RV32-NEXT: vle64.v v9, (a4)			; LMULMAX1-RV32-NEXT: vle64.v v9, (a4)
	; LMULMAX1-RV32-NEXT: addi a4, a0, 64			; LMULMAX1-RV32-NEXT: addi a4, a0, 64
	; LMULMAX1-RV32-NEXT: vle64.v v10, (a4)			; LMULMAX1-RV32-NEXT: vle64.v v10, (a4)
	; LMULMAX1-RV32-NEXT: addi a4, a0, 80			; LMULMAX1-RV32-NEXT: addi a4, a0, 80
	; LMULMAX1-RV32-NEXT: vle64.v v11, (a4)			; LMULMAX1-RV32-NEXT: vle64.v v11, (a4)
	; LMULMAX1-RV32-NEXT: addi a4, a0, 32			; LMULMAX1-RV32-NEXT: addi a4, a0, 32
	; LMULMAX1-RV32-NEXT: vle64.v v12, (a4)			; LMULMAX1-RV32-NEXT: vle64.v v12, (a4)
	; LMULMAX1-RV32-NEXT: addi a4, a0, 48			; LMULMAX1-RV32-NEXT: addi a4, a0, 48
	; LMULMAX1-RV32-NEXT: vle64.v v13, (a4)			; LMULMAX1-RV32-NEXT: vle64.v v13, (a4)
	; LMULMAX1-RV32-NEXT: vle64.v v14, (a0)			; LMULMAX1-RV32-NEXT: vle64.v v14, (a0)
	; LMULMAX1-RV32-NEXT: addi a0, a0, 16			; LMULMAX1-RV32-NEXT: addi a0, a0, 16
	; LMULMAX1-RV32-NEXT: vle64.v v15, (a0)			; LMULMAX1-RV32-NEXT: vle64.v v15, (a0)
	; LMULMAX1-RV32-NEXT: li a0, 5			; LMULMAX1-RV32-NEXT: li a0, 5
	; LMULMAX1-RV32-NEXT: vsetvli zero, zero, e8, mf8, ta, mu
	; LMULMAX1-RV32-NEXT: vmv.s.x v0, a0			; LMULMAX1-RV32-NEXT: vmv.s.x v0, a0
	; LMULMAX1-RV32-NEXT: vsetivli zero, 4, e32, m1, ta, mu			; LMULMAX1-RV32-NEXT: vsetivli zero, 4, e32, m1, ta, mu
	; LMULMAX1-RV32-NEXT: vmv.v.x v16, a2			; LMULMAX1-RV32-NEXT: vmv.v.x v16, a2
	; LMULMAX1-RV32-NEXT: vmerge.vxm v16, v16, a1, v0			; LMULMAX1-RV32-NEXT: vmerge.vxm v16, v16, a1, v0
	; LMULMAX1-RV32-NEXT: vsetivli zero, 2, e64, m1, ta, mu			; LMULMAX1-RV32-NEXT: vsetivli zero, 2, e64, m1, ta, mu
	; LMULMAX1-RV32-NEXT: vadd.vv v15, v15, v16			; LMULMAX1-RV32-NEXT: vadd.vv v15, v15, v16
	; LMULMAX1-RV32-NEXT: vadd.vv v14, v14, v16			; LMULMAX1-RV32-NEXT: vadd.vv v14, v14, v16
	; LMULMAX1-RV32-NEXT: vadd.vv v13, v13, v16			; LMULMAX1-RV32-NEXT: vadd.vv v13, v13, v16
	▲ Show 20 Lines • Show All 102 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-reduction-fp.ll

Show First 20 Lines • Show All 425 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%v = load <4 x float>, <4 x float>* %x		%v = load <4 x float>, <4 x float>* %x
%red = call float @llvm.vector.reduce.fadd.v4f32(float %s, <4 x float> %v)		%red = call float @llvm.vector.reduce.fadd.v4f32(float %s, <4 x float> %v)
ret float %red		ret float %red
}		}

define float @vreduce_fwadd_v4f32(<4 x half>* %x, float %s) {		define float @vreduce_fwadd_v4f32(<4 x half>* %x, float %s) {
; CHECK-LABEL: vreduce_fwadd_v4f32:		; CHECK-LABEL: vreduce_fwadd_v4f32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, mu		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; CHECK-NEXT: vsetvli zero, zero, e32, m1, ta, mu
; CHECK-NEXT: vfmv.s.f v9, fa0		; CHECK-NEXT: vfmv.s.f v9, fa0
; CHECK-NEXT: vsetvli zero, zero, e16, mf2, ta, mu		; CHECK-NEXT: vsetvli zero, zero, e16, mf2, ta, mu
; CHECK-NEXT: vfwredusum.vs v8, v8, v9		; CHECK-NEXT: vfwredusum.vs v8, v8, v9
; CHECK-NEXT: vsetvli zero, zero, e32, m1, ta, mu		; CHECK-NEXT: vsetvli zero, zero, e32, m1, ta, mu
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <4 x half>, <4 x half>* %x		%v = load <4 x half>, <4 x half>* %x
%e = fpext <4 x half> %v to <4 x float>		%e = fpext <4 x half> %v to <4 x float>
%red = call reassoc float @llvm.vector.reduce.fadd.v4f32(float %s, <4 x float> %e)		%red = call reassoc float @llvm.vector.reduce.fadd.v4f32(float %s, <4 x float> %e)
ret float %red		ret float %red
}		}

define float @vreduce_ord_fwadd_v4f32(<4 x half>* %x, float %s) {		define float @vreduce_ord_fwadd_v4f32(<4 x half>* %x, float %s) {
; CHECK-LABEL: vreduce_ord_fwadd_v4f32:		; CHECK-LABEL: vreduce_ord_fwadd_v4f32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, mu		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; CHECK-NEXT: vsetvli zero, zero, e32, m1, ta, mu
; CHECK-NEXT: vfmv.s.f v9, fa0		; CHECK-NEXT: vfmv.s.f v9, fa0
; CHECK-NEXT: vsetvli zero, zero, e16, mf2, ta, mu		; CHECK-NEXT: vsetvli zero, zero, e16, mf2, ta, mu
; CHECK-NEXT: vfwredosum.vs v8, v8, v9		; CHECK-NEXT: vfwredosum.vs v8, v8, v9
; CHECK-NEXT: vsetvli zero, zero, e32, m1, ta, mu		; CHECK-NEXT: vsetvli zero, zero, e32, m1, ta, mu
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <4 x half>, <4 x half>* %x		%v = load <4 x half>, <4 x half>* %x
%e = fpext <4 x half> %v to <4 x float>		%e = fpext <4 x half> %v to <4 x float>
▲ Show 20 Lines • Show All 347 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%e = fpext <1 x float> %v to <1 x double>		%e = fpext <1 x float> %v to <1 x double>
%red = call reassoc double @llvm.vector.reduce.fadd.v1f64(double %s, <1 x double> %e)		%red = call reassoc double @llvm.vector.reduce.fadd.v1f64(double %s, <1 x double> %e)
ret double %red		ret double %red
}		}

define double @vreduce_ord_fwadd_v1f64(<1 x float>* %x, double %s) {		define double @vreduce_ord_fwadd_v1f64(<1 x float>* %x, double %s) {
; CHECK-LABEL: vreduce_ord_fwadd_v1f64:		; CHECK-LABEL: vreduce_ord_fwadd_v1f64:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 1, e32, mf2, ta, mu		; CHECK-NEXT: vsetivli zero, 1, e64, m1, ta, mu
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vsetvli zero, zero, e64, m1, ta, mu
; CHECK-NEXT: vfmv.s.f v9, fa0		; CHECK-NEXT: vfmv.s.f v9, fa0
; CHECK-NEXT: vsetvli zero, zero, e32, mf2, ta, mu		; CHECK-NEXT: vsetvli zero, zero, e32, mf2, ta, mu
; CHECK-NEXT: vfwredosum.vs v8, v8, v9		; CHECK-NEXT: vfwredosum.vs v8, v8, v9
; CHECK-NEXT: vsetvli zero, zero, e64, m1, ta, mu		; CHECK-NEXT: vsetvli zero, zero, e64, m1, ta, mu
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <1 x float>, <1 x float>* %x		%v = load <1 x float>, <1 x float>* %x
%e = fpext <1 x float> %v to <1 x double>		%e = fpext <1 x float> %v to <1 x double>
Show All 29 Lines	; CHECK-NEXT: ret
%v = load <2 x double>, <2 x double>* %x		%v = load <2 x double>, <2 x double>* %x
%red = call double @llvm.vector.reduce.fadd.v2f64(double %s, <2 x double> %v)		%red = call double @llvm.vector.reduce.fadd.v2f64(double %s, <2 x double> %v)
ret double %red		ret double %red
}		}

define double @vreduce_fwadd_v2f64(<2 x float>* %x, double %s) {		define double @vreduce_fwadd_v2f64(<2 x float>* %x, double %s) {
; CHECK-LABEL: vreduce_fwadd_v2f64:		; CHECK-LABEL: vreduce_fwadd_v2f64:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 2, e32, mf2, ta, mu		; CHECK-NEXT: vsetivli zero, 2, e64, m1, ta, mu
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vsetvli zero, zero, e64, m1, ta, mu
; CHECK-NEXT: vfmv.s.f v9, fa0		; CHECK-NEXT: vfmv.s.f v9, fa0
; CHECK-NEXT: vsetvli zero, zero, e32, mf2, ta, mu		; CHECK-NEXT: vsetvli zero, zero, e32, mf2, ta, mu
; CHECK-NEXT: vfwredusum.vs v8, v8, v9		; CHECK-NEXT: vfwredusum.vs v8, v8, v9
; CHECK-NEXT: vsetvli zero, zero, e64, m1, ta, mu		; CHECK-NEXT: vsetvli zero, zero, e64, m1, ta, mu
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <2 x float>, <2 x float>* %x		%v = load <2 x float>, <2 x float>* %x
%e = fpext <2 x float> %v to <2 x double>		%e = fpext <2 x float> %v to <2 x double>
%red = call reassoc double @llvm.vector.reduce.fadd.v2f64(double %s, <2 x double> %e)		%red = call reassoc double @llvm.vector.reduce.fadd.v2f64(double %s, <2 x double> %e)
ret double %red		ret double %red
}		}

define double @vreduce_ord_fwadd_v2f64(<2 x float>* %x, double %s) {		define double @vreduce_ord_fwadd_v2f64(<2 x float>* %x, double %s) {
; CHECK-LABEL: vreduce_ord_fwadd_v2f64:		; CHECK-LABEL: vreduce_ord_fwadd_v2f64:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 2, e32, mf2, ta, mu		; CHECK-NEXT: vsetivli zero, 2, e64, m1, ta, mu
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vsetvli zero, zero, e64, m1, ta, mu
; CHECK-NEXT: vfmv.s.f v9, fa0		; CHECK-NEXT: vfmv.s.f v9, fa0
; CHECK-NEXT: vsetvli zero, zero, e32, mf2, ta, mu		; CHECK-NEXT: vsetvli zero, zero, e32, mf2, ta, mu
; CHECK-NEXT: vfwredosum.vs v8, v8, v9		; CHECK-NEXT: vfwredosum.vs v8, v8, v9
; CHECK-NEXT: vsetvli zero, zero, e64, m1, ta, mu		; CHECK-NEXT: vsetvli zero, zero, e64, m1, ta, mu
; CHECK-NEXT: vfmv.f.s fa0, v8		; CHECK-NEXT: vfmv.f.s fa0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <2 x float>, <2 x float>* %x		%v = load <2 x float>, <2 x float>* %x
%e = fpext <2 x float> %v to <2 x double>		%e = fpext <2 x float> %v to <2 x double>
▲ Show 20 Lines • Show All 949 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-reduction-int.ll

Show First 20 Lines • Show All 170 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%v = load <1 x i16>, <1 x i16>* %x		%v = load <1 x i16>, <1 x i16>* %x
%red = call i16 @llvm.vector.reduce.add.v1i16(<1 x i16> %v)		%red = call i16 @llvm.vector.reduce.add.v1i16(<1 x i16> %v)
ret i16 %red		ret i16 %red
}		}

define i16 @vwreduce_add_v1i16(<1 x i8>* %x) {		define i16 @vwreduce_add_v1i16(<1 x i8>* %x) {
; CHECK-LABEL: vwreduce_add_v1i16:		; CHECK-LABEL: vwreduce_add_v1i16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 1, e8, mf8, ta, mu		; CHECK-NEXT: vsetivli zero, 1, e16, mf4, ta, mu
; CHECK-NEXT: vle8.v v8, (a0)		; CHECK-NEXT: vle8.v v8, (a0)
; CHECK-NEXT: vsetvli zero, zero, e16, mf4, ta, mu
; CHECK-NEXT: vsext.vf2 v9, v8		; CHECK-NEXT: vsext.vf2 v9, v8
; CHECK-NEXT: vmv.x.s a0, v9		; CHECK-NEXT: vmv.x.s a0, v9
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <1 x i8>, <1 x i8>* %x		%v = load <1 x i8>, <1 x i8>* %x
%e = sext <1 x i8> %v to <1 x i16>		%e = sext <1 x i8> %v to <1 x i16>
%red = call i16 @llvm.vector.reduce.add.v1i16(<1 x i16> %e)		%red = call i16 @llvm.vector.reduce.add.v1i16(<1 x i16> %e)
ret i16 %red		ret i16 %red
}		}

define i16 @vwreduce_uadd_v1i16(<1 x i8>* %x) {		define i16 @vwreduce_uadd_v1i16(<1 x i8>* %x) {
; CHECK-LABEL: vwreduce_uadd_v1i16:		; CHECK-LABEL: vwreduce_uadd_v1i16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 1, e8, mf8, ta, mu		; CHECK-NEXT: vsetivli zero, 1, e16, mf4, ta, mu
; CHECK-NEXT: vle8.v v8, (a0)		; CHECK-NEXT: vle8.v v8, (a0)
; CHECK-NEXT: vsetvli zero, zero, e16, mf4, ta, mu
; CHECK-NEXT: vzext.vf2 v9, v8		; CHECK-NEXT: vzext.vf2 v9, v8
; CHECK-NEXT: vmv.x.s a0, v9		; CHECK-NEXT: vmv.x.s a0, v9
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <1 x i8>, <1 x i8>* %x		%v = load <1 x i8>, <1 x i8>* %x
%e = zext <1 x i8> %v to <1 x i16>		%e = zext <1 x i8> %v to <1 x i16>
%red = call i16 @llvm.vector.reduce.add.v1i16(<1 x i16> %e)		%red = call i16 @llvm.vector.reduce.add.v1i16(<1 x i16> %e)
ret i16 %red		ret i16 %red
}		}
▲ Show 20 Lines • Show All 116 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%v = load <8 x i16>, <8 x i16>* %x		%v = load <8 x i16>, <8 x i16>* %x
%red = call i16 @llvm.vector.reduce.add.v8i16(<8 x i16> %v)		%red = call i16 @llvm.vector.reduce.add.v8i16(<8 x i16> %v)
ret i16 %red		ret i16 %red
}		}

define i16 @vwreduce_add_v8i16(<8 x i8>* %x) {		define i16 @vwreduce_add_v8i16(<8 x i8>* %x) {
; CHECK-LABEL: vwreduce_add_v8i16:		; CHECK-LABEL: vwreduce_add_v8i16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu		; CHECK-NEXT: vsetivli zero, 8, e16, m1, ta, mu
; CHECK-NEXT: vle8.v v8, (a0)		; CHECK-NEXT: vle8.v v8, (a0)
; CHECK-NEXT: vsetvli zero, zero, e16, m1, ta, mu
; CHECK-NEXT: vmv.s.x v9, zero		; CHECK-NEXT: vmv.s.x v9, zero
; CHECK-NEXT: vsetvli zero, zero, e8, mf2, ta, mu		; CHECK-NEXT: vsetvli zero, zero, e8, mf2, ta, mu
; CHECK-NEXT: vwredsum.vs v8, v8, v9		; CHECK-NEXT: vwredsum.vs v8, v8, v9
; CHECK-NEXT: vsetvli zero, zero, e16, m1, ta, mu		; CHECK-NEXT: vsetvli zero, zero, e16, m1, ta, mu
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <8 x i8>, <8 x i8>* %x		%v = load <8 x i8>, <8 x i8>* %x
%e = sext <8 x i8> %v to <8 x i16>		%e = sext <8 x i8> %v to <8 x i16>
%red = call i16 @llvm.vector.reduce.add.v8i16(<8 x i16> %e)		%red = call i16 @llvm.vector.reduce.add.v8i16(<8 x i16> %e)
ret i16 %red		ret i16 %red
}		}

define i16 @vwreduce_uadd_v8i16(<8 x i8>* %x) {		define i16 @vwreduce_uadd_v8i16(<8 x i8>* %x) {
; CHECK-LABEL: vwreduce_uadd_v8i16:		; CHECK-LABEL: vwreduce_uadd_v8i16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu		; CHECK-NEXT: vsetivli zero, 8, e16, m1, ta, mu
; CHECK-NEXT: vle8.v v8, (a0)		; CHECK-NEXT: vle8.v v8, (a0)
; CHECK-NEXT: vsetvli zero, zero, e16, m1, ta, mu
; CHECK-NEXT: vmv.s.x v9, zero		; CHECK-NEXT: vmv.s.x v9, zero
; CHECK-NEXT: vsetvli zero, zero, e8, mf2, ta, mu		; CHECK-NEXT: vsetvli zero, zero, e8, mf2, ta, mu
; CHECK-NEXT: vwredsumu.vs v8, v8, v9		; CHECK-NEXT: vwredsumu.vs v8, v8, v9
; CHECK-NEXT: vsetvli zero, zero, e16, m1, ta, mu		; CHECK-NEXT: vsetvli zero, zero, e16, m1, ta, mu
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <8 x i8>, <8 x i8>* %x		%v = load <8 x i8>, <8 x i8>* %x
%e = zext <8 x i8> %v to <8 x i16>		%e = zext <8 x i8> %v to <8 x i16>
▲ Show 20 Lines • Show All 247 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%v = load <1 x i32>, <1 x i32>* %x		%v = load <1 x i32>, <1 x i32>* %x
%red = call i32 @llvm.vector.reduce.add.v1i32(<1 x i32> %v)		%red = call i32 @llvm.vector.reduce.add.v1i32(<1 x i32> %v)
ret i32 %red		ret i32 %red
}		}

define i32 @vwreduce_add_v1i32(<1 x i16>* %x) {		define i32 @vwreduce_add_v1i32(<1 x i16>* %x) {
; CHECK-LABEL: vwreduce_add_v1i32:		; CHECK-LABEL: vwreduce_add_v1i32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 1, e16, mf4, ta, mu		; CHECK-NEXT: vsetivli zero, 1, e32, mf2, ta, mu
; CHECK-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; CHECK-NEXT: vsetvli zero, zero, e32, mf2, ta, mu
; CHECK-NEXT: vsext.vf2 v9, v8		; CHECK-NEXT: vsext.vf2 v9, v8
; CHECK-NEXT: vmv.x.s a0, v9		; CHECK-NEXT: vmv.x.s a0, v9
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <1 x i16>, <1 x i16>* %x		%v = load <1 x i16>, <1 x i16>* %x
%e = sext <1 x i16> %v to <1 x i32>		%e = sext <1 x i16> %v to <1 x i32>
%red = call i32 @llvm.vector.reduce.add.v1i32(<1 x i32> %e)		%red = call i32 @llvm.vector.reduce.add.v1i32(<1 x i32> %e)
ret i32 %red		ret i32 %red
}		}

define i32 @vwreduce_uadd_v1i32(<1 x i16>* %x) {		define i32 @vwreduce_uadd_v1i32(<1 x i16>* %x) {
; CHECK-LABEL: vwreduce_uadd_v1i32:		; CHECK-LABEL: vwreduce_uadd_v1i32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 1, e16, mf4, ta, mu		; CHECK-NEXT: vsetivli zero, 1, e32, mf2, ta, mu
; CHECK-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; CHECK-NEXT: vsetvli zero, zero, e32, mf2, ta, mu
; CHECK-NEXT: vzext.vf2 v9, v8		; CHECK-NEXT: vzext.vf2 v9, v8
; CHECK-NEXT: vmv.x.s a0, v9		; CHECK-NEXT: vmv.x.s a0, v9
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <1 x i16>, <1 x i16>* %x		%v = load <1 x i16>, <1 x i16>* %x
%e = zext <1 x i16> %v to <1 x i32>		%e = zext <1 x i16> %v to <1 x i32>
%red = call i32 @llvm.vector.reduce.add.v1i32(<1 x i32> %e)		%red = call i32 @llvm.vector.reduce.add.v1i32(<1 x i32> %e)
ret i32 %red		ret i32 %red
}		}
▲ Show 20 Lines • Show All 64 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%v = load <4 x i32>, <4 x i32>* %x		%v = load <4 x i32>, <4 x i32>* %x
%red = call i32 @llvm.vector.reduce.add.v4i32(<4 x i32> %v)		%red = call i32 @llvm.vector.reduce.add.v4i32(<4 x i32> %v)
ret i32 %red		ret i32 %red
}		}

define i32 @vwreduce_add_v4i32(<4 x i16>* %x) {		define i32 @vwreduce_add_v4i32(<4 x i16>* %x) {
; CHECK-LABEL: vwreduce_add_v4i32:		; CHECK-LABEL: vwreduce_add_v4i32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, mu		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; CHECK-NEXT: vsetvli zero, zero, e32, m1, ta, mu
; CHECK-NEXT: vmv.s.x v9, zero		; CHECK-NEXT: vmv.s.x v9, zero
; CHECK-NEXT: vsetvli zero, zero, e16, mf2, ta, mu		; CHECK-NEXT: vsetvli zero, zero, e16, mf2, ta, mu
; CHECK-NEXT: vwredsum.vs v8, v8, v9		; CHECK-NEXT: vwredsum.vs v8, v8, v9
; CHECK-NEXT: vsetvli zero, zero, e32, m1, ta, mu		; CHECK-NEXT: vsetvli zero, zero, e32, m1, ta, mu
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <4 x i16>, <4 x i16>* %x		%v = load <4 x i16>, <4 x i16>* %x
%e = sext <4 x i16> %v to <4 x i32>		%e = sext <4 x i16> %v to <4 x i32>
%red = call i32 @llvm.vector.reduce.add.v4i32(<4 x i32> %e)		%red = call i32 @llvm.vector.reduce.add.v4i32(<4 x i32> %e)
ret i32 %red		ret i32 %red
}		}

define i32 @vwreduce_uadd_v4i32(<4 x i16>* %x) {		define i32 @vwreduce_uadd_v4i32(<4 x i16>* %x) {
; CHECK-LABEL: vwreduce_uadd_v4i32:		; CHECK-LABEL: vwreduce_uadd_v4i32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, mu		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; CHECK-NEXT: vsetvli zero, zero, e32, m1, ta, mu
; CHECK-NEXT: vmv.s.x v9, zero		; CHECK-NEXT: vmv.s.x v9, zero
; CHECK-NEXT: vsetvli zero, zero, e16, mf2, ta, mu		; CHECK-NEXT: vsetvli zero, zero, e16, mf2, ta, mu
; CHECK-NEXT: vwredsumu.vs v8, v8, v9		; CHECK-NEXT: vwredsumu.vs v8, v8, v9
; CHECK-NEXT: vsetvli zero, zero, e32, m1, ta, mu		; CHECK-NEXT: vsetvli zero, zero, e32, m1, ta, mu
; CHECK-NEXT: vmv.x.s a0, v8		; CHECK-NEXT: vmv.x.s a0, v8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v = load <4 x i16>, <4 x i16>* %x		%v = load <4 x i16>, <4 x i16>* %x
%e = zext <4 x i16> %v to <4 x i32>		%e = zext <4 x i16> %v to <4 x i32>
▲ Show 20 Lines • Show All 252 Lines • ▼ Show 20 Lines	; RV64-NEXT: ret
%v = load <1 x i64>, <1 x i64>* %x		%v = load <1 x i64>, <1 x i64>* %x
%red = call i64 @llvm.vector.reduce.add.v1i64(<1 x i64> %v)		%red = call i64 @llvm.vector.reduce.add.v1i64(<1 x i64> %v)
ret i64 %red		ret i64 %red
}		}

define i64 @vwreduce_add_v1i64(<1 x i32>* %x) {		define i64 @vwreduce_add_v1i64(<1 x i32>* %x) {
; RV32-LABEL: vwreduce_add_v1i64:		; RV32-LABEL: vwreduce_add_v1i64:
; RV32: # %bb.0:		; RV32: # %bb.0:
; RV32-NEXT: vsetivli zero, 1, e32, mf2, ta, mu		; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, mu
; RV32-NEXT: vle32.v v8, (a0)		; RV32-NEXT: vle32.v v8, (a0)
; RV32-NEXT: vsetvli zero, zero, e64, m1, ta, mu
; RV32-NEXT: vsext.vf2 v9, v8		; RV32-NEXT: vsext.vf2 v9, v8
; RV32-NEXT: li a0, 32		; RV32-NEXT: li a0, 32
; RV32-NEXT: vsrl.vx v8, v9, a0		; RV32-NEXT: vsrl.vx v8, v9, a0
; RV32-NEXT: vmv.x.s a1, v8		; RV32-NEXT: vmv.x.s a1, v8
; RV32-NEXT: vmv.x.s a0, v9		; RV32-NEXT: vmv.x.s a0, v9
; RV32-NEXT: ret		; RV32-NEXT: ret
;		;
; RV64-LABEL: vwreduce_add_v1i64:		; RV64-LABEL: vwreduce_add_v1i64:
; RV64: # %bb.0:		; RV64: # %bb.0:
; RV64-NEXT: vsetivli zero, 1, e32, mf2, ta, mu		; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, mu
; RV64-NEXT: vle32.v v8, (a0)		; RV64-NEXT: vle32.v v8, (a0)
; RV64-NEXT: vsetvli zero, zero, e64, m1, ta, mu
; RV64-NEXT: vsext.vf2 v9, v8		; RV64-NEXT: vsext.vf2 v9, v8
; RV64-NEXT: vmv.x.s a0, v9		; RV64-NEXT: vmv.x.s a0, v9
; RV64-NEXT: ret		; RV64-NEXT: ret
%v = load <1 x i32>, <1 x i32>* %x		%v = load <1 x i32>, <1 x i32>* %x
%e = sext <1 x i32> %v to <1 x i64>		%e = sext <1 x i32> %v to <1 x i64>
%red = call i64 @llvm.vector.reduce.add.v1i64(<1 x i64> %e)		%red = call i64 @llvm.vector.reduce.add.v1i64(<1 x i64> %e)
ret i64 %red		ret i64 %red
}		}

define i64 @vwreduce_uadd_v1i64(<1 x i32>* %x) {		define i64 @vwreduce_uadd_v1i64(<1 x i32>* %x) {
; RV32-LABEL: vwreduce_uadd_v1i64:		; RV32-LABEL: vwreduce_uadd_v1i64:
; RV32: # %bb.0:		; RV32: # %bb.0:
; RV32-NEXT: vsetivli zero, 1, e32, mf2, ta, mu		; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, mu
; RV32-NEXT: vle32.v v8, (a0)		; RV32-NEXT: vle32.v v8, (a0)
; RV32-NEXT: vsetvli zero, zero, e64, m1, ta, mu
; RV32-NEXT: vzext.vf2 v9, v8		; RV32-NEXT: vzext.vf2 v9, v8
; RV32-NEXT: li a0, 32		; RV32-NEXT: li a0, 32
; RV32-NEXT: vsrl.vx v8, v9, a0		; RV32-NEXT: vsrl.vx v8, v9, a0
; RV32-NEXT: vmv.x.s a1, v8		; RV32-NEXT: vmv.x.s a1, v8
; RV32-NEXT: vmv.x.s a0, v9		; RV32-NEXT: vmv.x.s a0, v9
; RV32-NEXT: ret		; RV32-NEXT: ret
;		;
; RV64-LABEL: vwreduce_uadd_v1i64:		; RV64-LABEL: vwreduce_uadd_v1i64:
; RV64: # %bb.0:		; RV64: # %bb.0:
; RV64-NEXT: vsetivli zero, 1, e32, mf2, ta, mu		; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, mu
; RV64-NEXT: vle32.v v8, (a0)		; RV64-NEXT: vle32.v v8, (a0)
; RV64-NEXT: vsetvli zero, zero, e64, m1, ta, mu
; RV64-NEXT: vzext.vf2 v9, v8		; RV64-NEXT: vzext.vf2 v9, v8
; RV64-NEXT: vmv.x.s a0, v9		; RV64-NEXT: vmv.x.s a0, v9
; RV64-NEXT: ret		; RV64-NEXT: ret
%v = load <1 x i32>, <1 x i32>* %x		%v = load <1 x i32>, <1 x i32>* %x
%e = zext <1 x i32> %v to <1 x i64>		%e = zext <1 x i32> %v to <1 x i64>
%red = call i64 @llvm.vector.reduce.add.v1i64(<1 x i64> %e)		%red = call i64 @llvm.vector.reduce.add.v1i64(<1 x i64> %e)
ret i64 %red		ret i64 %red
}		}
Show All 25 Lines	; RV64-NEXT: ret
%v = load <2 x i64>, <2 x i64>* %x		%v = load <2 x i64>, <2 x i64>* %x
%red = call i64 @llvm.vector.reduce.add.v2i64(<2 x i64> %v)		%red = call i64 @llvm.vector.reduce.add.v2i64(<2 x i64> %v)
ret i64 %red		ret i64 %red
}		}

define i64 @vwreduce_add_v2i64(<2 x i32>* %x) {		define i64 @vwreduce_add_v2i64(<2 x i32>* %x) {
; RV32-LABEL: vwreduce_add_v2i64:		; RV32-LABEL: vwreduce_add_v2i64:
; RV32: # %bb.0:		; RV32: # %bb.0:
; RV32-NEXT: vsetivli zero, 2, e32, mf2, ta, mu		; RV32-NEXT: vsetivli zero, 2, e64, m1, ta, mu
; RV32-NEXT: vle32.v v8, (a0)		; RV32-NEXT: vle32.v v8, (a0)
; RV32-NEXT: vsetvli zero, zero, e64, m1, ta, mu
; RV32-NEXT: vmv.s.x v9, zero		; RV32-NEXT: vmv.s.x v9, zero
; RV32-NEXT: vsetvli zero, zero, e32, mf2, ta, mu		; RV32-NEXT: vsetvli zero, zero, e32, mf2, ta, mu
; RV32-NEXT: vwredsum.vs v8, v8, v9		; RV32-NEXT: vwredsum.vs v8, v8, v9
; RV32-NEXT: vsetvli zero, zero, e64, m1, ta, mu		; RV32-NEXT: vsetvli zero, zero, e64, m1, ta, mu
; RV32-NEXT: vmv.x.s a0, v8		; RV32-NEXT: vmv.x.s a0, v8
; RV32-NEXT: li a1, 32		; RV32-NEXT: li a1, 32
; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, mu		; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, mu
; RV32-NEXT: vsrl.vx v8, v8, a1		; RV32-NEXT: vsrl.vx v8, v8, a1
; RV32-NEXT: vmv.x.s a1, v8		; RV32-NEXT: vmv.x.s a1, v8
; RV32-NEXT: ret		; RV32-NEXT: ret
;		;
; RV64-LABEL: vwreduce_add_v2i64:		; RV64-LABEL: vwreduce_add_v2i64:
; RV64: # %bb.0:		; RV64: # %bb.0:
; RV64-NEXT: vsetivli zero, 2, e32, mf2, ta, mu		; RV64-NEXT: vsetivli zero, 2, e64, m1, ta, mu
; RV64-NEXT: vle32.v v8, (a0)		; RV64-NEXT: vle32.v v8, (a0)
; RV64-NEXT: vsetvli zero, zero, e64, m1, ta, mu
; RV64-NEXT: vmv.s.x v9, zero		; RV64-NEXT: vmv.s.x v9, zero
; RV64-NEXT: vsetvli zero, zero, e32, mf2, ta, mu		; RV64-NEXT: vsetvli zero, zero, e32, mf2, ta, mu
; RV64-NEXT: vwredsum.vs v8, v8, v9		; RV64-NEXT: vwredsum.vs v8, v8, v9
; RV64-NEXT: vsetvli zero, zero, e64, m1, ta, mu		; RV64-NEXT: vsetvli zero, zero, e64, m1, ta, mu
; RV64-NEXT: vmv.x.s a0, v8		; RV64-NEXT: vmv.x.s a0, v8
; RV64-NEXT: ret		; RV64-NEXT: ret
%v = load <2 x i32>, <2 x i32>* %x		%v = load <2 x i32>, <2 x i32>* %x
%e = sext <2 x i32> %v to <2 x i64>		%e = sext <2 x i32> %v to <2 x i64>
%red = call i64 @llvm.vector.reduce.add.v2i64(<2 x i64> %e)		%red = call i64 @llvm.vector.reduce.add.v2i64(<2 x i64> %e)
ret i64 %red		ret i64 %red
}		}

define i64 @vwreduce_uadd_v2i64(<2 x i32>* %x) {		define i64 @vwreduce_uadd_v2i64(<2 x i32>* %x) {
; RV32-LABEL: vwreduce_uadd_v2i64:		; RV32-LABEL: vwreduce_uadd_v2i64:
; RV32: # %bb.0:		; RV32: # %bb.0:
; RV32-NEXT: vsetivli zero, 2, e32, mf2, ta, mu		; RV32-NEXT: vsetivli zero, 2, e64, m1, ta, mu
; RV32-NEXT: vle32.v v8, (a0)		; RV32-NEXT: vle32.v v8, (a0)
; RV32-NEXT: vsetvli zero, zero, e64, m1, ta, mu
; RV32-NEXT: vmv.s.x v9, zero		; RV32-NEXT: vmv.s.x v9, zero
; RV32-NEXT: vsetvli zero, zero, e32, mf2, ta, mu		; RV32-NEXT: vsetvli zero, zero, e32, mf2, ta, mu
; RV32-NEXT: vwredsumu.vs v8, v8, v9		; RV32-NEXT: vwredsumu.vs v8, v8, v9
; RV32-NEXT: vsetvli zero, zero, e64, m1, ta, mu		; RV32-NEXT: vsetvli zero, zero, e64, m1, ta, mu
; RV32-NEXT: vmv.x.s a0, v8		; RV32-NEXT: vmv.x.s a0, v8
; RV32-NEXT: li a1, 32		; RV32-NEXT: li a1, 32
; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, mu		; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, mu
; RV32-NEXT: vsrl.vx v8, v8, a1		; RV32-NEXT: vsrl.vx v8, v8, a1
; RV32-NEXT: vmv.x.s a1, v8		; RV32-NEXT: vmv.x.s a1, v8
; RV32-NEXT: ret		; RV32-NEXT: ret
;		;
; RV64-LABEL: vwreduce_uadd_v2i64:		; RV64-LABEL: vwreduce_uadd_v2i64:
; RV64: # %bb.0:		; RV64: # %bb.0:
; RV64-NEXT: vsetivli zero, 2, e32, mf2, ta, mu		; RV64-NEXT: vsetivli zero, 2, e64, m1, ta, mu
; RV64-NEXT: vle32.v v8, (a0)		; RV64-NEXT: vle32.v v8, (a0)
; RV64-NEXT: vsetvli zero, zero, e64, m1, ta, mu
; RV64-NEXT: vmv.s.x v9, zero		; RV64-NEXT: vmv.s.x v9, zero
; RV64-NEXT: vsetvli zero, zero, e32, mf2, ta, mu		; RV64-NEXT: vsetvli zero, zero, e32, mf2, ta, mu
; RV64-NEXT: vwredsumu.vs v8, v8, v9		; RV64-NEXT: vwredsumu.vs v8, v8, v9
; RV64-NEXT: vsetvli zero, zero, e64, m1, ta, mu		; RV64-NEXT: vsetvli zero, zero, e64, m1, ta, mu
; RV64-NEXT: vmv.x.s a0, v8		; RV64-NEXT: vmv.x.s a0, v8
; RV64-NEXT: ret		; RV64-NEXT: ret
%v = load <2 x i32>, <2 x i32>* %x		%v = load <2 x i32>, <2 x i32>* %x
%e = zext <2 x i32> %v to <2 x i64>		%e = zext <2 x i32> %v to <2 x i64>
▲ Show 20 Lines • Show All 6,441 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-vfwadd.ll

Show First 20 Lines • Show All 385 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%e = fpext <32 x float> %c to <32 x double>		%e = fpext <32 x float> %c to <32 x double>
%f = fadd <32 x double> %d, %e		%f = fadd <32 x double> %d, %e
ret <32 x double> %f		ret <32 x double> %f
}		}

define <2 x float> @vfwadd_wv_v2f16(<2 x float> %x, <2 x half> %y) {		define <2 x float> @vfwadd_wv_v2f16(<2 x float> %x, <2 x half> %y) {
; CHECK-LABEL: vfwadd_wv_v2f16:		; CHECK-LABEL: vfwadd_wv_v2f16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 2, e32, mf2, ta, mu		; CHECK-NEXT: vsetivli zero, 2, e16, mf4, ta, mu
; CHECK-NEXT: vle32.v v9, (a0)		; CHECK-NEXT: vle32.v v9, (a0)
; CHECK-NEXT: vle16.v v10, (a1)		; CHECK-NEXT: vle16.v v10, (a1)
; CHECK-NEXT: vsetvli zero, zero, e16, mf4, ta, mu
; CHECK-NEXT: vfwadd.wv v8, v9, v10		; CHECK-NEXT: vfwadd.wv v8, v9, v10
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = load <2 x float>, <2 x float>* %x		%a = load <2 x float>, <2 x float>* %x
%b = load <2 x half>, <2 x half>* %y		%b = load <2 x half>, <2 x half>* %y
%c = fpext <2 x half> %b to <2 x float>		%c = fpext <2 x half> %b to <2 x float>
%d = fadd <2 x float> %c, %a		%d = fadd <2 x float> %c, %a
ret <2 x float> %d		ret <2 x float> %d
}		}

define <4 x float> @vfwadd_wv_v4f16(<4 x float> %x, <4 x half> %y) {		define <4 x float> @vfwadd_wv_v4f16(<4 x float> %x, <4 x half> %y) {
; CHECK-LABEL: vfwadd_wv_v4f16:		; CHECK-LABEL: vfwadd_wv_v4f16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu		; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, mu
; CHECK-NEXT: vle32.v v9, (a0)		; CHECK-NEXT: vle32.v v9, (a0)
; CHECK-NEXT: vle16.v v10, (a1)		; CHECK-NEXT: vle16.v v10, (a1)
; CHECK-NEXT: vsetvli zero, zero, e16, mf2, ta, mu
; CHECK-NEXT: vfwadd.wv v8, v9, v10		; CHECK-NEXT: vfwadd.wv v8, v9, v10
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = load <4 x float>, <4 x float>* %x		%a = load <4 x float>, <4 x float>* %x
%b = load <4 x half>, <4 x half>* %y		%b = load <4 x half>, <4 x half>* %y
%c = fpext <4 x half> %b to <4 x float>		%c = fpext <4 x half> %b to <4 x float>
%d = fadd <4 x float> %c, %a		%d = fadd <4 x float> %c, %a
ret <4 x float> %d		ret <4 x float> %d
}		}

define <8 x float> @vfwadd_wv_v8f16(<8 x float> %x, <8 x half> %y) {		define <8 x float> @vfwadd_wv_v8f16(<8 x float> %x, <8 x half> %y) {
; CHECK-LABEL: vfwadd_wv_v8f16:		; CHECK-LABEL: vfwadd_wv_v8f16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 8, e32, m2, ta, mu		; CHECK-NEXT: vsetivli zero, 8, e16, m1, ta, mu
; CHECK-NEXT: vle32.v v10, (a0)		; CHECK-NEXT: vle32.v v10, (a0)
; CHECK-NEXT: vle16.v v12, (a1)		; CHECK-NEXT: vle16.v v12, (a1)
; CHECK-NEXT: vsetvli zero, zero, e16, m1, ta, mu
; CHECK-NEXT: vfwadd.wv v8, v10, v12		; CHECK-NEXT: vfwadd.wv v8, v10, v12
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = load <8 x float>, <8 x float>* %x		%a = load <8 x float>, <8 x float>* %x
%b = load <8 x half>, <8 x half>* %y		%b = load <8 x half>, <8 x half>* %y
%c = fpext <8 x half> %b to <8 x float>		%c = fpext <8 x half> %b to <8 x float>
%d = fadd <8 x float> %c, %a		%d = fadd <8 x float> %c, %a
ret <8 x float> %d		ret <8 x float> %d
}		}

define <16 x float> @vfwadd_wv_v16f16(<16 x float> %x, <16 x half> %y) {		define <16 x float> @vfwadd_wv_v16f16(<16 x float> %x, <16 x half> %y) {
; CHECK-LABEL: vfwadd_wv_v16f16:		; CHECK-LABEL: vfwadd_wv_v16f16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 16, e32, m4, ta, mu		; CHECK-NEXT: vsetivli zero, 16, e16, m2, ta, mu
; CHECK-NEXT: vle32.v v12, (a0)		; CHECK-NEXT: vle32.v v12, (a0)
; CHECK-NEXT: vle16.v v16, (a1)		; CHECK-NEXT: vle16.v v16, (a1)
; CHECK-NEXT: vsetvli zero, zero, e16, m2, ta, mu
; CHECK-NEXT: vfwadd.wv v8, v12, v16		; CHECK-NEXT: vfwadd.wv v8, v12, v16
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = load <16 x float>, <16 x float>* %x		%a = load <16 x float>, <16 x float>* %x
%b = load <16 x half>, <16 x half>* %y		%b = load <16 x half>, <16 x half>* %y
%c = fpext <16 x half> %b to <16 x float>		%c = fpext <16 x half> %b to <16 x float>
%d = fadd <16 x float> %c, %a		%d = fadd <16 x float> %c, %a
ret <16 x float> %d		ret <16 x float> %d
}		}

define <32 x float> @vfwadd_wv_v32f16(<32 x float> %x, <32 x half> %y) {		define <32 x float> @vfwadd_wv_v32f16(<32 x float> %x, <32 x half> %y) {
; CHECK-LABEL: vfwadd_wv_v32f16:		; CHECK-LABEL: vfwadd_wv_v32f16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: li a2, 32		; CHECK-NEXT: li a2, 32
; CHECK-NEXT: vsetvli zero, a2, e32, m8, ta, mu		; CHECK-NEXT: vsetvli zero, a2, e16, m4, ta, mu
; CHECK-NEXT: vle32.v v16, (a0)		; CHECK-NEXT: vle32.v v16, (a0)
; CHECK-NEXT: vle16.v v24, (a1)		; CHECK-NEXT: vle16.v v24, (a1)
; CHECK-NEXT: vsetvli zero, zero, e16, m4, ta, mu
; CHECK-NEXT: vfwadd.wv v8, v16, v24		; CHECK-NEXT: vfwadd.wv v8, v16, v24
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = load <32 x float>, <32 x float>* %x		%a = load <32 x float>, <32 x float>* %x
%b = load <32 x half>, <32 x half>* %y		%b = load <32 x half>, <32 x half>* %y
%c = fpext <32 x half> %b to <32 x float>		%c = fpext <32 x half> %b to <32 x float>
%d = fadd <32 x float> %c, %a		%d = fadd <32 x float> %c, %a
ret <32 x float> %d		ret <32 x float> %d
}		}

define <2 x double> @vfwadd_wv_v2f32(<2 x double> %x, <2 x float> %y) {		define <2 x double> @vfwadd_wv_v2f32(<2 x double> %x, <2 x float> %y) {
; CHECK-LABEL: vfwadd_wv_v2f32:		; CHECK-LABEL: vfwadd_wv_v2f32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 2, e64, m1, ta, mu		; CHECK-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
; CHECK-NEXT: vle64.v v9, (a0)		; CHECK-NEXT: vle64.v v9, (a0)
; CHECK-NEXT: vle32.v v10, (a1)		; CHECK-NEXT: vle32.v v10, (a1)
; CHECK-NEXT: vsetvli zero, zero, e32, mf2, ta, mu
; CHECK-NEXT: vfwadd.wv v8, v9, v10		; CHECK-NEXT: vfwadd.wv v8, v9, v10
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = load <2 x double>, <2 x double>* %x		%a = load <2 x double>, <2 x double>* %x
%b = load <2 x float>, <2 x float>* %y		%b = load <2 x float>, <2 x float>* %y
%c = fpext <2 x float> %b to <2 x double>		%c = fpext <2 x float> %b to <2 x double>
%d = fadd <2 x double> %c, %a		%d = fadd <2 x double> %c, %a
ret <2 x double> %d		ret <2 x double> %d
}		}

define <4 x double> @vfwadd_wv_v4f32(<4 x double> %x, <4 x float> %y) {		define <4 x double> @vfwadd_wv_v4f32(<4 x double> %x, <4 x float> %y) {
; CHECK-LABEL: vfwadd_wv_v4f32:		; CHECK-LABEL: vfwadd_wv_v4f32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 4, e64, m2, ta, mu		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: vle64.v v10, (a0)		; CHECK-NEXT: vle64.v v10, (a0)
; CHECK-NEXT: vle32.v v12, (a1)		; CHECK-NEXT: vle32.v v12, (a1)
; CHECK-NEXT: vsetvli zero, zero, e32, m1, ta, mu
; CHECK-NEXT: vfwadd.wv v8, v10, v12		; CHECK-NEXT: vfwadd.wv v8, v10, v12
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = load <4 x double>, <4 x double>* %x		%a = load <4 x double>, <4 x double>* %x
%b = load <4 x float>, <4 x float>* %y		%b = load <4 x float>, <4 x float>* %y
%c = fpext <4 x float> %b to <4 x double>		%c = fpext <4 x float> %b to <4 x double>
%d = fadd <4 x double> %c, %a		%d = fadd <4 x double> %c, %a
ret <4 x double> %d		ret <4 x double> %d
}		}

define <8 x double> @vfwadd_wv_v8f32(<8 x double> %x, <8 x float> %y) {		define <8 x double> @vfwadd_wv_v8f32(<8 x double> %x, <8 x float> %y) {
; CHECK-LABEL: vfwadd_wv_v8f32:		; CHECK-LABEL: vfwadd_wv_v8f32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 8, e64, m4, ta, mu		; CHECK-NEXT: vsetivli zero, 8, e32, m2, ta, mu
; CHECK-NEXT: vle64.v v12, (a0)		; CHECK-NEXT: vle64.v v12, (a0)
; CHECK-NEXT: vle32.v v16, (a1)		; CHECK-NEXT: vle32.v v16, (a1)
; CHECK-NEXT: vsetvli zero, zero, e32, m2, ta, mu
; CHECK-NEXT: vfwadd.wv v8, v12, v16		; CHECK-NEXT: vfwadd.wv v8, v12, v16
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = load <8 x double>, <8 x double>* %x		%a = load <8 x double>, <8 x double>* %x
%b = load <8 x float>, <8 x float>* %y		%b = load <8 x float>, <8 x float>* %y
%c = fpext <8 x float> %b to <8 x double>		%c = fpext <8 x float> %b to <8 x double>
%d = fadd <8 x double> %c, %a		%d = fadd <8 x double> %c, %a
ret <8 x double> %d		ret <8 x double> %d
}		}

define <16 x double> @vfwadd_wv_v16f32(<16 x double> %x, <16 x float> %y) {		define <16 x double> @vfwadd_wv_v16f32(<16 x double> %x, <16 x float> %y) {
; CHECK-LABEL: vfwadd_wv_v16f32:		; CHECK-LABEL: vfwadd_wv_v16f32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 16, e64, m8, ta, mu		; CHECK-NEXT: vsetivli zero, 16, e32, m4, ta, mu
; CHECK-NEXT: vle64.v v16, (a0)		; CHECK-NEXT: vle64.v v16, (a0)
; CHECK-NEXT: vle32.v v24, (a1)		; CHECK-NEXT: vle32.v v24, (a1)
; CHECK-NEXT: vsetvli zero, zero, e32, m4, ta, mu
; CHECK-NEXT: vfwadd.wv v8, v16, v24		; CHECK-NEXT: vfwadd.wv v8, v16, v24
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = load <16 x double>, <16 x double>* %x		%a = load <16 x double>, <16 x double>* %x
%b = load <16 x float>, <16 x float>* %y		%b = load <16 x float>, <16 x float>* %y
%c = fpext <16 x float> %b to <16 x double>		%c = fpext <16 x float> %b to <16 x double>
%d = fadd <16 x double> %c, %a		%d = fadd <16 x double> %c, %a
ret <16 x double> %d		ret <16 x double> %d
}		}

define <2 x float> @vfwadd_wf_v2f16(<2 x float>* %x, half %y) {		define <2 x float> @vfwadd_wf_v2f16(<2 x float>* %x, half %y) {
; CHECK-LABEL: vfwadd_wf_v2f16:		; CHECK-LABEL: vfwadd_wf_v2f16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 2, e32, mf2, ta, mu		; CHECK-NEXT: vsetivli zero, 2, e16, mf4, ta, mu
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vsetvli zero, zero, e16, mf4, ta, mu
; CHECK-NEXT: vfwadd.wf v8, v8, fa0		; CHECK-NEXT: vfwadd.wf v8, v8, fa0
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = load <2 x float>, <2 x float>* %x		%a = load <2 x float>, <2 x float>* %x
%b = insertelement <2 x half> poison, half %y, i32 0		%b = insertelement <2 x half> poison, half %y, i32 0
%c = shufflevector <2 x half> %b, <2 x half> poison, <2 x i32> zeroinitializer		%c = shufflevector <2 x half> %b, <2 x half> poison, <2 x i32> zeroinitializer
%d = fpext <2 x half> %c to <2 x float>		%d = fpext <2 x half> %c to <2 x float>
%e = fadd <2 x float> %d, %a		%e = fadd <2 x float> %d, %a
ret <2 x float> %e		ret <2 x float> %e
}		}

define <4 x float> @vfwadd_wf_v4f16(<4 x float>* %x, half %y) {		define <4 x float> @vfwadd_wf_v4f16(<4 x float>* %x, half %y) {
; CHECK-LABEL: vfwadd_wf_v4f16:		; CHECK-LABEL: vfwadd_wf_v4f16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu		; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, mu
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vsetvli zero, zero, e16, mf2, ta, mu
; CHECK-NEXT: vfwadd.wf v8, v8, fa0		; CHECK-NEXT: vfwadd.wf v8, v8, fa0
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = load <4 x float>, <4 x float>* %x		%a = load <4 x float>, <4 x float>* %x
%b = insertelement <4 x half> poison, half %y, i32 0		%b = insertelement <4 x half> poison, half %y, i32 0
%c = shufflevector <4 x half> %b, <4 x half> poison, <4 x i32> zeroinitializer		%c = shufflevector <4 x half> %b, <4 x half> poison, <4 x i32> zeroinitializer
%d = fpext <4 x half> %c to <4 x float>		%d = fpext <4 x half> %c to <4 x float>
%e = fadd <4 x float> %d, %a		%e = fadd <4 x float> %d, %a
ret <4 x float> %e		ret <4 x float> %e
}		}

define <8 x float> @vfwadd_wf_v8f16(<8 x float>* %x, half %y) {		define <8 x float> @vfwadd_wf_v8f16(<8 x float>* %x, half %y) {
; CHECK-LABEL: vfwadd_wf_v8f16:		; CHECK-LABEL: vfwadd_wf_v8f16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 8, e32, m2, ta, mu		; CHECK-NEXT: vsetivli zero, 8, e16, m1, ta, mu
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vsetvli zero, zero, e16, m1, ta, mu
; CHECK-NEXT: vfwadd.wf v8, v8, fa0		; CHECK-NEXT: vfwadd.wf v8, v8, fa0
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = load <8 x float>, <8 x float>* %x		%a = load <8 x float>, <8 x float>* %x
%b = insertelement <8 x half> poison, half %y, i32 0		%b = insertelement <8 x half> poison, half %y, i32 0
%c = shufflevector <8 x half> %b, <8 x half> poison, <8 x i32> zeroinitializer		%c = shufflevector <8 x half> %b, <8 x half> poison, <8 x i32> zeroinitializer
%d = fpext <8 x half> %c to <8 x float>		%d = fpext <8 x half> %c to <8 x float>
%e = fadd <8 x float> %d, %a		%e = fadd <8 x float> %d, %a
ret <8 x float> %e		ret <8 x float> %e
}		}

define <16 x float> @vfwadd_wf_v16f16(<16 x float>* %x, half %y) {		define <16 x float> @vfwadd_wf_v16f16(<16 x float>* %x, half %y) {
; CHECK-LABEL: vfwadd_wf_v16f16:		; CHECK-LABEL: vfwadd_wf_v16f16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 16, e32, m4, ta, mu		; CHECK-NEXT: vsetivli zero, 16, e16, m2, ta, mu
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vsetvli zero, zero, e16, m2, ta, mu
; CHECK-NEXT: vfwadd.wf v8, v8, fa0		; CHECK-NEXT: vfwadd.wf v8, v8, fa0
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = load <16 x float>, <16 x float>* %x		%a = load <16 x float>, <16 x float>* %x
%b = insertelement <16 x half> poison, half %y, i32 0		%b = insertelement <16 x half> poison, half %y, i32 0
%c = shufflevector <16 x half> %b, <16 x half> poison, <16 x i32> zeroinitializer		%c = shufflevector <16 x half> %b, <16 x half> poison, <16 x i32> zeroinitializer
%d = fpext <16 x half> %c to <16 x float>		%d = fpext <16 x half> %c to <16 x float>
%e = fadd <16 x float> %d, %a		%e = fadd <16 x float> %d, %a
ret <16 x float> %e		ret <16 x float> %e
}		}

define <2 x double> @vfwadd_wf_v2f32(<2 x double>* %x, float %y) {		define <2 x double> @vfwadd_wf_v2f32(<2 x double>* %x, float %y) {
; CHECK-LABEL: vfwadd_wf_v2f32:		; CHECK-LABEL: vfwadd_wf_v2f32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 2, e64, m1, ta, mu		; CHECK-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
; CHECK-NEXT: vle64.v v8, (a0)		; CHECK-NEXT: vle64.v v8, (a0)
; CHECK-NEXT: vsetvli zero, zero, e32, mf2, ta, mu
; CHECK-NEXT: vfwadd.wf v8, v8, fa0		; CHECK-NEXT: vfwadd.wf v8, v8, fa0
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = load <2 x double>, <2 x double>* %x		%a = load <2 x double>, <2 x double>* %x
%b = insertelement <2 x float> poison, float %y, i32 0		%b = insertelement <2 x float> poison, float %y, i32 0
%c = shufflevector <2 x float> %b, <2 x float> poison, <2 x i32> zeroinitializer		%c = shufflevector <2 x float> %b, <2 x float> poison, <2 x i32> zeroinitializer
%d = fpext <2 x float> %c to <2 x double>		%d = fpext <2 x float> %c to <2 x double>
%e = fadd <2 x double> %d, %a		%e = fadd <2 x double> %d, %a
ret <2 x double> %e		ret <2 x double> %e
}		}

define <4 x double> @vfwadd_wf_v4f32(<4 x double>* %x, float %y) {		define <4 x double> @vfwadd_wf_v4f32(<4 x double>* %x, float %y) {
; CHECK-LABEL: vfwadd_wf_v4f32:		; CHECK-LABEL: vfwadd_wf_v4f32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 4, e64, m2, ta, mu		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: vle64.v v8, (a0)		; CHECK-NEXT: vle64.v v8, (a0)
; CHECK-NEXT: vsetvli zero, zero, e32, m1, ta, mu
; CHECK-NEXT: vfwadd.wf v8, v8, fa0		; CHECK-NEXT: vfwadd.wf v8, v8, fa0
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = load <4 x double>, <4 x double>* %x		%a = load <4 x double>, <4 x double>* %x
%b = insertelement <4 x float> poison, float %y, i32 0		%b = insertelement <4 x float> poison, float %y, i32 0
%c = shufflevector <4 x float> %b, <4 x float> poison, <4 x i32> zeroinitializer		%c = shufflevector <4 x float> %b, <4 x float> poison, <4 x i32> zeroinitializer
%d = fpext <4 x float> %c to <4 x double>		%d = fpext <4 x float> %c to <4 x double>
%e = fadd <4 x double> %d, %a		%e = fadd <4 x double> %d, %a
ret <4 x double> %e		ret <4 x double> %e
}		}

define <8 x double> @vfwadd_wf_v8f32(<8 x double>* %x, float %y) {		define <8 x double> @vfwadd_wf_v8f32(<8 x double>* %x, float %y) {
; CHECK-LABEL: vfwadd_wf_v8f32:		; CHECK-LABEL: vfwadd_wf_v8f32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 8, e64, m4, ta, mu		; CHECK-NEXT: vsetivli zero, 8, e32, m2, ta, mu
; CHECK-NEXT: vle64.v v8, (a0)		; CHECK-NEXT: vle64.v v8, (a0)
; CHECK-NEXT: vsetvli zero, zero, e32, m2, ta, mu
; CHECK-NEXT: vfwadd.wf v8, v8, fa0		; CHECK-NEXT: vfwadd.wf v8, v8, fa0
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = load <8 x double>, <8 x double>* %x		%a = load <8 x double>, <8 x double>* %x
%b = insertelement <8 x float> poison, float %y, i32 0		%b = insertelement <8 x float> poison, float %y, i32 0
%c = shufflevector <8 x float> %b, <8 x float> poison, <8 x i32> zeroinitializer		%c = shufflevector <8 x float> %b, <8 x float> poison, <8 x i32> zeroinitializer
%d = fpext <8 x float> %c to <8 x double>		%d = fpext <8 x float> %c to <8 x double>
%e = fadd <8 x double> %d, %a		%e = fadd <8 x double> %d, %a
ret <8 x double> %e		ret <8 x double> %e
}		}

define <16 x double> @vfwadd_wf_v16f32(<16 x double>* %x, float %y) {		define <16 x double> @vfwadd_wf_v16f32(<16 x double>* %x, float %y) {
; CHECK-LABEL: vfwadd_wf_v16f32:		; CHECK-LABEL: vfwadd_wf_v16f32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 16, e64, m8, ta, mu		; CHECK-NEXT: vsetivli zero, 16, e32, m4, ta, mu
; CHECK-NEXT: vle64.v v8, (a0)		; CHECK-NEXT: vle64.v v8, (a0)
; CHECK-NEXT: vsetvli zero, zero, e32, m4, ta, mu
; CHECK-NEXT: vfwadd.wf v8, v8, fa0		; CHECK-NEXT: vfwadd.wf v8, v8, fa0
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = load <16 x double>, <16 x double>* %x		%a = load <16 x double>, <16 x double>* %x
%b = insertelement <16 x float> poison, float %y, i32 0		%b = insertelement <16 x float> poison, float %y, i32 0
%c = shufflevector <16 x float> %b, <16 x float> poison, <16 x i32> zeroinitializer		%c = shufflevector <16 x float> %b, <16 x float> poison, <16 x i32> zeroinitializer
%d = fpext <16 x float> %c to <16 x double>		%d = fpext <16 x float> %c to <16 x double>
%e = fadd <16 x double> %d, %a		%e = fadd <16 x double> %d, %a
ret <16 x double> %e		ret <16 x double> %e
}		}

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-vfwsub.ll

Show First 20 Lines • Show All 388 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%e = fpext <32 x float> %c to <32 x double>		%e = fpext <32 x float> %c to <32 x double>
%f = fsub <32 x double> %d, %e		%f = fsub <32 x double> %d, %e
ret <32 x double> %f		ret <32 x double> %f
}		}

define <2 x float> @vfwsub_wv_v2f16(<2 x float> %x, <2 x half> %y) {		define <2 x float> @vfwsub_wv_v2f16(<2 x float> %x, <2 x half> %y) {
; CHECK-LABEL: vfwsub_wv_v2f16:		; CHECK-LABEL: vfwsub_wv_v2f16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 2, e32, mf2, ta, mu		; CHECK-NEXT: vsetivli zero, 2, e16, mf4, ta, mu
; CHECK-NEXT: vle32.v v9, (a0)		; CHECK-NEXT: vle32.v v9, (a0)
; CHECK-NEXT: vle16.v v10, (a1)		; CHECK-NEXT: vle16.v v10, (a1)
; CHECK-NEXT: vsetvli zero, zero, e16, mf4, ta, mu
; CHECK-NEXT: vfwsub.wv v8, v9, v10		; CHECK-NEXT: vfwsub.wv v8, v9, v10
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = load <2 x float>, <2 x float>* %x		%a = load <2 x float>, <2 x float>* %x
%b = load <2 x half>, <2 x half>* %y		%b = load <2 x half>, <2 x half>* %y
%c = fpext <2 x half> %b to <2 x float>		%c = fpext <2 x half> %b to <2 x float>
%d = fsub <2 x float> %a, %c		%d = fsub <2 x float> %a, %c
ret <2 x float> %d		ret <2 x float> %d
}		}

define <4 x float> @vfwsub_wv_v4f16(<4 x float> %x, <4 x half> %y) {		define <4 x float> @vfwsub_wv_v4f16(<4 x float> %x, <4 x half> %y) {
; CHECK-LABEL: vfwsub_wv_v4f16:		; CHECK-LABEL: vfwsub_wv_v4f16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu		; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, mu
; CHECK-NEXT: vle32.v v9, (a0)		; CHECK-NEXT: vle32.v v9, (a0)
; CHECK-NEXT: vle16.v v10, (a1)		; CHECK-NEXT: vle16.v v10, (a1)
; CHECK-NEXT: vsetvli zero, zero, e16, mf2, ta, mu
; CHECK-NEXT: vfwsub.wv v8, v9, v10		; CHECK-NEXT: vfwsub.wv v8, v9, v10
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = load <4 x float>, <4 x float>* %x		%a = load <4 x float>, <4 x float>* %x
%b = load <4 x half>, <4 x half>* %y		%b = load <4 x half>, <4 x half>* %y
%c = fpext <4 x half> %b to <4 x float>		%c = fpext <4 x half> %b to <4 x float>
%d = fsub <4 x float> %a, %c		%d = fsub <4 x float> %a, %c
ret <4 x float> %d		ret <4 x float> %d
}		}

define <8 x float> @vfwsub_wv_v8f16(<8 x float> %x, <8 x half> %y) {		define <8 x float> @vfwsub_wv_v8f16(<8 x float> %x, <8 x half> %y) {
; CHECK-LABEL: vfwsub_wv_v8f16:		; CHECK-LABEL: vfwsub_wv_v8f16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 8, e32, m2, ta, mu		; CHECK-NEXT: vsetivli zero, 8, e16, m1, ta, mu
; CHECK-NEXT: vle32.v v10, (a0)		; CHECK-NEXT: vle32.v v10, (a0)
; CHECK-NEXT: vle16.v v12, (a1)		; CHECK-NEXT: vle16.v v12, (a1)
; CHECK-NEXT: vsetvli zero, zero, e16, m1, ta, mu
; CHECK-NEXT: vfwsub.wv v8, v10, v12		; CHECK-NEXT: vfwsub.wv v8, v10, v12
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = load <8 x float>, <8 x float>* %x		%a = load <8 x float>, <8 x float>* %x
%b = load <8 x half>, <8 x half>* %y		%b = load <8 x half>, <8 x half>* %y
%c = fpext <8 x half> %b to <8 x float>		%c = fpext <8 x half> %b to <8 x float>
%d = fsub <8 x float> %a, %c		%d = fsub <8 x float> %a, %c
ret <8 x float> %d		ret <8 x float> %d
}		}

define <16 x float> @vfwsub_wv_v16f16(<16 x float> %x, <16 x half> %y) {		define <16 x float> @vfwsub_wv_v16f16(<16 x float> %x, <16 x half> %y) {
; CHECK-LABEL: vfwsub_wv_v16f16:		; CHECK-LABEL: vfwsub_wv_v16f16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 16, e32, m4, ta, mu		; CHECK-NEXT: vsetivli zero, 16, e16, m2, ta, mu
; CHECK-NEXT: vle32.v v12, (a0)		; CHECK-NEXT: vle32.v v12, (a0)
; CHECK-NEXT: vle16.v v16, (a1)		; CHECK-NEXT: vle16.v v16, (a1)
; CHECK-NEXT: vsetvli zero, zero, e16, m2, ta, mu
; CHECK-NEXT: vfwsub.wv v8, v12, v16		; CHECK-NEXT: vfwsub.wv v8, v12, v16
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = load <16 x float>, <16 x float>* %x		%a = load <16 x float>, <16 x float>* %x
%b = load <16 x half>, <16 x half>* %y		%b = load <16 x half>, <16 x half>* %y
%c = fpext <16 x half> %b to <16 x float>		%c = fpext <16 x half> %b to <16 x float>
%d = fsub <16 x float> %a, %c		%d = fsub <16 x float> %a, %c
ret <16 x float> %d		ret <16 x float> %d
}		}

define <32 x float> @vfwsub_wv_v32f16(<32 x float> %x, <32 x half> %y) {		define <32 x float> @vfwsub_wv_v32f16(<32 x float> %x, <32 x half> %y) {
; CHECK-LABEL: vfwsub_wv_v32f16:		; CHECK-LABEL: vfwsub_wv_v32f16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: li a2, 32		; CHECK-NEXT: li a2, 32
; CHECK-NEXT: vsetvli zero, a2, e32, m8, ta, mu		; CHECK-NEXT: vsetvli zero, a2, e16, m4, ta, mu
; CHECK-NEXT: vle32.v v16, (a0)		; CHECK-NEXT: vle32.v v16, (a0)
; CHECK-NEXT: vle16.v v24, (a1)		; CHECK-NEXT: vle16.v v24, (a1)
; CHECK-NEXT: vsetvli zero, zero, e16, m4, ta, mu
; CHECK-NEXT: vfwsub.wv v8, v16, v24		; CHECK-NEXT: vfwsub.wv v8, v16, v24
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = load <32 x float>, <32 x float>* %x		%a = load <32 x float>, <32 x float>* %x
%b = load <32 x half>, <32 x half>* %y		%b = load <32 x half>, <32 x half>* %y
%c = fpext <32 x half> %b to <32 x float>		%c = fpext <32 x half> %b to <32 x float>
%d = fsub <32 x float> %a, %c		%d = fsub <32 x float> %a, %c
ret <32 x float> %d		ret <32 x float> %d
}		}

define <2 x double> @vfwsub_wv_v2f32(<2 x double> %x, <2 x float> %y) {		define <2 x double> @vfwsub_wv_v2f32(<2 x double> %x, <2 x float> %y) {
; CHECK-LABEL: vfwsub_wv_v2f32:		; CHECK-LABEL: vfwsub_wv_v2f32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 2, e64, m1, ta, mu		; CHECK-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
; CHECK-NEXT: vle64.v v9, (a0)		; CHECK-NEXT: vle64.v v9, (a0)
; CHECK-NEXT: vle32.v v10, (a1)		; CHECK-NEXT: vle32.v v10, (a1)
; CHECK-NEXT: vsetvli zero, zero, e32, mf2, ta, mu
; CHECK-NEXT: vfwsub.wv v8, v9, v10		; CHECK-NEXT: vfwsub.wv v8, v9, v10
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = load <2 x double>, <2 x double>* %x		%a = load <2 x double>, <2 x double>* %x
%b = load <2 x float>, <2 x float>* %y		%b = load <2 x float>, <2 x float>* %y
%c = fpext <2 x float> %b to <2 x double>		%c = fpext <2 x float> %b to <2 x double>
%d = fsub <2 x double> %a, %c		%d = fsub <2 x double> %a, %c
ret <2 x double> %d		ret <2 x double> %d
}		}

define <4 x double> @vfwsub_wv_v4f32(<4 x double> %x, <4 x float> %y) {		define <4 x double> @vfwsub_wv_v4f32(<4 x double> %x, <4 x float> %y) {
; CHECK-LABEL: vfwsub_wv_v4f32:		; CHECK-LABEL: vfwsub_wv_v4f32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 4, e64, m2, ta, mu		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: vle64.v v10, (a0)		; CHECK-NEXT: vle64.v v10, (a0)
; CHECK-NEXT: vle32.v v12, (a1)		; CHECK-NEXT: vle32.v v12, (a1)
; CHECK-NEXT: vsetvli zero, zero, e32, m1, ta, mu
; CHECK-NEXT: vfwsub.wv v8, v10, v12		; CHECK-NEXT: vfwsub.wv v8, v10, v12
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = load <4 x double>, <4 x double>* %x		%a = load <4 x double>, <4 x double>* %x
%b = load <4 x float>, <4 x float>* %y		%b = load <4 x float>, <4 x float>* %y
%c = fpext <4 x float> %b to <4 x double>		%c = fpext <4 x float> %b to <4 x double>
%d = fsub <4 x double> %a, %c		%d = fsub <4 x double> %a, %c
ret <4 x double> %d		ret <4 x double> %d
}		}

define <8 x double> @vfwsub_wv_v8f32(<8 x double> %x, <8 x float> %y) {		define <8 x double> @vfwsub_wv_v8f32(<8 x double> %x, <8 x float> %y) {
; CHECK-LABEL: vfwsub_wv_v8f32:		; CHECK-LABEL: vfwsub_wv_v8f32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 8, e64, m4, ta, mu		; CHECK-NEXT: vsetivli zero, 8, e32, m2, ta, mu
; CHECK-NEXT: vle64.v v12, (a0)		; CHECK-NEXT: vle64.v v12, (a0)
; CHECK-NEXT: vle32.v v16, (a1)		; CHECK-NEXT: vle32.v v16, (a1)
; CHECK-NEXT: vsetvli zero, zero, e32, m2, ta, mu
; CHECK-NEXT: vfwsub.wv v8, v12, v16		; CHECK-NEXT: vfwsub.wv v8, v12, v16
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = load <8 x double>, <8 x double>* %x		%a = load <8 x double>, <8 x double>* %x
%b = load <8 x float>, <8 x float>* %y		%b = load <8 x float>, <8 x float>* %y
%c = fpext <8 x float> %b to <8 x double>		%c = fpext <8 x float> %b to <8 x double>
%d = fsub <8 x double> %a, %c		%d = fsub <8 x double> %a, %c
ret <8 x double> %d		ret <8 x double> %d
}		}

define <16 x double> @vfwsub_wv_v16f32(<16 x double> %x, <16 x float> %y) {		define <16 x double> @vfwsub_wv_v16f32(<16 x double> %x, <16 x float> %y) {
; CHECK-LABEL: vfwsub_wv_v16f32:		; CHECK-LABEL: vfwsub_wv_v16f32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 16, e64, m8, ta, mu		; CHECK-NEXT: vsetivli zero, 16, e32, m4, ta, mu
; CHECK-NEXT: vle64.v v16, (a0)		; CHECK-NEXT: vle64.v v16, (a0)
; CHECK-NEXT: vle32.v v24, (a1)		; CHECK-NEXT: vle32.v v24, (a1)
; CHECK-NEXT: vsetvli zero, zero, e32, m4, ta, mu
; CHECK-NEXT: vfwsub.wv v8, v16, v24		; CHECK-NEXT: vfwsub.wv v8, v16, v24
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = load <16 x double>, <16 x double>* %x		%a = load <16 x double>, <16 x double>* %x
%b = load <16 x float>, <16 x float>* %y		%b = load <16 x float>, <16 x float>* %y
%c = fpext <16 x float> %b to <16 x double>		%c = fpext <16 x float> %b to <16 x double>
%d = fsub <16 x double> %a, %c		%d = fsub <16 x double> %a, %c
ret <16 x double> %d		ret <16 x double> %d
}		}

define <2 x float> @vfwsub_wf_v2f16(<2 x float>* %x, half %y) {		define <2 x float> @vfwsub_wf_v2f16(<2 x float>* %x, half %y) {
; CHECK-LABEL: vfwsub_wf_v2f16:		; CHECK-LABEL: vfwsub_wf_v2f16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 2, e32, mf2, ta, mu		; CHECK-NEXT: vsetivli zero, 2, e16, mf4, ta, mu
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vsetvli zero, zero, e16, mf4, ta, mu
; CHECK-NEXT: vfwsub.wf v8, v8, fa0		; CHECK-NEXT: vfwsub.wf v8, v8, fa0
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = load <2 x float>, <2 x float>* %x		%a = load <2 x float>, <2 x float>* %x
%b = insertelement <2 x half> poison, half %y, i32 0		%b = insertelement <2 x half> poison, half %y, i32 0
%c = shufflevector <2 x half> %b, <2 x half> poison, <2 x i32> zeroinitializer		%c = shufflevector <2 x half> %b, <2 x half> poison, <2 x i32> zeroinitializer
%d = fpext <2 x half> %c to <2 x float>		%d = fpext <2 x half> %c to <2 x float>
%e = fsub <2 x float> %a, %d		%e = fsub <2 x float> %a, %d
ret <2 x float> %e		ret <2 x float> %e
}		}

define <4 x float> @vfwsub_wf_v4f16(<4 x float>* %x, half %y) {		define <4 x float> @vfwsub_wf_v4f16(<4 x float>* %x, half %y) {
; CHECK-LABEL: vfwsub_wf_v4f16:		; CHECK-LABEL: vfwsub_wf_v4f16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu		; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, mu
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vsetvli zero, zero, e16, mf2, ta, mu
; CHECK-NEXT: vfwsub.wf v8, v8, fa0		; CHECK-NEXT: vfwsub.wf v8, v8, fa0
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = load <4 x float>, <4 x float>* %x		%a = load <4 x float>, <4 x float>* %x
%b = insertelement <4 x half> poison, half %y, i32 0		%b = insertelement <4 x half> poison, half %y, i32 0
%c = shufflevector <4 x half> %b, <4 x half> poison, <4 x i32> zeroinitializer		%c = shufflevector <4 x half> %b, <4 x half> poison, <4 x i32> zeroinitializer
%d = fpext <4 x half> %c to <4 x float>		%d = fpext <4 x half> %c to <4 x float>
%e = fsub <4 x float> %a, %d		%e = fsub <4 x float> %a, %d
ret <4 x float> %e		ret <4 x float> %e
}		}

define <8 x float> @vfwsub_wf_v8f16(<8 x float>* %x, half %y) {		define <8 x float> @vfwsub_wf_v8f16(<8 x float>* %x, half %y) {
; CHECK-LABEL: vfwsub_wf_v8f16:		; CHECK-LABEL: vfwsub_wf_v8f16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 8, e32, m2, ta, mu		; CHECK-NEXT: vsetivli zero, 8, e16, m1, ta, mu
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vsetvli zero, zero, e16, m1, ta, mu
; CHECK-NEXT: vfwsub.wf v8, v8, fa0		; CHECK-NEXT: vfwsub.wf v8, v8, fa0
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = load <8 x float>, <8 x float>* %x		%a = load <8 x float>, <8 x float>* %x
%b = insertelement <8 x half> poison, half %y, i32 0		%b = insertelement <8 x half> poison, half %y, i32 0
%c = shufflevector <8 x half> %b, <8 x half> poison, <8 x i32> zeroinitializer		%c = shufflevector <8 x half> %b, <8 x half> poison, <8 x i32> zeroinitializer
%d = fpext <8 x half> %c to <8 x float>		%d = fpext <8 x half> %c to <8 x float>
%e = fsub <8 x float> %a, %d		%e = fsub <8 x float> %a, %d
ret <8 x float> %e		ret <8 x float> %e
}		}

define <16 x float> @vfwsub_wf_v16f16(<16 x float>* %x, half %y) {		define <16 x float> @vfwsub_wf_v16f16(<16 x float>* %x, half %y) {
; CHECK-LABEL: vfwsub_wf_v16f16:		; CHECK-LABEL: vfwsub_wf_v16f16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 16, e32, m4, ta, mu		; CHECK-NEXT: vsetivli zero, 16, e16, m2, ta, mu
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vsetvli zero, zero, e16, m2, ta, mu
; CHECK-NEXT: vfwsub.wf v8, v8, fa0		; CHECK-NEXT: vfwsub.wf v8, v8, fa0
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = load <16 x float>, <16 x float>* %x		%a = load <16 x float>, <16 x float>* %x
%b = insertelement <16 x half> poison, half %y, i32 0		%b = insertelement <16 x half> poison, half %y, i32 0
%c = shufflevector <16 x half> %b, <16 x half> poison, <16 x i32> zeroinitializer		%c = shufflevector <16 x half> %b, <16 x half> poison, <16 x i32> zeroinitializer
%d = fpext <16 x half> %c to <16 x float>		%d = fpext <16 x half> %c to <16 x float>
%e = fsub <16 x float> %a, %d		%e = fsub <16 x float> %a, %d
ret <16 x float> %e		ret <16 x float> %e
}		}

define <2 x double> @vfwsub_wf_v2f32(<2 x double>* %x, float %y) {		define <2 x double> @vfwsub_wf_v2f32(<2 x double>* %x, float %y) {
; CHECK-LABEL: vfwsub_wf_v2f32:		; CHECK-LABEL: vfwsub_wf_v2f32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 2, e64, m1, ta, mu		; CHECK-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
; CHECK-NEXT: vle64.v v8, (a0)		; CHECK-NEXT: vle64.v v8, (a0)
; CHECK-NEXT: vsetvli zero, zero, e32, mf2, ta, mu
; CHECK-NEXT: vfwsub.wf v8, v8, fa0		; CHECK-NEXT: vfwsub.wf v8, v8, fa0
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = load <2 x double>, <2 x double>* %x		%a = load <2 x double>, <2 x double>* %x
%b = insertelement <2 x float> poison, float %y, i32 0		%b = insertelement <2 x float> poison, float %y, i32 0
%c = shufflevector <2 x float> %b, <2 x float> poison, <2 x i32> zeroinitializer		%c = shufflevector <2 x float> %b, <2 x float> poison, <2 x i32> zeroinitializer
%d = fpext <2 x float> %c to <2 x double>		%d = fpext <2 x float> %c to <2 x double>
%e = fsub <2 x double> %a, %d		%e = fsub <2 x double> %a, %d
ret <2 x double> %e		ret <2 x double> %e
}		}

define <4 x double> @vfwsub_wf_v4f32(<4 x double>* %x, float %y) {		define <4 x double> @vfwsub_wf_v4f32(<4 x double>* %x, float %y) {
; CHECK-LABEL: vfwsub_wf_v4f32:		; CHECK-LABEL: vfwsub_wf_v4f32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 4, e64, m2, ta, mu		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: vle64.v v8, (a0)		; CHECK-NEXT: vle64.v v8, (a0)
; CHECK-NEXT: vsetvli zero, zero, e32, m1, ta, mu
; CHECK-NEXT: vfwsub.wf v8, v8, fa0		; CHECK-NEXT: vfwsub.wf v8, v8, fa0
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = load <4 x double>, <4 x double>* %x		%a = load <4 x double>, <4 x double>* %x
%b = insertelement <4 x float> poison, float %y, i32 0		%b = insertelement <4 x float> poison, float %y, i32 0
%c = shufflevector <4 x float> %b, <4 x float> poison, <4 x i32> zeroinitializer		%c = shufflevector <4 x float> %b, <4 x float> poison, <4 x i32> zeroinitializer
%d = fpext <4 x float> %c to <4 x double>		%d = fpext <4 x float> %c to <4 x double>
%e = fsub <4 x double> %a, %d		%e = fsub <4 x double> %a, %d
ret <4 x double> %e		ret <4 x double> %e
}		}

define <8 x double> @vfwsub_wf_v8f32(<8 x double>* %x, float %y) {		define <8 x double> @vfwsub_wf_v8f32(<8 x double>* %x, float %y) {
; CHECK-LABEL: vfwsub_wf_v8f32:		; CHECK-LABEL: vfwsub_wf_v8f32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 8, e64, m4, ta, mu		; CHECK-NEXT: vsetivli zero, 8, e32, m2, ta, mu
; CHECK-NEXT: vle64.v v8, (a0)		; CHECK-NEXT: vle64.v v8, (a0)
; CHECK-NEXT: vsetvli zero, zero, e32, m2, ta, mu
; CHECK-NEXT: vfwsub.wf v8, v8, fa0		; CHECK-NEXT: vfwsub.wf v8, v8, fa0
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = load <8 x double>, <8 x double>* %x		%a = load <8 x double>, <8 x double>* %x
%b = insertelement <8 x float> poison, float %y, i32 0		%b = insertelement <8 x float> poison, float %y, i32 0
%c = shufflevector <8 x float> %b, <8 x float> poison, <8 x i32> zeroinitializer		%c = shufflevector <8 x float> %b, <8 x float> poison, <8 x i32> zeroinitializer
%d = fpext <8 x float> %c to <8 x double>		%d = fpext <8 x float> %c to <8 x double>
%e = fsub <8 x double> %a, %d		%e = fsub <8 x double> %a, %d
ret <8 x double> %e		ret <8 x double> %e
}		}

define <16 x double> @vfwsub_wf_v16f32(<16 x double>* %x, float %y) {		define <16 x double> @vfwsub_wf_v16f32(<16 x double>* %x, float %y) {
; CHECK-LABEL: vfwsub_wf_v16f32:		; CHECK-LABEL: vfwsub_wf_v16f32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 16, e64, m8, ta, mu		; CHECK-NEXT: vsetivli zero, 16, e32, m4, ta, mu
; CHECK-NEXT: vle64.v v8, (a0)		; CHECK-NEXT: vle64.v v8, (a0)
; CHECK-NEXT: vsetvli zero, zero, e32, m4, ta, mu
; CHECK-NEXT: vfwsub.wf v8, v8, fa0		; CHECK-NEXT: vfwsub.wf v8, v8, fa0
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = load <16 x double>, <16 x double>* %x		%a = load <16 x double>, <16 x double>* %x
%b = insertelement <16 x float> poison, float %y, i32 0		%b = insertelement <16 x float> poison, float %y, i32 0
%c = shufflevector <16 x float> %b, <16 x float> poison, <16 x i32> zeroinitializer		%c = shufflevector <16 x float> %b, <16 x float> poison, <16 x i32> zeroinitializer
%d = fpext <16 x float> %c to <16 x double>		%d = fpext <16 x float> %c to <16 x double>
%e = fsub <16 x double> %a, %d		%e = fsub <16 x double> %a, %d
ret <16 x double> %e		ret <16 x double> %e
}		}

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-vwadd.ll

Show First 20 Lines • Show All 346 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%d = sext <32 x i32> %b to <32 x i64>		%d = sext <32 x i32> %b to <32 x i64>
%e = add <32 x i64> %c, %d		%e = add <32 x i64> %c, %d
ret <32 x i64> %e		ret <32 x i64> %e
}		}

define <2 x i32> @vwadd_v2i32_v2i8(<2 x i8>* %x, <2 x i8>* %y) {		define <2 x i32> @vwadd_v2i32_v2i8(<2 x i8>* %x, <2 x i8>* %y) {
; CHECK-LABEL: vwadd_v2i32_v2i8:		; CHECK-LABEL: vwadd_v2i32_v2i8:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 2, e8, mf8, ta, mu		; CHECK-NEXT: vsetivli zero, 2, e16, mf4, ta, mu
; CHECK-NEXT: vle8.v v8, (a1)		; CHECK-NEXT: vle8.v v8, (a1)
; CHECK-NEXT: vle8.v v9, (a0)		; CHECK-NEXT: vle8.v v9, (a0)
; CHECK-NEXT: vsetvli zero, zero, e16, mf4, ta, mu
; CHECK-NEXT: vsext.vf2 v10, v8		; CHECK-NEXT: vsext.vf2 v10, v8
; CHECK-NEXT: vsext.vf2 v11, v9		; CHECK-NEXT: vsext.vf2 v11, v9
; CHECK-NEXT: vwadd.vv v8, v11, v10		; CHECK-NEXT: vwadd.vv v8, v11, v10
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = load <2 x i8>, <2 x i8>* %x		%a = load <2 x i8>, <2 x i8>* %x
%b = load <2 x i8>, <2 x i8>* %y		%b = load <2 x i8>, <2 x i8>* %y
%c = sext <2 x i8> %a to <2 x i32>		%c = sext <2 x i8> %a to <2 x i32>
%d = sext <2 x i8> %b to <2 x i32>		%d = sext <2 x i8> %b to <2 x i32>
%e = add <2 x i32> %c, %d		%e = add <2 x i32> %c, %d
ret <2 x i32> %e		ret <2 x i32> %e
}		}

define <4 x i32> @vwadd_v4i32_v4i8_v4i16(<4 x i8>* %x, <4 x i16>* %y) {		define <4 x i32> @vwadd_v4i32_v4i8_v4i16(<4 x i8>* %x, <4 x i16>* %y) {
; CHECK-LABEL: vwadd_v4i32_v4i8_v4i16:		; CHECK-LABEL: vwadd_v4i32_v4i8_v4i16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 4, e8, mf4, ta, mu		; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, mu
; CHECK-NEXT: vle8.v v8, (a0)		; CHECK-NEXT: vle8.v v8, (a0)
; CHECK-NEXT: vle16.v v9, (a1)		; CHECK-NEXT: vle16.v v9, (a1)
; CHECK-NEXT: vsetvli zero, zero, e16, mf2, ta, mu
; CHECK-NEXT: vsext.vf2 v10, v8		; CHECK-NEXT: vsext.vf2 v10, v8
; CHECK-NEXT: vwadd.vv v8, v10, v9		; CHECK-NEXT: vwadd.vv v8, v10, v9
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = load <4 x i8>, <4 x i8>* %x		%a = load <4 x i8>, <4 x i8>* %x
%b = load <4 x i16>, <4 x i16>* %y		%b = load <4 x i16>, <4 x i16>* %y
%c = sext <4 x i8> %a to <4 x i32>		%c = sext <4 x i8> %a to <4 x i32>
%d = sext <4 x i16> %b to <4 x i32>		%d = sext <4 x i16> %b to <4 x i32>
%e = add <4 x i32> %c, %d		%e = add <4 x i32> %c, %d
▲ Show 20 Lines • Show All 481 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-vwaddu.ll

Show First 20 Lines • Show All 346 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%d = zext <32 x i32> %b to <32 x i64>		%d = zext <32 x i32> %b to <32 x i64>
%e = add <32 x i64> %c, %d		%e = add <32 x i64> %c, %d
ret <32 x i64> %e		ret <32 x i64> %e
}		}

define <2 x i32> @vwaddu_v2i32_v2i8(<2 x i8>* %x, <2 x i8>* %y) {		define <2 x i32> @vwaddu_v2i32_v2i8(<2 x i8>* %x, <2 x i8>* %y) {
; CHECK-LABEL: vwaddu_v2i32_v2i8:		; CHECK-LABEL: vwaddu_v2i32_v2i8:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 2, e8, mf8, ta, mu		; CHECK-NEXT: vsetivli zero, 2, e16, mf4, ta, mu
; CHECK-NEXT: vle8.v v8, (a1)		; CHECK-NEXT: vle8.v v8, (a1)
; CHECK-NEXT: vle8.v v9, (a0)		; CHECK-NEXT: vle8.v v9, (a0)
; CHECK-NEXT: vsetvli zero, zero, e16, mf4, ta, mu
; CHECK-NEXT: vzext.vf2 v10, v8		; CHECK-NEXT: vzext.vf2 v10, v8
; CHECK-NEXT: vzext.vf2 v11, v9		; CHECK-NEXT: vzext.vf2 v11, v9
; CHECK-NEXT: vwaddu.vv v8, v11, v10		; CHECK-NEXT: vwaddu.vv v8, v11, v10
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = load <2 x i8>, <2 x i8>* %x		%a = load <2 x i8>, <2 x i8>* %x
%b = load <2 x i8>, <2 x i8>* %y		%b = load <2 x i8>, <2 x i8>* %y
%c = zext <2 x i8> %a to <2 x i32>		%c = zext <2 x i8> %a to <2 x i32>
%d = zext <2 x i8> %b to <2 x i32>		%d = zext <2 x i8> %b to <2 x i32>
%e = add <2 x i32> %c, %d		%e = add <2 x i32> %c, %d
ret <2 x i32> %e		ret <2 x i32> %e
}		}

define <4 x i32> @vwaddu_v4i32_v4i8_v4i16(<4 x i8>* %x, <4 x i16>* %y) {		define <4 x i32> @vwaddu_v4i32_v4i8_v4i16(<4 x i8>* %x, <4 x i16>* %y) {
; CHECK-LABEL: vwaddu_v4i32_v4i8_v4i16:		; CHECK-LABEL: vwaddu_v4i32_v4i8_v4i16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 4, e8, mf4, ta, mu		; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, mu
; CHECK-NEXT: vle8.v v8, (a0)		; CHECK-NEXT: vle8.v v8, (a0)
; CHECK-NEXT: vle16.v v9, (a1)		; CHECK-NEXT: vle16.v v9, (a1)
; CHECK-NEXT: vsetvli zero, zero, e16, mf2, ta, mu
; CHECK-NEXT: vzext.vf2 v10, v8		; CHECK-NEXT: vzext.vf2 v10, v8
; CHECK-NEXT: vwaddu.vv v8, v10, v9		; CHECK-NEXT: vwaddu.vv v8, v10, v9
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = load <4 x i8>, <4 x i8>* %x		%a = load <4 x i8>, <4 x i8>* %x
%b = load <4 x i16>, <4 x i16>* %y		%b = load <4 x i16>, <4 x i16>* %y
%c = zext <4 x i8> %a to <4 x i32>		%c = zext <4 x i8> %a to <4 x i32>
%d = zext <4 x i16> %b to <4 x i32>		%d = zext <4 x i16> %b to <4 x i32>
%e = add <4 x i32> %c, %d		%e = add <4 x i32> %c, %d
▲ Show 20 Lines • Show All 478 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-vwmul.ll

Show First 20 Lines • Show All 349 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%d = sext <32 x i32> %b to <32 x i64>		%d = sext <32 x i32> %b to <32 x i64>
%e = mul <32 x i64> %c, %d		%e = mul <32 x i64> %c, %d
ret <32 x i64> %e		ret <32 x i64> %e
}		}

define <2 x i32> @vwmul_v2i32_v2i8(<2 x i8>* %x, <2 x i8>* %y) {		define <2 x i32> @vwmul_v2i32_v2i8(<2 x i8>* %x, <2 x i8>* %y) {
; CHECK-LABEL: vwmul_v2i32_v2i8:		; CHECK-LABEL: vwmul_v2i32_v2i8:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 2, e8, mf8, ta, mu		; CHECK-NEXT: vsetivli zero, 2, e16, mf4, ta, mu
; CHECK-NEXT: vle8.v v8, (a1)		; CHECK-NEXT: vle8.v v8, (a1)
; CHECK-NEXT: vle8.v v9, (a0)		; CHECK-NEXT: vle8.v v9, (a0)
; CHECK-NEXT: vsetvli zero, zero, e16, mf4, ta, mu
; CHECK-NEXT: vsext.vf2 v10, v8		; CHECK-NEXT: vsext.vf2 v10, v8
; CHECK-NEXT: vsext.vf2 v11, v9		; CHECK-NEXT: vsext.vf2 v11, v9
; CHECK-NEXT: vwmul.vv v8, v11, v10		; CHECK-NEXT: vwmul.vv v8, v11, v10
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = load <2 x i8>, <2 x i8>* %x		%a = load <2 x i8>, <2 x i8>* %x
%b = load <2 x i8>, <2 x i8>* %y		%b = load <2 x i8>, <2 x i8>* %y
%c = sext <2 x i8> %a to <2 x i32>		%c = sext <2 x i8> %a to <2 x i32>
%d = sext <2 x i8> %b to <2 x i32>		%d = sext <2 x i8> %b to <2 x i32>
%e = mul <2 x i32> %c, %d		%e = mul <2 x i32> %c, %d
ret <2 x i32> %e		ret <2 x i32> %e
}		}

define <4 x i32> @vwmul_v4i32_v4i8_v4i16(<4 x i8>* %x, <4 x i16>* %y) {		define <4 x i32> @vwmul_v4i32_v4i8_v4i16(<4 x i8>* %x, <4 x i16>* %y) {
; CHECK-LABEL: vwmul_v4i32_v4i8_v4i16:		; CHECK-LABEL: vwmul_v4i32_v4i8_v4i16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 4, e8, mf4, ta, mu		; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, mu
; CHECK-NEXT: vle8.v v8, (a0)		; CHECK-NEXT: vle8.v v8, (a0)
; CHECK-NEXT: vle16.v v9, (a1)		; CHECK-NEXT: vle16.v v9, (a1)
; CHECK-NEXT: vsetvli zero, zero, e16, mf2, ta, mu
; CHECK-NEXT: vsext.vf2 v10, v8		; CHECK-NEXT: vsext.vf2 v10, v8
; CHECK-NEXT: vwmul.vv v8, v10, v9		; CHECK-NEXT: vwmul.vv v8, v10, v9
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = load <4 x i8>, <4 x i8>* %x		%a = load <4 x i8>, <4 x i8>* %x
%b = load <4 x i16>, <4 x i16>* %y		%b = load <4 x i16>, <4 x i16>* %y
%c = sext <4 x i8> %a to <4 x i32>		%c = sext <4 x i8> %a to <4 x i32>
%d = sext <4 x i16> %b to <4 x i32>		%d = sext <4 x i16> %b to <4 x i32>
%e = mul <4 x i32> %c, %d		%e = mul <4 x i32> %c, %d
▲ Show 20 Lines • Show All 276 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%f = sext <8 x i8> %a to <8 x i16>		%f = sext <8 x i8> %a to <8 x i16>
%g = mul <8 x i16> %e, %f		%g = mul <8 x i16> %e, %f
ret <8 x i16> %g		ret <8 x i16> %g
}		}

define <8 x i16> @vwmul_vx_v8i16_i16(<8 x i8>* %x, i16* %y) {		define <8 x i16> @vwmul_vx_v8i16_i16(<8 x i8>* %x, i16* %y) {
; CHECK-LABEL: vwmul_vx_v8i16_i16:		; CHECK-LABEL: vwmul_vx_v8i16_i16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu		; CHECK-NEXT: vsetivli zero, 8, e16, m1, ta, mu
; CHECK-NEXT: vle8.v v8, (a0)		; CHECK-NEXT: vle8.v v8, (a0)
; CHECK-NEXT: lh a0, 0(a1)		; CHECK-NEXT: lh a0, 0(a1)
; CHECK-NEXT: vsetvli zero, zero, e16, m1, ta, mu
; CHECK-NEXT: vsext.vf2 v9, v8		; CHECK-NEXT: vsext.vf2 v9, v8
; CHECK-NEXT: vmul.vx v8, v9, a0		; CHECK-NEXT: vmul.vx v8, v9, a0
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = load <8 x i8>, <8 x i8>* %x		%a = load <8 x i8>, <8 x i8>* %x
%b = load i16, i16* %y		%b = load i16, i16* %y
%d = insertelement <8 x i16> poison, i16 %b, i32 0		%d = insertelement <8 x i16> poison, i16 %b, i32 0
%e = shufflevector <8 x i16> %d, <8 x i16> poison, <8 x i32> zeroinitializer		%e = shufflevector <8 x i16> %d, <8 x i16> poison, <8 x i32> zeroinitializer
%f = sext <8 x i8> %a to <8 x i16>		%f = sext <8 x i8> %a to <8 x i16>
Show All 35 Lines	; CHECK-NEXT: ret
%f = sext <4 x i16> %a to <4 x i32>		%f = sext <4 x i16> %a to <4 x i32>
%g = mul <4 x i32> %e, %f		%g = mul <4 x i32> %e, %f
ret <4 x i32> %g		ret <4 x i32> %g
}		}

define <4 x i32> @vwmul_vx_v4i32_i32(<4 x i16>* %x, i32* %y) {		define <4 x i32> @vwmul_vx_v4i32_i32(<4 x i16>* %x, i32* %y) {
; CHECK-LABEL: vwmul_vx_v4i32_i32:		; CHECK-LABEL: vwmul_vx_v4i32_i32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, mu		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; CHECK-NEXT: lw a0, 0(a1)		; CHECK-NEXT: lw a0, 0(a1)
; CHECK-NEXT: vsetvli zero, zero, e32, m1, ta, mu
; CHECK-NEXT: vsext.vf2 v9, v8		; CHECK-NEXT: vsext.vf2 v9, v8
; CHECK-NEXT: vmul.vx v8, v9, a0		; CHECK-NEXT: vmul.vx v8, v9, a0
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = load <4 x i16>, <4 x i16>* %x		%a = load <4 x i16>, <4 x i16>* %x
%b = load i32, i32* %y		%b = load i32, i32* %y
%d = insertelement <4 x i32> poison, i32 %b, i32 0		%d = insertelement <4 x i32> poison, i32 %b, i32 0
%e = shufflevector <4 x i32> %d, <4 x i32> poison, <4 x i32> zeroinitializer		%e = shufflevector <4 x i32> %d, <4 x i32> poison, <4 x i32> zeroinitializer
%f = sext <4 x i16> %a to <4 x i32>		%f = sext <4 x i16> %a to <4 x i32>
%g = mul <4 x i32> %e, %f		%g = mul <4 x i32> %e, %f
ret <4 x i32> %g		ret <4 x i32> %g
}		}

define <2 x i64> @vwmul_vx_v2i64_i8(<2 x i32>* %x, i8* %y) {		define <2 x i64> @vwmul_vx_v2i64_i8(<2 x i32>* %x, i8* %y) {
; RV32-LABEL: vwmul_vx_v2i64_i8:		; RV32-LABEL: vwmul_vx_v2i64_i8:
; RV32: # %bb.0:		; RV32: # %bb.0:
; RV32-NEXT: addi sp, sp, -16		; RV32-NEXT: addi sp, sp, -16
; RV32-NEXT: .cfi_def_cfa_offset 16		; RV32-NEXT: .cfi_def_cfa_offset 16
; RV32-NEXT: vsetivli zero, 2, e32, mf2, ta, mu		; RV32-NEXT: vsetivli zero, 2, e64, m1, ta, mu
; RV32-NEXT: lb a1, 0(a1)		; RV32-NEXT: lb a1, 0(a1)
; RV32-NEXT: vle32.v v8, (a0)		; RV32-NEXT: vle32.v v8, (a0)
; RV32-NEXT: srai a0, a1, 31		; RV32-NEXT: srai a0, a1, 31
; RV32-NEXT: sw a1, 8(sp)		; RV32-NEXT: sw a1, 8(sp)
; RV32-NEXT: sw a0, 12(sp)		; RV32-NEXT: sw a0, 12(sp)
; RV32-NEXT: addi a0, sp, 8		; RV32-NEXT: addi a0, sp, 8
; RV32-NEXT: vlse64.v v9, (a0), zero		; RV32-NEXT: vlse64.v v9, (a0), zero
; RV32-NEXT: vsetvli zero, zero, e64, m1, ta, mu
; RV32-NEXT: vsext.vf2 v10, v8		; RV32-NEXT: vsext.vf2 v10, v8
; RV32-NEXT: vmul.vv v8, v9, v10		; RV32-NEXT: vmul.vv v8, v9, v10
; RV32-NEXT: addi sp, sp, 16		; RV32-NEXT: addi sp, sp, 16
; RV32-NEXT: ret		; RV32-NEXT: ret
;		;
; RV64-LABEL: vwmul_vx_v2i64_i8:		; RV64-LABEL: vwmul_vx_v2i64_i8:
; RV64: # %bb.0:		; RV64: # %bb.0:
; RV64-NEXT: vsetivli zero, 2, e32, mf2, ta, mu		; RV64-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
Show All 11 Lines	; RV64-NEXT: ret
ret <2 x i64> %g		ret <2 x i64> %g
}		}

define <2 x i64> @vwmul_vx_v2i64_i16(<2 x i32>* %x, i16* %y) {		define <2 x i64> @vwmul_vx_v2i64_i16(<2 x i32>* %x, i16* %y) {
; RV32-LABEL: vwmul_vx_v2i64_i16:		; RV32-LABEL: vwmul_vx_v2i64_i16:
; RV32: # %bb.0:		; RV32: # %bb.0:
; RV32-NEXT: addi sp, sp, -16		; RV32-NEXT: addi sp, sp, -16
; RV32-NEXT: .cfi_def_cfa_offset 16		; RV32-NEXT: .cfi_def_cfa_offset 16
; RV32-NEXT: vsetivli zero, 2, e32, mf2, ta, mu		; RV32-NEXT: vsetivli zero, 2, e64, m1, ta, mu
; RV32-NEXT: lh a1, 0(a1)		; RV32-NEXT: lh a1, 0(a1)
; RV32-NEXT: vle32.v v8, (a0)		; RV32-NEXT: vle32.v v8, (a0)
; RV32-NEXT: srai a0, a1, 31		; RV32-NEXT: srai a0, a1, 31
; RV32-NEXT: sw a1, 8(sp)		; RV32-NEXT: sw a1, 8(sp)
; RV32-NEXT: sw a0, 12(sp)		; RV32-NEXT: sw a0, 12(sp)
; RV32-NEXT: addi a0, sp, 8		; RV32-NEXT: addi a0, sp, 8
; RV32-NEXT: vlse64.v v9, (a0), zero		; RV32-NEXT: vlse64.v v9, (a0), zero
; RV32-NEXT: vsetvli zero, zero, e64, m1, ta, mu
; RV32-NEXT: vsext.vf2 v10, v8		; RV32-NEXT: vsext.vf2 v10, v8
; RV32-NEXT: vmul.vv v8, v9, v10		; RV32-NEXT: vmul.vv v8, v9, v10
; RV32-NEXT: addi sp, sp, 16		; RV32-NEXT: addi sp, sp, 16
; RV32-NEXT: ret		; RV32-NEXT: ret
;		;
; RV64-LABEL: vwmul_vx_v2i64_i16:		; RV64-LABEL: vwmul_vx_v2i64_i16:
; RV64: # %bb.0:		; RV64: # %bb.0:
; RV64-NEXT: vsetivli zero, 2, e32, mf2, ta, mu		; RV64-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
Show All 11 Lines	; RV64-NEXT: ret
ret <2 x i64> %g		ret <2 x i64> %g
}		}

define <2 x i64> @vwmul_vx_v2i64_i32(<2 x i32>* %x, i32* %y) {		define <2 x i64> @vwmul_vx_v2i64_i32(<2 x i32>* %x, i32* %y) {
; RV32-LABEL: vwmul_vx_v2i64_i32:		; RV32-LABEL: vwmul_vx_v2i64_i32:
; RV32: # %bb.0:		; RV32: # %bb.0:
; RV32-NEXT: addi sp, sp, -16		; RV32-NEXT: addi sp, sp, -16
; RV32-NEXT: .cfi_def_cfa_offset 16		; RV32-NEXT: .cfi_def_cfa_offset 16
; RV32-NEXT: vsetivli zero, 2, e32, mf2, ta, mu		; RV32-NEXT: vsetivli zero, 2, e64, m1, ta, mu
; RV32-NEXT: lw a1, 0(a1)		; RV32-NEXT: lw a1, 0(a1)
; RV32-NEXT: vle32.v v8, (a0)		; RV32-NEXT: vle32.v v8, (a0)
; RV32-NEXT: srai a0, a1, 31		; RV32-NEXT: srai a0, a1, 31
; RV32-NEXT: sw a1, 8(sp)		; RV32-NEXT: sw a1, 8(sp)
; RV32-NEXT: sw a0, 12(sp)		; RV32-NEXT: sw a0, 12(sp)
; RV32-NEXT: addi a0, sp, 8		; RV32-NEXT: addi a0, sp, 8
; RV32-NEXT: vlse64.v v9, (a0), zero		; RV32-NEXT: vlse64.v v9, (a0), zero
; RV32-NEXT: vsetvli zero, zero, e64, m1, ta, mu
; RV32-NEXT: vsext.vf2 v10, v8		; RV32-NEXT: vsext.vf2 v10, v8
; RV32-NEXT: vmul.vv v8, v9, v10		; RV32-NEXT: vmul.vv v8, v9, v10
; RV32-NEXT: addi sp, sp, 16		; RV32-NEXT: addi sp, sp, 16
; RV32-NEXT: ret		; RV32-NEXT: ret
;		;
; RV64-LABEL: vwmul_vx_v2i64_i32:		; RV64-LABEL: vwmul_vx_v2i64_i32:
; RV64: # %bb.0:		; RV64: # %bb.0:
; RV64-NEXT: vsetivli zero, 2, e32, mf2, ta, mu		; RV64-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
Show All 11 Lines	; RV64-NEXT: ret
ret <2 x i64> %g		ret <2 x i64> %g
}		}

define <2 x i64> @vwmul_vx_v2i64_i64(<2 x i32>* %x, i64* %y) {		define <2 x i64> @vwmul_vx_v2i64_i64(<2 x i32>* %x, i64* %y) {
; RV32-LABEL: vwmul_vx_v2i64_i64:		; RV32-LABEL: vwmul_vx_v2i64_i64:
; RV32: # %bb.0:		; RV32: # %bb.0:
; RV32-NEXT: addi sp, sp, -16		; RV32-NEXT: addi sp, sp, -16
; RV32-NEXT: .cfi_def_cfa_offset 16		; RV32-NEXT: .cfi_def_cfa_offset 16
; RV32-NEXT: vsetivli zero, 2, e32, mf2, ta, mu		; RV32-NEXT: vsetivli zero, 2, e64, m1, ta, mu
; RV32-NEXT: lw a2, 4(a1)		; RV32-NEXT: lw a2, 4(a1)
; RV32-NEXT: lw a1, 0(a1)		; RV32-NEXT: lw a1, 0(a1)
; RV32-NEXT: vle32.v v8, (a0)		; RV32-NEXT: vle32.v v8, (a0)
; RV32-NEXT: sw a2, 12(sp)		; RV32-NEXT: sw a2, 12(sp)
; RV32-NEXT: sw a1, 8(sp)		; RV32-NEXT: sw a1, 8(sp)
; RV32-NEXT: addi a0, sp, 8		; RV32-NEXT: addi a0, sp, 8
; RV32-NEXT: vlse64.v v9, (a0), zero		; RV32-NEXT: vlse64.v v9, (a0), zero
; RV32-NEXT: vsetvli zero, zero, e64, m1, ta, mu
; RV32-NEXT: vsext.vf2 v10, v8		; RV32-NEXT: vsext.vf2 v10, v8
; RV32-NEXT: vmul.vv v8, v9, v10		; RV32-NEXT: vmul.vv v8, v9, v10
; RV32-NEXT: addi sp, sp, 16		; RV32-NEXT: addi sp, sp, 16
; RV32-NEXT: ret		; RV32-NEXT: ret
;		;
; RV64-LABEL: vwmul_vx_v2i64_i64:		; RV64-LABEL: vwmul_vx_v2i64_i64:
; RV64: # %bb.0:		; RV64: # %bb.0:
; RV64-NEXT: vsetivli zero, 2, e32, mf2, ta, mu		; RV64-NEXT: vsetivli zero, 2, e64, m1, ta, mu
; RV64-NEXT: vle32.v v8, (a0)		; RV64-NEXT: vle32.v v8, (a0)
; RV64-NEXT: ld a0, 0(a1)		; RV64-NEXT: ld a0, 0(a1)
; RV64-NEXT: vsetvli zero, zero, e64, m1, ta, mu
; RV64-NEXT: vsext.vf2 v9, v8		; RV64-NEXT: vsext.vf2 v9, v8
; RV64-NEXT: vmul.vx v8, v9, a0		; RV64-NEXT: vmul.vx v8, v9, a0
; RV64-NEXT: ret		; RV64-NEXT: ret
%a = load <2 x i32>, <2 x i32>* %x		%a = load <2 x i32>, <2 x i32>* %x
%b = load i64, i64* %y		%b = load i64, i64* %y
%d = insertelement <2 x i64> poison, i64 %b, i64 0		%d = insertelement <2 x i64> poison, i64 %b, i64 0
%e = shufflevector <2 x i64> %d, <2 x i64> poison, <2 x i32> zeroinitializer		%e = shufflevector <2 x i64> %d, <2 x i64> poison, <2 x i32> zeroinitializer
%f = sext <2 x i32> %a to <2 x i64>		%f = sext <2 x i32> %a to <2 x i64>
%g = mul <2 x i64> %e, %f		%g = mul <2 x i64> %e, %f
ret <2 x i64> %g		ret <2 x i64> %g
}		}

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-vwmulsu.ll

Show First 20 Lines • Show All 365 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%d = sext <32 x i32> %b to <32 x i64>		%d = sext <32 x i32> %b to <32 x i64>
%e = mul <32 x i64> %c, %d		%e = mul <32 x i64> %c, %d
ret <32 x i64> %e		ret <32 x i64> %e
}		}

define <2 x i32> @vwmulsu_v2i32_v2i8(<2 x i8>* %x, <2 x i8>* %y) {		define <2 x i32> @vwmulsu_v2i32_v2i8(<2 x i8>* %x, <2 x i8>* %y) {
; CHECK-LABEL: vwmulsu_v2i32_v2i8:		; CHECK-LABEL: vwmulsu_v2i32_v2i8:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 2, e8, mf8, ta, mu		; CHECK-NEXT: vsetivli zero, 2, e16, mf4, ta, mu
; CHECK-NEXT: vle8.v v8, (a0)		; CHECK-NEXT: vle8.v v8, (a0)
; CHECK-NEXT: vle8.v v9, (a1)		; CHECK-NEXT: vle8.v v9, (a1)
; CHECK-NEXT: vsetvli zero, zero, e16, mf4, ta, mu
; CHECK-NEXT: vzext.vf2 v10, v8		; CHECK-NEXT: vzext.vf2 v10, v8
; CHECK-NEXT: vsext.vf2 v11, v9		; CHECK-NEXT: vsext.vf2 v11, v9
; CHECK-NEXT: vwmulsu.vv v8, v11, v10		; CHECK-NEXT: vwmulsu.vv v8, v11, v10
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = load <2 x i8>, <2 x i8>* %x		%a = load <2 x i8>, <2 x i8>* %x
%b = load <2 x i8>, <2 x i8>* %y		%b = load <2 x i8>, <2 x i8>* %y
%c = zext <2 x i8> %a to <2 x i32>		%c = zext <2 x i8> %a to <2 x i32>
%d = sext <2 x i8> %b to <2 x i32>		%d = sext <2 x i8> %b to <2 x i32>
%e = mul <2 x i32> %c, %d		%e = mul <2 x i32> %c, %d
ret <2 x i32> %e		ret <2 x i32> %e
}		}

define <4 x i32> @vwmulsu_v4i32_v4i8_v4i16(<4 x i8>* %x, <4 x i16>* %y) {		define <4 x i32> @vwmulsu_v4i32_v4i8_v4i16(<4 x i8>* %x, <4 x i16>* %y) {
; CHECK-LABEL: vwmulsu_v4i32_v4i8_v4i16:		; CHECK-LABEL: vwmulsu_v4i32_v4i8_v4i16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 4, e8, mf4, ta, mu		; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, mu
; CHECK-NEXT: vle8.v v8, (a0)		; CHECK-NEXT: vle8.v v8, (a0)
; CHECK-NEXT: vle16.v v9, (a1)		; CHECK-NEXT: vle16.v v9, (a1)
; CHECK-NEXT: vsetvli zero, zero, e16, mf2, ta, mu
; CHECK-NEXT: vzext.vf2 v10, v8		; CHECK-NEXT: vzext.vf2 v10, v8
; CHECK-NEXT: vwmulsu.vv v8, v9, v10		; CHECK-NEXT: vwmulsu.vv v8, v9, v10
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = load <4 x i8>, <4 x i8>* %x		%a = load <4 x i8>, <4 x i8>* %x
%b = load <4 x i16>, <4 x i16>* %y		%b = load <4 x i16>, <4 x i16>* %y
%c = zext <4 x i8> %a to <4 x i32>		%c = zext <4 x i8> %a to <4 x i32>
%d = sext <4 x i16> %b to <4 x i32>		%d = sext <4 x i16> %b to <4 x i32>
%e = mul <4 x i32> %c, %d		%e = mul <4 x i32> %c, %d
▲ Show 20 Lines • Show All 293 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%f = sext <8 x i8> %a to <8 x i16>		%f = sext <8 x i8> %a to <8 x i16>
%g = mul <8 x i16> %e, %f		%g = mul <8 x i16> %e, %f
ret <8 x i16> %g		ret <8 x i16> %g
}		}

define <8 x i16> @vwmulsu_vx_v8i16_i8_swap(<8 x i8>* %x, i8* %y) {		define <8 x i16> @vwmulsu_vx_v8i16_i8_swap(<8 x i8>* %x, i8* %y) {
; CHECK-LABEL: vwmulsu_vx_v8i16_i8_swap:		; CHECK-LABEL: vwmulsu_vx_v8i16_i8_swap:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu		; CHECK-NEXT: vsetivli zero, 8, e16, m1, ta, mu
; CHECK-NEXT: vle8.v v8, (a0)		; CHECK-NEXT: vle8.v v8, (a0)
; CHECK-NEXT: lb a0, 0(a1)		; CHECK-NEXT: lb a0, 0(a1)
; CHECK-NEXT: vsetvli zero, zero, e16, m1, ta, mu
; CHECK-NEXT: vzext.vf2 v9, v8		; CHECK-NEXT: vzext.vf2 v9, v8
; CHECK-NEXT: vmul.vx v8, v9, a0		; CHECK-NEXT: vmul.vx v8, v9, a0
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = load <8 x i8>, <8 x i8>* %x		%a = load <8 x i8>, <8 x i8>* %x
%b = load i8, i8* %y		%b = load i8, i8* %y
%c = sext i8 %b to i16		%c = sext i8 %b to i16
%d = insertelement <8 x i16> poison, i16 %c, i32 0		%d = insertelement <8 x i16> poison, i16 %c, i32 0
%e = shufflevector <8 x i16> %d, <8 x i16> poison, <8 x i32> zeroinitializer		%e = shufflevector <8 x i16> %d, <8 x i16> poison, <8 x i32> zeroinitializer
Show All 38 Lines	; CHECK-NEXT: ret
ret <4 x i32> %g		ret <4 x i32> %g
}		}

define <2 x i64> @vwmulsu_vx_v2i64_i8(<2 x i32>* %x, i8* %y) {		define <2 x i64> @vwmulsu_vx_v2i64_i8(<2 x i32>* %x, i8* %y) {
; RV32-LABEL: vwmulsu_vx_v2i64_i8:		; RV32-LABEL: vwmulsu_vx_v2i64_i8:
; RV32: # %bb.0:		; RV32: # %bb.0:
; RV32-NEXT: addi sp, sp, -16		; RV32-NEXT: addi sp, sp, -16
; RV32-NEXT: .cfi_def_cfa_offset 16		; RV32-NEXT: .cfi_def_cfa_offset 16
; RV32-NEXT: vsetivli zero, 2, e32, mf2, ta, mu		; RV32-NEXT: vsetivli zero, 2, e64, m1, ta, mu
; RV32-NEXT: lbu a1, 0(a1)		; RV32-NEXT: lbu a1, 0(a1)
; RV32-NEXT: vle32.v v8, (a0)		; RV32-NEXT: vle32.v v8, (a0)
; RV32-NEXT: sw zero, 12(sp)		; RV32-NEXT: sw zero, 12(sp)
; RV32-NEXT: sw a1, 8(sp)		; RV32-NEXT: sw a1, 8(sp)
; RV32-NEXT: addi a0, sp, 8		; RV32-NEXT: addi a0, sp, 8
; RV32-NEXT: vlse64.v v9, (a0), zero		; RV32-NEXT: vlse64.v v9, (a0), zero
; RV32-NEXT: vsetvli zero, zero, e64, m1, ta, mu
; RV32-NEXT: vsext.vf2 v10, v8		; RV32-NEXT: vsext.vf2 v10, v8
; RV32-NEXT: vmul.vv v8, v9, v10		; RV32-NEXT: vmul.vv v8, v9, v10
; RV32-NEXT: addi sp, sp, 16		; RV32-NEXT: addi sp, sp, 16
; RV32-NEXT: ret		; RV32-NEXT: ret
;		;
; RV64-LABEL: vwmulsu_vx_v2i64_i8:		; RV64-LABEL: vwmulsu_vx_v2i64_i8:
; RV64: # %bb.0:		; RV64: # %bb.0:
; RV64-NEXT: vsetivli zero, 2, e32, mf2, ta, mu		; RV64-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
Show All 11 Lines	; RV64-NEXT: ret
ret <2 x i64> %g		ret <2 x i64> %g
}		}

define <2 x i64> @vwmulsu_vx_v2i64_i16(<2 x i32>* %x, i16* %y) {		define <2 x i64> @vwmulsu_vx_v2i64_i16(<2 x i32>* %x, i16* %y) {
; RV32-LABEL: vwmulsu_vx_v2i64_i16:		; RV32-LABEL: vwmulsu_vx_v2i64_i16:
; RV32: # %bb.0:		; RV32: # %bb.0:
; RV32-NEXT: addi sp, sp, -16		; RV32-NEXT: addi sp, sp, -16
; RV32-NEXT: .cfi_def_cfa_offset 16		; RV32-NEXT: .cfi_def_cfa_offset 16
; RV32-NEXT: vsetivli zero, 2, e32, mf2, ta, mu		; RV32-NEXT: vsetivli zero, 2, e64, m1, ta, mu
; RV32-NEXT: lhu a1, 0(a1)		; RV32-NEXT: lhu a1, 0(a1)
; RV32-NEXT: vle32.v v8, (a0)		; RV32-NEXT: vle32.v v8, (a0)
; RV32-NEXT: sw zero, 12(sp)		; RV32-NEXT: sw zero, 12(sp)
; RV32-NEXT: sw a1, 8(sp)		; RV32-NEXT: sw a1, 8(sp)
; RV32-NEXT: addi a0, sp, 8		; RV32-NEXT: addi a0, sp, 8
; RV32-NEXT: vlse64.v v9, (a0), zero		; RV32-NEXT: vlse64.v v9, (a0), zero
; RV32-NEXT: vsetvli zero, zero, e64, m1, ta, mu
; RV32-NEXT: vsext.vf2 v10, v8		; RV32-NEXT: vsext.vf2 v10, v8
; RV32-NEXT: vmul.vv v8, v9, v10		; RV32-NEXT: vmul.vv v8, v9, v10
; RV32-NEXT: addi sp, sp, 16		; RV32-NEXT: addi sp, sp, 16
; RV32-NEXT: ret		; RV32-NEXT: ret
;		;
; RV64-LABEL: vwmulsu_vx_v2i64_i16:		; RV64-LABEL: vwmulsu_vx_v2i64_i16:
; RV64: # %bb.0:		; RV64: # %bb.0:
; RV64-NEXT: vsetivli zero, 2, e32, mf2, ta, mu		; RV64-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
Show All 11 Lines	; RV64-NEXT: ret
ret <2 x i64> %g		ret <2 x i64> %g
}		}

define <2 x i64> @vwmulsu_vx_v2i64_i32(<2 x i32>* %x, i32* %y) {		define <2 x i64> @vwmulsu_vx_v2i64_i32(<2 x i32>* %x, i32* %y) {
; RV32-LABEL: vwmulsu_vx_v2i64_i32:		; RV32-LABEL: vwmulsu_vx_v2i64_i32:
; RV32: # %bb.0:		; RV32: # %bb.0:
; RV32-NEXT: addi sp, sp, -16		; RV32-NEXT: addi sp, sp, -16
; RV32-NEXT: .cfi_def_cfa_offset 16		; RV32-NEXT: .cfi_def_cfa_offset 16
; RV32-NEXT: vsetivli zero, 2, e32, mf2, ta, mu		; RV32-NEXT: vsetivli zero, 2, e64, m1, ta, mu
; RV32-NEXT: lw a1, 0(a1)		; RV32-NEXT: lw a1, 0(a1)
; RV32-NEXT: vle32.v v8, (a0)		; RV32-NEXT: vle32.v v8, (a0)
; RV32-NEXT: sw zero, 12(sp)		; RV32-NEXT: sw zero, 12(sp)
; RV32-NEXT: sw a1, 8(sp)		; RV32-NEXT: sw a1, 8(sp)
; RV32-NEXT: addi a0, sp, 8		; RV32-NEXT: addi a0, sp, 8
; RV32-NEXT: vlse64.v v9, (a0), zero		; RV32-NEXT: vlse64.v v9, (a0), zero
; RV32-NEXT: vsetvli zero, zero, e64, m1, ta, mu
; RV32-NEXT: vsext.vf2 v10, v8		; RV32-NEXT: vsext.vf2 v10, v8
; RV32-NEXT: vmul.vv v8, v9, v10		; RV32-NEXT: vmul.vv v8, v9, v10
; RV32-NEXT: addi sp, sp, 16		; RV32-NEXT: addi sp, sp, 16
; RV32-NEXT: ret		; RV32-NEXT: ret
;		;
; RV64-LABEL: vwmulsu_vx_v2i64_i32:		; RV64-LABEL: vwmulsu_vx_v2i64_i32:
; RV64: # %bb.0:		; RV64: # %bb.0:
; RV64-NEXT: vsetivli zero, 2, e32, mf2, ta, mu		; RV64-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
▲ Show 20 Lines • Show All 78 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-vwmulu.ll

Show First 20 Lines • Show All 349 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%d = zext <32 x i32> %b to <32 x i64>		%d = zext <32 x i32> %b to <32 x i64>
%e = mul <32 x i64> %c, %d		%e = mul <32 x i64> %c, %d
ret <32 x i64> %e		ret <32 x i64> %e
}		}

define <2 x i32> @vwmulu_v2i32_v2i8(<2 x i8>* %x, <2 x i8>* %y) {		define <2 x i32> @vwmulu_v2i32_v2i8(<2 x i8>* %x, <2 x i8>* %y) {
; CHECK-LABEL: vwmulu_v2i32_v2i8:		; CHECK-LABEL: vwmulu_v2i32_v2i8:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 2, e8, mf8, ta, mu		; CHECK-NEXT: vsetivli zero, 2, e16, mf4, ta, mu
; CHECK-NEXT: vle8.v v8, (a1)		; CHECK-NEXT: vle8.v v8, (a1)
; CHECK-NEXT: vle8.v v9, (a0)		; CHECK-NEXT: vle8.v v9, (a0)
; CHECK-NEXT: vsetvli zero, zero, e16, mf4, ta, mu
; CHECK-NEXT: vzext.vf2 v10, v8		; CHECK-NEXT: vzext.vf2 v10, v8
; CHECK-NEXT: vzext.vf2 v11, v9		; CHECK-NEXT: vzext.vf2 v11, v9
; CHECK-NEXT: vwmulu.vv v8, v11, v10		; CHECK-NEXT: vwmulu.vv v8, v11, v10
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = load <2 x i8>, <2 x i8>* %x		%a = load <2 x i8>, <2 x i8>* %x
%b = load <2 x i8>, <2 x i8>* %y		%b = load <2 x i8>, <2 x i8>* %y
%c = zext <2 x i8> %a to <2 x i32>		%c = zext <2 x i8> %a to <2 x i32>
%d = zext <2 x i8> %b to <2 x i32>		%d = zext <2 x i8> %b to <2 x i32>
%e = mul <2 x i32> %c, %d		%e = mul <2 x i32> %c, %d
ret <2 x i32> %e		ret <2 x i32> %e
}		}

define <4 x i32> @vwmulu_v4i32_v4i8_v4i16(<4 x i8>* %x, <4 x i16>* %y) {		define <4 x i32> @vwmulu_v4i32_v4i8_v4i16(<4 x i8>* %x, <4 x i16>* %y) {
; CHECK-LABEL: vwmulu_v4i32_v4i8_v4i16:		; CHECK-LABEL: vwmulu_v4i32_v4i8_v4i16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 4, e8, mf4, ta, mu		; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, mu
; CHECK-NEXT: vle8.v v8, (a0)		; CHECK-NEXT: vle8.v v8, (a0)
; CHECK-NEXT: vle16.v v9, (a1)		; CHECK-NEXT: vle16.v v9, (a1)
; CHECK-NEXT: vsetvli zero, zero, e16, mf2, ta, mu
; CHECK-NEXT: vzext.vf2 v10, v8		; CHECK-NEXT: vzext.vf2 v10, v8
; CHECK-NEXT: vwmulu.vv v8, v10, v9		; CHECK-NEXT: vwmulu.vv v8, v10, v9
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = load <4 x i8>, <4 x i8>* %x		%a = load <4 x i8>, <4 x i8>* %x
%b = load <4 x i16>, <4 x i16>* %y		%b = load <4 x i16>, <4 x i16>* %y
%c = zext <4 x i8> %a to <4 x i32>		%c = zext <4 x i8> %a to <4 x i32>
%d = zext <4 x i16> %b to <4 x i32>		%d = zext <4 x i16> %b to <4 x i32>
%e = mul <4 x i32> %c, %d		%e = mul <4 x i32> %c, %d
▲ Show 20 Lines • Show All 276 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%f = zext <8 x i8> %a to <8 x i16>		%f = zext <8 x i8> %a to <8 x i16>
%g = mul <8 x i16> %e, %f		%g = mul <8 x i16> %e, %f
ret <8 x i16> %g		ret <8 x i16> %g
}		}

define <8 x i16> @vwmulu_vx_v8i16_i16(<8 x i8>* %x, i16* %y) {		define <8 x i16> @vwmulu_vx_v8i16_i16(<8 x i8>* %x, i16* %y) {
; CHECK-LABEL: vwmulu_vx_v8i16_i16:		; CHECK-LABEL: vwmulu_vx_v8i16_i16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu		; CHECK-NEXT: vsetivli zero, 8, e16, m1, ta, mu
; CHECK-NEXT: vle8.v v8, (a0)		; CHECK-NEXT: vle8.v v8, (a0)
; CHECK-NEXT: lh a0, 0(a1)		; CHECK-NEXT: lh a0, 0(a1)
; CHECK-NEXT: vsetvli zero, zero, e16, m1, ta, mu
; CHECK-NEXT: vzext.vf2 v9, v8		; CHECK-NEXT: vzext.vf2 v9, v8
; CHECK-NEXT: vmul.vx v8, v9, a0		; CHECK-NEXT: vmul.vx v8, v9, a0
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = load <8 x i8>, <8 x i8>* %x		%a = load <8 x i8>, <8 x i8>* %x
%b = load i16, i16* %y		%b = load i16, i16* %y
%d = insertelement <8 x i16> poison, i16 %b, i32 0		%d = insertelement <8 x i16> poison, i16 %b, i32 0
%e = shufflevector <8 x i16> %d, <8 x i16> poison, <8 x i32> zeroinitializer		%e = shufflevector <8 x i16> %d, <8 x i16> poison, <8 x i32> zeroinitializer
%f = zext <8 x i8> %a to <8 x i16>		%f = zext <8 x i8> %a to <8 x i16>
Show All 35 Lines	; CHECK-NEXT: ret
%f = zext <4 x i16> %a to <4 x i32>		%f = zext <4 x i16> %a to <4 x i32>
%g = mul <4 x i32> %e, %f		%g = mul <4 x i32> %e, %f
ret <4 x i32> %g		ret <4 x i32> %g
}		}

define <4 x i32> @vwmulu_vx_v4i32_i32(<4 x i16>* %x, i32* %y) {		define <4 x i32> @vwmulu_vx_v4i32_i32(<4 x i16>* %x, i32* %y) {
; CHECK-LABEL: vwmulu_vx_v4i32_i32:		; CHECK-LABEL: vwmulu_vx_v4i32_i32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, mu		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: vle16.v v8, (a0)		; CHECK-NEXT: vle16.v v8, (a0)
; CHECK-NEXT: lw a0, 0(a1)		; CHECK-NEXT: lw a0, 0(a1)
; CHECK-NEXT: vsetvli zero, zero, e32, m1, ta, mu
; CHECK-NEXT: vzext.vf2 v9, v8		; CHECK-NEXT: vzext.vf2 v9, v8
; CHECK-NEXT: vmul.vx v8, v9, a0		; CHECK-NEXT: vmul.vx v8, v9, a0
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = load <4 x i16>, <4 x i16>* %x		%a = load <4 x i16>, <4 x i16>* %x
%b = load i32, i32* %y		%b = load i32, i32* %y
%d = insertelement <4 x i32> poison, i32 %b, i32 0		%d = insertelement <4 x i32> poison, i32 %b, i32 0
%e = shufflevector <4 x i32> %d, <4 x i32> poison, <4 x i32> zeroinitializer		%e = shufflevector <4 x i32> %d, <4 x i32> poison, <4 x i32> zeroinitializer
%f = zext <4 x i16> %a to <4 x i32>		%f = zext <4 x i16> %a to <4 x i32>
▲ Show 20 Lines • Show All 155 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-vwsub.ll

Show First 20 Lines • Show All 346 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%d = sext <32 x i32> %b to <32 x i64>		%d = sext <32 x i32> %b to <32 x i64>
%e = sub <32 x i64> %c, %d		%e = sub <32 x i64> %c, %d
ret <32 x i64> %e		ret <32 x i64> %e
}		}

define <2 x i32> @vwsub_v2i32_v2i8(<2 x i8>* %x, <2 x i8>* %y) {		define <2 x i32> @vwsub_v2i32_v2i8(<2 x i8>* %x, <2 x i8>* %y) {
; CHECK-LABEL: vwsub_v2i32_v2i8:		; CHECK-LABEL: vwsub_v2i32_v2i8:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 2, e8, mf8, ta, mu		; CHECK-NEXT: vsetivli zero, 2, e16, mf4, ta, mu
; CHECK-NEXT: vle8.v v8, (a1)		; CHECK-NEXT: vle8.v v8, (a1)
; CHECK-NEXT: vle8.v v9, (a0)		; CHECK-NEXT: vle8.v v9, (a0)
; CHECK-NEXT: vsetvli zero, zero, e16, mf4, ta, mu
; CHECK-NEXT: vsext.vf2 v10, v8		; CHECK-NEXT: vsext.vf2 v10, v8
; CHECK-NEXT: vsext.vf2 v11, v9		; CHECK-NEXT: vsext.vf2 v11, v9
; CHECK-NEXT: vwsub.vv v8, v11, v10		; CHECK-NEXT: vwsub.vv v8, v11, v10
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = load <2 x i8>, <2 x i8>* %x		%a = load <2 x i8>, <2 x i8>* %x
%b = load <2 x i8>, <2 x i8>* %y		%b = load <2 x i8>, <2 x i8>* %y
%c = sext <2 x i8> %a to <2 x i32>		%c = sext <2 x i8> %a to <2 x i32>
%d = sext <2 x i8> %b to <2 x i32>		%d = sext <2 x i8> %b to <2 x i32>
%e = sub <2 x i32> %c, %d		%e = sub <2 x i32> %c, %d
ret <2 x i32> %e		ret <2 x i32> %e
}		}

define <4 x i32> @vwsub_v4i32_v4i8_v4i16(<4 x i8>* %x, <4 x i16>* %y) {		define <4 x i32> @vwsub_v4i32_v4i8_v4i16(<4 x i8>* %x, <4 x i16>* %y) {
; CHECK-LABEL: vwsub_v4i32_v4i8_v4i16:		; CHECK-LABEL: vwsub_v4i32_v4i8_v4i16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 4, e8, mf4, ta, mu		; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, mu
; CHECK-NEXT: vle8.v v8, (a0)		; CHECK-NEXT: vle8.v v8, (a0)
; CHECK-NEXT: vle16.v v9, (a1)		; CHECK-NEXT: vle16.v v9, (a1)
; CHECK-NEXT: vsetvli zero, zero, e16, mf2, ta, mu
; CHECK-NEXT: vsext.vf2 v10, v8		; CHECK-NEXT: vsext.vf2 v10, v8
; CHECK-NEXT: vwsub.vv v8, v10, v9		; CHECK-NEXT: vwsub.vv v8, v10, v9
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = load <4 x i8>, <4 x i8>* %x		%a = load <4 x i8>, <4 x i8>* %x
%b = load <4 x i16>, <4 x i16>* %y		%b = load <4 x i16>, <4 x i16>* %y
%c = sext <4 x i8> %a to <4 x i32>		%c = sext <4 x i8> %a to <4 x i32>
%d = sext <4 x i16> %b to <4 x i32>		%d = sext <4 x i16> %b to <4 x i32>
%e = sub <4 x i32> %c, %d		%e = sub <4 x i32> %c, %d
▲ Show 20 Lines • Show All 258 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%e = sext <16 x i32> %c to <16 x i64>		%e = sext <16 x i32> %c to <16 x i64>
%f = sub <16 x i64> %d, %e		%f = sub <16 x i64> %d, %e
ret <16 x i64> %f		ret <16 x i64> %f
}		}

define <8 x i16> @vwsub_vx_v8i16_i8(<8 x i8>* %x, i8* %y) {		define <8 x i16> @vwsub_vx_v8i16_i8(<8 x i8>* %x, i8* %y) {
; CHECK-LABEL: vwsub_vx_v8i16_i8:		; CHECK-LABEL: vwsub_vx_v8i16_i8:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu		; CHECK-NEXT: vsetivli zero, 8, e16, m1, ta, mu
; CHECK-NEXT: lb a1, 0(a1)		; CHECK-NEXT: lb a1, 0(a1)
; CHECK-NEXT: vle8.v v9, (a0)		; CHECK-NEXT: vle8.v v9, (a0)
; CHECK-NEXT: vsetvli zero, zero, e16, m1, ta, mu
; CHECK-NEXT: vmv.v.x v10, a1		; CHECK-NEXT: vmv.v.x v10, a1
; CHECK-NEXT: vsetvli zero, zero, e8, mf2, ta, mu		; CHECK-NEXT: vsetvli zero, zero, e8, mf2, ta, mu
; CHECK-NEXT: vwsub.wv v8, v10, v9		; CHECK-NEXT: vwsub.wv v8, v10, v9
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = load <8 x i8>, <8 x i8>* %x		%a = load <8 x i8>, <8 x i8>* %x
%b = load i8, i8* %y		%b = load i8, i8* %y
%c = sext i8 %b to i16		%c = sext i8 %b to i16
%d = insertelement <8 x i16> poison, i16 %c, i32 0		%d = insertelement <8 x i16> poison, i16 %c, i32 0
Show All 18 Lines	; CHECK-NEXT: ret
%f = sext <8 x i8> %a to <8 x i16>		%f = sext <8 x i8> %a to <8 x i16>
%g = sub <8 x i16> %e, %f		%g = sub <8 x i16> %e, %f
ret <8 x i16> %g		ret <8 x i16> %g
}		}

define <4 x i32> @vwsub_vx_v4i32_i8(<4 x i16>* %x, i8* %y) {		define <4 x i32> @vwsub_vx_v4i32_i8(<4 x i16>* %x, i8* %y) {
; CHECK-LABEL: vwsub_vx_v4i32_i8:		; CHECK-LABEL: vwsub_vx_v4i32_i8:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, mu		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: lb a1, 0(a1)		; CHECK-NEXT: lb a1, 0(a1)
; CHECK-NEXT: vle16.v v9, (a0)		; CHECK-NEXT: vle16.v v9, (a0)
; CHECK-NEXT: vsetvli zero, zero, e32, m1, ta, mu
; CHECK-NEXT: vmv.v.x v10, a1		; CHECK-NEXT: vmv.v.x v10, a1
; CHECK-NEXT: vsetvli zero, zero, e16, mf2, ta, mu		; CHECK-NEXT: vsetvli zero, zero, e16, mf2, ta, mu
; CHECK-NEXT: vwsub.wv v8, v10, v9		; CHECK-NEXT: vwsub.wv v8, v10, v9
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = load <4 x i16>, <4 x i16>* %x		%a = load <4 x i16>, <4 x i16>* %x
%b = load i8, i8* %y		%b = load i8, i8* %y
%c = sext i8 %b to i32		%c = sext i8 %b to i32
%d = insertelement <4 x i32> poison, i32 %c, i32 0		%d = insertelement <4 x i32> poison, i32 %c, i32 0
%e = shufflevector <4 x i32> %d, <4 x i32> poison, <4 x i32> zeroinitializer		%e = shufflevector <4 x i32> %d, <4 x i32> poison, <4 x i32> zeroinitializer
%f = sext <4 x i16> %a to <4 x i32>		%f = sext <4 x i16> %a to <4 x i32>
%g = sub <4 x i32> %e, %f		%g = sub <4 x i32> %e, %f
ret <4 x i32> %g		ret <4 x i32> %g
}		}

define <4 x i32> @vwsub_vx_v4i32_i16(<4 x i16>* %x, i16* %y) {		define <4 x i32> @vwsub_vx_v4i32_i16(<4 x i16>* %x, i16* %y) {
; CHECK-LABEL: vwsub_vx_v4i32_i16:		; CHECK-LABEL: vwsub_vx_v4i32_i16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, mu		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: lh a1, 0(a1)		; CHECK-NEXT: lh a1, 0(a1)
; CHECK-NEXT: vle16.v v9, (a0)		; CHECK-NEXT: vle16.v v9, (a0)
; CHECK-NEXT: vsetvli zero, zero, e32, m1, ta, mu
; CHECK-NEXT: vmv.v.x v10, a1		; CHECK-NEXT: vmv.v.x v10, a1
; CHECK-NEXT: vsetvli zero, zero, e16, mf2, ta, mu		; CHECK-NEXT: vsetvli zero, zero, e16, mf2, ta, mu
; CHECK-NEXT: vwsub.wv v8, v10, v9		; CHECK-NEXT: vwsub.wv v8, v10, v9
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = load <4 x i16>, <4 x i16>* %x		%a = load <4 x i16>, <4 x i16>* %x
%b = load i16, i16* %y		%b = load i16, i16* %y
%c = sext i16 %b to i32		%c = sext i16 %b to i32
%d = insertelement <4 x i32> poison, i32 %c, i32 0		%d = insertelement <4 x i32> poison, i32 %c, i32 0
Show All 33 Lines
; RV32-NEXT: addi a0, sp, 8		; RV32-NEXT: addi a0, sp, 8
; RV32-NEXT: vlse64.v v10, (a0), zero		; RV32-NEXT: vlse64.v v10, (a0), zero
; RV32-NEXT: vwsub.wv v8, v10, v9		; RV32-NEXT: vwsub.wv v8, v10, v9
; RV32-NEXT: addi sp, sp, 16		; RV32-NEXT: addi sp, sp, 16
; RV32-NEXT: ret		; RV32-NEXT: ret
;		;
; RV64-LABEL: vwsub_vx_v2i64_i8:		; RV64-LABEL: vwsub_vx_v2i64_i8:
; RV64: # %bb.0:		; RV64: # %bb.0:
; RV64-NEXT: vsetivli zero, 2, e32, mf2, ta, mu		; RV64-NEXT: vsetivli zero, 2, e64, m1, ta, mu
; RV64-NEXT: lb a1, 0(a1)		; RV64-NEXT: lb a1, 0(a1)
; RV64-NEXT: vle32.v v9, (a0)		; RV64-NEXT: vle32.v v9, (a0)
; RV64-NEXT: vsetvli zero, zero, e64, m1, ta, mu
; RV64-NEXT: vmv.v.x v10, a1		; RV64-NEXT: vmv.v.x v10, a1
; RV64-NEXT: vsetvli zero, zero, e32, mf2, ta, mu		; RV64-NEXT: vsetvli zero, zero, e32, mf2, ta, mu
; RV64-NEXT: vwsub.wv v8, v10, v9		; RV64-NEXT: vwsub.wv v8, v10, v9
; RV64-NEXT: ret		; RV64-NEXT: ret
%a = load <2 x i32>, <2 x i32>* %x		%a = load <2 x i32>, <2 x i32>* %x
%b = load i8, i8* %y		%b = load i8, i8* %y
%c = sext i8 %b to i64		%c = sext i8 %b to i64
%d = insertelement <2 x i64> poison, i64 %c, i64 0		%d = insertelement <2 x i64> poison, i64 %c, i64 0
Show All 16 Lines
; RV32-NEXT: addi a0, sp, 8		; RV32-NEXT: addi a0, sp, 8
; RV32-NEXT: vlse64.v v10, (a0), zero		; RV32-NEXT: vlse64.v v10, (a0), zero
; RV32-NEXT: vwsub.wv v8, v10, v9		; RV32-NEXT: vwsub.wv v8, v10, v9
; RV32-NEXT: addi sp, sp, 16		; RV32-NEXT: addi sp, sp, 16
; RV32-NEXT: ret		; RV32-NEXT: ret
;		;
; RV64-LABEL: vwsub_vx_v2i64_i16:		; RV64-LABEL: vwsub_vx_v2i64_i16:
; RV64: # %bb.0:		; RV64: # %bb.0:
; RV64-NEXT: vsetivli zero, 2, e32, mf2, ta, mu		; RV64-NEXT: vsetivli zero, 2, e64, m1, ta, mu
; RV64-NEXT: lh a1, 0(a1)		; RV64-NEXT: lh a1, 0(a1)
; RV64-NEXT: vle32.v v9, (a0)		; RV64-NEXT: vle32.v v9, (a0)
; RV64-NEXT: vsetvli zero, zero, e64, m1, ta, mu
; RV64-NEXT: vmv.v.x v10, a1		; RV64-NEXT: vmv.v.x v10, a1
; RV64-NEXT: vsetvli zero, zero, e32, mf2, ta, mu		; RV64-NEXT: vsetvli zero, zero, e32, mf2, ta, mu
; RV64-NEXT: vwsub.wv v8, v10, v9		; RV64-NEXT: vwsub.wv v8, v10, v9
; RV64-NEXT: ret		; RV64-NEXT: ret
%a = load <2 x i32>, <2 x i32>* %x		%a = load <2 x i32>, <2 x i32>* %x
%b = load i16, i16* %y		%b = load i16, i16* %y
%c = sext i16 %b to i64		%c = sext i16 %b to i64
%d = insertelement <2 x i64> poison, i64 %c, i64 0		%d = insertelement <2 x i64> poison, i64 %c, i64 0
Show All 16 Lines
; RV32-NEXT: addi a0, sp, 8		; RV32-NEXT: addi a0, sp, 8
; RV32-NEXT: vlse64.v v10, (a0), zero		; RV32-NEXT: vlse64.v v10, (a0), zero
; RV32-NEXT: vwsub.wv v8, v10, v9		; RV32-NEXT: vwsub.wv v8, v10, v9
; RV32-NEXT: addi sp, sp, 16		; RV32-NEXT: addi sp, sp, 16
; RV32-NEXT: ret		; RV32-NEXT: ret
;		;
; RV64-LABEL: vwsub_vx_v2i64_i32:		; RV64-LABEL: vwsub_vx_v2i64_i32:
; RV64: # %bb.0:		; RV64: # %bb.0:
; RV64-NEXT: vsetivli zero, 2, e32, mf2, ta, mu		; RV64-NEXT: vsetivli zero, 2, e64, m1, ta, mu
; RV64-NEXT: lw a1, 0(a1)		; RV64-NEXT: lw a1, 0(a1)
; RV64-NEXT: vle32.v v9, (a0)		; RV64-NEXT: vle32.v v9, (a0)
; RV64-NEXT: vsetvli zero, zero, e64, m1, ta, mu
; RV64-NEXT: vmv.v.x v10, a1		; RV64-NEXT: vmv.v.x v10, a1
; RV64-NEXT: vsetvli zero, zero, e32, mf2, ta, mu		; RV64-NEXT: vsetvli zero, zero, e32, mf2, ta, mu
; RV64-NEXT: vwsub.wv v8, v10, v9		; RV64-NEXT: vwsub.wv v8, v10, v9
; RV64-NEXT: ret		; RV64-NEXT: ret
%a = load <2 x i32>, <2 x i32>* %x		%a = load <2 x i32>, <2 x i32>* %x
%b = load i32, i32* %y		%b = load i32, i32* %y
%c = sext i32 %b to i64		%c = sext i32 %b to i64
%d = insertelement <2 x i64> poison, i64 %c, i64 0		%d = insertelement <2 x i64> poison, i64 %c, i64 0
Show All 37 Lines

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-vwsubu.ll

Show First 20 Lines • Show All 346 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%d = zext <32 x i32> %b to <32 x i64>		%d = zext <32 x i32> %b to <32 x i64>
%e = sub <32 x i64> %c, %d		%e = sub <32 x i64> %c, %d
ret <32 x i64> %e		ret <32 x i64> %e
}		}

define <2 x i32> @vwsubu_v2i32_v2i8(<2 x i8>* %x, <2 x i8>* %y) {		define <2 x i32> @vwsubu_v2i32_v2i8(<2 x i8>* %x, <2 x i8>* %y) {
; CHECK-LABEL: vwsubu_v2i32_v2i8:		; CHECK-LABEL: vwsubu_v2i32_v2i8:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 2, e8, mf8, ta, mu		; CHECK-NEXT: vsetivli zero, 2, e16, mf4, ta, mu
; CHECK-NEXT: vle8.v v8, (a1)		; CHECK-NEXT: vle8.v v8, (a1)
; CHECK-NEXT: vle8.v v9, (a0)		; CHECK-NEXT: vle8.v v9, (a0)
; CHECK-NEXT: vsetvli zero, zero, e16, mf4, ta, mu
; CHECK-NEXT: vzext.vf2 v10, v8		; CHECK-NEXT: vzext.vf2 v10, v8
; CHECK-NEXT: vzext.vf2 v11, v9		; CHECK-NEXT: vzext.vf2 v11, v9
; CHECK-NEXT: vwsubu.vv v8, v11, v10		; CHECK-NEXT: vwsubu.vv v8, v11, v10
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = load <2 x i8>, <2 x i8>* %x		%a = load <2 x i8>, <2 x i8>* %x
%b = load <2 x i8>, <2 x i8>* %y		%b = load <2 x i8>, <2 x i8>* %y
%c = zext <2 x i8> %a to <2 x i32>		%c = zext <2 x i8> %a to <2 x i32>
%d = zext <2 x i8> %b to <2 x i32>		%d = zext <2 x i8> %b to <2 x i32>
%e = sub <2 x i32> %c, %d		%e = sub <2 x i32> %c, %d
ret <2 x i32> %e		ret <2 x i32> %e
}		}

define <4 x i32> @vwsubu_v4i32_v4i8_v4i16(<4 x i8>* %x, <4 x i16>* %y) {		define <4 x i32> @vwsubu_v4i32_v4i8_v4i16(<4 x i8>* %x, <4 x i16>* %y) {
; CHECK-LABEL: vwsubu_v4i32_v4i8_v4i16:		; CHECK-LABEL: vwsubu_v4i32_v4i8_v4i16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 4, e8, mf4, ta, mu		; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, mu
; CHECK-NEXT: vle8.v v8, (a0)		; CHECK-NEXT: vle8.v v8, (a0)
; CHECK-NEXT: vle16.v v9, (a1)		; CHECK-NEXT: vle16.v v9, (a1)
; CHECK-NEXT: vsetvli zero, zero, e16, mf2, ta, mu
; CHECK-NEXT: vzext.vf2 v10, v8		; CHECK-NEXT: vzext.vf2 v10, v8
; CHECK-NEXT: vwsubu.vv v8, v10, v9		; CHECK-NEXT: vwsubu.vv v8, v10, v9
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = load <4 x i8>, <4 x i8>* %x		%a = load <4 x i8>, <4 x i8>* %x
%b = load <4 x i16>, <4 x i16>* %y		%b = load <4 x i16>, <4 x i16>* %y
%c = zext <4 x i8> %a to <4 x i32>		%c = zext <4 x i8> %a to <4 x i32>
%d = zext <4 x i16> %b to <4 x i32>		%d = zext <4 x i16> %b to <4 x i32>
%e = sub <4 x i32> %c, %d		%e = sub <4 x i32> %c, %d
▲ Show 20 Lines • Show All 258 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%e = zext <16 x i32> %c to <16 x i64>		%e = zext <16 x i32> %c to <16 x i64>
%f = sub <16 x i64> %d, %e		%f = sub <16 x i64> %d, %e
ret <16 x i64> %f		ret <16 x i64> %f
}		}

define <8 x i16> @vwsubu_vx_v8i16_i8(<8 x i8>* %x, i8* %y) {		define <8 x i16> @vwsubu_vx_v8i16_i8(<8 x i8>* %x, i8* %y) {
; CHECK-LABEL: vwsubu_vx_v8i16_i8:		; CHECK-LABEL: vwsubu_vx_v8i16_i8:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu		; CHECK-NEXT: vsetivli zero, 8, e16, m1, ta, mu
; CHECK-NEXT: lbu a1, 0(a1)		; CHECK-NEXT: lbu a1, 0(a1)
; CHECK-NEXT: vle8.v v9, (a0)		; CHECK-NEXT: vle8.v v9, (a0)
; CHECK-NEXT: vsetvli zero, zero, e16, m1, ta, mu
; CHECK-NEXT: vmv.v.x v10, a1		; CHECK-NEXT: vmv.v.x v10, a1
; CHECK-NEXT: vsetvli zero, zero, e8, mf2, ta, mu		; CHECK-NEXT: vsetvli zero, zero, e8, mf2, ta, mu
; CHECK-NEXT: vwsubu.wv v8, v10, v9		; CHECK-NEXT: vwsubu.wv v8, v10, v9
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = load <8 x i8>, <8 x i8>* %x		%a = load <8 x i8>, <8 x i8>* %x
%b = load i8, i8* %y		%b = load i8, i8* %y
%c = zext i8 %b to i16		%c = zext i8 %b to i16
%d = insertelement <8 x i16> poison, i16 %c, i32 0		%d = insertelement <8 x i16> poison, i16 %c, i32 0
Show All 18 Lines	; CHECK-NEXT: ret
%f = zext <8 x i8> %a to <8 x i16>		%f = zext <8 x i8> %a to <8 x i16>
%g = sub <8 x i16> %e, %f		%g = sub <8 x i16> %e, %f
ret <8 x i16> %g		ret <8 x i16> %g
}		}

define <4 x i32> @vwsubu_vx_v4i32_i8(<4 x i16>* %x, i8* %y) {		define <4 x i32> @vwsubu_vx_v4i32_i8(<4 x i16>* %x, i8* %y) {
; CHECK-LABEL: vwsubu_vx_v4i32_i8:		; CHECK-LABEL: vwsubu_vx_v4i32_i8:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, mu		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: lbu a1, 0(a1)		; CHECK-NEXT: lbu a1, 0(a1)
; CHECK-NEXT: vle16.v v9, (a0)		; CHECK-NEXT: vle16.v v9, (a0)
; CHECK-NEXT: vsetvli zero, zero, e32, m1, ta, mu
; CHECK-NEXT: vmv.v.x v10, a1		; CHECK-NEXT: vmv.v.x v10, a1
; CHECK-NEXT: vsetvli zero, zero, e16, mf2, ta, mu		; CHECK-NEXT: vsetvli zero, zero, e16, mf2, ta, mu
; CHECK-NEXT: vwsubu.wv v8, v10, v9		; CHECK-NEXT: vwsubu.wv v8, v10, v9
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = load <4 x i16>, <4 x i16>* %x		%a = load <4 x i16>, <4 x i16>* %x
%b = load i8, i8* %y		%b = load i8, i8* %y
%c = zext i8 %b to i32		%c = zext i8 %b to i32
%d = insertelement <4 x i32> poison, i32 %c, i32 0		%d = insertelement <4 x i32> poison, i32 %c, i32 0
%e = shufflevector <4 x i32> %d, <4 x i32> poison, <4 x i32> zeroinitializer		%e = shufflevector <4 x i32> %d, <4 x i32> poison, <4 x i32> zeroinitializer
%f = zext <4 x i16> %a to <4 x i32>		%f = zext <4 x i16> %a to <4 x i32>
%g = sub <4 x i32> %e, %f		%g = sub <4 x i32> %e, %f
ret <4 x i32> %g		ret <4 x i32> %g
}		}

define <4 x i32> @vwsubu_vx_v4i32_i16(<4 x i16>* %x, i16* %y) {		define <4 x i32> @vwsubu_vx_v4i32_i16(<4 x i16>* %x, i16* %y) {
; CHECK-LABEL: vwsubu_vx_v4i32_i16:		; CHECK-LABEL: vwsubu_vx_v4i32_i16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, mu		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: lhu a1, 0(a1)		; CHECK-NEXT: lhu a1, 0(a1)
; CHECK-NEXT: vle16.v v9, (a0)		; CHECK-NEXT: vle16.v v9, (a0)
; CHECK-NEXT: vsetvli zero, zero, e32, m1, ta, mu
; CHECK-NEXT: vmv.v.x v10, a1		; CHECK-NEXT: vmv.v.x v10, a1
; CHECK-NEXT: vsetvli zero, zero, e16, mf2, ta, mu		; CHECK-NEXT: vsetvli zero, zero, e16, mf2, ta, mu
; CHECK-NEXT: vwsubu.wv v8, v10, v9		; CHECK-NEXT: vwsubu.wv v8, v10, v9
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = load <4 x i16>, <4 x i16>* %x		%a = load <4 x i16>, <4 x i16>* %x
%b = load i16, i16* %y		%b = load i16, i16* %y
%c = zext i16 %b to i32		%c = zext i16 %b to i32
%d = insertelement <4 x i32> poison, i32 %c, i32 0		%d = insertelement <4 x i32> poison, i32 %c, i32 0
Show All 32 Lines
; RV32-NEXT: addi a0, sp, 8		; RV32-NEXT: addi a0, sp, 8
; RV32-NEXT: vlse64.v v10, (a0), zero		; RV32-NEXT: vlse64.v v10, (a0), zero
; RV32-NEXT: vwsubu.wv v8, v10, v9		; RV32-NEXT: vwsubu.wv v8, v10, v9
; RV32-NEXT: addi sp, sp, 16		; RV32-NEXT: addi sp, sp, 16
; RV32-NEXT: ret		; RV32-NEXT: ret
;		;
; RV64-LABEL: vwsubu_vx_v2i64_i8:		; RV64-LABEL: vwsubu_vx_v2i64_i8:
; RV64: # %bb.0:		; RV64: # %bb.0:
; RV64-NEXT: vsetivli zero, 2, e32, mf2, ta, mu		; RV64-NEXT: vsetivli zero, 2, e64, m1, ta, mu
; RV64-NEXT: lbu a1, 0(a1)		; RV64-NEXT: lbu a1, 0(a1)
; RV64-NEXT: vle32.v v9, (a0)		; RV64-NEXT: vle32.v v9, (a0)
; RV64-NEXT: vsetvli zero, zero, e64, m1, ta, mu
; RV64-NEXT: vmv.v.x v10, a1		; RV64-NEXT: vmv.v.x v10, a1
; RV64-NEXT: vsetvli zero, zero, e32, mf2, ta, mu		; RV64-NEXT: vsetvli zero, zero, e32, mf2, ta, mu
; RV64-NEXT: vwsubu.wv v8, v10, v9		; RV64-NEXT: vwsubu.wv v8, v10, v9
; RV64-NEXT: ret		; RV64-NEXT: ret
%a = load <2 x i32>, <2 x i32>* %x		%a = load <2 x i32>, <2 x i32>* %x
%b = load i8, i8* %y		%b = load i8, i8* %y
%c = zext i8 %b to i64		%c = zext i8 %b to i64
%d = insertelement <2 x i64> poison, i64 %c, i64 0		%d = insertelement <2 x i64> poison, i64 %c, i64 0
Show All 15 Lines
; RV32-NEXT: addi a0, sp, 8		; RV32-NEXT: addi a0, sp, 8
; RV32-NEXT: vlse64.v v10, (a0), zero		; RV32-NEXT: vlse64.v v10, (a0), zero
; RV32-NEXT: vwsubu.wv v8, v10, v9		; RV32-NEXT: vwsubu.wv v8, v10, v9
; RV32-NEXT: addi sp, sp, 16		; RV32-NEXT: addi sp, sp, 16
; RV32-NEXT: ret		; RV32-NEXT: ret
;		;
; RV64-LABEL: vwsubu_vx_v2i64_i16:		; RV64-LABEL: vwsubu_vx_v2i64_i16:
; RV64: # %bb.0:		; RV64: # %bb.0:
; RV64-NEXT: vsetivli zero, 2, e32, mf2, ta, mu		; RV64-NEXT: vsetivli zero, 2, e64, m1, ta, mu
; RV64-NEXT: lhu a1, 0(a1)		; RV64-NEXT: lhu a1, 0(a1)
; RV64-NEXT: vle32.v v9, (a0)		; RV64-NEXT: vle32.v v9, (a0)
; RV64-NEXT: vsetvli zero, zero, e64, m1, ta, mu
; RV64-NEXT: vmv.v.x v10, a1		; RV64-NEXT: vmv.v.x v10, a1
; RV64-NEXT: vsetvli zero, zero, e32, mf2, ta, mu		; RV64-NEXT: vsetvli zero, zero, e32, mf2, ta, mu
; RV64-NEXT: vwsubu.wv v8, v10, v9		; RV64-NEXT: vwsubu.wv v8, v10, v9
; RV64-NEXT: ret		; RV64-NEXT: ret
%a = load <2 x i32>, <2 x i32>* %x		%a = load <2 x i32>, <2 x i32>* %x
%b = load i16, i16* %y		%b = load i16, i16* %y
%c = zext i16 %b to i64		%c = zext i16 %b to i64
%d = insertelement <2 x i64> poison, i64 %c, i64 0		%d = insertelement <2 x i64> poison, i64 %c, i64 0
Show All 15 Lines
; RV32-NEXT: addi a0, sp, 8		; RV32-NEXT: addi a0, sp, 8
; RV32-NEXT: vlse64.v v10, (a0), zero		; RV32-NEXT: vlse64.v v10, (a0), zero
; RV32-NEXT: vwsubu.wv v8, v10, v9		; RV32-NEXT: vwsubu.wv v8, v10, v9
; RV32-NEXT: addi sp, sp, 16		; RV32-NEXT: addi sp, sp, 16
; RV32-NEXT: ret		; RV32-NEXT: ret
;		;
; RV64-LABEL: vwsubu_vx_v2i64_i32:		; RV64-LABEL: vwsubu_vx_v2i64_i32:
; RV64: # %bb.0:		; RV64: # %bb.0:
; RV64-NEXT: vsetivli zero, 2, e32, mf2, ta, mu		; RV64-NEXT: vsetivli zero, 2, e64, m1, ta, mu
; RV64-NEXT: lwu a1, 0(a1)		; RV64-NEXT: lwu a1, 0(a1)
; RV64-NEXT: vle32.v v9, (a0)		; RV64-NEXT: vle32.v v9, (a0)
; RV64-NEXT: vsetvli zero, zero, e64, m1, ta, mu
; RV64-NEXT: vmv.v.x v10, a1		; RV64-NEXT: vmv.v.x v10, a1
; RV64-NEXT: vsetvli zero, zero, e32, mf2, ta, mu		; RV64-NEXT: vsetvli zero, zero, e32, mf2, ta, mu
; RV64-NEXT: vwsubu.wv v8, v10, v9		; RV64-NEXT: vwsubu.wv v8, v10, v9
; RV64-NEXT: ret		; RV64-NEXT: ret
%a = load <2 x i32>, <2 x i32>* %x		%a = load <2 x i32>, <2 x i32>* %x
%b = load i32, i32* %y		%b = load i32, i32* %y
%c = zext i32 %b to i64		%c = zext i32 %b to i64
%d = insertelement <2 x i64> poison, i64 %c, i64 0		%d = insertelement <2 x i64> poison, i64 %c, i64 0
Show All 37 Lines

llvm/test/CodeGen/RISCV/rvv/vsetvli-insert.mir

Show First 20 Lines • Show All 188 Lines • ▼ Show 20 Lines	body: \|
bb.0.entry:		bb.0.entry:
liveins: $x10, $x11		liveins: $x10, $x11

; CHECK-LABEL: name: load_zext		; CHECK-LABEL: name: load_zext
; CHECK: liveins: $x10, $x11		; CHECK: liveins: $x10, $x11
; CHECK-NEXT: {{ $}}		; CHECK-NEXT: {{ $}}
; CHECK-NEXT: [[COPY:%[0-9]+]]:gprnox0 = COPY $x11		; CHECK-NEXT: [[COPY:%[0-9]+]]:gprnox0 = COPY $x11
; CHECK-NEXT: [[COPY1:%[0-9]+]]:gpr = COPY $x10		; CHECK-NEXT: [[COPY1:%[0-9]+]]:gpr = COPY $x10
; CHECK-NEXT: dead $x0 = PseudoVSETVLI [[COPY]], 87 /* e32, mf2, ta, mu */, implicit-def $vl, implicit-def $vtype		; CHECK-NEXT: dead $x0 = PseudoVSETVLI [[COPY]], 88 /* e64, m1, ta, mu */, implicit-def $vl, implicit-def $vtype
; CHECK-NEXT: [[PseudoVLE32_V_MF2_:%[0-9]+]]:vr = PseudoVLE32_V_MF2 [[COPY1]], $noreg, 5 /* e32 */, implicit $vl, implicit $vtype		; CHECK-NEXT: [[PseudoVLE32_V_MF2_:%[0-9]+]]:vr = PseudoVLE32_V_MF2 [[COPY1]], $noreg, 5 /* e32 */, implicit $vl, implicit $vtype
; CHECK-NEXT: dead $x0 = PseudoVSETVLIX0 killed $x0, 88 /* e64, m1, ta, mu */, implicit-def $vl, implicit-def $vtype, implicit $vl
; CHECK-NEXT: early-clobber %3:vr = PseudoVZEXT_VF2_M1 killed [[PseudoVLE32_V_MF2_]], $noreg, 6 /* e64 */, implicit $vl, implicit $vtype		; CHECK-NEXT: early-clobber %3:vr = PseudoVZEXT_VF2_M1 killed [[PseudoVLE32_V_MF2_]], $noreg, 6 /* e64 */, implicit $vl, implicit $vtype
; CHECK-NEXT: $v8 = COPY %3		; CHECK-NEXT: $v8 = COPY %3
; CHECK-NEXT: PseudoRET implicit $v8		; CHECK-NEXT: PseudoRET implicit $v8
%1:gprnox0 = COPY $x11		%1:gprnox0 = COPY $x11
%0:gpr = COPY $x10		%0:gpr = COPY $x10
%2:vr = PseudoVLE32_V_MF2 %0, %1, 5		%2:vr = PseudoVLE32_V_MF2 %0, %1, 5
early-clobber %3:vr = PseudoVZEXT_VF2_M1 killed %2, %1, 6		early-clobber %3:vr = PseudoVZEXT_VF2_M1 killed %2, %1, 6
$v8 = COPY %3		$v8 = COPY %3
▲ Show 20 Lines • Show All 201 Lines • Show Last 20 Lines

This is an archive of the discontinued LLVM Phabricator instance.

[RISCV] Extend demanded field transform in InsertVSETVLI to VTYPE subfeildsClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 436907

llvm/lib/Target/RISCV/RISCVInsertVSETVLI.cpp

llvm/test/CodeGen/RISCV/rvv/extload-truncstore.ll

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-ctlz.ll

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-extload-truncstore.ll

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-fp-conv.ll

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-fp-shuffles.ll

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-fp.ll

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-fp2i.ll

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-i2fp.ll

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-int-exttrunc.ll

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-int-shuffles.ll

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-int-splat.ll

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-reduction-fp.ll

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-reduction-int.ll

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-vfwadd.ll

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-vfwsub.ll

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-vwadd.ll

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-vwaddu.ll

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-vwmul.ll

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-vwmulsu.ll

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-vwmulu.ll

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-vwsub.ll

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-vwsubu.ll

llvm/test/CodeGen/RISCV/rvv/vsetvli-insert.mir

[RISCV] Extend demanded field transform in InsertVSETVLI to VTYPE subfeilds
ClosedPublic