This is an archive of the discontinued LLVM Phabricator instance.

[RISCV] Use vslide1down lowering for two element non-constant build_vectors
ClosedPublic

Authored by reames on May 2 2023, 10:26 AM.

Download Raw Diff

Details

Reviewers

• l.frisken
craig.topper
asb
kito-cheng

Commits

rG9fc5af1b8466: [RISCV] Use vslide1down lowering for two element non-constant build_vectors

Summary

When the values are in GPRs, the vslide1down lowering is always better. We need to greatly improve the splat-and-mask cost model to handle constants in a meaningful way, so for now, limit this to non-constant vectors.

This does send the "partially constant" case down the vslide1down path. This could cause some regressions, though I don't see any in practice.

The cost modeling for the general case is annoyingly tricky. We have a great amount of inconsistency around immediate operands, and as a result, the exact constant and exact lowering choice matters a lot. I'm hoping that we get a "good enough" result without modeling this exactly, but we may need to do something analogous to getIntMatCost (i.e. a search w/costing).

Diff Detail

Repository: rG LLVM Github Monorepo

Event Timeline

reames created this revision.May 2 2023, 10:26 AM

Herald added a project: Restricted Project. · View Herald TranscriptMay 2 2023, 10:26 AM

Herald added subscribers: jobnoorman, luke, VincentWu and 29 others. · View Herald Transcript

reames requested review of this revision.May 2 2023, 10:26 AM

Herald added a project: Restricted Project. · View Herald TranscriptMay 2 2023, 10:26 AM

Herald added subscribers: • pcwang-thead, eopXD, MaskRay. · View Herald Transcript

Harbormaster completed remote builds in B229479: Diff 518788.May 2 2023, 11:59 AM

LGTM

This revision is now accepted and ready to land.May 2 2023, 9:27 PM

Closed by commit rG9fc5af1b8466: [RISCV] Use vslide1down lowering for two element non-constant build_vectors (authored by reames). · Explain WhyMay 3 2023, 7:35 AM

This revision was automatically updated to reflect the committed changes.

reames added a commit: rG9fc5af1b8466: [RISCV] Use vslide1down lowering for two element non-constant build_vectors.

reames mentioned this in D159332: [RISCV] Cap build vector cost to avoid quadratic cost at high LMULs.Aug 31 2023, 8:35 PM

reames mentioned this in rGde34d39b66c2: [RISCV] Cap build vector cost to avoid quadratic cost at high LMULs.Sep 5 2023, 9:04 AM

Revision Contents

Path

Size

llvm/

lib/

Target/

RISCV/

RISCVISelLowering.cpp

1 line

test/

CodeGen/

RISCV/

rvv/

fixed-vector-shuffle-reverse.ll

10 lines

fixed-vectors-bitcast.ll

10 lines

fixed-vectors-fp2i-sat.ll

40 lines

fixed-vectors-load.ll

7 lines

fixed-vectors-mask-buildvec.ll

12 lines

fixed-vectors-masked-scatter.ll

12 lines

fixed-vectors-store.ll

5 lines

fold-vector-cmp.ll

12 lines

Diff 519071

llvm/lib/Target/RISCV/RISCVISelLowering.cpp

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 3,151 Lines • ▼ Show 20 Lines	static SDValue lowerBUILD_VECTOR(SDValue Op, SelectionDAG &DAG,

assert(DominantValue && "Not expecting an all-undef BUILD_VECTOR");		assert(DominantValue && "Not expecting an all-undef BUILD_VECTOR");
unsigned NumDefElts = NumElts - NumUndefElts;		unsigned NumDefElts = NumElts - NumUndefElts;
unsigned DominantValueCountThreshold = NumDefElts <= 2 ? 0 : NumDefElts - 2;		unsigned DominantValueCountThreshold = NumDefElts <= 2 ? 0 : NumDefElts - 2;

// Don't perform this optimization when optimizing for size, since		// Don't perform this optimization when optimizing for size, since
// materializing elements and inserting them tends to cause code bloat.		// materializing elements and inserting them tends to cause code bloat.
if (!DAG.shouldOptForSize() && NumScalarLoads < NumElts &&		if (!DAG.shouldOptForSize() && NumScalarLoads < NumElts &&
		(NumElts != 2 \|\| ISD::isBuildVectorOfConstantSDNodes(Op.getNode())) &&
((MostCommonCount > DominantValueCountThreshold) \|\|		((MostCommonCount > DominantValueCountThreshold) \|\|
(ValueCounts.size() <= Log2_32(NumDefElts)))) {		(ValueCounts.size() <= Log2_32(NumDefElts)))) {
// Start by splatting the most common element.		// Start by splatting the most common element.
SDValue Vec = DAG.getSplatBuildVector(VT, DL, DominantValue);		SDValue Vec = DAG.getSplatBuildVector(VT, DL, DominantValue);

DenseSet<SDValue> Processed{DominantValue};		DenseSet<SDValue> Processed{DominantValue};
MVT SelMaskTy = VT.changeVectorElementType(MVT::i1);		MVT SelMaskTy = VT.changeVectorElementType(MVT::i1);
for (const auto &OpIdx : enumerate(Op->ops())) {		for (const auto &OpIdx : enumerate(Op->ops())) {
▲ Show 20 Lines • Show All 12,913 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/rvv/fixed-vector-shuffle-reverse.ll

	Show All 12 Lines
	define <2 x i1> @reverse_v2i1(<2 x i1> %a) {			define <2 x i1> @reverse_v2i1(<2 x i1> %a) {
	; CHECK-LABEL: reverse_v2i1:			; CHECK-LABEL: reverse_v2i1:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: vsetivli zero, 2, e8, mf8, ta, ma			; CHECK-NEXT: vsetivli zero, 2, e8, mf8, ta, ma
	; CHECK-NEXT: vmv.v.i v8, 0			; CHECK-NEXT: vmv.v.i v8, 0
	; CHECK-NEXT: vmerge.vim v8, v8, 1, v0			; CHECK-NEXT: vmerge.vim v8, v8, 1, v0
	; CHECK-NEXT: vslidedown.vi v8, v8, 1			; CHECK-NEXT: vslidedown.vi v8, v8, 1
	; CHECK-NEXT: vmv.x.s a0, v8			; CHECK-NEXT: vmv.x.s a0, v8
	; CHECK-NEXT: vfirst.m a1, v0			; CHECK-NEXT: vslide1down.vx v8, v8, a0
	; CHECK-NEXT: seqz a1, a1			; CHECK-NEXT: vfirst.m a0, v0
	; CHECK-NEXT: vmv.v.x v8, a1			; CHECK-NEXT: seqz a0, a0
	; CHECK-NEXT: vsetvli zero, zero, e8, mf8, tu, ma			; CHECK-NEXT: vslide1down.vx v8, v8, a0
	; CHECK-NEXT: vmv.s.x v8, a0
	; CHECK-NEXT: vsetvli zero, zero, e8, mf8, ta, ma
	; CHECK-NEXT: vand.vi v8, v8, 1			; CHECK-NEXT: vand.vi v8, v8, 1
	; CHECK-NEXT: vmsne.vi v0, v8, 0			; CHECK-NEXT: vmsne.vi v0, v8, 0
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%res = call <2 x i1> @llvm.experimental.vector.reverse.v2i1(<2 x i1> %a)			%res = call <2 x i1> @llvm.experimental.vector.reverse.v2i1(<2 x i1> %a)
	ret <2 x i1> %res			ret <2 x i1> %res
	}			}

	define <4 x i1> @reverse_v4i1(<4 x i1> %a) {			define <4 x i1> @reverse_v4i1(<4 x i1> %a) {
	▲ Show 20 Lines • Show All 3,300 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-bitcast.ll

	Show First 20 Lines • Show All 515 Lines • ▼ Show 20 Lines
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma
	; RV64-NEXT: vmv.s.x v8, a0			; RV64-NEXT: vmv.s.x v8, a0
	; RV64-NEXT: ret			; RV64-NEXT: ret
	;			;
	; RV32ELEN32-LABEL: bitcast_i64_v4i16:			; RV32ELEN32-LABEL: bitcast_i64_v4i16:
	; RV32ELEN32: # %bb.0:			; RV32ELEN32: # %bb.0:
	; RV32ELEN32-NEXT: vsetivli zero, 2, e32, m1, ta, ma			; RV32ELEN32-NEXT: vsetivli zero, 2, e32, m1, ta, ma
	; RV32ELEN32-NEXT: vmv.v.x v8, a1			; RV32ELEN32-NEXT: vslide1down.vx v8, v8, a0
	; RV32ELEN32-NEXT: vsetvli zero, zero, e32, m1, tu, ma			; RV32ELEN32-NEXT: vslide1down.vx v8, v8, a1
	; RV32ELEN32-NEXT: vmv.s.x v8, a0
	; RV32ELEN32-NEXT: ret			; RV32ELEN32-NEXT: ret
	;			;
	; RV64ELEN32-LABEL: bitcast_i64_v4i16:			; RV64ELEN32-LABEL: bitcast_i64_v4i16:
	; RV64ELEN32: # %bb.0:			; RV64ELEN32: # %bb.0:
	; RV64ELEN32-NEXT: addi sp, sp, -16			; RV64ELEN32-NEXT: addi sp, sp, -16
	; RV64ELEN32-NEXT: .cfi_def_cfa_offset 16			; RV64ELEN32-NEXT: .cfi_def_cfa_offset 16
	; RV64ELEN32-NEXT: sd a0, 8(sp)			; RV64ELEN32-NEXT: sd a0, 8(sp)
	; RV64ELEN32-NEXT: addi a0, sp, 8			; RV64ELEN32-NEXT: addi a0, sp, 8
	Show All 17 Lines
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma
	; RV64-NEXT: vmv.s.x v8, a0			; RV64-NEXT: vmv.s.x v8, a0
	; RV64-NEXT: ret			; RV64-NEXT: ret
	;			;
	; RV32ELEN32-LABEL: bitcast_i64_v2i32:			; RV32ELEN32-LABEL: bitcast_i64_v2i32:
	; RV32ELEN32: # %bb.0:			; RV32ELEN32: # %bb.0:
	; RV32ELEN32-NEXT: vsetivli zero, 2, e32, m1, ta, ma			; RV32ELEN32-NEXT: vsetivli zero, 2, e32, m1, ta, ma
	; RV32ELEN32-NEXT: vmv.v.x v8, a1			; RV32ELEN32-NEXT: vslide1down.vx v8, v8, a0
	; RV32ELEN32-NEXT: vsetvli zero, zero, e32, m1, tu, ma			; RV32ELEN32-NEXT: vslide1down.vx v8, v8, a1
	; RV32ELEN32-NEXT: vmv.s.x v8, a0
	; RV32ELEN32-NEXT: ret			; RV32ELEN32-NEXT: ret
	;			;
	; RV64ELEN32-LABEL: bitcast_i64_v2i32:			; RV64ELEN32-LABEL: bitcast_i64_v2i32:
	; RV64ELEN32: # %bb.0:			; RV64ELEN32: # %bb.0:
	; RV64ELEN32-NEXT: addi sp, sp, -16			; RV64ELEN32-NEXT: addi sp, sp, -16
	; RV64ELEN32-NEXT: .cfi_def_cfa_offset 16			; RV64ELEN32-NEXT: .cfi_def_cfa_offset 16
	; RV64ELEN32-NEXT: sd a0, 8(sp)			; RV64ELEN32-NEXT: sd a0, 8(sp)
	; RV64ELEN32-NEXT: addi a0, sp, 8			; RV64ELEN32-NEXT: addi a0, sp, 8
	Show All 28 Lines

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-fp2i-sat.ll

	Show First 20 Lines • Show All 185 Lines • ▼ Show 20 Lines
	}			}
	declare <2 x i64> @llvm.fptoui.sat.v2i64.v2f16(<2 x half>)			declare <2 x i64> @llvm.fptoui.sat.v2i64.v2f16(<2 x half>)

	define void @fp2si_v2f64_v2i8(ptr %x, ptr %y) {			define void @fp2si_v2f64_v2i8(ptr %x, ptr %y) {
	; RV32-LABEL: fp2si_v2f64_v2i8:			; RV32-LABEL: fp2si_v2f64_v2i8:
	; RV32: # %bb.0:			; RV32: # %bb.0:
	; RV32-NEXT: vsetivli zero, 2, e64, m1, ta, ma			; RV32-NEXT: vsetivli zero, 2, e64, m1, ta, ma
	; RV32-NEXT: vle64.v v8, (a0)			; RV32-NEXT: vle64.v v8, (a0)
	; RV32-NEXT: vfmv.f.s fa5, v8			; RV32-NEXT: vslidedown.vi v9, v8, 1
				; RV32-NEXT: vfmv.f.s fa5, v9
	; RV32-NEXT: lui a0, %hi(.LCPI10_0)			; RV32-NEXT: lui a0, %hi(.LCPI10_0)
	; RV32-NEXT: fld fa4, %lo(.LCPI10_0)(a0)			; RV32-NEXT: fld fa4, %lo(.LCPI10_0)(a0)
	; RV32-NEXT: lui a0, %hi(.LCPI10_1)			; RV32-NEXT: lui a0, %hi(.LCPI10_1)
	; RV32-NEXT: fld fa3, %lo(.LCPI10_1)(a0)			; RV32-NEXT: fld fa3, %lo(.LCPI10_1)(a0)
	; RV32-NEXT: feq.d a0, fa5, fa5			; RV32-NEXT: feq.d a0, fa5, fa5
	; RV32-NEXT: neg a0, a0			; RV32-NEXT: neg a0, a0
	; RV32-NEXT: fmax.d fa5, fa5, fa4			; RV32-NEXT: fmax.d fa5, fa5, fa4
	; RV32-NEXT: fmin.d fa5, fa5, fa3			; RV32-NEXT: fmin.d fa5, fa5, fa3
	; RV32-NEXT: fcvt.w.d a2, fa5, rtz			; RV32-NEXT: fcvt.w.d a2, fa5, rtz
	; RV32-NEXT: and a0, a0, a2			; RV32-NEXT: and a0, a0, a2
	; RV32-NEXT: vslidedown.vi v8, v8, 1
	; RV32-NEXT: vfmv.f.s fa5, v8			; RV32-NEXT: vfmv.f.s fa5, v8
	; RV32-NEXT: feq.d a2, fa5, fa5			; RV32-NEXT: feq.d a2, fa5, fa5
	; RV32-NEXT: neg a2, a2			; RV32-NEXT: neg a2, a2
	; RV32-NEXT: fmax.d fa5, fa5, fa4			; RV32-NEXT: fmax.d fa5, fa5, fa4
	; RV32-NEXT: fmin.d fa5, fa5, fa3			; RV32-NEXT: fmin.d fa5, fa5, fa3
	; RV32-NEXT: fcvt.w.d a3, fa5, rtz			; RV32-NEXT: fcvt.w.d a3, fa5, rtz
	; RV32-NEXT: and a2, a2, a3			; RV32-NEXT: and a2, a2, a3
	; RV32-NEXT: vsetvli zero, zero, e8, mf8, ta, ma			; RV32-NEXT: vsetvli zero, zero, e8, mf8, ta, ma
	; RV32-NEXT: vmv.v.x v8, a2			; RV32-NEXT: vslide1down.vx v8, v8, a2
	; RV32-NEXT: vsetvli zero, zero, e8, mf8, tu, ma			; RV32-NEXT: vslide1down.vx v8, v8, a0
	; RV32-NEXT: vmv.s.x v8, a0
	; RV32-NEXT: vse8.v v8, (a1)			; RV32-NEXT: vse8.v v8, (a1)
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: fp2si_v2f64_v2i8:			; RV64-LABEL: fp2si_v2f64_v2i8:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: vsetivli zero, 2, e64, m1, ta, ma			; RV64-NEXT: vsetivli zero, 2, e64, m1, ta, ma
	; RV64-NEXT: vle64.v v8, (a0)			; RV64-NEXT: vle64.v v8, (a0)
	; RV64-NEXT: vfmv.f.s fa5, v8			; RV64-NEXT: vslidedown.vi v9, v8, 1
				; RV64-NEXT: vfmv.f.s fa5, v9
	; RV64-NEXT: lui a0, %hi(.LCPI10_0)			; RV64-NEXT: lui a0, %hi(.LCPI10_0)
	; RV64-NEXT: fld fa4, %lo(.LCPI10_0)(a0)			; RV64-NEXT: fld fa4, %lo(.LCPI10_0)(a0)
	; RV64-NEXT: lui a0, %hi(.LCPI10_1)			; RV64-NEXT: lui a0, %hi(.LCPI10_1)
	; RV64-NEXT: fld fa3, %lo(.LCPI10_1)(a0)			; RV64-NEXT: fld fa3, %lo(.LCPI10_1)(a0)
	; RV64-NEXT: feq.d a0, fa5, fa5			; RV64-NEXT: feq.d a0, fa5, fa5
	; RV64-NEXT: neg a0, a0			; RV64-NEXT: neg a0, a0
	; RV64-NEXT: fmax.d fa5, fa5, fa4			; RV64-NEXT: fmax.d fa5, fa5, fa4
	; RV64-NEXT: fmin.d fa5, fa5, fa3			; RV64-NEXT: fmin.d fa5, fa5, fa3
	; RV64-NEXT: fcvt.l.d a2, fa5, rtz			; RV64-NEXT: fcvt.l.d a2, fa5, rtz
	; RV64-NEXT: and a0, a0, a2			; RV64-NEXT: and a0, a0, a2
	; RV64-NEXT: vslidedown.vi v8, v8, 1
	; RV64-NEXT: vfmv.f.s fa5, v8			; RV64-NEXT: vfmv.f.s fa5, v8
	; RV64-NEXT: feq.d a2, fa5, fa5			; RV64-NEXT: feq.d a2, fa5, fa5
	; RV64-NEXT: neg a2, a2			; RV64-NEXT: neg a2, a2
	; RV64-NEXT: fmax.d fa5, fa5, fa4			; RV64-NEXT: fmax.d fa5, fa5, fa4
	; RV64-NEXT: fmin.d fa5, fa5, fa3			; RV64-NEXT: fmin.d fa5, fa5, fa3
	; RV64-NEXT: fcvt.l.d a3, fa5, rtz			; RV64-NEXT: fcvt.l.d a3, fa5, rtz
	; RV64-NEXT: and a2, a2, a3			; RV64-NEXT: and a2, a2, a3
	; RV64-NEXT: vsetvli zero, zero, e8, mf8, ta, ma			; RV64-NEXT: vsetvli zero, zero, e8, mf8, ta, ma
	; RV64-NEXT: vmv.v.x v8, a2			; RV64-NEXT: vslide1down.vx v8, v8, a2
	; RV64-NEXT: vsetvli zero, zero, e8, mf8, tu, ma			; RV64-NEXT: vslide1down.vx v8, v8, a0
	; RV64-NEXT: vmv.s.x v8, a0
	; RV64-NEXT: vse8.v v8, (a1)			; RV64-NEXT: vse8.v v8, (a1)
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%a = load <2 x double>, ptr %x			%a = load <2 x double>, ptr %x
	%d = call <2 x i8> @llvm.fptosi.sat.v2i8.v2f64(<2 x double> %a)			%d = call <2 x i8> @llvm.fptosi.sat.v2i8.v2f64(<2 x double> %a)
	store <2 x i8> %d, ptr %y			store <2 x i8> %d, ptr %y
	ret void			ret void
	}			}
	declare <2 x i8> @llvm.fptosi.sat.v2i8.v2f64(<2 x double>)			declare <2 x i8> @llvm.fptosi.sat.v2i8.v2f64(<2 x double>)

	define void @fp2ui_v2f64_v2i8(ptr %x, ptr %y) {			define void @fp2ui_v2f64_v2i8(ptr %x, ptr %y) {
	; RV32-LABEL: fp2ui_v2f64_v2i8:			; RV32-LABEL: fp2ui_v2f64_v2i8:
	; RV32: # %bb.0:			; RV32: # %bb.0:
	; RV32-NEXT: vsetivli zero, 2, e64, m1, ta, ma			; RV32-NEXT: vsetivli zero, 2, e64, m1, ta, ma
	; RV32-NEXT: vle64.v v8, (a0)			; RV32-NEXT: vle64.v v8, (a0)
	; RV32-NEXT: lui a0, %hi(.LCPI11_0)			; RV32-NEXT: lui a0, %hi(.LCPI11_0)
	; RV32-NEXT: fld fa5, %lo(.LCPI11_0)(a0)			; RV32-NEXT: fld fa5, %lo(.LCPI11_0)(a0)
	; RV32-NEXT: vfmv.f.s fa4, v8			; RV32-NEXT: vfmv.f.s fa4, v8
	; RV32-NEXT: fcvt.d.w fa3, zero			; RV32-NEXT: fcvt.d.w fa3, zero
	; RV32-NEXT: fmax.d fa4, fa4, fa3			; RV32-NEXT: fmax.d fa4, fa4, fa3
	; RV32-NEXT: fmin.d fa4, fa4, fa5			; RV32-NEXT: fmin.d fa4, fa4, fa5
	; RV32-NEXT: fcvt.wu.d a0, fa4, rtz			; RV32-NEXT: fcvt.wu.d a0, fa4, rtz
				; RV32-NEXT: vsetvli zero, zero, e8, mf8, ta, ma
				; RV32-NEXT: vslide1down.vx v9, v8, a0
				; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma
	; RV32-NEXT: vslidedown.vi v8, v8, 1			; RV32-NEXT: vslidedown.vi v8, v8, 1
	; RV32-NEXT: vfmv.f.s fa4, v8			; RV32-NEXT: vfmv.f.s fa4, v8
	; RV32-NEXT: fmax.d fa4, fa4, fa3			; RV32-NEXT: fmax.d fa4, fa4, fa3
	; RV32-NEXT: fmin.d fa5, fa4, fa5			; RV32-NEXT: fmin.d fa5, fa4, fa5
	; RV32-NEXT: fcvt.wu.d a2, fa5, rtz			; RV32-NEXT: fcvt.wu.d a0, fa5, rtz
	; RV32-NEXT: vsetvli zero, zero, e8, mf8, ta, ma			; RV32-NEXT: vsetivli zero, 2, e8, mf8, ta, ma
	; RV32-NEXT: vmv.v.x v8, a2			; RV32-NEXT: vslide1down.vx v8, v9, a0
	; RV32-NEXT: vsetvli zero, zero, e8, mf8, tu, ma
	; RV32-NEXT: vmv.s.x v8, a0
	; RV32-NEXT: vse8.v v8, (a1)			; RV32-NEXT: vse8.v v8, (a1)
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: fp2ui_v2f64_v2i8:			; RV64-LABEL: fp2ui_v2f64_v2i8:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: vsetivli zero, 2, e64, m1, ta, ma			; RV64-NEXT: vsetivli zero, 2, e64, m1, ta, ma
	; RV64-NEXT: vle64.v v8, (a0)			; RV64-NEXT: vle64.v v8, (a0)
	; RV64-NEXT: lui a0, %hi(.LCPI11_0)			; RV64-NEXT: lui a0, %hi(.LCPI11_0)
	; RV64-NEXT: fld fa5, %lo(.LCPI11_0)(a0)			; RV64-NEXT: fld fa5, %lo(.LCPI11_0)(a0)
	; RV64-NEXT: vfmv.f.s fa4, v8			; RV64-NEXT: vfmv.f.s fa4, v8
	; RV64-NEXT: fmv.d.x fa3, zero			; RV64-NEXT: fmv.d.x fa3, zero
	; RV64-NEXT: fmax.d fa4, fa4, fa3			; RV64-NEXT: fmax.d fa4, fa4, fa3
	; RV64-NEXT: fmin.d fa4, fa4, fa5			; RV64-NEXT: fmin.d fa4, fa4, fa5
	; RV64-NEXT: fcvt.lu.d a0, fa4, rtz			; RV64-NEXT: fcvt.lu.d a0, fa4, rtz
				; RV64-NEXT: vsetvli zero, zero, e8, mf8, ta, ma
				; RV64-NEXT: vslide1down.vx v9, v8, a0
				; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma
	; RV64-NEXT: vslidedown.vi v8, v8, 1			; RV64-NEXT: vslidedown.vi v8, v8, 1
	; RV64-NEXT: vfmv.f.s fa4, v8			; RV64-NEXT: vfmv.f.s fa4, v8
	; RV64-NEXT: fmax.d fa4, fa4, fa3			; RV64-NEXT: fmax.d fa4, fa4, fa3
	; RV64-NEXT: fmin.d fa5, fa4, fa5			; RV64-NEXT: fmin.d fa5, fa4, fa5
	; RV64-NEXT: fcvt.lu.d a2, fa5, rtz			; RV64-NEXT: fcvt.lu.d a0, fa5, rtz
	; RV64-NEXT: vsetvli zero, zero, e8, mf8, ta, ma			; RV64-NEXT: vsetivli zero, 2, e8, mf8, ta, ma
	; RV64-NEXT: vmv.v.x v8, a2			; RV64-NEXT: vslide1down.vx v8, v9, a0
	; RV64-NEXT: vsetvli zero, zero, e8, mf8, tu, ma
	; RV64-NEXT: vmv.s.x v8, a0
	; RV64-NEXT: vse8.v v8, (a1)			; RV64-NEXT: vse8.v v8, (a1)
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%a = load <2 x double>, ptr %x			%a = load <2 x double>, ptr %x
	%d = call <2 x i8> @llvm.fptoui.sat.v2i8.v2f64(<2 x double> %a)			%d = call <2 x i8> @llvm.fptoui.sat.v2i8.v2f64(<2 x double> %a)
	store <2 x i8> %d, ptr %y			store <2 x i8> %d, ptr %y
	ret void			ret void
	}			}
	declare <2 x i8> @llvm.fptoui.sat.v2i8.v2f64(<2 x double>)			declare <2 x i8> @llvm.fptoui.sat.v2i8.v2f64(<2 x double>)
	▲ Show 20 Lines • Show All 388 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-load.ll

	Show First 20 Lines • Show All 134 Lines • ▼ Show 20 Lines
	; RV32-NEXT: sw a2, 8(a0)			; RV32-NEXT: sw a2, 8(a0)
	; RV32-NEXT: sw a3, 4(a0)			; RV32-NEXT: sw a3, 4(a0)
	; RV32-NEXT: sw a1, 0(a0)			; RV32-NEXT: sw a1, 0(a0)
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: load_v6f16:			; RV64-LABEL: load_v6f16:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: ld a2, 0(a1)			; RV64-NEXT: ld a2, 0(a1)
	; RV64-NEXT: addi a1, a1, 8
	; RV64-NEXT: vsetivli zero, 2, e64, m1, ta, ma			; RV64-NEXT: vsetivli zero, 2, e64, m1, ta, ma
	; RV64-NEXT: vlse64.v v8, (a1), zero			; RV64-NEXT: ld a1, 8(a1)
	; RV64-NEXT: vsetvli zero, zero, e64, m1, tu, ma			; RV64-NEXT: vslide1down.vx v8, v8, a2
	; RV64-NEXT: vmv.s.x v8, a2			; RV64-NEXT: vslide1down.vx v8, v8, a1
	; RV64-NEXT: sd a2, 0(a0)			; RV64-NEXT: sd a2, 0(a0)
	; RV64-NEXT: vslidedown.vi v8, v8, 2			; RV64-NEXT: vslidedown.vi v8, v8, 2
	; RV64-NEXT: addi a0, a0, 8			; RV64-NEXT: addi a0, a0, 8
	; RV64-NEXT: vsetivli zero, 1, e32, m1, ta, ma			; RV64-NEXT: vsetivli zero, 1, e32, m1, ta, ma
	; RV64-NEXT: vse32.v v8, (a0)			; RV64-NEXT: vse32.v v8, (a0)
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%x = load <6 x half>, ptr %p			%x = load <6 x half>, ptr %p
	ret <6 x half> %x			ret <6 x half> %x
	▲ Show 20 Lines • Show All 77 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-mask-buildvec.ll

Show First 20 Lines • Show All 48 Lines • ▼ Show 20 Lines	; ZVE32F-NEXT: ret
%1 = insertelement <1 x i1> poison, i1 %x, i32 0		%1 = insertelement <1 x i1> poison, i1 %x, i32 0
ret <1 x i1> %1		ret <1 x i1> %1
}		}

define <2 x i1> @buildvec_mask_nonconst_v2i1(i1 %x, i1 %y) {		define <2 x i1> @buildvec_mask_nonconst_v2i1(i1 %x, i1 %y) {
; CHECK-LABEL: buildvec_mask_nonconst_v2i1:		; CHECK-LABEL: buildvec_mask_nonconst_v2i1:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 2, e8, mf8, ta, ma		; CHECK-NEXT: vsetivli zero, 2, e8, mf8, ta, ma
; CHECK-NEXT: vmv.v.x v8, a1		; CHECK-NEXT: vslide1down.vx v8, v8, a0
; CHECK-NEXT: vsetvli zero, zero, e8, mf8, tu, ma		; CHECK-NEXT: vslide1down.vx v8, v8, a1
; CHECK-NEXT: vmv.s.x v8, a0
; CHECK-NEXT: vsetvli zero, zero, e8, mf8, ta, ma
; CHECK-NEXT: vand.vi v8, v8, 1		; CHECK-NEXT: vand.vi v8, v8, 1
; CHECK-NEXT: vmsne.vi v0, v8, 0		; CHECK-NEXT: vmsne.vi v0, v8, 0
; CHECK-NEXT: ret		; CHECK-NEXT: ret
;		;
; ZVE32F-LABEL: buildvec_mask_nonconst_v2i1:		; ZVE32F-LABEL: buildvec_mask_nonconst_v2i1:
; ZVE32F: # %bb.0:		; ZVE32F: # %bb.0:
; ZVE32F-NEXT: vsetivli zero, 2, e8, mf4, ta, ma		; ZVE32F-NEXT: vsetivli zero, 2, e8, mf4, ta, ma
; ZVE32F-NEXT: vmv.v.x v8, a1		; ZVE32F-NEXT: vslide1down.vx v8, v8, a0
; ZVE32F-NEXT: vsetvli zero, zero, e8, mf4, tu, ma		; ZVE32F-NEXT: vslide1down.vx v8, v8, a1
; ZVE32F-NEXT: vmv.s.x v8, a0
; ZVE32F-NEXT: vsetvli zero, zero, e8, mf4, ta, ma
; ZVE32F-NEXT: vand.vi v8, v8, 1		; ZVE32F-NEXT: vand.vi v8, v8, 1
; ZVE32F-NEXT: vmsne.vi v0, v8, 0		; ZVE32F-NEXT: vmsne.vi v0, v8, 0
; ZVE32F-NEXT: ret		; ZVE32F-NEXT: ret
%1 = insertelement <2 x i1> poison, i1 %x, i32 0		%1 = insertelement <2 x i1> poison, i1 %x, i32 0
%2 = insertelement <2 x i1> %1, i1 %y, i32 1		%2 = insertelement <2 x i1> %1, i1 %y, i32 1
ret <2 x i1> %2		ret <2 x i1> %2
}		}

▲ Show 20 Lines • Show All 835 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-masked-scatter.ll

This file is larger than 256 KB, so syntax highlighting is disabled by default.

	Show First 20 Lines • Show All 1,661 Lines • ▼ Show 20 Lines
	; RV64-NEXT: vsetivli zero, 2, e32, mf2, ta, ma			; RV64-NEXT: vsetivli zero, 2, e32, mf2, ta, ma
	; RV64-NEXT: vnsrl.wi v8, v8, 0			; RV64-NEXT: vnsrl.wi v8, v8, 0
	; RV64-NEXT: vsoxei64.v v8, (zero), v9, v0.t			; RV64-NEXT: vsoxei64.v v8, (zero), v9, v0.t
	; RV64-NEXT: ret			; RV64-NEXT: ret
	;			;
	; RV32ZVE32F-LABEL: mscatter_v2i64_truncstore_v2i32:			; RV32ZVE32F-LABEL: mscatter_v2i64_truncstore_v2i32:
	; RV32ZVE32F: # %bb.0:			; RV32ZVE32F: # %bb.0:
	; RV32ZVE32F-NEXT: lw a1, 0(a0)			; RV32ZVE32F-NEXT: lw a1, 0(a0)
	; RV32ZVE32F-NEXT: addi a0, a0, 8			; RV32ZVE32F-NEXT: lw a0, 8(a0)
	; RV32ZVE32F-NEXT: vsetivli zero, 2, e32, m1, ta, ma			; RV32ZVE32F-NEXT: vsetivli zero, 2, e32, m1, ta, ma
	; RV32ZVE32F-NEXT: vlse32.v v9, (a0), zero			; RV32ZVE32F-NEXT: vslide1down.vx v9, v8, a1
	; RV32ZVE32F-NEXT: vsetvli zero, zero, e32, m1, tu, ma			; RV32ZVE32F-NEXT: vslide1down.vx v9, v9, a0
	; RV32ZVE32F-NEXT: vmv.s.x v9, a1
	; RV32ZVE32F-NEXT: vsoxei32.v v9, (zero), v8, v0.t			; RV32ZVE32F-NEXT: vsoxei32.v v9, (zero), v8, v0.t
	; RV32ZVE32F-NEXT: ret			; RV32ZVE32F-NEXT: ret
	;			;
	; RV64ZVE32F-LABEL: mscatter_v2i64_truncstore_v2i32:			; RV64ZVE32F-LABEL: mscatter_v2i64_truncstore_v2i32:
	; RV64ZVE32F: # %bb.0:			; RV64ZVE32F: # %bb.0:
	; RV64ZVE32F-NEXT: vsetivli zero, 2, e32, m1, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 2, e32, m1, ta, ma
	; RV64ZVE32F-NEXT: vmv.v.x v8, a1			; RV64ZVE32F-NEXT: vslide1down.vx v8, v8, a0
	; RV64ZVE32F-NEXT: vsetvli zero, zero, e32, m1, tu, ma			; RV64ZVE32F-NEXT: vslide1down.vx v8, v8, a1
	; RV64ZVE32F-NEXT: vmv.s.x v8, a0
	; RV64ZVE32F-NEXT: vsetvli zero, zero, e8, mf4, ta, ma			; RV64ZVE32F-NEXT: vsetvli zero, zero, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: vmv.x.s a0, v0			; RV64ZVE32F-NEXT: vmv.x.s a0, v0
	; RV64ZVE32F-NEXT: andi a1, a0, 1			; RV64ZVE32F-NEXT: andi a1, a0, 1
	; RV64ZVE32F-NEXT: bnez a1, .LBB24_3			; RV64ZVE32F-NEXT: bnez a1, .LBB24_3
	; RV64ZVE32F-NEXT: # %bb.1: # %else			; RV64ZVE32F-NEXT: # %bb.1: # %else
	; RV64ZVE32F-NEXT: andi a0, a0, 2			; RV64ZVE32F-NEXT: andi a0, a0, 2
	; RV64ZVE32F-NEXT: bnez a0, .LBB24_4			; RV64ZVE32F-NEXT: bnez a0, .LBB24_4
	; RV64ZVE32F-NEXT: .LBB24_2: # %else2			; RV64ZVE32F-NEXT: .LBB24_2: # %else2
	▲ Show 20 Lines • Show All 9,516 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-store.ll

	Show First 20 Lines • Show All 145 Lines • ▼ Show 20 Lines
	; RV64-NEXT: lhu a1, 32(a1)			; RV64-NEXT: lhu a1, 32(a1)
	; RV64-NEXT: srli a4, a4, 32			; RV64-NEXT: srli a4, a4, 32
	; RV64-NEXT: or a2, a4, a2			; RV64-NEXT: or a2, a4, a2
	; RV64-NEXT: slli a3, a3, 16			; RV64-NEXT: slli a3, a3, 16
	; RV64-NEXT: or a1, a1, a3			; RV64-NEXT: or a1, a1, a3
	; RV64-NEXT: slli a1, a1, 32			; RV64-NEXT: slli a1, a1, 32
	; RV64-NEXT: srli a1, a1, 32			; RV64-NEXT: srli a1, a1, 32
	; RV64-NEXT: vsetivli zero, 2, e64, m1, ta, ma			; RV64-NEXT: vsetivli zero, 2, e64, m1, ta, ma
	; RV64-NEXT: vmv.v.x v8, a1			; RV64-NEXT: vslide1down.vx v8, v8, a2
	; RV64-NEXT: vsetvli zero, zero, e64, m1, tu, ma			; RV64-NEXT: vslide1down.vx v8, v8, a1
	; RV64-NEXT: vmv.s.x v8, a2
	; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma
	; RV64-NEXT: vse64.v v8, (a0)			; RV64-NEXT: vse64.v v8, (a0)
	; RV64-NEXT: vslidedown.vi v8, v8, 2			; RV64-NEXT: vslidedown.vi v8, v8, 2
	; RV64-NEXT: addi a0, a0, 8			; RV64-NEXT: addi a0, a0, 8
	; RV64-NEXT: vsetivli zero, 1, e32, m1, ta, ma			; RV64-NEXT: vsetivli zero, 1, e32, m1, ta, ma
	; RV64-NEXT: vse32.v v8, (a0)			; RV64-NEXT: vse32.v v8, (a0)
	; RV64-NEXT: ret			; RV64-NEXT: ret
	store <6 x half> %v, ptr %p			store <6 x half> %v, ptr %p
	▲ Show 20 Lines • Show All 66 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/rvv/fold-vector-cmp.ll

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: llc -start-after codegenprepare -mtriple=riscv64 -mattr=-v -o - %s \| FileCheck --check-prefix=CHECK-NOV %s			; RUN: llc -start-after codegenprepare -mtriple=riscv64 -mattr=-v -o - %s \| FileCheck --check-prefix=CHECK-NOV %s
	; RUN: llc -start-after codegenprepare -mtriple=riscv64 -mattr=+v -o - %s \| FileCheck --check-prefix=CHECK-V %s			; RUN: llc -start-after codegenprepare -mtriple=riscv64 -mattr=+v -o - %s \| FileCheck --check-prefix=CHECK-V %s

	; Reproducer for https://github.com/llvm/llvm-project/issues/55168.			; Reproducer for https://github.com/llvm/llvm-project/issues/55168.
	; We should always return 1 (and not -1).			; We should always return 1 (and not -1).
	define i32 @test(i32 %call.i) {			define i32 @test(i32 %call.i) {
	; CHECK-NOV-LABEL: test:			; CHECK-NOV-LABEL: test:
	; CHECK-NOV: # %bb.0:			; CHECK-NOV: # %bb.0:
	; CHECK-NOV-NEXT: li a0, 1			; CHECK-NOV-NEXT: li a0, 1
	; CHECK-NOV-NEXT: ret			; CHECK-NOV-NEXT: ret
	;			;
	; CHECK-V-LABEL: test:			; CHECK-V-LABEL: test:
	; CHECK-V: # %bb.0:			; CHECK-V: # %bb.0:
	; CHECK-V-NEXT: lui a1, 524288
	; CHECK-V-NEXT: vsetivli zero, 2, e32, mf2, ta, ma			; CHECK-V-NEXT: vsetivli zero, 2, e32, mf2, ta, ma
	; CHECK-V-NEXT: vmv.v.x v8, a1			; CHECK-V-NEXT: vslide1down.vx v8, v8, a0
	; CHECK-V-NEXT: vsetvli zero, zero, e32, mf2, tu, ma			; CHECK-V-NEXT: lui a0, 524288
	; CHECK-V-NEXT: vmv.s.x v8, a0			; CHECK-V-NEXT: vslide1down.vx v8, v8, a0
	; CHECK-V-NEXT: addiw a1, a1, 2			; CHECK-V-NEXT: addiw a0, a0, 2
	; CHECK-V-NEXT: vsetvli zero, zero, e32, mf2, ta, ma			; CHECK-V-NEXT: vmslt.vx v0, v8, a0
	; CHECK-V-NEXT: vmslt.vx v0, v8, a1
	; CHECK-V-NEXT: vmv.v.i v8, 0			; CHECK-V-NEXT: vmv.v.i v8, 0
	; CHECK-V-NEXT: vmerge.vim v8, v8, 1, v0			; CHECK-V-NEXT: vmerge.vim v8, v8, 1, v0
	; CHECK-V-NEXT: vslidedown.vi v8, v8, 1			; CHECK-V-NEXT: vslidedown.vi v8, v8, 1
	; CHECK-V-NEXT: vmv.x.s a0, v8			; CHECK-V-NEXT: vmv.x.s a0, v8
	; CHECK-V-NEXT: ret			; CHECK-V-NEXT: ret
	%t2 = insertelement <2 x i32> <i32 poison, i32 -2147483648>, i32 %call.i, i64 0			%t2 = insertelement <2 x i32> <i32 poison, i32 -2147483648>, i32 %call.i, i64 0
	%t3 = icmp slt <2 x i32> %t2, <i32 -2147483646, i32 -2147483646>			%t3 = icmp slt <2 x i32> %t2, <i32 -2147483646, i32 -2147483646>
	%t4 = zext <2 x i1> %t3 to <2 x i32>			%t4 = zext <2 x i1> %t3 to <2 x i32>
	%t6 = extractelement <2 x i32> %t4, i64 1			%t6 = extractelement <2 x i32> %t4, i64 1
	ret i32 %t6			ret i32 %t6
	}			}

This is an archive of the discontinued LLVM Phabricator instance.

[RISCV] Use vslide1down lowering for two element non-constant build_vectorsClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 519071

llvm/lib/Target/RISCV/RISCVISelLowering.cpp

llvm/test/CodeGen/RISCV/rvv/fixed-vector-shuffle-reverse.ll

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-bitcast.ll

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-fp2i-sat.ll

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-load.ll

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-mask-buildvec.ll

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-masked-scatter.ll

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-store.ll

llvm/test/CodeGen/RISCV/rvv/fold-vector-cmp.ll

[RISCV] Use vslide1down lowering for two element non-constant build_vectors
ClosedPublic