This is an archive of the discontinued LLVM Phabricator instance.

[RISCV] Cap build vector cost to avoid quadratic cost at high LMULs
ClosedPublic

Authored by reames on Aug 31 2023, 8:35 PM.

Download Raw Diff

Details

Reviewers

luke
craig.topper
asb

Commits

rGde34d39b66c2: [RISCV] Cap build vector cost to avoid quadratic cost at high LMULs

Summary

(Still somewhat WIP - posted for feedback, and frankly to grab a phab revision)

Each vslide operation is linear in LMUL on common hardware. (For instance, the sifive-x280 cost model models slides this way.) If we do a VL unique inserts, each with a cost linear in LMUL, the overall cost is O(LMUL2) * VLEN/ETYPE. To avoid the degenerate case, fallback to the stack if the cost is more than a fixed (linear) threshold.

For context, here's the sifive-x280 llvm-mca results for the current lowering and stack based lowering for each LMUL (using e64). Assumes code was compiled for V (i.e. zvl128b).
output/sifive-x280/buildvector_m1_via_stack.mca:Total Cycles: 1904
output/sifive-x280/buildvector_m2_via_stack.mca:Total Cycles: 2104
output/sifive-x280/buildvector_m4_via_stack.mca:Total Cycles: 2504
output/sifive-x280/buildvector_m8_via_stack.mca:Total Cycles: 3304
output/sifive-x280/buildvector_m1_via_vslidedown.mca:Total Cycles: 804
output/sifive-x280/buildvector_m2_via_vslidedown.mca:Total Cycles: 1604
output/sifive-x280/buildvector_m4_via_vslide1down.mca:Total Cycles: 6400
output/sifive-x280/buildvector_m8_via_vslide1down.mca:Total Cycles: 25599

There are other schemes we could use to cap the cost. The next best is recursive decomposition of the vector into smaller LMULs. That's still quadratic, but with a better constant. However, stack based seems to cost better on all LMULs, so we can just go with the simpler scheme.

Arguably, this patch is fixing a regression introduced with my D149667 as before that change, we'd always fallback to the stack, and thus didn't have the non-linearity.

Diff Detail

Event Timeline

reames created this revision.Aug 31 2023, 8:35 PM

Herald added a project: Restricted Project. · View Herald TranscriptAug 31 2023, 8:35 PM

Herald added subscribers: jobnoorman, sunshaoce, VincentWu and 29 others. · View Herald Transcript

reames requested review of this revision.Aug 31 2023, 8:35 PM

Herald added a project: Restricted Project. · View Herald TranscriptAug 31 2023, 8:35 PM

Herald added subscribers: wangpc, eopXD, MaskRay. · View Herald Transcript

Harbormaster completed remote builds in B256172: Diff 555244.Aug 31 2023, 9:13 PM

reames mentioned this in D159375: [RISCV] Lower fixed vectors extract_vector_elt through stack at high LMUL.Sep 1 2023, 12:49 PM

LGTM

llvm/lib/Target/RISCV/RISCVISelLowering.cpp
3529	space after switch

This revision is now accepted and ready to land.Sep 1 2023, 3:34 PM

Closed by commit rGde34d39b66c2: [RISCV] Cap build vector cost to avoid quadratic cost at high LMULs (authored by reames). · Explain WhySep 5 2023, 9:04 AM

This revision was automatically updated to reflect the committed changes.

reames added a commit: rGde34d39b66c2: [RISCV] Cap build vector cost to avoid quadratic cost at high LMULs.

reames mentioned this in rG463c9f44dcd8: [RISCV] Move slide and gather costing to TLI [NFC] (PR #65396).Sep 7 2023, 6:28 PM

reames mentioned this in rG299d710e3d83: [RISCV] Lower fixed vectors extract_vector_elt through stack at high LMUL.Sep 11 2023, 10:49 AM

Revision Contents

Path

Size

llvm/

lib/

Target/

RISCV/

RISCVISelLowering.cpp

48 lines

test/

CodeGen/

RISCV/

rvv/

fixed-vectors-fp-buildvec.ll

1075 lines

Diff 555244

llvm/lib/Target/RISCV/RISCVISelLowering.cpp

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show All 32 Lines
#include "llvm/IR/DiagnosticPrinter.h"		#include "llvm/IR/DiagnosticPrinter.h"
#include "llvm/IR/IRBuilder.h"		#include "llvm/IR/IRBuilder.h"
#include "llvm/IR/Instructions.h"		#include "llvm/IR/Instructions.h"
#include "llvm/IR/IntrinsicsRISCV.h"		#include "llvm/IR/IntrinsicsRISCV.h"
#include "llvm/IR/PatternMatch.h"		#include "llvm/IR/PatternMatch.h"
#include "llvm/Support/CommandLine.h"		#include "llvm/Support/CommandLine.h"
#include "llvm/Support/Debug.h"		#include "llvm/Support/Debug.h"
#include "llvm/Support/ErrorHandling.h"		#include "llvm/Support/ErrorHandling.h"
		#include "llvm/Support/InstructionCost.h"
#include "llvm/Support/KnownBits.h"		#include "llvm/Support/KnownBits.h"
#include "llvm/Support/MathExtras.h"		#include "llvm/Support/MathExtras.h"
#include "llvm/Support/raw_ostream.h"		#include "llvm/Support/raw_ostream.h"
#include <optional>		#include <optional>

using namespace llvm;		using namespace llvm;

#define DEBUG_TYPE "riscv-lower"		#define DEBUG_TYPE "riscv-lower"
▲ Show 20 Lines • Show All 3,460 Lines • ▼ Show 20 Lines	if (SDValue Splat = cast<BuildVectorSDNode>(Op)->getSplatValue()) {
Splat =		Splat =
DAG.getNode(Opc, DL, ContainerVT, DAG.getUNDEF(ContainerVT), Splat, VL);		DAG.getNode(Opc, DL, ContainerVT, DAG.getUNDEF(ContainerVT), Splat, VL);
return convertFromScalableVector(VT, Splat, DAG, Subtarget);		return convertFromScalableVector(VT, Splat, DAG, Subtarget);
}		}

if (SDValue Res = lowerBuildVectorViaDominantValues(Op, DAG, Subtarget))		if (SDValue Res = lowerBuildVectorViaDominantValues(Op, DAG, Subtarget))
return Res;		return Res;

		// Cap the cost at a value linear to the number of elements in the vector. The
		// default lowering is to use the stack. The vector store + scalar loads is
		// linear in VL. However, at high lmuls vslide1down and vslidedown end up
		// being (at least) linear in LMUL. As a result, using the vslidedown lowering
		// for every element ends up being VL*LMUL.
		// TODO: Should we be directly costing the stack alternative? Doing so might
		// give us a more accurate upper bound.
		InstructionCost LinearBudget = VT.getVectorNumElements() * 2;

		// TODO: unify with TTI getSlideCost. Should this be on Subtarget? Or somewhere else?
		InstructionCost PerSlideCost = 1;
		switch(RISCVTargetLowering::getLMUL(ContainerVT)) {
		craig.topperUnsubmitted Not Done Reply Inline Actions space after switch craig.topper: space after switch
		default: break;
		case RISCVII::VLMUL::LMUL_2:
		PerSlideCost = 2;
		break;
		case RISCVII::VLMUL::LMUL_4:
		PerSlideCost = 4;
		break;
		case RISCVII::VLMUL::LMUL_8:
		PerSlideCost = 8;
		break;
		}

		// TODO: Should we be using the build instseq then cost + evaluate scheme
		// we use for integer constants here?
		unsigned UndefCount = 0;
		for (const SDValue &V : Op->ops()) {
		if (V.isUndef()) {
		UndefCount++;
		continue;
		}
		if (UndefCount) {
		LinearBudget -= PerSlideCost;
		UndefCount = 0;
		}
		LinearBudget -= PerSlideCost;
		}
		if (UndefCount) {
		LinearBudget -= PerSlideCost;
		}

		if (LinearBudget < 0)
		return SDValue();

assert((!VT.isFloatingPoint() \|\|		assert((!VT.isFloatingPoint() \|\|
VT.getVectorElementType().getSizeInBits() <= Subtarget.getFLen()) &&		VT.getVectorElementType().getSizeInBits() <= Subtarget.getFLen()) &&
"Illegal type which will result in reserved encoding");		"Illegal type which will result in reserved encoding");

const unsigned Policy = RISCVII::TAIL_AGNOSTIC \| RISCVII::MASK_AGNOSTIC;		const unsigned Policy = RISCVII::TAIL_AGNOSTIC \| RISCVII::MASK_AGNOSTIC;

SDValue Vec = DAG.getUNDEF(ContainerVT);		SDValue Vec = DAG.getUNDEF(ContainerVT);
unsigned UndefCount = 0;		UndefCount = 0;
for (const SDValue &V : Op->ops()) {		for (const SDValue &V : Op->ops()) {
if (V.isUndef()) {		if (V.isUndef()) {
UndefCount++;		UndefCount++;
continue;		continue;
}		}
if (UndefCount) {		if (UndefCount) {
const SDValue Offset = DAG.getConstant(UndefCount, DL, Subtarget.getXLenVT());		const SDValue Offset = DAG.getConstant(UndefCount, DL, Subtarget.getXLenVT());
Vec = getVSlidedown(DAG, Subtarget, DL, ContainerVT, DAG.getUNDEF(ContainerVT),		Vec = getVSlidedown(DAG, Subtarget, DL, ContainerVT, DAG.getUNDEF(ContainerVT),
▲ Show 20 Lines • Show All 14,766 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-fp-buildvec.ll

Show First 20 Lines • Show All 330 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%v4 = insertelement <8 x float> %v3, float %e4, i64 4		%v4 = insertelement <8 x float> %v3, float %e4, i64 4
%v5 = insertelement <8 x float> %v4, float %e5, i64 5		%v5 = insertelement <8 x float> %v4, float %e5, i64 5
%v6 = insertelement <8 x float> %v5, float %e6, i64 6		%v6 = insertelement <8 x float> %v5, float %e6, i64 6
%v7 = insertelement <8 x float> %v6, float %e7, i64 7		%v7 = insertelement <8 x float> %v6, float %e7, i64 7
ret <8 x float> %v7		ret <8 x float> %v7
}		}

define <16 x float> @buildvec_v16f32(float %e0, float %e1, float %e2, float %e3, float %e4, float %e5, float %e6, float %e7, float %e8, float %e9, float %e10, float %e11, float %e12, float %e13, float %e14, float %e15) {		define <16 x float> @buildvec_v16f32(float %e0, float %e1, float %e2, float %e3, float %e4, float %e5, float %e6, float %e7, float %e8, float %e9, float %e10, float %e11, float %e12, float %e13, float %e14, float %e15) {
; CHECK-LABEL: buildvec_v16f32:		; RV32-LABEL: buildvec_v16f32:
; CHECK: # %bb.0:		; RV32: # %bb.0:
; CHECK-NEXT: fmv.w.x ft0, a7		; RV32-NEXT: addi sp, sp, -128
; CHECK-NEXT: fmv.w.x ft1, a6		; RV32-NEXT: .cfi_def_cfa_offset 128
; CHECK-NEXT: fmv.w.x ft2, a5		; RV32-NEXT: sw ra, 124(sp) # 4-byte Folded Spill
; CHECK-NEXT: fmv.w.x ft3, a4		; RV32-NEXT: sw s0, 120(sp) # 4-byte Folded Spill
; CHECK-NEXT: fmv.w.x ft4, a3		; RV32-NEXT: .cfi_offset ra, -4
; CHECK-NEXT: fmv.w.x ft5, a2		; RV32-NEXT: .cfi_offset s0, -8
; CHECK-NEXT: fmv.w.x ft6, a1		; RV32-NEXT: addi s0, sp, 128
; CHECK-NEXT: fmv.w.x ft7, a0		; RV32-NEXT: .cfi_def_cfa s0, 0
; CHECK-NEXT: vsetivli zero, 16, e32, m4, ta, ma		; RV32-NEXT: andi sp, sp, -64
; CHECK-NEXT: vfslide1down.vf v8, v8, fa0		; RV32-NEXT: sw a7, 60(sp)
; CHECK-NEXT: vfslide1down.vf v8, v8, fa1		; RV32-NEXT: sw a6, 56(sp)
; CHECK-NEXT: vfslide1down.vf v8, v8, fa2		; RV32-NEXT: sw a5, 52(sp)
; CHECK-NEXT: vfslide1down.vf v8, v8, fa3		; RV32-NEXT: sw a4, 48(sp)
; CHECK-NEXT: vfslide1down.vf v8, v8, fa4		; RV32-NEXT: sw a3, 44(sp)
; CHECK-NEXT: vfslide1down.vf v8, v8, fa5		; RV32-NEXT: sw a2, 40(sp)
; CHECK-NEXT: vfslide1down.vf v8, v8, fa6		; RV32-NEXT: sw a1, 36(sp)
; CHECK-NEXT: vfslide1down.vf v8, v8, fa7		; RV32-NEXT: sw a0, 32(sp)
; CHECK-NEXT: vfslide1down.vf v8, v8, ft7		; RV32-NEXT: fsw fa7, 28(sp)
; CHECK-NEXT: vfslide1down.vf v8, v8, ft6		; RV32-NEXT: fsw fa6, 24(sp)
; CHECK-NEXT: vfslide1down.vf v8, v8, ft5		; RV32-NEXT: fsw fa5, 20(sp)
; CHECK-NEXT: vfslide1down.vf v8, v8, ft4		; RV32-NEXT: fsw fa4, 16(sp)
; CHECK-NEXT: vfslide1down.vf v8, v8, ft3		; RV32-NEXT: fsw fa3, 12(sp)
; CHECK-NEXT: vfslide1down.vf v8, v8, ft2		; RV32-NEXT: fsw fa2, 8(sp)
; CHECK-NEXT: vfslide1down.vf v8, v8, ft1		; RV32-NEXT: fsw fa1, 4(sp)
; CHECK-NEXT: vfslide1down.vf v8, v8, ft0		; RV32-NEXT: fsw fa0, 0(sp)
; CHECK-NEXT: ret		; RV32-NEXT: mv a0, sp
		; RV32-NEXT: vsetivli zero, 16, e32, m4, ta, ma
		; RV32-NEXT: vle32.v v8, (a0)
		; RV32-NEXT: addi sp, s0, -128
		; RV32-NEXT: lw ra, 124(sp) # 4-byte Folded Reload
		; RV32-NEXT: lw s0, 120(sp) # 4-byte Folded Reload
		; RV32-NEXT: addi sp, sp, 128
		; RV32-NEXT: ret
		;
		; RV64-LABEL: buildvec_v16f32:
		; RV64: # %bb.0:
		; RV64-NEXT: addi sp, sp, -128
		; RV64-NEXT: .cfi_def_cfa_offset 128
		; RV64-NEXT: sd ra, 120(sp) # 8-byte Folded Spill
		; RV64-NEXT: sd s0, 112(sp) # 8-byte Folded Spill
		; RV64-NEXT: .cfi_offset ra, -8
		; RV64-NEXT: .cfi_offset s0, -16
		; RV64-NEXT: addi s0, sp, 128
		; RV64-NEXT: .cfi_def_cfa s0, 0
		; RV64-NEXT: andi sp, sp, -64
		; RV64-NEXT: fmv.w.x ft0, a0
		; RV64-NEXT: fmv.w.x ft1, a1
		; RV64-NEXT: fmv.w.x ft2, a2
		; RV64-NEXT: fmv.w.x ft3, a3
		; RV64-NEXT: fmv.w.x ft4, a4
		; RV64-NEXT: fmv.w.x ft5, a5
		; RV64-NEXT: fmv.w.x ft6, a6
		; RV64-NEXT: fmv.w.x ft7, a7
		; RV64-NEXT: fsw fa7, 28(sp)
		; RV64-NEXT: fsw fa6, 24(sp)
		; RV64-NEXT: fsw fa5, 20(sp)
		; RV64-NEXT: fsw fa4, 16(sp)
		; RV64-NEXT: fsw fa3, 12(sp)
		; RV64-NEXT: fsw fa2, 8(sp)
		; RV64-NEXT: fsw fa1, 4(sp)
		; RV64-NEXT: fsw fa0, 0(sp)
		; RV64-NEXT: fsw ft7, 60(sp)
		; RV64-NEXT: fsw ft6, 56(sp)
		; RV64-NEXT: fsw ft5, 52(sp)
		; RV64-NEXT: fsw ft4, 48(sp)
		; RV64-NEXT: fsw ft3, 44(sp)
		; RV64-NEXT: fsw ft2, 40(sp)
		; RV64-NEXT: fsw ft1, 36(sp)
		; RV64-NEXT: fsw ft0, 32(sp)
		; RV64-NEXT: mv a0, sp
		; RV64-NEXT: vsetivli zero, 16, e32, m4, ta, ma
		; RV64-NEXT: vle32.v v8, (a0)
		; RV64-NEXT: addi sp, s0, -128
		; RV64-NEXT: ld ra, 120(sp) # 8-byte Folded Reload
		; RV64-NEXT: ld s0, 112(sp) # 8-byte Folded Reload
		; RV64-NEXT: addi sp, sp, 128
		; RV64-NEXT: ret
%v0 = insertelement <16 x float> poison, float %e0, i64 0		%v0 = insertelement <16 x float> poison, float %e0, i64 0
%v1 = insertelement <16 x float> %v0, float %e1, i64 1		%v1 = insertelement <16 x float> %v0, float %e1, i64 1
%v2 = insertelement <16 x float> %v1, float %e2, i64 2		%v2 = insertelement <16 x float> %v1, float %e2, i64 2
%v3 = insertelement <16 x float> %v2, float %e3, i64 3		%v3 = insertelement <16 x float> %v2, float %e3, i64 3
%v4 = insertelement <16 x float> %v3, float %e4, i64 4		%v4 = insertelement <16 x float> %v3, float %e4, i64 4
%v5 = insertelement <16 x float> %v4, float %e5, i64 5		%v5 = insertelement <16 x float> %v4, float %e5, i64 5
%v6 = insertelement <16 x float> %v5, float %e6, i64 6		%v6 = insertelement <16 x float> %v5, float %e6, i64 6
%v7 = insertelement <16 x float> %v6, float %e7, i64 7		%v7 = insertelement <16 x float> %v6, float %e7, i64 7
%v8 = insertelement <16 x float> %v7, float %e8, i64 8		%v8 = insertelement <16 x float> %v7, float %e8, i64 8
%v9 = insertelement <16 x float> %v8, float %e9, i64 9		%v9 = insertelement <16 x float> %v8, float %e9, i64 9
%v10 = insertelement <16 x float> %v9, float %e10, i64 10		%v10 = insertelement <16 x float> %v9, float %e10, i64 10
%v11 = insertelement <16 x float> %v10, float %e11, i64 11		%v11 = insertelement <16 x float> %v10, float %e11, i64 11
%v12 = insertelement <16 x float> %v11, float %e12, i64 12		%v12 = insertelement <16 x float> %v11, float %e12, i64 12
%v13 = insertelement <16 x float> %v12, float %e13, i64 13		%v13 = insertelement <16 x float> %v12, float %e13, i64 13
%v14 = insertelement <16 x float> %v13, float %e14, i64 14		%v14 = insertelement <16 x float> %v13, float %e14, i64 14
%v15 = insertelement <16 x float> %v14, float %e15, i64 15		%v15 = insertelement <16 x float> %v14, float %e15, i64 15
ret <16 x float> %v15		ret <16 x float> %v15
}		}

define <32 x float> @buildvec_v32f32(float %e0, float %e1, float %e2, float %e3, float %e4, float %e5, float %e6, float %e7, float %e8, float %e9, float %e10, float %e11, float %e12, float %e13, float %e14, float %e15, float %e16, float %e17, float %e18, float %e19, float %e20, float %e21, float %e22, float %e23, float %e24, float %e25, float %e26, float %e27, float %e28, float %e29, float %e30, float %e31) {		define <32 x float> @buildvec_v32f32(float %e0, float %e1, float %e2, float %e3, float %e4, float %e5, float %e6, float %e7, float %e8, float %e9, float %e10, float %e11, float %e12, float %e13, float %e14, float %e15, float %e16, float %e17, float %e18, float %e19, float %e20, float %e21, float %e22, float %e23, float %e24, float %e25, float %e26, float %e27, float %e28, float %e29, float %e30, float %e31) {
; RV32-LABEL: buildvec_v32f32:		; RV32-LABEL: buildvec_v32f32:
; RV32: # %bb.0:		; RV32: # %bb.0:
; RV32-NEXT: addi sp, sp, -96		; RV32-NEXT: addi sp, sp, -256
; RV32-NEXT: .cfi_def_cfa_offset 96		; RV32-NEXT: .cfi_def_cfa_offset 256
; RV32-NEXT: fsd fs0, 88(sp) # 8-byte Folded Spill		; RV32-NEXT: sw ra, 252(sp) # 4-byte Folded Spill
; RV32-NEXT: fsd fs1, 80(sp) # 8-byte Folded Spill		; RV32-NEXT: sw s0, 248(sp) # 4-byte Folded Spill
; RV32-NEXT: fsd fs2, 72(sp) # 8-byte Folded Spill		; RV32-NEXT: fsd fs0, 240(sp) # 8-byte Folded Spill
; RV32-NEXT: fsd fs3, 64(sp) # 8-byte Folded Spill		; RV32-NEXT: fsd fs1, 232(sp) # 8-byte Folded Spill
; RV32-NEXT: fsd fs4, 56(sp) # 8-byte Folded Spill		; RV32-NEXT: fsd fs2, 224(sp) # 8-byte Folded Spill
; RV32-NEXT: fsd fs5, 48(sp) # 8-byte Folded Spill		; RV32-NEXT: fsd fs3, 216(sp) # 8-byte Folded Spill
; RV32-NEXT: fsd fs6, 40(sp) # 8-byte Folded Spill		; RV32-NEXT: .cfi_offset ra, -4
; RV32-NEXT: fsd fs7, 32(sp) # 8-byte Folded Spill		; RV32-NEXT: .cfi_offset s0, -8
; RV32-NEXT: fsd fs8, 24(sp) # 8-byte Folded Spill		; RV32-NEXT: .cfi_offset fs0, -16
; RV32-NEXT: fsd fs9, 16(sp) # 8-byte Folded Spill		; RV32-NEXT: .cfi_offset fs1, -24
; RV32-NEXT: fsd fs10, 8(sp) # 8-byte Folded Spill		; RV32-NEXT: .cfi_offset fs2, -32
; RV32-NEXT: fsd fs11, 0(sp) # 8-byte Folded Spill		; RV32-NEXT: .cfi_offset fs3, -40
; RV32-NEXT: .cfi_offset fs0, -8		; RV32-NEXT: addi s0, sp, 256
; RV32-NEXT: .cfi_offset fs1, -16		; RV32-NEXT: .cfi_def_cfa s0, 0
; RV32-NEXT: .cfi_offset fs2, -24		; RV32-NEXT: andi sp, sp, -128
; RV32-NEXT: .cfi_offset fs3, -32		; RV32-NEXT: flw ft0, 0(s0)
; RV32-NEXT: .cfi_offset fs4, -40		; RV32-NEXT: flw ft1, 4(s0)
; RV32-NEXT: .cfi_offset fs5, -48		; RV32-NEXT: flw ft2, 8(s0)
; RV32-NEXT: .cfi_offset fs6, -56		; RV32-NEXT: flw ft3, 12(s0)
; RV32-NEXT: .cfi_offset fs7, -64		; RV32-NEXT: flw ft4, 16(s0)
; RV32-NEXT: .cfi_offset fs8, -72		; RV32-NEXT: flw ft5, 20(s0)
; RV32-NEXT: .cfi_offset fs9, -80		; RV32-NEXT: flw ft6, 24(s0)
; RV32-NEXT: .cfi_offset fs10, -88		; RV32-NEXT: flw ft7, 28(s0)
; RV32-NEXT: .cfi_offset fs11, -96		; RV32-NEXT: flw ft8, 32(s0)
; RV32-NEXT: fmv.w.x ft0, a7		; RV32-NEXT: flw ft9, 36(s0)
; RV32-NEXT: fmv.w.x ft1, a6		; RV32-NEXT: flw ft10, 40(s0)
; RV32-NEXT: fmv.w.x ft2, a5		; RV32-NEXT: flw ft11, 44(s0)
; RV32-NEXT: fmv.w.x ft3, a4		; RV32-NEXT: flw fs0, 60(s0)
; RV32-NEXT: fmv.w.x ft4, a3		; RV32-NEXT: flw fs1, 56(s0)
; RV32-NEXT: fmv.w.x ft5, a2		; RV32-NEXT: flw fs2, 52(s0)
; RV32-NEXT: fmv.w.x ft6, a1		; RV32-NEXT: flw fs3, 48(s0)
; RV32-NEXT: fmv.w.x ft7, a0		; RV32-NEXT: fsw fs0, 124(sp)
; RV32-NEXT: flw ft8, 156(sp)		; RV32-NEXT: fsw fs1, 120(sp)
; RV32-NEXT: flw ft9, 152(sp)		; RV32-NEXT: fsw fs2, 116(sp)
; RV32-NEXT: flw ft10, 148(sp)		; RV32-NEXT: fsw fs3, 112(sp)
; RV32-NEXT: flw ft11, 144(sp)		; RV32-NEXT: fsw ft11, 108(sp)
; RV32-NEXT: flw fs0, 140(sp)		; RV32-NEXT: fsw ft10, 104(sp)
; RV32-NEXT: flw fs1, 136(sp)		; RV32-NEXT: fsw ft9, 100(sp)
; RV32-NEXT: flw fs2, 132(sp)		; RV32-NEXT: fsw ft8, 96(sp)
; RV32-NEXT: flw fs3, 128(sp)		; RV32-NEXT: fsw ft7, 92(sp)
; RV32-NEXT: flw fs4, 124(sp)		; RV32-NEXT: fsw ft6, 88(sp)
; RV32-NEXT: flw fs5, 120(sp)		; RV32-NEXT: fsw ft5, 84(sp)
; RV32-NEXT: flw fs6, 116(sp)		; RV32-NEXT: fsw ft4, 80(sp)
; RV32-NEXT: flw fs7, 112(sp)		; RV32-NEXT: fsw ft3, 76(sp)
; RV32-NEXT: flw fs8, 108(sp)		; RV32-NEXT: fsw ft2, 72(sp)
; RV32-NEXT: flw fs9, 104(sp)		; RV32-NEXT: fsw ft1, 68(sp)
; RV32-NEXT: flw fs10, 100(sp)		; RV32-NEXT: fsw ft0, 64(sp)
; RV32-NEXT: flw fs11, 96(sp)		; RV32-NEXT: sw a7, 60(sp)
		; RV32-NEXT: sw a6, 56(sp)
		; RV32-NEXT: sw a5, 52(sp)
		; RV32-NEXT: sw a4, 48(sp)
		; RV32-NEXT: sw a3, 44(sp)
		; RV32-NEXT: sw a2, 40(sp)
		; RV32-NEXT: sw a1, 36(sp)
		; RV32-NEXT: sw a0, 32(sp)
		; RV32-NEXT: fsw fa7, 28(sp)
		; RV32-NEXT: fsw fa6, 24(sp)
		; RV32-NEXT: fsw fa5, 20(sp)
		; RV32-NEXT: fsw fa4, 16(sp)
		; RV32-NEXT: fsw fa3, 12(sp)
		; RV32-NEXT: fsw fa2, 8(sp)
		; RV32-NEXT: fsw fa1, 4(sp)
		; RV32-NEXT: fsw fa0, 0(sp)
; RV32-NEXT: li a0, 32		; RV32-NEXT: li a0, 32
		; RV32-NEXT: mv a1, sp
; RV32-NEXT: vsetvli zero, a0, e32, m8, ta, ma		; RV32-NEXT: vsetvli zero, a0, e32, m8, ta, ma
; RV32-NEXT: vfslide1down.vf v8, v8, fa0		; RV32-NEXT: vle32.v v8, (a1)
; RV32-NEXT: vfslide1down.vf v8, v8, fa1		; RV32-NEXT: addi sp, s0, -256
; RV32-NEXT: vfslide1down.vf v8, v8, fa2		; RV32-NEXT: lw ra, 252(sp) # 4-byte Folded Reload
; RV32-NEXT: vfslide1down.vf v8, v8, fa3		; RV32-NEXT: lw s0, 248(sp) # 4-byte Folded Reload
; RV32-NEXT: vfslide1down.vf v8, v8, fa4		; RV32-NEXT: fld fs0, 240(sp) # 8-byte Folded Reload
; RV32-NEXT: vfslide1down.vf v8, v8, fa5		; RV32-NEXT: fld fs1, 232(sp) # 8-byte Folded Reload
; RV32-NEXT: vfslide1down.vf v8, v8, fa6		; RV32-NEXT: fld fs2, 224(sp) # 8-byte Folded Reload
; RV32-NEXT: vfslide1down.vf v8, v8, fa7		; RV32-NEXT: fld fs3, 216(sp) # 8-byte Folded Reload
; RV32-NEXT: vfslide1down.vf v8, v8, ft7		; RV32-NEXT: addi sp, sp, 256
; RV32-NEXT: vfslide1down.vf v8, v8, ft6
; RV32-NEXT: vfslide1down.vf v8, v8, ft5
; RV32-NEXT: vfslide1down.vf v8, v8, ft4
; RV32-NEXT: vfslide1down.vf v8, v8, ft3
; RV32-NEXT: vfslide1down.vf v8, v8, ft2
; RV32-NEXT: vfslide1down.vf v8, v8, ft1
; RV32-NEXT: vfslide1down.vf v8, v8, ft0
; RV32-NEXT: vfslide1down.vf v8, v8, fs11
; RV32-NEXT: vfslide1down.vf v8, v8, fs10
; RV32-NEXT: vfslide1down.vf v8, v8, fs9
; RV32-NEXT: vfslide1down.vf v8, v8, fs8
; RV32-NEXT: vfslide1down.vf v8, v8, fs7
; RV32-NEXT: vfslide1down.vf v8, v8, fs6
; RV32-NEXT: vfslide1down.vf v8, v8, fs5
; RV32-NEXT: vfslide1down.vf v8, v8, fs4
; RV32-NEXT: vfslide1down.vf v8, v8, fs3
; RV32-NEXT: vfslide1down.vf v8, v8, fs2
; RV32-NEXT: vfslide1down.vf v8, v8, fs1
; RV32-NEXT: vfslide1down.vf v8, v8, fs0
; RV32-NEXT: vfslide1down.vf v8, v8, ft11
; RV32-NEXT: vfslide1down.vf v8, v8, ft10
; RV32-NEXT: vfslide1down.vf v8, v8, ft9
; RV32-NEXT: vfslide1down.vf v8, v8, ft8
; RV32-NEXT: fld fs0, 88(sp) # 8-byte Folded Reload
; RV32-NEXT: fld fs1, 80(sp) # 8-byte Folded Reload
; RV32-NEXT: fld fs2, 72(sp) # 8-byte Folded Reload
; RV32-NEXT: fld fs3, 64(sp) # 8-byte Folded Reload
; RV32-NEXT: fld fs4, 56(sp) # 8-byte Folded Reload
; RV32-NEXT: fld fs5, 48(sp) # 8-byte Folded Reload
; RV32-NEXT: fld fs6, 40(sp) # 8-byte Folded Reload
; RV32-NEXT: fld fs7, 32(sp) # 8-byte Folded Reload
; RV32-NEXT: fld fs8, 24(sp) # 8-byte Folded Reload
; RV32-NEXT: fld fs9, 16(sp) # 8-byte Folded Reload
; RV32-NEXT: fld fs10, 8(sp) # 8-byte Folded Reload
; RV32-NEXT: fld fs11, 0(sp) # 8-byte Folded Reload
; RV32-NEXT: addi sp, sp, 96
; RV32-NEXT: ret		; RV32-NEXT: ret
;		;
; RV64-LABEL: buildvec_v32f32:		; RV64-LABEL: buildvec_v32f32:
; RV64: # %bb.0:		; RV64: # %bb.0:
; RV64-NEXT: addi sp, sp, -96		; RV64-NEXT: addi sp, sp, -256
; RV64-NEXT: .cfi_def_cfa_offset 96		; RV64-NEXT: .cfi_def_cfa_offset 256
; RV64-NEXT: fsd fs0, 88(sp) # 8-byte Folded Spill		; RV64-NEXT: sd ra, 248(sp) # 8-byte Folded Spill
; RV64-NEXT: fsd fs1, 80(sp) # 8-byte Folded Spill		; RV64-NEXT: sd s0, 240(sp) # 8-byte Folded Spill
; RV64-NEXT: fsd fs2, 72(sp) # 8-byte Folded Spill		; RV64-NEXT: fsd fs0, 232(sp) # 8-byte Folded Spill
; RV64-NEXT: fsd fs3, 64(sp) # 8-byte Folded Spill		; RV64-NEXT: fsd fs1, 224(sp) # 8-byte Folded Spill
; RV64-NEXT: fsd fs4, 56(sp) # 8-byte Folded Spill		; RV64-NEXT: fsd fs2, 216(sp) # 8-byte Folded Spill
; RV64-NEXT: fsd fs5, 48(sp) # 8-byte Folded Spill		; RV64-NEXT: fsd fs3, 208(sp) # 8-byte Folded Spill
; RV64-NEXT: fsd fs6, 40(sp) # 8-byte Folded Spill		; RV64-NEXT: fsd fs4, 200(sp) # 8-byte Folded Spill
; RV64-NEXT: fsd fs7, 32(sp) # 8-byte Folded Spill		; RV64-NEXT: fsd fs5, 192(sp) # 8-byte Folded Spill
; RV64-NEXT: fsd fs8, 24(sp) # 8-byte Folded Spill		; RV64-NEXT: fsd fs6, 184(sp) # 8-byte Folded Spill
; RV64-NEXT: fsd fs9, 16(sp) # 8-byte Folded Spill		; RV64-NEXT: fsd fs7, 176(sp) # 8-byte Folded Spill
; RV64-NEXT: fsd fs10, 8(sp) # 8-byte Folded Spill		; RV64-NEXT: fsd fs8, 168(sp) # 8-byte Folded Spill
; RV64-NEXT: fsd fs11, 0(sp) # 8-byte Folded Spill		; RV64-NEXT: fsd fs9, 160(sp) # 8-byte Folded Spill
; RV64-NEXT: .cfi_offset fs0, -8		; RV64-NEXT: fsd fs10, 152(sp) # 8-byte Folded Spill
; RV64-NEXT: .cfi_offset fs1, -16		; RV64-NEXT: fsd fs11, 144(sp) # 8-byte Folded Spill
; RV64-NEXT: .cfi_offset fs2, -24		; RV64-NEXT: .cfi_offset ra, -8
; RV64-NEXT: .cfi_offset fs3, -32		; RV64-NEXT: .cfi_offset s0, -16
; RV64-NEXT: .cfi_offset fs4, -40		; RV64-NEXT: .cfi_offset fs0, -24
; RV64-NEXT: .cfi_offset fs5, -48		; RV64-NEXT: .cfi_offset fs1, -32
; RV64-NEXT: .cfi_offset fs6, -56		; RV64-NEXT: .cfi_offset fs2, -40
; RV64-NEXT: .cfi_offset fs7, -64		; RV64-NEXT: .cfi_offset fs3, -48
; RV64-NEXT: .cfi_offset fs8, -72		; RV64-NEXT: .cfi_offset fs4, -56
; RV64-NEXT: .cfi_offset fs9, -80		; RV64-NEXT: .cfi_offset fs5, -64
; RV64-NEXT: .cfi_offset fs10, -88		; RV64-NEXT: .cfi_offset fs6, -72
; RV64-NEXT: .cfi_offset fs11, -96		; RV64-NEXT: .cfi_offset fs7, -80
; RV64-NEXT: fmv.w.x ft0, a7		; RV64-NEXT: .cfi_offset fs8, -88
; RV64-NEXT: fmv.w.x ft1, a6		; RV64-NEXT: .cfi_offset fs9, -96
; RV64-NEXT: fmv.w.x ft2, a5		; RV64-NEXT: .cfi_offset fs10, -104
; RV64-NEXT: fmv.w.x ft3, a4		; RV64-NEXT: .cfi_offset fs11, -112
; RV64-NEXT: fmv.w.x ft4, a3		; RV64-NEXT: addi s0, sp, 256
; RV64-NEXT: fmv.w.x ft5, a2		; RV64-NEXT: .cfi_def_cfa s0, 0
; RV64-NEXT: fmv.w.x ft6, a1		; RV64-NEXT: andi sp, sp, -128
; RV64-NEXT: fmv.w.x ft7, a0		; RV64-NEXT: fmv.w.x ft0, a0
; RV64-NEXT: flw ft8, 216(sp)		; RV64-NEXT: fmv.w.x ft1, a1
; RV64-NEXT: flw ft9, 208(sp)		; RV64-NEXT: fmv.w.x ft2, a2
; RV64-NEXT: flw ft10, 200(sp)		; RV64-NEXT: fmv.w.x ft3, a3
; RV64-NEXT: flw ft11, 192(sp)		; RV64-NEXT: fmv.w.x ft4, a4
; RV64-NEXT: flw fs0, 184(sp)		; RV64-NEXT: fmv.w.x ft5, a5
; RV64-NEXT: flw fs1, 176(sp)		; RV64-NEXT: fmv.w.x ft6, a6
; RV64-NEXT: flw fs2, 168(sp)		; RV64-NEXT: fmv.w.x ft7, a7
; RV64-NEXT: flw fs3, 160(sp)		; RV64-NEXT: flw ft8, 0(s0)
; RV64-NEXT: flw fs4, 152(sp)		; RV64-NEXT: flw ft9, 8(s0)
; RV64-NEXT: flw fs5, 144(sp)		; RV64-NEXT: flw ft10, 16(s0)
; RV64-NEXT: flw fs6, 136(sp)		; RV64-NEXT: flw ft11, 24(s0)
; RV64-NEXT: flw fs7, 128(sp)		; RV64-NEXT: flw fs0, 32(s0)
; RV64-NEXT: flw fs8, 120(sp)		; RV64-NEXT: flw fs1, 40(s0)
; RV64-NEXT: flw fs9, 112(sp)		; RV64-NEXT: flw fs2, 48(s0)
; RV64-NEXT: flw fs10, 104(sp)		; RV64-NEXT: flw fs3, 56(s0)
; RV64-NEXT: flw fs11, 96(sp)		; RV64-NEXT: flw fs4, 64(s0)
		; RV64-NEXT: flw fs5, 72(s0)
		; RV64-NEXT: flw fs6, 80(s0)
		; RV64-NEXT: flw fs7, 88(s0)
		; RV64-NEXT: flw fs8, 120(s0)
		; RV64-NEXT: flw fs9, 112(s0)
		; RV64-NEXT: flw fs10, 104(s0)
		; RV64-NEXT: flw fs11, 96(s0)
		; RV64-NEXT: fsw fs8, 124(sp)
		; RV64-NEXT: fsw fs9, 120(sp)
		; RV64-NEXT: fsw fs10, 116(sp)
		; RV64-NEXT: fsw fs11, 112(sp)
		; RV64-NEXT: fsw fs7, 108(sp)
		; RV64-NEXT: fsw fs6, 104(sp)
		; RV64-NEXT: fsw fs5, 100(sp)
		; RV64-NEXT: fsw fs4, 96(sp)
		; RV64-NEXT: fsw fs3, 92(sp)
		; RV64-NEXT: fsw fs2, 88(sp)
		; RV64-NEXT: fsw fs1, 84(sp)
		; RV64-NEXT: fsw fs0, 80(sp)
		; RV64-NEXT: fsw ft11, 76(sp)
		; RV64-NEXT: fsw ft10, 72(sp)
		; RV64-NEXT: fsw ft9, 68(sp)
		; RV64-NEXT: fsw ft8, 64(sp)
		; RV64-NEXT: fsw fa7, 28(sp)
		; RV64-NEXT: fsw fa6, 24(sp)
		; RV64-NEXT: fsw fa5, 20(sp)
		; RV64-NEXT: fsw fa4, 16(sp)
		; RV64-NEXT: fsw fa3, 12(sp)
		; RV64-NEXT: fsw fa2, 8(sp)
		; RV64-NEXT: fsw fa1, 4(sp)
		; RV64-NEXT: fsw fa0, 0(sp)
		; RV64-NEXT: fsw ft7, 60(sp)
		; RV64-NEXT: fsw ft6, 56(sp)
		; RV64-NEXT: fsw ft5, 52(sp)
		; RV64-NEXT: fsw ft4, 48(sp)
		; RV64-NEXT: fsw ft3, 44(sp)
		; RV64-NEXT: fsw ft2, 40(sp)
		; RV64-NEXT: fsw ft1, 36(sp)
		; RV64-NEXT: fsw ft0, 32(sp)
; RV64-NEXT: li a0, 32		; RV64-NEXT: li a0, 32
		; RV64-NEXT: mv a1, sp
; RV64-NEXT: vsetvli zero, a0, e32, m8, ta, ma		; RV64-NEXT: vsetvli zero, a0, e32, m8, ta, ma
; RV64-NEXT: vfslide1down.vf v8, v8, fa0		; RV64-NEXT: vle32.v v8, (a1)
; RV64-NEXT: vfslide1down.vf v8, v8, fa1		; RV64-NEXT: addi sp, s0, -256
; RV64-NEXT: vfslide1down.vf v8, v8, fa2		; RV64-NEXT: ld ra, 248(sp) # 8-byte Folded Reload
; RV64-NEXT: vfslide1down.vf v8, v8, fa3		; RV64-NEXT: ld s0, 240(sp) # 8-byte Folded Reload
; RV64-NEXT: vfslide1down.vf v8, v8, fa4		; RV64-NEXT: fld fs0, 232(sp) # 8-byte Folded Reload
; RV64-NEXT: vfslide1down.vf v8, v8, fa5		; RV64-NEXT: fld fs1, 224(sp) # 8-byte Folded Reload
; RV64-NEXT: vfslide1down.vf v8, v8, fa6		; RV64-NEXT: fld fs2, 216(sp) # 8-byte Folded Reload
; RV64-NEXT: vfslide1down.vf v8, v8, fa7		; RV64-NEXT: fld fs3, 208(sp) # 8-byte Folded Reload
; RV64-NEXT: vfslide1down.vf v8, v8, ft7		; RV64-NEXT: fld fs4, 200(sp) # 8-byte Folded Reload
; RV64-NEXT: vfslide1down.vf v8, v8, ft6		; RV64-NEXT: fld fs5, 192(sp) # 8-byte Folded Reload
; RV64-NEXT: vfslide1down.vf v8, v8, ft5		; RV64-NEXT: fld fs6, 184(sp) # 8-byte Folded Reload
; RV64-NEXT: vfslide1down.vf v8, v8, ft4		; RV64-NEXT: fld fs7, 176(sp) # 8-byte Folded Reload
; RV64-NEXT: vfslide1down.vf v8, v8, ft3		; RV64-NEXT: fld fs8, 168(sp) # 8-byte Folded Reload
; RV64-NEXT: vfslide1down.vf v8, v8, ft2		; RV64-NEXT: fld fs9, 160(sp) # 8-byte Folded Reload
; RV64-NEXT: vfslide1down.vf v8, v8, ft1		; RV64-NEXT: fld fs10, 152(sp) # 8-byte Folded Reload
; RV64-NEXT: vfslide1down.vf v8, v8, ft0		; RV64-NEXT: fld fs11, 144(sp) # 8-byte Folded Reload
; RV64-NEXT: vfslide1down.vf v8, v8, fs11		; RV64-NEXT: addi sp, sp, 256
; RV64-NEXT: vfslide1down.vf v8, v8, fs10
; RV64-NEXT: vfslide1down.vf v8, v8, fs9
; RV64-NEXT: vfslide1down.vf v8, v8, fs8
; RV64-NEXT: vfslide1down.vf v8, v8, fs7
; RV64-NEXT: vfslide1down.vf v8, v8, fs6
; RV64-NEXT: vfslide1down.vf v8, v8, fs5
; RV64-NEXT: vfslide1down.vf v8, v8, fs4
; RV64-NEXT: vfslide1down.vf v8, v8, fs3
; RV64-NEXT: vfslide1down.vf v8, v8, fs2
; RV64-NEXT: vfslide1down.vf v8, v8, fs1
; RV64-NEXT: vfslide1down.vf v8, v8, fs0
; RV64-NEXT: vfslide1down.vf v8, v8, ft11
; RV64-NEXT: vfslide1down.vf v8, v8, ft10
; RV64-NEXT: vfslide1down.vf v8, v8, ft9
; RV64-NEXT: vfslide1down.vf v8, v8, ft8
; RV64-NEXT: fld fs0, 88(sp) # 8-byte Folded Reload
; RV64-NEXT: fld fs1, 80(sp) # 8-byte Folded Reload
; RV64-NEXT: fld fs2, 72(sp) # 8-byte Folded Reload
; RV64-NEXT: fld fs3, 64(sp) # 8-byte Folded Reload
; RV64-NEXT: fld fs4, 56(sp) # 8-byte Folded Reload
; RV64-NEXT: fld fs5, 48(sp) # 8-byte Folded Reload
; RV64-NEXT: fld fs6, 40(sp) # 8-byte Folded Reload
; RV64-NEXT: fld fs7, 32(sp) # 8-byte Folded Reload
; RV64-NEXT: fld fs8, 24(sp) # 8-byte Folded Reload
; RV64-NEXT: fld fs9, 16(sp) # 8-byte Folded Reload
; RV64-NEXT: fld fs10, 8(sp) # 8-byte Folded Reload
; RV64-NEXT: fld fs11, 0(sp) # 8-byte Folded Reload
; RV64-NEXT: addi sp, sp, 96
; RV64-NEXT: ret		; RV64-NEXT: ret
%v0 = insertelement <32 x float> poison, float %e0, i64 0		%v0 = insertelement <32 x float> poison, float %e0, i64 0
%v1 = insertelement <32 x float> %v0, float %e1, i64 1		%v1 = insertelement <32 x float> %v0, float %e1, i64 1
%v2 = insertelement <32 x float> %v1, float %e2, i64 2		%v2 = insertelement <32 x float> %v1, float %e2, i64 2
%v3 = insertelement <32 x float> %v2, float %e3, i64 3		%v3 = insertelement <32 x float> %v2, float %e3, i64 3
%v4 = insertelement <32 x float> %v3, float %e4, i64 4		%v4 = insertelement <32 x float> %v3, float %e4, i64 4
%v5 = insertelement <32 x float> %v4, float %e5, i64 5		%v5 = insertelement <32 x float> %v4, float %e5, i64 5
%v6 = insertelement <32 x float> %v5, float %e6, i64 6		%v6 = insertelement <32 x float> %v5, float %e6, i64 6
Show All 21 Lines	; RV64-NEXT: ret
%v28 = insertelement <32 x float> %v27, float %e28, i64 28		%v28 = insertelement <32 x float> %v27, float %e28, i64 28
%v29 = insertelement <32 x float> %v28, float %e29, i64 29		%v29 = insertelement <32 x float> %v28, float %e29, i64 29
%v30 = insertelement <32 x float> %v29, float %e30, i64 30		%v30 = insertelement <32 x float> %v29, float %e30, i64 30
%v31 = insertelement <32 x float> %v30, float %e31, i64 31		%v31 = insertelement <32 x float> %v30, float %e31, i64 31
ret <32 x float> %v31		ret <32 x float> %v31
}		}

define <8 x double> @buildvec_v8f64(double %e0, double %e1, double %e2, double %e3, double %e4, double %e5, double %e6, double %e7) {		define <8 x double> @buildvec_v8f64(double %e0, double %e1, double %e2, double %e3, double %e4, double %e5, double %e6, double %e7) {
; CHECK-LABEL: buildvec_v8f64:		; RV32-LABEL: buildvec_v8f64:
; CHECK: # %bb.0:		; RV32: # %bb.0:
; CHECK-NEXT: vsetivli zero, 8, e64, m4, ta, ma		; RV32-NEXT: addi sp, sp, -128
; CHECK-NEXT: vfslide1down.vf v8, v8, fa0		; RV32-NEXT: .cfi_def_cfa_offset 128
; CHECK-NEXT: vfslide1down.vf v8, v8, fa1		; RV32-NEXT: sw ra, 124(sp) # 4-byte Folded Spill
; CHECK-NEXT: vfslide1down.vf v8, v8, fa2		; RV32-NEXT: sw s0, 120(sp) # 4-byte Folded Spill
; CHECK-NEXT: vfslide1down.vf v8, v8, fa3		; RV32-NEXT: .cfi_offset ra, -4
; CHECK-NEXT: vfslide1down.vf v8, v8, fa4		; RV32-NEXT: .cfi_offset s0, -8
; CHECK-NEXT: vfslide1down.vf v8, v8, fa5		; RV32-NEXT: addi s0, sp, 128
; CHECK-NEXT: vfslide1down.vf v8, v8, fa6		; RV32-NEXT: .cfi_def_cfa s0, 0
; CHECK-NEXT: vfslide1down.vf v8, v8, fa7		; RV32-NEXT: andi sp, sp, -64
; CHECK-NEXT: ret		; RV32-NEXT: fsd fa7, 56(sp)
		; RV32-NEXT: fsd fa6, 48(sp)
		; RV32-NEXT: fsd fa5, 40(sp)
		; RV32-NEXT: fsd fa4, 32(sp)
		; RV32-NEXT: fsd fa3, 24(sp)
		; RV32-NEXT: fsd fa2, 16(sp)
		; RV32-NEXT: fsd fa1, 8(sp)
		; RV32-NEXT: fsd fa0, 0(sp)
		; RV32-NEXT: mv a0, sp
		; RV32-NEXT: vsetivli zero, 8, e64, m4, ta, ma
		; RV32-NEXT: vle64.v v8, (a0)
		; RV32-NEXT: addi sp, s0, -128
		; RV32-NEXT: lw ra, 124(sp) # 4-byte Folded Reload
		; RV32-NEXT: lw s0, 120(sp) # 4-byte Folded Reload
		; RV32-NEXT: addi sp, sp, 128
		; RV32-NEXT: ret
		;
		; RV64-LABEL: buildvec_v8f64:
		; RV64: # %bb.0:
		; RV64-NEXT: addi sp, sp, -128
		; RV64-NEXT: .cfi_def_cfa_offset 128
		; RV64-NEXT: sd ra, 120(sp) # 8-byte Folded Spill
		; RV64-NEXT: sd s0, 112(sp) # 8-byte Folded Spill
		; RV64-NEXT: .cfi_offset ra, -8
		; RV64-NEXT: .cfi_offset s0, -16
		; RV64-NEXT: addi s0, sp, 128
		; RV64-NEXT: .cfi_def_cfa s0, 0
		; RV64-NEXT: andi sp, sp, -64
		; RV64-NEXT: fsd fa7, 56(sp)
		; RV64-NEXT: fsd fa6, 48(sp)
		; RV64-NEXT: fsd fa5, 40(sp)
		; RV64-NEXT: fsd fa4, 32(sp)
		; RV64-NEXT: fsd fa3, 24(sp)
		; RV64-NEXT: fsd fa2, 16(sp)
		; RV64-NEXT: fsd fa1, 8(sp)
		; RV64-NEXT: fsd fa0, 0(sp)
		; RV64-NEXT: mv a0, sp
		; RV64-NEXT: vsetivli zero, 8, e64, m4, ta, ma
		; RV64-NEXT: vle64.v v8, (a0)
		; RV64-NEXT: addi sp, s0, -128
		; RV64-NEXT: ld ra, 120(sp) # 8-byte Folded Reload
		; RV64-NEXT: ld s0, 112(sp) # 8-byte Folded Reload
		; RV64-NEXT: addi sp, sp, 128
		; RV64-NEXT: ret
%v0 = insertelement <8 x double> poison, double %e0, i64 0		%v0 = insertelement <8 x double> poison, double %e0, i64 0
%v1 = insertelement <8 x double> %v0, double %e1, i64 1		%v1 = insertelement <8 x double> %v0, double %e1, i64 1
%v2 = insertelement <8 x double> %v1, double %e2, i64 2		%v2 = insertelement <8 x double> %v1, double %e2, i64 2
%v3 = insertelement <8 x double> %v2, double %e3, i64 3		%v3 = insertelement <8 x double> %v2, double %e3, i64 3
%v4 = insertelement <8 x double> %v3, double %e4, i64 4		%v4 = insertelement <8 x double> %v3, double %e4, i64 4
%v5 = insertelement <8 x double> %v4, double %e5, i64 5		%v5 = insertelement <8 x double> %v4, double %e5, i64 5
%v6 = insertelement <8 x double> %v5, double %e6, i64 6		%v6 = insertelement <8 x double> %v5, double %e6, i64 6
%v7 = insertelement <8 x double> %v6, double %e7, i64 7		%v7 = insertelement <8 x double> %v6, double %e7, i64 7
ret <8 x double> %v7		ret <8 x double> %v7
}		}

define <16 x double> @buildvec_v16f64(double %e0, double %e1, double %e2, double %e3, double %e4, double %e5, double %e6, double %e7, double %e8, double %e9, double %e10, double %e11, double %e12, double %e13, double %e14, double %e15) {		define <16 x double> @buildvec_v16f64(double %e0, double %e1, double %e2, double %e3, double %e4, double %e5, double %e6, double %e7, double %e8, double %e9, double %e10, double %e11, double %e12, double %e13, double %e14, double %e15) {
; RV32-LABEL: buildvec_v16f64:		; RV32-LABEL: buildvec_v16f64:
; RV32: # %bb.0:		; RV32: # %bb.0:
; RV32-NEXT: addi sp, sp, -16		; RV32-NEXT: addi sp, sp, -384
; RV32-NEXT: .cfi_def_cfa_offset 16		; RV32-NEXT: .cfi_def_cfa_offset 384
; RV32-NEXT: sw a6, 8(sp)		; RV32-NEXT: sw ra, 380(sp) # 4-byte Folded Spill
; RV32-NEXT: sw a7, 12(sp)		; RV32-NEXT: sw s0, 376(sp) # 4-byte Folded Spill
; RV32-NEXT: fld ft0, 8(sp)		; RV32-NEXT: .cfi_offset ra, -4
; RV32-NEXT: sw a4, 8(sp)		; RV32-NEXT: .cfi_offset s0, -8
; RV32-NEXT: sw a5, 12(sp)		; RV32-NEXT: addi s0, sp, 384
; RV32-NEXT: fld ft1, 8(sp)		; RV32-NEXT: .cfi_def_cfa s0, 0
; RV32-NEXT: sw a2, 8(sp)		; RV32-NEXT: andi sp, sp, -128
; RV32-NEXT: sw a3, 12(sp)		; RV32-NEXT: sw a0, 120(sp)
; RV32-NEXT: fld ft2, 8(sp)		; RV32-NEXT: sw a1, 124(sp)
; RV32-NEXT: sw a0, 8(sp)		; RV32-NEXT: fld ft0, 120(sp)
; RV32-NEXT: sw a1, 12(sp)		; RV32-NEXT: sw a2, 120(sp)
; RV32-NEXT: fld ft3, 8(sp)		; RV32-NEXT: sw a3, 124(sp)
; RV32-NEXT: fld ft4, 40(sp)		; RV32-NEXT: fld ft1, 120(sp)
; RV32-NEXT: fld ft5, 32(sp)		; RV32-NEXT: sw a4, 120(sp)
; RV32-NEXT: fld ft6, 24(sp)		; RV32-NEXT: sw a5, 124(sp)
; RV32-NEXT: fld ft7, 16(sp)		; RV32-NEXT: fld ft2, 120(sp)
		; RV32-NEXT: sw a6, 120(sp)
		; RV32-NEXT: sw a7, 124(sp)
		; RV32-NEXT: fld ft3, 120(sp)
		; RV32-NEXT: fld ft4, 24(s0)
		; RV32-NEXT: fld ft5, 16(s0)
		; RV32-NEXT: fld ft6, 8(s0)
		; RV32-NEXT: fld ft7, 0(s0)
		; RV32-NEXT: fsd ft4, 248(sp)
		; RV32-NEXT: fsd ft5, 240(sp)
		; RV32-NEXT: fsd ft6, 232(sp)
		; RV32-NEXT: fsd ft7, 224(sp)
		; RV32-NEXT: fsd fa7, 184(sp)
		; RV32-NEXT: fsd fa6, 176(sp)
		; RV32-NEXT: fsd fa5, 168(sp)
		; RV32-NEXT: fsd fa4, 160(sp)
		; RV32-NEXT: fsd fa3, 152(sp)
		; RV32-NEXT: fsd fa2, 144(sp)
		; RV32-NEXT: fsd fa1, 136(sp)
		; RV32-NEXT: fsd fa0, 128(sp)
		; RV32-NEXT: fsd ft3, 216(sp)
		; RV32-NEXT: fsd ft2, 208(sp)
		; RV32-NEXT: fsd ft1, 200(sp)
		; RV32-NEXT: fsd ft0, 192(sp)
		; RV32-NEXT: addi a0, sp, 128
; RV32-NEXT: vsetivli zero, 16, e64, m8, ta, ma		; RV32-NEXT: vsetivli zero, 16, e64, m8, ta, ma
; RV32-NEXT: vfslide1down.vf v8, v8, fa0		; RV32-NEXT: vle64.v v8, (a0)
; RV32-NEXT: vfslide1down.vf v8, v8, fa1		; RV32-NEXT: addi sp, s0, -384
; RV32-NEXT: vfslide1down.vf v8, v8, fa2		; RV32-NEXT: lw ra, 380(sp) # 4-byte Folded Reload
; RV32-NEXT: vfslide1down.vf v8, v8, fa3		; RV32-NEXT: lw s0, 376(sp) # 4-byte Folded Reload
; RV32-NEXT: vfslide1down.vf v8, v8, fa4		; RV32-NEXT: addi sp, sp, 384
; RV32-NEXT: vfslide1down.vf v8, v8, fa5
; RV32-NEXT: vfslide1down.vf v8, v8, fa6
; RV32-NEXT: vfslide1down.vf v8, v8, fa7
; RV32-NEXT: vfslide1down.vf v8, v8, ft3
; RV32-NEXT: vfslide1down.vf v8, v8, ft2
; RV32-NEXT: vfslide1down.vf v8, v8, ft1
; RV32-NEXT: vfslide1down.vf v8, v8, ft0
; RV32-NEXT: vfslide1down.vf v8, v8, ft7
; RV32-NEXT: vfslide1down.vf v8, v8, ft6
; RV32-NEXT: vfslide1down.vf v8, v8, ft5
; RV32-NEXT: vfslide1down.vf v8, v8, ft4
; RV32-NEXT: addi sp, sp, 16
; RV32-NEXT: ret		; RV32-NEXT: ret
;		;
; RV64-LABEL: buildvec_v16f64:		; RV64-LABEL: buildvec_v16f64:
; RV64: # %bb.0:		; RV64: # %bb.0:
; RV64-NEXT: fmv.d.x ft0, a7		; RV64-NEXT: addi sp, sp, -256
; RV64-NEXT: fmv.d.x ft1, a6		; RV64-NEXT: .cfi_def_cfa_offset 256
; RV64-NEXT: fmv.d.x ft2, a5		; RV64-NEXT: sd ra, 248(sp) # 8-byte Folded Spill
; RV64-NEXT: fmv.d.x ft3, a4		; RV64-NEXT: sd s0, 240(sp) # 8-byte Folded Spill
; RV64-NEXT: fmv.d.x ft4, a3		; RV64-NEXT: .cfi_offset ra, -8
; RV64-NEXT: fmv.d.x ft5, a2		; RV64-NEXT: .cfi_offset s0, -16
; RV64-NEXT: fmv.d.x ft6, a1		; RV64-NEXT: addi s0, sp, 256
; RV64-NEXT: fmv.d.x ft7, a0		; RV64-NEXT: .cfi_def_cfa s0, 0
		; RV64-NEXT: andi sp, sp, -128
		; RV64-NEXT: sd a7, 120(sp)
		; RV64-NEXT: sd a6, 112(sp)
		; RV64-NEXT: sd a5, 104(sp)
		; RV64-NEXT: sd a4, 96(sp)
		; RV64-NEXT: sd a3, 88(sp)
		; RV64-NEXT: sd a2, 80(sp)
		; RV64-NEXT: sd a1, 72(sp)
		; RV64-NEXT: sd a0, 64(sp)
		; RV64-NEXT: fsd fa7, 56(sp)
		; RV64-NEXT: fsd fa6, 48(sp)
		; RV64-NEXT: fsd fa5, 40(sp)
		; RV64-NEXT: fsd fa4, 32(sp)
		; RV64-NEXT: fsd fa3, 24(sp)
		; RV64-NEXT: fsd fa2, 16(sp)
		; RV64-NEXT: fsd fa1, 8(sp)
		; RV64-NEXT: fsd fa0, 0(sp)
		; RV64-NEXT: mv a0, sp
; RV64-NEXT: vsetivli zero, 16, e64, m8, ta, ma		; RV64-NEXT: vsetivli zero, 16, e64, m8, ta, ma
; RV64-NEXT: vfslide1down.vf v8, v8, fa0		; RV64-NEXT: vle64.v v8, (a0)
; RV64-NEXT: vfslide1down.vf v8, v8, fa1		; RV64-NEXT: addi sp, s0, -256
; RV64-NEXT: vfslide1down.vf v8, v8, fa2		; RV64-NEXT: ld ra, 248(sp) # 8-byte Folded Reload
; RV64-NEXT: vfslide1down.vf v8, v8, fa3		; RV64-NEXT: ld s0, 240(sp) # 8-byte Folded Reload
; RV64-NEXT: vfslide1down.vf v8, v8, fa4		; RV64-NEXT: addi sp, sp, 256
; RV64-NEXT: vfslide1down.vf v8, v8, fa5
; RV64-NEXT: vfslide1down.vf v8, v8, fa6
; RV64-NEXT: vfslide1down.vf v8, v8, fa7
; RV64-NEXT: vfslide1down.vf v8, v8, ft7
; RV64-NEXT: vfslide1down.vf v8, v8, ft6
; RV64-NEXT: vfslide1down.vf v8, v8, ft5
; RV64-NEXT: vfslide1down.vf v8, v8, ft4
; RV64-NEXT: vfslide1down.vf v8, v8, ft3
; RV64-NEXT: vfslide1down.vf v8, v8, ft2
; RV64-NEXT: vfslide1down.vf v8, v8, ft1
; RV64-NEXT: vfslide1down.vf v8, v8, ft0
; RV64-NEXT: ret		; RV64-NEXT: ret
%v0 = insertelement <16 x double> poison, double %e0, i64 0		%v0 = insertelement <16 x double> poison, double %e0, i64 0
%v1 = insertelement <16 x double> %v0, double %e1, i64 1		%v1 = insertelement <16 x double> %v0, double %e1, i64 1
%v2 = insertelement <16 x double> %v1, double %e2, i64 2		%v2 = insertelement <16 x double> %v1, double %e2, i64 2
%v3 = insertelement <16 x double> %v2, double %e3, i64 3		%v3 = insertelement <16 x double> %v2, double %e3, i64 3
%v4 = insertelement <16 x double> %v3, double %e4, i64 4		%v4 = insertelement <16 x double> %v3, double %e4, i64 4
%v5 = insertelement <16 x double> %v4, double %e5, i64 5		%v5 = insertelement <16 x double> %v4, double %e5, i64 5
%v6 = insertelement <16 x double> %v5, double %e6, i64 6		%v6 = insertelement <16 x double> %v5, double %e6, i64 6
%v7 = insertelement <16 x double> %v6, double %e7, i64 7		%v7 = insertelement <16 x double> %v6, double %e7, i64 7
%v8 = insertelement <16 x double> %v7, double %e8, i64 8		%v8 = insertelement <16 x double> %v7, double %e8, i64 8
%v9 = insertelement <16 x double> %v8, double %e9, i64 9		%v9 = insertelement <16 x double> %v8, double %e9, i64 9
%v10 = insertelement <16 x double> %v9, double %e10, i64 10		%v10 = insertelement <16 x double> %v9, double %e10, i64 10
%v11 = insertelement <16 x double> %v10, double %e11, i64 11		%v11 = insertelement <16 x double> %v10, double %e11, i64 11
%v12 = insertelement <16 x double> %v11, double %e12, i64 12		%v12 = insertelement <16 x double> %v11, double %e12, i64 12
%v13 = insertelement <16 x double> %v12, double %e13, i64 13		%v13 = insertelement <16 x double> %v12, double %e13, i64 13
%v14 = insertelement <16 x double> %v13, double %e14, i64 14		%v14 = insertelement <16 x double> %v13, double %e14, i64 14
%v15 = insertelement <16 x double> %v14, double %e15, i64 15		%v15 = insertelement <16 x double> %v14, double %e15, i64 15
ret <16 x double> %v15		ret <16 x double> %v15
}		}

define <32 x double> @buildvec_v32f64(double %e0, double %e1, double %e2, double %e3, double %e4, double %e5, double %e6, double %e7, double %e8, double %e9, double %e10, double %e11, double %e12, double %e13, double %e14, double %e15, double %e16, double %e17, double %e18, double %e19, double %e20, double %e21, double %e22, double %e23, double %e24, double %e25, double %e26, double %e27, double %e28, double %e29, double %e30, double %e31) {		define <32 x double> @buildvec_v32f64(double %e0, double %e1, double %e2, double %e3, double %e4, double %e5, double %e6, double %e7, double %e8, double %e9, double %e10, double %e11, double %e12, double %e13, double %e14, double %e15, double %e16, double %e17, double %e18, double %e19, double %e20, double %e21, double %e22, double %e23, double %e24, double %e25, double %e26, double %e27, double %e28, double %e29, double %e30, double %e31) {
; RV32-LABEL: buildvec_v32f64:		; RV32-LABEL: buildvec_v32f64:
; RV32: # %bb.0:		; RV32: # %bb.0:
; RV32-NEXT: addi sp, sp, -112		; RV32-NEXT: addi sp, sp, -512
; RV32-NEXT: .cfi_def_cfa_offset 112		; RV32-NEXT: .cfi_def_cfa_offset 512
; RV32-NEXT: fsd fs0, 104(sp) # 8-byte Folded Spill		; RV32-NEXT: sw ra, 508(sp) # 4-byte Folded Spill
; RV32-NEXT: fsd fs1, 96(sp) # 8-byte Folded Spill		; RV32-NEXT: sw s0, 504(sp) # 4-byte Folded Spill
; RV32-NEXT: fsd fs2, 88(sp) # 8-byte Folded Spill		; RV32-NEXT: fsd fs0, 496(sp) # 8-byte Folded Spill
; RV32-NEXT: fsd fs3, 80(sp) # 8-byte Folded Spill		; RV32-NEXT: fsd fs1, 488(sp) # 8-byte Folded Spill
; RV32-NEXT: fsd fs4, 72(sp) # 8-byte Folded Spill		; RV32-NEXT: fsd fs2, 480(sp) # 8-byte Folded Spill
; RV32-NEXT: fsd fs5, 64(sp) # 8-byte Folded Spill		; RV32-NEXT: fsd fs3, 472(sp) # 8-byte Folded Spill
; RV32-NEXT: fsd fs6, 56(sp) # 8-byte Folded Spill		; RV32-NEXT: fsd fs4, 464(sp) # 8-byte Folded Spill
; RV32-NEXT: fsd fs7, 48(sp) # 8-byte Folded Spill		; RV32-NEXT: fsd fs5, 456(sp) # 8-byte Folded Spill
; RV32-NEXT: fsd fs8, 40(sp) # 8-byte Folded Spill		; RV32-NEXT: fsd fs6, 448(sp) # 8-byte Folded Spill
; RV32-NEXT: fsd fs9, 32(sp) # 8-byte Folded Spill		; RV32-NEXT: fsd fs7, 440(sp) # 8-byte Folded Spill
; RV32-NEXT: fsd fs10, 24(sp) # 8-byte Folded Spill		; RV32-NEXT: fsd fs8, 432(sp) # 8-byte Folded Spill
; RV32-NEXT: fsd fs11, 16(sp) # 8-byte Folded Spill		; RV32-NEXT: fsd fs9, 424(sp) # 8-byte Folded Spill
; RV32-NEXT: .cfi_offset fs0, -8		; RV32-NEXT: fsd fs10, 416(sp) # 8-byte Folded Spill
; RV32-NEXT: .cfi_offset fs1, -16		; RV32-NEXT: fsd fs11, 408(sp) # 8-byte Folded Spill
; RV32-NEXT: .cfi_offset fs2, -24		; RV32-NEXT: .cfi_offset ra, -4
; RV32-NEXT: .cfi_offset fs3, -32		; RV32-NEXT: .cfi_offset s0, -8
; RV32-NEXT: .cfi_offset fs4, -40		; RV32-NEXT: .cfi_offset fs0, -16
; RV32-NEXT: .cfi_offset fs5, -48		; RV32-NEXT: .cfi_offset fs1, -24
; RV32-NEXT: .cfi_offset fs6, -56		; RV32-NEXT: .cfi_offset fs2, -32
; RV32-NEXT: .cfi_offset fs7, -64		; RV32-NEXT: .cfi_offset fs3, -40
; RV32-NEXT: .cfi_offset fs8, -72		; RV32-NEXT: .cfi_offset fs4, -48
; RV32-NEXT: .cfi_offset fs9, -80		; RV32-NEXT: .cfi_offset fs5, -56
; RV32-NEXT: .cfi_offset fs10, -88		; RV32-NEXT: .cfi_offset fs6, -64
; RV32-NEXT: .cfi_offset fs11, -96		; RV32-NEXT: .cfi_offset fs7, -72
; RV32-NEXT: sw a6, 8(sp)		; RV32-NEXT: .cfi_offset fs8, -80
; RV32-NEXT: sw a7, 12(sp)		; RV32-NEXT: .cfi_offset fs9, -88
; RV32-NEXT: fld ft0, 8(sp)		; RV32-NEXT: .cfi_offset fs10, -96
; RV32-NEXT: sw a4, 8(sp)		; RV32-NEXT: .cfi_offset fs11, -104
; RV32-NEXT: sw a5, 12(sp)		; RV32-NEXT: addi s0, sp, 512
; RV32-NEXT: fld ft1, 8(sp)		; RV32-NEXT: .cfi_def_cfa s0, 0
; RV32-NEXT: sw a2, 8(sp)		; RV32-NEXT: andi sp, sp, -128
; RV32-NEXT: sw a3, 12(sp)		; RV32-NEXT: sw a0, 120(sp)
; RV32-NEXT: fld ft2, 8(sp)		; RV32-NEXT: sw a1, 124(sp)
; RV32-NEXT: sw a0, 8(sp)		; RV32-NEXT: fld ft0, 120(sp)
; RV32-NEXT: sw a1, 12(sp)		; RV32-NEXT: sw a2, 120(sp)
; RV32-NEXT: fld ft3, 8(sp)		; RV32-NEXT: sw a3, 124(sp)
; RV32-NEXT: fld ft4, 264(sp)		; RV32-NEXT: fld ft1, 120(sp)
; RV32-NEXT: fld ft5, 256(sp)		; RV32-NEXT: sw a4, 120(sp)
; RV32-NEXT: fld ft6, 248(sp)		; RV32-NEXT: sw a5, 124(sp)
; RV32-NEXT: fld ft7, 240(sp)		; RV32-NEXT: fld ft2, 120(sp)
; RV32-NEXT: fld ft8, 232(sp)		; RV32-NEXT: sw a6, 120(sp)
; RV32-NEXT: fld ft9, 224(sp)		; RV32-NEXT: sw a7, 124(sp)
; RV32-NEXT: fld ft10, 216(sp)		; RV32-NEXT: fld ft3, 120(sp)
; RV32-NEXT: fld ft11, 208(sp)		; RV32-NEXT: fld ft4, 0(s0)
; RV32-NEXT: fld fs0, 200(sp)		; RV32-NEXT: fld ft5, 8(s0)
; RV32-NEXT: fld fs1, 192(sp)		; RV32-NEXT: fld ft6, 16(s0)
; RV32-NEXT: fld fs2, 184(sp)		; RV32-NEXT: fld ft7, 24(s0)
; RV32-NEXT: fld fs3, 176(sp)		; RV32-NEXT: fld ft8, 32(s0)
; RV32-NEXT: fld fs4, 168(sp)		; RV32-NEXT: fld ft9, 40(s0)
; RV32-NEXT: fld fs5, 160(sp)		; RV32-NEXT: fld ft10, 48(s0)
; RV32-NEXT: fld fs6, 152(sp)		; RV32-NEXT: fld ft11, 56(s0)
; RV32-NEXT: fld fs7, 144(sp)		; RV32-NEXT: fld fs0, 64(s0)
; RV32-NEXT: fld fs8, 136(sp)		; RV32-NEXT: fld fs1, 72(s0)
; RV32-NEXT: fld fs9, 128(sp)		; RV32-NEXT: fld fs2, 80(s0)
; RV32-NEXT: fld fs10, 120(sp)		; RV32-NEXT: fld fs3, 88(s0)
; RV32-NEXT: fld fs11, 112(sp)		; RV32-NEXT: fld fs4, 96(s0)
		; RV32-NEXT: fld fs5, 104(s0)
		; RV32-NEXT: fld fs6, 112(s0)
		; RV32-NEXT: fld fs7, 120(s0)
		; RV32-NEXT: fld fs8, 152(s0)
		; RV32-NEXT: fld fs9, 144(s0)
		; RV32-NEXT: fld fs10, 136(s0)
		; RV32-NEXT: fld fs11, 128(s0)
		; RV32-NEXT: fsd fs8, 248(sp)
		; RV32-NEXT: fsd fs9, 240(sp)
		; RV32-NEXT: fsd fs10, 232(sp)
		; RV32-NEXT: fsd fs11, 224(sp)
		; RV32-NEXT: fsd fs7, 216(sp)
		; RV32-NEXT: fsd fs6, 208(sp)
		; RV32-NEXT: fsd fs5, 200(sp)
		; RV32-NEXT: fsd fs4, 192(sp)
		; RV32-NEXT: fsd fs3, 184(sp)
		; RV32-NEXT: fsd fs2, 176(sp)
		; RV32-NEXT: fsd fs1, 168(sp)
		; RV32-NEXT: fsd fs0, 160(sp)
		; RV32-NEXT: fsd ft11, 152(sp)
		; RV32-NEXT: fsd ft10, 144(sp)
		; RV32-NEXT: fsd ft9, 136(sp)
		; RV32-NEXT: fsd ft8, 128(sp)
		; RV32-NEXT: fsd ft7, 376(sp)
		; RV32-NEXT: fsd ft6, 368(sp)
		; RV32-NEXT: fsd ft5, 360(sp)
		; RV32-NEXT: fsd ft4, 352(sp)
		; RV32-NEXT: fsd fa7, 312(sp)
		; RV32-NEXT: fsd fa6, 304(sp)
		; RV32-NEXT: fsd fa5, 296(sp)
		; RV32-NEXT: fsd fa4, 288(sp)
		; RV32-NEXT: fsd fa3, 280(sp)
		; RV32-NEXT: fsd fa2, 272(sp)
		; RV32-NEXT: fsd fa1, 264(sp)
		; RV32-NEXT: fsd fa0, 256(sp)
		; RV32-NEXT: fsd ft3, 344(sp)
		; RV32-NEXT: fsd ft2, 336(sp)
		; RV32-NEXT: fsd ft1, 328(sp)
		; RV32-NEXT: fsd ft0, 320(sp)
		; RV32-NEXT: addi a0, sp, 128
; RV32-NEXT: vsetivli zero, 16, e64, m8, ta, ma		; RV32-NEXT: vsetivli zero, 16, e64, m8, ta, ma
; RV32-NEXT: vfslide1down.vf v8, v8, fa0		; RV32-NEXT: vle64.v v16, (a0)
; RV32-NEXT: vfslide1down.vf v8, v8, fa1		; RV32-NEXT: addi a0, sp, 256
; RV32-NEXT: vfslide1down.vf v8, v8, fa2		; RV32-NEXT: vle64.v v8, (a0)
; RV32-NEXT: vfslide1down.vf v8, v8, fa3		; RV32-NEXT: addi sp, s0, -512
; RV32-NEXT: vfslide1down.vf v8, v8, fa4		; RV32-NEXT: lw ra, 508(sp) # 4-byte Folded Reload
; RV32-NEXT: vfslide1down.vf v8, v8, fa5		; RV32-NEXT: lw s0, 504(sp) # 4-byte Folded Reload
; RV32-NEXT: vfslide1down.vf v8, v8, fa6		; RV32-NEXT: fld fs0, 496(sp) # 8-byte Folded Reload
; RV32-NEXT: vfslide1down.vf v8, v8, fa7		; RV32-NEXT: fld fs1, 488(sp) # 8-byte Folded Reload
; RV32-NEXT: vfslide1down.vf v8, v8, ft3		; RV32-NEXT: fld fs2, 480(sp) # 8-byte Folded Reload
; RV32-NEXT: vfslide1down.vf v8, v8, ft2		; RV32-NEXT: fld fs3, 472(sp) # 8-byte Folded Reload
; RV32-NEXT: vfslide1down.vf v8, v8, ft1		; RV32-NEXT: fld fs4, 464(sp) # 8-byte Folded Reload
; RV32-NEXT: vfslide1down.vf v8, v8, ft0		; RV32-NEXT: fld fs5, 456(sp) # 8-byte Folded Reload
; RV32-NEXT: vfslide1down.vf v8, v8, fs11		; RV32-NEXT: fld fs6, 448(sp) # 8-byte Folded Reload
; RV32-NEXT: vfslide1down.vf v8, v8, fs10		; RV32-NEXT: fld fs7, 440(sp) # 8-byte Folded Reload
; RV32-NEXT: vfslide1down.vf v8, v8, fs9		; RV32-NEXT: fld fs8, 432(sp) # 8-byte Folded Reload
; RV32-NEXT: vfslide1down.vf v8, v8, fs8		; RV32-NEXT: fld fs9, 424(sp) # 8-byte Folded Reload
; RV32-NEXT: vfslide1down.vf v16, v8, fs7		; RV32-NEXT: fld fs10, 416(sp) # 8-byte Folded Reload
; RV32-NEXT: vfslide1down.vf v16, v16, fs6		; RV32-NEXT: fld fs11, 408(sp) # 8-byte Folded Reload
; RV32-NEXT: vfslide1down.vf v16, v16, fs5		; RV32-NEXT: addi sp, sp, 512
; RV32-NEXT: vfslide1down.vf v16, v16, fs4
; RV32-NEXT: vfslide1down.vf v16, v16, fs3
; RV32-NEXT: vfslide1down.vf v16, v16, fs2
; RV32-NEXT: vfslide1down.vf v16, v16, fs1
; RV32-NEXT: vfslide1down.vf v16, v16, fs0
; RV32-NEXT: vfslide1down.vf v16, v16, ft11
; RV32-NEXT: vfslide1down.vf v16, v16, ft10
; RV32-NEXT: vfslide1down.vf v16, v16, ft9
; RV32-NEXT: vfslide1down.vf v16, v16, ft8
; RV32-NEXT: vfslide1down.vf v16, v16, ft7
; RV32-NEXT: vfslide1down.vf v16, v16, ft6
; RV32-NEXT: vfslide1down.vf v16, v16, ft5
; RV32-NEXT: vfslide1down.vf v16, v16, ft4
; RV32-NEXT: fld fs0, 104(sp) # 8-byte Folded Reload
; RV32-NEXT: fld fs1, 96(sp) # 8-byte Folded Reload
; RV32-NEXT: fld fs2, 88(sp) # 8-byte Folded Reload
; RV32-NEXT: fld fs3, 80(sp) # 8-byte Folded Reload
; RV32-NEXT: fld fs4, 72(sp) # 8-byte Folded Reload
; RV32-NEXT: fld fs5, 64(sp) # 8-byte Folded Reload
; RV32-NEXT: fld fs6, 56(sp) # 8-byte Folded Reload
; RV32-NEXT: fld fs7, 48(sp) # 8-byte Folded Reload
; RV32-NEXT: fld fs8, 40(sp) # 8-byte Folded Reload
; RV32-NEXT: fld fs9, 32(sp) # 8-byte Folded Reload
; RV32-NEXT: fld fs10, 24(sp) # 8-byte Folded Reload
; RV32-NEXT: fld fs11, 16(sp) # 8-byte Folded Reload
; RV32-NEXT: addi sp, sp, 112
; RV32-NEXT: ret		; RV32-NEXT: ret
;		;
; RV64-LABEL: buildvec_v32f64:		; RV64-LABEL: buildvec_v32f64:
; RV64: # %bb.0:		; RV64: # %bb.0:
; RV64-NEXT: addi sp, sp, -96		; RV64-NEXT: addi sp, sp, -384
; RV64-NEXT: .cfi_def_cfa_offset 96		; RV64-NEXT: .cfi_def_cfa_offset 384
; RV64-NEXT: fsd fs0, 88(sp) # 8-byte Folded Spill		; RV64-NEXT: sd ra, 376(sp) # 8-byte Folded Spill
; RV64-NEXT: fsd fs1, 80(sp) # 8-byte Folded Spill		; RV64-NEXT: sd s0, 368(sp) # 8-byte Folded Spill
; RV64-NEXT: fsd fs2, 72(sp) # 8-byte Folded Spill		; RV64-NEXT: fsd fs0, 360(sp) # 8-byte Folded Spill
; RV64-NEXT: fsd fs3, 64(sp) # 8-byte Folded Spill		; RV64-NEXT: fsd fs1, 352(sp) # 8-byte Folded Spill
; RV64-NEXT: fsd fs4, 56(sp) # 8-byte Folded Spill		; RV64-NEXT: fsd fs2, 344(sp) # 8-byte Folded Spill
; RV64-NEXT: fsd fs5, 48(sp) # 8-byte Folded Spill		; RV64-NEXT: fsd fs3, 336(sp) # 8-byte Folded Spill
; RV64-NEXT: fsd fs6, 40(sp) # 8-byte Folded Spill		; RV64-NEXT: .cfi_offset ra, -8
; RV64-NEXT: fsd fs7, 32(sp) # 8-byte Folded Spill		; RV64-NEXT: .cfi_offset s0, -16
; RV64-NEXT: fsd fs8, 24(sp) # 8-byte Folded Spill		; RV64-NEXT: .cfi_offset fs0, -24
; RV64-NEXT: fsd fs9, 16(sp) # 8-byte Folded Spill		; RV64-NEXT: .cfi_offset fs1, -32
; RV64-NEXT: fsd fs10, 8(sp) # 8-byte Folded Spill		; RV64-NEXT: .cfi_offset fs2, -40
; RV64-NEXT: fsd fs11, 0(sp) # 8-byte Folded Spill		; RV64-NEXT: .cfi_offset fs3, -48
; RV64-NEXT: .cfi_offset fs0, -8		; RV64-NEXT: addi s0, sp, 384
; RV64-NEXT: .cfi_offset fs1, -16		; RV64-NEXT: .cfi_def_cfa s0, 0
; RV64-NEXT: .cfi_offset fs2, -24		; RV64-NEXT: andi sp, sp, -128
; RV64-NEXT: .cfi_offset fs3, -32		; RV64-NEXT: fld ft0, 0(s0)
; RV64-NEXT: .cfi_offset fs4, -40		; RV64-NEXT: fld ft1, 8(s0)
; RV64-NEXT: .cfi_offset fs5, -48		; RV64-NEXT: fld ft2, 16(s0)
; RV64-NEXT: .cfi_offset fs6, -56		; RV64-NEXT: fld ft3, 24(s0)
; RV64-NEXT: .cfi_offset fs7, -64		; RV64-NEXT: fld ft4, 32(s0)
; RV64-NEXT: .cfi_offset fs8, -72		; RV64-NEXT: fld ft5, 40(s0)
; RV64-NEXT: .cfi_offset fs9, -80		; RV64-NEXT: fld ft6, 48(s0)
; RV64-NEXT: .cfi_offset fs10, -88		; RV64-NEXT: fld ft7, 56(s0)
; RV64-NEXT: .cfi_offset fs11, -96		; RV64-NEXT: fld ft8, 64(s0)
; RV64-NEXT: fmv.d.x ft0, a7		; RV64-NEXT: fld ft9, 72(s0)
; RV64-NEXT: fmv.d.x ft1, a6		; RV64-NEXT: fld ft10, 80(s0)
; RV64-NEXT: fmv.d.x ft2, a5		; RV64-NEXT: fld ft11, 88(s0)
; RV64-NEXT: fmv.d.x ft3, a4		; RV64-NEXT: fld fs0, 96(s0)
; RV64-NEXT: fmv.d.x ft4, a3		; RV64-NEXT: fld fs1, 104(s0)
; RV64-NEXT: fmv.d.x ft5, a2		; RV64-NEXT: fld fs2, 112(s0)
; RV64-NEXT: fmv.d.x ft6, a1		; RV64-NEXT: fld fs3, 120(s0)
; RV64-NEXT: fmv.d.x ft7, a0		; RV64-NEXT: sd a7, 248(sp)
; RV64-NEXT: fld ft8, 216(sp)		; RV64-NEXT: sd a6, 240(sp)
; RV64-NEXT: fld ft9, 208(sp)		; RV64-NEXT: sd a5, 232(sp)
; RV64-NEXT: fld ft10, 200(sp)		; RV64-NEXT: sd a4, 224(sp)
; RV64-NEXT: fld ft11, 192(sp)		; RV64-NEXT: sd a3, 216(sp)
; RV64-NEXT: fld fs0, 184(sp)		; RV64-NEXT: sd a2, 208(sp)
; RV64-NEXT: fld fs1, 176(sp)		; RV64-NEXT: sd a1, 200(sp)
; RV64-NEXT: fld fs2, 168(sp)		; RV64-NEXT: sd a0, 192(sp)
; RV64-NEXT: fld fs3, 160(sp)		; RV64-NEXT: fsd fa7, 184(sp)
; RV64-NEXT: fld fs4, 152(sp)		; RV64-NEXT: fsd fa6, 176(sp)
; RV64-NEXT: fld fs5, 144(sp)		; RV64-NEXT: fsd fa5, 168(sp)
; RV64-NEXT: fld fs6, 136(sp)		; RV64-NEXT: fsd fa4, 160(sp)
; RV64-NEXT: fld fs7, 128(sp)		; RV64-NEXT: fsd fa3, 152(sp)
; RV64-NEXT: fld fs8, 120(sp)		; RV64-NEXT: fsd fa2, 144(sp)
; RV64-NEXT: fld fs9, 112(sp)		; RV64-NEXT: fsd fa1, 136(sp)
; RV64-NEXT: fld fs10, 104(sp)		; RV64-NEXT: fsd fa0, 128(sp)
; RV64-NEXT: fld fs11, 96(sp)		; RV64-NEXT: fsd fs3, 120(sp)
		; RV64-NEXT: fsd fs2, 112(sp)
		; RV64-NEXT: fsd fs1, 104(sp)
		; RV64-NEXT: fsd fs0, 96(sp)
		; RV64-NEXT: fsd ft11, 88(sp)
		; RV64-NEXT: fsd ft10, 80(sp)
		; RV64-NEXT: fsd ft9, 72(sp)
		; RV64-NEXT: fsd ft8, 64(sp)
		; RV64-NEXT: fsd ft7, 56(sp)
		; RV64-NEXT: fsd ft6, 48(sp)
		; RV64-NEXT: fsd ft5, 40(sp)
		; RV64-NEXT: fsd ft4, 32(sp)
		; RV64-NEXT: fsd ft3, 24(sp)
		; RV64-NEXT: fsd ft2, 16(sp)
		; RV64-NEXT: fsd ft1, 8(sp)
		; RV64-NEXT: fsd ft0, 0(sp)
		; RV64-NEXT: addi a0, sp, 128
; RV64-NEXT: vsetivli zero, 16, e64, m8, ta, ma		; RV64-NEXT: vsetivli zero, 16, e64, m8, ta, ma
; RV64-NEXT: vfslide1down.vf v8, v8, fa0		; RV64-NEXT: vle64.v v8, (a0)
; RV64-NEXT: vfslide1down.vf v8, v8, fa1		; RV64-NEXT: mv a0, sp
; RV64-NEXT: vfslide1down.vf v8, v8, fa2		; RV64-NEXT: vle64.v v16, (a0)
; RV64-NEXT: vfslide1down.vf v8, v8, fa3		; RV64-NEXT: addi sp, s0, -384
; RV64-NEXT: vfslide1down.vf v8, v8, fa4		; RV64-NEXT: ld ra, 376(sp) # 8-byte Folded Reload
; RV64-NEXT: vfslide1down.vf v8, v8, fa5		; RV64-NEXT: ld s0, 368(sp) # 8-byte Folded Reload
; RV64-NEXT: vfslide1down.vf v8, v8, fa6		; RV64-NEXT: fld fs0, 360(sp) # 8-byte Folded Reload
; RV64-NEXT: vfslide1down.vf v8, v8, fa7		; RV64-NEXT: fld fs1, 352(sp) # 8-byte Folded Reload
; RV64-NEXT: vfslide1down.vf v8, v8, ft7		; RV64-NEXT: fld fs2, 344(sp) # 8-byte Folded Reload
; RV64-NEXT: vfslide1down.vf v8, v8, ft6		; RV64-NEXT: fld fs3, 336(sp) # 8-byte Folded Reload
; RV64-NEXT: vfslide1down.vf v8, v8, ft5		; RV64-NEXT: addi sp, sp, 384
; RV64-NEXT: vfslide1down.vf v8, v8, ft4
; RV64-NEXT: vfslide1down.vf v8, v8, ft3
; RV64-NEXT: vfslide1down.vf v8, v8, ft2
; RV64-NEXT: vfslide1down.vf v8, v8, ft1
; RV64-NEXT: vfslide1down.vf v8, v8, ft0
; RV64-NEXT: vfslide1down.vf v16, v8, fs11
; RV64-NEXT: vfslide1down.vf v16, v16, fs10
; RV64-NEXT: vfslide1down.vf v16, v16, fs9
; RV64-NEXT: vfslide1down.vf v16, v16, fs8
; RV64-NEXT: vfslide1down.vf v16, v16, fs7
; RV64-NEXT: vfslide1down.vf v16, v16, fs6
; RV64-NEXT: vfslide1down.vf v16, v16, fs5
; RV64-NEXT: vfslide1down.vf v16, v16, fs4
; RV64-NEXT: vfslide1down.vf v16, v16, fs3
; RV64-NEXT: vfslide1down.vf v16, v16, fs2
; RV64-NEXT: vfslide1down.vf v16, v16, fs1
; RV64-NEXT: vfslide1down.vf v16, v16, fs0
; RV64-NEXT: vfslide1down.vf v16, v16, ft11
; RV64-NEXT: vfslide1down.vf v16, v16, ft10
; RV64-NEXT: vfslide1down.vf v16, v16, ft9
; RV64-NEXT: vfslide1down.vf v16, v16, ft8
; RV64-NEXT: fld fs0, 88(sp) # 8-byte Folded Reload
; RV64-NEXT: fld fs1, 80(sp) # 8-byte Folded Reload
; RV64-NEXT: fld fs2, 72(sp) # 8-byte Folded Reload
; RV64-NEXT: fld fs3, 64(sp) # 8-byte Folded Reload
; RV64-NEXT: fld fs4, 56(sp) # 8-byte Folded Reload
; RV64-NEXT: fld fs5, 48(sp) # 8-byte Folded Reload
; RV64-NEXT: fld fs6, 40(sp) # 8-byte Folded Reload
; RV64-NEXT: fld fs7, 32(sp) # 8-byte Folded Reload
; RV64-NEXT: fld fs8, 24(sp) # 8-byte Folded Reload
; RV64-NEXT: fld fs9, 16(sp) # 8-byte Folded Reload
; RV64-NEXT: fld fs10, 8(sp) # 8-byte Folded Reload
; RV64-NEXT: fld fs11, 0(sp) # 8-byte Folded Reload
; RV64-NEXT: addi sp, sp, 96
; RV64-NEXT: ret		; RV64-NEXT: ret
%v0 = insertelement <32 x double> poison, double %e0, i64 0		%v0 = insertelement <32 x double> poison, double %e0, i64 0
%v1 = insertelement <32 x double> %v0, double %e1, i64 1		%v1 = insertelement <32 x double> %v0, double %e1, i64 1
%v2 = insertelement <32 x double> %v1, double %e2, i64 2		%v2 = insertelement <32 x double> %v1, double %e2, i64 2
%v3 = insertelement <32 x double> %v2, double %e3, i64 3		%v3 = insertelement <32 x double> %v2, double %e3, i64 3
%v4 = insertelement <32 x double> %v3, double %e4, i64 4		%v4 = insertelement <32 x double> %v3, double %e4, i64 4
%v5 = insertelement <32 x double> %v4, double %e5, i64 5		%v5 = insertelement <32 x double> %v4, double %e5, i64 5
%v6 = insertelement <32 x double> %v5, double %e6, i64 6		%v6 = insertelement <32 x double> %v5, double %e6, i64 6
Show All 27 Lines