This is an archive of the discontinued LLVM Phabricator instance.

Paths

Table of Contentst

-
llvm/
-
include/llvm/CodeGen/
-
llvm/
-
CodeGen/
-
TargetFrameLowering.h
-
lib/
-
CodeGen/
-
PrologEpilogInserter.cpp
-
Target/AArch64/
-
AArch64/
-
AArch64FrameLowering.h
4/5
AArch64FrameLowering.cpp
-
AArch64MachineFunctionInfo.h
-
AArch64RegisterInfo.cpp
-
test/CodeGen/AArch64/
-
CodeGen/
-
AArch64/
-
debug-info-sve-dbg-value.mir
-
framelayout-sve-calleesaves-fix.mir
-
framelayout-sve.ll
-
framelayout-sve.mir
-
named-vector-shuffle-reverse-sve.ll
-
split-vector-insert.ll
1/2
sve-calling-convention-mixed.ll
-
sve-extract-vector.ll
-
sve-insert-vector.ll
-
sve-pred-arith.ll
-
sve-split-extract-elt.ll
-
sve-split-insert-elt.ll
-
sve-split-int-pred-reduce.ll
-
sve-tailcall.ll
-
sve-trunc.ll
-
unwind-preserved.ll

Differential D97193

[AArch64][SVE] Ensure hasFP has a consistent return value
AbandonedPublic

Authored by bsmith on Feb 22 2021, 7:15 AM.

Download Raw Diff

Details

Reviewers

peterwaller-arm
joechrisellis
sdesmalen
efriedma
ggouaillardet

Summary

Do the necessary FP profitability checks once, in a new pre CSR spilling
function, referring to that in hasFP. Also ensure that hasFP returns true
prior to this calculation.

This fixes various codegen issues caused by an inconsistent return value
of hasFP, such as PR49217.

Diff Detail

Repository: rG LLVM Github Monorepo

Unit TestsFailed

	Time	Test
	50 ms	x64 debian > Flang.Semantics::resolve102.f90

Event Timeline

bsmith created this revision.Feb 22 2021, 7:15 AM

Herald added a reviewer: efriedma. · View Herald TranscriptFeb 22 2021, 7:15 AM

Herald added subscribers: psnobl, hiraditya, kristof.beyls, tschuett. · View Herald Transcript

bsmith requested review of this revision.Feb 22 2021, 7:15 AM

Herald added a project: Restricted Project. · View Herald TranscriptFeb 22 2021, 7:15 AM

Herald added a subscriber: llvm-commits. · View Herald Transcript

bsmith added a reviewer: ggouaillardet.Feb 22 2021, 7:16 AM

Harbormaster completed remote builds in B90214: Diff 325439.Feb 22 2021, 8:03 AM

sdesmalen added inline comments.Feb 24 2021, 3:29 AM

llvm/lib/Target/AArch64/AArch64FrameLowering.cpp
377	nit: maybe add a TODO/FIXME comment to say that this approach is probably temporary and may be removed in the future when LocalStackSlotAllocation works on multiple StackIDs. (as that will have created virtual base pointers, so there's no long the need to always force the availability of the FP).
2957	Given that the approach is probably temporary, does it necessarily need a new generic callback, or could this be called from early-on in determineCalleeSaves?
2961	This can probably do with an early bail-out if it is not compiling for SVE.
llvm/test/CodeGen/AArch64/sve-calling-convention-mixed.ll
45	Why does this function not require the frame-pointer? (it has both locals for passing GPRs and ZPRs)

huihuiz added a subscriber: huihuiz.Feb 24 2021, 10:01 AM

efriedma added inline comments.Feb 24 2021, 2:14 PM

llvm/lib/Target/AArch64/AArch64FrameLowering.cpp
383	My team was testing out this patch internally, and this mechanism doesn't work quite as expected. Specifically, changing the value of hasFP() after register allocation has a bad interaction with register scavenging. If hasFP() returns false, the frame lowering code can decide to reserve FP as the emergency spill, so we don't allocate an emergency spill slot. But register scavenging doesn't realize this: it queries MachineRegisterInfo::isReserved(), which is cached from before register allocation. So in rare cases, scavenging can't find a register, and we can hit the fatal error "Cannot scavenge register without an emergency spill slot!" One possible solution here is to change AArch64RegisterInfo::getReservedRegs() so it doesn't depend on hasCalculatedSVEShouldUseFP(), so the reserved registers don't change after regalloc. Currently don't have a testcase I can share; let me know if you need one, and I'll try to come up with something.

Always explicitly reserve x29 when building for SVE
Add comments to indicate the fact that this is a temporary change
Add early bailout when not building for SVE

llvm/lib/Target/AArch64/AArch64FrameLowering.cpp
2957	Ideally probably not, however `determineCalleeSaves` is actually called from more that just `PrologEpilogInserter`, hence it makes more sense to call this directly from `PrologEpilogInserter` rather than `determineCalleeSaves`.
llvm/test/CodeGen/AArch64/sve-calling-convention-mixed.ll
45	Unfortunately I think this is just going to have to be a deficiency in this approach and will have to get fixed when done properly. The issue here is that when `processFunctionBeforeCalleeSpill()` is called the stack has only one object on it (the SVE one), the non-SVE objects only appear during `assignCalleeSavedSpillSlots()` in `PrologEpilogInserter`, which is done after `determineCalleeSaves()`. The calculation of whether an FP should be used can't be delayed until after this point otherwise you end up with rogue frame pointer setup where it isn't used.

Harbormaster completed remote builds in B91355: Diff 327136.Mar 1 2021, 10:47 AM

Fix new test that appeared after rebase.

Harbormaster completed remote builds in B91549: Diff 327417.Mar 2 2021, 6:13 AM

Given this approach has other downsides (namely reserving x29 all the time for SVE), I think instead of doing this I'll revert the previous patch this fixes, and wait until we have a better approach for this.

bsmith mentioned this in D98350: Revert "[AArch64][SVE] Allow accesses to SVE stack objects to use frame pointer".Mar 10 2021, 7:10 AM

bsmith mentioned this in rGea834c8365ca: Revert "[AArch64][SVE] Allow accesses to SVE stack objects to use frame pointer".Mar 11 2021, 5:33 AM

Revision Contents

Path

Size

llvm/

include/

llvm/

CodeGen/

TargetFrameLowering.h

5 lines

lib/

CodeGen/

PrologEpilogInserter.cpp

4 lines

Target/

AArch64/

AArch64FrameLowering.h

2 lines

AArch64FrameLowering.cpp

56 lines

AArch64MachineFunctionInfo.h

22 lines

AArch64RegisterInfo.cpp

14 lines

test/

CodeGen/

AArch64/

debug-info-sve-dbg-value.mir

4 lines

framelayout-sve-calleesaves-fix.mir

6 lines

framelayout-sve.ll

86 lines

framelayout-sve.mir

104 lines

named-vector-shuffle-reverse-sve.ll

76 lines

split-vector-insert.ll

12 lines

sve-calling-convention-mixed.ll

27 lines

sve-extract-vector.ll

16 lines

sve-insert-vector.ll

32 lines

sve-pred-arith.ll

12 lines

sve-split-extract-elt.ll

42 lines

sve-split-insert-elt.ll

30 lines

sve-split-int-pred-reduce.ll

6 lines

sve-tailcall.ll

8 lines

sve-trunc.ll

6 lines

unwind-preserved.ll

40 lines

Diff 327417

llvm/include/llvm/CodeGen/TargetFrameLowering.h

Show First 20 Lines • Show All 338 Lines • ▼ Show 20 Lines	public:
/// This method also sets up the register scavenger ensuring there is a free		/// This method also sets up the register scavenger ensuring there is a free
/// register or a frameindex available.		/// register or a frameindex available.
/// This method should not be called by any passes outside of PEI, because		/// This method should not be called by any passes outside of PEI, because
/// it may change state passed in by \p MF and \p RS. The preferred		/// it may change state passed in by \p MF and \p RS. The preferred
/// interface outside PEI is getCalleeSaves.		/// interface outside PEI is getCalleeSaves.
virtual void determineCalleeSaves(MachineFunction &MF, BitVector &SavedRegs,		virtual void determineCalleeSaves(MachineFunction &MF, BitVector &SavedRegs,
RegScavenger *RS = nullptr) const;		RegScavenger *RS = nullptr) const;

		/// processFunctionBeforeCalleeSpill - This method is called immediately
		/// before the specified function's callee saved registers are calculated and
		/// spilled. This method is optional.
		virtual void processFunctionBeforeCalleeSpill(MachineFunction &MF) const {}

/// processFunctionBeforeFrameFinalized - This method is called immediately		/// processFunctionBeforeFrameFinalized - This method is called immediately
/// before the specified function's frame layout (MF.getFrameInfo()) is		/// before the specified function's frame layout (MF.getFrameInfo()) is
/// finalized. Once the frame is finalized, MO_FrameIndex operands are		/// finalized. Once the frame is finalized, MO_FrameIndex operands are
/// replaced with direct constants. This method is optional.		/// replaced with direct constants. This method is optional.
///		///
virtual void processFunctionBeforeFrameFinalized(MachineFunction &MF,		virtual void processFunctionBeforeFrameFinalized(MachineFunction &MF,
RegScavenger *RS = nullptr) const {		RegScavenger *RS = nullptr) const {
}		}
▲ Show 20 Lines • Show All 102 Lines • Show Last 20 Lines

llvm/lib/CodeGen/PrologEpilogInserter.cpp

Show First 20 Lines • Show All 230 Lines • ▼ Show 20 Lines	bool PEI::runOnMachineFunction(MachineFunction &MF) {
// place all spills in the entry block, all restores in return blocks.		// place all spills in the entry block, all restores in return blocks.
calculateSaveRestoreBlocks(MF);		calculateSaveRestoreBlocks(MF);

// Stash away DBG_VALUEs that should not be moved by insertion of prolog code.		// Stash away DBG_VALUEs that should not be moved by insertion of prolog code.
SavedDbgValuesMap EntryDbgValues;		SavedDbgValuesMap EntryDbgValues;
for (MachineBasicBlock *SaveBlock : SaveBlocks)		for (MachineBasicBlock *SaveBlock : SaveBlocks)
stashEntryDbgValues(*SaveBlock, EntryDbgValues);		stashEntryDbgValues(*SaveBlock, EntryDbgValues);

		// Allow the target to make preperations to a function before the callee
		// registers are calculated and spilled.
		TFI->processFunctionBeforeCalleeSpill(MF);

// Handle CSR spilling and restoring, for targets that need it.		// Handle CSR spilling and restoring, for targets that need it.
if (MF.getTarget().usesPhysRegsForValues())		if (MF.getTarget().usesPhysRegsForValues())
spillCalleeSavedRegs(MF);		spillCalleeSavedRegs(MF);

// Allow the target machine to make final modifications to the function		// Allow the target machine to make final modifications to the function
// before the frame layout is finalized.		// before the frame layout is finalized.
TFI->processFunctionBeforeFrameFinalized(MF, RS);		TFI->processFunctionBeforeFrameFinalized(MF, RS);

▲ Show 20 Lines • Show All 1,073 Lines • Show Last 20 Lines

llvm/lib/Target/AArch64/AArch64FrameLowering.h

Show First 20 Lines • Show All 77 Lines • ▼ Show 20 Lines	public:
/// Returns true if the target will correctly handle shrink wrapping.		/// Returns true if the target will correctly handle shrink wrapping.
bool enableShrinkWrapping(const MachineFunction &MF) const override {		bool enableShrinkWrapping(const MachineFunction &MF) const override {
return true;		return true;
}		}

bool enableStackSlotScavenging(const MachineFunction &MF) const override;		bool enableStackSlotScavenging(const MachineFunction &MF) const override;
TargetStackID::Value getStackIDForScalableVectors() const override;		TargetStackID::Value getStackIDForScalableVectors() const override;

		void processFunctionBeforeCalleeSpill(MachineFunction &MF) const override;

void processFunctionBeforeFrameFinalized(MachineFunction &MF,		void processFunctionBeforeFrameFinalized(MachineFunction &MF,
RegScavenger *RS) const override;		RegScavenger *RS) const override;

void		void
processFunctionBeforeFrameIndicesReplaced(MachineFunction &MF,		processFunctionBeforeFrameIndicesReplaced(MachineFunction &MF,
RegScavenger *RS) const override;		RegScavenger *RS) const override;

unsigned getWinEHParentFrameOffset(const MachineFunction &MF) const override;		unsigned getWinEHParentFrameOffset(const MachineFunction &MF) const override;
▲ Show 20 Lines • Show All 62 Lines • Show Last 20 Lines

llvm/lib/Target/AArch64/AArch64FrameLowering.cpp

Show First 20 Lines • Show All 341 Lines • ▼ Show 20 Lines	return !(MFI.hasCalls() \|\| hasFP(MF) \|\| NumBytes > RedZoneSize \|\|
getSVEStackSize(MF));		getSVEStackSize(MF));
}		}

/// hasFP - Return true if the specified function should have a dedicated frame		/// hasFP - Return true if the specified function should have a dedicated frame
/// pointer register.		/// pointer register.
bool AArch64FrameLowering::hasFP(const MachineFunction &MF) const {		bool AArch64FrameLowering::hasFP(const MachineFunction &MF) const {
const MachineFrameInfo &MFI = MF.getFrameInfo();		const MachineFrameInfo &MFI = MF.getFrameInfo();
const AArch64FunctionInfo *AFI = MF.getInfo<AArch64FunctionInfo>();		const AArch64FunctionInfo *AFI = MF.getInfo<AArch64FunctionInfo>();
const TargetRegisterInfo *RegInfo = MF.getSubtarget().getRegisterInfo();		const AArch64Subtarget &STI = MF.getSubtarget<AArch64Subtarget>();
		const TargetRegisterInfo *RegInfo = STI.getRegisterInfo();
// Win64 EH requires a frame pointer if funclets are present, as the locals		// Win64 EH requires a frame pointer if funclets are present, as the locals
// are accessed off the frame pointer in both the parent function and the		// are accessed off the frame pointer in both the parent function and the
// funclets.		// funclets.
if (MF.hasEHFunclets())		if (MF.hasEHFunclets())
return true;		return true;
// Retain behavior of always omitting the FP for leaf functions when possible.		// Retain behavior of always omitting the FP for leaf functions when possible.
if (MF.getTarget().Options.DisableFramePointerElim(MF))		if (MF.getTarget().Options.DisableFramePointerElim(MF))
return true;		return true;
if (MFI.hasVarSizedObjects() \|\| MFI.isFrameAddressTaken() \|\|		if (MFI.hasVarSizedObjects() \|\| MFI.isFrameAddressTaken() \|\|
MFI.hasStackMap() \|\| MFI.hasPatchPoint() \|\|		MFI.hasStackMap() \|\| MFI.hasPatchPoint() \|\|
RegInfo->needsStackRealignment(MF))		RegInfo->needsStackRealignment(MF))
return true;		return true;
// With large callframes around we may need to use FP to access the scavenging		// With large callframes around we may need to use FP to access the scavenging
// emergency spillslot.		// emergency spillslot.
//		//
// Unfortunately some calls to hasFP() like machine verifier ->		// Unfortunately some calls to hasFP() like machine verifier ->
// getReservedReg() -> hasFP in the middle of global isel are too early		// getReservedReg() -> hasFP in the middle of global isel are too early
// to know the max call frame size. Hopefully conservatively returning "true"		// to know the max call frame size. Hopefully conservatively returning "true"
// in those cases is fine.		// in those cases is fine.
// DefaultSafeSPDisplacement is fine as we only emergency spill GP regs.		// DefaultSafeSPDisplacement is fine as we only emergency spill GP regs.
if (!MFI.isMaxCallFrameSizeComputed() \|\|		if (!MFI.isMaxCallFrameSizeComputed() \|\|
MFI.getMaxCallFrameSize() > DefaultSafeSPDisplacement)		MFI.getMaxCallFrameSize() > DefaultSafeSPDisplacement)
return true;		return true;
// If there are both SVE and non-SVE objects on the stack, make the frame
// pointer available since it may be more performant to use it.		// FIXME: Once LocalStackSlotAllocation works on multiple StackIDs, the below
uint64_t CalleeStackSize = AFI->isCalleeSavedStackSizeComputed()		// code can be removed, along with the changes in getReservedRegs().
		sdesmalenUnsubmitted Done Reply Inline Actions nit: maybe add a TODO/FIXME comment to say that this approach is probably temporary and may be removed in the future when LocalStackSlotAllocation works on multiple StackIDs. (as that will have created virtual base pointers, so there's no long the need to always force the availability of the FP). sdesmalen: nit: maybe add a TODO/FIXME comment to say that this approach is probably temporary and may be…
? AFI->getCalleeSavedStackSize()		// Only perform the below in the presence of SVE so as to avoid reserving x29
: 0;		// unnecessarily.
uint64_t NonSVEStackSize = MFI.getStackSize() - CalleeStackSize;		if (STI.hasSVE()) {
if (AFI->getStackSizeSVE() && NonSVEStackSize)		// If we have not yet determined if we should be using the FP then as above
		// we must be conservative and return true. Unfortunatly this will cause x29
		// to always be reserved in the presence of SVE, which is a trade off for
		efriedmaUnsubmitted Done Reply Inline Actions My team was testing out this patch internally, and this mechanism doesn't work quite as expected. Specifically, changing the value of hasFP() after register allocation has a bad interaction with register scavenging. If hasFP() returns false, the frame lowering code can decide to reserve FP as the emergency spill, so we don't allocate an emergency spill slot. But register scavenging doesn't realize this: it queries MachineRegisterInfo::isReserved(), which is cached from before register allocation. So in rare cases, scavenging can't find a register, and we can hit the fatal error "Cannot scavenge register without an emergency spill slot!" One possible solution here is to change AArch64RegisterInfo::getReservedRegs() so it doesn't depend on hasCalculatedSVEShouldUseFP(), so the reserved registers don't change after regalloc. Currently don't have a testcase I can share; let me know if you need one, and I'll try to come up with something. efriedma: My team was testing out this patch internally, and this mechanism doesn't work quite as…
		// the large gains using a frame pointer can provide.
		if (!AFI->hasCalculatedSVEShouldUseFP())
return true;		return true;

		return AFI->getSVEShouldUseFP();
		}

return false;		return false;
}		}

/// hasReservedCallFrame - Under normal circumstances, when a frame pointer is		/// hasReservedCallFrame - Under normal circumstances, when a frame pointer is
/// not required, we reserve argument space for call sites in the function		/// not required, we reserve argument space for call sites in the function
/// immediately on entry to the current function. This eliminates the need for		/// immediately on entry to the current function. This eliminates the need for
/// add/sub sp brackets around call sites. Returns true if the call frame is		/// add/sub sp brackets around call sites. Returns true if the call frame is
/// included as part of the stack frame.		/// included as part of the stack frame.
▲ Show 20 Lines • Show All 2,550 Lines • ▼ Show 20 Lines
}		}

int64_t AArch64FrameLowering::assignSVEStackObjectOffsets(		int64_t AArch64FrameLowering::assignSVEStackObjectOffsets(
MachineFrameInfo &MFI, int &MinCSFrameIndex, int &MaxCSFrameIndex) const {		MachineFrameInfo &MFI, int &MinCSFrameIndex, int &MaxCSFrameIndex) const {
return determineSVEStackObjectOffsets(MFI, MinCSFrameIndex, MaxCSFrameIndex,		return determineSVEStackObjectOffsets(MFI, MinCSFrameIndex, MaxCSFrameIndex,
true);		true);
}		}

		// FIXME: Once LocalStackSlotAllocation works on multiple StackIDs, this
		sdesmalenUnsubmitted Not Done Reply Inline Actions Given that the approach is probably temporary, does it necessarily need a new generic callback, or could this be called from early-on in determineCalleeSaves? sdesmalen: Given that the approach is probably temporary, does it necessarily need a new generic callback…
		bsmithAuthorUnsubmitted Done Reply Inline Actions Ideally probably not, however `determineCalleeSaves` is actually called from more that just `PrologEpilogInserter`, hence it makes more sense to call this directly from `PrologEpilogInserter` rather than `determineCalleeSaves`. bsmith: Ideally probably not, however `determineCalleeSaves` is actually called from more that just…
		// function can be removed.
		void AArch64FrameLowering::processFunctionBeforeCalleeSpill(MachineFunction &MF) const {
		Lint: Pre-merge checks Inline Actions clang-format: please reformat the code -void AArch64FrameLowering::processFunctionBeforeCalleeSpill(MachineFunction &MF) const { +void AArch64FrameLowering::processFunctionBeforeCalleeSpill( + MachineFunction &MF) const { Lint: Pre-merge checks: clang-format: please reformat the code ``` -void AArch64FrameLowering…
		MachineFrameInfo &MFI = MF.getFrameInfo();
		AArch64FunctionInfo *AFI = MF.getInfo<AArch64FunctionInfo>();
		sdesmalenUnsubmitted Done Reply Inline Actions This can probably do with an early bail-out if it is not compiling for SVE. sdesmalen: This can probably do with an early bail-out if it is not compiling for SVE.
		const AArch64Subtarget &STI = MF.getSubtarget<AArch64Subtarget>();

		// If we are not building with SVE then there is no reason to calculate the
		// below.
		if (!STI.hasSVE())
		return;

		// Determine whether this function should use a frame pointer or not. This
		// calculation should only be done once so as to avoid changing our mind if
		// the stack objects change.
		assert(!AFI->hasCalculatedSVEShouldUseFP());

		// If there are both SVE and non-SVE objects on the stack, make the frame
		// pointer available since it may be more performant to use it.
		bool HasSVEStackObjects = false, HasNonSVEStackObjects = false;
		for (int I = MFI.getObjectIndexBegin(), E = MFI.getObjectIndexEnd(); I != E;
		++I)
		if (MFI.getStackID(I) == TargetStackID::ScalableVector)
		HasSVEStackObjects = true;
		else
		HasNonSVEStackObjects = true;

		AFI->setSVEShouldUseFP(HasSVEStackObjects && HasNonSVEStackObjects);
		}

void AArch64FrameLowering::processFunctionBeforeFrameFinalized(		void AArch64FrameLowering::processFunctionBeforeFrameFinalized(
MachineFunction &MF, RegScavenger *RS) const {		MachineFunction &MF, RegScavenger *RS) const {
MachineFrameInfo &MFI = MF.getFrameInfo();		MachineFrameInfo &MFI = MF.getFrameInfo();

assert(getStackGrowthDirection() == TargetFrameLowering::StackGrowsDown &&		assert(getStackGrowthDirection() == TargetFrameLowering::StackGrowsDown &&
"Upwards growing stack unsupported");		"Upwards growing stack unsupported");

int MinCSFrameIndex, MaxCSFrameIndex;		int MinCSFrameIndex, MaxCSFrameIndex;
▲ Show 20 Lines • Show All 626 Lines • Show Last 20 Lines

llvm/lib/Target/AArch64/AArch64MachineFunctionInfo.h

Show First 20 Lines • Show All 112 Lines • ▼ Show 20 Lines	class AArch64FunctionInfo final : public MachineFunctionInfo {
/// SVE stack size (for predicates and data vectors) are maintained here		/// SVE stack size (for predicates and data vectors) are maintained here
/// rather than in FrameInfo, as the placement and Stack IDs are target		/// rather than in FrameInfo, as the placement and Stack IDs are target
/// specific.		/// specific.
uint64_t StackSizeSVE = 0;		uint64_t StackSizeSVE = 0;

/// HasCalculatedStackSizeSVE indicates whether StackSizeSVE is valid.		/// HasCalculatedStackSizeSVE indicates whether StackSizeSVE is valid.
bool HasCalculatedStackSizeSVE = false;		bool HasCalculatedStackSizeSVE = false;

		/// SVEShouldUseFP indicates whether the frame pointer should be used based
		/// upon which types of stack objects are present (SVE and non-SVE).
		bool SVEShouldUseFP = false;

		/// HasCalculatedSVEShouldUseFP indicates whether SVEShouldUseFP is valid.
		bool HasCalculatedSVEShouldUseFP = false;

/// Has a value when it is known whether or not the function uses a		/// Has a value when it is known whether or not the function uses a
/// redzone, and no value otherwise.		/// redzone, and no value otherwise.
/// Initialized during frame lowering, unless the function has the noredzone		/// Initialized during frame lowering, unless the function has the noredzone
/// attribute, in which case it is set to false at construction.		/// attribute, in which case it is set to false at construction.
Optional<bool> HasRedZone;		Optional<bool> HasRedZone;

/// ForwardedMustTailRegParms - A list of virtual and physical registers		/// ForwardedMustTailRegParms - A list of virtual and physical registers
/// that must be forwarded to every musttail call.		/// that must be forwarded to every musttail call.
▲ Show 20 Lines • Show All 47 Lines • ▼ Show 20 Lines	public:

void setStackSizeSVE(uint64_t S) {		void setStackSizeSVE(uint64_t S) {
HasCalculatedStackSizeSVE = true;		HasCalculatedStackSizeSVE = true;
StackSizeSVE = S;		StackSizeSVE = S;
}		}

uint64_t getStackSizeSVE() const { return StackSizeSVE; }		uint64_t getStackSizeSVE() const { return StackSizeSVE; }

		bool hasCalculatedSVEShouldUseFP() const {
		return HasCalculatedSVEShouldUseFP;
		}

		void setSVEShouldUseFP(bool S) {
		HasCalculatedSVEShouldUseFP = true;
		SVEShouldUseFP = S;
		}

		bool getSVEShouldUseFP() const { return SVEShouldUseFP; }

bool hasStackFrame() const { return HasStackFrame; }		bool hasStackFrame() const { return HasStackFrame; }
void setHasStackFrame(bool s) { HasStackFrame = s; }		void setHasStackFrame(bool s) { HasStackFrame = s; }

bool isStackRealigned() const { return StackRealigned; }		bool isStackRealigned() const { return StackRealigned; }
void setStackRealigned(bool s) { StackRealigned = s; }		void setStackRealigned(bool s) { StackRealigned = s; }

bool hasCalleeSaveStackFreeSpace() const {		bool hasCalleeSaveStackFreeSpace() const {
return CalleeSaveStackHasFreeSpace;		return CalleeSaveStackHasFreeSpace;
▲ Show 20 Lines • Show All 51 Lines • ▼ Show 20 Lines	if (!HasCalleeSavedStackSize \|\| ValidateCalleeSavedStackSize) {
assert((!HasCalleeSavedStackSize \|\| getCalleeSavedStackSize() == Size) &&		assert((!HasCalleeSavedStackSize \|\| getCalleeSavedStackSize() == Size) &&
"Invalid size calculated for callee saves");		"Invalid size calculated for callee saves");
return Size;		return Size;
}		}

return getCalleeSavedStackSize();		return getCalleeSavedStackSize();
}		}

bool isCalleeSavedStackSizeComputed() const {
return HasCalleeSavedStackSize;
}

unsigned getCalleeSavedStackSize() const {		unsigned getCalleeSavedStackSize() const {
assert(HasCalleeSavedStackSize &&		assert(HasCalleeSavedStackSize &&
"CalleeSavedStackSize has not been calculated");		"CalleeSavedStackSize has not been calculated");
return CalleeSavedStackSize;		return CalleeSavedStackSize;
}		}

// Saves the CalleeSavedStackSize for SVE vectors in 'scalable bytes'		// Saves the CalleeSavedStackSize for SVE vectors in 'scalable bytes'
void setSVECalleeSavedStackSize(unsigned Size) {		void setSVECalleeSavedStackSize(unsigned Size) {
▲ Show 20 Lines • Show All 146 Lines • Show Last 20 Lines

llvm/lib/Target/AArch64/AArch64RegisterInfo.cpp

	Show First 20 Lines • Show All 297 Lines • ▼ Show 20 Lines

	const uint32_t *AArch64RegisterInfo::getWindowsStackProbePreservedMask() const {			const uint32_t *AArch64RegisterInfo::getWindowsStackProbePreservedMask() const {
	return CSR_AArch64_StackProbe_Windows_RegMask;			return CSR_AArch64_StackProbe_Windows_RegMask;
	}			}

	BitVector			BitVector
	AArch64RegisterInfo::getReservedRegs(const MachineFunction &MF) const {			AArch64RegisterInfo::getReservedRegs(const MachineFunction &MF) const {
	const AArch64FrameLowering *TFI = getFrameLowering(MF);			const AArch64FrameLowering *TFI = getFrameLowering(MF);
				const AArch64Subtarget &STI = MF.getSubtarget<AArch64Subtarget>();

	// FIXME: avoid re-calculating this every time.			// FIXME: avoid re-calculating this every time.
	BitVector Reserved(getNumRegs());			BitVector Reserved(getNumRegs());
	markSuperRegs(Reserved, AArch64::WSP);			markSuperRegs(Reserved, AArch64::WSP);
	markSuperRegs(Reserved, AArch64::WZR);			markSuperRegs(Reserved, AArch64::WZR);

	if (TFI->hasFP(MF) \|\| TT.isOSDarwin())			// FIXME: Once LocalStackSlotAllocation works on multiple StackIDs and the
				// hasFP() return value doesn't change after frame lowering, SVE no longer
				// needs to always reserve FP.
				// If we have SVE we always reserve the frame pointer. This is because the
				// return of hasFP() can change just before frame lowering. We need to avoid
				// changing the result of getReservedRegs() after register allocation
				// otherwise the cached reserved registers in register scavenging does not
				// match the value here, hence we can get into trouble with the register
				// assigned as the emergency spill.
				if (STI.hasSVE() \|\| TFI->hasFP(MF) \|\| TT.isOSDarwin())
	markSuperRegs(Reserved, AArch64::W29);			markSuperRegs(Reserved, AArch64::W29);

	for (size_t i = 0; i < AArch64::GPR32commonRegClass.getNumRegs(); ++i) {			for (size_t i = 0; i < AArch64::GPR32commonRegClass.getNumRegs(); ++i) {
	if (MF.getSubtarget<AArch64Subtarget>().isXRegisterReserved(i))			if (STI.isXRegisterReserved(i))
	markSuperRegs(Reserved, AArch64::GPR32commonRegClass.getRegister(i));			markSuperRegs(Reserved, AArch64::GPR32commonRegClass.getRegister(i));
	}			}

	if (hasBasePointer(MF))			if (hasBasePointer(MF))
	markSuperRegs(Reserved, AArch64::W19);			markSuperRegs(Reserved, AArch64::W19);

	// SLH uses register W16/X16 as the taint register.			// SLH uses register W16/X16 as the taint register.
	if (MF.getFunction().hasFnAttribute(Attribute::SpeculativeLoadHardening))			if (MF.getFunction().hasFnAttribute(Attribute::SpeculativeLoadHardening))
	▲ Show 20 Lines • Show All 459 Lines • Show Last 20 Lines

llvm/test/CodeGen/AArch64/debug-info-sve-dbg-value.mir

	# RUN: llc -o %t -filetype=obj -start-before=prologepilog %s			# RUN: llc -o %t -filetype=obj -start-before=prologepilog %s
	# RUN: llvm-dwarfdump --name="value0" %t \| FileCheck %s --check-prefix=CHECK0			# RUN: llvm-dwarfdump --name="value0" %t \| FileCheck %s --check-prefix=CHECK0
	# RUN: llvm-dwarfdump --name="value1" %t \| FileCheck %s --check-prefix=CHECK1			# RUN: llvm-dwarfdump --name="value1" %t \| FileCheck %s --check-prefix=CHECK1
	# RUN: llvm-dwarfdump --name="value2" %t \| FileCheck %s --check-prefix=CHECK2			# RUN: llvm-dwarfdump --name="value2" %t \| FileCheck %s --check-prefix=CHECK2
	# RUN: llvm-dwarfdump --name="value3" %t \| FileCheck %s --check-prefix=CHECK3			# RUN: llvm-dwarfdump --name="value3" %t \| FileCheck %s --check-prefix=CHECK3
	# RUN: llvm-dwarfdump --name="value4" %t \| FileCheck %s --check-prefix=CHECK4			# RUN: llvm-dwarfdump --name="value4" %t \| FileCheck %s --check-prefix=CHECK4
	# RUN: llvm-dwarfdump --name="value5" %t \| FileCheck %s --check-prefix=CHECK5			# RUN: llvm-dwarfdump --name="value5" %t \| FileCheck %s --check-prefix=CHECK5

	# CHECK0: : DW_OP_breg31 WSP+8, DW_OP_lit16, DW_OP_plus)			# CHECK0: : DW_OP_breg29 W29+24, DW_OP_lit16, DW_OP_plus)
	# CHECK0: DW_AT_type {{.*}}ty32			# CHECK0: DW_AT_type {{.*}}ty32
	#			#
	# CHECK1: : DW_OP_breg31 WSP+16)			# CHECK1: : DW_OP_breg31 WSP+8, DW_OP_lit16, DW_OP_plus)
	# CHECK1: DW_AT_type {{.*}}ty32			# CHECK1: DW_AT_type {{.*}}ty32
	#			#
	# CHECK2: : DW_OP_breg29 W29+0, DW_OP_lit8, DW_OP_bregx VG+0, DW_OP_mul, DW_OP_minus)			# CHECK2: : DW_OP_breg29 W29+0, DW_OP_lit8, DW_OP_bregx VG+0, DW_OP_mul, DW_OP_minus)
	# CHECK2: DW_AT_type {{.*}}svint32_t			# CHECK2: DW_AT_type {{.*}}svint32_t
	#			#
	# CHECK3: : DW_OP_breg29 W29+0, DW_OP_lit16, DW_OP_bregx VG+0, DW_OP_mul, DW_OP_minus)			# CHECK3: : DW_OP_breg29 W29+0, DW_OP_lit16, DW_OP_bregx VG+0, DW_OP_mul, DW_OP_minus)
	# CHECK3: DW_AT_type {{.*}}svint32_t			# CHECK3: DW_AT_type {{.*}}svint32_t
	#			#
	▲ Show 20 Lines • Show All 107 Lines • Show Last 20 Lines

llvm/test/CodeGen/AArch64/framelayout-sve-calleesaves-fix.mir

	# NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py			# NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	# RUN: llc -mattr=+sve -mtriple=aarch64-none-linux-gnu -start-before=prologepilog %s -o - \| FileCheck %s			# RUN: llc -mattr=+sve -mtriple=aarch64-none-linux-gnu -start-before=prologepilog %s -o - \| FileCheck %s

	--- \|			--- \|
	define aarch64_sve_vector_pcs void @fix_restorepoint_p4() { entry: unreachable }			define aarch64_sve_vector_pcs void @fix_restorepoint_p4() { entry: unreachable }
	; CHECK-LABEL: fix_restorepoint_p4:			; CHECK-LABEL: fix_restorepoint_p4:
	; CHECK: // %bb.0: // %entry			; CHECK: // %bb.0: // %entry
	; CHECK-NEXT: str x29, [sp, #-16]! // 8-byte Folded Spill			; CHECK-NEXT: str x30, [sp, #-16]! // 8-byte Folded Spill
	; CHECK-NEXT: addvl sp, sp, #-2			; CHECK-NEXT: addvl sp, sp, #-2
	; CHECK-NEXT: str p4, [sp, #7, mul vl] // 2-byte Folded Spill			; CHECK-NEXT: str p4, [sp, #7, mul vl] // 2-byte Folded Spill
	; CHECK-NEXT: str z8, [sp, #1, mul vl] // 16-byte Folded Spill			; CHECK-NEXT: str z8, [sp, #1, mul vl] // 16-byte Folded Spill
	; CHECK-NEXT: addvl sp, sp, #-1			; CHECK-NEXT: addvl sp, sp, #-1
	; CHECK-NEXT: .cfi_escape 0x0f, 0x0c, 0x8f, 0x00, 0x11, 0x10, 0x22, 0x11, 0x18, 0x92, 0x2e, 0x00, 0x1e, 0x22 // sp + 16 + 24 * VG			; CHECK-NEXT: .cfi_escape 0x0f, 0x0c, 0x8f, 0x00, 0x11, 0x10, 0x22, 0x11, 0x18, 0x92, 0x2e, 0x00, 0x1e, 0x22 // sp + 16 + 24 * VG
	; CHECK-NEXT: .cfi_escape 0x10, 0x48, 0x0a, 0x11, 0x70, 0x22, 0x11, 0x78, 0x92, 0x2e, 0x00, 0x1e, 0x22 // $d8 @ cfa - 16 - 8 * VG			; CHECK-NEXT: .cfi_escape 0x10, 0x48, 0x0a, 0x11, 0x70, 0x22, 0x11, 0x78, 0x92, 0x2e, 0x00, 0x1e, 0x22 // $d8 @ cfa - 16 - 8 * VG
	; CHECK-NEXT: .cfi_offset w29, -16			; CHECK-NEXT: .cfi_offset w30, -16
	; CHECK-NEXT: // implicit-def: $z8			; CHECK-NEXT: // implicit-def: $z8
	; CHECK-NEXT: // implicit-def: $p4			; CHECK-NEXT: // implicit-def: $p4
	; CHECK-NEXT: addvl sp, sp, #1			; CHECK-NEXT: addvl sp, sp, #1
	; CHECK-NEXT: ldr p4, [sp, #7, mul vl] // 2-byte Folded Reload			; CHECK-NEXT: ldr p4, [sp, #7, mul vl] // 2-byte Folded Reload
	; CHECK-NEXT: ldr z8, [sp, #1, mul vl] // 16-byte Folded Reload			; CHECK-NEXT: ldr z8, [sp, #1, mul vl] // 16-byte Folded Reload
	; CHECK-NEXT: addvl sp, sp, #2			; CHECK-NEXT: addvl sp, sp, #2
	; CHECK-NEXT: ldr x29, [sp], #16 // 8-byte Folded Reload			; CHECK-NEXT: ldr x30, [sp], #16 // 8-byte Folded Reload
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	...			...
	name: fix_restorepoint_p4			name: fix_restorepoint_p4
	stack:			stack:
	- { id: 0, stack-id: scalable-vector, size: 16, alignment: 16 }			- { id: 0, stack-id: scalable-vector, size: 16, alignment: 16 }
	body: \|			body: \|
	bb.0.entry:			bb.0.entry:
	$z8 = IMPLICIT_DEF			$z8 = IMPLICIT_DEF
	$p4 = IMPLICIT_DEF			$p4 = IMPLICIT_DEF
	B %bb.1			B %bb.1

	bb.1.entry:			bb.1.entry:
	RET_ReallyLR			RET_ReallyLR
	---			---

llvm/test/CodeGen/AArch64/framelayout-sve.ll

This file was added.

				; RUN: llc -mtriple=aarch64-linux-gnu -mattr=+sve -o - %s \| FileCheck %s

				; A more end to end test than test/CodeGen/AArch64/framelayout-sve.mir to
				; ensure that hasFP is returning a consistent value throughout.

				; Check that FP is used for SVE stack objects and that SP is used for non-SVE
				; stack objects

				define void @func1(<vscale x 2 x i32> %v0, i32 %v1) {
				; CHECK-LABEL: func1
				; CHECK: st1w { z0.d }, p0, [x29, #-1, mul vl]
				; CHECK: str w0, [sp, #12]
				; CHECK: str w0, [sp, #8]
				; CHECK: str w0, [sp, #4]

				%local0 = alloca <vscale x 2 x i32>
				%local1 = alloca i32
				%local2 = alloca i32
				%local3 = alloca i32
				store volatile <vscale x 2 x i32> %v0, <vscale x 2 x i32>* %local0
				store volatile i32 %v1, i32* %local1
				store volatile i32 %v1, i32* %local2
				store volatile i32 %v1, i32* %local3
				ret void
				}

				; Check that FP is not used when there are no non-SVE objects on the stack

				define void @func2(<vscale x 2 x i32> %v0) {
				; CHECK-LABEL: func2
				; CHECK: st1w { z0.d }, p0, [sp, #1, mul vl]

				%local0 = alloca <vscale x 2 x i32>
				store volatile <vscale x 2 x i32> %v0, <vscale x 2 x i32>* %local0
				ret void
				}

				; Check that FP is not used when there are no SVE objects on the stack

				define void @func3(i32 %v0) {
				; CHECK-LABEL: func3
				; CHECK: str w0, [sp, #12]

				%local0 = alloca i32
				store volatile i32 %v0, i32* %local0
				ret void
				}

				; Check that FP is used appropriatly in the presense of only loads

				define void @func4() {
				; CHECK-LABEL: func4
				; CHECK: ldr w8, [sp, #12]
				; CHECK: ld1w { z0.d }, p0/z, [x29, #-1, mul vl]

				%local0 = alloca i32
				%local1 = alloca <vscale x 2 x i32>
				load volatile i32, i32* %local0
				load volatile <vscale x 2 x i32>, <vscale x 2 x i32>* %local1
				ret void
				}

				; Check that in presence of high register pressure x29 does not get used as a
				; general purpose register when FP is in use

				@var = global [30 x i64] zeroinitializer

				define void @func5(<vscale x 2 x i32> %v0, i32 %v1) {
				; CHECK-LABEL: func5
				; CHECK: mov x29, sp
				; CHECK-NOT: ldr x29
				; CHECK-NOT: str x29

				%val = load volatile [30 x i64], [30 x i64]* @var
				store volatile [30 x i64] %val, [30 x i64]* @var

				%local0 = alloca <vscale x 2 x i32>
				%local1 = alloca i32
				%local2 = alloca i32
				%local3 = alloca i32
				store volatile <vscale x 2 x i32> %v0, <vscale x 2 x i32>* %local0
				store volatile i32 %v1, i32* %local1
				store volatile i32 %v1, i32* %local2
				store volatile i32 %v1, i32* %local3
				ret void
				}

llvm/test/CodeGen/AArch64/framelayout-sve.mir

	Show First 20 Lines • Show All 50 Lines • ▼ Show 20 Lines
	# +----------+			# +----------+
	# \| %stack.1 \| // not scalable			# \| %stack.1 \| // not scalable
	# +----------+ <- SP			# +----------+ <- SP

	# CHECK-LABEL: name: test_allocate_sve			# CHECK-LABEL: name: test_allocate_sve
	# CHECK: stackSize: 32			# CHECK: stackSize: 32

	# CHECK: bb.0.entry:			# CHECK: bb.0.entry:
	# CHECK-NEXT: $sp = frame-setup STRXpre killed $[[SCRATCH:[a-z0-9]+]], $sp, -16			# CHECK-NEXT: $sp = frame-setup STPXpre killed $fp, killed $[[SCRATCH:[a-z0-9]+]], $sp, -2
	# CHECK-NEXT: $fp = frame-setup ADDXri $sp, 0, 0			# CHECK-NEXT: $fp = frame-setup ADDXri $sp, 0, 0
	# CHECK-NEXT: $sp = frame-setup ADDVL_XXI $sp, -2			# CHECK-NEXT: $sp = frame-setup ADDVL_XXI $sp, -2
	# CHECK-NEXT: $sp = frame-setup SUBXri $sp, 16, 0			# CHECK-NEXT: $sp = frame-setup SUBXri $sp, 16, 0
	# CHECK-COUNT-2: frame-setup CFI_INSTRUCTION			# CHECK-COUNT-3: frame-setup CFI_INSTRUCTION

	# CHECK-NEXT: $sp = frame-destroy ADDVL_XXI $sp, 2			# CHECK-NEXT: $sp = frame-destroy ADDVL_XXI $sp, 2
	# CHECK-NEXT: $sp = frame-destroy ADDXri $sp, 16, 0			# CHECK-NEXT: $sp = frame-destroy ADDXri $sp, 16, 0
	# CHECK-NEXT: $sp, $[[SCRATCH]] = frame-destroy LDRXpost $sp, 16			# CHECK-NEXT: $sp, $fp, $[[SCRATCH]] = frame-destroy LDPXpost $sp, 2
	# CHECK-NEXT: RET_ReallyLR			# CHECK-NEXT: RET_ReallyLR

	# ASM-LABEL: test_allocate_sve:			# ASM-LABEL: test_allocate_sve:
	# ASM: .cfi_offset w29, -16			# ASM: .cfi_offset w29, -16
	#			#
	# UNWINDINFO: DW_CFA_offset: reg29 -16			# UNWINDINFO: DW_CFA_offset: reg29 -16
	name: test_allocate_sve			name: test_allocate_sve
	stack:			stack:
	Show All 12 Lines
	# +----------+			# +----------+
	# \| %stack.1 \| // not scalable			# \| %stack.1 \| // not scalable
	# +----------+ <- SP			# +----------+ <- SP

	# CHECK-LABEL: name: test_allocate_sve_gpr_callee_saves			# CHECK-LABEL: name: test_allocate_sve_gpr_callee_saves
	# CHECK: stackSize: 48			# CHECK: stackSize: 48

	# CHECK: bb.0.entry:			# CHECK: bb.0.entry:
	# CHECK-NEXT: $sp = frame-setup STRXpre killed $[[SCRATCH:[a-z0-9]+]], $sp, -32			# CHECK-NEXT: $sp = frame-setup STPXpre killed $fp, killed $[[SCRATCH:[a-z0-9]+]], $sp, -4
	# CHECK-NEXT: frame-setup STPXi killed $x21, killed $x20, $sp, 2			# CHECK-NEXT: frame-setup STPXi killed $x21, killed $x20, $sp, 2
	# CHECK-NEXT: $fp = frame-setup ADDXri $sp, 0, 0			# CHECK-NEXT: $fp = frame-setup ADDXri $sp, 0, 0
	# CHECK-NEXT: $sp = frame-setup ADDVL_XXI $sp, -2			# CHECK-NEXT: $sp = frame-setup ADDVL_XXI $sp, -2
	# CHECK-NEXT: $sp = frame-setup SUBXri $sp, 16, 0			# CHECK-NEXT: $sp = frame-setup SUBXri $sp, 16, 0
	# CHECK-COUNT-4: frame-setup CFI_INSTRUCTION			# CHECK-COUNT-5: frame-setup CFI_INSTRUCTION
	#			#
	# CHECK-NEXT: $x20 = IMPLICIT_DEF			# CHECK-NEXT: $x20 = IMPLICIT_DEF
	# CHECK-NEXT: $x21 = IMPLICIT_DEF			# CHECK-NEXT: $x21 = IMPLICIT_DEF
	# CHECK-NEXT: $sp = frame-destroy ADDVL_XXI $sp, 2			# CHECK-NEXT: $sp = frame-destroy ADDVL_XXI $sp, 2
	# CHECK-NEXT: $sp = frame-destroy ADDXri $sp, 16, 0			# CHECK-NEXT: $sp = frame-destroy ADDXri $sp, 16, 0
	# CHECK-NEXT: $x21, $x20 = frame-destroy LDPXi $sp, 2			# CHECK-NEXT: $x21, $x20 = frame-destroy LDPXi $sp, 2
	# CHECK-NEXT: $sp, $[[SCRATCH]] = frame-destroy LDRXpost $sp, 32			# CHECK-NEXT: $sp, $fp, $[[SCRATCH]] = frame-destroy LDPXpost $sp, 4
	# CHECK-NEXT: RET_ReallyLR			# CHECK-NEXT: RET_ReallyLR
	#			#
	# ASM-LABEL: test_allocate_sve_gpr_callee_saves:			# ASM-LABEL: test_allocate_sve_gpr_callee_saves:
	# ASM: .cfi_offset w20, -8			# ASM: .cfi_offset w20, -8
	# ASM-NEXT: .cfi_offset w21, -16			# ASM-NEXT: .cfi_offset w21, -16
				# ASM-NEXT: .cfi_offset w30, -24
	# ASM-NEXT: .cfi_offset w29, -32			# ASM-NEXT: .cfi_offset w29, -32
	#			#
	# UNWINDINFO: DW_CFA_offset: reg20 -8			# UNWINDINFO: DW_CFA_offset: reg20 -8
	# UNWINDINFO-NEXT: DW_CFA_offset: reg21 -16			# UNWINDINFO-NEXT: DW_CFA_offset: reg21 -16
				# UNWINDINFO-NEXT: DW_CFA_offset: reg30 -24
	# UNWINDINFO-NEXT: DW_CFA_offset: reg29 -32			# UNWINDINFO-NEXT: DW_CFA_offset: reg29 -32
	name: test_allocate_sve_gpr_callee_saves			name: test_allocate_sve_gpr_callee_saves
	stack:			stack:
	- { id: 0, stack-id: scalable-vector, size: 18, alignment: 2 }			- { id: 0, stack-id: scalable-vector, size: 18, alignment: 2 }
	- { id: 1, stack-id: default, size: 16, alignment: 8 }			- { id: 1, stack-id: default, size: 16, alignment: 8 }
	body: \|			body: \|
	bb.0.entry:			bb.0.entry:
	$x20 = IMPLICIT_DEF			$x20 = IMPLICIT_DEF
	▲ Show 20 Lines • Show All 50 Lines • ▼ Show 20 Lines
	# +----------+			# +----------+
	# \| %stack.3 \| // not scalable			# \| %stack.3 \| // not scalable
	# +----------+ <- SP			# +----------+ <- SP

	# CHECK-LABEL: name: test_address_sve			# CHECK-LABEL: name: test_address_sve
	# CHECK: stackSize: 32			# CHECK: stackSize: 32

	# CHECK: bb.0.entry:			# CHECK: bb.0.entry:
	# CHECK-NEXT: $sp = frame-setup STRXpre killed $[[SCRATCH:[a-z0-9]+]], $sp, -16			# CHECK-NEXT: $sp = frame-setup STPXpre killed $fp, killed $[[SCRATCH:[a-z0-9]+]], $sp, -2
	# CHECK-NEXT: $fp = frame-setup ADDXri $sp, 0, 0			# CHECK-NEXT: $fp = frame-setup ADDXri $sp, 0, 0
	# CHECK-NEXT: $sp = frame-setup ADDVL_XXI $sp, -3			# CHECK-NEXT: $sp = frame-setup ADDVL_XXI $sp, -3
	# CHECK-NEXT: $sp = frame-setup SUBXri $sp, 16, 0			# CHECK-NEXT: $sp = frame-setup SUBXri $sp, 16, 0
	# CHECK-COUNT-2: frame-setup CFI_INSTRUCTION			# CHECK-COUNT-3: frame-setup CFI_INSTRUCTION

	# CHECK-NEXT: STR_ZXI $z0, $fp, -1			# CHECK-NEXT: STR_ZXI $z0, $fp, -1
	# CHECK-NEXT: STR_ZXI $z1, $fp, -2			# CHECK-NEXT: STR_ZXI $z1, $fp, -2
	# CHECK-NEXT: STR_PXI $p0, $fp, -17			# CHECK-NEXT: STR_PXI $p0, $fp, -17

	# CHECK-NEXT: $sp = frame-destroy ADDVL_XXI $sp, 3			# CHECK-NEXT: $sp = frame-destroy ADDVL_XXI $sp, 3
	# CHECK-NEXT: $sp = frame-destroy ADDXri $sp, 16, 0			# CHECK-NEXT: $sp = frame-destroy ADDXri $sp, 16, 0
	# CHECK-NEXT: $sp, $[[SCRATCH]] = frame-destroy LDRXpost $sp, 16			# CHECK-NEXT: $sp, $fp, $[[SCRATCH]] = frame-destroy LDPXpost $sp, 2
	# CHECK-NEXT: RET_ReallyLR			# CHECK-NEXT: RET_ReallyLR
	#			#
	# ASM-LABEL: test_address_sve:			# ASM-LABEL: test_address_sve:
	# ASM: .cfi_offset w29, -16			# ASM: .cfi_offset w29, -16
	#			#
	# UNWINDINFO: DW_CFA_offset: reg29 -16			# UNWINDINFO: DW_CFA_offset: reg29 -16

	name: test_address_sve			name: test_address_sve
	▲ Show 20 Lines • Show All 81 Lines • ▼ Show 20 Lines
	# \| %stack.0 \| // vector of 16 scalable bytes			# \| %stack.0 \| // vector of 16 scalable bytes
	# +---------- +			# +---------- +
	# \| %stack.1 \| // not scalable, 16 bytes			# \| %stack.1 \| // not scalable, 16 bytes
	# +-----------+ <- SP			# +-----------+ <- SP
	# CHECK-LABEL: name: test_stack_arg_sve			# CHECK-LABEL: name: test_stack_arg_sve
	# CHECK: stackSize: 32			# CHECK: stackSize: 32

	# CHECK: bb.0.entry:			# CHECK: bb.0.entry:
	# CHECK-NEXT: $sp = frame-setup STRXpre killed $[[SCRATCH:[a-z0-9]+]], $sp, -16			# CHECK-NEXT: $sp = frame-setup STPXpre killed $fp, killed $[[SCRATCH:[a-z0-9]+]], $sp, -2
	# CHECK-NEXT: $fp = frame-setup ADDXri $sp, 0, 0			# CHECK-NEXT: $fp = frame-setup ADDXri $sp, 0, 0
	# CHECK-NEXT: $sp = frame-setup ADDVL_XXI $sp, -1			# CHECK-NEXT: $sp = frame-setup ADDVL_XXI $sp, -1
	# CHECK-NEXT: $sp = frame-setup SUBXri $sp, 16, 0			# CHECK-NEXT: $sp = frame-setup SUBXri $sp, 16, 0
	# CHECK-COUNT-2: frame-setup CFI_INSTRUCTION			# CHECK-COUNT-3: frame-setup CFI_INSTRUCTION

	# CHECK-NEXT: $x0 = LDRXui $fp, 2			# CHECK-NEXT: $x0 = LDRXui $fp, 2

	# CHECK-NEXT: $sp = frame-destroy ADDVL_XXI $sp, 1			# CHECK-NEXT: $sp = frame-destroy ADDVL_XXI $sp, 1
	# CHECK-NEXT: $sp = frame-destroy ADDXri $sp, 16, 0			# CHECK-NEXT: $sp = frame-destroy ADDXri $sp, 16, 0
	# CHECK-NEXT: $sp, $[[SCRATCH]] = frame-destroy LDRXpost $sp, 16			# CHECK-NEXT: $sp, $fp, $[[SCRATCH]] = frame-destroy LDPXpost $sp, 2
	# CHECK-NEXT: RET_ReallyLR			# CHECK-NEXT: RET_ReallyLR
	#			#
	# ASM-LABEL: test_stack_arg_sve:			# ASM-LABEL: test_stack_arg_sve:
	# ASM: .cfi_offset w29, -16			# ASM: .cfi_offset w29, -16
	#			#
	# UNWINDINFO: DW_CFA_offset: reg29 -16			# UNWINDINFO: DW_CFA_offset: reg29 -16

	name: test_stack_arg_sve			name: test_stack_arg_sve
	▲ Show 20 Lines • Show All 53 Lines • ▼ Show 20 Lines
	# CHECK-NEXT: $sp = frame-destroy ADDVL_XXI $sp, 31			# CHECK-NEXT: $sp = frame-destroy ADDVL_XXI $sp, 31
	# CHECK-NEXT: $sp = frame-destroy ADDVL_XXI $sp, 31			# CHECK-NEXT: $sp = frame-destroy ADDVL_XXI $sp, 31
	# CHECK-NEXT: $sp = frame-destroy ADDVL_XXI $sp, 9			# CHECK-NEXT: $sp = frame-destroy ADDVL_XXI $sp, 9
	# CHECK-NEXT: $sp, $[[SCRATCH]] = frame-destroy LDRXpost $sp, 16			# CHECK-NEXT: $sp, $[[SCRATCH]] = frame-destroy LDRXpost $sp, 16
	# CHECK-NEXT: RET_ReallyLR			# CHECK-NEXT: RET_ReallyLR
	#			#
	# ASM-LABEL: test_address_sve_out_of_range:			# ASM-LABEL: test_address_sve_out_of_range:
	# ASM: .cfi_escape 0x0f, 0x0d, 0x8f, 0x00, 0x11, 0x10, 0x22, 0x11, 0x88, 0x10, 0x92, 0x2e, 0x00, 0x1e, 0x22 // sp + 16 + 2056 * VG			# ASM: .cfi_escape 0x0f, 0x0d, 0x8f, 0x00, 0x11, 0x10, 0x22, 0x11, 0x88, 0x10, 0x92, 0x2e, 0x00, 0x1e, 0x22 // sp + 16 + 2056 * VG
	# ASM-NEXT: .cfi_offset w29, -16			# ASM-NEXT: .cfi_offset w30, -16
	#			#
	# UNWINDINFO: DW_CFA_def_cfa_expression: DW_OP_breg31 +0, DW_OP_consts +16, DW_OP_plus, DW_OP_consts +2056, DW_OP_bregx 0x2e +0, DW_OP_mul, DW_OP_plus			# UNWINDINFO: DW_CFA_def_cfa_expression: DW_OP_breg31 +0, DW_OP_consts +16, DW_OP_plus, DW_OP_consts +2056, DW_OP_bregx 0x2e +0, DW_OP_mul, DW_OP_plus
	# UNWINDINFO-NEXT: DW_CFA_offset: reg29 -16			# UNWINDINFO-NEXT: DW_CFA_offset: reg30 -16
	name: test_address_sve_out_of_range			name: test_address_sve_out_of_range
	frameInfo:			frameInfo:
	maxAlignment: 16			maxAlignment: 16
	stack:			stack:
	- { id: 0, stack-id: scalable-vector, size: 16, alignment: 16 }			- { id: 0, stack-id: scalable-vector, size: 16, alignment: 16 }
	- { id: 1, stack-id: scalable-vector, size: 3584, alignment: 16 }			- { id: 1, stack-id: scalable-vector, size: 3584, alignment: 16 }
	- { id: 2, stack-id: scalable-vector, size: 512, alignment: 16 }			- { id: 2, stack-id: scalable-vector, size: 512, alignment: 16 }

	▲ Show 20 Lines • Show All 61 Lines • ▼ Show 20 Lines
	# CHECK: $sp = frame-destroy ADDXri $sp, 32, 0			# CHECK: $sp = frame-destroy ADDXri $sp, 32, 0
	# CHECK: $p6 = frame-destroy LDR_PXI $sp, 5			# CHECK: $p6 = frame-destroy LDR_PXI $sp, 5
	# CHECK: $p5 = frame-destroy LDR_PXI $sp, 6			# CHECK: $p5 = frame-destroy LDR_PXI $sp, 6
	# CHECK: $p4 = frame-destroy LDR_PXI $sp, 7			# CHECK: $p4 = frame-destroy LDR_PXI $sp, 7
	# CHECK: $sp = frame-destroy ADDVL_XXI $sp, 1			# CHECK: $sp = frame-destroy ADDVL_XXI $sp, 1
	# CHECK: RET_ReallyLR			# CHECK: RET_ReallyLR
	#			#
	# ASM-LABEL: save_restore_pregs_sve:			# ASM-LABEL: save_restore_pregs_sve:
	# ASM: .cfi_offset w29, -16			# ASM: .cfi_offset w30, -16
	#			#
	# UNWINDINFO: DW_CFA_offset: reg29 -16			# UNWINDINFO: DW_CFA_offset: reg30 -16
	name: save_restore_pregs_sve			name: save_restore_pregs_sve
	stack:			stack:
	- { id: 0, stack-id: default, size: 32, alignment: 16 }			- { id: 0, stack-id: default, size: 32, alignment: 16 }
	body: \|			body: \|
	bb.0.entry:			bb.0.entry:

	$p4 = IMPLICIT_DEF			$p4 = IMPLICIT_DEF
	$p5 = IMPLICIT_DEF			$p5 = IMPLICIT_DEF
	$p6 = IMPLICIT_DEF			$p6 = IMPLICIT_DEF

	RET_ReallyLR			RET_ReallyLR
	---			---
	...			...
	# CHECK-LABEL: name: save_restore_zregs_sve			# CHECK-LABEL: name: save_restore_zregs_sve
	# CHECK: $sp = frame-setup STRXpre killed $fp, $sp, -16			# CHECK: $sp = frame-setup STRXpre killed $lr, $sp, -16
	# CHECK-NEXT: $fp = frame-setup ADDXri $sp, 0, 0
	# CHECK-NEXT: $sp = frame-setup ADDVL_XXI $sp, -3			# CHECK-NEXT: $sp = frame-setup ADDVL_XXI $sp, -3
	# CHECK-NEXT: frame-setup STR_ZXI killed $z10, $sp, 0			# CHECK-NEXT: frame-setup STR_ZXI killed $z10, $sp, 0
	# CHECK-NEXT: frame-setup STR_ZXI killed $z9, $sp, 1			# CHECK-NEXT: frame-setup STR_ZXI killed $z9, $sp, 1
	# CHECK-NEXT: frame-setup STR_ZXI killed $z8, $sp, 2			# CHECK-NEXT: frame-setup STR_ZXI killed $z8, $sp, 2
	# CHECK-NEXT: $sp = frame-setup SUBXri $sp, 32, 0			# CHECK-NEXT: $sp = frame-setup SUBXri $sp, 32, 0
	# CHECK-COUNT-5: frame-setup CFI_INSTRUCTION			# CHECK-COUNT-5: frame-setup CFI_INSTRUCTION

	# CHECK: $sp = frame-destroy ADDXri $sp, 32, 0			# CHECK: $sp = frame-destroy ADDXri $sp, 32, 0
	# CHECK-NEXT: $z10 = frame-destroy LDR_ZXI $sp, 0			# CHECK-NEXT: $z10 = frame-destroy LDR_ZXI $sp, 0
	# CHECK-NEXT: $z9 = frame-destroy LDR_ZXI $sp, 1			# CHECK-NEXT: $z9 = frame-destroy LDR_ZXI $sp, 1
	# CHECK-NEXT: $z8 = frame-destroy LDR_ZXI $sp, 2			# CHECK-NEXT: $z8 = frame-destroy LDR_ZXI $sp, 2
	# CHECK-NEXT: $sp = frame-destroy ADDVL_XXI $sp, 3			# CHECK-NEXT: $sp = frame-destroy ADDVL_XXI $sp, 3
	# CHECK-NEXT: $sp, $fp = frame-destroy LDRXpost $sp, 16			# CHECK-NEXT: $sp, $lr = frame-destroy LDRXpost $sp, 16
	# CHECK-NEXT: RET_ReallyLR			# CHECK-NEXT: RET_ReallyLR
	#			#
	# ASM-LABEL: save_restore_zregs_sve:			# ASM-LABEL: save_restore_zregs_sve:
	# ASM: .cfi_escape 0x10, 0x48, 0x0a, 0x11, 0x70, 0x22, 0x11, 0x78, 0x92, 0x2e, 0x00, 0x1e, 0x22 // $d8 @ cfa - 16 - 8 * VG			# ASM: .cfi_escape 0x10, 0x48, 0x0a, 0x11, 0x70, 0x22, 0x11, 0x78, 0x92, 0x2e, 0x00, 0x1e, 0x22 // $d8 @ cfa - 16 - 8 * VG
	# ASM-NEXT: .cfi_escape 0x10, 0x49, 0x0a, 0x11, 0x70, 0x22, 0x11, 0x70, 0x92, 0x2e, 0x00, 0x1e, 0x22 // $d9 @ cfa - 16 - 16 * VG			# ASM-NEXT: .cfi_escape 0x10, 0x49, 0x0a, 0x11, 0x70, 0x22, 0x11, 0x70, 0x92, 0x2e, 0x00, 0x1e, 0x22 // $d9 @ cfa - 16 - 16 * VG
	# ASM-NEXT: .cfi_escape 0x10, 0x4a, 0x0a, 0x11, 0x70, 0x22, 0x11, 0x68, 0x92, 0x2e, 0x00, 0x1e, 0x22 // $d10 @ cfa - 16 - 24 * VG			# ASM-NEXT: .cfi_escape 0x10, 0x4a, 0x0a, 0x11, 0x70, 0x22, 0x11, 0x68, 0x92, 0x2e, 0x00, 0x1e, 0x22 // $d10 @ cfa - 16 - 24 * VG

	# UNWINDINFO: DW_CFA_expression: reg72 DW_OP_consts -16, DW_OP_plus, DW_OP_consts -8, DW_OP_bregx 0x2e +0, DW_OP_mul, DW_OP_plus			# UNWINDINFO: DW_CFA_expression: reg72 DW_OP_consts -16, DW_OP_plus, DW_OP_consts -8, DW_OP_bregx 0x2e +0, DW_OP_mul, DW_OP_plus
	# UNWINDINFO-NEXT: DW_CFA_expression: reg73 DW_OP_consts -16, DW_OP_plus, DW_OP_consts -16, DW_OP_bregx 0x2e +0, DW_OP_mul, DW_OP_plus			# UNWINDINFO-NEXT: DW_CFA_expression: reg73 DW_OP_consts -16, DW_OP_plus, DW_OP_consts -16, DW_OP_bregx 0x2e +0, DW_OP_mul, DW_OP_plus
	# UNWINDINFO-NEXT: DW_CFA_expression: reg74 DW_OP_consts -16, DW_OP_plus, DW_OP_consts -24, DW_OP_bregx 0x2e +0, DW_OP_mul, DW_OP_plus			# UNWINDINFO-NEXT: DW_CFA_expression: reg74 DW_OP_consts -16, DW_OP_plus, DW_OP_consts -24, DW_OP_bregx 0x2e +0, DW_OP_mul, DW_OP_plus
	# UNWINDINFO-NEXT: DW_CFA_offset: reg29 -16			# UNWINDINFO-NEXT: DW_CFA_offset: reg30 -16

	name: save_restore_zregs_sve			name: save_restore_zregs_sve
	stack:			stack:
	- { id: 0, stack-id: default, size: 32, alignment: 16 }			- { id: 0, stack-id: default, size: 32, alignment: 16 }
	body: \|			body: \|
	bb.0.entry:			bb.0.entry:

	$z8 = IMPLICIT_DEF			$z8 = IMPLICIT_DEF
	$z9 = IMPLICIT_DEF			$z9 = IMPLICIT_DEF
	$z10 = IMPLICIT_DEF			$z10 = IMPLICIT_DEF

	RET_ReallyLR			RET_ReallyLR
	---			---
	...			...
	# Test allocation/deallocation of the stack frame together with the			# Test allocation/deallocation of the stack frame together with the
	# saving/restoring of callee save registers. Fixed-stack objects			# saving/restoring of callee save registers. Fixed-stack objects
	# are allocated before the callee-saves.			# are allocated before the callee-saves.
	# This also adds some non-SVE callee-saves, to ensure that those are			# This also adds some non-SVE callee-saves, to ensure that those are
	# paired correctly.			# paired correctly.
	#			#
	# CHECK-LABEL: name: save_restore_sve			# CHECK-LABEL: name: save_restore_sve
	# CHECK: $sp = frame-setup STPXpre killed ${{[a-z0-9]+}}, killed $x21, $sp, -4			# CHECK: $sp = frame-setup STPXpre killed $fp, killed $lr, $sp, -6
	# CHECK: frame-setup STPXi killed $x20, killed $x19, $sp, 2			# CHECK: frame-setup STRXui killed $x21, $sp, 2
				# CHECK: frame-setup STPXi killed $x20, killed $x19, $sp, 4
				# CHECK: $fp = frame-setup ADDXri $sp, 0, 0
	# CHECK: $sp = frame-setup ADDVL_XXI $sp, -18			# CHECK: $sp = frame-setup ADDVL_XXI $sp, -18
	# CHECK: frame-setup STR_PXI killed $p15, $sp, 4			# CHECK: frame-setup STR_PXI killed $p15, $sp, 4
	# CHECK: frame-setup STR_PXI killed $p14, $sp, 5			# CHECK: frame-setup STR_PXI killed $p14, $sp, 5
	# CHECK: frame-setup STR_PXI killed $p5, $sp, 14			# CHECK: frame-setup STR_PXI killed $p5, $sp, 14
	# CHECK: frame-setup STR_PXI killed $p4, $sp, 15			# CHECK: frame-setup STR_PXI killed $p4, $sp, 15
	# CHECK: frame-setup STR_ZXI killed $z23, $sp, 2			# CHECK: frame-setup STR_ZXI killed $z23, $sp, 2
	# CHECK: frame-setup STR_ZXI killed $z22, $sp, 3			# CHECK: frame-setup STR_ZXI killed $z22, $sp, 3
	# CHECK: frame-setup STR_ZXI killed $z9, $sp, 16			# CHECK: frame-setup STR_ZXI killed $z9, $sp, 16
	# CHECK: frame-setup STR_ZXI killed $z8, $sp, 17			# CHECK: frame-setup STR_ZXI killed $z8, $sp, 17
	# CHECK: $sp = frame-setup ADDVL_XXI $sp, -1			# CHECK: $sp = frame-setup ADDVL_XXI $sp, -1
	# CHECK: $sp = frame-setup SUBXri $sp, 32, 0			# CHECK: $sp = frame-setup SUBXri $sp, 32, 0
	# CHECK-COUNT-13: frame-setup CFI_INSTRUCTION			# CHECK-COUNT-14: frame-setup CFI_INSTRUCTION

	# CHECK: $sp = frame-destroy ADDXri $sp, 32, 0			# CHECK: $sp = frame-destroy ADDXri $sp, 32, 0
	# CHECK: $sp = frame-destroy ADDVL_XXI $sp, 1			# CHECK: $sp = frame-destroy ADDVL_XXI $sp, 1
	# CHECK: $p15 = frame-destroy LDR_PXI $sp, 4			# CHECK: $p15 = frame-destroy LDR_PXI $sp, 4
	# CHECK: $p14 = frame-destroy LDR_PXI $sp, 5			# CHECK: $p14 = frame-destroy LDR_PXI $sp, 5
	# CHECK: $p5 = frame-destroy LDR_PXI $sp, 14			# CHECK: $p5 = frame-destroy LDR_PXI $sp, 14
	# CHECK: $p4 = frame-destroy LDR_PXI $sp, 15			# CHECK: $p4 = frame-destroy LDR_PXI $sp, 15
	# CHECK: $z23 = frame-destroy LDR_ZXI $sp, 2			# CHECK: $z23 = frame-destroy LDR_ZXI $sp, 2
	# CHECK: $z22 = frame-destroy LDR_ZXI $sp, 3			# CHECK: $z22 = frame-destroy LDR_ZXI $sp, 3
	# CHECK: $z9 = frame-destroy LDR_ZXI $sp, 16			# CHECK: $z9 = frame-destroy LDR_ZXI $sp, 16
	# CHECK: $z8 = frame-destroy LDR_ZXI $sp, 17			# CHECK: $z8 = frame-destroy LDR_ZXI $sp, 17
	# CHECK: $sp = frame-destroy ADDVL_XXI $sp, 18			# CHECK: $sp = frame-destroy ADDVL_XXI $sp, 18
	# CHECK: $x20, $x19 = frame-destroy LDPXi $sp, 2			# CHECK: $x20, $x19 = frame-destroy LDPXi $sp, 4
	# CHECK: $sp, ${{[a-z0-9]+}}, $x21 = frame-destroy LDPXpost $sp, 4			# CHECK: $x21 = frame-destroy LDRXui $sp, 2
				# CHECK: $sp, $fp, $lr = frame-destroy LDPXpost $sp, 6
	# CHECK: RET_ReallyLR			# CHECK: RET_ReallyLR
	#			#
	# ASM-LABEL: save_restore_sve:			# ASM-LABEL: save_restore_sve:
	# ASM: .cfi_escape 0x10, 0x48, 0x0a, 0x11, 0x60, 0x22, 0x11, 0x78, 0x92, 0x2e, 0x00, 0x1e, 0x22 // $d8 @ cfa - 32 - 8 * VG			# ASM: .cfi_escape 0x10, 0x48, 0x0a, 0x11, 0x50, 0x22, 0x11, 0x78, 0x92, 0x2e, 0x00, 0x1e, 0x22 // $d8 @ cfa - 48 - 8 * VG
	# ASM-NEXT: .cfi_escape 0x10, 0x49, 0x0a, 0x11, 0x60, 0x22, 0x11, 0x70, 0x92, 0x2e, 0x00, 0x1e, 0x22 // $d9 @ cfa - 32 - 16 * VG			# ASM-NEXT: .cfi_escape 0x10, 0x49, 0x0a, 0x11, 0x50, 0x22, 0x11, 0x70, 0x92, 0x2e, 0x00, 0x1e, 0x22 // $d9 @ cfa - 48 - 16 * VG
	# ASM-NEXT: .cfi_escape 0x10, 0x4a, 0x0a, 0x11, 0x60, 0x22, 0x11, 0x68, 0x92, 0x2e, 0x00, 0x1e, 0x22 // $d10 @ cfa - 32 - 24 * VG			# ASM-NEXT: .cfi_escape 0x10, 0x4a, 0x0a, 0x11, 0x50, 0x22, 0x11, 0x68, 0x92, 0x2e, 0x00, 0x1e, 0x22 // $d10 @ cfa - 48 - 24 * VG
	# ASM-NEXT: .cfi_escape 0x10, 0x4b, 0x0a, 0x11, 0x60, 0x22, 0x11, 0x60, 0x92, 0x2e, 0x00, 0x1e, 0x22 // $d11 @ cfa - 32 - 32 * VG			# ASM-NEXT: .cfi_escape 0x10, 0x4b, 0x0a, 0x11, 0x50, 0x22, 0x11, 0x60, 0x92, 0x2e, 0x00, 0x1e, 0x22 // $d11 @ cfa - 48 - 32 * VG
	# ASM-NEXT: .cfi_escape 0x10, 0x4c, 0x0a, 0x11, 0x60, 0x22, 0x11, 0x58, 0x92, 0x2e, 0x00, 0x1e, 0x22 // $d12 @ cfa - 32 - 40 * VG			# ASM-NEXT: .cfi_escape 0x10, 0x4c, 0x0a, 0x11, 0x50, 0x22, 0x11, 0x58, 0x92, 0x2e, 0x00, 0x1e, 0x22 // $d12 @ cfa - 48 - 40 * VG
	# ASM-NEXT: .cfi_escape 0x10, 0x4d, 0x0a, 0x11, 0x60, 0x22, 0x11, 0x50, 0x92, 0x2e, 0x00, 0x1e, 0x22 // $d13 @ cfa - 32 - 48 * VG			# ASM-NEXT: .cfi_escape 0x10, 0x4d, 0x0a, 0x11, 0x50, 0x22, 0x11, 0x50, 0x92, 0x2e, 0x00, 0x1e, 0x22 // $d13 @ cfa - 48 - 48 * VG
	# ASM-NEXT: .cfi_escape 0x10, 0x4e, 0x0a, 0x11, 0x60, 0x22, 0x11, 0x48, 0x92, 0x2e, 0x00, 0x1e, 0x22 // $d14 @ cfa - 32 - 56 * VG			# ASM-NEXT: .cfi_escape 0x10, 0x4e, 0x0a, 0x11, 0x50, 0x22, 0x11, 0x48, 0x92, 0x2e, 0x00, 0x1e, 0x22 // $d14 @ cfa - 48 - 56 * VG
	# ASM-NEXT: .cfi_escape 0x10, 0x4f, 0x0a, 0x11, 0x60, 0x22, 0x11, 0x40, 0x92, 0x2e, 0x00, 0x1e, 0x22 // $d15 @ cfa - 32 - 64 * VG			# ASM-NEXT: .cfi_escape 0x10, 0x4f, 0x0a, 0x11, 0x50, 0x22, 0x11, 0x40, 0x92, 0x2e, 0x00, 0x1e, 0x22 // $d15 @ cfa - 48 - 64 * VG
	# ASM-NEXT: .cfi_offset w19, -8			# ASM-NEXT: .cfi_offset w19, -8
	# ASM-NEXT: .cfi_offset w20, -16			# ASM-NEXT: .cfi_offset w20, -16
	# ASM-NEXT: .cfi_offset w21, -24			# ASM-NEXT: .cfi_offset w21, -32
	# ASM-NEXT: .cfi_offset w29, -32			# ASM-NEXT: .cfi_offset w30, -40
	#			# ASM-NEXT: .cfi_offset w29, -48
	# UNWINDINFO: DW_CFA_expression: reg72 DW_OP_consts -32, DW_OP_plus, DW_OP_consts -8, DW_OP_bregx 0x2e +0, DW_OP_mul, DW_OP_plus			#
	# UNWINDINFO-NEXT: DW_CFA_expression: reg73 DW_OP_consts -32, DW_OP_plus, DW_OP_consts -16, DW_OP_bregx 0x2e +0, DW_OP_mul, DW_OP_plus			# UNWINDINFO: DW_CFA_expression: reg72 DW_OP_consts -48, DW_OP_plus, DW_OP_consts -8, DW_OP_bregx 0x2e +0, DW_OP_mul, DW_OP_plus
	# UNWINDINFO-NEXT: DW_CFA_expression: reg74 DW_OP_consts -32, DW_OP_plus, DW_OP_consts -24, DW_OP_bregx 0x2e +0, DW_OP_mul, DW_OP_plus			# UNWINDINFO-NEXT: DW_CFA_expression: reg73 DW_OP_consts -48, DW_OP_plus, DW_OP_consts -16, DW_OP_bregx 0x2e +0, DW_OP_mul, DW_OP_plus
	# UNWINDINFO-NEXT: DW_CFA_expression: reg75 DW_OP_consts -32, DW_OP_plus, DW_OP_consts -32, DW_OP_bregx 0x2e +0, DW_OP_mul, DW_OP_plus			# UNWINDINFO-NEXT: DW_CFA_expression: reg74 DW_OP_consts -48, DW_OP_plus, DW_OP_consts -24, DW_OP_bregx 0x2e +0, DW_OP_mul, DW_OP_plus
	# UNWINDINFO-NEXT: DW_CFA_expression: reg76 DW_OP_consts -32, DW_OP_plus, DW_OP_consts -40, DW_OP_bregx 0x2e +0, DW_OP_mul, DW_OP_plus			# UNWINDINFO-NEXT: DW_CFA_expression: reg75 DW_OP_consts -48, DW_OP_plus, DW_OP_consts -32, DW_OP_bregx 0x2e +0, DW_OP_mul, DW_OP_plus
	# UNWINDINFO-NEXT: DW_CFA_expression: reg77 DW_OP_consts -32, DW_OP_plus, DW_OP_consts -48, DW_OP_bregx 0x2e +0, DW_OP_mul, DW_OP_plus			# UNWINDINFO-NEXT: DW_CFA_expression: reg76 DW_OP_consts -48, DW_OP_plus, DW_OP_consts -40, DW_OP_bregx 0x2e +0, DW_OP_mul, DW_OP_plus
	# UNWINDINFO-NEXT: DW_CFA_expression: reg78 DW_OP_consts -32, DW_OP_plus, DW_OP_consts -56, DW_OP_bregx 0x2e +0, DW_OP_mul, DW_OP_plus			# UNWINDINFO-NEXT: DW_CFA_expression: reg77 DW_OP_consts -48, DW_OP_plus, DW_OP_consts -48, DW_OP_bregx 0x2e +0, DW_OP_mul, DW_OP_plus
	# UNWINDINFO-NEXT: DW_CFA_expression: reg79 DW_OP_consts -32, DW_OP_plus, DW_OP_consts -64, DW_OP_bregx 0x2e +0, DW_OP_mul, DW_OP_plus			# UNWINDINFO-NEXT: DW_CFA_expression: reg78 DW_OP_consts -48, DW_OP_plus, DW_OP_consts -56, DW_OP_bregx 0x2e +0, DW_OP_mul, DW_OP_plus
				# UNWINDINFO-NEXT: DW_CFA_expression: reg79 DW_OP_consts -48, DW_OP_plus, DW_OP_consts -64, DW_OP_bregx 0x2e +0, DW_OP_mul, DW_OP_plus
	# UNWINDINFO-NEXT: DW_CFA_offset: reg19 -8			# UNWINDINFO-NEXT: DW_CFA_offset: reg19 -8
	# UNWINDINFO-NEXT: DW_CFA_offset: reg20 -16			# UNWINDINFO-NEXT: DW_CFA_offset: reg20 -16
	# UNWINDINFO-NEXT: DW_CFA_offset: reg21 -24			# UNWINDINFO-NEXT: DW_CFA_offset: reg21 -32
	# UNWINDINFO-NEXT: DW_CFA_offset: reg29 -32			# UNWINDINFO-NEXT: DW_CFA_offset: reg30 -40
				# UNWINDINFO-NEXT: DW_CFA_offset: reg29 -48

	name: save_restore_sve			name: save_restore_sve
	stack:			stack:
	- { id: 0, stack-id: scalable-vector, size: 16, alignment: 16 }			- { id: 0, stack-id: scalable-vector, size: 16, alignment: 16 }
	- { id: 1, stack-id: default, size: 32, alignment: 16 }			- { id: 1, stack-id: default, size: 32, alignment: 16 }
	body: \|			body: \|
	bb.0.entry:			bb.0.entry:

	▲ Show 20 Lines • Show All 140 Lines • ▼ Show 20 Lines
	# CHECK-NEXT: stack-id: scalable-vector, callee-saved-register: '$z8',			# CHECK-NEXT: stack-id: scalable-vector, callee-saved-register: '$z8',
	# CHECK: - { id: 7, name: '', type: spill-slot, offset: -32, size: 16, alignment: 16,			# CHECK: - { id: 7, name: '', type: spill-slot, offset: -32, size: 16, alignment: 16,
	# CHECK-NEXT: stack-id: scalable-vector, callee-saved-register: '$z23',			# CHECK-NEXT: stack-id: scalable-vector, callee-saved-register: '$z23',
	# CHECK: - { id: 8, name: '', type: spill-slot, offset: -34, size: 2, alignment: 2,			# CHECK: - { id: 8, name: '', type: spill-slot, offset: -34, size: 2, alignment: 2,
	# CHECK-NEXT: stack-id: scalable-vector, callee-saved-register: '$p4',			# CHECK-NEXT: stack-id: scalable-vector, callee-saved-register: '$p4',
	# CHECK: - { id: 9, name: '', type: spill-slot, offset: -36, size: 2, alignment: 2,			# CHECK: - { id: 9, name: '', type: spill-slot, offset: -36, size: 2, alignment: 2,
	# CHECK-NEXT: stack-id: scalable-vector, callee-saved-register: '$p15',			# CHECK-NEXT: stack-id: scalable-vector, callee-saved-register: '$p15',
	# CHECK: - { id: 10, name: '', type: spill-slot, offset: -16, size: 8, alignment: 16,			# CHECK: - { id: 10, name: '', type: spill-slot, offset: -16, size: 8, alignment: 16,
	# CHECK-NEXT: stack-id: default, callee-saved-register: '$fp',			# CHECK-NEXT: stack-id: default, callee-saved-register: '$lr',
	#			#
	# CHECK: bb.0.entry:			# CHECK: bb.0.entry:
	# CHECK-NEXT: $sp = frame-setup STRXpre killed $[[SCRATCH:[a-z0-9]+]], $sp, -16			# CHECK-NEXT: $sp = frame-setup STRXpre killed $[[SCRATCH:[a-z0-9]+]], $sp, -16
	# CHECK-NEXT: $sp = frame-setup ADDVL_XXI $sp, -3			# CHECK-NEXT: $sp = frame-setup ADDVL_XXI $sp, -3
	# CHECK-NEXT: STR_PXI killed $p15, $sp, 6			# CHECK-NEXT: STR_PXI killed $p15, $sp, 6
	# CHECK-NEXT: STR_PXI killed $p4, $sp, 7			# CHECK-NEXT: STR_PXI killed $p4, $sp, 7
	# CHECK-NEXT: STR_ZXI killed $z23, $sp, 1			# CHECK-NEXT: STR_ZXI killed $z23, $sp, 1
	# CHECK-NEXT: STR_ZXI killed $z8, $sp, 2			# CHECK-NEXT: STR_ZXI killed $z8, $sp, 2
	# CHECK-NEXT: $sp = frame-setup ADDVL_XXI $sp, -7			# CHECK-NEXT: $sp = frame-setup ADDVL_XXI $sp, -7
	# CHECK-COUNT-3: frame-setup CFI_INSTRUCTION			# CHECK-COUNT-3: frame-setup CFI_INSTRUCTION
	# ASM-LABEL: frame_layout:			# ASM-LABEL: frame_layout:
	# ASM: .cfi_escape 0x0f, 0x0d, 0x8f, 0x00, 0x11, 0x10, 0x22, 0x11, 0xd0, 0x00, 0x92, 0x2e, 0x00, 0x1e, 0x22 // sp + 16 + 80 * VG			# ASM: .cfi_escape 0x0f, 0x0d, 0x8f, 0x00, 0x11, 0x10, 0x22, 0x11, 0xd0, 0x00, 0x92, 0x2e, 0x00, 0x1e, 0x22 // sp + 16 + 80 * VG
	# ASM-NEXT: .cfi_escape 0x10, 0x48, 0x0a, 0x11, 0x70, 0x22, 0x11, 0x78, 0x92, 0x2e, 0x00, 0x1e, 0x22 // $d8 @ cfa - 16 - 8 * VG			# ASM-NEXT: .cfi_escape 0x10, 0x48, 0x0a, 0x11, 0x70, 0x22, 0x11, 0x78, 0x92, 0x2e, 0x00, 0x1e, 0x22 // $d8 @ cfa - 16 - 8 * VG
	# ASM-NEXT: .cfi_offset w29, -16			# ASM-NEXT: .cfi_offset w30, -16
	#			#
	# UNWINDINFO: DW_CFA_def_cfa_expression: DW_OP_breg31 +0, DW_OP_consts +16, DW_OP_plus, DW_OP_consts +80, DW_OP_bregx 0x2e +0, DW_OP_mul, DW_OP_plus			# UNWINDINFO: DW_CFA_def_cfa_expression: DW_OP_breg31 +0, DW_OP_consts +16, DW_OP_plus, DW_OP_consts +80, DW_OP_bregx 0x2e +0, DW_OP_mul, DW_OP_plus
	# UNWINDINFO-NEXT: DW_CFA_expression: reg72 DW_OP_consts -16, DW_OP_plus, DW_OP_consts -8, DW_OP_bregx 0x2e +0, DW_OP_mul, DW_OP_plus			# UNWINDINFO-NEXT: DW_CFA_expression: reg72 DW_OP_consts -16, DW_OP_plus, DW_OP_consts -8, DW_OP_bregx 0x2e +0, DW_OP_mul, DW_OP_plus
	# UNWINDINFO-NEXT: DW_CFA_offset: reg29 -16			# UNWINDINFO-NEXT: DW_CFA_offset: reg30 -16
	name: frame_layout			name: frame_layout
	stack:			stack:
	- { id: 0, type: default, size: 32, alignment: 16, stack-id: scalable-vector }			- { id: 0, type: default, size: 32, alignment: 16, stack-id: scalable-vector }
	- { id: 1, type: default, size: 4, alignment: 2, stack-id: scalable-vector }			- { id: 1, type: default, size: 4, alignment: 2, stack-id: scalable-vector }
	- { id: 2, type: default, size: 16, alignment: 16, stack-id: scalable-vector }			- { id: 2, type: default, size: 16, alignment: 16, stack-id: scalable-vector }
	- { id: 3, type: default, size: 2, alignment: 2, stack-id: scalable-vector }			- { id: 3, type: default, size: 2, alignment: 2, stack-id: scalable-vector }
	- { id: 4, type: spill-slot, size: 16, alignment: 16, stack-id: scalable-vector }			- { id: 4, type: spill-slot, size: 16, alignment: 16, stack-id: scalable-vector }
	- { id: 5, type: spill-slot, size: 2, alignment: 2, stack-id: scalable-vector }			- { id: 5, type: spill-slot, size: 2, alignment: 2, stack-id: scalable-vector }
	▲ Show 20 Lines • Show All 46 Lines • Show Last 20 Lines

llvm/test/CodeGen/AArch64/named-vector-shuffle-reverse-sve.ll

	Show First 20 Lines • Show All 49 Lines • ▼ Show 20 Lines
	; CHECK-NEXT: ret			; CHECK-NEXT: ret

	%res = call <vscale x 16 x i1> @llvm.experimental.vector.reverse.nxv16i1(<vscale x 16 x i1> %a)			%res = call <vscale x 16 x i1> @llvm.experimental.vector.reverse.nxv16i1(<vscale x 16 x i1> %a)
	ret <vscale x 16 x i1> %res			ret <vscale x 16 x i1> %res
	}			}

	; Verify splitvec type legalisation works as expected.			; Verify splitvec type legalisation works as expected.
	define <vscale x 32 x i1> @reverse_nxv32i1(<vscale x 32 x i1> %a) #0 {			define <vscale x 32 x i1> @reverse_nxv32i1(<vscale x 32 x i1> %a) #0 {
	; CHECK-LABEL: reverse_nxv32i1:			; CHECK-SELDAG-LABEL: reverse_nxv32i1:
	; CHECK-SELDAG: // %bb.0:			; CHECK-SELDAG: // %bb.0:
	; CHECK-SELDAG-NEXT: rev p2.b, p1.b			; CHECK-SELDAG-NEXT: rev p2.b, p1.b
	; CHECK-SELDAG-NEXT: rev p1.b, p0.b			; CHECK-SELDAG-NEXT: rev p1.b, p0.b
	; CHECK-SELDAG-NEXT: mov p0.b, p2.b			; CHECK-SELDAG-NEXT: mov p0.b, p2.b
	; CHECK-SELDAG-NEXT: ret			; CHECK-SELDAG-NEXT: ret
				;
				; CHECK-FASTISEL-LABEL: reverse_nxv32i1:
	; CHECK-FASTISEL: // %bb.0:			; CHECK-FASTISEL: // %bb.0:
	; CHECK-FASTISEL-NEXT: str x29, [sp, #-16]			; CHECK-FASTISEL-NEXT: str x30, [sp, #-16]! // 8-byte Folded Spill
	; CHECK-FASTISEL-NEXT: addvl sp, sp, #-1			; CHECK-FASTISEL-NEXT: addvl sp, sp, #-1
	; CHECK-FASTISEL-NEXT: str p1, [sp, #7, mul vl]			; CHECK-FASTISEL-NEXT: str p1, [sp, #7, mul vl] // 2-byte Folded Spill
	; CHECK-FASTISEL-NEXT: mov p1.b, p0.b			; CHECK-FASTISEL-NEXT: mov p1.b, p0.b
	; CHECK-FASTISEL-NEXT: ldr p0, [sp, #7, mul vl]			; CHECK-FASTISEL-NEXT: ldr p0, [sp, #7, mul vl] // 2-byte Folded Reload
	; CHECK-FASTISEL-NEXT: rev p0.b, p0.b			; CHECK-FASTISEL-NEXT: rev p0.b, p0.b
	; CHECK-FASTISEL-NEXT: rev p1.b, p1.b			; CHECK-FASTISEL-NEXT: rev p1.b, p1.b
	; CHECK-FASTISEL-NEXT: addvl sp, sp, #1			; CHECK-FASTISEL-NEXT: addvl sp, sp, #1
	; CHECK-FASTISEL-NEXT: ldr x29, [sp], #16			; CHECK-FASTISEL-NEXT: ldr x30, [sp], #16 // 8-byte Folded Reload
	; CHECK-FASTISEL-NEXT: ret			; CHECK-FASTISEL-NEXT: ret

	%res = call <vscale x 32 x i1> @llvm.experimental.vector.reverse.nxv32i1(<vscale x 32 x i1> %a)			%res = call <vscale x 32 x i1> @llvm.experimental.vector.reverse.nxv32i1(<vscale x 32 x i1> %a)
	ret <vscale x 32 x i1> %res			ret <vscale x 32 x i1> %res
	}			}

	;			;
	; VECTOR_REVERSE - ZPR			; VECTOR_REVERSE - ZPR
	▲ Show 20 Lines • Show All 76 Lines • ▼ Show 20 Lines
	; CHECK-NEXT: ret			; CHECK-NEXT: ret

	%res = call <vscale x 2 x i8> @llvm.experimental.vector.reverse.nxv2i8(<vscale x 2 x i8> %a)			%res = call <vscale x 2 x i8> @llvm.experimental.vector.reverse.nxv2i8(<vscale x 2 x i8> %a)
	ret <vscale x 2 x i8> %res			ret <vscale x 2 x i8> %res
	}			}

	; Verify splitvec type legalisation works as expected.			; Verify splitvec type legalisation works as expected.
	define <vscale x 8 x i32> @reverse_nxv8i32(<vscale x 8 x i32> %a) #0 {			define <vscale x 8 x i32> @reverse_nxv8i32(<vscale x 8 x i32> %a) #0 {
	; CHECK-LABEL: reverse_nxv8i32:			; CHECK-SELDAG-LABEL: reverse_nxv8i32:
	; CHECK-SELDAG: // %bb.0:			; CHECK-SELDAG: // %bb.0:
	; CHECK-SELDAG-NEXT: rev z2.s, z1.s			; CHECK-SELDAG-NEXT: rev z2.s, z1.s
	; CHECK-SELDAG-NEXT: rev z1.s, z0.s			; CHECK-SELDAG-NEXT: rev z1.s, z0.s
	; CHECK-SELDAG-NEXT: mov z0.d, z2.d			; CHECK-SELDAG-NEXT: mov z0.d, z2.d
	; CHECK-SELDAG-NEXT: ret			; CHECK-SELDAG-NEXT: ret
				;
				; CHECK-FASTISEL-LABEL: reverse_nxv8i32:
	; CHECK-FASTISEL: // %bb.0:			; CHECK-FASTISEL: // %bb.0:
	; CHECK-FASTISEL-NEXT: str x29, [sp, #-16]			; CHECK-FASTISEL-NEXT: str x30, [sp, #-16]! // 8-byte Folded Spill
	; CHECK-FASTISEL-NEXT: addvl sp, sp, #-1			; CHECK-FASTISEL-NEXT: addvl sp, sp, #-1
	; CHECK-FASTISEL-NEXT: str z1, [sp]			; CHECK-FASTISEL-NEXT: str z1, [sp] // 16-byte Folded Spill
	; CHECK-FASTISEL-NEXT: mov z1.d, z0.d			; CHECK-FASTISEL-NEXT: mov z1.d, z0.d
	; CHECK-FASTISEL-NEXT: ldr z0, [sp]			; CHECK-FASTISEL-NEXT: ldr z0, [sp] // 16-byte Folded Reload
	; CHECK-FASTISEL-NEXT: rev z0.s, z0.s			; CHECK-FASTISEL-NEXT: rev z0.s, z0.s
	; CHECK-FASTISEL-NEXT: rev z1.s, z1.s			; CHECK-FASTISEL-NEXT: rev z1.s, z1.s
	; CHECK-FASTISEL-NEXT: addvl sp, sp, #1			; CHECK-FASTISEL-NEXT: addvl sp, sp, #1
	; CHECK-FASTISEL-NEXT: ldr x29, [sp], #16			; CHECK-FASTISEL-NEXT: ldr x30, [sp], #16 // 8-byte Folded Reload
	; CHECK-FASTISEL-NEXT: ret			; CHECK-FASTISEL-NEXT: ret

	%res = call <vscale x 8 x i32> @llvm.experimental.vector.reverse.nxv8i32(<vscale x 8 x i32> %a)			%res = call <vscale x 8 x i32> @llvm.experimental.vector.reverse.nxv8i32(<vscale x 8 x i32> %a)
	ret <vscale x 8 x i32> %res			ret <vscale x 8 x i32> %res
	}			}

	; Verify splitvec type legalisation works as expected.			; Verify splitvec type legalisation works as expected.
	define <vscale x 16 x float> @reverse_nxv16f32(<vscale x 16 x float> %a) #0 {			define <vscale x 16 x float> @reverse_nxv16f32(<vscale x 16 x float> %a) #0 {
	; CHECK-LABEL: reverse_nxv16f32:			; CHECK-SELDAG-LABEL: reverse_nxv16f32:
	; CHECK-SELDAG: // %bb.0:			; CHECK-SELDAG: // %bb.0:
	; CHECK-SELDAG-NEXT: rev z5.s, z3.s			; CHECK-SELDAG-NEXT: rev z5.s, z3.s
	; CHECK-SELDAG-NEXT: rev z4.s, z2.s			; CHECK-SELDAG-NEXT: rev z4.s, z2.s
	; CHECK-SELDAG-NEXT: rev z2.s, z1.s			; CHECK-SELDAG-NEXT: rev z2.s, z1.s
	; CHECK-SELDAG-NEXT: rev z3.s, z0.s			; CHECK-SELDAG-NEXT: rev z3.s, z0.s
	; CHECK-SELDAG-NEXT: mov z0.d, z5.d			; CHECK-SELDAG-NEXT: mov z0.d, z5.d
	; CHECK-SELDAG-NEXT: mov z1.d, z4.d			; CHECK-SELDAG-NEXT: mov z1.d, z4.d
	; CHECK-SELDAG-NEXT: ret			; CHECK-SELDAG-NEXT: ret
				;
				; CHECK-FASTISEL-LABEL: reverse_nxv16f32:
	; CHECK-FASTISEL: // %bb.0:			; CHECK-FASTISEL: // %bb.0:
	; CHECK-FASTISEL-NEXT: str x29, [sp, #-16]			; CHECK-FASTISEL-NEXT: str x30, [sp, #-16]! // 8-byte Folded Spill
	; CHECK-FASTISEL-NEXT: addvl sp, sp, #-2			; CHECK-FASTISEL-NEXT: addvl sp, sp, #-2
	; CHECK-FASTISEL-NEXT: str z3, [sp, #1, mul vl]			; CHECK-FASTISEL-NEXT: str z3, [sp, #1, mul vl] // 16-byte Folded Spill
	; CHECK-FASTISEL-NEXT: str z2, [sp]			; CHECK-FASTISEL-NEXT: str z2, [sp] // 16-byte Folded Spill
	; CHECK-FASTISEL-NEXT: mov z2.d, z1.d			; CHECK-FASTISEL-NEXT: mov z2.d, z1.d
	; CHECK-FASTISEL-NEXT: ldr z1, [sp]			; CHECK-FASTISEL-NEXT: ldr z1, [sp] // 16-byte Folded Reload
	; CHECK-FASTISEL-NEXT: mov z3.d, z0.d			; CHECK-FASTISEL-NEXT: mov z3.d, z0.d
	; CHECK-FASTISEL-NEXT: ldr z0, [sp, #1, mul vl]			; CHECK-FASTISEL-NEXT: ldr z0, [sp, #1, mul vl] // 16-byte Folded Reload
	; CHECK-FASTISEL-NEXT: rev z0.s, z0.s			; CHECK-FASTISEL-NEXT: rev z0.s, z0.s
	; CHECK-FASTISEL-NEXT: rev z1.s, z1.s			; CHECK-FASTISEL-NEXT: rev z1.s, z1.s
	; CHECK-FASTISEL-NEXT: rev z2.s, z2.s			; CHECK-FASTISEL-NEXT: rev z2.s, z2.s
	; CHECK-FASTISEL-NEXT: rev z3.s, z3.s			; CHECK-FASTISEL-NEXT: rev z3.s, z3.s
	; CHECK-FASTISEL-NEXT: addvl sp, sp, #2			; CHECK-FASTISEL-NEXT: addvl sp, sp, #2
	; CHECK-FASTISEL-NEXT: ldr x29, [sp], #16			; CHECK-FASTISEL-NEXT: ldr x30, [sp], #16 // 8-byte Folded Reload
	; CHECK-FASTISEL-NEXT: ret			; CHECK-FASTISEL-NEXT: ret

	%res = call <vscale x 16 x float> @llvm.experimental.vector.reverse.nxv16f32(<vscale x 16 x float> %a)			%res = call <vscale x 16 x float> @llvm.experimental.vector.reverse.nxv16f32(<vscale x 16 x float> %a)
	ret <vscale x 16 x float> %res			ret <vscale x 16 x float> %res
	}			}


	declare <vscale x 2 x i1> @llvm.experimental.vector.reverse.nxv2i1(<vscale x 2 x i1>)			declare <vscale x 2 x i1> @llvm.experimental.vector.reverse.nxv2i1(<vscale x 2 x i1>)
	Show All 17 Lines

llvm/test/CodeGen/AArch64/split-vector-insert.ll

	Show All 10 Lines
	define <vscale x 2 x i64> @test_nxv2i64_v8i64(<vscale x 2 x i64> %a, <8 x i64> %b) #0 {			define <vscale x 2 x i64> @test_nxv2i64_v8i64(<vscale x 2 x i64> %a, <8 x i64> %b) #0 {
	; CHECK-LEGALIZATION: Legally typed node: [[T1:t[0-9]+]]: nxv2i64 = insert_subvector {{t[0-9]+}}, {{t[0-9]+}}, Constant:i64<0>			; CHECK-LEGALIZATION: Legally typed node: [[T1:t[0-9]+]]: nxv2i64 = insert_subvector {{t[0-9]+}}, {{t[0-9]+}}, Constant:i64<0>
	; CHECK-LEGALIZATION: Legally typed node: [[T2:t[0-9]+]]: nxv2i64 = insert_subvector [[T1]], {{t[0-9]+}}, Constant:i64<2>			; CHECK-LEGALIZATION: Legally typed node: [[T2:t[0-9]+]]: nxv2i64 = insert_subvector [[T1]], {{t[0-9]+}}, Constant:i64<2>
	; CHECK-LEGALIZATION: Legally typed node: [[T3:t[0-9]+]]: nxv2i64 = insert_subvector [[T2]], {{t[0-9]+}}, Constant:i64<4>			; CHECK-LEGALIZATION: Legally typed node: [[T3:t[0-9]+]]: nxv2i64 = insert_subvector [[T2]], {{t[0-9]+}}, Constant:i64<4>
	; CHECK-LEGALIZATION: Legally typed node: [[T4:t[0-9]+]]: nxv2i64 = insert_subvector [[T3]], {{t[0-9]+}}, Constant:i64<6>			; CHECK-LEGALIZATION: Legally typed node: [[T4:t[0-9]+]]: nxv2i64 = insert_subvector [[T3]], {{t[0-9]+}}, Constant:i64<6>

	; CHECK-LABEL: test_nxv2i64_v8i64:			; CHECK-LABEL: test_nxv2i64_v8i64:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: str x29, [sp, #-16]! // 8-byte Folded Spill			; CHECK-NEXT: str x30, [sp, #-16]! // 8-byte Folded Spill
	; CHECK-NEXT: addvl sp, sp, #-4			; CHECK-NEXT: addvl sp, sp, #-4
	; CHECK-NEXT: .cfi_escape 0x0f, 0x0c, 0x8f, 0x00, 0x11, 0x10, 0x22, 0x11, 0x20, 0x92, 0x2e, 0x00, 0x1e, 0x22 // sp + 16 + 32 * VG			; CHECK-NEXT: .cfi_escape 0x0f, 0x0c, 0x8f, 0x00, 0x11, 0x10, 0x22, 0x11, 0x20, 0x92, 0x2e, 0x00, 0x1e, 0x22 // sp + 16 + 32 * VG
	; CHECK-NEXT: .cfi_offset w29, -16			; CHECK-NEXT: .cfi_offset w30, -16
	; CHECK-NEXT: cntd x8			; CHECK-NEXT: cntd x8
	; CHECK-NEXT: sub x8, x8, #1 // =1			; CHECK-NEXT: sub x8, x8, #1 // =1
	; CHECK-NEXT: cmp x8, #0 // =0			; CHECK-NEXT: cmp x8, #0 // =0
	; CHECK-NEXT: csel x10, x8, xzr, lo			; CHECK-NEXT: csel x10, x8, xzr, lo
	; CHECK-NEXT: ptrue p0.d			; CHECK-NEXT: ptrue p0.d
	; CHECK-NEXT: mov x9, sp			; CHECK-NEXT: mov x9, sp
	; CHECK-NEXT: lsl x10, x10, #3			; CHECK-NEXT: lsl x10, x10, #3
	; CHECK-NEXT: st1d { z0.d }, p0, [sp]			; CHECK-NEXT: st1d { z0.d }, p0, [sp]
	Show All 19 Lines
	; CHECK-NEXT: cmp x8, #6 // =6			; CHECK-NEXT: cmp x8, #6 // =6
	; CHECK-NEXT: csel x8, x8, x9, lo			; CHECK-NEXT: csel x8, x8, x9, lo
	; CHECK-NEXT: addvl x10, sp, #3			; CHECK-NEXT: addvl x10, sp, #3
	; CHECK-NEXT: lsl x8, x8, #3			; CHECK-NEXT: lsl x8, x8, #3
	; CHECK-NEXT: st1d { z0.d }, p0, [sp, #3, mul vl]			; CHECK-NEXT: st1d { z0.d }, p0, [sp, #3, mul vl]
	; CHECK-NEXT: str q4, [x10, x8]			; CHECK-NEXT: str q4, [x10, x8]
	; CHECK-NEXT: ld1d { z0.d }, p0/z, [sp, #3, mul vl]			; CHECK-NEXT: ld1d { z0.d }, p0/z, [sp, #3, mul vl]
	; CHECK-NEXT: addvl sp, sp, #4			; CHECK-NEXT: addvl sp, sp, #4
	; CHECK-NEXT: ldr x29, [sp], #16 // 8-byte Folded Reload			; CHECK-NEXT: ldr x30, [sp], #16 // 8-byte Folded Reload
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call <vscale x 2 x i64> @llvm.experimental.vector.insert.nxv2i64.v8i64(<vscale x 2 x i64> %a, <8 x i64> %b, i64 0)			%r = call <vscale x 2 x i64> @llvm.experimental.vector.insert.nxv2i64.v8i64(<vscale x 2 x i64> %a, <8 x i64> %b, i64 0)
	ret <vscale x 2 x i64> %r			ret <vscale x 2 x i64> %r
	}			}

	define <vscale x 2 x double> @test_nxv2f64_v8f64(<vscale x 2 x double> %a, <8 x double> %b) #0 {			define <vscale x 2 x double> @test_nxv2f64_v8f64(<vscale x 2 x double> %a, <8 x double> %b) #0 {
	; CHECK-LEGALIZATION: Legally typed node: [[T1:t[0-9]+]]: nxv2f64 = insert_subvector {{t[0-9]+}}, {{t[0-9]+}}, Constant:i64<0>			; CHECK-LEGALIZATION: Legally typed node: [[T1:t[0-9]+]]: nxv2f64 = insert_subvector {{t[0-9]+}}, {{t[0-9]+}}, Constant:i64<0>
	; CHECK-LEGALIZATION: Legally typed node: [[T2:t[0-9]+]]: nxv2f64 = insert_subvector [[T1]], {{t[0-9]+}}, Constant:i64<2>			; CHECK-LEGALIZATION: Legally typed node: [[T2:t[0-9]+]]: nxv2f64 = insert_subvector [[T1]], {{t[0-9]+}}, Constant:i64<2>
	; CHECK-LEGALIZATION: Legally typed node: [[T3:t[0-9]+]]: nxv2f64 = insert_subvector [[T2]], {{t[0-9]+}}, Constant:i64<4>			; CHECK-LEGALIZATION: Legally typed node: [[T3:t[0-9]+]]: nxv2f64 = insert_subvector [[T2]], {{t[0-9]+}}, Constant:i64<4>
	; CHECK-LEGALIZATION: Legally typed node: [[T4:t[0-9]+]]: nxv2f64 = insert_subvector [[T3]], {{t[0-9]+}}, Constant:i64<6>			; CHECK-LEGALIZATION: Legally typed node: [[T4:t[0-9]+]]: nxv2f64 = insert_subvector [[T3]], {{t[0-9]+}}, Constant:i64<6>

	; CHECK-LABEL: test_nxv2f64_v8f64:			; CHECK-LABEL: test_nxv2f64_v8f64:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: str x29, [sp, #-16]! // 8-byte Folded Spill			; CHECK-NEXT: str x30, [sp, #-16]! // 8-byte Folded Spill
	; CHECK-NEXT: addvl sp, sp, #-4			; CHECK-NEXT: addvl sp, sp, #-4
	; CHECK-NEXT: .cfi_escape 0x0f, 0x0c, 0x8f, 0x00, 0x11, 0x10, 0x22, 0x11, 0x20, 0x92, 0x2e, 0x00, 0x1e, 0x22 // sp + 16 + 32 * VG			; CHECK-NEXT: .cfi_escape 0x0f, 0x0c, 0x8f, 0x00, 0x11, 0x10, 0x22, 0x11, 0x20, 0x92, 0x2e, 0x00, 0x1e, 0x22 // sp + 16 + 32 * VG
	; CHECK-NEXT: .cfi_offset w29, -16			; CHECK-NEXT: .cfi_offset w30, -16
	; CHECK-NEXT: cntd x8			; CHECK-NEXT: cntd x8
	; CHECK-NEXT: sub x8, x8, #1 // =1			; CHECK-NEXT: sub x8, x8, #1 // =1
	; CHECK-NEXT: cmp x8, #0 // =0			; CHECK-NEXT: cmp x8, #0 // =0
	; CHECK-NEXT: csel x10, x8, xzr, lo			; CHECK-NEXT: csel x10, x8, xzr, lo
	; CHECK-NEXT: ptrue p0.d			; CHECK-NEXT: ptrue p0.d
	; CHECK-NEXT: mov x9, sp			; CHECK-NEXT: mov x9, sp
	; CHECK-NEXT: lsl x10, x10, #3			; CHECK-NEXT: lsl x10, x10, #3
	; CHECK-NEXT: st1d { z0.d }, p0, [sp]			; CHECK-NEXT: st1d { z0.d }, p0, [sp]
	Show All 19 Lines
	; CHECK-NEXT: cmp x8, #6 // =6			; CHECK-NEXT: cmp x8, #6 // =6
	; CHECK-NEXT: csel x8, x8, x9, lo			; CHECK-NEXT: csel x8, x8, x9, lo
	; CHECK-NEXT: addvl x10, sp, #3			; CHECK-NEXT: addvl x10, sp, #3
	; CHECK-NEXT: lsl x8, x8, #3			; CHECK-NEXT: lsl x8, x8, #3
	; CHECK-NEXT: st1d { z0.d }, p0, [sp, #3, mul vl]			; CHECK-NEXT: st1d { z0.d }, p0, [sp, #3, mul vl]
	; CHECK-NEXT: str q4, [x10, x8]			; CHECK-NEXT: str q4, [x10, x8]
	; CHECK-NEXT: ld1d { z0.d }, p0/z, [sp, #3, mul vl]			; CHECK-NEXT: ld1d { z0.d }, p0/z, [sp, #3, mul vl]
	; CHECK-NEXT: addvl sp, sp, #4			; CHECK-NEXT: addvl sp, sp, #4
	; CHECK-NEXT: ldr x29, [sp], #16 // 8-byte Folded Reload			; CHECK-NEXT: ldr x30, [sp], #16 // 8-byte Folded Reload
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call <vscale x 2 x double> @llvm.experimental.vector.insert.nxv2f64.v8f64(<vscale x 2 x double> %a, <8 x double> %b, i64 0)			%r = call <vscale x 2 x double> @llvm.experimental.vector.insert.nxv2f64.v8f64(<vscale x 2 x double> %a, <8 x double> %b, i64 0)
	ret <vscale x 2 x double> %r			ret <vscale x 2 x double> %r
	}			}

llvm/test/CodeGen/AArch64/sve-calling-convention-mixed.ll

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: llc < %s -mtriple aarch64-linux-gnu -mattr=+sve \| FileCheck %s			; RUN: llc < %s -mtriple aarch64-linux-gnu -mattr=+sve \| FileCheck %s

	target datalayout = "e-m:e-i8:8:32-i16:16:32-i64:64-i128:128-n32:64-S128"			target datalayout = "e-m:e-i8:8:32-i16:16:32-i64:64-i128:128-n32:64-S128"
	target triple = "aarch64-unknown-linux-gnu"			target triple = "aarch64-unknown-linux-gnu"

	; Make sure callers set up the arguments correctly - tests AArch64ISelLowering::LowerCALL			; Make sure callers set up the arguments correctly - tests AArch64ISelLowering::LowerCALL

	define float @foo1(double* %x0, double* %x1, double* %x2) nounwind {			define float @foo1(double* %x0, double* %x1, double* %x2) nounwind {
	; CHECK-LABEL: foo1:			; CHECK-LABEL: foo1:
	; CHECK: // %bb.0: // %entry			; CHECK: // %bb.0: // %entry
	; CHECK-NEXT: stp x29, x30, [sp, #-16]! // 16-byte Folded Spill			; CHECK-NEXT: stp x30, x28, [sp, #-16]! // 16-byte Folded Spill
	; CHECK-NEXT: addvl sp, sp, #-4			; CHECK-NEXT: addvl sp, sp, #-4
	; CHECK-NEXT: ptrue p0.b			; CHECK-NEXT: ptrue p0.b
	; CHECK-NEXT: ld4d { z1.d, z2.d, z3.d, z4.d }, p0/z, [x0]			; CHECK-NEXT: ld4d { z1.d, z2.d, z3.d, z4.d }, p0/z, [x0]
	; CHECK-NEXT: ld4d { z16.d, z17.d, z18.d, z19.d }, p0/z, [x1]			; CHECK-NEXT: ld4d { z16.d, z17.d, z18.d, z19.d }, p0/z, [x1]
	; CHECK-NEXT: ld1d { z5.d }, p0/z, [x2]			; CHECK-NEXT: ld1d { z5.d }, p0/z, [x2]
	; CHECK-NEXT: ptrue p0.d			; CHECK-NEXT: ptrue p0.d
	; CHECK-NEXT: mov x8, sp			; CHECK-NEXT: mov x8, sp
	; CHECK-NEXT: fmov s0, #1.00000000			; CHECK-NEXT: fmov s0, #1.00000000
	; CHECK-NEXT: mov x0, sp			; CHECK-NEXT: mov x0, sp
	; CHECK-NEXT: st1d { z16.d }, p0, [sp]			; CHECK-NEXT: st1d { z16.d }, p0, [sp]
	; CHECK-NEXT: st1d { z17.d }, p0, [x8, #1, mul vl]			; CHECK-NEXT: st1d { z17.d }, p0, [x8, #1, mul vl]
	; CHECK-NEXT: st1d { z18.d }, p0, [x8, #2, mul vl]			; CHECK-NEXT: st1d { z18.d }, p0, [x8, #2, mul vl]
	; CHECK-NEXT: st1d { z19.d }, p0, [x8, #3, mul vl]			; CHECK-NEXT: st1d { z19.d }, p0, [x8, #3, mul vl]
	; CHECK-NEXT: bl callee1			; CHECK-NEXT: bl callee1
	; CHECK-NEXT: addvl sp, sp, #4			; CHECK-NEXT: addvl sp, sp, #4
	; CHECK-NEXT: ldp x29, x30, [sp], #16 // 16-byte Folded Reload			; CHECK-NEXT: ldp x30, x28, [sp], #16 // 16-byte Folded Reload
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	entry:			entry:
	%0 = call <vscale x 16 x i1> @llvm.aarch64.sve.ptrue.nxv16i1(i32 31)			%0 = call <vscale x 16 x i1> @llvm.aarch64.sve.ptrue.nxv16i1(i32 31)
	%1 = call <vscale x 2 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv2i1(<vscale x 16 x i1> %0)			%1 = call <vscale x 2 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv2i1(<vscale x 16 x i1> %0)
	%2 = call <vscale x 8 x double> @llvm.aarch64.sve.ld4.nxv8f64.nxv2i1(<vscale x 2 x i1> %1, double* %x0)			%2 = call <vscale x 8 x double> @llvm.aarch64.sve.ld4.nxv8f64.nxv2i1(<vscale x 2 x i1> %1, double* %x0)
	%3 = call <vscale x 8 x double> @llvm.aarch64.sve.ld4.nxv8f64.nxv2i1(<vscale x 2 x i1> %1, double* %x1)			%3 = call <vscale x 8 x double> @llvm.aarch64.sve.ld4.nxv8f64.nxv2i1(<vscale x 2 x i1> %1, double* %x1)
	%4 = call <vscale x 2 x double> @llvm.aarch64.sve.ld1.nxv2f64(<vscale x 2 x i1> %1, double* %x2)			%4 = call <vscale x 2 x double> @llvm.aarch64.sve.ld1.nxv2f64(<vscale x 2 x i1> %1, double* %x2)
	%call = call float @callee1(float 1.000000e+00, <vscale x 8 x double> %2, <vscale x 8 x double> %3, <vscale x 2 x double> %4)			%call = call float @callee1(float 1.000000e+00, <vscale x 8 x double> %2, <vscale x 8 x double> %3, <vscale x 2 x double> %4)
	ret float %call			ret float %call
	}			}

	define float @foo2(double* %x0, double* %x1) nounwind {			define float @foo2(double* %x0, double* %x1) nounwind {
	; CHECK-LABEL: foo2:			; CHECK-LABEL: foo2:
	; CHECK: // %bb.0: // %entry			; CHECK: // %bb.0: // %entry
	; CHECK-NEXT: stp x29, x30, [sp, #-16]! // 16-byte Folded Spill			; CHECK-NEXT: stp x30, x28, [sp, #-16]! // 16-byte Folded Spill
	; CHECK-NEXT: mov x29, sp
	; CHECK-NEXT: addvl sp, sp, #-4			; CHECK-NEXT: addvl sp, sp, #-4
				; CHECK-NEXT: sub sp, sp, #16 // =16
				sdesmalenUnsubmitted Not Done Reply Inline Actions Why does this function not require the frame-pointer? (it has both locals for passing GPRs and ZPRs) sdesmalen: Why does this function not require the frame-pointer? (it has both locals for passing GPRs and…
				bsmithAuthorUnsubmitted Done Reply Inline Actions Unfortunately I think this is just going to have to be a deficiency in this approach and will have to get fixed when done properly. The issue here is that when `processFunctionBeforeCalleeSpill()` is called the stack has only one object on it (the SVE one), the non-SVE objects only appear during `assignCalleeSavedSpillSlots()` in `PrologEpilogInserter`, which is done after `determineCalleeSaves()`. The calculation of whether an FP should be used can't be delayed until after this point otherwise you end up with rogue frame pointer setup where it isn't used. bsmith: Unfortunately I think this is just going to have to be a deficiency in this approach and will…
	; CHECK-NEXT: ptrue p0.b			; CHECK-NEXT: ptrue p0.b
	; CHECK-NEXT: ld4d { z1.d, z2.d, z3.d, z4.d }, p0/z, [x0]			; CHECK-NEXT: ld4d { z1.d, z2.d, z3.d, z4.d }, p0/z, [x0]
	; CHECK-NEXT: ld4d { z16.d, z17.d, z18.d, z19.d }, p0/z, [x1]			; CHECK-NEXT: ld4d { z16.d, z17.d, z18.d, z19.d }, p0/z, [x1]
	; CHECK-NEXT: ptrue p0.d			; CHECK-NEXT: ptrue p0.d
	; CHECK-NEXT: addvl x8, x29, #-4			; CHECK-NEXT: add x8, sp, #16 // =16
				; CHECK-NEXT: add x9, sp, #16 // =16
	; CHECK-NEXT: fmov s0, #1.00000000			; CHECK-NEXT: fmov s0, #1.00000000
	; CHECK-NEXT: st1d { z16.d }, p0, [x29, #-4, mul vl]
	; CHECK-NEXT: st1d { z17.d }, p0, [x8, #1, mul vl]
	; CHECK-NEXT: st1d { z18.d }, p0, [x8, #2, mul vl]
	; CHECK-NEXT: st1d { z19.d }, p0, [x8, #3, mul vl]
	; CHECK-NEXT: mov w1, #1			; CHECK-NEXT: mov w1, #1
	; CHECK-NEXT: mov w2, #2			; CHECK-NEXT: mov w2, #2
	; CHECK-NEXT: mov w3, #3			; CHECK-NEXT: mov w3, #3
	; CHECK-NEXT: mov w4, #4			; CHECK-NEXT: mov w4, #4
	; CHECK-NEXT: mov w5, #5			; CHECK-NEXT: mov w5, #5
	; CHECK-NEXT: mov w6, #6			; CHECK-NEXT: mov w6, #6
	; CHECK-NEXT: mov w7, #7			; CHECK-NEXT: mov w7, #7
	; CHECK-NEXT: str x8, [sp, #-16]!
	; CHECK-NEXT: mov w0, wzr			; CHECK-NEXT: mov w0, wzr
				; CHECK-NEXT: st1d { z16.d }, p0, [x9]
				; CHECK-NEXT: st1d { z17.d }, p0, [x8, #1, mul vl]
				; CHECK-NEXT: st1d { z18.d }, p0, [x8, #2, mul vl]
				; CHECK-NEXT: st1d { z19.d }, p0, [x8, #3, mul vl]
				; CHECK-NEXT: str x8, [sp]
	; CHECK-NEXT: bl callee2			; CHECK-NEXT: bl callee2
	; CHECK-NEXT: addvl sp, sp, #4			; CHECK-NEXT: addvl sp, sp, #4
	; CHECK-NEXT: add sp, sp, #16 // =16			; CHECK-NEXT: add sp, sp, #16 // =16
	; CHECK-NEXT: ldp x29, x30, [sp], #16 // 16-byte Folded Reload			; CHECK-NEXT: ldp x30, x28, [sp], #16 // 16-byte Folded Reload
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	entry:			entry:
	%0 = call <vscale x 16 x i1> @llvm.aarch64.sve.ptrue.nxv16i1(i32 31)			%0 = call <vscale x 16 x i1> @llvm.aarch64.sve.ptrue.nxv16i1(i32 31)
	%1 = call <vscale x 2 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv2i1(<vscale x 16 x i1> %0)			%1 = call <vscale x 2 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv2i1(<vscale x 16 x i1> %0)
	%2 = call <vscale x 8 x double> @llvm.aarch64.sve.ld4.nxv8f64.nxv2i1(<vscale x 2 x i1> %1, double* %x0)			%2 = call <vscale x 8 x double> @llvm.aarch64.sve.ld4.nxv8f64.nxv2i1(<vscale x 2 x i1> %1, double* %x0)
	%3 = call <vscale x 8 x double> @llvm.aarch64.sve.ld4.nxv8f64.nxv2i1(<vscale x 2 x i1> %1, double* %x1)			%3 = call <vscale x 8 x double> @llvm.aarch64.sve.ld4.nxv8f64.nxv2i1(<vscale x 2 x i1> %1, double* %x1)
	%call = call float @callee2(i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7, float 1.000000e+00, <vscale x 8 x double> %2, <vscale x 8 x double> %3)			%call = call float @callee2(i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7, float 1.000000e+00, <vscale x 8 x double> %2, <vscale x 8 x double> %3)
	ret float %call			ret float %call
	}			}

	define float @foo3(double* %x0, double* %x1, double* %x2) nounwind {			define float @foo3(double* %x0, double* %x1, double* %x2) nounwind {
	; CHECK-LABEL: foo3:			; CHECK-LABEL: foo3:
	; CHECK: // %bb.0: // %entry			; CHECK: // %bb.0: // %entry
	; CHECK-NEXT: stp x29, x30, [sp, #-16]! // 16-byte Folded Spill			; CHECK-NEXT: stp x30, x28, [sp, #-16]! // 16-byte Folded Spill
	; CHECK-NEXT: addvl sp, sp, #-3			; CHECK-NEXT: addvl sp, sp, #-3
	; CHECK-NEXT: ptrue p0.b			; CHECK-NEXT: ptrue p0.b
	; CHECK-NEXT: ld4d { z2.d, z3.d, z4.d, z5.d }, p0/z, [x0]			; CHECK-NEXT: ld4d { z2.d, z3.d, z4.d, z5.d }, p0/z, [x0]
	; CHECK-NEXT: ld3d { z16.d, z17.d, z18.d }, p0/z, [x1]			; CHECK-NEXT: ld3d { z16.d, z17.d, z18.d }, p0/z, [x1]
	; CHECK-NEXT: ld1d { z6.d }, p0/z, [x2]			; CHECK-NEXT: ld1d { z6.d }, p0/z, [x2]
	; CHECK-NEXT: ptrue p0.d			; CHECK-NEXT: ptrue p0.d
	; CHECK-NEXT: mov x8, sp			; CHECK-NEXT: mov x8, sp
	; CHECK-NEXT: fmov s0, #1.00000000			; CHECK-NEXT: fmov s0, #1.00000000
	; CHECK-NEXT: fmov s1, #2.00000000			; CHECK-NEXT: fmov s1, #2.00000000
	; CHECK-NEXT: mov x0, sp			; CHECK-NEXT: mov x0, sp
	; CHECK-NEXT: st1d { z16.d }, p0, [sp]			; CHECK-NEXT: st1d { z16.d }, p0, [sp]
	; CHECK-NEXT: st1d { z17.d }, p0, [x8, #1, mul vl]			; CHECK-NEXT: st1d { z17.d }, p0, [x8, #1, mul vl]
	; CHECK-NEXT: st1d { z18.d }, p0, [x8, #2, mul vl]			; CHECK-NEXT: st1d { z18.d }, p0, [x8, #2, mul vl]
	; CHECK-NEXT: bl callee3			; CHECK-NEXT: bl callee3
	; CHECK-NEXT: addvl sp, sp, #3			; CHECK-NEXT: addvl sp, sp, #3
	; CHECK-NEXT: ldp x29, x30, [sp], #16 // 16-byte Folded Reload			; CHECK-NEXT: ldp x30, x28, [sp], #16 // 16-byte Folded Reload
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	entry:			entry:
	%0 = call <vscale x 16 x i1> @llvm.aarch64.sve.ptrue.nxv16i1(i32 31)			%0 = call <vscale x 16 x i1> @llvm.aarch64.sve.ptrue.nxv16i1(i32 31)
	%1 = call <vscale x 2 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv2i1(<vscale x 16 x i1> %0)			%1 = call <vscale x 2 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv2i1(<vscale x 16 x i1> %0)
	%2 = call <vscale x 8 x double> @llvm.aarch64.sve.ld4.nxv8f64.nxv2i1(<vscale x 2 x i1> %1, double* %x0)			%2 = call <vscale x 8 x double> @llvm.aarch64.sve.ld4.nxv8f64.nxv2i1(<vscale x 2 x i1> %1, double* %x0)
	%3 = call <vscale x 6 x double> @llvm.aarch64.sve.ld3.nxv6f64.nxv2i1(<vscale x 2 x i1> %1, double* %x1)			%3 = call <vscale x 6 x double> @llvm.aarch64.sve.ld3.nxv6f64.nxv2i1(<vscale x 2 x i1> %1, double* %x1)
	%4 = call <vscale x 2 x double> @llvm.aarch64.sve.ld1.nxv2f64(<vscale x 2 x i1> %1, double* %x2)			%4 = call <vscale x 2 x double> @llvm.aarch64.sve.ld1.nxv2f64(<vscale x 2 x i1> %1, double* %x2)
	%call = call float @callee3(float 1.000000e+00, float 2.000000e+00, <vscale x 8 x double> %2, <vscale x 6 x double> %3, <vscale x 2 x double> %4)			%call = call float @callee3(float 1.000000e+00, float 2.000000e+00, <vscale x 8 x double> %2, <vscale x 6 x double> %3, <vscale x 2 x double> %4)
	▲ Show 20 Lines • Show All 94 Lines • Show Last 20 Lines

llvm/test/CodeGen/AArch64/sve-extract-vector.ll

Show All 13 Lines	; CHECK-NEXT: ret
%retval = call <2 x i64> @llvm.experimental.vector.extract.v2i64.nxv2i64(<vscale x 2 x i64> %vec, i64 0)		%retval = call <2 x i64> @llvm.experimental.vector.extract.v2i64.nxv2i64(<vscale x 2 x i64> %vec, i64 0)
ret <2 x i64> %retval		ret <2 x i64> %retval
}		}

; Goes through memory currently; idx != 0.		; Goes through memory currently; idx != 0.
define <2 x i64> @extract_v2i64_nxv2i64_idx1(<vscale x 2 x i64> %vec) nounwind {		define <2 x i64> @extract_v2i64_nxv2i64_idx1(<vscale x 2 x i64> %vec) nounwind {
; CHECK-LABEL: extract_v2i64_nxv2i64_idx1:		; CHECK-LABEL: extract_v2i64_nxv2i64_idx1:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: str x29, [sp, #-16]! // 8-byte Folded Spill		; CHECK-NEXT: str x30, [sp, #-16]! // 8-byte Folded Spill
; CHECK-NEXT: addvl sp, sp, #-1		; CHECK-NEXT: addvl sp, sp, #-1
; CHECK-NEXT: cntd x8		; CHECK-NEXT: cntd x8
; CHECK-NEXT: sub x8, x8, #1 // =1		; CHECK-NEXT: sub x8, x8, #1 // =1
; CHECK-NEXT: cmp x8, #1 // =1		; CHECK-NEXT: cmp x8, #1 // =1
; CHECK-NEXT: ptrue p0.d		; CHECK-NEXT: ptrue p0.d
; CHECK-NEXT: csinc x8, x8, xzr, lo		; CHECK-NEXT: csinc x8, x8, xzr, lo
; CHECK-NEXT: st1d { z0.d }, p0, [sp]		; CHECK-NEXT: st1d { z0.d }, p0, [sp]
; CHECK-NEXT: lsl x8, x8, #3		; CHECK-NEXT: lsl x8, x8, #3
; CHECK-NEXT: mov x9, sp		; CHECK-NEXT: mov x9, sp
; CHECK-NEXT: ldr q0, [x9, x8]		; CHECK-NEXT: ldr q0, [x9, x8]
; CHECK-NEXT: addvl sp, sp, #1		; CHECK-NEXT: addvl sp, sp, #1
; CHECK-NEXT: ldr x29, [sp], #16 // 8-byte Folded Reload		; CHECK-NEXT: ldr x30, [sp], #16 // 8-byte Folded Reload
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%retval = call <2 x i64> @llvm.experimental.vector.extract.v2i64.nxv2i64(<vscale x 2 x i64> %vec, i64 1)		%retval = call <2 x i64> @llvm.experimental.vector.extract.v2i64.nxv2i64(<vscale x 2 x i64> %vec, i64 1)
ret <2 x i64> %retval		ret <2 x i64> %retval
}		}

; Should codegen to a nop, since idx is zero.		; Should codegen to a nop, since idx is zero.
define <4 x i32> @extract_v4i32_nxv4i32(<vscale x 4 x i32> %vec) nounwind {		define <4 x i32> @extract_v4i32_nxv4i32(<vscale x 4 x i32> %vec) nounwind {
; CHECK-LABEL: extract_v4i32_nxv4i32:		; CHECK-LABEL: extract_v4i32_nxv4i32:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: // kill: def $q0 killed $q0 killed $z0		; CHECK-NEXT: // kill: def $q0 killed $q0 killed $z0
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%retval = call <4 x i32> @llvm.experimental.vector.extract.v4i32.nxv4i32(<vscale x 4 x i32> %vec, i64 0)		%retval = call <4 x i32> @llvm.experimental.vector.extract.v4i32.nxv4i32(<vscale x 4 x i32> %vec, i64 0)
ret <4 x i32> %retval		ret <4 x i32> %retval
}		}

; Goes through memory currently; idx != 0.		; Goes through memory currently; idx != 0.
define <4 x i32> @extract_v4i32_nxv4i32_idx1(<vscale x 4 x i32> %vec) nounwind {		define <4 x i32> @extract_v4i32_nxv4i32_idx1(<vscale x 4 x i32> %vec) nounwind {
; CHECK-LABEL: extract_v4i32_nxv4i32_idx1:		; CHECK-LABEL: extract_v4i32_nxv4i32_idx1:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: str x29, [sp, #-16]! // 8-byte Folded Spill		; CHECK-NEXT: str x30, [sp, #-16]! // 8-byte Folded Spill
; CHECK-NEXT: addvl sp, sp, #-1		; CHECK-NEXT: addvl sp, sp, #-1
; CHECK-NEXT: cntw x8		; CHECK-NEXT: cntw x8
; CHECK-NEXT: sub x8, x8, #1 // =1		; CHECK-NEXT: sub x8, x8, #1 // =1
; CHECK-NEXT: cmp x8, #1 // =1		; CHECK-NEXT: cmp x8, #1 // =1
; CHECK-NEXT: ptrue p0.s		; CHECK-NEXT: ptrue p0.s
; CHECK-NEXT: csinc x8, x8, xzr, lo		; CHECK-NEXT: csinc x8, x8, xzr, lo
; CHECK-NEXT: st1w { z0.s }, p0, [sp]		; CHECK-NEXT: st1w { z0.s }, p0, [sp]
; CHECK-NEXT: lsl x8, x8, #2		; CHECK-NEXT: lsl x8, x8, #2
; CHECK-NEXT: mov x9, sp		; CHECK-NEXT: mov x9, sp
; CHECK-NEXT: ldr q0, [x9, x8]		; CHECK-NEXT: ldr q0, [x9, x8]
; CHECK-NEXT: addvl sp, sp, #1		; CHECK-NEXT: addvl sp, sp, #1
; CHECK-NEXT: ldr x29, [sp], #16 // 8-byte Folded Reload		; CHECK-NEXT: ldr x30, [sp], #16 // 8-byte Folded Reload
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%retval = call <4 x i32> @llvm.experimental.vector.extract.v4i32.nxv4i32(<vscale x 4 x i32> %vec, i64 1)		%retval = call <4 x i32> @llvm.experimental.vector.extract.v4i32.nxv4i32(<vscale x 4 x i32> %vec, i64 1)
ret <4 x i32> %retval		ret <4 x i32> %retval
}		}

; Should codegen to a nop, since idx is zero.		; Should codegen to a nop, since idx is zero.
define <8 x i16> @extract_v8i16_nxv8i16(<vscale x 8 x i16> %vec) nounwind {		define <8 x i16> @extract_v8i16_nxv8i16(<vscale x 8 x i16> %vec) nounwind {
; CHECK-LABEL: extract_v8i16_nxv8i16:		; CHECK-LABEL: extract_v8i16_nxv8i16:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: // kill: def $q0 killed $q0 killed $z0		; CHECK-NEXT: // kill: def $q0 killed $q0 killed $z0
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%retval = call <8 x i16> @llvm.experimental.vector.extract.v8i16.nxv8i16(<vscale x 8 x i16> %vec, i64 0)		%retval = call <8 x i16> @llvm.experimental.vector.extract.v8i16.nxv8i16(<vscale x 8 x i16> %vec, i64 0)
ret <8 x i16> %retval		ret <8 x i16> %retval
}		}

; Goes through memory currently; idx != 0.		; Goes through memory currently; idx != 0.
define <8 x i16> @extract_v8i16_nxv8i16_idx1(<vscale x 8 x i16> %vec) nounwind {		define <8 x i16> @extract_v8i16_nxv8i16_idx1(<vscale x 8 x i16> %vec) nounwind {
; CHECK-LABEL: extract_v8i16_nxv8i16_idx1:		; CHECK-LABEL: extract_v8i16_nxv8i16_idx1:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: str x29, [sp, #-16]! // 8-byte Folded Spill		; CHECK-NEXT: str x30, [sp, #-16]! // 8-byte Folded Spill
; CHECK-NEXT: addvl sp, sp, #-1		; CHECK-NEXT: addvl sp, sp, #-1
; CHECK-NEXT: cnth x8		; CHECK-NEXT: cnth x8
; CHECK-NEXT: sub x8, x8, #1 // =1		; CHECK-NEXT: sub x8, x8, #1 // =1
; CHECK-NEXT: cmp x8, #1 // =1		; CHECK-NEXT: cmp x8, #1 // =1
; CHECK-NEXT: ptrue p0.h		; CHECK-NEXT: ptrue p0.h
; CHECK-NEXT: csinc x8, x8, xzr, lo		; CHECK-NEXT: csinc x8, x8, xzr, lo
; CHECK-NEXT: st1h { z0.h }, p0, [sp]		; CHECK-NEXT: st1h { z0.h }, p0, [sp]
; CHECK-NEXT: lsl x8, x8, #1		; CHECK-NEXT: lsl x8, x8, #1
; CHECK-NEXT: mov x9, sp		; CHECK-NEXT: mov x9, sp
; CHECK-NEXT: ldr q0, [x9, x8]		; CHECK-NEXT: ldr q0, [x9, x8]
; CHECK-NEXT: addvl sp, sp, #1		; CHECK-NEXT: addvl sp, sp, #1
; CHECK-NEXT: ldr x29, [sp], #16 // 8-byte Folded Reload		; CHECK-NEXT: ldr x30, [sp], #16 // 8-byte Folded Reload
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%retval = call <8 x i16> @llvm.experimental.vector.extract.v8i16.nxv8i16(<vscale x 8 x i16> %vec, i64 1)		%retval = call <8 x i16> @llvm.experimental.vector.extract.v8i16.nxv8i16(<vscale x 8 x i16> %vec, i64 1)
ret <8 x i16> %retval		ret <8 x i16> %retval
}		}

; Should codegen to a nop, since idx is zero.		; Should codegen to a nop, since idx is zero.
define <16 x i8> @extract_v16i8_nxv16i8(<vscale x 16 x i8> %vec) nounwind {		define <16 x i8> @extract_v16i8_nxv16i8(<vscale x 16 x i8> %vec) nounwind {
; CHECK-LABEL: extract_v16i8_nxv16i8:		; CHECK-LABEL: extract_v16i8_nxv16i8:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: // kill: def $q0 killed $q0 killed $z0		; CHECK-NEXT: // kill: def $q0 killed $q0 killed $z0
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%retval = call <16 x i8> @llvm.experimental.vector.extract.v16i8.nxv16i8(<vscale x 16 x i8> %vec, i64 0)		%retval = call <16 x i8> @llvm.experimental.vector.extract.v16i8.nxv16i8(<vscale x 16 x i8> %vec, i64 0)
ret <16 x i8> %retval		ret <16 x i8> %retval
}		}

; Goes through memory currently; idx != 0.		; Goes through memory currently; idx != 0.
define <16 x i8> @extract_v16i8_nxv16i8_idx1(<vscale x 16 x i8> %vec) nounwind {		define <16 x i8> @extract_v16i8_nxv16i8_idx1(<vscale x 16 x i8> %vec) nounwind {
; CHECK-LABEL: extract_v16i8_nxv16i8_idx1:		; CHECK-LABEL: extract_v16i8_nxv16i8_idx1:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: str x29, [sp, #-16]! // 8-byte Folded Spill		; CHECK-NEXT: str x30, [sp, #-16]! // 8-byte Folded Spill
; CHECK-NEXT: addvl sp, sp, #-1		; CHECK-NEXT: addvl sp, sp, #-1
; CHECK-NEXT: rdvl x8, #1		; CHECK-NEXT: rdvl x8, #1
; CHECK-NEXT: sub x8, x8, #1 // =1		; CHECK-NEXT: sub x8, x8, #1 // =1
; CHECK-NEXT: ptrue p0.b		; CHECK-NEXT: ptrue p0.b
; CHECK-NEXT: cmp x8, #1 // =1		; CHECK-NEXT: cmp x8, #1 // =1
; CHECK-NEXT: st1b { z0.b }, p0, [sp]		; CHECK-NEXT: st1b { z0.b }, p0, [sp]
; CHECK-NEXT: csinc x8, x8, xzr, lo		; CHECK-NEXT: csinc x8, x8, xzr, lo
; CHECK-NEXT: mov x9, sp		; CHECK-NEXT: mov x9, sp
; CHECK-NEXT: ldr q0, [x9, x8]		; CHECK-NEXT: ldr q0, [x9, x8]
; CHECK-NEXT: addvl sp, sp, #1		; CHECK-NEXT: addvl sp, sp, #1
; CHECK-NEXT: ldr x29, [sp], #16 // 8-byte Folded Reload		; CHECK-NEXT: ldr x30, [sp], #16 // 8-byte Folded Reload
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%retval = call <16 x i8> @llvm.experimental.vector.extract.v16i8.nxv16i8(<vscale x 16 x i8> %vec, i64 1)		%retval = call <16 x i8> @llvm.experimental.vector.extract.v16i8.nxv16i8(<vscale x 16 x i8> %vec, i64 1)
ret <16 x i8> %retval		ret <16 x i8> %retval
}		}

declare <2 x i64> @llvm.experimental.vector.extract.v2i64.nxv2i64(<vscale x 2 x i64>, i64)		declare <2 x i64> @llvm.experimental.vector.extract.v2i64.nxv2i64(<vscale x 2 x i64>, i64)
declare <4 x i32> @llvm.experimental.vector.extract.v4i32.nxv4i32(<vscale x 4 x i32>, i64)		declare <4 x i32> @llvm.experimental.vector.extract.v4i32.nxv4i32(<vscale x 4 x i32>, i64)
declare <8 x i16> @llvm.experimental.vector.extract.v8i16.nxv8i16(<vscale x 8 x i16>, i64)		declare <8 x i16> @llvm.experimental.vector.extract.v8i16.nxv8i16(<vscale x 8 x i16>, i64)
declare <16 x i8> @llvm.experimental.vector.extract.v16i8.nxv16i8(<vscale x 16 x i8>, i64)		declare <16 x i8> @llvm.experimental.vector.extract.v16i8.nxv16i8(<vscale x 16 x i8>, i64)

llvm/test/CodeGen/AArch64/sve-insert-vector.ll

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: llc -mtriple=aarch64-linux-gnu -mattr=+sve < %s 2>%t \| FileCheck %s --check-prefixes=CHECK			; RUN: llc -mtriple=aarch64-linux-gnu -mattr=+sve < %s 2>%t \| FileCheck %s --check-prefixes=CHECK
	; RUN: FileCheck --check-prefix=WARN --allow-empty %s < %t			; RUN: FileCheck --check-prefix=WARN --allow-empty %s < %t
	; If this check fails please read test/CodeGen/AArch64/README for instructions on how to resolve it.			; If this check fails please read test/CodeGen/AArch64/README for instructions on how to resolve it.
	; WARN-NOT: warning			; WARN-NOT: warning

	define <vscale x 2 x i64> @insert_v2i64_nxv2i64(<vscale x 2 x i64> %vec, <2 x i64> %subvec) nounwind {			define <vscale x 2 x i64> @insert_v2i64_nxv2i64(<vscale x 2 x i64> %vec, <2 x i64> %subvec) nounwind {
	; CHECK-LABEL: insert_v2i64_nxv2i64:			; CHECK-LABEL: insert_v2i64_nxv2i64:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: str x29, [sp, #-16]! // 8-byte Folded Spill			; CHECK-NEXT: str x30, [sp, #-16]! // 8-byte Folded Spill
	; CHECK-NEXT: addvl sp, sp, #-1			; CHECK-NEXT: addvl sp, sp, #-1
	; CHECK-NEXT: cntd x8			; CHECK-NEXT: cntd x8
	; CHECK-NEXT: sub x8, x8, #1 // =1			; CHECK-NEXT: sub x8, x8, #1 // =1
	; CHECK-NEXT: cmp x8, #0 // =0			; CHECK-NEXT: cmp x8, #0 // =0
	; CHECK-NEXT: csel x8, x8, xzr, lo			; CHECK-NEXT: csel x8, x8, xzr, lo
	; CHECK-NEXT: ptrue p0.d			; CHECK-NEXT: ptrue p0.d
	; CHECK-NEXT: lsl x8, x8, #3			; CHECK-NEXT: lsl x8, x8, #3
	; CHECK-NEXT: mov x9, sp			; CHECK-NEXT: mov x9, sp
	; CHECK-NEXT: st1d { z0.d }, p0, [sp]			; CHECK-NEXT: st1d { z0.d }, p0, [sp]
	; CHECK-NEXT: str q1, [x9, x8]			; CHECK-NEXT: str q1, [x9, x8]
	; CHECK-NEXT: ld1d { z0.d }, p0/z, [sp]			; CHECK-NEXT: ld1d { z0.d }, p0/z, [sp]
	; CHECK-NEXT: addvl sp, sp, #1			; CHECK-NEXT: addvl sp, sp, #1
	; CHECK-NEXT: ldr x29, [sp], #16 // 8-byte Folded Reload			; CHECK-NEXT: ldr x30, [sp], #16 // 8-byte Folded Reload
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%retval = call <vscale x 2 x i64> @llvm.experimental.vector.insert.nxv2i64.v2i64(<vscale x 2 x i64> %vec, <2 x i64> %subvec, i64 0)			%retval = call <vscale x 2 x i64> @llvm.experimental.vector.insert.nxv2i64.v2i64(<vscale x 2 x i64> %vec, <2 x i64> %subvec, i64 0)
	ret <vscale x 2 x i64> %retval			ret <vscale x 2 x i64> %retval
	}			}

	define <vscale x 2 x i64> @insert_v2i64_nxv2i64_idx1(<vscale x 2 x i64> %vec, <2 x i64> %subvec) nounwind {			define <vscale x 2 x i64> @insert_v2i64_nxv2i64_idx1(<vscale x 2 x i64> %vec, <2 x i64> %subvec) nounwind {
	; CHECK-LABEL: insert_v2i64_nxv2i64_idx1:			; CHECK-LABEL: insert_v2i64_nxv2i64_idx1:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: str x29, [sp, #-16]! // 8-byte Folded Spill			; CHECK-NEXT: str x30, [sp, #-16]! // 8-byte Folded Spill
	; CHECK-NEXT: addvl sp, sp, #-1			; CHECK-NEXT: addvl sp, sp, #-1
	; CHECK-NEXT: cntd x8			; CHECK-NEXT: cntd x8
	; CHECK-NEXT: sub x8, x8, #1 // =1			; CHECK-NEXT: sub x8, x8, #1 // =1
	; CHECK-NEXT: cmp x8, #1 // =1			; CHECK-NEXT: cmp x8, #1 // =1
	; CHECK-NEXT: csinc x8, x8, xzr, lo			; CHECK-NEXT: csinc x8, x8, xzr, lo
	; CHECK-NEXT: ptrue p0.d			; CHECK-NEXT: ptrue p0.d
	; CHECK-NEXT: lsl x8, x8, #3			; CHECK-NEXT: lsl x8, x8, #3
	; CHECK-NEXT: mov x9, sp			; CHECK-NEXT: mov x9, sp
	; CHECK-NEXT: st1d { z0.d }, p0, [sp]			; CHECK-NEXT: st1d { z0.d }, p0, [sp]
	; CHECK-NEXT: str q1, [x9, x8]			; CHECK-NEXT: str q1, [x9, x8]
	; CHECK-NEXT: ld1d { z0.d }, p0/z, [sp]			; CHECK-NEXT: ld1d { z0.d }, p0/z, [sp]
	; CHECK-NEXT: addvl sp, sp, #1			; CHECK-NEXT: addvl sp, sp, #1
	; CHECK-NEXT: ldr x29, [sp], #16 // 8-byte Folded Reload			; CHECK-NEXT: ldr x30, [sp], #16 // 8-byte Folded Reload
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%retval = call <vscale x 2 x i64> @llvm.experimental.vector.insert.nxv2i64.v2i64(<vscale x 2 x i64> %vec, <2 x i64> %subvec, i64 1)			%retval = call <vscale x 2 x i64> @llvm.experimental.vector.insert.nxv2i64.v2i64(<vscale x 2 x i64> %vec, <2 x i64> %subvec, i64 1)
	ret <vscale x 2 x i64> %retval			ret <vscale x 2 x i64> %retval
	}			}

	define <vscale x 4 x i32> @insert_v4i32_nxv4i32(<vscale x 4 x i32> %vec, <4 x i32> %subvec) nounwind {			define <vscale x 4 x i32> @insert_v4i32_nxv4i32(<vscale x 4 x i32> %vec, <4 x i32> %subvec) nounwind {
	; CHECK-LABEL: insert_v4i32_nxv4i32:			; CHECK-LABEL: insert_v4i32_nxv4i32:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: str x29, [sp, #-16]! // 8-byte Folded Spill			; CHECK-NEXT: str x30, [sp, #-16]! // 8-byte Folded Spill
	; CHECK-NEXT: addvl sp, sp, #-1			; CHECK-NEXT: addvl sp, sp, #-1
	; CHECK-NEXT: cntw x8			; CHECK-NEXT: cntw x8
	; CHECK-NEXT: sub x8, x8, #1 // =1			; CHECK-NEXT: sub x8, x8, #1 // =1
	; CHECK-NEXT: cmp x8, #0 // =0			; CHECK-NEXT: cmp x8, #0 // =0
	; CHECK-NEXT: csel x8, x8, xzr, lo			; CHECK-NEXT: csel x8, x8, xzr, lo
	; CHECK-NEXT: ptrue p0.s			; CHECK-NEXT: ptrue p0.s
	; CHECK-NEXT: lsl x8, x8, #2			; CHECK-NEXT: lsl x8, x8, #2
	; CHECK-NEXT: mov x9, sp			; CHECK-NEXT: mov x9, sp
	; CHECK-NEXT: st1w { z0.s }, p0, [sp]			; CHECK-NEXT: st1w { z0.s }, p0, [sp]
	; CHECK-NEXT: str q1, [x9, x8]			; CHECK-NEXT: str q1, [x9, x8]
	; CHECK-NEXT: ld1w { z0.s }, p0/z, [sp]			; CHECK-NEXT: ld1w { z0.s }, p0/z, [sp]
	; CHECK-NEXT: addvl sp, sp, #1			; CHECK-NEXT: addvl sp, sp, #1
	; CHECK-NEXT: ldr x29, [sp], #16 // 8-byte Folded Reload			; CHECK-NEXT: ldr x30, [sp], #16 // 8-byte Folded Reload
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%retval = call <vscale x 4 x i32> @llvm.experimental.vector.insert.nxv4i32.v4i32(<vscale x 4 x i32> %vec, <4 x i32> %subvec, i64 0)			%retval = call <vscale x 4 x i32> @llvm.experimental.vector.insert.nxv4i32.v4i32(<vscale x 4 x i32> %vec, <4 x i32> %subvec, i64 0)
	ret <vscale x 4 x i32> %retval			ret <vscale x 4 x i32> %retval
	}			}

	define <vscale x 4 x i32> @insert_v4i32_nxv4i32_idx1(<vscale x 4 x i32> %vec, <4 x i32> %subvec) nounwind {			define <vscale x 4 x i32> @insert_v4i32_nxv4i32_idx1(<vscale x 4 x i32> %vec, <4 x i32> %subvec) nounwind {
	; CHECK-LABEL: insert_v4i32_nxv4i32_idx1:			; CHECK-LABEL: insert_v4i32_nxv4i32_idx1:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: str x29, [sp, #-16]! // 8-byte Folded Spill			; CHECK-NEXT: str x30, [sp, #-16]! // 8-byte Folded Spill
	; CHECK-NEXT: addvl sp, sp, #-1			; CHECK-NEXT: addvl sp, sp, #-1
	; CHECK-NEXT: cntw x8			; CHECK-NEXT: cntw x8
	; CHECK-NEXT: sub x8, x8, #1 // =1			; CHECK-NEXT: sub x8, x8, #1 // =1
	; CHECK-NEXT: cmp x8, #1 // =1			; CHECK-NEXT: cmp x8, #1 // =1
	; CHECK-NEXT: csinc x8, x8, xzr, lo			; CHECK-NEXT: csinc x8, x8, xzr, lo
	; CHECK-NEXT: ptrue p0.s			; CHECK-NEXT: ptrue p0.s
	; CHECK-NEXT: lsl x8, x8, #2			; CHECK-NEXT: lsl x8, x8, #2
	; CHECK-NEXT: mov x9, sp			; CHECK-NEXT: mov x9, sp
	; CHECK-NEXT: st1w { z0.s }, p0, [sp]			; CHECK-NEXT: st1w { z0.s }, p0, [sp]
	; CHECK-NEXT: str q1, [x9, x8]			; CHECK-NEXT: str q1, [x9, x8]
	; CHECK-NEXT: ld1w { z0.s }, p0/z, [sp]			; CHECK-NEXT: ld1w { z0.s }, p0/z, [sp]
	; CHECK-NEXT: addvl sp, sp, #1			; CHECK-NEXT: addvl sp, sp, #1
	; CHECK-NEXT: ldr x29, [sp], #16 // 8-byte Folded Reload			; CHECK-NEXT: ldr x30, [sp], #16 // 8-byte Folded Reload
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%retval = call <vscale x 4 x i32> @llvm.experimental.vector.insert.nxv4i32.v4i32(<vscale x 4 x i32> %vec, <4 x i32> %subvec, i64 1)			%retval = call <vscale x 4 x i32> @llvm.experimental.vector.insert.nxv4i32.v4i32(<vscale x 4 x i32> %vec, <4 x i32> %subvec, i64 1)
	ret <vscale x 4 x i32> %retval			ret <vscale x 4 x i32> %retval
	}			}

	define <vscale x 8 x i16> @insert_v8i16_nxv8i16(<vscale x 8 x i16> %vec, <8 x i16> %subvec) nounwind {			define <vscale x 8 x i16> @insert_v8i16_nxv8i16(<vscale x 8 x i16> %vec, <8 x i16> %subvec) nounwind {
	; CHECK-LABEL: insert_v8i16_nxv8i16:			; CHECK-LABEL: insert_v8i16_nxv8i16:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: str x29, [sp, #-16]! // 8-byte Folded Spill			; CHECK-NEXT: str x30, [sp, #-16]! // 8-byte Folded Spill
	; CHECK-NEXT: addvl sp, sp, #-1			; CHECK-NEXT: addvl sp, sp, #-1
	; CHECK-NEXT: cnth x8			; CHECK-NEXT: cnth x8
	; CHECK-NEXT: sub x8, x8, #1 // =1			; CHECK-NEXT: sub x8, x8, #1 // =1
	; CHECK-NEXT: cmp x8, #0 // =0			; CHECK-NEXT: cmp x8, #0 // =0
	; CHECK-NEXT: csel x8, x8, xzr, lo			; CHECK-NEXT: csel x8, x8, xzr, lo
	; CHECK-NEXT: ptrue p0.h			; CHECK-NEXT: ptrue p0.h
	; CHECK-NEXT: lsl x8, x8, #1			; CHECK-NEXT: lsl x8, x8, #1
	; CHECK-NEXT: mov x9, sp			; CHECK-NEXT: mov x9, sp
	; CHECK-NEXT: st1h { z0.h }, p0, [sp]			; CHECK-NEXT: st1h { z0.h }, p0, [sp]
	; CHECK-NEXT: str q1, [x9, x8]			; CHECK-NEXT: str q1, [x9, x8]
	; CHECK-NEXT: ld1h { z0.h }, p0/z, [sp]			; CHECK-NEXT: ld1h { z0.h }, p0/z, [sp]
	; CHECK-NEXT: addvl sp, sp, #1			; CHECK-NEXT: addvl sp, sp, #1
	; CHECK-NEXT: ldr x29, [sp], #16 // 8-byte Folded Reload			; CHECK-NEXT: ldr x30, [sp], #16 // 8-byte Folded Reload
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%retval = call <vscale x 8 x i16> @llvm.experimental.vector.insert.nxv8i16.v8i16(<vscale x 8 x i16> %vec, <8 x i16> %subvec, i64 0)			%retval = call <vscale x 8 x i16> @llvm.experimental.vector.insert.nxv8i16.v8i16(<vscale x 8 x i16> %vec, <8 x i16> %subvec, i64 0)
	ret <vscale x 8 x i16> %retval			ret <vscale x 8 x i16> %retval
	}			}

	define <vscale x 8 x i16> @insert_v8i16_nxv8i16_idx1(<vscale x 8 x i16> %vec, <8 x i16> %subvec) nounwind {			define <vscale x 8 x i16> @insert_v8i16_nxv8i16_idx1(<vscale x 8 x i16> %vec, <8 x i16> %subvec) nounwind {
	; CHECK-LABEL: insert_v8i16_nxv8i16_idx1:			; CHECK-LABEL: insert_v8i16_nxv8i16_idx1:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: str x29, [sp, #-16]! // 8-byte Folded Spill			; CHECK-NEXT: str x30, [sp, #-16]! // 8-byte Folded Spill
	; CHECK-NEXT: addvl sp, sp, #-1			; CHECK-NEXT: addvl sp, sp, #-1
	; CHECK-NEXT: cnth x8			; CHECK-NEXT: cnth x8
	; CHECK-NEXT: sub x8, x8, #1 // =1			; CHECK-NEXT: sub x8, x8, #1 // =1
	; CHECK-NEXT: cmp x8, #1 // =1			; CHECK-NEXT: cmp x8, #1 // =1
	; CHECK-NEXT: csinc x8, x8, xzr, lo			; CHECK-NEXT: csinc x8, x8, xzr, lo
	; CHECK-NEXT: ptrue p0.h			; CHECK-NEXT: ptrue p0.h
	; CHECK-NEXT: lsl x8, x8, #1			; CHECK-NEXT: lsl x8, x8, #1
	; CHECK-NEXT: mov x9, sp			; CHECK-NEXT: mov x9, sp
	; CHECK-NEXT: st1h { z0.h }, p0, [sp]			; CHECK-NEXT: st1h { z0.h }, p0, [sp]
	; CHECK-NEXT: str q1, [x9, x8]			; CHECK-NEXT: str q1, [x9, x8]
	; CHECK-NEXT: ld1h { z0.h }, p0/z, [sp]			; CHECK-NEXT: ld1h { z0.h }, p0/z, [sp]
	; CHECK-NEXT: addvl sp, sp, #1			; CHECK-NEXT: addvl sp, sp, #1
	; CHECK-NEXT: ldr x29, [sp], #16 // 8-byte Folded Reload			; CHECK-NEXT: ldr x30, [sp], #16 // 8-byte Folded Reload
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%retval = call <vscale x 8 x i16> @llvm.experimental.vector.insert.nxv8i16.v8i16(<vscale x 8 x i16> %vec, <8 x i16> %subvec, i64 1)			%retval = call <vscale x 8 x i16> @llvm.experimental.vector.insert.nxv8i16.v8i16(<vscale x 8 x i16> %vec, <8 x i16> %subvec, i64 1)
	ret <vscale x 8 x i16> %retval			ret <vscale x 8 x i16> %retval
	}			}

	define <vscale x 16 x i8> @insert_v16i8_nxv16i8(<vscale x 16 x i8> %vec, <16 x i8> %subvec) nounwind {			define <vscale x 16 x i8> @insert_v16i8_nxv16i8(<vscale x 16 x i8> %vec, <16 x i8> %subvec) nounwind {
	; CHECK-LABEL: insert_v16i8_nxv16i8:			; CHECK-LABEL: insert_v16i8_nxv16i8:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: str x29, [sp, #-16]! // 8-byte Folded Spill			; CHECK-NEXT: str x30, [sp, #-16]! // 8-byte Folded Spill
	; CHECK-NEXT: addvl sp, sp, #-1			; CHECK-NEXT: addvl sp, sp, #-1
	; CHECK-NEXT: rdvl x8, #1			; CHECK-NEXT: rdvl x8, #1
	; CHECK-NEXT: sub x8, x8, #1 // =1			; CHECK-NEXT: sub x8, x8, #1 // =1
	; CHECK-NEXT: cmp x8, #0 // =0			; CHECK-NEXT: cmp x8, #0 // =0
	; CHECK-NEXT: ptrue p0.b			; CHECK-NEXT: ptrue p0.b
	; CHECK-NEXT: csel x8, x8, xzr, lo			; CHECK-NEXT: csel x8, x8, xzr, lo
	; CHECK-NEXT: mov x9, sp			; CHECK-NEXT: mov x9, sp
	; CHECK-NEXT: st1b { z0.b }, p0, [sp]			; CHECK-NEXT: st1b { z0.b }, p0, [sp]
	; CHECK-NEXT: str q1, [x9, x8]			; CHECK-NEXT: str q1, [x9, x8]
	; CHECK-NEXT: ld1b { z0.b }, p0/z, [sp]			; CHECK-NEXT: ld1b { z0.b }, p0/z, [sp]
	; CHECK-NEXT: addvl sp, sp, #1			; CHECK-NEXT: addvl sp, sp, #1
	; CHECK-NEXT: ldr x29, [sp], #16 // 8-byte Folded Reload			; CHECK-NEXT: ldr x30, [sp], #16 // 8-byte Folded Reload
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%retval = call <vscale x 16 x i8> @llvm.experimental.vector.insert.nxv16i8.v16i8(<vscale x 16 x i8> %vec, <16 x i8> %subvec, i64 0)			%retval = call <vscale x 16 x i8> @llvm.experimental.vector.insert.nxv16i8.v16i8(<vscale x 16 x i8> %vec, <16 x i8> %subvec, i64 0)
	ret <vscale x 16 x i8> %retval			ret <vscale x 16 x i8> %retval
	}			}

	define <vscale x 16 x i8> @insert_v16i8_nxv16i8_idx1(<vscale x 16 x i8> %vec, <16 x i8> %subvec) nounwind {			define <vscale x 16 x i8> @insert_v16i8_nxv16i8_idx1(<vscale x 16 x i8> %vec, <16 x i8> %subvec) nounwind {
	; CHECK-LABEL: insert_v16i8_nxv16i8_idx1:			; CHECK-LABEL: insert_v16i8_nxv16i8_idx1:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: str x29, [sp, #-16]! // 8-byte Folded Spill			; CHECK-NEXT: str x30, [sp, #-16]! // 8-byte Folded Spill
	; CHECK-NEXT: addvl sp, sp, #-1			; CHECK-NEXT: addvl sp, sp, #-1
	; CHECK-NEXT: rdvl x8, #1			; CHECK-NEXT: rdvl x8, #1
	; CHECK-NEXT: sub x8, x8, #1 // =1			; CHECK-NEXT: sub x8, x8, #1 // =1
	; CHECK-NEXT: cmp x8, #1 // =1			; CHECK-NEXT: cmp x8, #1 // =1
	; CHECK-NEXT: ptrue p0.b			; CHECK-NEXT: ptrue p0.b
	; CHECK-NEXT: csinc x8, x8, xzr, lo			; CHECK-NEXT: csinc x8, x8, xzr, lo
	; CHECK-NEXT: mov x9, sp			; CHECK-NEXT: mov x9, sp
	; CHECK-NEXT: st1b { z0.b }, p0, [sp]			; CHECK-NEXT: st1b { z0.b }, p0, [sp]
	; CHECK-NEXT: str q1, [x9, x8]			; CHECK-NEXT: str q1, [x9, x8]
	; CHECK-NEXT: ld1b { z0.b }, p0/z, [sp]			; CHECK-NEXT: ld1b { z0.b }, p0/z, [sp]
	; CHECK-NEXT: addvl sp, sp, #1			; CHECK-NEXT: addvl sp, sp, #1
	; CHECK-NEXT: ldr x29, [sp], #16 // 8-byte Folded Reload			; CHECK-NEXT: ldr x30, [sp], #16 // 8-byte Folded Reload
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%retval = call <vscale x 16 x i8> @llvm.experimental.vector.insert.nxv16i8.v16i8(<vscale x 16 x i8> %vec, <16 x i8> %subvec, i64 1)			%retval = call <vscale x 16 x i8> @llvm.experimental.vector.insert.nxv16i8.v16i8(<vscale x 16 x i8> %vec, <16 x i8> %subvec, i64 1)
	ret <vscale x 16 x i8> %retval			ret <vscale x 16 x i8> %retval
	}			}

	declare <vscale x 2 x i64> @llvm.experimental.vector.insert.nxv2i64.v2i64(<vscale x 2 x i64>, <2 x i64>, i64)			declare <vscale x 2 x i64> @llvm.experimental.vector.insert.nxv2i64.v2i64(<vscale x 2 x i64>, <2 x i64>, i64)
	declare <vscale x 4 x i32> @llvm.experimental.vector.insert.nxv4i32.v4i32(<vscale x 4 x i32>, <4 x i32>, i64)			declare <vscale x 4 x i32> @llvm.experimental.vector.insert.nxv4i32.v4i32(<vscale x 4 x i32>, <4 x i32>, i64)
	declare <vscale x 8 x i16> @llvm.experimental.vector.insert.nxv8i16.v8i16(<vscale x 8 x i16>, <8 x i16>, i64)			declare <vscale x 8 x i16> @llvm.experimental.vector.insert.nxv8i16.v8i16(<vscale x 8 x i16>, <8 x i16>, i64)
	declare <vscale x 16 x i8> @llvm.experimental.vector.insert.nxv16i8.v16i8(<vscale x 16 x i8>, <16 x i8>, i64)			declare <vscale x 16 x i8> @llvm.experimental.vector.insert.nxv16i8.v16i8(<vscale x 16 x i8>, <16 x i8>, i64)

llvm/test/CodeGen/AArch64/sve-pred-arith.ll

	Show First 20 Lines • Show All 47 Lines • ▼ Show 20 Lines
	}			}


	; ILLEGAL ADDS			; ILLEGAL ADDS

	define aarch64_sve_vector_pcs <vscale x 64 x i1> @add_nxv64i1(<vscale x 64 x i1> %a, <vscale x 64 x i1> %b) {			define aarch64_sve_vector_pcs <vscale x 64 x i1> @add_nxv64i1(<vscale x 64 x i1> %a, <vscale x 64 x i1> %b) {
	; CHECK-LABEL: add_nxv64i1:			; CHECK-LABEL: add_nxv64i1:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: str x29, [sp, #-16]! // 8-byte Folded Spill			; CHECK-NEXT: str x30, [sp, #-16]! // 8-byte Folded Spill
	; CHECK-NEXT: addvl sp, sp, #-1			; CHECK-NEXT: addvl sp, sp, #-1
	; CHECK-NEXT: str p8, [sp, #3, mul vl] // 2-byte Folded Spill			; CHECK-NEXT: str p8, [sp, #3, mul vl] // 2-byte Folded Spill
	; CHECK-NEXT: str p7, [sp, #4, mul vl] // 2-byte Folded Spill			; CHECK-NEXT: str p7, [sp, #4, mul vl] // 2-byte Folded Spill
	; CHECK-NEXT: str p6, [sp, #5, mul vl] // 2-byte Folded Spill			; CHECK-NEXT: str p6, [sp, #5, mul vl] // 2-byte Folded Spill
	; CHECK-NEXT: str p5, [sp, #6, mul vl] // 2-byte Folded Spill			; CHECK-NEXT: str p5, [sp, #6, mul vl] // 2-byte Folded Spill
	; CHECK-NEXT: str p4, [sp, #7, mul vl] // 2-byte Folded Spill			; CHECK-NEXT: str p4, [sp, #7, mul vl] // 2-byte Folded Spill
	; CHECK-NEXT: .cfi_escape 0x0f, 0x0c, 0x8f, 0x00, 0x11, 0x10, 0x22, 0x11, 0x08, 0x92, 0x2e, 0x00, 0x1e, 0x22 // sp + 16 + 8 * VG			; CHECK-NEXT: .cfi_escape 0x0f, 0x0c, 0x8f, 0x00, 0x11, 0x10, 0x22, 0x11, 0x08, 0x92, 0x2e, 0x00, 0x1e, 0x22 // sp + 16 + 8 * VG
	; CHECK-NEXT: .cfi_offset w29, -16			; CHECK-NEXT: .cfi_offset w30, -16
	; CHECK-NEXT: ldr p4, [x3]			; CHECK-NEXT: ldr p4, [x3]
	; CHECK-NEXT: ldr p5, [x0]			; CHECK-NEXT: ldr p5, [x0]
	; CHECK-NEXT: ldr p6, [x1]			; CHECK-NEXT: ldr p6, [x1]
	; CHECK-NEXT: ldr p7, [x2]			; CHECK-NEXT: ldr p7, [x2]
	; CHECK-NEXT: ptrue p8.b			; CHECK-NEXT: ptrue p8.b
	; CHECK-NEXT: eor p0.b, p8/z, p0.b, p5.b			; CHECK-NEXT: eor p0.b, p8/z, p0.b, p5.b
	; CHECK-NEXT: eor p1.b, p8/z, p1.b, p6.b			; CHECK-NEXT: eor p1.b, p8/z, p1.b, p6.b
	; CHECK-NEXT: eor p2.b, p8/z, p2.b, p7.b			; CHECK-NEXT: eor p2.b, p8/z, p2.b, p7.b
	; CHECK-NEXT: eor p3.b, p8/z, p3.b, p4.b			; CHECK-NEXT: eor p3.b, p8/z, p3.b, p4.b
	; CHECK-NEXT: ldr p8, [sp, #3, mul vl] // 2-byte Folded Reload			; CHECK-NEXT: ldr p8, [sp, #3, mul vl] // 2-byte Folded Reload
	; CHECK-NEXT: ldr p7, [sp, #4, mul vl] // 2-byte Folded Reload			; CHECK-NEXT: ldr p7, [sp, #4, mul vl] // 2-byte Folded Reload
	; CHECK-NEXT: ldr p6, [sp, #5, mul vl] // 2-byte Folded Reload			; CHECK-NEXT: ldr p6, [sp, #5, mul vl] // 2-byte Folded Reload
	; CHECK-NEXT: ldr p5, [sp, #6, mul vl] // 2-byte Folded Reload			; CHECK-NEXT: ldr p5, [sp, #6, mul vl] // 2-byte Folded Reload
	; CHECK-NEXT: ldr p4, [sp, #7, mul vl] // 2-byte Folded Reload			; CHECK-NEXT: ldr p4, [sp, #7, mul vl] // 2-byte Folded Reload
	; CHECK-NEXT: addvl sp, sp, #1			; CHECK-NEXT: addvl sp, sp, #1
	; CHECK-NEXT: ldr x29, [sp], #16 // 8-byte Folded Reload			; CHECK-NEXT: ldr x30, [sp], #16 // 8-byte Folded Reload
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%res = add <vscale x 64 x i1> %a, %b			%res = add <vscale x 64 x i1> %a, %b
	ret <vscale x 64 x i1> %res;			ret <vscale x 64 x i1> %res;
	}			}


	; LEGAL SUBS			; LEGAL SUBS

	Show All 39 Lines


	; ILLEGAL SUBGS			; ILLEGAL SUBGS


	define aarch64_sve_vector_pcs <vscale x 64 x i1> @sub_nxv64i1(<vscale x 64 x i1> %a, <vscale x 64 x i1> %b) {			define aarch64_sve_vector_pcs <vscale x 64 x i1> @sub_nxv64i1(<vscale x 64 x i1> %a, <vscale x 64 x i1> %b) {
	; CHECK-LABEL: sub_nxv64i1:			; CHECK-LABEL: sub_nxv64i1:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: str x29, [sp, #-16]! // 8-byte Folded Spill			; CHECK-NEXT: str x30, [sp, #-16]! // 8-byte Folded Spill
	; CHECK-NEXT: addvl sp, sp, #-1			; CHECK-NEXT: addvl sp, sp, #-1
	; CHECK-NEXT: str p8, [sp, #3, mul vl] // 2-byte Folded Spill			; CHECK-NEXT: str p8, [sp, #3, mul vl] // 2-byte Folded Spill
	; CHECK-NEXT: str p7, [sp, #4, mul vl] // 2-byte Folded Spill			; CHECK-NEXT: str p7, [sp, #4, mul vl] // 2-byte Folded Spill
	; CHECK-NEXT: str p6, [sp, #5, mul vl] // 2-byte Folded Spill			; CHECK-NEXT: str p6, [sp, #5, mul vl] // 2-byte Folded Spill
	; CHECK-NEXT: str p5, [sp, #6, mul vl] // 2-byte Folded Spill			; CHECK-NEXT: str p5, [sp, #6, mul vl] // 2-byte Folded Spill
	; CHECK-NEXT: str p4, [sp, #7, mul vl] // 2-byte Folded Spill			; CHECK-NEXT: str p4, [sp, #7, mul vl] // 2-byte Folded Spill
	; CHECK-NEXT: .cfi_escape 0x0f, 0x0c, 0x8f, 0x00, 0x11, 0x10, 0x22, 0x11, 0x08, 0x92, 0x2e, 0x00, 0x1e, 0x22 // sp + 16 + 8 * VG			; CHECK-NEXT: .cfi_escape 0x0f, 0x0c, 0x8f, 0x00, 0x11, 0x10, 0x22, 0x11, 0x08, 0x92, 0x2e, 0x00, 0x1e, 0x22 // sp + 16 + 8 * VG
	; CHECK-NEXT: .cfi_offset w29, -16			; CHECK-NEXT: .cfi_offset w30, -16
	; CHECK-NEXT: ldr p4, [x3]			; CHECK-NEXT: ldr p4, [x3]
	; CHECK-NEXT: ldr p5, [x0]			; CHECK-NEXT: ldr p5, [x0]
	; CHECK-NEXT: ldr p6, [x1]			; CHECK-NEXT: ldr p6, [x1]
	; CHECK-NEXT: ldr p7, [x2]			; CHECK-NEXT: ldr p7, [x2]
	; CHECK-NEXT: ptrue p8.b			; CHECK-NEXT: ptrue p8.b
	; CHECK-NEXT: eor p0.b, p8/z, p0.b, p5.b			; CHECK-NEXT: eor p0.b, p8/z, p0.b, p5.b
	; CHECK-NEXT: eor p1.b, p8/z, p1.b, p6.b			; CHECK-NEXT: eor p1.b, p8/z, p1.b, p6.b
	; CHECK-NEXT: eor p2.b, p8/z, p2.b, p7.b			; CHECK-NEXT: eor p2.b, p8/z, p2.b, p7.b
	; CHECK-NEXT: eor p3.b, p8/z, p3.b, p4.b			; CHECK-NEXT: eor p3.b, p8/z, p3.b, p4.b
	; CHECK-NEXT: ldr p8, [sp, #3, mul vl] // 2-byte Folded Reload			; CHECK-NEXT: ldr p8, [sp, #3, mul vl] // 2-byte Folded Reload
	; CHECK-NEXT: ldr p7, [sp, #4, mul vl] // 2-byte Folded Reload			; CHECK-NEXT: ldr p7, [sp, #4, mul vl] // 2-byte Folded Reload
	; CHECK-NEXT: ldr p6, [sp, #5, mul vl] // 2-byte Folded Reload			; CHECK-NEXT: ldr p6, [sp, #5, mul vl] // 2-byte Folded Reload
	; CHECK-NEXT: ldr p5, [sp, #6, mul vl] // 2-byte Folded Reload			; CHECK-NEXT: ldr p5, [sp, #6, mul vl] // 2-byte Folded Reload
	; CHECK-NEXT: ldr p4, [sp, #7, mul vl] // 2-byte Folded Reload			; CHECK-NEXT: ldr p4, [sp, #7, mul vl] // 2-byte Folded Reload
	; CHECK-NEXT: addvl sp, sp, #1			; CHECK-NEXT: addvl sp, sp, #1
	; CHECK-NEXT: ldr x29, [sp], #16 // 8-byte Folded Reload			; CHECK-NEXT: ldr x30, [sp], #16 // 8-byte Folded Reload
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%res = sub <vscale x 64 x i1> %a, %b			%res = sub <vscale x 64 x i1> %a, %b
	ret <vscale x 64 x i1> %res;			ret <vscale x 64 x i1> %res;
	}			}

llvm/test/CodeGen/AArch64/sve-split-extract-elt.ll

	Show All 17 Lines
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%ext = extractelement <vscale x 2 x i32> %a, i32 %idx			%ext = extractelement <vscale x 2 x i32> %a, i32 %idx
	ret i32 %ext			ret i32 %ext
	}			}

	define i8 @split_extract_32i8_idx(<vscale x 32 x i8> %a, i32 %idx) {			define i8 @split_extract_32i8_idx(<vscale x 32 x i8> %a, i32 %idx) {
	; CHECK-LABEL: split_extract_32i8_idx:			; CHECK-LABEL: split_extract_32i8_idx:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: str x29, [sp, #-16]! // 8-byte Folded Spill			; CHECK-NEXT: str x30, [sp, #-16]! // 8-byte Folded Spill
	; CHECK-NEXT: addvl sp, sp, #-2			; CHECK-NEXT: addvl sp, sp, #-2
	; CHECK-NEXT: .cfi_escape 0x0f, 0x0c, 0x8f, 0x00, 0x11, 0x10, 0x22, 0x11, 0x10, 0x92, 0x2e, 0x00, 0x1e, 0x22 // sp + 16 + 16 * VG			; CHECK-NEXT: .cfi_escape 0x0f, 0x0c, 0x8f, 0x00, 0x11, 0x10, 0x22, 0x11, 0x10, 0x92, 0x2e, 0x00, 0x1e, 0x22 // sp + 16 + 16 * VG
	; CHECK-NEXT: .cfi_offset w29, -16			; CHECK-NEXT: .cfi_offset w30, -16
	; CHECK-NEXT: rdvl x10, #2			; CHECK-NEXT: rdvl x10, #2
	; CHECK-NEXT: // kill: def $w0 killed $w0 def $x0			; CHECK-NEXT: // kill: def $w0 killed $w0 def $x0
	; CHECK-NEXT: sxtw x9, w0			; CHECK-NEXT: sxtw x9, w0
	; CHECK-NEXT: sub x10, x10, #1 // =1			; CHECK-NEXT: sub x10, x10, #1 // =1
	; CHECK-NEXT: ptrue p0.b			; CHECK-NEXT: ptrue p0.b
	; CHECK-NEXT: mov x8, sp			; CHECK-NEXT: mov x8, sp
	; CHECK-NEXT: cmp x9, x10			; CHECK-NEXT: cmp x9, x10
	; CHECK-NEXT: st1b { z1.b }, p0, [x8, #1, mul vl]			; CHECK-NEXT: st1b { z1.b }, p0, [x8, #1, mul vl]
	; CHECK-NEXT: st1b { z0.b }, p0, [sp]			; CHECK-NEXT: st1b { z0.b }, p0, [sp]
	; CHECK-NEXT: csel x9, x9, x10, lo			; CHECK-NEXT: csel x9, x9, x10, lo
	; CHECK-NEXT: ldrb w0, [x8, x9]			; CHECK-NEXT: ldrb w0, [x8, x9]
	; CHECK-NEXT: addvl sp, sp, #2			; CHECK-NEXT: addvl sp, sp, #2
	; CHECK-NEXT: ldr x29, [sp], #16 // 8-byte Folded Reload			; CHECK-NEXT: ldr x30, [sp], #16 // 8-byte Folded Reload
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%ext = extractelement <vscale x 32 x i8> %a, i32 %idx			%ext = extractelement <vscale x 32 x i8> %a, i32 %idx
	ret i8 %ext			ret i8 %ext
	}			}

	define i16 @split_extract_16i16_idx(<vscale x 16 x i16> %a, i32 %idx) {			define i16 @split_extract_16i16_idx(<vscale x 16 x i16> %a, i32 %idx) {
	; CHECK-LABEL: split_extract_16i16_idx:			; CHECK-LABEL: split_extract_16i16_idx:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: str x29, [sp, #-16]! // 8-byte Folded Spill			; CHECK-NEXT: str x30, [sp, #-16]! // 8-byte Folded Spill
	; CHECK-NEXT: addvl sp, sp, #-2			; CHECK-NEXT: addvl sp, sp, #-2
	; CHECK-NEXT: .cfi_escape 0x0f, 0x0c, 0x8f, 0x00, 0x11, 0x10, 0x22, 0x11, 0x10, 0x92, 0x2e, 0x00, 0x1e, 0x22 // sp + 16 + 16 * VG			; CHECK-NEXT: .cfi_escape 0x0f, 0x0c, 0x8f, 0x00, 0x11, 0x10, 0x22, 0x11, 0x10, 0x92, 0x2e, 0x00, 0x1e, 0x22 // sp + 16 + 16 * VG
	; CHECK-NEXT: .cfi_offset w29, -16			; CHECK-NEXT: .cfi_offset w30, -16
	; CHECK-NEXT: rdvl x10, #1			; CHECK-NEXT: rdvl x10, #1
	; CHECK-NEXT: // kill: def $w0 killed $w0 def $x0			; CHECK-NEXT: // kill: def $w0 killed $w0 def $x0
	; CHECK-NEXT: sxtw x9, w0			; CHECK-NEXT: sxtw x9, w0
	; CHECK-NEXT: sub x10, x10, #1 // =1			; CHECK-NEXT: sub x10, x10, #1 // =1
	; CHECK-NEXT: ptrue p0.h			; CHECK-NEXT: ptrue p0.h
	; CHECK-NEXT: mov x8, sp			; CHECK-NEXT: mov x8, sp
	; CHECK-NEXT: cmp x9, x10			; CHECK-NEXT: cmp x9, x10
	; CHECK-NEXT: st1h { z1.h }, p0, [x8, #1, mul vl]			; CHECK-NEXT: st1h { z1.h }, p0, [x8, #1, mul vl]
	; CHECK-NEXT: st1h { z0.h }, p0, [sp]			; CHECK-NEXT: st1h { z0.h }, p0, [sp]
	; CHECK-NEXT: csel x9, x9, x10, lo			; CHECK-NEXT: csel x9, x9, x10, lo
	; CHECK-NEXT: ldrh w0, [x8, x9, lsl #1]			; CHECK-NEXT: ldrh w0, [x8, x9, lsl #1]
	; CHECK-NEXT: addvl sp, sp, #2			; CHECK-NEXT: addvl sp, sp, #2
	; CHECK-NEXT: ldr x29, [sp], #16 // 8-byte Folded Reload			; CHECK-NEXT: ldr x30, [sp], #16 // 8-byte Folded Reload
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%ext = extractelement <vscale x 16 x i16> %a, i32 %idx			%ext = extractelement <vscale x 16 x i16> %a, i32 %idx
	ret i16 %ext			ret i16 %ext
	}			}

	define i32 @split_extract_8i32_idx(<vscale x 8 x i32> %a, i32 %idx) {			define i32 @split_extract_8i32_idx(<vscale x 8 x i32> %a, i32 %idx) {
	; CHECK-LABEL: split_extract_8i32_idx:			; CHECK-LABEL: split_extract_8i32_idx:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: str x29, [sp, #-16]! // 8-byte Folded Spill			; CHECK-NEXT: str x30, [sp, #-16]! // 8-byte Folded Spill
	; CHECK-NEXT: addvl sp, sp, #-2			; CHECK-NEXT: addvl sp, sp, #-2
	; CHECK-NEXT: .cfi_escape 0x0f, 0x0c, 0x8f, 0x00, 0x11, 0x10, 0x22, 0x11, 0x10, 0x92, 0x2e, 0x00, 0x1e, 0x22 // sp + 16 + 16 * VG			; CHECK-NEXT: .cfi_escape 0x0f, 0x0c, 0x8f, 0x00, 0x11, 0x10, 0x22, 0x11, 0x10, 0x92, 0x2e, 0x00, 0x1e, 0x22 // sp + 16 + 16 * VG
	; CHECK-NEXT: .cfi_offset w29, -16			; CHECK-NEXT: .cfi_offset w30, -16
	; CHECK-NEXT: cnth x10			; CHECK-NEXT: cnth x10
	; CHECK-NEXT: // kill: def $w0 killed $w0 def $x0			; CHECK-NEXT: // kill: def $w0 killed $w0 def $x0
	; CHECK-NEXT: sxtw x9, w0			; CHECK-NEXT: sxtw x9, w0
	; CHECK-NEXT: sub x10, x10, #1 // =1			; CHECK-NEXT: sub x10, x10, #1 // =1
	; CHECK-NEXT: ptrue p0.s			; CHECK-NEXT: ptrue p0.s
	; CHECK-NEXT: mov x8, sp			; CHECK-NEXT: mov x8, sp
	; CHECK-NEXT: cmp x9, x10			; CHECK-NEXT: cmp x9, x10
	; CHECK-NEXT: st1w { z1.s }, p0, [x8, #1, mul vl]			; CHECK-NEXT: st1w { z1.s }, p0, [x8, #1, mul vl]
	; CHECK-NEXT: st1w { z0.s }, p0, [sp]			; CHECK-NEXT: st1w { z0.s }, p0, [sp]
	; CHECK-NEXT: csel x9, x9, x10, lo			; CHECK-NEXT: csel x9, x9, x10, lo
	; CHECK-NEXT: ldr w0, [x8, x9, lsl #2]			; CHECK-NEXT: ldr w0, [x8, x9, lsl #2]
	; CHECK-NEXT: addvl sp, sp, #2			; CHECK-NEXT: addvl sp, sp, #2
	; CHECK-NEXT: ldr x29, [sp], #16 // 8-byte Folded Reload			; CHECK-NEXT: ldr x30, [sp], #16 // 8-byte Folded Reload
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%ext = extractelement <vscale x 8 x i32> %a, i32 %idx			%ext = extractelement <vscale x 8 x i32> %a, i32 %idx
	ret i32 %ext			ret i32 %ext
	}			}

	define i64 @split_extract_8i64_idx(<vscale x 8 x i64> %a, i32 %idx) {			define i64 @split_extract_8i64_idx(<vscale x 8 x i64> %a, i32 %idx) {
	; CHECK-LABEL: split_extract_8i64_idx:			; CHECK-LABEL: split_extract_8i64_idx:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: str x29, [sp, #-16]! // 8-byte Folded Spill			; CHECK-NEXT: str x30, [sp, #-16]! // 8-byte Folded Spill
	; CHECK-NEXT: addvl sp, sp, #-4			; CHECK-NEXT: addvl sp, sp, #-4
	; CHECK-NEXT: .cfi_escape 0x0f, 0x0c, 0x8f, 0x00, 0x11, 0x10, 0x22, 0x11, 0x20, 0x92, 0x2e, 0x00, 0x1e, 0x22 // sp + 16 + 32 * VG			; CHECK-NEXT: .cfi_escape 0x0f, 0x0c, 0x8f, 0x00, 0x11, 0x10, 0x22, 0x11, 0x20, 0x92, 0x2e, 0x00, 0x1e, 0x22 // sp + 16 + 32 * VG
	; CHECK-NEXT: .cfi_offset w29, -16			; CHECK-NEXT: .cfi_offset w30, -16
	; CHECK-NEXT: cnth x10			; CHECK-NEXT: cnth x10
	; CHECK-NEXT: // kill: def $w0 killed $w0 def $x0			; CHECK-NEXT: // kill: def $w0 killed $w0 def $x0
	; CHECK-NEXT: sxtw x9, w0			; CHECK-NEXT: sxtw x9, w0
	; CHECK-NEXT: sub x10, x10, #1 // =1			; CHECK-NEXT: sub x10, x10, #1 // =1
	; CHECK-NEXT: ptrue p0.d			; CHECK-NEXT: ptrue p0.d
	; CHECK-NEXT: mov x8, sp			; CHECK-NEXT: mov x8, sp
	; CHECK-NEXT: cmp x9, x10			; CHECK-NEXT: cmp x9, x10
	; CHECK-NEXT: st1d { z3.d }, p0, [x8, #3, mul vl]			; CHECK-NEXT: st1d { z3.d }, p0, [x8, #3, mul vl]
	; CHECK-NEXT: st1d { z2.d }, p0, [x8, #2, mul vl]			; CHECK-NEXT: st1d { z2.d }, p0, [x8, #2, mul vl]
	; CHECK-NEXT: st1d { z1.d }, p0, [x8, #1, mul vl]			; CHECK-NEXT: st1d { z1.d }, p0, [x8, #1, mul vl]
	; CHECK-NEXT: st1d { z0.d }, p0, [sp]			; CHECK-NEXT: st1d { z0.d }, p0, [sp]
	; CHECK-NEXT: csel x9, x9, x10, lo			; CHECK-NEXT: csel x9, x9, x10, lo
	; CHECK-NEXT: ldr x0, [x8, x9, lsl #3]			; CHECK-NEXT: ldr x0, [x8, x9, lsl #3]
	; CHECK-NEXT: addvl sp, sp, #4			; CHECK-NEXT: addvl sp, sp, #4
	; CHECK-NEXT: ldr x29, [sp], #16 // 8-byte Folded Reload			; CHECK-NEXT: ldr x30, [sp], #16 // 8-byte Folded Reload
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%ext = extractelement <vscale x 8 x i64> %a, i32 %idx			%ext = extractelement <vscale x 8 x i64> %a, i32 %idx
	ret i64 %ext			ret i64 %ext
	}			}

	; EXTRACT VECTOR ELT, CONSTANT IDX			; EXTRACT VECTOR ELT, CONSTANT IDX

	define i16 @promote_extract_4i16(<vscale x 4 x i16> %a) {			define i16 @promote_extract_4i16(<vscale x 4 x i16> %a) {
	Show All 12 Lines
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%ext = extractelement <vscale x 32 x i8> %a, i32 3			%ext = extractelement <vscale x 32 x i8> %a, i32 3
	ret i8 %ext			ret i8 %ext
	}			}

	define i16 @split_extract_16i16(<vscale x 16 x i16> %a) {			define i16 @split_extract_16i16(<vscale x 16 x i16> %a) {
	; CHECK-LABEL: split_extract_16i16:			; CHECK-LABEL: split_extract_16i16:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: str x29, [sp, #-16]! // 8-byte Folded Spill			; CHECK-NEXT: str x30, [sp, #-16]! // 8-byte Folded Spill
	; CHECK-NEXT: addvl sp, sp, #-2			; CHECK-NEXT: addvl sp, sp, #-2
	; CHECK-NEXT: .cfi_escape 0x0f, 0x0c, 0x8f, 0x00, 0x11, 0x10, 0x22, 0x11, 0x10, 0x92, 0x2e, 0x00, 0x1e, 0x22 // sp + 16 + 16 * VG			; CHECK-NEXT: .cfi_escape 0x0f, 0x0c, 0x8f, 0x00, 0x11, 0x10, 0x22, 0x11, 0x10, 0x92, 0x2e, 0x00, 0x1e, 0x22 // sp + 16 + 16 * VG
	; CHECK-NEXT: .cfi_offset w29, -16			; CHECK-NEXT: .cfi_offset w30, -16
	; CHECK-NEXT: rdvl x10, #1			; CHECK-NEXT: rdvl x10, #1
	; CHECK-NEXT: sub x10, x10, #1 // =1			; CHECK-NEXT: sub x10, x10, #1 // =1
	; CHECK-NEXT: ptrue p0.h			; CHECK-NEXT: ptrue p0.h
	; CHECK-NEXT: mov x8, sp			; CHECK-NEXT: mov x8, sp
	; CHECK-NEXT: mov w9, #128			; CHECK-NEXT: mov w9, #128
	; CHECK-NEXT: cmp x10, #128 // =128			; CHECK-NEXT: cmp x10, #128 // =128
	; CHECK-NEXT: st1h { z1.h }, p0, [x8, #1, mul vl]			; CHECK-NEXT: st1h { z1.h }, p0, [x8, #1, mul vl]
	; CHECK-NEXT: st1h { z0.h }, p0, [sp]			; CHECK-NEXT: st1h { z0.h }, p0, [sp]
	; CHECK-NEXT: csel x9, x10, x9, lo			; CHECK-NEXT: csel x9, x10, x9, lo
	; CHECK-NEXT: ldrh w0, [x8, x9, lsl #1]			; CHECK-NEXT: ldrh w0, [x8, x9, lsl #1]
	; CHECK-NEXT: addvl sp, sp, #2			; CHECK-NEXT: addvl sp, sp, #2
	; CHECK-NEXT: ldr x29, [sp], #16 // 8-byte Folded Reload			; CHECK-NEXT: ldr x30, [sp], #16 // 8-byte Folded Reload
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%ext = extractelement <vscale x 16 x i16> %a, i32 128			%ext = extractelement <vscale x 16 x i16> %a, i32 128
	ret i16 %ext			ret i16 %ext
	}			}

	define i32 @split_extract_16i32(<vscale x 16 x i32> %a) {			define i32 @split_extract_16i32(<vscale x 16 x i32> %a) {
	; CHECK-LABEL: split_extract_16i32:			; CHECK-LABEL: split_extract_16i32:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: str x29, [sp, #-16]! // 8-byte Folded Spill			; CHECK-NEXT: str x30, [sp, #-16]! // 8-byte Folded Spill
	; CHECK-NEXT: addvl sp, sp, #-4			; CHECK-NEXT: addvl sp, sp, #-4
	; CHECK-NEXT: .cfi_escape 0x0f, 0x0c, 0x8f, 0x00, 0x11, 0x10, 0x22, 0x11, 0x20, 0x92, 0x2e, 0x00, 0x1e, 0x22 // sp + 16 + 32 * VG			; CHECK-NEXT: .cfi_escape 0x0f, 0x0c, 0x8f, 0x00, 0x11, 0x10, 0x22, 0x11, 0x20, 0x92, 0x2e, 0x00, 0x1e, 0x22 // sp + 16 + 32 * VG
	; CHECK-NEXT: .cfi_offset w29, -16			; CHECK-NEXT: .cfi_offset w30, -16
	; CHECK-NEXT: mov w9, #34464			; CHECK-NEXT: mov w9, #34464
	; CHECK-NEXT: rdvl x10, #1			; CHECK-NEXT: rdvl x10, #1
	; CHECK-NEXT: movk w9, #1, lsl #16			; CHECK-NEXT: movk w9, #1, lsl #16
	; CHECK-NEXT: sub x10, x10, #1 // =1			; CHECK-NEXT: sub x10, x10, #1 // =1
	; CHECK-NEXT: ptrue p0.s			; CHECK-NEXT: ptrue p0.s
	; CHECK-NEXT: mov x8, sp			; CHECK-NEXT: mov x8, sp
	; CHECK-NEXT: cmp x10, x9			; CHECK-NEXT: cmp x10, x9
	; CHECK-NEXT: st1w { z3.s }, p0, [x8, #3, mul vl]			; CHECK-NEXT: st1w { z3.s }, p0, [x8, #3, mul vl]
	; CHECK-NEXT: st1w { z2.s }, p0, [x8, #2, mul vl]			; CHECK-NEXT: st1w { z2.s }, p0, [x8, #2, mul vl]
	; CHECK-NEXT: st1w { z1.s }, p0, [x8, #1, mul vl]			; CHECK-NEXT: st1w { z1.s }, p0, [x8, #1, mul vl]
	; CHECK-NEXT: st1w { z0.s }, p0, [sp]			; CHECK-NEXT: st1w { z0.s }, p0, [sp]
	; CHECK-NEXT: csel x9, x10, x9, lo			; CHECK-NEXT: csel x9, x10, x9, lo
	; CHECK-NEXT: ldr w0, [x8, x9, lsl #2]			; CHECK-NEXT: ldr w0, [x8, x9, lsl #2]
	; CHECK-NEXT: addvl sp, sp, #4			; CHECK-NEXT: addvl sp, sp, #4
	; CHECK-NEXT: ldr x29, [sp], #16 // 8-byte Folded Reload			; CHECK-NEXT: ldr x30, [sp], #16 // 8-byte Folded Reload
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%ext = extractelement <vscale x 16 x i32> %a, i32 100000			%ext = extractelement <vscale x 16 x i32> %a, i32 100000
	ret i32 %ext			ret i32 %ext
	}			}

	define i64 @split_extract_4i64(<vscale x 4 x i64> %a) {			define i64 @split_extract_4i64(<vscale x 4 x i64> %a) {
	; CHECK-LABEL: split_extract_4i64:			; CHECK-LABEL: split_extract_4i64:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: str x29, [sp, #-16]! // 8-byte Folded Spill			; CHECK-NEXT: str x30, [sp, #-16]! // 8-byte Folded Spill
	; CHECK-NEXT: addvl sp, sp, #-2			; CHECK-NEXT: addvl sp, sp, #-2
	; CHECK-NEXT: .cfi_escape 0x0f, 0x0c, 0x8f, 0x00, 0x11, 0x10, 0x22, 0x11, 0x10, 0x92, 0x2e, 0x00, 0x1e, 0x22 // sp + 16 + 16 * VG			; CHECK-NEXT: .cfi_escape 0x0f, 0x0c, 0x8f, 0x00, 0x11, 0x10, 0x22, 0x11, 0x10, 0x92, 0x2e, 0x00, 0x1e, 0x22 // sp + 16 + 16 * VG
	; CHECK-NEXT: .cfi_offset w29, -16			; CHECK-NEXT: .cfi_offset w30, -16
	; CHECK-NEXT: cntw x10			; CHECK-NEXT: cntw x10
	; CHECK-NEXT: sub x10, x10, #1 // =1			; CHECK-NEXT: sub x10, x10, #1 // =1
	; CHECK-NEXT: ptrue p0.d			; CHECK-NEXT: ptrue p0.d
	; CHECK-NEXT: mov x8, sp			; CHECK-NEXT: mov x8, sp
	; CHECK-NEXT: mov w9, #10			; CHECK-NEXT: mov w9, #10
	; CHECK-NEXT: cmp x10, #10 // =10			; CHECK-NEXT: cmp x10, #10 // =10
	; CHECK-NEXT: st1d { z1.d }, p0, [x8, #1, mul vl]			; CHECK-NEXT: st1d { z1.d }, p0, [x8, #1, mul vl]
	; CHECK-NEXT: st1d { z0.d }, p0, [sp]			; CHECK-NEXT: st1d { z0.d }, p0, [sp]
	; CHECK-NEXT: csel x9, x10, x9, lo			; CHECK-NEXT: csel x9, x10, x9, lo
	; CHECK-NEXT: ldr x0, [x8, x9, lsl #3]			; CHECK-NEXT: ldr x0, [x8, x9, lsl #3]
	; CHECK-NEXT: addvl sp, sp, #2			; CHECK-NEXT: addvl sp, sp, #2
	; CHECK-NEXT: ldr x29, [sp], #16 // 8-byte Folded Reload			; CHECK-NEXT: ldr x30, [sp], #16 // 8-byte Folded Reload
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%ext = extractelement <vscale x 4 x i64> %a, i32 10			%ext = extractelement <vscale x 4 x i64> %a, i32 10
	ret i64 %ext			ret i64 %ext
	}			}

llvm/test/CodeGen/AArch64/sve-split-insert-elt.ll

	Show All 17 Lines
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%ins = insertelement <vscale x 8 x i8> %a, i8 %elt, i64 %idx			%ins = insertelement <vscale x 8 x i8> %a, i8 %elt, i64 %idx
	ret <vscale x 8 x i8> %ins			ret <vscale x 8 x i8> %ins
	}			}

	define <vscale x 32 x i8> @split_insert_32i8_idx(<vscale x 32 x i8> %a, i8 %elt, i64 %idx) {			define <vscale x 32 x i8> @split_insert_32i8_idx(<vscale x 32 x i8> %a, i8 %elt, i64 %idx) {
	; CHECK-LABEL: split_insert_32i8_idx:			; CHECK-LABEL: split_insert_32i8_idx:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: str x29, [sp, #-16]! // 8-byte Folded Spill			; CHECK-NEXT: str x30, [sp, #-16]! // 8-byte Folded Spill
	; CHECK-NEXT: addvl sp, sp, #-2			; CHECK-NEXT: addvl sp, sp, #-2
	; CHECK-NEXT: .cfi_escape 0x0f, 0x0c, 0x8f, 0x00, 0x11, 0x10, 0x22, 0x11, 0x10, 0x92, 0x2e, 0x00, 0x1e, 0x22 // sp + 16 + 16 * VG			; CHECK-NEXT: .cfi_escape 0x0f, 0x0c, 0x8f, 0x00, 0x11, 0x10, 0x22, 0x11, 0x10, 0x92, 0x2e, 0x00, 0x1e, 0x22 // sp + 16 + 16 * VG
	; CHECK-NEXT: .cfi_offset w29, -16			; CHECK-NEXT: .cfi_offset w30, -16
	; CHECK-NEXT: rdvl x8, #2			; CHECK-NEXT: rdvl x8, #2
	; CHECK-NEXT: sub x8, x8, #1 // =1			; CHECK-NEXT: sub x8, x8, #1 // =1
	; CHECK-NEXT: cmp x1, x8			; CHECK-NEXT: cmp x1, x8
	; CHECK-NEXT: ptrue p0.b			; CHECK-NEXT: ptrue p0.b
	; CHECK-NEXT: csel x8, x1, x8, lo			; CHECK-NEXT: csel x8, x1, x8, lo
	; CHECK-NEXT: mov x9, sp			; CHECK-NEXT: mov x9, sp
	; CHECK-NEXT: st1b { z1.b }, p0, [x9, #1, mul vl]			; CHECK-NEXT: st1b { z1.b }, p0, [x9, #1, mul vl]
	; CHECK-NEXT: st1b { z0.b }, p0, [sp]			; CHECK-NEXT: st1b { z0.b }, p0, [sp]
	; CHECK-NEXT: strb w0, [x9, x8]			; CHECK-NEXT: strb w0, [x9, x8]
	; CHECK-NEXT: ld1b { z1.b }, p0/z, [x9, #1, mul vl]			; CHECK-NEXT: ld1b { z1.b }, p0/z, [x9, #1, mul vl]
	; CHECK-NEXT: ld1b { z0.b }, p0/z, [sp]			; CHECK-NEXT: ld1b { z0.b }, p0/z, [sp]
	; CHECK-NEXT: addvl sp, sp, #2			; CHECK-NEXT: addvl sp, sp, #2
	; CHECK-NEXT: ldr x29, [sp], #16 // 8-byte Folded Reload			; CHECK-NEXT: ldr x30, [sp], #16 // 8-byte Folded Reload
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%ins = insertelement <vscale x 32 x i8> %a, i8 %elt, i64 %idx			%ins = insertelement <vscale x 32 x i8> %a, i8 %elt, i64 %idx
	ret <vscale x 32 x i8> %ins			ret <vscale x 32 x i8> %ins
	}			}

	define <vscale x 8 x float> @split_insert_8f32_idx(<vscale x 8 x float> %a, float %elt, i64 %idx) {			define <vscale x 8 x float> @split_insert_8f32_idx(<vscale x 8 x float> %a, float %elt, i64 %idx) {
	; CHECK-LABEL: split_insert_8f32_idx:			; CHECK-LABEL: split_insert_8f32_idx:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: str x29, [sp, #-16]! // 8-byte Folded Spill			; CHECK-NEXT: str x30, [sp, #-16]! // 8-byte Folded Spill
	; CHECK-NEXT: addvl sp, sp, #-2			; CHECK-NEXT: addvl sp, sp, #-2
	; CHECK-NEXT: .cfi_escape 0x0f, 0x0c, 0x8f, 0x00, 0x11, 0x10, 0x22, 0x11, 0x10, 0x92, 0x2e, 0x00, 0x1e, 0x22 // sp + 16 + 16 * VG			; CHECK-NEXT: .cfi_escape 0x0f, 0x0c, 0x8f, 0x00, 0x11, 0x10, 0x22, 0x11, 0x10, 0x92, 0x2e, 0x00, 0x1e, 0x22 // sp + 16 + 16 * VG
	; CHECK-NEXT: .cfi_offset w29, -16			; CHECK-NEXT: .cfi_offset w30, -16
	; CHECK-NEXT: cnth x8			; CHECK-NEXT: cnth x8
	; CHECK-NEXT: sub x8, x8, #1 // =1			; CHECK-NEXT: sub x8, x8, #1 // =1
	; CHECK-NEXT: cmp x0, x8			; CHECK-NEXT: cmp x0, x8
	; CHECK-NEXT: ptrue p0.s			; CHECK-NEXT: ptrue p0.s
	; CHECK-NEXT: csel x8, x0, x8, lo			; CHECK-NEXT: csel x8, x0, x8, lo
	; CHECK-NEXT: mov x9, sp			; CHECK-NEXT: mov x9, sp
	; CHECK-NEXT: st1w { z1.s }, p0, [x9, #1, mul vl]			; CHECK-NEXT: st1w { z1.s }, p0, [x9, #1, mul vl]
	; CHECK-NEXT: st1w { z0.s }, p0, [sp]			; CHECK-NEXT: st1w { z0.s }, p0, [sp]
	; CHECK-NEXT: str s2, [x9, x8, lsl #2]			; CHECK-NEXT: str s2, [x9, x8, lsl #2]
	; CHECK-NEXT: ld1w { z1.s }, p0/z, [x9, #1, mul vl]			; CHECK-NEXT: ld1w { z1.s }, p0/z, [x9, #1, mul vl]
	; CHECK-NEXT: ld1w { z0.s }, p0/z, [sp]			; CHECK-NEXT: ld1w { z0.s }, p0/z, [sp]
	; CHECK-NEXT: addvl sp, sp, #2			; CHECK-NEXT: addvl sp, sp, #2
	; CHECK-NEXT: ldr x29, [sp], #16 // 8-byte Folded Reload			; CHECK-NEXT: ldr x30, [sp], #16 // 8-byte Folded Reload
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%ins = insertelement <vscale x 8 x float> %a, float %elt, i64 %idx			%ins = insertelement <vscale x 8 x float> %a, float %elt, i64 %idx
	ret <vscale x 8 x float> %ins			ret <vscale x 8 x float> %ins
	}			}

	define <vscale x 8 x i64> @split_insert_8i64_idx(<vscale x 8 x i64> %a, i64 %elt, i64 %idx) {			define <vscale x 8 x i64> @split_insert_8i64_idx(<vscale x 8 x i64> %a, i64 %elt, i64 %idx) {
	; CHECK-LABEL: split_insert_8i64_idx:			; CHECK-LABEL: split_insert_8i64_idx:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: str x29, [sp, #-16]! // 8-byte Folded Spill			; CHECK-NEXT: str x30, [sp, #-16]! // 8-byte Folded Spill
	; CHECK-NEXT: addvl sp, sp, #-4			; CHECK-NEXT: addvl sp, sp, #-4
	; CHECK-NEXT: .cfi_escape 0x0f, 0x0c, 0x8f, 0x00, 0x11, 0x10, 0x22, 0x11, 0x20, 0x92, 0x2e, 0x00, 0x1e, 0x22 // sp + 16 + 32 * VG			; CHECK-NEXT: .cfi_escape 0x0f, 0x0c, 0x8f, 0x00, 0x11, 0x10, 0x22, 0x11, 0x20, 0x92, 0x2e, 0x00, 0x1e, 0x22 // sp + 16 + 32 * VG
	; CHECK-NEXT: .cfi_offset w29, -16			; CHECK-NEXT: .cfi_offset w30, -16
	; CHECK-NEXT: cnth x8			; CHECK-NEXT: cnth x8
	; CHECK-NEXT: sub x8, x8, #1 // =1			; CHECK-NEXT: sub x8, x8, #1 // =1
	; CHECK-NEXT: cmp x1, x8			; CHECK-NEXT: cmp x1, x8
	; CHECK-NEXT: ptrue p0.d			; CHECK-NEXT: ptrue p0.d
	; CHECK-NEXT: csel x8, x1, x8, lo			; CHECK-NEXT: csel x8, x1, x8, lo
	; CHECK-NEXT: mov x9, sp			; CHECK-NEXT: mov x9, sp
	; CHECK-NEXT: st1d { z3.d }, p0, [x9, #3, mul vl]			; CHECK-NEXT: st1d { z3.d }, p0, [x9, #3, mul vl]
	; CHECK-NEXT: st1d { z2.d }, p0, [x9, #2, mul vl]			; CHECK-NEXT: st1d { z2.d }, p0, [x9, #2, mul vl]
	; CHECK-NEXT: st1d { z1.d }, p0, [x9, #1, mul vl]			; CHECK-NEXT: st1d { z1.d }, p0, [x9, #1, mul vl]
	; CHECK-NEXT: st1d { z0.d }, p0, [sp]			; CHECK-NEXT: st1d { z0.d }, p0, [sp]
	; CHECK-NEXT: str x0, [x9, x8, lsl #3]			; CHECK-NEXT: str x0, [x9, x8, lsl #3]
	; CHECK-NEXT: ld1d { z1.d }, p0/z, [x9, #1, mul vl]			; CHECK-NEXT: ld1d { z1.d }, p0/z, [x9, #1, mul vl]
	; CHECK-NEXT: ld1d { z2.d }, p0/z, [x9, #2, mul vl]			; CHECK-NEXT: ld1d { z2.d }, p0/z, [x9, #2, mul vl]
	; CHECK-NEXT: ld1d { z3.d }, p0/z, [x9, #3, mul vl]			; CHECK-NEXT: ld1d { z3.d }, p0/z, [x9, #3, mul vl]
	; CHECK-NEXT: ld1d { z0.d }, p0/z, [sp]			; CHECK-NEXT: ld1d { z0.d }, p0/z, [sp]
	; CHECK-NEXT: addvl sp, sp, #4			; CHECK-NEXT: addvl sp, sp, #4
	; CHECK-NEXT: ldr x29, [sp], #16 // 8-byte Folded Reload			; CHECK-NEXT: ldr x30, [sp], #16 // 8-byte Folded Reload
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%ins = insertelement <vscale x 8 x i64> %a, i64 %elt, i64 %idx			%ins = insertelement <vscale x 8 x i64> %a, i64 %elt, i64 %idx
	ret <vscale x 8 x i64> %ins			ret <vscale x 8 x i64> %ins
	}			}

	; INSERT VECTOR ELT, CONSTANT IDX			; INSERT VECTOR ELT, CONSTANT IDX

	define <vscale x 4 x i16> @promote_insert_4i16(<vscale x 4 x i16> %a, i16 %elt) {			define <vscale x 4 x i16> @promote_insert_4i16(<vscale x 4 x i16> %a, i16 %elt) {
	Show All 25 Lines
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%ins = insertelement <vscale x 32 x i8> %a, i8 %elt, i64 3			%ins = insertelement <vscale x 32 x i8> %a, i8 %elt, i64 3
	ret <vscale x 32 x i8> %ins			ret <vscale x 32 x i8> %ins
	}			}

	define <vscale x 32 x i16> @split_insert_32i16(<vscale x 32 x i16> %a, i16 %elt) {			define <vscale x 32 x i16> @split_insert_32i16(<vscale x 32 x i16> %a, i16 %elt) {
	; CHECK-LABEL: split_insert_32i16:			; CHECK-LABEL: split_insert_32i16:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: str x29, [sp, #-16]! // 8-byte Folded Spill			; CHECK-NEXT: str x30, [sp, #-16]! // 8-byte Folded Spill
	; CHECK-NEXT: addvl sp, sp, #-4			; CHECK-NEXT: addvl sp, sp, #-4
	; CHECK-NEXT: .cfi_escape 0x0f, 0x0c, 0x8f, 0x00, 0x11, 0x10, 0x22, 0x11, 0x20, 0x92, 0x2e, 0x00, 0x1e, 0x22 // sp + 16 + 32 * VG			; CHECK-NEXT: .cfi_escape 0x0f, 0x0c, 0x8f, 0x00, 0x11, 0x10, 0x22, 0x11, 0x20, 0x92, 0x2e, 0x00, 0x1e, 0x22 // sp + 16 + 32 * VG
	; CHECK-NEXT: .cfi_offset w29, -16			; CHECK-NEXT: .cfi_offset w30, -16
	; CHECK-NEXT: rdvl x10, #2			; CHECK-NEXT: rdvl x10, #2
	; CHECK-NEXT: sub x10, x10, #1 // =1			; CHECK-NEXT: sub x10, x10, #1 // =1
	; CHECK-NEXT: mov w9, #128			; CHECK-NEXT: mov w9, #128
	; CHECK-NEXT: cmp x10, #128 // =128			; CHECK-NEXT: cmp x10, #128 // =128
	; CHECK-NEXT: ptrue p0.h			; CHECK-NEXT: ptrue p0.h
	; CHECK-NEXT: mov x8, sp			; CHECK-NEXT: mov x8, sp
	; CHECK-NEXT: csel x9, x10, x9, lo			; CHECK-NEXT: csel x9, x10, x9, lo
	; CHECK-NEXT: st1h { z3.h }, p0, [x8, #3, mul vl]			; CHECK-NEXT: st1h { z3.h }, p0, [x8, #3, mul vl]
	; CHECK-NEXT: st1h { z2.h }, p0, [x8, #2, mul vl]			; CHECK-NEXT: st1h { z2.h }, p0, [x8, #2, mul vl]
	; CHECK-NEXT: st1h { z1.h }, p0, [x8, #1, mul vl]			; CHECK-NEXT: st1h { z1.h }, p0, [x8, #1, mul vl]
	; CHECK-NEXT: st1h { z0.h }, p0, [sp]			; CHECK-NEXT: st1h { z0.h }, p0, [sp]
	; CHECK-NEXT: strh w0, [x8, x9, lsl #1]			; CHECK-NEXT: strh w0, [x8, x9, lsl #1]
	; CHECK-NEXT: ld1h { z1.h }, p0/z, [x8, #1, mul vl]			; CHECK-NEXT: ld1h { z1.h }, p0/z, [x8, #1, mul vl]
	; CHECK-NEXT: ld1h { z2.h }, p0/z, [x8, #2, mul vl]			; CHECK-NEXT: ld1h { z2.h }, p0/z, [x8, #2, mul vl]
	; CHECK-NEXT: ld1h { z3.h }, p0/z, [x8, #3, mul vl]			; CHECK-NEXT: ld1h { z3.h }, p0/z, [x8, #3, mul vl]
	; CHECK-NEXT: ld1h { z0.h }, p0/z, [sp]			; CHECK-NEXT: ld1h { z0.h }, p0/z, [sp]
	; CHECK-NEXT: addvl sp, sp, #4			; CHECK-NEXT: addvl sp, sp, #4
	; CHECK-NEXT: ldr x29, [sp], #16 // 8-byte Folded Reload			; CHECK-NEXT: ldr x30, [sp], #16 // 8-byte Folded Reload
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%ins = insertelement <vscale x 32 x i16> %a, i16 %elt, i64 128			%ins = insertelement <vscale x 32 x i16> %a, i16 %elt, i64 128
	ret <vscale x 32 x i16> %ins			ret <vscale x 32 x i16> %ins
	}			}

	define <vscale x 8 x i32> @split_insert_8i32(<vscale x 8 x i32> %a, i32 %elt) {			define <vscale x 8 x i32> @split_insert_8i32(<vscale x 8 x i32> %a, i32 %elt) {
	; CHECK-LABEL: split_insert_8i32:			; CHECK-LABEL: split_insert_8i32:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: str x29, [sp, #-16]! // 8-byte Folded Spill			; CHECK-NEXT: str x30, [sp, #-16]! // 8-byte Folded Spill
	; CHECK-NEXT: addvl sp, sp, #-2			; CHECK-NEXT: addvl sp, sp, #-2
	; CHECK-NEXT: .cfi_escape 0x0f, 0x0c, 0x8f, 0x00, 0x11, 0x10, 0x22, 0x11, 0x10, 0x92, 0x2e, 0x00, 0x1e, 0x22 // sp + 16 + 16 * VG			; CHECK-NEXT: .cfi_escape 0x0f, 0x0c, 0x8f, 0x00, 0x11, 0x10, 0x22, 0x11, 0x10, 0x92, 0x2e, 0x00, 0x1e, 0x22 // sp + 16 + 16 * VG
	; CHECK-NEXT: .cfi_offset w29, -16			; CHECK-NEXT: .cfi_offset w30, -16
	; CHECK-NEXT: mov w9, #16960			; CHECK-NEXT: mov w9, #16960
	; CHECK-NEXT: cnth x10			; CHECK-NEXT: cnth x10
	; CHECK-NEXT: movk w9, #15, lsl #16			; CHECK-NEXT: movk w9, #15, lsl #16
	; CHECK-NEXT: sub x10, x10, #1 // =1			; CHECK-NEXT: sub x10, x10, #1 // =1
	; CHECK-NEXT: cmp x10, x9			; CHECK-NEXT: cmp x10, x9
	; CHECK-NEXT: ptrue p0.s			; CHECK-NEXT: ptrue p0.s
	; CHECK-NEXT: mov x8, sp			; CHECK-NEXT: mov x8, sp
	; CHECK-NEXT: csel x9, x10, x9, lo			; CHECK-NEXT: csel x9, x10, x9, lo
	; CHECK-NEXT: st1w { z1.s }, p0, [x8, #1, mul vl]			; CHECK-NEXT: st1w { z1.s }, p0, [x8, #1, mul vl]
	; CHECK-NEXT: st1w { z0.s }, p0, [sp]			; CHECK-NEXT: st1w { z0.s }, p0, [sp]
	; CHECK-NEXT: str w0, [x8, x9, lsl #2]			; CHECK-NEXT: str w0, [x8, x9, lsl #2]
	; CHECK-NEXT: ld1w { z1.s }, p0/z, [x8, #1, mul vl]			; CHECK-NEXT: ld1w { z1.s }, p0/z, [x8, #1, mul vl]
	; CHECK-NEXT: ld1w { z0.s }, p0/z, [sp]			; CHECK-NEXT: ld1w { z0.s }, p0/z, [sp]
	; CHECK-NEXT: addvl sp, sp, #2			; CHECK-NEXT: addvl sp, sp, #2
	; CHECK-NEXT: ldr x29, [sp], #16 // 8-byte Folded Reload			; CHECK-NEXT: ldr x30, [sp], #16 // 8-byte Folded Reload
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%ins = insertelement <vscale x 8 x i32> %a, i32 %elt, i64 1000000			%ins = insertelement <vscale x 8 x i32> %a, i32 %elt, i64 1000000
	ret <vscale x 8 x i32> %ins			ret <vscale x 8 x i32> %ins
	}			}

llvm/test/CodeGen/AArch64/sve-split-int-pred-reduce.ll

	Show All 17 Lines
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%res = call i1 @llvm.vector.reduce.and.nxv32i1(<vscale x 32 x i1> %a)			%res = call i1 @llvm.vector.reduce.and.nxv32i1(<vscale x 32 x i1> %a)
	ret i1 %res			ret i1 %res
	}			}

	define i1 @andv_nxv64i1(<vscale x 64 x i1> %a) {			define i1 @andv_nxv64i1(<vscale x 64 x i1> %a) {
	; CHECK-LABEL: andv_nxv64i1:			; CHECK-LABEL: andv_nxv64i1:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: str x29, [sp, #-16]! // 8-byte Folded Spill			; CHECK-NEXT: str x30, [sp, #-16]! // 8-byte Folded Spill
	; CHECK-NEXT: addvl sp, sp, #-1			; CHECK-NEXT: addvl sp, sp, #-1
	; CHECK-NEXT: str p4, [sp, #7, mul vl] // 2-byte Folded Spill			; CHECK-NEXT: str p4, [sp, #7, mul vl] // 2-byte Folded Spill
	; CHECK-NEXT: .cfi_escape 0x0f, 0x0c, 0x8f, 0x00, 0x11, 0x10, 0x22, 0x11, 0x08, 0x92, 0x2e, 0x00, 0x1e, 0x22 // sp + 16 + 8 * VG			; CHECK-NEXT: .cfi_escape 0x0f, 0x0c, 0x8f, 0x00, 0x11, 0x10, 0x22, 0x11, 0x08, 0x92, 0x2e, 0x00, 0x1e, 0x22 // sp + 16 + 8 * VG
	; CHECK-NEXT: .cfi_offset w29, -16			; CHECK-NEXT: .cfi_offset w30, -16
	; CHECK-NEXT: ptrue p4.b			; CHECK-NEXT: ptrue p4.b
	; CHECK-NEXT: and p1.b, p4/z, p1.b, p3.b			; CHECK-NEXT: and p1.b, p4/z, p1.b, p3.b
	; CHECK-NEXT: and p0.b, p4/z, p0.b, p2.b			; CHECK-NEXT: and p0.b, p4/z, p0.b, p2.b
	; CHECK-NEXT: and p0.b, p4/z, p0.b, p1.b			; CHECK-NEXT: and p0.b, p4/z, p0.b, p1.b
	; CHECK-NEXT: not p0.b, p4/z, p0.b			; CHECK-NEXT: not p0.b, p4/z, p0.b
	; CHECK-NEXT: ptest p4, p0.b			; CHECK-NEXT: ptest p4, p0.b
	; CHECK-NEXT: ldr p4, [sp, #7, mul vl] // 2-byte Folded Reload			; CHECK-NEXT: ldr p4, [sp, #7, mul vl] // 2-byte Folded Reload
	; CHECK-NEXT: cset w0, eq			; CHECK-NEXT: cset w0, eq
	; CHECK-NEXT: addvl sp, sp, #1			; CHECK-NEXT: addvl sp, sp, #1
	; CHECK-NEXT: ldr x29, [sp], #16 // 8-byte Folded Reload			; CHECK-NEXT: ldr x30, [sp], #16 // 8-byte Folded Reload
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%res = call i1 @llvm.vector.reduce.and.nxv64i1(<vscale x 64 x i1> %a)			%res = call i1 @llvm.vector.reduce.and.nxv64i1(<vscale x 64 x i1> %a)
	ret i1 %res			ret i1 %res
	}			}

	; ORV			; ORV

	define i1 @orv_nxv32i1(<vscale x 32 x i1> %a) {			define i1 @orv_nxv32i1(<vscale x 32 x i1> %a) {
	▲ Show 20 Lines • Show All 97 Lines • Show Last 20 Lines

llvm/test/CodeGen/AArch64/sve-tailcall.ll

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: llc -mtriple=aarch64 -mattr=+sve < %s 2>%t \| FileCheck %s			; RUN: llc -mtriple=aarch64 -mattr=+sve < %s 2>%t \| FileCheck %s
	; RUN: FileCheck --check-prefix=WARN --allow-empty %s <%t			; RUN: FileCheck --check-prefix=WARN --allow-empty %s <%t

	; If this check fails please read test/CodeGen/AArch64/README for instructions on how to resolve it.			; If this check fails please read test/CodeGen/AArch64/README for instructions on how to resolve it.
	; WARN-NOT: warning			; WARN-NOT: warning

	; Check that a tail call from an SVE function to another SVE function			; Check that a tail call from an SVE function to another SVE function
	; can use a tail-call, as the same registers will be preserved by the			; can use a tail-call, as the same registers will be preserved by the
	; callee.			; callee.
	define <vscale x 4 x i32> @sve_caller_sve_callee() nounwind {			define <vscale x 4 x i32> @sve_caller_sve_callee() nounwind {
	; CHECK-LABEL: sve_caller_sve_callee:			; CHECK-LABEL: sve_caller_sve_callee:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: str x29, [sp, #-16]! // 8-byte Folded Spill			; CHECK-NEXT: str x30, [sp, #-16]! // 8-byte Folded Spill
	; CHECK-NEXT: addvl sp, sp, #-2			; CHECK-NEXT: addvl sp, sp, #-2
	; CHECK-NEXT: str z10, [sp] // 16-byte Folded Spill			; CHECK-NEXT: str z10, [sp] // 16-byte Folded Spill
	; CHECK-NEXT: str z9, [sp, #1, mul vl] // 16-byte Folded Spill			; CHECK-NEXT: str z9, [sp, #1, mul vl] // 16-byte Folded Spill
	; CHECK-NEXT: //APP			; CHECK-NEXT: //APP
	; CHECK-NEXT: //NO_APP			; CHECK-NEXT: //NO_APP
	; CHECK-NEXT: ldr z10, [sp] // 16-byte Folded Reload			; CHECK-NEXT: ldr z10, [sp] // 16-byte Folded Reload
	; CHECK-NEXT: ldr z9, [sp, #1, mul vl] // 16-byte Folded Reload			; CHECK-NEXT: ldr z9, [sp, #1, mul vl] // 16-byte Folded Reload
	; CHECK-NEXT: addvl sp, sp, #2			; CHECK-NEXT: addvl sp, sp, #2
	; CHECK-NEXT: ldr x29, [sp], #16 // 8-byte Folded Reload			; CHECK-NEXT: ldr x30, [sp], #16 // 8-byte Folded Reload
	; CHECK-NEXT: b sve_callee			; CHECK-NEXT: b sve_callee
	tail call void asm sideeffect "", "~{z9},~{z10}"()			tail call void asm sideeffect "", "~{z9},~{z10}"()
	%call = tail call <vscale x 4 x i32> @sve_callee()			%call = tail call <vscale x 4 x i32> @sve_callee()
	ret <vscale x 4 x i32> %call			ret <vscale x 4 x i32> %call
	}			}

	declare <vscale x 4 x i32> @sve_callee()			declare <vscale x 4 x i32> @sve_callee()

	; Check that a tail call from an SVE function to a non-SVE function			; Check that a tail call from an SVE function to a non-SVE function
	; does not use a tail-call, because after the call many of the SVE			; does not use a tail-call, because after the call many of the SVE
	; registers may be clobbered and needs to be restored.			; registers may be clobbered and needs to be restored.
	define i32 @sve_caller_non_sve_callee(<vscale x 4 x i32> %arg) nounwind {			define i32 @sve_caller_non_sve_callee(<vscale x 4 x i32> %arg) nounwind {
	; CHECK-LABEL: sve_caller_non_sve_callee:			; CHECK-LABEL: sve_caller_non_sve_callee:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: stp x29, x30, [sp, #-16]! // 16-byte Folded Spill			; CHECK-NEXT: stp x30, x28, [sp, #-16]! // 16-byte Folded Spill
	; CHECK-NEXT: addvl sp, sp, #-18			; CHECK-NEXT: addvl sp, sp, #-18
	; CHECK-NEXT: str p15, [sp, #4, mul vl] // 2-byte Folded Spill			; CHECK-NEXT: str p15, [sp, #4, mul vl] // 2-byte Folded Spill
	; CHECK-NEXT: str p14, [sp, #5, mul vl] // 2-byte Folded Spill			; CHECK-NEXT: str p14, [sp, #5, mul vl] // 2-byte Folded Spill
	; CHECK-NEXT: str p13, [sp, #6, mul vl] // 2-byte Folded Spill			; CHECK-NEXT: str p13, [sp, #6, mul vl] // 2-byte Folded Spill
	; CHECK-NEXT: str p12, [sp, #7, mul vl] // 2-byte Folded Spill			; CHECK-NEXT: str p12, [sp, #7, mul vl] // 2-byte Folded Spill
	; CHECK-NEXT: str p11, [sp, #8, mul vl] // 2-byte Folded Spill			; CHECK-NEXT: str p11, [sp, #8, mul vl] // 2-byte Folded Spill
	; CHECK-NEXT: str p10, [sp, #9, mul vl] // 2-byte Folded Spill			; CHECK-NEXT: str p10, [sp, #9, mul vl] // 2-byte Folded Spill
	; CHECK-NEXT: str p9, [sp, #10, mul vl] // 2-byte Folded Spill			; CHECK-NEXT: str p9, [sp, #10, mul vl] // 2-byte Folded Spill
	▲ Show 20 Lines • Show All 45 Lines • ▼ Show 20 Lines
	; CHECK-NEXT: ldr z14, [sp, #11, mul vl] // 16-byte Folded Reload			; CHECK-NEXT: ldr z14, [sp, #11, mul vl] // 16-byte Folded Reload
	; CHECK-NEXT: ldr z13, [sp, #12, mul vl] // 16-byte Folded Reload			; CHECK-NEXT: ldr z13, [sp, #12, mul vl] // 16-byte Folded Reload
	; CHECK-NEXT: ldr z12, [sp, #13, mul vl] // 16-byte Folded Reload			; CHECK-NEXT: ldr z12, [sp, #13, mul vl] // 16-byte Folded Reload
	; CHECK-NEXT: ldr z11, [sp, #14, mul vl] // 16-byte Folded Reload			; CHECK-NEXT: ldr z11, [sp, #14, mul vl] // 16-byte Folded Reload
	; CHECK-NEXT: ldr z10, [sp, #15, mul vl] // 16-byte Folded Reload			; CHECK-NEXT: ldr z10, [sp, #15, mul vl] // 16-byte Folded Reload
	; CHECK-NEXT: ldr z9, [sp, #16, mul vl] // 16-byte Folded Reload			; CHECK-NEXT: ldr z9, [sp, #16, mul vl] // 16-byte Folded Reload
	; CHECK-NEXT: ldr z8, [sp, #17, mul vl] // 16-byte Folded Reload			; CHECK-NEXT: ldr z8, [sp, #17, mul vl] // 16-byte Folded Reload
	; CHECK-NEXT: addvl sp, sp, #18			; CHECK-NEXT: addvl sp, sp, #18
	; CHECK-NEXT: ldp x29, x30, [sp], #16 // 16-byte Folded Reload			; CHECK-NEXT: ldp x30, x28, [sp], #16 // 16-byte Folded Reload
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	tail call void asm sideeffect "", "~{z9},~{z10}"()			tail call void asm sideeffect "", "~{z9},~{z10}"()
	%call = tail call i32 @non_sve_callee()			%call = tail call i32 @non_sve_callee()
	ret i32 %call			ret i32 %call
	}			}

	declare i32 @non_sve_callee()			declare i32 @non_sve_callee()

llvm/test/CodeGen/AArch64/sve-trunc.ll

	Show First 20 Lines • Show All 107 Lines • ▼ Show 20 Lines
	entry:			entry:
	%out = trunc <vscale x 8 x i64> %in to <vscale x 8 x i1>			%out = trunc <vscale x 8 x i64> %in to <vscale x 8 x i1>
	ret <vscale x 8 x i1> %out			ret <vscale x 8 x i1> %out
	}			}

	define <vscale x 16 x i1> @trunc_i64toi1_split3(<vscale x 16 x i64> %in) {			define <vscale x 16 x i1> @trunc_i64toi1_split3(<vscale x 16 x i64> %in) {
	; CHECK-LABEL: trunc_i64toi1_split3:			; CHECK-LABEL: trunc_i64toi1_split3:
	; CHECK: // %bb.0: // %entry			; CHECK: // %bb.0: // %entry
	; CHECK-NEXT: str x29, [sp, #-16]! // 8-byte Folded Spill			; CHECK-NEXT: str x30, [sp, #-16]! // 8-byte Folded Spill
	; CHECK-NEXT: addvl sp, sp, #-1			; CHECK-NEXT: addvl sp, sp, #-1
	; CHECK-NEXT: str p4, [sp, #7, mul vl] // 2-byte Folded Spill			; CHECK-NEXT: str p4, [sp, #7, mul vl] // 2-byte Folded Spill
	; CHECK-NEXT: .cfi_escape 0x0f, 0x0c, 0x8f, 0x00, 0x11, 0x10, 0x22, 0x11, 0x08, 0x92, 0x2e, 0x00, 0x1e, 0x22 // sp + 16 + 8 * VG			; CHECK-NEXT: .cfi_escape 0x0f, 0x0c, 0x8f, 0x00, 0x11, 0x10, 0x22, 0x11, 0x08, 0x92, 0x2e, 0x00, 0x1e, 0x22 // sp + 16 + 8 * VG
	; CHECK-NEXT: .cfi_offset w29, -16			; CHECK-NEXT: .cfi_offset w30, -16
	; CHECK-NEXT: ptrue p0.d			; CHECK-NEXT: ptrue p0.d
	; CHECK-NEXT: and z7.d, z7.d, #0x1			; CHECK-NEXT: and z7.d, z7.d, #0x1
	; CHECK-NEXT: and z6.d, z6.d, #0x1			; CHECK-NEXT: and z6.d, z6.d, #0x1
	; CHECK-NEXT: and z5.d, z5.d, #0x1			; CHECK-NEXT: and z5.d, z5.d, #0x1
	; CHECK-NEXT: and z4.d, z4.d, #0x1			; CHECK-NEXT: and z4.d, z4.d, #0x1
	; CHECK-NEXT: and z3.d, z3.d, #0x1			; CHECK-NEXT: and z3.d, z3.d, #0x1
	; CHECK-NEXT: and z2.d, z2.d, #0x1			; CHECK-NEXT: and z2.d, z2.d, #0x1
	; CHECK-NEXT: cmpne p1.d, p0/z, z7.d, #0			; CHECK-NEXT: cmpne p1.d, p0/z, z7.d, #0
	Show All 10 Lines
	; CHECK-NEXT: cmpne p4.d, p0/z, z1.d, #0			; CHECK-NEXT: cmpne p4.d, p0/z, z1.d, #0
	; CHECK-NEXT: cmpne p0.d, p0/z, z0.d, #0			; CHECK-NEXT: cmpne p0.d, p0/z, z0.d, #0
	; CHECK-NEXT: uzp1 p0.s, p0.s, p4.s			; CHECK-NEXT: uzp1 p0.s, p0.s, p4.s
	; CHECK-NEXT: ldr p4, [sp, #7, mul vl] // 2-byte Folded Reload			; CHECK-NEXT: ldr p4, [sp, #7, mul vl] // 2-byte Folded Reload
	; CHECK-NEXT: uzp1 p1.h, p3.h, p1.h			; CHECK-NEXT: uzp1 p1.h, p3.h, p1.h
	; CHECK-NEXT: uzp1 p0.h, p0.h, p2.h			; CHECK-NEXT: uzp1 p0.h, p0.h, p2.h
	; CHECK-NEXT: uzp1 p0.b, p0.b, p1.b			; CHECK-NEXT: uzp1 p0.b, p0.b, p1.b
	; CHECK-NEXT: addvl sp, sp, #1			; CHECK-NEXT: addvl sp, sp, #1
	; CHECK-NEXT: ldr x29, [sp], #16 // 8-byte Folded Reload			; CHECK-NEXT: ldr x30, [sp], #16 // 8-byte Folded Reload
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	entry:			entry:
	%out = trunc <vscale x 16 x i64> %in to <vscale x 16 x i1>			%out = trunc <vscale x 16 x i64> %in to <vscale x 16 x i1>
	ret <vscale x 16 x i1> %out			ret <vscale x 16 x i1> %out
	}			}


	define <vscale x 4 x i1> @trunc_i32toi1(<vscale x 4 x i32> %in) {			define <vscale x 4 x i1> @trunc_i32toi1(<vscale x 4 x i32> %in) {
	Show All 34 Lines

llvm/test/CodeGen/AArch64/unwind-preserved.ll

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py UTC_ARGS: --extra_scrub			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py UTC_ARGS: --extra_scrub
	; RUN: llc -mtriple=aarch64-linux-gnu -mattr=+sve -O0 -global-isel=0 -global-isel-abort=0 < %s \| FileCheck %s			; RUN: llc -mtriple=aarch64-linux-gnu -mattr=+sve -O0 -global-isel=0 -global-isel-abort=0 < %s \| FileCheck %s
	; RUN: llc -mtriple=aarch64-linux-gnu -mattr=+sve -O0 -global-isel=1 -global-isel-abort=0 < %s \| FileCheck %s --check-prefix=GISEL			; RUN: llc -mtriple=aarch64-linux-gnu -mattr=+sve -O0 -global-isel=1 -global-isel-abort=0 < %s \| FileCheck %s --check-prefix=GISEL

	; Test that z0 is saved/restored, as the unwinder may only retain the low 64bits (d0).			; Test that z0 is saved/restored, as the unwinder may only retain the low 64bits (d0).
	define <vscale x 4 x i32> @invoke_callee_may_throw_sve(<vscale x 4 x i32> %v) personality i8 0 {			define <vscale x 4 x i32> @invoke_callee_may_throw_sve(<vscale x 4 x i32> %v) personality i8 0 {
	; CHECK-LABEL: invoke_callee_may_throw_sve:			; CHECK-LABEL: invoke_callee_may_throw_sve:
	; CHECK: .Lfunc_begin0:			; CHECK: .Lfunc_begin0:
	; CHECK-NEXT: .cfi_startproc			; CHECK-NEXT: .cfi_startproc
	; CHECK-NEXT: // %bb.0:			; CHECK-NEXT: // %bb.0:
	; CHECK-NEXT: stp x29, x30, [sp, #-16]! // 16-byte Folded Spill			; CHECK-NEXT: stp x30, x28, [sp, #-16]! // 16-byte Folded Spill
	; CHECK-NEXT: addvl sp, sp, #-18			; CHECK-NEXT: addvl sp, sp, #-18
	; CHECK-NEXT: str p15, [sp, #4, mul vl] // 2-byte Folded Spill			; CHECK-NEXT: str p15, [sp, #4, mul vl] // 2-byte Folded Spill
	; CHECK-NEXT: str p14, [sp, #5, mul vl] // 2-byte Folded Spill			; CHECK-NEXT: str p14, [sp, #5, mul vl] // 2-byte Folded Spill
	; CHECK-NEXT: str p13, [sp, #6, mul vl] // 2-byte Folded Spill			; CHECK-NEXT: str p13, [sp, #6, mul vl] // 2-byte Folded Spill
	; CHECK-NEXT: str p12, [sp, #7, mul vl] // 2-byte Folded Spill			; CHECK-NEXT: str p12, [sp, #7, mul vl] // 2-byte Folded Spill
	; CHECK-NEXT: str p11, [sp, #8, mul vl] // 2-byte Folded Spill			; CHECK-NEXT: str p11, [sp, #8, mul vl] // 2-byte Folded Spill
	; CHECK-NEXT: str p10, [sp, #9, mul vl] // 2-byte Folded Spill			; CHECK-NEXT: str p10, [sp, #9, mul vl] // 2-byte Folded Spill
	; CHECK-NEXT: str p9, [sp, #10, mul vl] // 2-byte Folded Spill			; CHECK-NEXT: str p9, [sp, #10, mul vl] // 2-byte Folded Spill
	Show All 23 Lines
	; CHECK-NEXT: .cfi_escape 0x10, 0x48, 0x0a, 0x11, 0x70, 0x22, 0x11, 0x78, 0x92, 0x2e, 0x00, 0x1e, 0x22 // $d8 @ cfa - 16 - 8 * VG			; CHECK-NEXT: .cfi_escape 0x10, 0x48, 0x0a, 0x11, 0x70, 0x22, 0x11, 0x78, 0x92, 0x2e, 0x00, 0x1e, 0x22 // $d8 @ cfa - 16 - 8 * VG
	; CHECK-NEXT: .cfi_escape 0x10, 0x49, 0x0a, 0x11, 0x70, 0x22, 0x11, 0x70, 0x92, 0x2e, 0x00, 0x1e, 0x22 // $d9 @ cfa - 16 - 16 * VG			; CHECK-NEXT: .cfi_escape 0x10, 0x49, 0x0a, 0x11, 0x70, 0x22, 0x11, 0x70, 0x92, 0x2e, 0x00, 0x1e, 0x22 // $d9 @ cfa - 16 - 16 * VG
	; CHECK-NEXT: .cfi_escape 0x10, 0x4a, 0x0a, 0x11, 0x70, 0x22, 0x11, 0x68, 0x92, 0x2e, 0x00, 0x1e, 0x22 // $d10 @ cfa - 16 - 24 * VG			; CHECK-NEXT: .cfi_escape 0x10, 0x4a, 0x0a, 0x11, 0x70, 0x22, 0x11, 0x68, 0x92, 0x2e, 0x00, 0x1e, 0x22 // $d10 @ cfa - 16 - 24 * VG
	; CHECK-NEXT: .cfi_escape 0x10, 0x4b, 0x0a, 0x11, 0x70, 0x22, 0x11, 0x60, 0x92, 0x2e, 0x00, 0x1e, 0x22 // $d11 @ cfa - 16 - 32 * VG			; CHECK-NEXT: .cfi_escape 0x10, 0x4b, 0x0a, 0x11, 0x70, 0x22, 0x11, 0x60, 0x92, 0x2e, 0x00, 0x1e, 0x22 // $d11 @ cfa - 16 - 32 * VG
	; CHECK-NEXT: .cfi_escape 0x10, 0x4c, 0x0a, 0x11, 0x70, 0x22, 0x11, 0x58, 0x92, 0x2e, 0x00, 0x1e, 0x22 // $d12 @ cfa - 16 - 40 * VG			; CHECK-NEXT: .cfi_escape 0x10, 0x4c, 0x0a, 0x11, 0x70, 0x22, 0x11, 0x58, 0x92, 0x2e, 0x00, 0x1e, 0x22 // $d12 @ cfa - 16 - 40 * VG
	; CHECK-NEXT: .cfi_escape 0x10, 0x4d, 0x0a, 0x11, 0x70, 0x22, 0x11, 0x50, 0x92, 0x2e, 0x00, 0x1e, 0x22 // $d13 @ cfa - 16 - 48 * VG			; CHECK-NEXT: .cfi_escape 0x10, 0x4d, 0x0a, 0x11, 0x70, 0x22, 0x11, 0x50, 0x92, 0x2e, 0x00, 0x1e, 0x22 // $d13 @ cfa - 16 - 48 * VG
	; CHECK-NEXT: .cfi_escape 0x10, 0x4e, 0x0a, 0x11, 0x70, 0x22, 0x11, 0x48, 0x92, 0x2e, 0x00, 0x1e, 0x22 // $d14 @ cfa - 16 - 56 * VG			; CHECK-NEXT: .cfi_escape 0x10, 0x4e, 0x0a, 0x11, 0x70, 0x22, 0x11, 0x48, 0x92, 0x2e, 0x00, 0x1e, 0x22 // $d14 @ cfa - 16 - 56 * VG
	; CHECK-NEXT: .cfi_escape 0x10, 0x4f, 0x0a, 0x11, 0x70, 0x22, 0x11, 0x40, 0x92, 0x2e, 0x00, 0x1e, 0x22 // $d15 @ cfa - 16 - 64 * VG			; CHECK-NEXT: .cfi_escape 0x10, 0x4f, 0x0a, 0x11, 0x70, 0x22, 0x11, 0x40, 0x92, 0x2e, 0x00, 0x1e, 0x22 // $d15 @ cfa - 16 - 64 * VG
	; CHECK-NEXT: .cfi_offset w30, -8			; CHECK-NEXT: .cfi_offset w28, -8
	; CHECK-NEXT: .cfi_offset w29, -16			; CHECK-NEXT: .cfi_offset w30, -16
	; CHECK-NEXT: str z0, [sp] // 16-byte Folded Spill			; CHECK-NEXT: str z0, [sp] // 16-byte Folded Spill
	; CHECK-NEXT: .Ltmp0:			; CHECK-NEXT: .Ltmp0:
	; CHECK-NEXT: bl may_throw_sve			; CHECK-NEXT: bl may_throw_sve
	; CHECK-NEXT: .Ltmp1:			; CHECK-NEXT: .Ltmp1:
	; CHECK-NEXT: str z0, [sp, #1, mul vl] // 16-byte Folded Spill			; CHECK-NEXT: str z0, [sp, #1, mul vl] // 16-byte Folded Spill
	; CHECK-NEXT: b .LBB0_1			; CHECK-NEXT: b .LBB0_1
	; CHECK-NEXT: .LBB0_1: // %.Lcontinue			; CHECK-NEXT: .LBB0_1: // %.Lcontinue
	; CHECK-NEXT: ldr z0, [sp, #1, mul vl] // 16-byte Folded Reload			; CHECK-NEXT: ldr z0, [sp, #1, mul vl] // 16-byte Folded Reload
	Show All 22 Lines
	; CHECK-NEXT: ldr z14, [sp, #11, mul vl] // 16-byte Folded Reload			; CHECK-NEXT: ldr z14, [sp, #11, mul vl] // 16-byte Folded Reload
	; CHECK-NEXT: ldr z13, [sp, #12, mul vl] // 16-byte Folded Reload			; CHECK-NEXT: ldr z13, [sp, #12, mul vl] // 16-byte Folded Reload
	; CHECK-NEXT: ldr z12, [sp, #13, mul vl] // 16-byte Folded Reload			; CHECK-NEXT: ldr z12, [sp, #13, mul vl] // 16-byte Folded Reload
	; CHECK-NEXT: ldr z11, [sp, #14, mul vl] // 16-byte Folded Reload			; CHECK-NEXT: ldr z11, [sp, #14, mul vl] // 16-byte Folded Reload
	; CHECK-NEXT: ldr z10, [sp, #15, mul vl] // 16-byte Folded Reload			; CHECK-NEXT: ldr z10, [sp, #15, mul vl] // 16-byte Folded Reload
	; CHECK-NEXT: ldr z9, [sp, #16, mul vl] // 16-byte Folded Reload			; CHECK-NEXT: ldr z9, [sp, #16, mul vl] // 16-byte Folded Reload
	; CHECK-NEXT: ldr z8, [sp, #17, mul vl] // 16-byte Folded Reload			; CHECK-NEXT: ldr z8, [sp, #17, mul vl] // 16-byte Folded Reload
	; CHECK-NEXT: addvl sp, sp, #18			; CHECK-NEXT: addvl sp, sp, #18
	; CHECK-NEXT: ldp x29, x30, [sp], #16 // 16-byte Folded Reload			; CHECK-NEXT: ldp x30, x28, [sp], #16 // 16-byte Folded Reload
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	; CHECK-NEXT: .LBB0_2: // %.Lunwind			; CHECK-NEXT: .LBB0_2: // %.Lunwind
	; CHECK-NEXT: .Ltmp2:			; CHECK-NEXT: .Ltmp2:
	; CHECK-NEXT: ldr z0, [sp] // 16-byte Folded Reload			; CHECK-NEXT: ldr z0, [sp] // 16-byte Folded Reload
	; CHECK-NEXT: addvl sp, sp, #2			; CHECK-NEXT: addvl sp, sp, #2
	; CHECK-NEXT: ldr p15, [sp, #4, mul vl] // 2-byte Folded Reload			; CHECK-NEXT: ldr p15, [sp, #4, mul vl] // 2-byte Folded Reload
	; CHECK-NEXT: ldr p14, [sp, #5, mul vl] // 2-byte Folded Reload			; CHECK-NEXT: ldr p14, [sp, #5, mul vl] // 2-byte Folded Reload
	; CHECK-NEXT: ldr p13, [sp, #6, mul vl] // 2-byte Folded Reload			; CHECK-NEXT: ldr p13, [sp, #6, mul vl] // 2-byte Folded Reload
	Show All 18 Lines
	; CHECK-NEXT: ldr z14, [sp, #11, mul vl] // 16-byte Folded Reload			; CHECK-NEXT: ldr z14, [sp, #11, mul vl] // 16-byte Folded Reload
	; CHECK-NEXT: ldr z13, [sp, #12, mul vl] // 16-byte Folded Reload			; CHECK-NEXT: ldr z13, [sp, #12, mul vl] // 16-byte Folded Reload
	; CHECK-NEXT: ldr z12, [sp, #13, mul vl] // 16-byte Folded Reload			; CHECK-NEXT: ldr z12, [sp, #13, mul vl] // 16-byte Folded Reload
	; CHECK-NEXT: ldr z11, [sp, #14, mul vl] // 16-byte Folded Reload			; CHECK-NEXT: ldr z11, [sp, #14, mul vl] // 16-byte Folded Reload
	; CHECK-NEXT: ldr z10, [sp, #15, mul vl] // 16-byte Folded Reload			; CHECK-NEXT: ldr z10, [sp, #15, mul vl] // 16-byte Folded Reload
	; CHECK-NEXT: ldr z9, [sp, #16, mul vl] // 16-byte Folded Reload			; CHECK-NEXT: ldr z9, [sp, #16, mul vl] // 16-byte Folded Reload
	; CHECK-NEXT: ldr z8, [sp, #17, mul vl] // 16-byte Folded Reload			; CHECK-NEXT: ldr z8, [sp, #17, mul vl] // 16-byte Folded Reload
	; CHECK-NEXT: addvl sp, sp, #18			; CHECK-NEXT: addvl sp, sp, #18
	; CHECK-NEXT: ldp x29, x30, [sp], #16 // 16-byte Folded Reload			; CHECK-NEXT: ldp x30, x28, [sp], #16 // 16-byte Folded Reload
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	;			;
	; GISEL-LABEL: invoke_callee_may_throw_sve:			; GISEL-LABEL: invoke_callee_may_throw_sve:
	; GISEL: .Lfunc_begin0:			; GISEL: .Lfunc_begin0:
	; GISEL-NEXT: .cfi_startproc			; GISEL-NEXT: .cfi_startproc
	; GISEL-NEXT: // %bb.0:			; GISEL-NEXT: // %bb.0:
	; GISEL-NEXT: stp x29, x30, [sp, #-16]! // 16-byte Folded Spill			; GISEL-NEXT: stp x30, x28, [sp, #-16]! // 16-byte Folded Spill
	; GISEL-NEXT: addvl sp, sp, #-18			; GISEL-NEXT: addvl sp, sp, #-18
	; GISEL-NEXT: str p15, [sp, #4, mul vl] // 2-byte Folded Spill			; GISEL-NEXT: str p15, [sp, #4, mul vl] // 2-byte Folded Spill
	; GISEL-NEXT: str p14, [sp, #5, mul vl] // 2-byte Folded Spill			; GISEL-NEXT: str p14, [sp, #5, mul vl] // 2-byte Folded Spill
	; GISEL-NEXT: str p13, [sp, #6, mul vl] // 2-byte Folded Spill			; GISEL-NEXT: str p13, [sp, #6, mul vl] // 2-byte Folded Spill
	; GISEL-NEXT: str p12, [sp, #7, mul vl] // 2-byte Folded Spill			; GISEL-NEXT: str p12, [sp, #7, mul vl] // 2-byte Folded Spill
	; GISEL-NEXT: str p11, [sp, #8, mul vl] // 2-byte Folded Spill			; GISEL-NEXT: str p11, [sp, #8, mul vl] // 2-byte Folded Spill
	; GISEL-NEXT: str p10, [sp, #9, mul vl] // 2-byte Folded Spill			; GISEL-NEXT: str p10, [sp, #9, mul vl] // 2-byte Folded Spill
	; GISEL-NEXT: str p9, [sp, #10, mul vl] // 2-byte Folded Spill			; GISEL-NEXT: str p9, [sp, #10, mul vl] // 2-byte Folded Spill
	Show All 23 Lines
	; GISEL-NEXT: .cfi_escape 0x10, 0x48, 0x0a, 0x11, 0x70, 0x22, 0x11, 0x78, 0x92, 0x2e, 0x00, 0x1e, 0x22 // $d8 @ cfa - 16 - 8 * VG			; GISEL-NEXT: .cfi_escape 0x10, 0x48, 0x0a, 0x11, 0x70, 0x22, 0x11, 0x78, 0x92, 0x2e, 0x00, 0x1e, 0x22 // $d8 @ cfa - 16 - 8 * VG
	; GISEL-NEXT: .cfi_escape 0x10, 0x49, 0x0a, 0x11, 0x70, 0x22, 0x11, 0x70, 0x92, 0x2e, 0x00, 0x1e, 0x22 // $d9 @ cfa - 16 - 16 * VG			; GISEL-NEXT: .cfi_escape 0x10, 0x49, 0x0a, 0x11, 0x70, 0x22, 0x11, 0x70, 0x92, 0x2e, 0x00, 0x1e, 0x22 // $d9 @ cfa - 16 - 16 * VG
	; GISEL-NEXT: .cfi_escape 0x10, 0x4a, 0x0a, 0x11, 0x70, 0x22, 0x11, 0x68, 0x92, 0x2e, 0x00, 0x1e, 0x22 // $d10 @ cfa - 16 - 24 * VG			; GISEL-NEXT: .cfi_escape 0x10, 0x4a, 0x0a, 0x11, 0x70, 0x22, 0x11, 0x68, 0x92, 0x2e, 0x00, 0x1e, 0x22 // $d10 @ cfa - 16 - 24 * VG
	; GISEL-NEXT: .cfi_escape 0x10, 0x4b, 0x0a, 0x11, 0x70, 0x22, 0x11, 0x60, 0x92, 0x2e, 0x00, 0x1e, 0x22 // $d11 @ cfa - 16 - 32 * VG			; GISEL-NEXT: .cfi_escape 0x10, 0x4b, 0x0a, 0x11, 0x70, 0x22, 0x11, 0x60, 0x92, 0x2e, 0x00, 0x1e, 0x22 // $d11 @ cfa - 16 - 32 * VG
	; GISEL-NEXT: .cfi_escape 0x10, 0x4c, 0x0a, 0x11, 0x70, 0x22, 0x11, 0x58, 0x92, 0x2e, 0x00, 0x1e, 0x22 // $d12 @ cfa - 16 - 40 * VG			; GISEL-NEXT: .cfi_escape 0x10, 0x4c, 0x0a, 0x11, 0x70, 0x22, 0x11, 0x58, 0x92, 0x2e, 0x00, 0x1e, 0x22 // $d12 @ cfa - 16 - 40 * VG
	; GISEL-NEXT: .cfi_escape 0x10, 0x4d, 0x0a, 0x11, 0x70, 0x22, 0x11, 0x50, 0x92, 0x2e, 0x00, 0x1e, 0x22 // $d13 @ cfa - 16 - 48 * VG			; GISEL-NEXT: .cfi_escape 0x10, 0x4d, 0x0a, 0x11, 0x70, 0x22, 0x11, 0x50, 0x92, 0x2e, 0x00, 0x1e, 0x22 // $d13 @ cfa - 16 - 48 * VG
	; GISEL-NEXT: .cfi_escape 0x10, 0x4e, 0x0a, 0x11, 0x70, 0x22, 0x11, 0x48, 0x92, 0x2e, 0x00, 0x1e, 0x22 // $d14 @ cfa - 16 - 56 * VG			; GISEL-NEXT: .cfi_escape 0x10, 0x4e, 0x0a, 0x11, 0x70, 0x22, 0x11, 0x48, 0x92, 0x2e, 0x00, 0x1e, 0x22 // $d14 @ cfa - 16 - 56 * VG
	; GISEL-NEXT: .cfi_escape 0x10, 0x4f, 0x0a, 0x11, 0x70, 0x22, 0x11, 0x40, 0x92, 0x2e, 0x00, 0x1e, 0x22 // $d15 @ cfa - 16 - 64 * VG			; GISEL-NEXT: .cfi_escape 0x10, 0x4f, 0x0a, 0x11, 0x70, 0x22, 0x11, 0x40, 0x92, 0x2e, 0x00, 0x1e, 0x22 // $d15 @ cfa - 16 - 64 * VG
	; GISEL-NEXT: .cfi_offset w30, -8			; GISEL-NEXT: .cfi_offset w28, -8
	; GISEL-NEXT: .cfi_offset w29, -16			; GISEL-NEXT: .cfi_offset w30, -16
	; GISEL-NEXT: str z0, [sp] // 16-byte Folded Spill			; GISEL-NEXT: str z0, [sp] // 16-byte Folded Spill
	; GISEL-NEXT: .Ltmp0:			; GISEL-NEXT: .Ltmp0:
	; GISEL-NEXT: bl may_throw_sve			; GISEL-NEXT: bl may_throw_sve
	; GISEL-NEXT: .Ltmp1:			; GISEL-NEXT: .Ltmp1:
	; GISEL-NEXT: str z0, [sp, #1, mul vl] // 16-byte Folded Spill			; GISEL-NEXT: str z0, [sp, #1, mul vl] // 16-byte Folded Spill
	; GISEL-NEXT: b .LBB0_1			; GISEL-NEXT: b .LBB0_1
	; GISEL-NEXT: .LBB0_1: // %.Lcontinue			; GISEL-NEXT: .LBB0_1: // %.Lcontinue
	; GISEL-NEXT: ldr z0, [sp, #1, mul vl] // 16-byte Folded Reload			; GISEL-NEXT: ldr z0, [sp, #1, mul vl] // 16-byte Folded Reload
	Show All 22 Lines
	; GISEL-NEXT: ldr z14, [sp, #11, mul vl] // 16-byte Folded Reload			; GISEL-NEXT: ldr z14, [sp, #11, mul vl] // 16-byte Folded Reload
	; GISEL-NEXT: ldr z13, [sp, #12, mul vl] // 16-byte Folded Reload			; GISEL-NEXT: ldr z13, [sp, #12, mul vl] // 16-byte Folded Reload
	; GISEL-NEXT: ldr z12, [sp, #13, mul vl] // 16-byte Folded Reload			; GISEL-NEXT: ldr z12, [sp, #13, mul vl] // 16-byte Folded Reload
	; GISEL-NEXT: ldr z11, [sp, #14, mul vl] // 16-byte Folded Reload			; GISEL-NEXT: ldr z11, [sp, #14, mul vl] // 16-byte Folded Reload
	; GISEL-NEXT: ldr z10, [sp, #15, mul vl] // 16-byte Folded Reload			; GISEL-NEXT: ldr z10, [sp, #15, mul vl] // 16-byte Folded Reload
	; GISEL-NEXT: ldr z9, [sp, #16, mul vl] // 16-byte Folded Reload			; GISEL-NEXT: ldr z9, [sp, #16, mul vl] // 16-byte Folded Reload
	; GISEL-NEXT: ldr z8, [sp, #17, mul vl] // 16-byte Folded Reload			; GISEL-NEXT: ldr z8, [sp, #17, mul vl] // 16-byte Folded Reload
	; GISEL-NEXT: addvl sp, sp, #18			; GISEL-NEXT: addvl sp, sp, #18
	; GISEL-NEXT: ldp x29, x30, [sp], #16 // 16-byte Folded Reload			; GISEL-NEXT: ldp x30, x28, [sp], #16 // 16-byte Folded Reload
	; GISEL-NEXT: ret			; GISEL-NEXT: ret
	; GISEL-NEXT: .LBB0_2: // %.Lunwind			; GISEL-NEXT: .LBB0_2: // %.Lunwind
	; GISEL-NEXT: .Ltmp2:			; GISEL-NEXT: .Ltmp2:
	; GISEL-NEXT: ldr z0, [sp] // 16-byte Folded Reload			; GISEL-NEXT: ldr z0, [sp] // 16-byte Folded Reload
	; GISEL-NEXT: addvl sp, sp, #2			; GISEL-NEXT: addvl sp, sp, #2
	; GISEL-NEXT: ldr p15, [sp, #4, mul vl] // 2-byte Folded Reload			; GISEL-NEXT: ldr p15, [sp, #4, mul vl] // 2-byte Folded Reload
	; GISEL-NEXT: ldr p14, [sp, #5, mul vl] // 2-byte Folded Reload			; GISEL-NEXT: ldr p14, [sp, #5, mul vl] // 2-byte Folded Reload
	; GISEL-NEXT: ldr p13, [sp, #6, mul vl] // 2-byte Folded Reload			; GISEL-NEXT: ldr p13, [sp, #6, mul vl] // 2-byte Folded Reload
	Show All 18 Lines
	; GISEL-NEXT: ldr z14, [sp, #11, mul vl] // 16-byte Folded Reload			; GISEL-NEXT: ldr z14, [sp, #11, mul vl] // 16-byte Folded Reload
	; GISEL-NEXT: ldr z13, [sp, #12, mul vl] // 16-byte Folded Reload			; GISEL-NEXT: ldr z13, [sp, #12, mul vl] // 16-byte Folded Reload
	; GISEL-NEXT: ldr z12, [sp, #13, mul vl] // 16-byte Folded Reload			; GISEL-NEXT: ldr z12, [sp, #13, mul vl] // 16-byte Folded Reload
	; GISEL-NEXT: ldr z11, [sp, #14, mul vl] // 16-byte Folded Reload			; GISEL-NEXT: ldr z11, [sp, #14, mul vl] // 16-byte Folded Reload
	; GISEL-NEXT: ldr z10, [sp, #15, mul vl] // 16-byte Folded Reload			; GISEL-NEXT: ldr z10, [sp, #15, mul vl] // 16-byte Folded Reload
	; GISEL-NEXT: ldr z9, [sp, #16, mul vl] // 16-byte Folded Reload			; GISEL-NEXT: ldr z9, [sp, #16, mul vl] // 16-byte Folded Reload
	; GISEL-NEXT: ldr z8, [sp, #17, mul vl] // 16-byte Folded Reload			; GISEL-NEXT: ldr z8, [sp, #17, mul vl] // 16-byte Folded Reload
	; GISEL-NEXT: addvl sp, sp, #18			; GISEL-NEXT: addvl sp, sp, #18
	; GISEL-NEXT: ldp x29, x30, [sp], #16 // 16-byte Folded Reload			; GISEL-NEXT: ldp x30, x28, [sp], #16 // 16-byte Folded Reload
	; GISEL-NEXT: ret			; GISEL-NEXT: ret
	%result = invoke <vscale x 4 x i32> @may_throw_sve(<vscale x 4 x i32> %v) to label %.Lcontinue unwind label %.Lunwind			%result = invoke <vscale x 4 x i32> @may_throw_sve(<vscale x 4 x i32> %v) to label %.Lcontinue unwind label %.Lunwind
	.Lcontinue:			.Lcontinue:
	ret <vscale x 4 x i32> %result			ret <vscale x 4 x i32> %result
	.Lunwind:			.Lunwind:
	%lp = landingpad { i8*, i32 } cleanup			%lp = landingpad { i8*, i32 } cleanup
	ret <vscale x 4 x i32> %v;			ret <vscale x 4 x i32> %v;
	}			}
	Show All 11 Lines
	; CHECK-NEXT: stp q23, q22, [sp, #32] // 32-byte Folded Spill			; CHECK-NEXT: stp q23, q22, [sp, #32] // 32-byte Folded Spill
	; CHECK-NEXT: stp q21, q20, [sp, #64] // 32-byte Folded Spill			; CHECK-NEXT: stp q21, q20, [sp, #64] // 32-byte Folded Spill
	; CHECK-NEXT: stp q19, q18, [sp, #96] // 32-byte Folded Spill			; CHECK-NEXT: stp q19, q18, [sp, #96] // 32-byte Folded Spill
	; CHECK-NEXT: stp q17, q16, [sp, #128] // 32-byte Folded Spill			; CHECK-NEXT: stp q17, q16, [sp, #128] // 32-byte Folded Spill
	; CHECK-NEXT: stp q15, q14, [sp, #160] // 32-byte Folded Spill			; CHECK-NEXT: stp q15, q14, [sp, #160] // 32-byte Folded Spill
	; CHECK-NEXT: stp q13, q12, [sp, #192] // 32-byte Folded Spill			; CHECK-NEXT: stp q13, q12, [sp, #192] // 32-byte Folded Spill
	; CHECK-NEXT: stp q11, q10, [sp, #224] // 32-byte Folded Spill			; CHECK-NEXT: stp q11, q10, [sp, #224] // 32-byte Folded Spill
	; CHECK-NEXT: stp q9, q8, [sp, #256] // 32-byte Folded Spill			; CHECK-NEXT: stp q9, q8, [sp, #256] // 32-byte Folded Spill
	; CHECK-NEXT: stp x29, x30, [sp, #288] // 16-byte Folded Spill			; CHECK-NEXT: stp x30, x28, [sp, #288] // 16-byte Folded Spill
	; CHECK-NEXT: .cfi_def_cfa_offset 304			; CHECK-NEXT: .cfi_def_cfa_offset 304
	; CHECK-NEXT: .cfi_offset w30, -8			; CHECK-NEXT: .cfi_offset w28, -8
	; CHECK-NEXT: .cfi_offset w29, -16			; CHECK-NEXT: .cfi_offset w30, -16
	; CHECK-NEXT: .cfi_offset b8, -32			; CHECK-NEXT: .cfi_offset b8, -32
	; CHECK-NEXT: .cfi_offset b9, -48			; CHECK-NEXT: .cfi_offset b9, -48
	; CHECK-NEXT: .cfi_offset b10, -64			; CHECK-NEXT: .cfi_offset b10, -64
	; CHECK-NEXT: .cfi_offset b11, -80			; CHECK-NEXT: .cfi_offset b11, -80
	; CHECK-NEXT: .cfi_offset b12, -96			; CHECK-NEXT: .cfi_offset b12, -96
	; CHECK-NEXT: .cfi_offset b13, -112			; CHECK-NEXT: .cfi_offset b13, -112
	; CHECK-NEXT: .cfi_offset b14, -128			; CHECK-NEXT: .cfi_offset b14, -128
	; CHECK-NEXT: .cfi_offset b15, -144			; CHECK-NEXT: .cfi_offset b15, -144
	; CHECK-NEXT: .cfi_offset b16, -160			; CHECK-NEXT: .cfi_offset b16, -160
	; CHECK-NEXT: .cfi_offset b17, -176			; CHECK-NEXT: .cfi_offset b17, -176
	; CHECK-NEXT: .cfi_offset b18, -192			; CHECK-NEXT: .cfi_offset b18, -192
	; CHECK-NEXT: .cfi_offset b19, -208			; CHECK-NEXT: .cfi_offset b19, -208
	; CHECK-NEXT: .cfi_offset b20, -224			; CHECK-NEXT: .cfi_offset b20, -224
	; CHECK-NEXT: .cfi_offset b21, -240			; CHECK-NEXT: .cfi_offset b21, -240
	; CHECK-NEXT: .cfi_offset b22, -256			; CHECK-NEXT: .cfi_offset b22, -256
	; CHECK-NEXT: .cfi_offset b23, -272			; CHECK-NEXT: .cfi_offset b23, -272
	; CHECK-NEXT: str q0, [sp] // 16-byte Folded Spill			; CHECK-NEXT: str q0, [sp] // 16-byte Folded Spill
	; CHECK-NEXT: .Ltmp3:			; CHECK-NEXT: .Ltmp3:
	; CHECK-NEXT: bl may_throw_neon			; CHECK-NEXT: bl may_throw_neon
	; CHECK-NEXT: .Ltmp4:			; CHECK-NEXT: .Ltmp4:
	; CHECK-NEXT: str q0, [sp, #16] // 16-byte Folded Spill			; CHECK-NEXT: str q0, [sp, #16] // 16-byte Folded Spill
	; CHECK-NEXT: b .LBB1_1			; CHECK-NEXT: b .LBB1_1
	; CHECK-NEXT: .LBB1_1: // %.Lcontinue			; CHECK-NEXT: .LBB1_1: // %.Lcontinue
	; CHECK-NEXT: ldr q0, [sp, #16] // 16-byte Folded Reload			; CHECK-NEXT: ldr q0, [sp, #16] // 16-byte Folded Reload
	; CHECK-NEXT: ldp x29, x30, [sp, #288] // 16-byte Folded Reload			; CHECK-NEXT: ldp x30, x28, [sp, #288] // 16-byte Folded Reload
	; CHECK-NEXT: ldp q9, q8, [sp, #256] // 32-byte Folded Reload			; CHECK-NEXT: ldp q9, q8, [sp, #256] // 32-byte Folded Reload
	; CHECK-NEXT: ldp q11, q10, [sp, #224] // 32-byte Folded Reload			; CHECK-NEXT: ldp q11, q10, [sp, #224] // 32-byte Folded Reload
	; CHECK-NEXT: ldp q13, q12, [sp, #192] // 32-byte Folded Reload			; CHECK-NEXT: ldp q13, q12, [sp, #192] // 32-byte Folded Reload
	; CHECK-NEXT: ldp q15, q14, [sp, #160] // 32-byte Folded Reload			; CHECK-NEXT: ldp q15, q14, [sp, #160] // 32-byte Folded Reload
	; CHECK-NEXT: ldp q17, q16, [sp, #128] // 32-byte Folded Reload			; CHECK-NEXT: ldp q17, q16, [sp, #128] // 32-byte Folded Reload
	; CHECK-NEXT: ldp q19, q18, [sp, #96] // 32-byte Folded Reload			; CHECK-NEXT: ldp q19, q18, [sp, #96] // 32-byte Folded Reload
	; CHECK-NEXT: ldp q21, q20, [sp, #64] // 32-byte Folded Reload			; CHECK-NEXT: ldp q21, q20, [sp, #64] // 32-byte Folded Reload
	; CHECK-NEXT: ldp q23, q22, [sp, #32] // 32-byte Folded Reload			; CHECK-NEXT: ldp q23, q22, [sp, #32] // 32-byte Folded Reload
	; CHECK-NEXT: add sp, sp, #304 // =304			; CHECK-NEXT: add sp, sp, #304 // =304
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	; CHECK-NEXT: .LBB1_2: // %.Lunwind			; CHECK-NEXT: .LBB1_2: // %.Lunwind
	; CHECK-NEXT: .Ltmp5:			; CHECK-NEXT: .Ltmp5:
	; CHECK-NEXT: ldr q0, [sp] // 16-byte Folded Reload			; CHECK-NEXT: ldr q0, [sp] // 16-byte Folded Reload
	; CHECK-NEXT: ldp x29, x30, [sp, #288] // 16-byte Folded Reload			; CHECK-NEXT: ldp x30, x28, [sp, #288] // 16-byte Folded Reload
	; CHECK-NEXT: ldp q9, q8, [sp, #256] // 32-byte Folded Reload			; CHECK-NEXT: ldp q9, q8, [sp, #256] // 32-byte Folded Reload
	; CHECK-NEXT: ldp q11, q10, [sp, #224] // 32-byte Folded Reload			; CHECK-NEXT: ldp q11, q10, [sp, #224] // 32-byte Folded Reload
	; CHECK-NEXT: ldp q13, q12, [sp, #192] // 32-byte Folded Reload			; CHECK-NEXT: ldp q13, q12, [sp, #192] // 32-byte Folded Reload
	; CHECK-NEXT: ldp q15, q14, [sp, #160] // 32-byte Folded Reload			; CHECK-NEXT: ldp q15, q14, [sp, #160] // 32-byte Folded Reload
	; CHECK-NEXT: ldp q17, q16, [sp, #128] // 32-byte Folded Reload			; CHECK-NEXT: ldp q17, q16, [sp, #128] // 32-byte Folded Reload
	; CHECK-NEXT: ldp q19, q18, [sp, #96] // 32-byte Folded Reload			; CHECK-NEXT: ldp q19, q18, [sp, #96] // 32-byte Folded Reload
	; CHECK-NEXT: ldp q21, q20, [sp, #64] // 32-byte Folded Reload			; CHECK-NEXT: ldp q21, q20, [sp, #64] // 32-byte Folded Reload
	; CHECK-NEXT: ldp q23, q22, [sp, #32] // 32-byte Folded Reload			; CHECK-NEXT: ldp q23, q22, [sp, #32] // 32-byte Folded Reload
	; CHECK-NEXT: add sp, sp, #304 // =304			; CHECK-NEXT: add sp, sp, #304 // =304
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	;			;
	; GISEL-LABEL: invoke_callee_may_throw_neon:			; GISEL-LABEL: invoke_callee_may_throw_neon:
	; GISEL: .Lfunc_begin1:			; GISEL: .Lfunc_begin1:
	; GISEL-NEXT: .cfi_startproc			; GISEL-NEXT: .cfi_startproc
	; GISEL-NEXT: // %bb.0:			; GISEL-NEXT: // %bb.0:
	; GISEL-NEXT: sub sp, sp, #304 // =304			; GISEL-NEXT: sub sp, sp, #304 // =304
	; GISEL-NEXT: stp q23, q22, [sp, #32] // 32-byte Folded Spill			; GISEL-NEXT: stp q23, q22, [sp, #32] // 32-byte Folded Spill
	; GISEL-NEXT: stp q21, q20, [sp, #64] // 32-byte Folded Spill			; GISEL-NEXT: stp q21, q20, [sp, #64] // 32-byte Folded Spill
	; GISEL-NEXT: stp q19, q18, [sp, #96] // 32-byte Folded Spill			; GISEL-NEXT: stp q19, q18, [sp, #96] // 32-byte Folded Spill
	; GISEL-NEXT: stp q17, q16, [sp, #128] // 32-byte Folded Spill			; GISEL-NEXT: stp q17, q16, [sp, #128] // 32-byte Folded Spill
	; GISEL-NEXT: stp q15, q14, [sp, #160] // 32-byte Folded Spill			; GISEL-NEXT: stp q15, q14, [sp, #160] // 32-byte Folded Spill
	; GISEL-NEXT: stp q13, q12, [sp, #192] // 32-byte Folded Spill			; GISEL-NEXT: stp q13, q12, [sp, #192] // 32-byte Folded Spill
	; GISEL-NEXT: stp q11, q10, [sp, #224] // 32-byte Folded Spill			; GISEL-NEXT: stp q11, q10, [sp, #224] // 32-byte Folded Spill
	; GISEL-NEXT: stp q9, q8, [sp, #256] // 32-byte Folded Spill			; GISEL-NEXT: stp q9, q8, [sp, #256] // 32-byte Folded Spill
	; GISEL-NEXT: stp x29, x30, [sp, #288] // 16-byte Folded Spill			; GISEL-NEXT: stp x30, x28, [sp, #288] // 16-byte Folded Spill
	; GISEL-NEXT: .cfi_def_cfa_offset 304			; GISEL-NEXT: .cfi_def_cfa_offset 304
	; GISEL-NEXT: .cfi_offset w30, -8			; GISEL-NEXT: .cfi_offset w28, -8
	; GISEL-NEXT: .cfi_offset w29, -16			; GISEL-NEXT: .cfi_offset w30, -16
	; GISEL-NEXT: .cfi_offset b8, -32			; GISEL-NEXT: .cfi_offset b8, -32
	; GISEL-NEXT: .cfi_offset b9, -48			; GISEL-NEXT: .cfi_offset b9, -48
	; GISEL-NEXT: .cfi_offset b10, -64			; GISEL-NEXT: .cfi_offset b10, -64
	; GISEL-NEXT: .cfi_offset b11, -80			; GISEL-NEXT: .cfi_offset b11, -80
	; GISEL-NEXT: .cfi_offset b12, -96			; GISEL-NEXT: .cfi_offset b12, -96
	; GISEL-NEXT: .cfi_offset b13, -112			; GISEL-NEXT: .cfi_offset b13, -112
	; GISEL-NEXT: .cfi_offset b14, -128			; GISEL-NEXT: .cfi_offset b14, -128
	; GISEL-NEXT: .cfi_offset b15, -144			; GISEL-NEXT: .cfi_offset b15, -144
	; GISEL-NEXT: .cfi_offset b16, -160			; GISEL-NEXT: .cfi_offset b16, -160
	; GISEL-NEXT: .cfi_offset b17, -176			; GISEL-NEXT: .cfi_offset b17, -176
	; GISEL-NEXT: .cfi_offset b18, -192			; GISEL-NEXT: .cfi_offset b18, -192
	; GISEL-NEXT: .cfi_offset b19, -208			; GISEL-NEXT: .cfi_offset b19, -208
	; GISEL-NEXT: .cfi_offset b20, -224			; GISEL-NEXT: .cfi_offset b20, -224
	; GISEL-NEXT: .cfi_offset b21, -240			; GISEL-NEXT: .cfi_offset b21, -240
	; GISEL-NEXT: .cfi_offset b22, -256			; GISEL-NEXT: .cfi_offset b22, -256
	; GISEL-NEXT: .cfi_offset b23, -272			; GISEL-NEXT: .cfi_offset b23, -272
	; GISEL-NEXT: str q0, [sp] // 16-byte Folded Spill			; GISEL-NEXT: str q0, [sp] // 16-byte Folded Spill
	; GISEL-NEXT: .Ltmp3:			; GISEL-NEXT: .Ltmp3:
	; GISEL-NEXT: bl may_throw_neon			; GISEL-NEXT: bl may_throw_neon
	; GISEL-NEXT: str q0, [sp, #16] // 16-byte Folded Spill			; GISEL-NEXT: str q0, [sp, #16] // 16-byte Folded Spill
	; GISEL-NEXT: .Ltmp4:			; GISEL-NEXT: .Ltmp4:
	; GISEL-NEXT: // %bb.1: // %.Lcontinue			; GISEL-NEXT: // %bb.1: // %.Lcontinue
	; GISEL-NEXT: ldr q0, [sp, #16] // 16-byte Folded Reload			; GISEL-NEXT: ldr q0, [sp, #16] // 16-byte Folded Reload
	; GISEL-NEXT: ldp x29, x30, [sp, #288] // 16-byte Folded Reload			; GISEL-NEXT: ldp x30, x28, [sp, #288] // 16-byte Folded Reload
	; GISEL-NEXT: ldp q9, q8, [sp, #256] // 32-byte Folded Reload			; GISEL-NEXT: ldp q9, q8, [sp, #256] // 32-byte Folded Reload
	; GISEL-NEXT: ldp q11, q10, [sp, #224] // 32-byte Folded Reload			; GISEL-NEXT: ldp q11, q10, [sp, #224] // 32-byte Folded Reload
	; GISEL-NEXT: ldp q13, q12, [sp, #192] // 32-byte Folded Reload			; GISEL-NEXT: ldp q13, q12, [sp, #192] // 32-byte Folded Reload
	; GISEL-NEXT: ldp q15, q14, [sp, #160] // 32-byte Folded Reload			; GISEL-NEXT: ldp q15, q14, [sp, #160] // 32-byte Folded Reload
	; GISEL-NEXT: ldp q17, q16, [sp, #128] // 32-byte Folded Reload			; GISEL-NEXT: ldp q17, q16, [sp, #128] // 32-byte Folded Reload
	; GISEL-NEXT: ldp q19, q18, [sp, #96] // 32-byte Folded Reload			; GISEL-NEXT: ldp q19, q18, [sp, #96] // 32-byte Folded Reload
	; GISEL-NEXT: ldp q21, q20, [sp, #64] // 32-byte Folded Reload			; GISEL-NEXT: ldp q21, q20, [sp, #64] // 32-byte Folded Reload
	; GISEL-NEXT: ldp q23, q22, [sp, #32] // 32-byte Folded Reload			; GISEL-NEXT: ldp q23, q22, [sp, #32] // 32-byte Folded Reload
	; GISEL-NEXT: add sp, sp, #304 // =304			; GISEL-NEXT: add sp, sp, #304 // =304
	; GISEL-NEXT: ret			; GISEL-NEXT: ret
	; GISEL-NEXT: .LBB1_2: // %.Lunwind			; GISEL-NEXT: .LBB1_2: // %.Lunwind
	; GISEL-NEXT: .Ltmp5:			; GISEL-NEXT: .Ltmp5:
	; GISEL-NEXT: ldr q0, [sp] // 16-byte Folded Reload			; GISEL-NEXT: ldr q0, [sp] // 16-byte Folded Reload
	; GISEL-NEXT: ldp x29, x30, [sp, #288] // 16-byte Folded Reload			; GISEL-NEXT: ldp x30, x28, [sp, #288] // 16-byte Folded Reload
	; GISEL-NEXT: ldp q9, q8, [sp, #256] // 32-byte Folded Reload			; GISEL-NEXT: ldp q9, q8, [sp, #256] // 32-byte Folded Reload
	; GISEL-NEXT: ldp q11, q10, [sp, #224] // 32-byte Folded Reload			; GISEL-NEXT: ldp q11, q10, [sp, #224] // 32-byte Folded Reload
	; GISEL-NEXT: ldp q13, q12, [sp, #192] // 32-byte Folded Reload			; GISEL-NEXT: ldp q13, q12, [sp, #192] // 32-byte Folded Reload
	; GISEL-NEXT: ldp q15, q14, [sp, #160] // 32-byte Folded Reload			; GISEL-NEXT: ldp q15, q14, [sp, #160] // 32-byte Folded Reload
	; GISEL-NEXT: ldp q17, q16, [sp, #128] // 32-byte Folded Reload			; GISEL-NEXT: ldp q17, q16, [sp, #128] // 32-byte Folded Reload
	; GISEL-NEXT: ldp q19, q18, [sp, #96] // 32-byte Folded Reload			; GISEL-NEXT: ldp q19, q18, [sp, #96] // 32-byte Folded Reload
	; GISEL-NEXT: ldp q21, q20, [sp, #64] // 32-byte Folded Reload			; GISEL-NEXT: ldp q21, q20, [sp, #64] // 32-byte Folded Reload
	; GISEL-NEXT: ldp q23, q22, [sp, #32] // 32-byte Folded Reload			; GISEL-NEXT: ldp q23, q22, [sp, #32] // 32-byte Folded Reload
	Show All 11 Lines

This is an archive of the discontinued LLVM Phabricator instance.

[AArch64][SVE] Ensure hasFP has a consistent return valueAbandonedPublic

Details

Diff Detail

Unit TestsFailed

Event Timeline

Revision Contents

Diff 327417

llvm/include/llvm/CodeGen/TargetFrameLowering.h

llvm/lib/CodeGen/PrologEpilogInserter.cpp

llvm/lib/Target/AArch64/AArch64FrameLowering.h

llvm/lib/Target/AArch64/AArch64FrameLowering.cpp

llvm/lib/Target/AArch64/AArch64MachineFunctionInfo.h

llvm/lib/Target/AArch64/AArch64RegisterInfo.cpp

llvm/test/CodeGen/AArch64/debug-info-sve-dbg-value.mir

llvm/test/CodeGen/AArch64/framelayout-sve-calleesaves-fix.mir

llvm/test/CodeGen/AArch64/framelayout-sve.ll

llvm/test/CodeGen/AArch64/framelayout-sve.mir

llvm/test/CodeGen/AArch64/named-vector-shuffle-reverse-sve.ll

llvm/test/CodeGen/AArch64/split-vector-insert.ll

llvm/test/CodeGen/AArch64/sve-calling-convention-mixed.ll

llvm/test/CodeGen/AArch64/sve-extract-vector.ll

llvm/test/CodeGen/AArch64/sve-insert-vector.ll

llvm/test/CodeGen/AArch64/sve-pred-arith.ll

llvm/test/CodeGen/AArch64/sve-split-extract-elt.ll

llvm/test/CodeGen/AArch64/sve-split-insert-elt.ll

llvm/test/CodeGen/AArch64/sve-split-int-pred-reduce.ll

llvm/test/CodeGen/AArch64/sve-tailcall.ll

llvm/test/CodeGen/AArch64/sve-trunc.ll

llvm/test/CodeGen/AArch64/unwind-preserved.ll

[AArch64][SVE] Ensure hasFP has a consistent return value
AbandonedPublic