Diff 219708

lib/Target/RISCV/RISCVFrameLowering.cpp

Show First 20 Lines • Show All 57 Lines • ▼ Show 20 Lines	void RISCVFrameLowering::determineFrameLayout(MachineFunction &MF) const {
MFI.setStackSize(FrameSize);		MFI.setStackSize(FrameSize);
}		}

void RISCVFrameLowering::adjustReg(MachineBasicBlock &MBB,		void RISCVFrameLowering::adjustReg(MachineBasicBlock &MBB,
MachineBasicBlock::iterator MBBI,		MachineBasicBlock::iterator MBBI,
const DebugLoc &DL, Register DestReg,		const DebugLoc &DL, Register DestReg,
Register SrcReg, int64_t Val,		Register SrcReg, int64_t Val,
MachineInstr::MIFlag Flag) const {		MachineInstr::MIFlag Flag) const {
MachineRegisterInfo &MRI = MBB.getParent()->getRegInfo();
const RISCVInstrInfo *TII = STI.getInstrInfo();		const RISCVInstrInfo *TII = STI.getInstrInfo();

if (DestReg == SrcReg && Val == 0)		if (DestReg == SrcReg && Val == 0)
return;		return;

if (isInt<12>(Val)) {		if (isInt<12>(Val)) {
BuildMI(MBB, MBBI, DL, TII->get(RISCV::ADDI), DestReg)		BuildMI(MBB, MBBI, DL, TII->get(RISCV::ADDI), DestReg)
.addReg(SrcReg)		.addReg(SrcReg)
.addImm(Val)		.addImm(Val)
.setMIFlag(Flag);		.setMIFlag(Flag);
} else if (isInt<32>(Val)) {		} else {
unsigned Opc = RISCV::ADD;		unsigned Opc = RISCV::ADD;
bool isSub = Val < 0;		bool isSub = Val < 0;
if (isSub) {		if (isSub) {
Val = -Val;		Val = -Val;
Opc = RISCV::SUB;		Opc = RISCV::SUB;
}		}

Register ScratchReg = MRI.createVirtualRegister(&RISCV::GPRRegClass);		Register ScratchReg = TII->getTempReg(MBB.getParent(), Flag);
TII->movImm32(MBB, MBBI, DL, ScratchReg, Val, Flag);		TII->movImm(MBB, MBBI, DL, ScratchReg, Val, Flag);
BuildMI(MBB, MBBI, DL, TII->get(Opc), DestReg)		BuildMI(MBB, MBBI, DL, TII->get(Opc), DestReg)
.addReg(SrcReg)		.addReg(SrcReg)
.addReg(ScratchReg, RegState::Kill)		.addReg(ScratchReg, RegState::Kill)
		lenaryUnsubmitted Not Done Reply Inline Actions I think you can probably get rid of `movImm32`, and only use movImm64 (the logic in `generateInstSeq` covers 32-bit operands), which I think will address the TODO in `movImm32`. Then my only worry would be how we error when we need a larger-than-32-bit offset on RISC-V 32, which would probably cause errors somewhere way before this code anyway. lenary: I think you can probably get rid of `movImm32`, and only use movImm64 (the logic in…
		shiva0217AuthorUnsubmitted Done Reply Inline Actions Yes, there's some test case improvement by replacing movImm32 with the generateInstSeq one, thanks! I would add an error message for RV32 with a larger-than-32-bit offset. We could update the message when we support a larger-than-32-bit offset in RV32. shiva0217: Yes, there's some test case improvement by replacing movImm32 with the generateInstSeq one…
.setMIFlag(Flag);		.setMIFlag(Flag);
} else {
report_fatal_error("adjustReg cannot yet handle adjustments >32 bits");
}		}
}		}

// Returns the register used to hold the frame pointer.		// Returns the register used to hold the frame pointer.
static Register getFPReg(const RISCVSubtarget &STI) { return RISCV::X8; }		static Register getFPReg(const RISCVSubtarget &STI) { return RISCV::X8; }

// Returns the register used to hold the stack pointer.		// Returns the register used to hold the stack pointer.
static Register getSPReg(const RISCVSubtarget &STI) { return RISCV::X2; }		static Register getSPReg(const RISCVSubtarget &STI) { return RISCV::X2; }
▲ Show 20 Lines • Show All 308 Lines • Show Last 20 Lines

lib/Target/RISCV/RISCVInstrInfo.h

Show All 40 Lines	void storeRegToStackSlot(MachineBasicBlock &MBB,
const TargetRegisterClass *RC,		const TargetRegisterClass *RC,
const TargetRegisterInfo *TRI) const override;		const TargetRegisterInfo *TRI) const override;

void loadRegFromStackSlot(MachineBasicBlock &MBB,		void loadRegFromStackSlot(MachineBasicBlock &MBB,
MachineBasicBlock::iterator MBBI, unsigned DstReg,		MachineBasicBlock::iterator MBBI, unsigned DstReg,
int FrameIndex, const TargetRegisterClass *RC,		int FrameIndex, const TargetRegisterClass *RC,
const TargetRegisterInfo *TRI) const override;		const TargetRegisterInfo *TRI) const override;

// Materializes the given int32 Val into DstReg.		Register getTempReg(MachineFunction *MF, MachineInstr::MIFlag Flag) const;
void movImm32(MachineBasicBlock &MBB, MachineBasicBlock::iterator MBBI,
		// Materializes the given integer Val into DstReg.
		void movImm(MachineBasicBlock &MBB, MachineBasicBlock::iterator MBBI,
const DebugLoc &DL, Register DstReg, uint64_t Val,		const DebugLoc &DL, Register DstReg, uint64_t Val,
MachineInstr::MIFlag Flag = MachineInstr::NoFlags) const;		MachineInstr::MIFlag Flag = MachineInstr::NoFlags) const;

unsigned getInstSizeInBytes(const MachineInstr &MI) const override;		unsigned getInstSizeInBytes(const MachineInstr &MI) const override;

bool analyzeBranch(MachineBasicBlock &MBB, MachineBasicBlock *&TBB,		bool analyzeBranch(MachineBasicBlock &MBB, MachineBasicBlock *&TBB,
MachineBasicBlock *&FBB,		MachineBasicBlock *&FBB,
SmallVectorImpl<MachineOperand> &Cond,		SmallVectorImpl<MachineOperand> &Cond,
bool AllowModify) const override;		bool AllowModify) const override;

Show All 25 Lines

lib/Target/RISCV/RISCVInstrInfo.cpp

//===-- RISCVInstrInfo.cpp - RISCV Instruction Information ------- C++ --===//		//===-- RISCVInstrInfo.cpp - RISCV Instruction Information ------- C++ --===//
//		//
// Part of the LLVM Project, under the Apache License v2.0 with LLVM Exceptions.		// Part of the LLVM Project, under the Apache License v2.0 with LLVM Exceptions.
// See https://llvm.org/LICENSE.txt for license information.		// See https://llvm.org/LICENSE.txt for license information.
// SPDX-License-Identifier: Apache-2.0 WITH LLVM-exception		// SPDX-License-Identifier: Apache-2.0 WITH LLVM-exception
//		//
//===----------------------------------------------------------------------===//		//===----------------------------------------------------------------------===//
//		//
// This file contains the RISCV implementation of the TargetInstrInfo class.		// This file contains the RISCV implementation of the TargetInstrInfo class.
//		//
//===----------------------------------------------------------------------===//		//===----------------------------------------------------------------------===//

#include "RISCVInstrInfo.h"		#include "RISCVInstrInfo.h"
#include "RISCV.h"		#include "RISCV.h"
#include "RISCVSubtarget.h"		#include "RISCVSubtarget.h"
#include "RISCVTargetMachine.h"		#include "RISCVTargetMachine.h"
		#include "Utils/RISCVMatInt.h"
#include "llvm/ADT/STLExtras.h"		#include "llvm/ADT/STLExtras.h"
#include "llvm/ADT/SmallVector.h"		#include "llvm/ADT/SmallVector.h"
#include "llvm/CodeGen/MachineFunctionPass.h"		#include "llvm/CodeGen/MachineFunctionPass.h"
#include "llvm/CodeGen/MachineInstrBuilder.h"		#include "llvm/CodeGen/MachineInstrBuilder.h"
#include "llvm/CodeGen/MachineRegisterInfo.h"		#include "llvm/CodeGen/MachineRegisterInfo.h"
#include "llvm/CodeGen/RegisterScavenging.h"		#include "llvm/CodeGen/RegisterScavenging.h"
#include "llvm/Support/ErrorHandling.h"		#include "llvm/Support/ErrorHandling.h"
#include "llvm/Support/TargetRegistry.h"		#include "llvm/Support/TargetRegistry.h"
▲ Show 20 Lines • Show All 126 Lines • ▼ Show 20 Lines	void RISCVInstrInfo::loadRegFromStackSlot(MachineBasicBlock &MBB,
else if (RISCV::FPR64RegClass.hasSubClassEq(RC))		else if (RISCV::FPR64RegClass.hasSubClassEq(RC))
Opcode = RISCV::FLD;		Opcode = RISCV::FLD;
else		else
llvm_unreachable("Can't load this register from stack slot");		llvm_unreachable("Can't load this register from stack slot");

BuildMI(MBB, I, DL, get(Opcode), DstReg).addFrameIndex(FI).addImm(0);		BuildMI(MBB, I, DL, get(Opcode), DstReg).addFrameIndex(FI).addImm(0);
}		}

void RISCVInstrInfo::movImm32(MachineBasicBlock &MBB,		Register RISCVInstrInfo::getTempReg(MachineFunction *MF,
MachineBasicBlock::iterator MBBI,
const DebugLoc &DL, Register DstReg, uint64_t Val,
MachineInstr::MIFlag Flag) const {		MachineInstr::MIFlag Flag) const {
assert(isInt<32>(Val) && "Can only materialize 32-bit constants");		MachineRegisterInfo &MRI = MF->getRegInfo();
		const MachineFrameInfo &MFI = MF->getFrameInfo();
		unsigned TempReg;

// TODO: If the value can be materialized using only one instruction, only		// We can use T1 as temp register if the instructions are for FrameSetup or
// insert a single instruction.		// FrameDestroy and there is no shrink wrap optimization occur.
		if (((Flag == MachineInstr::FrameSetup) && (MFI.getSavePoint() == nullptr)) \|\|
		((Flag == MachineInstr::FrameDestroy) &&
		(MFI.getRestorePoint() == nullptr))) {
		TempReg = RISCV::X6;
		} else {
		TempReg = MRI.createVirtualRegister(&RISCV::GPRRegClass);
		}

uint64_t Hi20 = ((Val + 0x800) >> 12) & 0xfffff;		return TempReg;
uint64_t Lo12 = SignExtend64<12>(Val);		}
BuildMI(MBB, MBBI, DL, get(RISCV::LUI), DstReg)
.addImm(Hi20)		void RISCVInstrInfo::movImm(MachineBasicBlock &MBB,
		MachineBasicBlock::iterator MBBI,
		const DebugLoc &DL, Register DstReg, uint64_t Val,
		MachineInstr::MIFlag Flag) const {
		MachineFunction *MF = MBB.getParent();
		bool IsRV64 = MF->getSubtarget<RISCVSubtarget>().is64Bit();
		Register SrcReg = RISCV::X0;
		Register Result = getTempReg(MF, Flag);
		unsigned Num = 0;

		if (!IsRV64 && !isInt<32>(Val))
		report_fatal_error("Should only materialize 32-bit constants for RV32");

		RISCVMatInt::InstSeq Seq;
		RISCVMatInt::generateInstSeq(Val, IsRV64, Seq);
		assert(Seq.size() > 0);

		for (RISCVMatInt::Inst &Inst : Seq) {
		// Write the final result to DstReg if it's the last instruction in the Seq.
		// Otherwise, write the result to the temp register.
		if (++Num == Seq.size())
		Result = DstReg;

		if (Inst.Opc == RISCV::LUI) {
		BuildMI(MBB, MBBI, DL, get(RISCV::LUI), Result)
		.addImm(Inst.Imm)
.setMIFlag(Flag);		.setMIFlag(Flag);
BuildMI(MBB, MBBI, DL, get(RISCV::ADDI), DstReg)		} else {
.addReg(DstReg, RegState::Kill)		BuildMI(MBB, MBBI, DL, get(Inst.Opc), Result)
.addImm(Lo12)		.addReg(SrcReg, RegState::Kill)
		.addImm(Inst.Imm)
.setMIFlag(Flag);		.setMIFlag(Flag);
}		}
		// Only the first instruction has X0 as its source.
		SrcReg = Result;
		}
		}

// The contents of values added to Cond are not examined outside of		// The contents of values added to Cond are not examined outside of
// RISCVInstrInfo, giving us flexibility in what to push to it. For RISCV, we		// RISCVInstrInfo, giving us flexibility in what to push to it. For RISCV, we
// push BranchOpcode, Reg1, Reg2.		// push BranchOpcode, Reg1, Reg2.
static void parseCondBranch(MachineInstr &LastInst, MachineBasicBlock *&Target,		static void parseCondBranch(MachineInstr &LastInst, MachineBasicBlock *&Target,
SmallVectorImpl<MachineOperand> &Cond) {		SmallVectorImpl<MachineOperand> &Cond) {
// Block ends with fall-through condbranch.		// Block ends with fall-through condbranch.
assert(LastInst.getDesc().isConditionalBranch() &&		assert(LastInst.getDesc().isConditionalBranch() &&
▲ Show 20 Lines • Show All 283 Lines • Show Last 20 Lines

lib/Target/RISCV/RISCVRegisterInfo.cpp

Show First 20 Lines • Show All 104 Lines • ▼ Show 20 Lines	void RISCVRegisterInfo::eliminateFrameIndex(MachineBasicBlock::iterator II,
MachineBasicBlock &MBB = *MI.getParent();		MachineBasicBlock &MBB = *MI.getParent();
bool FrameRegIsKill = false;		bool FrameRegIsKill = false;

if (!isInt<12>(Offset)) {		if (!isInt<12>(Offset)) {
assert(isInt<32>(Offset) && "Int32 expected");		assert(isInt<32>(Offset) && "Int32 expected");
// The offset won't fit in an immediate, so use a scratch register instead		// The offset won't fit in an immediate, so use a scratch register instead
// Modify Offset and FrameReg appropriately		// Modify Offset and FrameReg appropriately
Register ScratchReg = MRI.createVirtualRegister(&RISCV::GPRRegClass);		Register ScratchReg = MRI.createVirtualRegister(&RISCV::GPRRegClass);
TII->movImm32(MBB, II, DL, ScratchReg, Offset);		TII->movImm(MBB, II, DL, ScratchReg, Offset);
BuildMI(MBB, II, DL, TII->get(RISCV::ADD), ScratchReg)		BuildMI(MBB, II, DL, TII->get(RISCV::ADD), ScratchReg)
.addReg(FrameReg)		.addReg(FrameReg)
.addReg(ScratchReg, RegState::Kill);		.addReg(ScratchReg, RegState::Kill);
Offset = 0;		Offset = 0;
FrameReg = ScratchReg;		FrameReg = ScratchReg;
FrameRegIsKill = true;		FrameRegIsKill = true;
}		}

Show All 36 Lines

test/CodeGen/RISCV/large-stack.ll

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: llc -mtriple=riscv32 -verify-machineinstrs < %s \			; RUN: llc -mtriple=riscv32 -verify-machineinstrs < %s \
	; RUN: \| FileCheck -check-prefix=RV32I-FPELIM %s			; RUN: \| FileCheck -check-prefix=RV32I-FPELIM %s
	; RUN: llc -mtriple=riscv32 -verify-machineinstrs -frame-pointer=all < %s \			; RUN: llc -mtriple=riscv32 -verify-machineinstrs -frame-pointer=all < %s \
	; RUN: \| FileCheck -check-prefix=RV32I-WITHFP %s			; RUN: \| FileCheck -check-prefix=RV32I-WITHFP %s

	; TODO: the quality of the generated code is poor			; TODO: the quality of the generated code is poor

	define void @test() nounwind {			define void @test() nounwind {
	; RV32I-FPELIM-LABEL: test:			; RV32I-FPELIM-LABEL: test:
	; RV32I-FPELIM: # %bb.0:			; RV32I-FPELIM: # %bb.0:
	; RV32I-FPELIM-NEXT: lui a0, 74565			; RV32I-FPELIM-NEXT: lui t1, 74565
	; RV32I-FPELIM-NEXT: addi a0, a0, 1664			; RV32I-FPELIM-NEXT: addi t1, t1, 1664
	; RV32I-FPELIM-NEXT: sub sp, sp, a0			; RV32I-FPELIM-NEXT: sub sp, sp, t1
	; RV32I-FPELIM-NEXT: lui a0, 74565			; RV32I-FPELIM-NEXT: lui t1, 74565
	; RV32I-FPELIM-NEXT: addi a0, a0, 1664			; RV32I-FPELIM-NEXT: addi t1, t1, 1664
	; RV32I-FPELIM-NEXT: add sp, sp, a0			; RV32I-FPELIM-NEXT: add sp, sp, t1
	; RV32I-FPELIM-NEXT: ret			; RV32I-FPELIM-NEXT: ret
	;			;
	; RV32I-WITHFP-LABEL: test:			; RV32I-WITHFP-LABEL: test:
	; RV32I-WITHFP: # %bb.0:			; RV32I-WITHFP: # %bb.0:
	; RV32I-WITHFP-NEXT: lui a0, 74565			; RV32I-WITHFP-NEXT: lui t1, 74565
	; RV32I-WITHFP-NEXT: addi a0, a0, 1680			; RV32I-WITHFP-NEXT: addi t1, t1, 1680
	; RV32I-WITHFP-NEXT: sub sp, sp, a0			; RV32I-WITHFP-NEXT: sub sp, sp, t1
	; RV32I-WITHFP-NEXT: lui a0, 74565			; RV32I-WITHFP-NEXT: lui a0, 74565
	; RV32I-WITHFP-NEXT: addi a0, a0, 1676			; RV32I-WITHFP-NEXT: addi a0, a0, 1676
	; RV32I-WITHFP-NEXT: add a0, sp, a0			; RV32I-WITHFP-NEXT: add a0, sp, a0
	; RV32I-WITHFP-NEXT: sw ra, 0(a0)			; RV32I-WITHFP-NEXT: sw ra, 0(a0)
	; RV32I-WITHFP-NEXT: lui a0, 74565			; RV32I-WITHFP-NEXT: lui a0, 74565
	; RV32I-WITHFP-NEXT: addi a0, a0, 1672			; RV32I-WITHFP-NEXT: addi a0, a0, 1672
	; RV32I-WITHFP-NEXT: add a0, sp, a0			; RV32I-WITHFP-NEXT: add a0, sp, a0
	; RV32I-WITHFP-NEXT: sw s0, 0(a0)			; RV32I-WITHFP-NEXT: sw s0, 0(a0)
	; RV32I-WITHFP-NEXT: lui a0, 74565			; RV32I-WITHFP-NEXT: lui t1, 74565
	; RV32I-WITHFP-NEXT: addi a0, a0, 1680			; RV32I-WITHFP-NEXT: addi t1, t1, 1680
	; RV32I-WITHFP-NEXT: add s0, sp, a0			; RV32I-WITHFP-NEXT: add s0, sp, t1
	; RV32I-WITHFP-NEXT: lui a0, 74565			; RV32I-WITHFP-NEXT: lui a0, 74565
	; RV32I-WITHFP-NEXT: addi a0, a0, 1672			; RV32I-WITHFP-NEXT: addi a0, a0, 1672
	; RV32I-WITHFP-NEXT: add a0, sp, a0			; RV32I-WITHFP-NEXT: add a0, sp, a0
	; RV32I-WITHFP-NEXT: lw s0, 0(a0)			; RV32I-WITHFP-NEXT: lw s0, 0(a0)
	; RV32I-WITHFP-NEXT: lui a0, 74565			; RV32I-WITHFP-NEXT: lui a0, 74565
	; RV32I-WITHFP-NEXT: addi a0, a0, 1676			; RV32I-WITHFP-NEXT: addi a0, a0, 1676
	; RV32I-WITHFP-NEXT: add a0, sp, a0			; RV32I-WITHFP-NEXT: add a0, sp, a0
	; RV32I-WITHFP-NEXT: lw ra, 0(a0)			; RV32I-WITHFP-NEXT: lw ra, 0(a0)
	; RV32I-WITHFP-NEXT: lui a0, 74565			; RV32I-WITHFP-NEXT: lui t1, 74565
	; RV32I-WITHFP-NEXT: addi a0, a0, 1680			; RV32I-WITHFP-NEXT: addi t1, t1, 1680
	; RV32I-WITHFP-NEXT: add sp, sp, a0			; RV32I-WITHFP-NEXT: add sp, sp, t1
	; RV32I-WITHFP-NEXT: ret			; RV32I-WITHFP-NEXT: ret
	%tmp = alloca [ 305419896 x i8 ] , align 4			%tmp = alloca [ 305419896 x i8 ] , align 4
	ret void			ret void
	}			}

	; This test case artificially produces register pressure which should force			; This test case artificially produces register pressure which should force
	; use of the emergency spill slot.			; use of the emergency spill slot.

	define void @test_emergency_spill_slot(i32 %a) nounwind {			define void @test_emergency_spill_slot(i32 %a) nounwind {
	; RV32I-FPELIM-LABEL: test_emergency_spill_slot:			; RV32I-FPELIM-LABEL: test_emergency_spill_slot:
	; RV32I-FPELIM: # %bb.0:			; RV32I-FPELIM: # %bb.0:
	; RV32I-FPELIM-NEXT: lui a1, 98			; RV32I-FPELIM-NEXT: lui t1, 98
	; RV32I-FPELIM-NEXT: addi a1, a1, -1392			; RV32I-FPELIM-NEXT: addi t1, t1, -1392
	; RV32I-FPELIM-NEXT: sub sp, sp, a1			; RV32I-FPELIM-NEXT: sub sp, sp, t1
	; RV32I-FPELIM-NEXT: lui a1, 98			; RV32I-FPELIM-NEXT: lui a1, 98
	; RV32I-FPELIM-NEXT: addi a1, a1, -1396			; RV32I-FPELIM-NEXT: addi a1, a1, -1396
	; RV32I-FPELIM-NEXT: add a1, sp, a1			; RV32I-FPELIM-NEXT: add a1, sp, a1
	; RV32I-FPELIM-NEXT: sw s0, 0(a1)			; RV32I-FPELIM-NEXT: sw s0, 0(a1)
	; RV32I-FPELIM-NEXT: lui a1, 98			; RV32I-FPELIM-NEXT: lui a1, 98
	; RV32I-FPELIM-NEXT: addi a1, a1, -1400			; RV32I-FPELIM-NEXT: addi a1, a1, -1400
	; RV32I-FPELIM-NEXT: add a1, sp, a1			; RV32I-FPELIM-NEXT: add a1, sp, a1
	; RV32I-FPELIM-NEXT: sw s1, 0(a1)			; RV32I-FPELIM-NEXT: sw s1, 0(a1)
	Show All 11 Lines
	; RV32I-FPELIM-NEXT: lui a0, 98			; RV32I-FPELIM-NEXT: lui a0, 98
	; RV32I-FPELIM-NEXT: addi a0, a0, -1400			; RV32I-FPELIM-NEXT: addi a0, a0, -1400
	; RV32I-FPELIM-NEXT: add a0, sp, a0			; RV32I-FPELIM-NEXT: add a0, sp, a0
	; RV32I-FPELIM-NEXT: lw s1, 0(a0)			; RV32I-FPELIM-NEXT: lw s1, 0(a0)
	; RV32I-FPELIM-NEXT: lui a0, 98			; RV32I-FPELIM-NEXT: lui a0, 98
	; RV32I-FPELIM-NEXT: addi a0, a0, -1396			; RV32I-FPELIM-NEXT: addi a0, a0, -1396
	; RV32I-FPELIM-NEXT: add a0, sp, a0			; RV32I-FPELIM-NEXT: add a0, sp, a0
	; RV32I-FPELIM-NEXT: lw s0, 0(a0)			; RV32I-FPELIM-NEXT: lw s0, 0(a0)
	; RV32I-FPELIM-NEXT: lui a0, 98			; RV32I-FPELIM-NEXT: lui t1, 98
	; RV32I-FPELIM-NEXT: addi a0, a0, -1392			; RV32I-FPELIM-NEXT: addi t1, t1, -1392
	; RV32I-FPELIM-NEXT: add sp, sp, a0			; RV32I-FPELIM-NEXT: add sp, sp, t1
	; RV32I-FPELIM-NEXT: ret			; RV32I-FPELIM-NEXT: ret
	;			;
	; RV32I-WITHFP-LABEL: test_emergency_spill_slot:			; RV32I-WITHFP-LABEL: test_emergency_spill_slot:
	; RV32I-WITHFP: # %bb.0:			; RV32I-WITHFP: # %bb.0:
	; RV32I-WITHFP-NEXT: lui a1, 98			; RV32I-WITHFP-NEXT: lui t1, 98
	; RV32I-WITHFP-NEXT: addi a1, a1, -1376			; RV32I-WITHFP-NEXT: addi t1, t1, -1376
	; RV32I-WITHFP-NEXT: sub sp, sp, a1			; RV32I-WITHFP-NEXT: sub sp, sp, t1
	; RV32I-WITHFP-NEXT: lui a1, 98			; RV32I-WITHFP-NEXT: lui a1, 98
	; RV32I-WITHFP-NEXT: addi a1, a1, -1380			; RV32I-WITHFP-NEXT: addi a1, a1, -1380
	; RV32I-WITHFP-NEXT: add a1, sp, a1			; RV32I-WITHFP-NEXT: add a1, sp, a1
	; RV32I-WITHFP-NEXT: sw ra, 0(a1)			; RV32I-WITHFP-NEXT: sw ra, 0(a1)
	; RV32I-WITHFP-NEXT: lui a1, 98			; RV32I-WITHFP-NEXT: lui a1, 98
	; RV32I-WITHFP-NEXT: addi a1, a1, -1384			; RV32I-WITHFP-NEXT: addi a1, a1, -1384
	; RV32I-WITHFP-NEXT: add a1, sp, a1			; RV32I-WITHFP-NEXT: add a1, sp, a1
	; RV32I-WITHFP-NEXT: sw s0, 0(a1)			; RV32I-WITHFP-NEXT: sw s0, 0(a1)
	; RV32I-WITHFP-NEXT: lui a1, 98			; RV32I-WITHFP-NEXT: lui a1, 98
	; RV32I-WITHFP-NEXT: addi a1, a1, -1388			; RV32I-WITHFP-NEXT: addi a1, a1, -1388
	; RV32I-WITHFP-NEXT: add a1, sp, a1			; RV32I-WITHFP-NEXT: add a1, sp, a1
	; RV32I-WITHFP-NEXT: sw s1, 0(a1)			; RV32I-WITHFP-NEXT: sw s1, 0(a1)
	; RV32I-WITHFP-NEXT: lui a1, 98			; RV32I-WITHFP-NEXT: lui a1, 98
	; RV32I-WITHFP-NEXT: addi a1, a1, -1392			; RV32I-WITHFP-NEXT: addi a1, a1, -1392
	; RV32I-WITHFP-NEXT: add a1, sp, a1			; RV32I-WITHFP-NEXT: add a1, sp, a1
	; RV32I-WITHFP-NEXT: sw s2, 0(a1)			; RV32I-WITHFP-NEXT: sw s2, 0(a1)
	; RV32I-WITHFP-NEXT: lui a1, 98			; RV32I-WITHFP-NEXT: lui t1, 98
	; RV32I-WITHFP-NEXT: addi a1, a1, -1376			; RV32I-WITHFP-NEXT: addi t1, t1, -1376
	; RV32I-WITHFP-NEXT: add s0, sp, a1			; RV32I-WITHFP-NEXT: add s0, sp, t1
	; RV32I-WITHFP-NEXT: lui a1, 78			; RV32I-WITHFP-NEXT: lui a1, 78
	; RV32I-WITHFP-NEXT: addi a1, a1, 512			; RV32I-WITHFP-NEXT: addi a1, a1, 512
	; RV32I-WITHFP-NEXT: lui a2, 1048478			; RV32I-WITHFP-NEXT: lui a2, 1048478
	; RV32I-WITHFP-NEXT: addi a2, a2, 1388			; RV32I-WITHFP-NEXT: addi a2, a2, 1388
	; RV32I-WITHFP-NEXT: add a2, s0, a2			; RV32I-WITHFP-NEXT: add a2, s0, a2
	; RV32I-WITHFP-NEXT: mv a2, a2			; RV32I-WITHFP-NEXT: mv a2, a2
	; RV32I-WITHFP-NEXT: add a1, a2, a1			; RV32I-WITHFP-NEXT: add a1, a2, a1
	; RV32I-WITHFP-NEXT: #APP			; RV32I-WITHFP-NEXT: #APP
	Show All 14 Lines
	; RV32I-WITHFP-NEXT: lui a0, 98			; RV32I-WITHFP-NEXT: lui a0, 98
	; RV32I-WITHFP-NEXT: addi a0, a0, -1384			; RV32I-WITHFP-NEXT: addi a0, a0, -1384
	; RV32I-WITHFP-NEXT: add a0, sp, a0			; RV32I-WITHFP-NEXT: add a0, sp, a0
	; RV32I-WITHFP-NEXT: lw s0, 0(a0)			; RV32I-WITHFP-NEXT: lw s0, 0(a0)
	; RV32I-WITHFP-NEXT: lui a0, 98			; RV32I-WITHFP-NEXT: lui a0, 98
	; RV32I-WITHFP-NEXT: addi a0, a0, -1380			; RV32I-WITHFP-NEXT: addi a0, a0, -1380
	; RV32I-WITHFP-NEXT: add a0, sp, a0			; RV32I-WITHFP-NEXT: add a0, sp, a0
	; RV32I-WITHFP-NEXT: lw ra, 0(a0)			; RV32I-WITHFP-NEXT: lw ra, 0(a0)
	; RV32I-WITHFP-NEXT: lui a0, 98			; RV32I-WITHFP-NEXT: lui t1, 98
	; RV32I-WITHFP-NEXT: addi a0, a0, -1376			; RV32I-WITHFP-NEXT: addi t1, t1, -1376
	; RV32I-WITHFP-NEXT: add sp, sp, a0			; RV32I-WITHFP-NEXT: add sp, sp, t1
	; RV32I-WITHFP-NEXT: ret			; RV32I-WITHFP-NEXT: ret
	%data = alloca [ 100000 x i32 ] , align 4			%data = alloca [ 100000 x i32 ] , align 4
	%ptr = getelementptr inbounds [100000 x i32], [100000 x i32]* %data, i32 0, i32 80000			%ptr = getelementptr inbounds [100000 x i32], [100000 x i32]* %data, i32 0, i32 80000
	%1 = tail call { i32, i32, i32, i32, i32, i32, i32, i32, i32, i32, i32, i32, i32, i32, i32 } asm sideeffect "nop", "=r,=r,=r,=r,=r,=r,=r,=r,=r,=r,=r,=r,=r,=r,=r"()			%1 = tail call { i32, i32, i32, i32, i32, i32, i32, i32, i32, i32, i32, i32, i32, i32, i32 } asm sideeffect "nop", "=r,=r,=r,=r,=r,=r,=r,=r,=r,=r,=r,=r,=r,=r,=r"()
	%asmresult0 = extractvalue { i32, i32, i32, i32, i32, i32, i32, i32, i32, i32, i32, i32, i32, i32, i32 } %1, 0			%asmresult0 = extractvalue { i32, i32, i32, i32, i32, i32, i32, i32, i32, i32, i32, i32, i32, i32, i32 } %1, 0
	%asmresult1 = extractvalue { i32, i32, i32, i32, i32, i32, i32, i32, i32, i32, i32, i32, i32, i32, i32 } %1, 1			%asmresult1 = extractvalue { i32, i32, i32, i32, i32, i32, i32, i32, i32, i32, i32, i32, i32, i32, i32 } %1, 1
	%asmresult2 = extractvalue { i32, i32, i32, i32, i32, i32, i32, i32, i32, i32, i32, i32, i32, i32, i32 } %1, 2			%asmresult2 = extractvalue { i32, i32, i32, i32, i32, i32, i32, i32, i32, i32, i32, i32, i32, i32, i32 } %1, 2
	%asmresult3 = extractvalue { i32, i32, i32, i32, i32, i32, i32, i32, i32, i32, i32, i32, i32, i32, i32 } %1, 3			%asmresult3 = extractvalue { i32, i32, i32, i32, i32, i32, i32, i32, i32, i32, i32, i32, i32, i32, i32 } %1, 3
	Show All 15 Lines

test/CodeGen/RISCV/rv64-large-stack.ll

This file was added.

				; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
				; RUN: llc -mtriple=riscv64 -verify-machineinstrs < %s \| FileCheck %s
				;
				; The test case check that RV64 could handle the stack adjustment offset exceed
				; 32-bit.

				define void @foo() nounwind {
				; CHECK-LABEL: foo:
				; CHECK: # %bb.0: # %entry
				; CHECK-NEXT: lui t1, 95
				; CHECK-NEXT: addiw t1, t1, 1505
				; CHECK-NEXT: slli t1, t1, 13
				; CHECK-NEXT: addi t1, t1, 32
				; CHECK-NEXT: sub sp, sp, t1
				; CHECK-NEXT: lui a0, 781250
				; CHECK-NEXT: addiw a0, a0, 24
				; CHECK-NEXT: add a0, sp, a0
				; CHECK-NEXT: sd ra, 0(a0)
				; CHECK-NEXT: addi a0, sp, 16
				; CHECK-NEXT: call baz
				; CHECK-NEXT: lui a0, 781250
				; CHECK-NEXT: addiw a0, a0, 24
				; CHECK-NEXT: add a0, sp, a0
				; CHECK-NEXT: ld ra, 0(a0)
				; CHECK-NEXT: lui t1, 95
				; CHECK-NEXT: addiw t1, t1, 1505
				; CHECK-NEXT: slli t1, t1, 13
				; CHECK-NEXT: addi t1, t1, 32
				; CHECK-NEXT: add sp, sp, t1
				; CHECK-NEXT: ret
				entry:
				%w = alloca [100000000 x { fp128, fp128 }], align 16
				%arraydecay = getelementptr inbounds [100000000 x { fp128, fp128 }], [100000000 x { fp128, fp128 }]* %w, i64 0, i64 0
				call void @baz({ fp128, fp128 }* nonnull %arraydecay)
				ret void
				}

				declare void @baz({ fp128, fp128 }*)
				lenaryUnsubmitted Not Done Reply Inline Actions I think this test case can be significantly simplified. You should just need a single alloca, and then maybe a call that uses a pointer into the alloca? lenary: I think this test case can be significantly simplified. You should just need a single alloca…
				shiva0217AuthorUnsubmitted Done Reply Inline Actions Yes, it becomes significantly cleaner, thanks! shiva0217: Yes, it becomes significantly cleaner, thanks!

test/CodeGen/RISCV/stack-realignment.ll

Show First 20 Lines • Show All 303 Lines • ▼ Show 20 Lines	; RV64I-NEXT: ret
%1 = alloca i8, align 512		%1 = alloca i8, align 512
call void @callee(i8* %1)		call void @callee(i8* %1)
ret void		ret void
}		}

define void @caller1024() nounwind {		define void @caller1024() nounwind {
; RV32I-LABEL: caller1024:		; RV32I-LABEL: caller1024:
; RV32I: # %bb.0:		; RV32I: # %bb.0:
; RV32I-NEXT: lui a0, 1		; RV32I-NEXT: lui t1, 1
; RV32I-NEXT: addi a0, a0, -1024		; RV32I-NEXT: addi t1, t1, -1024
; RV32I-NEXT: sub sp, sp, a0		; RV32I-NEXT: sub sp, sp, t1
; RV32I-NEXT: lui a0, 1		; RV32I-NEXT: lui a0, 1
; RV32I-NEXT: addi a0, a0, -1028		; RV32I-NEXT: addi a0, a0, -1028
; RV32I-NEXT: add a0, sp, a0		; RV32I-NEXT: add a0, sp, a0
; RV32I-NEXT: sw ra, 0(a0)		; RV32I-NEXT: sw ra, 0(a0)
; RV32I-NEXT: lui a0, 1		; RV32I-NEXT: lui a0, 1
; RV32I-NEXT: addi a0, a0, -1032		; RV32I-NEXT: addi a0, a0, -1032
; RV32I-NEXT: add a0, sp, a0		; RV32I-NEXT: add a0, sp, a0
; RV32I-NEXT: sw s0, 0(a0)		; RV32I-NEXT: sw s0, 0(a0)
; RV32I-NEXT: lui a0, 1		; RV32I-NEXT: lui t1, 1
; RV32I-NEXT: addi a0, a0, -1024		; RV32I-NEXT: addi t1, t1, -1024
; RV32I-NEXT: add s0, sp, a0		; RV32I-NEXT: add s0, sp, t1
; RV32I-NEXT: andi sp, sp, -1024		; RV32I-NEXT: andi sp, sp, -1024
; RV32I-NEXT: lui a0, 1		; RV32I-NEXT: lui a0, 1
; RV32I-NEXT: addi a0, a0, -2048		; RV32I-NEXT: addi a0, a0, -2048
; RV32I-NEXT: add a0, sp, a0		; RV32I-NEXT: add a0, sp, a0
; RV32I-NEXT: mv a0, a0		; RV32I-NEXT: mv a0, a0
; RV32I-NEXT: call callee		; RV32I-NEXT: call callee
; RV32I-NEXT: lui a0, 1		; RV32I-NEXT: lui t1, 1
; RV32I-NEXT: addi a0, a0, -1024		; RV32I-NEXT: addi t1, t1, -1024
; RV32I-NEXT: sub sp, s0, a0		; RV32I-NEXT: sub sp, s0, t1
; RV32I-NEXT: lui a0, 1		; RV32I-NEXT: lui a0, 1
; RV32I-NEXT: addi a0, a0, -1032		; RV32I-NEXT: addi a0, a0, -1032
; RV32I-NEXT: add a0, sp, a0		; RV32I-NEXT: add a0, sp, a0
; RV32I-NEXT: lw s0, 0(a0)		; RV32I-NEXT: lw s0, 0(a0)
; RV32I-NEXT: lui a0, 1		; RV32I-NEXT: lui a0, 1
; RV32I-NEXT: addi a0, a0, -1028		; RV32I-NEXT: addi a0, a0, -1028
; RV32I-NEXT: add a0, sp, a0		; RV32I-NEXT: add a0, sp, a0
; RV32I-NEXT: lw ra, 0(a0)		; RV32I-NEXT: lw ra, 0(a0)
; RV32I-NEXT: lui a0, 1		; RV32I-NEXT: lui t1, 1
; RV32I-NEXT: addi a0, a0, -1024		; RV32I-NEXT: addi t1, t1, -1024
; RV32I-NEXT: add sp, sp, a0		; RV32I-NEXT: add sp, sp, t1
; RV32I-NEXT: ret		; RV32I-NEXT: ret
;		;
; RV64I-LABEL: caller1024:		; RV64I-LABEL: caller1024:
; RV64I: # %bb.0:		; RV64I: # %bb.0:
		; RV64I-NEXT: lui t1, 1
		; RV64I-NEXT: addiw t1, t1, -1024
		; RV64I-NEXT: sub sp, sp, t1
; RV64I-NEXT: lui a0, 1		; RV64I-NEXT: lui a0, 1
; RV64I-NEXT: addi a0, a0, -1024		; RV64I-NEXT: addiw a0, a0, -1032
; RV64I-NEXT: sub sp, sp, a0
; RV64I-NEXT: lui a0, 1
; RV64I-NEXT: addi a0, a0, -1032
; RV64I-NEXT: add a0, sp, a0		; RV64I-NEXT: add a0, sp, a0
; RV64I-NEXT: sd ra, 0(a0)		; RV64I-NEXT: sd ra, 0(a0)
; RV64I-NEXT: lui a0, 1		; RV64I-NEXT: lui a0, 1
; RV64I-NEXT: addi a0, a0, -1040		; RV64I-NEXT: addiw a0, a0, -1040
; RV64I-NEXT: add a0, sp, a0		; RV64I-NEXT: add a0, sp, a0
; RV64I-NEXT: sd s0, 0(a0)		; RV64I-NEXT: sd s0, 0(a0)
; RV64I-NEXT: lui a0, 1		; RV64I-NEXT: lui t1, 1
; RV64I-NEXT: addi a0, a0, -1024		; RV64I-NEXT: addiw t1, t1, -1024
; RV64I-NEXT: add s0, sp, a0		; RV64I-NEXT: add s0, sp, t1
; RV64I-NEXT: andi sp, sp, -1024		; RV64I-NEXT: andi sp, sp, -1024
; RV64I-NEXT: lui a0, 1		; RV64I-NEXT: lui a0, 1
; RV64I-NEXT: addi a0, a0, -2048		; RV64I-NEXT: addiw a0, a0, -2048
; RV64I-NEXT: add a0, sp, a0		; RV64I-NEXT: add a0, sp, a0
; RV64I-NEXT: mv a0, a0		; RV64I-NEXT: mv a0, a0
; RV64I-NEXT: call callee		; RV64I-NEXT: call callee
		; RV64I-NEXT: lui t1, 1
		; RV64I-NEXT: addiw t1, t1, -1024
		; RV64I-NEXT: sub sp, s0, t1
; RV64I-NEXT: lui a0, 1		; RV64I-NEXT: lui a0, 1
; RV64I-NEXT: addi a0, a0, -1024		; RV64I-NEXT: addiw a0, a0, -1040
; RV64I-NEXT: sub sp, s0, a0
; RV64I-NEXT: lui a0, 1
; RV64I-NEXT: addi a0, a0, -1040
; RV64I-NEXT: add a0, sp, a0		; RV64I-NEXT: add a0, sp, a0
; RV64I-NEXT: ld s0, 0(a0)		; RV64I-NEXT: ld s0, 0(a0)
; RV64I-NEXT: lui a0, 1		; RV64I-NEXT: lui a0, 1
; RV64I-NEXT: addi a0, a0, -1032		; RV64I-NEXT: addiw a0, a0, -1032
; RV64I-NEXT: add a0, sp, a0		; RV64I-NEXT: add a0, sp, a0
; RV64I-NEXT: ld ra, 0(a0)		; RV64I-NEXT: ld ra, 0(a0)
; RV64I-NEXT: lui a0, 1		; RV64I-NEXT: lui t1, 1
; RV64I-NEXT: addi a0, a0, -1024		; RV64I-NEXT: addiw t1, t1, -1024
; RV64I-NEXT: add sp, sp, a0		; RV64I-NEXT: add sp, sp, t1
; RV64I-NEXT: ret		; RV64I-NEXT: ret
%1 = alloca i8, align 1024		%1 = alloca i8, align 1024
call void @callee(i8* %1)		call void @callee(i8* %1)
ret void		ret void
}		}

define void @caller_no_realign1024() nounwind "no-realign-stack" {		define void @caller_no_realign1024() nounwind "no-realign-stack" {
; RV32I-LABEL: caller_no_realign1024:		; RV32I-LABEL: caller_no_realign1024:
Show All 18 Lines	; RV64I-NEXT: ret
%1 = alloca i8, align 1024		%1 = alloca i8, align 1024
call void @callee(i8* %1)		call void @callee(i8* %1)
ret void		ret void
}		}

define void @caller2048() nounwind {		define void @caller2048() nounwind {
; RV32I-LABEL: caller2048:		; RV32I-LABEL: caller2048:
; RV32I: # %bb.0:		; RV32I: # %bb.0:
; RV32I-NEXT: lui a0, 2		; RV32I-NEXT: lui t1, 2
; RV32I-NEXT: addi a0, a0, -2048		; RV32I-NEXT: addi t1, t1, -2048
; RV32I-NEXT: sub sp, sp, a0		; RV32I-NEXT: sub sp, sp, t1
; RV32I-NEXT: lui a0, 1		; RV32I-NEXT: lui a0, 1
; RV32I-NEXT: addi a0, a0, 2044		; RV32I-NEXT: addi a0, a0, 2044
; RV32I-NEXT: add a0, sp, a0		; RV32I-NEXT: add a0, sp, a0
; RV32I-NEXT: sw ra, 0(a0)		; RV32I-NEXT: sw ra, 0(a0)
; RV32I-NEXT: lui a0, 1		; RV32I-NEXT: lui a0, 1
; RV32I-NEXT: addi a0, a0, 2040		; RV32I-NEXT: addi a0, a0, 2040
; RV32I-NEXT: add a0, sp, a0		; RV32I-NEXT: add a0, sp, a0
; RV32I-NEXT: sw s0, 0(a0)		; RV32I-NEXT: sw s0, 0(a0)
; RV32I-NEXT: lui a0, 2		; RV32I-NEXT: lui t1, 2
; RV32I-NEXT: addi a0, a0, -2048		; RV32I-NEXT: addi t1, t1, -2048
; RV32I-NEXT: add s0, sp, a0		; RV32I-NEXT: add s0, sp, t1
; RV32I-NEXT: andi sp, sp, -2048		; RV32I-NEXT: andi sp, sp, -2048
; RV32I-NEXT: lui a0, 1		; RV32I-NEXT: lui a0, 1
; RV32I-NEXT: mv a0, a0
; RV32I-NEXT: add a0, sp, a0		; RV32I-NEXT: add a0, sp, a0
; RV32I-NEXT: mv a0, a0		; RV32I-NEXT: mv a0, a0
; RV32I-NEXT: call callee		; RV32I-NEXT: call callee
; RV32I-NEXT: lui a0, 2		; RV32I-NEXT: lui t1, 2
; RV32I-NEXT: addi a0, a0, -2048		; RV32I-NEXT: addi t1, t1, -2048
; RV32I-NEXT: sub sp, s0, a0		; RV32I-NEXT: sub sp, s0, t1
; RV32I-NEXT: lui a0, 1		; RV32I-NEXT: lui a0, 1
; RV32I-NEXT: addi a0, a0, 2040		; RV32I-NEXT: addi a0, a0, 2040
; RV32I-NEXT: add a0, sp, a0		; RV32I-NEXT: add a0, sp, a0
; RV32I-NEXT: lw s0, 0(a0)		; RV32I-NEXT: lw s0, 0(a0)
; RV32I-NEXT: lui a0, 1		; RV32I-NEXT: lui a0, 1
; RV32I-NEXT: addi a0, a0, 2044		; RV32I-NEXT: addi a0, a0, 2044
; RV32I-NEXT: add a0, sp, a0		; RV32I-NEXT: add a0, sp, a0
; RV32I-NEXT: lw ra, 0(a0)		; RV32I-NEXT: lw ra, 0(a0)
; RV32I-NEXT: lui a0, 2		; RV32I-NEXT: lui t1, 2
; RV32I-NEXT: addi a0, a0, -2048		; RV32I-NEXT: addi t1, t1, -2048
; RV32I-NEXT: add sp, sp, a0		; RV32I-NEXT: add sp, sp, t1
; RV32I-NEXT: ret		; RV32I-NEXT: ret
;		;
; RV64I-LABEL: caller2048:		; RV64I-LABEL: caller2048:
; RV64I: # %bb.0:		; RV64I: # %bb.0:
; RV64I-NEXT: lui a0, 2		; RV64I-NEXT: lui t1, 2
; RV64I-NEXT: addi a0, a0, -2048		; RV64I-NEXT: addiw t1, t1, -2048
; RV64I-NEXT: sub sp, sp, a0		; RV64I-NEXT: sub sp, sp, t1
; RV64I-NEXT: lui a0, 1		; RV64I-NEXT: lui a0, 1
; RV64I-NEXT: addi a0, a0, 2040		; RV64I-NEXT: addiw a0, a0, 2040
; RV64I-NEXT: add a0, sp, a0		; RV64I-NEXT: add a0, sp, a0
; RV64I-NEXT: sd ra, 0(a0)		; RV64I-NEXT: sd ra, 0(a0)
; RV64I-NEXT: lui a0, 1		; RV64I-NEXT: lui a0, 1
; RV64I-NEXT: addi a0, a0, 2032		; RV64I-NEXT: addiw a0, a0, 2032
; RV64I-NEXT: add a0, sp, a0		; RV64I-NEXT: add a0, sp, a0
; RV64I-NEXT: sd s0, 0(a0)		; RV64I-NEXT: sd s0, 0(a0)
; RV64I-NEXT: lui a0, 2		; RV64I-NEXT: lui t1, 2
; RV64I-NEXT: addi a0, a0, -2048		; RV64I-NEXT: addiw t1, t1, -2048
; RV64I-NEXT: add s0, sp, a0		; RV64I-NEXT: add s0, sp, t1
; RV64I-NEXT: andi sp, sp, -2048		; RV64I-NEXT: andi sp, sp, -2048
; RV64I-NEXT: lui a0, 1		; RV64I-NEXT: lui a0, 1
; RV64I-NEXT: mv a0, a0
; RV64I-NEXT: add a0, sp, a0		; RV64I-NEXT: add a0, sp, a0
; RV64I-NEXT: mv a0, a0		; RV64I-NEXT: mv a0, a0
; RV64I-NEXT: call callee		; RV64I-NEXT: call callee
; RV64I-NEXT: lui a0, 2		; RV64I-NEXT: lui t1, 2
; RV64I-NEXT: addi a0, a0, -2048		; RV64I-NEXT: addiw t1, t1, -2048
; RV64I-NEXT: sub sp, s0, a0		; RV64I-NEXT: sub sp, s0, t1
; RV64I-NEXT: lui a0, 1		; RV64I-NEXT: lui a0, 1
; RV64I-NEXT: addi a0, a0, 2032		; RV64I-NEXT: addiw a0, a0, 2032
; RV64I-NEXT: add a0, sp, a0		; RV64I-NEXT: add a0, sp, a0
; RV64I-NEXT: ld s0, 0(a0)		; RV64I-NEXT: ld s0, 0(a0)
; RV64I-NEXT: lui a0, 1		; RV64I-NEXT: lui a0, 1
; RV64I-NEXT: addi a0, a0, 2040		; RV64I-NEXT: addiw a0, a0, 2040
; RV64I-NEXT: add a0, sp, a0		; RV64I-NEXT: add a0, sp, a0
; RV64I-NEXT: ld ra, 0(a0)		; RV64I-NEXT: ld ra, 0(a0)
; RV64I-NEXT: lui a0, 2		; RV64I-NEXT: lui t1, 2
; RV64I-NEXT: addi a0, a0, -2048		; RV64I-NEXT: addiw t1, t1, -2048
; RV64I-NEXT: add sp, sp, a0		; RV64I-NEXT: add sp, sp, t1
; RV64I-NEXT: ret		; RV64I-NEXT: ret
%1 = alloca i8, align 2048		%1 = alloca i8, align 2048
call void @callee(i8* %1)		call void @callee(i8* %1)
ret void		ret void
}		}

define void @caller_no_realign2048() nounwind "no-realign-stack" {		define void @caller_no_realign2048() nounwind "no-realign-stack" {
; RV32I-LABEL: caller_no_realign2048:		; RV32I-LABEL: caller_no_realign2048:
Show All 18 Lines	; RV64I-NEXT: ret
%1 = alloca i8, align 2048		%1 = alloca i8, align 2048
call void @callee(i8* %1)		call void @callee(i8* %1)
ret void		ret void
}		}

define void @caller4096() nounwind {		define void @caller4096() nounwind {
; RV32I-LABEL: caller4096:		; RV32I-LABEL: caller4096:
; RV32I: # %bb.0:		; RV32I: # %bb.0:
; RV32I-NEXT: lui a0, 3		; RV32I-NEXT: lui t1, 3
; RV32I-NEXT: mv a0, a0		; RV32I-NEXT: sub sp, sp, t1
; RV32I-NEXT: sub sp, sp, a0
; RV32I-NEXT: lui a0, 3		; RV32I-NEXT: lui a0, 3
; RV32I-NEXT: addi a0, a0, -4		; RV32I-NEXT: addi a0, a0, -4
; RV32I-NEXT: add a0, sp, a0		; RV32I-NEXT: add a0, sp, a0
; RV32I-NEXT: sw ra, 0(a0)		; RV32I-NEXT: sw ra, 0(a0)
; RV32I-NEXT: lui a0, 3		; RV32I-NEXT: lui a0, 3
; RV32I-NEXT: addi a0, a0, -8		; RV32I-NEXT: addi a0, a0, -8
; RV32I-NEXT: add a0, sp, a0		; RV32I-NEXT: add a0, sp, a0
; RV32I-NEXT: sw s0, 0(a0)		; RV32I-NEXT: sw s0, 0(a0)
; RV32I-NEXT: lui a0, 3		; RV32I-NEXT: lui t1, 3
; RV32I-NEXT: mv a0, a0		; RV32I-NEXT: add s0, sp, t1
; RV32I-NEXT: add s0, sp, a0
; RV32I-NEXT: srli a0, sp, 12		; RV32I-NEXT: srli a0, sp, 12
; RV32I-NEXT: slli sp, a0, 12		; RV32I-NEXT: slli sp, a0, 12
; RV32I-NEXT: lui a0, 2		; RV32I-NEXT: lui a0, 2
; RV32I-NEXT: mv a0, a0
; RV32I-NEXT: add a0, sp, a0		; RV32I-NEXT: add a0, sp, a0
; RV32I-NEXT: mv a0, a0		; RV32I-NEXT: mv a0, a0
; RV32I-NEXT: call callee		; RV32I-NEXT: call callee
; RV32I-NEXT: lui a0, 3		; RV32I-NEXT: lui t1, 3
; RV32I-NEXT: mv a0, a0		; RV32I-NEXT: sub sp, s0, t1
; RV32I-NEXT: sub sp, s0, a0
; RV32I-NEXT: lui a0, 3		; RV32I-NEXT: lui a0, 3
; RV32I-NEXT: addi a0, a0, -8		; RV32I-NEXT: addi a0, a0, -8
; RV32I-NEXT: add a0, sp, a0		; RV32I-NEXT: add a0, sp, a0
; RV32I-NEXT: lw s0, 0(a0)		; RV32I-NEXT: lw s0, 0(a0)
; RV32I-NEXT: lui a0, 3		; RV32I-NEXT: lui a0, 3
; RV32I-NEXT: addi a0, a0, -4		; RV32I-NEXT: addi a0, a0, -4
; RV32I-NEXT: add a0, sp, a0		; RV32I-NEXT: add a0, sp, a0
; RV32I-NEXT: lw ra, 0(a0)		; RV32I-NEXT: lw ra, 0(a0)
; RV32I-NEXT: lui a0, 3		; RV32I-NEXT: lui t1, 3
; RV32I-NEXT: mv a0, a0		; RV32I-NEXT: add sp, sp, t1
; RV32I-NEXT: add sp, sp, a0
; RV32I-NEXT: ret		; RV32I-NEXT: ret
;		;
; RV64I-LABEL: caller4096:		; RV64I-LABEL: caller4096:
; RV64I: # %bb.0:		; RV64I: # %bb.0:
		; RV64I-NEXT: lui t1, 3
		; RV64I-NEXT: sub sp, sp, t1
; RV64I-NEXT: lui a0, 3		; RV64I-NEXT: lui a0, 3
; RV64I-NEXT: mv a0, a0		; RV64I-NEXT: addiw a0, a0, -8
; RV64I-NEXT: sub sp, sp, a0
; RV64I-NEXT: lui a0, 3
; RV64I-NEXT: addi a0, a0, -8
; RV64I-NEXT: add a0, sp, a0		; RV64I-NEXT: add a0, sp, a0
; RV64I-NEXT: sd ra, 0(a0)		; RV64I-NEXT: sd ra, 0(a0)
; RV64I-NEXT: lui a0, 3		; RV64I-NEXT: lui a0, 3
; RV64I-NEXT: addi a0, a0, -16		; RV64I-NEXT: addiw a0, a0, -16
; RV64I-NEXT: add a0, sp, a0		; RV64I-NEXT: add a0, sp, a0
; RV64I-NEXT: sd s0, 0(a0)		; RV64I-NEXT: sd s0, 0(a0)
; RV64I-NEXT: lui a0, 3		; RV64I-NEXT: lui t1, 3
; RV64I-NEXT: mv a0, a0		; RV64I-NEXT: add s0, sp, t1
; RV64I-NEXT: add s0, sp, a0
; RV64I-NEXT: srli a0, sp, 12		; RV64I-NEXT: srli a0, sp, 12
; RV64I-NEXT: slli sp, a0, 12		; RV64I-NEXT: slli sp, a0, 12
; RV64I-NEXT: lui a0, 2		; RV64I-NEXT: lui a0, 2
; RV64I-NEXT: mv a0, a0
; RV64I-NEXT: add a0, sp, a0		; RV64I-NEXT: add a0, sp, a0
; RV64I-NEXT: mv a0, a0		; RV64I-NEXT: mv a0, a0
; RV64I-NEXT: call callee		; RV64I-NEXT: call callee
		; RV64I-NEXT: lui t1, 3
		; RV64I-NEXT: sub sp, s0, t1
; RV64I-NEXT: lui a0, 3		; RV64I-NEXT: lui a0, 3
; RV64I-NEXT: mv a0, a0		; RV64I-NEXT: addiw a0, a0, -16
; RV64I-NEXT: sub sp, s0, a0
; RV64I-NEXT: lui a0, 3
; RV64I-NEXT: addi a0, a0, -16
; RV64I-NEXT: add a0, sp, a0		; RV64I-NEXT: add a0, sp, a0
; RV64I-NEXT: ld s0, 0(a0)		; RV64I-NEXT: ld s0, 0(a0)
; RV64I-NEXT: lui a0, 3		; RV64I-NEXT: lui a0, 3
; RV64I-NEXT: addi a0, a0, -8		; RV64I-NEXT: addiw a0, a0, -8
; RV64I-NEXT: add a0, sp, a0		; RV64I-NEXT: add a0, sp, a0
; RV64I-NEXT: ld ra, 0(a0)		; RV64I-NEXT: ld ra, 0(a0)
; RV64I-NEXT: lui a0, 3		; RV64I-NEXT: lui t1, 3
; RV64I-NEXT: mv a0, a0		; RV64I-NEXT: add sp, sp, t1
; RV64I-NEXT: add sp, sp, a0
; RV64I-NEXT: ret		; RV64I-NEXT: ret
%1 = alloca i8, align 4096		%1 = alloca i8, align 4096
call void @callee(i8* %1)		call void @callee(i8* %1)
ret void		ret void
}		}

define void @caller_no_realign4096() nounwind "no-realign-stack" {		define void @caller_no_realign4096() nounwind "no-realign-stack" {
; RV32I-LABEL: caller_no_realign4096:		; RV32I-LABEL: caller_no_realign4096:
Show All 22 Lines

This is an archive of the discontinued LLVM Phabricator instance.

[RISCV] Support stack offset exceed 32-bit for RV64
ClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 219708

lib/Target/RISCV/RISCVFrameLowering.cpp

lib/Target/RISCV/RISCVInstrInfo.h

lib/Target/RISCV/RISCVInstrInfo.cpp

lib/Target/RISCV/RISCVRegisterInfo.cpp

test/CodeGen/RISCV/large-stack.ll

test/CodeGen/RISCV/rv64-large-stack.ll

test/CodeGen/RISCV/stack-realignment.ll

This is an archive of the discontinued LLVM Phabricator instance.

[RISCV] Support stack offset exceed 32-bit for RV64ClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 219708

lib/Target/RISCV/RISCVFrameLowering.cpp

lib/Target/RISCV/RISCVInstrInfo.h

lib/Target/RISCV/RISCVInstrInfo.cpp

lib/Target/RISCV/RISCVRegisterInfo.cpp

test/CodeGen/RISCV/large-stack.ll

test/CodeGen/RISCV/rv64-large-stack.ll

test/CodeGen/RISCV/stack-realignment.ll

[RISCV] Support stack offset exceed 32-bit for RV64
ClosedPublic