This is an archive of the discontinued LLVM Phabricator instance.

Paths

Table of Contentst

-
llvm/
-
lib/Target/ARM/
-
Target/
-
ARM/
3/3
ARMFrameLowering.cpp
-
test/CodeGen/
-
CodeGen/
-
ARM/
-
segmented-stacks.ll
-
Thumb/
-
segmented-stacks.ll
-
Thumb2/
-
segmented-stacks.ll

Differential D118545

[ARM] Fix 8-bit immediate overflow in the instruction of segmented stack prologue.
ClosedPublic

Authored by ZhiyaoMa98 on Jan 29 2022, 4:04 PM.

Download Raw Diff

Details

Reviewers

asl
ostannard
chill
john.brawn
efriedma

Commits

rGadc26b4eaedc: [ARM] Fix 8-bit immediate overflow in the instruction of segmented stack…

Summary

It fixes the overflow of 8-bit immediate field in the emitted instruction that allocates large stacklet.

For thumb2 targets, load large immediate by a pair of movw and movt instruction. For thumb1 and ARM targets, load large immediate by reading from literal pool.

Diff Detail

Repository: rG LLVM Github Monorepo

Event Timeline

ZhiyaoMa98 created this revision.Jan 29 2022, 4:04 PM

Herald added subscribers: hiraditya, kristof.beyls. · View Herald TranscriptJan 29 2022, 4:04 PM

ZhiyaoMa98 requested review of this revision.Jan 29 2022, 4:04 PM

Herald added a project: Restricted Project. · View Herald TranscriptJan 29 2022, 4:04 PM

Harbormaster completed remote builds in B146486: Diff 404310.Jan 29 2022, 5:39 PM

@dmgreen

dmgreen added reviewers: ostannard, chill, john.brawn, efriedma.Feb 1 2022, 4:22 AM

Please add a test for this. llvm/test/CodeGen/ARM/segmented-stacks.ll already has some tests related to this, so it looks like you could add a couple of RUN lines for thumb and thumb2 targets, and add test_very_large that's like test_large but with an integer that's too large for ARM::MOVi.

llvm/lib/Target/ARM/ARMFrameLowering.cpp
2459	We already have pseudo-instructions for mov of 32-bit immediate in arm and thumb2, so instead of having a function to emit the code sequence here it would be better I think to create a tMOVi32imm pseudo-instruction and generate the instruction sequence when expanding it.
2642	This isn't a conditional move, so this should be t2MOVi32imm.
2656–2657	We'll also have incorrect code generation when AlignedStackSize is larger than the max immediate of ARM::SUBri (and similar with ARM::MOVi down below), so we should similarly be making use of ARM::MOVi32imm to generate the immediate here.

For thumb1, the number of emitted instructions varies with the value of the 32-bit immediate. How should we set the cost for the new pseudo-instruction tMOVi32imm? For the existing t2MOVi32imm, the cost is set as IIC_iMOVix2. I understand it comes from one movw and one movt. But for variable cost, I am not sure what to do.

I see the logic of expanding t2MOVi32imm in ARMExpandPseudo::ExpandMOV32BitImm, but I feel hard to understand them fully. Is there any tutorial that focuses on this part?

Thank you for your review and comments, and help.

Not sure about the discussion of MOVi32imm etc. In ARM mode, the existing MOVi32imm can't be used for arbitrary constants without armv6t2. For the general case, we emit a constant pool load. Similarly, on Thumb, we just never bothered to implement tMOVi32imm.

Can we use emitThumbRegPlusImmediate/emitT2RegPlusImmediate/emitARMRegPlusImmediate here, instead of reimplementing it?

Yes, emitThumbRegPlusImmediate works. Thank you for the suggestion. @efriedma

I am looking into adding more tests, but existing test strikes me as strange. test_large() in llvm/test/CodeGen/Thumb/segmented-stacks.ll already tests for large stacklet allocation, but the test case is vain.

The test case expects the following output:

...
push 	{r4, r5}
mov 	r5, sp
sub  	r5, #40192
...

Even if without this patch, the output machine assembly code matches the expected output string and passes the test. But sub r5, #40192 is not a valid instruction on thumb. After passing through the assembler, the sub instruction becomes subs r5, #0:

00000078 <test_large>:
  78:   b430            push    {r4, r5}
  7a:   466d            mov     r5, sp
  7c:   3d00            subs    r5, #0
...

How can I perform the test effectively?

You'll want to have the RUN lines for the thumb tests to have a --check-prefix argument to FileCheck that's unique, and use that to check for the thumb-specific codegen, e.g.

; RUN: llc < %s -mtriple=arm-linux-androideabi -mattr=+v4t -verify-machineinstrs | FileCheck %s -check-prefix=ARM-android
; RUN: llc < %s -mtriple=arm-linux-unknown-gnueabi -mattr=+v4t  -verify-machineinstrs | FileCheck %s -check-prefix=ARM-linux
; RUN: llc < %s -mtriple=thumb-linux-androideabi -mattr=+v4t -verify-machineinstrs | FileCheck %s -check-prefix=THUMB-android
; RUN: llc < %s -mtriple=thumb-linux-unknown-gnueabi -mattr=+v4t  -verify-machineinstrs | FileCheck %s -check-prefix=THUMB-linux

then later

; THUMB-android:      test_large:

; THUMB-android:      push    {r4, r5}
; THUMB-android-NEXT: whatever the expected sp-setting instruction sequence is

Let me clarify the problem. The test compares the output at the machine assembly level, i.e. ARM (thumb) assembly instruction. However, some syntactically correct ARM (thumb) assembly does not generate binary instruction with the same semantic.

For example, sub r5, #40192 is a syntactically correct ARM (thumb) assembly, but #40192 does not fit into 8-bit immediate field. Surprisingly the assembler accepts the assembly instruction and emits the binary instruction subs r5, #0, without reporting an error.

The following command tests at the machine assembly level. It sees sub r5, #40192 and considers it correct.
; RUN: llc < %s -mtriple=thumb-linux-androideabi -verify-machineinstrs | FileCheck %s -check-prefix=Thumb-android

The following command generates binary object. It should trigger an error when it tries to assemble sub r5, #40192 in thumb1, but does not.
; RUN: llc < %s -mtriple=thumb-linux-androideabi -filetype=obj

So my point is the current test code has already included the large stack frame test case, but the bug is not detected and we are unable to detect it in this way.

We should rewrite the test, but I do not know how the test can be written to reveal the bug I am trying to resolve.

When the integrated assembler is used directly by the compiler, as opposed to parsing textual assembler, it uses a different codepath which passes the operands directly, which skips converting them to/from text. This codepath ends up skipping some kinds of operand validation; we don't expect to be generating invalid instructions.

We do have a method ARMBaseInstrInfo::verifyInstruction which is used by the machine verifier to validate target-specific properties of instructions. It currently only verifies immediates for load/store instructions, not arithmetic, so it doesn't currently catch this. Improvements are definitely welcome, though.

To clarify, if you try to assemble a file containing the line sub r5, #40192 on a Thumb target, it will print an error. The issue you're seeing with an impossible instruction only shows up for instructions generated internally by the compiler itself.

ARMBaseInstrInfo::verifyInstruction can be tested using a MachineIR (MIR) test. See llvm/test/CodeGen/ARM/machine-verifier.mir .

The pseudo-instruction ARM::MOVi32imm seems to be broken.
BuildMI(McrMBB, DL, TII.get(ARM::MOVi32imm), ARM::R4).addImm(0xa0000); generates the following.

c0:   e3e04fff        mvn     r4, #1020       ; 0x3fc
c4:   e24444ff        sub     r4, r4, #-16777216      ; 0xff000000

No existing code is using ARM::MOVi32imm. Is the pseudo-instruction really broken or I misunderstood something?

When we don't have movw/movt, there is no two-instruction sequence to materialize an arbitrary immediate, so we only use ARM::MOVi32imm in very limited cases. See https://github.com/llvm/llvm-project/blob/807e2f12fab52c6abf3e89c02eec0f585b3b8f22/llvm/lib/Target/ARM/ARMInstrInfo.td#L836 and https://github.com/llvm/llvm-project/blob/807e2f12fab52c6abf3e89c02eec0f585b3b8f22/llvm/lib/Target/ARM/ARMExpandPseudoInsts.cpp#L970 . (Maybe ARMExpandPseudo::ExpandMOV32BitImm should have an assertion to make this clear.)

Changed t2MOVCCi32imm to unconditional t2MOVi32imm .
Updated thumb1 and ARM to read from literal pool.
Added tests.

Harbormaster completed remote builds in B148851: Diff 407689.Feb 10 2022, 3:10 PM

Ping. Is there anything else I should fix?

LGTM

@john.brawn Any further comment?

@ZhiyaoMa98 I assume you don't have commit access; how do you want to be credited in the "author" line of the git commit?

This revision is now accepted and ready to land.Mar 8 2022, 12:03 PM

Herald added a project: Restricted Project. · View Herald TranscriptMar 8 2022, 12:03 PM

@efriedma
Thanks. Please set my name as "Zhiyao Ma" and my email as "zhiyao.ma.98@gmail.com".

LGTM as well.

This revision was landed with ongoing or failed builds.Mar 10 2022, 3:17 PM

Closed by commit rGadc26b4eaedc: [ARM] Fix 8-bit immediate overflow in the instruction of segmented stack… (authored by ZhiyaoMa98, committed by efriedma). · Explain Why

This revision was automatically updated to reflect the committed changes.

efriedma added a commit: rGadc26b4eaedc: [ARM] Fix 8-bit immediate overflow in the instruction of segmented stack….

Revision Contents

Path

Size

llvm/

lib/

Target/

ARM/

ARMFrameLowering.cpp

123 lines

test/

CodeGen/

ARM/

segmented-stacks.ll

56 lines

Thumb/

segmented-stacks.ll

29 lines

Thumb2/

segmented-stacks.ll

104 lines

Diff 414511

llvm/lib/Target/ARM/ARMFrameLowering.cpp

Show First 20 Lines • Show All 2,450 Lines • ▼ Show 20 Lines	static uint32_t alignToARMConstant(uint32_t Value) {
else		else
Value = Value << (24 - Shifted);		Value = Value << (24 - Shifted);

return Value;		return Value;
}		}

// The stack limit in the TCB is set to this many bytes above the actual		// The stack limit in the TCB is set to this many bytes above the actual
// stack limit.		// stack limit.
static const uint64_t kSplitStackAvailable = 256;		static const uint64_t kSplitStackAvailable = 256;
		john.brawnUnsubmitted Done Reply Inline Actions We already have pseudo-instructions for mov of 32-bit immediate in arm and thumb2, so instead of having a function to emit the code sequence here it would be better I think to create a tMOVi32imm pseudo-instruction and generate the instruction sequence when expanding it. john.brawn: We already have pseudo-instructions for mov of 32-bit immediate in arm and thumb2, so instead…

// Adjust the function prologue to enable split stacks. This currently only		// Adjust the function prologue to enable split stacks. This currently only
// supports android and linux.		// supports android and linux.
//		//
// The ABI of the segmented stack prologue is a little arbitrarily chosen, but		// The ABI of the segmented stack prologue is a little arbitrarily chosen, but
// must be well defined in order to allow for consistent implementations of the		// must be well defined in order to allow for consistent implementations of the
// __morestack helper function. The ABI is also not a normal ABI in that it		// __morestack helper function. The ABI is also not a normal ABI in that it
// doesn't follow the normal calling conventions because this allows the		// doesn't follow the normal calling conventions because this allows the
Show All 15 Lines
//		//
// [1] - https://github.com/mozilla/rust/blob/86efd9/src/rt/arch/arm/morestack.S		// [1] - https://github.com/mozilla/rust/blob/86efd9/src/rt/arch/arm/morestack.S
void ARMFrameLowering::adjustForSegmentedStacks(		void ARMFrameLowering::adjustForSegmentedStacks(
MachineFunction &MF, MachineBasicBlock &PrologueMBB) const {		MachineFunction &MF, MachineBasicBlock &PrologueMBB) const {
unsigned Opcode;		unsigned Opcode;
unsigned CFIIndex;		unsigned CFIIndex;
const ARMSubtarget *ST = &MF.getSubtarget<ARMSubtarget>();		const ARMSubtarget *ST = &MF.getSubtarget<ARMSubtarget>();
bool Thumb = ST->isThumb();		bool Thumb = ST->isThumb();
		bool Thumb2 = ST->isThumb2();

// Sadly, this currently doesn't support varargs, platforms other than		// Sadly, this currently doesn't support varargs, platforms other than
// android/linux. Note that thumb1/thumb2 are support for android/linux.		// android/linux. Note that thumb1/thumb2 are support for android/linux.
if (MF.getFunction().isVarArg())		if (MF.getFunction().isVarArg())
report_fatal_error("Segmented stacks do not support vararg functions.");		report_fatal_error("Segmented stacks do not support vararg functions.");
if (!ST->isTargetAndroid() && !ST->isTargetLinux())		if (!ST->isTargetAndroid() && !ST->isTargetLinux())
report_fatal_error("Segmented stacks not supported on this platform.");		report_fatal_error("Segmented stacks not supported on this platform.");

▲ Show 20 Lines • Show All 126 Lines • ▼ Show 20 Lines	if (Thumb) {
BuildMI(McrMBB, DL, TII.get(ARM::MOVr), ScratchReg1)		BuildMI(McrMBB, DL, TII.get(ARM::MOVr), ScratchReg1)
.addReg(ARM::SP)		.addReg(ARM::SP)
.add(predOps(ARMCC::AL))		.add(predOps(ARMCC::AL))
.add(condCodeOp());		.add(condCodeOp());
}		}

// sub SR1, sp, #StackSize		// sub SR1, sp, #StackSize
if (!CompareStackPointer && Thumb) {		if (!CompareStackPointer && Thumb) {
		if (AlignedStackSize < 256) {
BuildMI(McrMBB, DL, TII.get(ARM::tSUBi8), ScratchReg1)		BuildMI(McrMBB, DL, TII.get(ARM::tSUBi8), ScratchReg1)
.add(condCodeOp())		.add(condCodeOp())
.addReg(ScratchReg1)		.addReg(ScratchReg1)
.addImm(AlignedStackSize)		.addImm(AlignedStackSize)
.add(predOps(ARMCC::AL));		.add(predOps(ARMCC::AL));
		} else {
		if (Thumb2) {
		BuildMI(McrMBB, DL, TII.get(ARM::t2MOVi32imm), ScratchReg0)
		john.brawnUnsubmitted Done Reply Inline Actions This isn't a conditional move, so this should be t2MOVi32imm. john.brawn: This isn't a conditional move, so this should be t2MOVi32imm.
		.addImm(AlignedStackSize);
		} else {
		auto MBBI = McrMBB->end();
		auto RegInfo = STI.getRegisterInfo();
		RegInfo->emitLoadConstPool(*McrMBB, MBBI, DL, ScratchReg0, 0,
		AlignedStackSize);
		}
		BuildMI(McrMBB, DL, TII.get(ARM::tSUBrr), ScratchReg1)
		.add(condCodeOp())
		.addReg(ScratchReg1)
		.addReg(ScratchReg0)
		.add(predOps(ARMCC::AL));
		}
} else if (!CompareStackPointer) {		} else if (!CompareStackPointer) {
		if (AlignedStackSize < 256) {
		john.brawnUnsubmitted Done Reply Inline Actions We'll also have incorrect code generation when AlignedStackSize is larger than the max immediate of ARM::SUBri (and similar with ARM::MOVi down below), so we should similarly be making use of ARM::MOVi32imm to generate the immediate here. john.brawn: We'll also have incorrect code generation when AlignedStackSize is larger than the max…
BuildMI(McrMBB, DL, TII.get(ARM::SUBri), ScratchReg1)		BuildMI(McrMBB, DL, TII.get(ARM::SUBri), ScratchReg1)
.addReg(ARM::SP)		.addReg(ARM::SP)
.addImm(AlignedStackSize)		.addImm(AlignedStackSize)
.add(predOps(ARMCC::AL))		.add(predOps(ARMCC::AL))
.add(condCodeOp());		.add(condCodeOp());
		} else {
		auto MBBI = McrMBB->end();
		auto RegInfo = STI.getRegisterInfo();
		RegInfo->emitLoadConstPool(*McrMBB, MBBI, DL, ScratchReg0, 0,
		AlignedStackSize);
		BuildMI(McrMBB, DL, TII.get(ARM::SUBrr), ScratchReg1)
		.addReg(ARM::SP)
		.addReg(ScratchReg0)
		.add(predOps(ARMCC::AL))
		.add(condCodeOp());
		}
}		}

if (Thumb && ST->isThumb1Only()) {		if (Thumb && ST->isThumb1Only()) {
unsigned PCLabelId = ARMFI->createPICLabelUId();		unsigned PCLabelId = ARMFI->createPICLabelUId();
ARMConstantPoolValue *NewCPV = ARMConstantPoolSymbol::Create(		ARMConstantPoolValue *NewCPV = ARMConstantPoolSymbol::Create(
MF.getFunction().getContext(), "__STACK_LIMIT", PCLabelId, 0);		MF.getFunction().getContext(), "__STACK_LIMIT", PCLabelId, 0);
MachineConstantPool *MCP = MF.getConstantPool();		MachineConstantPool *MCP = MF.getConstantPool();
unsigned CPI = MCP->getConstantPoolIndex(NewCPV, Align(4));		unsigned CPI = MCP->getConstantPoolIndex(NewCPV, Align(4));
▲ Show 20 Lines • Show All 50 Lines • ▼ Show 20 Lines	void ARMFrameLowering::adjustForSegmentedStacks(

// Calling __morestack(StackSize, Size of stack arguments).		// Calling __morestack(StackSize, Size of stack arguments).
// __morestack knows that the stack size requested is in SR0(r4)		// __morestack knows that the stack size requested is in SR0(r4)
// and amount size of stack arguments is in SR1(r5).		// and amount size of stack arguments is in SR1(r5).

// Pass first argument for the __morestack by Scratch Register #0.		// Pass first argument for the __morestack by Scratch Register #0.
// The amount size of stack required		// The amount size of stack required
if (Thumb) {		if (Thumb) {
		if (AlignedStackSize < 256) {
BuildMI(AllocMBB, DL, TII.get(ARM::tMOVi8), ScratchReg0)		BuildMI(AllocMBB, DL, TII.get(ARM::tMOVi8), ScratchReg0)
.add(condCodeOp())		.add(condCodeOp())
.addImm(AlignedStackSize)		.addImm(AlignedStackSize)
.add(predOps(ARMCC::AL));		.add(predOps(ARMCC::AL));
} else {		} else {
		if (Thumb2) {
		BuildMI(AllocMBB, DL, TII.get(ARM::t2MOVi32imm), ScratchReg0)
		.addImm(AlignedStackSize);
		} else {
		auto MBBI = AllocMBB->end();
		auto RegInfo = STI.getRegisterInfo();
		RegInfo->emitLoadConstPool(*AllocMBB, MBBI, DL, ScratchReg0, 0,
		AlignedStackSize);
		}
		}
		} else {
		if (AlignedStackSize < 256) {
BuildMI(AllocMBB, DL, TII.get(ARM::MOVi), ScratchReg0)		BuildMI(AllocMBB, DL, TII.get(ARM::MOVi), ScratchReg0)
.addImm(AlignedStackSize)		.addImm(AlignedStackSize)
.add(predOps(ARMCC::AL))		.add(predOps(ARMCC::AL))
.add(condCodeOp());		.add(condCodeOp());
		} else {
		auto MBBI = AllocMBB->end();
		auto RegInfo = STI.getRegisterInfo();
		RegInfo->emitLoadConstPool(*AllocMBB, MBBI, DL, ScratchReg0, 0,
		AlignedStackSize);
		}
}		}

// Pass second argument for the __morestack by Scratch Register #1.		// Pass second argument for the __morestack by Scratch Register #1.
// The amount size of stack consumed to save function arguments.		// The amount size of stack consumed to save function arguments.
if (Thumb) {		if (Thumb) {
		if (ARMFI->getArgumentStackSize() < 256) {
BuildMI(AllocMBB, DL, TII.get(ARM::tMOVi8), ScratchReg1)		BuildMI(AllocMBB, DL, TII.get(ARM::tMOVi8), ScratchReg1)
.add(condCodeOp())		.add(condCodeOp())
.addImm(alignToARMConstant(ARMFI->getArgumentStackSize()))		.addImm(alignToARMConstant(ARMFI->getArgumentStackSize()))
.add(predOps(ARMCC::AL));		.add(predOps(ARMCC::AL));
} else {		} else {
		if (Thumb2) {
		BuildMI(AllocMBB, DL, TII.get(ARM::t2MOVi32imm), ScratchReg1)
		.addImm(alignToARMConstant(ARMFI->getArgumentStackSize()));
		} else {
		auto MBBI = AllocMBB->end();
		auto RegInfo = STI.getRegisterInfo();
		RegInfo->emitLoadConstPool(
		*AllocMBB, MBBI, DL, ScratchReg1, 0,
		alignToARMConstant(ARMFI->getArgumentStackSize()));
		}
		}
		} else {
		if (alignToARMConstant(ARMFI->getArgumentStackSize()) < 256) {
BuildMI(AllocMBB, DL, TII.get(ARM::MOVi), ScratchReg1)		BuildMI(AllocMBB, DL, TII.get(ARM::MOVi), ScratchReg1)
.addImm(alignToARMConstant(ARMFI->getArgumentStackSize()))		.addImm(alignToARMConstant(ARMFI->getArgumentStackSize()))
.add(predOps(ARMCC::AL))		.add(predOps(ARMCC::AL))
.add(condCodeOp());		.add(condCodeOp());
		} else {
		auto MBBI = AllocMBB->end();
		auto RegInfo = STI.getRegisterInfo();
		RegInfo->emitLoadConstPool(
		*AllocMBB, MBBI, DL, ScratchReg1, 0,
		alignToARMConstant(ARMFI->getArgumentStackSize()));
		}
}		}

// push {lr} - Save return address of this function.		// push {lr} - Save return address of this function.
if (Thumb) {		if (Thumb) {
BuildMI(AllocMBB, DL, TII.get(ARM::tPUSH))		BuildMI(AllocMBB, DL, TII.get(ARM::tPUSH))
.add(predOps(ARMCC::AL))		.add(predOps(ARMCC::AL))
.addReg(ARM::LR);		.addReg(ARM::LR);
} else {		} else {
▲ Show 20 Lines • Show All 126 Lines • Show Last 20 Lines

llvm/test/CodeGen/ARM/segmented-stacks.ll

	; RUN: llc < %s -mtriple=arm-linux-androideabi -mattr=+v4t -verify-machineinstrs \| FileCheck %s -check-prefix=ARM-android			; RUN: llc < %s -mtriple=arm-linux-androideabi -mattr=+v4t -verify-machineinstrs \| FileCheck %s -check-prefix=ARM-android
	; RUN: llc < %s -mtriple=arm-linux-unknown-gnueabi -mattr=+v4t -verify-machineinstrs \| FileCheck %s -check-prefix=ARM-linux			; RUN: llc < %s -mtriple=arm-linux-unknown-gnueabi -mattr=+v4t -verify-machineinstrs \| FileCheck %s -check-prefix=ARM-linux

	; We used to crash with filetype=obj			; We used to crash with filetype=obj
	; RUN: llc < %s -mtriple=arm-linux-androideabi -filetype=obj			; RUN: llc < %s -mtriple=arm-linux-androideabi -filetype=obj
	; RUN: llc < %s -mtriple=arm-linux-unknown-gnueabi -filetype=obj			; RUN: llc < %s -mtriple=arm-linux-unknown-gnueabi -filetype=obj


	; Just to prevent the alloca from being optimized away			; Just to prevent the alloca from being optimized away
	declare void @dummy_use(i32*, i32)			declare void @dummy_use(i32*, i32)

	define void @test_basic() #0 {			define void @test_basic() #0 {
	%mem = alloca i32, i32 10			%mem = alloca i32, i32 10
	call void @dummy_use (i32* %mem, i32 10)			call void @dummy_use (i32* %mem, i32 10)
	ret void			ret void

	; ARM-linux: test_basic:			; ARM-linux-LABEL: test_basic:

	; ARM-linux: push {r4, r5}			; ARM-linux: push {r4, r5}
	; ARM-linux-NEXT: mrc p15, #0, r4, c13, c0, #3			; ARM-linux-NEXT: mrc p15, #0, r4, c13, c0, #3
	; ARM-linux-NEXT: mov r5, sp			; ARM-linux-NEXT: mov r5, sp
	; ARM-linux-NEXT: ldr r4, [r4, #4]			; ARM-linux-NEXT: ldr r4, [r4, #4]
	; ARM-linux-NEXT: cmp r4, r5			; ARM-linux-NEXT: cmp r4, r5
	; ARM-linux-NEXT: blo .LBB0_2			; ARM-linux-NEXT: blo .LBB0_2

	; ARM-linux: mov r4, #48			; ARM-linux: mov r4, #48
	; ARM-linux-NEXT: mov r5, #0			; ARM-linux-NEXT: mov r5, #0
	; ARM-linux-NEXT: stmdb sp!, {lr}			; ARM-linux-NEXT: stmdb sp!, {lr}
	; ARM-linux-NEXT: bl __morestack			; ARM-linux-NEXT: bl __morestack
	; ARM-linux-NEXT: ldm sp!, {lr}			; ARM-linux-NEXT: ldm sp!, {lr}
	; ARM-linux-NEXT: pop {r4, r5}			; ARM-linux-NEXT: pop {r4, r5}
	; ARM-linux-NEXT: bx lr			; ARM-linux-NEXT: bx lr

	; ARM-linux: pop {r4, r5}			; ARM-linux: pop {r4, r5}

	; ARM-android: test_basic:			; ARM-android-LABEL: test_basic:

	; ARM-android: push {r4, r5}			; ARM-android: push {r4, r5}
	; ARM-android-NEXT: mrc p15, #0, r4, c13, c0, #3			; ARM-android-NEXT: mrc p15, #0, r4, c13, c0, #3
	; ARM-android-NEXT: mov r5, sp			; ARM-android-NEXT: mov r5, sp
	; ARM-android-NEXT: ldr r4, [r4, #252]			; ARM-android-NEXT: ldr r4, [r4, #252]
	; ARM-android-NEXT: cmp r4, r5			; ARM-android-NEXT: cmp r4, r5
	; ARM-android-NEXT: blo .LBB0_2			; ARM-android-NEXT: blo .LBB0_2

	Show All 11 Lines

	define i32 @test_nested(i32 * nest %closure, i32 %other) #0 {			define i32 @test_nested(i32 * nest %closure, i32 %other) #0 {
	%addend = load i32 , i32 * %closure			%addend = load i32 , i32 * %closure
	%result = add i32 %other, %addend			%result = add i32 %other, %addend
	%mem = alloca i32, i32 10			%mem = alloca i32, i32 10
	call void @dummy_use (i32* %mem, i32 10)			call void @dummy_use (i32* %mem, i32 10)
	ret i32 %result			ret i32 %result

	; ARM-linux: test_nested:			; ARM-linux-LABEL: test_nested:

	; ARM-linux: push {r4, r5}			; ARM-linux: push {r4, r5}
	; ARM-linux-NEXT: mrc p15, #0, r4, c13, c0, #3			; ARM-linux-NEXT: mrc p15, #0, r4, c13, c0, #3
	; ARM-linux-NEXT: mov r5, sp			; ARM-linux-NEXT: mov r5, sp
	; ARM-linux-NEXT: ldr r4, [r4, #4]			; ARM-linux-NEXT: ldr r4, [r4, #4]
	; ARM-linux-NEXT: cmp r4, r5			; ARM-linux-NEXT: cmp r4, r5
	; ARM-linux-NEXT: blo .LBB1_2			; ARM-linux-NEXT: blo .LBB1_2

	; ARM-linux: mov r4, #56			; ARM-linux: mov r4, #56
	; ARM-linux-NEXT: mov r5, #0			; ARM-linux-NEXT: mov r5, #0
	; ARM-linux-NEXT: stmdb sp!, {lr}			; ARM-linux-NEXT: stmdb sp!, {lr}
	; ARM-linux-NEXT: bl __morestack			; ARM-linux-NEXT: bl __morestack
	; ARM-linux-NEXT: ldm sp!, {lr}			; ARM-linux-NEXT: ldm sp!, {lr}
	; ARM-linux-NEXT: pop {r4, r5}			; ARM-linux-NEXT: pop {r4, r5}
	; ARM-linux-NEXT: bx lr			; ARM-linux-NEXT: bx lr

	; ARM-linux: pop {r4, r5}			; ARM-linux: pop {r4, r5}

	; ARM-android: test_nested:			; ARM-android-LABEL: test_nested:

	; ARM-android: push {r4, r5}			; ARM-android: push {r4, r5}
	; ARM-android-NEXT: mrc p15, #0, r4, c13, c0, #3			; ARM-android-NEXT: mrc p15, #0, r4, c13, c0, #3
	; ARM-android-NEXT: mov r5, sp			; ARM-android-NEXT: mov r5, sp
	; ARM-android-NEXT: ldr r4, [r4, #252]			; ARM-android-NEXT: ldr r4, [r4, #252]
	; ARM-android-NEXT: cmp r4, r5			; ARM-android-NEXT: cmp r4, r5
	; ARM-android-NEXT: blo .LBB1_2			; ARM-android-NEXT: blo .LBB1_2

	Show All 9 Lines

	}			}

	define void @test_large() #0 {			define void @test_large() #0 {
	%mem = alloca i32, i32 10000			%mem = alloca i32, i32 10000
	call void @dummy_use (i32* %mem, i32 0)			call void @dummy_use (i32* %mem, i32 0)
	ret void			ret void

	; ARM-linux: test_large:			; ARM-linux-LABEL: test_large:

	; ARM-linux: push {r4, r5}			; ARM-linux: push {r4, r5}
				; ARM-linux-NEXT: ldr r4, .LCPI2_0
				; ARM-linux-NEXT: sub r5, sp, r4
	; ARM-linux-NEXT: mrc p15, #0, r4, c13, c0, #3			; ARM-linux-NEXT: mrc p15, #0, r4, c13, c0, #3
	; ARM-linux-NEXT: sub r5, sp, #40192
	; ARM-linux-NEXT: ldr r4, [r4, #4]			; ARM-linux-NEXT: ldr r4, [r4, #4]
	; ARM-linux-NEXT: cmp r4, r5			; ARM-linux-NEXT: cmp r4, r5
	; ARM-linux-NEXT: blo .LBB2_2			; ARM-linux-NEXT: blo .LBB2_2

	; ARM-linux: mov r4, #40192			; ARM-linux: ldr r4, .LCPI2_0
	; ARM-linux-NEXT: mov r5, #0			; ARM-linux-NEXT: mov r5, #0
	; ARM-linux-NEXT: stmdb sp!, {lr}			; ARM-linux-NEXT: stmdb sp!, {lr}
	; ARM-linux-NEXT: bl __morestack			; ARM-linux-NEXT: bl __morestack
	; ARM-linux-NEXT: ldm sp!, {lr}			; ARM-linux-NEXT: ldm sp!, {lr}
	; ARM-linux-NEXT: pop {r4, r5}			; ARM-linux-NEXT: pop {r4, r5}
	; ARM-linux-NEXT: bx lr			; ARM-linux-NEXT: bx lr

	; ARM-linux: pop {r4, r5}			; ARM-linux: pop {r4, r5}

	; ARM-android: test_large:			; ARM-linux: .LCPI2_0:
				; ARM-linux-NEXT: .long 40192

				; ARM-android-LABEL: test_large:

	; ARM-android: push {r4, r5}			; ARM-android: push {r4, r5}
				; ARM-android-NEXT: ldr r4, .LCPI2_0
				; ARM-android-NEXT: sub r5, sp, r4
	; ARM-android-NEXT: mrc p15, #0, r4, c13, c0, #3			; ARM-android-NEXT: mrc p15, #0, r4, c13, c0, #3
	; ARM-android-NEXT: sub r5, sp, #40192
	; ARM-android-NEXT: ldr r4, [r4, #252]			; ARM-android-NEXT: ldr r4, [r4, #252]
	; ARM-android-NEXT: cmp r4, r5			; ARM-android-NEXT: cmp r4, r5
	; ARM-android-NEXT: blo .LBB2_2			; ARM-android-NEXT: blo .LBB2_2

	; ARM-android: mov r4, #40192			; ARM-android: ldr r4, .LCPI2_0
	; ARM-android-NEXT: mov r5, #0			; ARM-android-NEXT: mov r5, #0
	; ARM-android-NEXT: stmdb sp!, {lr}			; ARM-android-NEXT: stmdb sp!, {lr}
	; ARM-android-NEXT: bl __morestack			; ARM-android-NEXT: bl __morestack
	; ARM-android-NEXT: ldm sp!, {lr}			; ARM-android-NEXT: ldm sp!, {lr}
	; ARM-android-NEXT: pop {r4, r5}			; ARM-android-NEXT: pop {r4, r5}
	; ARM-android-NEXT: bx lr			; ARM-android-NEXT: bx lr

	; ARM-android: pop {r4, r5}			; ARM-android: pop {r4, r5}

				; ARM-android: .LCPI2_0:
				; ARM-android-NEXT: .long 40192

	}			}

	define fastcc void @test_fastcc() #0 {			define fastcc void @test_fastcc() #0 {
	%mem = alloca i32, i32 10			%mem = alloca i32, i32 10
	call void @dummy_use (i32* %mem, i32 10)			call void @dummy_use (i32* %mem, i32 10)
	ret void			ret void

	; ARM-linux: test_fastcc:			; ARM-linux-LABEL: test_fastcc:

	; ARM-linux: push {r4, r5}			; ARM-linux: push {r4, r5}
	; ARM-linux-NEXT: mrc p15, #0, r4, c13, c0, #3			; ARM-linux-NEXT: mrc p15, #0, r4, c13, c0, #3
	; ARM-linux-NEXT: mov r5, sp			; ARM-linux-NEXT: mov r5, sp
	; ARM-linux-NEXT: ldr r4, [r4, #4]			; ARM-linux-NEXT: ldr r4, [r4, #4]
	; ARM-linux-NEXT: cmp r4, r5			; ARM-linux-NEXT: cmp r4, r5
	; ARM-linux-NEXT: blo .LBB3_2			; ARM-linux-NEXT: blo .LBB3_2

	; ARM-linux: mov r4, #48			; ARM-linux: mov r4, #48
	; ARM-linux-NEXT: mov r5, #0			; ARM-linux-NEXT: mov r5, #0
	; ARM-linux-NEXT: stmdb sp!, {lr}			; ARM-linux-NEXT: stmdb sp!, {lr}
	; ARM-linux-NEXT: bl __morestack			; ARM-linux-NEXT: bl __morestack
	; ARM-linux-NEXT: ldm sp!, {lr}			; ARM-linux-NEXT: ldm sp!, {lr}
	; ARM-linux-NEXT: pop {r4, r5}			; ARM-linux-NEXT: pop {r4, r5}
	; ARM-linux-NEXT: bx lr			; ARM-linux-NEXT: bx lr

	; ARM-linux: pop {r4, r5}			; ARM-linux: pop {r4, r5}

	; ARM-android: test_fastcc:			; ARM-android-LABEL: test_fastcc:

	; ARM-android: push {r4, r5}			; ARM-android: push {r4, r5}
	; ARM-android-NEXT: mrc p15, #0, r4, c13, c0, #3			; ARM-android-NEXT: mrc p15, #0, r4, c13, c0, #3
	; ARM-android-NEXT: mov r5, sp			; ARM-android-NEXT: mov r5, sp
	; ARM-android-NEXT: ldr r4, [r4, #252]			; ARM-android-NEXT: ldr r4, [r4, #252]
	; ARM-android-NEXT: cmp r4, r5			; ARM-android-NEXT: cmp r4, r5
	; ARM-android-NEXT: blo .LBB3_2			; ARM-android-NEXT: blo .LBB3_2

	Show All 9 Lines

	}			}

	define fastcc void @test_fastcc_large() #0 {			define fastcc void @test_fastcc_large() #0 {
	%mem = alloca i32, i32 10000			%mem = alloca i32, i32 10000
	call void @dummy_use (i32* %mem, i32 0)			call void @dummy_use (i32* %mem, i32 0)
	ret void			ret void

	; ARM-linux: test_fastcc_large:			; ARM-linux-LABEL: test_fastcc_large:

	; ARM-linux: push {r4, r5}			; ARM-linux: push {r4, r5}
				; ARM-linux-NEXT: ldr r4, .LCPI4_0
				; ARM-linux-NEXT: sub r5, sp, r4
	; ARM-linux-NEXT: mrc p15, #0, r4, c13, c0, #3			; ARM-linux-NEXT: mrc p15, #0, r4, c13, c0, #3
	; ARM-linux-NEXT: sub r5, sp, #40192
	; ARM-linux-NEXT: ldr r4, [r4, #4]			; ARM-linux-NEXT: ldr r4, [r4, #4]
	; ARM-linux-NEXT: cmp r4, r5			; ARM-linux-NEXT: cmp r4, r5
	; ARM-linux-NEXT: blo .LBB4_2			; ARM-linux-NEXT: blo .LBB4_2

	; ARM-linux: mov r4, #40192			; ARM-linux: ldr r4, .LCPI4_0
	; ARM-linux-NEXT: mov r5, #0			; ARM-linux-NEXT: mov r5, #0
	; ARM-linux-NEXT: stmdb sp!, {lr}			; ARM-linux-NEXT: stmdb sp!, {lr}
	; ARM-linux-NEXT: bl __morestack			; ARM-linux-NEXT: bl __morestack
	; ARM-linux-NEXT: ldm sp!, {lr}			; ARM-linux-NEXT: ldm sp!, {lr}
	; ARM-linux-NEXT: pop {r4, r5}			; ARM-linux-NEXT: pop {r4, r5}
	; ARM-linux-NEXT: bx lr			; ARM-linux-NEXT: bx lr

	; ARM-linux: pop {r4, r5}			; ARM-linux: pop {r4, r5}

	; ARM-android: test_fastcc_large:			; ARM-linux: .LCPI4_0:
				; ARM-linux-NEXT: .long 40192

				; ARM-android-LABEL: test_fastcc_large:

	; ARM-android: push {r4, r5}			; ARM-android: push {r4, r5}
				; ARM-android-NEXT: ldr r4, .LCPI4_0
				; ARM-android-NEXT: sub r5, sp, r4
	; ARM-android-NEXT: mrc p15, #0, r4, c13, c0, #3			; ARM-android-NEXT: mrc p15, #0, r4, c13, c0, #3
	; ARM-android-NEXT: sub r5, sp, #40192
	; ARM-android-NEXT: ldr r4, [r4, #252]			; ARM-android-NEXT: ldr r4, [r4, #252]
	; ARM-android-NEXT: cmp r4, r5			; ARM-android-NEXT: cmp r4, r5
	; ARM-android-NEXT: blo .LBB4_2			; ARM-android-NEXT: blo .LBB4_2

	; ARM-android: mov r4, #40192			; ARM-android: ldr r4, .LCPI4_0
	; ARM-android-NEXT: mov r5, #0			; ARM-android-NEXT: mov r5, #0
	; ARM-android-NEXT: stmdb sp!, {lr}			; ARM-android-NEXT: stmdb sp!, {lr}
	; ARM-android-NEXT: bl __morestack			; ARM-android-NEXT: bl __morestack
	; ARM-android-NEXT: ldm sp!, {lr}			; ARM-android-NEXT: ldm sp!, {lr}
	; ARM-android-NEXT: pop {r4, r5}			; ARM-android-NEXT: pop {r4, r5}
	; ARM-android-NEXT: bx lr			; ARM-android-NEXT: bx lr

	; ARM-android: pop {r4, r5}			; ARM-android: pop {r4, r5}

				; ARM-android: .LCPI4_0:
				; ARM-android-NEXT: .long 40192

	}			}

	define void @test_nostack() #0 {			define void @test_nostack() #0 {
	ret void			ret void

	; ARM-linux-LABEL: test_nostack:			; ARM-linux-LABEL: test_nostack:
	; ARM-linux-NOT: bl __morestack			; ARM-linux-NOT: bl __morestack

	; ARM-android-LABEL: test_nostack:			; ARM-android-LABEL: test_nostack:
	; ARM-android-NOT: bl __morestack			; ARM-android-NOT: bl __morestack
	}			}

	; Test to make sure that a morestack call is generated if there is a			; Test to make sure that a morestack call is generated if there is a
	; sibling call, even if the function in question has no stack frame			; sibling call, even if the function in question has no stack frame
	; (PR37807).			; (PR37807).

	declare i32 @callee(i32)			declare i32 @callee(i32)

	define i32 @test_sibling_call_empty_frame(i32 %x) #0 {			define i32 @test_sibling_call_empty_frame(i32 %x) #0 {
	%call = tail call i32 @callee(i32 %x) #0			%call = tail call i32 @callee(i32 %x) #0
	ret i32 %call			ret i32 %call

	; ARM-linux: test_sibling_call_empty_frame:			; ARM-linux-LABEL: test_sibling_call_empty_frame:
	; ARM-linux: bl __morestack			; ARM-linux: bl __morestack

	; ARM-android: test_sibling_call_empty_frame:			; ARM-android-LABEL: test_sibling_call_empty_frame:
	; ARM-android: bl __morestack			; ARM-android: bl __morestack

	}			}

	attributes #0 = { "split-stack" }			attributes #0 = { "split-stack" }

llvm/test/CodeGen/Thumb/segmented-stacks.ll

Show First 20 Lines • Show All 110 Lines • ▼ Show 20 Lines	define void @test_large() #0 {
%mem = alloca i32, i32 10000		%mem = alloca i32, i32 10000
call void @dummy_use (i32* %mem, i32 0)		call void @dummy_use (i32* %mem, i32 0)
ret void		ret void

; Thumb-android-LABEL: test_large:		; Thumb-android-LABEL: test_large:

; Thumb-android: push {r4, r5}		; Thumb-android: push {r4, r5}
; Thumb-android-NEXT: mov r5, sp		; Thumb-android-NEXT: mov r5, sp
; Thumb-android-NEXT: sub r5, #40192
; Thumb-android-NEXT: ldr r4, .LCPI2_2		; Thumb-android-NEXT: ldr r4, .LCPI2_2
		; Thumb-android-NEXT: sub r5, r5, r4
		; Thumb-android-NEXT: ldr r4, .LCPI2_3
; Thumb-android-NEXT: ldr r4, [r4]		; Thumb-android-NEXT: ldr r4, [r4]
; Thumb-android-NEXT: cmp r4, r5		; Thumb-android-NEXT: cmp r4, r5
; Thumb-android-NEXT: blo .LBB2_2		; Thumb-android-NEXT: blo .LBB2_2

; Thumb-android: mov r4, #40192		; Thumb-android: ldr r4, .LCPI2_2
; Thumb-android-NEXT: mov r5, #0		; Thumb-android-NEXT: mov r5, #0
; Thumb-android-NEXT: push {lr}		; Thumb-android-NEXT: push {lr}
; Thumb-android-NEXT: bl __morestack		; Thumb-android-NEXT: bl __morestack
; Thumb-android-NEXT: pop {r4}		; Thumb-android-NEXT: pop {r4}
; Thumb-android-NEXT: mov lr, r4		; Thumb-android-NEXT: mov lr, r4
; Thumb-android-NEXT: pop {r4, r5}		; Thumb-android-NEXT: pop {r4, r5}
; Thumb-android-NEXT: bx lr		; Thumb-android-NEXT: bx lr

; Thumb-android: pop {r4, r5}		; Thumb-android: pop {r4, r5}

		; Thumb-android: .LCPI2_2:
		; Thumb-android-NEXT: .long 40192

; Thumb-linux-LABEL: test_large:		; Thumb-linux-LABEL: test_large:

; Thumb-linux: push {r4, r5}		; Thumb-linux: push {r4, r5}
; Thumb-linux-NEXT: mov r5, sp		; Thumb-linux-NEXT: mov r5, sp
; Thumb-linux-NEXT: sub r5, #40192
; Thumb-linux-NEXT: ldr r4, .LCPI2_2		; Thumb-linux-NEXT: ldr r4, .LCPI2_2
		; Thumb-linux-NEXT: sub r5, r5, r4
		; Thumb-linux-NEXT: ldr r4, .LCPI2_3
; Thumb-linux-NEXT: ldr r4, [r4]		; Thumb-linux-NEXT: ldr r4, [r4]
; Thumb-linux-NEXT: cmp r4, r5		; Thumb-linux-NEXT: cmp r4, r5
; Thumb-linux-NEXT: blo .LBB2_2		; Thumb-linux-NEXT: blo .LBB2_2

; Thumb-linux: mov r4, #40192		; Thumb-linux: ldr r4, .LCPI2_2
; Thumb-linux-NEXT: mov r5, #0		; Thumb-linux-NEXT: mov r5, #0
; Thumb-linux-NEXT: push {lr}		; Thumb-linux-NEXT: push {lr}
; Thumb-linux-NEXT: bl __morestack		; Thumb-linux-NEXT: bl __morestack
; Thumb-linux-NEXT: pop {r4}		; Thumb-linux-NEXT: pop {r4}
; Thumb-linux-NEXT: mov lr, r4		; Thumb-linux-NEXT: mov lr, r4
; Thumb-linux-NEXT: pop {r4, r5}		; Thumb-linux-NEXT: pop {r4, r5}
; Thumb-linux-NEXT: bx lr		; Thumb-linux-NEXT: bx lr

▲ Show 20 Lines • Show All 52 Lines • ▼ Show 20 Lines	define fastcc void @test_fastcc_large() #0 {
%mem = alloca i32, i32 10000		%mem = alloca i32, i32 10000
call void @dummy_use (i32* %mem, i32 0)		call void @dummy_use (i32* %mem, i32 0)
ret void		ret void

; Thumb-android-LABEL: test_fastcc_large:		; Thumb-android-LABEL: test_fastcc_large:

; Thumb-android: push {r4, r5}		; Thumb-android: push {r4, r5}
; Thumb-android-NEXT: mov r5, sp		; Thumb-android-NEXT: mov r5, sp
; Thumb-android-NEXT: sub r5, #40192
; Thumb-android-NEXT: ldr r4, .LCPI4_2		; Thumb-android-NEXT: ldr r4, .LCPI4_2
		; Thumb-android-NEXT: sub r5, r5, r4
		; Thumb-android-NEXT: ldr r4, .LCPI4_3
; Thumb-android-NEXT: ldr r4, [r4]		; Thumb-android-NEXT: ldr r4, [r4]
; Thumb-android-NEXT: cmp r4, r5		; Thumb-android-NEXT: cmp r4, r5
; Thumb-android-NEXT: blo .LBB4_2		; Thumb-android-NEXT: blo .LBB4_2

; Thumb-android: mov r4, #40192		; Thumb-android: ldr r4, .LCPI4_2
; Thumb-android-NEXT: mov r5, #0		; Thumb-android-NEXT: mov r5, #0
; Thumb-android-NEXT: push {lr}		; Thumb-android-NEXT: push {lr}
; Thumb-android-NEXT: bl __morestack		; Thumb-android-NEXT: bl __morestack
; Thumb-android-NEXT: pop {r4}		; Thumb-android-NEXT: pop {r4}
; Thumb-android-NEXT: mov lr, r4		; Thumb-android-NEXT: mov lr, r4
; Thumb-android-NEXT: pop {r4, r5}		; Thumb-android-NEXT: pop {r4, r5}
; Thumb-android-NEXT: bx lr		; Thumb-android-NEXT: bx lr

; Thumb-android: pop {r4, r5}		; Thumb-android: pop {r4, r5}

		; Thumb-android: .LCPI4_2:
		; Thumb-android-NEXT: .long 40192

; Thumb-linux-LABEL: test_fastcc_large:		; Thumb-linux-LABEL: test_fastcc_large:

; Thumb-linux: push {r4, r5}		; Thumb-linux: push {r4, r5}
; Thumb-linux-NEXT: mov r5, sp		; Thumb-linux-NEXT: mov r5, sp
; Thumb-linux-NEXT: sub r5, #40192
; Thumb-linux-NEXT: ldr r4, .LCPI4_2		; Thumb-linux-NEXT: ldr r4, .LCPI4_2
		; Thumb-linux-NEXT: sub r5, r5, r4
		; Thumb-linux-NEXT: ldr r4, .LCPI4_3
; Thumb-linux-NEXT: ldr r4, [r4]		; Thumb-linux-NEXT: ldr r4, [r4]
; Thumb-linux-NEXT: cmp r4, r5		; Thumb-linux-NEXT: cmp r4, r5
; Thumb-linux-NEXT: blo .LBB4_2		; Thumb-linux-NEXT: blo .LBB4_2

; Thumb-linux: mov r4, #40192		; Thumb-linux: ldr r4, .LCPI4_2
; Thumb-linux-NEXT: mov r5, #0		; Thumb-linux-NEXT: mov r5, #0
; Thumb-linux-NEXT: push {lr}		; Thumb-linux-NEXT: push {lr}
; Thumb-linux-NEXT: bl __morestack		; Thumb-linux-NEXT: bl __morestack
; Thumb-linux-NEXT: pop {r4}		; Thumb-linux-NEXT: pop {r4}
; Thumb-linux-NEXT: mov lr, r4		; Thumb-linux-NEXT: mov lr, r4
; Thumb-linux-NEXT: pop {r4, r5}		; Thumb-linux-NEXT: pop {r4, r5}
; Thumb-linux-NEXT: bx lr		; Thumb-linux-NEXT: bx lr

; Thumb-linux: pop {r4, r5}		; Thumb-linux: pop {r4, r5}

		; Thumb-linux: .LCPI4_2:
		; Thumb-linux-NEXT: .long 40192

}		}

define void @test_nostack() #0 {		define void @test_nostack() #0 {
ret void		ret void

; Thumb-android-LABEL: test_nostack:		; Thumb-android-LABEL: test_nostack:
; Thumb-android-NOT: bl __morestack		; Thumb-android-NOT: bl __morestack

; Thumb-linux-LABEL: test_nostack:		; Thumb-linux-LABEL: test_nostack:
; Thumb-linux-NOT: bl __morestack		; Thumb-linux-NOT: bl __morestack
}		}

attributes #0 = { "split-stack" }		attributes #0 = { "split-stack" }

llvm/test/CodeGen/Thumb2/segmented-stacks.ll

	Show First 20 Lines • Show All 61 Lines • ▼ Show 20 Lines
	; ARM-NEXT: bl dummy_use			; ARM-NEXT: bl dummy_use
	; ARM-NEXT: add sp, sp, #40			; ARM-NEXT: add sp, sp, #40
	; ARM-NEXT: pop {r11, pc}			; ARM-NEXT: pop {r11, pc}
	%mem = alloca i32, i32 10			%mem = alloca i32, i32 10
	call void @dummy_use (i32* %mem, i32 10)			call void @dummy_use (i32* %mem, i32 10)
	ret void			ret void
	}			}

				define void @test_large() #0 {
				%mem = alloca i32, i32 10000
				call void @dummy_use (i32* %mem, i32 0)
				ret void

				; THUMB-LABEL: test_large:

				; THUMB: push {r4, r5}
				; THUMB-NEXT: movw r4, #40192
				; THUMB-NEXT: mov r5, sp
				; THUMB-NEXT: movt r4, #0
				; THUMB-NEXT: sub r5, r5, r4
				; THUMB-NEXT: mrc p15, #0, r4, c13, c0, #3
				; THUMB-NEXT: ldr.w r4, [r4, #252]
				; THUMB-NEXT: cmp r4, r5
				; THUMB-NEXT: blo .LBB1_2

				; THUMB: movw r4, #40192
				; THUMB-NEXT: movt r4, #0
				; THUMB-NEXT: mov r5, #0
				; THUMB-NEXT: push {lr}
				; THUMB-NEXT: bl __morestack
				; THUMB-NEXT: ldr lr, [sp], #4
				; THUMB-NEXT: pop {r4, r5}
				; THUMB-NEXT: bx lr

				; THUMB: pop {r4, r5}


				; ARM-LABEL: test_large:

				; ARM: push {r4, r5}
				; ARM-NEXT: ldr r4, .LCPI1_0
				; ARM-NEXT: sub r5, sp, r4
				; ARM-NEXT: mrc p15, #0, r4, c13, c0, #3
				; ARM-NEXT: ldr r4, [r4, #252]
				; ARM-NEXT: cmp r4, r5
				; ARM-NEXT: blo .LBB1_2

				; ARM: ldr r4, .LCPI1_0
				; ARM-NEXT: mov r5, #0
				; ARM-NEXT: stmdb sp!, {lr}
				; ARM-NEXT: bl __morestack
				; ARM-NEXT: ldm sp!, {lr}
				; ARM-NEXT: pop {r4, r5}
				; ARM-NEXT: bx lr

				; ARM: pop {r4, r5}

				; ARM: .LCPI1_0:
				; ARM-NEXT: .long 40192

				}

				define fastcc void @test_fastcc_large() #0 {
				%mem = alloca i32, i32 10000
				call void @dummy_use (i32* %mem, i32 0)
				ret void

				; THUMB-LABEL: test_fastcc_large:

				; THUMB: push {r4, r5}
				; THUMB-NEXT: movw r4, #40192
				; THUMB-NEXT: mov r5, sp
				; THUMB-NEXT: movt r4, #0
				; THUMB-NEXT: sub r5, r5, r4
				; THUMB-NEXT: mrc p15, #0, r4, c13, c0, #3
				; THUMB-NEXT: ldr.w r4, [r4, #252]
				; THUMB-NEXT: cmp r4, r5
				; THUMB-NEXT: blo .LBB2_2

				; THUMB: movw r4, #40192
				; THUMB-NEXT: movt r4, #0
				; THUMB-NEXT: mov r5, #0
				; THUMB-NEXT: push {lr}
				; THUMB-NEXT: bl __morestack
				; THUMB-NEXT: ldr lr, [sp], #4
				; THUMB-NEXT: pop {r4, r5}
				; THUMB-NEXT: bx lr

				; THUMB: pop {r4, r5}

				; ARM-LABEL: test_fastcc_large:

				; ARM: push {r4, r5}
				; ARM-NEXT: ldr r4, .LCPI2_0
				; ARM-NEXT: sub r5, sp, r4
				; ARM-NEXT: mrc p15, #0, r4, c13, c0, #3
				; ARM-NEXT: ldr r4, [r4, #252]
				; ARM-NEXT: cmp r4, r5
				; ARM-NEXT: blo .LBB2_2

				; ARM: ldr r4, .LCPI2_0
				; ARM-NEXT: mov r5, #0
				; ARM-NEXT: stmdb sp!, {lr}
				; ARM-NEXT: bl __morestack
				; ARM-NEXT: ldm sp!, {lr}
				; ARM-NEXT: pop {r4, r5}
				; ARM-NEXT: bx lr

				; ARM: .LCPI2_0:
				; ARM-NEXT: .long 40192
				}

	attributes #0 = { "split-stack" }			attributes #0 = { "split-stack" }

This is an archive of the discontinued LLVM Phabricator instance.

[ARM] Fix 8-bit immediate overflow in the instruction of segmented stack prologue.ClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 414511

llvm/lib/Target/ARM/ARMFrameLowering.cpp

llvm/test/CodeGen/ARM/segmented-stacks.ll

llvm/test/CodeGen/Thumb/segmented-stacks.ll

llvm/test/CodeGen/Thumb2/segmented-stacks.ll

[ARM] Fix 8-bit immediate overflow in the instruction of segmented stack prologue.
ClosedPublic