This is an archive of the discontinued LLVM Phabricator instance.

Paths

Table of Contentst

-
llvm/
-
lib/Target/RISCV/
-
Target/
-
RISCV/
-
RISCVRegisterInfo.cpp
-
test/CodeGen/RISCV/rvv/
-
CodeGen/
-
RISCV/
-
rvv/
-
addi-scalable-offset.mir
1/1
emergency-slot.mir

Differential D100847

[RISCV] Further fixes for RVV stack offset computation
ClosedPublic

Authored by frasercrmck on Apr 20 2021, 5:31 AM.

Download Raw Diff

Details

Reviewers

HsiangKai
craig.topper
khchen
StephenFan
rogfer01
evandro

Commits

rG3f02d269433e: [RISCV] Further fixes for RVV stack offset computation

Summary

This patch fixes a case missed out by D100574, in which RVV scalable
stack offset computations may require three live registers in the case
where the offset's fixed component is 12 bits or larger and has a
scalable component.

Instead of adding an additional emergency spill slot, this patch further
optimizes the scalable stack offset computation sequences to reduce
register usage.

By emitting the sequence to compute the scalable component before the
fixed component, we can free up one scratch register to be reallocated
by the sequence for the fixed component. Doing this saves one register
and thus one additional emergency spill slot.

Compare:

$x5 = LUI 1
$x1 = ADDIW killed $x5, -1896
$x1 = ADD $x2, killed $x1
$x5 = PseudoReadVLENB
$x6 = ADDI $x0, 50
$x5 = MUL killed $x5, killed $x6
$x1 = ADD killed $x1, killed $x5

versus:

$x5 = PseudoReadVLENB
$x1 = ADDI $x0, 50
$x5 = MUL killed $x5, killed $x1
$x1 = LUI 1
$x1 = ADDIW killed $x1, -1896
$x1 = ADD $x2, killed $x1
$x1 = ADD killed $x1, killed $x5

Diff Detail

Repository: rG LLVM Github Monorepo

Event Timeline

frasercrmck created this revision.Apr 20 2021, 5:31 AM

Herald added subscribers: vkmr, luismarques, apazos and 22 others. · View Herald TranscriptApr 20 2021, 5:31 AM

frasercrmck requested review of this revision.Apr 20 2021, 5:31 AM

Herald added a project: Restricted Project. · View Herald TranscriptApr 20 2021, 5:31 AM

Herald added subscribers: llvm-commits, MaskRay. · View Herald Transcript

frasercrmck added inline comments.Apr 20 2021, 5:32 AM

llvm/test/CodeGen/RISCV/rvv/emergency-slot.mir
154	I should have noticed this in the earlier patch, we were using three registers but since `$x9` isn't a live-in to the successor block it wasn't requiring an emergency spill lot.

Harbormaster completed remote builds in B99697: Diff 338837.Apr 20 2021, 6:59 AM

It makes sense to me. Thanks for optimizing the sequence further.

This revision is now accepted and ready to land.Apr 20 2021, 10:22 AM

Closed by commit rG3f02d269433e: [RISCV] Further fixes for RVV stack offset computation (authored by frasercrmck). · Explain WhyApr 21 2021, 2:58 AM

This revision was automatically updated to reflect the committed changes.

frasercrmck added a commit: rG3f02d269433e: [RISCV] Further fixes for RVV stack offset computation.

Revision Contents

Path

Size

llvm/

lib/

Target/

RISCV/

RISCVRegisterInfo.cpp

39 lines

test/

CodeGen/

RISCV/

rvv/

addi-scalable-offset.mir

2 lines

emergency-slot.mir

30 lines

Diff 339157

llvm/lib/Target/RISCV/RISCVRegisterInfo.cpp

Show First 20 Lines • Show All 207 Lines • ▼ Show 20 Lines	void RISCVRegisterInfo::eliminateFrameIndex(MachineBasicBlock::iterator II,
if (!isInt<32>(Offset.getFixed())) {		if (!isInt<32>(Offset.getFixed())) {
report_fatal_error(		report_fatal_error(
"Frame offsets outside of the signed 32-bit range not supported");		"Frame offsets outside of the signed 32-bit range not supported");
}		}

MachineBasicBlock &MBB = *MI.getParent();		MachineBasicBlock &MBB = *MI.getParent();
bool FrameRegIsKill = false;		bool FrameRegIsKill = false;

		// If required, pre-compute the scalable factor amount which will be used in
		// later offset computation. Since this sequence requires up to two scratch
		// registers -- after which one is made free -- this grants us better
		// scavenging of scratch registers as only up to two are live at one time,
		// rather than three.
		Register ScalableFactorRegister;
		unsigned ScalableAdjOpc = RISCV::ADD;
		if (Offset.getScalable()) {
		int64_t ScalableValue = Offset.getScalable();
		if (ScalableValue < 0) {
		ScalableValue = -ScalableValue;
		ScalableAdjOpc = RISCV::SUB;
		}
		// 1. Get vlenb && multiply vlen with the number of vector registers.
		ScalableFactorRegister =
		TII->getVLENFactoredAmount(MF, MBB, II, ScalableValue);
		}

if (!isInt<12>(Offset.getFixed())) {		if (!isInt<12>(Offset.getFixed())) {
// The offset won't fit in an immediate, so use a scratch register instead		// The offset won't fit in an immediate, so use a scratch register instead
// Modify Offset and FrameReg appropriately		// Modify Offset and FrameReg appropriately
Register ScratchReg = MRI.createVirtualRegister(&RISCV::GPRRegClass);		Register ScratchReg = MRI.createVirtualRegister(&RISCV::GPRRegClass);
TII->movImm(MBB, II, DL, ScratchReg, Offset.getFixed());		TII->movImm(MBB, II, DL, ScratchReg, Offset.getFixed());
if (MI.getOpcode() == RISCV::ADDI && !Offset.getScalable()) {		if (MI.getOpcode() == RISCV::ADDI && !Offset.getScalable()) {
BuildMI(MBB, II, DL, TII->get(RISCV::ADD), MI.getOperand(0).getReg())		BuildMI(MBB, II, DL, TII->get(RISCV::ADD), MI.getOperand(0).getReg())
.addReg(FrameReg)		.addReg(FrameReg)
Show All 22 Lines	else {
.addReg(FrameReg, getKillRegState(FrameRegIsKill))		.addReg(FrameReg, getKillRegState(FrameRegIsKill))
.addImm(Offset.getFixed());		.addImm(Offset.getFixed());
MI.getOperand(FIOperandNum)		MI.getOperand(FIOperandNum)
.ChangeToRegister(ScratchReg, false, false, true);		.ChangeToRegister(ScratchReg, false, false, true);
}		}
}		}
} else {		} else {
// Offset = (fixed offset, scalable offset)		// Offset = (fixed offset, scalable offset)
unsigned Opc = RISCV::ADD;		// Step 1, the scalable offset, has already been computed.
int64_t ScalableValue = Offset.getScalable();		assert(ScalableFactorRegister &&
if (ScalableValue < 0) {		"Expected pre-computation of scalable factor in earlier step");
ScalableValue = -ScalableValue;
Opc = RISCV::SUB;
}

// 1. Get vlenb && multiply vlen with number of vector register.
Register FactorRegister =
TII->getVLENFactoredAmount(MF, MBB, II, ScalableValue);

// 2. Calculate address: FrameReg + result of multiply		// 2. Calculate address: FrameReg + result of multiply
if (MI.getOpcode() == RISCV::ADDI && !Offset.getFixed()) {		if (MI.getOpcode() == RISCV::ADDI && !Offset.getFixed()) {
BuildMI(MBB, II, DL, TII->get(Opc), MI.getOperand(0).getReg())		BuildMI(MBB, II, DL, TII->get(ScalableAdjOpc), MI.getOperand(0).getReg())
.addReg(FrameReg, getKillRegState(FrameRegIsKill))		.addReg(FrameReg, getKillRegState(FrameRegIsKill))
.addReg(FactorRegister, RegState::Kill);		.addReg(ScalableFactorRegister, RegState::Kill);
MI.eraseFromParent();		MI.eraseFromParent();
return;		return;
}		}
Register VL = MRI.createVirtualRegister(&RISCV::GPRRegClass);		Register VL = MRI.createVirtualRegister(&RISCV::GPRRegClass);
BuildMI(MBB, II, DL, TII->get(Opc), VL)		BuildMI(MBB, II, DL, TII->get(ScalableAdjOpc), VL)
.addReg(FrameReg, getKillRegState(FrameRegIsKill))		.addReg(FrameReg, getKillRegState(FrameRegIsKill))
.addReg(FactorRegister, RegState::Kill);		.addReg(ScalableFactorRegister, RegState::Kill);

if (isRVV && Offset.getFixed()) {		if (isRVV && Offset.getFixed()) {
// Scalable load/store has no immediate argument. We need to add the		// Scalable load/store has no immediate argument. We need to add the
// fixed part into the load/store base address.		// fixed part into the load/store base address.
BuildMI(MBB, II, DL, TII->get(RISCV::ADDI), VL)		BuildMI(MBB, II, DL, TII->get(RISCV::ADDI), VL)
.addReg(VL)		.addReg(VL)
.addImm(Offset.getFixed());		.addImm(Offset.getFixed());
}		}
▲ Show 20 Lines • Show All 52 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/rvv/addi-scalable-offset.mir

Show All 34 Lines	bb.0:
; CHECK: CFI_INSTRUCTION offset $x8, -16		; CHECK: CFI_INSTRUCTION offset $x8, -16
; CHECK: $x8 = frame-setup ADDI $x2, 2032		; CHECK: $x8 = frame-setup ADDI $x2, 2032
; CHECK: CFI_INSTRUCTION def_cfa $x8, 0		; CHECK: CFI_INSTRUCTION def_cfa $x8, 0
; CHECK: $x2 = frame-setup ADDI $x2, -240		; CHECK: $x2 = frame-setup ADDI $x2, -240
; CHECK: $x12 = PseudoReadVLENB		; CHECK: $x12 = PseudoReadVLENB
; CHECK: $x2 = SUB $x2, killed $x12		; CHECK: $x2 = SUB $x2, killed $x12
; CHECK: dead renamable $x11 = PseudoVSETVLI killed renamable $x11, 88, implicit-def $vl, implicit-def $vtype		; CHECK: dead renamable $x11 = PseudoVSETVLI killed renamable $x11, 88, implicit-def $vl, implicit-def $vtype
; CHECK: renamable $v25 = PseudoVLE64_V_M1 killed renamable $x10, $noreg, 64, implicit $vl, implicit $vtype :: (load unknown-size from %ir.pa, align 8)		; CHECK: renamable $v25 = PseudoVLE64_V_M1 killed renamable $x10, $noreg, 64, implicit $vl, implicit $vtype :: (load unknown-size from %ir.pa, align 8)
		; CHECK: $x11 = PseudoReadVLENB
; CHECK: $x10 = LUI 1048575		; CHECK: $x10 = LUI 1048575
; CHECK: $x10 = ADDIW killed $x10, 1824		; CHECK: $x10 = ADDIW killed $x10, 1824
; CHECK: $x10 = ADD $x8, killed $x10		; CHECK: $x10 = ADD $x8, killed $x10
; CHECK: $x11 = PseudoReadVLENB
; CHECK: $x10 = SUB killed $x10, killed $x11		; CHECK: $x10 = SUB killed $x10, killed $x11
; CHECK: VS1R_V killed renamable $v25, killed renamable $x10		; CHECK: VS1R_V killed renamable $v25, killed renamable $x10
; CHECK: $x10 = PseudoReadVLENB		; CHECK: $x10 = PseudoReadVLENB
; CHECK: $x2 = ADD $x2, killed $x10		; CHECK: $x2 = ADD $x2, killed $x10
; CHECK: $x2 = frame-destroy ADDI $x2, 240		; CHECK: $x2 = frame-destroy ADDI $x2, 240
; CHECK: $x8 = LD $x2, 2016 :: (load 8 from %stack.4)		; CHECK: $x8 = LD $x2, 2016 :: (load 8 from %stack.4)
; CHECK: $x1 = LD $x2, 2024 :: (load 8 from %stack.3)		; CHECK: $x1 = LD $x2, 2024 :: (load 8 from %stack.3)
; CHECK: $x2 = frame-destroy ADDI $x2, 2032		; CHECK: $x2 = frame-destroy ADDI $x2, 2032
Show All 9 Lines

llvm/test/CodeGen/RISCV/rvv/emergency-slot.mir

Show First 20 Lines • Show All 84 Lines • ▼ Show 20 Lines	body: \|
; CHECK: $x2 = frame-setup ADDI $x2, -272		; CHECK: $x2 = frame-setup ADDI $x2, -272
; CHECK: $x10 = PseudoReadVLENB		; CHECK: $x10 = PseudoReadVLENB
; CHECK: $x11 = ADDI $x0, 51		; CHECK: $x11 = ADDI $x0, 51
; CHECK: $x10 = MUL killed $x10, killed $x11		; CHECK: $x10 = MUL killed $x10, killed $x11
; CHECK: $x2 = SUB $x2, killed $x10		; CHECK: $x2 = SUB $x2, killed $x10
; CHECK: $x2 = ANDI $x2, -128		; CHECK: $x2 = ANDI $x2, -128
; CHECK: dead renamable $x15 = PseudoVSETIVLI 1, 72, implicit-def $vl, implicit-def $vtype		; CHECK: dead renamable $x15 = PseudoVSETIVLI 1, 72, implicit-def $vl, implicit-def $vtype
; CHECK: renamable $v25 = PseudoVMV_V_X_M1 killed renamable $x12, $noreg, 16, implicit $vl, implicit $vtype		; CHECK: renamable $v25 = PseudoVMV_V_X_M1 killed renamable $x12, $noreg, 16, implicit $vl, implicit $vtype
		; CHECK: $x11 = PseudoReadVLENB
		; CHECK: $x10 = ADDI $x0, 50
		; CHECK: $x11 = MUL killed $x11, killed $x10
; CHECK: $x10 = LUI 1		; CHECK: $x10 = LUI 1
; CHECK: $x10 = ADDIW killed $x10, -1896		; CHECK: $x10 = ADDIW killed $x10, -1896
; CHECK: $x10 = ADD $x2, killed $x10		; CHECK: $x10 = ADD $x2, killed $x10
; CHECK: $x11 = PseudoReadVLENB
; CHECK: $x12 = ADDI $x0, 50
; CHECK: $x11 = MUL killed $x11, killed $x12
; CHECK: $x10 = ADD killed $x10, killed $x11		; CHECK: $x10 = ADD killed $x10, killed $x11
; CHECK: PseudoVSPILL_M1 killed renamable $v25, killed $x10 :: (store unknown-size into %stack.1, align 8)		; CHECK: PseudoVSPILL_M1 killed renamable $v25, killed $x10 :: (store unknown-size into %stack.1, align 8)
; CHECK: renamable $x1 = ADDI $x0, 255		; CHECK: renamable $x1 = ADDI $x0, 255
; CHECK: renamable $x5 = nuw ADDI $x2, 384		; CHECK: renamable $x5 = nuw ADDI $x2, 384
; CHECK: renamable $x6 = ADDI $x2, 512		; CHECK: renamable $x6 = ADDI $x2, 512
; CHECK: renamable $x7 = nuw ADDI $x2, 640		; CHECK: renamable $x7 = nuw ADDI $x2, 640
; CHECK: renamable $x10 = ADDI $x0, 128		; CHECK: renamable $x10 = ADDI $x0, 128
; CHECK: renamable $x12 = nuw ADDI $x2, 256		; CHECK: renamable $x12 = nuw ADDI $x2, 256
Show All 21 Lines	body: \|
; CHECK: renamable $x11 = ANDI renamable $x15, 255		; CHECK: renamable $x11 = ANDI renamable $x15, 255
; CHECK: renamable $x13 = SLLI renamable $x11, 3		; CHECK: renamable $x13 = SLLI renamable $x11, 3
; CHECK: renamable $x13 = ADD renamable $x26, killed renamable $x13		; CHECK: renamable $x13 = ADD renamable $x26, killed renamable $x13
; CHECK: renamable $x13 = LD killed renamable $x13, 0 :: (load 8)		; CHECK: renamable $x13 = LD killed renamable $x13, 0 :: (load 8)
; CHECK: renamable $x9 = SRAI renamable $x13, 63		; CHECK: renamable $x9 = SRAI renamable $x13, 63
; CHECK: renamable $x9 = SRLI killed renamable $x9, 62		; CHECK: renamable $x9 = SRLI killed renamable $x9, 62
; CHECK: renamable $x9 = ADD renamable $x13, killed renamable $x9		; CHECK: renamable $x9 = ADD renamable $x13, killed renamable $x9
; CHECK: renamable $x9 = ANDI killed renamable $x9, -4		; CHECK: renamable $x9 = ANDI killed renamable $x9, -4
; CHECK: renamable $x16 = SUB killed renamable $x13, killed renamable $x9		; CHECK: renamable $x16 = SUB killed renamable $x13, renamable $x9
; CHECK: dead renamable $x13 = PseudoVSETIVLI 1, 64, implicit-def $vl, implicit-def $vtype		; CHECK: dead renamable $x13 = PseudoVSETIVLI 1, 64, implicit-def $vl, implicit-def $vtype
; CHECK: renamable $x13 = nsw ADDI renamable $x16, -2		; CHECK: renamable $x13 = nsw ADDI renamable $x16, -2
; CHECK: $x5 = LUI 1		; CHECK: $x5 = PseudoReadVLENB
; CHECK: $x9 = ADDIW killed $x5, -1896		; CHECK: $x1 = ADDI $x0, 50
; CHECK: $x9 = ADD $x2, killed $x9		; CHECK: $x5 = MUL killed $x5, killed $x1
; CHECK: $x1 = PseudoReadVLENB		; CHECK: $x1 = LUI 1
; CHECK: $x5 = ADDI $x0, 50		; CHECK: $x1 = ADDIW killed $x1, -1896
; CHECK: $x1 = MUL killed $x1, killed $x5		; CHECK: $x1 = ADD $x2, killed $x1
		; CHECK: $x1 = ADD killed $x1, killed $x5
; CHECK: $x5 = LD $x2, 0 :: (load 8 from %stack.17)		; CHECK: $x5 = LD $x2, 0 :: (load 8 from %stack.17)
; CHECK: $x9 = ADD killed $x9, killed $x1		; CHECK: renamable $v0 = PseudoVRELOAD_M1 killed $x1 :: (load unknown-size from %stack.1, align 8)
; CHECK: $x1 = LD $x2, 8 :: (load 8 from %stack.16)		; CHECK: $x1 = LD $x2, 8 :: (load 8 from %stack.16)
; CHECK: renamable $v0 = PseudoVRELOAD_M1 killed $x9 :: (load unknown-size from %stack.1, align 8)
; CHECK: renamable $v0 = PseudoVSLIDEDOWN_VX_M1 undef renamable $v0, killed renamable $v0, killed renamable $x13, $noreg, 8, implicit $vl, implicit $vtype		; CHECK: renamable $v0 = PseudoVSLIDEDOWN_VX_M1 undef renamable $v0, killed renamable $v0, killed renamable $x13, $noreg, 8, implicit $vl, implicit $vtype
; CHECK: renamable $x13 = PseudoVMV_X_S_M1 killed renamable $v0, 8, implicit $vl, implicit $vtype		; CHECK: renamable $x13 = PseudoVMV_X_S_M1 killed renamable $v0, 8, implicit $vl, implicit $vtype
; CHECK: BLT killed renamable $x16, renamable $x27, %bb.2		; CHECK: BLT killed renamable $x16, renamable $x27, %bb.2
; CHECK: bb.1:		; CHECK: bb.1:
; CHECK: successors: %bb.2(0x80000000)		; CHECK: successors: %bb.2(0x80000000)
; CHECK: liveins: $x1, $x5, $x6, $x7, $x10, $x11, $x12, $x13, $x14, $x15, $x17, $x18, $x19, $x20, $x21, $x22, $x23, $x24, $x25, $x26, $x27, $x28, $x29, $x30, $x31		; CHECK: liveins: $x1, $x5, $x6, $x7, $x9, $x10, $x11, $x12, $x13, $x14, $x15, $x17, $x18, $x19, $x20, $x21, $x22, $x23, $x24, $x25, $x26, $x27, $x28, $x29, $x30, $x31
		frasercrmckAuthorUnsubmitted Done Reply Inline Actions I should have noticed this in the earlier patch, we were using three registers but since `$x9` isn't a live-in to the successor block it wasn't requiring an emergency spill lot. frasercrmck: I should have noticed this in the earlier patch, we //were// using three registers but since…
; CHECK: renamable $x9 = COPY killed renamable $x13		; CHECK: renamable $x9 = COPY killed renamable $x13
; CHECK: PseudoBR %bb.2		; CHECK: PseudoBR %bb.2
; CHECK: bb.2:		; CHECK: bb.2:
; CHECK: $x10 = frame-destroy LUI 1		; CHECK: $x10 = frame-destroy LUI 1
; CHECK: $x10 = frame-destroy ADDIW killed $x10, -1792		; CHECK: $x10 = frame-destroy ADDIW killed $x10, -1792
; CHECK: $x2 = frame-destroy SUB $x8, killed $x10		; CHECK: $x2 = frame-destroy SUB $x8, killed $x10
; CHECK: $x2 = frame-destroy ADDI $x2, 272		; CHECK: $x2 = frame-destroy ADDI $x2, 272
; CHECK: $x27 = LD $x2, 1928 :: (load 8 from %stack.15)		; CHECK: $x27 = LD $x2, 1928 :: (load 8 from %stack.15)
▲ Show 20 Lines • Show All 44 Lines • ▼ Show 20 Lines	bb.0:
renamable $x11 = ANDI renamable $x15, 255		renamable $x11 = ANDI renamable $x15, 255
renamable $x13 = SLLI renamable $x11, 3		renamable $x13 = SLLI renamable $x11, 3
renamable $x13 = ADD renamable $x26, killed renamable $x13		renamable $x13 = ADD renamable $x26, killed renamable $x13
renamable $x13 = LD killed renamable $x13, 0 :: (load 8)		renamable $x13 = LD killed renamable $x13, 0 :: (load 8)
renamable $x9 = SRAI renamable $x13, 63		renamable $x9 = SRAI renamable $x13, 63
renamable $x9 = SRLI killed renamable $x9, 62		renamable $x9 = SRLI killed renamable $x9, 62
renamable $x9 = ADD renamable $x13, killed renamable $x9		renamable $x9 = ADD renamable $x13, killed renamable $x9
renamable $x9 = ANDI killed renamable $x9, -4		renamable $x9 = ANDI killed renamable $x9, -4
renamable $x16 = SUB killed renamable $x13, killed renamable $x9		renamable $x16 = SUB killed renamable $x13, renamable $x9
dead renamable $x13 = PseudoVSETIVLI 1, 64, implicit-def $vl, implicit-def $vtype		dead renamable $x13 = PseudoVSETIVLI 1, 64, implicit-def $vl, implicit-def $vtype
renamable $x13 = nsw ADDI renamable $x16, -2		renamable $x13 = nsw ADDI renamable $x16, -2
renamable $v0 = PseudoVRELOAD_M1 %stack.1 :: (load unknown-size from %stack.1, align 8)		renamable $v0 = PseudoVRELOAD_M1 %stack.1 :: (load unknown-size from %stack.1, align 8)
renamable $v0 = PseudoVSLIDEDOWN_VX_M1 undef renamable $v0, killed renamable $v0, killed renamable $x13, $noreg, 8, implicit $vl, implicit $vtype		renamable $v0 = PseudoVSLIDEDOWN_VX_M1 undef renamable $v0, killed renamable $v0, killed renamable $x13, $noreg, 8, implicit $vl, implicit $vtype
renamable $x13 = PseudoVMV_X_S_M1 killed renamable $v0, 8, implicit $vl, implicit $vtype		renamable $x13 = PseudoVMV_X_S_M1 killed renamable $v0, 8, implicit $vl, implicit $vtype
BLT killed renamable $x16, renamable $x27, %bb.2		BLT killed renamable $x16, renamable $x27, %bb.2

bb.1:		bb.1:
successors: %bb.2		successors: %bb.2
liveins: $x1, $x5, $x6, $x7, $x10, $x11, $x12, $x13, $x14, $x15, $x17, $x18, $x19, $x20, $x21, $x22, $x23, $x24, $x25, $x26, $x27, $x28, $x29, $x30, $x31		liveins: $x1, $x5, $x6, $x7, $x9, $x10, $x11, $x12, $x13, $x14, $x15, $x17, $x18, $x19, $x20, $x21, $x22, $x23, $x24, $x25, $x26, $x27, $x28, $x29, $x30, $x31

renamable $x9 = COPY killed renamable $x13		renamable $x9 = COPY killed renamable $x13
PseudoBR %bb.2		PseudoBR %bb.2

bb.2:		bb.2:
PseudoRET		PseudoRET
...		...