This is an archive of the discontinued LLVM Phabricator instance.

Paths

Table of Contentst

-
llvm/
-
lib/
-
CodeGen/
-
RegAllocGreedy.cpp
-
Target/
-
AArch64/
-
AArch64RegisterInfo.h
-
PowerPC/
-
PPCRegisterInfo.h
-
X86/
-
X86RegisterInfo.h
-
test/
-
CodeGen/
-
AArch64/
-
cgp-usubo.ll
-
csr-split.ll
-
PowerPC/
-
2008-10-28-f128-i32.ll
-
csr-split.ll
2/2
tail-dup-break-cfg.ll
-
X86/
-
atom-fixup-lea2.ll
-
block-placement.ll
-
bmi.ll
-
callbr-asm-branch-folding.ll
-
cgp-usubo.ll
-
csr-split.ll
-
fp128-cast.ll
-
peep-test-4.ll
-
ragreedy-bug.ll
-
ragreedy-hoist-spill.ll
-
regalloc-advanced-split-cost.ll
-
sjlj-eh.ll
-
speculative-load-hardening.ll
-
tail-dup-merge-loop-headers.ll
-
tail-opts.ll
-
tbm_patterns.ll
-
x86-shrink-wrapping.ll
-
DebugInfo/X86/
-
X86/
-
live-debug-values.ll

Differential D66576

[Regalloc][WIP] Increase CSR cost in RegAllocGreedy to favour splitting/spill over CSR first use
Needs ReviewPublic

Authored by lkail on Aug 22 2019, 1:13 AM.

Download Raw Diff

Details

Reviewers

qcolombet
wmi
nemanjai
hfinkel
MatzeB
jsji
dmgreen
• wuzish
ZhangKang
dexonsmith

Group Reviewers

Restricted Project

Summary

It's trying to solve the issue which was proposed at D32201 and D27366 before.

The register allocator currently favors allocating a CSR over splitting/spilling a region. This in effect results in introducing more opportunity to save/restore CSR registers at prologue/epilogue. It hurts performance especially when there is no need of prologue/epilogue for the hot path. If we can save/restore non-CSR across call, then we don't use CSR during the function and we don't need to save/restore them at prologue/epilogue.

It also influences the shrink-wrapping directly if we must use CSR during the function. For now copies of parameter registers into CSR's in the entry block when the parameter is live across any calls in the function. And of course, this disables shrink-wrapping because the save point then must be the entry block. After the patch, live ranges allocated to CSR registers will be shortened and will only be used in cold places, so that we may get better chances to do shrink-wrapping.

I refine the adjusting CSR cost to enhance the RegAllocGreedy to favour splitting/spill the virtual register which is being allocated instead of allocate CSR directly. If use CSR, we need add load/store pair in prologue/epilogue. So if the cost caused by spillings which is introduced by trying to avoid using CSR is larger than load/store pair in prologue/epilogue, we would choose to use CSR. I make the raw cost to be 1 because the cost is load/store pair in prologue/epilogue if use CSR. so the cost is 1 time spill like the cost calculated in SpillPlacer. Then we need scale the cost relative to entry frequency.

It can directly help to expand the opportunity exposed to shrink-wrapping at later phase because it causes the use of CSR is delayed to the BB with the call instead of entry BB.It's trying to avoid the magic cost number for different target. The CSRCost is a relative times corresponding to the spill operation in prologue/epilogue.

Diff Detail

Event Timeline

• wuzish created this revision.Aug 22 2019, 1:13 AM

Herald added a project: Restricted Project. · View Herald TranscriptAug 22 2019, 1:13 AM

Herald added subscribers: llvm-commits, MaskRay, hiraditya. · View Herald Transcript

This is a WIP draft and I have not fixed all check-all cases now. I want to get some quick feedback whether it's on the right direction and whether its performance is good at all different target. If you have time, could you please review it or give some comments, and help me to verify the performance at other targets?

Can you add tests for atleast x86/arm and precommit them + rebase?

dexonsmith resigned from this revision.Aug 25 2019, 8:17 AM

• wuzish mentioned this in rL369877: [NFC][Regalloc] Add testcases for D66576.Aug 25 2019, 10:06 PM

• wuzish mentioned this in rGe18aa1e0a2d3: [NFC][Regalloc] Add testcases for D66576.Aug 25 2019, 10:10 PM

Enable it for AARCH64 and x86, and address testcases.

Herald added subscribers: jfb, kbarton, javed.absar. · View Herald TranscriptAug 26 2019, 1:22 AM

Could anybody run some bmk to see the performance result of AARCH64 and X86?
I have run on PowerPC, it has good influence in some bmks of spec2017 and no obvious degression.

Can the patch description please be updated to contain a dumbed down explanation of the issue this is solving?

+ @dmgreen for arm benchmarks

xbolva00 removed a reviewer: xbolva00.Aug 30 2019, 8:51 AM

• wuzish edited the summary of this revision. (Show Details)Sep 2 2019, 1:05 AM

• wuzish added a reviewer: dmgreen.

• wuzish added a reviewer: Restricted Project.Sep 2 2019, 10:16 PM

gentle pin...

.AMDGPU also override the getCSRFirstUseCost() but your patch didn't catch that. And would you please post some improve number for powerpc of this patch ?

llvm/test/CodeGen/PowerPC/tail-dup-break-cfg.ll
2	I suggest that, you should commit a NFC patch to update the CHCK first.

ZhangKang added a reviewer: ZhangKang.Oct 10 2019, 10:21 PM

In D66576#1660216, @steven.zhang wrote:

.AMDGPU also override the getCSRFirstUseCost() but your patch didn't catch that. And would you please post some improve number for powerpc of this patch ?

Not done; would be good to have some perf numbers here, for ppc and x86

In D66576#1705534, @lebedev.ri wrote:

In D66576#1660216, @steven.zhang wrote:

.AMDGPU also override the getCSRFirstUseCost() but your patch didn't catch that. And would you please post some improve number for powerpc of this patch ?

Not done; would be good to have some perf numbers here, for ppc and x86

We have test this patch(getCSRFirstUseCost () return 1) on PowerPC.
For spec base, there are 6 cases has improved more that 1%, the largest improvement case is 3.63%, no case degraded more than 1%.
For spec peak, there are 5 cases has improved more that 1%, the largest improvement case is 5.9%, only one case degraded more than 1%(1.76%).
Overall, the base & peak reset has been improved after this patch on PPC.

ZhangKang commandeered this revision.Oct 11 2019, 2:39 AM

ZhangKang edited reviewers, added: • wuzish; removed: ZhangKang.

Do you have numbers also for x86?

In D66576#1705646, @xbolva00 wrote:

Do you have numbers also for x86?

No, I don't have. I'm sorry that I have no x86 test machine.

In D66576#1705646, @xbolva00 wrote:

Do you have numbers also for x86?

@xbolva00 , I think this patch should have a good performance on X86, but I don't have a X86 performance machine to confirm it, Could you help me to test the spec performance for this patch on X86 or tell me who I can ask for help to do the test?

I can.. but next week.

Maybe @Carrot @evandro @fhahn could check it too.

lebedev.ri added inline comments.Oct 18 2019, 2:32 AM

llvm/test/CodeGen/PowerPC/tail-dup-layout.ll
116–136 ↗	(On Diff #217086)	Please precommit all NFC test regenerations first, and rebase the patch.

In D66576#1714164, @xbolva00 wrote:

I can.. but next week.

Maybe @Carrot @evandro @fhahn could check it too.

@xbolva00 , I am very glad to hear that you can do this test. Thank you very much!!!

ZhangKang marked 2 inline comments as done.Oct 23 2019, 6:23 PM

ZhangKang added inline comments.

llvm/test/CodeGen/PowerPC/tail-dup-break-cfg.ll
2	This is a WIP draft and have not fixed all check-all cases now. I want to get some quick feedback whether it's on the right direction and whether its performance is good at all different target. If this patch is OK for others, I will commit a NFC patch to update the CHECK.

Tested on x86-64, -O3, spec 2006. Observed small improvements here and there.. Overall spec int score +0.2.

bzip possibly regressed a bit.. 1%. But it could be noise..

Without patch
347 346 346

With patch
351 351 352

phlav added a subscriber: phlav.Oct 25 2019, 10:03 AM

Update the test cases using the tool update_llc_test_checks.py.

Use the script to update the test cases.

lkail commandeered this revision.Sep 9 2020, 11:32 PM

lkail added a reviewer: ZhangKang.

Revision Contents

Path

Size

llvm/

lib/

CodeGen/

RegAllocGreedy.cpp

24 lines

Target/

AArch64/

AArch64RegisterInfo.h

7 lines

PowerPC/

PPCRegisterInfo.h

6 lines

X86/

X86RegisterInfo.h

6 lines

test/

CodeGen/

AArch64/

cgp-usubo.ll

27 lines

csr-split.ll

4 lines

PowerPC/

2008-10-28-f128-i32.ll

3 lines

csr-split.ll

29 lines

tail-dup-break-cfg.ll

48 lines

X86/

atom-fixup-lea2.ll

30 lines

block-placement.ll

217 lines

bmi.ll

194 lines

callbr-asm-branch-folding.ll

43 lines

36 lines

2 lines

20 lines

18 lines

334 lines

ragreedy-hoist-spill.ll

102 lines

regalloc-advanced-split-cost.ll

42 lines

sjlj-eh.ll

4 lines

speculative-load-hardening.ll

147 lines

tail-dup-merge-loop-headers.ll

24 lines

tail-opts.ll

66 lines

tbm_patterns.ll

64 lines

x86-shrink-wrapping.ll

38 lines

DebugInfo/

X86/

live-debug-values.ll

2 lines

Diff 227018

llvm/lib/CodeGen/RegAllocGreedy.cpp

	Show First 20 Lines • Show All 2,836 Lines • ▼ Show 20 Lines
	}			}

	void RAGreedy::aboutToRemoveInterval(LiveInterval &LI) {			void RAGreedy::aboutToRemoveInterval(LiveInterval &LI) {
	// Do not keep invalid information around.			// Do not keep invalid information around.
	SetOfBrokenHints.remove(&LI);			SetOfBrokenHints.remove(&LI);
	}			}

	void RAGreedy::initializeCSRCost() {			void RAGreedy::initializeCSRCost() {
	// We use the larger one out of the command-line option and the value report			// We need scale the cost relative to entry freq.
	// by TRI.			CSRCost = BlockFrequency(MBFI->getEntryFreq() * TRI->getCSRFirstUseCost());
	CSRCost = BlockFrequency(
	std::max((unsigned)CSRFirstTimeCost, TRI->getCSRFirstUseCost()));
	if (!CSRCost.getFrequency())
	return;

	// Raw cost is relative to Entry == 2^14; scale it appropriately.
	uint64_t ActualEntry = MBFI->getEntryFreq();
	if (!ActualEntry) {
	CSRCost = 0;
	return;
	}
	uint64_t FixedEntry = 1 << 14;
	if (ActualEntry < FixedEntry)
	CSRCost *= BranchProbability(ActualEntry, FixedEntry);
	else if (ActualEntry <= UINT32_MAX)
	// Invert the fraction and divide.
	CSRCost /= BranchProbability(FixedEntry, ActualEntry);
	else
	// Can't use BranchProbability in general, since it takes 32-bit numbers.
	CSRCost = CSRCost.getFrequency() * (ActualEntry / FixedEntry);
	}			}

	/// Collect the hint info for \p Reg.			/// Collect the hint info for \p Reg.
	/// The results are stored into \p Out.			/// The results are stored into \p Out.
	/// \p Out is not cleared before being populated.			/// \p Out is not cleared before being populated.
	void RAGreedy::collectHintInfo(unsigned Reg, HintsInfo &Out) {			void RAGreedy::collectHintInfo(unsigned Reg, HintsInfo &Out) {
	for (const MachineInstr &Instr : MRI->reg_nodbg_instructions(Reg)) {			for (const MachineInstr &Instr : MRI->reg_nodbg_instructions(Reg)) {
	if (!Instr.isFullCopy())			if (!Instr.isFullCopy())
	▲ Show 20 Lines • Show All 392 Lines • Show Last 20 Lines

llvm/lib/Target/AArch64/AArch64RegisterInfo.h

Show First 20 Lines • Show All 44 Lines • ▼ Show 20 Lines	public:
/// Code Generation virtual methods...		/// Code Generation virtual methods...
const MCPhysReg getCalleeSavedRegs(const MachineFunction MF) const override;		const MCPhysReg getCalleeSavedRegs(const MachineFunction MF) const override;
const MCPhysReg *		const MCPhysReg *
getCalleeSavedRegsViaCopy(const MachineFunction *MF) const;		getCalleeSavedRegsViaCopy(const MachineFunction *MF) const;
const uint32_t *getCallPreservedMask(const MachineFunction &MF,		const uint32_t *getCallPreservedMask(const MachineFunction &MF,
CallingConv::ID) const override;		CallingConv::ID) const override;

unsigned getCSRFirstUseCost() const override {		unsigned getCSRFirstUseCost() const override {
// The cost will be compared against BlockFrequency where entry has the		// If use CSR, the cost is load/store pair in prologue/epilogue.
// value of 1 << 14. A value of 5 will choose to spill or split really		// So the cost is 1 time spill like the cost calculated in SpillPlacer.
// cold path instead of using a callee-saved register.		return 1;
return 5;
}		}

const TargetRegisterClass *		const TargetRegisterClass *
getSubClassWithSubReg(const TargetRegisterClass *RC,		getSubClassWithSubReg(const TargetRegisterClass *RC,
unsigned Idx) const override;		unsigned Idx) const override;

// Calls involved in thread-local variable lookup save more registers than		// Calls involved in thread-local variable lookup save more registers than
// normal calls, so they need a different mask to represent this.		// normal calls, so they need a different mask to represent this.
▲ Show 20 Lines • Show All 66 Lines • Show Last 20 Lines

llvm/lib/Target/PowerPC/PPCRegisterInfo.h

Show First 20 Lines • Show All 94 Lines • ▼ Show 20 Lines	public:
bool trackLivenessAfterRegAlloc(const MachineFunction &MF) const override {		bool trackLivenessAfterRegAlloc(const MachineFunction &MF) const override {
return true;		return true;
}		}

bool requiresVirtualBaseRegisters(const MachineFunction &MF) const override {		bool requiresVirtualBaseRegisters(const MachineFunction &MF) const override {
return true;		return true;
}		}

		unsigned getCSRFirstUseCost() const override {
		// If use CSR, the cost is load/store pair in prologue/epilogue.
		// So the cost is 1 time spill like the cost calculated in SpillPlacer.
		return 1;
		}

void lowerDynamicAlloc(MachineBasicBlock::iterator II) const;		void lowerDynamicAlloc(MachineBasicBlock::iterator II) const;
void lowerDynamicAreaOffset(MachineBasicBlock::iterator II) const;		void lowerDynamicAreaOffset(MachineBasicBlock::iterator II) const;
void lowerCRSpilling(MachineBasicBlock::iterator II,		void lowerCRSpilling(MachineBasicBlock::iterator II,
unsigned FrameIndex) const;		unsigned FrameIndex) const;
void lowerCRRestore(MachineBasicBlock::iterator II,		void lowerCRRestore(MachineBasicBlock::iterator II,
unsigned FrameIndex) const;		unsigned FrameIndex) const;
void lowerCRBitSpilling(MachineBasicBlock::iterator II,		void lowerCRBitSpilling(MachineBasicBlock::iterator II,
unsigned FrameIndex) const;		unsigned FrameIndex) const;
▲ Show 20 Lines • Show All 51 Lines • Show Last 20 Lines

llvm/lib/Target/X86/X86RegisterInfo.h

Show First 20 Lines • Show All 103 Lines • ▼ Show 20 Lines	public:
const MCPhysReg *		const MCPhysReg *
getCalleeSavedRegs(const MachineFunction* MF) const override;		getCalleeSavedRegs(const MachineFunction* MF) const override;
const MCPhysReg *		const MCPhysReg *
getCalleeSavedRegsViaCopy(const MachineFunction *MF) const;		getCalleeSavedRegsViaCopy(const MachineFunction *MF) const;
const uint32_t *getCallPreservedMask(const MachineFunction &MF,		const uint32_t *getCallPreservedMask(const MachineFunction &MF,
CallingConv::ID) const override;		CallingConv::ID) const override;
const uint32_t *getNoPreservedMask() const override;		const uint32_t *getNoPreservedMask() const override;

		unsigned getCSRFirstUseCost() const override {
		// If use CSR, the cost is load/store pair in prologue/epilogue.
		// So the cost is 1 time spill like the cost calculated in SpillPlacer.
		return 1;
		}

// Calls involved in thread-local variable lookup save more registers than		// Calls involved in thread-local variable lookup save more registers than
// normal calls, so they need a different mask to represent this.		// normal calls, so they need a different mask to represent this.
const uint32_t *getDarwinTLSCallPreservedMask() const;		const uint32_t *getDarwinTLSCallPreservedMask() const;

/// getReservedRegs - Returns a bitset indexed by physical register number		/// getReservedRegs - Returns a bitset indexed by physical register number
/// indicating if a register is a special register that has particular uses and		/// indicating if a register is a special register that has particular uses and
/// should be considered unavailable at all times, e.g. SP, RA. This is used by		/// should be considered unavailable at all times, e.g. SP, RA. This is used by
/// register scavenger to determine what registers are free.		/// register scavenger to determine what registers are free.
Show All 33 Lines

llvm/test/CodeGen/AArch64/cgp-usubo.ll

	Show First 20 Lines • Show All 145 Lines • ▼ Show 20 Lines
	end:			end:
	%ov = icmp ult i64 %x, %y			%ov = icmp ult i64 %x, %y
	ret i1 %ov			ret i1 %ov
	}			}

	define i1 @usubo_ult_cmp_dominates_i64(i64 %x, i64 %y, i64* %p, i1 %cond) nounwind {			define i1 @usubo_ult_cmp_dominates_i64(i64 %x, i64 %y, i64* %p, i1 %cond) nounwind {
	; CHECK-LABEL: usubo_ult_cmp_dominates_i64:			; CHECK-LABEL: usubo_ult_cmp_dominates_i64:
	; CHECK: // %bb.0: // %entry			; CHECK: // %bb.0: // %entry
	; CHECK-NEXT: str x30, [sp, #-48]! // 8-byte Folded Spill			; CHECK-NEXT: sub sp, sp, #48 // =48
				; CHECK-NEXT: str x30, [sp, #16] // 8-byte Folded Spill
	; CHECK-NEXT: stp x20, x19, [sp, #32] // 16-byte Folded Spill			; CHECK-NEXT: stp x20, x19, [sp, #32] // 16-byte Folded Spill
	; CHECK-NEXT: mov w20, w3
	; CHECK-NEXT: stp x22, x21, [sp, #16] // 16-byte Folded Spill
	; CHECK-NEXT: tbz w3, #0, .LBB8_3			; CHECK-NEXT: tbz w3, #0, .LBB8_3
	; CHECK-NEXT: // %bb.1: // %t			; CHECK-NEXT: // %bb.1: // %t
	; CHECK-NEXT: cmp x0, x1			; CHECK-NEXT: cmp x0, x1
	; CHECK-NEXT: mov x22, x0			; CHECK-NEXT: cset w8, lo
	; CHECK-NEXT: cset w0, lo			; CHECK-NEXT: mov x19, x0
	; CHECK-NEXT: mov x19, x2			; CHECK-NEXT: mov w0, w8
	; CHECK-NEXT: mov x21, x1			; CHECK-NEXT: str x2, [sp, #24] // 8-byte Folded Spill
				; CHECK-NEXT: str w3, [sp, #12] // 4-byte Folded Spill
				; CHECK-NEXT: mov x20, x1
	; CHECK-NEXT: bl call			; CHECK-NEXT: bl call
	; CHECK-NEXT: subs x8, x22, x21			; CHECK-NEXT: ldr w3, [sp, #12] // 4-byte Folded Reload
				; CHECK-NEXT: ldr x8, [sp, #24] // 8-byte Folded Reload
				; CHECK-NEXT: subs x9, x19, x20
	; CHECK-NEXT: b.hs .LBB8_3			; CHECK-NEXT: b.hs .LBB8_3
	; CHECK-NEXT: // %bb.2: // %end			; CHECK-NEXT: // %bb.2: // %end
	; CHECK-NEXT: cset w0, lo			; CHECK-NEXT: cset w0, lo
	; CHECK-NEXT: str x8, [x19]			; CHECK-NEXT: str x9, [x8]
	; CHECK-NEXT: b .LBB8_4			; CHECK-NEXT: b .LBB8_4
	; CHECK-NEXT: .LBB8_3: // %f			; CHECK-NEXT: .LBB8_3: // %f
	; CHECK-NEXT: and w0, w20, #0x1			; CHECK-NEXT: and w0, w3, #0x1
	; CHECK-NEXT: .LBB8_4: // %f			; CHECK-NEXT: .LBB8_4: // %f
	; CHECK-NEXT: ldp x20, x19, [sp, #32] // 16-byte Folded Reload			; CHECK-NEXT: ldp x20, x19, [sp, #32] // 16-byte Folded Reload
	; CHECK-NEXT: ldp x22, x21, [sp, #16] // 16-byte Folded Reload			; CHECK-NEXT: ldr x30, [sp, #16] // 8-byte Folded Reload
	; CHECK-NEXT: ldr x30, [sp], #48 // 8-byte Folded Reload			; CHECK-NEXT: add sp, sp, #48 // =48
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	entry:			entry:
	br i1 %cond, label %t, label %f			br i1 %cond, label %t, label %f

	t:			t:
	%ov = icmp ult i64 %x, %y			%ov = icmp ult i64 %x, %y
	call void @call(i1 %ov)			call void @call(i1 %ov)
	br i1 %ov, label %end, label %f			br i1 %ov, label %end, label %f
	Show All 10 Lines

llvm/test/CodeGen/AArch64/csr-split.ll

	Show First 20 Lines • Show All 80 Lines • ▼ Show 20 Lines
	; CHECK-NEXT: stp x30, x19, [sp, #-16]! // 16-byte Folded Spill			; CHECK-NEXT: stp x30, x19, [sp, #-16]! // 16-byte Folded Spill
	; CHECK-NEXT: .cfi_def_cfa_offset 16			; CHECK-NEXT: .cfi_def_cfa_offset 16
	; CHECK-NEXT: .cfi_offset w19, -8			; CHECK-NEXT: .cfi_offset w19, -8
	; CHECK-NEXT: .cfi_offset w30, -16			; CHECK-NEXT: .cfi_offset w30, -16
	; CHECK-NEXT: cbz x0, .LBB1_2			; CHECK-NEXT: cbz x0, .LBB1_2
	; CHECK-NEXT: // %bb.1: // %if.end			; CHECK-NEXT: // %bb.1: // %if.end
	; CHECK-NEXT: adrp x8, a			; CHECK-NEXT: adrp x8, a
	; CHECK-NEXT: ldrsw x8, [x8, :lo12:a]			; CHECK-NEXT: ldrsw x8, [x8, :lo12:a]
	; CHECK-NEXT: mov x19, x0
	; CHECK-NEXT: cmp x8, x0			; CHECK-NEXT: cmp x8, x0
	; CHECK-NEXT: b.eq .LBB1_3			; CHECK-NEXT: b.eq .LBB1_3
	; CHECK-NEXT: .LBB1_2: // %return			; CHECK-NEXT: .LBB1_2: // %return
	; CHECK-NEXT: mov w0, wzr			; CHECK-NEXT: mov w0, wzr
	; CHECK-NEXT: ldp x30, x19, [sp], #16 // 16-byte Folded Reload			; CHECK-NEXT: ldp x30, x19, [sp], #16 // 16-byte Folded Reload
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	; CHECK-NEXT: .LBB1_3: // %if.then2			; CHECK-NEXT: .LBB1_3: // %if.then2
				; CHECK-NEXT: mov x19, x0
	; CHECK-NEXT: bl callVoid			; CHECK-NEXT: bl callVoid
	; CHECK-NEXT: mov x0, x19			; CHECK-NEXT: mov x0, x19
	; CHECK-NEXT: ldp x30, x19, [sp], #16 // 16-byte Folded Reload			; CHECK-NEXT: ldp x30, x19, [sp], #16 // 16-byte Folded Reload
	; CHECK-NEXT: b callNonVoid			; CHECK-NEXT: b callNonVoid
	;			;
	; CHECK-APPLE-LABEL: test2:			; CHECK-APPLE-LABEL: test2:
	; CHECK-APPLE: ; %bb.0: ; %entry			; CHECK-APPLE: ; %bb.0: ; %entry
	; CHECK-APPLE-NEXT: stp x20, x19, [sp, #-32]! ; 16-byte Folded Spill			; CHECK-APPLE-NEXT: stp x20, x19, [sp, #-32]! ; 16-byte Folded Spill
	; CHECK-APPLE-NEXT: stp x29, x30, [sp, #16] ; 16-byte Folded Spill			; CHECK-APPLE-NEXT: stp x29, x30, [sp, #16] ; 16-byte Folded Spill
	; CHECK-APPLE-NEXT: .cfi_def_cfa_offset 32			; CHECK-APPLE-NEXT: .cfi_def_cfa_offset 32
	; CHECK-APPLE-NEXT: .cfi_offset w30, -8			; CHECK-APPLE-NEXT: .cfi_offset w30, -8
	; CHECK-APPLE-NEXT: .cfi_offset w29, -16			; CHECK-APPLE-NEXT: .cfi_offset w29, -16
	; CHECK-APPLE-NEXT: .cfi_offset w19, -24			; CHECK-APPLE-NEXT: .cfi_offset w19, -24
	; CHECK-APPLE-NEXT: .cfi_offset w20, -32			; CHECK-APPLE-NEXT: .cfi_offset w20, -32
	; CHECK-APPLE-NEXT: cbz x0, LBB1_2			; CHECK-APPLE-NEXT: cbz x0, LBB1_2
	; CHECK-APPLE-NEXT: ; %bb.1: ; %if.end			; CHECK-APPLE-NEXT: ; %bb.1: ; %if.end
	; CHECK-APPLE-NEXT: Lloh2:			; CHECK-APPLE-NEXT: Lloh2:
	; CHECK-APPLE-NEXT: adrp x8, _a@PAGE			; CHECK-APPLE-NEXT: adrp x8, _a@PAGE
	; CHECK-APPLE-NEXT: Lloh3:			; CHECK-APPLE-NEXT: Lloh3:
	; CHECK-APPLE-NEXT: ldrsw x8, [x8, _a@PAGEOFF]			; CHECK-APPLE-NEXT: ldrsw x8, [x8, _a@PAGEOFF]
	; CHECK-APPLE-NEXT: mov x19, x0
	; CHECK-APPLE-NEXT: cmp x8, x0			; CHECK-APPLE-NEXT: cmp x8, x0
	; CHECK-APPLE-NEXT: b.eq LBB1_3			; CHECK-APPLE-NEXT: b.eq LBB1_3
	; CHECK-APPLE-NEXT: LBB1_2: ; %return			; CHECK-APPLE-NEXT: LBB1_2: ; %return
	; CHECK-APPLE-NEXT: ldp x29, x30, [sp, #16] ; 16-byte Folded Reload			; CHECK-APPLE-NEXT: ldp x29, x30, [sp, #16] ; 16-byte Folded Reload
	; CHECK-APPLE-NEXT: mov w0, wzr			; CHECK-APPLE-NEXT: mov w0, wzr
	; CHECK-APPLE-NEXT: ldp x20, x19, [sp], #32 ; 16-byte Folded Reload			; CHECK-APPLE-NEXT: ldp x20, x19, [sp], #32 ; 16-byte Folded Reload
	; CHECK-APPLE-NEXT: ret			; CHECK-APPLE-NEXT: ret
	; CHECK-APPLE-NEXT: LBB1_3: ; %if.then2			; CHECK-APPLE-NEXT: LBB1_3: ; %if.then2
				; CHECK-APPLE-NEXT: mov x19, x0
	; CHECK-APPLE-NEXT: bl _callVoid			; CHECK-APPLE-NEXT: bl _callVoid
	; CHECK-APPLE-NEXT: ldp x29, x30, [sp, #16] ; 16-byte Folded Reload			; CHECK-APPLE-NEXT: ldp x29, x30, [sp, #16] ; 16-byte Folded Reload
	; CHECK-APPLE-NEXT: mov x0, x19			; CHECK-APPLE-NEXT: mov x0, x19
	; CHECK-APPLE-NEXT: ldp x20, x19, [sp], #32 ; 16-byte Folded Reload			; CHECK-APPLE-NEXT: ldp x20, x19, [sp], #32 ; 16-byte Folded Reload
	; CHECK-APPLE-NEXT: b _callNonVoid			; CHECK-APPLE-NEXT: b _callNonVoid
	; CHECK-APPLE-NEXT: .loh AdrpLdr Lloh2, Lloh3			; CHECK-APPLE-NEXT: .loh AdrpLdr Lloh2, Lloh3
	entry:			entry:
	%tobool = icmp eq i32* %p1, null			%tobool = icmp eq i32* %p1, null
	▲ Show 20 Lines • Show All 91 Lines • Show Last 20 Lines

llvm/test/CodeGen/PowerPC/2008-10-28-f128-i32.ll

	Show First 20 Lines • Show All 135 Lines • ▼ Show 20 Lines
	; CHECK-NEXT: stw 3, 224(1)			; CHECK-NEXT: stw 3, 224(1)
	; CHECK-NEXT: lwz 3, 204(1)			; CHECK-NEXT: lwz 3, 204(1)
	; CHECK-NEXT: lfd 1, 224(1)			; CHECK-NEXT: lfd 1, 224(1)
	; CHECK-NEXT: stw 3, 220(1)			; CHECK-NEXT: stw 3, 220(1)
	; CHECK-NEXT: lwz 3, 200(1)			; CHECK-NEXT: lwz 3, 200(1)
	; CHECK-NEXT: stw 3, 216(1)			; CHECK-NEXT: stw 3, 216(1)
	; CHECK-NEXT: lfd 2, 216(1)			; CHECK-NEXT: lfd 2, 216(1)
	; CHECK-NEXT: bl __gcc_qadd@PLT			; CHECK-NEXT: bl __gcc_qadd@PLT
				; CHECK-NEXT: mcrf 0, 2
	; CHECK-NEXT: blt 2, .LBB0_7			; CHECK-NEXT: blt 2, .LBB0_7
	; CHECK-NEXT: # %bb.6: # %bb1			; CHECK-NEXT: # %bb.6: # %bb1
	; CHECK-NEXT: fmr 2, 28			; CHECK-NEXT: fmr 2, 28
	; CHECK-NEXT: .LBB0_7: # %bb1			; CHECK-NEXT: .LBB0_7: # %bb1
	; CHECK-NEXT: blt 2, .LBB0_9			; CHECK-NEXT: blt 0, .LBB0_9
	; CHECK-NEXT: # %bb.8: # %bb1			; CHECK-NEXT: # %bb.8: # %bb1
	; CHECK-NEXT: fmr 1, 29			; CHECK-NEXT: fmr 1, 29
	; CHECK-NEXT: .LBB0_9: # %bb1			; CHECK-NEXT: .LBB0_9: # %bb1
	; CHECK-NEXT: stfd 1, 184(1)			; CHECK-NEXT: stfd 1, 184(1)
	; CHECK-NEXT: stfd 2, 192(1)			; CHECK-NEXT: stfd 2, 192(1)
	; CHECK-NEXT: fmr 1, 31			; CHECK-NEXT: fmr 1, 31
	; CHECK-NEXT: lwz 3, 188(1)			; CHECK-NEXT: lwz 3, 188(1)
	; CHECK-NEXT: fmr 2, 30			; CHECK-NEXT: fmr 2, 30
	▲ Show 20 Lines • Show All 182 Lines • Show Last 20 Lines

llvm/test/CodeGen/PowerPC/csr-split.ll

	Show All 12 Lines
	; CHECK-PWR9: # %bb.0: # %entry			; CHECK-PWR9: # %bb.0: # %entry
	; CHECK-PWR9-NEXT: mflr r0			; CHECK-PWR9-NEXT: mflr r0
	; CHECK-PWR9-NEXT: .cfi_def_cfa_offset 48			; CHECK-PWR9-NEXT: .cfi_def_cfa_offset 48
	; CHECK-PWR9-NEXT: .cfi_offset lr, 16			; CHECK-PWR9-NEXT: .cfi_offset lr, 16
	; CHECK-PWR9-NEXT: .cfi_offset r30, -16			; CHECK-PWR9-NEXT: .cfi_offset r30, -16
	; CHECK-PWR9-NEXT: std r30, -16(r1) # 8-byte Folded Spill			; CHECK-PWR9-NEXT: std r30, -16(r1) # 8-byte Folded Spill
	; CHECK-PWR9-NEXT: std r0, 16(r1)			; CHECK-PWR9-NEXT: std r0, 16(r1)
	; CHECK-PWR9-NEXT: stdu r1, -48(r1)			; CHECK-PWR9-NEXT: stdu r1, -48(r1)
	; CHECK-PWR9-NEXT: mr r30, r3			; CHECK-PWR9-NEXT: addis r4, r2, a@toc@ha
	; CHECK-PWR9-NEXT: addis r3, r2, a@toc@ha			; CHECK-PWR9-NEXT: lwa r4, a@toc@l(r4)
	; CHECK-PWR9-NEXT: lwa r3, a@toc@l(r3)			; CHECK-PWR9-NEXT: cmpld r4, r3
	; CHECK-PWR9-NEXT: cmpld r3, r30			; CHECK-PWR9-NEXT: # implicit-def: $r4
	; CHECK-PWR9-NEXT: # implicit-def: $r3
	; CHECK-PWR9-NEXT: bne cr0, .LBB0_2			; CHECK-PWR9-NEXT: bne cr0, .LBB0_2
	; CHECK-PWR9-NEXT: # %bb.1: # %if.then			; CHECK-PWR9-NEXT: # %bb.1: # %if.then
				; CHECK-PWR9-NEXT: mr r30, r3
	; CHECK-PWR9-NEXT: bl callVoid			; CHECK-PWR9-NEXT: bl callVoid
	; CHECK-PWR9-NEXT: nop			; CHECK-PWR9-NEXT: nop
	; CHECK-PWR9-NEXT: mr r3, r30			; CHECK-PWR9-NEXT: mr r3, r30
	; CHECK-PWR9-NEXT: bl callNonVoid			; CHECK-PWR9-NEXT: bl callNonVoid
	; CHECK-PWR9-NEXT: nop			; CHECK-PWR9-NEXT: nop
				; CHECK-PWR9-NEXT: mr r4, r3
	; CHECK-PWR9-NEXT: .LBB0_2: # %if.end			; CHECK-PWR9-NEXT: .LBB0_2: # %if.end
	; CHECK-PWR9-NEXT: extsw r3, r3			; CHECK-PWR9-NEXT: extsw r3, r4
	; CHECK-PWR9-NEXT: addi r1, r1, 48			; CHECK-PWR9-NEXT: addi r1, r1, 48
	; CHECK-PWR9-NEXT: ld r0, 16(r1)			; CHECK-PWR9-NEXT: ld r0, 16(r1)
	; CHECK-PWR9-NEXT: mtlr r0			; CHECK-PWR9-NEXT: mtlr r0
	; CHECK-PWR9-NEXT: ld r30, -16(r1) # 8-byte Folded Reload			; CHECK-PWR9-NEXT: ld r30, -16(r1) # 8-byte Folded Reload
	; CHECK-PWR9-NEXT: blr			; CHECK-PWR9-NEXT: blr
	;			;
	; CHECK-LABEL: test1:			; CHECK-LABEL: test1:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: mflr r0			; CHECK-NEXT: mflr r0
	; CHECK-NEXT: std r0, 16(r1)			; CHECK-NEXT: std r0, 16(r1)
	; CHECK-NEXT: stdu r1, -128(r1)			; CHECK-NEXT: stdu r1, -128(r1)
	; CHECK-NEXT: .cfi_def_cfa_offset 128			; CHECK-NEXT: .cfi_def_cfa_offset 128
	; CHECK-NEXT: .cfi_offset lr, 16			; CHECK-NEXT: .cfi_offset lr, 16
	; CHECK-NEXT: .cfi_offset r30, -16			; CHECK-NEXT: .cfi_offset r30, -16
	; CHECK-NEXT: addis r4, r2, a@toc@ha			; CHECK-NEXT: addis r4, r2, a@toc@ha
	; CHECK-NEXT: std r30, 112(r1) # 8-byte Folded Spill			; CHECK-NEXT: std r30, 112(r1) # 8-byte Folded Spill
	; CHECK-NEXT: mr r30, r3			; CHECK-NEXT: mr r30, r3
	; CHECK-NEXT: lwa r4, a@toc@l(r4)			; CHECK-NEXT: lwa r5, a@toc@l(r4)
	; CHECK-NEXT: cmpld r4, r3			; CHECK-NEXT: cmpld r5, r3
	; CHECK-NEXT: # implicit-def: $r3			; CHECK-NEXT: # implicit-def: $r3
	; CHECK-NEXT: bne cr0, .LBB0_2			; CHECK-NEXT: bne cr0, .LBB0_2
	; CHECK-NEXT: # %bb.1: # %if.then			; CHECK-NEXT: # %bb.1: # %if.then
	; CHECK-NEXT: bl callVoid			; CHECK-NEXT: bl callVoid
	; CHECK-NEXT: nop			; CHECK-NEXT: nop
	; CHECK-NEXT: mr r3, r30			; CHECK-NEXT: mr r3, r30
	; CHECK-NEXT: bl callNonVoid			; CHECK-NEXT: bl callNonVoid
	; CHECK-NEXT: nop			; CHECK-NEXT: nop
	Show All 35 Lines
	; CHECK-PWR9-NEXT: std r30, -16(r1) # 8-byte Folded Spill			; CHECK-PWR9-NEXT: std r30, -16(r1) # 8-byte Folded Spill
	; CHECK-PWR9-NEXT: std r0, 16(r1)			; CHECK-PWR9-NEXT: std r0, 16(r1)
	; CHECK-PWR9-NEXT: stdu r1, -48(r1)			; CHECK-PWR9-NEXT: stdu r1, -48(r1)
	; CHECK-PWR9-NEXT: mr r30, r3			; CHECK-PWR9-NEXT: mr r30, r3
	; CHECK-PWR9-NEXT: li r3, 0			; CHECK-PWR9-NEXT: li r3, 0
	; CHECK-PWR9-NEXT: cmpldi r30, 0			; CHECK-PWR9-NEXT: cmpldi r30, 0
	; CHECK-PWR9-NEXT: beq cr0, .LBB1_3			; CHECK-PWR9-NEXT: beq cr0, .LBB1_3
	; CHECK-PWR9-NEXT: # %bb.1: # %if.end			; CHECK-PWR9-NEXT: # %bb.1: # %if.end
	; CHECK-PWR9-NEXT: addis r4, r2, a@toc@ha			; CHECK-PWR9-NEXT: addis r5, r2, a@toc@ha
	; CHECK-PWR9-NEXT: lwa r4, a@toc@l(r4)			; CHECK-PWR9-NEXT: lwa r5, a@toc@l(r5)
	; CHECK-PWR9-NEXT: cmpld r4, r30			; CHECK-PWR9-NEXT: cmpld r5, r30
	; CHECK-PWR9-NEXT: bne cr0, .LBB1_3			; CHECK-PWR9-NEXT: bne cr0, .LBB1_3
	; CHECK-PWR9-NEXT: # %bb.2: # %if.then2			; CHECK-PWR9-NEXT: # %bb.2: # %if.then2
	; CHECK-PWR9-NEXT: bl callVoid			; CHECK-PWR9-NEXT: bl callVoid
	; CHECK-PWR9-NEXT: nop			; CHECK-PWR9-NEXT: nop
	; CHECK-PWR9-NEXT: mr r3, r30			; CHECK-PWR9-NEXT: mr r3, r30
	; CHECK-PWR9-NEXT: bl callNonVoid			; CHECK-PWR9-NEXT: bl callNonVoid
	; CHECK-PWR9-NEXT: nop			; CHECK-PWR9-NEXT: nop
	; CHECK-PWR9-NEXT: .LBB1_3: # %return			; CHECK-PWR9-NEXT: .LBB1_3: # %return
	Show All 13 Lines
	; CHECK-NEXT: .cfi_offset lr, 16			; CHECK-NEXT: .cfi_offset lr, 16
	; CHECK-NEXT: .cfi_offset r30, -16			; CHECK-NEXT: .cfi_offset r30, -16
	; CHECK-NEXT: std r30, 112(r1) # 8-byte Folded Spill			; CHECK-NEXT: std r30, 112(r1) # 8-byte Folded Spill
	; CHECK-NEXT: mr r30, r3			; CHECK-NEXT: mr r30, r3
	; CHECK-NEXT: cmpldi r3, 0			; CHECK-NEXT: cmpldi r3, 0
	; CHECK-NEXT: li r3, 0			; CHECK-NEXT: li r3, 0
	; CHECK-NEXT: beq cr0, .LBB1_3			; CHECK-NEXT: beq cr0, .LBB1_3
	; CHECK-NEXT: # %bb.1: # %if.end			; CHECK-NEXT: # %bb.1: # %if.end
	; CHECK-NEXT: addis r4, r2, a@toc@ha			; CHECK-NEXT: addis r5, r2, a@toc@ha
	; CHECK-NEXT: lwa r4, a@toc@l(r4)			; CHECK-NEXT: lwa r5, a@toc@l(r5)
	; CHECK-NEXT: cmpld r4, r30			; CHECK-NEXT: cmpld r5, r30
	; CHECK-NEXT: bne cr0, .LBB1_3			; CHECK-NEXT: bne cr0, .LBB1_3
	; CHECK-NEXT: # %bb.2: # %if.then2			; CHECK-NEXT: # %bb.2: # %if.then2
	; CHECK-NEXT: bl callVoid			; CHECK-NEXT: bl callVoid
	; CHECK-NEXT: nop			; CHECK-NEXT: nop
	; CHECK-NEXT: mr r3, r30			; CHECK-NEXT: mr r3, r30
	; CHECK-NEXT: bl callNonVoid			; CHECK-NEXT: bl callNonVoid
	; CHECK-NEXT: nop			; CHECK-NEXT: nop
	; CHECK-NEXT: .LBB1_3: # %return			; CHECK-NEXT: .LBB1_3: # %return
	▲ Show 20 Lines • Show All 116 Lines • Show Last 20 Lines

llvm/test/CodeGen/PowerPC/tail-dup-break-cfg.ll

; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py		; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
; RUN: llc -O2 -o - %s \| FileCheck %s		; RUN: llc -O2 -o - %s \| FileCheck %s
steven.zhangUnsubmitted Done Reply Inline Actions I suggest that, you should commit a NFC patch to update the CHCK first. steven.zhang: I suggest that, you should commit a NFC patch to update the CHCK first.
ZhangKangUnsubmitted Done Reply Inline Actions This is a WIP draft and have not fixed all check-all cases now. I want to get some quick feedback whether it's on the right direction and whether its performance is good at all different target. If this patch is OK for others, I will commit a NFC patch to update the CHECK. ZhangKang: This is a WIP draft and have not fixed all check-all cases now. I want to get some quick…
target datalayout = "e-m:e-i64:64-n32:64"		target datalayout = "e-m:e-i64:64-n32:64"
target triple = "powerpc64le-grtev4-linux-gnu"		target triple = "powerpc64le-grtev4-linux-gnu"

; Intended layout:		; Intended layout:
; The code for tail-duplication during layout will produce the layout:		; The code for tail-duplication during layout will produce the layout:
; test1		; test1
; test2		; test2
; body1 (with copy of test2)		; body1 (with copy of test2)
; body2		; body2
; exit		; exit

define void @tail_dup_break_cfg(i32 %tag) {		define void @tail_dup_break_cfg(i32 %tag) {
; CHECK-LABEL: tail_dup_break_cfg:		; CHECK-LABEL: tail_dup_break_cfg:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: mflr 0		; CHECK-NEXT: mflr 0
; CHECK-NEXT: .cfi_def_cfa_offset 48
; CHECK-NEXT: .cfi_offset lr, 16
; CHECK-NEXT: .cfi_offset r30, -16
; CHECK-NEXT: std 30, -16(1) # 8-byte Folded Spill
; CHECK-NEXT: std 0, 16(1)		; CHECK-NEXT: std 0, 16(1)
; CHECK-NEXT: stdu 1, -48(1)		; CHECK-NEXT: stdu 1, -48(1)
; CHECK-NEXT: mr 30, 3		; CHECK-NEXT: .cfi_def_cfa_offset 48
; CHECK-NEXT: andi. 3, 30, 1		; CHECK-NEXT: .cfi_offset lr, 16
		; CHECK-NEXT: andi. 4, 3, 1
; CHECK-NEXT: bc 12, 1, .LBB0_3		; CHECK-NEXT: bc 12, 1, .LBB0_3
; CHECK-NEXT: # %bb.1: # %test2		; CHECK-NEXT: # %bb.1: # %test2
; CHECK-NEXT: andi. 3, 30, 2		; CHECK-NEXT: andi. 3, 3, 2
; CHECK-NEXT: bne 0, .LBB0_4		; CHECK-NEXT: bne 0, .LBB0_4
; CHECK-NEXT: .LBB0_2: # %exit		; CHECK-NEXT: .LBB0_2: # %exit
; CHECK-NEXT: addi 1, 1, 48		; CHECK-NEXT: addi 1, 1, 48
; CHECK-NEXT: ld 0, 16(1)		; CHECK-NEXT: ld 0, 16(1)
; CHECK-NEXT: mtlr 0		; CHECK-NEXT: mtlr 0
; CHECK-NEXT: ld 30, -16(1) # 8-byte Folded Reload
; CHECK-NEXT: blr		; CHECK-NEXT: blr
; CHECK-NEXT: .LBB0_3: # %body1		; CHECK-NEXT: .LBB0_3: # %body1
		; CHECK-NEXT: std 3, 40(1) # 8-byte Folded Spill
; CHECK-NEXT: bl a		; CHECK-NEXT: bl a
; CHECK-NEXT: nop		; CHECK-NEXT: nop
; CHECK-NEXT: bl a		; CHECK-NEXT: bl a
; CHECK-NEXT: nop		; CHECK-NEXT: nop
; CHECK-NEXT: bl a		; CHECK-NEXT: bl a
; CHECK-NEXT: nop		; CHECK-NEXT: nop
; CHECK-NEXT: bl a		; CHECK-NEXT: bl a
; CHECK-NEXT: nop		; CHECK-NEXT: nop
; CHECK-NEXT: andi. 3, 30, 2		; CHECK-NEXT: ld 3, 40(1) # 8-byte Folded Reload
		; CHECK-NEXT: andi. 3, 3, 2
; CHECK-NEXT: beq 0, .LBB0_2		; CHECK-NEXT: beq 0, .LBB0_2
; CHECK-NEXT: .LBB0_4: # %body2		; CHECK-NEXT: .LBB0_4: # %body2
; CHECK-NEXT: bl b		; CHECK-NEXT: bl b
; CHECK-NEXT: nop		; CHECK-NEXT: nop
; CHECK-NEXT: bl b		; CHECK-NEXT: bl b
; CHECK-NEXT: nop		; CHECK-NEXT: nop
; CHECK-NEXT: bl b		; CHECK-NEXT: bl b
; CHECK-NEXT: nop		; CHECK-NEXT: nop
Show All 26 Lines	exit:
ret void		ret void
}		}

; The branch weights here hint that we shouldn't tail duplicate in this case.		; The branch weights here hint that we shouldn't tail duplicate in this case.
define void @tail_dup_dont_break_cfg(i32 %tag) {		define void @tail_dup_dont_break_cfg(i32 %tag) {
; CHECK-LABEL: tail_dup_dont_break_cfg:		; CHECK-LABEL: tail_dup_dont_break_cfg:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: mflr 0		; CHECK-NEXT: mflr 0
; CHECK-NEXT: .cfi_def_cfa_offset 48
; CHECK-NEXT: .cfi_offset lr, 16
; CHECK-NEXT: .cfi_offset r30, -16
; CHECK-NEXT: std 30, -16(1) # 8-byte Folded Spill
; CHECK-NEXT: std 0, 16(1)		; CHECK-NEXT: std 0, 16(1)
; CHECK-NEXT: stdu 1, -48(1)		; CHECK-NEXT: stdu 1, -48(1)
; CHECK-NEXT: mr 30, 3		; CHECK-NEXT: .cfi_def_cfa_offset 48
; CHECK-NEXT: andi. 3, 30, 1		; CHECK-NEXT: .cfi_offset lr, 16
		; CHECK-NEXT: andi. 4, 3, 1
; CHECK-NEXT: bc 4, 1, .LBB1_2		; CHECK-NEXT: bc 4, 1, .LBB1_2
; CHECK-NEXT: # %bb.1: # %body1		; CHECK-NEXT: # %bb.1: # %body1
		; CHECK-NEXT: std 3, 40(1) # 8-byte Folded Spill
; CHECK-NEXT: bl a		; CHECK-NEXT: bl a
; CHECK-NEXT: nop		; CHECK-NEXT: nop
; CHECK-NEXT: bl a		; CHECK-NEXT: bl a
; CHECK-NEXT: nop		; CHECK-NEXT: nop
; CHECK-NEXT: bl a		; CHECK-NEXT: bl a
; CHECK-NEXT: nop		; CHECK-NEXT: nop
; CHECK-NEXT: bl a		; CHECK-NEXT: bl a
; CHECK-NEXT: nop		; CHECK-NEXT: nop
		; CHECK-NEXT: ld 3, 40(1) # 8-byte Folded Reload
; CHECK-NEXT: .LBB1_2: # %test2		; CHECK-NEXT: .LBB1_2: # %test2
; CHECK-NEXT: andi. 3, 30, 2		; CHECK-NEXT: andi. 3, 3, 2
; CHECK-NEXT: beq 0, .LBB1_4		; CHECK-NEXT: beq 0, .LBB1_4
; CHECK-NEXT: # %bb.3: # %body2		; CHECK-NEXT: # %bb.3: # %body2
; CHECK-NEXT: bl b		; CHECK-NEXT: bl b
; CHECK-NEXT: nop		; CHECK-NEXT: nop
; CHECK-NEXT: bl b		; CHECK-NEXT: bl b
; CHECK-NEXT: nop		; CHECK-NEXT: nop
; CHECK-NEXT: bl b		; CHECK-NEXT: bl b
; CHECK-NEXT: nop		; CHECK-NEXT: nop
; CHECK-NEXT: bl b		; CHECK-NEXT: bl b
; CHECK-NEXT: nop		; CHECK-NEXT: nop
; CHECK-NEXT: .LBB1_4: # %exit		; CHECK-NEXT: .LBB1_4: # %exit
; CHECK-NEXT: addi 1, 1, 48		; CHECK-NEXT: addi 1, 1, 48
; CHECK-NEXT: ld 0, 16(1)		; CHECK-NEXT: ld 0, 16(1)
; CHECK-NEXT: mtlr 0		; CHECK-NEXT: mtlr 0
; CHECK-NEXT: ld 30, -16(1) # 8-byte Folded Reload
; CHECK-NEXT: blr		; CHECK-NEXT: blr
entry:		entry:
br label %test1		br label %test1
test1:		test1:
%tagbit1 = and i32 %tag, 1		%tagbit1 = and i32 %tag, 1
%tagbit1eq0 = icmp eq i32 %tagbit1, 0		%tagbit1eq0 = icmp eq i32 %tagbit1, 0
br i1 %tagbit1eq0, label %test2, label %body1, !prof !1 ; %test2 more likely		br i1 %tagbit1eq0, label %test2, label %body1, !prof !1 ; %test2 more likely
body1:		body1:
Show All 23 Lines
; This function arranges for the successors of %succ to have already been laid		; This function arranges for the successors of %succ to have already been laid
; out. When we consider whether to lay out succ after bb and to tail-duplicate		; out. When we consider whether to lay out succ after bb and to tail-duplicate
; it, v and ret have already been placed, so we tail-duplicate as it removes a		; it, v and ret have already been placed, so we tail-duplicate as it removes a
; branch and strictly increases fallthrough		; branch and strictly increases fallthrough
define void @tail_dup_no_succ(i32 %tag) {		define void @tail_dup_no_succ(i32 %tag) {
; CHECK-LABEL: tail_dup_no_succ:		; CHECK-LABEL: tail_dup_no_succ:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: mflr 0		; CHECK-NEXT: mflr 0
; CHECK-NEXT: .cfi_def_cfa_offset 48
; CHECK-NEXT: .cfi_offset lr, 16
; CHECK-NEXT: .cfi_offset r30, -16
; CHECK-NEXT: std 30, -16(1) # 8-byte Folded Spill
; CHECK-NEXT: std 0, 16(1)		; CHECK-NEXT: std 0, 16(1)
; CHECK-NEXT: stdu 1, -48(1)		; CHECK-NEXT: stdu 1, -48(1)
; CHECK-NEXT: mr 30, 3		; CHECK-NEXT: .cfi_def_cfa_offset 48
; CHECK-NEXT: andi. 3, 3, 1		; CHECK-NEXT: .cfi_offset lr, 16
		; CHECK-NEXT: andi. 4, 3, 1
; CHECK-NEXT: bc 12, 1, .LBB2_3		; CHECK-NEXT: bc 12, 1, .LBB2_3
; CHECK-NEXT: .LBB2_1: # %v		; CHECK-NEXT: .LBB2_1: # %v
; CHECK-NEXT: bl d		; CHECK-NEXT: bl d
; CHECK-NEXT: nop		; CHECK-NEXT: nop
; CHECK-NEXT: bl d		; CHECK-NEXT: bl d
; CHECK-NEXT: nop		; CHECK-NEXT: nop
; CHECK-NEXT: .LBB2_2: # %ret		; CHECK-NEXT: .LBB2_2: # %ret
; CHECK-NEXT: addi 1, 1, 48		; CHECK-NEXT: addi 1, 1, 48
; CHECK-NEXT: ld 0, 16(1)		; CHECK-NEXT: ld 0, 16(1)
; CHECK-NEXT: mtlr 0		; CHECK-NEXT: mtlr 0
; CHECK-NEXT: ld 30, -16(1) # 8-byte Folded Reload
; CHECK-NEXT: blr		; CHECK-NEXT: blr
; CHECK-NEXT: .LBB2_3: # %bb		; CHECK-NEXT: .LBB2_3: # %bb
; CHECK-NEXT: andi. 3, 30, 2		; CHECK-NEXT: andi. 4, 3, 2
; CHECK-NEXT: bne 0, .LBB2_5		; CHECK-NEXT: bne 0, .LBB2_5
; CHECK-NEXT: # %bb.4: # %succ		; CHECK-NEXT: # %bb.4: # %succ
; CHECK-NEXT: andi. 3, 30, 4		; CHECK-NEXT: andi. 3, 3, 4
; CHECK-NEXT: beq 0, .LBB2_2		; CHECK-NEXT: beq 0, .LBB2_2
; CHECK-NEXT: b .LBB2_1		; CHECK-NEXT: b .LBB2_1
; CHECK-NEXT: .LBB2_5: # %c		; CHECK-NEXT: .LBB2_5: # %c
		; CHECK-NEXT: std 3, 40(1) # 8-byte Folded Spill
; CHECK-NEXT: bl c		; CHECK-NEXT: bl c
; CHECK-NEXT: nop		; CHECK-NEXT: nop
; CHECK-NEXT: bl c		; CHECK-NEXT: bl c
; CHECK-NEXT: nop		; CHECK-NEXT: nop
; CHECK-NEXT: andi. 3, 30, 4		; CHECK-NEXT: ld 3, 40(1) # 8-byte Folded Reload
		; CHECK-NEXT: andi. 3, 3, 4
; CHECK-NEXT: beq 0, .LBB2_2		; CHECK-NEXT: beq 0, .LBB2_2
; CHECK-NEXT: b .LBB2_1		; CHECK-NEXT: b .LBB2_1
entry:		entry:
%tagbit1 = and i32 %tag, 1		%tagbit1 = and i32 %tag, 1
%tagbit1eq0 = icmp eq i32 %tagbit1, 0		%tagbit1eq0 = icmp eq i32 %tagbit1, 0
br i1 %tagbit1eq0, label %v, label %bb, !prof !2 ; %v very much more likely		br i1 %tagbit1eq0, label %v, label %bb, !prof !2 ; %v very much more likely
bb:		bb:
%tagbit2 = and i32 %tag, 2		%tagbit2 = and i32 %tag, 2
Show All 22 Lines

llvm/test/CodeGen/X86/atom-fixup-lea2.ll

	Show All 26 Lines
	; return sum;			; return sum;
	;}			;}

	%struct.node_t = type { i32, i32, i32, i32, i32* }			%struct.node_t = type { i32, i32, i32, i32, i32* }

	define i32 @test() {			define i32 @test() {
	; CHECK-LABEL: test:			; CHECK-LABEL: test:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: pushl %ebx
	; CHECK-NEXT: .cfi_def_cfa_offset 8
	; CHECK-NEXT: pushl %edi			; CHECK-NEXT: pushl %edi
	; CHECK-NEXT: .cfi_def_cfa_offset 12			; CHECK-NEXT: .cfi_def_cfa_offset 8
	; CHECK-NEXT: pushl %esi			; CHECK-NEXT: pushl %esi
	; CHECK-NEXT: .cfi_def_cfa_offset 16			; CHECK-NEXT: .cfi_def_cfa_offset 12
	; CHECK-NEXT: leal -{{[0-9]+}}(%esp), %esp			; CHECK-NEXT: leal -{{[0-9]+}}(%esp), %esp
	; CHECK-NEXT: .cfi_def_cfa_offset 48			; CHECK-NEXT: .cfi_def_cfa_offset 48
	; CHECK-NEXT: .cfi_offset %esi, -16			; CHECK-NEXT: .cfi_offset %esi, -12
	; CHECK-NEXT: .cfi_offset %edi, -12			; CHECK-NEXT: .cfi_offset %edi, -8
	; CHECK-NEXT: .cfi_offset %ebx, -8
	; CHECK-NEXT: leal {{[0-9]+}}(%esp), %eax			; CHECK-NEXT: leal {{[0-9]+}}(%esp), %eax
	; CHECK-NEXT: movl %eax, (%esp)			; CHECK-NEXT: movl %eax, (%esp)
	; CHECK-NEXT: calll getnode			; CHECK-NEXT: calll getnode
	; CHECK-NEXT: leal -{{[0-9]+}}(%esp), %esp			; CHECK-NEXT: leal -{{[0-9]+}}(%esp), %esp
	; CHECK-NEXT: movl {{[0-9]+}}(%esp), %ecx			; CHECK-NEXT: movl {{[0-9]+}}(%esp), %ecx
	; CHECK-NEXT: xorl %eax, %eax			; CHECK-NEXT: xorl %eax, %eax
	; CHECK-NEXT: testl %ecx, %ecx			; CHECK-NEXT: testl %ecx, %ecx
	; CHECK-NEXT: je .LBB0_6			; CHECK-NEXT: je .LBB0_6
	; CHECK-NEXT: # %bb.1: # %land.lhs.true			; CHECK-NEXT: # %bb.1: # %land.lhs.true
	; CHECK-NEXT: movl {{[0-9]+}}(%esp), %edx			; CHECK-NEXT: movl {{[0-9]+}}(%esp), %edx
	; CHECK-NEXT: testl %edx, %edx			; CHECK-NEXT: testl %edx, %edx
	; CHECK-NEXT: jle .LBB0_6			; CHECK-NEXT: jle .LBB0_6
	; CHECK-NEXT: # %bb.2: # %land.lhs.true2			; CHECK-NEXT: # %bb.2: # %land.lhs.true2
	; CHECK-NEXT: movl {{[0-9]+}}(%esp), %edi			; CHECK-NEXT: movl {{[0-9]+}}(%esp), %esi
	; CHECK-NEXT: testl %edi, %edi			; CHECK-NEXT: testl %esi, %esi
	; CHECK-NEXT: jle .LBB0_6			; CHECK-NEXT: jle .LBB0_6
	; CHECK-NEXT: # %bb.3: # %land.lhs.true4			; CHECK-NEXT: # %bb.3: # %land.lhs.true4
				; CHECK-NEXT: movl %esi, {{[-0-9]+}}(%e{{[sb]}}p) # 4-byte Spill
	; CHECK-NEXT: movl {{[0-9]+}}(%esp), %esi			; CHECK-NEXT: movl {{[0-9]+}}(%esp), %esi
	; CHECK-NEXT: testl %esi, %esi			; CHECK-NEXT: testl %esi, %esi
	; CHECK-NEXT: jle .LBB0_6			; CHECK-NEXT: jle .LBB0_6
	; CHECK-NEXT: # %bb.4: # %land.lhs.true7			; CHECK-NEXT: # %bb.4: # %land.lhs.true7
	; CHECK-NEXT: movl {{[0-9]+}}(%esp), %ebx			; CHECK-NEXT: movl {{[0-9]+}}(%esp), %edi
	; CHECK-NEXT: testl %ebx, %ebx			; CHECK-NEXT: testl %edi, %edi
	; CHECK-NEXT: jle .LBB0_6			; CHECK-NEXT: jle .LBB0_6
	; CHECK-NEXT: # %bb.5: # %if.then			; CHECK-NEXT: # %bb.5: # %if.then
	; CHECK-NEXT: leal (%esi,%edi), %esi			; CHECK-NEXT: addl {{[-0-9]+}}(%e{{[sb]}}p), %esi # 4-byte Folded Reload
	; CHECK-NEXT: leal (%edx,%ecx), %edx			; CHECK-NEXT: leal (%edx,%ecx), %edx
	; CHECK-NEXT: leal (%esi,%ebx), %esi			; CHECK-NEXT: leal (%esi,%edi), %esi
	; CHECK-NEXT: movl (%edx,%esi,4), %eax			; CHECK-NEXT: movl (%edx,%esi,4), %eax
	; CHECK-NEXT: .LBB0_6: # %if.end			; CHECK-NEXT: .LBB0_6: # %if.end
	; CHECK-NEXT: leal {{[0-9]+}}(%esp), %esp			; CHECK-NEXT: leal {{[0-9]+}}(%esp), %esp
	; CHECK-NEXT: .cfi_def_cfa_offset 16
	; CHECK-NEXT: popl %esi
	; CHECK-NEXT: .cfi_def_cfa_offset 12			; CHECK-NEXT: .cfi_def_cfa_offset 12
	; CHECK-NEXT: popl %edi			; CHECK-NEXT: popl %esi
	; CHECK-NEXT: .cfi_def_cfa_offset 8			; CHECK-NEXT: .cfi_def_cfa_offset 8
	; CHECK-NEXT: popl %ebx			; CHECK-NEXT: popl %edi
	; CHECK-NEXT: .cfi_def_cfa_offset 4			; CHECK-NEXT: .cfi_def_cfa_offset 4
	; CHECK-NEXT: retl			; CHECK-NEXT: retl
	entry:			entry:
	%n = alloca %struct.node_t, align 4			%n = alloca %struct.node_t, align 4
	call void bitcast (void (%struct.node_t, ...) @getnode to void (%struct.node_t))(%struct.node_t* sret %n)			call void bitcast (void (%struct.node_t, ...) @getnode to void (%struct.node_t))(%struct.node_t* sret %n)
	%array = getelementptr inbounds %struct.node_t, %struct.node_t* %n, i32 0, i32 4			%array = getelementptr inbounds %struct.node_t, %struct.node_t* %n, i32 0, i32 4
	%0 = load i32, i32* %array, align 4			%0 = load i32, i32* %array, align 4
	%cmp = icmp eq i32* %0, null			%cmp = icmp eq i32* %0, null
	▲ Show 20 Lines • Show All 42 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/block-placement.ll

; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py		; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
; RUN: llc -mtriple=i686-linux -pre-RA-sched=source < %s \| FileCheck %s		; RUN: llc -mtriple=i686-linux -pre-RA-sched=source < %s \| FileCheck %s
; RUN: opt -disable-output -debugify < %s		; RUN: opt -disable-output -debugify < %s

declare void @error(i32 %i, i32 %a, i32 %b)		declare void @error(i32 %i, i32 %a, i32 %b)

define i32 @test_ifchains(i32 %i, i32* %a, i32 %b) {		define i32 @test_ifchains(i32 %i, i32* %a, i32 %b) {
; Test a chain of ifs, where the block guarded by the if is error handling code		; Test a chain of ifs, where the block guarded by the if is error handling code
; that is not expected to run.		; that is not expected to run.
; CHECK-LABEL: test_ifchains:		; CHECK-LABEL: test_ifchains:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: pushl %ebx		; CHECK-NEXT: subl $12, %esp
; CHECK-NEXT: .cfi_def_cfa_offset 8
; CHECK-NEXT: pushl %edi
; CHECK-NEXT: .cfi_def_cfa_offset 12
; CHECK-NEXT: pushl %esi
; CHECK-NEXT: .cfi_def_cfa_offset 16		; CHECK-NEXT: .cfi_def_cfa_offset 16
; CHECK-NEXT: .cfi_offset %esi, -16		; CHECK-NEXT: movl {{[0-9]+}}(%esp), %eax
; CHECK-NEXT: .cfi_offset %edi, -12		; CHECK-NEXT: movl {{[0-9]+}}(%esp), %edx
; CHECK-NEXT: .cfi_offset %ebx, -8		; CHECK-NEXT: movl {{[0-9]+}}(%esp), %ecx
; CHECK-NEXT: movl {{[0-9]+}}(%esp), %esi		; CHECK-NEXT: cmpl $2, 4(%edx)
; CHECK-NEXT: movl {{[0-9]+}}(%esp), %ebx
; CHECK-NEXT: movl {{[0-9]+}}(%esp), %edi
; CHECK-NEXT: cmpl $2, 4(%ebx)
; CHECK-NEXT: jae .LBB0_1		; CHECK-NEXT: jae .LBB0_1
; CHECK-NEXT: # %bb.2: # %else1		; CHECK-NEXT: # %bb.2: # %else1
; CHECK-NEXT: cmpl $3, 8(%ebx)		; CHECK-NEXT: cmpl $3, 8(%edx)
; CHECK-NEXT: jae .LBB0_3		; CHECK-NEXT: jae .LBB0_3
; CHECK-NEXT: .LBB0_4: # %else2		; CHECK-NEXT: .LBB0_4: # %else2
; CHECK-NEXT: cmpl $4, 12(%ebx)		; CHECK-NEXT: cmpl $4, 12(%edx)
; CHECK-NEXT: jae .LBB0_5		; CHECK-NEXT: jae .LBB0_5
; CHECK-NEXT: .LBB0_6: # %else3		; CHECK-NEXT: .LBB0_6: # %else3
; CHECK-NEXT: cmpl $5, 16(%ebx)		; CHECK-NEXT: cmpl $5, 16(%edx)
; CHECK-NEXT: jae .LBB0_7		; CHECK-NEXT: jae .LBB0_7
; CHECK-NEXT: .LBB0_8: # %else4		; CHECK-NEXT: .LBB0_8: # %else4
; CHECK-NEXT: cmpl $4, 12(%ebx)		; CHECK-NEXT: cmpl $4, 12(%edx)
; CHECK-NEXT: jae .LBB0_9		; CHECK-NEXT: jae .LBB0_9
; CHECK-NEXT: .LBB0_10: # %exit		; CHECK-NEXT: .LBB0_10: # %exit
; CHECK-NEXT: movl %esi, %eax		; CHECK-NEXT: addl $12, %esp
; CHECK-NEXT: popl %esi
; CHECK-NEXT: .cfi_def_cfa_offset 12
; CHECK-NEXT: popl %edi
; CHECK-NEXT: .cfi_def_cfa_offset 8
; CHECK-NEXT: popl %ebx
; CHECK-NEXT: .cfi_def_cfa_offset 4		; CHECK-NEXT: .cfi_def_cfa_offset 4
; CHECK-NEXT: retl		; CHECK-NEXT: retl
; CHECK-NEXT: .LBB0_1: # %then1		; CHECK-NEXT: .LBB0_1: # %then1
; CHECK-NEXT: .cfi_def_cfa_offset 16		; CHECK-NEXT: .cfi_def_cfa_offset 16
; CHECK-NEXT: subl $4, %esp		; CHECK-NEXT: subl $4, %esp
; CHECK-NEXT: .cfi_adjust_cfa_offset 4		; CHECK-NEXT: .cfi_adjust_cfa_offset 4
; CHECK-NEXT: pushl %esi		; CHECK-NEXT: pushl %eax
; CHECK-NEXT: .cfi_adjust_cfa_offset 4		; CHECK-NEXT: .cfi_adjust_cfa_offset 4
; CHECK-NEXT: pushl $1		; CHECK-NEXT: pushl $1
; CHECK-NEXT: .cfi_adjust_cfa_offset 4		; CHECK-NEXT: .cfi_adjust_cfa_offset 4
; CHECK-NEXT: pushl %edi		; CHECK-NEXT: pushl %ecx
; CHECK-NEXT: .cfi_adjust_cfa_offset 4		; CHECK-NEXT: .cfi_adjust_cfa_offset 4
; CHECK-NEXT: calll error		; CHECK-NEXT: calll error
		; CHECK-NEXT: movl {{[0-9]+}}(%esp), %edx
		; CHECK-NEXT: movl {{[0-9]+}}(%esp), %ecx
		; CHECK-NEXT: movl {{[0-9]+}}(%esp), %eax
; CHECK-NEXT: addl $16, %esp		; CHECK-NEXT: addl $16, %esp
; CHECK-NEXT: .cfi_adjust_cfa_offset -16		; CHECK-NEXT: .cfi_adjust_cfa_offset -16
; CHECK-NEXT: cmpl $3, 8(%ebx)		; CHECK-NEXT: cmpl $3, 8(%edx)
; CHECK-NEXT: jb .LBB0_4		; CHECK-NEXT: jb .LBB0_4
; CHECK-NEXT: .LBB0_3: # %then2		; CHECK-NEXT: .LBB0_3: # %then2
; CHECK-NEXT: subl $4, %esp		; CHECK-NEXT: subl $4, %esp
; CHECK-NEXT: .cfi_adjust_cfa_offset 4		; CHECK-NEXT: .cfi_adjust_cfa_offset 4
; CHECK-NEXT: pushl %esi		; CHECK-NEXT: pushl %eax
; CHECK-NEXT: .cfi_adjust_cfa_offset 4		; CHECK-NEXT: .cfi_adjust_cfa_offset 4
; CHECK-NEXT: pushl $1		; CHECK-NEXT: pushl $1
; CHECK-NEXT: .cfi_adjust_cfa_offset 4		; CHECK-NEXT: .cfi_adjust_cfa_offset 4
; CHECK-NEXT: pushl %edi		; CHECK-NEXT: pushl %ecx
; CHECK-NEXT: .cfi_adjust_cfa_offset 4		; CHECK-NEXT: .cfi_adjust_cfa_offset 4
; CHECK-NEXT: calll error		; CHECK-NEXT: calll error
		; CHECK-NEXT: movl {{[0-9]+}}(%esp), %edx
		; CHECK-NEXT: movl {{[0-9]+}}(%esp), %ecx
		; CHECK-NEXT: movl {{[0-9]+}}(%esp), %eax
; CHECK-NEXT: addl $16, %esp		; CHECK-NEXT: addl $16, %esp
; CHECK-NEXT: .cfi_adjust_cfa_offset -16		; CHECK-NEXT: .cfi_adjust_cfa_offset -16
; CHECK-NEXT: cmpl $4, 12(%ebx)		; CHECK-NEXT: cmpl $4, 12(%edx)
; CHECK-NEXT: jb .LBB0_6		; CHECK-NEXT: jb .LBB0_6
; CHECK-NEXT: .LBB0_5: # %then3		; CHECK-NEXT: .LBB0_5: # %then3
; CHECK-NEXT: subl $4, %esp		; CHECK-NEXT: subl $4, %esp
; CHECK-NEXT: .cfi_adjust_cfa_offset 4		; CHECK-NEXT: .cfi_adjust_cfa_offset 4
; CHECK-NEXT: pushl %esi		; CHECK-NEXT: pushl %eax
; CHECK-NEXT: .cfi_adjust_cfa_offset 4		; CHECK-NEXT: .cfi_adjust_cfa_offset 4
; CHECK-NEXT: pushl $1		; CHECK-NEXT: pushl $1
; CHECK-NEXT: .cfi_adjust_cfa_offset 4		; CHECK-NEXT: .cfi_adjust_cfa_offset 4
; CHECK-NEXT: pushl %edi		; CHECK-NEXT: pushl %ecx
; CHECK-NEXT: .cfi_adjust_cfa_offset 4		; CHECK-NEXT: .cfi_adjust_cfa_offset 4
; CHECK-NEXT: calll error		; CHECK-NEXT: calll error
		; CHECK-NEXT: movl {{[0-9]+}}(%esp), %edx
		; CHECK-NEXT: movl {{[0-9]+}}(%esp), %ecx
		; CHECK-NEXT: movl {{[0-9]+}}(%esp), %eax
; CHECK-NEXT: addl $16, %esp		; CHECK-NEXT: addl $16, %esp
; CHECK-NEXT: .cfi_adjust_cfa_offset -16		; CHECK-NEXT: .cfi_adjust_cfa_offset -16
; CHECK-NEXT: cmpl $5, 16(%ebx)		; CHECK-NEXT: cmpl $5, 16(%edx)
; CHECK-NEXT: jb .LBB0_8		; CHECK-NEXT: jb .LBB0_8
; CHECK-NEXT: .LBB0_7: # %then4		; CHECK-NEXT: .LBB0_7: # %then4
; CHECK-NEXT: subl $4, %esp		; CHECK-NEXT: subl $4, %esp
; CHECK-NEXT: .cfi_adjust_cfa_offset 4		; CHECK-NEXT: .cfi_adjust_cfa_offset 4
; CHECK-NEXT: pushl %esi		; CHECK-NEXT: pushl %eax
; CHECK-NEXT: .cfi_adjust_cfa_offset 4		; CHECK-NEXT: .cfi_adjust_cfa_offset 4
; CHECK-NEXT: pushl $1		; CHECK-NEXT: pushl $1
; CHECK-NEXT: .cfi_adjust_cfa_offset 4		; CHECK-NEXT: .cfi_adjust_cfa_offset 4
; CHECK-NEXT: pushl %edi		; CHECK-NEXT: pushl %ecx
; CHECK-NEXT: .cfi_adjust_cfa_offset 4		; CHECK-NEXT: .cfi_adjust_cfa_offset 4
; CHECK-NEXT: calll error		; CHECK-NEXT: calll error
		; CHECK-NEXT: movl {{[0-9]+}}(%esp), %edx
		; CHECK-NEXT: movl {{[0-9]+}}(%esp), %ecx
		; CHECK-NEXT: movl {{[0-9]+}}(%esp), %eax
; CHECK-NEXT: addl $16, %esp		; CHECK-NEXT: addl $16, %esp
; CHECK-NEXT: .cfi_adjust_cfa_offset -16		; CHECK-NEXT: .cfi_adjust_cfa_offset -16
; CHECK-NEXT: cmpl $4, 12(%ebx)		; CHECK-NEXT: cmpl $4, 12(%edx)
; CHECK-NEXT: jb .LBB0_10		; CHECK-NEXT: jb .LBB0_10
; CHECK-NEXT: .LBB0_9: # %then5		; CHECK-NEXT: .LBB0_9: # %then5
; CHECK-NEXT: subl $4, %esp		; CHECK-NEXT: subl $4, %esp
; CHECK-NEXT: .cfi_adjust_cfa_offset 4		; CHECK-NEXT: .cfi_adjust_cfa_offset 4
; CHECK-NEXT: pushl %esi		; CHECK-NEXT: pushl %eax
; CHECK-NEXT: .cfi_adjust_cfa_offset 4		; CHECK-NEXT: .cfi_adjust_cfa_offset 4
; CHECK-NEXT: pushl $1		; CHECK-NEXT: pushl $1
; CHECK-NEXT: .cfi_adjust_cfa_offset 4		; CHECK-NEXT: .cfi_adjust_cfa_offset 4
; CHECK-NEXT: pushl %edi		; CHECK-NEXT: pushl %ecx
; CHECK-NEXT: .cfi_adjust_cfa_offset 4		; CHECK-NEXT: .cfi_adjust_cfa_offset 4
; CHECK-NEXT: calll error		; CHECK-NEXT: calll error
		; CHECK-NEXT: movl {{[0-9]+}}(%esp), %eax
; CHECK-NEXT: addl $16, %esp		; CHECK-NEXT: addl $16, %esp
; CHECK-NEXT: .cfi_adjust_cfa_offset -16		; CHECK-NEXT: .cfi_adjust_cfa_offset -16
; CHECK-NEXT: jmp .LBB0_10		; CHECK-NEXT: addl $12, %esp
		; CHECK-NEXT: .cfi_def_cfa_offset 4
		; CHECK-NEXT: retl

entry:		entry:
%gep1 = getelementptr i32, i32* %a, i32 1		%gep1 = getelementptr i32, i32* %a, i32 1
%val1 = load i32, i32* %gep1		%val1 = load i32, i32* %gep1
%cond1 = icmp ugt i32 %val1, 1		%cond1 = icmp ugt i32 %val1, 1
br i1 %cond1, label %then1, label %else1, !prof !0		br i1 %cond1, label %then1, label %else1, !prof !0

then1:		then1:
▲ Show 20 Lines • Show All 2,094 Lines • ▼ Show 20 Lines
declare void @cold_function() cold		declare void @cold_function() cold

define i32 @test_cold_calls(i32* %a) {		define i32 @test_cold_calls(i32* %a) {
; Test that edges to blocks post-dominated by cold calls are		; Test that edges to blocks post-dominated by cold calls are
; marked as not expected to be taken. They should be laid out		; marked as not expected to be taken. They should be laid out
; at the bottom.		; at the bottom.
; CHECK-LABEL: test_cold_calls:		; CHECK-LABEL: test_cold_calls:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: pushl %esi		; CHECK-NEXT: subl $12, %esp
; CHECK-NEXT: .cfi_def_cfa_offset 8
; CHECK-NEXT: subl $8, %esp
; CHECK-NEXT: .cfi_def_cfa_offset 16		; CHECK-NEXT: .cfi_def_cfa_offset 16
; CHECK-NEXT: .cfi_offset %esi, -8
; CHECK-NEXT: movl {{[0-9]+}}(%esp), %eax		; CHECK-NEXT: movl {{[0-9]+}}(%esp), %eax
; CHECK-NEXT: movl 4(%eax), %esi		; CHECK-NEXT: movl 4(%eax), %ecx
; CHECK-NEXT: cmpl $2, %esi		; CHECK-NEXT: cmpl $2, %ecx
; CHECK-NEXT: jae .LBB20_1		; CHECK-NEXT: jae .LBB20_1
; CHECK-NEXT: # %bb.2: # %else		; CHECK-NEXT: # %bb.2: # %else
; CHECK-NEXT: movl 8(%eax), %esi		; CHECK-NEXT: movl 8(%eax), %eax
; CHECK-NEXT: .LBB20_3: # %exit		; CHECK-NEXT: addl $12, %esp
; CHECK-NEXT: movl %esi, %eax
; CHECK-NEXT: addl $8, %esp
; CHECK-NEXT: .cfi_def_cfa_offset 8
; CHECK-NEXT: popl %esi
; CHECK-NEXT: .cfi_def_cfa_offset 4		; CHECK-NEXT: .cfi_def_cfa_offset 4
; CHECK-NEXT: retl		; CHECK-NEXT: retl
; CHECK-NEXT: .LBB20_1: # %then		; CHECK-NEXT: .LBB20_1: # %then
; CHECK-NEXT: .cfi_def_cfa_offset 16		; CHECK-NEXT: .cfi_def_cfa_offset 16
		; CHECK-NEXT: movl %ecx, {{[-0-9]+}}(%e{{[sb]}}p) # 4-byte Spill
; CHECK-NEXT: calll cold_function		; CHECK-NEXT: calll cold_function
; CHECK-NEXT: jmp .LBB20_3		; CHECK-NEXT: movl {{[-0-9]+}}(%e{{[sb]}}p), %eax # 4-byte Reload
		; CHECK-NEXT: addl $12, %esp
		; CHECK-NEXT: .cfi_def_cfa_offset 4
		; CHECK-NEXT: retl

entry:		entry:
%gep1 = getelementptr i32, i32* %a, i32 1		%gep1 = getelementptr i32, i32* %a, i32 1
%val1 = load i32, i32* %gep1		%val1 = load i32, i32* %gep1
%cond1 = icmp ugt i32 %val1, 1		%cond1 = icmp ugt i32 %val1, 1
br i1 %cond1, label %then, label %else		br i1 %cond1, label %then, label %else

then:		then:
▲ Show 20 Lines • Show All 556 Lines • ▼ Show 20 Lines
define i32 @not_rotate_if_extra_branch(i32 %count) {		define i32 @not_rotate_if_extra_branch(i32 %count) {
; Test checks that there is no loop rotation		; Test checks that there is no loop rotation
; if it introduces extra branch.		; if it introduces extra branch.
; Specifically in this case because best exit is .header		; Specifically in this case because best exit is .header
; but it has fallthrough to .middle block and last block in		; but it has fallthrough to .middle block and last block in
; loop chain .slow does not have afallthrough to .header.		; loop chain .slow does not have afallthrough to .header.
; CHECK-LABEL: not_rotate_if_extra_branch:		; CHECK-LABEL: not_rotate_if_extra_branch:
; CHECK: # %bb.0: # %.entry		; CHECK: # %bb.0: # %.entry
; CHECK-NEXT: pushl %ebx		; CHECK-NEXT: subl $12, %esp
; CHECK-NEXT: .cfi_def_cfa_offset 8
; CHECK-NEXT: pushl %edi
; CHECK-NEXT: .cfi_def_cfa_offset 12
; CHECK-NEXT: pushl %esi
; CHECK-NEXT: .cfi_def_cfa_offset 16		; CHECK-NEXT: .cfi_def_cfa_offset 16
; CHECK-NEXT: subl $16, %esp		; CHECK-NEXT: movl {{[0-9]+}}(%esp), %ecx
; CHECK-NEXT: .cfi_def_cfa_offset 32		; CHECK-NEXT: leal (%ecx,%ecx), %eax
; CHECK-NEXT: .cfi_offset %esi, -16		; CHECK-NEXT: xorl %edx, %edx
; CHECK-NEXT: .cfi_offset %edi, -12
; CHECK-NEXT: .cfi_offset %ebx, -8
; CHECK-NEXT: movl {{[0-9]+}}(%esp), %edi
; CHECK-NEXT: leal (%edi,%edi), %esi
; CHECK-NEXT: xorl %ebx, %ebx
; CHECK-NEXT: .LBB30_1: # %.header		; CHECK-NEXT: .LBB30_1: # %.header
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: cmpl $9000001, %ebx # imm = 0x895441		; CHECK-NEXT: cmpl $9000001, %edx # imm = 0x895441
; CHECK-NEXT: jge .LBB30_2		; CHECK-NEXT: jge .LBB30_5
; CHECK-NEXT: # %bb.3: # %.middle		; CHECK-NEXT: # %bb.2: # %.middle
; CHECK-NEXT: # in Loop: Header=BB30_1 Depth=1		; CHECK-NEXT: # in Loop: Header=BB30_1 Depth=1
; CHECK-NEXT: testl $1023, %ebx # imm = 0x3FF		; CHECK-NEXT: testl $1023, %edx # imm = 0x3FF
; CHECK-NEXT: je .LBB30_4		; CHECK-NEXT: je .LBB30_4
; CHECK-NEXT: .LBB30_5: # %.backedge		; CHECK-NEXT: .LBB30_3: # %.backedge
; CHECK-NEXT: # in Loop: Header=BB30_1 Depth=1		; CHECK-NEXT: # in Loop: Header=BB30_1 Depth=1
; CHECK-NEXT: addl %ebx, %esi		; CHECK-NEXT: addl %edx, %eax
; CHECK-NEXT: incl %ebx		; CHECK-NEXT: incl %edx
; CHECK-NEXT: cmpl %edi, %ebx		; CHECK-NEXT: cmpl %ecx, %edx
; CHECK-NEXT: jl .LBB30_1		; CHECK-NEXT: jl .LBB30_1
; CHECK-NEXT: jmp .LBB30_6		; CHECK-NEXT: jmp .LBB30_6
; CHECK-NEXT: .LBB30_4: # %.slow		; CHECK-NEXT: .LBB30_4: # %.slow
; CHECK-NEXT: # in Loop: Header=BB30_1 Depth=1		; CHECK-NEXT: # in Loop: Header=BB30_1 Depth=1
; CHECK-NEXT: movl %esi, (%esp)		; CHECK-NEXT: movl %eax, (%esp)
		; CHECK-NEXT: movl %eax, {{[-0-9]+}}(%e{{[sb]}}p) # 4-byte Spill
		; CHECK-NEXT: movl %edx, {{[-0-9]+}}(%e{{[sb]}}p) # 4-byte Spill
; CHECK-NEXT: calll effect		; CHECK-NEXT: calll effect
; CHECK-NEXT: jmp .LBB30_5		; CHECK-NEXT: movl {{[-0-9]+}}(%e{{[sb]}}p), %edx # 4-byte Reload
; CHECK-NEXT: .LBB30_2: # %.bailout		; CHECK-NEXT: movl {{[0-9]+}}(%esp), %ecx
; CHECK-NEXT: incl %edi		; CHECK-NEXT: movl {{[-0-9]+}}(%e{{[sb]}}p), %eax # 4-byte Reload
; CHECK-NEXT: movl %edi, %esi		; CHECK-NEXT: jmp .LBB30_3
		; CHECK-NEXT: .LBB30_5: # %.bailout
		; CHECK-NEXT: incl %ecx
		; CHECK-NEXT: movl %ecx, %eax
; CHECK-NEXT: .LBB30_6: # %.stop		; CHECK-NEXT: .LBB30_6: # %.stop
; CHECK-NEXT: movl %esi, %eax		; CHECK-NEXT: addl $12, %esp
; CHECK-NEXT: addl $16, %esp
; CHECK-NEXT: .cfi_def_cfa_offset 16
; CHECK-NEXT: popl %esi
; CHECK-NEXT: .cfi_def_cfa_offset 12
; CHECK-NEXT: popl %edi
; CHECK-NEXT: .cfi_def_cfa_offset 8
; CHECK-NEXT: popl %ebx
; CHECK-NEXT: .cfi_def_cfa_offset 4		; CHECK-NEXT: .cfi_def_cfa_offset 4
; CHECK-NEXT: retl		; CHECK-NEXT: retl
.entry:		.entry:
%sum.0 = shl nsw i32 %count, 1		%sum.0 = shl nsw i32 %count, 1
br label %.header		br label %.header

.header:		.header:
%i = phi i32 [ %i.1, %.backedge ], [ 0, %.entry ]		%i = phi i32 [ %i.1, %.backedge ], [ 0, %.entry ]
Show All 25 Lines	.stop:
ret i32 %sum.phi		ret i32 %sum.phi
}		}

define i32 @not_rotate_if_extra_branch_regression(i32 %count, i32 %init) {		define i32 @not_rotate_if_extra_branch_regression(i32 %count, i32 %init) {
; This is a regression test against patch avoid loop rotation if		; This is a regression test against patch avoid loop rotation if
; it introduce an extra btanch.		; it introduce an extra btanch.
; CHECK-LABEL: not_rotate_if_extra_branch_regression:		; CHECK-LABEL: not_rotate_if_extra_branch_regression:
; CHECK: # %bb.0: # %.entry		; CHECK: # %bb.0: # %.entry
; CHECK-NEXT: pushl %ebx
; CHECK-NEXT: .cfi_def_cfa_offset 8
; CHECK-NEXT: pushl %edi
; CHECK-NEXT: .cfi_def_cfa_offset 12
; CHECK-NEXT: pushl %esi		; CHECK-NEXT: pushl %esi
		; CHECK-NEXT: .cfi_def_cfa_offset 8
		; CHECK-NEXT: subl $8, %esp
; CHECK-NEXT: .cfi_def_cfa_offset 16		; CHECK-NEXT: .cfi_def_cfa_offset 16
; CHECK-NEXT: subl $16, %esp		; CHECK-NEXT: .cfi_offset %esi, -8
; CHECK-NEXT: .cfi_def_cfa_offset 32		; CHECK-NEXT: movl {{[0-9]+}}(%esp), %edx
; CHECK-NEXT: .cfi_offset %esi, -16		; CHECK-NEXT: movl {{[0-9]+}}(%esp), %ecx
; CHECK-NEXT: .cfi_offset %edi, -12		; CHECK-NEXT: xorl %eax, %eax
; CHECK-NEXT: .cfi_offset %ebx, -8
; CHECK-NEXT: movl {{[0-9]+}}(%esp), %eax
; CHECK-NEXT: movl {{[0-9]+}}(%esp), %edi
; CHECK-NEXT: xorl %esi, %esi
; CHECK-NEXT: .LBB31_1: # %.first_header		; CHECK-NEXT: .LBB31_1: # %.first_header
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: cmpl $9000000, %esi # imm = 0x895440		; CHECK-NEXT: cmpl $9000000, %eax # imm = 0x895440
; CHECK-NEXT: jg .LBB31_8		; CHECK-NEXT: jg .LBB31_9
; CHECK-NEXT: # %bb.2: # %.first_backedge		; CHECK-NEXT: # %bb.2: # %.first_backedge
; CHECK-NEXT: # in Loop: Header=BB31_1 Depth=1		; CHECK-NEXT: # in Loop: Header=BB31_1 Depth=1
; CHECK-NEXT: incl %esi		; CHECK-NEXT: incl %eax
; CHECK-NEXT: cmpl %edi, %esi		; CHECK-NEXT: cmpl %ecx, %eax
; CHECK-NEXT: jl .LBB31_1		; CHECK-NEXT: jl .LBB31_1
; CHECK-NEXT: .LBB31_3: # %.second_header		; CHECK-NEXT: .LBB31_3: # %.second_header
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: movl %eax, %ebx		; CHECK-NEXT: movl %edx, %esi
; CHECK-NEXT: cmpl %edi, %eax		; CHECK-NEXT: cmpl %ecx, %edx
; CHECK-NEXT: jg .LBB31_7		; CHECK-NEXT: jg .LBB31_7
; CHECK-NEXT: # %bb.4: # %.second_middle		; CHECK-NEXT: # %bb.4: # %.second_middle
; CHECK-NEXT: # in Loop: Header=BB31_3 Depth=1		; CHECK-NEXT: # in Loop: Header=BB31_3 Depth=1
; CHECK-NEXT: cmpl $9000001, %ebx # imm = 0x895441		; CHECK-NEXT: cmpl $9000001, %esi # imm = 0x895441
; CHECK-NEXT: jge .LBB31_5		; CHECK-NEXT: jge .LBB31_5
; CHECK-NEXT: .LBB31_6: # %.second_backedge		; CHECK-NEXT: .LBB31_6: # %.second_backedge
; CHECK-NEXT: # in Loop: Header=BB31_3 Depth=1		; CHECK-NEXT: # in Loop: Header=BB31_3 Depth=1
; CHECK-NEXT: leal 1(%ebx), %eax		; CHECK-NEXT: leal 1(%esi), %edx
; CHECK-NEXT: cmpl $10000000, %ebx # imm = 0x989680		; CHECK-NEXT: cmpl $10000000, %esi # imm = 0x989680
; CHECK-NEXT: jl .LBB31_3		; CHECK-NEXT: jl .LBB31_3
; CHECK-NEXT: jmp .LBB31_7		; CHECK-NEXT: jmp .LBB31_7
; CHECK-NEXT: .LBB31_5: # %.slow		; CHECK-NEXT: .LBB31_5: # %.slow
; CHECK-NEXT: # in Loop: Header=BB31_3 Depth=1		; CHECK-NEXT: # in Loop: Header=BB31_3 Depth=1
; CHECK-NEXT: movl %ebx, (%esp)		; CHECK-NEXT: movl %esi, (%esp)
		; CHECK-NEXT: movl %eax, {{[-0-9]+}}(%e{{[sb]}}p) # 4-byte Spill
; CHECK-NEXT: calll effect		; CHECK-NEXT: calll effect
		; CHECK-NEXT: movl {{[0-9]+}}(%esp), %ecx
		; CHECK-NEXT: movl {{[-0-9]+}}(%e{{[sb]}}p), %eax # 4-byte Reload
; CHECK-NEXT: jmp .LBB31_6		; CHECK-NEXT: jmp .LBB31_6
; CHECK-NEXT: .LBB31_7: # %.stop		; CHECK-NEXT: .LBB31_7: # %.stop
; CHECK-NEXT: addl %ebx, %esi		; CHECK-NEXT: addl %esi, %eax
; CHECK-NEXT: movl %esi, %eax		; CHECK-NEXT: .LBB31_8: # %.stop
; CHECK-NEXT: .LBB31_9: # %.bailout		; CHECK-NEXT: addl $8, %esp
; CHECK-NEXT: addl $16, %esp
; CHECK-NEXT: .cfi_def_cfa_offset 16
; CHECK-NEXT: popl %esi
; CHECK-NEXT: .cfi_def_cfa_offset 12
; CHECK-NEXT: popl %edi
; CHECK-NEXT: .cfi_def_cfa_offset 8		; CHECK-NEXT: .cfi_def_cfa_offset 8
; CHECK-NEXT: popl %ebx		; CHECK-NEXT: popl %esi
; CHECK-NEXT: .cfi_def_cfa_offset 4		; CHECK-NEXT: .cfi_def_cfa_offset 4
; CHECK-NEXT: retl		; CHECK-NEXT: retl
; CHECK-NEXT: .LBB31_8: # %.bailout		; CHECK-NEXT: .LBB31_9: # %.bailout
; CHECK-NEXT: .cfi_def_cfa_offset 32		; CHECK-NEXT: .cfi_def_cfa_offset 16
; CHECK-NEXT: xorl %eax, %eax		; CHECK-NEXT: xorl %eax, %eax
; CHECK-NEXT: jmp .LBB31_9		; CHECK-NEXT: jmp .LBB31_8
.entry:		.entry:
%sum.0 = shl nsw i32 %count, 1		%sum.0 = shl nsw i32 %count, 1
br label %.first_header		br label %.first_header

.first_header:		.first_header:
%i = phi i32 [ %i.1, %.first_backedge ], [ 0, %.entry ]		%i = phi i32 [ %i.1, %.first_backedge ], [ 0, %.entry ]
%is_bo1 = icmp sgt i32 %i, 9000000		%is_bo1 = icmp sgt i32 %i, 9000000
br i1 %is_bo1, label %.bailout, label %.first_backedge, !prof !14		br i1 %is_bo1, label %.bailout, label %.first_backedge, !prof !14
▲ Show 20 Lines • Show All 45 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/bmi.ll

Show First 20 Lines • Show All 1,050 Lines • ▼ Show 20 Lines	; X64-NEXT: retq
br label %6		br label %6

ret void		ret void
}		}

define i32 @blsr32_branch(i32 %x) {		define i32 @blsr32_branch(i32 %x) {
; X86-LABEL: blsr32_branch:		; X86-LABEL: blsr32_branch:
; X86: # %bb.0:		; X86: # %bb.0:
; X86-NEXT: pushl %esi		; X86-NEXT: pushl %eax
; X86-NEXT: .cfi_def_cfa_offset 8		; X86-NEXT: .cfi_def_cfa_offset 8
; X86-NEXT: .cfi_offset %esi, -8		; X86-NEXT: blsrl {{[0-9]+}}(%esp), %eax
; X86-NEXT: blsrl {{[0-9]+}}(%esp), %esi		; X86-NEXT: je .LBB46_1
; X86-NEXT: jne .LBB46_2		; X86-NEXT: # %bb.2:
; X86-NEXT: # %bb.1:		; X86-NEXT: popl %ecx
		; X86-NEXT: .cfi_def_cfa_offset 4
		; X86-NEXT: retl
		; X86-NEXT: .LBB46_1:
		; X86-NEXT: .cfi_def_cfa_offset 8
		; X86-NEXT: movl %eax, (%esp) # 4-byte Spill
; X86-NEXT: calll bar		; X86-NEXT: calll bar
; X86-NEXT: .LBB46_2:		; X86-NEXT: movl (%esp), %eax # 4-byte Reload
; X86-NEXT: movl %esi, %eax		; X86-NEXT: popl %ecx
; X86-NEXT: popl %esi
; X86-NEXT: .cfi_def_cfa_offset 4		; X86-NEXT: .cfi_def_cfa_offset 4
; X86-NEXT: retl		; X86-NEXT: retl
;		;
; X64-LABEL: blsr32_branch:		; X64-LABEL: blsr32_branch:
; X64: # %bb.0:		; X64: # %bb.0:
; X64-NEXT: pushq %rbx		; X64-NEXT: pushq %rax
		; X64-NEXT: .cfi_def_cfa_offset 16
		; X64-NEXT: blsrl %edi, %eax
		; X64-NEXT: je .LBB46_1
		; X64-NEXT: # %bb.2:
		; X64-NEXT: popq %rcx
		; X64-NEXT: .cfi_def_cfa_offset 8
		; X64-NEXT: retq
		; X64-NEXT: .LBB46_1:
; X64-NEXT: .cfi_def_cfa_offset 16		; X64-NEXT: .cfi_def_cfa_offset 16
; X64-NEXT: .cfi_offset %rbx, -16		; X64-NEXT: movl %eax, {{[-0-9]+}}(%r{{[sb]}}p) # 4-byte Spill
; X64-NEXT: blsrl %edi, %ebx
; X64-NEXT: jne .LBB46_2
; X64-NEXT: # %bb.1:
; X64-NEXT: callq bar		; X64-NEXT: callq bar
; X64-NEXT: .LBB46_2:		; X64-NEXT: movl {{[-0-9]+}}(%r{{[sb]}}p), %eax # 4-byte Reload
; X64-NEXT: movl %ebx, %eax		; X64-NEXT: popq %rcx
; X64-NEXT: popq %rbx
; X64-NEXT: .cfi_def_cfa_offset 8		; X64-NEXT: .cfi_def_cfa_offset 8
; X64-NEXT: retq		; X64-NEXT: retq
%tmp = sub i32 %x, 1		%tmp = sub i32 %x, 1
%tmp2 = and i32 %x, %tmp		%tmp2 = and i32 %x, %tmp
%cmp = icmp eq i32 %tmp2, 0		%cmp = icmp eq i32 %tmp2, 0
br i1 %cmp, label %1, label %2		br i1 %cmp, label %1, label %2

tail call void @bar()		tail call void @bar()
br label %2		br label %2
ret i32 %tmp2		ret i32 %tmp2
}		}

define i64 @blsr64_branch(i64 %x) {		define i64 @blsr64_branch(i64 %x) {
; X86-LABEL: blsr64_branch:		; X86-LABEL: blsr64_branch:
; X86: # %bb.0:		; X86: # %bb.0:
; X86-NEXT: pushl %edi
; X86-NEXT: .cfi_def_cfa_offset 8
; X86-NEXT: pushl %esi		; X86-NEXT: pushl %esi
; X86-NEXT: .cfi_def_cfa_offset 12		; X86-NEXT: .cfi_def_cfa_offset 8
; X86-NEXT: .cfi_offset %esi, -12		; X86-NEXT: subl $8, %esp
; X86-NEXT: .cfi_offset %edi, -8		; X86-NEXT: .cfi_def_cfa_offset 16
; X86-NEXT: movl {{[0-9]+}}(%esp), %eax		; X86-NEXT: .cfi_offset %esi, -8
; X86-NEXT: movl {{[0-9]+}}(%esp), %ecx		; X86-NEXT: movl {{[0-9]+}}(%esp), %ecx
; X86-NEXT: movl %eax, %esi		; X86-NEXT: movl {{[0-9]+}}(%esp), %esi
; X86-NEXT: addl $-1, %esi		; X86-NEXT: movl %ecx, %eax
; X86-NEXT: movl %ecx, %edi		; X86-NEXT: addl $-1, %eax
; X86-NEXT: adcl $-1, %edi		; X86-NEXT: movl %esi, %edx
; X86-NEXT: andl %eax, %esi		; X86-NEXT: adcl $-1, %edx
; X86-NEXT: andl %ecx, %edi		; X86-NEXT: andl %ecx, %eax
; X86-NEXT: movl %esi, %eax		; X86-NEXT: andl %esi, %edx
; X86-NEXT: orl %edi, %eax		; X86-NEXT: movl %eax, %ecx
		; X86-NEXT: orl %edx, %ecx
; X86-NEXT: jne .LBB47_2		; X86-NEXT: jne .LBB47_2
; X86-NEXT: # %bb.1:		; X86-NEXT: # %bb.1:
		; X86-NEXT: movl %eax, {{[-0-9]+}}(%e{{[sb]}}p) # 4-byte Spill
		; X86-NEXT: movl %edx, (%esp) # 4-byte Spill
; X86-NEXT: calll bar		; X86-NEXT: calll bar
		; X86-NEXT: movl (%esp), %edx # 4-byte Reload
		; X86-NEXT: movl {{[-0-9]+}}(%e{{[sb]}}p), %eax # 4-byte Reload
; X86-NEXT: .LBB47_2:		; X86-NEXT: .LBB47_2:
; X86-NEXT: movl %esi, %eax		; X86-NEXT: addl $8, %esp
; X86-NEXT: movl %edi, %edx
; X86-NEXT: popl %esi
; X86-NEXT: .cfi_def_cfa_offset 8		; X86-NEXT: .cfi_def_cfa_offset 8
; X86-NEXT: popl %edi		; X86-NEXT: popl %esi
; X86-NEXT: .cfi_def_cfa_offset 4		; X86-NEXT: .cfi_def_cfa_offset 4
; X86-NEXT: retl		; X86-NEXT: retl
;		;
; X64-LABEL: blsr64_branch:		; X64-LABEL: blsr64_branch:
; X64: # %bb.0:		; X64: # %bb.0:
; X64-NEXT: pushq %rbx		; X64-NEXT: pushq %rax
		; X64-NEXT: .cfi_def_cfa_offset 16
		; X64-NEXT: blsrq %rdi, %rax
		; X64-NEXT: je .LBB47_1
		; X64-NEXT: # %bb.2:
		; X64-NEXT: popq %rcx
		; X64-NEXT: .cfi_def_cfa_offset 8
		; X64-NEXT: retq
		; X64-NEXT: .LBB47_1:
; X64-NEXT: .cfi_def_cfa_offset 16		; X64-NEXT: .cfi_def_cfa_offset 16
; X64-NEXT: .cfi_offset %rbx, -16		; X64-NEXT: movq %rax, (%rsp) # 8-byte Spill
; X64-NEXT: blsrq %rdi, %rbx
; X64-NEXT: jne .LBB47_2
; X64-NEXT: # %bb.1:
; X64-NEXT: callq bar		; X64-NEXT: callq bar
; X64-NEXT: .LBB47_2:		; X64-NEXT: movq (%rsp), %rax # 8-byte Reload
; X64-NEXT: movq %rbx, %rax		; X64-NEXT: popq %rcx
; X64-NEXT: popq %rbx
; X64-NEXT: .cfi_def_cfa_offset 8		; X64-NEXT: .cfi_def_cfa_offset 8
; X64-NEXT: retq		; X64-NEXT: retq
%tmp = sub i64 %x, 1		%tmp = sub i64 %x, 1
%tmp2 = and i64 %x, %tmp		%tmp2 = and i64 %x, %tmp
%cmp = icmp eq i64 %tmp2, 0		%cmp = icmp eq i64 %tmp2, 0
br i1 %cmp, label %1, label %2		br i1 %cmp, label %1, label %2

tail call void @bar()		tail call void @bar()
br label %2		br label %2
ret i64 %tmp2		ret i64 %tmp2
}		}

define i32 @blsi32_branch(i32 %x) {		define i32 @blsi32_branch(i32 %x) {
; X86-LABEL: blsi32_branch:		; X86-LABEL: blsi32_branch:
; X86: # %bb.0:		; X86: # %bb.0:
; X86-NEXT: pushl %esi		; X86-NEXT: pushl %eax
; X86-NEXT: .cfi_def_cfa_offset 8		; X86-NEXT: .cfi_def_cfa_offset 8
; X86-NEXT: .cfi_offset %esi, -8		; X86-NEXT: blsil {{[0-9]+}}(%esp), %eax
; X86-NEXT: blsil {{[0-9]+}}(%esp), %esi		; X86-NEXT: je .LBB48_1
; X86-NEXT: jne .LBB48_2		; X86-NEXT: # %bb.2:
; X86-NEXT: # %bb.1:		; X86-NEXT: popl %ecx
		; X86-NEXT: .cfi_def_cfa_offset 4
		; X86-NEXT: retl
		; X86-NEXT: .LBB48_1:
		; X86-NEXT: .cfi_def_cfa_offset 8
		; X86-NEXT: movl %eax, (%esp) # 4-byte Spill
; X86-NEXT: calll bar		; X86-NEXT: calll bar
; X86-NEXT: .LBB48_2:		; X86-NEXT: movl (%esp), %eax # 4-byte Reload
; X86-NEXT: movl %esi, %eax		; X86-NEXT: popl %ecx
; X86-NEXT: popl %esi
; X86-NEXT: .cfi_def_cfa_offset 4		; X86-NEXT: .cfi_def_cfa_offset 4
; X86-NEXT: retl		; X86-NEXT: retl
;		;
; X64-LABEL: blsi32_branch:		; X64-LABEL: blsi32_branch:
; X64: # %bb.0:		; X64: # %bb.0:
; X64-NEXT: pushq %rbx		; X64-NEXT: pushq %rax
; X64-NEXT: .cfi_def_cfa_offset 16		; X64-NEXT: .cfi_def_cfa_offset 16
; X64-NEXT: .cfi_offset %rbx, -16		; X64-NEXT: blsil %edi, %eax
; X64-NEXT: blsil %edi, %ebx		; X64-NEXT: je .LBB48_1
; X64-NEXT: jne .LBB48_2		; X64-NEXT: # %bb.2:
; X64-NEXT: # %bb.1:		; X64-NEXT: popq %rcx
		; X64-NEXT: .cfi_def_cfa_offset 8
		; X64-NEXT: retq
		; X64-NEXT: .LBB48_1:
		; X64-NEXT: .cfi_def_cfa_offset 16
		; X64-NEXT: movl %eax, {{[-0-9]+}}(%r{{[sb]}}p) # 4-byte Spill
; X64-NEXT: callq bar		; X64-NEXT: callq bar
; X64-NEXT: .LBB48_2:		; X64-NEXT: movl {{[-0-9]+}}(%r{{[sb]}}p), %eax # 4-byte Reload
; X64-NEXT: movl %ebx, %eax		; X64-NEXT: popq %rcx
; X64-NEXT: popq %rbx
; X64-NEXT: .cfi_def_cfa_offset 8		; X64-NEXT: .cfi_def_cfa_offset 8
; X64-NEXT: retq		; X64-NEXT: retq
%tmp = sub i32 0, %x		%tmp = sub i32 0, %x
%tmp2 = and i32 %x, %tmp		%tmp2 = and i32 %x, %tmp
%cmp = icmp eq i32 %tmp2, 0		%cmp = icmp eq i32 %tmp2, 0
br i1 %cmp, label %1, label %2		br i1 %cmp, label %1, label %2

tail call void @bar()		tail call void @bar()
br label %2		br label %2
ret i32 %tmp2		ret i32 %tmp2
}		}

define i64 @blsi64_branch(i64 %x) {		define i64 @blsi64_branch(i64 %x) {
; X86-LABEL: blsi64_branch:		; X86-LABEL: blsi64_branch:
; X86: # %bb.0:		; X86: # %bb.0:
; X86-NEXT: pushl %edi
; X86-NEXT: .cfi_def_cfa_offset 8
; X86-NEXT: pushl %esi		; X86-NEXT: pushl %esi
; X86-NEXT: .cfi_def_cfa_offset 12		; X86-NEXT: .cfi_def_cfa_offset 8
; X86-NEXT: .cfi_offset %esi, -12		; X86-NEXT: subl $8, %esp
; X86-NEXT: .cfi_offset %edi, -8		; X86-NEXT: .cfi_def_cfa_offset 16
; X86-NEXT: movl {{[0-9]+}}(%esp), %eax		; X86-NEXT: .cfi_offset %esi, -8
; X86-NEXT: movl {{[0-9]+}}(%esp), %ecx		; X86-NEXT: movl {{[0-9]+}}(%esp), %ecx
; X86-NEXT: xorl %esi, %esi		; X86-NEXT: movl {{[0-9]+}}(%esp), %esi
; X86-NEXT: movl %eax, %edi		; X86-NEXT: xorl %edx, %edx
; X86-NEXT: negl %edi		; X86-NEXT: movl %ecx, %eax
; X86-NEXT: sbbl %ecx, %esi		; X86-NEXT: negl %eax
; X86-NEXT: andl %ecx, %esi		; X86-NEXT: sbbl %esi, %edx
; X86-NEXT: andl %eax, %edi		; X86-NEXT: andl %esi, %edx
; X86-NEXT: movl %edi, %eax		; X86-NEXT: andl %ecx, %eax
; X86-NEXT: orl %esi, %eax		; X86-NEXT: movl %eax, %ecx
		; X86-NEXT: orl %edx, %ecx
; X86-NEXT: jne .LBB49_2		; X86-NEXT: jne .LBB49_2
; X86-NEXT: # %bb.1:		; X86-NEXT: # %bb.1:
		; X86-NEXT: movl %edx, {{[-0-9]+}}(%e{{[sb]}}p) # 4-byte Spill
		; X86-NEXT: movl %eax, (%esp) # 4-byte Spill
; X86-NEXT: calll bar		; X86-NEXT: calll bar
		; X86-NEXT: movl (%esp), %eax # 4-byte Reload
		; X86-NEXT: movl {{[-0-9]+}}(%e{{[sb]}}p), %edx # 4-byte Reload
; X86-NEXT: .LBB49_2:		; X86-NEXT: .LBB49_2:
; X86-NEXT: movl %edi, %eax		; X86-NEXT: addl $8, %esp
; X86-NEXT: movl %esi, %edx
; X86-NEXT: popl %esi
; X86-NEXT: .cfi_def_cfa_offset 8		; X86-NEXT: .cfi_def_cfa_offset 8
; X86-NEXT: popl %edi		; X86-NEXT: popl %esi
; X86-NEXT: .cfi_def_cfa_offset 4		; X86-NEXT: .cfi_def_cfa_offset 4
; X86-NEXT: retl		; X86-NEXT: retl
;		;
; X64-LABEL: blsi64_branch:		; X64-LABEL: blsi64_branch:
; X64: # %bb.0:		; X64: # %bb.0:
; X64-NEXT: pushq %rbx		; X64-NEXT: pushq %rax
		; X64-NEXT: .cfi_def_cfa_offset 16
		; X64-NEXT: blsiq %rdi, %rax
		; X64-NEXT: je .LBB49_1
		; X64-NEXT: # %bb.2:
		; X64-NEXT: popq %rcx
		; X64-NEXT: .cfi_def_cfa_offset 8
		; X64-NEXT: retq
		; X64-NEXT: .LBB49_1:
; X64-NEXT: .cfi_def_cfa_offset 16		; X64-NEXT: .cfi_def_cfa_offset 16
; X64-NEXT: .cfi_offset %rbx, -16		; X64-NEXT: movq %rax, (%rsp) # 8-byte Spill
; X64-NEXT: blsiq %rdi, %rbx
; X64-NEXT: jne .LBB49_2
; X64-NEXT: # %bb.1:
; X64-NEXT: callq bar		; X64-NEXT: callq bar
; X64-NEXT: .LBB49_2:		; X64-NEXT: movq (%rsp), %rax # 8-byte Reload
; X64-NEXT: movq %rbx, %rax		; X64-NEXT: popq %rcx
; X64-NEXT: popq %rbx
; X64-NEXT: .cfi_def_cfa_offset 8		; X64-NEXT: .cfi_def_cfa_offset 8
; X64-NEXT: retq		; X64-NEXT: retq
%tmp = sub i64 0, %x		%tmp = sub i64 0, %x
%tmp2 = and i64 %x, %tmp		%tmp2 = and i64 %x, %tmp
%cmp = icmp eq i64 %tmp2, 0		%cmp = icmp eq i64 %tmp2, 0
br i1 %cmp, label %1, label %2		br i1 %cmp, label %1, label %2

tail call void @bar()		tail call void @bar()
▲ Show 20 Lines • Show All 142 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/callbr-asm-branch-folding.ll

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: llc < %s -mtriple=x86_64-unknown-linux-gnu \| FileCheck %s			; RUN: llc < %s -mtriple=x86_64-unknown-linux-gnu \| FileCheck %s

	; This test hung in the BranchFolding pass during asm-goto bring up			; This test hung in the BranchFolding pass during asm-goto bring up

	@e = global i32 0			@e = global i32 0
	@j = global i32 0			@j = global i32 0

	define void @n(i32* %o, i32 %p, i32 %u) nounwind {			define void @n(i32* %o, i32 %p, i32 %u) nounwind {
	; CHECK-LABEL: n:			; CHECK-LABEL: n:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: pushq %rbp			; CHECK-NEXT: pushq %rbp
	; CHECK-NEXT: pushq %r15			; CHECK-NEXT: pushq %r15
	; CHECK-NEXT: pushq %r14			; CHECK-NEXT: pushq %r14
	; CHECK-NEXT: pushq %r13
	; CHECK-NEXT: pushq %r12			; CHECK-NEXT: pushq %r12
	; CHECK-NEXT: pushq %rbx			; CHECK-NEXT: pushq %rbx
	; CHECK-NEXT: pushq %rax			; CHECK-NEXT: subq $16, %rsp
	; CHECK-NEXT: movl %edx, %ebx			; CHECK-NEXT: movl %edx, %r14d
	; CHECK-NEXT: movl %esi, %r12d			; CHECK-NEXT: movl %esi, %ebx
	; CHECK-NEXT: movq %rdi, %r15			; CHECK-NEXT: movq %rdi, %rbp
	; CHECK-NEXT: callq c			; CHECK-NEXT: callq c
	; CHECK-NEXT: movl %eax, %r13d			; CHECK-NEXT: movl %eax, %r15d
	; CHECK-NEXT: movq %r15, %rdi			; CHECK-NEXT: movq %rbp, %rdi
	; CHECK-NEXT: callq l			; CHECK-NEXT: callq l
	; CHECK-NEXT: testl %eax, %eax			; CHECK-NEXT: testl %eax, %eax
	; CHECK-NEXT: je .LBB0_1			; CHECK-NEXT: je .LBB0_1
	; CHECK-NEXT: .LBB0_10: # %cleanup			; CHECK-NEXT: .LBB0_10: # %cleanup
	; CHECK-NEXT: addq $8, %rsp			; CHECK-NEXT: addq $16, %rsp
	; CHECK-NEXT: popq %rbx			; CHECK-NEXT: popq %rbx
	; CHECK-NEXT: popq %r12			; CHECK-NEXT: popq %r12
	; CHECK-NEXT: popq %r13
	; CHECK-NEXT: popq %r14			; CHECK-NEXT: popq %r14
	; CHECK-NEXT: popq %r15			; CHECK-NEXT: popq %r15
	; CHECK-NEXT: popq %rbp			; CHECK-NEXT: popq %rbp
	; CHECK-NEXT: retq			; CHECK-NEXT: retq
	; CHECK-NEXT: .LBB0_1: # %if.end			; CHECK-NEXT: .LBB0_1: # %if.end
	; CHECK-NEXT: movl %ebx, {{[-0-9]+}}(%r{{[sb]}}p) # 4-byte Spill			; CHECK-NEXT: movl %ebx, %eax
				; CHECK-NEXT: movq %rbp, {{[-0-9]+}}(%r{{[sb]}}p) # 8-byte Spill
	; CHECK-NEXT: cmpl $0, {{.*}}(%rip)			; CHECK-NEXT: cmpl $0, {{.*}}(%rip)
				; CHECK-NEXT: # implicit-def: $r12d
	; CHECK-NEXT: # implicit-def: $ebx			; CHECK-NEXT: # implicit-def: $ebx
	; CHECK-NEXT: # implicit-def: $r14d
	; CHECK-NEXT: je .LBB0_4			; CHECK-NEXT: je .LBB0_4
	; CHECK-NEXT: # %bb.2: # %if.then4			; CHECK-NEXT: # %bb.2: # %if.then4
	; CHECK-NEXT: movslq %r12d, %rdi			; CHECK-NEXT: movslq %eax, %rdi
	; CHECK-NEXT: callq m			; CHECK-NEXT: callq m
	; CHECK-NEXT: # implicit-def: $ebx			; CHECK-NEXT: # implicit-def: $r12d
	; CHECK-NEXT: # implicit-def: $ebp			; CHECK-NEXT: # implicit-def: $ebp
	; CHECK-NEXT: .LBB0_3: # %r			; CHECK-NEXT: .LBB0_3: # %r
	; CHECK-NEXT: callq c			; CHECK-NEXT: callq c
	; CHECK-NEXT: movl %ebp, %r14d			; CHECK-NEXT: movl %ebp, %ebx
	; CHECK-NEXT: .LBB0_4: # %if.end8			; CHECK-NEXT: .LBB0_4: # %if.end8
	; CHECK-NEXT: movl %ebx, %edi			; CHECK-NEXT: movl %r12d, %edi
	; CHECK-NEXT: callq i			; CHECK-NEXT: callq i
	; CHECK-NEXT: movl %eax, %ebp			; CHECK-NEXT: movl %eax, %ebp
	; CHECK-NEXT: orl %r14d, %ebp			; CHECK-NEXT: orl %ebx, %ebp
	; CHECK-NEXT: testl %r13d, %r13d			; CHECK-NEXT: testl %r15d, %r15d
	; CHECK-NEXT: je .LBB0_6			; CHECK-NEXT: je .LBB0_6
	; CHECK-NEXT: # %bb.5:			; CHECK-NEXT: # %bb.5:
	; CHECK-NEXT: andl $4, %ebx			; CHECK-NEXT: andl $4, %r12d
	; CHECK-NEXT: jmp .LBB0_3			; CHECK-NEXT: jmp .LBB0_3
	; CHECK-NEXT: .LBB0_6: # %if.end12			; CHECK-NEXT: .LBB0_6: # %if.end12
	; CHECK-NEXT: testl %ebp, %ebp			; CHECK-NEXT: testl %ebp, %ebp
	; CHECK-NEXT: je .LBB0_9			; CHECK-NEXT: je .LBB0_9
	; CHECK-NEXT: # %bb.7: # %if.then14			; CHECK-NEXT: # %bb.7: # %if.then14
	; CHECK-NEXT: movl {{[-0-9]+}}(%r{{[sb]}}p), %eax # 4-byte Reload			; CHECK-NEXT: movq {{[-0-9]+}}(%r{{[sb]}}p), %rdx # 8-byte Reload
	; CHECK-NEXT: #APP			; CHECK-NEXT: #APP
	; CHECK-NEXT: #NO_APP			; CHECK-NEXT: #NO_APP
	; CHECK-NEXT: jmp .LBB0_10			; CHECK-NEXT: jmp .LBB0_10
	; CHECK-NEXT: .Ltmp0: # Block address taken			; CHECK-NEXT: .Ltmp0: # Block address taken
	; CHECK-NEXT: .LBB0_8: # %if.then20.critedge			; CHECK-NEXT: .LBB0_8: # %if.then20.critedge
	; CHECK-NEXT: movl {{.*}}(%rip), %edi			; CHECK-NEXT: movl {{.*}}(%rip), %edi
	; CHECK-NEXT: movslq %eax, %rcx			; CHECK-NEXT: movslq %r14d, %rcx
	; CHECK-NEXT: movl $1, %esi			; CHECK-NEXT: movl $1, %esi
	; CHECK-NEXT: movq %r15, %rdx			; CHECK-NEXT: addq $16, %rsp
	; CHECK-NEXT: addq $8, %rsp
	; CHECK-NEXT: popq %rbx			; CHECK-NEXT: popq %rbx
	; CHECK-NEXT: popq %r12			; CHECK-NEXT: popq %r12
	; CHECK-NEXT: popq %r13
	; CHECK-NEXT: popq %r14			; CHECK-NEXT: popq %r14
	; CHECK-NEXT: popq %r15			; CHECK-NEXT: popq %r15
	; CHECK-NEXT: popq %rbp			; CHECK-NEXT: popq %rbp
	; CHECK-NEXT: jmp k # TAILCALL			; CHECK-NEXT: jmp k # TAILCALL
	; CHECK-NEXT: .LBB0_9: # %if.else			; CHECK-NEXT: .LBB0_9: # %if.else
	; CHECK-NEXT: incq 0			; CHECK-NEXT: incq 0
	; CHECK-NEXT: jmp .LBB0_10			; CHECK-NEXT: jmp .LBB0_10
	entry:			entry:
	▲ Show 20 Lines • Show All 65 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/cgp-usubo.ll

	Show First 20 Lines • Show All 156 Lines • ▼ Show 20 Lines
	end:			end:
	%ov = icmp ult i64 %x, %y			%ov = icmp ult i64 %x, %y
	ret i1 %ov			ret i1 %ov
	}			}

	define i1 @usubo_ult_cmp_dominates_i64(i64 %x, i64 %y, i64* %p, i1 %cond) nounwind {			define i1 @usubo_ult_cmp_dominates_i64(i64 %x, i64 %y, i64* %p, i1 %cond) nounwind {
	; CHECK-LABEL: usubo_ult_cmp_dominates_i64:			; CHECK-LABEL: usubo_ult_cmp_dominates_i64:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: pushq %rbp
	; CHECK-NEXT: pushq %r15
	; CHECK-NEXT: pushq %r14
	; CHECK-NEXT: pushq %rbx			; CHECK-NEXT: pushq %rbx
	; CHECK-NEXT: pushq %rax			; CHECK-NEXT: subq $32, %rsp
	; CHECK-NEXT: movl %ecx, %ebp			; CHECK-NEXT: testb $1, %cl
	; CHECK-NEXT: testb $1, %bpl
	; CHECK-NEXT: je .LBB9_2			; CHECK-NEXT: je .LBB9_2
	; CHECK-NEXT: # %bb.1: # %t			; CHECK-NEXT: # %bb.1: # %t
	; CHECK-NEXT: movq %rdx, %r14			; CHECK-NEXT: xorl %eax, %eax
	; CHECK-NEXT: movq %rsi, %r15			; CHECK-NEXT: cmpq %rsi, %rdi
	; CHECK-NEXT: movq %rdi, %rbx			; CHECK-NEXT: setb %al
	; CHECK-NEXT: xorl %edi, %edi			; CHECK-NEXT: movq %rdi, {{[-0-9]+}}(%r{{[sb]}}p) # 8-byte Spill
	; CHECK-NEXT: cmpq %rsi, %rbx			; CHECK-NEXT: movl %eax, %edi
	; CHECK-NEXT: setb %dil			; CHECK-NEXT: movq %rdx, {{[-0-9]+}}(%r{{[sb]}}p) # 8-byte Spill
				; CHECK-NEXT: movl %ecx, {{[-0-9]+}}(%r{{[sb]}}p) # 4-byte Spill
				; CHECK-NEXT: movq %rsi, %rbx
	; CHECK-NEXT: callq call			; CHECK-NEXT: callq call
	; CHECK-NEXT: subq %r15, %rbx			; CHECK-NEXT: movq {{[-0-9]+}}(%r{{[sb]}}p), %rsi # 8-byte Reload
				; CHECK-NEXT: movl {{[-0-9]+}}(%r{{[sb]}}p), %ecx # 4-byte Reload
				; CHECK-NEXT: movq {{[-0-9]+}}(%r{{[sb]}}p), %rdx # 8-byte Reload
				; CHECK-NEXT: subq %rbx, %rsi
	; CHECK-NEXT: jae .LBB9_2			; CHECK-NEXT: jae .LBB9_2
	; CHECK-NEXT: # %bb.4: # %end			; CHECK-NEXT: # %bb.4: # %end
	; CHECK-NEXT: setb %al			; CHECK-NEXT: setb %al
	; CHECK-NEXT: movq %rbx, (%r14)			; CHECK-NEXT: movq %rsi, (%rdx)
	; CHECK-NEXT: jmp .LBB9_3			; CHECK-NEXT: jmp .LBB9_3
	; CHECK-NEXT: .LBB9_2: # %f			; CHECK-NEXT: .LBB9_2: # %f
	; CHECK-NEXT: movl %ebp, %eax			; CHECK-NEXT: movl %ecx, %eax
	; CHECK-NEXT: .LBB9_3: # %f			; CHECK-NEXT: .LBB9_3: # %f
	; CHECK-NEXT: addq $8, %rsp			; CHECK-NEXT: addq $32, %rsp
	; CHECK-NEXT: popq %rbx			; CHECK-NEXT: popq %rbx
	; CHECK-NEXT: popq %r14
	; CHECK-NEXT: popq %r15
	; CHECK-NEXT: popq %rbp
	; CHECK-NEXT: retq			; CHECK-NEXT: retq
	entry:			entry:
	br i1 %cond, label %t, label %f			br i1 %cond, label %t, label %f

	t:			t:
	%ov = icmp ult i64 %x, %y			%ov = icmp ult i64 %x, %y
	call void @call(i1 %ov)			call void @call(i1 %ov)
	br i1 %ov, label %end, label %f			br i1 %ov, label %end, label %f
	▲ Show 20 Lines • Show All 58 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/csr-split.ll

	Show First 20 Lines • Show All 69 Lines • ▼ Show 20 Lines
	; CHECK-LABEL: test2:			; CHECK-LABEL: test2:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: pushq %rbx			; CHECK-NEXT: pushq %rbx
	; CHECK-NEXT: .cfi_def_cfa_offset 16			; CHECK-NEXT: .cfi_def_cfa_offset 16
	; CHECK-NEXT: .cfi_offset %rbx, -16			; CHECK-NEXT: .cfi_offset %rbx, -16
	; CHECK-NEXT: testq %rdi, %rdi			; CHECK-NEXT: testq %rdi, %rdi
	; CHECK-NEXT: je .LBB1_2			; CHECK-NEXT: je .LBB1_2
	; CHECK-NEXT: # %bb.1: # %if.end			; CHECK-NEXT: # %bb.1: # %if.end
	; CHECK-NEXT: movq %rdi, %rbx
	; CHECK-NEXT: movslq {{.*}}(%rip), %rax			; CHECK-NEXT: movslq {{.*}}(%rip), %rax
	; CHECK-NEXT: cmpq %rdi, %rax			; CHECK-NEXT: cmpq %rdi, %rax
	; CHECK-NEXT: je .LBB1_3			; CHECK-NEXT: je .LBB1_3
	; CHECK-NEXT: .LBB1_2: # %return			; CHECK-NEXT: .LBB1_2: # %return
	; CHECK-NEXT: xorl %eax, %eax			; CHECK-NEXT: xorl %eax, %eax
	; CHECK-NEXT: popq %rbx			; CHECK-NEXT: popq %rbx
	; CHECK-NEXT: .cfi_def_cfa_offset 8			; CHECK-NEXT: .cfi_def_cfa_offset 8
	; CHECK-NEXT: retq			; CHECK-NEXT: retq
	; CHECK-NEXT: .LBB1_3: # %if.then2			; CHECK-NEXT: .LBB1_3: # %if.then2
	; CHECK-NEXT: .cfi_def_cfa_offset 16			; CHECK-NEXT: .cfi_def_cfa_offset 16
				; CHECK-NEXT: movq %rdi, %rbx
	; CHECK-NEXT: callq callVoid			; CHECK-NEXT: callq callVoid
	; CHECK-NEXT: movq %rbx, %rdi			; CHECK-NEXT: movq %rbx, %rdi
	; CHECK-NEXT: popq %rbx			; CHECK-NEXT: popq %rbx
	; CHECK-NEXT: .cfi_def_cfa_offset 8			; CHECK-NEXT: .cfi_def_cfa_offset 8
	; CHECK-NEXT: jmp callNonVoid # TAILCALL			; CHECK-NEXT: jmp callNonVoid # TAILCALL
	;			;
	; CHECK-32BIT-LABEL: test2:			; CHECK-32BIT-LABEL: test2:
	; CHECK-32BIT: # %bb.0: # %entry			; CHECK-32BIT: # %bb.0: # %entry
	▲ Show 20 Lines • Show All 134 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/fp128-cast.ll

	Show First 20 Lines • Show All 1,093 Lines • ▼ Show 20 Lines
	; X64-SSE-NEXT: .LBB22_2: # %cleanup			; X64-SSE-NEXT: .LBB22_2: # %cleanup
	; X64-SSE-NEXT: retq			; X64-SSE-NEXT: retq
	;			;
	; X32-LABEL: TestTruncCopysign:			; X32-LABEL: TestTruncCopysign:
	; X32: # %bb.0: # %entry			; X32: # %bb.0: # %entry
	; X32-NEXT: pushl %edi			; X32-NEXT: pushl %edi
	; X32-NEXT: pushl %esi			; X32-NEXT: pushl %esi
	; X32-NEXT: subl $36, %esp			; X32-NEXT: subl $36, %esp
	; X32-NEXT: movl {{[0-9]+}}(%esp), %esi
	; X32-NEXT: movl {{[0-9]+}}(%esp), %eax			; X32-NEXT: movl {{[0-9]+}}(%esp), %eax
	; X32-NEXT: movl {{[0-9]+}}(%esp), %ecx			; X32-NEXT: movl {{[0-9]+}}(%esp), %ecx
	; X32-NEXT: movl {{[0-9]+}}(%esp), %edi
	; X32-NEXT: movl {{[0-9]+}}(%esp), %edx			; X32-NEXT: movl {{[0-9]+}}(%esp), %edx
				; X32-NEXT: movl {{[0-9]+}}(%esp), %edi
				; X32-NEXT: movl {{[0-9]+}}(%esp), %esi
	; X32-NEXT: cmpl $50001, {{[0-9]+}}(%esp) # imm = 0xC351			; X32-NEXT: cmpl $50001, {{[0-9]+}}(%esp) # imm = 0xC351
	; X32-NEXT: jl .LBB22_4			; X32-NEXT: jl .LBB22_4
	; X32-NEXT: # %bb.1: # %if.then			; X32-NEXT: # %bb.1: # %if.then
	; X32-NEXT: pushl %eax
	; X32-NEXT: pushl %ecx			; X32-NEXT: pushl %ecx
	; X32-NEXT: pushl %edi
	; X32-NEXT: pushl %edx			; X32-NEXT: pushl %edx
				; X32-NEXT: pushl %edi
				; X32-NEXT: pushl %esi
	; X32-NEXT: calll __trunctfdf2			; X32-NEXT: calll __trunctfdf2
	; X32-NEXT: addl $16, %esp			; X32-NEXT: addl $16, %esp
	; X32-NEXT: fstpl {{[0-9]+}}(%esp)			; X32-NEXT: fstpl {{[0-9]+}}(%esp)
	; X32-NEXT: testb $-128, {{[0-9]+}}(%esp)			; X32-NEXT: testb $-128, {{[0-9]+}}(%esp)
	; X32-NEXT: flds {{\.LCPI.*}}			; X32-NEXT: flds {{\.LCPI.*}}
	; X32-NEXT: flds {{\.LCPI.*}}			; X32-NEXT: flds {{\.LCPI.*}}
	; X32-NEXT: jne .LBB22_3			; X32-NEXT: jne .LBB22_3
	; X32-NEXT: # %bb.2: # %if.then			; X32-NEXT: # %bb.2: # %if.then
	; X32-NEXT: fstp %st(1)			; X32-NEXT: fstp %st(1)
	; X32-NEXT: fldz			; X32-NEXT: fldz
	; X32-NEXT: .LBB22_3: # %if.then			; X32-NEXT: .LBB22_3: # %if.then
	; X32-NEXT: fstp %st(0)			; X32-NEXT: fstp %st(0)
	; X32-NEXT: subl $16, %esp			; X32-NEXT: subl $16, %esp
	; X32-NEXT: leal {{[0-9]+}}(%esp), %eax			; X32-NEXT: leal {{[0-9]+}}(%esp), %eax
	; X32-NEXT: movl %eax, (%esp)			; X32-NEXT: movl %eax, (%esp)
	; X32-NEXT: fstpl {{[0-9]+}}(%esp)			; X32-NEXT: fstpl {{[0-9]+}}(%esp)
	; X32-NEXT: calll __extenddftf2			; X32-NEXT: calll __extenddftf2
	; X32-NEXT: addl $12, %esp			; X32-NEXT: addl $12, %esp
	; X32-NEXT: movl {{[0-9]+}}(%esp), %eax
	; X32-NEXT: movl {{[0-9]+}}(%esp), %ecx			; X32-NEXT: movl {{[0-9]+}}(%esp), %ecx
	; X32-NEXT: movl {{[0-9]+}}(%esp), %edx			; X32-NEXT: movl {{[0-9]+}}(%esp), %edx
				; X32-NEXT: movl {{[0-9]+}}(%esp), %esi
	; X32-NEXT: movl {{[0-9]+}}(%esp), %edi			; X32-NEXT: movl {{[0-9]+}}(%esp), %edi
				; X32-NEXT: movl {{[0-9]+}}(%esp), %eax
	; X32-NEXT: .LBB22_4: # %cleanup			; X32-NEXT: .LBB22_4: # %cleanup
	; X32-NEXT: movl %edx, (%esi)			; X32-NEXT: movl %esi, (%eax)
	; X32-NEXT: movl %edi, 4(%esi)			; X32-NEXT: movl %edi, 4(%eax)
	; X32-NEXT: movl %ecx, 8(%esi)			; X32-NEXT: movl %edx, 8(%eax)
	; X32-NEXT: movl %eax, 12(%esi)			; X32-NEXT: movl %ecx, 12(%eax)
	; X32-NEXT: movl %esi, %eax
	; X32-NEXT: addl $36, %esp			; X32-NEXT: addl $36, %esp
	; X32-NEXT: popl %esi			; X32-NEXT: popl %esi
	; X32-NEXT: popl %edi			; X32-NEXT: popl %edi
	; X32-NEXT: retl $4			; X32-NEXT: retl $4
	;			;
	; X64-AVX-LABEL: TestTruncCopysign:			; X64-AVX-LABEL: TestTruncCopysign:
	; X64-AVX: # %bb.0: # %entry			; X64-AVX: # %bb.0: # %entry
	; X64-AVX-NEXT: cmpl $50001, %edi # imm = 0xC351			; X64-AVX-NEXT: cmpl $50001, %edi # imm = 0xC351
	▲ Show 20 Lines • Show All 101 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/peep-test-4.ll

	Show First 20 Lines • Show All 257 Lines • ▼ Show 20 Lines
	return:			return:
	tail call void @foo32(i32 %cnt)			tail call void @foo32(i32 %cnt)
	ret void			ret void
	}			}

	define void @testCTZ3(i32 %v) nounwind {			define void @testCTZ3(i32 %v) nounwind {
	; CHECK-LABEL: testCTZ3:			; CHECK-LABEL: testCTZ3:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: pushq %rbx			; CHECK-NEXT: tzcntl %edi, %edi
	; CHECK-NEXT: tzcntl %edi, %ebx			; CHECK-NEXT: jb .LBB13_1
	; CHECK-NEXT: jae .LBB13_2			; CHECK-NEXT: # %bb.2: # %return
	; CHECK-NEXT: # %bb.1: # %bb			; CHECK-NEXT: jmp foo32 # TAILCALL
	; CHECK-NEXT: movl %ebx, %edi			; CHECK-NEXT: .LBB13_1: # %bb
				; CHECK-NEXT: pushq %rax
				; CHECK-NEXT: movl %edi, {{[-0-9]+}}(%r{{[sb]}}p) # 4-byte Spill
				; CHECK-NEXT: movl {{[-0-9]+}}(%r{{[sb]}}p), %edi # 4-byte Reload
	; CHECK-NEXT: callq foo			; CHECK-NEXT: callq foo
	; CHECK-NEXT: .LBB13_2: # %return			; CHECK-NEXT: movl {{[-0-9]+}}(%r{{[sb]}}p), %edi # 4-byte Reload
	; CHECK-NEXT: movl %ebx, %edi			; CHECK-NEXT: addq $8, %rsp
	; CHECK-NEXT: popq %rbx
	; CHECK-NEXT: jmp foo32 # TAILCALL			; CHECK-NEXT: jmp foo32 # TAILCALL
	%cnt = tail call i32 @llvm.cttz.i32(i32 %v, i1 true)			%cnt = tail call i32 @llvm.cttz.i32(i32 %v, i1 true)
	%cmp = icmp ne i32 %v, 0			%cmp = icmp ne i32 %v, 0
	br i1 %cmp, label %return, label %bb			br i1 %cmp, label %return, label %bb

	bb:			bb:
	tail call void @foo(i32 %cnt)			tail call void @foo(i32 %cnt)
	br label %return			br label %return
	Show All 33 Lines

llvm/test/CodeGen/X86/ragreedy-bug.ll

	Show All 17 Lines
	%struct.E_list_struct = type { %struct.E_list_struct, %struct.Exp_struct }			%struct.E_list_struct = type { %struct.E_list_struct, %struct.Exp_struct }
	%struct.domain_struct = type { i8, i32, %struct.List_o_links_struct, i32, i32, %struct.d_tree_leaf_struct, %struct.domain_struct }			%struct.domain_struct = type { i8, i32, %struct.List_o_links_struct, i32, i32, %struct.d_tree_leaf_struct, %struct.domain_struct }
	%struct.d_tree_leaf_struct = type { %struct.domain_struct, i32, %struct.d_tree_leaf_struct }			%struct.d_tree_leaf_struct = type { %struct.domain_struct, i32, %struct.d_tree_leaf_struct }
	@_DefaultRuneLocale = external global %struct._RuneLocale			@_DefaultRuneLocale = external global %struct._RuneLocale
	declare i32 @__maskrune(i32, i64) #7			declare i32 @__maskrune(i32, i64) #7
	define fastcc i32 @prune_match(%struct.Connector_struct* nocapture readonly %a, %struct.Connector_struct* nocapture readonly %b) #9 {			define fastcc i32 @prune_match(%struct.Connector_struct* nocapture readonly %a, %struct.Connector_struct* nocapture readonly %b) #9 {
	; CHECK-LABEL: prune_match:			; CHECK-LABEL: prune_match:
	; CHECK: ## %bb.0: ## %entry			; CHECK: ## %bb.0: ## %entry
	; CHECK-NEXT: pushq %rbp			; CHECK-NEXT: subq $40, %rsp
	; CHECK-NEXT: .cfi_def_cfa_offset 16
	; CHECK-NEXT: pushq %r15
	; CHECK-NEXT: .cfi_def_cfa_offset 24
	; CHECK-NEXT: pushq %r14
	; CHECK-NEXT: .cfi_def_cfa_offset 32
	; CHECK-NEXT: pushq %r13
	; CHECK-NEXT: .cfi_def_cfa_offset 40
	; CHECK-NEXT: pushq %r12
	; CHECK-NEXT: .cfi_def_cfa_offset 48			; CHECK-NEXT: .cfi_def_cfa_offset 48
	; CHECK-NEXT: pushq %rbx
	; CHECK-NEXT: .cfi_def_cfa_offset 56
	; CHECK-NEXT: pushq %rax
	; CHECK-NEXT: .cfi_def_cfa_offset 64
	; CHECK-NEXT: .cfi_offset %rbx, -56
	; CHECK-NEXT: .cfi_offset %r12, -48
	; CHECK-NEXT: .cfi_offset %r13, -40
	; CHECK-NEXT: .cfi_offset %r14, -32
	; CHECK-NEXT: .cfi_offset %r15, -24
	; CHECK-NEXT: .cfi_offset %rbp, -16
	; CHECK-NEXT: movzwl (%rdi), %eax			; CHECK-NEXT: movzwl (%rdi), %eax
	; CHECK-NEXT: cmpw (%rsi), %ax			; CHECK-NEXT: cmpw (%rsi), %ax
	; CHECK-NEXT: jne LBB0_20			; CHECK-NEXT: jne LBB0_46
	; CHECK-NEXT: ## %bb.1: ## %if.end			; CHECK-NEXT: ## %bb.1: ## %if.end
	; CHECK-NEXT: movq %rdi, %r12			; CHECK-NEXT: movb 4(%rdi), %r9b
	; CHECK-NEXT: movb 4(%rdi), %cl			; CHECK-NEXT: movb 4(%rsi), %r10b
	; CHECK-NEXT: movb 4(%rsi), %dl			; CHECK-NEXT: movq 16(%rdi), %r11
	; CHECK-NEXT: movq 16(%rdi), %r14			; CHECK-NEXT: movq 16(%rsi), %r8
	; CHECK-NEXT: movq 16(%rsi), %r15			; CHECK-NEXT: xorl %edx, %edx
	; CHECK-NEXT: xorl %ebx, %ebx			; CHECK-NEXT: movq __DefaultRuneLocale@{{.*}}(%rip), %rsi
	; CHECK-NEXT: movq __DefaultRuneLocale@{{.*}}(%rip), %rbp			; CHECK-NEXT: movl $32768, %ecx ## imm = 0x8000
	; CHECK-NEXT: movl $32768, %r13d ## imm = 0x8000
	; CHECK-NEXT: LBB0_2: ## %while.cond			; CHECK-NEXT: LBB0_2: ## %while.cond
	; CHECK-NEXT: ## =>This Inner Loop Header: Depth=1			; CHECK-NEXT: ## =>This Inner Loop Header: Depth=1
	; CHECK-NEXT: movsbq (%r14,%rbx), %rdi			; CHECK-NEXT: movsbq (%r11,%rdx), %rax
	; CHECK-NEXT: testq %rdi, %rdi			; CHECK-NEXT: testq %rax, %rax
	; CHECK-NEXT: js LBB0_8			; CHECK-NEXT: js LBB0_8
	; CHECK-NEXT: ## %bb.3: ## %cond.true.i.i			; CHECK-NEXT: ## %bb.3: ## %cond.true.i.i
	; CHECK-NEXT: ## in Loop: Header=BB0_2 Depth=1			; CHECK-NEXT: ## in Loop: Header=BB0_2 Depth=1
	; CHECK-NEXT: movl 60(%rbp,%rdi,4), %eax			; CHECK-NEXT: movl 60(%rsi,%rax,4), %eax
	; CHECK-NEXT: andl %r13d, %eax			; CHECK-NEXT: andl %ecx, %eax
	; CHECK-NEXT: testl %eax, %eax			; CHECK-NEXT: testl %eax, %eax
	; CHECK-NEXT: jne LBB0_6			; CHECK-NEXT: jne LBB0_6
	; CHECK-NEXT: LBB0_4: ## %lor.rhs			; CHECK-NEXT: LBB0_4: ## %lor.rhs
	; CHECK-NEXT: ## in Loop: Header=BB0_2 Depth=1			; CHECK-NEXT: ## in Loop: Header=BB0_2 Depth=1
	; CHECK-NEXT: movsbq (%rbx,%r15), %rdi			; CHECK-NEXT: movsbq (%rdx,%r8), %rax
	; CHECK-NEXT: testq %rdi, %rdi			; CHECK-NEXT: testq %rax, %rax
	; CHECK-NEXT: js LBB0_9			; CHECK-NEXT: js LBB0_9
	; CHECK-NEXT: ## %bb.5: ## %cond.true.i.i217			; CHECK-NEXT: ## %bb.5: ## %cond.true.i.i217
	; CHECK-NEXT: ## in Loop: Header=BB0_2 Depth=1			; CHECK-NEXT: ## in Loop: Header=BB0_2 Depth=1
	; CHECK-NEXT: movl 60(%rbp,%rdi,4), %eax			; CHECK-NEXT: movl 60(%rsi,%rax,4), %eax
	; CHECK-NEXT: andl %r13d, %eax			; CHECK-NEXT: andl %ecx, %eax
	; CHECK-NEXT: testl %eax, %eax			; CHECK-NEXT: testl %eax, %eax
	; CHECK-NEXT: je LBB0_10			; CHECK-NEXT: je LBB0_10
	; CHECK-NEXT: LBB0_6: ## %while.body			; CHECK-NEXT: LBB0_6: ## %while.body
	; CHECK-NEXT: ## in Loop: Header=BB0_2 Depth=1			; CHECK-NEXT: ## in Loop: Header=BB0_2 Depth=1
	; CHECK-NEXT: movzbl (%rbx,%r14), %eax			; CHECK-NEXT: movzbl (%rdx,%r11), %eax
	; CHECK-NEXT: cmpb (%rbx,%r15), %al			; CHECK-NEXT: cmpb (%rdx,%r8), %al
	; CHECK-NEXT: jne LBB0_20			; CHECK-NEXT: jne LBB0_46
	; CHECK-NEXT: ## %bb.7: ## %if.end17			; CHECK-NEXT: ## %bb.7: ## %if.end17
	; CHECK-NEXT: ## in Loop: Header=BB0_2 Depth=1			; CHECK-NEXT: ## in Loop: Header=BB0_2 Depth=1
	; CHECK-NEXT: incq %rbx			; CHECK-NEXT: incq %rdx
	; CHECK-NEXT: jmp LBB0_2			; CHECK-NEXT: jmp LBB0_2
	; CHECK-NEXT: LBB0_8: ## %cond.false.i.i			; CHECK-NEXT: LBB0_8: ## %cond.false.i.i
	; CHECK-NEXT: ## in Loop: Header=BB0_2 Depth=1			; CHECK-NEXT: ## in Loop: Header=BB0_2 Depth=1
	; CHECK-NEXT: movl $32768, %esi ## imm = 0x8000			; CHECK-NEXT: movl $32768, %esi ## imm = 0x8000
	; CHECK-NEXT: ## kill: def $edi killed $edi killed $rdi			; CHECK-NEXT: movq %rdi, {{[-0-9]+}}(%r{{[sb]}}p) ## 8-byte Spill
	; CHECK-NEXT: movb %cl, {{[-0-9]+}}(%r{{[sb]}}p) ## 1-byte Spill			; CHECK-NEXT: movl %eax, %edi
	; CHECK-NEXT: movb %dl, {{[-0-9]+}}(%r{{[sb]}}p) ## 1-byte Spill			; CHECK-NEXT: movq %r11, {{[-0-9]+}}(%r{{[sb]}}p) ## 8-byte Spill
				; CHECK-NEXT: movq %r8, {{[-0-9]+}}(%r{{[sb]}}p) ## 8-byte Spill
				; CHECK-NEXT: movq %rdx, {{[-0-9]+}}(%r{{[sb]}}p) ## 8-byte Spill
				; CHECK-NEXT: movb %r9b, {{[-0-9]+}}(%r{{[sb]}}p) ## 1-byte Spill
				; CHECK-NEXT: movb %r10b, {{[-0-9]+}}(%r{{[sb]}}p) ## 1-byte Spill
	; CHECK-NEXT: callq ___maskrune			; CHECK-NEXT: callq ___maskrune
	; CHECK-NEXT: movzbl {{[-0-9]+}}(%r{{[sb]}}p), %edx ## 1-byte Folded Reload			; CHECK-NEXT: movl $32768, %ecx ## imm = 0x8000
	; CHECK-NEXT: movzbl {{[-0-9]+}}(%r{{[sb]}}p), %ecx ## 1-byte Folded Reload			; CHECK-NEXT: movq __DefaultRuneLocale@{{.*}}(%rip), %rsi
				; CHECK-NEXT: movzbl {{[-0-9]+}}(%r{{[sb]}}p), %r10d ## 1-byte Folded Reload
				; CHECK-NEXT: movzbl {{[-0-9]+}}(%r{{[sb]}}p), %r9d ## 1-byte Folded Reload
				; CHECK-NEXT: movq {{[-0-9]+}}(%r{{[sb]}}p), %rdx ## 8-byte Reload
				; CHECK-NEXT: movq {{[-0-9]+}}(%r{{[sb]}}p), %r8 ## 8-byte Reload
				; CHECK-NEXT: movq {{[-0-9]+}}(%r{{[sb]}}p), %r11 ## 8-byte Reload
				; CHECK-NEXT: movq {{[-0-9]+}}(%r{{[sb]}}p), %rdi ## 8-byte Reload
	; CHECK-NEXT: testl %eax, %eax			; CHECK-NEXT: testl %eax, %eax
	; CHECK-NEXT: je LBB0_4			; CHECK-NEXT: je LBB0_4
	; CHECK-NEXT: jmp LBB0_6			; CHECK-NEXT: jmp LBB0_6
	; CHECK-NEXT: LBB0_9: ## %cond.false.i.i219			; CHECK-NEXT: LBB0_9: ## %cond.false.i.i219
	; CHECK-NEXT: ## in Loop: Header=BB0_2 Depth=1			; CHECK-NEXT: ## in Loop: Header=BB0_2 Depth=1
	; CHECK-NEXT: movl $32768, %esi ## imm = 0x8000			; CHECK-NEXT: movl $32768, %esi ## imm = 0x8000
	; CHECK-NEXT: ## kill: def $edi killed $edi killed $rdi			; CHECK-NEXT: movq %rdi, {{[-0-9]+}}(%r{{[sb]}}p) ## 8-byte Spill
	; CHECK-NEXT: movb %cl, {{[-0-9]+}}(%r{{[sb]}}p) ## 1-byte Spill			; CHECK-NEXT: movl %eax, %edi
	; CHECK-NEXT: movb %dl, {{[-0-9]+}}(%r{{[sb]}}p) ## 1-byte Spill			; CHECK-NEXT: movq %r11, {{[-0-9]+}}(%r{{[sb]}}p) ## 8-byte Spill
				; CHECK-NEXT: movq %r8, {{[-0-9]+}}(%r{{[sb]}}p) ## 8-byte Spill
				; CHECK-NEXT: movq %rdx, {{[-0-9]+}}(%r{{[sb]}}p) ## 8-byte Spill
				; CHECK-NEXT: movb %r9b, {{[-0-9]+}}(%r{{[sb]}}p) ## 1-byte Spill
				; CHECK-NEXT: movb %r10b, {{[-0-9]+}}(%r{{[sb]}}p) ## 1-byte Spill
	; CHECK-NEXT: callq ___maskrune			; CHECK-NEXT: callq ___maskrune
	; CHECK-NEXT: movzbl {{[-0-9]+}}(%r{{[sb]}}p), %edx ## 1-byte Folded Reload			; CHECK-NEXT: movl $32768, %ecx ## imm = 0x8000
	; CHECK-NEXT: movzbl {{[-0-9]+}}(%r{{[sb]}}p), %ecx ## 1-byte Folded Reload			; CHECK-NEXT: movq __DefaultRuneLocale@{{.*}}(%rip), %rsi
				; CHECK-NEXT: movzbl {{[-0-9]+}}(%r{{[sb]}}p), %r10d ## 1-byte Folded Reload
				; CHECK-NEXT: movzbl {{[-0-9]+}}(%r{{[sb]}}p), %r9d ## 1-byte Folded Reload
				; CHECK-NEXT: movq {{[-0-9]+}}(%r{{[sb]}}p), %rdx ## 8-byte Reload
				; CHECK-NEXT: movq {{[-0-9]+}}(%r{{[sb]}}p), %r8 ## 8-byte Reload
				; CHECK-NEXT: movq {{[-0-9]+}}(%r{{[sb]}}p), %r11 ## 8-byte Reload
				; CHECK-NEXT: movq {{[-0-9]+}}(%r{{[sb]}}p), %rdi ## 8-byte Reload
	; CHECK-NEXT: testl %eax, %eax			; CHECK-NEXT: testl %eax, %eax
	; CHECK-NEXT: jne LBB0_6			; CHECK-NEXT: jne LBB0_6
	; CHECK-NEXT: LBB0_10: ## %while.end			; CHECK-NEXT: LBB0_10: ## %while.end
	; CHECK-NEXT: movl %edx, %eax			; CHECK-NEXT: movl %r10d, %eax
	; CHECK-NEXT: orb %cl, %al			; CHECK-NEXT: orb %r9b, %al
	; CHECK-NEXT: jne LBB0_28			; CHECK-NEXT: jne LBB0_26
	; CHECK-NEXT: ## %bb.11: ## %if.then23			; CHECK-NEXT: ## %bb.11: ## %if.then23
	; CHECK-NEXT: movq 16(%r12), %rdx			; CHECK-NEXT: movq 16(%rdi), %rcx
	; CHECK-NEXT: cmpb $83, (%rdx)			; CHECK-NEXT: cmpb $83, (%rcx)
	; CHECK-NEXT: movb (%r14,%rbx), %cl			; CHECK-NEXT: movb (%r11,%rdx), %sil
	; CHECK-NEXT: je LBB0_22			; CHECK-NEXT: je LBB0_21
	; CHECK-NEXT: LBB0_12: ## %while.cond59.preheader			; CHECK-NEXT: LBB0_12: ## %while.cond59.preheader
	; CHECK-NEXT: movl $1, %eax			; CHECK-NEXT: movl $1, %eax
	; CHECK-NEXT: LBB0_13: ## %while.cond59.preheader			; CHECK-NEXT: LBB0_13: ## %while.cond59.preheader
	; CHECK-NEXT: testb %cl, %cl			; CHECK-NEXT: testb %sil, %sil
	; CHECK-NEXT: je LBB0_21			; CHECK-NEXT: je LBB0_25
	; CHECK-NEXT: LBB0_14: ## %land.rhs			; CHECK-NEXT: LBB0_14: ## %land.rhs
	; CHECK-NEXT: ## =>This Inner Loop Header: Depth=1			; CHECK-NEXT: ## =>This Inner Loop Header: Depth=1
	; CHECK-NEXT: movzbl (%r15,%rbx), %edx			; CHECK-NEXT: movzbl (%r8,%rdx), %ecx
	; CHECK-NEXT: movl $1, %eax			; CHECK-NEXT: movl $1, %eax
	; CHECK-NEXT: testb %dl, %dl			; CHECK-NEXT: testb %cl, %cl
	; CHECK-NEXT: je LBB0_21			; CHECK-NEXT: je LBB0_25
	; CHECK-NEXT: ## %bb.15: ## %while.body66			; CHECK-NEXT: ## %bb.15: ## %while.body66
	; CHECK-NEXT: ## in Loop: Header=BB0_14 Depth=1			; CHECK-NEXT: ## in Loop: Header=BB0_14 Depth=1
	; CHECK-NEXT: cmpb $42, %cl			; CHECK-NEXT: cmpb $42, %sil
	; CHECK-NEXT: je LBB0_19			; CHECK-NEXT: je LBB0_19
	; CHECK-NEXT: ## %bb.16: ## %while.body66			; CHECK-NEXT: ## %bb.16: ## %while.body66
	; CHECK-NEXT: ## in Loop: Header=BB0_14 Depth=1			; CHECK-NEXT: ## in Loop: Header=BB0_14 Depth=1
	; CHECK-NEXT: cmpb $42, %dl			; CHECK-NEXT: cmpb $42, %cl
	; CHECK-NEXT: je LBB0_19			; CHECK-NEXT: je LBB0_19
	; CHECK-NEXT: ## %bb.17: ## %lor.lhs.false74			; CHECK-NEXT: ## %bb.17: ## %lor.lhs.false74
	; CHECK-NEXT: ## in Loop: Header=BB0_14 Depth=1			; CHECK-NEXT: ## in Loop: Header=BB0_14 Depth=1
	; CHECK-NEXT: xorl %eax, %eax			; CHECK-NEXT: xorl %eax, %eax
	; CHECK-NEXT: cmpb %dl, %cl			; CHECK-NEXT: cmpb %cl, %sil
	; CHECK-NEXT: jne LBB0_21			; CHECK-NEXT: jne LBB0_25
	; CHECK-NEXT: ## %bb.18: ## %lor.lhs.false74			; CHECK-NEXT: ## %bb.18: ## %lor.lhs.false74
	; CHECK-NEXT: ## in Loop: Header=BB0_14 Depth=1			; CHECK-NEXT: ## in Loop: Header=BB0_14 Depth=1
	; CHECK-NEXT: cmpb $94, %cl			; CHECK-NEXT: cmpb $94, %sil
	; CHECK-NEXT: je LBB0_21			; CHECK-NEXT: je LBB0_25
	; CHECK-NEXT: LBB0_19: ## %if.then83			; CHECK-NEXT: LBB0_19: ## %if.then83
	; CHECK-NEXT: ## in Loop: Header=BB0_14 Depth=1			; CHECK-NEXT: ## in Loop: Header=BB0_14 Depth=1
	; CHECK-NEXT: movzbl 1(%r14,%rbx), %ecx			; CHECK-NEXT: movzbl 1(%r11,%rdx), %esi
	; CHECK-NEXT: incq %rbx			; CHECK-NEXT: incq %rdx
	; CHECK-NEXT: testb %cl, %cl			; CHECK-NEXT: testb %sil, %sil
	; CHECK-NEXT: movl $1, %eax			; CHECK-NEXT: movl $1, %eax
	; CHECK-NEXT: jne LBB0_14			; CHECK-NEXT: jne LBB0_14
	; CHECK-NEXT: jmp LBB0_21			; CHECK-NEXT: jmp LBB0_25
	; CHECK-NEXT: LBB0_22: ## %land.lhs.true28			; CHECK-NEXT: LBB0_21: ## %land.lhs.true28
	; CHECK-NEXT: movl $1, %eax			; CHECK-NEXT: movl $1, %eax
	; CHECK-NEXT: testb %cl, %cl			; CHECK-NEXT: testb %sil, %sil
	; CHECK-NEXT: je LBB0_21			; CHECK-NEXT: je LBB0_25
	; CHECK-NEXT: ## %bb.23: ## %land.lhs.true28			; CHECK-NEXT: ## %bb.22: ## %land.lhs.true28
	; CHECK-NEXT: cmpb $112, %cl			; CHECK-NEXT: cmpb $112, %sil
	; CHECK-NEXT: jne LBB0_14			; CHECK-NEXT: jne LBB0_14
	; CHECK-NEXT: ## %bb.24: ## %land.lhs.true35			; CHECK-NEXT: ## %bb.23: ## %land.lhs.true35
	; CHECK-NEXT: cmpb $112, (%r15,%rbx)			; CHECK-NEXT: cmpb $112, (%r8,%rdx)
	; CHECK-NEXT: jne LBB0_14			; CHECK-NEXT: jne LBB0_14
	; CHECK-NEXT: ## %bb.25: ## %land.lhs.true43			; CHECK-NEXT: ## %bb.24: ## %land.lhs.true43
	; CHECK-NEXT: movq %r14, %rsi			; CHECK-NEXT: movq %r11, %rdi
	; CHECK-NEXT: subq %rdx, %rsi			; CHECK-NEXT: subq %rcx, %rdi
	; CHECK-NEXT: addq %rbx, %rsi			; CHECK-NEXT: addq %rdx, %rdi
	; CHECK-NEXT: cmpq $1, %rsi			; CHECK-NEXT: cmpq $1, %rdi
	; CHECK-NEXT: je LBB0_21			; CHECK-NEXT: jne LBB0_44
	; CHECK-NEXT: ## %bb.26: ## %lor.lhs.false47			; CHECK-NEXT: LBB0_25: ## %return
	; CHECK-NEXT: cmpq $2, %rsi			; CHECK-NEXT: addq $40, %rsp
	; CHECK-NEXT: jne LBB0_12			; CHECK-NEXT: retq
	; CHECK-NEXT: ## %bb.27: ## %land.lhs.true52			; CHECK-NEXT: LBB0_26: ## %if.else88
	; CHECK-NEXT: cmpb $73, -1(%r14,%rbx)			; CHECK-NEXT: cmpb $1, %r9b
	; CHECK-NEXT: jne LBB0_13			; CHECK-NEXT: jne LBB0_35
	; CHECK-NEXT: jmp LBB0_21			; CHECK-NEXT: ## %bb.27: ## %if.else88
	; CHECK-NEXT: LBB0_28: ## %if.else88			; CHECK-NEXT: cmpb $2, %r10b
	; CHECK-NEXT: cmpb $1, %cl			; CHECK-NEXT: jne LBB0_35
	; CHECK-NEXT: jne LBB0_37			; CHECK-NEXT: ## %bb.28: ## %while.cond95.preheader
	; CHECK-NEXT: ## %bb.29: ## %if.else88			; CHECK-NEXT: movb (%r11,%rdx), %sil
	; CHECK-NEXT: cmpb $2, %dl
	; CHECK-NEXT: jne LBB0_37
	; CHECK-NEXT: ## %bb.30: ## %while.cond95.preheader
	; CHECK-NEXT: movb (%r14,%rbx), %cl
	; CHECK-NEXT: movl $1, %eax			; CHECK-NEXT: movl $1, %eax
	; CHECK-NEXT: testb %cl, %cl			; CHECK-NEXT: testb %sil, %sil
	; CHECK-NEXT: jne LBB0_32			; CHECK-NEXT: jne LBB0_30
	; CHECK-NEXT: jmp LBB0_21			; CHECK-NEXT: jmp LBB0_25
	; CHECK-NEXT: LBB0_31: ## %if.then117			; CHECK-NEXT: LBB0_29: ## %if.then117
	; CHECK-NEXT: ## in Loop: Header=BB0_32 Depth=1			; CHECK-NEXT: ## in Loop: Header=BB0_30 Depth=1
	; CHECK-NEXT: movzbl 1(%r14,%rbx), %ecx			; CHECK-NEXT: movzbl 1(%r11,%rdx), %esi
	; CHECK-NEXT: incq %rbx			; CHECK-NEXT: incq %rdx
	; CHECK-NEXT: testb %cl, %cl			; CHECK-NEXT: testb %sil, %sil
	; CHECK-NEXT: je LBB0_21			; CHECK-NEXT: je LBB0_25
	; CHECK-NEXT: LBB0_32: ## %land.rhs99			; CHECK-NEXT: LBB0_30: ## %land.rhs99
	; CHECK-NEXT: ## =>This Inner Loop Header: Depth=1			; CHECK-NEXT: ## =>This Inner Loop Header: Depth=1
	; CHECK-NEXT: movzbl (%r15,%rbx), %edx			; CHECK-NEXT: movzbl (%r8,%rdx), %ecx
	; CHECK-NEXT: testb %dl, %dl			; CHECK-NEXT: testb %cl, %cl
	; CHECK-NEXT: je LBB0_21			; CHECK-NEXT: je LBB0_25
				; CHECK-NEXT: ## %bb.31: ## %while.body104
				; CHECK-NEXT: ## in Loop: Header=BB0_30 Depth=1
				; CHECK-NEXT: cmpb %cl, %sil
				; CHECK-NEXT: je LBB0_29
				; CHECK-NEXT: ## %bb.32: ## %while.body104
				; CHECK-NEXT: ## in Loop: Header=BB0_30 Depth=1
				; CHECK-NEXT: cmpb $42, %sil
				; CHECK-NEXT: je LBB0_29
	; CHECK-NEXT: ## %bb.33: ## %while.body104			; CHECK-NEXT: ## %bb.33: ## %while.body104
	; CHECK-NEXT: ## in Loop: Header=BB0_32 Depth=1			; CHECK-NEXT: ## in Loop: Header=BB0_30 Depth=1
	; CHECK-NEXT: cmpb %dl, %cl			; CHECK-NEXT: cmpb $94, %cl
	; CHECK-NEXT: je LBB0_31			; CHECK-NEXT: je LBB0_29
	; CHECK-NEXT: ## %bb.34: ## %while.body104			; CHECK-NEXT: LBB0_46:
	; CHECK-NEXT: ## in Loop: Header=BB0_32 Depth=1
	; CHECK-NEXT: cmpb $42, %cl
	; CHECK-NEXT: je LBB0_31
	; CHECK-NEXT: ## %bb.35: ## %while.body104
	; CHECK-NEXT: ## in Loop: Header=BB0_32 Depth=1
	; CHECK-NEXT: cmpb $94, %dl
	; CHECK-NEXT: je LBB0_31
	; CHECK-NEXT: LBB0_20:
	; CHECK-NEXT: xorl %eax, %eax			; CHECK-NEXT: xorl %eax, %eax
	; CHECK-NEXT: LBB0_21: ## %return			; CHECK-NEXT: addq $40, %rsp
	; CHECK-NEXT: addq $8, %rsp
	; CHECK-NEXT: popq %rbx
	; CHECK-NEXT: popq %r12
	; CHECK-NEXT: popq %r13
	; CHECK-NEXT: popq %r14
	; CHECK-NEXT: popq %r15
	; CHECK-NEXT: popq %rbp
	; CHECK-NEXT: retq			; CHECK-NEXT: retq
	; CHECK-NEXT: LBB0_37: ## %if.else123			; CHECK-NEXT: LBB0_35: ## %if.else123
	; CHECK-NEXT: xorl %eax, %eax			; CHECK-NEXT: xorl %eax, %eax
	; CHECK-NEXT: cmpb $1, %dl			; CHECK-NEXT: cmpb $1, %r10b
	; CHECK-NEXT: jne LBB0_21			; CHECK-NEXT: jne LBB0_25
	; CHECK-NEXT: ## %bb.38: ## %if.else123			; CHECK-NEXT: ## %bb.36: ## %if.else123
	; CHECK-NEXT: cmpb $2, %cl			; CHECK-NEXT: cmpb $2, %r9b
	; CHECK-NEXT: jne LBB0_21			; CHECK-NEXT: jne LBB0_25
	; CHECK-NEXT: ## %bb.39: ## %while.cond130.preheader			; CHECK-NEXT: ## %bb.37: ## %while.cond130.preheader
	; CHECK-NEXT: movb (%r14,%rbx), %cl			; CHECK-NEXT: movb (%r11,%rdx), %sil
	; CHECK-NEXT: testb %cl, %cl			; CHECK-NEXT: testb %sil, %sil
	; CHECK-NEXT: jne LBB0_41			; CHECK-NEXT: jne LBB0_39
	; CHECK-NEXT: jmp LBB0_45			; CHECK-NEXT: jmp LBB0_43
	; CHECK-NEXT: LBB0_40: ## %if.then152			; CHECK-NEXT: LBB0_38: ## %if.then152
	; CHECK-NEXT: ## in Loop: Header=BB0_41 Depth=1			; CHECK-NEXT: ## in Loop: Header=BB0_39 Depth=1
	; CHECK-NEXT: movzbl 1(%r14,%rbx), %ecx			; CHECK-NEXT: movzbl 1(%r11,%rdx), %esi
	; CHECK-NEXT: incq %rbx			; CHECK-NEXT: incq %rdx
	; CHECK-NEXT: testb %cl, %cl			; CHECK-NEXT: testb %sil, %sil
	; CHECK-NEXT: je LBB0_45			; CHECK-NEXT: je LBB0_43
	; CHECK-NEXT: LBB0_41: ## %land.rhs134			; CHECK-NEXT: LBB0_39: ## %land.rhs134
	; CHECK-NEXT: ## =>This Inner Loop Header: Depth=1			; CHECK-NEXT: ## =>This Inner Loop Header: Depth=1
	; CHECK-NEXT: movzbl (%r15,%rbx), %edx			; CHECK-NEXT: movzbl (%r8,%rdx), %ecx
	; CHECK-NEXT: testb %dl, %dl			; CHECK-NEXT: testb %cl, %cl
	; CHECK-NEXT: je LBB0_45			; CHECK-NEXT: je LBB0_43
				; CHECK-NEXT: ## %bb.40: ## %while.body139
				; CHECK-NEXT: ## in Loop: Header=BB0_39 Depth=1
				; CHECK-NEXT: cmpb %cl, %sil
				; CHECK-NEXT: je LBB0_38
				; CHECK-NEXT: ## %bb.41: ## %while.body139
				; CHECK-NEXT: ## in Loop: Header=BB0_39 Depth=1
				; CHECK-NEXT: cmpb $42, %cl
				; CHECK-NEXT: je LBB0_38
	; CHECK-NEXT: ## %bb.42: ## %while.body139			; CHECK-NEXT: ## %bb.42: ## %while.body139
	; CHECK-NEXT: ## in Loop: Header=BB0_41 Depth=1			; CHECK-NEXT: ## in Loop: Header=BB0_39 Depth=1
	; CHECK-NEXT: cmpb %dl, %cl			; CHECK-NEXT: cmpb $94, %sil
	; CHECK-NEXT: je LBB0_40			; CHECK-NEXT: je LBB0_38
	; CHECK-NEXT: ## %bb.43: ## %while.body139			; CHECK-NEXT: jmp LBB0_25
	; CHECK-NEXT: ## in Loop: Header=BB0_41 Depth=1			; CHECK-NEXT: LBB0_43:
	; CHECK-NEXT: cmpb $42, %dl
	; CHECK-NEXT: je LBB0_40
	; CHECK-NEXT: ## %bb.44: ## %while.body139
	; CHECK-NEXT: ## in Loop: Header=BB0_41 Depth=1
	; CHECK-NEXT: cmpb $94, %cl
	; CHECK-NEXT: je LBB0_40
	; CHECK-NEXT: jmp LBB0_21
	; CHECK-NEXT: LBB0_45:
	; CHECK-NEXT: movl $1, %eax			; CHECK-NEXT: movl $1, %eax
	; CHECK-NEXT: jmp LBB0_21			; CHECK-NEXT: addq $40, %rsp
				; CHECK-NEXT: retq
				; CHECK-NEXT: LBB0_44: ## %lor.lhs.false47
				; CHECK-NEXT: cmpq $2, %rdi
				; CHECK-NEXT: jne LBB0_12
				; CHECK-NEXT: ## %bb.45: ## %land.lhs.true52
				; CHECK-NEXT: cmpb $73, -1(%r11,%rdx)
				; CHECK-NEXT: jne LBB0_13
				; CHECK-NEXT: jmp LBB0_25
	entry:			entry:
	%label56 = bitcast %struct.Connector_struct* %a to i16*			%label56 = bitcast %struct.Connector_struct* %a to i16*
	%0 = load i16, i16* %label56, align 2			%0 = load i16, i16* %label56, align 2
	%label157 = bitcast %struct.Connector_struct* %b to i16*			%label157 = bitcast %struct.Connector_struct* %b to i16*
	%1 = load i16, i16* %label157, align 2			%1 = load i16, i16* %label157, align 2
	%cmp = icmp eq i16 %0, %1			%cmp = icmp eq i16 %0, %1
	br i1 %cmp, label %if.end, label %return, !prof !988			br i1 %cmp, label %if.end, label %return, !prof !988
	if.end:			if.end:
	▲ Show 20 Lines • Show All 254 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/ragreedy-hoist-spill.ll

	Show First 20 Lines • Show All 62 Lines • ▼ Show 20 Lines
	; CHECK-NEXT: popq %rbp			; CHECK-NEXT: popq %rbp
	; CHECK-NEXT: retq			; CHECK-NEXT: retq
	; CHECK-NEXT: LBB0_5: ## %if.end25			; CHECK-NEXT: LBB0_5: ## %if.end25
	; CHECK-NEXT: xorl %eax, %eax			; CHECK-NEXT: xorl %eax, %eax
	; CHECK-NEXT: testb %al, %al			; CHECK-NEXT: testb %al, %al
	; CHECK-NEXT: je LBB0_55			; CHECK-NEXT: je LBB0_55
	; CHECK-NEXT: ## %bb.6: ## %SyTime.exit2720			; CHECK-NEXT: ## %bb.6: ## %SyTime.exit2720
	; CHECK-NEXT: movq %rdx, %rbx			; CHECK-NEXT: movq %rdx, %rbx
	; CHECK-NEXT: movq %rdi, %rbp			; CHECK-NEXT: movq %rdi, %r14
	; CHECK-NEXT: leaq {{[0-9]+}}(%rsp), %rax			; CHECK-NEXT: leaq {{[0-9]+}}(%rsp), %rax
	; CHECK-NEXT: leaq {{[0-9]+}}(%rsp), %rcx			; CHECK-NEXT: leaq {{[0-9]+}}(%rsp), %rcx
	; CHECK-NEXT: cmpq %rax, %rcx			; CHECK-NEXT: cmpq %rax, %rcx
	; CHECK-NEXT: jae LBB0_8			; CHECK-NEXT: jae LBB0_8
	; CHECK-NEXT: ## %bb.7: ## %for.body.lr.ph			; CHECK-NEXT: ## %bb.7: ## %for.body.lr.ph
	; CHECK-NEXT: movl $512, %edx ## imm = 0x200			; CHECK-NEXT: movl $512, %edx ## imm = 0x200
	; CHECK-NEXT: movl $32, %esi			; CHECK-NEXT: movl $32, %esi
	; CHECK-NEXT: callq _memset			; CHECK-NEXT: callq _memset
	; CHECK-NEXT: LBB0_8: ## %while.body.preheader			; CHECK-NEXT: LBB0_8: ## %while.body.preheader
	; CHECK-NEXT: movq %rbp, {{[-0-9]+}}(%r{{[sb]}}p) ## 8-byte Spill
	; CHECK-NEXT: imulq $1040, %rbx, %rax ## imm = 0x410			; CHECK-NEXT: imulq $1040, %rbx, %rax ## imm = 0x410
	; CHECK-NEXT: movq _syBuf@{{.*}}(%rip), %rcx			; CHECK-NEXT: movq _syBuf@{{.*}}(%rip), %rcx
	; CHECK-NEXT: leaq 8(%rcx,%rax), %rbx			; CHECK-NEXT: leaq 8(%rcx,%rax), %rbx
	; CHECK-NEXT: movl $1, %r15d			; CHECK-NEXT: movl $1, %ebp
	; CHECK-NEXT: movq _syCTRO@{{.*}}(%rip), %rax			; CHECK-NEXT: movq _syCTRO@{{.*}}(%rip), %rax
	; CHECK-NEXT: movb $1, %cl			; CHECK-NEXT: movb $1, %cl
	; CHECK-NEXT: .p2align 4, 0x90			; CHECK-NEXT: .p2align 4, 0x90
	; CHECK-NEXT: LBB0_9: ## %do.body			; CHECK-NEXT: LBB0_9: ## %do.body
	; CHECK-NEXT: ## =>This Inner Loop Header: Depth=1			; CHECK-NEXT: ## =>This Inner Loop Header: Depth=1
	; CHECK-NEXT: movl $0, (%rax)			; CHECK-NEXT: movl $0, (%rax)
	; CHECK-NEXT: testb %cl, %cl			; CHECK-NEXT: testb %cl, %cl
	; CHECK-NEXT: jne LBB0_9			; CHECK-NEXT: jne LBB0_9
	; CHECK-NEXT: ## %bb.10: ## %do.end			; CHECK-NEXT: ## %bb.10: ## %do.end
	; CHECK-NEXT: xorl %r14d, %r14d			; CHECK-NEXT: movq %r14, {{[-0-9]+}}(%r{{[sb]}}p) ## 8-byte Spill
	; CHECK-NEXT: testb %r14b, %r14b			; CHECK-NEXT: xorl %r13d, %r13d
				; CHECK-NEXT: testb %r13b, %r13b
	; CHECK-NEXT: jne LBB0_11			; CHECK-NEXT: jne LBB0_11
	; CHECK-NEXT: ## %bb.12: ## %while.body200.preheader			; CHECK-NEXT: ## %bb.12: ## %while.body200.preheader
	; CHECK-NEXT: xorl %edx, %edx			; CHECK-NEXT: xorl %r12d, %r12d
				; CHECK-NEXT: leaq {{.*}}(%rip), %rdx
	; CHECK-NEXT: leaq {{.*}}(%rip), %rsi			; CHECK-NEXT: leaq {{.*}}(%rip), %rsi
	; CHECK-NEXT: leaq {{.*}}(%rip), %rdi			; CHECK-NEXT: movl $0, {{[-0-9]+}}(%r{{[sb]}}p) ## 4-byte Folded Spill
	; CHECK-NEXT: xorl %ebp, %ebp			; CHECK-NEXT: xorl %r14d, %r14d
	; CHECK-NEXT: xorl %r13d, %r13d
	; CHECK-NEXT: jmp LBB0_13			; CHECK-NEXT: jmp LBB0_13
	; CHECK-NEXT: .p2align 4, 0x90			; CHECK-NEXT: .p2align 4, 0x90
	; CHECK-NEXT: LBB0_20: ## %sw.bb256			; CHECK-NEXT: LBB0_20: ## %sw.bb256
	; CHECK-NEXT: ## in Loop: Header=BB0_13 Depth=1			; CHECK-NEXT: ## in Loop: Header=BB0_13 Depth=1
	; CHECK-NEXT: movl %r14d, %r13d			; CHECK-NEXT: movl %r13d, %r14d
	; CHECK-NEXT: LBB0_21: ## %while.cond197.backedge			; CHECK-NEXT: LBB0_21: ## %while.cond197.backedge
	; CHECK-NEXT: ## in Loop: Header=BB0_13 Depth=1			; CHECK-NEXT: ## in Loop: Header=BB0_13 Depth=1
	; CHECK-NEXT: decl %r15d			; CHECK-NEXT: decl %ebp
	; CHECK-NEXT: testl %r15d, %r15d			; CHECK-NEXT: testl %ebp, %ebp
	; CHECK-NEXT: movl %r13d, %r14d			; CHECK-NEXT: movl %r14d, %r13d
	; CHECK-NEXT: jle LBB0_22			; CHECK-NEXT: jle LBB0_22
	; CHECK-NEXT: LBB0_13: ## %while.body200			; CHECK-NEXT: LBB0_13: ## %while.body200
	; CHECK-NEXT: ## =>This Loop Header: Depth=1			; CHECK-NEXT: ## =>This Loop Header: Depth=1
	; CHECK-NEXT: ## Child Loop BB0_30 Depth 2			; CHECK-NEXT: ## Child Loop BB0_30 Depth 2
	; CHECK-NEXT: ## Child Loop BB0_38 Depth 2			; CHECK-NEXT: ## Child Loop BB0_38 Depth 2
	; CHECK-NEXT: leal -268(%r14), %eax			; CHECK-NEXT: leal -268(%r13), %eax
	; CHECK-NEXT: cmpl $105, %eax			; CHECK-NEXT: cmpl $105, %eax
	; CHECK-NEXT: ja LBB0_14			; CHECK-NEXT: ja LBB0_14
	; CHECK-NEXT: ## %bb.56: ## %while.body200			; CHECK-NEXT: ## %bb.56: ## %while.body200
	; CHECK-NEXT: ## in Loop: Header=BB0_13 Depth=1			; CHECK-NEXT: ## in Loop: Header=BB0_13 Depth=1
	; CHECK-NEXT: movslq (%rdi,%rax,4), %rax			; CHECK-NEXT: movslq (%rsi,%rax,4), %rax
	; CHECK-NEXT: addq %rdi, %rax			; CHECK-NEXT: addq %rsi, %rax
	; CHECK-NEXT: jmpq *%rax			; CHECK-NEXT: jmpq *%rax
	; CHECK-NEXT: LBB0_44: ## %while.cond1037.preheader			; CHECK-NEXT: LBB0_44: ## %while.cond1037.preheader
	; CHECK-NEXT: ## in Loop: Header=BB0_13 Depth=1			; CHECK-NEXT: ## in Loop: Header=BB0_13 Depth=1
	; CHECK-NEXT: testb %dl, %dl			; CHECK-NEXT: testb %r12b, %r12b
	; CHECK-NEXT: movl %r14d, %r13d			; CHECK-NEXT: movl %r13d, %r14d
	; CHECK-NEXT: jne LBB0_21			; CHECK-NEXT: jne LBB0_21
	; CHECK-NEXT: jmp LBB0_55			; CHECK-NEXT: jmp LBB0_55
	; CHECK-NEXT: .p2align 4, 0x90			; CHECK-NEXT: .p2align 4, 0x90
	; CHECK-NEXT: LBB0_14: ## %while.body200			; CHECK-NEXT: LBB0_14: ## %while.body200
	; CHECK-NEXT: ## in Loop: Header=BB0_13 Depth=1			; CHECK-NEXT: ## in Loop: Header=BB0_13 Depth=1
	; CHECK-NEXT: leal 1(%r14), %eax			; CHECK-NEXT: leal 1(%r13), %eax
	; CHECK-NEXT: cmpl $21, %eax			; CHECK-NEXT: cmpl $21, %eax
	; CHECK-NEXT: ja LBB0_20			; CHECK-NEXT: ja LBB0_20
	; CHECK-NEXT: ## %bb.15: ## %while.body200			; CHECK-NEXT: ## %bb.15: ## %while.body200
	; CHECK-NEXT: ## in Loop: Header=BB0_13 Depth=1			; CHECK-NEXT: ## in Loop: Header=BB0_13 Depth=1
	; CHECK-NEXT: movl $-1, %r13d			; CHECK-NEXT: movl $-1, %r14d
	; CHECK-NEXT: movslq (%rsi,%rax,4), %rax			; CHECK-NEXT: movslq (%rdx,%rax,4), %rax
	; CHECK-NEXT: addq %rsi, %rax			; CHECK-NEXT: addq %rdx, %rax
	; CHECK-NEXT: jmpq *%rax			; CHECK-NEXT: jmpq *%rax
	; CHECK-NEXT: LBB0_18: ## %while.cond201.preheader			; CHECK-NEXT: LBB0_18: ## %while.cond201.preheader
	; CHECK-NEXT: ## in Loop: Header=BB0_13 Depth=1			; CHECK-NEXT: ## in Loop: Header=BB0_13 Depth=1
	; CHECK-NEXT: movl $1, %r13d			; CHECK-NEXT: movl $1, %r14d
	; CHECK-NEXT: jmp LBB0_21			; CHECK-NEXT: jmp LBB0_21
	; CHECK-NEXT: LBB0_26: ## %sw.bb474			; CHECK-NEXT: LBB0_26: ## %sw.bb474
	; CHECK-NEXT: ## in Loop: Header=BB0_13 Depth=1			; CHECK-NEXT: ## in Loop: Header=BB0_13 Depth=1
	; CHECK-NEXT: testb %dl, %dl			; CHECK-NEXT: testb %r12b, %r12b
	; CHECK-NEXT: ## implicit-def: $r12			; CHECK-NEXT: ## implicit-def: $r15
	; CHECK-NEXT: jne LBB0_34			; CHECK-NEXT: jne LBB0_34
	; CHECK-NEXT: ## %bb.27: ## %do.body479.preheader			; CHECK-NEXT: ## %bb.27: ## %do.body479.preheader
	; CHECK-NEXT: ## in Loop: Header=BB0_13 Depth=1			; CHECK-NEXT: ## in Loop: Header=BB0_13 Depth=1
	; CHECK-NEXT: testb %dl, %dl			; CHECK-NEXT: testb %r12b, %r12b
	; CHECK-NEXT: ## implicit-def: $r12			; CHECK-NEXT: ## implicit-def: $r15
	; CHECK-NEXT: jne LBB0_34			; CHECK-NEXT: jne LBB0_34
	; CHECK-NEXT: ## %bb.28: ## %land.rhs485.preheader			; CHECK-NEXT: ## %bb.28: ## %land.rhs485.preheader
	; CHECK-NEXT: ## in Loop: Header=BB0_13 Depth=1			; CHECK-NEXT: ## in Loop: Header=BB0_13 Depth=1
	; CHECK-NEXT: ## implicit-def: $rax			; CHECK-NEXT: ## implicit-def: $rax
	; CHECK-NEXT: testb %al, %al			; CHECK-NEXT: testb %al, %al
	; CHECK-NEXT: jns LBB0_30			; CHECK-NEXT: jns LBB0_30
	; CHECK-NEXT: jmp LBB0_55			; CHECK-NEXT: jmp LBB0_55
	; CHECK-NEXT: .p2align 4, 0x90			; CHECK-NEXT: .p2align 4, 0x90
	; CHECK-NEXT: LBB0_32: ## %do.body479.backedge			; CHECK-NEXT: LBB0_32: ## %do.body479.backedge
	; CHECK-NEXT: ## in Loop: Header=BB0_30 Depth=2			; CHECK-NEXT: ## in Loop: Header=BB0_30 Depth=2
	; CHECK-NEXT: leaq 1(%r12), %rax			; CHECK-NEXT: leaq 1(%r15), %rax
	; CHECK-NEXT: testb %dl, %dl			; CHECK-NEXT: testb %r12b, %r12b
	; CHECK-NEXT: je LBB0_33			; CHECK-NEXT: je LBB0_33
	; CHECK-NEXT: ## %bb.29: ## %land.rhs485			; CHECK-NEXT: ## %bb.29: ## %land.rhs485
	; CHECK-NEXT: ## in Loop: Header=BB0_30 Depth=2			; CHECK-NEXT: ## in Loop: Header=BB0_30 Depth=2
	; CHECK-NEXT: testb %al, %al			; CHECK-NEXT: testb %al, %al
	; CHECK-NEXT: js LBB0_55			; CHECK-NEXT: js LBB0_55
	; CHECK-NEXT: LBB0_30: ## %cond.true.i.i2780			; CHECK-NEXT: LBB0_30: ## %cond.true.i.i2780
	; CHECK-NEXT: ## Parent Loop BB0_13 Depth=1			; CHECK-NEXT: ## Parent Loop BB0_13 Depth=1
	; CHECK-NEXT: ## => This Inner Loop Header: Depth=2			; CHECK-NEXT: ## => This Inner Loop Header: Depth=2
	; CHECK-NEXT: movq %rax, %r12			; CHECK-NEXT: movq %rax, %r15
	; CHECK-NEXT: testb %dl, %dl			; CHECK-NEXT: testb %r12b, %r12b
	; CHECK-NEXT: jne LBB0_32			; CHECK-NEXT: jne LBB0_32
	; CHECK-NEXT: ## %bb.31: ## %lor.rhs500			; CHECK-NEXT: ## %bb.31: ## %lor.rhs500
	; CHECK-NEXT: ## in Loop: Header=BB0_30 Depth=2			; CHECK-NEXT: ## in Loop: Header=BB0_30 Depth=2
	; CHECK-NEXT: movl $256, %esi ## imm = 0x100			; CHECK-NEXT: movl $256, %esi ## imm = 0x100
	; CHECK-NEXT: callq ___maskrune			; CHECK-NEXT: callq ___maskrune
	; CHECK-NEXT: xorl %edx, %edx			; CHECK-NEXT: testb %r12b, %r12b
	; CHECK-NEXT: testb %dl, %dl
	; CHECK-NEXT: jne LBB0_32			; CHECK-NEXT: jne LBB0_32
	; CHECK-NEXT: jmp LBB0_34			; CHECK-NEXT: jmp LBB0_34
	; CHECK-NEXT: LBB0_45: ## %sw.bb1134			; CHECK-NEXT: LBB0_45: ## %sw.bb1134
	; CHECK-NEXT: ## in Loop: Header=BB0_13 Depth=1			; CHECK-NEXT: ## in Loop: Header=BB0_13 Depth=1
	; CHECK-NEXT: leaq {{[0-9]+}}(%rsp), %rax			; CHECK-NEXT: leaq {{[0-9]+}}(%rsp), %rax
	; CHECK-NEXT: leaq {{[0-9]+}}(%rsp), %rcx			; CHECK-NEXT: leaq {{[0-9]+}}(%rsp), %rcx
	; CHECK-NEXT: cmpq %rax, %rcx			; CHECK-NEXT: cmpq %rax, %rcx
	; CHECK-NEXT: jb LBB0_55			; CHECK-NEXT: jb LBB0_55
	; CHECK-NEXT: ## %bb.46: ## in Loop: Header=BB0_13 Depth=1			; CHECK-NEXT: ## %bb.46: ## in Loop: Header=BB0_13 Depth=1
	; CHECK-NEXT: xorl %ebp, %ebp			; CHECK-NEXT: movl $0, {{[-0-9]+}}(%r{{[sb]}}p) ## 4-byte Folded Spill
	; CHECK-NEXT: movl $268, %r13d ## imm = 0x10C			; CHECK-NEXT: movl $268, %r14d ## imm = 0x10C
	; CHECK-NEXT: jmp LBB0_21			; CHECK-NEXT: jmp LBB0_21
	; CHECK-NEXT: LBB0_19: ## %sw.bb243			; CHECK-NEXT: LBB0_19: ## %sw.bb243
	; CHECK-NEXT: ## in Loop: Header=BB0_13 Depth=1			; CHECK-NEXT: ## in Loop: Header=BB0_13 Depth=1
	; CHECK-NEXT: movl $2, %r13d			; CHECK-NEXT: movl $2, %r14d
	; CHECK-NEXT: jmp LBB0_21			; CHECK-NEXT: jmp LBB0_21
	; CHECK-NEXT: LBB0_40: ## %sw.bb566			; CHECK-NEXT: LBB0_40: ## %sw.bb566
	; CHECK-NEXT: ## in Loop: Header=BB0_13 Depth=1			; CHECK-NEXT: ## in Loop: Header=BB0_13 Depth=1
	; CHECK-NEXT: movl $20, %r13d			; CHECK-NEXT: movl $20, %r14d
	; CHECK-NEXT: jmp LBB0_21			; CHECK-NEXT: jmp LBB0_21
	; CHECK-NEXT: LBB0_33: ## %if.end517.loopexitsplit			; CHECK-NEXT: LBB0_33: ## %if.end517.loopexitsplit
	; CHECK-NEXT: ## in Loop: Header=BB0_13 Depth=1			; CHECK-NEXT: ## in Loop: Header=BB0_13 Depth=1
	; CHECK-NEXT: incq %r12			; CHECK-NEXT: incq %r15
	; CHECK-NEXT: LBB0_34: ## %if.end517			; CHECK-NEXT: LBB0_34: ## %if.end517
	; CHECK-NEXT: ## in Loop: Header=BB0_13 Depth=1			; CHECK-NEXT: ## in Loop: Header=BB0_13 Depth=1
	; CHECK-NEXT: leal -324(%r13), %eax			; CHECK-NEXT: leal -324(%r14), %eax
	; CHECK-NEXT: cmpl $59, %eax			; CHECK-NEXT: cmpl $59, %eax
	; CHECK-NEXT: ja LBB0_35			; CHECK-NEXT: ja LBB0_35
	; CHECK-NEXT: ## %bb.57: ## %if.end517			; CHECK-NEXT: ## %bb.57: ## %if.end517
	; CHECK-NEXT: ## in Loop: Header=BB0_13 Depth=1			; CHECK-NEXT: ## in Loop: Header=BB0_13 Depth=1
	; CHECK-NEXT: movabsq $576460756598390785, %rcx ## imm = 0x800000100000001			; CHECK-NEXT: movabsq $576460756598390785, %rcx ## imm = 0x800000100000001
	; CHECK-NEXT: btq %rax, %rcx			; CHECK-NEXT: btq %rax, %rcx
	; CHECK-NEXT: jb LBB0_38			; CHECK-NEXT: jb LBB0_38
	; CHECK-NEXT: LBB0_35: ## %if.end517			; CHECK-NEXT: LBB0_35: ## %if.end517
	; CHECK-NEXT: ## in Loop: Header=BB0_13 Depth=1			; CHECK-NEXT: ## in Loop: Header=BB0_13 Depth=1
	; CHECK-NEXT: cmpl $11, %r13d			; CHECK-NEXT: cmpl $11, %r14d
	; CHECK-NEXT: je LBB0_38			; CHECK-NEXT: je LBB0_38
	; CHECK-NEXT: ## %bb.36: ## %if.end517			; CHECK-NEXT: ## %bb.36: ## %if.end517
	; CHECK-NEXT: ## in Loop: Header=BB0_13 Depth=1			; CHECK-NEXT: ## in Loop: Header=BB0_13 Depth=1
	; CHECK-NEXT: cmpl $24, %r13d			; CHECK-NEXT: cmpl $24, %r14d
	; CHECK-NEXT: je LBB0_38			; CHECK-NEXT: je LBB0_38
	; CHECK-NEXT: ## %bb.37: ## %if.then532			; CHECK-NEXT: ## %bb.37: ## %if.then532
	; CHECK-NEXT: ## in Loop: Header=BB0_13 Depth=1			; CHECK-NEXT: ## in Loop: Header=BB0_13 Depth=1
	; CHECK-NEXT: movq _SyFgets.yank@{{.*}}(%rip), %rax			; CHECK-NEXT: movq _SyFgets.yank@{{.*}}(%rip), %rax
	; CHECK-NEXT: movb $0, (%rax)			; CHECK-NEXT: movb $0, (%rax)
	; CHECK-NEXT: .p2align 4, 0x90			; CHECK-NEXT: .p2align 4, 0x90
	; CHECK-NEXT: LBB0_38: ## %for.cond534			; CHECK-NEXT: LBB0_38: ## %for.cond534
	; CHECK-NEXT: ## Parent Loop BB0_13 Depth=1			; CHECK-NEXT: ## Parent Loop BB0_13 Depth=1
	; CHECK-NEXT: ## => This Inner Loop Header: Depth=2			; CHECK-NEXT: ## => This Inner Loop Header: Depth=2
	; CHECK-NEXT: testb %dl, %dl			; CHECK-NEXT: testb %r12b, %r12b
	; CHECK-NEXT: jne LBB0_38			; CHECK-NEXT: jne LBB0_38
	; CHECK-NEXT: ## %bb.39: ## %for.cond542.preheader			; CHECK-NEXT: ## %bb.39: ## %for.cond542.preheader
	; CHECK-NEXT: ## in Loop: Header=BB0_13 Depth=1			; CHECK-NEXT: ## in Loop: Header=BB0_13 Depth=1
	; CHECK-NEXT: testb %dl, %dl			; CHECK-NEXT: testb %r12b, %r12b
	; CHECK-NEXT: movb $0, (%r12)			; CHECK-NEXT: movb $0, (%r15)
	; CHECK-NEXT: movl %r14d, %r13d			; CHECK-NEXT: movl %r13d, %r14d
				; CHECK-NEXT: leaq {{.*}}(%rip), %rdx
	; CHECK-NEXT: leaq {{.*}}(%rip), %rsi			; CHECK-NEXT: leaq {{.*}}(%rip), %rsi
	; CHECK-NEXT: leaq {{.*}}(%rip), %rdi
	; CHECK-NEXT: jmp LBB0_21			; CHECK-NEXT: jmp LBB0_21
	; CHECK-NEXT: .p2align 4, 0x90			; CHECK-NEXT: .p2align 4, 0x90
	; CHECK-NEXT: LBB0_42: ## %while.cond864			; CHECK-NEXT: LBB0_42: ## %while.cond864
	; CHECK-NEXT: ## =>This Inner Loop Header: Depth=1			; CHECK-NEXT: ## =>This Inner Loop Header: Depth=1
	; CHECK-NEXT: jmp LBB0_42			; CHECK-NEXT: jmp LBB0_42
	; CHECK-NEXT: .p2align 4, 0x90			; CHECK-NEXT: .p2align 4, 0x90
	; CHECK-NEXT: LBB0_43: ## %while.cond962			; CHECK-NEXT: LBB0_43: ## %while.cond962
	; CHECK-NEXT: ## =>This Inner Loop Header: Depth=1			; CHECK-NEXT: ## =>This Inner Loop Header: Depth=1
	; CHECK-NEXT: jmp LBB0_43			; CHECK-NEXT: jmp LBB0_43
	; CHECK-NEXT: .p2align 4, 0x90			; CHECK-NEXT: .p2align 4, 0x90
	; CHECK-NEXT: LBB0_25: ## %for.cond357			; CHECK-NEXT: LBB0_25: ## %for.cond357
	; CHECK-NEXT: ## =>This Inner Loop Header: Depth=1			; CHECK-NEXT: ## =>This Inner Loop Header: Depth=1
	; CHECK-NEXT: jmp LBB0_25			; CHECK-NEXT: jmp LBB0_25
	; CHECK-NEXT: LBB0_11:			; CHECK-NEXT: LBB0_11:
	; CHECK-NEXT: xorl %ebp, %ebp			; CHECK-NEXT: movl $0, {{[-0-9]+}}(%r{{[sb]}}p) ## 4-byte Folded Spill
	; CHECK-NEXT: xorl %r13d, %r13d			; CHECK-NEXT: xorl %r14d, %r14d
	; CHECK-NEXT: LBB0_22: ## %while.end1465			; CHECK-NEXT: LBB0_22: ## %while.end1465
	; CHECK-NEXT: incl %r13d			; CHECK-NEXT: incl %r14d
	; CHECK-NEXT: cmpl $16, %r13d			; CHECK-NEXT: cmpl $16, %r14d
	; CHECK-NEXT: ja LBB0_50			; CHECK-NEXT: ja LBB0_50
	; CHECK-NEXT: ## %bb.23: ## %while.end1465			; CHECK-NEXT: ## %bb.23: ## %while.end1465
	; CHECK-NEXT: movl $83969, %eax ## imm = 0x14801			; CHECK-NEXT: movl $83969, %eax ## imm = 0x14801
	; CHECK-NEXT: btl %r13d, %eax			; CHECK-NEXT: btl %r14d, %eax
	; CHECK-NEXT: jae LBB0_50			; CHECK-NEXT: jae LBB0_50
	; CHECK-NEXT: ## %bb.24:			; CHECK-NEXT: ## %bb.24:
	; CHECK-NEXT: xorl %ebp, %ebp			; CHECK-NEXT: xorl %ebp, %ebp
	; CHECK-NEXT: movq {{[-0-9]+}}(%r{{[sb]}}p), %rbx ## 8-byte Reload			; CHECK-NEXT: movq {{[-0-9]+}}(%r{{[sb]}}p), %rbx ## 8-byte Reload
	; CHECK-NEXT: LBB0_48: ## %if.then1477			; CHECK-NEXT: LBB0_48: ## %if.then1477
	; CHECK-NEXT: movl $1, %edx			; CHECK-NEXT: movl $1, %edx
	; CHECK-NEXT: callq _write			; CHECK-NEXT: callq _write
	; CHECK-NEXT: subq %rbp, %rbx			; CHECK-NEXT: subq %rbp, %rbx
	; CHECK-NEXT: movq _syHistory@{{.*}}(%rip), %rax			; CHECK-NEXT: movq _syHistory@{{.*}}(%rip), %rax
	; CHECK-NEXT: leaq 8189(%rbx,%rax), %rax			; CHECK-NEXT: leaq 8189(%rbx,%rax), %rax
	; CHECK-NEXT: .p2align 4, 0x90			; CHECK-NEXT: .p2align 4, 0x90
	; CHECK-NEXT: LBB0_49: ## %for.body1723			; CHECK-NEXT: LBB0_49: ## %for.body1723
	; CHECK-NEXT: ## =>This Inner Loop Header: Depth=1			; CHECK-NEXT: ## =>This Inner Loop Header: Depth=1
	; CHECK-NEXT: decq %rax			; CHECK-NEXT: decq %rax
	; CHECK-NEXT: jmp LBB0_49			; CHECK-NEXT: jmp LBB0_49
	; CHECK-NEXT: LBB0_50: ## %for.cond1480.preheader			; CHECK-NEXT: LBB0_50: ## %for.cond1480.preheader
	; CHECK-NEXT: movl $512, %eax ## imm = 0x200			; CHECK-NEXT: movl $512, %eax ## imm = 0x200
	; CHECK-NEXT: cmpq %rax, %rax			; CHECK-NEXT: cmpq %rax, %rax
	; CHECK-NEXT: jae LBB0_55			; CHECK-NEXT: jae LBB0_55
	; CHECK-NEXT: ## %bb.51: ## %for.body1664.lr.ph			; CHECK-NEXT: ## %bb.51: ## %for.body1664.lr.ph
	; CHECK-NEXT: xorl %eax, %eax			; CHECK-NEXT: xorl %eax, %eax
	; CHECK-NEXT: testb %al, %al			; CHECK-NEXT: testb %al, %al
				; CHECK-NEXT: movl {{[-0-9]+}}(%r{{[sb]}}p), %ebp ## 4-byte Reload
	; CHECK-NEXT: jne LBB0_54			; CHECK-NEXT: jne LBB0_54
	; CHECK-NEXT: ## %bb.52: ## %while.body1679.preheader			; CHECK-NEXT: ## %bb.52: ## %while.body1679.preheader
	; CHECK-NEXT: incl %ebp			; CHECK-NEXT: incl %ebp
	; CHECK-NEXT: .p2align 4, 0x90			; CHECK-NEXT: .p2align 4, 0x90
	; CHECK-NEXT: LBB0_53: ## %while.body1679			; CHECK-NEXT: LBB0_53: ## %while.body1679
	; CHECK-NEXT: ## =>This Inner Loop Header: Depth=1			; CHECK-NEXT: ## =>This Inner Loop Header: Depth=1
	; CHECK-NEXT: movq (%rbx), %rdi			; CHECK-NEXT: movq (%rbx), %rdi
	; CHECK-NEXT: callq _fileno			; CHECK-NEXT: callq _fileno
	▲ Show 20 Lines • Show All 394 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/regalloc-advanced-split-cost.ll

	Show All 17 Lines
	define i32 @foo(i32* %array, i32 %cond1, i32 %val) local_unnamed_addr #0 {			define i32 @foo(i32* %array, i32 %cond1, i32 %val) local_unnamed_addr #0 {
	; CHECK-LABEL: foo:			; CHECK-LABEL: foo:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: pushl %ebp			; CHECK-NEXT: pushl %ebp
	; CHECK-NEXT: pushl %ebx			; CHECK-NEXT: pushl %ebx
	; CHECK-NEXT: pushl %edi			; CHECK-NEXT: pushl %edi
	; CHECK-NEXT: pushl %esi			; CHECK-NEXT: pushl %esi
	; CHECK-NEXT: subl $8, %esp			; CHECK-NEXT: subl $8, %esp
	; CHECK-NEXT: movl {{[0-9]+}}(%esp), %eax
	; CHECK-NEXT: movl {{[0-9]+}}(%esp), %esi			; CHECK-NEXT: movl {{[0-9]+}}(%esp), %esi
	; CHECK-NEXT: movl (%eax), %ecx			; CHECK-NEXT: movl {{[0-9]+}}(%esp), %eax
	; CHECK-NEXT: movl %ecx, (%esp) # 4-byte Spill			; CHECK-NEXT: movl (%esi), %ebp
	; CHECK-NEXT: movl 4(%eax), %ebx			; CHECK-NEXT: movl 4(%esi), %ebx
	; CHECK-NEXT: movl 8(%eax), %ecx			; CHECK-NEXT: movl 8(%esi), %ecx
	; CHECK-NEXT: movl 12(%eax), %edx			; CHECK-NEXT: movl 12(%esi), %edx
	; CHECK-NEXT: movl 16(%eax), %edi			; CHECK-NEXT: movl 16(%esi), %edi
	; CHECK-NEXT: movl (%eax,%esi,4), %esi			; CHECK-NEXT: movl (%esi,%eax,4), %eax
	; CHECK-NEXT: shll $5, %esi			; CHECK-NEXT: shll $5, %eax
	; CHECK-NEXT: cmpl $0, {{[0-9]+}}(%esp)			; CHECK-NEXT: cmpl $0, {{[0-9]+}}(%esp)
	; CHECK-NEXT: je .LBB0_2			; CHECK-NEXT: je .LBB0_2
	; CHECK-NEXT: # %bb.1: # %if.then			; CHECK-NEXT: # %bb.1: # %if.then
	; CHECK-NEXT: movl %esi, 24(%eax)			; CHECK-NEXT: movl %eax, 24(%esi)
	; CHECK-NEXT: movl %esi, %ebp
	; CHECK-NEXT: movl (%esp), %eax # 4-byte Reload
	; CHECK-NEXT: #APP			; CHECK-NEXT: #APP
	; CHECK-NEXT: nop			; CHECK-NEXT: nop
	; CHECK-NEXT: #NO_APP			; CHECK-NEXT: #NO_APP
	; CHECK-NEXT: movl {{[0-9]+}}(%esp), %eax			; CHECK-NEXT: movl {{[0-9]+}}(%esp), %ecx
	; CHECK-NEXT: leal 28(%eax), %ecx			; CHECK-NEXT: leal 28(%ecx), %edx
	; CHECK-NEXT: jmp .LBB0_3			; CHECK-NEXT: jmp .LBB0_3
	; CHECK-NEXT: .LBB0_2: # %if.else			; CHECK-NEXT: .LBB0_2: # %if.else
	; CHECK-NEXT: movl 20(%eax), %ebp			; CHECK-NEXT: movl %ebp, (%esp) # 4-byte Spill
				; CHECK-NEXT: movl 20(%esi), %ebp
	; CHECK-NEXT: movl %ebp, {{[-0-9]+}}(%e{{[sb]}}p) # 4-byte Spill			; CHECK-NEXT: movl %ebp, {{[-0-9]+}}(%e{{[sb]}}p) # 4-byte Spill
	; CHECK-NEXT: movl %esi, 32(%eax)			; CHECK-NEXT: movl %eax, 32(%esi)
	; CHECK-NEXT: movl %esi, %ebp			; CHECK-NEXT: movl %eax, %ebp
	; CHECK-NEXT: movl (%esp), %eax # 4-byte Reload			; CHECK-NEXT: movl (%esp), %eax # 4-byte Reload
	; CHECK-NEXT: movl {{[-0-9]+}}(%e{{[sb]}}p), %esi # 4-byte Reload			; CHECK-NEXT: movl {{[-0-9]+}}(%e{{[sb]}}p), %esi # 4-byte Reload
	; CHECK-NEXT: #APP			; CHECK-NEXT: #APP
	; CHECK-NEXT: nop			; CHECK-NEXT: nop
	; CHECK-NEXT: #NO_APP			; CHECK-NEXT: #NO_APP
	; CHECK-NEXT: movl {{[0-9]+}}(%esp), %eax
	; CHECK-NEXT: leal 36(%eax), %ecx
	; CHECK-NEXT: .LBB0_3: # %if.end
	; CHECK-NEXT: movl %ebp, (%ecx)
	; CHECK-NEXT: addl (%eax), %ebp
	; CHECK-NEXT: movl %ebp, %eax			; CHECK-NEXT: movl %ebp, %eax
				; CHECK-NEXT: movl {{[0-9]+}}(%esp), %ecx
				; CHECK-NEXT: leal 36(%ecx), %edx
				; CHECK-NEXT: .LBB0_3: # %if.end
				; CHECK-NEXT: movl %eax, (%edx)
				; CHECK-NEXT: addl (%ecx), %eax
	; CHECK-NEXT: addl $8, %esp			; CHECK-NEXT: addl $8, %esp
	; CHECK-NEXT: popl %esi			; CHECK-NEXT: popl %esi
	; CHECK-NEXT: popl %edi			; CHECK-NEXT: popl %edi
	; CHECK-NEXT: popl %ebx			; CHECK-NEXT: popl %ebx
	; CHECK-NEXT: popl %ebp			; CHECK-NEXT: popl %ebp
	; CHECK-NEXT: retl			; CHECK-NEXT: retl
	entry:			entry:
	%array.addr = alloca i32*, align 4			%array.addr = alloca i32*, align 4
	▲ Show 20 Lines • Show All 60 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/sjlj-eh.ll

	Show All 26 Lines
	; CHECK-NEXT: leal -64(%ebp), %eax			; CHECK-NEXT: leal -64(%ebp), %eax
	; CHECK-NEXT: pushl %eax			; CHECK-NEXT: pushl %eax
	; CHECK-NEXT: calll __Unwind_SjLj_Register			; CHECK-NEXT: calll __Unwind_SjLj_Register
	; CHECK-NEXT: addl $4, %esp			; CHECK-NEXT: addl $4, %esp
	; CHECK-NEXT: Ltmp0:			; CHECK-NEXT: Ltmp0:
	; CHECK-NEXT: calll __Z20function_that_throwsv			; CHECK-NEXT: calll __Z20function_that_throwsv
	; CHECK-NEXT: Ltmp1:			; CHECK-NEXT: Ltmp1:
	; CHECK-NEXT: # %bb.1: # %try.cont			; CHECK-NEXT: # %bb.1: # %try.cont
				; CHECK-NEXT: LBB0_2: # %try.cont
	; CHECK-NEXT: leal -64(%ebp), %eax			; CHECK-NEXT: leal -64(%ebp), %eax
	; CHECK-NEXT: pushl %eax			; CHECK-NEXT: pushl %eax
	; CHECK-NEXT: LBB0_2: # %try.cont
	; CHECK-NEXT: calll __Unwind_SjLj_Unregister			; CHECK-NEXT: calll __Unwind_SjLj_Unregister
	; CHECK-NEXT: addl $56, %esp			; CHECK-NEXT: addl $56, %esp
	; CHECK-NEXT: popl %esi			; CHECK-NEXT: popl %esi
	; CHECK-NEXT: popl %edi			; CHECK-NEXT: popl %edi
	; CHECK-NEXT: popl %ebx			; CHECK-NEXT: popl %ebx
	; CHECK-NEXT: popl %ebp			; CHECK-NEXT: popl %ebp
	; CHECK-NEXT: retl			; CHECK-NEXT: retl
	; CHECK-NEXT: LBB0_3:			; CHECK-NEXT: LBB0_3:
	; CHECK-NEXT: leal -64(%ebp), %esi
	; CHECK-NEXT: movl -60(%ebp), %eax			; CHECK-NEXT: movl -60(%ebp), %eax
	; CHECK-NEXT: cmpl $1, %eax			; CHECK-NEXT: cmpl $1, %eax
	; CHECK-NEXT: jb LBB0_4			; CHECK-NEXT: jb LBB0_4
	; CHECK-NEXT: # %bb.5:			; CHECK-NEXT: # %bb.5:
	; CHECK-NEXT: ud2			; CHECK-NEXT: ud2
	; CHECK-NEXT: LBB0_4:			; CHECK-NEXT: LBB0_4:
	; CHECK-NEXT: jmpl *LJTI0_0(,%eax,4)			; CHECK-NEXT: jmpl *LJTI0_0(,%eax,4)
	; CHECK-NEXT: LBB0_6: # %lpad			; CHECK-NEXT: LBB0_6: # %lpad
	; CHECK-NEXT: Ltmp2:			; CHECK-NEXT: Ltmp2:
	; CHECK-NEXT: movl -56(%ebp), %eax			; CHECK-NEXT: movl -56(%ebp), %eax
	; CHECK-NEXT: movl -52(%ebp), %ecx			; CHECK-NEXT: movl -52(%ebp), %ecx
	; CHECK-NEXT: movl $-1, -60(%ebp)			; CHECK-NEXT: movl $-1, -60(%ebp)
	; CHECK-NEXT: pushl %eax			; CHECK-NEXT: pushl %eax
	; CHECK-NEXT: calll ___cxa_begin_catch			; CHECK-NEXT: calll ___cxa_begin_catch
	; CHECK-NEXT: addl $4, %esp			; CHECK-NEXT: addl $4, %esp
	; CHECK-NEXT: movl $-1, -60(%ebp)			; CHECK-NEXT: movl $-1, -60(%ebp)
	; CHECK-NEXT: calll ___cxa_end_catch			; CHECK-NEXT: calll ___cxa_end_catch
	; CHECK-NEXT: pushl %esi
	; CHECK-NEXT: jmp LBB0_2			; CHECK-NEXT: jmp LBB0_2
	; CHECK-NEXT: Lfunc_end0:			; CHECK-NEXT: Lfunc_end0:
	;			;
	; CHECK-X64-LABEL: _Z8functionv:			; CHECK-X64-LABEL: _Z8functionv:
	; CHECK-X64: # %bb.0: # %entry			; CHECK-X64: # %bb.0: # %entry
	; CHECK-X64-NEXT: pushq %rbp			; CHECK-X64-NEXT: pushq %rbp
	; CHECK-X64-NEXT: movq %rsp, %rbp			; CHECK-X64-NEXT: movq %rsp, %rbp
	; CHECK-X64-NEXT: pushq %r15			; CHECK-X64-NEXT: pushq %r15
	▲ Show 20 Lines • Show All 189 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/speculative-load-hardening.ll

	Show All 26 Lines
	entry:			entry:
	%v = load i32, i32* %ptr			%v = load i32, i32* %ptr
	ret i32 %v			ret i32 %v
	}			}

	define void @test_basic_conditions(i32 %a, i32 %b, i32 %c, i32* %ptr1, i32* %ptr2, i32** %ptr3) speculative_load_hardening {			define void @test_basic_conditions(i32 %a, i32 %b, i32 %c, i32* %ptr1, i32* %ptr2, i32** %ptr3) speculative_load_hardening {
	; X64-LABEL: test_basic_conditions:			; X64-LABEL: test_basic_conditions:
	; X64: # %bb.0: # %entry			; X64: # %bb.0: # %entry
	; X64-NEXT: pushq %r15
	; X64-NEXT: .cfi_def_cfa_offset 16
	; X64-NEXT: pushq %r14			; X64-NEXT: pushq %r14
	; X64-NEXT: .cfi_def_cfa_offset 24			; X64-NEXT: .cfi_def_cfa_offset 16
	; X64-NEXT: pushq %rbx			; X64-NEXT: pushq %rbx
				; X64-NEXT: .cfi_def_cfa_offset 24
				; X64-NEXT: pushq %rax
	; X64-NEXT: .cfi_def_cfa_offset 32			; X64-NEXT: .cfi_def_cfa_offset 32
	; X64-NEXT: .cfi_offset %rbx, -32			; X64-NEXT: .cfi_offset %rbx, -24
	; X64-NEXT: .cfi_offset %r14, -24			; X64-NEXT: .cfi_offset %r14, -16
	; X64-NEXT: .cfi_offset %r15, -16
	; X64-NEXT: movq %rsp, %rax			; X64-NEXT: movq %rsp, %rax
	; X64-NEXT: movq $-1, %rbx			; X64-NEXT: movq $-1, %r10
	; X64-NEXT: sarq $63, %rax			; X64-NEXT: sarq $63, %rax
	; X64-NEXT: testl %edi, %edi			; X64-NEXT: testl %edi, %edi
	; X64-NEXT: jne .LBB1_1			; X64-NEXT: jne .LBB1_1
	; X64-NEXT: # %bb.2: # %then1			; X64-NEXT: # %bb.2: # %then1
	; X64-NEXT: cmovneq %rbx, %rax			; X64-NEXT: cmovneq %r10, %rax
	; X64-NEXT: testl %esi, %esi			; X64-NEXT: testl %esi, %esi
	; X64-NEXT: je .LBB1_4			; X64-NEXT: je .LBB1_4
	; X64-NEXT: .LBB1_1:			; X64-NEXT: .LBB1_1:
	; X64-NEXT: cmoveq %rbx, %rax			; X64-NEXT: cmoveq %r10, %rax
	; X64-NEXT: .LBB1_8: # %exit			; X64-NEXT: .LBB1_8: # %exit
	; X64-NEXT: shlq $47, %rax			; X64-NEXT: shlq $47, %rax
	; X64-NEXT: orq %rax, %rsp			; X64-NEXT: orq %rax, %rsp
	; X64-NEXT: popq %rbx			; X64-NEXT: addq $8, %rsp
	; X64-NEXT: .cfi_def_cfa_offset 24			; X64-NEXT: .cfi_def_cfa_offset 24
	; X64-NEXT: popq %r14			; X64-NEXT: popq %rbx
	; X64-NEXT: .cfi_def_cfa_offset 16			; X64-NEXT: .cfi_def_cfa_offset 16
	; X64-NEXT: popq %r15			; X64-NEXT: popq %r14
	; X64-NEXT: .cfi_def_cfa_offset 8			; X64-NEXT: .cfi_def_cfa_offset 8
	; X64-NEXT: retq			; X64-NEXT: retq
	; X64-NEXT: .LBB1_4: # %then2			; X64-NEXT: .LBB1_4: # %then2
	; X64-NEXT: .cfi_def_cfa_offset 32			; X64-NEXT: .cfi_def_cfa_offset 32
	; X64-NEXT: movq %r8, %r14			; X64-NEXT: cmovneq %r10, %rax
	; X64-NEXT: cmovneq %rbx, %rax
	; X64-NEXT: testl %edx, %edx			; X64-NEXT: testl %edx, %edx
	; X64-NEXT: je .LBB1_6			; X64-NEXT: je .LBB1_6
	; X64-NEXT: # %bb.5: # %else3			; X64-NEXT: # %bb.5: # %else3
	; X64-NEXT: cmoveq %rbx, %rax			; X64-NEXT: cmoveq %r10, %rax
	; X64-NEXT: movslq (%r9), %rcx			; X64-NEXT: movslq (%r9), %rdx
	; X64-NEXT: orq %rax, %rcx			; X64-NEXT: orq %rax, %rdx
	; X64-NEXT: leaq (%r14,%rcx,4), %r15			; X64-NEXT: leaq (%r8,%rdx,4), %rcx
	; X64-NEXT: movl %ecx, (%r14,%rcx,4)			; X64-NEXT: movl %edx, (%r8,%rdx,4)
	; X64-NEXT: jmp .LBB1_7			; X64-NEXT: jmp .LBB1_7
	; X64-NEXT: .LBB1_6: # %then3			; X64-NEXT: .LBB1_6: # %then3
	; X64-NEXT: cmovneq %rbx, %rax			; X64-NEXT: cmovneq %r10, %rax
	; X64-NEXT: movl (%rcx), %ecx			; X64-NEXT: movl (%rcx), %ecx
	; X64-NEXT: addl (%r14), %ecx			; X64-NEXT: addl (%r8), %ecx
	; X64-NEXT: movslq %ecx, %rdi			; X64-NEXT: movslq %ecx, %rdi
	; X64-NEXT: orq %rax, %rdi			; X64-NEXT: orq %rax, %rdi
	; X64-NEXT: movl (%r14,%rdi,4), %esi			; X64-NEXT: movl (%r8,%rdi,4), %esi
	; X64-NEXT: orl %eax, %esi			; X64-NEXT: orl %eax, %esi
	; X64-NEXT: movq (%r9), %r15			; X64-NEXT: movq (%r9), %rbx
	; X64-NEXT: orq %rax, %r15			; X64-NEXT: orq %rax, %rbx
	; X64-NEXT: addl (%r15), %esi			; X64-NEXT: addl (%rbx), %esi
	; X64-NEXT: shlq $47, %rax			; X64-NEXT: shlq $47, %rax
	; X64-NEXT: # kill: def $edi killed $edi killed $rdi			; X64-NEXT: # kill: def $edi killed $edi killed $rdi
	; X64-NEXT: orq %rax, %rsp			; X64-NEXT: orq %rax, %rsp
				; X64-NEXT: movq %r8, (%rsp) # 8-byte Spill
				; X64-NEXT: movq $-1, %r14
	; X64-NEXT: callq leak			; X64-NEXT: callq leak
	; X64-NEXT: .Lslh_ret_addr0:			; X64-NEXT: .Lslh_ret_addr0:
				; X64-NEXT: movq %rbx, %rcx
				; X64-NEXT: movq (%rsp), %r8 # 8-byte Reload
	; X64-NEXT: movq %rsp, %rax			; X64-NEXT: movq %rsp, %rax
	; X64-NEXT: movq -{{[0-9]+}}(%rsp), %rcx			; X64-NEXT: movq -{{[0-9]+}}(%rsp), %rdx
	; X64-NEXT: sarq $63, %rax			; X64-NEXT: sarq $63, %rax
	; X64-NEXT: cmpq $.Lslh_ret_addr0, %rcx			; X64-NEXT: cmpq $.Lslh_ret_addr0, %rdx
	; X64-NEXT: cmovneq %rbx, %rax			; X64-NEXT: cmovneq %r14, %rax
	; X64-NEXT: .LBB1_7: # %merge			; X64-NEXT: .LBB1_7: # %merge
	; X64-NEXT: movslq (%r15), %rcx			; X64-NEXT: movslq (%rcx), %rcx
	; X64-NEXT: orq %rax, %rcx			; X64-NEXT: orq %rax, %rcx
	; X64-NEXT: movl $0, (%r14,%rcx,4)			; X64-NEXT: movl $0, (%r8,%rcx,4)
	; X64-NEXT: jmp .LBB1_8			; X64-NEXT: jmp .LBB1_8
	;			;
	; X64-LFENCE-LABEL: test_basic_conditions:			; X64-LFENCE-LABEL: test_basic_conditions:
	; X64-LFENCE: # %bb.0: # %entry			; X64-LFENCE: # %bb.0: # %entry
	; X64-LFENCE-NEXT: pushq %r14
	; X64-LFENCE-NEXT: .cfi_def_cfa_offset 16
	; X64-LFENCE-NEXT: pushq %rbx			; X64-LFENCE-NEXT: pushq %rbx
	; X64-LFENCE-NEXT: .cfi_def_cfa_offset 24			; X64-LFENCE-NEXT: .cfi_def_cfa_offset 16
	; X64-LFENCE-NEXT: pushq %rax			; X64-LFENCE-NEXT: subq $16, %rsp
	; X64-LFENCE-NEXT: .cfi_def_cfa_offset 32			; X64-LFENCE-NEXT: .cfi_def_cfa_offset 32
	; X64-LFENCE-NEXT: .cfi_offset %rbx, -24			; X64-LFENCE-NEXT: .cfi_offset %rbx, -16
	; X64-LFENCE-NEXT: .cfi_offset %r14, -16
	; X64-LFENCE-NEXT: testl %edi, %edi			; X64-LFENCE-NEXT: testl %edi, %edi
	; X64-LFENCE-NEXT: jne .LBB1_6			; X64-LFENCE-NEXT: jne .LBB1_6
	; X64-LFENCE-NEXT: # %bb.1: # %then1			; X64-LFENCE-NEXT: # %bb.1: # %then1
	; X64-LFENCE-NEXT: lfence			; X64-LFENCE-NEXT: lfence
	; X64-LFENCE-NEXT: testl %esi, %esi			; X64-LFENCE-NEXT: testl %esi, %esi
	; X64-LFENCE-NEXT: jne .LBB1_6			; X64-LFENCE-NEXT: jne .LBB1_6
	; X64-LFENCE-NEXT: # %bb.2: # %then2			; X64-LFENCE-NEXT: # %bb.2: # %then2
	; X64-LFENCE-NEXT: movq %r8, %rbx
	; X64-LFENCE-NEXT: lfence			; X64-LFENCE-NEXT: lfence
	; X64-LFENCE-NEXT: testl %edx, %edx			; X64-LFENCE-NEXT: testl %edx, %edx
	; X64-LFENCE-NEXT: je .LBB1_3			; X64-LFENCE-NEXT: je .LBB1_3
	; X64-LFENCE-NEXT: # %bb.4: # %else3			; X64-LFENCE-NEXT: # %bb.4: # %else3
	; X64-LFENCE-NEXT: lfence			; X64-LFENCE-NEXT: lfence
	; X64-LFENCE-NEXT: movslq (%r9), %rax			; X64-LFENCE-NEXT: movslq (%r9), %rcx
	; X64-LFENCE-NEXT: leaq (%rbx,%rax,4), %r14			; X64-LFENCE-NEXT: leaq (%r8,%rcx,4), %rax
	; X64-LFENCE-NEXT: movl %eax, (%rbx,%rax,4)			; X64-LFENCE-NEXT: movl %ecx, (%r8,%rcx,4)
	; X64-LFENCE-NEXT: jmp .LBB1_5			; X64-LFENCE-NEXT: jmp .LBB1_5
	; X64-LFENCE-NEXT: .LBB1_3: # %then3			; X64-LFENCE-NEXT: .LBB1_3: # %then3
	; X64-LFENCE-NEXT: lfence			; X64-LFENCE-NEXT: lfence
	; X64-LFENCE-NEXT: movl (%rcx), %eax			; X64-LFENCE-NEXT: movl (%rcx), %eax
	; X64-LFENCE-NEXT: addl (%rbx), %eax			; X64-LFENCE-NEXT: addl (%r8), %eax
	; X64-LFENCE-NEXT: movslq %eax, %rdi			; X64-LFENCE-NEXT: movslq %eax, %rdi
	; X64-LFENCE-NEXT: movl (%rbx,%rdi,4), %esi			; X64-LFENCE-NEXT: movl (%r8,%rdi,4), %esi
	; X64-LFENCE-NEXT: movq (%r9), %r14			; X64-LFENCE-NEXT: movq (%r9), %rbx
	; X64-LFENCE-NEXT: addl (%r14), %esi			; X64-LFENCE-NEXT: addl (%rbx), %esi
	; X64-LFENCE-NEXT: # kill: def $edi killed $edi killed $rdi			; X64-LFENCE-NEXT: # kill: def $edi killed $edi killed $rdi
				; X64-LFENCE-NEXT: movq %r8, {{[-0-9]+}}(%r{{[sb]}}p) # 8-byte Spill
	; X64-LFENCE-NEXT: callq leak			; X64-LFENCE-NEXT: callq leak
				; X64-LFENCE-NEXT: movq %rbx, %rax
				; X64-LFENCE-NEXT: movq {{[-0-9]+}}(%r{{[sb]}}p), %r8 # 8-byte Reload
	; X64-LFENCE-NEXT: .LBB1_5: # %merge			; X64-LFENCE-NEXT: .LBB1_5: # %merge
	; X64-LFENCE-NEXT: movslq (%r14), %rax			; X64-LFENCE-NEXT: movslq (%rax), %rax
	; X64-LFENCE-NEXT: movl $0, (%rbx,%rax,4)			; X64-LFENCE-NEXT: movl $0, (%r8,%rax,4)
	; X64-LFENCE-NEXT: .LBB1_6: # %exit			; X64-LFENCE-NEXT: .LBB1_6: # %exit
	; X64-LFENCE-NEXT: lfence			; X64-LFENCE-NEXT: lfence
	; X64-LFENCE-NEXT: addq $8, %rsp			; X64-LFENCE-NEXT: addq $16, %rsp
	; X64-LFENCE-NEXT: .cfi_def_cfa_offset 24
	; X64-LFENCE-NEXT: popq %rbx
	; X64-LFENCE-NEXT: .cfi_def_cfa_offset 16			; X64-LFENCE-NEXT: .cfi_def_cfa_offset 16
	; X64-LFENCE-NEXT: popq %r14			; X64-LFENCE-NEXT: popq %rbx
	; X64-LFENCE-NEXT: .cfi_def_cfa_offset 8			; X64-LFENCE-NEXT: .cfi_def_cfa_offset 8
	; X64-LFENCE-NEXT: retq			; X64-LFENCE-NEXT: retq
	entry:			entry:
	%a.cmp = icmp eq i32 %a, 0			%a.cmp = icmp eq i32 %a, 0
	br i1 %a.cmp, label %then1, label %exit			br i1 %a.cmp, label %then1, label %exit

	then1:			then1:
	%b.cmp = icmp eq i32 %b, 0			%b.cmp = icmp eq i32 %b, 0
	▲ Show 20 Lines • Show All 340 Lines • ▼ Show 20 Lines

	declare void @__cxa_throw(i8, i8, i8*) local_unnamed_addr			declare void @__cxa_throw(i8, i8, i8*) local_unnamed_addr

	define void @test_basic_eh(i32 %a, i32* %ptr1, i32* %ptr2) speculative_load_hardening personality i8* bitcast (i32 (...)* @__gxx_personality_v0 to i8*) {			define void @test_basic_eh(i32 %a, i32* %ptr1, i32* %ptr2) speculative_load_hardening personality i8* bitcast (i32 (...)* @__gxx_personality_v0 to i8*) {
	; X64-LABEL: test_basic_eh:			; X64-LABEL: test_basic_eh:
	; X64: # %bb.0: # %entry			; X64: # %bb.0: # %entry
	; X64-NEXT: pushq %rbp			; X64-NEXT: pushq %rbp
	; X64-NEXT: .cfi_def_cfa_offset 16			; X64-NEXT: .cfi_def_cfa_offset 16
	; X64-NEXT: pushq %r15
	; X64-NEXT: .cfi_def_cfa_offset 24
	; X64-NEXT: pushq %r14
	; X64-NEXT: .cfi_def_cfa_offset 32
	; X64-NEXT: pushq %rbx			; X64-NEXT: pushq %rbx
	; X64-NEXT: .cfi_def_cfa_offset 40			; X64-NEXT: .cfi_def_cfa_offset 24
	; X64-NEXT: pushq %rax			; X64-NEXT: subq $24, %rsp
	; X64-NEXT: .cfi_def_cfa_offset 48			; X64-NEXT: .cfi_def_cfa_offset 48
	; X64-NEXT: .cfi_offset %rbx, -40			; X64-NEXT: .cfi_offset %rbx, -24
	; X64-NEXT: .cfi_offset %r14, -32
	; X64-NEXT: .cfi_offset %r15, -24
	; X64-NEXT: .cfi_offset %rbp, -16			; X64-NEXT: .cfi_offset %rbp, -16
	; X64-NEXT: movq %rsp, %rax			; X64-NEXT: movq %rsp, %rax
	; X64-NEXT: movq $-1, %r15			; X64-NEXT: movq $-1, %rbx
	; X64-NEXT: sarq $63, %rax			; X64-NEXT: sarq $63, %rax
	; X64-NEXT: cmpl $41, %edi			; X64-NEXT: cmpl $41, %edi
	; X64-NEXT: jg .LBB4_1			; X64-NEXT: jg .LBB4_1
	; X64-NEXT: # %bb.2: # %thrower			; X64-NEXT: # %bb.2: # %thrower
	; X64-NEXT: movq %rdx, %r14			; X64-NEXT: movq %rdx, {{[-0-9]+}}(%r{{[sb]}}p) # 8-byte Spill
	; X64-NEXT: movq %rsi, %rbx			; X64-NEXT: cmovgq %rbx, %rax
	; X64-NEXT: cmovgq %r15, %rax
	; X64-NEXT: movslq %edi, %rcx			; X64-NEXT: movslq %edi, %rcx
				; X64-NEXT: movq %rsi, {{[-0-9]+}}(%r{{[sb]}}p) # 8-byte Spill
	; X64-NEXT: movl (%rsi,%rcx,4), %ebp			; X64-NEXT: movl (%rsi,%rcx,4), %ebp
	; X64-NEXT: orl %eax, %ebp			; X64-NEXT: orl %eax, %ebp
	; X64-NEXT: movl $4, %edi			; X64-NEXT: movl $4, %edi
	; X64-NEXT: shlq $47, %rax			; X64-NEXT: shlq $47, %rax
	; X64-NEXT: orq %rax, %rsp			; X64-NEXT: orq %rax, %rsp
	; X64-NEXT: callq __cxa_allocate_exception			; X64-NEXT: callq __cxa_allocate_exception
	; X64-NEXT: .Lslh_ret_addr4:			; X64-NEXT: .Lslh_ret_addr4:
	; X64-NEXT: movq %rsp, %rcx			; X64-NEXT: movq %rsp, %rcx
	; X64-NEXT: movq -{{[0-9]+}}(%rsp), %rdx			; X64-NEXT: movq -{{[0-9]+}}(%rsp), %rdx
	; X64-NEXT: sarq $63, %rcx			; X64-NEXT: sarq $63, %rcx
	; X64-NEXT: cmpq $.Lslh_ret_addr4, %rdx			; X64-NEXT: cmpq $.Lslh_ret_addr4, %rdx
	; X64-NEXT: cmovneq %r15, %rcx			; X64-NEXT: cmovneq %rbx, %rcx
	; X64-NEXT: movl %ebp, (%rax)			; X64-NEXT: movl %ebp, (%rax)
	; X64-NEXT: .Ltmp0:			; X64-NEXT: .Ltmp0:
	; X64-NEXT: shlq $47, %rcx			; X64-NEXT: shlq $47, %rcx
	; X64-NEXT: movq %rax, %rdi			; X64-NEXT: movq %rax, %rdi
	; X64-NEXT: xorl %esi, %esi			; X64-NEXT: xorl %esi, %esi
	; X64-NEXT: xorl %edx, %edx			; X64-NEXT: xorl %edx, %edx
	; X64-NEXT: orq %rcx, %rsp			; X64-NEXT: orq %rcx, %rsp
	; X64-NEXT: callq __cxa_throw			; X64-NEXT: callq __cxa_throw
	; X64-NEXT: .Lslh_ret_addr5:			; X64-NEXT: .Lslh_ret_addr5:
	; X64-NEXT: movq %rsp, %rax			; X64-NEXT: movq %rsp, %rax
	; X64-NEXT: movq -{{[0-9]+}}(%rsp), %rcx			; X64-NEXT: movq -{{[0-9]+}}(%rsp), %rcx
	; X64-NEXT: sarq $63, %rax			; X64-NEXT: sarq $63, %rax
	; X64-NEXT: cmpq $.Lslh_ret_addr5, %rcx			; X64-NEXT: cmpq $.Lslh_ret_addr5, %rcx
	; X64-NEXT: cmovneq %r15, %rax			; X64-NEXT: cmovneq %rbx, %rax
	; X64-NEXT: .Ltmp1:			; X64-NEXT: .Ltmp1:
	; X64-NEXT: jmp .LBB4_3			; X64-NEXT: jmp .LBB4_3
	; X64-NEXT: .LBB4_1:			; X64-NEXT: .LBB4_1:
	; X64-NEXT: cmovleq %r15, %rax			; X64-NEXT: cmovleq %rbx, %rax
	; X64-NEXT: .LBB4_3: # %exit			; X64-NEXT: .LBB4_3: # %exit
	; X64-NEXT: shlq $47, %rax			; X64-NEXT: shlq $47, %rax
	; X64-NEXT: orq %rax, %rsp			; X64-NEXT: orq %rax, %rsp
	; X64-NEXT: addq $8, %rsp			; X64-NEXT: addq $24, %rsp
	; X64-NEXT: .cfi_def_cfa_offset 40
	; X64-NEXT: popq %rbx
	; X64-NEXT: .cfi_def_cfa_offset 32
	; X64-NEXT: popq %r14
	; X64-NEXT: .cfi_def_cfa_offset 24			; X64-NEXT: .cfi_def_cfa_offset 24
	; X64-NEXT: popq %r15			; X64-NEXT: popq %rbx
	; X64-NEXT: .cfi_def_cfa_offset 16			; X64-NEXT: .cfi_def_cfa_offset 16
	; X64-NEXT: popq %rbp			; X64-NEXT: popq %rbp
	; X64-NEXT: .cfi_def_cfa_offset 8			; X64-NEXT: .cfi_def_cfa_offset 8
	; X64-NEXT: retq			; X64-NEXT: retq
	; X64-NEXT: .LBB4_4: # %lpad			; X64-NEXT: .LBB4_4: # %lpad
	; X64-NEXT: .cfi_def_cfa_offset 48			; X64-NEXT: .cfi_def_cfa_offset 48
	; X64-NEXT: .Ltmp2:			; X64-NEXT: .Ltmp2:
	; X64-NEXT: movq %rsp, %rcx			; X64-NEXT: movq %rsp, %rcx
	; X64-NEXT: sarq $63, %rcx			; X64-NEXT: sarq $63, %rcx
	; X64-NEXT: movl (%rax), %eax			; X64-NEXT: movl (%rax), %edx
	; X64-NEXT: addl (%rbx), %eax			; X64-NEXT: movq {{[-0-9]+}}(%r{{[sb]}}p), %rax # 8-byte Reload
	; X64-NEXT: cltq			; X64-NEXT: addl (%rax), %edx
	; X64-NEXT: orq %rcx, %rax			; X64-NEXT: movslq %edx, %rdx
	; X64-NEXT: movl (%r14,%rax,4), %edi			; X64-NEXT: orq %rcx, %rdx
				; X64-NEXT: movq {{[-0-9]+}}(%r{{[sb]}}p), %rax # 8-byte Reload
				; X64-NEXT: movl (%rax,%rdx,4), %edi
	; X64-NEXT: orl %ecx, %edi			; X64-NEXT: orl %ecx, %edi
	; X64-NEXT: shlq $47, %rcx			; X64-NEXT: shlq $47, %rcx
	; X64-NEXT: orq %rcx, %rsp			; X64-NEXT: orq %rcx, %rsp
	; X64-NEXT: callq sink			; X64-NEXT: callq sink
	; X64-NEXT: .Lslh_ret_addr6:			; X64-NEXT: .Lslh_ret_addr6:
	; X64-NEXT: movq %rsp, %rax			; X64-NEXT: movq %rsp, %rax
	; X64-NEXT: movq -{{[0-9]+}}(%rsp), %rcx			; X64-NEXT: movq -{{[0-9]+}}(%rsp), %rcx
	; X64-NEXT: sarq $63, %rax			; X64-NEXT: sarq $63, %rax
	; X64-NEXT: cmpq $.Lslh_ret_addr6, %rcx			; X64-NEXT: cmpq $.Lslh_ret_addr6, %rcx
	; X64-NEXT: cmovneq %r15, %rax			; X64-NEXT: cmovneq %rbx, %rax
	;			;
	; X64-LFENCE-LABEL: test_basic_eh:			; X64-LFENCE-LABEL: test_basic_eh:
	; X64-LFENCE: # %bb.0: # %entry			; X64-LFENCE: # %bb.0: # %entry
	; X64-LFENCE-NEXT: pushq %rbp			; X64-LFENCE-NEXT: pushq %rbp
	; X64-LFENCE-NEXT: .cfi_def_cfa_offset 16			; X64-LFENCE-NEXT: .cfi_def_cfa_offset 16
	; X64-LFENCE-NEXT: pushq %r14			; X64-LFENCE-NEXT: pushq %r14
	; X64-LFENCE-NEXT: .cfi_def_cfa_offset 24			; X64-LFENCE-NEXT: .cfi_def_cfa_offset 24
	; X64-LFENCE-NEXT: pushq %rbx			; X64-LFENCE-NEXT: pushq %rbx
	▲ Show 20 Lines • Show All 562 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/tail-dup-merge-loop-headers.ll

	Show First 20 Lines • Show All 84 Lines • ▼ Show 20 Lines
	; couldn't shrink the test any further.			; couldn't shrink the test any further.

	define i32 @loop_shared_header(i8* %exe, i32 %exesz, i32 %headsize, i32 %min, i32 %wwprva, i32 %e_lfanew, i8* readonly %wwp, i32 %wwpsz, i16 zeroext %sects) local_unnamed_addr #0 {			define i32 @loop_shared_header(i8* %exe, i32 %exesz, i32 %headsize, i32 %min, i32 %wwprva, i32 %e_lfanew, i8* readonly %wwp, i32 %wwpsz, i16 zeroext %sects) local_unnamed_addr #0 {
	; CHECK-LABEL: loop_shared_header:			; CHECK-LABEL: loop_shared_header:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: pushq %rbp			; CHECK-NEXT: pushq %rbp
	; CHECK-NEXT: pushq %r15			; CHECK-NEXT: pushq %r15
	; CHECK-NEXT: pushq %r14			; CHECK-NEXT: pushq %r14
	; CHECK-NEXT: pushq %r13
	; CHECK-NEXT: pushq %r12			; CHECK-NEXT: pushq %r12
	; CHECK-NEXT: pushq %rbx			; CHECK-NEXT: pushq %rbx
	; CHECK-NEXT: pushq %rax			; CHECK-NEXT: subq $16, %rsp
	; CHECK-NEXT: movl $1, %ebx			; CHECK-NEXT: movl $1, %ebx
	; CHECK-NEXT: xorl %eax, %eax			; CHECK-NEXT: xorl %eax, %eax
	; CHECK-NEXT: testb %al, %al			; CHECK-NEXT: testb %al, %al
	; CHECK-NEXT: jne .LBB1_26			; CHECK-NEXT: jne .LBB1_26
	; CHECK-NEXT: # %bb.1: # %if.end19			; CHECK-NEXT: # %bb.1: # %if.end19
	; CHECK-NEXT: movl %esi, %r13d			; CHECK-NEXT: movl %esi, %r15d
	; CHECK-NEXT: movq %rdi, %r12			; CHECK-NEXT: movq %rdi, {{[-0-9]+}}(%r{{[sb]}}p) # 8-byte Spill
	; CHECK-NEXT: movl (%rax), %ebp			; CHECK-NEXT: movl (%rax), %ebp
	; CHECK-NEXT: leal (,%rbp,4), %r14d			; CHECK-NEXT: leal (,%rbp,4), %r12d
	; CHECK-NEXT: movl %r14d, %r15d			; CHECK-NEXT: movl %r12d, %r14d
	; CHECK-NEXT: movl $1, %esi			; CHECK-NEXT: movl $1, %esi
	; CHECK-NEXT: movq %r15, %rdi			; CHECK-NEXT: movq %r14, %rdi
	; CHECK-NEXT: callq cli_calloc			; CHECK-NEXT: callq cli_calloc
	; CHECK-NEXT: testl %r13d, %r13d			; CHECK-NEXT: testl %r15d, %r15d
	; CHECK-NEXT: je .LBB1_25			; CHECK-NEXT: je .LBB1_25
	; CHECK-NEXT: # %bb.2: # %if.end19			; CHECK-NEXT: # %bb.2: # %if.end19
	; CHECK-NEXT: testl %ebp, %ebp			; CHECK-NEXT: testl %ebp, %ebp
	; CHECK-NEXT: je .LBB1_25			; CHECK-NEXT: je .LBB1_25
	; CHECK-NEXT: # %bb.3: # %if.end19			; CHECK-NEXT: # %bb.3: # %if.end19
	; CHECK-NEXT: movq %rax, %rbx			; CHECK-NEXT: movq %rax, %rbx
	; CHECK-NEXT: xorl %eax, %eax			; CHECK-NEXT: xorl %eax, %eax
	; CHECK-NEXT: testb %al, %al			; CHECK-NEXT: testb %al, %al
	; CHECK-NEXT: jne .LBB1_25			; CHECK-NEXT: jne .LBB1_25
	; CHECK-NEXT: # %bb.4: # %if.end19			; CHECK-NEXT: # %bb.4: # %if.end19
	; CHECK-NEXT: cmpq %r12, %rbx			; CHECK-NEXT: cmpq {{[-0-9]+}}(%r{{[sb]}}p), %rbx # 8-byte Folded Reload
	; CHECK-NEXT: jb .LBB1_25			; CHECK-NEXT: jb .LBB1_25
	; CHECK-NEXT: # %bb.5: # %if.end50			; CHECK-NEXT: # %bb.5: # %if.end50
	; CHECK-NEXT: movq %rbx, %rdi			; CHECK-NEXT: movq %rbx, %rdi
	; CHECK-NEXT: movq %r15, %rdx			; CHECK-NEXT: movq %r14, %rdx
	; CHECK-NEXT: callq memcpy			; CHECK-NEXT: callq memcpy
	; CHECK-NEXT: cmpl $4, %r14d			; CHECK-NEXT: cmpl $4, %r12d
	; CHECK-NEXT: jb .LBB1_28			; CHECK-NEXT: jb .LBB1_28
	; CHECK-NEXT: # %bb.6: # %shared_preheader			; CHECK-NEXT: # %bb.6: # %shared_preheader
	; CHECK-NEXT: movb $32, %dl			; CHECK-NEXT: movb $32, %dl
	; CHECK-NEXT: xorl %eax, %eax			; CHECK-NEXT: xorl %eax, %eax
	; CHECK-NEXT: # implicit-def: $rcx			; CHECK-NEXT: # implicit-def: $rcx
	; CHECK-NEXT: testl %ebp, %ebp			; CHECK-NEXT: testl %ebp, %ebp
	; CHECK-NEXT: je .LBB1_18			; CHECK-NEXT: je .LBB1_18
	; CHECK-NEXT: .p2align 4, 0x90			; CHECK-NEXT: .p2align 4, 0x90
	▲ Show 20 Lines • Show All 63 Lines • ▼ Show 20 Lines
	; CHECK-NEXT: jmp .LBB1_26			; CHECK-NEXT: jmp .LBB1_26
	; CHECK-NEXT: .LBB1_22: # %if.then99.i			; CHECK-NEXT: .LBB1_22: # %if.then99.i
	; CHECK-NEXT: xorl %ebx, %ebx			; CHECK-NEXT: xorl %ebx, %ebx
	; CHECK-NEXT: movl $.str.6, %edi			; CHECK-NEXT: movl $.str.6, %edi
	; CHECK-NEXT: xorl %eax, %eax			; CHECK-NEXT: xorl %eax, %eax
	; CHECK-NEXT: callq cli_dbgmsg			; CHECK-NEXT: callq cli_dbgmsg
	; CHECK-NEXT: .LBB1_26: # %cleanup			; CHECK-NEXT: .LBB1_26: # %cleanup
	; CHECK-NEXT: movl %ebx, %eax			; CHECK-NEXT: movl %ebx, %eax
	; CHECK-NEXT: addq $8, %rsp			; CHECK-NEXT: addq $16, %rsp
	; CHECK-NEXT: popq %rbx			; CHECK-NEXT: popq %rbx
	; CHECK-NEXT: popq %r12			; CHECK-NEXT: popq %r12
	; CHECK-NEXT: popq %r13
	; CHECK-NEXT: popq %r14			; CHECK-NEXT: popq %r14
	; CHECK-NEXT: popq %r15			; CHECK-NEXT: popq %r15
	; CHECK-NEXT: popq %rbp			; CHECK-NEXT: popq %rbp
	; CHECK-NEXT: retq			; CHECK-NEXT: retq
	; CHECK-NEXT: .LBB1_27: # %wunpsect.exit.thread.loopexit389			; CHECK-NEXT: .LBB1_27: # %wunpsect.exit.thread.loopexit389
	; CHECK-NEXT: .LBB1_28: # %wunpsect.exit.thread.loopexit391			; CHECK-NEXT: .LBB1_28: # %wunpsect.exit.thread.loopexit391
	entry:			entry:
	%0 = load i32, i32* undef, align 4			%0 = load i32, i32* undef, align 4
	▲ Show 20 Lines • Show All 106 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/tail-opts.ll

	Show First 20 Lines • Show All 233 Lines • ▼ Show 20 Lines
	%struct.tree_decl = type { [24 x i8], i8, i32, %union.tree_node, i32, i8, i8, i8, i8, %union.tree_node, %union.tree_node, %union.tree_node, %union.tree_node, %union.tree_node, %union.tree_node, %union.tree_node, %union.tree_node, %union.tree_node, %struct.rtx_def, %union..2anon, %0, %union.tree_node, %struct.lang_decl }			%struct.tree_decl = type { [24 x i8], i8, i32, %union.tree_node, i32, i8, i8, i8, i8, %union.tree_node, %union.tree_node, %union.tree_node, %union.tree_node, %union.tree_node, %union.tree_node, %union.tree_node, %union.tree_node, %union.tree_node, %struct.rtx_def, %union..2anon, %0, %union.tree_node, %struct.lang_decl }
	%union..2anon = type { i32 }			%union..2anon = type { i32 }
	%union.rtunion = type { i8* }			%union.rtunion = type { i8* }
	%union.tree_node = type { %struct.tree_decl }			%union.tree_node = type { %struct.tree_decl }

	define fastcc void @c_expand_expr_stmt(%union.tree_node* %expr) nounwind {			define fastcc void @c_expand_expr_stmt(%union.tree_node* %expr) nounwind {
	; CHECK-LABEL: c_expand_expr_stmt:			; CHECK-LABEL: c_expand_expr_stmt:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: pushq %rbx			; CHECK-NEXT: pushq %rax
	; CHECK-NEXT: xorl %eax, %eax			; CHECK-NEXT: xorl %eax, %eax
	; CHECK-NEXT: testb %al, %al			; CHECK-NEXT: testb %al, %al
	; CHECK-NEXT: jne .LBB3_17			; CHECK-NEXT: jne .LBB3_17
	; CHECK-NEXT: # %bb.1: # %entry			; CHECK-NEXT: # %bb.1: # %entry
	; CHECK-NEXT: movb 0, %bl			; CHECK-NEXT: movb 0, %al
	; CHECK-NEXT: xorl %eax, %eax			; CHECK-NEXT: xorl %ecx, %ecx
	; CHECK-NEXT: testb %al, %al			; CHECK-NEXT: testb %cl, %cl
	; CHECK-NEXT: jne .LBB3_16			; CHECK-NEXT: jne .LBB3_16
	; CHECK-NEXT: # %bb.2: # %bb.i			; CHECK-NEXT: # %bb.2: # %bb.i
	; CHECK-NEXT: xorl %eax, %eax			; CHECK-NEXT: xorl %ecx, %ecx
	; CHECK-NEXT: testb %al, %al			; CHECK-NEXT: testb %cl, %cl
	; CHECK-NEXT: je .LBB3_16			; CHECK-NEXT: je .LBB3_16
	; CHECK-NEXT: # %bb.3: # %lvalue_p.exit			; CHECK-NEXT: # %bb.3: # %lvalue_p.exit
	; CHECK-NEXT: movq 0, %rax			; CHECK-NEXT: movq 0, %rcx
	; CHECK-NEXT: movzbl (%rax), %ecx			; CHECK-NEXT: movzbl (%rcx), %edx
	; CHECK-NEXT: testl %ecx, %ecx			; CHECK-NEXT: testl %edx, %edx
	; CHECK-NEXT: je .LBB3_12			; CHECK-NEXT: je .LBB3_12
	; CHECK-NEXT: # %bb.4: # %lvalue_p.exit			; CHECK-NEXT: # %bb.4: # %lvalue_p.exit
	; CHECK-NEXT: cmpl $2, %ecx			; CHECK-NEXT: cmpl $2, %edx
	; CHECK-NEXT: jne .LBB3_5			; CHECK-NEXT: jne .LBB3_5
	; CHECK-NEXT: # %bb.6: # %bb.i1			; CHECK-NEXT: # %bb.6: # %bb.i1
	; CHECK-NEXT: movq 32(%rax), %rax			; CHECK-NEXT: movq 32(%rcx), %rcx
	; CHECK-NEXT: movzbl 16(%rax), %ecx			; CHECK-NEXT: movzbl 16(%rcx), %edx
	; CHECK-NEXT: testl %ecx, %ecx			; CHECK-NEXT: testl %edx, %edx
	; CHECK-NEXT: je .LBB3_10			; CHECK-NEXT: je .LBB3_10
	; CHECK-NEXT: # %bb.7: # %bb.i1			; CHECK-NEXT: # %bb.7: # %bb.i1
	; CHECK-NEXT: cmpl $2, %ecx			; CHECK-NEXT: cmpl $2, %edx
	; CHECK-NEXT: jne .LBB3_8			; CHECK-NEXT: jne .LBB3_8
	; CHECK-NEXT: # %bb.9: # %bb.i.i			; CHECK-NEXT: # %bb.9: # %bb.i.i
	; CHECK-NEXT: xorl %edi, %edi			; CHECK-NEXT: xorl %edi, %edi
				; CHECK-NEXT: movb %al, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill
	; CHECK-NEXT: callq lvalue_p			; CHECK-NEXT: callq lvalue_p
	; CHECK-NEXT: testl %eax, %eax			; CHECK-NEXT: testl %eax, %eax
	; CHECK-NEXT: setne %al			; CHECK-NEXT: movb {{[-0-9]+}}(%r{{[sb]}}p), %al # 1-byte Reload
	; CHECK-NEXT: testb %al, %al			; CHECK-NEXT: setne %cl
				; CHECK-NEXT: testb %cl, %cl
	; CHECK-NEXT: je .LBB3_15			; CHECK-NEXT: je .LBB3_15
	; CHECK-NEXT: jmp .LBB3_17			; CHECK-NEXT: jmp .LBB3_17
	; CHECK-NEXT: .LBB3_16: # %bb1			; CHECK-NEXT: .LBB3_16: # %bb1
	; CHECK-NEXT: cmpb $23, %bl			; CHECK-NEXT: cmpb $23, %al
	; CHECK-NEXT: .LBB3_17: # %bb3			; CHECK-NEXT: .LBB3_17: # %bb3
	; CHECK-NEXT: .LBB3_12: # %bb2.i3			; CHECK-NEXT: .LBB3_12: # %bb2.i3
	; CHECK-NEXT: movq 8(%rax), %rax			; CHECK-NEXT: movq 8(%rcx), %rcx
	; CHECK-NEXT: movb 16(%rax), %cl			; CHECK-NEXT: movb 16(%rcx), %dl
	; CHECK-NEXT: xorl %eax, %eax			; CHECK-NEXT: xorl %ecx, %ecx
	; CHECK-NEXT: cmpb $23, %cl			; CHECK-NEXT: cmpb $23, %dl
	; CHECK-NEXT: je .LBB3_14			; CHECK-NEXT: je .LBB3_14
	; CHECK-NEXT: # %bb.13: # %bb2.i3			; CHECK-NEXT: # %bb.13: # %bb2.i3
	; CHECK-NEXT: cmpb $16, %cl			; CHECK-NEXT: cmpb $16, %dl
	; CHECK-NEXT: je .LBB3_14			; CHECK-NEXT: je .LBB3_14
	; CHECK-NEXT: jmp .LBB3_17			; CHECK-NEXT: jmp .LBB3_17
	; CHECK-NEXT: .LBB3_5:			; CHECK-NEXT: .LBB3_5:
	; CHECK-NEXT: xorl %eax, %eax			; CHECK-NEXT: xorl %ecx, %ecx
	; CHECK-NEXT: testb %al, %al			; CHECK-NEXT: testb %cl, %cl
	; CHECK-NEXT: je .LBB3_15			; CHECK-NEXT: je .LBB3_15
	; CHECK-NEXT: jmp .LBB3_17			; CHECK-NEXT: jmp .LBB3_17
	; CHECK-NEXT: .LBB3_10: # %bb2.i.i2			; CHECK-NEXT: .LBB3_10: # %bb2.i.i2
	; CHECK-NEXT: movq 8(%rax), %rax			; CHECK-NEXT: movq 8(%rcx), %rcx
	; CHECK-NEXT: movb 16(%rax), %cl			; CHECK-NEXT: movb 16(%rcx), %dl
	; CHECK-NEXT: xorl %eax, %eax			; CHECK-NEXT: xorl %ecx, %ecx
	; CHECK-NEXT: cmpb $16, %cl			; CHECK-NEXT: cmpb $16, %dl
	; CHECK-NEXT: je .LBB3_14			; CHECK-NEXT: je .LBB3_14
	; CHECK-NEXT: # %bb.11: # %bb2.i.i2			; CHECK-NEXT: # %bb.11: # %bb2.i.i2
	; CHECK-NEXT: cmpb $23, %cl			; CHECK-NEXT: cmpb $23, %dl
	; CHECK-NEXT: je .LBB3_14			; CHECK-NEXT: je .LBB3_14
	; CHECK-NEXT: jmp .LBB3_17			; CHECK-NEXT: jmp .LBB3_17
	; CHECK-NEXT: .LBB3_8:			; CHECK-NEXT: .LBB3_8:
	; CHECK-NEXT: xorl %eax, %eax			; CHECK-NEXT: xorl %ecx, %ecx
	; CHECK-NEXT: .LBB3_14: # %lvalue_p.exit4			; CHECK-NEXT: .LBB3_14: # %lvalue_p.exit4
	; CHECK-NEXT: testb %al, %al			; CHECK-NEXT: testb %cl, %cl
	; CHECK-NEXT: jne .LBB3_17			; CHECK-NEXT: jne .LBB3_17
	; CHECK-NEXT: .LBB3_15: # %lvalue_p.exit4			; CHECK-NEXT: .LBB3_15: # %lvalue_p.exit4
	; CHECK-NEXT: testb %bl, %bl			; CHECK-NEXT: testb %al, %al
	entry:			entry:
	%tmp4 = load i8, i8* null, align 8 ; <i8> [#uses=3]			%tmp4 = load i8, i8* null, align 8 ; <i8> [#uses=3]
	switch i8 %tmp4, label %bb3 [			switch i8 %tmp4, label %bb3 [
	i8 18, label %bb			i8 18, label %bb
	]			]

	bb: ; preds = %entry			bb: ; preds = %entry
	switch i32 undef, label %bb1 [			switch i32 undef, label %bb1 [
	▲ Show 20 Lines • Show All 451 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/tbm_patterns.ll

Show First 20 Lines • Show All 869 Lines • ▼ Show 20 Lines	; CHECK-NEXT: retq
%4 = add nuw nsw i64 %2, 1		%4 = add nuw nsw i64 %2, 1
%5 = and i64 %4, %3		%5 = and i64 %4, %3
ret i64 %5		ret i64 %5
}		}

define i32 @blcic32_branch(i32 %x) nounwind {		define i32 @blcic32_branch(i32 %x) nounwind {
; CHECK-LABEL: blcic32_branch:		; CHECK-LABEL: blcic32_branch:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: pushq %rbx		; CHECK-NEXT: blcicl %edi, %eax
; CHECK-NEXT: blcicl %edi, %ebx		; CHECK-NEXT: je .LBB69_1
; CHECK-NEXT: jne .LBB69_2		; CHECK-NEXT: # %bb.2:
; CHECK-NEXT: # %bb.1:		; CHECK-NEXT: retq
		; CHECK-NEXT: .LBB69_1:
		; CHECK-NEXT: pushq %rax
		; CHECK-NEXT: movl %eax, {{[-0-9]+}}(%r{{[sb]}}p) # 4-byte Spill
; CHECK-NEXT: callq bar		; CHECK-NEXT: callq bar
; CHECK-NEXT: .LBB69_2:		; CHECK-NEXT: movl {{[-0-9]+}}(%r{{[sb]}}p), %eax # 4-byte Reload
; CHECK-NEXT: movl %ebx, %eax		; CHECK-NEXT: addq $8, %rsp
; CHECK-NEXT: popq %rbx
; CHECK-NEXT: retq		; CHECK-NEXT: retq
%tmp = xor i32 %x, -1		%tmp = xor i32 %x, -1
%tmp2 = add i32 %x, 1		%tmp2 = add i32 %x, 1
%tmp3 = and i32 %tmp, %tmp2		%tmp3 = and i32 %tmp, %tmp2
%cmp = icmp eq i32 %tmp3, 0		%cmp = icmp eq i32 %tmp3, 0
br i1 %cmp, label %1, label %2		br i1 %cmp, label %1, label %2

tail call void @bar()		tail call void @bar()
br label %2		br label %2
ret i32 %tmp3		ret i32 %tmp3
}		}

define i64 @blcic64_branch(i64 %x) nounwind {		define i64 @blcic64_branch(i64 %x) nounwind {
; CHECK-LABEL: blcic64_branch:		; CHECK-LABEL: blcic64_branch:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: pushq %rbx		; CHECK-NEXT: blcicq %rdi, %rax
; CHECK-NEXT: blcicq %rdi, %rbx		; CHECK-NEXT: je .LBB70_1
; CHECK-NEXT: jne .LBB70_2		; CHECK-NEXT: # %bb.2:
; CHECK-NEXT: # %bb.1:		; CHECK-NEXT: retq
		; CHECK-NEXT: .LBB70_1:
		; CHECK-NEXT: pushq %rax
		; CHECK-NEXT: movq %rax, (%rsp) # 8-byte Spill
; CHECK-NEXT: callq bar		; CHECK-NEXT: callq bar
; CHECK-NEXT: .LBB70_2:		; CHECK-NEXT: movq (%rsp), %rax # 8-byte Reload
; CHECK-NEXT: movq %rbx, %rax		; CHECK-NEXT: addq $8, %rsp
; CHECK-NEXT: popq %rbx
; CHECK-NEXT: retq		; CHECK-NEXT: retq
%tmp = xor i64 %x, -1		%tmp = xor i64 %x, -1
%tmp2 = add i64 %x, 1		%tmp2 = add i64 %x, 1
%tmp3 = and i64 %tmp, %tmp2		%tmp3 = and i64 %tmp, %tmp2
%cmp = icmp eq i64 %tmp3, 0		%cmp = icmp eq i64 %tmp3, 0
br i1 %cmp, label %1, label %2		br i1 %cmp, label %1, label %2

tail call void @bar()		tail call void @bar()
br label %2		br label %2
ret i64 %tmp3		ret i64 %tmp3
}		}

define i32 @tzmsk32_branch(i32 %x) nounwind {		define i32 @tzmsk32_branch(i32 %x) nounwind {
; CHECK-LABEL: tzmsk32_branch:		; CHECK-LABEL: tzmsk32_branch:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: pushq %rbx		; CHECK-NEXT: tzmskl %edi, %eax
; CHECK-NEXT: tzmskl %edi, %ebx		; CHECK-NEXT: je .LBB71_1
; CHECK-NEXT: jne .LBB71_2		; CHECK-NEXT: # %bb.2:
; CHECK-NEXT: # %bb.1:		; CHECK-NEXT: retq
		; CHECK-NEXT: .LBB71_1:
		; CHECK-NEXT: pushq %rax
		; CHECK-NEXT: movl %eax, {{[-0-9]+}}(%r{{[sb]}}p) # 4-byte Spill
; CHECK-NEXT: callq bar		; CHECK-NEXT: callq bar
; CHECK-NEXT: .LBB71_2:		; CHECK-NEXT: movl {{[-0-9]+}}(%r{{[sb]}}p), %eax # 4-byte Reload
; CHECK-NEXT: movl %ebx, %eax		; CHECK-NEXT: addq $8, %rsp
; CHECK-NEXT: popq %rbx
; CHECK-NEXT: retq		; CHECK-NEXT: retq
%tmp = xor i32 %x, -1		%tmp = xor i32 %x, -1
%tmp2 = add i32 %x, -1		%tmp2 = add i32 %x, -1
%tmp3 = and i32 %tmp, %tmp2		%tmp3 = and i32 %tmp, %tmp2
%cmp = icmp eq i32 %tmp3, 0		%cmp = icmp eq i32 %tmp3, 0
br i1 %cmp, label %1, label %2		br i1 %cmp, label %1, label %2

tail call void @bar()		tail call void @bar()
br label %2		br label %2
ret i32 %tmp3		ret i32 %tmp3
}		}

define i64 @tzmsk64_branch(i64 %x) nounwind {		define i64 @tzmsk64_branch(i64 %x) nounwind {
; CHECK-LABEL: tzmsk64_branch:		; CHECK-LABEL: tzmsk64_branch:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: pushq %rbx		; CHECK-NEXT: tzmskq %rdi, %rax
; CHECK-NEXT: tzmskq %rdi, %rbx		; CHECK-NEXT: je .LBB72_1
; CHECK-NEXT: jne .LBB72_2		; CHECK-NEXT: # %bb.2:
; CHECK-NEXT: # %bb.1:		; CHECK-NEXT: retq
		; CHECK-NEXT: .LBB72_1:
		; CHECK-NEXT: pushq %rax
		; CHECK-NEXT: movq %rax, (%rsp) # 8-byte Spill
; CHECK-NEXT: callq bar		; CHECK-NEXT: callq bar
; CHECK-NEXT: .LBB72_2:		; CHECK-NEXT: movq (%rsp), %rax # 8-byte Reload
; CHECK-NEXT: movq %rbx, %rax		; CHECK-NEXT: addq $8, %rsp
; CHECK-NEXT: popq %rbx
; CHECK-NEXT: retq		; CHECK-NEXT: retq
%tmp = xor i64 %x, -1		%tmp = xor i64 %x, -1
%tmp2 = add i64 %x, -1		%tmp2 = add i64 %x, -1
%tmp3 = and i64 %tmp, %tmp2		%tmp3 = and i64 %tmp, %tmp2
%cmp = icmp eq i64 %tmp3, 0		%cmp = icmp eq i64 %tmp3, 0
br i1 %cmp, label %1, label %2		br i1 %cmp, label %1, label %2

tail call void @bar()		tail call void @bar()
br label %2		br label %2
ret i64 %tmp3		ret i64 %tmp3
}		}

declare void @bar()		declare void @bar()

llvm/test/CodeGen/X86/x86-shrink-wrapping.ll

	Show First 20 Lines • Show All 1,368 Lines • ▼ Show 20 Lines
	define i32 @irreducibleCFG() #4 {			define i32 @irreducibleCFG() #4 {
	; ENABLE-LABEL: irreducibleCFG:			; ENABLE-LABEL: irreducibleCFG:
	; ENABLE: ## %bb.0: ## %entry			; ENABLE: ## %bb.0: ## %entry
	; ENABLE-NEXT: pushq %rbp			; ENABLE-NEXT: pushq %rbp
	; ENABLE-NEXT: .cfi_def_cfa_offset 16			; ENABLE-NEXT: .cfi_def_cfa_offset 16
	; ENABLE-NEXT: .cfi_offset %rbp, -16			; ENABLE-NEXT: .cfi_offset %rbp, -16
	; ENABLE-NEXT: movq %rsp, %rbp			; ENABLE-NEXT: movq %rsp, %rbp
	; ENABLE-NEXT: .cfi_def_cfa_register %rbp			; ENABLE-NEXT: .cfi_def_cfa_register %rbp
	; ENABLE-NEXT: pushq %rbx
	; ENABLE-NEXT: pushq %rax
	; ENABLE-NEXT: .cfi_offset %rbx, -24
	; ENABLE-NEXT: movq _irreducibleCFGf@{{.*}}(%rip), %rax			; ENABLE-NEXT: movq _irreducibleCFGf@{{.*}}(%rip), %rax
	; ENABLE-NEXT: cmpb $0, (%rax)			; ENABLE-NEXT: cmpb $0, (%rax)
	; ENABLE-NEXT: je LBB16_2			; ENABLE-NEXT: je LBB16_2
	; ENABLE-NEXT: .p2align 4, 0x90			; ENABLE-NEXT: .p2align 4, 0x90
	; ENABLE-NEXT: LBB16_1: ## %preheader			; ENABLE-NEXT: LBB16_1: ## %preheader
	; ENABLE-NEXT: ## =>This Inner Loop Header: Depth=1			; ENABLE-NEXT: ## =>This Inner Loop Header: Depth=1
	; ENABLE-NEXT: jmp LBB16_1			; ENABLE-NEXT: jmp LBB16_1
	; ENABLE-NEXT: LBB16_2: ## %split			; ENABLE-NEXT: LBB16_2: ## %split
	; ENABLE-NEXT: movq _irreducibleCFGb@{{.*}}(%rip), %rax			; ENABLE-NEXT: movq _irreducibleCFGb@{{.*}}(%rip), %rax
	; ENABLE-NEXT: cmpl $0, (%rax)			; ENABLE-NEXT: cmpl $0, (%rax)
	; ENABLE-NEXT: je LBB16_3			; ENABLE-NEXT: je LBB16_4
	; ENABLE-NEXT: ## %bb.4: ## %for.body4.i			; ENABLE-NEXT: ## %bb.3: ## %for.body4.i
	; ENABLE-NEXT: movq _irreducibleCFGa@{{.*}}(%rip), %rax			; ENABLE-NEXT: movq _irreducibleCFGa@{{.*}}(%rip), %rax
	; ENABLE-NEXT: movl (%rax), %edi			; ENABLE-NEXT: movl (%rax), %edi
	; ENABLE-NEXT: xorl %ebx, %ebx
	; ENABLE-NEXT: xorl %eax, %eax			; ENABLE-NEXT: xorl %eax, %eax
	; ENABLE-NEXT: callq _something			; ENABLE-NEXT: callq _something
	; ENABLE-NEXT: jmp LBB16_5			; ENABLE-NEXT: LBB16_4: ## %for.inc
	; ENABLE-NEXT: LBB16_3:			; ENABLE-NEXT: xorl %eax, %eax
	; ENABLE-NEXT: xorl %ebx, %ebx
	; ENABLE-NEXT: .p2align 4, 0x90			; ENABLE-NEXT: .p2align 4, 0x90
	; ENABLE-NEXT: LBB16_5: ## %for.inc			; ENABLE-NEXT: LBB16_5: ## %for.inc
	; ENABLE-NEXT: ## =>This Inner Loop Header: Depth=1			; ENABLE-NEXT: ## =>This Inner Loop Header: Depth=1
	; ENABLE-NEXT: incl %ebx			; ENABLE-NEXT: incl %eax
	; ENABLE-NEXT: cmpl $7, %ebx			; ENABLE-NEXT: cmpl $7, %eax
	; ENABLE-NEXT: jl LBB16_5			; ENABLE-NEXT: jl LBB16_5
	; ENABLE-NEXT: ## %bb.6: ## %fn1.exit			; ENABLE-NEXT: ## %bb.6: ## %fn1.exit
	; ENABLE-NEXT: xorl %eax, %eax			; ENABLE-NEXT: xorl %eax, %eax
	; ENABLE-NEXT: addq $8, %rsp
	; ENABLE-NEXT: popq %rbx
	; ENABLE-NEXT: popq %rbp			; ENABLE-NEXT: popq %rbp
	; ENABLE-NEXT: retq			; ENABLE-NEXT: retq
	;			;
	; DISABLE-LABEL: irreducibleCFG:			; DISABLE-LABEL: irreducibleCFG:
	; DISABLE: ## %bb.0: ## %entry			; DISABLE: ## %bb.0: ## %entry
	; DISABLE-NEXT: pushq %rbp			; DISABLE-NEXT: pushq %rbp
	; DISABLE-NEXT: .cfi_def_cfa_offset 16			; DISABLE-NEXT: .cfi_def_cfa_offset 16
	; DISABLE-NEXT: .cfi_offset %rbp, -16			; DISABLE-NEXT: .cfi_offset %rbp, -16
	; DISABLE-NEXT: movq %rsp, %rbp			; DISABLE-NEXT: movq %rsp, %rbp
	; DISABLE-NEXT: .cfi_def_cfa_register %rbp			; DISABLE-NEXT: .cfi_def_cfa_register %rbp
	; DISABLE-NEXT: pushq %rbx
	; DISABLE-NEXT: pushq %rax
	; DISABLE-NEXT: .cfi_offset %rbx, -24
	; DISABLE-NEXT: movq _irreducibleCFGf@{{.*}}(%rip), %rax			; DISABLE-NEXT: movq _irreducibleCFGf@{{.*}}(%rip), %rax
	; DISABLE-NEXT: cmpb $0, (%rax)			; DISABLE-NEXT: cmpb $0, (%rax)
	; DISABLE-NEXT: je LBB16_2			; DISABLE-NEXT: je LBB16_2
	; DISABLE-NEXT: .p2align 4, 0x90			; DISABLE-NEXT: .p2align 4, 0x90
	; DISABLE-NEXT: LBB16_1: ## %preheader			; DISABLE-NEXT: LBB16_1: ## %preheader
	; DISABLE-NEXT: ## =>This Inner Loop Header: Depth=1			; DISABLE-NEXT: ## =>This Inner Loop Header: Depth=1
	; DISABLE-NEXT: jmp LBB16_1			; DISABLE-NEXT: jmp LBB16_1
	; DISABLE-NEXT: LBB16_2: ## %split			; DISABLE-NEXT: LBB16_2: ## %split
	; DISABLE-NEXT: movq _irreducibleCFGb@{{.*}}(%rip), %rax			; DISABLE-NEXT: movq _irreducibleCFGb@{{.*}}(%rip), %rax
	; DISABLE-NEXT: cmpl $0, (%rax)			; DISABLE-NEXT: cmpl $0, (%rax)
	; DISABLE-NEXT: je LBB16_3			; DISABLE-NEXT: je LBB16_4
	; DISABLE-NEXT: ## %bb.4: ## %for.body4.i			; DISABLE-NEXT: ## %bb.3: ## %for.body4.i
	; DISABLE-NEXT: movq _irreducibleCFGa@{{.*}}(%rip), %rax			; DISABLE-NEXT: movq _irreducibleCFGa@{{.*}}(%rip), %rax
	; DISABLE-NEXT: movl (%rax), %edi			; DISABLE-NEXT: movl (%rax), %edi
	; DISABLE-NEXT: xorl %ebx, %ebx
	; DISABLE-NEXT: xorl %eax, %eax			; DISABLE-NEXT: xorl %eax, %eax
	; DISABLE-NEXT: callq _something			; DISABLE-NEXT: callq _something
	; DISABLE-NEXT: jmp LBB16_5			; DISABLE-NEXT: LBB16_4: ## %for.inc
	; DISABLE-NEXT: LBB16_3:			; DISABLE-NEXT: xorl %eax, %eax
	; DISABLE-NEXT: xorl %ebx, %ebx
	; DISABLE-NEXT: .p2align 4, 0x90			; DISABLE-NEXT: .p2align 4, 0x90
	; DISABLE-NEXT: LBB16_5: ## %for.inc			; DISABLE-NEXT: LBB16_5: ## %for.inc
	; DISABLE-NEXT: ## =>This Inner Loop Header: Depth=1			; DISABLE-NEXT: ## =>This Inner Loop Header: Depth=1
	; DISABLE-NEXT: incl %ebx			; DISABLE-NEXT: incl %eax
	; DISABLE-NEXT: cmpl $7, %ebx			; DISABLE-NEXT: cmpl $7, %eax
	; DISABLE-NEXT: jl LBB16_5			; DISABLE-NEXT: jl LBB16_5
	; DISABLE-NEXT: ## %bb.6: ## %fn1.exit			; DISABLE-NEXT: ## %bb.6: ## %fn1.exit
	; DISABLE-NEXT: xorl %eax, %eax			; DISABLE-NEXT: xorl %eax, %eax
	; DISABLE-NEXT: addq $8, %rsp
	; DISABLE-NEXT: popq %rbx
	; DISABLE-NEXT: popq %rbp			; DISABLE-NEXT: popq %rbp
	; DISABLE-NEXT: retq			; DISABLE-NEXT: retq
	entry:			entry:
	%i0 = load i32, i32* @irreducibleCFGa, align 4			%i0 = load i32, i32* @irreducibleCFGa, align 4
	%.pr = load i8, i8* @irreducibleCFGf, align 1			%.pr = load i8, i8* @irreducibleCFGf, align 1
	%bool = icmp eq i8 %.pr, 0			%bool = icmp eq i8 %.pr, 0
	br i1 %bool, label %split, label %preheader			br i1 %bool, label %split, label %preheader

	▲ Show 20 Lines • Show All 123 Lines • Show Last 20 Lines

llvm/test/DebugInfo/X86/live-debug-values.ll

	Show All 23 Lines
	; return 0;			; return 0;
	; }			; }
	; with clang -g -O3 -emit-llvm -c LiveDebugValues.c -S -o live-debug-values.ll			; with clang -g -O3 -emit-llvm -c LiveDebugValues.c -S -o live-debug-values.ll
	; This case will also produce multiple locations but only the debug range			; This case will also produce multiple locations but only the debug range
	; extension is tested here.			; extension is tested here.

	; DBG_VALUE for variable "n" is extended into %bb.5 from its predecessors %bb.3			; DBG_VALUE for variable "n" is extended into %bb.5 from its predecessors %bb.3
	; and %bb.4.			; and %bb.4.
				; CHECK: #DEBUG_VALUE: main:n <- $ebx
	; CHECK: .LBB0_5:			; CHECK: .LBB0_5:
	; CHECK-NEXT: #DEBUG_VALUE: main:n <- $ebx
	; Other register values have been clobbered.			; Other register values have been clobbered.
	; CHECK-NOT: #DEBUG_VALUE:			; CHECK-NOT: #DEBUG_VALUE:
	; CHECK: movl %e{{..}}, m(%rip)			; CHECK: movl %e{{..}}, m(%rip)

	; ModuleID = 'LiveDebugValues.c'			; ModuleID = 'LiveDebugValues.c'
	source_filename = "test/DebugInfo/X86/live-debug-values.ll"			source_filename = "test/DebugInfo/X86/live-debug-values.ll"
	target datalayout = "e-m:e-i64:64-f80:128-n8:16:32:64-S128"			target datalayout = "e-m:e-i64:64-f80:128-n8:16:32:64-S128"
	target triple = "x86_64-unknown-linux-gnu"			target triple = "x86_64-unknown-linux-gnu"
	▲ Show 20 Lines • Show All 117 Lines • Show Last 20 Lines

This is an archive of the discontinued LLVM Phabricator instance.

[Regalloc][WIP] Increase CSR cost in RegAllocGreedy to favour splitting/spill over CSR first useNeeds ReviewPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 227018

llvm/lib/CodeGen/RegAllocGreedy.cpp

llvm/lib/Target/AArch64/AArch64RegisterInfo.h

llvm/lib/Target/PowerPC/PPCRegisterInfo.h

llvm/lib/Target/X86/X86RegisterInfo.h

llvm/test/CodeGen/AArch64/cgp-usubo.ll

llvm/test/CodeGen/AArch64/csr-split.ll

llvm/test/CodeGen/PowerPC/2008-10-28-f128-i32.ll

llvm/test/CodeGen/PowerPC/csr-split.ll

llvm/test/CodeGen/PowerPC/tail-dup-break-cfg.ll

llvm/test/CodeGen/X86/atom-fixup-lea2.ll

llvm/test/CodeGen/X86/block-placement.ll

llvm/test/CodeGen/X86/bmi.ll

llvm/test/CodeGen/X86/callbr-asm-branch-folding.ll

llvm/test/CodeGen/X86/cgp-usubo.ll

llvm/test/CodeGen/X86/csr-split.ll

llvm/test/CodeGen/X86/fp128-cast.ll

llvm/test/CodeGen/X86/peep-test-4.ll

llvm/test/CodeGen/X86/ragreedy-bug.ll

llvm/test/CodeGen/X86/ragreedy-hoist-spill.ll

llvm/test/CodeGen/X86/regalloc-advanced-split-cost.ll

llvm/test/CodeGen/X86/sjlj-eh.ll

llvm/test/CodeGen/X86/speculative-load-hardening.ll

llvm/test/CodeGen/X86/tail-dup-merge-loop-headers.ll

llvm/test/CodeGen/X86/tail-opts.ll

llvm/test/CodeGen/X86/tbm_patterns.ll

llvm/test/CodeGen/X86/x86-shrink-wrapping.ll

llvm/test/DebugInfo/X86/live-debug-values.ll

[Regalloc][WIP] Increase CSR cost in RegAllocGreedy to favour splitting/spill over CSR first use
Needs ReviewPublic