This is an archive of the discontinued LLVM Phabricator instance.

Paths

Table of Contentst

-
llvm/
-
include/llvm/CodeGen/
-
llvm/
-
CodeGen/
-
TargetLowering.h
-
lib/
-
CodeGen/
2
CodeGenPrepare.cpp
-
Target/ARM/
-
ARM/
-
ARMISelLowering.h
-
test/
-
CodeGen/
-
ARM/
-
branch-on-zero.ll
-
Thumb2/
-
2010-02-11-phi-cycle.ll
-
Transforms/CodeGenPrepare/ARM/
-
CodeGenPrepare/
-
ARM/
-
branch-on-zero.ll

Differential D101778

[CPG][ARM] Optimize towards branch on zero in codegenprepare
ClosedPublic

Authored by dmgreen on May 3 2021, 12:16 PM.

Download Raw Diff

Details

Reviewers

SjoerdMeijer
ostannard
efriedma
NickGuy
samtebbs

Commits

rGdd5c52029d27: [CPG][ARM] Optimize towards branch on zero in codegenprepare

Summary

This adds a simple fold into codegenprepare that converts comparison of branches towards comparison with zero if possible. For example:

  %c = icmp ult %x, 8
  br %c, bla, blb
  %tc = lshr %x, 3
becomes
  %tc = lshr %x, 3
  %c = icmp eq %tc, 0
  br %c, bla, blb

As a first order approximation, this can reduce the number of instructions needed to perform the branch as the shift is (often) needed anyway. At the moment this does not effect very much, as llvm tends to prefer the opposite form. But it can protect against regressions from commits like rG9423f78240a2.

Simple cases of Add and Sub are added along with Shift, equally as the comparison to zero can often be folded with cpsr flags.

Diff Detail

Repository: rG LLVM Github Monorepo

Event Timeline

dmgreen created this revision.May 3 2021, 12:16 PM

Herald added subscribers: danielkiss, hiraditya, kristof.beyls. · View Herald TranscriptMay 3 2021, 12:16 PM

dmgreen requested review of this revision.May 3 2021, 12:16 PM

Herald added a project: Restricted Project. · View Herald TranscriptMay 3 2021, 12:16 PM

dmgreen added a parent revision: D101688: [ARM] Constrain CMPZ shift combine to a single use.May 3 2021, 12:16 PM

Harbormaster completed remote builds in B102356: Diff 342494.May 3 2021, 12:17 PM

This should go into DAGCombine.

@lebedev.ri This is a cross-block optimization, it cannot go into DAGCombine.

dmgreen mentioned this in rG9423f78240a2: [InstCombine] Fold multiuse shr eq zero.May 9 2021, 2:00 PM

Looks like a good optimisation to me. Perhaps wait a day in case others want to comment.

This revision is now accepted and ready to land.May 13 2021, 2:05 AM

nikic added inline comments.May 13 2021, 2:50 AM

llvm/lib/CodeGen/CodeGenPrepare.cpp
7710	This is going to assert for large (> 64-bit) icmps.
7731	Style nit: `Cmp->isEquality()`

Thanks. I've switched it to use APInt and added a couple of extra tests.

Harbormaster completed remote builds in B104252: Diff 345098.May 13 2021, 5:21 AM

This revision was landed with ongoing or failed builds.May 16 2021, 9:54 AM

Closed by commit rGdd5c52029d27: [CPG][ARM] Optimize towards branch on zero in codegenprepare (authored by dmgreen). · Explain Why

This revision was automatically updated to reflect the committed changes.

dmgreen added a commit: rGdd5c52029d27: [CPG][ARM] Optimize towards branch on zero in codegenprepare.

nikic mentioned this in rG9a9421a46116: Reapply [InstCombine] Fold multiuse shr eq zero.May 22 2021, 5:47 AM

liaolucy mentioned this in D142071: [RISCV] Enable preferZeroCompareBranch to optimize branch on zero in codegenprepare.Jan 18 2023, 6:23 PM

liaolucy mentioned this in rGfbace9540890: [RISCV] Enable preferZeroCompareBranch to optimize branch on zero in….Feb 27 2023, 10:43 PM

dtcxzyw mentioned this in D147789: [CodeGenPrepare][RISCV] Reverse transform in CGP to use zero-compare branch.Apr 7 2023, 7:16 AM

Revision Contents

Path

Size

llvm/

include/

llvm/

CodeGen/

TargetLowering.h

4 lines

lib/

CodeGen/

CodeGenPrepare.cpp

63 lines

Target/

ARM/

ARMISelLowering.h

2 lines

test/

CodeGen/

ARM/

branch-on-zero.ll

32 lines

Thumb2/

2010-02-11-phi-cycle.ll

34 lines

Transforms/

CodeGenPrepare/

ARM/

branch-on-zero.ll

52 lines

Diff 345714

llvm/include/llvm/CodeGen/TargetLowering.h

Show First 20 Lines • Show All 607 Lines • ▼ Show 20 Lines	public:
virtual unsigned getCustomCtpopCost(EVT VT, ISD::CondCode Cond) const {		virtual unsigned getCustomCtpopCost(EVT VT, ISD::CondCode Cond) const {
return 1;		return 1;
}		}

/// Return true if instruction generated for equality comparison is folded		/// Return true if instruction generated for equality comparison is folded
/// with instruction generated for signed comparison.		/// with instruction generated for signed comparison.
virtual bool isEqualityCmpFoldedWithSignedCmp() const { return true; }		virtual bool isEqualityCmpFoldedWithSignedCmp() const { return true; }

		/// Return true if the heuristic to prefer icmp eq zero should be used in code
		/// gen prepare.
		virtual bool preferZeroCompareBranch() const { return false; }

/// Return true if it is safe to transform an integer-domain bitwise operation		/// Return true if it is safe to transform an integer-domain bitwise operation
/// into the equivalent floating-point operation. This should be set to true		/// into the equivalent floating-point operation. This should be set to true
/// if the target has IEEE-754-compliant fabs/fneg operations for the input		/// if the target has IEEE-754-compliant fabs/fneg operations for the input
/// type.		/// type.
virtual bool hasBitPreservingFPLogic(EVT VT) const {		virtual bool hasBitPreservingFPLogic(EVT VT) const {
return false;		return false;
}		}

▲ Show 20 Lines • Show All 4,026 Lines • Show Last 20 Lines

llvm/lib/CodeGen/CodeGenPrepare.cpp

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 7,682 Lines • ▼ Show 20 Lines	static bool tryUnmergingGEPsAcrossIndirectBr(GetElementPtrInst *GEPI,
// After unmerging, verify that GEPIOp is actually only used in SrcBlock (not		// After unmerging, verify that GEPIOp is actually only used in SrcBlock (not
// alive on IndirectBr edges).		// alive on IndirectBr edges).
assert(find_if(GEPIOp->users(), [&](User *Usr) {		assert(find_if(GEPIOp->users(), [&](User *Usr) {
return cast<Instruction>(Usr)->getParent() != SrcBlock;		return cast<Instruction>(Usr)->getParent() != SrcBlock;
}) == GEPIOp->users().end() && "GEPIOp is used outside SrcBlock");		}) == GEPIOp->users().end() && "GEPIOp is used outside SrcBlock");
return true;		return true;
}		}

		static bool optimizeBranch(BranchInst *Branch, const TargetLowering &TLI) {
		// Try and convert
		// %c = icmp ult %x, 8
		// br %c, bla, blb
		// %tc = lshr %x, 3
		// to
		// %tc = lshr %x, 3
		// %c = icmp eq %tc, 0
		// br %c, bla, blb
		// Creating the cmp to zero can be better for the backend, especially if the
		// lshr produces flags that can be used automatically.
		if (!TLI.preferZeroCompareBranch() \|\| !Branch->isConditional())
		return false;

		ICmpInst *Cmp = dyn_cast<ICmpInst>(Branch->getCondition());
		if (!Cmp \|\| !isa<ConstantInt>(Cmp->getOperand(1)) \|\| !Cmp->hasOneUse())
		return false;

		Value *X = Cmp->getOperand(0);
		APInt CmpC = cast<ConstantInt>(Cmp->getOperand(1))->getValue();
		nikicUnsubmitted Not Done Reply Inline Actions This is going to assert for large (> 64-bit) icmps. nikic: This is going to assert for large (> 64-bit) icmps.

		for (auto *U : X->users()) {
		Instruction *UI = dyn_cast<Instruction>(U);
		// A quick dominance check
		if (!UI \|\|
		(UI->getParent() != Branch->getParent() &&
		UI->getParent() != Branch->getSuccessor(0) &&
		UI->getParent() != Branch->getSuccessor(1)) \|\|
		(UI->getParent() != Branch->getParent() &&
		!UI->getParent()->getSinglePredecessor()))
		continue;

		if (CmpC.isPowerOf2() && Cmp->getPredicate() == ICmpInst::ICMP_ULT &&
		match(UI, m_Shr(m_Specific(X), m_SpecificInt(CmpC.logBase2())))) {
		IRBuilder<> Builder(Branch);
		if (UI->getParent() != Branch->getParent())
		UI->moveBefore(Branch);
		Value *NewCmp = Builder.CreateCmp(ICmpInst::ICMP_EQ, UI,
		ConstantInt::get(UI->getType(), 0));
		LLVM_DEBUG(dbgs() << "Converting " << *Cmp << "\n");
		LLVM_DEBUG(dbgs() << " to compare on zero: " << *NewCmp << "\n");
		nikicUnsubmitted Not Done Reply Inline Actions Style nit: `Cmp->isEquality()` nikic: Style nit: `Cmp->isEquality()`
		Cmp->replaceAllUsesWith(NewCmp);
		return true;
		}
		if (Cmp->isEquality() &&
		(match(UI, m_Add(m_Specific(X), m_SpecificInt(-CmpC))) \|\|
		match(UI, m_Sub(m_Specific(X), m_SpecificInt(CmpC))))) {
		IRBuilder<> Builder(Branch);
		if (UI->getParent() != Branch->getParent())
		UI->moveBefore(Branch);
		Value *NewCmp = Builder.CreateCmp(Cmp->getPredicate(), UI,
		ConstantInt::get(UI->getType(), 0));
		LLVM_DEBUG(dbgs() << "Converting " << *Cmp << "\n");
		LLVM_DEBUG(dbgs() << " to compare on zero: " << *NewCmp << "\n");
		Cmp->replaceAllUsesWith(NewCmp);
		return true;
		}
		}
		return false;
		}

bool CodeGenPrepare::optimizeInst(Instruction *I, bool &ModifiedDT) {		bool CodeGenPrepare::optimizeInst(Instruction *I, bool &ModifiedDT) {
// Bail out if we inserted the instruction to prevent optimizations from		// Bail out if we inserted the instruction to prevent optimizations from
// stepping on each other's toes.		// stepping on each other's toes.
if (InsertedInsts.count(I))		if (InsertedInsts.count(I))
return false;		return false;

// TODO: Move into the switch on opcode below here.		// TODO: Move into the switch on opcode below here.
if (PHINode *P = dyn_cast<PHINode>(I)) {		if (PHINode *P = dyn_cast<PHINode>(I)) {
▲ Show 20 Lines • Show All 145 Lines • ▼ Show 20 Lines	bool CodeGenPrepare::optimizeInst(Instruction *I, bool &ModifiedDT) {
case Instruction::Select:		case Instruction::Select:
return optimizeSelectInst(cast<SelectInst>(I));		return optimizeSelectInst(cast<SelectInst>(I));
case Instruction::ShuffleVector:		case Instruction::ShuffleVector:
return optimizeShuffleVectorInst(cast<ShuffleVectorInst>(I));		return optimizeShuffleVectorInst(cast<ShuffleVectorInst>(I));
case Instruction::Switch:		case Instruction::Switch:
return optimizeSwitchInst(cast<SwitchInst>(I));		return optimizeSwitchInst(cast<SwitchInst>(I));
case Instruction::ExtractElement:		case Instruction::ExtractElement:
return optimizeExtractElementInst(cast<ExtractElementInst>(I));		return optimizeExtractElementInst(cast<ExtractElementInst>(I));
		case Instruction::Br:
		return optimizeBranch(cast<BranchInst>(I), *TLI);
}		}

return false;		return false;
}		}

/// Given an OR instruction, check to see if this is a bitreverse		/// Given an OR instruction, check to see if this is a bitreverse
/// idiom. If so, insert the new intrinsic and return true.		/// idiom. If so, insert the new intrinsic and return true.
bool CodeGenPrepare::makeBitReverse(Instruction &I) {		bool CodeGenPrepare::makeBitReverse(Instruction &I) {
▲ Show 20 Lines • Show All 357 Lines • Show Last 20 Lines

llvm/lib/Target/ARM/ARMISelLowering.h

Show First 20 Lines • Show All 567 Lines • ▼ Show 20 Lines	public:

/// createFastISel - This method returns a target specific FastISel object,		/// createFastISel - This method returns a target specific FastISel object,
/// or null if the target does not support "fast" ISel.		/// or null if the target does not support "fast" ISel.
FastISel *createFastISel(FunctionLoweringInfo &funcInfo,		FastISel *createFastISel(FunctionLoweringInfo &funcInfo,
const TargetLibraryInfo *libInfo) const override;		const TargetLibraryInfo *libInfo) const override;

Sched::Preference getSchedulingPreference(SDNode *N) const override;		Sched::Preference getSchedulingPreference(SDNode *N) const override;

		bool preferZeroCompareBranch() const override { return true; }

bool		bool
isShuffleMaskLegal(ArrayRef<int> M, EVT VT) const override;		isShuffleMaskLegal(ArrayRef<int> M, EVT VT) const override;
bool isOffsetFoldingLegal(const GlobalAddressSDNode *GA) const override;		bool isOffsetFoldingLegal(const GlobalAddressSDNode *GA) const override;

/// isFPImmLegal - Returns true if the target can instruction select the		/// isFPImmLegal - Returns true if the target can instruction select the
/// specified FP immediate natively. If false, the legalizer will		/// specified FP immediate natively. If false, the legalizer will
/// materialize the FP immediate as a load from a constant pool.		/// materialize the FP immediate as a load from a constant pool.
bool isFPImmLegal(const APFloat &Imm, EVT VT,		bool isFPImmLegal(const APFloat &Imm, EVT VT,
▲ Show 20 Lines • Show All 384 Lines • Show Last 20 Lines

llvm/test/CodeGen/ARM/branch-on-zero.ll

	Show First 20 Lines • Show All 90 Lines • ▼ Show 20 Lines

	while.end: ; preds = %while.body, %entry			while.end: ; preds = %while.body, %entry
	ret i32 0			ret i32 0
	}			}

	define i32 @test_lshr2(i32* nocapture %x, i32* nocapture readonly %y, i32 %n) {			define i32 @test_lshr2(i32* nocapture %x, i32* nocapture readonly %y, i32 %n) {
	; CHECK-V6M-LABEL: test_lshr2:			; CHECK-V6M-LABEL: test_lshr2:
	; CHECK-V6M: @ %bb.0: @ %entry			; CHECK-V6M: @ %bb.0: @ %entry
	; CHECK-V6M-NEXT: cmp r2, #4
	; CHECK-V6M-NEXT: blo .LBB1_3
	; CHECK-V6M-NEXT: @ %bb.1: @ %while.body.preheader
	; CHECK-V6M-NEXT: lsrs r2, r2, #2			; CHECK-V6M-NEXT: lsrs r2, r2, #2
	; CHECK-V6M-NEXT: .LBB1_2: @ %while.body			; CHECK-V6M-NEXT: beq .LBB1_2
				; CHECK-V6M-NEXT: .LBB1_1: @ %while.body
	; CHECK-V6M-NEXT: @ =>This Inner Loop Header: Depth=1			; CHECK-V6M-NEXT: @ =>This Inner Loop Header: Depth=1
	; CHECK-V6M-NEXT: ldm r1!, {r3}			; CHECK-V6M-NEXT: ldm r1!, {r3}
	; CHECK-V6M-NEXT: lsls r3, r3, #1			; CHECK-V6M-NEXT: lsls r3, r3, #1
	; CHECK-V6M-NEXT: stm r0!, {r3}			; CHECK-V6M-NEXT: stm r0!, {r3}
	; CHECK-V6M-NEXT: subs r2, r2, #1			; CHECK-V6M-NEXT: subs r2, r2, #1
	; CHECK-V6M-NEXT: bne .LBB1_2			; CHECK-V6M-NEXT: bne .LBB1_1
	; CHECK-V6M-NEXT: .LBB1_3: @ %while.end			; CHECK-V6M-NEXT: .LBB1_2: @ %while.end
	; CHECK-V6M-NEXT: movs r0, #0			; CHECK-V6M-NEXT: movs r0, #0
	; CHECK-V6M-NEXT: bx lr			; CHECK-V6M-NEXT: bx lr
	;			;
	; CHECK-V7M-LABEL: test_lshr2:			; CHECK-V7M-LABEL: test_lshr2:
	; CHECK-V7M: @ %bb.0: @ %entry			; CHECK-V7M: @ %bb.0: @ %entry
	; CHECK-V7M-NEXT: cmp r2, #4			; CHECK-V7M-NEXT: lsrs r2, r2, #2
	; CHECK-V7M-NEXT: blo .LBB1_3			; CHECK-V7M-NEXT: beq .LBB1_3
	; CHECK-V7M-NEXT: @ %bb.1: @ %while.body.preheader			; CHECK-V7M-NEXT: @ %bb.1: @ %while.body.preheader
	; CHECK-V7M-NEXT: subs r1, #4			; CHECK-V7M-NEXT: subs r1, #4
	; CHECK-V7M-NEXT: subs r0, #4			; CHECK-V7M-NEXT: subs r0, #4
	; CHECK-V7M-NEXT: lsrs r2, r2, #2
	; CHECK-V7M-NEXT: .LBB1_2: @ %while.body			; CHECK-V7M-NEXT: .LBB1_2: @ %while.body
	; CHECK-V7M-NEXT: @ =>This Inner Loop Header: Depth=1			; CHECK-V7M-NEXT: @ =>This Inner Loop Header: Depth=1
	; CHECK-V7M-NEXT: ldr r3, [r1, #4]!			; CHECK-V7M-NEXT: ldr r3, [r1, #4]!
	; CHECK-V7M-NEXT: subs r2, #1			; CHECK-V7M-NEXT: subs r2, #1
	; CHECK-V7M-NEXT: lsl.w r3, r3, #1			; CHECK-V7M-NEXT: lsl.w r3, r3, #1
	; CHECK-V7M-NEXT: str r3, [r0, #4]!			; CHECK-V7M-NEXT: str r3, [r0, #4]!
	; CHECK-V7M-NEXT: bne .LBB1_2			; CHECK-V7M-NEXT: bne .LBB1_2
	; CHECK-V7M-NEXT: .LBB1_3: @ %while.end			; CHECK-V7M-NEXT: .LBB1_3: @ %while.end
	; CHECK-V7M-NEXT: movs r0, #0			; CHECK-V7M-NEXT: movs r0, #0
	; CHECK-V7M-NEXT: bx lr			; CHECK-V7M-NEXT: bx lr
	;			;
	; CHECK-V81M-LABEL: test_lshr2:			; CHECK-V81M-LABEL: test_lshr2:
	; CHECK-V81M: @ %bb.0: @ %entry			; CHECK-V81M: @ %bb.0: @ %entry
	; CHECK-V81M-NEXT: .save {r7, lr}			; CHECK-V81M-NEXT: .save {r7, lr}
	; CHECK-V81M-NEXT: push {r7, lr}			; CHECK-V81M-NEXT: push {r7, lr}
	; CHECK-V81M-NEXT: cmp r2, #4			; CHECK-V81M-NEXT: lsrs r2, r2, #2
	; CHECK-V81M-NEXT: blo .LBB1_3			; CHECK-V81M-NEXT: wls lr, r2, .LBB1_2
	; CHECK-V81M-NEXT: @ %bb.1: @ %while.body.preheader			; CHECK-V81M-NEXT: .LBB1_1: @ %while.body
	; CHECK-V81M-NEXT: lsr.w lr, r2, #2
	; CHECK-V81M-NEXT: .LBB1_2: @ %while.body
	; CHECK-V81M-NEXT: @ =>This Inner Loop Header: Depth=1			; CHECK-V81M-NEXT: @ =>This Inner Loop Header: Depth=1
	; CHECK-V81M-NEXT: ldr r2, [r1], #4			; CHECK-V81M-NEXT: ldr r2, [r1], #4
	; CHECK-V81M-NEXT: lsls r2, r2, #1			; CHECK-V81M-NEXT: lsls r2, r2, #1
	; CHECK-V81M-NEXT: str r2, [r0], #4			; CHECK-V81M-NEXT: str r2, [r0], #4
	; CHECK-V81M-NEXT: le lr, .LBB1_2			; CHECK-V81M-NEXT: le lr, .LBB1_1
	; CHECK-V81M-NEXT: .LBB1_3: @ %while.end			; CHECK-V81M-NEXT: .LBB1_2: @ %while.end
	; CHECK-V81M-NEXT: movs r0, #0			; CHECK-V81M-NEXT: movs r0, #0
	; CHECK-V81M-NEXT: pop {r7, pc}			; CHECK-V81M-NEXT: pop {r7, pc}
	;			;
	; CHECK-V7A-LABEL: test_lshr2:			; CHECK-V7A-LABEL: test_lshr2:
	; CHECK-V7A: @ %bb.0: @ %entry			; CHECK-V7A: @ %bb.0: @ %entry
	; CHECK-V7A-NEXT: cmp r2, #4			; CHECK-V7A-NEXT: mov r3, #0
	; CHECK-V7A-NEXT: blo .LBB1_3			; CHECK-V7A-NEXT: cmp r3, r2, lsr #2
				; CHECK-V7A-NEXT: beq .LBB1_3
	; CHECK-V7A-NEXT: @ %bb.1: @ %while.body.preheader			; CHECK-V7A-NEXT: @ %bb.1: @ %while.body.preheader
	; CHECK-V7A-NEXT: lsr r2, r2, #2			; CHECK-V7A-NEXT: lsr r2, r2, #2
	; CHECK-V7A-NEXT: .LBB1_2: @ %while.body			; CHECK-V7A-NEXT: .LBB1_2: @ %while.body
	; CHECK-V7A-NEXT: @ =>This Inner Loop Header: Depth=1			; CHECK-V7A-NEXT: @ =>This Inner Loop Header: Depth=1
	; CHECK-V7A-NEXT: ldr r3, [r1], #4			; CHECK-V7A-NEXT: ldr r3, [r1], #4
	; CHECK-V7A-NEXT: subs r2, r2, #1			; CHECK-V7A-NEXT: subs r2, r2, #1
	; CHECK-V7A-NEXT: lsl r3, r3, #1			; CHECK-V7A-NEXT: lsl r3, r3, #1
	; CHECK-V7A-NEXT: str r3, [r0], #4			; CHECK-V7A-NEXT: str r3, [r0], #4
	Show All 29 Lines

llvm/test/CodeGen/Thumb2/2010-02-11-phi-cycle.ll

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: llc < %s -mtriple=thumbv7-none-eabi \| FileCheck %s			; RUN: llc < %s -mtriple=thumbv7-none-eabi \| FileCheck %s
	target datalayout = "e-p:32:32:32-i1:8:32-i8:8:32-i16:16:32-i32:32:32-i64:32:32-f32:32:32-f64:32:32-v64:64:64-v128:128:128-a0:0:32-n32"			target datalayout = "e-p:32:32:32-i1:8:32-i8:8:32-i16:16:32-i32:32:32-i64:32:32-f32:32:32-f64:32:32-v64:64:64-v128:128:128-a0:0:32-n32"

	define i32 @test(i32 %n) nounwind {			define i32 @test(i32 %n) nounwind {
	; CHECK-LABEL: test:			; CHECK-LABEL: test:
	; CHECK: @ %bb.0: @ %entry			; CHECK: @ %bb.0: @ %entry
	; CHECK-NEXT: .save {r4, lr}			; CHECK-NEXT: .save {r4, lr}
	; CHECK-NEXT: push {r4, lr}			; CHECK-NEXT: push {r4, lr}
	; CHECK-NEXT: cmp r0, #1			; CHECK-NEXT: subs r4, r0, #1
	; CHECK-NEXT: it eq			; CHECK-NEXT: it eq
	; CHECK-NEXT: popeq {r4, pc}			; CHECK-NEXT: popeq {r4, pc}
	; CHECK-NEXT: .LBB0_1: @ %bb.nph			; CHECK-NEXT: .LBB0_1: @ %bb
	; CHECK-NEXT: subs r4, r0, #1
	; CHECK-NEXT: .LBB0_2: @ %bb
	; CHECK-NEXT: @ =>This Inner Loop Header: Depth=1			; CHECK-NEXT: @ =>This Inner Loop Header: Depth=1
	; CHECK-NEXT: bl f			; CHECK-NEXT: bl f
	; CHECK-NEXT: bl g			; CHECK-NEXT: bl g
	; CHECK-NEXT: subs r4, #1			; CHECK-NEXT: subs r4, #1
	; CHECK-NEXT: bne .LBB0_2			; CHECK-NEXT: bne .LBB0_1
	; CHECK-NEXT: @ %bb.3: @ %return			; CHECK-NEXT: @ %bb.2: @ %return
	; CHECK-NEXT: pop {r4, pc}			; CHECK-NEXT: pop {r4, pc}
	entry:			entry:
	%0 = icmp eq i32 %n, 1 ; <i1> [#uses=1]			%0 = icmp eq i32 %n, 1 ; <i1> [#uses=1]
	br i1 %0, label %return, label %bb.nph			br i1 %0, label %return, label %bb.nph

	bb.nph: ; preds = %entry			bb.nph: ; preds = %entry
	%tmp = add i32 %n, -1 ; <i32> [#uses=1]			%tmp = add i32 %n, -1 ; <i32> [#uses=1]
	br label %bb			br label %bb
	Show All 15 Lines
	}			}

	define i32 @test_dead_cycle(i32 %n) nounwind {			define i32 @test_dead_cycle(i32 %n) nounwind {
	; also check for duplicate induction variables (radar 7645034)			; also check for duplicate induction variables (radar 7645034)
	; CHECK-LABEL: test_dead_cycle:			; CHECK-LABEL: test_dead_cycle:
	; CHECK: @ %bb.0: @ %entry			; CHECK: @ %bb.0: @ %entry
	; CHECK-NEXT: .save {r4, lr}			; CHECK-NEXT: .save {r4, lr}
	; CHECK-NEXT: push {r4, lr}			; CHECK-NEXT: push {r4, lr}
	; CHECK-NEXT: cmp r0, #1			; CHECK-NEXT: subs r4, r0, #1
	; CHECK-NEXT: it eq			; CHECK-NEXT: it eq
	; CHECK-NEXT: popeq {r4, pc}			; CHECK-NEXT: popeq {r4, pc}
	; CHECK-NEXT: .LBB1_1: @ %bb.nph			; CHECK-NEXT: .LBB1_1: @ %bb
	; CHECK-NEXT: subs r4, r0, #1
	; CHECK-NEXT: b .LBB1_3
	; CHECK-NEXT: .LBB1_2: @ %bb2
	; CHECK-NEXT: @ in Loop: Header=BB1_3 Depth=1
	; CHECK-NEXT: subs r4, #1
	; CHECK-NEXT: beq .LBB1_5
	; CHECK-NEXT: .LBB1_3: @ %bb
	; CHECK-NEXT: @ =>This Inner Loop Header: Depth=1			; CHECK-NEXT: @ =>This Inner Loop Header: Depth=1
	; CHECK-NEXT: cmp r4, #2			; CHECK-NEXT: cmp r4, #2
	; CHECK-NEXT: blt .LBB1_2			; CHECK-NEXT: blt .LBB1_3
	; CHECK-NEXT: @ %bb.4: @ %bb1			; CHECK-NEXT: @ %bb.2: @ %bb1
	; CHECK-NEXT: @ in Loop: Header=BB1_3 Depth=1			; CHECK-NEXT: @ in Loop: Header=BB1_1 Depth=1
	; CHECK-NEXT: bl f			; CHECK-NEXT: bl f
	; CHECK-NEXT: bl g			; CHECK-NEXT: bl g
	; CHECK-NEXT: b .LBB1_2			; CHECK-NEXT: .LBB1_3: @ %bb2
	; CHECK-NEXT: .LBB1_5: @ %return			; CHECK-NEXT: @ in Loop: Header=BB1_1 Depth=1
				; CHECK-NEXT: subs r4, #1
				; CHECK-NEXT: bne .LBB1_1
				; CHECK-NEXT: @ %bb.4: @ %return
	; CHECK-NEXT: pop {r4, pc}			; CHECK-NEXT: pop {r4, pc}
	entry:			entry:
	%0 = icmp eq i32 %n, 1 ; <i1> [#uses=1]			%0 = icmp eq i32 %n, 1 ; <i1> [#uses=1]
	br i1 %0, label %return, label %bb.nph			br i1 %0, label %return, label %bb.nph

	bb.nph: ; preds = %entry			bb.nph: ; preds = %entry
	%tmp = add i32 %n, -1 ; <i32> [#uses=2]			%tmp = add i32 %n, -1 ; <i32> [#uses=2]
	br label %bb			br label %bb
	Show All 29 Lines

llvm/test/Transforms/CodeGenPrepare/ARM/branch-on-zero.ll

	; NOTE: Assertions have been autogenerated by utils/update_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_test_checks.py
	; RUN: opt -S -codegenprepare < %s \| FileCheck %s			; RUN: opt -S -codegenprepare < %s \| FileCheck %s

	target datalayout = "e-m:e-p:32:32-i64:64-v128:64:128-a:0:32-n32-S64"			target datalayout = "e-m:e-p:32:32-i64:64-v128:64:128-a:0:32-n32-S64"
	target triple = "thumbv8.1m.main-none-eabi"			target triple = "thumbv8.1m.main-none-eabi"

	define i32 @lshr3_then(i32 %a) {			define i32 @lshr3_then(i32 %a) {
	; CHECK-LABEL: @lshr3_then(			; CHECK-LABEL: @lshr3_then(
	; CHECK-NEXT: entry:			; CHECK-NEXT: entry:
	; CHECK-NEXT: [[C:%.]] = icmp ult i32 [[A:%.]], 8			; CHECK-NEXT: [[L:%.]] = lshr i32 [[A:%.]], 3
	; CHECK-NEXT: br i1 [[C]], label [[THEN:%.]], label [[ELSE:%.]]			; CHECK-NEXT: [[TMP0:%.*]] = icmp eq i32 [[L]], 0
				; CHECK-NEXT: br i1 [[TMP0]], label [[THEN:%.]], label [[ELSE:%.]]
	; CHECK: then:			; CHECK: then:
	; CHECK-NEXT: ret i32 0			; CHECK-NEXT: ret i32 0
	; CHECK: else:			; CHECK: else:
	; CHECK-NEXT: [[L:%.*]] = lshr i32 [[A]], 3
	; CHECK-NEXT: ret i32 [[L]]			; CHECK-NEXT: ret i32 [[L]]
	;			;
	entry:			entry:
	%c = icmp ult i32 %a, 8			%c = icmp ult i32 %a, 8
	br i1 %c, label %then, label %else			br i1 %c, label %then, label %else

	then:			then:
	ret i32 0			ret i32 0

	else:			else:
	%l = lshr i32 %a, 3			%l = lshr i32 %a, 3
	ret i32 %l			ret i32 %l
	}			}

	define i32 @lshr5_else(i32 %a) {			define i32 @lshr5_else(i32 %a) {
	; CHECK-LABEL: @lshr5_else(			; CHECK-LABEL: @lshr5_else(
	; CHECK-NEXT: entry:			; CHECK-NEXT: entry:
	; CHECK-NEXT: [[C:%.]] = icmp ult i32 [[A:%.]], 32			; CHECK-NEXT: [[L:%.]] = lshr i32 [[A:%.]], 5
	; CHECK-NEXT: br i1 [[C]], label [[THEN:%.]], label [[ELSE:%.]]			; CHECK-NEXT: [[TMP0:%.*]] = icmp eq i32 [[L]], 0
				; CHECK-NEXT: br i1 [[TMP0]], label [[THEN:%.]], label [[ELSE:%.]]
	; CHECK: then:			; CHECK: then:
	; CHECK-NEXT: [[L:%.*]] = lshr i32 [[A]], 5
	; CHECK-NEXT: ret i32 [[L]]			; CHECK-NEXT: ret i32 [[L]]
	; CHECK: else:			; CHECK: else:
	; CHECK-NEXT: ret i32 0			; CHECK-NEXT: ret i32 0
	;			;
	entry:			entry:
	%c = icmp ult i32 %a, 32			%c = icmp ult i32 %a, 32
	br i1 %c, label %then, label %else			br i1 %c, label %then, label %else

	then:			then:
	%l = lshr i32 %a, 5			%l = lshr i32 %a, 5
	ret i32 %l			ret i32 %l

	else:			else:
	ret i32 0			ret i32 0
	}			}

	define i32 @lshr2_entry(i32 %a) {			define i32 @lshr2_entry(i32 %a) {
	; CHECK-LABEL: @lshr2_entry(			; CHECK-LABEL: @lshr2_entry(
	; CHECK-NEXT: entry:			; CHECK-NEXT: entry:
	; CHECK-NEXT: [[L:%.]] = lshr i32 [[A:%.]], 1			; CHECK-NEXT: [[L:%.]] = lshr i32 [[A:%.]], 1
	; CHECK-NEXT: [[C:%.*]] = icmp ult i32 [[A]], 2			; CHECK-NEXT: [[TMP0:%.*]] = icmp eq i32 [[L]], 0
	; CHECK-NEXT: br i1 [[C]], label [[THEN:%.]], label [[ELSE:%.]]			; CHECK-NEXT: br i1 [[TMP0]], label [[THEN:%.]], label [[ELSE:%.]]
	; CHECK: then:			; CHECK: then:
	; CHECK-NEXT: ret i32 [[L]]			; CHECK-NEXT: ret i32 [[L]]
	; CHECK: else:			; CHECK: else:
	; CHECK-NEXT: ret i32 0			; CHECK-NEXT: ret i32 0
	;			;
	entry:			entry:
	%l = lshr i32 %a, 1			%l = lshr i32 %a, 1
	%c = icmp ult i32 %a, 2			%c = icmp ult i32 %a, 2
	Show All 27 Lines

	else:			else:
	ret i32 0			ret i32 0
	}			}

	define i32 @ashr5_else(i32 %a) {			define i32 @ashr5_else(i32 %a) {
	; CHECK-LABEL: @ashr5_else(			; CHECK-LABEL: @ashr5_else(
	; CHECK-NEXT: entry:			; CHECK-NEXT: entry:
	; CHECK-NEXT: [[C:%.]] = icmp ult i32 [[A:%.]], 32			; CHECK-NEXT: [[L:%.]] = ashr i32 [[A:%.]], 5
	; CHECK-NEXT: br i1 [[C]], label [[THEN:%.]], label [[ELSE:%.]]			; CHECK-NEXT: [[TMP0:%.*]] = icmp eq i32 [[L]], 0
				; CHECK-NEXT: br i1 [[TMP0]], label [[THEN:%.]], label [[ELSE:%.]]
	; CHECK: then:			; CHECK: then:
	; CHECK-NEXT: [[L:%.*]] = ashr i32 [[A]], 5
	; CHECK-NEXT: ret i32 [[L]]			; CHECK-NEXT: ret i32 [[L]]
	; CHECK: else:			; CHECK: else:
	; CHECK-NEXT: ret i32 0			; CHECK-NEXT: ret i32 0
	;			;
	entry:			entry:
	%c = icmp ult i32 %a, 32			%c = icmp ult i32 %a, 32
	br i1 %c, label %then, label %else			br i1 %c, label %then, label %else

	Show All 26 Lines
	else:			else:
	%l = add i32 %a, 10			%l = add i32 %a, 10
	ret i32 %l			ret i32 %l
	}			}

	define i32 @addm10_then(i32 %a) {			define i32 @addm10_then(i32 %a) {
	; CHECK-LABEL: @addm10_then(			; CHECK-LABEL: @addm10_then(
	; CHECK-NEXT: entry:			; CHECK-NEXT: entry:
	; CHECK-NEXT: [[C:%.]] = icmp eq i32 [[A:%.]], 10			; CHECK-NEXT: [[L:%.]] = add i32 [[A:%.]], -10
	; CHECK-NEXT: br i1 [[C]], label [[THEN:%.]], label [[ELSE:%.]]			; CHECK-NEXT: [[TMP0:%.*]] = icmp eq i32 [[L]], 0
				; CHECK-NEXT: br i1 [[TMP0]], label [[THEN:%.]], label [[ELSE:%.]]
	; CHECK: then:			; CHECK: then:
	; CHECK-NEXT: [[L:%.*]] = add i32 [[A]], -10
	; CHECK-NEXT: ret i32 [[L]]			; CHECK-NEXT: ret i32 [[L]]
	; CHECK: else:			; CHECK: else:
	; CHECK-NEXT: ret i32 0			; CHECK-NEXT: ret i32 0
	;			;
	entry:			entry:
	%c = icmp eq i32 %a, 10			%c = icmp eq i32 %a, 10
	br i1 %c, label %then, label %else			br i1 %c, label %then, label %else

	Show All 26 Lines

	else:			else:
	ret i32 0			ret i32 0
	}			}

	define i32 @sub10_else(i32 %a) {			define i32 @sub10_else(i32 %a) {
	; CHECK-LABEL: @sub10_else(			; CHECK-LABEL: @sub10_else(
	; CHECK-NEXT: entry:			; CHECK-NEXT: entry:
	; CHECK-NEXT: [[C:%.]] = icmp eq i32 [[A:%.]], 10			; CHECK-NEXT: [[L:%.]] = sub i32 [[A:%.]], 10
	; CHECK-NEXT: br i1 [[C]], label [[THEN:%.]], label [[ELSE:%.]]			; CHECK-NEXT: [[TMP0:%.*]] = icmp eq i32 [[L]], 0
				; CHECK-NEXT: br i1 [[TMP0]], label [[THEN:%.]], label [[ELSE:%.]]
	; CHECK: then:			; CHECK: then:
	; CHECK-NEXT: ret i32 0			; CHECK-NEXT: ret i32 0
	; CHECK: else:			; CHECK: else:
	; CHECK-NEXT: [[L:%.*]] = sub i32 [[A]], 10
	; CHECK-NEXT: ret i32 [[L]]			; CHECK-NEXT: ret i32 [[L]]
	;			;
	entry:			entry:
	%c = icmp eq i32 %a, 10			%c = icmp eq i32 %a, 10
	br i1 %c, label %then, label %else			br i1 %c, label %then, label %else

	then:			then:
	ret i32 0			ret i32 0

	else:			else:
	%l = sub i32 %a, 10			%l = sub i32 %a, 10
	ret i32 %l			ret i32 %l
	}			}

	define i32 @subm10_then(i32 %a) {			define i32 @subm10_then(i32 %a) {
	; CHECK-LABEL: @subm10_then(			; CHECK-LABEL: @subm10_then(
	; CHECK-NEXT: entry:			; CHECK-NEXT: entry:
	; CHECK-NEXT: [[C:%.]] = icmp eq i32 [[A:%.]], -10			; CHECK-NEXT: [[L:%.]] = sub i32 [[A:%.]], -10
	; CHECK-NEXT: br i1 [[C]], label [[THEN:%.]], label [[ELSE:%.]]			; CHECK-NEXT: [[TMP0:%.*]] = icmp eq i32 [[L]], 0
				; CHECK-NEXT: br i1 [[TMP0]], label [[THEN:%.]], label [[ELSE:%.]]
	; CHECK: then:			; CHECK: then:
	; CHECK-NEXT: [[L:%.*]] = sub i32 [[A]], -10
	; CHECK-NEXT: ret i32 [[L]]			; CHECK-NEXT: ret i32 [[L]]
	; CHECK: else:			; CHECK: else:
	; CHECK-NEXT: ret i32 0			; CHECK-NEXT: ret i32 0
	;			;
	entry:			entry:
	%c = icmp eq i32 %a, -10			%c = icmp eq i32 %a, -10
	br i1 %c, label %then, label %else			br i1 %c, label %then, label %else

	then:			then:
	%l = sub i32 %a, -10			%l = sub i32 %a, -10
	ret i32 %l			ret i32 %l

	else:			else:
	ret i32 0			ret i32 0
	}			}

	define i64 @lshr64(i64 %a) {			define i64 @lshr64(i64 %a) {
	; CHECK-LABEL: @lshr64(			; CHECK-LABEL: @lshr64(
	; CHECK-NEXT: entry:			; CHECK-NEXT: entry:
	; CHECK-NEXT: [[C:%.]] = icmp ult i64 [[A:%.]], 1099511627776			; CHECK-NEXT: [[L:%.]] = lshr i64 [[A:%.]], 40
	; CHECK-NEXT: br i1 [[C]], label [[THEN:%.]], label [[ELSE:%.]]			; CHECK-NEXT: [[TMP0:%.*]] = icmp eq i64 [[L]], 0
				; CHECK-NEXT: br i1 [[TMP0]], label [[THEN:%.]], label [[ELSE:%.]]
	; CHECK: then:			; CHECK: then:
	; CHECK-NEXT: ret i64 0			; CHECK-NEXT: ret i64 0
	; CHECK: else:			; CHECK: else:
	; CHECK-NEXT: [[L:%.*]] = lshr i64 [[A]], 40
	; CHECK-NEXT: ret i64 [[L]]			; CHECK-NEXT: ret i64 [[L]]
	;			;
	entry:			entry:
	%c = icmp ult i64 %a, 1099511627776			%c = icmp ult i64 %a, 1099511627776
	br i1 %c, label %then, label %else			br i1 %c, label %then, label %else

	then:			then:
	ret i64 0			ret i64 0

	else:			else:
	%l = lshr i64 %a, 40			%l = lshr i64 %a, 40
	ret i64 %l			ret i64 %l
	}			}

	define i128 @lshr128(i128 %a) {			define i128 @lshr128(i128 %a) {
	; CHECK-LABEL: @lshr128(			; CHECK-LABEL: @lshr128(
	; CHECK-NEXT: entry:			; CHECK-NEXT: entry:
	; CHECK-NEXT: [[C:%.]] = icmp ult i128 [[A:%.]], 36893488147419103232			; CHECK-NEXT: [[L:%.]] = lshr i128 [[A:%.]], 65
	; CHECK-NEXT: br i1 [[C]], label [[THEN:%.]], label [[ELSE:%.]]			; CHECK-NEXT: [[TMP0:%.*]] = icmp eq i128 [[L]], 0
				; CHECK-NEXT: br i1 [[TMP0]], label [[THEN:%.]], label [[ELSE:%.]]
	; CHECK: then:			; CHECK: then:
	; CHECK-NEXT: ret i128 0			; CHECK-NEXT: ret i128 0
	; CHECK: else:			; CHECK: else:
	; CHECK-NEXT: [[L:%.*]] = lshr i128 [[A]], 65
	; CHECK-NEXT: ret i128 [[L]]			; CHECK-NEXT: ret i128 [[L]]
	;			;
	entry:			entry:
	%c = icmp ult i128 %a, 36893488147419103232			%c = icmp ult i128 %a, 36893488147419103232
	br i1 %c, label %then, label %else			br i1 %c, label %then, label %else

	then:			then:
	ret i128 0			ret i128 0
	Show All 37 Lines

This is an archive of the discontinued LLVM Phabricator instance.

[CPG][ARM] Optimize towards branch on zero in codegenprepareClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 345714

llvm/include/llvm/CodeGen/TargetLowering.h

llvm/lib/CodeGen/CodeGenPrepare.cpp

llvm/lib/Target/ARM/ARMISelLowering.h

llvm/test/CodeGen/ARM/branch-on-zero.ll

llvm/test/CodeGen/Thumb2/2010-02-11-phi-cycle.ll

llvm/test/Transforms/CodeGenPrepare/ARM/branch-on-zero.ll

[CPG][ARM] Optimize towards branch on zero in codegenprepare
ClosedPublic