Diff 195763

llvm/lib/Transforms/Scalar/LoopPredication.cpp

Show First 20 Lines • Show All 172 Lines • ▼ Show 20 Lines
// For uge condition the widened condition is:		// For uge condition the widened condition is:
// guardStart u< guardLimit && latchLimit u> 1.		// guardStart u< guardLimit && latchLimit u> 1.
// For sge condition the widened condition is:		// For sge condition the widened condition is:
// guardStart u< guardLimit && latchLimit s> 1.		// guardStart u< guardLimit && latchLimit s> 1.
//===----------------------------------------------------------------------===//		//===----------------------------------------------------------------------===//

#include "llvm/Transforms/Scalar/LoopPredication.h"		#include "llvm/Transforms/Scalar/LoopPredication.h"
#include "llvm/ADT/Statistic.h"		#include "llvm/ADT/Statistic.h"
		#include "llvm/Analysis/AliasAnalysis.h"
#include "llvm/Analysis/BranchProbabilityInfo.h"		#include "llvm/Analysis/BranchProbabilityInfo.h"
#include "llvm/Analysis/GuardUtils.h"		#include "llvm/Analysis/GuardUtils.h"
#include "llvm/Analysis/LoopInfo.h"		#include "llvm/Analysis/LoopInfo.h"
#include "llvm/Analysis/LoopPass.h"		#include "llvm/Analysis/LoopPass.h"
#include "llvm/Analysis/ScalarEvolution.h"		#include "llvm/Analysis/ScalarEvolution.h"
#include "llvm/Analysis/ScalarEvolutionExpander.h"		#include "llvm/Analysis/ScalarEvolutionExpander.h"
#include "llvm/Analysis/ScalarEvolutionExpressions.h"		#include "llvm/Analysis/ScalarEvolutionExpressions.h"
#include "llvm/IR/Function.h"		#include "llvm/IR/Function.h"
▲ Show 20 Lines • Show All 52 Lines • ▼ Show 20 Lines	LoopICmp(ICmpInst::Predicate Pred, const SCEVAddRecExpr *IV,
: Pred(Pred), IV(IV), Limit(Limit) {}		: Pred(Pred), IV(IV), Limit(Limit) {}
LoopICmp() {}		LoopICmp() {}
void dump() {		void dump() {
dbgs() << "LoopICmp Pred = " << Pred << ", IV = " << *IV		dbgs() << "LoopICmp Pred = " << Pred << ", IV = " << *IV
<< ", Limit = " << *Limit << "\n";		<< ", Limit = " << *Limit << "\n";
}		}
};		};

		AliasAnalysis *AA;
ScalarEvolution *SE;		ScalarEvolution *SE;
BranchProbabilityInfo *BPI;		BranchProbabilityInfo *BPI;

Loop *L;		Loop *L;
const DataLayout *DL;		const DataLayout *DL;
BasicBlock *Preheader;		BasicBlock *Preheader;
LoopICmp LatchCheck;		LoopICmp LatchCheck;

Show All 13 Lines	class LoopPredication {
/// loop invariant location if possible.		/// loop invariant location if possible.
Instruction findInsertPt(Instruction User, ArrayRef<Value*> Ops);		Instruction findInsertPt(Instruction User, ArrayRef<Value*> Ops);
/// Same as above, except that this uses the SCEV definition of invariant		/// Same as above, except that this uses the SCEV definition of invariant
/// which is that an expression can be made invariant via SCEVExpander.		/// which is that an expression can be made invariant via SCEVExpander.
/// Thus, this version is only suitable for finding an insert point to be be		/// Thus, this version is only suitable for finding an insert point to be be
/// passed to SCEVExpander!		/// passed to SCEVExpander!
Instruction findInsertPt(Instruction User, ArrayRef<const SCEV*> Ops);		Instruction findInsertPt(Instruction User, ArrayRef<const SCEV*> Ops);

bool CanExpand(const SCEV* S);		/// Return true if the value is known to produce a single fixed value across
		/// all iterations on which it executes. Note that this does not imply
		/// speculation safety. That must be established seperately.
		bool isLoopInvariantValue(const SCEV* S);

Value expandCheck(SCEVExpander &Expander, Instruction Guard,		Value expandCheck(SCEVExpander &Expander, Instruction Guard,
ICmpInst::Predicate Pred, const SCEV *LHS,		ICmpInst::Predicate Pred, const SCEV *LHS,
const SCEV *RHS);		const SCEV *RHS);

Optional<Value > widenICmpRangeCheck(ICmpInst ICI, SCEVExpander &Expander,		Optional<Value > widenICmpRangeCheck(ICmpInst ICI, SCEVExpander &Expander,
Instruction *Guard);		Instruction *Guard);
Optional<Value *> widenICmpRangeCheckIncrementingLoop(LoopICmp LatchCheck,		Optional<Value *> widenICmpRangeCheckIncrementingLoop(LoopICmp LatchCheck,
LoopICmp RangeCheck,		LoopICmp RangeCheck,
Show All 26 Lines	class LoopPredication {
// This function returns true if we can safely represent the IV type in		// This function returns true if we can safely represent the IV type in
// the RangeCheckType without loss of information.		// the RangeCheckType without loss of information.
bool isSafeToTruncateWideIVType(Type *RangeCheckType);		bool isSafeToTruncateWideIVType(Type *RangeCheckType);
// Return the loopLatchCheck corresponding to the RangeCheckType if safe to do		// Return the loopLatchCheck corresponding to the RangeCheckType if safe to do
// so.		// so.
Optional<LoopICmp> generateLoopLatchCheck(Type *RangeCheckType);		Optional<LoopICmp> generateLoopLatchCheck(Type *RangeCheckType);

public:		public:
LoopPredication(ScalarEvolution SE, BranchProbabilityInfo BPI)		LoopPredication(AliasAnalysis AA, ScalarEvolution SE,
: SE(SE), BPI(BPI){};		BranchProbabilityInfo *BPI)
		: AA(AA), SE(SE), BPI(BPI){};
bool runOnLoop(Loop *L);		bool runOnLoop(Loop *L);
};		};

class LoopPredicationLegacyPass : public LoopPass {		class LoopPredicationLegacyPass : public LoopPass {
public:		public:
static char ID;		static char ID;
LoopPredicationLegacyPass() : LoopPass(ID) {		LoopPredicationLegacyPass() : LoopPass(ID) {
initializeLoopPredicationLegacyPassPass(*PassRegistry::getPassRegistry());		initializeLoopPredicationLegacyPassPass(*PassRegistry::getPassRegistry());
}		}

void getAnalysisUsage(AnalysisUsage &AU) const override {		void getAnalysisUsage(AnalysisUsage &AU) const override {
AU.addRequired<BranchProbabilityInfoWrapperPass>();		AU.addRequired<BranchProbabilityInfoWrapperPass>();
getLoopAnalysisUsage(AU);		getLoopAnalysisUsage(AU);
}		}

bool runOnLoop(Loop *L, LPPassManager &LPM) override {		bool runOnLoop(Loop *L, LPPassManager &LPM) override {
if (skipLoop(L))		if (skipLoop(L))
return false;		return false;
auto *SE = &getAnalysis<ScalarEvolutionWrapperPass>().getSE();		auto *SE = &getAnalysis<ScalarEvolutionWrapperPass>().getSE();
BranchProbabilityInfo &BPI =		BranchProbabilityInfo &BPI =
getAnalysis<BranchProbabilityInfoWrapperPass>().getBPI();		getAnalysis<BranchProbabilityInfoWrapperPass>().getBPI();
LoopPredication LP(SE, &BPI);		auto *AA = &getAnalysis<AAResultsWrapperPass>().getAAResults();
		LoopPredication LP(AA, SE, &BPI);
return LP.runOnLoop(L);		return LP.runOnLoop(L);
}		}
};		};

char LoopPredicationLegacyPass::ID = 0;		char LoopPredicationLegacyPass::ID = 0;
} // end namespace llvm		} // end namespace llvm

INITIALIZE_PASS_BEGIN(LoopPredicationLegacyPass, "loop-predication",		INITIALIZE_PASS_BEGIN(LoopPredicationLegacyPass, "loop-predication",
Show All 9 Lines

PreservedAnalyses LoopPredicationPass::run(Loop &L, LoopAnalysisManager &AM,		PreservedAnalyses LoopPredicationPass::run(Loop &L, LoopAnalysisManager &AM,
LoopStandardAnalysisResults &AR,		LoopStandardAnalysisResults &AR,
LPMUpdater &U) {		LPMUpdater &U) {
const auto &FAM =		const auto &FAM =
AM.getResult<FunctionAnalysisManagerLoopProxy>(L, AR).getManager();		AM.getResult<FunctionAnalysisManagerLoopProxy>(L, AR).getManager();
Function *F = L.getHeader()->getParent();		Function *F = L.getHeader()->getParent();
auto BPI = FAM.getCachedResult<BranchProbabilityAnalysis>(F);		auto BPI = FAM.getCachedResult<BranchProbabilityAnalysis>(F);
LoopPredication LP(&AR.SE, BPI);		LoopPredication LP(&AR.AA, &AR.SE, BPI);
if (!LP.runOnLoop(&L))		if (!LP.runOnLoop(&L))
return PreservedAnalyses::all();		return PreservedAnalyses::all();

return getLoopPassPreservedAnalyses();		return getLoopPassPreservedAnalyses();
}		}

Optional<LoopPredication::LoopICmp>		Optional<LoopPredication::LoopICmp>
LoopPredication::parseLoopICmp(ICmpInst::Predicate Pred, Value *LHS,		LoopPredication::parseLoopICmp(ICmpInst::Predicate Pred, Value *LHS,
▲ Show 20 Lines • Show All 78 Lines • ▼ Show 20 Lines	Instruction LoopPredication::findInsertPt(Instruction Use,
for (Value *Op : Ops)		for (Value *Op : Ops)
if (!L->isLoopInvariant(Op))		if (!L->isLoopInvariant(Op))
return Use;		return Use;
return Preheader->getTerminator();		return Preheader->getTerminator();
}		}

Instruction LoopPredication::findInsertPt(Instruction Use,		Instruction LoopPredication::findInsertPt(Instruction Use,
ArrayRef<const SCEV*> Ops) {		ArrayRef<const SCEV*> Ops) {
		// Subtlety: SCEV considers things to be invariant if the value produced is
		// the same across iterations. This is not the same as being able to
		// evaluate outside the loop, which is what we actually need here.
for (const SCEV *Op : Ops)		for (const SCEV *Op : Ops)
if (!SE->isLoopInvariant(Op, L))		if (!SE->isLoopInvariant(Op, L) \|\|
		!isSafeToExpandAt(Op, Preheader->getTerminator(), *SE))
return Use;		return Use;
return Preheader->getTerminator();		return Preheader->getTerminator();
}		}

		bool LoopPredication::isLoopInvariantValue(const SCEV* S) {
		// Handling expressions which produce invariant results, but haven't yet
		// been removed from the loop serves two important purposes.
		// 1) Most importantly, it resolves a pass ordering cycle which would
		// otherwise need us to iteration licm, loop-predication, and either
		// loop-unswitch or loop-peeling to make progress on examples with lots of
		// predicable range checks in a row. (Since, in the general case, we can't
		// hoist the length checks until the dominating checks have been discharged
		// as we can't prove doing so is safe.)
		// 2) As a nice side effect, this exposes the value of peeling or unswitching
		// much more obviously in the IR. Otherwise, the cost modeling for other
		// transforms would end up needing to duplicate all of this logic to model a
		// check which becomes predictable based on a modeled peel or unswitch.
		//
		// The cost of doing so in the worst case is an extra fill from the stack in
		// the loop to materialize the loop invariant test value instead of checking
		// against the original IV which is presumable in a register inside the loop.
		// Such cases are presumably rare, and hint at missing oppurtunities for
		// other passes.

		if (SE->isLoopInvariant(S, L))
		// Note: This the SCEV variant, so the original Value* may be within the
		// loop even though SCEV has proven it is loop invariant.
		return true;

bool LoopPredication::CanExpand(const SCEV* S) {		// Handle a particular important case which SCEV doesn't yet know about which
return SE->isLoopInvariant(S, L) && isSafeToExpand(S, *SE);		// shows up in range checks on arrays with immutable lengths.
		// TODO: This should be sunk inside SCEV.
		if (const SCEVUnknown *U = dyn_cast<SCEVUnknown>(S))
		if (const auto *LI = dyn_cast<LoadInst>(U->getValue()))
		if (LI->isUnordered())
		if (AA->pointsToConstantMemory(LI->getOperand(0)) \|\|
		LI->getMetadata(LLVMContext::MD_invariant_load) != nullptr)
		return true;
		return false;
}		}

Optional<Value *> LoopPredication::widenICmpRangeCheckIncrementingLoop(		Optional<Value *> LoopPredication::widenICmpRangeCheckIncrementingLoop(
LoopPredication::LoopICmp LatchCheck, LoopPredication::LoopICmp RangeCheck,		LoopPredication::LoopICmp LatchCheck, LoopPredication::LoopICmp RangeCheck,
SCEVExpander &Expander, Instruction *Guard) {		SCEVExpander &Expander, Instruction *Guard) {
auto *Ty = RangeCheck.IV->getType();		auto *Ty = RangeCheck.IV->getType();
// Generate the widened condition for the forward loop:		// Generate the widened condition for the forward loop:
// guardStart u< guardLimit &&		// guardStart u< guardLimit &&
// latchLimit <pred> guardLimit - 1 - guardStart + latchStart		// latchLimit <pred> guardLimit - 1 - guardStart + latchStart
// where <pred> depends on the latch condition predicate. See the file		// where <pred> depends on the latch condition predicate. See the file
// header comment for the reasoning.		// header comment for the reasoning.
// guardLimit - guardStart + latchStart - 1		// guardLimit - guardStart + latchStart - 1
const SCEV *GuardStart = RangeCheck.IV->getStart();		const SCEV *GuardStart = RangeCheck.IV->getStart();
const SCEV *GuardLimit = RangeCheck.Limit;		const SCEV *GuardLimit = RangeCheck.Limit;
const SCEV *LatchStart = LatchCheck.IV->getStart();		const SCEV *LatchStart = LatchCheck.IV->getStart();
const SCEV *LatchLimit = LatchCheck.Limit;		const SCEV *LatchLimit = LatchCheck.Limit;
		// Subtlety: We need all the values to be invariant across all iterations,
		// but we only need to check expansion safety for those which aren't
		// already guaranteed to dominate the guard.
		if (!isLoopInvariantValue(GuardStart) \|\|
		!isLoopInvariantValue(GuardLimit) \|\|
		!isLoopInvariantValue(LatchStart) \|\|
		!isLoopInvariantValue(LatchLimit)) {
		LLVM_DEBUG(dbgs() << "Can't expand limit check!\n");
		return None;
		}
		if (!isSafeToExpandAt(LatchStart, Guard, *SE) \|\|
		!isSafeToExpandAt(LatchLimit, Guard, *SE)) {
		LLVM_DEBUG(dbgs() << "Can't expand limit check!\n");
		return None;
		}

// guardLimit - guardStart + latchStart - 1		// guardLimit - guardStart + latchStart - 1
const SCEV *RHS =		const SCEV *RHS =
SE->getAddExpr(SE->getMinusSCEV(GuardLimit, GuardStart),		SE->getAddExpr(SE->getMinusSCEV(GuardLimit, GuardStart),
SE->getMinusSCEV(LatchStart, SE->getOne(Ty)));		SE->getMinusSCEV(LatchStart, SE->getOne(Ty)));
if (!CanExpand(GuardStart) \|\| !CanExpand(GuardLimit) \|\|
!CanExpand(LatchLimit) \|\| !CanExpand(RHS)) {
LLVM_DEBUG(dbgs() << "Can't expand limit check!\n");
return None;
}
auto LimitCheckPred =		auto LimitCheckPred =
ICmpInst::getFlippedStrictnessPredicate(LatchCheck.Pred);		ICmpInst::getFlippedStrictnessPredicate(LatchCheck.Pred);

LLVM_DEBUG(dbgs() << "LHS: " << *LatchLimit << "\n");		LLVM_DEBUG(dbgs() << "LHS: " << *LatchLimit << "\n");
LLVM_DEBUG(dbgs() << "RHS: " << *RHS << "\n");		LLVM_DEBUG(dbgs() << "RHS: " << *RHS << "\n");
LLVM_DEBUG(dbgs() << "Pred: " << LimitCheckPred << "\n");		LLVM_DEBUG(dbgs() << "Pred: " << LimitCheckPred << "\n");

auto *LimitCheck =		auto *LimitCheck =
expandCheck(Expander, Guard, LimitCheckPred, LatchLimit, RHS);		expandCheck(Expander, Guard, LimitCheckPred, LatchLimit, RHS);
auto *FirstIterationCheck = expandCheck(Expander, Guard, RangeCheck.Pred,		auto *FirstIterationCheck = expandCheck(Expander, Guard, RangeCheck.Pred,
GuardStart, GuardLimit);		GuardStart, GuardLimit);
IRBuilder<> Builder(findInsertPt(Guard, {FirstIterationCheck, LimitCheck}));		IRBuilder<> Builder(findInsertPt(Guard, {FirstIterationCheck, LimitCheck}));
return Builder.CreateAnd(FirstIterationCheck, LimitCheck);		return Builder.CreateAnd(FirstIterationCheck, LimitCheck);
}		}

Optional<Value *> LoopPredication::widenICmpRangeCheckDecrementingLoop(		Optional<Value *> LoopPredication::widenICmpRangeCheckDecrementingLoop(
LoopPredication::LoopICmp LatchCheck, LoopPredication::LoopICmp RangeCheck,		LoopPredication::LoopICmp LatchCheck, LoopPredication::LoopICmp RangeCheck,
SCEVExpander &Expander, Instruction *Guard) {		SCEVExpander &Expander, Instruction *Guard) {
auto *Ty = RangeCheck.IV->getType();		auto *Ty = RangeCheck.IV->getType();
const SCEV *GuardStart = RangeCheck.IV->getStart();		const SCEV *GuardStart = RangeCheck.IV->getStart();
const SCEV *GuardLimit = RangeCheck.Limit;		const SCEV *GuardLimit = RangeCheck.Limit;
		const SCEV *LatchStart = LatchCheck.IV->getStart();
const SCEV *LatchLimit = LatchCheck.Limit;		const SCEV *LatchLimit = LatchCheck.Limit;
if (!CanExpand(GuardStart) \|\| !CanExpand(GuardLimit) \|\|		// Subtlety: We need all the values to be invariant across all iterations,
!CanExpand(LatchLimit)) {		// but we only need to check expansion safety for those which aren't
		// already guaranteed to dominate the guard.
		if (!isLoopInvariantValue(GuardStart) \|\|
		!isLoopInvariantValue(GuardLimit) \|\|
		!isLoopInvariantValue(LatchStart) \|\|
		!isLoopInvariantValue(LatchLimit)) {
		LLVM_DEBUG(dbgs() << "Can't expand limit check!\n");
		return None;
		}
		if (!isSafeToExpandAt(LatchStart, Guard, *SE) \|\|
		!isSafeToExpandAt(LatchLimit, Guard, *SE)) {
LLVM_DEBUG(dbgs() << "Can't expand limit check!\n");		LLVM_DEBUG(dbgs() << "Can't expand limit check!\n");
return None;		return None;
}		}
// The decrement of the latch check IV should be the same as the		// The decrement of the latch check IV should be the same as the
// rangeCheckIV.		// rangeCheckIV.
auto PostDecLatchCheckIV = LatchCheck.IV->getPostIncExpr(SE);		auto PostDecLatchCheckIV = LatchCheck.IV->getPostIncExpr(SE);
if (RangeCheck.IV != PostDecLatchCheckIV) {		if (RangeCheck.IV != PostDecLatchCheckIV) {
LLVM_DEBUG(dbgs() << "Not the same. PostDecLatchCheckIV: "		LLVM_DEBUG(dbgs() << "Not the same. PostDecLatchCheckIV: "
▲ Show 20 Lines • Show All 414 Lines • Show Last 20 Lines

llvm/test/Transforms/LoopPredication/basic.ll

	Show First 20 Lines • Show All 1,495 Lines • ▼ Show 20 Lines
	; CHECK-NEXT: [[TMP5:%.]] = icmp eq i32 [[N:%.]], 0			; CHECK-NEXT: [[TMP5:%.]] = icmp eq i32 [[N:%.]], 0
	; CHECK-NEXT: br i1 [[TMP5]], label [[EXIT:%.]], label [[LOOP_PREHEADER:%.]]			; CHECK-NEXT: br i1 [[TMP5]], label [[EXIT:%.]], label [[LOOP_PREHEADER:%.]]
	; CHECK: loop.preheader:			; CHECK: loop.preheader:
	; CHECK-NEXT: br label [[LOOP:%.*]]			; CHECK-NEXT: br label [[LOOP:%.*]]
	; CHECK: loop:			; CHECK: loop:
	; CHECK-NEXT: [[LOOP_ACC:%.]] = phi i32 [ [[LOOP_ACC_NEXT:%.]], [[LOOP]] ], [ 0, [[LOOP_PREHEADER]] ]			; CHECK-NEXT: [[LOOP_ACC:%.]] = phi i32 [ [[LOOP_ACC_NEXT:%.]], [[LOOP]] ], [ 0, [[LOOP_PREHEADER]] ]
	; CHECK-NEXT: [[I:%.]] = phi i32 [ [[I_NEXT:%.]], [[LOOP]] ], [ 0, [[LOOP_PREHEADER]] ]			; CHECK-NEXT: [[I:%.]] = phi i32 [ [[I_NEXT:%.]], [[LOOP]] ], [ 0, [[LOOP_PREHEADER]] ]
	; CHECK-NEXT: [[LENGTH_UDIV:%.]] = udiv i32 [[LENGTH:%.]], [[DIVIDER:%.*]]			; CHECK-NEXT: [[LENGTH_UDIV:%.]] = udiv i32 [[LENGTH:%.]], [[DIVIDER:%.*]]
	; CHECK-NEXT: [[WITHIN_BOUNDS:%.*]] = icmp ult i32 [[I]], [[LENGTH_UDIV]]			; CHECK-NEXT: [[TMP0:%.*]] = icmp ule i32 [[N]], [[LENGTH_UDIV]]
	; CHECK-NEXT: call void (i1, ...) @llvm.experimental.guard(i1 [[WITHIN_BOUNDS]], i32 9) [ "deopt"() ]			; CHECK-NEXT: [[TMP1:%.*]] = icmp ult i32 0, [[LENGTH_UDIV]]
				; CHECK-NEXT: [[TMP2:%.*]] = and i1 [[TMP1]], [[TMP0]]
				; CHECK-NEXT: call void (i1, ...) @llvm.experimental.guard(i1 [[TMP2]], i32 9) [ "deopt"() ]
	; CHECK-NEXT: [[I_I64:%.*]] = zext i32 [[I]] to i64			; CHECK-NEXT: [[I_I64:%.*]] = zext i32 [[I]] to i64
	; CHECK-NEXT: [[ARRAY_I_PTR:%.]] = getelementptr inbounds i32, i32 [[ARRAY:%.*]], i64 [[I_I64]]			; CHECK-NEXT: [[ARRAY_I_PTR:%.]] = getelementptr inbounds i32, i32 [[ARRAY:%.*]], i64 [[I_I64]]
	; CHECK-NEXT: [[ARRAY_I:%.]] = load i32, i32 [[ARRAY_I_PTR]], align 4			; CHECK-NEXT: [[ARRAY_I:%.]] = load i32, i32 [[ARRAY_I_PTR]], align 4
	; CHECK-NEXT: [[LOOP_ACC_NEXT]] = add i32 [[LOOP_ACC]], [[ARRAY_I]]			; CHECK-NEXT: [[LOOP_ACC_NEXT]] = add i32 [[LOOP_ACC]], [[ARRAY_I]]
	; CHECK-NEXT: [[I_NEXT]] = add nuw i32 [[I]], 1			; CHECK-NEXT: [[I_NEXT]] = add nuw i32 [[I]], 1
	; CHECK-NEXT: [[CONTINUE:%.*]] = icmp ult i32 [[I_NEXT]], [[N]]			; CHECK-NEXT: [[CONTINUE:%.*]] = icmp ult i32 [[I_NEXT]], [[N]]
	; CHECK-NEXT: br i1 [[CONTINUE]], label [[LOOP]], label [[EXIT_LOOPEXIT:%.*]]			; CHECK-NEXT: br i1 [[CONTINUE]], label [[LOOP]], label [[EXIT_LOOPEXIT:%.*]]
	; CHECK: exit.loopexit:			; CHECK: exit.loopexit:
	▲ Show 20 Lines • Show All 82 Lines • Show Last 20 Lines

llvm/test/Transforms/LoopPredication/basic_widenable_branch_guards.ll

	Show First 20 Lines • Show All 1,802 Lines • ▼ Show 20 Lines
	; CHECK-NEXT: [[TMP5:%.]] = icmp eq i32 [[N:%.]], 0			; CHECK-NEXT: [[TMP5:%.]] = icmp eq i32 [[N:%.]], 0
	; CHECK-NEXT: br i1 [[TMP5]], label [[EXIT:%.]], label [[LOOP_PREHEADER:%.]]			; CHECK-NEXT: br i1 [[TMP5]], label [[EXIT:%.]], label [[LOOP_PREHEADER:%.]]
	; CHECK: loop.preheader:			; CHECK: loop.preheader:
	; CHECK-NEXT: br label [[LOOP:%.*]]			; CHECK-NEXT: br label [[LOOP:%.*]]
	; CHECK: loop:			; CHECK: loop:
	; CHECK-NEXT: [[LOOP_ACC:%.]] = phi i32 [ [[LOOP_ACC_NEXT:%.]], [[GUARDED:%.*]] ], [ 0, [[LOOP_PREHEADER]] ]			; CHECK-NEXT: [[LOOP_ACC:%.]] = phi i32 [ [[LOOP_ACC_NEXT:%.]], [[GUARDED:%.*]] ], [ 0, [[LOOP_PREHEADER]] ]
	; CHECK-NEXT: [[I:%.]] = phi i32 [ [[I_NEXT:%.]], [[GUARDED]] ], [ 0, [[LOOP_PREHEADER]] ]			; CHECK-NEXT: [[I:%.]] = phi i32 [ [[I_NEXT:%.]], [[GUARDED]] ], [ 0, [[LOOP_PREHEADER]] ]
	; CHECK-NEXT: [[LENGTH_UDIV:%.]] = udiv i32 [[LENGTH:%.]], [[DIVIDER:%.*]]			; CHECK-NEXT: [[LENGTH_UDIV:%.]] = udiv i32 [[LENGTH:%.]], [[DIVIDER:%.*]]
	; CHECK-NEXT: [[WITHIN_BOUNDS:%.*]] = icmp ult i32 [[I]], [[LENGTH_UDIV]]
	; CHECK-NEXT: [[WIDENABLE_COND:%.*]] = call i1 @llvm.experimental.widenable.condition()			; CHECK-NEXT: [[WIDENABLE_COND:%.*]] = call i1 @llvm.experimental.widenable.condition()
	; CHECK-NEXT: [[EXIPLICIT_GUARD_COND:%.*]] = and i1 [[WITHIN_BOUNDS]], [[WIDENABLE_COND]]			; CHECK-NEXT: [[TMP0:%.*]] = icmp ule i32 [[N]], [[LENGTH_UDIV]]
	; CHECK-NEXT: br i1 [[EXIPLICIT_GUARD_COND]], label [[GUARDED]], label [[DEOPT:%.*]], !prof !0			; CHECK-NEXT: [[TMP1:%.*]] = icmp ult i32 0, [[LENGTH_UDIV]]
				; CHECK-NEXT: [[TMP2:%.*]] = and i1 [[TMP1]], [[TMP0]]
				; CHECK-NEXT: [[TMP3:%.*]] = and i1 [[TMP2]], [[WIDENABLE_COND]]
				; CHECK-NEXT: br i1 [[TMP3]], label [[GUARDED]], label [[DEOPT:%.*]], !prof !0
	; CHECK: deopt:			; CHECK: deopt:
	; CHECK-NEXT: [[DEOPTCALL:%.*]] = call i32 (...) @llvm.experimental.deoptimize.i32(i32 9) [ "deopt"() ]			; CHECK-NEXT: [[DEOPTCALL:%.*]] = call i32 (...) @llvm.experimental.deoptimize.i32(i32 9) [ "deopt"() ]
	; CHECK-NEXT: ret i32 [[DEOPTCALL]]			; CHECK-NEXT: ret i32 [[DEOPTCALL]]
	; CHECK: guarded:			; CHECK: guarded:
	; CHECK-NEXT: [[I_I64:%.*]] = zext i32 [[I]] to i64			; CHECK-NEXT: [[I_I64:%.*]] = zext i32 [[I]] to i64
	; CHECK-NEXT: [[ARRAY_I_PTR:%.]] = getelementptr inbounds i32, i32 [[ARRAY:%.*]], i64 [[I_I64]]			; CHECK-NEXT: [[ARRAY_I_PTR:%.]] = getelementptr inbounds i32, i32 [[ARRAY:%.*]], i64 [[I_I64]]
	; CHECK-NEXT: [[ARRAY_I:%.]] = load i32, i32 [[ARRAY_I_PTR]], align 4			; CHECK-NEXT: [[ARRAY_I:%.]] = load i32, i32 [[ARRAY_I_PTR]], align 4
	; CHECK-NEXT: [[LOOP_ACC_NEXT]] = add i32 [[LOOP_ACC]], [[ARRAY_I]]			; CHECK-NEXT: [[LOOP_ACC_NEXT]] = add i32 [[LOOP_ACC]], [[ARRAY_I]]
	▲ Show 20 Lines • Show All 113 Lines • Show Last 20 Lines

llvm/test/Transforms/LoopPredication/invariant_load.ll

	Show First 20 Lines • Show All 72 Lines • ▼ Show 20 Lines
	; CHECK: loop.preheader:			; CHECK: loop.preheader:
	; CHECK-NEXT: br label [[LOOP:%.*]]			; CHECK-NEXT: br label [[LOOP:%.*]]
	; CHECK: loop:			; CHECK: loop:
	; CHECK-NEXT: [[LOOP_ACC:%.]] = phi i32 [ [[LOOP_ACC_NEXT:%.]], [[LOOP]] ], [ 0, [[LOOP_PREHEADER]] ]			; CHECK-NEXT: [[LOOP_ACC:%.]] = phi i32 [ [[LOOP_ACC_NEXT:%.]], [[LOOP]] ], [ 0, [[LOOP_PREHEADER]] ]
	; CHECK-NEXT: [[I:%.]] = phi i32 [ [[I_NEXT:%.]], [[LOOP]] ], [ 0, [[LOOP_PREHEADER]] ]			; CHECK-NEXT: [[I:%.]] = phi i32 [ [[I_NEXT:%.]], [[LOOP]] ], [ 0, [[LOOP_PREHEADER]] ]
	; CHECK-NEXT: [[UNKNOWN:%.]] = load volatile i1, i1 @UNKNOWN			; CHECK-NEXT: [[UNKNOWN:%.]] = load volatile i1, i1 @UNKNOWN
	; CHECK-NEXT: call void (i1, ...) @llvm.experimental.guard(i1 [[UNKNOWN]]) [ "deopt"() ]			; CHECK-NEXT: call void (i1, ...) @llvm.experimental.guard(i1 [[UNKNOWN]]) [ "deopt"() ]
	; CHECK-NEXT: [[LEN:%.]] = load i32, i32 [[LENGTH:%.*]], align 4, !invariant.load !0			; CHECK-NEXT: [[LEN:%.]] = load i32, i32 [[LENGTH:%.*]], align 4, !invariant.load !0
	; CHECK-NEXT: [[WITHIN_BOUNDS:%.*]] = icmp ult i32 [[I]], [[LEN]]			; CHECK-NEXT: [[TMP0:%.*]] = icmp ule i32 [[N]], [[LEN]]
	; CHECK-NEXT: call void (i1, ...) @llvm.experimental.guard(i1 [[WITHIN_BOUNDS]], i32 9) [ "deopt"() ]			; CHECK-NEXT: [[TMP1:%.*]] = icmp ult i32 0, [[LEN]]
				; CHECK-NEXT: [[TMP2:%.*]] = and i1 [[TMP1]], [[TMP0]]
				; CHECK-NEXT: call void (i1, ...) @llvm.experimental.guard(i1 [[TMP2]], i32 9) [ "deopt"() ]
	; CHECK-NEXT: [[I_I64:%.*]] = zext i32 [[I]] to i64			; CHECK-NEXT: [[I_I64:%.*]] = zext i32 [[I]] to i64
	; CHECK-NEXT: [[ARRAY_I_PTR:%.]] = getelementptr inbounds i32, i32 [[ARRAY:%.*]], i64 [[I_I64]]			; CHECK-NEXT: [[ARRAY_I_PTR:%.]] = getelementptr inbounds i32, i32 [[ARRAY:%.*]], i64 [[I_I64]]
	; CHECK-NEXT: [[ARRAY_I:%.]] = load i32, i32 [[ARRAY_I_PTR]], align 4			; CHECK-NEXT: [[ARRAY_I:%.]] = load i32, i32 [[ARRAY_I_PTR]], align 4
	; CHECK-NEXT: [[LOOP_ACC_NEXT]] = add i32 [[LOOP_ACC]], [[ARRAY_I]]			; CHECK-NEXT: [[LOOP_ACC_NEXT]] = add i32 [[LOOP_ACC]], [[ARRAY_I]]
	; CHECK-NEXT: [[I_NEXT]] = add nuw i32 [[I]], 1			; CHECK-NEXT: [[I_NEXT]] = add nuw i32 [[I]], 1
	; CHECK-NEXT: [[CONTINUE:%.*]] = icmp ult i32 [[I_NEXT]], [[N]]			; CHECK-NEXT: [[CONTINUE:%.*]] = icmp ult i32 [[I_NEXT]], [[N]]
	; CHECK-NEXT: br i1 [[CONTINUE]], label [[LOOP]], label [[EXIT_LOOPEXIT:%.*]]			; CHECK-NEXT: br i1 [[CONTINUE]], label [[LOOP]], label [[EXIT_LOOPEXIT:%.*]]
	; CHECK: exit.loopexit:			; CHECK: exit.loopexit:
	▲ Show 20 Lines • Show All 168 Lines • ▼ Show 20 Lines
	; CHECK: loop.preheader:			; CHECK: loop.preheader:
	; CHECK-NEXT: br label [[LOOP:%.*]]			; CHECK-NEXT: br label [[LOOP:%.*]]
	; CHECK: loop:			; CHECK: loop:
	; CHECK-NEXT: [[LOOP_ACC:%.]] = phi i32 [ [[LOOP_ACC_NEXT:%.]], [[LOOP]] ], [ 0, [[LOOP_PREHEADER]] ]			; CHECK-NEXT: [[LOOP_ACC:%.]] = phi i32 [ [[LOOP_ACC_NEXT:%.]], [[LOOP]] ], [ 0, [[LOOP_PREHEADER]] ]
	; CHECK-NEXT: [[I:%.]] = phi i32 [ [[I_NEXT:%.]], [[LOOP]] ], [ 0, [[LOOP_PREHEADER]] ]			; CHECK-NEXT: [[I:%.]] = phi i32 [ [[I_NEXT:%.]], [[LOOP]] ], [ 0, [[LOOP_PREHEADER]] ]
	; CHECK-NEXT: [[UNKNOWN:%.]] = load volatile i1, i1 @UNKNOWN			; CHECK-NEXT: [[UNKNOWN:%.]] = load volatile i1, i1 @UNKNOWN
	; CHECK-NEXT: call void (i1, ...) @llvm.experimental.guard(i1 [[UNKNOWN]]) [ "deopt"() ]			; CHECK-NEXT: call void (i1, ...) @llvm.experimental.guard(i1 [[UNKNOWN]]) [ "deopt"() ]
	; CHECK-NEXT: [[LEN:%.]] = load i32, i32 @Length, align 4			; CHECK-NEXT: [[LEN:%.]] = load i32, i32 @Length, align 4
	; CHECK-NEXT: [[WITHIN_BOUNDS:%.*]] = icmp ult i32 [[I]], [[LEN]]			; CHECK-NEXT: [[TMP0:%.*]] = icmp ule i32 [[N]], [[LEN]]
	; CHECK-NEXT: call void (i1, ...) @llvm.experimental.guard(i1 [[WITHIN_BOUNDS]], i32 9) [ "deopt"() ]			; CHECK-NEXT: [[TMP1:%.*]] = icmp ult i32 0, [[LEN]]
				; CHECK-NEXT: [[TMP2:%.*]] = and i1 [[TMP1]], [[TMP0]]
				; CHECK-NEXT: call void (i1, ...) @llvm.experimental.guard(i1 [[TMP2]], i32 9) [ "deopt"() ]
	; CHECK-NEXT: [[I_I64:%.*]] = zext i32 [[I]] to i64			; CHECK-NEXT: [[I_I64:%.*]] = zext i32 [[I]] to i64
	; CHECK-NEXT: [[ARRAY_I_PTR:%.]] = getelementptr inbounds i32, i32 [[ARRAY:%.*]], i64 [[I_I64]]			; CHECK-NEXT: [[ARRAY_I_PTR:%.]] = getelementptr inbounds i32, i32 [[ARRAY:%.*]], i64 [[I_I64]]
	; CHECK-NEXT: [[ARRAY_I:%.]] = load i32, i32 [[ARRAY_I_PTR]], align 4			; CHECK-NEXT: [[ARRAY_I:%.]] = load i32, i32 [[ARRAY_I_PTR]], align 4
	; CHECK-NEXT: [[LOOP_ACC_NEXT]] = add i32 [[LOOP_ACC]], [[ARRAY_I]]			; CHECK-NEXT: [[LOOP_ACC_NEXT]] = add i32 [[LOOP_ACC]], [[ARRAY_I]]
	; CHECK-NEXT: [[I_NEXT]] = add nuw i32 [[I]], 1			; CHECK-NEXT: [[I_NEXT]] = add nuw i32 [[I]], 1
	; CHECK-NEXT: [[CONTINUE:%.*]] = icmp ult i32 [[I_NEXT]], [[N]]			; CHECK-NEXT: [[CONTINUE:%.*]] = icmp ult i32 [[I_NEXT]], [[N]]
	; CHECK-NEXT: br i1 [[CONTINUE]], label [[LOOP]], label [[EXIT_LOOPEXIT:%.*]]			; CHECK-NEXT: br i1 [[CONTINUE]], label [[LOOP]], label [[EXIT_LOOPEXIT:%.*]]
	; CHECK: exit.loopexit:			; CHECK: exit.loopexit:
	▲ Show 20 Lines • Show All 95 Lines • Show Last 20 Lines

This is an archive of the discontinued LLVM Phabricator instance.

[LoopPredication] Allow predication of loop invariant computations
ClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 195763

llvm/lib/Transforms/Scalar/LoopPredication.cpp

llvm/test/Transforms/LoopPredication/basic.ll

llvm/test/Transforms/LoopPredication/basic_widenable_branch_guards.ll

llvm/test/Transforms/LoopPredication/invariant_load.ll

This is an archive of the discontinued LLVM Phabricator instance.

[LoopPredication] Allow predication of loop invariant computationsClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 195763

llvm/lib/Transforms/Scalar/LoopPredication.cpp

llvm/test/Transforms/LoopPredication/basic.ll

llvm/test/Transforms/LoopPredication/basic_widenable_branch_guards.ll

llvm/test/Transforms/LoopPredication/invariant_load.ll

[LoopPredication] Allow predication of loop invariant computations
ClosedPublic