This is an archive of the discontinued LLVM Phabricator instance.

Paths

Table of Contentst

-
llvm/
-
lib/Transforms/Utils/
-
Transforms/
-
Utils/
1
LoopUnrollRuntime.cpp
-
test/Transforms/LoopUnroll/
-
Transforms/
-
LoopUnroll/
1
runtime-loop-multiple-exits.ll

Differential D107381

[runtimeunroll] Support multiple exits to latch exit w/epilogue loop
ClosedPublic

Authored by reames on Aug 3 2021, 11:28 AM.

Download Raw Diff

Details

Reviewers

anna
fhahn
Whitney
nikic

Commits

rG94d091429253: [runtimeunroll] Support multiple exits to latch exit w/epilogue loop

Summary

This patch extends the runtime unrolling infrastructure to support unrolling a loop with multiple exiting blocks branching to the same exit block used by the latch. It intentionally does not include a cost model change to enable this functionality unless appropriate force flags are used.

I decided to restrict this to the epilogue case. Given the changes ended up being pretty generic, we may be able to unblock the prolog case too, but I want to do that in a separate change to reduce the amount of code we all have to understand at one time.

Diff Detail

Repository: rG LLVM Github Monorepo

Event Timeline

reames created this revision.Aug 3 2021, 11:28 AM

Herald added subscribers: zzheng, bollu, hiraditya, mcrosier. · View Herald TranscriptAug 3 2021, 11:28 AM

reames requested review of this revision.Aug 3 2021, 11:28 AM

Herald added a project: Restricted Project. · View Herald TranscriptAug 3 2021, 11:28 AM

Harbormaster completed remote builds in B117700: Diff 363816.Aug 3 2021, 12:02 PM

xbolva00 added reviewers: Whitney, nikic.Aug 11 2021, 10:50 AM

ping

LGTM

llvm/lib/Transforms/Utils/LoopUnrollRuntime.cpp
749–750	No need to create a SmallVector anymore here, you can directly pass `{Latch}`.
llvm/test/Transforms/LoopUnroll/runtime-loop-multiple-exits.ll
1–2	In https://github.com/llvm/llvm-project/commit/70ffd65ca97bd7010108ad8c1369c105fb78714a you dropped the `-instcombine` from the other RUN lines, so this `EPILOG-NO-IC` line is now redundant and can be dropped.

This revision is now accepted and ready to land.Aug 17 2021, 11:01 AM

reames mentioned this in rG54934923b92d: [test] Remove a redundant test line.Aug 17 2021, 5:34 PM

This revision was landed with ongoing or failed builds.Aug 17 2021, 5:52 PM

Closed by commit rG94d091429253: [runtimeunroll] Support multiple exits to latch exit w/epilogue loop (authored by reames). · Explain Why

This revision was automatically updated to reflect the committed changes.

reames added a commit: rG94d091429253: [runtimeunroll] Support multiple exits to latch exit w/epilogue loop.

reames mentioned this in D108262: [runtimeunroll] Support multiple exits to latch exit w/prolog loop.Aug 17 2021, 6:16 PM

Hello! I'm seeing a failure from this commit in this test with our downstream Arm32 compiler. Does it ring any bells? Thanks.

21		DominatorTree is different than a freshly computed one!
22			Current:
23		=============================--------------------------------
24		Inorder Dominator Tree: DFSNumbers invalid: 17 slow queries.
25		  [1] %entry {4294967295,4294967295} [0]
26		    [2] %entry.new {4294967295,4294967295} [1]
27		      [3] %header {4294967295,4294967295} [2]
28		        [4] %for.exiting_block {4294967295,4294967295} [3]
29		          [5] %latch {4294967295,4294967295} [4]
30		            [6] %for.exiting_block.1 {4294967295,4294967295} [5]
31		              [7] %latch.1 {4294967295,4294967295} [6]
32		                [8] %latchExit.unr-lcssa.loopexit {4294967295,4294967295} [7]
33		          [5] %for.exit2.loopexit {4294967295,4294967295} [4]
34		        [4] %latchExit.epilog-lcssa.loopexit {4294967295,4294967295} [3]
35		    [2] %latchExit.unr-lcssa {4294967295,4294967295} [1]
36		      [3] %header.epil.preheader {4294967295,4294967295} [2]
37		        [4] %header.epil {4294967295,4294967295} [3]
38		          [5] %for.exiting_block.epil {4294967295,4294967295} [4]
39		            [6] %latch.epil {4294967295,4294967295} [5]
40		      [3] %latchExit {4294967295,4294967295} [2]
41		    [2] %for.exit2 {4294967295,4294967295} [1]
42		    [2] %latchExit.epilog-lcssa {4294967295,4294967295} [1]
43		Roots: %entry 
44		 
45			Freshly computed tree:
46		=============================--------------------------------
47		Inorder Dominator Tree: DFSNumbers invalid: 0 slow queries.
48		  [1] %entry {4294967295,4294967295} [0]
49		    [2] %latchExit.unr-lcssa {4294967295,4294967295} [1]
50		      [3] %header.epil.preheader {4294967295,4294967295} [2]
51		        [4] %header.epil {4294967295,4294967295} [3]
52		          [5] %for.exiting_block.epil {4294967295,4294967295} [4]
53		            [6] %latch.epil {4294967295,4294967295} [5]
54		    [2] %latchExit.epilog-lcssa {4294967295,4294967295} [1]
55		    [2] %latchExit {4294967295,4294967295} [1]
56		    [2] %for.exit2 {4294967295,4294967295} [1]
57		    [2] %entry.new {4294967295,4294967295} [1]
58		      [3] %header {4294967295,4294967295} [2]
59		        [4] %latchExit.epilog-lcssa.loopexit {4294967295,4294967295} [3]
60		        [4] %for.exiting_block {4294967295,4294967295} [3]
61		          [5] %for.exit2.loopexit {4294967295,4294967295} [4]
62		          [5] %latch {4294967295,4294967295} [4]
63		            [6] %for.exiting_block.1 {4294967295,4294967295} [5]
64		              [7] %latch.1 {4294967295,4294967295} [6]
65		                [8] %latchExit.unr-lcssa.loopexit {4294967295,4294967295} [7]
66		Roots: %entry 
67		opt: /scratch/aphipps/triage_repo/tools/llvm_cgt/llvm-project/llvm/lib/IR/Dominators.cpp:412: virtual void llvm::DominatorTreeWrapperPass::verifyAnalysis() const: Assertion `DT.verify(DominatorTree::VerificationLevel::Full)' failed.

I'm seeing the same fault as @alanphipps when having build with LLVM_ENABLE_EXPENSIVE_CHECKS=ON and running the test/Transforms/LoopUnroll/runtime-loop-multiple-exits.ll test case.

Should we revert this patch until this has been investigated further?

jaykang10 added a subscriber: jaykang10.Aug 19 2021, 7:45 AM

In D107381#2954577, @bjope wrote:

I'm seeing the same fault as @alanphipps when having build with LLVM_ENABLE_EXPENSIVE_CHECKS=ON and running the test/Transforms/LoopUnroll/runtime-loop-multiple-exits.ll test case.

Should we revert this patch until this has been investigated further?

Should be fixed in 447256f. If not, please revert both changes and I'll take another look.

I do want to briefly address the revert question though. I would not revert based on the first report. There's no reproducer, and (I'm guessing) they're force enabling an internal flag. That would definitely be an unsupported configuration. Your second report is a supported configuration failing with an intree reproducer. Reverting to green in that case would have been completely reasonable.

p.s. Did I miss a buildbot failure on this? I'm surprised I didn't notice the expensive check failure. I would have expected a buildbot to report that.

In D107381#2955288, @reames wrote:

In D107381#2954577, @bjope wrote:

I'm seeing the same fault as @alanphipps when having build with LLVM_ENABLE_EXPENSIVE_CHECKS=ON and running the test/Transforms/LoopUnroll/runtime-loop-multiple-exits.ll test case.

Should we revert this patch until this has been investigated further?

Should be fixed in 447256f. If not, please revert both changes and I'll take another look.

I do want to briefly address the revert question though. I would not revert based on the first report. There's no reproducer, and (I'm guessing) they're force enabling an internal flag. That would definitely be an unsupported configuration. Your second report is a supported configuration failing with an intree reproducer. Reverting to green in that case would have been completely reasonable.

p.s. Did I miss a buildbot failure on this? I'm surprised I didn't notice the expensive check failure. I would have expected a buildbot to report that.

It showed up there https://green.lab.llvm.org/green/job/clang-stage1-cmake-RA-expensive/20179/

But I think for some reason that one does not send emails. I'll check with the maintainers.

In D107381#2955288, @reames wrote:

In D107381#2954577, @bjope wrote:

I'm seeing the same fault as @alanphipps when having build with LLVM_ENABLE_EXPENSIVE_CHECKS=ON and running the test/Transforms/LoopUnroll/runtime-loop-multiple-exits.ll test case.

Should we revert this patch until this has been investigated further?

Should be fixed in 447256f. If not, please revert both changes and I'll take another look.

I do want to briefly address the revert question though. I would not revert based on the first report. There's no reproducer, and (I'm guessing) they're force enabling an internal flag. That would definitely be an unsupported configuration. Your second report is a supported configuration failing with an intree reproducer. Reverting to green in that case would have been completely reasonable.

Thanks @reames, that sounds reasonable to me. There was no rush to revert from my point of view here (specially considering the quick fix, so it was more of a suggestion in case it would take days to fix the problem).

Why did this only fail under expensive checks? The test has a -verify-dom-info, so I'd have expected that to fail with a normal build as well.

reames mentioned this in rG17b9cb181775: [runtimeunroll] Support multiple exits to latch exit w/prolog loop.Aug 19 2021, 11:43 AM

FYI, pushed the prolog equivalent (D108262) with a fix for the DT issue rolled in. It existed there too. If further problems are found, please feel free to revert that as well.

In D107381#2955321, @nikic wrote:

Why did this only fail under expensive checks? The test has a -verify-dom-info, so I'd have expected that to fail with a normal build as well.

IIRC, verify-dom-info is slightly different from performing a full DT verification. We have the full verification of DT in runtime unrolling which is under the expensive checks flag:

  // Verify that the Dom Tree is correct.
  #if defined(EXPENSIVE_CHECKS) && !defined(NDEBUG)
assert(DT->verify(DominatorTree::VerificationLevel::Full));

Revision Contents

Path

Size

llvm/

lib/

Transforms/

Utils/

LoopUnrollRuntime.cpp

26 lines

test/

Transforms/

LoopUnroll/

runtime-loop-multiple-exits.ll

862 lines

Diff 367077

llvm/lib/Transforms/Utils/LoopUnrollRuntime.cpp

Show First 20 Lines • Show All 209 Lines • ▼ Show 20 Lines	static void ConnectEpilog(Loop L, Value ModVal, BasicBlock *NewExit,
for (PHINode &PN : NewExit->phis()) {		for (PHINode &PN : NewExit->phis()) {
// PN should be used in another PHI located in Exit block as		// PN should be used in another PHI located in Exit block as
// Exit was split by SplitBlockPredecessors into Exit and NewExit		// Exit was split by SplitBlockPredecessors into Exit and NewExit
// Basicaly it should look like:		// Basicaly it should look like:
// NewExit:		// NewExit:
// PN = PHI [I, Latch]		// PN = PHI [I, Latch]
// ...		// ...
// Exit:		// Exit:
// EpilogPN = PHI [PN, EpilogPreHeader]		// EpilogPN = PHI [PN, EpilogPreHeader], [X, Exit2], [Y, Exit2.epil]
		//
		// Exits from non-latch blocks point to the original exit block and the
		// epilogue edges have already been added.
//		//
// There is EpilogPreHeader incoming block instead of NewExit as		// There is EpilogPreHeader incoming block instead of NewExit as
// NewExit was spilt 1 more time to get EpilogPreHeader.		// NewExit was spilt 1 more time to get EpilogPreHeader.
assert(PN.hasOneUse() && "The phi should have 1 use");		assert(PN.hasOneUse() && "The phi should have 1 use");
PHINode *EpilogPN = cast<PHINode>(PN.use_begin()->getUser());		PHINode *EpilogPN = cast<PHINode>(PN.use_begin()->getUser());
assert(EpilogPN->getParent() == Exit && "EpilogPN should be in Exit block");		assert(EpilogPN->getParent() == Exit && "EpilogPN should be in Exit block");

// Add incoming PreHeader from branch around the Loop		// Add incoming PreHeader from branch around the Loop
▲ Show 20 Lines • Show All 209 Lines • ▼ Show 20 Lines	static bool canSafelyUnrollMultiExitLoop(Loop L, BasicBlock LatchExit,
// loop. Check for these below.		// loop. Check for these below.

// We rely on LCSSA form being preserved when the exit blocks are transformed.		// We rely on LCSSA form being preserved when the exit blocks are transformed.
// (Note that only an off-by-default mode of the old PM disables PreserveLCCA.)		// (Note that only an off-by-default mode of the old PM disables PreserveLCCA.)
if (!PreserveLCSSA)		if (!PreserveLCSSA)
return false;		return false;

// TODO: Support multiple exiting blocks jumping to the `LatchExit` when		// TODO: Support multiple exiting blocks jumping to the `LatchExit` when
// UnrollRuntimeMultiExit is true. This will need updating the logic in		// using a prolog loop.
// connectEpilog/connectProlog.		if (!UseEpilogRemainder && !LatchExit->getSinglePredecessor()) {
if (!LatchExit->getSinglePredecessor()) {
LLVM_DEBUG(		LLVM_DEBUG(
dbgs() << "Bailout for multi-exit handling when latch exit has >1 "		dbgs() << "Bailout for multi-exit handling when latch exit has >1 "
"predecessor.\n");		"predecessor.\n");
return false;		return false;
}		}
// FIXME: We bail out of multi-exit unrolling when epilog loop is generated		// FIXME: We bail out of multi-exit unrolling when epilog loop is generated
// and L is an inner loop. This is because in presence of multiple exits, the		// and L is an inner loop. This is because in presence of multiple exits, the
// outer loop is incorrect: we do not add the EpilogPreheader and exit to the		// outer loop is incorrect: we do not add the EpilogPreheader and exit to the
Show All 17 Lines	assert(canSafelyUnrollMultiExitLoop(L, LatchExit, PreserveLCSSA,
UseEpilogRemainder) &&		UseEpilogRemainder) &&
"Should be safe to unroll before checking profitability!");		"Should be safe to unroll before checking profitability!");
#endif		#endif

// Priority goes to UnrollRuntimeMultiExit if it's supplied.		// Priority goes to UnrollRuntimeMultiExit if it's supplied.
if (UnrollRuntimeMultiExit.getNumOccurrences())		if (UnrollRuntimeMultiExit.getNumOccurrences())
return UnrollRuntimeMultiExit;		return UnrollRuntimeMultiExit;

		// TODO: We used to bail out for correctness (now fixed). Under what
		// circumstances is this case profitable to allow?
		if (!LatchExit->getSinglePredecessor())
		return false;

// The main pain point with multi-exit loop unrolling is that once unrolled,		// The main pain point with multi-exit loop unrolling is that once unrolled,
// we will not be able to merge all blocks into a straight line code.		// we will not be able to merge all blocks into a straight line code.
// There are branches within the unrolled loop that go to the OtherExits.		// There are branches within the unrolled loop that go to the OtherExits.
// The second point is the increase in code size, but this is true		// The second point is the increase in code size, but this is true
// irrespective of multiple exits.		// irrespective of multiple exits.

// Note: Both the heuristics below are coarse grained. We are essentially		// Note: Both the heuristics below are coarse grained. We are essentially
// enabling unrolling of loops that have a single side exit other than the		// enabling unrolling of loops that have a single side exit other than the
▲ Show 20 Lines • Show All 246 Lines • ▼ Show 20 Lines	bool llvm::UnrollRuntimeLoopRemainder(
BasicBlock *EpilogPreHeader = nullptr;		BasicBlock *EpilogPreHeader = nullptr;
BasicBlock *PrologPreHeader = nullptr;		BasicBlock *PrologPreHeader = nullptr;

if (UseEpilogRemainder) {		if (UseEpilogRemainder) {
// If epilog remainder		// If epilog remainder
// Split PreHeader to insert a branch around loop for unrolling.		// Split PreHeader to insert a branch around loop for unrolling.
NewPreHeader = SplitBlock(PreHeader, PreHeader->getTerminator(), DT, LI);		NewPreHeader = SplitBlock(PreHeader, PreHeader->getTerminator(), DT, LI);
NewPreHeader->setName(PreHeader->getName() + ".new");		NewPreHeader->setName(PreHeader->getName() + ".new");
// Split LatchExit to create phi nodes from branch above.		// Split LatchExit to create phi nodes from branch above.
SmallVector<BasicBlock*, 4> Preds(predecessors(LatchExit));		NewExit = SplitBlockPredecessors(LatchExit, {Latch}, ".unr-lcssa", DT, LI,
		nikicUnsubmitted Not Done Reply Inline Actions No need to create a SmallVector anymore here, you can directly pass `{Latch}`. nikic: No need to create a SmallVector anymore here, you can directly pass `{Latch}`.
NewExit = SplitBlockPredecessors(LatchExit, Preds, ".unr-lcssa", DT, LI,
nullptr, PreserveLCSSA);		nullptr, PreserveLCSSA);
// NewExit gets its DebugLoc from LatchExit, which is not part of the		// NewExit gets its DebugLoc from LatchExit, which is not part of the
// original Loop.		// original Loop.
// Fix this by setting Loop's DebugLoc to NewExit.		// Fix this by setting Loop's DebugLoc to NewExit.
auto *NewExitTerminator = NewExit->getTerminator();		auto *NewExitTerminator = NewExit->getTerminator();
NewExitTerminator->setDebugLoc(Header->getTerminator()->getDebugLoc());		NewExitTerminator->setDebugLoc(Header->getTerminator()->getDebugLoc());
// Split NewExit to insert epilog remainder loop.		// Split NewExit to insert epilog remainder loop.
EpilogPreHeader = SplitBlock(NewExit, NewExitTerminator, DT, LI);		EpilogPreHeader = SplitBlock(NewExit, NewExitTerminator, DT, LI);
▲ Show 20 Lines • Show All 98 Lines • ▼ Show 20 Lines	for (auto *BB : OtherExits) {
// loop will be used through these phi nodes at the exit blocks that are		// loop will be used through these phi nodes at the exit blocks that are
// transformed below.		// transformed below.
for (PHINode &PN : BB->phis()) {		for (PHINode &PN : BB->phis()) {
unsigned oldNumOperands = PN.getNumIncomingValues();		unsigned oldNumOperands = PN.getNumIncomingValues();
// Add the incoming values from the remainder code to the end of the phi		// Add the incoming values from the remainder code to the end of the phi
// node.		// node.
for (unsigned i = 0; i < oldNumOperands; i++){		for (unsigned i = 0; i < oldNumOperands; i++){
auto *PredBB =PN.getIncomingBlock(i);		auto *PredBB =PN.getIncomingBlock(i);
		if (PredBB == Latch)
		// The latch exit is handled seperately, see connectX
		continue;
		if (!L->contains(PredBB))
		// Even if we had dedicated exits, the code above inserted an
		// extra branch which can reach the latch exit.
		continue;

auto *V = PN.getIncomingValue(i);		auto *V = PN.getIncomingValue(i);
if (Instruction *I = dyn_cast<Instruction>(V))		if (Instruction *I = dyn_cast<Instruction>(V))
if (L->contains(I))		if (L->contains(I))
V = VMap.lookup(I);		V = VMap.lookup(I);
PN.addIncoming(V, cast<BasicBlock>(VMap[PredBB]));		PN.addIncoming(V, cast<BasicBlock>(VMap[PredBB]));
}		}
}		}
#if defined(EXPENSIVE_CHECKS) && !defined(NDEBUG)		#if defined(EXPENSIVE_CHECKS) && !defined(NDEBUG)
▲ Show 20 Lines • Show All 129 Lines • Show Last 20 Lines

llvm/test/Transforms/LoopUnroll/runtime-loop-multiple-exits.ll

; NOTE: Assertions have been autogenerated by utils/update_test_checks.py UTC_ARGS: -p		; NOTE: Assertions have been autogenerated by utils/update_test_checks.py UTC_ARGS: -p
; RUN: opt < %s -loop-unroll -unroll-runtime=true -unroll-runtime-epilog=true -unroll-runtime-multi-exit=true -verify-loop-lcssa -verify-dom-info -verify-loop-info -S \| FileCheck %s -check-prefixes=CHECK,EPILOG		; RUN: opt < %s -loop-unroll -unroll-runtime=true -unroll-runtime-epilog=true -unroll-runtime-multi-exit=true -verify-loop-lcssa -verify-dom-info -verify-loop-info -S \| FileCheck %s -check-prefixes=CHECK,EPILOG
		nikicUnsubmitted Not Done Reply Inline Actions In https://github.com/llvm/llvm-project/commit/70ffd65ca97bd7010108ad8c1369c105fb78714a you dropped the `-instcombine` from the other RUN lines, so this `EPILOG-NO-IC` line is now redundant and can be dropped. nikic: In https://github.com/llvm/llvm-project/commit/70ffd65ca97bd7010108ad8c1369c105fb78714a you…
; RUN: opt < %s -loop-unroll -unroll-runtime -unroll-count=2 -unroll-runtime-epilog=true -unroll-runtime-multi-exit=true -verify-loop-lcssa -verify-dom-info -verify-loop-info -S \| FileCheck %s -check-prefixes=CHECK,EPILOG-BLOCK		; RUN: opt < %s -loop-unroll -unroll-runtime -unroll-count=2 -unroll-runtime-epilog=true -unroll-runtime-multi-exit=true -verify-loop-lcssa -verify-dom-info -verify-loop-info -S \| FileCheck %s -check-prefixes=CHECK,EPILOG-BLOCK
; RUN: opt < %s -loop-unroll -unroll-runtime=true -unroll-runtime-epilog=false -unroll-runtime-multi-exit=true -verify-loop-lcssa -verify-dom-info -verify-loop-info -S \| FileCheck %s -check-prefixes=CHECK,PROLOG		; RUN: opt < %s -loop-unroll -unroll-runtime=true -unroll-runtime-epilog=false -unroll-runtime-multi-exit=true -verify-loop-lcssa -verify-dom-info -verify-loop-info -S \| FileCheck %s -check-prefixes=CHECK,PROLOG
; RUN: opt < %s -loop-unroll -unroll-runtime -unroll-runtime-epilog=false -unroll-count=2 -unroll-runtime-multi-exit=true -verify-loop-lcssa -verify-dom-info -verify-loop-info -S \| FileCheck %s -check-prefixes=CHECK,PROLOG-BLOCK		; RUN: opt < %s -loop-unroll -unroll-runtime -unroll-runtime-epilog=false -unroll-count=2 -unroll-runtime-multi-exit=true -verify-loop-lcssa -verify-dom-info -verify-loop-info -S \| FileCheck %s -check-prefixes=CHECK,PROLOG-BLOCK

; REQUIRES: asserts		; REQUIRES: asserts

; test with three exiting and three exit blocks.		; test with three exiting and three exit blocks.
; none of the exit blocks have successors		; none of the exit blocks have successors
▲ Show 20 Lines • Show All 1,259 Lines • ▼ Show 20 Lines	exit2.loopexit:
ret void		ret void
}		}

; FIXME: Support multiple exiting blocks to the same latch exit block.		; FIXME: Support multiple exiting blocks to the same latch exit block.
; Three exiting blocks where header and latch exit to same LatchExit.		; Three exiting blocks where header and latch exit to same LatchExit.
define i32 @hdr_latch_same_exit(i32* nocapture %a, i64 %n, i1 %cond) {		define i32 @hdr_latch_same_exit(i32* nocapture %a, i64 %n, i1 %cond) {
; EPILOG-LABEL: @hdr_latch_same_exit(		; EPILOG-LABEL: @hdr_latch_same_exit(
; EPILOG-NEXT: entry:		; EPILOG-NEXT: entry:
		; EPILOG-NEXT: %0 = add i64 %n, -1
		; EPILOG-NEXT: %xtraiter = and i64 %n, 7
		; EPILOG-NEXT: %1 = icmp ult i64 %0, 7
		; EPILOG-NEXT: br i1 %1, label %latchExit.unr-lcssa, label %entry.new
		; EPILOG: entry.new:
		; EPILOG-NEXT: %unroll_iter = sub i64 %n, %xtraiter
; EPILOG-NEXT: br label %header		; EPILOG-NEXT: br label %header
; EPILOG: header:		; EPILOG: header:
; EPILOG-NEXT: %indvars.iv = phi i64 [ %indvars.iv.next, %latch ], [ 0, %entry ]		; EPILOG-NEXT: %indvars.iv = phi i64 [ 0, %entry.new ], [ %indvars.iv.next.7, %latch.7 ]
; EPILOG-NEXT: %sum.02 = phi i32 [ %add, %latch ], [ 0, %entry ]		; EPILOG-NEXT: %sum.02 = phi i32 [ 0, %entry.new ], [ %add.7, %latch.7 ]
; EPILOG-NEXT: br i1 %cond, label %latchExit, label %for.exiting_block		; EPILOG-NEXT: %niter = phi i64 [ %unroll_iter, %entry.new ], [ %niter.nsub.7, %latch.7 ]
		; EPILOG-NEXT: br i1 %cond, label %latchExit.epilog-lcssa.loopexit, label %for.exiting_block
; EPILOG: for.exiting_block:		; EPILOG: for.exiting_block:
; EPILOG-NEXT: %cmp = icmp eq i64 %n, 42		; EPILOG-NEXT: %cmp = icmp eq i64 %n, 42
; EPILOG-NEXT: br i1 %cmp, label %for.exit2, label %latch		; EPILOG-NEXT: br i1 %cmp, label %for.exit2.loopexit, label %latch
; EPILOG: latch:		; EPILOG: latch:
; EPILOG-NEXT: %arrayidx = getelementptr inbounds i32, i32* %a, i64 %indvars.iv		; EPILOG-NEXT: %arrayidx = getelementptr inbounds i32, i32* %a, i64 %indvars.iv
; EPILOG-NEXT: %0 = load i32, i32* %arrayidx, align 4		; EPILOG-NEXT: %2 = load i32, i32* %arrayidx, align 4
; EPILOG-NEXT: %add = add nsw i32 %0, %sum.02		; EPILOG-NEXT: %add = add nsw i32 %2, %sum.02
; EPILOG-NEXT: %indvars.iv.next = add i64 %indvars.iv, 1		; EPILOG-NEXT: %indvars.iv.next = add nuw nsw i64 %indvars.iv, 1
; EPILOG-NEXT: %exitcond = icmp eq i64 %indvars.iv.next, %n		; EPILOG-NEXT: %niter.nsub = sub i64 %niter, 1
; EPILOG-NEXT: br i1 %exitcond, label %latchExit, label %header		; EPILOG-NEXT: br i1 %cond, label %latchExit.epilog-lcssa.loopexit, label %for.exiting_block.1
		; EPILOG: latchExit.unr-lcssa.loopexit:
		; EPILOG-NEXT: %result.ph.ph = phi i32 [ %add.7, %latch.7 ]
		; EPILOG-NEXT: %indvars.iv.unr.ph = phi i64 [ %indvars.iv.next.7, %latch.7 ]
		; EPILOG-NEXT: %sum.02.unr.ph = phi i32 [ %add.7, %latch.7 ]
		; EPILOG-NEXT: br label %latchExit.unr-lcssa
		; EPILOG: latchExit.unr-lcssa:
		; EPILOG-NEXT: %result.ph = phi i32 [ undef, %entry ], [ %result.ph.ph, %latchExit.unr-lcssa.loopexit ]
		; EPILOG-NEXT: %indvars.iv.unr = phi i64 [ 0, %entry ], [ %indvars.iv.unr.ph, %latchExit.unr-lcssa.loopexit ]
		; EPILOG-NEXT: %sum.02.unr = phi i32 [ 0, %entry ], [ %sum.02.unr.ph, %latchExit.unr-lcssa.loopexit ]
		; EPILOG-NEXT: %lcmp.mod = icmp ne i64 %xtraiter, 0
		; EPILOG-NEXT: br i1 %lcmp.mod, label %header.epil.preheader, label %latchExit
		; EPILOG: header.epil.preheader:
		; EPILOG-NEXT: br label %header.epil
		; EPILOG: header.epil:
		; EPILOG-NEXT: %indvars.iv.epil = phi i64 [ %indvars.iv.next.epil, %latch.epil ], [ %indvars.iv.unr, %header.epil.preheader ]
		; EPILOG-NEXT: %sum.02.epil = phi i32 [ %add.epil, %latch.epil ], [ %sum.02.unr, %header.epil.preheader ]
		; EPILOG-NEXT: %epil.iter = phi i64 [ %xtraiter, %header.epil.preheader ], [ %epil.iter.sub, %latch.epil ]
		; EPILOG-NEXT: br i1 %cond, label %latchExit.epilog-lcssa.loopexit2, label %for.exiting_block.epil
		; EPILOG: for.exiting_block.epil:
		; EPILOG-NEXT: %cmp.epil = icmp eq i64 %n, 42
		; EPILOG-NEXT: br i1 %cmp.epil, label %for.exit2.loopexit4, label %latch.epil
		; EPILOG: latch.epil:
		; EPILOG-NEXT: %arrayidx.epil = getelementptr inbounds i32, i32* %a, i64 %indvars.iv.epil
		; EPILOG-NEXT: %3 = load i32, i32* %arrayidx.epil, align 4
		; EPILOG-NEXT: %add.epil = add nsw i32 %3, %sum.02.epil
		; EPILOG-NEXT: %indvars.iv.next.epil = add i64 %indvars.iv.epil, 1
		; EPILOG-NEXT: %exitcond.epil = icmp eq i64 %indvars.iv.next.epil, %n
		; EPILOG-NEXT: %epil.iter.sub = sub i64 %epil.iter, 1
		; EPILOG-NEXT: %epil.iter.cmp = icmp ne i64 %epil.iter.sub, 0
		; EPILOG-NEXT: br i1 %epil.iter.cmp, label %header.epil, label %latchExit.epilog-lcssa.loopexit2, !llvm.loop !4
		; EPILOG: latchExit.epilog-lcssa.loopexit:
		; EPILOG-NEXT: %result.ph1.ph = phi i32 [ 0, %header ], [ 0, %latch ], [ 0, %latch.1 ], [ 0, %latch.2 ], [ 0, %latch.3 ], [ 0, %latch.4 ], [ 0, %latch.5 ], [ 0, %latch.6 ]
		; EPILOG-NEXT: br label %latchExit.epilog-lcssa
		; EPILOG: latchExit.epilog-lcssa.loopexit2:
		; EPILOG-NEXT: %result.ph1.ph3 = phi i32 [ 0, %header.epil ], [ %add.epil, %latch.epil ]
		; EPILOG-NEXT: br label %latchExit.epilog-lcssa
		; EPILOG: latchExit.epilog-lcssa:
		; EPILOG-NEXT: %result.ph1 = phi i32 [ %result.ph1.ph, %latchExit.epilog-lcssa.loopexit ], [ %result.ph1.ph3, %latchExit.epilog-lcssa.loopexit2 ]
		; EPILOG-NEXT: br label %latchExit
; EPILOG: latchExit:		; EPILOG: latchExit:
; EPILOG-NEXT: %result = phi i32 [ 0, %header ], [ %add, %latch ]		; EPILOG-NEXT: %result = phi i32 [ %result.ph, %latchExit.unr-lcssa ], [ %result.ph1, %latchExit.epilog-lcssa ]
; EPILOG-NEXT: ret i32 %result		; EPILOG-NEXT: ret i32 %result
		; EPILOG: for.exit2.loopexit:
		; EPILOG-NEXT: br label %for.exit2
		; EPILOG: for.exit2.loopexit4:
		; EPILOG-NEXT: br label %for.exit2
; EPILOG: for.exit2:		; EPILOG: for.exit2:
; EPILOG-NEXT: ret i32 42		; EPILOG-NEXT: ret i32 42
		; EPILOG: for.exiting_block.1:
		; EPILOG-NEXT: %cmp.1 = icmp eq i64 %n, 42
		; EPILOG-NEXT: br i1 %cmp.1, label %for.exit2.loopexit, label %latch.1
		; EPILOG: latch.1:
		; EPILOG-NEXT: %arrayidx.1 = getelementptr inbounds i32, i32* %a, i64 %indvars.iv.next
		; EPILOG-NEXT: %4 = load i32, i32* %arrayidx.1, align 4
		; EPILOG-NEXT: %add.1 = add nsw i32 %4, %add
		; EPILOG-NEXT: %indvars.iv.next.1 = add nuw nsw i64 %indvars.iv.next, 1
		; EPILOG-NEXT: %niter.nsub.1 = sub i64 %niter.nsub, 1
		; EPILOG-NEXT: br i1 %cond, label %latchExit.epilog-lcssa.loopexit, label %for.exiting_block.2
		; EPILOG: for.exiting_block.2:
		; EPILOG-NEXT: %cmp.2 = icmp eq i64 %n, 42
		; EPILOG-NEXT: br i1 %cmp.2, label %for.exit2.loopexit, label %latch.2
		; EPILOG: latch.2:
		; EPILOG-NEXT: %arrayidx.2 = getelementptr inbounds i32, i32* %a, i64 %indvars.iv.next.1
		; EPILOG-NEXT: %5 = load i32, i32* %arrayidx.2, align 4
		; EPILOG-NEXT: %add.2 = add nsw i32 %5, %add.1
		; EPILOG-NEXT: %indvars.iv.next.2 = add nuw nsw i64 %indvars.iv.next.1, 1
		; EPILOG-NEXT: %niter.nsub.2 = sub i64 %niter.nsub.1, 1
		; EPILOG-NEXT: br i1 %cond, label %latchExit.epilog-lcssa.loopexit, label %for.exiting_block.3
		; EPILOG: for.exiting_block.3:
		; EPILOG-NEXT: %cmp.3 = icmp eq i64 %n, 42
		; EPILOG-NEXT: br i1 %cmp.3, label %for.exit2.loopexit, label %latch.3
		; EPILOG: latch.3:
		; EPILOG-NEXT: %arrayidx.3 = getelementptr inbounds i32, i32* %a, i64 %indvars.iv.next.2
		; EPILOG-NEXT: %6 = load i32, i32* %arrayidx.3, align 4
		; EPILOG-NEXT: %add.3 = add nsw i32 %6, %add.2
		; EPILOG-NEXT: %indvars.iv.next.3 = add nuw nsw i64 %indvars.iv.next.2, 1
		; EPILOG-NEXT: %niter.nsub.3 = sub i64 %niter.nsub.2, 1
		; EPILOG-NEXT: br i1 %cond, label %latchExit.epilog-lcssa.loopexit, label %for.exiting_block.4
		; EPILOG: for.exiting_block.4:
		; EPILOG-NEXT: %cmp.4 = icmp eq i64 %n, 42
		; EPILOG-NEXT: br i1 %cmp.4, label %for.exit2.loopexit, label %latch.4
		; EPILOG: latch.4:
		; EPILOG-NEXT: %arrayidx.4 = getelementptr inbounds i32, i32* %a, i64 %indvars.iv.next.3
		; EPILOG-NEXT: %7 = load i32, i32* %arrayidx.4, align 4
		; EPILOG-NEXT: %add.4 = add nsw i32 %7, %add.3
		; EPILOG-NEXT: %indvars.iv.next.4 = add nuw nsw i64 %indvars.iv.next.3, 1
		; EPILOG-NEXT: %niter.nsub.4 = sub i64 %niter.nsub.3, 1
		; EPILOG-NEXT: br i1 %cond, label %latchExit.epilog-lcssa.loopexit, label %for.exiting_block.5
		; EPILOG: for.exiting_block.5:
		; EPILOG-NEXT: %cmp.5 = icmp eq i64 %n, 42
		; EPILOG-NEXT: br i1 %cmp.5, label %for.exit2.loopexit, label %latch.5
		; EPILOG: latch.5:
		; EPILOG-NEXT: %arrayidx.5 = getelementptr inbounds i32, i32* %a, i64 %indvars.iv.next.4
		; EPILOG-NEXT: %8 = load i32, i32* %arrayidx.5, align 4
		; EPILOG-NEXT: %add.5 = add nsw i32 %8, %add.4
		; EPILOG-NEXT: %indvars.iv.next.5 = add nuw nsw i64 %indvars.iv.next.4, 1
		; EPILOG-NEXT: %niter.nsub.5 = sub i64 %niter.nsub.4, 1
		; EPILOG-NEXT: br i1 %cond, label %latchExit.epilog-lcssa.loopexit, label %for.exiting_block.6
		; EPILOG: for.exiting_block.6:
		; EPILOG-NEXT: %cmp.6 = icmp eq i64 %n, 42
		; EPILOG-NEXT: br i1 %cmp.6, label %for.exit2.loopexit, label %latch.6
		; EPILOG: latch.6:
		; EPILOG-NEXT: %arrayidx.6 = getelementptr inbounds i32, i32* %a, i64 %indvars.iv.next.5
		; EPILOG-NEXT: %9 = load i32, i32* %arrayidx.6, align 4
		; EPILOG-NEXT: %add.6 = add nsw i32 %9, %add.5
		; EPILOG-NEXT: %indvars.iv.next.6 = add nuw nsw i64 %indvars.iv.next.5, 1
		; EPILOG-NEXT: %niter.nsub.6 = sub i64 %niter.nsub.5, 1
		; EPILOG-NEXT: br i1 %cond, label %latchExit.epilog-lcssa.loopexit, label %for.exiting_block.7
		; EPILOG: for.exiting_block.7:
		; EPILOG-NEXT: %cmp.7 = icmp eq i64 %n, 42
		; EPILOG-NEXT: br i1 %cmp.7, label %for.exit2.loopexit, label %latch.7
		; EPILOG: latch.7:
		; EPILOG-NEXT: %arrayidx.7 = getelementptr inbounds i32, i32* %a, i64 %indvars.iv.next.6
		; EPILOG-NEXT: %10 = load i32, i32* %arrayidx.7, align 4
		; EPILOG-NEXT: %add.7 = add nsw i32 %10, %add.6
		; EPILOG-NEXT: %indvars.iv.next.7 = add i64 %indvars.iv.next.6, 1
		; EPILOG-NEXT: %niter.nsub.7 = sub i64 %niter.nsub.6, 1
		; EPILOG-NEXT: %niter.ncmp.7 = icmp eq i64 %niter.nsub.7, 0
		; EPILOG-NEXT: br i1 %niter.ncmp.7, label %latchExit.unr-lcssa.loopexit, label %header
;		;
; EPILOG-BLOCK-LABEL: @hdr_latch_same_exit(		; EPILOG-BLOCK-LABEL: @hdr_latch_same_exit(
; EPILOG-BLOCK-NEXT: entry:		; EPILOG-BLOCK-NEXT: entry:
		; EPILOG-BLOCK-NEXT: %0 = add i64 %n, -1
		; EPILOG-BLOCK-NEXT: %xtraiter = and i64 %n, 1
		; EPILOG-BLOCK-NEXT: %1 = icmp ult i64 %0, 1
		; EPILOG-BLOCK-NEXT: br i1 %1, label %latchExit.unr-lcssa, label %entry.new
		; EPILOG-BLOCK: entry.new:
		; EPILOG-BLOCK-NEXT: %unroll_iter = sub i64 %n, %xtraiter
; EPILOG-BLOCK-NEXT: br label %header		; EPILOG-BLOCK-NEXT: br label %header
; EPILOG-BLOCK: header:		; EPILOG-BLOCK: header:
; EPILOG-BLOCK-NEXT: %indvars.iv = phi i64 [ 0, %entry ], [ %indvars.iv.next.1, %latch.1 ]		; EPILOG-BLOCK-NEXT: %indvars.iv = phi i64 [ 0, %entry.new ], [ %indvars.iv.next.1, %latch.1 ]
; EPILOG-BLOCK-NEXT: %sum.02 = phi i32 [ 0, %entry ], [ %add.1, %latch.1 ]		; EPILOG-BLOCK-NEXT: %sum.02 = phi i32 [ 0, %entry.new ], [ %add.1, %latch.1 ]
; EPILOG-BLOCK-NEXT: br i1 %cond, label %latchExit, label %for.exiting_block		; EPILOG-BLOCK-NEXT: %niter = phi i64 [ %unroll_iter, %entry.new ], [ %niter.nsub.1, %latch.1 ]
		; EPILOG-BLOCK-NEXT: br i1 %cond, label %latchExit.epilog-lcssa.loopexit, label %for.exiting_block
; EPILOG-BLOCK: for.exiting_block:		; EPILOG-BLOCK: for.exiting_block:
; EPILOG-BLOCK-NEXT: %cmp = icmp eq i64 %n, 42		; EPILOG-BLOCK-NEXT: %cmp = icmp eq i64 %n, 42
; EPILOG-BLOCK-NEXT: br i1 %cmp, label %for.exit2, label %latch		; EPILOG-BLOCK-NEXT: br i1 %cmp, label %for.exit2.loopexit, label %latch
; EPILOG-BLOCK: latch:		; EPILOG-BLOCK: latch:
; EPILOG-BLOCK-NEXT: %arrayidx = getelementptr inbounds i32, i32* %a, i64 %indvars.iv		; EPILOG-BLOCK-NEXT: %arrayidx = getelementptr inbounds i32, i32* %a, i64 %indvars.iv
; EPILOG-BLOCK-NEXT: %0 = load i32, i32* %arrayidx, align 4		; EPILOG-BLOCK-NEXT: %2 = load i32, i32* %arrayidx, align 4
; EPILOG-BLOCK-NEXT: %add = add nsw i32 %0, %sum.02		; EPILOG-BLOCK-NEXT: %add = add nsw i32 %2, %sum.02
; EPILOG-BLOCK-NEXT: %indvars.iv.next = add nuw nsw i64 %indvars.iv, 1		; EPILOG-BLOCK-NEXT: %indvars.iv.next = add nuw nsw i64 %indvars.iv, 1
; EPILOG-BLOCK-NEXT: %exitcond = icmp eq i64 %indvars.iv.next, %n		; EPILOG-BLOCK-NEXT: %niter.nsub = sub i64 %niter, 1
; EPILOG-BLOCK-NEXT: br i1 %exitcond, label %latchExit, label %header.1		; EPILOG-BLOCK-NEXT: br i1 %cond, label %latchExit.epilog-lcssa.loopexit, label %for.exiting_block.1
		; EPILOG-BLOCK: latchExit.unr-lcssa.loopexit:
		; EPILOG-BLOCK-NEXT: %result.ph.ph = phi i32 [ %add.1, %latch.1 ]
		; EPILOG-BLOCK-NEXT: %indvars.iv.unr.ph = phi i64 [ %indvars.iv.next.1, %latch.1 ]
		; EPILOG-BLOCK-NEXT: %sum.02.unr.ph = phi i32 [ %add.1, %latch.1 ]
		; EPILOG-BLOCK-NEXT: br label %latchExit.unr-lcssa
		; EPILOG-BLOCK: latchExit.unr-lcssa:
		; EPILOG-BLOCK-NEXT: %result.ph = phi i32 [ undef, %entry ], [ %result.ph.ph, %latchExit.unr-lcssa.loopexit ]
		; EPILOG-BLOCK-NEXT: %indvars.iv.unr = phi i64 [ 0, %entry ], [ %indvars.iv.unr.ph, %latchExit.unr-lcssa.loopexit ]
		; EPILOG-BLOCK-NEXT: %sum.02.unr = phi i32 [ 0, %entry ], [ %sum.02.unr.ph, %latchExit.unr-lcssa.loopexit ]
		; EPILOG-BLOCK-NEXT: %lcmp.mod = icmp ne i64 %xtraiter, 0
		; EPILOG-BLOCK-NEXT: br i1 %lcmp.mod, label %header.epil.preheader, label %latchExit
		; EPILOG-BLOCK: header.epil.preheader:
		; EPILOG-BLOCK-NEXT: br label %header.epil
		; EPILOG-BLOCK: header.epil:
		; EPILOG-BLOCK-NEXT: %indvars.iv.epil = phi i64 [ %indvars.iv.unr, %header.epil.preheader ]
		; EPILOG-BLOCK-NEXT: %sum.02.epil = phi i32 [ %sum.02.unr, %header.epil.preheader ]
		; EPILOG-BLOCK-NEXT: br i1 %cond, label %latchExit.epilog-lcssa, label %for.exiting_block.epil
		; EPILOG-BLOCK: for.exiting_block.epil:
		; EPILOG-BLOCK-NEXT: %cmp.epil = icmp eq i64 %n, 42
		; EPILOG-BLOCK-NEXT: br i1 %cmp.epil, label %for.exit2, label %latch.epil
		; EPILOG-BLOCK: latch.epil:
		; EPILOG-BLOCK-NEXT: %arrayidx.epil = getelementptr inbounds i32, i32* %a, i64 %indvars.iv.epil
		; EPILOG-BLOCK-NEXT: %3 = load i32, i32* %arrayidx.epil, align 4
		; EPILOG-BLOCK-NEXT: %add.epil = add nsw i32 %3, %sum.02.epil
		; EPILOG-BLOCK-NEXT: %indvars.iv.next.epil = add i64 %indvars.iv.epil, 1
		; EPILOG-BLOCK-NEXT: %exitcond.epil = icmp eq i64 %indvars.iv.next.epil, %n
		; EPILOG-BLOCK-NEXT: br label %latchExit.epilog-lcssa
		; EPILOG-BLOCK: latchExit.epilog-lcssa.loopexit:
		; EPILOG-BLOCK-NEXT: %result.ph1.ph = phi i32 [ 0, %header ], [ 0, %latch ]
		; EPILOG-BLOCK-NEXT: br label %latchExit.epilog-lcssa
		; EPILOG-BLOCK: latchExit.epilog-lcssa:
		; EPILOG-BLOCK-NEXT: %result.ph1 = phi i32 [ %add.epil, %latch.epil ], [ 0, %header.epil ], [ %result.ph1.ph, %latchExit.epilog-lcssa.loopexit ]
		; EPILOG-BLOCK-NEXT: br label %latchExit
; EPILOG-BLOCK: latchExit:		; EPILOG-BLOCK: latchExit:
; EPILOG-BLOCK-NEXT: %result = phi i32 [ 0, %header ], [ %add, %latch ], [ 0, %header.1 ], [ %add.1, %latch.1 ]		; EPILOG-BLOCK-NEXT: %result = phi i32 [ %result.ph, %latchExit.unr-lcssa ], [ %result.ph1, %latchExit.epilog-lcssa ]
; EPILOG-BLOCK-NEXT: ret i32 %result		; EPILOG-BLOCK-NEXT: ret i32 %result
		; EPILOG-BLOCK: for.exit2.loopexit:
		; EPILOG-BLOCK-NEXT: br label %for.exit2
; EPILOG-BLOCK: for.exit2:		; EPILOG-BLOCK: for.exit2:
; EPILOG-BLOCK-NEXT: ret i32 42		; EPILOG-BLOCK-NEXT: ret i32 42
; EPILOG-BLOCK: header.1:
; EPILOG-BLOCK-NEXT: br i1 %cond, label %latchExit, label %for.exiting_block.1
; EPILOG-BLOCK: for.exiting_block.1:		; EPILOG-BLOCK: for.exiting_block.1:
; EPILOG-BLOCK-NEXT: %cmp.1 = icmp eq i64 %n, 42		; EPILOG-BLOCK-NEXT: %cmp.1 = icmp eq i64 %n, 42
; EPILOG-BLOCK-NEXT: br i1 %cmp.1, label %for.exit2, label %latch.1		; EPILOG-BLOCK-NEXT: br i1 %cmp.1, label %for.exit2.loopexit, label %latch.1
; EPILOG-BLOCK: latch.1:		; EPILOG-BLOCK: latch.1:
; EPILOG-BLOCK-NEXT: %arrayidx.1 = getelementptr inbounds i32, i32* %a, i64 %indvars.iv.next		; EPILOG-BLOCK-NEXT: %arrayidx.1 = getelementptr inbounds i32, i32* %a, i64 %indvars.iv.next
; EPILOG-BLOCK-NEXT: %1 = load i32, i32* %arrayidx.1, align 4		; EPILOG-BLOCK-NEXT: %4 = load i32, i32* %arrayidx.1, align 4
; EPILOG-BLOCK-NEXT: %add.1 = add nsw i32 %1, %add		; EPILOG-BLOCK-NEXT: %add.1 = add nsw i32 %4, %add
; EPILOG-BLOCK-NEXT: %indvars.iv.next.1 = add i64 %indvars.iv.next, 1		; EPILOG-BLOCK-NEXT: %indvars.iv.next.1 = add i64 %indvars.iv.next, 1
; EPILOG-BLOCK-NEXT: %exitcond.1 = icmp eq i64 %indvars.iv.next.1, %n		; EPILOG-BLOCK-NEXT: %niter.nsub.1 = sub i64 %niter.nsub, 1
; EPILOG-BLOCK-NEXT: br i1 %exitcond.1, label %latchExit, label %header, !llvm.loop !4		; EPILOG-BLOCK-NEXT: %niter.ncmp.1 = icmp eq i64 %niter.nsub.1, 0
		; EPILOG-BLOCK-NEXT: br i1 %niter.ncmp.1, label %latchExit.unr-lcssa.loopexit, label %header, !llvm.loop !4
;		;
; PROLOG-LABEL: @hdr_latch_same_exit(		; PROLOG-LABEL: @hdr_latch_same_exit(
; PROLOG-NEXT: entry:		; PROLOG-NEXT: entry:
; PROLOG-NEXT: br label %header		; PROLOG-NEXT: br label %header
; PROLOG: header:		; PROLOG: header:
; PROLOG-NEXT: %indvars.iv = phi i64 [ %indvars.iv.next, %latch ], [ 0, %entry ]		; PROLOG-NEXT: %indvars.iv = phi i64 [ %indvars.iv.next, %latch ], [ 0, %entry ]
; PROLOG-NEXT: %sum.02 = phi i32 [ %add, %latch ], [ 0, %entry ]		; PROLOG-NEXT: %sum.02 = phi i32 [ %add, %latch ], [ 0, %entry ]
; PROLOG-NEXT: br i1 %cond, label %latchExit, label %for.exiting_block		; PROLOG-NEXT: br i1 %cond, label %latchExit, label %for.exiting_block
▲ Show 20 Lines • Show All 78 Lines • ▼ Show 20 Lines
}		}

; Two exiting blocks to latch where the exiting blocks are Latch and a		; Two exiting blocks to latch where the exiting blocks are Latch and a
; non-header		; non-header
; FIXME: We should unroll this loop.		; FIXME: We should unroll this loop.
define i32 @otherblock_latch_same_exit(i32* nocapture %a, i64 %n, i1 %cond) {		define i32 @otherblock_latch_same_exit(i32* nocapture %a, i64 %n, i1 %cond) {
; EPILOG-LABEL: @otherblock_latch_same_exit(		; EPILOG-LABEL: @otherblock_latch_same_exit(
; EPILOG-NEXT: entry:		; EPILOG-NEXT: entry:
		; EPILOG-NEXT: %0 = add i64 %n, -1
		; EPILOG-NEXT: %xtraiter = and i64 %n, 7
		; EPILOG-NEXT: %1 = icmp ult i64 %0, 7
		; EPILOG-NEXT: br i1 %1, label %latchExit.unr-lcssa, label %entry.new
		; EPILOG: entry.new:
		; EPILOG-NEXT: %unroll_iter = sub i64 %n, %xtraiter
; EPILOG-NEXT: br label %header		; EPILOG-NEXT: br label %header
; EPILOG: header:		; EPILOG: header:
; EPILOG-NEXT: %indvars.iv = phi i64 [ %indvars.iv.next, %latch ], [ 0, %entry ]		; EPILOG-NEXT: %indvars.iv = phi i64 [ 0, %entry.new ], [ %indvars.iv.next.7, %latch.7 ]
; EPILOG-NEXT: %sum.02 = phi i32 [ %add, %latch ], [ 0, %entry ]		; EPILOG-NEXT: %sum.02 = phi i32 [ 0, %entry.new ], [ %add.7, %latch.7 ]
; EPILOG-NEXT: br i1 %cond, label %for.exit2, label %for.exiting_block		; EPILOG-NEXT: %niter = phi i64 [ %unroll_iter, %entry.new ], [ %niter.nsub.7, %latch.7 ]
		; EPILOG-NEXT: br i1 %cond, label %for.exit2.loopexit, label %for.exiting_block
; EPILOG: for.exiting_block:		; EPILOG: for.exiting_block:
; EPILOG-NEXT: %cmp = icmp eq i64 %n, 42		; EPILOG-NEXT: %cmp = icmp eq i64 %n, 42
; EPILOG-NEXT: br i1 %cmp, label %latchExit, label %latch		; EPILOG-NEXT: br i1 %cmp, label %latchExit.epilog-lcssa.loopexit, label %latch
; EPILOG: latch:		; EPILOG: latch:
; EPILOG-NEXT: %arrayidx = getelementptr inbounds i32, i32* %a, i64 %indvars.iv		; EPILOG-NEXT: %arrayidx = getelementptr inbounds i32, i32* %a, i64 %indvars.iv
; EPILOG-NEXT: %0 = load i32, i32* %arrayidx, align 4		; EPILOG-NEXT: %2 = load i32, i32* %arrayidx, align 4
; EPILOG-NEXT: %add = add nsw i32 %0, %sum.02		; EPILOG-NEXT: %add = add nsw i32 %2, %sum.02
; EPILOG-NEXT: %indvars.iv.next = add i64 %indvars.iv, 1		; EPILOG-NEXT: %indvars.iv.next = add nuw nsw i64 %indvars.iv, 1
; EPILOG-NEXT: %exitcond = icmp eq i64 %indvars.iv.next, %n		; EPILOG-NEXT: %niter.nsub = sub i64 %niter, 1
; EPILOG-NEXT: br i1 %exitcond, label %latchExit, label %header		; EPILOG-NEXT: br i1 %cond, label %for.exit2.loopexit, label %for.exiting_block.1
		; EPILOG: latchExit.unr-lcssa.loopexit:
		; EPILOG-NEXT: %result.ph.ph = phi i32 [ %add.7, %latch.7 ]
		; EPILOG-NEXT: %indvars.iv.unr.ph = phi i64 [ %indvars.iv.next.7, %latch.7 ]
		; EPILOG-NEXT: %sum.02.unr.ph = phi i32 [ %add.7, %latch.7 ]
		; EPILOG-NEXT: br label %latchExit.unr-lcssa
		; EPILOG: latchExit.unr-lcssa:
		; EPILOG-NEXT: %result.ph = phi i32 [ undef, %entry ], [ %result.ph.ph, %latchExit.unr-lcssa.loopexit ]
		; EPILOG-NEXT: %indvars.iv.unr = phi i64 [ 0, %entry ], [ %indvars.iv.unr.ph, %latchExit.unr-lcssa.loopexit ]
		; EPILOG-NEXT: %sum.02.unr = phi i32 [ 0, %entry ], [ %sum.02.unr.ph, %latchExit.unr-lcssa.loopexit ]
		; EPILOG-NEXT: %lcmp.mod = icmp ne i64 %xtraiter, 0
		; EPILOG-NEXT: br i1 %lcmp.mod, label %header.epil.preheader, label %latchExit
		; EPILOG: header.epil.preheader:
		; EPILOG-NEXT: br label %header.epil
		; EPILOG: header.epil:
		; EPILOG-NEXT: %indvars.iv.epil = phi i64 [ %indvars.iv.next.epil, %latch.epil ], [ %indvars.iv.unr, %header.epil.preheader ]
		; EPILOG-NEXT: %sum.02.epil = phi i32 [ %add.epil, %latch.epil ], [ %sum.02.unr, %header.epil.preheader ]
		; EPILOG-NEXT: %epil.iter = phi i64 [ %xtraiter, %header.epil.preheader ], [ %epil.iter.sub, %latch.epil ]
		; EPILOG-NEXT: br i1 %cond, label %for.exit2.loopexit2, label %for.exiting_block.epil
		; EPILOG: for.exiting_block.epil:
		; EPILOG-NEXT: %cmp.epil = icmp eq i64 %n, 42
		; EPILOG-NEXT: br i1 %cmp.epil, label %latchExit.epilog-lcssa.loopexit3, label %latch.epil
		; EPILOG: latch.epil:
		; EPILOG-NEXT: %arrayidx.epil = getelementptr inbounds i32, i32* %a, i64 %indvars.iv.epil
		; EPILOG-NEXT: %3 = load i32, i32* %arrayidx.epil, align 4
		; EPILOG-NEXT: %add.epil = add nsw i32 %3, %sum.02.epil
		; EPILOG-NEXT: %indvars.iv.next.epil = add i64 %indvars.iv.epil, 1
		; EPILOG-NEXT: %exitcond.epil = icmp eq i64 %indvars.iv.next.epil, %n
		; EPILOG-NEXT: %epil.iter.sub = sub i64 %epil.iter, 1
		; EPILOG-NEXT: %epil.iter.cmp = icmp ne i64 %epil.iter.sub, 0
		; EPILOG-NEXT: br i1 %epil.iter.cmp, label %header.epil, label %latchExit.epilog-lcssa.loopexit3, !llvm.loop !5
		; EPILOG: latchExit.epilog-lcssa.loopexit:
		; EPILOG-NEXT: %result.ph1.ph = phi i32 [ 2, %for.exiting_block ], [ 2, %for.exiting_block.1 ], [ 2, %for.exiting_block.2 ], [ 2, %for.exiting_block.3 ], [ 2, %for.exiting_block.4 ], [ 2, %for.exiting_block.5 ], [ 2, %for.exiting_block.6 ], [ 2, %for.exiting_block.7 ]
		; EPILOG-NEXT: br label %latchExit.epilog-lcssa
		; EPILOG: latchExit.epilog-lcssa.loopexit3:
		; EPILOG-NEXT: %result.ph1.ph4 = phi i32 [ 2, %for.exiting_block.epil ], [ %add.epil, %latch.epil ]
		; EPILOG-NEXT: br label %latchExit.epilog-lcssa
		; EPILOG: latchExit.epilog-lcssa:
		; EPILOG-NEXT: %result.ph1 = phi i32 [ %result.ph1.ph, %latchExit.epilog-lcssa.loopexit ], [ %result.ph1.ph4, %latchExit.epilog-lcssa.loopexit3 ]
		; EPILOG-NEXT: br label %latchExit
; EPILOG: latchExit:		; EPILOG: latchExit:
; EPILOG-NEXT: %result = phi i32 [ 2, %for.exiting_block ], [ %add, %latch ]		; EPILOG-NEXT: %result = phi i32 [ %result.ph, %latchExit.unr-lcssa ], [ %result.ph1, %latchExit.epilog-lcssa ]
; EPILOG-NEXT: ret i32 %result		; EPILOG-NEXT: ret i32 %result
		; EPILOG: for.exit2.loopexit:
		; EPILOG-NEXT: br label %for.exit2
		; EPILOG: for.exit2.loopexit2:
		; EPILOG-NEXT: br label %for.exit2
; EPILOG: for.exit2:		; EPILOG: for.exit2:
; EPILOG-NEXT: ret i32 42		; EPILOG-NEXT: ret i32 42
		; EPILOG: for.exiting_block.1:
		; EPILOG-NEXT: %cmp.1 = icmp eq i64 %n, 42
		; EPILOG-NEXT: br i1 %cmp.1, label %latchExit.epilog-lcssa.loopexit, label %latch.1
		; EPILOG: latch.1:
		; EPILOG-NEXT: %arrayidx.1 = getelementptr inbounds i32, i32* %a, i64 %indvars.iv.next
		; EPILOG-NEXT: %4 = load i32, i32* %arrayidx.1, align 4
		; EPILOG-NEXT: %add.1 = add nsw i32 %4, %add
		; EPILOG-NEXT: %indvars.iv.next.1 = add nuw nsw i64 %indvars.iv.next, 1
		; EPILOG-NEXT: %niter.nsub.1 = sub i64 %niter.nsub, 1
		; EPILOG-NEXT: br i1 %cond, label %for.exit2.loopexit, label %for.exiting_block.2
		; EPILOG: for.exiting_block.2:
		; EPILOG-NEXT: %cmp.2 = icmp eq i64 %n, 42
		; EPILOG-NEXT: br i1 %cmp.2, label %latchExit.epilog-lcssa.loopexit, label %latch.2
		; EPILOG: latch.2:
		; EPILOG-NEXT: %arrayidx.2 = getelementptr inbounds i32, i32* %a, i64 %indvars.iv.next.1
		; EPILOG-NEXT: %5 = load i32, i32* %arrayidx.2, align 4
		; EPILOG-NEXT: %add.2 = add nsw i32 %5, %add.1
		; EPILOG-NEXT: %indvars.iv.next.2 = add nuw nsw i64 %indvars.iv.next.1, 1
		; EPILOG-NEXT: %niter.nsub.2 = sub i64 %niter.nsub.1, 1
		; EPILOG-NEXT: br i1 %cond, label %for.exit2.loopexit, label %for.exiting_block.3
		; EPILOG: for.exiting_block.3:
		; EPILOG-NEXT: %cmp.3 = icmp eq i64 %n, 42
		; EPILOG-NEXT: br i1 %cmp.3, label %latchExit.epilog-lcssa.loopexit, label %latch.3
		; EPILOG: latch.3:
		; EPILOG-NEXT: %arrayidx.3 = getelementptr inbounds i32, i32* %a, i64 %indvars.iv.next.2
		; EPILOG-NEXT: %6 = load i32, i32* %arrayidx.3, align 4
		; EPILOG-NEXT: %add.3 = add nsw i32 %6, %add.2
		; EPILOG-NEXT: %indvars.iv.next.3 = add nuw nsw i64 %indvars.iv.next.2, 1
		; EPILOG-NEXT: %niter.nsub.3 = sub i64 %niter.nsub.2, 1
		; EPILOG-NEXT: br i1 %cond, label %for.exit2.loopexit, label %for.exiting_block.4
		; EPILOG: for.exiting_block.4:
		; EPILOG-NEXT: %cmp.4 = icmp eq i64 %n, 42
		; EPILOG-NEXT: br i1 %cmp.4, label %latchExit.epilog-lcssa.loopexit, label %latch.4
		; EPILOG: latch.4:
		; EPILOG-NEXT: %arrayidx.4 = getelementptr inbounds i32, i32* %a, i64 %indvars.iv.next.3
		; EPILOG-NEXT: %7 = load i32, i32* %arrayidx.4, align 4
		; EPILOG-NEXT: %add.4 = add nsw i32 %7, %add.3
		; EPILOG-NEXT: %indvars.iv.next.4 = add nuw nsw i64 %indvars.iv.next.3, 1
		; EPILOG-NEXT: %niter.nsub.4 = sub i64 %niter.nsub.3, 1
		; EPILOG-NEXT: br i1 %cond, label %for.exit2.loopexit, label %for.exiting_block.5
		; EPILOG: for.exiting_block.5:
		; EPILOG-NEXT: %cmp.5 = icmp eq i64 %n, 42
		; EPILOG-NEXT: br i1 %cmp.5, label %latchExit.epilog-lcssa.loopexit, label %latch.5
		; EPILOG: latch.5:
		; EPILOG-NEXT: %arrayidx.5 = getelementptr inbounds i32, i32* %a, i64 %indvars.iv.next.4
		; EPILOG-NEXT: %8 = load i32, i32* %arrayidx.5, align 4
		; EPILOG-NEXT: %add.5 = add nsw i32 %8, %add.4
		; EPILOG-NEXT: %indvars.iv.next.5 = add nuw nsw i64 %indvars.iv.next.4, 1
		; EPILOG-NEXT: %niter.nsub.5 = sub i64 %niter.nsub.4, 1
		; EPILOG-NEXT: br i1 %cond, label %for.exit2.loopexit, label %for.exiting_block.6
		; EPILOG: for.exiting_block.6:
		; EPILOG-NEXT: %cmp.6 = icmp eq i64 %n, 42
		; EPILOG-NEXT: br i1 %cmp.6, label %latchExit.epilog-lcssa.loopexit, label %latch.6
		; EPILOG: latch.6:
		; EPILOG-NEXT: %arrayidx.6 = getelementptr inbounds i32, i32* %a, i64 %indvars.iv.next.5
		; EPILOG-NEXT: %9 = load i32, i32* %arrayidx.6, align 4
		; EPILOG-NEXT: %add.6 = add nsw i32 %9, %add.5
		; EPILOG-NEXT: %indvars.iv.next.6 = add nuw nsw i64 %indvars.iv.next.5, 1
		; EPILOG-NEXT: %niter.nsub.6 = sub i64 %niter.nsub.5, 1
		; EPILOG-NEXT: br i1 %cond, label %for.exit2.loopexit, label %for.exiting_block.7
		; EPILOG: for.exiting_block.7:
		; EPILOG-NEXT: %cmp.7 = icmp eq i64 %n, 42
		; EPILOG-NEXT: br i1 %cmp.7, label %latchExit.epilog-lcssa.loopexit, label %latch.7
		; EPILOG: latch.7:
		; EPILOG-NEXT: %arrayidx.7 = getelementptr inbounds i32, i32* %a, i64 %indvars.iv.next.6
		; EPILOG-NEXT: %10 = load i32, i32* %arrayidx.7, align 4
		; EPILOG-NEXT: %add.7 = add nsw i32 %10, %add.6
		; EPILOG-NEXT: %indvars.iv.next.7 = add i64 %indvars.iv.next.6, 1
		; EPILOG-NEXT: %niter.nsub.7 = sub i64 %niter.nsub.6, 1
		; EPILOG-NEXT: %niter.ncmp.7 = icmp eq i64 %niter.nsub.7, 0
		; EPILOG-NEXT: br i1 %niter.ncmp.7, label %latchExit.unr-lcssa.loopexit, label %header
;		;
; EPILOG-BLOCK-LABEL: @otherblock_latch_same_exit(		; EPILOG-BLOCK-LABEL: @otherblock_latch_same_exit(
; EPILOG-BLOCK-NEXT: entry:		; EPILOG-BLOCK-NEXT: entry:
		; EPILOG-BLOCK-NEXT: %0 = add i64 %n, -1
		; EPILOG-BLOCK-NEXT: %xtraiter = and i64 %n, 1
		; EPILOG-BLOCK-NEXT: %1 = icmp ult i64 %0, 1
		; EPILOG-BLOCK-NEXT: br i1 %1, label %latchExit.unr-lcssa, label %entry.new
		; EPILOG-BLOCK: entry.new:
		; EPILOG-BLOCK-NEXT: %unroll_iter = sub i64 %n, %xtraiter
; EPILOG-BLOCK-NEXT: br label %header		; EPILOG-BLOCK-NEXT: br label %header
; EPILOG-BLOCK: header:		; EPILOG-BLOCK: header:
; EPILOG-BLOCK-NEXT: %indvars.iv = phi i64 [ 0, %entry ], [ %indvars.iv.next.1, %latch.1 ]		; EPILOG-BLOCK-NEXT: %indvars.iv = phi i64 [ 0, %entry.new ], [ %indvars.iv.next.1, %latch.1 ]
; EPILOG-BLOCK-NEXT: %sum.02 = phi i32 [ 0, %entry ], [ %add.1, %latch.1 ]		; EPILOG-BLOCK-NEXT: %sum.02 = phi i32 [ 0, %entry.new ], [ %add.1, %latch.1 ]
; EPILOG-BLOCK-NEXT: br i1 %cond, label %for.exit2, label %for.exiting_block		; EPILOG-BLOCK-NEXT: %niter = phi i64 [ %unroll_iter, %entry.new ], [ %niter.nsub.1, %latch.1 ]
		; EPILOG-BLOCK-NEXT: br i1 %cond, label %for.exit2.loopexit, label %for.exiting_block
; EPILOG-BLOCK: for.exiting_block:		; EPILOG-BLOCK: for.exiting_block:
; EPILOG-BLOCK-NEXT: %cmp = icmp eq i64 %n, 42		; EPILOG-BLOCK-NEXT: %cmp = icmp eq i64 %n, 42
; EPILOG-BLOCK-NEXT: br i1 %cmp, label %latchExit, label %latch		; EPILOG-BLOCK-NEXT: br i1 %cmp, label %latchExit.epilog-lcssa.loopexit, label %latch
; EPILOG-BLOCK: latch:		; EPILOG-BLOCK: latch:
; EPILOG-BLOCK-NEXT: %arrayidx = getelementptr inbounds i32, i32* %a, i64 %indvars.iv		; EPILOG-BLOCK-NEXT: %arrayidx = getelementptr inbounds i32, i32* %a, i64 %indvars.iv
; EPILOG-BLOCK-NEXT: %0 = load i32, i32* %arrayidx, align 4		; EPILOG-BLOCK-NEXT: %2 = load i32, i32* %arrayidx, align 4
; EPILOG-BLOCK-NEXT: %add = add nsw i32 %0, %sum.02		; EPILOG-BLOCK-NEXT: %add = add nsw i32 %2, %sum.02
; EPILOG-BLOCK-NEXT: %indvars.iv.next = add nuw nsw i64 %indvars.iv, 1		; EPILOG-BLOCK-NEXT: %indvars.iv.next = add nuw nsw i64 %indvars.iv, 1
; EPILOG-BLOCK-NEXT: %exitcond = icmp eq i64 %indvars.iv.next, %n		; EPILOG-BLOCK-NEXT: %niter.nsub = sub i64 %niter, 1
; EPILOG-BLOCK-NEXT: br i1 %exitcond, label %latchExit, label %header.1		; EPILOG-BLOCK-NEXT: br i1 %cond, label %for.exit2.loopexit, label %for.exiting_block.1
		; EPILOG-BLOCK: latchExit.unr-lcssa.loopexit:
		; EPILOG-BLOCK-NEXT: %result.ph.ph = phi i32 [ %add.1, %latch.1 ]
		; EPILOG-BLOCK-NEXT: %indvars.iv.unr.ph = phi i64 [ %indvars.iv.next.1, %latch.1 ]
		; EPILOG-BLOCK-NEXT: %sum.02.unr.ph = phi i32 [ %add.1, %latch.1 ]
		; EPILOG-BLOCK-NEXT: br label %latchExit.unr-lcssa
		; EPILOG-BLOCK: latchExit.unr-lcssa:
		; EPILOG-BLOCK-NEXT: %result.ph = phi i32 [ undef, %entry ], [ %result.ph.ph, %latchExit.unr-lcssa.loopexit ]
		; EPILOG-BLOCK-NEXT: %indvars.iv.unr = phi i64 [ 0, %entry ], [ %indvars.iv.unr.ph, %latchExit.unr-lcssa.loopexit ]
		; EPILOG-BLOCK-NEXT: %sum.02.unr = phi i32 [ 0, %entry ], [ %sum.02.unr.ph, %latchExit.unr-lcssa.loopexit ]
		; EPILOG-BLOCK-NEXT: %lcmp.mod = icmp ne i64 %xtraiter, 0
		; EPILOG-BLOCK-NEXT: br i1 %lcmp.mod, label %header.epil.preheader, label %latchExit
		; EPILOG-BLOCK: header.epil.preheader:
		; EPILOG-BLOCK-NEXT: br label %header.epil
		; EPILOG-BLOCK: header.epil:
		; EPILOG-BLOCK-NEXT: %indvars.iv.epil = phi i64 [ %indvars.iv.unr, %header.epil.preheader ]
		; EPILOG-BLOCK-NEXT: %sum.02.epil = phi i32 [ %sum.02.unr, %header.epil.preheader ]
		; EPILOG-BLOCK-NEXT: br i1 %cond, label %for.exit2, label %for.exiting_block.epil
		; EPILOG-BLOCK: for.exiting_block.epil:
		; EPILOG-BLOCK-NEXT: %cmp.epil = icmp eq i64 %n, 42
		; EPILOG-BLOCK-NEXT: br i1 %cmp.epil, label %latchExit.epilog-lcssa, label %latch.epil
		; EPILOG-BLOCK: latch.epil:
		; EPILOG-BLOCK-NEXT: %arrayidx.epil = getelementptr inbounds i32, i32* %a, i64 %indvars.iv.epil
		; EPILOG-BLOCK-NEXT: %3 = load i32, i32* %arrayidx.epil, align 4
		; EPILOG-BLOCK-NEXT: %add.epil = add nsw i32 %3, %sum.02.epil
		; EPILOG-BLOCK-NEXT: %indvars.iv.next.epil = add i64 %indvars.iv.epil, 1
		; EPILOG-BLOCK-NEXT: %exitcond.epil = icmp eq i64 %indvars.iv.next.epil, %n
		; EPILOG-BLOCK-NEXT: br label %latchExit.epilog-lcssa
		; EPILOG-BLOCK: latchExit.epilog-lcssa.loopexit:
		; EPILOG-BLOCK-NEXT: %result.ph1.ph = phi i32 [ 2, %for.exiting_block ], [ 2, %for.exiting_block.1 ]
		; EPILOG-BLOCK-NEXT: br label %latchExit.epilog-lcssa
		; EPILOG-BLOCK: latchExit.epilog-lcssa:
		; EPILOG-BLOCK-NEXT: %result.ph1 = phi i32 [ %add.epil, %latch.epil ], [ 2, %for.exiting_block.epil ], [ %result.ph1.ph, %latchExit.epilog-lcssa.loopexit ]
		; EPILOG-BLOCK-NEXT: br label %latchExit
; EPILOG-BLOCK: latchExit:		; EPILOG-BLOCK: latchExit:
; EPILOG-BLOCK-NEXT: %result = phi i32 [ 2, %for.exiting_block ], [ %add, %latch ], [ 2, %for.exiting_block.1 ], [ %add.1, %latch.1 ]		; EPILOG-BLOCK-NEXT: %result = phi i32 [ %result.ph, %latchExit.unr-lcssa ], [ %result.ph1, %latchExit.epilog-lcssa ]
; EPILOG-BLOCK-NEXT: ret i32 %result		; EPILOG-BLOCK-NEXT: ret i32 %result
		; EPILOG-BLOCK: for.exit2.loopexit:
		; EPILOG-BLOCK-NEXT: br label %for.exit2
; EPILOG-BLOCK: for.exit2:		; EPILOG-BLOCK: for.exit2:
; EPILOG-BLOCK-NEXT: ret i32 42		; EPILOG-BLOCK-NEXT: ret i32 42
; EPILOG-BLOCK: header.1:
; EPILOG-BLOCK-NEXT: br i1 %cond, label %for.exit2, label %for.exiting_block.1
; EPILOG-BLOCK: for.exiting_block.1:		; EPILOG-BLOCK: for.exiting_block.1:
; EPILOG-BLOCK-NEXT: %cmp.1 = icmp eq i64 %n, 42		; EPILOG-BLOCK-NEXT: %cmp.1 = icmp eq i64 %n, 42
; EPILOG-BLOCK-NEXT: br i1 %cmp.1, label %latchExit, label %latch.1		; EPILOG-BLOCK-NEXT: br i1 %cmp.1, label %latchExit.epilog-lcssa.loopexit, label %latch.1
; EPILOG-BLOCK: latch.1:		; EPILOG-BLOCK: latch.1:
; EPILOG-BLOCK-NEXT: %arrayidx.1 = getelementptr inbounds i32, i32* %a, i64 %indvars.iv.next		; EPILOG-BLOCK-NEXT: %arrayidx.1 = getelementptr inbounds i32, i32* %a, i64 %indvars.iv.next
; EPILOG-BLOCK-NEXT: %1 = load i32, i32* %arrayidx.1, align 4		; EPILOG-BLOCK-NEXT: %4 = load i32, i32* %arrayidx.1, align 4
; EPILOG-BLOCK-NEXT: %add.1 = add nsw i32 %1, %add		; EPILOG-BLOCK-NEXT: %add.1 = add nsw i32 %4, %add
; EPILOG-BLOCK-NEXT: %indvars.iv.next.1 = add i64 %indvars.iv.next, 1		; EPILOG-BLOCK-NEXT: %indvars.iv.next.1 = add i64 %indvars.iv.next, 1
; EPILOG-BLOCK-NEXT: %exitcond.1 = icmp eq i64 %indvars.iv.next.1, %n		; EPILOG-BLOCK-NEXT: %niter.nsub.1 = sub i64 %niter.nsub, 1
; EPILOG-BLOCK-NEXT: br i1 %exitcond.1, label %latchExit, label %header, !llvm.loop !5		; EPILOG-BLOCK-NEXT: %niter.ncmp.1 = icmp eq i64 %niter.nsub.1, 0
		; EPILOG-BLOCK-NEXT: br i1 %niter.ncmp.1, label %latchExit.unr-lcssa.loopexit, label %header, !llvm.loop !5
;		;
; PROLOG-LABEL: @otherblock_latch_same_exit(		; PROLOG-LABEL: @otherblock_latch_same_exit(
; PROLOG-NEXT: entry:		; PROLOG-NEXT: entry:
; PROLOG-NEXT: br label %header		; PROLOG-NEXT: br label %header
; PROLOG: header:		; PROLOG: header:
; PROLOG-NEXT: %indvars.iv = phi i64 [ %indvars.iv.next, %latch ], [ 0, %entry ]		; PROLOG-NEXT: %indvars.iv = phi i64 [ %indvars.iv.next, %latch ], [ 0, %entry ]
; PROLOG-NEXT: %sum.02 = phi i32 [ %add, %latch ], [ 0, %entry ]		; PROLOG-NEXT: %sum.02 = phi i32 [ %add, %latch ], [ 0, %entry ]
; PROLOG-NEXT: br i1 %cond, label %for.exit2, label %for.exiting_block		; PROLOG-NEXT: br i1 %cond, label %for.exit2, label %for.exiting_block
▲ Show 20 Lines • Show All 79 Lines • ▼ Show 20 Lines

; Two exiting blocks to latch where the exiting blocks are Latch and a		; Two exiting blocks to latch where the exiting blocks are Latch and a
; non-header		; non-header
; Same as above test except the incoming value for latch Phi is from the header		; Same as above test except the incoming value for latch Phi is from the header
; FIXME: We should be able to runtime unroll.		; FIXME: We should be able to runtime unroll.
define i32 @otherblock_latch_same_exit2(i32* nocapture %a, i64 %n, i1 %cond) {		define i32 @otherblock_latch_same_exit2(i32* nocapture %a, i64 %n, i1 %cond) {
; EPILOG-LABEL: @otherblock_latch_same_exit2(		; EPILOG-LABEL: @otherblock_latch_same_exit2(
; EPILOG-NEXT: entry:		; EPILOG-NEXT: entry:
		; EPILOG-NEXT: %0 = add i64 %n, -1
		; EPILOG-NEXT: %xtraiter = and i64 %n, 7
		; EPILOG-NEXT: %1 = icmp ult i64 %0, 7
		; EPILOG-NEXT: br i1 %1, label %latchExit.unr-lcssa, label %entry.new
		; EPILOG: entry.new:
		; EPILOG-NEXT: %unroll_iter = sub i64 %n, %xtraiter
; EPILOG-NEXT: br label %header		; EPILOG-NEXT: br label %header
; EPILOG: header:		; EPILOG: header:
; EPILOG-NEXT: %indvars.iv = phi i64 [ %indvars.iv.next, %latch ], [ 0, %entry ]		; EPILOG-NEXT: %indvars.iv = phi i64 [ 0, %entry.new ], [ %indvars.iv.next.7, %latch.7 ]
; EPILOG-NEXT: %sum.02 = phi i32 [ %add, %latch ], [ 0, %entry ]		; EPILOG-NEXT: %sum.02 = phi i32 [ 0, %entry.new ], [ %add.7, %latch.7 ]
; EPILOG-NEXT: br i1 %cond, label %for.exit2, label %for.exiting_block		; EPILOG-NEXT: %niter = phi i64 [ %unroll_iter, %entry.new ], [ %niter.nsub.7, %latch.7 ]
		; EPILOG-NEXT: br i1 %cond, label %for.exit2.loopexit, label %for.exiting_block
; EPILOG: for.exiting_block:		; EPILOG: for.exiting_block:
; EPILOG-NEXT: %cmp = icmp eq i64 %n, 42		; EPILOG-NEXT: %cmp = icmp eq i64 %n, 42
; EPILOG-NEXT: br i1 %cmp, label %latchExit, label %latch		; EPILOG-NEXT: br i1 %cmp, label %latchExit.epilog-lcssa.loopexit, label %latch
; EPILOG: latch:		; EPILOG: latch:
; EPILOG-NEXT: %arrayidx = getelementptr inbounds i32, i32* %a, i64 %indvars.iv		; EPILOG-NEXT: %arrayidx = getelementptr inbounds i32, i32* %a, i64 %indvars.iv
; EPILOG-NEXT: %0 = load i32, i32* %arrayidx, align 4		; EPILOG-NEXT: %2 = load i32, i32* %arrayidx, align 4
; EPILOG-NEXT: %add = add nsw i32 %0, %sum.02		; EPILOG-NEXT: %add = add nsw i32 %2, %sum.02
; EPILOG-NEXT: %indvars.iv.next = add i64 %indvars.iv, 1		; EPILOG-NEXT: %indvars.iv.next = add nuw nsw i64 %indvars.iv, 1
; EPILOG-NEXT: %exitcond = icmp eq i64 %indvars.iv.next, %n		; EPILOG-NEXT: %niter.nsub = sub i64 %niter, 1
; EPILOG-NEXT: br i1 %exitcond, label %latchExit, label %header		; EPILOG-NEXT: br i1 %cond, label %for.exit2.loopexit, label %for.exiting_block.1
		; EPILOG: latchExit.unr-lcssa.loopexit:
		; EPILOG-NEXT: %result.ph.ph = phi i32 [ %add.7, %latch.7 ]
		; EPILOG-NEXT: %indvars.iv.unr.ph = phi i64 [ %indvars.iv.next.7, %latch.7 ]
		; EPILOG-NEXT: %sum.02.unr.ph = phi i32 [ %add.7, %latch.7 ]
		; EPILOG-NEXT: br label %latchExit.unr-lcssa
		; EPILOG: latchExit.unr-lcssa:
		; EPILOG-NEXT: %result.ph = phi i32 [ undef, %entry ], [ %result.ph.ph, %latchExit.unr-lcssa.loopexit ]
		; EPILOG-NEXT: %indvars.iv.unr = phi i64 [ 0, %entry ], [ %indvars.iv.unr.ph, %latchExit.unr-lcssa.loopexit ]
		; EPILOG-NEXT: %sum.02.unr = phi i32 [ 0, %entry ], [ %sum.02.unr.ph, %latchExit.unr-lcssa.loopexit ]
		; EPILOG-NEXT: %lcmp.mod = icmp ne i64 %xtraiter, 0
		; EPILOG-NEXT: br i1 %lcmp.mod, label %header.epil.preheader, label %latchExit
		; EPILOG: header.epil.preheader:
		; EPILOG-NEXT: br label %header.epil
		; EPILOG: header.epil:
		; EPILOG-NEXT: %indvars.iv.epil = phi i64 [ %indvars.iv.next.epil, %latch.epil ], [ %indvars.iv.unr, %header.epil.preheader ]
		; EPILOG-NEXT: %sum.02.epil = phi i32 [ %add.epil, %latch.epil ], [ %sum.02.unr, %header.epil.preheader ]
		; EPILOG-NEXT: %epil.iter = phi i64 [ %xtraiter, %header.epil.preheader ], [ %epil.iter.sub, %latch.epil ]
		; EPILOG-NEXT: br i1 %cond, label %for.exit2.loopexit2, label %for.exiting_block.epil
		; EPILOG: for.exiting_block.epil:
		; EPILOG-NEXT: %cmp.epil = icmp eq i64 %n, 42
		; EPILOG-NEXT: br i1 %cmp.epil, label %latchExit.epilog-lcssa.loopexit3, label %latch.epil
		; EPILOG: latch.epil:
		; EPILOG-NEXT: %arrayidx.epil = getelementptr inbounds i32, i32* %a, i64 %indvars.iv.epil
		; EPILOG-NEXT: %3 = load i32, i32* %arrayidx.epil, align 4
		; EPILOG-NEXT: %add.epil = add nsw i32 %3, %sum.02.epil
		; EPILOG-NEXT: %indvars.iv.next.epil = add i64 %indvars.iv.epil, 1
		; EPILOG-NEXT: %exitcond.epil = icmp eq i64 %indvars.iv.next.epil, %n
		; EPILOG-NEXT: %epil.iter.sub = sub i64 %epil.iter, 1
		; EPILOG-NEXT: %epil.iter.cmp = icmp ne i64 %epil.iter.sub, 0
		; EPILOG-NEXT: br i1 %epil.iter.cmp, label %header.epil, label %latchExit.epilog-lcssa.loopexit3, !llvm.loop !6
		; EPILOG: latchExit.epilog-lcssa.loopexit:
		; EPILOG-NEXT: %result.ph1.ph = phi i32 [ %sum.02, %for.exiting_block ], [ %add, %for.exiting_block.1 ], [ %add.1, %for.exiting_block.2 ], [ %add.2, %for.exiting_block.3 ], [ %add.3, %for.exiting_block.4 ], [ %add.4, %for.exiting_block.5 ], [ %add.5, %for.exiting_block.6 ], [ %add.6, %for.exiting_block.7 ]
		; EPILOG-NEXT: br label %latchExit.epilog-lcssa
		; EPILOG: latchExit.epilog-lcssa.loopexit3:
		; EPILOG-NEXT: %result.ph1.ph4 = phi i32 [ %sum.02.epil, %for.exiting_block.epil ], [ %add.epil, %latch.epil ]
		; EPILOG-NEXT: br label %latchExit.epilog-lcssa
		; EPILOG: latchExit.epilog-lcssa:
		; EPILOG-NEXT: %result.ph1 = phi i32 [ %result.ph1.ph, %latchExit.epilog-lcssa.loopexit ], [ %result.ph1.ph4, %latchExit.epilog-lcssa.loopexit3 ]
		; EPILOG-NEXT: br label %latchExit
; EPILOG: latchExit:		; EPILOG: latchExit:
; EPILOG-NEXT: %result = phi i32 [ %sum.02, %for.exiting_block ], [ %add, %latch ]		; EPILOG-NEXT: %result = phi i32 [ %result.ph, %latchExit.unr-lcssa ], [ %result.ph1, %latchExit.epilog-lcssa ]
; EPILOG-NEXT: ret i32 %result		; EPILOG-NEXT: ret i32 %result
		; EPILOG: for.exit2.loopexit:
		; EPILOG-NEXT: br label %for.exit2
		; EPILOG: for.exit2.loopexit2:
		; EPILOG-NEXT: br label %for.exit2
; EPILOG: for.exit2:		; EPILOG: for.exit2:
; EPILOG-NEXT: ret i32 42		; EPILOG-NEXT: ret i32 42
		; EPILOG: for.exiting_block.1:
		; EPILOG-NEXT: %cmp.1 = icmp eq i64 %n, 42
		; EPILOG-NEXT: br i1 %cmp.1, label %latchExit.epilog-lcssa.loopexit, label %latch.1
		; EPILOG: latch.1:
		; EPILOG-NEXT: %arrayidx.1 = getelementptr inbounds i32, i32* %a, i64 %indvars.iv.next
		; EPILOG-NEXT: %4 = load i32, i32* %arrayidx.1, align 4
		; EPILOG-NEXT: %add.1 = add nsw i32 %4, %add
		; EPILOG-NEXT: %indvars.iv.next.1 = add nuw nsw i64 %indvars.iv.next, 1
		; EPILOG-NEXT: %niter.nsub.1 = sub i64 %niter.nsub, 1
		; EPILOG-NEXT: br i1 %cond, label %for.exit2.loopexit, label %for.exiting_block.2
		; EPILOG: for.exiting_block.2:
		; EPILOG-NEXT: %cmp.2 = icmp eq i64 %n, 42
		; EPILOG-NEXT: br i1 %cmp.2, label %latchExit.epilog-lcssa.loopexit, label %latch.2
		; EPILOG: latch.2:
		; EPILOG-NEXT: %arrayidx.2 = getelementptr inbounds i32, i32* %a, i64 %indvars.iv.next.1
		; EPILOG-NEXT: %5 = load i32, i32* %arrayidx.2, align 4
		; EPILOG-NEXT: %add.2 = add nsw i32 %5, %add.1
		; EPILOG-NEXT: %indvars.iv.next.2 = add nuw nsw i64 %indvars.iv.next.1, 1
		; EPILOG-NEXT: %niter.nsub.2 = sub i64 %niter.nsub.1, 1
		; EPILOG-NEXT: br i1 %cond, label %for.exit2.loopexit, label %for.exiting_block.3
		; EPILOG: for.exiting_block.3:
		; EPILOG-NEXT: %cmp.3 = icmp eq i64 %n, 42
		; EPILOG-NEXT: br i1 %cmp.3, label %latchExit.epilog-lcssa.loopexit, label %latch.3
		; EPILOG: latch.3:
		; EPILOG-NEXT: %arrayidx.3 = getelementptr inbounds i32, i32* %a, i64 %indvars.iv.next.2
		; EPILOG-NEXT: %6 = load i32, i32* %arrayidx.3, align 4
		; EPILOG-NEXT: %add.3 = add nsw i32 %6, %add.2
		; EPILOG-NEXT: %indvars.iv.next.3 = add nuw nsw i64 %indvars.iv.next.2, 1
		; EPILOG-NEXT: %niter.nsub.3 = sub i64 %niter.nsub.2, 1
		; EPILOG-NEXT: br i1 %cond, label %for.exit2.loopexit, label %for.exiting_block.4
		; EPILOG: for.exiting_block.4:
		; EPILOG-NEXT: %cmp.4 = icmp eq i64 %n, 42
		; EPILOG-NEXT: br i1 %cmp.4, label %latchExit.epilog-lcssa.loopexit, label %latch.4
		; EPILOG: latch.4:
		; EPILOG-NEXT: %arrayidx.4 = getelementptr inbounds i32, i32* %a, i64 %indvars.iv.next.3
		; EPILOG-NEXT: %7 = load i32, i32* %arrayidx.4, align 4
		; EPILOG-NEXT: %add.4 = add nsw i32 %7, %add.3
		; EPILOG-NEXT: %indvars.iv.next.4 = add nuw nsw i64 %indvars.iv.next.3, 1
		; EPILOG-NEXT: %niter.nsub.4 = sub i64 %niter.nsub.3, 1
		; EPILOG-NEXT: br i1 %cond, label %for.exit2.loopexit, label %for.exiting_block.5
		; EPILOG: for.exiting_block.5:
		; EPILOG-NEXT: %cmp.5 = icmp eq i64 %n, 42
		; EPILOG-NEXT: br i1 %cmp.5, label %latchExit.epilog-lcssa.loopexit, label %latch.5
		; EPILOG: latch.5:
		; EPILOG-NEXT: %arrayidx.5 = getelementptr inbounds i32, i32* %a, i64 %indvars.iv.next.4
		; EPILOG-NEXT: %8 = load i32, i32* %arrayidx.5, align 4
		; EPILOG-NEXT: %add.5 = add nsw i32 %8, %add.4
		; EPILOG-NEXT: %indvars.iv.next.5 = add nuw nsw i64 %indvars.iv.next.4, 1
		; EPILOG-NEXT: %niter.nsub.5 = sub i64 %niter.nsub.4, 1
		; EPILOG-NEXT: br i1 %cond, label %for.exit2.loopexit, label %for.exiting_block.6
		; EPILOG: for.exiting_block.6:
		; EPILOG-NEXT: %cmp.6 = icmp eq i64 %n, 42
		; EPILOG-NEXT: br i1 %cmp.6, label %latchExit.epilog-lcssa.loopexit, label %latch.6
		; EPILOG: latch.6:
		; EPILOG-NEXT: %arrayidx.6 = getelementptr inbounds i32, i32* %a, i64 %indvars.iv.next.5
		; EPILOG-NEXT: %9 = load i32, i32* %arrayidx.6, align 4
		; EPILOG-NEXT: %add.6 = add nsw i32 %9, %add.5
		; EPILOG-NEXT: %indvars.iv.next.6 = add nuw nsw i64 %indvars.iv.next.5, 1
		; EPILOG-NEXT: %niter.nsub.6 = sub i64 %niter.nsub.5, 1
		; EPILOG-NEXT: br i1 %cond, label %for.exit2.loopexit, label %for.exiting_block.7
		; EPILOG: for.exiting_block.7:
		; EPILOG-NEXT: %cmp.7 = icmp eq i64 %n, 42
		; EPILOG-NEXT: br i1 %cmp.7, label %latchExit.epilog-lcssa.loopexit, label %latch.7
		; EPILOG: latch.7:
		; EPILOG-NEXT: %arrayidx.7 = getelementptr inbounds i32, i32* %a, i64 %indvars.iv.next.6
		; EPILOG-NEXT: %10 = load i32, i32* %arrayidx.7, align 4
		; EPILOG-NEXT: %add.7 = add nsw i32 %10, %add.6
		; EPILOG-NEXT: %indvars.iv.next.7 = add i64 %indvars.iv.next.6, 1
		; EPILOG-NEXT: %niter.nsub.7 = sub i64 %niter.nsub.6, 1
		; EPILOG-NEXT: %niter.ncmp.7 = icmp eq i64 %niter.nsub.7, 0
		; EPILOG-NEXT: br i1 %niter.ncmp.7, label %latchExit.unr-lcssa.loopexit, label %header
;		;
; EPILOG-BLOCK-LABEL: @otherblock_latch_same_exit2(		; EPILOG-BLOCK-LABEL: @otherblock_latch_same_exit2(
; EPILOG-BLOCK-NEXT: entry:		; EPILOG-BLOCK-NEXT: entry:
		; EPILOG-BLOCK-NEXT: %0 = add i64 %n, -1
		; EPILOG-BLOCK-NEXT: %xtraiter = and i64 %n, 1
		; EPILOG-BLOCK-NEXT: %1 = icmp ult i64 %0, 1
		; EPILOG-BLOCK-NEXT: br i1 %1, label %latchExit.unr-lcssa, label %entry.new
		; EPILOG-BLOCK: entry.new:
		; EPILOG-BLOCK-NEXT: %unroll_iter = sub i64 %n, %xtraiter
; EPILOG-BLOCK-NEXT: br label %header		; EPILOG-BLOCK-NEXT: br label %header
; EPILOG-BLOCK: header:		; EPILOG-BLOCK: header:
; EPILOG-BLOCK-NEXT: %indvars.iv = phi i64 [ 0, %entry ], [ %indvars.iv.next.1, %latch.1 ]		; EPILOG-BLOCK-NEXT: %indvars.iv = phi i64 [ 0, %entry.new ], [ %indvars.iv.next.1, %latch.1 ]
; EPILOG-BLOCK-NEXT: %sum.02 = phi i32 [ 0, %entry ], [ %add.1, %latch.1 ]		; EPILOG-BLOCK-NEXT: %sum.02 = phi i32 [ 0, %entry.new ], [ %add.1, %latch.1 ]
; EPILOG-BLOCK-NEXT: br i1 %cond, label %for.exit2, label %for.exiting_block		; EPILOG-BLOCK-NEXT: %niter = phi i64 [ %unroll_iter, %entry.new ], [ %niter.nsub.1, %latch.1 ]
		; EPILOG-BLOCK-NEXT: br i1 %cond, label %for.exit2.loopexit, label %for.exiting_block
; EPILOG-BLOCK: for.exiting_block:		; EPILOG-BLOCK: for.exiting_block:
; EPILOG-BLOCK-NEXT: %cmp = icmp eq i64 %n, 42		; EPILOG-BLOCK-NEXT: %cmp = icmp eq i64 %n, 42
; EPILOG-BLOCK-NEXT: br i1 %cmp, label %latchExit, label %latch		; EPILOG-BLOCK-NEXT: br i1 %cmp, label %latchExit.epilog-lcssa.loopexit, label %latch
; EPILOG-BLOCK: latch:		; EPILOG-BLOCK: latch:
; EPILOG-BLOCK-NEXT: %arrayidx = getelementptr inbounds i32, i32* %a, i64 %indvars.iv		; EPILOG-BLOCK-NEXT: %arrayidx = getelementptr inbounds i32, i32* %a, i64 %indvars.iv
; EPILOG-BLOCK-NEXT: %0 = load i32, i32* %arrayidx, align 4		; EPILOG-BLOCK-NEXT: %2 = load i32, i32* %arrayidx, align 4
; EPILOG-BLOCK-NEXT: %add = add nsw i32 %0, %sum.02		; EPILOG-BLOCK-NEXT: %add = add nsw i32 %2, %sum.02
; EPILOG-BLOCK-NEXT: %indvars.iv.next = add nuw nsw i64 %indvars.iv, 1		; EPILOG-BLOCK-NEXT: %indvars.iv.next = add nuw nsw i64 %indvars.iv, 1
; EPILOG-BLOCK-NEXT: %exitcond = icmp eq i64 %indvars.iv.next, %n		; EPILOG-BLOCK-NEXT: %niter.nsub = sub i64 %niter, 1
; EPILOG-BLOCK-NEXT: br i1 %exitcond, label %latchExit, label %header.1		; EPILOG-BLOCK-NEXT: br i1 %cond, label %for.exit2.loopexit, label %for.exiting_block.1
		; EPILOG-BLOCK: latchExit.unr-lcssa.loopexit:
		; EPILOG-BLOCK-NEXT: %result.ph.ph = phi i32 [ %add.1, %latch.1 ]
		; EPILOG-BLOCK-NEXT: %indvars.iv.unr.ph = phi i64 [ %indvars.iv.next.1, %latch.1 ]
		; EPILOG-BLOCK-NEXT: %sum.02.unr.ph = phi i32 [ %add.1, %latch.1 ]
		; EPILOG-BLOCK-NEXT: br label %latchExit.unr-lcssa
		; EPILOG-BLOCK: latchExit.unr-lcssa:
		; EPILOG-BLOCK-NEXT: %result.ph = phi i32 [ undef, %entry ], [ %result.ph.ph, %latchExit.unr-lcssa.loopexit ]
		; EPILOG-BLOCK-NEXT: %indvars.iv.unr = phi i64 [ 0, %entry ], [ %indvars.iv.unr.ph, %latchExit.unr-lcssa.loopexit ]
		; EPILOG-BLOCK-NEXT: %sum.02.unr = phi i32 [ 0, %entry ], [ %sum.02.unr.ph, %latchExit.unr-lcssa.loopexit ]
		; EPILOG-BLOCK-NEXT: %lcmp.mod = icmp ne i64 %xtraiter, 0
		; EPILOG-BLOCK-NEXT: br i1 %lcmp.mod, label %header.epil.preheader, label %latchExit
		; EPILOG-BLOCK: header.epil.preheader:
		; EPILOG-BLOCK-NEXT: br label %header.epil
		; EPILOG-BLOCK: header.epil:
		; EPILOG-BLOCK-NEXT: %indvars.iv.epil = phi i64 [ %indvars.iv.unr, %header.epil.preheader ]
		; EPILOG-BLOCK-NEXT: %sum.02.epil = phi i32 [ %sum.02.unr, %header.epil.preheader ]
		; EPILOG-BLOCK-NEXT: br i1 %cond, label %for.exit2, label %for.exiting_block.epil
		; EPILOG-BLOCK: for.exiting_block.epil:
		; EPILOG-BLOCK-NEXT: %cmp.epil = icmp eq i64 %n, 42
		; EPILOG-BLOCK-NEXT: br i1 %cmp.epil, label %latchExit.epilog-lcssa, label %latch.epil
		; EPILOG-BLOCK: latch.epil:
		; EPILOG-BLOCK-NEXT: %arrayidx.epil = getelementptr inbounds i32, i32* %a, i64 %indvars.iv.epil
		; EPILOG-BLOCK-NEXT: %3 = load i32, i32* %arrayidx.epil, align 4
		; EPILOG-BLOCK-NEXT: %add.epil = add nsw i32 %3, %sum.02.epil
		; EPILOG-BLOCK-NEXT: %indvars.iv.next.epil = add i64 %indvars.iv.epil, 1
		; EPILOG-BLOCK-NEXT: %exitcond.epil = icmp eq i64 %indvars.iv.next.epil, %n
		; EPILOG-BLOCK-NEXT: br label %latchExit.epilog-lcssa
		; EPILOG-BLOCK: latchExit.epilog-lcssa.loopexit:
		; EPILOG-BLOCK-NEXT: %result.ph1.ph = phi i32 [ %sum.02, %for.exiting_block ], [ %add, %for.exiting_block.1 ]
		; EPILOG-BLOCK-NEXT: br label %latchExit.epilog-lcssa
		; EPILOG-BLOCK: latchExit.epilog-lcssa:
		; EPILOG-BLOCK-NEXT: %result.ph1 = phi i32 [ %add.epil, %latch.epil ], [ %sum.02.epil, %for.exiting_block.epil ], [ %result.ph1.ph, %latchExit.epilog-lcssa.loopexit ]
		; EPILOG-BLOCK-NEXT: br label %latchExit
; EPILOG-BLOCK: latchExit:		; EPILOG-BLOCK: latchExit:
; EPILOG-BLOCK-NEXT: %result = phi i32 [ %sum.02, %for.exiting_block ], [ %add, %latch ], [ %add, %for.exiting_block.1 ], [ %add.1, %latch.1 ]		; EPILOG-BLOCK-NEXT: %result = phi i32 [ %result.ph, %latchExit.unr-lcssa ], [ %result.ph1, %latchExit.epilog-lcssa ]
; EPILOG-BLOCK-NEXT: ret i32 %result		; EPILOG-BLOCK-NEXT: ret i32 %result
		; EPILOG-BLOCK: for.exit2.loopexit:
		; EPILOG-BLOCK-NEXT: br label %for.exit2
; EPILOG-BLOCK: for.exit2:		; EPILOG-BLOCK: for.exit2:
; EPILOG-BLOCK-NEXT: ret i32 42		; EPILOG-BLOCK-NEXT: ret i32 42
; EPILOG-BLOCK: header.1:
; EPILOG-BLOCK-NEXT: br i1 %cond, label %for.exit2, label %for.exiting_block.1
; EPILOG-BLOCK: for.exiting_block.1:		; EPILOG-BLOCK: for.exiting_block.1:
; EPILOG-BLOCK-NEXT: %cmp.1 = icmp eq i64 %n, 42		; EPILOG-BLOCK-NEXT: %cmp.1 = icmp eq i64 %n, 42
; EPILOG-BLOCK-NEXT: br i1 %cmp.1, label %latchExit, label %latch.1		; EPILOG-BLOCK-NEXT: br i1 %cmp.1, label %latchExit.epilog-lcssa.loopexit, label %latch.1
; EPILOG-BLOCK: latch.1:		; EPILOG-BLOCK: latch.1:
; EPILOG-BLOCK-NEXT: %arrayidx.1 = getelementptr inbounds i32, i32* %a, i64 %indvars.iv.next		; EPILOG-BLOCK-NEXT: %arrayidx.1 = getelementptr inbounds i32, i32* %a, i64 %indvars.iv.next
; EPILOG-BLOCK-NEXT: %1 = load i32, i32* %arrayidx.1, align 4		; EPILOG-BLOCK-NEXT: %4 = load i32, i32* %arrayidx.1, align 4
; EPILOG-BLOCK-NEXT: %add.1 = add nsw i32 %1, %add		; EPILOG-BLOCK-NEXT: %add.1 = add nsw i32 %4, %add
; EPILOG-BLOCK-NEXT: %indvars.iv.next.1 = add i64 %indvars.iv.next, 1		; EPILOG-BLOCK-NEXT: %indvars.iv.next.1 = add i64 %indvars.iv.next, 1
; EPILOG-BLOCK-NEXT: %exitcond.1 = icmp eq i64 %indvars.iv.next.1, %n		; EPILOG-BLOCK-NEXT: %niter.nsub.1 = sub i64 %niter.nsub, 1
; EPILOG-BLOCK-NEXT: br i1 %exitcond.1, label %latchExit, label %header, !llvm.loop !6		; EPILOG-BLOCK-NEXT: %niter.ncmp.1 = icmp eq i64 %niter.nsub.1, 0
		; EPILOG-BLOCK-NEXT: br i1 %niter.ncmp.1, label %latchExit.unr-lcssa.loopexit, label %header, !llvm.loop !6
;		;
; PROLOG-LABEL: @otherblock_latch_same_exit2(		; PROLOG-LABEL: @otherblock_latch_same_exit2(
; PROLOG-NEXT: entry:		; PROLOG-NEXT: entry:
; PROLOG-NEXT: br label %header		; PROLOG-NEXT: br label %header
; PROLOG: header:		; PROLOG: header:
; PROLOG-NEXT: %indvars.iv = phi i64 [ %indvars.iv.next, %latch ], [ 0, %entry ]		; PROLOG-NEXT: %indvars.iv = phi i64 [ %indvars.iv.next, %latch ], [ 0, %entry ]
; PROLOG-NEXT: %sum.02 = phi i32 [ %add, %latch ], [ 0, %entry ]		; PROLOG-NEXT: %sum.02 = phi i32 [ %add, %latch ], [ 0, %entry ]
; PROLOG-NEXT: br i1 %cond, label %for.exit2, label %for.exiting_block		; PROLOG-NEXT: br i1 %cond, label %for.exit2, label %for.exiting_block
▲ Show 20 Lines • Show All 80 Lines • ▼ Show 20 Lines
; Two exiting blocks to latch where the exiting blocks are Latch and a		; Two exiting blocks to latch where the exiting blocks are Latch and a
; non-header		; non-header
; Same as above test except the incoming value for cloned latch Phi is from the		; Same as above test except the incoming value for cloned latch Phi is from the
; for.exiting_block.		; for.exiting_block.
; FIXME: We should be able to runtime unroll.		; FIXME: We should be able to runtime unroll.
define i32 @otherblock_latch_same_exit3(i32* nocapture %a, i64 %n, i1 %cond) {		define i32 @otherblock_latch_same_exit3(i32* nocapture %a, i64 %n, i1 %cond) {
; EPILOG-LABEL: @otherblock_latch_same_exit3(		; EPILOG-LABEL: @otherblock_latch_same_exit3(
; EPILOG-NEXT: entry:		; EPILOG-NEXT: entry:
		; EPILOG-NEXT: %0 = add i64 %n, -1
		; EPILOG-NEXT: %xtraiter = and i64 %n, 7
		; EPILOG-NEXT: %1 = icmp ult i64 %0, 7
		; EPILOG-NEXT: br i1 %1, label %latchExit.unr-lcssa, label %entry.new
		; EPILOG: entry.new:
		; EPILOG-NEXT: %unroll_iter = sub i64 %n, %xtraiter
; EPILOG-NEXT: br label %header		; EPILOG-NEXT: br label %header
; EPILOG: header:		; EPILOG: header:
; EPILOG-NEXT: %indvars.iv = phi i64 [ %indvars.iv.next, %latch ], [ 0, %entry ]		; EPILOG-NEXT: %indvars.iv = phi i64 [ 0, %entry.new ], [ %indvars.iv.next.7, %latch.7 ]
; EPILOG-NEXT: %sum.02 = phi i32 [ %add, %latch ], [ 0, %entry ]		; EPILOG-NEXT: %sum.02 = phi i32 [ 0, %entry.new ], [ %add.7, %latch.7 ]
; EPILOG-NEXT: br i1 %cond, label %for.exit2, label %for.exiting_block		; EPILOG-NEXT: %niter = phi i64 [ %unroll_iter, %entry.new ], [ %niter.nsub.7, %latch.7 ]
		; EPILOG-NEXT: br i1 %cond, label %for.exit2.loopexit, label %for.exiting_block
; EPILOG: for.exiting_block:		; EPILOG: for.exiting_block:
; EPILOG-NEXT: %arrayidx = getelementptr inbounds i32, i32* %a, i64 %indvars.iv		; EPILOG-NEXT: %arrayidx = getelementptr inbounds i32, i32* %a, i64 %indvars.iv
; EPILOG-NEXT: %0 = load i32, i32* %arrayidx, align 4		; EPILOG-NEXT: %2 = load i32, i32* %arrayidx, align 4
; EPILOG-NEXT: %add = add nsw i32 %0, %sum.02		; EPILOG-NEXT: %add = add nsw i32 %2, %sum.02
; EPILOG-NEXT: %cmp = icmp eq i64 %n, 42		; EPILOG-NEXT: %cmp = icmp eq i64 %n, 42
; EPILOG-NEXT: br i1 %cmp, label %latchExit, label %latch		; EPILOG-NEXT: br i1 %cmp, label %latchExit.epilog-lcssa.loopexit, label %latch
; EPILOG: latch:		; EPILOG: latch:
; EPILOG-NEXT: %indvars.iv.next = add i64 %indvars.iv, 1		; EPILOG-NEXT: %indvars.iv.next = add nuw nsw i64 %indvars.iv, 1
; EPILOG-NEXT: %exitcond = icmp eq i64 %indvars.iv.next, %n		; EPILOG-NEXT: %niter.nsub = sub i64 %niter, 1
; EPILOG-NEXT: br i1 %exitcond, label %latchExit, label %header		; EPILOG-NEXT: br i1 %cond, label %for.exit2.loopexit, label %for.exiting_block.1
		; EPILOG: latchExit.unr-lcssa.loopexit:
		; EPILOG-NEXT: %result.ph.ph = phi i32 [ %add.7, %latch.7 ]
		; EPILOG-NEXT: %indvars.iv.unr.ph = phi i64 [ %indvars.iv.next.7, %latch.7 ]
		; EPILOG-NEXT: %sum.02.unr.ph = phi i32 [ %add.7, %latch.7 ]
		; EPILOG-NEXT: br label %latchExit.unr-lcssa
		; EPILOG: latchExit.unr-lcssa:
		; EPILOG-NEXT: %result.ph = phi i32 [ undef, %entry ], [ %result.ph.ph, %latchExit.unr-lcssa.loopexit ]
		; EPILOG-NEXT: %indvars.iv.unr = phi i64 [ 0, %entry ], [ %indvars.iv.unr.ph, %latchExit.unr-lcssa.loopexit ]
		; EPILOG-NEXT: %sum.02.unr = phi i32 [ 0, %entry ], [ %sum.02.unr.ph, %latchExit.unr-lcssa.loopexit ]
		; EPILOG-NEXT: %lcmp.mod = icmp ne i64 %xtraiter, 0
		; EPILOG-NEXT: br i1 %lcmp.mod, label %header.epil.preheader, label %latchExit
		; EPILOG: header.epil.preheader:
		; EPILOG-NEXT: br label %header.epil
		; EPILOG: header.epil:
		; EPILOG-NEXT: %indvars.iv.epil = phi i64 [ %indvars.iv.next.epil, %latch.epil ], [ %indvars.iv.unr, %header.epil.preheader ]
		; EPILOG-NEXT: %sum.02.epil = phi i32 [ %add.epil, %latch.epil ], [ %sum.02.unr, %header.epil.preheader ]
		; EPILOG-NEXT: %epil.iter = phi i64 [ %xtraiter, %header.epil.preheader ], [ %epil.iter.sub, %latch.epil ]
		; EPILOG-NEXT: br i1 %cond, label %for.exit2.loopexit2, label %for.exiting_block.epil
		; EPILOG: for.exiting_block.epil:
		; EPILOG-NEXT: %arrayidx.epil = getelementptr inbounds i32, i32* %a, i64 %indvars.iv.epil
		; EPILOG-NEXT: %3 = load i32, i32* %arrayidx.epil, align 4
		; EPILOG-NEXT: %add.epil = add nsw i32 %3, %sum.02.epil
		; EPILOG-NEXT: %cmp.epil = icmp eq i64 %n, 42
		; EPILOG-NEXT: br i1 %cmp.epil, label %latchExit.epilog-lcssa.loopexit3, label %latch.epil
		; EPILOG: latch.epil:
		; EPILOG-NEXT: %indvars.iv.next.epil = add i64 %indvars.iv.epil, 1
		; EPILOG-NEXT: %exitcond.epil = icmp eq i64 %indvars.iv.next.epil, %n
		; EPILOG-NEXT: %epil.iter.sub = sub i64 %epil.iter, 1
		; EPILOG-NEXT: %epil.iter.cmp = icmp ne i64 %epil.iter.sub, 0
		; EPILOG-NEXT: br i1 %epil.iter.cmp, label %header.epil, label %latchExit.epilog-lcssa.loopexit3, !llvm.loop !7
		; EPILOG: latchExit.epilog-lcssa.loopexit:
		; EPILOG-NEXT: %result.ph1.ph = phi i32 [ %sum.02, %for.exiting_block ], [ %add, %for.exiting_block.1 ], [ %add.1, %for.exiting_block.2 ], [ %add.2, %for.exiting_block.3 ], [ %add.3, %for.exiting_block.4 ], [ %add.4, %for.exiting_block.5 ], [ %add.5, %for.exiting_block.6 ], [ %add.6, %for.exiting_block.7 ]
		; EPILOG-NEXT: br label %latchExit.epilog-lcssa
		; EPILOG: latchExit.epilog-lcssa.loopexit3:
		; EPILOG-NEXT: %result.ph1.ph4 = phi i32 [ %sum.02.epil, %for.exiting_block.epil ], [ %add.epil, %latch.epil ]
		; EPILOG-NEXT: br label %latchExit.epilog-lcssa
		; EPILOG: latchExit.epilog-lcssa:
		; EPILOG-NEXT: %result.ph1 = phi i32 [ %result.ph1.ph, %latchExit.epilog-lcssa.loopexit ], [ %result.ph1.ph4, %latchExit.epilog-lcssa.loopexit3 ]
		; EPILOG-NEXT: br label %latchExit
; EPILOG: latchExit:		; EPILOG: latchExit:
; EPILOG-NEXT: %result = phi i32 [ %sum.02, %for.exiting_block ], [ %add, %latch ]		; EPILOG-NEXT: %result = phi i32 [ %result.ph, %latchExit.unr-lcssa ], [ %result.ph1, %latchExit.epilog-lcssa ]
; EPILOG-NEXT: ret i32 %result		; EPILOG-NEXT: ret i32 %result
		; EPILOG: for.exit2.loopexit:
		; EPILOG-NEXT: br label %for.exit2
		; EPILOG: for.exit2.loopexit2:
		; EPILOG-NEXT: br label %for.exit2
; EPILOG: for.exit2:		; EPILOG: for.exit2:
; EPILOG-NEXT: ret i32 42		; EPILOG-NEXT: ret i32 42
		; EPILOG: for.exiting_block.1:
		; EPILOG-NEXT: %arrayidx.1 = getelementptr inbounds i32, i32* %a, i64 %indvars.iv.next
		; EPILOG-NEXT: %4 = load i32, i32* %arrayidx.1, align 4
		; EPILOG-NEXT: %add.1 = add nsw i32 %4, %add
		; EPILOG-NEXT: %cmp.1 = icmp eq i64 %n, 42
		; EPILOG-NEXT: br i1 %cmp.1, label %latchExit.epilog-lcssa.loopexit, label %latch.1
		; EPILOG: latch.1:
		; EPILOG-NEXT: %indvars.iv.next.1 = add nuw nsw i64 %indvars.iv.next, 1
		; EPILOG-NEXT: %niter.nsub.1 = sub i64 %niter.nsub, 1
		; EPILOG-NEXT: br i1 %cond, label %for.exit2.loopexit, label %for.exiting_block.2
		; EPILOG: for.exiting_block.2:
		; EPILOG-NEXT: %arrayidx.2 = getelementptr inbounds i32, i32* %a, i64 %indvars.iv.next.1
		; EPILOG-NEXT: %5 = load i32, i32* %arrayidx.2, align 4
		; EPILOG-NEXT: %add.2 = add nsw i32 %5, %add.1
		; EPILOG-NEXT: %cmp.2 = icmp eq i64 %n, 42
		; EPILOG-NEXT: br i1 %cmp.2, label %latchExit.epilog-lcssa.loopexit, label %latch.2
		; EPILOG: latch.2:
		; EPILOG-NEXT: %indvars.iv.next.2 = add nuw nsw i64 %indvars.iv.next.1, 1
		; EPILOG-NEXT: %niter.nsub.2 = sub i64 %niter.nsub.1, 1
		; EPILOG-NEXT: br i1 %cond, label %for.exit2.loopexit, label %for.exiting_block.3
		; EPILOG: for.exiting_block.3:
		; EPILOG-NEXT: %arrayidx.3 = getelementptr inbounds i32, i32* %a, i64 %indvars.iv.next.2
		; EPILOG-NEXT: %6 = load i32, i32* %arrayidx.3, align 4
		; EPILOG-NEXT: %add.3 = add nsw i32 %6, %add.2
		; EPILOG-NEXT: %cmp.3 = icmp eq i64 %n, 42
		; EPILOG-NEXT: br i1 %cmp.3, label %latchExit.epilog-lcssa.loopexit, label %latch.3
		; EPILOG: latch.3:
		; EPILOG-NEXT: %indvars.iv.next.3 = add nuw nsw i64 %indvars.iv.next.2, 1
		; EPILOG-NEXT: %niter.nsub.3 = sub i64 %niter.nsub.2, 1
		; EPILOG-NEXT: br i1 %cond, label %for.exit2.loopexit, label %for.exiting_block.4
		; EPILOG: for.exiting_block.4:
		; EPILOG-NEXT: %arrayidx.4 = getelementptr inbounds i32, i32* %a, i64 %indvars.iv.next.3
		; EPILOG-NEXT: %7 = load i32, i32* %arrayidx.4, align 4
		; EPILOG-NEXT: %add.4 = add nsw i32 %7, %add.3
		; EPILOG-NEXT: %cmp.4 = icmp eq i64 %n, 42
		; EPILOG-NEXT: br i1 %cmp.4, label %latchExit.epilog-lcssa.loopexit, label %latch.4
		; EPILOG: latch.4:
		; EPILOG-NEXT: %indvars.iv.next.4 = add nuw nsw i64 %indvars.iv.next.3, 1
		; EPILOG-NEXT: %niter.nsub.4 = sub i64 %niter.nsub.3, 1
		; EPILOG-NEXT: br i1 %cond, label %for.exit2.loopexit, label %for.exiting_block.5
		; EPILOG: for.exiting_block.5:
		; EPILOG-NEXT: %arrayidx.5 = getelementptr inbounds i32, i32* %a, i64 %indvars.iv.next.4
		; EPILOG-NEXT: %8 = load i32, i32* %arrayidx.5, align 4
		; EPILOG-NEXT: %add.5 = add nsw i32 %8, %add.4
		; EPILOG-NEXT: %cmp.5 = icmp eq i64 %n, 42
		; EPILOG-NEXT: br i1 %cmp.5, label %latchExit.epilog-lcssa.loopexit, label %latch.5
		; EPILOG: latch.5:
		; EPILOG-NEXT: %indvars.iv.next.5 = add nuw nsw i64 %indvars.iv.next.4, 1
		; EPILOG-NEXT: %niter.nsub.5 = sub i64 %niter.nsub.4, 1
		; EPILOG-NEXT: br i1 %cond, label %for.exit2.loopexit, label %for.exiting_block.6
		; EPILOG: for.exiting_block.6:
		; EPILOG-NEXT: %arrayidx.6 = getelementptr inbounds i32, i32* %a, i64 %indvars.iv.next.5
		; EPILOG-NEXT: %9 = load i32, i32* %arrayidx.6, align 4
		; EPILOG-NEXT: %add.6 = add nsw i32 %9, %add.5
		; EPILOG-NEXT: %cmp.6 = icmp eq i64 %n, 42
		; EPILOG-NEXT: br i1 %cmp.6, label %latchExit.epilog-lcssa.loopexit, label %latch.6
		; EPILOG: latch.6:
		; EPILOG-NEXT: %indvars.iv.next.6 = add nuw nsw i64 %indvars.iv.next.5, 1
		; EPILOG-NEXT: %niter.nsub.6 = sub i64 %niter.nsub.5, 1
		; EPILOG-NEXT: br i1 %cond, label %for.exit2.loopexit, label %for.exiting_block.7
		; EPILOG: for.exiting_block.7:
		; EPILOG-NEXT: %arrayidx.7 = getelementptr inbounds i32, i32* %a, i64 %indvars.iv.next.6
		; EPILOG-NEXT: %10 = load i32, i32* %arrayidx.7, align 4
		; EPILOG-NEXT: %add.7 = add nsw i32 %10, %add.6
		; EPILOG-NEXT: %cmp.7 = icmp eq i64 %n, 42
		; EPILOG-NEXT: br i1 %cmp.7, label %latchExit.epilog-lcssa.loopexit, label %latch.7
		; EPILOG: latch.7:
		; EPILOG-NEXT: %indvars.iv.next.7 = add i64 %indvars.iv.next.6, 1
		; EPILOG-NEXT: %niter.nsub.7 = sub i64 %niter.nsub.6, 1
		; EPILOG-NEXT: %niter.ncmp.7 = icmp eq i64 %niter.nsub.7, 0
		; EPILOG-NEXT: br i1 %niter.ncmp.7, label %latchExit.unr-lcssa.loopexit, label %header
;		;
; EPILOG-BLOCK-LABEL: @otherblock_latch_same_exit3(		; EPILOG-BLOCK-LABEL: @otherblock_latch_same_exit3(
; EPILOG-BLOCK-NEXT: entry:		; EPILOG-BLOCK-NEXT: entry:
		; EPILOG-BLOCK-NEXT: %0 = add i64 %n, -1
		; EPILOG-BLOCK-NEXT: %xtraiter = and i64 %n, 1
		; EPILOG-BLOCK-NEXT: %1 = icmp ult i64 %0, 1
		; EPILOG-BLOCK-NEXT: br i1 %1, label %latchExit.unr-lcssa, label %entry.new
		; EPILOG-BLOCK: entry.new:
		; EPILOG-BLOCK-NEXT: %unroll_iter = sub i64 %n, %xtraiter
; EPILOG-BLOCK-NEXT: br label %header		; EPILOG-BLOCK-NEXT: br label %header
; EPILOG-BLOCK: header:		; EPILOG-BLOCK: header:
; EPILOG-BLOCK-NEXT: %indvars.iv = phi i64 [ 0, %entry ], [ %indvars.iv.next.1, %latch.1 ]		; EPILOG-BLOCK-NEXT: %indvars.iv = phi i64 [ 0, %entry.new ], [ %indvars.iv.next.1, %latch.1 ]
; EPILOG-BLOCK-NEXT: %sum.02 = phi i32 [ 0, %entry ], [ %add.1, %latch.1 ]		; EPILOG-BLOCK-NEXT: %sum.02 = phi i32 [ 0, %entry.new ], [ %add.1, %latch.1 ]
; EPILOG-BLOCK-NEXT: br i1 %cond, label %for.exit2, label %for.exiting_block		; EPILOG-BLOCK-NEXT: %niter = phi i64 [ %unroll_iter, %entry.new ], [ %niter.nsub.1, %latch.1 ]
		; EPILOG-BLOCK-NEXT: br i1 %cond, label %for.exit2.loopexit, label %for.exiting_block
; EPILOG-BLOCK: for.exiting_block:		; EPILOG-BLOCK: for.exiting_block:
; EPILOG-BLOCK-NEXT: %arrayidx = getelementptr inbounds i32, i32* %a, i64 %indvars.iv		; EPILOG-BLOCK-NEXT: %arrayidx = getelementptr inbounds i32, i32* %a, i64 %indvars.iv
; EPILOG-BLOCK-NEXT: %0 = load i32, i32* %arrayidx, align 4		; EPILOG-BLOCK-NEXT: %2 = load i32, i32* %arrayidx, align 4
; EPILOG-BLOCK-NEXT: %add = add nsw i32 %0, %sum.02		; EPILOG-BLOCK-NEXT: %add = add nsw i32 %2, %sum.02
; EPILOG-BLOCK-NEXT: %cmp = icmp eq i64 %n, 42		; EPILOG-BLOCK-NEXT: %cmp = icmp eq i64 %n, 42
; EPILOG-BLOCK-NEXT: br i1 %cmp, label %latchExit, label %latch		; EPILOG-BLOCK-NEXT: br i1 %cmp, label %latchExit.epilog-lcssa.loopexit, label %latch
; EPILOG-BLOCK: latch:		; EPILOG-BLOCK: latch:
; EPILOG-BLOCK-NEXT: %indvars.iv.next = add nuw nsw i64 %indvars.iv, 1		; EPILOG-BLOCK-NEXT: %indvars.iv.next = add nuw nsw i64 %indvars.iv, 1
; EPILOG-BLOCK-NEXT: %exitcond = icmp eq i64 %indvars.iv.next, %n		; EPILOG-BLOCK-NEXT: %niter.nsub = sub i64 %niter, 1
; EPILOG-BLOCK-NEXT: br i1 %exitcond, label %latchExit, label %header.1		; EPILOG-BLOCK-NEXT: br i1 %cond, label %for.exit2.loopexit, label %for.exiting_block.1
		; EPILOG-BLOCK: latchExit.unr-lcssa.loopexit:
		; EPILOG-BLOCK-NEXT: %result.ph.ph = phi i32 [ %add.1, %latch.1 ]
		; EPILOG-BLOCK-NEXT: %indvars.iv.unr.ph = phi i64 [ %indvars.iv.next.1, %latch.1 ]
		; EPILOG-BLOCK-NEXT: %sum.02.unr.ph = phi i32 [ %add.1, %latch.1 ]
		; EPILOG-BLOCK-NEXT: br label %latchExit.unr-lcssa
		; EPILOG-BLOCK: latchExit.unr-lcssa:
		; EPILOG-BLOCK-NEXT: %result.ph = phi i32 [ undef, %entry ], [ %result.ph.ph, %latchExit.unr-lcssa.loopexit ]
		; EPILOG-BLOCK-NEXT: %indvars.iv.unr = phi i64 [ 0, %entry ], [ %indvars.iv.unr.ph, %latchExit.unr-lcssa.loopexit ]
		; EPILOG-BLOCK-NEXT: %sum.02.unr = phi i32 [ 0, %entry ], [ %sum.02.unr.ph, %latchExit.unr-lcssa.loopexit ]
		; EPILOG-BLOCK-NEXT: %lcmp.mod = icmp ne i64 %xtraiter, 0
		; EPILOG-BLOCK-NEXT: br i1 %lcmp.mod, label %header.epil.preheader, label %latchExit
		; EPILOG-BLOCK: header.epil.preheader:
		; EPILOG-BLOCK-NEXT: br label %header.epil
		; EPILOG-BLOCK: header.epil:
		; EPILOG-BLOCK-NEXT: %indvars.iv.epil = phi i64 [ %indvars.iv.unr, %header.epil.preheader ]
		; EPILOG-BLOCK-NEXT: %sum.02.epil = phi i32 [ %sum.02.unr, %header.epil.preheader ]
		; EPILOG-BLOCK-NEXT: br i1 %cond, label %for.exit2, label %for.exiting_block.epil
		; EPILOG-BLOCK: for.exiting_block.epil:
		; EPILOG-BLOCK-NEXT: %arrayidx.epil = getelementptr inbounds i32, i32* %a, i64 %indvars.iv.epil
		; EPILOG-BLOCK-NEXT: %3 = load i32, i32* %arrayidx.epil, align 4
		; EPILOG-BLOCK-NEXT: %add.epil = add nsw i32 %3, %sum.02.epil
		; EPILOG-BLOCK-NEXT: %cmp.epil = icmp eq i64 %n, 42
		; EPILOG-BLOCK-NEXT: br i1 %cmp.epil, label %latchExit.epilog-lcssa, label %latch.epil
		; EPILOG-BLOCK: latch.epil:
		; EPILOG-BLOCK-NEXT: %indvars.iv.next.epil = add i64 %indvars.iv.epil, 1
		; EPILOG-BLOCK-NEXT: %exitcond.epil = icmp eq i64 %indvars.iv.next.epil, %n
		; EPILOG-BLOCK-NEXT: br label %latchExit.epilog-lcssa
		; EPILOG-BLOCK: latchExit.epilog-lcssa.loopexit:
		; EPILOG-BLOCK-NEXT: %result.ph1.ph = phi i32 [ %sum.02, %for.exiting_block ], [ %add, %for.exiting_block.1 ]
		; EPILOG-BLOCK-NEXT: br label %latchExit.epilog-lcssa
		; EPILOG-BLOCK: latchExit.epilog-lcssa:
		; EPILOG-BLOCK-NEXT: %result.ph1 = phi i32 [ %add.epil, %latch.epil ], [ %sum.02.epil, %for.exiting_block.epil ], [ %result.ph1.ph, %latchExit.epilog-lcssa.loopexit ]
		; EPILOG-BLOCK-NEXT: br label %latchExit
; EPILOG-BLOCK: latchExit:		; EPILOG-BLOCK: latchExit:
; EPILOG-BLOCK-NEXT: %result = phi i32 [ %sum.02, %for.exiting_block ], [ %add, %latch ], [ %add, %for.exiting_block.1 ], [ %add.1, %latch.1 ]		; EPILOG-BLOCK-NEXT: %result = phi i32 [ %result.ph, %latchExit.unr-lcssa ], [ %result.ph1, %latchExit.epilog-lcssa ]
; EPILOG-BLOCK-NEXT: ret i32 %result		; EPILOG-BLOCK-NEXT: ret i32 %result
		; EPILOG-BLOCK: for.exit2.loopexit:
		; EPILOG-BLOCK-NEXT: br label %for.exit2
; EPILOG-BLOCK: for.exit2:		; EPILOG-BLOCK: for.exit2:
; EPILOG-BLOCK-NEXT: ret i32 42		; EPILOG-BLOCK-NEXT: ret i32 42
; EPILOG-BLOCK: header.1:
; EPILOG-BLOCK-NEXT: br i1 %cond, label %for.exit2, label %for.exiting_block.1
; EPILOG-BLOCK: for.exiting_block.1:		; EPILOG-BLOCK: for.exiting_block.1:
; EPILOG-BLOCK-NEXT: %arrayidx.1 = getelementptr inbounds i32, i32* %a, i64 %indvars.iv.next		; EPILOG-BLOCK-NEXT: %arrayidx.1 = getelementptr inbounds i32, i32* %a, i64 %indvars.iv.next
; EPILOG-BLOCK-NEXT: %1 = load i32, i32* %arrayidx.1, align 4		; EPILOG-BLOCK-NEXT: %4 = load i32, i32* %arrayidx.1, align 4
; EPILOG-BLOCK-NEXT: %add.1 = add nsw i32 %1, %add		; EPILOG-BLOCK-NEXT: %add.1 = add nsw i32 %4, %add
; EPILOG-BLOCK-NEXT: %cmp.1 = icmp eq i64 %n, 42		; EPILOG-BLOCK-NEXT: %cmp.1 = icmp eq i64 %n, 42
; EPILOG-BLOCK-NEXT: br i1 %cmp.1, label %latchExit, label %latch.1		; EPILOG-BLOCK-NEXT: br i1 %cmp.1, label %latchExit.epilog-lcssa.loopexit, label %latch.1
; EPILOG-BLOCK: latch.1:		; EPILOG-BLOCK: latch.1:
; EPILOG-BLOCK-NEXT: %indvars.iv.next.1 = add i64 %indvars.iv.next, 1		; EPILOG-BLOCK-NEXT: %indvars.iv.next.1 = add i64 %indvars.iv.next, 1
; EPILOG-BLOCK-NEXT: %exitcond.1 = icmp eq i64 %indvars.iv.next.1, %n		; EPILOG-BLOCK-NEXT: %niter.nsub.1 = sub i64 %niter.nsub, 1
; EPILOG-BLOCK-NEXT: br i1 %exitcond.1, label %latchExit, label %header, !llvm.loop !7		; EPILOG-BLOCK-NEXT: %niter.ncmp.1 = icmp eq i64 %niter.nsub.1, 0
		; EPILOG-BLOCK-NEXT: br i1 %niter.ncmp.1, label %latchExit.unr-lcssa.loopexit, label %header, !llvm.loop !7
;		;
; PROLOG-LABEL: @otherblock_latch_same_exit3(		; PROLOG-LABEL: @otherblock_latch_same_exit3(
; PROLOG-NEXT: entry:		; PROLOG-NEXT: entry:
; PROLOG-NEXT: br label %header		; PROLOG-NEXT: br label %header
; PROLOG: header:		; PROLOG: header:
; PROLOG-NEXT: %indvars.iv = phi i64 [ %indvars.iv.next, %latch ], [ 0, %entry ]		; PROLOG-NEXT: %indvars.iv = phi i64 [ %indvars.iv.next, %latch ], [ 0, %entry ]
; PROLOG-NEXT: %sum.02 = phi i32 [ %add, %latch ], [ 0, %entry ]		; PROLOG-NEXT: %sum.02 = phi i32 [ %add, %latch ], [ 0, %entry ]
; PROLOG-NEXT: br i1 %cond, label %for.exit2, label %for.exiting_block		; PROLOG-NEXT: br i1 %cond, label %for.exit2, label %for.exiting_block
▲ Show 20 Lines • Show All 185 Lines • ▼ Show 20 Lines
; EPILOG-NEXT: i64 42, label %exit1.loopexit2		; EPILOG-NEXT: i64 42, label %exit1.loopexit2
; EPILOG-NEXT: ]		; EPILOG-NEXT: ]
; EPILOG: loop_latch.epil:		; EPILOG: loop_latch.epil:
; EPILOG-NEXT: %iv_next.epil = add nuw nsw i64 %iv.epil, 1		; EPILOG-NEXT: %iv_next.epil = add nuw nsw i64 %iv.epil, 1
; EPILOG-NEXT: %sum.next.epil = add i64 %sum.epil, %add		; EPILOG-NEXT: %sum.next.epil = add i64 %sum.epil, %add
; EPILOG-NEXT: %cmp.epil = icmp ne i64 %iv_next.epil, %trip		; EPILOG-NEXT: %cmp.epil = icmp ne i64 %iv_next.epil, %trip
; EPILOG-NEXT: %epil.iter.sub = sub i64 %epil.iter, 1		; EPILOG-NEXT: %epil.iter.sub = sub i64 %epil.iter, 1
; EPILOG-NEXT: %epil.iter.cmp = icmp ne i64 %epil.iter.sub, 0		; EPILOG-NEXT: %epil.iter.cmp = icmp ne i64 %epil.iter.sub, 0
; EPILOG-NEXT: br i1 %epil.iter.cmp, label %loop_header.epil, label %latchexit.epilog-lcssa, !llvm.loop !4		; EPILOG-NEXT: br i1 %epil.iter.cmp, label %loop_header.epil, label %latchexit.epilog-lcssa, !llvm.loop !8
; EPILOG: latchexit.epilog-lcssa:		; EPILOG: latchexit.epilog-lcssa:
; EPILOG-NEXT: %sum.next.lcssa.ph1 = phi i64 [ %sum.next.epil, %loop_latch.epil ]		; EPILOG-NEXT: %sum.next.lcssa.ph1 = phi i64 [ %sum.next.epil, %loop_latch.epil ]
; EPILOG-NEXT: br label %latchexit		; EPILOG-NEXT: br label %latchexit
; EPILOG: latchexit:		; EPILOG: latchexit:
; EPILOG-NEXT: %sum.next.lcssa = phi i64 [ %sum.next.lcssa.ph, %latchexit.unr-lcssa ], [ %sum.next.lcssa.ph1, %latchexit.epilog-lcssa ]		; EPILOG-NEXT: %sum.next.lcssa = phi i64 [ %sum.next.lcssa.ph, %latchexit.unr-lcssa ], [ %sum.next.lcssa.ph1, %latchexit.epilog-lcssa ]
; EPILOG-NEXT: ret i64 %sum.next.lcssa		; EPILOG-NEXT: ret i64 %sum.next.lcssa
; EPILOG: loop_exiting.1:		; EPILOG: loop_exiting.1:
; EPILOG-NEXT: %ivy.1 = add i64 %iv_next, %add		; EPILOG-NEXT: %ivy.1 = add i64 %iv_next, %add
▲ Show 20 Lines • Show All 438 Lines • ▼ Show 20 Lines
; EPILOG: latch.epil:		; EPILOG: latch.epil:
; EPILOG-NEXT: %arrayidx.epil = getelementptr inbounds i32, i32* %a, i64 %indvars.iv.epil		; EPILOG-NEXT: %arrayidx.epil = getelementptr inbounds i32, i32* %a, i64 %indvars.iv.epil
; EPILOG-NEXT: %load.epil = load i32, i32* %arrayidx.epil, align 4		; EPILOG-NEXT: %load.epil = load i32, i32* %arrayidx.epil, align 4
; EPILOG-NEXT: %add.epil = add nsw i32 %load.epil, %sum.02.epil		; EPILOG-NEXT: %add.epil = add nsw i32 %load.epil, %sum.02.epil
; EPILOG-NEXT: %indvars.iv.next.epil = add i64 %indvars.iv.epil, 1		; EPILOG-NEXT: %indvars.iv.next.epil = add i64 %indvars.iv.epil, 1
; EPILOG-NEXT: %exitcond.epil = icmp eq i64 %indvars.iv.next.epil, %n		; EPILOG-NEXT: %exitcond.epil = icmp eq i64 %indvars.iv.next.epil, %n
; EPILOG-NEXT: %epil.iter.sub = sub i64 %epil.iter, 1		; EPILOG-NEXT: %epil.iter.sub = sub i64 %epil.iter, 1
; EPILOG-NEXT: %epil.iter.cmp = icmp ne i64 %epil.iter.sub, 0		; EPILOG-NEXT: %epil.iter.cmp = icmp ne i64 %epil.iter.sub, 0
; EPILOG-NEXT: br i1 %epil.iter.cmp, label %header.epil, label %latch_exit.epilog-lcssa, !llvm.loop !5		; EPILOG-NEXT: br i1 %epil.iter.cmp, label %header.epil, label %latch_exit.epilog-lcssa, !llvm.loop !9
; EPILOG: latch_exit.epilog-lcssa:		; EPILOG: latch_exit.epilog-lcssa:
; EPILOG-NEXT: %sum.0.lcssa.ph1 = phi i32 [ %add.epil, %latch.epil ]		; EPILOG-NEXT: %sum.0.lcssa.ph1 = phi i32 [ %add.epil, %latch.epil ]
; EPILOG-NEXT: br label %latch_exit		; EPILOG-NEXT: br label %latch_exit
; EPILOG: latch_exit:		; EPILOG: latch_exit:
; EPILOG-NEXT: %sum.0.lcssa = phi i32 [ %sum.0.lcssa.ph, %latch_exit.unr-lcssa ], [ %sum.0.lcssa.ph1, %latch_exit.epilog-lcssa ]		; EPILOG-NEXT: %sum.0.lcssa = phi i32 [ %sum.0.lcssa.ph, %latch_exit.unr-lcssa ], [ %sum.0.lcssa.ph1, %latch_exit.epilog-lcssa ]
; EPILOG-NEXT: ret i32 %sum.0.lcssa		; EPILOG-NEXT: ret i32 %sum.0.lcssa
; EPILOG: for.exit2.loopexit:		; EPILOG: for.exit2.loopexit:
; EPILOG-NEXT: %retval.ph = phi i32 [ 42, %for.exiting_block ], [ %sum.02, %header ], [ %add, %latch ], [ 42, %for.exiting_block.1 ], [ %add.1, %latch.1 ], [ 42, %for.exiting_block.2 ], [ %add.2, %latch.2 ], [ 42, %for.exiting_block.3 ], [ %add.3, %latch.3 ], [ 42, %for.exiting_block.4 ], [ %add.4, %latch.4 ], [ 42, %for.exiting_block.5 ], [ %add.5, %latch.5 ], [ 42, %for.exiting_block.6 ], [ %add.6, %latch.6 ], [ 42, %for.exiting_block.7 ]		; EPILOG-NEXT: %retval.ph = phi i32 [ 42, %for.exiting_block ], [ %sum.02, %header ], [ %add, %latch ], [ 42, %for.exiting_block.1 ], [ %add.1, %latch.1 ], [ 42, %for.exiting_block.2 ], [ %add.2, %latch.2 ], [ 42, %for.exiting_block.3 ], [ %add.3, %latch.3 ], [ 42, %for.exiting_block.4 ], [ %add.4, %latch.4 ], [ 42, %for.exiting_block.5 ], [ %add.5, %latch.5 ], [ 42, %for.exiting_block.6 ], [ %add.6, %latch.6 ], [ 42, %for.exiting_block.7 ]
▲ Show 20 Lines • Show All 440 Lines • ▼ Show 20 Lines
; EPILOG-NEXT: %i6.epil = phi i64 [ %i6.unr, %header.epil.preheader ], [ %add.epil, %latch.epil ]		; EPILOG-NEXT: %i6.epil = phi i64 [ %i6.unr, %header.epil.preheader ], [ %add.epil, %latch.epil ]
; EPILOG-NEXT: %epil.iter = phi i64 [ %xtraiter, %header.epil.preheader ], [ %epil.iter.sub, %latch.epil ]		; EPILOG-NEXT: %epil.iter = phi i64 [ %xtraiter, %header.epil.preheader ], [ %epil.iter.sub, %latch.epil ]
; EPILOG-NEXT: br i1 false, label %loopexit1.loopexit1, label %latch.epil		; EPILOG-NEXT: br i1 false, label %loopexit1.loopexit1, label %latch.epil
; EPILOG: latch.epil:		; EPILOG: latch.epil:
; EPILOG-NEXT: %add.epil = add nuw nsw i64 %i6.epil, 1		; EPILOG-NEXT: %add.epil = add nuw nsw i64 %i6.epil, 1
; EPILOG-NEXT: %i9.epil = icmp slt i64 %add.epil, %sext		; EPILOG-NEXT: %i9.epil = icmp slt i64 %add.epil, %sext
; EPILOG-NEXT: %epil.iter.sub = sub i64 %epil.iter, 1		; EPILOG-NEXT: %epil.iter.sub = sub i64 %epil.iter, 1
; EPILOG-NEXT: %epil.iter.cmp = icmp ne i64 %epil.iter.sub, 0		; EPILOG-NEXT: %epil.iter.cmp = icmp ne i64 %epil.iter.sub, 0
; EPILOG-NEXT: br i1 %epil.iter.cmp, label %header.epil, label %latchexit.epilog-lcssa, !llvm.loop !6		; EPILOG-NEXT: br i1 %epil.iter.cmp, label %header.epil, label %latchexit.epilog-lcssa, !llvm.loop !10
; EPILOG: latchexit.epilog-lcssa:		; EPILOG: latchexit.epilog-lcssa:
; EPILOG-NEXT: br label %latchexit		; EPILOG-NEXT: br label %latchexit
; EPILOG: latchexit:		; EPILOG: latchexit:
; EPILOG-NEXT: unreachable		; EPILOG-NEXT: unreachable
; EPILOG: loopexit2:		; EPILOG: loopexit2:
; EPILOG-NEXT: ret i32 %shft		; EPILOG-NEXT: ret i32 %shft
; EPILOG: loopexit1.loopexit:		; EPILOG: loopexit1.loopexit:
; EPILOG-NEXT: %sext3.ph = phi i32 [ %shft, %header ], [ %shft, %latch ], [ %shft, %latch.1 ], [ %shft, %latch.2 ], [ %shft, %latch.3 ], [ %shft, %latch.4 ], [ %shft, %latch.5 ], [ %shft, %latch.6 ]		; EPILOG-NEXT: %sext3.ph = phi i32 [ %shft, %header ], [ %shft, %latch ], [ %shft, %latch.1 ], [ %shft, %latch.2 ], [ %shft, %latch.3 ], [ %shft, %latch.4 ], [ %shft, %latch.5 ], [ %shft, %latch.6 ]
▲ Show 20 Lines • Show All 803 Lines • Show Last 20 Lines