This is an archive of the discontinued LLVM Phabricator instance.

[WIP][LV] Reassociate start value of recurrence to end
Needs ReviewPublic

Authored by reames on Oct 25 2022, 1:57 PM.

Download Raw Diff

Details

Reviewers

craig.topper
fhahn
paulwalker-arm
david-arm

Summary

This is more a discussion item than an actual patch right now. Curious to know what folks think about profitability on various targets.

Our current lowering of a reduction in the vectorizer creates the starting vector value as a splat of the identity element and then inserts the original scalar start as the low element. An alternate choice would be to instead use a splat of the identity element, and defer handling the scalar start until the end of the loop.

RISC-V has an interesting quirk to the reduction instructions where the start value of the recurrence must be provided. As a result, using the deferred-add strategy fits slightly better with the ISA, and generally allows us to get rid of one scalar to vector insert. Its worth noting this comes at the cost of extending the live range of the scalar start value.

I glanced at AArch64 for comparison, and all of the unordered reductions appear to have a single vector operand. So, in this case the deferred add strategy would cost us a longer live range and an extra scalar add. This doesn't appear profitable unless I'm missing something.

What do our other targets prefer here? Is this a case we should just have a target hook, or is there something smarter we can do heuristic wise?

Diff Detail

Unit TestsFailed

	Time	Test
	30 ms	x64 debian > LLVM.MC/WebAssembly::array-fill.ll
	90 ms	x64 debian > LLVM.MC/WebAssembly::assembler-binary.ll
	30 ms	x64 debian > LLVM.MC/WebAssembly::bss.ll
	70 ms	x64 debian > LLVM.MC/WebAssembly::comdat.ll
	40 ms	x64 debian > LLVM.MC/WebAssembly::debug-info.ll
		View Full Test Results (20 Failed)

Event Timeline

reames created this revision.Oct 25 2022, 1:57 PM

Herald added a project: Restricted Project. · View Herald TranscriptOct 25 2022, 1:57 PM

Herald added subscribers: kosarev, StephenFan, frasercrmck and 29 others. · View Herald Transcript

reames requested review of this revision.Oct 25 2022, 1:57 PM

Herald added a project: Restricted Project. · View Herald TranscriptOct 25 2022, 1:57 PM

Herald added subscribers: • pcwang-thead, vkmr, MaskRay. · View Herald Transcript

Harbormaster completed remote builds in B194264: Diff 470607.Oct 25 2022, 3:05 PM

Revision Contents

Path

Size

llvm/

lib/

Transforms/

Vectorize/

LoopVectorize.cpp

22 lines

VPlanRecipes.cpp

12 lines

test/

Transforms/

LoopVectorize/

AArch64/

gather-do-not-vectorize-addressing.ll

58 lines

sve-epilog-vect-reductions.ll

37 lines

AMDGPU/

packed-math.ll

6 lines

ARM/

mve-reduction-predselect.ll

8 lines

mve-reduction-types.ll

30 lines

mve-selectandorcost.ll

5 lines

sphinx.ll

54 lines

PowerPC/

widened-massv-call.ll

3 lines

widened-massv-vfabi-attr.ll

3 lines

RISCV/

5 lines

5 lines

10 lines

5 lines

X86/

cost-model.ll

5 lines

imprecise-through-phis.ll

10 lines

invariant-store-vectorization.ll

24 lines

load-deref-pred.ll

70 lines

reduction-fastmath.ll

35 lines

5 lines

13 lines

20 lines

20 lines

epilog-vectorization-reductions.ll

204 lines

first-order-recurrence.ll

564 lines

if-pred-non-void.ll

345 lines

if-pred-stores.ll

378 lines

induction.ll

588 lines

interleaved-accesses.ll

39 lines

loop-form.ll

3 lines

pr51614-fold-tail-by-masking.ll

23 lines

pr55167-fold-tail-live-out.ll

7 lines

reduction-inloop-pred.ll

53 lines

reduction-inloop.ll

51 lines

reduction-predselect.ll

8 lines

reduction-small-size.ll

31 lines

scalable-reduction-inloop.ll

96 lines

trunc-reductions.ll

98 lines

PhaseOrdering/

AArch64/

peel-multiple-unreachable-exits-for-vectorization.ll

112 lines

Diff 470607

llvm/lib/Transforms/Vectorize/LoopVectorize.cpp

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 3,860 Lines • ▼ Show 20 Lines	void InnerLoopVectorizer::fixReduction(VPReductionPHIRecipe *PhiR,
VPTransformState &State) {		VPTransformState &State) {
PHINode *OrigPhi = cast<PHINode>(PhiR->getUnderlyingValue());		PHINode *OrigPhi = cast<PHINode>(PhiR->getUnderlyingValue());
// Get it's reduction variable descriptor.		// Get it's reduction variable descriptor.
assert(Legal->isReductionVariable(OrigPhi) &&		assert(Legal->isReductionVariable(OrigPhi) &&
"Unable to find the reduction variable");		"Unable to find the reduction variable");
const RecurrenceDescriptor &RdxDesc = PhiR->getRecurrenceDescriptor();		const RecurrenceDescriptor &RdxDesc = PhiR->getRecurrenceDescriptor();

RecurKind RK = RdxDesc.getRecurrenceKind();		RecurKind RK = RdxDesc.getRecurrenceKind();
TrackingVH<Value> ReductionStartValue = RdxDesc.getRecurrenceStartValue();		// There are two start values in play. For non-epilogue reduction, these
		// are the same. For epilogue vectorization, the recurrence start value
		// is the start of the unvectorized reduction. The start value of the
		// recipe is the start value of the epilogue loop after vectorization
		// of the main loop (i.e. the resume value).
		TrackingVH<Value> OrigStartValue = RdxDesc.getRecurrenceStartValue();
		VPValue *StartVPV = PhiR->getStartValue();
		TrackingVH<Value> ReductionStartValue = StartVPV->getLiveInIRValue();


Instruction *LoopExitInst = RdxDesc.getLoopExitInstr();		Instruction *LoopExitInst = RdxDesc.getLoopExitInstr();
State.setDebugLocFromInst(ReductionStartValue);		State.setDebugLocFromInst(ReductionStartValue);

VPValue *LoopExitInstDef = PhiR->getBackedgeValue();		VPValue *LoopExitInstDef = PhiR->getBackedgeValue();
// This is the vector-clone of the value that leaves the loop.		// This is the vector-clone of the value that leaves the loop.
Type *VecTy = State.get(LoopExitInstDef, 0)->getType();		Type *VecTy = State.get(LoopExitInstDef, 0)->getType();

// Wrap flags are in general invalid after vectorization, clear them.		// Wrap flags are in general invalid after vectorization, clear them.
▲ Show 20 Lines • Show All 112 Lines • ▼ Show 20 Lines	if (VF.isVector() && !PhiR->isInLoop()) {
ReducedPartRdx =		ReducedPartRdx =
createTargetReduction(Builder, TTI, RdxDesc, ReducedPartRdx, OrigPhi);		createTargetReduction(Builder, TTI, RdxDesc, ReducedPartRdx, OrigPhi);
// If the reduction can be performed in a smaller type, we need to extend		// If the reduction can be performed in a smaller type, we need to extend
// the reduction to the wider type before we branch to the original loop.		// the reduction to the wider type before we branch to the original loop.
if (PhiTy != RdxDesc.getRecurrenceType())		if (PhiTy != RdxDesc.getRecurrenceType())
ReducedPartRdx = RdxDesc.isSigned()		ReducedPartRdx = RdxDesc.isSigned()
? Builder.CreateSExt(ReducedPartRdx, PhiTy)		? Builder.CreateSExt(ReducedPartRdx, PhiTy)
: Builder.CreateZExt(ReducedPartRdx, PhiTy);		: Builder.CreateZExt(ReducedPartRdx, PhiTy);

		if (!PhiR->isOrdered() && Op != Instruction::ICmp && Op != Instruction::FCmp) {
		ReducedPartRdx = Builder.CreateBinOp(
		(Instruction::BinaryOps)Op, ReductionStartValue, ReducedPartRdx,
		"rdx.start");
		}
}		}

PHINode *ResumePhi =		PHINode *ResumePhi = dyn_cast<PHINode>(StartVPV->getUnderlyingValue());
dyn_cast<PHINode>(PhiR->getStartValue()->getUnderlyingValue());

// Create a phi node that merges control-flow from the backedge-taken check		// Create a phi node that merges control-flow from the backedge-taken check
// block and the middle block.		// block and the middle block.
PHINode *BCBlockPhi = PHINode::Create(PhiTy, 2, "bc.merge.rdx",		PHINode *BCBlockPhi = PHINode::Create(PhiTy, 2, "bc.merge.rdx",
LoopScalarPreHeader->getTerminator());		LoopScalarPreHeader->getTerminator());

// If we are fixing reductions in the epilogue loop then we should already		// If we are fixing reductions in the epilogue loop then we should already
// have created a bc.merge.rdx Phi after the main vector body. Ensure that		// have created a bc.merge.rdx Phi after the main vector body. Ensure that
// we carry over the incoming values correctly.		// we carry over the incoming values correctly.
for (auto *Incoming : predecessors(LoopScalarPreHeader)) {		for (auto *Incoming : predecessors(LoopScalarPreHeader)) {
if (Incoming == LoopMiddleBlock)		if (Incoming == LoopMiddleBlock)
BCBlockPhi->addIncoming(ReducedPartRdx, Incoming);		BCBlockPhi->addIncoming(ReducedPartRdx, Incoming);
else if (ResumePhi && llvm::is_contained(ResumePhi->blocks(), Incoming))		else if (ResumePhi && llvm::is_contained(ResumePhi->blocks(), Incoming))
BCBlockPhi->addIncoming(ResumePhi->getIncomingValueForBlock(Incoming),		BCBlockPhi->addIncoming(ResumePhi->getIncomingValueForBlock(Incoming),
Incoming);		Incoming);
else		else
BCBlockPhi->addIncoming(ReductionStartValue, Incoming);		BCBlockPhi->addIncoming(OrigStartValue, Incoming);
}		}

// Set the resume value for this reduction		// Set the resume value for this reduction
ReductionResumeValues.insert({&RdxDesc, BCBlockPhi});		ReductionResumeValues.insert({&RdxDesc, BCBlockPhi});

// If there were stores of the reduction value to a uniform memory address		// If there were stores of the reduction value to a uniform memory address
// inside the loop, create the final store here.		// inside the loop, create the final store here.
if (StoreInst *SI = RdxDesc.IntermediateStore) {		if (StoreInst *SI = RdxDesc.IntermediateStore) {
▲ Show 20 Lines • Show All 6,633 Lines • Show Last 20 Lines

llvm/lib/Transforms/Vectorize/VPlanRecipes.cpp

Show First 20 Lines • Show All 1,161 Lines • ▼ Show 20 Lines	void VPReductionPHIRecipe::execute(VPTransformState &State) {
// In order to support recurrences we need to be able to vectorize Phi nodes.		// In order to support recurrences we need to be able to vectorize Phi nodes.
// Phi nodes have cycles, so we need to vectorize them in two stages. This is		// Phi nodes have cycles, so we need to vectorize them in two stages. This is
// stage #1: We create a new vector PHI node with no incoming edges. We'll use		// stage #1: We create a new vector PHI node with no incoming edges. We'll use
// this value when we vectorize all of the instructions that use the PHI.		// this value when we vectorize all of the instructions that use the PHI.
bool ScalarPHI = State.VF.isScalar() \|\| IsInLoop;		bool ScalarPHI = State.VF.isScalar() \|\| IsInLoop;
Type *VecTy =		Type *VecTy =
ScalarPHI ? PN->getType() : VectorType::get(PN->getType(), State.VF);		ScalarPHI ? PN->getType() : VectorType::get(PN->getType(), State.VF);

		bool CanReassociate = !IsInLoop && !IsOrdered;

BasicBlock *HeaderBB = State.CFG.PrevBB;		BasicBlock *HeaderBB = State.CFG.PrevBB;
assert(State.CurrentVectorLoop->getHeader() == HeaderBB &&		assert(State.CurrentVectorLoop->getHeader() == HeaderBB &&
"recipe must be in the vector loop header");		"recipe must be in the vector loop header");
unsigned LastPartForNewPhi = isOrdered() ? 1 : State.UF;		unsigned LastPartForNewPhi = isOrdered() ? 1 : State.UF;
for (unsigned Part = 0; Part < LastPartForNewPhi; ++Part) {		for (unsigned Part = 0; Part < LastPartForNewPhi; ++Part) {
Value *EntryPart =		Value *EntryPart =
PHINode::Create(VecTy, 2, "vec.phi", &*HeaderBB->getFirstInsertionPt());		PHINode::Create(VecTy, 2, "vec.phi", &*HeaderBB->getFirstInsertionPt());
State.set(this, EntryPart, Part);		State.set(this, EntryPart, Part);
Show All 22 Lines	void VPReductionPHIRecipe::execute(VPTransformState &State) {
} else {		} else {
Iden = RdxDesc.getRecurrenceIdentity(RK, VecTy->getScalarType(),		Iden = RdxDesc.getRecurrenceIdentity(RK, VecTy->getScalarType(),
RdxDesc.getFastMathFlags());		RdxDesc.getFastMathFlags());

if (!ScalarPHI) {		if (!ScalarPHI) {
Iden = Builder.CreateVectorSplat(State.VF, Iden);		Iden = Builder.CreateVectorSplat(State.VF, Iden);
IRBuilderBase::InsertPointGuard IPBuilder(Builder);		IRBuilderBase::InsertPointGuard IPBuilder(Builder);
Builder.SetInsertPoint(VectorPH->getTerminator());		Builder.SetInsertPoint(VectorPH->getTerminator());

		if (CanReassociate)
		StartV = Iden;
		else {
Constant *Zero = Builder.getInt32(0);		Constant *Zero = Builder.getInt32(0);
StartV = Builder.CreateInsertElement(Iden, StartV, Zero);		StartV = Builder.CreateInsertElement(Iden, StartV, Zero);
}		}
		StartV = Iden;
		}
}		}

for (unsigned Part = 0; Part < LastPartForNewPhi; ++Part) {		for (unsigned Part = 0; Part < LastPartForNewPhi; ++Part) {
Value *EntryPart = State.get(this, Part);		Value *EntryPart = State.get(this, Part);
// Make sure to add the reduction start value only to the		// Make sure to add the reduction start value only to the
// first unroll part.		// first unroll part.
Value *StartVal = (Part == 0) ? StartV : Iden;		Value *StartVal = (Part == 0) ? StartV : Iden;
cast<PHINode>(EntryPart)->addIncoming(StartVal, VectorPH);		cast<PHINode>(EntryPart)->addIncoming(StartVal, VectorPH);
▲ Show 20 Lines • Show All 85 Lines • Show Last 20 Lines

llvm/test/Transforms/LoopVectorize/AArch64/gather-do-not-vectorize-addressing.ll

	Show All 13 Lines
	; CHECK-NEXT: [[MIN_ITERS_CHECK:%.*]] = icmp ult i64 [[WIDE_TRIP_COUNT]], 2			; CHECK-NEXT: [[MIN_ITERS_CHECK:%.*]] = icmp ult i64 [[WIDE_TRIP_COUNT]], 2
	; CHECK-NEXT: br i1 [[MIN_ITERS_CHECK]], label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]			; CHECK-NEXT: br i1 [[MIN_ITERS_CHECK]], label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]
	; CHECK: vector.ph:			; CHECK: vector.ph:
	; CHECK-NEXT: [[N_MOD_VF:%.*]] = urem i64 [[WIDE_TRIP_COUNT]], 2			; CHECK-NEXT: [[N_MOD_VF:%.*]] = urem i64 [[WIDE_TRIP_COUNT]], 2
	; CHECK-NEXT: [[N_VEC:%.*]] = sub i64 [[WIDE_TRIP_COUNT]], [[N_MOD_VF]]			; CHECK-NEXT: [[N_VEC:%.*]] = sub i64 [[WIDE_TRIP_COUNT]], [[N_MOD_VF]]
	; CHECK-NEXT: br label [[VECTOR_BODY:%.*]]			; CHECK-NEXT: br label [[VECTOR_BODY:%.*]]
	; CHECK: vector.body:			; CHECK: vector.body:
	; CHECK-NEXT: [[INDEX:%.]] = phi i64 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[VECTOR_BODY]] ]			; CHECK-NEXT: [[INDEX:%.]] = phi i64 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[VECTOR_BODY]] ]
	; CHECK-NEXT: [[VEC_PHI:%.]] = phi <2 x double> [ <double 0.000000e+00, double -0.000000e+00>, [[VECTOR_PH]] ], [ [[TMP14:%.]], [[VECTOR_BODY]] ]			; CHECK-NEXT: [[VEC_PHI:%.]] = phi <2 x double> [ <double -0.000000e+00, double -0.000000e+00>, [[VECTOR_PH]] ], [ [[TMP14:%.]], [[VECTOR_BODY]] ]
	; CHECK-NEXT: [[TMP0:%.*]] = add i64 [[INDEX]], 0			; CHECK-NEXT: [[TMP0:%.*]] = add i64 [[INDEX]], 0
	; CHECK-NEXT: [[TMP1:%.*]] = add i64 [[INDEX]], 1			; CHECK-NEXT: [[TMP1:%.*]] = add i64 [[INDEX]], 1
	; CHECK-NEXT: [[TMP2:%.]] = getelementptr inbounds i32, ptr [[OFFSET:%.]], i64 [[TMP0]]			; CHECK-NEXT: [[TMP2:%.]] = getelementptr inbounds i32, ptr [[OFFSET:%.]], i64 [[TMP0]]
	; CHECK-NEXT: [[TMP3:%.*]] = getelementptr inbounds i32, ptr [[OFFSET]], i64 [[TMP1]]			; CHECK-NEXT: [[TMP3:%.*]] = getelementptr inbounds i32, ptr [[OFFSET]], i64 [[TMP1]]
	; CHECK-NEXT: [[TMP4:%.*]] = load i32, ptr [[TMP2]], align 4			; CHECK-NEXT: [[TMP4:%.*]] = load i32, ptr [[TMP2]], align 4
	; CHECK-NEXT: [[TMP5:%.*]] = load i32, ptr [[TMP3]], align 4			; CHECK-NEXT: [[TMP5:%.*]] = load i32, ptr [[TMP3]], align 4
	; CHECK-NEXT: [[TMP6:%.*]] = sext i32 [[TMP4]] to i64			; CHECK-NEXT: [[TMP6:%.*]] = sext i32 [[TMP4]] to i64
	; CHECK-NEXT: [[TMP7:%.*]] = sext i32 [[TMP5]] to i64			; CHECK-NEXT: [[TMP7:%.*]] = sext i32 [[TMP5]] to i64
	; CHECK-NEXT: [[TMP8:%.]] = getelementptr inbounds double, ptr [[DATA:%.]], i64 [[TMP6]]			; CHECK-NEXT: [[TMP8:%.]] = getelementptr inbounds double, ptr [[DATA:%.]], i64 [[TMP6]]
	; CHECK-NEXT: [[TMP9:%.*]] = getelementptr inbounds double, ptr [[DATA]], i64 [[TMP7]]			; CHECK-NEXT: [[TMP9:%.*]] = getelementptr inbounds double, ptr [[DATA]], i64 [[TMP7]]
	; CHECK-NEXT: [[TMP10:%.*]] = load double, ptr [[TMP8]], align 8			; CHECK-NEXT: [[TMP10:%.*]] = load double, ptr [[TMP8]], align 8
	; CHECK-NEXT: [[TMP11:%.*]] = load double, ptr [[TMP9]], align 8			; CHECK-NEXT: [[TMP11:%.*]] = load double, ptr [[TMP9]], align 8
	; CHECK-NEXT: [[TMP12:%.*]] = insertelement <2 x double> poison, double [[TMP10]], i32 0			; CHECK-NEXT: [[TMP12:%.*]] = insertelement <2 x double> poison, double [[TMP10]], i32 0
	; CHECK-NEXT: [[TMP13:%.*]] = insertelement <2 x double> [[TMP12]], double [[TMP11]], i32 1			; CHECK-NEXT: [[TMP13:%.*]] = insertelement <2 x double> [[TMP12]], double [[TMP11]], i32 1
	; CHECK-NEXT: [[TMP14]] = fadd <2 x double> [[VEC_PHI]], [[TMP13]]			; CHECK-NEXT: [[TMP14]] = fadd <2 x double> [[VEC_PHI]], [[TMP13]]
	; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 2			; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 2
	; CHECK-NEXT: [[TMP15:%.*]] = icmp eq i64 [[INDEX_NEXT]], [[N_VEC]]			; CHECK-NEXT: [[TMP15:%.*]] = icmp eq i64 [[INDEX_NEXT]], [[N_VEC]]
	; CHECK-NEXT: br i1 [[TMP15]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP0:![0-9]+]]			; CHECK-NEXT: br i1 [[TMP15]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP0:![0-9]+]]
				; CHECK: middle.block:
				; CHECK-NEXT: [[TMP16:%.*]] = call double @llvm.vector.reduce.fadd.v2f64(double -0.000000e+00, <2 x double> [[TMP14]])
				; CHECK-NEXT: [[RDX_START:%.*]] = fadd double 0.000000e+00, [[TMP16]]
				; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i64 [[WIDE_TRIP_COUNT]], [[N_VEC]]
				; CHECK-NEXT: br i1 [[CMP_N]], label [[FOR_COND_CLEANUP_LOOPEXIT:%.*]], label [[SCALAR_PH]]
				; CHECK: scalar.ph:
				; CHECK-NEXT: [[BC_RESUME_VAL:%.*]] = phi i64 [ [[N_VEC]], [[MIDDLE_BLOCK]] ], [ 0, [[FOR_BODY_PREHEADER]] ]
				; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi double [ 0.000000e+00, [[FOR_BODY_PREHEADER]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
				; CHECK-NEXT: br label [[FOR_BODY:%.*]]
				; CHECK: for.cond.cleanup.loopexit:
				; CHECK-NEXT: [[ADD_LCSSA:%.]] = phi double [ [[ADD:%.]], [[FOR_BODY]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
				; CHECK-NEXT: br label [[FOR_COND_CLEANUP]]
				; CHECK: for.cond.cleanup:
				; CHECK-NEXT: [[RES_0_LCSSA:%.]] = phi double [ 0.000000e+00, [[ENTRY:%.]] ], [ [[ADD_LCSSA]], [[FOR_COND_CLEANUP_LOOPEXIT]] ]
				; CHECK-NEXT: ret double [[RES_0_LCSSA]]
				; CHECK: for.body:
				; CHECK-NEXT: [[INDVARS_IV:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[INDVARS_IV_NEXT:%.]], [[FOR_BODY]] ]
				; CHECK-NEXT: [[RES_07:%.*]] = phi double [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[ADD]], [[FOR_BODY]] ]
				; CHECK-NEXT: [[ARRAYIDX:%.*]] = getelementptr inbounds i32, ptr [[OFFSET]], i64 [[INDVARS_IV]]
				; CHECK-NEXT: [[TMP17:%.*]] = load i32, ptr [[ARRAYIDX]], align 4
				; CHECK-NEXT: [[IDXPROM1:%.*]] = sext i32 [[TMP17]] to i64
				; CHECK-NEXT: [[ARRAYIDX2:%.*]] = getelementptr inbounds double, ptr [[DATA]], i64 [[IDXPROM1]]
				; CHECK-NEXT: [[TMP18:%.*]] = load double, ptr [[ARRAYIDX2]], align 8
				; CHECK-NEXT: [[ADD]] = fadd double [[RES_07]], [[TMP18]]
				; CHECK-NEXT: [[INDVARS_IV_NEXT]] = add nuw nsw i64 [[INDVARS_IV]], 1
				; CHECK-NEXT: [[EXITCOND_NOT:%.*]] = icmp eq i64 [[INDVARS_IV_NEXT]], [[WIDE_TRIP_COUNT]]
				; CHECK-NEXT: br i1 [[EXITCOND_NOT]], label [[FOR_COND_CLEANUP_LOOPEXIT]], label [[FOR_BODY]], !llvm.loop [[LOOP2:![0-9]+]]
	;			;
	; SVE-LABEL: @test(			; SVE-LABEL: @test(
	; SVE-NEXT: entry:			; SVE-NEXT: entry:
	; SVE-NEXT: [[CMP6:%.]] = icmp sgt i32 [[SIZE:%.]], 0			; SVE-NEXT: [[CMP6:%.]] = icmp sgt i32 [[SIZE:%.]], 0
	; SVE-NEXT: br i1 [[CMP6]], label [[FOR_BODY_PREHEADER:%.]], label [[FOR_COND_CLEANUP:%.]]			; SVE-NEXT: br i1 [[CMP6]], label [[FOR_BODY_PREHEADER:%.]], label [[FOR_COND_CLEANUP:%.]]
	; SVE: for.body.preheader:			; SVE: for.body.preheader:
	; SVE-NEXT: [[WIDE_TRIP_COUNT:%.*]] = zext i32 [[SIZE]] to i64			; SVE-NEXT: [[WIDE_TRIP_COUNT:%.*]] = zext i32 [[SIZE]] to i64
	; SVE-NEXT: [[TMP0:%.*]] = call i64 @llvm.vscale.i64()			; SVE-NEXT: [[TMP0:%.*]] = call i64 @llvm.vscale.i64()
	; SVE-NEXT: [[TMP1:%.*]] = mul i64 [[TMP0]], 2			; SVE-NEXT: [[TMP1:%.*]] = mul i64 [[TMP0]], 2
	; SVE-NEXT: [[MIN_ITERS_CHECK:%.*]] = icmp ult i64 [[WIDE_TRIP_COUNT]], [[TMP1]]			; SVE-NEXT: [[MIN_ITERS_CHECK:%.*]] = icmp ult i64 [[WIDE_TRIP_COUNT]], [[TMP1]]
	; SVE-NEXT: br i1 [[MIN_ITERS_CHECK]], label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]			; SVE-NEXT: br i1 [[MIN_ITERS_CHECK]], label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]
	; SVE: vector.ph:			; SVE: vector.ph:
	; SVE-NEXT: [[TMP2:%.*]] = call i64 @llvm.vscale.i64()			; SVE-NEXT: [[TMP2:%.*]] = call i64 @llvm.vscale.i64()
	; SVE-NEXT: [[TMP3:%.*]] = mul i64 [[TMP2]], 2			; SVE-NEXT: [[TMP3:%.*]] = mul i64 [[TMP2]], 2
	; SVE-NEXT: [[N_MOD_VF:%.*]] = urem i64 [[WIDE_TRIP_COUNT]], [[TMP3]]			; SVE-NEXT: [[N_MOD_VF:%.*]] = urem i64 [[WIDE_TRIP_COUNT]], [[TMP3]]
	; SVE-NEXT: [[N_VEC:%.*]] = sub i64 [[WIDE_TRIP_COUNT]], [[N_MOD_VF]]			; SVE-NEXT: [[N_VEC:%.*]] = sub i64 [[WIDE_TRIP_COUNT]], [[N_MOD_VF]]
	; SVE-NEXT: br label [[VECTOR_BODY:%.*]]			; SVE-NEXT: br label [[VECTOR_BODY:%.*]]
	; SVE: vector.body:			; SVE: vector.body:
	; SVE-NEXT: [[INDEX:%.]] = phi i64 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[VECTOR_BODY]] ]			; SVE-NEXT: [[INDEX:%.]] = phi i64 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[VECTOR_BODY]] ]
	; SVE-NEXT: [[VEC_PHI:%.]] = phi <vscale x 2 x double> [ insertelement (<vscale x 2 x double> shufflevector (<vscale x 2 x double> insertelement (<vscale x 2 x double> poison, double -0.000000e+00, i32 0), <vscale x 2 x double> poison, <vscale x 2 x i32> zeroinitializer), double 0.000000e+00, i32 0), [[VECTOR_PH]] ], [ [[TMP9:%.]], [[VECTOR_BODY]] ]			; SVE-NEXT: [[VEC_PHI:%.]] = phi <vscale x 2 x double> [ shufflevector (<vscale x 2 x double> insertelement (<vscale x 2 x double> poison, double -0.000000e+00, i32 0), <vscale x 2 x double> poison, <vscale x 2 x i32> zeroinitializer), [[VECTOR_PH]] ], [ [[TMP9:%.]], [[VECTOR_BODY]] ]
	; SVE-NEXT: [[TMP4:%.*]] = add i64 [[INDEX]], 0			; SVE-NEXT: [[TMP4:%.*]] = add i64 [[INDEX]], 0
	; SVE-NEXT: [[TMP5:%.]] = getelementptr inbounds i32, ptr [[OFFSET:%.]], i64 [[TMP4]]			; SVE-NEXT: [[TMP5:%.]] = getelementptr inbounds i32, ptr [[OFFSET:%.]], i64 [[TMP4]]
	; SVE-NEXT: [[TMP6:%.*]] = getelementptr inbounds i32, ptr [[TMP5]], i32 0			; SVE-NEXT: [[TMP6:%.*]] = getelementptr inbounds i32, ptr [[TMP5]], i32 0
	; SVE-NEXT: [[WIDE_LOAD:%.*]] = load <vscale x 2 x i32>, ptr [[TMP6]], align 4			; SVE-NEXT: [[WIDE_LOAD:%.*]] = load <vscale x 2 x i32>, ptr [[TMP6]], align 4
	; SVE-NEXT: [[TMP7:%.*]] = sext <vscale x 2 x i32> [[WIDE_LOAD]] to <vscale x 2 x i64>			; SVE-NEXT: [[TMP7:%.*]] = sext <vscale x 2 x i32> [[WIDE_LOAD]] to <vscale x 2 x i64>
	; SVE-NEXT: [[TMP8:%.]] = getelementptr inbounds double, ptr [[DATA:%.]], <vscale x 2 x i64> [[TMP7]]			; SVE-NEXT: [[TMP8:%.]] = getelementptr inbounds double, ptr [[DATA:%.]], <vscale x 2 x i64> [[TMP7]]
	; SVE-NEXT: [[WIDE_MASKED_GATHER:%.*]] = call <vscale x 2 x double> @llvm.masked.gather.nxv2f64.nxv2p0(<vscale x 2 x ptr> [[TMP8]], i32 8, <vscale x 2 x i1> shufflevector (<vscale x 2 x i1> insertelement (<vscale x 2 x i1> poison, i1 true, i32 0), <vscale x 2 x i1> poison, <vscale x 2 x i32> zeroinitializer), <vscale x 2 x double> poison)			; SVE-NEXT: [[WIDE_MASKED_GATHER:%.*]] = call <vscale x 2 x double> @llvm.masked.gather.nxv2f64.nxv2p0(<vscale x 2 x ptr> [[TMP8]], i32 8, <vscale x 2 x i1> shufflevector (<vscale x 2 x i1> insertelement (<vscale x 2 x i1> poison, i1 true, i32 0), <vscale x 2 x i1> poison, <vscale x 2 x i32> zeroinitializer), <vscale x 2 x double> poison)
	; SVE-NEXT: [[TMP9]] = fadd <vscale x 2 x double> [[VEC_PHI]], [[WIDE_MASKED_GATHER]]			; SVE-NEXT: [[TMP9]] = fadd <vscale x 2 x double> [[VEC_PHI]], [[WIDE_MASKED_GATHER]]
	; SVE-NEXT: [[TMP10:%.*]] = call i64 @llvm.vscale.i64()			; SVE-NEXT: [[TMP10:%.*]] = call i64 @llvm.vscale.i64()
	; SVE-NEXT: [[TMP11:%.*]] = mul i64 [[TMP10]], 2			; SVE-NEXT: [[TMP11:%.*]] = mul i64 [[TMP10]], 2
	; SVE-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], [[TMP11]]			; SVE-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], [[TMP11]]
	; SVE-NEXT: [[TMP12:%.*]] = icmp eq i64 [[INDEX_NEXT]], [[N_VEC]]			; SVE-NEXT: [[TMP12:%.*]] = icmp eq i64 [[INDEX_NEXT]], [[N_VEC]]
	; SVE-NEXT: br i1 [[TMP12]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP0:![0-9]+]]			; SVE-NEXT: br i1 [[TMP12]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP0:![0-9]+]]
				; SVE: middle.block:
				; SVE-NEXT: [[TMP13:%.*]] = call double @llvm.vector.reduce.fadd.nxv2f64(double -0.000000e+00, <vscale x 2 x double> [[TMP9]])
				; SVE-NEXT: [[RDX_START:%.*]] = fadd double 0.000000e+00, [[TMP13]]
				; SVE-NEXT: [[CMP_N:%.*]] = icmp eq i64 [[WIDE_TRIP_COUNT]], [[N_VEC]]
				; SVE-NEXT: br i1 [[CMP_N]], label [[FOR_COND_CLEANUP_LOOPEXIT:%.*]], label [[SCALAR_PH]]
				; SVE: scalar.ph:
				; SVE-NEXT: [[BC_RESUME_VAL:%.*]] = phi i64 [ [[N_VEC]], [[MIDDLE_BLOCK]] ], [ 0, [[FOR_BODY_PREHEADER]] ]
				; SVE-NEXT: [[BC_MERGE_RDX:%.*]] = phi double [ 0.000000e+00, [[FOR_BODY_PREHEADER]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
				; SVE-NEXT: br label [[FOR_BODY:%.*]]
				; SVE: for.cond.cleanup.loopexit:
				; SVE-NEXT: [[ADD_LCSSA:%.]] = phi double [ [[ADD:%.]], [[FOR_BODY]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
				; SVE-NEXT: br label [[FOR_COND_CLEANUP]]
				; SVE: for.cond.cleanup:
				; SVE-NEXT: [[RES_0_LCSSA:%.]] = phi double [ 0.000000e+00, [[ENTRY:%.]] ], [ [[ADD_LCSSA]], [[FOR_COND_CLEANUP_LOOPEXIT]] ]
				; SVE-NEXT: ret double [[RES_0_LCSSA]]
				; SVE: for.body:
				; SVE-NEXT: [[INDVARS_IV:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[INDVARS_IV_NEXT:%.]], [[FOR_BODY]] ]
				; SVE-NEXT: [[RES_07:%.*]] = phi double [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[ADD]], [[FOR_BODY]] ]
				; SVE-NEXT: [[ARRAYIDX:%.*]] = getelementptr inbounds i32, ptr [[OFFSET]], i64 [[INDVARS_IV]]
				; SVE-NEXT: [[TMP14:%.*]] = load i32, ptr [[ARRAYIDX]], align 4
				; SVE-NEXT: [[IDXPROM1:%.*]] = sext i32 [[TMP14]] to i64
				; SVE-NEXT: [[ARRAYIDX2:%.*]] = getelementptr inbounds double, ptr [[DATA]], i64 [[IDXPROM1]]
				; SVE-NEXT: [[TMP15:%.*]] = load double, ptr [[ARRAYIDX2]], align 8
				; SVE-NEXT: [[ADD]] = fadd double [[RES_07]], [[TMP15]]
				; SVE-NEXT: [[INDVARS_IV_NEXT]] = add nuw nsw i64 [[INDVARS_IV]], 1
				; SVE-NEXT: [[EXITCOND_NOT:%.*]] = icmp eq i64 [[INDVARS_IV_NEXT]], [[WIDE_TRIP_COUNT]]
				; SVE-NEXT: br i1 [[EXITCOND_NOT]], label [[FOR_COND_CLEANUP_LOOPEXIT]], label [[FOR_BODY]], !llvm.loop [[LOOP2:![0-9]+]]
	;			;
	entry:			entry:
	%cmp6 = icmp sgt i32 %size, 0			%cmp6 = icmp sgt i32 %size, 0
	br i1 %cmp6, label %for.body.preheader, label %for.cond.cleanup			br i1 %cmp6, label %for.body.preheader, label %for.cond.cleanup

	for.body.preheader: ; preds = %entry			for.body.preheader: ; preds = %entry
	%wide.trip.count = zext i32 %size to i64			%wide.trip.count = zext i32 %size to i64
	br label %for.body			br label %for.body
	Show All 22 Lines

llvm/test/Transforms/LoopVectorize/AArch64/sve-epilog-vect-reductions.ll

	Show All 16 Lines
	; CHECK: vector.ph:			; CHECK: vector.ph:
	; CHECK-NEXT: [[TMP2:%.*]] = call i64 @llvm.vscale.i64()			; CHECK-NEXT: [[TMP2:%.*]] = call i64 @llvm.vscale.i64()
	; CHECK-NEXT: [[TMP3:%.*]] = mul i64 [[TMP2]], 4			; CHECK-NEXT: [[TMP3:%.*]] = mul i64 [[TMP2]], 4
	; CHECK-NEXT: [[N_MOD_VF:%.*]] = urem i64 [[N]], [[TMP3]]			; CHECK-NEXT: [[N_MOD_VF:%.*]] = urem i64 [[N]], [[TMP3]]
	; CHECK-NEXT: [[N_VEC:%.*]] = sub i64 [[N]], [[N_MOD_VF]]			; CHECK-NEXT: [[N_VEC:%.*]] = sub i64 [[N]], [[N_MOD_VF]]
	; CHECK-NEXT: br label [[VECTOR_BODY:%.*]]			; CHECK-NEXT: br label [[VECTOR_BODY:%.*]]
	; CHECK: vector.body:			; CHECK: vector.body:
	; CHECK-NEXT: [[INDEX:%.]] = phi i64 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[VECTOR_BODY]] ]			; CHECK-NEXT: [[INDEX:%.]] = phi i64 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[VECTOR_BODY]] ]
	; CHECK-NEXT: [[VEC_PHI:%.]] = phi <vscale x 2 x i64> [ insertelement (<vscale x 2 x i64> zeroinitializer, i64 5, i32 0), [[VECTOR_PH]] ], [ [[TMP18:%.]], [[VECTOR_BODY]] ]			; CHECK-NEXT: [[VEC_PHI:%.]] = phi <vscale x 2 x i64> [ zeroinitializer, [[VECTOR_PH]] ], [ [[TMP18:%.]], [[VECTOR_BODY]] ]
	; CHECK-NEXT: [[VEC_PHI2:%.]] = phi <vscale x 2 x i64> [ zeroinitializer, [[VECTOR_PH]] ], [ [[TMP19:%.]], [[VECTOR_BODY]] ]			; CHECK-NEXT: [[VEC_PHI2:%.]] = phi <vscale x 2 x i64> [ zeroinitializer, [[VECTOR_PH]] ], [ [[TMP19:%.]], [[VECTOR_BODY]] ]
	; CHECK-NEXT: [[TMP4:%.*]] = add i64 [[INDEX]], 0			; CHECK-NEXT: [[TMP4:%.*]] = add i64 [[INDEX]], 0
	; CHECK-NEXT: [[TMP5:%.*]] = call i64 @llvm.vscale.i64()			; CHECK-NEXT: [[TMP5:%.*]] = call i64 @llvm.vscale.i64()
	; CHECK-NEXT: [[TMP6:%.*]] = mul i64 [[TMP5]], 2			; CHECK-NEXT: [[TMP6:%.*]] = mul i64 [[TMP5]], 2
	; CHECK-NEXT: [[TMP7:%.*]] = add i64 [[TMP6]], 0			; CHECK-NEXT: [[TMP7:%.*]] = add i64 [[TMP6]], 0
	; CHECK-NEXT: [[TMP8:%.*]] = mul i64 [[TMP7]], 1			; CHECK-NEXT: [[TMP8:%.*]] = mul i64 [[TMP7]], 1
	; CHECK-NEXT: [[TMP9:%.*]] = add i64 [[INDEX]], [[TMP8]]			; CHECK-NEXT: [[TMP9:%.*]] = add i64 [[INDEX]], [[TMP8]]
	; CHECK-NEXT: [[TMP10:%.]] = getelementptr inbounds i64, i64 [[A:%.*]], i64 [[TMP4]]			; CHECK-NEXT: [[TMP10:%.]] = getelementptr inbounds i64, i64 [[A:%.*]], i64 [[TMP4]]
	Show All 11 Lines
	; CHECK-NEXT: [[TMP20:%.*]] = call i64 @llvm.vscale.i64()			; CHECK-NEXT: [[TMP20:%.*]] = call i64 @llvm.vscale.i64()
	; CHECK-NEXT: [[TMP21:%.*]] = mul i64 [[TMP20]], 4			; CHECK-NEXT: [[TMP21:%.*]] = mul i64 [[TMP20]], 4
	; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], [[TMP21]]			; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], [[TMP21]]
	; CHECK-NEXT: [[TMP22:%.*]] = icmp eq i64 [[INDEX_NEXT]], [[N_VEC]]			; CHECK-NEXT: [[TMP22:%.*]] = icmp eq i64 [[INDEX_NEXT]], [[N_VEC]]
	; CHECK-NEXT: br i1 [[TMP22]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP0:![0-9]+]]			; CHECK-NEXT: br i1 [[TMP22]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP0:![0-9]+]]
	; CHECK: middle.block:			; CHECK: middle.block:
	; CHECK-NEXT: [[BIN_RDX:%.*]] = add <vscale x 2 x i64> [[TMP19]], [[TMP18]]			; CHECK-NEXT: [[BIN_RDX:%.*]] = add <vscale x 2 x i64> [[TMP19]], [[TMP18]]
	; CHECK-NEXT: [[TMP23:%.*]] = call i64 @llvm.vector.reduce.add.nxv2i64(<vscale x 2 x i64> [[BIN_RDX]])			; CHECK-NEXT: [[TMP23:%.*]] = call i64 @llvm.vector.reduce.add.nxv2i64(<vscale x 2 x i64> [[BIN_RDX]])
				; CHECK-NEXT: [[RDX_START:%.*]] = add i64 5, [[TMP23]]
	; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i64 [[N]], [[N_VEC]]			; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i64 [[N]], [[N_VEC]]
	; CHECK-NEXT: br i1 [[CMP_N]], label [[FOR_END:%.]], label [[VEC_EPILOG_ITER_CHECK:%.]]			; CHECK-NEXT: br i1 [[CMP_N]], label [[FOR_END:%.]], label [[VEC_EPILOG_ITER_CHECK:%.]]
	; CHECK: vec.epilog.iter.check:			; CHECK: vec.epilog.iter.check:
	; CHECK-NEXT: [[N_VEC_REMAINING:%.*]] = sub i64 [[N]], [[N_VEC]]			; CHECK-NEXT: [[N_VEC_REMAINING:%.*]] = sub i64 [[N]], [[N_VEC]]
	; CHECK-NEXT: [[MIN_EPILOG_ITERS_CHECK:%.*]] = icmp ult i64 [[N_VEC_REMAINING]], 2			; CHECK-NEXT: [[MIN_EPILOG_ITERS_CHECK:%.*]] = icmp ult i64 [[N_VEC_REMAINING]], 2
	; CHECK-NEXT: br i1 [[MIN_EPILOG_ITERS_CHECK]], label [[VEC_EPILOG_SCALAR_PH]], label [[VEC_EPILOG_PH]]			; CHECK-NEXT: br i1 [[MIN_EPILOG_ITERS_CHECK]], label [[VEC_EPILOG_SCALAR_PH]], label [[VEC_EPILOG_PH]]
	; CHECK: vec.epilog.ph:			; CHECK: vec.epilog.ph:
	; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i64 [ 5, [[VECTOR_MAIN_LOOP_ITER_CHECK]] ], [ [[TMP23]], [[VEC_EPILOG_ITER_CHECK]] ]			; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i64 [ 5, [[VECTOR_MAIN_LOOP_ITER_CHECK]] ], [ [[RDX_START]], [[VEC_EPILOG_ITER_CHECK]] ]
	; CHECK-NEXT: [[VEC_EPILOG_RESUME_VAL:%.*]] = phi i64 [ [[N_VEC]], [[VEC_EPILOG_ITER_CHECK]] ], [ 0, [[VECTOR_MAIN_LOOP_ITER_CHECK]] ]			; CHECK-NEXT: [[VEC_EPILOG_RESUME_VAL:%.*]] = phi i64 [ [[N_VEC]], [[VEC_EPILOG_ITER_CHECK]] ], [ 0, [[VECTOR_MAIN_LOOP_ITER_CHECK]] ]
	; CHECK-NEXT: [[N_MOD_VF4:%.*]] = urem i64 [[N]], 2			; CHECK-NEXT: [[N_MOD_VF4:%.*]] = urem i64 [[N]], 2
	; CHECK-NEXT: [[N_VEC5:%.*]] = sub i64 [[N]], [[N_MOD_VF4]]			; CHECK-NEXT: [[N_VEC5:%.*]] = sub i64 [[N]], [[N_MOD_VF4]]
	; CHECK-NEXT: [[TMP24:%.*]] = insertelement <2 x i64> zeroinitializer, i64 [[BC_MERGE_RDX]], i32 0
	; CHECK-NEXT: br label [[VEC_EPILOG_VECTOR_BODY:%.*]]			; CHECK-NEXT: br label [[VEC_EPILOG_VECTOR_BODY:%.*]]
	; CHECK: vec.epilog.vector.body:			; CHECK: vec.epilog.vector.body:
	; CHECK-NEXT: [[OFFSET_IDX:%.]] = phi i64 [ [[VEC_EPILOG_RESUME_VAL]], [[VEC_EPILOG_PH]] ], [ [[INDEX_NEXT10:%.]], [[VEC_EPILOG_VECTOR_BODY]] ]			; CHECK-NEXT: [[OFFSET_IDX:%.]] = phi i64 [ [[VEC_EPILOG_RESUME_VAL]], [[VEC_EPILOG_PH]] ], [ [[INDEX_NEXT10:%.]], [[VEC_EPILOG_VECTOR_BODY]] ]
	; CHECK-NEXT: [[VEC_PHI8:%.]] = phi <2 x i64> [ [[TMP24]], [[VEC_EPILOG_PH]] ], [ [[TMP29:%.]], [[VEC_EPILOG_VECTOR_BODY]] ]			; CHECK-NEXT: [[VEC_PHI8:%.]] = phi <2 x i64> [ zeroinitializer, [[VEC_EPILOG_PH]] ], [ [[TMP28:%.]], [[VEC_EPILOG_VECTOR_BODY]] ]
	; CHECK-NEXT: [[TMP25:%.*]] = add i64 [[OFFSET_IDX]], 0			; CHECK-NEXT: [[TMP24:%.*]] = add i64 [[OFFSET_IDX]], 0
	; CHECK-NEXT: [[TMP26:%.]] = getelementptr inbounds i64, i64 [[A]], i64 [[TMP25]]			; CHECK-NEXT: [[TMP25:%.]] = getelementptr inbounds i64, i64 [[A]], i64 [[TMP24]]
	; CHECK-NEXT: [[TMP27:%.]] = getelementptr inbounds i64, i64 [[TMP26]], i32 0			; CHECK-NEXT: [[TMP26:%.]] = getelementptr inbounds i64, i64 [[TMP25]], i32 0
	; CHECK-NEXT: [[TMP28:%.]] = bitcast i64 [[TMP27]] to <2 x i64>*			; CHECK-NEXT: [[TMP27:%.]] = bitcast i64 [[TMP26]] to <2 x i64>*
	; CHECK-NEXT: [[WIDE_LOAD9:%.]] = load <2 x i64>, <2 x i64> [[TMP28]], align 4			; CHECK-NEXT: [[WIDE_LOAD9:%.]] = load <2 x i64>, <2 x i64> [[TMP27]], align 4
	; CHECK-NEXT: [[TMP29]] = add <2 x i64> [[WIDE_LOAD9]], [[VEC_PHI8]]			; CHECK-NEXT: [[TMP28]] = add <2 x i64> [[WIDE_LOAD9]], [[VEC_PHI8]]
	; CHECK-NEXT: [[INDEX_NEXT10]] = add nuw i64 [[OFFSET_IDX]], 2			; CHECK-NEXT: [[INDEX_NEXT10]] = add nuw i64 [[OFFSET_IDX]], 2
	; CHECK-NEXT: [[TMP30:%.*]] = icmp eq i64 [[INDEX_NEXT10]], [[N_VEC5]]			; CHECK-NEXT: [[TMP29:%.*]] = icmp eq i64 [[INDEX_NEXT10]], [[N_VEC5]]
	; CHECK-NEXT: br i1 [[TMP30]], label [[VEC_EPILOG_MIDDLE_BLOCK:%.*]], label [[VEC_EPILOG_VECTOR_BODY]], !llvm.loop [[LOOP2:![0-9]+]]			; CHECK-NEXT: br i1 [[TMP29]], label [[VEC_EPILOG_MIDDLE_BLOCK:%.*]], label [[VEC_EPILOG_VECTOR_BODY]], !llvm.loop [[LOOP2:![0-9]+]]
	; CHECK: vec.epilog.middle.block:			; CHECK: vec.epilog.middle.block:
	; CHECK-NEXT: [[TMP31:%.*]] = call i64 @llvm.vector.reduce.add.v2i64(<2 x i64> [[TMP29]])			; CHECK-NEXT: [[TMP30:%.*]] = call i64 @llvm.vector.reduce.add.v2i64(<2 x i64> [[TMP28]])
				; CHECK-NEXT: [[RDX_START11:%.*]] = add i64 [[BC_MERGE_RDX]], [[TMP30]]
	; CHECK-NEXT: [[CMP_N6:%.*]] = icmp eq i64 [[N]], [[N_VEC5]]			; CHECK-NEXT: [[CMP_N6:%.*]] = icmp eq i64 [[N]], [[N_VEC5]]
	; CHECK-NEXT: br i1 [[CMP_N6]], label [[FOR_END]], label [[VEC_EPILOG_SCALAR_PH]]			; CHECK-NEXT: br i1 [[CMP_N6]], label [[FOR_END]], label [[VEC_EPILOG_SCALAR_PH]]
	; CHECK: vec.epilog.scalar.ph:			; CHECK: vec.epilog.scalar.ph:
	; CHECK-NEXT: [[BC_RESUME_VAL:%.]] = phi i64 [ [[N_VEC5]], [[VEC_EPILOG_MIDDLE_BLOCK]] ], [ [[N_VEC]], [[VEC_EPILOG_ITER_CHECK]] ], [ 0, [[ITER_CHECK:%.]] ]			; CHECK-NEXT: [[BC_RESUME_VAL:%.]] = phi i64 [ [[N_VEC5]], [[VEC_EPILOG_MIDDLE_BLOCK]] ], [ [[N_VEC]], [[VEC_EPILOG_ITER_CHECK]] ], [ 0, [[ITER_CHECK:%.]] ]
	; CHECK-NEXT: [[BC_MERGE_RDX11:%.*]] = phi i64 [ 5, [[ITER_CHECK]] ], [ [[TMP23]], [[VEC_EPILOG_ITER_CHECK]] ], [ [[TMP31]], [[VEC_EPILOG_MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[BC_MERGE_RDX12:%.*]] = phi i64 [ 5, [[ITER_CHECK]] ], [ [[RDX_START]], [[VEC_EPILOG_ITER_CHECK]] ], [ [[RDX_START11]], [[VEC_EPILOG_MIDDLE_BLOCK]] ]
	; CHECK-NEXT: br label [[FOR_BODY:%.*]]			; CHECK-NEXT: br label [[FOR_BODY:%.*]]
	; CHECK: for.body:			; CHECK: for.body:
	; CHECK-NEXT: [[IV:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[VEC_EPILOG_SCALAR_PH]] ], [ [[IV_NEXT:%.]], [[FOR_BODY]] ]			; CHECK-NEXT: [[IV:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[VEC_EPILOG_SCALAR_PH]] ], [ [[IV_NEXT:%.]], [[FOR_BODY]] ]
	; CHECK-NEXT: [[SUM:%.]] = phi i64 [ [[BC_MERGE_RDX11]], [[VEC_EPILOG_SCALAR_PH]] ], [ [[ADD:%.]], [[FOR_BODY]] ]			; CHECK-NEXT: [[SUM:%.]] = phi i64 [ [[BC_MERGE_RDX12]], [[VEC_EPILOG_SCALAR_PH]] ], [ [[ADD:%.]], [[FOR_BODY]] ]
	; CHECK-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds i64, i64 [[A]], i64 [[IV]]			; CHECK-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds i64, i64 [[A]], i64 [[IV]]
	; CHECK-NEXT: [[TMP32:%.]] = load i64, i64 [[ARRAYIDX]], align 4			; CHECK-NEXT: [[TMP31:%.]] = load i64, i64 [[ARRAYIDX]], align 4
	; CHECK-NEXT: [[ADD]] = add i64 [[TMP32]], [[SUM]]			; CHECK-NEXT: [[ADD]] = add i64 [[TMP31]], [[SUM]]
	; CHECK-NEXT: [[IV_NEXT]] = add nuw nsw i64 [[IV]], 1			; CHECK-NEXT: [[IV_NEXT]] = add nuw nsw i64 [[IV]], 1
	; CHECK-NEXT: [[EXITCOND_NOT:%.*]] = icmp eq i64 [[IV_NEXT]], [[N]]			; CHECK-NEXT: [[EXITCOND_NOT:%.*]] = icmp eq i64 [[IV_NEXT]], [[N]]
	; CHECK-NEXT: br i1 [[EXITCOND_NOT]], label [[FOR_END]], label [[FOR_BODY]], !llvm.loop [[LOOP4:![0-9]+]]			; CHECK-NEXT: br i1 [[EXITCOND_NOT]], label [[FOR_END]], label [[FOR_BODY]], !llvm.loop [[LOOP4:![0-9]+]]
	; CHECK: for.end:			; CHECK: for.end:
	; CHECK-NEXT: [[ADD_LCSSA:%.*]] = phi i64 [ [[ADD]], [[FOR_BODY]] ], [ [[TMP23]], [[MIDDLE_BLOCK]] ], [ [[TMP31]], [[VEC_EPILOG_MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[ADD_LCSSA:%.*]] = phi i64 [ [[ADD]], [[FOR_BODY]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ], [ [[RDX_START11]], [[VEC_EPILOG_MIDDLE_BLOCK]] ]
	; CHECK-NEXT: ret i64 [[ADD_LCSSA]]			; CHECK-NEXT: ret i64 [[ADD_LCSSA]]
	;			;
	entry:			entry:
	br label %for.body			br label %for.body

	for.body:			for.body:
	%iv = phi i64 [ 0, %entry ], [ %iv.next, %for.body ]			%iv = phi i64 [ 0, %entry ], [ %iv.next, %for.body ]
	%sum = phi i64 [ 5, %entry ], [ %add, %for.body ]			%sum = phi i64 [ 5, %entry ], [ %add, %for.body ]
	Show All 14 Lines

llvm/test/Transforms/LoopVectorize/AMDGPU/packed-math.ll

	Show All 21 Lines
	; GFX9-NEXT: [[TMP4]] = fadd fast <2 x half> [[VEC_PHI]], [[WIDE_LOAD]]			; GFX9-NEXT: [[TMP4]] = fadd fast <2 x half> [[VEC_PHI]], [[WIDE_LOAD]]
	; GFX9-NEXT: [[TMP5]] = fadd fast <2 x half> [[VEC_PHI1]], [[WIDE_LOAD2]]			; GFX9-NEXT: [[TMP5]] = fadd fast <2 x half> [[VEC_PHI1]], [[WIDE_LOAD2]]
	; GFX9-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 4			; GFX9-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 4
	; GFX9-NEXT: [[TMP6:%.*]] = icmp eq i64 [[INDEX_NEXT]], 256			; GFX9-NEXT: [[TMP6:%.*]] = icmp eq i64 [[INDEX_NEXT]], 256
	; GFX9-NEXT: br i1 [[TMP6]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP0:![0-9]+]]			; GFX9-NEXT: br i1 [[TMP6]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP0:![0-9]+]]
	; GFX9: middle.block:			; GFX9: middle.block:
	; GFX9-NEXT: [[BIN_RDX:%.*]] = fadd fast <2 x half> [[TMP5]], [[TMP4]]			; GFX9-NEXT: [[BIN_RDX:%.*]] = fadd fast <2 x half> [[TMP5]], [[TMP4]]
	; GFX9-NEXT: [[TMP7:%.*]] = call fast half @llvm.vector.reduce.fadd.v2f16(half 0xH8000, <2 x half> [[BIN_RDX]])			; GFX9-NEXT: [[TMP7:%.*]] = call fast half @llvm.vector.reduce.fadd.v2f16(half 0xH8000, <2 x half> [[BIN_RDX]])
				; GFX9-NEXT: [[RDX_START:%.*]] = fadd half [[TMP7]], 0xH0000
	; GFX9-NEXT: br i1 true, label [[FOR_END:%.*]], label [[SCALAR_PH]]			; GFX9-NEXT: br i1 true, label [[FOR_END:%.*]], label [[SCALAR_PH]]
	; GFX9: scalar.ph:			; GFX9: scalar.ph:
	; GFX9-NEXT: br label [[FOR_BODY:%.*]]			; GFX9-NEXT: br label [[FOR_BODY:%.*]]
	; GFX9: for.body:			; GFX9: for.body:
	; GFX9-NEXT: br i1 poison, label [[FOR_END]], label [[FOR_BODY]], !llvm.loop [[LOOP2:![0-9]+]]			; GFX9-NEXT: br i1 poison, label [[FOR_END]], label [[FOR_BODY]], !llvm.loop [[LOOP2:![0-9]+]]
	; GFX9: for.end:			; GFX9: for.end:
	; GFX9-NEXT: [[ADD_LCSSA:%.*]] = phi half [ poison, [[FOR_BODY]] ], [ [[TMP7]], [[MIDDLE_BLOCK]] ]			; GFX9-NEXT: [[ADD_LCSSA:%.*]] = phi half [ poison, [[FOR_BODY]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; GFX9-NEXT: ret half [[ADD_LCSSA]]			; GFX9-NEXT: ret half [[ADD_LCSSA]]
	;			;
	; VI-LABEL: @vectorize_v2f16_loop(			; VI-LABEL: @vectorize_v2f16_loop(
	; VI-NEXT: entry:			; VI-NEXT: entry:
	; VI-NEXT: br i1 false, label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]			; VI-NEXT: br i1 false, label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]
	; VI: vector.ph:			; VI: vector.ph:
	; VI-NEXT: br label [[VECTOR_BODY:%.*]]			; VI-NEXT: br label [[VECTOR_BODY:%.*]]
	; VI: vector.body:			; VI: vector.body:
	Show All 9 Lines
	; VI-NEXT: [[TMP4]] = fadd fast <2 x half> [[VEC_PHI]], [[WIDE_LOAD]]			; VI-NEXT: [[TMP4]] = fadd fast <2 x half> [[VEC_PHI]], [[WIDE_LOAD]]
	; VI-NEXT: [[TMP5]] = fadd fast <2 x half> [[VEC_PHI1]], [[WIDE_LOAD2]]			; VI-NEXT: [[TMP5]] = fadd fast <2 x half> [[VEC_PHI1]], [[WIDE_LOAD2]]
	; VI-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 4			; VI-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 4
	; VI-NEXT: [[TMP6:%.*]] = icmp eq i64 [[INDEX_NEXT]], 256			; VI-NEXT: [[TMP6:%.*]] = icmp eq i64 [[INDEX_NEXT]], 256
	; VI-NEXT: br i1 [[TMP6]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP0:![0-9]+]]			; VI-NEXT: br i1 [[TMP6]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP0:![0-9]+]]
	; VI: middle.block:			; VI: middle.block:
	; VI-NEXT: [[BIN_RDX:%.*]] = fadd fast <2 x half> [[TMP5]], [[TMP4]]			; VI-NEXT: [[BIN_RDX:%.*]] = fadd fast <2 x half> [[TMP5]], [[TMP4]]
	; VI-NEXT: [[TMP7:%.*]] = call fast half @llvm.vector.reduce.fadd.v2f16(half 0xH8000, <2 x half> [[BIN_RDX]])			; VI-NEXT: [[TMP7:%.*]] = call fast half @llvm.vector.reduce.fadd.v2f16(half 0xH8000, <2 x half> [[BIN_RDX]])
				; VI-NEXT: [[RDX_START:%.*]] = fadd half [[TMP7]], 0xH0000
	; VI-NEXT: br i1 true, label [[FOR_END:%.*]], label [[SCALAR_PH]]			; VI-NEXT: br i1 true, label [[FOR_END:%.*]], label [[SCALAR_PH]]
	; VI: scalar.ph:			; VI: scalar.ph:
	; VI-NEXT: br label [[FOR_BODY:%.*]]			; VI-NEXT: br label [[FOR_BODY:%.*]]
	; VI: for.body:			; VI: for.body:
	; VI-NEXT: br i1 poison, label [[FOR_END]], label [[FOR_BODY]], !llvm.loop [[LOOP2:![0-9]+]]			; VI-NEXT: br i1 poison, label [[FOR_END]], label [[FOR_BODY]], !llvm.loop [[LOOP2:![0-9]+]]
	; VI: for.end:			; VI: for.end:
	; VI-NEXT: [[ADD_LCSSA:%.*]] = phi half [ poison, [[FOR_BODY]] ], [ [[TMP7]], [[MIDDLE_BLOCK]] ]			; VI-NEXT: [[ADD_LCSSA:%.*]] = phi half [ poison, [[FOR_BODY]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; VI-NEXT: ret half [[ADD_LCSSA]]			; VI-NEXT: ret half [[ADD_LCSSA]]
	;			;
	; CI-LABEL: @vectorize_v2f16_loop(			; CI-LABEL: @vectorize_v2f16_loop(
	; CI-NEXT: entry:			; CI-NEXT: entry:
	; CI-NEXT: br label [[FOR_BODY:%.*]]			; CI-NEXT: br label [[FOR_BODY:%.*]]
	; CI: for.body:			; CI: for.body:
	; CI-NEXT: [[INDVARS_IV:%.]] = phi i64 [ 0, [[ENTRY:%.]] ], [ [[INDVARS_IV_NEXT:%.*]], [[FOR_BODY]] ]			; CI-NEXT: [[INDVARS_IV:%.]] = phi i64 [ 0, [[ENTRY:%.]] ], [ [[INDVARS_IV_NEXT:%.*]], [[FOR_BODY]] ]
	; CI-NEXT: [[Q_04:%.]] = phi half [ 0xH0000, [[ENTRY]] ], [ [[ADD:%.]], [[FOR_BODY]] ]			; CI-NEXT: [[Q_04:%.]] = phi half [ 0xH0000, [[ENTRY]] ], [ [[ADD:%.]], [[FOR_BODY]] ]
	Show All 26 Lines

llvm/test/Transforms/LoopVectorize/ARM/mve-reduction-predselect.ll

	Show First 20 Lines • Show All 344 Lines • ▼ Show 20 Lines
	; CHECK-NEXT: [[TMP4:%.*]] = fadd fast <4 x float> [[VEC_PHI]], [[WIDE_MASKED_LOAD]]			; CHECK-NEXT: [[TMP4:%.*]] = fadd fast <4 x float> [[VEC_PHI]], [[WIDE_MASKED_LOAD]]
	; CHECK-NEXT: [[TMP5:%.*]] = fadd fast <4 x float> [[TMP4]], [[WIDE_MASKED_LOAD1]]			; CHECK-NEXT: [[TMP5:%.*]] = fadd fast <4 x float> [[TMP4]], [[WIDE_MASKED_LOAD1]]
	; CHECK-NEXT: [[TMP6]] = select fast <4 x i1> [[ACTIVE_LANE_MASK]], <4 x float> [[TMP5]], <4 x float> [[VEC_PHI]]			; CHECK-NEXT: [[TMP6]] = select fast <4 x i1> [[ACTIVE_LANE_MASK]], <4 x float> [[TMP5]], <4 x float> [[VEC_PHI]]
	; CHECK-NEXT: [[INDEX_NEXT]] = add i32 [[INDEX]], 4			; CHECK-NEXT: [[INDEX_NEXT]] = add i32 [[INDEX]], 4
	; CHECK-NEXT: [[TMP7:%.*]] = icmp eq i32 [[INDEX_NEXT]], 260			; CHECK-NEXT: [[TMP7:%.*]] = icmp eq i32 [[INDEX_NEXT]], 260
	; CHECK-NEXT: br i1 [[TMP7]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP14:![0-9]+]]			; CHECK-NEXT: br i1 [[TMP7]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP14:![0-9]+]]
	; CHECK: middle.block:			; CHECK: middle.block:
	; CHECK-NEXT: [[TMP8:%.*]] = call fast float @llvm.vector.reduce.fadd.v4f32(float -0.000000e+00, <4 x float> [[TMP6]])			; CHECK-NEXT: [[TMP8:%.*]] = call fast float @llvm.vector.reduce.fadd.v4f32(float -0.000000e+00, <4 x float> [[TMP6]])
				; CHECK-NEXT: [[RDX_START:%.*]] = fadd float [[TMP8]], 0.000000e+00
	; CHECK-NEXT: br i1 true, label [[FOR_END:%.*]], label [[SCALAR_PH]]			; CHECK-NEXT: br i1 true, label [[FOR_END:%.*]], label [[SCALAR_PH]]
	; CHECK: scalar.ph:			; CHECK: scalar.ph:
	; CHECK-NEXT: br label [[FOR_BODY:%.*]]			; CHECK-NEXT: br label [[FOR_BODY:%.*]]
	; CHECK: for.body:			; CHECK: for.body:
	; CHECK-NEXT: br i1 poison, label [[FOR_END]], label [[FOR_BODY]], !llvm.loop [[LOOP15:![0-9]+]]			; CHECK-NEXT: br i1 poison, label [[FOR_END]], label [[FOR_BODY]], !llvm.loop [[LOOP15:![0-9]+]]
	; CHECK: for.end:			; CHECK: for.end:
	; CHECK-NEXT: [[RESULT_0_LCSSA:%.*]] = phi float [ poison, [[FOR_BODY]] ], [ [[TMP8]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[RESULT_0_LCSSA:%.*]] = phi float [ poison, [[FOR_BODY]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: ret float [[RESULT_0_LCSSA]]			; CHECK-NEXT: ret float [[RESULT_0_LCSSA]]
	;			;
	entry:			entry:
	br label %for.body			br label %for.body

	for.body: ; preds = %entry, %for.body			for.body: ; preds = %entry, %for.body
	%indvars.iv = phi i32 [ %indvars.iv.next, %for.body ], [ 0, %entry ]			%indvars.iv = phi i32 [ %indvars.iv.next, %for.body ], [ 0, %entry ]
	%result.08 = phi float [ %fadd, %for.body ], [ 0.0, %entry ]			%result.08 = phi float [ %fadd, %for.body ], [ 0.0, %entry ]
	Show All 15 Lines
	define float @reduction_fmul(float* nocapture %A, float* nocapture %B) {			define float @reduction_fmul(float* nocapture %A, float* nocapture %B) {
	; CHECK-LABEL: @reduction_fmul(			; CHECK-LABEL: @reduction_fmul(
	; CHECK-NEXT: entry:			; CHECK-NEXT: entry:
	; CHECK-NEXT: br i1 false, label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]			; CHECK-NEXT: br i1 false, label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]
	; CHECK: vector.ph:			; CHECK: vector.ph:
	; CHECK-NEXT: br label [[VECTOR_BODY:%.*]]			; CHECK-NEXT: br label [[VECTOR_BODY:%.*]]
	; CHECK: vector.body:			; CHECK: vector.body:
	; CHECK-NEXT: [[INDEX:%.]] = phi i32 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[VECTOR_BODY]] ]			; CHECK-NEXT: [[INDEX:%.]] = phi i32 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[VECTOR_BODY]] ]
	; CHECK-NEXT: [[VEC_PHI:%.]] = phi <4 x float> [ <float 0.000000e+00, float 1.000000e+00, float 1.000000e+00, float 1.000000e+00>, [[VECTOR_PH]] ], [ [[TMP6:%.]], [[VECTOR_BODY]] ]			; CHECK-NEXT: [[VEC_PHI:%.]] = phi <4 x float> [ <float 1.000000e+00, float 1.000000e+00, float 1.000000e+00, float 1.000000e+00>, [[VECTOR_PH]] ], [ [[TMP6:%.]], [[VECTOR_BODY]] ]
	; CHECK-NEXT: [[ACTIVE_LANE_MASK:%.*]] = call <4 x i1> @llvm.get.active.lane.mask.v4i1.i32(i32 [[INDEX]], i32 257)			; CHECK-NEXT: [[ACTIVE_LANE_MASK:%.*]] = call <4 x i1> @llvm.get.active.lane.mask.v4i1.i32(i32 [[INDEX]], i32 257)
	; CHECK-NEXT: [[TMP0:%.]] = getelementptr inbounds float, float [[A:%.*]], i32 [[INDEX]]			; CHECK-NEXT: [[TMP0:%.]] = getelementptr inbounds float, float [[A:%.*]], i32 [[INDEX]]
	; CHECK-NEXT: [[TMP1:%.]] = bitcast float [[TMP0]] to <4 x float>*			; CHECK-NEXT: [[TMP1:%.]] = bitcast float [[TMP0]] to <4 x float>*
	; CHECK-NEXT: [[WIDE_MASKED_LOAD:%.]] = call <4 x float> @llvm.masked.load.v4f32.p0v4f32(<4 x float> [[TMP1]], i32 4, <4 x i1> [[ACTIVE_LANE_MASK]], <4 x float> poison)			; CHECK-NEXT: [[WIDE_MASKED_LOAD:%.]] = call <4 x float> @llvm.masked.load.v4f32.p0v4f32(<4 x float> [[TMP1]], i32 4, <4 x i1> [[ACTIVE_LANE_MASK]], <4 x float> poison)
	; CHECK-NEXT: [[TMP2:%.]] = getelementptr inbounds float, float [[B:%.*]], i32 [[INDEX]]			; CHECK-NEXT: [[TMP2:%.]] = getelementptr inbounds float, float [[B:%.*]], i32 [[INDEX]]
	; CHECK-NEXT: [[TMP3:%.]] = bitcast float [[TMP2]] to <4 x float>*			; CHECK-NEXT: [[TMP3:%.]] = bitcast float [[TMP2]] to <4 x float>*
	; CHECK-NEXT: [[WIDE_MASKED_LOAD1:%.]] = call <4 x float> @llvm.masked.load.v4f32.p0v4f32(<4 x float> [[TMP3]], i32 4, <4 x i1> [[ACTIVE_LANE_MASK]], <4 x float> poison)			; CHECK-NEXT: [[WIDE_MASKED_LOAD1:%.]] = call <4 x float> @llvm.masked.load.v4f32.p0v4f32(<4 x float> [[TMP3]], i32 4, <4 x i1> [[ACTIVE_LANE_MASK]], <4 x float> poison)
	; CHECK-NEXT: [[TMP4:%.*]] = fmul fast <4 x float> [[VEC_PHI]], [[WIDE_MASKED_LOAD]]			; CHECK-NEXT: [[TMP4:%.*]] = fmul fast <4 x float> [[VEC_PHI]], [[WIDE_MASKED_LOAD]]
	; CHECK-NEXT: [[TMP5:%.*]] = fmul fast <4 x float> [[TMP4]], [[WIDE_MASKED_LOAD1]]			; CHECK-NEXT: [[TMP5:%.*]] = fmul fast <4 x float> [[TMP4]], [[WIDE_MASKED_LOAD1]]
	; CHECK-NEXT: [[TMP6]] = select fast <4 x i1> [[ACTIVE_LANE_MASK]], <4 x float> [[TMP5]], <4 x float> [[VEC_PHI]]			; CHECK-NEXT: [[TMP6]] = select fast <4 x i1> [[ACTIVE_LANE_MASK]], <4 x float> [[TMP5]], <4 x float> [[VEC_PHI]]
	; CHECK-NEXT: [[INDEX_NEXT]] = add i32 [[INDEX]], 4			; CHECK-NEXT: [[INDEX_NEXT]] = add i32 [[INDEX]], 4
	; CHECK-NEXT: [[TMP7:%.*]] = icmp eq i32 [[INDEX_NEXT]], 260			; CHECK-NEXT: [[TMP7:%.*]] = icmp eq i32 [[INDEX_NEXT]], 260
	; CHECK-NEXT: br i1 [[TMP7]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP16:![0-9]+]]			; CHECK-NEXT: br i1 [[TMP7]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP16:![0-9]+]]
	; CHECK: middle.block:			; CHECK: middle.block:
	; CHECK-NEXT: [[TMP8:%.*]] = call fast float @llvm.vector.reduce.fmul.v4f32(float 1.000000e+00, <4 x float> [[TMP6]])			; CHECK-NEXT: [[TMP8:%.*]] = call fast float @llvm.vector.reduce.fmul.v4f32(float 1.000000e+00, <4 x float> [[TMP6]])
				; CHECK-NEXT: [[RDX_START:%.*]] = fmul float [[TMP8]], 0.000000e+00
	; CHECK-NEXT: br i1 true, label [[FOR_END:%.*]], label [[SCALAR_PH]]			; CHECK-NEXT: br i1 true, label [[FOR_END:%.*]], label [[SCALAR_PH]]
	; CHECK: scalar.ph:			; CHECK: scalar.ph:
	; CHECK-NEXT: br label [[FOR_BODY:%.*]]			; CHECK-NEXT: br label [[FOR_BODY:%.*]]
	; CHECK: for.body:			; CHECK: for.body:
	; CHECK-NEXT: br i1 poison, label [[FOR_END]], label [[FOR_BODY]], !llvm.loop [[LOOP17:![0-9]+]]			; CHECK-NEXT: br i1 poison, label [[FOR_END]], label [[FOR_BODY]], !llvm.loop [[LOOP17:![0-9]+]]
	; CHECK: for.end:			; CHECK: for.end:
	; CHECK-NEXT: [[RESULT_0_LCSSA:%.*]] = phi float [ poison, [[FOR_BODY]] ], [ [[TMP8]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[RESULT_0_LCSSA:%.*]] = phi float [ poison, [[FOR_BODY]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: ret float [[RESULT_0_LCSSA]]			; CHECK-NEXT: ret float [[RESULT_0_LCSSA]]
	;			;
	entry:			entry:
	br label %for.body			br label %for.body

	for.body: ; preds = %entry, %for.body			for.body: ; preds = %entry, %for.body
	%indvars.iv = phi i32 [ %indvars.iv.next, %for.body ], [ 0, %entry ]			%indvars.iv = phi i32 [ %indvars.iv.next, %for.body ], [ 0, %entry ]
	%result.08 = phi float [ %fmul, %for.body ], [ 0.0, %entry ]			%result.08 = phi float [ %fmul, %for.body ], [ 0.0, %entry ]
	▲ Show 20 Lines • Show All 160 Lines • Show Last 20 Lines

llvm/test/Transforms/LoopVectorize/ARM/mve-reduction-types.ll

	Show First 20 Lines • Show All 264 Lines • ▼ Show 20 Lines
	; CHECK-NEXT: [[WIDE_MASKED_LOAD:%.]] = call <4 x i32> @llvm.masked.load.v4i32.p0v4i32(<4 x i32> [[TMP3]], i32 4, <4 x i1> [[ACTIVE_LANE_MASK]], <4 x i32> poison)			; CHECK-NEXT: [[WIDE_MASKED_LOAD:%.]] = call <4 x i32> @llvm.masked.load.v4i32.p0v4i32(<4 x i32> [[TMP3]], i32 4, <4 x i1> [[ACTIVE_LANE_MASK]], <4 x i32> poison)
	; CHECK-NEXT: [[TMP4:%.*]] = mul <4 x i32> [[WIDE_MASKED_LOAD]], [[VEC_PHI]]			; CHECK-NEXT: [[TMP4:%.*]] = mul <4 x i32> [[WIDE_MASKED_LOAD]], [[VEC_PHI]]
	; CHECK-NEXT: [[TMP5]] = select <4 x i1> [[ACTIVE_LANE_MASK]], <4 x i32> [[TMP4]], <4 x i32> [[VEC_PHI]]			; CHECK-NEXT: [[TMP5]] = select <4 x i1> [[ACTIVE_LANE_MASK]], <4 x i32> [[TMP4]], <4 x i32> [[VEC_PHI]]
	; CHECK-NEXT: [[INDEX_NEXT]] = add i32 [[INDEX]], 4			; CHECK-NEXT: [[INDEX_NEXT]] = add i32 [[INDEX]], 4
	; CHECK-NEXT: [[TMP6:%.*]] = icmp eq i32 [[INDEX_NEXT]], [[N_VEC]]			; CHECK-NEXT: [[TMP6:%.*]] = icmp eq i32 [[INDEX_NEXT]], [[N_VEC]]
	; CHECK-NEXT: br i1 [[TMP6]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP8:![0-9]+]]			; CHECK-NEXT: br i1 [[TMP6]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP8:![0-9]+]]
	; CHECK: middle.block:			; CHECK: middle.block:
	; CHECK-NEXT: [[TMP7:%.*]] = call i32 @llvm.vector.reduce.mul.v4i32(<4 x i32> [[TMP5]])			; CHECK-NEXT: [[TMP7:%.*]] = call i32 @llvm.vector.reduce.mul.v4i32(<4 x i32> [[TMP5]])
				; CHECK-NEXT: [[RDX_START:%.*]] = mul i32 1, [[TMP7]]
	; CHECK-NEXT: br i1 true, label [[FOR_COND_CLEANUP_LOOPEXIT:%.*]], label [[SCALAR_PH]]			; CHECK-NEXT: br i1 true, label [[FOR_COND_CLEANUP_LOOPEXIT:%.*]], label [[SCALAR_PH]]
	; CHECK: scalar.ph:			; CHECK: scalar.ph:
	; CHECK-NEXT: [[BC_RESUME_VAL:%.*]] = phi i32 [ [[N_VEC]], [[MIDDLE_BLOCK]] ], [ 0, [[FOR_BODY_PREHEADER]] ]			; CHECK-NEXT: [[BC_RESUME_VAL:%.*]] = phi i32 [ [[N_VEC]], [[MIDDLE_BLOCK]] ], [ 0, [[FOR_BODY_PREHEADER]] ]
	; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 1, [[FOR_BODY_PREHEADER]] ], [ [[TMP7]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 1, [[FOR_BODY_PREHEADER]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: br label [[FOR_BODY:%.*]]			; CHECK-NEXT: br label [[FOR_BODY:%.*]]
	; CHECK: for.body:			; CHECK: for.body:
	; CHECK-NEXT: [[I_08:%.]] = phi i32 [ [[INC:%.]], [[FOR_BODY]] ], [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ]			; CHECK-NEXT: [[I_08:%.]] = phi i32 [ [[INC:%.]], [[FOR_BODY]] ], [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ]
	; CHECK-NEXT: [[R_07:%.]] = phi i32 [ [[ADD:%.]], [[FOR_BODY]] ], [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ]			; CHECK-NEXT: [[R_07:%.]] = phi i32 [ [[ADD:%.]], [[FOR_BODY]] ], [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ]
	; CHECK-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds i32, i32 [[X]], i32 [[I_08]]			; CHECK-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds i32, i32 [[X]], i32 [[I_08]]
	; CHECK-NEXT: [[TMP8:%.]] = load i32, i32 [[ARRAYIDX]], align 4			; CHECK-NEXT: [[TMP8:%.]] = load i32, i32 [[ARRAYIDX]], align 4
	; CHECK-NEXT: [[ADD]] = mul nsw i32 [[TMP8]], [[R_07]]			; CHECK-NEXT: [[ADD]] = mul nsw i32 [[TMP8]], [[R_07]]
	; CHECK-NEXT: [[INC]] = add nuw nsw i32 [[I_08]], 1			; CHECK-NEXT: [[INC]] = add nuw nsw i32 [[I_08]], 1
	; CHECK-NEXT: [[EXITCOND:%.*]] = icmp eq i32 [[INC]], [[N]]			; CHECK-NEXT: [[EXITCOND:%.*]] = icmp eq i32 [[INC]], [[N]]
	; CHECK-NEXT: br i1 [[EXITCOND]], label [[FOR_COND_CLEANUP_LOOPEXIT]], label [[FOR_BODY]], !llvm.loop [[LOOP9:![0-9]+]]			; CHECK-NEXT: br i1 [[EXITCOND]], label [[FOR_COND_CLEANUP_LOOPEXIT]], label [[FOR_BODY]], !llvm.loop [[LOOP9:![0-9]+]]
	; CHECK: for.cond.cleanup.loopexit:			; CHECK: for.cond.cleanup.loopexit:
	; CHECK-NEXT: [[ADD_LCSSA:%.*]] = phi i32 [ [[ADD]], [[FOR_BODY]] ], [ [[TMP7]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[ADD_LCSSA:%.*]] = phi i32 [ [[ADD]], [[FOR_BODY]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: br label [[FOR_COND_CLEANUP]]			; CHECK-NEXT: br label [[FOR_COND_CLEANUP]]
	; CHECK: for.cond.cleanup:			; CHECK: for.cond.cleanup:
	; CHECK-NEXT: [[R_0_LCSSA:%.]] = phi i32 [ 1, [[ENTRY:%.]] ], [ [[ADD_LCSSA]], [[FOR_COND_CLEANUP_LOOPEXIT]] ]			; CHECK-NEXT: [[R_0_LCSSA:%.]] = phi i32 [ 1, [[ENTRY:%.]] ], [ [[ADD_LCSSA]], [[FOR_COND_CLEANUP_LOOPEXIT]] ]
	; CHECK-NEXT: ret i32 [[R_0_LCSSA]]			; CHECK-NEXT: ret i32 [[R_0_LCSSA]]
	;			;
	entry:			entry:
	%cmp6 = icmp sgt i32 %n, 0			%cmp6 = icmp sgt i32 %n, 0
	br i1 %cmp6, label %for.body, label %for.cond.cleanup			br i1 %cmp6, label %for.body, label %for.cond.cleanup
	Show All 36 Lines
	; CHECK-NEXT: [[WIDE_MASKED_LOAD:%.]] = call <4 x i32> @llvm.masked.load.v4i32.p0v4i32(<4 x i32> [[TMP3]], i32 4, <4 x i1> [[ACTIVE_LANE_MASK]], <4 x i32> poison)			; CHECK-NEXT: [[WIDE_MASKED_LOAD:%.]] = call <4 x i32> @llvm.masked.load.v4i32.p0v4i32(<4 x i32> [[TMP3]], i32 4, <4 x i1> [[ACTIVE_LANE_MASK]], <4 x i32> poison)
	; CHECK-NEXT: [[TMP4:%.*]] = and <4 x i32> [[WIDE_MASKED_LOAD]], [[VEC_PHI]]			; CHECK-NEXT: [[TMP4:%.*]] = and <4 x i32> [[WIDE_MASKED_LOAD]], [[VEC_PHI]]
	; CHECK-NEXT: [[TMP5]] = select <4 x i1> [[ACTIVE_LANE_MASK]], <4 x i32> [[TMP4]], <4 x i32> [[VEC_PHI]]			; CHECK-NEXT: [[TMP5]] = select <4 x i1> [[ACTIVE_LANE_MASK]], <4 x i32> [[TMP4]], <4 x i32> [[VEC_PHI]]
	; CHECK-NEXT: [[INDEX_NEXT]] = add i32 [[INDEX]], 4			; CHECK-NEXT: [[INDEX_NEXT]] = add i32 [[INDEX]], 4
	; CHECK-NEXT: [[TMP6:%.*]] = icmp eq i32 [[INDEX_NEXT]], [[N_VEC]]			; CHECK-NEXT: [[TMP6:%.*]] = icmp eq i32 [[INDEX_NEXT]], [[N_VEC]]
	; CHECK-NEXT: br i1 [[TMP6]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP10:![0-9]+]]			; CHECK-NEXT: br i1 [[TMP6]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP10:![0-9]+]]
	; CHECK: middle.block:			; CHECK: middle.block:
	; CHECK-NEXT: [[TMP7:%.*]] = call i32 @llvm.vector.reduce.and.v4i32(<4 x i32> [[TMP5]])			; CHECK-NEXT: [[TMP7:%.*]] = call i32 @llvm.vector.reduce.and.v4i32(<4 x i32> [[TMP5]])
				; CHECK-NEXT: [[RDX_START:%.*]] = and i32 -1, [[TMP7]]
	; CHECK-NEXT: br i1 true, label [[FOR_COND_CLEANUP_LOOPEXIT:%.*]], label [[SCALAR_PH]]			; CHECK-NEXT: br i1 true, label [[FOR_COND_CLEANUP_LOOPEXIT:%.*]], label [[SCALAR_PH]]
	; CHECK: scalar.ph:			; CHECK: scalar.ph:
	; CHECK-NEXT: [[BC_RESUME_VAL:%.*]] = phi i32 [ [[N_VEC]], [[MIDDLE_BLOCK]] ], [ 0, [[FOR_BODY_PREHEADER]] ]			; CHECK-NEXT: [[BC_RESUME_VAL:%.*]] = phi i32 [ [[N_VEC]], [[MIDDLE_BLOCK]] ], [ 0, [[FOR_BODY_PREHEADER]] ]
	; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ -1, [[FOR_BODY_PREHEADER]] ], [ [[TMP7]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ -1, [[FOR_BODY_PREHEADER]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: br label [[FOR_BODY:%.*]]			; CHECK-NEXT: br label [[FOR_BODY:%.*]]
	; CHECK: for.body:			; CHECK: for.body:
	; CHECK-NEXT: [[I_08:%.]] = phi i32 [ [[INC:%.]], [[FOR_BODY]] ], [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ]			; CHECK-NEXT: [[I_08:%.]] = phi i32 [ [[INC:%.]], [[FOR_BODY]] ], [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ]
	; CHECK-NEXT: [[R_07:%.]] = phi i32 [ [[ADD:%.]], [[FOR_BODY]] ], [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ]			; CHECK-NEXT: [[R_07:%.]] = phi i32 [ [[ADD:%.]], [[FOR_BODY]] ], [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ]
	; CHECK-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds i32, i32 [[X]], i32 [[I_08]]			; CHECK-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds i32, i32 [[X]], i32 [[I_08]]
	; CHECK-NEXT: [[TMP8:%.]] = load i32, i32 [[ARRAYIDX]], align 4			; CHECK-NEXT: [[TMP8:%.]] = load i32, i32 [[ARRAYIDX]], align 4
	; CHECK-NEXT: [[ADD]] = and i32 [[TMP8]], [[R_07]]			; CHECK-NEXT: [[ADD]] = and i32 [[TMP8]], [[R_07]]
	; CHECK-NEXT: [[INC]] = add nuw nsw i32 [[I_08]], 1			; CHECK-NEXT: [[INC]] = add nuw nsw i32 [[I_08]], 1
	; CHECK-NEXT: [[EXITCOND:%.*]] = icmp eq i32 [[INC]], [[N]]			; CHECK-NEXT: [[EXITCOND:%.*]] = icmp eq i32 [[INC]], [[N]]
	; CHECK-NEXT: br i1 [[EXITCOND]], label [[FOR_COND_CLEANUP_LOOPEXIT]], label [[FOR_BODY]], !llvm.loop [[LOOP11:![0-9]+]]			; CHECK-NEXT: br i1 [[EXITCOND]], label [[FOR_COND_CLEANUP_LOOPEXIT]], label [[FOR_BODY]], !llvm.loop [[LOOP11:![0-9]+]]
	; CHECK: for.cond.cleanup.loopexit:			; CHECK: for.cond.cleanup.loopexit:
	; CHECK-NEXT: [[ADD_LCSSA:%.*]] = phi i32 [ [[ADD]], [[FOR_BODY]] ], [ [[TMP7]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[ADD_LCSSA:%.*]] = phi i32 [ [[ADD]], [[FOR_BODY]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: br label [[FOR_COND_CLEANUP]]			; CHECK-NEXT: br label [[FOR_COND_CLEANUP]]
	; CHECK: for.cond.cleanup:			; CHECK: for.cond.cleanup:
	; CHECK-NEXT: [[R_0_LCSSA:%.]] = phi i32 [ -1, [[ENTRY:%.]] ], [ [[ADD_LCSSA]], [[FOR_COND_CLEANUP_LOOPEXIT]] ]			; CHECK-NEXT: [[R_0_LCSSA:%.]] = phi i32 [ -1, [[ENTRY:%.]] ], [ [[ADD_LCSSA]], [[FOR_COND_CLEANUP_LOOPEXIT]] ]
	; CHECK-NEXT: ret i32 [[R_0_LCSSA]]			; CHECK-NEXT: ret i32 [[R_0_LCSSA]]
	;			;
	entry:			entry:
	%cmp6 = icmp sgt i32 %n, 0			%cmp6 = icmp sgt i32 %n, 0
	br i1 %cmp6, label %for.body, label %for.cond.cleanup			br i1 %cmp6, label %for.body, label %for.cond.cleanup
	Show All 36 Lines
	; CHECK-NEXT: [[WIDE_MASKED_LOAD:%.]] = call <4 x i32> @llvm.masked.load.v4i32.p0v4i32(<4 x i32> [[TMP3]], i32 4, <4 x i1> [[ACTIVE_LANE_MASK]], <4 x i32> poison)			; CHECK-NEXT: [[WIDE_MASKED_LOAD:%.]] = call <4 x i32> @llvm.masked.load.v4i32.p0v4i32(<4 x i32> [[TMP3]], i32 4, <4 x i1> [[ACTIVE_LANE_MASK]], <4 x i32> poison)
	; CHECK-NEXT: [[TMP4:%.*]] = or <4 x i32> [[WIDE_MASKED_LOAD]], [[VEC_PHI]]			; CHECK-NEXT: [[TMP4:%.*]] = or <4 x i32> [[WIDE_MASKED_LOAD]], [[VEC_PHI]]
	; CHECK-NEXT: [[TMP5]] = select <4 x i1> [[ACTIVE_LANE_MASK]], <4 x i32> [[TMP4]], <4 x i32> [[VEC_PHI]]			; CHECK-NEXT: [[TMP5]] = select <4 x i1> [[ACTIVE_LANE_MASK]], <4 x i32> [[TMP4]], <4 x i32> [[VEC_PHI]]
	; CHECK-NEXT: [[INDEX_NEXT]] = add i32 [[INDEX]], 4			; CHECK-NEXT: [[INDEX_NEXT]] = add i32 [[INDEX]], 4
	; CHECK-NEXT: [[TMP6:%.*]] = icmp eq i32 [[INDEX_NEXT]], [[N_VEC]]			; CHECK-NEXT: [[TMP6:%.*]] = icmp eq i32 [[INDEX_NEXT]], [[N_VEC]]
	; CHECK-NEXT: br i1 [[TMP6]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP12:![0-9]+]]			; CHECK-NEXT: br i1 [[TMP6]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP12:![0-9]+]]
	; CHECK: middle.block:			; CHECK: middle.block:
	; CHECK-NEXT: [[TMP7:%.*]] = call i32 @llvm.vector.reduce.or.v4i32(<4 x i32> [[TMP5]])			; CHECK-NEXT: [[TMP7:%.*]] = call i32 @llvm.vector.reduce.or.v4i32(<4 x i32> [[TMP5]])
				; CHECK-NEXT: [[RDX_START:%.*]] = or i32 0, [[TMP7]]
	; CHECK-NEXT: br i1 true, label [[FOR_COND_CLEANUP_LOOPEXIT:%.*]], label [[SCALAR_PH]]			; CHECK-NEXT: br i1 true, label [[FOR_COND_CLEANUP_LOOPEXIT:%.*]], label [[SCALAR_PH]]
	; CHECK: scalar.ph:			; CHECK: scalar.ph:
	; CHECK-NEXT: [[BC_RESUME_VAL:%.*]] = phi i32 [ [[N_VEC]], [[MIDDLE_BLOCK]] ], [ 0, [[FOR_BODY_PREHEADER]] ]			; CHECK-NEXT: [[BC_RESUME_VAL:%.*]] = phi i32 [ [[N_VEC]], [[MIDDLE_BLOCK]] ], [ 0, [[FOR_BODY_PREHEADER]] ]
	; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 0, [[FOR_BODY_PREHEADER]] ], [ [[TMP7]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 0, [[FOR_BODY_PREHEADER]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: br label [[FOR_BODY:%.*]]			; CHECK-NEXT: br label [[FOR_BODY:%.*]]
	; CHECK: for.body:			; CHECK: for.body:
	; CHECK-NEXT: [[I_08:%.]] = phi i32 [ [[INC:%.]], [[FOR_BODY]] ], [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ]			; CHECK-NEXT: [[I_08:%.]] = phi i32 [ [[INC:%.]], [[FOR_BODY]] ], [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ]
	; CHECK-NEXT: [[R_07:%.]] = phi i32 [ [[ADD:%.]], [[FOR_BODY]] ], [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ]			; CHECK-NEXT: [[R_07:%.]] = phi i32 [ [[ADD:%.]], [[FOR_BODY]] ], [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ]
	; CHECK-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds i32, i32 [[X]], i32 [[I_08]]			; CHECK-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds i32, i32 [[X]], i32 [[I_08]]
	; CHECK-NEXT: [[TMP8:%.]] = load i32, i32 [[ARRAYIDX]], align 4			; CHECK-NEXT: [[TMP8:%.]] = load i32, i32 [[ARRAYIDX]], align 4
	; CHECK-NEXT: [[ADD]] = or i32 [[TMP8]], [[R_07]]			; CHECK-NEXT: [[ADD]] = or i32 [[TMP8]], [[R_07]]
	; CHECK-NEXT: [[INC]] = add nuw nsw i32 [[I_08]], 1			; CHECK-NEXT: [[INC]] = add nuw nsw i32 [[I_08]], 1
	; CHECK-NEXT: [[EXITCOND:%.*]] = icmp eq i32 [[INC]], [[N]]			; CHECK-NEXT: [[EXITCOND:%.*]] = icmp eq i32 [[INC]], [[N]]
	; CHECK-NEXT: br i1 [[EXITCOND]], label [[FOR_COND_CLEANUP_LOOPEXIT]], label [[FOR_BODY]], !llvm.loop [[LOOP13:![0-9]+]]			; CHECK-NEXT: br i1 [[EXITCOND]], label [[FOR_COND_CLEANUP_LOOPEXIT]], label [[FOR_BODY]], !llvm.loop [[LOOP13:![0-9]+]]
	; CHECK: for.cond.cleanup.loopexit:			; CHECK: for.cond.cleanup.loopexit:
	; CHECK-NEXT: [[ADD_LCSSA:%.*]] = phi i32 [ [[ADD]], [[FOR_BODY]] ], [ [[TMP7]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[ADD_LCSSA:%.*]] = phi i32 [ [[ADD]], [[FOR_BODY]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: br label [[FOR_COND_CLEANUP]]			; CHECK-NEXT: br label [[FOR_COND_CLEANUP]]
	; CHECK: for.cond.cleanup:			; CHECK: for.cond.cleanup:
	; CHECK-NEXT: [[R_0_LCSSA:%.]] = phi i32 [ 0, [[ENTRY:%.]] ], [ [[ADD_LCSSA]], [[FOR_COND_CLEANUP_LOOPEXIT]] ]			; CHECK-NEXT: [[R_0_LCSSA:%.]] = phi i32 [ 0, [[ENTRY:%.]] ], [ [[ADD_LCSSA]], [[FOR_COND_CLEANUP_LOOPEXIT]] ]
	; CHECK-NEXT: ret i32 [[R_0_LCSSA]]			; CHECK-NEXT: ret i32 [[R_0_LCSSA]]
	;			;
	entry:			entry:
	%cmp6 = icmp sgt i32 %n, 0			%cmp6 = icmp sgt i32 %n, 0
	br i1 %cmp6, label %for.body, label %for.cond.cleanup			br i1 %cmp6, label %for.body, label %for.cond.cleanup
	Show All 36 Lines
	; CHECK-NEXT: [[WIDE_MASKED_LOAD:%.]] = call <4 x i32> @llvm.masked.load.v4i32.p0v4i32(<4 x i32> [[TMP3]], i32 4, <4 x i1> [[ACTIVE_LANE_MASK]], <4 x i32> poison)			; CHECK-NEXT: [[WIDE_MASKED_LOAD:%.]] = call <4 x i32> @llvm.masked.load.v4i32.p0v4i32(<4 x i32> [[TMP3]], i32 4, <4 x i1> [[ACTIVE_LANE_MASK]], <4 x i32> poison)
	; CHECK-NEXT: [[TMP4:%.*]] = xor <4 x i32> [[WIDE_MASKED_LOAD]], [[VEC_PHI]]			; CHECK-NEXT: [[TMP4:%.*]] = xor <4 x i32> [[WIDE_MASKED_LOAD]], [[VEC_PHI]]
	; CHECK-NEXT: [[TMP5]] = select <4 x i1> [[ACTIVE_LANE_MASK]], <4 x i32> [[TMP4]], <4 x i32> [[VEC_PHI]]			; CHECK-NEXT: [[TMP5]] = select <4 x i1> [[ACTIVE_LANE_MASK]], <4 x i32> [[TMP4]], <4 x i32> [[VEC_PHI]]
	; CHECK-NEXT: [[INDEX_NEXT]] = add i32 [[INDEX]], 4			; CHECK-NEXT: [[INDEX_NEXT]] = add i32 [[INDEX]], 4
	; CHECK-NEXT: [[TMP6:%.*]] = icmp eq i32 [[INDEX_NEXT]], [[N_VEC]]			; CHECK-NEXT: [[TMP6:%.*]] = icmp eq i32 [[INDEX_NEXT]], [[N_VEC]]
	; CHECK-NEXT: br i1 [[TMP6]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP14:![0-9]+]]			; CHECK-NEXT: br i1 [[TMP6]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP14:![0-9]+]]
	; CHECK: middle.block:			; CHECK: middle.block:
	; CHECK-NEXT: [[TMP7:%.*]] = call i32 @llvm.vector.reduce.xor.v4i32(<4 x i32> [[TMP5]])			; CHECK-NEXT: [[TMP7:%.*]] = call i32 @llvm.vector.reduce.xor.v4i32(<4 x i32> [[TMP5]])
				; CHECK-NEXT: [[RDX_START:%.*]] = xor i32 0, [[TMP7]]
	; CHECK-NEXT: br i1 true, label [[FOR_COND_CLEANUP_LOOPEXIT:%.*]], label [[SCALAR_PH]]			; CHECK-NEXT: br i1 true, label [[FOR_COND_CLEANUP_LOOPEXIT:%.*]], label [[SCALAR_PH]]
	; CHECK: scalar.ph:			; CHECK: scalar.ph:
	; CHECK-NEXT: [[BC_RESUME_VAL:%.*]] = phi i32 [ [[N_VEC]], [[MIDDLE_BLOCK]] ], [ 0, [[FOR_BODY_PREHEADER]] ]			; CHECK-NEXT: [[BC_RESUME_VAL:%.*]] = phi i32 [ [[N_VEC]], [[MIDDLE_BLOCK]] ], [ 0, [[FOR_BODY_PREHEADER]] ]
	; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 0, [[FOR_BODY_PREHEADER]] ], [ [[TMP7]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 0, [[FOR_BODY_PREHEADER]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: br label [[FOR_BODY:%.*]]			; CHECK-NEXT: br label [[FOR_BODY:%.*]]
	; CHECK: for.body:			; CHECK: for.body:
	; CHECK-NEXT: [[I_08:%.]] = phi i32 [ [[INC:%.]], [[FOR_BODY]] ], [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ]			; CHECK-NEXT: [[I_08:%.]] = phi i32 [ [[INC:%.]], [[FOR_BODY]] ], [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ]
	; CHECK-NEXT: [[R_07:%.]] = phi i32 [ [[ADD:%.]], [[FOR_BODY]] ], [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ]			; CHECK-NEXT: [[R_07:%.]] = phi i32 [ [[ADD:%.]], [[FOR_BODY]] ], [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ]
	; CHECK-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds i32, i32 [[X]], i32 [[I_08]]			; CHECK-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds i32, i32 [[X]], i32 [[I_08]]
	; CHECK-NEXT: [[TMP8:%.]] = load i32, i32 [[ARRAYIDX]], align 4			; CHECK-NEXT: [[TMP8:%.]] = load i32, i32 [[ARRAYIDX]], align 4
	; CHECK-NEXT: [[ADD]] = xor i32 [[TMP8]], [[R_07]]			; CHECK-NEXT: [[ADD]] = xor i32 [[TMP8]], [[R_07]]
	; CHECK-NEXT: [[INC]] = add nuw nsw i32 [[I_08]], 1			; CHECK-NEXT: [[INC]] = add nuw nsw i32 [[I_08]], 1
	; CHECK-NEXT: [[EXITCOND:%.*]] = icmp eq i32 [[INC]], [[N]]			; CHECK-NEXT: [[EXITCOND:%.*]] = icmp eq i32 [[INC]], [[N]]
	; CHECK-NEXT: br i1 [[EXITCOND]], label [[FOR_COND_CLEANUP_LOOPEXIT]], label [[FOR_BODY]], !llvm.loop [[LOOP15:![0-9]+]]			; CHECK-NEXT: br i1 [[EXITCOND]], label [[FOR_COND_CLEANUP_LOOPEXIT]], label [[FOR_BODY]], !llvm.loop [[LOOP15:![0-9]+]]
	; CHECK: for.cond.cleanup.loopexit:			; CHECK: for.cond.cleanup.loopexit:
	; CHECK-NEXT: [[ADD_LCSSA:%.*]] = phi i32 [ [[ADD]], [[FOR_BODY]] ], [ [[TMP7]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[ADD_LCSSA:%.*]] = phi i32 [ [[ADD]], [[FOR_BODY]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: br label [[FOR_COND_CLEANUP]]			; CHECK-NEXT: br label [[FOR_COND_CLEANUP]]
	; CHECK: for.cond.cleanup:			; CHECK: for.cond.cleanup:
	; CHECK-NEXT: [[R_0_LCSSA:%.]] = phi i32 [ 0, [[ENTRY:%.]] ], [ [[ADD_LCSSA]], [[FOR_COND_CLEANUP_LOOPEXIT]] ]			; CHECK-NEXT: [[R_0_LCSSA:%.]] = phi i32 [ 0, [[ENTRY:%.]] ], [ [[ADD_LCSSA]], [[FOR_COND_CLEANUP_LOOPEXIT]] ]
	; CHECK-NEXT: ret i32 [[R_0_LCSSA]]			; CHECK-NEXT: ret i32 [[R_0_LCSSA]]
	;			;
	entry:			entry:
	%cmp6 = icmp sgt i32 %n, 0			%cmp6 = icmp sgt i32 %n, 0
	br i1 %cmp6, label %for.body, label %for.cond.cleanup			br i1 %cmp6, label %for.body, label %for.cond.cleanup
	Show All 36 Lines
	; CHECK-NEXT: [[WIDE_MASKED_LOAD:%.]] = call <4 x float> @llvm.masked.load.v4f32.p0v4f32(<4 x float> [[TMP3]], i32 4, <4 x i1> [[ACTIVE_LANE_MASK]], <4 x float> poison)			; CHECK-NEXT: [[WIDE_MASKED_LOAD:%.]] = call <4 x float> @llvm.masked.load.v4f32.p0v4f32(<4 x float> [[TMP3]], i32 4, <4 x i1> [[ACTIVE_LANE_MASK]], <4 x float> poison)
	; CHECK-NEXT: [[TMP4:%.*]] = fadd fast <4 x float> [[WIDE_MASKED_LOAD]], [[VEC_PHI]]			; CHECK-NEXT: [[TMP4:%.*]] = fadd fast <4 x float> [[WIDE_MASKED_LOAD]], [[VEC_PHI]]
	; CHECK-NEXT: [[TMP5]] = select fast <4 x i1> [[ACTIVE_LANE_MASK]], <4 x float> [[TMP4]], <4 x float> [[VEC_PHI]]			; CHECK-NEXT: [[TMP5]] = select fast <4 x i1> [[ACTIVE_LANE_MASK]], <4 x float> [[TMP4]], <4 x float> [[VEC_PHI]]
	; CHECK-NEXT: [[INDEX_NEXT]] = add i32 [[INDEX]], 4			; CHECK-NEXT: [[INDEX_NEXT]] = add i32 [[INDEX]], 4
	; CHECK-NEXT: [[TMP6:%.*]] = icmp eq i32 [[INDEX_NEXT]], [[N_VEC]]			; CHECK-NEXT: [[TMP6:%.*]] = icmp eq i32 [[INDEX_NEXT]], [[N_VEC]]
	; CHECK-NEXT: br i1 [[TMP6]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP16:![0-9]+]]			; CHECK-NEXT: br i1 [[TMP6]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP16:![0-9]+]]
	; CHECK: middle.block:			; CHECK: middle.block:
	; CHECK-NEXT: [[TMP7:%.*]] = call fast float @llvm.vector.reduce.fadd.v4f32(float -0.000000e+00, <4 x float> [[TMP5]])			; CHECK-NEXT: [[TMP7:%.*]] = call fast float @llvm.vector.reduce.fadd.v4f32(float -0.000000e+00, <4 x float> [[TMP5]])
				; CHECK-NEXT: [[RDX_START:%.*]] = fadd float 0.000000e+00, [[TMP7]]
	; CHECK-NEXT: br i1 true, label [[FOR_COND_CLEANUP_LOOPEXIT:%.*]], label [[SCALAR_PH]]			; CHECK-NEXT: br i1 true, label [[FOR_COND_CLEANUP_LOOPEXIT:%.*]], label [[SCALAR_PH]]
	; CHECK: scalar.ph:			; CHECK: scalar.ph:
	; CHECK-NEXT: [[BC_RESUME_VAL:%.*]] = phi i32 [ [[N_VEC]], [[MIDDLE_BLOCK]] ], [ 0, [[FOR_BODY_PREHEADER]] ]			; CHECK-NEXT: [[BC_RESUME_VAL:%.*]] = phi i32 [ [[N_VEC]], [[MIDDLE_BLOCK]] ], [ 0, [[FOR_BODY_PREHEADER]] ]
	; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi float [ 0.000000e+00, [[FOR_BODY_PREHEADER]] ], [ [[TMP7]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi float [ 0.000000e+00, [[FOR_BODY_PREHEADER]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: br label [[FOR_BODY:%.*]]			; CHECK-NEXT: br label [[FOR_BODY:%.*]]
	; CHECK: for.body:			; CHECK: for.body:
	; CHECK-NEXT: [[I_08:%.]] = phi i32 [ [[INC:%.]], [[FOR_BODY]] ], [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ]			; CHECK-NEXT: [[I_08:%.]] = phi i32 [ [[INC:%.]], [[FOR_BODY]] ], [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ]
	; CHECK-NEXT: [[R_07:%.]] = phi float [ [[ADD:%.]], [[FOR_BODY]] ], [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ]			; CHECK-NEXT: [[R_07:%.]] = phi float [ [[ADD:%.]], [[FOR_BODY]] ], [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ]
	; CHECK-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds float, float [[X]], i32 [[I_08]]			; CHECK-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds float, float [[X]], i32 [[I_08]]
	; CHECK-NEXT: [[TMP8:%.]] = load float, float [[ARRAYIDX]], align 4			; CHECK-NEXT: [[TMP8:%.]] = load float, float [[ARRAYIDX]], align 4
	; CHECK-NEXT: [[ADD]] = fadd fast float [[TMP8]], [[R_07]]			; CHECK-NEXT: [[ADD]] = fadd fast float [[TMP8]], [[R_07]]
	; CHECK-NEXT: [[INC]] = add nuw nsw i32 [[I_08]], 1			; CHECK-NEXT: [[INC]] = add nuw nsw i32 [[I_08]], 1
	; CHECK-NEXT: [[EXITCOND:%.*]] = icmp eq i32 [[INC]], [[N]]			; CHECK-NEXT: [[EXITCOND:%.*]] = icmp eq i32 [[INC]], [[N]]
	; CHECK-NEXT: br i1 [[EXITCOND]], label [[FOR_COND_CLEANUP_LOOPEXIT]], label [[FOR_BODY]], !llvm.loop [[LOOP17:![0-9]+]]			; CHECK-NEXT: br i1 [[EXITCOND]], label [[FOR_COND_CLEANUP_LOOPEXIT]], label [[FOR_BODY]], !llvm.loop [[LOOP17:![0-9]+]]
	; CHECK: for.cond.cleanup.loopexit:			; CHECK: for.cond.cleanup.loopexit:
	; CHECK-NEXT: [[ADD_LCSSA:%.*]] = phi float [ [[ADD]], [[FOR_BODY]] ], [ [[TMP7]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[ADD_LCSSA:%.*]] = phi float [ [[ADD]], [[FOR_BODY]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: br label [[FOR_COND_CLEANUP]]			; CHECK-NEXT: br label [[FOR_COND_CLEANUP]]
	; CHECK: for.cond.cleanup:			; CHECK: for.cond.cleanup:
	; CHECK-NEXT: [[R_0_LCSSA:%.]] = phi float [ 0.000000e+00, [[ENTRY:%.]] ], [ [[ADD_LCSSA]], [[FOR_COND_CLEANUP_LOOPEXIT]] ]			; CHECK-NEXT: [[R_0_LCSSA:%.]] = phi float [ 0.000000e+00, [[ENTRY:%.]] ], [ [[ADD_LCSSA]], [[FOR_COND_CLEANUP_LOOPEXIT]] ]
	; CHECK-NEXT: ret float [[R_0_LCSSA]]			; CHECK-NEXT: ret float [[R_0_LCSSA]]
	;			;
	entry:			entry:
	%cmp6 = icmp sgt i32 %n, 0			%cmp6 = icmp sgt i32 %n, 0
	br i1 %cmp6, label %for.body, label %for.cond.cleanup			br i1 %cmp6, label %for.body, label %for.cond.cleanup
	Show All 36 Lines
	; CHECK-NEXT: [[WIDE_MASKED_LOAD:%.]] = call <4 x float> @llvm.masked.load.v4f32.p0v4f32(<4 x float> [[TMP3]], i32 4, <4 x i1> [[ACTIVE_LANE_MASK]], <4 x float> poison)			; CHECK-NEXT: [[WIDE_MASKED_LOAD:%.]] = call <4 x float> @llvm.masked.load.v4f32.p0v4f32(<4 x float> [[TMP3]], i32 4, <4 x i1> [[ACTIVE_LANE_MASK]], <4 x float> poison)
	; CHECK-NEXT: [[TMP4:%.*]] = fmul fast <4 x float> [[WIDE_MASKED_LOAD]], [[VEC_PHI]]			; CHECK-NEXT: [[TMP4:%.*]] = fmul fast <4 x float> [[WIDE_MASKED_LOAD]], [[VEC_PHI]]
	; CHECK-NEXT: [[TMP5]] = select fast <4 x i1> [[ACTIVE_LANE_MASK]], <4 x float> [[TMP4]], <4 x float> [[VEC_PHI]]			; CHECK-NEXT: [[TMP5]] = select fast <4 x i1> [[ACTIVE_LANE_MASK]], <4 x float> [[TMP4]], <4 x float> [[VEC_PHI]]
	; CHECK-NEXT: [[INDEX_NEXT]] = add i32 [[INDEX]], 4			; CHECK-NEXT: [[INDEX_NEXT]] = add i32 [[INDEX]], 4
	; CHECK-NEXT: [[TMP6:%.*]] = icmp eq i32 [[INDEX_NEXT]], [[N_VEC]]			; CHECK-NEXT: [[TMP6:%.*]] = icmp eq i32 [[INDEX_NEXT]], [[N_VEC]]
	; CHECK-NEXT: br i1 [[TMP6]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP18:![0-9]+]]			; CHECK-NEXT: br i1 [[TMP6]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP18:![0-9]+]]
	; CHECK: middle.block:			; CHECK: middle.block:
	; CHECK-NEXT: [[TMP7:%.*]] = call fast float @llvm.vector.reduce.fmul.v4f32(float 1.000000e+00, <4 x float> [[TMP5]])			; CHECK-NEXT: [[TMP7:%.*]] = call fast float @llvm.vector.reduce.fmul.v4f32(float 1.000000e+00, <4 x float> [[TMP5]])
				; CHECK-NEXT: [[RDX_START:%.*]] = fmul float 1.000000e+00, [[TMP7]]
	; CHECK-NEXT: br i1 true, label [[FOR_COND_CLEANUP_LOOPEXIT:%.*]], label [[SCALAR_PH]]			; CHECK-NEXT: br i1 true, label [[FOR_COND_CLEANUP_LOOPEXIT:%.*]], label [[SCALAR_PH]]
	; CHECK: scalar.ph:			; CHECK: scalar.ph:
	; CHECK-NEXT: [[BC_RESUME_VAL:%.*]] = phi i32 [ [[N_VEC]], [[MIDDLE_BLOCK]] ], [ 0, [[FOR_BODY_PREHEADER]] ]			; CHECK-NEXT: [[BC_RESUME_VAL:%.*]] = phi i32 [ [[N_VEC]], [[MIDDLE_BLOCK]] ], [ 0, [[FOR_BODY_PREHEADER]] ]
	; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi float [ 1.000000e+00, [[FOR_BODY_PREHEADER]] ], [ [[TMP7]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi float [ 1.000000e+00, [[FOR_BODY_PREHEADER]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: br label [[FOR_BODY:%.*]]			; CHECK-NEXT: br label [[FOR_BODY:%.*]]
	; CHECK: for.body:			; CHECK: for.body:
	; CHECK-NEXT: [[I_08:%.]] = phi i32 [ [[INC:%.]], [[FOR_BODY]] ], [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ]			; CHECK-NEXT: [[I_08:%.]] = phi i32 [ [[INC:%.]], [[FOR_BODY]] ], [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ]
	; CHECK-NEXT: [[R_07:%.]] = phi float [ [[ADD:%.]], [[FOR_BODY]] ], [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ]			; CHECK-NEXT: [[R_07:%.]] = phi float [ [[ADD:%.]], [[FOR_BODY]] ], [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ]
	; CHECK-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds float, float [[X]], i32 [[I_08]]			; CHECK-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds float, float [[X]], i32 [[I_08]]
	; CHECK-NEXT: [[TMP8:%.]] = load float, float [[ARRAYIDX]], align 4			; CHECK-NEXT: [[TMP8:%.]] = load float, float [[ARRAYIDX]], align 4
	; CHECK-NEXT: [[ADD]] = fmul fast float [[TMP8]], [[R_07]]			; CHECK-NEXT: [[ADD]] = fmul fast float [[TMP8]], [[R_07]]
	; CHECK-NEXT: [[INC]] = add nuw nsw i32 [[I_08]], 1			; CHECK-NEXT: [[INC]] = add nuw nsw i32 [[I_08]], 1
	; CHECK-NEXT: [[EXITCOND:%.*]] = icmp eq i32 [[INC]], [[N]]			; CHECK-NEXT: [[EXITCOND:%.*]] = icmp eq i32 [[INC]], [[N]]
	; CHECK-NEXT: br i1 [[EXITCOND]], label [[FOR_COND_CLEANUP_LOOPEXIT]], label [[FOR_BODY]], !llvm.loop [[LOOP19:![0-9]+]]			; CHECK-NEXT: br i1 [[EXITCOND]], label [[FOR_COND_CLEANUP_LOOPEXIT]], label [[FOR_BODY]], !llvm.loop [[LOOP19:![0-9]+]]
	; CHECK: for.cond.cleanup.loopexit:			; CHECK: for.cond.cleanup.loopexit:
	; CHECK-NEXT: [[ADD_LCSSA:%.*]] = phi float [ [[ADD]], [[FOR_BODY]] ], [ [[TMP7]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[ADD_LCSSA:%.*]] = phi float [ [[ADD]], [[FOR_BODY]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: br label [[FOR_COND_CLEANUP]]			; CHECK-NEXT: br label [[FOR_COND_CLEANUP]]
	; CHECK: for.cond.cleanup:			; CHECK: for.cond.cleanup:
	; CHECK-NEXT: [[R_0_LCSSA:%.]] = phi float [ 1.000000e+00, [[ENTRY:%.]] ], [ [[ADD_LCSSA]], [[FOR_COND_CLEANUP_LOOPEXIT]] ]			; CHECK-NEXT: [[R_0_LCSSA:%.]] = phi float [ 1.000000e+00, [[ENTRY:%.]] ], [ [[ADD_LCSSA]], [[FOR_COND_CLEANUP_LOOPEXIT]] ]
	; CHECK-NEXT: ret float [[R_0_LCSSA]]			; CHECK-NEXT: ret float [[R_0_LCSSA]]
	;			;
	entry:			entry:
	%cmp6 = icmp sgt i32 %n, 0			%cmp6 = icmp sgt i32 %n, 0
	br i1 %cmp6, label %for.body, label %for.cond.cleanup			br i1 %cmp6, label %for.body, label %for.cond.cleanup
	▲ Show 20 Lines • Show All 438 Lines • Show Last 20 Lines

llvm/test/Transforms/LoopVectorize/ARM/mve-selectandorcost.ll

	Show First 20 Lines • Show All 44 Lines • ▼ Show 20 Lines
	; CHECK-NEXT: [[TMP10:%.*]] = fdiv fast <4 x float> [[TMP9]], [[TMP7]]			; CHECK-NEXT: [[TMP10:%.*]] = fdiv fast <4 x float> [[TMP9]], [[TMP7]]
	; CHECK-NEXT: [[TMP11:%.*]] = select <4 x i1> [[TMP4]], <4 x float> <float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00>, <4 x float> [[TMP10]]			; CHECK-NEXT: [[TMP11:%.*]] = select <4 x i1> [[TMP4]], <4 x float> <float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00>, <4 x float> [[TMP10]]
	; CHECK-NEXT: [[PREDPHI]] = fadd fast <4 x float> [[VEC_PHI]], [[TMP11]]			; CHECK-NEXT: [[PREDPHI]] = fadd fast <4 x float> [[VEC_PHI]], [[TMP11]]
	; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i32 [[INDEX]], 4			; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i32 [[INDEX]], 4
	; CHECK-NEXT: [[TMP12:%.*]] = icmp eq i32 [[INDEX_NEXT]], [[N_VEC]]			; CHECK-NEXT: [[TMP12:%.*]] = icmp eq i32 [[INDEX_NEXT]], [[N_VEC]]
	; CHECK-NEXT: br i1 [[TMP12]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP0:![0-9]+]]			; CHECK-NEXT: br i1 [[TMP12]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP0:![0-9]+]]
	; CHECK: middle.block:			; CHECK: middle.block:
	; CHECK-NEXT: [[TMP13:%.*]] = call fast float @llvm.vector.reduce.fadd.v4f32(float -0.000000e+00, <4 x float> [[PREDPHI]])			; CHECK-NEXT: [[TMP13:%.*]] = call fast float @llvm.vector.reduce.fadd.v4f32(float -0.000000e+00, <4 x float> [[PREDPHI]])
				; CHECK-NEXT: [[RDX_START:%.*]] = fadd float [[TMP13]], 0.000000e+00
	; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i32 [[N_VEC]], [[BLOCKSIZE]]			; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i32 [[N_VEC]], [[BLOCKSIZE]]
	; CHECK-NEXT: br i1 [[CMP_N]], label [[WHILE_END]], label [[SCALAR_PH]]			; CHECK-NEXT: br i1 [[CMP_N]], label [[WHILE_END]], label [[SCALAR_PH]]
	; CHECK: scalar.ph:			; CHECK: scalar.ph:
	; CHECK-NEXT: [[BC_RESUME_VAL:%.]] = phi float [ [[IND_END]], [[MIDDLE_BLOCK]] ], [ [[PA]], [[WHILE_BODY_PREHEADER]] ]			; CHECK-NEXT: [[BC_RESUME_VAL:%.]] = phi float [ [[IND_END]], [[MIDDLE_BLOCK]] ], [ [[PA]], [[WHILE_BODY_PREHEADER]] ]
	; CHECK-NEXT: [[BC_RESUME_VAL2:%.]] = phi float [ [[IND_END1]], [[MIDDLE_BLOCK]] ], [ [[PB]], [[WHILE_BODY_PREHEADER]] ]			; CHECK-NEXT: [[BC_RESUME_VAL2:%.]] = phi float [ [[IND_END1]], [[MIDDLE_BLOCK]] ], [ [[PB]], [[WHILE_BODY_PREHEADER]] ]
	; CHECK-NEXT: [[BC_RESUME_VAL4:%.*]] = phi i32 [ [[IND_END3]], [[MIDDLE_BLOCK]] ], [ [[BLOCKSIZE]], [[WHILE_BODY_PREHEADER]] ]			; CHECK-NEXT: [[BC_RESUME_VAL4:%.*]] = phi i32 [ [[IND_END3]], [[MIDDLE_BLOCK]] ], [ [[BLOCKSIZE]], [[WHILE_BODY_PREHEADER]] ]
	; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi float [ [[TMP13]], [[MIDDLE_BLOCK]] ], [ 0.000000e+00, [[WHILE_BODY_PREHEADER]] ]			; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi float [ [[RDX_START]], [[MIDDLE_BLOCK]] ], [ 0.000000e+00, [[WHILE_BODY_PREHEADER]] ]
	; CHECK-NEXT: br label [[WHILE_BODY:%.*]]			; CHECK-NEXT: br label [[WHILE_BODY:%.*]]
	; CHECK: while.body:			; CHECK: while.body:
	; CHECK-NEXT: [[PA_ADDR_020:%.]] = phi float [ [[INCDEC_PTR:%.]], [[IF_END:%.]] ], [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ]			; CHECK-NEXT: [[PA_ADDR_020:%.]] = phi float [ [[INCDEC_PTR:%.]], [[IF_END:%.]] ], [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ]
	; CHECK-NEXT: [[PB_ADDR_019:%.]] = phi float [ [[INCDEC_PTR1:%.*]], [[IF_END]] ], [ [[BC_RESUME_VAL2]], [[SCALAR_PH]] ]			; CHECK-NEXT: [[PB_ADDR_019:%.]] = phi float [ [[INCDEC_PTR1:%.*]], [[IF_END]] ], [ [[BC_RESUME_VAL2]], [[SCALAR_PH]] ]
	; CHECK-NEXT: [[BLOCKSIZE_ADDR_018:%.]] = phi i32 [ [[DEC:%.]], [[IF_END]] ], [ [[BC_RESUME_VAL4]], [[SCALAR_PH]] ]			; CHECK-NEXT: [[BLOCKSIZE_ADDR_018:%.]] = phi i32 [ [[DEC:%.]], [[IF_END]] ], [ [[BC_RESUME_VAL4]], [[SCALAR_PH]] ]
	; CHECK-NEXT: [[ACCUM_017:%.]] = phi float [ [[ACCUM_1:%.]], [[IF_END]] ], [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ]			; CHECK-NEXT: [[ACCUM_017:%.]] = phi float [ [[ACCUM_1:%.]], [[IF_END]] ], [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ]
	; CHECK-NEXT: [[INCDEC_PTR]] = getelementptr inbounds float, float* [[PA_ADDR_020]], i32 1			; CHECK-NEXT: [[INCDEC_PTR]] = getelementptr inbounds float, float* [[PA_ADDR_020]], i32 1
	; CHECK-NEXT: [[TMP14:%.]] = load float, float [[PA_ADDR_020]], align 4			; CHECK-NEXT: [[TMP14:%.]] = load float, float [[PA_ADDR_020]], align 4
	Show All 13 Lines
	; CHECK-NEXT: [[ADD4:%.*]] = fadd fast float [[DIV]], [[ACCUM_017]]			; CHECK-NEXT: [[ADD4:%.*]] = fadd fast float [[DIV]], [[ACCUM_017]]
	; CHECK-NEXT: br label [[IF_END]]			; CHECK-NEXT: br label [[IF_END]]
	; CHECK: if.end:			; CHECK: if.end:
	; CHECK-NEXT: [[ACCUM_1]] = phi float [ [[ADD4]], [[IF_THEN]] ], [ [[ACCUM_017]], [[WHILE_BODY]] ]			; CHECK-NEXT: [[ACCUM_1]] = phi float [ [[ADD4]], [[IF_THEN]] ], [ [[ACCUM_017]], [[WHILE_BODY]] ]
	; CHECK-NEXT: [[DEC]] = add i32 [[BLOCKSIZE_ADDR_018]], -1			; CHECK-NEXT: [[DEC]] = add i32 [[BLOCKSIZE_ADDR_018]], -1
	; CHECK-NEXT: [[CMP_NOT:%.*]] = icmp eq i32 [[DEC]], 0			; CHECK-NEXT: [[CMP_NOT:%.*]] = icmp eq i32 [[DEC]], 0
	; CHECK-NEXT: br i1 [[CMP_NOT]], label [[WHILE_END]], label [[WHILE_BODY]], !llvm.loop [[LOOP2:![0-9]+]]			; CHECK-NEXT: br i1 [[CMP_NOT]], label [[WHILE_END]], label [[WHILE_BODY]], !llvm.loop [[LOOP2:![0-9]+]]
	; CHECK: while.end:			; CHECK: while.end:
	; CHECK-NEXT: [[ACCUM_0_LCSSA:%.]] = phi float [ 0.000000e+00, [[ENTRY:%.]] ], [ [[ACCUM_1]], [[IF_END]] ], [ [[TMP13]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[ACCUM_0_LCSSA:%.]] = phi float [ 0.000000e+00, [[ENTRY:%.]] ], [ [[ACCUM_1]], [[IF_END]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: ret float [[ACCUM_0_LCSSA]]			; CHECK-NEXT: ret float [[ACCUM_0_LCSSA]]
	;			;
	entry:			entry:
	%cmp.not16 = icmp eq i32 %blockSize, 0			%cmp.not16 = icmp eq i32 %blockSize, 0
	br i1 %cmp.not16, label %while.end, label %while.body			br i1 %cmp.not16, label %while.end, label %while.body

	while.body: ; preds = %entry, %if.end			while.body: ; preds = %entry, %if.end
	%pA.addr.020 = phi float* [ %incdec.ptr, %if.end ], [ %pA, %entry ]			%pA.addr.020 = phi float* [ %incdec.ptr, %if.end ], [ %pA, %entry ]
	Show All 36 Lines

llvm/test/Transforms/LoopVectorize/ARM/sphinx.ll

	Show All 33 Lines
	; CHECK-NEXT: [[ARRAYIDX113:%.]] = getelementptr inbounds float, float [[T7]], i32 [[T2]]			; CHECK-NEXT: [[ARRAYIDX113:%.]] = getelementptr inbounds float, float [[T7]], i32 [[T2]]
	; CHECK-NEXT: [[T8:%.]] = load float, float [[ARRAYIDX113]], align 4			; CHECK-NEXT: [[T8:%.]] = load float, float [[ARRAYIDX113]], align 4
	; CHECK-NEXT: [[CONV114:%.*]] = fpext float [[T8]] to double			; CHECK-NEXT: [[CONV114:%.*]] = fpext float [[T8]] to double
	; CHECK-NEXT: [[MIN_ITERS_CHECK:%.*]] = icmp ult i32 [[T]], 2			; CHECK-NEXT: [[MIN_ITERS_CHECK:%.*]] = icmp ult i32 [[T]], 2
	; CHECK-NEXT: br i1 [[MIN_ITERS_CHECK]], label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]			; CHECK-NEXT: br i1 [[MIN_ITERS_CHECK]], label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]
	; CHECK: vector.ph:			; CHECK: vector.ph:
	; CHECK-NEXT: [[N_MOD_VF:%.*]] = urem i32 [[T]], 2			; CHECK-NEXT: [[N_MOD_VF:%.*]] = urem i32 [[T]], 2
	; CHECK-NEXT: [[N_VEC:%.*]] = sub i32 [[T]], [[N_MOD_VF]]			; CHECK-NEXT: [[N_VEC:%.*]] = sub i32 [[T]], [[N_MOD_VF]]
	; CHECK-NEXT: [[TMP0:%.*]] = insertelement <2 x double> zeroinitializer, double [[CONV114]], i32 0
	; CHECK-NEXT: br label [[VECTOR_BODY:%.*]]			; CHECK-NEXT: br label [[VECTOR_BODY:%.*]]
	; CHECK: vector.body:			; CHECK: vector.body:
	; CHECK-NEXT: [[INDEX:%.]] = phi i32 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[VECTOR_BODY]] ]			; CHECK-NEXT: [[INDEX:%.]] = phi i32 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[VECTOR_BODY]] ]
	; CHECK-NEXT: [[VEC_PHI:%.]] = phi <2 x double> [ [[TMP0]], [[VECTOR_PH]] ], [ [[TMP16:%.]], [[VECTOR_BODY]] ]			; CHECK-NEXT: [[VEC_PHI:%.]] = phi <2 x double> [ zeroinitializer, [[VECTOR_PH]] ], [ [[TMP15:%.]], [[VECTOR_BODY]] ]
	; CHECK-NEXT: [[TMP1:%.*]] = add i32 [[INDEX]], 0			; CHECK-NEXT: [[TMP0:%.*]] = add i32 [[INDEX]], 0
	; CHECK-NEXT: [[TMP2:%.]] = getelementptr inbounds float, float [[X:%.*]], i32 [[TMP1]]			; CHECK-NEXT: [[TMP1:%.]] = getelementptr inbounds float, float [[X:%.*]], i32 [[TMP0]]
	; CHECK-NEXT: [[TMP3:%.]] = getelementptr inbounds float, float [[TMP2]], i32 0			; CHECK-NEXT: [[TMP2:%.]] = getelementptr inbounds float, float [[TMP1]], i32 0
	; CHECK-NEXT: [[TMP4:%.]] = bitcast float [[TMP3]] to <2 x float>*			; CHECK-NEXT: [[TMP3:%.]] = bitcast float [[TMP2]] to <2 x float>*
	; CHECK-NEXT: [[WIDE_LOAD:%.]] = load <2 x float>, <2 x float> [[TMP4]], align 4			; CHECK-NEXT: [[WIDE_LOAD:%.]] = load <2 x float>, <2 x float> [[TMP3]], align 4
	; CHECK-NEXT: [[TMP5:%.]] = getelementptr inbounds float, float [[T4]], i32 [[TMP1]]			; CHECK-NEXT: [[TMP4:%.]] = getelementptr inbounds float, float [[T4]], i32 [[TMP0]]
	; CHECK-NEXT: [[TMP6:%.]] = getelementptr inbounds float, float [[TMP5]], i32 0			; CHECK-NEXT: [[TMP5:%.]] = getelementptr inbounds float, float [[TMP4]], i32 0
	; CHECK-NEXT: [[TMP7:%.]] = bitcast float [[TMP6]] to <2 x float>*			; CHECK-NEXT: [[TMP6:%.]] = bitcast float [[TMP5]] to <2 x float>*
	; CHECK-NEXT: [[WIDE_LOAD1:%.]] = load <2 x float>, <2 x float> [[TMP7]], align 4			; CHECK-NEXT: [[WIDE_LOAD1:%.]] = load <2 x float>, <2 x float> [[TMP6]], align 4
	; CHECK-NEXT: [[TMP8:%.*]] = fsub fast <2 x float> [[WIDE_LOAD]], [[WIDE_LOAD1]]			; CHECK-NEXT: [[TMP7:%.*]] = fsub fast <2 x float> [[WIDE_LOAD]], [[WIDE_LOAD1]]
	; CHECK-NEXT: [[TMP9:%.*]] = fpext <2 x float> [[TMP8]] to <2 x double>			; CHECK-NEXT: [[TMP8:%.*]] = fpext <2 x float> [[TMP7]] to <2 x double>
	; CHECK-NEXT: [[TMP10:%.*]] = fmul fast <2 x double> [[TMP9]], [[TMP9]]			; CHECK-NEXT: [[TMP9:%.*]] = fmul fast <2 x double> [[TMP8]], [[TMP8]]
	; CHECK-NEXT: [[TMP11:%.]] = getelementptr inbounds float, float [[T6]], i32 [[TMP1]]			; CHECK-NEXT: [[TMP10:%.]] = getelementptr inbounds float, float [[T6]], i32 [[TMP0]]
	; CHECK-NEXT: [[TMP12:%.]] = getelementptr inbounds float, float [[TMP11]], i32 0			; CHECK-NEXT: [[TMP11:%.]] = getelementptr inbounds float, float [[TMP10]], i32 0
	; CHECK-NEXT: [[TMP13:%.]] = bitcast float [[TMP12]] to <2 x float>*			; CHECK-NEXT: [[TMP12:%.]] = bitcast float [[TMP11]] to <2 x float>*
	; CHECK-NEXT: [[WIDE_LOAD2:%.]] = load <2 x float>, <2 x float> [[TMP13]], align 4			; CHECK-NEXT: [[WIDE_LOAD2:%.]] = load <2 x float>, <2 x float> [[TMP12]], align 4
	; CHECK-NEXT: [[TMP14:%.*]] = fpext <2 x float> [[WIDE_LOAD2]] to <2 x double>			; CHECK-NEXT: [[TMP13:%.*]] = fpext <2 x float> [[WIDE_LOAD2]] to <2 x double>
	; CHECK-NEXT: [[TMP15:%.*]] = fmul fast <2 x double> [[TMP10]], [[TMP14]]			; CHECK-NEXT: [[TMP14:%.*]] = fmul fast <2 x double> [[TMP9]], [[TMP13]]
	; CHECK-NEXT: [[TMP16]] = fsub fast <2 x double> [[VEC_PHI]], [[TMP15]]			; CHECK-NEXT: [[TMP15]] = fsub fast <2 x double> [[VEC_PHI]], [[TMP14]]
	; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i32 [[INDEX]], 2			; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i32 [[INDEX]], 2
	; CHECK-NEXT: [[TMP17:%.*]] = icmp eq i32 [[INDEX_NEXT]], [[N_VEC]]			; CHECK-NEXT: [[TMP16:%.*]] = icmp eq i32 [[INDEX_NEXT]], [[N_VEC]]
	; CHECK-NEXT: br i1 [[TMP17]], label [[MIDDLE_BLOCK:%.]], label [[VECTOR_BODY]], [[LOOP0:!llvm.loop !.]]			; CHECK-NEXT: br i1 [[TMP16]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP0:![0-9]+]]
	; CHECK: middle.block:			; CHECK: middle.block:
	; CHECK-NEXT: [[TMP18:%.*]] = call fast double @llvm.vector.reduce.fadd.v2f64(double -0.000000e+00, <2 x double> [[TMP16]])			; CHECK-NEXT: [[TMP17:%.*]] = call fast double @llvm.vector.reduce.fadd.v2f64(double -0.000000e+00, <2 x double> [[TMP15]])
				; CHECK-NEXT: [[RDX_START:%.*]] = fadd double [[CONV114]], [[TMP17]]
	; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i32 [[T]], [[N_VEC]]			; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i32 [[T]], [[N_VEC]]
	; CHECK-NEXT: br i1 [[CMP_N]], label [[OUTEREND]], label [[SCALAR_PH]]			; CHECK-NEXT: br i1 [[CMP_N]], label [[OUTEREND]], label [[SCALAR_PH]]
	; CHECK: scalar.ph:			; CHECK: scalar.ph:
	; CHECK-NEXT: [[BC_RESUME_VAL:%.*]] = phi i32 [ [[N_VEC]], [[MIDDLE_BLOCK]] ], [ 0, [[OUTERLOOP]] ]			; CHECK-NEXT: [[BC_RESUME_VAL:%.*]] = phi i32 [ [[N_VEC]], [[MIDDLE_BLOCK]] ], [ 0, [[OUTERLOOP]] ]
	; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi double [ [[CONV114]], [[OUTERLOOP]] ], [ [[TMP18]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi double [ [[CONV114]], [[OUTERLOOP]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: br label [[INNERLOOP:%.*]]			; CHECK-NEXT: br label [[INNERLOOP:%.*]]
	; CHECK: innerloop:			; CHECK: innerloop:
	; CHECK-NEXT: [[I_2132:%.]] = phi i32 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[INC129:%.]], [[INNERLOOP]] ]			; CHECK-NEXT: [[I_2132:%.]] = phi i32 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[INC129:%.]], [[INNERLOOP]] ]
	; CHECK-NEXT: [[DVAL1_4131:%.]] = phi double [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[SUB127:%.]], [[INNERLOOP]] ]			; CHECK-NEXT: [[DVAL1_4131:%.]] = phi double [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[SUB127:%.]], [[INNERLOOP]] ]
	; CHECK-NEXT: [[ARRAYIDX119:%.]] = getelementptr inbounds float, float [[X]], i32 [[I_2132]]			; CHECK-NEXT: [[ARRAYIDX119:%.]] = getelementptr inbounds float, float [[X]], i32 [[I_2132]]
	; CHECK-NEXT: [[T9:%.]] = load float, float [[ARRAYIDX119]], align 4			; CHECK-NEXT: [[T9:%.]] = load float, float [[ARRAYIDX119]], align 4
	; CHECK-NEXT: [[ARRAYIDX120:%.]] = getelementptr inbounds float, float [[T4]], i32 [[I_2132]]			; CHECK-NEXT: [[ARRAYIDX120:%.]] = getelementptr inbounds float, float [[T4]], i32 [[I_2132]]
	; CHECK-NEXT: [[T10:%.]] = load float, float [[ARRAYIDX120]], align 4			; CHECK-NEXT: [[T10:%.]] = load float, float [[ARRAYIDX120]], align 4
	; CHECK-NEXT: [[SUB121:%.*]] = fsub fast float [[T9]], [[T10]]			; CHECK-NEXT: [[SUB121:%.*]] = fsub fast float [[T9]], [[T10]]
	; CHECK-NEXT: [[CONV122:%.*]] = fpext float [[SUB121]] to double			; CHECK-NEXT: [[CONV122:%.*]] = fpext float [[SUB121]] to double
	; CHECK-NEXT: [[MUL123:%.*]] = fmul fast double [[CONV122]], [[CONV122]]			; CHECK-NEXT: [[MUL123:%.*]] = fmul fast double [[CONV122]], [[CONV122]]
	; CHECK-NEXT: [[ARRAYIDX124:%.]] = getelementptr inbounds float, float [[T6]], i32 [[I_2132]]			; CHECK-NEXT: [[ARRAYIDX124:%.]] = getelementptr inbounds float, float [[T6]], i32 [[I_2132]]
	; CHECK-NEXT: [[T11:%.]] = load float, float [[ARRAYIDX124]], align 4			; CHECK-NEXT: [[T11:%.]] = load float, float [[ARRAYIDX124]], align 4
	; CHECK-NEXT: [[CONV125:%.*]] = fpext float [[T11]] to double			; CHECK-NEXT: [[CONV125:%.*]] = fpext float [[T11]] to double
	; CHECK-NEXT: [[MUL126:%.*]] = fmul fast double [[MUL123]], [[CONV125]]			; CHECK-NEXT: [[MUL126:%.*]] = fmul fast double [[MUL123]], [[CONV125]]
	; CHECK-NEXT: [[SUB127]] = fsub fast double [[DVAL1_4131]], [[MUL126]]			; CHECK-NEXT: [[SUB127]] = fsub fast double [[DVAL1_4131]], [[MUL126]]
	; CHECK-NEXT: [[INC129]] = add nuw nsw i32 [[I_2132]], 1			; CHECK-NEXT: [[INC129]] = add nuw nsw i32 [[I_2132]], 1
	; CHECK-NEXT: [[EXITCOND143:%.*]] = icmp eq i32 [[INC129]], [[T]]			; CHECK-NEXT: [[EXITCOND143:%.*]] = icmp eq i32 [[INC129]], [[T]]
	; CHECK-NEXT: br i1 [[EXITCOND143]], label [[OUTEREND]], label [[INNERLOOP]], [[LOOP2:!llvm.loop !.*]]			; CHECK-NEXT: br i1 [[EXITCOND143]], label [[OUTEREND]], label [[INNERLOOP]], !llvm.loop [[LOOP2:![0-9]+]]
	; CHECK: outerend:			; CHECK: outerend:
	; CHECK-NEXT: [[SUB127_LCSSA:%.*]] = phi double [ [[SUB127]], [[INNERLOOP]] ], [ [[TMP18]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[SUB127_LCSSA:%.*]] = phi double [ [[SUB127]], [[INNERLOOP]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: [[CONV138:%.*]] = fptosi double [[SUB127_LCSSA]] to i32			; CHECK-NEXT: [[CONV138:%.*]] = fptosi double [[SUB127_LCSSA]] to i32
	; CHECK-NEXT: [[CALL142]] = add nuw nsw i32 [[SCORE_1135]], [[CONV138]]			; CHECK-NEXT: [[CALL142]] = add nuw nsw i32 [[SCORE_1135]], [[CONV138]]
	; CHECK-NEXT: [[INC144]] = add nuw nsw i32 [[J_0136]], 1			; CHECK-NEXT: [[INC144]] = add nuw nsw i32 [[J_0136]], 1
	; CHECK-NEXT: [[ARRAYIDX102:%.]] = getelementptr inbounds i32, i32 @a, i32 [[INC144]]			; CHECK-NEXT: [[ARRAYIDX102:%.]] = getelementptr inbounds i32, i32 @a, i32 [[INC144]]
	; CHECK-NEXT: [[V17]] = load i32, i32* [[ARRAYIDX102]], align 4			; CHECK-NEXT: [[V17]] = load i32, i32* [[ARRAYIDX102]], align 4
	; CHECK-NEXT: [[CMP103:%.*]] = icmp sgt i32 [[V17]], -1			; CHECK-NEXT: [[CMP103:%.*]] = icmp sgt i32 [[V17]], -1
	; CHECK-NEXT: br i1 [[CMP103]], label [[OUTERLOOP]], label [[EXIT:%.*]]			; CHECK-NEXT: br i1 [[CMP103]], label [[OUTERLOOP]], label [[EXIT:%.*]]
	; CHECK: exit:			; CHECK: exit:
	▲ Show 20 Lines • Show All 56 Lines • Show Last 20 Lines

llvm/test/Transforms/LoopVectorize/PowerPC/widened-massv-call.ll

	Show All 17 Lines
	; CHECK-NEXT: [[TMP4:%.*]] = tail call fast <2 x double> @__sind2(<2 x double> [[TMP3]])			; CHECK-NEXT: [[TMP4:%.*]] = tail call fast <2 x double> @__sind2(<2 x double> [[TMP3]])
	; CHECK-NEXT: [[TMP5]] = fadd fast <2 x double> [[TMP4]], [[VEC_PHI]]			; CHECK-NEXT: [[TMP5]] = fadd fast <2 x double> [[TMP4]], [[VEC_PHI]]
	; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i32 [[INDEX]], 2			; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i32 [[INDEX]], 2
	; CHECK-NEXT: [[TMP6:%.*]] = icmp eq i32 [[INDEX_NEXT]], 128			; CHECK-NEXT: [[TMP6:%.*]] = icmp eq i32 [[INDEX_NEXT]], 128
	; CHECK-NEXT: br i1 [[TMP6]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP0:![0-9]+]]			; CHECK-NEXT: br i1 [[TMP6]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP0:![0-9]+]]
	; CHECK: middle.block:			; CHECK: middle.block:
	; CHECK-NEXT: [[DOTLCSSA:%.*]] = phi <2 x double> [ [[TMP5]], [[VECTOR_BODY]] ]			; CHECK-NEXT: [[DOTLCSSA:%.*]] = phi <2 x double> [ [[TMP5]], [[VECTOR_BODY]] ]
	; CHECK-NEXT: [[TMP7:%.*]] = tail call fast double @llvm.vector.reduce.fadd.v2f64(double -0.000000e+00, <2 x double> [[DOTLCSSA]])			; CHECK-NEXT: [[TMP7:%.*]] = tail call fast double @llvm.vector.reduce.fadd.v2f64(double -0.000000e+00, <2 x double> [[DOTLCSSA]])
	; CHECK-NEXT: ret double [[TMP7]]			; CHECK-NEXT: [[RDX_START:%.*]] = fadd double [[TMP7]], 0.000000e+00
				; CHECK-NEXT: ret double [[RDX_START]]
	;			;
	entry:			entry:
	br label %for.cond			br label %for.cond

	for.cond:			for.cond:
	%Sum.0 = phi double [ 0.000000e+00, %entry ], [ %add, %for.inc ]			%Sum.0 = phi double [ 0.000000e+00, %entry ], [ %add, %for.inc ]
	%i.0 = phi i32 [ 0, %entry ], [ %inc, %for.inc ]			%i.0 = phi i32 [ 0, %entry ], [ %inc, %for.inc ]
	%cmp = icmp slt i32 %i.0, 128			%cmp = icmp slt i32 %i.0, 128
	Show All 23 Lines

llvm/test/Transforms/LoopVectorize/PowerPC/widened-massv-vfabi-attr.ll

	Show All 15 Lines
	; CHECK-NEXT: [[TMP3:%.*]] = fpext <2 x float> [[WIDE_LOAD]] to <2 x double>			; CHECK-NEXT: [[TMP3:%.*]] = fpext <2 x float> [[WIDE_LOAD]] to <2 x double>
	; CHECK-NEXT: [[TMP4:%.*]] = call fast <2 x double> @__sind2_P8(<2 x double> [[TMP3]])			; CHECK-NEXT: [[TMP4:%.*]] = call fast <2 x double> @__sind2_P8(<2 x double> [[TMP3]])
	; CHECK-NEXT: [[TMP5]] = fadd fast <2 x double> [[VEC_PHI]], [[TMP4]]			; CHECK-NEXT: [[TMP5]] = fadd fast <2 x double> [[VEC_PHI]], [[TMP4]]
	; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i32 [[INDEX]], 2			; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i32 [[INDEX]], 2
	; CHECK-NEXT: [[TMP6:%.*]] = icmp eq i32 [[INDEX_NEXT]], 128			; CHECK-NEXT: [[TMP6:%.*]] = icmp eq i32 [[INDEX_NEXT]], 128
	; CHECK-NEXT: br i1 [[TMP6]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP0:![0-9]+]]			; CHECK-NEXT: br i1 [[TMP6]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP0:![0-9]+]]
	; CHECK: middle.block:			; CHECK: middle.block:
	; CHECK-NEXT: [[TMP7:%.*]] = call fast double @llvm.vector.reduce.fadd.v2f64(double -0.000000e+00, <2 x double> [[TMP5]])			; CHECK-NEXT: [[TMP7:%.*]] = call fast double @llvm.vector.reduce.fadd.v2f64(double -0.000000e+00, <2 x double> [[TMP5]])
	; CHECK-NEXT: ret double [[TMP7]]			; CHECK-NEXT: [[RDX_START:%.*]] = fadd double [[TMP7]], 0.000000e+00
				; CHECK-NEXT: ret double [[RDX_START]]
	;			;
	entry:			entry:
	br label %for.cond			br label %for.cond

	for.cond:			for.cond:
	%Sum.0 = phi double [ 0.000000e+00, %entry ], [ %add, %for.inc ]			%Sum.0 = phi double [ 0.000000e+00, %entry ], [ %add, %for.inc ]
	%i.0 = phi i32 [ 0, %entry ], [ %inc, %for.inc ]			%i.0 = phi i32 [ 0, %entry ], [ %inc, %for.inc ]
	%cmp = icmp slt i32 %i.0, 128			%cmp = icmp slt i32 %i.0, 128
	Show All 26 Lines

llvm/test/Transforms/LoopVectorize/RISCV/defaults.ll

	Show First 20 Lines • Show All 89 Lines • ▼ Show 20 Lines
	; CHECK-NEXT: [[WIDE_LOAD:%.*]] = load <vscale x 1 x i64>, ptr [[TMP4]], align 8			; CHECK-NEXT: [[WIDE_LOAD:%.*]] = load <vscale x 1 x i64>, ptr [[TMP4]], align 8
	; CHECK-NEXT: [[TMP5]] = add <vscale x 1 x i64> [[VEC_PHI]], [[WIDE_LOAD]]			; CHECK-NEXT: [[TMP5]] = add <vscale x 1 x i64> [[VEC_PHI]], [[WIDE_LOAD]]
	; CHECK-NEXT: [[TMP6:%.*]] = call i64 @llvm.vscale.i64()			; CHECK-NEXT: [[TMP6:%.*]] = call i64 @llvm.vscale.i64()
	; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], [[TMP6]]			; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], [[TMP6]]
	; CHECK-NEXT: [[TMP7:%.*]] = icmp eq i64 [[INDEX_NEXT]], [[N_VEC]]			; CHECK-NEXT: [[TMP7:%.*]] = icmp eq i64 [[INDEX_NEXT]], [[N_VEC]]
	; CHECK-NEXT: br i1 [[TMP7]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP4:![0-9]+]]			; CHECK-NEXT: br i1 [[TMP7]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP4:![0-9]+]]
	; CHECK: middle.block:			; CHECK: middle.block:
	; CHECK-NEXT: [[TMP8:%.*]] = call i64 @llvm.vector.reduce.add.nxv1i64(<vscale x 1 x i64> [[TMP5]])			; CHECK-NEXT: [[TMP8:%.*]] = call i64 @llvm.vector.reduce.add.nxv1i64(<vscale x 1 x i64> [[TMP5]])
				; CHECK-NEXT: [[RDX_START:%.*]] = add i64 0, [[TMP8]]
	; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i64 1024, [[N_VEC]]			; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i64 1024, [[N_VEC]]
	; CHECK-NEXT: br i1 [[CMP_N]], label [[FOR_END:%.*]], label [[SCALAR_PH]]			; CHECK-NEXT: br i1 [[CMP_N]], label [[FOR_END:%.*]], label [[SCALAR_PH]]
	; CHECK: scalar.ph:			; CHECK: scalar.ph:
	; CHECK-NEXT: [[BC_RESUME_VAL:%.]] = phi i64 [ [[N_VEC]], [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY:%.]] ]			; CHECK-NEXT: [[BC_RESUME_VAL:%.]] = phi i64 [ [[N_VEC]], [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY:%.]] ]
	; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i64 [ 0, [[ENTRY]] ], [ [[TMP8]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i64 [ 0, [[ENTRY]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: br label [[FOR_BODY:%.*]]			; CHECK-NEXT: br label [[FOR_BODY:%.*]]
	; CHECK: for.body:			; CHECK: for.body:
	; CHECK-NEXT: [[IV:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[IV_NEXT:%.]], [[FOR_BODY]] ]			; CHECK-NEXT: [[IV:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[IV_NEXT:%.]], [[FOR_BODY]] ]
	; CHECK-NEXT: [[SUM:%.]] = phi i64 [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[SUM_NEXT:%.]], [[FOR_BODY]] ]			; CHECK-NEXT: [[SUM:%.]] = phi i64 [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[SUM_NEXT:%.]], [[FOR_BODY]] ]
	; CHECK-NEXT: [[ARRAYIDX:%.*]] = getelementptr inbounds i64, ptr [[A]], i64 [[IV]]			; CHECK-NEXT: [[ARRAYIDX:%.*]] = getelementptr inbounds i64, ptr [[A]], i64 [[IV]]
	; CHECK-NEXT: [[ELEM:%.*]] = load i64, ptr [[ARRAYIDX]], align 8			; CHECK-NEXT: [[ELEM:%.*]] = load i64, ptr [[ARRAYIDX]], align 8
	; CHECK-NEXT: [[IV_NEXT]] = add nuw nsw i64 [[IV]], 1			; CHECK-NEXT: [[IV_NEXT]] = add nuw nsw i64 [[IV]], 1
	; CHECK-NEXT: [[SUM_NEXT]] = add i64 [[SUM]], [[ELEM]]			; CHECK-NEXT: [[SUM_NEXT]] = add i64 [[SUM]], [[ELEM]]
	; CHECK-NEXT: [[EXITCOND_NOT:%.*]] = icmp eq i64 [[IV_NEXT]], 1024			; CHECK-NEXT: [[EXITCOND_NOT:%.*]] = icmp eq i64 [[IV_NEXT]], 1024
	; CHECK-NEXT: br i1 [[EXITCOND_NOT]], label [[FOR_END]], label [[FOR_BODY]], !llvm.loop [[LOOP5:![0-9]+]]			; CHECK-NEXT: br i1 [[EXITCOND_NOT]], label [[FOR_END]], label [[FOR_BODY]], !llvm.loop [[LOOP5:![0-9]+]]
	; CHECK: for.end:			; CHECK: for.end:
	; CHECK-NEXT: [[SUM_NEXT_LCSSA:%.*]] = phi i64 [ [[SUM_NEXT]], [[FOR_BODY]] ], [ [[TMP8]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[SUM_NEXT_LCSSA:%.*]] = phi i64 [ [[SUM_NEXT]], [[FOR_BODY]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: ret i64 [[SUM_NEXT_LCSSA]]			; CHECK-NEXT: ret i64 [[SUM_NEXT_LCSSA]]
	;			;
	entry:			entry:
	br label %for.body			br label %for.body

	for.body:			for.body:
	%iv = phi i64 [0, %entry], [%iv.next, %for.body]			%iv = phi i64 [0, %entry], [%iv.next, %for.body]
	%sum = phi i64 [0, %entry], [%sum.next, %for.body]			%sum = phi i64 [0, %entry], [%sum.next, %for.body]
	Show All 11 Lines

llvm/test/Transforms/LoopVectorize/RISCV/inloop-reduction.ll

	Show First 20 Lines • Show All 48 Lines • ▼ Show 20 Lines
	; OUTLOOP-NEXT: [[TMP22:%.*]] = call i32 @llvm.vscale.i32()			; OUTLOOP-NEXT: [[TMP22:%.*]] = call i32 @llvm.vscale.i32()
	; OUTLOOP-NEXT: [[TMP23:%.*]] = mul i32 [[TMP22]], 4			; OUTLOOP-NEXT: [[TMP23:%.*]] = mul i32 [[TMP22]], 4
	; OUTLOOP-NEXT: [[INDEX_NEXT]] = add nuw i32 [[INDEX]], [[TMP23]]			; OUTLOOP-NEXT: [[INDEX_NEXT]] = add nuw i32 [[INDEX]], [[TMP23]]
	; OUTLOOP-NEXT: [[TMP24:%.*]] = icmp eq i32 [[INDEX_NEXT]], [[N_VEC]]			; OUTLOOP-NEXT: [[TMP24:%.*]] = icmp eq i32 [[INDEX_NEXT]], [[N_VEC]]
	; OUTLOOP-NEXT: br i1 [[TMP24]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP0:![0-9]+]]			; OUTLOOP-NEXT: br i1 [[TMP24]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP0:![0-9]+]]
	; OUTLOOP: middle.block:			; OUTLOOP: middle.block:
	; OUTLOOP-NEXT: [[BIN_RDX:%.*]] = add <vscale x 2 x i32> [[TMP21]], [[TMP20]]			; OUTLOOP-NEXT: [[BIN_RDX:%.*]] = add <vscale x 2 x i32> [[TMP21]], [[TMP20]]
	; OUTLOOP-NEXT: [[TMP25:%.*]] = call i32 @llvm.vector.reduce.add.nxv2i32(<vscale x 2 x i32> [[BIN_RDX]])			; OUTLOOP-NEXT: [[TMP25:%.*]] = call i32 @llvm.vector.reduce.add.nxv2i32(<vscale x 2 x i32> [[BIN_RDX]])
				; OUTLOOP-NEXT: [[RDX_START:%.*]] = add i32 0, [[TMP25]]
	; OUTLOOP-NEXT: [[CMP_N:%.*]] = icmp eq i32 [[N]], [[N_VEC]]			; OUTLOOP-NEXT: [[CMP_N:%.*]] = icmp eq i32 [[N]], [[N_VEC]]
	; OUTLOOP-NEXT: br i1 [[CMP_N]], label [[FOR_COND_CLEANUP_LOOPEXIT:%.*]], label [[SCALAR_PH]]			; OUTLOOP-NEXT: br i1 [[CMP_N]], label [[FOR_COND_CLEANUP_LOOPEXIT:%.*]], label [[SCALAR_PH]]
	; OUTLOOP: scalar.ph:			; OUTLOOP: scalar.ph:
	; OUTLOOP-NEXT: [[BC_RESUME_VAL:%.*]] = phi i32 [ [[N_VEC]], [[MIDDLE_BLOCK]] ], [ 0, [[FOR_BODY_PREHEADER]] ]			; OUTLOOP-NEXT: [[BC_RESUME_VAL:%.*]] = phi i32 [ [[N_VEC]], [[MIDDLE_BLOCK]] ], [ 0, [[FOR_BODY_PREHEADER]] ]
	; OUTLOOP-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 0, [[FOR_BODY_PREHEADER]] ], [ [[TMP25]], [[MIDDLE_BLOCK]] ]			; OUTLOOP-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 0, [[FOR_BODY_PREHEADER]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; OUTLOOP-NEXT: br label [[FOR_BODY:%.*]]			; OUTLOOP-NEXT: br label [[FOR_BODY:%.*]]
	; OUTLOOP: for.body:			; OUTLOOP: for.body:
	; OUTLOOP-NEXT: [[I_08:%.]] = phi i32 [ [[INC:%.]], [[FOR_BODY]] ], [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ]			; OUTLOOP-NEXT: [[I_08:%.]] = phi i32 [ [[INC:%.]], [[FOR_BODY]] ], [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ]
	; OUTLOOP-NEXT: [[R_07:%.]] = phi i32 [ [[ADD:%.]], [[FOR_BODY]] ], [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ]			; OUTLOOP-NEXT: [[R_07:%.]] = phi i32 [ [[ADD:%.]], [[FOR_BODY]] ], [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ]
	; OUTLOOP-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds i16, i16 [[X]], i32 [[I_08]]			; OUTLOOP-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds i16, i16 [[X]], i32 [[I_08]]
	; OUTLOOP-NEXT: [[TMP26:%.]] = load i16, i16 [[ARRAYIDX]], align 2			; OUTLOOP-NEXT: [[TMP26:%.]] = load i16, i16 [[ARRAYIDX]], align 2
	; OUTLOOP-NEXT: [[CONV:%.*]] = sext i16 [[TMP26]] to i32			; OUTLOOP-NEXT: [[CONV:%.*]] = sext i16 [[TMP26]] to i32
	; OUTLOOP-NEXT: [[ADD]] = add nsw i32 [[R_07]], [[CONV]]			; OUTLOOP-NEXT: [[ADD]] = add nsw i32 [[R_07]], [[CONV]]
	; OUTLOOP-NEXT: [[INC]] = add nuw nsw i32 [[I_08]], 1			; OUTLOOP-NEXT: [[INC]] = add nuw nsw i32 [[I_08]], 1
	; OUTLOOP-NEXT: [[EXITCOND:%.*]] = icmp eq i32 [[INC]], [[N]]			; OUTLOOP-NEXT: [[EXITCOND:%.*]] = icmp eq i32 [[INC]], [[N]]
	; OUTLOOP-NEXT: br i1 [[EXITCOND]], label [[FOR_COND_CLEANUP_LOOPEXIT]], label [[FOR_BODY]], !llvm.loop [[LOOP2:![0-9]+]]			; OUTLOOP-NEXT: br i1 [[EXITCOND]], label [[FOR_COND_CLEANUP_LOOPEXIT]], label [[FOR_BODY]], !llvm.loop [[LOOP2:![0-9]+]]
	; OUTLOOP: for.cond.cleanup.loopexit:			; OUTLOOP: for.cond.cleanup.loopexit:
	; OUTLOOP-NEXT: [[ADD_LCSSA:%.*]] = phi i32 [ [[ADD]], [[FOR_BODY]] ], [ [[TMP25]], [[MIDDLE_BLOCK]] ]			; OUTLOOP-NEXT: [[ADD_LCSSA:%.*]] = phi i32 [ [[ADD]], [[FOR_BODY]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; OUTLOOP-NEXT: br label [[FOR_COND_CLEANUP]]			; OUTLOOP-NEXT: br label [[FOR_COND_CLEANUP]]
	; OUTLOOP: for.cond.cleanup:			; OUTLOOP: for.cond.cleanup:
	; OUTLOOP-NEXT: [[R_0_LCSSA:%.]] = phi i32 [ 0, [[ENTRY:%.]] ], [ [[ADD_LCSSA]], [[FOR_COND_CLEANUP_LOOPEXIT]] ]			; OUTLOOP-NEXT: [[R_0_LCSSA:%.]] = phi i32 [ 0, [[ENTRY:%.]] ], [ [[ADD_LCSSA]], [[FOR_COND_CLEANUP_LOOPEXIT]] ]
	; OUTLOOP-NEXT: ret i32 [[R_0_LCSSA]]			; OUTLOOP-NEXT: ret i32 [[R_0_LCSSA]]
	;			;
	; INLOOP-LABEL: @add_i16_i32(			; INLOOP-LABEL: @add_i16_i32(
	; INLOOP-NEXT: entry:			; INLOOP-NEXT: entry:
	; INLOOP-NEXT: [[CMP6:%.]] = icmp sgt i32 [[N:%.]], 0			; INLOOP-NEXT: [[CMP6:%.]] = icmp sgt i32 [[N:%.]], 0
	▲ Show 20 Lines • Show All 87 Lines • Show Last 20 Lines

llvm/test/Transforms/LoopVectorize/RISCV/scalable-basics.ll

	Show First 20 Lines • Show All 440 Lines • ▼ Show 20 Lines
	; VLENUNK-NEXT: [[WIDE_MASKED_GATHER:%.*]] = call <vscale x 1 x i64> @llvm.masked.gather.nxv1i64.nxv1p0(<vscale x 1 x ptr> [[TMP5]], i32 8, <vscale x 1 x i1> shufflevector (<vscale x 1 x i1> insertelement (<vscale x 1 x i1> poison, i1 true, i32 0), <vscale x 1 x i1> poison, <vscale x 1 x i32> zeroinitializer), <vscale x 1 x i64> poison)			; VLENUNK-NEXT: [[WIDE_MASKED_GATHER:%.*]] = call <vscale x 1 x i64> @llvm.masked.gather.nxv1i64.nxv1p0(<vscale x 1 x ptr> [[TMP5]], i32 8, <vscale x 1 x i1> shufflevector (<vscale x 1 x i1> insertelement (<vscale x 1 x i1> poison, i1 true, i32 0), <vscale x 1 x i1> poison, <vscale x 1 x i32> zeroinitializer), <vscale x 1 x i64> poison)
	; VLENUNK-NEXT: [[TMP6]] = add <vscale x 1 x i64> [[VEC_PHI]], [[WIDE_MASKED_GATHER]]			; VLENUNK-NEXT: [[TMP6]] = add <vscale x 1 x i64> [[VEC_PHI]], [[WIDE_MASKED_GATHER]]
	; VLENUNK-NEXT: [[TMP7:%.*]] = call i64 @llvm.vscale.i64()			; VLENUNK-NEXT: [[TMP7:%.*]] = call i64 @llvm.vscale.i64()
	; VLENUNK-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], [[TMP7]]			; VLENUNK-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], [[TMP7]]
	; VLENUNK-NEXT: [[TMP8:%.*]] = icmp eq i64 [[INDEX_NEXT]], [[N_VEC]]			; VLENUNK-NEXT: [[TMP8:%.*]] = icmp eq i64 [[INDEX_NEXT]], [[N_VEC]]
	; VLENUNK-NEXT: br i1 [[TMP8]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP8:![0-9]+]]			; VLENUNK-NEXT: br i1 [[TMP8]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP8:![0-9]+]]
	; VLENUNK: middle.block:			; VLENUNK: middle.block:
	; VLENUNK-NEXT: [[TMP9:%.*]] = call i64 @llvm.vector.reduce.add.nxv1i64(<vscale x 1 x i64> [[TMP6]])			; VLENUNK-NEXT: [[TMP9:%.*]] = call i64 @llvm.vector.reduce.add.nxv1i64(<vscale x 1 x i64> [[TMP6]])
				; VLENUNK-NEXT: [[RDX_START:%.*]] = add i64 0, [[TMP9]]
	; VLENUNK-NEXT: [[CMP_N:%.*]] = icmp eq i64 1024, [[N_VEC]]			; VLENUNK-NEXT: [[CMP_N:%.*]] = icmp eq i64 1024, [[N_VEC]]
	; VLENUNK-NEXT: br i1 [[CMP_N]], label [[FOR_END:%.*]], label [[SCALAR_PH]]			; VLENUNK-NEXT: br i1 [[CMP_N]], label [[FOR_END:%.*]], label [[SCALAR_PH]]
	; VLENUNK: scalar.ph:			; VLENUNK: scalar.ph:
	; VLENUNK-NEXT: [[BC_RESUME_VAL:%.]] = phi i64 [ [[N_VEC]], [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY:%.]] ]			; VLENUNK-NEXT: [[BC_RESUME_VAL:%.]] = phi i64 [ [[N_VEC]], [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY:%.]] ]
	; VLENUNK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i64 [ 0, [[ENTRY]] ], [ [[TMP9]], [[MIDDLE_BLOCK]] ]			; VLENUNK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i64 [ 0, [[ENTRY]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; VLENUNK-NEXT: br label [[FOR_BODY:%.*]]			; VLENUNK-NEXT: br label [[FOR_BODY:%.*]]
	; VLENUNK: for.body:			; VLENUNK: for.body:
	; VLENUNK-NEXT: [[IV:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[IV_NEXT:%.]], [[FOR_BODY]] ]			; VLENUNK-NEXT: [[IV:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[IV_NEXT:%.]], [[FOR_BODY]] ]
	; VLENUNK-NEXT: [[SUM:%.]] = phi i64 [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[SUM_NEXT:%.]], [[FOR_BODY]] ]			; VLENUNK-NEXT: [[SUM:%.]] = phi i64 [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[SUM_NEXT:%.]], [[FOR_BODY]] ]
	; VLENUNK-NEXT: [[BADDR:%.*]] = getelementptr inbounds i64, ptr [[B]], i64 [[IV]]			; VLENUNK-NEXT: [[BADDR:%.*]] = getelementptr inbounds i64, ptr [[B]], i64 [[IV]]
	; VLENUNK-NEXT: [[AIDX:%.*]] = load i64, ptr [[BADDR]], align 8			; VLENUNK-NEXT: [[AIDX:%.*]] = load i64, ptr [[BADDR]], align 8
	; VLENUNK-NEXT: [[AADDR:%.*]] = getelementptr inbounds i64, ptr [[A]], i64 [[AIDX]]			; VLENUNK-NEXT: [[AADDR:%.*]] = getelementptr inbounds i64, ptr [[A]], i64 [[AIDX]]
	; VLENUNK-NEXT: [[ELEM:%.*]] = load i64, ptr [[AADDR]], align 8			; VLENUNK-NEXT: [[ELEM:%.*]] = load i64, ptr [[AADDR]], align 8
	; VLENUNK-NEXT: [[IV_NEXT]] = add nuw nsw i64 [[IV]], 1			; VLENUNK-NEXT: [[IV_NEXT]] = add nuw nsw i64 [[IV]], 1
	; VLENUNK-NEXT: [[SUM_NEXT]] = add i64 [[SUM]], [[ELEM]]			; VLENUNK-NEXT: [[SUM_NEXT]] = add i64 [[SUM]], [[ELEM]]
	; VLENUNK-NEXT: [[EXITCOND_NOT:%.*]] = icmp eq i64 [[IV_NEXT]], 1024			; VLENUNK-NEXT: [[EXITCOND_NOT:%.*]] = icmp eq i64 [[IV_NEXT]], 1024
	; VLENUNK-NEXT: br i1 [[EXITCOND_NOT]], label [[FOR_END]], label [[FOR_BODY]], !llvm.loop [[LOOP9:![0-9]+]]			; VLENUNK-NEXT: br i1 [[EXITCOND_NOT]], label [[FOR_END]], label [[FOR_BODY]], !llvm.loop [[LOOP9:![0-9]+]]
	; VLENUNK: for.end:			; VLENUNK: for.end:
	; VLENUNK-NEXT: [[SUM_NEXT_LCSSA:%.*]] = phi i64 [ [[SUM_NEXT]], [[FOR_BODY]] ], [ [[TMP9]], [[MIDDLE_BLOCK]] ]			; VLENUNK-NEXT: [[SUM_NEXT_LCSSA:%.*]] = phi i64 [ [[SUM_NEXT]], [[FOR_BODY]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; VLENUNK-NEXT: ret i64 [[SUM_NEXT_LCSSA]]			; VLENUNK-NEXT: ret i64 [[SUM_NEXT_LCSSA]]
	;			;
	; VLEN128-LABEL: @indexed_load(			; VLEN128-LABEL: @indexed_load(
	; VLEN128-NEXT: entry:			; VLEN128-NEXT: entry:
	; VLEN128-NEXT: [[TMP0:%.*]] = call i64 @llvm.vscale.i64()			; VLEN128-NEXT: [[TMP0:%.*]] = call i64 @llvm.vscale.i64()
	; VLEN128-NEXT: [[MIN_ITERS_CHECK:%.*]] = icmp ult i64 1024, [[TMP0]]			; VLEN128-NEXT: [[MIN_ITERS_CHECK:%.*]] = icmp ult i64 1024, [[TMP0]]
	; VLEN128-NEXT: br i1 [[MIN_ITERS_CHECK]], label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]			; VLEN128-NEXT: br i1 [[MIN_ITERS_CHECK]], label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]
	; VLEN128: vector.ph:			; VLEN128: vector.ph:
	Show All 12 Lines
	; VLEN128-NEXT: [[WIDE_MASKED_GATHER:%.*]] = call <vscale x 1 x i64> @llvm.masked.gather.nxv1i64.nxv1p0(<vscale x 1 x ptr> [[TMP5]], i32 8, <vscale x 1 x i1> shufflevector (<vscale x 1 x i1> insertelement (<vscale x 1 x i1> poison, i1 true, i32 0), <vscale x 1 x i1> poison, <vscale x 1 x i32> zeroinitializer), <vscale x 1 x i64> poison)			; VLEN128-NEXT: [[WIDE_MASKED_GATHER:%.*]] = call <vscale x 1 x i64> @llvm.masked.gather.nxv1i64.nxv1p0(<vscale x 1 x ptr> [[TMP5]], i32 8, <vscale x 1 x i1> shufflevector (<vscale x 1 x i1> insertelement (<vscale x 1 x i1> poison, i1 true, i32 0), <vscale x 1 x i1> poison, <vscale x 1 x i32> zeroinitializer), <vscale x 1 x i64> poison)
	; VLEN128-NEXT: [[TMP6]] = add <vscale x 1 x i64> [[VEC_PHI]], [[WIDE_MASKED_GATHER]]			; VLEN128-NEXT: [[TMP6]] = add <vscale x 1 x i64> [[VEC_PHI]], [[WIDE_MASKED_GATHER]]
	; VLEN128-NEXT: [[TMP7:%.*]] = call i64 @llvm.vscale.i64()			; VLEN128-NEXT: [[TMP7:%.*]] = call i64 @llvm.vscale.i64()
	; VLEN128-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], [[TMP7]]			; VLEN128-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], [[TMP7]]
	; VLEN128-NEXT: [[TMP8:%.*]] = icmp eq i64 [[INDEX_NEXT]], [[N_VEC]]			; VLEN128-NEXT: [[TMP8:%.*]] = icmp eq i64 [[INDEX_NEXT]], [[N_VEC]]
	; VLEN128-NEXT: br i1 [[TMP8]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP8:![0-9]+]]			; VLEN128-NEXT: br i1 [[TMP8]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP8:![0-9]+]]
	; VLEN128: middle.block:			; VLEN128: middle.block:
	; VLEN128-NEXT: [[TMP9:%.*]] = call i64 @llvm.vector.reduce.add.nxv1i64(<vscale x 1 x i64> [[TMP6]])			; VLEN128-NEXT: [[TMP9:%.*]] = call i64 @llvm.vector.reduce.add.nxv1i64(<vscale x 1 x i64> [[TMP6]])
				; VLEN128-NEXT: [[RDX_START:%.*]] = add i64 0, [[TMP9]]
	; VLEN128-NEXT: [[CMP_N:%.*]] = icmp eq i64 1024, [[N_VEC]]			; VLEN128-NEXT: [[CMP_N:%.*]] = icmp eq i64 1024, [[N_VEC]]
	; VLEN128-NEXT: br i1 [[CMP_N]], label [[FOR_END:%.*]], label [[SCALAR_PH]]			; VLEN128-NEXT: br i1 [[CMP_N]], label [[FOR_END:%.*]], label [[SCALAR_PH]]
	; VLEN128: scalar.ph:			; VLEN128: scalar.ph:
	; VLEN128-NEXT: [[BC_RESUME_VAL:%.]] = phi i64 [ [[N_VEC]], [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY:%.]] ]			; VLEN128-NEXT: [[BC_RESUME_VAL:%.]] = phi i64 [ [[N_VEC]], [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY:%.]] ]
	; VLEN128-NEXT: [[BC_MERGE_RDX:%.*]] = phi i64 [ 0, [[ENTRY]] ], [ [[TMP9]], [[MIDDLE_BLOCK]] ]			; VLEN128-NEXT: [[BC_MERGE_RDX:%.*]] = phi i64 [ 0, [[ENTRY]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; VLEN128-NEXT: br label [[FOR_BODY:%.*]]			; VLEN128-NEXT: br label [[FOR_BODY:%.*]]
	; VLEN128: for.body:			; VLEN128: for.body:
	; VLEN128-NEXT: [[IV:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[IV_NEXT:%.]], [[FOR_BODY]] ]			; VLEN128-NEXT: [[IV:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[IV_NEXT:%.]], [[FOR_BODY]] ]
	; VLEN128-NEXT: [[SUM:%.]] = phi i64 [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[SUM_NEXT:%.]], [[FOR_BODY]] ]			; VLEN128-NEXT: [[SUM:%.]] = phi i64 [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[SUM_NEXT:%.]], [[FOR_BODY]] ]
	; VLEN128-NEXT: [[BADDR:%.*]] = getelementptr inbounds i64, ptr [[B]], i64 [[IV]]			; VLEN128-NEXT: [[BADDR:%.*]] = getelementptr inbounds i64, ptr [[B]], i64 [[IV]]
	; VLEN128-NEXT: [[AIDX:%.*]] = load i64, ptr [[BADDR]], align 8			; VLEN128-NEXT: [[AIDX:%.*]] = load i64, ptr [[BADDR]], align 8
	; VLEN128-NEXT: [[AADDR:%.*]] = getelementptr inbounds i64, ptr [[A]], i64 [[AIDX]]			; VLEN128-NEXT: [[AADDR:%.*]] = getelementptr inbounds i64, ptr [[A]], i64 [[AIDX]]
	; VLEN128-NEXT: [[ELEM:%.*]] = load i64, ptr [[AADDR]], align 8			; VLEN128-NEXT: [[ELEM:%.*]] = load i64, ptr [[AADDR]], align 8
	; VLEN128-NEXT: [[IV_NEXT]] = add nuw nsw i64 [[IV]], 1			; VLEN128-NEXT: [[IV_NEXT]] = add nuw nsw i64 [[IV]], 1
	; VLEN128-NEXT: [[SUM_NEXT]] = add i64 [[SUM]], [[ELEM]]			; VLEN128-NEXT: [[SUM_NEXT]] = add i64 [[SUM]], [[ELEM]]
	; VLEN128-NEXT: [[EXITCOND_NOT:%.*]] = icmp eq i64 [[IV_NEXT]], 1024			; VLEN128-NEXT: [[EXITCOND_NOT:%.*]] = icmp eq i64 [[IV_NEXT]], 1024
	; VLEN128-NEXT: br i1 [[EXITCOND_NOT]], label [[FOR_END]], label [[FOR_BODY]], !llvm.loop [[LOOP9:![0-9]+]]			; VLEN128-NEXT: br i1 [[EXITCOND_NOT]], label [[FOR_END]], label [[FOR_BODY]], !llvm.loop [[LOOP9:![0-9]+]]
	; VLEN128: for.end:			; VLEN128: for.end:
	; VLEN128-NEXT: [[SUM_NEXT_LCSSA:%.*]] = phi i64 [ [[SUM_NEXT]], [[FOR_BODY]] ], [ [[TMP9]], [[MIDDLE_BLOCK]] ]			; VLEN128-NEXT: [[SUM_NEXT_LCSSA:%.*]] = phi i64 [ [[SUM_NEXT]], [[FOR_BODY]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; VLEN128-NEXT: ret i64 [[SUM_NEXT_LCSSA]]			; VLEN128-NEXT: ret i64 [[SUM_NEXT_LCSSA]]
	;			;
	entry:			entry:
	br label %for.body			br label %for.body

	for.body:			for.body:
	%iv = phi i64 [ 0, %entry ], [ %iv.next, %for.body ]			%iv = phi i64 [ 0, %entry ], [ %iv.next, %for.body ]
	%sum = phi i64 [0, %entry], [%sum.next, %for.body]			%sum = phi i64 [0, %entry], [%sum.next, %for.body]
	▲ Show 20 Lines • Show All 197 Lines • Show Last 20 Lines

llvm/test/Transforms/LoopVectorize/RISCV/scalable-tailfold.ll

	Show First 20 Lines • Show All 160 Lines • ▼ Show 20 Lines
	; CHECK-NEXT: [[TMP9]] = add <vscale x 1 x i64> [[VEC_PHI]], [[WIDE_MASKED_GATHER]]			; CHECK-NEXT: [[TMP9]] = add <vscale x 1 x i64> [[VEC_PHI]], [[WIDE_MASKED_GATHER]]
	; CHECK-NEXT: [[TMP10:%.*]] = select <vscale x 1 x i1> [[ACTIVE_LANE_MASK]], <vscale x 1 x i64> [[TMP9]], <vscale x 1 x i64> [[VEC_PHI]]			; CHECK-NEXT: [[TMP10:%.*]] = select <vscale x 1 x i1> [[ACTIVE_LANE_MASK]], <vscale x 1 x i64> [[TMP9]], <vscale x 1 x i64> [[VEC_PHI]]
	; CHECK-NEXT: [[TMP11:%.*]] = call i64 @llvm.vscale.i64()			; CHECK-NEXT: [[TMP11:%.*]] = call i64 @llvm.vscale.i64()
	; CHECK-NEXT: [[INDEX_NEXT]] = add i64 [[INDEX]], [[TMP11]]			; CHECK-NEXT: [[INDEX_NEXT]] = add i64 [[INDEX]], [[TMP11]]
	; CHECK-NEXT: [[TMP12:%.*]] = icmp eq i64 [[INDEX_NEXT]], [[N_VEC]]			; CHECK-NEXT: [[TMP12:%.*]] = icmp eq i64 [[INDEX_NEXT]], [[N_VEC]]
	; CHECK-NEXT: br i1 [[TMP12]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP6:![0-9]+]]			; CHECK-NEXT: br i1 [[TMP12]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP6:![0-9]+]]
	; CHECK: middle.block:			; CHECK: middle.block:
	; CHECK-NEXT: [[TMP13:%.*]] = call i64 @llvm.vector.reduce.add.nxv1i64(<vscale x 1 x i64> [[TMP10]])			; CHECK-NEXT: [[TMP13:%.*]] = call i64 @llvm.vector.reduce.add.nxv1i64(<vscale x 1 x i64> [[TMP10]])
				; CHECK-NEXT: [[RDX_START:%.*]] = add i64 0, [[TMP13]]
	; CHECK-NEXT: br i1 true, label [[FOR_END:%.*]], label [[SCALAR_PH]]			; CHECK-NEXT: br i1 true, label [[FOR_END:%.*]], label [[SCALAR_PH]]
	; CHECK: scalar.ph:			; CHECK: scalar.ph:
	; CHECK-NEXT: [[BC_RESUME_VAL:%.]] = phi i64 [ [[N_VEC]], [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY:%.]] ]			; CHECK-NEXT: [[BC_RESUME_VAL:%.]] = phi i64 [ [[N_VEC]], [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY:%.]] ]
	; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i64 [ 0, [[ENTRY]] ], [ [[TMP13]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i64 [ 0, [[ENTRY]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: br label [[FOR_BODY:%.*]]			; CHECK-NEXT: br label [[FOR_BODY:%.*]]
	; CHECK: for.body:			; CHECK: for.body:
	; CHECK-NEXT: [[IV:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[IV_NEXT:%.]], [[FOR_BODY]] ]			; CHECK-NEXT: [[IV:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[IV_NEXT:%.]], [[FOR_BODY]] ]
	; CHECK-NEXT: [[SUM:%.]] = phi i64 [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[SUM_NEXT:%.]], [[FOR_BODY]] ]			; CHECK-NEXT: [[SUM:%.]] = phi i64 [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[SUM_NEXT:%.]], [[FOR_BODY]] ]
	; CHECK-NEXT: [[BADDR:%.*]] = getelementptr inbounds i64, ptr [[B]], i64 [[IV]]			; CHECK-NEXT: [[BADDR:%.*]] = getelementptr inbounds i64, ptr [[B]], i64 [[IV]]
	; CHECK-NEXT: [[AIDX:%.*]] = load i64, ptr [[BADDR]], align 8			; CHECK-NEXT: [[AIDX:%.*]] = load i64, ptr [[BADDR]], align 8
	; CHECK-NEXT: [[AADDR:%.*]] = getelementptr inbounds i64, ptr [[A]], i64 [[AIDX]]			; CHECK-NEXT: [[AADDR:%.*]] = getelementptr inbounds i64, ptr [[A]], i64 [[AIDX]]
	; CHECK-NEXT: [[ELEM:%.*]] = load i64, ptr [[AADDR]], align 8			; CHECK-NEXT: [[ELEM:%.*]] = load i64, ptr [[AADDR]], align 8
	; CHECK-NEXT: [[IV_NEXT]] = add nuw nsw i64 [[IV]], 1			; CHECK-NEXT: [[IV_NEXT]] = add nuw nsw i64 [[IV]], 1
	; CHECK-NEXT: [[SUM_NEXT]] = add i64 [[SUM]], [[ELEM]]			; CHECK-NEXT: [[SUM_NEXT]] = add i64 [[SUM]], [[ELEM]]
	; CHECK-NEXT: [[EXITCOND_NOT:%.*]] = icmp eq i64 [[IV_NEXT]], 1024			; CHECK-NEXT: [[EXITCOND_NOT:%.*]] = icmp eq i64 [[IV_NEXT]], 1024
	; CHECK-NEXT: br i1 [[EXITCOND_NOT]], label [[FOR_END]], label [[FOR_BODY]], !llvm.loop [[LOOP7:![0-9]+]]			; CHECK-NEXT: br i1 [[EXITCOND_NOT]], label [[FOR_END]], label [[FOR_BODY]], !llvm.loop [[LOOP7:![0-9]+]]
	; CHECK: for.end:			; CHECK: for.end:
	; CHECK-NEXT: [[SUM_NEXT_LCSSA:%.*]] = phi i64 [ [[SUM_NEXT]], [[FOR_BODY]] ], [ [[TMP13]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[SUM_NEXT_LCSSA:%.*]] = phi i64 [ [[SUM_NEXT]], [[FOR_BODY]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: ret i64 [[SUM_NEXT_LCSSA]]			; CHECK-NEXT: ret i64 [[SUM_NEXT_LCSSA]]
	;			;
	entry:			entry:
	br label %for.body			br label %for.body

	for.body:			for.body:
	%iv = phi i64 [ 0, %entry ], [ %iv.next, %for.body ]			%iv = phi i64 [ 0, %entry ], [ %iv.next, %for.body ]
	%sum = phi i64 [0, %entry], [%sum.next, %for.body]			%sum = phi i64 [0, %entry], [%sum.next, %for.body]
	▲ Show 20 Lines • Show All 161 Lines • Show Last 20 Lines

llvm/test/Transforms/LoopVectorize/X86/cost-model.ll

	Show First 20 Lines • Show All 210 Lines • ▼ Show 20 Lines
	; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 16			; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 16
	; CHECK-NEXT: [[TMP123:%.*]] = icmp eq i64 [[INDEX_NEXT]], [[N_VEC]]			; CHECK-NEXT: [[TMP123:%.*]] = icmp eq i64 [[INDEX_NEXT]], [[N_VEC]]
	; CHECK-NEXT: br i1 [[TMP123]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP0:![0-9]+]]			; CHECK-NEXT: br i1 [[TMP123]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP0:![0-9]+]]
	; CHECK: middle.block:			; CHECK: middle.block:
	; CHECK-NEXT: [[BIN_RDX:%.*]] = fadd fast <4 x float> [[TMP120]], [[TMP119]]			; CHECK-NEXT: [[BIN_RDX:%.*]] = fadd fast <4 x float> [[TMP120]], [[TMP119]]
	; CHECK-NEXT: [[BIN_RDX4:%.*]] = fadd fast <4 x float> [[TMP121]], [[BIN_RDX]]			; CHECK-NEXT: [[BIN_RDX4:%.*]] = fadd fast <4 x float> [[TMP121]], [[BIN_RDX]]
	; CHECK-NEXT: [[BIN_RDX5:%.*]] = fadd fast <4 x float> [[TMP122]], [[BIN_RDX4]]			; CHECK-NEXT: [[BIN_RDX5:%.*]] = fadd fast <4 x float> [[TMP122]], [[BIN_RDX4]]
	; CHECK-NEXT: [[TMP124:%.*]] = call fast float @llvm.vector.reduce.fadd.v4f32(float -0.000000e+00, <4 x float> [[BIN_RDX5]])			; CHECK-NEXT: [[TMP124:%.*]] = call fast float @llvm.vector.reduce.fadd.v4f32(float -0.000000e+00, <4 x float> [[BIN_RDX5]])
				; CHECK-NEXT: [[RDX_START:%.*]] = fadd float 0.000000e+00, [[TMP124]]
	; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i64 [[TMP2]], [[N_VEC]]			; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i64 [[TMP2]], [[N_VEC]]
	; CHECK-NEXT: br i1 [[CMP_N]], label [[LOOPEXIT:%.*]], label [[SCALAR_PH]]			; CHECK-NEXT: br i1 [[CMP_N]], label [[LOOPEXIT:%.*]], label [[SCALAR_PH]]
	; CHECK: scalar.ph:			; CHECK: scalar.ph:
	; CHECK-NEXT: [[BC_RESUME_VAL:%.*]] = phi i64 [ [[IND_END]], [[MIDDLE_BLOCK]] ], [ 0, [[PREHEADER]] ]			; CHECK-NEXT: [[BC_RESUME_VAL:%.*]] = phi i64 [ [[IND_END]], [[MIDDLE_BLOCK]] ], [ 0, [[PREHEADER]] ]
	; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi float [ 0.000000e+00, [[PREHEADER]] ], [ [[TMP124]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi float [ 0.000000e+00, [[PREHEADER]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: br label [[FOR:%.*]]			; CHECK-NEXT: br label [[FOR:%.*]]
	; CHECK: for:			; CHECK: for:
	; CHECK-NEXT: [[INDVARS_IV:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[INDVARS_IV_NEXT:%.]], [[FOR]] ]			; CHECK-NEXT: [[INDVARS_IV:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[INDVARS_IV_NEXT:%.]], [[FOR]] ]
	; CHECK-NEXT: [[S_02:%.]] = phi float [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[ADD4:%.]], [[FOR]] ]			; CHECK-NEXT: [[S_02:%.]] = phi float [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[ADD4:%.]], [[FOR]] ]
	; CHECK-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds float, float [[A]], i64 [[INDVARS_IV]]			; CHECK-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds float, float [[A]], i64 [[INDVARS_IV]]
	; CHECK-NEXT: [[T1:%.]] = load float, float [[ARRAYIDX]], align 4			; CHECK-NEXT: [[T1:%.]] = load float, float [[ARRAYIDX]], align 4
	; CHECK-NEXT: [[ARRAYIDX3:%.]] = getelementptr inbounds float, float [[B]], i64 [[INDVARS_IV]]			; CHECK-NEXT: [[ARRAYIDX3:%.]] = getelementptr inbounds float, float [[B]], i64 [[INDVARS_IV]]
	; CHECK-NEXT: [[T2:%.]] = load float, float [[ARRAYIDX3]], align 4			; CHECK-NEXT: [[T2:%.]] = load float, float [[ARRAYIDX3]], align 4
	; CHECK-NEXT: [[ADD:%.*]] = fadd fast float [[T1]], [[S_02]]			; CHECK-NEXT: [[ADD:%.*]] = fadd fast float [[T1]], [[S_02]]
	; CHECK-NEXT: [[ADD4]] = fadd fast float [[ADD]], [[T2]]			; CHECK-NEXT: [[ADD4]] = fadd fast float [[ADD]], [[T2]]
	; CHECK-NEXT: [[INDVARS_IV_NEXT]] = add nuw nsw i64 [[INDVARS_IV]], 32			; CHECK-NEXT: [[INDVARS_IV_NEXT]] = add nuw nsw i64 [[INDVARS_IV]], 32
	; CHECK-NEXT: [[CMP1:%.*]] = icmp slt i64 [[INDVARS_IV_NEXT]], [[T0]]			; CHECK-NEXT: [[CMP1:%.*]] = icmp slt i64 [[INDVARS_IV_NEXT]], [[T0]]
	; CHECK-NEXT: br i1 [[CMP1]], label [[FOR]], label [[LOOPEXIT]], !llvm.loop [[LOOP2:![0-9]+]]			; CHECK-NEXT: br i1 [[CMP1]], label [[FOR]], label [[LOOPEXIT]], !llvm.loop [[LOOP2:![0-9]+]]
	; CHECK: loopexit:			; CHECK: loopexit:
	; CHECK-NEXT: [[ADD4_LCSSA:%.*]] = phi float [ [[ADD4]], [[FOR]] ], [ [[TMP124]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[ADD4_LCSSA:%.*]] = phi float [ [[ADD4]], [[FOR]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: br label [[FOR_END]]			; CHECK-NEXT: br label [[FOR_END]]
	; CHECK: for.end:			; CHECK: for.end:
	; CHECK-NEXT: [[S_0_LCSSA:%.]] = phi float [ 0.000000e+00, [[ENTRY:%.]] ], [ [[ADD4_LCSSA]], [[LOOPEXIT]] ]			; CHECK-NEXT: [[S_0_LCSSA:%.]] = phi float [ 0.000000e+00, [[ENTRY:%.]] ], [ [[ADD4_LCSSA]], [[LOOPEXIT]] ]
	; CHECK-NEXT: ret float [[S_0_LCSSA]]			; CHECK-NEXT: ret float [[S_0_LCSSA]]
	;			;
	entry:			entry:
	%cmp = icmp sgt i32 %n, 0			%cmp = icmp sgt i32 %n, 0
	br i1 %cmp, label %preheader, label %for.end			br i1 %cmp, label %preheader, label %for.end
	Show All 27 Lines

llvm/test/Transforms/LoopVectorize/X86/imprecise-through-phis.ll

	Show First 20 Lines • Show All 81 Lines • ▼ Show 20 Lines
	; SSE-NEXT: [[TMP5:%.*]] = fadd fast <2 x double> [[VEC_PHI]], [[WIDE_LOAD]]			; SSE-NEXT: [[TMP5:%.*]] = fadd fast <2 x double> [[VEC_PHI]], [[WIDE_LOAD]]
	; SSE-NEXT: [[TMP6:%.*]] = xor <2 x i1> [[TMP4]], <i1 true, i1 true>			; SSE-NEXT: [[TMP6:%.*]] = xor <2 x i1> [[TMP4]], <i1 true, i1 true>
	; SSE-NEXT: [[PREDPHI]] = select <2 x i1> [[TMP4]], <2 x double> [[TMP5]], <2 x double> [[VEC_PHI]]			; SSE-NEXT: [[PREDPHI]] = select <2 x i1> [[TMP4]], <2 x double> [[TMP5]], <2 x double> [[VEC_PHI]]
	; SSE-NEXT: [[INDEX_NEXT]] = add nuw i32 [[INDEX]], 2			; SSE-NEXT: [[INDEX_NEXT]] = add nuw i32 [[INDEX]], 2
	; SSE-NEXT: [[TMP7:%.*]] = icmp eq i32 [[INDEX_NEXT]], 32			; SSE-NEXT: [[TMP7:%.*]] = icmp eq i32 [[INDEX_NEXT]], 32
	; SSE-NEXT: br i1 [[TMP7]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP0:![0-9]+]]			; SSE-NEXT: br i1 [[TMP7]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP0:![0-9]+]]
	; SSE: middle.block:			; SSE: middle.block:
	; SSE-NEXT: [[TMP8:%.*]] = call fast double @llvm.vector.reduce.fadd.v2f64(double -0.000000e+00, <2 x double> [[PREDPHI]])			; SSE-NEXT: [[TMP8:%.*]] = call fast double @llvm.vector.reduce.fadd.v2f64(double -0.000000e+00, <2 x double> [[PREDPHI]])
				; SSE-NEXT: [[RDX_START:%.*]] = fadd double 0.000000e+00, [[TMP8]]
	; SSE-NEXT: [[CMP_N:%.*]] = icmp eq i32 32, 32			; SSE-NEXT: [[CMP_N:%.*]] = icmp eq i32 32, 32
	; SSE-NEXT: br i1 [[CMP_N]], label [[DONE:%.*]], label [[SCALAR_PH]]			; SSE-NEXT: br i1 [[CMP_N]], label [[DONE:%.*]], label [[SCALAR_PH]]
	; SSE: scalar.ph:			; SSE: scalar.ph:
	; SSE-NEXT: [[BC_RESUME_VAL:%.]] = phi i32 [ 32, [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY:%.]] ]			; SSE-NEXT: [[BC_RESUME_VAL:%.]] = phi i32 [ 32, [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY:%.]] ]
	; SSE-NEXT: [[BC_MERGE_RDX:%.*]] = phi double [ 0.000000e+00, [[ENTRY]] ], [ [[TMP8]], [[MIDDLE_BLOCK]] ]			; SSE-NEXT: [[BC_MERGE_RDX:%.*]] = phi double [ 0.000000e+00, [[ENTRY]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; SSE-NEXT: br label [[LOOP:%.*]]			; SSE-NEXT: br label [[LOOP:%.*]]
	; SSE: loop:			; SSE: loop:
	; SSE-NEXT: [[I:%.]] = phi i32 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[I_NEXT:%.]], [[NEXT_ITER:%.*]] ]			; SSE-NEXT: [[I:%.]] = phi i32 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[I_NEXT:%.]], [[NEXT_ITER:%.*]] ]
	; SSE-NEXT: [[TOT:%.]] = phi double [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[TOT_NEXT:%.]], [[NEXT_ITER]] ]			; SSE-NEXT: [[TOT:%.]] = phi double [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[TOT_NEXT:%.]], [[NEXT_ITER]] ]
	; SSE-NEXT: [[ADDR:%.]] = getelementptr double, double [[ARR]], i32 [[I]]			; SSE-NEXT: [[ADDR:%.]] = getelementptr double, double [[ARR]], i32 [[I]]
	; SSE-NEXT: [[NEXTVAL:%.]] = load double, double [[ADDR]], align 8			; SSE-NEXT: [[NEXTVAL:%.]] = load double, double [[ADDR]], align 8
	; SSE-NEXT: [[TST:%.*]] = fcmp fast une double [[NEXTVAL]], 4.200000e+01			; SSE-NEXT: [[TST:%.*]] = fcmp fast une double [[NEXTVAL]], 4.200000e+01
	; SSE-NEXT: br i1 [[TST]], label [[DO_ADD:%.]], label [[NO_ADD:%.]]			; SSE-NEXT: br i1 [[TST]], label [[DO_ADD:%.]], label [[NO_ADD:%.]]
	; SSE: do.add:			; SSE: do.add:
	; SSE-NEXT: [[TOT_NEW:%.*]] = fadd fast double [[TOT]], [[NEXTVAL]]			; SSE-NEXT: [[TOT_NEW:%.*]] = fadd fast double [[TOT]], [[NEXTVAL]]
	; SSE-NEXT: br label [[NEXT_ITER]]			; SSE-NEXT: br label [[NEXT_ITER]]
	; SSE: no.add:			; SSE: no.add:
	; SSE-NEXT: br label [[NEXT_ITER]]			; SSE-NEXT: br label [[NEXT_ITER]]
	; SSE: next.iter:			; SSE: next.iter:
	; SSE-NEXT: [[TOT_NEXT]] = phi double [ [[TOT]], [[NO_ADD]] ], [ [[TOT_NEW]], [[DO_ADD]] ]			; SSE-NEXT: [[TOT_NEXT]] = phi double [ [[TOT]], [[NO_ADD]] ], [ [[TOT_NEW]], [[DO_ADD]] ]
	; SSE-NEXT: [[I_NEXT]] = add i32 [[I]], 1			; SSE-NEXT: [[I_NEXT]] = add i32 [[I]], 1
	; SSE-NEXT: [[AGAIN:%.*]] = icmp ult i32 [[I_NEXT]], 32			; SSE-NEXT: [[AGAIN:%.*]] = icmp ult i32 [[I_NEXT]], 32
	; SSE-NEXT: br i1 [[AGAIN]], label [[LOOP]], label [[DONE]], !llvm.loop [[LOOP2:![0-9]+]]			; SSE-NEXT: br i1 [[AGAIN]], label [[LOOP]], label [[DONE]], !llvm.loop [[LOOP2:![0-9]+]]
	; SSE: done:			; SSE: done:
	; SSE-NEXT: [[TOT_NEXT_LCSSA:%.*]] = phi double [ [[TOT_NEXT]], [[NEXT_ITER]] ], [ [[TMP8]], [[MIDDLE_BLOCK]] ]			; SSE-NEXT: [[TOT_NEXT_LCSSA:%.*]] = phi double [ [[TOT_NEXT]], [[NEXT_ITER]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; SSE-NEXT: ret double [[TOT_NEXT_LCSSA]]			; SSE-NEXT: ret double [[TOT_NEXT_LCSSA]]
	;			;
	; AVX-LABEL: @sumIfVector(			; AVX-LABEL: @sumIfVector(
	; AVX-NEXT: entry:			; AVX-NEXT: entry:
	; AVX-NEXT: br i1 false, label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]			; AVX-NEXT: br i1 false, label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]
	; AVX: vector.ph:			; AVX: vector.ph:
	; AVX-NEXT: br label [[VECTOR_BODY:%.*]]			; AVX-NEXT: br label [[VECTOR_BODY:%.*]]
	; AVX: vector.body:			; AVX: vector.body:
	; AVX-NEXT: [[INDEX:%.]] = phi i32 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[VECTOR_BODY]] ]			; AVX-NEXT: [[INDEX:%.]] = phi i32 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[VECTOR_BODY]] ]
	; AVX-NEXT: [[VEC_PHI:%.]] = phi <4 x double> [ zeroinitializer, [[VECTOR_PH]] ], [ [[PREDPHI:%.]], [[VECTOR_BODY]] ]			; AVX-NEXT: [[VEC_PHI:%.]] = phi <4 x double> [ zeroinitializer, [[VECTOR_PH]] ], [ [[PREDPHI:%.]], [[VECTOR_BODY]] ]
	; AVX-NEXT: [[TMP0:%.*]] = add i32 [[INDEX]], 0			; AVX-NEXT: [[TMP0:%.*]] = add i32 [[INDEX]], 0
	; AVX-NEXT: [[TMP1:%.]] = getelementptr double, double [[ARR:%.*]], i32 [[TMP0]]			; AVX-NEXT: [[TMP1:%.]] = getelementptr double, double [[ARR:%.*]], i32 [[TMP0]]
	; AVX-NEXT: [[TMP2:%.]] = getelementptr double, double [[TMP1]], i32 0			; AVX-NEXT: [[TMP2:%.]] = getelementptr double, double [[TMP1]], i32 0
	; AVX-NEXT: [[TMP3:%.]] = bitcast double [[TMP2]] to <4 x double>*			; AVX-NEXT: [[TMP3:%.]] = bitcast double [[TMP2]] to <4 x double>*
	; AVX-NEXT: [[WIDE_LOAD:%.]] = load <4 x double>, <4 x double> [[TMP3]], align 8			; AVX-NEXT: [[WIDE_LOAD:%.]] = load <4 x double>, <4 x double> [[TMP3]], align 8
	; AVX-NEXT: [[TMP4:%.*]] = fcmp fast une <4 x double> [[WIDE_LOAD]], <double 4.200000e+01, double 4.200000e+01, double 4.200000e+01, double 4.200000e+01>			; AVX-NEXT: [[TMP4:%.*]] = fcmp fast une <4 x double> [[WIDE_LOAD]], <double 4.200000e+01, double 4.200000e+01, double 4.200000e+01, double 4.200000e+01>
	; AVX-NEXT: [[TMP5:%.*]] = fadd fast <4 x double> [[VEC_PHI]], [[WIDE_LOAD]]			; AVX-NEXT: [[TMP5:%.*]] = fadd fast <4 x double> [[VEC_PHI]], [[WIDE_LOAD]]
	; AVX-NEXT: [[TMP6:%.*]] = xor <4 x i1> [[TMP4]], <i1 true, i1 true, i1 true, i1 true>			; AVX-NEXT: [[TMP6:%.*]] = xor <4 x i1> [[TMP4]], <i1 true, i1 true, i1 true, i1 true>
	; AVX-NEXT: [[PREDPHI]] = select <4 x i1> [[TMP4]], <4 x double> [[TMP5]], <4 x double> [[VEC_PHI]]			; AVX-NEXT: [[PREDPHI]] = select <4 x i1> [[TMP4]], <4 x double> [[TMP5]], <4 x double> [[VEC_PHI]]
	; AVX-NEXT: [[INDEX_NEXT]] = add nuw i32 [[INDEX]], 4			; AVX-NEXT: [[INDEX_NEXT]] = add nuw i32 [[INDEX]], 4
	; AVX-NEXT: [[TMP7:%.*]] = icmp eq i32 [[INDEX_NEXT]], 32			; AVX-NEXT: [[TMP7:%.*]] = icmp eq i32 [[INDEX_NEXT]], 32
	; AVX-NEXT: br i1 [[TMP7]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP0:![0-9]+]]			; AVX-NEXT: br i1 [[TMP7]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP0:![0-9]+]]
	; AVX: middle.block:			; AVX: middle.block:
	; AVX-NEXT: [[TMP8:%.*]] = call fast double @llvm.vector.reduce.fadd.v4f64(double -0.000000e+00, <4 x double> [[PREDPHI]])			; AVX-NEXT: [[TMP8:%.*]] = call fast double @llvm.vector.reduce.fadd.v4f64(double -0.000000e+00, <4 x double> [[PREDPHI]])
				; AVX-NEXT: [[RDX_START:%.*]] = fadd double 0.000000e+00, [[TMP8]]
	; AVX-NEXT: [[CMP_N:%.*]] = icmp eq i32 32, 32			; AVX-NEXT: [[CMP_N:%.*]] = icmp eq i32 32, 32
	; AVX-NEXT: br i1 [[CMP_N]], label [[DONE:%.*]], label [[SCALAR_PH]]			; AVX-NEXT: br i1 [[CMP_N]], label [[DONE:%.*]], label [[SCALAR_PH]]
	; AVX: scalar.ph:			; AVX: scalar.ph:
	; AVX-NEXT: [[BC_RESUME_VAL:%.]] = phi i32 [ 32, [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY:%.]] ]			; AVX-NEXT: [[BC_RESUME_VAL:%.]] = phi i32 [ 32, [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY:%.]] ]
	; AVX-NEXT: [[BC_MERGE_RDX:%.*]] = phi double [ 0.000000e+00, [[ENTRY]] ], [ [[TMP8]], [[MIDDLE_BLOCK]] ]			; AVX-NEXT: [[BC_MERGE_RDX:%.*]] = phi double [ 0.000000e+00, [[ENTRY]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; AVX-NEXT: br label [[LOOP:%.*]]			; AVX-NEXT: br label [[LOOP:%.*]]
	; AVX: loop:			; AVX: loop:
	; AVX-NEXT: [[I:%.]] = phi i32 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[I_NEXT:%.]], [[NEXT_ITER:%.*]] ]			; AVX-NEXT: [[I:%.]] = phi i32 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[I_NEXT:%.]], [[NEXT_ITER:%.*]] ]
	; AVX-NEXT: [[TOT:%.]] = phi double [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[TOT_NEXT:%.]], [[NEXT_ITER]] ]			; AVX-NEXT: [[TOT:%.]] = phi double [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[TOT_NEXT:%.]], [[NEXT_ITER]] ]
	; AVX-NEXT: [[ADDR:%.]] = getelementptr double, double [[ARR]], i32 [[I]]			; AVX-NEXT: [[ADDR:%.]] = getelementptr double, double [[ARR]], i32 [[I]]
	; AVX-NEXT: [[NEXTVAL:%.]] = load double, double [[ADDR]], align 8			; AVX-NEXT: [[NEXTVAL:%.]] = load double, double [[ADDR]], align 8
	; AVX-NEXT: [[TST:%.*]] = fcmp fast une double [[NEXTVAL]], 4.200000e+01			; AVX-NEXT: [[TST:%.*]] = fcmp fast une double [[NEXTVAL]], 4.200000e+01
	; AVX-NEXT: br i1 [[TST]], label [[DO_ADD:%.]], label [[NO_ADD:%.]]			; AVX-NEXT: br i1 [[TST]], label [[DO_ADD:%.]], label [[NO_ADD:%.]]
	; AVX: do.add:			; AVX: do.add:
	; AVX-NEXT: [[TOT_NEW:%.*]] = fadd fast double [[TOT]], [[NEXTVAL]]			; AVX-NEXT: [[TOT_NEW:%.*]] = fadd fast double [[TOT]], [[NEXTVAL]]
	; AVX-NEXT: br label [[NEXT_ITER]]			; AVX-NEXT: br label [[NEXT_ITER]]
	; AVX: no.add:			; AVX: no.add:
	; AVX-NEXT: br label [[NEXT_ITER]]			; AVX-NEXT: br label [[NEXT_ITER]]
	; AVX: next.iter:			; AVX: next.iter:
	; AVX-NEXT: [[TOT_NEXT]] = phi double [ [[TOT]], [[NO_ADD]] ], [ [[TOT_NEW]], [[DO_ADD]] ]			; AVX-NEXT: [[TOT_NEXT]] = phi double [ [[TOT]], [[NO_ADD]] ], [ [[TOT_NEW]], [[DO_ADD]] ]
	; AVX-NEXT: [[I_NEXT]] = add i32 [[I]], 1			; AVX-NEXT: [[I_NEXT]] = add i32 [[I]], 1
	; AVX-NEXT: [[AGAIN:%.*]] = icmp ult i32 [[I_NEXT]], 32			; AVX-NEXT: [[AGAIN:%.*]] = icmp ult i32 [[I_NEXT]], 32
	; AVX-NEXT: br i1 [[AGAIN]], label [[LOOP]], label [[DONE]], !llvm.loop [[LOOP2:![0-9]+]]			; AVX-NEXT: br i1 [[AGAIN]], label [[LOOP]], label [[DONE]], !llvm.loop [[LOOP2:![0-9]+]]
	; AVX: done:			; AVX: done:
	; AVX-NEXT: [[TOT_NEXT_LCSSA:%.*]] = phi double [ [[TOT_NEXT]], [[NEXT_ITER]] ], [ [[TMP8]], [[MIDDLE_BLOCK]] ]			; AVX-NEXT: [[TOT_NEXT_LCSSA:%.*]] = phi double [ [[TOT_NEXT]], [[NEXT_ITER]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; AVX-NEXT: ret double [[TOT_NEXT_LCSSA]]			; AVX-NEXT: ret double [[TOT_NEXT_LCSSA]]
	;			;
	entry:			entry:
	br label %loop			br label %loop

	loop:			loop:
	%i = phi i32 [0, %entry], [%i.next, %next.iter]			%i = phi i32 [0, %entry], [%i.next, %next.iter]
	%tot = phi double [0.0, %entry], [%tot.next, %next.iter]			%tot = phi double [0.0, %entry], [%tot.next, %next.iter]
	Show All 24 Lines

llvm/test/Transforms/LoopVectorize/X86/invariant-store-vectorization.ll

	Show First 20 Lines • Show All 63 Lines • ▼ Show 20 Lines
	; CHECK: vec.epilog.iter.check:			; CHECK: vec.epilog.iter.check:
	; CHECK-NEXT: [[N_VEC_REMAINING:%.*]] = and i64 [[SMAX6]], 56			; CHECK-NEXT: [[N_VEC_REMAINING:%.*]] = and i64 [[SMAX6]], 56
	; CHECK-NEXT: [[MIN_EPILOG_ITERS_CHECK:%.*]] = icmp eq i64 [[N_VEC_REMAINING]], 0			; CHECK-NEXT: [[MIN_EPILOG_ITERS_CHECK:%.*]] = icmp eq i64 [[N_VEC_REMAINING]], 0
	; CHECK-NEXT: br i1 [[MIN_EPILOG_ITERS_CHECK]], label [[VEC_EPILOG_SCALAR_PH]], label [[VEC_EPILOG_PH]]			; CHECK-NEXT: br i1 [[MIN_EPILOG_ITERS_CHECK]], label [[VEC_EPILOG_SCALAR_PH]], label [[VEC_EPILOG_PH]]
	; CHECK: vec.epilog.ph:			; CHECK: vec.epilog.ph:
	; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 0, [[VECTOR_MAIN_LOOP_ITER_CHECK]] ], [ [[TMP13]], [[VEC_EPILOG_ITER_CHECK]] ]			; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 0, [[VECTOR_MAIN_LOOP_ITER_CHECK]] ], [ [[TMP13]], [[VEC_EPILOG_ITER_CHECK]] ]
	; CHECK-NEXT: [[VEC_EPILOG_RESUME_VAL:%.*]] = phi i64 [ 0, [[VECTOR_MAIN_LOOP_ITER_CHECK]] ], [ [[N_VEC]], [[VEC_EPILOG_ITER_CHECK]] ]			; CHECK-NEXT: [[VEC_EPILOG_RESUME_VAL:%.*]] = phi i64 [ 0, [[VECTOR_MAIN_LOOP_ITER_CHECK]] ], [ [[N_VEC]], [[VEC_EPILOG_ITER_CHECK]] ]
	; CHECK-NEXT: [[N_VEC17:%.*]] = and i64 [[SMAX6]], 9223372036854775800			; CHECK-NEXT: [[N_VEC17:%.*]] = and i64 [[SMAX6]], 9223372036854775800
	; CHECK-NEXT: [[TMP14:%.*]] = insertelement <8 x i32> <i32 poison, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0>, i32 [[BC_MERGE_RDX]], i64 0
	; CHECK-NEXT: br label [[VEC_EPILOG_VECTOR_BODY:%.*]]			; CHECK-NEXT: br label [[VEC_EPILOG_VECTOR_BODY:%.*]]
	; CHECK: vec.epilog.vector.body:			; CHECK: vec.epilog.vector.body:
	; CHECK-NEXT: [[OFFSET_IDX:%.]] = phi i64 [ [[VEC_EPILOG_RESUME_VAL]], [[VEC_EPILOG_PH]] ], [ [[INDEX_NEXT22:%.]], [[VEC_EPILOG_VECTOR_BODY]] ]			; CHECK-NEXT: [[OFFSET_IDX:%.]] = phi i64 [ [[VEC_EPILOG_RESUME_VAL]], [[VEC_EPILOG_PH]] ], [ [[INDEX_NEXT22:%.]], [[VEC_EPILOG_VECTOR_BODY]] ]
	; CHECK-NEXT: [[VEC_PHI20:%.]] = phi <8 x i32> [ [[TMP14]], [[VEC_EPILOG_PH]] ], [ [[TMP17:%.]], [[VEC_EPILOG_VECTOR_BODY]] ]			; CHECK-NEXT: [[VEC_PHI20:%.]] = phi <8 x i32> [ zeroinitializer, [[VEC_EPILOG_PH]] ], [ [[TMP16:%.]], [[VEC_EPILOG_VECTOR_BODY]] ]
	; CHECK-NEXT: [[TMP15:%.]] = getelementptr inbounds i32, i32 [[B]], i64 [[OFFSET_IDX]]			; CHECK-NEXT: [[TMP14:%.]] = getelementptr inbounds i32, i32 [[B]], i64 [[OFFSET_IDX]]
	; CHECK-NEXT: [[TMP16:%.]] = bitcast i32 [[TMP15]] to <8 x i32>*			; CHECK-NEXT: [[TMP15:%.]] = bitcast i32 [[TMP14]] to <8 x i32>*
	; CHECK-NEXT: [[WIDE_LOAD21:%.]] = load <8 x i32>, <8 x i32> [[TMP16]], align 8, !alias.scope !7			; CHECK-NEXT: [[WIDE_LOAD21:%.]] = load <8 x i32>, <8 x i32> [[TMP15]], align 8, !alias.scope !7
	; CHECK-NEXT: [[TMP17]] = add <8 x i32> [[VEC_PHI20]], [[WIDE_LOAD21]]			; CHECK-NEXT: [[TMP16]] = add <8 x i32> [[VEC_PHI20]], [[WIDE_LOAD21]]
	; CHECK-NEXT: store i32 [[NTRUNC]], i32* [[A]], align 4, !alias.scope !10, !noalias !7			; CHECK-NEXT: store i32 [[NTRUNC]], i32* [[A]], align 4, !alias.scope !10, !noalias !7
	; CHECK-NEXT: [[INDEX_NEXT22]] = add nuw i64 [[OFFSET_IDX]], 8			; CHECK-NEXT: [[INDEX_NEXT22]] = add nuw i64 [[OFFSET_IDX]], 8
	; CHECK-NEXT: [[TMP18:%.*]] = icmp eq i64 [[INDEX_NEXT22]], [[N_VEC17]]			; CHECK-NEXT: [[TMP17:%.*]] = icmp eq i64 [[INDEX_NEXT22]], [[N_VEC17]]
	; CHECK-NEXT: br i1 [[TMP18]], label [[VEC_EPILOG_MIDDLE_BLOCK:%.*]], label [[VEC_EPILOG_VECTOR_BODY]], !llvm.loop [[LOOP12:![0-9]+]]			; CHECK-NEXT: br i1 [[TMP17]], label [[VEC_EPILOG_MIDDLE_BLOCK:%.*]], label [[VEC_EPILOG_VECTOR_BODY]], !llvm.loop [[LOOP12:![0-9]+]]
	; CHECK: vec.epilog.middle.block:			; CHECK: vec.epilog.middle.block:
	; CHECK-NEXT: [[TMP19:%.*]] = call i32 @llvm.vector.reduce.add.v8i32(<8 x i32> [[TMP17]])			; CHECK-NEXT: [[TMP18:%.*]] = call i32 @llvm.vector.reduce.add.v8i32(<8 x i32> [[TMP16]])
				; CHECK-NEXT: [[RDX_START23:%.*]] = add i32 [[BC_MERGE_RDX]], [[TMP18]]
	; CHECK-NEXT: [[CMP_N18:%.*]] = icmp eq i64 [[SMAX6]], [[N_VEC17]]			; CHECK-NEXT: [[CMP_N18:%.*]] = icmp eq i64 [[SMAX6]], [[N_VEC17]]
	; CHECK-NEXT: br i1 [[CMP_N18]], label [[FOR_END]], label [[VEC_EPILOG_SCALAR_PH]]			; CHECK-NEXT: br i1 [[CMP_N18]], label [[FOR_END]], label [[VEC_EPILOG_SCALAR_PH]]
	; CHECK: vec.epilog.scalar.ph:			; CHECK: vec.epilog.scalar.ph:
	; CHECK-NEXT: [[BC_RESUME_VAL:%.]] = phi i64 [ [[N_VEC17]], [[VEC_EPILOG_MIDDLE_BLOCK]] ], [ [[N_VEC]], [[VEC_EPILOG_ITER_CHECK]] ], [ 0, [[VECTOR_MEMCHECK]] ], [ 0, [[ITER_CHECK:%.]] ]			; CHECK-NEXT: [[BC_RESUME_VAL:%.]] = phi i64 [ [[N_VEC17]], [[VEC_EPILOG_MIDDLE_BLOCK]] ], [ [[N_VEC]], [[VEC_EPILOG_ITER_CHECK]] ], [ 0, [[VECTOR_MEMCHECK]] ], [ 0, [[ITER_CHECK:%.]] ]
	; CHECK-NEXT: [[BC_MERGE_RDX23:%.*]] = phi i32 [ [[TMP19]], [[VEC_EPILOG_MIDDLE_BLOCK]] ], [ [[TMP13]], [[VEC_EPILOG_ITER_CHECK]] ], [ 0, [[VECTOR_MEMCHECK]] ], [ 0, [[ITER_CHECK]] ]			; CHECK-NEXT: [[BC_MERGE_RDX24:%.*]] = phi i32 [ [[RDX_START23]], [[VEC_EPILOG_MIDDLE_BLOCK]] ], [ [[TMP13]], [[VEC_EPILOG_ITER_CHECK]] ], [ 0, [[VECTOR_MEMCHECK]] ], [ 0, [[ITER_CHECK]] ]
	; CHECK-NEXT: br label [[FOR_BODY:%.*]]			; CHECK-NEXT: br label [[FOR_BODY:%.*]]
	; CHECK: for.body:			; CHECK: for.body:
	; CHECK-NEXT: [[I:%.]] = phi i64 [ [[I_NEXT:%.]], [[FOR_BODY]] ], [ [[BC_RESUME_VAL]], [[VEC_EPILOG_SCALAR_PH]] ]			; CHECK-NEXT: [[I:%.]] = phi i64 [ [[I_NEXT:%.]], [[FOR_BODY]] ], [ [[BC_RESUME_VAL]], [[VEC_EPILOG_SCALAR_PH]] ]
	; CHECK-NEXT: [[T0:%.]] = phi i32 [ [[T3:%.]], [[FOR_BODY]] ], [ [[BC_MERGE_RDX23]], [[VEC_EPILOG_SCALAR_PH]] ]			; CHECK-NEXT: [[T0:%.]] = phi i32 [ [[T3:%.]], [[FOR_BODY]] ], [ [[BC_MERGE_RDX24]], [[VEC_EPILOG_SCALAR_PH]] ]
	; CHECK-NEXT: [[T1:%.]] = getelementptr inbounds i32, i32 [[B]], i64 [[I]]			; CHECK-NEXT: [[T1:%.]] = getelementptr inbounds i32, i32 [[B]], i64 [[I]]
	; CHECK-NEXT: [[T2:%.]] = load i32, i32 [[T1]], align 8			; CHECK-NEXT: [[T2:%.]] = load i32, i32 [[T1]], align 8
	; CHECK-NEXT: [[T3]] = add i32 [[T0]], [[T2]]			; CHECK-NEXT: [[T3]] = add i32 [[T0]], [[T2]]
	; CHECK-NEXT: store i32 [[NTRUNC]], i32* [[A]], align 4			; CHECK-NEXT: store i32 [[NTRUNC]], i32* [[A]], align 4
	; CHECK-NEXT: [[I_NEXT]] = add nuw nsw i64 [[I]], 1			; CHECK-NEXT: [[I_NEXT]] = add nuw nsw i64 [[I]], 1
	; CHECK-NEXT: [[COND:%.*]] = icmp slt i64 [[I_NEXT]], [[N]]			; CHECK-NEXT: [[COND:%.*]] = icmp slt i64 [[I_NEXT]], [[N]]
	; CHECK-NEXT: br i1 [[COND]], label [[FOR_BODY]], label [[FOR_END]], !llvm.loop [[LOOP14:![0-9]+]]			; CHECK-NEXT: br i1 [[COND]], label [[FOR_BODY]], label [[FOR_END]], !llvm.loop [[LOOP14:![0-9]+]]
	; CHECK: for.end:			; CHECK: for.end:
	; CHECK-NEXT: [[T4:%.*]] = phi i32 [ [[T3]], [[FOR_BODY]] ], [ [[TMP13]], [[MIDDLE_BLOCK]] ], [ [[TMP19]], [[VEC_EPILOG_MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[T4:%.*]] = phi i32 [ [[T3]], [[FOR_BODY]] ], [ [[TMP13]], [[MIDDLE_BLOCK]] ], [ [[RDX_START23]], [[VEC_EPILOG_MIDDLE_BLOCK]] ]
	; CHECK-NEXT: ret i32 [[T4]]			; CHECK-NEXT: ret i32 [[T4]]
	;			;
	entry:			entry:
	%ntrunc = trunc i64 %n to i32			%ntrunc = trunc i64 %n to i32
	br label %for.body			br label %for.body

	for.body: ; preds = %for.body, %entry			for.body: ; preds = %for.body, %entry
	%i = phi i64 [ %i.next, %for.body ], [ 0, %entry ]			%i = phi i64 [ %i.next, %for.body ], [ 0, %entry ]
	▲ Show 20 Lines • Show All 266 Lines • Show Last 20 Lines

llvm/test/Transforms/LoopVectorize/X86/load-deref-pred.ll

	Show First 20 Lines • Show All 80 Lines • ▼ Show 20 Lines
	; CHECK-NEXT: [[VEC_IND_NEXT]] = add <4 x i64> [[STEP_ADD2]], <i64 4, i64 4, i64 4, i64 4>			; CHECK-NEXT: [[VEC_IND_NEXT]] = add <4 x i64> [[STEP_ADD2]], <i64 4, i64 4, i64 4, i64 4>
	; CHECK-NEXT: [[TMP28:%.*]] = icmp eq i64 [[INDEX_NEXT]], 4096			; CHECK-NEXT: [[TMP28:%.*]] = icmp eq i64 [[INDEX_NEXT]], 4096
	; CHECK-NEXT: br i1 [[TMP28]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP0:![0-9]+]]			; CHECK-NEXT: br i1 [[TMP28]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP0:![0-9]+]]
	; CHECK: middle.block:			; CHECK: middle.block:
	; CHECK-NEXT: [[BIN_RDX:%.*]] = add <4 x i32> [[TMP25]], [[TMP24]]			; CHECK-NEXT: [[BIN_RDX:%.*]] = add <4 x i32> [[TMP25]], [[TMP24]]
	; CHECK-NEXT: [[BIN_RDX19:%.*]] = add <4 x i32> [[TMP26]], [[BIN_RDX]]			; CHECK-NEXT: [[BIN_RDX19:%.*]] = add <4 x i32> [[TMP26]], [[BIN_RDX]]
	; CHECK-NEXT: [[BIN_RDX20:%.*]] = add <4 x i32> [[TMP27]], [[BIN_RDX19]]			; CHECK-NEXT: [[BIN_RDX20:%.*]] = add <4 x i32> [[TMP27]], [[BIN_RDX19]]
	; CHECK-NEXT: [[TMP29:%.*]] = call i32 @llvm.vector.reduce.add.v4i32(<4 x i32> [[BIN_RDX20]])			; CHECK-NEXT: [[TMP29:%.*]] = call i32 @llvm.vector.reduce.add.v4i32(<4 x i32> [[BIN_RDX20]])
				; CHECK-NEXT: [[RDX_START:%.*]] = add i32 0, [[TMP29]]
	; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i64 4096, 4096			; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i64 4096, 4096
	; CHECK-NEXT: br i1 [[CMP_N]], label [[LOOP_EXIT:%.*]], label [[SCALAR_PH]]			; CHECK-NEXT: br i1 [[CMP_N]], label [[LOOP_EXIT:%.*]], label [[SCALAR_PH]]
	; CHECK: scalar.ph:			; CHECK: scalar.ph:
	; CHECK-NEXT: [[BC_RESUME_VAL:%.]] = phi i64 [ 4096, [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY:%.]] ]			; CHECK-NEXT: [[BC_RESUME_VAL:%.]] = phi i64 [ 4096, [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY:%.]] ]
	; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 0, [[ENTRY]] ], [ [[TMP29]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 0, [[ENTRY]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: br label [[LOOP:%.*]]			; CHECK-NEXT: br label [[LOOP:%.*]]
	; CHECK: loop:			; CHECK: loop:
	; CHECK-NEXT: [[IV:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[IV_NEXT:%.]], [[LATCH:%.*]] ]			; CHECK-NEXT: [[IV:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[IV_NEXT:%.]], [[LATCH:%.*]] ]
	; CHECK-NEXT: [[ACCUM:%.]] = phi i32 [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[ACCUM_NEXT:%.]], [[LATCH]] ]			; CHECK-NEXT: [[ACCUM:%.]] = phi i32 [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[ACCUM_NEXT:%.]], [[LATCH]] ]
	; CHECK-NEXT: [[IV_NEXT]] = add i64 [[IV]], 1			; CHECK-NEXT: [[IV_NEXT]] = add i64 [[IV]], 1
	; CHECK-NEXT: [[EARLYCND:%.*]] = icmp slt i64 [[IV]], [[LEN]]			; CHECK-NEXT: [[EARLYCND:%.*]] = icmp slt i64 [[IV]], [[LEN]]
	; CHECK-NEXT: br i1 [[EARLYCND]], label [[PRED:%.*]], label [[LATCH]]			; CHECK-NEXT: br i1 [[EARLYCND]], label [[PRED:%.*]], label [[LATCH]]
	; CHECK: pred:			; CHECK: pred:
	; CHECK-NEXT: [[ADDR:%.]] = getelementptr inbounds i32, i32 [[BASE]], i64 [[IV]]			; CHECK-NEXT: [[ADDR:%.]] = getelementptr inbounds i32, i32 [[BASE]], i64 [[IV]]
	; CHECK-NEXT: [[VAL:%.]] = load i32, i32 [[ADDR]], align 4			; CHECK-NEXT: [[VAL:%.]] = load i32, i32 [[ADDR]], align 4
	; CHECK-NEXT: br label [[LATCH]]			; CHECK-NEXT: br label [[LATCH]]
	; CHECK: latch:			; CHECK: latch:
	; CHECK-NEXT: [[VAL_PHI:%.*]] = phi i32 [ 0, [[LOOP]] ], [ [[VAL]], [[PRED]] ]			; CHECK-NEXT: [[VAL_PHI:%.*]] = phi i32 [ 0, [[LOOP]] ], [ [[VAL]], [[PRED]] ]
	; CHECK-NEXT: [[ACCUM_NEXT]] = add i32 [[ACCUM]], [[VAL_PHI]]			; CHECK-NEXT: [[ACCUM_NEXT]] = add i32 [[ACCUM]], [[VAL_PHI]]
	; CHECK-NEXT: [[EXIT:%.*]] = icmp ugt i64 [[IV]], 4094			; CHECK-NEXT: [[EXIT:%.*]] = icmp ugt i64 [[IV]], 4094
	; CHECK-NEXT: br i1 [[EXIT]], label [[LOOP_EXIT]], label [[LOOP]], !llvm.loop [[LOOP2:![0-9]+]]			; CHECK-NEXT: br i1 [[EXIT]], label [[LOOP_EXIT]], label [[LOOP]], !llvm.loop [[LOOP2:![0-9]+]]
	; CHECK: loop_exit:			; CHECK: loop_exit:
	; CHECK-NEXT: [[ACCUM_NEXT_LCSSA:%.*]] = phi i32 [ [[ACCUM_NEXT]], [[LATCH]] ], [ [[TMP29]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[ACCUM_NEXT_LCSSA:%.*]] = phi i32 [ [[ACCUM_NEXT]], [[LATCH]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: ret i32 [[ACCUM_NEXT_LCSSA]]			; CHECK-NEXT: ret i32 [[ACCUM_NEXT_LCSSA]]
	;			;
	entry:			entry:
	%alloca = alloca [4096 x i32]			%alloca = alloca [4096 x i32]
	%base = bitcast [4096 x i32]* %alloca to i32*			%base = bitcast [4096 x i32]* %alloca to i32*
	call void @init(i32* %base)			call void @init(i32* %base)
	br label %loop			br label %loop
	loop:			loop:
	▲ Show 20 Lines • Show All 127 Lines • ▼ Show 20 Lines
	; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 16			; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 16
	; CHECK-NEXT: [[TMP84:%.*]] = icmp eq i64 [[INDEX_NEXT]], 4096			; CHECK-NEXT: [[TMP84:%.*]] = icmp eq i64 [[INDEX_NEXT]], 4096
	; CHECK-NEXT: br i1 [[TMP84]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP4:![0-9]+]]			; CHECK-NEXT: br i1 [[TMP84]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP4:![0-9]+]]
	; CHECK: middle.block:			; CHECK: middle.block:
	; CHECK-NEXT: [[BIN_RDX:%.*]] = add <4 x i32> [[TMP81]], [[TMP80]]			; CHECK-NEXT: [[BIN_RDX:%.*]] = add <4 x i32> [[TMP81]], [[TMP80]]
	; CHECK-NEXT: [[BIN_RDX10:%.*]] = add <4 x i32> [[TMP82]], [[BIN_RDX]]			; CHECK-NEXT: [[BIN_RDX10:%.*]] = add <4 x i32> [[TMP82]], [[BIN_RDX]]
	; CHECK-NEXT: [[BIN_RDX11:%.*]] = add <4 x i32> [[TMP83]], [[BIN_RDX10]]			; CHECK-NEXT: [[BIN_RDX11:%.*]] = add <4 x i32> [[TMP83]], [[BIN_RDX10]]
	; CHECK-NEXT: [[TMP85:%.*]] = call i32 @llvm.vector.reduce.add.v4i32(<4 x i32> [[BIN_RDX11]])			; CHECK-NEXT: [[TMP85:%.*]] = call i32 @llvm.vector.reduce.add.v4i32(<4 x i32> [[BIN_RDX11]])
				; CHECK-NEXT: [[RDX_START:%.*]] = add i32 0, [[TMP85]]
	; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i64 4096, 4096			; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i64 4096, 4096
	; CHECK-NEXT: br i1 [[CMP_N]], label [[LOOP_EXIT:%.*]], label [[SCALAR_PH]]			; CHECK-NEXT: br i1 [[CMP_N]], label [[LOOP_EXIT:%.*]], label [[SCALAR_PH]]
	; CHECK: scalar.ph:			; CHECK: scalar.ph:
	; CHECK-NEXT: [[BC_RESUME_VAL:%.]] = phi i64 [ 4096, [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY:%.]] ]			; CHECK-NEXT: [[BC_RESUME_VAL:%.]] = phi i64 [ 4096, [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY:%.]] ]
	; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 0, [[ENTRY]] ], [ [[TMP85]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 0, [[ENTRY]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: br label [[LOOP:%.*]]			; CHECK-NEXT: br label [[LOOP:%.*]]
	; CHECK: loop:			; CHECK: loop:
	; CHECK-NEXT: [[IV:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[IV_NEXT:%.]], [[LATCH:%.*]] ]			; CHECK-NEXT: [[IV:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[IV_NEXT:%.]], [[LATCH:%.*]] ]
	; CHECK-NEXT: [[ACCUM:%.]] = phi i32 [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[ACCUM_NEXT:%.]], [[LATCH]] ]			; CHECK-NEXT: [[ACCUM:%.]] = phi i32 [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[ACCUM_NEXT:%.]], [[LATCH]] ]
	; CHECK-NEXT: [[IV_NEXT]] = add i64 [[IV]], 1			; CHECK-NEXT: [[IV_NEXT]] = add i64 [[IV]], 1
	; CHECK-NEXT: [[TEST_ADDR:%.]] = getelementptr inbounds i1, i1 [[TEST_BASE]], i64 [[IV]]			; CHECK-NEXT: [[TEST_ADDR:%.]] = getelementptr inbounds i1, i1 [[TEST_BASE]], i64 [[IV]]
	; CHECK-NEXT: [[EARLYCND:%.]] = load i1, i1 [[TEST_ADDR]], align 1			; CHECK-NEXT: [[EARLYCND:%.]] = load i1, i1 [[TEST_ADDR]], align 1
	; CHECK-NEXT: br i1 [[EARLYCND]], label [[PRED:%.*]], label [[LATCH]]			; CHECK-NEXT: br i1 [[EARLYCND]], label [[PRED:%.*]], label [[LATCH]]
	; CHECK: pred:			; CHECK: pred:
	; CHECK-NEXT: [[ADDR:%.]] = getelementptr inbounds i32, i32 [[BASE]], i64 [[IV]]			; CHECK-NEXT: [[ADDR:%.]] = getelementptr inbounds i32, i32 [[BASE]], i64 [[IV]]
	; CHECK-NEXT: [[VAL:%.]] = load i32, i32 [[ADDR]], align 4			; CHECK-NEXT: [[VAL:%.]] = load i32, i32 [[ADDR]], align 4
	; CHECK-NEXT: br label [[LATCH]]			; CHECK-NEXT: br label [[LATCH]]
	; CHECK: latch:			; CHECK: latch:
	; CHECK-NEXT: [[VAL_PHI:%.*]] = phi i32 [ 0, [[LOOP]] ], [ [[VAL]], [[PRED]] ]			; CHECK-NEXT: [[VAL_PHI:%.*]] = phi i32 [ 0, [[LOOP]] ], [ [[VAL]], [[PRED]] ]
	; CHECK-NEXT: [[ACCUM_NEXT]] = add i32 [[ACCUM]], [[VAL_PHI]]			; CHECK-NEXT: [[ACCUM_NEXT]] = add i32 [[ACCUM]], [[VAL_PHI]]
	; CHECK-NEXT: [[EXIT:%.*]] = icmp ugt i64 [[IV]], 4094			; CHECK-NEXT: [[EXIT:%.*]] = icmp ugt i64 [[IV]], 4094
	; CHECK-NEXT: br i1 [[EXIT]], label [[LOOP_EXIT]], label [[LOOP]], !llvm.loop [[LOOP5:![0-9]+]]			; CHECK-NEXT: br i1 [[EXIT]], label [[LOOP_EXIT]], label [[LOOP]], !llvm.loop [[LOOP5:![0-9]+]]
	; CHECK: loop_exit:			; CHECK: loop_exit:
	; CHECK-NEXT: [[ACCUM_NEXT_LCSSA:%.*]] = phi i32 [ [[ACCUM_NEXT]], [[LATCH]] ], [ [[TMP85]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[ACCUM_NEXT_LCSSA:%.*]] = phi i32 [ [[ACCUM_NEXT]], [[LATCH]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: ret i32 [[ACCUM_NEXT_LCSSA]]			; CHECK-NEXT: ret i32 [[ACCUM_NEXT_LCSSA]]
	;			;
	entry:			entry:
	%alloca = alloca [4096 x i32]			%alloca = alloca [4096 x i32]
	%base = bitcast [4096 x i32]* %alloca to i32*			%base = bitcast [4096 x i32]* %alloca to i32*
	call void @init(i32* %base)			call void @init(i32* %base)
	br label %loop			br label %loop
	loop:			loop:
	▲ Show 20 Lines • Show All 147 Lines • ▼ Show 20 Lines
	; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 16			; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 16
	; CHECK-NEXT: [[TMP104:%.*]] = icmp eq i64 [[INDEX_NEXT]], 4096			; CHECK-NEXT: [[TMP104:%.*]] = icmp eq i64 [[INDEX_NEXT]], 4096
	; CHECK-NEXT: br i1 [[TMP104]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP6:![0-9]+]]			; CHECK-NEXT: br i1 [[TMP104]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP6:![0-9]+]]
	; CHECK: middle.block:			; CHECK: middle.block:
	; CHECK-NEXT: [[BIN_RDX:%.*]] = add <4 x i32> [[TMP101]], [[TMP100]]			; CHECK-NEXT: [[BIN_RDX:%.*]] = add <4 x i32> [[TMP101]], [[TMP100]]
	; CHECK-NEXT: [[BIN_RDX7:%.*]] = add <4 x i32> [[TMP102]], [[BIN_RDX]]			; CHECK-NEXT: [[BIN_RDX7:%.*]] = add <4 x i32> [[TMP102]], [[BIN_RDX]]
	; CHECK-NEXT: [[BIN_RDX8:%.*]] = add <4 x i32> [[TMP103]], [[BIN_RDX7]]			; CHECK-NEXT: [[BIN_RDX8:%.*]] = add <4 x i32> [[TMP103]], [[BIN_RDX7]]
	; CHECK-NEXT: [[TMP105:%.*]] = call i32 @llvm.vector.reduce.add.v4i32(<4 x i32> [[BIN_RDX8]])			; CHECK-NEXT: [[TMP105:%.*]] = call i32 @llvm.vector.reduce.add.v4i32(<4 x i32> [[BIN_RDX8]])
				; CHECK-NEXT: [[RDX_START:%.*]] = add i32 0, [[TMP105]]
	; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i64 4096, 4096			; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i64 4096, 4096
	; CHECK-NEXT: br i1 [[CMP_N]], label [[LOOP_EXIT:%.*]], label [[SCALAR_PH]]			; CHECK-NEXT: br i1 [[CMP_N]], label [[LOOP_EXIT:%.*]], label [[SCALAR_PH]]
	; CHECK: scalar.ph:			; CHECK: scalar.ph:
	; CHECK-NEXT: [[BC_RESUME_VAL:%.]] = phi i64 [ 4096, [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY:%.]] ]			; CHECK-NEXT: [[BC_RESUME_VAL:%.]] = phi i64 [ 4096, [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY:%.]] ]
	; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 0, [[ENTRY]] ], [ [[TMP105]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 0, [[ENTRY]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: br label [[LOOP:%.*]]			; CHECK-NEXT: br label [[LOOP:%.*]]
	; CHECK: loop:			; CHECK: loop:
	; CHECK-NEXT: [[IV:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[IV_NEXT:%.]], [[LATCH:%.*]] ]			; CHECK-NEXT: [[IV:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[IV_NEXT:%.]], [[LATCH:%.*]] ]
	; CHECK-NEXT: [[ACCUM:%.]] = phi i32 [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[ACCUM_NEXT:%.]], [[LATCH]] ]			; CHECK-NEXT: [[ACCUM:%.]] = phi i32 [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[ACCUM_NEXT:%.]], [[LATCH]] ]
	; CHECK-NEXT: [[IV_NEXT]] = add i64 [[IV]], 1			; CHECK-NEXT: [[IV_NEXT]] = add i64 [[IV]], 1
	; CHECK-NEXT: [[TEST_ADDR:%.]] = getelementptr inbounds i1, i1 [[TEST_BASE]], i64 [[IV]]			; CHECK-NEXT: [[TEST_ADDR:%.]] = getelementptr inbounds i1, i1 [[TEST_BASE]], i64 [[IV]]
	; CHECK-NEXT: [[EARLYCND:%.]] = load i1, i1 [[TEST_ADDR]], align 1			; CHECK-NEXT: [[EARLYCND:%.]] = load i1, i1 [[TEST_ADDR]], align 1
	; CHECK-NEXT: br i1 [[EARLYCND]], label [[PRED:%.*]], label [[LATCH]]			; CHECK-NEXT: br i1 [[EARLYCND]], label [[PRED:%.*]], label [[LATCH]]
	; CHECK: pred:			; CHECK: pred:
	; CHECK-NEXT: [[VAL:%.]] = load i32, i32 [[BASE]], align 4			; CHECK-NEXT: [[VAL:%.]] = load i32, i32 [[BASE]], align 4
	; CHECK-NEXT: br label [[LATCH]]			; CHECK-NEXT: br label [[LATCH]]
	; CHECK: latch:			; CHECK: latch:
	; CHECK-NEXT: [[VAL_PHI:%.*]] = phi i32 [ 0, [[LOOP]] ], [ [[VAL]], [[PRED]] ]			; CHECK-NEXT: [[VAL_PHI:%.*]] = phi i32 [ 0, [[LOOP]] ], [ [[VAL]], [[PRED]] ]
	; CHECK-NEXT: [[ACCUM_NEXT]] = add i32 [[ACCUM]], [[VAL_PHI]]			; CHECK-NEXT: [[ACCUM_NEXT]] = add i32 [[ACCUM]], [[VAL_PHI]]
	; CHECK-NEXT: [[EXIT:%.*]] = icmp ugt i64 [[IV]], 4094			; CHECK-NEXT: [[EXIT:%.*]] = icmp ugt i64 [[IV]], 4094
	; CHECK-NEXT: br i1 [[EXIT]], label [[LOOP_EXIT]], label [[LOOP]], !llvm.loop [[LOOP7:![0-9]+]]			; CHECK-NEXT: br i1 [[EXIT]], label [[LOOP_EXIT]], label [[LOOP]], !llvm.loop [[LOOP7:![0-9]+]]
	; CHECK: loop_exit:			; CHECK: loop_exit:
	; CHECK-NEXT: [[ACCUM_NEXT_LCSSA:%.*]] = phi i32 [ [[ACCUM_NEXT]], [[LATCH]] ], [ [[TMP105]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[ACCUM_NEXT_LCSSA:%.*]] = phi i32 [ [[ACCUM_NEXT]], [[LATCH]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: ret i32 [[ACCUM_NEXT_LCSSA]]			; CHECK-NEXT: ret i32 [[ACCUM_NEXT_LCSSA]]
	;			;
	entry:			entry:
	%alloca = alloca [4096 x i32]			%alloca = alloca [4096 x i32]
	%base = bitcast [4096 x i32]* %alloca to i32*			%base = bitcast [4096 x i32]* %alloca to i32*
	call void @init(i32* %base)			call void @init(i32* %base)
	br label %loop			br label %loop
	loop:			loop:
	▲ Show 20 Lines • Show All 287 Lines • ▼ Show 20 Lines
	; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 16			; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 16
	; CHECK-NEXT: [[TMP184:%.*]] = icmp eq i64 [[INDEX_NEXT]], 4096			; CHECK-NEXT: [[TMP184:%.*]] = icmp eq i64 [[INDEX_NEXT]], 4096
	; CHECK-NEXT: br i1 [[TMP184]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP8:![0-9]+]]			; CHECK-NEXT: br i1 [[TMP184]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP8:![0-9]+]]
	; CHECK: middle.block:			; CHECK: middle.block:
	; CHECK-NEXT: [[BIN_RDX:%.*]] = add <4 x i32> [[TMP181]], [[TMP180]]			; CHECK-NEXT: [[BIN_RDX:%.*]] = add <4 x i32> [[TMP181]], [[TMP180]]
	; CHECK-NEXT: [[BIN_RDX37:%.*]] = add <4 x i32> [[TMP182]], [[BIN_RDX]]			; CHECK-NEXT: [[BIN_RDX37:%.*]] = add <4 x i32> [[TMP182]], [[BIN_RDX]]
	; CHECK-NEXT: [[BIN_RDX38:%.*]] = add <4 x i32> [[TMP183]], [[BIN_RDX37]]			; CHECK-NEXT: [[BIN_RDX38:%.*]] = add <4 x i32> [[TMP183]], [[BIN_RDX37]]
	; CHECK-NEXT: [[TMP185:%.*]] = call i32 @llvm.vector.reduce.add.v4i32(<4 x i32> [[BIN_RDX38]])			; CHECK-NEXT: [[TMP185:%.*]] = call i32 @llvm.vector.reduce.add.v4i32(<4 x i32> [[BIN_RDX38]])
				; CHECK-NEXT: [[RDX_START:%.*]] = add i32 0, [[TMP185]]
	; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i64 4096, 4096			; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i64 4096, 4096
	; CHECK-NEXT: br i1 [[CMP_N]], label [[LOOP_EXIT:%.*]], label [[SCALAR_PH]]			; CHECK-NEXT: br i1 [[CMP_N]], label [[LOOP_EXIT:%.*]], label [[SCALAR_PH]]
	; CHECK: scalar.ph:			; CHECK: scalar.ph:
	; CHECK-NEXT: [[BC_RESUME_VAL:%.]] = phi i64 [ 4096, [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY:%.]] ]			; CHECK-NEXT: [[BC_RESUME_VAL:%.]] = phi i64 [ 4096, [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY:%.]] ]
	; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 0, [[ENTRY]] ], [ [[TMP185]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 0, [[ENTRY]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: br label [[LOOP:%.*]]			; CHECK-NEXT: br label [[LOOP:%.*]]
	; CHECK: loop:			; CHECK: loop:
	; CHECK-NEXT: [[IV:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[IV_NEXT:%.]], [[LATCH:%.*]] ]			; CHECK-NEXT: [[IV:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[IV_NEXT:%.]], [[LATCH:%.*]] ]
	; CHECK-NEXT: [[ACCUM:%.]] = phi i32 [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[ACCUM_NEXT:%.]], [[LATCH]] ]			; CHECK-NEXT: [[ACCUM:%.]] = phi i32 [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[ACCUM_NEXT:%.]], [[LATCH]] ]
	; CHECK-NEXT: [[IV_NEXT]] = add i64 [[IV]], 1			; CHECK-NEXT: [[IV_NEXT]] = add i64 [[IV]], 1
	; CHECK-NEXT: [[TEST_ADDR:%.]] = getelementptr inbounds i1, i1 [[TEST_BASE]], i64 [[IV]]			; CHECK-NEXT: [[TEST_ADDR:%.]] = getelementptr inbounds i1, i1 [[TEST_BASE]], i64 [[IV]]
	; CHECK-NEXT: [[EARLYCND:%.]] = load i1, i1 [[TEST_ADDR]], align 1			; CHECK-NEXT: [[EARLYCND:%.]] = load i1, i1 [[TEST_ADDR]], align 1
	; CHECK-NEXT: br i1 [[EARLYCND]], label [[PRED:%.*]], label [[LATCH]]			; CHECK-NEXT: br i1 [[EARLYCND]], label [[PRED:%.*]], label [[LATCH]]
	; CHECK: pred:			; CHECK: pred:
	; CHECK-NEXT: [[BASE_I16P:%.]] = bitcast i32 [[BASE]] to i16*			; CHECK-NEXT: [[BASE_I16P:%.]] = bitcast i32 [[BASE]] to i16*
	; CHECK-NEXT: [[ADDR_I16P:%.]] = getelementptr inbounds i16, i16 [[BASE_I16P]], i64 [[IV]]			; CHECK-NEXT: [[ADDR_I16P:%.]] = getelementptr inbounds i16, i16 [[BASE_I16P]], i64 [[IV]]
	; CHECK-NEXT: [[ADDR:%.]] = bitcast i16 [[ADDR_I16P]] to i32*			; CHECK-NEXT: [[ADDR:%.]] = bitcast i16 [[ADDR_I16P]] to i32*
	; CHECK-NEXT: [[VAL:%.]] = load i32, i32 [[ADDR]], align 4			; CHECK-NEXT: [[VAL:%.]] = load i32, i32 [[ADDR]], align 4
	; CHECK-NEXT: br label [[LATCH]]			; CHECK-NEXT: br label [[LATCH]]
	; CHECK: latch:			; CHECK: latch:
	; CHECK-NEXT: [[VAL_PHI:%.*]] = phi i32 [ 0, [[LOOP]] ], [ [[VAL]], [[PRED]] ]			; CHECK-NEXT: [[VAL_PHI:%.*]] = phi i32 [ 0, [[LOOP]] ], [ [[VAL]], [[PRED]] ]
	; CHECK-NEXT: [[ACCUM_NEXT]] = add i32 [[ACCUM]], [[VAL_PHI]]			; CHECK-NEXT: [[ACCUM_NEXT]] = add i32 [[ACCUM]], [[VAL_PHI]]
	; CHECK-NEXT: [[EXIT:%.*]] = icmp ugt i64 [[IV]], 4094			; CHECK-NEXT: [[EXIT:%.*]] = icmp ugt i64 [[IV]], 4094
	; CHECK-NEXT: br i1 [[EXIT]], label [[LOOP_EXIT]], label [[LOOP]], !llvm.loop [[LOOP9:![0-9]+]]			; CHECK-NEXT: br i1 [[EXIT]], label [[LOOP_EXIT]], label [[LOOP]], !llvm.loop [[LOOP9:![0-9]+]]
	; CHECK: loop_exit:			; CHECK: loop_exit:
	; CHECK-NEXT: [[ACCUM_NEXT_LCSSA:%.*]] = phi i32 [ [[ACCUM_NEXT]], [[LATCH]] ], [ [[TMP185]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[ACCUM_NEXT_LCSSA:%.*]] = phi i32 [ [[ACCUM_NEXT]], [[LATCH]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: ret i32 [[ACCUM_NEXT_LCSSA]]			; CHECK-NEXT: ret i32 [[ACCUM_NEXT_LCSSA]]
	;			;
	entry:			entry:
	%alloca = alloca [4096 x i32]			%alloca = alloca [4096 x i32]
	%base = bitcast [4096 x i32]* %alloca to i32*			%base = bitcast [4096 x i32]* %alloca to i32*
	call void @init(i32* %base)			call void @init(i32* %base)
	br label %loop			br label %loop
	loop:			loop:
	▲ Show 20 Lines • Show All 135 Lines • ▼ Show 20 Lines
	; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 16			; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 16
	; CHECK-NEXT: [[TMP85:%.*]] = icmp eq i64 [[INDEX_NEXT]], [[N_VEC]]			; CHECK-NEXT: [[TMP85:%.*]] = icmp eq i64 [[INDEX_NEXT]], [[N_VEC]]
	; CHECK-NEXT: br i1 [[TMP85]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP10:![0-9]+]]			; CHECK-NEXT: br i1 [[TMP85]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP10:![0-9]+]]
	; CHECK: middle.block:			; CHECK: middle.block:
	; CHECK-NEXT: [[BIN_RDX:%.*]] = add <4 x i32> [[TMP82]], [[TMP81]]			; CHECK-NEXT: [[BIN_RDX:%.*]] = add <4 x i32> [[TMP82]], [[TMP81]]
	; CHECK-NEXT: [[BIN_RDX10:%.*]] = add <4 x i32> [[TMP83]], [[BIN_RDX]]			; CHECK-NEXT: [[BIN_RDX10:%.*]] = add <4 x i32> [[TMP83]], [[BIN_RDX]]
	; CHECK-NEXT: [[BIN_RDX11:%.*]] = add <4 x i32> [[TMP84]], [[BIN_RDX10]]			; CHECK-NEXT: [[BIN_RDX11:%.*]] = add <4 x i32> [[TMP84]], [[BIN_RDX10]]
	; CHECK-NEXT: [[TMP86:%.*]] = call i32 @llvm.vector.reduce.add.v4i32(<4 x i32> [[BIN_RDX11]])			; CHECK-NEXT: [[TMP86:%.*]] = call i32 @llvm.vector.reduce.add.v4i32(<4 x i32> [[BIN_RDX11]])
				; CHECK-NEXT: [[RDX_START:%.*]] = add i32 0, [[TMP86]]
	; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i64 [[TMP0]], [[N_VEC]]			; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i64 [[TMP0]], [[N_VEC]]
	; CHECK-NEXT: br i1 [[CMP_N]], label [[LOOP_EXIT:%.*]], label [[SCALAR_PH]]			; CHECK-NEXT: br i1 [[CMP_N]], label [[LOOP_EXIT:%.*]], label [[SCALAR_PH]]
	; CHECK: scalar.ph:			; CHECK: scalar.ph:
	; CHECK-NEXT: [[BC_RESUME_VAL:%.]] = phi i64 [ [[N_VEC]], [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY:%.]] ]			; CHECK-NEXT: [[BC_RESUME_VAL:%.]] = phi i64 [ [[N_VEC]], [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY:%.]] ]
	; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 0, [[ENTRY]] ], [ [[TMP86]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 0, [[ENTRY]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: br label [[LOOP:%.*]]			; CHECK-NEXT: br label [[LOOP:%.*]]
	; CHECK: loop:			; CHECK: loop:
	; CHECK-NEXT: [[IV:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[IV_NEXT:%.]], [[LATCH:%.*]] ]			; CHECK-NEXT: [[IV:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[IV_NEXT:%.]], [[LATCH:%.*]] ]
	; CHECK-NEXT: [[ACCUM:%.]] = phi i32 [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[ACCUM_NEXT:%.]], [[LATCH]] ]			; CHECK-NEXT: [[ACCUM:%.]] = phi i32 [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[ACCUM_NEXT:%.]], [[LATCH]] ]
	; CHECK-NEXT: [[IV_NEXT]] = add i64 [[IV]], 1			; CHECK-NEXT: [[IV_NEXT]] = add i64 [[IV]], 1
	; CHECK-NEXT: [[TEST_ADDR:%.]] = getelementptr inbounds i1, i1 [[TEST_BASE]], i64 [[IV]]			; CHECK-NEXT: [[TEST_ADDR:%.]] = getelementptr inbounds i1, i1 [[TEST_BASE]], i64 [[IV]]
	; CHECK-NEXT: [[EARLYCND:%.]] = load i1, i1 [[TEST_ADDR]], align 1			; CHECK-NEXT: [[EARLYCND:%.]] = load i1, i1 [[TEST_ADDR]], align 1
	; CHECK-NEXT: br i1 [[EARLYCND]], label [[PRED:%.*]], label [[LATCH]]			; CHECK-NEXT: br i1 [[EARLYCND]], label [[PRED:%.*]], label [[LATCH]]
	; CHECK: pred:			; CHECK: pred:
	; CHECK-NEXT: [[ADDR:%.]] = getelementptr inbounds i32, i32 [[BASE]], i64 [[IV]]			; CHECK-NEXT: [[ADDR:%.]] = getelementptr inbounds i32, i32 [[BASE]], i64 [[IV]]
	; CHECK-NEXT: [[VAL:%.]] = load i32, i32 [[ADDR]], align 4			; CHECK-NEXT: [[VAL:%.]] = load i32, i32 [[ADDR]], align 4
	; CHECK-NEXT: br label [[LATCH]]			; CHECK-NEXT: br label [[LATCH]]
	; CHECK: latch:			; CHECK: latch:
	; CHECK-NEXT: [[VAL_PHI:%.*]] = phi i32 [ 0, [[LOOP]] ], [ [[VAL]], [[PRED]] ]			; CHECK-NEXT: [[VAL_PHI:%.*]] = phi i32 [ 0, [[LOOP]] ], [ [[VAL]], [[PRED]] ]
	; CHECK-NEXT: [[ACCUM_NEXT]] = add i32 [[ACCUM]], [[VAL_PHI]]			; CHECK-NEXT: [[ACCUM_NEXT]] = add i32 [[ACCUM]], [[VAL_PHI]]
	; CHECK-NEXT: [[EXIT:%.*]] = icmp ugt i64 [[IV]], [[MIN_N]]			; CHECK-NEXT: [[EXIT:%.*]] = icmp ugt i64 [[IV]], [[MIN_N]]
	; CHECK-NEXT: br i1 [[EXIT]], label [[LOOP_EXIT]], label [[LOOP]], !llvm.loop [[LOOP11:![0-9]+]]			; CHECK-NEXT: br i1 [[EXIT]], label [[LOOP_EXIT]], label [[LOOP]], !llvm.loop [[LOOP11:![0-9]+]]
	; CHECK: loop_exit:			; CHECK: loop_exit:
	; CHECK-NEXT: [[ACCUM_NEXT_LCSSA:%.*]] = phi i32 [ [[ACCUM_NEXT]], [[LATCH]] ], [ [[TMP86]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[ACCUM_NEXT_LCSSA:%.*]] = phi i32 [ [[ACCUM_NEXT]], [[LATCH]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: ret i32 [[ACCUM_NEXT_LCSSA]]			; CHECK-NEXT: ret i32 [[ACCUM_NEXT_LCSSA]]
	;			;
	entry:			entry:
	%alloca = alloca [4096 x i32]			%alloca = alloca [4096 x i32]
	%base = bitcast [4096 x i32]* %alloca to i32*			%base = bitcast [4096 x i32]* %alloca to i32*
	call void @init(i32* %base)			call void @init(i32* %base)
	%min.cmp = icmp ult i64 4096, %n			%min.cmp = icmp ult i64 4096, %n
	%min.n = select i1 %min.cmp, i64 4096, i64 %n			%min.n = select i1 %min.cmp, i64 4096, i64 %n
	▲ Show 20 Lines • Show All 133 Lines • ▼ Show 20 Lines
	; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 16			; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 16
	; CHECK-NEXT: [[TMP84:%.*]] = icmp eq i64 [[INDEX_NEXT]], 3072			; CHECK-NEXT: [[TMP84:%.*]] = icmp eq i64 [[INDEX_NEXT]], 3072
	; CHECK-NEXT: br i1 [[TMP84]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP12:![0-9]+]]			; CHECK-NEXT: br i1 [[TMP84]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP12:![0-9]+]]
	; CHECK: middle.block:			; CHECK: middle.block:
	; CHECK-NEXT: [[BIN_RDX:%.*]] = add <4 x i32> [[TMP81]], [[TMP80]]			; CHECK-NEXT: [[BIN_RDX:%.*]] = add <4 x i32> [[TMP81]], [[TMP80]]
	; CHECK-NEXT: [[BIN_RDX10:%.*]] = add <4 x i32> [[TMP82]], [[BIN_RDX]]			; CHECK-NEXT: [[BIN_RDX10:%.*]] = add <4 x i32> [[TMP82]], [[BIN_RDX]]
	; CHECK-NEXT: [[BIN_RDX11:%.*]] = add <4 x i32> [[TMP83]], [[BIN_RDX10]]			; CHECK-NEXT: [[BIN_RDX11:%.*]] = add <4 x i32> [[TMP83]], [[BIN_RDX10]]
	; CHECK-NEXT: [[TMP85:%.*]] = call i32 @llvm.vector.reduce.add.v4i32(<4 x i32> [[BIN_RDX11]])			; CHECK-NEXT: [[TMP85:%.*]] = call i32 @llvm.vector.reduce.add.v4i32(<4 x i32> [[BIN_RDX11]])
				; CHECK-NEXT: [[RDX_START:%.*]] = add i32 0, [[TMP85]]
	; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i64 3072, 3072			; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i64 3072, 3072
	; CHECK-NEXT: br i1 [[CMP_N]], label [[LOOP_EXIT:%.*]], label [[SCALAR_PH]]			; CHECK-NEXT: br i1 [[CMP_N]], label [[LOOP_EXIT:%.*]], label [[SCALAR_PH]]
	; CHECK: scalar.ph:			; CHECK: scalar.ph:
	; CHECK-NEXT: [[BC_RESUME_VAL:%.]] = phi i64 [ 4096, [[MIDDLE_BLOCK]] ], [ 1024, [[ENTRY:%.]] ]			; CHECK-NEXT: [[BC_RESUME_VAL:%.]] = phi i64 [ 4096, [[MIDDLE_BLOCK]] ], [ 1024, [[ENTRY:%.]] ]
	; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 0, [[ENTRY]] ], [ [[TMP85]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 0, [[ENTRY]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: br label [[LOOP:%.*]]			; CHECK-NEXT: br label [[LOOP:%.*]]
	; CHECK: loop:			; CHECK: loop:
	; CHECK-NEXT: [[IV:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[IV_NEXT:%.]], [[LATCH:%.*]] ]			; CHECK-NEXT: [[IV:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[IV_NEXT:%.]], [[LATCH:%.*]] ]
	; CHECK-NEXT: [[ACCUM:%.]] = phi i32 [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[ACCUM_NEXT:%.]], [[LATCH]] ]			; CHECK-NEXT: [[ACCUM:%.]] = phi i32 [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[ACCUM_NEXT:%.]], [[LATCH]] ]
	; CHECK-NEXT: [[IV_NEXT]] = add i64 [[IV]], 1			; CHECK-NEXT: [[IV_NEXT]] = add i64 [[IV]], 1
	; CHECK-NEXT: [[TEST_ADDR:%.]] = getelementptr inbounds i1, i1 [[TEST_BASE]], i64 [[IV]]			; CHECK-NEXT: [[TEST_ADDR:%.]] = getelementptr inbounds i1, i1 [[TEST_BASE]], i64 [[IV]]
	; CHECK-NEXT: [[EARLYCND:%.]] = load i1, i1 [[TEST_ADDR]], align 1			; CHECK-NEXT: [[EARLYCND:%.]] = load i1, i1 [[TEST_ADDR]], align 1
	; CHECK-NEXT: br i1 [[EARLYCND]], label [[PRED:%.*]], label [[LATCH]]			; CHECK-NEXT: br i1 [[EARLYCND]], label [[PRED:%.*]], label [[LATCH]]
	; CHECK: pred:			; CHECK: pred:
	; CHECK-NEXT: [[ADDR:%.]] = getelementptr inbounds i32, i32 [[BASE]], i64 [[IV]]			; CHECK-NEXT: [[ADDR:%.]] = getelementptr inbounds i32, i32 [[BASE]], i64 [[IV]]
	; CHECK-NEXT: [[VAL:%.]] = load i32, i32 [[ADDR]], align 4			; CHECK-NEXT: [[VAL:%.]] = load i32, i32 [[ADDR]], align 4
	; CHECK-NEXT: br label [[LATCH]]			; CHECK-NEXT: br label [[LATCH]]
	; CHECK: latch:			; CHECK: latch:
	; CHECK-NEXT: [[VAL_PHI:%.*]] = phi i32 [ 0, [[LOOP]] ], [ [[VAL]], [[PRED]] ]			; CHECK-NEXT: [[VAL_PHI:%.*]] = phi i32 [ 0, [[LOOP]] ], [ [[VAL]], [[PRED]] ]
	; CHECK-NEXT: [[ACCUM_NEXT]] = add i32 [[ACCUM]], [[VAL_PHI]]			; CHECK-NEXT: [[ACCUM_NEXT]] = add i32 [[ACCUM]], [[VAL_PHI]]
	; CHECK-NEXT: [[EXIT:%.*]] = icmp ugt i64 [[IV]], 4094			; CHECK-NEXT: [[EXIT:%.*]] = icmp ugt i64 [[IV]], 4094
	; CHECK-NEXT: br i1 [[EXIT]], label [[LOOP_EXIT]], label [[LOOP]], !llvm.loop [[LOOP13:![0-9]+]]			; CHECK-NEXT: br i1 [[EXIT]], label [[LOOP_EXIT]], label [[LOOP]], !llvm.loop [[LOOP13:![0-9]+]]
	; CHECK: loop_exit:			; CHECK: loop_exit:
	; CHECK-NEXT: [[ACCUM_NEXT_LCSSA:%.*]] = phi i32 [ [[ACCUM_NEXT]], [[LATCH]] ], [ [[TMP85]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[ACCUM_NEXT_LCSSA:%.*]] = phi i32 [ [[ACCUM_NEXT]], [[LATCH]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: ret i32 [[ACCUM_NEXT_LCSSA]]			; CHECK-NEXT: ret i32 [[ACCUM_NEXT_LCSSA]]
	;			;
	entry:			entry:
	%alloca = alloca [4096 x i32]			%alloca = alloca [4096 x i32]
	%base = bitcast [4096 x i32]* %alloca to i32*			%base = bitcast [4096 x i32]* %alloca to i32*
	call void @init(i32* %base)			call void @init(i32* %base)
	br label %loop			br label %loop
	loop:			loop:
	▲ Show 20 Lines • Show All 311 Lines • ▼ Show 20 Lines
	; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 16			; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 16
	; CHECK-NEXT: [[TMP152:%.*]] = icmp eq i64 [[INDEX_NEXT]], 2048			; CHECK-NEXT: [[TMP152:%.*]] = icmp eq i64 [[INDEX_NEXT]], 2048
	; CHECK-NEXT: br i1 [[TMP152]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP14:![0-9]+]]			; CHECK-NEXT: br i1 [[TMP152]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP14:![0-9]+]]
	; CHECK: middle.block:			; CHECK: middle.block:
	; CHECK-NEXT: [[BIN_RDX:%.*]] = add <4 x i32> [[TMP149]], [[TMP148]]			; CHECK-NEXT: [[BIN_RDX:%.*]] = add <4 x i32> [[TMP149]], [[TMP148]]
	; CHECK-NEXT: [[BIN_RDX37:%.*]] = add <4 x i32> [[TMP150]], [[BIN_RDX]]			; CHECK-NEXT: [[BIN_RDX37:%.*]] = add <4 x i32> [[TMP150]], [[BIN_RDX]]
	; CHECK-NEXT: [[BIN_RDX38:%.*]] = add <4 x i32> [[TMP151]], [[BIN_RDX37]]			; CHECK-NEXT: [[BIN_RDX38:%.*]] = add <4 x i32> [[TMP151]], [[BIN_RDX37]]
	; CHECK-NEXT: [[TMP153:%.*]] = call i32 @llvm.vector.reduce.add.v4i32(<4 x i32> [[BIN_RDX38]])			; CHECK-NEXT: [[TMP153:%.*]] = call i32 @llvm.vector.reduce.add.v4i32(<4 x i32> [[BIN_RDX38]])
				; CHECK-NEXT: [[RDX_START:%.*]] = add i32 0, [[TMP153]]
	; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i64 2048, 2048			; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i64 2048, 2048
	; CHECK-NEXT: br i1 [[CMP_N]], label [[LOOP_EXIT:%.*]], label [[SCALAR_PH]]			; CHECK-NEXT: br i1 [[CMP_N]], label [[LOOP_EXIT:%.*]], label [[SCALAR_PH]]
	; CHECK: scalar.ph:			; CHECK: scalar.ph:
	; CHECK-NEXT: [[BC_RESUME_VAL:%.]] = phi i64 [ 4096, [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY:%.]] ]			; CHECK-NEXT: [[BC_RESUME_VAL:%.]] = phi i64 [ 4096, [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY:%.]] ]
	; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 0, [[ENTRY]] ], [ [[TMP153]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 0, [[ENTRY]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: br label [[LOOP:%.*]]			; CHECK-NEXT: br label [[LOOP:%.*]]
	; CHECK: loop:			; CHECK: loop:
	; CHECK-NEXT: [[IV:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[IV_NEXT:%.]], [[LATCH:%.*]] ]			; CHECK-NEXT: [[IV:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[IV_NEXT:%.]], [[LATCH:%.*]] ]
	; CHECK-NEXT: [[ACCUM:%.]] = phi i32 [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[ACCUM_NEXT:%.]], [[LATCH]] ]			; CHECK-NEXT: [[ACCUM:%.]] = phi i32 [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[ACCUM_NEXT:%.]], [[LATCH]] ]
	; CHECK-NEXT: [[IV_NEXT]] = add i64 [[IV]], 2			; CHECK-NEXT: [[IV_NEXT]] = add i64 [[IV]], 2
	; CHECK-NEXT: [[TEST_ADDR:%.]] = getelementptr inbounds i1, i1 [[TEST_BASE]], i64 [[IV]]			; CHECK-NEXT: [[TEST_ADDR:%.]] = getelementptr inbounds i1, i1 [[TEST_BASE]], i64 [[IV]]
	; CHECK-NEXT: [[EARLYCND:%.]] = load i1, i1 [[TEST_ADDR]], align 1			; CHECK-NEXT: [[EARLYCND:%.]] = load i1, i1 [[TEST_ADDR]], align 1
	; CHECK-NEXT: br i1 [[EARLYCND]], label [[PRED:%.*]], label [[LATCH]]			; CHECK-NEXT: br i1 [[EARLYCND]], label [[PRED:%.*]], label [[LATCH]]
	; CHECK: pred:			; CHECK: pred:
	; CHECK-NEXT: [[ADDR:%.]] = getelementptr inbounds i32, i32 [[BASE]], i64 [[IV]]			; CHECK-NEXT: [[ADDR:%.]] = getelementptr inbounds i32, i32 [[BASE]], i64 [[IV]]
	; CHECK-NEXT: [[VAL:%.]] = load i32, i32 [[ADDR]], align 4			; CHECK-NEXT: [[VAL:%.]] = load i32, i32 [[ADDR]], align 4
	; CHECK-NEXT: br label [[LATCH]]			; CHECK-NEXT: br label [[LATCH]]
	; CHECK: latch:			; CHECK: latch:
	; CHECK-NEXT: [[VAL_PHI:%.*]] = phi i32 [ 0, [[LOOP]] ], [ [[VAL]], [[PRED]] ]			; CHECK-NEXT: [[VAL_PHI:%.*]] = phi i32 [ 0, [[LOOP]] ], [ [[VAL]], [[PRED]] ]
	; CHECK-NEXT: [[ACCUM_NEXT]] = add i32 [[ACCUM]], [[VAL_PHI]]			; CHECK-NEXT: [[ACCUM_NEXT]] = add i32 [[ACCUM]], [[VAL_PHI]]
	; CHECK-NEXT: [[EXIT:%.*]] = icmp ugt i64 [[IV]], 4093			; CHECK-NEXT: [[EXIT:%.*]] = icmp ugt i64 [[IV]], 4093
	; CHECK-NEXT: br i1 [[EXIT]], label [[LOOP_EXIT]], label [[LOOP]], !llvm.loop [[LOOP15:![0-9]+]]			; CHECK-NEXT: br i1 [[EXIT]], label [[LOOP_EXIT]], label [[LOOP]], !llvm.loop [[LOOP15:![0-9]+]]
	; CHECK: loop_exit:			; CHECK: loop_exit:
	; CHECK-NEXT: [[ACCUM_NEXT_LCSSA:%.*]] = phi i32 [ [[ACCUM_NEXT]], [[LATCH]] ], [ [[TMP153]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[ACCUM_NEXT_LCSSA:%.*]] = phi i32 [ [[ACCUM_NEXT]], [[LATCH]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: ret i32 [[ACCUM_NEXT_LCSSA]]			; CHECK-NEXT: ret i32 [[ACCUM_NEXT_LCSSA]]
	;			;
	entry:			entry:
	%alloca = alloca [4096 x i32]			%alloca = alloca [4096 x i32]
	%base = bitcast [4096 x i32]* %alloca to i32*			%base = bitcast [4096 x i32]* %alloca to i32*
	call void @init(i32* %base)			call void @init(i32* %base)
	br label %loop			br label %loop
	loop:			loop:
	▲ Show 20 Lines • Show All 127 Lines • ▼ Show 20 Lines
	; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 16			; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 16
	; CHECK-NEXT: [[TMP84:%.*]] = icmp eq i64 [[INDEX_NEXT]], 4096			; CHECK-NEXT: [[TMP84:%.*]] = icmp eq i64 [[INDEX_NEXT]], 4096
	; CHECK-NEXT: br i1 [[TMP84]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP16:![0-9]+]]			; CHECK-NEXT: br i1 [[TMP84]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP16:![0-9]+]]
	; CHECK: middle.block:			; CHECK: middle.block:
	; CHECK-NEXT: [[BIN_RDX:%.*]] = add <4 x i32> [[TMP81]], [[TMP80]]			; CHECK-NEXT: [[BIN_RDX:%.*]] = add <4 x i32> [[TMP81]], [[TMP80]]
	; CHECK-NEXT: [[BIN_RDX10:%.*]] = add <4 x i32> [[TMP82]], [[BIN_RDX]]			; CHECK-NEXT: [[BIN_RDX10:%.*]] = add <4 x i32> [[TMP82]], [[BIN_RDX]]
	; CHECK-NEXT: [[BIN_RDX11:%.*]] = add <4 x i32> [[TMP83]], [[BIN_RDX10]]			; CHECK-NEXT: [[BIN_RDX11:%.*]] = add <4 x i32> [[TMP83]], [[BIN_RDX10]]
	; CHECK-NEXT: [[TMP85:%.*]] = call i32 @llvm.vector.reduce.add.v4i32(<4 x i32> [[BIN_RDX11]])			; CHECK-NEXT: [[TMP85:%.*]] = call i32 @llvm.vector.reduce.add.v4i32(<4 x i32> [[BIN_RDX11]])
				; CHECK-NEXT: [[RDX_START:%.*]] = add i32 0, [[TMP85]]
	; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i64 4096, 4096			; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i64 4096, 4096
	; CHECK-NEXT: br i1 [[CMP_N]], label [[LOOP_EXIT:%.*]], label [[SCALAR_PH]]			; CHECK-NEXT: br i1 [[CMP_N]], label [[LOOP_EXIT:%.*]], label [[SCALAR_PH]]
	; CHECK: scalar.ph:			; CHECK: scalar.ph:
	; CHECK-NEXT: [[BC_RESUME_VAL:%.]] = phi i64 [ 4096, [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY:%.]] ]			; CHECK-NEXT: [[BC_RESUME_VAL:%.]] = phi i64 [ 4096, [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY:%.]] ]
	; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 0, [[ENTRY]] ], [ [[TMP85]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 0, [[ENTRY]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: br label [[LOOP:%.*]]			; CHECK-NEXT: br label [[LOOP:%.*]]
	; CHECK: loop:			; CHECK: loop:
	; CHECK-NEXT: [[IV:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[IV_NEXT:%.]], [[LATCH:%.*]] ]			; CHECK-NEXT: [[IV:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[IV_NEXT:%.]], [[LATCH:%.*]] ]
	; CHECK-NEXT: [[ACCUM:%.]] = phi i32 [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[ACCUM_NEXT:%.]], [[LATCH]] ]			; CHECK-NEXT: [[ACCUM:%.]] = phi i32 [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[ACCUM_NEXT:%.]], [[LATCH]] ]
	; CHECK-NEXT: [[IV_NEXT]] = add i64 [[IV]], 1			; CHECK-NEXT: [[IV_NEXT]] = add i64 [[IV]], 1
	; CHECK-NEXT: [[TEST_ADDR:%.]] = getelementptr inbounds i1, i1 [[TEST_BASE]], i64 [[IV]]			; CHECK-NEXT: [[TEST_ADDR:%.]] = getelementptr inbounds i1, i1 [[TEST_BASE]], i64 [[IV]]
	; CHECK-NEXT: [[EARLYCND:%.]] = load i1, i1 [[TEST_ADDR]], align 1			; CHECK-NEXT: [[EARLYCND:%.]] = load i1, i1 [[TEST_ADDR]], align 1
	; CHECK-NEXT: br i1 [[EARLYCND]], label [[PRED:%.*]], label [[LATCH]]			; CHECK-NEXT: br i1 [[EARLYCND]], label [[PRED:%.*]], label [[LATCH]]
	; CHECK: pred:			; CHECK: pred:
	; CHECK-NEXT: [[ADDR:%.]] = getelementptr inbounds i32, i32 [[BASE]], i64 [[IV]]			; CHECK-NEXT: [[ADDR:%.]] = getelementptr inbounds i32, i32 [[BASE]], i64 [[IV]]
	; CHECK-NEXT: [[VAL:%.]] = load i32, i32 [[ADDR]], align 4			; CHECK-NEXT: [[VAL:%.]] = load i32, i32 [[ADDR]], align 4
	; CHECK-NEXT: br label [[LATCH]]			; CHECK-NEXT: br label [[LATCH]]
	; CHECK: latch:			; CHECK: latch:
	; CHECK-NEXT: [[VAL_PHI:%.*]] = phi i32 [ 0, [[LOOP]] ], [ [[VAL]], [[PRED]] ]			; CHECK-NEXT: [[VAL_PHI:%.*]] = phi i32 [ 0, [[LOOP]] ], [ [[VAL]], [[PRED]] ]
	; CHECK-NEXT: [[ACCUM_NEXT]] = add i32 [[ACCUM]], [[VAL_PHI]]			; CHECK-NEXT: [[ACCUM_NEXT]] = add i32 [[ACCUM]], [[VAL_PHI]]
	; CHECK-NEXT: [[EXIT:%.*]] = icmp ugt i64 [[IV]], 4094			; CHECK-NEXT: [[EXIT:%.*]] = icmp ugt i64 [[IV]], 4094
	; CHECK-NEXT: br i1 [[EXIT]], label [[LOOP_EXIT]], label [[LOOP]], !llvm.loop [[LOOP17:![0-9]+]]			; CHECK-NEXT: br i1 [[EXIT]], label [[LOOP_EXIT]], label [[LOOP]], !llvm.loop [[LOOP17:![0-9]+]]
	; CHECK: loop_exit:			; CHECK: loop_exit:
	; CHECK-NEXT: [[ACCUM_NEXT_LCSSA:%.*]] = phi i32 [ [[ACCUM_NEXT]], [[LATCH]] ], [ [[TMP85]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[ACCUM_NEXT_LCSSA:%.*]] = phi i32 [ [[ACCUM_NEXT]], [[LATCH]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: ret i32 [[ACCUM_NEXT_LCSSA]]			; CHECK-NEXT: ret i32 [[ACCUM_NEXT_LCSSA]]
	;			;
	entry:			entry:
	%alloca = alloca [1024 x i32]			%alloca = alloca [1024 x i32]
	%base = bitcast [1024 x i32]* %alloca to i32*			%base = bitcast [1024 x i32]* %alloca to i32*
	call void @init(i32* %base)			call void @init(i32* %base)
	br label %loop			br label %loop
	loop:			loop:
	▲ Show 20 Lines • Show All 127 Lines • ▼ Show 20 Lines
	; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 16			; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 16
	; CHECK-NEXT: [[TMP84:%.*]] = icmp eq i64 [[INDEX_NEXT]], 4096			; CHECK-NEXT: [[TMP84:%.*]] = icmp eq i64 [[INDEX_NEXT]], 4096
	; CHECK-NEXT: br i1 [[TMP84]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP18:![0-9]+]]			; CHECK-NEXT: br i1 [[TMP84]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP18:![0-9]+]]
	; CHECK: middle.block:			; CHECK: middle.block:
	; CHECK-NEXT: [[BIN_RDX:%.*]] = add <4 x i32> [[TMP81]], [[TMP80]]			; CHECK-NEXT: [[BIN_RDX:%.*]] = add <4 x i32> [[TMP81]], [[TMP80]]
	; CHECK-NEXT: [[BIN_RDX10:%.*]] = add <4 x i32> [[TMP82]], [[BIN_RDX]]			; CHECK-NEXT: [[BIN_RDX10:%.*]] = add <4 x i32> [[TMP82]], [[BIN_RDX]]
	; CHECK-NEXT: [[BIN_RDX11:%.*]] = add <4 x i32> [[TMP83]], [[BIN_RDX10]]			; CHECK-NEXT: [[BIN_RDX11:%.*]] = add <4 x i32> [[TMP83]], [[BIN_RDX10]]
	; CHECK-NEXT: [[TMP85:%.*]] = call i32 @llvm.vector.reduce.add.v4i32(<4 x i32> [[BIN_RDX11]])			; CHECK-NEXT: [[TMP85:%.*]] = call i32 @llvm.vector.reduce.add.v4i32(<4 x i32> [[BIN_RDX11]])
				; CHECK-NEXT: [[RDX_START:%.*]] = add i32 0, [[TMP85]]
	; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i64 4096, 4096			; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i64 4096, 4096
	; CHECK-NEXT: br i1 [[CMP_N]], label [[LOOP_EXIT:%.*]], label [[SCALAR_PH]]			; CHECK-NEXT: br i1 [[CMP_N]], label [[LOOP_EXIT:%.*]], label [[SCALAR_PH]]
	; CHECK: scalar.ph:			; CHECK: scalar.ph:
	; CHECK-NEXT: [[BC_RESUME_VAL:%.]] = phi i64 [ 4096, [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY:%.]] ]			; CHECK-NEXT: [[BC_RESUME_VAL:%.]] = phi i64 [ 4096, [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY:%.]] ]
	; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 0, [[ENTRY]] ], [ [[TMP85]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 0, [[ENTRY]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: br label [[LOOP:%.*]]			; CHECK-NEXT: br label [[LOOP:%.*]]
	; CHECK: loop:			; CHECK: loop:
	; CHECK-NEXT: [[IV:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[IV_NEXT:%.]], [[LATCH:%.*]] ]			; CHECK-NEXT: [[IV:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[IV_NEXT:%.]], [[LATCH:%.*]] ]
	; CHECK-NEXT: [[ACCUM:%.]] = phi i32 [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[ACCUM_NEXT:%.]], [[LATCH]] ]			; CHECK-NEXT: [[ACCUM:%.]] = phi i32 [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[ACCUM_NEXT:%.]], [[LATCH]] ]
	; CHECK-NEXT: [[IV_NEXT]] = add i64 [[IV]], 1			; CHECK-NEXT: [[IV_NEXT]] = add i64 [[IV]], 1
	; CHECK-NEXT: [[TEST_ADDR:%.]] = getelementptr inbounds i1, i1 [[TEST_BASE]], i64 [[IV]]			; CHECK-NEXT: [[TEST_ADDR:%.]] = getelementptr inbounds i1, i1 [[TEST_BASE]], i64 [[IV]]
	; CHECK-NEXT: [[EARLYCND:%.]] = load i1, i1 [[TEST_ADDR]], align 1			; CHECK-NEXT: [[EARLYCND:%.]] = load i1, i1 [[TEST_ADDR]], align 1
	; CHECK-NEXT: br i1 [[EARLYCND]], label [[PRED:%.*]], label [[LATCH]]			; CHECK-NEXT: br i1 [[EARLYCND]], label [[PRED:%.*]], label [[LATCH]]
	; CHECK: pred:			; CHECK: pred:
	; CHECK-NEXT: [[ADDR:%.]] = getelementptr inbounds i32, i32 [[BASE]], i64 [[IV]]			; CHECK-NEXT: [[ADDR:%.]] = getelementptr inbounds i32, i32 [[BASE]], i64 [[IV]]
	; CHECK-NEXT: [[VAL:%.]] = load i32, i32 [[ADDR]], align 4			; CHECK-NEXT: [[VAL:%.]] = load i32, i32 [[ADDR]], align 4
	; CHECK-NEXT: br label [[LATCH]]			; CHECK-NEXT: br label [[LATCH]]
	; CHECK: latch:			; CHECK: latch:
	; CHECK-NEXT: [[VAL_PHI:%.*]] = phi i32 [ 0, [[LOOP]] ], [ [[VAL]], [[PRED]] ]			; CHECK-NEXT: [[VAL_PHI:%.*]] = phi i32 [ 0, [[LOOP]] ], [ [[VAL]], [[PRED]] ]
	; CHECK-NEXT: [[ACCUM_NEXT]] = add i32 [[ACCUM]], [[VAL_PHI]]			; CHECK-NEXT: [[ACCUM_NEXT]] = add i32 [[ACCUM]], [[VAL_PHI]]
	; CHECK-NEXT: [[EXIT:%.*]] = icmp ugt i64 [[IV]], 4094			; CHECK-NEXT: [[EXIT:%.*]] = icmp ugt i64 [[IV]], 4094
	; CHECK-NEXT: br i1 [[EXIT]], label [[LOOP_EXIT]], label [[LOOP]], !llvm.loop [[LOOP19:![0-9]+]]			; CHECK-NEXT: br i1 [[EXIT]], label [[LOOP_EXIT]], label [[LOOP]], !llvm.loop [[LOOP19:![0-9]+]]
	; CHECK: loop_exit:			; CHECK: loop_exit:
	; CHECK-NEXT: [[ACCUM_NEXT_LCSSA:%.*]] = phi i32 [ [[ACCUM_NEXT]], [[LATCH]] ], [ [[TMP85]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[ACCUM_NEXT_LCSSA:%.*]] = phi i32 [ [[ACCUM_NEXT]], [[LATCH]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: ret i32 [[ACCUM_NEXT_LCSSA]]			; CHECK-NEXT: ret i32 [[ACCUM_NEXT_LCSSA]]
	;			;
	entry:			entry:
	%alloca = alloca [4095 x i32]			%alloca = alloca [4095 x i32]
	%base = bitcast [4095 x i32]* %alloca to i32*			%base = bitcast [4095 x i32]* %alloca to i32*
	call void @init(i32* %base)			call void @init(i32* %base)
	br label %loop			br label %loop
	loop:			loop:
	▲ Show 20 Lines • Show All 127 Lines • ▼ Show 20 Lines
	; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 16			; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 16
	; CHECK-NEXT: [[TMP84:%.*]] = icmp eq i64 [[INDEX_NEXT]], 4096			; CHECK-NEXT: [[TMP84:%.*]] = icmp eq i64 [[INDEX_NEXT]], 4096
	; CHECK-NEXT: br i1 [[TMP84]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP20:![0-9]+]]			; CHECK-NEXT: br i1 [[TMP84]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP20:![0-9]+]]
	; CHECK: middle.block:			; CHECK: middle.block:
	; CHECK-NEXT: [[BIN_RDX:%.*]] = add <4 x i32> [[TMP81]], [[TMP80]]			; CHECK-NEXT: [[BIN_RDX:%.*]] = add <4 x i32> [[TMP81]], [[TMP80]]
	; CHECK-NEXT: [[BIN_RDX10:%.*]] = add <4 x i32> [[TMP82]], [[BIN_RDX]]			; CHECK-NEXT: [[BIN_RDX10:%.*]] = add <4 x i32> [[TMP82]], [[BIN_RDX]]
	; CHECK-NEXT: [[BIN_RDX11:%.*]] = add <4 x i32> [[TMP83]], [[BIN_RDX10]]			; CHECK-NEXT: [[BIN_RDX11:%.*]] = add <4 x i32> [[TMP83]], [[BIN_RDX10]]
	; CHECK-NEXT: [[TMP85:%.*]] = call i32 @llvm.vector.reduce.add.v4i32(<4 x i32> [[BIN_RDX11]])			; CHECK-NEXT: [[TMP85:%.*]] = call i32 @llvm.vector.reduce.add.v4i32(<4 x i32> [[BIN_RDX11]])
				; CHECK-NEXT: [[RDX_START:%.*]] = add i32 0, [[TMP85]]
	; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i64 4096, 4096			; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i64 4096, 4096
	; CHECK-NEXT: br i1 [[CMP_N]], label [[LOOP_EXIT:%.*]], label [[SCALAR_PH]]			; CHECK-NEXT: br i1 [[CMP_N]], label [[LOOP_EXIT:%.*]], label [[SCALAR_PH]]
	; CHECK: scalar.ph:			; CHECK: scalar.ph:
	; CHECK-NEXT: [[BC_RESUME_VAL:%.]] = phi i64 [ 4096, [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY:%.]] ]			; CHECK-NEXT: [[BC_RESUME_VAL:%.]] = phi i64 [ 4096, [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY:%.]] ]
	; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 0, [[ENTRY]] ], [ [[TMP85]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 0, [[ENTRY]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: br label [[LOOP:%.*]]			; CHECK-NEXT: br label [[LOOP:%.*]]
	; CHECK: loop:			; CHECK: loop:
	; CHECK-NEXT: [[IV:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[IV_NEXT:%.]], [[LATCH:%.*]] ]			; CHECK-NEXT: [[IV:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[IV_NEXT:%.]], [[LATCH:%.*]] ]
	; CHECK-NEXT: [[ACCUM:%.]] = phi i32 [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[ACCUM_NEXT:%.]], [[LATCH]] ]			; CHECK-NEXT: [[ACCUM:%.]] = phi i32 [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[ACCUM_NEXT:%.]], [[LATCH]] ]
	; CHECK-NEXT: [[IV_NEXT]] = add i64 [[IV]], 1			; CHECK-NEXT: [[IV_NEXT]] = add i64 [[IV]], 1
	; CHECK-NEXT: [[TEST_ADDR:%.]] = getelementptr inbounds i1, i1 [[TEST_BASE]], i64 [[IV]]			; CHECK-NEXT: [[TEST_ADDR:%.]] = getelementptr inbounds i1, i1 [[TEST_BASE]], i64 [[IV]]
	; CHECK-NEXT: [[EARLYCND:%.]] = load i1, i1 [[TEST_ADDR]], align 1			; CHECK-NEXT: [[EARLYCND:%.]] = load i1, i1 [[TEST_ADDR]], align 1
	; CHECK-NEXT: br i1 [[EARLYCND]], label [[PRED:%.*]], label [[LATCH]]			; CHECK-NEXT: br i1 [[EARLYCND]], label [[PRED:%.*]], label [[LATCH]]
	; CHECK: pred:			; CHECK: pred:
	; CHECK-NEXT: [[ADDR:%.]] = getelementptr inbounds i32, i32 [[BASE]], i64 [[IV]]			; CHECK-NEXT: [[ADDR:%.]] = getelementptr inbounds i32, i32 [[BASE]], i64 [[IV]]
	; CHECK-NEXT: [[VAL:%.]] = load i32, i32 [[ADDR]], align 4			; CHECK-NEXT: [[VAL:%.]] = load i32, i32 [[ADDR]], align 4
	; CHECK-NEXT: br label [[LATCH]]			; CHECK-NEXT: br label [[LATCH]]
	; CHECK: latch:			; CHECK: latch:
	; CHECK-NEXT: [[VAL_PHI:%.*]] = phi i32 [ 0, [[LOOP]] ], [ [[VAL]], [[PRED]] ]			; CHECK-NEXT: [[VAL_PHI:%.*]] = phi i32 [ 0, [[LOOP]] ], [ [[VAL]], [[PRED]] ]
	; CHECK-NEXT: [[ACCUM_NEXT]] = add i32 [[ACCUM]], [[VAL_PHI]]			; CHECK-NEXT: [[ACCUM_NEXT]] = add i32 [[ACCUM]], [[VAL_PHI]]
	; CHECK-NEXT: [[EXIT:%.*]] = icmp ugt i64 [[IV]], 4094			; CHECK-NEXT: [[EXIT:%.*]] = icmp ugt i64 [[IV]], 4094
	; CHECK-NEXT: br i1 [[EXIT]], label [[LOOP_EXIT]], label [[LOOP]], !llvm.loop [[LOOP21:![0-9]+]]			; CHECK-NEXT: br i1 [[EXIT]], label [[LOOP_EXIT]], label [[LOOP]], !llvm.loop [[LOOP21:![0-9]+]]
	; CHECK: loop_exit:			; CHECK: loop_exit:
	; CHECK-NEXT: [[ACCUM_NEXT_LCSSA:%.*]] = phi i32 [ [[ACCUM_NEXT]], [[LATCH]] ], [ [[TMP85]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[ACCUM_NEXT_LCSSA:%.*]] = phi i32 [ [[ACCUM_NEXT]], [[LATCH]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: ret i32 [[ACCUM_NEXT_LCSSA]]			; CHECK-NEXT: ret i32 [[ACCUM_NEXT_LCSSA]]
	;			;
	entry:			entry:
	%alloca = alloca [16383 x i8]			%alloca = alloca [16383 x i8]
	%base = bitcast [16383 x i8]* %alloca to i32*			%base = bitcast [16383 x i8]* %alloca to i32*
	call void @init(i32* %base)			call void @init(i32* %base)
	br label %loop			br label %loop
	loop:			loop:
	▲ Show 20 Lines • Show All 136 Lines • ▼ Show 20 Lines
	; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 16			; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 16
	; CHECK-NEXT: [[TMP85:%.*]] = icmp eq i64 [[INDEX_NEXT]], [[N_VEC]]			; CHECK-NEXT: [[TMP85:%.*]] = icmp eq i64 [[INDEX_NEXT]], [[N_VEC]]
	; CHECK-NEXT: br i1 [[TMP85]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP22:![0-9]+]]			; CHECK-NEXT: br i1 [[TMP85]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP22:![0-9]+]]
	; CHECK: middle.block:			; CHECK: middle.block:
	; CHECK-NEXT: [[BIN_RDX:%.*]] = add <4 x i32> [[TMP82]], [[TMP81]]			; CHECK-NEXT: [[BIN_RDX:%.*]] = add <4 x i32> [[TMP82]], [[TMP81]]
	; CHECK-NEXT: [[BIN_RDX10:%.*]] = add <4 x i32> [[TMP83]], [[BIN_RDX]]			; CHECK-NEXT: [[BIN_RDX10:%.*]] = add <4 x i32> [[TMP83]], [[BIN_RDX]]
	; CHECK-NEXT: [[BIN_RDX11:%.*]] = add <4 x i32> [[TMP84]], [[BIN_RDX10]]			; CHECK-NEXT: [[BIN_RDX11:%.*]] = add <4 x i32> [[TMP84]], [[BIN_RDX10]]
	; CHECK-NEXT: [[TMP86:%.*]] = call i32 @llvm.vector.reduce.add.v4i32(<4 x i32> [[BIN_RDX11]])			; CHECK-NEXT: [[TMP86:%.*]] = call i32 @llvm.vector.reduce.add.v4i32(<4 x i32> [[BIN_RDX11]])
				; CHECK-NEXT: [[RDX_START:%.*]] = add i32 0, [[TMP86]]
	; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i64 [[TMP0]], [[N_VEC]]			; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i64 [[TMP0]], [[N_VEC]]
	; CHECK-NEXT: br i1 [[CMP_N]], label [[LOOP_EXIT:%.*]], label [[SCALAR_PH]]			; CHECK-NEXT: br i1 [[CMP_N]], label [[LOOP_EXIT:%.*]], label [[SCALAR_PH]]
	; CHECK: scalar.ph:			; CHECK: scalar.ph:
	; CHECK-NEXT: [[BC_RESUME_VAL:%.]] = phi i64 [ [[N_VEC]], [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY:%.]] ]			; CHECK-NEXT: [[BC_RESUME_VAL:%.]] = phi i64 [ [[N_VEC]], [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY:%.]] ]
	; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 0, [[ENTRY]] ], [ [[TMP86]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 0, [[ENTRY]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: br label [[LOOP:%.*]]			; CHECK-NEXT: br label [[LOOP:%.*]]
	; CHECK: loop:			; CHECK: loop:
	; CHECK-NEXT: [[IV:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[IV_NEXT:%.]], [[LATCH:%.*]] ]			; CHECK-NEXT: [[IV:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[IV_NEXT:%.]], [[LATCH:%.*]] ]
	; CHECK-NEXT: [[ACCUM:%.]] = phi i32 [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[ACCUM_NEXT:%.]], [[LATCH]] ]			; CHECK-NEXT: [[ACCUM:%.]] = phi i32 [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[ACCUM_NEXT:%.]], [[LATCH]] ]
	; CHECK-NEXT: [[IV_NEXT]] = add i64 [[IV]], 1			; CHECK-NEXT: [[IV_NEXT]] = add i64 [[IV]], 1
	; CHECK-NEXT: [[TEST_ADDR:%.]] = getelementptr inbounds i1, i1 [[TEST_BASE]], i64 [[IV]]			; CHECK-NEXT: [[TEST_ADDR:%.]] = getelementptr inbounds i1, i1 [[TEST_BASE]], i64 [[IV]]
	; CHECK-NEXT: [[EARLYCND:%.]] = load i1, i1 [[TEST_ADDR]], align 1			; CHECK-NEXT: [[EARLYCND:%.]] = load i1, i1 [[TEST_ADDR]], align 1
	; CHECK-NEXT: br i1 [[EARLYCND]], label [[PRED:%.*]], label [[LATCH]]			; CHECK-NEXT: br i1 [[EARLYCND]], label [[PRED:%.*]], label [[LATCH]]
	; CHECK: pred:			; CHECK: pred:
	; CHECK-NEXT: [[ADDR:%.]] = getelementptr inbounds i32, i32 [[BASE]], i64 [[IV]]			; CHECK-NEXT: [[ADDR:%.]] = getelementptr inbounds i32, i32 [[BASE]], i64 [[IV]]
	; CHECK-NEXT: [[VAL:%.]] = load i32, i32 [[ADDR]], align 4			; CHECK-NEXT: [[VAL:%.]] = load i32, i32 [[ADDR]], align 4
	; CHECK-NEXT: br label [[LATCH]]			; CHECK-NEXT: br label [[LATCH]]
	; CHECK: latch:			; CHECK: latch:
	; CHECK-NEXT: [[VAL_PHI:%.*]] = phi i32 [ 0, [[LOOP]] ], [ [[VAL]], [[PRED]] ]			; CHECK-NEXT: [[VAL_PHI:%.*]] = phi i32 [ 0, [[LOOP]] ], [ [[VAL]], [[PRED]] ]
	; CHECK-NEXT: [[ACCUM_NEXT]] = add i32 [[ACCUM]], [[VAL_PHI]]			; CHECK-NEXT: [[ACCUM_NEXT]] = add i32 [[ACCUM]], [[VAL_PHI]]
	; CHECK-NEXT: [[EXIT:%.*]] = icmp ugt i64 [[IV]], [[MIN]]			; CHECK-NEXT: [[EXIT:%.*]] = icmp ugt i64 [[IV]], [[MIN]]
	; CHECK-NEXT: br i1 [[EXIT]], label [[LOOP_EXIT]], label [[LOOP]], !llvm.loop [[LOOP23:![0-9]+]]			; CHECK-NEXT: br i1 [[EXIT]], label [[LOOP_EXIT]], label [[LOOP]], !llvm.loop [[LOOP23:![0-9]+]]
	; CHECK: loop_exit:			; CHECK: loop_exit:
	; CHECK-NEXT: [[ACCUM_NEXT_LCSSA:%.*]] = phi i32 [ [[ACCUM_NEXT]], [[LATCH]] ], [ [[TMP86]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[ACCUM_NEXT_LCSSA:%.*]] = phi i32 [ [[ACCUM_NEXT]], [[LATCH]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: ret i32 [[ACCUM_NEXT_LCSSA]]			; CHECK-NEXT: ret i32 [[ACCUM_NEXT_LCSSA]]
	;			;
	entry:			entry:
	%alloca = alloca [4096 x i32]			%alloca = alloca [4096 x i32]
	%base = bitcast [4096 x i32]* %alloca to i32*			%base = bitcast [4096 x i32]* %alloca to i32*
	call void @init(i32* %base)			call void @init(i32* %base)
	%cmp = icmp ugt i64 %len, 4094			%cmp = icmp ugt i64 %len, 4094
	%min = select i1 %cmp, i64 4094, i64 %len			%min = select i1 %cmp, i64 4094, i64 %len
	▲ Show 20 Lines • Show All 134 Lines • ▼ Show 20 Lines
	; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 16			; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 16
	; CHECK-NEXT: [[TMP84:%.*]] = icmp eq i64 [[INDEX_NEXT]], 4096			; CHECK-NEXT: [[TMP84:%.*]] = icmp eq i64 [[INDEX_NEXT]], 4096
	; CHECK-NEXT: br i1 [[TMP84]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP24:![0-9]+]]			; CHECK-NEXT: br i1 [[TMP84]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP24:![0-9]+]]
	; CHECK: middle.block:			; CHECK: middle.block:
	; CHECK-NEXT: [[BIN_RDX:%.*]] = add <4 x i32> [[TMP81]], [[TMP80]]			; CHECK-NEXT: [[BIN_RDX:%.*]] = add <4 x i32> [[TMP81]], [[TMP80]]
	; CHECK-NEXT: [[BIN_RDX10:%.*]] = add <4 x i32> [[TMP82]], [[BIN_RDX]]			; CHECK-NEXT: [[BIN_RDX10:%.*]] = add <4 x i32> [[TMP82]], [[BIN_RDX]]
	; CHECK-NEXT: [[BIN_RDX11:%.*]] = add <4 x i32> [[TMP83]], [[BIN_RDX10]]			; CHECK-NEXT: [[BIN_RDX11:%.*]] = add <4 x i32> [[TMP83]], [[BIN_RDX10]]
	; CHECK-NEXT: [[TMP85:%.*]] = call i32 @llvm.vector.reduce.add.v4i32(<4 x i32> [[BIN_RDX11]])			; CHECK-NEXT: [[TMP85:%.*]] = call i32 @llvm.vector.reduce.add.v4i32(<4 x i32> [[BIN_RDX11]])
				; CHECK-NEXT: [[RDX_START:%.*]] = add i32 0, [[TMP85]]
	; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i64 4096, 4096			; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i64 4096, 4096
	; CHECK-NEXT: br i1 [[CMP_N]], label [[LOOP_EXIT:%.*]], label [[SCALAR_PH]]			; CHECK-NEXT: br i1 [[CMP_N]], label [[LOOP_EXIT:%.*]], label [[SCALAR_PH]]
	; CHECK: scalar.ph:			; CHECK: scalar.ph:
	; CHECK-NEXT: [[BC_RESUME_VAL:%.]] = phi i64 [ 4096, [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY:%.]] ]			; CHECK-NEXT: [[BC_RESUME_VAL:%.]] = phi i64 [ 4096, [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY:%.]] ]
	; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 0, [[ENTRY]] ], [ [[TMP85]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 0, [[ENTRY]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: br label [[LOOP:%.*]]			; CHECK-NEXT: br label [[LOOP:%.*]]
	; CHECK: loop:			; CHECK: loop:
	; CHECK-NEXT: [[IV:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[IV_NEXT:%.]], [[LATCH:%.*]] ]			; CHECK-NEXT: [[IV:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[IV_NEXT:%.]], [[LATCH:%.*]] ]
	; CHECK-NEXT: [[ACCUM:%.]] = phi i32 [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[ACCUM_NEXT:%.]], [[LATCH]] ]			; CHECK-NEXT: [[ACCUM:%.]] = phi i32 [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[ACCUM_NEXT:%.]], [[LATCH]] ]
	; CHECK-NEXT: [[IV_NEXT]] = add i64 [[IV]], 1			; CHECK-NEXT: [[IV_NEXT]] = add i64 [[IV]], 1
	; CHECK-NEXT: [[TEST_ADDR:%.]] = getelementptr inbounds i1, i1 [[TEST_BASE]], i64 [[IV]]			; CHECK-NEXT: [[TEST_ADDR:%.]] = getelementptr inbounds i1, i1 [[TEST_BASE]], i64 [[IV]]
	; CHECK-NEXT: [[EARLYCND:%.]] = load i1, i1 [[TEST_ADDR]], align 1			; CHECK-NEXT: [[EARLYCND:%.]] = load i1, i1 [[TEST_ADDR]], align 1
	; CHECK-NEXT: br i1 [[EARLYCND]], label [[PRED:%.*]], label [[LATCH]]			; CHECK-NEXT: br i1 [[EARLYCND]], label [[PRED:%.*]], label [[LATCH]]
	; CHECK: pred:			; CHECK: pred:
	; CHECK-NEXT: [[ADDR:%.]] = getelementptr inbounds i32, i32 [[BASE]], i64 [[IV]]			; CHECK-NEXT: [[ADDR:%.]] = getelementptr inbounds i32, i32 [[BASE]], i64 [[IV]]
	; CHECK-NEXT: [[VAL:%.]] = load i32, i32 [[ADDR]], align 4			; CHECK-NEXT: [[VAL:%.]] = load i32, i32 [[ADDR]], align 4
	; CHECK-NEXT: br label [[LATCH]]			; CHECK-NEXT: br label [[LATCH]]
	; CHECK: latch:			; CHECK: latch:
	; CHECK-NEXT: [[VAL_PHI:%.*]] = phi i32 [ 0, [[LOOP]] ], [ [[VAL]], [[PRED]] ]			; CHECK-NEXT: [[VAL_PHI:%.*]] = phi i32 [ 0, [[LOOP]] ], [ [[VAL]], [[PRED]] ]
	; CHECK-NEXT: [[ACCUM_NEXT]] = add i32 [[ACCUM]], [[VAL_PHI]]			; CHECK-NEXT: [[ACCUM_NEXT]] = add i32 [[ACCUM]], [[VAL_PHI]]
	; CHECK-NEXT: [[EXIT:%.*]] = icmp ugt i64 [[IV]], 4094			; CHECK-NEXT: [[EXIT:%.*]] = icmp ugt i64 [[IV]], 4094
	; CHECK-NEXT: br i1 [[EXIT]], label [[LOOP_EXIT]], label [[LOOP]], !llvm.loop [[LOOP25:![0-9]+]]			; CHECK-NEXT: br i1 [[EXIT]], label [[LOOP_EXIT]], label [[LOOP]], !llvm.loop [[LOOP25:![0-9]+]]
	; CHECK: loop_exit:			; CHECK: loop_exit:
	; CHECK-NEXT: [[ACCUM_NEXT_LCSSA:%.*]] = phi i32 [ [[ACCUM_NEXT]], [[LATCH]] ], [ [[TMP85]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[ACCUM_NEXT_LCSSA:%.*]] = phi i32 [ [[ACCUM_NEXT]], [[LATCH]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: ret i32 [[ACCUM_NEXT_LCSSA]]			; CHECK-NEXT: ret i32 [[ACCUM_NEXT_LCSSA]]
	;			;
	entry:			entry:
	%allocation = call nonnull i8* @my_alloc(i32 16384)			%allocation = call nonnull i8* @my_alloc(i32 16384)
	%base = bitcast i8* %allocation to i32*			%base = bitcast i8* %allocation to i32*
	call void @init(i32* %base)			call void @init(i32* %base)
	br label %loop			br label %loop
	loop:			loop:
	▲ Show 20 Lines • Show All 128 Lines • ▼ Show 20 Lines
	; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 16			; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 16
	; CHECK-NEXT: [[TMP84:%.*]] = icmp eq i64 [[INDEX_NEXT]], 4096			; CHECK-NEXT: [[TMP84:%.*]] = icmp eq i64 [[INDEX_NEXT]], 4096
	; CHECK-NEXT: br i1 [[TMP84]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP26:![0-9]+]]			; CHECK-NEXT: br i1 [[TMP84]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP26:![0-9]+]]
	; CHECK: middle.block:			; CHECK: middle.block:
	; CHECK-NEXT: [[BIN_RDX:%.*]] = add <4 x i32> [[TMP81]], [[TMP80]]			; CHECK-NEXT: [[BIN_RDX:%.*]] = add <4 x i32> [[TMP81]], [[TMP80]]
	; CHECK-NEXT: [[BIN_RDX10:%.*]] = add <4 x i32> [[TMP82]], [[BIN_RDX]]			; CHECK-NEXT: [[BIN_RDX10:%.*]] = add <4 x i32> [[TMP82]], [[BIN_RDX]]
	; CHECK-NEXT: [[BIN_RDX11:%.*]] = add <4 x i32> [[TMP83]], [[BIN_RDX10]]			; CHECK-NEXT: [[BIN_RDX11:%.*]] = add <4 x i32> [[TMP83]], [[BIN_RDX10]]
	; CHECK-NEXT: [[TMP85:%.*]] = call i32 @llvm.vector.reduce.add.v4i32(<4 x i32> [[BIN_RDX11]])			; CHECK-NEXT: [[TMP85:%.*]] = call i32 @llvm.vector.reduce.add.v4i32(<4 x i32> [[BIN_RDX11]])
				; CHECK-NEXT: [[RDX_START:%.*]] = add i32 0, [[TMP85]]
	; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i64 4096, 4096			; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i64 4096, 4096
	; CHECK-NEXT: br i1 [[CMP_N]], label [[LOOP_EXIT:%.*]], label [[SCALAR_PH]]			; CHECK-NEXT: br i1 [[CMP_N]], label [[LOOP_EXIT:%.*]], label [[SCALAR_PH]]
	; CHECK: scalar.ph:			; CHECK: scalar.ph:
	; CHECK-NEXT: [[BC_RESUME_VAL:%.]] = phi i64 [ 4096, [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY:%.]] ]			; CHECK-NEXT: [[BC_RESUME_VAL:%.]] = phi i64 [ 4096, [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY:%.]] ]
	; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 0, [[ENTRY]] ], [ [[TMP85]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 0, [[ENTRY]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: br label [[LOOP:%.*]]			; CHECK-NEXT: br label [[LOOP:%.*]]
	; CHECK: loop:			; CHECK: loop:
	; CHECK-NEXT: [[IV:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[IV_NEXT:%.]], [[LATCH:%.*]] ]			; CHECK-NEXT: [[IV:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[IV_NEXT:%.]], [[LATCH:%.*]] ]
	; CHECK-NEXT: [[ACCUM:%.]] = phi i32 [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[ACCUM_NEXT:%.]], [[LATCH]] ]			; CHECK-NEXT: [[ACCUM:%.]] = phi i32 [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[ACCUM_NEXT:%.]], [[LATCH]] ]
	; CHECK-NEXT: [[IV_NEXT]] = add i64 [[IV]], 1			; CHECK-NEXT: [[IV_NEXT]] = add i64 [[IV]], 1
	; CHECK-NEXT: [[TEST_ADDR:%.]] = getelementptr inbounds i1, i1 [[TEST_BASE]], i64 [[IV]]			; CHECK-NEXT: [[TEST_ADDR:%.]] = getelementptr inbounds i1, i1 [[TEST_BASE]], i64 [[IV]]
	; CHECK-NEXT: [[EARLYCND:%.]] = load i1, i1 [[TEST_ADDR]], align 1			; CHECK-NEXT: [[EARLYCND:%.]] = load i1, i1 [[TEST_ADDR]], align 1
	; CHECK-NEXT: br i1 [[EARLYCND]], label [[PRED:%.*]], label [[LATCH]]			; CHECK-NEXT: br i1 [[EARLYCND]], label [[PRED:%.*]], label [[LATCH]]
	; CHECK: pred:			; CHECK: pred:
	; CHECK-NEXT: [[ADDR:%.]] = getelementptr inbounds i32, i32 [[BASE]], i64 [[IV]]			; CHECK-NEXT: [[ADDR:%.]] = getelementptr inbounds i32, i32 [[BASE]], i64 [[IV]]
	; CHECK-NEXT: [[VAL:%.]] = load i32, i32 [[ADDR]], align 4			; CHECK-NEXT: [[VAL:%.]] = load i32, i32 [[ADDR]], align 4
	; CHECK-NEXT: br label [[LATCH]]			; CHECK-NEXT: br label [[LATCH]]
	; CHECK: latch:			; CHECK: latch:
	; CHECK-NEXT: [[VAL_PHI:%.*]] = phi i32 [ 0, [[LOOP]] ], [ [[VAL]], [[PRED]] ]			; CHECK-NEXT: [[VAL_PHI:%.*]] = phi i32 [ 0, [[LOOP]] ], [ [[VAL]], [[PRED]] ]
	; CHECK-NEXT: [[ACCUM_NEXT]] = add i32 [[ACCUM]], [[VAL_PHI]]			; CHECK-NEXT: [[ACCUM_NEXT]] = add i32 [[ACCUM]], [[VAL_PHI]]
	; CHECK-NEXT: [[EXIT:%.*]] = icmp ugt i64 [[IV]], 4094			; CHECK-NEXT: [[EXIT:%.*]] = icmp ugt i64 [[IV]], 4094
	; CHECK-NEXT: br i1 [[EXIT]], label [[LOOP_EXIT]], label [[LOOP]], !llvm.loop [[LOOP27:![0-9]+]]			; CHECK-NEXT: br i1 [[EXIT]], label [[LOOP_EXIT]], label [[LOOP]], !llvm.loop [[LOOP27:![0-9]+]]
	; CHECK: loop_exit:			; CHECK: loop_exit:
	; CHECK-NEXT: [[ACCUM_NEXT_LCSSA:%.*]] = phi i32 [ [[ACCUM_NEXT]], [[LATCH]] ], [ [[TMP85]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[ACCUM_NEXT_LCSSA:%.*]] = phi i32 [ [[ACCUM_NEXT]], [[LATCH]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: ret i32 [[ACCUM_NEXT_LCSSA]]			; CHECK-NEXT: ret i32 [[ACCUM_NEXT_LCSSA]]
	;			;
	entry:			entry:
	%allocation = call nonnull i8* @my_array_alloc(i32 4096, i32 4)			%allocation = call nonnull i8* @my_array_alloc(i32 4096, i32 4)
	%base = bitcast i8* %allocation to i32*			%base = bitcast i8* %allocation to i32*
	call void @init(i32* %base)			call void @init(i32* %base)
	br label %loop			br label %loop
	loop:			loop:
	▲ Show 20 Lines • Show All 138 Lines • ▼ Show 20 Lines
	; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 16			; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 16
	; CHECK-NEXT: [[TMP84:%.*]] = icmp eq i64 [[INDEX_NEXT]], 4096			; CHECK-NEXT: [[TMP84:%.*]] = icmp eq i64 [[INDEX_NEXT]], 4096
	; CHECK-NEXT: br i1 [[TMP84]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP28:![0-9]+]]			; CHECK-NEXT: br i1 [[TMP84]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP28:![0-9]+]]
	; CHECK: middle.block:			; CHECK: middle.block:
	; CHECK-NEXT: [[BIN_RDX:%.*]] = add <4 x i32> [[TMP81]], [[TMP80]]			; CHECK-NEXT: [[BIN_RDX:%.*]] = add <4 x i32> [[TMP81]], [[TMP80]]
	; CHECK-NEXT: [[BIN_RDX10:%.*]] = add <4 x i32> [[TMP82]], [[BIN_RDX]]			; CHECK-NEXT: [[BIN_RDX10:%.*]] = add <4 x i32> [[TMP82]], [[BIN_RDX]]
	; CHECK-NEXT: [[BIN_RDX11:%.*]] = add <4 x i32> [[TMP83]], [[BIN_RDX10]]			; CHECK-NEXT: [[BIN_RDX11:%.*]] = add <4 x i32> [[TMP83]], [[BIN_RDX10]]
	; CHECK-NEXT: [[TMP85:%.*]] = call i32 @llvm.vector.reduce.add.v4i32(<4 x i32> [[BIN_RDX11]])			; CHECK-NEXT: [[TMP85:%.*]] = call i32 @llvm.vector.reduce.add.v4i32(<4 x i32> [[BIN_RDX11]])
				; CHECK-NEXT: [[RDX_START:%.*]] = add i32 0, [[TMP85]]
	; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i64 4096, 4096			; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i64 4096, 4096
	; CHECK-NEXT: br i1 [[CMP_N]], label [[LOOP_EXIT:%.*]], label [[SCALAR_PH]]			; CHECK-NEXT: br i1 [[CMP_N]], label [[LOOP_EXIT:%.*]], label [[SCALAR_PH]]
	; CHECK: scalar.ph:			; CHECK: scalar.ph:
	; CHECK-NEXT: [[BC_RESUME_VAL:%.*]] = phi i64 [ 4096, [[MIDDLE_BLOCK]] ], [ 0, [[PREHEADER]] ]			; CHECK-NEXT: [[BC_RESUME_VAL:%.*]] = phi i64 [ 4096, [[MIDDLE_BLOCK]] ], [ 0, [[PREHEADER]] ]
	; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 0, [[PREHEADER]] ], [ [[TMP85]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 0, [[PREHEADER]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: br label [[LOOP:%.*]]			; CHECK-NEXT: br label [[LOOP:%.*]]
	; CHECK: loop:			; CHECK: loop:
	; CHECK-NEXT: [[IV:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[IV_NEXT:%.]], [[LATCH:%.*]] ]			; CHECK-NEXT: [[IV:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[IV_NEXT:%.]], [[LATCH:%.*]] ]
	; CHECK-NEXT: [[ACCUM:%.]] = phi i32 [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[ACCUM_NEXT:%.]], [[LATCH]] ]			; CHECK-NEXT: [[ACCUM:%.]] = phi i32 [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[ACCUM_NEXT:%.]], [[LATCH]] ]
	; CHECK-NEXT: [[IV_NEXT]] = add i64 [[IV]], 1			; CHECK-NEXT: [[IV_NEXT]] = add i64 [[IV]], 1
	; CHECK-NEXT: [[TEST_ADDR:%.]] = getelementptr inbounds i1, i1 [[TEST_BASE]], i64 [[IV]]			; CHECK-NEXT: [[TEST_ADDR:%.]] = getelementptr inbounds i1, i1 [[TEST_BASE]], i64 [[IV]]
	; CHECK-NEXT: [[EARLYCND:%.]] = load i1, i1 [[TEST_ADDR]], align 1			; CHECK-NEXT: [[EARLYCND:%.]] = load i1, i1 [[TEST_ADDR]], align 1
	; CHECK-NEXT: br i1 [[EARLYCND]], label [[PRED:%.*]], label [[LATCH]]			; CHECK-NEXT: br i1 [[EARLYCND]], label [[PRED:%.*]], label [[LATCH]]
	; CHECK: pred:			; CHECK: pred:
	; CHECK-NEXT: [[ADDR:%.]] = getelementptr inbounds i32, i32 [[BASE]], i64 [[IV]]			; CHECK-NEXT: [[ADDR:%.]] = getelementptr inbounds i32, i32 [[BASE]], i64 [[IV]]
	; CHECK-NEXT: [[VAL:%.]] = load i32, i32 [[ADDR]], align 4			; CHECK-NEXT: [[VAL:%.]] = load i32, i32 [[ADDR]], align 4
	; CHECK-NEXT: br label [[LATCH]]			; CHECK-NEXT: br label [[LATCH]]
	; CHECK: latch:			; CHECK: latch:
	; CHECK-NEXT: [[VAL_PHI:%.*]] = phi i32 [ 0, [[LOOP]] ], [ [[VAL]], [[PRED]] ]			; CHECK-NEXT: [[VAL_PHI:%.*]] = phi i32 [ 0, [[LOOP]] ], [ [[VAL]], [[PRED]] ]
	; CHECK-NEXT: [[ACCUM_NEXT]] = add i32 [[ACCUM]], [[VAL_PHI]]			; CHECK-NEXT: [[ACCUM_NEXT]] = add i32 [[ACCUM]], [[VAL_PHI]]
	; CHECK-NEXT: [[EXIT:%.*]] = icmp ugt i64 [[IV]], 4094			; CHECK-NEXT: [[EXIT:%.*]] = icmp ugt i64 [[IV]], 4094
	; CHECK-NEXT: br i1 [[EXIT]], label [[LOOP_EXIT]], label [[LOOP]], !llvm.loop [[LOOP29:![0-9]+]]			; CHECK-NEXT: br i1 [[EXIT]], label [[LOOP_EXIT]], label [[LOOP]], !llvm.loop [[LOOP29:![0-9]+]]
	; CHECK: loop_exit:			; CHECK: loop_exit:
	; CHECK-NEXT: [[ACCUM_NEXT_LCSSA:%.*]] = phi i32 [ [[ACCUM_NEXT]], [[LATCH]] ], [ [[TMP85]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[ACCUM_NEXT_LCSSA:%.*]] = phi i32 [ [[ACCUM_NEXT]], [[LATCH]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: ret i32 [[ACCUM_NEXT_LCSSA]]			; CHECK-NEXT: ret i32 [[ACCUM_NEXT_LCSSA]]
	;			;
	entry:			entry:
	%allocation = call nonnull i8* @my_alloc(i32 16384)			%allocation = call nonnull i8* @my_alloc(i32 16384)
	%base = bitcast i8* %allocation to i32*			%base = bitcast i8* %allocation to i32*
	call void @init(i32* %base)			call void @init(i32* %base)
	br i1 %allzero, label %freeit, label %preheader			br i1 %allzero, label %freeit, label %preheader
	freeit:			freeit:
	Show All 24 Lines

llvm/test/Transforms/LoopVectorize/X86/reduction-fastmath.ll

	Show First 20 Lines • Show All 67 Lines • ▼ Show 20 Lines
	; CHECK-NEXT: [[WIDE_LOAD:%.]] = load <4 x float>, <4 x float> [[TMP5]], align 4			; CHECK-NEXT: [[WIDE_LOAD:%.]] = load <4 x float>, <4 x float> [[TMP5]], align 4
	; CHECK-NEXT: [[TMP6:%.]] = getelementptr float, float [[TMP2]], i32 4			; CHECK-NEXT: [[TMP6:%.]] = getelementptr float, float [[TMP2]], i32 4
	; CHECK-NEXT: [[TMP7:%.]] = bitcast float [[TMP6]] to <4 x float>*			; CHECK-NEXT: [[TMP7:%.]] = bitcast float [[TMP6]] to <4 x float>*
	; CHECK-NEXT: [[WIDE_LOAD2:%.]] = load <4 x float>, <4 x float> [[TMP7]], align 4			; CHECK-NEXT: [[WIDE_LOAD2:%.]] = load <4 x float>, <4 x float> [[TMP7]], align 4
	; CHECK-NEXT: [[TMP8]] = fadd fast <4 x float> [[VEC_PHI]], [[WIDE_LOAD]]			; CHECK-NEXT: [[TMP8]] = fadd fast <4 x float> [[VEC_PHI]], [[WIDE_LOAD]]
	; CHECK-NEXT: [[TMP9]] = fadd fast <4 x float> [[VEC_PHI1]], [[WIDE_LOAD2]]			; CHECK-NEXT: [[TMP9]] = fadd fast <4 x float> [[VEC_PHI1]], [[WIDE_LOAD2]]
	; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i32 [[INDEX]], 8			; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i32 [[INDEX]], 8
	; CHECK-NEXT: [[TMP10:%.*]] = icmp eq i32 [[INDEX_NEXT]], 4096			; CHECK-NEXT: [[TMP10:%.*]] = icmp eq i32 [[INDEX_NEXT]], 4096
	; CHECK-NEXT: br i1 [[TMP10]], label [[MIDDLE_BLOCK:%.]], label [[VECTOR_BODY]], [[LOOP0:!llvm.loop !.]]			; CHECK-NEXT: br i1 [[TMP10]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP0:![0-9]+]]
	; CHECK: middle.block:			; CHECK: middle.block:
	; CHECK-NEXT: [[BIN_RDX:%.*]] = fadd fast <4 x float> [[TMP9]], [[TMP8]]			; CHECK-NEXT: [[BIN_RDX:%.*]] = fadd fast <4 x float> [[TMP9]], [[TMP8]]
	; CHECK-NEXT: [[TMP11:%.*]] = call fast float @llvm.vector.reduce.fadd.v4f32(float -0.000000e+00, <4 x float> [[BIN_RDX]])			; CHECK-NEXT: [[TMP11:%.*]] = call fast float @llvm.vector.reduce.fadd.v4f32(float -0.000000e+00, <4 x float> [[BIN_RDX]])
				; CHECK-NEXT: [[RDX_START:%.*]] = fadd float 0.000000e+00, [[TMP11]]
	; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i32 4096, 4096			; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i32 4096, 4096
	; CHECK-NEXT: br i1 [[CMP_N]], label [[LOOP_EXIT_LOOPEXIT:%.*]], label [[SCALAR_PH]]			; CHECK-NEXT: br i1 [[CMP_N]], label [[LOOP_EXIT_LOOPEXIT:%.*]], label [[SCALAR_PH]]
	; CHECK: scalar.ph:			; CHECK: scalar.ph:
	; CHECK-NEXT: [[BC_RESUME_VAL:%.*]] = phi i32 [ 4096, [[MIDDLE_BLOCK]] ], [ 0, [[LOOP_PREHEADER]] ]			; CHECK-NEXT: [[BC_RESUME_VAL:%.*]] = phi i32 [ 4096, [[MIDDLE_BLOCK]] ], [ 0, [[LOOP_PREHEADER]] ]
	; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi float [ 0.000000e+00, [[LOOP_PREHEADER]] ], [ [[TMP11]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi float [ 0.000000e+00, [[LOOP_PREHEADER]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: br label [[LOOP:%.*]]			; CHECK-NEXT: br label [[LOOP:%.*]]
	; CHECK: loop:			; CHECK: loop:
	; CHECK-NEXT: [[IDX:%.]] = phi i32 [ [[IDX_INC:%.]], [[LOOP]] ], [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ]			; CHECK-NEXT: [[IDX:%.]] = phi i32 [ [[IDX_INC:%.]], [[LOOP]] ], [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ]
	; CHECK-NEXT: [[SUM:%.]] = phi float [ [[SUM_INC:%.]], [[LOOP]] ], [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ]			; CHECK-NEXT: [[SUM:%.]] = phi float [ [[SUM_INC:%.]], [[LOOP]] ], [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ]
	; CHECK-NEXT: [[ADDRESS:%.]] = getelementptr float, float [[ARRAY]], i32 [[IDX]]			; CHECK-NEXT: [[ADDRESS:%.]] = getelementptr float, float [[ARRAY]], i32 [[IDX]]
	; CHECK-NEXT: [[VALUE:%.]] = load float, float [[ADDRESS]], align 4			; CHECK-NEXT: [[VALUE:%.]] = load float, float [[ADDRESS]], align 4
	; CHECK-NEXT: [[SUM_INC]] = fadd fast float [[SUM]], [[VALUE]]			; CHECK-NEXT: [[SUM_INC]] = fadd fast float [[SUM]], [[VALUE]]
	; CHECK-NEXT: [[IDX_INC]] = add i32 [[IDX]], 1			; CHECK-NEXT: [[IDX_INC]] = add i32 [[IDX]], 1
	; CHECK-NEXT: [[BE_COND:%.*]] = icmp ne i32 [[IDX_INC]], 4096			; CHECK-NEXT: [[BE_COND:%.*]] = icmp ne i32 [[IDX_INC]], 4096
	; CHECK-NEXT: br i1 [[BE_COND]], label [[LOOP]], label [[LOOP_EXIT_LOOPEXIT]], [[LOOP2:!llvm.loop !.*]]			; CHECK-NEXT: br i1 [[BE_COND]], label [[LOOP]], label [[LOOP_EXIT_LOOPEXIT]], !llvm.loop [[LOOP2:![0-9]+]]
	; CHECK: loop.exit.loopexit:			; CHECK: loop.exit.loopexit:
	; CHECK-NEXT: [[SUM_INC_LCSSA:%.*]] = phi float [ [[SUM_INC]], [[LOOP]] ], [ [[TMP11]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[SUM_INC_LCSSA:%.*]] = phi float [ [[SUM_INC]], [[LOOP]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: br label [[LOOP_EXIT]]			; CHECK-NEXT: br label [[LOOP_EXIT]]
	; CHECK: loop.exit:			; CHECK: loop.exit:
	; CHECK-NEXT: [[SUM_LCSSA:%.]] = phi float [ 0.000000e+00, [[ENTRY:%.]] ], [ [[SUM_INC_LCSSA]], [[LOOP_EXIT_LOOPEXIT]] ]			; CHECK-NEXT: [[SUM_LCSSA:%.]] = phi float [ 0.000000e+00, [[ENTRY:%.]] ], [ [[SUM_INC_LCSSA]], [[LOOP_EXIT_LOOPEXIT]] ]
	; CHECK-NEXT: ret float [[SUM_LCSSA]]			; CHECK-NEXT: ret float [[SUM_LCSSA]]
	;			;
	entry:			entry:
	%entry.cond = icmp ne i32 0, 4096			%entry.cond = icmp ne i32 0, 4096
	br i1 %entry.cond, label %loop, label %loop.exit			br i1 %entry.cond, label %loop, label %loop.exit
	Show All 35 Lines
	; CHECK-NEXT: [[WIDE_LOAD:%.]] = load <4 x float>, <4 x float> [[TMP5]], align 4			; CHECK-NEXT: [[WIDE_LOAD:%.]] = load <4 x float>, <4 x float> [[TMP5]], align 4
	; CHECK-NEXT: [[TMP6:%.]] = getelementptr float, float [[TMP2]], i32 4			; CHECK-NEXT: [[TMP6:%.]] = getelementptr float, float [[TMP2]], i32 4
	; CHECK-NEXT: [[TMP7:%.]] = bitcast float [[TMP6]] to <4 x float>*			; CHECK-NEXT: [[TMP7:%.]] = bitcast float [[TMP6]] to <4 x float>*
	; CHECK-NEXT: [[WIDE_LOAD2:%.]] = load <4 x float>, <4 x float> [[TMP7]], align 4			; CHECK-NEXT: [[WIDE_LOAD2:%.]] = load <4 x float>, <4 x float> [[TMP7]], align 4
	; CHECK-NEXT: [[TMP8]] = fadd reassoc <4 x float> [[VEC_PHI]], [[WIDE_LOAD]]			; CHECK-NEXT: [[TMP8]] = fadd reassoc <4 x float> [[VEC_PHI]], [[WIDE_LOAD]]
	; CHECK-NEXT: [[TMP9]] = fadd reassoc <4 x float> [[VEC_PHI1]], [[WIDE_LOAD2]]			; CHECK-NEXT: [[TMP9]] = fadd reassoc <4 x float> [[VEC_PHI1]], [[WIDE_LOAD2]]
	; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i32 [[INDEX]], 8			; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i32 [[INDEX]], 8
	; CHECK-NEXT: [[TMP10:%.*]] = icmp eq i32 [[INDEX_NEXT]], 4096			; CHECK-NEXT: [[TMP10:%.*]] = icmp eq i32 [[INDEX_NEXT]], 4096
	; CHECK-NEXT: br i1 [[TMP10]], label [[MIDDLE_BLOCK:%.]], label [[VECTOR_BODY]], [[LOOP4:!llvm.loop !.]]			; CHECK-NEXT: br i1 [[TMP10]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP4:![0-9]+]]
	; CHECK: middle.block:			; CHECK: middle.block:
	; CHECK-NEXT: [[BIN_RDX:%.*]] = fadd reassoc <4 x float> [[TMP9]], [[TMP8]]			; CHECK-NEXT: [[BIN_RDX:%.*]] = fadd reassoc <4 x float> [[TMP9]], [[TMP8]]
	; CHECK-NEXT: [[TMP11:%.*]] = call reassoc float @llvm.vector.reduce.fadd.v4f32(float -0.000000e+00, <4 x float> [[BIN_RDX]])			; CHECK-NEXT: [[TMP11:%.*]] = call reassoc float @llvm.vector.reduce.fadd.v4f32(float -0.000000e+00, <4 x float> [[BIN_RDX]])
				; CHECK-NEXT: [[RDX_START:%.*]] = fadd float -0.000000e+00, [[TMP11]]
	; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i32 4096, 4096			; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i32 4096, 4096
	; CHECK-NEXT: br i1 [[CMP_N]], label [[LOOP_EXIT_LOOPEXIT:%.*]], label [[SCALAR_PH]]			; CHECK-NEXT: br i1 [[CMP_N]], label [[LOOP_EXIT_LOOPEXIT:%.*]], label [[SCALAR_PH]]
	; CHECK: scalar.ph:			; CHECK: scalar.ph:
	; CHECK-NEXT: [[BC_RESUME_VAL:%.*]] = phi i32 [ 4096, [[MIDDLE_BLOCK]] ], [ 0, [[LOOP_PREHEADER]] ]			; CHECK-NEXT: [[BC_RESUME_VAL:%.*]] = phi i32 [ 4096, [[MIDDLE_BLOCK]] ], [ 0, [[LOOP_PREHEADER]] ]
	; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi float [ -0.000000e+00, [[LOOP_PREHEADER]] ], [ [[TMP11]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi float [ -0.000000e+00, [[LOOP_PREHEADER]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: br label [[LOOP:%.*]]			; CHECK-NEXT: br label [[LOOP:%.*]]
	; CHECK: loop:			; CHECK: loop:
	; CHECK-NEXT: [[IDX:%.]] = phi i32 [ [[IDX_INC:%.]], [[LOOP]] ], [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ]			; CHECK-NEXT: [[IDX:%.]] = phi i32 [ [[IDX_INC:%.]], [[LOOP]] ], [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ]
	; CHECK-NEXT: [[SUM:%.]] = phi float [ [[SUM_INC:%.]], [[LOOP]] ], [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ]			; CHECK-NEXT: [[SUM:%.]] = phi float [ [[SUM_INC:%.]], [[LOOP]] ], [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ]
	; CHECK-NEXT: [[ADDRESS:%.]] = getelementptr float, float [[ARRAY]], i32 [[IDX]]			; CHECK-NEXT: [[ADDRESS:%.]] = getelementptr float, float [[ARRAY]], i32 [[IDX]]
	; CHECK-NEXT: [[VALUE:%.]] = load float, float [[ADDRESS]], align 4			; CHECK-NEXT: [[VALUE:%.]] = load float, float [[ADDRESS]], align 4
	; CHECK-NEXT: [[SUM_INC]] = fadd reassoc float [[SUM]], [[VALUE]]			; CHECK-NEXT: [[SUM_INC]] = fadd reassoc float [[SUM]], [[VALUE]]
	; CHECK-NEXT: [[IDX_INC]] = add i32 [[IDX]], 1			; CHECK-NEXT: [[IDX_INC]] = add i32 [[IDX]], 1
	; CHECK-NEXT: [[BE_COND:%.*]] = icmp ne i32 [[IDX_INC]], 4096			; CHECK-NEXT: [[BE_COND:%.*]] = icmp ne i32 [[IDX_INC]], 4096
	; CHECK-NEXT: br i1 [[BE_COND]], label [[LOOP]], label [[LOOP_EXIT_LOOPEXIT]], [[LOOP5:!llvm.loop !.*]]			; CHECK-NEXT: br i1 [[BE_COND]], label [[LOOP]], label [[LOOP_EXIT_LOOPEXIT]], !llvm.loop [[LOOP5:![0-9]+]]
	; CHECK: loop.exit.loopexit:			; CHECK: loop.exit.loopexit:
	; CHECK-NEXT: [[SUM_INC_LCSSA:%.*]] = phi float [ [[SUM_INC]], [[LOOP]] ], [ [[TMP11]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[SUM_INC_LCSSA:%.*]] = phi float [ [[SUM_INC]], [[LOOP]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: br label [[LOOP_EXIT]]			; CHECK-NEXT: br label [[LOOP_EXIT]]
	; CHECK: loop.exit:			; CHECK: loop.exit:
	; CHECK-NEXT: [[SUM_LCSSA:%.]] = phi float [ -0.000000e+00, [[ENTRY:%.]] ], [ [[SUM_INC_LCSSA]], [[LOOP_EXIT_LOOPEXIT]] ]			; CHECK-NEXT: [[SUM_LCSSA:%.]] = phi float [ -0.000000e+00, [[ENTRY:%.]] ], [ [[SUM_INC_LCSSA]], [[LOOP_EXIT_LOOPEXIT]] ]
	; CHECK-NEXT: ret float [[SUM_LCSSA]]			; CHECK-NEXT: ret float [[SUM_LCSSA]]
	;			;
	entry:			entry:
	%entry.cond = icmp ne i32 0, 4096			%entry.cond = icmp ne i32 0, 4096
	br i1 %entry.cond, label %loop, label %loop.exit			br i1 %entry.cond, label %loop, label %loop.exit
	Show All 35 Lines
	; CHECK-NEXT: [[WIDE_LOAD:%.]] = load <4 x float>, <4 x float> [[TMP5]], align 4			; CHECK-NEXT: [[WIDE_LOAD:%.]] = load <4 x float>, <4 x float> [[TMP5]], align 4
	; CHECK-NEXT: [[TMP6:%.]] = getelementptr float, float [[TMP2]], i32 4			; CHECK-NEXT: [[TMP6:%.]] = getelementptr float, float [[TMP2]], i32 4
	; CHECK-NEXT: [[TMP7:%.]] = bitcast float [[TMP6]] to <4 x float>*			; CHECK-NEXT: [[TMP7:%.]] = bitcast float [[TMP6]] to <4 x float>*
	; CHECK-NEXT: [[WIDE_LOAD2:%.]] = load <4 x float>, <4 x float> [[TMP7]], align 4			; CHECK-NEXT: [[WIDE_LOAD2:%.]] = load <4 x float>, <4 x float> [[TMP7]], align 4
	; CHECK-NEXT: [[TMP8]] = fadd reassoc contract <4 x float> [[VEC_PHI]], [[WIDE_LOAD]]			; CHECK-NEXT: [[TMP8]] = fadd reassoc contract <4 x float> [[VEC_PHI]], [[WIDE_LOAD]]
	; CHECK-NEXT: [[TMP9]] = fadd reassoc contract <4 x float> [[VEC_PHI1]], [[WIDE_LOAD2]]			; CHECK-NEXT: [[TMP9]] = fadd reassoc contract <4 x float> [[VEC_PHI1]], [[WIDE_LOAD2]]
	; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i32 [[INDEX]], 8			; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i32 [[INDEX]], 8
	; CHECK-NEXT: [[TMP10:%.*]] = icmp eq i32 [[INDEX_NEXT]], 4096			; CHECK-NEXT: [[TMP10:%.*]] = icmp eq i32 [[INDEX_NEXT]], 4096
	; CHECK-NEXT: br i1 [[TMP10]], label [[MIDDLE_BLOCK:%.]], label [[VECTOR_BODY]], [[LOOP6:!llvm.loop !.]]			; CHECK-NEXT: br i1 [[TMP10]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP6:![0-9]+]]
	; CHECK: middle.block:			; CHECK: middle.block:
	; CHECK-NEXT: [[BIN_RDX:%.*]] = fadd reassoc contract <4 x float> [[TMP9]], [[TMP8]]			; CHECK-NEXT: [[BIN_RDX:%.*]] = fadd reassoc contract <4 x float> [[TMP9]], [[TMP8]]
	; CHECK-NEXT: [[TMP11:%.*]] = call reassoc contract float @llvm.vector.reduce.fadd.v4f32(float -0.000000e+00, <4 x float> [[BIN_RDX]])			; CHECK-NEXT: [[TMP11:%.*]] = call reassoc contract float @llvm.vector.reduce.fadd.v4f32(float -0.000000e+00, <4 x float> [[BIN_RDX]])
				; CHECK-NEXT: [[RDX_START:%.*]] = fadd float -0.000000e+00, [[TMP11]]
	; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i32 4096, 4096			; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i32 4096, 4096
	; CHECK-NEXT: br i1 [[CMP_N]], label [[LOOP_EXIT_LOOPEXIT:%.*]], label [[SCALAR_PH]]			; CHECK-NEXT: br i1 [[CMP_N]], label [[LOOP_EXIT_LOOPEXIT:%.*]], label [[SCALAR_PH]]
	; CHECK: scalar.ph:			; CHECK: scalar.ph:
	; CHECK-NEXT: [[BC_RESUME_VAL:%.*]] = phi i32 [ 4096, [[MIDDLE_BLOCK]] ], [ 0, [[LOOP_PREHEADER]] ]			; CHECK-NEXT: [[BC_RESUME_VAL:%.*]] = phi i32 [ 4096, [[MIDDLE_BLOCK]] ], [ 0, [[LOOP_PREHEADER]] ]
	; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi float [ -0.000000e+00, [[LOOP_PREHEADER]] ], [ [[TMP11]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi float [ -0.000000e+00, [[LOOP_PREHEADER]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: br label [[LOOP:%.*]]			; CHECK-NEXT: br label [[LOOP:%.*]]
	; CHECK: loop:			; CHECK: loop:
	; CHECK-NEXT: [[IDX:%.]] = phi i32 [ [[IDX_INC:%.]], [[LOOP]] ], [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ]			; CHECK-NEXT: [[IDX:%.]] = phi i32 [ [[IDX_INC:%.]], [[LOOP]] ], [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ]
	; CHECK-NEXT: [[SUM:%.]] = phi float [ [[SUM_INC:%.]], [[LOOP]] ], [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ]			; CHECK-NEXT: [[SUM:%.]] = phi float [ [[SUM_INC:%.]], [[LOOP]] ], [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ]
	; CHECK-NEXT: [[ADDRESS:%.]] = getelementptr float, float [[ARRAY]], i32 [[IDX]]			; CHECK-NEXT: [[ADDRESS:%.]] = getelementptr float, float [[ARRAY]], i32 [[IDX]]
	; CHECK-NEXT: [[VALUE:%.]] = load float, float [[ADDRESS]], align 4			; CHECK-NEXT: [[VALUE:%.]] = load float, float [[ADDRESS]], align 4
	; CHECK-NEXT: [[SUM_INC]] = fadd reassoc contract float [[SUM]], [[VALUE]]			; CHECK-NEXT: [[SUM_INC]] = fadd reassoc contract float [[SUM]], [[VALUE]]
	; CHECK-NEXT: [[IDX_INC]] = add i32 [[IDX]], 1			; CHECK-NEXT: [[IDX_INC]] = add i32 [[IDX]], 1
	; CHECK-NEXT: [[BE_COND:%.*]] = icmp ne i32 [[IDX_INC]], 4096			; CHECK-NEXT: [[BE_COND:%.*]] = icmp ne i32 [[IDX_INC]], 4096
	; CHECK-NEXT: br i1 [[BE_COND]], label [[LOOP]], label [[LOOP_EXIT_LOOPEXIT]], [[LOOP7:!llvm.loop !.*]]			; CHECK-NEXT: br i1 [[BE_COND]], label [[LOOP]], label [[LOOP_EXIT_LOOPEXIT]], !llvm.loop [[LOOP7:![0-9]+]]
	; CHECK: loop.exit.loopexit:			; CHECK: loop.exit.loopexit:
	; CHECK-NEXT: [[SUM_INC_LCSSA:%.*]] = phi float [ [[SUM_INC]], [[LOOP]] ], [ [[TMP11]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[SUM_INC_LCSSA:%.*]] = phi float [ [[SUM_INC]], [[LOOP]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: br label [[LOOP_EXIT]]			; CHECK-NEXT: br label [[LOOP_EXIT]]
	; CHECK: loop.exit:			; CHECK: loop.exit:
	; CHECK-NEXT: [[SUM_LCSSA:%.]] = phi float [ -0.000000e+00, [[ENTRY:%.]] ], [ [[SUM_INC_LCSSA]], [[LOOP_EXIT_LOOPEXIT]] ]			; CHECK-NEXT: [[SUM_LCSSA:%.]] = phi float [ -0.000000e+00, [[ENTRY:%.]] ], [ [[SUM_INC_LCSSA]], [[LOOP_EXIT_LOOPEXIT]] ]
	; CHECK-NEXT: ret float [[SUM_LCSSA]]			; CHECK-NEXT: ret float [[SUM_LCSSA]]
	;			;
	entry:			entry:
	%entry.cond = icmp ne i32 0, 4096			%entry.cond = icmp ne i32 0, 4096
	br i1 %entry.cond, label %loop, label %loop.exit			br i1 %entry.cond, label %loop, label %loop.exit
	▲ Show 20 Lines • Show All 44 Lines • ▼ Show 20 Lines
	; CHECK-NEXT: [[TMP7:%.]] = bitcast float [[TMP6]] to <4 x float>*			; CHECK-NEXT: [[TMP7:%.]] = bitcast float [[TMP6]] to <4 x float>*
	; CHECK-NEXT: [[WIDE_LOAD2:%.]] = load <4 x float>, <4 x float> [[TMP7]], align 4			; CHECK-NEXT: [[WIDE_LOAD2:%.]] = load <4 x float>, <4 x float> [[TMP7]], align 4
	; CHECK-NEXT: [[TMP8:%.*]] = fcmp nnan ninf nsz oge <4 x float> [[WIDE_LOAD]], [[VEC_PHI]]			; CHECK-NEXT: [[TMP8:%.*]] = fcmp nnan ninf nsz oge <4 x float> [[WIDE_LOAD]], [[VEC_PHI]]
	; CHECK-NEXT: [[TMP9:%.*]] = fcmp nnan ninf nsz oge <4 x float> [[WIDE_LOAD2]], [[VEC_PHI1]]			; CHECK-NEXT: [[TMP9:%.*]] = fcmp nnan ninf nsz oge <4 x float> [[WIDE_LOAD2]], [[VEC_PHI1]]
	; CHECK-NEXT: [[TMP10]] = select <4 x i1> [[TMP8]], <4 x float> [[WIDE_LOAD]], <4 x float> [[VEC_PHI]]			; CHECK-NEXT: [[TMP10]] = select <4 x i1> [[TMP8]], <4 x float> [[WIDE_LOAD]], <4 x float> [[VEC_PHI]]
	; CHECK-NEXT: [[TMP11]] = select <4 x i1> [[TMP9]], <4 x float> [[WIDE_LOAD2]], <4 x float> [[VEC_PHI1]]			; CHECK-NEXT: [[TMP11]] = select <4 x i1> [[TMP9]], <4 x float> [[WIDE_LOAD2]], <4 x float> [[VEC_PHI1]]
	; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 8			; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 8
	; CHECK-NEXT: [[TMP12:%.*]] = icmp eq i64 [[INDEX_NEXT]], [[N_VEC]]			; CHECK-NEXT: [[TMP12:%.*]] = icmp eq i64 [[INDEX_NEXT]], [[N_VEC]]
	; CHECK-NEXT: br i1 [[TMP12]], label [[MIDDLE_BLOCK:%.]], label [[VECTOR_BODY]], [[LOOP8:!llvm.loop !.]]			; CHECK-NEXT: br i1 [[TMP12]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP8:![0-9]+]]
	; CHECK: middle.block:			; CHECK: middle.block:
	; CHECK-NEXT: [[RDX_MINMAX_CMP:%.*]] = fcmp nnan ninf nsz ogt <4 x float> [[TMP10]], [[TMP11]]			; CHECK-NEXT: [[RDX_MINMAX_CMP:%.*]] = fcmp nnan ninf nsz ogt <4 x float> [[TMP10]], [[TMP11]]
	; CHECK-NEXT: [[RDX_MINMAX_SELECT:%.*]] = select nnan ninf nsz <4 x i1> [[RDX_MINMAX_CMP]], <4 x float> [[TMP10]], <4 x float> [[TMP11]]			; CHECK-NEXT: [[RDX_MINMAX_SELECT:%.*]] = select nnan ninf nsz <4 x i1> [[RDX_MINMAX_CMP]], <4 x float> [[TMP10]], <4 x float> [[TMP11]]
	; CHECK-NEXT: [[TMP13:%.*]] = call nnan ninf nsz float @llvm.vector.reduce.fmax.v4f32(<4 x float> [[RDX_MINMAX_SELECT]])			; CHECK-NEXT: [[TMP13:%.*]] = call nnan ninf nsz float @llvm.vector.reduce.fmax.v4f32(<4 x float> [[RDX_MINMAX_SELECT]])
	; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i64 [[WIDE_TRIP_COUNT]], [[N_VEC]]			; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i64 [[WIDE_TRIP_COUNT]], [[N_VEC]]
	; CHECK-NEXT: br i1 [[CMP_N]], label [[FOR_COND_CLEANUP_LOOPEXIT:%.*]], label [[SCALAR_PH]]			; CHECK-NEXT: br i1 [[CMP_N]], label [[FOR_COND_CLEANUP_LOOPEXIT:%.*]], label [[SCALAR_PH]]
	; CHECK: scalar.ph:			; CHECK: scalar.ph:
	; CHECK-NEXT: [[BC_RESUME_VAL:%.*]] = phi i64 [ [[N_VEC]], [[MIDDLE_BLOCK]] ], [ 0, [[FOR_BODY_LR_PH]] ]			; CHECK-NEXT: [[BC_RESUME_VAL:%.*]] = phi i64 [ [[N_VEC]], [[MIDDLE_BLOCK]] ], [ 0, [[FOR_BODY_LR_PH]] ]
	Show All 9 Lines
	; CHECK-NEXT: [[INDVARS_IV:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[INDVARS_IV_NEXT:%.]], [[FOR_BODY]] ]			; CHECK-NEXT: [[INDVARS_IV:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[INDVARS_IV_NEXT:%.]], [[FOR_BODY]] ]
	; CHECK-NEXT: [[MAX_013:%.*]] = phi float [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[MAX_0_]], [[FOR_BODY]] ]			; CHECK-NEXT: [[MAX_013:%.*]] = phi float [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[MAX_0_]], [[FOR_BODY]] ]
	; CHECK-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds float, float [[A]], i64 [[INDVARS_IV]]			; CHECK-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds float, float [[A]], i64 [[INDVARS_IV]]
	; CHECK-NEXT: [[TMP14:%.]] = load float, float [[ARRAYIDX]], align 4			; CHECK-NEXT: [[TMP14:%.]] = load float, float [[ARRAYIDX]], align 4
	; CHECK-NEXT: [[CMP1_INV:%.*]] = fcmp nnan ninf nsz oge float [[TMP14]], [[MAX_013]]			; CHECK-NEXT: [[CMP1_INV:%.*]] = fcmp nnan ninf nsz oge float [[TMP14]], [[MAX_013]]
	; CHECK-NEXT: [[MAX_0_]] = select i1 [[CMP1_INV]], float [[TMP14]], float [[MAX_013]]			; CHECK-NEXT: [[MAX_0_]] = select i1 [[CMP1_INV]], float [[TMP14]], float [[MAX_013]]
	; CHECK-NEXT: [[INDVARS_IV_NEXT]] = add nuw nsw i64 [[INDVARS_IV]], 1			; CHECK-NEXT: [[INDVARS_IV_NEXT]] = add nuw nsw i64 [[INDVARS_IV]], 1
	; CHECK-NEXT: [[EXITCOND:%.*]] = icmp eq i64 [[INDVARS_IV_NEXT]], [[WIDE_TRIP_COUNT]]			; CHECK-NEXT: [[EXITCOND:%.*]] = icmp eq i64 [[INDVARS_IV_NEXT]], [[WIDE_TRIP_COUNT]]
	; CHECK-NEXT: br i1 [[EXITCOND]], label [[FOR_COND_CLEANUP_LOOPEXIT]], label [[FOR_BODY]], [[LOOP9:!llvm.loop !.*]]			; CHECK-NEXT: br i1 [[EXITCOND]], label [[FOR_COND_CLEANUP_LOOPEXIT]], label [[FOR_BODY]], !llvm.loop [[LOOP9:![0-9]+]]
	;			;
	entry:			entry:
	%cmp12 = icmp sgt i32 %N, 0			%cmp12 = icmp sgt i32 %N, 0
	br i1 %cmp12, label %for.body.lr.ph, label %for.cond.cleanup			br i1 %cmp12, label %for.body.lr.ph, label %for.cond.cleanup

	for.body.lr.ph:			for.body.lr.ph:
	%wide.trip.count = zext i32 %N to i64			%wide.trip.count = zext i32 %N to i64
	br label %for.body			br label %for.body
	▲ Show 20 Lines • Show All 44 Lines • ▼ Show 20 Lines
	; CHECK-NEXT: [[TMP7:%.]] = bitcast float [[TMP6]] to <4 x float>*			; CHECK-NEXT: [[TMP7:%.]] = bitcast float [[TMP6]] to <4 x float>*
	; CHECK-NEXT: [[WIDE_LOAD2:%.]] = load <4 x float>, <4 x float> [[TMP7]], align 4			; CHECK-NEXT: [[WIDE_LOAD2:%.]] = load <4 x float>, <4 x float> [[TMP7]], align 4
	; CHECK-NEXT: [[TMP8:%.*]] = fcmp nnan ninf oge <4 x float> [[WIDE_LOAD]], [[VEC_PHI]]			; CHECK-NEXT: [[TMP8:%.*]] = fcmp nnan ninf oge <4 x float> [[WIDE_LOAD]], [[VEC_PHI]]
	; CHECK-NEXT: [[TMP9:%.*]] = fcmp nnan ninf oge <4 x float> [[WIDE_LOAD2]], [[VEC_PHI1]]			; CHECK-NEXT: [[TMP9:%.*]] = fcmp nnan ninf oge <4 x float> [[WIDE_LOAD2]], [[VEC_PHI1]]
	; CHECK-NEXT: [[TMP10]] = select <4 x i1> [[TMP8]], <4 x float> [[WIDE_LOAD]], <4 x float> [[VEC_PHI]]			; CHECK-NEXT: [[TMP10]] = select <4 x i1> [[TMP8]], <4 x float> [[WIDE_LOAD]], <4 x float> [[VEC_PHI]]
	; CHECK-NEXT: [[TMP11]] = select <4 x i1> [[TMP9]], <4 x float> [[WIDE_LOAD2]], <4 x float> [[VEC_PHI1]]			; CHECK-NEXT: [[TMP11]] = select <4 x i1> [[TMP9]], <4 x float> [[WIDE_LOAD2]], <4 x float> [[VEC_PHI1]]
	; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 8			; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 8
	; CHECK-NEXT: [[TMP12:%.*]] = icmp eq i64 [[INDEX_NEXT]], [[N_VEC]]			; CHECK-NEXT: [[TMP12:%.*]] = icmp eq i64 [[INDEX_NEXT]], [[N_VEC]]
	; CHECK-NEXT: br i1 [[TMP12]], label [[MIDDLE_BLOCK:%.]], label [[VECTOR_BODY]], [[LOOP10:!llvm.loop !.]]			; CHECK-NEXT: br i1 [[TMP12]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP10:![0-9]+]]
	; CHECK: middle.block:			; CHECK: middle.block:
	; CHECK-NEXT: [[RDX_MINMAX_CMP:%.*]] = fcmp nnan ninf ogt <4 x float> [[TMP10]], [[TMP11]]			; CHECK-NEXT: [[RDX_MINMAX_CMP:%.*]] = fcmp nnan ninf ogt <4 x float> [[TMP10]], [[TMP11]]
	; CHECK-NEXT: [[RDX_MINMAX_SELECT:%.*]] = select nnan ninf <4 x i1> [[RDX_MINMAX_CMP]], <4 x float> [[TMP10]], <4 x float> [[TMP11]]			; CHECK-NEXT: [[RDX_MINMAX_SELECT:%.*]] = select nnan ninf <4 x i1> [[RDX_MINMAX_CMP]], <4 x float> [[TMP10]], <4 x float> [[TMP11]]
	; CHECK-NEXT: [[TMP13:%.*]] = call nnan ninf float @llvm.vector.reduce.fmax.v4f32(<4 x float> [[RDX_MINMAX_SELECT]])			; CHECK-NEXT: [[TMP13:%.*]] = call nnan ninf float @llvm.vector.reduce.fmax.v4f32(<4 x float> [[RDX_MINMAX_SELECT]])
	; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i64 [[WIDE_TRIP_COUNT]], [[N_VEC]]			; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i64 [[WIDE_TRIP_COUNT]], [[N_VEC]]
	; CHECK-NEXT: br i1 [[CMP_N]], label [[FOR_COND_CLEANUP_LOOPEXIT:%.*]], label [[SCALAR_PH]]			; CHECK-NEXT: br i1 [[CMP_N]], label [[FOR_COND_CLEANUP_LOOPEXIT:%.*]], label [[SCALAR_PH]]
	; CHECK: scalar.ph:			; CHECK: scalar.ph:
	; CHECK-NEXT: [[BC_RESUME_VAL:%.*]] = phi i64 [ [[N_VEC]], [[MIDDLE_BLOCK]] ], [ 0, [[FOR_BODY_LR_PH]] ]			; CHECK-NEXT: [[BC_RESUME_VAL:%.*]] = phi i64 [ [[N_VEC]], [[MIDDLE_BLOCK]] ], [ 0, [[FOR_BODY_LR_PH]] ]
	Show All 9 Lines
	; CHECK-NEXT: [[INDVARS_IV:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[INDVARS_IV_NEXT:%.]], [[FOR_BODY]] ]			; CHECK-NEXT: [[INDVARS_IV:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[INDVARS_IV_NEXT:%.]], [[FOR_BODY]] ]
	; CHECK-NEXT: [[MAX_013:%.*]] = phi float [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[MAX_0_]], [[FOR_BODY]] ]			; CHECK-NEXT: [[MAX_013:%.*]] = phi float [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[MAX_0_]], [[FOR_BODY]] ]
	; CHECK-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds float, float [[A]], i64 [[INDVARS_IV]]			; CHECK-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds float, float [[A]], i64 [[INDVARS_IV]]
	; CHECK-NEXT: [[TMP14:%.]] = load float, float [[ARRAYIDX]], align 4			; CHECK-NEXT: [[TMP14:%.]] = load float, float [[ARRAYIDX]], align 4
	; CHECK-NEXT: [[CMP1_INV:%.*]] = fcmp nnan ninf oge float [[TMP14]], [[MAX_013]]			; CHECK-NEXT: [[CMP1_INV:%.*]] = fcmp nnan ninf oge float [[TMP14]], [[MAX_013]]
	; CHECK-NEXT: [[MAX_0_]] = select nnan ninf i1 [[CMP1_INV]], float [[TMP14]], float [[MAX_013]]			; CHECK-NEXT: [[MAX_0_]] = select nnan ninf i1 [[CMP1_INV]], float [[TMP14]], float [[MAX_013]]
	; CHECK-NEXT: [[INDVARS_IV_NEXT]] = add nuw nsw i64 [[INDVARS_IV]], 1			; CHECK-NEXT: [[INDVARS_IV_NEXT]] = add nuw nsw i64 [[INDVARS_IV]], 1
	; CHECK-NEXT: [[EXITCOND:%.*]] = icmp eq i64 [[INDVARS_IV_NEXT]], [[WIDE_TRIP_COUNT]]			; CHECK-NEXT: [[EXITCOND:%.*]] = icmp eq i64 [[INDVARS_IV_NEXT]], [[WIDE_TRIP_COUNT]]
	; CHECK-NEXT: br i1 [[EXITCOND]], label [[FOR_COND_CLEANUP_LOOPEXIT]], label [[FOR_BODY]], [[LOOP11:!llvm.loop !.*]]			; CHECK-NEXT: br i1 [[EXITCOND]], label [[FOR_COND_CLEANUP_LOOPEXIT]], label [[FOR_BODY]], !llvm.loop [[LOOP11:![0-9]+]]
	;			;
	entry:			entry:
	%cmp12 = icmp sgt i32 %N, 0			%cmp12 = icmp sgt i32 %N, 0
	br i1 %cmp12, label %for.body.lr.ph, label %for.cond.cleanup			br i1 %cmp12, label %for.body.lr.ph, label %for.cond.cleanup

	for.body.lr.ph:			for.body.lr.ph:
	%wide.trip.count = zext i32 %N to i64			%wide.trip.count = zext i32 %N to i64
	br label %for.body			br label %for.body
	Show All 18 Lines

llvm/test/Transforms/LoopVectorize/X86/strided_load_cost.ll

	Show First 20 Lines • Show All 57 Lines • ▼ Show 20 Lines
	; CHECK-NEXT: [[TMP35:%.*]] = mul nsw <8 x i32> [[TMP34]], [[WIDE_LOAD]]			; CHECK-NEXT: [[TMP35:%.*]] = mul nsw <8 x i32> [[TMP34]], [[WIDE_LOAD]]
	; CHECK-NEXT: [[TMP36:%.*]] = add <8 x i32> [[VEC_PHI]], <i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4>			; CHECK-NEXT: [[TMP36:%.*]] = add <8 x i32> [[VEC_PHI]], <i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4>
	; CHECK-NEXT: [[TMP37]] = add <8 x i32> [[TMP36]], [[TMP35]]			; CHECK-NEXT: [[TMP37]] = add <8 x i32> [[TMP36]], [[TMP35]]
	; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 8			; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 8
	; CHECK-NEXT: [[TMP38:%.*]] = icmp eq i64 [[INDEX_NEXT]], 96			; CHECK-NEXT: [[TMP38:%.*]] = icmp eq i64 [[INDEX_NEXT]], 96
	; CHECK-NEXT: br i1 [[TMP38]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP5:![0-9]+]]			; CHECK-NEXT: br i1 [[TMP38]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP5:![0-9]+]]
	; CHECK: middle.block:			; CHECK: middle.block:
	; CHECK-NEXT: [[TMP39:%.*]] = call i32 @llvm.vector.reduce.add.v8i32(<8 x i32> [[TMP37]])			; CHECK-NEXT: [[TMP39:%.*]] = call i32 @llvm.vector.reduce.add.v8i32(<8 x i32> [[TMP37]])
				; CHECK-NEXT: [[RDX_START:%.*]] = add i32 0, [[TMP39]]
	; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i64 100, 96			; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i64 100, 96
	; CHECK-NEXT: br i1 [[CMP_N]], label [[FOR_COND_CLEANUP:%.*]], label [[SCALAR_PH]]			; CHECK-NEXT: br i1 [[CMP_N]], label [[FOR_COND_CLEANUP:%.*]], label [[SCALAR_PH]]
	; CHECK: scalar.ph:			; CHECK: scalar.ph:
	; CHECK-NEXT: [[BC_RESUME_VAL:%.]] = phi i64 [ 96, [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY:%.]] ]			; CHECK-NEXT: [[BC_RESUME_VAL:%.]] = phi i64 [ 96, [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY:%.]] ]
	; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 0, [[ENTRY]] ], [ [[TMP39]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 0, [[ENTRY]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: br label [[FOR_BODY:%.*]]			; CHECK-NEXT: br label [[FOR_BODY:%.*]]
	; CHECK: for.cond.cleanup:			; CHECK: for.cond.cleanup:
	; CHECK-NEXT: [[ADD7_LCSSA:%.]] = phi i32 [ [[ADD7:%.]], [[FOR_BODY]] ], [ [[TMP39]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[ADD7_LCSSA:%.]] = phi i32 [ [[ADD7:%.]], [[FOR_BODY]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: ret i32 [[ADD7_LCSSA]]			; CHECK-NEXT: ret i32 [[ADD7_LCSSA]]
	; CHECK: for.body:			; CHECK: for.body:
	; CHECK-NEXT: [[INDVARS_IV:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[INDVARS_IV_NEXT:%.]], [[FOR_BODY]] ]			; CHECK-NEXT: [[INDVARS_IV:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[INDVARS_IV_NEXT:%.]], [[FOR_BODY]] ]
	; CHECK-NEXT: [[SUM_015:%.*]] = phi i32 [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[ADD7]], [[FOR_BODY]] ]			; CHECK-NEXT: [[SUM_015:%.*]] = phi i32 [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[ADD7]], [[FOR_BODY]] ]
	; CHECK-NEXT: [[ARRAYIDX2:%.]] = getelementptr inbounds [100 x i32], [100 x i32] [[DATA]], i64 [[IDXPROM]], i64 [[INDVARS_IV]]			; CHECK-NEXT: [[ARRAYIDX2:%.]] = getelementptr inbounds [100 x i32], [100 x i32] [[DATA]], i64 [[IDXPROM]], i64 [[INDVARS_IV]]
	; CHECK-NEXT: [[TMP40:%.]] = load i32, i32 [[ARRAYIDX2]], align 4, !tbaa [[TBAA1]]			; CHECK-NEXT: [[TMP40:%.]] = load i32, i32 [[ARRAYIDX2]], align 4, !tbaa [[TBAA1]]
	; CHECK-NEXT: [[ARRAYIDX6:%.]] = getelementptr inbounds [100 x i32], [100 x i32] [[DATA]], i64 [[INDVARS_IV]], i64 [[IDXPROM5]]			; CHECK-NEXT: [[ARRAYIDX6:%.]] = getelementptr inbounds [100 x i32], [100 x i32] [[DATA]], i64 [[INDVARS_IV]], i64 [[IDXPROM5]]
	; CHECK-NEXT: [[TMP41:%.]] = load i32, i32 [[ARRAYIDX6]], align 4, !tbaa [[TBAA1]]			; CHECK-NEXT: [[TMP41:%.]] = load i32, i32 [[ARRAYIDX6]], align 4, !tbaa [[TBAA1]]
	▲ Show 20 Lines • Show All 41 Lines • Show Last 20 Lines

llvm/test/Transforms/LoopVectorize/X86/tail_loop_folding.ll

	Show First 20 Lines • Show All 46 Lines • ▼ Show 20 Lines
	; CHECK-NEXT: [[TMP13:%.]] = load i32, i32 [[ARRAYIDX]], align 4			; CHECK-NEXT: [[TMP13:%.]] = load i32, i32 [[ARRAYIDX]], align 4
	; CHECK-NEXT: [[ARRAYIDX2:%.]] = getelementptr inbounds i32, i32 [[C]], i64 [[INDVARS_IV]]			; CHECK-NEXT: [[ARRAYIDX2:%.]] = getelementptr inbounds i32, i32 [[C]], i64 [[INDVARS_IV]]
	; CHECK-NEXT: [[TMP14:%.]] = load i32, i32 [[ARRAYIDX2]], align 4			; CHECK-NEXT: [[TMP14:%.]] = load i32, i32 [[ARRAYIDX2]], align 4
	; CHECK-NEXT: [[ADD:%.*]] = add nsw i32 [[TMP14]], [[TMP13]]			; CHECK-NEXT: [[ADD:%.*]] = add nsw i32 [[TMP14]], [[TMP13]]
	; CHECK-NEXT: [[ARRAYIDX4:%.]] = getelementptr inbounds i32, i32 [[A]], i64 [[INDVARS_IV]]			; CHECK-NEXT: [[ARRAYIDX4:%.]] = getelementptr inbounds i32, i32 [[A]], i64 [[INDVARS_IV]]
	; CHECK-NEXT: store i32 [[ADD]], i32* [[ARRAYIDX4]], align 4			; CHECK-NEXT: store i32 [[ADD]], i32* [[ARRAYIDX4]], align 4
	; CHECK-NEXT: [[INDVARS_IV_NEXT]] = add nuw nsw i64 [[INDVARS_IV]], 1			; CHECK-NEXT: [[INDVARS_IV_NEXT]] = add nuw nsw i64 [[INDVARS_IV]], 1
	; CHECK-NEXT: [[EXITCOND:%.*]] = icmp eq i64 [[INDVARS_IV_NEXT]], 430			; CHECK-NEXT: [[EXITCOND:%.*]] = icmp eq i64 [[INDVARS_IV_NEXT]], 430
	; CHECK-NEXT: br i1 [[EXITCOND]], label [[FOR_COND_CLEANUP]], label [[FOR_BODY]], !llvm.loop [[LOOP3:![0-9]+]]			; CHECK-NEXT: br i1 [[EXITCOND]], label [[FOR_COND_CLEANUP]], label [[FOR_BODY]], !llvm.loop [[LOOP2:![0-9]+]]
	;			;
	entry:			entry:
	br label %for.body			br label %for.body

	for.cond.cleanup:			for.cond.cleanup:
	ret void			ret void

	for.body:			for.body:
	▲ Show 20 Lines • Show All 125 Lines • ▼ Show 20 Lines
	; CHECK-NEXT: [[TMP11:%.*]] = add nsw <8 x i32> [[WIDE_MASKED_LOAD3]], [[WIDE_MASKED_LOAD]]			; CHECK-NEXT: [[TMP11:%.*]] = add nsw <8 x i32> [[WIDE_MASKED_LOAD3]], [[WIDE_MASKED_LOAD]]
	; CHECK-NEXT: [[TMP12]] = add <8 x i32> [[TMP11]], [[VEC_PHI]]			; CHECK-NEXT: [[TMP12]] = add <8 x i32> [[TMP11]], [[VEC_PHI]]
	; CHECK-NEXT: [[TMP13:%.*]] = select <8 x i1> [[TMP4]], <8 x i32> [[TMP12]], <8 x i32> [[VEC_PHI]]			; CHECK-NEXT: [[TMP13:%.*]] = select <8 x i1> [[TMP4]], <8 x i32> [[TMP12]], <8 x i32> [[VEC_PHI]]
	; CHECK-NEXT: [[INDEX_NEXT]] = add i64 [[INDEX]], 8			; CHECK-NEXT: [[INDEX_NEXT]] = add i64 [[INDEX]], 8
	; CHECK-NEXT: [[TMP14:%.*]] = icmp eq i64 [[INDEX_NEXT]], [[N_VEC]]			; CHECK-NEXT: [[TMP14:%.*]] = icmp eq i64 [[INDEX_NEXT]], [[N_VEC]]
	; CHECK-NEXT: br i1 [[TMP14]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP6:![0-9]+]]			; CHECK-NEXT: br i1 [[TMP14]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP6:![0-9]+]]
	; CHECK: middle.block:			; CHECK: middle.block:
	; CHECK-NEXT: [[TMP15:%.*]] = call i32 @llvm.vector.reduce.add.v8i32(<8 x i32> [[TMP13]])			; CHECK-NEXT: [[TMP15:%.*]] = call i32 @llvm.vector.reduce.add.v8i32(<8 x i32> [[TMP13]])
				; CHECK-NEXT: [[RDX_START:%.*]] = add i32 0, [[TMP15]]
	; CHECK-NEXT: br i1 true, label [[FOR_COND_CLEANUP:%.*]], label [[SCALAR_PH]]			; CHECK-NEXT: br i1 true, label [[FOR_COND_CLEANUP:%.*]], label [[SCALAR_PH]]
	; CHECK: scalar.ph:			; CHECK: scalar.ph:
	; CHECK-NEXT: [[BC_RESUME_VAL:%.]] = phi i64 [ [[N_VEC]], [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY:%.]] ]			; CHECK-NEXT: [[BC_RESUME_VAL:%.]] = phi i64 [ [[N_VEC]], [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY:%.]] ]
	; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 0, [[ENTRY]] ], [ [[TMP15]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 0, [[ENTRY]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: br label [[FOR_BODY:%.*]]			; CHECK-NEXT: br label [[FOR_BODY:%.*]]
	; CHECK: for.body:			; CHECK: for.body:
	; CHECK-NEXT: [[INDVARS_IV:%.]] = phi i64 [ [[INDVARS_IV_NEXT:%.]], [[FOR_BODY]] ], [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ]			; CHECK-NEXT: [[INDVARS_IV:%.]] = phi i64 [ [[INDVARS_IV_NEXT:%.]], [[FOR_BODY]] ], [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ]
	; CHECK-NEXT: [[SUM_0:%.]] = phi i32 [ [[SUM_1:%.]], [[FOR_BODY]] ], [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ]			; CHECK-NEXT: [[SUM_0:%.]] = phi i32 [ [[SUM_1:%.]], [[FOR_BODY]] ], [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ]
	; CHECK-NEXT: [[INDVARS_IV_NEXT]] = add nuw nsw i64 [[INDVARS_IV]], 1			; CHECK-NEXT: [[INDVARS_IV_NEXT]] = add nuw nsw i64 [[INDVARS_IV]], 1
	; CHECK-NEXT: [[ARRAYIDXA:%.]] = getelementptr inbounds i32, i32 [[A]], i64 [[INDVARS_IV]]			; CHECK-NEXT: [[ARRAYIDXA:%.]] = getelementptr inbounds i32, i32 [[A]], i64 [[INDVARS_IV]]
	; CHECK-NEXT: [[TMP16:%.]] = load i32, i32 [[ARRAYIDXA]], align 4			; CHECK-NEXT: [[TMP16:%.]] = load i32, i32 [[ARRAYIDXA]], align 4
	; CHECK-NEXT: [[ARRAYIDXB:%.]] = getelementptr inbounds i32, i32 [[B]], i64 [[INDVARS_IV]]			; CHECK-NEXT: [[ARRAYIDXB:%.]] = getelementptr inbounds i32, i32 [[B]], i64 [[INDVARS_IV]]
	; CHECK-NEXT: [[TMP17:%.]] = load i32, i32 [[ARRAYIDXB]], align 4			; CHECK-NEXT: [[TMP17:%.]] = load i32, i32 [[ARRAYIDXB]], align 4
	; CHECK-NEXT: [[ADD:%.*]] = add nsw i32 [[TMP17]], [[TMP16]]			; CHECK-NEXT: [[ADD:%.*]] = add nsw i32 [[TMP17]], [[TMP16]]
	; CHECK-NEXT: [[SUM_1]] = add nuw nsw i32 [[ADD]], [[SUM_0]]			; CHECK-NEXT: [[SUM_1]] = add nuw nsw i32 [[ADD]], [[SUM_0]]
	; CHECK-NEXT: [[LFTR_WIDEIV:%.*]] = trunc i64 [[INDVARS_IV_NEXT]] to i32			; CHECK-NEXT: [[LFTR_WIDEIV:%.*]] = trunc i64 [[INDVARS_IV_NEXT]] to i32
	; CHECK-NEXT: [[EXITCOND:%.*]] = icmp eq i32 [[LFTR_WIDEIV]], [[N]]			; CHECK-NEXT: [[EXITCOND:%.*]] = icmp eq i32 [[LFTR_WIDEIV]], [[N]]
	; CHECK-NEXT: br i1 [[EXITCOND]], label [[FOR_COND_CLEANUP]], label [[FOR_BODY]], !llvm.loop [[LOOP7:![0-9]+]]			; CHECK-NEXT: br i1 [[EXITCOND]], label [[FOR_COND_CLEANUP]], label [[FOR_BODY]], !llvm.loop [[LOOP7:![0-9]+]]
	; CHECK: for.cond.cleanup:			; CHECK: for.cond.cleanup:
	; CHECK-NEXT: [[SUM_1_LCSSA:%.*]] = phi i32 [ [[SUM_1]], [[FOR_BODY]] ], [ [[TMP15]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[SUM_1_LCSSA:%.*]] = phi i32 [ [[SUM_1]], [[FOR_BODY]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: ret i32 [[SUM_1_LCSSA]]			; CHECK-NEXT: ret i32 [[SUM_1_LCSSA]]
	;			;
	entry:			entry:
	br label %for.body			br label %for.body

	for.body:			for.body:
	%indvars.iv = phi i64 [ %indvars.iv.next, %for.body ], [ 0, %entry ]			%indvars.iv = phi i64 [ %indvars.iv.next, %for.body ], [ 0, %entry ]
	%sum.0 = phi i32 [ %sum.1, %for.body ], [ 0, %entry ]			%sum.0 = phi i32 [ %sum.1, %for.body ], [ 0, %entry ]
	%indvars.iv.next = add nuw nsw i64 %indvars.iv, 1			%indvars.iv.next = add nuw nsw i64 %indvars.iv, 1
	%arrayidxA = getelementptr inbounds i32, i32* %A, i64 %indvars.iv			%arrayidxA = getelementptr inbounds i32, i32* %A, i64 %indvars.iv
	%0 = load i32, i32* %arrayidxA, align 4			%0 = load i32, i32* %arrayidxA, align 4
	%arrayidxB = getelementptr inbounds i32, i32* %B, i64 %indvars.iv			%arrayidxB = getelementptr inbounds i32, i32* %B, i64 %indvars.iv
	%1 = load i32, i32* %arrayidxB, align 4			%1 = load i32, i32* %arrayidxB, align 4
	%add = add nsw i32 %1, %0			%add = add nsw i32 %1, %0
	%sum.1 = add nuw nsw i32 %add, %sum.0			%sum.1 = add nuw nsw i32 %add, %sum.0
	%lftr.wideiv = trunc i64 %indvars.iv.next to i32			%lftr.wideiv = trunc i64 %indvars.iv.next to i32
	%exitcond = icmp eq i32 %lftr.wideiv, %N			%exitcond = icmp eq i32 %lftr.wideiv, %N
	br i1 %exitcond, label %for.cond.cleanup, label %for.body			br i1 %exitcond, label %for.cond.cleanup, label %for.body

	for.cond.cleanup:			for.cond.cleanup:
	ret i32 %sum.1			ret i32 %sum.1
	}			}

	; CHECK: [[LOOP0]] = distinct !{[[LOOP0]], [[MD_IS_VEC:![0-9]+]]}
	; CHECK-NEXT: [[MD_IS_VEC:![0-9]+]] = !{!"llvm.loop.isvectorized", i32 1}
	; CHECK-NEXT: [[LOOP3]] = distinct !{[[LOOP3]], [[MD_RT_UNROLL_DIS:![0-9]+]], [[MD_IS_VEC]]}
	; CHECK-NEXT: [[MD_RT_UNROLL_DIS]] = !{!"llvm.loop.unroll.runtime.disable"}
	; CHECK-NEXT: [[LOOP4]] = distinct !{[[LOOP4]], [[MD_IS_VEC]]}
	; CHECK-NEXT: [[LOOP5]] = distinct !{[[LOOP5]], [[MD_RT_UNROLL_DIS]], [[MD_IS_VEC]]}

	attributes #0 = { nounwind optsize uwtable "target-cpu"="core-avx2" "target-features"="+avx,+avx2" }			attributes #0 = { nounwind optsize uwtable "target-cpu"="core-avx2" "target-features"="+avx,+avx2" }

	!6 = distinct !{!6, !7, !8}			!6 = distinct !{!6, !7, !8}
	!7 = !{!"llvm.loop.vectorize.predicate.enable", i1 true}			!7 = !{!"llvm.loop.vectorize.predicate.enable", i1 true}
	!8 = !{!"llvm.loop.vectorize.enable", i1 true}			!8 = !{!"llvm.loop.vectorize.enable", i1 true}

	!10 = distinct !{!10, !11, !12}			!10 = distinct !{!10, !11, !12}
	!11 = !{!"llvm.loop.vectorize.predicate.enable", i1 false}			!11 = !{!"llvm.loop.vectorize.predicate.enable", i1 false}
	!12 = !{!"llvm.loop.vectorize.enable", i1 true}			!12 = !{!"llvm.loop.vectorize.enable", i1 true}

llvm/test/Transforms/LoopVectorize/X86/uniform_mem_op.ll

	Show First 20 Lines • Show All 71 Lines • ▼ Show 20 Lines
	; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 16			; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 16
	; CHECK-NEXT: [[TMP5:%.*]] = icmp eq i64 [[INDEX_NEXT]], 4096			; CHECK-NEXT: [[TMP5:%.*]] = icmp eq i64 [[INDEX_NEXT]], 4096
	; CHECK-NEXT: br i1 [[TMP5]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP4:![0-9]+]]			; CHECK-NEXT: br i1 [[TMP5]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP4:![0-9]+]]
	; CHECK: middle.block:			; CHECK: middle.block:
	; CHECK-NEXT: [[BIN_RDX:%.*]] = add <4 x i32> [[TMP2]], [[TMP1]]			; CHECK-NEXT: [[BIN_RDX:%.*]] = add <4 x i32> [[TMP2]], [[TMP1]]
	; CHECK-NEXT: [[BIN_RDX10:%.*]] = add <4 x i32> [[TMP3]], [[BIN_RDX]]			; CHECK-NEXT: [[BIN_RDX10:%.*]] = add <4 x i32> [[TMP3]], [[BIN_RDX]]
	; CHECK-NEXT: [[BIN_RDX11:%.*]] = add <4 x i32> [[TMP4]], [[BIN_RDX10]]			; CHECK-NEXT: [[BIN_RDX11:%.*]] = add <4 x i32> [[TMP4]], [[BIN_RDX10]]
	; CHECK-NEXT: [[TMP6:%.*]] = call i32 @llvm.vector.reduce.add.v4i32(<4 x i32> [[BIN_RDX11]])			; CHECK-NEXT: [[TMP6:%.*]] = call i32 @llvm.vector.reduce.add.v4i32(<4 x i32> [[BIN_RDX11]])
				; CHECK-NEXT: [[RDX_START:%.*]] = add i32 0, [[TMP6]]
	; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i64 4097, 4096			; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i64 4097, 4096
	; CHECK-NEXT: br i1 [[CMP_N]], label [[LOOPEXIT:%.*]], label [[SCALAR_PH]]			; CHECK-NEXT: br i1 [[CMP_N]], label [[LOOPEXIT:%.*]], label [[SCALAR_PH]]
	; CHECK: scalar.ph:			; CHECK: scalar.ph:
	; CHECK-NEXT: [[BC_RESUME_VAL:%.]] = phi i64 [ 4096, [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY:%.]] ]			; CHECK-NEXT: [[BC_RESUME_VAL:%.]] = phi i64 [ 4096, [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY:%.]] ]
	; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 0, [[ENTRY]] ], [ [[TMP6]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 0, [[ENTRY]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: br label [[FOR_BODY:%.*]]			; CHECK-NEXT: br label [[FOR_BODY:%.*]]
	; CHECK: for.body:			; CHECK: for.body:
	; CHECK-NEXT: [[IV:%.]] = phi i64 [ [[IV_NEXT:%.]], [[FOR_BODY]] ], [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ]			; CHECK-NEXT: [[IV:%.]] = phi i64 [ [[IV_NEXT:%.]], [[FOR_BODY]] ], [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ]
	; CHECK-NEXT: [[ACCUM:%.]] = phi i32 [ [[ACCUM_NEXT:%.]], [[FOR_BODY]] ], [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ]			; CHECK-NEXT: [[ACCUM:%.]] = phi i32 [ [[ACCUM_NEXT:%.]], [[FOR_BODY]] ], [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ]
	; CHECK-NEXT: [[LOAD:%.]] = load i32, i32 [[ADDR]], align 4			; CHECK-NEXT: [[LOAD:%.]] = load i32, i32 [[ADDR]], align 4
	; CHECK-NEXT: [[ACCUM_NEXT]] = add i32 [[ACCUM]], [[LOAD]]			; CHECK-NEXT: [[ACCUM_NEXT]] = add i32 [[ACCUM]], [[LOAD]]
	; CHECK-NEXT: [[IV_NEXT]] = add nuw nsw i64 [[IV]], 1			; CHECK-NEXT: [[IV_NEXT]] = add nuw nsw i64 [[IV]], 1
	; CHECK-NEXT: [[EXITCOND:%.*]] = icmp eq i64 [[IV]], 4096			; CHECK-NEXT: [[EXITCOND:%.*]] = icmp eq i64 [[IV]], 4096
	; CHECK-NEXT: br i1 [[EXITCOND]], label [[LOOPEXIT]], label [[FOR_BODY]], !llvm.loop [[LOOP5:![0-9]+]]			; CHECK-NEXT: br i1 [[EXITCOND]], label [[LOOPEXIT]], label [[FOR_BODY]], !llvm.loop [[LOOP5:![0-9]+]]
	; CHECK: loopexit:			; CHECK: loopexit:
	; CHECK-NEXT: [[ACCUM_NEXT_LCSSA:%.*]] = phi i32 [ [[ACCUM_NEXT]], [[FOR_BODY]] ], [ [[TMP6]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[ACCUM_NEXT_LCSSA:%.*]] = phi i32 [ [[ACCUM_NEXT]], [[FOR_BODY]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: ret i32 [[ACCUM_NEXT_LCSSA]]			; CHECK-NEXT: ret i32 [[ACCUM_NEXT_LCSSA]]
	;			;
	entry:			entry:
	br label %for.body			br label %for.body

	for.body:			for.body:
	%iv = phi i64 [ %iv.next, %for.body ], [ 0, %entry ]			%iv = phi i64 [ %iv.next, %for.body ], [ 0, %entry ]
	%accum = phi i32 [%accum.next, %for.body], [0, %entry]			%accum = phi i32 [%accum.next, %for.body], [0, %entry]
	▲ Show 20 Lines • Show All 327 Lines • ▼ Show 20 Lines
	; CHECK-NEXT: [[TMP51]] = add <4 x i32> [[VEC_PHI2]], [[TMP49]]			; CHECK-NEXT: [[TMP51]] = add <4 x i32> [[VEC_PHI2]], [[TMP49]]
	; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 8			; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 8
	; CHECK-NEXT: [[VEC_IND_NEXT]] = add <4 x i64> [[STEP_ADD]], <i64 4, i64 4, i64 4, i64 4>			; CHECK-NEXT: [[VEC_IND_NEXT]] = add <4 x i64> [[STEP_ADD]], <i64 4, i64 4, i64 4, i64 4>
	; CHECK-NEXT: [[TMP52:%.*]] = icmp eq i64 [[INDEX_NEXT]], 4096			; CHECK-NEXT: [[TMP52:%.*]] = icmp eq i64 [[INDEX_NEXT]], 4096
	; CHECK-NEXT: br i1 [[TMP52]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP19:![0-9]+]]			; CHECK-NEXT: br i1 [[TMP52]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP19:![0-9]+]]
	; CHECK: middle.block:			; CHECK: middle.block:
	; CHECK-NEXT: [[BIN_RDX:%.*]] = add <4 x i32> [[TMP51]], [[TMP50]]			; CHECK-NEXT: [[BIN_RDX:%.*]] = add <4 x i32> [[TMP51]], [[TMP50]]
	; CHECK-NEXT: [[TMP53:%.*]] = call i32 @llvm.vector.reduce.add.v4i32(<4 x i32> [[BIN_RDX]])			; CHECK-NEXT: [[TMP53:%.*]] = call i32 @llvm.vector.reduce.add.v4i32(<4 x i32> [[BIN_RDX]])
				; CHECK-NEXT: [[RDX_START:%.*]] = add i32 0, [[TMP53]]
	; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i64 4096, 4096			; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i64 4096, 4096
	; CHECK-NEXT: br i1 [[CMP_N]], label [[LOOP_EXIT:%.*]], label [[SCALAR_PH]]			; CHECK-NEXT: br i1 [[CMP_N]], label [[LOOP_EXIT:%.*]], label [[SCALAR_PH]]
	; CHECK: scalar.ph:			; CHECK: scalar.ph:
	; CHECK-NEXT: [[BC_RESUME_VAL:%.]] = phi i64 [ 4096, [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY:%.]] ]			; CHECK-NEXT: [[BC_RESUME_VAL:%.]] = phi i64 [ 4096, [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY:%.]] ]
	; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 0, [[ENTRY]] ], [ [[TMP53]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 0, [[ENTRY]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: br label [[LOOP:%.*]]			; CHECK-NEXT: br label [[LOOP:%.*]]
	; CHECK: loop:			; CHECK: loop:
	; CHECK-NEXT: [[IV:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[IV_NEXT:%.]], [[LOOP]] ]			; CHECK-NEXT: [[IV:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[IV_NEXT:%.]], [[LOOP]] ]
	; CHECK-NEXT: [[ACCUM:%.]] = phi i32 [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[ACCUM_NEXT:%.]], [[LOOP]] ]			; CHECK-NEXT: [[ACCUM:%.]] = phi i32 [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[ACCUM_NEXT:%.]], [[LOOP]] ]
	; CHECK-NEXT: [[IV_NEXT]] = add i64 [[IV]], 1			; CHECK-NEXT: [[IV_NEXT]] = add i64 [[IV]], 1
	; CHECK-NEXT: [[BYTE:%.*]] = udiv i64 [[IV]], 8			; CHECK-NEXT: [[BYTE:%.*]] = udiv i64 [[IV]], 8
	; CHECK-NEXT: [[TEST_ADDR:%.]] = getelementptr inbounds i8, i8 [[TEST_BASE]], i64 [[BYTE]]			; CHECK-NEXT: [[TEST_ADDR:%.]] = getelementptr inbounds i8, i8 [[TEST_BASE]], i64 [[BYTE]]
	; CHECK-NEXT: [[EARLYCND:%.]] = load i8, i8 [[TEST_ADDR]], align 1			; CHECK-NEXT: [[EARLYCND:%.]] = load i8, i8 [[TEST_ADDR]], align 1
	; CHECK-NEXT: [[BIT:%.*]] = urem i64 [[IV]], 8			; CHECK-NEXT: [[BIT:%.*]] = urem i64 [[IV]], 8
	; CHECK-NEXT: [[BIT_TRUNC:%.*]] = trunc i64 [[BIT]] to i8			; CHECK-NEXT: [[BIT_TRUNC:%.*]] = trunc i64 [[BIT]] to i8
	; CHECK-NEXT: [[MASK:%.*]] = lshr i8 [[EARLYCND]], [[BIT_TRUNC]]			; CHECK-NEXT: [[MASK:%.*]] = lshr i8 [[EARLYCND]], [[BIT_TRUNC]]
	; CHECK-NEXT: [[TEST:%.*]] = and i8 [[MASK]], 1			; CHECK-NEXT: [[TEST:%.*]] = and i8 [[MASK]], 1
	; CHECK-NEXT: [[VAL:%.*]] = zext i8 [[TEST]] to i32			; CHECK-NEXT: [[VAL:%.*]] = zext i8 [[TEST]] to i32
	; CHECK-NEXT: [[ACCUM_NEXT]] = add i32 [[ACCUM]], [[VAL]]			; CHECK-NEXT: [[ACCUM_NEXT]] = add i32 [[ACCUM]], [[VAL]]
	; CHECK-NEXT: [[EXIT:%.*]] = icmp ugt i64 [[IV]], 4094			; CHECK-NEXT: [[EXIT:%.*]] = icmp ugt i64 [[IV]], 4094
	; CHECK-NEXT: br i1 [[EXIT]], label [[LOOP_EXIT]], label [[LOOP]], !llvm.loop [[LOOP20:![0-9]+]]			; CHECK-NEXT: br i1 [[EXIT]], label [[LOOP_EXIT]], label [[LOOP]], !llvm.loop [[LOOP20:![0-9]+]]
	; CHECK: loop_exit:			; CHECK: loop_exit:
	; CHECK-NEXT: [[ACCUM_NEXT_LCSSA:%.*]] = phi i32 [ [[ACCUM_NEXT]], [[LOOP]] ], [ [[TMP53]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[ACCUM_NEXT_LCSSA:%.*]] = phi i32 [ [[ACCUM_NEXT]], [[LOOP]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: ret i32 [[ACCUM_NEXT_LCSSA]]			; CHECK-NEXT: ret i32 [[ACCUM_NEXT_LCSSA]]
	;			;
	entry:			entry:
	%alloca = alloca [4096 x i32]			%alloca = alloca [4096 x i32]
	%base = bitcast [4096 x i32]* %alloca to i32*			%base = bitcast [4096 x i32]* %alloca to i32*
	call void @init(i32* %base)			call void @init(i32* %base)
	br label %loop			br label %loop
	loop:			loop:
	▲ Show 20 Lines • Show All 41 Lines • ▼ Show 20 Lines
	; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 16			; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 16
	; CHECK-NEXT: [[TMP5:%.*]] = icmp eq i64 [[INDEX_NEXT]], 4096			; CHECK-NEXT: [[TMP5:%.*]] = icmp eq i64 [[INDEX_NEXT]], 4096
	; CHECK-NEXT: br i1 [[TMP5]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP21:![0-9]+]]			; CHECK-NEXT: br i1 [[TMP5]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP21:![0-9]+]]
	; CHECK: middle.block:			; CHECK: middle.block:
	; CHECK-NEXT: [[BIN_RDX:%.*]] = add <4 x i32> [[TMP2]], [[TMP1]]			; CHECK-NEXT: [[BIN_RDX:%.*]] = add <4 x i32> [[TMP2]], [[TMP1]]
	; CHECK-NEXT: [[BIN_RDX10:%.*]] = add <4 x i32> [[TMP3]], [[BIN_RDX]]			; CHECK-NEXT: [[BIN_RDX10:%.*]] = add <4 x i32> [[TMP3]], [[BIN_RDX]]
	; CHECK-NEXT: [[BIN_RDX11:%.*]] = add <4 x i32> [[TMP4]], [[BIN_RDX10]]			; CHECK-NEXT: [[BIN_RDX11:%.*]] = add <4 x i32> [[TMP4]], [[BIN_RDX10]]
	; CHECK-NEXT: [[TMP6:%.*]] = call i32 @llvm.vector.reduce.add.v4i32(<4 x i32> [[BIN_RDX11]])			; CHECK-NEXT: [[TMP6:%.*]] = call i32 @llvm.vector.reduce.add.v4i32(<4 x i32> [[BIN_RDX11]])
				; CHECK-NEXT: [[RDX_START:%.*]] = add i32 0, [[TMP6]]
	; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i64 4097, 4096			; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i64 4097, 4096
	; CHECK-NEXT: br i1 [[CMP_N]], label [[LOOPEXIT:%.*]], label [[SCALAR_PH]]			; CHECK-NEXT: br i1 [[CMP_N]], label [[LOOPEXIT:%.*]], label [[SCALAR_PH]]
	; CHECK: scalar.ph:			; CHECK: scalar.ph:
	; CHECK-NEXT: [[BC_RESUME_VAL:%.]] = phi i64 [ 4096, [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY:%.]] ]			; CHECK-NEXT: [[BC_RESUME_VAL:%.]] = phi i64 [ 4096, [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY:%.]] ]
	; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 0, [[ENTRY]] ], [ [[TMP6]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 0, [[ENTRY]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: br label [[FOR_BODY:%.*]]			; CHECK-NEXT: br label [[FOR_BODY:%.*]]
	; CHECK: for.body:			; CHECK: for.body:
	; CHECK-NEXT: [[IV:%.]] = phi i64 [ [[IV_NEXT:%.]], [[FOR_BODY]] ], [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ]			; CHECK-NEXT: [[IV:%.]] = phi i64 [ [[IV_NEXT:%.]], [[FOR_BODY]] ], [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ]
	; CHECK-NEXT: [[ACCUM:%.]] = phi i32 [ [[ACCUM_NEXT:%.]], [[FOR_BODY]] ], [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ]			; CHECK-NEXT: [[ACCUM:%.]] = phi i32 [ [[ACCUM_NEXT:%.]], [[FOR_BODY]] ], [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ]
	; CHECK-NEXT: [[LOAD:%.]] = load i32, i32 @GAddr, align 4			; CHECK-NEXT: [[LOAD:%.]] = load i32, i32 @GAddr, align 4
	; CHECK-NEXT: [[ACCUM_NEXT]] = add i32 [[ACCUM]], [[LOAD]]			; CHECK-NEXT: [[ACCUM_NEXT]] = add i32 [[ACCUM]], [[LOAD]]
	; CHECK-NEXT: [[IV_NEXT]] = add nuw nsw i64 [[IV]], 1			; CHECK-NEXT: [[IV_NEXT]] = add nuw nsw i64 [[IV]], 1
	; CHECK-NEXT: [[EXITCOND:%.*]] = icmp eq i64 [[IV]], 4096			; CHECK-NEXT: [[EXITCOND:%.*]] = icmp eq i64 [[IV]], 4096
	; CHECK-NEXT: br i1 [[EXITCOND]], label [[LOOPEXIT]], label [[FOR_BODY]], !llvm.loop [[LOOP22:![0-9]+]]			; CHECK-NEXT: br i1 [[EXITCOND]], label [[LOOPEXIT]], label [[FOR_BODY]], !llvm.loop [[LOOP22:![0-9]+]]
	; CHECK: loopexit:			; CHECK: loopexit:
	; CHECK-NEXT: [[ACCUM_NEXT_LCSSA:%.*]] = phi i32 [ [[ACCUM_NEXT]], [[FOR_BODY]] ], [ [[TMP6]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[ACCUM_NEXT_LCSSA:%.*]] = phi i32 [ [[ACCUM_NEXT]], [[FOR_BODY]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: ret i32 [[ACCUM_NEXT_LCSSA]]			; CHECK-NEXT: ret i32 [[ACCUM_NEXT_LCSSA]]
	;			;
	entry:			entry:
	br label %for.body			br label %for.body

	for.body:			for.body:
	%iv = phi i64 [ %iv.next, %for.body ], [ 0, %entry ]			%iv = phi i64 [ %iv.next, %for.body ], [ 0, %entry ]
	%accum = phi i32 [%accum.next, %for.body], [0, %entry]			%accum = phi i32 [%accum.next, %for.body], [0, %entry]
	Show All 30 Lines
	; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 16			; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 16
	; CHECK-NEXT: [[TMP5:%.*]] = icmp eq i64 [[INDEX_NEXT]], 4096			; CHECK-NEXT: [[TMP5:%.*]] = icmp eq i64 [[INDEX_NEXT]], 4096
	; CHECK-NEXT: br i1 [[TMP5]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP23:![0-9]+]]			; CHECK-NEXT: br i1 [[TMP5]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP23:![0-9]+]]
	; CHECK: middle.block:			; CHECK: middle.block:
	; CHECK-NEXT: [[BIN_RDX:%.*]] = add <4 x i32> [[TMP2]], [[TMP1]]			; CHECK-NEXT: [[BIN_RDX:%.*]] = add <4 x i32> [[TMP2]], [[TMP1]]
	; CHECK-NEXT: [[BIN_RDX10:%.*]] = add <4 x i32> [[TMP3]], [[BIN_RDX]]			; CHECK-NEXT: [[BIN_RDX10:%.*]] = add <4 x i32> [[TMP3]], [[BIN_RDX]]
	; CHECK-NEXT: [[BIN_RDX11:%.*]] = add <4 x i32> [[TMP4]], [[BIN_RDX10]]			; CHECK-NEXT: [[BIN_RDX11:%.*]] = add <4 x i32> [[TMP4]], [[BIN_RDX10]]
	; CHECK-NEXT: [[TMP6:%.*]] = call i32 @llvm.vector.reduce.add.v4i32(<4 x i32> [[BIN_RDX11]])			; CHECK-NEXT: [[TMP6:%.*]] = call i32 @llvm.vector.reduce.add.v4i32(<4 x i32> [[BIN_RDX11]])
				; CHECK-NEXT: [[RDX_START:%.*]] = add i32 0, [[TMP6]]
	; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i64 4097, 4096			; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i64 4097, 4096
	; CHECK-NEXT: br i1 [[CMP_N]], label [[LOOPEXIT:%.*]], label [[SCALAR_PH]]			; CHECK-NEXT: br i1 [[CMP_N]], label [[LOOPEXIT:%.*]], label [[SCALAR_PH]]
	; CHECK: scalar.ph:			; CHECK: scalar.ph:
	; CHECK-NEXT: [[BC_RESUME_VAL:%.]] = phi i64 [ 4096, [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY:%.]] ]			; CHECK-NEXT: [[BC_RESUME_VAL:%.]] = phi i64 [ 4096, [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY:%.]] ]
	; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 0, [[ENTRY]] ], [ [[TMP6]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 0, [[ENTRY]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: br label [[FOR_BODY:%.*]]			; CHECK-NEXT: br label [[FOR_BODY:%.*]]
	; CHECK: for.body:			; CHECK: for.body:
	; CHECK-NEXT: [[IV:%.]] = phi i64 [ [[IV_NEXT:%.]], [[FOR_BODY]] ], [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ]			; CHECK-NEXT: [[IV:%.]] = phi i64 [ [[IV_NEXT:%.]], [[FOR_BODY]] ], [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ]
	; CHECK-NEXT: [[ACCUM:%.]] = phi i32 [ [[ACCUM_NEXT:%.]], [[FOR_BODY]] ], [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ]			; CHECK-NEXT: [[ACCUM:%.]] = phi i32 [ [[ACCUM_NEXT:%.]], [[FOR_BODY]] ], [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ]
	; CHECK-NEXT: [[LOAD:%.]] = load i32, i32 getelementptr (i32, i32* @GAddr, i64 5), align 4			; CHECK-NEXT: [[LOAD:%.]] = load i32, i32 getelementptr (i32, i32* @GAddr, i64 5), align 4
	; CHECK-NEXT: [[ACCUM_NEXT]] = add i32 [[ACCUM]], [[LOAD]]			; CHECK-NEXT: [[ACCUM_NEXT]] = add i32 [[ACCUM]], [[LOAD]]
	; CHECK-NEXT: [[IV_NEXT]] = add nuw nsw i64 [[IV]], 1			; CHECK-NEXT: [[IV_NEXT]] = add nuw nsw i64 [[IV]], 1
	; CHECK-NEXT: [[EXITCOND:%.*]] = icmp eq i64 [[IV]], 4096			; CHECK-NEXT: [[EXITCOND:%.*]] = icmp eq i64 [[IV]], 4096
	; CHECK-NEXT: br i1 [[EXITCOND]], label [[LOOPEXIT]], label [[FOR_BODY]], !llvm.loop [[LOOP24:![0-9]+]]			; CHECK-NEXT: br i1 [[EXITCOND]], label [[LOOPEXIT]], label [[FOR_BODY]], !llvm.loop [[LOOP24:![0-9]+]]
	; CHECK: loopexit:			; CHECK: loopexit:
	; CHECK-NEXT: [[ACCUM_NEXT_LCSSA:%.*]] = phi i32 [ [[ACCUM_NEXT]], [[FOR_BODY]] ], [ [[TMP6]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[ACCUM_NEXT_LCSSA:%.*]] = phi i32 [ [[ACCUM_NEXT]], [[FOR_BODY]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: ret i32 [[ACCUM_NEXT_LCSSA]]			; CHECK-NEXT: ret i32 [[ACCUM_NEXT_LCSSA]]
	;			;
	entry:			entry:
	br label %for.body			br label %for.body

	for.body: ; preds = %for.body, %entry			for.body: ; preds = %for.body, %entry
	%iv = phi i64 [ %iv.next, %for.body ], [ 0, %entry ]			%iv = phi i64 [ %iv.next, %for.body ], [ 0, %entry ]
	%accum = phi i32 [ %accum.next, %for.body ], [ 0, %entry ]			%accum = phi i32 [ %accum.next, %for.body ], [ 0, %entry ]
	Show All 9 Lines

llvm/test/Transforms/LoopVectorize/X86/x86-predication.ll

	Show First 20 Lines • Show All 48 Lines • ▼ Show 20 Lines
	; CHECK-NEXT: [[TMP18:%.*]] = xor <2 x i1> [[BROADCAST_SPLAT]], <i1 true, i1 true>			; CHECK-NEXT: [[TMP18:%.*]] = xor <2 x i1> [[BROADCAST_SPLAT]], <i1 true, i1 true>
	; CHECK-NEXT: [[PREDPHI:%.*]] = select <2 x i1> [[BROADCAST_SPLAT]], <2 x i32> [[TMP17]], <2 x i32> [[WIDE_LOAD]]			; CHECK-NEXT: [[PREDPHI:%.*]] = select <2 x i1> [[BROADCAST_SPLAT]], <2 x i32> [[TMP17]], <2 x i32> [[WIDE_LOAD]]
	; CHECK-NEXT: [[TMP19]] = add <2 x i32> [[VEC_PHI]], [[PREDPHI]]			; CHECK-NEXT: [[TMP19]] = add <2 x i32> [[VEC_PHI]], [[PREDPHI]]
	; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 2			; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 2
	; CHECK-NEXT: [[TMP20:%.*]] = icmp eq i64 [[INDEX_NEXT]], 10000			; CHECK-NEXT: [[TMP20:%.*]] = icmp eq i64 [[INDEX_NEXT]], 10000
	; CHECK-NEXT: br i1 [[TMP20]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP0:![0-9]+]]			; CHECK-NEXT: br i1 [[TMP20]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP0:![0-9]+]]
	; CHECK: middle.block:			; CHECK: middle.block:
	; CHECK-NEXT: [[TMP21:%.*]] = call i32 @llvm.vector.reduce.add.v2i32(<2 x i32> [[TMP19]])			; CHECK-NEXT: [[TMP21:%.*]] = call i32 @llvm.vector.reduce.add.v2i32(<2 x i32> [[TMP19]])
				; CHECK-NEXT: [[RDX_START:%.*]] = add i32 0, [[TMP21]]
	; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i64 10000, 10000			; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i64 10000, 10000
	; CHECK-NEXT: br i1 [[CMP_N]], label [[FOR_END:%.]], label [[FOR_BODY:%.]]			; CHECK-NEXT: br i1 [[CMP_N]], label [[FOR_END:%.]], label [[FOR_BODY:%.]]
	; CHECK: for.body:			; CHECK: for.body:
	; CHECK-NEXT: [[I:%.]] = phi i64 [ [[I_NEXT:%.]], [[FOR_INC:%.*]] ], [ 10000, [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[I:%.]] = phi i64 [ [[I_NEXT:%.]], [[FOR_INC:%.*]] ], [ 10000, [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: [[R:%.]] = phi i32 [ [[T7:%.]], [[FOR_INC]] ], [ [[TMP21]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[R:%.]] = phi i32 [ [[T7:%.]], [[FOR_INC]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: [[T0:%.]] = getelementptr inbounds i32, i32 [[A]], i64 [[I]]			; CHECK-NEXT: [[T0:%.]] = getelementptr inbounds i32, i32 [[A]], i64 [[I]]
	; CHECK-NEXT: [[T1:%.]] = load i32, i32 [[T0]], align 4			; CHECK-NEXT: [[T1:%.]] = load i32, i32 [[T0]], align 4
	; CHECK-NEXT: br i1 [[C]], label [[IF_THEN:%.*]], label [[FOR_INC]]			; CHECK-NEXT: br i1 [[C]], label [[IF_THEN:%.*]], label [[FOR_INC]]
	; CHECK: if.then:			; CHECK: if.then:
	; CHECK-NEXT: [[T2:%.]] = getelementptr inbounds i32, i32 [[B]], i64 [[I]]			; CHECK-NEXT: [[T2:%.]] = getelementptr inbounds i32, i32 [[B]], i64 [[I]]
	; CHECK-NEXT: [[T3:%.]] = load i32, i32 [[T2]], align 4			; CHECK-NEXT: [[T3:%.]] = load i32, i32 [[T2]], align 4
	; CHECK-NEXT: [[T4:%.*]] = sdiv i32 [[T3]], [[X]]			; CHECK-NEXT: [[T4:%.*]] = sdiv i32 [[T3]], [[X]]
	; CHECK-NEXT: [[T5:%.*]] = add nsw i32 [[T4]], [[T1]]			; CHECK-NEXT: [[T5:%.*]] = add nsw i32 [[T4]], [[T1]]
	; CHECK-NEXT: br label [[FOR_INC]]			; CHECK-NEXT: br label [[FOR_INC]]
	; CHECK: for.inc:			; CHECK: for.inc:
	; CHECK-NEXT: [[T6:%.*]] = phi i32 [ [[T1]], [[FOR_BODY]] ], [ [[T5]], [[IF_THEN]] ]			; CHECK-NEXT: [[T6:%.*]] = phi i32 [ [[T1]], [[FOR_BODY]] ], [ [[T5]], [[IF_THEN]] ]
	; CHECK-NEXT: [[T7]] = add i32 [[R]], [[T6]]			; CHECK-NEXT: [[T7]] = add i32 [[R]], [[T6]]
	; CHECK-NEXT: [[I_NEXT]] = add nuw nsw i64 [[I]], 1			; CHECK-NEXT: [[I_NEXT]] = add nuw nsw i64 [[I]], 1
	; CHECK-NEXT: [[COND:%.*]] = icmp eq i64 [[I_NEXT]], 10000			; CHECK-NEXT: [[COND:%.*]] = icmp eq i64 [[I_NEXT]], 10000
	; CHECK-NEXT: br i1 [[COND]], label [[FOR_END]], label [[FOR_BODY]], !llvm.loop [[LOOP2:![0-9]+]]			; CHECK-NEXT: br i1 [[COND]], label [[FOR_END]], label [[FOR_BODY]], !llvm.loop [[LOOP2:![0-9]+]]
	; CHECK: for.end:			; CHECK: for.end:
	; CHECK-NEXT: [[T8:%.*]] = phi i32 [ [[T7]], [[FOR_INC]] ], [ [[TMP21]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[T8:%.*]] = phi i32 [ [[T7]], [[FOR_INC]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: ret i32 [[T8]]			; CHECK-NEXT: ret i32 [[T8]]
	;			;
	; SINK-GATHER-LABEL: @predicated_sdiv_masked_load(			; SINK-GATHER-LABEL: @predicated_sdiv_masked_load(
	; SINK-GATHER-NEXT: entry:			; SINK-GATHER-NEXT: entry:
	; SINK-GATHER-NEXT: br i1 false, label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]			; SINK-GATHER-NEXT: br i1 false, label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]
	; SINK-GATHER: vector.ph:			; SINK-GATHER: vector.ph:
	; SINK-GATHER-NEXT: [[BROADCAST_SPLATINSERT:%.]] = insertelement <8 x i1> poison, i1 [[C:%.]], i32 0			; SINK-GATHER-NEXT: [[BROADCAST_SPLATINSERT:%.]] = insertelement <8 x i1> poison, i1 [[C:%.]], i32 0
	; SINK-GATHER-NEXT: [[BROADCAST_SPLAT:%.*]] = shufflevector <8 x i1> [[BROADCAST_SPLATINSERT]], <8 x i1> poison, <8 x i32> zeroinitializer			; SINK-GATHER-NEXT: [[BROADCAST_SPLAT:%.*]] = shufflevector <8 x i1> [[BROADCAST_SPLATINSERT]], <8 x i1> poison, <8 x i32> zeroinitializer
	▲ Show 20 Lines • Show All 86 Lines • ▼ Show 20 Lines
	; SINK-GATHER-NEXT: [[TMP48:%.*]] = xor <8 x i1> [[BROADCAST_SPLAT]], <i1 true, i1 true, i1 true, i1 true, i1 true, i1 true, i1 true, i1 true>			; SINK-GATHER-NEXT: [[TMP48:%.*]] = xor <8 x i1> [[BROADCAST_SPLAT]], <i1 true, i1 true, i1 true, i1 true, i1 true, i1 true, i1 true, i1 true>
	; SINK-GATHER-NEXT: [[PREDPHI:%.*]] = select <8 x i1> [[BROADCAST_SPLAT]], <8 x i32> [[TMP47]], <8 x i32> [[WIDE_LOAD]]			; SINK-GATHER-NEXT: [[PREDPHI:%.*]] = select <8 x i1> [[BROADCAST_SPLAT]], <8 x i32> [[TMP47]], <8 x i32> [[WIDE_LOAD]]
	; SINK-GATHER-NEXT: [[TMP49]] = add <8 x i32> [[VEC_PHI]], [[PREDPHI]]			; SINK-GATHER-NEXT: [[TMP49]] = add <8 x i32> [[VEC_PHI]], [[PREDPHI]]
	; SINK-GATHER-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 8			; SINK-GATHER-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 8
	; SINK-GATHER-NEXT: [[TMP50:%.*]] = icmp eq i64 [[INDEX_NEXT]], 10000			; SINK-GATHER-NEXT: [[TMP50:%.*]] = icmp eq i64 [[INDEX_NEXT]], 10000
	; SINK-GATHER-NEXT: br i1 [[TMP50]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP0:![0-9]+]]			; SINK-GATHER-NEXT: br i1 [[TMP50]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP0:![0-9]+]]
	; SINK-GATHER: middle.block:			; SINK-GATHER: middle.block:
	; SINK-GATHER-NEXT: [[TMP51:%.*]] = call i32 @llvm.vector.reduce.add.v8i32(<8 x i32> [[TMP49]])			; SINK-GATHER-NEXT: [[TMP51:%.*]] = call i32 @llvm.vector.reduce.add.v8i32(<8 x i32> [[TMP49]])
				; SINK-GATHER-NEXT: [[RDX_START:%.*]] = add i32 0, [[TMP51]]
	; SINK-GATHER-NEXT: [[CMP_N:%.*]] = icmp eq i64 10000, 10000			; SINK-GATHER-NEXT: [[CMP_N:%.*]] = icmp eq i64 10000, 10000
	; SINK-GATHER-NEXT: br i1 [[CMP_N]], label [[FOR_END:%.*]], label [[SCALAR_PH]]			; SINK-GATHER-NEXT: br i1 [[CMP_N]], label [[FOR_END:%.*]], label [[SCALAR_PH]]
	; SINK-GATHER: scalar.ph:			; SINK-GATHER: scalar.ph:
	; SINK-GATHER-NEXT: [[BC_RESUME_VAL:%.]] = phi i64 [ 10000, [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY:%.]] ]			; SINK-GATHER-NEXT: [[BC_RESUME_VAL:%.]] = phi i64 [ 10000, [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY:%.]] ]
	; SINK-GATHER-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 0, [[ENTRY]] ], [ [[TMP51]], [[MIDDLE_BLOCK]] ]			; SINK-GATHER-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 0, [[ENTRY]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; SINK-GATHER-NEXT: br label [[FOR_BODY:%.*]]			; SINK-GATHER-NEXT: br label [[FOR_BODY:%.*]]
	; SINK-GATHER: for.body:			; SINK-GATHER: for.body:
	; SINK-GATHER-NEXT: [[I:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[I_NEXT:%.]], [[FOR_INC:%.*]] ]			; SINK-GATHER-NEXT: [[I:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[I_NEXT:%.]], [[FOR_INC:%.*]] ]
	; SINK-GATHER-NEXT: [[R:%.]] = phi i32 [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[T7:%.]], [[FOR_INC]] ]			; SINK-GATHER-NEXT: [[R:%.]] = phi i32 [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[T7:%.]], [[FOR_INC]] ]
	; SINK-GATHER-NEXT: [[T0:%.]] = getelementptr inbounds i32, i32 [[A]], i64 [[I]]			; SINK-GATHER-NEXT: [[T0:%.]] = getelementptr inbounds i32, i32 [[A]], i64 [[I]]
	; SINK-GATHER-NEXT: [[T1:%.]] = load i32, i32 [[T0]], align 4			; SINK-GATHER-NEXT: [[T1:%.]] = load i32, i32 [[T0]], align 4
	; SINK-GATHER-NEXT: br i1 [[C]], label [[IF_THEN:%.*]], label [[FOR_INC]]			; SINK-GATHER-NEXT: br i1 [[C]], label [[IF_THEN:%.*]], label [[FOR_INC]]
	; SINK-GATHER: if.then:			; SINK-GATHER: if.then:
	; SINK-GATHER-NEXT: [[T2:%.]] = getelementptr inbounds i32, i32 [[B]], i64 [[I]]			; SINK-GATHER-NEXT: [[T2:%.]] = getelementptr inbounds i32, i32 [[B]], i64 [[I]]
	; SINK-GATHER-NEXT: [[T3:%.]] = load i32, i32 [[T2]], align 4			; SINK-GATHER-NEXT: [[T3:%.]] = load i32, i32 [[T2]], align 4
	; SINK-GATHER-NEXT: [[T4:%.*]] = sdiv i32 [[T3]], [[X]]			; SINK-GATHER-NEXT: [[T4:%.*]] = sdiv i32 [[T3]], [[X]]
	; SINK-GATHER-NEXT: [[T5:%.*]] = add nsw i32 [[T4]], [[T1]]			; SINK-GATHER-NEXT: [[T5:%.*]] = add nsw i32 [[T4]], [[T1]]
	; SINK-GATHER-NEXT: br label [[FOR_INC]]			; SINK-GATHER-NEXT: br label [[FOR_INC]]
	; SINK-GATHER: for.inc:			; SINK-GATHER: for.inc:
	; SINK-GATHER-NEXT: [[T6:%.*]] = phi i32 [ [[T1]], [[FOR_BODY]] ], [ [[T5]], [[IF_THEN]] ]			; SINK-GATHER-NEXT: [[T6:%.*]] = phi i32 [ [[T1]], [[FOR_BODY]] ], [ [[T5]], [[IF_THEN]] ]
	; SINK-GATHER-NEXT: [[T7]] = add i32 [[R]], [[T6]]			; SINK-GATHER-NEXT: [[T7]] = add i32 [[R]], [[T6]]
	; SINK-GATHER-NEXT: [[I_NEXT]] = add nuw nsw i64 [[I]], 1			; SINK-GATHER-NEXT: [[I_NEXT]] = add nuw nsw i64 [[I]], 1
	; SINK-GATHER-NEXT: [[COND:%.*]] = icmp eq i64 [[I_NEXT]], 10000			; SINK-GATHER-NEXT: [[COND:%.*]] = icmp eq i64 [[I_NEXT]], 10000
	; SINK-GATHER-NEXT: br i1 [[COND]], label [[FOR_END]], label [[FOR_BODY]], !llvm.loop [[LOOP2:![0-9]+]]			; SINK-GATHER-NEXT: br i1 [[COND]], label [[FOR_END]], label [[FOR_BODY]], !llvm.loop [[LOOP2:![0-9]+]]
	; SINK-GATHER: for.end:			; SINK-GATHER: for.end:
	; SINK-GATHER-NEXT: [[T8:%.*]] = phi i32 [ [[T7]], [[FOR_INC]] ], [ [[TMP51]], [[MIDDLE_BLOCK]] ]			; SINK-GATHER-NEXT: [[T8:%.*]] = phi i32 [ [[T7]], [[FOR_INC]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; SINK-GATHER-NEXT: ret i32 [[T8]]			; SINK-GATHER-NEXT: ret i32 [[T8]]
	;			;
	entry:			entry:
	br label %for.body			br label %for.body

	for.body:			for.body:
	%i = phi i64 [ 0, %entry ], [ %i.next, %for.inc ]			%i = phi i64 [ 0, %entry ], [ %i.next, %for.inc ]
	%r = phi i32 [ 0, %entry ], [ %t7, %for.inc ]			%r = phi i32 [ 0, %entry ], [ %t7, %for.inc ]
	▲ Show 20 Lines • Show All 70 Lines • ▼ Show 20 Lines
	; CHECK-NEXT: [[PREDPHI:%.*]] = select <2 x i1> [[BROADCAST_SPLAT]], <2 x i32> [[TMP16]], <2 x i32> [[BROADCAST_SPLAT4]]			; CHECK-NEXT: [[PREDPHI:%.*]] = select <2 x i1> [[BROADCAST_SPLAT]], <2 x i32> [[TMP16]], <2 x i32> [[BROADCAST_SPLAT4]]
	; CHECK-NEXT: [[TMP18]] = add <2 x i32> [[VEC_PHI]], [[PREDPHI]]			; CHECK-NEXT: [[TMP18]] = add <2 x i32> [[VEC_PHI]], [[PREDPHI]]
	; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 2			; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 2
	; CHECK-NEXT: [[VEC_IND_NEXT]] = add <2 x i64> [[VEC_IND]], <i64 2, i64 2>			; CHECK-NEXT: [[VEC_IND_NEXT]] = add <2 x i64> [[VEC_IND]], <i64 2, i64 2>
	; CHECK-NEXT: [[TMP19:%.*]] = icmp eq i64 [[INDEX_NEXT]], [[N_VEC]]			; CHECK-NEXT: [[TMP19:%.*]] = icmp eq i64 [[INDEX_NEXT]], [[N_VEC]]
	; CHECK-NEXT: br i1 [[TMP19]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP4:![0-9]+]]			; CHECK-NEXT: br i1 [[TMP19]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP4:![0-9]+]]
	; CHECK: middle.block:			; CHECK: middle.block:
	; CHECK-NEXT: [[TMP20:%.*]] = call i32 @llvm.vector.reduce.add.v2i32(<2 x i32> [[TMP18]])			; CHECK-NEXT: [[TMP20:%.*]] = call i32 @llvm.vector.reduce.add.v2i32(<2 x i32> [[TMP18]])
				; CHECK-NEXT: [[RDX_START:%.*]] = add i32 0, [[TMP20]]
	; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i64 [[SMAX]], [[N_VEC]]			; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i64 [[SMAX]], [[N_VEC]]
	; CHECK-NEXT: br i1 [[CMP_N]], label [[FOR_END:%.*]], label [[SCALAR_PH]]			; CHECK-NEXT: br i1 [[CMP_N]], label [[FOR_END:%.*]], label [[SCALAR_PH]]
	; CHECK: scalar.ph:			; CHECK: scalar.ph:
	; CHECK-NEXT: [[BC_RESUME_VAL:%.]] = phi i64 [ [[N_VEC]], [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY:%.]] ]			; CHECK-NEXT: [[BC_RESUME_VAL:%.]] = phi i64 [ [[N_VEC]], [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY:%.]] ]
	; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 0, [[ENTRY]] ], [ [[TMP20]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 0, [[ENTRY]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: br label [[FOR_BODY:%.*]]			; CHECK-NEXT: br label [[FOR_BODY:%.*]]
	; CHECK: for.body:			; CHECK: for.body:
	; CHECK-NEXT: [[I:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[I_NEXT:%.]], [[FOR_INC:%.*]] ]			; CHECK-NEXT: [[I:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[I_NEXT:%.]], [[FOR_INC:%.*]] ]
	; CHECK-NEXT: [[R:%.]] = phi i32 [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[T6:%.]], [[FOR_INC]] ]			; CHECK-NEXT: [[R:%.]] = phi i32 [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[T6:%.]], [[FOR_INC]] ]
	; CHECK-NEXT: [[I7:%.*]] = mul i64 [[I]], 777			; CHECK-NEXT: [[I7:%.*]] = mul i64 [[I]], 777
	; CHECK-NEXT: br i1 [[C]], label [[IF_THEN:%.*]], label [[FOR_INC]]			; CHECK-NEXT: br i1 [[C]], label [[IF_THEN:%.*]], label [[FOR_INC]]
	; CHECK: if.then:			; CHECK: if.then:
	; CHECK-NEXT: [[T0:%.]] = getelementptr inbounds i32, i32 [[A]], i64 [[I7]]			; CHECK-NEXT: [[T0:%.]] = getelementptr inbounds i32, i32 [[A]], i64 [[I7]]
	; CHECK-NEXT: [[T2:%.]] = load i32, i32 [[T0]], align 4			; CHECK-NEXT: [[T2:%.]] = load i32, i32 [[T0]], align 4
	; CHECK-NEXT: [[T4:%.*]] = udiv i32 [[T2]], [[X]]			; CHECK-NEXT: [[T4:%.*]] = udiv i32 [[T2]], [[X]]
	; CHECK-NEXT: br label [[FOR_INC]]			; CHECK-NEXT: br label [[FOR_INC]]
	; CHECK: for.inc:			; CHECK: for.inc:
	; CHECK-NEXT: [[T5:%.*]] = phi i32 [ [[X]], [[FOR_BODY]] ], [ [[T4]], [[IF_THEN]] ]			; CHECK-NEXT: [[T5:%.*]] = phi i32 [ [[X]], [[FOR_BODY]] ], [ [[T4]], [[IF_THEN]] ]
	; CHECK-NEXT: [[T6]] = add i32 [[R]], [[T5]]			; CHECK-NEXT: [[T6]] = add i32 [[R]], [[T5]]
	; CHECK-NEXT: [[I_NEXT]] = add nuw nsw i64 [[I]], 1			; CHECK-NEXT: [[I_NEXT]] = add nuw nsw i64 [[I]], 1
	; CHECK-NEXT: [[COND:%.*]] = icmp slt i64 [[I_NEXT]], [[N]]			; CHECK-NEXT: [[COND:%.*]] = icmp slt i64 [[I_NEXT]], [[N]]
	; CHECK-NEXT: br i1 [[COND]], label [[FOR_BODY]], label [[FOR_END]], !llvm.loop [[LOOP5:![0-9]+]]			; CHECK-NEXT: br i1 [[COND]], label [[FOR_BODY]], label [[FOR_END]], !llvm.loop [[LOOP5:![0-9]+]]
	; CHECK: for.end:			; CHECK: for.end:
	; CHECK-NEXT: [[T7:%.*]] = phi i32 [ [[T6]], [[FOR_INC]] ], [ [[TMP20]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[T7:%.*]] = phi i32 [ [[T6]], [[FOR_INC]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: ret i32 [[T7]]			; CHECK-NEXT: ret i32 [[T7]]
	;			;
	; SINK-GATHER-LABEL: @scalarize_and_sink_gather(			; SINK-GATHER-LABEL: @scalarize_and_sink_gather(
	; SINK-GATHER-NEXT: entry:			; SINK-GATHER-NEXT: entry:
	; SINK-GATHER-NEXT: [[SMAX:%.]] = call i64 @llvm.smax.i64(i64 [[N:%.]], i64 1)			; SINK-GATHER-NEXT: [[SMAX:%.]] = call i64 @llvm.smax.i64(i64 [[N:%.]], i64 1)
	; SINK-GATHER-NEXT: [[MIN_ITERS_CHECK:%.*]] = icmp ult i64 [[SMAX]], 8			; SINK-GATHER-NEXT: [[MIN_ITERS_CHECK:%.*]] = icmp ult i64 [[SMAX]], 8
	; SINK-GATHER-NEXT: br i1 [[MIN_ITERS_CHECK]], label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]			; SINK-GATHER-NEXT: br i1 [[MIN_ITERS_CHECK]], label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]
	; SINK-GATHER: vector.ph:			; SINK-GATHER: vector.ph:
	▲ Show 20 Lines • Show All 109 Lines • ▼ Show 20 Lines
	; SINK-GATHER-NEXT: [[PREDPHI:%.*]] = select <8 x i1> [[BROADCAST_SPLAT]], <8 x i32> [[TMP64]], <8 x i32> [[BROADCAST_SPLAT16]]			; SINK-GATHER-NEXT: [[PREDPHI:%.*]] = select <8 x i1> [[BROADCAST_SPLAT]], <8 x i32> [[TMP64]], <8 x i32> [[BROADCAST_SPLAT16]]
	; SINK-GATHER-NEXT: [[TMP66]] = add <8 x i32> [[VEC_PHI]], [[PREDPHI]]			; SINK-GATHER-NEXT: [[TMP66]] = add <8 x i32> [[VEC_PHI]], [[PREDPHI]]
	; SINK-GATHER-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 8			; SINK-GATHER-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 8
	; SINK-GATHER-NEXT: [[VEC_IND_NEXT]] = add <8 x i64> [[VEC_IND]], <i64 8, i64 8, i64 8, i64 8, i64 8, i64 8, i64 8, i64 8>			; SINK-GATHER-NEXT: [[VEC_IND_NEXT]] = add <8 x i64> [[VEC_IND]], <i64 8, i64 8, i64 8, i64 8, i64 8, i64 8, i64 8, i64 8>
	; SINK-GATHER-NEXT: [[TMP67:%.*]] = icmp eq i64 [[INDEX_NEXT]], [[N_VEC]]			; SINK-GATHER-NEXT: [[TMP67:%.*]] = icmp eq i64 [[INDEX_NEXT]], [[N_VEC]]
	; SINK-GATHER-NEXT: br i1 [[TMP67]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP4:![0-9]+]]			; SINK-GATHER-NEXT: br i1 [[TMP67]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP4:![0-9]+]]
	; SINK-GATHER: middle.block:			; SINK-GATHER: middle.block:
	; SINK-GATHER-NEXT: [[TMP68:%.*]] = call i32 @llvm.vector.reduce.add.v8i32(<8 x i32> [[TMP66]])			; SINK-GATHER-NEXT: [[TMP68:%.*]] = call i32 @llvm.vector.reduce.add.v8i32(<8 x i32> [[TMP66]])
				; SINK-GATHER-NEXT: [[RDX_START:%.*]] = add i32 0, [[TMP68]]
	; SINK-GATHER-NEXT: [[CMP_N:%.*]] = icmp eq i64 [[SMAX]], [[N_VEC]]			; SINK-GATHER-NEXT: [[CMP_N:%.*]] = icmp eq i64 [[SMAX]], [[N_VEC]]
	; SINK-GATHER-NEXT: br i1 [[CMP_N]], label [[FOR_END:%.*]], label [[SCALAR_PH]]			; SINK-GATHER-NEXT: br i1 [[CMP_N]], label [[FOR_END:%.*]], label [[SCALAR_PH]]
	; SINK-GATHER: scalar.ph:			; SINK-GATHER: scalar.ph:
	; SINK-GATHER-NEXT: [[BC_RESUME_VAL:%.]] = phi i64 [ [[N_VEC]], [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY:%.]] ]			; SINK-GATHER-NEXT: [[BC_RESUME_VAL:%.]] = phi i64 [ [[N_VEC]], [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY:%.]] ]
	; SINK-GATHER-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 0, [[ENTRY]] ], [ [[TMP68]], [[MIDDLE_BLOCK]] ]			; SINK-GATHER-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 0, [[ENTRY]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; SINK-GATHER-NEXT: br label [[FOR_BODY:%.*]]			; SINK-GATHER-NEXT: br label [[FOR_BODY:%.*]]
	; SINK-GATHER: for.body:			; SINK-GATHER: for.body:
	; SINK-GATHER-NEXT: [[I:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[I_NEXT:%.]], [[FOR_INC:%.*]] ]			; SINK-GATHER-NEXT: [[I:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[I_NEXT:%.]], [[FOR_INC:%.*]] ]
	; SINK-GATHER-NEXT: [[R:%.]] = phi i32 [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[T6:%.]], [[FOR_INC]] ]			; SINK-GATHER-NEXT: [[R:%.]] = phi i32 [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[T6:%.]], [[FOR_INC]] ]
	; SINK-GATHER-NEXT: [[I7:%.*]] = mul i64 [[I]], 777			; SINK-GATHER-NEXT: [[I7:%.*]] = mul i64 [[I]], 777
	; SINK-GATHER-NEXT: br i1 [[C]], label [[IF_THEN:%.*]], label [[FOR_INC]]			; SINK-GATHER-NEXT: br i1 [[C]], label [[IF_THEN:%.*]], label [[FOR_INC]]
	; SINK-GATHER: if.then:			; SINK-GATHER: if.then:
	; SINK-GATHER-NEXT: [[T0:%.]] = getelementptr inbounds i32, i32 [[A]], i64 [[I7]]			; SINK-GATHER-NEXT: [[T0:%.]] = getelementptr inbounds i32, i32 [[A]], i64 [[I7]]
	; SINK-GATHER-NEXT: [[T2:%.]] = load i32, i32 [[T0]], align 4			; SINK-GATHER-NEXT: [[T2:%.]] = load i32, i32 [[T0]], align 4
	; SINK-GATHER-NEXT: [[T4:%.*]] = udiv i32 [[T2]], [[X]]			; SINK-GATHER-NEXT: [[T4:%.*]] = udiv i32 [[T2]], [[X]]
	; SINK-GATHER-NEXT: br label [[FOR_INC]]			; SINK-GATHER-NEXT: br label [[FOR_INC]]
	; SINK-GATHER: for.inc:			; SINK-GATHER: for.inc:
	; SINK-GATHER-NEXT: [[T5:%.*]] = phi i32 [ [[X]], [[FOR_BODY]] ], [ [[T4]], [[IF_THEN]] ]			; SINK-GATHER-NEXT: [[T5:%.*]] = phi i32 [ [[X]], [[FOR_BODY]] ], [ [[T4]], [[IF_THEN]] ]
	; SINK-GATHER-NEXT: [[T6]] = add i32 [[R]], [[T5]]			; SINK-GATHER-NEXT: [[T6]] = add i32 [[R]], [[T5]]
	; SINK-GATHER-NEXT: [[I_NEXT]] = add nuw nsw i64 [[I]], 1			; SINK-GATHER-NEXT: [[I_NEXT]] = add nuw nsw i64 [[I]], 1
	; SINK-GATHER-NEXT: [[COND:%.*]] = icmp slt i64 [[I_NEXT]], [[N]]			; SINK-GATHER-NEXT: [[COND:%.*]] = icmp slt i64 [[I_NEXT]], [[N]]
	; SINK-GATHER-NEXT: br i1 [[COND]], label [[FOR_BODY]], label [[FOR_END]], !llvm.loop [[LOOP5:![0-9]+]]			; SINK-GATHER-NEXT: br i1 [[COND]], label [[FOR_BODY]], label [[FOR_END]], !llvm.loop [[LOOP5:![0-9]+]]
	; SINK-GATHER: for.end:			; SINK-GATHER: for.end:
	; SINK-GATHER-NEXT: [[T7:%.*]] = phi i32 [ [[T6]], [[FOR_INC]] ], [ [[TMP68]], [[MIDDLE_BLOCK]] ]			; SINK-GATHER-NEXT: [[T7:%.*]] = phi i32 [ [[T6]], [[FOR_INC]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; SINK-GATHER-NEXT: ret i32 [[T7]]			; SINK-GATHER-NEXT: ret i32 [[T7]]
	;			;
	entry:			entry:
	br label %for.body			br label %for.body

	for.body:			for.body:
	%i = phi i64 [ 0, %entry ], [ %i.next, %for.inc ]			%i = phi i64 [ 0, %entry ], [ %i.next, %for.inc ]
	%r = phi i32 [ 0, %entry ], [ %t6, %for.inc ]			%r = phi i32 [ 0, %entry ], [ %t6, %for.inc ]
	Show All 20 Lines

llvm/test/Transforms/LoopVectorize/epilog-vectorization-reductions.ll

	Show All 12 Lines
	; CHECK-NEXT: [[MIN_ITERS_CHECK1:%.*]] = icmp ult i64 [[N]], 4			; CHECK-NEXT: [[MIN_ITERS_CHECK1:%.*]] = icmp ult i64 [[N]], 4
	; CHECK-NEXT: br i1 [[MIN_ITERS_CHECK1]], label [[VEC_EPILOG_PH:%.]], label [[VECTOR_PH:%.]]			; CHECK-NEXT: br i1 [[MIN_ITERS_CHECK1]], label [[VEC_EPILOG_PH:%.]], label [[VECTOR_PH:%.]]
	; CHECK: vector.ph:			; CHECK: vector.ph:
	; CHECK-NEXT: [[N_MOD_VF:%.*]] = urem i64 [[N]], 4			; CHECK-NEXT: [[N_MOD_VF:%.*]] = urem i64 [[N]], 4
	; CHECK-NEXT: [[N_VEC:%.*]] = sub i64 [[N]], [[N_MOD_VF]]			; CHECK-NEXT: [[N_VEC:%.*]] = sub i64 [[N]], [[N_MOD_VF]]
	; CHECK-NEXT: br label [[VECTOR_BODY:%.*]]			; CHECK-NEXT: br label [[VECTOR_BODY:%.*]]
	; CHECK: vector.body:			; CHECK: vector.body:
	; CHECK-NEXT: [[INDEX:%.]] = phi i64 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[VECTOR_BODY]] ]			; CHECK-NEXT: [[INDEX:%.]] = phi i64 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[VECTOR_BODY]] ]
	; CHECK-NEXT: [[VEC_PHI:%.]] = phi <4 x i64> [ <i64 5, i64 0, i64 0, i64 0>, [[VECTOR_PH]] ], [ [[TMP4:%.]], [[VECTOR_BODY]] ]			; CHECK-NEXT: [[VEC_PHI:%.]] = phi <4 x i64> [ zeroinitializer, [[VECTOR_PH]] ], [ [[TMP4:%.]], [[VECTOR_BODY]] ]
	; CHECK-NEXT: [[TMP0:%.*]] = add i64 [[INDEX]], 0			; CHECK-NEXT: [[TMP0:%.*]] = add i64 [[INDEX]], 0
	; CHECK-NEXT: [[TMP1:%.]] = getelementptr inbounds i64, i64 [[A:%.*]], i64 [[TMP0]]			; CHECK-NEXT: [[TMP1:%.]] = getelementptr inbounds i64, i64 [[A:%.*]], i64 [[TMP0]]
	; CHECK-NEXT: [[TMP2:%.]] = getelementptr inbounds i64, i64 [[TMP1]], i32 0			; CHECK-NEXT: [[TMP2:%.]] = getelementptr inbounds i64, i64 [[TMP1]], i32 0
	; CHECK-NEXT: [[TMP3:%.]] = bitcast i64 [[TMP2]] to <4 x i64>*			; CHECK-NEXT: [[TMP3:%.]] = bitcast i64 [[TMP2]] to <4 x i64>*
	; CHECK-NEXT: [[WIDE_LOAD:%.]] = load <4 x i64>, <4 x i64> [[TMP3]], align 4			; CHECK-NEXT: [[WIDE_LOAD:%.]] = load <4 x i64>, <4 x i64> [[TMP3]], align 4
	; CHECK-NEXT: [[TMP4]] = add <4 x i64> [[WIDE_LOAD]], [[VEC_PHI]]			; CHECK-NEXT: [[TMP4]] = add <4 x i64> [[WIDE_LOAD]], [[VEC_PHI]]
	; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 4			; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 4
	; CHECK-NEXT: [[TMP5:%.*]] = icmp eq i64 [[INDEX_NEXT]], [[N_VEC]]			; CHECK-NEXT: [[TMP5:%.*]] = icmp eq i64 [[INDEX_NEXT]], [[N_VEC]]
	; CHECK-NEXT: br i1 [[TMP5]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP0:![0-9]+]]			; CHECK-NEXT: br i1 [[TMP5]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP0:![0-9]+]]
	; CHECK: middle.block:			; CHECK: middle.block:
	; CHECK-NEXT: [[TMP6:%.*]] = call i64 @llvm.vector.reduce.add.v4i64(<4 x i64> [[TMP4]])			; CHECK-NEXT: [[TMP6:%.*]] = call i64 @llvm.vector.reduce.add.v4i64(<4 x i64> [[TMP4]])
				; CHECK-NEXT: [[RDX_START:%.*]] = add i64 5, [[TMP6]]
	; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i64 [[N]], [[N_VEC]]			; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i64 [[N]], [[N_VEC]]
	; CHECK-NEXT: br i1 [[CMP_N]], label [[FOR_END:%.]], label [[VEC_EPILOG_ITER_CHECK:%.]]			; CHECK-NEXT: br i1 [[CMP_N]], label [[FOR_END:%.]], label [[VEC_EPILOG_ITER_CHECK:%.]]
	; CHECK: vec.epilog.iter.check:			; CHECK: vec.epilog.iter.check:
	; CHECK-NEXT: [[N_VEC_REMAINING:%.*]] = sub i64 [[N]], [[N_VEC]]			; CHECK-NEXT: [[N_VEC_REMAINING:%.*]] = sub i64 [[N]], [[N_VEC]]
	; CHECK-NEXT: [[MIN_EPILOG_ITERS_CHECK:%.*]] = icmp ult i64 [[N_VEC_REMAINING]], 4			; CHECK-NEXT: [[MIN_EPILOG_ITERS_CHECK:%.*]] = icmp ult i64 [[N_VEC_REMAINING]], 4
	; CHECK-NEXT: br i1 [[MIN_EPILOG_ITERS_CHECK]], label [[VEC_EPILOG_SCALAR_PH]], label [[VEC_EPILOG_PH]]			; CHECK-NEXT: br i1 [[MIN_EPILOG_ITERS_CHECK]], label [[VEC_EPILOG_SCALAR_PH]], label [[VEC_EPILOG_PH]]
	; CHECK: vec.epilog.ph:			; CHECK: vec.epilog.ph:
	; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i64 [ 5, [[VECTOR_MAIN_LOOP_ITER_CHECK]] ], [ [[TMP6]], [[VEC_EPILOG_ITER_CHECK]] ]			; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i64 [ 5, [[VECTOR_MAIN_LOOP_ITER_CHECK]] ], [ [[RDX_START]], [[VEC_EPILOG_ITER_CHECK]] ]
	; CHECK-NEXT: [[VEC_EPILOG_RESUME_VAL:%.*]] = phi i64 [ [[N_VEC]], [[VEC_EPILOG_ITER_CHECK]] ], [ 0, [[VECTOR_MAIN_LOOP_ITER_CHECK]] ]			; CHECK-NEXT: [[VEC_EPILOG_RESUME_VAL:%.*]] = phi i64 [ [[N_VEC]], [[VEC_EPILOG_ITER_CHECK]] ], [ 0, [[VECTOR_MAIN_LOOP_ITER_CHECK]] ]
	; CHECK-NEXT: [[N_MOD_VF2:%.*]] = urem i64 [[N]], 4			; CHECK-NEXT: [[N_MOD_VF2:%.*]] = urem i64 [[N]], 4
	; CHECK-NEXT: [[N_VEC3:%.*]] = sub i64 [[N]], [[N_MOD_VF2]]			; CHECK-NEXT: [[N_VEC3:%.*]] = sub i64 [[N]], [[N_MOD_VF2]]
	; CHECK-NEXT: [[TMP7:%.*]] = insertelement <4 x i64> zeroinitializer, i64 [[BC_MERGE_RDX]], i32 0
	; CHECK-NEXT: br label [[VEC_EPILOG_VECTOR_BODY:%.*]]			; CHECK-NEXT: br label [[VEC_EPILOG_VECTOR_BODY:%.*]]
	; CHECK: vec.epilog.vector.body:			; CHECK: vec.epilog.vector.body:
	; CHECK-NEXT: [[OFFSET_IDX:%.]] = phi i64 [ [[VEC_EPILOG_RESUME_VAL]], [[VEC_EPILOG_PH]] ], [ [[INDEX_NEXT8:%.]], [[VEC_EPILOG_VECTOR_BODY]] ]			; CHECK-NEXT: [[OFFSET_IDX:%.]] = phi i64 [ [[VEC_EPILOG_RESUME_VAL]], [[VEC_EPILOG_PH]] ], [ [[INDEX_NEXT8:%.]], [[VEC_EPILOG_VECTOR_BODY]] ]
	; CHECK-NEXT: [[VEC_PHI6:%.]] = phi <4 x i64> [ [[TMP7]], [[VEC_EPILOG_PH]] ], [ [[TMP12:%.]], [[VEC_EPILOG_VECTOR_BODY]] ]			; CHECK-NEXT: [[VEC_PHI6:%.]] = phi <4 x i64> [ zeroinitializer, [[VEC_EPILOG_PH]] ], [ [[TMP11:%.]], [[VEC_EPILOG_VECTOR_BODY]] ]
	; CHECK-NEXT: [[TMP8:%.*]] = add i64 [[OFFSET_IDX]], 0			; CHECK-NEXT: [[TMP7:%.*]] = add i64 [[OFFSET_IDX]], 0
	; CHECK-NEXT: [[TMP9:%.]] = getelementptr inbounds i64, i64 [[A]], i64 [[TMP8]]			; CHECK-NEXT: [[TMP8:%.]] = getelementptr inbounds i64, i64 [[A]], i64 [[TMP7]]
	; CHECK-NEXT: [[TMP10:%.]] = getelementptr inbounds i64, i64 [[TMP9]], i32 0			; CHECK-NEXT: [[TMP9:%.]] = getelementptr inbounds i64, i64 [[TMP8]], i32 0
	; CHECK-NEXT: [[TMP11:%.]] = bitcast i64 [[TMP10]] to <4 x i64>*			; CHECK-NEXT: [[TMP10:%.]] = bitcast i64 [[TMP9]] to <4 x i64>*
	; CHECK-NEXT: [[WIDE_LOAD7:%.]] = load <4 x i64>, <4 x i64> [[TMP11]], align 4			; CHECK-NEXT: [[WIDE_LOAD7:%.]] = load <4 x i64>, <4 x i64> [[TMP10]], align 4
	; CHECK-NEXT: [[TMP12]] = add <4 x i64> [[WIDE_LOAD7]], [[VEC_PHI6]]			; CHECK-NEXT: [[TMP11]] = add <4 x i64> [[WIDE_LOAD7]], [[VEC_PHI6]]
	; CHECK-NEXT: [[INDEX_NEXT8]] = add nuw i64 [[OFFSET_IDX]], 4			; CHECK-NEXT: [[INDEX_NEXT8]] = add nuw i64 [[OFFSET_IDX]], 4
	; CHECK-NEXT: [[TMP13:%.*]] = icmp eq i64 [[INDEX_NEXT8]], [[N_VEC3]]			; CHECK-NEXT: [[TMP12:%.*]] = icmp eq i64 [[INDEX_NEXT8]], [[N_VEC3]]
	; CHECK-NEXT: br i1 [[TMP13]], label [[VEC_EPILOG_MIDDLE_BLOCK:%.*]], label [[VEC_EPILOG_VECTOR_BODY]], !llvm.loop [[LOOP2:![0-9]+]]			; CHECK-NEXT: br i1 [[TMP12]], label [[VEC_EPILOG_MIDDLE_BLOCK:%.*]], label [[VEC_EPILOG_VECTOR_BODY]], !llvm.loop [[LOOP2:![0-9]+]]
	; CHECK: vec.epilog.middle.block:			; CHECK: vec.epilog.middle.block:
	; CHECK-NEXT: [[TMP14:%.*]] = call i64 @llvm.vector.reduce.add.v4i64(<4 x i64> [[TMP12]])			; CHECK-NEXT: [[TMP13:%.*]] = call i64 @llvm.vector.reduce.add.v4i64(<4 x i64> [[TMP11]])
				; CHECK-NEXT: [[RDX_START9:%.*]] = add i64 [[BC_MERGE_RDX]], [[TMP13]]
	; CHECK-NEXT: [[CMP_N4:%.*]] = icmp eq i64 [[N]], [[N_VEC3]]			; CHECK-NEXT: [[CMP_N4:%.*]] = icmp eq i64 [[N]], [[N_VEC3]]
	; CHECK-NEXT: br i1 [[CMP_N4]], label [[FOR_END]], label [[VEC_EPILOG_SCALAR_PH]]			; CHECK-NEXT: br i1 [[CMP_N4]], label [[FOR_END]], label [[VEC_EPILOG_SCALAR_PH]]
	; CHECK: vec.epilog.scalar.ph:			; CHECK: vec.epilog.scalar.ph:
	; CHECK-NEXT: [[BC_RESUME_VAL:%.]] = phi i64 [ [[N_VEC3]], [[VEC_EPILOG_MIDDLE_BLOCK]] ], [ [[N_VEC]], [[VEC_EPILOG_ITER_CHECK]] ], [ 0, [[ITER_CHECK:%.]] ]			; CHECK-NEXT: [[BC_RESUME_VAL:%.]] = phi i64 [ [[N_VEC3]], [[VEC_EPILOG_MIDDLE_BLOCK]] ], [ [[N_VEC]], [[VEC_EPILOG_ITER_CHECK]] ], [ 0, [[ITER_CHECK:%.]] ]
	; CHECK-NEXT: [[BC_MERGE_RDX9:%.*]] = phi i64 [ 5, [[ITER_CHECK]] ], [ [[TMP6]], [[VEC_EPILOG_ITER_CHECK]] ], [ [[TMP14]], [[VEC_EPILOG_MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[BC_MERGE_RDX10:%.*]] = phi i64 [ 5, [[ITER_CHECK]] ], [ [[RDX_START]], [[VEC_EPILOG_ITER_CHECK]] ], [ [[RDX_START9]], [[VEC_EPILOG_MIDDLE_BLOCK]] ]
	; CHECK-NEXT: br label [[FOR_BODY:%.*]]			; CHECK-NEXT: br label [[FOR_BODY:%.*]]
	; CHECK: for.body:			; CHECK: for.body:
	; CHECK-NEXT: [[IV:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[VEC_EPILOG_SCALAR_PH]] ], [ [[IV_NEXT:%.]], [[FOR_BODY]] ]			; CHECK-NEXT: [[IV:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[VEC_EPILOG_SCALAR_PH]] ], [ [[IV_NEXT:%.]], [[FOR_BODY]] ]
	; CHECK-NEXT: [[SUM:%.]] = phi i64 [ [[BC_MERGE_RDX9]], [[VEC_EPILOG_SCALAR_PH]] ], [ [[ADD:%.]], [[FOR_BODY]] ]			; CHECK-NEXT: [[SUM:%.]] = phi i64 [ [[BC_MERGE_RDX10]], [[VEC_EPILOG_SCALAR_PH]] ], [ [[ADD:%.]], [[FOR_BODY]] ]
	; CHECK-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds i64, i64 [[A]], i64 [[IV]]			; CHECK-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds i64, i64 [[A]], i64 [[IV]]
	; CHECK-NEXT: [[TMP15:%.]] = load i64, i64 [[ARRAYIDX]], align 4			; CHECK-NEXT: [[TMP14:%.]] = load i64, i64 [[ARRAYIDX]], align 4
	; CHECK-NEXT: [[ADD]] = add i64 [[TMP15]], [[SUM]]			; CHECK-NEXT: [[ADD]] = add i64 [[TMP14]], [[SUM]]
	; CHECK-NEXT: [[IV_NEXT]] = add nuw nsw i64 [[IV]], 1			; CHECK-NEXT: [[IV_NEXT]] = add nuw nsw i64 [[IV]], 1
	; CHECK-NEXT: [[EXITCOND_NOT:%.*]] = icmp eq i64 [[IV_NEXT]], [[N]]			; CHECK-NEXT: [[EXITCOND_NOT:%.*]] = icmp eq i64 [[IV_NEXT]], [[N]]
	; CHECK-NEXT: br i1 [[EXITCOND_NOT]], label [[FOR_END]], label [[FOR_BODY]], !llvm.loop [[LOOP4:![0-9]+]]			; CHECK-NEXT: br i1 [[EXITCOND_NOT]], label [[FOR_END]], label [[FOR_BODY]], !llvm.loop [[LOOP4:![0-9]+]]
	; CHECK: for.end:			; CHECK: for.end:
	; CHECK-NEXT: [[ADD_LCSSA:%.*]] = phi i64 [ [[ADD]], [[FOR_BODY]] ], [ [[TMP6]], [[MIDDLE_BLOCK]] ], [ [[TMP14]], [[VEC_EPILOG_MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[ADD_LCSSA:%.*]] = phi i64 [ [[ADD]], [[FOR_BODY]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ], [ [[RDX_START9]], [[VEC_EPILOG_MIDDLE_BLOCK]] ]
	; CHECK-NEXT: ret i64 [[ADD_LCSSA]]			; CHECK-NEXT: ret i64 [[ADD_LCSSA]]
	;			;
	entry:			entry:
	br label %for.body			br label %for.body

	for.body:			for.body:
	%iv = phi i64 [ 0, %entry ], [ %iv.next, %for.body ]			%iv = phi i64 [ 0, %entry ], [ %iv.next, %for.body ]
	%sum = phi i64 [ 5, %entry ], [ %add, %for.body ]			%sum = phi i64 [ 5, %entry ], [ %add, %for.body ]
	▲ Show 20 Lines • Show All 131 Lines • ▼ Show 20 Lines
	; CHECK-NEXT: [[TMP7:%.*]] = icmp eq i32 [[INDEX_NEXT]], 256			; CHECK-NEXT: [[TMP7:%.*]] = icmp eq i32 [[INDEX_NEXT]], 256
	; CHECK-NEXT: [[TMP8:%.*]] = trunc <4 x i32> [[TMP6]] to <4 x i16>			; CHECK-NEXT: [[TMP8:%.*]] = trunc <4 x i32> [[TMP6]] to <4 x i16>
	; CHECK-NEXT: [[TMP9]] = zext <4 x i16> [[TMP8]] to <4 x i32>			; CHECK-NEXT: [[TMP9]] = zext <4 x i16> [[TMP8]] to <4 x i32>
	; CHECK-NEXT: br i1 [[TMP7]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP8:![0-9]+]]			; CHECK-NEXT: br i1 [[TMP7]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP8:![0-9]+]]
	; CHECK: middle.block:			; CHECK: middle.block:
	; CHECK-NEXT: [[TMP10:%.*]] = trunc <4 x i32> [[TMP9]] to <4 x i16>			; CHECK-NEXT: [[TMP10:%.*]] = trunc <4 x i32> [[TMP9]] to <4 x i16>
	; CHECK-NEXT: [[TMP11:%.*]] = call i16 @llvm.vector.reduce.or.v4i16(<4 x i16> [[TMP10]])			; CHECK-NEXT: [[TMP11:%.*]] = call i16 @llvm.vector.reduce.or.v4i16(<4 x i16> [[TMP10]])
	; CHECK-NEXT: [[TMP12:%.*]] = zext i16 [[TMP11]] to i32			; CHECK-NEXT: [[TMP12:%.*]] = zext i16 [[TMP11]] to i32
				; CHECK-NEXT: [[RDX_START:%.*]] = or i32 0, [[TMP12]]
	; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i32 256, 256			; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i32 256, 256
	; CHECK-NEXT: br i1 [[CMP_N]], label [[FOR_END:%.]], label [[VEC_EPILOG_ITER_CHECK:%.]]			; CHECK-NEXT: br i1 [[CMP_N]], label [[FOR_END:%.]], label [[VEC_EPILOG_ITER_CHECK:%.]]
	; CHECK: vec.epilog.iter.check:			; CHECK: vec.epilog.iter.check:
	; CHECK-NEXT: br i1 true, label [[VEC_EPILOG_SCALAR_PH]], label [[VEC_EPILOG_PH]]			; CHECK-NEXT: br i1 true, label [[VEC_EPILOG_SCALAR_PH]], label [[VEC_EPILOG_PH]]
	; CHECK: vec.epilog.ph:			; CHECK: vec.epilog.ph:
	; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 0, [[VECTOR_MAIN_LOOP_ITER_CHECK]] ], [ [[TMP12]], [[VEC_EPILOG_ITER_CHECK]] ]			; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 0, [[VECTOR_MAIN_LOOP_ITER_CHECK]] ], [ [[RDX_START]], [[VEC_EPILOG_ITER_CHECK]] ]
	; CHECK-NEXT: [[VEC_EPILOG_RESUME_VAL:%.*]] = phi i32 [ 256, [[VEC_EPILOG_ITER_CHECK]] ], [ 0, [[VECTOR_MAIN_LOOP_ITER_CHECK]] ]			; CHECK-NEXT: [[VEC_EPILOG_RESUME_VAL:%.*]] = phi i32 [ 256, [[VEC_EPILOG_ITER_CHECK]] ], [ 0, [[VECTOR_MAIN_LOOP_ITER_CHECK]] ]
	; CHECK-NEXT: [[TMP13:%.*]] = insertelement <4 x i32> zeroinitializer, i32 [[BC_MERGE_RDX]], i32 0
	; CHECK-NEXT: br label [[VEC_EPILOG_VECTOR_BODY:%.*]]			; CHECK-NEXT: br label [[VEC_EPILOG_VECTOR_BODY:%.*]]
	; CHECK: vec.epilog.vector.body:			; CHECK: vec.epilog.vector.body:
	; CHECK-NEXT: [[OFFSET_IDX:%.]] = phi i32 [ [[VEC_EPILOG_RESUME_VAL]], [[VEC_EPILOG_PH]] ], [ [[INDEX_NEXT5:%.]], [[VEC_EPILOG_VECTOR_BODY]] ]			; CHECK-NEXT: [[OFFSET_IDX:%.]] = phi i32 [ [[VEC_EPILOG_RESUME_VAL]], [[VEC_EPILOG_PH]] ], [ [[INDEX_NEXT5:%.]], [[VEC_EPILOG_VECTOR_BODY]] ]
	; CHECK-NEXT: [[VEC_PHI3:%.]] = phi <4 x i32> [ [[TMP13]], [[VEC_EPILOG_PH]] ], [ [[TMP23:%.]], [[VEC_EPILOG_VECTOR_BODY]] ]			; CHECK-NEXT: [[VEC_PHI3:%.]] = phi <4 x i32> [ zeroinitializer, [[VEC_EPILOG_PH]] ], [ [[TMP22:%.]], [[VEC_EPILOG_VECTOR_BODY]] ]
	; CHECK-NEXT: [[TMP14:%.*]] = add i32 [[OFFSET_IDX]], 0			; CHECK-NEXT: [[TMP13:%.*]] = add i32 [[OFFSET_IDX]], 0
	; CHECK-NEXT: [[TMP15:%.*]] = and <4 x i32> [[VEC_PHI3]], <i32 65535, i32 65535, i32 65535, i32 65535>			; CHECK-NEXT: [[TMP14:%.*]] = and <4 x i32> [[VEC_PHI3]], <i32 65535, i32 65535, i32 65535, i32 65535>
	; CHECK-NEXT: [[TMP16:%.]] = getelementptr inbounds i16, i16 [[PTR]], i32 [[TMP14]]			; CHECK-NEXT: [[TMP15:%.]] = getelementptr inbounds i16, i16 [[PTR]], i32 [[TMP13]]
	; CHECK-NEXT: [[TMP17:%.]] = getelementptr inbounds i16, i16 [[TMP16]], i32 0			; CHECK-NEXT: [[TMP16:%.]] = getelementptr inbounds i16, i16 [[TMP15]], i32 0
	; CHECK-NEXT: [[TMP18:%.]] = bitcast i16 [[TMP17]] to <4 x i16>*			; CHECK-NEXT: [[TMP17:%.]] = bitcast i16 [[TMP16]] to <4 x i16>*
	; CHECK-NEXT: [[WIDE_LOAD4:%.]] = load <4 x i16>, <4 x i16> [[TMP18]], align 2			; CHECK-NEXT: [[WIDE_LOAD4:%.]] = load <4 x i16>, <4 x i16> [[TMP17]], align 2
	; CHECK-NEXT: [[TMP19:%.*]] = zext <4 x i16> [[WIDE_LOAD4]] to <4 x i32>			; CHECK-NEXT: [[TMP18:%.*]] = zext <4 x i16> [[WIDE_LOAD4]] to <4 x i32>
	; CHECK-NEXT: [[TMP20:%.*]] = or <4 x i32> [[TMP15]], [[TMP19]]			; CHECK-NEXT: [[TMP19:%.*]] = or <4 x i32> [[TMP14]], [[TMP18]]
	; CHECK-NEXT: [[INDEX_NEXT5]] = add nuw i32 [[OFFSET_IDX]], 4			; CHECK-NEXT: [[INDEX_NEXT5]] = add nuw i32 [[OFFSET_IDX]], 4
	; CHECK-NEXT: [[TMP21:%.*]] = icmp eq i32 [[INDEX_NEXT5]], 256			; CHECK-NEXT: [[TMP20:%.*]] = icmp eq i32 [[INDEX_NEXT5]], 256
	; CHECK-NEXT: [[TMP22:%.*]] = trunc <4 x i32> [[TMP20]] to <4 x i16>			; CHECK-NEXT: [[TMP21:%.*]] = trunc <4 x i32> [[TMP19]] to <4 x i16>
	; CHECK-NEXT: [[TMP23]] = zext <4 x i16> [[TMP22]] to <4 x i32>			; CHECK-NEXT: [[TMP22]] = zext <4 x i16> [[TMP21]] to <4 x i32>
	; CHECK-NEXT: br i1 [[TMP21]], label [[VEC_EPILOG_MIDDLE_BLOCK:%.*]], label [[VEC_EPILOG_VECTOR_BODY]], !llvm.loop [[LOOP9:![0-9]+]]			; CHECK-NEXT: br i1 [[TMP20]], label [[VEC_EPILOG_MIDDLE_BLOCK:%.*]], label [[VEC_EPILOG_VECTOR_BODY]], !llvm.loop [[LOOP9:![0-9]+]]
	; CHECK: vec.epilog.middle.block:			; CHECK: vec.epilog.middle.block:
	; CHECK-NEXT: [[TMP24:%.*]] = trunc <4 x i32> [[TMP23]] to <4 x i16>			; CHECK-NEXT: [[TMP23:%.*]] = trunc <4 x i32> [[TMP22]] to <4 x i16>
	; CHECK-NEXT: [[TMP25:%.*]] = call i16 @llvm.vector.reduce.or.v4i16(<4 x i16> [[TMP24]])			; CHECK-NEXT: [[TMP24:%.*]] = call i16 @llvm.vector.reduce.or.v4i16(<4 x i16> [[TMP23]])
	; CHECK-NEXT: [[TMP26:%.*]] = zext i16 [[TMP25]] to i32			; CHECK-NEXT: [[TMP25:%.*]] = zext i16 [[TMP24]] to i32
				; CHECK-NEXT: [[RDX_START6:%.*]] = or i32 [[BC_MERGE_RDX]], [[TMP25]]
	; CHECK-NEXT: [[CMP_N1:%.*]] = icmp eq i32 256, 256			; CHECK-NEXT: [[CMP_N1:%.*]] = icmp eq i32 256, 256
	; CHECK-NEXT: br i1 [[CMP_N1]], label [[FOR_END]], label [[VEC_EPILOG_SCALAR_PH]]			; CHECK-NEXT: br i1 [[CMP_N1]], label [[FOR_END]], label [[VEC_EPILOG_SCALAR_PH]]
	; CHECK: vec.epilog.scalar.ph:			; CHECK: vec.epilog.scalar.ph:
	; CHECK-NEXT: [[BC_RESUME_VAL:%.]] = phi i32 [ 256, [[VEC_EPILOG_MIDDLE_BLOCK]] ], [ 256, [[VEC_EPILOG_ITER_CHECK]] ], [ 0, [[ITER_CHECK:%.]] ]			; CHECK-NEXT: [[BC_RESUME_VAL:%.]] = phi i32 [ 256, [[VEC_EPILOG_MIDDLE_BLOCK]] ], [ 256, [[VEC_EPILOG_ITER_CHECK]] ], [ 0, [[ITER_CHECK:%.]] ]
	; CHECK-NEXT: [[BC_MERGE_RDX6:%.*]] = phi i32 [ 0, [[ITER_CHECK]] ], [ [[TMP12]], [[VEC_EPILOG_ITER_CHECK]] ], [ [[TMP26]], [[VEC_EPILOG_MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[BC_MERGE_RDX7:%.*]] = phi i32 [ 0, [[ITER_CHECK]] ], [ [[RDX_START]], [[VEC_EPILOG_ITER_CHECK]] ], [ [[RDX_START6]], [[VEC_EPILOG_MIDDLE_BLOCK]] ]
	; CHECK-NEXT: br label [[FOR_BODY:%.*]]			; CHECK-NEXT: br label [[FOR_BODY:%.*]]
	; CHECK: for.body:			; CHECK: for.body:
	; CHECK-NEXT: [[IV:%.]] = phi i32 [ [[IV_NEXT:%.]], [[FOR_BODY]] ], [ [[BC_RESUME_VAL]], [[VEC_EPILOG_SCALAR_PH]] ]			; CHECK-NEXT: [[IV:%.]] = phi i32 [ [[IV_NEXT:%.]], [[FOR_BODY]] ], [ [[BC_RESUME_VAL]], [[VEC_EPILOG_SCALAR_PH]] ]
	; CHECK-NEXT: [[SUM_02P:%.]] = phi i32 [ [[XOR:%.]], [[FOR_BODY]] ], [ [[BC_MERGE_RDX6]], [[VEC_EPILOG_SCALAR_PH]] ]			; CHECK-NEXT: [[SUM_02P:%.]] = phi i32 [ [[XOR:%.]], [[FOR_BODY]] ], [ [[BC_MERGE_RDX7]], [[VEC_EPILOG_SCALAR_PH]] ]
	; CHECK-NEXT: [[SUM_02:%.*]] = and i32 [[SUM_02P]], 65535			; CHECK-NEXT: [[SUM_02:%.*]] = and i32 [[SUM_02P]], 65535
	; CHECK-NEXT: [[GEP:%.]] = getelementptr inbounds i16, i16 [[PTR]], i32 [[IV]]			; CHECK-NEXT: [[GEP:%.]] = getelementptr inbounds i16, i16 [[PTR]], i32 [[IV]]
	; CHECK-NEXT: [[LOAD:%.]] = load i16, i16 [[GEP]], align 2			; CHECK-NEXT: [[LOAD:%.]] = load i16, i16 [[GEP]], align 2
	; CHECK-NEXT: [[EXT:%.*]] = zext i16 [[LOAD]] to i32			; CHECK-NEXT: [[EXT:%.*]] = zext i16 [[LOAD]] to i32
	; CHECK-NEXT: [[XOR]] = or i32 [[SUM_02]], [[EXT]]			; CHECK-NEXT: [[XOR]] = or i32 [[SUM_02]], [[EXT]]
	; CHECK-NEXT: [[IV_NEXT]] = add i32 [[IV]], 1			; CHECK-NEXT: [[IV_NEXT]] = add i32 [[IV]], 1
	; CHECK-NEXT: [[EXITCOND:%.*]] = icmp eq i32 [[IV_NEXT]], 256			; CHECK-NEXT: [[EXITCOND:%.*]] = icmp eq i32 [[IV_NEXT]], 256
	; CHECK-NEXT: br i1 [[EXITCOND]], label [[FOR_END]], label [[FOR_BODY]], !llvm.loop [[LOOP10:![0-9]+]]			; CHECK-NEXT: br i1 [[EXITCOND]], label [[FOR_END]], label [[FOR_BODY]], !llvm.loop [[LOOP10:![0-9]+]]
	; CHECK: for.end:			; CHECK: for.end:
	; CHECK-NEXT: [[XOR_LCSSA:%.*]] = phi i32 [ [[XOR]], [[FOR_BODY]] ], [ [[TMP12]], [[MIDDLE_BLOCK]] ], [ [[TMP26]], [[VEC_EPILOG_MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[XOR_LCSSA:%.*]] = phi i32 [ [[XOR]], [[FOR_BODY]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ], [ [[RDX_START6]], [[VEC_EPILOG_MIDDLE_BLOCK]] ]
	; CHECK-NEXT: [[RET:%.*]] = trunc i32 [[XOR_LCSSA]] to i16			; CHECK-NEXT: [[RET:%.*]] = trunc i32 [[XOR_LCSSA]] to i16
	; CHECK-NEXT: ret i16 [[RET]]			; CHECK-NEXT: ret i16 [[RET]]
	;			;
	entry:			entry:
	br label %for.body			br label %for.body

	for.body:			for.body:
	%iv = phi i32 [ %iv.next, %for.body ], [ 0, %entry ]			%iv = phi i32 [ %iv.next, %for.body ], [ 0, %entry ]
	Show All 24 Lines
	; CHECK-NEXT: [[MIN_ITERS_CHECK1:%.*]] = icmp ult i64 [[N]], 4			; CHECK-NEXT: [[MIN_ITERS_CHECK1:%.*]] = icmp ult i64 [[N]], 4
	; CHECK-NEXT: br i1 [[MIN_ITERS_CHECK1]], label [[VEC_EPILOG_PH:%.]], label [[VECTOR_PH:%.]]			; CHECK-NEXT: br i1 [[MIN_ITERS_CHECK1]], label [[VEC_EPILOG_PH:%.]], label [[VECTOR_PH:%.]]
	; CHECK: vector.ph:			; CHECK: vector.ph:
	; CHECK-NEXT: [[N_MOD_VF:%.*]] = urem i64 [[N]], 4			; CHECK-NEXT: [[N_MOD_VF:%.*]] = urem i64 [[N]], 4
	; CHECK-NEXT: [[N_VEC:%.*]] = sub i64 [[N]], [[N_MOD_VF]]			; CHECK-NEXT: [[N_VEC:%.*]] = sub i64 [[N]], [[N_MOD_VF]]
	; CHECK-NEXT: br label [[VECTOR_BODY:%.*]]			; CHECK-NEXT: br label [[VECTOR_BODY:%.*]]
	; CHECK: vector.body:			; CHECK: vector.body:
	; CHECK-NEXT: [[INDEX:%.]] = phi i64 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[VECTOR_BODY]] ]			; CHECK-NEXT: [[INDEX:%.]] = phi i64 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[VECTOR_BODY]] ]
	; CHECK-NEXT: [[VEC_PHI:%.]] = phi <4 x float> [ <float 1.500000e+01, float 1.000000e+00, float 1.000000e+00, float 1.000000e+00>, [[VECTOR_PH]] ], [ [[TMP5:%.]], [[VECTOR_BODY]] ]			; CHECK-NEXT: [[VEC_PHI:%.]] = phi <4 x float> [ <float 1.000000e+00, float 1.000000e+00, float 1.000000e+00, float 1.000000e+00>, [[VECTOR_PH]] ], [ [[TMP5:%.]], [[VECTOR_BODY]] ]
	; CHECK-NEXT: [[VEC_PHI2:%.]] = phi <4 x float> [ <float 1.000000e+01, float 0.000000e+00, float 0.000000e+00, float 0.000000e+00>, [[VECTOR_PH]] ], [ [[TMP4:%.]], [[VECTOR_BODY]] ]			; CHECK-NEXT: [[VEC_PHI2:%.]] = phi <4 x float> [ zeroinitializer, [[VECTOR_PH]] ], [ [[TMP4:%.]], [[VECTOR_BODY]] ]
	; CHECK-NEXT: [[TMP0:%.*]] = add i64 [[INDEX]], 0			; CHECK-NEXT: [[TMP0:%.*]] = add i64 [[INDEX]], 0
	; CHECK-NEXT: [[TMP1:%.]] = getelementptr inbounds float, float [[A:%.*]], i64 [[TMP0]]			; CHECK-NEXT: [[TMP1:%.]] = getelementptr inbounds float, float [[A:%.*]], i64 [[TMP0]]
	; CHECK-NEXT: [[TMP2:%.]] = getelementptr inbounds float, float [[TMP1]], i32 0			; CHECK-NEXT: [[TMP2:%.]] = getelementptr inbounds float, float [[TMP1]], i32 0
	; CHECK-NEXT: [[TMP3:%.]] = bitcast float [[TMP2]] to <4 x float>*			; CHECK-NEXT: [[TMP3:%.]] = bitcast float [[TMP2]] to <4 x float>*
	; CHECK-NEXT: [[WIDE_LOAD:%.]] = load <4 x float>, <4 x float> [[TMP3]], align 4			; CHECK-NEXT: [[WIDE_LOAD:%.]] = load <4 x float>, <4 x float> [[TMP3]], align 4
	; CHECK-NEXT: [[TMP4]] = fadd fast <4 x float> [[VEC_PHI2]], [[WIDE_LOAD]]			; CHECK-NEXT: [[TMP4]] = fadd fast <4 x float> [[VEC_PHI2]], [[WIDE_LOAD]]
	; CHECK-NEXT: [[TMP5]] = fmul fast <4 x float> [[VEC_PHI]], [[WIDE_LOAD]]			; CHECK-NEXT: [[TMP5]] = fmul fast <4 x float> [[VEC_PHI]], [[WIDE_LOAD]]
	; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 4			; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 4
	; CHECK-NEXT: [[TMP6:%.*]] = icmp eq i64 [[INDEX_NEXT]], [[N_VEC]]			; CHECK-NEXT: [[TMP6:%.*]] = icmp eq i64 [[INDEX_NEXT]], [[N_VEC]]
	; CHECK-NEXT: br i1 [[TMP6]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP11:![0-9]+]]			; CHECK-NEXT: br i1 [[TMP6]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP11:![0-9]+]]
	; CHECK: middle.block:			; CHECK: middle.block:
	; CHECK-NEXT: [[TMP7:%.*]] = call fast float @llvm.vector.reduce.fadd.v4f32(float -0.000000e+00, <4 x float> [[TMP4]])			; CHECK-NEXT: [[TMP7:%.*]] = call fast float @llvm.vector.reduce.fadd.v4f32(float -0.000000e+00, <4 x float> [[TMP4]])
				; CHECK-NEXT: [[RDX_START3:%.*]] = fadd float 1.000000e+01, [[TMP7]]
	; CHECK-NEXT: [[TMP8:%.*]] = call fast float @llvm.vector.reduce.fmul.v4f32(float 1.000000e+00, <4 x float> [[TMP5]])			; CHECK-NEXT: [[TMP8:%.*]] = call fast float @llvm.vector.reduce.fmul.v4f32(float 1.000000e+00, <4 x float> [[TMP5]])
				; CHECK-NEXT: [[RDX_START:%.*]] = fmul float 1.500000e+01, [[TMP8]]
	; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i64 [[N]], [[N_VEC]]			; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i64 [[N]], [[N_VEC]]
	; CHECK-NEXT: br i1 [[CMP_N]], label [[FOR_END:%.]], label [[VEC_EPILOG_ITER_CHECK:%.]]			; CHECK-NEXT: br i1 [[CMP_N]], label [[FOR_END:%.]], label [[VEC_EPILOG_ITER_CHECK:%.]]
	; CHECK: vec.epilog.iter.check:			; CHECK: vec.epilog.iter.check:
	; CHECK-NEXT: [[N_VEC_REMAINING:%.*]] = sub i64 [[N]], [[N_VEC]]			; CHECK-NEXT: [[N_VEC_REMAINING:%.*]] = sub i64 [[N]], [[N_VEC]]
	; CHECK-NEXT: [[MIN_EPILOG_ITERS_CHECK:%.*]] = icmp ult i64 [[N_VEC_REMAINING]], 4			; CHECK-NEXT: [[MIN_EPILOG_ITERS_CHECK:%.*]] = icmp ult i64 [[N_VEC_REMAINING]], 4
	; CHECK-NEXT: br i1 [[MIN_EPILOG_ITERS_CHECK]], label [[VEC_EPILOG_SCALAR_PH]], label [[VEC_EPILOG_PH]]			; CHECK-NEXT: br i1 [[MIN_EPILOG_ITERS_CHECK]], label [[VEC_EPILOG_SCALAR_PH]], label [[VEC_EPILOG_PH]]
	; CHECK: vec.epilog.ph:			; CHECK: vec.epilog.ph:
	; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi float [ 1.500000e+01, [[VECTOR_MAIN_LOOP_ITER_CHECK]] ], [ [[TMP8]], [[VEC_EPILOG_ITER_CHECK]] ]			; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi float [ 1.500000e+01, [[VECTOR_MAIN_LOOP_ITER_CHECK]] ], [ [[RDX_START]], [[VEC_EPILOG_ITER_CHECK]] ]
	; CHECK-NEXT: [[BC_MERGE_RDX3:%.*]] = phi float [ 1.000000e+01, [[VECTOR_MAIN_LOOP_ITER_CHECK]] ], [ [[TMP7]], [[VEC_EPILOG_ITER_CHECK]] ]			; CHECK-NEXT: [[BC_MERGE_RDX4:%.*]] = phi float [ 1.000000e+01, [[VECTOR_MAIN_LOOP_ITER_CHECK]] ], [ [[RDX_START3]], [[VEC_EPILOG_ITER_CHECK]] ]
	; CHECK-NEXT: [[VEC_EPILOG_RESUME_VAL:%.*]] = phi i64 [ [[N_VEC]], [[VEC_EPILOG_ITER_CHECK]] ], [ 0, [[VECTOR_MAIN_LOOP_ITER_CHECK]] ]			; CHECK-NEXT: [[VEC_EPILOG_RESUME_VAL:%.*]] = phi i64 [ [[N_VEC]], [[VEC_EPILOG_ITER_CHECK]] ], [ 0, [[VECTOR_MAIN_LOOP_ITER_CHECK]] ]
	; CHECK-NEXT: [[N_MOD_VF4:%.*]] = urem i64 [[N]], 4			; CHECK-NEXT: [[N_MOD_VF5:%.*]] = urem i64 [[N]], 4
	; CHECK-NEXT: [[N_VEC5:%.*]] = sub i64 [[N]], [[N_MOD_VF4]]			; CHECK-NEXT: [[N_VEC6:%.*]] = sub i64 [[N]], [[N_MOD_VF5]]
	; CHECK-NEXT: [[TMP9:%.*]] = insertelement <4 x float> <float 1.000000e+00, float 1.000000e+00, float 1.000000e+00, float 1.000000e+00>, float [[BC_MERGE_RDX]], i32 0
	; CHECK-NEXT: [[TMP10:%.*]] = insertelement <4 x float> zeroinitializer, float [[BC_MERGE_RDX3]], i32 0
	; CHECK-NEXT: br label [[VEC_EPILOG_VECTOR_BODY:%.*]]			; CHECK-NEXT: br label [[VEC_EPILOG_VECTOR_BODY:%.*]]
	; CHECK: vec.epilog.vector.body:			; CHECK: vec.epilog.vector.body:
	; CHECK-NEXT: [[OFFSET_IDX:%.]] = phi i64 [ [[VEC_EPILOG_RESUME_VAL]], [[VEC_EPILOG_PH]] ], [ [[INDEX_NEXT11:%.]], [[VEC_EPILOG_VECTOR_BODY]] ]			; CHECK-NEXT: [[OFFSET_IDX:%.]] = phi i64 [ [[VEC_EPILOG_RESUME_VAL]], [[VEC_EPILOG_PH]] ], [ [[INDEX_NEXT12:%.]], [[VEC_EPILOG_VECTOR_BODY]] ]
	; CHECK-NEXT: [[VEC_PHI8:%.]] = phi <4 x float> [ [[TMP9]], [[VEC_EPILOG_PH]] ], [ [[TMP16:%.]], [[VEC_EPILOG_VECTOR_BODY]] ]			; CHECK-NEXT: [[VEC_PHI9:%.]] = phi <4 x float> [ <float 1.000000e+00, float 1.000000e+00, float 1.000000e+00, float 1.000000e+00>, [[VEC_EPILOG_PH]] ], [ [[TMP14:%.]], [[VEC_EPILOG_VECTOR_BODY]] ]
	; CHECK-NEXT: [[VEC_PHI9:%.]] = phi <4 x float> [ [[TMP10]], [[VEC_EPILOG_PH]] ], [ [[TMP15:%.]], [[VEC_EPILOG_VECTOR_BODY]] ]			; CHECK-NEXT: [[VEC_PHI10:%.]] = phi <4 x float> [ zeroinitializer, [[VEC_EPILOG_PH]] ], [ [[TMP13:%.]], [[VEC_EPILOG_VECTOR_BODY]] ]
	; CHECK-NEXT: [[TMP11:%.*]] = add i64 [[OFFSET_IDX]], 0			; CHECK-NEXT: [[TMP9:%.*]] = add i64 [[OFFSET_IDX]], 0
	; CHECK-NEXT: [[TMP12:%.]] = getelementptr inbounds float, float [[A]], i64 [[TMP11]]			; CHECK-NEXT: [[TMP10:%.]] = getelementptr inbounds float, float [[A]], i64 [[TMP9]]
	; CHECK-NEXT: [[TMP13:%.]] = getelementptr inbounds float, float [[TMP12]], i32 0			; CHECK-NEXT: [[TMP11:%.]] = getelementptr inbounds float, float [[TMP10]], i32 0
	; CHECK-NEXT: [[TMP14:%.]] = bitcast float [[TMP13]] to <4 x float>*			; CHECK-NEXT: [[TMP12:%.]] = bitcast float [[TMP11]] to <4 x float>*
	; CHECK-NEXT: [[WIDE_LOAD10:%.]] = load <4 x float>, <4 x float> [[TMP14]], align 4			; CHECK-NEXT: [[WIDE_LOAD11:%.]] = load <4 x float>, <4 x float> [[TMP12]], align 4
	; CHECK-NEXT: [[TMP15]] = fadd fast <4 x float> [[VEC_PHI9]], [[WIDE_LOAD10]]			; CHECK-NEXT: [[TMP13]] = fadd fast <4 x float> [[VEC_PHI10]], [[WIDE_LOAD11]]
	; CHECK-NEXT: [[TMP16]] = fmul fast <4 x float> [[VEC_PHI8]], [[WIDE_LOAD10]]			; CHECK-NEXT: [[TMP14]] = fmul fast <4 x float> [[VEC_PHI9]], [[WIDE_LOAD11]]
	; CHECK-NEXT: [[INDEX_NEXT11]] = add nuw i64 [[OFFSET_IDX]], 4			; CHECK-NEXT: [[INDEX_NEXT12]] = add nuw i64 [[OFFSET_IDX]], 4
	; CHECK-NEXT: [[TMP17:%.*]] = icmp eq i64 [[INDEX_NEXT11]], [[N_VEC5]]			; CHECK-NEXT: [[TMP15:%.*]] = icmp eq i64 [[INDEX_NEXT12]], [[N_VEC6]]
	; CHECK-NEXT: br i1 [[TMP17]], label [[VEC_EPILOG_MIDDLE_BLOCK:%.*]], label [[VEC_EPILOG_VECTOR_BODY]], !llvm.loop [[LOOP12:![0-9]+]]			; CHECK-NEXT: br i1 [[TMP15]], label [[VEC_EPILOG_MIDDLE_BLOCK:%.*]], label [[VEC_EPILOG_VECTOR_BODY]], !llvm.loop [[LOOP12:![0-9]+]]
	; CHECK: vec.epilog.middle.block:			; CHECK: vec.epilog.middle.block:
	; CHECK-NEXT: [[TMP18:%.*]] = call fast float @llvm.vector.reduce.fadd.v4f32(float -0.000000e+00, <4 x float> [[TMP15]])			; CHECK-NEXT: [[TMP16:%.*]] = call fast float @llvm.vector.reduce.fadd.v4f32(float -0.000000e+00, <4 x float> [[TMP13]])
	; CHECK-NEXT: [[TMP19:%.*]] = call fast float @llvm.vector.reduce.fmul.v4f32(float 1.000000e+00, <4 x float> [[TMP16]])			; CHECK-NEXT: [[RDX_START15:%.*]] = fadd float [[BC_MERGE_RDX4]], [[TMP16]]
	; CHECK-NEXT: [[CMP_N6:%.*]] = icmp eq i64 [[N]], [[N_VEC5]]			; CHECK-NEXT: [[TMP17:%.*]] = call fast float @llvm.vector.reduce.fmul.v4f32(float 1.000000e+00, <4 x float> [[TMP14]])
	; CHECK-NEXT: br i1 [[CMP_N6]], label [[FOR_END]], label [[VEC_EPILOG_SCALAR_PH]]			; CHECK-NEXT: [[RDX_START13:%.*]] = fmul float [[BC_MERGE_RDX]], [[TMP17]]
				; CHECK-NEXT: [[CMP_N7:%.*]] = icmp eq i64 [[N]], [[N_VEC6]]
				; CHECK-NEXT: br i1 [[CMP_N7]], label [[FOR_END]], label [[VEC_EPILOG_SCALAR_PH]]
	; CHECK: vec.epilog.scalar.ph:			; CHECK: vec.epilog.scalar.ph:
	; CHECK-NEXT: [[BC_RESUME_VAL:%.]] = phi i64 [ [[N_VEC5]], [[VEC_EPILOG_MIDDLE_BLOCK]] ], [ [[N_VEC]], [[VEC_EPILOG_ITER_CHECK]] ], [ 0, [[ITER_CHECK:%.]] ]			; CHECK-NEXT: [[BC_RESUME_VAL:%.]] = phi i64 [ [[N_VEC6]], [[VEC_EPILOG_MIDDLE_BLOCK]] ], [ [[N_VEC]], [[VEC_EPILOG_ITER_CHECK]] ], [ 0, [[ITER_CHECK:%.]] ]
	; CHECK-NEXT: [[BC_MERGE_RDX12:%.*]] = phi float [ 1.500000e+01, [[ITER_CHECK]] ], [ [[TMP8]], [[VEC_EPILOG_ITER_CHECK]] ], [ [[TMP19]], [[VEC_EPILOG_MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[BC_MERGE_RDX14:%.*]] = phi float [ 1.500000e+01, [[ITER_CHECK]] ], [ [[RDX_START]], [[VEC_EPILOG_ITER_CHECK]] ], [ [[RDX_START13]], [[VEC_EPILOG_MIDDLE_BLOCK]] ]
	; CHECK-NEXT: [[BC_MERGE_RDX13:%.*]] = phi float [ 1.000000e+01, [[ITER_CHECK]] ], [ [[TMP7]], [[VEC_EPILOG_ITER_CHECK]] ], [ [[TMP18]], [[VEC_EPILOG_MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[BC_MERGE_RDX16:%.*]] = phi float [ 1.000000e+01, [[ITER_CHECK]] ], [ [[RDX_START3]], [[VEC_EPILOG_ITER_CHECK]] ], [ [[RDX_START15]], [[VEC_EPILOG_MIDDLE_BLOCK]] ]
	; CHECK-NEXT: br label [[FOR_BODY:%.*]]			; CHECK-NEXT: br label [[FOR_BODY:%.*]]
	; CHECK: for.body:			; CHECK: for.body:
	; CHECK-NEXT: [[IV:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[VEC_EPILOG_SCALAR_PH]] ], [ [[IV_NEXT:%.]], [[FOR_BODY]] ]			; CHECK-NEXT: [[IV:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[VEC_EPILOG_SCALAR_PH]] ], [ [[IV_NEXT:%.]], [[FOR_BODY]] ]
	; CHECK-NEXT: [[PROD:%.]] = phi float [ [[BC_MERGE_RDX12]], [[VEC_EPILOG_SCALAR_PH]] ], [ [[MUL:%.]], [[FOR_BODY]] ]			; CHECK-NEXT: [[PROD:%.]] = phi float [ [[BC_MERGE_RDX14]], [[VEC_EPILOG_SCALAR_PH]] ], [ [[MUL:%.]], [[FOR_BODY]] ]
	; CHECK-NEXT: [[SUM:%.]] = phi float [ [[BC_MERGE_RDX13]], [[VEC_EPILOG_SCALAR_PH]] ], [ [[ADD:%.]], [[FOR_BODY]] ]			; CHECK-NEXT: [[SUM:%.]] = phi float [ [[BC_MERGE_RDX16]], [[VEC_EPILOG_SCALAR_PH]] ], [ [[ADD:%.]], [[FOR_BODY]] ]
	; CHECK-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds float, float [[A]], i64 [[IV]]			; CHECK-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds float, float [[A]], i64 [[IV]]
	; CHECK-NEXT: [[TMP20:%.]] = load float, float [[ARRAYIDX]], align 4			; CHECK-NEXT: [[TMP18:%.]] = load float, float [[ARRAYIDX]], align 4
	; CHECK-NEXT: [[ADD]] = fadd fast float [[SUM]], [[TMP20]]			; CHECK-NEXT: [[ADD]] = fadd fast float [[SUM]], [[TMP18]]
	; CHECK-NEXT: [[MUL]] = fmul fast float [[PROD]], [[TMP20]]			; CHECK-NEXT: [[MUL]] = fmul fast float [[PROD]], [[TMP18]]
	; CHECK-NEXT: [[IV_NEXT]] = add nuw nsw i64 [[IV]], 1			; CHECK-NEXT: [[IV_NEXT]] = add nuw nsw i64 [[IV]], 1
	; CHECK-NEXT: [[EXITCOND_NOT:%.*]] = icmp eq i64 [[IV_NEXT]], [[N]]			; CHECK-NEXT: [[EXITCOND_NOT:%.*]] = icmp eq i64 [[IV_NEXT]], [[N]]
	; CHECK-NEXT: br i1 [[EXITCOND_NOT]], label [[FOR_END]], label [[FOR_BODY]], !llvm.loop [[LOOP13:![0-9]+]]			; CHECK-NEXT: br i1 [[EXITCOND_NOT]], label [[FOR_END]], label [[FOR_BODY]], !llvm.loop [[LOOP13:![0-9]+]]
	; CHECK: for.end:			; CHECK: for.end:
	; CHECK-NEXT: [[ADD_LCSSA:%.*]] = phi float [ [[ADD]], [[FOR_BODY]] ], [ [[TMP7]], [[MIDDLE_BLOCK]] ], [ [[TMP18]], [[VEC_EPILOG_MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[ADD_LCSSA:%.*]] = phi float [ [[ADD]], [[FOR_BODY]] ], [ [[RDX_START3]], [[MIDDLE_BLOCK]] ], [ [[RDX_START15]], [[VEC_EPILOG_MIDDLE_BLOCK]] ]
	; CHECK-NEXT: [[MUL_LCSSA:%.*]] = phi float [ [[MUL]], [[FOR_BODY]] ], [ [[TMP8]], [[MIDDLE_BLOCK]] ], [ [[TMP19]], [[VEC_EPILOG_MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[MUL_LCSSA:%.*]] = phi float [ [[MUL]], [[FOR_BODY]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ], [ [[RDX_START13]], [[VEC_EPILOG_MIDDLE_BLOCK]] ]
	; CHECK-NEXT: [[DIV:%.*]] = fdiv float [[MUL_LCSSA]], [[ADD_LCSSA]]			; CHECK-NEXT: [[DIV:%.*]] = fdiv float [[MUL_LCSSA]], [[ADD_LCSSA]]
	; CHECK-NEXT: ret float [[DIV]]			; CHECK-NEXT: ret float [[DIV]]
	;			;
	entry:			entry:
	br label %for.body			br label %for.body

	for.body:			for.body:
	%iv = phi i64 [ 0, %entry ], [ %iv.next, %for.body ]			%iv = phi i64 [ 0, %entry ], [ %iv.next, %for.body ]
	Show All 25 Lines
	; CHECK-NEXT: [[MIN_ITERS_CHECK:%.]] = icmp ult i64 [[N:%.]], 4			; CHECK-NEXT: [[MIN_ITERS_CHECK:%.]] = icmp ult i64 [[N:%.]], 4
	; CHECK-NEXT: br i1 [[MIN_ITERS_CHECK]], label [[VEC_EPILOG_SCALAR_PH:%.]], label [[VECTOR_MAIN_LOOP_ITER_CHECK:%.]]			; CHECK-NEXT: br i1 [[MIN_ITERS_CHECK]], label [[VEC_EPILOG_SCALAR_PH:%.]], label [[VECTOR_MAIN_LOOP_ITER_CHECK:%.]]
	; CHECK: vector.main.loop.iter.check:			; CHECK: vector.main.loop.iter.check:
	; CHECK-NEXT: [[MIN_ITERS_CHECK1:%.*]] = icmp ult i64 [[N]], 4			; CHECK-NEXT: [[MIN_ITERS_CHECK1:%.*]] = icmp ult i64 [[N]], 4
	; CHECK-NEXT: br i1 [[MIN_ITERS_CHECK1]], label [[VEC_EPILOG_PH:%.]], label [[VECTOR_PH:%.]]			; CHECK-NEXT: br i1 [[MIN_ITERS_CHECK1]], label [[VEC_EPILOG_PH:%.]], label [[VECTOR_PH:%.]]
	; CHECK: vector.ph:			; CHECK: vector.ph:
	; CHECK-NEXT: [[N_MOD_VF:%.*]] = urem i64 [[N]], 4			; CHECK-NEXT: [[N_MOD_VF:%.*]] = urem i64 [[N]], 4
	; CHECK-NEXT: [[N_VEC:%.*]] = sub i64 [[N]], [[N_MOD_VF]]			; CHECK-NEXT: [[N_VEC:%.*]] = sub i64 [[N]], [[N_MOD_VF]]
	; CHECK-NEXT: [[TMP0:%.*]] = insertelement <4 x i32> zeroinitializer, i32 [[START_SUM]], i32 0
	; CHECK-NEXT: br label [[VECTOR_BODY:%.*]]			; CHECK-NEXT: br label [[VECTOR_BODY:%.*]]
	; CHECK: vector.body:			; CHECK: vector.body:
	; CHECK-NEXT: [[INDEX:%.]] = phi i64 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[VECTOR_BODY]] ]			; CHECK-NEXT: [[INDEX:%.]] = phi i64 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[VECTOR_BODY]] ]
	; CHECK-NEXT: [[VEC_PHI:%.]] = phi <4 x i32> [ [[TMP0]], [[VECTOR_PH]] ], [ [[TMP5:%.]], [[VECTOR_BODY]] ]			; CHECK-NEXT: [[VEC_PHI:%.]] = phi <4 x i32> [ zeroinitializer, [[VECTOR_PH]] ], [ [[TMP4:%.]], [[VECTOR_BODY]] ]
	; CHECK-NEXT: [[TMP1:%.*]] = add i64 [[INDEX]], 0			; CHECK-NEXT: [[TMP0:%.*]] = add i64 [[INDEX]], 0
	; CHECK-NEXT: [[TMP2:%.]] = getelementptr inbounds i32, i32 [[A:%.*]], i64 [[TMP1]]			; CHECK-NEXT: [[TMP1:%.]] = getelementptr inbounds i32, i32 [[A:%.*]], i64 [[TMP0]]
	; CHECK-NEXT: [[TMP3:%.]] = getelementptr inbounds i32, i32 [[TMP2]], i32 0			; CHECK-NEXT: [[TMP2:%.]] = getelementptr inbounds i32, i32 [[TMP1]], i32 0
	; CHECK-NEXT: [[TMP4:%.]] = bitcast i32 [[TMP3]] to <4 x i32>*			; CHECK-NEXT: [[TMP3:%.]] = bitcast i32 [[TMP2]] to <4 x i32>*
	; CHECK-NEXT: [[WIDE_LOAD:%.]] = load <4 x i32>, <4 x i32> [[TMP4]], align 4			; CHECK-NEXT: [[WIDE_LOAD:%.]] = load <4 x i32>, <4 x i32> [[TMP3]], align 4
	; CHECK-NEXT: [[TMP5]] = sub <4 x i32> [[VEC_PHI]], [[WIDE_LOAD]]			; CHECK-NEXT: [[TMP4]] = sub <4 x i32> [[VEC_PHI]], [[WIDE_LOAD]]
	; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 4			; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 4
	; CHECK-NEXT: [[TMP6:%.*]] = icmp eq i64 [[INDEX_NEXT]], [[N_VEC]]			; CHECK-NEXT: [[TMP5:%.*]] = icmp eq i64 [[INDEX_NEXT]], [[N_VEC]]
	; CHECK-NEXT: br i1 [[TMP6]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP14:![0-9]+]]			; CHECK-NEXT: br i1 [[TMP5]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP14:![0-9]+]]
	; CHECK: middle.block:			; CHECK: middle.block:
	; CHECK-NEXT: [[TMP7:%.*]] = call i32 @llvm.vector.reduce.add.v4i32(<4 x i32> [[TMP5]])			; CHECK-NEXT: [[TMP6:%.*]] = call i32 @llvm.vector.reduce.add.v4i32(<4 x i32> [[TMP4]])
				; CHECK-NEXT: [[RDX_START:%.*]] = add i32 [[START_SUM]], [[TMP6]]
	; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i64 [[N]], [[N_VEC]]			; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i64 [[N]], [[N_VEC]]
	; CHECK-NEXT: br i1 [[CMP_N]], label [[FOR_COND]], label [[VEC_EPILOG_ITER_CHECK:%.*]]			; CHECK-NEXT: br i1 [[CMP_N]], label [[FOR_COND]], label [[VEC_EPILOG_ITER_CHECK:%.*]]
	; CHECK: vec.epilog.iter.check:			; CHECK: vec.epilog.iter.check:
	; CHECK-NEXT: [[N_VEC_REMAINING:%.*]] = sub i64 [[N]], [[N_VEC]]			; CHECK-NEXT: [[N_VEC_REMAINING:%.*]] = sub i64 [[N]], [[N_VEC]]
	; CHECK-NEXT: [[MIN_EPILOG_ITERS_CHECK:%.*]] = icmp ult i64 [[N_VEC_REMAINING]], 4			; CHECK-NEXT: [[MIN_EPILOG_ITERS_CHECK:%.*]] = icmp ult i64 [[N_VEC_REMAINING]], 4
	; CHECK-NEXT: br i1 [[MIN_EPILOG_ITERS_CHECK]], label [[VEC_EPILOG_SCALAR_PH]], label [[VEC_EPILOG_PH]]			; CHECK-NEXT: br i1 [[MIN_EPILOG_ITERS_CHECK]], label [[VEC_EPILOG_SCALAR_PH]], label [[VEC_EPILOG_PH]]
	; CHECK: vec.epilog.ph:			; CHECK: vec.epilog.ph:
	; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ [[START_SUM]], [[VECTOR_MAIN_LOOP_ITER_CHECK]] ], [ [[TMP7]], [[VEC_EPILOG_ITER_CHECK]] ]			; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ [[START_SUM]], [[VECTOR_MAIN_LOOP_ITER_CHECK]] ], [ [[RDX_START]], [[VEC_EPILOG_ITER_CHECK]] ]
	; CHECK-NEXT: [[VEC_EPILOG_RESUME_VAL:%.*]] = phi i64 [ [[N_VEC]], [[VEC_EPILOG_ITER_CHECK]] ], [ 0, [[VECTOR_MAIN_LOOP_ITER_CHECK]] ]			; CHECK-NEXT: [[VEC_EPILOG_RESUME_VAL:%.*]] = phi i64 [ [[N_VEC]], [[VEC_EPILOG_ITER_CHECK]] ], [ 0, [[VECTOR_MAIN_LOOP_ITER_CHECK]] ]
	; CHECK-NEXT: [[N_MOD_VF2:%.*]] = urem i64 [[N]], 4			; CHECK-NEXT: [[N_MOD_VF2:%.*]] = urem i64 [[N]], 4
	; CHECK-NEXT: [[N_VEC3:%.*]] = sub i64 [[N]], [[N_MOD_VF2]]			; CHECK-NEXT: [[N_VEC3:%.*]] = sub i64 [[N]], [[N_MOD_VF2]]
	; CHECK-NEXT: [[TMP8:%.*]] = insertelement <4 x i32> zeroinitializer, i32 [[BC_MERGE_RDX]], i32 0
	; CHECK-NEXT: br label [[VEC_EPILOG_VECTOR_BODY:%.*]]			; CHECK-NEXT: br label [[VEC_EPILOG_VECTOR_BODY:%.*]]
	; CHECK: vec.epilog.vector.body:			; CHECK: vec.epilog.vector.body:
	; CHECK-NEXT: [[OFFSET_IDX:%.]] = phi i64 [ [[VEC_EPILOG_RESUME_VAL]], [[VEC_EPILOG_PH]] ], [ [[INDEX_NEXT8:%.]], [[VEC_EPILOG_VECTOR_BODY]] ]			; CHECK-NEXT: [[OFFSET_IDX:%.]] = phi i64 [ [[VEC_EPILOG_RESUME_VAL]], [[VEC_EPILOG_PH]] ], [ [[INDEX_NEXT8:%.]], [[VEC_EPILOG_VECTOR_BODY]] ]
	; CHECK-NEXT: [[VEC_PHI6:%.]] = phi <4 x i32> [ [[TMP8]], [[VEC_EPILOG_PH]] ], [ [[TMP13:%.]], [[VEC_EPILOG_VECTOR_BODY]] ]			; CHECK-NEXT: [[VEC_PHI6:%.]] = phi <4 x i32> [ zeroinitializer, [[VEC_EPILOG_PH]] ], [ [[TMP11:%.]], [[VEC_EPILOG_VECTOR_BODY]] ]
	; CHECK-NEXT: [[TMP9:%.*]] = add i64 [[OFFSET_IDX]], 0			; CHECK-NEXT: [[TMP7:%.*]] = add i64 [[OFFSET_IDX]], 0
	; CHECK-NEXT: [[TMP10:%.]] = getelementptr inbounds i32, i32 [[A]], i64 [[TMP9]]			; CHECK-NEXT: [[TMP8:%.]] = getelementptr inbounds i32, i32 [[A]], i64 [[TMP7]]
	; CHECK-NEXT: [[TMP11:%.]] = getelementptr inbounds i32, i32 [[TMP10]], i32 0			; CHECK-NEXT: [[TMP9:%.]] = getelementptr inbounds i32, i32 [[TMP8]], i32 0
	; CHECK-NEXT: [[TMP12:%.]] = bitcast i32 [[TMP11]] to <4 x i32>*			; CHECK-NEXT: [[TMP10:%.]] = bitcast i32 [[TMP9]] to <4 x i32>*
	; CHECK-NEXT: [[WIDE_LOAD7:%.]] = load <4 x i32>, <4 x i32> [[TMP12]], align 4			; CHECK-NEXT: [[WIDE_LOAD7:%.]] = load <4 x i32>, <4 x i32> [[TMP10]], align 4
	; CHECK-NEXT: [[TMP13]] = sub <4 x i32> [[VEC_PHI6]], [[WIDE_LOAD7]]			; CHECK-NEXT: [[TMP11]] = sub <4 x i32> [[VEC_PHI6]], [[WIDE_LOAD7]]
	; CHECK-NEXT: [[INDEX_NEXT8]] = add nuw i64 [[OFFSET_IDX]], 4			; CHECK-NEXT: [[INDEX_NEXT8]] = add nuw i64 [[OFFSET_IDX]], 4
	; CHECK-NEXT: [[TMP14:%.*]] = icmp eq i64 [[INDEX_NEXT8]], [[N_VEC3]]			; CHECK-NEXT: [[TMP12:%.*]] = icmp eq i64 [[INDEX_NEXT8]], [[N_VEC3]]
	; CHECK-NEXT: br i1 [[TMP14]], label [[VEC_EPILOG_MIDDLE_BLOCK:%.*]], label [[VEC_EPILOG_VECTOR_BODY]], !llvm.loop [[LOOP15:![0-9]+]]			; CHECK-NEXT: br i1 [[TMP12]], label [[VEC_EPILOG_MIDDLE_BLOCK:%.*]], label [[VEC_EPILOG_VECTOR_BODY]], !llvm.loop [[LOOP15:![0-9]+]]
	; CHECK: vec.epilog.middle.block:			; CHECK: vec.epilog.middle.block:
	; CHECK-NEXT: [[TMP15:%.*]] = call i32 @llvm.vector.reduce.add.v4i32(<4 x i32> [[TMP13]])			; CHECK-NEXT: [[TMP13:%.*]] = call i32 @llvm.vector.reduce.add.v4i32(<4 x i32> [[TMP11]])
				; CHECK-NEXT: [[RDX_START9:%.*]] = add i32 [[BC_MERGE_RDX]], [[TMP13]]
	; CHECK-NEXT: [[CMP_N4:%.*]] = icmp eq i64 [[N]], [[N_VEC3]]			; CHECK-NEXT: [[CMP_N4:%.*]] = icmp eq i64 [[N]], [[N_VEC3]]
	; CHECK-NEXT: br i1 [[CMP_N4]], label [[FOR_COND]], label [[VEC_EPILOG_SCALAR_PH]]			; CHECK-NEXT: br i1 [[CMP_N4]], label [[FOR_COND]], label [[VEC_EPILOG_SCALAR_PH]]
	; CHECK: vec.epilog.scalar.ph:			; CHECK: vec.epilog.scalar.ph:
	; CHECK-NEXT: [[BC_RESUME_VAL:%.*]] = phi i64 [ [[N_VEC3]], [[VEC_EPILOG_MIDDLE_BLOCK]] ], [ [[N_VEC]], [[VEC_EPILOG_ITER_CHECK]] ], [ 0, [[ITER_CHECK]] ]			; CHECK-NEXT: [[BC_RESUME_VAL:%.*]] = phi i64 [ [[N_VEC3]], [[VEC_EPILOG_MIDDLE_BLOCK]] ], [ [[N_VEC]], [[VEC_EPILOG_ITER_CHECK]] ], [ 0, [[ITER_CHECK]] ]
	; CHECK-NEXT: [[BC_MERGE_RDX9:%.*]] = phi i32 [ [[START_SUM]], [[ITER_CHECK]] ], [ [[TMP7]], [[VEC_EPILOG_ITER_CHECK]] ], [ [[TMP15]], [[VEC_EPILOG_MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[BC_MERGE_RDX10:%.*]] = phi i32 [ [[START_SUM]], [[ITER_CHECK]] ], [ [[RDX_START]], [[VEC_EPILOG_ITER_CHECK]] ], [ [[RDX_START9]], [[VEC_EPILOG_MIDDLE_BLOCK]] ]
	; CHECK-NEXT: br label [[FOR_BODY:%.*]]			; CHECK-NEXT: br label [[FOR_BODY:%.*]]
	; CHECK: for.body:			; CHECK: for.body:
	; CHECK-NEXT: [[IV:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[VEC_EPILOG_SCALAR_PH]] ], [ [[IV_NEXT:%.]], [[FOR_BODY]] ]			; CHECK-NEXT: [[IV:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[VEC_EPILOG_SCALAR_PH]] ], [ [[IV_NEXT:%.]], [[FOR_BODY]] ]
	; CHECK-NEXT: [[SUM:%.]] = phi i32 [ [[BC_MERGE_RDX9]], [[VEC_EPILOG_SCALAR_PH]] ], [ [[SUB:%.]], [[FOR_BODY]] ]			; CHECK-NEXT: [[SUM:%.]] = phi i32 [ [[BC_MERGE_RDX10]], [[VEC_EPILOG_SCALAR_PH]] ], [ [[SUB:%.]], [[FOR_BODY]] ]
	; CHECK-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds i32, i32 [[A]], i64 [[IV]]			; CHECK-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds i32, i32 [[A]], i64 [[IV]]
	; CHECK-NEXT: [[LOAD:%.]] = load i32, i32 [[ARRAYIDX]], align 4			; CHECK-NEXT: [[LOAD:%.]] = load i32, i32 [[ARRAYIDX]], align 4
	; CHECK-NEXT: [[SUB]] = sub nsw i32 [[SUM]], [[LOAD]]			; CHECK-NEXT: [[SUB]] = sub nsw i32 [[SUM]], [[LOAD]]
	; CHECK-NEXT: [[IV_NEXT]] = add nuw nsw i64 [[IV]], 1			; CHECK-NEXT: [[IV_NEXT]] = add nuw nsw i64 [[IV]], 1
	; CHECK-NEXT: [[EXITCOND_NOT:%.*]] = icmp eq i64 [[IV_NEXT]], [[N]]			; CHECK-NEXT: [[EXITCOND_NOT:%.*]] = icmp eq i64 [[IV_NEXT]], [[N]]
	; CHECK-NEXT: br i1 [[EXITCOND_NOT]], label [[FOR_COND]], label [[FOR_BODY]], !llvm.loop [[LOOP16:![0-9]+]]			; CHECK-NEXT: br i1 [[EXITCOND_NOT]], label [[FOR_COND]], label [[FOR_BODY]], !llvm.loop [[LOOP16:![0-9]+]]
	; CHECK: for.cond:			; CHECK: for.cond:
	; CHECK-NEXT: [[SUB_LCSSA]] = phi i32 [ [[SUB]], [[FOR_BODY]] ], [ [[TMP7]], [[MIDDLE_BLOCK]] ], [ [[TMP15]], [[VEC_EPILOG_MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[SUB_LCSSA]] = phi i32 [ [[SUB]], [[FOR_BODY]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ], [ [[RDX_START9]], [[VEC_EPILOG_MIDDLE_BLOCK]] ]
	; CHECK-NEXT: [[OUTER_IV_NEXT]] = add nuw nsw i64 [[OUTER_IV]], 1			; CHECK-NEXT: [[OUTER_IV_NEXT]] = add nuw nsw i64 [[OUTER_IV]], 1
	; CHECK-NEXT: [[OUTER_EXITCOND_NOT:%.*]] = icmp eq i64 [[OUTER_IV_NEXT]], [[N]]			; CHECK-NEXT: [[OUTER_EXITCOND_NOT:%.*]] = icmp eq i64 [[OUTER_IV_NEXT]], [[N]]
	; CHECK-NEXT: br i1 [[OUTER_EXITCOND_NOT]], label [[FOR_END:%.*]], label [[ITER_CHECK]]			; CHECK-NEXT: br i1 [[OUTER_EXITCOND_NOT]], label [[FOR_END:%.*]], label [[ITER_CHECK]]
	; CHECK: for.end:			; CHECK: for.end:
	; CHECK-NEXT: [[SUB_LCSSA_LCSSA:%.*]] = phi i32 [ [[SUB_LCSSA]], [[FOR_COND]] ]			; CHECK-NEXT: [[SUB_LCSSA_LCSSA:%.*]] = phi i32 [ [[SUB_LCSSA]], [[FOR_COND]] ]
	; CHECK-NEXT: ret i32 [[SUB_LCSSA_LCSSA]]			; CHECK-NEXT: ret i32 [[SUB_LCSSA_LCSSA]]
	;			;
	entry:			entry:
	Show All 25 Lines

llvm/test/Transforms/LoopVectorize/first-order-recurrence.ll

This file is larger than 256 KB, so syntax highlighting is disabled by default.

	Show First 20 Lines • Show All 94 Lines • ▼ Show 20 Lines
	; UNROLL-NO-VF-NEXT: [[MIN_ITERS_CHECK:%.*]] = icmp ult i64 [[TMP2]], 2			; UNROLL-NO-VF-NEXT: [[MIN_ITERS_CHECK:%.*]] = icmp ult i64 [[TMP2]], 2
	; UNROLL-NO-VF-NEXT: br i1 [[MIN_ITERS_CHECK]], label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]			; UNROLL-NO-VF-NEXT: br i1 [[MIN_ITERS_CHECK]], label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]
	; UNROLL-NO-VF: vector.ph:			; UNROLL-NO-VF: vector.ph:
	; UNROLL-NO-VF-NEXT: [[N_MOD_VF:%.*]] = urem i64 [[TMP2]], 2			; UNROLL-NO-VF-NEXT: [[N_MOD_VF:%.*]] = urem i64 [[TMP2]], 2
	; UNROLL-NO-VF-NEXT: [[N_VEC:%.*]] = sub i64 [[TMP2]], [[N_MOD_VF]]			; UNROLL-NO-VF-NEXT: [[N_VEC:%.*]] = sub i64 [[TMP2]], [[N_MOD_VF]]
	; UNROLL-NO-VF-NEXT: br label [[VECTOR_BODY:%.*]]			; UNROLL-NO-VF-NEXT: br label [[VECTOR_BODY:%.*]]
	; UNROLL-NO-VF: vector.body:			; UNROLL-NO-VF: vector.body:
	; UNROLL-NO-VF-NEXT: [[INDEX:%.]] = phi i64 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[VECTOR_BODY]] ]			; UNROLL-NO-VF-NEXT: [[INDEX:%.]] = phi i64 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[VECTOR_BODY]] ]
	; UNROLL-NO-VF-NEXT: [[VECTOR_RECUR:%.]] = phi i32 [ [[PRE_LOAD]], [[VECTOR_PH]] ], [ [[TMP8:%.]], [[VECTOR_BODY]] ]			; UNROLL-NO-VF-NEXT: [[VECTOR_RECUR:%.]] = phi i32 [ [[PRE_LOAD]], [[VECTOR_PH]] ], [ [[TMP10:%.]], [[VECTOR_BODY]] ]
	; UNROLL-NO-VF-NEXT: [[INDUCTION:%.*]] = add i64 [[INDEX]], 0			; UNROLL-NO-VF-NEXT: [[TMP3:%.*]] = add i64 [[INDEX]], 0
	; UNROLL-NO-VF-NEXT: [[INDUCTION1:%.*]] = add i64 [[INDEX]], 1			; UNROLL-NO-VF-NEXT: [[TMP4:%.*]] = add i64 [[INDEX]], 1
	; UNROLL-NO-VF-NEXT: [[TMP3:%.*]] = add nuw nsw i64 [[INDUCTION]], 1			; UNROLL-NO-VF-NEXT: [[TMP5:%.*]] = add nuw nsw i64 [[TMP3]], 1
	; UNROLL-NO-VF-NEXT: [[TMP4:%.*]] = add nuw nsw i64 [[INDUCTION1]], 1			; UNROLL-NO-VF-NEXT: [[TMP6:%.*]] = add nuw nsw i64 [[TMP4]], 1
	; UNROLL-NO-VF-NEXT: [[TMP5:%.]] = getelementptr inbounds i32, i32 [[A]], i64 [[TMP3]]			; UNROLL-NO-VF-NEXT: [[TMP7:%.]] = getelementptr inbounds i32, i32 [[A]], i64 [[TMP5]]
	; UNROLL-NO-VF-NEXT: [[TMP6:%.]] = getelementptr inbounds i32, i32 [[A]], i64 [[TMP4]]			; UNROLL-NO-VF-NEXT: [[TMP8:%.]] = getelementptr inbounds i32, i32 [[A]], i64 [[TMP6]]
	; UNROLL-NO-VF-NEXT: [[TMP7:%.]] = load i32, i32 [[TMP5]], align 4			; UNROLL-NO-VF-NEXT: [[TMP9:%.]] = load i32, i32 [[TMP7]], align 4
	; UNROLL-NO-VF-NEXT: [[TMP8]] = load i32, i32* [[TMP6]], align 4			; UNROLL-NO-VF-NEXT: [[TMP10]] = load i32, i32* [[TMP8]], align 4
	; UNROLL-NO-VF-NEXT: [[TMP9:%.]] = getelementptr inbounds i32, i32 [[B:%.*]], i64 [[INDUCTION]]			; UNROLL-NO-VF-NEXT: [[TMP11:%.]] = getelementptr inbounds i32, i32 [[B:%.*]], i64 [[TMP3]]
	; UNROLL-NO-VF-NEXT: [[TMP10:%.]] = getelementptr inbounds i32, i32 [[B]], i64 [[INDUCTION1]]			; UNROLL-NO-VF-NEXT: [[TMP12:%.]] = getelementptr inbounds i32, i32 [[B]], i64 [[TMP4]]
	; UNROLL-NO-VF-NEXT: [[TMP11:%.*]] = add i32 [[TMP7]], [[VECTOR_RECUR]]			; UNROLL-NO-VF-NEXT: [[TMP13:%.*]] = add i32 [[TMP9]], [[VECTOR_RECUR]]
	; UNROLL-NO-VF-NEXT: [[TMP12:%.*]] = add i32 [[TMP8]], [[TMP7]]			; UNROLL-NO-VF-NEXT: [[TMP14:%.*]] = add i32 [[TMP10]], [[TMP9]]
	; UNROLL-NO-VF-NEXT: store i32 [[TMP11]], i32* [[TMP9]], align 4			; UNROLL-NO-VF-NEXT: store i32 [[TMP13]], i32* [[TMP11]], align 4
	; UNROLL-NO-VF-NEXT: store i32 [[TMP12]], i32* [[TMP10]], align 4			; UNROLL-NO-VF-NEXT: store i32 [[TMP14]], i32* [[TMP12]], align 4
	; UNROLL-NO-VF-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 2			; UNROLL-NO-VF-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 2
	; UNROLL-NO-VF-NEXT: [[TMP13:%.*]] = icmp eq i64 [[INDEX_NEXT]], [[N_VEC]]			; UNROLL-NO-VF-NEXT: [[TMP15:%.*]] = icmp eq i64 [[INDEX_NEXT]], [[N_VEC]]
	; UNROLL-NO-VF-NEXT: br i1 [[TMP13]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP0:![0-9]+]]			; UNROLL-NO-VF-NEXT: br i1 [[TMP15]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP0:![0-9]+]]
	; UNROLL-NO-VF: middle.block:			; UNROLL-NO-VF: middle.block:
	; UNROLL-NO-VF-NEXT: [[CMP_N:%.*]] = icmp eq i64 [[TMP2]], [[N_VEC]]			; UNROLL-NO-VF-NEXT: [[CMP_N:%.*]] = icmp eq i64 [[TMP2]], [[N_VEC]]
	; UNROLL-NO-VF-NEXT: br i1 [[CMP_N]], label [[FOR_EXIT:%.*]], label [[SCALAR_PH]]			; UNROLL-NO-VF-NEXT: br i1 [[CMP_N]], label [[FOR_EXIT:%.*]], label [[SCALAR_PH]]
	; UNROLL-NO-VF: scalar.ph:			; UNROLL-NO-VF: scalar.ph:
	; UNROLL-NO-VF-NEXT: [[SCALAR_RECUR_INIT:%.*]] = phi i32 [ [[PRE_LOAD]], [[FOR_PREHEADER]] ], [ [[TMP8]], [[MIDDLE_BLOCK]] ]			; UNROLL-NO-VF-NEXT: [[SCALAR_RECUR_INIT:%.*]] = phi i32 [ [[PRE_LOAD]], [[FOR_PREHEADER]] ], [ [[TMP10]], [[MIDDLE_BLOCK]] ]
	; UNROLL-NO-VF-NEXT: [[BC_RESUME_VAL:%.*]] = phi i64 [ [[N_VEC]], [[MIDDLE_BLOCK]] ], [ 0, [[FOR_PREHEADER]] ]			; UNROLL-NO-VF-NEXT: [[BC_RESUME_VAL:%.*]] = phi i64 [ [[N_VEC]], [[MIDDLE_BLOCK]] ], [ 0, [[FOR_PREHEADER]] ]
	; UNROLL-NO-VF-NEXT: br label [[SCALAR_BODY:%.*]]			; UNROLL-NO-VF-NEXT: br label [[SCALAR_BODY:%.*]]
	; UNROLL-NO-VF: scalar.body:			; UNROLL-NO-VF: scalar.body:
	; UNROLL-NO-VF-NEXT: [[SCALAR_RECUR:%.]] = phi i32 [ [[SCALAR_RECUR_INIT]], [[SCALAR_PH]] ], [ [[TMP14:%.]], [[SCALAR_BODY]] ]			; UNROLL-NO-VF-NEXT: [[SCALAR_RECUR:%.]] = phi i32 [ [[SCALAR_RECUR_INIT]], [[SCALAR_PH]] ], [ [[TMP16:%.]], [[SCALAR_BODY]] ]
	; UNROLL-NO-VF-NEXT: [[INDVARS_IV:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[INDVARS_IV_NEXT:%.]], [[SCALAR_BODY]] ]			; UNROLL-NO-VF-NEXT: [[INDVARS_IV:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[INDVARS_IV_NEXT:%.]], [[SCALAR_BODY]] ]
	; UNROLL-NO-VF-NEXT: [[INDVARS_IV_NEXT]] = add nuw nsw i64 [[INDVARS_IV]], 1			; UNROLL-NO-VF-NEXT: [[INDVARS_IV_NEXT]] = add nuw nsw i64 [[INDVARS_IV]], 1
	; UNROLL-NO-VF-NEXT: [[ARRAYIDX32:%.]] = getelementptr inbounds i32, i32 [[A]], i64 [[INDVARS_IV_NEXT]]			; UNROLL-NO-VF-NEXT: [[ARRAYIDX32:%.]] = getelementptr inbounds i32, i32 [[A]], i64 [[INDVARS_IV_NEXT]]
	; UNROLL-NO-VF-NEXT: [[TMP14]] = load i32, i32* [[ARRAYIDX32]], align 4			; UNROLL-NO-VF-NEXT: [[TMP16]] = load i32, i32* [[ARRAYIDX32]], align 4
	; UNROLL-NO-VF-NEXT: [[ARRAYIDX34:%.]] = getelementptr inbounds i32, i32 [[B]], i64 [[INDVARS_IV]]			; UNROLL-NO-VF-NEXT: [[ARRAYIDX34:%.]] = getelementptr inbounds i32, i32 [[B]], i64 [[INDVARS_IV]]
	; UNROLL-NO-VF-NEXT: [[ADD35:%.*]] = add i32 [[TMP14]], [[SCALAR_RECUR]]			; UNROLL-NO-VF-NEXT: [[ADD35:%.*]] = add i32 [[TMP16]], [[SCALAR_RECUR]]
	; UNROLL-NO-VF-NEXT: store i32 [[ADD35]], i32* [[ARRAYIDX34]], align 4			; UNROLL-NO-VF-NEXT: store i32 [[ADD35]], i32* [[ARRAYIDX34]], align 4
	; UNROLL-NO-VF-NEXT: [[LFTR_WIDEIV:%.*]] = trunc i64 [[INDVARS_IV_NEXT]] to i32			; UNROLL-NO-VF-NEXT: [[LFTR_WIDEIV:%.*]] = trunc i64 [[INDVARS_IV_NEXT]] to i32
	; UNROLL-NO-VF-NEXT: [[EXITCOND:%.*]] = icmp eq i32 [[LFTR_WIDEIV]], [[N]]			; UNROLL-NO-VF-NEXT: [[EXITCOND:%.*]] = icmp eq i32 [[LFTR_WIDEIV]], [[N]]
	; UNROLL-NO-VF-NEXT: br i1 [[EXITCOND]], label [[FOR_EXIT]], label [[SCALAR_BODY]], !llvm.loop [[LOOP2:![0-9]+]]			; UNROLL-NO-VF-NEXT: br i1 [[EXITCOND]], label [[FOR_EXIT]], label [[SCALAR_BODY]], !llvm.loop [[LOOP2:![0-9]+]]
	; UNROLL-NO-VF: for.exit:			; UNROLL-NO-VF: for.exit:
	; UNROLL-NO-VF-NEXT: ret void			; UNROLL-NO-VF-NEXT: ret void
	;			;
	; SINK-AFTER-LABEL: @recurrence_1(			; SINK-AFTER-LABEL: @recurrence_1(
	▲ Show 20 Lines • Show All 184 Lines • ▼ Show 20 Lines
	; UNROLL-NO-VF-NEXT: [[MIN_ITERS_CHECK:%.*]] = icmp ult i64 [[TMP2]], 2			; UNROLL-NO-VF-NEXT: [[MIN_ITERS_CHECK:%.*]] = icmp ult i64 [[TMP2]], 2
	; UNROLL-NO-VF-NEXT: br i1 [[MIN_ITERS_CHECK]], label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]			; UNROLL-NO-VF-NEXT: br i1 [[MIN_ITERS_CHECK]], label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]
	; UNROLL-NO-VF: vector.ph:			; UNROLL-NO-VF: vector.ph:
	; UNROLL-NO-VF-NEXT: [[N_MOD_VF:%.*]] = urem i64 [[TMP2]], 2			; UNROLL-NO-VF-NEXT: [[N_MOD_VF:%.*]] = urem i64 [[TMP2]], 2
	; UNROLL-NO-VF-NEXT: [[N_VEC:%.*]] = sub i64 [[TMP2]], [[N_MOD_VF]]			; UNROLL-NO-VF-NEXT: [[N_VEC:%.*]] = sub i64 [[TMP2]], [[N_MOD_VF]]
	; UNROLL-NO-VF-NEXT: br label [[VECTOR_BODY:%.*]]			; UNROLL-NO-VF-NEXT: br label [[VECTOR_BODY:%.*]]
	; UNROLL-NO-VF: vector.body:			; UNROLL-NO-VF: vector.body:
	; UNROLL-NO-VF-NEXT: [[INDEX:%.]] = phi i64 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[VECTOR_BODY]] ]			; UNROLL-NO-VF-NEXT: [[INDEX:%.]] = phi i64 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[VECTOR_BODY]] ]
	; UNROLL-NO-VF-NEXT: [[VECTOR_RECUR:%.]] = phi i32 [ [[DOTPRE]], [[VECTOR_PH]] ], [ [[TMP6:%.]], [[VECTOR_BODY]] ]			; UNROLL-NO-VF-NEXT: [[VECTOR_RECUR:%.]] = phi i32 [ [[DOTPRE]], [[VECTOR_PH]] ], [ [[TMP8:%.]], [[VECTOR_BODY]] ]
	; UNROLL-NO-VF-NEXT: [[VEC_PHI:%.]] = phi i32 [ poison, [[VECTOR_PH]] ], [ [[TMP15:%.]], [[VECTOR_BODY]] ]			; UNROLL-NO-VF-NEXT: [[VEC_PHI:%.]] = phi i32 [ poison, [[VECTOR_PH]] ], [ [[TMP17:%.]], [[VECTOR_BODY]] ]
	; UNROLL-NO-VF-NEXT: [[VEC_PHI1:%.]] = phi i32 [ poison, [[VECTOR_PH]] ], [ [[TMP16:%.]], [[VECTOR_BODY]] ]			; UNROLL-NO-VF-NEXT: [[VEC_PHI1:%.]] = phi i32 [ poison, [[VECTOR_PH]] ], [ [[TMP18:%.]], [[VECTOR_BODY]] ]
	; UNROLL-NO-VF-NEXT: [[INDUCTION:%.*]] = add i64 [[INDEX]], 0			; UNROLL-NO-VF-NEXT: [[TMP3:%.*]] = add i64 [[INDEX]], 0
	; UNROLL-NO-VF-NEXT: [[INDUCTION2:%.*]] = add i64 [[INDEX]], 1			; UNROLL-NO-VF-NEXT: [[TMP4:%.*]] = add i64 [[INDEX]], 1
	; UNROLL-NO-VF-NEXT: [[TMP3:%.]] = getelementptr inbounds i32, i32 [[A]], i64 [[INDUCTION]]			; UNROLL-NO-VF-NEXT: [[TMP5:%.]] = getelementptr inbounds i32, i32 [[A]], i64 [[TMP3]]
	; UNROLL-NO-VF-NEXT: [[TMP4:%.]] = getelementptr inbounds i32, i32 [[A]], i64 [[INDUCTION2]]			; UNROLL-NO-VF-NEXT: [[TMP6:%.]] = getelementptr inbounds i32, i32 [[A]], i64 [[TMP4]]
	; UNROLL-NO-VF-NEXT: [[TMP5:%.]] = load i32, i32 [[TMP3]], align 4			; UNROLL-NO-VF-NEXT: [[TMP7:%.]] = load i32, i32 [[TMP5]], align 4
	; UNROLL-NO-VF-NEXT: [[TMP6]] = load i32, i32* [[TMP4]], align 4			; UNROLL-NO-VF-NEXT: [[TMP8]] = load i32, i32* [[TMP6]], align 4
	; UNROLL-NO-VF-NEXT: [[TMP7:%.*]] = sub nsw i32 [[TMP5]], [[VECTOR_RECUR]]			; UNROLL-NO-VF-NEXT: [[TMP9:%.*]] = sub nsw i32 [[TMP7]], [[VECTOR_RECUR]]
	; UNROLL-NO-VF-NEXT: [[TMP8:%.*]] = sub nsw i32 [[TMP6]], [[TMP5]]			; UNROLL-NO-VF-NEXT: [[TMP10:%.*]] = sub nsw i32 [[TMP8]], [[TMP7]]
	; UNROLL-NO-VF-NEXT: [[TMP9:%.*]] = icmp sgt i32 [[TMP7]], 0			; UNROLL-NO-VF-NEXT: [[TMP11:%.*]] = icmp sgt i32 [[TMP9]], 0
	; UNROLL-NO-VF-NEXT: [[TMP10:%.*]] = icmp sgt i32 [[TMP8]], 0			; UNROLL-NO-VF-NEXT: [[TMP12:%.*]] = icmp sgt i32 [[TMP10]], 0
	; UNROLL-NO-VF-NEXT: [[TMP11:%.*]] = select i1 [[TMP9]], i32 [[TMP7]], i32 0			; UNROLL-NO-VF-NEXT: [[TMP13:%.*]] = select i1 [[TMP11]], i32 [[TMP9]], i32 0
	; UNROLL-NO-VF-NEXT: [[TMP12:%.*]] = select i1 [[TMP10]], i32 [[TMP8]], i32 0			; UNROLL-NO-VF-NEXT: [[TMP14:%.*]] = select i1 [[TMP12]], i32 [[TMP10]], i32 0
	; UNROLL-NO-VF-NEXT: [[TMP13:%.*]] = icmp slt i32 [[VEC_PHI]], [[TMP11]]			; UNROLL-NO-VF-NEXT: [[TMP15:%.*]] = icmp slt i32 [[VEC_PHI]], [[TMP13]]
	; UNROLL-NO-VF-NEXT: [[TMP14:%.*]] = icmp slt i32 [[VEC_PHI1]], [[TMP12]]			; UNROLL-NO-VF-NEXT: [[TMP16:%.*]] = icmp slt i32 [[VEC_PHI1]], [[TMP14]]
	; UNROLL-NO-VF-NEXT: [[TMP15]] = select i1 [[TMP13]], i32 [[VEC_PHI]], i32 [[TMP11]]			; UNROLL-NO-VF-NEXT: [[TMP17]] = select i1 [[TMP15]], i32 [[VEC_PHI]], i32 [[TMP13]]
	; UNROLL-NO-VF-NEXT: [[TMP16]] = select i1 [[TMP14]], i32 [[VEC_PHI1]], i32 [[TMP12]]			; UNROLL-NO-VF-NEXT: [[TMP18]] = select i1 [[TMP16]], i32 [[VEC_PHI1]], i32 [[TMP14]]
	; UNROLL-NO-VF-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 2			; UNROLL-NO-VF-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 2
	; UNROLL-NO-VF-NEXT: [[TMP17:%.*]] = icmp eq i64 [[INDEX_NEXT]], [[N_VEC]]			; UNROLL-NO-VF-NEXT: [[TMP19:%.*]] = icmp eq i64 [[INDEX_NEXT]], [[N_VEC]]
	; UNROLL-NO-VF-NEXT: br i1 [[TMP17]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP3:![0-9]+]]			; UNROLL-NO-VF-NEXT: br i1 [[TMP19]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP3:![0-9]+]]
	; UNROLL-NO-VF: middle.block:			; UNROLL-NO-VF: middle.block:
	; UNROLL-NO-VF-NEXT: [[RDX_MINMAX_CMP:%.*]] = icmp slt i32 [[TMP15]], [[TMP16]]			; UNROLL-NO-VF-NEXT: [[RDX_MINMAX_CMP:%.*]] = icmp slt i32 [[TMP17]], [[TMP18]]
	; UNROLL-NO-VF-NEXT: [[RDX_MINMAX_SELECT:%.*]] = select i1 [[RDX_MINMAX_CMP]], i32 [[TMP15]], i32 [[TMP16]]			; UNROLL-NO-VF-NEXT: [[RDX_MINMAX_SELECT:%.*]] = select i1 [[RDX_MINMAX_CMP]], i32 [[TMP17]], i32 [[TMP18]]
	; UNROLL-NO-VF-NEXT: [[CMP_N:%.*]] = icmp eq i64 [[TMP2]], [[N_VEC]]			; UNROLL-NO-VF-NEXT: [[CMP_N:%.*]] = icmp eq i64 [[TMP2]], [[N_VEC]]
	; UNROLL-NO-VF-NEXT: br i1 [[CMP_N]], label [[FOR_COND_CLEANUP_LOOPEXIT:%.*]], label [[SCALAR_PH]]			; UNROLL-NO-VF-NEXT: br i1 [[CMP_N]], label [[FOR_COND_CLEANUP_LOOPEXIT:%.*]], label [[SCALAR_PH]]
	; UNROLL-NO-VF: scalar.ph:			; UNROLL-NO-VF: scalar.ph:
	; UNROLL-NO-VF-NEXT: [[SCALAR_RECUR_INIT:%.*]] = phi i32 [ [[DOTPRE]], [[FOR_PREHEADER]] ], [ [[TMP6]], [[MIDDLE_BLOCK]] ]			; UNROLL-NO-VF-NEXT: [[SCALAR_RECUR_INIT:%.*]] = phi i32 [ [[DOTPRE]], [[FOR_PREHEADER]] ], [ [[TMP8]], [[MIDDLE_BLOCK]] ]
	; UNROLL-NO-VF-NEXT: [[BC_RESUME_VAL:%.*]] = phi i64 [ [[N_VEC]], [[MIDDLE_BLOCK]] ], [ 0, [[FOR_PREHEADER]] ]			; UNROLL-NO-VF-NEXT: [[BC_RESUME_VAL:%.*]] = phi i64 [ [[N_VEC]], [[MIDDLE_BLOCK]] ], [ 0, [[FOR_PREHEADER]] ]
	; UNROLL-NO-VF-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ poison, [[FOR_PREHEADER]] ], [ [[RDX_MINMAX_SELECT]], [[MIDDLE_BLOCK]] ]			; UNROLL-NO-VF-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ poison, [[FOR_PREHEADER]] ], [ [[RDX_MINMAX_SELECT]], [[MIDDLE_BLOCK]] ]
	; UNROLL-NO-VF-NEXT: br label [[SCALAR_BODY:%.*]]			; UNROLL-NO-VF-NEXT: br label [[SCALAR_BODY:%.*]]
	; UNROLL-NO-VF: for.cond.cleanup.loopexit:			; UNROLL-NO-VF: for.cond.cleanup.loopexit:
	; UNROLL-NO-VF-NEXT: [[MINMAX_0_COND_LCSSA:%.]] = phi i32 [ [[MINMAX_0_COND:%.]], [[SCALAR_BODY]] ], [ [[RDX_MINMAX_SELECT]], [[MIDDLE_BLOCK]] ]			; UNROLL-NO-VF-NEXT: [[MINMAX_0_COND_LCSSA:%.]] = phi i32 [ [[MINMAX_0_COND:%.]], [[SCALAR_BODY]] ], [ [[RDX_MINMAX_SELECT]], [[MIDDLE_BLOCK]] ]
	; UNROLL-NO-VF-NEXT: br label [[FOR_COND_CLEANUP]]			; UNROLL-NO-VF-NEXT: br label [[FOR_COND_CLEANUP]]
	; UNROLL-NO-VF: for.cond.cleanup:			; UNROLL-NO-VF: for.cond.cleanup:
	; UNROLL-NO-VF-NEXT: [[MINMAX_0_LCSSA:%.]] = phi i32 [ poison, [[ENTRY:%.]] ], [ [[MINMAX_0_COND_LCSSA]], [[FOR_COND_CLEANUP_LOOPEXIT]] ]			; UNROLL-NO-VF-NEXT: [[MINMAX_0_LCSSA:%.]] = phi i32 [ poison, [[ENTRY:%.]] ], [ [[MINMAX_0_COND_LCSSA]], [[FOR_COND_CLEANUP_LOOPEXIT]] ]
	; UNROLL-NO-VF-NEXT: ret i32 [[MINMAX_0_LCSSA]]			; UNROLL-NO-VF-NEXT: ret i32 [[MINMAX_0_LCSSA]]
	; UNROLL-NO-VF: scalar.body:			; UNROLL-NO-VF: scalar.body:
	; UNROLL-NO-VF-NEXT: [[SCALAR_RECUR:%.]] = phi i32 [ [[SCALAR_RECUR_INIT]], [[SCALAR_PH]] ], [ [[TMP18:%.]], [[SCALAR_BODY]] ]			; UNROLL-NO-VF-NEXT: [[SCALAR_RECUR:%.]] = phi i32 [ [[SCALAR_RECUR_INIT]], [[SCALAR_PH]] ], [ [[TMP20:%.]], [[SCALAR_BODY]] ]
	; UNROLL-NO-VF-NEXT: [[INDVARS_IV:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[INDVARS_IV_NEXT:%.]], [[SCALAR_BODY]] ]			; UNROLL-NO-VF-NEXT: [[INDVARS_IV:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[INDVARS_IV_NEXT:%.]], [[SCALAR_BODY]] ]
	; UNROLL-NO-VF-NEXT: [[MINMAX_028:%.*]] = phi i32 [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[MINMAX_0_COND]], [[SCALAR_BODY]] ]			; UNROLL-NO-VF-NEXT: [[MINMAX_028:%.*]] = phi i32 [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[MINMAX_0_COND]], [[SCALAR_BODY]] ]
	; UNROLL-NO-VF-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds i32, i32 [[A]], i64 [[INDVARS_IV]]			; UNROLL-NO-VF-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds i32, i32 [[A]], i64 [[INDVARS_IV]]
	; UNROLL-NO-VF-NEXT: [[TMP18]] = load i32, i32* [[ARRAYIDX]], align 4			; UNROLL-NO-VF-NEXT: [[TMP20]] = load i32, i32* [[ARRAYIDX]], align 4
	; UNROLL-NO-VF-NEXT: [[SUB3:%.*]] = sub nsw i32 [[TMP18]], [[SCALAR_RECUR]]			; UNROLL-NO-VF-NEXT: [[SUB3:%.*]] = sub nsw i32 [[TMP20]], [[SCALAR_RECUR]]
	; UNROLL-NO-VF-NEXT: [[CMP4:%.*]] = icmp sgt i32 [[SUB3]], 0			; UNROLL-NO-VF-NEXT: [[CMP4:%.*]] = icmp sgt i32 [[SUB3]], 0
	; UNROLL-NO-VF-NEXT: [[COND:%.*]] = select i1 [[CMP4]], i32 [[SUB3]], i32 0			; UNROLL-NO-VF-NEXT: [[COND:%.*]] = select i1 [[CMP4]], i32 [[SUB3]], i32 0
	; UNROLL-NO-VF-NEXT: [[CMP5:%.*]] = icmp slt i32 [[MINMAX_028]], [[COND]]			; UNROLL-NO-VF-NEXT: [[CMP5:%.*]] = icmp slt i32 [[MINMAX_028]], [[COND]]
	; UNROLL-NO-VF-NEXT: [[MINMAX_0_COND]] = select i1 [[CMP5]], i32 [[MINMAX_028]], i32 [[COND]]			; UNROLL-NO-VF-NEXT: [[MINMAX_0_COND]] = select i1 [[CMP5]], i32 [[MINMAX_028]], i32 [[COND]]
	; UNROLL-NO-VF-NEXT: [[INDVARS_IV_NEXT]] = add nuw nsw i64 [[INDVARS_IV]], 1			; UNROLL-NO-VF-NEXT: [[INDVARS_IV_NEXT]] = add nuw nsw i64 [[INDVARS_IV]], 1
	; UNROLL-NO-VF-NEXT: [[LFTR_WIDEIV:%.*]] = trunc i64 [[INDVARS_IV_NEXT]] to i32			; UNROLL-NO-VF-NEXT: [[LFTR_WIDEIV:%.*]] = trunc i64 [[INDVARS_IV_NEXT]] to i32
	; UNROLL-NO-VF-NEXT: [[EXITCOND:%.*]] = icmp eq i32 [[LFTR_WIDEIV]], [[N]]			; UNROLL-NO-VF-NEXT: [[EXITCOND:%.*]] = icmp eq i32 [[LFTR_WIDEIV]], [[N]]
	; UNROLL-NO-VF-NEXT: br i1 [[EXITCOND]], label [[FOR_COND_CLEANUP_LOOPEXIT]], label [[SCALAR_BODY]], !llvm.loop [[LOOP4:![0-9]+]]			; UNROLL-NO-VF-NEXT: br i1 [[EXITCOND]], label [[FOR_COND_CLEANUP_LOOPEXIT]], label [[SCALAR_BODY]], !llvm.loop [[LOOP4:![0-9]+]]
	▲ Show 20 Lines • Show All 220 Lines • ▼ Show 20 Lines
	; UNROLL-NO-VF-NEXT: br i1 [[MIN_ITERS_CHECK]], label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]			; UNROLL-NO-VF-NEXT: br i1 [[MIN_ITERS_CHECK]], label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]
	; UNROLL-NO-VF: vector.ph:			; UNROLL-NO-VF: vector.ph:
	; UNROLL-NO-VF-NEXT: [[N_MOD_VF:%.*]] = urem i64 [[TMP3]], 2			; UNROLL-NO-VF-NEXT: [[N_MOD_VF:%.*]] = urem i64 [[TMP3]], 2
	; UNROLL-NO-VF-NEXT: [[N_VEC:%.*]] = sub i64 [[TMP3]], [[N_MOD_VF]]			; UNROLL-NO-VF-NEXT: [[N_VEC:%.*]] = sub i64 [[TMP3]], [[N_MOD_VF]]
	; UNROLL-NO-VF-NEXT: [[IND_END:%.*]] = add i64 1, [[N_VEC]]			; UNROLL-NO-VF-NEXT: [[IND_END:%.*]] = add i64 1, [[N_VEC]]
	; UNROLL-NO-VF-NEXT: br label [[VECTOR_BODY:%.*]]			; UNROLL-NO-VF-NEXT: br label [[VECTOR_BODY:%.*]]
	; UNROLL-NO-VF: vector.body:			; UNROLL-NO-VF: vector.body:
	; UNROLL-NO-VF-NEXT: [[INDEX:%.]] = phi i64 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[VECTOR_BODY]] ]			; UNROLL-NO-VF-NEXT: [[INDEX:%.]] = phi i64 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[VECTOR_BODY]] ]
	; UNROLL-NO-VF-NEXT: [[VECTOR_RECUR:%.]] = phi i16 [ [[TMP0]], [[VECTOR_PH]] ], [ [[TMP7:%.]], [[VECTOR_BODY]] ]			; UNROLL-NO-VF-NEXT: [[VECTOR_RECUR:%.]] = phi i16 [ [[TMP0]], [[VECTOR_PH]] ], [ [[TMP9:%.]], [[VECTOR_BODY]] ]
	; UNROLL-NO-VF-NEXT: [[OFFSET_IDX:%.*]] = add i64 1, [[INDEX]]			; UNROLL-NO-VF-NEXT: [[OFFSET_IDX:%.*]] = add i64 1, [[INDEX]]
	; UNROLL-NO-VF-NEXT: [[INDUCTION:%.*]] = add i64 [[OFFSET_IDX]], 0			; UNROLL-NO-VF-NEXT: [[TMP4:%.*]] = add i64 [[OFFSET_IDX]], 0
	; UNROLL-NO-VF-NEXT: [[INDUCTION1:%.*]] = add i64 [[OFFSET_IDX]], 1			; UNROLL-NO-VF-NEXT: [[TMP5:%.*]] = add i64 [[OFFSET_IDX]], 1
	; UNROLL-NO-VF-NEXT: [[TMP4:%.]] = getelementptr inbounds i16, i16 [[A]], i64 [[INDUCTION]]			; UNROLL-NO-VF-NEXT: [[TMP6:%.]] = getelementptr inbounds i16, i16 [[A]], i64 [[TMP4]]
	; UNROLL-NO-VF-NEXT: [[TMP5:%.]] = getelementptr inbounds i16, i16 [[A]], i64 [[INDUCTION1]]			; UNROLL-NO-VF-NEXT: [[TMP7:%.]] = getelementptr inbounds i16, i16 [[A]], i64 [[TMP5]]
	; UNROLL-NO-VF-NEXT: [[TMP6:%.]] = load i16, i16 [[TMP4]], align 2			; UNROLL-NO-VF-NEXT: [[TMP8:%.]] = load i16, i16 [[TMP6]], align 2
	; UNROLL-NO-VF-NEXT: [[TMP7]] = load i16, i16* [[TMP5]], align 2			; UNROLL-NO-VF-NEXT: [[TMP9]] = load i16, i16* [[TMP7]], align 2
	; UNROLL-NO-VF-NEXT: [[TMP8:%.*]] = sitofp i16 [[TMP6]] to double			; UNROLL-NO-VF-NEXT: [[TMP10:%.*]] = sitofp i16 [[TMP8]] to double
	; UNROLL-NO-VF-NEXT: [[TMP9:%.*]] = sitofp i16 [[TMP7]] to double			; UNROLL-NO-VF-NEXT: [[TMP11:%.*]] = sitofp i16 [[TMP9]] to double
	; UNROLL-NO-VF-NEXT: [[TMP10:%.*]] = sitofp i16 [[VECTOR_RECUR]] to double			; UNROLL-NO-VF-NEXT: [[TMP12:%.*]] = sitofp i16 [[VECTOR_RECUR]] to double
	; UNROLL-NO-VF-NEXT: [[TMP11:%.*]] = sitofp i16 [[TMP6]] to double			; UNROLL-NO-VF-NEXT: [[TMP13:%.*]] = sitofp i16 [[TMP8]] to double
	; UNROLL-NO-VF-NEXT: [[TMP12:%.*]] = fmul fast double [[TMP10]], [[CONV1]]			; UNROLL-NO-VF-NEXT: [[TMP14:%.*]] = fmul fast double [[TMP12]], [[CONV1]]
	; UNROLL-NO-VF-NEXT: [[TMP13:%.*]] = fmul fast double [[TMP11]], [[CONV1]]			; UNROLL-NO-VF-NEXT: [[TMP15:%.*]] = fmul fast double [[TMP13]], [[CONV1]]
	; UNROLL-NO-VF-NEXT: [[TMP14:%.*]] = fsub fast double [[TMP8]], [[TMP12]]			; UNROLL-NO-VF-NEXT: [[TMP16:%.*]] = fsub fast double [[TMP10]], [[TMP14]]
	; UNROLL-NO-VF-NEXT: [[TMP15:%.*]] = fsub fast double [[TMP9]], [[TMP13]]			; UNROLL-NO-VF-NEXT: [[TMP17:%.*]] = fsub fast double [[TMP11]], [[TMP15]]
	; UNROLL-NO-VF-NEXT: [[TMP16:%.]] = getelementptr inbounds double, double [[B]], i64 [[INDUCTION]]			; UNROLL-NO-VF-NEXT: [[TMP18:%.]] = getelementptr inbounds double, double [[B]], i64 [[TMP4]]
	; UNROLL-NO-VF-NEXT: [[TMP17:%.]] = getelementptr inbounds double, double [[B]], i64 [[INDUCTION1]]			; UNROLL-NO-VF-NEXT: [[TMP19:%.]] = getelementptr inbounds double, double [[B]], i64 [[TMP5]]
	; UNROLL-NO-VF-NEXT: store double [[TMP14]], double* [[TMP16]], align 8			; UNROLL-NO-VF-NEXT: store double [[TMP16]], double* [[TMP18]], align 8
	; UNROLL-NO-VF-NEXT: store double [[TMP15]], double* [[TMP17]], align 8			; UNROLL-NO-VF-NEXT: store double [[TMP17]], double* [[TMP19]], align 8
	; UNROLL-NO-VF-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 2			; UNROLL-NO-VF-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 2
	; UNROLL-NO-VF-NEXT: [[TMP18:%.*]] = icmp eq i64 [[INDEX_NEXT]], [[N_VEC]]			; UNROLL-NO-VF-NEXT: [[TMP20:%.*]] = icmp eq i64 [[INDEX_NEXT]], [[N_VEC]]
	; UNROLL-NO-VF-NEXT: br i1 [[TMP18]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP5:![0-9]+]]			; UNROLL-NO-VF-NEXT: br i1 [[TMP20]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP5:![0-9]+]]
	; UNROLL-NO-VF: middle.block:			; UNROLL-NO-VF: middle.block:
	; UNROLL-NO-VF-NEXT: [[CMP_N:%.*]] = icmp eq i64 [[TMP3]], [[N_VEC]]			; UNROLL-NO-VF-NEXT: [[CMP_N:%.*]] = icmp eq i64 [[TMP3]], [[N_VEC]]
	; UNROLL-NO-VF-NEXT: br i1 [[CMP_N]], label [[FOR_END_LOOPEXIT:%.*]], label [[SCALAR_PH]]			; UNROLL-NO-VF-NEXT: br i1 [[CMP_N]], label [[FOR_END_LOOPEXIT:%.*]], label [[SCALAR_PH]]
	; UNROLL-NO-VF: scalar.ph:			; UNROLL-NO-VF: scalar.ph:
	; UNROLL-NO-VF-NEXT: [[SCALAR_RECUR_INIT:%.*]] = phi i16 [ [[TMP0]], [[FOR_PREHEADER]] ], [ [[TMP7]], [[MIDDLE_BLOCK]] ]			; UNROLL-NO-VF-NEXT: [[SCALAR_RECUR_INIT:%.*]] = phi i16 [ [[TMP0]], [[FOR_PREHEADER]] ], [ [[TMP9]], [[MIDDLE_BLOCK]] ]
	; UNROLL-NO-VF-NEXT: [[BC_RESUME_VAL:%.*]] = phi i64 [ [[IND_END]], [[MIDDLE_BLOCK]] ], [ 1, [[FOR_PREHEADER]] ]			; UNROLL-NO-VF-NEXT: [[BC_RESUME_VAL:%.*]] = phi i64 [ [[IND_END]], [[MIDDLE_BLOCK]] ], [ 1, [[FOR_PREHEADER]] ]
	; UNROLL-NO-VF-NEXT: br label [[SCALAR_BODY:%.*]]			; UNROLL-NO-VF-NEXT: br label [[SCALAR_BODY:%.*]]
	; UNROLL-NO-VF: scalar.body:			; UNROLL-NO-VF: scalar.body:
	; UNROLL-NO-VF-NEXT: [[SCALAR_RECUR:%.]] = phi i16 [ [[SCALAR_RECUR_INIT]], [[SCALAR_PH]] ], [ [[TMP19:%.]], [[SCALAR_BODY]] ]			; UNROLL-NO-VF-NEXT: [[SCALAR_RECUR:%.]] = phi i16 [ [[SCALAR_RECUR_INIT]], [[SCALAR_PH]] ], [ [[TMP21:%.]], [[SCALAR_BODY]] ]
	; UNROLL-NO-VF-NEXT: [[ADVARS_IV:%.]] = phi i64 [ [[ADVARS_IV_NEXT:%.]], [[SCALAR_BODY]] ], [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ]			; UNROLL-NO-VF-NEXT: [[ADVARS_IV:%.]] = phi i64 [ [[ADVARS_IV_NEXT:%.]], [[SCALAR_BODY]] ], [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ]
	; UNROLL-NO-VF-NEXT: [[ARRAYIDX5:%.]] = getelementptr inbounds i16, i16 [[A]], i64 [[ADVARS_IV]]			; UNROLL-NO-VF-NEXT: [[ARRAYIDX5:%.]] = getelementptr inbounds i16, i16 [[A]], i64 [[ADVARS_IV]]
	; UNROLL-NO-VF-NEXT: [[TMP19]] = load i16, i16* [[ARRAYIDX5]], align 2			; UNROLL-NO-VF-NEXT: [[TMP21]] = load i16, i16* [[ARRAYIDX5]], align 2
	; UNROLL-NO-VF-NEXT: [[CONV6:%.*]] = sitofp i16 [[TMP19]] to double			; UNROLL-NO-VF-NEXT: [[CONV6:%.*]] = sitofp i16 [[TMP21]] to double
	; UNROLL-NO-VF-NEXT: [[CONV11:%.*]] = sitofp i16 [[SCALAR_RECUR]] to double			; UNROLL-NO-VF-NEXT: [[CONV11:%.*]] = sitofp i16 [[SCALAR_RECUR]] to double
	; UNROLL-NO-VF-NEXT: [[MUL12:%.*]] = fmul fast double [[CONV11]], [[CONV1]]			; UNROLL-NO-VF-NEXT: [[MUL12:%.*]] = fmul fast double [[CONV11]], [[CONV1]]
	; UNROLL-NO-VF-NEXT: [[SUB13:%.*]] = fsub fast double [[CONV6]], [[MUL12]]			; UNROLL-NO-VF-NEXT: [[SUB13:%.*]] = fsub fast double [[CONV6]], [[MUL12]]
	; UNROLL-NO-VF-NEXT: [[ARRAYIDX15:%.]] = getelementptr inbounds double, double [[B]], i64 [[ADVARS_IV]]			; UNROLL-NO-VF-NEXT: [[ARRAYIDX15:%.]] = getelementptr inbounds double, double [[B]], i64 [[ADVARS_IV]]
	; UNROLL-NO-VF-NEXT: store double [[SUB13]], double* [[ARRAYIDX15]], align 8			; UNROLL-NO-VF-NEXT: store double [[SUB13]], double* [[ARRAYIDX15]], align 8
	; UNROLL-NO-VF-NEXT: [[ADVARS_IV_NEXT]] = add nuw nsw i64 [[ADVARS_IV]], 1			; UNROLL-NO-VF-NEXT: [[ADVARS_IV_NEXT]] = add nuw nsw i64 [[ADVARS_IV]], 1
	; UNROLL-NO-VF-NEXT: [[LFTR_WIDEIV:%.*]] = trunc i64 [[ADVARS_IV_NEXT]] to i32			; UNROLL-NO-VF-NEXT: [[LFTR_WIDEIV:%.*]] = trunc i64 [[ADVARS_IV_NEXT]] to i32
	; UNROLL-NO-VF-NEXT: [[EXITCOND:%.*]] = icmp eq i32 [[LFTR_WIDEIV]], [[N]]			; UNROLL-NO-VF-NEXT: [[EXITCOND:%.*]] = icmp eq i32 [[LFTR_WIDEIV]], [[N]]
	▲ Show 20 Lines • Show All 328 Lines • ▼ Show 20 Lines
	; UNROLL-NO-VF-NEXT: br i1 [[MIN_ITERS_CHECK]], label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]			; UNROLL-NO-VF-NEXT: br i1 [[MIN_ITERS_CHECK]], label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]
	; UNROLL-NO-VF: vector.ph:			; UNROLL-NO-VF: vector.ph:
	; UNROLL-NO-VF-NEXT: [[N_MOD_VF:%.*]] = urem i32 [[I_016]], 2			; UNROLL-NO-VF-NEXT: [[N_MOD_VF:%.*]] = urem i32 [[I_016]], 2
	; UNROLL-NO-VF-NEXT: [[N_VEC:%.*]] = sub i32 [[I_016]], [[N_MOD_VF]]			; UNROLL-NO-VF-NEXT: [[N_VEC:%.*]] = sub i32 [[I_016]], [[N_MOD_VF]]
	; UNROLL-NO-VF-NEXT: [[IND_END:%.*]] = sub i32 [[I_016]], [[N_VEC]]			; UNROLL-NO-VF-NEXT: [[IND_END:%.*]] = sub i32 [[I_016]], [[N_VEC]]
	; UNROLL-NO-VF-NEXT: br label [[VECTOR_BODY:%.*]]			; UNROLL-NO-VF-NEXT: br label [[VECTOR_BODY:%.*]]
	; UNROLL-NO-VF: vector.body:			; UNROLL-NO-VF: vector.body:
	; UNROLL-NO-VF-NEXT: [[INDEX:%.]] = phi i32 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[VECTOR_BODY]] ]			; UNROLL-NO-VF-NEXT: [[INDEX:%.]] = phi i32 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[VECTOR_BODY]] ]
	; UNROLL-NO-VF-NEXT: [[VECTOR_RECUR:%.]] = phi i32 [ [[E_015]], [[VECTOR_PH]] ], [ [[INDUCTION1:%.]], [[VECTOR_BODY]] ]			; UNROLL-NO-VF-NEXT: [[VECTOR_RECUR:%.]] = phi i32 [ [[E_015]], [[VECTOR_PH]] ], [ [[TMP1:%.]], [[VECTOR_BODY]] ]
	; UNROLL-NO-VF-NEXT: [[OFFSET_IDX:%.*]] = sub i32 [[I_016]], [[INDEX]]			; UNROLL-NO-VF-NEXT: [[OFFSET_IDX:%.*]] = sub i32 [[I_016]], [[INDEX]]
	; UNROLL-NO-VF-NEXT: [[INDUCTION:%.*]] = add i32 [[OFFSET_IDX]], 0			; UNROLL-NO-VF-NEXT: [[TMP0:%.*]] = add i32 [[OFFSET_IDX]], 0
	; UNROLL-NO-VF-NEXT: [[INDUCTION1]] = add i32 [[OFFSET_IDX]], -1			; UNROLL-NO-VF-NEXT: [[TMP1]] = add i32 [[OFFSET_IDX]], -1
	; UNROLL-NO-VF-NEXT: [[INDEX_NEXT]] = add nuw i32 [[INDEX]], 2			; UNROLL-NO-VF-NEXT: [[INDEX_NEXT]] = add nuw i32 [[INDEX]], 2
	; UNROLL-NO-VF-NEXT: [[TMP0:%.*]] = icmp eq i32 [[INDEX_NEXT]], [[N_VEC]]			; UNROLL-NO-VF-NEXT: [[TMP2:%.*]] = icmp eq i32 [[INDEX_NEXT]], [[N_VEC]]
	; UNROLL-NO-VF-NEXT: br i1 [[TMP0]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP7:![0-9]+]]			; UNROLL-NO-VF-NEXT: br i1 [[TMP2]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP7:![0-9]+]]
	; UNROLL-NO-VF: middle.block:			; UNROLL-NO-VF: middle.block:
	; UNROLL-NO-VF-NEXT: [[CMP_N:%.*]] = icmp eq i32 [[I_016]], [[N_VEC]]			; UNROLL-NO-VF-NEXT: [[CMP_N:%.*]] = icmp eq i32 [[I_016]], [[N_VEC]]
	; UNROLL-NO-VF-NEXT: br i1 [[CMP_N]], label [[FOR_COND_CLEANUP3]], label [[SCALAR_PH]]			; UNROLL-NO-VF-NEXT: br i1 [[CMP_N]], label [[FOR_COND_CLEANUP3]], label [[SCALAR_PH]]
	; UNROLL-NO-VF: scalar.ph:			; UNROLL-NO-VF: scalar.ph:
	; UNROLL-NO-VF-NEXT: [[SCALAR_RECUR_INIT:%.*]] = phi i32 [ [[E_015]], [[FOR_COND1_PREHEADER]] ], [ [[INDUCTION1]], [[MIDDLE_BLOCK]] ]			; UNROLL-NO-VF-NEXT: [[SCALAR_RECUR_INIT:%.*]] = phi i32 [ [[E_015]], [[FOR_COND1_PREHEADER]] ], [ [[TMP1]], [[MIDDLE_BLOCK]] ]
	; UNROLL-NO-VF-NEXT: [[BC_RESUME_VAL:%.*]] = phi i32 [ [[IND_END]], [[MIDDLE_BLOCK]] ], [ [[I_016]], [[FOR_COND1_PREHEADER]] ]			; UNROLL-NO-VF-NEXT: [[BC_RESUME_VAL:%.*]] = phi i32 [ [[IND_END]], [[MIDDLE_BLOCK]] ], [ [[I_016]], [[FOR_COND1_PREHEADER]] ]
	; UNROLL-NO-VF-NEXT: br label [[FOR_COND1:%.*]]			; UNROLL-NO-VF-NEXT: br label [[FOR_COND1:%.*]]
	; UNROLL-NO-VF: for.cond.cleanup:			; UNROLL-NO-VF: for.cond.cleanup:
	; UNROLL-NO-VF-NEXT: [[E_1_LCSSA_LCSSA:%.*]] = phi i32 [ [[E_1_LCSSA]], [[FOR_COND_CLEANUP3]] ]			; UNROLL-NO-VF-NEXT: [[E_1_LCSSA_LCSSA:%.*]] = phi i32 [ [[E_1_LCSSA]], [[FOR_COND_CLEANUP3]] ]
	; UNROLL-NO-VF-NEXT: ret i32 [[E_1_LCSSA_LCSSA]]			; UNROLL-NO-VF-NEXT: ret i32 [[E_1_LCSSA_LCSSA]]
	; UNROLL-NO-VF: for.cond1:			; UNROLL-NO-VF: for.cond1:
	; UNROLL-NO-VF-NEXT: [[SCALAR_RECUR:%.]] = phi i32 [ [[K_0:%.]], [[FOR_COND1]] ], [ [[SCALAR_RECUR_INIT]], [[SCALAR_PH]] ]			; UNROLL-NO-VF-NEXT: [[SCALAR_RECUR:%.]] = phi i32 [ [[K_0:%.]], [[FOR_COND1]] ], [ [[SCALAR_RECUR_INIT]], [[SCALAR_PH]] ]
	; UNROLL-NO-VF-NEXT: [[K_0]] = phi i32 [ [[DEC:%.*]], [[FOR_COND1]] ], [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ]			; UNROLL-NO-VF-NEXT: [[K_0]] = phi i32 [ [[DEC:%.*]], [[FOR_COND1]] ], [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ]
	; UNROLL-NO-VF-NEXT: [[CMP2:%.*]] = icmp sgt i32 [[K_0]], 1			; UNROLL-NO-VF-NEXT: [[CMP2:%.*]] = icmp sgt i32 [[K_0]], 1
	; UNROLL-NO-VF-NEXT: [[DEC]] = add nsw i32 [[K_0]], -1			; UNROLL-NO-VF-NEXT: [[DEC]] = add nsw i32 [[K_0]], -1
	; UNROLL-NO-VF-NEXT: br i1 [[CMP2]], label [[FOR_COND1]], label [[FOR_COND_CLEANUP3]], !llvm.loop [[LOOP8:![0-9]+]]			; UNROLL-NO-VF-NEXT: br i1 [[CMP2]], label [[FOR_COND1]], label [[FOR_COND_CLEANUP3]], !llvm.loop [[LOOP8:![0-9]+]]
	; UNROLL-NO-VF: for.cond.cleanup3:			; UNROLL-NO-VF: for.cond.cleanup3:
	; UNROLL-NO-VF-NEXT: [[E_1_LCSSA]] = phi i32 [ [[SCALAR_RECUR]], [[FOR_COND1]] ], [ [[INDUCTION]], [[MIDDLE_BLOCK]] ]			; UNROLL-NO-VF-NEXT: [[E_1_LCSSA]] = phi i32 [ [[SCALAR_RECUR]], [[FOR_COND1]] ], [ [[TMP0]], [[MIDDLE_BLOCK]] ]
	; UNROLL-NO-VF-NEXT: [[INC]] = add nuw nsw i32 [[I_016]], 1			; UNROLL-NO-VF-NEXT: [[INC]] = add nuw nsw i32 [[I_016]], 1
	; UNROLL-NO-VF-NEXT: [[EXITCOND:%.*]] = icmp eq i32 [[INC]], 49			; UNROLL-NO-VF-NEXT: [[EXITCOND:%.*]] = icmp eq i32 [[INC]], 49
	; UNROLL-NO-VF-NEXT: br i1 [[EXITCOND]], label [[FOR_COND_CLEANUP:%.*]], label [[FOR_COND1_PREHEADER]]			; UNROLL-NO-VF-NEXT: br i1 [[EXITCOND]], label [[FOR_COND_CLEANUP:%.*]], label [[FOR_COND1_PREHEADER]]
	;			;
	; SINK-AFTER-LABEL: @PR27246(			; SINK-AFTER-LABEL: @PR27246(
	; SINK-AFTER-NEXT: entry:			; SINK-AFTER-NEXT: entry:
	; SINK-AFTER-NEXT: br label [[FOR_COND1_PREHEADER:%.*]]			; SINK-AFTER-NEXT: br label [[FOR_COND1_PREHEADER:%.*]]
	; SINK-AFTER: for.cond1.preheader:			; SINK-AFTER: for.cond1.preheader:
	▲ Show 20 Lines • Show All 162 Lines • ▼ Show 20 Lines
	; UNROLL-NO-VF-NEXT: br i1 [[MIN_ITERS_CHECK]], label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]			; UNROLL-NO-VF-NEXT: br i1 [[MIN_ITERS_CHECK]], label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]
	; UNROLL-NO-VF: vector.ph:			; UNROLL-NO-VF: vector.ph:
	; UNROLL-NO-VF-NEXT: [[N_MOD_VF:%.*]] = urem i64 [[TMP2]], 2			; UNROLL-NO-VF-NEXT: [[N_MOD_VF:%.*]] = urem i64 [[TMP2]], 2
	; UNROLL-NO-VF-NEXT: [[N_VEC:%.*]] = sub i64 [[TMP2]], [[N_MOD_VF]]			; UNROLL-NO-VF-NEXT: [[N_VEC:%.*]] = sub i64 [[TMP2]], [[N_MOD_VF]]
	; UNROLL-NO-VF-NEXT: [[IND_END:%.*]] = mul i64 [[N_VEC]], 2			; UNROLL-NO-VF-NEXT: [[IND_END:%.*]] = mul i64 [[N_VEC]], 2
	; UNROLL-NO-VF-NEXT: br label [[VECTOR_BODY:%.*]]			; UNROLL-NO-VF-NEXT: br label [[VECTOR_BODY:%.*]]
	; UNROLL-NO-VF: vector.body:			; UNROLL-NO-VF: vector.body:
	; UNROLL-NO-VF-NEXT: [[INDEX:%.]] = phi i64 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[VECTOR_BODY]] ]			; UNROLL-NO-VF-NEXT: [[INDEX:%.]] = phi i64 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[VECTOR_BODY]] ]
	; UNROLL-NO-VF-NEXT: [[VECTOR_RECUR:%.]] = phi i32 [ [[PRE_LOAD:%.]], [[VECTOR_PH]] ], [ [[TMP8:%.*]], [[VECTOR_BODY]] ]			; UNROLL-NO-VF-NEXT: [[VECTOR_RECUR:%.]] = phi i32 [ [[PRE_LOAD:%.]], [[VECTOR_PH]] ], [ [[TMP10:%.*]], [[VECTOR_BODY]] ]
	; UNROLL-NO-VF-NEXT: [[OFFSET_IDX:%.*]] = mul i64 [[INDEX]], 2			; UNROLL-NO-VF-NEXT: [[OFFSET_IDX:%.*]] = mul i64 [[INDEX]], 2
	; UNROLL-NO-VF-NEXT: [[INDUCTION:%.*]] = add i64 [[OFFSET_IDX]], 0			; UNROLL-NO-VF-NEXT: [[TMP3:%.*]] = add i64 [[OFFSET_IDX]], 0
	; UNROLL-NO-VF-NEXT: [[INDUCTION1:%.*]] = add i64 [[OFFSET_IDX]], 2			; UNROLL-NO-VF-NEXT: [[TMP4:%.*]] = add i64 [[OFFSET_IDX]], 2
	; UNROLL-NO-VF-NEXT: [[TMP3:%.*]] = add nuw nsw i64 [[INDUCTION]], 2			; UNROLL-NO-VF-NEXT: [[TMP5:%.*]] = add nuw nsw i64 [[TMP3]], 2
	; UNROLL-NO-VF-NEXT: [[TMP4:%.*]] = add nuw nsw i64 [[INDUCTION1]], 2			; UNROLL-NO-VF-NEXT: [[TMP6:%.*]] = add nuw nsw i64 [[TMP4]], 2
	; UNROLL-NO-VF-NEXT: [[TMP5:%.]] = getelementptr inbounds i32, i32 [[A:%.*]], i64 [[TMP3]]			; UNROLL-NO-VF-NEXT: [[TMP7:%.]] = getelementptr inbounds i32, i32 [[A:%.*]], i64 [[TMP5]]
	; UNROLL-NO-VF-NEXT: [[TMP6:%.]] = getelementptr inbounds i32, i32 [[A]], i64 [[TMP4]]			; UNROLL-NO-VF-NEXT: [[TMP8:%.]] = getelementptr inbounds i32, i32 [[A]], i64 [[TMP6]]
	; UNROLL-NO-VF-NEXT: [[TMP7:%.]] = load i32, i32 [[TMP5]], align 4			; UNROLL-NO-VF-NEXT: [[TMP9:%.]] = load i32, i32 [[TMP7]], align 4
	; UNROLL-NO-VF-NEXT: [[TMP8]] = load i32, i32* [[TMP6]], align 4			; UNROLL-NO-VF-NEXT: [[TMP10]] = load i32, i32* [[TMP8]], align 4
	; UNROLL-NO-VF-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 2			; UNROLL-NO-VF-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 2
	; UNROLL-NO-VF-NEXT: [[TMP9:%.*]] = icmp eq i64 [[INDEX_NEXT]], [[N_VEC]]			; UNROLL-NO-VF-NEXT: [[TMP11:%.*]] = icmp eq i64 [[INDEX_NEXT]], [[N_VEC]]
	; UNROLL-NO-VF-NEXT: br i1 [[TMP9]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP9:![0-9]+]]			; UNROLL-NO-VF-NEXT: br i1 [[TMP11]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP9:![0-9]+]]
	; UNROLL-NO-VF: middle.block:			; UNROLL-NO-VF: middle.block:
	; UNROLL-NO-VF-NEXT: [[CMP_N:%.*]] = icmp eq i64 [[TMP2]], [[N_VEC]]			; UNROLL-NO-VF-NEXT: [[CMP_N:%.*]] = icmp eq i64 [[TMP2]], [[N_VEC]]
	; UNROLL-NO-VF-NEXT: br i1 [[CMP_N]], label [[FOR_END:%.*]], label [[SCALAR_PH]]			; UNROLL-NO-VF-NEXT: br i1 [[CMP_N]], label [[FOR_END:%.*]], label [[SCALAR_PH]]
	; UNROLL-NO-VF: scalar.ph:			; UNROLL-NO-VF: scalar.ph:
	; UNROLL-NO-VF-NEXT: [[SCALAR_RECUR_INIT:%.]] = phi i32 [ [[PRE_LOAD]], [[ENTRY:%.]] ], [ [[TMP8]], [[MIDDLE_BLOCK]] ]			; UNROLL-NO-VF-NEXT: [[SCALAR_RECUR_INIT:%.]] = phi i32 [ [[PRE_LOAD]], [[ENTRY:%.]] ], [ [[TMP10]], [[MIDDLE_BLOCK]] ]
	; UNROLL-NO-VF-NEXT: [[BC_RESUME_VAL:%.*]] = phi i64 [ [[IND_END]], [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY]] ]			; UNROLL-NO-VF-NEXT: [[BC_RESUME_VAL:%.*]] = phi i64 [ [[IND_END]], [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY]] ]
	; UNROLL-NO-VF-NEXT: br label [[SCALAR_BODY:%.*]]			; UNROLL-NO-VF-NEXT: br label [[SCALAR_BODY:%.*]]
	; UNROLL-NO-VF: scalar.body:			; UNROLL-NO-VF: scalar.body:
	; UNROLL-NO-VF-NEXT: [[I:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[I_NEXT:%.]], [[SCALAR_BODY]] ]			; UNROLL-NO-VF-NEXT: [[I:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[I_NEXT:%.]], [[SCALAR_BODY]] ]
	; UNROLL-NO-VF-NEXT: [[SCALAR_RECUR:%.]] = phi i32 [ [[SCALAR_RECUR_INIT]], [[SCALAR_PH]] ], [ [[VAR2:%.]], [[SCALAR_BODY]] ]			; UNROLL-NO-VF-NEXT: [[SCALAR_RECUR:%.]] = phi i32 [ [[SCALAR_RECUR_INIT]], [[SCALAR_PH]] ], [ [[VAR2:%.]], [[SCALAR_BODY]] ]
	; UNROLL-NO-VF-NEXT: [[I_NEXT]] = add nuw nsw i64 [[I]], 2			; UNROLL-NO-VF-NEXT: [[I_NEXT]] = add nuw nsw i64 [[I]], 2
	; UNROLL-NO-VF-NEXT: [[VAR1:%.]] = getelementptr inbounds i32, i32 [[A]], i64 [[I_NEXT]]			; UNROLL-NO-VF-NEXT: [[VAR1:%.]] = getelementptr inbounds i32, i32 [[A]], i64 [[I_NEXT]]
	; UNROLL-NO-VF-NEXT: [[VAR2]] = load i32, i32* [[VAR1]], align 4			; UNROLL-NO-VF-NEXT: [[VAR2]] = load i32, i32* [[VAR1]], align 4
	▲ Show 20 Lines • Show All 236 Lines • ▼ Show 20 Lines
	;			;
	; UNROLL-NO-VF-LABEL: @extract_second_last_iteration(			; UNROLL-NO-VF-LABEL: @extract_second_last_iteration(
	; UNROLL-NO-VF-NEXT: entry:			; UNROLL-NO-VF-NEXT: entry:
	; UNROLL-NO-VF-NEXT: br i1 false, label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]			; UNROLL-NO-VF-NEXT: br i1 false, label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]
	; UNROLL-NO-VF: vector.ph:			; UNROLL-NO-VF: vector.ph:
	; UNROLL-NO-VF-NEXT: br label [[VECTOR_BODY:%.*]]			; UNROLL-NO-VF-NEXT: br label [[VECTOR_BODY:%.*]]
	; UNROLL-NO-VF: vector.body:			; UNROLL-NO-VF: vector.body:
	; UNROLL-NO-VF-NEXT: [[INDEX:%.]] = phi i32 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[VECTOR_BODY]] ]			; UNROLL-NO-VF-NEXT: [[INDEX:%.]] = phi i32 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[VECTOR_BODY]] ]
	; UNROLL-NO-VF-NEXT: [[VECTOR_RECUR:%.]] = phi i32 [ 0, [[VECTOR_PH]] ], [ [[TMP1:%.]], [[VECTOR_BODY]] ]			; UNROLL-NO-VF-NEXT: [[VECTOR_RECUR:%.]] = phi i32 [ 0, [[VECTOR_PH]] ], [ [[TMP3:%.]], [[VECTOR_BODY]] ]
	; UNROLL-NO-VF-NEXT: [[INDUCTION:%.*]] = add i32 [[INDEX]], 0			; UNROLL-NO-VF-NEXT: [[TMP0:%.*]] = add i32 [[INDEX]], 0
	; UNROLL-NO-VF-NEXT: [[INDUCTION1:%.*]] = add i32 [[INDEX]], 1			; UNROLL-NO-VF-NEXT: [[TMP1:%.*]] = add i32 [[INDEX]], 1
	; UNROLL-NO-VF-NEXT: [[TMP0:%.]] = add i32 [[INDUCTION]], [[X:%.]]			; UNROLL-NO-VF-NEXT: [[TMP2:%.]] = add i32 [[TMP0]], [[X:%.]]
	; UNROLL-NO-VF-NEXT: [[TMP1]] = add i32 [[INDUCTION1]], [[X]]			; UNROLL-NO-VF-NEXT: [[TMP3]] = add i32 [[TMP1]], [[X]]
	; UNROLL-NO-VF-NEXT: [[INDEX_NEXT]] = add nuw i32 [[INDEX]], 2			; UNROLL-NO-VF-NEXT: [[INDEX_NEXT]] = add nuw i32 [[INDEX]], 2
	; UNROLL-NO-VF-NEXT: [[TMP2:%.*]] = icmp eq i32 [[INDEX_NEXT]], 96			; UNROLL-NO-VF-NEXT: [[TMP4:%.*]] = icmp eq i32 [[INDEX_NEXT]], 96
	; UNROLL-NO-VF-NEXT: br i1 [[TMP2]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP13:![0-9]+]]			; UNROLL-NO-VF-NEXT: br i1 [[TMP4]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP13:![0-9]+]]
	; UNROLL-NO-VF: middle.block:			; UNROLL-NO-VF: middle.block:
	; UNROLL-NO-VF-NEXT: [[CMP_N:%.*]] = icmp eq i32 96, 96			; UNROLL-NO-VF-NEXT: [[CMP_N:%.*]] = icmp eq i32 96, 96
	; UNROLL-NO-VF-NEXT: br i1 [[CMP_N]], label [[FOR_END:%.*]], label [[SCALAR_PH]]			; UNROLL-NO-VF-NEXT: br i1 [[CMP_N]], label [[FOR_END:%.*]], label [[SCALAR_PH]]
	; UNROLL-NO-VF: scalar.ph:			; UNROLL-NO-VF: scalar.ph:
	; UNROLL-NO-VF-NEXT: [[SCALAR_RECUR_INIT:%.]] = phi i32 [ 0, [[ENTRY:%.]] ], [ [[TMP1]], [[MIDDLE_BLOCK]] ]			; UNROLL-NO-VF-NEXT: [[SCALAR_RECUR_INIT:%.]] = phi i32 [ 0, [[ENTRY:%.]] ], [ [[TMP3]], [[MIDDLE_BLOCK]] ]
	; UNROLL-NO-VF-NEXT: [[BC_RESUME_VAL:%.*]] = phi i32 [ 96, [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY]] ]			; UNROLL-NO-VF-NEXT: [[BC_RESUME_VAL:%.*]] = phi i32 [ 96, [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY]] ]
	; UNROLL-NO-VF-NEXT: br label [[FOR_BODY:%.*]]			; UNROLL-NO-VF-NEXT: br label [[FOR_BODY:%.*]]
	; UNROLL-NO-VF: for.body:			; UNROLL-NO-VF: for.body:
	; UNROLL-NO-VF-NEXT: [[INC_PHI:%.]] = phi i32 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[INC:%.]], [[FOR_BODY]] ]			; UNROLL-NO-VF-NEXT: [[INC_PHI:%.]] = phi i32 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[INC:%.]], [[FOR_BODY]] ]
	; UNROLL-NO-VF-NEXT: [[SCALAR_RECUR:%.]] = phi i32 [ [[SCALAR_RECUR_INIT]], [[SCALAR_PH]] ], [ [[ADDX:%.]], [[FOR_BODY]] ]			; UNROLL-NO-VF-NEXT: [[SCALAR_RECUR:%.]] = phi i32 [ [[SCALAR_RECUR_INIT]], [[SCALAR_PH]] ], [ [[ADDX:%.]], [[FOR_BODY]] ]
	; UNROLL-NO-VF-NEXT: [[INC]] = add i32 [[INC_PHI]], 1			; UNROLL-NO-VF-NEXT: [[INC]] = add i32 [[INC_PHI]], 1
	; UNROLL-NO-VF-NEXT: [[BC:%.*]] = zext i32 [[INC_PHI]] to i64			; UNROLL-NO-VF-NEXT: [[BC:%.*]] = zext i32 [[INC_PHI]] to i64
	; UNROLL-NO-VF-NEXT: [[ADDX]] = add i32 [[INC_PHI]], [[X]]			; UNROLL-NO-VF-NEXT: [[ADDX]] = add i32 [[INC_PHI]], [[X]]
	; UNROLL-NO-VF-NEXT: [[CMP:%.*]] = icmp eq i32 [[INC_PHI]], 95			; UNROLL-NO-VF-NEXT: [[CMP:%.*]] = icmp eq i32 [[INC_PHI]], 95
	; UNROLL-NO-VF-NEXT: br i1 [[CMP]], label [[FOR_END]], label [[FOR_BODY]], !llvm.loop [[LOOP14:![0-9]+]]			; UNROLL-NO-VF-NEXT: br i1 [[CMP]], label [[FOR_END]], label [[FOR_BODY]], !llvm.loop [[LOOP14:![0-9]+]]
	; UNROLL-NO-VF: for.end:			; UNROLL-NO-VF: for.end:
	; UNROLL-NO-VF-NEXT: [[VAL_PHI_LCSSA:%.*]] = phi i32 [ [[SCALAR_RECUR]], [[FOR_BODY]] ], [ [[TMP0]], [[MIDDLE_BLOCK]] ]			; UNROLL-NO-VF-NEXT: [[VAL_PHI_LCSSA:%.*]] = phi i32 [ [[SCALAR_RECUR]], [[FOR_BODY]] ], [ [[TMP2]], [[MIDDLE_BLOCK]] ]
	; UNROLL-NO-VF-NEXT: ret i32 [[VAL_PHI_LCSSA]]			; UNROLL-NO-VF-NEXT: ret i32 [[VAL_PHI_LCSSA]]
	;			;
	; SINK-AFTER-LABEL: @extract_second_last_iteration(			; SINK-AFTER-LABEL: @extract_second_last_iteration(
	; SINK-AFTER-NEXT: entry:			; SINK-AFTER-NEXT: entry:
	; SINK-AFTER-NEXT: br i1 false, label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]			; SINK-AFTER-NEXT: br i1 false, label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]
	; SINK-AFTER: vector.ph:			; SINK-AFTER: vector.ph:
	; SINK-AFTER-NEXT: [[BROADCAST_SPLATINSERT:%.]] = insertelement <4 x i32> poison, i32 [[X:%.]], i32 0			; SINK-AFTER-NEXT: [[BROADCAST_SPLATINSERT:%.]] = insertelement <4 x i32> poison, i32 [[X:%.]], i32 0
	; SINK-AFTER-NEXT: [[BROADCAST_SPLAT:%.*]] = shufflevector <4 x i32> [[BROADCAST_SPLATINSERT]], <4 x i32> poison, <4 x i32> zeroinitializer			; SINK-AFTER-NEXT: [[BROADCAST_SPLAT:%.*]] = shufflevector <4 x i32> [[BROADCAST_SPLATINSERT]], <4 x i32> poison, <4 x i32> zeroinitializer
	▲ Show 20 Lines • Show All 136 Lines • ▼ Show 20 Lines
	; UNROLL-NO-IC-NEXT: [[TMP48]] = add <4 x i32> [[VEC_PHI]], [[TMP46]]			; UNROLL-NO-IC-NEXT: [[TMP48]] = add <4 x i32> [[VEC_PHI]], [[TMP46]]
	; UNROLL-NO-IC-NEXT: [[TMP49]] = add <4 x i32> [[VEC_PHI9]], [[TMP47]]			; UNROLL-NO-IC-NEXT: [[TMP49]] = add <4 x i32> [[VEC_PHI9]], [[TMP47]]
	; UNROLL-NO-IC-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 8			; UNROLL-NO-IC-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 8
	; UNROLL-NO-IC-NEXT: [[TMP50:%.*]] = icmp eq i64 [[INDEX_NEXT]], 10240			; UNROLL-NO-IC-NEXT: [[TMP50:%.*]] = icmp eq i64 [[INDEX_NEXT]], 10240
	; UNROLL-NO-IC-NEXT: br i1 [[TMP50]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP16:![0-9]+]]			; UNROLL-NO-IC-NEXT: br i1 [[TMP50]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP16:![0-9]+]]
	; UNROLL-NO-IC: middle.block:			; UNROLL-NO-IC: middle.block:
	; UNROLL-NO-IC-NEXT: [[BIN_RDX:%.*]] = add <4 x i32> [[TMP49]], [[TMP48]]			; UNROLL-NO-IC-NEXT: [[BIN_RDX:%.*]] = add <4 x i32> [[TMP49]], [[TMP48]]
	; UNROLL-NO-IC-NEXT: [[TMP51:%.*]] = call i32 @llvm.vector.reduce.add.v4i32(<4 x i32> [[BIN_RDX]])			; UNROLL-NO-IC-NEXT: [[TMP51:%.*]] = call i32 @llvm.vector.reduce.add.v4i32(<4 x i32> [[BIN_RDX]])
				; UNROLL-NO-IC-NEXT: [[RDX_START:%.*]] = add i32 0, [[TMP51]]
	; UNROLL-NO-IC-NEXT: [[CMP_N:%.*]] = icmp eq i64 10240, 10240			; UNROLL-NO-IC-NEXT: [[CMP_N:%.*]] = icmp eq i64 10240, 10240
	; UNROLL-NO-IC-NEXT: [[VECTOR_RECUR_EXTRACT:%.*]] = extractelement <4 x double> [[TMP39]], i32 3			; UNROLL-NO-IC-NEXT: [[VECTOR_RECUR_EXTRACT:%.*]] = extractelement <4 x double> [[TMP39]], i32 3
	; UNROLL-NO-IC-NEXT: [[VECTOR_RECUR_EXTRACT_FOR_PHI:%.*]] = extractelement <4 x double> [[TMP39]], i32 2			; UNROLL-NO-IC-NEXT: [[VECTOR_RECUR_EXTRACT_FOR_PHI:%.*]] = extractelement <4 x double> [[TMP39]], i32 2
	; UNROLL-NO-IC-NEXT: br i1 [[CMP_N]], label [[FOR_COND_CLEANUP:%.*]], label [[SCALAR_PH]]			; UNROLL-NO-IC-NEXT: br i1 [[CMP_N]], label [[FOR_COND_CLEANUP:%.*]], label [[SCALAR_PH]]
	; UNROLL-NO-IC: scalar.ph:			; UNROLL-NO-IC: scalar.ph:
	; UNROLL-NO-IC-NEXT: [[SCALAR_RECUR_INIT:%.]] = phi double [ [[J]], [[ENTRY:%.]] ], [ [[VECTOR_RECUR_EXTRACT]], [[MIDDLE_BLOCK]] ]			; UNROLL-NO-IC-NEXT: [[SCALAR_RECUR_INIT:%.]] = phi double [ [[J]], [[ENTRY:%.]] ], [ [[VECTOR_RECUR_EXTRACT]], [[MIDDLE_BLOCK]] ]
	; UNROLL-NO-IC-NEXT: [[BC_RESUME_VAL:%.]] = phi double [ [[IND_END]], [[MIDDLE_BLOCK]] ], [ [[B]], [[ENTRY]] ]			; UNROLL-NO-IC-NEXT: [[BC_RESUME_VAL:%.]] = phi double [ [[IND_END]], [[MIDDLE_BLOCK]] ], [ [[B]], [[ENTRY]] ]
	; UNROLL-NO-IC-NEXT: [[BC_RESUME_VAL1:%.*]] = phi i32 [ 10240, [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY]] ]			; UNROLL-NO-IC-NEXT: [[BC_RESUME_VAL1:%.*]] = phi i32 [ 10240, [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY]] ]
	; UNROLL-NO-IC-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 0, [[ENTRY]] ], [ [[TMP51]], [[MIDDLE_BLOCK]] ]			; UNROLL-NO-IC-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 0, [[ENTRY]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; UNROLL-NO-IC-NEXT: br label [[FOR_BODY:%.*]]			; UNROLL-NO-IC-NEXT: br label [[FOR_BODY:%.*]]
	; UNROLL-NO-IC: for.cond.cleanup:			; UNROLL-NO-IC: for.cond.cleanup:
	; UNROLL-NO-IC-NEXT: [[A_1_LCSSA:%.]] = phi i32 [ [[A_1:%.]], [[FOR_BODY]] ], [ [[TMP51]], [[MIDDLE_BLOCK]] ]			; UNROLL-NO-IC-NEXT: [[A_1_LCSSA:%.]] = phi i32 [ [[A_1:%.]], [[FOR_BODY]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; UNROLL-NO-IC-NEXT: ret i32 [[A_1_LCSSA]]			; UNROLL-NO-IC-NEXT: ret i32 [[A_1_LCSSA]]
	; UNROLL-NO-IC: for.body:			; UNROLL-NO-IC: for.body:
	; UNROLL-NO-IC-NEXT: [[B_ADDR_012:%.]] = phi double [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[ADD_PTR:%.*]], [[FOR_BODY]] ]			; UNROLL-NO-IC-NEXT: [[B_ADDR_012:%.]] = phi double [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[ADD_PTR:%.*]], [[FOR_BODY]] ]
	; UNROLL-NO-IC-NEXT: [[I_011:%.]] = phi i32 [ [[BC_RESUME_VAL1]], [[SCALAR_PH]] ], [ [[INC1:%.]], [[FOR_BODY]] ]			; UNROLL-NO-IC-NEXT: [[I_011:%.]] = phi i32 [ [[BC_RESUME_VAL1]], [[SCALAR_PH]] ], [ [[INC1:%.]], [[FOR_BODY]] ]
	; UNROLL-NO-IC-NEXT: [[A_010:%.*]] = phi i32 [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[A_1]], [[FOR_BODY]] ]			; UNROLL-NO-IC-NEXT: [[A_010:%.*]] = phi i32 [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[A_1]], [[FOR_BODY]] ]
	; UNROLL-NO-IC-NEXT: [[SCALAR_RECUR:%.]] = phi double [ [[SCALAR_RECUR_INIT]], [[SCALAR_PH]] ], [ [[TMP52:%.]], [[FOR_BODY]] ]			; UNROLL-NO-IC-NEXT: [[SCALAR_RECUR:%.]] = phi double [ [[SCALAR_RECUR_INIT]], [[SCALAR_PH]] ], [ [[TMP52:%.]], [[FOR_BODY]] ]
	; UNROLL-NO-IC-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds double, double [[B_ADDR_012]], i64 [[IDXPROM]]			; UNROLL-NO-IC-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds double, double [[B_ADDR_012]], i64 [[IDXPROM]]
	; UNROLL-NO-IC-NEXT: [[TMP52]] = load double, double* [[ARRAYIDX]], align 8			; UNROLL-NO-IC-NEXT: [[TMP52]] = load double, double* [[ARRAYIDX]], align 8
	▲ Show 20 Lines • Show All 109 Lines • ▼ Show 20 Lines
	; SINK-AFTER-NEXT: [[TMP22:%.*]] = fcmp une <4 x double> [[TMP21]], zeroinitializer			; SINK-AFTER-NEXT: [[TMP22:%.*]] = fcmp une <4 x double> [[TMP21]], zeroinitializer
	; SINK-AFTER-NEXT: [[TMP23:%.*]] = zext <4 x i1> [[TMP22]] to <4 x i32>			; SINK-AFTER-NEXT: [[TMP23:%.*]] = zext <4 x i1> [[TMP22]] to <4 x i32>
	; SINK-AFTER-NEXT: [[TMP24]] = add <4 x i32> [[VEC_PHI]], [[TMP23]]			; SINK-AFTER-NEXT: [[TMP24]] = add <4 x i32> [[VEC_PHI]], [[TMP23]]
	; SINK-AFTER-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 4			; SINK-AFTER-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 4
	; SINK-AFTER-NEXT: [[TMP25:%.*]] = icmp eq i64 [[INDEX_NEXT]], 10240			; SINK-AFTER-NEXT: [[TMP25:%.*]] = icmp eq i64 [[INDEX_NEXT]], 10240
	; SINK-AFTER-NEXT: br i1 [[TMP25]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP16:![0-9]+]]			; SINK-AFTER-NEXT: br i1 [[TMP25]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP16:![0-9]+]]
	; SINK-AFTER: middle.block:			; SINK-AFTER: middle.block:
	; SINK-AFTER-NEXT: [[TMP26:%.*]] = call i32 @llvm.vector.reduce.add.v4i32(<4 x i32> [[TMP24]])			; SINK-AFTER-NEXT: [[TMP26:%.*]] = call i32 @llvm.vector.reduce.add.v4i32(<4 x i32> [[TMP24]])
				; SINK-AFTER-NEXT: [[RDX_START:%.*]] = add i32 0, [[TMP26]]
	; SINK-AFTER-NEXT: [[CMP_N:%.*]] = icmp eq i64 10240, 10240			; SINK-AFTER-NEXT: [[CMP_N:%.*]] = icmp eq i64 10240, 10240
	; SINK-AFTER-NEXT: [[VECTOR_RECUR_EXTRACT:%.*]] = extractelement <4 x double> [[TMP19]], i32 3			; SINK-AFTER-NEXT: [[VECTOR_RECUR_EXTRACT:%.*]] = extractelement <4 x double> [[TMP19]], i32 3
	; SINK-AFTER-NEXT: [[VECTOR_RECUR_EXTRACT_FOR_PHI:%.*]] = extractelement <4 x double> [[TMP19]], i32 2			; SINK-AFTER-NEXT: [[VECTOR_RECUR_EXTRACT_FOR_PHI:%.*]] = extractelement <4 x double> [[TMP19]], i32 2
	; SINK-AFTER-NEXT: br i1 [[CMP_N]], label [[FOR_COND_CLEANUP:%.*]], label [[SCALAR_PH]]			; SINK-AFTER-NEXT: br i1 [[CMP_N]], label [[FOR_COND_CLEANUP:%.*]], label [[SCALAR_PH]]
	; SINK-AFTER: scalar.ph:			; SINK-AFTER: scalar.ph:
	; SINK-AFTER-NEXT: [[SCALAR_RECUR_INIT:%.]] = phi double [ [[J]], [[ENTRY:%.]] ], [ [[VECTOR_RECUR_EXTRACT]], [[MIDDLE_BLOCK]] ]			; SINK-AFTER-NEXT: [[SCALAR_RECUR_INIT:%.]] = phi double [ [[J]], [[ENTRY:%.]] ], [ [[VECTOR_RECUR_EXTRACT]], [[MIDDLE_BLOCK]] ]
	; SINK-AFTER-NEXT: [[BC_RESUME_VAL:%.]] = phi double [ [[IND_END]], [[MIDDLE_BLOCK]] ], [ [[B]], [[ENTRY]] ]			; SINK-AFTER-NEXT: [[BC_RESUME_VAL:%.]] = phi double [ [[IND_END]], [[MIDDLE_BLOCK]] ], [ [[B]], [[ENTRY]] ]
	; SINK-AFTER-NEXT: [[BC_RESUME_VAL1:%.*]] = phi i32 [ 10240, [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY]] ]			; SINK-AFTER-NEXT: [[BC_RESUME_VAL1:%.*]] = phi i32 [ 10240, [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY]] ]
	; SINK-AFTER-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 0, [[ENTRY]] ], [ [[TMP26]], [[MIDDLE_BLOCK]] ]			; SINK-AFTER-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 0, [[ENTRY]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; SINK-AFTER-NEXT: br label [[FOR_BODY:%.*]]			; SINK-AFTER-NEXT: br label [[FOR_BODY:%.*]]
	; SINK-AFTER: for.cond.cleanup:			; SINK-AFTER: for.cond.cleanup:
	; SINK-AFTER-NEXT: [[A_1_LCSSA:%.]] = phi i32 [ [[A_1:%.]], [[FOR_BODY]] ], [ [[TMP26]], [[MIDDLE_BLOCK]] ]			; SINK-AFTER-NEXT: [[A_1_LCSSA:%.]] = phi i32 [ [[A_1:%.]], [[FOR_BODY]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; SINK-AFTER-NEXT: ret i32 [[A_1_LCSSA]]			; SINK-AFTER-NEXT: ret i32 [[A_1_LCSSA]]
	; SINK-AFTER: for.body:			; SINK-AFTER: for.body:
	; SINK-AFTER-NEXT: [[B_ADDR_012:%.]] = phi double [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[ADD_PTR:%.*]], [[FOR_BODY]] ]			; SINK-AFTER-NEXT: [[B_ADDR_012:%.]] = phi double [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[ADD_PTR:%.*]], [[FOR_BODY]] ]
	; SINK-AFTER-NEXT: [[I_011:%.]] = phi i32 [ [[BC_RESUME_VAL1]], [[SCALAR_PH]] ], [ [[INC1:%.]], [[FOR_BODY]] ]			; SINK-AFTER-NEXT: [[I_011:%.]] = phi i32 [ [[BC_RESUME_VAL1]], [[SCALAR_PH]] ], [ [[INC1:%.]], [[FOR_BODY]] ]
	; SINK-AFTER-NEXT: [[A_010:%.*]] = phi i32 [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[A_1]], [[FOR_BODY]] ]			; SINK-AFTER-NEXT: [[A_010:%.*]] = phi i32 [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[A_1]], [[FOR_BODY]] ]
	; SINK-AFTER-NEXT: [[SCALAR_RECUR:%.]] = phi double [ [[SCALAR_RECUR_INIT]], [[SCALAR_PH]] ], [ [[TMP27:%.]], [[FOR_BODY]] ]			; SINK-AFTER-NEXT: [[SCALAR_RECUR:%.]] = phi double [ [[SCALAR_RECUR_INIT]], [[SCALAR_PH]] ], [ [[TMP27:%.]], [[FOR_BODY]] ]
	; SINK-AFTER-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds double, double [[B_ADDR_012]], i64 [[IDXPROM]]			; SINK-AFTER-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds double, double [[B_ADDR_012]], i64 [[IDXPROM]]
	; SINK-AFTER-NEXT: [[TMP27]] = load double, double* [[ARRAYIDX]], align 8			; SINK-AFTER-NEXT: [[TMP27]] = load double, double* [[ARRAYIDX]], align 8
	▲ Show 20 Lines • Show All 114 Lines • ▼ Show 20 Lines
	; UNROLL-NO-VF-NEXT: [[MIN_ITERS_CHECK:%.]] = icmp ult i64 [[N:%.]], 2			; UNROLL-NO-VF-NEXT: [[MIN_ITERS_CHECK:%.]] = icmp ult i64 [[N:%.]], 2
	; UNROLL-NO-VF-NEXT: br i1 [[MIN_ITERS_CHECK]], label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]			; UNROLL-NO-VF-NEXT: br i1 [[MIN_ITERS_CHECK]], label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]
	; UNROLL-NO-VF: vector.ph:			; UNROLL-NO-VF: vector.ph:
	; UNROLL-NO-VF-NEXT: [[N_MOD_VF:%.*]] = urem i64 [[N]], 2			; UNROLL-NO-VF-NEXT: [[N_MOD_VF:%.*]] = urem i64 [[N]], 2
	; UNROLL-NO-VF-NEXT: [[N_VEC:%.*]] = sub i64 [[N]], [[N_MOD_VF]]			; UNROLL-NO-VF-NEXT: [[N_VEC:%.*]] = sub i64 [[N]], [[N_MOD_VF]]
	; UNROLL-NO-VF-NEXT: br label [[VECTOR_BODY:%.*]]			; UNROLL-NO-VF-NEXT: br label [[VECTOR_BODY:%.*]]
	; UNROLL-NO-VF: vector.body:			; UNROLL-NO-VF: vector.body:
	; UNROLL-NO-VF-NEXT: [[INDEX:%.]] = phi i64 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[VECTOR_BODY]] ]			; UNROLL-NO-VF-NEXT: [[INDEX:%.]] = phi i64 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[VECTOR_BODY]] ]
	; UNROLL-NO-VF-NEXT: [[VECTOR_RECUR:%.]] = phi i16 [ [[DOTPRE]], [[VECTOR_PH]] ], [ [[TMP5:%.]], [[VECTOR_BODY]] ]			; UNROLL-NO-VF-NEXT: [[VECTOR_RECUR:%.]] = phi i16 [ [[DOTPRE]], [[VECTOR_PH]] ], [ [[TMP7:%.]], [[VECTOR_BODY]] ]
	; UNROLL-NO-VF-NEXT: [[INDUCTION:%.*]] = add i64 [[INDEX]], 0			; UNROLL-NO-VF-NEXT: [[TMP0:%.*]] = add i64 [[INDEX]], 0
	; UNROLL-NO-VF-NEXT: [[INDUCTION1:%.*]] = add i64 [[INDEX]], 1			; UNROLL-NO-VF-NEXT: [[TMP1:%.*]] = add i64 [[INDEX]], 1
	; UNROLL-NO-VF-NEXT: [[TMP0:%.*]] = add nuw nsw i64 [[INDUCTION]], 1			; UNROLL-NO-VF-NEXT: [[TMP2:%.*]] = add nuw nsw i64 [[TMP0]], 1
	; UNROLL-NO-VF-NEXT: [[TMP1:%.*]] = add nuw nsw i64 [[INDUCTION1]], 1			; UNROLL-NO-VF-NEXT: [[TMP3:%.*]] = add nuw nsw i64 [[TMP1]], 1
	; UNROLL-NO-VF-NEXT: [[TMP2:%.]] = getelementptr inbounds i16, i16 [[A]], i64 [[TMP0]]			; UNROLL-NO-VF-NEXT: [[TMP4:%.]] = getelementptr inbounds i16, i16 [[A]], i64 [[TMP2]]
	; UNROLL-NO-VF-NEXT: [[TMP3:%.]] = getelementptr inbounds i16, i16 [[A]], i64 [[TMP1]]			; UNROLL-NO-VF-NEXT: [[TMP5:%.]] = getelementptr inbounds i16, i16 [[A]], i64 [[TMP3]]
	; UNROLL-NO-VF-NEXT: [[TMP4:%.]] = load i16, i16 [[TMP2]], align 2			; UNROLL-NO-VF-NEXT: [[TMP6:%.]] = load i16, i16 [[TMP4]], align 2
	; UNROLL-NO-VF-NEXT: [[TMP5]] = load i16, i16* [[TMP3]], align 2			; UNROLL-NO-VF-NEXT: [[TMP7]] = load i16, i16* [[TMP5]], align 2
	; UNROLL-NO-VF-NEXT: [[TMP6:%.*]] = sext i16 [[VECTOR_RECUR]] to i32			; UNROLL-NO-VF-NEXT: [[TMP8:%.*]] = sext i16 [[VECTOR_RECUR]] to i32
	; UNROLL-NO-VF-NEXT: [[TMP7:%.*]] = sext i16 [[TMP4]] to i32			; UNROLL-NO-VF-NEXT: [[TMP9:%.*]] = sext i16 [[TMP6]] to i32
	; UNROLL-NO-VF-NEXT: [[TMP8:%.*]] = sext i16 [[TMP4]] to i32			; UNROLL-NO-VF-NEXT: [[TMP10:%.*]] = sext i16 [[TMP6]] to i32
	; UNROLL-NO-VF-NEXT: [[TMP9:%.*]] = sext i16 [[TMP5]] to i32			; UNROLL-NO-VF-NEXT: [[TMP11:%.*]] = sext i16 [[TMP7]] to i32
	; UNROLL-NO-VF-NEXT: [[TMP10:%.*]] = mul nsw i32 [[TMP8]], [[TMP6]]			; UNROLL-NO-VF-NEXT: [[TMP12:%.*]] = mul nsw i32 [[TMP10]], [[TMP8]]
	; UNROLL-NO-VF-NEXT: [[TMP11:%.*]] = mul nsw i32 [[TMP9]], [[TMP7]]			; UNROLL-NO-VF-NEXT: [[TMP13:%.*]] = mul nsw i32 [[TMP11]], [[TMP9]]
	; UNROLL-NO-VF-NEXT: [[TMP12:%.]] = getelementptr inbounds i32, i32 [[B:%.*]], i64 [[INDUCTION]]			; UNROLL-NO-VF-NEXT: [[TMP14:%.]] = getelementptr inbounds i32, i32 [[B:%.*]], i64 [[TMP0]]
	; UNROLL-NO-VF-NEXT: [[TMP13:%.]] = getelementptr inbounds i32, i32 [[B]], i64 [[INDUCTION1]]			; UNROLL-NO-VF-NEXT: [[TMP15:%.]] = getelementptr inbounds i32, i32 [[B]], i64 [[TMP1]]
	; UNROLL-NO-VF-NEXT: store i32 [[TMP10]], i32* [[TMP12]], align 4			; UNROLL-NO-VF-NEXT: store i32 [[TMP12]], i32* [[TMP14]], align 4
	; UNROLL-NO-VF-NEXT: store i32 [[TMP11]], i32* [[TMP13]], align 4			; UNROLL-NO-VF-NEXT: store i32 [[TMP13]], i32* [[TMP15]], align 4
	; UNROLL-NO-VF-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 2			; UNROLL-NO-VF-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 2
	; UNROLL-NO-VF-NEXT: [[TMP14:%.*]] = icmp eq i64 [[INDEX_NEXT]], [[N_VEC]]			; UNROLL-NO-VF-NEXT: [[TMP16:%.*]] = icmp eq i64 [[INDEX_NEXT]], [[N_VEC]]
	; UNROLL-NO-VF-NEXT: br i1 [[TMP14]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP17:![0-9]+]]			; UNROLL-NO-VF-NEXT: br i1 [[TMP16]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP17:![0-9]+]]
	; UNROLL-NO-VF: middle.block:			; UNROLL-NO-VF: middle.block:
	; UNROLL-NO-VF-NEXT: [[CMP_N:%.*]] = icmp eq i64 [[N]], [[N_VEC]]			; UNROLL-NO-VF-NEXT: [[CMP_N:%.*]] = icmp eq i64 [[N]], [[N_VEC]]
	; UNROLL-NO-VF-NEXT: br i1 [[CMP_N]], label [[FOR_END:%.*]], label [[SCALAR_PH]]			; UNROLL-NO-VF-NEXT: br i1 [[CMP_N]], label [[FOR_END:%.*]], label [[SCALAR_PH]]
	; UNROLL-NO-VF: scalar.ph:			; UNROLL-NO-VF: scalar.ph:
	; UNROLL-NO-VF-NEXT: [[SCALAR_RECUR_INIT:%.]] = phi i16 [ [[DOTPRE]], [[ENTRY:%.]] ], [ [[TMP5]], [[MIDDLE_BLOCK]] ]			; UNROLL-NO-VF-NEXT: [[SCALAR_RECUR_INIT:%.]] = phi i16 [ [[DOTPRE]], [[ENTRY:%.]] ], [ [[TMP7]], [[MIDDLE_BLOCK]] ]
	; UNROLL-NO-VF-NEXT: [[BC_RESUME_VAL:%.*]] = phi i64 [ [[N_VEC]], [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY]] ]			; UNROLL-NO-VF-NEXT: [[BC_RESUME_VAL:%.*]] = phi i64 [ [[N_VEC]], [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY]] ]
	; UNROLL-NO-VF-NEXT: br label [[FOR_BODY:%.*]]			; UNROLL-NO-VF-NEXT: br label [[FOR_BODY:%.*]]
	; UNROLL-NO-VF: for.body:			; UNROLL-NO-VF: for.body:
	; UNROLL-NO-VF-NEXT: [[SCALAR_RECUR:%.]] = phi i16 [ [[SCALAR_RECUR_INIT]], [[SCALAR_PH]] ], [ [[TMP15:%.]], [[FOR_BODY]] ]			; UNROLL-NO-VF-NEXT: [[SCALAR_RECUR:%.]] = phi i16 [ [[SCALAR_RECUR_INIT]], [[SCALAR_PH]] ], [ [[TMP17:%.]], [[FOR_BODY]] ]
	; UNROLL-NO-VF-NEXT: [[INDVARS_IV:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[INDVARS_IV_NEXT:%.]], [[FOR_BODY]] ]			; UNROLL-NO-VF-NEXT: [[INDVARS_IV:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[INDVARS_IV_NEXT:%.]], [[FOR_BODY]] ]
	; UNROLL-NO-VF-NEXT: [[CONV:%.*]] = sext i16 [[SCALAR_RECUR]] to i32			; UNROLL-NO-VF-NEXT: [[CONV:%.*]] = sext i16 [[SCALAR_RECUR]] to i32
	; UNROLL-NO-VF-NEXT: [[INDVARS_IV_NEXT]] = add nuw nsw i64 [[INDVARS_IV]], 1			; UNROLL-NO-VF-NEXT: [[INDVARS_IV_NEXT]] = add nuw nsw i64 [[INDVARS_IV]], 1
	; UNROLL-NO-VF-NEXT: [[ARRAYIDX2:%.]] = getelementptr inbounds i16, i16 [[A]], i64 [[INDVARS_IV_NEXT]]			; UNROLL-NO-VF-NEXT: [[ARRAYIDX2:%.]] = getelementptr inbounds i16, i16 [[A]], i64 [[INDVARS_IV_NEXT]]
	; UNROLL-NO-VF-NEXT: [[TMP15]] = load i16, i16* [[ARRAYIDX2]], align 2			; UNROLL-NO-VF-NEXT: [[TMP17]] = load i16, i16* [[ARRAYIDX2]], align 2
	; UNROLL-NO-VF-NEXT: [[CONV3:%.*]] = sext i16 [[TMP15]] to i32			; UNROLL-NO-VF-NEXT: [[CONV3:%.*]] = sext i16 [[TMP17]] to i32
	; UNROLL-NO-VF-NEXT: [[MUL:%.*]] = mul nsw i32 [[CONV3]], [[CONV]]			; UNROLL-NO-VF-NEXT: [[MUL:%.*]] = mul nsw i32 [[CONV3]], [[CONV]]
	; UNROLL-NO-VF-NEXT: [[ARRAYIDX5:%.]] = getelementptr inbounds i32, i32 [[B]], i64 [[INDVARS_IV]]			; UNROLL-NO-VF-NEXT: [[ARRAYIDX5:%.]] = getelementptr inbounds i32, i32 [[B]], i64 [[INDVARS_IV]]
	; UNROLL-NO-VF-NEXT: store i32 [[MUL]], i32* [[ARRAYIDX5]], align 4			; UNROLL-NO-VF-NEXT: store i32 [[MUL]], i32* [[ARRAYIDX5]], align 4
	; UNROLL-NO-VF-NEXT: [[EXITCOND:%.*]] = icmp eq i64 [[INDVARS_IV_NEXT]], [[N]]			; UNROLL-NO-VF-NEXT: [[EXITCOND:%.*]] = icmp eq i64 [[INDVARS_IV_NEXT]], [[N]]
	; UNROLL-NO-VF-NEXT: br i1 [[EXITCOND]], label [[FOR_END]], label [[FOR_BODY]], !llvm.loop [[LOOP18:![0-9]+]]			; UNROLL-NO-VF-NEXT: br i1 [[EXITCOND]], label [[FOR_END]], label [[FOR_BODY]], !llvm.loop [[LOOP18:![0-9]+]]
	; UNROLL-NO-VF: for.end:			; UNROLL-NO-VF: for.end:
	; UNROLL-NO-VF-NEXT: ret void			; UNROLL-NO-VF-NEXT: ret void
	;			;
	▲ Show 20 Lines • Show All 198 Lines • ▼ Show 20 Lines
	; UNROLL-NO-VF-NEXT: [[MIN_ITERS_CHECK:%.]] = icmp ult i64 [[N:%.]], 2			; UNROLL-NO-VF-NEXT: [[MIN_ITERS_CHECK:%.]] = icmp ult i64 [[N:%.]], 2
	; UNROLL-NO-VF-NEXT: br i1 [[MIN_ITERS_CHECK]], label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]			; UNROLL-NO-VF-NEXT: br i1 [[MIN_ITERS_CHECK]], label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]
	; UNROLL-NO-VF: vector.ph:			; UNROLL-NO-VF: vector.ph:
	; UNROLL-NO-VF-NEXT: [[N_MOD_VF:%.*]] = urem i64 [[N]], 2			; UNROLL-NO-VF-NEXT: [[N_MOD_VF:%.*]] = urem i64 [[N]], 2
	; UNROLL-NO-VF-NEXT: [[N_VEC:%.*]] = sub i64 [[N]], [[N_MOD_VF]]			; UNROLL-NO-VF-NEXT: [[N_VEC:%.*]] = sub i64 [[N]], [[N_MOD_VF]]
	; UNROLL-NO-VF-NEXT: br label [[VECTOR_BODY:%.*]]			; UNROLL-NO-VF-NEXT: br label [[VECTOR_BODY:%.*]]
	; UNROLL-NO-VF: vector.body:			; UNROLL-NO-VF: vector.body:
	; UNROLL-NO-VF-NEXT: [[INDEX:%.]] = phi i64 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[VECTOR_BODY]] ]			; UNROLL-NO-VF-NEXT: [[INDEX:%.]] = phi i64 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[VECTOR_BODY]] ]
	; UNROLL-NO-VF-NEXT: [[VECTOR_RECUR:%.]] = phi i16 [ [[DOTPRE]], [[VECTOR_PH]] ], [ [[TMP5:%.]], [[VECTOR_BODY]] ]			; UNROLL-NO-VF-NEXT: [[VECTOR_RECUR:%.]] = phi i16 [ [[DOTPRE]], [[VECTOR_PH]] ], [ [[TMP7:%.]], [[VECTOR_BODY]] ]
	; UNROLL-NO-VF-NEXT: [[INDUCTION:%.*]] = add i64 [[INDEX]], 0			; UNROLL-NO-VF-NEXT: [[TMP0:%.*]] = add i64 [[INDEX]], 0
	; UNROLL-NO-VF-NEXT: [[INDUCTION1:%.*]] = add i64 [[INDEX]], 1			; UNROLL-NO-VF-NEXT: [[TMP1:%.*]] = add i64 [[INDEX]], 1
	; UNROLL-NO-VF-NEXT: [[TMP0:%.]] = getelementptr inbounds i32, i32 [[C:%.*]], i64 [[INDUCTION]]			; UNROLL-NO-VF-NEXT: [[TMP2:%.]] = getelementptr inbounds i32, i32 [[C:%.*]], i64 [[TMP0]]
	; UNROLL-NO-VF-NEXT: [[TMP1:%.]] = getelementptr inbounds i32, i32 [[C]], i64 [[INDUCTION1]]			; UNROLL-NO-VF-NEXT: [[TMP3:%.]] = getelementptr inbounds i32, i32 [[C]], i64 [[TMP1]]
	; UNROLL-NO-VF-NEXT: [[TMP2:%.]] = getelementptr inbounds [2 x i16], [2 x i16] [[A]], i64 [[INDUCTION]], i64 1			; UNROLL-NO-VF-NEXT: [[TMP4:%.]] = getelementptr inbounds [2 x i16], [2 x i16] [[A]], i64 [[TMP0]], i64 1
	; UNROLL-NO-VF-NEXT: [[TMP3:%.]] = getelementptr inbounds [2 x i16], [2 x i16] [[A]], i64 [[INDUCTION1]], i64 1			; UNROLL-NO-VF-NEXT: [[TMP5:%.]] = getelementptr inbounds [2 x i16], [2 x i16] [[A]], i64 [[TMP1]], i64 1
	; UNROLL-NO-VF-NEXT: store i32 7, i32* [[TMP0]], align 4			; UNROLL-NO-VF-NEXT: store i32 7, i32* [[TMP2]], align 4
	; UNROLL-NO-VF-NEXT: store i32 7, i32* [[TMP1]], align 4			; UNROLL-NO-VF-NEXT: store i32 7, i32* [[TMP3]], align 4
	; UNROLL-NO-VF-NEXT: [[TMP4:%.]] = load i16, i16 [[TMP2]], align 2			; UNROLL-NO-VF-NEXT: [[TMP6:%.]] = load i16, i16 [[TMP4]], align 2
	; UNROLL-NO-VF-NEXT: [[TMP5]] = load i16, i16* [[TMP3]], align 2			; UNROLL-NO-VF-NEXT: [[TMP7]] = load i16, i16* [[TMP5]], align 2
	; UNROLL-NO-VF-NEXT: [[TMP6:%.*]] = sext i16 [[VECTOR_RECUR]] to i32			; UNROLL-NO-VF-NEXT: [[TMP8:%.*]] = sext i16 [[VECTOR_RECUR]] to i32
	; UNROLL-NO-VF-NEXT: [[TMP7:%.*]] = sext i16 [[TMP4]] to i32			; UNROLL-NO-VF-NEXT: [[TMP9:%.*]] = sext i16 [[TMP6]] to i32
	; UNROLL-NO-VF-NEXT: [[TMP8:%.*]] = sext i16 [[TMP4]] to i32			; UNROLL-NO-VF-NEXT: [[TMP10:%.*]] = sext i16 [[TMP6]] to i32
	; UNROLL-NO-VF-NEXT: [[TMP9:%.*]] = sext i16 [[TMP5]] to i32			; UNROLL-NO-VF-NEXT: [[TMP11:%.*]] = sext i16 [[TMP7]] to i32
	; UNROLL-NO-VF-NEXT: [[TMP10:%.*]] = mul nsw i32 [[TMP8]], [[TMP6]]			; UNROLL-NO-VF-NEXT: [[TMP12:%.*]] = mul nsw i32 [[TMP10]], [[TMP8]]
	; UNROLL-NO-VF-NEXT: [[TMP11:%.*]] = mul nsw i32 [[TMP9]], [[TMP7]]			; UNROLL-NO-VF-NEXT: [[TMP13:%.*]] = mul nsw i32 [[TMP11]], [[TMP9]]
	; UNROLL-NO-VF-NEXT: [[TMP12:%.]] = getelementptr inbounds i32, i32 [[B:%.*]], i64 [[INDUCTION]]			; UNROLL-NO-VF-NEXT: [[TMP14:%.]] = getelementptr inbounds i32, i32 [[B:%.*]], i64 [[TMP0]]
	; UNROLL-NO-VF-NEXT: [[TMP13:%.]] = getelementptr inbounds i32, i32 [[B]], i64 [[INDUCTION1]]			; UNROLL-NO-VF-NEXT: [[TMP15:%.]] = getelementptr inbounds i32, i32 [[B]], i64 [[TMP1]]
	; UNROLL-NO-VF-NEXT: store i32 [[TMP10]], i32* [[TMP12]], align 4			; UNROLL-NO-VF-NEXT: store i32 [[TMP12]], i32* [[TMP14]], align 4
	; UNROLL-NO-VF-NEXT: store i32 [[TMP11]], i32* [[TMP13]], align 4			; UNROLL-NO-VF-NEXT: store i32 [[TMP13]], i32* [[TMP15]], align 4
	; UNROLL-NO-VF-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 2			; UNROLL-NO-VF-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 2
	; UNROLL-NO-VF-NEXT: [[TMP14:%.*]] = icmp eq i64 [[INDEX_NEXT]], [[N_VEC]]			; UNROLL-NO-VF-NEXT: [[TMP16:%.*]] = icmp eq i64 [[INDEX_NEXT]], [[N_VEC]]
	; UNROLL-NO-VF-NEXT: br i1 [[TMP14]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP19:![0-9]+]]			; UNROLL-NO-VF-NEXT: br i1 [[TMP16]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP19:![0-9]+]]
	; UNROLL-NO-VF: middle.block:			; UNROLL-NO-VF: middle.block:
	; UNROLL-NO-VF-NEXT: [[CMP_N:%.*]] = icmp eq i64 [[N]], [[N_VEC]]			; UNROLL-NO-VF-NEXT: [[CMP_N:%.*]] = icmp eq i64 [[N]], [[N_VEC]]
	; UNROLL-NO-VF-NEXT: br i1 [[CMP_N]], label [[FOR_END:%.*]], label [[SCALAR_PH]]			; UNROLL-NO-VF-NEXT: br i1 [[CMP_N]], label [[FOR_END:%.*]], label [[SCALAR_PH]]
	; UNROLL-NO-VF: scalar.ph:			; UNROLL-NO-VF: scalar.ph:
	; UNROLL-NO-VF-NEXT: [[SCALAR_RECUR_INIT:%.]] = phi i16 [ [[DOTPRE]], [[ENTRY:%.]] ], [ [[TMP5]], [[MIDDLE_BLOCK]] ]			; UNROLL-NO-VF-NEXT: [[SCALAR_RECUR_INIT:%.]] = phi i16 [ [[DOTPRE]], [[ENTRY:%.]] ], [ [[TMP7]], [[MIDDLE_BLOCK]] ]
	; UNROLL-NO-VF-NEXT: [[BC_RESUME_VAL:%.*]] = phi i64 [ [[N_VEC]], [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY]] ]			; UNROLL-NO-VF-NEXT: [[BC_RESUME_VAL:%.*]] = phi i64 [ [[N_VEC]], [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY]] ]
	; UNROLL-NO-VF-NEXT: br label [[FOR_BODY:%.*]]			; UNROLL-NO-VF-NEXT: br label [[FOR_BODY:%.*]]
	; UNROLL-NO-VF: for.body:			; UNROLL-NO-VF: for.body:
	; UNROLL-NO-VF-NEXT: [[SCALAR_RECUR:%.]] = phi i16 [ [[SCALAR_RECUR_INIT]], [[SCALAR_PH]] ], [ [[TMP15:%.]], [[FOR_BODY]] ]			; UNROLL-NO-VF-NEXT: [[SCALAR_RECUR:%.]] = phi i16 [ [[SCALAR_RECUR_INIT]], [[SCALAR_PH]] ], [ [[TMP17:%.]], [[FOR_BODY]] ]
	; UNROLL-NO-VF-NEXT: [[INDVARS_IV:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[INDVARS_IV_NEXT:%.]], [[FOR_BODY]] ]			; UNROLL-NO-VF-NEXT: [[INDVARS_IV:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[INDVARS_IV_NEXT:%.]], [[FOR_BODY]] ]
	; UNROLL-NO-VF-NEXT: [[ARRAYCIDX:%.]] = getelementptr inbounds i32, i32 [[C]], i64 [[INDVARS_IV]]			; UNROLL-NO-VF-NEXT: [[ARRAYCIDX:%.]] = getelementptr inbounds i32, i32 [[C]], i64 [[INDVARS_IV]]
	; UNROLL-NO-VF-NEXT: [[CUR_INDEX:%.]] = getelementptr inbounds [2 x i16], [2 x i16] [[A]], i64 [[INDVARS_IV]], i64 1			; UNROLL-NO-VF-NEXT: [[CUR_INDEX:%.]] = getelementptr inbounds [2 x i16], [2 x i16] [[A]], i64 [[INDVARS_IV]], i64 1
	; UNROLL-NO-VF-NEXT: store i32 7, i32* [[ARRAYCIDX]], align 4			; UNROLL-NO-VF-NEXT: store i32 7, i32* [[ARRAYCIDX]], align 4
	; UNROLL-NO-VF-NEXT: [[CONV:%.*]] = sext i16 [[SCALAR_RECUR]] to i32			; UNROLL-NO-VF-NEXT: [[CONV:%.*]] = sext i16 [[SCALAR_RECUR]] to i32
	; UNROLL-NO-VF-NEXT: [[TMP15]] = load i16, i16* [[CUR_INDEX]], align 2			; UNROLL-NO-VF-NEXT: [[TMP17]] = load i16, i16* [[CUR_INDEX]], align 2
	; UNROLL-NO-VF-NEXT: [[CONV3:%.*]] = sext i16 [[TMP15]] to i32			; UNROLL-NO-VF-NEXT: [[CONV3:%.*]] = sext i16 [[TMP17]] to i32
	; UNROLL-NO-VF-NEXT: [[MUL:%.*]] = mul nsw i32 [[CONV3]], [[CONV]]			; UNROLL-NO-VF-NEXT: [[MUL:%.*]] = mul nsw i32 [[CONV3]], [[CONV]]
	; UNROLL-NO-VF-NEXT: [[ARRAYIDX5:%.]] = getelementptr inbounds i32, i32 [[B]], i64 [[INDVARS_IV]]			; UNROLL-NO-VF-NEXT: [[ARRAYIDX5:%.]] = getelementptr inbounds i32, i32 [[B]], i64 [[INDVARS_IV]]
	; UNROLL-NO-VF-NEXT: store i32 [[MUL]], i32* [[ARRAYIDX5]], align 4			; UNROLL-NO-VF-NEXT: store i32 [[MUL]], i32* [[ARRAYIDX5]], align 4
	; UNROLL-NO-VF-NEXT: [[INDVARS_IV_NEXT]] = add nuw nsw i64 [[INDVARS_IV]], 1			; UNROLL-NO-VF-NEXT: [[INDVARS_IV_NEXT]] = add nuw nsw i64 [[INDVARS_IV]], 1
	; UNROLL-NO-VF-NEXT: [[EXITCOND:%.*]] = icmp eq i64 [[INDVARS_IV_NEXT]], [[N]]			; UNROLL-NO-VF-NEXT: [[EXITCOND:%.*]] = icmp eq i64 [[INDVARS_IV_NEXT]], [[N]]
	; UNROLL-NO-VF-NEXT: br i1 [[EXITCOND]], label [[FOR_END]], label [[FOR_BODY]], !llvm.loop [[LOOP20:![0-9]+]]			; UNROLL-NO-VF-NEXT: br i1 [[EXITCOND]], label [[FOR_END]], label [[FOR_BODY]], !llvm.loop [[LOOP20:![0-9]+]]
	; UNROLL-NO-VF: for.end:			; UNROLL-NO-VF: for.end:
	; UNROLL-NO-VF-NEXT: ret void			; UNROLL-NO-VF-NEXT: ret void
	▲ Show 20 Lines • Show All 182 Lines • ▼ Show 20 Lines
	; UNROLL-NO-VF-NEXT: [[MIN_ITERS_CHECK:%.]] = icmp ult i64 [[N:%.]], 2			; UNROLL-NO-VF-NEXT: [[MIN_ITERS_CHECK:%.]] = icmp ult i64 [[N:%.]], 2
	; UNROLL-NO-VF-NEXT: br i1 [[MIN_ITERS_CHECK]], label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]			; UNROLL-NO-VF-NEXT: br i1 [[MIN_ITERS_CHECK]], label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]
	; UNROLL-NO-VF: vector.ph:			; UNROLL-NO-VF: vector.ph:
	; UNROLL-NO-VF-NEXT: [[N_MOD_VF:%.*]] = urem i64 [[N]], 2			; UNROLL-NO-VF-NEXT: [[N_MOD_VF:%.*]] = urem i64 [[N]], 2
	; UNROLL-NO-VF-NEXT: [[N_VEC:%.*]] = sub i64 [[N]], [[N_MOD_VF]]			; UNROLL-NO-VF-NEXT: [[N_VEC:%.*]] = sub i64 [[N]], [[N_MOD_VF]]
	; UNROLL-NO-VF-NEXT: br label [[VECTOR_BODY:%.*]]			; UNROLL-NO-VF-NEXT: br label [[VECTOR_BODY:%.*]]
	; UNROLL-NO-VF: vector.body:			; UNROLL-NO-VF: vector.body:
	; UNROLL-NO-VF-NEXT: [[INDEX:%.]] = phi i64 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[VECTOR_BODY]] ]			; UNROLL-NO-VF-NEXT: [[INDEX:%.]] = phi i64 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[VECTOR_BODY]] ]
	; UNROLL-NO-VF-NEXT: [[VECTOR_RECUR:%.]] = phi i16 [ [[DOTPRE]], [[VECTOR_PH]] ], [ [[TMP5:%.]], [[VECTOR_BODY]] ]			; UNROLL-NO-VF-NEXT: [[VECTOR_RECUR:%.]] = phi i16 [ [[DOTPRE]], [[VECTOR_PH]] ], [ [[TMP7:%.]], [[VECTOR_BODY]] ]
	; UNROLL-NO-VF-NEXT: [[INDUCTION:%.*]] = add i64 [[INDEX]], 0			; UNROLL-NO-VF-NEXT: [[TMP0:%.*]] = add i64 [[INDEX]], 0
	; UNROLL-NO-VF-NEXT: [[INDUCTION1:%.*]] = add i64 [[INDEX]], 1			; UNROLL-NO-VF-NEXT: [[TMP1:%.*]] = add i64 [[INDEX]], 1
	; UNROLL-NO-VF-NEXT: [[TMP0:%.*]] = add nuw nsw i64 [[INDUCTION]], 1			; UNROLL-NO-VF-NEXT: [[TMP2:%.*]] = add nuw nsw i64 [[TMP0]], 1
	; UNROLL-NO-VF-NEXT: [[TMP1:%.*]] = add nuw nsw i64 [[INDUCTION1]], 1			; UNROLL-NO-VF-NEXT: [[TMP3:%.*]] = add nuw nsw i64 [[TMP1]], 1
	; UNROLL-NO-VF-NEXT: [[TMP2:%.]] = getelementptr inbounds i16, i16 [[A]], i64 [[TMP0]]			; UNROLL-NO-VF-NEXT: [[TMP4:%.]] = getelementptr inbounds i16, i16 [[A]], i64 [[TMP2]]
	; UNROLL-NO-VF-NEXT: [[TMP3:%.]] = getelementptr inbounds i16, i16 [[A]], i64 [[TMP1]]			; UNROLL-NO-VF-NEXT: [[TMP5:%.]] = getelementptr inbounds i16, i16 [[A]], i64 [[TMP3]]
	; UNROLL-NO-VF-NEXT: [[TMP4:%.]] = load i16, i16 [[TMP2]], align 2			; UNROLL-NO-VF-NEXT: [[TMP6:%.]] = load i16, i16 [[TMP4]], align 2
	; UNROLL-NO-VF-NEXT: [[TMP5]] = load i16, i16* [[TMP3]], align 2			; UNROLL-NO-VF-NEXT: [[TMP7]] = load i16, i16* [[TMP5]], align 2
	; UNROLL-NO-VF-NEXT: [[TMP6:%.*]] = sext i16 [[VECTOR_RECUR]] to i32			; UNROLL-NO-VF-NEXT: [[TMP8:%.*]] = sext i16 [[VECTOR_RECUR]] to i32
	; UNROLL-NO-VF-NEXT: [[TMP7:%.*]] = sext i16 [[TMP4]] to i32			; UNROLL-NO-VF-NEXT: [[TMP9:%.*]] = sext i16 [[TMP6]] to i32
	; UNROLL-NO-VF-NEXT: [[TMP8:%.*]] = add nsw i32 [[TMP6]], 2			; UNROLL-NO-VF-NEXT: [[TMP10:%.*]] = add nsw i32 [[TMP8]], 2
	; UNROLL-NO-VF-NEXT: [[TMP9:%.*]] = add nsw i32 [[TMP7]], 2			; UNROLL-NO-VF-NEXT: [[TMP11:%.*]] = add nsw i32 [[TMP9]], 2
	; UNROLL-NO-VF-NEXT: [[TMP10:%.*]] = sext i16 [[TMP4]] to i32			; UNROLL-NO-VF-NEXT: [[TMP12:%.*]] = sext i16 [[TMP6]] to i32
	; UNROLL-NO-VF-NEXT: [[TMP11:%.*]] = sext i16 [[TMP5]] to i32			; UNROLL-NO-VF-NEXT: [[TMP13:%.*]] = sext i16 [[TMP7]] to i32
	; UNROLL-NO-VF-NEXT: [[TMP12:%.*]] = mul nsw i32 [[TMP8]], [[TMP10]]			; UNROLL-NO-VF-NEXT: [[TMP14:%.*]] = mul nsw i32 [[TMP10]], [[TMP12]]
	; UNROLL-NO-VF-NEXT: [[TMP13:%.*]] = mul nsw i32 [[TMP9]], [[TMP11]]			; UNROLL-NO-VF-NEXT: [[TMP15:%.*]] = mul nsw i32 [[TMP11]], [[TMP13]]
	; UNROLL-NO-VF-NEXT: [[TMP14:%.]] = getelementptr inbounds i32, i32 [[B:%.*]], i64 [[INDUCTION]]			; UNROLL-NO-VF-NEXT: [[TMP16:%.]] = getelementptr inbounds i32, i32 [[B:%.*]], i64 [[TMP0]]
	; UNROLL-NO-VF-NEXT: [[TMP15:%.]] = getelementptr inbounds i32, i32 [[B]], i64 [[INDUCTION1]]			; UNROLL-NO-VF-NEXT: [[TMP17:%.]] = getelementptr inbounds i32, i32 [[B]], i64 [[TMP1]]
	; UNROLL-NO-VF-NEXT: store i32 [[TMP12]], i32* [[TMP14]], align 4			; UNROLL-NO-VF-NEXT: store i32 [[TMP14]], i32* [[TMP16]], align 4
	; UNROLL-NO-VF-NEXT: store i32 [[TMP13]], i32* [[TMP15]], align 4			; UNROLL-NO-VF-NEXT: store i32 [[TMP15]], i32* [[TMP17]], align 4
	; UNROLL-NO-VF-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 2			; UNROLL-NO-VF-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 2
	; UNROLL-NO-VF-NEXT: [[TMP16:%.*]] = icmp eq i64 [[INDEX_NEXT]], [[N_VEC]]			; UNROLL-NO-VF-NEXT: [[TMP18:%.*]] = icmp eq i64 [[INDEX_NEXT]], [[N_VEC]]
	; UNROLL-NO-VF-NEXT: br i1 [[TMP16]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP21:![0-9]+]]			; UNROLL-NO-VF-NEXT: br i1 [[TMP18]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP21:![0-9]+]]
	; UNROLL-NO-VF: middle.block:			; UNROLL-NO-VF: middle.block:
	; UNROLL-NO-VF-NEXT: [[CMP_N:%.*]] = icmp eq i64 [[N]], [[N_VEC]]			; UNROLL-NO-VF-NEXT: [[CMP_N:%.*]] = icmp eq i64 [[N]], [[N_VEC]]
	; UNROLL-NO-VF-NEXT: br i1 [[CMP_N]], label [[FOR_END:%.*]], label [[SCALAR_PH]]			; UNROLL-NO-VF-NEXT: br i1 [[CMP_N]], label [[FOR_END:%.*]], label [[SCALAR_PH]]
	; UNROLL-NO-VF: scalar.ph:			; UNROLL-NO-VF: scalar.ph:
	; UNROLL-NO-VF-NEXT: [[SCALAR_RECUR_INIT:%.]] = phi i16 [ [[DOTPRE]], [[ENTRY:%.]] ], [ [[TMP5]], [[MIDDLE_BLOCK]] ]			; UNROLL-NO-VF-NEXT: [[SCALAR_RECUR_INIT:%.]] = phi i16 [ [[DOTPRE]], [[ENTRY:%.]] ], [ [[TMP7]], [[MIDDLE_BLOCK]] ]
	; UNROLL-NO-VF-NEXT: [[BC_RESUME_VAL:%.*]] = phi i64 [ [[N_VEC]], [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY]] ]			; UNROLL-NO-VF-NEXT: [[BC_RESUME_VAL:%.*]] = phi i64 [ [[N_VEC]], [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY]] ]
	; UNROLL-NO-VF-NEXT: br label [[FOR_BODY:%.*]]			; UNROLL-NO-VF-NEXT: br label [[FOR_BODY:%.*]]
	; UNROLL-NO-VF: for.body:			; UNROLL-NO-VF: for.body:
	; UNROLL-NO-VF-NEXT: [[SCALAR_RECUR:%.]] = phi i16 [ [[SCALAR_RECUR_INIT]], [[SCALAR_PH]] ], [ [[TMP17:%.]], [[FOR_BODY]] ]			; UNROLL-NO-VF-NEXT: [[SCALAR_RECUR:%.]] = phi i16 [ [[SCALAR_RECUR_INIT]], [[SCALAR_PH]] ], [ [[TMP19:%.]], [[FOR_BODY]] ]
	; UNROLL-NO-VF-NEXT: [[INDVARS_IV:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[INDVARS_IV_NEXT:%.]], [[FOR_BODY]] ]			; UNROLL-NO-VF-NEXT: [[INDVARS_IV:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[INDVARS_IV_NEXT:%.]], [[FOR_BODY]] ]
	; UNROLL-NO-VF-NEXT: [[CONV:%.*]] = sext i16 [[SCALAR_RECUR]] to i32			; UNROLL-NO-VF-NEXT: [[CONV:%.*]] = sext i16 [[SCALAR_RECUR]] to i32
	; UNROLL-NO-VF-NEXT: [[ADD:%.*]] = add nsw i32 [[CONV]], 2			; UNROLL-NO-VF-NEXT: [[ADD:%.*]] = add nsw i32 [[CONV]], 2
	; UNROLL-NO-VF-NEXT: [[INDVARS_IV_NEXT]] = add nuw nsw i64 [[INDVARS_IV]], 1			; UNROLL-NO-VF-NEXT: [[INDVARS_IV_NEXT]] = add nuw nsw i64 [[INDVARS_IV]], 1
	; UNROLL-NO-VF-NEXT: [[ARRAYIDX2:%.]] = getelementptr inbounds i16, i16 [[A]], i64 [[INDVARS_IV_NEXT]]			; UNROLL-NO-VF-NEXT: [[ARRAYIDX2:%.]] = getelementptr inbounds i16, i16 [[A]], i64 [[INDVARS_IV_NEXT]]
	; UNROLL-NO-VF-NEXT: [[TMP17]] = load i16, i16* [[ARRAYIDX2]], align 2			; UNROLL-NO-VF-NEXT: [[TMP19]] = load i16, i16* [[ARRAYIDX2]], align 2
	; UNROLL-NO-VF-NEXT: [[CONV3:%.*]] = sext i16 [[TMP17]] to i32			; UNROLL-NO-VF-NEXT: [[CONV3:%.*]] = sext i16 [[TMP19]] to i32
	; UNROLL-NO-VF-NEXT: [[MUL:%.*]] = mul nsw i32 [[ADD]], [[CONV3]]			; UNROLL-NO-VF-NEXT: [[MUL:%.*]] = mul nsw i32 [[ADD]], [[CONV3]]
	; UNROLL-NO-VF-NEXT: [[ARRAYIDX5:%.]] = getelementptr inbounds i32, i32 [[B]], i64 [[INDVARS_IV]]			; UNROLL-NO-VF-NEXT: [[ARRAYIDX5:%.]] = getelementptr inbounds i32, i32 [[B]], i64 [[INDVARS_IV]]
	; UNROLL-NO-VF-NEXT: store i32 [[MUL]], i32* [[ARRAYIDX5]], align 4			; UNROLL-NO-VF-NEXT: store i32 [[MUL]], i32* [[ARRAYIDX5]], align 4
	; UNROLL-NO-VF-NEXT: [[EXITCOND:%.*]] = icmp eq i64 [[INDVARS_IV_NEXT]], [[N]]			; UNROLL-NO-VF-NEXT: [[EXITCOND:%.*]] = icmp eq i64 [[INDVARS_IV_NEXT]], [[N]]
	; UNROLL-NO-VF-NEXT: br i1 [[EXITCOND]], label [[FOR_END]], label [[FOR_BODY]], !llvm.loop [[LOOP22:![0-9]+]]			; UNROLL-NO-VF-NEXT: br i1 [[EXITCOND]], label [[FOR_END]], label [[FOR_BODY]], !llvm.loop [[LOOP22:![0-9]+]]
	; UNROLL-NO-VF: for.end:			; UNROLL-NO-VF: for.end:
	; UNROLL-NO-VF-NEXT: ret void			; UNROLL-NO-VF-NEXT: ret void
	;			;
	▲ Show 20 Lines • Show All 233 Lines • ▼ Show 20 Lines
	;			;
	; UNROLL-NO-VF-LABEL: @sink_dead_inst(			; UNROLL-NO-VF-LABEL: @sink_dead_inst(
	; UNROLL-NO-VF-NEXT: entry:			; UNROLL-NO-VF-NEXT: entry:
	; UNROLL-NO-VF-NEXT: br i1 false, label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]			; UNROLL-NO-VF-NEXT: br i1 false, label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]
	; UNROLL-NO-VF: vector.ph:			; UNROLL-NO-VF: vector.ph:
	; UNROLL-NO-VF-NEXT: br label [[VECTOR_BODY:%.*]]			; UNROLL-NO-VF-NEXT: br label [[VECTOR_BODY:%.*]]
	; UNROLL-NO-VF: vector.body:			; UNROLL-NO-VF: vector.body:
	; UNROLL-NO-VF-NEXT: [[INDEX:%.]] = phi i32 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[VECTOR_BODY]] ]			; UNROLL-NO-VF-NEXT: [[INDEX:%.]] = phi i32 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[VECTOR_BODY]] ]
	; UNROLL-NO-VF-NEXT: [[VECTOR_RECUR:%.]] = phi i16 [ 0, [[VECTOR_PH]] ], [ [[TMP6:%.]], [[VECTOR_BODY]] ]			; UNROLL-NO-VF-NEXT: [[VECTOR_RECUR:%.]] = phi i16 [ 0, [[VECTOR_PH]] ], [ [[TMP8:%.]], [[VECTOR_BODY]] ]
	; UNROLL-NO-VF-NEXT: [[VECTOR_RECUR1:%.]] = phi i32 [ -27, [[VECTOR_PH]] ], [ [[TMP4:%.]], [[VECTOR_BODY]] ]			; UNROLL-NO-VF-NEXT: [[VECTOR_RECUR1:%.]] = phi i32 [ -27, [[VECTOR_PH]] ], [ [[TMP6:%.]], [[VECTOR_BODY]] ]
	; UNROLL-NO-VF-NEXT: [[TMP0:%.*]] = trunc i32 [[INDEX]] to i16			; UNROLL-NO-VF-NEXT: [[TMP0:%.*]] = trunc i32 [[INDEX]] to i16
	; UNROLL-NO-VF-NEXT: [[OFFSET_IDX:%.*]] = add i16 -27, [[TMP0]]			; UNROLL-NO-VF-NEXT: [[OFFSET_IDX:%.*]] = add i16 -27, [[TMP0]]
	; UNROLL-NO-VF-NEXT: [[INDUCTION:%.*]] = add i16 [[OFFSET_IDX]], 0			; UNROLL-NO-VF-NEXT: [[TMP1:%.*]] = add i16 [[OFFSET_IDX]], 0
	; UNROLL-NO-VF-NEXT: [[INDUCTION2:%.*]] = add i16 [[OFFSET_IDX]], 1			; UNROLL-NO-VF-NEXT: [[TMP2:%.*]] = add i16 [[OFFSET_IDX]], 1
	; UNROLL-NO-VF-NEXT: [[TMP1:%.*]] = add i16 [[INDUCTION]], 1			; UNROLL-NO-VF-NEXT: [[TMP3:%.*]] = add i16 [[TMP1]], 1
	; UNROLL-NO-VF-NEXT: [[TMP2:%.*]] = add i16 [[INDUCTION2]], 1			; UNROLL-NO-VF-NEXT: [[TMP4:%.*]] = add i16 [[TMP2]], 1
	; UNROLL-NO-VF-NEXT: [[TMP3:%.*]] = zext i16 [[TMP1]] to i32			; UNROLL-NO-VF-NEXT: [[TMP5:%.*]] = zext i16 [[TMP3]] to i32
	; UNROLL-NO-VF-NEXT: [[TMP4]] = zext i16 [[TMP2]] to i32			; UNROLL-NO-VF-NEXT: [[TMP6]] = zext i16 [[TMP4]] to i32
	; UNROLL-NO-VF-NEXT: [[TMP5:%.*]] = add i16 [[TMP1]], 5			; UNROLL-NO-VF-NEXT: [[TMP7:%.*]] = add i16 [[TMP3]], 5
	; UNROLL-NO-VF-NEXT: [[TMP6]] = add i16 [[TMP2]], 5			; UNROLL-NO-VF-NEXT: [[TMP8]] = add i16 [[TMP4]], 5
	; UNROLL-NO-VF-NEXT: [[INDEX_NEXT]] = add nuw i32 [[INDEX]], 2			; UNROLL-NO-VF-NEXT: [[INDEX_NEXT]] = add nuw i32 [[INDEX]], 2
	; UNROLL-NO-VF-NEXT: [[TMP7:%.*]] = icmp eq i32 [[INDEX_NEXT]], 42			; UNROLL-NO-VF-NEXT: [[TMP9:%.*]] = icmp eq i32 [[INDEX_NEXT]], 42
	; UNROLL-NO-VF-NEXT: br i1 [[TMP7]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP23:![0-9]+]]			; UNROLL-NO-VF-NEXT: br i1 [[TMP9]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP23:![0-9]+]]
	; UNROLL-NO-VF: middle.block:			; UNROLL-NO-VF: middle.block:
	; UNROLL-NO-VF-NEXT: [[CMP_N:%.*]] = icmp eq i32 43, 42			; UNROLL-NO-VF-NEXT: [[CMP_N:%.*]] = icmp eq i32 43, 42
	; UNROLL-NO-VF-NEXT: br i1 [[CMP_N]], label [[FOR_END:%.*]], label [[SCALAR_PH]]			; UNROLL-NO-VF-NEXT: br i1 [[CMP_N]], label [[FOR_END:%.*]], label [[SCALAR_PH]]
	; UNROLL-NO-VF: scalar.ph:			; UNROLL-NO-VF: scalar.ph:
	; UNROLL-NO-VF-NEXT: [[SCALAR_RECUR_INIT3:%.]] = phi i32 [ -27, [[ENTRY:%.]] ], [ [[TMP4]], [[MIDDLE_BLOCK]] ]			; UNROLL-NO-VF-NEXT: [[SCALAR_RECUR_INIT2:%.]] = phi i32 [ -27, [[ENTRY:%.]] ], [ [[TMP6]], [[MIDDLE_BLOCK]] ]
	; UNROLL-NO-VF-NEXT: [[SCALAR_RECUR_INIT:%.*]] = phi i16 [ 0, [[ENTRY]] ], [ [[TMP6]], [[MIDDLE_BLOCK]] ]			; UNROLL-NO-VF-NEXT: [[SCALAR_RECUR_INIT:%.*]] = phi i16 [ 0, [[ENTRY]] ], [ [[TMP8]], [[MIDDLE_BLOCK]] ]
	; UNROLL-NO-VF-NEXT: [[BC_RESUME_VAL:%.*]] = phi i16 [ 15, [[MIDDLE_BLOCK]] ], [ -27, [[ENTRY]] ]			; UNROLL-NO-VF-NEXT: [[BC_RESUME_VAL:%.*]] = phi i16 [ 15, [[MIDDLE_BLOCK]] ], [ -27, [[ENTRY]] ]
	; UNROLL-NO-VF-NEXT: br label [[FOR_COND:%.*]]			; UNROLL-NO-VF-NEXT: br label [[FOR_COND:%.*]]
	; UNROLL-NO-VF: for.cond:			; UNROLL-NO-VF: for.cond:
	; UNROLL-NO-VF-NEXT: [[IV:%.]] = phi i16 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[IV_NEXT:%.]], [[FOR_COND]] ]			; UNROLL-NO-VF-NEXT: [[IV:%.]] = phi i16 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[IV_NEXT:%.]], [[FOR_COND]] ]
	; UNROLL-NO-VF-NEXT: [[SCALAR_RECUR:%.]] = phi i16 [ [[SCALAR_RECUR_INIT]], [[SCALAR_PH]] ], [ [[REC_1_PREV:%.]], [[FOR_COND]] ]			; UNROLL-NO-VF-NEXT: [[SCALAR_RECUR:%.]] = phi i16 [ [[SCALAR_RECUR_INIT]], [[SCALAR_PH]] ], [ [[REC_1_PREV:%.]], [[FOR_COND]] ]
	; UNROLL-NO-VF-NEXT: [[SCALAR_RECUR4:%.]] = phi i32 [ [[SCALAR_RECUR_INIT3]], [[SCALAR_PH]] ], [ [[REC_2_PREV:%.]], [[FOR_COND]] ]			; UNROLL-NO-VF-NEXT: [[SCALAR_RECUR3:%.]] = phi i32 [ [[SCALAR_RECUR_INIT2]], [[SCALAR_PH]] ], [ [[REC_2_PREV:%.]], [[FOR_COND]] ]
	; UNROLL-NO-VF-NEXT: [[USE_REC_1:%.*]] = sub i16 [[SCALAR_RECUR]], 10			; UNROLL-NO-VF-NEXT: [[USE_REC_1:%.*]] = sub i16 [[SCALAR_RECUR]], 10
	; UNROLL-NO-VF-NEXT: [[CMP:%.*]] = icmp eq i32 [[SCALAR_RECUR4]], 15			; UNROLL-NO-VF-NEXT: [[CMP:%.*]] = icmp eq i32 [[SCALAR_RECUR3]], 15
	; UNROLL-NO-VF-NEXT: [[IV_NEXT]] = add i16 [[IV]], 1			; UNROLL-NO-VF-NEXT: [[IV_NEXT]] = add i16 [[IV]], 1
	; UNROLL-NO-VF-NEXT: [[REC_2_PREV]] = zext i16 [[IV_NEXT]] to i32			; UNROLL-NO-VF-NEXT: [[REC_2_PREV]] = zext i16 [[IV_NEXT]] to i32
	; UNROLL-NO-VF-NEXT: [[REC_1_PREV]] = add i16 [[IV_NEXT]], 5			; UNROLL-NO-VF-NEXT: [[REC_1_PREV]] = add i16 [[IV_NEXT]], 5
	; UNROLL-NO-VF-NEXT: br i1 [[CMP]], label [[FOR_END]], label [[FOR_COND]], !llvm.loop [[LOOP24:![0-9]+]]			; UNROLL-NO-VF-NEXT: br i1 [[CMP]], label [[FOR_END]], label [[FOR_COND]], !llvm.loop [[LOOP24:![0-9]+]]
	; UNROLL-NO-VF: for.end:			; UNROLL-NO-VF: for.end:
	; UNROLL-NO-VF-NEXT: ret void			; UNROLL-NO-VF-NEXT: ret void
	;			;
	; SINK-AFTER-LABEL: @sink_dead_inst(			; SINK-AFTER-LABEL: @sink_dead_inst(
	▲ Show 20 Lines • Show All 165 Lines • ▼ Show 20 Lines
	; UNROLL-NO-IC-NEXT: [[TMP48:%.*]] = select <4 x i1> [[TMP2]], <4 x i32> [[TMP46]], <4 x i32> [[VEC_PHI]]			; UNROLL-NO-IC-NEXT: [[TMP48:%.*]] = select <4 x i1> [[TMP2]], <4 x i32> [[TMP46]], <4 x i32> [[VEC_PHI]]
	; UNROLL-NO-IC-NEXT: [[TMP49:%.*]] = select <4 x i1> [[TMP3]], <4 x i32> [[TMP47]], <4 x i32> [[VEC_PHI1]]			; UNROLL-NO-IC-NEXT: [[TMP49:%.*]] = select <4 x i1> [[TMP3]], <4 x i32> [[TMP47]], <4 x i32> [[VEC_PHI1]]
	; UNROLL-NO-IC-NEXT: [[INDEX_NEXT]] = add i32 [[INDEX]], 8			; UNROLL-NO-IC-NEXT: [[INDEX_NEXT]] = add i32 [[INDEX]], 8
	; UNROLL-NO-IC-NEXT: [[TMP50:%.*]] = icmp eq i32 [[INDEX_NEXT]], [[N_VEC]]			; UNROLL-NO-IC-NEXT: [[TMP50:%.*]] = icmp eq i32 [[INDEX_NEXT]], [[N_VEC]]
	; UNROLL-NO-IC-NEXT: br i1 [[TMP50]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !prof [[PROF26:![0-9]+]], !llvm.loop [[LOOP27:![0-9]+]]			; UNROLL-NO-IC-NEXT: br i1 [[TMP50]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !prof [[PROF26:![0-9]+]], !llvm.loop [[LOOP27:![0-9]+]]
	; UNROLL-NO-IC: middle.block:			; UNROLL-NO-IC: middle.block:
	; UNROLL-NO-IC-NEXT: [[BIN_RDX:%.*]] = add <4 x i32> [[TMP49]], [[TMP48]]			; UNROLL-NO-IC-NEXT: [[BIN_RDX:%.*]] = add <4 x i32> [[TMP49]], [[TMP48]]
	; UNROLL-NO-IC-NEXT: [[TMP51:%.*]] = call i32 @llvm.vector.reduce.add.v4i32(<4 x i32> [[BIN_RDX]])			; UNROLL-NO-IC-NEXT: [[TMP51:%.*]] = call i32 @llvm.vector.reduce.add.v4i32(<4 x i32> [[BIN_RDX]])
				; UNROLL-NO-IC-NEXT: [[RDX_START:%.*]] = add i32 0, [[TMP51]]
	; UNROLL-NO-IC-NEXT: [[VECTOR_RECUR_EXTRACT:%.*]] = extractelement <4 x i32> [[TMP43]], i32 3			; UNROLL-NO-IC-NEXT: [[VECTOR_RECUR_EXTRACT:%.*]] = extractelement <4 x i32> [[TMP43]], i32 3
	; UNROLL-NO-IC-NEXT: [[VECTOR_RECUR_EXTRACT_FOR_PHI:%.*]] = extractelement <4 x i32> [[TMP43]], i32 2			; UNROLL-NO-IC-NEXT: [[VECTOR_RECUR_EXTRACT_FOR_PHI:%.*]] = extractelement <4 x i32> [[TMP43]], i32 2
	; UNROLL-NO-IC-NEXT: br i1 true, label [[BB1:%.*]], label [[SCALAR_PH]]			; UNROLL-NO-IC-NEXT: br i1 true, label [[BB1:%.*]], label [[SCALAR_PH]]
	; UNROLL-NO-IC: scalar.ph:			; UNROLL-NO-IC: scalar.ph:
	; UNROLL-NO-IC-NEXT: [[SCALAR_RECUR_INIT:%.]] = phi i32 [ 0, [[BB:%.]] ], [ [[VECTOR_RECUR_EXTRACT]], [[MIDDLE_BLOCK]] ]			; UNROLL-NO-IC-NEXT: [[SCALAR_RECUR_INIT:%.]] = phi i32 [ 0, [[BB:%.]] ], [ [[VECTOR_RECUR_EXTRACT]], [[MIDDLE_BLOCK]] ]
	; UNROLL-NO-IC-NEXT: [[BC_RESUME_VAL:%.*]] = phi i32 [ [[IND_END]], [[MIDDLE_BLOCK]] ], [ [[Y]], [[BB]] ]			; UNROLL-NO-IC-NEXT: [[BC_RESUME_VAL:%.*]] = phi i32 [ [[IND_END]], [[MIDDLE_BLOCK]] ], [ [[Y]], [[BB]] ]
	; UNROLL-NO-IC-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 0, [[BB]] ], [ [[TMP51]], [[MIDDLE_BLOCK]] ]			; UNROLL-NO-IC-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 0, [[BB]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; UNROLL-NO-IC-NEXT: br label [[BB2:%.*]]			; UNROLL-NO-IC-NEXT: br label [[BB2:%.*]]
	; UNROLL-NO-IC: bb1:			; UNROLL-NO-IC: bb1:
	; UNROLL-NO-IC-NEXT: [[VAR:%.]] = phi i32 [ [[VAR6:%.]], [[BB2]] ], [ [[TMP51]], [[MIDDLE_BLOCK]] ]			; UNROLL-NO-IC-NEXT: [[VAR:%.]] = phi i32 [ [[VAR6:%.]], [[BB2]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; UNROLL-NO-IC-NEXT: ret i32 [[VAR]]			; UNROLL-NO-IC-NEXT: ret i32 [[VAR]]
	; UNROLL-NO-IC: bb2:			; UNROLL-NO-IC: bb2:
	; UNROLL-NO-IC-NEXT: [[VAR3:%.]] = phi i32 [ [[VAR8:%.]], [[BB2]] ], [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ]			; UNROLL-NO-IC-NEXT: [[VAR3:%.]] = phi i32 [ [[VAR8:%.]], [[BB2]] ], [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ]
	; UNROLL-NO-IC-NEXT: [[SCALAR_RECUR:%.]] = phi i32 [ [[VAR7:%.]], [[BB2]] ], [ [[SCALAR_RECUR_INIT]], [[SCALAR_PH]] ]			; UNROLL-NO-IC-NEXT: [[SCALAR_RECUR:%.]] = phi i32 [ [[VAR7:%.]], [[BB2]] ], [ [[SCALAR_RECUR_INIT]], [[SCALAR_PH]] ]
	; UNROLL-NO-IC-NEXT: [[VAR5:%.*]] = phi i32 [ [[VAR6]], [[BB2]] ], [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ]			; UNROLL-NO-IC-NEXT: [[VAR5:%.*]] = phi i32 [ [[VAR6]], [[BB2]] ], [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ]
	; UNROLL-NO-IC-NEXT: [[VAR6]] = add i32 [[VAR5]], [[SCALAR_RECUR]]			; UNROLL-NO-IC-NEXT: [[VAR6]] = add i32 [[VAR5]], [[SCALAR_RECUR]]
	; UNROLL-NO-IC-NEXT: [[VAR7]] = udiv i32 219220132, [[VAR3]]			; UNROLL-NO-IC-NEXT: [[VAR7]] = udiv i32 219220132, [[VAR3]]
	; UNROLL-NO-IC-NEXT: [[VAR8]] = add nsw i32 [[VAR3]], -1			; UNROLL-NO-IC-NEXT: [[VAR8]] = add nsw i32 [[VAR3]], -1
	Show All 9 Lines
	; UNROLL-NO-VF: vector.ph:			; UNROLL-NO-VF: vector.ph:
	; UNROLL-NO-VF-NEXT: [[N_RND_UP:%.*]] = add i32 [[TMP1]], 1			; UNROLL-NO-VF-NEXT: [[N_RND_UP:%.*]] = add i32 [[TMP1]], 1
	; UNROLL-NO-VF-NEXT: [[N_MOD_VF:%.*]] = urem i32 [[N_RND_UP]], 2			; UNROLL-NO-VF-NEXT: [[N_MOD_VF:%.*]] = urem i32 [[N_RND_UP]], 2
	; UNROLL-NO-VF-NEXT: [[N_VEC:%.*]] = sub i32 [[N_RND_UP]], [[N_MOD_VF]]			; UNROLL-NO-VF-NEXT: [[N_VEC:%.*]] = sub i32 [[N_RND_UP]], [[N_MOD_VF]]
	; UNROLL-NO-VF-NEXT: [[IND_END:%.*]] = sub i32 [[Y]], [[N_VEC]]			; UNROLL-NO-VF-NEXT: [[IND_END:%.*]] = sub i32 [[Y]], [[N_VEC]]
	; UNROLL-NO-VF-NEXT: [[TRIP_COUNT_MINUS_1:%.*]] = sub i32 [[TMP1]], 1			; UNROLL-NO-VF-NEXT: [[TRIP_COUNT_MINUS_1:%.*]] = sub i32 [[TMP1]], 1
	; UNROLL-NO-VF-NEXT: br label [[VECTOR_BODY:%.*]]			; UNROLL-NO-VF-NEXT: br label [[VECTOR_BODY:%.*]]
	; UNROLL-NO-VF: vector.body:			; UNROLL-NO-VF: vector.body:
	; UNROLL-NO-VF-NEXT: [[INDEX:%.]] = phi i32 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[PRED_UDIV_CONTINUE5:%.*]] ]			; UNROLL-NO-VF-NEXT: [[INDEX:%.]] = phi i32 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[PRED_UDIV_CONTINUE4:%.*]] ]
	; UNROLL-NO-VF-NEXT: [[VECTOR_RECUR:%.]] = phi i32 [ 0, [[VECTOR_PH]] ], [ [[TMP7:%.]], [[PRED_UDIV_CONTINUE5]] ]			; UNROLL-NO-VF-NEXT: [[VECTOR_RECUR:%.]] = phi i32 [ 0, [[VECTOR_PH]] ], [ [[TMP9:%.]], [[PRED_UDIV_CONTINUE4]] ]
	; UNROLL-NO-VF-NEXT: [[VEC_PHI:%.]] = phi i32 [ 0, [[VECTOR_PH]] ], [ [[TMP8:%.]], [[PRED_UDIV_CONTINUE5]] ]			; UNROLL-NO-VF-NEXT: [[VEC_PHI:%.]] = phi i32 [ 0, [[VECTOR_PH]] ], [ [[TMP10:%.]], [[PRED_UDIV_CONTINUE4]] ]
	; UNROLL-NO-VF-NEXT: [[VEC_PHI1:%.]] = phi i32 [ 0, [[VECTOR_PH]] ], [ [[TMP9:%.]], [[PRED_UDIV_CONTINUE5]] ]			; UNROLL-NO-VF-NEXT: [[VEC_PHI1:%.]] = phi i32 [ 0, [[VECTOR_PH]] ], [ [[TMP11:%.]], [[PRED_UDIV_CONTINUE4]] ]
	; UNROLL-NO-VF-NEXT: [[OFFSET_IDX:%.*]] = sub i32 [[Y]], [[INDEX]]			; UNROLL-NO-VF-NEXT: [[OFFSET_IDX:%.*]] = sub i32 [[Y]], [[INDEX]]
	; UNROLL-NO-VF-NEXT: [[VEC_IV:%.*]] = add i32 [[INDEX]], 0			; UNROLL-NO-VF-NEXT: [[VEC_IV:%.*]] = add i32 [[INDEX]], 0
	; UNROLL-NO-VF-NEXT: [[VEC_IV3:%.*]] = add i32 [[INDEX]], 1			; UNROLL-NO-VF-NEXT: [[VEC_IV2:%.*]] = add i32 [[INDEX]], 1
	; UNROLL-NO-VF-NEXT: [[TMP2:%.*]] = icmp ule i32 [[VEC_IV]], [[TRIP_COUNT_MINUS_1]]			; UNROLL-NO-VF-NEXT: [[TMP2:%.*]] = icmp ule i32 [[VEC_IV]], [[TRIP_COUNT_MINUS_1]]
	; UNROLL-NO-VF-NEXT: [[TMP3:%.*]] = icmp ule i32 [[VEC_IV3]], [[TRIP_COUNT_MINUS_1]]			; UNROLL-NO-VF-NEXT: [[TMP3:%.*]] = icmp ule i32 [[VEC_IV2]], [[TRIP_COUNT_MINUS_1]]
	; UNROLL-NO-VF-NEXT: br i1 [[TMP2]], label [[PRED_UDIV_IF:%.]], label [[PRED_UDIV_CONTINUE:%.]]			; UNROLL-NO-VF-NEXT: br i1 [[TMP2]], label [[PRED_UDIV_IF:%.]], label [[PRED_UDIV_CONTINUE:%.]]
	; UNROLL-NO-VF: pred.udiv.if:			; UNROLL-NO-VF: pred.udiv.if:
	; UNROLL-NO-VF-NEXT: [[INDUCTION:%.*]] = add i32 [[OFFSET_IDX]], 0			; UNROLL-NO-VF-NEXT: [[TMP4:%.*]] = add i32 [[OFFSET_IDX]], 0
	; UNROLL-NO-VF-NEXT: [[TMP4:%.*]] = udiv i32 219220132, [[INDUCTION]]			; UNROLL-NO-VF-NEXT: [[TMP5:%.*]] = udiv i32 219220132, [[TMP4]]
	; UNROLL-NO-VF-NEXT: br label [[PRED_UDIV_CONTINUE]]			; UNROLL-NO-VF-NEXT: br label [[PRED_UDIV_CONTINUE]]
	; UNROLL-NO-VF: pred.udiv.continue:			; UNROLL-NO-VF: pred.udiv.continue:
	; UNROLL-NO-VF-NEXT: [[TMP5:%.*]] = phi i32 [ poison, [[VECTOR_BODY]] ], [ [[TMP4]], [[PRED_UDIV_IF]] ]			; UNROLL-NO-VF-NEXT: [[TMP6:%.*]] = phi i32 [ poison, [[VECTOR_BODY]] ], [ [[TMP5]], [[PRED_UDIV_IF]] ]
	; UNROLL-NO-VF-NEXT: br i1 [[TMP3]], label [[PRED_UDIV_IF4:%.*]], label [[PRED_UDIV_CONTINUE5]]			; UNROLL-NO-VF-NEXT: br i1 [[TMP3]], label [[PRED_UDIV_IF3:%.*]], label [[PRED_UDIV_CONTINUE4]]
	; UNROLL-NO-VF: pred.udiv.if3:			; UNROLL-NO-VF: pred.udiv.if3:
	; UNROLL-NO-VF-NEXT: [[INDUCTION2:%.*]] = add i32 [[OFFSET_IDX]], -1			; UNROLL-NO-VF-NEXT: [[TMP7:%.*]] = add i32 [[OFFSET_IDX]], -1
	; UNROLL-NO-VF-NEXT: [[TMP6:%.*]] = udiv i32 219220132, [[INDUCTION2]]			; UNROLL-NO-VF-NEXT: [[TMP8:%.*]] = udiv i32 219220132, [[TMP7]]
	; UNROLL-NO-VF-NEXT: br label [[PRED_UDIV_CONTINUE5]]			; UNROLL-NO-VF-NEXT: br label [[PRED_UDIV_CONTINUE4]]
	; UNROLL-NO-VF: pred.udiv.continue4:			; UNROLL-NO-VF: pred.udiv.continue4:
	; UNROLL-NO-VF-NEXT: [[TMP7]] = phi i32 [ poison, [[PRED_UDIV_CONTINUE]] ], [ [[TMP6]], [[PRED_UDIV_IF4]] ]			; UNROLL-NO-VF-NEXT: [[TMP9]] = phi i32 [ poison, [[PRED_UDIV_CONTINUE]] ], [ [[TMP8]], [[PRED_UDIV_IF3]] ]
	; UNROLL-NO-VF-NEXT: [[TMP8]] = add i32 [[VEC_PHI]], [[VECTOR_RECUR]]			; UNROLL-NO-VF-NEXT: [[TMP10]] = add i32 [[VEC_PHI]], [[VECTOR_RECUR]]
	; UNROLL-NO-VF-NEXT: [[TMP9]] = add i32 [[VEC_PHI1]], [[TMP5]]			; UNROLL-NO-VF-NEXT: [[TMP11]] = add i32 [[VEC_PHI1]], [[TMP6]]
	; UNROLL-NO-VF-NEXT: [[TMP10:%.*]] = select i1 [[TMP2]], i32 [[TMP8]], i32 [[VEC_PHI]]			; UNROLL-NO-VF-NEXT: [[TMP12:%.*]] = select i1 [[TMP2]], i32 [[TMP10]], i32 [[VEC_PHI]]
	; UNROLL-NO-VF-NEXT: [[TMP11:%.*]] = select i1 [[TMP3]], i32 [[TMP9]], i32 [[VEC_PHI1]]			; UNROLL-NO-VF-NEXT: [[TMP13:%.*]] = select i1 [[TMP3]], i32 [[TMP11]], i32 [[VEC_PHI1]]
	; UNROLL-NO-VF-NEXT: [[INDEX_NEXT]] = add i32 [[INDEX]], 2			; UNROLL-NO-VF-NEXT: [[INDEX_NEXT]] = add i32 [[INDEX]], 2
	; UNROLL-NO-VF-NEXT: [[TMP12:%.*]] = icmp eq i32 [[INDEX_NEXT]], [[N_VEC]]			; UNROLL-NO-VF-NEXT: [[TMP14:%.*]] = icmp eq i32 [[INDEX_NEXT]], [[N_VEC]]
	; UNROLL-NO-VF-NEXT: br i1 [[TMP12]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !prof [[PROF25:![0-9]+]], !llvm.loop [[LOOP26:![0-9]+]]			; UNROLL-NO-VF-NEXT: br i1 [[TMP14]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !prof [[PROF25:![0-9]+]], !llvm.loop [[LOOP26:![0-9]+]]
	; UNROLL-NO-VF: middle.block:			; UNROLL-NO-VF: middle.block:
	; UNROLL-NO-VF-NEXT: [[BIN_RDX:%.*]] = add i32 [[TMP11]], [[TMP10]]			; UNROLL-NO-VF-NEXT: [[BIN_RDX:%.*]] = add i32 [[TMP13]], [[TMP12]]
	; UNROLL-NO-VF-NEXT: br i1 true, label [[BB1:%.*]], label [[SCALAR_PH]]			; UNROLL-NO-VF-NEXT: br i1 true, label [[BB1:%.*]], label [[SCALAR_PH]]
	; UNROLL-NO-VF: scalar.ph:			; UNROLL-NO-VF: scalar.ph:
	; UNROLL-NO-VF-NEXT: [[SCALAR_RECUR_INIT:%.]] = phi i32 [ 0, [[BB:%.]] ], [ [[TMP7]], [[MIDDLE_BLOCK]] ]			; UNROLL-NO-VF-NEXT: [[SCALAR_RECUR_INIT:%.]] = phi i32 [ 0, [[BB:%.]] ], [ [[TMP9]], [[MIDDLE_BLOCK]] ]
	; UNROLL-NO-VF-NEXT: [[BC_RESUME_VAL:%.*]] = phi i32 [ [[IND_END]], [[MIDDLE_BLOCK]] ], [ [[Y]], [[BB]] ]			; UNROLL-NO-VF-NEXT: [[BC_RESUME_VAL:%.*]] = phi i32 [ [[IND_END]], [[MIDDLE_BLOCK]] ], [ [[Y]], [[BB]] ]
	; UNROLL-NO-VF-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 0, [[BB]] ], [ [[BIN_RDX]], [[MIDDLE_BLOCK]] ]			; UNROLL-NO-VF-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 0, [[BB]] ], [ [[BIN_RDX]], [[MIDDLE_BLOCK]] ]
	; UNROLL-NO-VF-NEXT: br label [[BB2:%.*]]			; UNROLL-NO-VF-NEXT: br label [[BB2:%.*]]
	; UNROLL-NO-VF: bb1:			; UNROLL-NO-VF: bb1:
	; UNROLL-NO-VF-NEXT: [[VAR:%.]] = phi i32 [ [[VAR6:%.]], [[BB2]] ], [ [[BIN_RDX]], [[MIDDLE_BLOCK]] ]			; UNROLL-NO-VF-NEXT: [[VAR:%.]] = phi i32 [ [[VAR6:%.]], [[BB2]] ], [ [[BIN_RDX]], [[MIDDLE_BLOCK]] ]
	; UNROLL-NO-VF-NEXT: ret i32 [[VAR]]			; UNROLL-NO-VF-NEXT: ret i32 [[VAR]]
	; UNROLL-NO-VF: bb2:			; UNROLL-NO-VF: bb2:
	; UNROLL-NO-VF-NEXT: [[VAR3:%.]] = phi i32 [ [[VAR8:%.]], [[BB2]] ], [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ]			; UNROLL-NO-VF-NEXT: [[VAR3:%.]] = phi i32 [ [[VAR8:%.]], [[BB2]] ], [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ]
	▲ Show 20 Lines • Show All 68 Lines • ▼ Show 20 Lines
	; SINK-AFTER-NEXT: [[TMP23:%.*]] = shufflevector <4 x i32> [[VECTOR_RECUR]], <4 x i32> [[TMP22]], <4 x i32> <i32 3, i32 4, i32 5, i32 6>			; SINK-AFTER-NEXT: [[TMP23:%.*]] = shufflevector <4 x i32> [[VECTOR_RECUR]], <4 x i32> [[TMP22]], <4 x i32> <i32 3, i32 4, i32 5, i32 6>
	; SINK-AFTER-NEXT: [[TMP24]] = add <4 x i32> [[VEC_PHI]], [[TMP23]]			; SINK-AFTER-NEXT: [[TMP24]] = add <4 x i32> [[VEC_PHI]], [[TMP23]]
	; SINK-AFTER-NEXT: [[TMP25:%.*]] = select <4 x i1> [[TMP2]], <4 x i32> [[TMP24]], <4 x i32> [[VEC_PHI]]			; SINK-AFTER-NEXT: [[TMP25:%.*]] = select <4 x i1> [[TMP2]], <4 x i32> [[TMP24]], <4 x i32> [[VEC_PHI]]
	; SINK-AFTER-NEXT: [[INDEX_NEXT]] = add i32 [[INDEX]], 4			; SINK-AFTER-NEXT: [[INDEX_NEXT]] = add i32 [[INDEX]], 4
	; SINK-AFTER-NEXT: [[TMP26:%.*]] = icmp eq i32 [[INDEX_NEXT]], [[N_VEC]]			; SINK-AFTER-NEXT: [[TMP26:%.*]] = icmp eq i32 [[INDEX_NEXT]], [[N_VEC]]
	; SINK-AFTER-NEXT: br i1 [[TMP26]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !prof [[PROF26:![0-9]+]], !llvm.loop [[LOOP27:![0-9]+]]			; SINK-AFTER-NEXT: br i1 [[TMP26]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !prof [[PROF26:![0-9]+]], !llvm.loop [[LOOP27:![0-9]+]]
	; SINK-AFTER: middle.block:			; SINK-AFTER: middle.block:
	; SINK-AFTER-NEXT: [[TMP27:%.*]] = call i32 @llvm.vector.reduce.add.v4i32(<4 x i32> [[TMP25]])			; SINK-AFTER-NEXT: [[TMP27:%.*]] = call i32 @llvm.vector.reduce.add.v4i32(<4 x i32> [[TMP25]])
				; SINK-AFTER-NEXT: [[RDX_START:%.*]] = add i32 0, [[TMP27]]
	; SINK-AFTER-NEXT: [[VECTOR_RECUR_EXTRACT:%.*]] = extractelement <4 x i32> [[TMP22]], i32 3			; SINK-AFTER-NEXT: [[VECTOR_RECUR_EXTRACT:%.*]] = extractelement <4 x i32> [[TMP22]], i32 3
	; SINK-AFTER-NEXT: [[VECTOR_RECUR_EXTRACT_FOR_PHI:%.*]] = extractelement <4 x i32> [[TMP22]], i32 2			; SINK-AFTER-NEXT: [[VECTOR_RECUR_EXTRACT_FOR_PHI:%.*]] = extractelement <4 x i32> [[TMP22]], i32 2
	; SINK-AFTER-NEXT: br i1 true, label [[BB1:%.*]], label [[SCALAR_PH]]			; SINK-AFTER-NEXT: br i1 true, label [[BB1:%.*]], label [[SCALAR_PH]]
	; SINK-AFTER: scalar.ph:			; SINK-AFTER: scalar.ph:
	; SINK-AFTER-NEXT: [[SCALAR_RECUR_INIT:%.]] = phi i32 [ 0, [[BB:%.]] ], [ [[VECTOR_RECUR_EXTRACT]], [[MIDDLE_BLOCK]] ]			; SINK-AFTER-NEXT: [[SCALAR_RECUR_INIT:%.]] = phi i32 [ 0, [[BB:%.]] ], [ [[VECTOR_RECUR_EXTRACT]], [[MIDDLE_BLOCK]] ]
	; SINK-AFTER-NEXT: [[BC_RESUME_VAL:%.*]] = phi i32 [ [[IND_END]], [[MIDDLE_BLOCK]] ], [ [[Y]], [[BB]] ]			; SINK-AFTER-NEXT: [[BC_RESUME_VAL:%.*]] = phi i32 [ [[IND_END]], [[MIDDLE_BLOCK]] ], [ [[Y]], [[BB]] ]
	; SINK-AFTER-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 0, [[BB]] ], [ [[TMP27]], [[MIDDLE_BLOCK]] ]			; SINK-AFTER-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 0, [[BB]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; SINK-AFTER-NEXT: br label [[BB2:%.*]]			; SINK-AFTER-NEXT: br label [[BB2:%.*]]
	; SINK-AFTER: bb1:			; SINK-AFTER: bb1:
	; SINK-AFTER-NEXT: [[VAR:%.]] = phi i32 [ [[VAR6:%.]], [[BB2]] ], [ [[TMP27]], [[MIDDLE_BLOCK]] ]			; SINK-AFTER-NEXT: [[VAR:%.]] = phi i32 [ [[VAR6:%.]], [[BB2]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; SINK-AFTER-NEXT: ret i32 [[VAR]]			; SINK-AFTER-NEXT: ret i32 [[VAR]]
	; SINK-AFTER: bb2:			; SINK-AFTER: bb2:
	; SINK-AFTER-NEXT: [[VAR3:%.]] = phi i32 [ [[VAR8:%.]], [[BB2]] ], [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ]			; SINK-AFTER-NEXT: [[VAR3:%.]] = phi i32 [ [[VAR8:%.]], [[BB2]] ], [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ]
	; SINK-AFTER-NEXT: [[SCALAR_RECUR:%.]] = phi i32 [ [[VAR7:%.]], [[BB2]] ], [ [[SCALAR_RECUR_INIT]], [[SCALAR_PH]] ]			; SINK-AFTER-NEXT: [[SCALAR_RECUR:%.]] = phi i32 [ [[VAR7:%.]], [[BB2]] ], [ [[SCALAR_RECUR_INIT]], [[SCALAR_PH]] ]
	; SINK-AFTER-NEXT: [[VAR5:%.*]] = phi i32 [ [[VAR6]], [[BB2]] ], [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ]			; SINK-AFTER-NEXT: [[VAR5:%.*]] = phi i32 [ [[VAR6]], [[BB2]] ], [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ]
	; SINK-AFTER-NEXT: [[VAR6]] = add i32 [[VAR5]], [[SCALAR_RECUR]]			; SINK-AFTER-NEXT: [[VAR6]] = add i32 [[VAR5]], [[SCALAR_RECUR]]
	; SINK-AFTER-NEXT: [[VAR7]] = udiv i32 219220132, [[VAR3]]			; SINK-AFTER-NEXT: [[VAR7]] = udiv i32 219220132, [[VAR3]]
	; SINK-AFTER-NEXT: [[VAR8]] = add nsw i32 [[VAR3]], -1			; SINK-AFTER-NEXT: [[VAR8]] = add nsw i32 [[VAR3]], -1
	▲ Show 20 Lines • Show All 190 Lines • ▼ Show 20 Lines
	; UNROLL-NO-IC-NEXT: [[TMP73:%.*]] = select <4 x i1> [[TMP11]], <4 x i32> [[TMP47]], <4 x i32> [[VEC_PHI3]]			; UNROLL-NO-IC-NEXT: [[TMP73:%.*]] = select <4 x i1> [[TMP11]], <4 x i32> [[TMP47]], <4 x i32> [[VEC_PHI3]]
	; UNROLL-NO-IC-NEXT: [[INDEX_NEXT]] = add i32 [[INDEX]], 8			; UNROLL-NO-IC-NEXT: [[INDEX_NEXT]] = add i32 [[INDEX]], 8
	; UNROLL-NO-IC-NEXT: [[VEC_IND_NEXT]] = add <4 x i32> [[STEP_ADD]], <i32 4, i32 4, i32 4, i32 4>			; UNROLL-NO-IC-NEXT: [[VEC_IND_NEXT]] = add <4 x i32> [[STEP_ADD]], <i32 4, i32 4, i32 4, i32 4>
	; UNROLL-NO-IC-NEXT: [[TMP74:%.*]] = icmp eq i32 [[INDEX_NEXT]], [[N_VEC]]			; UNROLL-NO-IC-NEXT: [[TMP74:%.*]] = icmp eq i32 [[INDEX_NEXT]], [[N_VEC]]
	; UNROLL-NO-IC-NEXT: br i1 [[TMP74]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !prof [[PROF26]], !llvm.loop [[LOOP30:![0-9]+]]			; UNROLL-NO-IC-NEXT: br i1 [[TMP74]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !prof [[PROF26]], !llvm.loop [[LOOP30:![0-9]+]]
	; UNROLL-NO-IC: middle.block:			; UNROLL-NO-IC: middle.block:
	; UNROLL-NO-IC-NEXT: [[BIN_RDX:%.*]] = add <4 x i32> [[TMP73]], [[TMP72]]			; UNROLL-NO-IC-NEXT: [[BIN_RDX:%.*]] = add <4 x i32> [[TMP73]], [[TMP72]]
	; UNROLL-NO-IC-NEXT: [[TMP75:%.*]] = call i32 @llvm.vector.reduce.add.v4i32(<4 x i32> [[BIN_RDX]])			; UNROLL-NO-IC-NEXT: [[TMP75:%.*]] = call i32 @llvm.vector.reduce.add.v4i32(<4 x i32> [[BIN_RDX]])
				; UNROLL-NO-IC-NEXT: [[RDX_START:%.*]] = add i32 0, [[TMP75]]
	; UNROLL-NO-IC-NEXT: [[VECTOR_RECUR_EXTRACT:%.*]] = extractelement <4 x i32> [[TMP43]], i32 3			; UNROLL-NO-IC-NEXT: [[VECTOR_RECUR_EXTRACT:%.*]] = extractelement <4 x i32> [[TMP43]], i32 3
	; UNROLL-NO-IC-NEXT: [[VECTOR_RECUR_EXTRACT_FOR_PHI:%.*]] = extractelement <4 x i32> [[TMP43]], i32 2			; UNROLL-NO-IC-NEXT: [[VECTOR_RECUR_EXTRACT_FOR_PHI:%.*]] = extractelement <4 x i32> [[TMP43]], i32 2
	; UNROLL-NO-IC-NEXT: br i1 true, label [[BB1:%.*]], label [[SCALAR_PH]]			; UNROLL-NO-IC-NEXT: br i1 true, label [[BB1:%.*]], label [[SCALAR_PH]]
	; UNROLL-NO-IC: scalar.ph:			; UNROLL-NO-IC: scalar.ph:
	; UNROLL-NO-IC-NEXT: [[SCALAR_RECUR_INIT:%.]] = phi i32 [ 0, [[BB:%.]] ], [ [[VECTOR_RECUR_EXTRACT]], [[MIDDLE_BLOCK]] ]			; UNROLL-NO-IC-NEXT: [[SCALAR_RECUR_INIT:%.]] = phi i32 [ 0, [[BB:%.]] ], [ [[VECTOR_RECUR_EXTRACT]], [[MIDDLE_BLOCK]] ]
	; UNROLL-NO-IC-NEXT: [[BC_RESUME_VAL:%.*]] = phi i32 [ [[IND_END]], [[MIDDLE_BLOCK]] ], [ [[Y]], [[BB]] ]			; UNROLL-NO-IC-NEXT: [[BC_RESUME_VAL:%.*]] = phi i32 [ [[IND_END]], [[MIDDLE_BLOCK]] ], [ [[Y]], [[BB]] ]
	; UNROLL-NO-IC-NEXT: [[BC_RESUME_VAL1:%.*]] = phi i32 [ [[N_VEC]], [[MIDDLE_BLOCK]] ], [ 0, [[BB]] ]			; UNROLL-NO-IC-NEXT: [[BC_RESUME_VAL1:%.*]] = phi i32 [ [[N_VEC]], [[MIDDLE_BLOCK]] ], [ 0, [[BB]] ]
	; UNROLL-NO-IC-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 0, [[BB]] ], [ [[TMP75]], [[MIDDLE_BLOCK]] ]			; UNROLL-NO-IC-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 0, [[BB]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; UNROLL-NO-IC-NEXT: br label [[BB2:%.*]]			; UNROLL-NO-IC-NEXT: br label [[BB2:%.*]]
	; UNROLL-NO-IC: bb1:			; UNROLL-NO-IC: bb1:
	; UNROLL-NO-IC-NEXT: [[VAR:%.]] = phi i32 [ [[VAR6:%.]], [[BB2]] ], [ [[TMP75]], [[MIDDLE_BLOCK]] ]			; UNROLL-NO-IC-NEXT: [[VAR:%.]] = phi i32 [ [[VAR6:%.]], [[BB2]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; UNROLL-NO-IC-NEXT: ret i32 [[VAR]]			; UNROLL-NO-IC-NEXT: ret i32 [[VAR]]
	; UNROLL-NO-IC: bb2:			; UNROLL-NO-IC: bb2:
	; UNROLL-NO-IC-NEXT: [[VAR3:%.]] = phi i32 [ [[VAR8:%.]], [[BB2]] ], [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ]			; UNROLL-NO-IC-NEXT: [[VAR3:%.]] = phi i32 [ [[VAR8:%.]], [[BB2]] ], [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ]
	; UNROLL-NO-IC-NEXT: [[IV:%.]] = phi i32 [ [[IV_NEXT:%.]], [[BB2]] ], [ [[BC_RESUME_VAL1]], [[SCALAR_PH]] ]			; UNROLL-NO-IC-NEXT: [[IV:%.]] = phi i32 [ [[IV_NEXT:%.]], [[BB2]] ], [ [[BC_RESUME_VAL1]], [[SCALAR_PH]] ]
	; UNROLL-NO-IC-NEXT: [[SCALAR_RECUR:%.]] = phi i32 [ [[VAR7:%.]], [[BB2]] ], [ [[SCALAR_RECUR_INIT]], [[SCALAR_PH]] ]			; UNROLL-NO-IC-NEXT: [[SCALAR_RECUR:%.]] = phi i32 [ [[VAR7:%.]], [[BB2]] ], [ [[SCALAR_RECUR_INIT]], [[SCALAR_PH]] ]
	; UNROLL-NO-IC-NEXT: [[VAR5:%.*]] = phi i32 [ [[VAR6]], [[BB2]] ], [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ]			; UNROLL-NO-IC-NEXT: [[VAR5:%.*]] = phi i32 [ [[VAR6]], [[BB2]] ], [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ]
	; UNROLL-NO-IC-NEXT: [[G:%.]] = getelementptr inbounds i32, i32 [[X]], i32 [[IV]]			; UNROLL-NO-IC-NEXT: [[G:%.]] = getelementptr inbounds i32, i32 [[X]], i32 [[IV]]
	; UNROLL-NO-IC-NEXT: [[VAR6]] = add i32 [[VAR5]], [[SCALAR_RECUR]]			; UNROLL-NO-IC-NEXT: [[VAR6]] = add i32 [[VAR5]], [[SCALAR_RECUR]]
	Show All 13 Lines
	; UNROLL-NO-VF: vector.ph:			; UNROLL-NO-VF: vector.ph:
	; UNROLL-NO-VF-NEXT: [[N_RND_UP:%.*]] = add i32 [[TMP1]], 1			; UNROLL-NO-VF-NEXT: [[N_RND_UP:%.*]] = add i32 [[TMP1]], 1
	; UNROLL-NO-VF-NEXT: [[N_MOD_VF:%.*]] = urem i32 [[N_RND_UP]], 2			; UNROLL-NO-VF-NEXT: [[N_MOD_VF:%.*]] = urem i32 [[N_RND_UP]], 2
	; UNROLL-NO-VF-NEXT: [[N_VEC:%.*]] = sub i32 [[N_RND_UP]], [[N_MOD_VF]]			; UNROLL-NO-VF-NEXT: [[N_VEC:%.*]] = sub i32 [[N_RND_UP]], [[N_MOD_VF]]
	; UNROLL-NO-VF-NEXT: [[IND_END:%.*]] = sub i32 [[Y]], [[N_VEC]]			; UNROLL-NO-VF-NEXT: [[IND_END:%.*]] = sub i32 [[Y]], [[N_VEC]]
	; UNROLL-NO-VF-NEXT: [[TRIP_COUNT_MINUS_1:%.*]] = sub i32 [[TMP1]], 1			; UNROLL-NO-VF-NEXT: [[TRIP_COUNT_MINUS_1:%.*]] = sub i32 [[TMP1]], 1
	; UNROLL-NO-VF-NEXT: br label [[VECTOR_BODY:%.*]]			; UNROLL-NO-VF-NEXT: br label [[VECTOR_BODY:%.*]]
	; UNROLL-NO-VF: vector.body:			; UNROLL-NO-VF: vector.body:
	; UNROLL-NO-VF-NEXT: [[INDEX:%.]] = phi i32 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[PRED_STORE_CONTINUE10:%.*]] ]			; UNROLL-NO-VF-NEXT: [[INDEX:%.]] = phi i32 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[PRED_STORE_CONTINUE7:%.*]] ]
	; UNROLL-NO-VF-NEXT: [[VECTOR_RECUR:%.]] = phi i32 [ 0, [[VECTOR_PH]] ], [ [[TMP7:%.]], [[PRED_STORE_CONTINUE10]] ]			; UNROLL-NO-VF-NEXT: [[VECTOR_RECUR:%.]] = phi i32 [ 0, [[VECTOR_PH]] ], [ [[TMP9:%.]], [[PRED_STORE_CONTINUE7]] ]
	; UNROLL-NO-VF-NEXT: [[VEC_PHI:%.]] = phi i32 [ 0, [[VECTOR_PH]] ], [ [[TMP8:%.]], [[PRED_STORE_CONTINUE10]] ]			; UNROLL-NO-VF-NEXT: [[VEC_PHI:%.]] = phi i32 [ 0, [[VECTOR_PH]] ], [ [[TMP10:%.]], [[PRED_STORE_CONTINUE7]] ]
	; UNROLL-NO-VF-NEXT: [[VEC_PHI2:%.]] = phi i32 [ 0, [[VECTOR_PH]] ], [ [[TMP9:%.]], [[PRED_STORE_CONTINUE10]] ]			; UNROLL-NO-VF-NEXT: [[VEC_PHI2:%.]] = phi i32 [ 0, [[VECTOR_PH]] ], [ [[TMP11:%.]], [[PRED_STORE_CONTINUE7]] ]
	; UNROLL-NO-VF-NEXT: [[OFFSET_IDX:%.*]] = sub i32 [[Y]], [[INDEX]]			; UNROLL-NO-VF-NEXT: [[OFFSET_IDX:%.*]] = sub i32 [[Y]], [[INDEX]]
	; UNROLL-NO-VF-NEXT: [[INDUCTION4:%.*]] = add i32 [[OFFSET_IDX]], 0			; UNROLL-NO-VF-NEXT: [[TMP2:%.*]] = add i32 [[OFFSET_IDX]], 0
	; UNROLL-NO-VF-NEXT: [[INDUCTION5:%.*]] = add i32 [[OFFSET_IDX]], -1			; UNROLL-NO-VF-NEXT: [[TMP3:%.*]] = add i32 [[OFFSET_IDX]], -1
	; UNROLL-NO-VF-NEXT: [[VEC_IV:%.*]] = add i32 [[INDEX]], 0			; UNROLL-NO-VF-NEXT: [[VEC_IV:%.*]] = add i32 [[INDEX]], 0
	; UNROLL-NO-VF-NEXT: [[VEC_IV6:%.*]] = add i32 [[INDEX]], 1			; UNROLL-NO-VF-NEXT: [[VEC_IV3:%.*]] = add i32 [[INDEX]], 1
	; UNROLL-NO-VF-NEXT: [[TMP2:%.*]] = icmp ule i32 [[VEC_IV]], [[TRIP_COUNT_MINUS_1]]			; UNROLL-NO-VF-NEXT: [[TMP4:%.*]] = icmp ule i32 [[VEC_IV]], [[TRIP_COUNT_MINUS_1]]
	; UNROLL-NO-VF-NEXT: [[TMP3:%.*]] = icmp ule i32 [[VEC_IV6]], [[TRIP_COUNT_MINUS_1]]			; UNROLL-NO-VF-NEXT: [[TMP5:%.*]] = icmp ule i32 [[VEC_IV3]], [[TRIP_COUNT_MINUS_1]]
	; UNROLL-NO-VF-NEXT: br i1 [[TMP2]], label [[PRED_UDIV_IF:%.]], label [[PRED_UDIV_CONTINUE:%.]]			; UNROLL-NO-VF-NEXT: br i1 [[TMP4]], label [[PRED_UDIV_IF:%.]], label [[PRED_UDIV_CONTINUE:%.]]
	; UNROLL-NO-VF: pred.udiv.if:			; UNROLL-NO-VF: pred.udiv.if:
	; UNROLL-NO-VF-NEXT: [[TMP4:%.*]] = udiv i32 219220132, [[INDUCTION4]]			; UNROLL-NO-VF-NEXT: [[TMP6:%.*]] = udiv i32 219220132, [[TMP2]]
	; UNROLL-NO-VF-NEXT: br label [[PRED_UDIV_CONTINUE]]			; UNROLL-NO-VF-NEXT: br label [[PRED_UDIV_CONTINUE]]
	; UNROLL-NO-VF: pred.udiv.continue:			; UNROLL-NO-VF: pred.udiv.continue:
	; UNROLL-NO-VF-NEXT: [[TMP5:%.*]] = phi i32 [ poison, [[VECTOR_BODY]] ], [ [[TMP4]], [[PRED_UDIV_IF]] ]			; UNROLL-NO-VF-NEXT: [[TMP7:%.*]] = phi i32 [ poison, [[VECTOR_BODY]] ], [ [[TMP6]], [[PRED_UDIV_IF]] ]
	; UNROLL-NO-VF-NEXT: br i1 [[TMP3]], label [[PRED_UDIV_IF7:%.]], label [[PRED_UDIV_CONTINUE8:%.]]			; UNROLL-NO-VF-NEXT: br i1 [[TMP5]], label [[PRED_UDIV_IF4:%.]], label [[PRED_UDIV_CONTINUE5:%.]]
	; UNROLL-NO-VF: pred.udiv.if4:			; UNROLL-NO-VF: pred.udiv.if4:
	; UNROLL-NO-VF-NEXT: [[TMP6:%.*]] = udiv i32 219220132, [[INDUCTION5]]			; UNROLL-NO-VF-NEXT: [[TMP8:%.*]] = udiv i32 219220132, [[TMP3]]
	; UNROLL-NO-VF-NEXT: br label [[PRED_UDIV_CONTINUE8]]			; UNROLL-NO-VF-NEXT: br label [[PRED_UDIV_CONTINUE5]]
	; UNROLL-NO-VF: pred.udiv.continue5:			; UNROLL-NO-VF: pred.udiv.continue5:
	; UNROLL-NO-VF-NEXT: [[TMP7]] = phi i32 [ poison, [[PRED_UDIV_CONTINUE]] ], [ [[TMP6]], [[PRED_UDIV_IF7]] ]			; UNROLL-NO-VF-NEXT: [[TMP9]] = phi i32 [ poison, [[PRED_UDIV_CONTINUE]] ], [ [[TMP8]], [[PRED_UDIV_IF4]] ]
	; UNROLL-NO-VF-NEXT: [[TMP8]] = add i32 [[VEC_PHI]], [[VECTOR_RECUR]]			; UNROLL-NO-VF-NEXT: [[TMP10]] = add i32 [[VEC_PHI]], [[VECTOR_RECUR]]
	; UNROLL-NO-VF-NEXT: [[TMP9]] = add i32 [[VEC_PHI2]], [[TMP5]]			; UNROLL-NO-VF-NEXT: [[TMP11]] = add i32 [[VEC_PHI2]], [[TMP7]]
	; UNROLL-NO-VF-NEXT: br i1 [[TMP2]], label [[PRED_STORE_IF:%.]], label [[PRED_STORE_CONTINUE:%.]]			; UNROLL-NO-VF-NEXT: br i1 [[TMP4]], label [[PRED_STORE_IF:%.]], label [[PRED_STORE_CONTINUE:%.]]
	; UNROLL-NO-VF: pred.store.if:			; UNROLL-NO-VF: pred.store.if:
	; UNROLL-NO-VF-NEXT: [[INDUCTION:%.*]] = add i32 [[INDEX]], 0			; UNROLL-NO-VF-NEXT: [[TMP12:%.*]] = add i32 [[INDEX]], 0
	; UNROLL-NO-VF-NEXT: [[TMP10:%.]] = getelementptr inbounds i32, i32 [[X:%.*]], i32 [[INDUCTION]]			; UNROLL-NO-VF-NEXT: [[TMP13:%.]] = getelementptr inbounds i32, i32 [[X:%.*]], i32 [[TMP12]]
	; UNROLL-NO-VF-NEXT: store i32 [[INDUCTION4]], i32* [[TMP10]], align 4			; UNROLL-NO-VF-NEXT: store i32 [[TMP2]], i32* [[TMP13]], align 4
	; UNROLL-NO-VF-NEXT: br label [[PRED_STORE_CONTINUE]]			; UNROLL-NO-VF-NEXT: br label [[PRED_STORE_CONTINUE]]
	; UNROLL-NO-VF: pred.store.continue:			; UNROLL-NO-VF: pred.store.continue:
	; UNROLL-NO-VF-NEXT: br i1 [[TMP3]], label [[PRED_STORE_IF9:%.*]], label [[PRED_STORE_CONTINUE10]]			; UNROLL-NO-VF-NEXT: br i1 [[TMP5]], label [[PRED_STORE_IF6:%.*]], label [[PRED_STORE_CONTINUE7]]
	; UNROLL-NO-VF: pred.store.if6:			; UNROLL-NO-VF: pred.store.if6:
	; UNROLL-NO-VF-NEXT: [[INDUCTION3:%.*]] = add i32 [[INDEX]], 1			; UNROLL-NO-VF-NEXT: [[TMP14:%.*]] = add i32 [[INDEX]], 1
	; UNROLL-NO-VF-NEXT: [[TMP11:%.]] = getelementptr inbounds i32, i32 [[X]], i32 [[INDUCTION3]]			; UNROLL-NO-VF-NEXT: [[TMP15:%.]] = getelementptr inbounds i32, i32 [[X]], i32 [[TMP14]]
	; UNROLL-NO-VF-NEXT: store i32 [[INDUCTION5]], i32* [[TMP11]], align 4			; UNROLL-NO-VF-NEXT: store i32 [[TMP3]], i32* [[TMP15]], align 4
	; UNROLL-NO-VF-NEXT: br label [[PRED_STORE_CONTINUE10]]			; UNROLL-NO-VF-NEXT: br label [[PRED_STORE_CONTINUE7]]
	; UNROLL-NO-VF: pred.store.continue7:			; UNROLL-NO-VF: pred.store.continue7:
	; UNROLL-NO-VF-NEXT: [[TMP12:%.*]] = select i1 [[TMP2]], i32 [[TMP8]], i32 [[VEC_PHI]]			; UNROLL-NO-VF-NEXT: [[TMP16:%.*]] = select i1 [[TMP4]], i32 [[TMP10]], i32 [[VEC_PHI]]
	; UNROLL-NO-VF-NEXT: [[TMP13:%.*]] = select i1 [[TMP3]], i32 [[TMP9]], i32 [[VEC_PHI2]]			; UNROLL-NO-VF-NEXT: [[TMP17:%.*]] = select i1 [[TMP5]], i32 [[TMP11]], i32 [[VEC_PHI2]]
	; UNROLL-NO-VF-NEXT: [[INDEX_NEXT]] = add i32 [[INDEX]], 2			; UNROLL-NO-VF-NEXT: [[INDEX_NEXT]] = add i32 [[INDEX]], 2
	; UNROLL-NO-VF-NEXT: [[TMP14:%.*]] = icmp eq i32 [[INDEX_NEXT]], [[N_VEC]]			; UNROLL-NO-VF-NEXT: [[TMP18:%.*]] = icmp eq i32 [[INDEX_NEXT]], [[N_VEC]]
	; UNROLL-NO-VF-NEXT: br i1 [[TMP14]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !prof [[PROF25]], !llvm.loop [[LOOP29:![0-9]+]]			; UNROLL-NO-VF-NEXT: br i1 [[TMP18]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !prof [[PROF25]], !llvm.loop [[LOOP29:![0-9]+]]
	; UNROLL-NO-VF: middle.block:			; UNROLL-NO-VF: middle.block:
	; UNROLL-NO-VF-NEXT: [[BIN_RDX:%.*]] = add i32 [[TMP13]], [[TMP12]]			; UNROLL-NO-VF-NEXT: [[BIN_RDX:%.*]] = add i32 [[TMP17]], [[TMP16]]
	; UNROLL-NO-VF-NEXT: br i1 true, label [[BB1:%.*]], label [[SCALAR_PH]]			; UNROLL-NO-VF-NEXT: br i1 true, label [[BB1:%.*]], label [[SCALAR_PH]]
	; UNROLL-NO-VF: scalar.ph:			; UNROLL-NO-VF: scalar.ph:
	; UNROLL-NO-VF-NEXT: [[SCALAR_RECUR_INIT:%.]] = phi i32 [ 0, [[BB:%.]] ], [ [[TMP7]], [[MIDDLE_BLOCK]] ]			; UNROLL-NO-VF-NEXT: [[SCALAR_RECUR_INIT:%.]] = phi i32 [ 0, [[BB:%.]] ], [ [[TMP9]], [[MIDDLE_BLOCK]] ]
	; UNROLL-NO-VF-NEXT: [[BC_RESUME_VAL:%.*]] = phi i32 [ [[IND_END]], [[MIDDLE_BLOCK]] ], [ [[Y]], [[BB]] ]			; UNROLL-NO-VF-NEXT: [[BC_RESUME_VAL:%.*]] = phi i32 [ [[IND_END]], [[MIDDLE_BLOCK]] ], [ [[Y]], [[BB]] ]
	; UNROLL-NO-VF-NEXT: [[BC_RESUME_VAL1:%.*]] = phi i32 [ [[N_VEC]], [[MIDDLE_BLOCK]] ], [ 0, [[BB]] ]			; UNROLL-NO-VF-NEXT: [[BC_RESUME_VAL1:%.*]] = phi i32 [ [[N_VEC]], [[MIDDLE_BLOCK]] ], [ 0, [[BB]] ]
	; UNROLL-NO-VF-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 0, [[BB]] ], [ [[BIN_RDX]], [[MIDDLE_BLOCK]] ]			; UNROLL-NO-VF-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 0, [[BB]] ], [ [[BIN_RDX]], [[MIDDLE_BLOCK]] ]
	; UNROLL-NO-VF-NEXT: br label [[BB2:%.*]]			; UNROLL-NO-VF-NEXT: br label [[BB2:%.*]]
	; UNROLL-NO-VF: bb1:			; UNROLL-NO-VF: bb1:
	; UNROLL-NO-VF-NEXT: [[VAR:%.]] = phi i32 [ [[VAR6:%.]], [[BB2]] ], [ [[BIN_RDX]], [[MIDDLE_BLOCK]] ]			; UNROLL-NO-VF-NEXT: [[VAR:%.]] = phi i32 [ [[VAR6:%.]], [[BB2]] ], [ [[BIN_RDX]], [[MIDDLE_BLOCK]] ]
	; UNROLL-NO-VF-NEXT: ret i32 [[VAR]]			; UNROLL-NO-VF-NEXT: ret i32 [[VAR]]
	; UNROLL-NO-VF: bb2:			; UNROLL-NO-VF: bb2:
	▲ Show 20 Lines • Show All 104 Lines • ▼ Show 20 Lines
	; SINK-AFTER: pred.store.continue13:			; SINK-AFTER: pred.store.continue13:
	; SINK-AFTER-NEXT: [[TMP37:%.*]] = select <4 x i1> [[TMP6]], <4 x i32> [[TMP24]], <4 x i32> [[VEC_PHI]]			; SINK-AFTER-NEXT: [[TMP37:%.*]] = select <4 x i1> [[TMP6]], <4 x i32> [[TMP24]], <4 x i32> [[VEC_PHI]]
	; SINK-AFTER-NEXT: [[INDEX_NEXT]] = add i32 [[INDEX]], 4			; SINK-AFTER-NEXT: [[INDEX_NEXT]] = add i32 [[INDEX]], 4
	; SINK-AFTER-NEXT: [[VEC_IND_NEXT]] = add <4 x i32> [[VEC_IND]], <i32 4, i32 4, i32 4, i32 4>			; SINK-AFTER-NEXT: [[VEC_IND_NEXT]] = add <4 x i32> [[VEC_IND]], <i32 4, i32 4, i32 4, i32 4>
	; SINK-AFTER-NEXT: [[TMP38:%.*]] = icmp eq i32 [[INDEX_NEXT]], [[N_VEC]]			; SINK-AFTER-NEXT: [[TMP38:%.*]] = icmp eq i32 [[INDEX_NEXT]], [[N_VEC]]
	; SINK-AFTER-NEXT: br i1 [[TMP38]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !prof [[PROF26]], !llvm.loop [[LOOP30:![0-9]+]]			; SINK-AFTER-NEXT: br i1 [[TMP38]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !prof [[PROF26]], !llvm.loop [[LOOP30:![0-9]+]]
	; SINK-AFTER: middle.block:			; SINK-AFTER: middle.block:
	; SINK-AFTER-NEXT: [[TMP39:%.*]] = call i32 @llvm.vector.reduce.add.v4i32(<4 x i32> [[TMP37]])			; SINK-AFTER-NEXT: [[TMP39:%.*]] = call i32 @llvm.vector.reduce.add.v4i32(<4 x i32> [[TMP37]])
				; SINK-AFTER-NEXT: [[RDX_START:%.*]] = add i32 0, [[TMP39]]
	; SINK-AFTER-NEXT: [[VECTOR_RECUR_EXTRACT:%.*]] = extractelement <4 x i32> [[TMP22]], i32 3			; SINK-AFTER-NEXT: [[VECTOR_RECUR_EXTRACT:%.*]] = extractelement <4 x i32> [[TMP22]], i32 3
	; SINK-AFTER-NEXT: [[VECTOR_RECUR_EXTRACT_FOR_PHI:%.*]] = extractelement <4 x i32> [[TMP22]], i32 2			; SINK-AFTER-NEXT: [[VECTOR_RECUR_EXTRACT_FOR_PHI:%.*]] = extractelement <4 x i32> [[TMP22]], i32 2
	; SINK-AFTER-NEXT: br i1 true, label [[BB1:%.*]], label [[SCALAR_PH]]			; SINK-AFTER-NEXT: br i1 true, label [[BB1:%.*]], label [[SCALAR_PH]]
	; SINK-AFTER: scalar.ph:			; SINK-AFTER: scalar.ph:
	; SINK-AFTER-NEXT: [[SCALAR_RECUR_INIT:%.]] = phi i32 [ 0, [[BB:%.]] ], [ [[VECTOR_RECUR_EXTRACT]], [[MIDDLE_BLOCK]] ]			; SINK-AFTER-NEXT: [[SCALAR_RECUR_INIT:%.]] = phi i32 [ 0, [[BB:%.]] ], [ [[VECTOR_RECUR_EXTRACT]], [[MIDDLE_BLOCK]] ]
	; SINK-AFTER-NEXT: [[BC_RESUME_VAL:%.*]] = phi i32 [ [[IND_END]], [[MIDDLE_BLOCK]] ], [ [[Y]], [[BB]] ]			; SINK-AFTER-NEXT: [[BC_RESUME_VAL:%.*]] = phi i32 [ [[IND_END]], [[MIDDLE_BLOCK]] ], [ [[Y]], [[BB]] ]
	; SINK-AFTER-NEXT: [[BC_RESUME_VAL1:%.*]] = phi i32 [ [[N_VEC]], [[MIDDLE_BLOCK]] ], [ 0, [[BB]] ]			; SINK-AFTER-NEXT: [[BC_RESUME_VAL1:%.*]] = phi i32 [ [[N_VEC]], [[MIDDLE_BLOCK]] ], [ 0, [[BB]] ]
	; SINK-AFTER-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 0, [[BB]] ], [ [[TMP39]], [[MIDDLE_BLOCK]] ]			; SINK-AFTER-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 0, [[BB]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; SINK-AFTER-NEXT: br label [[BB2:%.*]]			; SINK-AFTER-NEXT: br label [[BB2:%.*]]
	; SINK-AFTER: bb1:			; SINK-AFTER: bb1:
	; SINK-AFTER-NEXT: [[VAR:%.]] = phi i32 [ [[VAR6:%.]], [[BB2]] ], [ [[TMP39]], [[MIDDLE_BLOCK]] ]			; SINK-AFTER-NEXT: [[VAR:%.]] = phi i32 [ [[VAR6:%.]], [[BB2]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; SINK-AFTER-NEXT: ret i32 [[VAR]]			; SINK-AFTER-NEXT: ret i32 [[VAR]]
	; SINK-AFTER: bb2:			; SINK-AFTER: bb2:
	; SINK-AFTER-NEXT: [[VAR3:%.]] = phi i32 [ [[VAR8:%.]], [[BB2]] ], [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ]			; SINK-AFTER-NEXT: [[VAR3:%.]] = phi i32 [ [[VAR8:%.]], [[BB2]] ], [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ]
	; SINK-AFTER-NEXT: [[IV:%.]] = phi i32 [ [[IV_NEXT:%.]], [[BB2]] ], [ [[BC_RESUME_VAL1]], [[SCALAR_PH]] ]			; SINK-AFTER-NEXT: [[IV:%.]] = phi i32 [ [[IV_NEXT:%.]], [[BB2]] ], [ [[BC_RESUME_VAL1]], [[SCALAR_PH]] ]
	; SINK-AFTER-NEXT: [[SCALAR_RECUR:%.]] = phi i32 [ [[VAR7:%.]], [[BB2]] ], [ [[SCALAR_RECUR_INIT]], [[SCALAR_PH]] ]			; SINK-AFTER-NEXT: [[SCALAR_RECUR:%.]] = phi i32 [ [[VAR7:%.]], [[BB2]] ], [ [[SCALAR_RECUR_INIT]], [[SCALAR_PH]] ]
	; SINK-AFTER-NEXT: [[VAR5:%.*]] = phi i32 [ [[VAR6]], [[BB2]] ], [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ]			; SINK-AFTER-NEXT: [[VAR5:%.*]] = phi i32 [ [[VAR6]], [[BB2]] ], [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ]
	; SINK-AFTER-NEXT: [[G:%.]] = getelementptr inbounds i32, i32 [[X]], i32 [[IV]]			; SINK-AFTER-NEXT: [[G:%.]] = getelementptr inbounds i32, i32 [[X]], i32 [[IV]]
	; SINK-AFTER-NEXT: [[VAR6]] = add i32 [[VAR5]], [[SCALAR_RECUR]]			; SINK-AFTER-NEXT: [[VAR6]] = add i32 [[VAR5]], [[SCALAR_RECUR]]
	▲ Show 20 Lines • Show All 90 Lines • ▼ Show 20 Lines
	;			;
	; UNROLL-NO-VF-LABEL: @sink_after_dead_inst(			; UNROLL-NO-VF-LABEL: @sink_after_dead_inst(
	; UNROLL-NO-VF-NEXT: entry:			; UNROLL-NO-VF-NEXT: entry:
	; UNROLL-NO-VF-NEXT: br i1 false, label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]			; UNROLL-NO-VF-NEXT: br i1 false, label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]
	; UNROLL-NO-VF: vector.ph:			; UNROLL-NO-VF: vector.ph:
	; UNROLL-NO-VF-NEXT: br label [[VECTOR_BODY:%.*]]			; UNROLL-NO-VF-NEXT: br label [[VECTOR_BODY:%.*]]
	; UNROLL-NO-VF: vector.body:			; UNROLL-NO-VF: vector.body:
	; UNROLL-NO-VF-NEXT: [[INDEX:%.]] = phi i32 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[VECTOR_BODY]] ]			; UNROLL-NO-VF-NEXT: [[INDEX:%.]] = phi i32 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[VECTOR_BODY]] ]
	; UNROLL-NO-VF-NEXT: [[VECTOR_RECUR:%.]] = phi i32 [ 0, [[VECTOR_PH]] ], [ [[TMP5:%.]], [[VECTOR_BODY]] ]			; UNROLL-NO-VF-NEXT: [[VECTOR_RECUR:%.]] = phi i32 [ 0, [[VECTOR_PH]] ], [ [[TMP7:%.]], [[VECTOR_BODY]] ]
	; UNROLL-NO-VF-NEXT: [[OFFSET_IDX:%.*]] = trunc i32 [[INDEX]] to i16			; UNROLL-NO-VF-NEXT: [[OFFSET_IDX:%.*]] = trunc i32 [[INDEX]] to i16
	; UNROLL-NO-VF-NEXT: [[INDUCTION:%.*]] = add i16 [[OFFSET_IDX]], 0			; UNROLL-NO-VF-NEXT: [[TMP0:%.*]] = add i16 [[OFFSET_IDX]], 0
	; UNROLL-NO-VF-NEXT: [[INDUCTION1:%.*]] = add i16 [[OFFSET_IDX]], 1			; UNROLL-NO-VF-NEXT: [[TMP1:%.*]] = add i16 [[OFFSET_IDX]], 1
	; UNROLL-NO-VF-NEXT: [[TMP0:%.*]] = add i16 [[INDUCTION]], 1			; UNROLL-NO-VF-NEXT: [[TMP2:%.*]] = add i16 [[TMP0]], 1
	; UNROLL-NO-VF-NEXT: [[TMP1:%.*]] = add i16 [[INDUCTION1]], 1			; UNROLL-NO-VF-NEXT: [[TMP3:%.*]] = add i16 [[TMP1]], 1
	; UNROLL-NO-VF-NEXT: [[TMP2:%.*]] = or i16 [[TMP0]], [[TMP0]]			; UNROLL-NO-VF-NEXT: [[TMP4:%.*]] = or i16 [[TMP2]], [[TMP2]]
	; UNROLL-NO-VF-NEXT: [[TMP3:%.*]] = or i16 [[TMP1]], [[TMP1]]			; UNROLL-NO-VF-NEXT: [[TMP5:%.*]] = or i16 [[TMP3]], [[TMP3]]
	; UNROLL-NO-VF-NEXT: [[TMP4:%.*]] = zext i16 [[TMP2]] to i32			; UNROLL-NO-VF-NEXT: [[TMP6:%.*]] = zext i16 [[TMP4]] to i32
	; UNROLL-NO-VF-NEXT: [[TMP5]] = zext i16 [[TMP3]] to i32			; UNROLL-NO-VF-NEXT: [[TMP7]] = zext i16 [[TMP5]] to i32
	; UNROLL-NO-VF-NEXT: [[TMP6:%.]] = getelementptr i32, i32 [[A_PTR:%.*]], i16 [[INDUCTION]]			; UNROLL-NO-VF-NEXT: [[TMP8:%.]] = getelementptr i32, i32 [[A_PTR:%.*]], i16 [[TMP0]]
	; UNROLL-NO-VF-NEXT: [[TMP7:%.]] = getelementptr i32, i32 [[A_PTR]], i16 [[INDUCTION1]]			; UNROLL-NO-VF-NEXT: [[TMP9:%.]] = getelementptr i32, i32 [[A_PTR]], i16 [[TMP1]]
	; UNROLL-NO-VF-NEXT: store i32 0, i32* [[TMP6]], align 4			; UNROLL-NO-VF-NEXT: store i32 0, i32* [[TMP8]], align 4
	; UNROLL-NO-VF-NEXT: store i32 0, i32* [[TMP7]], align 4			; UNROLL-NO-VF-NEXT: store i32 0, i32* [[TMP9]], align 4
	; UNROLL-NO-VF-NEXT: [[INDEX_NEXT]] = add nuw i32 [[INDEX]], 2			; UNROLL-NO-VF-NEXT: [[INDEX_NEXT]] = add nuw i32 [[INDEX]], 2
	; UNROLL-NO-VF-NEXT: [[TMP8:%.*]] = icmp eq i32 [[INDEX_NEXT]], 16			; UNROLL-NO-VF-NEXT: [[TMP10:%.*]] = icmp eq i32 [[INDEX_NEXT]], 16
	; UNROLL-NO-VF-NEXT: br i1 [[TMP8]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP31:![0-9]+]]			; UNROLL-NO-VF-NEXT: br i1 [[TMP10]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP31:![0-9]+]]
	; UNROLL-NO-VF: middle.block:			; UNROLL-NO-VF: middle.block:
	; UNROLL-NO-VF-NEXT: [[CMP_N:%.*]] = icmp eq i32 16, 16			; UNROLL-NO-VF-NEXT: [[CMP_N:%.*]] = icmp eq i32 16, 16
	; UNROLL-NO-VF-NEXT: br i1 [[CMP_N]], label [[FOR_END:%.*]], label [[SCALAR_PH]]			; UNROLL-NO-VF-NEXT: br i1 [[CMP_N]], label [[FOR_END:%.*]], label [[SCALAR_PH]]
	; UNROLL-NO-VF: scalar.ph:			; UNROLL-NO-VF: scalar.ph:
	; UNROLL-NO-VF-NEXT: [[SCALAR_RECUR_INIT:%.]] = phi i32 [ 0, [[ENTRY:%.]] ], [ [[TMP5]], [[MIDDLE_BLOCK]] ]			; UNROLL-NO-VF-NEXT: [[SCALAR_RECUR_INIT:%.]] = phi i32 [ 0, [[ENTRY:%.]] ], [ [[TMP7]], [[MIDDLE_BLOCK]] ]
	; UNROLL-NO-VF-NEXT: [[BC_RESUME_VAL:%.*]] = phi i16 [ 16, [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY]] ]			; UNROLL-NO-VF-NEXT: [[BC_RESUME_VAL:%.*]] = phi i16 [ 16, [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY]] ]
	; UNROLL-NO-VF-NEXT: br label [[LOOP:%.*]]			; UNROLL-NO-VF-NEXT: br label [[LOOP:%.*]]
	; UNROLL-NO-VF: loop:			; UNROLL-NO-VF: loop:
	; UNROLL-NO-VF-NEXT: [[IV:%.]] = phi i16 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[IV_NEXT:%.]], [[LOOP]] ]			; UNROLL-NO-VF-NEXT: [[IV:%.]] = phi i16 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[IV_NEXT:%.]], [[LOOP]] ]
	; UNROLL-NO-VF-NEXT: [[SCALAR_RECUR:%.]] = phi i32 [ [[SCALAR_RECUR_INIT]], [[SCALAR_PH]] ], [ [[FOR_PREV:%.]], [[LOOP]] ]			; UNROLL-NO-VF-NEXT: [[SCALAR_RECUR:%.]] = phi i32 [ [[SCALAR_RECUR_INIT]], [[SCALAR_PH]] ], [ [[FOR_PREV:%.]], [[LOOP]] ]
	; UNROLL-NO-VF-NEXT: [[CMP:%.*]] = icmp eq i32 [[SCALAR_RECUR]], 15			; UNROLL-NO-VF-NEXT: [[CMP:%.*]] = icmp eq i32 [[SCALAR_RECUR]], 15
	; UNROLL-NO-VF-NEXT: [[C:%.*]] = icmp eq i1 [[CMP]], true			; UNROLL-NO-VF-NEXT: [[C:%.*]] = icmp eq i1 [[CMP]], true
	; UNROLL-NO-VF-NEXT: [[VEC_DEAD:%.*]] = and i1 [[C]], true			; UNROLL-NO-VF-NEXT: [[VEC_DEAD:%.*]] = and i1 [[C]], true
	▲ Show 20 Lines • Show All 84 Lines • Show Last 20 Lines

llvm/test/Transforms/LoopVectorize/if-pred-non-void.ll

	Show First 20 Lines • Show All 220 Lines • ▼ Show 20 Lines
	; UNROLL-NO-VF-NEXT: [[BOUND027:%.]] = icmp ult i8 [[ASR6]], [[SCEVGEP1011]]			; UNROLL-NO-VF-NEXT: [[BOUND027:%.]] = icmp ult i8 [[ASR6]], [[SCEVGEP1011]]
	; UNROLL-NO-VF-NEXT: [[BOUND128:%.]] = icmp ult i8 [[AUR9]], [[SCEVGEP78]]			; UNROLL-NO-VF-NEXT: [[BOUND128:%.]] = icmp ult i8 [[AUR9]], [[SCEVGEP78]]
	; UNROLL-NO-VF-NEXT: [[FOUND_CONFLICT29:%.*]] = and i1 [[BOUND027]], [[BOUND128]]			; UNROLL-NO-VF-NEXT: [[FOUND_CONFLICT29:%.*]] = and i1 [[BOUND027]], [[BOUND128]]
	; UNROLL-NO-VF-NEXT: [[CONFLICT_RDX30:%.*]] = or i1 [[CONFLICT_RDX26]], [[FOUND_CONFLICT29]]			; UNROLL-NO-VF-NEXT: [[CONFLICT_RDX30:%.*]] = or i1 [[CONFLICT_RDX26]], [[FOUND_CONFLICT29]]
	; UNROLL-NO-VF-NEXT: br i1 [[CONFLICT_RDX30]], label [[SCALAR_PH]], label [[VECTOR_PH:%.*]]			; UNROLL-NO-VF-NEXT: br i1 [[CONFLICT_RDX30]], label [[SCALAR_PH]], label [[VECTOR_PH:%.*]]
	; UNROLL-NO-VF: vector.ph:			; UNROLL-NO-VF: vector.ph:
	; UNROLL-NO-VF-NEXT: br label [[VECTOR_BODY:%.*]]			; UNROLL-NO-VF-NEXT: br label [[VECTOR_BODY:%.*]]
	; UNROLL-NO-VF: vector.body:			; UNROLL-NO-VF: vector.body:
	; UNROLL-NO-VF-NEXT: [[INDEX:%.]] = phi i64 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[PRED_UREM_CONTINUE33:%.*]] ]			; UNROLL-NO-VF-NEXT: [[INDEX:%.]] = phi i64 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[PRED_UREM_CONTINUE32:%.*]] ]
	; UNROLL-NO-VF-NEXT: [[INDUCTION:%.*]] = add i64 [[INDEX]], 0			; UNROLL-NO-VF-NEXT: [[TMP0:%.*]] = add i64 [[INDEX]], 0
	; UNROLL-NO-VF-NEXT: [[INDUCTION31:%.*]] = add i64 [[INDEX]], 1			; UNROLL-NO-VF-NEXT: [[TMP1:%.*]] = add i64 [[INDEX]], 1
	; UNROLL-NO-VF-NEXT: [[TMP0:%.]] = getelementptr inbounds i32, i32 [[ASD]], i64 [[INDUCTION]]			; UNROLL-NO-VF-NEXT: [[TMP2:%.]] = getelementptr inbounds i32, i32 [[ASD]], i64 [[TMP0]]
	; UNROLL-NO-VF-NEXT: [[TMP1:%.]] = getelementptr inbounds i32, i32 [[ASD]], i64 [[INDUCTION31]]			; UNROLL-NO-VF-NEXT: [[TMP3:%.]] = getelementptr inbounds i32, i32 [[ASD]], i64 [[TMP1]]
	; UNROLL-NO-VF-NEXT: [[TMP2:%.]] = getelementptr inbounds i32, i32 [[AUD]], i64 [[INDUCTION]]			; UNROLL-NO-VF-NEXT: [[TMP4:%.]] = getelementptr inbounds i32, i32 [[AUD]], i64 [[TMP0]]
	; UNROLL-NO-VF-NEXT: [[TMP3:%.]] = getelementptr inbounds i32, i32 [[AUD]], i64 [[INDUCTION31]]			; UNROLL-NO-VF-NEXT: [[TMP5:%.]] = getelementptr inbounds i32, i32 [[AUD]], i64 [[TMP1]]
	; UNROLL-NO-VF-NEXT: [[TMP4:%.]] = getelementptr inbounds i32, i32 [[ASR]], i64 [[INDUCTION]]			; UNROLL-NO-VF-NEXT: [[TMP6:%.]] = getelementptr inbounds i32, i32 [[ASR]], i64 [[TMP0]]
	; UNROLL-NO-VF-NEXT: [[TMP5:%.]] = getelementptr inbounds i32, i32 [[ASR]], i64 [[INDUCTION31]]			; UNROLL-NO-VF-NEXT: [[TMP7:%.]] = getelementptr inbounds i32, i32 [[ASR]], i64 [[TMP1]]
	; UNROLL-NO-VF-NEXT: [[TMP6:%.]] = getelementptr inbounds i32, i32 [[AUR]], i64 [[INDUCTION]]			; UNROLL-NO-VF-NEXT: [[TMP8:%.]] = getelementptr inbounds i32, i32 [[AUR]], i64 [[TMP0]]
	; UNROLL-NO-VF-NEXT: [[TMP7:%.]] = getelementptr inbounds i32, i32 [[AUR]], i64 [[INDUCTION31]]			; UNROLL-NO-VF-NEXT: [[TMP9:%.]] = getelementptr inbounds i32, i32 [[AUR]], i64 [[TMP1]]
	; UNROLL-NO-VF-NEXT: [[TMP8:%.]] = load i32, i32 [[TMP0]], align 4, !alias.scope !5, !noalias !8			; UNROLL-NO-VF-NEXT: [[TMP10:%.]] = load i32, i32 [[TMP2]], align 4, !alias.scope !5, !noalias !8
	; UNROLL-NO-VF-NEXT: [[TMP9:%.]] = load i32, i32 [[TMP1]], align 4, !alias.scope !5, !noalias !8			; UNROLL-NO-VF-NEXT: [[TMP11:%.]] = load i32, i32 [[TMP3]], align 4, !alias.scope !5, !noalias !8
	; UNROLL-NO-VF-NEXT: [[TMP10:%.]] = load i32, i32 [[TMP2]], align 4, !alias.scope !12, !noalias !13			; UNROLL-NO-VF-NEXT: [[TMP12:%.]] = load i32, i32 [[TMP4]], align 4, !alias.scope !12, !noalias !13
	; UNROLL-NO-VF-NEXT: [[TMP11:%.]] = load i32, i32 [[TMP3]], align 4, !alias.scope !12, !noalias !13			; UNROLL-NO-VF-NEXT: [[TMP13:%.]] = load i32, i32 [[TMP5]], align 4, !alias.scope !12, !noalias !13
	; UNROLL-NO-VF-NEXT: [[TMP12:%.]] = load i32, i32 [[TMP4]], align 4, !alias.scope !14, !noalias !15			; UNROLL-NO-VF-NEXT: [[TMP14:%.]] = load i32, i32 [[TMP6]], align 4, !alias.scope !14, !noalias !15
	; UNROLL-NO-VF-NEXT: [[TMP13:%.]] = load i32, i32 [[TMP5]], align 4, !alias.scope !14, !noalias !15			; UNROLL-NO-VF-NEXT: [[TMP15:%.]] = load i32, i32 [[TMP7]], align 4, !alias.scope !14, !noalias !15
	; UNROLL-NO-VF-NEXT: [[TMP14:%.]] = load i32, i32 [[TMP6]], align 4, !alias.scope !15			; UNROLL-NO-VF-NEXT: [[TMP16:%.]] = load i32, i32 [[TMP8]], align 4, !alias.scope !15
	; UNROLL-NO-VF-NEXT: [[TMP15:%.]] = load i32, i32 [[TMP7]], align 4, !alias.scope !15			; UNROLL-NO-VF-NEXT: [[TMP17:%.]] = load i32, i32 [[TMP9]], align 4, !alias.scope !15
	; UNROLL-NO-VF-NEXT: [[TMP16:%.*]] = add nsw i32 [[TMP8]], 23			; UNROLL-NO-VF-NEXT: [[TMP18:%.*]] = add nsw i32 [[TMP10]], 23
	; UNROLL-NO-VF-NEXT: [[TMP17:%.*]] = add nsw i32 [[TMP9]], 23			; UNROLL-NO-VF-NEXT: [[TMP19:%.*]] = add nsw i32 [[TMP11]], 23
	; UNROLL-NO-VF-NEXT: [[TMP18:%.*]] = add nsw i32 [[TMP10]], 24			; UNROLL-NO-VF-NEXT: [[TMP20:%.*]] = add nsw i32 [[TMP12]], 24
	; UNROLL-NO-VF-NEXT: [[TMP19:%.*]] = add nsw i32 [[TMP11]], 24			; UNROLL-NO-VF-NEXT: [[TMP21:%.*]] = add nsw i32 [[TMP13]], 24
	; UNROLL-NO-VF-NEXT: [[TMP20:%.*]] = add nsw i32 [[TMP12]], 25			; UNROLL-NO-VF-NEXT: [[TMP22:%.*]] = add nsw i32 [[TMP14]], 25
	; UNROLL-NO-VF-NEXT: [[TMP21:%.*]] = add nsw i32 [[TMP13]], 25			; UNROLL-NO-VF-NEXT: [[TMP23:%.*]] = add nsw i32 [[TMP15]], 25
	; UNROLL-NO-VF-NEXT: [[TMP22:%.*]] = add nsw i32 [[TMP14]], 26			; UNROLL-NO-VF-NEXT: [[TMP24:%.*]] = add nsw i32 [[TMP16]], 26
	; UNROLL-NO-VF-NEXT: [[TMP23:%.*]] = add nsw i32 [[TMP15]], 26			; UNROLL-NO-VF-NEXT: [[TMP25:%.*]] = add nsw i32 [[TMP17]], 26
	; UNROLL-NO-VF-NEXT: [[TMP24:%.*]] = icmp slt i32 [[TMP8]], 100			; UNROLL-NO-VF-NEXT: [[TMP26:%.*]] = icmp slt i32 [[TMP10]], 100
	; UNROLL-NO-VF-NEXT: [[TMP25:%.*]] = icmp slt i32 [[TMP9]], 100			; UNROLL-NO-VF-NEXT: [[TMP27:%.*]] = icmp slt i32 [[TMP11]], 100
	; UNROLL-NO-VF-NEXT: br i1 [[TMP24]], label [[PRED_UREM_IF:%.]], label [[PRED_UREM_CONTINUE:%.]]			; UNROLL-NO-VF-NEXT: br i1 [[TMP26]], label [[PRED_UREM_IF:%.]], label [[PRED_UREM_CONTINUE:%.]]
	; UNROLL-NO-VF: pred.urem.if:			; UNROLL-NO-VF: pred.urem.if:
	; UNROLL-NO-VF-NEXT: [[TMP26:%.*]] = sdiv i32 [[TMP16]], [[TMP8]]			; UNROLL-NO-VF-NEXT: [[TMP28:%.*]] = sdiv i32 [[TMP18]], [[TMP10]]
	; UNROLL-NO-VF-NEXT: [[TMP27:%.*]] = udiv i32 [[TMP18]], [[TMP10]]			; UNROLL-NO-VF-NEXT: [[TMP29:%.*]] = udiv i32 [[TMP20]], [[TMP12]]
	; UNROLL-NO-VF-NEXT: [[TMP28:%.*]] = srem i32 [[TMP20]], [[TMP12]]			; UNROLL-NO-VF-NEXT: [[TMP30:%.*]] = srem i32 [[TMP22]], [[TMP14]]
	; UNROLL-NO-VF-NEXT: [[TMP29:%.*]] = urem i32 [[TMP22]], [[TMP14]]			; UNROLL-NO-VF-NEXT: [[TMP31:%.*]] = urem i32 [[TMP24]], [[TMP16]]
	; UNROLL-NO-VF-NEXT: br label [[PRED_UREM_CONTINUE]]			; UNROLL-NO-VF-NEXT: br label [[PRED_UREM_CONTINUE]]
	; UNROLL-NO-VF: pred.urem.continue:			; UNROLL-NO-VF: pred.urem.continue:
	; UNROLL-NO-VF-NEXT: [[TMP30:%.*]] = phi i32 [ poison, [[VECTOR_BODY]] ], [ [[TMP26]], [[PRED_UREM_IF]] ]
	; UNROLL-NO-VF-NEXT: [[TMP31:%.*]] = phi i32 [ poison, [[VECTOR_BODY]] ], [ [[TMP27]], [[PRED_UREM_IF]] ]
	; UNROLL-NO-VF-NEXT: [[TMP32:%.*]] = phi i32 [ poison, [[VECTOR_BODY]] ], [ [[TMP28]], [[PRED_UREM_IF]] ]			; UNROLL-NO-VF-NEXT: [[TMP32:%.*]] = phi i32 [ poison, [[VECTOR_BODY]] ], [ [[TMP28]], [[PRED_UREM_IF]] ]
	; UNROLL-NO-VF-NEXT: [[TMP33:%.*]] = phi i32 [ poison, [[VECTOR_BODY]] ], [ [[TMP29]], [[PRED_UREM_IF]] ]			; UNROLL-NO-VF-NEXT: [[TMP33:%.*]] = phi i32 [ poison, [[VECTOR_BODY]] ], [ [[TMP29]], [[PRED_UREM_IF]] ]
	; UNROLL-NO-VF-NEXT: br i1 [[TMP25]], label [[PRED_UREM_IF32:%.*]], label [[PRED_UREM_CONTINUE33]]			; UNROLL-NO-VF-NEXT: [[TMP34:%.*]] = phi i32 [ poison, [[VECTOR_BODY]] ], [ [[TMP30]], [[PRED_UREM_IF]] ]
				; UNROLL-NO-VF-NEXT: [[TMP35:%.*]] = phi i32 [ poison, [[VECTOR_BODY]] ], [ [[TMP31]], [[PRED_UREM_IF]] ]
				; UNROLL-NO-VF-NEXT: br i1 [[TMP27]], label [[PRED_UREM_IF31:%.*]], label [[PRED_UREM_CONTINUE32]]
	; UNROLL-NO-VF: pred.urem.if31:			; UNROLL-NO-VF: pred.urem.if31:
	; UNROLL-NO-VF-NEXT: [[TMP34:%.*]] = sdiv i32 [[TMP17]], [[TMP9]]			; UNROLL-NO-VF-NEXT: [[TMP36:%.*]] = sdiv i32 [[TMP19]], [[TMP11]]
	; UNROLL-NO-VF-NEXT: [[TMP35:%.*]] = udiv i32 [[TMP19]], [[TMP11]]			; UNROLL-NO-VF-NEXT: [[TMP37:%.*]] = udiv i32 [[TMP21]], [[TMP13]]
	; UNROLL-NO-VF-NEXT: [[TMP36:%.*]] = srem i32 [[TMP21]], [[TMP13]]			; UNROLL-NO-VF-NEXT: [[TMP38:%.*]] = srem i32 [[TMP23]], [[TMP15]]
	; UNROLL-NO-VF-NEXT: [[TMP37:%.*]] = urem i32 [[TMP23]], [[TMP15]]			; UNROLL-NO-VF-NEXT: [[TMP39:%.*]] = urem i32 [[TMP25]], [[TMP17]]
	; UNROLL-NO-VF-NEXT: br label [[PRED_UREM_CONTINUE33]]			; UNROLL-NO-VF-NEXT: br label [[PRED_UREM_CONTINUE32]]
	; UNROLL-NO-VF: pred.urem.continue32:			; UNROLL-NO-VF: pred.urem.continue32:
	; UNROLL-NO-VF-NEXT: [[TMP38:%.*]] = phi i32 [ poison, [[PRED_UREM_CONTINUE]] ], [ [[TMP34]], [[PRED_UREM_IF32]] ]			; UNROLL-NO-VF-NEXT: [[TMP40:%.*]] = phi i32 [ poison, [[PRED_UREM_CONTINUE]] ], [ [[TMP36]], [[PRED_UREM_IF31]] ]
	; UNROLL-NO-VF-NEXT: [[TMP39:%.*]] = phi i32 [ poison, [[PRED_UREM_CONTINUE]] ], [ [[TMP35]], [[PRED_UREM_IF32]] ]			; UNROLL-NO-VF-NEXT: [[TMP41:%.*]] = phi i32 [ poison, [[PRED_UREM_CONTINUE]] ], [ [[TMP37]], [[PRED_UREM_IF31]] ]
	; UNROLL-NO-VF-NEXT: [[TMP40:%.*]] = phi i32 [ poison, [[PRED_UREM_CONTINUE]] ], [ [[TMP36]], [[PRED_UREM_IF32]] ]			; UNROLL-NO-VF-NEXT: [[TMP42:%.*]] = phi i32 [ poison, [[PRED_UREM_CONTINUE]] ], [ [[TMP38]], [[PRED_UREM_IF31]] ]
	; UNROLL-NO-VF-NEXT: [[TMP41:%.*]] = phi i32 [ poison, [[PRED_UREM_CONTINUE]] ], [ [[TMP37]], [[PRED_UREM_IF32]] ]			; UNROLL-NO-VF-NEXT: [[TMP43:%.*]] = phi i32 [ poison, [[PRED_UREM_CONTINUE]] ], [ [[TMP39]], [[PRED_UREM_IF31]] ]
	; UNROLL-NO-VF-NEXT: [[TMP42:%.*]] = xor i1 [[TMP24]], true			; UNROLL-NO-VF-NEXT: [[TMP44:%.*]] = xor i1 [[TMP26]], true
	; UNROLL-NO-VF-NEXT: [[TMP43:%.*]] = xor i1 [[TMP25]], true			; UNROLL-NO-VF-NEXT: [[TMP45:%.*]] = xor i1 [[TMP27]], true
	; UNROLL-NO-VF-NEXT: [[PREDPHI:%.*]] = select i1 [[TMP42]], i32 [[TMP16]], i32 [[TMP30]]			; UNROLL-NO-VF-NEXT: [[PREDPHI:%.*]] = select i1 [[TMP44]], i32 [[TMP18]], i32 [[TMP32]]
	; UNROLL-NO-VF-NEXT: [[PREDPHI34:%.*]] = select i1 [[TMP43]], i32 [[TMP17]], i32 [[TMP38]]			; UNROLL-NO-VF-NEXT: [[PREDPHI33:%.*]] = select i1 [[TMP45]], i32 [[TMP19]], i32 [[TMP40]]
	; UNROLL-NO-VF-NEXT: [[PREDPHI35:%.*]] = select i1 [[TMP42]], i32 [[TMP18]], i32 [[TMP31]]			; UNROLL-NO-VF-NEXT: [[PREDPHI34:%.*]] = select i1 [[TMP44]], i32 [[TMP20]], i32 [[TMP33]]
	; UNROLL-NO-VF-NEXT: [[PREDPHI36:%.*]] = select i1 [[TMP43]], i32 [[TMP19]], i32 [[TMP39]]			; UNROLL-NO-VF-NEXT: [[PREDPHI35:%.*]] = select i1 [[TMP45]], i32 [[TMP21]], i32 [[TMP41]]
	; UNROLL-NO-VF-NEXT: [[PREDPHI37:%.*]] = select i1 [[TMP42]], i32 [[TMP20]], i32 [[TMP32]]			; UNROLL-NO-VF-NEXT: [[PREDPHI36:%.*]] = select i1 [[TMP44]], i32 [[TMP22]], i32 [[TMP34]]
	; UNROLL-NO-VF-NEXT: [[PREDPHI38:%.*]] = select i1 [[TMP43]], i32 [[TMP21]], i32 [[TMP40]]			; UNROLL-NO-VF-NEXT: [[PREDPHI37:%.*]] = select i1 [[TMP45]], i32 [[TMP23]], i32 [[TMP42]]
	; UNROLL-NO-VF-NEXT: [[PREDPHI39:%.*]] = select i1 [[TMP42]], i32 [[TMP22]], i32 [[TMP33]]			; UNROLL-NO-VF-NEXT: [[PREDPHI38:%.*]] = select i1 [[TMP44]], i32 [[TMP24]], i32 [[TMP35]]
	; UNROLL-NO-VF-NEXT: [[PREDPHI40:%.*]] = select i1 [[TMP43]], i32 [[TMP23]], i32 [[TMP41]]			; UNROLL-NO-VF-NEXT: [[PREDPHI39:%.*]] = select i1 [[TMP45]], i32 [[TMP25]], i32 [[TMP43]]
	; UNROLL-NO-VF-NEXT: store i32 [[PREDPHI]], i32* [[TMP0]], align 4, !alias.scope !5, !noalias !8			; UNROLL-NO-VF-NEXT: store i32 [[PREDPHI]], i32* [[TMP2]], align 4, !alias.scope !5, !noalias !8
	; UNROLL-NO-VF-NEXT: store i32 [[PREDPHI34]], i32* [[TMP1]], align 4, !alias.scope !5, !noalias !8			; UNROLL-NO-VF-NEXT: store i32 [[PREDPHI33]], i32* [[TMP3]], align 4, !alias.scope !5, !noalias !8
	; UNROLL-NO-VF-NEXT: store i32 [[PREDPHI35]], i32* [[TMP2]], align 4, !alias.scope !12, !noalias !13			; UNROLL-NO-VF-NEXT: store i32 [[PREDPHI34]], i32* [[TMP4]], align 4, !alias.scope !12, !noalias !13
	; UNROLL-NO-VF-NEXT: store i32 [[PREDPHI36]], i32* [[TMP3]], align 4, !alias.scope !12, !noalias !13			; UNROLL-NO-VF-NEXT: store i32 [[PREDPHI35]], i32* [[TMP5]], align 4, !alias.scope !12, !noalias !13
	; UNROLL-NO-VF-NEXT: store i32 [[PREDPHI37]], i32* [[TMP4]], align 4, !alias.scope !14, !noalias !15			; UNROLL-NO-VF-NEXT: store i32 [[PREDPHI36]], i32* [[TMP6]], align 4, !alias.scope !14, !noalias !15
	; UNROLL-NO-VF-NEXT: store i32 [[PREDPHI38]], i32* [[TMP5]], align 4, !alias.scope !14, !noalias !15			; UNROLL-NO-VF-NEXT: store i32 [[PREDPHI37]], i32* [[TMP7]], align 4, !alias.scope !14, !noalias !15
	; UNROLL-NO-VF-NEXT: store i32 [[PREDPHI39]], i32* [[TMP6]], align 4, !alias.scope !15			; UNROLL-NO-VF-NEXT: store i32 [[PREDPHI38]], i32* [[TMP8]], align 4, !alias.scope !15
	; UNROLL-NO-VF-NEXT: store i32 [[PREDPHI40]], i32* [[TMP7]], align 4, !alias.scope !15			; UNROLL-NO-VF-NEXT: store i32 [[PREDPHI39]], i32* [[TMP9]], align 4, !alias.scope !15
	; UNROLL-NO-VF-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 2			; UNROLL-NO-VF-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 2
	; UNROLL-NO-VF-NEXT: [[TMP44:%.*]] = icmp eq i64 [[INDEX_NEXT]], 128			; UNROLL-NO-VF-NEXT: [[TMP46:%.*]] = icmp eq i64 [[INDEX_NEXT]], 128
	; UNROLL-NO-VF-NEXT: br i1 [[TMP44]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP16:![0-9]+]]			; UNROLL-NO-VF-NEXT: br i1 [[TMP46]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP16:![0-9]+]]
	; UNROLL-NO-VF: middle.block:			; UNROLL-NO-VF: middle.block:
	; UNROLL-NO-VF-NEXT: [[CMP_N:%.*]] = icmp eq i64 128, 128			; UNROLL-NO-VF-NEXT: [[CMP_N:%.*]] = icmp eq i64 128, 128
	; UNROLL-NO-VF-NEXT: br i1 [[CMP_N]], label [[FOR_COND_CLEANUP:%.*]], label [[SCALAR_PH]]			; UNROLL-NO-VF-NEXT: br i1 [[CMP_N]], label [[FOR_COND_CLEANUP:%.*]], label [[SCALAR_PH]]
	; UNROLL-NO-VF: scalar.ph:			; UNROLL-NO-VF: scalar.ph:
	; UNROLL-NO-VF-NEXT: [[BC_RESUME_VAL:%.]] = phi i64 [ 128, [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY:%.]] ], [ 0, [[VECTOR_MEMCHECK]] ]			; UNROLL-NO-VF-NEXT: [[BC_RESUME_VAL:%.]] = phi i64 [ 128, [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY:%.]] ], [ 0, [[VECTOR_MEMCHECK]] ]
	; UNROLL-NO-VF-NEXT: br label [[FOR_BODY:%.*]]			; UNROLL-NO-VF-NEXT: br label [[FOR_BODY:%.*]]
	; UNROLL-NO-VF: for.cond.cleanup:			; UNROLL-NO-VF: for.cond.cleanup:
	; UNROLL-NO-VF-NEXT: ret void			; UNROLL-NO-VF-NEXT: ret void
	▲ Show 20 Lines • Show All 177 Lines • ▼ Show 20 Lines
	; UNROLL-NO-VF-NEXT: [[SCEVGEP45:%.]] = bitcast i32 [[SCEVGEP4]] to i8*			; UNROLL-NO-VF-NEXT: [[SCEVGEP45:%.]] = bitcast i32 [[SCEVGEP4]] to i8*
	; UNROLL-NO-VF-NEXT: [[BOUND0:%.]] = icmp ult i8 [[ASD1]], [[SCEVGEP45]]			; UNROLL-NO-VF-NEXT: [[BOUND0:%.]] = icmp ult i8 [[ASD1]], [[SCEVGEP45]]
	; UNROLL-NO-VF-NEXT: [[BOUND1:%.]] = icmp ult i8 [[BSD3]], [[SCEVGEP2]]			; UNROLL-NO-VF-NEXT: [[BOUND1:%.]] = icmp ult i8 [[BSD3]], [[SCEVGEP2]]
	; UNROLL-NO-VF-NEXT: [[FOUND_CONFLICT:%.*]] = and i1 [[BOUND0]], [[BOUND1]]			; UNROLL-NO-VF-NEXT: [[FOUND_CONFLICT:%.*]] = and i1 [[BOUND0]], [[BOUND1]]
	; UNROLL-NO-VF-NEXT: br i1 [[FOUND_CONFLICT]], label [[SCALAR_PH]], label [[VECTOR_PH:%.*]]			; UNROLL-NO-VF-NEXT: br i1 [[FOUND_CONFLICT]], label [[SCALAR_PH]], label [[VECTOR_PH:%.*]]
	; UNROLL-NO-VF: vector.ph:			; UNROLL-NO-VF: vector.ph:
	; UNROLL-NO-VF-NEXT: br label [[VECTOR_BODY:%.*]]			; UNROLL-NO-VF-NEXT: br label [[VECTOR_BODY:%.*]]
	; UNROLL-NO-VF: vector.body:			; UNROLL-NO-VF: vector.body:
	; UNROLL-NO-VF-NEXT: [[INDEX:%.]] = phi i64 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[PRED_SDIV_CONTINUE8:%.*]] ]			; UNROLL-NO-VF-NEXT: [[INDEX:%.]] = phi i64 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[PRED_SDIV_CONTINUE7:%.*]] ]
	; UNROLL-NO-VF-NEXT: [[INDUCTION:%.*]] = add i64 [[INDEX]], 0			; UNROLL-NO-VF-NEXT: [[TMP0:%.*]] = add i64 [[INDEX]], 0
	; UNROLL-NO-VF-NEXT: [[INDUCTION6:%.*]] = add i64 [[INDEX]], 1			; UNROLL-NO-VF-NEXT: [[TMP1:%.*]] = add i64 [[INDEX]], 1
	; UNROLL-NO-VF-NEXT: [[TMP0:%.]] = getelementptr inbounds i32, i32 [[ASD]], i64 [[INDUCTION]]			; UNROLL-NO-VF-NEXT: [[TMP2:%.]] = getelementptr inbounds i32, i32 [[ASD]], i64 [[TMP0]]
	; UNROLL-NO-VF-NEXT: [[TMP1:%.]] = getelementptr inbounds i32, i32 [[ASD]], i64 [[INDUCTION6]]			; UNROLL-NO-VF-NEXT: [[TMP3:%.]] = getelementptr inbounds i32, i32 [[ASD]], i64 [[TMP1]]
	; UNROLL-NO-VF-NEXT: [[TMP2:%.]] = load i32, i32 [[TMP0]], align 4, !alias.scope !19, !noalias !22			; UNROLL-NO-VF-NEXT: [[TMP4:%.]] = load i32, i32 [[TMP2]], align 4, !alias.scope !19, !noalias !22
	; UNROLL-NO-VF-NEXT: [[TMP3:%.]] = load i32, i32 [[TMP1]], align 4, !alias.scope !19, !noalias !22			; UNROLL-NO-VF-NEXT: [[TMP5:%.]] = load i32, i32 [[TMP3]], align 4, !alias.scope !19, !noalias !22
	; UNROLL-NO-VF-NEXT: [[TMP4:%.*]] = add nsw i32 [[TMP2]], 23			; UNROLL-NO-VF-NEXT: [[TMP6:%.*]] = add nsw i32 [[TMP4]], 23
	; UNROLL-NO-VF-NEXT: [[TMP5:%.*]] = add nsw i32 [[TMP3]], 23			; UNROLL-NO-VF-NEXT: [[TMP7:%.*]] = add nsw i32 [[TMP5]], 23
	; UNROLL-NO-VF-NEXT: [[TMP6:%.*]] = icmp slt i32 [[TMP2]], 100			; UNROLL-NO-VF-NEXT: [[TMP8:%.*]] = icmp slt i32 [[TMP4]], 100
	; UNROLL-NO-VF-NEXT: [[TMP7:%.*]] = icmp slt i32 [[TMP3]], 100			; UNROLL-NO-VF-NEXT: [[TMP9:%.*]] = icmp slt i32 [[TMP5]], 100
	; UNROLL-NO-VF-NEXT: br i1 [[TMP6]], label [[PRED_SDIV_IF:%.]], label [[PRED_SDIV_CONTINUE:%.]]			; UNROLL-NO-VF-NEXT: br i1 [[TMP8]], label [[PRED_SDIV_IF:%.]], label [[PRED_SDIV_CONTINUE:%.]]
	; UNROLL-NO-VF: pred.sdiv.if:			; UNROLL-NO-VF: pred.sdiv.if:
	; UNROLL-NO-VF-NEXT: [[TMP8:%.]] = getelementptr inbounds i32, i32 [[BSD]], i64 [[INDUCTION]]			; UNROLL-NO-VF-NEXT: [[TMP10:%.]] = getelementptr inbounds i32, i32 [[BSD]], i64 [[TMP0]]
	; UNROLL-NO-VF-NEXT: [[TMP9:%.]] = load i32, i32 [[TMP8]], align 4, !alias.scope !22			; UNROLL-NO-VF-NEXT: [[TMP11:%.]] = load i32, i32 [[TMP10]], align 4, !alias.scope !22
	; UNROLL-NO-VF-NEXT: [[TMP10:%.*]] = sdiv i32 [[TMP4]], [[TMP2]]			; UNROLL-NO-VF-NEXT: [[TMP12:%.*]] = sdiv i32 [[TMP6]], [[TMP4]]
	; UNROLL-NO-VF-NEXT: [[TMP11:%.*]] = sdiv i32 [[TMP9]], [[TMP10]]			; UNROLL-NO-VF-NEXT: [[TMP13:%.*]] = sdiv i32 [[TMP11]], [[TMP12]]
	; UNROLL-NO-VF-NEXT: br label [[PRED_SDIV_CONTINUE]]			; UNROLL-NO-VF-NEXT: br label [[PRED_SDIV_CONTINUE]]
	; UNROLL-NO-VF: pred.sdiv.continue:			; UNROLL-NO-VF: pred.sdiv.continue:
	; UNROLL-NO-VF-NEXT: [[TMP12:%.*]] = phi i32 [ poison, [[VECTOR_BODY]] ], [ [[TMP10]], [[PRED_SDIV_IF]] ]			; UNROLL-NO-VF-NEXT: [[TMP14:%.*]] = phi i32 [ poison, [[VECTOR_BODY]] ], [ [[TMP12]], [[PRED_SDIV_IF]] ]
	; UNROLL-NO-VF-NEXT: [[TMP13:%.*]] = phi i32 [ poison, [[VECTOR_BODY]] ], [ [[TMP11]], [[PRED_SDIV_IF]] ]			; UNROLL-NO-VF-NEXT: [[TMP15:%.*]] = phi i32 [ poison, [[VECTOR_BODY]] ], [ [[TMP13]], [[PRED_SDIV_IF]] ]
	; UNROLL-NO-VF-NEXT: br i1 [[TMP7]], label [[PRED_SDIV_IF7:%.*]], label [[PRED_SDIV_CONTINUE8]]			; UNROLL-NO-VF-NEXT: br i1 [[TMP9]], label [[PRED_SDIV_IF6:%.*]], label [[PRED_SDIV_CONTINUE7]]
	; UNROLL-NO-VF: pred.sdiv.if6:			; UNROLL-NO-VF: pred.sdiv.if6:
	; UNROLL-NO-VF-NEXT: [[TMP14:%.]] = getelementptr inbounds i32, i32 [[BSD]], i64 [[INDUCTION6]]			; UNROLL-NO-VF-NEXT: [[TMP16:%.]] = getelementptr inbounds i32, i32 [[BSD]], i64 [[TMP1]]
	; UNROLL-NO-VF-NEXT: [[TMP15:%.]] = load i32, i32 [[TMP14]], align 4, !alias.scope !22			; UNROLL-NO-VF-NEXT: [[TMP17:%.]] = load i32, i32 [[TMP16]], align 4, !alias.scope !22
	; UNROLL-NO-VF-NEXT: [[TMP16:%.*]] = sdiv i32 [[TMP5]], [[TMP3]]			; UNROLL-NO-VF-NEXT: [[TMP18:%.*]] = sdiv i32 [[TMP7]], [[TMP5]]
	; UNROLL-NO-VF-NEXT: [[TMP17:%.*]] = sdiv i32 [[TMP15]], [[TMP16]]			; UNROLL-NO-VF-NEXT: [[TMP19:%.*]] = sdiv i32 [[TMP17]], [[TMP18]]
	; UNROLL-NO-VF-NEXT: br label [[PRED_SDIV_CONTINUE8]]			; UNROLL-NO-VF-NEXT: br label [[PRED_SDIV_CONTINUE7]]
	; UNROLL-NO-VF: pred.sdiv.continue7:			; UNROLL-NO-VF: pred.sdiv.continue7:
	; UNROLL-NO-VF-NEXT: [[TMP18:%.*]] = phi i32 [ poison, [[PRED_SDIV_CONTINUE]] ], [ [[TMP16]], [[PRED_SDIV_IF7]] ]			; UNROLL-NO-VF-NEXT: [[TMP20:%.*]] = phi i32 [ poison, [[PRED_SDIV_CONTINUE]] ], [ [[TMP18]], [[PRED_SDIV_IF6]] ]
	; UNROLL-NO-VF-NEXT: [[TMP19:%.*]] = phi i32 [ poison, [[PRED_SDIV_CONTINUE]] ], [ [[TMP17]], [[PRED_SDIV_IF7]] ]			; UNROLL-NO-VF-NEXT: [[TMP21:%.*]] = phi i32 [ poison, [[PRED_SDIV_CONTINUE]] ], [ [[TMP19]], [[PRED_SDIV_IF6]] ]
	; UNROLL-NO-VF-NEXT: [[TMP20:%.*]] = xor i1 [[TMP6]], true			; UNROLL-NO-VF-NEXT: [[TMP22:%.*]] = xor i1 [[TMP8]], true
	; UNROLL-NO-VF-NEXT: [[TMP21:%.*]] = xor i1 [[TMP7]], true			; UNROLL-NO-VF-NEXT: [[TMP23:%.*]] = xor i1 [[TMP9]], true
	; UNROLL-NO-VF-NEXT: [[PREDPHI:%.*]] = select i1 [[TMP20]], i32 [[TMP4]], i32 [[TMP13]]			; UNROLL-NO-VF-NEXT: [[PREDPHI:%.*]] = select i1 [[TMP22]], i32 [[TMP6]], i32 [[TMP15]]
	; UNROLL-NO-VF-NEXT: [[PREDPHI9:%.*]] = select i1 [[TMP21]], i32 [[TMP5]], i32 [[TMP19]]			; UNROLL-NO-VF-NEXT: [[PREDPHI8:%.*]] = select i1 [[TMP23]], i32 [[TMP7]], i32 [[TMP21]]
	; UNROLL-NO-VF-NEXT: store i32 [[PREDPHI]], i32* [[TMP0]], align 4, !alias.scope !19, !noalias !22			; UNROLL-NO-VF-NEXT: store i32 [[PREDPHI]], i32* [[TMP2]], align 4, !alias.scope !19, !noalias !22
	; UNROLL-NO-VF-NEXT: store i32 [[PREDPHI9]], i32* [[TMP1]], align 4, !alias.scope !19, !noalias !22			; UNROLL-NO-VF-NEXT: store i32 [[PREDPHI8]], i32* [[TMP3]], align 4, !alias.scope !19, !noalias !22
	; UNROLL-NO-VF-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 2			; UNROLL-NO-VF-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 2
	; UNROLL-NO-VF-NEXT: [[TMP22:%.*]] = icmp eq i64 [[INDEX_NEXT]], 128			; UNROLL-NO-VF-NEXT: [[TMP24:%.*]] = icmp eq i64 [[INDEX_NEXT]], 128
	; UNROLL-NO-VF-NEXT: br i1 [[TMP22]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP24:![0-9]+]]			; UNROLL-NO-VF-NEXT: br i1 [[TMP24]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP24:![0-9]+]]
	; UNROLL-NO-VF: middle.block:			; UNROLL-NO-VF: middle.block:
	; UNROLL-NO-VF-NEXT: [[CMP_N:%.*]] = icmp eq i64 128, 128			; UNROLL-NO-VF-NEXT: [[CMP_N:%.*]] = icmp eq i64 128, 128
	; UNROLL-NO-VF-NEXT: br i1 [[CMP_N]], label [[FOR_COND_CLEANUP:%.*]], label [[SCALAR_PH]]			; UNROLL-NO-VF-NEXT: br i1 [[CMP_N]], label [[FOR_COND_CLEANUP:%.*]], label [[SCALAR_PH]]
	; UNROLL-NO-VF: scalar.ph:			; UNROLL-NO-VF: scalar.ph:
	; UNROLL-NO-VF-NEXT: [[BC_RESUME_VAL:%.]] = phi i64 [ 128, [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY:%.]] ], [ 0, [[VECTOR_MEMCHECK]] ]			; UNROLL-NO-VF-NEXT: [[BC_RESUME_VAL:%.]] = phi i64 [ 128, [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY:%.]] ], [ 0, [[VECTOR_MEMCHECK]] ]
	; UNROLL-NO-VF-NEXT: br label [[FOR_BODY:%.*]]			; UNROLL-NO-VF-NEXT: br label [[FOR_BODY:%.*]]
	; UNROLL-NO-VF: for.cond.cleanup:			; UNROLL-NO-VF: for.cond.cleanup:
	; UNROLL-NO-VF-NEXT: ret void			; UNROLL-NO-VF-NEXT: ret void
	▲ Show 20 Lines • Show All 154 Lines • ▼ Show 20 Lines
	; UNROLL-NO-VF-NEXT: [[SCEVGEP45:%.]] = bitcast i32 [[SCEVGEP4]] to i8*			; UNROLL-NO-VF-NEXT: [[SCEVGEP45:%.]] = bitcast i32 [[SCEVGEP4]] to i8*
	; UNROLL-NO-VF-NEXT: [[BOUND0:%.]] = icmp ult i8 [[ASD1]], [[SCEVGEP45]]			; UNROLL-NO-VF-NEXT: [[BOUND0:%.]] = icmp ult i8 [[ASD1]], [[SCEVGEP45]]
	; UNROLL-NO-VF-NEXT: [[BOUND1:%.]] = icmp ult i8 [[BSD3]], [[SCEVGEP2]]			; UNROLL-NO-VF-NEXT: [[BOUND1:%.]] = icmp ult i8 [[BSD3]], [[SCEVGEP2]]
	; UNROLL-NO-VF-NEXT: [[FOUND_CONFLICT:%.*]] = and i1 [[BOUND0]], [[BOUND1]]			; UNROLL-NO-VF-NEXT: [[FOUND_CONFLICT:%.*]] = and i1 [[BOUND0]], [[BOUND1]]
	; UNROLL-NO-VF-NEXT: br i1 [[FOUND_CONFLICT]], label [[SCALAR_PH]], label [[VECTOR_PH:%.*]]			; UNROLL-NO-VF-NEXT: br i1 [[FOUND_CONFLICT]], label [[SCALAR_PH]], label [[VECTOR_PH:%.*]]
	; UNROLL-NO-VF: vector.ph:			; UNROLL-NO-VF: vector.ph:
	; UNROLL-NO-VF-NEXT: br label [[VECTOR_BODY:%.*]]			; UNROLL-NO-VF-NEXT: br label [[VECTOR_BODY:%.*]]
	; UNROLL-NO-VF: vector.body:			; UNROLL-NO-VF: vector.body:
	; UNROLL-NO-VF-NEXT: [[INDEX:%.]] = phi i64 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[PRED_SDIV_CONTINUE8:%.*]] ]			; UNROLL-NO-VF-NEXT: [[INDEX:%.]] = phi i64 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[PRED_SDIV_CONTINUE7:%.*]] ]
	; UNROLL-NO-VF-NEXT: [[INDUCTION:%.*]] = add i64 [[INDEX]], 0			; UNROLL-NO-VF-NEXT: [[TMP0:%.*]] = add i64 [[INDEX]], 0
	; UNROLL-NO-VF-NEXT: [[INDUCTION6:%.*]] = add i64 [[INDEX]], 1			; UNROLL-NO-VF-NEXT: [[TMP1:%.*]] = add i64 [[INDEX]], 1
	; UNROLL-NO-VF-NEXT: [[TMP0:%.]] = getelementptr inbounds i32, i32 [[ASD]], i64 [[INDUCTION]]			; UNROLL-NO-VF-NEXT: [[TMP2:%.]] = getelementptr inbounds i32, i32 [[ASD]], i64 [[TMP0]]
	; UNROLL-NO-VF-NEXT: [[TMP1:%.]] = getelementptr inbounds i32, i32 [[ASD]], i64 [[INDUCTION6]]			; UNROLL-NO-VF-NEXT: [[TMP3:%.]] = getelementptr inbounds i32, i32 [[ASD]], i64 [[TMP1]]
	; UNROLL-NO-VF-NEXT: [[TMP2:%.]] = load i32, i32 [[TMP0]], align 4, !alias.scope !28, !noalias !31			; UNROLL-NO-VF-NEXT: [[TMP4:%.]] = load i32, i32 [[TMP2]], align 4, !alias.scope !28, !noalias !31
	; UNROLL-NO-VF-NEXT: [[TMP3:%.]] = load i32, i32 [[TMP1]], align 4, !alias.scope !28, !noalias !31			; UNROLL-NO-VF-NEXT: [[TMP5:%.]] = load i32, i32 [[TMP3]], align 4, !alias.scope !28, !noalias !31
	; UNROLL-NO-VF-NEXT: [[TMP4:%.*]] = add nsw i32 [[TMP2]], 23			; UNROLL-NO-VF-NEXT: [[TMP6:%.*]] = add nsw i32 [[TMP4]], 23
	; UNROLL-NO-VF-NEXT: [[TMP5:%.*]] = add nsw i32 [[TMP3]], 23			; UNROLL-NO-VF-NEXT: [[TMP7:%.*]] = add nsw i32 [[TMP5]], 23
	; UNROLL-NO-VF-NEXT: [[TMP6:%.*]] = icmp slt i32 [[TMP2]], 100			; UNROLL-NO-VF-NEXT: [[TMP8:%.*]] = icmp slt i32 [[TMP4]], 100
	; UNROLL-NO-VF-NEXT: [[TMP7:%.*]] = icmp slt i32 [[TMP3]], 100			; UNROLL-NO-VF-NEXT: [[TMP9:%.*]] = icmp slt i32 [[TMP5]], 100
	; UNROLL-NO-VF-NEXT: [[TMP8:%.*]] = icmp sge i32 [[TMP2]], 200			; UNROLL-NO-VF-NEXT: [[TMP10:%.*]] = icmp sge i32 [[TMP4]], 200
	; UNROLL-NO-VF-NEXT: [[TMP9:%.*]] = icmp sge i32 [[TMP3]], 200			; UNROLL-NO-VF-NEXT: [[TMP11:%.*]] = icmp sge i32 [[TMP5]], 200
	; UNROLL-NO-VF-NEXT: [[TMP10:%.*]] = xor i1 [[TMP6]], true, !dbg [[DBG33:![0-9]+]]			; UNROLL-NO-VF-NEXT: [[TMP12:%.*]] = xor i1 [[TMP8]], true, !dbg [[DBG33:![0-9]+]]
	; UNROLL-NO-VF-NEXT: [[TMP11:%.*]] = xor i1 [[TMP7]], true, !dbg [[DBG33]]			; UNROLL-NO-VF-NEXT: [[TMP13:%.*]] = xor i1 [[TMP9]], true, !dbg [[DBG33]]
	; UNROLL-NO-VF-NEXT: [[TMP12:%.*]] = select i1 [[TMP10]], i1 [[TMP8]], i1 false, !dbg [[DBG34:![0-9]+]]			; UNROLL-NO-VF-NEXT: [[TMP14:%.*]] = select i1 [[TMP12]], i1 [[TMP10]], i1 false, !dbg [[DBG34:![0-9]+]]
	; UNROLL-NO-VF-NEXT: [[TMP13:%.*]] = select i1 [[TMP11]], i1 [[TMP9]], i1 false, !dbg [[DBG34]]			; UNROLL-NO-VF-NEXT: [[TMP15:%.*]] = select i1 [[TMP13]], i1 [[TMP11]], i1 false, !dbg [[DBG34]]
	; UNROLL-NO-VF-NEXT: [[TMP14:%.*]] = or i1 [[TMP12]], [[TMP6]]			; UNROLL-NO-VF-NEXT: [[TMP16:%.*]] = or i1 [[TMP14]], [[TMP8]]
	; UNROLL-NO-VF-NEXT: [[TMP15:%.*]] = or i1 [[TMP13]], [[TMP7]]			; UNROLL-NO-VF-NEXT: [[TMP17:%.*]] = or i1 [[TMP15]], [[TMP9]]
	; UNROLL-NO-VF-NEXT: br i1 [[TMP14]], label [[PRED_SDIV_IF:%.]], label [[PRED_SDIV_CONTINUE:%.]]			; UNROLL-NO-VF-NEXT: br i1 [[TMP16]], label [[PRED_SDIV_IF:%.]], label [[PRED_SDIV_CONTINUE:%.]]
	; UNROLL-NO-VF: pred.sdiv.if:			; UNROLL-NO-VF: pred.sdiv.if:
	; UNROLL-NO-VF-NEXT: [[TMP16:%.]] = getelementptr inbounds i32, i32 [[BSD]], i64 [[INDUCTION]]			; UNROLL-NO-VF-NEXT: [[TMP18:%.]] = getelementptr inbounds i32, i32 [[BSD]], i64 [[TMP0]]
	; UNROLL-NO-VF-NEXT: [[TMP17:%.]] = load i32, i32 [[TMP16]], align 4, !alias.scope !31			; UNROLL-NO-VF-NEXT: [[TMP19:%.]] = load i32, i32 [[TMP18]], align 4, !alias.scope !31
	; UNROLL-NO-VF-NEXT: [[TMP18:%.*]] = sdiv i32 [[TMP4]], [[TMP2]]			; UNROLL-NO-VF-NEXT: [[TMP20:%.*]] = sdiv i32 [[TMP6]], [[TMP4]]
	; UNROLL-NO-VF-NEXT: [[TMP19:%.*]] = sdiv i32 [[TMP17]], [[TMP18]]			; UNROLL-NO-VF-NEXT: [[TMP21:%.*]] = sdiv i32 [[TMP19]], [[TMP20]]
	; UNROLL-NO-VF-NEXT: br label [[PRED_SDIV_CONTINUE]]			; UNROLL-NO-VF-NEXT: br label [[PRED_SDIV_CONTINUE]]
	; UNROLL-NO-VF: pred.sdiv.continue:			; UNROLL-NO-VF: pred.sdiv.continue:
	; UNROLL-NO-VF-NEXT: [[TMP20:%.*]] = phi i32 [ poison, [[VECTOR_BODY]] ], [ [[TMP18]], [[PRED_SDIV_IF]] ]			; UNROLL-NO-VF-NEXT: [[TMP22:%.*]] = phi i32 [ poison, [[VECTOR_BODY]] ], [ [[TMP20]], [[PRED_SDIV_IF]] ]
	; UNROLL-NO-VF-NEXT: [[TMP21:%.*]] = phi i32 [ poison, [[VECTOR_BODY]] ], [ [[TMP19]], [[PRED_SDIV_IF]] ]			; UNROLL-NO-VF-NEXT: [[TMP23:%.*]] = phi i32 [ poison, [[VECTOR_BODY]] ], [ [[TMP21]], [[PRED_SDIV_IF]] ]
	; UNROLL-NO-VF-NEXT: br i1 [[TMP15]], label [[PRED_SDIV_IF7:%.*]], label [[PRED_SDIV_CONTINUE8]]			; UNROLL-NO-VF-NEXT: br i1 [[TMP17]], label [[PRED_SDIV_IF6:%.*]], label [[PRED_SDIV_CONTINUE7]]
	; UNROLL-NO-VF: pred.sdiv.if6:			; UNROLL-NO-VF: pred.sdiv.if6:
	; UNROLL-NO-VF-NEXT: [[TMP22:%.]] = getelementptr inbounds i32, i32 [[BSD]], i64 [[INDUCTION6]]			; UNROLL-NO-VF-NEXT: [[TMP24:%.]] = getelementptr inbounds i32, i32 [[BSD]], i64 [[TMP1]]
	; UNROLL-NO-VF-NEXT: [[TMP23:%.]] = load i32, i32 [[TMP22]], align 4, !alias.scope !31			; UNROLL-NO-VF-NEXT: [[TMP25:%.]] = load i32, i32 [[TMP24]], align 4, !alias.scope !31
	; UNROLL-NO-VF-NEXT: [[TMP24:%.*]] = sdiv i32 [[TMP5]], [[TMP3]]			; UNROLL-NO-VF-NEXT: [[TMP26:%.*]] = sdiv i32 [[TMP7]], [[TMP5]]
	; UNROLL-NO-VF-NEXT: [[TMP25:%.*]] = sdiv i32 [[TMP23]], [[TMP24]]			; UNROLL-NO-VF-NEXT: [[TMP27:%.*]] = sdiv i32 [[TMP25]], [[TMP26]]
	; UNROLL-NO-VF-NEXT: br label [[PRED_SDIV_CONTINUE8]]			; UNROLL-NO-VF-NEXT: br label [[PRED_SDIV_CONTINUE7]]
	; UNROLL-NO-VF: pred.sdiv.continue7:			; UNROLL-NO-VF: pred.sdiv.continue7:
	; UNROLL-NO-VF-NEXT: [[TMP26:%.*]] = phi i32 [ poison, [[PRED_SDIV_CONTINUE]] ], [ [[TMP24]], [[PRED_SDIV_IF7]] ]			; UNROLL-NO-VF-NEXT: [[TMP28:%.*]] = phi i32 [ poison, [[PRED_SDIV_CONTINUE]] ], [ [[TMP26]], [[PRED_SDIV_IF6]] ]
	; UNROLL-NO-VF-NEXT: [[TMP27:%.*]] = phi i32 [ poison, [[PRED_SDIV_CONTINUE]] ], [ [[TMP25]], [[PRED_SDIV_IF7]] ]			; UNROLL-NO-VF-NEXT: [[TMP29:%.*]] = phi i32 [ poison, [[PRED_SDIV_CONTINUE]] ], [ [[TMP27]], [[PRED_SDIV_IF6]] ]
	; UNROLL-NO-VF-NEXT: [[TMP28:%.*]] = xor i1 [[TMP8]], true, !dbg [[DBG34]]			; UNROLL-NO-VF-NEXT: [[TMP30:%.*]] = xor i1 [[TMP10]], true, !dbg [[DBG34]]
	; UNROLL-NO-VF-NEXT: [[TMP29:%.*]] = xor i1 [[TMP9]], true, !dbg [[DBG34]]			; UNROLL-NO-VF-NEXT: [[TMP31:%.*]] = xor i1 [[TMP11]], true, !dbg [[DBG34]]
	; UNROLL-NO-VF-NEXT: [[TMP30:%.*]] = select i1 [[TMP10]], i1 [[TMP28]], i1 false, !dbg [[DBG34]]			; UNROLL-NO-VF-NEXT: [[TMP32:%.*]] = select i1 [[TMP12]], i1 [[TMP30]], i1 false, !dbg [[DBG34]]
	; UNROLL-NO-VF-NEXT: [[TMP31:%.*]] = select i1 [[TMP11]], i1 [[TMP29]], i1 false, !dbg [[DBG34]]			; UNROLL-NO-VF-NEXT: [[TMP33:%.*]] = select i1 [[TMP13]], i1 [[TMP31]], i1 false, !dbg [[DBG34]]
	; UNROLL-NO-VF-NEXT: [[PREDPHI:%.*]] = select i1 [[TMP30]], i32 [[TMP4]], i32 [[TMP21]]			; UNROLL-NO-VF-NEXT: [[PREDPHI:%.*]] = select i1 [[TMP32]], i32 [[TMP6]], i32 [[TMP23]]
	; UNROLL-NO-VF-NEXT: [[PREDPHI9:%.*]] = select i1 [[TMP31]], i32 [[TMP5]], i32 [[TMP27]]			; UNROLL-NO-VF-NEXT: [[PREDPHI8:%.*]] = select i1 [[TMP33]], i32 [[TMP7]], i32 [[TMP29]]
	; UNROLL-NO-VF-NEXT: store i32 [[PREDPHI]], i32* [[TMP0]], align 4, !alias.scope !28, !noalias !31			; UNROLL-NO-VF-NEXT: store i32 [[PREDPHI]], i32* [[TMP2]], align 4, !alias.scope !28, !noalias !31
	; UNROLL-NO-VF-NEXT: store i32 [[PREDPHI9]], i32* [[TMP1]], align 4, !alias.scope !28, !noalias !31			; UNROLL-NO-VF-NEXT: store i32 [[PREDPHI8]], i32* [[TMP3]], align 4, !alias.scope !28, !noalias !31
	; UNROLL-NO-VF-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 2			; UNROLL-NO-VF-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 2
	; UNROLL-NO-VF-NEXT: [[TMP32:%.*]] = icmp eq i64 [[INDEX_NEXT]], 128			; UNROLL-NO-VF-NEXT: [[TMP34:%.*]] = icmp eq i64 [[INDEX_NEXT]], 128
	; UNROLL-NO-VF-NEXT: br i1 [[TMP32]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP35:![0-9]+]]			; UNROLL-NO-VF-NEXT: br i1 [[TMP34]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP35:![0-9]+]]
	; UNROLL-NO-VF: middle.block:			; UNROLL-NO-VF: middle.block:
	; UNROLL-NO-VF-NEXT: [[CMP_N:%.*]] = icmp eq i64 128, 128			; UNROLL-NO-VF-NEXT: [[CMP_N:%.*]] = icmp eq i64 128, 128
	; UNROLL-NO-VF-NEXT: br i1 [[CMP_N]], label [[FOR_COND_CLEANUP:%.*]], label [[SCALAR_PH]]			; UNROLL-NO-VF-NEXT: br i1 [[CMP_N]], label [[FOR_COND_CLEANUP:%.*]], label [[SCALAR_PH]]
	; UNROLL-NO-VF: scalar.ph:			; UNROLL-NO-VF: scalar.ph:
	; UNROLL-NO-VF-NEXT: [[BC_RESUME_VAL:%.]] = phi i64 [ 128, [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY:%.]] ], [ 0, [[VECTOR_MEMCHECK]] ]			; UNROLL-NO-VF-NEXT: [[BC_RESUME_VAL:%.]] = phi i64 [ 128, [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY:%.]] ], [ 0, [[VECTOR_MEMCHECK]] ]
	; UNROLL-NO-VF-NEXT: br label [[FOR_BODY:%.*]]			; UNROLL-NO-VF-NEXT: br label [[FOR_BODY:%.*]]
	; UNROLL-NO-VF: for.cond.cleanup:			; UNROLL-NO-VF: for.cond.cleanup:
	; UNROLL-NO-VF-NEXT: ret void			; UNROLL-NO-VF-NEXT: ret void
	▲ Show 20 Lines • Show All 98 Lines • ▼ Show 20 Lines
	; CHECK-NEXT: [[TMP18:%.*]] = xor <2 x i1> [[BROADCAST_SPLAT]], <i1 true, i1 true>			; CHECK-NEXT: [[TMP18:%.*]] = xor <2 x i1> [[BROADCAST_SPLAT]], <i1 true, i1 true>
	; CHECK-NEXT: [[PREDPHI:%.*]] = select <2 x i1> [[BROADCAST_SPLAT]], <2 x i32> [[TMP17]], <2 x i32> [[WIDE_LOAD]]			; CHECK-NEXT: [[PREDPHI:%.*]] = select <2 x i1> [[BROADCAST_SPLAT]], <2 x i32> [[TMP17]], <2 x i32> [[WIDE_LOAD]]
	; CHECK-NEXT: [[TMP19]] = add <2 x i32> [[VEC_PHI]], [[PREDPHI]]			; CHECK-NEXT: [[TMP19]] = add <2 x i32> [[VEC_PHI]], [[PREDPHI]]
	; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 2			; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 2
	; CHECK-NEXT: [[TMP20:%.*]] = icmp eq i64 [[INDEX_NEXT]], [[N_VEC]]			; CHECK-NEXT: [[TMP20:%.*]] = icmp eq i64 [[INDEX_NEXT]], [[N_VEC]]
	; CHECK-NEXT: br i1 [[TMP20]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP37:![0-9]+]]			; CHECK-NEXT: br i1 [[TMP20]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP37:![0-9]+]]
	; CHECK: middle.block:			; CHECK: middle.block:
	; CHECK-NEXT: [[TMP21:%.*]] = call i32 @llvm.vector.reduce.add.v2i32(<2 x i32> [[TMP19]])			; CHECK-NEXT: [[TMP21:%.*]] = call i32 @llvm.vector.reduce.add.v2i32(<2 x i32> [[TMP19]])
				; CHECK-NEXT: [[RDX_START:%.*]] = add i32 0, [[TMP21]]
	; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i64 [[SMAX]], [[N_VEC]]			; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i64 [[SMAX]], [[N_VEC]]
	; CHECK-NEXT: br i1 [[CMP_N]], label [[FOR_END:%.*]], label [[SCALAR_PH]]			; CHECK-NEXT: br i1 [[CMP_N]], label [[FOR_END:%.*]], label [[SCALAR_PH]]
	; CHECK: scalar.ph:			; CHECK: scalar.ph:
	; CHECK-NEXT: [[BC_RESUME_VAL:%.]] = phi i64 [ [[N_VEC]], [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY:%.]] ]			; CHECK-NEXT: [[BC_RESUME_VAL:%.]] = phi i64 [ [[N_VEC]], [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY:%.]] ]
	; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 0, [[ENTRY]] ], [ [[TMP21]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 0, [[ENTRY]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: br label [[FOR_BODY:%.*]]			; CHECK-NEXT: br label [[FOR_BODY:%.*]]
	; CHECK: for.body:			; CHECK: for.body:
	; CHECK-NEXT: [[I:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[I_NEXT:%.]], [[FOR_INC:%.*]] ]			; CHECK-NEXT: [[I:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[I_NEXT:%.]], [[FOR_INC:%.*]] ]
	; CHECK-NEXT: [[R:%.]] = phi i32 [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[T6:%.]], [[FOR_INC]] ]			; CHECK-NEXT: [[R:%.]] = phi i32 [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[T6:%.]], [[FOR_INC]] ]
	; CHECK-NEXT: [[T0:%.]] = getelementptr inbounds i32, i32 [[A]], i64 [[I]]			; CHECK-NEXT: [[T0:%.]] = getelementptr inbounds i32, i32 [[A]], i64 [[I]]
	; CHECK-NEXT: [[T2:%.]] = load i32, i32 [[T0]], align 4			; CHECK-NEXT: [[T2:%.]] = load i32, i32 [[T0]], align 4
	; CHECK-NEXT: br i1 [[C]], label [[IF_THEN:%.*]], label [[FOR_INC]]			; CHECK-NEXT: br i1 [[C]], label [[IF_THEN:%.*]], label [[FOR_INC]]
	; CHECK: if.then:			; CHECK: if.then:
	; CHECK-NEXT: [[T3:%.*]] = add nsw i32 [[T2]], [[X]]			; CHECK-NEXT: [[T3:%.*]] = add nsw i32 [[T2]], [[X]]
	; CHECK-NEXT: [[T4:%.*]] = udiv i32 [[T2]], [[T3]]			; CHECK-NEXT: [[T4:%.*]] = udiv i32 [[T2]], [[T3]]
	; CHECK-NEXT: br label [[FOR_INC]]			; CHECK-NEXT: br label [[FOR_INC]]
	; CHECK: for.inc:			; CHECK: for.inc:
	; CHECK-NEXT: [[T5:%.*]] = phi i32 [ [[T2]], [[FOR_BODY]] ], [ [[T4]], [[IF_THEN]] ]			; CHECK-NEXT: [[T5:%.*]] = phi i32 [ [[T2]], [[FOR_BODY]] ], [ [[T4]], [[IF_THEN]] ]
	; CHECK-NEXT: [[T6]] = add i32 [[R]], [[T5]]			; CHECK-NEXT: [[T6]] = add i32 [[R]], [[T5]]
	; CHECK-NEXT: [[I_NEXT]] = add nuw nsw i64 [[I]], 1			; CHECK-NEXT: [[I_NEXT]] = add nuw nsw i64 [[I]], 1
	; CHECK-NEXT: [[COND:%.*]] = icmp slt i64 [[I_NEXT]], [[N]]			; CHECK-NEXT: [[COND:%.*]] = icmp slt i64 [[I_NEXT]], [[N]]
	; CHECK-NEXT: br i1 [[COND]], label [[FOR_BODY]], label [[FOR_END]], !llvm.loop [[LOOP38:![0-9]+]]			; CHECK-NEXT: br i1 [[COND]], label [[FOR_BODY]], label [[FOR_END]], !llvm.loop [[LOOP38:![0-9]+]]
	; CHECK: for.end:			; CHECK: for.end:
	; CHECK-NEXT: [[T7:%.*]] = phi i32 [ [[T6]], [[FOR_INC]] ], [ [[TMP21]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[T7:%.*]] = phi i32 [ [[T6]], [[FOR_INC]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: ret i32 [[T7]]			; CHECK-NEXT: ret i32 [[T7]]
	;			;
	; UNROLL-NO-VF-LABEL: @predicated_udiv_scalarized_operand(			; UNROLL-NO-VF-LABEL: @predicated_udiv_scalarized_operand(
	; UNROLL-NO-VF-NEXT: entry:			; UNROLL-NO-VF-NEXT: entry:
	; UNROLL-NO-VF-NEXT: [[SMAX:%.]] = call i64 @llvm.smax.i64(i64 [[N:%.]], i64 1)			; UNROLL-NO-VF-NEXT: [[SMAX:%.]] = call i64 @llvm.smax.i64(i64 [[N:%.]], i64 1)
	; UNROLL-NO-VF-NEXT: [[MIN_ITERS_CHECK:%.*]] = icmp ult i64 [[SMAX]], 2			; UNROLL-NO-VF-NEXT: [[MIN_ITERS_CHECK:%.*]] = icmp ult i64 [[SMAX]], 2
	; UNROLL-NO-VF-NEXT: br i1 [[MIN_ITERS_CHECK]], label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]			; UNROLL-NO-VF-NEXT: br i1 [[MIN_ITERS_CHECK]], label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]
	; UNROLL-NO-VF: vector.ph:			; UNROLL-NO-VF: vector.ph:
	; UNROLL-NO-VF-NEXT: [[N_MOD_VF:%.*]] = urem i64 [[SMAX]], 2			; UNROLL-NO-VF-NEXT: [[N_MOD_VF:%.*]] = urem i64 [[SMAX]], 2
	; UNROLL-NO-VF-NEXT: [[N_VEC:%.*]] = sub i64 [[SMAX]], [[N_MOD_VF]]			; UNROLL-NO-VF-NEXT: [[N_VEC:%.*]] = sub i64 [[SMAX]], [[N_MOD_VF]]
	; UNROLL-NO-VF-NEXT: br label [[VECTOR_BODY:%.*]]			; UNROLL-NO-VF-NEXT: br label [[VECTOR_BODY:%.*]]
	; UNROLL-NO-VF: vector.body:			; UNROLL-NO-VF: vector.body:
	; UNROLL-NO-VF-NEXT: [[INDEX:%.]] = phi i64 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[PRED_UDIV_CONTINUE4:%.*]] ]			; UNROLL-NO-VF-NEXT: [[INDEX:%.]] = phi i64 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[PRED_UDIV_CONTINUE3:%.*]] ]
	; UNROLL-NO-VF-NEXT: [[VEC_PHI:%.]] = phi i32 [ 0, [[VECTOR_PH]] ], [ [[TMP12:%.]], [[PRED_UDIV_CONTINUE4]] ]			; UNROLL-NO-VF-NEXT: [[VEC_PHI:%.]] = phi i32 [ 0, [[VECTOR_PH]] ], [ [[TMP14:%.]], [[PRED_UDIV_CONTINUE3]] ]
	; UNROLL-NO-VF-NEXT: [[VEC_PHI1:%.]] = phi i32 [ 0, [[VECTOR_PH]] ], [ [[TMP13:%.]], [[PRED_UDIV_CONTINUE4]] ]			; UNROLL-NO-VF-NEXT: [[VEC_PHI1:%.]] = phi i32 [ 0, [[VECTOR_PH]] ], [ [[TMP15:%.]], [[PRED_UDIV_CONTINUE3]] ]
	; UNROLL-NO-VF-NEXT: [[INDUCTION:%.*]] = add i64 [[INDEX]], 0			; UNROLL-NO-VF-NEXT: [[TMP0:%.*]] = add i64 [[INDEX]], 0
	; UNROLL-NO-VF-NEXT: [[INDUCTION2:%.*]] = add i64 [[INDEX]], 1			; UNROLL-NO-VF-NEXT: [[TMP1:%.*]] = add i64 [[INDEX]], 1
	; UNROLL-NO-VF-NEXT: [[TMP0:%.]] = getelementptr inbounds i32, i32 [[A:%.*]], i64 [[INDUCTION]]			; UNROLL-NO-VF-NEXT: [[TMP2:%.]] = getelementptr inbounds i32, i32 [[A:%.*]], i64 [[TMP0]]
	; UNROLL-NO-VF-NEXT: [[TMP1:%.]] = getelementptr inbounds i32, i32 [[A]], i64 [[INDUCTION2]]			; UNROLL-NO-VF-NEXT: [[TMP3:%.]] = getelementptr inbounds i32, i32 [[A]], i64 [[TMP1]]
	; UNROLL-NO-VF-NEXT: [[TMP2:%.]] = load i32, i32 [[TMP0]], align 4			; UNROLL-NO-VF-NEXT: [[TMP4:%.]] = load i32, i32 [[TMP2]], align 4
	; UNROLL-NO-VF-NEXT: [[TMP3:%.]] = load i32, i32 [[TMP1]], align 4			; UNROLL-NO-VF-NEXT: [[TMP5:%.]] = load i32, i32 [[TMP3]], align 4
	; UNROLL-NO-VF-NEXT: br i1 [[C:%.]], label [[PRED_UDIV_IF:%.]], label [[PRED_UDIV_CONTINUE:%.*]]			; UNROLL-NO-VF-NEXT: br i1 [[C:%.]], label [[PRED_UDIV_IF:%.]], label [[PRED_UDIV_CONTINUE:%.*]]
	; UNROLL-NO-VF: pred.udiv.if:			; UNROLL-NO-VF: pred.udiv.if:
	; UNROLL-NO-VF-NEXT: [[TMP4:%.]] = add nsw i32 [[TMP2]], [[X:%.]]			; UNROLL-NO-VF-NEXT: [[TMP6:%.]] = add nsw i32 [[TMP4]], [[X:%.]]
	; UNROLL-NO-VF-NEXT: [[TMP5:%.*]] = udiv i32 [[TMP2]], [[TMP4]]			; UNROLL-NO-VF-NEXT: [[TMP7:%.*]] = udiv i32 [[TMP4]], [[TMP6]]
	; UNROLL-NO-VF-NEXT: br label [[PRED_UDIV_CONTINUE]]			; UNROLL-NO-VF-NEXT: br label [[PRED_UDIV_CONTINUE]]
	; UNROLL-NO-VF: pred.udiv.continue:			; UNROLL-NO-VF: pred.udiv.continue:
	; UNROLL-NO-VF-NEXT: [[TMP6:%.*]] = phi i32 [ poison, [[VECTOR_BODY]] ], [ [[TMP5]], [[PRED_UDIV_IF]] ]			; UNROLL-NO-VF-NEXT: [[TMP8:%.*]] = phi i32 [ poison, [[VECTOR_BODY]] ], [ [[TMP7]], [[PRED_UDIV_IF]] ]
	; UNROLL-NO-VF-NEXT: br i1 [[C]], label [[PRED_UDIV_IF3:%.*]], label [[PRED_UDIV_CONTINUE4]]			; UNROLL-NO-VF-NEXT: br i1 [[C]], label [[PRED_UDIV_IF2:%.*]], label [[PRED_UDIV_CONTINUE3]]
	; UNROLL-NO-VF: pred.udiv.if2:			; UNROLL-NO-VF: pred.udiv.if2:
	; UNROLL-NO-VF-NEXT: [[TMP7:%.*]] = add nsw i32 [[TMP3]], [[X]]			; UNROLL-NO-VF-NEXT: [[TMP9:%.*]] = add nsw i32 [[TMP5]], [[X]]
	; UNROLL-NO-VF-NEXT: [[TMP8:%.*]] = udiv i32 [[TMP3]], [[TMP7]]			; UNROLL-NO-VF-NEXT: [[TMP10:%.*]] = udiv i32 [[TMP5]], [[TMP9]]
	; UNROLL-NO-VF-NEXT: br label [[PRED_UDIV_CONTINUE4]]			; UNROLL-NO-VF-NEXT: br label [[PRED_UDIV_CONTINUE3]]
	; UNROLL-NO-VF: pred.udiv.continue3:			; UNROLL-NO-VF: pred.udiv.continue3:
	; UNROLL-NO-VF-NEXT: [[TMP9:%.*]] = phi i32 [ poison, [[PRED_UDIV_CONTINUE]] ], [ [[TMP8]], [[PRED_UDIV_IF3]] ]			; UNROLL-NO-VF-NEXT: [[TMP11:%.*]] = phi i32 [ poison, [[PRED_UDIV_CONTINUE]] ], [ [[TMP10]], [[PRED_UDIV_IF2]] ]
	; UNROLL-NO-VF-NEXT: [[TMP10:%.*]] = xor i1 [[C]], true			; UNROLL-NO-VF-NEXT: [[TMP12:%.*]] = xor i1 [[C]], true
	; UNROLL-NO-VF-NEXT: [[TMP11:%.*]] = xor i1 [[C]], true			; UNROLL-NO-VF-NEXT: [[TMP13:%.*]] = xor i1 [[C]], true
	; UNROLL-NO-VF-NEXT: [[PREDPHI:%.*]] = select i1 [[C]], i32 [[TMP6]], i32 [[TMP2]]			; UNROLL-NO-VF-NEXT: [[PREDPHI:%.*]] = select i1 [[C]], i32 [[TMP8]], i32 [[TMP4]]
	; UNROLL-NO-VF-NEXT: [[PREDPHI5:%.*]] = select i1 [[C]], i32 [[TMP9]], i32 [[TMP3]]			; UNROLL-NO-VF-NEXT: [[PREDPHI4:%.*]] = select i1 [[C]], i32 [[TMP11]], i32 [[TMP5]]
	; UNROLL-NO-VF-NEXT: [[TMP12]] = add i32 [[VEC_PHI]], [[PREDPHI]]			; UNROLL-NO-VF-NEXT: [[TMP14]] = add i32 [[VEC_PHI]], [[PREDPHI]]
	; UNROLL-NO-VF-NEXT: [[TMP13]] = add i32 [[VEC_PHI1]], [[PREDPHI5]]			; UNROLL-NO-VF-NEXT: [[TMP15]] = add i32 [[VEC_PHI1]], [[PREDPHI4]]
	; UNROLL-NO-VF-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 2			; UNROLL-NO-VF-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 2
	; UNROLL-NO-VF-NEXT: [[TMP14:%.*]] = icmp eq i64 [[INDEX_NEXT]], [[N_VEC]]			; UNROLL-NO-VF-NEXT: [[TMP16:%.*]] = icmp eq i64 [[INDEX_NEXT]], [[N_VEC]]
	; UNROLL-NO-VF-NEXT: br i1 [[TMP14]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP37:![0-9]+]]			; UNROLL-NO-VF-NEXT: br i1 [[TMP16]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP37:![0-9]+]]
	; UNROLL-NO-VF: middle.block:			; UNROLL-NO-VF: middle.block:
	; UNROLL-NO-VF-NEXT: [[BIN_RDX:%.*]] = add i32 [[TMP13]], [[TMP12]]			; UNROLL-NO-VF-NEXT: [[BIN_RDX:%.*]] = add i32 [[TMP15]], [[TMP14]]
	; UNROLL-NO-VF-NEXT: [[CMP_N:%.*]] = icmp eq i64 [[SMAX]], [[N_VEC]]			; UNROLL-NO-VF-NEXT: [[CMP_N:%.*]] = icmp eq i64 [[SMAX]], [[N_VEC]]
	; UNROLL-NO-VF-NEXT: br i1 [[CMP_N]], label [[FOR_END:%.*]], label [[SCALAR_PH]]			; UNROLL-NO-VF-NEXT: br i1 [[CMP_N]], label [[FOR_END:%.*]], label [[SCALAR_PH]]
	; UNROLL-NO-VF: scalar.ph:			; UNROLL-NO-VF: scalar.ph:
	; UNROLL-NO-VF-NEXT: [[BC_RESUME_VAL:%.]] = phi i64 [ [[N_VEC]], [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY:%.]] ]			; UNROLL-NO-VF-NEXT: [[BC_RESUME_VAL:%.]] = phi i64 [ [[N_VEC]], [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY:%.]] ]
	; UNROLL-NO-VF-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 0, [[ENTRY]] ], [ [[BIN_RDX]], [[MIDDLE_BLOCK]] ]			; UNROLL-NO-VF-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 0, [[ENTRY]] ], [ [[BIN_RDX]], [[MIDDLE_BLOCK]] ]
	; UNROLL-NO-VF-NEXT: br label [[FOR_BODY:%.*]]			; UNROLL-NO-VF-NEXT: br label [[FOR_BODY:%.*]]
	; UNROLL-NO-VF: for.body:			; UNROLL-NO-VF: for.body:
	; UNROLL-NO-VF-NEXT: [[I:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[I_NEXT:%.]], [[FOR_INC:%.*]] ]			; UNROLL-NO-VF-NEXT: [[I:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[I_NEXT:%.]], [[FOR_INC:%.*]] ]
	▲ Show 20 Lines • Show All 62 Lines • Show Last 20 Lines

llvm/test/Transforms/LoopVectorize/if-pred-stores.ll

	; NOTE: Assertions have been autogenerated by utils/update_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_test_checks.py
	; RUN: opt -S -vectorize-num-stores-pred=1 -force-vector-width=1 -force-vector-interleave=2 -loop-vectorize -verify-loop-info -simplifycfg -simplifycfg-require-and-preserve-domtree=1 < %s \| FileCheck %s --check-prefix=UNROLL			; RUN: opt -S -vectorize-num-stores-pred=1 -force-vector-width=1 -force-vector-interleave=2 -loop-vectorize -verify-loop-info -simplifycfg -simplifycfg-require-and-preserve-domtree=1 < %s \| FileCheck %s --check-prefix=UNROLL
	; RUN: opt -S -vectorize-num-stores-pred=1 -force-vector-width=1 -force-vector-interleave=2 -loop-vectorize -verify-loop-info < %s \| FileCheck %s --check-prefix=UNROLL-NOSIMPLIFY			; RUN: opt -S -vectorize-num-stores-pred=1 -force-vector-width=1 -force-vector-interleave=2 -loop-vectorize -verify-loop-info < %s \| FileCheck %s --check-prefix=UNROLL-NOSIMPLIFY
	; RUN: opt -S -vectorize-num-stores-pred=1 -force-vector-width=2 -force-vector-interleave=1 -loop-vectorize -verify-loop-info -simplifycfg -simplifycfg-require-and-preserve-domtree=1 < %s \| FileCheck %s --check-prefix=VEC			; RUN: opt -S -vectorize-num-stores-pred=1 -force-vector-width=2 -force-vector-interleave=1 -loop-vectorize -verify-loop-info -simplifycfg -simplifycfg-require-and-preserve-domtree=1 < %s \| FileCheck %s --check-prefix=VEC

	target datalayout = "e-m:o-i64:64-f80:128-n8:16:32:64-S128"			target datalayout = "e-m:o-i64:64-f80:128-n8:16:32:64-S128"

	; Test predication of stores.			; Test predication of stores.
	define i32 @test(i32* nocapture %f) #0 {			define i32 @test(i32* nocapture %f) #0 {
	; UNROLL-LABEL: @test(			; UNROLL-LABEL: @test(
	; UNROLL-NEXT: entry:			; UNROLL-NEXT: entry:
	; UNROLL-NEXT: br label [[VECTOR_BODY:%.*]]			; UNROLL-NEXT: br label [[VECTOR_BODY:%.*]]
	; UNROLL: vector.body:			; UNROLL: vector.body:
	; UNROLL-NEXT: [[INDEX:%.]] = phi i64 [ 0, [[ENTRY:%.]] ], [ [[INDEX_NEXT:%.]], [[PRED_STORE_CONTINUE3:%.]] ]			; UNROLL-NEXT: [[INDEX:%.]] = phi i64 [ 0, [[ENTRY:%.]] ], [ [[INDEX_NEXT:%.]], [[PRED_STORE_CONTINUE2:%.]] ]
	; UNROLL-NEXT: [[INDUCTION:%.*]] = add i64 [[INDEX]], 0			; UNROLL-NEXT: [[TMP0:%.*]] = add i64 [[INDEX]], 0
	; UNROLL-NEXT: [[INDUCTION1:%.*]] = add i64 [[INDEX]], 1			; UNROLL-NEXT: [[TMP1:%.*]] = add i64 [[INDEX]], 1
	; UNROLL-NEXT: [[TMP0:%.]] = getelementptr inbounds i32, i32 [[F:%.*]], i64 [[INDUCTION]]			; UNROLL-NEXT: [[TMP2:%.]] = getelementptr inbounds i32, i32 [[F:%.*]], i64 [[TMP0]]
	; UNROLL-NEXT: [[TMP1:%.]] = getelementptr inbounds i32, i32 [[F]], i64 [[INDUCTION1]]			; UNROLL-NEXT: [[TMP3:%.]] = getelementptr inbounds i32, i32 [[F]], i64 [[TMP1]]
	; UNROLL-NEXT: [[TMP2:%.]] = load i32, i32 [[TMP0]], align 4			; UNROLL-NEXT: [[TMP4:%.]] = load i32, i32 [[TMP2]], align 4
	; UNROLL-NEXT: [[TMP3:%.]] = load i32, i32 [[TMP1]], align 4			; UNROLL-NEXT: [[TMP5:%.]] = load i32, i32 [[TMP3]], align 4
	; UNROLL-NEXT: [[TMP4:%.*]] = icmp sgt i32 [[TMP2]], 100			; UNROLL-NEXT: [[TMP6:%.*]] = icmp sgt i32 [[TMP4]], 100
	; UNROLL-NEXT: [[TMP5:%.*]] = icmp sgt i32 [[TMP3]], 100			; UNROLL-NEXT: [[TMP7:%.*]] = icmp sgt i32 [[TMP5]], 100
	; UNROLL-NEXT: br i1 [[TMP4]], label [[PRED_STORE_IF:%.]], label [[PRED_STORE_CONTINUE:%.]]			; UNROLL-NEXT: br i1 [[TMP6]], label [[PRED_STORE_IF:%.]], label [[PRED_STORE_CONTINUE:%.]]
	; UNROLL: pred.store.if:			; UNROLL: pred.store.if:
	; UNROLL-NEXT: [[TMP6:%.*]] = add nsw i32 [[TMP2]], 20			; UNROLL-NEXT: [[TMP8:%.*]] = add nsw i32 [[TMP4]], 20
	; UNROLL-NEXT: store i32 [[TMP6]], i32* [[TMP0]], align 4			; UNROLL-NEXT: store i32 [[TMP8]], i32* [[TMP2]], align 4
	; UNROLL-NEXT: br label [[PRED_STORE_CONTINUE]]			; UNROLL-NEXT: br label [[PRED_STORE_CONTINUE]]
	; UNROLL: pred.store.continue:			; UNROLL: pred.store.continue:
	; UNROLL-NEXT: br i1 [[TMP5]], label [[PRED_STORE_IF2:%.*]], label [[PRED_STORE_CONTINUE3]]			; UNROLL-NEXT: br i1 [[TMP7]], label [[PRED_STORE_IF1:%.*]], label [[PRED_STORE_CONTINUE2]]
	; UNROLL: pred.store.if1:			; UNROLL: pred.store.if1:
	; UNROLL-NEXT: [[TMP7:%.*]] = add nsw i32 [[TMP3]], 20			; UNROLL-NEXT: [[TMP9:%.*]] = add nsw i32 [[TMP5]], 20
	; UNROLL-NEXT: store i32 [[TMP7]], i32* [[TMP1]], align 4			; UNROLL-NEXT: store i32 [[TMP9]], i32* [[TMP3]], align 4
	; UNROLL-NEXT: br label [[PRED_STORE_CONTINUE3]]			; UNROLL-NEXT: br label [[PRED_STORE_CONTINUE2]]
	; UNROLL: pred.store.continue2:			; UNROLL: pred.store.continue2:
	; UNROLL-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 2			; UNROLL-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 2
	; UNROLL-NEXT: [[TMP8:%.*]] = icmp eq i64 [[INDEX_NEXT]], 128			; UNROLL-NEXT: [[TMP10:%.*]] = icmp eq i64 [[INDEX_NEXT]], 128
	; UNROLL-NEXT: br i1 [[TMP8]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP0:![0-9]+]]			; UNROLL-NEXT: br i1 [[TMP10]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP0:![0-9]+]]
	; UNROLL: middle.block:			; UNROLL: middle.block:
	; UNROLL-NEXT: [[CMP_N:%.*]] = icmp eq i64 128, 128			; UNROLL-NEXT: [[CMP_N:%.*]] = icmp eq i64 128, 128
	; UNROLL-NEXT: br i1 [[CMP_N]], label [[FOR_END:%.]], label [[FOR_BODY:%.]]			; UNROLL-NEXT: br i1 [[CMP_N]], label [[FOR_END:%.]], label [[FOR_BODY:%.]]
	; UNROLL: for.body:			; UNROLL: for.body:
	; UNROLL-NEXT: [[INDVARS_IV:%.]] = phi i64 [ [[INDVARS_IV_NEXT:%.]], [[FOR_INC:%.*]] ], [ 128, [[MIDDLE_BLOCK]] ]			; UNROLL-NEXT: [[INDVARS_IV:%.]] = phi i64 [ [[INDVARS_IV_NEXT:%.]], [[FOR_INC:%.*]] ], [ 128, [[MIDDLE_BLOCK]] ]
	; UNROLL-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds i32, i32 [[F]], i64 [[INDVARS_IV]]			; UNROLL-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds i32, i32 [[F]], i64 [[INDVARS_IV]]
	; UNROLL-NEXT: [[TMP9:%.]] = load i32, i32 [[ARRAYIDX]], align 4			; UNROLL-NEXT: [[TMP11:%.]] = load i32, i32 [[ARRAYIDX]], align 4
	; UNROLL-NEXT: [[CMP1:%.*]] = icmp sgt i32 [[TMP9]], 100			; UNROLL-NEXT: [[CMP1:%.*]] = icmp sgt i32 [[TMP11]], 100
	; UNROLL-NEXT: br i1 [[CMP1]], label [[IF_THEN:%.*]], label [[FOR_INC]]			; UNROLL-NEXT: br i1 [[CMP1]], label [[IF_THEN:%.*]], label [[FOR_INC]]
	; UNROLL: if.then:			; UNROLL: if.then:
	; UNROLL-NEXT: [[ADD:%.*]] = add nsw i32 [[TMP9]], 20			; UNROLL-NEXT: [[ADD:%.*]] = add nsw i32 [[TMP11]], 20
	; UNROLL-NEXT: store i32 [[ADD]], i32* [[ARRAYIDX]], align 4			; UNROLL-NEXT: store i32 [[ADD]], i32* [[ARRAYIDX]], align 4
	; UNROLL-NEXT: br label [[FOR_INC]]			; UNROLL-NEXT: br label [[FOR_INC]]
	; UNROLL: for.inc:			; UNROLL: for.inc:
	; UNROLL-NEXT: [[INDVARS_IV_NEXT]] = add nuw nsw i64 [[INDVARS_IV]], 1			; UNROLL-NEXT: [[INDVARS_IV_NEXT]] = add nuw nsw i64 [[INDVARS_IV]], 1
	; UNROLL-NEXT: [[EXITCOND:%.*]] = icmp eq i64 [[INDVARS_IV_NEXT]], 128			; UNROLL-NEXT: [[EXITCOND:%.*]] = icmp eq i64 [[INDVARS_IV_NEXT]], 128
	; UNROLL-NEXT: br i1 [[EXITCOND]], label [[FOR_END]], label [[FOR_BODY]], !llvm.loop [[LOOP2:![0-9]+]]			; UNROLL-NEXT: br i1 [[EXITCOND]], label [[FOR_END]], label [[FOR_BODY]], !llvm.loop [[LOOP2:![0-9]+]]
	; UNROLL: for.end:			; UNROLL: for.end:
	; UNROLL-NEXT: ret i32 0			; UNROLL-NEXT: ret i32 0
	;			;
	; UNROLL-NOSIMPLIFY-LABEL: @test(			; UNROLL-NOSIMPLIFY-LABEL: @test(
	; UNROLL-NOSIMPLIFY-NEXT: entry:			; UNROLL-NOSIMPLIFY-NEXT: entry:
	; UNROLL-NOSIMPLIFY-NEXT: br i1 false, label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]			; UNROLL-NOSIMPLIFY-NEXT: br i1 false, label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]
	; UNROLL-NOSIMPLIFY: vector.ph:			; UNROLL-NOSIMPLIFY: vector.ph:
	; UNROLL-NOSIMPLIFY-NEXT: br label [[VECTOR_BODY:%.*]]			; UNROLL-NOSIMPLIFY-NEXT: br label [[VECTOR_BODY:%.*]]
	; UNROLL-NOSIMPLIFY: vector.body:			; UNROLL-NOSIMPLIFY: vector.body:
	; UNROLL-NOSIMPLIFY-NEXT: [[INDEX:%.]] = phi i64 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[PRED_STORE_CONTINUE3:%.*]] ]			; UNROLL-NOSIMPLIFY-NEXT: [[INDEX:%.]] = phi i64 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[PRED_STORE_CONTINUE2:%.*]] ]
	; UNROLL-NOSIMPLIFY-NEXT: [[INDUCTION:%.*]] = add i64 [[INDEX]], 0			; UNROLL-NOSIMPLIFY-NEXT: [[TMP0:%.*]] = add i64 [[INDEX]], 0
	; UNROLL-NOSIMPLIFY-NEXT: [[INDUCTION1:%.*]] = add i64 [[INDEX]], 1			; UNROLL-NOSIMPLIFY-NEXT: [[TMP1:%.*]] = add i64 [[INDEX]], 1
	; UNROLL-NOSIMPLIFY-NEXT: [[TMP0:%.]] = getelementptr inbounds i32, i32 [[F:%.*]], i64 [[INDUCTION]]			; UNROLL-NOSIMPLIFY-NEXT: [[TMP2:%.]] = getelementptr inbounds i32, i32 [[F:%.*]], i64 [[TMP0]]
	; UNROLL-NOSIMPLIFY-NEXT: [[TMP1:%.]] = getelementptr inbounds i32, i32 [[F]], i64 [[INDUCTION1]]			; UNROLL-NOSIMPLIFY-NEXT: [[TMP3:%.]] = getelementptr inbounds i32, i32 [[F]], i64 [[TMP1]]
	; UNROLL-NOSIMPLIFY-NEXT: [[TMP2:%.]] = load i32, i32 [[TMP0]], align 4			; UNROLL-NOSIMPLIFY-NEXT: [[TMP4:%.]] = load i32, i32 [[TMP2]], align 4
	; UNROLL-NOSIMPLIFY-NEXT: [[TMP3:%.]] = load i32, i32 [[TMP1]], align 4			; UNROLL-NOSIMPLIFY-NEXT: [[TMP5:%.]] = load i32, i32 [[TMP3]], align 4
	; UNROLL-NOSIMPLIFY-NEXT: [[TMP4:%.*]] = icmp sgt i32 [[TMP2]], 100			; UNROLL-NOSIMPLIFY-NEXT: [[TMP6:%.*]] = icmp sgt i32 [[TMP4]], 100
	; UNROLL-NOSIMPLIFY-NEXT: [[TMP5:%.*]] = icmp sgt i32 [[TMP3]], 100			; UNROLL-NOSIMPLIFY-NEXT: [[TMP7:%.*]] = icmp sgt i32 [[TMP5]], 100
	; UNROLL-NOSIMPLIFY-NEXT: br i1 [[TMP4]], label [[PRED_STORE_IF:%.]], label [[PRED_STORE_CONTINUE:%.]]			; UNROLL-NOSIMPLIFY-NEXT: br i1 [[TMP6]], label [[PRED_STORE_IF:%.]], label [[PRED_STORE_CONTINUE:%.]]
	; UNROLL-NOSIMPLIFY: pred.store.if:			; UNROLL-NOSIMPLIFY: pred.store.if:
	; UNROLL-NOSIMPLIFY-NEXT: [[TMP6:%.*]] = add nsw i32 [[TMP2]], 20			; UNROLL-NOSIMPLIFY-NEXT: [[TMP8:%.*]] = add nsw i32 [[TMP4]], 20
	; UNROLL-NOSIMPLIFY-NEXT: store i32 [[TMP6]], i32* [[TMP0]], align 4			; UNROLL-NOSIMPLIFY-NEXT: store i32 [[TMP8]], i32* [[TMP2]], align 4
	; UNROLL-NOSIMPLIFY-NEXT: br label [[PRED_STORE_CONTINUE]]			; UNROLL-NOSIMPLIFY-NEXT: br label [[PRED_STORE_CONTINUE]]
	; UNROLL-NOSIMPLIFY: pred.store.continue:			; UNROLL-NOSIMPLIFY: pred.store.continue:
	; UNROLL-NOSIMPLIFY-NEXT: br i1 [[TMP5]], label [[PRED_STORE_IF2:%.*]], label [[PRED_STORE_CONTINUE3]]			; UNROLL-NOSIMPLIFY-NEXT: br i1 [[TMP7]], label [[PRED_STORE_IF1:%.*]], label [[PRED_STORE_CONTINUE2]]
	; UNROLL-NOSIMPLIFY: pred.store.if1:			; UNROLL-NOSIMPLIFY: pred.store.if1:
	; UNROLL-NOSIMPLIFY-NEXT: [[TMP7:%.*]] = add nsw i32 [[TMP3]], 20			; UNROLL-NOSIMPLIFY-NEXT: [[TMP9:%.*]] = add nsw i32 [[TMP5]], 20
	; UNROLL-NOSIMPLIFY-NEXT: store i32 [[TMP7]], i32* [[TMP1]], align 4			; UNROLL-NOSIMPLIFY-NEXT: store i32 [[TMP9]], i32* [[TMP3]], align 4
	; UNROLL-NOSIMPLIFY-NEXT: br label [[PRED_STORE_CONTINUE3]]			; UNROLL-NOSIMPLIFY-NEXT: br label [[PRED_STORE_CONTINUE2]]
	; UNROLL-NOSIMPLIFY: pred.store.continue2:			; UNROLL-NOSIMPLIFY: pred.store.continue2:
	; UNROLL-NOSIMPLIFY-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 2			; UNROLL-NOSIMPLIFY-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 2
	; UNROLL-NOSIMPLIFY-NEXT: [[TMP8:%.*]] = icmp eq i64 [[INDEX_NEXT]], 128			; UNROLL-NOSIMPLIFY-NEXT: [[TMP10:%.*]] = icmp eq i64 [[INDEX_NEXT]], 128
	; UNROLL-NOSIMPLIFY-NEXT: br i1 [[TMP8]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP0:![0-9]+]]			; UNROLL-NOSIMPLIFY-NEXT: br i1 [[TMP10]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP0:![0-9]+]]
	; UNROLL-NOSIMPLIFY: middle.block:			; UNROLL-NOSIMPLIFY: middle.block:
	; UNROLL-NOSIMPLIFY-NEXT: [[CMP_N:%.*]] = icmp eq i64 128, 128			; UNROLL-NOSIMPLIFY-NEXT: [[CMP_N:%.*]] = icmp eq i64 128, 128
	; UNROLL-NOSIMPLIFY-NEXT: br i1 [[CMP_N]], label [[FOR_END:%.*]], label [[SCALAR_PH]]			; UNROLL-NOSIMPLIFY-NEXT: br i1 [[CMP_N]], label [[FOR_END:%.*]], label [[SCALAR_PH]]
	; UNROLL-NOSIMPLIFY: scalar.ph:			; UNROLL-NOSIMPLIFY: scalar.ph:
	; UNROLL-NOSIMPLIFY-NEXT: [[BC_RESUME_VAL:%.]] = phi i64 [ 128, [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY:%.]] ]			; UNROLL-NOSIMPLIFY-NEXT: [[BC_RESUME_VAL:%.]] = phi i64 [ 128, [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY:%.]] ]
	; UNROLL-NOSIMPLIFY-NEXT: br label [[FOR_BODY:%.*]]			; UNROLL-NOSIMPLIFY-NEXT: br label [[FOR_BODY:%.*]]
	; UNROLL-NOSIMPLIFY: for.body:			; UNROLL-NOSIMPLIFY: for.body:
	; UNROLL-NOSIMPLIFY-NEXT: [[INDVARS_IV:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[INDVARS_IV_NEXT:%.]], [[FOR_INC:%.*]] ]			; UNROLL-NOSIMPLIFY-NEXT: [[INDVARS_IV:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[INDVARS_IV_NEXT:%.]], [[FOR_INC:%.*]] ]
	; UNROLL-NOSIMPLIFY-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds i32, i32 [[F]], i64 [[INDVARS_IV]]			; UNROLL-NOSIMPLIFY-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds i32, i32 [[F]], i64 [[INDVARS_IV]]
	; UNROLL-NOSIMPLIFY-NEXT: [[TMP9:%.]] = load i32, i32 [[ARRAYIDX]], align 4			; UNROLL-NOSIMPLIFY-NEXT: [[TMP11:%.]] = load i32, i32 [[ARRAYIDX]], align 4
	; UNROLL-NOSIMPLIFY-NEXT: [[CMP1:%.*]] = icmp sgt i32 [[TMP9]], 100			; UNROLL-NOSIMPLIFY-NEXT: [[CMP1:%.*]] = icmp sgt i32 [[TMP11]], 100
	; UNROLL-NOSIMPLIFY-NEXT: br i1 [[CMP1]], label [[IF_THEN:%.*]], label [[FOR_INC]]			; UNROLL-NOSIMPLIFY-NEXT: br i1 [[CMP1]], label [[IF_THEN:%.*]], label [[FOR_INC]]
	; UNROLL-NOSIMPLIFY: if.then:			; UNROLL-NOSIMPLIFY: if.then:
	; UNROLL-NOSIMPLIFY-NEXT: [[ADD:%.*]] = add nsw i32 [[TMP9]], 20			; UNROLL-NOSIMPLIFY-NEXT: [[ADD:%.*]] = add nsw i32 [[TMP11]], 20
	; UNROLL-NOSIMPLIFY-NEXT: store i32 [[ADD]], i32* [[ARRAYIDX]], align 4			; UNROLL-NOSIMPLIFY-NEXT: store i32 [[ADD]], i32* [[ARRAYIDX]], align 4
	; UNROLL-NOSIMPLIFY-NEXT: br label [[FOR_INC]]			; UNROLL-NOSIMPLIFY-NEXT: br label [[FOR_INC]]
	; UNROLL-NOSIMPLIFY: for.inc:			; UNROLL-NOSIMPLIFY: for.inc:
	; UNROLL-NOSIMPLIFY-NEXT: [[INDVARS_IV_NEXT]] = add nuw nsw i64 [[INDVARS_IV]], 1			; UNROLL-NOSIMPLIFY-NEXT: [[INDVARS_IV_NEXT]] = add nuw nsw i64 [[INDVARS_IV]], 1
	; UNROLL-NOSIMPLIFY-NEXT: [[EXITCOND:%.*]] = icmp eq i64 [[INDVARS_IV_NEXT]], 128			; UNROLL-NOSIMPLIFY-NEXT: [[EXITCOND:%.*]] = icmp eq i64 [[INDVARS_IV_NEXT]], 128
	; UNROLL-NOSIMPLIFY-NEXT: br i1 [[EXITCOND]], label [[FOR_END]], label [[FOR_BODY]], !llvm.loop [[LOOP2:![0-9]+]]			; UNROLL-NOSIMPLIFY-NEXT: br i1 [[EXITCOND]], label [[FOR_END]], label [[FOR_BODY]], !llvm.loop [[LOOP2:![0-9]+]]
	; UNROLL-NOSIMPLIFY: for.end:			; UNROLL-NOSIMPLIFY: for.end:
	; UNROLL-NOSIMPLIFY-NEXT: ret i32 0			; UNROLL-NOSIMPLIFY-NEXT: ret i32 0
	▲ Show 20 Lines • Show All 95 Lines • ▼ Show 20 Lines
	; UNROLL-NEXT: [[MIN_ITERS_CHECK:%.*]] = icmp ult i64 [[TMP4]], 2			; UNROLL-NEXT: [[MIN_ITERS_CHECK:%.*]] = icmp ult i64 [[TMP4]], 2
	; UNROLL-NEXT: br i1 [[MIN_ITERS_CHECK]], label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]			; UNROLL-NEXT: br i1 [[MIN_ITERS_CHECK]], label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]
	; UNROLL: vector.ph:			; UNROLL: vector.ph:
	; UNROLL-NEXT: [[N_MOD_VF:%.*]] = urem i64 [[TMP4]], 2			; UNROLL-NEXT: [[N_MOD_VF:%.*]] = urem i64 [[TMP4]], 2
	; UNROLL-NEXT: [[N_VEC:%.*]] = sub i64 [[TMP4]], [[N_MOD_VF]]			; UNROLL-NEXT: [[N_VEC:%.*]] = sub i64 [[TMP4]], [[N_MOD_VF]]
	; UNROLL-NEXT: [[IND_END:%.*]] = add i64 [[V_1]], [[N_VEC]]			; UNROLL-NEXT: [[IND_END:%.*]] = add i64 [[V_1]], [[N_VEC]]
	; UNROLL-NEXT: br label [[VECTOR_BODY:%.*]]			; UNROLL-NEXT: br label [[VECTOR_BODY:%.*]]
	; UNROLL: vector.body:			; UNROLL: vector.body:
	; UNROLL-NEXT: [[INDEX:%.]] = phi i64 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[PRED_STORE_CONTINUE4:%.*]] ]			; UNROLL-NEXT: [[INDEX:%.]] = phi i64 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[PRED_STORE_CONTINUE3:%.*]] ]
	; UNROLL-NEXT: [[VEC_PHI:%.]] = phi i32 [ [[V_2:%.]], [[VECTOR_PH]] ], [ [[PREDPHI:%.*]], [[PRED_STORE_CONTINUE4]] ]			; UNROLL-NEXT: [[VEC_PHI:%.]] = phi i32 [ [[V_2:%.]], [[VECTOR_PH]] ], [ [[PREDPHI:%.*]], [[PRED_STORE_CONTINUE3]] ]
	; UNROLL-NEXT: [[VEC_PHI2:%.]] = phi i32 [ 0, [[VECTOR_PH]] ], [ [[PREDPHI5:%.]], [[PRED_STORE_CONTINUE4]] ]			; UNROLL-NEXT: [[VEC_PHI1:%.]] = phi i32 [ 0, [[VECTOR_PH]] ], [ [[PREDPHI4:%.]], [[PRED_STORE_CONTINUE3]] ]
	; UNROLL-NEXT: [[OFFSET_IDX:%.*]] = add i64 [[V_1]], [[INDEX]]			; UNROLL-NEXT: [[OFFSET_IDX:%.*]] = add i64 [[V_1]], [[INDEX]]
	; UNROLL-NEXT: br i1 [[COND_2:%.]], label [[PRED_STORE_IF:%.]], label [[PRED_STORE_CONTINUE4]]			; UNROLL-NEXT: br i1 [[COND_2:%.]], label [[PRED_STORE_IF:%.]], label [[PRED_STORE_CONTINUE3]]
	; UNROLL: pred.store.if:			; UNROLL: pred.store.if:
	; UNROLL-NEXT: [[INDUCTION:%.*]] = add i64 [[OFFSET_IDX]], 0			; UNROLL-NEXT: [[TMP5:%.*]] = add i64 [[OFFSET_IDX]], 0
	; UNROLL-NEXT: [[TMP5:%.]] = getelementptr inbounds [768 x i32], [768 x i32] [[PTR:%.*]], i64 0, i64 [[INDUCTION]]			; UNROLL-NEXT: [[TMP6:%.]] = getelementptr inbounds [768 x i32], [768 x i32] [[PTR:%.*]], i64 0, i64 [[TMP5]]
	; UNROLL-NEXT: [[TMP6:%.]] = load i32, i32 [[TMP5]], align 4			; UNROLL-NEXT: [[TMP7:%.]] = load i32, i32 [[TMP6]], align 4
	; UNROLL-NEXT: store i32 [[TMP6]], i32* [[TMP5]], align 4			; UNROLL-NEXT: store i32 [[TMP7]], i32* [[TMP6]], align 4
	; UNROLL-NEXT: [[INDUCTION1:%.*]] = add i64 [[OFFSET_IDX]], 1			; UNROLL-NEXT: [[TMP8:%.*]] = add i64 [[OFFSET_IDX]], 1
	; UNROLL-NEXT: [[TMP7:%.]] = getelementptr inbounds [768 x i32], [768 x i32] [[PTR]], i64 0, i64 [[INDUCTION1]]			; UNROLL-NEXT: [[TMP9:%.]] = getelementptr inbounds [768 x i32], [768 x i32] [[PTR]], i64 0, i64 [[TMP8]]
	; UNROLL-NEXT: [[TMP8:%.]] = load i32, i32 [[TMP7]], align 4			; UNROLL-NEXT: [[TMP10:%.]] = load i32, i32 [[TMP9]], align 4
	; UNROLL-NEXT: store i32 [[TMP8]], i32* [[TMP7]], align 4			; UNROLL-NEXT: store i32 [[TMP10]], i32* [[TMP9]], align 4
	; UNROLL-NEXT: br label [[PRED_STORE_CONTINUE4]]			; UNROLL-NEXT: br label [[PRED_STORE_CONTINUE3]]
	; UNROLL: pred.store.continue3:			; UNROLL: pred.store.continue3:
	; UNROLL-NEXT: [[TMP9:%.*]] = add i32 [[VEC_PHI]], 1			; UNROLL-NEXT: [[TMP11:%.*]] = add i32 [[VEC_PHI]], 1
	; UNROLL-NEXT: [[TMP10:%.*]] = add i32 [[VEC_PHI2]], 1			; UNROLL-NEXT: [[TMP12:%.*]] = add i32 [[VEC_PHI1]], 1
	; UNROLL-NEXT: [[TMP11:%.*]] = xor i1 [[COND_2]], true			; UNROLL-NEXT: [[TMP13:%.*]] = xor i1 [[COND_2]], true
	; UNROLL-NEXT: [[TMP12:%.*]] = xor i1 [[COND_2]], true			; UNROLL-NEXT: [[TMP14:%.*]] = xor i1 [[COND_2]], true
	; UNROLL-NEXT: [[PREDPHI]] = select i1 [[TMP11]], i32 [[VEC_PHI]], i32 [[TMP9]]			; UNROLL-NEXT: [[PREDPHI]] = select i1 [[TMP13]], i32 [[VEC_PHI]], i32 [[TMP11]]
	; UNROLL-NEXT: [[PREDPHI5]] = select i1 [[TMP12]], i32 [[VEC_PHI2]], i32 [[TMP10]]			; UNROLL-NEXT: [[PREDPHI4]] = select i1 [[TMP14]], i32 [[VEC_PHI1]], i32 [[TMP12]]
	; UNROLL-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 2			; UNROLL-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 2
	; UNROLL-NEXT: [[TMP13:%.*]] = icmp eq i64 [[INDEX_NEXT]], [[N_VEC]]			; UNROLL-NEXT: [[TMP15:%.*]] = icmp eq i64 [[INDEX_NEXT]], [[N_VEC]]
	; UNROLL-NEXT: br i1 [[TMP13]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP3:![0-9]+]]			; UNROLL-NEXT: br i1 [[TMP15]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP3:![0-9]+]]
	; UNROLL: middle.block:			; UNROLL: middle.block:
	; UNROLL-NEXT: [[BIN_RDX:%.*]] = add i32 [[PREDPHI5]], [[PREDPHI]]			; UNROLL-NEXT: [[BIN_RDX:%.*]] = add i32 [[PREDPHI4]], [[PREDPHI]]
	; UNROLL-NEXT: [[CMP_N:%.*]] = icmp eq i64 [[TMP4]], [[N_VEC]]			; UNROLL-NEXT: [[CMP_N:%.*]] = icmp eq i64 [[TMP4]], [[N_VEC]]
	; UNROLL-NEXT: [[TMP14:%.*]] = xor i1 [[CMP_N]], true			; UNROLL-NEXT: [[TMP16:%.*]] = xor i1 [[CMP_N]], true
	; UNROLL-NEXT: call void @llvm.assume(i1 [[TMP14]])			; UNROLL-NEXT: call void @llvm.assume(i1 [[TMP16]])
	; UNROLL-NEXT: br label [[SCALAR_PH]]			; UNROLL-NEXT: br label [[SCALAR_PH]]
	; UNROLL: scalar.ph:			; UNROLL: scalar.ph:
	; UNROLL-NEXT: [[BC_RESUME_VAL:%.]] = phi i64 [ [[IND_END]], [[MIDDLE_BLOCK]] ], [ [[V_1]], [[ENTRY:%.]] ]			; UNROLL-NEXT: [[BC_RESUME_VAL:%.]] = phi i64 [ [[IND_END]], [[MIDDLE_BLOCK]] ], [ [[V_1]], [[ENTRY:%.]] ]
	; UNROLL-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ [[V_2]], [[ENTRY]] ], [ [[BIN_RDX]], [[MIDDLE_BLOCK]] ]			; UNROLL-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ [[V_2]], [[ENTRY]] ], [ [[BIN_RDX]], [[MIDDLE_BLOCK]] ]
	; UNROLL-NEXT: br label [[FOR_BODY14:%.*]]			; UNROLL-NEXT: br label [[FOR_BODY14:%.*]]
	; UNROLL: for.body14:			; UNROLL: for.body14:
	; UNROLL-NEXT: [[INDVARS_IV3:%.]] = phi i64 [ [[INDVARS_IV_NEXT4:%.]], [[FOR_INC23:%.*]] ], [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ]			; UNROLL-NEXT: [[INDVARS_IV3:%.]] = phi i64 [ [[INDVARS_IV_NEXT4:%.]], [[FOR_INC23:%.*]] ], [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ]
	; UNROLL-NEXT: [[INEWCHUNKS_120:%.]] = phi i32 [ [[INEWCHUNKS_2:%.]], [[FOR_INC23]] ], [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ]			; UNROLL-NEXT: [[INEWCHUNKS_120:%.]] = phi i32 [ [[INEWCHUNKS_2:%.]], [[FOR_INC23]] ], [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ]
	Show All 26 Lines
	; UNROLL-NOSIMPLIFY-NEXT: [[MIN_ITERS_CHECK:%.*]] = icmp ult i64 [[TMP3]], 2			; UNROLL-NOSIMPLIFY-NEXT: [[MIN_ITERS_CHECK:%.*]] = icmp ult i64 [[TMP3]], 2
	; UNROLL-NOSIMPLIFY-NEXT: br i1 [[MIN_ITERS_CHECK]], label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]			; UNROLL-NOSIMPLIFY-NEXT: br i1 [[MIN_ITERS_CHECK]], label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]
	; UNROLL-NOSIMPLIFY: vector.ph:			; UNROLL-NOSIMPLIFY: vector.ph:
	; UNROLL-NOSIMPLIFY-NEXT: [[N_MOD_VF:%.*]] = urem i64 [[TMP3]], 2			; UNROLL-NOSIMPLIFY-NEXT: [[N_MOD_VF:%.*]] = urem i64 [[TMP3]], 2
	; UNROLL-NOSIMPLIFY-NEXT: [[N_VEC:%.*]] = sub i64 [[TMP3]], [[N_MOD_VF]]			; UNROLL-NOSIMPLIFY-NEXT: [[N_VEC:%.*]] = sub i64 [[TMP3]], [[N_MOD_VF]]
	; UNROLL-NOSIMPLIFY-NEXT: [[IND_END:%.*]] = add i64 [[V_1]], [[N_VEC]]			; UNROLL-NOSIMPLIFY-NEXT: [[IND_END:%.*]] = add i64 [[V_1]], [[N_VEC]]
	; UNROLL-NOSIMPLIFY-NEXT: br label [[VECTOR_BODY:%.*]]			; UNROLL-NOSIMPLIFY-NEXT: br label [[VECTOR_BODY:%.*]]
	; UNROLL-NOSIMPLIFY: vector.body:			; UNROLL-NOSIMPLIFY: vector.body:
	; UNROLL-NOSIMPLIFY-NEXT: [[INDEX:%.]] = phi i64 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[PRED_STORE_CONTINUE4:%.*]] ]			; UNROLL-NOSIMPLIFY-NEXT: [[INDEX:%.]] = phi i64 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[PRED_STORE_CONTINUE3:%.*]] ]
	; UNROLL-NOSIMPLIFY-NEXT: [[VEC_PHI:%.]] = phi i32 [ [[V_2:%.]], [[VECTOR_PH]] ], [ [[PREDPHI:%.*]], [[PRED_STORE_CONTINUE4]] ]			; UNROLL-NOSIMPLIFY-NEXT: [[VEC_PHI:%.]] = phi i32 [ [[V_2:%.]], [[VECTOR_PH]] ], [ [[PREDPHI:%.*]], [[PRED_STORE_CONTINUE3]] ]
	; UNROLL-NOSIMPLIFY-NEXT: [[VEC_PHI2:%.]] = phi i32 [ 0, [[VECTOR_PH]] ], [ [[PREDPHI5:%.]], [[PRED_STORE_CONTINUE4]] ]			; UNROLL-NOSIMPLIFY-NEXT: [[VEC_PHI1:%.]] = phi i32 [ 0, [[VECTOR_PH]] ], [ [[PREDPHI4:%.]], [[PRED_STORE_CONTINUE3]] ]
	; UNROLL-NOSIMPLIFY-NEXT: [[OFFSET_IDX:%.*]] = add i64 [[V_1]], [[INDEX]]			; UNROLL-NOSIMPLIFY-NEXT: [[OFFSET_IDX:%.*]] = add i64 [[V_1]], [[INDEX]]
	; UNROLL-NOSIMPLIFY-NEXT: br i1 [[COND_2:%.]], label [[PRED_STORE_IF:%.]], label [[PRED_STORE_CONTINUE:%.*]]			; UNROLL-NOSIMPLIFY-NEXT: br i1 [[COND_2:%.]], label [[PRED_STORE_IF:%.]], label [[PRED_STORE_CONTINUE:%.*]]
	; UNROLL-NOSIMPLIFY: pred.store.if:			; UNROLL-NOSIMPLIFY: pred.store.if:
	; UNROLL-NOSIMPLIFY-NEXT: [[INDUCTION:%.*]] = add i64 [[OFFSET_IDX]], 0			; UNROLL-NOSIMPLIFY-NEXT: [[TMP4:%.*]] = add i64 [[OFFSET_IDX]], 0
	; UNROLL-NOSIMPLIFY-NEXT: [[TMP4:%.]] = getelementptr inbounds [768 x i32], [768 x i32] [[PTR:%.*]], i64 0, i64 [[INDUCTION]]			; UNROLL-NOSIMPLIFY-NEXT: [[TMP5:%.]] = getelementptr inbounds [768 x i32], [768 x i32] [[PTR:%.*]], i64 0, i64 [[TMP4]]
	; UNROLL-NOSIMPLIFY-NEXT: [[TMP5:%.]] = load i32, i32 [[TMP4]], align 4			; UNROLL-NOSIMPLIFY-NEXT: [[TMP6:%.]] = load i32, i32 [[TMP5]], align 4
	; UNROLL-NOSIMPLIFY-NEXT: store i32 [[TMP5]], i32* [[TMP4]], align 4			; UNROLL-NOSIMPLIFY-NEXT: store i32 [[TMP6]], i32* [[TMP5]], align 4
	; UNROLL-NOSIMPLIFY-NEXT: br label [[PRED_STORE_CONTINUE]]			; UNROLL-NOSIMPLIFY-NEXT: br label [[PRED_STORE_CONTINUE]]
	; UNROLL-NOSIMPLIFY: pred.store.continue:			; UNROLL-NOSIMPLIFY: pred.store.continue:
	; UNROLL-NOSIMPLIFY-NEXT: br i1 [[COND_2]], label [[PRED_STORE_IF3:%.*]], label [[PRED_STORE_CONTINUE4]]			; UNROLL-NOSIMPLIFY-NEXT: br i1 [[COND_2]], label [[PRED_STORE_IF2:%.*]], label [[PRED_STORE_CONTINUE3]]
	; UNROLL-NOSIMPLIFY: pred.store.if2:			; UNROLL-NOSIMPLIFY: pred.store.if2:
	; UNROLL-NOSIMPLIFY-NEXT: [[INDUCTION1:%.*]] = add i64 [[OFFSET_IDX]], 1			; UNROLL-NOSIMPLIFY-NEXT: [[TMP7:%.*]] = add i64 [[OFFSET_IDX]], 1
	; UNROLL-NOSIMPLIFY-NEXT: [[TMP6:%.]] = getelementptr inbounds [768 x i32], [768 x i32] [[PTR]], i64 0, i64 [[INDUCTION1]]			; UNROLL-NOSIMPLIFY-NEXT: [[TMP8:%.]] = getelementptr inbounds [768 x i32], [768 x i32] [[PTR]], i64 0, i64 [[TMP7]]
	; UNROLL-NOSIMPLIFY-NEXT: [[TMP7:%.]] = load i32, i32 [[TMP6]], align 4			; UNROLL-NOSIMPLIFY-NEXT: [[TMP9:%.]] = load i32, i32 [[TMP8]], align 4
	; UNROLL-NOSIMPLIFY-NEXT: store i32 [[TMP7]], i32* [[TMP6]], align 4			; UNROLL-NOSIMPLIFY-NEXT: store i32 [[TMP9]], i32* [[TMP8]], align 4
	; UNROLL-NOSIMPLIFY-NEXT: br label [[PRED_STORE_CONTINUE4]]			; UNROLL-NOSIMPLIFY-NEXT: br label [[PRED_STORE_CONTINUE3]]
	; UNROLL-NOSIMPLIFY: pred.store.continue3:			; UNROLL-NOSIMPLIFY: pred.store.continue3:
	; UNROLL-NOSIMPLIFY-NEXT: [[TMP8:%.*]] = add i32 [[VEC_PHI]], 1			; UNROLL-NOSIMPLIFY-NEXT: [[TMP10:%.*]] = add i32 [[VEC_PHI]], 1
	; UNROLL-NOSIMPLIFY-NEXT: [[TMP9:%.*]] = add i32 [[VEC_PHI2]], 1			; UNROLL-NOSIMPLIFY-NEXT: [[TMP11:%.*]] = add i32 [[VEC_PHI1]], 1
	; UNROLL-NOSIMPLIFY-NEXT: [[TMP10:%.*]] = xor i1 [[COND_2]], true			; UNROLL-NOSIMPLIFY-NEXT: [[TMP12:%.*]] = xor i1 [[COND_2]], true
	; UNROLL-NOSIMPLIFY-NEXT: [[TMP11:%.*]] = xor i1 [[COND_2]], true			; UNROLL-NOSIMPLIFY-NEXT: [[TMP13:%.*]] = xor i1 [[COND_2]], true
	; UNROLL-NOSIMPLIFY-NEXT: [[PREDPHI]] = select i1 [[TMP10]], i32 [[VEC_PHI]], i32 [[TMP8]]			; UNROLL-NOSIMPLIFY-NEXT: [[PREDPHI]] = select i1 [[TMP12]], i32 [[VEC_PHI]], i32 [[TMP10]]
	; UNROLL-NOSIMPLIFY-NEXT: [[PREDPHI5]] = select i1 [[TMP11]], i32 [[VEC_PHI2]], i32 [[TMP9]]			; UNROLL-NOSIMPLIFY-NEXT: [[PREDPHI4]] = select i1 [[TMP13]], i32 [[VEC_PHI1]], i32 [[TMP11]]
	; UNROLL-NOSIMPLIFY-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 2			; UNROLL-NOSIMPLIFY-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 2
	; UNROLL-NOSIMPLIFY-NEXT: [[TMP12:%.*]] = icmp eq i64 [[INDEX_NEXT]], [[N_VEC]]			; UNROLL-NOSIMPLIFY-NEXT: [[TMP14:%.*]] = icmp eq i64 [[INDEX_NEXT]], [[N_VEC]]
	; UNROLL-NOSIMPLIFY-NEXT: br i1 [[TMP12]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP3:![0-9]+]]			; UNROLL-NOSIMPLIFY-NEXT: br i1 [[TMP14]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP3:![0-9]+]]
	; UNROLL-NOSIMPLIFY: middle.block:			; UNROLL-NOSIMPLIFY: middle.block:
	; UNROLL-NOSIMPLIFY-NEXT: [[BIN_RDX:%.*]] = add i32 [[PREDPHI5]], [[PREDPHI]]			; UNROLL-NOSIMPLIFY-NEXT: [[BIN_RDX:%.*]] = add i32 [[PREDPHI4]], [[PREDPHI]]
	; UNROLL-NOSIMPLIFY-NEXT: [[CMP_N:%.*]] = icmp eq i64 [[TMP3]], [[N_VEC]]			; UNROLL-NOSIMPLIFY-NEXT: [[CMP_N:%.*]] = icmp eq i64 [[TMP3]], [[N_VEC]]
	; UNROLL-NOSIMPLIFY-NEXT: br i1 [[CMP_N]], label [[FOR_INC26_LOOPEXIT:%.*]], label [[SCALAR_PH]]			; UNROLL-NOSIMPLIFY-NEXT: br i1 [[CMP_N]], label [[FOR_INC26_LOOPEXIT:%.*]], label [[SCALAR_PH]]
	; UNROLL-NOSIMPLIFY: scalar.ph:			; UNROLL-NOSIMPLIFY: scalar.ph:
	; UNROLL-NOSIMPLIFY-NEXT: [[BC_RESUME_VAL:%.*]] = phi i64 [ [[IND_END]], [[MIDDLE_BLOCK]] ], [ [[V_1]], [[FOR_BODY14_PREHEADER]] ]			; UNROLL-NOSIMPLIFY-NEXT: [[BC_RESUME_VAL:%.*]] = phi i64 [ [[IND_END]], [[MIDDLE_BLOCK]] ], [ [[V_1]], [[FOR_BODY14_PREHEADER]] ]
	; UNROLL-NOSIMPLIFY-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ [[V_2]], [[FOR_BODY14_PREHEADER]] ], [ [[BIN_RDX]], [[MIDDLE_BLOCK]] ]			; UNROLL-NOSIMPLIFY-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ [[V_2]], [[FOR_BODY14_PREHEADER]] ], [ [[BIN_RDX]], [[MIDDLE_BLOCK]] ]
	; UNROLL-NOSIMPLIFY-NEXT: br label [[FOR_BODY14:%.*]]			; UNROLL-NOSIMPLIFY-NEXT: br label [[FOR_BODY14:%.*]]
	; UNROLL-NOSIMPLIFY: for.body14:			; UNROLL-NOSIMPLIFY: for.body14:
	; UNROLL-NOSIMPLIFY-NEXT: [[INDVARS_IV3:%.]] = phi i64 [ [[INDVARS_IV_NEXT4:%.]], [[FOR_INC23:%.*]] ], [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ]			; UNROLL-NOSIMPLIFY-NEXT: [[INDVARS_IV3:%.]] = phi i64 [ [[INDVARS_IV_NEXT4:%.]], [[FOR_INC23:%.*]] ], [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ]
	Show All 28 Lines
	; VEC-NEXT: [[TMP3:%.*]] = zext i32 [[TMP2]] to i64			; VEC-NEXT: [[TMP3:%.*]] = zext i32 [[TMP2]] to i64
	; VEC-NEXT: [[TMP4:%.*]] = add nuw nsw i64 [[TMP3]], 1			; VEC-NEXT: [[TMP4:%.*]] = add nuw nsw i64 [[TMP3]], 1
	; VEC-NEXT: [[MIN_ITERS_CHECK:%.*]] = icmp ult i64 [[TMP4]], 2			; VEC-NEXT: [[MIN_ITERS_CHECK:%.*]] = icmp ult i64 [[TMP4]], 2
	; VEC-NEXT: br i1 [[MIN_ITERS_CHECK]], label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]			; VEC-NEXT: br i1 [[MIN_ITERS_CHECK]], label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]
	; VEC: vector.ph:			; VEC: vector.ph:
	; VEC-NEXT: [[N_MOD_VF:%.*]] = urem i64 [[TMP4]], 2			; VEC-NEXT: [[N_MOD_VF:%.*]] = urem i64 [[TMP4]], 2
	; VEC-NEXT: [[N_VEC:%.*]] = sub i64 [[TMP4]], [[N_MOD_VF]]			; VEC-NEXT: [[N_VEC:%.*]] = sub i64 [[TMP4]], [[N_MOD_VF]]
	; VEC-NEXT: [[IND_END:%.*]] = add i64 [[V_1]], [[N_VEC]]			; VEC-NEXT: [[IND_END:%.*]] = add i64 [[V_1]], [[N_VEC]]
	; VEC-NEXT: [[TMP5:%.]] = insertelement <2 x i32> zeroinitializer, i32 [[V_2:%.]], i32 0
	; VEC-NEXT: [[BROADCAST_SPLATINSERT:%.]] = insertelement <2 x i1> poison, i1 [[COND_2:%.]], i32 0			; VEC-NEXT: [[BROADCAST_SPLATINSERT:%.]] = insertelement <2 x i1> poison, i1 [[COND_2:%.]], i32 0
	; VEC-NEXT: [[BROADCAST_SPLAT:%.*]] = shufflevector <2 x i1> [[BROADCAST_SPLATINSERT]], <2 x i1> poison, <2 x i32> zeroinitializer			; VEC-NEXT: [[BROADCAST_SPLAT:%.*]] = shufflevector <2 x i1> [[BROADCAST_SPLATINSERT]], <2 x i1> poison, <2 x i32> zeroinitializer
	; VEC-NEXT: br label [[VECTOR_BODY:%.*]]			; VEC-NEXT: br label [[VECTOR_BODY:%.*]]
	; VEC: vector.body:			; VEC: vector.body:
	; VEC-NEXT: [[INDEX:%.]] = phi i64 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[PRED_STORE_CONTINUE2:%.*]] ]			; VEC-NEXT: [[INDEX:%.]] = phi i64 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[PRED_STORE_CONTINUE2:%.*]] ]
	; VEC-NEXT: [[VEC_PHI:%.]] = phi <2 x i32> [ [[TMP5]], [[VECTOR_PH]] ], [ [[PREDPHI:%.]], [[PRED_STORE_CONTINUE2]] ]			; VEC-NEXT: [[VEC_PHI:%.]] = phi <2 x i32> [ zeroinitializer, [[VECTOR_PH]] ], [ [[PREDPHI:%.]], [[PRED_STORE_CONTINUE2]] ]
	; VEC-NEXT: [[OFFSET_IDX:%.*]] = add i64 [[V_1]], [[INDEX]]			; VEC-NEXT: [[OFFSET_IDX:%.*]] = add i64 [[V_1]], [[INDEX]]
	; VEC-NEXT: [[TMP6:%.*]] = add i64 [[OFFSET_IDX]], 0			; VEC-NEXT: [[TMP5:%.*]] = add i64 [[OFFSET_IDX]], 0
	; VEC-NEXT: [[TMP7:%.]] = getelementptr inbounds [768 x i32], [768 x i32] [[PTR:%.*]], i64 0, i64 [[TMP6]]			; VEC-NEXT: [[TMP6:%.]] = getelementptr inbounds [768 x i32], [768 x i32] [[PTR:%.*]], i64 0, i64 [[TMP5]]
	; VEC-NEXT: [[TMP8:%.]] = getelementptr inbounds i32, i32 [[TMP7]], i32 0			; VEC-NEXT: [[TMP7:%.]] = getelementptr inbounds i32, i32 [[TMP6]], i32 0
	; VEC-NEXT: [[TMP9:%.]] = bitcast i32 [[TMP8]] to <2 x i32>*			; VEC-NEXT: [[TMP8:%.]] = bitcast i32 [[TMP7]] to <2 x i32>*
	; VEC-NEXT: [[WIDE_LOAD:%.]] = load <2 x i32>, <2 x i32> [[TMP9]], align 4			; VEC-NEXT: [[WIDE_LOAD:%.]] = load <2 x i32>, <2 x i32> [[TMP8]], align 4
	; VEC-NEXT: [[TMP10:%.*]] = extractelement <2 x i1> [[BROADCAST_SPLAT]], i32 0			; VEC-NEXT: [[TMP9:%.*]] = extractelement <2 x i1> [[BROADCAST_SPLAT]], i32 0
	; VEC-NEXT: br i1 [[TMP10]], label [[PRED_STORE_IF:%.]], label [[PRED_STORE_CONTINUE:%.]]			; VEC-NEXT: br i1 [[TMP9]], label [[PRED_STORE_IF:%.]], label [[PRED_STORE_CONTINUE:%.]]
	; VEC: pred.store.if:			; VEC: pred.store.if:
	; VEC-NEXT: [[TMP11:%.]] = getelementptr inbounds [768 x i32], [768 x i32] [[PTR]], i64 0, i64 [[TMP6]]			; VEC-NEXT: [[TMP10:%.]] = getelementptr inbounds [768 x i32], [768 x i32] [[PTR]], i64 0, i64 [[TMP5]]
	; VEC-NEXT: [[TMP12:%.*]] = extractelement <2 x i32> [[WIDE_LOAD]], i32 0			; VEC-NEXT: [[TMP11:%.*]] = extractelement <2 x i32> [[WIDE_LOAD]], i32 0
	; VEC-NEXT: store i32 [[TMP12]], i32* [[TMP11]], align 4			; VEC-NEXT: store i32 [[TMP11]], i32* [[TMP10]], align 4
	; VEC-NEXT: br label [[PRED_STORE_CONTINUE]]			; VEC-NEXT: br label [[PRED_STORE_CONTINUE]]
	; VEC: pred.store.continue:			; VEC: pred.store.continue:
	; VEC-NEXT: [[TMP13:%.*]] = extractelement <2 x i1> [[BROADCAST_SPLAT]], i32 1			; VEC-NEXT: [[TMP12:%.*]] = extractelement <2 x i1> [[BROADCAST_SPLAT]], i32 1
	; VEC-NEXT: br i1 [[TMP13]], label [[PRED_STORE_IF1:%.*]], label [[PRED_STORE_CONTINUE2]]			; VEC-NEXT: br i1 [[TMP12]], label [[PRED_STORE_IF1:%.*]], label [[PRED_STORE_CONTINUE2]]
	; VEC: pred.store.if1:			; VEC: pred.store.if1:
	; VEC-NEXT: [[TMP14:%.*]] = add i64 [[OFFSET_IDX]], 1			; VEC-NEXT: [[TMP13:%.*]] = add i64 [[OFFSET_IDX]], 1
	; VEC-NEXT: [[TMP15:%.]] = getelementptr inbounds [768 x i32], [768 x i32] [[PTR]], i64 0, i64 [[TMP14]]			; VEC-NEXT: [[TMP14:%.]] = getelementptr inbounds [768 x i32], [768 x i32] [[PTR]], i64 0, i64 [[TMP13]]
	; VEC-NEXT: [[TMP16:%.*]] = extractelement <2 x i32> [[WIDE_LOAD]], i32 1			; VEC-NEXT: [[TMP15:%.*]] = extractelement <2 x i32> [[WIDE_LOAD]], i32 1
	; VEC-NEXT: store i32 [[TMP16]], i32* [[TMP15]], align 4			; VEC-NEXT: store i32 [[TMP15]], i32* [[TMP14]], align 4
	; VEC-NEXT: br label [[PRED_STORE_CONTINUE2]]			; VEC-NEXT: br label [[PRED_STORE_CONTINUE2]]
	; VEC: pred.store.continue2:			; VEC: pred.store.continue2:
	; VEC-NEXT: [[TMP17:%.*]] = add <2 x i32> [[VEC_PHI]], <i32 1, i32 1>			; VEC-NEXT: [[TMP16:%.*]] = add <2 x i32> [[VEC_PHI]], <i32 1, i32 1>
	; VEC-NEXT: [[TMP18:%.*]] = xor <2 x i1> [[BROADCAST_SPLAT]], <i1 true, i1 true>			; VEC-NEXT: [[TMP17:%.*]] = xor <2 x i1> [[BROADCAST_SPLAT]], <i1 true, i1 true>
	; VEC-NEXT: [[PREDPHI]] = select <2 x i1> [[TMP18]], <2 x i32> [[VEC_PHI]], <2 x i32> [[TMP17]]			; VEC-NEXT: [[PREDPHI]] = select <2 x i1> [[TMP17]], <2 x i32> [[VEC_PHI]], <2 x i32> [[TMP16]]
	; VEC-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 2			; VEC-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 2
	; VEC-NEXT: [[TMP19:%.*]] = icmp eq i64 [[INDEX_NEXT]], [[N_VEC]]			; VEC-NEXT: [[TMP18:%.*]] = icmp eq i64 [[INDEX_NEXT]], [[N_VEC]]
	; VEC-NEXT: br i1 [[TMP19]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP4:![0-9]+]]			; VEC-NEXT: br i1 [[TMP18]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP4:![0-9]+]]
	; VEC: middle.block:			; VEC: middle.block:
	; VEC-NEXT: [[TMP20:%.*]] = call i32 @llvm.vector.reduce.add.v2i32(<2 x i32> [[PREDPHI]])			; VEC-NEXT: [[TMP19:%.*]] = call i32 @llvm.vector.reduce.add.v2i32(<2 x i32> [[PREDPHI]])
				; VEC-NEXT: [[RDX_START:%.]] = add i32 [[V_2:%.]], [[TMP19]]
	; VEC-NEXT: [[CMP_N:%.*]] = icmp eq i64 [[TMP4]], [[N_VEC]]			; VEC-NEXT: [[CMP_N:%.*]] = icmp eq i64 [[TMP4]], [[N_VEC]]
	; VEC-NEXT: [[TMP21:%.*]] = xor i1 [[CMP_N]], true			; VEC-NEXT: [[TMP20:%.*]] = xor i1 [[CMP_N]], true
	; VEC-NEXT: call void @llvm.assume(i1 [[TMP21]])			; VEC-NEXT: call void @llvm.assume(i1 [[TMP20]])
	; VEC-NEXT: br label [[SCALAR_PH]]			; VEC-NEXT: br label [[SCALAR_PH]]
	; VEC: scalar.ph:			; VEC: scalar.ph:
	; VEC-NEXT: [[BC_RESUME_VAL:%.]] = phi i64 [ [[IND_END]], [[MIDDLE_BLOCK]] ], [ [[V_1]], [[ENTRY:%.]] ]			; VEC-NEXT: [[BC_RESUME_VAL:%.]] = phi i64 [ [[IND_END]], [[MIDDLE_BLOCK]] ], [ [[V_1]], [[ENTRY:%.]] ]
	; VEC-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ [[V_2]], [[ENTRY]] ], [ [[TMP20]], [[MIDDLE_BLOCK]] ]			; VEC-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ [[V_2]], [[ENTRY]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; VEC-NEXT: br label [[FOR_BODY14:%.*]]			; VEC-NEXT: br label [[FOR_BODY14:%.*]]
	; VEC: for.body14:			; VEC: for.body14:
	; VEC-NEXT: [[INDVARS_IV3:%.]] = phi i64 [ [[INDVARS_IV_NEXT4:%.]], [[FOR_INC23:%.*]] ], [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ]			; VEC-NEXT: [[INDVARS_IV3:%.]] = phi i64 [ [[INDVARS_IV_NEXT4:%.]], [[FOR_INC23:%.*]] ], [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ]
	; VEC-NEXT: [[INEWCHUNKS_120:%.]] = phi i32 [ [[INEWCHUNKS_2:%.]], [[FOR_INC23]] ], [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ]			; VEC-NEXT: [[INEWCHUNKS_120:%.]] = phi i32 [ [[INEWCHUNKS_2:%.]], [[FOR_INC23]] ], [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ]
	; VEC-NEXT: [[ARRAYIDX16:%.]] = getelementptr inbounds [768 x i32], [768 x i32] [[PTR]], i64 0, i64 [[INDVARS_IV3]]			; VEC-NEXT: [[ARRAYIDX16:%.]] = getelementptr inbounds [768 x i32], [768 x i32] [[PTR]], i64 0, i64 [[INDVARS_IV3]]
	; VEC-NEXT: [[TMP:%.]] = load i32, i32 [[ARRAYIDX16]], align 4			; VEC-NEXT: [[TMP:%.]] = load i32, i32 [[ARRAYIDX16]], align 4
	; VEC-NEXT: br i1 [[COND_2]], label [[IF_THEN18:%.*]], label [[FOR_INC23]]			; VEC-NEXT: br i1 [[COND_2]], label [[IF_THEN18:%.*]], label [[FOR_INC23]]
	; VEC: if.then18:			; VEC: if.then18:
	▲ Show 20 Lines • Show All 42 Lines • ▼ Show 20 Lines
	; conditional store to remain scalar. Since we can only type-shrink vector			; conditional store to remain scalar. Since we can only type-shrink vector
	; types, we shouldn't try to represent the expression in a smaller type.			; types, we shouldn't try to represent the expression in a smaller type.
	;			;
	define void @minimal_bit_widths(i1 %c) {			define void @minimal_bit_widths(i1 %c) {
	; UNROLL-LABEL: @minimal_bit_widths(			; UNROLL-LABEL: @minimal_bit_widths(
	; UNROLL-NEXT: entry:			; UNROLL-NEXT: entry:
	; UNROLL-NEXT: br label [[VECTOR_BODY:%.*]]			; UNROLL-NEXT: br label [[VECTOR_BODY:%.*]]
	; UNROLL: vector.body:			; UNROLL: vector.body:
	; UNROLL-NEXT: [[INDEX:%.]] = phi i64 [ 0, [[ENTRY:%.]] ], [ [[INDEX_NEXT:%.]], [[PRED_STORE_CONTINUE6:%.]] ]			; UNROLL-NEXT: [[INDEX:%.]] = phi i64 [ 0, [[ENTRY:%.]] ], [ [[INDEX_NEXT:%.]], [[PRED_STORE_CONTINUE3:%.]] ]
	; UNROLL-NEXT: br i1 [[C:%.]], label [[PRED_STORE_IF:%.]], label [[PRED_STORE_CONTINUE6]]			; UNROLL-NEXT: br i1 [[C:%.]], label [[PRED_STORE_IF:%.]], label [[PRED_STORE_CONTINUE3]]
	; UNROLL: pred.store.if:			; UNROLL: pred.store.if:
	; UNROLL-NEXT: [[INDUCTION3:%.*]] = add i64 [[INDEX]], 0			; UNROLL-NEXT: [[TMP0:%.*]] = add i64 [[INDEX]], 0
	; UNROLL-NEXT: [[TMP0:%.]] = getelementptr i8, i8 undef, i64 [[INDUCTION3]]			; UNROLL-NEXT: [[TMP1:%.]] = getelementptr i8, i8 undef, i64 [[TMP0]]
	; UNROLL-NEXT: [[TMP1:%.]] = load i8, i8 [[TMP0]], align 1			; UNROLL-NEXT: [[TMP2:%.]] = load i8, i8 [[TMP1]], align 1
	; UNROLL-NEXT: [[TMP2:%.*]] = zext i8 [[TMP1]] to i32			; UNROLL-NEXT: [[TMP3:%.*]] = zext i8 [[TMP2]] to i32
	; UNROLL-NEXT: [[TMP3:%.*]] = trunc i32 [[TMP2]] to i8			; UNROLL-NEXT: [[TMP4:%.*]] = trunc i32 [[TMP3]] to i8
	; UNROLL-NEXT: store i8 [[TMP3]], i8* [[TMP0]], align 1			; UNROLL-NEXT: store i8 [[TMP4]], i8* [[TMP1]], align 1
	; UNROLL-NEXT: [[INDUCTION4:%.*]] = add i64 [[INDEX]], 1			; UNROLL-NEXT: [[TMP5:%.*]] = add i64 [[INDEX]], 1
	; UNROLL-NEXT: [[TMP4:%.]] = getelementptr i8, i8 undef, i64 [[INDUCTION4]]			; UNROLL-NEXT: [[TMP6:%.]] = getelementptr i8, i8 undef, i64 [[TMP5]]
	; UNROLL-NEXT: [[TMP5:%.]] = load i8, i8 [[TMP4]], align 1			; UNROLL-NEXT: [[TMP7:%.]] = load i8, i8 [[TMP6]], align 1
	; UNROLL-NEXT: [[TMP6:%.*]] = zext i8 [[TMP5]] to i32			; UNROLL-NEXT: [[TMP8:%.*]] = zext i8 [[TMP7]] to i32
	; UNROLL-NEXT: [[TMP7:%.*]] = trunc i32 [[TMP6]] to i8			; UNROLL-NEXT: [[TMP9:%.*]] = trunc i32 [[TMP8]] to i8
	; UNROLL-NEXT: store i8 [[TMP7]], i8* [[TMP4]], align 1			; UNROLL-NEXT: store i8 [[TMP9]], i8* [[TMP6]], align 1
	; UNROLL-NEXT: br label [[PRED_STORE_CONTINUE6]]			; UNROLL-NEXT: br label [[PRED_STORE_CONTINUE3]]
	; UNROLL: pred.store.continue3:			; UNROLL: pred.store.continue3:
	; UNROLL-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 2			; UNROLL-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 2
	; UNROLL-NEXT: [[TMP8:%.*]] = icmp eq i64 [[INDEX_NEXT]], undef			; UNROLL-NEXT: [[TMP10:%.*]] = icmp eq i64 [[INDEX_NEXT]], undef
	; UNROLL-NEXT: br i1 [[TMP8]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP4:![0-9]+]]			; UNROLL-NEXT: br i1 [[TMP10]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP4:![0-9]+]]
	; UNROLL: middle.block:			; UNROLL: middle.block:
	; UNROLL-NEXT: [[CMP_N:%.*]] = icmp eq i64 undef, undef			; UNROLL-NEXT: [[CMP_N:%.*]] = icmp eq i64 undef, undef
	; UNROLL-NEXT: br i1 [[CMP_N]], label [[FOR_END:%.]], label [[FOR_BODY:%.]]			; UNROLL-NEXT: br i1 [[CMP_N]], label [[FOR_END:%.]], label [[FOR_BODY:%.]]
	; UNROLL: for.body:			; UNROLL: for.body:
	; UNROLL-NEXT: [[TMP0:%.]] = phi i64 [ [[TMP6:%.]], [[FOR_INC:%.*]] ], [ undef, [[MIDDLE_BLOCK]] ]			; UNROLL-NEXT: [[TMP0:%.]] = phi i64 [ [[TMP6:%.]], [[FOR_INC:%.*]] ], [ undef, [[MIDDLE_BLOCK]] ]
	; UNROLL-NEXT: [[TMP1:%.]] = phi i64 [ [[TMP7:%.]], [[FOR_INC]] ], [ undef, [[MIDDLE_BLOCK]] ]			; UNROLL-NEXT: [[TMP1:%.]] = phi i64 [ [[TMP7:%.]], [[FOR_INC]] ], [ undef, [[MIDDLE_BLOCK]] ]
	; UNROLL-NEXT: [[TMP2:%.]] = getelementptr i8, i8 undef, i64 [[TMP0]]			; UNROLL-NEXT: [[TMP2:%.]] = getelementptr i8, i8 undef, i64 [[TMP0]]
	; UNROLL-NEXT: [[TMP3:%.]] = load i8, i8 [[TMP2]], align 1			; UNROLL-NEXT: [[TMP3:%.]] = load i8, i8 [[TMP2]], align 1
	Show All 12 Lines
	; UNROLL-NEXT: ret void			; UNROLL-NEXT: ret void
	;			;
	; UNROLL-NOSIMPLIFY-LABEL: @minimal_bit_widths(			; UNROLL-NOSIMPLIFY-LABEL: @minimal_bit_widths(
	; UNROLL-NOSIMPLIFY-NEXT: entry:			; UNROLL-NOSIMPLIFY-NEXT: entry:
	; UNROLL-NOSIMPLIFY-NEXT: br i1 false, label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]			; UNROLL-NOSIMPLIFY-NEXT: br i1 false, label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]
	; UNROLL-NOSIMPLIFY: vector.ph:			; UNROLL-NOSIMPLIFY: vector.ph:
	; UNROLL-NOSIMPLIFY-NEXT: br label [[VECTOR_BODY:%.*]]			; UNROLL-NOSIMPLIFY-NEXT: br label [[VECTOR_BODY:%.*]]
	; UNROLL-NOSIMPLIFY: vector.body:			; UNROLL-NOSIMPLIFY: vector.body:
	; UNROLL-NOSIMPLIFY-NEXT: [[INDEX:%.]] = phi i64 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[PRED_STORE_CONTINUE6:%.*]] ]			; UNROLL-NOSIMPLIFY-NEXT: [[INDEX:%.]] = phi i64 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[PRED_STORE_CONTINUE3:%.*]] ]
	; UNROLL-NOSIMPLIFY-NEXT: br i1 [[C:%.]], label [[PRED_STORE_IF:%.]], label [[PRED_STORE_CONTINUE:%.*]]			; UNROLL-NOSIMPLIFY-NEXT: br i1 [[C:%.]], label [[PRED_STORE_IF:%.]], label [[PRED_STORE_CONTINUE:%.*]]
	; UNROLL-NOSIMPLIFY: pred.store.if:			; UNROLL-NOSIMPLIFY: pred.store.if:
	; UNROLL-NOSIMPLIFY-NEXT: [[INDUCTION3:%.*]] = add i64 [[INDEX]], 0			; UNROLL-NOSIMPLIFY-NEXT: [[TMP0:%.*]] = add i64 [[INDEX]], 0
	; UNROLL-NOSIMPLIFY-NEXT: [[TMP0:%.]] = getelementptr i8, i8 undef, i64 [[INDUCTION3]]			; UNROLL-NOSIMPLIFY-NEXT: [[TMP1:%.]] = getelementptr i8, i8 undef, i64 [[TMP0]]
	; UNROLL-NOSIMPLIFY-NEXT: [[TMP1:%.]] = load i8, i8 [[TMP0]], align 1			; UNROLL-NOSIMPLIFY-NEXT: [[TMP2:%.]] = load i8, i8 [[TMP1]], align 1
	; UNROLL-NOSIMPLIFY-NEXT: [[TMP2:%.*]] = zext i8 [[TMP1]] to i32			; UNROLL-NOSIMPLIFY-NEXT: [[TMP3:%.*]] = zext i8 [[TMP2]] to i32
	; UNROLL-NOSIMPLIFY-NEXT: [[TMP3:%.*]] = trunc i32 [[TMP2]] to i8			; UNROLL-NOSIMPLIFY-NEXT: [[TMP4:%.*]] = trunc i32 [[TMP3]] to i8
	; UNROLL-NOSIMPLIFY-NEXT: store i8 [[TMP3]], i8* [[TMP0]], align 1			; UNROLL-NOSIMPLIFY-NEXT: store i8 [[TMP4]], i8* [[TMP1]], align 1
	; UNROLL-NOSIMPLIFY-NEXT: br label [[PRED_STORE_CONTINUE]]			; UNROLL-NOSIMPLIFY-NEXT: br label [[PRED_STORE_CONTINUE]]
	; UNROLL-NOSIMPLIFY: pred.store.continue:			; UNROLL-NOSIMPLIFY: pred.store.continue:
	; UNROLL-NOSIMPLIFY-NEXT: br i1 [[C]], label [[PRED_STORE_IF5:%.*]], label [[PRED_STORE_CONTINUE6]]			; UNROLL-NOSIMPLIFY-NEXT: br i1 [[C]], label [[PRED_STORE_IF2:%.*]], label [[PRED_STORE_CONTINUE3]]
	; UNROLL-NOSIMPLIFY: pred.store.if2:			; UNROLL-NOSIMPLIFY: pred.store.if2:
	; UNROLL-NOSIMPLIFY-NEXT: [[INDUCTION2:%.*]] = add i64 [[INDEX]], 1			; UNROLL-NOSIMPLIFY-NEXT: [[TMP5:%.*]] = add i64 [[INDEX]], 1
	; UNROLL-NOSIMPLIFY-NEXT: [[TMP4:%.]] = getelementptr i8, i8 undef, i64 [[INDUCTION2]]			; UNROLL-NOSIMPLIFY-NEXT: [[TMP6:%.]] = getelementptr i8, i8 undef, i64 [[TMP5]]
	; UNROLL-NOSIMPLIFY-NEXT: [[TMP5:%.]] = load i8, i8 [[TMP4]], align 1			; UNROLL-NOSIMPLIFY-NEXT: [[TMP7:%.]] = load i8, i8 [[TMP6]], align 1
	; UNROLL-NOSIMPLIFY-NEXT: [[TMP6:%.*]] = zext i8 [[TMP5]] to i32			; UNROLL-NOSIMPLIFY-NEXT: [[TMP8:%.*]] = zext i8 [[TMP7]] to i32
	; UNROLL-NOSIMPLIFY-NEXT: [[TMP7:%.*]] = trunc i32 [[TMP6]] to i8			; UNROLL-NOSIMPLIFY-NEXT: [[TMP9:%.*]] = trunc i32 [[TMP8]] to i8
	; UNROLL-NOSIMPLIFY-NEXT: store i8 [[TMP7]], i8* [[TMP4]], align 1			; UNROLL-NOSIMPLIFY-NEXT: store i8 [[TMP9]], i8* [[TMP6]], align 1
	; UNROLL-NOSIMPLIFY-NEXT: br label [[PRED_STORE_CONTINUE6]]			; UNROLL-NOSIMPLIFY-NEXT: br label [[PRED_STORE_CONTINUE3]]
	; UNROLL-NOSIMPLIFY: pred.store.continue3:			; UNROLL-NOSIMPLIFY: pred.store.continue3:
	; UNROLL-NOSIMPLIFY-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 2			; UNROLL-NOSIMPLIFY-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 2
	; UNROLL-NOSIMPLIFY-NEXT: [[TMP8:%.*]] = icmp eq i64 [[INDEX_NEXT]], undef			; UNROLL-NOSIMPLIFY-NEXT: [[TMP10:%.*]] = icmp eq i64 [[INDEX_NEXT]], undef
	; UNROLL-NOSIMPLIFY-NEXT: br i1 [[TMP8]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP5:![0-9]+]]			; UNROLL-NOSIMPLIFY-NEXT: br i1 [[TMP10]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP5:![0-9]+]]
	; UNROLL-NOSIMPLIFY: middle.block:			; UNROLL-NOSIMPLIFY: middle.block:
	; UNROLL-NOSIMPLIFY-NEXT: [[CMP_N:%.*]] = icmp eq i64 undef, undef			; UNROLL-NOSIMPLIFY-NEXT: [[CMP_N:%.*]] = icmp eq i64 undef, undef
	; UNROLL-NOSIMPLIFY-NEXT: br i1 [[CMP_N]], label [[FOR_END:%.*]], label [[SCALAR_PH]]			; UNROLL-NOSIMPLIFY-NEXT: br i1 [[CMP_N]], label [[FOR_END:%.*]], label [[SCALAR_PH]]
	; UNROLL-NOSIMPLIFY: scalar.ph:			; UNROLL-NOSIMPLIFY: scalar.ph:
	; UNROLL-NOSIMPLIFY-NEXT: [[BC_RESUME_VAL:%.]] = phi i64 [ undef, [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY:%.]] ]			; UNROLL-NOSIMPLIFY-NEXT: [[BC_RESUME_VAL:%.]] = phi i64 [ undef, [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY:%.]] ]
	; UNROLL-NOSIMPLIFY-NEXT: [[BC_RESUME_VAL1:%.*]] = phi i64 [ undef, [[MIDDLE_BLOCK]] ], [ undef, [[ENTRY]] ]			; UNROLL-NOSIMPLIFY-NEXT: [[BC_RESUME_VAL1:%.*]] = phi i64 [ undef, [[MIDDLE_BLOCK]] ], [ undef, [[ENTRY]] ]
	; UNROLL-NOSIMPLIFY-NEXT: br label [[FOR_BODY:%.*]]			; UNROLL-NOSIMPLIFY-NEXT: br label [[FOR_BODY:%.*]]
	; UNROLL-NOSIMPLIFY: for.body:			; UNROLL-NOSIMPLIFY: for.body:
	Show All 18 Lines
	; VEC-LABEL: @minimal_bit_widths(			; VEC-LABEL: @minimal_bit_widths(
	; VEC-NEXT: entry:			; VEC-NEXT: entry:
	; VEC-NEXT: [[BROADCAST_SPLATINSERT:%.]] = insertelement <2 x i1> poison, i1 [[C:%.]], i32 0			; VEC-NEXT: [[BROADCAST_SPLATINSERT:%.]] = insertelement <2 x i1> poison, i1 [[C:%.]], i32 0
	; VEC-NEXT: [[BROADCAST_SPLAT:%.*]] = shufflevector <2 x i1> [[BROADCAST_SPLATINSERT]], <2 x i1> poison, <2 x i32> zeroinitializer			; VEC-NEXT: [[BROADCAST_SPLAT:%.*]] = shufflevector <2 x i1> [[BROADCAST_SPLATINSERT]], <2 x i1> poison, <2 x i32> zeroinitializer
	; VEC-NEXT: br label [[VECTOR_BODY:%.*]]			; VEC-NEXT: br label [[VECTOR_BODY:%.*]]
	; VEC: vector.body:			; VEC: vector.body:
	; VEC-NEXT: [[INDEX:%.]] = phi i64 [ 0, [[ENTRY:%.]] ], [ [[INDEX_NEXT:%.]], [[PRED_STORE_CONTINUE3:%.]] ]			; VEC-NEXT: [[INDEX:%.]] = phi i64 [ 0, [[ENTRY:%.]] ], [ [[INDEX_NEXT:%.]], [[PRED_STORE_CONTINUE3:%.]] ]
	; VEC-NEXT: [[TMP0:%.*]] = add i64 [[INDEX]], 0			; VEC-NEXT: [[TMP0:%.*]] = add i64 [[INDEX]], 0
	; VEC-NEXT: [[TMP2:%.]] = getelementptr i8, i8 undef, i64 [[TMP0]]			; VEC-NEXT: [[TMP1:%.]] = getelementptr i8, i8 undef, i64 [[TMP0]]
	; VEC-NEXT: [[TMP3:%.]] = getelementptr i8, i8 [[TMP2]], i32 0			; VEC-NEXT: [[TMP2:%.]] = getelementptr i8, i8 [[TMP1]], i32 0
	; VEC-NEXT: [[TMP4:%.]] = bitcast i8 [[TMP3]] to <2 x i8>*			; VEC-NEXT: [[TMP3:%.]] = bitcast i8 [[TMP2]] to <2 x i8>*
	; VEC-NEXT: [[WIDE_LOAD:%.]] = load <2 x i8>, <2 x i8> [[TMP4]], align 1			; VEC-NEXT: [[WIDE_LOAD:%.]] = load <2 x i8>, <2 x i8> [[TMP3]], align 1
	; VEC-NEXT: [[TMP5:%.*]] = extractelement <2 x i1> [[BROADCAST_SPLAT]], i32 0			; VEC-NEXT: [[TMP4:%.*]] = extractelement <2 x i1> [[BROADCAST_SPLAT]], i32 0
	; VEC-NEXT: br i1 [[TMP5]], label [[PRED_STORE_IF:%.]], label [[PRED_STORE_CONTINUE:%.]]			; VEC-NEXT: br i1 [[TMP4]], label [[PRED_STORE_IF:%.]], label [[PRED_STORE_CONTINUE:%.]]
	; VEC: pred.store.if:			; VEC: pred.store.if:
	; VEC-NEXT: [[TMP6:%.*]] = extractelement <2 x i8> [[WIDE_LOAD]], i32 0			; VEC-NEXT: [[TMP5:%.*]] = extractelement <2 x i8> [[WIDE_LOAD]], i32 0
	; VEC-NEXT: [[TMP7:%.*]] = zext i8 [[TMP6]] to i32			; VEC-NEXT: [[TMP6:%.*]] = zext i8 [[TMP5]] to i32
	; VEC-NEXT: [[TMP8:%.*]] = trunc i32 [[TMP7]] to i8			; VEC-NEXT: [[TMP7:%.*]] = trunc i32 [[TMP6]] to i8
	; VEC-NEXT: [[TMP9:%.]] = getelementptr i8, i8 undef, i64 [[TMP0]]			; VEC-NEXT: [[TMP8:%.]] = getelementptr i8, i8 undef, i64 [[TMP0]]
	; VEC-NEXT: store i8 [[TMP8]], i8* [[TMP9]], align 1			; VEC-NEXT: store i8 [[TMP7]], i8* [[TMP8]], align 1
	; VEC-NEXT: br label [[PRED_STORE_CONTINUE]]			; VEC-NEXT: br label [[PRED_STORE_CONTINUE]]
	; VEC: pred.store.continue:			; VEC: pred.store.continue:
	; VEC-NEXT: [[TMP10:%.*]] = extractelement <2 x i1> [[BROADCAST_SPLAT]], i32 1			; VEC-NEXT: [[TMP9:%.*]] = extractelement <2 x i1> [[BROADCAST_SPLAT]], i32 1
	; VEC-NEXT: br i1 [[TMP10]], label [[PRED_STORE_IF2:%.*]], label [[PRED_STORE_CONTINUE3]]			; VEC-NEXT: br i1 [[TMP9]], label [[PRED_STORE_IF2:%.*]], label [[PRED_STORE_CONTINUE3]]
	; VEC: pred.store.if2:			; VEC: pred.store.if2:
	; VEC-NEXT: [[TMP11:%.*]] = add i64 [[INDEX]], 1			; VEC-NEXT: [[TMP10:%.*]] = add i64 [[INDEX]], 1
	; VEC-NEXT: [[TMP12:%.*]] = extractelement <2 x i8> [[WIDE_LOAD]], i32 1			; VEC-NEXT: [[TMP11:%.*]] = extractelement <2 x i8> [[WIDE_LOAD]], i32 1
	; VEC-NEXT: [[TMP13:%.*]] = zext i8 [[TMP12]] to i32			; VEC-NEXT: [[TMP12:%.*]] = zext i8 [[TMP11]] to i32
	; VEC-NEXT: [[TMP14:%.*]] = trunc i32 [[TMP13]] to i8			; VEC-NEXT: [[TMP13:%.*]] = trunc i32 [[TMP12]] to i8
	; VEC-NEXT: [[TMP15:%.]] = getelementptr i8, i8 undef, i64 [[TMP11]]			; VEC-NEXT: [[TMP14:%.]] = getelementptr i8, i8 undef, i64 [[TMP10]]
	; VEC-NEXT: store i8 [[TMP14]], i8* [[TMP15]], align 1			; VEC-NEXT: store i8 [[TMP13]], i8* [[TMP14]], align 1
	; VEC-NEXT: br label [[PRED_STORE_CONTINUE3]]			; VEC-NEXT: br label [[PRED_STORE_CONTINUE3]]
	; VEC: pred.store.continue3:			; VEC: pred.store.continue3:
	; VEC-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 2			; VEC-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 2
	; VEC-NEXT: [[TMP16:%.*]] = icmp eq i64 [[INDEX_NEXT]], undef			; VEC-NEXT: [[TMP15:%.*]] = icmp eq i64 [[INDEX_NEXT]], undef
	; VEC-NEXT: br i1 [[TMP16]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP5:![0-9]+]]			; VEC-NEXT: br i1 [[TMP15]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP5:![0-9]+]]
	; VEC: middle.block:			; VEC: middle.block:
	; VEC-NEXT: [[CMP_N:%.*]] = icmp eq i64 undef, undef			; VEC-NEXT: [[CMP_N:%.*]] = icmp eq i64 undef, undef
	; VEC-NEXT: br i1 [[CMP_N]], label [[FOR_END:%.]], label [[FOR_BODY:%.]]			; VEC-NEXT: br i1 [[CMP_N]], label [[FOR_END:%.]], label [[FOR_BODY:%.]]
	; VEC: for.body:			; VEC: for.body:
	; VEC-NEXT: [[TMP0:%.]] = phi i64 [ [[TMP6:%.]], [[FOR_INC:%.*]] ], [ undef, [[MIDDLE_BLOCK]] ]			; VEC-NEXT: [[TMP0:%.]] = phi i64 [ [[TMP6:%.]], [[FOR_INC:%.*]] ], [ undef, [[MIDDLE_BLOCK]] ]
	; VEC-NEXT: [[TMP1:%.]] = phi i64 [ [[TMP7:%.]], [[FOR_INC]] ], [ undef, [[MIDDLE_BLOCK]] ]			; VEC-NEXT: [[TMP1:%.]] = phi i64 [ [[TMP7:%.]], [[FOR_INC]] ], [ undef, [[MIDDLE_BLOCK]] ]
	; VEC-NEXT: [[TMP2:%.]] = getelementptr i8, i8 undef, i64 [[TMP0]]			; VEC-NEXT: [[TMP2:%.]] = getelementptr i8, i8 undef, i64 [[TMP0]]
	; VEC-NEXT: [[TMP3:%.]] = load i8, i8 [[TMP2]], align 1			; VEC-NEXT: [[TMP3:%.]] = load i8, i8 [[TMP2]], align 1
	▲ Show 20 Lines • Show All 62 Lines • ▼ Show 20 Lines
	; UNROLL-NEXT: ret void			; UNROLL-NEXT: ret void
	;			;
	; UNROLL-NOSIMPLIFY-LABEL: @minimal_bit_widths_with_aliasing_store(			; UNROLL-NOSIMPLIFY-LABEL: @minimal_bit_widths_with_aliasing_store(
	; UNROLL-NOSIMPLIFY-NEXT: entry:			; UNROLL-NOSIMPLIFY-NEXT: entry:
	; UNROLL-NOSIMPLIFY-NEXT: br i1 true, label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]			; UNROLL-NOSIMPLIFY-NEXT: br i1 true, label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]
	; UNROLL-NOSIMPLIFY: vector.ph:			; UNROLL-NOSIMPLIFY: vector.ph:
	; UNROLL-NOSIMPLIFY-NEXT: br label [[VECTOR_BODY:%.*]]			; UNROLL-NOSIMPLIFY-NEXT: br label [[VECTOR_BODY:%.*]]
	; UNROLL-NOSIMPLIFY: vector.body:			; UNROLL-NOSIMPLIFY: vector.body:
	; UNROLL-NOSIMPLIFY-NEXT: [[INDEX:%.]] = phi i64 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[PRED_STORE_CONTINUE6:%.*]] ]			; UNROLL-NOSIMPLIFY-NEXT: [[INDEX:%.]] = phi i64 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[PRED_STORE_CONTINUE3:%.*]] ]
	; UNROLL-NOSIMPLIFY-NEXT: [[INDUCTION:%.*]] = add i64 [[INDEX]], 0			; UNROLL-NOSIMPLIFY-NEXT: [[TMP0:%.*]] = add i64 [[INDEX]], 0
	; UNROLL-NOSIMPLIFY-NEXT: [[INDUCTION2:%.*]] = add i64 [[INDEX]], 1			; UNROLL-NOSIMPLIFY-NEXT: [[TMP1:%.*]] = add i64 [[INDEX]], 1
	; UNROLL-NOSIMPLIFY-NEXT: [[TMP0:%.]] = getelementptr i8, i8 [[PTR:%.*]], i64 [[INDUCTION]]			; UNROLL-NOSIMPLIFY-NEXT: [[TMP2:%.]] = getelementptr i8, i8 [[PTR:%.*]], i64 [[TMP0]]
	; UNROLL-NOSIMPLIFY-NEXT: [[TMP1:%.]] = getelementptr i8, i8 [[PTR]], i64 [[INDUCTION2]]			; UNROLL-NOSIMPLIFY-NEXT: [[TMP3:%.]] = getelementptr i8, i8 [[PTR]], i64 [[TMP1]]
	; UNROLL-NOSIMPLIFY-NEXT: store i8 0, i8* [[TMP0]], align 1			; UNROLL-NOSIMPLIFY-NEXT: store i8 0, i8* [[TMP2]], align 1
	; UNROLL-NOSIMPLIFY-NEXT: store i8 0, i8* [[TMP1]], align 1			; UNROLL-NOSIMPLIFY-NEXT: store i8 0, i8* [[TMP3]], align 1
	; UNROLL-NOSIMPLIFY-NEXT: br i1 [[C:%.]], label [[PRED_STORE_IF:%.]], label [[PRED_STORE_CONTINUE:%.*]]			; UNROLL-NOSIMPLIFY-NEXT: br i1 [[C:%.]], label [[PRED_STORE_IF:%.]], label [[PRED_STORE_CONTINUE:%.*]]
	; UNROLL-NOSIMPLIFY: pred.store.if:			; UNROLL-NOSIMPLIFY: pred.store.if:
	; UNROLL-NOSIMPLIFY-NEXT: [[TMP2:%.]] = load i8, i8 [[TMP0]], align 1			; UNROLL-NOSIMPLIFY-NEXT: [[TMP4:%.]] = load i8, i8 [[TMP2]], align 1
	; UNROLL-NOSIMPLIFY-NEXT: [[TMP3:%.*]] = zext i8 [[TMP2]] to i32			; UNROLL-NOSIMPLIFY-NEXT: [[TMP5:%.*]] = zext i8 [[TMP4]] to i32
	; UNROLL-NOSIMPLIFY-NEXT: [[TMP4:%.*]] = trunc i32 [[TMP3]] to i8			; UNROLL-NOSIMPLIFY-NEXT: [[TMP6:%.*]] = trunc i32 [[TMP5]] to i8
	; UNROLL-NOSIMPLIFY-NEXT: store i8 [[TMP4]], i8* [[TMP0]], align 1			; UNROLL-NOSIMPLIFY-NEXT: store i8 [[TMP6]], i8* [[TMP2]], align 1
	; UNROLL-NOSIMPLIFY-NEXT: br label [[PRED_STORE_CONTINUE]]			; UNROLL-NOSIMPLIFY-NEXT: br label [[PRED_STORE_CONTINUE]]
	; UNROLL-NOSIMPLIFY: pred.store.continue:			; UNROLL-NOSIMPLIFY: pred.store.continue:
	; UNROLL-NOSIMPLIFY-NEXT: br i1 [[C]], label [[PRED_STORE_IF5:%.*]], label [[PRED_STORE_CONTINUE6]]			; UNROLL-NOSIMPLIFY-NEXT: br i1 [[C]], label [[PRED_STORE_IF2:%.*]], label [[PRED_STORE_CONTINUE3]]
	; UNROLL-NOSIMPLIFY: pred.store.if2:			; UNROLL-NOSIMPLIFY: pred.store.if2:
	; UNROLL-NOSIMPLIFY-NEXT: [[TMP5:%.]] = load i8, i8 [[TMP1]], align 1			; UNROLL-NOSIMPLIFY-NEXT: [[TMP7:%.]] = load i8, i8 [[TMP3]], align 1
	; UNROLL-NOSIMPLIFY-NEXT: [[TMP6:%.*]] = zext i8 [[TMP5]] to i32			; UNROLL-NOSIMPLIFY-NEXT: [[TMP8:%.*]] = zext i8 [[TMP7]] to i32
	; UNROLL-NOSIMPLIFY-NEXT: [[TMP7:%.*]] = trunc i32 [[TMP6]] to i8			; UNROLL-NOSIMPLIFY-NEXT: [[TMP9:%.*]] = trunc i32 [[TMP8]] to i8
	; UNROLL-NOSIMPLIFY-NEXT: store i8 [[TMP7]], i8* [[TMP1]], align 1			; UNROLL-NOSIMPLIFY-NEXT: store i8 [[TMP9]], i8* [[TMP3]], align 1
	; UNROLL-NOSIMPLIFY-NEXT: br label [[PRED_STORE_CONTINUE6]]			; UNROLL-NOSIMPLIFY-NEXT: br label [[PRED_STORE_CONTINUE3]]
	; UNROLL-NOSIMPLIFY: pred.store.continue3:			; UNROLL-NOSIMPLIFY: pred.store.continue3:
	; UNROLL-NOSIMPLIFY-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 2			; UNROLL-NOSIMPLIFY-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 2
	; UNROLL-NOSIMPLIFY-NEXT: [[TMP8:%.*]] = icmp eq i64 [[INDEX_NEXT]], 0			; UNROLL-NOSIMPLIFY-NEXT: [[TMP10:%.*]] = icmp eq i64 [[INDEX_NEXT]], 0
	; UNROLL-NOSIMPLIFY-NEXT: br i1 [[TMP8]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP7:![0-9]+]]			; UNROLL-NOSIMPLIFY-NEXT: br i1 [[TMP10]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP7:![0-9]+]]
	; UNROLL-NOSIMPLIFY: middle.block:			; UNROLL-NOSIMPLIFY: middle.block:
	; UNROLL-NOSIMPLIFY-NEXT: [[CMP_N:%.*]] = icmp eq i64 0, 0			; UNROLL-NOSIMPLIFY-NEXT: [[CMP_N:%.*]] = icmp eq i64 0, 0
	; UNROLL-NOSIMPLIFY-NEXT: br i1 [[CMP_N]], label [[FOR_END:%.*]], label [[SCALAR_PH]]			; UNROLL-NOSIMPLIFY-NEXT: br i1 [[CMP_N]], label [[FOR_END:%.*]], label [[SCALAR_PH]]
	; UNROLL-NOSIMPLIFY: scalar.ph:			; UNROLL-NOSIMPLIFY: scalar.ph:
	; UNROLL-NOSIMPLIFY-NEXT: [[BC_RESUME_VAL:%.]] = phi i64 [ 0, [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY:%.]] ]			; UNROLL-NOSIMPLIFY-NEXT: [[BC_RESUME_VAL:%.]] = phi i64 [ 0, [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY:%.]] ]
	; UNROLL-NOSIMPLIFY-NEXT: [[BC_RESUME_VAL1:%.*]] = phi i64 [ 0, [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY]] ]			; UNROLL-NOSIMPLIFY-NEXT: [[BC_RESUME_VAL1:%.*]] = phi i64 [ 0, [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY]] ]
	; UNROLL-NOSIMPLIFY-NEXT: br label [[FOR_BODY:%.*]]			; UNROLL-NOSIMPLIFY-NEXT: br label [[FOR_BODY:%.*]]
	; UNROLL-NOSIMPLIFY: for.body:			; UNROLL-NOSIMPLIFY: for.body:
	▲ Show 20 Lines • Show All 68 Lines • Show Last 20 Lines

llvm/test/Transforms/LoopVectorize/induction.ll

This file is larger than 256 KB, so syntax highlighting is disabled by default.

	Show First 20 Lines • Show All 674 Lines • ▼ Show 20 Lines
	; CHECK-NEXT: [[TMP3:%.]] = bitcast i64 [[TMP2]] to <2 x i64>*			; CHECK-NEXT: [[TMP3:%.]] = bitcast i64 [[TMP2]] to <2 x i64>*
	; CHECK-NEXT: [[WIDE_LOAD:%.]] = load <2 x i64>, <2 x i64> [[TMP3]], align 8			; CHECK-NEXT: [[WIDE_LOAD:%.]] = load <2 x i64>, <2 x i64> [[TMP3]], align 8
	; CHECK-NEXT: [[TMP4]] = add <2 x i64> [[WIDE_LOAD]], [[VEC_PHI]]			; CHECK-NEXT: [[TMP4]] = add <2 x i64> [[WIDE_LOAD]], [[VEC_PHI]]
	; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 2			; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 2
	; CHECK-NEXT: [[TMP5:%.*]] = icmp eq i64 [[INDEX_NEXT]], [[N_VEC]]			; CHECK-NEXT: [[TMP5:%.*]] = icmp eq i64 [[INDEX_NEXT]], [[N_VEC]]
	; CHECK-NEXT: br i1 [[TMP5]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP11:![0-9]+]]			; CHECK-NEXT: br i1 [[TMP5]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP11:![0-9]+]]
	; CHECK: middle.block:			; CHECK: middle.block:
	; CHECK-NEXT: [[TMP6:%.*]] = call i64 @llvm.vector.reduce.add.v2i64(<2 x i64> [[TMP4]])			; CHECK-NEXT: [[TMP6:%.*]] = call i64 @llvm.vector.reduce.add.v2i64(<2 x i64> [[TMP4]])
				; CHECK-NEXT: [[RDX_START:%.*]] = add i64 0, [[TMP6]]
	; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i64 [[SMAX]], [[N_VEC]]			; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i64 [[SMAX]], [[N_VEC]]
	; CHECK-NEXT: br i1 [[CMP_N]], label [[FOR_END:%.*]], label [[SCALAR_PH]]			; CHECK-NEXT: br i1 [[CMP_N]], label [[FOR_END:%.*]], label [[SCALAR_PH]]
	; CHECK: scalar.ph:			; CHECK: scalar.ph:
	; CHECK-NEXT: [[BC_RESUME_VAL:%.]] = phi i64 [ [[N_VEC]], [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY:%.]] ]			; CHECK-NEXT: [[BC_RESUME_VAL:%.]] = phi i64 [ [[N_VEC]], [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY:%.]] ]
	; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i64 [ 0, [[ENTRY]] ], [ [[TMP6]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i64 [ 0, [[ENTRY]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: br label [[FOR_BODY:%.*]]			; CHECK-NEXT: br label [[FOR_BODY:%.*]]
	; CHECK: for.body:			; CHECK: for.body:
	; CHECK-NEXT: [[I:%.]] = phi i64 [ [[I_NEXT:%.]], [[FOR_BODY]] ], [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ]			; CHECK-NEXT: [[I:%.]] = phi i64 [ [[I_NEXT:%.]], [[FOR_BODY]] ], [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ]
	; CHECK-NEXT: [[SUM:%.]] = phi i64 [ [[TMP9:%.]], [[FOR_BODY]] ], [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ]			; CHECK-NEXT: [[SUM:%.]] = phi i64 [ [[TMP9:%.]], [[FOR_BODY]] ], [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ]
	; CHECK-NEXT: [[TMP7:%.]] = getelementptr inbounds i64, i64 [[A]], i64 [[I]]			; CHECK-NEXT: [[TMP7:%.]] = getelementptr inbounds i64, i64 [[A]], i64 [[I]]
	; CHECK-NEXT: [[TMP8:%.]] = load i64, i64 [[TMP7]], align 8			; CHECK-NEXT: [[TMP8:%.]] = load i64, i64 [[TMP7]], align 8
	; CHECK-NEXT: [[TMP9]] = add i64 [[TMP8]], [[SUM]]			; CHECK-NEXT: [[TMP9]] = add i64 [[TMP8]], [[SUM]]
	; CHECK-NEXT: [[I_NEXT]] = add nuw nsw i64 [[I]], 1			; CHECK-NEXT: [[I_NEXT]] = add nuw nsw i64 [[I]], 1
	; CHECK-NEXT: [[COND:%.*]] = icmp slt i64 [[I_NEXT]], [[N]]			; CHECK-NEXT: [[COND:%.*]] = icmp slt i64 [[I_NEXT]], [[N]]
	; CHECK-NEXT: br i1 [[COND]], label [[FOR_BODY]], label [[FOR_END]], !llvm.loop [[LOOP12:![0-9]+]]			; CHECK-NEXT: br i1 [[COND]], label [[FOR_BODY]], label [[FOR_END]], !llvm.loop [[LOOP12:![0-9]+]]
	; CHECK: for.end:			; CHECK: for.end:
	; CHECK-NEXT: [[TMP10:%.*]] = phi i64 [ [[TMP9]], [[FOR_BODY]] ], [ [[TMP6]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[TMP10:%.*]] = phi i64 [ [[TMP9]], [[FOR_BODY]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: ret i64 [[TMP10]]			; CHECK-NEXT: ret i64 [[TMP10]]
	;			;
	; IND-LABEL: @scalarize_induction_variable_01(			; IND-LABEL: @scalarize_induction_variable_01(
	; IND-NEXT: entry:			; IND-NEXT: entry:
	; IND-NEXT: [[SMAX:%.]] = call i64 @llvm.smax.i64(i64 [[N:%.]], i64 1)			; IND-NEXT: [[SMAX:%.]] = call i64 @llvm.smax.i64(i64 [[N:%.]], i64 1)
	; IND-NEXT: [[MIN_ITERS_CHECK:%.*]] = icmp ult i64 [[SMAX]], 2			; IND-NEXT: [[MIN_ITERS_CHECK:%.*]] = icmp ult i64 [[SMAX]], 2
	; IND-NEXT: br i1 [[MIN_ITERS_CHECK]], label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]			; IND-NEXT: br i1 [[MIN_ITERS_CHECK]], label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]
	; IND: vector.ph:			; IND: vector.ph:
	▲ Show 20 Lines • Show All 101 Lines • ▼ Show 20 Lines
	; UNROLL-NO-IC-NEXT: [[TMP8]] = add <2 x i64> [[WIDE_LOAD]], [[VEC_PHI]]			; UNROLL-NO-IC-NEXT: [[TMP8]] = add <2 x i64> [[WIDE_LOAD]], [[VEC_PHI]]
	; UNROLL-NO-IC-NEXT: [[TMP9]] = add <2 x i64> [[WIDE_LOAD2]], [[VEC_PHI1]]			; UNROLL-NO-IC-NEXT: [[TMP9]] = add <2 x i64> [[WIDE_LOAD2]], [[VEC_PHI1]]
	; UNROLL-NO-IC-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 4			; UNROLL-NO-IC-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 4
	; UNROLL-NO-IC-NEXT: [[TMP10:%.*]] = icmp eq i64 [[INDEX_NEXT]], [[N_VEC]]			; UNROLL-NO-IC-NEXT: [[TMP10:%.*]] = icmp eq i64 [[INDEX_NEXT]], [[N_VEC]]
	; UNROLL-NO-IC-NEXT: br i1 [[TMP10]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP11:![0-9]+]]			; UNROLL-NO-IC-NEXT: br i1 [[TMP10]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP11:![0-9]+]]
	; UNROLL-NO-IC: middle.block:			; UNROLL-NO-IC: middle.block:
	; UNROLL-NO-IC-NEXT: [[BIN_RDX:%.*]] = add <2 x i64> [[TMP9]], [[TMP8]]			; UNROLL-NO-IC-NEXT: [[BIN_RDX:%.*]] = add <2 x i64> [[TMP9]], [[TMP8]]
	; UNROLL-NO-IC-NEXT: [[TMP11:%.*]] = call i64 @llvm.vector.reduce.add.v2i64(<2 x i64> [[BIN_RDX]])			; UNROLL-NO-IC-NEXT: [[TMP11:%.*]] = call i64 @llvm.vector.reduce.add.v2i64(<2 x i64> [[BIN_RDX]])
				; UNROLL-NO-IC-NEXT: [[RDX_START:%.*]] = add i64 0, [[TMP11]]
	; UNROLL-NO-IC-NEXT: [[CMP_N:%.*]] = icmp eq i64 [[SMAX]], [[N_VEC]]			; UNROLL-NO-IC-NEXT: [[CMP_N:%.*]] = icmp eq i64 [[SMAX]], [[N_VEC]]
	; UNROLL-NO-IC-NEXT: br i1 [[CMP_N]], label [[FOR_END:%.*]], label [[SCALAR_PH]]			; UNROLL-NO-IC-NEXT: br i1 [[CMP_N]], label [[FOR_END:%.*]], label [[SCALAR_PH]]
	; UNROLL-NO-IC: scalar.ph:			; UNROLL-NO-IC: scalar.ph:
	; UNROLL-NO-IC-NEXT: [[BC_RESUME_VAL:%.]] = phi i64 [ [[N_VEC]], [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY:%.]] ]			; UNROLL-NO-IC-NEXT: [[BC_RESUME_VAL:%.]] = phi i64 [ [[N_VEC]], [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY:%.]] ]
	; UNROLL-NO-IC-NEXT: [[BC_MERGE_RDX:%.*]] = phi i64 [ 0, [[ENTRY]] ], [ [[TMP11]], [[MIDDLE_BLOCK]] ]			; UNROLL-NO-IC-NEXT: [[BC_MERGE_RDX:%.*]] = phi i64 [ 0, [[ENTRY]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; UNROLL-NO-IC-NEXT: br label [[FOR_BODY:%.*]]			; UNROLL-NO-IC-NEXT: br label [[FOR_BODY:%.*]]
	; UNROLL-NO-IC: for.body:			; UNROLL-NO-IC: for.body:
	; UNROLL-NO-IC-NEXT: [[I:%.]] = phi i64 [ [[I_NEXT:%.]], [[FOR_BODY]] ], [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ]			; UNROLL-NO-IC-NEXT: [[I:%.]] = phi i64 [ [[I_NEXT:%.]], [[FOR_BODY]] ], [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ]
	; UNROLL-NO-IC-NEXT: [[SUM:%.]] = phi i64 [ [[TMP14:%.]], [[FOR_BODY]] ], [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ]			; UNROLL-NO-IC-NEXT: [[SUM:%.]] = phi i64 [ [[TMP14:%.]], [[FOR_BODY]] ], [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ]
	; UNROLL-NO-IC-NEXT: [[TMP12:%.]] = getelementptr inbounds i64, i64 [[A]], i64 [[I]]			; UNROLL-NO-IC-NEXT: [[TMP12:%.]] = getelementptr inbounds i64, i64 [[A]], i64 [[I]]
	; UNROLL-NO-IC-NEXT: [[TMP13:%.]] = load i64, i64 [[TMP12]], align 8			; UNROLL-NO-IC-NEXT: [[TMP13:%.]] = load i64, i64 [[TMP12]], align 8
	; UNROLL-NO-IC-NEXT: [[TMP14]] = add i64 [[TMP13]], [[SUM]]			; UNROLL-NO-IC-NEXT: [[TMP14]] = add i64 [[TMP13]], [[SUM]]
	; UNROLL-NO-IC-NEXT: [[I_NEXT]] = add nuw nsw i64 [[I]], 1			; UNROLL-NO-IC-NEXT: [[I_NEXT]] = add nuw nsw i64 [[I]], 1
	; UNROLL-NO-IC-NEXT: [[COND:%.*]] = icmp slt i64 [[I_NEXT]], [[N]]			; UNROLL-NO-IC-NEXT: [[COND:%.*]] = icmp slt i64 [[I_NEXT]], [[N]]
	; UNROLL-NO-IC-NEXT: br i1 [[COND]], label [[FOR_BODY]], label [[FOR_END]], !llvm.loop [[LOOP12:![0-9]+]]			; UNROLL-NO-IC-NEXT: br i1 [[COND]], label [[FOR_BODY]], label [[FOR_END]], !llvm.loop [[LOOP12:![0-9]+]]
	; UNROLL-NO-IC: for.end:			; UNROLL-NO-IC: for.end:
	; UNROLL-NO-IC-NEXT: [[TMP15:%.*]] = phi i64 [ [[TMP14]], [[FOR_BODY]] ], [ [[TMP11]], [[MIDDLE_BLOCK]] ]			; UNROLL-NO-IC-NEXT: [[TMP15:%.*]] = phi i64 [ [[TMP14]], [[FOR_BODY]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; UNROLL-NO-IC-NEXT: ret i64 [[TMP15]]			; UNROLL-NO-IC-NEXT: ret i64 [[TMP15]]
	;			;
	; INTERLEAVE-LABEL: @scalarize_induction_variable_01(			; INTERLEAVE-LABEL: @scalarize_induction_variable_01(
	; INTERLEAVE-NEXT: entry:			; INTERLEAVE-NEXT: entry:
	; INTERLEAVE-NEXT: [[SMAX:%.]] = call i64 @llvm.smax.i64(i64 [[N:%.]], i64 1)			; INTERLEAVE-NEXT: [[SMAX:%.]] = call i64 @llvm.smax.i64(i64 [[N:%.]], i64 1)
	; INTERLEAVE-NEXT: [[MIN_ITERS_CHECK:%.*]] = icmp ult i64 [[SMAX]], 8			; INTERLEAVE-NEXT: [[MIN_ITERS_CHECK:%.*]] = icmp ult i64 [[SMAX]], 8
	; INTERLEAVE-NEXT: br i1 [[MIN_ITERS_CHECK]], label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]			; INTERLEAVE-NEXT: br i1 [[MIN_ITERS_CHECK]], label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]
	; INTERLEAVE: vector.ph:			; INTERLEAVE: vector.ph:
	▲ Show 20 Lines • Show All 100 Lines • ▼ Show 20 Lines
	; CHECK-NEXT: [[TMP17:%.*]] = fadd fast <2 x float> [[VEC_PHI]], <float 1.000000e+00, float 1.000000e+00>			; CHECK-NEXT: [[TMP17:%.*]] = fadd fast <2 x float> [[VEC_PHI]], <float 1.000000e+00, float 1.000000e+00>
	; CHECK-NEXT: [[TMP18:%.*]] = fadd fast <2 x float> [[TMP17]], [[TMP10]]			; CHECK-NEXT: [[TMP18:%.*]] = fadd fast <2 x float> [[TMP17]], [[TMP10]]
	; CHECK-NEXT: [[TMP19]] = fadd fast <2 x float> [[TMP18]], [[TMP16]]			; CHECK-NEXT: [[TMP19]] = fadd fast <2 x float> [[TMP18]], [[TMP16]]
	; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 2			; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 2
	; CHECK-NEXT: [[TMP20:%.*]] = icmp eq i64 [[INDEX_NEXT]], [[N_VEC]]			; CHECK-NEXT: [[TMP20:%.*]] = icmp eq i64 [[INDEX_NEXT]], [[N_VEC]]
	; CHECK-NEXT: br i1 [[TMP20]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP13:![0-9]+]]			; CHECK-NEXT: br i1 [[TMP20]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP13:![0-9]+]]
	; CHECK: middle.block:			; CHECK: middle.block:
	; CHECK-NEXT: [[TMP21:%.*]] = call fast float @llvm.vector.reduce.fadd.v2f32(float -0.000000e+00, <2 x float> [[TMP19]])			; CHECK-NEXT: [[TMP21:%.*]] = call fast float @llvm.vector.reduce.fadd.v2f32(float -0.000000e+00, <2 x float> [[TMP19]])
				; CHECK-NEXT: [[RDX_START:%.*]] = fadd float 0.000000e+00, [[TMP21]]
	; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i64 [[TMP2]], [[N_VEC]]			; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i64 [[TMP2]], [[N_VEC]]
	; CHECK-NEXT: br i1 [[CMP_N]], label [[FOR_END:%.*]], label [[SCALAR_PH]]			; CHECK-NEXT: br i1 [[CMP_N]], label [[FOR_END:%.*]], label [[SCALAR_PH]]
	; CHECK: scalar.ph:			; CHECK: scalar.ph:
	; CHECK-NEXT: [[BC_RESUME_VAL:%.]] = phi i64 [ [[IND_END]], [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY:%.]] ]			; CHECK-NEXT: [[BC_RESUME_VAL:%.]] = phi i64 [ [[IND_END]], [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY:%.]] ]
	; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi float [ 0.000000e+00, [[ENTRY]] ], [ [[TMP21]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi float [ 0.000000e+00, [[ENTRY]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: br label [[FOR_BODY:%.*]]			; CHECK-NEXT: br label [[FOR_BODY:%.*]]
	; CHECK: for.body:			; CHECK: for.body:
	; CHECK-NEXT: [[I:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[I_NEXT:%.]], [[FOR_BODY]] ]			; CHECK-NEXT: [[I:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[I_NEXT:%.]], [[FOR_BODY]] ]
	; CHECK-NEXT: [[S:%.]] = phi float [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[TMP28:%.]], [[FOR_BODY]] ]			; CHECK-NEXT: [[S:%.]] = phi float [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[TMP28:%.]], [[FOR_BODY]] ]
	; CHECK-NEXT: [[TMP22:%.]] = getelementptr inbounds float, float [[A]], i64 [[I]]			; CHECK-NEXT: [[TMP22:%.]] = getelementptr inbounds float, float [[A]], i64 [[I]]
	; CHECK-NEXT: [[TMP23:%.]] = load float, float [[TMP22]], align 4			; CHECK-NEXT: [[TMP23:%.]] = load float, float [[TMP22]], align 4
	; CHECK-NEXT: [[TMP24:%.]] = getelementptr inbounds float, float [[B]], i64 [[I]]			; CHECK-NEXT: [[TMP24:%.]] = getelementptr inbounds float, float [[B]], i64 [[I]]
	; CHECK-NEXT: [[TMP25:%.]] = load float, float [[TMP24]], align 4			; CHECK-NEXT: [[TMP25:%.]] = load float, float [[TMP24]], align 4
	; CHECK-NEXT: [[TMP26:%.*]] = fadd fast float [[S]], 1.000000e+00			; CHECK-NEXT: [[TMP26:%.*]] = fadd fast float [[S]], 1.000000e+00
	; CHECK-NEXT: [[TMP27:%.*]] = fadd fast float [[TMP26]], [[TMP23]]			; CHECK-NEXT: [[TMP27:%.*]] = fadd fast float [[TMP26]], [[TMP23]]
	; CHECK-NEXT: [[TMP28]] = fadd fast float [[TMP27]], [[TMP25]]			; CHECK-NEXT: [[TMP28]] = fadd fast float [[TMP27]], [[TMP25]]
	; CHECK-NEXT: [[I_NEXT]] = add nuw nsw i64 [[I]], 8			; CHECK-NEXT: [[I_NEXT]] = add nuw nsw i64 [[I]], 8
	; CHECK-NEXT: [[COND:%.*]] = icmp slt i64 [[I_NEXT]], [[N]]			; CHECK-NEXT: [[COND:%.*]] = icmp slt i64 [[I_NEXT]], [[N]]
	; CHECK-NEXT: br i1 [[COND]], label [[FOR_BODY]], label [[FOR_END]], !llvm.loop [[LOOP14:![0-9]+]]			; CHECK-NEXT: br i1 [[COND]], label [[FOR_BODY]], label [[FOR_END]], !llvm.loop [[LOOP14:![0-9]+]]
	; CHECK: for.end:			; CHECK: for.end:
	; CHECK-NEXT: [[S_LCSSA:%.*]] = phi float [ [[TMP28]], [[FOR_BODY]] ], [ [[TMP21]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[S_LCSSA:%.*]] = phi float [ [[TMP28]], [[FOR_BODY]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: ret float [[S_LCSSA]]			; CHECK-NEXT: ret float [[S_LCSSA]]
	;			;
	; IND-LABEL: @scalarize_induction_variable_02(			; IND-LABEL: @scalarize_induction_variable_02(
	; IND-NEXT: entry:			; IND-NEXT: entry:
	; IND-NEXT: [[SMAX:%.]] = call i64 @llvm.smax.i64(i64 [[N:%.]], i64 8)			; IND-NEXT: [[SMAX:%.]] = call i64 @llvm.smax.i64(i64 [[N:%.]], i64 8)
	; IND-NEXT: [[TMP0:%.*]] = add nsw i64 [[SMAX]], -1			; IND-NEXT: [[TMP0:%.*]] = add nsw i64 [[SMAX]], -1
	; IND-NEXT: [[TMP1:%.*]] = lshr i64 [[TMP0]], 3			; IND-NEXT: [[TMP1:%.*]] = lshr i64 [[TMP0]], 3
	; IND-NEXT: [[TMP2:%.*]] = add nuw nsw i64 [[TMP1]], 1			; IND-NEXT: [[TMP2:%.*]] = add nuw nsw i64 [[TMP1]], 1
	Show All 23 Lines
	; IND-NEXT: [[TMP16:%.*]] = fadd fast <2 x float> [[VEC_PHI]], <float 1.000000e+00, float 1.000000e+00>			; IND-NEXT: [[TMP16:%.*]] = fadd fast <2 x float> [[VEC_PHI]], <float 1.000000e+00, float 1.000000e+00>
	; IND-NEXT: [[TMP17:%.*]] = fadd fast <2 x float> [[TMP16]], [[TMP9]]			; IND-NEXT: [[TMP17:%.*]] = fadd fast <2 x float> [[TMP16]], [[TMP9]]
	; IND-NEXT: [[TMP18]] = fadd fast <2 x float> [[TMP17]], [[TMP15]]			; IND-NEXT: [[TMP18]] = fadd fast <2 x float> [[TMP17]], [[TMP15]]
	; IND-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 2			; IND-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 2
	; IND-NEXT: [[TMP19:%.*]] = icmp eq i64 [[INDEX_NEXT]], [[N_VEC]]			; IND-NEXT: [[TMP19:%.*]] = icmp eq i64 [[INDEX_NEXT]], [[N_VEC]]
	; IND-NEXT: br i1 [[TMP19]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP13:![0-9]+]]			; IND-NEXT: br i1 [[TMP19]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP13:![0-9]+]]
	; IND: middle.block:			; IND: middle.block:
	; IND-NEXT: [[TMP20:%.*]] = call fast float @llvm.vector.reduce.fadd.v2f32(float -0.000000e+00, <2 x float> [[TMP18]])			; IND-NEXT: [[TMP20:%.*]] = call fast float @llvm.vector.reduce.fadd.v2f32(float -0.000000e+00, <2 x float> [[TMP18]])
				; IND-NEXT: [[RDX_START:%.*]] = fadd float [[TMP20]], 0.000000e+00
	; IND-NEXT: [[CMP_N:%.*]] = icmp eq i64 [[TMP2]], [[N_VEC]]			; IND-NEXT: [[CMP_N:%.*]] = icmp eq i64 [[TMP2]], [[N_VEC]]
	; IND-NEXT: br i1 [[CMP_N]], label [[FOR_END:%.*]], label [[SCALAR_PH]]			; IND-NEXT: br i1 [[CMP_N]], label [[FOR_END:%.*]], label [[SCALAR_PH]]
	; IND: scalar.ph:			; IND: scalar.ph:
	; IND-NEXT: [[BC_RESUME_VAL:%.]] = phi i64 [ [[IND_END]], [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY:%.]] ]			; IND-NEXT: [[BC_RESUME_VAL:%.]] = phi i64 [ [[IND_END]], [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY:%.]] ]
	; IND-NEXT: [[BC_MERGE_RDX:%.*]] = phi float [ [[TMP20]], [[MIDDLE_BLOCK]] ], [ 0.000000e+00, [[ENTRY]] ]			; IND-NEXT: [[BC_MERGE_RDX:%.*]] = phi float [ [[RDX_START]], [[MIDDLE_BLOCK]] ], [ 0.000000e+00, [[ENTRY]] ]
	; IND-NEXT: br label [[FOR_BODY:%.*]]			; IND-NEXT: br label [[FOR_BODY:%.*]]
	; IND: for.body:			; IND: for.body:
	; IND-NEXT: [[I:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[I_NEXT:%.]], [[FOR_BODY]] ]			; IND-NEXT: [[I:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[I_NEXT:%.]], [[FOR_BODY]] ]
	; IND-NEXT: [[S:%.]] = phi float [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[TMP27:%.]], [[FOR_BODY]] ]			; IND-NEXT: [[S:%.]] = phi float [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[TMP27:%.]], [[FOR_BODY]] ]
	; IND-NEXT: [[TMP21:%.]] = getelementptr inbounds float, float [[A]], i64 [[I]]			; IND-NEXT: [[TMP21:%.]] = getelementptr inbounds float, float [[A]], i64 [[I]]
	; IND-NEXT: [[TMP22:%.]] = load float, float [[TMP21]], align 4			; IND-NEXT: [[TMP22:%.]] = load float, float [[TMP21]], align 4
	; IND-NEXT: [[TMP23:%.]] = getelementptr inbounds float, float [[B]], i64 [[I]]			; IND-NEXT: [[TMP23:%.]] = getelementptr inbounds float, float [[B]], i64 [[I]]
	; IND-NEXT: [[TMP24:%.]] = load float, float [[TMP23]], align 4			; IND-NEXT: [[TMP24:%.]] = load float, float [[TMP23]], align 4
	; IND-NEXT: [[TMP25:%.*]] = fadd fast float [[S]], 1.000000e+00			; IND-NEXT: [[TMP25:%.*]] = fadd fast float [[S]], 1.000000e+00
	; IND-NEXT: [[TMP26:%.*]] = fadd fast float [[TMP25]], [[TMP22]]			; IND-NEXT: [[TMP26:%.*]] = fadd fast float [[TMP25]], [[TMP22]]
	; IND-NEXT: [[TMP27]] = fadd fast float [[TMP26]], [[TMP24]]			; IND-NEXT: [[TMP27]] = fadd fast float [[TMP26]], [[TMP24]]
	; IND-NEXT: [[I_NEXT]] = add nuw nsw i64 [[I]], 8			; IND-NEXT: [[I_NEXT]] = add nuw nsw i64 [[I]], 8
	; IND-NEXT: [[COND:%.*]] = icmp slt i64 [[I_NEXT]], [[N]]			; IND-NEXT: [[COND:%.*]] = icmp slt i64 [[I_NEXT]], [[N]]
	; IND-NEXT: br i1 [[COND]], label [[FOR_BODY]], label [[FOR_END]], !llvm.loop [[LOOP14:![0-9]+]]			; IND-NEXT: br i1 [[COND]], label [[FOR_BODY]], label [[FOR_END]], !llvm.loop [[LOOP14:![0-9]+]]
	; IND: for.end:			; IND: for.end:
	; IND-NEXT: [[S_LCSSA:%.*]] = phi float [ [[TMP27]], [[FOR_BODY]] ], [ [[TMP20]], [[MIDDLE_BLOCK]] ]			; IND-NEXT: [[S_LCSSA:%.*]] = phi float [ [[TMP27]], [[FOR_BODY]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; IND-NEXT: ret float [[S_LCSSA]]			; IND-NEXT: ret float [[S_LCSSA]]
	;			;
	; UNROLL-LABEL: @scalarize_induction_variable_02(			; UNROLL-LABEL: @scalarize_induction_variable_02(
	; UNROLL-NEXT: entry:			; UNROLL-NEXT: entry:
	; UNROLL-NEXT: [[SMAX:%.]] = call i64 @llvm.smax.i64(i64 [[N:%.]], i64 8)			; UNROLL-NEXT: [[SMAX:%.]] = call i64 @llvm.smax.i64(i64 [[N:%.]], i64 8)
	; UNROLL-NEXT: [[TMP0:%.*]] = add nsw i64 [[SMAX]], -1			; UNROLL-NEXT: [[TMP0:%.*]] = add nsw i64 [[SMAX]], -1
	; UNROLL-NEXT: [[TMP1:%.*]] = lshr i64 [[TMP0]], 3			; UNROLL-NEXT: [[TMP1:%.*]] = lshr i64 [[TMP0]], 3
	; UNROLL-NEXT: [[TMP2:%.*]] = add nuw nsw i64 [[TMP1]], 1			; UNROLL-NEXT: [[TMP2:%.*]] = add nuw nsw i64 [[TMP1]], 1
	▲ Show 20 Lines • Show All 42 Lines • ▼ Show 20 Lines
	; UNROLL-NEXT: [[TMP34]] = fadd fast <2 x float> [[TMP32]], [[TMP25]]			; UNROLL-NEXT: [[TMP34]] = fadd fast <2 x float> [[TMP32]], [[TMP25]]
	; UNROLL-NEXT: [[TMP35]] = fadd fast <2 x float> [[TMP33]], [[TMP29]]			; UNROLL-NEXT: [[TMP35]] = fadd fast <2 x float> [[TMP33]], [[TMP29]]
	; UNROLL-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 4			; UNROLL-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 4
	; UNROLL-NEXT: [[TMP36:%.*]] = icmp eq i64 [[INDEX_NEXT]], [[N_VEC]]			; UNROLL-NEXT: [[TMP36:%.*]] = icmp eq i64 [[INDEX_NEXT]], [[N_VEC]]
	; UNROLL-NEXT: br i1 [[TMP36]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP13:![0-9]+]]			; UNROLL-NEXT: br i1 [[TMP36]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP13:![0-9]+]]
	; UNROLL: middle.block:			; UNROLL: middle.block:
	; UNROLL-NEXT: [[BIN_RDX:%.*]] = fadd fast <2 x float> [[TMP35]], [[TMP34]]			; UNROLL-NEXT: [[BIN_RDX:%.*]] = fadd fast <2 x float> [[TMP35]], [[TMP34]]
	; UNROLL-NEXT: [[TMP37:%.*]] = call fast float @llvm.vector.reduce.fadd.v2f32(float -0.000000e+00, <2 x float> [[BIN_RDX]])			; UNROLL-NEXT: [[TMP37:%.*]] = call fast float @llvm.vector.reduce.fadd.v2f32(float -0.000000e+00, <2 x float> [[BIN_RDX]])
				; UNROLL-NEXT: [[RDX_START:%.*]] = fadd float [[TMP37]], 0.000000e+00
	; UNROLL-NEXT: [[CMP_N:%.*]] = icmp eq i64 [[TMP2]], [[N_VEC]]			; UNROLL-NEXT: [[CMP_N:%.*]] = icmp eq i64 [[TMP2]], [[N_VEC]]
	; UNROLL-NEXT: br i1 [[CMP_N]], label [[FOR_END:%.*]], label [[SCALAR_PH]]			; UNROLL-NEXT: br i1 [[CMP_N]], label [[FOR_END:%.*]], label [[SCALAR_PH]]
	; UNROLL: scalar.ph:			; UNROLL: scalar.ph:
	; UNROLL-NEXT: [[BC_RESUME_VAL:%.]] = phi i64 [ [[IND_END]], [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY:%.]] ]			; UNROLL-NEXT: [[BC_RESUME_VAL:%.]] = phi i64 [ [[IND_END]], [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY:%.]] ]
	; UNROLL-NEXT: [[BC_MERGE_RDX:%.*]] = phi float [ [[TMP37]], [[MIDDLE_BLOCK]] ], [ 0.000000e+00, [[ENTRY]] ]			; UNROLL-NEXT: [[BC_MERGE_RDX:%.*]] = phi float [ [[RDX_START]], [[MIDDLE_BLOCK]] ], [ 0.000000e+00, [[ENTRY]] ]
	; UNROLL-NEXT: br label [[FOR_BODY:%.*]]			; UNROLL-NEXT: br label [[FOR_BODY:%.*]]
	; UNROLL: for.body:			; UNROLL: for.body:
	; UNROLL-NEXT: [[I:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[I_NEXT:%.]], [[FOR_BODY]] ]			; UNROLL-NEXT: [[I:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[I_NEXT:%.]], [[FOR_BODY]] ]
	; UNROLL-NEXT: [[S:%.]] = phi float [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[TMP44:%.]], [[FOR_BODY]] ]			; UNROLL-NEXT: [[S:%.]] = phi float [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[TMP44:%.]], [[FOR_BODY]] ]
	; UNROLL-NEXT: [[TMP38:%.]] = getelementptr inbounds float, float [[A]], i64 [[I]]			; UNROLL-NEXT: [[TMP38:%.]] = getelementptr inbounds float, float [[A]], i64 [[I]]
	; UNROLL-NEXT: [[TMP39:%.]] = load float, float [[TMP38]], align 4			; UNROLL-NEXT: [[TMP39:%.]] = load float, float [[TMP38]], align 4
	; UNROLL-NEXT: [[TMP40:%.]] = getelementptr inbounds float, float [[B]], i64 [[I]]			; UNROLL-NEXT: [[TMP40:%.]] = getelementptr inbounds float, float [[B]], i64 [[I]]
	; UNROLL-NEXT: [[TMP41:%.]] = load float, float [[TMP40]], align 4			; UNROLL-NEXT: [[TMP41:%.]] = load float, float [[TMP40]], align 4
	; UNROLL-NEXT: [[TMP42:%.*]] = fadd fast float [[S]], 1.000000e+00			; UNROLL-NEXT: [[TMP42:%.*]] = fadd fast float [[S]], 1.000000e+00
	; UNROLL-NEXT: [[TMP43:%.*]] = fadd fast float [[TMP42]], [[TMP39]]			; UNROLL-NEXT: [[TMP43:%.*]] = fadd fast float [[TMP42]], [[TMP39]]
	; UNROLL-NEXT: [[TMP44]] = fadd fast float [[TMP43]], [[TMP41]]			; UNROLL-NEXT: [[TMP44]] = fadd fast float [[TMP43]], [[TMP41]]
	; UNROLL-NEXT: [[I_NEXT]] = add nuw nsw i64 [[I]], 8			; UNROLL-NEXT: [[I_NEXT]] = add nuw nsw i64 [[I]], 8
	; UNROLL-NEXT: [[COND:%.*]] = icmp slt i64 [[I_NEXT]], [[N]]			; UNROLL-NEXT: [[COND:%.*]] = icmp slt i64 [[I_NEXT]], [[N]]
	; UNROLL-NEXT: br i1 [[COND]], label [[FOR_BODY]], label [[FOR_END]], !llvm.loop [[LOOP14:![0-9]+]]			; UNROLL-NEXT: br i1 [[COND]], label [[FOR_BODY]], label [[FOR_END]], !llvm.loop [[LOOP14:![0-9]+]]
	; UNROLL: for.end:			; UNROLL: for.end:
	; UNROLL-NEXT: [[S_LCSSA:%.*]] = phi float [ [[TMP44]], [[FOR_BODY]] ], [ [[TMP37]], [[MIDDLE_BLOCK]] ]			; UNROLL-NEXT: [[S_LCSSA:%.*]] = phi float [ [[TMP44]], [[FOR_BODY]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; UNROLL-NEXT: ret float [[S_LCSSA]]			; UNROLL-NEXT: ret float [[S_LCSSA]]
	;			;
	; UNROLL-NO-IC-LABEL: @scalarize_induction_variable_02(			; UNROLL-NO-IC-LABEL: @scalarize_induction_variable_02(
	; UNROLL-NO-IC-NEXT: entry:			; UNROLL-NO-IC-NEXT: entry:
	; UNROLL-NO-IC-NEXT: [[SMAX:%.]] = call i64 @llvm.smax.i64(i64 [[N:%.]], i64 8)			; UNROLL-NO-IC-NEXT: [[SMAX:%.]] = call i64 @llvm.smax.i64(i64 [[N:%.]], i64 8)
	; UNROLL-NO-IC-NEXT: [[TMP0:%.*]] = add nsw i64 [[SMAX]], -1			; UNROLL-NO-IC-NEXT: [[TMP0:%.*]] = add nsw i64 [[SMAX]], -1
	; UNROLL-NO-IC-NEXT: [[TMP1:%.*]] = lshr i64 [[TMP0]], 3			; UNROLL-NO-IC-NEXT: [[TMP1:%.*]] = lshr i64 [[TMP0]], 3
	; UNROLL-NO-IC-NEXT: [[TMP2:%.*]] = add nuw nsw i64 [[TMP1]], 1			; UNROLL-NO-IC-NEXT: [[TMP2:%.*]] = add nuw nsw i64 [[TMP1]], 1
	▲ Show 20 Lines • Show All 44 Lines • ▼ Show 20 Lines
	; UNROLL-NO-IC-NEXT: [[TMP35]] = fadd fast <2 x float> [[TMP33]], [[TMP26]]			; UNROLL-NO-IC-NEXT: [[TMP35]] = fadd fast <2 x float> [[TMP33]], [[TMP26]]
	; UNROLL-NO-IC-NEXT: [[TMP36]] = fadd fast <2 x float> [[TMP34]], [[TMP30]]			; UNROLL-NO-IC-NEXT: [[TMP36]] = fadd fast <2 x float> [[TMP34]], [[TMP30]]
	; UNROLL-NO-IC-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 4			; UNROLL-NO-IC-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 4
	; UNROLL-NO-IC-NEXT: [[TMP37:%.*]] = icmp eq i64 [[INDEX_NEXT]], [[N_VEC]]			; UNROLL-NO-IC-NEXT: [[TMP37:%.*]] = icmp eq i64 [[INDEX_NEXT]], [[N_VEC]]
	; UNROLL-NO-IC-NEXT: br i1 [[TMP37]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP13:![0-9]+]]			; UNROLL-NO-IC-NEXT: br i1 [[TMP37]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP13:![0-9]+]]
	; UNROLL-NO-IC: middle.block:			; UNROLL-NO-IC: middle.block:
	; UNROLL-NO-IC-NEXT: [[BIN_RDX:%.*]] = fadd fast <2 x float> [[TMP36]], [[TMP35]]			; UNROLL-NO-IC-NEXT: [[BIN_RDX:%.*]] = fadd fast <2 x float> [[TMP36]], [[TMP35]]
	; UNROLL-NO-IC-NEXT: [[TMP38:%.*]] = call fast float @llvm.vector.reduce.fadd.v2f32(float -0.000000e+00, <2 x float> [[BIN_RDX]])			; UNROLL-NO-IC-NEXT: [[TMP38:%.*]] = call fast float @llvm.vector.reduce.fadd.v2f32(float -0.000000e+00, <2 x float> [[BIN_RDX]])
				; UNROLL-NO-IC-NEXT: [[RDX_START:%.*]] = fadd float 0.000000e+00, [[TMP38]]
	; UNROLL-NO-IC-NEXT: [[CMP_N:%.*]] = icmp eq i64 [[TMP2]], [[N_VEC]]			; UNROLL-NO-IC-NEXT: [[CMP_N:%.*]] = icmp eq i64 [[TMP2]], [[N_VEC]]
	; UNROLL-NO-IC-NEXT: br i1 [[CMP_N]], label [[FOR_END:%.*]], label [[SCALAR_PH]]			; UNROLL-NO-IC-NEXT: br i1 [[CMP_N]], label [[FOR_END:%.*]], label [[SCALAR_PH]]
	; UNROLL-NO-IC: scalar.ph:			; UNROLL-NO-IC: scalar.ph:
	; UNROLL-NO-IC-NEXT: [[BC_RESUME_VAL:%.]] = phi i64 [ [[IND_END]], [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY:%.]] ]			; UNROLL-NO-IC-NEXT: [[BC_RESUME_VAL:%.]] = phi i64 [ [[IND_END]], [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY:%.]] ]
	; UNROLL-NO-IC-NEXT: [[BC_MERGE_RDX:%.*]] = phi float [ 0.000000e+00, [[ENTRY]] ], [ [[TMP38]], [[MIDDLE_BLOCK]] ]			; UNROLL-NO-IC-NEXT: [[BC_MERGE_RDX:%.*]] = phi float [ 0.000000e+00, [[ENTRY]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; UNROLL-NO-IC-NEXT: br label [[FOR_BODY:%.*]]			; UNROLL-NO-IC-NEXT: br label [[FOR_BODY:%.*]]
	; UNROLL-NO-IC: for.body:			; UNROLL-NO-IC: for.body:
	; UNROLL-NO-IC-NEXT: [[I:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[I_NEXT:%.]], [[FOR_BODY]] ]			; UNROLL-NO-IC-NEXT: [[I:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[I_NEXT:%.]], [[FOR_BODY]] ]
	; UNROLL-NO-IC-NEXT: [[S:%.]] = phi float [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[TMP45:%.]], [[FOR_BODY]] ]			; UNROLL-NO-IC-NEXT: [[S:%.]] = phi float [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[TMP45:%.]], [[FOR_BODY]] ]
	; UNROLL-NO-IC-NEXT: [[TMP39:%.]] = getelementptr inbounds float, float [[A]], i64 [[I]]			; UNROLL-NO-IC-NEXT: [[TMP39:%.]] = getelementptr inbounds float, float [[A]], i64 [[I]]
	; UNROLL-NO-IC-NEXT: [[TMP40:%.]] = load float, float [[TMP39]], align 4			; UNROLL-NO-IC-NEXT: [[TMP40:%.]] = load float, float [[TMP39]], align 4
	; UNROLL-NO-IC-NEXT: [[TMP41:%.]] = getelementptr inbounds float, float [[B]], i64 [[I]]			; UNROLL-NO-IC-NEXT: [[TMP41:%.]] = getelementptr inbounds float, float [[B]], i64 [[I]]
	; UNROLL-NO-IC-NEXT: [[TMP42:%.]] = load float, float [[TMP41]], align 4			; UNROLL-NO-IC-NEXT: [[TMP42:%.]] = load float, float [[TMP41]], align 4
	; UNROLL-NO-IC-NEXT: [[TMP43:%.*]] = fadd fast float [[S]], 1.000000e+00			; UNROLL-NO-IC-NEXT: [[TMP43:%.*]] = fadd fast float [[S]], 1.000000e+00
	; UNROLL-NO-IC-NEXT: [[TMP44:%.*]] = fadd fast float [[TMP43]], [[TMP40]]			; UNROLL-NO-IC-NEXT: [[TMP44:%.*]] = fadd fast float [[TMP43]], [[TMP40]]
	; UNROLL-NO-IC-NEXT: [[TMP45]] = fadd fast float [[TMP44]], [[TMP42]]			; UNROLL-NO-IC-NEXT: [[TMP45]] = fadd fast float [[TMP44]], [[TMP42]]
	; UNROLL-NO-IC-NEXT: [[I_NEXT]] = add nuw nsw i64 [[I]], 8			; UNROLL-NO-IC-NEXT: [[I_NEXT]] = add nuw nsw i64 [[I]], 8
	; UNROLL-NO-IC-NEXT: [[COND:%.*]] = icmp slt i64 [[I_NEXT]], [[N]]			; UNROLL-NO-IC-NEXT: [[COND:%.*]] = icmp slt i64 [[I_NEXT]], [[N]]
	; UNROLL-NO-IC-NEXT: br i1 [[COND]], label [[FOR_BODY]], label [[FOR_END]], !llvm.loop [[LOOP14:![0-9]+]]			; UNROLL-NO-IC-NEXT: br i1 [[COND]], label [[FOR_BODY]], label [[FOR_END]], !llvm.loop [[LOOP14:![0-9]+]]
	; UNROLL-NO-IC: for.end:			; UNROLL-NO-IC: for.end:
	; UNROLL-NO-IC-NEXT: [[S_LCSSA:%.*]] = phi float [ [[TMP45]], [[FOR_BODY]] ], [ [[TMP38]], [[MIDDLE_BLOCK]] ]			; UNROLL-NO-IC-NEXT: [[S_LCSSA:%.*]] = phi float [ [[TMP45]], [[FOR_BODY]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; UNROLL-NO-IC-NEXT: ret float [[S_LCSSA]]			; UNROLL-NO-IC-NEXT: ret float [[S_LCSSA]]
	;			;
	; INTERLEAVE-LABEL: @scalarize_induction_variable_02(			; INTERLEAVE-LABEL: @scalarize_induction_variable_02(
	; INTERLEAVE-NEXT: entry:			; INTERLEAVE-NEXT: entry:
	; INTERLEAVE-NEXT: [[SMAX:%.]] = call i64 @llvm.smax.i64(i64 [[N:%.]], i64 8)			; INTERLEAVE-NEXT: [[SMAX:%.]] = call i64 @llvm.smax.i64(i64 [[N:%.]], i64 8)
	; INTERLEAVE-NEXT: [[TMP0:%.*]] = add nsw i64 [[SMAX]], -1			; INTERLEAVE-NEXT: [[TMP0:%.*]] = add nsw i64 [[SMAX]], -1
	; INTERLEAVE-NEXT: [[MIN_ITERS_CHECK:%.*]] = icmp ult i64 [[TMP0]], 64			; INTERLEAVE-NEXT: [[MIN_ITERS_CHECK:%.*]] = icmp ult i64 [[TMP0]], 64
	; INTERLEAVE-NEXT: br i1 [[MIN_ITERS_CHECK]], label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]			; INTERLEAVE-NEXT: br i1 [[MIN_ITERS_CHECK]], label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]
	Show All 35 Lines
	; INTERLEAVE-NEXT: [[TMP18]] = fadd fast <4 x float> [[TMP16]], [[STRIDED_VEC6]]			; INTERLEAVE-NEXT: [[TMP18]] = fadd fast <4 x float> [[TMP16]], [[STRIDED_VEC6]]
	; INTERLEAVE-NEXT: [[TMP19]] = fadd fast <4 x float> [[TMP17]], [[STRIDED_VEC7]]			; INTERLEAVE-NEXT: [[TMP19]] = fadd fast <4 x float> [[TMP17]], [[STRIDED_VEC7]]
	; INTERLEAVE-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 8			; INTERLEAVE-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 8
	; INTERLEAVE-NEXT: [[TMP20:%.*]] = icmp eq i64 [[INDEX_NEXT]], [[N_VEC]]			; INTERLEAVE-NEXT: [[TMP20:%.*]] = icmp eq i64 [[INDEX_NEXT]], [[N_VEC]]
	; INTERLEAVE-NEXT: br i1 [[TMP20]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP13:![0-9]+]]			; INTERLEAVE-NEXT: br i1 [[TMP20]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP13:![0-9]+]]
	; INTERLEAVE: middle.block:			; INTERLEAVE: middle.block:
	; INTERLEAVE-NEXT: [[BIN_RDX:%.*]] = fadd fast <4 x float> [[TMP19]], [[TMP18]]			; INTERLEAVE-NEXT: [[BIN_RDX:%.*]] = fadd fast <4 x float> [[TMP19]], [[TMP18]]
	; INTERLEAVE-NEXT: [[TMP21:%.*]] = call fast float @llvm.vector.reduce.fadd.v4f32(float -0.000000e+00, <4 x float> [[BIN_RDX]])			; INTERLEAVE-NEXT: [[TMP21:%.*]] = call fast float @llvm.vector.reduce.fadd.v4f32(float -0.000000e+00, <4 x float> [[BIN_RDX]])
				; INTERLEAVE-NEXT: [[RDX_START:%.*]] = fadd float [[TMP21]], 0.000000e+00
	; INTERLEAVE-NEXT: br label [[SCALAR_PH]]			; INTERLEAVE-NEXT: br label [[SCALAR_PH]]
	; INTERLEAVE: scalar.ph:			; INTERLEAVE: scalar.ph:
	; INTERLEAVE-NEXT: [[BC_RESUME_VAL:%.]] = phi i64 [ [[IND_END]], [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY:%.]] ]			; INTERLEAVE-NEXT: [[BC_RESUME_VAL:%.]] = phi i64 [ [[IND_END]], [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY:%.]] ]
	; INTERLEAVE-NEXT: [[BC_MERGE_RDX:%.*]] = phi float [ [[TMP21]], [[MIDDLE_BLOCK]] ], [ 0.000000e+00, [[ENTRY]] ]			; INTERLEAVE-NEXT: [[BC_MERGE_RDX:%.*]] = phi float [ [[RDX_START]], [[MIDDLE_BLOCK]] ], [ 0.000000e+00, [[ENTRY]] ]
	; INTERLEAVE-NEXT: br label [[FOR_BODY:%.*]]			; INTERLEAVE-NEXT: br label [[FOR_BODY:%.*]]
	; INTERLEAVE: for.body:			; INTERLEAVE: for.body:
	; INTERLEAVE-NEXT: [[I:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[I_NEXT:%.]], [[FOR_BODY]] ]			; INTERLEAVE-NEXT: [[I:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[I_NEXT:%.]], [[FOR_BODY]] ]
	; INTERLEAVE-NEXT: [[S:%.]] = phi float [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[TMP28:%.]], [[FOR_BODY]] ]			; INTERLEAVE-NEXT: [[S:%.]] = phi float [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[TMP28:%.]], [[FOR_BODY]] ]
	; INTERLEAVE-NEXT: [[TMP22:%.]] = getelementptr inbounds float, float [[A]], i64 [[I]]			; INTERLEAVE-NEXT: [[TMP22:%.]] = getelementptr inbounds float, float [[A]], i64 [[I]]
	; INTERLEAVE-NEXT: [[TMP23:%.]] = load float, float [[TMP22]], align 4			; INTERLEAVE-NEXT: [[TMP23:%.]] = load float, float [[TMP22]], align 4
	; INTERLEAVE-NEXT: [[TMP24:%.]] = getelementptr inbounds float, float [[B]], i64 [[I]]			; INTERLEAVE-NEXT: [[TMP24:%.]] = getelementptr inbounds float, float [[B]], i64 [[I]]
	; INTERLEAVE-NEXT: [[TMP25:%.]] = load float, float [[TMP24]], align 4			; INTERLEAVE-NEXT: [[TMP25:%.]] = load float, float [[TMP24]], align 4
	▲ Show 20 Lines • Show All 806 Lines • ▼ Show 20 Lines
	; CHECK-NEXT: [[TMP15:%.*]] = xor <2 x i1> [[BROADCAST_SPLAT]], <i1 true, i1 true>			; CHECK-NEXT: [[TMP15:%.*]] = xor <2 x i1> [[BROADCAST_SPLAT]], <i1 true, i1 true>
	; CHECK-NEXT: [[PREDPHI:%.*]] = select <2 x i1> [[TMP15]], <2 x i32> [[WIDE_LOAD]], <2 x i32> [[TMP14]]			; CHECK-NEXT: [[PREDPHI:%.*]] = select <2 x i1> [[TMP15]], <2 x i32> [[WIDE_LOAD]], <2 x i32> [[TMP14]]
	; CHECK-NEXT: [[TMP16]] = add <2 x i32> [[PREDPHI]], [[VEC_PHI]]			; CHECK-NEXT: [[TMP16]] = add <2 x i32> [[PREDPHI]], [[VEC_PHI]]
	; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i32 [[INDEX]], 2			; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i32 [[INDEX]], 2
	; CHECK-NEXT: [[TMP17:%.*]] = icmp eq i32 [[INDEX_NEXT]], [[N_VEC]]			; CHECK-NEXT: [[TMP17:%.*]] = icmp eq i32 [[INDEX_NEXT]], [[N_VEC]]
	; CHECK-NEXT: br i1 [[TMP17]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP24:![0-9]+]]			; CHECK-NEXT: br i1 [[TMP17]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP24:![0-9]+]]
	; CHECK: middle.block:			; CHECK: middle.block:
	; CHECK-NEXT: [[TMP18:%.*]] = call i32 @llvm.vector.reduce.add.v2i32(<2 x i32> [[TMP16]])			; CHECK-NEXT: [[TMP18:%.*]] = call i32 @llvm.vector.reduce.add.v2i32(<2 x i32> [[TMP16]])
				; CHECK-NEXT: [[RDX_START:%.*]] = add i32 0, [[TMP18]]
	; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i32 [[SMAX]], [[N_VEC]]			; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i32 [[SMAX]], [[N_VEC]]
	; CHECK-NEXT: br i1 [[CMP_N]], label [[FOR_END:%.*]], label [[SCALAR_PH]]			; CHECK-NEXT: br i1 [[CMP_N]], label [[FOR_END:%.*]], label [[SCALAR_PH]]
	; CHECK: scalar.ph:			; CHECK: scalar.ph:
	; CHECK-NEXT: [[BC_RESUME_VAL:%.]] = phi i32 [ [[N_VEC]], [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY:%.]] ]			; CHECK-NEXT: [[BC_RESUME_VAL:%.]] = phi i32 [ [[N_VEC]], [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY:%.]] ]
	; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 0, [[ENTRY]] ], [ [[TMP18]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 0, [[ENTRY]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: br label [[FOR_BODY:%.*]]			; CHECK-NEXT: br label [[FOR_BODY:%.*]]
	; CHECK: for.body:			; CHECK: for.body:
	; CHECK-NEXT: [[I:%.]] = phi i32 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[I_NEXT:%.]], [[IF_END:%.*]] ]			; CHECK-NEXT: [[I:%.]] = phi i32 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[I_NEXT:%.]], [[IF_END:%.*]] ]
	; CHECK-NEXT: [[SUM:%.]] = phi i32 [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[VAR4:%.]], [[IF_END]] ]			; CHECK-NEXT: [[SUM:%.]] = phi i32 [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[VAR4:%.]], [[IF_END]] ]
	; CHECK-NEXT: [[VAR0:%.]] = getelementptr inbounds i32, i32 [[A]], i32 [[I]]			; CHECK-NEXT: [[VAR0:%.]] = getelementptr inbounds i32, i32 [[A]], i32 [[I]]
	; CHECK-NEXT: [[VAR1:%.]] = load i32, i32 [[VAR0]], align 4			; CHECK-NEXT: [[VAR1:%.]] = load i32, i32 [[VAR0]], align 4
	; CHECK-NEXT: br i1 [[C]], label [[IF_THEN:%.*]], label [[IF_END]]			; CHECK-NEXT: br i1 [[C]], label [[IF_THEN:%.*]], label [[IF_END]]
	; CHECK: if.then:			; CHECK: if.then:
	; CHECK-NEXT: [[VAR2:%.*]] = udiv i32 [[VAR1]], [[I]]			; CHECK-NEXT: [[VAR2:%.*]] = udiv i32 [[VAR1]], [[I]]
	; CHECK-NEXT: br label [[IF_END]]			; CHECK-NEXT: br label [[IF_END]]
	; CHECK: if.end:			; CHECK: if.end:
	; CHECK-NEXT: [[VAR3:%.*]] = phi i32 [ [[VAR2]], [[IF_THEN]] ], [ [[VAR1]], [[FOR_BODY]] ]			; CHECK-NEXT: [[VAR3:%.*]] = phi i32 [ [[VAR2]], [[IF_THEN]] ], [ [[VAR1]], [[FOR_BODY]] ]
	; CHECK-NEXT: [[VAR4]] = add i32 [[VAR3]], [[SUM]]			; CHECK-NEXT: [[VAR4]] = add i32 [[VAR3]], [[SUM]]
	; CHECK-NEXT: [[I_NEXT]] = add nuw nsw i32 [[I]], 1			; CHECK-NEXT: [[I_NEXT]] = add nuw nsw i32 [[I]], 1
	; CHECK-NEXT: [[COND:%.*]] = icmp slt i32 [[I_NEXT]], [[N]]			; CHECK-NEXT: [[COND:%.*]] = icmp slt i32 [[I_NEXT]], [[N]]
	; CHECK-NEXT: br i1 [[COND]], label [[FOR_BODY]], label [[FOR_END]], !llvm.loop [[LOOP25:![0-9]+]]			; CHECK-NEXT: br i1 [[COND]], label [[FOR_BODY]], label [[FOR_END]], !llvm.loop [[LOOP25:![0-9]+]]
	; CHECK: for.end:			; CHECK: for.end:
	; CHECK-NEXT: [[VAR5:%.*]] = phi i32 [ [[VAR4]], [[IF_END]] ], [ [[TMP18]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[VAR5:%.*]] = phi i32 [ [[VAR4]], [[IF_END]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: ret i32 [[VAR5]]			; CHECK-NEXT: ret i32 [[VAR5]]
	;			;
	; IND-LABEL: @scalarize_induction_variable_05(			; IND-LABEL: @scalarize_induction_variable_05(
	; IND-NEXT: entry:			; IND-NEXT: entry:
	; IND-NEXT: [[SMAX:%.]] = call i32 @llvm.smax.i32(i32 [[N:%.]], i32 1)			; IND-NEXT: [[SMAX:%.]] = call i32 @llvm.smax.i32(i32 [[N:%.]], i32 1)
	; IND-NEXT: [[MIN_ITERS_CHECK:%.*]] = icmp ult i32 [[SMAX]], 2			; IND-NEXT: [[MIN_ITERS_CHECK:%.*]] = icmp ult i32 [[SMAX]], 2
	; IND-NEXT: br i1 [[MIN_ITERS_CHECK]], label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]			; IND-NEXT: br i1 [[MIN_ITERS_CHECK]], label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]
	; IND: vector.ph:			; IND: vector.ph:
	▲ Show 20 Lines • Show All 227 Lines • ▼ Show 20 Lines
	; UNROLL-NO-IC-NEXT: [[TMP32]] = add <2 x i32> [[PREDPHI]], [[VEC_PHI]]			; UNROLL-NO-IC-NEXT: [[TMP32]] = add <2 x i32> [[PREDPHI]], [[VEC_PHI]]
	; UNROLL-NO-IC-NEXT: [[TMP33]] = add <2 x i32> [[PREDPHI11]], [[VEC_PHI1]]			; UNROLL-NO-IC-NEXT: [[TMP33]] = add <2 x i32> [[PREDPHI11]], [[VEC_PHI1]]
	; UNROLL-NO-IC-NEXT: [[INDEX_NEXT]] = add nuw i32 [[INDEX]], 4			; UNROLL-NO-IC-NEXT: [[INDEX_NEXT]] = add nuw i32 [[INDEX]], 4
	; UNROLL-NO-IC-NEXT: [[TMP34:%.*]] = icmp eq i32 [[INDEX_NEXT]], [[N_VEC]]			; UNROLL-NO-IC-NEXT: [[TMP34:%.*]] = icmp eq i32 [[INDEX_NEXT]], [[N_VEC]]
	; UNROLL-NO-IC-NEXT: br i1 [[TMP34]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP24:![0-9]+]]			; UNROLL-NO-IC-NEXT: br i1 [[TMP34]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP24:![0-9]+]]
	; UNROLL-NO-IC: middle.block:			; UNROLL-NO-IC: middle.block:
	; UNROLL-NO-IC-NEXT: [[BIN_RDX:%.*]] = add <2 x i32> [[TMP33]], [[TMP32]]			; UNROLL-NO-IC-NEXT: [[BIN_RDX:%.*]] = add <2 x i32> [[TMP33]], [[TMP32]]
	; UNROLL-NO-IC-NEXT: [[TMP35:%.*]] = call i32 @llvm.vector.reduce.add.v2i32(<2 x i32> [[BIN_RDX]])			; UNROLL-NO-IC-NEXT: [[TMP35:%.*]] = call i32 @llvm.vector.reduce.add.v2i32(<2 x i32> [[BIN_RDX]])
				; UNROLL-NO-IC-NEXT: [[RDX_START:%.*]] = add i32 0, [[TMP35]]
	; UNROLL-NO-IC-NEXT: [[CMP_N:%.*]] = icmp eq i32 [[SMAX]], [[N_VEC]]			; UNROLL-NO-IC-NEXT: [[CMP_N:%.*]] = icmp eq i32 [[SMAX]], [[N_VEC]]
	; UNROLL-NO-IC-NEXT: br i1 [[CMP_N]], label [[FOR_END:%.*]], label [[SCALAR_PH]]			; UNROLL-NO-IC-NEXT: br i1 [[CMP_N]], label [[FOR_END:%.*]], label [[SCALAR_PH]]
	; UNROLL-NO-IC: scalar.ph:			; UNROLL-NO-IC: scalar.ph:
	; UNROLL-NO-IC-NEXT: [[BC_RESUME_VAL:%.]] = phi i32 [ [[N_VEC]], [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY:%.]] ]			; UNROLL-NO-IC-NEXT: [[BC_RESUME_VAL:%.]] = phi i32 [ [[N_VEC]], [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY:%.]] ]
	; UNROLL-NO-IC-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 0, [[ENTRY]] ], [ [[TMP35]], [[MIDDLE_BLOCK]] ]			; UNROLL-NO-IC-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 0, [[ENTRY]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; UNROLL-NO-IC-NEXT: br label [[FOR_BODY:%.*]]			; UNROLL-NO-IC-NEXT: br label [[FOR_BODY:%.*]]
	; UNROLL-NO-IC: for.body:			; UNROLL-NO-IC: for.body:
	; UNROLL-NO-IC-NEXT: [[I:%.]] = phi i32 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[I_NEXT:%.]], [[IF_END:%.*]] ]			; UNROLL-NO-IC-NEXT: [[I:%.]] = phi i32 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[I_NEXT:%.]], [[IF_END:%.*]] ]
	; UNROLL-NO-IC-NEXT: [[SUM:%.]] = phi i32 [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[VAR4:%.]], [[IF_END]] ]			; UNROLL-NO-IC-NEXT: [[SUM:%.]] = phi i32 [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[VAR4:%.]], [[IF_END]] ]
	; UNROLL-NO-IC-NEXT: [[VAR0:%.]] = getelementptr inbounds i32, i32 [[A]], i32 [[I]]			; UNROLL-NO-IC-NEXT: [[VAR0:%.]] = getelementptr inbounds i32, i32 [[A]], i32 [[I]]
	; UNROLL-NO-IC-NEXT: [[VAR1:%.]] = load i32, i32 [[VAR0]], align 4			; UNROLL-NO-IC-NEXT: [[VAR1:%.]] = load i32, i32 [[VAR0]], align 4
	; UNROLL-NO-IC-NEXT: br i1 [[C]], label [[IF_THEN:%.*]], label [[IF_END]]			; UNROLL-NO-IC-NEXT: br i1 [[C]], label [[IF_THEN:%.*]], label [[IF_END]]
	; UNROLL-NO-IC: if.then:			; UNROLL-NO-IC: if.then:
	; UNROLL-NO-IC-NEXT: [[VAR2:%.*]] = udiv i32 [[VAR1]], [[I]]			; UNROLL-NO-IC-NEXT: [[VAR2:%.*]] = udiv i32 [[VAR1]], [[I]]
	; UNROLL-NO-IC-NEXT: br label [[IF_END]]			; UNROLL-NO-IC-NEXT: br label [[IF_END]]
	; UNROLL-NO-IC: if.end:			; UNROLL-NO-IC: if.end:
	; UNROLL-NO-IC-NEXT: [[VAR3:%.*]] = phi i32 [ [[VAR2]], [[IF_THEN]] ], [ [[VAR1]], [[FOR_BODY]] ]			; UNROLL-NO-IC-NEXT: [[VAR3:%.*]] = phi i32 [ [[VAR2]], [[IF_THEN]] ], [ [[VAR1]], [[FOR_BODY]] ]
	; UNROLL-NO-IC-NEXT: [[VAR4]] = add i32 [[VAR3]], [[SUM]]			; UNROLL-NO-IC-NEXT: [[VAR4]] = add i32 [[VAR3]], [[SUM]]
	; UNROLL-NO-IC-NEXT: [[I_NEXT]] = add nuw nsw i32 [[I]], 1			; UNROLL-NO-IC-NEXT: [[I_NEXT]] = add nuw nsw i32 [[I]], 1
	; UNROLL-NO-IC-NEXT: [[COND:%.*]] = icmp slt i32 [[I_NEXT]], [[N]]			; UNROLL-NO-IC-NEXT: [[COND:%.*]] = icmp slt i32 [[I_NEXT]], [[N]]
	; UNROLL-NO-IC-NEXT: br i1 [[COND]], label [[FOR_BODY]], label [[FOR_END]], !llvm.loop [[LOOP25:![0-9]+]]			; UNROLL-NO-IC-NEXT: br i1 [[COND]], label [[FOR_BODY]], label [[FOR_END]], !llvm.loop [[LOOP25:![0-9]+]]
	; UNROLL-NO-IC: for.end:			; UNROLL-NO-IC: for.end:
	; UNROLL-NO-IC-NEXT: [[VAR5:%.*]] = phi i32 [ [[VAR4]], [[IF_END]] ], [ [[TMP35]], [[MIDDLE_BLOCK]] ]			; UNROLL-NO-IC-NEXT: [[VAR5:%.*]] = phi i32 [ [[VAR4]], [[IF_END]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; UNROLL-NO-IC-NEXT: ret i32 [[VAR5]]			; UNROLL-NO-IC-NEXT: ret i32 [[VAR5]]
	;			;
	; INTERLEAVE-LABEL: @scalarize_induction_variable_05(			; INTERLEAVE-LABEL: @scalarize_induction_variable_05(
	; INTERLEAVE-NEXT: entry:			; INTERLEAVE-NEXT: entry:
	; INTERLEAVE-NEXT: [[SMAX:%.]] = call i32 @llvm.smax.i32(i32 [[N:%.]], i32 1)			; INTERLEAVE-NEXT: [[SMAX:%.]] = call i32 @llvm.smax.i32(i32 [[N:%.]], i32 1)
	; INTERLEAVE-NEXT: [[MIN_ITERS_CHECK:%.*]] = icmp ult i32 [[SMAX]], 8			; INTERLEAVE-NEXT: [[MIN_ITERS_CHECK:%.*]] = icmp ult i32 [[SMAX]], 8
	; INTERLEAVE-NEXT: br i1 [[MIN_ITERS_CHECK]], label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]			; INTERLEAVE-NEXT: br i1 [[MIN_ITERS_CHECK]], label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]
	; INTERLEAVE: vector.ph:			; INTERLEAVE: vector.ph:
	▲ Show 20 Lines • Show All 486 Lines • ▼ Show 20 Lines
	define i32 @i8_loop() nounwind readnone ssp uwtable {			define i32 @i8_loop() nounwind readnone ssp uwtable {
	; CHECK-LABEL: @i8_loop(			; CHECK-LABEL: @i8_loop(
	; CHECK-NEXT: entry:			; CHECK-NEXT: entry:
	; CHECK-NEXT: br i1 false, label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]			; CHECK-NEXT: br i1 false, label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]
	; CHECK: vector.ph:			; CHECK: vector.ph:
	; CHECK-NEXT: br label [[VECTOR_BODY:%.*]]			; CHECK-NEXT: br label [[VECTOR_BODY:%.*]]
	; CHECK: vector.body:			; CHECK: vector.body:
	; CHECK-NEXT: [[INDEX:%.]] = phi i32 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[VECTOR_BODY]] ]			; CHECK-NEXT: [[INDEX:%.]] = phi i32 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[VECTOR_BODY]] ]
	; CHECK-NEXT: [[VEC_PHI:%.]] = phi <2 x i32> [ <i32 1, i32 -1>, [[VECTOR_PH]] ], [ [[TMP0:%.]], [[VECTOR_BODY]] ]			; CHECK-NEXT: [[VEC_PHI:%.]] = phi <2 x i32> [ <i32 -1, i32 -1>, [[VECTOR_PH]] ], [ [[TMP0:%.]], [[VECTOR_BODY]] ]
	; CHECK-NEXT: [[TMP0]] = and <2 x i32> [[VEC_PHI]], <i32 4, i32 4>			; CHECK-NEXT: [[TMP0]] = and <2 x i32> [[VEC_PHI]], <i32 4, i32 4>
	; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i32 [[INDEX]], 2			; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i32 [[INDEX]], 2
	; CHECK-NEXT: [[TMP1:%.*]] = icmp eq i32 [[INDEX_NEXT]], 256			; CHECK-NEXT: [[TMP1:%.*]] = icmp eq i32 [[INDEX_NEXT]], 256
	; CHECK-NEXT: br i1 [[TMP1]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP28:![0-9]+]]			; CHECK-NEXT: br i1 [[TMP1]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP28:![0-9]+]]
	; CHECK: middle.block:			; CHECK: middle.block:
	; CHECK-NEXT: [[TMP2:%.*]] = call i32 @llvm.vector.reduce.and.v2i32(<2 x i32> [[TMP0]])			; CHECK-NEXT: [[TMP2:%.*]] = call i32 @llvm.vector.reduce.and.v2i32(<2 x i32> [[TMP0]])
				; CHECK-NEXT: [[RDX_START:%.*]] = and i32 1, [[TMP2]]
	; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i32 256, 256			; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i32 256, 256
	; CHECK-NEXT: br i1 [[CMP_N]], label [[EXIT:%.*]], label [[SCALAR_PH]]			; CHECK-NEXT: br i1 [[CMP_N]], label [[EXIT:%.*]], label [[SCALAR_PH]]
	; CHECK: scalar.ph:			; CHECK: scalar.ph:
	; CHECK-NEXT: [[BC_RESUME_VAL:%.]] = phi i8 [ 0, [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY:%.]] ]			; CHECK-NEXT: [[BC_RESUME_VAL:%.]] = phi i8 [ 0, [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY:%.]] ]
	; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 1, [[ENTRY]] ], [ [[TMP2]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 1, [[ENTRY]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: br label [[LOOP:%.*]]			; CHECK-NEXT: br label [[LOOP:%.*]]
	; CHECK: loop:			; CHECK: loop:
	; CHECK-NEXT: [[A_0:%.]] = phi i32 [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[A_0_AND:%.]], [[LOOP]] ]			; CHECK-NEXT: [[A_0:%.]] = phi i32 [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[A_0_AND:%.]], [[LOOP]] ]
	; CHECK-NEXT: [[B_0:%.]] = phi i8 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[B_NEXT:%.]], [[LOOP]] ]			; CHECK-NEXT: [[B_0:%.]] = phi i8 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[B_NEXT:%.]], [[LOOP]] ]
	; CHECK-NEXT: [[A_0_AND]] = and i32 [[A_0]], 4			; CHECK-NEXT: [[A_0_AND]] = and i32 [[A_0]], 4
	; CHECK-NEXT: [[B_NEXT]] = add i8 [[B_0]], -1			; CHECK-NEXT: [[B_NEXT]] = add i8 [[B_0]], -1
	; CHECK-NEXT: [[EC:%.*]] = icmp eq i8 [[B_NEXT]], 0			; CHECK-NEXT: [[EC:%.*]] = icmp eq i8 [[B_NEXT]], 0
	; CHECK-NEXT: br i1 [[EC]], label [[EXIT]], label [[LOOP]], !llvm.loop [[LOOP29:![0-9]+]]			; CHECK-NEXT: br i1 [[EC]], label [[EXIT]], label [[LOOP]], !llvm.loop [[LOOP29:![0-9]+]]
	; CHECK: exit:			; CHECK: exit:
	; CHECK-NEXT: [[A_0_AND_LCSSA:%.*]] = phi i32 [ [[A_0_AND]], [[LOOP]] ], [ [[TMP2]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[A_0_AND_LCSSA:%.*]] = phi i32 [ [[A_0_AND]], [[LOOP]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: ret i32 [[A_0_AND_LCSSA]]			; CHECK-NEXT: ret i32 [[A_0_AND_LCSSA]]
	;			;
	; IND-LABEL: @i8_loop(			; IND-LABEL: @i8_loop(
	; IND-NEXT: entry:			; IND-NEXT: entry:
	; IND-NEXT: br i1 false, label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]			; IND-NEXT: br i1 false, label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]
	; IND: vector.ph:			; IND: vector.ph:
	; IND-NEXT: br label [[VECTOR_BODY:%.*]]			; IND-NEXT: br label [[VECTOR_BODY:%.*]]
	; IND: vector.body:			; IND: vector.body:
	Show All 31 Lines
	;			;
	; UNROLL-NO-IC-LABEL: @i8_loop(			; UNROLL-NO-IC-LABEL: @i8_loop(
	; UNROLL-NO-IC-NEXT: entry:			; UNROLL-NO-IC-NEXT: entry:
	; UNROLL-NO-IC-NEXT: br i1 false, label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]			; UNROLL-NO-IC-NEXT: br i1 false, label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]
	; UNROLL-NO-IC: vector.ph:			; UNROLL-NO-IC: vector.ph:
	; UNROLL-NO-IC-NEXT: br label [[VECTOR_BODY:%.*]]			; UNROLL-NO-IC-NEXT: br label [[VECTOR_BODY:%.*]]
	; UNROLL-NO-IC: vector.body:			; UNROLL-NO-IC: vector.body:
	; UNROLL-NO-IC-NEXT: [[INDEX:%.]] = phi i32 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[VECTOR_BODY]] ]			; UNROLL-NO-IC-NEXT: [[INDEX:%.]] = phi i32 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[VECTOR_BODY]] ]
	; UNROLL-NO-IC-NEXT: [[VEC_PHI:%.]] = phi <2 x i32> [ <i32 1, i32 -1>, [[VECTOR_PH]] ], [ [[TMP0:%.]], [[VECTOR_BODY]] ]			; UNROLL-NO-IC-NEXT: [[VEC_PHI:%.]] = phi <2 x i32> [ <i32 -1, i32 -1>, [[VECTOR_PH]] ], [ [[TMP0:%.]], [[VECTOR_BODY]] ]
	; UNROLL-NO-IC-NEXT: [[VEC_PHI1:%.]] = phi <2 x i32> [ <i32 -1, i32 -1>, [[VECTOR_PH]] ], [ [[TMP1:%.]], [[VECTOR_BODY]] ]			; UNROLL-NO-IC-NEXT: [[VEC_PHI1:%.]] = phi <2 x i32> [ <i32 -1, i32 -1>, [[VECTOR_PH]] ], [ [[TMP1:%.]], [[VECTOR_BODY]] ]
	; UNROLL-NO-IC-NEXT: [[TMP0]] = and <2 x i32> [[VEC_PHI]], <i32 4, i32 4>			; UNROLL-NO-IC-NEXT: [[TMP0]] = and <2 x i32> [[VEC_PHI]], <i32 4, i32 4>
	; UNROLL-NO-IC-NEXT: [[TMP1]] = and <2 x i32> [[VEC_PHI1]], <i32 4, i32 4>			; UNROLL-NO-IC-NEXT: [[TMP1]] = and <2 x i32> [[VEC_PHI1]], <i32 4, i32 4>
	; UNROLL-NO-IC-NEXT: [[INDEX_NEXT]] = add nuw i32 [[INDEX]], 4			; UNROLL-NO-IC-NEXT: [[INDEX_NEXT]] = add nuw i32 [[INDEX]], 4
	; UNROLL-NO-IC-NEXT: [[TMP2:%.*]] = icmp eq i32 [[INDEX_NEXT]], 256			; UNROLL-NO-IC-NEXT: [[TMP2:%.*]] = icmp eq i32 [[INDEX_NEXT]], 256
	; UNROLL-NO-IC-NEXT: br i1 [[TMP2]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP28:![0-9]+]]			; UNROLL-NO-IC-NEXT: br i1 [[TMP2]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP28:![0-9]+]]
	; UNROLL-NO-IC: middle.block:			; UNROLL-NO-IC: middle.block:
	; UNROLL-NO-IC-NEXT: [[BIN_RDX:%.*]] = and <2 x i32> [[TMP1]], [[TMP0]]			; UNROLL-NO-IC-NEXT: [[BIN_RDX:%.*]] = and <2 x i32> [[TMP1]], [[TMP0]]
	; UNROLL-NO-IC-NEXT: [[TMP3:%.*]] = call i32 @llvm.vector.reduce.and.v2i32(<2 x i32> [[BIN_RDX]])			; UNROLL-NO-IC-NEXT: [[TMP3:%.*]] = call i32 @llvm.vector.reduce.and.v2i32(<2 x i32> [[BIN_RDX]])
				; UNROLL-NO-IC-NEXT: [[RDX_START:%.*]] = and i32 1, [[TMP3]]
	; UNROLL-NO-IC-NEXT: [[CMP_N:%.*]] = icmp eq i32 256, 256			; UNROLL-NO-IC-NEXT: [[CMP_N:%.*]] = icmp eq i32 256, 256
	; UNROLL-NO-IC-NEXT: br i1 [[CMP_N]], label [[EXIT:%.*]], label [[SCALAR_PH]]			; UNROLL-NO-IC-NEXT: br i1 [[CMP_N]], label [[EXIT:%.*]], label [[SCALAR_PH]]
	; UNROLL-NO-IC: scalar.ph:			; UNROLL-NO-IC: scalar.ph:
	; UNROLL-NO-IC-NEXT: [[BC_RESUME_VAL:%.]] = phi i8 [ 0, [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY:%.]] ]			; UNROLL-NO-IC-NEXT: [[BC_RESUME_VAL:%.]] = phi i8 [ 0, [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY:%.]] ]
	; UNROLL-NO-IC-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 1, [[ENTRY]] ], [ [[TMP3]], [[MIDDLE_BLOCK]] ]			; UNROLL-NO-IC-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 1, [[ENTRY]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; UNROLL-NO-IC-NEXT: br label [[LOOP:%.*]]			; UNROLL-NO-IC-NEXT: br label [[LOOP:%.*]]
	; UNROLL-NO-IC: loop:			; UNROLL-NO-IC: loop:
	; UNROLL-NO-IC-NEXT: [[A_0:%.]] = phi i32 [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[A_0_AND:%.]], [[LOOP]] ]			; UNROLL-NO-IC-NEXT: [[A_0:%.]] = phi i32 [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[A_0_AND:%.]], [[LOOP]] ]
	; UNROLL-NO-IC-NEXT: [[B_0:%.]] = phi i8 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[B_NEXT:%.]], [[LOOP]] ]			; UNROLL-NO-IC-NEXT: [[B_0:%.]] = phi i8 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[B_NEXT:%.]], [[LOOP]] ]
	; UNROLL-NO-IC-NEXT: [[A_0_AND]] = and i32 [[A_0]], 4			; UNROLL-NO-IC-NEXT: [[A_0_AND]] = and i32 [[A_0]], 4
	; UNROLL-NO-IC-NEXT: [[B_NEXT]] = add i8 [[B_0]], -1			; UNROLL-NO-IC-NEXT: [[B_NEXT]] = add i8 [[B_0]], -1
	; UNROLL-NO-IC-NEXT: [[EC:%.*]] = icmp eq i8 [[B_NEXT]], 0			; UNROLL-NO-IC-NEXT: [[EC:%.*]] = icmp eq i8 [[B_NEXT]], 0
	; UNROLL-NO-IC-NEXT: br i1 [[EC]], label [[EXIT]], label [[LOOP]], !llvm.loop [[LOOP29:![0-9]+]]			; UNROLL-NO-IC-NEXT: br i1 [[EC]], label [[EXIT]], label [[LOOP]], !llvm.loop [[LOOP29:![0-9]+]]
	; UNROLL-NO-IC: exit:			; UNROLL-NO-IC: exit:
	; UNROLL-NO-IC-NEXT: [[A_0_AND_LCSSA:%.*]] = phi i32 [ [[A_0_AND]], [[LOOP]] ], [ [[TMP3]], [[MIDDLE_BLOCK]] ]			; UNROLL-NO-IC-NEXT: [[A_0_AND_LCSSA:%.*]] = phi i32 [ [[A_0_AND]], [[LOOP]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; UNROLL-NO-IC-NEXT: ret i32 [[A_0_AND_LCSSA]]			; UNROLL-NO-IC-NEXT: ret i32 [[A_0_AND_LCSSA]]
	;			;
	; INTERLEAVE-LABEL: @i8_loop(			; INTERLEAVE-LABEL: @i8_loop(
	; INTERLEAVE-NEXT: entry:			; INTERLEAVE-NEXT: entry:
	; INTERLEAVE-NEXT: br i1 false, label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]			; INTERLEAVE-NEXT: br i1 false, label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]
	; INTERLEAVE: vector.ph:			; INTERLEAVE: vector.ph:
	; INTERLEAVE-NEXT: br label [[VECTOR_BODY:%.*]]			; INTERLEAVE-NEXT: br label [[VECTOR_BODY:%.*]]
	; INTERLEAVE: vector.body:			; INTERLEAVE: vector.body:
	Show All 29 Lines
	define i32 @i16_loop() nounwind readnone ssp uwtable {			define i32 @i16_loop() nounwind readnone ssp uwtable {
	; CHECK-LABEL: @i16_loop(			; CHECK-LABEL: @i16_loop(
	; CHECK-NEXT: entry:			; CHECK-NEXT: entry:
	; CHECK-NEXT: br i1 false, label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]			; CHECK-NEXT: br i1 false, label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]
	; CHECK: vector.ph:			; CHECK: vector.ph:
	; CHECK-NEXT: br label [[VECTOR_BODY:%.*]]			; CHECK-NEXT: br label [[VECTOR_BODY:%.*]]
	; CHECK: vector.body:			; CHECK: vector.body:
	; CHECK-NEXT: [[INDEX:%.]] = phi i32 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[VECTOR_BODY]] ]			; CHECK-NEXT: [[INDEX:%.]] = phi i32 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[VECTOR_BODY]] ]
	; CHECK-NEXT: [[VEC_PHI:%.]] = phi <2 x i32> [ <i32 1, i32 -1>, [[VECTOR_PH]] ], [ [[TMP0:%.]], [[VECTOR_BODY]] ]			; CHECK-NEXT: [[VEC_PHI:%.]] = phi <2 x i32> [ <i32 -1, i32 -1>, [[VECTOR_PH]] ], [ [[TMP0:%.]], [[VECTOR_BODY]] ]
	; CHECK-NEXT: [[TMP0]] = and <2 x i32> [[VEC_PHI]], <i32 4, i32 4>			; CHECK-NEXT: [[TMP0]] = and <2 x i32> [[VEC_PHI]], <i32 4, i32 4>
	; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i32 [[INDEX]], 2			; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i32 [[INDEX]], 2
	; CHECK-NEXT: [[TMP1:%.*]] = icmp eq i32 [[INDEX_NEXT]], 65536			; CHECK-NEXT: [[TMP1:%.*]] = icmp eq i32 [[INDEX_NEXT]], 65536
	; CHECK-NEXT: br i1 [[TMP1]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP30:![0-9]+]]			; CHECK-NEXT: br i1 [[TMP1]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP30:![0-9]+]]
	; CHECK: middle.block:			; CHECK: middle.block:
	; CHECK-NEXT: [[TMP2:%.*]] = call i32 @llvm.vector.reduce.and.v2i32(<2 x i32> [[TMP0]])			; CHECK-NEXT: [[TMP2:%.*]] = call i32 @llvm.vector.reduce.and.v2i32(<2 x i32> [[TMP0]])
				; CHECK-NEXT: [[RDX_START:%.*]] = and i32 1, [[TMP2]]
	; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i32 65536, 65536			; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i32 65536, 65536
	; CHECK-NEXT: br i1 [[CMP_N]], label [[EXIT:%.*]], label [[SCALAR_PH]]			; CHECK-NEXT: br i1 [[CMP_N]], label [[EXIT:%.*]], label [[SCALAR_PH]]
	; CHECK: scalar.ph:			; CHECK: scalar.ph:
	; CHECK-NEXT: [[BC_RESUME_VAL:%.]] = phi i16 [ 0, [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY:%.]] ]			; CHECK-NEXT: [[BC_RESUME_VAL:%.]] = phi i16 [ 0, [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY:%.]] ]
	; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 1, [[ENTRY]] ], [ [[TMP2]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 1, [[ENTRY]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: br label [[LOOP:%.*]]			; CHECK-NEXT: br label [[LOOP:%.*]]
	; CHECK: loop:			; CHECK: loop:
	; CHECK-NEXT: [[A_0:%.]] = phi i32 [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[A_0_AND:%.]], [[LOOP]] ]			; CHECK-NEXT: [[A_0:%.]] = phi i32 [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[A_0_AND:%.]], [[LOOP]] ]
	; CHECK-NEXT: [[B_0:%.]] = phi i16 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[B_0_NEXT:%.]], [[LOOP]] ]			; CHECK-NEXT: [[B_0:%.]] = phi i16 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[B_0_NEXT:%.]], [[LOOP]] ]
	; CHECK-NEXT: [[A_0_AND]] = and i32 [[A_0]], 4			; CHECK-NEXT: [[A_0_AND]] = and i32 [[A_0]], 4
	; CHECK-NEXT: [[B_0_NEXT]] = add i16 [[B_0]], -1			; CHECK-NEXT: [[B_0_NEXT]] = add i16 [[B_0]], -1
	; CHECK-NEXT: [[EC:%.*]] = icmp eq i16 [[B_0_NEXT]], 0			; CHECK-NEXT: [[EC:%.*]] = icmp eq i16 [[B_0_NEXT]], 0
	; CHECK-NEXT: br i1 [[EC]], label [[EXIT]], label [[LOOP]], !llvm.loop [[LOOP31:![0-9]+]]			; CHECK-NEXT: br i1 [[EC]], label [[EXIT]], label [[LOOP]], !llvm.loop [[LOOP31:![0-9]+]]
	; CHECK: exit:			; CHECK: exit:
	; CHECK-NEXT: [[A_0_AND_LCSSA:%.*]] = phi i32 [ [[A_0_AND]], [[LOOP]] ], [ [[TMP2]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[A_0_AND_LCSSA:%.*]] = phi i32 [ [[A_0_AND]], [[LOOP]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: ret i32 [[A_0_AND_LCSSA]]			; CHECK-NEXT: ret i32 [[A_0_AND_LCSSA]]
	;			;
	; IND-LABEL: @i16_loop(			; IND-LABEL: @i16_loop(
	; IND-NEXT: entry:			; IND-NEXT: entry:
	; IND-NEXT: br i1 false, label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]			; IND-NEXT: br i1 false, label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]
	; IND: vector.ph:			; IND: vector.ph:
	; IND-NEXT: br label [[VECTOR_BODY:%.*]]			; IND-NEXT: br label [[VECTOR_BODY:%.*]]
	; IND: vector.body:			; IND: vector.body:
	Show All 31 Lines
	;			;
	; UNROLL-NO-IC-LABEL: @i16_loop(			; UNROLL-NO-IC-LABEL: @i16_loop(
	; UNROLL-NO-IC-NEXT: entry:			; UNROLL-NO-IC-NEXT: entry:
	; UNROLL-NO-IC-NEXT: br i1 false, label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]			; UNROLL-NO-IC-NEXT: br i1 false, label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]
	; UNROLL-NO-IC: vector.ph:			; UNROLL-NO-IC: vector.ph:
	; UNROLL-NO-IC-NEXT: br label [[VECTOR_BODY:%.*]]			; UNROLL-NO-IC-NEXT: br label [[VECTOR_BODY:%.*]]
	; UNROLL-NO-IC: vector.body:			; UNROLL-NO-IC: vector.body:
	; UNROLL-NO-IC-NEXT: [[INDEX:%.]] = phi i32 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[VECTOR_BODY]] ]			; UNROLL-NO-IC-NEXT: [[INDEX:%.]] = phi i32 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[VECTOR_BODY]] ]
	; UNROLL-NO-IC-NEXT: [[VEC_PHI:%.]] = phi <2 x i32> [ <i32 1, i32 -1>, [[VECTOR_PH]] ], [ [[TMP0:%.]], [[VECTOR_BODY]] ]			; UNROLL-NO-IC-NEXT: [[VEC_PHI:%.]] = phi <2 x i32> [ <i32 -1, i32 -1>, [[VECTOR_PH]] ], [ [[TMP0:%.]], [[VECTOR_BODY]] ]
	; UNROLL-NO-IC-NEXT: [[VEC_PHI1:%.]] = phi <2 x i32> [ <i32 -1, i32 -1>, [[VECTOR_PH]] ], [ [[TMP1:%.]], [[VECTOR_BODY]] ]			; UNROLL-NO-IC-NEXT: [[VEC_PHI1:%.]] = phi <2 x i32> [ <i32 -1, i32 -1>, [[VECTOR_PH]] ], [ [[TMP1:%.]], [[VECTOR_BODY]] ]
	; UNROLL-NO-IC-NEXT: [[TMP0]] = and <2 x i32> [[VEC_PHI]], <i32 4, i32 4>			; UNROLL-NO-IC-NEXT: [[TMP0]] = and <2 x i32> [[VEC_PHI]], <i32 4, i32 4>
	; UNROLL-NO-IC-NEXT: [[TMP1]] = and <2 x i32> [[VEC_PHI1]], <i32 4, i32 4>			; UNROLL-NO-IC-NEXT: [[TMP1]] = and <2 x i32> [[VEC_PHI1]], <i32 4, i32 4>
	; UNROLL-NO-IC-NEXT: [[INDEX_NEXT]] = add nuw i32 [[INDEX]], 4			; UNROLL-NO-IC-NEXT: [[INDEX_NEXT]] = add nuw i32 [[INDEX]], 4
	; UNROLL-NO-IC-NEXT: [[TMP2:%.*]] = icmp eq i32 [[INDEX_NEXT]], 65536			; UNROLL-NO-IC-NEXT: [[TMP2:%.*]] = icmp eq i32 [[INDEX_NEXT]], 65536
	; UNROLL-NO-IC-NEXT: br i1 [[TMP2]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP30:![0-9]+]]			; UNROLL-NO-IC-NEXT: br i1 [[TMP2]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP30:![0-9]+]]
	; UNROLL-NO-IC: middle.block:			; UNROLL-NO-IC: middle.block:
	; UNROLL-NO-IC-NEXT: [[BIN_RDX:%.*]] = and <2 x i32> [[TMP1]], [[TMP0]]			; UNROLL-NO-IC-NEXT: [[BIN_RDX:%.*]] = and <2 x i32> [[TMP1]], [[TMP0]]
	; UNROLL-NO-IC-NEXT: [[TMP3:%.*]] = call i32 @llvm.vector.reduce.and.v2i32(<2 x i32> [[BIN_RDX]])			; UNROLL-NO-IC-NEXT: [[TMP3:%.*]] = call i32 @llvm.vector.reduce.and.v2i32(<2 x i32> [[BIN_RDX]])
				; UNROLL-NO-IC-NEXT: [[RDX_START:%.*]] = and i32 1, [[TMP3]]
	; UNROLL-NO-IC-NEXT: [[CMP_N:%.*]] = icmp eq i32 65536, 65536			; UNROLL-NO-IC-NEXT: [[CMP_N:%.*]] = icmp eq i32 65536, 65536
	; UNROLL-NO-IC-NEXT: br i1 [[CMP_N]], label [[EXIT:%.*]], label [[SCALAR_PH]]			; UNROLL-NO-IC-NEXT: br i1 [[CMP_N]], label [[EXIT:%.*]], label [[SCALAR_PH]]
	; UNROLL-NO-IC: scalar.ph:			; UNROLL-NO-IC: scalar.ph:
	; UNROLL-NO-IC-NEXT: [[BC_RESUME_VAL:%.]] = phi i16 [ 0, [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY:%.]] ]			; UNROLL-NO-IC-NEXT: [[BC_RESUME_VAL:%.]] = phi i16 [ 0, [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY:%.]] ]
	; UNROLL-NO-IC-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 1, [[ENTRY]] ], [ [[TMP3]], [[MIDDLE_BLOCK]] ]			; UNROLL-NO-IC-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 1, [[ENTRY]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; UNROLL-NO-IC-NEXT: br label [[LOOP:%.*]]			; UNROLL-NO-IC-NEXT: br label [[LOOP:%.*]]
	; UNROLL-NO-IC: loop:			; UNROLL-NO-IC: loop:
	; UNROLL-NO-IC-NEXT: [[A_0:%.]] = phi i32 [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[A_0_AND:%.]], [[LOOP]] ]			; UNROLL-NO-IC-NEXT: [[A_0:%.]] = phi i32 [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[A_0_AND:%.]], [[LOOP]] ]
	; UNROLL-NO-IC-NEXT: [[B_0:%.]] = phi i16 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[B_0_NEXT:%.]], [[LOOP]] ]			; UNROLL-NO-IC-NEXT: [[B_0:%.]] = phi i16 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[B_0_NEXT:%.]], [[LOOP]] ]
	; UNROLL-NO-IC-NEXT: [[A_0_AND]] = and i32 [[A_0]], 4			; UNROLL-NO-IC-NEXT: [[A_0_AND]] = and i32 [[A_0]], 4
	; UNROLL-NO-IC-NEXT: [[B_0_NEXT]] = add i16 [[B_0]], -1			; UNROLL-NO-IC-NEXT: [[B_0_NEXT]] = add i16 [[B_0]], -1
	; UNROLL-NO-IC-NEXT: [[EC:%.*]] = icmp eq i16 [[B_0_NEXT]], 0			; UNROLL-NO-IC-NEXT: [[EC:%.*]] = icmp eq i16 [[B_0_NEXT]], 0
	; UNROLL-NO-IC-NEXT: br i1 [[EC]], label [[EXIT]], label [[LOOP]], !llvm.loop [[LOOP31:![0-9]+]]			; UNROLL-NO-IC-NEXT: br i1 [[EC]], label [[EXIT]], label [[LOOP]], !llvm.loop [[LOOP31:![0-9]+]]
	; UNROLL-NO-IC: exit:			; UNROLL-NO-IC: exit:
	; UNROLL-NO-IC-NEXT: [[A_0_AND_LCSSA:%.*]] = phi i32 [ [[A_0_AND]], [[LOOP]] ], [ [[TMP3]], [[MIDDLE_BLOCK]] ]			; UNROLL-NO-IC-NEXT: [[A_0_AND_LCSSA:%.*]] = phi i32 [ [[A_0_AND]], [[LOOP]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; UNROLL-NO-IC-NEXT: ret i32 [[A_0_AND_LCSSA]]			; UNROLL-NO-IC-NEXT: ret i32 [[A_0_AND_LCSSA]]
	;			;
	; INTERLEAVE-LABEL: @i16_loop(			; INTERLEAVE-LABEL: @i16_loop(
	; INTERLEAVE-NEXT: entry:			; INTERLEAVE-NEXT: entry:
	; INTERLEAVE-NEXT: br i1 false, label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]			; INTERLEAVE-NEXT: br i1 false, label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]
	; INTERLEAVE: vector.ph:			; INTERLEAVE: vector.ph:
	; INTERLEAVE-NEXT: br label [[VECTOR_BODY:%.*]]			; INTERLEAVE-NEXT: br label [[VECTOR_BODY:%.*]]
	; INTERLEAVE: vector.body:			; INTERLEAVE: vector.body:
	Show All 33 Lines
	define i32 @max_i32_backedgetaken() nounwind readnone ssp uwtable {			define i32 @max_i32_backedgetaken() nounwind readnone ssp uwtable {
	; CHECK-LABEL: @max_i32_backedgetaken(			; CHECK-LABEL: @max_i32_backedgetaken(
	; CHECK-NEXT: entry:			; CHECK-NEXT: entry:
	; CHECK-NEXT: br i1 true, label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]			; CHECK-NEXT: br i1 true, label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]
	; CHECK: vector.ph:			; CHECK: vector.ph:
	; CHECK-NEXT: br label [[VECTOR_BODY:%.*]]			; CHECK-NEXT: br label [[VECTOR_BODY:%.*]]
	; CHECK: vector.body:			; CHECK: vector.body:
	; CHECK-NEXT: [[INDEX:%.]] = phi i32 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[VECTOR_BODY]] ]			; CHECK-NEXT: [[INDEX:%.]] = phi i32 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[VECTOR_BODY]] ]
	; CHECK-NEXT: [[VEC_PHI:%.]] = phi <2 x i32> [ <i32 1, i32 -1>, [[VECTOR_PH]] ], [ [[TMP0:%.]], [[VECTOR_BODY]] ]			; CHECK-NEXT: [[VEC_PHI:%.]] = phi <2 x i32> [ <i32 -1, i32 -1>, [[VECTOR_PH]] ], [ [[TMP0:%.]], [[VECTOR_BODY]] ]
	; CHECK-NEXT: [[TMP0]] = and <2 x i32> [[VEC_PHI]], <i32 4, i32 4>			; CHECK-NEXT: [[TMP0]] = and <2 x i32> [[VEC_PHI]], <i32 4, i32 4>
	; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i32 [[INDEX]], 2			; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i32 [[INDEX]], 2
	; CHECK-NEXT: [[TMP1:%.*]] = icmp eq i32 [[INDEX_NEXT]], 0			; CHECK-NEXT: [[TMP1:%.*]] = icmp eq i32 [[INDEX_NEXT]], 0
	; CHECK-NEXT: br i1 [[TMP1]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP32:![0-9]+]]			; CHECK-NEXT: br i1 [[TMP1]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP32:![0-9]+]]
	; CHECK: middle.block:			; CHECK: middle.block:
	; CHECK-NEXT: [[TMP2:%.*]] = call i32 @llvm.vector.reduce.and.v2i32(<2 x i32> [[TMP0]])			; CHECK-NEXT: [[TMP2:%.*]] = call i32 @llvm.vector.reduce.and.v2i32(<2 x i32> [[TMP0]])
				; CHECK-NEXT: [[RDX_START:%.*]] = and i32 1, [[TMP2]]
	; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i32 0, 0			; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i32 0, 0
	; CHECK-NEXT: br i1 [[CMP_N]], label [[EXIT:%.*]], label [[SCALAR_PH]]			; CHECK-NEXT: br i1 [[CMP_N]], label [[EXIT:%.*]], label [[SCALAR_PH]]
	; CHECK: scalar.ph:			; CHECK: scalar.ph:
	; CHECK-NEXT: [[BC_RESUME_VAL:%.]] = phi i32 [ 0, [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY:%.]] ]			; CHECK-NEXT: [[BC_RESUME_VAL:%.]] = phi i32 [ 0, [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY:%.]] ]
	; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 1, [[ENTRY]] ], [ [[TMP2]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 1, [[ENTRY]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: br label [[LOOP:%.*]]			; CHECK-NEXT: br label [[LOOP:%.*]]
	; CHECK: loop:			; CHECK: loop:
	; CHECK-NEXT: [[A_0:%.]] = phi i32 [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[A_0_AND:%.]], [[LOOP]] ]			; CHECK-NEXT: [[A_0:%.]] = phi i32 [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[A_0_AND:%.]], [[LOOP]] ]
	; CHECK-NEXT: [[B_0:%.]] = phi i32 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[B_NEXT:%.]], [[LOOP]] ]			; CHECK-NEXT: [[B_0:%.]] = phi i32 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[B_NEXT:%.]], [[LOOP]] ]
	; CHECK-NEXT: [[A_0_AND]] = and i32 [[A_0]], 4			; CHECK-NEXT: [[A_0_AND]] = and i32 [[A_0]], 4
	; CHECK-NEXT: [[B_NEXT]] = add i32 [[B_0]], -1			; CHECK-NEXT: [[B_NEXT]] = add i32 [[B_0]], -1
	; CHECK-NEXT: [[EC:%.*]] = icmp eq i32 [[B_NEXT]], 0			; CHECK-NEXT: [[EC:%.*]] = icmp eq i32 [[B_NEXT]], 0
	; CHECK-NEXT: br i1 [[EC]], label [[EXIT]], label [[LOOP]], !llvm.loop [[LOOP33:![0-9]+]]			; CHECK-NEXT: br i1 [[EC]], label [[EXIT]], label [[LOOP]], !llvm.loop [[LOOP33:![0-9]+]]
	; CHECK: exit:			; CHECK: exit:
	; CHECK-NEXT: [[A_0_AND_LCSSA:%.*]] = phi i32 [ [[A_0_AND]], [[LOOP]] ], [ [[TMP2]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[A_0_AND_LCSSA:%.*]] = phi i32 [ [[A_0_AND]], [[LOOP]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: ret i32 [[A_0_AND_LCSSA]]			; CHECK-NEXT: ret i32 [[A_0_AND_LCSSA]]
	;			;
	; IND-LABEL: @max_i32_backedgetaken(			; IND-LABEL: @max_i32_backedgetaken(
	; IND-NEXT: entry:			; IND-NEXT: entry:
	; IND-NEXT: br i1 true, label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]			; IND-NEXT: br i1 true, label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]
	; IND: vector.ph:			; IND: vector.ph:
	; IND-NEXT: br label [[VECTOR_BODY:%.*]]			; IND-NEXT: br label [[VECTOR_BODY:%.*]]
	; IND: vector.body:			; IND: vector.body:
	Show All 31 Lines
	;			;
	; UNROLL-NO-IC-LABEL: @max_i32_backedgetaken(			; UNROLL-NO-IC-LABEL: @max_i32_backedgetaken(
	; UNROLL-NO-IC-NEXT: entry:			; UNROLL-NO-IC-NEXT: entry:
	; UNROLL-NO-IC-NEXT: br i1 true, label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]			; UNROLL-NO-IC-NEXT: br i1 true, label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]
	; UNROLL-NO-IC: vector.ph:			; UNROLL-NO-IC: vector.ph:
	; UNROLL-NO-IC-NEXT: br label [[VECTOR_BODY:%.*]]			; UNROLL-NO-IC-NEXT: br label [[VECTOR_BODY:%.*]]
	; UNROLL-NO-IC: vector.body:			; UNROLL-NO-IC: vector.body:
	; UNROLL-NO-IC-NEXT: [[INDEX:%.]] = phi i32 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[VECTOR_BODY]] ]			; UNROLL-NO-IC-NEXT: [[INDEX:%.]] = phi i32 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[VECTOR_BODY]] ]
	; UNROLL-NO-IC-NEXT: [[VEC_PHI:%.]] = phi <2 x i32> [ <i32 1, i32 -1>, [[VECTOR_PH]] ], [ [[TMP0:%.]], [[VECTOR_BODY]] ]			; UNROLL-NO-IC-NEXT: [[VEC_PHI:%.]] = phi <2 x i32> [ <i32 -1, i32 -1>, [[VECTOR_PH]] ], [ [[TMP0:%.]], [[VECTOR_BODY]] ]
	; UNROLL-NO-IC-NEXT: [[VEC_PHI1:%.]] = phi <2 x i32> [ <i32 -1, i32 -1>, [[VECTOR_PH]] ], [ [[TMP1:%.]], [[VECTOR_BODY]] ]			; UNROLL-NO-IC-NEXT: [[VEC_PHI1:%.]] = phi <2 x i32> [ <i32 -1, i32 -1>, [[VECTOR_PH]] ], [ [[TMP1:%.]], [[VECTOR_BODY]] ]
	; UNROLL-NO-IC-NEXT: [[TMP0]] = and <2 x i32> [[VEC_PHI]], <i32 4, i32 4>			; UNROLL-NO-IC-NEXT: [[TMP0]] = and <2 x i32> [[VEC_PHI]], <i32 4, i32 4>
	; UNROLL-NO-IC-NEXT: [[TMP1]] = and <2 x i32> [[VEC_PHI1]], <i32 4, i32 4>			; UNROLL-NO-IC-NEXT: [[TMP1]] = and <2 x i32> [[VEC_PHI1]], <i32 4, i32 4>
	; UNROLL-NO-IC-NEXT: [[INDEX_NEXT]] = add nuw i32 [[INDEX]], 4			; UNROLL-NO-IC-NEXT: [[INDEX_NEXT]] = add nuw i32 [[INDEX]], 4
	; UNROLL-NO-IC-NEXT: [[TMP2:%.*]] = icmp eq i32 [[INDEX_NEXT]], 0			; UNROLL-NO-IC-NEXT: [[TMP2:%.*]] = icmp eq i32 [[INDEX_NEXT]], 0
	; UNROLL-NO-IC-NEXT: br i1 [[TMP2]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP32:![0-9]+]]			; UNROLL-NO-IC-NEXT: br i1 [[TMP2]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP32:![0-9]+]]
	; UNROLL-NO-IC: middle.block:			; UNROLL-NO-IC: middle.block:
	; UNROLL-NO-IC-NEXT: [[BIN_RDX:%.*]] = and <2 x i32> [[TMP1]], [[TMP0]]			; UNROLL-NO-IC-NEXT: [[BIN_RDX:%.*]] = and <2 x i32> [[TMP1]], [[TMP0]]
	; UNROLL-NO-IC-NEXT: [[TMP3:%.*]] = call i32 @llvm.vector.reduce.and.v2i32(<2 x i32> [[BIN_RDX]])			; UNROLL-NO-IC-NEXT: [[TMP3:%.*]] = call i32 @llvm.vector.reduce.and.v2i32(<2 x i32> [[BIN_RDX]])
				; UNROLL-NO-IC-NEXT: [[RDX_START:%.*]] = and i32 1, [[TMP3]]
	; UNROLL-NO-IC-NEXT: [[CMP_N:%.*]] = icmp eq i32 0, 0			; UNROLL-NO-IC-NEXT: [[CMP_N:%.*]] = icmp eq i32 0, 0
	; UNROLL-NO-IC-NEXT: br i1 [[CMP_N]], label [[EXIT:%.*]], label [[SCALAR_PH]]			; UNROLL-NO-IC-NEXT: br i1 [[CMP_N]], label [[EXIT:%.*]], label [[SCALAR_PH]]
	; UNROLL-NO-IC: scalar.ph:			; UNROLL-NO-IC: scalar.ph:
	; UNROLL-NO-IC-NEXT: [[BC_RESUME_VAL:%.]] = phi i32 [ 0, [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY:%.]] ]			; UNROLL-NO-IC-NEXT: [[BC_RESUME_VAL:%.]] = phi i32 [ 0, [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY:%.]] ]
	; UNROLL-NO-IC-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 1, [[ENTRY]] ], [ [[TMP3]], [[MIDDLE_BLOCK]] ]			; UNROLL-NO-IC-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 1, [[ENTRY]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; UNROLL-NO-IC-NEXT: br label [[LOOP:%.*]]			; UNROLL-NO-IC-NEXT: br label [[LOOP:%.*]]
	; UNROLL-NO-IC: loop:			; UNROLL-NO-IC: loop:
	; UNROLL-NO-IC-NEXT: [[A_0:%.]] = phi i32 [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[A_0_AND:%.]], [[LOOP]] ]			; UNROLL-NO-IC-NEXT: [[A_0:%.]] = phi i32 [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[A_0_AND:%.]], [[LOOP]] ]
	; UNROLL-NO-IC-NEXT: [[B_0:%.]] = phi i32 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[B_NEXT:%.]], [[LOOP]] ]			; UNROLL-NO-IC-NEXT: [[B_0:%.]] = phi i32 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[B_NEXT:%.]], [[LOOP]] ]
	; UNROLL-NO-IC-NEXT: [[A_0_AND]] = and i32 [[A_0]], 4			; UNROLL-NO-IC-NEXT: [[A_0_AND]] = and i32 [[A_0]], 4
	; UNROLL-NO-IC-NEXT: [[B_NEXT]] = add i32 [[B_0]], -1			; UNROLL-NO-IC-NEXT: [[B_NEXT]] = add i32 [[B_0]], -1
	; UNROLL-NO-IC-NEXT: [[EC:%.*]] = icmp eq i32 [[B_NEXT]], 0			; UNROLL-NO-IC-NEXT: [[EC:%.*]] = icmp eq i32 [[B_NEXT]], 0
	; UNROLL-NO-IC-NEXT: br i1 [[EC]], label [[EXIT]], label [[LOOP]], !llvm.loop [[LOOP33:![0-9]+]]			; UNROLL-NO-IC-NEXT: br i1 [[EC]], label [[EXIT]], label [[LOOP]], !llvm.loop [[LOOP33:![0-9]+]]
	; UNROLL-NO-IC: exit:			; UNROLL-NO-IC: exit:
	; UNROLL-NO-IC-NEXT: [[A_0_AND_LCSSA:%.*]] = phi i32 [ [[A_0_AND]], [[LOOP]] ], [ [[TMP3]], [[MIDDLE_BLOCK]] ]			; UNROLL-NO-IC-NEXT: [[A_0_AND_LCSSA:%.*]] = phi i32 [ [[A_0_AND]], [[LOOP]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; UNROLL-NO-IC-NEXT: ret i32 [[A_0_AND_LCSSA]]			; UNROLL-NO-IC-NEXT: ret i32 [[A_0_AND_LCSSA]]
	;			;
	; INTERLEAVE-LABEL: @max_i32_backedgetaken(			; INTERLEAVE-LABEL: @max_i32_backedgetaken(
	; INTERLEAVE-NEXT: entry:			; INTERLEAVE-NEXT: entry:
	; INTERLEAVE-NEXT: br i1 true, label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]			; INTERLEAVE-NEXT: br i1 true, label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]
	; INTERLEAVE: vector.ph:			; INTERLEAVE: vector.ph:
	; INTERLEAVE-NEXT: br label [[VECTOR_BODY:%.*]]			; INTERLEAVE-NEXT: br label [[VECTOR_BODY:%.*]]
	; INTERLEAVE: vector.body:			; INTERLEAVE: vector.body:
	▲ Show 20 Lines • Show All 44 Lines • ▼ Show 20 Lines
	; CHECK-NEXT: [[TMP3:%.*]] = add nuw nsw i32 [[TMP2]], 1			; CHECK-NEXT: [[TMP3:%.*]] = add nuw nsw i32 [[TMP2]], 1
	; CHECK-NEXT: [[MIN_ITERS_CHECK:%.*]] = icmp ult i32 [[TMP3]], 2			; CHECK-NEXT: [[MIN_ITERS_CHECK:%.*]] = icmp ult i32 [[TMP3]], 2
	; CHECK-NEXT: br i1 [[MIN_ITERS_CHECK]], label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]			; CHECK-NEXT: br i1 [[MIN_ITERS_CHECK]], label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]
	; CHECK: vector.ph:			; CHECK: vector.ph:
	; CHECK-NEXT: [[N_MOD_VF:%.*]] = urem i32 [[TMP3]], 2			; CHECK-NEXT: [[N_MOD_VF:%.*]] = urem i32 [[TMP3]], 2
	; CHECK-NEXT: [[N_VEC:%.*]] = sub i32 [[TMP3]], [[N_MOD_VF]]			; CHECK-NEXT: [[N_VEC:%.*]] = sub i32 [[TMP3]], [[N_MOD_VF]]
	; CHECK-NEXT: [[CAST_VTC:%.*]] = trunc i32 [[N_VEC]] to i8			; CHECK-NEXT: [[CAST_VTC:%.*]] = trunc i32 [[N_VEC]] to i8
	; CHECK-NEXT: [[IND_END:%.*]] = add i8 [[DOTPR_I]], [[CAST_VTC]]			; CHECK-NEXT: [[IND_END:%.*]] = add i8 [[DOTPR_I]], [[CAST_VTC]]
	; CHECK-NEXT: [[TMP4:%.*]] = insertelement <2 x i32> <i32 -1, i32 -1>, i32 [[C_PROMOTED_I]], i32 0
	; CHECK-NEXT: [[BROADCAST_SPLATINSERT:%.*]] = insertelement <2 x i32> poison, i32 [[TMP0]], i32 0			; CHECK-NEXT: [[BROADCAST_SPLATINSERT:%.*]] = insertelement <2 x i32> poison, i32 [[TMP0]], i32 0
	; CHECK-NEXT: [[BROADCAST_SPLAT:%.*]] = shufflevector <2 x i32> [[BROADCAST_SPLATINSERT]], <2 x i32> poison, <2 x i32> zeroinitializer			; CHECK-NEXT: [[BROADCAST_SPLAT:%.*]] = shufflevector <2 x i32> [[BROADCAST_SPLATINSERT]], <2 x i32> poison, <2 x i32> zeroinitializer
	; CHECK-NEXT: br label [[VECTOR_BODY:%.*]]			; CHECK-NEXT: br label [[VECTOR_BODY:%.*]]
	; CHECK: vector.body:			; CHECK: vector.body:
	; CHECK-NEXT: [[INDEX:%.]] = phi i32 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[VECTOR_BODY]] ]			; CHECK-NEXT: [[INDEX:%.]] = phi i32 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[VECTOR_BODY]] ]
	; CHECK-NEXT: [[VEC_PHI:%.]] = phi <2 x i32> [ [[TMP4]], [[VECTOR_PH]] ], [ [[TMP5:%.]], [[VECTOR_BODY]] ]			; CHECK-NEXT: [[VEC_PHI:%.]] = phi <2 x i32> [ <i32 -1, i32 -1>, [[VECTOR_PH]] ], [ [[TMP4:%.]], [[VECTOR_BODY]] ]
	; CHECK-NEXT: [[TMP5]] = and <2 x i32> [[BROADCAST_SPLAT]], [[VEC_PHI]]			; CHECK-NEXT: [[TMP4]] = and <2 x i32> [[BROADCAST_SPLAT]], [[VEC_PHI]]
	; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i32 [[INDEX]], 2			; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i32 [[INDEX]], 2
	; CHECK-NEXT: [[TMP6:%.*]] = icmp eq i32 [[INDEX_NEXT]], [[N_VEC]]			; CHECK-NEXT: [[TMP5:%.*]] = icmp eq i32 [[INDEX_NEXT]], [[N_VEC]]
	; CHECK-NEXT: br i1 [[TMP6]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP34:![0-9]+]]			; CHECK-NEXT: br i1 [[TMP5]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP34:![0-9]+]]
	; CHECK: middle.block:			; CHECK: middle.block:
	; CHECK-NEXT: [[TMP7:%.*]] = call i32 @llvm.vector.reduce.and.v2i32(<2 x i32> [[TMP5]])			; CHECK-NEXT: [[TMP6:%.*]] = call i32 @llvm.vector.reduce.and.v2i32(<2 x i32> [[TMP4]])
				; CHECK-NEXT: [[RDX_START:%.*]] = and i32 [[C_PROMOTED_I]], [[TMP6]]
	; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i32 [[TMP3]], [[N_VEC]]			; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i32 [[TMP3]], [[N_VEC]]
	; CHECK-NEXT: br i1 [[CMP_N]], label [[LOOPEXIT:%.*]], label [[SCALAR_PH]]			; CHECK-NEXT: br i1 [[CMP_N]], label [[LOOPEXIT:%.*]], label [[SCALAR_PH]]
	; CHECK: scalar.ph:			; CHECK: scalar.ph:
	; CHECK-NEXT: [[BC_RESUME_VAL:%.]] = phi i8 [ [[IND_END]], [[MIDDLE_BLOCK]] ], [ [[DOTPR_I]], [[ENTRY:%.]] ]			; CHECK-NEXT: [[BC_RESUME_VAL:%.]] = phi i8 [ [[IND_END]], [[MIDDLE_BLOCK]] ], [ [[DOTPR_I]], [[ENTRY:%.]] ]
	; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ [[C_PROMOTED_I]], [[ENTRY]] ], [ [[TMP7]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ [[C_PROMOTED_I]], [[ENTRY]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: br label [[COND_END_I:%.*]]			; CHECK-NEXT: br label [[COND_END_I:%.*]]
	; CHECK: cond.end.i:			; CHECK: cond.end.i:
	; CHECK-NEXT: [[INC4_I:%.]] = phi i8 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[INC_I:%.]], [[COND_END_I]] ]			; CHECK-NEXT: [[INC4_I:%.]] = phi i8 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[INC_I:%.]], [[COND_END_I]] ]
	; CHECK-NEXT: [[AND3_I:%.]] = phi i32 [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[AND_I:%.]], [[COND_END_I]] ]			; CHECK-NEXT: [[AND3_I:%.]] = phi i32 [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[AND_I:%.]], [[COND_END_I]] ]
	; CHECK-NEXT: [[AND_I]] = and i32 [[TMP0]], [[AND3_I]]			; CHECK-NEXT: [[AND_I]] = and i32 [[TMP0]], [[AND3_I]]
	; CHECK-NEXT: [[INC_I]] = add i8 [[INC4_I]], 1			; CHECK-NEXT: [[INC_I]] = add i8 [[INC4_I]], 1
	; CHECK-NEXT: [[TOBOOL_I:%.*]] = icmp eq i8 [[INC_I]], 0			; CHECK-NEXT: [[TOBOOL_I:%.*]] = icmp eq i8 [[INC_I]], 0
	; CHECK-NEXT: br i1 [[TOBOOL_I]], label [[LOOPEXIT]], label [[COND_END_I]], !llvm.loop [[LOOP35:![0-9]+]]			; CHECK-NEXT: br i1 [[TOBOOL_I]], label [[LOOPEXIT]], label [[COND_END_I]], !llvm.loop [[LOOP35:![0-9]+]]
	; CHECK: loopexit:			; CHECK: loopexit:
	; CHECK-NEXT: [[AND_I_LCSSA:%.*]] = phi i32 [ [[AND_I]], [[COND_END_I]] ], [ [[TMP7]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[AND_I_LCSSA:%.*]] = phi i32 [ [[AND_I]], [[COND_END_I]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: ret i32 [[AND_I_LCSSA]]			; CHECK-NEXT: ret i32 [[AND_I_LCSSA]]
	;			;
	; IND-LABEL: @testoverflowcheck(			; IND-LABEL: @testoverflowcheck(
	; IND-NEXT: entry:			; IND-NEXT: entry:
	; IND-NEXT: [[DOTPR_I:%.]] = load i8, i8 @e, align 1			; IND-NEXT: [[DOTPR_I:%.]] = load i8, i8 @e, align 1
	; IND-NEXT: [[TMP0:%.]] = load i32, i32 @d, align 4			; IND-NEXT: [[TMP0:%.]] = load i32, i32 @d, align 4
	; IND-NEXT: [[C_PROMOTED_I:%.]] = load i32, i32 @c, align 4			; IND-NEXT: [[C_PROMOTED_I:%.]] = load i32, i32 @c, align 4
	; IND-NEXT: [[TMP1:%.*]] = xor i8 [[DOTPR_I]], -1			; IND-NEXT: [[TMP1:%.*]] = xor i8 [[DOTPR_I]], -1
	; IND-NEXT: [[TMP2:%.*]] = zext i8 [[TMP1]] to i32			; IND-NEXT: [[TMP2:%.*]] = zext i8 [[TMP1]] to i32
	; IND-NEXT: [[TMP3:%.*]] = add nuw nsw i32 [[TMP2]], 1			; IND-NEXT: [[TMP3:%.*]] = add nuw nsw i32 [[TMP2]], 1
	; IND-NEXT: [[MIN_ITERS_CHECK:%.*]] = icmp eq i8 [[DOTPR_I]], -1			; IND-NEXT: [[MIN_ITERS_CHECK:%.*]] = icmp eq i8 [[DOTPR_I]], -1
	; IND-NEXT: br i1 [[MIN_ITERS_CHECK]], label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]			; IND-NEXT: br i1 [[MIN_ITERS_CHECK]], label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]
	; IND: vector.ph:			; IND: vector.ph:
	; IND-NEXT: [[N_VEC:%.*]] = and i32 [[TMP3]], -2			; IND-NEXT: [[N_VEC:%.*]] = and i32 [[TMP3]], -2
	; IND-NEXT: [[CAST_VTC:%.*]] = trunc i32 [[N_VEC]] to i8			; IND-NEXT: [[CAST_VTC:%.*]] = trunc i32 [[N_VEC]] to i8
	; IND-NEXT: [[IND_END:%.*]] = add i8 [[DOTPR_I]], [[CAST_VTC]]			; IND-NEXT: [[IND_END:%.*]] = add i8 [[DOTPR_I]], [[CAST_VTC]]
	; IND-NEXT: [[TMP4:%.*]] = insertelement <2 x i32> <i32 poison, i32 -1>, i32 [[C_PROMOTED_I]], i64 0
	; IND-NEXT: [[BROADCAST_SPLATINSERT:%.*]] = insertelement <2 x i32> poison, i32 [[TMP0]], i64 0			; IND-NEXT: [[BROADCAST_SPLATINSERT:%.*]] = insertelement <2 x i32> poison, i32 [[TMP0]], i64 0
	; IND-NEXT: [[BROADCAST_SPLAT:%.*]] = shufflevector <2 x i32> [[BROADCAST_SPLATINSERT]], <2 x i32> poison, <2 x i32> zeroinitializer			; IND-NEXT: [[BROADCAST_SPLAT:%.*]] = shufflevector <2 x i32> [[BROADCAST_SPLATINSERT]], <2 x i32> poison, <2 x i32> zeroinitializer
	; IND-NEXT: br label [[VECTOR_BODY:%.*]]			; IND-NEXT: br label [[VECTOR_BODY:%.*]]
	; IND: vector.body:			; IND: vector.body:
	; IND-NEXT: [[INDEX:%.]] = phi i32 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[VECTOR_BODY]] ]			; IND-NEXT: [[INDEX:%.]] = phi i32 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[VECTOR_BODY]] ]
	; IND-NEXT: [[INDEX_NEXT]] = add nuw i32 [[INDEX]], 2			; IND-NEXT: [[INDEX_NEXT]] = add nuw i32 [[INDEX]], 2
	; IND-NEXT: [[TMP5:%.*]] = icmp eq i32 [[INDEX_NEXT]], [[N_VEC]]			; IND-NEXT: [[TMP4:%.*]] = icmp eq i32 [[INDEX_NEXT]], [[N_VEC]]
	; IND-NEXT: br i1 [[TMP5]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP34:![0-9]+]]			; IND-NEXT: br i1 [[TMP4]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP34:![0-9]+]]
	; IND: middle.block:			; IND: middle.block:
	; IND-NEXT: [[TMP6:%.*]] = and <2 x i32> [[TMP4]], [[BROADCAST_SPLAT]]			; IND-NEXT: [[TMP5:%.*]] = call i32 @llvm.vector.reduce.and.v2i32(<2 x i32> [[BROADCAST_SPLAT]])
	; IND-NEXT: [[TMP7:%.*]] = call i32 @llvm.vector.reduce.and.v2i32(<2 x i32> [[TMP6]])			; IND-NEXT: [[RDX_START:%.*]] = and i32 [[C_PROMOTED_I]], [[TMP5]]
	; IND-NEXT: [[CMP_N:%.*]] = icmp eq i32 [[TMP3]], [[N_VEC]]			; IND-NEXT: [[CMP_N:%.*]] = icmp eq i32 [[TMP3]], [[N_VEC]]
	; IND-NEXT: br i1 [[CMP_N]], label [[LOOPEXIT:%.*]], label [[SCALAR_PH]]			; IND-NEXT: br i1 [[CMP_N]], label [[LOOPEXIT:%.*]], label [[SCALAR_PH]]
	; IND: scalar.ph:			; IND: scalar.ph:
	; IND-NEXT: [[BC_RESUME_VAL:%.]] = phi i8 [ [[IND_END]], [[MIDDLE_BLOCK]] ], [ [[DOTPR_I]], [[ENTRY:%.]] ]			; IND-NEXT: [[BC_RESUME_VAL:%.]] = phi i8 [ [[IND_END]], [[MIDDLE_BLOCK]] ], [ [[DOTPR_I]], [[ENTRY:%.]] ]
	; IND-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ [[TMP7]], [[MIDDLE_BLOCK]] ], [ [[C_PROMOTED_I]], [[ENTRY]] ]			; IND-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ [[RDX_START]], [[MIDDLE_BLOCK]] ], [ [[C_PROMOTED_I]], [[ENTRY]] ]
	; IND-NEXT: br label [[COND_END_I:%.*]]			; IND-NEXT: br label [[COND_END_I:%.*]]
	; IND: cond.end.i:			; IND: cond.end.i:
	; IND-NEXT: [[INC4_I:%.]] = phi i8 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[INC_I:%.]], [[COND_END_I]] ]			; IND-NEXT: [[INC4_I:%.]] = phi i8 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[INC_I:%.]], [[COND_END_I]] ]
	; IND-NEXT: [[TMP8:%.*]] = and i32 [[BC_MERGE_RDX]], [[TMP0]]			; IND-NEXT: [[TMP6:%.*]] = and i32 [[BC_MERGE_RDX]], [[TMP0]]
	; IND-NEXT: [[INC_I]] = add i8 [[INC4_I]], 1			; IND-NEXT: [[INC_I]] = add i8 [[INC4_I]], 1
	; IND-NEXT: [[TOBOOL_I:%.*]] = icmp eq i8 [[INC_I]], 0			; IND-NEXT: [[TOBOOL_I:%.*]] = icmp eq i8 [[INC_I]], 0
	; IND-NEXT: br i1 [[TOBOOL_I]], label [[LOOPEXIT]], label [[COND_END_I]], !llvm.loop [[LOOP35:![0-9]+]]			; IND-NEXT: br i1 [[TOBOOL_I]], label [[LOOPEXIT]], label [[COND_END_I]], !llvm.loop [[LOOP35:![0-9]+]]
	; IND: loopexit:			; IND: loopexit:
	; IND-NEXT: [[AND_I_LCSSA:%.*]] = phi i32 [ [[TMP8]], [[COND_END_I]] ], [ [[TMP7]], [[MIDDLE_BLOCK]] ]			; IND-NEXT: [[AND_I_LCSSA:%.*]] = phi i32 [ [[TMP6]], [[COND_END_I]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; IND-NEXT: ret i32 [[AND_I_LCSSA]]			; IND-NEXT: ret i32 [[AND_I_LCSSA]]
	;			;
	; UNROLL-LABEL: @testoverflowcheck(			; UNROLL-LABEL: @testoverflowcheck(
	; UNROLL-NEXT: entry:			; UNROLL-NEXT: entry:
	; UNROLL-NEXT: [[DOTPR_I:%.]] = load i8, i8 @e, align 1			; UNROLL-NEXT: [[DOTPR_I:%.]] = load i8, i8 @e, align 1
	; UNROLL-NEXT: [[TMP0:%.]] = load i32, i32 @d, align 4			; UNROLL-NEXT: [[TMP0:%.]] = load i32, i32 @d, align 4
	; UNROLL-NEXT: [[C_PROMOTED_I:%.]] = load i32, i32 @c, align 4			; UNROLL-NEXT: [[C_PROMOTED_I:%.]] = load i32, i32 @c, align 4
	; UNROLL-NEXT: [[TMP1:%.*]] = xor i8 [[DOTPR_I]], -1			; UNROLL-NEXT: [[TMP1:%.*]] = xor i8 [[DOTPR_I]], -1
	; UNROLL-NEXT: [[TMP2:%.*]] = zext i8 [[TMP1]] to i32			; UNROLL-NEXT: [[TMP2:%.*]] = zext i8 [[TMP1]] to i32
	; UNROLL-NEXT: [[TMP3:%.*]] = add nuw nsw i32 [[TMP2]], 1			; UNROLL-NEXT: [[TMP3:%.*]] = add nuw nsw i32 [[TMP2]], 1
	; UNROLL-NEXT: [[MIN_ITERS_CHECK:%.*]] = icmp ugt i8 [[DOTPR_I]], -4			; UNROLL-NEXT: [[MIN_ITERS_CHECK:%.*]] = icmp ugt i8 [[DOTPR_I]], -4
	; UNROLL-NEXT: br i1 [[MIN_ITERS_CHECK]], label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]			; UNROLL-NEXT: br i1 [[MIN_ITERS_CHECK]], label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]
	; UNROLL: vector.ph:			; UNROLL: vector.ph:
	; UNROLL-NEXT: [[N_VEC:%.*]] = and i32 [[TMP3]], -4			; UNROLL-NEXT: [[N_VEC:%.*]] = and i32 [[TMP3]], -4
	; UNROLL-NEXT: [[CAST_VTC:%.*]] = trunc i32 [[N_VEC]] to i8			; UNROLL-NEXT: [[CAST_VTC:%.*]] = trunc i32 [[N_VEC]] to i8
	; UNROLL-NEXT: [[IND_END:%.*]] = add i8 [[DOTPR_I]], [[CAST_VTC]]			; UNROLL-NEXT: [[IND_END:%.*]] = add i8 [[DOTPR_I]], [[CAST_VTC]]
	; UNROLL-NEXT: [[TMP4:%.*]] = insertelement <2 x i32> <i32 poison, i32 -1>, i32 [[C_PROMOTED_I]], i64 0
	; UNROLL-NEXT: [[BROADCAST_SPLATINSERT:%.*]] = insertelement <2 x i32> poison, i32 [[TMP0]], i64 0			; UNROLL-NEXT: [[BROADCAST_SPLATINSERT:%.*]] = insertelement <2 x i32> poison, i32 [[TMP0]], i64 0
	; UNROLL-NEXT: [[BROADCAST_SPLATINSERT2:%.*]] = insertelement <2 x i32> poison, i32 [[TMP0]], i64 0			; UNROLL-NEXT: [[BROADCAST_SPLATINSERT2:%.*]] = insertelement <2 x i32> poison, i32 [[TMP0]], i64 0
	; UNROLL-NEXT: br label [[VECTOR_BODY:%.*]]			; UNROLL-NEXT: br label [[VECTOR_BODY:%.*]]
	; UNROLL: vector.body:			; UNROLL: vector.body:
	; UNROLL-NEXT: [[INDEX:%.]] = phi i32 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[VECTOR_BODY]] ]			; UNROLL-NEXT: [[INDEX:%.]] = phi i32 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[VECTOR_BODY]] ]
	; UNROLL-NEXT: [[INDEX_NEXT]] = add nuw i32 [[INDEX]], 4			; UNROLL-NEXT: [[INDEX_NEXT]] = add nuw i32 [[INDEX]], 4
	; UNROLL-NEXT: [[TMP5:%.*]] = icmp eq i32 [[INDEX_NEXT]], [[N_VEC]]			; UNROLL-NEXT: [[TMP4:%.*]] = icmp eq i32 [[INDEX_NEXT]], [[N_VEC]]
	; UNROLL-NEXT: br i1 [[TMP5]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP34:![0-9]+]]			; UNROLL-NEXT: br i1 [[TMP4]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP34:![0-9]+]]
	; UNROLL: middle.block:			; UNROLL: middle.block:
	; UNROLL-NEXT: [[TMP6:%.*]] = and <2 x i32> [[BROADCAST_SPLATINSERT2]], [[BROADCAST_SPLATINSERT]]			; UNROLL-NEXT: [[TMP5:%.*]] = and <2 x i32> [[BROADCAST_SPLATINSERT2]], [[BROADCAST_SPLATINSERT]]
	; UNROLL-NEXT: [[TMP7:%.*]] = shufflevector <2 x i32> [[TMP6]], <2 x i32> poison, <2 x i32> zeroinitializer			; UNROLL-NEXT: [[BIN_RDX:%.*]] = shufflevector <2 x i32> [[TMP5]], <2 x i32> poison, <2 x i32> zeroinitializer
	; UNROLL-NEXT: [[BIN_RDX:%.*]] = and <2 x i32> [[TMP7]], [[TMP4]]			; UNROLL-NEXT: [[TMP6:%.*]] = call i32 @llvm.vector.reduce.and.v2i32(<2 x i32> [[BIN_RDX]])
	; UNROLL-NEXT: [[TMP8:%.*]] = call i32 @llvm.vector.reduce.and.v2i32(<2 x i32> [[BIN_RDX]])			; UNROLL-NEXT: [[RDX_START:%.*]] = and i32 [[C_PROMOTED_I]], [[TMP6]]
	; UNROLL-NEXT: [[CMP_N:%.*]] = icmp eq i32 [[TMP3]], [[N_VEC]]			; UNROLL-NEXT: [[CMP_N:%.*]] = icmp eq i32 [[TMP3]], [[N_VEC]]
	; UNROLL-NEXT: br i1 [[CMP_N]], label [[LOOPEXIT:%.*]], label [[SCALAR_PH]]			; UNROLL-NEXT: br i1 [[CMP_N]], label [[LOOPEXIT:%.*]], label [[SCALAR_PH]]
	; UNROLL: scalar.ph:			; UNROLL: scalar.ph:
	; UNROLL-NEXT: [[BC_RESUME_VAL:%.]] = phi i8 [ [[IND_END]], [[MIDDLE_BLOCK]] ], [ [[DOTPR_I]], [[ENTRY:%.]] ]			; UNROLL-NEXT: [[BC_RESUME_VAL:%.]] = phi i8 [ [[IND_END]], [[MIDDLE_BLOCK]] ], [ [[DOTPR_I]], [[ENTRY:%.]] ]
	; UNROLL-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ [[TMP8]], [[MIDDLE_BLOCK]] ], [ [[C_PROMOTED_I]], [[ENTRY]] ]			; UNROLL-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ [[RDX_START]], [[MIDDLE_BLOCK]] ], [ [[C_PROMOTED_I]], [[ENTRY]] ]
	; UNROLL-NEXT: br label [[COND_END_I:%.*]]			; UNROLL-NEXT: br label [[COND_END_I:%.*]]
	; UNROLL: cond.end.i:			; UNROLL: cond.end.i:
	; UNROLL-NEXT: [[INC4_I:%.]] = phi i8 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[INC_I:%.]], [[COND_END_I]] ]			; UNROLL-NEXT: [[INC4_I:%.]] = phi i8 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[INC_I:%.]], [[COND_END_I]] ]
	; UNROLL-NEXT: [[TMP9:%.*]] = and i32 [[BC_MERGE_RDX]], [[TMP0]]			; UNROLL-NEXT: [[TMP7:%.*]] = and i32 [[BC_MERGE_RDX]], [[TMP0]]
	; UNROLL-NEXT: [[INC_I]] = add i8 [[INC4_I]], 1			; UNROLL-NEXT: [[INC_I]] = add i8 [[INC4_I]], 1
	; UNROLL-NEXT: [[TOBOOL_I:%.*]] = icmp eq i8 [[INC_I]], 0			; UNROLL-NEXT: [[TOBOOL_I:%.*]] = icmp eq i8 [[INC_I]], 0
	; UNROLL-NEXT: br i1 [[TOBOOL_I]], label [[LOOPEXIT]], label [[COND_END_I]], !llvm.loop [[LOOP35:![0-9]+]]			; UNROLL-NEXT: br i1 [[TOBOOL_I]], label [[LOOPEXIT]], label [[COND_END_I]], !llvm.loop [[LOOP35:![0-9]+]]
	; UNROLL: loopexit:			; UNROLL: loopexit:
	; UNROLL-NEXT: [[AND_I_LCSSA:%.*]] = phi i32 [ [[TMP9]], [[COND_END_I]] ], [ [[TMP8]], [[MIDDLE_BLOCK]] ]			; UNROLL-NEXT: [[AND_I_LCSSA:%.*]] = phi i32 [ [[TMP7]], [[COND_END_I]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; UNROLL-NEXT: ret i32 [[AND_I_LCSSA]]			; UNROLL-NEXT: ret i32 [[AND_I_LCSSA]]
	;			;
	; UNROLL-NO-IC-LABEL: @testoverflowcheck(			; UNROLL-NO-IC-LABEL: @testoverflowcheck(
	; UNROLL-NO-IC-NEXT: entry:			; UNROLL-NO-IC-NEXT: entry:
	; UNROLL-NO-IC-NEXT: [[DOTPR_I:%.]] = load i8, i8 @e, align 1			; UNROLL-NO-IC-NEXT: [[DOTPR_I:%.]] = load i8, i8 @e, align 1
	; UNROLL-NO-IC-NEXT: [[TMP0:%.]] = load i32, i32 @d, align 4			; UNROLL-NO-IC-NEXT: [[TMP0:%.]] = load i32, i32 @d, align 4
	; UNROLL-NO-IC-NEXT: [[C_PROMOTED_I:%.]] = load i32, i32 @c, align 4			; UNROLL-NO-IC-NEXT: [[C_PROMOTED_I:%.]] = load i32, i32 @c, align 4
	; UNROLL-NO-IC-NEXT: [[TMP1:%.*]] = sub i8 -1, [[DOTPR_I]]			; UNROLL-NO-IC-NEXT: [[TMP1:%.*]] = sub i8 -1, [[DOTPR_I]]
	; UNROLL-NO-IC-NEXT: [[TMP2:%.*]] = zext i8 [[TMP1]] to i32			; UNROLL-NO-IC-NEXT: [[TMP2:%.*]] = zext i8 [[TMP1]] to i32
	; UNROLL-NO-IC-NEXT: [[TMP3:%.*]] = add nuw nsw i32 [[TMP2]], 1			; UNROLL-NO-IC-NEXT: [[TMP3:%.*]] = add nuw nsw i32 [[TMP2]], 1
	; UNROLL-NO-IC-NEXT: [[MIN_ITERS_CHECK:%.*]] = icmp ult i32 [[TMP3]], 4			; UNROLL-NO-IC-NEXT: [[MIN_ITERS_CHECK:%.*]] = icmp ult i32 [[TMP3]], 4
	; UNROLL-NO-IC-NEXT: br i1 [[MIN_ITERS_CHECK]], label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]			; UNROLL-NO-IC-NEXT: br i1 [[MIN_ITERS_CHECK]], label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]
	; UNROLL-NO-IC: vector.ph:			; UNROLL-NO-IC: vector.ph:
	; UNROLL-NO-IC-NEXT: [[N_MOD_VF:%.*]] = urem i32 [[TMP3]], 4			; UNROLL-NO-IC-NEXT: [[N_MOD_VF:%.*]] = urem i32 [[TMP3]], 4
	; UNROLL-NO-IC-NEXT: [[N_VEC:%.*]] = sub i32 [[TMP3]], [[N_MOD_VF]]			; UNROLL-NO-IC-NEXT: [[N_VEC:%.*]] = sub i32 [[TMP3]], [[N_MOD_VF]]
	; UNROLL-NO-IC-NEXT: [[CAST_VTC:%.*]] = trunc i32 [[N_VEC]] to i8			; UNROLL-NO-IC-NEXT: [[CAST_VTC:%.*]] = trunc i32 [[N_VEC]] to i8
	; UNROLL-NO-IC-NEXT: [[IND_END:%.*]] = add i8 [[DOTPR_I]], [[CAST_VTC]]			; UNROLL-NO-IC-NEXT: [[IND_END:%.*]] = add i8 [[DOTPR_I]], [[CAST_VTC]]
	; UNROLL-NO-IC-NEXT: [[TMP4:%.*]] = insertelement <2 x i32> <i32 -1, i32 -1>, i32 [[C_PROMOTED_I]], i32 0
	; UNROLL-NO-IC-NEXT: [[BROADCAST_SPLATINSERT:%.*]] = insertelement <2 x i32> poison, i32 [[TMP0]], i32 0			; UNROLL-NO-IC-NEXT: [[BROADCAST_SPLATINSERT:%.*]] = insertelement <2 x i32> poison, i32 [[TMP0]], i32 0
	; UNROLL-NO-IC-NEXT: [[BROADCAST_SPLAT:%.*]] = shufflevector <2 x i32> [[BROADCAST_SPLATINSERT]], <2 x i32> poison, <2 x i32> zeroinitializer			; UNROLL-NO-IC-NEXT: [[BROADCAST_SPLAT:%.*]] = shufflevector <2 x i32> [[BROADCAST_SPLATINSERT]], <2 x i32> poison, <2 x i32> zeroinitializer
	; UNROLL-NO-IC-NEXT: [[BROADCAST_SPLATINSERT2:%.*]] = insertelement <2 x i32> poison, i32 [[TMP0]], i32 0			; UNROLL-NO-IC-NEXT: [[BROADCAST_SPLATINSERT2:%.*]] = insertelement <2 x i32> poison, i32 [[TMP0]], i32 0
	; UNROLL-NO-IC-NEXT: [[BROADCAST_SPLAT3:%.*]] = shufflevector <2 x i32> [[BROADCAST_SPLATINSERT2]], <2 x i32> poison, <2 x i32> zeroinitializer			; UNROLL-NO-IC-NEXT: [[BROADCAST_SPLAT3:%.*]] = shufflevector <2 x i32> [[BROADCAST_SPLATINSERT2]], <2 x i32> poison, <2 x i32> zeroinitializer
	; UNROLL-NO-IC-NEXT: br label [[VECTOR_BODY:%.*]]			; UNROLL-NO-IC-NEXT: br label [[VECTOR_BODY:%.*]]
	; UNROLL-NO-IC: vector.body:			; UNROLL-NO-IC: vector.body:
	; UNROLL-NO-IC-NEXT: [[INDEX:%.]] = phi i32 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[VECTOR_BODY]] ]			; UNROLL-NO-IC-NEXT: [[INDEX:%.]] = phi i32 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[VECTOR_BODY]] ]
	; UNROLL-NO-IC-NEXT: [[VEC_PHI:%.]] = phi <2 x i32> [ [[TMP4]], [[VECTOR_PH]] ], [ [[TMP5:%.]], [[VECTOR_BODY]] ]			; UNROLL-NO-IC-NEXT: [[VEC_PHI:%.]] = phi <2 x i32> [ <i32 -1, i32 -1>, [[VECTOR_PH]] ], [ [[TMP4:%.]], [[VECTOR_BODY]] ]
	; UNROLL-NO-IC-NEXT: [[VEC_PHI1:%.]] = phi <2 x i32> [ <i32 -1, i32 -1>, [[VECTOR_PH]] ], [ [[TMP6:%.]], [[VECTOR_BODY]] ]			; UNROLL-NO-IC-NEXT: [[VEC_PHI1:%.]] = phi <2 x i32> [ <i32 -1, i32 -1>, [[VECTOR_PH]] ], [ [[TMP5:%.]], [[VECTOR_BODY]] ]
	; UNROLL-NO-IC-NEXT: [[TMP5]] = and <2 x i32> [[BROADCAST_SPLAT]], [[VEC_PHI]]			; UNROLL-NO-IC-NEXT: [[TMP4]] = and <2 x i32> [[BROADCAST_SPLAT]], [[VEC_PHI]]
	; UNROLL-NO-IC-NEXT: [[TMP6]] = and <2 x i32> [[BROADCAST_SPLAT3]], [[VEC_PHI1]]			; UNROLL-NO-IC-NEXT: [[TMP5]] = and <2 x i32> [[BROADCAST_SPLAT3]], [[VEC_PHI1]]
	; UNROLL-NO-IC-NEXT: [[INDEX_NEXT]] = add nuw i32 [[INDEX]], 4			; UNROLL-NO-IC-NEXT: [[INDEX_NEXT]] = add nuw i32 [[INDEX]], 4
	; UNROLL-NO-IC-NEXT: [[TMP7:%.*]] = icmp eq i32 [[INDEX_NEXT]], [[N_VEC]]			; UNROLL-NO-IC-NEXT: [[TMP6:%.*]] = icmp eq i32 [[INDEX_NEXT]], [[N_VEC]]
	; UNROLL-NO-IC-NEXT: br i1 [[TMP7]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP34:![0-9]+]]			; UNROLL-NO-IC-NEXT: br i1 [[TMP6]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP34:![0-9]+]]
	; UNROLL-NO-IC: middle.block:			; UNROLL-NO-IC: middle.block:
	; UNROLL-NO-IC-NEXT: [[BIN_RDX:%.*]] = and <2 x i32> [[TMP6]], [[TMP5]]			; UNROLL-NO-IC-NEXT: [[BIN_RDX:%.*]] = and <2 x i32> [[TMP5]], [[TMP4]]
	; UNROLL-NO-IC-NEXT: [[TMP8:%.*]] = call i32 @llvm.vector.reduce.and.v2i32(<2 x i32> [[BIN_RDX]])			; UNROLL-NO-IC-NEXT: [[TMP7:%.*]] = call i32 @llvm.vector.reduce.and.v2i32(<2 x i32> [[BIN_RDX]])
				; UNROLL-NO-IC-NEXT: [[RDX_START:%.*]] = and i32 [[C_PROMOTED_I]], [[TMP7]]
	; UNROLL-NO-IC-NEXT: [[CMP_N:%.*]] = icmp eq i32 [[TMP3]], [[N_VEC]]			; UNROLL-NO-IC-NEXT: [[CMP_N:%.*]] = icmp eq i32 [[TMP3]], [[N_VEC]]
	; UNROLL-NO-IC-NEXT: br i1 [[CMP_N]], label [[LOOPEXIT:%.*]], label [[SCALAR_PH]]			; UNROLL-NO-IC-NEXT: br i1 [[CMP_N]], label [[LOOPEXIT:%.*]], label [[SCALAR_PH]]
	; UNROLL-NO-IC: scalar.ph:			; UNROLL-NO-IC: scalar.ph:
	; UNROLL-NO-IC-NEXT: [[BC_RESUME_VAL:%.]] = phi i8 [ [[IND_END]], [[MIDDLE_BLOCK]] ], [ [[DOTPR_I]], [[ENTRY:%.]] ]			; UNROLL-NO-IC-NEXT: [[BC_RESUME_VAL:%.]] = phi i8 [ [[IND_END]], [[MIDDLE_BLOCK]] ], [ [[DOTPR_I]], [[ENTRY:%.]] ]
	; UNROLL-NO-IC-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ [[C_PROMOTED_I]], [[ENTRY]] ], [ [[TMP8]], [[MIDDLE_BLOCK]] ]			; UNROLL-NO-IC-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ [[C_PROMOTED_I]], [[ENTRY]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; UNROLL-NO-IC-NEXT: br label [[COND_END_I:%.*]]			; UNROLL-NO-IC-NEXT: br label [[COND_END_I:%.*]]
	; UNROLL-NO-IC: cond.end.i:			; UNROLL-NO-IC: cond.end.i:
	; UNROLL-NO-IC-NEXT: [[INC4_I:%.]] = phi i8 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[INC_I:%.]], [[COND_END_I]] ]			; UNROLL-NO-IC-NEXT: [[INC4_I:%.]] = phi i8 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[INC_I:%.]], [[COND_END_I]] ]
	; UNROLL-NO-IC-NEXT: [[AND3_I:%.]] = phi i32 [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[AND_I:%.]], [[COND_END_I]] ]			; UNROLL-NO-IC-NEXT: [[AND3_I:%.]] = phi i32 [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[AND_I:%.]], [[COND_END_I]] ]
	; UNROLL-NO-IC-NEXT: [[AND_I]] = and i32 [[TMP0]], [[AND3_I]]			; UNROLL-NO-IC-NEXT: [[AND_I]] = and i32 [[TMP0]], [[AND3_I]]
	; UNROLL-NO-IC-NEXT: [[INC_I]] = add i8 [[INC4_I]], 1			; UNROLL-NO-IC-NEXT: [[INC_I]] = add i8 [[INC4_I]], 1
	; UNROLL-NO-IC-NEXT: [[TOBOOL_I:%.*]] = icmp eq i8 [[INC_I]], 0			; UNROLL-NO-IC-NEXT: [[TOBOOL_I:%.*]] = icmp eq i8 [[INC_I]], 0
	; UNROLL-NO-IC-NEXT: br i1 [[TOBOOL_I]], label [[LOOPEXIT]], label [[COND_END_I]], !llvm.loop [[LOOP35:![0-9]+]]			; UNROLL-NO-IC-NEXT: br i1 [[TOBOOL_I]], label [[LOOPEXIT]], label [[COND_END_I]], !llvm.loop [[LOOP35:![0-9]+]]
	; UNROLL-NO-IC: loopexit:			; UNROLL-NO-IC: loopexit:
	; UNROLL-NO-IC-NEXT: [[AND_I_LCSSA:%.*]] = phi i32 [ [[AND_I]], [[COND_END_I]] ], [ [[TMP8]], [[MIDDLE_BLOCK]] ]			; UNROLL-NO-IC-NEXT: [[AND_I_LCSSA:%.*]] = phi i32 [ [[AND_I]], [[COND_END_I]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; UNROLL-NO-IC-NEXT: ret i32 [[AND_I_LCSSA]]			; UNROLL-NO-IC-NEXT: ret i32 [[AND_I_LCSSA]]
	;			;
	; INTERLEAVE-LABEL: @testoverflowcheck(			; INTERLEAVE-LABEL: @testoverflowcheck(
	; INTERLEAVE-NEXT: entry:			; INTERLEAVE-NEXT: entry:
	; INTERLEAVE-NEXT: [[DOTPR_I:%.]] = load i8, i8 @e, align 1			; INTERLEAVE-NEXT: [[DOTPR_I:%.]] = load i8, i8 @e, align 1
	; INTERLEAVE-NEXT: [[TMP0:%.]] = load i32, i32 @d, align 4			; INTERLEAVE-NEXT: [[TMP0:%.]] = load i32, i32 @d, align 4
	; INTERLEAVE-NEXT: [[C_PROMOTED_I:%.]] = load i32, i32 @c, align 4			; INTERLEAVE-NEXT: [[C_PROMOTED_I:%.]] = load i32, i32 @c, align 4
	; INTERLEAVE-NEXT: [[TMP1:%.*]] = xor i8 [[DOTPR_I]], -1			; INTERLEAVE-NEXT: [[TMP1:%.*]] = xor i8 [[DOTPR_I]], -1
	; INTERLEAVE-NEXT: [[TMP2:%.*]] = zext i8 [[TMP1]] to i32			; INTERLEAVE-NEXT: [[TMP2:%.*]] = zext i8 [[TMP1]] to i32
	; INTERLEAVE-NEXT: [[TMP3:%.*]] = add nuw nsw i32 [[TMP2]], 1			; INTERLEAVE-NEXT: [[TMP3:%.*]] = add nuw nsw i32 [[TMP2]], 1
	; INTERLEAVE-NEXT: [[MIN_ITERS_CHECK:%.*]] = icmp ugt i8 [[DOTPR_I]], -8			; INTERLEAVE-NEXT: [[MIN_ITERS_CHECK:%.*]] = icmp ugt i8 [[DOTPR_I]], -8
	; INTERLEAVE-NEXT: br i1 [[MIN_ITERS_CHECK]], label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]			; INTERLEAVE-NEXT: br i1 [[MIN_ITERS_CHECK]], label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]
	; INTERLEAVE: vector.ph:			; INTERLEAVE: vector.ph:
	; INTERLEAVE-NEXT: [[N_VEC:%.*]] = and i32 [[TMP3]], -8			; INTERLEAVE-NEXT: [[N_VEC:%.*]] = and i32 [[TMP3]], -8
	; INTERLEAVE-NEXT: [[CAST_VTC:%.*]] = trunc i32 [[N_VEC]] to i8			; INTERLEAVE-NEXT: [[CAST_VTC:%.*]] = trunc i32 [[N_VEC]] to i8
	; INTERLEAVE-NEXT: [[IND_END:%.*]] = add i8 [[DOTPR_I]], [[CAST_VTC]]			; INTERLEAVE-NEXT: [[IND_END:%.*]] = add i8 [[DOTPR_I]], [[CAST_VTC]]
	; INTERLEAVE-NEXT: [[TMP4:%.*]] = insertelement <4 x i32> <i32 poison, i32 -1, i32 -1, i32 -1>, i32 [[C_PROMOTED_I]], i64 0
	; INTERLEAVE-NEXT: [[BROADCAST_SPLATINSERT:%.*]] = insertelement <4 x i32> poison, i32 [[TMP0]], i64 0			; INTERLEAVE-NEXT: [[BROADCAST_SPLATINSERT:%.*]] = insertelement <4 x i32> poison, i32 [[TMP0]], i64 0
	; INTERLEAVE-NEXT: [[BROADCAST_SPLATINSERT2:%.*]] = insertelement <4 x i32> poison, i32 [[TMP0]], i64 0			; INTERLEAVE-NEXT: [[BROADCAST_SPLATINSERT2:%.*]] = insertelement <4 x i32> poison, i32 [[TMP0]], i64 0
	; INTERLEAVE-NEXT: br label [[VECTOR_BODY:%.*]]			; INTERLEAVE-NEXT: br label [[VECTOR_BODY:%.*]]
	; INTERLEAVE: vector.body:			; INTERLEAVE: vector.body:
	; INTERLEAVE-NEXT: [[INDEX:%.]] = phi i32 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[VECTOR_BODY]] ]			; INTERLEAVE-NEXT: [[INDEX:%.]] = phi i32 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[VECTOR_BODY]] ]
	; INTERLEAVE-NEXT: [[INDEX_NEXT]] = add nuw i32 [[INDEX]], 8			; INTERLEAVE-NEXT: [[INDEX_NEXT]] = add nuw i32 [[INDEX]], 8
	; INTERLEAVE-NEXT: [[TMP5:%.*]] = icmp eq i32 [[INDEX_NEXT]], [[N_VEC]]			; INTERLEAVE-NEXT: [[TMP4:%.*]] = icmp eq i32 [[INDEX_NEXT]], [[N_VEC]]
	; INTERLEAVE-NEXT: br i1 [[TMP5]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP34:![0-9]+]]			; INTERLEAVE-NEXT: br i1 [[TMP4]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP34:![0-9]+]]
	; INTERLEAVE: middle.block:			; INTERLEAVE: middle.block:
	; INTERLEAVE-NEXT: [[TMP6:%.*]] = and <4 x i32> [[BROADCAST_SPLATINSERT2]], [[BROADCAST_SPLATINSERT]]			; INTERLEAVE-NEXT: [[TMP5:%.*]] = and <4 x i32> [[BROADCAST_SPLATINSERT2]], [[BROADCAST_SPLATINSERT]]
	; INTERLEAVE-NEXT: [[TMP7:%.*]] = shufflevector <4 x i32> [[TMP6]], <4 x i32> poison, <4 x i32> zeroinitializer			; INTERLEAVE-NEXT: [[BIN_RDX:%.*]] = shufflevector <4 x i32> [[TMP5]], <4 x i32> poison, <4 x i32> zeroinitializer
	; INTERLEAVE-NEXT: [[BIN_RDX:%.*]] = and <4 x i32> [[TMP7]], [[TMP4]]			; INTERLEAVE-NEXT: [[TMP6:%.*]] = call i32 @llvm.vector.reduce.and.v4i32(<4 x i32> [[BIN_RDX]])
	; INTERLEAVE-NEXT: [[TMP8:%.*]] = call i32 @llvm.vector.reduce.and.v4i32(<4 x i32> [[BIN_RDX]])			; INTERLEAVE-NEXT: [[RDX_START:%.*]] = and i32 [[C_PROMOTED_I]], [[TMP6]]
	; INTERLEAVE-NEXT: [[CMP_N:%.*]] = icmp eq i32 [[TMP3]], [[N_VEC]]			; INTERLEAVE-NEXT: [[CMP_N:%.*]] = icmp eq i32 [[TMP3]], [[N_VEC]]
	; INTERLEAVE-NEXT: br i1 [[CMP_N]], label [[LOOPEXIT:%.*]], label [[SCALAR_PH]]			; INTERLEAVE-NEXT: br i1 [[CMP_N]], label [[LOOPEXIT:%.*]], label [[SCALAR_PH]]
	; INTERLEAVE: scalar.ph:			; INTERLEAVE: scalar.ph:
	; INTERLEAVE-NEXT: [[BC_RESUME_VAL:%.]] = phi i8 [ [[IND_END]], [[MIDDLE_BLOCK]] ], [ [[DOTPR_I]], [[ENTRY:%.]] ]			; INTERLEAVE-NEXT: [[BC_RESUME_VAL:%.]] = phi i8 [ [[IND_END]], [[MIDDLE_BLOCK]] ], [ [[DOTPR_I]], [[ENTRY:%.]] ]
	; INTERLEAVE-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ [[TMP8]], [[MIDDLE_BLOCK]] ], [ [[C_PROMOTED_I]], [[ENTRY]] ]			; INTERLEAVE-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ [[RDX_START]], [[MIDDLE_BLOCK]] ], [ [[C_PROMOTED_I]], [[ENTRY]] ]
	; INTERLEAVE-NEXT: br label [[COND_END_I:%.*]]			; INTERLEAVE-NEXT: br label [[COND_END_I:%.*]]
	; INTERLEAVE: cond.end.i:			; INTERLEAVE: cond.end.i:
	; INTERLEAVE-NEXT: [[INC4_I:%.]] = phi i8 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[INC_I:%.]], [[COND_END_I]] ]			; INTERLEAVE-NEXT: [[INC4_I:%.]] = phi i8 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[INC_I:%.]], [[COND_END_I]] ]
	; INTERLEAVE-NEXT: [[TMP9:%.*]] = and i32 [[BC_MERGE_RDX]], [[TMP0]]			; INTERLEAVE-NEXT: [[TMP7:%.*]] = and i32 [[BC_MERGE_RDX]], [[TMP0]]
	; INTERLEAVE-NEXT: [[INC_I]] = add i8 [[INC4_I]], 1			; INTERLEAVE-NEXT: [[INC_I]] = add i8 [[INC4_I]], 1
	; INTERLEAVE-NEXT: [[TOBOOL_I:%.*]] = icmp eq i8 [[INC_I]], 0			; INTERLEAVE-NEXT: [[TOBOOL_I:%.*]] = icmp eq i8 [[INC_I]], 0
	; INTERLEAVE-NEXT: br i1 [[TOBOOL_I]], label [[LOOPEXIT]], label [[COND_END_I]], !llvm.loop [[LOOP35:![0-9]+]]			; INTERLEAVE-NEXT: br i1 [[TOBOOL_I]], label [[LOOPEXIT]], label [[COND_END_I]], !llvm.loop [[LOOP35:![0-9]+]]
	; INTERLEAVE: loopexit:			; INTERLEAVE: loopexit:
	; INTERLEAVE-NEXT: [[AND_I_LCSSA:%.*]] = phi i32 [ [[TMP9]], [[COND_END_I]] ], [ [[TMP8]], [[MIDDLE_BLOCK]] ]			; INTERLEAVE-NEXT: [[AND_I_LCSSA:%.*]] = phi i32 [ [[TMP7]], [[COND_END_I]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; INTERLEAVE-NEXT: ret i32 [[AND_I_LCSSA]]			; INTERLEAVE-NEXT: ret i32 [[AND_I_LCSSA]]
	;			;
	entry:			entry:
	%.pr.i = load i8, i8* @e, align 1			%.pr.i = load i8, i8* @e, align 1
	%0 = load i32, i32* @d, align 4			%0 = load i32, i32* @d, align 4
	%c.promoted.i = load i32, i32* @c, align 4			%c.promoted.i = load i32, i32* @c, align 4
	br label %cond.end.i			br label %cond.end.i

	▲ Show 20 Lines • Show All 1,737 Lines • ▼ Show 20 Lines
	; primary induction variable.			; primary induction variable.
	;			;
	;			;
	define i32 @PR32419(i32 %a, i16 %b) {			define i32 @PR32419(i32 %a, i16 %b) {
	; CHECK-LABEL: @PR32419(			; CHECK-LABEL: @PR32419(
	; CHECK-NEXT: entry:			; CHECK-NEXT: entry:
	; CHECK-NEXT: br i1 false, label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]			; CHECK-NEXT: br i1 false, label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]
	; CHECK: vector.ph:			; CHECK: vector.ph:
	; CHECK-NEXT: [[TMP0:%.]] = insertelement <2 x i32> zeroinitializer, i32 [[A:%.]], i32 0
	; CHECK-NEXT: br label [[VECTOR_BODY:%.*]]			; CHECK-NEXT: br label [[VECTOR_BODY:%.*]]
	; CHECK: vector.body:			; CHECK: vector.body:
	; CHECK-NEXT: [[INDEX:%.]] = phi i32 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[PRED_UREM_CONTINUE2:%.*]] ]			; CHECK-NEXT: [[INDEX:%.]] = phi i32 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[PRED_UREM_CONTINUE2:%.*]] ]
	; CHECK-NEXT: [[VEC_PHI:%.]] = phi <2 x i32> [ [[TMP0]], [[VECTOR_PH]] ], [ [[TMP15:%.]], [[PRED_UREM_CONTINUE2]] ]			; CHECK-NEXT: [[VEC_PHI:%.]] = phi <2 x i32> [ zeroinitializer, [[VECTOR_PH]] ], [ [[TMP14:%.]], [[PRED_UREM_CONTINUE2]] ]
	; CHECK-NEXT: [[VEC_IND:%.]] = phi <2 x i16> [ <i16 -20, i16 -19>, [[VECTOR_PH]] ], [ [[VEC_IND_NEXT:%.]], [[PRED_UREM_CONTINUE2]] ]			; CHECK-NEXT: [[VEC_IND:%.]] = phi <2 x i16> [ <i16 -20, i16 -19>, [[VECTOR_PH]] ], [ [[VEC_IND_NEXT:%.]], [[PRED_UREM_CONTINUE2]] ]
	; CHECK-NEXT: [[OFFSET_IDX:%.*]] = add i32 -20, [[INDEX]]			; CHECK-NEXT: [[OFFSET_IDX:%.*]] = add i32 -20, [[INDEX]]
	; CHECK-NEXT: [[TMP1:%.*]] = trunc i32 [[OFFSET_IDX]] to i16			; CHECK-NEXT: [[TMP0:%.*]] = trunc i32 [[OFFSET_IDX]] to i16
	; CHECK-NEXT: [[TMP2:%.*]] = icmp eq <2 x i16> [[VEC_IND]], zeroinitializer			; CHECK-NEXT: [[TMP1:%.*]] = icmp eq <2 x i16> [[VEC_IND]], zeroinitializer
	; CHECK-NEXT: [[TMP3:%.*]] = xor <2 x i1> [[TMP2]], <i1 true, i1 true>			; CHECK-NEXT: [[TMP2:%.*]] = xor <2 x i1> [[TMP1]], <i1 true, i1 true>
	; CHECK-NEXT: [[TMP4:%.*]] = extractelement <2 x i1> [[TMP3]], i32 0			; CHECK-NEXT: [[TMP3:%.*]] = extractelement <2 x i1> [[TMP2]], i32 0
	; CHECK-NEXT: br i1 [[TMP4]], label [[PRED_UREM_IF:%.]], label [[PRED_UREM_CONTINUE:%.]]			; CHECK-NEXT: br i1 [[TMP3]], label [[PRED_UREM_IF:%.]], label [[PRED_UREM_CONTINUE:%.]]
	; CHECK: pred.urem.if:			; CHECK: pred.urem.if:
	; CHECK-NEXT: [[TMP5:%.*]] = add i16 [[TMP1]], 0			; CHECK-NEXT: [[TMP4:%.*]] = add i16 [[TMP0]], 0
	; CHECK-NEXT: [[TMP6:%.]] = urem i16 [[B:%.]], [[TMP5]]			; CHECK-NEXT: [[TMP5:%.]] = urem i16 [[B:%.]], [[TMP4]]
	; CHECK-NEXT: [[TMP7:%.*]] = insertelement <2 x i16> poison, i16 [[TMP6]], i32 0			; CHECK-NEXT: [[TMP6:%.*]] = insertelement <2 x i16> poison, i16 [[TMP5]], i32 0
	; CHECK-NEXT: br label [[PRED_UREM_CONTINUE]]			; CHECK-NEXT: br label [[PRED_UREM_CONTINUE]]
	; CHECK: pred.urem.continue:			; CHECK: pred.urem.continue:
	; CHECK-NEXT: [[TMP8:%.*]] = phi <2 x i16> [ poison, [[VECTOR_BODY]] ], [ [[TMP7]], [[PRED_UREM_IF]] ]			; CHECK-NEXT: [[TMP7:%.*]] = phi <2 x i16> [ poison, [[VECTOR_BODY]] ], [ [[TMP6]], [[PRED_UREM_IF]] ]
	; CHECK-NEXT: [[TMP9:%.*]] = extractelement <2 x i1> [[TMP3]], i32 1			; CHECK-NEXT: [[TMP8:%.*]] = extractelement <2 x i1> [[TMP2]], i32 1
	; CHECK-NEXT: br i1 [[TMP9]], label [[PRED_UREM_IF1:%.*]], label [[PRED_UREM_CONTINUE2]]			; CHECK-NEXT: br i1 [[TMP8]], label [[PRED_UREM_IF1:%.*]], label [[PRED_UREM_CONTINUE2]]
	; CHECK: pred.urem.if1:			; CHECK: pred.urem.if1:
	; CHECK-NEXT: [[TMP10:%.*]] = add i16 [[TMP1]], 1			; CHECK-NEXT: [[TMP9:%.*]] = add i16 [[TMP0]], 1
	; CHECK-NEXT: [[TMP11:%.*]] = urem i16 [[B]], [[TMP10]]			; CHECK-NEXT: [[TMP10:%.*]] = urem i16 [[B]], [[TMP9]]
	; CHECK-NEXT: [[TMP12:%.*]] = insertelement <2 x i16> [[TMP8]], i16 [[TMP11]], i32 1			; CHECK-NEXT: [[TMP11:%.*]] = insertelement <2 x i16> [[TMP7]], i16 [[TMP10]], i32 1
	; CHECK-NEXT: br label [[PRED_UREM_CONTINUE2]]			; CHECK-NEXT: br label [[PRED_UREM_CONTINUE2]]
	; CHECK: pred.urem.continue2:			; CHECK: pred.urem.continue2:
	; CHECK-NEXT: [[TMP13:%.*]] = phi <2 x i16> [ [[TMP8]], [[PRED_UREM_CONTINUE]] ], [ [[TMP12]], [[PRED_UREM_IF1]] ]			; CHECK-NEXT: [[TMP12:%.*]] = phi <2 x i16> [ [[TMP7]], [[PRED_UREM_CONTINUE]] ], [ [[TMP11]], [[PRED_UREM_IF1]] ]
	; CHECK-NEXT: [[PREDPHI:%.*]] = select <2 x i1> [[TMP2]], <2 x i16> zeroinitializer, <2 x i16> [[TMP13]]			; CHECK-NEXT: [[PREDPHI:%.*]] = select <2 x i1> [[TMP1]], <2 x i16> zeroinitializer, <2 x i16> [[TMP12]]
	; CHECK-NEXT: [[TMP14:%.*]] = sext <2 x i16> [[PREDPHI]] to <2 x i32>			; CHECK-NEXT: [[TMP13:%.*]] = sext <2 x i16> [[PREDPHI]] to <2 x i32>
	; CHECK-NEXT: [[TMP15]] = or <2 x i32> [[VEC_PHI]], [[TMP14]]			; CHECK-NEXT: [[TMP14]] = or <2 x i32> [[VEC_PHI]], [[TMP13]]
	; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i32 [[INDEX]], 2			; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i32 [[INDEX]], 2
	; CHECK-NEXT: [[VEC_IND_NEXT]] = add <2 x i16> [[VEC_IND]], <i16 2, i16 2>			; CHECK-NEXT: [[VEC_IND_NEXT]] = add <2 x i16> [[VEC_IND]], <i16 2, i16 2>
	; CHECK-NEXT: [[TMP16:%.*]] = icmp eq i32 [[INDEX_NEXT]], 20			; CHECK-NEXT: [[TMP15:%.*]] = icmp eq i32 [[INDEX_NEXT]], 20
	; CHECK-NEXT: br i1 [[TMP16]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP48:![0-9]+]]			; CHECK-NEXT: br i1 [[TMP15]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP48:![0-9]+]]
	; CHECK: middle.block:			; CHECK: middle.block:
	; CHECK-NEXT: [[TMP17:%.*]] = call i32 @llvm.vector.reduce.or.v2i32(<2 x i32> [[TMP15]])			; CHECK-NEXT: [[TMP16:%.*]] = call i32 @llvm.vector.reduce.or.v2i32(<2 x i32> [[TMP14]])
				; CHECK-NEXT: [[RDX_START:%.]] = or i32 [[A:%.]], [[TMP16]]
	; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i32 20, 20			; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i32 20, 20
	; CHECK-NEXT: br i1 [[CMP_N]], label [[FOR_END:%.*]], label [[SCALAR_PH]]			; CHECK-NEXT: br i1 [[CMP_N]], label [[FOR_END:%.*]], label [[SCALAR_PH]]
	; CHECK: scalar.ph:			; CHECK: scalar.ph:
	; CHECK-NEXT: [[BC_RESUME_VAL:%.]] = phi i32 [ 0, [[MIDDLE_BLOCK]] ], [ -20, [[ENTRY:%.]] ]			; CHECK-NEXT: [[BC_RESUME_VAL:%.]] = phi i32 [ 0, [[MIDDLE_BLOCK]] ], [ -20, [[ENTRY:%.]] ]
	; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ [[A]], [[ENTRY]] ], [ [[TMP17]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ [[A]], [[ENTRY]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: br label [[FOR_BODY:%.*]]			; CHECK-NEXT: br label [[FOR_BODY:%.*]]
	; CHECK: for.body:			; CHECK: for.body:
	; CHECK-NEXT: [[I:%.]] = phi i32 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[I_NEXT:%.]], [[FOR_INC:%.*]] ]			; CHECK-NEXT: [[I:%.]] = phi i32 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[I_NEXT:%.]], [[FOR_INC:%.*]] ]
	; CHECK-NEXT: [[VAR0:%.]] = phi i32 [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[VAR6:%.]], [[FOR_INC]] ]			; CHECK-NEXT: [[VAR0:%.]] = phi i32 [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[VAR6:%.]], [[FOR_INC]] ]
	; CHECK-NEXT: [[VAR1:%.*]] = trunc i32 [[I]] to i16			; CHECK-NEXT: [[VAR1:%.*]] = trunc i32 [[I]] to i16
	; CHECK-NEXT: [[VAR2:%.*]] = icmp eq i16 [[VAR1]], 0			; CHECK-NEXT: [[VAR2:%.*]] = icmp eq i16 [[VAR1]], 0
	; CHECK-NEXT: br i1 [[VAR2]], label [[FOR_INC]], label [[FOR_COND:%.*]]			; CHECK-NEXT: br i1 [[VAR2]], label [[FOR_INC]], label [[FOR_COND:%.*]]
	; CHECK: for.cond:			; CHECK: for.cond:
	; CHECK-NEXT: [[VAR3:%.*]] = urem i16 [[B]], [[VAR1]]			; CHECK-NEXT: [[VAR3:%.*]] = urem i16 [[B]], [[VAR1]]
	; CHECK-NEXT: br label [[FOR_INC]]			; CHECK-NEXT: br label [[FOR_INC]]
	; CHECK: for.inc:			; CHECK: for.inc:
	; CHECK-NEXT: [[VAR4:%.*]] = phi i16 [ [[VAR3]], [[FOR_COND]] ], [ 0, [[FOR_BODY]] ]			; CHECK-NEXT: [[VAR4:%.*]] = phi i16 [ [[VAR3]], [[FOR_COND]] ], [ 0, [[FOR_BODY]] ]
	; CHECK-NEXT: [[VAR5:%.*]] = sext i16 [[VAR4]] to i32			; CHECK-NEXT: [[VAR5:%.*]] = sext i16 [[VAR4]] to i32
	; CHECK-NEXT: [[VAR6]] = or i32 [[VAR0]], [[VAR5]]			; CHECK-NEXT: [[VAR6]] = or i32 [[VAR0]], [[VAR5]]
	; CHECK-NEXT: [[I_NEXT]] = add nsw i32 [[I]], 1			; CHECK-NEXT: [[I_NEXT]] = add nsw i32 [[I]], 1
	; CHECK-NEXT: [[COND:%.*]] = icmp eq i32 [[I_NEXT]], 0			; CHECK-NEXT: [[COND:%.*]] = icmp eq i32 [[I_NEXT]], 0
	; CHECK-NEXT: br i1 [[COND]], label [[FOR_END]], label [[FOR_BODY]], !llvm.loop [[LOOP49:![0-9]+]]			; CHECK-NEXT: br i1 [[COND]], label [[FOR_END]], label [[FOR_BODY]], !llvm.loop [[LOOP49:![0-9]+]]
	; CHECK: for.end:			; CHECK: for.end:
	; CHECK-NEXT: [[VAR7:%.*]] = phi i32 [ [[VAR6]], [[FOR_INC]] ], [ [[TMP17]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[VAR7:%.*]] = phi i32 [ [[VAR6]], [[FOR_INC]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: ret i32 [[VAR7]]			; CHECK-NEXT: ret i32 [[VAR7]]
	;			;
	; IND-LABEL: @PR32419(			; IND-LABEL: @PR32419(
	; IND-NEXT: entry:			; IND-NEXT: entry:
	; IND-NEXT: br i1 false, label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]			; IND-NEXT: br i1 false, label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]
	; IND: vector.ph:			; IND: vector.ph:
	; IND-NEXT: [[TMP0:%.]] = insertelement <2 x i32> <i32 poison, i32 0>, i32 [[A:%.]], i64 0
	; IND-NEXT: br label [[VECTOR_BODY:%.*]]			; IND-NEXT: br label [[VECTOR_BODY:%.*]]
	; IND: vector.body:			; IND: vector.body:
	; IND-NEXT: [[INDEX:%.]] = phi i32 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[PRED_UREM_CONTINUE2:%.*]] ]			; IND-NEXT: [[INDEX:%.]] = phi i32 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[PRED_UREM_CONTINUE2:%.*]] ]
	; IND-NEXT: [[VEC_PHI:%.]] = phi <2 x i32> [ [[TMP0]], [[VECTOR_PH]] ], [ [[TMP15:%.]], [[PRED_UREM_CONTINUE2]] ]			; IND-NEXT: [[VEC_PHI:%.]] = phi <2 x i32> [ zeroinitializer, [[VECTOR_PH]] ], [ [[TMP14:%.]], [[PRED_UREM_CONTINUE2]] ]
	; IND-NEXT: [[VEC_IND:%.]] = phi <2 x i16> [ <i16 -20, i16 -19>, [[VECTOR_PH]] ], [ [[VEC_IND_NEXT:%.]], [[PRED_UREM_CONTINUE2]] ]			; IND-NEXT: [[VEC_IND:%.]] = phi <2 x i16> [ <i16 -20, i16 -19>, [[VECTOR_PH]] ], [ [[VEC_IND_NEXT:%.]], [[PRED_UREM_CONTINUE2]] ]
	; IND-NEXT: [[TMP1:%.*]] = trunc i32 [[INDEX]] to i16			; IND-NEXT: [[TMP0:%.*]] = trunc i32 [[INDEX]] to i16
	; IND-NEXT: [[TMP2:%.*]] = icmp eq <2 x i16> [[VEC_IND]], zeroinitializer			; IND-NEXT: [[TMP1:%.*]] = icmp eq <2 x i16> [[VEC_IND]], zeroinitializer
	; IND-NEXT: [[TMP3:%.*]] = xor <2 x i1> [[TMP2]], <i1 true, i1 true>			; IND-NEXT: [[TMP2:%.*]] = xor <2 x i1> [[TMP1]], <i1 true, i1 true>
	; IND-NEXT: [[TMP4:%.*]] = extractelement <2 x i1> [[TMP3]], i64 0			; IND-NEXT: [[TMP3:%.*]] = extractelement <2 x i1> [[TMP2]], i64 0
	; IND-NEXT: br i1 [[TMP4]], label [[PRED_UREM_IF:%.]], label [[PRED_UREM_CONTINUE:%.]]			; IND-NEXT: br i1 [[TMP3]], label [[PRED_UREM_IF:%.]], label [[PRED_UREM_CONTINUE:%.]]
	; IND: pred.urem.if:			; IND: pred.urem.if:
	; IND-NEXT: [[TMP5:%.*]] = add i16 [[TMP1]], -20			; IND-NEXT: [[TMP4:%.*]] = add i16 [[TMP0]], -20
	; IND-NEXT: [[TMP6:%.]] = urem i16 [[B:%.]], [[TMP5]]			; IND-NEXT: [[TMP5:%.]] = urem i16 [[B:%.]], [[TMP4]]
	; IND-NEXT: [[TMP7:%.*]] = insertelement <2 x i16> poison, i16 [[TMP6]], i64 0			; IND-NEXT: [[TMP6:%.*]] = insertelement <2 x i16> poison, i16 [[TMP5]], i64 0
	; IND-NEXT: br label [[PRED_UREM_CONTINUE]]			; IND-NEXT: br label [[PRED_UREM_CONTINUE]]
	; IND: pred.urem.continue:			; IND: pred.urem.continue:
	; IND-NEXT: [[TMP8:%.*]] = phi <2 x i16> [ poison, [[VECTOR_BODY]] ], [ [[TMP7]], [[PRED_UREM_IF]] ]			; IND-NEXT: [[TMP7:%.*]] = phi <2 x i16> [ poison, [[VECTOR_BODY]] ], [ [[TMP6]], [[PRED_UREM_IF]] ]
	; IND-NEXT: [[TMP9:%.*]] = extractelement <2 x i1> [[TMP3]], i64 1			; IND-NEXT: [[TMP8:%.*]] = extractelement <2 x i1> [[TMP2]], i64 1
	; IND-NEXT: br i1 [[TMP9]], label [[PRED_UREM_IF1:%.*]], label [[PRED_UREM_CONTINUE2]]			; IND-NEXT: br i1 [[TMP8]], label [[PRED_UREM_IF1:%.*]], label [[PRED_UREM_CONTINUE2]]
	; IND: pred.urem.if1:			; IND: pred.urem.if1:
	; IND-NEXT: [[TMP10:%.*]] = add i16 [[TMP1]], -19			; IND-NEXT: [[TMP9:%.*]] = add i16 [[TMP0]], -19
	; IND-NEXT: [[TMP11:%.*]] = urem i16 [[B]], [[TMP10]]			; IND-NEXT: [[TMP10:%.*]] = urem i16 [[B]], [[TMP9]]
	; IND-NEXT: [[TMP12:%.*]] = insertelement <2 x i16> [[TMP8]], i16 [[TMP11]], i64 1			; IND-NEXT: [[TMP11:%.*]] = insertelement <2 x i16> [[TMP7]], i16 [[TMP10]], i64 1
	; IND-NEXT: br label [[PRED_UREM_CONTINUE2]]			; IND-NEXT: br label [[PRED_UREM_CONTINUE2]]
	; IND: pred.urem.continue2:			; IND: pred.urem.continue2:
	; IND-NEXT: [[TMP13:%.*]] = phi <2 x i16> [ [[TMP8]], [[PRED_UREM_CONTINUE]] ], [ [[TMP12]], [[PRED_UREM_IF1]] ]			; IND-NEXT: [[TMP12:%.*]] = phi <2 x i16> [ [[TMP7]], [[PRED_UREM_CONTINUE]] ], [ [[TMP11]], [[PRED_UREM_IF1]] ]
	; IND-NEXT: [[PREDPHI:%.*]] = select <2 x i1> [[TMP2]], <2 x i16> zeroinitializer, <2 x i16> [[TMP13]]			; IND-NEXT: [[PREDPHI:%.*]] = select <2 x i1> [[TMP1]], <2 x i16> zeroinitializer, <2 x i16> [[TMP12]]
	; IND-NEXT: [[TMP14:%.*]] = sext <2 x i16> [[PREDPHI]] to <2 x i32>			; IND-NEXT: [[TMP13:%.*]] = sext <2 x i16> [[PREDPHI]] to <2 x i32>
	; IND-NEXT: [[TMP15]] = or <2 x i32> [[VEC_PHI]], [[TMP14]]			; IND-NEXT: [[TMP14]] = or <2 x i32> [[VEC_PHI]], [[TMP13]]
	; IND-NEXT: [[INDEX_NEXT]] = add nuw i32 [[INDEX]], 2			; IND-NEXT: [[INDEX_NEXT]] = add nuw i32 [[INDEX]], 2
	; IND-NEXT: [[VEC_IND_NEXT]] = add <2 x i16> [[VEC_IND]], <i16 2, i16 2>			; IND-NEXT: [[VEC_IND_NEXT]] = add <2 x i16> [[VEC_IND]], <i16 2, i16 2>
	; IND-NEXT: [[TMP16:%.*]] = icmp eq i32 [[INDEX_NEXT]], 20			; IND-NEXT: [[TMP15:%.*]] = icmp eq i32 [[INDEX_NEXT]], 20
	; IND-NEXT: br i1 [[TMP16]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP48:![0-9]+]]			; IND-NEXT: br i1 [[TMP15]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP48:![0-9]+]]
	; IND: middle.block:			; IND: middle.block:
	; IND-NEXT: [[TMP17:%.*]] = call i32 @llvm.vector.reduce.or.v2i32(<2 x i32> [[TMP15]])			; IND-NEXT: [[TMP16:%.*]] = call i32 @llvm.vector.reduce.or.v2i32(<2 x i32> [[TMP14]])
				; IND-NEXT: [[RDX_START:%.]] = or i32 [[TMP16]], [[A:%.]]
	; IND-NEXT: br i1 true, label [[FOR_END:%.*]], label [[SCALAR_PH]]			; IND-NEXT: br i1 true, label [[FOR_END:%.*]], label [[SCALAR_PH]]
	; IND: scalar.ph:			; IND: scalar.ph:
	; IND-NEXT: br label [[FOR_BODY:%.*]]			; IND-NEXT: br label [[FOR_BODY:%.*]]
	; IND: for.body:			; IND: for.body:
	; IND-NEXT: br i1 poison, label [[FOR_INC:%.]], label [[FOR_COND:%.]]			; IND-NEXT: br i1 poison, label [[FOR_INC:%.]], label [[FOR_COND:%.]]
	; IND: for.cond:			; IND: for.cond:
	; IND-NEXT: br label [[FOR_INC]]			; IND-NEXT: br label [[FOR_INC]]
	; IND: for.inc:			; IND: for.inc:
	; IND-NEXT: br i1 poison, label [[FOR_END]], label [[FOR_BODY]], !llvm.loop [[LOOP49:![0-9]+]]			; IND-NEXT: br i1 poison, label [[FOR_END]], label [[FOR_BODY]], !llvm.loop [[LOOP49:![0-9]+]]
	; IND: for.end:			; IND: for.end:
	; IND-NEXT: [[VAR7:%.*]] = phi i32 [ poison, [[FOR_INC]] ], [ [[TMP17]], [[MIDDLE_BLOCK]] ]			; IND-NEXT: [[VAR7:%.*]] = phi i32 [ poison, [[FOR_INC]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; IND-NEXT: ret i32 [[VAR7]]			; IND-NEXT: ret i32 [[VAR7]]
	;			;
	; UNROLL-LABEL: @PR32419(			; UNROLL-LABEL: @PR32419(
	; UNROLL-NEXT: entry:			; UNROLL-NEXT: entry:
	; UNROLL-NEXT: br i1 false, label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]			; UNROLL-NEXT: br i1 false, label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]
	; UNROLL: vector.ph:			; UNROLL: vector.ph:
	; UNROLL-NEXT: [[TMP0:%.]] = insertelement <2 x i32> <i32 poison, i32 0>, i32 [[A:%.]], i64 0
	; UNROLL-NEXT: br label [[VECTOR_BODY:%.*]]			; UNROLL-NEXT: br label [[VECTOR_BODY:%.*]]
	; UNROLL: vector.body:			; UNROLL: vector.body:
	; UNROLL-NEXT: [[INDEX:%.]] = phi i32 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[PRED_UREM_CONTINUE8:%.*]] ]			; UNROLL-NEXT: [[INDEX:%.]] = phi i32 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[PRED_UREM_CONTINUE8:%.*]] ]
	; UNROLL-NEXT: [[VEC_PHI:%.]] = phi <2 x i32> [ [[TMP0]], [[VECTOR_PH]] ], [ [[TMP28:%.]], [[PRED_UREM_CONTINUE8]] ]			; UNROLL-NEXT: [[VEC_PHI:%.]] = phi <2 x i32> [ zeroinitializer, [[VECTOR_PH]] ], [ [[TMP27:%.]], [[PRED_UREM_CONTINUE8]] ]
	; UNROLL-NEXT: [[VEC_PHI1:%.]] = phi <2 x i32> [ zeroinitializer, [[VECTOR_PH]] ], [ [[TMP29:%.]], [[PRED_UREM_CONTINUE8]] ]			; UNROLL-NEXT: [[VEC_PHI1:%.]] = phi <2 x i32> [ zeroinitializer, [[VECTOR_PH]] ], [ [[TMP28:%.]], [[PRED_UREM_CONTINUE8]] ]
	; UNROLL-NEXT: [[VEC_IND:%.]] = phi <2 x i16> [ <i16 -20, i16 -19>, [[VECTOR_PH]] ], [ [[VEC_IND_NEXT:%.]], [[PRED_UREM_CONTINUE8]] ]			; UNROLL-NEXT: [[VEC_IND:%.]] = phi <2 x i16> [ <i16 -20, i16 -19>, [[VECTOR_PH]] ], [ [[VEC_IND_NEXT:%.]], [[PRED_UREM_CONTINUE8]] ]
	; UNROLL-NEXT: [[TMP1:%.*]] = trunc i32 [[INDEX]] to i16			; UNROLL-NEXT: [[TMP0:%.*]] = trunc i32 [[INDEX]] to i16
	; UNROLL-NEXT: [[TMP2:%.*]] = icmp eq <2 x i16> [[VEC_IND]], zeroinitializer			; UNROLL-NEXT: [[TMP1:%.*]] = icmp eq <2 x i16> [[VEC_IND]], zeroinitializer
	; UNROLL-NEXT: [[TMP3:%.*]] = icmp eq <2 x i16> [[VEC_IND]], <i16 -2, i16 -2>			; UNROLL-NEXT: [[TMP2:%.*]] = icmp eq <2 x i16> [[VEC_IND]], <i16 -2, i16 -2>
				; UNROLL-NEXT: [[TMP3:%.*]] = xor <2 x i1> [[TMP1]], <i1 true, i1 true>
	; UNROLL-NEXT: [[TMP4:%.*]] = xor <2 x i1> [[TMP2]], <i1 true, i1 true>			; UNROLL-NEXT: [[TMP4:%.*]] = xor <2 x i1> [[TMP2]], <i1 true, i1 true>
	; UNROLL-NEXT: [[TMP5:%.*]] = xor <2 x i1> [[TMP3]], <i1 true, i1 true>			; UNROLL-NEXT: [[TMP5:%.*]] = extractelement <2 x i1> [[TMP3]], i64 0
	; UNROLL-NEXT: [[TMP6:%.*]] = extractelement <2 x i1> [[TMP4]], i64 0			; UNROLL-NEXT: br i1 [[TMP5]], label [[PRED_UREM_IF:%.]], label [[PRED_UREM_CONTINUE:%.]]
	; UNROLL-NEXT: br i1 [[TMP6]], label [[PRED_UREM_IF:%.]], label [[PRED_UREM_CONTINUE:%.]]
	; UNROLL: pred.urem.if:			; UNROLL: pred.urem.if:
	; UNROLL-NEXT: [[TMP7:%.*]] = add i16 [[TMP1]], -20			; UNROLL-NEXT: [[TMP6:%.*]] = add i16 [[TMP0]], -20
	; UNROLL-NEXT: [[TMP8:%.]] = urem i16 [[B:%.]], [[TMP7]]			; UNROLL-NEXT: [[TMP7:%.]] = urem i16 [[B:%.]], [[TMP6]]
	; UNROLL-NEXT: [[TMP9:%.*]] = insertelement <2 x i16> poison, i16 [[TMP8]], i64 0			; UNROLL-NEXT: [[TMP8:%.*]] = insertelement <2 x i16> poison, i16 [[TMP7]], i64 0
	; UNROLL-NEXT: br label [[PRED_UREM_CONTINUE]]			; UNROLL-NEXT: br label [[PRED_UREM_CONTINUE]]
	; UNROLL: pred.urem.continue:			; UNROLL: pred.urem.continue:
	; UNROLL-NEXT: [[TMP10:%.*]] = phi <2 x i16> [ poison, [[VECTOR_BODY]] ], [ [[TMP9]], [[PRED_UREM_IF]] ]			; UNROLL-NEXT: [[TMP9:%.*]] = phi <2 x i16> [ poison, [[VECTOR_BODY]] ], [ [[TMP8]], [[PRED_UREM_IF]] ]
	; UNROLL-NEXT: [[TMP11:%.*]] = extractelement <2 x i1> [[TMP4]], i64 1			; UNROLL-NEXT: [[TMP10:%.*]] = extractelement <2 x i1> [[TMP3]], i64 1
	; UNROLL-NEXT: br i1 [[TMP11]], label [[PRED_UREM_IF3:%.]], label [[PRED_UREM_CONTINUE4:%.]]			; UNROLL-NEXT: br i1 [[TMP10]], label [[PRED_UREM_IF3:%.]], label [[PRED_UREM_CONTINUE4:%.]]
	; UNROLL: pred.urem.if3:			; UNROLL: pred.urem.if3:
	; UNROLL-NEXT: [[TMP12:%.*]] = add i16 [[TMP1]], -19			; UNROLL-NEXT: [[TMP11:%.*]] = add i16 [[TMP0]], -19
	; UNROLL-NEXT: [[TMP13:%.*]] = urem i16 [[B]], [[TMP12]]			; UNROLL-NEXT: [[TMP12:%.*]] = urem i16 [[B]], [[TMP11]]
	; UNROLL-NEXT: [[TMP14:%.*]] = insertelement <2 x i16> [[TMP10]], i16 [[TMP13]], i64 1			; UNROLL-NEXT: [[TMP13:%.*]] = insertelement <2 x i16> [[TMP9]], i16 [[TMP12]], i64 1
	; UNROLL-NEXT: br label [[PRED_UREM_CONTINUE4]]			; UNROLL-NEXT: br label [[PRED_UREM_CONTINUE4]]
	; UNROLL: pred.urem.continue4:			; UNROLL: pred.urem.continue4:
	; UNROLL-NEXT: [[TMP15:%.*]] = phi <2 x i16> [ [[TMP10]], [[PRED_UREM_CONTINUE]] ], [ [[TMP14]], [[PRED_UREM_IF3]] ]			; UNROLL-NEXT: [[TMP14:%.*]] = phi <2 x i16> [ [[TMP9]], [[PRED_UREM_CONTINUE]] ], [ [[TMP13]], [[PRED_UREM_IF3]] ]
	; UNROLL-NEXT: [[TMP16:%.*]] = extractelement <2 x i1> [[TMP5]], i64 0			; UNROLL-NEXT: [[TMP15:%.*]] = extractelement <2 x i1> [[TMP4]], i64 0
	; UNROLL-NEXT: br i1 [[TMP16]], label [[PRED_UREM_IF5:%.]], label [[PRED_UREM_CONTINUE6:%.]]			; UNROLL-NEXT: br i1 [[TMP15]], label [[PRED_UREM_IF5:%.]], label [[PRED_UREM_CONTINUE6:%.]]
	; UNROLL: pred.urem.if5:			; UNROLL: pred.urem.if5:
	; UNROLL-NEXT: [[TMP17:%.*]] = add i16 [[TMP1]], -18			; UNROLL-NEXT: [[TMP16:%.*]] = add i16 [[TMP0]], -18
	; UNROLL-NEXT: [[TMP18:%.*]] = urem i16 [[B]], [[TMP17]]			; UNROLL-NEXT: [[TMP17:%.*]] = urem i16 [[B]], [[TMP16]]
	; UNROLL-NEXT: [[TMP19:%.*]] = insertelement <2 x i16> poison, i16 [[TMP18]], i64 0			; UNROLL-NEXT: [[TMP18:%.*]] = insertelement <2 x i16> poison, i16 [[TMP17]], i64 0
	; UNROLL-NEXT: br label [[PRED_UREM_CONTINUE6]]			; UNROLL-NEXT: br label [[PRED_UREM_CONTINUE6]]
	; UNROLL: pred.urem.continue6:			; UNROLL: pred.urem.continue6:
	; UNROLL-NEXT: [[TMP20:%.*]] = phi <2 x i16> [ poison, [[PRED_UREM_CONTINUE4]] ], [ [[TMP19]], [[PRED_UREM_IF5]] ]			; UNROLL-NEXT: [[TMP19:%.*]] = phi <2 x i16> [ poison, [[PRED_UREM_CONTINUE4]] ], [ [[TMP18]], [[PRED_UREM_IF5]] ]
	; UNROLL-NEXT: [[TMP21:%.*]] = extractelement <2 x i1> [[TMP5]], i64 1			; UNROLL-NEXT: [[TMP20:%.*]] = extractelement <2 x i1> [[TMP4]], i64 1
	; UNROLL-NEXT: br i1 [[TMP21]], label [[PRED_UREM_IF7:%.*]], label [[PRED_UREM_CONTINUE8]]			; UNROLL-NEXT: br i1 [[TMP20]], label [[PRED_UREM_IF7:%.*]], label [[PRED_UREM_CONTINUE8]]
	; UNROLL: pred.urem.if7:			; UNROLL: pred.urem.if7:
	; UNROLL-NEXT: [[TMP22:%.*]] = add i16 [[TMP1]], -17			; UNROLL-NEXT: [[TMP21:%.*]] = add i16 [[TMP0]], -17
	; UNROLL-NEXT: [[TMP23:%.*]] = urem i16 [[B]], [[TMP22]]			; UNROLL-NEXT: [[TMP22:%.*]] = urem i16 [[B]], [[TMP21]]
	; UNROLL-NEXT: [[TMP24:%.*]] = insertelement <2 x i16> [[TMP20]], i16 [[TMP23]], i64 1			; UNROLL-NEXT: [[TMP23:%.*]] = insertelement <2 x i16> [[TMP19]], i16 [[TMP22]], i64 1
	; UNROLL-NEXT: br label [[PRED_UREM_CONTINUE8]]			; UNROLL-NEXT: br label [[PRED_UREM_CONTINUE8]]
	; UNROLL: pred.urem.continue8:			; UNROLL: pred.urem.continue8:
	; UNROLL-NEXT: [[TMP25:%.*]] = phi <2 x i16> [ [[TMP20]], [[PRED_UREM_CONTINUE6]] ], [ [[TMP24]], [[PRED_UREM_IF7]] ]			; UNROLL-NEXT: [[TMP24:%.*]] = phi <2 x i16> [ [[TMP19]], [[PRED_UREM_CONTINUE6]] ], [ [[TMP23]], [[PRED_UREM_IF7]] ]
	; UNROLL-NEXT: [[PREDPHI:%.*]] = select <2 x i1> [[TMP2]], <2 x i16> zeroinitializer, <2 x i16> [[TMP15]]			; UNROLL-NEXT: [[PREDPHI:%.*]] = select <2 x i1> [[TMP1]], <2 x i16> zeroinitializer, <2 x i16> [[TMP14]]
	; UNROLL-NEXT: [[PREDPHI9:%.*]] = select <2 x i1> [[TMP3]], <2 x i16> zeroinitializer, <2 x i16> [[TMP25]]			; UNROLL-NEXT: [[PREDPHI9:%.*]] = select <2 x i1> [[TMP2]], <2 x i16> zeroinitializer, <2 x i16> [[TMP24]]
	; UNROLL-NEXT: [[TMP26:%.*]] = sext <2 x i16> [[PREDPHI]] to <2 x i32>			; UNROLL-NEXT: [[TMP25:%.*]] = sext <2 x i16> [[PREDPHI]] to <2 x i32>
	; UNROLL-NEXT: [[TMP27:%.*]] = sext <2 x i16> [[PREDPHI9]] to <2 x i32>			; UNROLL-NEXT: [[TMP26:%.*]] = sext <2 x i16> [[PREDPHI9]] to <2 x i32>
	; UNROLL-NEXT: [[TMP28]] = or <2 x i32> [[VEC_PHI]], [[TMP26]]			; UNROLL-NEXT: [[TMP27]] = or <2 x i32> [[VEC_PHI]], [[TMP25]]
	; UNROLL-NEXT: [[TMP29]] = or <2 x i32> [[VEC_PHI1]], [[TMP27]]			; UNROLL-NEXT: [[TMP28]] = or <2 x i32> [[VEC_PHI1]], [[TMP26]]
	; UNROLL-NEXT: [[INDEX_NEXT]] = add nuw i32 [[INDEX]], 4			; UNROLL-NEXT: [[INDEX_NEXT]] = add nuw i32 [[INDEX]], 4
	; UNROLL-NEXT: [[VEC_IND_NEXT]] = add <2 x i16> [[VEC_IND]], <i16 4, i16 4>			; UNROLL-NEXT: [[VEC_IND_NEXT]] = add <2 x i16> [[VEC_IND]], <i16 4, i16 4>
	; UNROLL-NEXT: [[TMP30:%.*]] = icmp eq i32 [[INDEX_NEXT]], 20			; UNROLL-NEXT: [[TMP29:%.*]] = icmp eq i32 [[INDEX_NEXT]], 20
	; UNROLL-NEXT: br i1 [[TMP30]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP48:![0-9]+]]			; UNROLL-NEXT: br i1 [[TMP29]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP48:![0-9]+]]
	; UNROLL: middle.block:			; UNROLL: middle.block:
	; UNROLL-NEXT: [[BIN_RDX:%.*]] = or <2 x i32> [[TMP29]], [[TMP28]]			; UNROLL-NEXT: [[BIN_RDX:%.*]] = or <2 x i32> [[TMP28]], [[TMP27]]
	; UNROLL-NEXT: [[TMP31:%.*]] = call i32 @llvm.vector.reduce.or.v2i32(<2 x i32> [[BIN_RDX]])			; UNROLL-NEXT: [[TMP30:%.*]] = call i32 @llvm.vector.reduce.or.v2i32(<2 x i32> [[BIN_RDX]])
				; UNROLL-NEXT: [[RDX_START:%.]] = or i32 [[TMP30]], [[A:%.]]
	; UNROLL-NEXT: br i1 true, label [[FOR_END:%.*]], label [[SCALAR_PH]]			; UNROLL-NEXT: br i1 true, label [[FOR_END:%.*]], label [[SCALAR_PH]]
	; UNROLL: scalar.ph:			; UNROLL: scalar.ph:
	; UNROLL-NEXT: br label [[FOR_BODY:%.*]]			; UNROLL-NEXT: br label [[FOR_BODY:%.*]]
	; UNROLL: for.body:			; UNROLL: for.body:
	; UNROLL-NEXT: br i1 poison, label [[FOR_INC:%.]], label [[FOR_COND:%.]]			; UNROLL-NEXT: br i1 poison, label [[FOR_INC:%.]], label [[FOR_COND:%.]]
	; UNROLL: for.cond:			; UNROLL: for.cond:
	; UNROLL-NEXT: br label [[FOR_INC]]			; UNROLL-NEXT: br label [[FOR_INC]]
	; UNROLL: for.inc:			; UNROLL: for.inc:
	; UNROLL-NEXT: br i1 poison, label [[FOR_END]], label [[FOR_BODY]], !llvm.loop [[LOOP49:![0-9]+]]			; UNROLL-NEXT: br i1 poison, label [[FOR_END]], label [[FOR_BODY]], !llvm.loop [[LOOP49:![0-9]+]]
	; UNROLL: for.end:			; UNROLL: for.end:
	; UNROLL-NEXT: [[VAR7:%.*]] = phi i32 [ poison, [[FOR_INC]] ], [ [[TMP31]], [[MIDDLE_BLOCK]] ]			; UNROLL-NEXT: [[VAR7:%.*]] = phi i32 [ poison, [[FOR_INC]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; UNROLL-NEXT: ret i32 [[VAR7]]			; UNROLL-NEXT: ret i32 [[VAR7]]
	;			;
	; UNROLL-NO-IC-LABEL: @PR32419(			; UNROLL-NO-IC-LABEL: @PR32419(
	; UNROLL-NO-IC-NEXT: entry:			; UNROLL-NO-IC-NEXT: entry:
	; UNROLL-NO-IC-NEXT: br i1 false, label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]			; UNROLL-NO-IC-NEXT: br i1 false, label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]
	; UNROLL-NO-IC: vector.ph:			; UNROLL-NO-IC: vector.ph:
	; UNROLL-NO-IC-NEXT: [[TMP0:%.]] = insertelement <2 x i32> zeroinitializer, i32 [[A:%.]], i32 0
	; UNROLL-NO-IC-NEXT: br label [[VECTOR_BODY:%.*]]			; UNROLL-NO-IC-NEXT: br label [[VECTOR_BODY:%.*]]
	; UNROLL-NO-IC: vector.body:			; UNROLL-NO-IC: vector.body:
	; UNROLL-NO-IC-NEXT: [[INDEX:%.]] = phi i32 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[PRED_UREM_CONTINUE8:%.*]] ]			; UNROLL-NO-IC-NEXT: [[INDEX:%.]] = phi i32 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[PRED_UREM_CONTINUE8:%.*]] ]
	; UNROLL-NO-IC-NEXT: [[VEC_PHI:%.]] = phi <2 x i32> [ [[TMP0]], [[VECTOR_PH]] ], [ [[TMP28:%.]], [[PRED_UREM_CONTINUE8]] ]			; UNROLL-NO-IC-NEXT: [[VEC_PHI:%.]] = phi <2 x i32> [ zeroinitializer, [[VECTOR_PH]] ], [ [[TMP27:%.]], [[PRED_UREM_CONTINUE8]] ]
	; UNROLL-NO-IC-NEXT: [[VEC_PHI1:%.]] = phi <2 x i32> [ zeroinitializer, [[VECTOR_PH]] ], [ [[TMP29:%.]], [[PRED_UREM_CONTINUE8]] ]			; UNROLL-NO-IC-NEXT: [[VEC_PHI1:%.]] = phi <2 x i32> [ zeroinitializer, [[VECTOR_PH]] ], [ [[TMP28:%.]], [[PRED_UREM_CONTINUE8]] ]
	; UNROLL-NO-IC-NEXT: [[VEC_IND:%.]] = phi <2 x i16> [ <i16 -20, i16 -19>, [[VECTOR_PH]] ], [ [[VEC_IND_NEXT:%.]], [[PRED_UREM_CONTINUE8]] ]			; UNROLL-NO-IC-NEXT: [[VEC_IND:%.]] = phi <2 x i16> [ <i16 -20, i16 -19>, [[VECTOR_PH]] ], [ [[VEC_IND_NEXT:%.]], [[PRED_UREM_CONTINUE8]] ]
	; UNROLL-NO-IC-NEXT: [[STEP_ADD:%.*]] = add <2 x i16> [[VEC_IND]], <i16 2, i16 2>			; UNROLL-NO-IC-NEXT: [[STEP_ADD:%.*]] = add <2 x i16> [[VEC_IND]], <i16 2, i16 2>
	; UNROLL-NO-IC-NEXT: [[OFFSET_IDX:%.*]] = add i32 -20, [[INDEX]]			; UNROLL-NO-IC-NEXT: [[OFFSET_IDX:%.*]] = add i32 -20, [[INDEX]]
	; UNROLL-NO-IC-NEXT: [[TMP1:%.*]] = trunc i32 [[OFFSET_IDX]] to i16			; UNROLL-NO-IC-NEXT: [[TMP0:%.*]] = trunc i32 [[OFFSET_IDX]] to i16
	; UNROLL-NO-IC-NEXT: [[TMP2:%.*]] = icmp eq <2 x i16> [[VEC_IND]], zeroinitializer			; UNROLL-NO-IC-NEXT: [[TMP1:%.*]] = icmp eq <2 x i16> [[VEC_IND]], zeroinitializer
	; UNROLL-NO-IC-NEXT: [[TMP3:%.*]] = icmp eq <2 x i16> [[STEP_ADD]], zeroinitializer			; UNROLL-NO-IC-NEXT: [[TMP2:%.*]] = icmp eq <2 x i16> [[STEP_ADD]], zeroinitializer
				; UNROLL-NO-IC-NEXT: [[TMP3:%.*]] = xor <2 x i1> [[TMP1]], <i1 true, i1 true>
	; UNROLL-NO-IC-NEXT: [[TMP4:%.*]] = xor <2 x i1> [[TMP2]], <i1 true, i1 true>			; UNROLL-NO-IC-NEXT: [[TMP4:%.*]] = xor <2 x i1> [[TMP2]], <i1 true, i1 true>
	; UNROLL-NO-IC-NEXT: [[TMP5:%.*]] = xor <2 x i1> [[TMP3]], <i1 true, i1 true>			; UNROLL-NO-IC-NEXT: [[TMP5:%.*]] = extractelement <2 x i1> [[TMP3]], i32 0
	; UNROLL-NO-IC-NEXT: [[TMP6:%.*]] = extractelement <2 x i1> [[TMP4]], i32 0			; UNROLL-NO-IC-NEXT: br i1 [[TMP5]], label [[PRED_UREM_IF:%.]], label [[PRED_UREM_CONTINUE:%.]]
	; UNROLL-NO-IC-NEXT: br i1 [[TMP6]], label [[PRED_UREM_IF:%.]], label [[PRED_UREM_CONTINUE:%.]]
	; UNROLL-NO-IC: pred.urem.if:			; UNROLL-NO-IC: pred.urem.if:
	; UNROLL-NO-IC-NEXT: [[TMP7:%.*]] = add i16 [[TMP1]], 0			; UNROLL-NO-IC-NEXT: [[TMP6:%.*]] = add i16 [[TMP0]], 0
	; UNROLL-NO-IC-NEXT: [[TMP8:%.]] = urem i16 [[B:%.]], [[TMP7]]			; UNROLL-NO-IC-NEXT: [[TMP7:%.]] = urem i16 [[B:%.]], [[TMP6]]
	; UNROLL-NO-IC-NEXT: [[TMP9:%.*]] = insertelement <2 x i16> poison, i16 [[TMP8]], i32 0			; UNROLL-NO-IC-NEXT: [[TMP8:%.*]] = insertelement <2 x i16> poison, i16 [[TMP7]], i32 0
	; UNROLL-NO-IC-NEXT: br label [[PRED_UREM_CONTINUE]]			; UNROLL-NO-IC-NEXT: br label [[PRED_UREM_CONTINUE]]
	; UNROLL-NO-IC: pred.urem.continue:			; UNROLL-NO-IC: pred.urem.continue:
	; UNROLL-NO-IC-NEXT: [[TMP10:%.*]] = phi <2 x i16> [ poison, [[VECTOR_BODY]] ], [ [[TMP9]], [[PRED_UREM_IF]] ]			; UNROLL-NO-IC-NEXT: [[TMP9:%.*]] = phi <2 x i16> [ poison, [[VECTOR_BODY]] ], [ [[TMP8]], [[PRED_UREM_IF]] ]
	; UNROLL-NO-IC-NEXT: [[TMP11:%.*]] = extractelement <2 x i1> [[TMP4]], i32 1			; UNROLL-NO-IC-NEXT: [[TMP10:%.*]] = extractelement <2 x i1> [[TMP3]], i32 1
	; UNROLL-NO-IC-NEXT: br i1 [[TMP11]], label [[PRED_UREM_IF3:%.]], label [[PRED_UREM_CONTINUE4:%.]]			; UNROLL-NO-IC-NEXT: br i1 [[TMP10]], label [[PRED_UREM_IF3:%.]], label [[PRED_UREM_CONTINUE4:%.]]
	; UNROLL-NO-IC: pred.urem.if3:			; UNROLL-NO-IC: pred.urem.if3:
	; UNROLL-NO-IC-NEXT: [[TMP12:%.*]] = add i16 [[TMP1]], 1			; UNROLL-NO-IC-NEXT: [[TMP11:%.*]] = add i16 [[TMP0]], 1
	; UNROLL-NO-IC-NEXT: [[TMP13:%.*]] = urem i16 [[B]], [[TMP12]]			; UNROLL-NO-IC-NEXT: [[TMP12:%.*]] = urem i16 [[B]], [[TMP11]]
	; UNROLL-NO-IC-NEXT: [[TMP14:%.*]] = insertelement <2 x i16> [[TMP10]], i16 [[TMP13]], i32 1			; UNROLL-NO-IC-NEXT: [[TMP13:%.*]] = insertelement <2 x i16> [[TMP9]], i16 [[TMP12]], i32 1
	; UNROLL-NO-IC-NEXT: br label [[PRED_UREM_CONTINUE4]]			; UNROLL-NO-IC-NEXT: br label [[PRED_UREM_CONTINUE4]]
	; UNROLL-NO-IC: pred.urem.continue4:			; UNROLL-NO-IC: pred.urem.continue4:
	; UNROLL-NO-IC-NEXT: [[TMP15:%.*]] = phi <2 x i16> [ [[TMP10]], [[PRED_UREM_CONTINUE]] ], [ [[TMP14]], [[PRED_UREM_IF3]] ]			; UNROLL-NO-IC-NEXT: [[TMP14:%.*]] = phi <2 x i16> [ [[TMP9]], [[PRED_UREM_CONTINUE]] ], [ [[TMP13]], [[PRED_UREM_IF3]] ]
	; UNROLL-NO-IC-NEXT: [[TMP16:%.*]] = extractelement <2 x i1> [[TMP5]], i32 0			; UNROLL-NO-IC-NEXT: [[TMP15:%.*]] = extractelement <2 x i1> [[TMP4]], i32 0
	; UNROLL-NO-IC-NEXT: br i1 [[TMP16]], label [[PRED_UREM_IF5:%.]], label [[PRED_UREM_CONTINUE6:%.]]			; UNROLL-NO-IC-NEXT: br i1 [[TMP15]], label [[PRED_UREM_IF5:%.]], label [[PRED_UREM_CONTINUE6:%.]]
	; UNROLL-NO-IC: pred.urem.if5:			; UNROLL-NO-IC: pred.urem.if5:
	; UNROLL-NO-IC-NEXT: [[TMP17:%.*]] = add i16 [[TMP1]], 2			; UNROLL-NO-IC-NEXT: [[TMP16:%.*]] = add i16 [[TMP0]], 2
	; UNROLL-NO-IC-NEXT: [[TMP18:%.*]] = urem i16 [[B]], [[TMP17]]			; UNROLL-NO-IC-NEXT: [[TMP17:%.*]] = urem i16 [[B]], [[TMP16]]
	; UNROLL-NO-IC-NEXT: [[TMP19:%.*]] = insertelement <2 x i16> poison, i16 [[TMP18]], i32 0			; UNROLL-NO-IC-NEXT: [[TMP18:%.*]] = insertelement <2 x i16> poison, i16 [[TMP17]], i32 0
	; UNROLL-NO-IC-NEXT: br label [[PRED_UREM_CONTINUE6]]			; UNROLL-NO-IC-NEXT: br label [[PRED_UREM_CONTINUE6]]
	; UNROLL-NO-IC: pred.urem.continue6:			; UNROLL-NO-IC: pred.urem.continue6:
	; UNROLL-NO-IC-NEXT: [[TMP20:%.*]] = phi <2 x i16> [ poison, [[PRED_UREM_CONTINUE4]] ], [ [[TMP19]], [[PRED_UREM_IF5]] ]			; UNROLL-NO-IC-NEXT: [[TMP19:%.*]] = phi <2 x i16> [ poison, [[PRED_UREM_CONTINUE4]] ], [ [[TMP18]], [[PRED_UREM_IF5]] ]
	; UNROLL-NO-IC-NEXT: [[TMP21:%.*]] = extractelement <2 x i1> [[TMP5]], i32 1			; UNROLL-NO-IC-NEXT: [[TMP20:%.*]] = extractelement <2 x i1> [[TMP4]], i32 1
	; UNROLL-NO-IC-NEXT: br i1 [[TMP21]], label [[PRED_UREM_IF7:%.*]], label [[PRED_UREM_CONTINUE8]]			; UNROLL-NO-IC-NEXT: br i1 [[TMP20]], label [[PRED_UREM_IF7:%.*]], label [[PRED_UREM_CONTINUE8]]
	; UNROLL-NO-IC: pred.urem.if7:			; UNROLL-NO-IC: pred.urem.if7:
	; UNROLL-NO-IC-NEXT: [[TMP22:%.*]] = add i16 [[TMP1]], 3			; UNROLL-NO-IC-NEXT: [[TMP21:%.*]] = add i16 [[TMP0]], 3
	; UNROLL-NO-IC-NEXT: [[TMP23:%.*]] = urem i16 [[B]], [[TMP22]]			; UNROLL-NO-IC-NEXT: [[TMP22:%.*]] = urem i16 [[B]], [[TMP21]]
	; UNROLL-NO-IC-NEXT: [[TMP24:%.*]] = insertelement <2 x i16> [[TMP20]], i16 [[TMP23]], i32 1			; UNROLL-NO-IC-NEXT: [[TMP23:%.*]] = insertelement <2 x i16> [[TMP19]], i16 [[TMP22]], i32 1
	; UNROLL-NO-IC-NEXT: br label [[PRED_UREM_CONTINUE8]]			; UNROLL-NO-IC-NEXT: br label [[PRED_UREM_CONTINUE8]]
	; UNROLL-NO-IC: pred.urem.continue8:			; UNROLL-NO-IC: pred.urem.continue8:
	; UNROLL-NO-IC-NEXT: [[TMP25:%.*]] = phi <2 x i16> [ [[TMP20]], [[PRED_UREM_CONTINUE6]] ], [ [[TMP24]], [[PRED_UREM_IF7]] ]			; UNROLL-NO-IC-NEXT: [[TMP24:%.*]] = phi <2 x i16> [ [[TMP19]], [[PRED_UREM_CONTINUE6]] ], [ [[TMP23]], [[PRED_UREM_IF7]] ]
	; UNROLL-NO-IC-NEXT: [[PREDPHI:%.*]] = select <2 x i1> [[TMP2]], <2 x i16> zeroinitializer, <2 x i16> [[TMP15]]			; UNROLL-NO-IC-NEXT: [[PREDPHI:%.*]] = select <2 x i1> [[TMP1]], <2 x i16> zeroinitializer, <2 x i16> [[TMP14]]
	; UNROLL-NO-IC-NEXT: [[PREDPHI9:%.*]] = select <2 x i1> [[TMP3]], <2 x i16> zeroinitializer, <2 x i16> [[TMP25]]			; UNROLL-NO-IC-NEXT: [[PREDPHI9:%.*]] = select <2 x i1> [[TMP2]], <2 x i16> zeroinitializer, <2 x i16> [[TMP24]]
	; UNROLL-NO-IC-NEXT: [[TMP26:%.*]] = sext <2 x i16> [[PREDPHI]] to <2 x i32>			; UNROLL-NO-IC-NEXT: [[TMP25:%.*]] = sext <2 x i16> [[PREDPHI]] to <2 x i32>
	; UNROLL-NO-IC-NEXT: [[TMP27:%.*]] = sext <2 x i16> [[PREDPHI9]] to <2 x i32>			; UNROLL-NO-IC-NEXT: [[TMP26:%.*]] = sext <2 x i16> [[PREDPHI9]] to <2 x i32>
	; UNROLL-NO-IC-NEXT: [[TMP28]] = or <2 x i32> [[VEC_PHI]], [[TMP26]]			; UNROLL-NO-IC-NEXT: [[TMP27]] = or <2 x i32> [[VEC_PHI]], [[TMP25]]
	; UNROLL-NO-IC-NEXT: [[TMP29]] = or <2 x i32> [[VEC_PHI1]], [[TMP27]]			; UNROLL-NO-IC-NEXT: [[TMP28]] = or <2 x i32> [[VEC_PHI1]], [[TMP26]]
	; UNROLL-NO-IC-NEXT: [[INDEX_NEXT]] = add nuw i32 [[INDEX]], 4			; UNROLL-NO-IC-NEXT: [[INDEX_NEXT]] = add nuw i32 [[INDEX]], 4
	; UNROLL-NO-IC-NEXT: [[VEC_IND_NEXT]] = add <2 x i16> [[STEP_ADD]], <i16 2, i16 2>			; UNROLL-NO-IC-NEXT: [[VEC_IND_NEXT]] = add <2 x i16> [[STEP_ADD]], <i16 2, i16 2>
	; UNROLL-NO-IC-NEXT: [[TMP30:%.*]] = icmp eq i32 [[INDEX_NEXT]], 20			; UNROLL-NO-IC-NEXT: [[TMP29:%.*]] = icmp eq i32 [[INDEX_NEXT]], 20
	; UNROLL-NO-IC-NEXT: br i1 [[TMP30]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP48:![0-9]+]]			; UNROLL-NO-IC-NEXT: br i1 [[TMP29]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP48:![0-9]+]]
	; UNROLL-NO-IC: middle.block:			; UNROLL-NO-IC: middle.block:
	; UNROLL-NO-IC-NEXT: [[BIN_RDX:%.*]] = or <2 x i32> [[TMP29]], [[TMP28]]			; UNROLL-NO-IC-NEXT: [[BIN_RDX:%.*]] = or <2 x i32> [[TMP28]], [[TMP27]]
	; UNROLL-NO-IC-NEXT: [[TMP31:%.*]] = call i32 @llvm.vector.reduce.or.v2i32(<2 x i32> [[BIN_RDX]])			; UNROLL-NO-IC-NEXT: [[TMP30:%.*]] = call i32 @llvm.vector.reduce.or.v2i32(<2 x i32> [[BIN_RDX]])
				; UNROLL-NO-IC-NEXT: [[RDX_START:%.]] = or i32 [[A:%.]], [[TMP30]]
	; UNROLL-NO-IC-NEXT: [[CMP_N:%.*]] = icmp eq i32 20, 20			; UNROLL-NO-IC-NEXT: [[CMP_N:%.*]] = icmp eq i32 20, 20
	; UNROLL-NO-IC-NEXT: br i1 [[CMP_N]], label [[FOR_END:%.*]], label [[SCALAR_PH]]			; UNROLL-NO-IC-NEXT: br i1 [[CMP_N]], label [[FOR_END:%.*]], label [[SCALAR_PH]]
	; UNROLL-NO-IC: scalar.ph:			; UNROLL-NO-IC: scalar.ph:
	; UNROLL-NO-IC-NEXT: [[BC_RESUME_VAL:%.]] = phi i32 [ 0, [[MIDDLE_BLOCK]] ], [ -20, [[ENTRY:%.]] ]			; UNROLL-NO-IC-NEXT: [[BC_RESUME_VAL:%.]] = phi i32 [ 0, [[MIDDLE_BLOCK]] ], [ -20, [[ENTRY:%.]] ]
	; UNROLL-NO-IC-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ [[A]], [[ENTRY]] ], [ [[TMP31]], [[MIDDLE_BLOCK]] ]			; UNROLL-NO-IC-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ [[A]], [[ENTRY]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; UNROLL-NO-IC-NEXT: br label [[FOR_BODY:%.*]]			; UNROLL-NO-IC-NEXT: br label [[FOR_BODY:%.*]]
	; UNROLL-NO-IC: for.body:			; UNROLL-NO-IC: for.body:
	; UNROLL-NO-IC-NEXT: [[I:%.]] = phi i32 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[I_NEXT:%.]], [[FOR_INC:%.*]] ]			; UNROLL-NO-IC-NEXT: [[I:%.]] = phi i32 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[I_NEXT:%.]], [[FOR_INC:%.*]] ]
	; UNROLL-NO-IC-NEXT: [[VAR0:%.]] = phi i32 [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[VAR6:%.]], [[FOR_INC]] ]			; UNROLL-NO-IC-NEXT: [[VAR0:%.]] = phi i32 [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[VAR6:%.]], [[FOR_INC]] ]
	; UNROLL-NO-IC-NEXT: [[VAR1:%.*]] = trunc i32 [[I]] to i16			; UNROLL-NO-IC-NEXT: [[VAR1:%.*]] = trunc i32 [[I]] to i16
	; UNROLL-NO-IC-NEXT: [[VAR2:%.*]] = icmp eq i16 [[VAR1]], 0			; UNROLL-NO-IC-NEXT: [[VAR2:%.*]] = icmp eq i16 [[VAR1]], 0
	; UNROLL-NO-IC-NEXT: br i1 [[VAR2]], label [[FOR_INC]], label [[FOR_COND:%.*]]			; UNROLL-NO-IC-NEXT: br i1 [[VAR2]], label [[FOR_INC]], label [[FOR_COND:%.*]]
	; UNROLL-NO-IC: for.cond:			; UNROLL-NO-IC: for.cond:
	; UNROLL-NO-IC-NEXT: [[VAR3:%.*]] = urem i16 [[B]], [[VAR1]]			; UNROLL-NO-IC-NEXT: [[VAR3:%.*]] = urem i16 [[B]], [[VAR1]]
	; UNROLL-NO-IC-NEXT: br label [[FOR_INC]]			; UNROLL-NO-IC-NEXT: br label [[FOR_INC]]
	; UNROLL-NO-IC: for.inc:			; UNROLL-NO-IC: for.inc:
	; UNROLL-NO-IC-NEXT: [[VAR4:%.*]] = phi i16 [ [[VAR3]], [[FOR_COND]] ], [ 0, [[FOR_BODY]] ]			; UNROLL-NO-IC-NEXT: [[VAR4:%.*]] = phi i16 [ [[VAR3]], [[FOR_COND]] ], [ 0, [[FOR_BODY]] ]
	; UNROLL-NO-IC-NEXT: [[VAR5:%.*]] = sext i16 [[VAR4]] to i32			; UNROLL-NO-IC-NEXT: [[VAR5:%.*]] = sext i16 [[VAR4]] to i32
	; UNROLL-NO-IC-NEXT: [[VAR6]] = or i32 [[VAR0]], [[VAR5]]			; UNROLL-NO-IC-NEXT: [[VAR6]] = or i32 [[VAR0]], [[VAR5]]
	; UNROLL-NO-IC-NEXT: [[I_NEXT]] = add nsw i32 [[I]], 1			; UNROLL-NO-IC-NEXT: [[I_NEXT]] = add nsw i32 [[I]], 1
	; UNROLL-NO-IC-NEXT: [[COND:%.*]] = icmp eq i32 [[I_NEXT]], 0			; UNROLL-NO-IC-NEXT: [[COND:%.*]] = icmp eq i32 [[I_NEXT]], 0
	; UNROLL-NO-IC-NEXT: br i1 [[COND]], label [[FOR_END]], label [[FOR_BODY]], !llvm.loop [[LOOP49:![0-9]+]]			; UNROLL-NO-IC-NEXT: br i1 [[COND]], label [[FOR_END]], label [[FOR_BODY]], !llvm.loop [[LOOP49:![0-9]+]]
	; UNROLL-NO-IC: for.end:			; UNROLL-NO-IC: for.end:
	; UNROLL-NO-IC-NEXT: [[VAR7:%.*]] = phi i32 [ [[VAR6]], [[FOR_INC]] ], [ [[TMP31]], [[MIDDLE_BLOCK]] ]			; UNROLL-NO-IC-NEXT: [[VAR7:%.*]] = phi i32 [ [[VAR6]], [[FOR_INC]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; UNROLL-NO-IC-NEXT: ret i32 [[VAR7]]			; UNROLL-NO-IC-NEXT: ret i32 [[VAR7]]
	;			;
	; INTERLEAVE-LABEL: @PR32419(			; INTERLEAVE-LABEL: @PR32419(
	; INTERLEAVE-NEXT: entry:			; INTERLEAVE-NEXT: entry:
	; INTERLEAVE-NEXT: br i1 false, label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]			; INTERLEAVE-NEXT: br i1 false, label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]
	; INTERLEAVE: vector.ph:			; INTERLEAVE: vector.ph:
	; INTERLEAVE-NEXT: [[TMP0:%.]] = insertelement <4 x i32> <i32 poison, i32 0, i32 0, i32 0>, i32 [[A:%.]], i64 0
	; INTERLEAVE-NEXT: br label [[VECTOR_BODY:%.*]]			; INTERLEAVE-NEXT: br label [[VECTOR_BODY:%.*]]
	; INTERLEAVE: vector.body:			; INTERLEAVE: vector.body:
	; INTERLEAVE-NEXT: [[INDEX:%.]] = phi i32 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[PRED_UREM_CONTINUE16:%.*]] ]			; INTERLEAVE-NEXT: [[INDEX:%.]] = phi i32 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[PRED_UREM_CONTINUE16:%.*]] ]
	; INTERLEAVE-NEXT: [[VEC_PHI:%.]] = phi <4 x i32> [ [[TMP0]], [[VECTOR_PH]] ], [ [[TMP48:%.]], [[PRED_UREM_CONTINUE16]] ]			; INTERLEAVE-NEXT: [[VEC_PHI:%.]] = phi <4 x i32> [ zeroinitializer, [[VECTOR_PH]] ], [ [[TMP47:%.]], [[PRED_UREM_CONTINUE16]] ]
	; INTERLEAVE-NEXT: [[VEC_PHI1:%.]] = phi <4 x i32> [ zeroinitializer, [[VECTOR_PH]] ], [ [[TMP49:%.]], [[PRED_UREM_CONTINUE16]] ]			; INTERLEAVE-NEXT: [[VEC_PHI1:%.]] = phi <4 x i32> [ zeroinitializer, [[VECTOR_PH]] ], [ [[TMP48:%.]], [[PRED_UREM_CONTINUE16]] ]
	; INTERLEAVE-NEXT: [[VEC_IND:%.]] = phi <4 x i16> [ <i16 -20, i16 -19, i16 -18, i16 -17>, [[VECTOR_PH]] ], [ [[VEC_IND_NEXT:%.]], [[PRED_UREM_CONTINUE16]] ]			; INTERLEAVE-NEXT: [[VEC_IND:%.]] = phi <4 x i16> [ <i16 -20, i16 -19, i16 -18, i16 -17>, [[VECTOR_PH]] ], [ [[VEC_IND_NEXT:%.]], [[PRED_UREM_CONTINUE16]] ]
	; INTERLEAVE-NEXT: [[TMP1:%.*]] = trunc i32 [[INDEX]] to i16			; INTERLEAVE-NEXT: [[TMP0:%.*]] = trunc i32 [[INDEX]] to i16
	; INTERLEAVE-NEXT: [[TMP2:%.*]] = icmp eq <4 x i16> [[VEC_IND]], zeroinitializer			; INTERLEAVE-NEXT: [[TMP1:%.*]] = icmp eq <4 x i16> [[VEC_IND]], zeroinitializer
	; INTERLEAVE-NEXT: [[TMP3:%.*]] = icmp eq <4 x i16> [[VEC_IND]], <i16 -4, i16 -4, i16 -4, i16 -4>			; INTERLEAVE-NEXT: [[TMP2:%.*]] = icmp eq <4 x i16> [[VEC_IND]], <i16 -4, i16 -4, i16 -4, i16 -4>
				; INTERLEAVE-NEXT: [[TMP3:%.*]] = xor <4 x i1> [[TMP1]], <i1 true, i1 true, i1 true, i1 true>
	; INTERLEAVE-NEXT: [[TMP4:%.*]] = xor <4 x i1> [[TMP2]], <i1 true, i1 true, i1 true, i1 true>			; INTERLEAVE-NEXT: [[TMP4:%.*]] = xor <4 x i1> [[TMP2]], <i1 true, i1 true, i1 true, i1 true>
	; INTERLEAVE-NEXT: [[TMP5:%.*]] = xor <4 x i1> [[TMP3]], <i1 true, i1 true, i1 true, i1 true>			; INTERLEAVE-NEXT: [[TMP5:%.*]] = extractelement <4 x i1> [[TMP3]], i64 0
	; INTERLEAVE-NEXT: [[TMP6:%.*]] = extractelement <4 x i1> [[TMP4]], i64 0			; INTERLEAVE-NEXT: br i1 [[TMP5]], label [[PRED_UREM_IF:%.]], label [[PRED_UREM_CONTINUE:%.]]
	; INTERLEAVE-NEXT: br i1 [[TMP6]], label [[PRED_UREM_IF:%.]], label [[PRED_UREM_CONTINUE:%.]]
	; INTERLEAVE: pred.urem.if:			; INTERLEAVE: pred.urem.if:
	; INTERLEAVE-NEXT: [[TMP7:%.*]] = add i16 [[TMP1]], -20			; INTERLEAVE-NEXT: [[TMP6:%.*]] = add i16 [[TMP0]], -20
	; INTERLEAVE-NEXT: [[TMP8:%.]] = urem i16 [[B:%.]], [[TMP7]]			; INTERLEAVE-NEXT: [[TMP7:%.]] = urem i16 [[B:%.]], [[TMP6]]
	; INTERLEAVE-NEXT: [[TMP9:%.*]] = insertelement <4 x i16> poison, i16 [[TMP8]], i64 0			; INTERLEAVE-NEXT: [[TMP8:%.*]] = insertelement <4 x i16> poison, i16 [[TMP7]], i64 0
	; INTERLEAVE-NEXT: br label [[PRED_UREM_CONTINUE]]			; INTERLEAVE-NEXT: br label [[PRED_UREM_CONTINUE]]
	; INTERLEAVE: pred.urem.continue:			; INTERLEAVE: pred.urem.continue:
	; INTERLEAVE-NEXT: [[TMP10:%.*]] = phi <4 x i16> [ poison, [[VECTOR_BODY]] ], [ [[TMP9]], [[PRED_UREM_IF]] ]			; INTERLEAVE-NEXT: [[TMP9:%.*]] = phi <4 x i16> [ poison, [[VECTOR_BODY]] ], [ [[TMP8]], [[PRED_UREM_IF]] ]
	; INTERLEAVE-NEXT: [[TMP11:%.*]] = extractelement <4 x i1> [[TMP4]], i64 1			; INTERLEAVE-NEXT: [[TMP10:%.*]] = extractelement <4 x i1> [[TMP3]], i64 1
	; INTERLEAVE-NEXT: br i1 [[TMP11]], label [[PRED_UREM_IF3:%.]], label [[PRED_UREM_CONTINUE4:%.]]			; INTERLEAVE-NEXT: br i1 [[TMP10]], label [[PRED_UREM_IF3:%.]], label [[PRED_UREM_CONTINUE4:%.]]
	; INTERLEAVE: pred.urem.if3:			; INTERLEAVE: pred.urem.if3:
	; INTERLEAVE-NEXT: [[TMP12:%.*]] = add i16 [[TMP1]], -19			; INTERLEAVE-NEXT: [[TMP11:%.*]] = add i16 [[TMP0]], -19
	; INTERLEAVE-NEXT: [[TMP13:%.*]] = urem i16 [[B]], [[TMP12]]			; INTERLEAVE-NEXT: [[TMP12:%.*]] = urem i16 [[B]], [[TMP11]]
	; INTERLEAVE-NEXT: [[TMP14:%.*]] = insertelement <4 x i16> [[TMP10]], i16 [[TMP13]], i64 1			; INTERLEAVE-NEXT: [[TMP13:%.*]] = insertelement <4 x i16> [[TMP9]], i16 [[TMP12]], i64 1
	; INTERLEAVE-NEXT: br label [[PRED_UREM_CONTINUE4]]			; INTERLEAVE-NEXT: br label [[PRED_UREM_CONTINUE4]]
	; INTERLEAVE: pred.urem.continue4:			; INTERLEAVE: pred.urem.continue4:
	; INTERLEAVE-NEXT: [[TMP15:%.*]] = phi <4 x i16> [ [[TMP10]], [[PRED_UREM_CONTINUE]] ], [ [[TMP14]], [[PRED_UREM_IF3]] ]			; INTERLEAVE-NEXT: [[TMP14:%.*]] = phi <4 x i16> [ [[TMP9]], [[PRED_UREM_CONTINUE]] ], [ [[TMP13]], [[PRED_UREM_IF3]] ]
	; INTERLEAVE-NEXT: [[TMP16:%.*]] = extractelement <4 x i1> [[TMP4]], i64 2			; INTERLEAVE-NEXT: [[TMP15:%.*]] = extractelement <4 x i1> [[TMP3]], i64 2
	; INTERLEAVE-NEXT: br i1 [[TMP16]], label [[PRED_UREM_IF5:%.]], label [[PRED_UREM_CONTINUE6:%.]]			; INTERLEAVE-NEXT: br i1 [[TMP15]], label [[PRED_UREM_IF5:%.]], label [[PRED_UREM_CONTINUE6:%.]]
	; INTERLEAVE: pred.urem.if5:			; INTERLEAVE: pred.urem.if5:
	; INTERLEAVE-NEXT: [[TMP17:%.*]] = add i16 [[TMP1]], -18			; INTERLEAVE-NEXT: [[TMP16:%.*]] = add i16 [[TMP0]], -18
	; INTERLEAVE-NEXT: [[TMP18:%.*]] = urem i16 [[B]], [[TMP17]]			; INTERLEAVE-NEXT: [[TMP17:%.*]] = urem i16 [[B]], [[TMP16]]
	; INTERLEAVE-NEXT: [[TMP19:%.*]] = insertelement <4 x i16> [[TMP15]], i16 [[TMP18]], i64 2			; INTERLEAVE-NEXT: [[TMP18:%.*]] = insertelement <4 x i16> [[TMP14]], i16 [[TMP17]], i64 2
	; INTERLEAVE-NEXT: br label [[PRED_UREM_CONTINUE6]]			; INTERLEAVE-NEXT: br label [[PRED_UREM_CONTINUE6]]
	; INTERLEAVE: pred.urem.continue6:			; INTERLEAVE: pred.urem.continue6:
	; INTERLEAVE-NEXT: [[TMP20:%.*]] = phi <4 x i16> [ [[TMP15]], [[PRED_UREM_CONTINUE4]] ], [ [[TMP19]], [[PRED_UREM_IF5]] ]			; INTERLEAVE-NEXT: [[TMP19:%.*]] = phi <4 x i16> [ [[TMP14]], [[PRED_UREM_CONTINUE4]] ], [ [[TMP18]], [[PRED_UREM_IF5]] ]
	; INTERLEAVE-NEXT: [[TMP21:%.*]] = extractelement <4 x i1> [[TMP4]], i64 3			; INTERLEAVE-NEXT: [[TMP20:%.*]] = extractelement <4 x i1> [[TMP3]], i64 3
	; INTERLEAVE-NEXT: br i1 [[TMP21]], label [[PRED_UREM_IF7:%.]], label [[PRED_UREM_CONTINUE8:%.]]			; INTERLEAVE-NEXT: br i1 [[TMP20]], label [[PRED_UREM_IF7:%.]], label [[PRED_UREM_CONTINUE8:%.]]
	; INTERLEAVE: pred.urem.if7:			; INTERLEAVE: pred.urem.if7:
	; INTERLEAVE-NEXT: [[TMP22:%.*]] = add i16 [[TMP1]], -17			; INTERLEAVE-NEXT: [[TMP21:%.*]] = add i16 [[TMP0]], -17
	; INTERLEAVE-NEXT: [[TMP23:%.*]] = urem i16 [[B]], [[TMP22]]			; INTERLEAVE-NEXT: [[TMP22:%.*]] = urem i16 [[B]], [[TMP21]]
	; INTERLEAVE-NEXT: [[TMP24:%.*]] = insertelement <4 x i16> [[TMP20]], i16 [[TMP23]], i64 3			; INTERLEAVE-NEXT: [[TMP23:%.*]] = insertelement <4 x i16> [[TMP19]], i16 [[TMP22]], i64 3
	; INTERLEAVE-NEXT: br label [[PRED_UREM_CONTINUE8]]			; INTERLEAVE-NEXT: br label [[PRED_UREM_CONTINUE8]]
	; INTERLEAVE: pred.urem.continue8:			; INTERLEAVE: pred.urem.continue8:
	; INTERLEAVE-NEXT: [[TMP25:%.*]] = phi <4 x i16> [ [[TMP20]], [[PRED_UREM_CONTINUE6]] ], [ [[TMP24]], [[PRED_UREM_IF7]] ]			; INTERLEAVE-NEXT: [[TMP24:%.*]] = phi <4 x i16> [ [[TMP19]], [[PRED_UREM_CONTINUE6]] ], [ [[TMP23]], [[PRED_UREM_IF7]] ]
	; INTERLEAVE-NEXT: [[TMP26:%.*]] = extractelement <4 x i1> [[TMP5]], i64 0			; INTERLEAVE-NEXT: [[TMP25:%.*]] = extractelement <4 x i1> [[TMP4]], i64 0
	; INTERLEAVE-NEXT: br i1 [[TMP26]], label [[PRED_UREM_IF9:%.]], label [[PRED_UREM_CONTINUE10:%.]]			; INTERLEAVE-NEXT: br i1 [[TMP25]], label [[PRED_UREM_IF9:%.]], label [[PRED_UREM_CONTINUE10:%.]]
	; INTERLEAVE: pred.urem.if9:			; INTERLEAVE: pred.urem.if9:
	; INTERLEAVE-NEXT: [[TMP27:%.*]] = add i16 [[TMP1]], -16			; INTERLEAVE-NEXT: [[TMP26:%.*]] = add i16 [[TMP0]], -16
	; INTERLEAVE-NEXT: [[TMP28:%.*]] = urem i16 [[B]], [[TMP27]]			; INTERLEAVE-NEXT: [[TMP27:%.*]] = urem i16 [[B]], [[TMP26]]
	; INTERLEAVE-NEXT: [[TMP29:%.*]] = insertelement <4 x i16> poison, i16 [[TMP28]], i64 0			; INTERLEAVE-NEXT: [[TMP28:%.*]] = insertelement <4 x i16> poison, i16 [[TMP27]], i64 0
	; INTERLEAVE-NEXT: br label [[PRED_UREM_CONTINUE10]]			; INTERLEAVE-NEXT: br label [[PRED_UREM_CONTINUE10]]
	; INTERLEAVE: pred.urem.continue10:			; INTERLEAVE: pred.urem.continue10:
	; INTERLEAVE-NEXT: [[TMP30:%.*]] = phi <4 x i16> [ poison, [[PRED_UREM_CONTINUE8]] ], [ [[TMP29]], [[PRED_UREM_IF9]] ]			; INTERLEAVE-NEXT: [[TMP29:%.*]] = phi <4 x i16> [ poison, [[PRED_UREM_CONTINUE8]] ], [ [[TMP28]], [[PRED_UREM_IF9]] ]
	; INTERLEAVE-NEXT: [[TMP31:%.*]] = extractelement <4 x i1> [[TMP5]], i64 1			; INTERLEAVE-NEXT: [[TMP30:%.*]] = extractelement <4 x i1> [[TMP4]], i64 1
	; INTERLEAVE-NEXT: br i1 [[TMP31]], label [[PRED_UREM_IF11:%.]], label [[PRED_UREM_CONTINUE12:%.]]			; INTERLEAVE-NEXT: br i1 [[TMP30]], label [[PRED_UREM_IF11:%.]], label [[PRED_UREM_CONTINUE12:%.]]
	; INTERLEAVE: pred.urem.if11:			; INTERLEAVE: pred.urem.if11:
	; INTERLEAVE-NEXT: [[TMP32:%.*]] = add i16 [[TMP1]], -15			; INTERLEAVE-NEXT: [[TMP31:%.*]] = add i16 [[TMP0]], -15
	; INTERLEAVE-NEXT: [[TMP33:%.*]] = urem i16 [[B]], [[TMP32]]			; INTERLEAVE-NEXT: [[TMP32:%.*]] = urem i16 [[B]], [[TMP31]]
	; INTERLEAVE-NEXT: [[TMP34:%.*]] = insertelement <4 x i16> [[TMP30]], i16 [[TMP33]], i64 1			; INTERLEAVE-NEXT: [[TMP33:%.*]] = insertelement <4 x i16> [[TMP29]], i16 [[TMP32]], i64 1
	; INTERLEAVE-NEXT: br label [[PRED_UREM_CONTINUE12]]			; INTERLEAVE-NEXT: br label [[PRED_UREM_CONTINUE12]]
	; INTERLEAVE: pred.urem.continue12:			; INTERLEAVE: pred.urem.continue12:
	; INTERLEAVE-NEXT: [[TMP35:%.*]] = phi <4 x i16> [ [[TMP30]], [[PRED_UREM_CONTINUE10]] ], [ [[TMP34]], [[PRED_UREM_IF11]] ]			; INTERLEAVE-NEXT: [[TMP34:%.*]] = phi <4 x i16> [ [[TMP29]], [[PRED_UREM_CONTINUE10]] ], [ [[TMP33]], [[PRED_UREM_IF11]] ]
	; INTERLEAVE-NEXT: [[TMP36:%.*]] = extractelement <4 x i1> [[TMP5]], i64 2			; INTERLEAVE-NEXT: [[TMP35:%.*]] = extractelement <4 x i1> [[TMP4]], i64 2
	; INTERLEAVE-NEXT: br i1 [[TMP36]], label [[PRED_UREM_IF13:%.]], label [[PRED_UREM_CONTINUE14:%.]]			; INTERLEAVE-NEXT: br i1 [[TMP35]], label [[PRED_UREM_IF13:%.]], label [[PRED_UREM_CONTINUE14:%.]]
	; INTERLEAVE: pred.urem.if13:			; INTERLEAVE: pred.urem.if13:
	; INTERLEAVE-NEXT: [[TMP37:%.*]] = add i16 [[TMP1]], -14			; INTERLEAVE-NEXT: [[TMP36:%.*]] = add i16 [[TMP0]], -14
	; INTERLEAVE-NEXT: [[TMP38:%.*]] = urem i16 [[B]], [[TMP37]]			; INTERLEAVE-NEXT: [[TMP37:%.*]] = urem i16 [[B]], [[TMP36]]
	; INTERLEAVE-NEXT: [[TMP39:%.*]] = insertelement <4 x i16> [[TMP35]], i16 [[TMP38]], i64 2			; INTERLEAVE-NEXT: [[TMP38:%.*]] = insertelement <4 x i16> [[TMP34]], i16 [[TMP37]], i64 2
	; INTERLEAVE-NEXT: br label [[PRED_UREM_CONTINUE14]]			; INTERLEAVE-NEXT: br label [[PRED_UREM_CONTINUE14]]
	; INTERLEAVE: pred.urem.continue14:			; INTERLEAVE: pred.urem.continue14:
	; INTERLEAVE-NEXT: [[TMP40:%.*]] = phi <4 x i16> [ [[TMP35]], [[PRED_UREM_CONTINUE12]] ], [ [[TMP39]], [[PRED_UREM_IF13]] ]			; INTERLEAVE-NEXT: [[TMP39:%.*]] = phi <4 x i16> [ [[TMP34]], [[PRED_UREM_CONTINUE12]] ], [ [[TMP38]], [[PRED_UREM_IF13]] ]
	; INTERLEAVE-NEXT: [[TMP41:%.*]] = extractelement <4 x i1> [[TMP5]], i64 3			; INTERLEAVE-NEXT: [[TMP40:%.*]] = extractelement <4 x i1> [[TMP4]], i64 3
	; INTERLEAVE-NEXT: br i1 [[TMP41]], label [[PRED_UREM_IF15:%.*]], label [[PRED_UREM_CONTINUE16]]			; INTERLEAVE-NEXT: br i1 [[TMP40]], label [[PRED_UREM_IF15:%.*]], label [[PRED_UREM_CONTINUE16]]
	; INTERLEAVE: pred.urem.if15:			; INTERLEAVE: pred.urem.if15:
	; INTERLEAVE-NEXT: [[TMP42:%.*]] = add i16 [[TMP1]], -13			; INTERLEAVE-NEXT: [[TMP41:%.*]] = add i16 [[TMP0]], -13
	; INTERLEAVE-NEXT: [[TMP43:%.*]] = urem i16 [[B]], [[TMP42]]			; INTERLEAVE-NEXT: [[TMP42:%.*]] = urem i16 [[B]], [[TMP41]]
	; INTERLEAVE-NEXT: [[TMP44:%.*]] = insertelement <4 x i16> [[TMP40]], i16 [[TMP43]], i64 3			; INTERLEAVE-NEXT: [[TMP43:%.*]] = insertelement <4 x i16> [[TMP39]], i16 [[TMP42]], i64 3
	; INTERLEAVE-NEXT: br label [[PRED_UREM_CONTINUE16]]			; INTERLEAVE-NEXT: br label [[PRED_UREM_CONTINUE16]]
	; INTERLEAVE: pred.urem.continue16:			; INTERLEAVE: pred.urem.continue16:
	; INTERLEAVE-NEXT: [[TMP45:%.*]] = phi <4 x i16> [ [[TMP40]], [[PRED_UREM_CONTINUE14]] ], [ [[TMP44]], [[PRED_UREM_IF15]] ]			; INTERLEAVE-NEXT: [[TMP44:%.*]] = phi <4 x i16> [ [[TMP39]], [[PRED_UREM_CONTINUE14]] ], [ [[TMP43]], [[PRED_UREM_IF15]] ]
	; INTERLEAVE-NEXT: [[PREDPHI:%.*]] = select <4 x i1> [[TMP2]], <4 x i16> zeroinitializer, <4 x i16> [[TMP25]]			; INTERLEAVE-NEXT: [[PREDPHI:%.*]] = select <4 x i1> [[TMP1]], <4 x i16> zeroinitializer, <4 x i16> [[TMP24]]
	; INTERLEAVE-NEXT: [[PREDPHI17:%.*]] = select <4 x i1> [[TMP3]], <4 x i16> zeroinitializer, <4 x i16> [[TMP45]]			; INTERLEAVE-NEXT: [[PREDPHI17:%.*]] = select <4 x i1> [[TMP2]], <4 x i16> zeroinitializer, <4 x i16> [[TMP44]]
	; INTERLEAVE-NEXT: [[TMP46:%.*]] = sext <4 x i16> [[PREDPHI]] to <4 x i32>			; INTERLEAVE-NEXT: [[TMP45:%.*]] = sext <4 x i16> [[PREDPHI]] to <4 x i32>
	; INTERLEAVE-NEXT: [[TMP47:%.*]] = sext <4 x i16> [[PREDPHI17]] to <4 x i32>			; INTERLEAVE-NEXT: [[TMP46:%.*]] = sext <4 x i16> [[PREDPHI17]] to <4 x i32>
	; INTERLEAVE-NEXT: [[TMP48]] = or <4 x i32> [[VEC_PHI]], [[TMP46]]			; INTERLEAVE-NEXT: [[TMP47]] = or <4 x i32> [[VEC_PHI]], [[TMP45]]
	; INTERLEAVE-NEXT: [[TMP49]] = or <4 x i32> [[VEC_PHI1]], [[TMP47]]			; INTERLEAVE-NEXT: [[TMP48]] = or <4 x i32> [[VEC_PHI1]], [[TMP46]]
	; INTERLEAVE-NEXT: [[INDEX_NEXT]] = add nuw i32 [[INDEX]], 8			; INTERLEAVE-NEXT: [[INDEX_NEXT]] = add nuw i32 [[INDEX]], 8
	; INTERLEAVE-NEXT: [[VEC_IND_NEXT]] = add <4 x i16> [[VEC_IND]], <i16 8, i16 8, i16 8, i16 8>			; INTERLEAVE-NEXT: [[VEC_IND_NEXT]] = add <4 x i16> [[VEC_IND]], <i16 8, i16 8, i16 8, i16 8>
	; INTERLEAVE-NEXT: [[TMP50:%.*]] = icmp eq i32 [[INDEX_NEXT]], 16			; INTERLEAVE-NEXT: [[TMP49:%.*]] = icmp eq i32 [[INDEX_NEXT]], 16
	; INTERLEAVE-NEXT: br i1 [[TMP50]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP48:![0-9]+]]			; INTERLEAVE-NEXT: br i1 [[TMP49]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP48:![0-9]+]]
	; INTERLEAVE: middle.block:			; INTERLEAVE: middle.block:
	; INTERLEAVE-NEXT: [[BIN_RDX:%.*]] = or <4 x i32> [[TMP49]], [[TMP48]]			; INTERLEAVE-NEXT: [[BIN_RDX:%.*]] = or <4 x i32> [[TMP48]], [[TMP47]]
	; INTERLEAVE-NEXT: [[TMP51:%.*]] = call i32 @llvm.vector.reduce.or.v4i32(<4 x i32> [[BIN_RDX]])			; INTERLEAVE-NEXT: [[TMP50:%.*]] = call i32 @llvm.vector.reduce.or.v4i32(<4 x i32> [[BIN_RDX]])
				; INTERLEAVE-NEXT: [[RDX_START:%.]] = or i32 [[TMP50]], [[A:%.]]
	; INTERLEAVE-NEXT: br i1 false, label [[FOR_END:%.*]], label [[SCALAR_PH]]			; INTERLEAVE-NEXT: br i1 false, label [[FOR_END:%.*]], label [[SCALAR_PH]]
	; INTERLEAVE: scalar.ph:			; INTERLEAVE: scalar.ph:
	; INTERLEAVE-NEXT: [[BC_RESUME_VAL:%.]] = phi i32 [ -4, [[MIDDLE_BLOCK]] ], [ -20, [[ENTRY:%.]] ]			; INTERLEAVE-NEXT: [[BC_RESUME_VAL:%.]] = phi i32 [ -4, [[MIDDLE_BLOCK]] ], [ -20, [[ENTRY:%.]] ]
	; INTERLEAVE-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ [[TMP51]], [[MIDDLE_BLOCK]] ], [ [[A]], [[ENTRY]] ]			; INTERLEAVE-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ [[RDX_START]], [[MIDDLE_BLOCK]] ], [ [[A]], [[ENTRY]] ]
	; INTERLEAVE-NEXT: br label [[FOR_BODY:%.*]]			; INTERLEAVE-NEXT: br label [[FOR_BODY:%.*]]
	; INTERLEAVE: for.body:			; INTERLEAVE: for.body:
	; INTERLEAVE-NEXT: [[I:%.]] = phi i32 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[I_NEXT:%.]], [[FOR_INC:%.*]] ]			; INTERLEAVE-NEXT: [[I:%.]] = phi i32 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[I_NEXT:%.]], [[FOR_INC:%.*]] ]
	; INTERLEAVE-NEXT: [[VAR0:%.]] = phi i32 [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[VAR6:%.]], [[FOR_INC]] ]			; INTERLEAVE-NEXT: [[VAR0:%.]] = phi i32 [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[VAR6:%.]], [[FOR_INC]] ]
	; INTERLEAVE-NEXT: [[VAR1:%.*]] = trunc i32 [[I]] to i16			; INTERLEAVE-NEXT: [[VAR1:%.*]] = trunc i32 [[I]] to i16
	; INTERLEAVE-NEXT: [[VAR2:%.*]] = icmp eq i16 [[VAR1]], 0			; INTERLEAVE-NEXT: [[VAR2:%.*]] = icmp eq i16 [[VAR1]], 0
	; INTERLEAVE-NEXT: br i1 [[VAR2]], label [[FOR_INC]], label [[FOR_COND:%.*]]			; INTERLEAVE-NEXT: br i1 [[VAR2]], label [[FOR_INC]], label [[FOR_COND:%.*]]
	; INTERLEAVE: for.cond:			; INTERLEAVE: for.cond:
	; INTERLEAVE-NEXT: [[VAR3:%.*]] = urem i16 [[B]], [[VAR1]]			; INTERLEAVE-NEXT: [[VAR3:%.*]] = urem i16 [[B]], [[VAR1]]
	; INTERLEAVE-NEXT: br label [[FOR_INC]]			; INTERLEAVE-NEXT: br label [[FOR_INC]]
	; INTERLEAVE: for.inc:			; INTERLEAVE: for.inc:
	; INTERLEAVE-NEXT: [[VAR4:%.*]] = phi i16 [ [[VAR3]], [[FOR_COND]] ], [ 0, [[FOR_BODY]] ]			; INTERLEAVE-NEXT: [[VAR4:%.*]] = phi i16 [ [[VAR3]], [[FOR_COND]] ], [ 0, [[FOR_BODY]] ]
	; INTERLEAVE-NEXT: [[VAR5:%.*]] = sext i16 [[VAR4]] to i32			; INTERLEAVE-NEXT: [[VAR5:%.*]] = sext i16 [[VAR4]] to i32
	; INTERLEAVE-NEXT: [[VAR6]] = or i32 [[VAR0]], [[VAR5]]			; INTERLEAVE-NEXT: [[VAR6]] = or i32 [[VAR0]], [[VAR5]]
	; INTERLEAVE-NEXT: [[I_NEXT]] = add nsw i32 [[I]], 1			; INTERLEAVE-NEXT: [[I_NEXT]] = add nsw i32 [[I]], 1
	; INTERLEAVE-NEXT: [[COND:%.*]] = icmp eq i32 [[I_NEXT]], 0			; INTERLEAVE-NEXT: [[COND:%.*]] = icmp eq i32 [[I_NEXT]], 0
	; INTERLEAVE-NEXT: br i1 [[COND]], label [[FOR_END]], label [[FOR_BODY]], !llvm.loop [[LOOP49:![0-9]+]]			; INTERLEAVE-NEXT: br i1 [[COND]], label [[FOR_END]], label [[FOR_BODY]], !llvm.loop [[LOOP49:![0-9]+]]
	; INTERLEAVE: for.end:			; INTERLEAVE: for.end:
	; INTERLEAVE-NEXT: [[VAR7:%.*]] = phi i32 [ [[VAR6]], [[FOR_INC]] ], [ [[TMP51]], [[MIDDLE_BLOCK]] ]			; INTERLEAVE-NEXT: [[VAR7:%.*]] = phi i32 [ [[VAR6]], [[FOR_INC]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; INTERLEAVE-NEXT: ret i32 [[VAR7]]			; INTERLEAVE-NEXT: ret i32 [[VAR7]]
	;			;
	entry:			entry:
	br label %for.body			br label %for.body

	for.body:			for.body:
	%i = phi i32 [ -20, %entry ], [ %i.next, %for.inc ]			%i = phi i32 [ -20, %entry ], [ %i.next, %for.inc ]
	%var0 = phi i32 [ %a, %entry ], [ %var6, %for.inc ]			%var0 = phi i32 [ %a, %entry ], [ %var6, %for.inc ]
	▲ Show 20 Lines • Show All 50 Lines • ▼ Show 20 Lines
	; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 2			; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 2
	; CHECK-NEXT: [[VEC_IND_NEXT]] = add <2 x i32> [[VEC_IND]], <i32 2, i32 2>			; CHECK-NEXT: [[VEC_IND_NEXT]] = add <2 x i32> [[VEC_IND]], <i32 2, i32 2>
	; CHECK-NEXT: [[VEC_IND_NEXT3]] = add <2 x i32> [[VEC_IND2]], <i32 2, i32 2>			; CHECK-NEXT: [[VEC_IND_NEXT3]] = add <2 x i32> [[VEC_IND2]], <i32 2, i32 2>
	; CHECK-NEXT: [[VEC_IND_NEXT5]] = add <2 x i32> [[VEC_IND4]], <i32 2, i32 2>			; CHECK-NEXT: [[VEC_IND_NEXT5]] = add <2 x i32> [[VEC_IND4]], <i32 2, i32 2>
	; CHECK-NEXT: [[TMP11:%.*]] = icmp eq i64 [[INDEX_NEXT]], 112			; CHECK-NEXT: [[TMP11:%.*]] = icmp eq i64 [[INDEX_NEXT]], 112
	; CHECK-NEXT: br i1 [[TMP11]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP50:![0-9]+]]			; CHECK-NEXT: br i1 [[TMP11]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP50:![0-9]+]]
	; CHECK: middle.block:			; CHECK: middle.block:
	; CHECK-NEXT: [[TMP12:%.*]] = call i64 @llvm.vector.reduce.add.v2i64(<2 x i64> [[TMP10]])			; CHECK-NEXT: [[TMP12:%.*]] = call i64 @llvm.vector.reduce.add.v2i64(<2 x i64> [[TMP10]])
				; CHECK-NEXT: [[RDX_START:%.*]] = add i64 0, [[TMP12]]
	; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i64 113, 112			; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i64 113, 112
	; CHECK-NEXT: [[VECTOR_RECUR_EXTRACT:%.*]] = extractelement <2 x i32> [[VEC_IND2]], i32 1			; CHECK-NEXT: [[VECTOR_RECUR_EXTRACT:%.*]] = extractelement <2 x i32> [[VEC_IND2]], i32 1
	; CHECK-NEXT: [[VECTOR_RECUR_EXTRACT_FOR_PHI:%.*]] = extractelement <2 x i32> [[VEC_IND2]], i32 0			; CHECK-NEXT: [[VECTOR_RECUR_EXTRACT_FOR_PHI:%.*]] = extractelement <2 x i32> [[VEC_IND2]], i32 0
	; CHECK-NEXT: br i1 [[CMP_N]], label [[EXIT:%.*]], label [[SCALAR_PH]]			; CHECK-NEXT: br i1 [[CMP_N]], label [[EXIT:%.*]], label [[SCALAR_PH]]
	; CHECK: scalar.ph:			; CHECK: scalar.ph:
	; CHECK-NEXT: [[SCALAR_RECUR_INIT:%.]] = phi i32 [ 42, [[ENTRY:%.]] ], [ [[VECTOR_RECUR_EXTRACT]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[SCALAR_RECUR_INIT:%.]] = phi i32 [ 42, [[ENTRY:%.]] ], [ [[VECTOR_RECUR_EXTRACT]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: [[BC_RESUME_VAL:%.*]] = phi i64 [ 113, [[MIDDLE_BLOCK]] ], [ 1, [[ENTRY]] ]			; CHECK-NEXT: [[BC_RESUME_VAL:%.*]] = phi i64 [ 113, [[MIDDLE_BLOCK]] ], [ 1, [[ENTRY]] ]
	; CHECK-NEXT: [[BC_RESUME_VAL1:%.*]] = phi i32 [ 113, [[MIDDLE_BLOCK]] ], [ 1, [[ENTRY]] ]			; CHECK-NEXT: [[BC_RESUME_VAL1:%.*]] = phi i32 [ 113, [[MIDDLE_BLOCK]] ], [ 1, [[ENTRY]] ]
	; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i64 [ 0, [[ENTRY]] ], [ [[TMP12]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i64 [ 0, [[ENTRY]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: br label [[LOOP:%.*]]			; CHECK-NEXT: br label [[LOOP:%.*]]
	; CHECK: exit:			; CHECK: exit:
	; CHECK-NEXT: [[DOTLCSSA:%.]] = phi i64 [ [[C23:%.]], [[LOOP]] ], [ [[TMP12]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[DOTLCSSA:%.]] = phi i64 [ [[C23:%.]], [[LOOP]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: ret i64 [[DOTLCSSA]]			; CHECK-NEXT: ret i64 [[DOTLCSSA]]
	; CHECK: loop:			; CHECK: loop:
	; CHECK-NEXT: [[C5:%.*]] = phi i64 [ [[C23]], [[LOOP]] ], [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ]			; CHECK-NEXT: [[C5:%.*]] = phi i64 [ [[C23]], [[LOOP]] ], [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ]
	; CHECK-NEXT: [[INDVARS_IV:%.]] = phi i64 [ [[INDVARS_IV_NEXT:%.]], [[LOOP]] ], [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ]			; CHECK-NEXT: [[INDVARS_IV:%.]] = phi i64 [ [[INDVARS_IV_NEXT:%.]], [[LOOP]] ], [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ]
	; CHECK-NEXT: [[X:%.]] = phi i32 [ [[C24:%.]], [[LOOP]] ], [ [[BC_RESUME_VAL1]], [[SCALAR_PH]] ]			; CHECK-NEXT: [[X:%.]] = phi i32 [ [[C24:%.]], [[LOOP]] ], [ [[BC_RESUME_VAL1]], [[SCALAR_PH]] ]
	; CHECK-NEXT: [[SCALAR_RECUR:%.]] = phi i32 [ [[C6:%.]], [[LOOP]] ], [ [[SCALAR_RECUR_INIT]], [[SCALAR_PH]] ]			; CHECK-NEXT: [[SCALAR_RECUR:%.]] = phi i32 [ [[C6:%.]], [[LOOP]] ], [ [[SCALAR_RECUR_INIT]], [[SCALAR_PH]] ]
	; CHECK-NEXT: [[C6]] = trunc i64 [[INDVARS_IV]] to i32			; CHECK-NEXT: [[C6]] = trunc i64 [[INDVARS_IV]] to i32
	; CHECK-NEXT: [[C8:%.*]] = mul i32 [[X]], [[C6]]			; CHECK-NEXT: [[C8:%.*]] = mul i32 [[X]], [[C6]]
	▲ Show 20 Lines • Show All 198 Lines • ▼ Show 20 Lines
	; UNROLL-NO-IC-NEXT: [[VEC_IND_NEXT]] = add <2 x i32> [[STEP_ADD]], <i32 2, i32 2>			; UNROLL-NO-IC-NEXT: [[VEC_IND_NEXT]] = add <2 x i32> [[STEP_ADD]], <i32 2, i32 2>
	; UNROLL-NO-IC-NEXT: [[VEC_IND_NEXT7]] = add <2 x i32> [[STEP_ADD5]], <i32 2, i32 2>			; UNROLL-NO-IC-NEXT: [[VEC_IND_NEXT7]] = add <2 x i32> [[STEP_ADD5]], <i32 2, i32 2>
	; UNROLL-NO-IC-NEXT: [[VEC_IND_NEXT11]] = add <2 x i32> [[STEP_ADD9]], <i32 2, i32 2>			; UNROLL-NO-IC-NEXT: [[VEC_IND_NEXT11]] = add <2 x i32> [[STEP_ADD9]], <i32 2, i32 2>
	; UNROLL-NO-IC-NEXT: [[TMP22:%.*]] = icmp eq i64 [[INDEX_NEXT]], 112			; UNROLL-NO-IC-NEXT: [[TMP22:%.*]] = icmp eq i64 [[INDEX_NEXT]], 112
	; UNROLL-NO-IC-NEXT: br i1 [[TMP22]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP50:![0-9]+]]			; UNROLL-NO-IC-NEXT: br i1 [[TMP22]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP50:![0-9]+]]
	; UNROLL-NO-IC: middle.block:			; UNROLL-NO-IC: middle.block:
	; UNROLL-NO-IC-NEXT: [[BIN_RDX:%.*]] = add <2 x i64> [[TMP21]], [[TMP20]]			; UNROLL-NO-IC-NEXT: [[BIN_RDX:%.*]] = add <2 x i64> [[TMP21]], [[TMP20]]
	; UNROLL-NO-IC-NEXT: [[TMP23:%.*]] = call i64 @llvm.vector.reduce.add.v2i64(<2 x i64> [[BIN_RDX]])			; UNROLL-NO-IC-NEXT: [[TMP23:%.*]] = call i64 @llvm.vector.reduce.add.v2i64(<2 x i64> [[BIN_RDX]])
				; UNROLL-NO-IC-NEXT: [[RDX_START:%.*]] = add i64 0, [[TMP23]]
	; UNROLL-NO-IC-NEXT: [[CMP_N:%.*]] = icmp eq i64 113, 112			; UNROLL-NO-IC-NEXT: [[CMP_N:%.*]] = icmp eq i64 113, 112
	; UNROLL-NO-IC-NEXT: [[VECTOR_RECUR_EXTRACT:%.*]] = extractelement <2 x i32> [[STEP_ADD5]], i32 1			; UNROLL-NO-IC-NEXT: [[VECTOR_RECUR_EXTRACT:%.*]] = extractelement <2 x i32> [[STEP_ADD5]], i32 1
	; UNROLL-NO-IC-NEXT: [[VECTOR_RECUR_EXTRACT_FOR_PHI:%.*]] = extractelement <2 x i32> [[STEP_ADD5]], i32 0			; UNROLL-NO-IC-NEXT: [[VECTOR_RECUR_EXTRACT_FOR_PHI:%.*]] = extractelement <2 x i32> [[STEP_ADD5]], i32 0
	; UNROLL-NO-IC-NEXT: br i1 [[CMP_N]], label [[EXIT:%.*]], label [[SCALAR_PH]]			; UNROLL-NO-IC-NEXT: br i1 [[CMP_N]], label [[EXIT:%.*]], label [[SCALAR_PH]]
	; UNROLL-NO-IC: scalar.ph:			; UNROLL-NO-IC: scalar.ph:
	; UNROLL-NO-IC-NEXT: [[SCALAR_RECUR_INIT:%.]] = phi i32 [ 42, [[ENTRY:%.]] ], [ [[VECTOR_RECUR_EXTRACT]], [[MIDDLE_BLOCK]] ]			; UNROLL-NO-IC-NEXT: [[SCALAR_RECUR_INIT:%.]] = phi i32 [ 42, [[ENTRY:%.]] ], [ [[VECTOR_RECUR_EXTRACT]], [[MIDDLE_BLOCK]] ]
	; UNROLL-NO-IC-NEXT: [[BC_RESUME_VAL:%.*]] = phi i64 [ 113, [[MIDDLE_BLOCK]] ], [ 1, [[ENTRY]] ]			; UNROLL-NO-IC-NEXT: [[BC_RESUME_VAL:%.*]] = phi i64 [ 113, [[MIDDLE_BLOCK]] ], [ 1, [[ENTRY]] ]
	; UNROLL-NO-IC-NEXT: [[BC_RESUME_VAL1:%.*]] = phi i32 [ 113, [[MIDDLE_BLOCK]] ], [ 1, [[ENTRY]] ]			; UNROLL-NO-IC-NEXT: [[BC_RESUME_VAL1:%.*]] = phi i32 [ 113, [[MIDDLE_BLOCK]] ], [ 1, [[ENTRY]] ]
	; UNROLL-NO-IC-NEXT: [[BC_MERGE_RDX:%.*]] = phi i64 [ 0, [[ENTRY]] ], [ [[TMP23]], [[MIDDLE_BLOCK]] ]			; UNROLL-NO-IC-NEXT: [[BC_MERGE_RDX:%.*]] = phi i64 [ 0, [[ENTRY]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; UNROLL-NO-IC-NEXT: br label [[LOOP:%.*]]			; UNROLL-NO-IC-NEXT: br label [[LOOP:%.*]]
	; UNROLL-NO-IC: exit:			; UNROLL-NO-IC: exit:
	; UNROLL-NO-IC-NEXT: [[DOTLCSSA:%.]] = phi i64 [ [[C23:%.]], [[LOOP]] ], [ [[TMP23]], [[MIDDLE_BLOCK]] ]			; UNROLL-NO-IC-NEXT: [[DOTLCSSA:%.]] = phi i64 [ [[C23:%.]], [[LOOP]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; UNROLL-NO-IC-NEXT: ret i64 [[DOTLCSSA]]			; UNROLL-NO-IC-NEXT: ret i64 [[DOTLCSSA]]
	; UNROLL-NO-IC: loop:			; UNROLL-NO-IC: loop:
	; UNROLL-NO-IC-NEXT: [[C5:%.*]] = phi i64 [ [[C23]], [[LOOP]] ], [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ]			; UNROLL-NO-IC-NEXT: [[C5:%.*]] = phi i64 [ [[C23]], [[LOOP]] ], [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ]
	; UNROLL-NO-IC-NEXT: [[INDVARS_IV:%.]] = phi i64 [ [[INDVARS_IV_NEXT:%.]], [[LOOP]] ], [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ]			; UNROLL-NO-IC-NEXT: [[INDVARS_IV:%.]] = phi i64 [ [[INDVARS_IV_NEXT:%.]], [[LOOP]] ], [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ]
	; UNROLL-NO-IC-NEXT: [[X:%.]] = phi i32 [ [[C24:%.]], [[LOOP]] ], [ [[BC_RESUME_VAL1]], [[SCALAR_PH]] ]			; UNROLL-NO-IC-NEXT: [[X:%.]] = phi i32 [ [[C24:%.]], [[LOOP]] ], [ [[BC_RESUME_VAL1]], [[SCALAR_PH]] ]
	; UNROLL-NO-IC-NEXT: [[SCALAR_RECUR:%.]] = phi i32 [ [[C6:%.]], [[LOOP]] ], [ [[SCALAR_RECUR_INIT]], [[SCALAR_PH]] ]			; UNROLL-NO-IC-NEXT: [[SCALAR_RECUR:%.]] = phi i32 [ [[C6:%.]], [[LOOP]] ], [ [[SCALAR_RECUR_INIT]], [[SCALAR_PH]] ]
	; UNROLL-NO-IC-NEXT: [[C6]] = trunc i64 [[INDVARS_IV]] to i32			; UNROLL-NO-IC-NEXT: [[C6]] = trunc i64 [[INDVARS_IV]] to i32
	; UNROLL-NO-IC-NEXT: [[C8:%.*]] = mul i32 [[X]], [[C6]]			; UNROLL-NO-IC-NEXT: [[C8:%.*]] = mul i32 [[X]], [[C6]]
	▲ Show 20 Lines • Show All 810 Lines • Show Last 20 Lines

llvm/test/Transforms/LoopVectorize/interleaved-accesses.ll

	Show First 20 Lines • Show All 756 Lines • ▼ Show 20 Lines
	; CHECK-NEXT: [[TMP0:%.*]] = mul i64 [[INDEX]], 3			; CHECK-NEXT: [[TMP0:%.*]] = mul i64 [[INDEX]], 3
	; CHECK-NEXT: [[NEXT_GEP:%.]] = getelementptr i32, i32 [[A:%.*]], i64 [[TMP0]]			; CHECK-NEXT: [[NEXT_GEP:%.]] = getelementptr i32, i32 [[A:%.*]], i64 [[TMP0]]
	; CHECK-NEXT: [[TMP1:%.]] = bitcast i32 [[NEXT_GEP]] to <12 x i32>*			; CHECK-NEXT: [[TMP1:%.]] = bitcast i32 [[NEXT_GEP]] to <12 x i32>*
	; CHECK-NEXT: [[WIDE_VEC:%.]] = load <12 x i32>, <12 x i32> [[TMP1]], align 4			; CHECK-NEXT: [[WIDE_VEC:%.]] = load <12 x i32>, <12 x i32> [[TMP1]], align 4
	; CHECK-NEXT: [[STRIDED_VEC:%.*]] = shufflevector <12 x i32> [[WIDE_VEC]], <12 x i32> poison, <4 x i32> <i32 0, i32 3, i32 6, i32 9>			; CHECK-NEXT: [[STRIDED_VEC:%.*]] = shufflevector <12 x i32> [[WIDE_VEC]], <12 x i32> poison, <4 x i32> <i32 0, i32 3, i32 6, i32 9>
	; CHECK-NEXT: [[STRIDED_VEC2:%.*]] = shufflevector <12 x i32> [[WIDE_VEC]], <12 x i32> poison, <4 x i32> <i32 1, i32 4, i32 7, i32 10>			; CHECK-NEXT: [[STRIDED_VEC2:%.*]] = shufflevector <12 x i32> [[WIDE_VEC]], <12 x i32> poison, <4 x i32> <i32 1, i32 4, i32 7, i32 10>
	; CHECK-NEXT: [[STRIDED_VEC3:%.*]] = shufflevector <12 x i32> [[WIDE_VEC]], <12 x i32> poison, <4 x i32> <i32 2, i32 5, i32 8, i32 11>			; CHECK-NEXT: [[STRIDED_VEC3:%.*]] = shufflevector <12 x i32> [[WIDE_VEC]], <12 x i32> poison, <4 x i32> <i32 2, i32 5, i32 8, i32 11>
	; CHECK-NEXT: [[TMP2:%.*]] = add <4 x i32> [[STRIDED_VEC]], [[VEC_IND]]			; CHECK-NEXT: [[TMP2:%.*]] = add <4 x i32> [[STRIDED_VEC]], [[VEC_IND]]
	; CHECK-NEXT: [[TMP4:%.*]] = add <4 x i32> [[STRIDED_VEC2]], [[VEC_IND]]			; CHECK-NEXT: [[TMP3:%.*]] = add <4 x i32> [[STRIDED_VEC2]], [[VEC_IND]]
	; CHECK-NEXT: [[TMP5:%.*]] = add <4 x i32> [[STRIDED_VEC3]], [[VEC_IND]]			; CHECK-NEXT: [[TMP4:%.*]] = add <4 x i32> [[STRIDED_VEC3]], [[VEC_IND]]
	; CHECK-NEXT: [[TMP7:%.]] = bitcast i32 [[NEXT_GEP]] to <12 x i32>*			; CHECK-NEXT: [[TMP5:%.]] = bitcast i32 [[NEXT_GEP]] to <12 x i32>*
	; CHECK-NEXT: [[TMP8:%.*]] = shufflevector <4 x i32> [[TMP2]], <4 x i32> [[TMP4]], <8 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7>			; CHECK-NEXT: [[TMP6:%.*]] = shufflevector <4 x i32> [[TMP2]], <4 x i32> [[TMP3]], <8 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7>
	; CHECK-NEXT: [[TMP9:%.*]] = shufflevector <4 x i32> [[TMP5]], <4 x i32> poison, <8 x i32> <i32 0, i32 1, i32 2, i32 3, i32 undef, i32 undef, i32 undef, i32 undef>			; CHECK-NEXT: [[TMP7:%.*]] = shufflevector <4 x i32> [[TMP4]], <4 x i32> poison, <8 x i32> <i32 0, i32 1, i32 2, i32 3, i32 undef, i32 undef, i32 undef, i32 undef>
	; CHECK-NEXT: [[INTERLEAVED_VEC:%.*]] = shufflevector <8 x i32> [[TMP8]], <8 x i32> [[TMP9]], <12 x i32> <i32 0, i32 4, i32 8, i32 1, i32 5, i32 9, i32 2, i32 6, i32 10, i32 3, i32 7, i32 11>			; CHECK-NEXT: [[INTERLEAVED_VEC:%.*]] = shufflevector <8 x i32> [[TMP6]], <8 x i32> [[TMP7]], <12 x i32> <i32 0, i32 4, i32 8, i32 1, i32 5, i32 9, i32 2, i32 6, i32 10, i32 3, i32 7, i32 11>
	; CHECK-NEXT: store <12 x i32> [[INTERLEAVED_VEC]], <12 x i32>* [[TMP7]], align 4			; CHECK-NEXT: store <12 x i32> [[INTERLEAVED_VEC]], <12 x i32>* [[TMP5]], align 4
	; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 4			; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 4
	; CHECK-NEXT: [[VEC_IND_NEXT]] = add <4 x i32> [[VEC_IND]], <i32 4, i32 4, i32 4, i32 4>			; CHECK-NEXT: [[VEC_IND_NEXT]] = add <4 x i32> [[VEC_IND]], <i32 4, i32 4, i32 4, i32 4>
	; CHECK-NEXT: [[TMP10:%.*]] = icmp eq i64 [[INDEX_NEXT]], 1024			; CHECK-NEXT: [[TMP8:%.*]] = icmp eq i64 [[INDEX_NEXT]], 1024
	; CHECK-NEXT: br i1 [[TMP10]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP20:![0-9]+]]			; CHECK-NEXT: br i1 [[TMP8]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP20:![0-9]+]]
	; CHECK: middle.block:			; CHECK: middle.block:
	; CHECK-NEXT: br i1 true, label [[FOR_COND_CLEANUP:%.*]], label [[SCALAR_PH]]			; CHECK-NEXT: br i1 true, label [[FOR_COND_CLEANUP:%.*]], label [[SCALAR_PH]]
	; CHECK: scalar.ph:			; CHECK: scalar.ph:
	; CHECK-NEXT: br label [[FOR_BODY:%.*]]			; CHECK-NEXT: br label [[FOR_BODY:%.*]]
	; CHECK: for.cond.cleanup:			; CHECK: for.cond.cleanup:
	; CHECK-NEXT: ret void			; CHECK-NEXT: ret void
	; CHECK: for.body:			; CHECK: for.body:
	; CHECK-NEXT: br i1 poison, label [[FOR_COND_CLEANUP]], label [[FOR_BODY]], !llvm.loop [[LOOP21:![0-9]+]]			; CHECK-NEXT: br i1 poison, label [[FOR_COND_CLEANUP]], label [[FOR_BODY]], !llvm.loop [[LOOP21:![0-9]+]]
	▲ Show 20 Lines • Show All 55 Lines • ▼ Show 20 Lines
	define void @int_float_struct(%struct.IntFloat* nocapture readonly %A) #0 {			define void @int_float_struct(%struct.IntFloat* nocapture readonly %A) #0 {
	; CHECK-LABEL: @int_float_struct(			; CHECK-LABEL: @int_float_struct(
	; CHECK-NEXT: entry:			; CHECK-NEXT: entry:
	; CHECK-NEXT: br i1 false, label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]			; CHECK-NEXT: br i1 false, label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]
	; CHECK: vector.ph:			; CHECK: vector.ph:
	; CHECK-NEXT: br label [[VECTOR_BODY:%.*]]			; CHECK-NEXT: br label [[VECTOR_BODY:%.*]]
	; CHECK: vector.body:			; CHECK: vector.body:
	; CHECK-NEXT: [[INDEX:%.]] = phi i64 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[VECTOR_BODY]] ]			; CHECK-NEXT: [[INDEX:%.]] = phi i64 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[VECTOR_BODY]] ]
	; CHECK-NEXT: [[VEC_PHI:%.]] = phi <4 x float> [ <float undef, float 0.000000e+00, float 0.000000e+00, float 0.000000e+00>, [[VECTOR_PH]] ], [ [[TMP4:%.]], [[VECTOR_BODY]] ]
	; CHECK-NEXT: [[VEC_PHI1:%.]] = phi <4 x i32> [ <i32 undef, i32 0, i32 0, i32 0>, [[VECTOR_PH]] ], [ [[TMP3:%.]], [[VECTOR_BODY]] ]
	; CHECK-NEXT: [[TMP0:%.]] = getelementptr inbounds [[STRUCT_INTFLOAT:%.]], %struct.IntFloat* [[A:%.*]], i64 [[INDEX]], i32 0
	; CHECK-NEXT: [[TMP1:%.]] = bitcast i32 [[TMP0]] to <8 x i32>*
	; CHECK-NEXT: [[WIDE_VEC:%.]] = load <8 x i32>, <8 x i32> [[TMP1]], align 4
	; CHECK-NEXT: [[STRIDED_VEC:%.*]] = shufflevector <8 x i32> [[WIDE_VEC]], <8 x i32> poison, <4 x i32> <i32 0, i32 2, i32 4, i32 6>
	; CHECK-NEXT: [[STRIDED_VEC2:%.*]] = shufflevector <8 x i32> [[WIDE_VEC]], <8 x i32> poison, <4 x i32> <i32 1, i32 3, i32 5, i32 7>
	; CHECK-NEXT: [[TMP2:%.*]] = bitcast <4 x i32> [[STRIDED_VEC2]] to <4 x float>
	; CHECK-NEXT: [[TMP3]] = add <4 x i32> [[STRIDED_VEC]], [[VEC_PHI1]]
	; CHECK-NEXT: [[TMP4]] = fadd fast <4 x float> [[VEC_PHI]], [[TMP2]]
	; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 4			; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 4
	; CHECK-NEXT: [[TMP5:%.*]] = icmp eq i64 [[INDEX_NEXT]], 1024			; CHECK-NEXT: [[TMP0:%.*]] = icmp eq i64 [[INDEX_NEXT]], 1024
	; CHECK-NEXT: br i1 [[TMP5]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP22:![0-9]+]]			; CHECK-NEXT: br i1 [[TMP0]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP22:![0-9]+]]
	; CHECK: middle.block:			; CHECK: middle.block:
	; CHECK-NEXT: [[TMP6:%.*]] = call i32 @llvm.vector.reduce.add.v4i32(<4 x i32> [[TMP3]])
	; CHECK-NEXT: [[TMP7:%.*]] = call fast float @llvm.vector.reduce.fadd.v4f32(float -0.000000e+00, <4 x float> [[TMP4]])
	; CHECK-NEXT: br i1 true, label [[FOR_COND_CLEANUP:%.*]], label [[SCALAR_PH]]			; CHECK-NEXT: br i1 true, label [[FOR_COND_CLEANUP:%.*]], label [[SCALAR_PH]]
	; CHECK: scalar.ph:			; CHECK: scalar.ph:
	; CHECK-NEXT: br label [[FOR_BODY:%.*]]			; CHECK-NEXT: br label [[FOR_BODY:%.*]]
	; CHECK: for.cond.cleanup:			; CHECK: for.cond.cleanup:
	; CHECK-NEXT: [[ADD_LCSSA:%.*]] = phi i32 [ poison, [[FOR_BODY]] ], [ [[TMP6]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: store float 0x7FF8000000000000, float* @SB, align 4
	; CHECK-NEXT: [[ADD3_LCSSA:%.*]] = phi float [ poison, [[FOR_BODY]] ], [ [[TMP7]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: store i32 [[ADD_LCSSA]], i32* @SA, align 4
	; CHECK-NEXT: store float [[ADD3_LCSSA]], float* @SB, align 4
	; CHECK-NEXT: ret void			; CHECK-NEXT: ret void
	; CHECK: for.body:			; CHECK: for.body:
	; CHECK-NEXT: br i1 poison, label [[FOR_COND_CLEANUP]], label [[FOR_BODY]], !llvm.loop [[LOOP23:![0-9]+]]			; CHECK-NEXT: br i1 poison, label [[FOR_COND_CLEANUP]], label [[FOR_BODY]], !llvm.loop [[LOOP23:![0-9]+]]
	;			;
	entry:			entry:
	br label %for.body			br label %for.body

	for.cond.cleanup: ; preds = %for.body			for.cond.cleanup: ; preds = %for.body
	▲ Show 20 Lines • Show All 732 Lines • Show Last 20 Lines

llvm/test/Transforms/LoopVectorize/loop-form.ll

	Show First 20 Lines • Show All 1,205 Lines • ▼ Show 20 Lines
	; CHECK-NEXT: [[TMP3:%.]] = bitcast i32 [[TMP2]] to <2 x i32>*			; CHECK-NEXT: [[TMP3:%.]] = bitcast i32 [[TMP2]] to <2 x i32>*
	; CHECK-NEXT: [[WIDE_LOAD:%.]] = load <2 x i32>, <2 x i32> [[TMP3]], align 4			; CHECK-NEXT: [[WIDE_LOAD:%.]] = load <2 x i32>, <2 x i32> [[TMP3]], align 4
	; CHECK-NEXT: [[TMP4]] = add <2 x i32> [[VEC_PHI]], [[WIDE_LOAD]]			; CHECK-NEXT: [[TMP4]] = add <2 x i32> [[VEC_PHI]], [[WIDE_LOAD]]
	; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 2			; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 2
	; CHECK-NEXT: [[TMP5:%.*]] = icmp eq i64 [[INDEX_NEXT]], 200			; CHECK-NEXT: [[TMP5:%.*]] = icmp eq i64 [[INDEX_NEXT]], 200
	; CHECK-NEXT: br i1 [[TMP5]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP22:![0-9]+]]			; CHECK-NEXT: br i1 [[TMP5]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP22:![0-9]+]]
	; CHECK: middle.block:			; CHECK: middle.block:
	; CHECK-NEXT: [[TMP6:%.*]] = call i32 @llvm.vector.reduce.add.v2i32(<2 x i32> [[TMP4]])			; CHECK-NEXT: [[TMP6:%.*]] = call i32 @llvm.vector.reduce.add.v2i32(<2 x i32> [[TMP4]])
				; CHECK-NEXT: [[RDX_START:%.*]] = add i32 0, [[TMP6]]
	; CHECK-NEXT: br label [[SCALAR_PH]]			; CHECK-NEXT: br label [[SCALAR_PH]]
	; CHECK: scalar.ph:			; CHECK: scalar.ph:
	; CHECK-NEXT: [[BC_RESUME_VAL:%.]] = phi i64 [ 200, [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY:%.]] ]			; CHECK-NEXT: [[BC_RESUME_VAL:%.]] = phi i64 [ 200, [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY:%.]] ]
	; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 0, [[ENTRY]] ], [ [[TMP6]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 0, [[ENTRY]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: br label [[LOOP_HEADER:%.*]]			; CHECK-NEXT: br label [[LOOP_HEADER:%.*]]
	; CHECK: loop.header:			; CHECK: loop.header:
	; CHECK-NEXT: [[IV:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[IV_NEXT:%.]], [[LOOP_LATCH:%.*]] ]			; CHECK-NEXT: [[IV:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[IV_NEXT:%.]], [[LOOP_LATCH:%.*]] ]
	; CHECK-NEXT: [[ACCUM:%.]] = phi i32 [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[ACCUM_NEXT:%.]], [[LOOP_LATCH]] ]			; CHECK-NEXT: [[ACCUM:%.]] = phi i32 [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[ACCUM_NEXT:%.]], [[LOOP_LATCH]] ]
	; CHECK-NEXT: [[GEP:%.]] = getelementptr i32, i32 [[ADDR]], i64 [[IV]]			; CHECK-NEXT: [[GEP:%.]] = getelementptr i32, i32 [[ADDR]], i64 [[IV]]
	; CHECK-NEXT: [[EXITCOND_NOT:%.*]] = icmp eq i64 [[IV]], 200			; CHECK-NEXT: [[EXITCOND_NOT:%.*]] = icmp eq i64 [[IV]], 200
	; CHECK-NEXT: br i1 [[EXITCOND_NOT]], label [[EXIT:%.*]], label [[LOOP_LATCH]]			; CHECK-NEXT: br i1 [[EXITCOND_NOT]], label [[EXIT:%.*]], label [[LOOP_LATCH]]
	; CHECK: loop.latch:			; CHECK: loop.latch:
	▲ Show 20 Lines • Show All 111 Lines • Show Last 20 Lines

llvm/test/Transforms/LoopVectorize/pr51614-fold-tail-by-masking.ll

	Show All 9 Lines

	define dso_local i16 @reverse_interleave_load_fold_mask() optsize {			define dso_local i16 @reverse_interleave_load_fold_mask() optsize {
	; CHECK-LABEL: @reverse_interleave_load_fold_mask(			; CHECK-LABEL: @reverse_interleave_load_fold_mask(
	; CHECK-NEXT: entry:			; CHECK-NEXT: entry:
	; CHECK-NEXT: br i1 false, label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]			; CHECK-NEXT: br i1 false, label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]
	; CHECK: vector.ph:			; CHECK: vector.ph:
	; CHECK-NEXT: br label [[VECTOR_BODY:%.*]]			; CHECK-NEXT: br label [[VECTOR_BODY:%.*]]
	; CHECK: vector.body:			; CHECK: vector.body:
	; CHECK-NEXT: [[INDEX:%.]] = phi i32 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[PRED_LOAD_CONTINUE4:%.*]] ]			; CHECK-NEXT: [[INDEX:%.]] = phi i32 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[PRED_LOAD_CONTINUE2:%.*]] ]
	; CHECK-NEXT: [[VEC_PHI:%.]] = phi <2 x i16> [ zeroinitializer, [[VECTOR_PH]] ], [ [[TMP25:%.]], [[PRED_LOAD_CONTINUE4]] ]			; CHECK-NEXT: [[VEC_PHI:%.]] = phi <2 x i16> [ zeroinitializer, [[VECTOR_PH]] ], [ [[TMP25:%.]], [[PRED_LOAD_CONTINUE2]] ]
	; CHECK-NEXT: [[TMP0:%.*]] = trunc i32 [[INDEX]] to i16			; CHECK-NEXT: [[TMP0:%.*]] = trunc i32 [[INDEX]] to i16
	; CHECK-NEXT: [[OFFSET_IDX:%.*]] = sub i16 41, [[TMP0]]			; CHECK-NEXT: [[OFFSET_IDX:%.*]] = sub i16 41, [[TMP0]]
	; CHECK-NEXT: [[BROADCAST_SPLATINSERT1:%.*]] = insertelement <2 x i32> poison, i32 [[INDEX]], i32 0			; CHECK-NEXT: [[BROADCAST_SPLATINSERT:%.*]] = insertelement <2 x i32> poison, i32 [[INDEX]], i32 0
	; CHECK-NEXT: [[BROADCAST_SPLAT2:%.*]] = shufflevector <2 x i32> [[BROADCAST_SPLATINSERT1]], <2 x i32> poison, <2 x i32> zeroinitializer			; CHECK-NEXT: [[BROADCAST_SPLAT:%.*]] = shufflevector <2 x i32> [[BROADCAST_SPLATINSERT]], <2 x i32> poison, <2 x i32> zeroinitializer
	; CHECK-NEXT: [[VEC_IV:%.*]] = add <2 x i32> [[BROADCAST_SPLAT2]], <i32 0, i32 1>			; CHECK-NEXT: [[VEC_IV:%.*]] = add <2 x i32> [[BROADCAST_SPLAT]], <i32 0, i32 1>
	; CHECK-NEXT: [[TMP1:%.*]] = icmp ule <2 x i32> [[VEC_IV]], <i32 40, i32 40>			; CHECK-NEXT: [[TMP1:%.*]] = icmp ule <2 x i32> [[VEC_IV]], <i32 40, i32 40>
	; CHECK-NEXT: [[TMP2:%.*]] = extractelement <2 x i1> [[TMP1]], i32 0			; CHECK-NEXT: [[TMP2:%.*]] = extractelement <2 x i1> [[TMP1]], i32 0
	; CHECK-NEXT: br i1 [[TMP2]], label [[PRED_LOAD_IF:%.]], label [[PRED_LOAD_CONTINUE:%.]]			; CHECK-NEXT: br i1 [[TMP2]], label [[PRED_LOAD_IF:%.]], label [[PRED_LOAD_CONTINUE:%.]]
	; CHECK: pred.load.if:			; CHECK: pred.load.if:
	; CHECK-NEXT: [[TMP3:%.*]] = add i16 [[OFFSET_IDX]], 0			; CHECK-NEXT: [[TMP3:%.*]] = add i16 [[OFFSET_IDX]], 0
	; CHECK-NEXT: [[TMP4:%.*]] = add nsw i16 [[TMP3]], -1			; CHECK-NEXT: [[TMP4:%.*]] = add nsw i16 [[TMP3]], -1
	; CHECK-NEXT: [[TMP5:%.]] = getelementptr inbounds [40 x [4 x i16]], [40 x [4 x i16]] @A, i16 0, i16 [[TMP4]], i16 0			; CHECK-NEXT: [[TMP5:%.]] = getelementptr inbounds [40 x [4 x i16]], [40 x [4 x i16]] @A, i16 0, i16 [[TMP4]], i16 0
	; CHECK-NEXT: [[TMP6:%.]] = load i16, i16 [[TMP5]], align 1			; CHECK-NEXT: [[TMP6:%.]] = load i16, i16 [[TMP5]], align 1
	; CHECK-NEXT: [[TMP7:%.*]] = insertelement <2 x i16> poison, i16 [[TMP6]], i32 0			; CHECK-NEXT: [[TMP7:%.*]] = insertelement <2 x i16> poison, i16 [[TMP6]], i32 0
	; CHECK-NEXT: [[TMP8:%.]] = getelementptr inbounds [40 x [4 x i16]], [40 x [4 x i16]] @A, i16 0, i16 [[TMP4]], i16 3			; CHECK-NEXT: [[TMP8:%.]] = getelementptr inbounds [40 x [4 x i16]], [40 x [4 x i16]] @A, i16 0, i16 [[TMP4]], i16 3
	; CHECK-NEXT: [[TMP9:%.]] = load i16, i16 [[TMP8]], align 1			; CHECK-NEXT: [[TMP9:%.]] = load i16, i16 [[TMP8]], align 1
	; CHECK-NEXT: [[TMP10:%.*]] = insertelement <2 x i16> poison, i16 [[TMP9]], i32 0			; CHECK-NEXT: [[TMP10:%.*]] = insertelement <2 x i16> poison, i16 [[TMP9]], i32 0
	; CHECK-NEXT: br label [[PRED_LOAD_CONTINUE]]			; CHECK-NEXT: br label [[PRED_LOAD_CONTINUE]]
	; CHECK: pred.load.continue:			; CHECK: pred.load.continue:
	; CHECK-NEXT: [[TMP11:%.*]] = phi <2 x i16> [ poison, [[VECTOR_BODY]] ], [ [[TMP7]], [[PRED_LOAD_IF]] ]			; CHECK-NEXT: [[TMP11:%.*]] = phi <2 x i16> [ poison, [[VECTOR_BODY]] ], [ [[TMP7]], [[PRED_LOAD_IF]] ]
	; CHECK-NEXT: [[TMP12:%.*]] = phi <2 x i16> [ poison, [[VECTOR_BODY]] ], [ [[TMP10]], [[PRED_LOAD_IF]] ]			; CHECK-NEXT: [[TMP12:%.*]] = phi <2 x i16> [ poison, [[VECTOR_BODY]] ], [ [[TMP10]], [[PRED_LOAD_IF]] ]
	; CHECK-NEXT: [[TMP13:%.*]] = extractelement <2 x i1> [[TMP1]], i32 1			; CHECK-NEXT: [[TMP13:%.*]] = extractelement <2 x i1> [[TMP1]], i32 1
	; CHECK-NEXT: br i1 [[TMP13]], label [[PRED_LOAD_IF3:%.*]], label [[PRED_LOAD_CONTINUE4]]			; CHECK-NEXT: br i1 [[TMP13]], label [[PRED_LOAD_IF1:%.*]], label [[PRED_LOAD_CONTINUE2]]
	; CHECK: pred.load.if1:			; CHECK: pred.load.if1:
	; CHECK-NEXT: [[TMP14:%.*]] = add i16 [[OFFSET_IDX]], -1			; CHECK-NEXT: [[TMP14:%.*]] = add i16 [[OFFSET_IDX]], -1
	; CHECK-NEXT: [[TMP15:%.*]] = add nsw i16 [[TMP14]], -1			; CHECK-NEXT: [[TMP15:%.*]] = add nsw i16 [[TMP14]], -1
	; CHECK-NEXT: [[TMP16:%.]] = getelementptr inbounds [40 x [4 x i16]], [40 x [4 x i16]] @A, i16 0, i16 [[TMP15]], i16 0			; CHECK-NEXT: [[TMP16:%.]] = getelementptr inbounds [40 x [4 x i16]], [40 x [4 x i16]] @A, i16 0, i16 [[TMP15]], i16 0
	; CHECK-NEXT: [[TMP17:%.]] = load i16, i16 [[TMP16]], align 1			; CHECK-NEXT: [[TMP17:%.]] = load i16, i16 [[TMP16]], align 1
	; CHECK-NEXT: [[TMP18:%.*]] = insertelement <2 x i16> [[TMP11]], i16 [[TMP17]], i32 1			; CHECK-NEXT: [[TMP18:%.*]] = insertelement <2 x i16> [[TMP11]], i16 [[TMP17]], i32 1
	; CHECK-NEXT: [[TMP19:%.]] = getelementptr inbounds [40 x [4 x i16]], [40 x [4 x i16]] @A, i16 0, i16 [[TMP15]], i16 3			; CHECK-NEXT: [[TMP19:%.]] = getelementptr inbounds [40 x [4 x i16]], [40 x [4 x i16]] @A, i16 0, i16 [[TMP15]], i16 3
	; CHECK-NEXT: [[TMP20:%.]] = load i16, i16 [[TMP19]], align 1			; CHECK-NEXT: [[TMP20:%.]] = load i16, i16 [[TMP19]], align 1
	; CHECK-NEXT: [[TMP21:%.*]] = insertelement <2 x i16> [[TMP12]], i16 [[TMP20]], i32 1			; CHECK-NEXT: [[TMP21:%.*]] = insertelement <2 x i16> [[TMP12]], i16 [[TMP20]], i32 1
	; CHECK-NEXT: br label [[PRED_LOAD_CONTINUE4]]			; CHECK-NEXT: br label [[PRED_LOAD_CONTINUE2]]
	; CHECK: pred.load.continue2:			; CHECK: pred.load.continue2:
	; CHECK-NEXT: [[TMP22:%.*]] = phi <2 x i16> [ [[TMP11]], [[PRED_LOAD_CONTINUE]] ], [ [[TMP18]], [[PRED_LOAD_IF3]] ]			; CHECK-NEXT: [[TMP22:%.*]] = phi <2 x i16> [ [[TMP11]], [[PRED_LOAD_CONTINUE]] ], [ [[TMP18]], [[PRED_LOAD_IF1]] ]
	; CHECK-NEXT: [[TMP23:%.*]] = phi <2 x i16> [ [[TMP12]], [[PRED_LOAD_CONTINUE]] ], [ [[TMP21]], [[PRED_LOAD_IF3]] ]			; CHECK-NEXT: [[TMP23:%.*]] = phi <2 x i16> [ [[TMP12]], [[PRED_LOAD_CONTINUE]] ], [ [[TMP21]], [[PRED_LOAD_IF1]] ]
	; CHECK-NEXT: [[TMP24:%.*]] = add nsw <2 x i16> [[TMP22]], [[TMP23]]			; CHECK-NEXT: [[TMP24:%.*]] = add nsw <2 x i16> [[TMP22]], [[TMP23]]
	; CHECK-NEXT: [[TMP25]] = add <2 x i16> [[VEC_PHI]], [[TMP24]]			; CHECK-NEXT: [[TMP25]] = add <2 x i16> [[VEC_PHI]], [[TMP24]]
	; CHECK-NEXT: [[TMP26:%.*]] = select <2 x i1> [[TMP1]], <2 x i16> [[TMP25]], <2 x i16> [[VEC_PHI]]			; CHECK-NEXT: [[TMP26:%.*]] = select <2 x i1> [[TMP1]], <2 x i16> [[TMP25]], <2 x i16> [[VEC_PHI]]
	; CHECK-NEXT: [[INDEX_NEXT]] = add i32 [[INDEX]], 2			; CHECK-NEXT: [[INDEX_NEXT]] = add i32 [[INDEX]], 2
	; CHECK-NEXT: [[TMP27:%.*]] = icmp eq i32 [[INDEX_NEXT]], 42			; CHECK-NEXT: [[TMP27:%.*]] = icmp eq i32 [[INDEX_NEXT]], 42
	; CHECK-NEXT: br i1 [[TMP27]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP0:![0-9]+]]			; CHECK-NEXT: br i1 [[TMP27]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP0:![0-9]+]]
	; CHECK: middle.block:			; CHECK: middle.block:
	; CHECK-NEXT: [[TMP28:%.*]] = call i16 @llvm.vector.reduce.add.v2i16(<2 x i16> [[TMP26]])			; CHECK-NEXT: [[TMP28:%.*]] = call i16 @llvm.vector.reduce.add.v2i16(<2 x i16> [[TMP26]])
				; CHECK-NEXT: [[RDX_START:%.*]] = add i16 0, [[TMP28]]
	; CHECK-NEXT: br i1 true, label [[EXIT:%.*]], label [[SCALAR_PH]]			; CHECK-NEXT: br i1 true, label [[EXIT:%.*]], label [[SCALAR_PH]]
	; CHECK: scalar.ph:			; CHECK: scalar.ph:
	; CHECK-NEXT: [[BC_RESUME_VAL:%.]] = phi i16 [ -1, [[MIDDLE_BLOCK]] ], [ 41, [[ENTRY:%.]] ]			; CHECK-NEXT: [[BC_RESUME_VAL:%.]] = phi i16 [ -1, [[MIDDLE_BLOCK]] ], [ 41, [[ENTRY:%.]] ]
	; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i16 [ 0, [[ENTRY]] ], [ [[TMP28]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i16 [ 0, [[ENTRY]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: br label [[LOOP:%.*]]			; CHECK-NEXT: br label [[LOOP:%.*]]
	; CHECK: loop:			; CHECK: loop:
	; CHECK-NEXT: [[IV:%.]] = phi i16 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[IVMINUS1:%.]], [[LOOP]] ]			; CHECK-NEXT: [[IV:%.]] = phi i16 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[IVMINUS1:%.]], [[LOOP]] ]
	; CHECK-NEXT: [[SUM:%.]] = phi i16 [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[PREVSUM:%.]], [[LOOP]] ]			; CHECK-NEXT: [[SUM:%.]] = phi i16 [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[PREVSUM:%.]], [[LOOP]] ]
	; CHECK-NEXT: [[IVMINUS1]] = add nsw i16 [[IV]], -1			; CHECK-NEXT: [[IVMINUS1]] = add nsw i16 [[IV]], -1
	; CHECK-NEXT: [[GEPA0:%.]] = getelementptr inbounds [40 x [4 x i16]], [40 x [4 x i16]] @A, i16 0, i16 [[IVMINUS1]], i16 0			; CHECK-NEXT: [[GEPA0:%.]] = getelementptr inbounds [40 x [4 x i16]], [40 x [4 x i16]] @A, i16 0, i16 [[IVMINUS1]], i16 0
	; CHECK-NEXT: [[TMP29:%.]] = load i16, i16 [[GEPA0]], align 1			; CHECK-NEXT: [[TMP29:%.]] = load i16, i16 [[GEPA0]], align 1
	; CHECK-NEXT: [[GEPA3:%.]] = getelementptr inbounds [40 x [4 x i16]], [40 x [4 x i16]] @A, i16 0, i16 [[IVMINUS1]], i16 3			; CHECK-NEXT: [[GEPA3:%.]] = getelementptr inbounds [40 x [4 x i16]], [40 x [4 x i16]] @A, i16 0, i16 [[IVMINUS1]], i16 3
	; CHECK-NEXT: [[TMP30:%.]] = load i16, i16 [[GEPA3]], align 1			; CHECK-NEXT: [[TMP30:%.]] = load i16, i16 [[GEPA3]], align 1
	; CHECK-NEXT: [[ADD:%.*]] = add nsw i16 [[TMP29]], [[TMP30]]			; CHECK-NEXT: [[ADD:%.*]] = add nsw i16 [[TMP29]], [[TMP30]]
	; CHECK-NEXT: [[PREVSUM]] = add nsw i16 [[SUM]], [[ADD]]			; CHECK-NEXT: [[PREVSUM]] = add nsw i16 [[SUM]], [[ADD]]
	; CHECK-NEXT: [[CMP:%.*]] = icmp ugt i16 [[IV]], 1			; CHECK-NEXT: [[CMP:%.*]] = icmp ugt i16 [[IV]], 1
	; CHECK-NEXT: br i1 [[CMP]], label [[LOOP]], label [[EXIT]], !llvm.loop [[LOOP2:![0-9]+]]			; CHECK-NEXT: br i1 [[CMP]], label [[LOOP]], label [[EXIT]], !llvm.loop [[LOOP2:![0-9]+]]
	; CHECK: exit:			; CHECK: exit:
	; CHECK-NEXT: [[PREVSUM_LCSSA:%.*]] = phi i16 [ [[PREVSUM]], [[LOOP]] ], [ [[TMP28]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[PREVSUM_LCSSA:%.*]] = phi i16 [ [[PREVSUM]], [[LOOP]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: ret i16 [[PREVSUM_LCSSA]]			; CHECK-NEXT: ret i16 [[PREVSUM_LCSSA]]
	;			;
	entry:			entry:
	br label %loop			br label %loop

	loop:			loop:
	%iv = phi i16 [ 41, %entry ], [ %ivMinus1, %loop ]			%iv = phi i16 [ 41, %entry ], [ %ivMinus1, %loop ]
	%sum = phi i16 [ 0, %entry ], [ %prevSum, %loop ]			%sum = phi i16 [ 0, %entry ], [ %prevSum, %loop ]
	Show All 13 Lines

llvm/test/Transforms/LoopVectorize/pr55167-fold-tail-live-out.ll

	Show All 10 Lines
	; CHECK-NEXT: [[BROADCAST_SPLATINSERT1:%.]] = insertelement <2 x i1> poison, i1 [[C_1:%.]], i32 0			; CHECK-NEXT: [[BROADCAST_SPLATINSERT1:%.]] = insertelement <2 x i1> poison, i1 [[C_1:%.]], i32 0
	; CHECK-NEXT: [[BROADCAST_SPLAT2:%.*]] = shufflevector <2 x i1> [[BROADCAST_SPLATINSERT1]], <2 x i1> poison, <2 x i32> zeroinitializer			; CHECK-NEXT: [[BROADCAST_SPLAT2:%.*]] = shufflevector <2 x i1> [[BROADCAST_SPLATINSERT1]], <2 x i1> poison, <2 x i32> zeroinitializer
	; CHECK-NEXT: [[BROADCAST_SPLATINSERT3:%.]] = insertelement <2 x i1> poison, i1 [[C_2:%.]], i32 0			; CHECK-NEXT: [[BROADCAST_SPLATINSERT3:%.]] = insertelement <2 x i1> poison, i1 [[C_2:%.]], i32 0
	; CHECK-NEXT: [[BROADCAST_SPLAT4:%.*]] = shufflevector <2 x i1> [[BROADCAST_SPLATINSERT3]], <2 x i1> poison, <2 x i32> zeroinitializer			; CHECK-NEXT: [[BROADCAST_SPLAT4:%.*]] = shufflevector <2 x i1> [[BROADCAST_SPLATINSERT3]], <2 x i1> poison, <2 x i32> zeroinitializer
	; CHECK-NEXT: br label [[VECTOR_BODY:%.*]]			; CHECK-NEXT: br label [[VECTOR_BODY:%.*]]
	; CHECK: vector.body:			; CHECK: vector.body:
	; CHECK-NEXT: [[INDEX:%.]] = phi i32 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[VECTOR_BODY]] ]			; CHECK-NEXT: [[INDEX:%.]] = phi i32 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[VECTOR_BODY]] ]
	; CHECK-NEXT: [[VEC_IND:%.]] = phi <2 x i32> [ <i32 6, i32 7>, [[VECTOR_PH]] ], [ [[VEC_IND_NEXT:%.]], [[VECTOR_BODY]] ]			; CHECK-NEXT: [[VEC_IND:%.]] = phi <2 x i32> [ <i32 6, i32 7>, [[VECTOR_PH]] ], [ [[VEC_IND_NEXT:%.]], [[VECTOR_BODY]] ]
	; CHECK-NEXT: [[VEC_PHI:%.]] = phi <2 x i32> [ <i32 35902, i32 0>, [[VECTOR_PH]] ], [ [[PREDPHI7:%.]], [[VECTOR_BODY]] ]			; CHECK-NEXT: [[VEC_PHI:%.]] = phi <2 x i32> [ zeroinitializer, [[VECTOR_PH]] ], [ [[PREDPHI7:%.]], [[VECTOR_BODY]] ]
	; CHECK-NEXT: [[TMP0:%.*]] = add <2 x i32> [[VEC_PHI]], <i32 10, i32 10>			; CHECK-NEXT: [[TMP0:%.*]] = add <2 x i32> [[VEC_PHI]], <i32 10, i32 10>
	; CHECK-NEXT: [[TMP1:%.*]] = add <2 x i32> [[TMP0]], <i32 20, i32 20>			; CHECK-NEXT: [[TMP1:%.*]] = add <2 x i32> [[TMP0]], <i32 20, i32 20>
	; CHECK-NEXT: [[TMP2:%.*]] = xor <2 x i32> [[BROADCAST_SPLAT]], <i32 1, i32 1>			; CHECK-NEXT: [[TMP2:%.*]] = xor <2 x i32> [[BROADCAST_SPLAT]], <i32 1, i32 1>
	; CHECK-NEXT: [[TMP3:%.*]] = add <2 x i32> [[TMP1]], [[TMP2]]			; CHECK-NEXT: [[TMP3:%.*]] = add <2 x i32> [[TMP1]], [[TMP2]]
	; CHECK-NEXT: [[TMP4:%.*]] = xor <2 x i1> [[BROADCAST_SPLAT2]], <i1 true, i1 true>			; CHECK-NEXT: [[TMP4:%.*]] = xor <2 x i1> [[BROADCAST_SPLAT2]], <i1 true, i1 true>
	; CHECK-NEXT: [[TMP5:%.*]] = select <2 x i1> [[TMP4]], <2 x i1> [[BROADCAST_SPLAT4]], <2 x i1> zeroinitializer			; CHECK-NEXT: [[TMP5:%.*]] = select <2 x i1> [[TMP4]], <2 x i1> [[BROADCAST_SPLAT4]], <2 x i1> zeroinitializer
	; CHECK-NEXT: [[TMP6:%.*]] = xor <2 x i1> [[BROADCAST_SPLAT4]], <i1 true, i1 true>			; CHECK-NEXT: [[TMP6:%.*]] = xor <2 x i1> [[BROADCAST_SPLAT4]], <i1 true, i1 true>
	; CHECK-NEXT: [[TMP7:%.*]] = select <2 x i1> [[TMP4]], <2 x i1> [[TMP6]], <2 x i1> zeroinitializer			; CHECK-NEXT: [[TMP7:%.*]] = select <2 x i1> [[TMP4]], <2 x i1> [[TMP6]], <2 x i1> zeroinitializer
	; CHECK-NEXT: [[PREDPHI:%.*]] = select <2 x i1> [[TMP5]], <2 x i32> <i32 9, i32 9>, <2 x i32> [[VEC_IND]]			; CHECK-NEXT: [[PREDPHI:%.*]] = select <2 x i1> [[TMP5]], <2 x i32> <i32 9, i32 9>, <2 x i32> [[VEC_IND]]
	; CHECK-NEXT: [[PREDPHI5:%.*]] = select <2 x i1> [[TMP7]], <2 x i32> <i32 9, i32 9>, <2 x i32> [[PREDPHI]]			; CHECK-NEXT: [[PREDPHI5:%.*]] = select <2 x i1> [[TMP7]], <2 x i32> <i32 9, i32 9>, <2 x i32> [[PREDPHI]]
	; CHECK-NEXT: [[PREDPHI6:%.*]] = select <2 x i1> [[TMP5]], <2 x i32> [[TMP0]], <2 x i32> [[VEC_PHI]]			; CHECK-NEXT: [[PREDPHI6:%.*]] = select <2 x i1> [[TMP5]], <2 x i32> [[TMP0]], <2 x i32> [[VEC_PHI]]
	; CHECK-NEXT: [[PREDPHI7]] = select <2 x i1> [[TMP7]], <2 x i32> [[TMP3]], <2 x i32> [[PREDPHI6]]			; CHECK-NEXT: [[PREDPHI7]] = select <2 x i1> [[TMP7]], <2 x i32> [[TMP3]], <2 x i32> [[PREDPHI6]]
	; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i32 [[INDEX]], 2			; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i32 [[INDEX]], 2
	; CHECK-NEXT: [[VEC_IND_NEXT]] = add <2 x i32> [[VEC_IND]], <i32 2, i32 2>			; CHECK-NEXT: [[VEC_IND_NEXT]] = add <2 x i32> [[VEC_IND]], <i32 2, i32 2>
	; CHECK-NEXT: [[TMP8:%.*]] = icmp eq i32 [[INDEX_NEXT]], 176			; CHECK-NEXT: [[TMP8:%.*]] = icmp eq i32 [[INDEX_NEXT]], 176
	; CHECK-NEXT: br i1 [[TMP8]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP0:![0-9]+]]			; CHECK-NEXT: br i1 [[TMP8]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP0:![0-9]+]]
	; CHECK: middle.block:			; CHECK: middle.block:
	; CHECK-NEXT: [[TMP9:%.*]] = extractelement <2 x i32> [[PREDPHI5]], i32 1			; CHECK-NEXT: [[TMP9:%.*]] = extractelement <2 x i32> [[PREDPHI5]], i32 1
	; CHECK-NEXT: [[TMP10:%.*]] = call i32 @llvm.vector.reduce.add.v2i32(<2 x i32> [[PREDPHI7]])			; CHECK-NEXT: [[TMP10:%.*]] = call i32 @llvm.vector.reduce.add.v2i32(<2 x i32> [[PREDPHI7]])
				; CHECK-NEXT: [[RDX_START:%.*]] = add i32 35902, [[TMP10]]
	; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i32 176, 176			; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i32 176, 176
	; CHECK-NEXT: br i1 [[CMP_N]], label [[EXIT:%.*]], label [[SCALAR_PH]]			; CHECK-NEXT: br i1 [[CMP_N]], label [[EXIT:%.*]], label [[SCALAR_PH]]
	; CHECK: scalar.ph:			; CHECK: scalar.ph:
	; CHECK-NEXT: [[BC_RESUME_VAL:%.]] = phi i32 [ 182, [[MIDDLE_BLOCK]] ], [ 6, [[BB:%.]] ]			; CHECK-NEXT: [[BC_RESUME_VAL:%.]] = phi i32 [ 182, [[MIDDLE_BLOCK]] ], [ 6, [[BB:%.]] ]
	; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 35902, [[BB]] ], [ [[TMP10]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 35902, [[BB]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: br label [[LOOP_HEADER:%.*]]			; CHECK-NEXT: br label [[LOOP_HEADER:%.*]]
	; CHECK: loop.header:			; CHECK: loop.header:
	; CHECK-NEXT: [[IV:%.]] = phi i32 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[IV_NEXT:%.]], [[LOOP_LATCH:%.*]] ]			; CHECK-NEXT: [[IV:%.]] = phi i32 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[IV_NEXT:%.]], [[LOOP_LATCH:%.*]] ]
	; CHECK-NEXT: [[V_2:%.]] = phi i32 [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[P_2:%.]], [[LOOP_LATCH]] ]			; CHECK-NEXT: [[V_2:%.]] = phi i32 [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[P_2:%.]], [[LOOP_LATCH]] ]
	; CHECK-NEXT: br i1 [[C_1]], label [[LOOP_LATCH]], label [[BODY_1:%.*]]			; CHECK-NEXT: br i1 [[C_1]], label [[LOOP_LATCH]], label [[BODY_1:%.*]]
	; CHECK: body.1:			; CHECK: body.1:
	; CHECK-NEXT: [[V_2_ADD:%.*]] = add i32 [[V_2]], 10			; CHECK-NEXT: [[V_2_ADD:%.*]] = add i32 [[V_2]], 10
	; CHECK-NEXT: br i1 [[C_2]], label [[LOOP_LATCH]], label [[BODY_2:%.*]]			; CHECK-NEXT: br i1 [[C_2]], label [[LOOP_LATCH]], label [[BODY_2:%.*]]
	; CHECK: body.2:			; CHECK: body.2:
	; CHECK-NEXT: [[ADD_1:%.*]] = add i32 [[V_2_ADD]], 20			; CHECK-NEXT: [[ADD_1:%.*]] = add i32 [[V_2_ADD]], 20
	; CHECK-NEXT: [[XOR:%.*]] = xor i32 [[A]], 1			; CHECK-NEXT: [[XOR:%.*]] = xor i32 [[A]], 1
	; CHECK-NEXT: [[ADD_2:%.*]] = add i32 [[ADD_1]], [[XOR]]			; CHECK-NEXT: [[ADD_2:%.*]] = add i32 [[ADD_1]], [[XOR]]
	; CHECK-NEXT: br label [[LOOP_LATCH]]			; CHECK-NEXT: br label [[LOOP_LATCH]]
	; CHECK: loop.latch:			; CHECK: loop.latch:
	; CHECK-NEXT: [[P_1:%.*]] = phi i32 [ [[IV]], [[LOOP_HEADER]] ], [ 9, [[BODY_1]] ], [ 9, [[BODY_2]] ]			; CHECK-NEXT: [[P_1:%.*]] = phi i32 [ [[IV]], [[LOOP_HEADER]] ], [ 9, [[BODY_1]] ], [ 9, [[BODY_2]] ]
	; CHECK-NEXT: [[P_2]] = phi i32 [ [[V_2]], [[LOOP_HEADER]] ], [ [[V_2_ADD]], [[BODY_1]] ], [ [[ADD_2]], [[BODY_2]] ]			; CHECK-NEXT: [[P_2]] = phi i32 [ [[V_2]], [[LOOP_HEADER]] ], [ [[V_2_ADD]], [[BODY_1]] ], [ [[ADD_2]], [[BODY_2]] ]
	; CHECK-NEXT: [[IV_NEXT]] = add nuw nsw i32 [[IV]], 1			; CHECK-NEXT: [[IV_NEXT]] = add nuw nsw i32 [[IV]], 1
	; CHECK-NEXT: [[EC:%.*]] = icmp ult i32 [[IV]], 181			; CHECK-NEXT: [[EC:%.*]] = icmp ult i32 [[IV]], 181
	; CHECK-NEXT: br i1 [[EC]], label [[LOOP_HEADER]], label [[EXIT]], !llvm.loop [[LOOP2:![0-9]+]]			; CHECK-NEXT: br i1 [[EC]], label [[LOOP_HEADER]], label [[EXIT]], !llvm.loop [[LOOP2:![0-9]+]]
	; CHECK: exit:			; CHECK: exit:
	; CHECK-NEXT: [[E_1:%.*]] = phi i32 [ [[P_1]], [[LOOP_LATCH]] ], [ [[TMP9]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[E_1:%.*]] = phi i32 [ [[P_1]], [[LOOP_LATCH]] ], [ [[TMP9]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: [[E_2:%.*]] = phi i32 [ [[P_2]], [[LOOP_LATCH]] ], [ [[TMP10]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[E_2:%.*]] = phi i32 [ [[P_2]], [[LOOP_LATCH]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: [[RES:%.*]] = add i32 [[E_1]], [[E_2]]			; CHECK-NEXT: [[RES:%.*]] = add i32 [[E_1]], [[E_2]]
	; CHECK-NEXT: ret i32 [[RES]]			; CHECK-NEXT: ret i32 [[RES]]
	;			;
	bb:			bb:
	br label %loop.header			br label %loop.header

	loop.header:			loop.header:
	%iv = phi i32 [ 6, %bb ], [ %iv.next, %loop.latch ]			%iv = phi i32 [ 6, %bb ], [ %iv.next, %loop.latch ]
	Show All 26 Lines

llvm/test/Transforms/LoopVectorize/reduction-inloop-pred.ll

	Show First 20 Lines • Show All 1,338 Lines • ▼ Show 20 Lines
	}			}

	; Conditional reductions with multi-input phis.			; Conditional reductions with multi-input phis.
	define float @reduction_conditional(float* %A, float* %B, float* %C, float %S) {			define float @reduction_conditional(float* %A, float* %B, float* %C, float %S) {
	; CHECK-LABEL: @reduction_conditional(			; CHECK-LABEL: @reduction_conditional(
	; CHECK-NEXT: entry:			; CHECK-NEXT: entry:
	; CHECK-NEXT: br i1 false, label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]			; CHECK-NEXT: br i1 false, label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]
	; CHECK: vector.ph:			; CHECK: vector.ph:
	; CHECK-NEXT: [[TMP0:%.]] = insertelement <4 x float> <float poison, float 0.000000e+00, float 0.000000e+00, float 0.000000e+00>, float [[S:%.]], i64 0
	; CHECK-NEXT: br label [[VECTOR_BODY:%.*]]			; CHECK-NEXT: br label [[VECTOR_BODY:%.*]]
	; CHECK: vector.body:			; CHECK: vector.body:
	; CHECK-NEXT: [[INDEX:%.]] = phi i64 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[VECTOR_BODY]] ]			; CHECK-NEXT: [[INDEX:%.]] = phi i64 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[VECTOR_BODY]] ]
	; CHECK-NEXT: [[VEC_PHI:%.]] = phi <4 x float> [ [[TMP0]], [[VECTOR_PH]] ], [ [[PREDPHI3:%.]], [[VECTOR_BODY]] ]			; CHECK-NEXT: [[VEC_PHI:%.]] = phi <4 x float> [ zeroinitializer, [[VECTOR_PH]] ], [ [[PREDPHI3:%.]], [[VECTOR_BODY]] ]
	; CHECK-NEXT: [[TMP1:%.]] = getelementptr inbounds float, float [[A:%.*]], i64 [[INDEX]]			; CHECK-NEXT: [[TMP0:%.]] = getelementptr inbounds float, float [[A:%.*]], i64 [[INDEX]]
	; CHECK-NEXT: [[TMP2:%.]] = bitcast float [[TMP1]] to <4 x float>*			; CHECK-NEXT: [[TMP1:%.]] = bitcast float [[TMP0]] to <4 x float>*
	; CHECK-NEXT: [[WIDE_LOAD:%.]] = load <4 x float>, <4 x float> [[TMP2]], align 4			; CHECK-NEXT: [[WIDE_LOAD:%.]] = load <4 x float>, <4 x float> [[TMP1]], align 4
	; CHECK-NEXT: [[TMP3:%.]] = getelementptr inbounds float, float [[B:%.*]], i64 [[INDEX]]			; CHECK-NEXT: [[TMP2:%.]] = getelementptr inbounds float, float [[B:%.*]], i64 [[INDEX]]
	; CHECK-NEXT: [[TMP4:%.]] = bitcast float [[TMP3]] to <4 x float>*			; CHECK-NEXT: [[TMP3:%.]] = bitcast float [[TMP2]] to <4 x float>*
	; CHECK-NEXT: [[WIDE_LOAD1:%.]] = load <4 x float>, <4 x float> [[TMP4]], align 4			; CHECK-NEXT: [[WIDE_LOAD1:%.]] = load <4 x float>, <4 x float> [[TMP3]], align 4
	; CHECK-NEXT: [[TMP5:%.*]] = fcmp ogt <4 x float> [[WIDE_LOAD]], [[WIDE_LOAD1]]			; CHECK-NEXT: [[TMP4:%.*]] = fcmp ogt <4 x float> [[WIDE_LOAD]], [[WIDE_LOAD1]]
	; CHECK-NEXT: [[TMP6:%.*]] = fcmp ule <4 x float> [[WIDE_LOAD1]], <float 1.000000e+00, float 1.000000e+00, float 1.000000e+00, float 1.000000e+00>			; CHECK-NEXT: [[TMP5:%.*]] = fcmp ule <4 x float> [[WIDE_LOAD1]], <float 1.000000e+00, float 1.000000e+00, float 1.000000e+00, float 1.000000e+00>
	; CHECK-NEXT: [[TMP7:%.*]] = fcmp ogt <4 x float> [[WIDE_LOAD]], <float 2.000000e+00, float 2.000000e+00, float 2.000000e+00, float 2.000000e+00>			; CHECK-NEXT: [[TMP6:%.*]] = fcmp ogt <4 x float> [[WIDE_LOAD]], <float 2.000000e+00, float 2.000000e+00, float 2.000000e+00, float 2.000000e+00>
	; CHECK-NEXT: [[TMP8:%.*]] = and <4 x i1> [[TMP5]], [[TMP6]]			; CHECK-NEXT: [[TMP7:%.*]] = and <4 x i1> [[TMP4]], [[TMP5]]
	; CHECK-NEXT: [[TMP9:%.*]] = and <4 x i1> [[TMP8]], [[TMP7]]			; CHECK-NEXT: [[TMP8:%.*]] = and <4 x i1> [[TMP7]], [[TMP6]]
	; CHECK-NEXT: [[TMP10:%.*]] = xor <4 x i1> [[TMP7]], <i1 true, i1 true, i1 true, i1 true>			; CHECK-NEXT: [[TMP9:%.*]] = xor <4 x i1> [[TMP6]], <i1 true, i1 true, i1 true, i1 true>
	; CHECK-NEXT: [[TMP11:%.*]] = and <4 x i1> [[TMP8]], [[TMP10]]			; CHECK-NEXT: [[TMP10:%.*]] = and <4 x i1> [[TMP7]], [[TMP9]]
	; CHECK-NEXT: [[TMP12:%.*]] = xor <4 x i1> [[TMP5]], <i1 true, i1 true, i1 true, i1 true>			; CHECK-NEXT: [[TMP11:%.*]] = xor <4 x i1> [[TMP4]], <i1 true, i1 true, i1 true, i1 true>
	; CHECK-NEXT: [[PREDPHI_V:%.*]] = select <4 x i1> [[TMP9]], <4 x float> [[WIDE_LOAD1]], <4 x float> [[WIDE_LOAD]]			; CHECK-NEXT: [[PREDPHI_V:%.*]] = select <4 x i1> [[TMP8]], <4 x float> [[WIDE_LOAD1]], <4 x float> [[WIDE_LOAD]]
	; CHECK-NEXT: [[TMP13:%.*]] = select <4 x i1> [[TMP12]], <4 x i1> <i1 true, i1 true, i1 true, i1 true>, <4 x i1> [[TMP11]]			; CHECK-NEXT: [[TMP12:%.*]] = select <4 x i1> [[TMP11]], <4 x i1> <i1 true, i1 true, i1 true, i1 true>, <4 x i1> [[TMP10]]
	; CHECK-NEXT: [[PREDPHI2:%.*]] = select <4 x i1> [[TMP13]], <4 x float> <float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00>, <4 x float> [[PREDPHI_V]]			; CHECK-NEXT: [[PREDPHI2:%.*]] = select <4 x i1> [[TMP12]], <4 x float> <float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00>, <4 x float> [[PREDPHI_V]]
	; CHECK-NEXT: [[PREDPHI3]] = fadd fast <4 x float> [[VEC_PHI]], [[PREDPHI2]]			; CHECK-NEXT: [[PREDPHI3]] = fadd fast <4 x float> [[VEC_PHI]], [[PREDPHI2]]
	; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 4			; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 4
	; CHECK-NEXT: [[TMP14:%.*]] = icmp eq i64 [[INDEX_NEXT]], 128			; CHECK-NEXT: [[TMP13:%.*]] = icmp eq i64 [[INDEX_NEXT]], 128
	; CHECK-NEXT: br i1 [[TMP14]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP28:![0-9]+]]			; CHECK-NEXT: br i1 [[TMP13]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP28:![0-9]+]]
	; CHECK: middle.block:			; CHECK: middle.block:
	; CHECK-NEXT: [[TMP15:%.*]] = call fast float @llvm.vector.reduce.fadd.v4f32(float -0.000000e+00, <4 x float> [[PREDPHI3]])			; CHECK-NEXT: [[TMP14:%.*]] = call fast float @llvm.vector.reduce.fadd.v4f32(float -0.000000e+00, <4 x float> [[PREDPHI3]])
				; CHECK-NEXT: [[RDX_START:%.]] = fadd float [[TMP14]], [[S:%.]]
	; CHECK-NEXT: br i1 true, label [[FOR_END:%.*]], label [[SCALAR_PH]]			; CHECK-NEXT: br i1 true, label [[FOR_END:%.*]], label [[SCALAR_PH]]
	; CHECK: scalar.ph:			; CHECK: scalar.ph:
	; CHECK-NEXT: br label [[FOR_BODY:%.*]]			; CHECK-NEXT: br label [[FOR_BODY:%.*]]
	; CHECK: for.body:			; CHECK: for.body:
	; CHECK-NEXT: br i1 poison, label [[IF_THEN:%.]], label [[FOR_INC:%.]]			; CHECK-NEXT: br i1 poison, label [[IF_THEN:%.]], label [[FOR_INC:%.]]
	; CHECK: if.then:			; CHECK: if.then:
	; CHECK-NEXT: br i1 poison, label [[IF_THEN8:%.]], label [[IF_ELSE:%.]]			; CHECK-NEXT: br i1 poison, label [[IF_THEN8:%.]], label [[IF_ELSE:%.]]
	; CHECK: if.then8:			; CHECK: if.then8:
	; CHECK-NEXT: br label [[FOR_INC]]			; CHECK-NEXT: br label [[FOR_INC]]
	; CHECK: if.else:			; CHECK: if.else:
	; CHECK-NEXT: br i1 poison, label [[IF_THEN16:%.*]], label [[FOR_INC]]			; CHECK-NEXT: br i1 poison, label [[IF_THEN16:%.*]], label [[FOR_INC]]
	; CHECK: if.then16:			; CHECK: if.then16:
	; CHECK-NEXT: br label [[FOR_INC]]			; CHECK-NEXT: br label [[FOR_INC]]
	; CHECK: for.inc:			; CHECK: for.inc:
	; CHECK-NEXT: br i1 poison, label [[FOR_BODY]], label [[FOR_END]], !llvm.loop [[LOOP29:![0-9]+]]			; CHECK-NEXT: br i1 poison, label [[FOR_BODY]], label [[FOR_END]], !llvm.loop [[LOOP29:![0-9]+]]
	; CHECK: for.end:			; CHECK: for.end:
	; CHECK-NEXT: [[SUM_1_LCSSA:%.*]] = phi float [ poison, [[FOR_INC]] ], [ [[TMP15]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[SUM_1_LCSSA:%.*]] = phi float [ poison, [[FOR_INC]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: ret float [[SUM_1_LCSSA]]			; CHECK-NEXT: ret float [[SUM_1_LCSSA]]
	;			;
	entry:			entry:
	br label %for.body			br label %for.body

	for.body:			for.body:
	%indvars.iv = phi i64 [ 0, %entry ], [ %indvars.iv.next, %for.inc ]			%indvars.iv = phi i64 [ 0, %entry ], [ %indvars.iv.next, %for.inc ]
	%sum.033 = phi float [ %S, %entry ], [ %sum.1, %for.inc ]			%sum.033 = phi float [ %S, %entry ], [ %sum.1, %for.inc ]
	Show All 36 Lines
	; CHECK-LABEL: @reduction_add_trunc(			; CHECK-LABEL: @reduction_add_trunc(
	; CHECK-NEXT: entry:			; CHECK-NEXT: entry:
	; CHECK-NEXT: br i1 false, label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]			; CHECK-NEXT: br i1 false, label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]
	; CHECK: vector.ph:			; CHECK: vector.ph:
	; CHECK-NEXT: br label [[VECTOR_BODY:%.*]]			; CHECK-NEXT: br label [[VECTOR_BODY:%.*]]
	; CHECK: vector.body:			; CHECK: vector.body:
	; CHECK-NEXT: [[INDEX:%.]] = phi i32 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[PRED_LOAD_CONTINUE6:%.*]] ]			; CHECK-NEXT: [[INDEX:%.]] = phi i32 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[PRED_LOAD_CONTINUE6:%.*]] ]
	; CHECK-NEXT: [[VEC_IND:%.]] = phi <4 x i32> [ <i32 0, i32 1, i32 2, i32 3>, [[VECTOR_PH]] ], [ [[VEC_IND_NEXT:%.]], [[PRED_LOAD_CONTINUE6]] ]			; CHECK-NEXT: [[VEC_IND:%.]] = phi <4 x i32> [ <i32 0, i32 1, i32 2, i32 3>, [[VECTOR_PH]] ], [ [[VEC_IND_NEXT:%.]], [[PRED_LOAD_CONTINUE6]] ]
	; CHECK-NEXT: [[VEC_PHI:%.]] = phi <4 x i32> [ <i32 255, i32 0, i32 0, i32 0>, [[VECTOR_PH]] ], [ [[TMP30:%.]], [[PRED_LOAD_CONTINUE6]] ]			; CHECK-NEXT: [[VEC_PHI:%.]] = phi <4 x i32> [ zeroinitializer, [[VECTOR_PH]] ], [ [[TMP30:%.]], [[PRED_LOAD_CONTINUE6]] ]
	; CHECK-NEXT: [[TMP0:%.*]] = icmp ult <4 x i32> [[VEC_IND]], <i32 257, i32 257, i32 257, i32 257>			; CHECK-NEXT: [[TMP0:%.*]] = icmp ult <4 x i32> [[VEC_IND]], <i32 257, i32 257, i32 257, i32 257>
	; CHECK-NEXT: [[TMP1:%.*]] = and <4 x i32> [[VEC_PHI]], <i32 255, i32 255, i32 255, i32 255>			; CHECK-NEXT: [[TMP1:%.*]] = and <4 x i32> [[VEC_PHI]], <i32 255, i32 255, i32 255, i32 255>
	; CHECK-NEXT: [[TMP2:%.*]] = extractelement <4 x i1> [[TMP0]], i64 0			; CHECK-NEXT: [[TMP2:%.*]] = extractelement <4 x i1> [[TMP0]], i64 0
	; CHECK-NEXT: br i1 [[TMP2]], label [[PRED_LOAD_IF:%.]], label [[PRED_LOAD_CONTINUE:%.]]			; CHECK-NEXT: br i1 [[TMP2]], label [[PRED_LOAD_IF:%.]], label [[PRED_LOAD_CONTINUE:%.]]
	; CHECK: pred.load.if:			; CHECK: pred.load.if:
	; CHECK-NEXT: [[TMP3:%.*]] = sext i32 [[INDEX]] to i64			; CHECK-NEXT: [[TMP3:%.*]] = sext i32 [[INDEX]] to i64
	; CHECK-NEXT: [[TMP4:%.]] = getelementptr inbounds i8, i8 [[A:%.*]], i64 [[TMP3]]			; CHECK-NEXT: [[TMP4:%.]] = getelementptr inbounds i8, i8 [[A:%.*]], i64 [[TMP3]]
	; CHECK-NEXT: [[TMP5:%.]] = load i8, i8 [[TMP4]], align 4			; CHECK-NEXT: [[TMP5:%.]] = load i8, i8 [[TMP4]], align 4
	Show All 39 Lines
	; CHECK-NEXT: [[INDEX_NEXT]] = add i32 [[INDEX]], 4			; CHECK-NEXT: [[INDEX_NEXT]] = add i32 [[INDEX]], 4
	; CHECK-NEXT: [[VEC_IND_NEXT]] = add <4 x i32> [[VEC_IND]], <i32 4, i32 4, i32 4, i32 4>			; CHECK-NEXT: [[VEC_IND_NEXT]] = add <4 x i32> [[VEC_IND]], <i32 4, i32 4, i32 4, i32 4>
	; CHECK-NEXT: [[TMP31:%.*]] = icmp eq i32 [[INDEX_NEXT]], 260			; CHECK-NEXT: [[TMP31:%.*]] = icmp eq i32 [[INDEX_NEXT]], 260
	; CHECK-NEXT: br i1 [[TMP31]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP30:![0-9]+]]			; CHECK-NEXT: br i1 [[TMP31]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP30:![0-9]+]]
	; CHECK: middle.block:			; CHECK: middle.block:
	; CHECK-NEXT: [[TMP32:%.*]] = select <4 x i1> [[TMP0]], <4 x i32> [[TMP30]], <4 x i32> [[VEC_PHI]]			; CHECK-NEXT: [[TMP32:%.*]] = select <4 x i1> [[TMP0]], <4 x i32> [[TMP30]], <4 x i32> [[VEC_PHI]]
	; CHECK-NEXT: [[TMP33:%.*]] = trunc <4 x i32> [[TMP32]] to <4 x i8>			; CHECK-NEXT: [[TMP33:%.*]] = trunc <4 x i32> [[TMP32]] to <4 x i8>
	; CHECK-NEXT: [[TMP34:%.*]] = call i8 @llvm.vector.reduce.add.v4i8(<4 x i8> [[TMP33]])			; CHECK-NEXT: [[TMP34:%.*]] = call i8 @llvm.vector.reduce.add.v4i8(<4 x i8> [[TMP33]])
				; CHECK-NEXT: [[RDX_START:%.*]] = add i8 [[TMP34]], -1
	; CHECK-NEXT: br i1 true, label [[DOT_CRIT_EDGE:%.*]], label [[SCALAR_PH]]			; CHECK-NEXT: br i1 true, label [[DOT_CRIT_EDGE:%.*]], label [[SCALAR_PH]]
	; CHECK: scalar.ph:			; CHECK: scalar.ph:
	; CHECK-NEXT: br label [[DOTLR_PH:%.*]]			; CHECK-NEXT: br label [[DOTLR_PH:%.*]]
	; CHECK: .lr.ph:			; CHECK: .lr.ph:
	; CHECK-NEXT: br i1 poison, label [[DOT_CRIT_EDGE]], label [[DOTLR_PH]], !llvm.loop [[LOOP31:![0-9]+]]			; CHECK-NEXT: br i1 poison, label [[DOT_CRIT_EDGE]], label [[DOTLR_PH]], !llvm.loop [[LOOP31:![0-9]+]]
	; CHECK: ._crit_edge:			; CHECK: ._crit_edge:
	; CHECK-NEXT: [[SUM_0_LCSSA:%.*]] = phi i8 [ poison, [[DOTLR_PH]] ], [ [[TMP34]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[SUM_0_LCSSA:%.*]] = phi i8 [ poison, [[DOTLR_PH]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: ret i8 [[SUM_0_LCSSA]]			; CHECK-NEXT: ret i8 [[SUM_0_LCSSA]]
	;			;
	entry:			entry:
	br label %.lr.ph			br label %.lr.ph

	.lr.ph: ; preds = %entry, %.lr.ph			.lr.ph: ; preds = %entry, %.lr.ph
	%indvars.iv = phi i32 [ %indvars.iv.next, %.lr.ph ], [ 0, %entry ]			%indvars.iv = phi i32 [ %indvars.iv.next, %.lr.ph ], [ 0, %entry ]
	%sum.02p = phi i32 [ %l9, %.lr.ph ], [ 255, %entry ]			%sum.02p = phi i32 [ %l9, %.lr.ph ], [ 255, %entry ]
	Show All 17 Lines
	; CHECK-LABEL: @reduction_and_trunc(			; CHECK-LABEL: @reduction_and_trunc(
	; CHECK-NEXT: entry:			; CHECK-NEXT: entry:
	; CHECK-NEXT: br i1 false, label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]			; CHECK-NEXT: br i1 false, label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]
	; CHECK: vector.ph:			; CHECK: vector.ph:
	; CHECK-NEXT: br label [[VECTOR_BODY:%.*]]			; CHECK-NEXT: br label [[VECTOR_BODY:%.*]]
	; CHECK: vector.body:			; CHECK: vector.body:
	; CHECK-NEXT: [[INDEX:%.]] = phi i32 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[PRED_LOAD_CONTINUE6:%.*]] ]			; CHECK-NEXT: [[INDEX:%.]] = phi i32 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[PRED_LOAD_CONTINUE6:%.*]] ]
	; CHECK-NEXT: [[VEC_IND:%.]] = phi <4 x i32> [ <i32 0, i32 1, i32 2, i32 3>, [[VECTOR_PH]] ], [ [[VEC_IND_NEXT:%.]], [[PRED_LOAD_CONTINUE6]] ]			; CHECK-NEXT: [[VEC_IND:%.]] = phi <4 x i32> [ <i32 0, i32 1, i32 2, i32 3>, [[VECTOR_PH]] ], [ [[VEC_IND_NEXT:%.]], [[PRED_LOAD_CONTINUE6]] ]
	; CHECK-NEXT: [[VEC_PHI:%.]] = phi <4 x i32> [ <i32 255, i32 -1, i32 -1, i32 -1>, [[VECTOR_PH]] ], [ [[TMP29:%.]], [[PRED_LOAD_CONTINUE6]] ]			; CHECK-NEXT: [[VEC_PHI:%.]] = phi <4 x i32> [ <i32 -1, i32 -1, i32 -1, i32 -1>, [[VECTOR_PH]] ], [ [[TMP29:%.]], [[PRED_LOAD_CONTINUE6]] ]
	; CHECK-NEXT: [[TMP0:%.*]] = icmp ult <4 x i32> [[VEC_IND]], <i32 257, i32 257, i32 257, i32 257>			; CHECK-NEXT: [[TMP0:%.*]] = icmp ult <4 x i32> [[VEC_IND]], <i32 257, i32 257, i32 257, i32 257>
	; CHECK-NEXT: [[TMP1:%.*]] = extractelement <4 x i1> [[TMP0]], i64 0			; CHECK-NEXT: [[TMP1:%.*]] = extractelement <4 x i1> [[TMP0]], i64 0
	; CHECK-NEXT: br i1 [[TMP1]], label [[PRED_LOAD_IF:%.]], label [[PRED_LOAD_CONTINUE:%.]]			; CHECK-NEXT: br i1 [[TMP1]], label [[PRED_LOAD_IF:%.]], label [[PRED_LOAD_CONTINUE:%.]]
	; CHECK: pred.load.if:			; CHECK: pred.load.if:
	; CHECK-NEXT: [[TMP2:%.*]] = sext i32 [[INDEX]] to i64			; CHECK-NEXT: [[TMP2:%.*]] = sext i32 [[INDEX]] to i64
	; CHECK-NEXT: [[TMP3:%.]] = getelementptr inbounds i8, i8 [[A:%.*]], i64 [[TMP2]]			; CHECK-NEXT: [[TMP3:%.]] = getelementptr inbounds i8, i8 [[A:%.*]], i64 [[TMP2]]
	; CHECK-NEXT: [[TMP4:%.]] = load i8, i8 [[TMP3]], align 4			; CHECK-NEXT: [[TMP4:%.]] = load i8, i8 [[TMP3]], align 4
	; CHECK-NEXT: [[TMP5:%.*]] = insertelement <4 x i8> poison, i8 [[TMP4]], i64 0			; CHECK-NEXT: [[TMP5:%.*]] = insertelement <4 x i8> poison, i8 [[TMP4]], i64 0
	▲ Show 20 Lines • Show All 75 Lines • Show Last 20 Lines

llvm/test/Transforms/LoopVectorize/reduction-inloop.ll

	Show First 20 Lines • Show All 790 Lines • ▼ Show 20 Lines
	}			}

	; Conditional reductions with multi-input phis.			; Conditional reductions with multi-input phis.
	define float @reduction_conditional(float* %A, float* %B, float* %C, float %S) {			define float @reduction_conditional(float* %A, float* %B, float* %C, float %S) {
	; CHECK-LABEL: @reduction_conditional(			; CHECK-LABEL: @reduction_conditional(
	; CHECK-NEXT: entry:			; CHECK-NEXT: entry:
	; CHECK-NEXT: br i1 false, label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]			; CHECK-NEXT: br i1 false, label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]
	; CHECK: vector.ph:			; CHECK: vector.ph:
	; CHECK-NEXT: [[TMP0:%.]] = insertelement <4 x float> <float poison, float 0.000000e+00, float 0.000000e+00, float 0.000000e+00>, float [[S:%.]], i64 0
	; CHECK-NEXT: br label [[VECTOR_BODY:%.*]]			; CHECK-NEXT: br label [[VECTOR_BODY:%.*]]
	; CHECK: vector.body:			; CHECK: vector.body:
	; CHECK-NEXT: [[INDEX:%.]] = phi i64 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[VECTOR_BODY]] ]			; CHECK-NEXT: [[INDEX:%.]] = phi i64 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[VECTOR_BODY]] ]
	; CHECK-NEXT: [[VEC_PHI:%.]] = phi <4 x float> [ [[TMP0]], [[VECTOR_PH]] ], [ [[PREDPHI3:%.]], [[VECTOR_BODY]] ]			; CHECK-NEXT: [[VEC_PHI:%.]] = phi <4 x float> [ zeroinitializer, [[VECTOR_PH]] ], [ [[PREDPHI3:%.]], [[VECTOR_BODY]] ]
	; CHECK-NEXT: [[TMP1:%.]] = getelementptr inbounds float, float [[A:%.*]], i64 [[INDEX]]			; CHECK-NEXT: [[TMP0:%.]] = getelementptr inbounds float, float [[A:%.*]], i64 [[INDEX]]
	; CHECK-NEXT: [[TMP2:%.]] = bitcast float [[TMP1]] to <4 x float>*			; CHECK-NEXT: [[TMP1:%.]] = bitcast float [[TMP0]] to <4 x float>*
	; CHECK-NEXT: [[WIDE_LOAD:%.]] = load <4 x float>, <4 x float> [[TMP2]], align 4			; CHECK-NEXT: [[WIDE_LOAD:%.]] = load <4 x float>, <4 x float> [[TMP1]], align 4
	; CHECK-NEXT: [[TMP3:%.]] = getelementptr inbounds float, float [[B:%.*]], i64 [[INDEX]]			; CHECK-NEXT: [[TMP2:%.]] = getelementptr inbounds float, float [[B:%.*]], i64 [[INDEX]]
	; CHECK-NEXT: [[TMP4:%.]] = bitcast float [[TMP3]] to <4 x float>*			; CHECK-NEXT: [[TMP3:%.]] = bitcast float [[TMP2]] to <4 x float>*
	; CHECK-NEXT: [[WIDE_LOAD1:%.]] = load <4 x float>, <4 x float> [[TMP4]], align 4			; CHECK-NEXT: [[WIDE_LOAD1:%.]] = load <4 x float>, <4 x float> [[TMP3]], align 4
	; CHECK-NEXT: [[TMP5:%.*]] = fcmp ogt <4 x float> [[WIDE_LOAD]], [[WIDE_LOAD1]]			; CHECK-NEXT: [[TMP4:%.*]] = fcmp ogt <4 x float> [[WIDE_LOAD]], [[WIDE_LOAD1]]
	; CHECK-NEXT: [[TMP6:%.*]] = fcmp ule <4 x float> [[WIDE_LOAD1]], <float 1.000000e+00, float 1.000000e+00, float 1.000000e+00, float 1.000000e+00>			; CHECK-NEXT: [[TMP5:%.*]] = fcmp ule <4 x float> [[WIDE_LOAD1]], <float 1.000000e+00, float 1.000000e+00, float 1.000000e+00, float 1.000000e+00>
	; CHECK-NEXT: [[TMP7:%.*]] = fcmp ogt <4 x float> [[WIDE_LOAD]], <float 2.000000e+00, float 2.000000e+00, float 2.000000e+00, float 2.000000e+00>			; CHECK-NEXT: [[TMP6:%.*]] = fcmp ogt <4 x float> [[WIDE_LOAD]], <float 2.000000e+00, float 2.000000e+00, float 2.000000e+00, float 2.000000e+00>
	; CHECK-NEXT: [[TMP8:%.*]] = and <4 x i1> [[TMP5]], [[TMP6]]			; CHECK-NEXT: [[TMP7:%.*]] = and <4 x i1> [[TMP4]], [[TMP5]]
	; CHECK-NEXT: [[TMP9:%.*]] = and <4 x i1> [[TMP8]], [[TMP7]]			; CHECK-NEXT: [[TMP8:%.*]] = and <4 x i1> [[TMP7]], [[TMP6]]
	; CHECK-NEXT: [[TMP10:%.*]] = xor <4 x i1> [[TMP7]], <i1 true, i1 true, i1 true, i1 true>			; CHECK-NEXT: [[TMP9:%.*]] = xor <4 x i1> [[TMP6]], <i1 true, i1 true, i1 true, i1 true>
	; CHECK-NEXT: [[TMP11:%.*]] = and <4 x i1> [[TMP8]], [[TMP10]]			; CHECK-NEXT: [[TMP10:%.*]] = and <4 x i1> [[TMP7]], [[TMP9]]
	; CHECK-NEXT: [[TMP12:%.*]] = xor <4 x i1> [[TMP5]], <i1 true, i1 true, i1 true, i1 true>			; CHECK-NEXT: [[TMP11:%.*]] = xor <4 x i1> [[TMP4]], <i1 true, i1 true, i1 true, i1 true>
	; CHECK-NEXT: [[PREDPHI_V:%.*]] = select <4 x i1> [[TMP9]], <4 x float> [[WIDE_LOAD1]], <4 x float> [[WIDE_LOAD]]			; CHECK-NEXT: [[PREDPHI_V:%.*]] = select <4 x i1> [[TMP8]], <4 x float> [[WIDE_LOAD1]], <4 x float> [[WIDE_LOAD]]
	; CHECK-NEXT: [[TMP13:%.*]] = select <4 x i1> [[TMP12]], <4 x i1> <i1 true, i1 true, i1 true, i1 true>, <4 x i1> [[TMP11]]			; CHECK-NEXT: [[TMP12:%.*]] = select <4 x i1> [[TMP11]], <4 x i1> <i1 true, i1 true, i1 true, i1 true>, <4 x i1> [[TMP10]]
	; CHECK-NEXT: [[PREDPHI2:%.*]] = select <4 x i1> [[TMP13]], <4 x float> <float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00>, <4 x float> [[PREDPHI_V]]			; CHECK-NEXT: [[PREDPHI2:%.*]] = select <4 x i1> [[TMP12]], <4 x float> <float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00>, <4 x float> [[PREDPHI_V]]
	; CHECK-NEXT: [[PREDPHI3]] = fadd fast <4 x float> [[VEC_PHI]], [[PREDPHI2]]			; CHECK-NEXT: [[PREDPHI3]] = fadd fast <4 x float> [[VEC_PHI]], [[PREDPHI2]]
	; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 4			; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 4
	; CHECK-NEXT: [[TMP14:%.*]] = icmp eq i64 [[INDEX_NEXT]], 128			; CHECK-NEXT: [[TMP13:%.*]] = icmp eq i64 [[INDEX_NEXT]], 128
	; CHECK-NEXT: br i1 [[TMP14]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP32:![0-9]+]]			; CHECK-NEXT: br i1 [[TMP13]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP32:![0-9]+]]
	; CHECK: middle.block:			; CHECK: middle.block:
	; CHECK-NEXT: [[TMP15:%.*]] = call fast float @llvm.vector.reduce.fadd.v4f32(float -0.000000e+00, <4 x float> [[PREDPHI3]])			; CHECK-NEXT: [[TMP14:%.*]] = call fast float @llvm.vector.reduce.fadd.v4f32(float -0.000000e+00, <4 x float> [[PREDPHI3]])
				; CHECK-NEXT: [[RDX_START:%.]] = fadd float [[TMP14]], [[S:%.]]
	; CHECK-NEXT: br i1 true, label [[FOR_END:%.*]], label [[SCALAR_PH]]			; CHECK-NEXT: br i1 true, label [[FOR_END:%.*]], label [[SCALAR_PH]]
	; CHECK: scalar.ph:			; CHECK: scalar.ph:
	; CHECK-NEXT: br label [[FOR_BODY:%.*]]			; CHECK-NEXT: br label [[FOR_BODY:%.*]]
	; CHECK: for.body:			; CHECK: for.body:
	; CHECK-NEXT: br i1 poison, label [[IF_THEN:%.]], label [[FOR_INC:%.]]			; CHECK-NEXT: br i1 poison, label [[IF_THEN:%.]], label [[FOR_INC:%.]]
	; CHECK: if.then:			; CHECK: if.then:
	; CHECK-NEXT: br i1 poison, label [[IF_THEN8:%.]], label [[IF_ELSE:%.]]			; CHECK-NEXT: br i1 poison, label [[IF_THEN8:%.]], label [[IF_ELSE:%.]]
	; CHECK: if.then8:			; CHECK: if.then8:
	; CHECK-NEXT: br label [[FOR_INC]]			; CHECK-NEXT: br label [[FOR_INC]]
	; CHECK: if.else:			; CHECK: if.else:
	; CHECK-NEXT: br i1 poison, label [[IF_THEN16:%.*]], label [[FOR_INC]]			; CHECK-NEXT: br i1 poison, label [[IF_THEN16:%.*]], label [[FOR_INC]]
	; CHECK: if.then16:			; CHECK: if.then16:
	; CHECK-NEXT: br label [[FOR_INC]]			; CHECK-NEXT: br label [[FOR_INC]]
	; CHECK: for.inc:			; CHECK: for.inc:
	; CHECK-NEXT: br i1 poison, label [[FOR_BODY]], label [[FOR_END]], !llvm.loop [[LOOP33:![0-9]+]]			; CHECK-NEXT: br i1 poison, label [[FOR_BODY]], label [[FOR_END]], !llvm.loop [[LOOP33:![0-9]+]]
	; CHECK: for.end:			; CHECK: for.end:
	; CHECK-NEXT: [[SUM_1_LCSSA:%.*]] = phi float [ poison, [[FOR_INC]] ], [ [[TMP15]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[SUM_1_LCSSA:%.*]] = phi float [ poison, [[FOR_INC]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: ret float [[SUM_1_LCSSA]]			; CHECK-NEXT: ret float [[SUM_1_LCSSA]]
	;			;
	entry:			entry:
	br label %for.body			br label %for.body

	for.body:			for.body:
	%indvars.iv = phi i64 [ 0, %entry ], [ %indvars.iv.next, %for.inc ]			%indvars.iv = phi i64 [ 0, %entry ], [ %indvars.iv.next, %for.inc ]
	%sum.033 = phi float [ %S, %entry ], [ %sum.1, %for.inc ]			%sum.033 = phi float [ %S, %entry ], [ %sum.1, %for.inc ]
	▲ Show 20 Lines • Show All 141 Lines • ▼ Show 20 Lines
	define i8 @reduction_add_trunc(i8* noalias nocapture %A) {			define i8 @reduction_add_trunc(i8* noalias nocapture %A) {
	; CHECK-LABEL: @reduction_add_trunc(			; CHECK-LABEL: @reduction_add_trunc(
	; CHECK-NEXT: entry:			; CHECK-NEXT: entry:
	; CHECK-NEXT: br i1 false, label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]			; CHECK-NEXT: br i1 false, label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]
	; CHECK: vector.ph:			; CHECK: vector.ph:
	; CHECK-NEXT: br label [[VECTOR_BODY:%.*]]			; CHECK-NEXT: br label [[VECTOR_BODY:%.*]]
	; CHECK: vector.body:			; CHECK: vector.body:
	; CHECK-NEXT: [[INDEX:%.]] = phi i32 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[VECTOR_BODY]] ]			; CHECK-NEXT: [[INDEX:%.]] = phi i32 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[VECTOR_BODY]] ]
	; CHECK-NEXT: [[VEC_PHI:%.]] = phi <4 x i8> [ <i8 -1, i8 0, i8 0, i8 0>, [[VECTOR_PH]] ], [ [[TMP3:%.]], [[VECTOR_BODY]] ]			; CHECK-NEXT: [[VEC_PHI:%.]] = phi <4 x i8> [ zeroinitializer, [[VECTOR_PH]] ], [ [[TMP3:%.]], [[VECTOR_BODY]] ]
	; CHECK-NEXT: [[TMP0:%.*]] = sext i32 [[INDEX]] to i64			; CHECK-NEXT: [[TMP0:%.*]] = sext i32 [[INDEX]] to i64
	; CHECK-NEXT: [[TMP1:%.]] = getelementptr inbounds i8, i8 [[A:%.*]], i64 [[TMP0]]			; CHECK-NEXT: [[TMP1:%.]] = getelementptr inbounds i8, i8 [[A:%.*]], i64 [[TMP0]]
	; CHECK-NEXT: [[TMP2:%.]] = bitcast i8 [[TMP1]] to <4 x i8>*			; CHECK-NEXT: [[TMP2:%.]] = bitcast i8 [[TMP1]] to <4 x i8>*
	; CHECK-NEXT: [[WIDE_LOAD:%.]] = load <4 x i8>, <4 x i8> [[TMP2]], align 4			; CHECK-NEXT: [[WIDE_LOAD:%.]] = load <4 x i8>, <4 x i8> [[TMP2]], align 4
	; CHECK-NEXT: [[TMP3]] = add <4 x i8> [[VEC_PHI]], [[WIDE_LOAD]]			; CHECK-NEXT: [[TMP3]] = add <4 x i8> [[VEC_PHI]], [[WIDE_LOAD]]
	; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i32 [[INDEX]], 4			; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i32 [[INDEX]], 4
	; CHECK-NEXT: [[TMP4:%.*]] = icmp eq i32 [[INDEX_NEXT]], 256			; CHECK-NEXT: [[TMP4:%.*]] = icmp eq i32 [[INDEX_NEXT]], 256
	; CHECK-NEXT: br i1 [[TMP4]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP36:![0-9]+]]			; CHECK-NEXT: br i1 [[TMP4]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP36:![0-9]+]]
	; CHECK: middle.block:			; CHECK: middle.block:
	; CHECK-NEXT: [[TMP5:%.*]] = call i8 @llvm.vector.reduce.add.v4i8(<4 x i8> [[TMP3]])			; CHECK-NEXT: [[TMP5:%.*]] = call i8 @llvm.vector.reduce.add.v4i8(<4 x i8> [[TMP3]])
				; CHECK-NEXT: [[RDX_START:%.*]] = add i8 [[TMP5]], -1
	; CHECK-NEXT: br i1 true, label [[DOT_CRIT_EDGE:%.*]], label [[SCALAR_PH]]			; CHECK-NEXT: br i1 true, label [[DOT_CRIT_EDGE:%.*]], label [[SCALAR_PH]]
	; CHECK: scalar.ph:			; CHECK: scalar.ph:
	; CHECK-NEXT: br label [[DOTLR_PH:%.*]]			; CHECK-NEXT: br label [[DOTLR_PH:%.*]]
	; CHECK: .lr.ph:			; CHECK: .lr.ph:
	; CHECK-NEXT: br i1 poison, label [[DOT_CRIT_EDGE]], label [[DOTLR_PH]], !llvm.loop [[LOOP37:![0-9]+]]			; CHECK-NEXT: br i1 poison, label [[DOT_CRIT_EDGE]], label [[DOTLR_PH]], !llvm.loop [[LOOP37:![0-9]+]]
	; CHECK: ._crit_edge:			; CHECK: ._crit_edge:
	; CHECK-NEXT: [[SUM_0_LCSSA:%.*]] = phi i8 [ poison, [[DOTLR_PH]] ], [ [[TMP5]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[SUM_0_LCSSA:%.*]] = phi i8 [ poison, [[DOTLR_PH]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: ret i8 [[SUM_0_LCSSA]]			; CHECK-NEXT: ret i8 [[SUM_0_LCSSA]]
	;			;
	entry:			entry:
	br label %.lr.ph			br label %.lr.ph

	.lr.ph: ; preds = %entry, %.lr.ph			.lr.ph: ; preds = %entry, %.lr.ph
	%indvars.iv = phi i32 [ %indvars.iv.next, %.lr.ph ], [ 0, %entry ]			%indvars.iv = phi i32 [ %indvars.iv.next, %.lr.ph ], [ 0, %entry ]
	%sum.02p = phi i32 [ %l9, %.lr.ph ], [ 255, %entry ]			%sum.02p = phi i32 [ %l9, %.lr.ph ], [ 255, %entry ]
	▲ Show 20 Lines • Show All 136 Lines • Show Last 20 Lines

llvm/test/Transforms/LoopVectorize/reduction-predselect.ll

	Show First 20 Lines • Show All 684 Lines • ▼ Show 20 Lines
	; CHECK-NEXT: [[TMP41:%.*]] = fadd fast <4 x float> [[TMP40]], [[TMP39]]			; CHECK-NEXT: [[TMP41:%.*]] = fadd fast <4 x float> [[TMP40]], [[TMP39]]
	; CHECK-NEXT: [[TMP42]] = select fast <4 x i1> [[TMP0]], <4 x float> [[TMP41]], <4 x float> [[VEC_PHI]]			; CHECK-NEXT: [[TMP42]] = select fast <4 x i1> [[TMP0]], <4 x float> [[TMP41]], <4 x float> [[VEC_PHI]]
	; CHECK-NEXT: [[INDEX_NEXT]] = add i32 [[INDEX]], 4			; CHECK-NEXT: [[INDEX_NEXT]] = add i32 [[INDEX]], 4
	; CHECK-NEXT: [[VEC_IND_NEXT]] = add <4 x i32> [[VEC_IND]], <i32 4, i32 4, i32 4, i32 4>			; CHECK-NEXT: [[VEC_IND_NEXT]] = add <4 x i32> [[VEC_IND]], <i32 4, i32 4, i32 4, i32 4>
	; CHECK-NEXT: [[TMP43:%.*]] = icmp eq i32 [[INDEX_NEXT]], 260			; CHECK-NEXT: [[TMP43:%.*]] = icmp eq i32 [[INDEX_NEXT]], 260
	; CHECK-NEXT: br i1 [[TMP43]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP14:![0-9]+]]			; CHECK-NEXT: br i1 [[TMP43]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP14:![0-9]+]]
	; CHECK: middle.block:			; CHECK: middle.block:
	; CHECK-NEXT: [[TMP44:%.*]] = call fast float @llvm.vector.reduce.fadd.v4f32(float -0.000000e+00, <4 x float> [[TMP42]])			; CHECK-NEXT: [[TMP44:%.*]] = call fast float @llvm.vector.reduce.fadd.v4f32(float -0.000000e+00, <4 x float> [[TMP42]])
				; CHECK-NEXT: [[RDX_START:%.*]] = fadd float [[TMP44]], 0.000000e+00
	; CHECK-NEXT: br i1 true, label [[FOR_END:%.*]], label [[SCALAR_PH]]			; CHECK-NEXT: br i1 true, label [[FOR_END:%.*]], label [[SCALAR_PH]]
	; CHECK: scalar.ph:			; CHECK: scalar.ph:
	; CHECK-NEXT: br label [[FOR_BODY:%.*]]			; CHECK-NEXT: br label [[FOR_BODY:%.*]]
	; CHECK: for.body:			; CHECK: for.body:
	; CHECK-NEXT: br i1 poison, label [[FOR_END]], label [[FOR_BODY]], !llvm.loop [[LOOP15:![0-9]+]]			; CHECK-NEXT: br i1 poison, label [[FOR_END]], label [[FOR_BODY]], !llvm.loop [[LOOP15:![0-9]+]]
	; CHECK: for.end:			; CHECK: for.end:
	; CHECK-NEXT: [[RESULT_0_LCSSA:%.*]] = phi float [ poison, [[FOR_BODY]] ], [ [[TMP44]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[RESULT_0_LCSSA:%.*]] = phi float [ poison, [[FOR_BODY]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: ret float [[RESULT_0_LCSSA]]			; CHECK-NEXT: ret float [[RESULT_0_LCSSA]]
	;			;
	entry:			entry:
	br label %for.body			br label %for.body

	for.body: ; preds = %entry, %for.body			for.body: ; preds = %entry, %for.body
	%indvars.iv = phi i32 [ %indvars.iv.next, %for.body ], [ 0, %entry ]			%indvars.iv = phi i32 [ %indvars.iv.next, %for.body ], [ 0, %entry ]
	%result.08 = phi float [ %fadd, %for.body ], [ 0.0, %entry ]			%result.08 = phi float [ %fadd, %for.body ], [ 0.0, %entry ]
	Show All 16 Lines
	; CHECK-LABEL: @reduction_fmul(			; CHECK-LABEL: @reduction_fmul(
	; CHECK-NEXT: entry:			; CHECK-NEXT: entry:
	; CHECK-NEXT: br i1 false, label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]			; CHECK-NEXT: br i1 false, label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]
	; CHECK: vector.ph:			; CHECK: vector.ph:
	; CHECK-NEXT: br label [[VECTOR_BODY:%.*]]			; CHECK-NEXT: br label [[VECTOR_BODY:%.*]]
	; CHECK: vector.body:			; CHECK: vector.body:
	; CHECK-NEXT: [[INDEX:%.]] = phi i32 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[PRED_LOAD_CONTINUE6:%.*]] ]			; CHECK-NEXT: [[INDEX:%.]] = phi i32 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[PRED_LOAD_CONTINUE6:%.*]] ]
	; CHECK-NEXT: [[VEC_IND:%.]] = phi <4 x i32> [ <i32 0, i32 1, i32 2, i32 3>, [[VECTOR_PH]] ], [ [[VEC_IND_NEXT:%.]], [[PRED_LOAD_CONTINUE6]] ]			; CHECK-NEXT: [[VEC_IND:%.]] = phi <4 x i32> [ <i32 0, i32 1, i32 2, i32 3>, [[VECTOR_PH]] ], [ [[VEC_IND_NEXT:%.]], [[PRED_LOAD_CONTINUE6]] ]
	; CHECK-NEXT: [[VEC_PHI:%.]] = phi <4 x float> [ <float 0.000000e+00, float 1.000000e+00, float 1.000000e+00, float 1.000000e+00>, [[VECTOR_PH]] ], [ [[TMP42:%.]], [[PRED_LOAD_CONTINUE6]] ]			; CHECK-NEXT: [[VEC_PHI:%.]] = phi <4 x float> [ <float 1.000000e+00, float 1.000000e+00, float 1.000000e+00, float 1.000000e+00>, [[VECTOR_PH]] ], [ [[TMP42:%.]], [[PRED_LOAD_CONTINUE6]] ]
	; CHECK-NEXT: [[TMP0:%.*]] = icmp ult <4 x i32> [[VEC_IND]], <i32 257, i32 257, i32 257, i32 257>			; CHECK-NEXT: [[TMP0:%.*]] = icmp ult <4 x i32> [[VEC_IND]], <i32 257, i32 257, i32 257, i32 257>
	; CHECK-NEXT: [[TMP1:%.*]] = extractelement <4 x i1> [[TMP0]], i64 0			; CHECK-NEXT: [[TMP1:%.*]] = extractelement <4 x i1> [[TMP0]], i64 0
	; CHECK-NEXT: br i1 [[TMP1]], label [[PRED_LOAD_IF:%.]], label [[PRED_LOAD_CONTINUE:%.]]			; CHECK-NEXT: br i1 [[TMP1]], label [[PRED_LOAD_IF:%.]], label [[PRED_LOAD_CONTINUE:%.]]
	; CHECK: pred.load.if:			; CHECK: pred.load.if:
	; CHECK-NEXT: [[TMP2:%.]] = getelementptr inbounds float, float [[A:%.*]], i32 [[INDEX]]			; CHECK-NEXT: [[TMP2:%.]] = getelementptr inbounds float, float [[A:%.*]], i32 [[INDEX]]
	; CHECK-NEXT: [[TMP3:%.]] = load float, float [[TMP2]], align 4			; CHECK-NEXT: [[TMP3:%.]] = load float, float [[TMP2]], align 4
	; CHECK-NEXT: [[TMP4:%.*]] = insertelement <4 x float> poison, float [[TMP3]], i64 0			; CHECK-NEXT: [[TMP4:%.*]] = insertelement <4 x float> poison, float [[TMP3]], i64 0
	; CHECK-NEXT: [[TMP5:%.]] = getelementptr inbounds float, float [[B:%.*]], i32 [[INDEX]]			; CHECK-NEXT: [[TMP5:%.]] = getelementptr inbounds float, float [[B:%.*]], i32 [[INDEX]]
	▲ Show 20 Lines • Show All 49 Lines • ▼ Show 20 Lines
	; CHECK-NEXT: [[TMP41:%.*]] = fmul fast <4 x float> [[TMP40]], [[TMP39]]			; CHECK-NEXT: [[TMP41:%.*]] = fmul fast <4 x float> [[TMP40]], [[TMP39]]
	; CHECK-NEXT: [[TMP42]] = select fast <4 x i1> [[TMP0]], <4 x float> [[TMP41]], <4 x float> [[VEC_PHI]]			; CHECK-NEXT: [[TMP42]] = select fast <4 x i1> [[TMP0]], <4 x float> [[TMP41]], <4 x float> [[VEC_PHI]]
	; CHECK-NEXT: [[INDEX_NEXT]] = add i32 [[INDEX]], 4			; CHECK-NEXT: [[INDEX_NEXT]] = add i32 [[INDEX]], 4
	; CHECK-NEXT: [[VEC_IND_NEXT]] = add <4 x i32> [[VEC_IND]], <i32 4, i32 4, i32 4, i32 4>			; CHECK-NEXT: [[VEC_IND_NEXT]] = add <4 x i32> [[VEC_IND]], <i32 4, i32 4, i32 4, i32 4>
	; CHECK-NEXT: [[TMP43:%.*]] = icmp eq i32 [[INDEX_NEXT]], 260			; CHECK-NEXT: [[TMP43:%.*]] = icmp eq i32 [[INDEX_NEXT]], 260
	; CHECK-NEXT: br i1 [[TMP43]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP16:![0-9]+]]			; CHECK-NEXT: br i1 [[TMP43]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP16:![0-9]+]]
	; CHECK: middle.block:			; CHECK: middle.block:
	; CHECK-NEXT: [[TMP44:%.*]] = call fast float @llvm.vector.reduce.fmul.v4f32(float 1.000000e+00, <4 x float> [[TMP42]])			; CHECK-NEXT: [[TMP44:%.*]] = call fast float @llvm.vector.reduce.fmul.v4f32(float 1.000000e+00, <4 x float> [[TMP42]])
				; CHECK-NEXT: [[RDX_START:%.*]] = fmul float [[TMP44]], 0.000000e+00
	; CHECK-NEXT: br i1 true, label [[FOR_END:%.*]], label [[SCALAR_PH]]			; CHECK-NEXT: br i1 true, label [[FOR_END:%.*]], label [[SCALAR_PH]]
	; CHECK: scalar.ph:			; CHECK: scalar.ph:
	; CHECK-NEXT: br label [[FOR_BODY:%.*]]			; CHECK-NEXT: br label [[FOR_BODY:%.*]]
	; CHECK: for.body:			; CHECK: for.body:
	; CHECK-NEXT: br i1 poison, label [[FOR_END]], label [[FOR_BODY]], !llvm.loop [[LOOP17:![0-9]+]]			; CHECK-NEXT: br i1 poison, label [[FOR_END]], label [[FOR_BODY]], !llvm.loop [[LOOP17:![0-9]+]]
	; CHECK: for.end:			; CHECK: for.end:
	; CHECK-NEXT: [[RESULT_0_LCSSA:%.*]] = phi float [ poison, [[FOR_BODY]] ], [ [[TMP44]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[RESULT_0_LCSSA:%.*]] = phi float [ poison, [[FOR_BODY]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: ret float [[RESULT_0_LCSSA]]			; CHECK-NEXT: ret float [[RESULT_0_LCSSA]]
	;			;
	entry:			entry:
	br label %for.body			br label %for.body

	for.body: ; preds = %entry, %for.body			for.body: ; preds = %entry, %for.body
	%indvars.iv = phi i32 [ %indvars.iv.next, %for.body ], [ 0, %entry ]			%indvars.iv = phi i32 [ %indvars.iv.next, %for.body ], [ 0, %entry ]
	%result.08 = phi float [ %fmul, %for.body ], [ 0.0, %entry ]			%result.08 = phi float [ %fmul, %for.body ], [ 0.0, %entry ]
	▲ Show 20 Lines • Show All 186 Lines • Show Last 20 Lines

llvm/test/Transforms/LoopVectorize/reduction-small-size.ll

	Show All 25 Lines
	; CHECK-NEXT: [[TMP3:%.*]] = icmp eq i32 [[INDEX_NEXT]], [[N_VEC]]			; CHECK-NEXT: [[TMP3:%.*]] = icmp eq i32 [[INDEX_NEXT]], [[N_VEC]]
	; CHECK-NEXT: [[TMP4:%.*]] = trunc <4 x i32> [[TMP2]] to <4 x i8>			; CHECK-NEXT: [[TMP4:%.*]] = trunc <4 x i32> [[TMP2]] to <4 x i8>
	; CHECK-NEXT: [[TMP5]] = zext <4 x i8> [[TMP4]] to <4 x i32>			; CHECK-NEXT: [[TMP5]] = zext <4 x i8> [[TMP4]] to <4 x i32>
	; CHECK-NEXT: br i1 [[TMP3]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP0:![0-9]+]]			; CHECK-NEXT: br i1 [[TMP3]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP0:![0-9]+]]
	; CHECK: middle.block:			; CHECK: middle.block:
	; CHECK-NEXT: [[TMP6:%.*]] = trunc <4 x i32> [[TMP5]] to <4 x i8>			; CHECK-NEXT: [[TMP6:%.*]] = trunc <4 x i32> [[TMP5]] to <4 x i8>
	; CHECK-NEXT: [[TMP7:%.*]] = call i8 @llvm.vector.reduce.add.v4i8(<4 x i8> [[TMP6]])			; CHECK-NEXT: [[TMP7:%.*]] = call i8 @llvm.vector.reduce.add.v4i8(<4 x i8> [[TMP6]])
	; CHECK-NEXT: [[TMP8:%.*]] = zext i8 [[TMP7]] to i32			; CHECK-NEXT: [[TMP8:%.*]] = zext i8 [[TMP7]] to i32
				; CHECK-NEXT: [[RDX_START:%.*]] = add i32 0, [[TMP8]]
	; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i32 [[N]], [[N_VEC]]			; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i32 [[N]], [[N_VEC]]
	; CHECK-NEXT: br i1 [[CMP_N]], label [[FOR_END:%.*]], label [[SCALAR_PH]]			; CHECK-NEXT: br i1 [[CMP_N]], label [[FOR_END:%.*]], label [[SCALAR_PH]]
	; CHECK: scalar.ph:			; CHECK: scalar.ph:
	; CHECK-NEXT: [[BC_RESUME_VAL:%.]] = phi i32 [ [[N_VEC]], [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY:%.]] ]			; CHECK-NEXT: [[BC_RESUME_VAL:%.]] = phi i32 [ [[N_VEC]], [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY:%.]] ]
	; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 0, [[ENTRY]] ], [ [[TMP8]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 0, [[ENTRY]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: br label [[FOR_BODY:%.*]]			; CHECK-NEXT: br label [[FOR_BODY:%.*]]
	; CHECK: for.body:			; CHECK: for.body:
	; CHECK-NEXT: [[I:%.]] = phi i32 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[I_NEXT:%.]], [[IF_END:%.*]] ]			; CHECK-NEXT: [[I:%.]] = phi i32 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[I_NEXT:%.]], [[IF_END:%.*]] ]
	; CHECK-NEXT: [[R:%.]] = phi i32 [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[R_NEXT:%.]], [[IF_END]] ]			; CHECK-NEXT: [[R:%.]] = phi i32 [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[R_NEXT:%.]], [[IF_END]] ]
	; CHECK-NEXT: br i1 [[C]], label [[IF_THEN:%.*]], label [[IF_END]]			; CHECK-NEXT: br i1 [[C]], label [[IF_THEN:%.*]], label [[IF_END]]
	; CHECK: if.then:			; CHECK: if.then:
	; CHECK-NEXT: [[T0:%.*]] = sdiv i32 undef, undef			; CHECK-NEXT: [[T0:%.*]] = sdiv i32 undef, undef
	; CHECK-NEXT: br label [[IF_END]]			; CHECK-NEXT: br label [[IF_END]]
	; CHECK: if.end:			; CHECK: if.end:
	; CHECK-NEXT: [[T1:%.*]] = and i32 [[R]], 255			; CHECK-NEXT: [[T1:%.*]] = and i32 [[R]], 255
	; CHECK-NEXT: [[I_NEXT]] = add nsw i32 [[I]], 1			; CHECK-NEXT: [[I_NEXT]] = add nsw i32 [[I]], 1
	; CHECK-NEXT: [[R_NEXT]] = add nuw nsw i32 [[T1]], [[X]]			; CHECK-NEXT: [[R_NEXT]] = add nuw nsw i32 [[T1]], [[X]]
	; CHECK-NEXT: [[COND:%.*]] = icmp eq i32 [[I_NEXT]], [[N]]			; CHECK-NEXT: [[COND:%.*]] = icmp eq i32 [[I_NEXT]], [[N]]
	; CHECK-NEXT: br i1 [[COND]], label [[FOR_END]], label [[FOR_BODY]], !llvm.loop [[LOOP2:![0-9]+]]			; CHECK-NEXT: br i1 [[COND]], label [[FOR_END]], label [[FOR_BODY]], !llvm.loop [[LOOP2:![0-9]+]]
	; CHECK: for.end:			; CHECK: for.end:
	; CHECK-NEXT: [[T2:%.*]] = phi i32 [ [[R_NEXT]], [[IF_END]] ], [ [[TMP8]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[T2:%.*]] = phi i32 [ [[R_NEXT]], [[IF_END]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: [[T3:%.*]] = trunc i32 [[T2]] to i8			; CHECK-NEXT: [[T3:%.*]] = trunc i32 [[T2]] to i8
	; CHECK-NEXT: ret i8 [[T3]]			; CHECK-NEXT: ret i8 [[T3]]
	;			;
	entry:			entry:
	br label %for.body			br label %for.body

	for.body:			for.body:
	%i = phi i32 [ 0, %entry ], [ %i.next, %if.end ]			%i = phi i32 [ 0, %entry ], [ %i.next, %if.end ]
	Show All 24 Lines
	; CHECK-NEXT: [[TMP0:%.*]] = add i32 [[SMAX]], 1			; CHECK-NEXT: [[TMP0:%.*]] = add i32 [[SMAX]], 1
	; CHECK-NEXT: [[TMP1:%.*]] = sub i32 [[TMP0]], [[X]]			; CHECK-NEXT: [[TMP1:%.*]] = sub i32 [[TMP0]], [[X]]
	; CHECK-NEXT: [[MIN_ITERS_CHECK:%.*]] = icmp ult i32 [[TMP1]], 4			; CHECK-NEXT: [[MIN_ITERS_CHECK:%.*]] = icmp ult i32 [[TMP1]], 4
	; CHECK-NEXT: br i1 [[MIN_ITERS_CHECK]], label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]			; CHECK-NEXT: br i1 [[MIN_ITERS_CHECK]], label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]
	; CHECK: vector.ph:			; CHECK: vector.ph:
	; CHECK-NEXT: [[N_MOD_VF:%.*]] = urem i32 [[TMP1]], 4			; CHECK-NEXT: [[N_MOD_VF:%.*]] = urem i32 [[TMP1]], 4
	; CHECK-NEXT: [[N_VEC:%.*]] = sub i32 [[TMP1]], [[N_MOD_VF]]			; CHECK-NEXT: [[N_VEC:%.*]] = sub i32 [[TMP1]], [[N_MOD_VF]]
	; CHECK-NEXT: [[IND_END:%.*]] = add i32 [[X]], [[N_VEC]]			; CHECK-NEXT: [[IND_END:%.*]] = add i32 [[X]], [[N_VEC]]
	; CHECK-NEXT: [[TMP2:%.]] = insertelement <4 x i32> zeroinitializer, i32 [[Y:%.]], i32 0
	; CHECK-NEXT: br label [[VECTOR_BODY:%.*]]			; CHECK-NEXT: br label [[VECTOR_BODY:%.*]]
	; CHECK: vector.body:			; CHECK: vector.body:
	; CHECK-NEXT: [[INDEX:%.]] = phi i32 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[VECTOR_BODY]] ]			; CHECK-NEXT: [[INDEX:%.]] = phi i32 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[VECTOR_BODY]] ]
	; CHECK-NEXT: [[VEC_PHI:%.]] = phi <4 x i32> [ [[TMP2]], [[VECTOR_PH]] ], [ [[TMP7:%.]], [[VECTOR_BODY]] ]			; CHECK-NEXT: [[VEC_PHI:%.]] = phi <4 x i32> [ zeroinitializer, [[VECTOR_PH]] ], [ [[TMP6:%.]], [[VECTOR_BODY]] ]
	; CHECK-NEXT: [[TMP3:%.*]] = and <4 x i32> [[VEC_PHI]], <i32 1, i32 1, i32 1, i32 1>			; CHECK-NEXT: [[TMP2:%.*]] = and <4 x i32> [[VEC_PHI]], <i32 1, i32 1, i32 1, i32 1>
	; CHECK-NEXT: [[TMP4:%.*]] = add <4 x i32> [[TMP3]], <i32 -1, i32 -1, i32 -1, i32 -1>			; CHECK-NEXT: [[TMP3:%.*]] = add <4 x i32> [[TMP2]], <i32 -1, i32 -1, i32 -1, i32 -1>
	; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i32 [[INDEX]], 4			; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i32 [[INDEX]], 4
	; CHECK-NEXT: [[TMP5:%.*]] = icmp eq i32 [[INDEX_NEXT]], [[N_VEC]]			; CHECK-NEXT: [[TMP4:%.*]] = icmp eq i32 [[INDEX_NEXT]], [[N_VEC]]
	; CHECK-NEXT: [[TMP6:%.*]] = trunc <4 x i32> [[TMP4]] to <4 x i1>			; CHECK-NEXT: [[TMP5:%.*]] = trunc <4 x i32> [[TMP3]] to <4 x i1>
	; CHECK-NEXT: [[TMP7]] = sext <4 x i1> [[TMP6]] to <4 x i32>			; CHECK-NEXT: [[TMP6]] = sext <4 x i1> [[TMP5]] to <4 x i32>
	; CHECK-NEXT: br i1 [[TMP5]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP4:![0-9]+]]			; CHECK-NEXT: br i1 [[TMP4]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP4:![0-9]+]]
	; CHECK: middle.block:			; CHECK: middle.block:
	; CHECK-NEXT: [[TMP8:%.*]] = trunc <4 x i32> [[TMP7]] to <4 x i1>			; CHECK-NEXT: [[TMP7:%.*]] = trunc <4 x i32> [[TMP6]] to <4 x i1>
	; CHECK-NEXT: [[TMP9:%.*]] = call i1 @llvm.vector.reduce.add.v4i1(<4 x i1> [[TMP8]])			; CHECK-NEXT: [[TMP8:%.*]] = call i1 @llvm.vector.reduce.add.v4i1(<4 x i1> [[TMP7]])
	; CHECK-NEXT: [[TMP10:%.*]] = sext i1 [[TMP9]] to i32			; CHECK-NEXT: [[TMP9:%.*]] = sext i1 [[TMP8]] to i32
				; CHECK-NEXT: [[RDX_START:%.]] = add i32 [[Y:%.]], [[TMP9]]
	; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i32 [[TMP1]], [[N_VEC]]			; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i32 [[TMP1]], [[N_VEC]]
	; CHECK-NEXT: br i1 [[CMP_N]], label [[FOR_END:%.*]], label [[SCALAR_PH]]			; CHECK-NEXT: br i1 [[CMP_N]], label [[FOR_END:%.*]], label [[SCALAR_PH]]
	; CHECK: scalar.ph:			; CHECK: scalar.ph:
	; CHECK-NEXT: [[BC_RESUME_VAL:%.]] = phi i32 [ [[IND_END]], [[MIDDLE_BLOCK]] ], [ [[X]], [[ENTRY:%.]] ]			; CHECK-NEXT: [[BC_RESUME_VAL:%.]] = phi i32 [ [[IND_END]], [[MIDDLE_BLOCK]] ], [ [[X]], [[ENTRY:%.]] ]
	; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ [[Y]], [[ENTRY]] ], [ [[TMP10]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ [[Y]], [[ENTRY]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: br label [[FOR_BODY:%.*]]			; CHECK-NEXT: br label [[FOR_BODY:%.*]]
	; CHECK: for.body:			; CHECK: for.body:
	; CHECK-NEXT: [[I:%.]] = phi i32 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[I_NEXT:%.]], [[FOR_BODY]] ]			; CHECK-NEXT: [[I:%.]] = phi i32 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[I_NEXT:%.]], [[FOR_BODY]] ]
	; CHECK-NEXT: [[R:%.]] = phi i32 [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[R_NEXT:%.]], [[FOR_BODY]] ]			; CHECK-NEXT: [[R:%.]] = phi i32 [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[R_NEXT:%.]], [[FOR_BODY]] ]
	; CHECK-NEXT: [[T0:%.*]] = and i32 [[R]], 1			; CHECK-NEXT: [[T0:%.*]] = and i32 [[R]], 1
	; CHECK-NEXT: [[R_NEXT]] = add i32 [[T0]], -1			; CHECK-NEXT: [[R_NEXT]] = add i32 [[T0]], -1
	; CHECK-NEXT: [[I_NEXT]] = add nsw i32 [[I]], 1			; CHECK-NEXT: [[I_NEXT]] = add nsw i32 [[I]], 1
	; CHECK-NEXT: [[COND:%.*]] = icmp sgt i32 [[I]], 77			; CHECK-NEXT: [[COND:%.*]] = icmp sgt i32 [[I]], 77
	; CHECK-NEXT: br i1 [[COND]], label [[FOR_END]], label [[FOR_BODY]], !llvm.loop [[LOOP5:![0-9]+]]			; CHECK-NEXT: br i1 [[COND]], label [[FOR_END]], label [[FOR_BODY]], !llvm.loop [[LOOP5:![0-9]+]]
	; CHECK: for.end:			; CHECK: for.end:
	; CHECK-NEXT: [[T1:%.*]] = phi i32 [ [[R_NEXT]], [[FOR_BODY]] ], [ [[TMP10]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[T1:%.*]] = phi i32 [ [[R_NEXT]], [[FOR_BODY]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: ret i32 [[T1]]			; CHECK-NEXT: ret i32 [[T1]]
	;			;
	entry:			entry:
	br label %for.body			br label %for.body

	for.body:			for.body:
	%i = phi i32 [ %x, %entry ], [ %i.next, %for.body ]			%i = phi i32 [ %x, %entry ], [ %i.next, %for.body ]
	%r = phi i32 [ %y, %entry ], [ %r.next, %for.body ]			%r = phi i32 [ %y, %entry ], [ %r.next, %for.body ]
	▲ Show 20 Lines • Show All 76 Lines • Show Last 20 Lines

llvm/test/Transforms/LoopVectorize/scalable-reduction-inloop.ll

	; NOTE: Assertions have been autogenerated by utils/update_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_test_checks.py
	; RUN: opt < %s -loop-vectorize -force-target-supports-scalable-vectors=true -scalable-vectorization=on -S \| FileCheck %s			; RUN: opt < %s -loop-vectorize -force-target-supports-scalable-vectors=true -scalable-vectorization=on -S \| FileCheck %s

	target datalayout = "e-p:64:64:64-i1:8:8-i8:8:8-i16:16:16-i32:32:32-i64:64:64-f32:32:32-f64:64:64-v64:64:64-v128:128:128-a0:0:64-s0:64:64-f80:128:128-n8:16:32:64-S128"			target datalayout = "e-p:64:64:64-i1:8:8-i8:8:8-i16:16:16-i32:32:32-i64:64:64-f32:32:32-f64:64:64-v64:64:64-v128:128:128-a0:0:64-s0:64:64-f80:128:128-n8:16:32:64-S128"

	define i8 @reduction_add_trunc(i8* noalias nocapture %A) {			define i8 @reduction_add_trunc(i8* noalias nocapture %A) {
	; CHECK-LABEL: @reduction_add_trunc(			; CHECK-LABEL: @reduction_add_trunc(
				; CHECK-NEXT: entry:
				; CHECK-NEXT: [[TMP0:%.*]] = call i32 @llvm.vscale.i32()
				; CHECK-NEXT: [[TMP1:%.*]] = mul i32 [[TMP0]], 16
				; CHECK-NEXT: [[MIN_ITERS_CHECK:%.*]] = icmp ult i32 256, [[TMP1]]
				; CHECK-NEXT: br i1 [[MIN_ITERS_CHECK]], label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]
				; CHECK: vector.ph:
				; CHECK-NEXT: [[TMP2:%.*]] = call i32 @llvm.vscale.i32()
				; CHECK-NEXT: [[TMP3:%.*]] = mul i32 [[TMP2]], 16
				; CHECK-NEXT: [[N_MOD_VF:%.*]] = urem i32 256, [[TMP3]]
				; CHECK-NEXT: [[N_VEC:%.*]] = sub i32 256, [[N_MOD_VF]]
				; CHECK-NEXT: br label [[VECTOR_BODY:%.*]]
	; CHECK: vector.body:			; CHECK: vector.body:
	; CHECK-NEXT: [[INDEX:%.]] = phi i32 [ 0, %vector.ph ], [ [[INDEX_NEXT:%.]], %vector.body ]			; CHECK-NEXT: [[INDEX:%.]] = phi i32 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[VECTOR_BODY]] ]
	; CHECK-NEXT: [[VEC_PHI:%.]] = phi <vscale x 8 x i32> [ insertelement (<vscale x 8 x i32> zeroinitializer, i32 255, i32 0), %vector.ph ], [ [[TMP34:%.]], %vector.body ]			; CHECK-NEXT: [[VEC_PHI:%.]] = phi <vscale x 8 x i32> [ zeroinitializer, [[VECTOR_PH]] ], [ [[TMP28:%.]], [[VECTOR_BODY]] ]
	; CHECK-NEXT: [[VEC_PHI1:%.]] = phi <vscale x 8 x i32> [ zeroinitializer, %vector.ph ], [ [[TMP36:%.]], %vector.body ]			; CHECK-NEXT: [[VEC_PHI1:%.]] = phi <vscale x 8 x i32> [ zeroinitializer, [[VECTOR_PH]] ], [ [[TMP30:%.]], [[VECTOR_BODY]] ]
	; CHECK: [[TMP14:%.*]] = and <vscale x 8 x i32> [[VEC_PHI]], shufflevector (<vscale x 8 x i32> insertelement (<vscale x 8 x i32> poison, i32 255, i32 0), <vscale x 8 x i32> poison, <vscale x 8 x i32> zeroinitializer)			; CHECK-NEXT: [[TMP4:%.*]] = add i32 [[INDEX]], 0
	; CHECK-NEXT: [[TMP15:%.*]] = and <vscale x 8 x i32> [[VEC_PHI1]], shufflevector (<vscale x 8 x i32> insertelement (<vscale x 8 x i32> poison, i32 255, i32 0), <vscale x 8 x i32> poison, <vscale x 8 x i32> zeroinitializer)			; CHECK-NEXT: [[TMP5:%.*]] = call i32 @llvm.vscale.i32()
	; CHECK: [[WIDE_LOAD:%.]] = load <vscale x 8 x i8>, <vscale x 8 x i8>			; CHECK-NEXT: [[TMP6:%.*]] = mul i32 [[TMP5]], 8
	; CHECK: [[WIDE_LOAD2:%.]] = load <vscale x 8 x i8>, <vscale x 8 x i8>			; CHECK-NEXT: [[TMP7:%.*]] = add i32 [[TMP6]], 0
	; CHECK-NEXT: [[TMP26:%.*]] = zext <vscale x 8 x i8> [[WIDE_LOAD]] to <vscale x 8 x i32>			; CHECK-NEXT: [[TMP8:%.*]] = mul i32 [[TMP7]], 1
	; CHECK-NEXT: [[TMP27:%.*]] = zext <vscale x 8 x i8> [[WIDE_LOAD2]] to <vscale x 8 x i32>			; CHECK-NEXT: [[TMP9:%.*]] = add i32 [[INDEX]], [[TMP8]]
	; CHECK-NEXT: [[TMP28:%.*]] = add <vscale x 8 x i32> [[TMP14]], [[TMP26]]			; CHECK-NEXT: [[TMP10:%.*]] = and <vscale x 8 x i32> [[VEC_PHI]], shufflevector (<vscale x 8 x i32> insertelement (<vscale x 8 x i32> poison, i32 255, i32 0), <vscale x 8 x i32> poison, <vscale x 8 x i32> zeroinitializer)
	; CHECK-NEXT: [[TMP29:%.*]] = add <vscale x 8 x i32> [[TMP15]], [[TMP27]]			; CHECK-NEXT: [[TMP11:%.*]] = and <vscale x 8 x i32> [[VEC_PHI1]], shufflevector (<vscale x 8 x i32> insertelement (<vscale x 8 x i32> poison, i32 255, i32 0), <vscale x 8 x i32> poison, <vscale x 8 x i32> zeroinitializer)
	; CHECK-NEXT: [[TMP30:%.*]] = call i32 @llvm.vscale.i32()			; CHECK-NEXT: [[TMP12:%.]] = getelementptr inbounds i8, i8 [[A:%.*]], i32 [[TMP4]]
	; CHECK-NEXT: [[TMP31:%.*]] = mul i32 [[TMP30]], 16			; CHECK-NEXT: [[TMP13:%.]] = getelementptr inbounds i8, i8 [[A]], i32 [[TMP9]]
	; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i32 [[INDEX]], [[TMP31]]			; CHECK-NEXT: [[TMP14:%.]] = getelementptr inbounds i8, i8 [[TMP12]], i32 0
	; CHECK-NEXT: [[TMP32:%.]] = icmp eq i32 [[INDEX_NEXT]], {{%.}}			; CHECK-NEXT: [[TMP15:%.]] = bitcast i8 [[TMP14]] to <vscale x 8 x i8>*
	; CHECK-NEXT: [[TMP33:%.*]] = trunc <vscale x 8 x i32> [[TMP28]] to <vscale x 8 x i8>			; CHECK-NEXT: [[WIDE_LOAD:%.]] = load <vscale x 8 x i8>, <vscale x 8 x i8> [[TMP15]], align 4
	; CHECK-NEXT: [[TMP34]] = zext <vscale x 8 x i8> [[TMP33]] to <vscale x 8 x i32>			; CHECK-NEXT: [[TMP16:%.*]] = call i32 @llvm.vscale.i32()
	; CHECK-NEXT: [[TMP35:%.*]] = trunc <vscale x 8 x i32> [[TMP29]] to <vscale x 8 x i8>			; CHECK-NEXT: [[TMP17:%.*]] = mul i32 [[TMP16]], 8
	; CHECK-NEXT: [[TMP36]] = zext <vscale x 8 x i8> [[TMP35]] to <vscale x 8 x i32>			; CHECK-NEXT: [[TMP18:%.]] = getelementptr inbounds i8, i8 [[TMP12]], i32 [[TMP17]]
				; CHECK-NEXT: [[TMP19:%.]] = bitcast i8 [[TMP18]] to <vscale x 8 x i8>*
				; CHECK-NEXT: [[WIDE_LOAD2:%.]] = load <vscale x 8 x i8>, <vscale x 8 x i8> [[TMP19]], align 4
				; CHECK-NEXT: [[TMP20:%.*]] = zext <vscale x 8 x i8> [[WIDE_LOAD]] to <vscale x 8 x i32>
				; CHECK-NEXT: [[TMP21:%.*]] = zext <vscale x 8 x i8> [[WIDE_LOAD2]] to <vscale x 8 x i32>
				; CHECK-NEXT: [[TMP22:%.*]] = add <vscale x 8 x i32> [[TMP10]], [[TMP20]]
				; CHECK-NEXT: [[TMP23:%.*]] = add <vscale x 8 x i32> [[TMP11]], [[TMP21]]
				; CHECK-NEXT: [[TMP24:%.*]] = call i32 @llvm.vscale.i32()
				; CHECK-NEXT: [[TMP25:%.*]] = mul i32 [[TMP24]], 16
				; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i32 [[INDEX]], [[TMP25]]
				; CHECK-NEXT: [[TMP26:%.*]] = icmp eq i32 [[INDEX_NEXT]], [[N_VEC]]
				; CHECK-NEXT: [[TMP27:%.*]] = trunc <vscale x 8 x i32> [[TMP22]] to <vscale x 8 x i8>
				; CHECK-NEXT: [[TMP28]] = zext <vscale x 8 x i8> [[TMP27]] to <vscale x 8 x i32>
				; CHECK-NEXT: [[TMP29:%.*]] = trunc <vscale x 8 x i32> [[TMP23]] to <vscale x 8 x i8>
				; CHECK-NEXT: [[TMP30]] = zext <vscale x 8 x i8> [[TMP29]] to <vscale x 8 x i32>
				; CHECK-NEXT: br i1 [[TMP26]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP0:![0-9]+]]
	; CHECK: middle.block:			; CHECK: middle.block:
	; CHECK-NEXT: [[TMP37:%.*]] = trunc <vscale x 8 x i32> [[TMP34]] to <vscale x 8 x i8>			; CHECK-NEXT: [[TMP31:%.*]] = trunc <vscale x 8 x i32> [[TMP28]] to <vscale x 8 x i8>
	; CHECK-NEXT: [[TMP38:%.*]] = trunc <vscale x 8 x i32> [[TMP36]] to <vscale x 8 x i8>			; CHECK-NEXT: [[TMP32:%.*]] = trunc <vscale x 8 x i32> [[TMP30]] to <vscale x 8 x i8>
	; CHECK-NEXT: [[BIN_RDX:%.*]] = add <vscale x 8 x i8> [[TMP38]], [[TMP37]]			; CHECK-NEXT: [[BIN_RDX:%.*]] = add <vscale x 8 x i8> [[TMP32]], [[TMP31]]
	; CHECK-NEXT: [[TMP39:%.*]] = call i8 @llvm.vector.reduce.add.nxv8i8(<vscale x 8 x i8> [[BIN_RDX]])			; CHECK-NEXT: [[TMP33:%.*]] = call i8 @llvm.vector.reduce.add.nxv8i8(<vscale x 8 x i8> [[BIN_RDX]])
	; CHECK-NEXT: [[TMP40:%.*]] = zext i8 [[TMP39]] to i32			; CHECK-NEXT: [[TMP34:%.*]] = zext i8 [[TMP33]] to i32
				; CHECK-NEXT: [[RDX_START:%.*]] = add i32 255, [[TMP34]]
				; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i32 256, [[N_VEC]]
				; CHECK-NEXT: br i1 [[CMP_N]], label [[EXIT:%.*]], label [[SCALAR_PH]]
				; CHECK: scalar.ph:
				; CHECK-NEXT: [[BC_RESUME_VAL:%.]] = phi i32 [ [[N_VEC]], [[MIDDLE_BLOCK]] ], [ 0, [[ENTRY:%.]] ]
				; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 255, [[ENTRY]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
				; CHECK-NEXT: br label [[LOOP:%.*]]
				; CHECK: loop:
				; CHECK-NEXT: [[INDVARS_IV:%.]] = phi i32 [ [[INDVARS_IV_NEXT:%.]], [[LOOP]] ], [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ]
				; CHECK-NEXT: [[SUM_02P:%.]] = phi i32 [ [[L9:%.]], [[LOOP]] ], [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ]
				; CHECK-NEXT: [[SUM_02:%.*]] = and i32 [[SUM_02P]], 255
				; CHECK-NEXT: [[L2:%.]] = getelementptr inbounds i8, i8 [[A]], i32 [[INDVARS_IV]]
				; CHECK-NEXT: [[L3:%.]] = load i8, i8 [[L2]], align 4
				; CHECK-NEXT: [[L3E:%.*]] = zext i8 [[L3]] to i32
				; CHECK-NEXT: [[L9]] = add i32 [[SUM_02]], [[L3E]]
				; CHECK-NEXT: [[INDVARS_IV_NEXT]] = add i32 [[INDVARS_IV]], 1
				; CHECK-NEXT: [[EXITCOND:%.*]] = icmp eq i32 [[INDVARS_IV_NEXT]], 256
				; CHECK-NEXT: br i1 [[EXITCOND]], label [[EXIT]], label [[LOOP]], !llvm.loop [[LOOP2:![0-9]+]]
				; CHECK: exit:
				; CHECK-NEXT: [[SUM_0_LCSSA:%.*]] = phi i32 [ [[L9]], [[LOOP]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
				; CHECK-NEXT: [[RET:%.*]] = trunc i32 [[SUM_0_LCSSA]] to i8
				; CHECK-NEXT: ret i8 [[RET]]
	;			;
	entry:			entry:
	br label %loop			br label %loop

	loop: ; preds = %entry, %loop			loop: ; preds = %entry, %loop
	%indvars.iv = phi i32 [ %indvars.iv.next, %loop ], [ 0, %entry ]			%indvars.iv = phi i32 [ %indvars.iv.next, %loop ], [ 0, %entry ]
	%sum.02p = phi i32 [ %l9, %loop ], [ 255, %entry ]			%sum.02p = phi i32 [ %l9, %loop ], [ 255, %entry ]
	%sum.02 = and i32 %sum.02p, 255			%sum.02 = and i32 %sum.02p, 255
	Show All 19 Lines

llvm/test/Transforms/LoopVectorize/trunc-reductions.ll

	; NOTE: Assertions have been autogenerated by utils/update_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_test_checks.py
	; RUN: opt -loop-vectorize -dce -instcombine -force-vector-interleave=1 -force-vector-width=8 -S < %s \| FileCheck %s			; RUN: opt -loop-vectorize -dce -instcombine -force-vector-interleave=1 -force-vector-width=8 -S < %s \| FileCheck %s

	define i8 @reduction_and_trunc(i8* noalias nocapture %ptr) {			define i8 @reduction_and_trunc(i8* noalias nocapture %ptr) {
	; CHECK-LABEL: @reduction_and_trunc(			; CHECK-LABEL: @reduction_and_trunc(
	; CHECK-NEXT: entry:			; CHECK-NEXT: entry:
	; CHECK-NEXT: br i1 false, label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]			; CHECK-NEXT: br i1 false, label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]
	; CHECK: vector.ph:			; CHECK: vector.ph:
	; CHECK-NEXT: br label [[VECTOR_BODY:%.*]]			; CHECK-NEXT: br label [[VECTOR_BODY:%.*]]
	; CHECK: vector.body:			; CHECK: vector.body:
	; CHECK-NEXT: [[INDEX:%.]] = phi i32 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[VECTOR_BODY]] ]			; CHECK-NEXT: [[INDEX:%.]] = phi i32 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[VECTOR_BODY]] ]
	; CHECK-NEXT: [[VEC_PHI:%.]] = phi <8 x i8> [ <i8 0, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1>, [[VECTOR_PH]] ], [ [[TMP3:%.]], [[VECTOR_BODY]] ]
	; CHECK-NEXT: [[TMP0:%.*]] = sext i32 [[INDEX]] to i64
	; CHECK-NEXT: [[TMP1:%.]] = getelementptr inbounds i8, i8 [[PTR:%.*]], i64 [[TMP0]]
	; CHECK-NEXT: [[TMP2:%.]] = bitcast i8 [[TMP1]] to <8 x i8>*
	; CHECK-NEXT: [[WIDE_LOAD:%.]] = load <8 x i8>, <8 x i8> [[TMP2]], align 1
	; CHECK-NEXT: [[TMP3]] = and <8 x i8> [[VEC_PHI]], [[WIDE_LOAD]]
	; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i32 [[INDEX]], 8			; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i32 [[INDEX]], 8
	; CHECK-NEXT: [[TMP4:%.*]] = icmp eq i32 [[INDEX_NEXT]], 256			; CHECK-NEXT: [[TMP0:%.*]] = icmp eq i32 [[INDEX_NEXT]], 256
	; CHECK-NEXT: br i1 [[TMP4]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP0:![0-9]+]]			; CHECK-NEXT: br i1 [[TMP0]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP0:![0-9]+]]
	; CHECK: middle.block:			; CHECK: middle.block:
	; CHECK-NEXT: [[TMP5:%.*]] = call i8 @llvm.vector.reduce.and.v8i8(<8 x i8> [[TMP3]])
	; CHECK-NEXT: br i1 true, label [[FOR_END:%.*]], label [[SCALAR_PH]]			; CHECK-NEXT: br i1 true, label [[FOR_END:%.*]], label [[SCALAR_PH]]
	; CHECK: scalar.ph:			; CHECK: scalar.ph:
	; CHECK-NEXT: br label [[FOR_BODY:%.*]]			; CHECK-NEXT: br label [[FOR_BODY:%.*]]
	; CHECK: for.body:			; CHECK: for.body:
	; CHECK-NEXT: br i1 poison, label [[FOR_END]], label [[FOR_BODY]], !llvm.loop [[LOOP2:![0-9]+]]			; CHECK-NEXT: br i1 poison, label [[FOR_END]], label [[FOR_BODY]], !llvm.loop [[LOOP2:![0-9]+]]
	; CHECK: for.end:			; CHECK: for.end:
	; CHECK-NEXT: [[AND_LCSSA_OFF0:%.*]] = phi i8 [ poison, [[FOR_BODY]] ], [ [[TMP5]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: ret i8 0
	; CHECK-NEXT: ret i8 [[AND_LCSSA_OFF0]]
	;			;
	entry:			entry:
	br label %for.body			br label %for.body

	for.body:			for.body:
	%iv = phi i32 [ %iv.next, %for.body ], [ 0, %entry ]			%iv = phi i32 [ %iv.next, %for.body ], [ 0, %entry ]
	%sum.02p = phi i32 [ %and, %for.body ], [ 0, %entry ]			%sum.02p = phi i32 [ %and, %for.body ], [ 0, %entry ]
	%sum.02 = and i32 %sum.02p, 255			%sum.02 = and i32 %sum.02p, 255
	▲ Show 20 Lines • Show All 103 Lines • ▼ Show 20 Lines

	for.end:			for.end:
	%ret = trunc i32 %xor to i16			%ret = trunc i32 %xor to i16
	ret i16 %ret			ret i16 %ret
	}			}

	define i8 @reduction_smin_trunc(i8* noalias nocapture %ptr) {			define i8 @reduction_smin_trunc(i8* noalias nocapture %ptr) {
	; CHECK-LABEL: @reduction_smin_trunc(			; CHECK-LABEL: @reduction_smin_trunc(
	; CHECK-NOT: vector.body			; CHECK-NEXT: entry:
	; CHECK-NOT: <8 x			; CHECK-NEXT: br label [[FOR_BODY:%.*]]
	; CHECK: ret			; CHECK: for.body:
				; CHECK-NEXT: [[IV:%.]] = phi i32 [ [[IV_NEXT:%.]], [[FOR_BODY]] ], [ 0, [[ENTRY:%.*]] ]
				; CHECK-NEXT: [[SUM_02P:%.]] = phi i32 [ [[TMP1:%.]], [[FOR_BODY]] ], [ 256, [[ENTRY]] ]
				; CHECK-NEXT: [[SUM_02:%.*]] = and i32 [[SUM_02P]], 255
				; CHECK-NEXT: [[TMP0:%.*]] = sext i32 [[IV]] to i64
				; CHECK-NEXT: [[GEP:%.]] = getelementptr inbounds i8, i8 [[PTR:%.*]], i64 [[TMP0]]
				; CHECK-NEXT: [[LOAD:%.]] = load i8, i8 [[GEP]], align 1
				; CHECK-NEXT: [[EXT:%.*]] = sext i8 [[LOAD]] to i32
				; CHECK-NEXT: [[TMP1]] = call i32 @llvm.smin.i32(i32 [[SUM_02]], i32 [[EXT]])
				; CHECK-NEXT: [[IV_NEXT]] = add i32 [[IV]], 1
				; CHECK-NEXT: [[EXITCOND:%.*]] = icmp eq i32 [[IV_NEXT]], 256
				; CHECK-NEXT: br i1 [[EXITCOND]], label [[FOR_END:%.*]], label [[FOR_BODY]]
				; CHECK: for.end:
				; CHECK-NEXT: [[RET:%.*]] = trunc i32 [[TMP1]] to i8
				; CHECK-NEXT: ret i8 [[RET]]
				;
	entry:			entry:
	br label %for.body			br label %for.body

	for.body:			for.body:
	%iv = phi i32 [ %iv.next, %for.body ], [ 0, %entry ]			%iv = phi i32 [ %iv.next, %for.body ], [ 0, %entry ]
	%sum.02p = phi i32 [ %min, %for.body ], [ 256, %entry ]			%sum.02p = phi i32 [ %min, %for.body ], [ 256, %entry ]
	%sum.02 = and i32 %sum.02p, 255			%sum.02 = and i32 %sum.02p, 255
	%gep = getelementptr inbounds i8, i8* %ptr, i32 %iv			%gep = getelementptr inbounds i8, i8* %ptr, i32 %iv
	%load = load i8, i8* %gep			%load = load i8, i8* %gep
	%ext = sext i8 %load to i32			%ext = sext i8 %load to i32
	%icmp = icmp slt i32 %sum.02, %ext			%icmp = icmp slt i32 %sum.02, %ext
	%min = select i1 %icmp, i32 %sum.02, i32 %ext			%min = select i1 %icmp, i32 %sum.02, i32 %ext
	%iv.next = add i32 %iv, 1			%iv.next = add i32 %iv, 1
	%exitcond = icmp eq i32 %iv.next, 256			%exitcond = icmp eq i32 %iv.next, 256
	br i1 %exitcond, label %for.end, label %for.body			br i1 %exitcond, label %for.end, label %for.body

	for.end:			for.end:
	%ret = trunc i32 %min to i8			%ret = trunc i32 %min to i8
	ret i8 %ret			ret i8 %ret
	}			}

	define i8 @reduction_umin_trunc(i8* noalias nocapture %ptr) {			define i8 @reduction_umin_trunc(i8* noalias nocapture %ptr) {
	; CHECK-LABEL: @reduction_umin_trunc(			; CHECK-LABEL: @reduction_umin_trunc(
	; CHECK-NOT: vector.body			; CHECK-NEXT: entry:
	; CHECK-NOT: <8 x			; CHECK-NEXT: br label [[FOR_BODY:%.*]]
	; CHECK: ret			; CHECK: for.body:
				; CHECK-NEXT: [[IV:%.]] = phi i32 [ [[IV_NEXT:%.]], [[FOR_BODY]] ], [ 0, [[ENTRY:%.*]] ]
				; CHECK-NEXT: [[SUM_02P:%.]] = phi i32 [ [[TMP1:%.]], [[FOR_BODY]] ], [ 0, [[ENTRY]] ]
				; CHECK-NEXT: [[SUM_02:%.*]] = and i32 [[SUM_02P]], 255
				; CHECK-NEXT: [[TMP0:%.*]] = sext i32 [[IV]] to i64
				; CHECK-NEXT: [[GEP:%.]] = getelementptr inbounds i8, i8 [[PTR:%.*]], i64 [[TMP0]]
				; CHECK-NEXT: [[LOAD:%.]] = load i8, i8 [[GEP]], align 1
				; CHECK-NEXT: [[EXT:%.*]] = zext i8 [[LOAD]] to i32
				; CHECK-NEXT: [[TMP1]] = call i32 @llvm.umin.i32(i32 [[SUM_02]], i32 [[EXT]])
				; CHECK-NEXT: [[IV_NEXT]] = add i32 [[IV]], 1
				; CHECK-NEXT: [[EXITCOND:%.*]] = icmp eq i32 [[IV_NEXT]], 256
				; CHECK-NEXT: br i1 [[EXITCOND]], label [[FOR_END:%.*]], label [[FOR_BODY]]
				; CHECK: for.end:
				; CHECK-NEXT: [[RET:%.*]] = trunc i32 [[TMP1]] to i8
				; CHECK-NEXT: ret i8 [[RET]]
				;
	entry:			entry:
	br label %for.body			br label %for.body

	for.body:			for.body:
	%iv = phi i32 [ %iv.next, %for.body ], [ 0, %entry ]			%iv = phi i32 [ %iv.next, %for.body ], [ 0, %entry ]
	%sum.02p = phi i32 [ %min, %for.body ], [ 0, %entry ]			%sum.02p = phi i32 [ %min, %for.body ], [ 0, %entry ]
	%sum.02 = and i32 %sum.02p, 255			%sum.02 = and i32 %sum.02p, 255
	%gep = getelementptr inbounds i8, i8* %ptr, i32 %iv			%gep = getelementptr inbounds i8, i8* %ptr, i32 %iv
	%load = load i8, i8* %gep			%load = load i8, i8* %gep
	%ext = zext i8 %load to i32			%ext = zext i8 %load to i32
	%icmp = icmp ult i32 %sum.02, %ext			%icmp = icmp ult i32 %sum.02, %ext
	%min = select i1 %icmp, i32 %sum.02, i32 %ext			%min = select i1 %icmp, i32 %sum.02, i32 %ext
	%iv.next = add i32 %iv, 1			%iv.next = add i32 %iv, 1
	%exitcond = icmp eq i32 %iv.next, 256			%exitcond = icmp eq i32 %iv.next, 256
	br i1 %exitcond, label %for.end, label %for.body			br i1 %exitcond, label %for.end, label %for.body

	for.end:			for.end:
	%ret = trunc i32 %min to i8			%ret = trunc i32 %min to i8
	ret i8 %ret			ret i8 %ret
	}			}

	define i16 @reduction_smax_trunc(i16* noalias nocapture %ptr) {			define i16 @reduction_smax_trunc(i16* noalias nocapture %ptr) {
	; CHECK-LABEL: @reduction_smax_trunc(			; CHECK-LABEL: @reduction_smax_trunc(
	; CHECK-NOT: vector.body			; CHECK-NEXT: entry:
	; CHECK-NOT: <8 x			; CHECK-NEXT: br label [[FOR_BODY:%.*]]
	; CHECK: ret			; CHECK: for.body:
				; CHECK-NEXT: [[IV:%.]] = phi i32 [ [[IV_NEXT:%.]], [[FOR_BODY]] ], [ 0, [[ENTRY:%.*]] ]
				; CHECK-NEXT: [[SUM_02P:%.]] = phi i32 [ [[TMP1:%.]], [[FOR_BODY]] ], [ 0, [[ENTRY]] ]
				; CHECK-NEXT: [[SUM_02:%.*]] = and i32 [[SUM_02P]], 65535
				; CHECK-NEXT: [[TMP0:%.*]] = sext i32 [[IV]] to i64
				; CHECK-NEXT: [[GEP:%.]] = getelementptr inbounds i16, i16 [[PTR:%.*]], i64 [[TMP0]]
				; CHECK-NEXT: [[LOAD:%.]] = load i16, i16 [[GEP]], align 2
				; CHECK-NEXT: [[EXT:%.*]] = sext i16 [[LOAD]] to i32
				; CHECK-NEXT: [[TMP1]] = call i32 @llvm.smax.i32(i32 [[SUM_02]], i32 [[EXT]])
				; CHECK-NEXT: [[IV_NEXT]] = add i32 [[IV]], 1
				; CHECK-NEXT: [[EXITCOND:%.*]] = icmp eq i32 [[IV_NEXT]], 256
				; CHECK-NEXT: br i1 [[EXITCOND]], label [[FOR_END:%.*]], label [[FOR_BODY]]
				; CHECK: for.end:
				; CHECK-NEXT: [[RET:%.*]] = trunc i32 [[TMP1]] to i16
				; CHECK-NEXT: ret i16 [[RET]]
				;
	entry:			entry:
	br label %for.body			br label %for.body

	for.body:			for.body:
	%iv = phi i32 [ %iv.next, %for.body ], [ 0, %entry ]			%iv = phi i32 [ %iv.next, %for.body ], [ 0, %entry ]
	%sum.02p = phi i32 [ %min, %for.body ], [ 0, %entry ]			%sum.02p = phi i32 [ %min, %for.body ], [ 0, %entry ]
	%sum.02 = and i32 %sum.02p, 65535			%sum.02 = and i32 %sum.02p, 65535
	%gep = getelementptr inbounds i16, i16* %ptr, i32 %iv			%gep = getelementptr inbounds i16, i16* %ptr, i32 %iv
	%load = load i16, i16* %gep			%load = load i16, i16* %gep
	%ext = sext i16 %load to i32			%ext = sext i16 %load to i32
	%icmp = icmp sgt i32 %sum.02, %ext			%icmp = icmp sgt i32 %sum.02, %ext
	%min = select i1 %icmp, i32 %sum.02, i32 %ext			%min = select i1 %icmp, i32 %sum.02, i32 %ext
	%iv.next = add i32 %iv, 1			%iv.next = add i32 %iv, 1
	%exitcond = icmp eq i32 %iv.next, 256			%exitcond = icmp eq i32 %iv.next, 256
	br i1 %exitcond, label %for.end, label %for.body			br i1 %exitcond, label %for.end, label %for.body

	for.end:			for.end:
	%ret = trunc i32 %min to i16			%ret = trunc i32 %min to i16
	ret i16 %ret			ret i16 %ret
	}			}

	define i16 @reduction_umax_trunc(i16* noalias nocapture %ptr) {			define i16 @reduction_umax_trunc(i16* noalias nocapture %ptr) {
	; CHECK-LABEL: @reduction_umax_trunc(			; CHECK-LABEL: @reduction_umax_trunc(
	; CHECK-NOT: vector.body			; CHECK-NEXT: entry:
	; CHECK-NOT: <8 x			; CHECK-NEXT: br label [[FOR_BODY:%.*]]
	; CHECK: ret			; CHECK: for.body:
				; CHECK-NEXT: [[IV:%.]] = phi i32 [ [[IV_NEXT:%.]], [[FOR_BODY]] ], [ 0, [[ENTRY:%.*]] ]
				; CHECK-NEXT: [[SUM_02P:%.]] = phi i32 [ [[TMP1:%.]], [[FOR_BODY]] ], [ 0, [[ENTRY]] ]
				; CHECK-NEXT: [[SUM_02:%.*]] = and i32 [[SUM_02P]], 65535
				; CHECK-NEXT: [[TMP0:%.*]] = sext i32 [[IV]] to i64
				; CHECK-NEXT: [[GEP:%.]] = getelementptr inbounds i16, i16 [[PTR:%.*]], i64 [[TMP0]]
				; CHECK-NEXT: [[LOAD:%.]] = load i16, i16 [[GEP]], align 2
				; CHECK-NEXT: [[EXT:%.*]] = zext i16 [[LOAD]] to i32
				; CHECK-NEXT: [[TMP1]] = call i32 @llvm.umax.i32(i32 [[SUM_02]], i32 [[EXT]])
				; CHECK-NEXT: [[IV_NEXT]] = add i32 [[IV]], 1
				; CHECK-NEXT: [[EXITCOND:%.*]] = icmp eq i32 [[IV_NEXT]], 256
				; CHECK-NEXT: br i1 [[EXITCOND]], label [[FOR_END:%.*]], label [[FOR_BODY]]
				; CHECK: for.end:
				; CHECK-NEXT: [[RET:%.*]] = trunc i32 [[TMP1]] to i16
				; CHECK-NEXT: ret i16 [[RET]]
				;
	entry:			entry:
	br label %for.body			br label %for.body

	for.body:			for.body:
	%iv = phi i32 [ %iv.next, %for.body ], [ 0, %entry ]			%iv = phi i32 [ %iv.next, %for.body ], [ 0, %entry ]
	%sum.02p = phi i32 [ %min, %for.body ], [ 0, %entry ]			%sum.02p = phi i32 [ %min, %for.body ], [ 0, %entry ]
	%sum.02 = and i32 %sum.02p, 65535			%sum.02 = and i32 %sum.02p, 65535
	%gep = getelementptr inbounds i16, i16* %ptr, i32 %iv			%gep = getelementptr inbounds i16, i16* %ptr, i32 %iv
	Show All 12 Lines

llvm/test/Transforms/PhaseOrdering/AArch64/peel-multiple-unreachable-exits-for-vectorization.ll

	Show All 37 Lines
	; CHECK-NEXT: [[MIN_ITERS_CHECK:%.*]] = icmp ult i64 [[TMP2]], 5			; CHECK-NEXT: [[MIN_ITERS_CHECK:%.*]] = icmp ult i64 [[TMP2]], 5
	; CHECK-NEXT: br i1 [[MIN_ITERS_CHECK]], label [[LOOP_PREHEADER21:%.]], label [[VECTOR_PH:%.]]			; CHECK-NEXT: br i1 [[MIN_ITERS_CHECK]], label [[LOOP_PREHEADER21:%.]], label [[VECTOR_PH:%.]]
	; CHECK: vector.ph:			; CHECK: vector.ph:
	; CHECK-NEXT: [[N_MOD_VF:%.*]] = and i64 [[TMP2]], 3			; CHECK-NEXT: [[N_MOD_VF:%.*]] = and i64 [[TMP2]], 3
	; CHECK-NEXT: [[TMP3:%.*]] = icmp eq i64 [[N_MOD_VF]], 0			; CHECK-NEXT: [[TMP3:%.*]] = icmp eq i64 [[N_MOD_VF]], 0
	; CHECK-NEXT: [[TMP4:%.*]] = select i1 [[TMP3]], i64 4, i64 [[N_MOD_VF]]			; CHECK-NEXT: [[TMP4:%.*]] = select i1 [[TMP3]], i64 4, i64 [[N_MOD_VF]]
	; CHECK-NEXT: [[N_VEC:%.*]] = sub i64 [[TMP2]], [[TMP4]]			; CHECK-NEXT: [[N_VEC:%.*]] = sub i64 [[TMP2]], [[TMP4]]
	; CHECK-NEXT: [[IND_END:%.*]] = add i64 [[N_VEC]], 1			; CHECK-NEXT: [[IND_END:%.*]] = add i64 [[N_VEC]], 1
	; CHECK-NEXT: [[TMP5:%.*]] = insertelement <2 x i64> <i64 poison, i64 0>, i64 [[SUM_NEXT_PEEL]], i64 0
	; CHECK-NEXT: br label [[VECTOR_BODY:%.*]]			; CHECK-NEXT: br label [[VECTOR_BODY:%.*]]
	; CHECK: vector.body:			; CHECK: vector.body:
	; CHECK-NEXT: [[INDEX:%.]] = phi i64 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[VECTOR_BODY]] ]			; CHECK-NEXT: [[INDEX:%.]] = phi i64 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[VECTOR_BODY]] ]
	; CHECK-NEXT: [[VEC_PHI:%.]] = phi <2 x i64> [ [[TMP5]], [[VECTOR_PH]] ], [ [[TMP16:%.]], [[VECTOR_BODY]] ]			; CHECK-NEXT: [[VEC_PHI:%.]] = phi <2 x i64> [ zeroinitializer, [[VECTOR_PH]] ], [ [[TMP15:%.]], [[VECTOR_BODY]] ]
	; CHECK-NEXT: [[VEC_PHI17:%.]] = phi <2 x i64> [ zeroinitializer, [[VECTOR_PH]] ], [ [[TMP17:%.]], [[VECTOR_BODY]] ]			; CHECK-NEXT: [[VEC_PHI17:%.]] = phi <2 x i64> [ zeroinitializer, [[VECTOR_PH]] ], [ [[TMP16:%.]], [[VECTOR_BODY]] ]
	; CHECK-NEXT: [[OFFSET_IDX:%.*]] = or i64 [[INDEX]], 1			; CHECK-NEXT: [[OFFSET_IDX:%.*]] = or i64 [[INDEX]], 1
	; CHECK-NEXT: [[TMP6:%.]] = getelementptr i64, i64 [[START_I]], i64 [[OFFSET_IDX]]			; CHECK-NEXT: [[TMP5:%.]] = getelementptr i64, i64 [[START_I]], i64 [[OFFSET_IDX]]
	; CHECK-NEXT: [[TMP7:%.]] = bitcast i64 [[TMP6]] to <2 x i64>*			; CHECK-NEXT: [[TMP6:%.]] = bitcast i64 [[TMP5]] to <2 x i64>*
	; CHECK-NEXT: [[WIDE_LOAD:%.]] = load <2 x i64>, <2 x i64> [[TMP7]], align 4			; CHECK-NEXT: [[WIDE_LOAD:%.]] = load <2 x i64>, <2 x i64> [[TMP6]], align 4
	; CHECK-NEXT: [[TMP8:%.]] = getelementptr i64, i64 [[TMP6]], i64 2			; CHECK-NEXT: [[TMP7:%.]] = getelementptr i64, i64 [[TMP5]], i64 2
	; CHECK-NEXT: [[TMP9:%.]] = bitcast i64 [[TMP8]] to <2 x i64>*			; CHECK-NEXT: [[TMP8:%.]] = bitcast i64 [[TMP7]] to <2 x i64>*
	; CHECK-NEXT: [[WIDE_LOAD18:%.]] = load <2 x i64>, <2 x i64> [[TMP9]], align 4			; CHECK-NEXT: [[WIDE_LOAD18:%.]] = load <2 x i64>, <2 x i64> [[TMP8]], align 4
	; CHECK-NEXT: [[TMP10:%.]] = getelementptr i64, i64 [[START_I2_PEEL]], i64 [[OFFSET_IDX]]			; CHECK-NEXT: [[TMP9:%.]] = getelementptr i64, i64 [[START_I2_PEEL]], i64 [[OFFSET_IDX]]
	; CHECK-NEXT: [[TMP11:%.]] = bitcast i64 [[TMP10]] to <2 x i64>*			; CHECK-NEXT: [[TMP10:%.]] = bitcast i64 [[TMP9]] to <2 x i64>*
	; CHECK-NEXT: [[WIDE_LOAD19:%.]] = load <2 x i64>, <2 x i64> [[TMP11]], align 4			; CHECK-NEXT: [[WIDE_LOAD19:%.]] = load <2 x i64>, <2 x i64> [[TMP10]], align 4
	; CHECK-NEXT: [[TMP12:%.]] = getelementptr i64, i64 [[TMP10]], i64 2			; CHECK-NEXT: [[TMP11:%.]] = getelementptr i64, i64 [[TMP9]], i64 2
	; CHECK-NEXT: [[TMP13:%.]] = bitcast i64 [[TMP12]] to <2 x i64>*			; CHECK-NEXT: [[TMP12:%.]] = bitcast i64 [[TMP11]] to <2 x i64>*
	; CHECK-NEXT: [[WIDE_LOAD20:%.]] = load <2 x i64>, <2 x i64> [[TMP13]], align 4			; CHECK-NEXT: [[WIDE_LOAD20:%.]] = load <2 x i64>, <2 x i64> [[TMP12]], align 4
	; CHECK-NEXT: [[TMP14:%.*]] = add <2 x i64> [[WIDE_LOAD]], [[VEC_PHI]]			; CHECK-NEXT: [[TMP13:%.*]] = add <2 x i64> [[WIDE_LOAD]], [[VEC_PHI]]
	; CHECK-NEXT: [[TMP15:%.*]] = add <2 x i64> [[WIDE_LOAD18]], [[VEC_PHI17]]			; CHECK-NEXT: [[TMP14:%.*]] = add <2 x i64> [[WIDE_LOAD18]], [[VEC_PHI17]]
	; CHECK-NEXT: [[TMP16]] = add <2 x i64> [[TMP14]], [[WIDE_LOAD19]]			; CHECK-NEXT: [[TMP15]] = add <2 x i64> [[TMP13]], [[WIDE_LOAD19]]
	; CHECK-NEXT: [[TMP17]] = add <2 x i64> [[TMP15]], [[WIDE_LOAD20]]			; CHECK-NEXT: [[TMP16]] = add <2 x i64> [[TMP14]], [[WIDE_LOAD20]]
	; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 4			; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 4
	; CHECK-NEXT: [[TMP18:%.*]] = icmp eq i64 [[INDEX_NEXT]], [[N_VEC]]			; CHECK-NEXT: [[TMP17:%.*]] = icmp eq i64 [[INDEX_NEXT]], [[N_VEC]]
	; CHECK-NEXT: br i1 [[TMP18]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP0:![0-9]+]]			; CHECK-NEXT: br i1 [[TMP17]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP0:![0-9]+]]
	; CHECK: middle.block:			; CHECK: middle.block:
	; CHECK-NEXT: [[BIN_RDX:%.*]] = add <2 x i64> [[TMP17]], [[TMP16]]			; CHECK-NEXT: [[BIN_RDX:%.*]] = add <2 x i64> [[TMP16]], [[TMP15]]
	; CHECK-NEXT: [[TMP19:%.*]] = tail call i64 @llvm.vector.reduce.add.v2i64(<2 x i64> [[BIN_RDX]])			; CHECK-NEXT: [[TMP18:%.*]] = tail call i64 @llvm.vector.reduce.add.v2i64(<2 x i64> [[BIN_RDX]])
				; CHECK-NEXT: [[RDX_START:%.*]] = add i64 [[SUM_NEXT_PEEL]], [[TMP18]]
	; CHECK-NEXT: br label [[LOOP_PREHEADER21]]			; CHECK-NEXT: br label [[LOOP_PREHEADER21]]
	; CHECK: loop.preheader21:			; CHECK: loop.preheader21:
	; CHECK-NEXT: [[IV_PH:%.*]] = phi i64 [ 1, [[LOOP_PREHEADER]] ], [ [[IND_END]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[IV_PH:%.*]] = phi i64 [ 1, [[LOOP_PREHEADER]] ], [ [[IND_END]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: [[SUM_PH:%.*]] = phi i64 [ [[SUM_NEXT_PEEL]], [[LOOP_PREHEADER]] ], [ [[TMP19]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[SUM_PH:%.*]] = phi i64 [ [[SUM_NEXT_PEEL]], [[LOOP_PREHEADER]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: br label [[LOOP:%.*]]			; CHECK-NEXT: br label [[LOOP:%.*]]
	; CHECK: loop:			; CHECK: loop:
	; CHECK-NEXT: [[IV:%.]] = phi i64 [ [[IV_NEXT:%.]], [[AT_WITH_INT_CONVERSION_EXIT12:%.*]] ], [ [[IV_PH]], [[LOOP_PREHEADER21]] ]			; CHECK-NEXT: [[IV:%.]] = phi i64 [ [[IV_NEXT:%.]], [[AT_WITH_INT_CONVERSION_EXIT12:%.*]] ], [ [[IV_PH]], [[LOOP_PREHEADER21]] ]
	; CHECK-NEXT: [[SUM:%.]] = phi i64 [ [[SUM_NEXT:%.]], [[AT_WITH_INT_CONVERSION_EXIT12]] ], [ [[SUM_PH]], [[LOOP_PREHEADER21]] ]			; CHECK-NEXT: [[SUM:%.]] = phi i64 [ [[SUM_NEXT:%.]], [[AT_WITH_INT_CONVERSION_EXIT12]] ], [ [[SUM_PH]], [[LOOP_PREHEADER21]] ]
	; CHECK-NEXT: [[INRANGE_I:%.*]] = icmp ult i64 [[SUB_I]], [[IV]]			; CHECK-NEXT: [[INRANGE_I:%.*]] = icmp ult i64 [[SUB_I]], [[IV]]
	; CHECK-NEXT: br i1 [[INRANGE_I]], label [[ERROR_I:%.]], label [[AT_WITH_INT_CONVERSION_EXIT:%.]]			; CHECK-NEXT: br i1 [[INRANGE_I]], label [[ERROR_I:%.]], label [[AT_WITH_INT_CONVERSION_EXIT:%.]]
	; CHECK: error.i:			; CHECK: error.i:
	; CHECK-NEXT: tail call void @error()			; CHECK-NEXT: tail call void @error()
	▲ Show 20 Lines • Show All 78 Lines • ▼ Show 20 Lines
	; CHECK-NEXT: [[MIN_ITERS_CHECK:%.*]] = icmp ult i64 [[TMP2]], 5			; CHECK-NEXT: [[MIN_ITERS_CHECK:%.*]] = icmp ult i64 [[TMP2]], 5
	; CHECK-NEXT: br i1 [[MIN_ITERS_CHECK]], label [[LOOP_PREHEADER36:%.]], label [[VECTOR_PH:%.]]			; CHECK-NEXT: br i1 [[MIN_ITERS_CHECK]], label [[LOOP_PREHEADER36:%.]], label [[VECTOR_PH:%.]]
	; CHECK: vector.ph:			; CHECK: vector.ph:
	; CHECK-NEXT: [[N_MOD_VF:%.*]] = and i64 [[TMP2]], 3			; CHECK-NEXT: [[N_MOD_VF:%.*]] = and i64 [[TMP2]], 3
	; CHECK-NEXT: [[TMP3:%.*]] = icmp eq i64 [[N_MOD_VF]], 0			; CHECK-NEXT: [[TMP3:%.*]] = icmp eq i64 [[N_MOD_VF]], 0
	; CHECK-NEXT: [[TMP4:%.*]] = select i1 [[TMP3]], i64 4, i64 [[N_MOD_VF]]			; CHECK-NEXT: [[TMP4:%.*]] = select i1 [[TMP3]], i64 4, i64 [[N_MOD_VF]]
	; CHECK-NEXT: [[N_VEC:%.*]] = sub i64 [[TMP2]], [[TMP4]]			; CHECK-NEXT: [[N_VEC:%.*]] = sub i64 [[TMP2]], [[TMP4]]
	; CHECK-NEXT: [[IND_END:%.*]] = add i64 [[N_VEC]], 1			; CHECK-NEXT: [[IND_END:%.*]] = add i64 [[N_VEC]], 1
	; CHECK-NEXT: [[TMP5:%.*]] = insertelement <2 x i64> <i64 poison, i64 0>, i64 [[SUM_NEXT_PEEL]], i64 0
	; CHECK-NEXT: br label [[VECTOR_BODY:%.*]]			; CHECK-NEXT: br label [[VECTOR_BODY:%.*]]
	; CHECK: vector.body:			; CHECK: vector.body:
	; CHECK-NEXT: [[INDEX:%.]] = phi i64 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[VECTOR_BODY]] ]			; CHECK-NEXT: [[INDEX:%.]] = phi i64 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[VECTOR_BODY]] ]
	; CHECK-NEXT: [[VEC_PHI:%.]] = phi <2 x i64> [ [[TMP5]], [[VECTOR_PH]] ], [ [[TMP22:%.]], [[VECTOR_BODY]] ]			; CHECK-NEXT: [[VEC_PHI:%.]] = phi <2 x i64> [ zeroinitializer, [[VECTOR_PH]] ], [ [[TMP21:%.]], [[VECTOR_BODY]] ]
	; CHECK-NEXT: [[VEC_PHI30:%.]] = phi <2 x i64> [ zeroinitializer, [[VECTOR_PH]] ], [ [[TMP23:%.]], [[VECTOR_BODY]] ]			; CHECK-NEXT: [[VEC_PHI30:%.]] = phi <2 x i64> [ zeroinitializer, [[VECTOR_PH]] ], [ [[TMP22:%.]], [[VECTOR_BODY]] ]
	; CHECK-NEXT: [[OFFSET_IDX:%.*]] = or i64 [[INDEX]], 1			; CHECK-NEXT: [[OFFSET_IDX:%.*]] = or i64 [[INDEX]], 1
	; CHECK-NEXT: [[TMP6:%.]] = getelementptr i64, i64 [[START_I]], i64 [[OFFSET_IDX]]			; CHECK-NEXT: [[TMP5:%.]] = getelementptr i64, i64 [[START_I]], i64 [[OFFSET_IDX]]
	; CHECK-NEXT: [[TMP7:%.]] = bitcast i64 [[TMP6]] to <2 x i64>*			; CHECK-NEXT: [[TMP6:%.]] = bitcast i64 [[TMP5]] to <2 x i64>*
	; CHECK-NEXT: [[WIDE_LOAD:%.]] = load <2 x i64>, <2 x i64> [[TMP7]], align 4			; CHECK-NEXT: [[WIDE_LOAD:%.]] = load <2 x i64>, <2 x i64> [[TMP6]], align 4
	; CHECK-NEXT: [[TMP8:%.]] = getelementptr i64, i64 [[TMP6]], i64 2			; CHECK-NEXT: [[TMP7:%.]] = getelementptr i64, i64 [[TMP5]], i64 2
	; CHECK-NEXT: [[TMP9:%.]] = bitcast i64 [[TMP8]] to <2 x i64>*			; CHECK-NEXT: [[TMP8:%.]] = bitcast i64 [[TMP7]] to <2 x i64>*
	; CHECK-NEXT: [[WIDE_LOAD31:%.]] = load <2 x i64>, <2 x i64> [[TMP9]], align 4			; CHECK-NEXT: [[WIDE_LOAD31:%.]] = load <2 x i64>, <2 x i64> [[TMP8]], align 4
	; CHECK-NEXT: [[TMP10:%.]] = getelementptr i64, i64 [[START_I2_PEEL]], i64 [[OFFSET_IDX]]			; CHECK-NEXT: [[TMP9:%.]] = getelementptr i64, i64 [[START_I2_PEEL]], i64 [[OFFSET_IDX]]
	; CHECK-NEXT: [[TMP11:%.]] = bitcast i64 [[TMP10]] to <2 x i64>*			; CHECK-NEXT: [[TMP10:%.]] = bitcast i64 [[TMP9]] to <2 x i64>*
	; CHECK-NEXT: [[WIDE_LOAD32:%.]] = load <2 x i64>, <2 x i64> [[TMP11]], align 4			; CHECK-NEXT: [[WIDE_LOAD32:%.]] = load <2 x i64>, <2 x i64> [[TMP10]], align 4
	; CHECK-NEXT: [[TMP12:%.]] = getelementptr i64, i64 [[TMP10]], i64 2			; CHECK-NEXT: [[TMP11:%.]] = getelementptr i64, i64 [[TMP9]], i64 2
	; CHECK-NEXT: [[TMP13:%.]] = bitcast i64 [[TMP12]] to <2 x i64>*			; CHECK-NEXT: [[TMP12:%.]] = bitcast i64 [[TMP11]] to <2 x i64>*
	; CHECK-NEXT: [[WIDE_LOAD33:%.]] = load <2 x i64>, <2 x i64> [[TMP13]], align 4			; CHECK-NEXT: [[WIDE_LOAD33:%.]] = load <2 x i64>, <2 x i64> [[TMP12]], align 4
	; CHECK-NEXT: [[TMP14:%.]] = getelementptr i64, i64 [[START_I14_PEEL]], i64 [[OFFSET_IDX]]			; CHECK-NEXT: [[TMP13:%.]] = getelementptr i64, i64 [[START_I14_PEEL]], i64 [[OFFSET_IDX]]
	; CHECK-NEXT: [[TMP15:%.]] = bitcast i64 [[TMP14]] to <2 x i64>*			; CHECK-NEXT: [[TMP14:%.]] = bitcast i64 [[TMP13]] to <2 x i64>*
	; CHECK-NEXT: [[WIDE_LOAD34:%.]] = load <2 x i64>, <2 x i64> [[TMP15]], align 4			; CHECK-NEXT: [[WIDE_LOAD34:%.]] = load <2 x i64>, <2 x i64> [[TMP14]], align 4
	; CHECK-NEXT: [[TMP16:%.]] = getelementptr i64, i64 [[TMP14]], i64 2			; CHECK-NEXT: [[TMP15:%.]] = getelementptr i64, i64 [[TMP13]], i64 2
	; CHECK-NEXT: [[TMP17:%.]] = bitcast i64 [[TMP16]] to <2 x i64>*			; CHECK-NEXT: [[TMP16:%.]] = bitcast i64 [[TMP15]] to <2 x i64>*
	; CHECK-NEXT: [[WIDE_LOAD35:%.]] = load <2 x i64>, <2 x i64> [[TMP17]], align 4			; CHECK-NEXT: [[WIDE_LOAD35:%.]] = load <2 x i64>, <2 x i64> [[TMP16]], align 4
	; CHECK-NEXT: [[TMP18:%.*]] = add <2 x i64> [[WIDE_LOAD]], [[VEC_PHI]]			; CHECK-NEXT: [[TMP17:%.*]] = add <2 x i64> [[WIDE_LOAD]], [[VEC_PHI]]
	; CHECK-NEXT: [[TMP19:%.*]] = add <2 x i64> [[WIDE_LOAD31]], [[VEC_PHI30]]			; CHECK-NEXT: [[TMP18:%.*]] = add <2 x i64> [[WIDE_LOAD31]], [[VEC_PHI30]]
	; CHECK-NEXT: [[TMP20:%.*]] = add <2 x i64> [[TMP18]], [[WIDE_LOAD32]]			; CHECK-NEXT: [[TMP19:%.*]] = add <2 x i64> [[TMP17]], [[WIDE_LOAD32]]
	; CHECK-NEXT: [[TMP21:%.*]] = add <2 x i64> [[TMP19]], [[WIDE_LOAD33]]			; CHECK-NEXT: [[TMP20:%.*]] = add <2 x i64> [[TMP18]], [[WIDE_LOAD33]]
	; CHECK-NEXT: [[TMP22]] = add <2 x i64> [[TMP20]], [[WIDE_LOAD34]]			; CHECK-NEXT: [[TMP21]] = add <2 x i64> [[TMP19]], [[WIDE_LOAD34]]
	; CHECK-NEXT: [[TMP23]] = add <2 x i64> [[TMP21]], [[WIDE_LOAD35]]			; CHECK-NEXT: [[TMP22]] = add <2 x i64> [[TMP20]], [[WIDE_LOAD35]]
	; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 4			; CHECK-NEXT: [[INDEX_NEXT]] = add nuw i64 [[INDEX]], 4
	; CHECK-NEXT: [[TMP24:%.*]] = icmp eq i64 [[INDEX_NEXT]], [[N_VEC]]			; CHECK-NEXT: [[TMP23:%.*]] = icmp eq i64 [[INDEX_NEXT]], [[N_VEC]]
	; CHECK-NEXT: br i1 [[TMP24]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP5:![0-9]+]]			; CHECK-NEXT: br i1 [[TMP23]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop [[LOOP5:![0-9]+]]
	; CHECK: middle.block:			; CHECK: middle.block:
	; CHECK-NEXT: [[BIN_RDX:%.*]] = add <2 x i64> [[TMP23]], [[TMP22]]			; CHECK-NEXT: [[BIN_RDX:%.*]] = add <2 x i64> [[TMP22]], [[TMP21]]
	; CHECK-NEXT: [[TMP25:%.*]] = tail call i64 @llvm.vector.reduce.add.v2i64(<2 x i64> [[BIN_RDX]])			; CHECK-NEXT: [[TMP24:%.*]] = tail call i64 @llvm.vector.reduce.add.v2i64(<2 x i64> [[BIN_RDX]])
				; CHECK-NEXT: [[RDX_START:%.*]] = add i64 [[SUM_NEXT_PEEL]], [[TMP24]]
	; CHECK-NEXT: br label [[LOOP_PREHEADER36]]			; CHECK-NEXT: br label [[LOOP_PREHEADER36]]
	; CHECK: loop.preheader36:			; CHECK: loop.preheader36:
	; CHECK-NEXT: [[IV_PH:%.*]] = phi i64 [ 1, [[LOOP_PREHEADER]] ], [ [[IND_END]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[IV_PH:%.*]] = phi i64 [ 1, [[LOOP_PREHEADER]] ], [ [[IND_END]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: [[SUM_PH:%.*]] = phi i64 [ [[SUM_NEXT_PEEL]], [[LOOP_PREHEADER]] ], [ [[TMP25]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[SUM_PH:%.*]] = phi i64 [ [[SUM_NEXT_PEEL]], [[LOOP_PREHEADER]] ], [ [[RDX_START]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: br label [[LOOP:%.*]]			; CHECK-NEXT: br label [[LOOP:%.*]]
	; CHECK: loop:			; CHECK: loop:
	; CHECK-NEXT: [[IV:%.]] = phi i64 [ [[IV_NEXT:%.]], [[AT_WITH_INT_CONVERSION_EXIT24:%.*]] ], [ [[IV_PH]], [[LOOP_PREHEADER36]] ]			; CHECK-NEXT: [[IV:%.]] = phi i64 [ [[IV_NEXT:%.]], [[AT_WITH_INT_CONVERSION_EXIT24:%.*]] ], [ [[IV_PH]], [[LOOP_PREHEADER36]] ]
	; CHECK-NEXT: [[SUM:%.]] = phi i64 [ [[SUM_NEXT:%.]], [[AT_WITH_INT_CONVERSION_EXIT24]] ], [ [[SUM_PH]], [[LOOP_PREHEADER36]] ]			; CHECK-NEXT: [[SUM:%.]] = phi i64 [ [[SUM_NEXT:%.]], [[AT_WITH_INT_CONVERSION_EXIT24]] ], [ [[SUM_PH]], [[LOOP_PREHEADER36]] ]
	; CHECK-NEXT: [[INRANGE_I:%.*]] = icmp ult i64 [[SUB_I]], [[IV]]			; CHECK-NEXT: [[INRANGE_I:%.*]] = icmp ult i64 [[SUB_I]], [[IV]]
	; CHECK-NEXT: br i1 [[INRANGE_I]], label [[ERROR_I:%.]], label [[AT_WITH_INT_CONVERSION_EXIT:%.]]			; CHECK-NEXT: br i1 [[INRANGE_I]], label [[ERROR_I:%.]], label [[AT_WITH_INT_CONVERSION_EXIT:%.]]
	; CHECK: error.i:			; CHECK: error.i:
	; CHECK-NEXT: tail call void @error()			; CHECK-NEXT: tail call void @error()
	▲ Show 20 Lines • Show All 93 Lines • Show Last 20 Lines

This is an archive of the discontinued LLVM Phabricator instance.

[WIP][LV] Reassociate start value of recurrence to end Needs ReviewPublic

Details

Diff Detail

Unit TestsFailed

Event Timeline

Revision Contents

Diff 470607

llvm/lib/Transforms/Vectorize/LoopVectorize.cpp

llvm/lib/Transforms/Vectorize/VPlanRecipes.cpp

llvm/test/Transforms/LoopVectorize/AArch64/gather-do-not-vectorize-addressing.ll

llvm/test/Transforms/LoopVectorize/AArch64/sve-epilog-vect-reductions.ll

llvm/test/Transforms/LoopVectorize/AMDGPU/packed-math.ll

llvm/test/Transforms/LoopVectorize/ARM/mve-reduction-predselect.ll

llvm/test/Transforms/LoopVectorize/ARM/mve-reduction-types.ll

llvm/test/Transforms/LoopVectorize/ARM/mve-selectandorcost.ll

llvm/test/Transforms/LoopVectorize/ARM/sphinx.ll

llvm/test/Transforms/LoopVectorize/PowerPC/widened-massv-call.ll

llvm/test/Transforms/LoopVectorize/PowerPC/widened-massv-vfabi-attr.ll

llvm/test/Transforms/LoopVectorize/RISCV/defaults.ll

llvm/test/Transforms/LoopVectorize/RISCV/inloop-reduction.ll

llvm/test/Transforms/LoopVectorize/RISCV/scalable-basics.ll

llvm/test/Transforms/LoopVectorize/RISCV/scalable-tailfold.ll

llvm/test/Transforms/LoopVectorize/X86/cost-model.ll

llvm/test/Transforms/LoopVectorize/X86/imprecise-through-phis.ll

llvm/test/Transforms/LoopVectorize/X86/invariant-store-vectorization.ll

llvm/test/Transforms/LoopVectorize/X86/load-deref-pred.ll

llvm/test/Transforms/LoopVectorize/X86/reduction-fastmath.ll

llvm/test/Transforms/LoopVectorize/X86/strided_load_cost.ll

llvm/test/Transforms/LoopVectorize/X86/tail_loop_folding.ll

llvm/test/Transforms/LoopVectorize/X86/uniform_mem_op.ll

llvm/test/Transforms/LoopVectorize/X86/x86-predication.ll

llvm/test/Transforms/LoopVectorize/epilog-vectorization-reductions.ll

llvm/test/Transforms/LoopVectorize/first-order-recurrence.ll

llvm/test/Transforms/LoopVectorize/if-pred-non-void.ll

llvm/test/Transforms/LoopVectorize/if-pred-stores.ll

llvm/test/Transforms/LoopVectorize/induction.ll

llvm/test/Transforms/LoopVectorize/interleaved-accesses.ll

llvm/test/Transforms/LoopVectorize/loop-form.ll

llvm/test/Transforms/LoopVectorize/pr51614-fold-tail-by-masking.ll

llvm/test/Transforms/LoopVectorize/pr55167-fold-tail-live-out.ll

llvm/test/Transforms/LoopVectorize/reduction-inloop-pred.ll

llvm/test/Transforms/LoopVectorize/reduction-inloop.ll

llvm/test/Transforms/LoopVectorize/reduction-predselect.ll

llvm/test/Transforms/LoopVectorize/reduction-small-size.ll

llvm/test/Transforms/LoopVectorize/scalable-reduction-inloop.ll

llvm/test/Transforms/LoopVectorize/trunc-reductions.ll

llvm/test/Transforms/PhaseOrdering/AArch64/peel-multiple-unreachable-exits-for-vectorization.ll

[WIP][LV] Reassociate start value of recurrence to end
Needs ReviewPublic