This is an archive of the discontinued LLVM Phabricator instance.

[LV] Create new vector loop preheader so it contains vectorizer generated code only.
Needs ReviewPublic

Authored by ebrevnov on Dec 10 2019, 3:47 AM.

Download Raw Diff

Details

Reviewers

hsaito
Ayal
fhahn
rengolin
anna

Summary

This change is motivated by https://reviews.llvm.org/D71053 where we add suport for evaluating overhead of runtime checks.
Currently we may reuse existing block for vector preheader. Thus we endup with instructions not related to vectorization in vector preheader. With this change we will reuse existing preheader only if it has single instruction (should be a branch) and will generate new preheader in all other cases. That makes it easier to read the IR. What more importantly it enables us to evaluate cost of vector prehader in a more convinient way.

Diff Detail

Repository

rG LLVM Github Monorepo

Build Status

Buildable 42639
Build 43166: arc lint + arc unit

Event Timeline

ebrevnov created this revision.Dec 10 2019, 3:47 AM

Herald added a project: Restricted Project. · View Herald TranscriptDec 10 2019, 3:47 AM

Herald added subscribers: llvm-commits, rkruppe, hiraditya. · View Herald Transcript

Harbormaster completed remote builds in B42195: Diff 233039.Dec 10 2019, 3:53 AM

ebrevnov added reviewers: hsaito, Ayal, fhahn, rengolin, anna.Dec 10 2019, 3:54 AM

ebrevnov added a parent revision: D71249: [LV] Set name for vector preheader and trip count check blocks.

ebrevnov added a child revision: D71053: [LV] Take overhead of run-time checks into account during vectorization..Dec 10 2019, 3:56 AM

This change introduces a number of new branches in the code. While not necessarily the hottest code, it may prove significant on short loops, especially nested loops. Without evidence in the form of benchmarks etc. it's hard to justify.

Furthermore, I'm not sure I agree with the statement that this makes the analysis somehow simpler. Do you have an explicit goal in mind?

llvm/lib/Transforms/Vectorize/LoopVectorize.cpp
2687	Are you sure this is semantically valid on all targets?

In D71250#1777947, @rengolin wrote:

This change introduces a number of new branches in the code. While not necessarily the hottest code, it may prove significant on short loops, especially nested loops. Without evidence in the form of benchmarks etc. it's hard to justify.

These extra branches are very short leaved and optimized out by SimplifyCFG which happens just 3 passes after the vectorizer. Thus I don't believe it can cause any harm to the performance. I double check that LLVM's test-suite has no regressions.

Furthermore, I'm not sure I agree with the statement that this makes the analysis somehow simpler. Do you have an explicit goal in mind?

This is definitely a subjective thing as there is no any formal metric to measure. IMHO having vectorizer generated code clearly separated from the rest makes IR more readable. It becomes easy to see whole structure of the vectorizer generated code. Having sad that it's surely not the main motivation for the change. The aim here is to simplify next patch (https://reviews.llvm.org/D71053) which benefits from being able to observe vectorizer generated code without doing extra book keeping.

ebrevnov marked an inline comment as done.Dec 10 2019, 9:02 PM

ebrevnov added inline comments.

llvm/lib/Transforms/Vectorize/LoopVectorize.cpp
2687	That doesn't change existing semantics. It simply allows not to generate trivially dead code because otherwise there is an unconditional branch to vector loop.

In D71250#1778881, @ebrevnov wrote:

These extra branches are very short leaved and optimized out by SimplifyCFG which happens just 3 passes after the vectorizer.

Sounds reasonable.

Thus I don't believe it can cause any harm to the performance. I double check that LLVM's test-suite has no regressions.

Regression in performance or not showing any of those branches in asm output?

Unfortunately, the test-suite benchmark is not a complete set of relevant programs. :(

This is definitely a subjective thing as there is no any formal metric to measure. IMHO having vectorizer generated code clearly separated from the rest makes IR more readable. It becomes easy to see whole structure of the vectorizer generated code.

Just to keep in mind, in the past, steps towards generating "better looking" IR have almost always lead us to poorer codegen. Usually, we consider this to be a weak reason, if one at all, and one that could have unintended consequences.

So, if your patch has other properties, it's best to focus on them.

Having sad that it's surely not the main motivation for the change. The aim here is to simplify next patch (https://reviews.llvm.org/D71053) which benefits from being able to observe vectorizer generated code without doing extra book keeping.

It'd be interesting to know if this patch would also make other analises easier, too. That way, even if your following patch doesn't land, this one can benefit other parts of the vectoriser.

Can you think of some existing infrastructure in the vectoriser that would be easier with this change?

llvm/lib/Transforms/Vectorize/LoopVectorize.cpp
2687	Ah, my bad. I didn't see the condition invertion.

Rebase.

Harbormaster completed remote builds in B42639: Diff 234229.Dec 17 2019, 12:19 AM

Revision Contents

Path

Size

llvm/

lib/

Transforms/

Vectorize/

LoopVectorize.cpp

9 lines

test/

Transforms/

LoopVectorize/

AArch64/

pr36032.ll

6 lines

ARM/

sphinx.ll

8 lines

X86/

illegal-parallel-loop-uniform-write.ll

8 lines

invariant-load-gather.ll

10 lines

invariant-store-vectorization.ll

22 lines

60 lines

36 lines

6 lines

6 lines

x86-interleaved-accesses-masked-group.ll

6 lines

float-induction.ll

2 lines

float-minmax-instruction-flag.ll

6 lines

induction-step.ll

2 lines

induction.ll

2 lines

invariant-store-vectorization.ll

24 lines

iv_outside_user.ll

2 lines

pr30806.ll

2 lines

Diff 234229

llvm/lib/Transforms/Vectorize/LoopVectorize.cpp

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 2,678 Lines • ▼ Show 20 Lines

void InnerLoopVectorizer::emitMinimumIterationCountCheck(Loop *L,		void InnerLoopVectorizer::emitMinimumIterationCountCheck(Loop *L,
BasicBlock *Bypass) {		BasicBlock *Bypass) {
Value *Count = getOrCreateTripCount(L);		Value *Count = getOrCreateTripCount(L);
BasicBlock *const OrigPreHeader = LoopVectorPreHeader;		BasicBlock *const OrigPreHeader = LoopVectorPreHeader;
IRBuilder<> Builder(OrigPreHeader->getTerminator());		IRBuilder<> Builder(OrigPreHeader->getTerminator());

// Generate code to check if the loop's trip count is less than VF * UF, or		// Generate code to check if the loop's trip count is less than VF * UF, or
// equal to it in case a scalar epilogue is required; this implies that the		// equal to it in case a scalar epilogue is required; this implies that the
		rengolinUnsubmitted Not Done Reply Inline Actions Are you sure this is semantically valid on all targets? rengolin: Are you sure this is semantically valid on all targets?
		ebrevnovAuthorUnsubmitted Done Reply Inline Actions That doesn't change existing semantics. It simply allows not to generate trivially dead code because otherwise there is an unconditional branch to vector loop. ebrevnov: That doesn't change existing semantics. It simply allows not to generate trivially dead code…
		rengolinUnsubmitted Not Done Reply Inline Actions Ah, my bad. I didn't see the condition invertion. rengolin: Ah, my bad. I didn't see the condition invertion.
// vector trip count is zero. This check also covers the case where adding one		// vector trip count is zero. This check also covers the case where adding one
// to the backedge-taken count overflowed leading to an incorrect trip count		// to the backedge-taken count overflowed leading to an incorrect trip count
// of zero. In this case we will also jump to the scalar loop.		// of zero. In this case we will also jump to the scalar loop.
auto P =		auto P =
Cost->requiresScalarEpilogue() ? ICmpInst::ICMP_ULE : ICmpInst::ICMP_ULT;		Cost->requiresScalarEpilogue() ? ICmpInst::ICMP_ULE : ICmpInst::ICMP_ULT;

// If tail is to be folded, vector loop takes care of all iterations.		// If tail is to be folded, vector loop takes care of all iterations.
Value *CheckMinIters = Builder.getFalse();		Value *CheckMinIters = Builder.getFalse();
▲ Show 20 Lines • Show All 248 Lines • ▼ Show 20 Lines	BasicBlock *InnerLoopVectorizer::createVectorizedLoopSkeleton() {
// - counts from zero, stepping by one		// - counts from zero, stepping by one
// - is the size of the widest induction variable type		// - is the size of the widest induction variable type
// then we create a new one.		// then we create a new one.
OldInduction = Legal->getPrimaryInduction();		OldInduction = Legal->getPrimaryInduction();
Type *IdxTy = Legal->getWidestInductionType();		Type *IdxTy = Legal->getWidestInductionType();

// Split the single block loop into the two loop structure described above.		// Split the single block loop into the two loop structure described above.
LoopScalarBody = OrigLoop->getHeader();		LoopScalarBody = OrigLoop->getHeader();
LoopVectorPreHeader = OrigLoop->getLoopPreheader();
LoopExitBlock = OrigLoop->getExitBlock();		LoopExitBlock = OrigLoop->getExitBlock();
assert(LoopExitBlock && "Must have an exit block");		assert(LoopExitBlock && "Must have an exit block");

		BasicBlock *OrigLoopPH = OrigLoop->getLoopPreheader();
		if (OrigLoopPH->size() > 1)
		LoopVectorPreHeader = SplitBlock(OrigLoopPH, OrigLoopPH->getTerminator(),
		DT, LI, nullptr, "");
		else
		LoopVectorPreHeader = OrigLoopPH;

assert(LoopVectorPreHeader && "Invalid loop structure");		assert(LoopVectorPreHeader && "Invalid loop structure");

LoopVectorPreHeader->setName("vector.ph");		LoopVectorPreHeader->setName("vector.ph");

LoopMiddleBlock =		LoopMiddleBlock =
SplitBlock(LoopVectorPreHeader, LoopVectorPreHeader->getTerminator(), DT,		SplitBlock(LoopVectorPreHeader, LoopVectorPreHeader->getTerminator(), DT,
LI, nullptr, "middle.block");		LI, nullptr, "middle.block");
LoopScalarPreHeader =		LoopScalarPreHeader =
▲ Show 20 Lines • Show All 4,984 Lines • Show Last 20 Lines

llvm/test/Transforms/LoopVectorize/AArch64/pr36032.ll

	Show All 16 Lines
	; CHECK-NEXT: [[CALL:%.]] = tail call i8 @"_ZN3$_01aEv"(%struct.anon* nonnull @b)			; CHECK-NEXT: [[CALL:%.]] = tail call i8 @"_ZN3$_01aEv"(%struct.anon* nonnull @b)
	; CHECK-NEXT: [[SCEVGEP1:%.]] = getelementptr i8, i8 [[CALL]], i64 4			; CHECK-NEXT: [[SCEVGEP1:%.]] = getelementptr i8, i8 [[CALL]], i64 4
	; CHECK-NEXT: br label [[FOR_COND:%.*]]			; CHECK-NEXT: br label [[FOR_COND:%.*]]
	; CHECK: for.cond:			; CHECK: for.cond:
	; CHECK-NEXT: [[F_0:%.]] = phi i32 [ 0, [[ENTRY:%.]] ], [ [[ADD5:%.]], [[FOR_COND_CLEANUP:%.]] ]			; CHECK-NEXT: [[F_0:%.]] = phi i32 [ 0, [[ENTRY:%.]] ], [ [[ADD5:%.]], [[FOR_COND_CLEANUP:%.]] ]
	; CHECK-NEXT: [[G_0:%.]] = phi i32 [ undef, [[ENTRY]] ], [ [[G_1_LCSSA:%.]], [[FOR_COND_CLEANUP]] ]			; CHECK-NEXT: [[G_0:%.]] = phi i32 [ undef, [[ENTRY]] ], [ [[G_1_LCSSA:%.]], [[FOR_COND_CLEANUP]] ]
	; CHECK-NEXT: [[CMP12:%.*]] = icmp ult i32 [[G_0]], 4			; CHECK-NEXT: [[CMP12:%.*]] = icmp ult i32 [[G_0]], 4
	; CHECK-NEXT: [[CONV:%.*]] = and i32 [[F_0]], 65535			; CHECK-NEXT: [[CONV:%.*]] = and i32 [[F_0]], 65535
	; CHECK-NEXT: br i1 [[CMP12]], label [[TC_CHECK:%.*]], label [[FOR_COND_CLEANUP]]			; CHECK-NEXT: br i1 [[CMP12]], label [[FOR_BODY_LR_PH:%.*]], label [[FOR_COND_CLEANUP]]
	; CHECK: tc.check:			; CHECK: for.body.lr.ph:
	; CHECK-NEXT: [[TMP0:%.*]] = zext i32 [[G_0]] to i64			; CHECK-NEXT: [[TMP0:%.*]] = zext i32 [[G_0]] to i64
				; CHECK-NEXT: br label [[TC_CHECK:%.*]]
				; CHECK: tc.check:
	; CHECK-NEXT: [[TMP1:%.*]] = sub i64 4, [[TMP0]]			; CHECK-NEXT: [[TMP1:%.*]] = sub i64 4, [[TMP0]]
	; CHECK-NEXT: [[MIN_ITERS_CHECK:%.*]] = icmp ult i64 [[TMP1]], 4			; CHECK-NEXT: [[MIN_ITERS_CHECK:%.*]] = icmp ult i64 [[TMP1]], 4
	; CHECK-NEXT: br i1 [[MIN_ITERS_CHECK]], label [[SCALAR_PH:%.]], label [[VECTOR_SCEVCHECK:%.]]			; CHECK-NEXT: br i1 [[MIN_ITERS_CHECK]], label [[SCALAR_PH:%.]], label [[VECTOR_SCEVCHECK:%.]]
	; CHECK: vector.scevcheck:			; CHECK: vector.scevcheck:
	; CHECK-NEXT: [[TMP2:%.*]] = sub i64 3, [[TMP0]]			; CHECK-NEXT: [[TMP2:%.*]] = sub i64 3, [[TMP0]]
	; CHECK-NEXT: [[TMP3:%.*]] = add i32 [[G_0]], [[CONV]]			; CHECK-NEXT: [[TMP3:%.*]] = add i32 [[G_0]], [[CONV]]
	; CHECK-NEXT: [[TMP4:%.*]] = trunc i64 [[TMP2]] to i32			; CHECK-NEXT: [[TMP4:%.*]] = trunc i64 [[TMP2]] to i32
	; CHECK-NEXT: [[MUL:%.*]] = call { i32, i1 } @llvm.umul.with.overflow.i32(i32 1, i32 [[TMP4]])			; CHECK-NEXT: [[MUL:%.*]] = call { i32, i1 } @llvm.umul.with.overflow.i32(i32 1, i32 [[TMP4]])
	▲ Show 20 Lines • Show All 118 Lines • Show Last 20 Lines

llvm/test/Transforms/LoopVectorize/ARM/sphinx.ll

	Show All 13 Lines
	@vv = external global float**			@vv = external global float**
	@ll = external global float*			@ll = external global float*

	define i32 @test(float* nocapture readonly %x) {			define i32 @test(float* nocapture readonly %x) {
	; CHECK-LABEL: @test(			; CHECK-LABEL: @test(
	; CHECK-NEXT: entry:			; CHECK-NEXT: entry:
	; CHECK-NEXT: [[T:%.]] = load i32, i32 @v, align 8			; CHECK-NEXT: [[T:%.]] = load i32, i32 @v, align 8
	; CHECK-NEXT: [[T1:%.]] = load i32, i32 @a, align 4			; CHECK-NEXT: [[T1:%.]] = load i32, i32 @a, align 4
	; CHECK-NEXT: br label [[TC_CHECK:%.*]]			; CHECK-NEXT: br label [[OUTERLOOP:%.*]]
	; CHECK: tc.check:			; CHECK: outerloop:
	; CHECK-NEXT: [[T2:%.]] = phi i32 [ [[V17:%.]], [[OUTEREND:%.]] ], [ [[T1]], [[ENTRY:%.]] ]			; CHECK-NEXT: [[T2:%.]] = phi i32 [ [[V17:%.]], [[OUTEREND:%.]] ], [ [[T1]], [[ENTRY:%.]] ]
	; CHECK-NEXT: [[J_0136:%.]] = phi i32 [ [[INC144:%.]], [[OUTEREND]] ], [ 0, [[ENTRY]] ]			; CHECK-NEXT: [[J_0136:%.]] = phi i32 [ [[INC144:%.]], [[OUTEREND]] ], [ 0, [[ENTRY]] ]
	; CHECK-NEXT: [[SCORE_1135:%.]] = phi i32 [ [[CALL142:%.]], [[OUTEREND]] ], [ -939524096, [[ENTRY]] ]			; CHECK-NEXT: [[SCORE_1135:%.]] = phi i32 [ [[CALL142:%.]], [[OUTEREND]] ], [ -939524096, [[ENTRY]] ]
	; CHECK-NEXT: [[T3:%.]] = load float, float** @mm, align 4			; CHECK-NEXT: [[T3:%.]] = load float, float** @mm, align 4
	; CHECK-NEXT: [[ARRAYIDX109:%.]] = getelementptr inbounds float, float** [[T3]], i32 [[T2]]			; CHECK-NEXT: [[ARRAYIDX109:%.]] = getelementptr inbounds float, float** [[T3]], i32 [[T2]]
	; CHECK-NEXT: [[T4:%.]] = load float, float** [[ARRAYIDX109]], align 4			; CHECK-NEXT: [[T4:%.]] = load float, float** [[ARRAYIDX109]], align 4
	; CHECK-NEXT: [[T5:%.]] = load float, float** @vv, align 4			; CHECK-NEXT: [[T5:%.]] = load float, float** @vv, align 4
	; CHECK-NEXT: [[ARRAYIDX111:%.]] = getelementptr inbounds float, float** [[T5]], i32 [[T2]]			; CHECK-NEXT: [[ARRAYIDX111:%.]] = getelementptr inbounds float, float** [[T5]], i32 [[T2]]
	; CHECK-NEXT: [[T6:%.]] = load float, float** [[ARRAYIDX111]], align 4			; CHECK-NEXT: [[T6:%.]] = load float, float** [[ARRAYIDX111]], align 4
	; CHECK-NEXT: [[T7:%.]] = load float, float** @ll, align 4			; CHECK-NEXT: [[T7:%.]] = load float, float** @ll, align 4
	; CHECK-NEXT: [[ARRAYIDX113:%.]] = getelementptr inbounds float, float [[T7]], i32 [[T2]]			; CHECK-NEXT: [[ARRAYIDX113:%.]] = getelementptr inbounds float, float [[T7]], i32 [[T2]]
	; CHECK-NEXT: [[T8:%.]] = load float, float [[ARRAYIDX113]], align 4			; CHECK-NEXT: [[T8:%.]] = load float, float [[ARRAYIDX113]], align 4
	; CHECK-NEXT: [[CONV114:%.*]] = fpext float [[T8]] to double			; CHECK-NEXT: [[CONV114:%.*]] = fpext float [[T8]] to double
				; CHECK-NEXT: br label [[TC_CHECK:%.*]]
				; CHECK: tc.check:
	; CHECK-NEXT: [[MIN_ITERS_CHECK:%.*]] = icmp ult i32 [[T]], 2			; CHECK-NEXT: [[MIN_ITERS_CHECK:%.*]] = icmp ult i32 [[T]], 2
	; CHECK-NEXT: br i1 [[MIN_ITERS_CHECK]], label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]			; CHECK-NEXT: br i1 [[MIN_ITERS_CHECK]], label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]
	; CHECK: vector.ph:			; CHECK: vector.ph:
	; CHECK-NEXT: [[N_MOD_VF:%.*]] = urem i32 [[T]], 2			; CHECK-NEXT: [[N_MOD_VF:%.*]] = urem i32 [[T]], 2
	; CHECK-NEXT: [[N_VEC:%.*]] = sub i32 [[T]], [[N_MOD_VF]]			; CHECK-NEXT: [[N_VEC:%.*]] = sub i32 [[T]], [[N_MOD_VF]]
	; CHECK-NEXT: [[TMP0:%.*]] = insertelement <2 x double> zeroinitializer, double [[CONV114]], i32 0			; CHECK-NEXT: [[TMP0:%.*]] = insertelement <2 x double> zeroinitializer, double [[CONV114]], i32 0
	; CHECK-NEXT: br label [[VECTOR_BODY:%.*]]			; CHECK-NEXT: br label [[VECTOR_BODY:%.*]]
	; CHECK: vector.body:			; CHECK: vector.body:
	▲ Show 20 Lines • Show All 55 Lines • ▼ Show 20 Lines
	; CHECK: outerend:			; CHECK: outerend:
	; CHECK-NEXT: [[SUB127_LCSSA:%.*]] = phi double [ [[SUB127]], [[INNERLOOP]] ], [ [[TMP18]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[SUB127_LCSSA:%.*]] = phi double [ [[SUB127]], [[INNERLOOP]] ], [ [[TMP18]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: [[CONV138:%.*]] = fptosi double [[SUB127_LCSSA]] to i32			; CHECK-NEXT: [[CONV138:%.*]] = fptosi double [[SUB127_LCSSA]] to i32
	; CHECK-NEXT: [[CALL142]] = add nuw nsw i32 [[SCORE_1135]], [[CONV138]]			; CHECK-NEXT: [[CALL142]] = add nuw nsw i32 [[SCORE_1135]], [[CONV138]]
	; CHECK-NEXT: [[INC144]] = add nuw nsw i32 [[J_0136]], 1			; CHECK-NEXT: [[INC144]] = add nuw nsw i32 [[J_0136]], 1
	; CHECK-NEXT: [[ARRAYIDX102:%.]] = getelementptr inbounds i32, i32 @a, i32 [[INC144]]			; CHECK-NEXT: [[ARRAYIDX102:%.]] = getelementptr inbounds i32, i32 @a, i32 [[INC144]]
	; CHECK-NEXT: [[V17]] = load i32, i32* [[ARRAYIDX102]], align 4			; CHECK-NEXT: [[V17]] = load i32, i32* [[ARRAYIDX102]], align 4
	; CHECK-NEXT: [[CMP103:%.*]] = icmp sgt i32 [[V17]], -1			; CHECK-NEXT: [[CMP103:%.*]] = icmp sgt i32 [[V17]], -1
	; CHECK-NEXT: br i1 [[CMP103]], label [[TC_CHECK]], label [[EXIT:%.*]]			; CHECK-NEXT: br i1 [[CMP103]], label [[OUTERLOOP]], label [[EXIT:%.*]]
	; CHECK: exit:			; CHECK: exit:
	; CHECK-NEXT: ret i32 [[CALL142]]			; CHECK-NEXT: ret i32 [[CALL142]]
	;			;
	entry:			entry:
	%t = load i32, i32* @v, align 8			%t = load i32, i32* @v, align 8
	%t1 = load i32, i32* @a, align 4			%t1 = load i32, i32* @a, align 4
	br label %outerloop			br label %outerloop

	▲ Show 20 Lines • Show All 49 Lines • Show Last 20 Lines

llvm/test/Transforms/LoopVectorize/X86/illegal-parallel-loop-uniform-write.ll

	Show All 23 Lines
	; CHECK-NEXT: entry:			; CHECK-NEXT: entry:
	; CHECK-NEXT: [[CMP27:%.]] = icmp sgt i32 [[M:%.]], 0			; CHECK-NEXT: [[CMP27:%.]] = icmp sgt i32 [[M:%.]], 0
	; CHECK-NEXT: br i1 [[CMP27]], label [[FOR_BODY3_LR_PH_US_PREHEADER:%.]], label [[FOR_END15:%.]]			; CHECK-NEXT: br i1 [[CMP27]], label [[FOR_BODY3_LR_PH_US_PREHEADER:%.]], label [[FOR_END15:%.]]
	; CHECK: for.body3.lr.ph.us.preheader:			; CHECK: for.body3.lr.ph.us.preheader:
	; CHECK-NEXT: [[TMP0:%.*]] = add i32 [[M]], -1			; CHECK-NEXT: [[TMP0:%.*]] = add i32 [[M]], -1
	; CHECK-NEXT: [[TMP1:%.*]] = zext i32 [[TMP0]] to i64			; CHECK-NEXT: [[TMP1:%.*]] = zext i32 [[TMP0]] to i64
	; CHECK-NEXT: [[TMP2:%.*]] = add nuw nsw i64 [[TMP1]], 1			; CHECK-NEXT: [[TMP2:%.*]] = add nuw nsw i64 [[TMP1]], 1
	; CHECK-NEXT: [[TMP3:%.]] = zext i32 [[K:%.]] to i64			; CHECK-NEXT: [[TMP3:%.]] = zext i32 [[K:%.]] to i64
	; CHECK-NEXT: br label [[TC_CHECK:%.*]]			; CHECK-NEXT: br label [[FOR_BODY3_LR_PH_US:%.*]]
	; CHECK: for.end.us:			; CHECK: for.end.us:
	; CHECK-NEXT: [[ARRAYIDX9_US:%.]] = getelementptr inbounds i32, i32 [[B:%.]], i64 [[INDVARS_IV33:%.]]			; CHECK-NEXT: [[ARRAYIDX9_US:%.]] = getelementptr inbounds i32, i32 [[B:%.]], i64 [[INDVARS_IV33:%.]]
	; CHECK-NEXT: [[TMP4:%.]] = load i32, i32 [[ARRAYIDX9_US]], align 4, !llvm.mem.parallel_loop_access !0			; CHECK-NEXT: [[TMP4:%.]] = load i32, i32 [[ARRAYIDX9_US]], align 4, !llvm.mem.parallel_loop_access !0
	; CHECK-NEXT: [[ADD10_US:%.*]] = add nsw i32 [[TMP4]], 3			; CHECK-NEXT: [[ADD10_US:%.*]] = add nsw i32 [[TMP4]], 3
	; CHECK-NEXT: store i32 [[ADD10_US]], i32* [[ARRAYIDX9_US]], align 4, !llvm.mem.parallel_loop_access !0			; CHECK-NEXT: store i32 [[ADD10_US]], i32* [[ARRAYIDX9_US]], align 4, !llvm.mem.parallel_loop_access !0
	; CHECK-NEXT: [[INDVARS_IV_NEXT34:%.*]] = add i64 [[INDVARS_IV33]], 1			; CHECK-NEXT: [[INDVARS_IV_NEXT34:%.*]] = add i64 [[INDVARS_IV33]], 1
	; CHECK-NEXT: [[LFTR_WIDEIV35:%.*]] = trunc i64 [[INDVARS_IV_NEXT34]] to i32			; CHECK-NEXT: [[LFTR_WIDEIV35:%.*]] = trunc i64 [[INDVARS_IV_NEXT34]] to i32
	; CHECK-NEXT: [[EXITCOND36:%.*]] = icmp eq i32 [[LFTR_WIDEIV35]], [[M]]			; CHECK-NEXT: [[EXITCOND36:%.*]] = icmp eq i32 [[LFTR_WIDEIV35]], [[M]]
	; CHECK-NEXT: br i1 [[EXITCOND36]], label [[FOR_END15_LOOPEXIT:%.*]], label [[TC_CHECK]], !llvm.loop !2			; CHECK-NEXT: br i1 [[EXITCOND36]], label [[FOR_END15_LOOPEXIT:%.*]], label [[FOR_BODY3_LR_PH_US]], !llvm.loop !2
	; CHECK: for.body3.us:			; CHECK: for.body3.us:
	; CHECK-NEXT: [[INDVARS_IV29:%.]] = phi i64 [ [[BC_RESUME_VAL:%.]], [[SCALAR_PH:%.]] ], [ [[INDVARS_IV_NEXT30:%.]], [[FOR_BODY3_US:%.*]] ]			; CHECK-NEXT: [[INDVARS_IV29:%.]] = phi i64 [ [[BC_RESUME_VAL:%.]], [[SCALAR_PH:%.]] ], [ [[INDVARS_IV_NEXT30:%.]], [[FOR_BODY3_US:%.*]] ]
	; CHECK-NEXT: [[TMP5:%.*]] = trunc i64 [[INDVARS_IV29]] to i32			; CHECK-NEXT: [[TMP5:%.*]] = trunc i64 [[INDVARS_IV29]] to i32
	; CHECK-NEXT: [[ADD4_US:%.]] = add i32 [[ADD_US:%.]], [[TMP5]]			; CHECK-NEXT: [[ADD4_US:%.]] = add i32 [[ADD_US:%.]], [[TMP5]]
	; CHECK-NEXT: [[IDXPROM_US:%.*]] = sext i32 [[ADD4_US]] to i64			; CHECK-NEXT: [[IDXPROM_US:%.*]] = sext i32 [[ADD4_US]] to i64
	; CHECK-NEXT: [[ARRAYIDX_US:%.]] = getelementptr inbounds i32, i32 [[A:%.*]], i64 [[IDXPROM_US]]			; CHECK-NEXT: [[ARRAYIDX_US:%.]] = getelementptr inbounds i32, i32 [[A:%.*]], i64 [[IDXPROM_US]]
	; CHECK-NEXT: [[TMP6:%.]] = load i32, i32 [[ARRAYIDX_US]], align 4, !llvm.mem.parallel_loop_access !0			; CHECK-NEXT: [[TMP6:%.]] = load i32, i32 [[ARRAYIDX_US]], align 4, !llvm.mem.parallel_loop_access !0
	; CHECK-NEXT: [[ADD5_US:%.*]] = add nsw i32 [[TMP6]], 1			; CHECK-NEXT: [[ADD5_US:%.*]] = add nsw i32 [[TMP6]], 1
	; CHECK-NEXT: store i32 [[ADD5_US]], i32* [[ARRAYIDX7_US:%.*]], align 4, !llvm.mem.parallel_loop_access !0			; CHECK-NEXT: store i32 [[ADD5_US]], i32* [[ARRAYIDX7_US:%.*]], align 4, !llvm.mem.parallel_loop_access !0
	; CHECK-NEXT: [[INDVARS_IV_NEXT30]] = add i64 [[INDVARS_IV29]], 1			; CHECK-NEXT: [[INDVARS_IV_NEXT30]] = add i64 [[INDVARS_IV29]], 1
	; CHECK-NEXT: [[LFTR_WIDEIV31:%.*]] = trunc i64 [[INDVARS_IV_NEXT30]] to i32			; CHECK-NEXT: [[LFTR_WIDEIV31:%.*]] = trunc i64 [[INDVARS_IV_NEXT30]] to i32
	; CHECK-NEXT: [[EXITCOND32:%.*]] = icmp eq i32 [[LFTR_WIDEIV31]], [[M]]			; CHECK-NEXT: [[EXITCOND32:%.*]] = icmp eq i32 [[LFTR_WIDEIV31]], [[M]]
	; CHECK-NEXT: br i1 [[EXITCOND32]], label [[FOR_END_US:%.*]], label [[FOR_BODY3_US]], !llvm.loop !3			; CHECK-NEXT: br i1 [[EXITCOND32]], label [[FOR_END_US:%.*]], label [[FOR_BODY3_US]], !llvm.loop !3
	; CHECK: tc.check:			; CHECK: for.body3.lr.ph.us:
	; CHECK-NEXT: [[INDVARS_IV33]] = phi i64 [ [[INDVARS_IV_NEXT34]], [[FOR_END_US]] ], [ 0, [[FOR_BODY3_LR_PH_US_PREHEADER]] ]			; CHECK-NEXT: [[INDVARS_IV33]] = phi i64 [ [[INDVARS_IV_NEXT34]], [[FOR_END_US]] ], [ 0, [[FOR_BODY3_LR_PH_US_PREHEADER]] ]
	; CHECK-NEXT: [[TMP7:%.*]] = add i64 [[TMP3]], [[INDVARS_IV33]]			; CHECK-NEXT: [[TMP7:%.*]] = add i64 [[TMP3]], [[INDVARS_IV33]]
	; CHECK-NEXT: [[TMP8:%.*]] = trunc i64 [[TMP7]] to i32			; CHECK-NEXT: [[TMP8:%.*]] = trunc i64 [[TMP7]] to i32
	; CHECK-NEXT: [[TMP9:%.*]] = trunc i64 [[INDVARS_IV33]] to i32			; CHECK-NEXT: [[TMP9:%.*]] = trunc i64 [[INDVARS_IV33]] to i32
	; CHECK-NEXT: [[ADD_US]] = add i32 [[TMP9]], [[K]]			; CHECK-NEXT: [[ADD_US]] = add i32 [[TMP9]], [[K]]
	; CHECK-NEXT: [[ARRAYIDX7_US]] = getelementptr inbounds i32, i32* [[A]], i64 [[INDVARS_IV33]]			; CHECK-NEXT: [[ARRAYIDX7_US]] = getelementptr inbounds i32, i32* [[A]], i64 [[INDVARS_IV33]]
				; CHECK-NEXT: br label [[TC_CHECK:%.*]]
				; CHECK: tc.check:
	; CHECK-NEXT: [[MIN_ITERS_CHECK:%.*]] = icmp ult i64 [[TMP2]], 4			; CHECK-NEXT: [[MIN_ITERS_CHECK:%.*]] = icmp ult i64 [[TMP2]], 4
	; CHECK-NEXT: br i1 [[MIN_ITERS_CHECK]], label [[SCALAR_PH]], label [[VECTOR_SCEVCHECK:%.*]]			; CHECK-NEXT: br i1 [[MIN_ITERS_CHECK]], label [[SCALAR_PH]], label [[VECTOR_SCEVCHECK:%.*]]
	; CHECK: vector.scevcheck:			; CHECK: vector.scevcheck:
	; CHECK-NEXT: [[MUL:%.*]] = call { i32, i1 } @llvm.umul.with.overflow.i32(i32 1, i32 [[TMP0]])			; CHECK-NEXT: [[MUL:%.*]] = call { i32, i1 } @llvm.umul.with.overflow.i32(i32 1, i32 [[TMP0]])
	; CHECK-NEXT: [[MUL_RESULT:%.*]] = extractvalue { i32, i1 } [[MUL]], 0			; CHECK-NEXT: [[MUL_RESULT:%.*]] = extractvalue { i32, i1 } [[MUL]], 0
	; CHECK-NEXT: [[MUL_OVERFLOW:%.*]] = extractvalue { i32, i1 } [[MUL]], 1			; CHECK-NEXT: [[MUL_OVERFLOW:%.*]] = extractvalue { i32, i1 } [[MUL]], 1
	; CHECK-NEXT: [[TMP10:%.*]] = add i32 [[TMP8]], [[MUL_RESULT]]			; CHECK-NEXT: [[TMP10:%.*]] = add i32 [[TMP8]], [[MUL_RESULT]]
	; CHECK-NEXT: [[TMP11:%.*]] = sub i32 [[TMP8]], [[MUL_RESULT]]			; CHECK-NEXT: [[TMP11:%.*]] = sub i32 [[TMP8]], [[MUL_RESULT]]
	▲ Show 20 Lines • Show All 171 Lines • Show Last 20 Lines

llvm/test/Transforms/LoopVectorize/X86/invariant-load-gather.ll

	; NOTE: Assertions have been autogenerated by utils/update_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_test_checks.py
	; RUN: opt -loop-vectorize -S -mattr=avx512f -instcombine < %s \| FileCheck %s			; RUN: opt -loop-vectorize -S -mattr=avx512f -instcombine < %s \| FileCheck %s

	target datalayout = "e-m:e-i64:64-f80:128-n8:16:32:64-S128"			target datalayout = "e-m:e-i64:64-f80:128-n8:16:32:64-S128"
	target triple = "x86_64-unknown-linux-gnu"			target triple = "x86_64-unknown-linux-gnu"

	define i32 @inv_load_conditional(i32* %a, i64 %n, i32* %b, i32 %k) {			define i32 @inv_load_conditional(i32* %a, i64 %n, i32* %b, i32 %k) {
	; CHECK-LABEL: @inv_load_conditional(			; CHECK-LABEL: @inv_load_conditional(
	; CHECK-NEXT: tc.check:			; CHECK-NEXT: entry:
				; CHECK-NEXT: [[B1:%.]] = bitcast i32 [[B:%.]] to i8
				; CHECK-NEXT: [[A4:%.]] = bitcast i32 [[A:%.]] to i8
	; CHECK-NEXT: [[NTRUNC:%.]] = trunc i64 [[N:%.]] to i32			; CHECK-NEXT: [[NTRUNC:%.]] = trunc i64 [[N:%.]] to i32
				; CHECK-NEXT: br label [[TC_CHECK:%.*]]
				; CHECK: tc.check:
	; CHECK-NEXT: [[TMP0:%.*]] = icmp sgt i64 [[N]], 1			; CHECK-NEXT: [[TMP0:%.*]] = icmp sgt i64 [[N]], 1
	; CHECK-NEXT: [[SMAX:%.*]] = select i1 [[TMP0]], i64 [[N]], i64 1			; CHECK-NEXT: [[SMAX:%.*]] = select i1 [[TMP0]], i64 [[N]], i64 1
	; CHECK-NEXT: [[MIN_ITERS_CHECK:%.*]] = icmp ult i64 [[SMAX]], 16			; CHECK-NEXT: [[MIN_ITERS_CHECK:%.*]] = icmp ult i64 [[SMAX]], 16
	; CHECK-NEXT: br i1 [[MIN_ITERS_CHECK]], label [[SCALAR_PH:%.]], label [[VECTOR_MEMCHECK:%.]]			; CHECK-NEXT: br i1 [[MIN_ITERS_CHECK]], label [[SCALAR_PH:%.]], label [[VECTOR_MEMCHECK:%.]]
	; CHECK: vector.memcheck:			; CHECK: vector.memcheck:
	; CHECK-NEXT: [[A4:%.]] = bitcast i32 [[A:%.]] to i8
	; CHECK-NEXT: [[B1:%.]] = bitcast i32 [[B:%.]] to i8
	; CHECK-NEXT: [[TMP1:%.*]] = icmp sgt i64 [[N]], 1			; CHECK-NEXT: [[TMP1:%.*]] = icmp sgt i64 [[N]], 1
	; CHECK-NEXT: [[SMAX2:%.*]] = select i1 [[TMP1]], i64 [[N]], i64 1			; CHECK-NEXT: [[SMAX2:%.*]] = select i1 [[TMP1]], i64 [[N]], i64 1
	; CHECK-NEXT: [[SCEVGEP:%.]] = getelementptr i32, i32 [[B]], i64 [[SMAX2]]			; CHECK-NEXT: [[SCEVGEP:%.]] = getelementptr i32, i32 [[B]], i64 [[SMAX2]]
	; CHECK-NEXT: [[UGLYGEP:%.]] = getelementptr i8, i8 [[A4]], i64 1			; CHECK-NEXT: [[UGLYGEP:%.]] = getelementptr i8, i8 [[A4]], i64 1
	; CHECK-NEXT: [[BOUND0:%.]] = icmp ugt i8 [[UGLYGEP]], [[B1]]			; CHECK-NEXT: [[BOUND0:%.]] = icmp ugt i8 [[UGLYGEP]], [[B1]]
	; CHECK-NEXT: [[BOUND1:%.]] = icmp ugt i32 [[SCEVGEP]], [[A]]			; CHECK-NEXT: [[BOUND1:%.]] = icmp ugt i32 [[SCEVGEP]], [[A]]
	; CHECK-NEXT: [[FOUND_CONFLICT:%.*]] = and i1 [[BOUND0]], [[BOUND1]]			; CHECK-NEXT: [[FOUND_CONFLICT:%.*]] = and i1 [[BOUND0]], [[BOUND1]]
	; CHECK-NEXT: br i1 [[FOUND_CONFLICT]], label [[SCALAR_PH]], label [[VECTOR_PH:%.*]]			; CHECK-NEXT: br i1 [[FOUND_CONFLICT]], label [[SCALAR_PH]], label [[VECTOR_PH:%.*]]
	Show All 15 Lines
	; CHECK-NEXT: br i1 [[TMP5]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop !5			; CHECK-NEXT: br i1 [[TMP5]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop !5
	; CHECK: middle.block:			; CHECK: middle.block:
	; CHECK-NEXT: [[WIDE_MASKED_GATHER:%.]] = call <16 x i32> @llvm.masked.gather.v16i32.v16p0i32(<16 x i32> [[BROADCAST_SPLAT6]], i32 4, <16 x i1> [[TMP3]], <16 x i32> undef), !alias.scope !3			; CHECK-NEXT: [[WIDE_MASKED_GATHER:%.]] = call <16 x i32> @llvm.masked.gather.v16i32.v16p0i32(<16 x i32> [[BROADCAST_SPLAT6]], i32 4, <16 x i1> [[TMP3]], <16 x i32> undef), !alias.scope !3
	; CHECK-NEXT: [[PREDPHI:%.*]] = select <16 x i1> [[TMP3]], <16 x i32> [[WIDE_MASKED_GATHER]], <16 x i32> <i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 1>			; CHECK-NEXT: [[PREDPHI:%.*]] = select <16 x i1> [[TMP3]], <16 x i32> [[WIDE_MASKED_GATHER]], <16 x i32> <i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 1>
	; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i64 [[SMAX]], [[N_VEC]]			; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i64 [[SMAX]], [[N_VEC]]
	; CHECK-NEXT: [[TMP6:%.*]] = extractelement <16 x i32> [[PREDPHI]], i32 15			; CHECK-NEXT: [[TMP6:%.*]] = extractelement <16 x i32> [[PREDPHI]], i32 15
	; CHECK-NEXT: br i1 [[CMP_N]], label [[FOR_END:%.*]], label [[SCALAR_PH]]			; CHECK-NEXT: br i1 [[CMP_N]], label [[FOR_END:%.*]], label [[SCALAR_PH]]
	; CHECK: scalar.ph:			; CHECK: scalar.ph:
	; CHECK-NEXT: [[BC_RESUME_VAL:%.]] = phi i64 [ [[N_VEC]], [[MIDDLE_BLOCK]] ], [ 0, [[TC_CHECK:%.]] ], [ 0, [[VECTOR_MEMCHECK]] ]			; CHECK-NEXT: [[BC_RESUME_VAL:%.*]] = phi i64 [ [[N_VEC]], [[MIDDLE_BLOCK]] ], [ 0, [[TC_CHECK]] ], [ 0, [[VECTOR_MEMCHECK]] ]
	; CHECK-NEXT: br label [[FOR_BODY:%.*]]			; CHECK-NEXT: br label [[FOR_BODY:%.*]]
	; CHECK: for.body:			; CHECK: for.body:
	; CHECK-NEXT: [[I:%.]] = phi i64 [ [[I_NEXT:%.]], [[LATCH:%.*]] ], [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ]			; CHECK-NEXT: [[I:%.]] = phi i64 [ [[I_NEXT:%.]], [[LATCH:%.*]] ], [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ]
	; CHECK-NEXT: [[TMP1:%.]] = getelementptr inbounds i32, i32 [[B]], i64 [[I]]			; CHECK-NEXT: [[TMP1:%.]] = getelementptr inbounds i32, i32 [[B]], i64 [[I]]
	; CHECK-NEXT: [[CMP:%.]] = icmp eq i32 [[A]], null			; CHECK-NEXT: [[CMP:%.]] = icmp eq i32 [[A]], null
	; CHECK-NEXT: store i32 [[NTRUNC]], i32* [[TMP1]], align 4			; CHECK-NEXT: store i32 [[NTRUNC]], i32* [[TMP1]], align 4
	; CHECK-NEXT: br i1 [[CMP]], label [[LATCH]], label [[COND_LOAD:%.*]]			; CHECK-NEXT: br i1 [[CMP]], label [[LATCH]], label [[COND_LOAD:%.*]]
	; CHECK: cond_load:			; CHECK: cond_load:
	Show All 36 Lines

llvm/test/Transforms/LoopVectorize/X86/invariant-store-vectorization.ll

Show All 39 Lines	for.end: ; preds = %for.body
%tmp4 = phi i32 [ %tmp3, %for.body ]		%tmp4 = phi i32 [ %tmp3, %for.body ]
ret i32 %tmp4		ret i32 %tmp4
}		}

; Conditional store		; Conditional store
; if (b[i] == k) a = ntrunc		; if (b[i] == k) a = ntrunc
define void @inv_val_store_to_inv_address_conditional(i32* %a, i64 %n, i32* %b, i32 %k) {		define void @inv_val_store_to_inv_address_conditional(i32* %a, i64 %n, i32* %b, i32 %k) {
; CHECK-LABEL: @inv_val_store_to_inv_address_conditional(		; CHECK-LABEL: @inv_val_store_to_inv_address_conditional(
; CHECK-NEXT: tc.check:		; CHECK-NEXT: entry:
		; CHECK-NEXT: [[B1:%.]] = bitcast i32 [[B:%.]] to i8
		; CHECK-NEXT: [[A4:%.]] = bitcast i32 [[A:%.]] to i8
; CHECK-NEXT: [[NTRUNC:%.]] = trunc i64 [[N:%.]] to i32		; CHECK-NEXT: [[NTRUNC:%.]] = trunc i64 [[N:%.]] to i32
		; CHECK-NEXT: br label [[TC_CHECK:%.*]]
		; CHECK: tc.check:
; CHECK-NEXT: [[TMP0:%.*]] = icmp sgt i64 [[N]], 1		; CHECK-NEXT: [[TMP0:%.*]] = icmp sgt i64 [[N]], 1
; CHECK-NEXT: [[SMAX:%.*]] = select i1 [[TMP0]], i64 [[N]], i64 1		; CHECK-NEXT: [[SMAX:%.*]] = select i1 [[TMP0]], i64 [[N]], i64 1
; CHECK-NEXT: [[MIN_ITERS_CHECK:%.*]] = icmp ult i64 [[SMAX]], 16		; CHECK-NEXT: [[MIN_ITERS_CHECK:%.*]] = icmp ult i64 [[SMAX]], 16
; CHECK-NEXT: br i1 [[MIN_ITERS_CHECK]], label [[SCALAR_PH:%.]], label [[VECTOR_MEMCHECK:%.]]		; CHECK-NEXT: br i1 [[MIN_ITERS_CHECK]], label [[SCALAR_PH:%.]], label [[VECTOR_MEMCHECK:%.]]
; CHECK: vector.memcheck:		; CHECK: vector.memcheck:
; CHECK-NEXT: [[A4:%.]] = bitcast i32 [[A:%.]] to i8
; CHECK-NEXT: [[B1:%.]] = bitcast i32 [[B:%.]] to i8
; CHECK-NEXT: [[TMP1:%.*]] = icmp sgt i64 [[N]], 1		; CHECK-NEXT: [[TMP1:%.*]] = icmp sgt i64 [[N]], 1
; CHECK-NEXT: [[SMAX2:%.*]] = select i1 [[TMP1]], i64 [[N]], i64 1		; CHECK-NEXT: [[SMAX2:%.*]] = select i1 [[TMP1]], i64 [[N]], i64 1
; CHECK-NEXT: [[SCEVGEP:%.]] = getelementptr i32, i32 [[B]], i64 [[SMAX2]]		; CHECK-NEXT: [[SCEVGEP:%.]] = getelementptr i32, i32 [[B]], i64 [[SMAX2]]
; CHECK-NEXT: [[UGLYGEP:%.]] = getelementptr i8, i8 [[A4]], i64 1		; CHECK-NEXT: [[UGLYGEP:%.]] = getelementptr i8, i8 [[A4]], i64 1
; CHECK-NEXT: [[BOUND0:%.]] = icmp ugt i8 [[UGLYGEP]], [[B1]]		; CHECK-NEXT: [[BOUND0:%.]] = icmp ugt i8 [[UGLYGEP]], [[B1]]
; CHECK-NEXT: [[BOUND1:%.]] = icmp ugt i32 [[SCEVGEP]], [[A]]		; CHECK-NEXT: [[BOUND1:%.]] = icmp ugt i32 [[SCEVGEP]], [[A]]
; CHECK-NEXT: [[FOUND_CONFLICT:%.*]] = and i1 [[BOUND0]], [[BOUND1]]		; CHECK-NEXT: [[FOUND_CONFLICT:%.*]] = and i1 [[BOUND0]], [[BOUND1]]
; CHECK-NEXT: br i1 [[FOUND_CONFLICT]], label [[SCALAR_PH]], label [[VECTOR_PH:%.*]]		; CHECK-NEXT: br i1 [[FOUND_CONFLICT]], label [[SCALAR_PH]], label [[VECTOR_PH:%.*]]
Show All 17 Lines
; CHECK-NEXT: call void @llvm.masked.scatter.v16i32.v16p0i32(<16 x i32> [[BROADCAST_SPLAT8]], <16 x i32*> [[BROADCAST_SPLAT10]], i32 4, <16 x i1> [[TMP4]]), !alias.scope !11		; CHECK-NEXT: call void @llvm.masked.scatter.v16i32.v16p0i32(<16 x i32> [[BROADCAST_SPLAT8]], <16 x i32*> [[BROADCAST_SPLAT10]], i32 4, <16 x i1> [[TMP4]]), !alias.scope !11
; CHECK-NEXT: [[INDEX_NEXT]] = add i64 [[INDEX]], 16		; CHECK-NEXT: [[INDEX_NEXT]] = add i64 [[INDEX]], 16
; CHECK-NEXT: [[TMP6:%.*]] = icmp eq i64 [[INDEX_NEXT]], [[N_VEC]]		; CHECK-NEXT: [[TMP6:%.*]] = icmp eq i64 [[INDEX_NEXT]], [[N_VEC]]
; CHECK-NEXT: br i1 [[TMP6]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop !13		; CHECK-NEXT: br i1 [[TMP6]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop !13
; CHECK: middle.block:		; CHECK: middle.block:
; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i64 [[SMAX]], [[N_VEC]]		; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i64 [[SMAX]], [[N_VEC]]
; CHECK-NEXT: br i1 [[CMP_N]], label [[FOR_END:%.*]], label [[SCALAR_PH]]		; CHECK-NEXT: br i1 [[CMP_N]], label [[FOR_END:%.*]], label [[SCALAR_PH]]
; CHECK: scalar.ph:		; CHECK: scalar.ph:
; CHECK-NEXT: [[BC_RESUME_VAL:%.]] = phi i64 [ [[N_VEC]], [[MIDDLE_BLOCK]] ], [ 0, [[TC_CHECK:%.]] ], [ 0, [[VECTOR_MEMCHECK]] ]		; CHECK-NEXT: [[BC_RESUME_VAL:%.*]] = phi i64 [ [[N_VEC]], [[MIDDLE_BLOCK]] ], [ 0, [[TC_CHECK]] ], [ 0, [[VECTOR_MEMCHECK]] ]
; CHECK-NEXT: br label [[FOR_BODY:%.*]]		; CHECK-NEXT: br label [[FOR_BODY:%.*]]
; CHECK: for.body:		; CHECK: for.body:
; CHECK-NEXT: [[I:%.]] = phi i64 [ [[I_NEXT:%.]], [[LATCH:%.*]] ], [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ]		; CHECK-NEXT: [[I:%.]] = phi i64 [ [[I_NEXT:%.]], [[LATCH:%.*]] ], [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ]
; CHECK-NEXT: [[TMP1:%.]] = getelementptr inbounds i32, i32 [[B]], i64 [[I]]		; CHECK-NEXT: [[TMP1:%.]] = getelementptr inbounds i32, i32 [[B]], i64 [[I]]
; CHECK-NEXT: [[TMP2:%.]] = load i32, i32 [[TMP1]], align 8		; CHECK-NEXT: [[TMP2:%.]] = load i32, i32 [[TMP1]], align 8
; CHECK-NEXT: [[CMP:%.*]] = icmp eq i32 [[TMP2]], [[K]]		; CHECK-NEXT: [[CMP:%.*]] = icmp eq i32 [[TMP2]], [[K]]
; CHECK-NEXT: store i32 [[NTRUNC]], i32* [[TMP1]], align 4		; CHECK-NEXT: store i32 [[NTRUNC]], i32* [[TMP1]], align 4
; CHECK-NEXT: br i1 [[CMP]], label [[COND_STORE:%.*]], label [[LATCH]]		; CHECK-NEXT: br i1 [[CMP]], label [[COND_STORE:%.*]], label [[LATCH]]
Show All 29 Lines	latch:
br i1 %cond, label %for.body, label %for.end		br i1 %cond, label %for.body, label %for.end

for.end: ; preds = %for.body		for.end: ; preds = %for.body
ret void		ret void
}		}

define void @variant_val_store_to_inv_address_conditional(i32* %a, i64 %n, i32* %b, i32* %c, i32 %k) {		define void @variant_val_store_to_inv_address_conditional(i32* %a, i64 %n, i32* %b, i32* %c, i32 %k) {
; CHECK-LABEL: @variant_val_store_to_inv_address_conditional(		; CHECK-LABEL: @variant_val_store_to_inv_address_conditional(
; CHECK-NEXT: tc.check:		; CHECK-NEXT: entry:
		; CHECK-NEXT: [[B1:%.]] = bitcast i32 [[B:%.]] to i8
		; CHECK-NEXT: [[A4:%.]] = bitcast i32 [[A:%.]] to i8
		; CHECK-NEXT: [[C5:%.]] = bitcast i32 [[C:%.]] to i8
; CHECK-NEXT: [[NTRUNC:%.]] = trunc i64 [[N:%.]] to i32		; CHECK-NEXT: [[NTRUNC:%.]] = trunc i64 [[N:%.]] to i32
		; CHECK-NEXT: br label [[TC_CHECK:%.*]]
		; CHECK: tc.check:
; CHECK-NEXT: [[TMP0:%.*]] = icmp sgt i64 [[N]], 1		; CHECK-NEXT: [[TMP0:%.*]] = icmp sgt i64 [[N]], 1
; CHECK-NEXT: [[SMAX:%.*]] = select i1 [[TMP0]], i64 [[N]], i64 1		; CHECK-NEXT: [[SMAX:%.*]] = select i1 [[TMP0]], i64 [[N]], i64 1
; CHECK-NEXT: [[MIN_ITERS_CHECK:%.*]] = icmp ult i64 [[SMAX]], 16		; CHECK-NEXT: [[MIN_ITERS_CHECK:%.*]] = icmp ult i64 [[SMAX]], 16
; CHECK-NEXT: br i1 [[MIN_ITERS_CHECK]], label [[SCALAR_PH:%.]], label [[VECTOR_MEMCHECK:%.]]		; CHECK-NEXT: br i1 [[MIN_ITERS_CHECK]], label [[SCALAR_PH:%.]], label [[VECTOR_MEMCHECK:%.]]
; CHECK: vector.memcheck:		; CHECK: vector.memcheck:
; CHECK-NEXT: [[C5:%.]] = bitcast i32 [[C:%.]] to i8
; CHECK-NEXT: [[B1:%.]] = bitcast i32 [[B:%.]] to i8
; CHECK-NEXT: [[A4:%.]] = bitcast i32 [[A:%.]] to i8
; CHECK-NEXT: [[TMP1:%.*]] = icmp sgt i64 [[N]], 1		; CHECK-NEXT: [[TMP1:%.*]] = icmp sgt i64 [[N]], 1
; CHECK-NEXT: [[SMAX2:%.*]] = select i1 [[TMP1]], i64 [[N]], i64 1		; CHECK-NEXT: [[SMAX2:%.*]] = select i1 [[TMP1]], i64 [[N]], i64 1
; CHECK-NEXT: [[SCEVGEP:%.]] = getelementptr i32, i32 [[B]], i64 [[SMAX2]]		; CHECK-NEXT: [[SCEVGEP:%.]] = getelementptr i32, i32 [[B]], i64 [[SMAX2]]
; CHECK-NEXT: [[UGLYGEP:%.]] = getelementptr i8, i8 [[A4]], i64 1		; CHECK-NEXT: [[UGLYGEP:%.]] = getelementptr i8, i8 [[A4]], i64 1
; CHECK-NEXT: [[SCEVGEP6:%.]] = getelementptr i32, i32 [[C]], i64 [[SMAX2]]		; CHECK-NEXT: [[SCEVGEP6:%.]] = getelementptr i32, i32 [[C]], i64 [[SMAX2]]
; CHECK-NEXT: [[BOUND0:%.]] = icmp ugt i8 [[UGLYGEP]], [[B1]]		; CHECK-NEXT: [[BOUND0:%.]] = icmp ugt i8 [[UGLYGEP]], [[B1]]
; CHECK-NEXT: [[BOUND1:%.]] = icmp ugt i32 [[SCEVGEP]], [[A]]		; CHECK-NEXT: [[BOUND1:%.]] = icmp ugt i32 [[SCEVGEP]], [[A]]
; CHECK-NEXT: [[FOUND_CONFLICT:%.*]] = and i1 [[BOUND0]], [[BOUND1]]		; CHECK-NEXT: [[FOUND_CONFLICT:%.*]] = and i1 [[BOUND0]], [[BOUND1]]
Show All 29 Lines
; CHECK-NEXT: call void @llvm.masked.scatter.v16i32.v16p0i32(<16 x i32> [[WIDE_MASKED_LOAD]], <16 x i32*> [[BROADCAST_SPLAT21]], i32 4, <16 x i1> [[TMP4]]), !alias.scope !22, !noalias !21		; CHECK-NEXT: call void @llvm.masked.scatter.v16i32.v16p0i32(<16 x i32> [[WIDE_MASKED_LOAD]], <16 x i32*> [[BROADCAST_SPLAT21]], i32 4, <16 x i1> [[TMP4]]), !alias.scope !22, !noalias !21
; CHECK-NEXT: [[INDEX_NEXT]] = add i64 [[INDEX]], 16		; CHECK-NEXT: [[INDEX_NEXT]] = add i64 [[INDEX]], 16
; CHECK-NEXT: [[TMP8:%.*]] = icmp eq i64 [[INDEX_NEXT]], [[N_VEC]]		; CHECK-NEXT: [[TMP8:%.*]] = icmp eq i64 [[INDEX_NEXT]], [[N_VEC]]
; CHECK-NEXT: br i1 [[TMP8]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop !23		; CHECK-NEXT: br i1 [[TMP8]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop !23
; CHECK: middle.block:		; CHECK: middle.block:
; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i64 [[SMAX]], [[N_VEC]]		; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i64 [[SMAX]], [[N_VEC]]
; CHECK-NEXT: br i1 [[CMP_N]], label [[FOR_END:%.*]], label [[SCALAR_PH]]		; CHECK-NEXT: br i1 [[CMP_N]], label [[FOR_END:%.*]], label [[SCALAR_PH]]
; CHECK: scalar.ph:		; CHECK: scalar.ph:
; CHECK-NEXT: [[BC_RESUME_VAL:%.]] = phi i64 [ [[N_VEC]], [[MIDDLE_BLOCK]] ], [ 0, [[TC_CHECK:%.]] ], [ 0, [[VECTOR_MEMCHECK]] ]		; CHECK-NEXT: [[BC_RESUME_VAL:%.*]] = phi i64 [ [[N_VEC]], [[MIDDLE_BLOCK]] ], [ 0, [[TC_CHECK]] ], [ 0, [[VECTOR_MEMCHECK]] ]
; CHECK-NEXT: br label [[FOR_BODY:%.*]]		; CHECK-NEXT: br label [[FOR_BODY:%.*]]
; CHECK: for.body:		; CHECK: for.body:
; CHECK-NEXT: [[I:%.]] = phi i64 [ [[I_NEXT:%.]], [[LATCH:%.*]] ], [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ]		; CHECK-NEXT: [[I:%.]] = phi i64 [ [[I_NEXT:%.]], [[LATCH:%.*]] ], [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ]
; CHECK-NEXT: [[TMP1:%.]] = getelementptr inbounds i32, i32 [[B]], i64 [[I]]		; CHECK-NEXT: [[TMP1:%.]] = getelementptr inbounds i32, i32 [[B]], i64 [[I]]
; CHECK-NEXT: [[TMP2:%.]] = load i32, i32 [[TMP1]], align 8		; CHECK-NEXT: [[TMP2:%.]] = load i32, i32 [[TMP1]], align 8
; CHECK-NEXT: [[CMP:%.*]] = icmp eq i32 [[TMP2]], [[K]]		; CHECK-NEXT: [[CMP:%.*]] = icmp eq i32 [[TMP2]], [[K]]
; CHECK-NEXT: store i32 [[NTRUNC]], i32* [[TMP1]], align 4		; CHECK-NEXT: store i32 [[NTRUNC]], i32* [[TMP1]], align 4
; CHECK-NEXT: br i1 [[CMP]], label [[COND_STORE:%.*]], label [[LATCH]]		; CHECK-NEXT: br i1 [[CMP]], label [[COND_STORE:%.*]], label [[LATCH]]
Show All 38 Lines

llvm/test/Transforms/LoopVectorize/X86/load-deref-pred.ll

Show All 10 Lines
declare void @init(i32*)		declare void @init(i32*)

;; For ease of explanation, this one demonstrates		;; For ease of explanation, this one demonstrates
;; with a range check, but there are better lowering options specifically for		;; with a range check, but there are better lowering options specifically for
;; this test (i.e. reducing the iteration space of the vector copy), so		;; this test (i.e. reducing the iteration space of the vector copy), so
;; following tests are written more generically.		;; following tests are written more generically.
define i32 @test_explicit_pred(i64 %len) {		define i32 @test_explicit_pred(i64 %len) {
; CHECK-LABEL: @test_explicit_pred(		; CHECK-LABEL: @test_explicit_pred(
; CHECK-NEXT: tc.check:		; CHECK-NEXT: entry:
; CHECK-NEXT: [[ALLOCA:%.*]] = alloca [4096 x i32]		; CHECK-NEXT: [[ALLOCA:%.*]] = alloca [4096 x i32]
; CHECK-NEXT: [[BASE:%.]] = bitcast [4096 x i32] [[ALLOCA]] to i32*		; CHECK-NEXT: [[BASE:%.]] = bitcast [4096 x i32] [[ALLOCA]] to i32*
; CHECK-NEXT: call void @init(i32* [[BASE]])		; CHECK-NEXT: call void @init(i32* [[BASE]])
		; CHECK-NEXT: br label [[TC_CHECK:%.*]]
		; CHECK: tc.check:
; CHECK-NEXT: br i1 false, label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]		; CHECK-NEXT: br i1 false, label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]
; CHECK: vector.ph:		; CHECK: vector.ph:
; CHECK-NEXT: [[BROADCAST_SPLATINSERT:%.]] = insertelement <4 x i64> undef, i64 [[LEN:%.]], i32 0		; CHECK-NEXT: [[BROADCAST_SPLATINSERT:%.]] = insertelement <4 x i64> undef, i64 [[LEN:%.]], i32 0
; CHECK-NEXT: [[BROADCAST_SPLAT:%.*]] = shufflevector <4 x i64> [[BROADCAST_SPLATINSERT]], <4 x i64> undef, <4 x i32> zeroinitializer		; CHECK-NEXT: [[BROADCAST_SPLAT:%.*]] = shufflevector <4 x i64> [[BROADCAST_SPLATINSERT]], <4 x i64> undef, <4 x i32> zeroinitializer
; CHECK-NEXT: [[BROADCAST_SPLATINSERT7:%.*]] = insertelement <4 x i64> undef, i64 [[LEN]], i32 0		; CHECK-NEXT: [[BROADCAST_SPLATINSERT7:%.*]] = insertelement <4 x i64> undef, i64 [[LEN]], i32 0
; CHECK-NEXT: [[BROADCAST_SPLAT8:%.*]] = shufflevector <4 x i64> [[BROADCAST_SPLATINSERT7]], <4 x i64> undef, <4 x i32> zeroinitializer		; CHECK-NEXT: [[BROADCAST_SPLAT8:%.*]] = shufflevector <4 x i64> [[BROADCAST_SPLATINSERT7]], <4 x i64> undef, <4 x i32> zeroinitializer
; CHECK-NEXT: [[BROADCAST_SPLATINSERT9:%.*]] = insertelement <4 x i64> undef, i64 [[LEN]], i32 0		; CHECK-NEXT: [[BROADCAST_SPLATINSERT9:%.*]] = insertelement <4 x i64> undef, i64 [[LEN]], i32 0
; CHECK-NEXT: [[BROADCAST_SPLAT10:%.*]] = shufflevector <4 x i64> [[BROADCAST_SPLATINSERT9]], <4 x i64> undef, <4 x i32> zeroinitializer		; CHECK-NEXT: [[BROADCAST_SPLAT10:%.*]] = shufflevector <4 x i64> [[BROADCAST_SPLATINSERT9]], <4 x i64> undef, <4 x i32> zeroinitializer
▲ Show 20 Lines • Show All 69 Lines • ▼ Show 20 Lines
; CHECK-NEXT: [[RDX_SHUF:%.*]] = shufflevector <4 x i32> [[BIN_RDX20]], <4 x i32> undef, <4 x i32> <i32 2, i32 3, i32 undef, i32 undef>		; CHECK-NEXT: [[RDX_SHUF:%.*]] = shufflevector <4 x i32> [[BIN_RDX20]], <4 x i32> undef, <4 x i32> <i32 2, i32 3, i32 undef, i32 undef>
; CHECK-NEXT: [[BIN_RDX21:%.*]] = add <4 x i32> [[BIN_RDX20]], [[RDX_SHUF]]		; CHECK-NEXT: [[BIN_RDX21:%.*]] = add <4 x i32> [[BIN_RDX20]], [[RDX_SHUF]]
; CHECK-NEXT: [[RDX_SHUF22:%.*]] = shufflevector <4 x i32> [[BIN_RDX21]], <4 x i32> undef, <4 x i32> <i32 1, i32 undef, i32 undef, i32 undef>		; CHECK-NEXT: [[RDX_SHUF22:%.*]] = shufflevector <4 x i32> [[BIN_RDX21]], <4 x i32> undef, <4 x i32> <i32 1, i32 undef, i32 undef, i32 undef>
; CHECK-NEXT: [[BIN_RDX23:%.*]] = add <4 x i32> [[BIN_RDX21]], [[RDX_SHUF22]]		; CHECK-NEXT: [[BIN_RDX23:%.*]] = add <4 x i32> [[BIN_RDX21]], [[RDX_SHUF22]]
; CHECK-NEXT: [[TMP41:%.*]] = extractelement <4 x i32> [[BIN_RDX23]], i32 0		; CHECK-NEXT: [[TMP41:%.*]] = extractelement <4 x i32> [[BIN_RDX23]], i32 0
; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i64 4096, 4096		; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i64 4096, 4096
; CHECK-NEXT: br i1 [[CMP_N]], label [[LOOP_EXIT:%.*]], label [[SCALAR_PH]]		; CHECK-NEXT: br i1 [[CMP_N]], label [[LOOP_EXIT:%.*]], label [[SCALAR_PH]]
; CHECK: scalar.ph:		; CHECK: scalar.ph:
; CHECK-NEXT: [[BC_RESUME_VAL:%.]] = phi i64 [ 4096, [[MIDDLE_BLOCK]] ], [ 0, [[TC_CHECK:%.]] ]		; CHECK-NEXT: [[BC_RESUME_VAL:%.*]] = phi i64 [ 4096, [[MIDDLE_BLOCK]] ], [ 0, [[TC_CHECK]] ]
; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 0, [[TC_CHECK]] ], [ [[TMP41]], [[MIDDLE_BLOCK]] ]		; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 0, [[TC_CHECK]] ], [ [[TMP41]], [[MIDDLE_BLOCK]] ]
; CHECK-NEXT: br label [[LOOP:%.*]]		; CHECK-NEXT: br label [[LOOP:%.*]]
; CHECK: loop:		; CHECK: loop:
; CHECK-NEXT: [[IV:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[IV_NEXT:%.]], [[LATCH:%.*]] ]		; CHECK-NEXT: [[IV:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[IV_NEXT:%.]], [[LATCH:%.*]] ]
; CHECK-NEXT: [[ACCUM:%.]] = phi i32 [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[ACCUM_NEXT:%.]], [[LATCH]] ]		; CHECK-NEXT: [[ACCUM:%.]] = phi i32 [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[ACCUM_NEXT:%.]], [[LATCH]] ]
; CHECK-NEXT: [[IV_NEXT]] = add i64 [[IV]], 1		; CHECK-NEXT: [[IV_NEXT]] = add i64 [[IV]], 1
; CHECK-NEXT: [[EARLYCND:%.*]] = icmp slt i64 [[IV]], [[LEN]]		; CHECK-NEXT: [[EARLYCND:%.*]] = icmp slt i64 [[IV]], [[LEN]]
; CHECK-NEXT: br i1 [[EARLYCND]], label [[PRED:%.*]], label [[LATCH]]		; CHECK-NEXT: br i1 [[EARLYCND]], label [[PRED:%.*]], label [[LATCH]]
Show All 33 Lines

loop_exit:		loop_exit:
ret i32 %accum.next		ret i32 %accum.next
}		}

;; Similiar to the above, but without an analyzeable condition.		;; Similiar to the above, but without an analyzeable condition.
define i32 @test_explicit_pred_generic(i64 %len, i1* %test_base) {		define i32 @test_explicit_pred_generic(i64 %len, i1* %test_base) {
; CHECK-LABEL: @test_explicit_pred_generic(		; CHECK-LABEL: @test_explicit_pred_generic(
; CHECK-NEXT: tc.check:		; CHECK-NEXT: entry:
; CHECK-NEXT: [[ALLOCA:%.*]] = alloca [4096 x i32]		; CHECK-NEXT: [[ALLOCA:%.*]] = alloca [4096 x i32]
; CHECK-NEXT: [[BASE:%.]] = bitcast [4096 x i32] [[ALLOCA]] to i32*		; CHECK-NEXT: [[BASE:%.]] = bitcast [4096 x i32] [[ALLOCA]] to i32*
; CHECK-NEXT: call void @init(i32* [[BASE]])		; CHECK-NEXT: call void @init(i32* [[BASE]])
		; CHECK-NEXT: br label [[TC_CHECK:%.*]]
		; CHECK: tc.check:
; CHECK-NEXT: br i1 false, label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]		; CHECK-NEXT: br i1 false, label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]
; CHECK: vector.ph:		; CHECK: vector.ph:
; CHECK-NEXT: br label [[VECTOR_BODY:%.*]]		; CHECK-NEXT: br label [[VECTOR_BODY:%.*]]
; CHECK: vector.body:		; CHECK: vector.body:
; CHECK-NEXT: [[INDEX:%.]] = phi i64 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[VECTOR_BODY]] ]		; CHECK-NEXT: [[INDEX:%.]] = phi i64 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[VECTOR_BODY]] ]
; CHECK-NEXT: [[VEC_PHI:%.]] = phi <4 x i32> [ zeroinitializer, [[VECTOR_PH]] ], [ [[TMP80:%.]], [[VECTOR_BODY]] ]		; CHECK-NEXT: [[VEC_PHI:%.]] = phi <4 x i32> [ zeroinitializer, [[VECTOR_PH]] ], [ [[TMP80:%.]], [[VECTOR_BODY]] ]
; CHECK-NEXT: [[VEC_PHI4:%.]] = phi <4 x i32> [ zeroinitializer, [[VECTOR_PH]] ], [ [[TMP81:%.]], [[VECTOR_BODY]] ]		; CHECK-NEXT: [[VEC_PHI4:%.]] = phi <4 x i32> [ zeroinitializer, [[VECTOR_PH]] ], [ [[TMP81:%.]], [[VECTOR_BODY]] ]
; CHECK-NEXT: [[VEC_PHI5:%.]] = phi <4 x i32> [ zeroinitializer, [[VECTOR_PH]] ], [ [[TMP82:%.]], [[VECTOR_BODY]] ]		; CHECK-NEXT: [[VEC_PHI5:%.]] = phi <4 x i32> [ zeroinitializer, [[VECTOR_PH]] ], [ [[TMP82:%.]], [[VECTOR_BODY]] ]
▲ Show 20 Lines • Show All 106 Lines • ▼ Show 20 Lines
; CHECK-NEXT: [[RDX_SHUF:%.*]] = shufflevector <4 x i32> [[BIN_RDX14]], <4 x i32> undef, <4 x i32> <i32 2, i32 3, i32 undef, i32 undef>		; CHECK-NEXT: [[RDX_SHUF:%.*]] = shufflevector <4 x i32> [[BIN_RDX14]], <4 x i32> undef, <4 x i32> <i32 2, i32 3, i32 undef, i32 undef>
; CHECK-NEXT: [[BIN_RDX15:%.*]] = add <4 x i32> [[BIN_RDX14]], [[RDX_SHUF]]		; CHECK-NEXT: [[BIN_RDX15:%.*]] = add <4 x i32> [[BIN_RDX14]], [[RDX_SHUF]]
; CHECK-NEXT: [[RDX_SHUF16:%.*]] = shufflevector <4 x i32> [[BIN_RDX15]], <4 x i32> undef, <4 x i32> <i32 1, i32 undef, i32 undef, i32 undef>		; CHECK-NEXT: [[RDX_SHUF16:%.*]] = shufflevector <4 x i32> [[BIN_RDX15]], <4 x i32> undef, <4 x i32> <i32 1, i32 undef, i32 undef, i32 undef>
; CHECK-NEXT: [[BIN_RDX17:%.*]] = add <4 x i32> [[BIN_RDX15]], [[RDX_SHUF16]]		; CHECK-NEXT: [[BIN_RDX17:%.*]] = add <4 x i32> [[BIN_RDX15]], [[RDX_SHUF16]]
; CHECK-NEXT: [[TMP85:%.*]] = extractelement <4 x i32> [[BIN_RDX17]], i32 0		; CHECK-NEXT: [[TMP85:%.*]] = extractelement <4 x i32> [[BIN_RDX17]], i32 0
; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i64 4096, 4096		; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i64 4096, 4096
; CHECK-NEXT: br i1 [[CMP_N]], label [[LOOP_EXIT:%.*]], label [[SCALAR_PH]]		; CHECK-NEXT: br i1 [[CMP_N]], label [[LOOP_EXIT:%.*]], label [[SCALAR_PH]]
; CHECK: scalar.ph:		; CHECK: scalar.ph:
; CHECK-NEXT: [[BC_RESUME_VAL:%.]] = phi i64 [ 4096, [[MIDDLE_BLOCK]] ], [ 0, [[TC_CHECK:%.]] ]		; CHECK-NEXT: [[BC_RESUME_VAL:%.*]] = phi i64 [ 4096, [[MIDDLE_BLOCK]] ], [ 0, [[TC_CHECK]] ]
; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 0, [[TC_CHECK]] ], [ [[TMP85]], [[MIDDLE_BLOCK]] ]		; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 0, [[TC_CHECK]] ], [ [[TMP85]], [[MIDDLE_BLOCK]] ]
; CHECK-NEXT: br label [[LOOP:%.*]]		; CHECK-NEXT: br label [[LOOP:%.*]]
; CHECK: loop:		; CHECK: loop:
; CHECK-NEXT: [[IV:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[IV_NEXT:%.]], [[LATCH:%.*]] ]		; CHECK-NEXT: [[IV:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[IV_NEXT:%.]], [[LATCH:%.*]] ]
; CHECK-NEXT: [[ACCUM:%.]] = phi i32 [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[ACCUM_NEXT:%.]], [[LATCH]] ]		; CHECK-NEXT: [[ACCUM:%.]] = phi i32 [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[ACCUM_NEXT:%.]], [[LATCH]] ]
; CHECK-NEXT: [[IV_NEXT]] = add i64 [[IV]], 1		; CHECK-NEXT: [[IV_NEXT]] = add i64 [[IV]], 1
; CHECK-NEXT: [[TEST_ADDR:%.]] = getelementptr inbounds i1, i1 [[TEST_BASE]], i64 [[IV]]		; CHECK-NEXT: [[TEST_ADDR:%.]] = getelementptr inbounds i1, i1 [[TEST_BASE]], i64 [[IV]]
; CHECK-NEXT: [[EARLYCND:%.]] = load i1, i1 [[TEST_ADDR]]		; CHECK-NEXT: [[EARLYCND:%.]] = load i1, i1 [[TEST_ADDR]]
Show All 38 Lines
}		}

; Trivial case where the address loaded from it loop invariant (and yes,		; Trivial case where the address loaded from it loop invariant (and yes,
; there are better lowerings, this is a test of robustness of vectorization,		; there are better lowerings, this is a test of robustness of vectorization,
; nothing more.)		; nothing more.)
; TODO: currently shows predication which can be removed		; TODO: currently shows predication which can be removed
define i32 @test_invariant_address(i64 %len, i1* %test_base) {		define i32 @test_invariant_address(i64 %len, i1* %test_base) {
; CHECK-LABEL: @test_invariant_address(		; CHECK-LABEL: @test_invariant_address(
; CHECK-NEXT: tc.check:		; CHECK-NEXT: entry:
; CHECK-NEXT: [[ALLOCA:%.*]] = alloca [4096 x i32]		; CHECK-NEXT: [[ALLOCA:%.*]] = alloca [4096 x i32]
; CHECK-NEXT: [[BASE:%.]] = bitcast [4096 x i32] [[ALLOCA]] to i32*		; CHECK-NEXT: [[BASE:%.]] = bitcast [4096 x i32] [[ALLOCA]] to i32*
; CHECK-NEXT: call void @init(i32* [[BASE]])		; CHECK-NEXT: call void @init(i32* [[BASE]])
		; CHECK-NEXT: br label [[TC_CHECK:%.*]]
		; CHECK: tc.check:
; CHECK-NEXT: br i1 false, label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]		; CHECK-NEXT: br i1 false, label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]
; CHECK: vector.ph:		; CHECK: vector.ph:
; CHECK-NEXT: br label [[VECTOR_BODY:%.*]]		; CHECK-NEXT: br label [[VECTOR_BODY:%.*]]
; CHECK: vector.body:		; CHECK: vector.body:
; CHECK-NEXT: [[INDEX:%.]] = phi i64 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[VECTOR_BODY]] ]		; CHECK-NEXT: [[INDEX:%.]] = phi i64 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[VECTOR_BODY]] ]
; CHECK-NEXT: [[VEC_PHI:%.]] = phi <4 x i32> [ zeroinitializer, [[VECTOR_PH]] ], [ [[TMP100:%.]], [[VECTOR_BODY]] ]		; CHECK-NEXT: [[VEC_PHI:%.]] = phi <4 x i32> [ zeroinitializer, [[VECTOR_PH]] ], [ [[TMP100:%.]], [[VECTOR_BODY]] ]
; CHECK-NEXT: [[VEC_PHI4:%.]] = phi <4 x i32> [ zeroinitializer, [[VECTOR_PH]] ], [ [[TMP101:%.]], [[VECTOR_BODY]] ]		; CHECK-NEXT: [[VEC_PHI4:%.]] = phi <4 x i32> [ zeroinitializer, [[VECTOR_PH]] ], [ [[TMP101:%.]], [[VECTOR_BODY]] ]
; CHECK-NEXT: [[VEC_PHI5:%.]] = phi <4 x i32> [ zeroinitializer, [[VECTOR_PH]] ], [ [[TMP102:%.]], [[VECTOR_BODY]] ]		; CHECK-NEXT: [[VEC_PHI5:%.]] = phi <4 x i32> [ zeroinitializer, [[VECTOR_PH]] ], [ [[TMP102:%.]], [[VECTOR_BODY]] ]
▲ Show 20 Lines • Show All 122 Lines • ▼ Show 20 Lines
; CHECK-NEXT: [[RDX_SHUF:%.*]] = shufflevector <4 x i32> [[BIN_RDX11]], <4 x i32> undef, <4 x i32> <i32 2, i32 3, i32 undef, i32 undef>		; CHECK-NEXT: [[RDX_SHUF:%.*]] = shufflevector <4 x i32> [[BIN_RDX11]], <4 x i32> undef, <4 x i32> <i32 2, i32 3, i32 undef, i32 undef>
; CHECK-NEXT: [[BIN_RDX12:%.*]] = add <4 x i32> [[BIN_RDX11]], [[RDX_SHUF]]		; CHECK-NEXT: [[BIN_RDX12:%.*]] = add <4 x i32> [[BIN_RDX11]], [[RDX_SHUF]]
; CHECK-NEXT: [[RDX_SHUF13:%.*]] = shufflevector <4 x i32> [[BIN_RDX12]], <4 x i32> undef, <4 x i32> <i32 1, i32 undef, i32 undef, i32 undef>		; CHECK-NEXT: [[RDX_SHUF13:%.*]] = shufflevector <4 x i32> [[BIN_RDX12]], <4 x i32> undef, <4 x i32> <i32 1, i32 undef, i32 undef, i32 undef>
; CHECK-NEXT: [[BIN_RDX14:%.*]] = add <4 x i32> [[BIN_RDX12]], [[RDX_SHUF13]]		; CHECK-NEXT: [[BIN_RDX14:%.*]] = add <4 x i32> [[BIN_RDX12]], [[RDX_SHUF13]]
; CHECK-NEXT: [[TMP105:%.*]] = extractelement <4 x i32> [[BIN_RDX14]], i32 0		; CHECK-NEXT: [[TMP105:%.*]] = extractelement <4 x i32> [[BIN_RDX14]], i32 0
; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i64 4096, 4096		; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i64 4096, 4096
; CHECK-NEXT: br i1 [[CMP_N]], label [[LOOP_EXIT:%.*]], label [[SCALAR_PH]]		; CHECK-NEXT: br i1 [[CMP_N]], label [[LOOP_EXIT:%.*]], label [[SCALAR_PH]]
; CHECK: scalar.ph:		; CHECK: scalar.ph:
; CHECK-NEXT: [[BC_RESUME_VAL:%.]] = phi i64 [ 4096, [[MIDDLE_BLOCK]] ], [ 0, [[TC_CHECK:%.]] ]		; CHECK-NEXT: [[BC_RESUME_VAL:%.*]] = phi i64 [ 4096, [[MIDDLE_BLOCK]] ], [ 0, [[TC_CHECK]] ]
; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 0, [[TC_CHECK]] ], [ [[TMP105]], [[MIDDLE_BLOCK]] ]		; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 0, [[TC_CHECK]] ], [ [[TMP105]], [[MIDDLE_BLOCK]] ]
; CHECK-NEXT: br label [[LOOP:%.*]]		; CHECK-NEXT: br label [[LOOP:%.*]]
; CHECK: loop:		; CHECK: loop:
; CHECK-NEXT: [[IV:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[IV_NEXT:%.]], [[LATCH:%.*]] ]		; CHECK-NEXT: [[IV:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[IV_NEXT:%.]], [[LATCH:%.*]] ]
; CHECK-NEXT: [[ACCUM:%.]] = phi i32 [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[ACCUM_NEXT:%.]], [[LATCH]] ]		; CHECK-NEXT: [[ACCUM:%.]] = phi i32 [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[ACCUM_NEXT:%.]], [[LATCH]] ]
; CHECK-NEXT: [[IV_NEXT]] = add i64 [[IV]], 1		; CHECK-NEXT: [[IV_NEXT]] = add i64 [[IV]], 1
; CHECK-NEXT: [[TEST_ADDR:%.]] = getelementptr inbounds i1, i1 [[TEST_BASE]], i64 [[IV]]		; CHECK-NEXT: [[TEST_ADDR:%.]] = getelementptr inbounds i1, i1 [[TEST_BASE]], i64 [[IV]]
; CHECK-NEXT: [[EARLYCND:%.]] = load i1, i1 [[TEST_ADDR]]		; CHECK-NEXT: [[EARLYCND:%.]] = load i1, i1 [[TEST_ADDR]]
Show All 33 Lines

loop_exit:		loop_exit:
ret i32 %accum.next		ret i32 %accum.next
}		}

; Overlapping loads - Fails alignment checking, not dereferenceability		; Overlapping loads - Fails alignment checking, not dereferenceability
define i32 @test_step_narrower_than_access(i64 %len, i1* %test_base) {		define i32 @test_step_narrower_than_access(i64 %len, i1* %test_base) {
; CHECK-LABEL: @test_step_narrower_than_access(		; CHECK-LABEL: @test_step_narrower_than_access(
; CHECK-NEXT: tc.check:		; CHECK-NEXT: entry:
; CHECK-NEXT: [[ALLOCA:%.*]] = alloca [4096 x i32]		; CHECK-NEXT: [[ALLOCA:%.*]] = alloca [4096 x i32]
; CHECK-NEXT: [[BASE:%.]] = bitcast [4096 x i32] [[ALLOCA]] to i32*		; CHECK-NEXT: [[BASE:%.]] = bitcast [4096 x i32] [[ALLOCA]] to i32*
; CHECK-NEXT: call void @init(i32* [[BASE]])		; CHECK-NEXT: call void @init(i32* [[BASE]])
		; CHECK-NEXT: br label [[TC_CHECK:%.*]]
		; CHECK: tc.check:
; CHECK-NEXT: br i1 false, label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]		; CHECK-NEXT: br i1 false, label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]
; CHECK: vector.ph:		; CHECK: vector.ph:
; CHECK-NEXT: br label [[VECTOR_BODY:%.*]]		; CHECK-NEXT: br label [[VECTOR_BODY:%.*]]
; CHECK: vector.body:		; CHECK: vector.body:
; CHECK-NEXT: [[INDEX:%.]] = phi i64 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[PRED_LOAD_CONTINUE36:%.*]] ]		; CHECK-NEXT: [[INDEX:%.]] = phi i64 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[PRED_LOAD_CONTINUE36:%.*]] ]
; CHECK-NEXT: [[VEC_PHI:%.]] = phi <4 x i32> [ zeroinitializer, [[VECTOR_PH]] ], [ [[TMP180:%.]], [[PRED_LOAD_CONTINUE36]] ]		; CHECK-NEXT: [[VEC_PHI:%.]] = phi <4 x i32> [ zeroinitializer, [[VECTOR_PH]] ], [ [[TMP180:%.]], [[PRED_LOAD_CONTINUE36]] ]
; CHECK-NEXT: [[VEC_PHI4:%.]] = phi <4 x i32> [ zeroinitializer, [[VECTOR_PH]] ], [ [[TMP181:%.]], [[PRED_LOAD_CONTINUE36]] ]		; CHECK-NEXT: [[VEC_PHI4:%.]] = phi <4 x i32> [ zeroinitializer, [[VECTOR_PH]] ], [ [[TMP181:%.]], [[PRED_LOAD_CONTINUE36]] ]
; CHECK-NEXT: [[VEC_PHI5:%.]] = phi <4 x i32> [ zeroinitializer, [[VECTOR_PH]] ], [ [[TMP182:%.]], [[PRED_LOAD_CONTINUE36]] ]		; CHECK-NEXT: [[VEC_PHI5:%.]] = phi <4 x i32> [ zeroinitializer, [[VECTOR_PH]] ], [ [[TMP182:%.]], [[PRED_LOAD_CONTINUE36]] ]
▲ Show 20 Lines • Show All 266 Lines • ▼ Show 20 Lines
; CHECK-NEXT: [[RDX_SHUF:%.*]] = shufflevector <4 x i32> [[BIN_RDX41]], <4 x i32> undef, <4 x i32> <i32 2, i32 3, i32 undef, i32 undef>		; CHECK-NEXT: [[RDX_SHUF:%.*]] = shufflevector <4 x i32> [[BIN_RDX41]], <4 x i32> undef, <4 x i32> <i32 2, i32 3, i32 undef, i32 undef>
; CHECK-NEXT: [[BIN_RDX42:%.*]] = add <4 x i32> [[BIN_RDX41]], [[RDX_SHUF]]		; CHECK-NEXT: [[BIN_RDX42:%.*]] = add <4 x i32> [[BIN_RDX41]], [[RDX_SHUF]]
; CHECK-NEXT: [[RDX_SHUF43:%.*]] = shufflevector <4 x i32> [[BIN_RDX42]], <4 x i32> undef, <4 x i32> <i32 1, i32 undef, i32 undef, i32 undef>		; CHECK-NEXT: [[RDX_SHUF43:%.*]] = shufflevector <4 x i32> [[BIN_RDX42]], <4 x i32> undef, <4 x i32> <i32 1, i32 undef, i32 undef, i32 undef>
; CHECK-NEXT: [[BIN_RDX44:%.*]] = add <4 x i32> [[BIN_RDX42]], [[RDX_SHUF43]]		; CHECK-NEXT: [[BIN_RDX44:%.*]] = add <4 x i32> [[BIN_RDX42]], [[RDX_SHUF43]]
; CHECK-NEXT: [[TMP185:%.*]] = extractelement <4 x i32> [[BIN_RDX44]], i32 0		; CHECK-NEXT: [[TMP185:%.*]] = extractelement <4 x i32> [[BIN_RDX44]], i32 0
; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i64 4096, 4096		; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i64 4096, 4096
; CHECK-NEXT: br i1 [[CMP_N]], label [[LOOP_EXIT:%.*]], label [[SCALAR_PH]]		; CHECK-NEXT: br i1 [[CMP_N]], label [[LOOP_EXIT:%.*]], label [[SCALAR_PH]]
; CHECK: scalar.ph:		; CHECK: scalar.ph:
; CHECK-NEXT: [[BC_RESUME_VAL:%.]] = phi i64 [ 4096, [[MIDDLE_BLOCK]] ], [ 0, [[TC_CHECK:%.]] ]		; CHECK-NEXT: [[BC_RESUME_VAL:%.*]] = phi i64 [ 4096, [[MIDDLE_BLOCK]] ], [ 0, [[TC_CHECK]] ]
; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 0, [[TC_CHECK]] ], [ [[TMP185]], [[MIDDLE_BLOCK]] ]		; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 0, [[TC_CHECK]] ], [ [[TMP185]], [[MIDDLE_BLOCK]] ]
; CHECK-NEXT: br label [[LOOP:%.*]]		; CHECK-NEXT: br label [[LOOP:%.*]]
; CHECK: loop:		; CHECK: loop:
; CHECK-NEXT: [[IV:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[IV_NEXT:%.]], [[LATCH:%.*]] ]		; CHECK-NEXT: [[IV:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[IV_NEXT:%.]], [[LATCH:%.*]] ]
; CHECK-NEXT: [[ACCUM:%.]] = phi i32 [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[ACCUM_NEXT:%.]], [[LATCH]] ]		; CHECK-NEXT: [[ACCUM:%.]] = phi i32 [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[ACCUM_NEXT:%.]], [[LATCH]] ]
; CHECK-NEXT: [[IV_NEXT]] = add i64 [[IV]], 1		; CHECK-NEXT: [[IV_NEXT]] = add i64 [[IV]], 1
; CHECK-NEXT: [[TEST_ADDR:%.]] = getelementptr inbounds i1, i1 [[TEST_BASE]], i64 [[IV]]		; CHECK-NEXT: [[TEST_ADDR:%.]] = getelementptr inbounds i1, i1 [[TEST_BASE]], i64 [[IV]]
; CHECK-NEXT: [[EARLYCND:%.]] = load i1, i1 [[TEST_ADDR]]		; CHECK-NEXT: [[EARLYCND:%.]] = load i1, i1 [[TEST_ADDR]]
Show All 38 Lines	latch:
br i1 %exit, label %loop_exit, label %loop		br i1 %exit, label %loop_exit, label %loop

loop_exit:		loop_exit:
ret i32 %accum.next		ret i32 %accum.next
}		}

define i32 @test_max_trip_count(i64 %len, i1* %test_base, i64 %n) {		define i32 @test_max_trip_count(i64 %len, i1* %test_base, i64 %n) {
; CHECK-LABEL: @test_max_trip_count(		; CHECK-LABEL: @test_max_trip_count(
; CHECK-NEXT: tc.check:		; CHECK-NEXT: entry:
; CHECK-NEXT: [[ALLOCA:%.*]] = alloca [4096 x i32]		; CHECK-NEXT: [[ALLOCA:%.*]] = alloca [4096 x i32]
; CHECK-NEXT: [[BASE:%.]] = bitcast [4096 x i32] [[ALLOCA]] to i32*		; CHECK-NEXT: [[BASE:%.]] = bitcast [4096 x i32] [[ALLOCA]] to i32*
; CHECK-NEXT: call void @init(i32* [[BASE]])		; CHECK-NEXT: call void @init(i32* [[BASE]])
; CHECK-NEXT: [[MIN_CMP:%.]] = icmp ult i64 4096, [[N:%.]]		; CHECK-NEXT: [[MIN_CMP:%.]] = icmp ult i64 4096, [[N:%.]]
; CHECK-NEXT: [[MIN_N:%.*]] = select i1 [[MIN_CMP]], i64 4096, i64 [[N]]		; CHECK-NEXT: [[MIN_N:%.*]] = select i1 [[MIN_CMP]], i64 4096, i64 [[N]]
		; CHECK-NEXT: br label [[TC_CHECK:%.*]]
		; CHECK: tc.check:
; CHECK-NEXT: [[TMP0:%.*]] = add i64 [[MIN_N]], 2		; CHECK-NEXT: [[TMP0:%.*]] = add i64 [[MIN_N]], 2
; CHECK-NEXT: [[MIN_ITERS_CHECK:%.*]] = icmp ult i64 [[TMP0]], 16		; CHECK-NEXT: [[MIN_ITERS_CHECK:%.*]] = icmp ult i64 [[TMP0]], 16
; CHECK-NEXT: br i1 [[MIN_ITERS_CHECK]], label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]		; CHECK-NEXT: br i1 [[MIN_ITERS_CHECK]], label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]
; CHECK: vector.ph:		; CHECK: vector.ph:
; CHECK-NEXT: [[N_MOD_VF:%.*]] = urem i64 [[TMP0]], 16		; CHECK-NEXT: [[N_MOD_VF:%.*]] = urem i64 [[TMP0]], 16
; CHECK-NEXT: [[N_VEC:%.*]] = sub i64 [[TMP0]], [[N_MOD_VF]]		; CHECK-NEXT: [[N_VEC:%.*]] = sub i64 [[TMP0]], [[N_MOD_VF]]
; CHECK-NEXT: br label [[VECTOR_BODY:%.*]]		; CHECK-NEXT: br label [[VECTOR_BODY:%.*]]
; CHECK: vector.body:		; CHECK: vector.body:
▲ Show 20 Lines • Show All 110 Lines • ▼ Show 20 Lines
; CHECK-NEXT: [[RDX_SHUF:%.*]] = shufflevector <4 x i32> [[BIN_RDX14]], <4 x i32> undef, <4 x i32> <i32 2, i32 3, i32 undef, i32 undef>		; CHECK-NEXT: [[RDX_SHUF:%.*]] = shufflevector <4 x i32> [[BIN_RDX14]], <4 x i32> undef, <4 x i32> <i32 2, i32 3, i32 undef, i32 undef>
; CHECK-NEXT: [[BIN_RDX15:%.*]] = add <4 x i32> [[BIN_RDX14]], [[RDX_SHUF]]		; CHECK-NEXT: [[BIN_RDX15:%.*]] = add <4 x i32> [[BIN_RDX14]], [[RDX_SHUF]]
; CHECK-NEXT: [[RDX_SHUF16:%.*]] = shufflevector <4 x i32> [[BIN_RDX15]], <4 x i32> undef, <4 x i32> <i32 1, i32 undef, i32 undef, i32 undef>		; CHECK-NEXT: [[RDX_SHUF16:%.*]] = shufflevector <4 x i32> [[BIN_RDX15]], <4 x i32> undef, <4 x i32> <i32 1, i32 undef, i32 undef, i32 undef>
; CHECK-NEXT: [[BIN_RDX17:%.*]] = add <4 x i32> [[BIN_RDX15]], [[RDX_SHUF16]]		; CHECK-NEXT: [[BIN_RDX17:%.*]] = add <4 x i32> [[BIN_RDX15]], [[RDX_SHUF16]]
; CHECK-NEXT: [[TMP86:%.*]] = extractelement <4 x i32> [[BIN_RDX17]], i32 0		; CHECK-NEXT: [[TMP86:%.*]] = extractelement <4 x i32> [[BIN_RDX17]], i32 0
; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i64 [[TMP0]], [[N_VEC]]		; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i64 [[TMP0]], [[N_VEC]]
; CHECK-NEXT: br i1 [[CMP_N]], label [[LOOP_EXIT:%.*]], label [[SCALAR_PH]]		; CHECK-NEXT: br i1 [[CMP_N]], label [[LOOP_EXIT:%.*]], label [[SCALAR_PH]]
; CHECK: scalar.ph:		; CHECK: scalar.ph:
; CHECK-NEXT: [[BC_RESUME_VAL:%.]] = phi i64 [ [[N_VEC]], [[MIDDLE_BLOCK]] ], [ 0, [[TC_CHECK:%.]] ]		; CHECK-NEXT: [[BC_RESUME_VAL:%.*]] = phi i64 [ [[N_VEC]], [[MIDDLE_BLOCK]] ], [ 0, [[TC_CHECK]] ]
; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 0, [[TC_CHECK]] ], [ [[TMP86]], [[MIDDLE_BLOCK]] ]		; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 0, [[TC_CHECK]] ], [ [[TMP86]], [[MIDDLE_BLOCK]] ]
; CHECK-NEXT: br label [[LOOP:%.*]]		; CHECK-NEXT: br label [[LOOP:%.*]]
; CHECK: loop:		; CHECK: loop:
; CHECK-NEXT: [[IV:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[IV_NEXT:%.]], [[LATCH:%.*]] ]		; CHECK-NEXT: [[IV:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[IV_NEXT:%.]], [[LATCH:%.*]] ]
; CHECK-NEXT: [[ACCUM:%.]] = phi i32 [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[ACCUM_NEXT:%.]], [[LATCH]] ]		; CHECK-NEXT: [[ACCUM:%.]] = phi i32 [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[ACCUM_NEXT:%.]], [[LATCH]] ]
; CHECK-NEXT: [[IV_NEXT]] = add i64 [[IV]], 1		; CHECK-NEXT: [[IV_NEXT]] = add i64 [[IV]], 1
; CHECK-NEXT: [[TEST_ADDR:%.]] = getelementptr inbounds i1, i1 [[TEST_BASE]], i64 [[IV]]		; CHECK-NEXT: [[TEST_ADDR:%.]] = getelementptr inbounds i1, i1 [[TEST_BASE]], i64 [[IV]]
; CHECK-NEXT: [[EARLYCND:%.]] = load i1, i1 [[TEST_ADDR]]		; CHECK-NEXT: [[EARLYCND:%.]] = load i1, i1 [[TEST_ADDR]]
Show All 39 Lines	loop_exit:
ret i32 %accum.next		ret i32 %accum.next
}		}




define i32 @test_non_zero_start(i64 %len, i1* %test_base) {		define i32 @test_non_zero_start(i64 %len, i1* %test_base) {
; CHECK-LABEL: @test_non_zero_start(		; CHECK-LABEL: @test_non_zero_start(
; CHECK-NEXT: tc.check:		; CHECK-NEXT: entry:
; CHECK-NEXT: [[ALLOCA:%.*]] = alloca [4096 x i32]		; CHECK-NEXT: [[ALLOCA:%.*]] = alloca [4096 x i32]
; CHECK-NEXT: [[BASE:%.]] = bitcast [4096 x i32] [[ALLOCA]] to i32*		; CHECK-NEXT: [[BASE:%.]] = bitcast [4096 x i32] [[ALLOCA]] to i32*
; CHECK-NEXT: call void @init(i32* [[BASE]])		; CHECK-NEXT: call void @init(i32* [[BASE]])
		; CHECK-NEXT: br label [[TC_CHECK:%.*]]
		; CHECK: tc.check:
; CHECK-NEXT: br i1 false, label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]		; CHECK-NEXT: br i1 false, label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]
; CHECK: vector.ph:		; CHECK: vector.ph:
; CHECK-NEXT: br label [[VECTOR_BODY:%.*]]		; CHECK-NEXT: br label [[VECTOR_BODY:%.*]]
; CHECK: vector.body:		; CHECK: vector.body:
; CHECK-NEXT: [[INDEX:%.]] = phi i64 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[VECTOR_BODY]] ]		; CHECK-NEXT: [[INDEX:%.]] = phi i64 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[VECTOR_BODY]] ]
; CHECK-NEXT: [[VEC_PHI:%.]] = phi <4 x i32> [ zeroinitializer, [[VECTOR_PH]] ], [ [[TMP80:%.]], [[VECTOR_BODY]] ]		; CHECK-NEXT: [[VEC_PHI:%.]] = phi <4 x i32> [ zeroinitializer, [[VECTOR_PH]] ], [ [[TMP80:%.]], [[VECTOR_BODY]] ]
; CHECK-NEXT: [[VEC_PHI4:%.]] = phi <4 x i32> [ zeroinitializer, [[VECTOR_PH]] ], [ [[TMP81:%.]], [[VECTOR_BODY]] ]		; CHECK-NEXT: [[VEC_PHI4:%.]] = phi <4 x i32> [ zeroinitializer, [[VECTOR_PH]] ], [ [[TMP81:%.]], [[VECTOR_BODY]] ]
; CHECK-NEXT: [[VEC_PHI5:%.]] = phi <4 x i32> [ zeroinitializer, [[VECTOR_PH]] ], [ [[TMP82:%.]], [[VECTOR_BODY]] ]		; CHECK-NEXT: [[VEC_PHI5:%.]] = phi <4 x i32> [ zeroinitializer, [[VECTOR_PH]] ], [ [[TMP82:%.]], [[VECTOR_BODY]] ]
▲ Show 20 Lines • Show All 107 Lines • ▼ Show 20 Lines
; CHECK-NEXT: [[RDX_SHUF:%.*]] = shufflevector <4 x i32> [[BIN_RDX14]], <4 x i32> undef, <4 x i32> <i32 2, i32 3, i32 undef, i32 undef>		; CHECK-NEXT: [[RDX_SHUF:%.*]] = shufflevector <4 x i32> [[BIN_RDX14]], <4 x i32> undef, <4 x i32> <i32 2, i32 3, i32 undef, i32 undef>
; CHECK-NEXT: [[BIN_RDX15:%.*]] = add <4 x i32> [[BIN_RDX14]], [[RDX_SHUF]]		; CHECK-NEXT: [[BIN_RDX15:%.*]] = add <4 x i32> [[BIN_RDX14]], [[RDX_SHUF]]
; CHECK-NEXT: [[RDX_SHUF16:%.*]] = shufflevector <4 x i32> [[BIN_RDX15]], <4 x i32> undef, <4 x i32> <i32 1, i32 undef, i32 undef, i32 undef>		; CHECK-NEXT: [[RDX_SHUF16:%.*]] = shufflevector <4 x i32> [[BIN_RDX15]], <4 x i32> undef, <4 x i32> <i32 1, i32 undef, i32 undef, i32 undef>
; CHECK-NEXT: [[BIN_RDX17:%.*]] = add <4 x i32> [[BIN_RDX15]], [[RDX_SHUF16]]		; CHECK-NEXT: [[BIN_RDX17:%.*]] = add <4 x i32> [[BIN_RDX15]], [[RDX_SHUF16]]
; CHECK-NEXT: [[TMP85:%.*]] = extractelement <4 x i32> [[BIN_RDX17]], i32 0		; CHECK-NEXT: [[TMP85:%.*]] = extractelement <4 x i32> [[BIN_RDX17]], i32 0
; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i64 3072, 3072		; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i64 3072, 3072
; CHECK-NEXT: br i1 [[CMP_N]], label [[LOOP_EXIT:%.*]], label [[SCALAR_PH]]		; CHECK-NEXT: br i1 [[CMP_N]], label [[LOOP_EXIT:%.*]], label [[SCALAR_PH]]
; CHECK: scalar.ph:		; CHECK: scalar.ph:
; CHECK-NEXT: [[BC_RESUME_VAL:%.]] = phi i64 [ 4096, [[MIDDLE_BLOCK]] ], [ 1024, [[TC_CHECK:%.]] ]		; CHECK-NEXT: [[BC_RESUME_VAL:%.*]] = phi i64 [ 4096, [[MIDDLE_BLOCK]] ], [ 1024, [[TC_CHECK]] ]
; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 0, [[TC_CHECK]] ], [ [[TMP85]], [[MIDDLE_BLOCK]] ]		; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 0, [[TC_CHECK]] ], [ [[TMP85]], [[MIDDLE_BLOCK]] ]
; CHECK-NEXT: br label [[LOOP:%.*]]		; CHECK-NEXT: br label [[LOOP:%.*]]
; CHECK: loop:		; CHECK: loop:
; CHECK-NEXT: [[IV:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[IV_NEXT:%.]], [[LATCH:%.*]] ]		; CHECK-NEXT: [[IV:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[IV_NEXT:%.]], [[LATCH:%.*]] ]
; CHECK-NEXT: [[ACCUM:%.]] = phi i32 [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[ACCUM_NEXT:%.]], [[LATCH]] ]		; CHECK-NEXT: [[ACCUM:%.]] = phi i32 [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[ACCUM_NEXT:%.]], [[LATCH]] ]
; CHECK-NEXT: [[IV_NEXT]] = add i64 [[IV]], 1		; CHECK-NEXT: [[IV_NEXT]] = add i64 [[IV]], 1
; CHECK-NEXT: [[TEST_ADDR:%.]] = getelementptr inbounds i1, i1 [[TEST_BASE]], i64 [[IV]]		; CHECK-NEXT: [[TEST_ADDR:%.]] = getelementptr inbounds i1, i1 [[TEST_BASE]], i64 [[IV]]
; CHECK-NEXT: [[EARLYCND:%.]] = load i1, i1 [[TEST_ADDR]]		; CHECK-NEXT: [[EARLYCND:%.]] = load i1, i1 [[TEST_ADDR]]
▲ Show 20 Lines • Show All 89 Lines • ▼ Show 20 Lines
loop_exit:		loop_exit:
ret i32 %accum.next		ret i32 %accum.next
}		}


;; TODO: handle non-unit strides		;; TODO: handle non-unit strides
define i32 @test_non_unit_stride(i64 %len, i1* %test_base) {		define i32 @test_non_unit_stride(i64 %len, i1* %test_base) {
; CHECK-LABEL: @test_non_unit_stride(		; CHECK-LABEL: @test_non_unit_stride(
; CHECK-NEXT: tc.check:		; CHECK-NEXT: entry:
; CHECK-NEXT: [[ALLOCA:%.*]] = alloca [4096 x i32]		; CHECK-NEXT: [[ALLOCA:%.*]] = alloca [4096 x i32]
; CHECK-NEXT: [[BASE:%.]] = bitcast [4096 x i32] [[ALLOCA]] to i32*		; CHECK-NEXT: [[BASE:%.]] = bitcast [4096 x i32] [[ALLOCA]] to i32*
; CHECK-NEXT: call void @init(i32* [[BASE]])		; CHECK-NEXT: call void @init(i32* [[BASE]])
		; CHECK-NEXT: br label [[TC_CHECK:%.*]]
		; CHECK: tc.check:
; CHECK-NEXT: br i1 false, label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]		; CHECK-NEXT: br i1 false, label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]
; CHECK: vector.ph:		; CHECK: vector.ph:
; CHECK-NEXT: br label [[VECTOR_BODY:%.*]]		; CHECK-NEXT: br label [[VECTOR_BODY:%.*]]
; CHECK: vector.body:		; CHECK: vector.body:
; CHECK-NEXT: [[INDEX:%.]] = phi i64 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[PRED_LOAD_CONTINUE36:%.*]] ]		; CHECK-NEXT: [[INDEX:%.]] = phi i64 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[PRED_LOAD_CONTINUE36:%.*]] ]
; CHECK-NEXT: [[VEC_PHI:%.]] = phi <4 x i32> [ zeroinitializer, [[VECTOR_PH]] ], [ [[TMP148:%.]], [[PRED_LOAD_CONTINUE36]] ]		; CHECK-NEXT: [[VEC_PHI:%.]] = phi <4 x i32> [ zeroinitializer, [[VECTOR_PH]] ], [ [[TMP148:%.]], [[PRED_LOAD_CONTINUE36]] ]
; CHECK-NEXT: [[VEC_PHI4:%.]] = phi <4 x i32> [ zeroinitializer, [[VECTOR_PH]] ], [ [[TMP149:%.]], [[PRED_LOAD_CONTINUE36]] ]		; CHECK-NEXT: [[VEC_PHI4:%.]] = phi <4 x i32> [ zeroinitializer, [[VECTOR_PH]] ], [ [[TMP149:%.]], [[PRED_LOAD_CONTINUE36]] ]
; CHECK-NEXT: [[VEC_PHI5:%.]] = phi <4 x i32> [ zeroinitializer, [[VECTOR_PH]] ], [ [[TMP150:%.]], [[PRED_LOAD_CONTINUE36]] ]		; CHECK-NEXT: [[VEC_PHI5:%.]] = phi <4 x i32> [ zeroinitializer, [[VECTOR_PH]] ], [ [[TMP150:%.]], [[PRED_LOAD_CONTINUE36]] ]
▲ Show 20 Lines • Show All 235 Lines • ▼ Show 20 Lines
; CHECK-NEXT: [[RDX_SHUF:%.*]] = shufflevector <4 x i32> [[BIN_RDX41]], <4 x i32> undef, <4 x i32> <i32 2, i32 3, i32 undef, i32 undef>		; CHECK-NEXT: [[RDX_SHUF:%.*]] = shufflevector <4 x i32> [[BIN_RDX41]], <4 x i32> undef, <4 x i32> <i32 2, i32 3, i32 undef, i32 undef>
; CHECK-NEXT: [[BIN_RDX42:%.*]] = add <4 x i32> [[BIN_RDX41]], [[RDX_SHUF]]		; CHECK-NEXT: [[BIN_RDX42:%.*]] = add <4 x i32> [[BIN_RDX41]], [[RDX_SHUF]]
; CHECK-NEXT: [[RDX_SHUF43:%.*]] = shufflevector <4 x i32> [[BIN_RDX42]], <4 x i32> undef, <4 x i32> <i32 1, i32 undef, i32 undef, i32 undef>		; CHECK-NEXT: [[RDX_SHUF43:%.*]] = shufflevector <4 x i32> [[BIN_RDX42]], <4 x i32> undef, <4 x i32> <i32 1, i32 undef, i32 undef, i32 undef>
; CHECK-NEXT: [[BIN_RDX44:%.*]] = add <4 x i32> [[BIN_RDX42]], [[RDX_SHUF43]]		; CHECK-NEXT: [[BIN_RDX44:%.*]] = add <4 x i32> [[BIN_RDX42]], [[RDX_SHUF43]]
; CHECK-NEXT: [[TMP153:%.*]] = extractelement <4 x i32> [[BIN_RDX44]], i32 0		; CHECK-NEXT: [[TMP153:%.*]] = extractelement <4 x i32> [[BIN_RDX44]], i32 0
; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i64 2048, 2048		; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i64 2048, 2048
; CHECK-NEXT: br i1 [[CMP_N]], label [[LOOP_EXIT:%.*]], label [[SCALAR_PH]]		; CHECK-NEXT: br i1 [[CMP_N]], label [[LOOP_EXIT:%.*]], label [[SCALAR_PH]]
; CHECK: scalar.ph:		; CHECK: scalar.ph:
; CHECK-NEXT: [[BC_RESUME_VAL:%.]] = phi i64 [ 4096, [[MIDDLE_BLOCK]] ], [ 0, [[TC_CHECK:%.]] ]		; CHECK-NEXT: [[BC_RESUME_VAL:%.*]] = phi i64 [ 4096, [[MIDDLE_BLOCK]] ], [ 0, [[TC_CHECK]] ]
; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 0, [[TC_CHECK]] ], [ [[TMP153]], [[MIDDLE_BLOCK]] ]		; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 0, [[TC_CHECK]] ], [ [[TMP153]], [[MIDDLE_BLOCK]] ]
; CHECK-NEXT: br label [[LOOP:%.*]]		; CHECK-NEXT: br label [[LOOP:%.*]]
; CHECK: loop:		; CHECK: loop:
; CHECK-NEXT: [[IV:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[IV_NEXT:%.]], [[LATCH:%.*]] ]		; CHECK-NEXT: [[IV:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[IV_NEXT:%.]], [[LATCH:%.*]] ]
; CHECK-NEXT: [[ACCUM:%.]] = phi i32 [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[ACCUM_NEXT:%.]], [[LATCH]] ]		; CHECK-NEXT: [[ACCUM:%.]] = phi i32 [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[ACCUM_NEXT:%.]], [[LATCH]] ]
; CHECK-NEXT: [[IV_NEXT]] = add i64 [[IV]], 2		; CHECK-NEXT: [[IV_NEXT]] = add i64 [[IV]], 2
; CHECK-NEXT: [[TEST_ADDR:%.]] = getelementptr inbounds i1, i1 [[TEST_BASE]], i64 [[IV]]		; CHECK-NEXT: [[TEST_ADDR:%.]] = getelementptr inbounds i1, i1 [[TEST_BASE]], i64 [[IV]]
; CHECK-NEXT: [[EARLYCND:%.]] = load i1, i1 [[TEST_ADDR]]		; CHECK-NEXT: [[EARLYCND:%.]] = load i1, i1 [[TEST_ADDR]]
Show All 34 Lines	latch:
br i1 %exit, label %loop_exit, label %loop		br i1 %exit, label %loop_exit, label %loop

loop_exit:		loop_exit:
ret i32 %accum.next		ret i32 %accum.next
}		}

define i32 @neg_off_by_many(i64 %len, i1* %test_base) {		define i32 @neg_off_by_many(i64 %len, i1* %test_base) {
; CHECK-LABEL: @neg_off_by_many(		; CHECK-LABEL: @neg_off_by_many(
; CHECK-NEXT: tc.check:		; CHECK-NEXT: entry:
; CHECK-NEXT: [[ALLOCA:%.*]] = alloca [1024 x i32]		; CHECK-NEXT: [[ALLOCA:%.*]] = alloca [1024 x i32]
; CHECK-NEXT: [[BASE:%.]] = bitcast [1024 x i32] [[ALLOCA]] to i32*		; CHECK-NEXT: [[BASE:%.]] = bitcast [1024 x i32] [[ALLOCA]] to i32*
; CHECK-NEXT: call void @init(i32* [[BASE]])		; CHECK-NEXT: call void @init(i32* [[BASE]])
		; CHECK-NEXT: br label [[TC_CHECK:%.*]]
		; CHECK: tc.check:
; CHECK-NEXT: br i1 false, label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]		; CHECK-NEXT: br i1 false, label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]
; CHECK: vector.ph:		; CHECK: vector.ph:
; CHECK-NEXT: br label [[VECTOR_BODY:%.*]]		; CHECK-NEXT: br label [[VECTOR_BODY:%.*]]
; CHECK: vector.body:		; CHECK: vector.body:
; CHECK-NEXT: [[INDEX:%.]] = phi i64 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[VECTOR_BODY]] ]		; CHECK-NEXT: [[INDEX:%.]] = phi i64 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[VECTOR_BODY]] ]
; CHECK-NEXT: [[VEC_PHI:%.]] = phi <4 x i32> [ zeroinitializer, [[VECTOR_PH]] ], [ [[TMP80:%.]], [[VECTOR_BODY]] ]		; CHECK-NEXT: [[VEC_PHI:%.]] = phi <4 x i32> [ zeroinitializer, [[VECTOR_PH]] ], [ [[TMP80:%.]], [[VECTOR_BODY]] ]
; CHECK-NEXT: [[VEC_PHI4:%.]] = phi <4 x i32> [ zeroinitializer, [[VECTOR_PH]] ], [ [[TMP81:%.]], [[VECTOR_BODY]] ]		; CHECK-NEXT: [[VEC_PHI4:%.]] = phi <4 x i32> [ zeroinitializer, [[VECTOR_PH]] ], [ [[TMP81:%.]], [[VECTOR_BODY]] ]
; CHECK-NEXT: [[VEC_PHI5:%.]] = phi <4 x i32> [ zeroinitializer, [[VECTOR_PH]] ], [ [[TMP82:%.]], [[VECTOR_BODY]] ]		; CHECK-NEXT: [[VEC_PHI5:%.]] = phi <4 x i32> [ zeroinitializer, [[VECTOR_PH]] ], [ [[TMP82:%.]], [[VECTOR_BODY]] ]
▲ Show 20 Lines • Show All 106 Lines • ▼ Show 20 Lines
; CHECK-NEXT: [[RDX_SHUF:%.*]] = shufflevector <4 x i32> [[BIN_RDX14]], <4 x i32> undef, <4 x i32> <i32 2, i32 3, i32 undef, i32 undef>		; CHECK-NEXT: [[RDX_SHUF:%.*]] = shufflevector <4 x i32> [[BIN_RDX14]], <4 x i32> undef, <4 x i32> <i32 2, i32 3, i32 undef, i32 undef>
; CHECK-NEXT: [[BIN_RDX15:%.*]] = add <4 x i32> [[BIN_RDX14]], [[RDX_SHUF]]		; CHECK-NEXT: [[BIN_RDX15:%.*]] = add <4 x i32> [[BIN_RDX14]], [[RDX_SHUF]]
; CHECK-NEXT: [[RDX_SHUF16:%.*]] = shufflevector <4 x i32> [[BIN_RDX15]], <4 x i32> undef, <4 x i32> <i32 1, i32 undef, i32 undef, i32 undef>		; CHECK-NEXT: [[RDX_SHUF16:%.*]] = shufflevector <4 x i32> [[BIN_RDX15]], <4 x i32> undef, <4 x i32> <i32 1, i32 undef, i32 undef, i32 undef>
; CHECK-NEXT: [[BIN_RDX17:%.*]] = add <4 x i32> [[BIN_RDX15]], [[RDX_SHUF16]]		; CHECK-NEXT: [[BIN_RDX17:%.*]] = add <4 x i32> [[BIN_RDX15]], [[RDX_SHUF16]]
; CHECK-NEXT: [[TMP85:%.*]] = extractelement <4 x i32> [[BIN_RDX17]], i32 0		; CHECK-NEXT: [[TMP85:%.*]] = extractelement <4 x i32> [[BIN_RDX17]], i32 0
; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i64 4096, 4096		; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i64 4096, 4096
; CHECK-NEXT: br i1 [[CMP_N]], label [[LOOP_EXIT:%.*]], label [[SCALAR_PH]]		; CHECK-NEXT: br i1 [[CMP_N]], label [[LOOP_EXIT:%.*]], label [[SCALAR_PH]]
; CHECK: scalar.ph:		; CHECK: scalar.ph:
; CHECK-NEXT: [[BC_RESUME_VAL:%.]] = phi i64 [ 4096, [[MIDDLE_BLOCK]] ], [ 0, [[TC_CHECK:%.]] ]		; CHECK-NEXT: [[BC_RESUME_VAL:%.*]] = phi i64 [ 4096, [[MIDDLE_BLOCK]] ], [ 0, [[TC_CHECK]] ]
; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 0, [[TC_CHECK]] ], [ [[TMP85]], [[MIDDLE_BLOCK]] ]		; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 0, [[TC_CHECK]] ], [ [[TMP85]], [[MIDDLE_BLOCK]] ]
; CHECK-NEXT: br label [[LOOP:%.*]]		; CHECK-NEXT: br label [[LOOP:%.*]]
; CHECK: loop:		; CHECK: loop:
; CHECK-NEXT: [[IV:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[IV_NEXT:%.]], [[LATCH:%.*]] ]		; CHECK-NEXT: [[IV:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[IV_NEXT:%.]], [[LATCH:%.*]] ]
; CHECK-NEXT: [[ACCUM:%.]] = phi i32 [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[ACCUM_NEXT:%.]], [[LATCH]] ]		; CHECK-NEXT: [[ACCUM:%.]] = phi i32 [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[ACCUM_NEXT:%.]], [[LATCH]] ]
; CHECK-NEXT: [[IV_NEXT]] = add i64 [[IV]], 1		; CHECK-NEXT: [[IV_NEXT]] = add i64 [[IV]], 1
; CHECK-NEXT: [[TEST_ADDR:%.]] = getelementptr inbounds i1, i1 [[TEST_BASE]], i64 [[IV]]		; CHECK-NEXT: [[TEST_ADDR:%.]] = getelementptr inbounds i1, i1 [[TEST_BASE]], i64 [[IV]]
; CHECK-NEXT: [[EARLYCND:%.]] = load i1, i1 [[TEST_ADDR]]		; CHECK-NEXT: [[EARLYCND:%.]] = load i1, i1 [[TEST_ADDR]]
Show All 34 Lines	latch:
br i1 %exit, label %loop_exit, label %loop		br i1 %exit, label %loop_exit, label %loop

loop_exit:		loop_exit:
ret i32 %accum.next		ret i32 %accum.next
}		}

define i32 @neg_off_by_one_iteration(i64 %len, i1* %test_base) {		define i32 @neg_off_by_one_iteration(i64 %len, i1* %test_base) {
; CHECK-LABEL: @neg_off_by_one_iteration(		; CHECK-LABEL: @neg_off_by_one_iteration(
; CHECK-NEXT: tc.check:		; CHECK-NEXT: entry:
; CHECK-NEXT: [[ALLOCA:%.*]] = alloca [4095 x i32]		; CHECK-NEXT: [[ALLOCA:%.*]] = alloca [4095 x i32]
; CHECK-NEXT: [[BASE:%.]] = bitcast [4095 x i32] [[ALLOCA]] to i32*		; CHECK-NEXT: [[BASE:%.]] = bitcast [4095 x i32] [[ALLOCA]] to i32*
; CHECK-NEXT: call void @init(i32* [[BASE]])		; CHECK-NEXT: call void @init(i32* [[BASE]])
		; CHECK-NEXT: br label [[TC_CHECK:%.*]]
		; CHECK: tc.check:
; CHECK-NEXT: br i1 false, label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]		; CHECK-NEXT: br i1 false, label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]
; CHECK: vector.ph:		; CHECK: vector.ph:
; CHECK-NEXT: br label [[VECTOR_BODY:%.*]]		; CHECK-NEXT: br label [[VECTOR_BODY:%.*]]
; CHECK: vector.body:		; CHECK: vector.body:
; CHECK-NEXT: [[INDEX:%.]] = phi i64 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[VECTOR_BODY]] ]		; CHECK-NEXT: [[INDEX:%.]] = phi i64 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[VECTOR_BODY]] ]
; CHECK-NEXT: [[VEC_PHI:%.]] = phi <4 x i32> [ zeroinitializer, [[VECTOR_PH]] ], [ [[TMP80:%.]], [[VECTOR_BODY]] ]		; CHECK-NEXT: [[VEC_PHI:%.]] = phi <4 x i32> [ zeroinitializer, [[VECTOR_PH]] ], [ [[TMP80:%.]], [[VECTOR_BODY]] ]
; CHECK-NEXT: [[VEC_PHI4:%.]] = phi <4 x i32> [ zeroinitializer, [[VECTOR_PH]] ], [ [[TMP81:%.]], [[VECTOR_BODY]] ]		; CHECK-NEXT: [[VEC_PHI4:%.]] = phi <4 x i32> [ zeroinitializer, [[VECTOR_PH]] ], [ [[TMP81:%.]], [[VECTOR_BODY]] ]
; CHECK-NEXT: [[VEC_PHI5:%.]] = phi <4 x i32> [ zeroinitializer, [[VECTOR_PH]] ], [ [[TMP82:%.]], [[VECTOR_BODY]] ]		; CHECK-NEXT: [[VEC_PHI5:%.]] = phi <4 x i32> [ zeroinitializer, [[VECTOR_PH]] ], [ [[TMP82:%.]], [[VECTOR_BODY]] ]
▲ Show 20 Lines • Show All 106 Lines • ▼ Show 20 Lines
; CHECK-NEXT: [[RDX_SHUF:%.*]] = shufflevector <4 x i32> [[BIN_RDX14]], <4 x i32> undef, <4 x i32> <i32 2, i32 3, i32 undef, i32 undef>		; CHECK-NEXT: [[RDX_SHUF:%.*]] = shufflevector <4 x i32> [[BIN_RDX14]], <4 x i32> undef, <4 x i32> <i32 2, i32 3, i32 undef, i32 undef>
; CHECK-NEXT: [[BIN_RDX15:%.*]] = add <4 x i32> [[BIN_RDX14]], [[RDX_SHUF]]		; CHECK-NEXT: [[BIN_RDX15:%.*]] = add <4 x i32> [[BIN_RDX14]], [[RDX_SHUF]]
; CHECK-NEXT: [[RDX_SHUF16:%.*]] = shufflevector <4 x i32> [[BIN_RDX15]], <4 x i32> undef, <4 x i32> <i32 1, i32 undef, i32 undef, i32 undef>		; CHECK-NEXT: [[RDX_SHUF16:%.*]] = shufflevector <4 x i32> [[BIN_RDX15]], <4 x i32> undef, <4 x i32> <i32 1, i32 undef, i32 undef, i32 undef>
; CHECK-NEXT: [[BIN_RDX17:%.*]] = add <4 x i32> [[BIN_RDX15]], [[RDX_SHUF16]]		; CHECK-NEXT: [[BIN_RDX17:%.*]] = add <4 x i32> [[BIN_RDX15]], [[RDX_SHUF16]]
; CHECK-NEXT: [[TMP85:%.*]] = extractelement <4 x i32> [[BIN_RDX17]], i32 0		; CHECK-NEXT: [[TMP85:%.*]] = extractelement <4 x i32> [[BIN_RDX17]], i32 0
; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i64 4096, 4096		; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i64 4096, 4096
; CHECK-NEXT: br i1 [[CMP_N]], label [[LOOP_EXIT:%.*]], label [[SCALAR_PH]]		; CHECK-NEXT: br i1 [[CMP_N]], label [[LOOP_EXIT:%.*]], label [[SCALAR_PH]]
; CHECK: scalar.ph:		; CHECK: scalar.ph:
; CHECK-NEXT: [[BC_RESUME_VAL:%.]] = phi i64 [ 4096, [[MIDDLE_BLOCK]] ], [ 0, [[TC_CHECK:%.]] ]		; CHECK-NEXT: [[BC_RESUME_VAL:%.*]] = phi i64 [ 4096, [[MIDDLE_BLOCK]] ], [ 0, [[TC_CHECK]] ]
; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 0, [[TC_CHECK]] ], [ [[TMP85]], [[MIDDLE_BLOCK]] ]		; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 0, [[TC_CHECK]] ], [ [[TMP85]], [[MIDDLE_BLOCK]] ]
; CHECK-NEXT: br label [[LOOP:%.*]]		; CHECK-NEXT: br label [[LOOP:%.*]]
; CHECK: loop:		; CHECK: loop:
; CHECK-NEXT: [[IV:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[IV_NEXT:%.]], [[LATCH:%.*]] ]		; CHECK-NEXT: [[IV:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[IV_NEXT:%.]], [[LATCH:%.*]] ]
; CHECK-NEXT: [[ACCUM:%.]] = phi i32 [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[ACCUM_NEXT:%.]], [[LATCH]] ]		; CHECK-NEXT: [[ACCUM:%.]] = phi i32 [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[ACCUM_NEXT:%.]], [[LATCH]] ]
; CHECK-NEXT: [[IV_NEXT]] = add i64 [[IV]], 1		; CHECK-NEXT: [[IV_NEXT]] = add i64 [[IV]], 1
; CHECK-NEXT: [[TEST_ADDR:%.]] = getelementptr inbounds i1, i1 [[TEST_BASE]], i64 [[IV]]		; CHECK-NEXT: [[TEST_ADDR:%.]] = getelementptr inbounds i1, i1 [[TEST_BASE]], i64 [[IV]]
; CHECK-NEXT: [[EARLYCND:%.]] = load i1, i1 [[TEST_ADDR]]		; CHECK-NEXT: [[EARLYCND:%.]] = load i1, i1 [[TEST_ADDR]]
Show All 34 Lines	latch:
br i1 %exit, label %loop_exit, label %loop		br i1 %exit, label %loop_exit, label %loop

loop_exit:		loop_exit:
ret i32 %accum.next		ret i32 %accum.next
}		}

define i32 @neg_off_by_one_byte(i64 %len, i1* %test_base) {		define i32 @neg_off_by_one_byte(i64 %len, i1* %test_base) {
; CHECK-LABEL: @neg_off_by_one_byte(		; CHECK-LABEL: @neg_off_by_one_byte(
; CHECK-NEXT: tc.check:		; CHECK-NEXT: entry:
; CHECK-NEXT: [[ALLOCA:%.*]] = alloca [16383 x i8]		; CHECK-NEXT: [[ALLOCA:%.*]] = alloca [16383 x i8]
; CHECK-NEXT: [[BASE:%.]] = bitcast [16383 x i8] [[ALLOCA]] to i32*		; CHECK-NEXT: [[BASE:%.]] = bitcast [16383 x i8] [[ALLOCA]] to i32*
; CHECK-NEXT: call void @init(i32* [[BASE]])		; CHECK-NEXT: call void @init(i32* [[BASE]])
		; CHECK-NEXT: br label [[TC_CHECK:%.*]]
		; CHECK: tc.check:
; CHECK-NEXT: br i1 false, label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]		; CHECK-NEXT: br i1 false, label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]
; CHECK: vector.ph:		; CHECK: vector.ph:
; CHECK-NEXT: br label [[VECTOR_BODY:%.*]]		; CHECK-NEXT: br label [[VECTOR_BODY:%.*]]
; CHECK: vector.body:		; CHECK: vector.body:
; CHECK-NEXT: [[INDEX:%.]] = phi i64 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[VECTOR_BODY]] ]		; CHECK-NEXT: [[INDEX:%.]] = phi i64 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[VECTOR_BODY]] ]
; CHECK-NEXT: [[VEC_PHI:%.]] = phi <4 x i32> [ zeroinitializer, [[VECTOR_PH]] ], [ [[TMP80:%.]], [[VECTOR_BODY]] ]		; CHECK-NEXT: [[VEC_PHI:%.]] = phi <4 x i32> [ zeroinitializer, [[VECTOR_PH]] ], [ [[TMP80:%.]], [[VECTOR_BODY]] ]
; CHECK-NEXT: [[VEC_PHI4:%.]] = phi <4 x i32> [ zeroinitializer, [[VECTOR_PH]] ], [ [[TMP81:%.]], [[VECTOR_BODY]] ]		; CHECK-NEXT: [[VEC_PHI4:%.]] = phi <4 x i32> [ zeroinitializer, [[VECTOR_PH]] ], [ [[TMP81:%.]], [[VECTOR_BODY]] ]
; CHECK-NEXT: [[VEC_PHI5:%.]] = phi <4 x i32> [ zeroinitializer, [[VECTOR_PH]] ], [ [[TMP82:%.]], [[VECTOR_BODY]] ]		; CHECK-NEXT: [[VEC_PHI5:%.]] = phi <4 x i32> [ zeroinitializer, [[VECTOR_PH]] ], [ [[TMP82:%.]], [[VECTOR_BODY]] ]
▲ Show 20 Lines • Show All 106 Lines • ▼ Show 20 Lines
; CHECK-NEXT: [[RDX_SHUF:%.*]] = shufflevector <4 x i32> [[BIN_RDX14]], <4 x i32> undef, <4 x i32> <i32 2, i32 3, i32 undef, i32 undef>		; CHECK-NEXT: [[RDX_SHUF:%.*]] = shufflevector <4 x i32> [[BIN_RDX14]], <4 x i32> undef, <4 x i32> <i32 2, i32 3, i32 undef, i32 undef>
; CHECK-NEXT: [[BIN_RDX15:%.*]] = add <4 x i32> [[BIN_RDX14]], [[RDX_SHUF]]		; CHECK-NEXT: [[BIN_RDX15:%.*]] = add <4 x i32> [[BIN_RDX14]], [[RDX_SHUF]]
; CHECK-NEXT: [[RDX_SHUF16:%.*]] = shufflevector <4 x i32> [[BIN_RDX15]], <4 x i32> undef, <4 x i32> <i32 1, i32 undef, i32 undef, i32 undef>		; CHECK-NEXT: [[RDX_SHUF16:%.*]] = shufflevector <4 x i32> [[BIN_RDX15]], <4 x i32> undef, <4 x i32> <i32 1, i32 undef, i32 undef, i32 undef>
; CHECK-NEXT: [[BIN_RDX17:%.*]] = add <4 x i32> [[BIN_RDX15]], [[RDX_SHUF16]]		; CHECK-NEXT: [[BIN_RDX17:%.*]] = add <4 x i32> [[BIN_RDX15]], [[RDX_SHUF16]]
; CHECK-NEXT: [[TMP85:%.*]] = extractelement <4 x i32> [[BIN_RDX17]], i32 0		; CHECK-NEXT: [[TMP85:%.*]] = extractelement <4 x i32> [[BIN_RDX17]], i32 0
; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i64 4096, 4096		; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i64 4096, 4096
; CHECK-NEXT: br i1 [[CMP_N]], label [[LOOP_EXIT:%.*]], label [[SCALAR_PH]]		; CHECK-NEXT: br i1 [[CMP_N]], label [[LOOP_EXIT:%.*]], label [[SCALAR_PH]]
; CHECK: scalar.ph:		; CHECK: scalar.ph:
; CHECK-NEXT: [[BC_RESUME_VAL:%.]] = phi i64 [ 4096, [[MIDDLE_BLOCK]] ], [ 0, [[TC_CHECK:%.]] ]		; CHECK-NEXT: [[BC_RESUME_VAL:%.*]] = phi i64 [ 4096, [[MIDDLE_BLOCK]] ], [ 0, [[TC_CHECK]] ]
; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 0, [[TC_CHECK]] ], [ [[TMP85]], [[MIDDLE_BLOCK]] ]		; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi i32 [ 0, [[TC_CHECK]] ], [ [[TMP85]], [[MIDDLE_BLOCK]] ]
; CHECK-NEXT: br label [[LOOP:%.*]]		; CHECK-NEXT: br label [[LOOP:%.*]]
; CHECK: loop:		; CHECK: loop:
; CHECK-NEXT: [[IV:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[IV_NEXT:%.]], [[LATCH:%.*]] ]		; CHECK-NEXT: [[IV:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[IV_NEXT:%.]], [[LATCH:%.*]] ]
; CHECK-NEXT: [[ACCUM:%.]] = phi i32 [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[ACCUM_NEXT:%.]], [[LATCH]] ]		; CHECK-NEXT: [[ACCUM:%.]] = phi i32 [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ], [ [[ACCUM_NEXT:%.]], [[LATCH]] ]
; CHECK-NEXT: [[IV_NEXT]] = add i64 [[IV]], 1		; CHECK-NEXT: [[IV_NEXT]] = add i64 [[IV]], 1
; CHECK-NEXT: [[TEST_ADDR:%.]] = getelementptr inbounds i1, i1 [[TEST_BASE]], i64 [[IV]]		; CHECK-NEXT: [[TEST_ADDR:%.]] = getelementptr inbounds i1, i1 [[TEST_BASE]], i64 [[IV]]
; CHECK-NEXT: [[EARLYCND:%.]] = load i1, i1 [[TEST_ADDR]]		; CHECK-NEXT: [[EARLYCND:%.]] = load i1, i1 [[TEST_ADDR]]
▲ Show 20 Lines • Show All 41 Lines • Show Last 20 Lines

llvm/test/Transforms/LoopVectorize/X86/masked_load_store.ll

	Show First 20 Lines • Show All 1,937 Lines • ▼ Show 20 Lines
	; if (trigger[i] && (in[i] != 0))			; if (trigger[i] && (in[i] != 0))
	; out[i] = (double) 0.5;			; out[i] = (double) 0.5;
	; }			; }

	define void @foo7(double* noalias nocapture %out, double** noalias nocapture readonly %in, i8* noalias nocapture readonly %trigger, i32 %size) local_unnamed_addr #0 {			define void @foo7(double* noalias nocapture %out, double** noalias nocapture readonly %in, i8* noalias nocapture readonly %trigger, i32 %size) local_unnamed_addr #0 {
	; AVX1-LABEL: @foo7(			; AVX1-LABEL: @foo7(
	; AVX1-NEXT: entry:			; AVX1-NEXT: entry:
	; AVX1-NEXT: [[CMP5:%.]] = icmp eq i32 [[SIZE:%.]], 0			; AVX1-NEXT: [[CMP5:%.]] = icmp eq i32 [[SIZE:%.]], 0
	; AVX1-NEXT: br i1 [[CMP5]], label [[FOR_END:%.]], label [[TC_CHECK:%.]]			; AVX1-NEXT: br i1 [[CMP5]], label [[FOR_END:%.]], label [[FOR_BODY_PREHEADER:%.]]
	; AVX1: tc.check:			; AVX1: for.body.preheader:
	; AVX1-NEXT: [[WIDE_TRIP_COUNT:%.*]] = zext i32 [[SIZE]] to i64			; AVX1-NEXT: [[WIDE_TRIP_COUNT:%.*]] = zext i32 [[SIZE]] to i64
				; AVX1-NEXT: br label [[TC_CHECK:%.*]]
				; AVX1: tc.check:
	; AVX1-NEXT: [[MIN_ITERS_CHECK:%.*]] = icmp ult i64 [[WIDE_TRIP_COUNT]], 16			; AVX1-NEXT: [[MIN_ITERS_CHECK:%.*]] = icmp ult i64 [[WIDE_TRIP_COUNT]], 16
	; AVX1-NEXT: br i1 [[MIN_ITERS_CHECK]], label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]			; AVX1-NEXT: br i1 [[MIN_ITERS_CHECK]], label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]
	; AVX1: vector.ph:			; AVX1: vector.ph:
	; AVX1-NEXT: [[N_MOD_VF:%.*]] = urem i64 [[WIDE_TRIP_COUNT]], 16			; AVX1-NEXT: [[N_MOD_VF:%.*]] = urem i64 [[WIDE_TRIP_COUNT]], 16
	; AVX1-NEXT: [[N_VEC:%.*]] = sub i64 [[WIDE_TRIP_COUNT]], [[N_MOD_VF]]			; AVX1-NEXT: [[N_VEC:%.*]] = sub i64 [[WIDE_TRIP_COUNT]], [[N_MOD_VF]]
	; AVX1-NEXT: br label [[VECTOR_BODY:%.*]]			; AVX1-NEXT: br label [[VECTOR_BODY:%.*]]
	; AVX1: vector.body:			; AVX1: vector.body:
	; AVX1-NEXT: [[INDEX:%.]] = phi i64 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[VECTOR_BODY]] ]			; AVX1-NEXT: [[INDEX:%.]] = phi i64 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[VECTOR_BODY]] ]
	▲ Show 20 Lines • Show All 111 Lines • ▼ Show 20 Lines
	; AVX1: for.end.loopexit:			; AVX1: for.end.loopexit:
	; AVX1-NEXT: br label [[FOR_END]]			; AVX1-NEXT: br label [[FOR_END]]
	; AVX1: for.end:			; AVX1: for.end:
	; AVX1-NEXT: ret void			; AVX1-NEXT: ret void
	;			;
	; AVX2-LABEL: @foo7(			; AVX2-LABEL: @foo7(
	; AVX2-NEXT: entry:			; AVX2-NEXT: entry:
	; AVX2-NEXT: [[CMP5:%.]] = icmp eq i32 [[SIZE:%.]], 0			; AVX2-NEXT: [[CMP5:%.]] = icmp eq i32 [[SIZE:%.]], 0
	; AVX2-NEXT: br i1 [[CMP5]], label [[FOR_END:%.]], label [[TC_CHECK:%.]]			; AVX2-NEXT: br i1 [[CMP5]], label [[FOR_END:%.]], label [[FOR_BODY_PREHEADER:%.]]
	; AVX2: tc.check:			; AVX2: for.body.preheader:
	; AVX2-NEXT: [[WIDE_TRIP_COUNT:%.*]] = zext i32 [[SIZE]] to i64			; AVX2-NEXT: [[WIDE_TRIP_COUNT:%.*]] = zext i32 [[SIZE]] to i64
				; AVX2-NEXT: br label [[TC_CHECK:%.*]]
				; AVX2: tc.check:
	; AVX2-NEXT: [[MIN_ITERS_CHECK:%.*]] = icmp ult i64 [[WIDE_TRIP_COUNT]], 16			; AVX2-NEXT: [[MIN_ITERS_CHECK:%.*]] = icmp ult i64 [[WIDE_TRIP_COUNT]], 16
	; AVX2-NEXT: br i1 [[MIN_ITERS_CHECK]], label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]			; AVX2-NEXT: br i1 [[MIN_ITERS_CHECK]], label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]
	; AVX2: vector.ph:			; AVX2: vector.ph:
	; AVX2-NEXT: [[N_MOD_VF:%.*]] = urem i64 [[WIDE_TRIP_COUNT]], 16			; AVX2-NEXT: [[N_MOD_VF:%.*]] = urem i64 [[WIDE_TRIP_COUNT]], 16
	; AVX2-NEXT: [[N_VEC:%.*]] = sub i64 [[WIDE_TRIP_COUNT]], [[N_MOD_VF]]			; AVX2-NEXT: [[N_VEC:%.*]] = sub i64 [[WIDE_TRIP_COUNT]], [[N_MOD_VF]]
	; AVX2-NEXT: br label [[VECTOR_BODY:%.*]]			; AVX2-NEXT: br label [[VECTOR_BODY:%.*]]
	; AVX2: vector.body:			; AVX2: vector.body:
	; AVX2-NEXT: [[INDEX:%.]] = phi i64 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[VECTOR_BODY]] ]			; AVX2-NEXT: [[INDEX:%.]] = phi i64 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[VECTOR_BODY]] ]
	▲ Show 20 Lines • Show All 111 Lines • ▼ Show 20 Lines
	; AVX2: for.end.loopexit:			; AVX2: for.end.loopexit:
	; AVX2-NEXT: br label [[FOR_END]]			; AVX2-NEXT: br label [[FOR_END]]
	; AVX2: for.end:			; AVX2: for.end:
	; AVX2-NEXT: ret void			; AVX2-NEXT: ret void
	;			;
	; AVX512-LABEL: @foo7(			; AVX512-LABEL: @foo7(
	; AVX512-NEXT: entry:			; AVX512-NEXT: entry:
	; AVX512-NEXT: [[CMP5:%.]] = icmp eq i32 [[SIZE:%.]], 0			; AVX512-NEXT: [[CMP5:%.]] = icmp eq i32 [[SIZE:%.]], 0
	; AVX512-NEXT: br i1 [[CMP5]], label [[FOR_END:%.]], label [[TC_CHECK:%.]]			; AVX512-NEXT: br i1 [[CMP5]], label [[FOR_END:%.]], label [[FOR_BODY_PREHEADER:%.]]
	; AVX512: tc.check:			; AVX512: for.body.preheader:
	; AVX512-NEXT: [[WIDE_TRIP_COUNT:%.*]] = zext i32 [[SIZE]] to i64			; AVX512-NEXT: [[WIDE_TRIP_COUNT:%.*]] = zext i32 [[SIZE]] to i64
				; AVX512-NEXT: br label [[TC_CHECK:%.*]]
				; AVX512: tc.check:
	; AVX512-NEXT: [[MIN_ITERS_CHECK:%.*]] = icmp ult i64 [[WIDE_TRIP_COUNT]], 32			; AVX512-NEXT: [[MIN_ITERS_CHECK:%.*]] = icmp ult i64 [[WIDE_TRIP_COUNT]], 32
	; AVX512-NEXT: br i1 [[MIN_ITERS_CHECK]], label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]			; AVX512-NEXT: br i1 [[MIN_ITERS_CHECK]], label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]
	; AVX512: vector.ph:			; AVX512: vector.ph:
	; AVX512-NEXT: [[N_MOD_VF:%.*]] = urem i64 [[WIDE_TRIP_COUNT]], 32			; AVX512-NEXT: [[N_MOD_VF:%.*]] = urem i64 [[WIDE_TRIP_COUNT]], 32
	; AVX512-NEXT: [[N_VEC:%.*]] = sub i64 [[WIDE_TRIP_COUNT]], [[N_MOD_VF]]			; AVX512-NEXT: [[N_VEC:%.*]] = sub i64 [[WIDE_TRIP_COUNT]], [[N_MOD_VF]]
	; AVX512-NEXT: br label [[VECTOR_BODY:%.*]]			; AVX512-NEXT: br label [[VECTOR_BODY:%.*]]
	; AVX512: vector.body:			; AVX512: vector.body:
	; AVX512-NEXT: [[INDEX:%.]] = phi i64 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[VECTOR_BODY]] ]			; AVX512-NEXT: [[INDEX:%.]] = phi i64 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[VECTOR_BODY]] ]
	▲ Show 20 Lines • Show All 156 Lines • ▼ Show 20 Lines
	; if (trigger[i] && (in[i] != 0))			; if (trigger[i] && (in[i] != 0))
	; out[i] = (double) 0.5;			; out[i] = (double) 0.5;
	;}			;}

	define void @foo8(double* noalias nocapture %out, i32 ()** noalias nocapture readonly %in, i8* noalias nocapture readonly %trigger, i32 %size) local_unnamed_addr #0 {			define void @foo8(double* noalias nocapture %out, i32 ()** noalias nocapture readonly %in, i8* noalias nocapture readonly %trigger, i32 %size) local_unnamed_addr #0 {
	; AVX1-LABEL: @foo8(			; AVX1-LABEL: @foo8(
	; AVX1-NEXT: entry:			; AVX1-NEXT: entry:
	; AVX1-NEXT: [[CMP5:%.]] = icmp eq i32 [[SIZE:%.]], 0			; AVX1-NEXT: [[CMP5:%.]] = icmp eq i32 [[SIZE:%.]], 0
	; AVX1-NEXT: br i1 [[CMP5]], label [[FOR_END:%.]], label [[TC_CHECK:%.]]			; AVX1-NEXT: br i1 [[CMP5]], label [[FOR_END:%.]], label [[FOR_BODY_PREHEADER:%.]]
	; AVX1: tc.check:			; AVX1: for.body.preheader:
	; AVX1-NEXT: [[WIDE_TRIP_COUNT:%.*]] = zext i32 [[SIZE]] to i64			; AVX1-NEXT: [[WIDE_TRIP_COUNT:%.*]] = zext i32 [[SIZE]] to i64
				; AVX1-NEXT: br label [[TC_CHECK:%.*]]
				; AVX1: tc.check:
	; AVX1-NEXT: [[MIN_ITERS_CHECK:%.*]] = icmp ult i64 [[WIDE_TRIP_COUNT]], 16			; AVX1-NEXT: [[MIN_ITERS_CHECK:%.*]] = icmp ult i64 [[WIDE_TRIP_COUNT]], 16
	; AVX1-NEXT: br i1 [[MIN_ITERS_CHECK]], label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]			; AVX1-NEXT: br i1 [[MIN_ITERS_CHECK]], label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]
	; AVX1: vector.ph:			; AVX1: vector.ph:
	; AVX1-NEXT: [[N_MOD_VF:%.*]] = urem i64 [[WIDE_TRIP_COUNT]], 16			; AVX1-NEXT: [[N_MOD_VF:%.*]] = urem i64 [[WIDE_TRIP_COUNT]], 16
	; AVX1-NEXT: [[N_VEC:%.*]] = sub i64 [[WIDE_TRIP_COUNT]], [[N_MOD_VF]]			; AVX1-NEXT: [[N_VEC:%.*]] = sub i64 [[WIDE_TRIP_COUNT]], [[N_MOD_VF]]
	; AVX1-NEXT: br label [[VECTOR_BODY:%.*]]			; AVX1-NEXT: br label [[VECTOR_BODY:%.*]]
	; AVX1: vector.body:			; AVX1: vector.body:
	; AVX1-NEXT: [[INDEX:%.]] = phi i64 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[VECTOR_BODY]] ]			; AVX1-NEXT: [[INDEX:%.]] = phi i64 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[VECTOR_BODY]] ]
	▲ Show 20 Lines • Show All 111 Lines • ▼ Show 20 Lines
	; AVX1: for.end.loopexit:			; AVX1: for.end.loopexit:
	; AVX1-NEXT: br label [[FOR_END]]			; AVX1-NEXT: br label [[FOR_END]]
	; AVX1: for.end:			; AVX1: for.end:
	; AVX1-NEXT: ret void			; AVX1-NEXT: ret void
	;			;
	; AVX2-LABEL: @foo8(			; AVX2-LABEL: @foo8(
	; AVX2-NEXT: entry:			; AVX2-NEXT: entry:
	; AVX2-NEXT: [[CMP5:%.]] = icmp eq i32 [[SIZE:%.]], 0			; AVX2-NEXT: [[CMP5:%.]] = icmp eq i32 [[SIZE:%.]], 0
	; AVX2-NEXT: br i1 [[CMP5]], label [[FOR_END:%.]], label [[TC_CHECK:%.]]			; AVX2-NEXT: br i1 [[CMP5]], label [[FOR_END:%.]], label [[FOR_BODY_PREHEADER:%.]]
	; AVX2: tc.check:			; AVX2: for.body.preheader:
	; AVX2-NEXT: [[WIDE_TRIP_COUNT:%.*]] = zext i32 [[SIZE]] to i64			; AVX2-NEXT: [[WIDE_TRIP_COUNT:%.*]] = zext i32 [[SIZE]] to i64
				; AVX2-NEXT: br label [[TC_CHECK:%.*]]
				; AVX2: tc.check:
	; AVX2-NEXT: [[MIN_ITERS_CHECK:%.*]] = icmp ult i64 [[WIDE_TRIP_COUNT]], 16			; AVX2-NEXT: [[MIN_ITERS_CHECK:%.*]] = icmp ult i64 [[WIDE_TRIP_COUNT]], 16
	; AVX2-NEXT: br i1 [[MIN_ITERS_CHECK]], label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]			; AVX2-NEXT: br i1 [[MIN_ITERS_CHECK]], label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]
	; AVX2: vector.ph:			; AVX2: vector.ph:
	; AVX2-NEXT: [[N_MOD_VF:%.*]] = urem i64 [[WIDE_TRIP_COUNT]], 16			; AVX2-NEXT: [[N_MOD_VF:%.*]] = urem i64 [[WIDE_TRIP_COUNT]], 16
	; AVX2-NEXT: [[N_VEC:%.*]] = sub i64 [[WIDE_TRIP_COUNT]], [[N_MOD_VF]]			; AVX2-NEXT: [[N_VEC:%.*]] = sub i64 [[WIDE_TRIP_COUNT]], [[N_MOD_VF]]
	; AVX2-NEXT: br label [[VECTOR_BODY:%.*]]			; AVX2-NEXT: br label [[VECTOR_BODY:%.*]]
	; AVX2: vector.body:			; AVX2: vector.body:
	; AVX2-NEXT: [[INDEX:%.]] = phi i64 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[VECTOR_BODY]] ]			; AVX2-NEXT: [[INDEX:%.]] = phi i64 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[VECTOR_BODY]] ]
	▲ Show 20 Lines • Show All 111 Lines • ▼ Show 20 Lines
	; AVX2: for.end.loopexit:			; AVX2: for.end.loopexit:
	; AVX2-NEXT: br label [[FOR_END]]			; AVX2-NEXT: br label [[FOR_END]]
	; AVX2: for.end:			; AVX2: for.end:
	; AVX2-NEXT: ret void			; AVX2-NEXT: ret void
	;			;
	; AVX512-LABEL: @foo8(			; AVX512-LABEL: @foo8(
	; AVX512-NEXT: entry:			; AVX512-NEXT: entry:
	; AVX512-NEXT: [[CMP5:%.]] = icmp eq i32 [[SIZE:%.]], 0			; AVX512-NEXT: [[CMP5:%.]] = icmp eq i32 [[SIZE:%.]], 0
	; AVX512-NEXT: br i1 [[CMP5]], label [[FOR_END:%.]], label [[TC_CHECK:%.]]			; AVX512-NEXT: br i1 [[CMP5]], label [[FOR_END:%.]], label [[FOR_BODY_PREHEADER:%.]]
	; AVX512: tc.check:			; AVX512: for.body.preheader:
	; AVX512-NEXT: [[WIDE_TRIP_COUNT:%.*]] = zext i32 [[SIZE]] to i64			; AVX512-NEXT: [[WIDE_TRIP_COUNT:%.*]] = zext i32 [[SIZE]] to i64
				; AVX512-NEXT: br label [[TC_CHECK:%.*]]
				; AVX512: tc.check:
	; AVX512-NEXT: [[MIN_ITERS_CHECK:%.*]] = icmp ult i64 [[WIDE_TRIP_COUNT]], 32			; AVX512-NEXT: [[MIN_ITERS_CHECK:%.*]] = icmp ult i64 [[WIDE_TRIP_COUNT]], 32
	; AVX512-NEXT: br i1 [[MIN_ITERS_CHECK]], label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]			; AVX512-NEXT: br i1 [[MIN_ITERS_CHECK]], label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]
	; AVX512: vector.ph:			; AVX512: vector.ph:
	; AVX512-NEXT: [[N_MOD_VF:%.*]] = urem i64 [[WIDE_TRIP_COUNT]], 32			; AVX512-NEXT: [[N_MOD_VF:%.*]] = urem i64 [[WIDE_TRIP_COUNT]], 32
	; AVX512-NEXT: [[N_VEC:%.*]] = sub i64 [[WIDE_TRIP_COUNT]], [[N_MOD_VF]]			; AVX512-NEXT: [[N_VEC:%.*]] = sub i64 [[WIDE_TRIP_COUNT]], [[N_MOD_VF]]
	; AVX512-NEXT: br label [[VECTOR_BODY:%.*]]			; AVX512-NEXT: br label [[VECTOR_BODY:%.*]]
	; AVX512: vector.body:			; AVX512: vector.body:
	; AVX512-NEXT: [[INDEX:%.]] = phi i64 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[VECTOR_BODY]] ]			; AVX512-NEXT: [[INDEX:%.]] = phi i64 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[VECTOR_BODY]] ]
	▲ Show 20 Lines • Show All 153 Lines • Show Last 20 Lines

llvm/test/Transforms/LoopVectorize/X86/pr23997.ll

	; NOTE: Assertions have been autogenerated by utils/update_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_test_checks.py
	; RUN: opt -S -loop-vectorize -dce -instcombine < %s \| FileCheck %s			; RUN: opt -S -loop-vectorize -dce -instcombine < %s \| FileCheck %s

	target datalayout = "e-m:e-i64:64-f80:128-n8:16:32:64-S128-ni:1"			target datalayout = "e-m:e-i64:64-f80:128-n8:16:32:64-S128-ni:1"
	target triple = "x86_64-unknown-linux-gnu"			target triple = "x86_64-unknown-linux-gnu"

	; Ensure that the 'inbounds' is preserved on the GEPs that feed the load and store in the loop.			; Ensure that the 'inbounds' is preserved on the GEPs that feed the load and store in the loop.
	define void @foo(i8 addrspace(1)* align 8 dereferenceable_or_null(16), i8 addrspace(1)* align 8 dereferenceable_or_null(8), i64) #0 {			define void @foo(i8 addrspace(1)* align 8 dereferenceable_or_null(16), i8 addrspace(1)* align 8 dereferenceable_or_null(8), i64) #0 {
	; CHECK-LABEL: @foo(			; CHECK-LABEL: @foo(
	; CHECK-NEXT: entry:			; CHECK-NEXT: entry:
	; CHECK-NEXT: br label [[TC_CHECK:%.*]]			; CHECK-NEXT: br label [[PREHEADER:%.*]]
	; CHECK: tc.check:			; CHECK: preheader:
	; CHECK-NEXT: [[DOT10:%.]] = getelementptr inbounds i8, i8 addrspace(1) [[TMP0:%.*]], i64 16			; CHECK-NEXT: [[DOT10:%.]] = getelementptr inbounds i8, i8 addrspace(1) [[TMP0:%.*]], i64 16
	; CHECK-NEXT: [[DOT11:%.]] = bitcast i8 addrspace(1) [[DOT10]] to i8 addrspace(1)* addrspace(1)*			; CHECK-NEXT: [[DOT11:%.]] = bitcast i8 addrspace(1) [[DOT10]] to i8 addrspace(1)* addrspace(1)*
	; CHECK-NEXT: [[DOT12:%.]] = getelementptr inbounds i8, i8 addrspace(1) [[TMP1:%.*]], i64 16			; CHECK-NEXT: [[DOT12:%.]] = getelementptr inbounds i8, i8 addrspace(1) [[TMP1:%.*]], i64 16
	; CHECK-NEXT: [[DOT13:%.]] = bitcast i8 addrspace(1) [[DOT12]] to i8 addrspace(1)* addrspace(1)*			; CHECK-NEXT: [[DOT13:%.]] = bitcast i8 addrspace(1) [[DOT12]] to i8 addrspace(1)* addrspace(1)*
				; CHECK-NEXT: br label [[TC_CHECK:%.*]]
				; CHECK: tc.check:
	; CHECK-NEXT: [[TMP3:%.]] = icmp ugt i64 [[TMP2:%.]], 1			; CHECK-NEXT: [[TMP3:%.]] = icmp ugt i64 [[TMP2:%.]], 1
	; CHECK-NEXT: [[UMAX:%.*]] = select i1 [[TMP3]], i64 [[TMP2]], i64 1			; CHECK-NEXT: [[UMAX:%.*]] = select i1 [[TMP3]], i64 [[TMP2]], i64 1
	; CHECK-NEXT: [[MIN_ITERS_CHECK:%.*]] = icmp ult i64 [[UMAX]], 16			; CHECK-NEXT: [[MIN_ITERS_CHECK:%.*]] = icmp ult i64 [[UMAX]], 16
	; CHECK-NEXT: br i1 [[MIN_ITERS_CHECK]], label [[SCALAR_PH:%.]], label [[VECTOR_MEMCHECK:%.]]			; CHECK-NEXT: br i1 [[MIN_ITERS_CHECK]], label [[SCALAR_PH:%.]], label [[VECTOR_MEMCHECK:%.]]
	; CHECK: vector.memcheck:			; CHECK: vector.memcheck:
	; CHECK-NEXT: [[TMP4:%.*]] = icmp ugt i64 [[TMP2]], 1			; CHECK-NEXT: [[TMP4:%.*]] = icmp ugt i64 [[TMP2]], 1
	; CHECK-NEXT: [[UMAX1:%.*]] = select i1 [[TMP4]], i64 [[TMP2]], i64 1			; CHECK-NEXT: [[UMAX1:%.*]] = select i1 [[TMP4]], i64 [[TMP2]], i64 1
	; CHECK-NEXT: [[TMP5:%.*]] = shl i64 [[UMAX1]], 3			; CHECK-NEXT: [[TMP5:%.*]] = shl i64 [[UMAX1]], 3
	▲ Show 20 Lines • Show All 85 Lines • Show Last 20 Lines

llvm/test/Transforms/LoopVectorize/X86/pr35432.ll

	Show All 26 Lines
	; CHECK-NEXT: [[CMP8:%.*]] = icmp eq i32 [[CONV17]], 0			; CHECK-NEXT: [[CMP8:%.*]] = icmp eq i32 [[CONV17]], 0
	; CHECK-NEXT: br i1 [[CMP8]], label [[FOR_BODY_LR_PH:%.]], label [[FOR_END12:%.]]			; CHECK-NEXT: br i1 [[CMP8]], label [[FOR_BODY_LR_PH:%.]], label [[FOR_END12:%.]]
	; CHECK: for.body.lr.ph:			; CHECK: for.body.lr.ph:
	; CHECK-NEXT: br label [[FOR_BODY:%.*]]			; CHECK-NEXT: br label [[FOR_BODY:%.*]]
	; CHECK: for.body:			; CHECK: for.body:
	; CHECK-NEXT: [[STOREMERGE_IN9:%.]] = phi i32 [ [[TMP2]], [[FOR_BODY_LR_PH]] ], [ [[ADD:%.]], [[FOR_INC9:%.*]] ]			; CHECK-NEXT: [[STOREMERGE_IN9:%.]] = phi i32 [ [[TMP2]], [[FOR_BODY_LR_PH]] ], [ [[ADD:%.]], [[FOR_INC9:%.*]] ]
	; CHECK-NEXT: [[CONV52:%.*]] = and i32 [[STOREMERGE_IN9]], 255			; CHECK-NEXT: [[CONV52:%.*]] = and i32 [[STOREMERGE_IN9]], 255
	; CHECK-NEXT: [[CMP63:%.*]] = icmp ult i32 [[TMP2]], [[CONV52]]			; CHECK-NEXT: [[CMP63:%.*]] = icmp ult i32 [[TMP2]], [[CONV52]]
	; CHECK-NEXT: br i1 [[CMP63]], label [[TC_CHECK:%.*]], label [[FOR_INC9]]			; CHECK-NEXT: br i1 [[CMP63]], label [[FOR_BODY8_LR_PH:%.*]], label [[FOR_INC9]]
	; CHECK: tc.check:			; CHECK: for.body8.lr.ph:
	; CHECK-NEXT: [[CONV3:%.*]] = trunc i32 [[STOREMERGE_IN9]] to i8			; CHECK-NEXT: [[CONV3:%.*]] = trunc i32 [[STOREMERGE_IN9]] to i8
	; CHECK-NEXT: [[DOTPROMOTED:%.]] = load i32, i32 getelementptr inbounds ([192 x [192 x i32]], [192 x [192 x i32]]* @a, i64 0, i64 0, i64 0), align 16			; CHECK-NEXT: [[DOTPROMOTED:%.]] = load i32, i32 getelementptr inbounds ([192 x [192 x i32]], [192 x [192 x i32]]* @a, i64 0, i64 0, i64 0), align 16
				; CHECK-NEXT: br label [[TC_CHECK:%.*]]
				; CHECK: tc.check:
	; CHECK-NEXT: [[TMP3:%.*]] = add i8 [[CONV3]], -1			; CHECK-NEXT: [[TMP3:%.*]] = add i8 [[CONV3]], -1
	; CHECK-NEXT: [[TMP4:%.*]] = zext i8 [[TMP3]] to i32			; CHECK-NEXT: [[TMP4:%.*]] = zext i8 [[TMP3]] to i32
	; CHECK-NEXT: [[TMP5:%.*]] = add i32 [[TMP4]], 1			; CHECK-NEXT: [[TMP5:%.*]] = add i32 [[TMP4]], 1
	; CHECK-NEXT: [[TMP6:%.*]] = icmp ult i32 [[TMP2]], [[TMP4]]			; CHECK-NEXT: [[TMP6:%.*]] = icmp ult i32 [[TMP2]], [[TMP4]]
	; CHECK-NEXT: [[UMIN:%.*]] = select i1 [[TMP6]], i32 [[TMP2]], i32 [[TMP4]]			; CHECK-NEXT: [[UMIN:%.*]] = select i1 [[TMP6]], i32 [[TMP2]], i32 [[TMP4]]
	; CHECK-NEXT: [[TMP7:%.*]] = sub i32 [[TMP5]], [[UMIN]]			; CHECK-NEXT: [[TMP7:%.*]] = sub i32 [[TMP5]], [[UMIN]]
	; CHECK-NEXT: [[MIN_ITERS_CHECK:%.*]] = icmp ult i32 [[TMP7]], 8			; CHECK-NEXT: [[MIN_ITERS_CHECK:%.*]] = icmp ult i32 [[TMP7]], 8
	; CHECK-NEXT: br i1 [[MIN_ITERS_CHECK]], label [[SCALAR_PH:%.]], label [[VECTOR_SCEVCHECK:%.]]			; CHECK-NEXT: br i1 [[MIN_ITERS_CHECK]], label [[SCALAR_PH:%.]], label [[VECTOR_SCEVCHECK:%.]]
	▲ Show 20 Lines • Show All 163 Lines • Show Last 20 Lines

llvm/test/Transforms/LoopVectorize/X86/x86-interleaved-accesses-masked-group.ll

	Show First 20 Lines • Show All 84 Lines • ▼ Show 20 Lines
	; Exactly the same scenario except we are now optimizing for size, therefore			; Exactly the same scenario except we are now optimizing for size, therefore
	; we check that no scalar epilogue is created. Since we can't create an epilog			; we check that no scalar epilogue is created. Since we can't create an epilog
	; we need the ability to mask out the gaps.			; we need the ability to mask out the gaps.
	; When enable-masked-interleaved-access is enabled, the interleave-groups will			; When enable-masked-interleaved-access is enabled, the interleave-groups will
	; be vectorized with masked wide-loads with the mask properly shuffled and			; be vectorized with masked wide-loads with the mask properly shuffled and
	; And-ed with the gaps mask.			; And-ed with the gaps mask.

	;ENABLED_MASKED_STRIDED-LABEL: @masked_strided1_optsize(			;ENABLED_MASKED_STRIDED-LABEL: @masked_strided1_optsize(
	;ENABLED_MASKED_STRIDED-NEXT: tc.check:			;ENABLED_MASKED_STRIDED-NEXT: entry:
	;ENABLED_MASKED_STRIDED-NEXT: [[CONV:%.]] = zext i8 [[GUARD:%.]] to i32			;ENABLED_MASKED_STRIDED-NEXT: [[CONV:%.]] = zext i8 [[GUARD:%.]] to i32
	;ENABLED_MASKED_STRIDED-NEXT: [[BROADCAST_SPLATINSERT:%.*]] = insertelement <8 x i32> undef, i32 [[CONV]], i32 0			;ENABLED_MASKED_STRIDED-NEXT: [[BROADCAST_SPLATINSERT:%.*]] = insertelement <8 x i32> undef, i32 [[CONV]], i32 0
	;ENABLED_MASKED_STRIDED-NEXT: [[BROADCAST_SPLAT:%.*]] = shufflevector <8 x i32> [[BROADCAST_SPLATINSERT]], <8 x i32> undef, <8 x i32> zeroinitializer			;ENABLED_MASKED_STRIDED-NEXT: [[BROADCAST_SPLAT:%.*]] = shufflevector <8 x i32> [[BROADCAST_SPLATINSERT]], <8 x i32> undef, <8 x i32> zeroinitializer
	;ENABLED_MASKED_STRIDED-NEXT: br label [[VECTOR_BODY:%.*]]			;ENABLED_MASKED_STRIDED-NEXT: br label [[VECTOR_BODY:%.*]]
	;ENABLED_MASKED_STRIDED: vector.body:			;ENABLED_MASKED_STRIDED: vector.body:
	;ENABLED_MASKED_STRIDED-NEXT: [[INDEX:%.]] = phi i32 [ 0, [[ENTRY:%.]] ], [ [[INDEX_NEXT:%.*]], [[VECTOR_BODY]] ]			;ENABLED_MASKED_STRIDED-NEXT: [[INDEX:%.]] = phi i32 [ 0, [[ENTRY:%.]] ], [ [[INDEX_NEXT:%.*]], [[VECTOR_BODY]] ]
	;ENABLED_MASKED_STRIDED-NEXT: [[VEC_IND:%.]] = phi <8 x i32> [ <i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7>, [[ENTRY]] ], [ [[VEC_IND_NEXT:%.]], [[VECTOR_BODY]] ]			;ENABLED_MASKED_STRIDED-NEXT: [[VEC_IND:%.]] = phi <8 x i32> [ <i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7>, [[ENTRY]] ], [ [[VEC_IND_NEXT:%.]], [[VECTOR_BODY]] ]
	;ENABLED_MASKED_STRIDED-NEXT: [[TMP0:%.*]] = icmp ugt <8 x i32> [[VEC_IND]], [[BROADCAST_SPLAT]]			;ENABLED_MASKED_STRIDED-NEXT: [[TMP0:%.*]] = icmp ugt <8 x i32> [[VEC_IND]], [[BROADCAST_SPLAT]]
	▲ Show 20 Lines • Show All 90 Lines • ▼ Show 20 Lines
	; DISABLED_MASKED_STRIDED: for.end:			; DISABLED_MASKED_STRIDED: for.end:
	; DISABLED_MASKED_STRIDED-NEXT: ret void			; DISABLED_MASKED_STRIDED-NEXT: ret void


	; ENABLED_MASKED_STRIDED-LABEL: @masked_strided1_optsize_unknown_tc(			; ENABLED_MASKED_STRIDED-LABEL: @masked_strided1_optsize_unknown_tc(
	; ENABLED_MASKED_STRIDED-NEXT: entry:			; ENABLED_MASKED_STRIDED-NEXT: entry:
	; ENABLED_MASKED_STRIDED-NEXT: [[CMP9:%.]] = icmp sgt i32 [[N:%.]], 0			; ENABLED_MASKED_STRIDED-NEXT: [[CMP9:%.]] = icmp sgt i32 [[N:%.]], 0
	; ENABLED_MASKED_STRIDED-NEXT: br i1 [[CMP9]], label [[VECTOR_PH:%.]], label [[FOR_END:%.]]			; ENABLED_MASKED_STRIDED-NEXT: br i1 [[CMP9]], label [[VECTOR_PH:%.]], label [[FOR_END:%.]]
	; ENABLED_MASKED_STRIDED: vector.ph:			; ENABLED_MASKED_STRIDED: for.body.lr.ph:
	; ENABLED_MASKED_STRIDED-NEXT: [[CONV:%.]] = zext i8 [[GUARD:%.]] to i32			; ENABLED_MASKED_STRIDED-NEXT: [[CONV:%.]] = zext i8 [[GUARD:%.]] to i32
	; ENABLED_MASKED_STRIDED-NEXT: [[N_RND_UP:%.*]] = add i32 [[N]], 7			; ENABLED_MASKED_STRIDED-NEXT: [[N_RND_UP:%.*]] = add i32 [[N]], 7
	; ENABLED_MASKED_STRIDED-NEXT: [[N_VEC:%.*]] = and i32 [[N_RND_UP]], -8			; ENABLED_MASKED_STRIDED-NEXT: [[N_VEC:%.*]] = and i32 [[N_RND_UP]], -8
	; ENABLED_MASKED_STRIDED-NEXT: [[TRIP_COUNT_MINUS_1:%.*]] = add i32 [[N]], -1			; ENABLED_MASKED_STRIDED-NEXT: [[TRIP_COUNT_MINUS_1:%.*]] = add i32 [[N]], -1
	; ENABLED_MASKED_STRIDED-NEXT: [[BROADCAST_SPLATINSERT:%.*]] = insertelement <8 x i32> undef, i32 [[CONV]], i32 0			; ENABLED_MASKED_STRIDED-NEXT: [[BROADCAST_SPLATINSERT:%.*]] = insertelement <8 x i32> undef, i32 [[CONV]], i32 0
	; ENABLED_MASKED_STRIDED-NEXT: [[BROADCAST_SPLAT:%.*]] = shufflevector <8 x i32> [[BROADCAST_SPLATINSERT]], <8 x i32> undef, <8 x i32> zeroinitializer			; ENABLED_MASKED_STRIDED-NEXT: [[BROADCAST_SPLAT:%.*]] = shufflevector <8 x i32> [[BROADCAST_SPLATINSERT]], <8 x i32> undef, <8 x i32> zeroinitializer
	; ENABLED_MASKED_STRIDED-NEXT: [[BROADCAST_SPLATINSERT1:%.*]] = insertelement <8 x i32> undef, i32 [[TRIP_COUNT_MINUS_1]], i32 0			; ENABLED_MASKED_STRIDED-NEXT: [[BROADCAST_SPLATINSERT1:%.*]] = insertelement <8 x i32> undef, i32 [[TRIP_COUNT_MINUS_1]], i32 0
	; ENABLED_MASKED_STRIDED-NEXT: [[BROADCAST_SPLAT2:%.*]] = shufflevector <8 x i32> [[BROADCAST_SPLATINSERT1]], <8 x i32> undef, <8 x i32> zeroinitializer			; ENABLED_MASKED_STRIDED-NEXT: [[BROADCAST_SPLAT2:%.*]] = shufflevector <8 x i32> [[BROADCAST_SPLATINSERT1]], <8 x i32> undef, <8 x i32> zeroinitializer
	▲ Show 20 Lines • Show All 81 Lines • ▼ Show 20 Lines
	; }			; }
	; }			; }


	; ENABLED_MASKED_STRIDED-LABEL: @masked_strided3_optsize_unknown_tc(			; ENABLED_MASKED_STRIDED-LABEL: @masked_strided3_optsize_unknown_tc(
	; ENABLED_MASKED_STRIDED-NEXT: entry:			; ENABLED_MASKED_STRIDED-NEXT: entry:
	; ENABLED_MASKED_STRIDED-NEXT: [[CMP9:%.]] = icmp sgt i32 [[N:%.]], 0			; ENABLED_MASKED_STRIDED-NEXT: [[CMP9:%.]] = icmp sgt i32 [[N:%.]], 0
	; ENABLED_MASKED_STRIDED-NEXT: br i1 [[CMP9]], label [[VECTOR_PH:%.]], label [[FOR_END:%.]]			; ENABLED_MASKED_STRIDED-NEXT: br i1 [[CMP9]], label [[VECTOR_PH:%.]], label [[FOR_END:%.]]
	; ENABLED_MASKED_STRIDED: vector.ph:			; ENABLED_MASKED_STRIDED: for.body.lr.ph:
	; ENABLED_MASKED_STRIDED-NEXT: [[CONV:%.]] = zext i8 [[GUARD:%.]] to i32			; ENABLED_MASKED_STRIDED-NEXT: [[CONV:%.]] = zext i8 [[GUARD:%.]] to i32
	; ENABLED_MASKED_STRIDED-NEXT: [[N_RND_UP:%.*]] = add i32 [[N]], 7			; ENABLED_MASKED_STRIDED-NEXT: [[N_RND_UP:%.*]] = add i32 [[N]], 7
	; ENABLED_MASKED_STRIDED-NEXT: [[N_VEC:%.*]] = and i32 [[N_RND_UP]], -8			; ENABLED_MASKED_STRIDED-NEXT: [[N_VEC:%.*]] = and i32 [[N_RND_UP]], -8
	; ENABLED_MASKED_STRIDED-NEXT: [[TRIP_COUNT_MINUS_1:%.*]] = add i32 [[N]], -1			; ENABLED_MASKED_STRIDED-NEXT: [[TRIP_COUNT_MINUS_1:%.*]] = add i32 [[N]], -1
	; ENABLED_MASKED_STRIDED-NEXT: [[BROADCAST_SPLATINSERT:%.*]] = insertelement <8 x i32> undef, i32 [[CONV]], i32 0			; ENABLED_MASKED_STRIDED-NEXT: [[BROADCAST_SPLATINSERT:%.*]] = insertelement <8 x i32> undef, i32 [[CONV]], i32 0
	; ENABLED_MASKED_STRIDED-NEXT: [[BROADCAST_SPLAT:%.*]] = shufflevector <8 x i32> [[BROADCAST_SPLATINSERT]], <8 x i32> undef, <8 x i32> zeroinitializer			; ENABLED_MASKED_STRIDED-NEXT: [[BROADCAST_SPLAT:%.*]] = shufflevector <8 x i32> [[BROADCAST_SPLATINSERT]], <8 x i32> undef, <8 x i32> zeroinitializer
	; ENABLED_MASKED_STRIDED-NEXT: [[BROADCAST_SPLATINSERT1:%.*]] = insertelement <8 x i32> undef, i32 [[TRIP_COUNT_MINUS_1]], i32 0			; ENABLED_MASKED_STRIDED-NEXT: [[BROADCAST_SPLATINSERT1:%.*]] = insertelement <8 x i32> undef, i32 [[TRIP_COUNT_MINUS_1]], i32 0
	; ENABLED_MASKED_STRIDED-NEXT: [[BROADCAST_SPLAT2:%.*]] = shufflevector <8 x i32> [[BROADCAST_SPLATINSERT1]], <8 x i32> undef, <8 x i32> zeroinitializer			; ENABLED_MASKED_STRIDED-NEXT: [[BROADCAST_SPLAT2:%.*]] = shufflevector <8 x i32> [[BROADCAST_SPLATINSERT1]], <8 x i32> undef, <8 x i32> zeroinitializer
	▲ Show 20 Lines • Show All 520 Lines • Show Last 20 Lines

llvm/test/Transforms/LoopVectorize/float-induction.ll

	Show First 20 Lines • Show All 163 Lines • ▼ Show 20 Lines
	; x += fp_inc;			; x += fp_inc;
	; y -= 0.5;			; y -= 0.5;
	; B[i] = x + y;			; B[i] = x + y;
	; C[i] = y;			; C[i] = y;
	; }			; }
	;}			;}

	; VEC4_INTERL1-LABEL: @fp_iv_loop3(			; VEC4_INTERL1-LABEL: @fp_iv_loop3(
	; VEC4_INTERL1: tc.check:			; VEC4_INTERL1: for.body.lr.ph:
	; VEC4_INTERL1: [[TMP0:%.]] = load float, float @fp_inc, align 4			; VEC4_INTERL1: [[TMP0:%.]] = load float, float @fp_inc, align 4
	; VEC4_INTERL1: vector.ph:			; VEC4_INTERL1: vector.ph:
	; VEC4_INTERL1: [[DOTSPLATINSERT:%.*]] = insertelement <4 x float> undef, float %init, i32 0			; VEC4_INTERL1: [[DOTSPLATINSERT:%.*]] = insertelement <4 x float> undef, float %init, i32 0
	; VEC4_INTERL1-NEXT: [[DOTSPLAT:%.*]] = shufflevector <4 x float> [[DOTSPLATINSERT]], <4 x float> undef, <4 x i32> zeroinitializer			; VEC4_INTERL1-NEXT: [[DOTSPLAT:%.*]] = shufflevector <4 x float> [[DOTSPLATINSERT]], <4 x float> undef, <4 x i32> zeroinitializer
	; VEC4_INTERL1-NEXT: [[DOTSPLATINSERT5:%.*]] = insertelement <4 x float> undef, float [[TMP0]], i32 0			; VEC4_INTERL1-NEXT: [[DOTSPLATINSERT5:%.*]] = insertelement <4 x float> undef, float [[TMP0]], i32 0
	; VEC4_INTERL1-NEXT: [[DOTSPLAT6:%.*]] = shufflevector <4 x float> [[DOTSPLATINSERT5]], <4 x float> undef, <4 x i32> zeroinitializer			; VEC4_INTERL1-NEXT: [[DOTSPLAT6:%.*]] = shufflevector <4 x float> [[DOTSPLATINSERT5]], <4 x float> undef, <4 x i32> zeroinitializer
	; VEC4_INTERL1-NEXT: [[TMP7:%.*]] = fmul fast <4 x float> [[DOTSPLAT6]], <float 0.000000e+00, float 1.000000e+00, float 2.000000e+00, float 3.000000e+00>			; VEC4_INTERL1-NEXT: [[TMP7:%.*]] = fmul fast <4 x float> [[DOTSPLAT6]], <float 0.000000e+00, float 1.000000e+00, float 2.000000e+00, float 3.000000e+00>
	; VEC4_INTERL1-NEXT: [[INDUCTION7:%.*]] = fadd fast <4 x float> [[DOTSPLAT]], [[TMP7]]			; VEC4_INTERL1-NEXT: [[INDUCTION7:%.*]] = fadd fast <4 x float> [[DOTSPLAT]], [[TMP7]]
	▲ Show 20 Lines • Show All 160 Lines • Show Last 20 Lines

llvm/test/Transforms/LoopVectorize/float-minmax-instruction-flag.ll

	Show All 40 Lines
	out: ; preds = %loop			out: ; preds = %loop
	ret float %t6			ret float %t6
	}			}

	; Check if vectorization is still enabled by function attribute.			; Check if vectorization is still enabled by function attribute.

	define float @minloopattr(float* nocapture readonly %arg) #0 {			define float @minloopattr(float* nocapture readonly %arg) #0 {
	; CHECK-LABEL: @minloopattr(			; CHECK-LABEL: @minloopattr(
	; CHECK-NEXT: tc.check:			; CHECK-NEXT: top:
	; CHECK-NEXT: [[T:%.]] = load float, float [[ARG:%.*]]			; CHECK-NEXT: [[T:%.]] = load float, float [[ARG:%.*]]
				; CHECK-NEXT: br label [[TC_CHECK:%.*]]
				; CHECK: tc.check:
	; CHECK-NEXT: br i1 false, label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]			; CHECK-NEXT: br i1 false, label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]
	; CHECK: vector.ph:			; CHECK: vector.ph:
	; CHECK-NEXT: [[MINMAX_IDENT_SPLATINSERT:%.*]] = insertelement <4 x float> undef, float [[T]], i32 0			; CHECK-NEXT: [[MINMAX_IDENT_SPLATINSERT:%.*]] = insertelement <4 x float> undef, float [[T]], i32 0
	; CHECK-NEXT: [[MINMAX_IDENT_SPLAT:%.*]] = shufflevector <4 x float> [[MINMAX_IDENT_SPLATINSERT]], <4 x float> undef, <4 x i32> zeroinitializer			; CHECK-NEXT: [[MINMAX_IDENT_SPLAT:%.*]] = shufflevector <4 x float> [[MINMAX_IDENT_SPLATINSERT]], <4 x float> undef, <4 x i32> zeroinitializer
	; CHECK-NEXT: br label [[VECTOR_BODY:%.*]]			; CHECK-NEXT: br label [[VECTOR_BODY:%.*]]
	; CHECK: vector.body:			; CHECK: vector.body:
	; CHECK-NEXT: [[INDEX:%.]] = phi i64 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[VECTOR_BODY]] ]			; CHECK-NEXT: [[INDEX:%.]] = phi i64 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.]], [[VECTOR_BODY]] ]
	; CHECK-NEXT: [[VEC_PHI:%.]] = phi <4 x float> [ [[MINMAX_IDENT_SPLAT]], [[VECTOR_PH]] ], [ [[TMP6:%.]], [[VECTOR_BODY]] ]			; CHECK-NEXT: [[VEC_PHI:%.]] = phi <4 x float> [ [[MINMAX_IDENT_SPLAT]], [[VECTOR_PH]] ], [ [[TMP6:%.]], [[VECTOR_BODY]] ]
	Show All 18 Lines
	; CHECK-NEXT: [[RDX_MINMAX_SELECT:%.*]] = select fast <4 x i1> [[RDX_MINMAX_CMP]], <4 x float> [[TMP6]], <4 x float> [[RDX_SHUF]]			; CHECK-NEXT: [[RDX_MINMAX_SELECT:%.*]] = select fast <4 x i1> [[RDX_MINMAX_CMP]], <4 x float> [[TMP6]], <4 x float> [[RDX_SHUF]]
	; CHECK-NEXT: [[RDX_SHUF1:%.*]] = shufflevector <4 x float> [[RDX_MINMAX_SELECT]], <4 x float> undef, <4 x i32> <i32 1, i32 undef, i32 undef, i32 undef>			; CHECK-NEXT: [[RDX_SHUF1:%.*]] = shufflevector <4 x float> [[RDX_MINMAX_SELECT]], <4 x float> undef, <4 x i32> <i32 1, i32 undef, i32 undef, i32 undef>
	; CHECK-NEXT: [[RDX_MINMAX_CMP2:%.*]] = fcmp fast olt <4 x float> [[RDX_MINMAX_SELECT]], [[RDX_SHUF1]]			; CHECK-NEXT: [[RDX_MINMAX_CMP2:%.*]] = fcmp fast olt <4 x float> [[RDX_MINMAX_SELECT]], [[RDX_SHUF1]]
	; CHECK-NEXT: [[RDX_MINMAX_SELECT3:%.*]] = select fast <4 x i1> [[RDX_MINMAX_CMP2]], <4 x float> [[RDX_MINMAX_SELECT]], <4 x float> [[RDX_SHUF1]]			; CHECK-NEXT: [[RDX_MINMAX_SELECT3:%.*]] = select fast <4 x i1> [[RDX_MINMAX_CMP2]], <4 x float> [[RDX_MINMAX_SELECT]], <4 x float> [[RDX_SHUF1]]
	; CHECK-NEXT: [[TMP8:%.*]] = extractelement <4 x float> [[RDX_MINMAX_SELECT3]], i32 0			; CHECK-NEXT: [[TMP8:%.*]] = extractelement <4 x float> [[RDX_MINMAX_SELECT3]], i32 0
	; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i64 65536, 65536			; CHECK-NEXT: [[CMP_N:%.*]] = icmp eq i64 65536, 65536
	; CHECK-NEXT: br i1 [[CMP_N]], label [[OUT:%.*]], label [[SCALAR_PH]]			; CHECK-NEXT: br i1 [[CMP_N]], label [[OUT:%.*]], label [[SCALAR_PH]]
	; CHECK: scalar.ph:			; CHECK: scalar.ph:
	; CHECK-NEXT: [[BC_RESUME_VAL:%.]] = phi i64 [ 65537, [[MIDDLE_BLOCK]] ], [ 1, [[TC_CHECK:%.]] ]			; CHECK-NEXT: [[BC_RESUME_VAL:%.*]] = phi i64 [ 65537, [[MIDDLE_BLOCK]] ], [ 1, [[TC_CHECK]] ]
	; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi float [ [[T]], [[TC_CHECK]] ], [ [[TMP8]], [[MIDDLE_BLOCK]] ]			; CHECK-NEXT: [[BC_MERGE_RDX:%.*]] = phi float [ [[T]], [[TC_CHECK]] ], [ [[TMP8]], [[MIDDLE_BLOCK]] ]
	; CHECK-NEXT: br label [[LOOP:%.*]]			; CHECK-NEXT: br label [[LOOP:%.*]]
	; CHECK: loop:			; CHECK: loop:
	; CHECK-NEXT: [[T1:%.]] = phi i64 [ [[T7:%.]], [[LOOP]] ], [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ]			; CHECK-NEXT: [[T1:%.]] = phi i64 [ [[T7:%.]], [[LOOP]] ], [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ]
	; CHECK-NEXT: [[T2:%.]] = phi float [ [[T6:%.]], [[LOOP]] ], [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ]			; CHECK-NEXT: [[T2:%.]] = phi float [ [[T6:%.]], [[LOOP]] ], [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ]
	; CHECK-NEXT: [[T3:%.]] = getelementptr float, float [[ARG]], i64 [[T1]]			; CHECK-NEXT: [[T3:%.]] = getelementptr float, float [[ARG]], i64 [[T1]]
	; CHECK-NEXT: [[T4:%.]] = load float, float [[T3]], align 4			; CHECK-NEXT: [[T4:%.]] = load float, float [[T3]], align 4
	; CHECK-NEXT: [[T5:%.*]] = fcmp olt float [[T2]], [[T4]]			; CHECK-NEXT: [[T5:%.*]] = fcmp olt float [[T2]], [[T4]]
	▲ Show 20 Lines • Show All 68 Lines • Show Last 20 Lines

llvm/test/Transforms/LoopVectorize/induction-step.ll

	; RUN: opt < %s -loop-vectorize -force-vector-interleave=1 -force-vector-width=8 -S \| FileCheck %s			; RUN: opt < %s -loop-vectorize -force-vector-interleave=1 -force-vector-width=8 -S \| FileCheck %s

	; int int_inc;			; int int_inc;
	;			;
	;int induction_with_global(int init, int *restrict A, int N) {			;int induction_with_global(int init, int *restrict A, int N) {
	; int x = init;			; int x = init;
	; for (int i=0;i<N;i++){			; for (int i=0;i<N;i++){
	; A[i] = x;			; A[i] = x;
	; x += int_inc;			; x += int_inc;
	; }			; }
	; return x;			; return x;
	;}			;}

	; CHECK-LABEL: @induction_with_global(			; CHECK-LABEL: @induction_with_global(
	; CHECK: tc.check:			; CHECK: for.body.lr.ph:
	; CHECK-NEXT: [[TMP0:%.]] = load i32, i32 @int_inc, align 4			; CHECK-NEXT: [[TMP0:%.]] = load i32, i32 @int_inc, align 4
	; CHECK: vector.ph:			; CHECK: vector.ph:
	; CHECK: [[DOTSPLATINSERT:%.*]] = insertelement <8 x i32> undef, i32 %init, i32 0			; CHECK: [[DOTSPLATINSERT:%.*]] = insertelement <8 x i32> undef, i32 %init, i32 0
	; CHECK-NEXT: [[DOTSPLAT:%.*]] = shufflevector <8 x i32> [[DOTSPLATINSERT]], <8 x i32> undef, <8 x i32> zeroinitializer			; CHECK-NEXT: [[DOTSPLAT:%.*]] = shufflevector <8 x i32> [[DOTSPLATINSERT]], <8 x i32> undef, <8 x i32> zeroinitializer
	; CHECK-NEXT: [[DOTSPLATINSERT2:%.*]] = insertelement <8 x i32> undef, i32 [[TMP0]], i32 0			; CHECK-NEXT: [[DOTSPLATINSERT2:%.*]] = insertelement <8 x i32> undef, i32 [[TMP0]], i32 0
	; CHECK-NEXT: [[DOTSPLAT3:%.*]] = shufflevector <8 x i32> [[DOTSPLATINSERT2]], <8 x i32> undef, <8 x i32> zeroinitializer			; CHECK-NEXT: [[DOTSPLAT3:%.*]] = shufflevector <8 x i32> [[DOTSPLATINSERT2]], <8 x i32> undef, <8 x i32> zeroinitializer
	; CHECK-NEXT: [[TMP6:%.*]] = mul <8 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7>, [[DOTSPLAT3]]			; CHECK-NEXT: [[TMP6:%.*]] = mul <8 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7>, [[DOTSPLAT3]]
	; CHECK-NEXT: [[INDUCTION4:%.*]] = add <8 x i32> [[DOTSPLAT]], [[TMP6]]			; CHECK-NEXT: [[INDUCTION4:%.*]] = add <8 x i32> [[DOTSPLAT]], [[TMP6]]
	▲ Show 20 Lines • Show All 178 Lines • Show Last 20 Lines

llvm/test/Transforms/LoopVectorize/induction.ll

	Show First 20 Lines • Show All 523 Lines • ▼ Show 20 Lines
	; <label>:5 ; preds = %1			; <label>:5 ; preds = %1
	ret i32 %2			ret i32 %2
	}			}

	; When generating the overflow check we must sure that the induction start value			; When generating the overflow check we must sure that the induction start value
	; is defined before the branch to the scalar preheader.			; is defined before the branch to the scalar preheader.

	; CHECK-LABEL: testoverflowcheck			; CHECK-LABEL: testoverflowcheck
	; CHECK: tc.check:			; CHECK: entry:
	; CHECK: %[[LOAD:.*]] = load i8			; CHECK: %[[LOAD:.*]] = load i8
	; CHECK: br			; CHECK: br

	; CHECK: scalar.ph			; CHECK: scalar.ph
	; CHECK: phi i8 [ %{{.*}}, %middle.block ], [ %[[LOAD]], %tc.check ]			; CHECK: phi i8 [ %{{.*}}, %middle.block ], [ %[[LOAD]], %tc.check ]

	@e = global i8 1, align 1			@e = global i8 1, align 1
	@d = common global i32 0, align 4			@d = common global i32 0, align 4
	▲ Show 20 Lines • Show All 356 Lines • Show Last 20 Lines

llvm/test/Transforms/LoopVectorize/invariant-store-vectorization.ll

	Show First 20 Lines • Show All 158 Lines • ▼ Show 20 Lines
	for.end: ; preds = %for.body			for.end: ; preds = %for.body
	ret void			ret void
	}			}

	; Instcombine'd version of above test. Now the store is no longer of invariant			; Instcombine'd version of above test. Now the store is no longer of invariant
	; value.			; value.
	; scalar store the value extracted from the last element of the vector value.			; scalar store the value extracted from the last element of the vector value.
	; CHECK-LABEL: inv_val_store_to_inv_address_conditional_diff_values_ic			; CHECK-LABEL: inv_val_store_to_inv_address_conditional_diff_values_ic
	; CHECK-NEXT: tc.check:			; CHECK-NEXT: entry:
				; CHECK-NEXT: [[B1:%.]] = bitcast i32 [[B:%.]] to i8
				; CHECK-NEXT: [[A4:%.]] = bitcast i32 [[A:%.]] to i8
	; CHECK-NEXT: [[NTRUNC:%.]] = trunc i64 [[N:%.]] to i32			; CHECK-NEXT: [[NTRUNC:%.]] = trunc i64 [[N:%.]] to i32
				; CHECK-NEXT: br label [[TC_CHECK:%.*]]
				; CHECK: tc.check:
	; CHECK-NEXT: [[TMP0:%.*]] = icmp sgt i64 [[N]], 1			; CHECK-NEXT: [[TMP0:%.*]] = icmp sgt i64 [[N]], 1
	; CHECK-NEXT: [[SMAX:%.*]] = select i1 [[TMP0]], i64 [[N]], i64 1			; CHECK-NEXT: [[SMAX:%.*]] = select i1 [[TMP0]], i64 [[N]], i64 1
	; CHECK-NEXT: [[MIN_ITERS_CHECK:%.*]] = icmp ult i64 [[SMAX]], 4			; CHECK-NEXT: [[MIN_ITERS_CHECK:%.*]] = icmp ult i64 [[SMAX]], 4
	; CHECK-NEXT: br i1 [[MIN_ITERS_CHECK]], label [[SCALAR_PH:%.]], label [[VECTOR_MEMCHECK:%.]]			; CHECK-NEXT: br i1 [[MIN_ITERS_CHECK]], label [[SCALAR_PH:%.]], label [[VECTOR_MEMCHECK:%.]]
	; CHECK: vector.memcheck:			; CHECK: vector.memcheck:
	; CHECK-NEXT: [[A4:%.]] = bitcast i32 [[A:%.]] to i8
	; CHECK-NEXT: [[B1:%.]] = bitcast i32 [[B:%.]] to i8
	; CHECK-NEXT: [[TMP1:%.*]] = icmp sgt i64 [[N]], 1			; CHECK-NEXT: [[TMP1:%.*]] = icmp sgt i64 [[N]], 1
	; CHECK-NEXT: [[SMAX2:%.*]] = select i1 [[TMP1]], i64 [[N]], i64 1			; CHECK-NEXT: [[SMAX2:%.*]] = select i1 [[TMP1]], i64 [[N]], i64 1
	; CHECK-NEXT: [[SCEVGEP:%.]] = getelementptr i32, i32 [[B]], i64 [[SMAX2]]			; CHECK-NEXT: [[SCEVGEP:%.]] = getelementptr i32, i32 [[B]], i64 [[SMAX2]]
	; CHECK-NEXT: [[UGLYGEP:%.]] = getelementptr i8, i8 [[A4]], i64 1			; CHECK-NEXT: [[UGLYGEP:%.]] = getelementptr i8, i8 [[A4]], i64 1
	; CHECK-NEXT: [[BOUND0:%.]] = icmp ugt i8 [[UGLYGEP]], [[B1]]			; CHECK-NEXT: [[BOUND0:%.]] = icmp ugt i8 [[UGLYGEP]], [[B1]]
	; CHECK-NEXT: [[BOUND1:%.]] = icmp ugt i32 [[SCEVGEP]], [[A]]			; CHECK-NEXT: [[BOUND1:%.]] = icmp ugt i32 [[SCEVGEP]], [[A]]
	; CHECK-NEXT: [[FOUND_CONFLICT:%.*]] = and i1 [[BOUND0]], [[BOUND1]]			; CHECK-NEXT: [[FOUND_CONFLICT:%.*]] = and i1 [[BOUND0]], [[BOUND1]]
	; CHECK-NEXT: br i1 [[FOUND_CONFLICT]], label [[SCALAR_PH]], label [[VECTOR_PH:%.*]]			; CHECK-NEXT: br i1 [[FOUND_CONFLICT]], label [[SCALAR_PH]], label [[VECTOR_PH:%.*]]
	▲ Show 20 Lines • Show All 80 Lines • ▼ Show 20 Lines
	; This is not treated as a predicated store since the block the store belongs to			; This is not treated as a predicated store since the block the store belongs to
	; is the latch block (which doesn't need to be predicated).			; is the latch block (which doesn't need to be predicated).
	; variant/invariant values being stored to invariant address.			; variant/invariant values being stored to invariant address.
	; test checks that the last element of the phi is extracted and scalar stored			; test checks that the last element of the phi is extracted and scalar stored
	; into the uniform address within the loop.			; into the uniform address within the loop.
	; Since the condition and the phi is loop invariant, they are LICM'ed after			; Since the condition and the phi is loop invariant, they are LICM'ed after
	; vectorization.			; vectorization.
	; CHECK-LABEL: inv_val_store_to_inv_address_conditional_inv			; CHECK-LABEL: inv_val_store_to_inv_address_conditional_inv
	; CHECK-NEXT: tc.check:			; CHECK-NEXT: entry:
				; CHECK-NEXT: [[B1:%.]] = bitcast i32 [[B:%.]] to i8
				; CHECK-NEXT: [[A4:%.]] = bitcast i32 [[A:%.]] to i8
	; CHECK-NEXT: [[NTRUNC:%.]] = trunc i64 [[N:%.]] to i32			; CHECK-NEXT: [[NTRUNC:%.]] = trunc i64 [[N:%.]] to i32
	; CHECK-NEXT: [[CMP:%.]] = icmp eq i32 [[NTRUNC]], [[K:%.]]			; CHECK-NEXT: [[CMP:%.]] = icmp eq i32 [[NTRUNC]], [[K:%.]]
				; CHECK-NEXT: br label [[TC_CHECK:%.*]]
				; CHECK: tc.check:
	; CHECK-NEXT: [[TMP0:%.*]] = icmp sgt i64 [[N]], 1			; CHECK-NEXT: [[TMP0:%.*]] = icmp sgt i64 [[N]], 1
	; CHECK-NEXT: [[SMAX:%.*]] = select i1 [[TMP0]], i64 [[N]], i64 1			; CHECK-NEXT: [[SMAX:%.*]] = select i1 [[TMP0]], i64 [[N]], i64 1
	; CHECK-NEXT: [[MIN_ITERS_CHECK:%.*]] = icmp ult i64 [[SMAX]], 4			; CHECK-NEXT: [[MIN_ITERS_CHECK:%.*]] = icmp ult i64 [[SMAX]], 4
	; CHECK-NEXT: br i1 [[MIN_ITERS_CHECK]], label [[SCALAR_PH:%.]], label [[VECTOR_MEMCHECK:%.]]			; CHECK-NEXT: br i1 [[MIN_ITERS_CHECK]], label [[SCALAR_PH:%.]], label [[VECTOR_MEMCHECK:%.]]
	; CHECK: vector.memcheck:			; CHECK: vector.memcheck:
	; CHECK-NEXT: [[A4:%.]] = bitcast i32 [[A:%.]] to i8
	; CHECK-NEXT: [[B1:%.]] = bitcast i32 [[B:%.]] to i8
	; CHECK-NEXT: [[TMP1:%.*]] = icmp sgt i64 [[N]], 1			; CHECK-NEXT: [[TMP1:%.*]] = icmp sgt i64 [[N]], 1
	; CHECK-NEXT: [[SMAX2:%.*]] = select i1 [[TMP1]], i64 [[N]], i64 1			; CHECK-NEXT: [[SMAX2:%.*]] = select i1 [[TMP1]], i64 [[N]], i64 1
	; CHECK-NEXT: [[SCEVGEP:%.]] = getelementptr i32, i32 [[B]], i64 [[SMAX2]]			; CHECK-NEXT: [[SCEVGEP:%.]] = getelementptr i32, i32 [[B]], i64 [[SMAX2]]
	; CHECK-NEXT: [[UGLYGEP:%.]] = getelementptr i8, i8 [[A4]], i64 1			; CHECK-NEXT: [[UGLYGEP:%.]] = getelementptr i8, i8 [[A4]], i64 1
	; CHECK-NEXT: [[BOUND0:%.]] = icmp ugt i8 [[UGLYGEP]], [[B1]]			; CHECK-NEXT: [[BOUND0:%.]] = icmp ugt i8 [[UGLYGEP]], [[B1]]
	; CHECK-NEXT: [[BOUND1:%.]] = icmp ugt i32 [[SCEVGEP]], [[A]]			; CHECK-NEXT: [[BOUND1:%.]] = icmp ugt i32 [[SCEVGEP]], [[A]]
	; CHECK-NEXT: [[FOUND_CONFLICT:%.*]] = and i1 [[BOUND0]], [[BOUND1]]			; CHECK-NEXT: [[FOUND_CONFLICT:%.*]] = and i1 [[BOUND0]], [[BOUND1]]
	; CHECK-NEXT: br i1 [[FOUND_CONFLICT]], label [[SCALAR_PH]], label [[VECTOR_PH:%.*]]			; CHECK-NEXT: br i1 [[FOUND_CONFLICT]], label [[SCALAR_PH]], label [[VECTOR_PH:%.*]]
	▲ Show 20 Lines • Show All 70 Lines • ▼ Show 20 Lines
	for.end: ; preds = %for.body			for.end: ; preds = %for.body
	ret void			ret void
	}			}

	; variant value stored to uniform address tests that the code gen extracts the			; variant value stored to uniform address tests that the code gen extracts the
	; last element from the variant vector and scalar stores it into the uniform			; last element from the variant vector and scalar stores it into the uniform
	; address.			; address.
	; CHECK-LABEL: variant_val_store_to_inv_address			; CHECK-LABEL: variant_val_store_to_inv_address
	; CHECK-NEXT: tc.check:			; CHECK-NEXT: entry:
				; CHECK-NEXT: [[A1:%.]] = bitcast i32 [[A:%.]] to i8
				; CHECK-NEXT: [[B2:%.]] = bitcast i32 [[B:%.]] to i8
				; CHECK-NEXT: br label [[TC_CHECK:%.*]]
				; CHECK: tc.check:
	; CHECK-NEXT: [[TMP0:%.]] = icmp sgt i64 [[N:%.]], 1			; CHECK-NEXT: [[TMP0:%.]] = icmp sgt i64 [[N:%.]], 1
	; CHECK-NEXT: [[SMAX:%.*]] = select i1 [[TMP0]], i64 [[N]], i64 1			; CHECK-NEXT: [[SMAX:%.*]] = select i1 [[TMP0]], i64 [[N]], i64 1
	; CHECK-NEXT: [[MIN_ITERS_CHECK:%.*]] = icmp ult i64 [[SMAX]], 4			; CHECK-NEXT: [[MIN_ITERS_CHECK:%.*]] = icmp ult i64 [[SMAX]], 4
	; CHECK-NEXT: br i1 [[MIN_ITERS_CHECK]], label [[SCALAR_PH:%.]], label [[VECTOR_MEMCHECK:%.]]			; CHECK-NEXT: br i1 [[MIN_ITERS_CHECK]], label [[SCALAR_PH:%.]], label [[VECTOR_MEMCHECK:%.]]
	; CHECK: vector.memcheck:			; CHECK: vector.memcheck:
	; CHECK-NEXT: [[B2:%.]] = bitcast i32 [[B:%.]] to i8
	; CHECK-NEXT: [[A1:%.]] = bitcast i32 [[A:%.]] to i8
	; CHECK-NEXT: [[UGLYGEP:%.]] = getelementptr i8, i8 [[A1]], i64 1			; CHECK-NEXT: [[UGLYGEP:%.]] = getelementptr i8, i8 [[A1]], i64 1
	; CHECK-NEXT: [[TMP1:%.*]] = icmp sgt i64 [[N]], 1			; CHECK-NEXT: [[TMP1:%.*]] = icmp sgt i64 [[N]], 1
	; CHECK-NEXT: [[SMAX3:%.*]] = select i1 [[TMP1]], i64 [[N]], i64 1			; CHECK-NEXT: [[SMAX3:%.*]] = select i1 [[TMP1]], i64 [[N]], i64 1
	; CHECK-NEXT: [[SCEVGEP:%.]] = getelementptr i32, i32 [[B]], i64 [[SMAX3]]			; CHECK-NEXT: [[SCEVGEP:%.]] = getelementptr i32, i32 [[B]], i64 [[SMAX3]]
	; CHECK-NEXT: [[BOUND0:%.]] = icmp ugt i32 [[SCEVGEP]], [[A]]			; CHECK-NEXT: [[BOUND0:%.]] = icmp ugt i32 [[SCEVGEP]], [[A]]
	; CHECK-NEXT: [[BOUND1:%.]] = icmp ugt i8 [[UGLYGEP]], [[B2]]			; CHECK-NEXT: [[BOUND1:%.]] = icmp ugt i8 [[UGLYGEP]], [[B2]]
	; CHECK-NEXT: [[FOUND_CONFLICT:%.*]] = and i1 [[BOUND0]], [[BOUND1]]			; CHECK-NEXT: [[FOUND_CONFLICT:%.*]] = and i1 [[BOUND0]], [[BOUND1]]
	; CHECK-NEXT: br i1 [[FOUND_CONFLICT]], label [[SCALAR_PH]], label [[VECTOR_PH:%.*]]			; CHECK-NEXT: br i1 [[FOUND_CONFLICT]], label [[SCALAR_PH]], label [[VECTOR_PH:%.*]]
	▲ Show 20 Lines • Show All 210 Lines • Show Last 20 Lines

llvm/test/Transforms/LoopVectorize/iv_outside_user.ll

	Show First 20 Lines • Show All 135 Lines • ▼ Show 20 Lines
	; CHECK-LABEL: @PR30742			; CHECK-LABEL: @PR30742
	; CHECK: %[[T15:.+]] = add nsw i32 %tmp03, -7			; CHECK: %[[T15:.+]] = add nsw i32 %tmp03, -7
	; CHECK: vector.ph			; CHECK: vector.ph
	; CHECK: %[[N_MOD_VF:.+]] = urem i32 %[[T5:.+]], 2			; CHECK: %[[N_MOD_VF:.+]] = urem i32 %[[T5:.+]], 2
	; CHECK: %[[N_VEC:.+]] = sub i32 %[[T5]], %[[N_MOD_VF]]			; CHECK: %[[N_VEC:.+]] = sub i32 %[[T5]], %[[N_MOD_VF]]
	; CHECK: middle.block			; CHECK: middle.block
	; CHECK: %[[CMP:.+]] = icmp eq i32 %[[T5]], %[[N_VEC]]			; CHECK: %[[CMP:.+]] = icmp eq i32 %[[T5]], %[[N_VEC]]
	; CHECK: %ind.escape = add i32 %[[T15]],			; CHECK: %ind.escape = add i32 %[[T15]],
	; CHECK: br i1 %[[CMP]], label %tc.check, label %scalar.ph			; CHECK: br i1 %[[CMP]], label %BB3, label %scalar.ph
	define void @PR30742() {			define void @PR30742() {
	BB0:			BB0:
	br label %BB1			br label %BB1

	BB1:			BB1:
	%tmp00 = load i32, i32* undef, align 16			%tmp00 = load i32, i32* undef, align 16
	%tmp01 = sub i32 %tmp00, undef			%tmp01 = sub i32 %tmp00, undef
	%tmp02 = icmp slt i32 %tmp01, 1			%tmp02 = icmp slt i32 %tmp01, 1
	Show All 24 Lines

llvm/test/Transforms/LoopVectorize/pr30806.ll

Show All 34 Lines	loop1:
%outer_i = phi i32 [ %inc1, %loop2.exit ], [ 0, %loop1.preheader ]		%outer_i = phi i32 [ %inc1, %loop2.exit ], [ 0, %loop1.preheader ]
%0 = add i32 %denom, -1		%0 = add i32 %denom, -1
%1 = icmp ult i32 %0, %numer		%1 = icmp ult i32 %0, %numer
br i1 %1, label %loop2.preheader, label %loop2.exit		br i1 %1, label %loop2.preheader, label %loop2.exit

; Verify that a 'udiv' does appear between the 'loop2.preheader' label, and		; Verify that a 'udiv' does appear between the 'loop2.preheader' label, and
; whatever label comes next.		; whatever label comes next.
loop2.preheader:		loop2.preheader:
; CHECK-LABEL: tc.check:		; CHECK-LABEL: loop2.preheader:
; CHECK: udiv		; CHECK: udiv
; CHECK-LABEL: :		; CHECK-LABEL: :
%lim = udiv i32 %numer, %denom		%lim = udiv i32 %numer, %denom
%2 = zext i32 %lim to i64		%2 = zext i32 %lim to i64
br label %loop2		br label %loop2

loop2:		loop2:
%indvar.loop2 = phi i64 [ 0, %loop2.preheader ], [ %indvar.loop2.next, %loop2 ]		%indvar.loop2 = phi i64 [ 0, %loop2.preheader ], [ %indvar.loop2.next, %loop2 ]
Show All 14 Lines

This is an archive of the discontinued LLVM Phabricator instance.

[LV] Create new vector loop preheader so it contains vectorizer generated code only.Needs ReviewPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 234229

llvm/lib/Transforms/Vectorize/LoopVectorize.cpp

llvm/test/Transforms/LoopVectorize/AArch64/pr36032.ll

llvm/test/Transforms/LoopVectorize/ARM/sphinx.ll

llvm/test/Transforms/LoopVectorize/X86/illegal-parallel-loop-uniform-write.ll

llvm/test/Transforms/LoopVectorize/X86/invariant-load-gather.ll

llvm/test/Transforms/LoopVectorize/X86/invariant-store-vectorization.ll

llvm/test/Transforms/LoopVectorize/X86/load-deref-pred.ll

llvm/test/Transforms/LoopVectorize/X86/masked_load_store.ll

llvm/test/Transforms/LoopVectorize/X86/pr23997.ll

llvm/test/Transforms/LoopVectorize/X86/pr35432.ll

llvm/test/Transforms/LoopVectorize/X86/x86-interleaved-accesses-masked-group.ll

llvm/test/Transforms/LoopVectorize/float-induction.ll

llvm/test/Transforms/LoopVectorize/float-minmax-instruction-flag.ll

llvm/test/Transforms/LoopVectorize/induction-step.ll

llvm/test/Transforms/LoopVectorize/induction.ll

llvm/test/Transforms/LoopVectorize/invariant-store-vectorization.ll

llvm/test/Transforms/LoopVectorize/iv_outside_user.ll

llvm/test/Transforms/LoopVectorize/pr30806.ll

[LV] Create new vector loop preheader so it contains vectorizer generated code only.
Needs ReviewPublic