This is an archive of the discontinued LLVM Phabricator instance.

Paths

Table of Contentst

-
llvm/
-
lib/Transforms/InstCombine/
-
Transforms/
-
InstCombine/
-
InstCombineCompares.cpp
-
test/Transforms/
-
Transforms/
-
InstCombine/
-
gep-combine-loop-invariant.ll
-
narrow.ll
-
uaddo.ll
-
LoopUnroll/
-
runtime-loop-multiple-exits.ll
-
runtime-unroll-remainder.ll
-
LoopVectorize/
-
X86/
-
gather_scatter.ll
-
masked_load_store.ll
-
metadata-enable.ll
-
small-size.ll
-
x86-interleaved-accesses-masked-group.ll
-
interleaved-accesses.ll

Differential D58633

[InstCombine] remove one-use restriction for icmp+add constant fold
AbandonedPublic

Authored by spatel on Feb 25 2019, 9:36 AM.

Download Raw Diff

Details

Reviewers

efriedma
RKSimon
nikic
lebedev.ri

Summary

Remove the use of an add with constant when compared to another constant:
(A + C2) == C --> A == (C - C2)
(A + C2) != C --> A != (C - C2)

I noticed an inconsistency in the canonicalization of this pattern as part of D57516 and rL354746, so that is shown in the uaddo.ll test file.

I checked asm for some of the tests where the induction variable test is changing, and I don't see any diffs in the final results, so I'm assuming that something later (LSR?) converts that to optimized form either way?

Diff Detail

Event Timeline

spatel created this revision.Feb 25 2019, 9:36 AM

Herald added a project: Restricted Project. · View Herald TranscriptFeb 25 2019, 9:36 AM

Herald added subscribers: jdoerfert, zzheng, hiraditya, mcrosier. · View Herald Transcript

LG, that one-use check seems unmotivated,
we will only produce a single instruction (icmp),
so it does not seem to matter whether we can get rid of that add.

This revision is now accepted and ready to land.Feb 27 2019, 12:23 PM

It looks like this was added on purpose way back in https://reviews.llvm.org/rL16473. That was so long ago that everything will have changed since then, but have you run any benchmarks for this?

I agree that LSR should probably be turning this back into a cmp based on the inc in any loop backedges. But I'm not sure it will do that equally well for all backends. And changing the canonical form of a loop backedge is quite a big change :)

Oh, and I presume most loop transforms will use SCEV's, which won't have changed? So we don't need to update the tests for them all, to make sure they are still doing what they should?

In D58633#1413514, @dmgreen wrote:

It looks like this was added on purpose way back in https://reviews.llvm.org/rL16473. That was so long ago that everything will have changed since then, but have you run any benchmarks for this?

Thanks for digging up the original commit! So it was a purposeful hack. :)
The problem with that hack of course is that crippling a canonicalization is not the same as adding the inverse canonicalization. Also, we are already doing this same transform for related patterns - there was just this odd-shaped hole carved out by this use limitation for some subset of constant values.

I did some more experiments, and my guess about LSR (-loop-reduce) was correct. It cleans up the IR for the motivating example in either incoming form (before/after this patch) to exactly the same output form for a given target. I checked x86, PPC, AArch64, and armv7 triples. I only have x86 hardware to run benchmarks, but I don't see anything above noise with this patch. Note that the LSR behavior holds for both -O1 and -O2 (potentially drastically different IR due to loop vectorization).

I agree that LSR should probably be turning this back into a cmp based on the inc in any loop backedges. But I'm not sure it will do that equally well for all backends. And changing the canonical form of a loop backedge is quite a big change :)
Oh, and I presume most loop transforms will use SCEV's, which won't have changed? So we don't need to update the tests for them all, to make sure they are still doing what they should?

I'm not too familiar with SCEV. I see that LSR uses them, and that output matches expectations. Is there some other experiment I can try to confirm?

Yep. I think that makes sense to me. Would be good to remove the hack. And LSR should handle most of these cases. I think there's times when it doesn't do what it should, though.

This is one example, out of libjpeg I think, but I got it from csibe. It's was just the first I looked at that was larger than before:
https://reviews.llvm.org/P8129
Compiled with something like "opt -instcombine -o - -S jdmarker.ll | llc - -o -", vs without the instcombine. Codesize is a little bigger than it was, I think maybe something about the loops (not in simple form?) is making the SCEV's not useful, so LSR isn't transforming these back.

I don't know if this is representative of the other changes. Over all the benchmarks I ran, this patch seemed to be (on average, very slightly) worse overall than before, both for perf and codesize. Not by a long way, and there are certainly some improvements in there.

This is another one from cmsis dsp (https://github.com/ARM-software/CMSIS_5/blob/develop/CMSIS/DSP/Source/MatrixFunctions/arm_mat_trans_q31.c). Apparently the original was 20% slower on a thumb1 target, but something daft is likely going on there, as it can sometimes make bad decisions.
https://reviews.llvm.org/P8130
There does look like there's some extra uxth's in there, I've not looked into why. I was compiling with something like "-target arm-arm-none-eabi -mcpu=cortex-m33 -O3" (or maybe m23 for the thumb1 case).

In D58633#1414054, @dmgreen wrote:

Yep. I think that makes sense to me. Would be good to remove the hack. And LSR should handle most of these cases. I think there's times when it doesn't do what it should, though.

This is one example, out of libjpeg I think, but I got it from csibe. It's was just the first I looked at that was larger than before:
https://reviews.llvm.org/P8129
Compiled with something like "opt -instcombine -o - -S jdmarker.ll | llc - -o -", vs without the instcombine. Codesize is a little bigger than it was, I think maybe something about the loops (not in simple form?) is making the SCEV's not useful, so LSR isn't transforming these back.

I don't know if this is representative of the other changes. Over all the benchmarks I ran, this patch seemed to be (on average, very slightly) worse overall than before, both for perf and codesize. Not by a long way, and there are certainly some improvements in there.

Thanks for checking that. I see x86 getting bigger on that example too.
Given that this is just an academic change for me currently (we ended up needing to match both patterns for unsigned add overflow in the patches that led me here), I think we better try to make LSR stronger before pushing this one. I'm guessing this won't be at the top of my queue for a while, but I'll mark it as 'Plan changes' for now.

There's a similar one use check for the non-equality case in https://github.com/llvm-mirror/llvm/blob/fb1e04ff3c51a617c4944b2e05e8aa1b8c543e22/lib/Transforms/InstCombine/InstCombineCompares.cpp#L2389. This prevents the trivially true condition in https://rust.godbolt.org/z/qg0RjC from folding. That check was added (or rather moved) in rL341831.

Just wanted to add this as a datapoint for a case where dropping the restriction would be nice.

In D58633#1465428, @nikic wrote:

There's a similar one use check for the non-equality case in https://github.com/llvm-mirror/llvm/blob/fb1e04ff3c51a617c4944b2e05e8aa1b8c543e22/lib/Transforms/InstCombine/InstCombineCompares.cpp#L2389. This prevents the trivially true condition in https://rust.godbolt.org/z/qg0RjC from folding. That check was added (or rather moved) in rL341831.

Just wanted to add this as a datapoint for a case where dropping the restriction would be nice.

It's not explicitly stated in the commit message, but the test added with rL341831 suggests we are missing some kind of overflow check optimization (cc @t.p.northover)? Or maybe the motivation was similar to the cases we have here - covering up for failures in LSR?

Either way, we have a real motivating example for correcting instcombine now. If there's not enough will to fix the underlying problems, we can probably justify adding an over-specific match to instsimplify to zap the compare in the rust example.

mati865 added a subscriber: mati865.May 8 2019, 2:13 AM

nikic mentioned this in D63686: [LFTR] Fix post-inc pointer IV with truncated exit count (PR41998).Jun 29 2019, 2:44 AM

In D58633#1468821, @spatel wrote:

In D58633#1465428, @nikic wrote:

There's a similar one use check for the non-equality case in https://github.com/llvm-mirror/llvm/blob/fb1e04ff3c51a617c4944b2e05e8aa1b8c543e22/lib/Transforms/InstCombine/InstCombineCompares.cpp#L2389. This prevents the trivially true condition in https://rust.godbolt.org/z/qg0RjC from folding. That check was added (or rather moved) in rL341831.

Just wanted to add this as a datapoint for a case where dropping the restriction would be nice.

That should be resolved now, reverted in rG0f22e783a038.

It's not explicitly stated in the commit message, but the test added with rL341831 suggests we are missing some kind of overflow check optimization (cc @t.p.northover)? Or maybe the motivation was similar to the cases we have here - covering up for failures in LSR?

Either way, we have a real motivating example for correcting instcombine now. If there's not enough will to fix the underlying problems, we can probably justify adding an over-specific match to instsimplify to zap the compare in the rust example.

I've talked to @t.p.northover, and the original motivation is unknown/unreconstructible now.
That test is misleading - it wouldn't be transformed before rL341831 anyway - there are no no-wrap flags on the add there.

In D58633#1765212, @lebedev.ri wrote:

In D58633#1468821, @spatel wrote:

In D58633#1465428, @nikic wrote:

There's a similar one use check for the non-equality case in https://github.com/llvm-mirror/llvm/blob/fb1e04ff3c51a617c4944b2e05e8aa1b8c543e22/lib/Transforms/InstCombine/InstCombineCompares.cpp#L2389. This prevents the trivially true condition in https://rust.godbolt.org/z/qg0RjC from folding. That check was added (or rather moved) in rL341831.

Just wanted to add this as a datapoint for a case where dropping the restriction would be nice.

That should be resolved now, reverted in rG0f22e783a038.

Nice. Is that enough to resolve the motivating bug in the rust example?
I think this patch is still held up until we figure out how to make LSR and/or SCEV reconstruct the original patterns that they are expecting.

In D58633#1765405, @spatel wrote:

In D58633#1765212, @lebedev.ri wrote:

In D58633#1468821, @spatel wrote:

In D58633#1465428, @nikic wrote:

There's a similar one use check for the non-equality case in https://github.com/llvm-mirror/llvm/blob/fb1e04ff3c51a617c4944b2e05e8aa1b8c543e22/lib/Transforms/InstCombine/InstCombineCompares.cpp#L2389. This prevents the trivially true condition in https://rust.godbolt.org/z/qg0RjC from folding. That check was added (or rather moved) in rL341831.

Just wanted to add this as a datapoint for a case where dropping the restriction would be nice.

That should be resolved now, reverted in rG0f22e783a038.

Nice. Is that enough to resolve the motivating bug in the rust example?

I don't work on rust, but running that ir through -instcombine says yes.

I think this patch is still held up until we figure out how to make LSR and/or SCEV reconstruct the original patterns that they are expecting.

Yes, i think so.

This review seems to be stuck/dead, consider abandoning if no longer relevant.

Herald added a project: Restricted Project. · View Herald TranscriptJan 12 2023, 4:43 PM

Herald added subscribers: • pcwang-thead, StephenFan. · View Herald Transcript

spatel mentioned this in rG062415d3c8c1: [InstCombine] improve description of fold and add TODO; NFC.Jan 13 2023, 7:35 AM

Abandoning - I put a TODO comment on the fold that references this review in case someone wants to revive it.

Revision Contents

Path

Size

llvm/

lib/

Transforms/

InstCombine/

InstCombineCompares.cpp

16 lines

test/

Transforms/

InstCombine/

gep-combine-loop-invariant.ll

6 lines

narrow.ll

4 lines

uaddo.ll

2 lines

LoopUnroll/

runtime-loop-multiple-exits.ll

8 lines

runtime-unroll-remainder.ll

2 lines

LoopVectorize/

X86/

14 lines

96 lines

30 lines

6 lines

x86-interleaved-accesses-masked-group.ll

4 lines

interleaved-accesses.ll

2 lines

Diff 188201

llvm/lib/Transforms/InstCombine/InstCombineCompares.cpp

Show First 20 Lines • Show All 2,699 Lines • ▼ Show 20 Lines	if (C.isNullValue() && BO->hasOneUse()) {
if (match(BOp1, m_APInt(BOC)) && BOC->sgt(1) && BOC->isPowerOf2()) {		if (match(BOp1, m_APInt(BOC)) && BOC->sgt(1) && BOC->isPowerOf2()) {
Value *NewRem = Builder.CreateURem(BOp0, BOp1, BO->getName());		Value *NewRem = Builder.CreateURem(BOp0, BOp1, BO->getName());
return new ICmpInst(Pred, NewRem,		return new ICmpInst(Pred, NewRem,
Constant::getNullValue(BO->getType()));		Constant::getNullValue(BO->getType()));
}		}
}		}
break;		break;
case Instruction::Add: {		case Instruction::Add: {
// Replace ((add A, B) != C) with (A != C-B) if B & C are constants.		// (A + C2) == C --> A == (C - C2)
const APInt *BOC;		// (A + C2) != C --> A != (C - C2)
if (match(BOp1, m_APInt(BOC))) {		const APInt *C2;
if (BO->hasOneUse()) {		if (match(BOp1, m_APInt(C2))) {
Constant *SubC = ConstantExpr::getSub(RHS, cast<Constant>(BOp1));		Constant *SubC = ConstantExpr::getSub(RHS, cast<Constant>(BOp1));
return new ICmpInst(Pred, BOp0, SubC);		return new ICmpInst(Pred, BOp0, SubC);
}		}
} else if (C.isNullValue()) {		if (C.isNullValue()) {
// Replace ((add A, B) != 0) with (A != -B) if A or B is		// Replace ((add A, B) != 0) with (A != -B) if A or B is
// efficiently invertible, or if the add has just this one use.		// efficiently invertible, or if the add has just this one use.
if (Value *NegVal = dyn_castNegVal(BOp1))		if (Value *NegVal = dyn_castNegVal(BOp1))
return new ICmpInst(Pred, BOp0, NegVal);		return new ICmpInst(Pred, BOp0, NegVal);
if (Value *NegVal = dyn_castNegVal(BOp0))		if (Value *NegVal = dyn_castNegVal(BOp0))
return new ICmpInst(Pred, NegVal, BOp1);		return new ICmpInst(Pred, NegVal, BOp1);
if (BO->hasOneUse()) {		if (BO->hasOneUse()) {
Value *Neg = Builder.CreateNeg(BOp1);		Value *Neg = Builder.CreateNeg(BOp1);
▲ Show 20 Lines • Show All 2,893 Lines • Show Last 20 Lines

llvm/test/Transforms/InstCombine/gep-combine-loop-invariant.ll

	Show All 12 Lines
	; CHECK-NEXT: [[ADD_PTR36:%.]] = getelementptr inbounds i8, i8 [[ADD_PTR25]], i64 -1			; CHECK-NEXT: [[ADD_PTR36:%.]] = getelementptr inbounds i8, i8 [[ADD_PTR25]], i64 -1
	; CHECK-NEXT: [[TMP0:%.]] = bitcast i8 [[ADD_PTR36]] to i32*			; CHECK-NEXT: [[TMP0:%.]] = bitcast i8 [[ADD_PTR36]] to i32*
	; CHECK-NEXT: [[TMP1:%.]] = load i32, i32 [[TMP0]], align 4			; CHECK-NEXT: [[TMP1:%.]] = load i32, i32 [[TMP0]], align 4
	; CHECK-NEXT: [[CMP7:%.]] = icmp eq i32 [[TMP1]], [[SCAN_END:%.]]			; CHECK-NEXT: [[CMP7:%.]] = icmp eq i32 [[TMP1]], [[SCAN_END:%.]]
	; CHECK-NEXT: br i1 [[CMP7]], label [[DO_END:%.]], label [[IF_THEN_LR_PH:%.]]			; CHECK-NEXT: br i1 [[CMP7]], label [[DO_END:%.]], label [[IF_THEN_LR_PH:%.]]
	; CHECK: if.then.lr.ph:			; CHECK: if.then.lr.ph:
	; CHECK-NEXT: br label [[IF_THEN:%.*]]			; CHECK-NEXT: br label [[IF_THEN:%.*]]
	; CHECK: do.body:			; CHECK: do.body:
				; CHECK-NEXT: [[DEC:%.]] = add i32 [[CHAIN_LENGTH_ADDR_08:%.]], -1
	; CHECK-NEXT: [[IDX_EXT:%.]] = zext i32 [[TMP4:%.]] to i64			; CHECK-NEXT: [[IDX_EXT:%.]] = zext i32 [[TMP4:%.]] to i64
	; CHECK-NEXT: [[ADD_PTR:%.]] = getelementptr inbounds i8, i8 [[WIN]], i64 [[IDX_EXT1]]			; CHECK-NEXT: [[ADD_PTR:%.]] = getelementptr inbounds i8, i8 [[WIN]], i64 [[IDX_EXT1]]
	; CHECK-NEXT: [[ADD_PTR2:%.]] = getelementptr inbounds i8, i8 [[ADD_PTR]], i64 -1			; CHECK-NEXT: [[ADD_PTR2:%.]] = getelementptr inbounds i8, i8 [[ADD_PTR]], i64 -1
	; CHECK-NEXT: [[ADD_PTR3:%.]] = getelementptr inbounds i8, i8 [[ADD_PTR2]], i64 [[IDX_EXT]]			; CHECK-NEXT: [[ADD_PTR3:%.]] = getelementptr inbounds i8, i8 [[ADD_PTR2]], i64 [[IDX_EXT]]
	; CHECK-NEXT: [[TMP2:%.]] = bitcast i8 [[ADD_PTR3]] to i32*			; CHECK-NEXT: [[TMP2:%.]] = bitcast i8 [[ADD_PTR3]] to i32*
	; CHECK-NEXT: [[TMP3:%.]] = load i32, i32 [[TMP2]], align 4			; CHECK-NEXT: [[TMP3:%.]] = load i32, i32 [[TMP2]], align 4
	; CHECK-NEXT: [[CMP:%.*]] = icmp eq i32 [[TMP3]], [[SCAN_END]]			; CHECK-NEXT: [[CMP:%.*]] = icmp eq i32 [[TMP3]], [[SCAN_END]]
	; CHECK-NEXT: br i1 [[CMP]], label [[DO_END]], label [[IF_THEN]]			; CHECK-NEXT: br i1 [[CMP]], label [[DO_END]], label [[IF_THEN]]
	; CHECK: if.then:			; CHECK: if.then:
	; CHECK-NEXT: [[CUR_MATCH_ADDR_09:%.]] = phi i32 [ [[CUR_MATCH]], [[IF_THEN_LR_PH]] ], [ [[TMP4]], [[DO_BODY:%.]] ]			; CHECK-NEXT: [[CUR_MATCH_ADDR_09:%.]] = phi i32 [ [[CUR_MATCH]], [[IF_THEN_LR_PH]] ], [ [[TMP4]], [[DO_BODY:%.]] ]
	; CHECK-NEXT: [[CHAIN_LENGTH_ADDR_08:%.]] = phi i32 [ [[CHAIN_LENGTH:%.]], [[IF_THEN_LR_PH]] ], [ [[DEC:%.*]], [[DO_BODY]] ]			; CHECK-NEXT: [[CHAIN_LENGTH_ADDR_08]] = phi i32 [ [[CHAIN_LENGTH:%.*]], [[IF_THEN_LR_PH]] ], [ [[DEC]], [[DO_BODY]] ]
	; CHECK-NEXT: [[AND:%.]] = and i32 [[CUR_MATCH_ADDR_09]], [[WMASK:%.]]			; CHECK-NEXT: [[AND:%.]] = and i32 [[CUR_MATCH_ADDR_09]], [[WMASK:%.]]
	; CHECK-NEXT: [[IDXPROM:%.*]] = zext i32 [[AND]] to i64			; CHECK-NEXT: [[IDXPROM:%.*]] = zext i32 [[AND]] to i64
	; CHECK-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds i32, i32 [[PREV:%.*]], i64 [[IDXPROM]]			; CHECK-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds i32, i32 [[PREV:%.*]], i64 [[IDXPROM]]
	; CHECK-NEXT: [[TMP4]] = load i32, i32* [[ARRAYIDX]], align 4			; CHECK-NEXT: [[TMP4]] = load i32, i32* [[ARRAYIDX]], align 4
	; CHECK-NEXT: [[CMP4:%.]] = icmp ugt i32 [[TMP4]], [[LIMIT:%.]]			; CHECK-NEXT: [[CMP4:%.]] = icmp ugt i32 [[TMP4]], [[LIMIT:%.]]
	; CHECK-NEXT: br i1 [[CMP4]], label [[LAND_LHS_TRUE:%.*]], label [[DO_END]]			; CHECK-NEXT: br i1 [[CMP4]], label [[LAND_LHS_TRUE:%.*]], label [[DO_END]]
	; CHECK: land.lhs.true:			; CHECK: land.lhs.true:
	; CHECK-NEXT: [[DEC]] = add i32 [[CHAIN_LENGTH_ADDR_08]], -1			; CHECK-NEXT: [[CMP5:%.*]] = icmp eq i32 [[CHAIN_LENGTH_ADDR_08]], 1
	; CHECK-NEXT: [[CMP5:%.*]] = icmp eq i32 [[DEC]], 0
	; CHECK-NEXT: br i1 [[CMP5]], label [[DO_END]], label [[DO_BODY]]			; CHECK-NEXT: br i1 [[CMP5]], label [[DO_END]], label [[DO_BODY]]
	; CHECK: do.end:			; CHECK: do.end:
	; CHECK-NEXT: [[CONT_0:%.]] = phi i32 [ 1, [[ENTRY:%.]] ], [ 0, [[IF_THEN]] ], [ 0, [[LAND_LHS_TRUE]] ], [ 1, [[DO_BODY]] ]			; CHECK-NEXT: [[CONT_0:%.]] = phi i32 [ 1, [[ENTRY:%.]] ], [ 0, [[IF_THEN]] ], [ 0, [[LAND_LHS_TRUE]] ], [ 1, [[DO_BODY]] ]
	; CHECK-NEXT: ret i32 [[CONT_0]]			; CHECK-NEXT: ret i32 [[CONT_0]]
	;			;
	entry:			entry:
	%idx.ext2 = zext i32 %cur_match to i64			%idx.ext2 = zext i32 %cur_match to i64
	%add.ptr4 = getelementptr inbounds i8, i8* %win, i64 %idx.ext2			%add.ptr4 = getelementptr inbounds i8, i8* %win, i64 %idx.ext2
	▲ Show 20 Lines • Show All 139 Lines • Show Last 20 Lines

llvm/test/Transforms/InstCombine/narrow.ll

	Show First 20 Lines • Show All 109 Lines • ▼ Show 20 Lines
	; CHECK-NEXT: [[FOUND:%.]] = phi i8 [ 0, [[ENTRY]] ], [ [[OR:%.]], [[LOOP]] ]			; CHECK-NEXT: [[FOUND:%.]] = phi i8 [ 0, [[ENTRY]] ], [ [[OR:%.]], [[LOOP]] ]
	; CHECK-NEXT: [[TMP0:%.*]] = sext i32 [[INDVAR]] to i64			; CHECK-NEXT: [[TMP0:%.*]] = sext i32 [[INDVAR]] to i64
	; CHECK-NEXT: [[IDX:%.]] = getelementptr i32, i32 [[HAYSTACK:%.*]], i64 [[TMP0]]			; CHECK-NEXT: [[IDX:%.]] = getelementptr i32, i32 [[HAYSTACK:%.*]], i64 [[TMP0]]
	; CHECK-NEXT: [[LD:%.]] = load i32, i32 [[IDX]], align 4			; CHECK-NEXT: [[LD:%.]] = load i32, i32 [[IDX]], align 4
	; CHECK-NEXT: [[CMP1:%.]] = icmp eq i32 [[LD]], [[NEEDLE:%.]]			; CHECK-NEXT: [[CMP1:%.]] = icmp eq i32 [[LD]], [[NEEDLE:%.]]
	; CHECK-NEXT: [[ZEXT:%.*]] = zext i1 [[CMP1]] to i8			; CHECK-NEXT: [[ZEXT:%.*]] = zext i1 [[CMP1]] to i8
	; CHECK-NEXT: [[OR]] = or i8 [[FOUND]], [[ZEXT]]			; CHECK-NEXT: [[OR]] = or i8 [[FOUND]], [[ZEXT]]
	; CHECK-NEXT: [[INDVAR_NEXT]] = add i32 [[INDVAR]], 1			; CHECK-NEXT: [[INDVAR_NEXT]] = add i32 [[INDVAR]], 1
	; CHECK-NEXT: [[EXITCOND:%.*]] = icmp eq i32 [[INDVAR_NEXT]], 1000			; CHECK-NEXT: [[EXITCOND:%.*]] = icmp eq i32 [[INDVAR]], 999
	; CHECK-NEXT: br i1 [[EXITCOND]], label [[EXIT:%.*]], label [[LOOP]]			; CHECK-NEXT: br i1 [[EXITCOND]], label [[EXIT:%.*]], label [[LOOP]]
	; CHECK: exit:			; CHECK: exit:
	; CHECK-NEXT: [[TOBOOL:%.*]] = icmp ne i8 [[OR]], 0			; CHECK-NEXT: [[TOBOOL:%.*]] = icmp ne i8 [[OR]], 0
	; CHECK-NEXT: ret i1 [[TOBOOL]]			; CHECK-NEXT: ret i1 [[TOBOOL]]
	;			;
	entry:			entry:
	br label %loop			br label %loop

	Show All 26 Lines
	; CHECK-NEXT: [[INDVAR:%.]] = phi i64 [ 0, [[ENTRY:%.]] ], [ [[INDVAR_NEXT:%.*]], [[LOOP]] ]			; CHECK-NEXT: [[INDVAR:%.]] = phi i64 [ 0, [[ENTRY:%.]] ], [ [[INDVAR_NEXT:%.*]], [[LOOP]] ]
	; CHECK-NEXT: [[FOUND:%.]] = phi i8 [ 1, [[ENTRY]] ], [ [[AND:%.]], [[LOOP]] ]			; CHECK-NEXT: [[FOUND:%.]] = phi i8 [ 1, [[ENTRY]] ], [ [[AND:%.]], [[LOOP]] ]
	; CHECK-NEXT: [[IDX:%.]] = getelementptr i32, i32 [[HAYSTACK:%.*]], i64 [[INDVAR]]			; CHECK-NEXT: [[IDX:%.]] = getelementptr i32, i32 [[HAYSTACK:%.*]], i64 [[INDVAR]]
	; CHECK-NEXT: [[LD:%.]] = load i32, i32 [[IDX]], align 4			; CHECK-NEXT: [[LD:%.]] = load i32, i32 [[IDX]], align 4
	; CHECK-NEXT: [[CMP1:%.]] = icmp eq i32 [[LD]], [[HAY:%.]]			; CHECK-NEXT: [[CMP1:%.]] = icmp eq i32 [[LD]], [[HAY:%.]]
	; CHECK-NEXT: [[ZEXT:%.*]] = zext i1 [[CMP1]] to i8			; CHECK-NEXT: [[ZEXT:%.*]] = zext i1 [[CMP1]] to i8
	; CHECK-NEXT: [[AND]] = and i8 [[FOUND]], [[ZEXT]]			; CHECK-NEXT: [[AND]] = and i8 [[FOUND]], [[ZEXT]]
	; CHECK-NEXT: [[INDVAR_NEXT]] = add i64 [[INDVAR]], 1			; CHECK-NEXT: [[INDVAR_NEXT]] = add i64 [[INDVAR]], 1
	; CHECK-NEXT: [[EXITCOND:%.*]] = icmp eq i64 [[INDVAR_NEXT]], 1000			; CHECK-NEXT: [[EXITCOND:%.*]] = icmp eq i64 [[INDVAR]], 999
	; CHECK-NEXT: br i1 [[EXITCOND]], label [[EXIT:%.*]], label [[LOOP]]			; CHECK-NEXT: br i1 [[EXITCOND]], label [[EXIT:%.*]], label [[LOOP]]
	; CHECK: exit:			; CHECK: exit:
	; CHECK-NEXT: [[TOBOOL:%.*]] = icmp ne i8 [[AND]], 0			; CHECK-NEXT: [[TOBOOL:%.*]] = icmp ne i8 [[AND]], 0
	; CHECK-NEXT: ret i1 [[TOBOOL]]			; CHECK-NEXT: ret i1 [[TOBOOL]]
	;			;
	entry:			entry:
	br label %loop			br label %loop

	▲ Show 20 Lines • Show All 70 Lines • Show Last 20 Lines

llvm/test/Transforms/InstCombine/uaddo.ll

	Show First 20 Lines • Show All 152 Lines • ▼ Show 20 Lines

	; icmp canonicalization should be consistent for these cases.			; icmp canonicalization should be consistent for these cases.
	; Either the compare depends on the sum or not.			; Either the compare depends on the sum or not.

	define i1 @uaddo_1(i8 %x, i8* %p) {			define i1 @uaddo_1(i8 %x, i8* %p) {
	; CHECK-LABEL: @uaddo_1(			; CHECK-LABEL: @uaddo_1(
	; CHECK-NEXT: [[A:%.]] = add i8 [[X:%.]], 1			; CHECK-NEXT: [[A:%.]] = add i8 [[X:%.]], 1
	; CHECK-NEXT: store i8 [[A]], i8* [[P:%.*]], align 1			; CHECK-NEXT: store i8 [[A]], i8* [[P:%.*]], align 1
	; CHECK-NEXT: [[C:%.*]] = icmp eq i8 [[A]], 0			; CHECK-NEXT: [[C:%.*]] = icmp eq i8 [[X]], -1
	; CHECK-NEXT: ret i1 [[C]]			; CHECK-NEXT: ret i1 [[C]]
	;			;
	%a = add i8 %x, 1			%a = add i8 %x, 1
	store i8 %a, i8* %p			store i8 %a, i8* %p
	%c = icmp ult i8 %a, 1			%c = icmp ult i8 %a, 1
	ret i1 %c			ret i1 %c
	}			}

	Show All 13 Lines

llvm/test/Transforms/LoopUnroll/runtime-loop-multiple-exits.ll

	Show All 17 Lines
	; EPILOG-NEXT: [[XTRAITER:%.*]] = and i64 [[TRIP]], 7			; EPILOG-NEXT: [[XTRAITER:%.*]] = and i64 [[TRIP]], 7
	; EPILOG-NEXT: [[TMP1:%.*]] = icmp ult i64 [[TMP0]], 7			; EPILOG-NEXT: [[TMP1:%.*]] = icmp ult i64 [[TMP0]], 7
	; EPILOG-NEXT: br i1 [[TMP1]], label %exit2.loopexit.unr-lcssa, label [[ENTRY_NEW:%.*]]			; EPILOG-NEXT: br i1 [[TMP1]], label %exit2.loopexit.unr-lcssa, label [[ENTRY_NEW:%.*]]
	; EPILOG: entry.new:			; EPILOG: entry.new:
	; EPILOG-NEXT: [[UNROLL_ITER:%.*]] = sub i64 [[TRIP]], [[XTRAITER]]			; EPILOG-NEXT: [[UNROLL_ITER:%.*]] = sub i64 [[TRIP]], [[XTRAITER]]
	; EPILOG-NEXT: br label [[LOOP_HEADER:%.*]]			; EPILOG-NEXT: br label [[LOOP_HEADER:%.*]]
	; EPILOG: loop_latch.epil:			; EPILOG: loop_latch.epil:
	; EPILOG-NEXT: %epil.iter.sub = add i64 %epil.iter, -1			; EPILOG-NEXT: %epil.iter.sub = add i64 %epil.iter, -1
	; EPILOG-NEXT: %epil.iter.cmp = icmp eq i64 %epil.iter.sub, 0			; EPILOG-NEXT: %epil.iter.cmp = icmp eq i64 %epil.iter, 1
	; EPILOG-NEXT: br i1 %epil.iter.cmp, label %exit2.loopexit.epilog-lcssa, label %loop_header.epil			; EPILOG-NEXT: br i1 %epil.iter.cmp, label %exit2.loopexit.epilog-lcssa, label %loop_header.epil
	; EPILOG: loop_latch.7:			; EPILOG: loop_latch.7:
	; EPILOG-NEXT: %niter.nsub.7 = add i64 %niter, -8			; EPILOG-NEXT: %niter.nsub.7 = add i64 %niter, -8
	; EPILOG-NEXT: %niter.ncmp.7 = icmp eq i64 %niter.nsub.7, 0			; EPILOG-NEXT: %niter.ncmp.7 = icmp eq i64 %niter, 8
	; EPILOG-NEXT: br i1 %niter.ncmp.7, label %exit2.loopexit.unr-lcssa.loopexit, label %loop_header			; EPILOG-NEXT: br i1 %niter.ncmp.7, label %exit2.loopexit.unr-lcssa.loopexit, label %loop_header

	; PROLOG: test1(			; PROLOG: test1(
	; PROLOG-NEXT: entry:			; PROLOG-NEXT: entry:
	; PROLOG-NEXT: [[TMP0:%.]] = add i64 [[TRIP:%.]], -1			; PROLOG-NEXT: [[TMP0:%.]] = add i64 [[TRIP:%.]], -1
	; PROLOG-NEXT: [[XTRAITER:%.*]] = and i64 [[TRIP]], 7			; PROLOG-NEXT: [[XTRAITER:%.*]] = and i64 [[TRIP]], 7
	; PROLOG-NEXT: [[TMP1:%.*]] = icmp eq i64 [[XTRAITER]], 0			; PROLOG-NEXT: [[TMP1:%.*]] = icmp eq i64 [[XTRAITER]], 0
	; PROLOG-NEXT: br i1 [[TMP1]], label %loop_header.prol.loopexit, label %loop_header.prol.preheader			; PROLOG-NEXT: br i1 [[TMP1]], label %loop_header.prol.loopexit, label %loop_header.prol.preheader
	; PROLOG: loop_header.prol:			; PROLOG: loop_header.prol:
	; PROLOG-NEXT: %iv.prol = phi i64 [ 0, %loop_header.prol.preheader ], [ %iv_next.prol, %loop_latch.prol ]			; PROLOG-NEXT: %iv.prol = phi i64 [ 0, %loop_header.prol.preheader ], [ %iv_next.prol, %loop_latch.prol ]
	; PROLOG-NEXT: %prol.iter = phi i64 [ [[XTRAITER]], %loop_header.prol.preheader ], [ %prol.iter.sub, %loop_latch.prol ]			; PROLOG-NEXT: %prol.iter = phi i64 [ [[XTRAITER]], %loop_header.prol.preheader ], [ %prol.iter.sub, %loop_latch.prol ]
	; PROLOG-NEXT: br i1 %cond, label %loop_latch.prol, label %loop_exiting_bb1.prol			; PROLOG-NEXT: br i1 %cond, label %loop_latch.prol, label %loop_exiting_bb1.prol
	; PROLOG: loop_latch.prol:			; PROLOG: loop_latch.prol:
	; PROLOG-NEXT: %iv_next.prol = add i64 %iv.prol, 1			; PROLOG-NEXT: %iv_next.prol = add i64 %iv.prol, 1
	; PROLOG-NEXT: %prol.iter.sub = add i64 %prol.iter, -1			; PROLOG-NEXT: %prol.iter.sub = add i64 %prol.iter, -1
	; PROLOG-NEXT: %prol.iter.cmp = icmp eq i64 %prol.iter.sub, 0			; PROLOG-NEXT: %prol.iter.cmp = icmp eq i64 %prol.iter, 1
	; PROLOG-NEXT: br i1 %prol.iter.cmp, label %loop_header.prol.loopexit.unr-lcssa, label %loop_header.prol			; PROLOG-NEXT: br i1 %prol.iter.cmp, label %loop_header.prol.loopexit.unr-lcssa, label %loop_header.prol
	; PROLOG: loop_latch.7:			; PROLOG: loop_latch.7:
	; PROLOG-NEXT: %iv_next.7 = add i64 %iv, 8			; PROLOG-NEXT: %iv_next.7 = add i64 %iv, 8
	; PROLOG-NEXT: %cmp.7 = icmp eq i64 %iv_next.7, %trip			; PROLOG-NEXT: %cmp.7 = icmp eq i64 %iv_next.7, %trip
	; PROLOG-NEXT: br i1 %cmp.7, label %exit2.loopexit.unr-lcssa, label %loop_header			; PROLOG-NEXT: br i1 %cmp.7, label %exit2.loopexit.unr-lcssa, label %loop_header
	entry:			entry:
	br label %loop_header			br label %loop_header

	▲ Show 20 Lines • Show All 97 Lines • ▼ Show 20 Lines
	; EPILOG: loop_header:			; EPILOG: loop_header:
	; EPILOG-NEXT: %sum = phi i64 [ 0, %entry.new ], [ %sum.next.7, %loop_latch.7 ]			; EPILOG-NEXT: %sum = phi i64 [ 0, %entry.new ], [ %sum.next.7, %loop_latch.7 ]
	; EPILOG-NEXT: %niter = phi i64 [ %unroll_iter, %entry.new ], [ %niter.nsub.7, %loop_latch.7 ]			; EPILOG-NEXT: %niter = phi i64 [ %unroll_iter, %entry.new ], [ %niter.nsub.7, %loop_latch.7 ]
	; EPILOG: loop_exiting_bb1.7:			; EPILOG: loop_exiting_bb1.7:
	; EPILOG-NEXT: switch i64 %sum.next.6, label %loop_latch.7			; EPILOG-NEXT: switch i64 %sum.next.6, label %loop_latch.7
	; EPILOG: loop_latch.7:			; EPILOG: loop_latch.7:
	; EPILOG-NEXT: %sum.next.7 = add i64 %sum.next.6, %add			; EPILOG-NEXT: %sum.next.7 = add i64 %sum.next.6, %add
	; EPILOG-NEXT: %niter.nsub.7 = add i64 %niter, -8			; EPILOG-NEXT: %niter.nsub.7 = add i64 %niter, -8
	; EPILOG-NEXT: %niter.ncmp.7 = icmp eq i64 %niter.nsub.7, 0			; EPILOG-NEXT: %niter.ncmp.7 = icmp eq i64 %niter, 8
	; EPILOG-NEXT: br i1 %niter.ncmp.7, label %exit2.loopexit.unr-lcssa.loopexit, label %loop_header			; EPILOG-NEXT: br i1 %niter.ncmp.7, label %exit2.loopexit.unr-lcssa.loopexit, label %loop_header

	; PROLOG: test3(			; PROLOG: test3(
	; PROLOG-NEXT: entry:			; PROLOG-NEXT: entry:
	; PROLOG-NEXT: [[TMP0:%.]] = add i64 [[TRIP:%.]], -1			; PROLOG-NEXT: [[TMP0:%.]] = add i64 [[TRIP:%.]], -1
	; PROLOG-NEXT: [[XTRAITER:%.*]] = and i64 [[TRIP]], 7			; PROLOG-NEXT: [[XTRAITER:%.*]] = and i64 [[TRIP]], 7
	; PROLOG-NEXT: [[TMP1:%.*]] = icmp eq i64 [[XTRAITER]], 0			; PROLOG-NEXT: [[TMP1:%.*]] = icmp eq i64 [[XTRAITER]], 0
	; PROLOG-NEXT: br i1 [[TMP1]], label %loop_header.prol.loopexit, label %loop_header.prol.preheader			; PROLOG-NEXT: br i1 [[TMP1]], label %loop_header.prol.loopexit, label %loop_header.prol.preheader
	▲ Show 20 Lines • Show All 478 Lines • Show Last 20 Lines

llvm/test/Transforms/LoopUnroll/runtime-unroll-remainder.ll

	Show First 20 Lines • Show All 43 Lines • ▼ Show 20 Lines
	; CHECK-LABEL: for.body:			; CHECK-LABEL: for.body:
	; CHECK: [[INDVAR0:%[a-z.0-9]+]] = phi i64 [ 0, %for.body.lr.ph			; CHECK: [[INDVAR0:%[a-z.0-9]+]] = phi i64 [ 0, %for.body.lr.ph
	; CHECK: [[ITER:%[a-z.0-9]+]] = phi i64 [ %unroll_iter			; CHECK: [[ITER:%[a-z.0-9]+]] = phi i64 [ %unroll_iter
	; CHECK: or i64 [[INDVAR0]], 1			; CHECK: or i64 [[INDVAR0]], 1
	; CHECK: or i64 [[INDVAR0]], 2			; CHECK: or i64 [[INDVAR0]], 2
	; CHECK: or i64 [[INDVAR0]], 3			; CHECK: or i64 [[INDVAR0]], 3
	; CHECK: add nuw nsw i64 [[INDVAR0]], 4			; CHECK: add nuw nsw i64 [[INDVAR0]], 4
	; CHECK: [[SUB:%[a-z.0-9]+]] = add i64 [[ITER]], -4			; CHECK: [[SUB:%[a-z.0-9]+]] = add i64 [[ITER]], -4
	; CHECK: [[ITER_CMP:%[a-z.0-9]+]] = icmp eq i64 [[SUB]], 0			; CHECK: [[ITER_CMP:%[a-z.0-9]+]] = icmp eq i64 [[ITER]], 4
	; CHECK: br i1 [[ITER_CMP]], label %[[LOOP_EXIT:.*]], label %for.body			; CHECK: br i1 [[ITER_CMP]], label %[[LOOP_EXIT:.*]], label %for.body

	; CHECK: [[EPIL_PEEL1]]:			; CHECK: [[EPIL_PEEL1]]:
	; CHECK: [[PEEL_CMP1:%[a-z.0-9]+]] = icmp eq i64 %xtraiter, 2			; CHECK: [[PEEL_CMP1:%[a-z.0-9]+]] = icmp eq i64 %xtraiter, 2
	; CHECK: br i1 [[PEEL_CMP1]], label %[[EPIL_EXIT]], label %[[EPIL_PEEL2:.*]]			; CHECK: br i1 [[PEEL_CMP1]], label %[[EPIL_EXIT]], label %[[EPIL_PEEL2:.*]]

	; CHECK: [[EPIL_PEEL2]]:			; CHECK: [[EPIL_PEEL2]]:
	; CHECK: br label %[[EXIT]]			; CHECK: br label %[[EXIT]]
	Show All 14 Lines

llvm/test/Transforms/LoopVectorize/X86/gather_scatter.ll

	Show First 20 Lines • Show All 80 Lines • ▼ Show 20 Lines
	; AVX512-NEXT: [[TMP35:%.*]] = sext <16 x i32> [[WIDE_MASKED_LOAD_3]] to <16 x i64>			; AVX512-NEXT: [[TMP35:%.*]] = sext <16 x i32> [[WIDE_MASKED_LOAD_3]] to <16 x i64>
	; AVX512-NEXT: [[TMP36:%.]] = getelementptr inbounds float, float [[IN]], <16 x i64> [[TMP35]]			; AVX512-NEXT: [[TMP36:%.]] = getelementptr inbounds float, float [[IN]], <16 x i64> [[TMP35]]
	; AVX512-NEXT: [[WIDE_MASKED_GATHER_3:%.]] = call <16 x float> @llvm.masked.gather.v16f32.v16p0f32(<16 x float> [[TMP36]], i32 4, <16 x i1> [[TMP32]], <16 x float> undef)			; AVX512-NEXT: [[WIDE_MASKED_GATHER_3:%.]] = call <16 x float> @llvm.masked.gather.v16f32.v16p0f32(<16 x float> [[TMP36]], i32 4, <16 x i1> [[TMP32]], <16 x float> undef)
	; AVX512-NEXT: [[TMP37:%.*]] = fadd <16 x float> [[WIDE_MASKED_GATHER_3]], <float 5.000000e-01, float 5.000000e-01, float 5.000000e-01, float 5.000000e-01, float 5.000000e-01, float 5.000000e-01, float 5.000000e-01, float 5.000000e-01, float 5.000000e-01, float 5.000000e-01, float 5.000000e-01, float 5.000000e-01, float 5.000000e-01, float 5.000000e-01, float 5.000000e-01, float 5.000000e-01>			; AVX512-NEXT: [[TMP37:%.*]] = fadd <16 x float> [[WIDE_MASKED_GATHER_3]], <float 5.000000e-01, float 5.000000e-01, float 5.000000e-01, float 5.000000e-01, float 5.000000e-01, float 5.000000e-01, float 5.000000e-01, float 5.000000e-01, float 5.000000e-01, float 5.000000e-01, float 5.000000e-01, float 5.000000e-01, float 5.000000e-01, float 5.000000e-01, float 5.000000e-01, float 5.000000e-01>
	; AVX512-NEXT: [[TMP38:%.]] = getelementptr inbounds float, float [[OUT]], i64 [[INDEX_NEXT_2]]			; AVX512-NEXT: [[TMP38:%.]] = getelementptr inbounds float, float [[OUT]], i64 [[INDEX_NEXT_2]]
	; AVX512-NEXT: [[TMP39:%.]] = bitcast float [[TMP38]] to <16 x float>*			; AVX512-NEXT: [[TMP39:%.]] = bitcast float [[TMP38]] to <16 x float>*
	; AVX512-NEXT: call void @llvm.masked.store.v16f32.p0v16f32(<16 x float> [[TMP37]], <16 x float>* [[TMP39]], i32 4, <16 x i1> [[TMP32]])			; AVX512-NEXT: call void @llvm.masked.store.v16f32.p0v16f32(<16 x float> [[TMP37]], <16 x float>* [[TMP39]], i32 4, <16 x i1> [[TMP32]])
	; AVX512-NEXT: [[INDEX_NEXT_3]] = add nuw nsw i64 [[INDEX6]], 64			; AVX512-NEXT: [[INDEX_NEXT_3]] = add nuw nsw i64 [[INDEX6]], 64
	; AVX512-NEXT: [[TMP40:%.*]] = icmp eq i64 [[INDEX_NEXT_3]], 4096			; AVX512-NEXT: [[TMP40:%.*]] = icmp eq i64 [[INDEX6]], 4032
	; AVX512-NEXT: br i1 [[TMP40]], label [[FOR_END:%.*]], label [[VECTOR_BODY]], !llvm.loop !0			; AVX512-NEXT: br i1 [[TMP40]], label [[FOR_END:%.*]], label [[VECTOR_BODY]], !llvm.loop !0
	; AVX512: for.end:			; AVX512: for.end:
	; AVX512-NEXT: ret void			; AVX512-NEXT: ret void
	;			;
	; FVW2-LABEL: @foo1(			; FVW2-LABEL: @foo1(
	; FVW2-NEXT: entry:			; FVW2-NEXT: entry:
	; FVW2-NEXT: br label [[VECTOR_BODY:%.*]]			; FVW2-NEXT: br label [[VECTOR_BODY:%.*]]
	; FVW2: vector.body:			; FVW2: vector.body:
	▲ Show 20 Lines • Show All 53 Lines • ▼ Show 20 Lines
	; FVW2-NEXT: [[TMP35:%.*]] = sext <2 x i32> [[WIDE_MASKED_LOAD_3]] to <2 x i64>			; FVW2-NEXT: [[TMP35:%.*]] = sext <2 x i32> [[WIDE_MASKED_LOAD_3]] to <2 x i64>
	; FVW2-NEXT: [[TMP36:%.]] = getelementptr inbounds float, float [[IN]], <2 x i64> [[TMP35]]			; FVW2-NEXT: [[TMP36:%.]] = getelementptr inbounds float, float [[IN]], <2 x i64> [[TMP35]]
	; FVW2-NEXT: [[WIDE_MASKED_GATHER_3:%.]] = call <2 x float> @llvm.masked.gather.v2f32.v2p0f32(<2 x float> [[TMP36]], i32 4, <2 x i1> [[TMP32]], <2 x float> undef)			; FVW2-NEXT: [[WIDE_MASKED_GATHER_3:%.]] = call <2 x float> @llvm.masked.gather.v2f32.v2p0f32(<2 x float> [[TMP36]], i32 4, <2 x i1> [[TMP32]], <2 x float> undef)
	; FVW2-NEXT: [[TMP37:%.*]] = fadd <2 x float> [[WIDE_MASKED_GATHER_3]], <float 5.000000e-01, float 5.000000e-01>			; FVW2-NEXT: [[TMP37:%.*]] = fadd <2 x float> [[WIDE_MASKED_GATHER_3]], <float 5.000000e-01, float 5.000000e-01>
	; FVW2-NEXT: [[TMP38:%.]] = getelementptr inbounds float, float [[OUT]], i64 [[INDEX_NEXT_2]]			; FVW2-NEXT: [[TMP38:%.]] = getelementptr inbounds float, float [[OUT]], i64 [[INDEX_NEXT_2]]
	; FVW2-NEXT: [[TMP39:%.]] = bitcast float [[TMP38]] to <2 x float>*			; FVW2-NEXT: [[TMP39:%.]] = bitcast float [[TMP38]] to <2 x float>*
	; FVW2-NEXT: call void @llvm.masked.store.v2f32.p0v2f32(<2 x float> [[TMP37]], <2 x float>* [[TMP39]], i32 4, <2 x i1> [[TMP32]])			; FVW2-NEXT: call void @llvm.masked.store.v2f32.p0v2f32(<2 x float> [[TMP37]], <2 x float>* [[TMP39]], i32 4, <2 x i1> [[TMP32]])
	; FVW2-NEXT: [[INDEX_NEXT_3]] = add nuw nsw i64 [[INDEX6]], 8			; FVW2-NEXT: [[INDEX_NEXT_3]] = add nuw nsw i64 [[INDEX6]], 8
	; FVW2-NEXT: [[TMP40:%.*]] = icmp eq i64 [[INDEX_NEXT_3]], 4096			; FVW2-NEXT: [[TMP40:%.*]] = icmp eq i64 [[INDEX6]], 4088
	; FVW2-NEXT: br i1 [[TMP40]], label [[FOR_END:%.*]], label [[VECTOR_BODY]], !llvm.loop !0			; FVW2-NEXT: br i1 [[TMP40]], label [[FOR_END:%.*]], label [[VECTOR_BODY]], !llvm.loop !0
	; FVW2: for.end:			; FVW2: for.end:
	; FVW2-NEXT: ret void			; FVW2-NEXT: ret void
	;			;
	entry:			entry:
	%in.addr = alloca float*, align 8			%in.addr = alloca float*, align 8
	%out.addr = alloca float*, align 8			%out.addr = alloca float*, align 8
	%trigger.addr = alloca i32*, align 8			%trigger.addr = alloca i32*, align 8
	▲ Show 20 Lines • Show All 298 Lines • ▼ Show 20 Lines
	; FVW2-NEXT: [[TMP44:%.*]] = or i64 [[OFFSET_IDX]], 112			; FVW2-NEXT: [[TMP44:%.*]] = or i64 [[OFFSET_IDX]], 112
	; FVW2-NEXT: [[TMP45:%.]] = getelementptr inbounds float, float [[OUT]], i64 [[TMP44]]			; FVW2-NEXT: [[TMP45:%.]] = getelementptr inbounds float, float [[OUT]], i64 [[TMP44]]
	; FVW2-NEXT: [[TMP46:%.*]] = extractelement <2 x float> [[TMP15]], i32 1			; FVW2-NEXT: [[TMP46:%.*]] = extractelement <2 x float> [[TMP15]], i32 1
	; FVW2-NEXT: store float [[TMP46]], float* [[TMP45]], align 4			; FVW2-NEXT: store float [[TMP46]], float* [[TMP45]], align 4
	; FVW2-NEXT: br label [[PRED_STORE_CONTINUE30]]			; FVW2-NEXT: br label [[PRED_STORE_CONTINUE30]]
	; FVW2: pred.store.continue30:			; FVW2: pred.store.continue30:
	; FVW2-NEXT: [[INDEX_NEXT]] = add i64 [[INDEX6]], 8			; FVW2-NEXT: [[INDEX_NEXT]] = add i64 [[INDEX6]], 8
	; FVW2-NEXT: [[VEC_IND_NEXT]] = add <2 x i64> [[VEC_IND]], <i64 128, i64 128>			; FVW2-NEXT: [[VEC_IND_NEXT]] = add <2 x i64> [[VEC_IND]], <i64 128, i64 128>
	; FVW2-NEXT: [[TMP47:%.*]] = icmp eq i64 [[INDEX_NEXT]], 256			; FVW2-NEXT: [[TMP47:%.*]] = icmp eq i64 [[INDEX6]], 248
	; FVW2-NEXT: br i1 [[TMP47]], label [[FOR_END:%.*]], label [[VECTOR_BODY]], !llvm.loop !2			; FVW2-NEXT: br i1 [[TMP47]], label [[FOR_END:%.*]], label [[VECTOR_BODY]], !llvm.loop !2
	; FVW2: for.end:			; FVW2: for.end:
	; FVW2-NEXT: ret void			; FVW2-NEXT: ret void
	;			;
	entry:			entry:
	%in.addr = alloca %struct.In*, align 8			%in.addr = alloca %struct.In*, align 8
	%out.addr = alloca float*, align 8			%out.addr = alloca float*, align 8
	%trigger.addr = alloca i32*, align 8			%trigger.addr = alloca i32*, align 8
	▲ Show 20 Lines • Show All 299 Lines • ▼ Show 20 Lines
	; FVW2-NEXT: [[TMP44:%.*]] = or i64 [[OFFSET_IDX]], 112			; FVW2-NEXT: [[TMP44:%.*]] = or i64 [[OFFSET_IDX]], 112
	; FVW2-NEXT: [[TMP45:%.]] = getelementptr inbounds [[STRUCT_OUT]], %struct.Out [[OUT]], i64 [[TMP44]], i32 1			; FVW2-NEXT: [[TMP45:%.]] = getelementptr inbounds [[STRUCT_OUT]], %struct.Out [[OUT]], i64 [[TMP44]], i32 1
	; FVW2-NEXT: [[TMP46:%.*]] = extractelement <2 x float> [[TMP15]], i32 1			; FVW2-NEXT: [[TMP46:%.*]] = extractelement <2 x float> [[TMP15]], i32 1
	; FVW2-NEXT: store float [[TMP46]], float* [[TMP45]], align 4			; FVW2-NEXT: store float [[TMP46]], float* [[TMP45]], align 4
	; FVW2-NEXT: br label [[PRED_STORE_CONTINUE29]]			; FVW2-NEXT: br label [[PRED_STORE_CONTINUE29]]
	; FVW2: pred.store.continue29:			; FVW2: pred.store.continue29:
	; FVW2-NEXT: [[INDEX_NEXT]] = add i64 [[INDEX]], 8			; FVW2-NEXT: [[INDEX_NEXT]] = add i64 [[INDEX]], 8
	; FVW2-NEXT: [[VEC_IND_NEXT]] = add <2 x i64> [[VEC_IND]], <i64 128, i64 128>			; FVW2-NEXT: [[VEC_IND_NEXT]] = add <2 x i64> [[VEC_IND]], <i64 128, i64 128>
	; FVW2-NEXT: [[TMP47:%.*]] = icmp eq i64 [[INDEX_NEXT]], 256			; FVW2-NEXT: [[TMP47:%.*]] = icmp eq i64 [[INDEX]], 248
	; FVW2-NEXT: br i1 [[TMP47]], label [[FOR_END:%.*]], label [[VECTOR_BODY]], !llvm.loop !3			; FVW2-NEXT: br i1 [[TMP47]], label [[FOR_END:%.*]], label [[VECTOR_BODY]], !llvm.loop !3
	; FVW2: for.end:			; FVW2: for.end:
	; FVW2-NEXT: ret void			; FVW2-NEXT: ret void
	;			;
	entry:			entry:
	%in.addr = alloca %struct.In*, align 8			%in.addr = alloca %struct.In*, align 8
	%out.addr = alloca %struct.Out*, align 8			%out.addr = alloca %struct.Out*, align 8
	%trigger.addr = alloca i32*, align 8			%trigger.addr = alloca i32*, align 8
	▲ Show 20 Lines • Show All 285 Lines • ▼ Show 20 Lines
	; FVW2-NEXT: [[TMP44:%.*]] = or i64 [[OFFSET_IDX]], 112			; FVW2-NEXT: [[TMP44:%.*]] = or i64 [[OFFSET_IDX]], 112
	; FVW2-NEXT: [[TMP45:%.]] = getelementptr inbounds float, float addrspace(1) [[OUT]], i64 [[TMP44]]			; FVW2-NEXT: [[TMP45:%.]] = getelementptr inbounds float, float addrspace(1) [[OUT]], i64 [[TMP44]]
	; FVW2-NEXT: [[TMP46:%.*]] = extractelement <2 x float> [[TMP15]], i32 1			; FVW2-NEXT: [[TMP46:%.*]] = extractelement <2 x float> [[TMP15]], i32 1
	; FVW2-NEXT: store float [[TMP46]], float addrspace(1)* [[TMP45]], align 4			; FVW2-NEXT: store float [[TMP46]], float addrspace(1)* [[TMP45]], align 4
	; FVW2-NEXT: br label [[PRED_STORE_CONTINUE30]]			; FVW2-NEXT: br label [[PRED_STORE_CONTINUE30]]
	; FVW2: pred.store.continue30:			; FVW2: pred.store.continue30:
	; FVW2-NEXT: [[INDEX_NEXT]] = add i64 [[INDEX6]], 8			; FVW2-NEXT: [[INDEX_NEXT]] = add i64 [[INDEX6]], 8
	; FVW2-NEXT: [[VEC_IND_NEXT]] = add <2 x i64> [[VEC_IND]], <i64 128, i64 128>			; FVW2-NEXT: [[VEC_IND_NEXT]] = add <2 x i64> [[VEC_IND]], <i64 128, i64 128>
	; FVW2-NEXT: [[TMP47:%.*]] = icmp eq i64 [[INDEX_NEXT]], 256			; FVW2-NEXT: [[TMP47:%.*]] = icmp eq i64 [[INDEX6]], 248
	; FVW2-NEXT: br i1 [[TMP47]], label [[FOR_END:%.*]], label [[VECTOR_BODY]], !llvm.loop !4			; FVW2-NEXT: br i1 [[TMP47]], label [[FOR_END:%.*]], label [[VECTOR_BODY]], !llvm.loop !4
	; FVW2: for.end:			; FVW2: for.end:
	; FVW2-NEXT: ret void			; FVW2-NEXT: ret void
	;			;
	entry:			entry:
	%in.addr = alloca %struct.In addrspace(1)*, align 8			%in.addr = alloca %struct.In addrspace(1)*, align 8
	%out.addr = alloca float addrspace(1)*, align 8			%out.addr = alloca float addrspace(1)*, align 8
	%trigger.addr = alloca i32*, align 8			%trigger.addr = alloca i32*, align 8
	▲ Show 20 Lines • Show All 285 Lines • ▼ Show 20 Lines
	; FVW2-NEXT: [[TMP44:%.*]] = or i64 [[OFFSET_IDX]], 112			; FVW2-NEXT: [[TMP44:%.*]] = or i64 [[OFFSET_IDX]], 112
	; FVW2-NEXT: [[TMP45:%.]] = getelementptr inbounds float, float [[OUT]], i64 [[TMP44]]			; FVW2-NEXT: [[TMP45:%.]] = getelementptr inbounds float, float [[OUT]], i64 [[TMP44]]
	; FVW2-NEXT: [[TMP46:%.*]] = extractelement <2 x float> [[TMP15]], i32 1			; FVW2-NEXT: [[TMP46:%.*]] = extractelement <2 x float> [[TMP15]], i32 1
	; FVW2-NEXT: store float [[TMP46]], float* [[TMP45]], align 4			; FVW2-NEXT: store float [[TMP46]], float* [[TMP45]], align 4
	; FVW2-NEXT: br label [[PRED_STORE_CONTINUE30]]			; FVW2-NEXT: br label [[PRED_STORE_CONTINUE30]]
	; FVW2: pred.store.continue30:			; FVW2: pred.store.continue30:
	; FVW2-NEXT: [[INDEX_NEXT]] = add i64 [[INDEX6]], 8			; FVW2-NEXT: [[INDEX_NEXT]] = add i64 [[INDEX6]], 8
	; FVW2-NEXT: [[VEC_IND_NEXT]] = add <2 x i64> [[VEC_IND]], <i64 128, i64 128>			; FVW2-NEXT: [[VEC_IND_NEXT]] = add <2 x i64> [[VEC_IND]], <i64 128, i64 128>
	; FVW2-NEXT: [[TMP47:%.*]] = icmp eq i64 [[INDEX_NEXT]], 256			; FVW2-NEXT: [[TMP47:%.*]] = icmp eq i64 [[INDEX6]], 248
	; FVW2-NEXT: br i1 [[TMP47]], label [[FOR_END:%.*]], label [[VECTOR_BODY]], !llvm.loop !5			; FVW2-NEXT: br i1 [[TMP47]], label [[FOR_END:%.*]], label [[VECTOR_BODY]], !llvm.loop !5
	; FVW2: for.end:			; FVW2: for.end:
	; FVW2-NEXT: ret void			; FVW2-NEXT: ret void
	;			;
	entry:			entry:
	%in.addr = alloca %struct.In addrspace(1)*, align 8			%in.addr = alloca %struct.In addrspace(1)*, align 8
	%out.addr = alloca float addrspace(0)*, align 8			%out.addr = alloca float addrspace(0)*, align 8
	%trigger.addr = alloca i32*, align 8			%trigger.addr = alloca i32*, align 8
	▲ Show 20 Lines • Show All 285 Lines • ▼ Show 20 Lines
	; FVW2-NEXT: [[TMP44:%.*]] = or i64 [[OFFSET_IDX]], 112			; FVW2-NEXT: [[TMP44:%.*]] = or i64 [[OFFSET_IDX]], 112
	; FVW2-NEXT: [[TMP45:%.]] = getelementptr inbounds float, float addrspace(1) [[OUT]], i64 [[TMP44]]			; FVW2-NEXT: [[TMP45:%.]] = getelementptr inbounds float, float addrspace(1) [[OUT]], i64 [[TMP44]]
	; FVW2-NEXT: [[TMP46:%.*]] = extractelement <2 x float> [[TMP15]], i32 1			; FVW2-NEXT: [[TMP46:%.*]] = extractelement <2 x float> [[TMP15]], i32 1
	; FVW2-NEXT: store float [[TMP46]], float addrspace(1)* [[TMP45]], align 4			; FVW2-NEXT: store float [[TMP46]], float addrspace(1)* [[TMP45]], align 4
	; FVW2-NEXT: br label [[PRED_STORE_CONTINUE30]]			; FVW2-NEXT: br label [[PRED_STORE_CONTINUE30]]
	; FVW2: pred.store.continue30:			; FVW2: pred.store.continue30:
	; FVW2-NEXT: [[INDEX_NEXT]] = add i64 [[INDEX6]], 8			; FVW2-NEXT: [[INDEX_NEXT]] = add i64 [[INDEX6]], 8
	; FVW2-NEXT: [[VEC_IND_NEXT]] = add <2 x i64> [[VEC_IND]], <i64 128, i64 128>			; FVW2-NEXT: [[VEC_IND_NEXT]] = add <2 x i64> [[VEC_IND]], <i64 128, i64 128>
	; FVW2-NEXT: [[TMP47:%.*]] = icmp eq i64 [[INDEX_NEXT]], 256			; FVW2-NEXT: [[TMP47:%.*]] = icmp eq i64 [[INDEX6]], 248
	; FVW2-NEXT: br i1 [[TMP47]], label [[FOR_END:%.*]], label [[VECTOR_BODY]], !llvm.loop !6			; FVW2-NEXT: br i1 [[TMP47]], label [[FOR_END:%.*]], label [[VECTOR_BODY]], !llvm.loop !6
	; FVW2: for.end:			; FVW2: for.end:
	; FVW2-NEXT: ret void			; FVW2-NEXT: ret void
	;			;
	entry:			entry:
	%in.addr = alloca %struct.In addrspace(0)*, align 8			%in.addr = alloca %struct.In addrspace(0)*, align 8
	%out.addr = alloca float addrspace(1)*, align 8			%out.addr = alloca float addrspace(1)*, align 8
	%trigger.addr = alloca i32*, align 8			%trigger.addr = alloca i32*, align 8
	▲ Show 20 Lines • Show All 50 Lines • Show Last 20 Lines

llvm/test/Transforms/LoopVectorize/X86/masked_load_store.ll

	Show First 20 Lines • Show All 52 Lines • ▼ Show 20 Lines
	; AVX1-NEXT: [[TMP11:%.]] = getelementptr inbounds i32, i32 [[B]], i64 [[INDEX_NEXT]]			; AVX1-NEXT: [[TMP11:%.]] = getelementptr inbounds i32, i32 [[B]], i64 [[INDEX_NEXT]]
	; AVX1-NEXT: [[TMP12:%.]] = bitcast i32 [[TMP11]] to <8 x i32>*			; AVX1-NEXT: [[TMP12:%.]] = bitcast i32 [[TMP11]] to <8 x i32>*
	; AVX1-NEXT: [[WIDE_MASKED_LOAD_1:%.]] = call <8 x i32> @llvm.masked.load.v8i32.p0v8i32(<8 x i32> nonnull [[TMP12]], i32 4, <8 x i1> [[TMP10]], <8 x i32> undef), !alias.scope !3			; AVX1-NEXT: [[WIDE_MASKED_LOAD_1:%.]] = call <8 x i32> @llvm.masked.load.v8i32.p0v8i32(<8 x i32> nonnull [[TMP12]], i32 4, <8 x i1> [[TMP10]], <8 x i32> undef), !alias.scope !3
	; AVX1-NEXT: [[TMP13:%.*]] = add nsw <8 x i32> [[WIDE_MASKED_LOAD_1]], [[WIDE_LOAD_1]]			; AVX1-NEXT: [[TMP13:%.*]] = add nsw <8 x i32> [[WIDE_MASKED_LOAD_1]], [[WIDE_LOAD_1]]
	; AVX1-NEXT: [[TMP14:%.]] = getelementptr inbounds i32, i32 [[A]], i64 [[INDEX_NEXT]]			; AVX1-NEXT: [[TMP14:%.]] = getelementptr inbounds i32, i32 [[A]], i64 [[INDEX_NEXT]]
	; AVX1-NEXT: [[TMP15:%.]] = bitcast i32 [[TMP14]] to <8 x i32>*			; AVX1-NEXT: [[TMP15:%.]] = bitcast i32 [[TMP14]] to <8 x i32>*
	; AVX1-NEXT: call void @llvm.masked.store.v8i32.p0v8i32(<8 x i32> [[TMP13]], <8 x i32>* [[TMP15]], i32 4, <8 x i1> [[TMP10]]), !alias.scope !5, !noalias !7			; AVX1-NEXT: call void @llvm.masked.store.v8i32.p0v8i32(<8 x i32> [[TMP13]], <8 x i32>* [[TMP15]], i32 4, <8 x i1> [[TMP10]]), !alias.scope !5, !noalias !7
	; AVX1-NEXT: [[INDEX_NEXT_1]] = add nuw nsw i64 [[INDEX]], 16			; AVX1-NEXT: [[INDEX_NEXT_1]] = add nuw nsw i64 [[INDEX]], 16
	; AVX1-NEXT: [[TMP16:%.*]] = icmp eq i64 [[INDEX_NEXT_1]], 10000			; AVX1-NEXT: [[TMP16:%.*]] = icmp eq i64 [[INDEX]], 9984
	; AVX1-NEXT: br i1 [[TMP16]], label [[FOR_END:%.*]], label [[VECTOR_BODY]], !llvm.loop !8			; AVX1-NEXT: br i1 [[TMP16]], label [[FOR_END:%.*]], label [[VECTOR_BODY]], !llvm.loop !8
	; AVX1: for.body:			; AVX1: for.body:
	; AVX1-NEXT: [[INDVARS_IV:%.]] = phi i64 [ [[INDVARS_IV_NEXT_1:%.]], [[FOR_INC_1:%.*]] ], [ 0, [[ENTRY]] ]			; AVX1-NEXT: [[INDVARS_IV:%.]] = phi i64 [ [[INDVARS_IV_NEXT_1:%.]], [[FOR_INC_1:%.*]] ], [ 0, [[ENTRY]] ]
	; AVX1-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds i32, i32 [[TRIGGER]], i64 [[INDVARS_IV]]			; AVX1-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds i32, i32 [[TRIGGER]], i64 [[INDVARS_IV]]
	; AVX1-NEXT: [[TMP17:%.]] = load i32, i32 [[ARRAYIDX]], align 4			; AVX1-NEXT: [[TMP17:%.]] = load i32, i32 [[ARRAYIDX]], align 4
	; AVX1-NEXT: [[CMP1:%.*]] = icmp slt i32 [[TMP17]], 100			; AVX1-NEXT: [[CMP1:%.*]] = icmp slt i32 [[TMP17]], 100
	; AVX1-NEXT: br i1 [[CMP1]], label [[IF_THEN:%.]], label [[FOR_INC:%.]]			; AVX1-NEXT: br i1 [[CMP1]], label [[IF_THEN:%.]], label [[FOR_INC:%.]]
	; AVX1: if.then:			; AVX1: if.then:
	Show All 15 Lines
	; AVX1-NEXT: [[ARRAYIDX3_1:%.]] = getelementptr inbounds i32, i32 [[B]], i64 [[INDVARS_IV_NEXT]]			; AVX1-NEXT: [[ARRAYIDX3_1:%.]] = getelementptr inbounds i32, i32 [[B]], i64 [[INDVARS_IV_NEXT]]
	; AVX1-NEXT: [[TMP20:%.]] = load i32, i32 [[ARRAYIDX3_1]], align 4			; AVX1-NEXT: [[TMP20:%.]] = load i32, i32 [[ARRAYIDX3_1]], align 4
	; AVX1-NEXT: [[ADD_1:%.*]] = add nsw i32 [[TMP20]], [[TMP19]]			; AVX1-NEXT: [[ADD_1:%.*]] = add nsw i32 [[TMP20]], [[TMP19]]
	; AVX1-NEXT: [[ARRAYIDX7_1:%.]] = getelementptr inbounds i32, i32 [[A]], i64 [[INDVARS_IV_NEXT]]			; AVX1-NEXT: [[ARRAYIDX7_1:%.]] = getelementptr inbounds i32, i32 [[A]], i64 [[INDVARS_IV_NEXT]]
	; AVX1-NEXT: store i32 [[ADD_1]], i32* [[ARRAYIDX7_1]], align 4			; AVX1-NEXT: store i32 [[ADD_1]], i32* [[ARRAYIDX7_1]], align 4
	; AVX1-NEXT: br label [[FOR_INC_1]]			; AVX1-NEXT: br label [[FOR_INC_1]]
	; AVX1: for.inc.1:			; AVX1: for.inc.1:
	; AVX1-NEXT: [[INDVARS_IV_NEXT_1]] = add nuw nsw i64 [[INDVARS_IV]], 2			; AVX1-NEXT: [[INDVARS_IV_NEXT_1]] = add nuw nsw i64 [[INDVARS_IV]], 2
	; AVX1-NEXT: [[EXITCOND_1:%.*]] = icmp eq i64 [[INDVARS_IV_NEXT_1]], 10000			; AVX1-NEXT: [[EXITCOND_1:%.*]] = icmp eq i64 [[INDVARS_IV]], 9998
	; AVX1-NEXT: br i1 [[EXITCOND_1]], label [[FOR_END]], label [[FOR_BODY]], !llvm.loop !10			; AVX1-NEXT: br i1 [[EXITCOND_1]], label [[FOR_END]], label [[FOR_BODY]], !llvm.loop !10
	;			;
	; AVX2-LABEL: @foo1(			; AVX2-LABEL: @foo1(
	; AVX2-NEXT: entry:			; AVX2-NEXT: entry:
	; AVX2-NEXT: [[SCEVGEP:%.]] = getelementptr i32, i32 [[A:%.*]], i64 10000			; AVX2-NEXT: [[SCEVGEP:%.]] = getelementptr i32, i32 [[A:%.*]], i64 10000
	; AVX2-NEXT: [[SCEVGEP11:%.]] = getelementptr i32, i32 [[TRIGGER:%.*]], i64 10000			; AVX2-NEXT: [[SCEVGEP11:%.]] = getelementptr i32, i32 [[TRIGGER:%.*]], i64 10000
	; AVX2-NEXT: [[SCEVGEP14:%.]] = getelementptr i32, i32 [[B:%.*]], i64 10000			; AVX2-NEXT: [[SCEVGEP14:%.]] = getelementptr i32, i32 [[B:%.*]], i64 10000
	; AVX2-NEXT: [[BOUND0:%.]] = icmp ugt i32 [[SCEVGEP11]], [[A]]			; AVX2-NEXT: [[BOUND0:%.]] = icmp ugt i32 [[SCEVGEP11]], [[A]]
	▲ Show 20 Lines • Show All 91 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: call void @llvm.masked.store.v8i32.p0v8i32(<8 x i32> [[TMP53]], <8 x i32>* [[TMP59]], i32 4, <8 x i1> [[TMP41]]), !alias.scope !5, !noalias !7			; AVX2-NEXT: call void @llvm.masked.store.v8i32.p0v8i32(<8 x i32> [[TMP53]], <8 x i32>* [[TMP59]], i32 4, <8 x i1> [[TMP41]]), !alias.scope !5, !noalias !7
	; AVX2-NEXT: [[TMP60:%.]] = getelementptr inbounds i32, i32 [[TMP56]], i64 16			; AVX2-NEXT: [[TMP60:%.]] = getelementptr inbounds i32, i32 [[TMP56]], i64 16
	; AVX2-NEXT: [[TMP61:%.]] = bitcast i32 [[TMP60]] to <8 x i32>*			; AVX2-NEXT: [[TMP61:%.]] = bitcast i32 [[TMP60]] to <8 x i32>*
	; AVX2-NEXT: call void @llvm.masked.store.v8i32.p0v8i32(<8 x i32> [[TMP54]], <8 x i32>* [[TMP61]], i32 4, <8 x i1> [[TMP42]]), !alias.scope !5, !noalias !7			; AVX2-NEXT: call void @llvm.masked.store.v8i32.p0v8i32(<8 x i32> [[TMP54]], <8 x i32>* [[TMP61]], i32 4, <8 x i1> [[TMP42]]), !alias.scope !5, !noalias !7
	; AVX2-NEXT: [[TMP62:%.]] = getelementptr inbounds i32, i32 [[TMP56]], i64 24			; AVX2-NEXT: [[TMP62:%.]] = getelementptr inbounds i32, i32 [[TMP56]], i64 24
	; AVX2-NEXT: [[TMP63:%.]] = bitcast i32 [[TMP62]] to <8 x i32>*			; AVX2-NEXT: [[TMP63:%.]] = bitcast i32 [[TMP62]] to <8 x i32>*
	; AVX2-NEXT: call void @llvm.masked.store.v8i32.p0v8i32(<8 x i32> [[TMP55]], <8 x i32>* [[TMP63]], i32 4, <8 x i1> [[TMP43]]), !alias.scope !5, !noalias !7			; AVX2-NEXT: call void @llvm.masked.store.v8i32.p0v8i32(<8 x i32> [[TMP55]], <8 x i32>* [[TMP63]], i32 4, <8 x i1> [[TMP43]]), !alias.scope !5, !noalias !7
	; AVX2-NEXT: [[INDEX_NEXT_1]] = add nuw nsw i64 [[INDEX]], 64			; AVX2-NEXT: [[INDEX_NEXT_1]] = add nuw nsw i64 [[INDEX]], 64
	; AVX2-NEXT: [[TMP64:%.*]] = icmp eq i64 [[INDEX_NEXT_1]], 9984			; AVX2-NEXT: [[TMP64:%.*]] = icmp eq i64 [[INDEX]], 9920
	; AVX2-NEXT: br i1 [[TMP64]], label [[FOR_BODY_PREHEADER]], label [[VECTOR_BODY]], !llvm.loop !8			; AVX2-NEXT: br i1 [[TMP64]], label [[FOR_BODY_PREHEADER]], label [[VECTOR_BODY]], !llvm.loop !8
	; AVX2: for.body.preheader:			; AVX2: for.body.preheader:
	; AVX2-NEXT: [[INDVARS_IV_PH:%.*]] = phi i64 [ 0, [[ENTRY]] ], [ 9984, [[VECTOR_BODY]] ]			; AVX2-NEXT: [[INDVARS_IV_PH:%.*]] = phi i64 [ 0, [[ENTRY]] ], [ 9984, [[VECTOR_BODY]] ]
	; AVX2-NEXT: br label [[FOR_BODY:%.*]]			; AVX2-NEXT: br label [[FOR_BODY:%.*]]
	; AVX2: for.body:			; AVX2: for.body:
	; AVX2-NEXT: [[INDVARS_IV:%.]] = phi i64 [ [[INDVARS_IV_PH]], [[FOR_BODY_PREHEADER]] ], [ [[INDVARS_IV_NEXT_3:%.]], [[FOR_INC_3:%.*]] ]			; AVX2-NEXT: [[INDVARS_IV:%.]] = phi i64 [ [[INDVARS_IV_PH]], [[FOR_BODY_PREHEADER]] ], [ [[INDVARS_IV_NEXT_3:%.]], [[FOR_INC_3:%.*]] ]
	; AVX2-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds i32, i32 [[TRIGGER]], i64 [[INDVARS_IV]]			; AVX2-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds i32, i32 [[TRIGGER]], i64 [[INDVARS_IV]]
	; AVX2-NEXT: [[TMP65:%.]] = load i32, i32 [[ARRAYIDX]], align 4			; AVX2-NEXT: [[TMP65:%.]] = load i32, i32 [[ARRAYIDX]], align 4
	▲ Show 20 Lines • Show All 44 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: [[ARRAYIDX3_3:%.]] = getelementptr inbounds i32, i32 [[B]], i64 [[INDVARS_IV_NEXT_2]]			; AVX2-NEXT: [[ARRAYIDX3_3:%.]] = getelementptr inbounds i32, i32 [[B]], i64 [[INDVARS_IV_NEXT_2]]
	; AVX2-NEXT: [[TMP72:%.]] = load i32, i32 [[ARRAYIDX3_3]], align 4			; AVX2-NEXT: [[TMP72:%.]] = load i32, i32 [[ARRAYIDX3_3]], align 4
	; AVX2-NEXT: [[ADD_3:%.*]] = add nsw i32 [[TMP72]], [[TMP71]]			; AVX2-NEXT: [[ADD_3:%.*]] = add nsw i32 [[TMP72]], [[TMP71]]
	; AVX2-NEXT: [[ARRAYIDX7_3:%.]] = getelementptr inbounds i32, i32 [[A]], i64 [[INDVARS_IV_NEXT_2]]			; AVX2-NEXT: [[ARRAYIDX7_3:%.]] = getelementptr inbounds i32, i32 [[A]], i64 [[INDVARS_IV_NEXT_2]]
	; AVX2-NEXT: store i32 [[ADD_3]], i32* [[ARRAYIDX7_3]], align 4			; AVX2-NEXT: store i32 [[ADD_3]], i32* [[ARRAYIDX7_3]], align 4
	; AVX2-NEXT: br label [[FOR_INC_3]]			; AVX2-NEXT: br label [[FOR_INC_3]]
	; AVX2: for.inc.3:			; AVX2: for.inc.3:
	; AVX2-NEXT: [[INDVARS_IV_NEXT_3]] = add nuw nsw i64 [[INDVARS_IV]], 4			; AVX2-NEXT: [[INDVARS_IV_NEXT_3]] = add nuw nsw i64 [[INDVARS_IV]], 4
	; AVX2-NEXT: [[EXITCOND_3:%.*]] = icmp eq i64 [[INDVARS_IV_NEXT_3]], 10000			; AVX2-NEXT: [[EXITCOND_3:%.*]] = icmp eq i64 [[INDVARS_IV]], 9996
	; AVX2-NEXT: br i1 [[EXITCOND_3]], label [[FOR_END:%.*]], label [[FOR_BODY]], !llvm.loop !10			; AVX2-NEXT: br i1 [[EXITCOND_3]], label [[FOR_END:%.*]], label [[FOR_BODY]], !llvm.loop !10
	;			;
	; AVX512-LABEL: @foo1(			; AVX512-LABEL: @foo1(
	; AVX512-NEXT: entry:			; AVX512-NEXT: entry:
	; AVX512-NEXT: [[SCEVGEP:%.]] = getelementptr i32, i32 [[A:%.*]], i64 10000			; AVX512-NEXT: [[SCEVGEP:%.]] = getelementptr i32, i32 [[A:%.*]], i64 10000
	; AVX512-NEXT: [[SCEVGEP11:%.]] = getelementptr i32, i32 [[TRIGGER:%.*]], i64 10000			; AVX512-NEXT: [[SCEVGEP11:%.]] = getelementptr i32, i32 [[TRIGGER:%.*]], i64 10000
	; AVX512-NEXT: [[SCEVGEP14:%.]] = getelementptr i32, i32 [[B:%.*]], i64 10000			; AVX512-NEXT: [[SCEVGEP14:%.]] = getelementptr i32, i32 [[B:%.*]], i64 10000
	; AVX512-NEXT: [[BOUND0:%.]] = icmp ugt i32 [[SCEVGEP11]], [[A]]			; AVX512-NEXT: [[BOUND0:%.]] = icmp ugt i32 [[SCEVGEP11]], [[A]]
	▲ Show 20 Lines • Show All 91 Lines • ▼ Show 20 Lines
	; AVX512-NEXT: call void @llvm.masked.store.v16i32.p0v16i32(<16 x i32> [[TMP53]], <16 x i32>* [[TMP59]], i32 4, <16 x i1> [[TMP41]]), !alias.scope !5, !noalias !7			; AVX512-NEXT: call void @llvm.masked.store.v16i32.p0v16i32(<16 x i32> [[TMP53]], <16 x i32>* [[TMP59]], i32 4, <16 x i1> [[TMP41]]), !alias.scope !5, !noalias !7
	; AVX512-NEXT: [[TMP60:%.]] = getelementptr inbounds i32, i32 [[TMP56]], i64 32			; AVX512-NEXT: [[TMP60:%.]] = getelementptr inbounds i32, i32 [[TMP56]], i64 32
	; AVX512-NEXT: [[TMP61:%.]] = bitcast i32 [[TMP60]] to <16 x i32>*			; AVX512-NEXT: [[TMP61:%.]] = bitcast i32 [[TMP60]] to <16 x i32>*
	; AVX512-NEXT: call void @llvm.masked.store.v16i32.p0v16i32(<16 x i32> [[TMP54]], <16 x i32>* [[TMP61]], i32 4, <16 x i1> [[TMP42]]), !alias.scope !5, !noalias !7			; AVX512-NEXT: call void @llvm.masked.store.v16i32.p0v16i32(<16 x i32> [[TMP54]], <16 x i32>* [[TMP61]], i32 4, <16 x i1> [[TMP42]]), !alias.scope !5, !noalias !7
	; AVX512-NEXT: [[TMP62:%.]] = getelementptr inbounds i32, i32 [[TMP56]], i64 48			; AVX512-NEXT: [[TMP62:%.]] = getelementptr inbounds i32, i32 [[TMP56]], i64 48
	; AVX512-NEXT: [[TMP63:%.]] = bitcast i32 [[TMP62]] to <16 x i32>*			; AVX512-NEXT: [[TMP63:%.]] = bitcast i32 [[TMP62]] to <16 x i32>*
	; AVX512-NEXT: call void @llvm.masked.store.v16i32.p0v16i32(<16 x i32> [[TMP55]], <16 x i32>* [[TMP63]], i32 4, <16 x i1> [[TMP43]]), !alias.scope !5, !noalias !7			; AVX512-NEXT: call void @llvm.masked.store.v16i32.p0v16i32(<16 x i32> [[TMP55]], <16 x i32>* [[TMP63]], i32 4, <16 x i1> [[TMP43]]), !alias.scope !5, !noalias !7
	; AVX512-NEXT: [[INDEX_NEXT_1]] = add nuw nsw i64 [[INDEX]], 128			; AVX512-NEXT: [[INDEX_NEXT_1]] = add nuw nsw i64 [[INDEX]], 128
	; AVX512-NEXT: [[TMP64:%.*]] = icmp eq i64 [[INDEX_NEXT_1]], 9984			; AVX512-NEXT: [[TMP64:%.*]] = icmp eq i64 [[INDEX]], 9856
	; AVX512-NEXT: br i1 [[TMP64]], label [[FOR_BODY_PREHEADER]], label [[VECTOR_BODY]], !llvm.loop !8			; AVX512-NEXT: br i1 [[TMP64]], label [[FOR_BODY_PREHEADER]], label [[VECTOR_BODY]], !llvm.loop !8
	; AVX512: for.body.preheader:			; AVX512: for.body.preheader:
	; AVX512-NEXT: [[INDVARS_IV_PH:%.*]] = phi i64 [ 0, [[ENTRY]] ], [ 9984, [[VECTOR_BODY]] ]			; AVX512-NEXT: [[INDVARS_IV_PH:%.*]] = phi i64 [ 0, [[ENTRY]] ], [ 9984, [[VECTOR_BODY]] ]
	; AVX512-NEXT: br label [[FOR_BODY:%.*]]			; AVX512-NEXT: br label [[FOR_BODY:%.*]]
	; AVX512: for.body:			; AVX512: for.body:
	; AVX512-NEXT: [[INDVARS_IV:%.]] = phi i64 [ [[INDVARS_IV_PH]], [[FOR_BODY_PREHEADER]] ], [ [[INDVARS_IV_NEXT_3:%.]], [[FOR_INC_3:%.*]] ]			; AVX512-NEXT: [[INDVARS_IV:%.]] = phi i64 [ [[INDVARS_IV_PH]], [[FOR_BODY_PREHEADER]] ], [ [[INDVARS_IV_NEXT_3:%.]], [[FOR_INC_3:%.*]] ]
	; AVX512-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds i32, i32 [[TRIGGER]], i64 [[INDVARS_IV]]			; AVX512-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds i32, i32 [[TRIGGER]], i64 [[INDVARS_IV]]
	; AVX512-NEXT: [[TMP65:%.]] = load i32, i32 [[ARRAYIDX]], align 4			; AVX512-NEXT: [[TMP65:%.]] = load i32, i32 [[ARRAYIDX]], align 4
	▲ Show 20 Lines • Show All 44 Lines • ▼ Show 20 Lines
	; AVX512-NEXT: [[ARRAYIDX3_3:%.]] = getelementptr inbounds i32, i32 [[B]], i64 [[INDVARS_IV_NEXT_2]]			; AVX512-NEXT: [[ARRAYIDX3_3:%.]] = getelementptr inbounds i32, i32 [[B]], i64 [[INDVARS_IV_NEXT_2]]
	; AVX512-NEXT: [[TMP72:%.]] = load i32, i32 [[ARRAYIDX3_3]], align 4			; AVX512-NEXT: [[TMP72:%.]] = load i32, i32 [[ARRAYIDX3_3]], align 4
	; AVX512-NEXT: [[ADD_3:%.*]] = add nsw i32 [[TMP72]], [[TMP71]]			; AVX512-NEXT: [[ADD_3:%.*]] = add nsw i32 [[TMP72]], [[TMP71]]
	; AVX512-NEXT: [[ARRAYIDX7_3:%.]] = getelementptr inbounds i32, i32 [[A]], i64 [[INDVARS_IV_NEXT_2]]			; AVX512-NEXT: [[ARRAYIDX7_3:%.]] = getelementptr inbounds i32, i32 [[A]], i64 [[INDVARS_IV_NEXT_2]]
	; AVX512-NEXT: store i32 [[ADD_3]], i32* [[ARRAYIDX7_3]], align 4			; AVX512-NEXT: store i32 [[ADD_3]], i32* [[ARRAYIDX7_3]], align 4
	; AVX512-NEXT: br label [[FOR_INC_3]]			; AVX512-NEXT: br label [[FOR_INC_3]]
	; AVX512: for.inc.3:			; AVX512: for.inc.3:
	; AVX512-NEXT: [[INDVARS_IV_NEXT_3]] = add nuw nsw i64 [[INDVARS_IV]], 4			; AVX512-NEXT: [[INDVARS_IV_NEXT_3]] = add nuw nsw i64 [[INDVARS_IV]], 4
	; AVX512-NEXT: [[EXITCOND_3:%.*]] = icmp eq i64 [[INDVARS_IV_NEXT_3]], 10000			; AVX512-NEXT: [[EXITCOND_3:%.*]] = icmp eq i64 [[INDVARS_IV]], 9996
	; AVX512-NEXT: br i1 [[EXITCOND_3]], label [[FOR_END:%.*]], label [[FOR_BODY]], !llvm.loop !10			; AVX512-NEXT: br i1 [[EXITCOND_3]], label [[FOR_END:%.*]], label [[FOR_BODY]], !llvm.loop !10
	;			;
	entry:			entry:
	%A.addr = alloca i32*, align 8			%A.addr = alloca i32*, align 8
	%B.addr = alloca i32*, align 8			%B.addr = alloca i32*, align 8
	%trigger.addr = alloca i32*, align 8			%trigger.addr = alloca i32*, align 8
	%i = alloca i32, align 4			%i = alloca i32, align 4
	store i32* %A, i32** %A.addr, align 8			store i32* %A, i32** %A.addr, align 8
	▲ Show 20 Lines • Show All 86 Lines • ▼ Show 20 Lines
	; AVX1-NEXT: [[TMP11:%.]] = getelementptr inbounds i32, i32 addrspace(1) [[B]], i64 [[INDEX_NEXT]]			; AVX1-NEXT: [[TMP11:%.]] = getelementptr inbounds i32, i32 addrspace(1) [[B]], i64 [[INDEX_NEXT]]
	; AVX1-NEXT: [[TMP12:%.]] = bitcast i32 addrspace(1) [[TMP11]] to <8 x i32> addrspace(1)*			; AVX1-NEXT: [[TMP12:%.]] = bitcast i32 addrspace(1) [[TMP11]] to <8 x i32> addrspace(1)*
	; AVX1-NEXT: [[WIDE_MASKED_LOAD_1:%.]] = call <8 x i32> @llvm.masked.load.v8i32.p1v8i32(<8 x i32> addrspace(1) [[TMP12]], i32 4, <8 x i1> [[TMP10]], <8 x i32> undef), !alias.scope !14			; AVX1-NEXT: [[WIDE_MASKED_LOAD_1:%.]] = call <8 x i32> @llvm.masked.load.v8i32.p1v8i32(<8 x i32> addrspace(1) [[TMP12]], i32 4, <8 x i1> [[TMP10]], <8 x i32> undef), !alias.scope !14
	; AVX1-NEXT: [[TMP13:%.*]] = add nsw <8 x i32> [[WIDE_MASKED_LOAD_1]], [[WIDE_LOAD_1]]			; AVX1-NEXT: [[TMP13:%.*]] = add nsw <8 x i32> [[WIDE_MASKED_LOAD_1]], [[WIDE_LOAD_1]]
	; AVX1-NEXT: [[TMP14:%.]] = getelementptr inbounds i32, i32 addrspace(1) [[A]], i64 [[INDEX_NEXT]]			; AVX1-NEXT: [[TMP14:%.]] = getelementptr inbounds i32, i32 addrspace(1) [[A]], i64 [[INDEX_NEXT]]
	; AVX1-NEXT: [[TMP15:%.]] = bitcast i32 addrspace(1) [[TMP14]] to <8 x i32> addrspace(1)*			; AVX1-NEXT: [[TMP15:%.]] = bitcast i32 addrspace(1) [[TMP14]] to <8 x i32> addrspace(1)*
	; AVX1-NEXT: call void @llvm.masked.store.v8i32.p1v8i32(<8 x i32> [[TMP13]], <8 x i32> addrspace(1)* [[TMP15]], i32 4, <8 x i1> [[TMP10]]), !alias.scope !16, !noalias !18			; AVX1-NEXT: call void @llvm.masked.store.v8i32.p1v8i32(<8 x i32> [[TMP13]], <8 x i32> addrspace(1)* [[TMP15]], i32 4, <8 x i1> [[TMP10]]), !alias.scope !16, !noalias !18
	; AVX1-NEXT: [[INDEX_NEXT_1]] = add nuw nsw i64 [[INDEX]], 16			; AVX1-NEXT: [[INDEX_NEXT_1]] = add nuw nsw i64 [[INDEX]], 16
	; AVX1-NEXT: [[TMP16:%.*]] = icmp eq i64 [[INDEX_NEXT_1]], 10000			; AVX1-NEXT: [[TMP16:%.*]] = icmp eq i64 [[INDEX]], 9984
	; AVX1-NEXT: br i1 [[TMP16]], label [[FOR_END:%.*]], label [[VECTOR_BODY]], !llvm.loop !19			; AVX1-NEXT: br i1 [[TMP16]], label [[FOR_END:%.*]], label [[VECTOR_BODY]], !llvm.loop !19
	; AVX1: for.body:			; AVX1: for.body:
	; AVX1-NEXT: [[INDVARS_IV:%.]] = phi i64 [ [[INDVARS_IV_NEXT_1:%.]], [[FOR_INC_1:%.*]] ], [ 0, [[ENTRY]] ]			; AVX1-NEXT: [[INDVARS_IV:%.]] = phi i64 [ [[INDVARS_IV_NEXT_1:%.]], [[FOR_INC_1:%.*]] ], [ 0, [[ENTRY]] ]
	; AVX1-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds i32, i32 addrspace(1) [[TRIGGER]], i64 [[INDVARS_IV]]			; AVX1-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds i32, i32 addrspace(1) [[TRIGGER]], i64 [[INDVARS_IV]]
	; AVX1-NEXT: [[TMP17:%.]] = load i32, i32 addrspace(1) [[ARRAYIDX]], align 4			; AVX1-NEXT: [[TMP17:%.]] = load i32, i32 addrspace(1) [[ARRAYIDX]], align 4
	; AVX1-NEXT: [[CMP1:%.*]] = icmp slt i32 [[TMP17]], 100			; AVX1-NEXT: [[CMP1:%.*]] = icmp slt i32 [[TMP17]], 100
	; AVX1-NEXT: br i1 [[CMP1]], label [[IF_THEN:%.]], label [[FOR_INC:%.]]			; AVX1-NEXT: br i1 [[CMP1]], label [[IF_THEN:%.]], label [[FOR_INC:%.]]
	; AVX1: if.then:			; AVX1: if.then:
	Show All 15 Lines
	; AVX1-NEXT: [[ARRAYIDX3_1:%.]] = getelementptr inbounds i32, i32 addrspace(1) [[B]], i64 [[INDVARS_IV_NEXT]]			; AVX1-NEXT: [[ARRAYIDX3_1:%.]] = getelementptr inbounds i32, i32 addrspace(1) [[B]], i64 [[INDVARS_IV_NEXT]]
	; AVX1-NEXT: [[TMP20:%.]] = load i32, i32 addrspace(1) [[ARRAYIDX3_1]], align 4			; AVX1-NEXT: [[TMP20:%.]] = load i32, i32 addrspace(1) [[ARRAYIDX3_1]], align 4
	; AVX1-NEXT: [[ADD_1:%.*]] = add nsw i32 [[TMP20]], [[TMP19]]			; AVX1-NEXT: [[ADD_1:%.*]] = add nsw i32 [[TMP20]], [[TMP19]]
	; AVX1-NEXT: [[ARRAYIDX7_1:%.]] = getelementptr inbounds i32, i32 addrspace(1) [[A]], i64 [[INDVARS_IV_NEXT]]			; AVX1-NEXT: [[ARRAYIDX7_1:%.]] = getelementptr inbounds i32, i32 addrspace(1) [[A]], i64 [[INDVARS_IV_NEXT]]
	; AVX1-NEXT: store i32 [[ADD_1]], i32 addrspace(1)* [[ARRAYIDX7_1]], align 4			; AVX1-NEXT: store i32 [[ADD_1]], i32 addrspace(1)* [[ARRAYIDX7_1]], align 4
	; AVX1-NEXT: br label [[FOR_INC_1]]			; AVX1-NEXT: br label [[FOR_INC_1]]
	; AVX1: for.inc.1:			; AVX1: for.inc.1:
	; AVX1-NEXT: [[INDVARS_IV_NEXT_1]] = add nuw nsw i64 [[INDVARS_IV]], 2			; AVX1-NEXT: [[INDVARS_IV_NEXT_1]] = add nuw nsw i64 [[INDVARS_IV]], 2
	; AVX1-NEXT: [[EXITCOND_1:%.*]] = icmp eq i64 [[INDVARS_IV_NEXT_1]], 10000			; AVX1-NEXT: [[EXITCOND_1:%.*]] = icmp eq i64 [[INDVARS_IV]], 9998
	; AVX1-NEXT: br i1 [[EXITCOND_1]], label [[FOR_END]], label [[FOR_BODY]], !llvm.loop !20			; AVX1-NEXT: br i1 [[EXITCOND_1]], label [[FOR_END]], label [[FOR_BODY]], !llvm.loop !20
	;			;
	; AVX2-LABEL: @foo1_addrspace1(			; AVX2-LABEL: @foo1_addrspace1(
	; AVX2-NEXT: entry:			; AVX2-NEXT: entry:
	; AVX2-NEXT: [[SCEVGEP:%.]] = getelementptr i32, i32 addrspace(1) [[A:%.*]], i64 10000			; AVX2-NEXT: [[SCEVGEP:%.]] = getelementptr i32, i32 addrspace(1) [[A:%.*]], i64 10000
	; AVX2-NEXT: [[SCEVGEP11:%.]] = getelementptr i32, i32 addrspace(1) [[TRIGGER:%.*]], i64 10000			; AVX2-NEXT: [[SCEVGEP11:%.]] = getelementptr i32, i32 addrspace(1) [[TRIGGER:%.*]], i64 10000
	; AVX2-NEXT: [[SCEVGEP14:%.]] = getelementptr i32, i32 addrspace(1) [[B:%.*]], i64 10000			; AVX2-NEXT: [[SCEVGEP14:%.]] = getelementptr i32, i32 addrspace(1) [[B:%.*]], i64 10000
	; AVX2-NEXT: [[BOUND0:%.]] = icmp ugt i32 addrspace(1) [[SCEVGEP11]], [[A]]			; AVX2-NEXT: [[BOUND0:%.]] = icmp ugt i32 addrspace(1) [[SCEVGEP11]], [[A]]
	▲ Show 20 Lines • Show All 91 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: call void @llvm.masked.store.v8i32.p1v8i32(<8 x i32> [[TMP53]], <8 x i32> addrspace(1)* [[TMP59]], i32 4, <8 x i1> [[TMP41]]), !alias.scope !16, !noalias !18			; AVX2-NEXT: call void @llvm.masked.store.v8i32.p1v8i32(<8 x i32> [[TMP53]], <8 x i32> addrspace(1)* [[TMP59]], i32 4, <8 x i1> [[TMP41]]), !alias.scope !16, !noalias !18
	; AVX2-NEXT: [[TMP60:%.]] = getelementptr inbounds i32, i32 addrspace(1) [[TMP56]], i64 16			; AVX2-NEXT: [[TMP60:%.]] = getelementptr inbounds i32, i32 addrspace(1) [[TMP56]], i64 16
	; AVX2-NEXT: [[TMP61:%.]] = bitcast i32 addrspace(1) [[TMP60]] to <8 x i32> addrspace(1)*			; AVX2-NEXT: [[TMP61:%.]] = bitcast i32 addrspace(1) [[TMP60]] to <8 x i32> addrspace(1)*
	; AVX2-NEXT: call void @llvm.masked.store.v8i32.p1v8i32(<8 x i32> [[TMP54]], <8 x i32> addrspace(1)* [[TMP61]], i32 4, <8 x i1> [[TMP42]]), !alias.scope !16, !noalias !18			; AVX2-NEXT: call void @llvm.masked.store.v8i32.p1v8i32(<8 x i32> [[TMP54]], <8 x i32> addrspace(1)* [[TMP61]], i32 4, <8 x i1> [[TMP42]]), !alias.scope !16, !noalias !18
	; AVX2-NEXT: [[TMP62:%.]] = getelementptr inbounds i32, i32 addrspace(1) [[TMP56]], i64 24			; AVX2-NEXT: [[TMP62:%.]] = getelementptr inbounds i32, i32 addrspace(1) [[TMP56]], i64 24
	; AVX2-NEXT: [[TMP63:%.]] = bitcast i32 addrspace(1) [[TMP62]] to <8 x i32> addrspace(1)*			; AVX2-NEXT: [[TMP63:%.]] = bitcast i32 addrspace(1) [[TMP62]] to <8 x i32> addrspace(1)*
	; AVX2-NEXT: call void @llvm.masked.store.v8i32.p1v8i32(<8 x i32> [[TMP55]], <8 x i32> addrspace(1)* [[TMP63]], i32 4, <8 x i1> [[TMP43]]), !alias.scope !16, !noalias !18			; AVX2-NEXT: call void @llvm.masked.store.v8i32.p1v8i32(<8 x i32> [[TMP55]], <8 x i32> addrspace(1)* [[TMP63]], i32 4, <8 x i1> [[TMP43]]), !alias.scope !16, !noalias !18
	; AVX2-NEXT: [[INDEX_NEXT_1]] = add nuw nsw i64 [[INDEX]], 64			; AVX2-NEXT: [[INDEX_NEXT_1]] = add nuw nsw i64 [[INDEX]], 64
	; AVX2-NEXT: [[TMP64:%.*]] = icmp eq i64 [[INDEX_NEXT_1]], 9984			; AVX2-NEXT: [[TMP64:%.*]] = icmp eq i64 [[INDEX]], 9920
	; AVX2-NEXT: br i1 [[TMP64]], label [[FOR_BODY_PREHEADER]], label [[VECTOR_BODY]], !llvm.loop !19			; AVX2-NEXT: br i1 [[TMP64]], label [[FOR_BODY_PREHEADER]], label [[VECTOR_BODY]], !llvm.loop !19
	; AVX2: for.body.preheader:			; AVX2: for.body.preheader:
	; AVX2-NEXT: [[INDVARS_IV_PH:%.*]] = phi i64 [ 0, [[ENTRY]] ], [ 9984, [[VECTOR_BODY]] ]			; AVX2-NEXT: [[INDVARS_IV_PH:%.*]] = phi i64 [ 0, [[ENTRY]] ], [ 9984, [[VECTOR_BODY]] ]
	; AVX2-NEXT: br label [[FOR_BODY:%.*]]			; AVX2-NEXT: br label [[FOR_BODY:%.*]]
	; AVX2: for.body:			; AVX2: for.body:
	; AVX2-NEXT: [[INDVARS_IV:%.]] = phi i64 [ [[INDVARS_IV_PH]], [[FOR_BODY_PREHEADER]] ], [ [[INDVARS_IV_NEXT_3:%.]], [[FOR_INC_3:%.*]] ]			; AVX2-NEXT: [[INDVARS_IV:%.]] = phi i64 [ [[INDVARS_IV_PH]], [[FOR_BODY_PREHEADER]] ], [ [[INDVARS_IV_NEXT_3:%.]], [[FOR_INC_3:%.*]] ]
	; AVX2-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds i32, i32 addrspace(1) [[TRIGGER]], i64 [[INDVARS_IV]]			; AVX2-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds i32, i32 addrspace(1) [[TRIGGER]], i64 [[INDVARS_IV]]
	; AVX2-NEXT: [[TMP65:%.]] = load i32, i32 addrspace(1) [[ARRAYIDX]], align 4			; AVX2-NEXT: [[TMP65:%.]] = load i32, i32 addrspace(1) [[ARRAYIDX]], align 4
	▲ Show 20 Lines • Show All 44 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: [[ARRAYIDX3_3:%.]] = getelementptr inbounds i32, i32 addrspace(1) [[B]], i64 [[INDVARS_IV_NEXT_2]]			; AVX2-NEXT: [[ARRAYIDX3_3:%.]] = getelementptr inbounds i32, i32 addrspace(1) [[B]], i64 [[INDVARS_IV_NEXT_2]]
	; AVX2-NEXT: [[TMP72:%.]] = load i32, i32 addrspace(1) [[ARRAYIDX3_3]], align 4			; AVX2-NEXT: [[TMP72:%.]] = load i32, i32 addrspace(1) [[ARRAYIDX3_3]], align 4
	; AVX2-NEXT: [[ADD_3:%.*]] = add nsw i32 [[TMP72]], [[TMP71]]			; AVX2-NEXT: [[ADD_3:%.*]] = add nsw i32 [[TMP72]], [[TMP71]]
	; AVX2-NEXT: [[ARRAYIDX7_3:%.]] = getelementptr inbounds i32, i32 addrspace(1) [[A]], i64 [[INDVARS_IV_NEXT_2]]			; AVX2-NEXT: [[ARRAYIDX7_3:%.]] = getelementptr inbounds i32, i32 addrspace(1) [[A]], i64 [[INDVARS_IV_NEXT_2]]
	; AVX2-NEXT: store i32 [[ADD_3]], i32 addrspace(1)* [[ARRAYIDX7_3]], align 4			; AVX2-NEXT: store i32 [[ADD_3]], i32 addrspace(1)* [[ARRAYIDX7_3]], align 4
	; AVX2-NEXT: br label [[FOR_INC_3]]			; AVX2-NEXT: br label [[FOR_INC_3]]
	; AVX2: for.inc.3:			; AVX2: for.inc.3:
	; AVX2-NEXT: [[INDVARS_IV_NEXT_3]] = add nuw nsw i64 [[INDVARS_IV]], 4			; AVX2-NEXT: [[INDVARS_IV_NEXT_3]] = add nuw nsw i64 [[INDVARS_IV]], 4
	; AVX2-NEXT: [[EXITCOND_3:%.*]] = icmp eq i64 [[INDVARS_IV_NEXT_3]], 10000			; AVX2-NEXT: [[EXITCOND_3:%.*]] = icmp eq i64 [[INDVARS_IV]], 9996
	; AVX2-NEXT: br i1 [[EXITCOND_3]], label [[FOR_END:%.*]], label [[FOR_BODY]], !llvm.loop !20			; AVX2-NEXT: br i1 [[EXITCOND_3]], label [[FOR_END:%.*]], label [[FOR_BODY]], !llvm.loop !20
	;			;
	; AVX512-LABEL: @foo1_addrspace1(			; AVX512-LABEL: @foo1_addrspace1(
	; AVX512-NEXT: entry:			; AVX512-NEXT: entry:
	; AVX512-NEXT: [[SCEVGEP:%.]] = getelementptr i32, i32 addrspace(1) [[A:%.*]], i64 10000			; AVX512-NEXT: [[SCEVGEP:%.]] = getelementptr i32, i32 addrspace(1) [[A:%.*]], i64 10000
	; AVX512-NEXT: [[SCEVGEP11:%.]] = getelementptr i32, i32 addrspace(1) [[TRIGGER:%.*]], i64 10000			; AVX512-NEXT: [[SCEVGEP11:%.]] = getelementptr i32, i32 addrspace(1) [[TRIGGER:%.*]], i64 10000
	; AVX512-NEXT: [[SCEVGEP14:%.]] = getelementptr i32, i32 addrspace(1) [[B:%.*]], i64 10000			; AVX512-NEXT: [[SCEVGEP14:%.]] = getelementptr i32, i32 addrspace(1) [[B:%.*]], i64 10000
	; AVX512-NEXT: [[BOUND0:%.]] = icmp ugt i32 addrspace(1) [[SCEVGEP11]], [[A]]			; AVX512-NEXT: [[BOUND0:%.]] = icmp ugt i32 addrspace(1) [[SCEVGEP11]], [[A]]
	▲ Show 20 Lines • Show All 91 Lines • ▼ Show 20 Lines
	; AVX512-NEXT: call void @llvm.masked.store.v16i32.p1v16i32(<16 x i32> [[TMP53]], <16 x i32> addrspace(1)* [[TMP59]], i32 4, <16 x i1> [[TMP41]]), !alias.scope !16, !noalias !18			; AVX512-NEXT: call void @llvm.masked.store.v16i32.p1v16i32(<16 x i32> [[TMP53]], <16 x i32> addrspace(1)* [[TMP59]], i32 4, <16 x i1> [[TMP41]]), !alias.scope !16, !noalias !18
	; AVX512-NEXT: [[TMP60:%.]] = getelementptr inbounds i32, i32 addrspace(1) [[TMP56]], i64 32			; AVX512-NEXT: [[TMP60:%.]] = getelementptr inbounds i32, i32 addrspace(1) [[TMP56]], i64 32
	; AVX512-NEXT: [[TMP61:%.]] = bitcast i32 addrspace(1) [[TMP60]] to <16 x i32> addrspace(1)*			; AVX512-NEXT: [[TMP61:%.]] = bitcast i32 addrspace(1) [[TMP60]] to <16 x i32> addrspace(1)*
	; AVX512-NEXT: call void @llvm.masked.store.v16i32.p1v16i32(<16 x i32> [[TMP54]], <16 x i32> addrspace(1)* [[TMP61]], i32 4, <16 x i1> [[TMP42]]), !alias.scope !16, !noalias !18			; AVX512-NEXT: call void @llvm.masked.store.v16i32.p1v16i32(<16 x i32> [[TMP54]], <16 x i32> addrspace(1)* [[TMP61]], i32 4, <16 x i1> [[TMP42]]), !alias.scope !16, !noalias !18
	; AVX512-NEXT: [[TMP62:%.]] = getelementptr inbounds i32, i32 addrspace(1) [[TMP56]], i64 48			; AVX512-NEXT: [[TMP62:%.]] = getelementptr inbounds i32, i32 addrspace(1) [[TMP56]], i64 48
	; AVX512-NEXT: [[TMP63:%.]] = bitcast i32 addrspace(1) [[TMP62]] to <16 x i32> addrspace(1)*			; AVX512-NEXT: [[TMP63:%.]] = bitcast i32 addrspace(1) [[TMP62]] to <16 x i32> addrspace(1)*
	; AVX512-NEXT: call void @llvm.masked.store.v16i32.p1v16i32(<16 x i32> [[TMP55]], <16 x i32> addrspace(1)* [[TMP63]], i32 4, <16 x i1> [[TMP43]]), !alias.scope !16, !noalias !18			; AVX512-NEXT: call void @llvm.masked.store.v16i32.p1v16i32(<16 x i32> [[TMP55]], <16 x i32> addrspace(1)* [[TMP63]], i32 4, <16 x i1> [[TMP43]]), !alias.scope !16, !noalias !18
	; AVX512-NEXT: [[INDEX_NEXT_1]] = add nuw nsw i64 [[INDEX]], 128			; AVX512-NEXT: [[INDEX_NEXT_1]] = add nuw nsw i64 [[INDEX]], 128
	; AVX512-NEXT: [[TMP64:%.*]] = icmp eq i64 [[INDEX_NEXT_1]], 9984			; AVX512-NEXT: [[TMP64:%.*]] = icmp eq i64 [[INDEX]], 9856
	; AVX512-NEXT: br i1 [[TMP64]], label [[FOR_BODY_PREHEADER]], label [[VECTOR_BODY]], !llvm.loop !19			; AVX512-NEXT: br i1 [[TMP64]], label [[FOR_BODY_PREHEADER]], label [[VECTOR_BODY]], !llvm.loop !19
	; AVX512: for.body.preheader:			; AVX512: for.body.preheader:
	; AVX512-NEXT: [[INDVARS_IV_PH:%.*]] = phi i64 [ 0, [[ENTRY]] ], [ 9984, [[VECTOR_BODY]] ]			; AVX512-NEXT: [[INDVARS_IV_PH:%.*]] = phi i64 [ 0, [[ENTRY]] ], [ 9984, [[VECTOR_BODY]] ]
	; AVX512-NEXT: br label [[FOR_BODY:%.*]]			; AVX512-NEXT: br label [[FOR_BODY:%.*]]
	; AVX512: for.body:			; AVX512: for.body:
	; AVX512-NEXT: [[INDVARS_IV:%.]] = phi i64 [ [[INDVARS_IV_PH]], [[FOR_BODY_PREHEADER]] ], [ [[INDVARS_IV_NEXT_3:%.]], [[FOR_INC_3:%.*]] ]			; AVX512-NEXT: [[INDVARS_IV:%.]] = phi i64 [ [[INDVARS_IV_PH]], [[FOR_BODY_PREHEADER]] ], [ [[INDVARS_IV_NEXT_3:%.]], [[FOR_INC_3:%.*]] ]
	; AVX512-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds i32, i32 addrspace(1) [[TRIGGER]], i64 [[INDVARS_IV]]			; AVX512-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds i32, i32 addrspace(1) [[TRIGGER]], i64 [[INDVARS_IV]]
	; AVX512-NEXT: [[TMP65:%.]] = load i32, i32 addrspace(1) [[ARRAYIDX]], align 4			; AVX512-NEXT: [[TMP65:%.]] = load i32, i32 addrspace(1) [[ARRAYIDX]], align 4
	▲ Show 20 Lines • Show All 44 Lines • ▼ Show 20 Lines
	; AVX512-NEXT: [[ARRAYIDX3_3:%.]] = getelementptr inbounds i32, i32 addrspace(1) [[B]], i64 [[INDVARS_IV_NEXT_2]]			; AVX512-NEXT: [[ARRAYIDX3_3:%.]] = getelementptr inbounds i32, i32 addrspace(1) [[B]], i64 [[INDVARS_IV_NEXT_2]]
	; AVX512-NEXT: [[TMP72:%.]] = load i32, i32 addrspace(1) [[ARRAYIDX3_3]], align 4			; AVX512-NEXT: [[TMP72:%.]] = load i32, i32 addrspace(1) [[ARRAYIDX3_3]], align 4
	; AVX512-NEXT: [[ADD_3:%.*]] = add nsw i32 [[TMP72]], [[TMP71]]			; AVX512-NEXT: [[ADD_3:%.*]] = add nsw i32 [[TMP72]], [[TMP71]]
	; AVX512-NEXT: [[ARRAYIDX7_3:%.]] = getelementptr inbounds i32, i32 addrspace(1) [[A]], i64 [[INDVARS_IV_NEXT_2]]			; AVX512-NEXT: [[ARRAYIDX7_3:%.]] = getelementptr inbounds i32, i32 addrspace(1) [[A]], i64 [[INDVARS_IV_NEXT_2]]
	; AVX512-NEXT: store i32 [[ADD_3]], i32 addrspace(1)* [[ARRAYIDX7_3]], align 4			; AVX512-NEXT: store i32 [[ADD_3]], i32 addrspace(1)* [[ARRAYIDX7_3]], align 4
	; AVX512-NEXT: br label [[FOR_INC_3]]			; AVX512-NEXT: br label [[FOR_INC_3]]
	; AVX512: for.inc.3:			; AVX512: for.inc.3:
	; AVX512-NEXT: [[INDVARS_IV_NEXT_3]] = add nuw nsw i64 [[INDVARS_IV]], 4			; AVX512-NEXT: [[INDVARS_IV_NEXT_3]] = add nuw nsw i64 [[INDVARS_IV]], 4
	; AVX512-NEXT: [[EXITCOND_3:%.*]] = icmp eq i64 [[INDVARS_IV_NEXT_3]], 10000			; AVX512-NEXT: [[EXITCOND_3:%.*]] = icmp eq i64 [[INDVARS_IV]], 9996
	; AVX512-NEXT: br i1 [[EXITCOND_3]], label [[FOR_END:%.*]], label [[FOR_BODY]], !llvm.loop !20			; AVX512-NEXT: br i1 [[EXITCOND_3]], label [[FOR_END:%.*]], label [[FOR_BODY]], !llvm.loop !20
	;			;
	entry:			entry:
	%A.addr = alloca i32 addrspace(1)*, align 8			%A.addr = alloca i32 addrspace(1)*, align 8
	%B.addr = alloca i32 addrspace(1)*, align 8			%B.addr = alloca i32 addrspace(1)*, align 8
	%trigger.addr = alloca i32 addrspace(1)*, align 8			%trigger.addr = alloca i32 addrspace(1)*, align 8
	%i = alloca i32, align 4			%i = alloca i32, align 4
	store i32 addrspace(1)* %A, i32 addrspace(1)** %A.addr, align 8			store i32 addrspace(1)* %A, i32 addrspace(1)** %A.addr, align 8
	▲ Show 20 Lines • Show All 122 Lines • ▼ Show 20 Lines
	; AVX1-NEXT: call void @llvm.masked.store.v8f32.p0v8f32(<8 x float> [[TMP27]], <8 x float>* [[TMP33]], i32 4, <8 x i1> [[TMP11]]), !alias.scope !26, !noalias !28			; AVX1-NEXT: call void @llvm.masked.store.v8f32.p0v8f32(<8 x float> [[TMP27]], <8 x float>* [[TMP33]], i32 4, <8 x i1> [[TMP11]]), !alias.scope !26, !noalias !28
	; AVX1-NEXT: [[TMP34:%.]] = getelementptr inbounds float, float [[TMP30]], i64 16			; AVX1-NEXT: [[TMP34:%.]] = getelementptr inbounds float, float [[TMP30]], i64 16
	; AVX1-NEXT: [[TMP35:%.]] = bitcast float [[TMP34]] to <8 x float>*			; AVX1-NEXT: [[TMP35:%.]] = bitcast float [[TMP34]] to <8 x float>*
	; AVX1-NEXT: call void @llvm.masked.store.v8f32.p0v8f32(<8 x float> [[TMP28]], <8 x float>* [[TMP35]], i32 4, <8 x i1> [[TMP12]]), !alias.scope !26, !noalias !28			; AVX1-NEXT: call void @llvm.masked.store.v8f32.p0v8f32(<8 x float> [[TMP28]], <8 x float>* [[TMP35]], i32 4, <8 x i1> [[TMP12]]), !alias.scope !26, !noalias !28
	; AVX1-NEXT: [[TMP36:%.]] = getelementptr inbounds float, float [[TMP30]], i64 24			; AVX1-NEXT: [[TMP36:%.]] = getelementptr inbounds float, float [[TMP30]], i64 24
	; AVX1-NEXT: [[TMP37:%.]] = bitcast float [[TMP36]] to <8 x float>*			; AVX1-NEXT: [[TMP37:%.]] = bitcast float [[TMP36]] to <8 x float>*
	; AVX1-NEXT: call void @llvm.masked.store.v8f32.p0v8f32(<8 x float> [[TMP29]], <8 x float>* [[TMP37]], i32 4, <8 x i1> [[TMP13]]), !alias.scope !26, !noalias !28			; AVX1-NEXT: call void @llvm.masked.store.v8f32.p0v8f32(<8 x float> [[TMP29]], <8 x float>* [[TMP37]], i32 4, <8 x i1> [[TMP13]]), !alias.scope !26, !noalias !28
	; AVX1-NEXT: [[INDEX_NEXT]] = add i64 [[INDEX]], 32			; AVX1-NEXT: [[INDEX_NEXT]] = add i64 [[INDEX]], 32
	; AVX1-NEXT: [[TMP38:%.*]] = icmp eq i64 [[INDEX_NEXT]], 9984			; AVX1-NEXT: [[TMP38:%.*]] = icmp eq i64 [[INDEX]], 9952
	; AVX1-NEXT: br i1 [[TMP38]], label [[FOR_BODY_PREHEADER]], label [[VECTOR_BODY]], !llvm.loop !29			; AVX1-NEXT: br i1 [[TMP38]], label [[FOR_BODY_PREHEADER]], label [[VECTOR_BODY]], !llvm.loop !29
	; AVX1: for.body.preheader:			; AVX1: for.body.preheader:
	; AVX1-NEXT: [[INDVARS_IV_PH:%.*]] = phi i64 [ 0, [[ENTRY]] ], [ 9984, [[VECTOR_BODY]] ]			; AVX1-NEXT: [[INDVARS_IV_PH:%.*]] = phi i64 [ 0, [[ENTRY]] ], [ 9984, [[VECTOR_BODY]] ]
	; AVX1-NEXT: br label [[FOR_BODY:%.*]]			; AVX1-NEXT: br label [[FOR_BODY:%.*]]
	; AVX1: for.body:			; AVX1: for.body:
	; AVX1-NEXT: [[INDVARS_IV:%.]] = phi i64 [ [[INDVARS_IV_PH]], [[FOR_BODY_PREHEADER]] ], [ [[INDVARS_IV_NEXT_1:%.]], [[FOR_INC_1:%.*]] ]			; AVX1-NEXT: [[INDVARS_IV:%.]] = phi i64 [ [[INDVARS_IV_PH]], [[FOR_BODY_PREHEADER]] ], [ [[INDVARS_IV_NEXT_1:%.]], [[FOR_INC_1:%.*]] ]
	; AVX1-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds i32, i32 [[TRIGGER]], i64 [[INDVARS_IV]]			; AVX1-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds i32, i32 [[TRIGGER]], i64 [[INDVARS_IV]]
	; AVX1-NEXT: [[TMP39:%.]] = load i32, i32 [[ARRAYIDX]], align 4			; AVX1-NEXT: [[TMP39:%.]] = load i32, i32 [[ARRAYIDX]], align 4
	Show All 20 Lines
	; AVX1-NEXT: [[TMP42:%.]] = load float, float [[ARRAYIDX3_1]], align 4			; AVX1-NEXT: [[TMP42:%.]] = load float, float [[ARRAYIDX3_1]], align 4
	; AVX1-NEXT: [[CONV_1:%.*]] = sitofp i32 [[TMP41]] to float			; AVX1-NEXT: [[CONV_1:%.*]] = sitofp i32 [[TMP41]] to float
	; AVX1-NEXT: [[ADD_1:%.*]] = fadd float [[TMP42]], [[CONV_1]]			; AVX1-NEXT: [[ADD_1:%.*]] = fadd float [[TMP42]], [[CONV_1]]
	; AVX1-NEXT: [[ARRAYIDX7_1:%.]] = getelementptr inbounds float, float [[A]], i64 [[INDVARS_IV_NEXT]]			; AVX1-NEXT: [[ARRAYIDX7_1:%.]] = getelementptr inbounds float, float [[A]], i64 [[INDVARS_IV_NEXT]]
	; AVX1-NEXT: store float [[ADD_1]], float* [[ARRAYIDX7_1]], align 4			; AVX1-NEXT: store float [[ADD_1]], float* [[ARRAYIDX7_1]], align 4
	; AVX1-NEXT: br label [[FOR_INC_1]]			; AVX1-NEXT: br label [[FOR_INC_1]]
	; AVX1: for.inc.1:			; AVX1: for.inc.1:
	; AVX1-NEXT: [[INDVARS_IV_NEXT_1]] = add nuw nsw i64 [[INDVARS_IV]], 2			; AVX1-NEXT: [[INDVARS_IV_NEXT_1]] = add nuw nsw i64 [[INDVARS_IV]], 2
	; AVX1-NEXT: [[EXITCOND_1:%.*]] = icmp eq i64 [[INDVARS_IV_NEXT_1]], 10000			; AVX1-NEXT: [[EXITCOND_1:%.*]] = icmp eq i64 [[INDVARS_IV]], 9998
	; AVX1-NEXT: br i1 [[EXITCOND_1]], label [[FOR_END:%.*]], label [[FOR_BODY]], !llvm.loop !30			; AVX1-NEXT: br i1 [[EXITCOND_1]], label [[FOR_END:%.*]], label [[FOR_BODY]], !llvm.loop !30
	;			;
	; AVX2-LABEL: @foo2(			; AVX2-LABEL: @foo2(
	; AVX2-NEXT: entry:			; AVX2-NEXT: entry:
	; AVX2-NEXT: [[SCEVGEP:%.]] = getelementptr float, float [[A:%.*]], i64 10000			; AVX2-NEXT: [[SCEVGEP:%.]] = getelementptr float, float [[A:%.*]], i64 10000
	; AVX2-NEXT: [[SCEVGEP11:%.]] = getelementptr i32, i32 [[TRIGGER:%.*]], i64 10000			; AVX2-NEXT: [[SCEVGEP11:%.]] = getelementptr i32, i32 [[TRIGGER:%.*]], i64 10000
	; AVX2-NEXT: [[SCEVGEP14:%.]] = getelementptr float, float [[B:%.*]], i64 10000			; AVX2-NEXT: [[SCEVGEP14:%.]] = getelementptr float, float [[B:%.*]], i64 10000
	; AVX2-NEXT: [[TMP0:%.]] = bitcast i32 [[SCEVGEP11]] to float*			; AVX2-NEXT: [[TMP0:%.]] = bitcast i32 [[SCEVGEP11]] to float*
	▲ Show 20 Lines • Show All 52 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: call void @llvm.masked.store.v8f32.p0v8f32(<8 x float> [[TMP27]], <8 x float>* [[TMP33]], i32 4, <8 x i1> [[TMP11]]), !alias.scope !26, !noalias !28			; AVX2-NEXT: call void @llvm.masked.store.v8f32.p0v8f32(<8 x float> [[TMP27]], <8 x float>* [[TMP33]], i32 4, <8 x i1> [[TMP11]]), !alias.scope !26, !noalias !28
	; AVX2-NEXT: [[TMP34:%.]] = getelementptr inbounds float, float [[TMP30]], i64 16			; AVX2-NEXT: [[TMP34:%.]] = getelementptr inbounds float, float [[TMP30]], i64 16
	; AVX2-NEXT: [[TMP35:%.]] = bitcast float [[TMP34]] to <8 x float>*			; AVX2-NEXT: [[TMP35:%.]] = bitcast float [[TMP34]] to <8 x float>*
	; AVX2-NEXT: call void @llvm.masked.store.v8f32.p0v8f32(<8 x float> [[TMP28]], <8 x float>* [[TMP35]], i32 4, <8 x i1> [[TMP12]]), !alias.scope !26, !noalias !28			; AVX2-NEXT: call void @llvm.masked.store.v8f32.p0v8f32(<8 x float> [[TMP28]], <8 x float>* [[TMP35]], i32 4, <8 x i1> [[TMP12]]), !alias.scope !26, !noalias !28
	; AVX2-NEXT: [[TMP36:%.]] = getelementptr inbounds float, float [[TMP30]], i64 24			; AVX2-NEXT: [[TMP36:%.]] = getelementptr inbounds float, float [[TMP30]], i64 24
	; AVX2-NEXT: [[TMP37:%.]] = bitcast float [[TMP36]] to <8 x float>*			; AVX2-NEXT: [[TMP37:%.]] = bitcast float [[TMP36]] to <8 x float>*
	; AVX2-NEXT: call void @llvm.masked.store.v8f32.p0v8f32(<8 x float> [[TMP29]], <8 x float>* [[TMP37]], i32 4, <8 x i1> [[TMP13]]), !alias.scope !26, !noalias !28			; AVX2-NEXT: call void @llvm.masked.store.v8f32.p0v8f32(<8 x float> [[TMP29]], <8 x float>* [[TMP37]], i32 4, <8 x i1> [[TMP13]]), !alias.scope !26, !noalias !28
	; AVX2-NEXT: [[INDEX_NEXT]] = add i64 [[INDEX]], 32			; AVX2-NEXT: [[INDEX_NEXT]] = add i64 [[INDEX]], 32
	; AVX2-NEXT: [[TMP38:%.*]] = icmp eq i64 [[INDEX_NEXT]], 9984			; AVX2-NEXT: [[TMP38:%.*]] = icmp eq i64 [[INDEX]], 9952
	; AVX2-NEXT: br i1 [[TMP38]], label [[FOR_BODY_PREHEADER]], label [[VECTOR_BODY]], !llvm.loop !29			; AVX2-NEXT: br i1 [[TMP38]], label [[FOR_BODY_PREHEADER]], label [[VECTOR_BODY]], !llvm.loop !29
	; AVX2: for.body.preheader:			; AVX2: for.body.preheader:
	; AVX2-NEXT: [[INDVARS_IV_PH:%.*]] = phi i64 [ 0, [[ENTRY]] ], [ 9984, [[VECTOR_BODY]] ]			; AVX2-NEXT: [[INDVARS_IV_PH:%.*]] = phi i64 [ 0, [[ENTRY]] ], [ 9984, [[VECTOR_BODY]] ]
	; AVX2-NEXT: br label [[FOR_BODY:%.*]]			; AVX2-NEXT: br label [[FOR_BODY:%.*]]
	; AVX2: for.body:			; AVX2: for.body:
	; AVX2-NEXT: [[INDVARS_IV:%.]] = phi i64 [ [[INDVARS_IV_PH]], [[FOR_BODY_PREHEADER]] ], [ [[INDVARS_IV_NEXT_3:%.]], [[FOR_INC_3:%.*]] ]			; AVX2-NEXT: [[INDVARS_IV:%.]] = phi i64 [ [[INDVARS_IV_PH]], [[FOR_BODY_PREHEADER]] ], [ [[INDVARS_IV_NEXT_3:%.]], [[FOR_INC_3:%.*]] ]
	; AVX2-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds i32, i32 [[TRIGGER]], i64 [[INDVARS_IV]]			; AVX2-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds i32, i32 [[TRIGGER]], i64 [[INDVARS_IV]]
	; AVX2-NEXT: [[TMP39:%.]] = load i32, i32 [[ARRAYIDX]], align 4			; AVX2-NEXT: [[TMP39:%.]] = load i32, i32 [[ARRAYIDX]], align 4
	▲ Show 20 Lines • Show All 48 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: [[TMP46:%.]] = load float, float [[ARRAYIDX3_3]], align 4			; AVX2-NEXT: [[TMP46:%.]] = load float, float [[ARRAYIDX3_3]], align 4
	; AVX2-NEXT: [[CONV_3:%.*]] = sitofp i32 [[TMP45]] to float			; AVX2-NEXT: [[CONV_3:%.*]] = sitofp i32 [[TMP45]] to float
	; AVX2-NEXT: [[ADD_3:%.*]] = fadd float [[TMP46]], [[CONV_3]]			; AVX2-NEXT: [[ADD_3:%.*]] = fadd float [[TMP46]], [[CONV_3]]
	; AVX2-NEXT: [[ARRAYIDX7_3:%.]] = getelementptr inbounds float, float [[A]], i64 [[INDVARS_IV_NEXT_2]]			; AVX2-NEXT: [[ARRAYIDX7_3:%.]] = getelementptr inbounds float, float [[A]], i64 [[INDVARS_IV_NEXT_2]]
	; AVX2-NEXT: store float [[ADD_3]], float* [[ARRAYIDX7_3]], align 4			; AVX2-NEXT: store float [[ADD_3]], float* [[ARRAYIDX7_3]], align 4
	; AVX2-NEXT: br label [[FOR_INC_3]]			; AVX2-NEXT: br label [[FOR_INC_3]]
	; AVX2: for.inc.3:			; AVX2: for.inc.3:
	; AVX2-NEXT: [[INDVARS_IV_NEXT_3]] = add nuw nsw i64 [[INDVARS_IV]], 4			; AVX2-NEXT: [[INDVARS_IV_NEXT_3]] = add nuw nsw i64 [[INDVARS_IV]], 4
	; AVX2-NEXT: [[EXITCOND_3:%.*]] = icmp eq i64 [[INDVARS_IV_NEXT_3]], 10000			; AVX2-NEXT: [[EXITCOND_3:%.*]] = icmp eq i64 [[INDVARS_IV]], 9996
	; AVX2-NEXT: br i1 [[EXITCOND_3]], label [[FOR_END:%.*]], label [[FOR_BODY]], !llvm.loop !30			; AVX2-NEXT: br i1 [[EXITCOND_3]], label [[FOR_END:%.*]], label [[FOR_BODY]], !llvm.loop !30
	;			;
	; AVX512-LABEL: @foo2(			; AVX512-LABEL: @foo2(
	; AVX512-NEXT: entry:			; AVX512-NEXT: entry:
	; AVX512-NEXT: [[SCEVGEP:%.]] = getelementptr float, float [[A:%.*]], i64 10000			; AVX512-NEXT: [[SCEVGEP:%.]] = getelementptr float, float [[A:%.*]], i64 10000
	; AVX512-NEXT: [[SCEVGEP11:%.]] = getelementptr i32, i32 [[TRIGGER:%.*]], i64 10000			; AVX512-NEXT: [[SCEVGEP11:%.]] = getelementptr i32, i32 [[TRIGGER:%.*]], i64 10000
	; AVX512-NEXT: [[SCEVGEP14:%.]] = getelementptr float, float [[B:%.*]], i64 10000			; AVX512-NEXT: [[SCEVGEP14:%.]] = getelementptr float, float [[B:%.*]], i64 10000
	; AVX512-NEXT: [[TMP0:%.]] = bitcast i32 [[SCEVGEP11]] to float*			; AVX512-NEXT: [[TMP0:%.]] = bitcast i32 [[SCEVGEP11]] to float*
	▲ Show 20 Lines • Show All 52 Lines • ▼ Show 20 Lines
	; AVX512-NEXT: call void @llvm.masked.store.v16f32.p0v16f32(<16 x float> [[TMP27]], <16 x float>* [[TMP33]], i32 4, <16 x i1> [[TMP11]]), !alias.scope !26, !noalias !28			; AVX512-NEXT: call void @llvm.masked.store.v16f32.p0v16f32(<16 x float> [[TMP27]], <16 x float>* [[TMP33]], i32 4, <16 x i1> [[TMP11]]), !alias.scope !26, !noalias !28
	; AVX512-NEXT: [[TMP34:%.]] = getelementptr inbounds float, float [[TMP30]], i64 32			; AVX512-NEXT: [[TMP34:%.]] = getelementptr inbounds float, float [[TMP30]], i64 32
	; AVX512-NEXT: [[TMP35:%.]] = bitcast float [[TMP34]] to <16 x float>*			; AVX512-NEXT: [[TMP35:%.]] = bitcast float [[TMP34]] to <16 x float>*
	; AVX512-NEXT: call void @llvm.masked.store.v16f32.p0v16f32(<16 x float> [[TMP28]], <16 x float>* [[TMP35]], i32 4, <16 x i1> [[TMP12]]), !alias.scope !26, !noalias !28			; AVX512-NEXT: call void @llvm.masked.store.v16f32.p0v16f32(<16 x float> [[TMP28]], <16 x float>* [[TMP35]], i32 4, <16 x i1> [[TMP12]]), !alias.scope !26, !noalias !28
	; AVX512-NEXT: [[TMP36:%.]] = getelementptr inbounds float, float [[TMP30]], i64 48			; AVX512-NEXT: [[TMP36:%.]] = getelementptr inbounds float, float [[TMP30]], i64 48
	; AVX512-NEXT: [[TMP37:%.]] = bitcast float [[TMP36]] to <16 x float>*			; AVX512-NEXT: [[TMP37:%.]] = bitcast float [[TMP36]] to <16 x float>*
	; AVX512-NEXT: call void @llvm.masked.store.v16f32.p0v16f32(<16 x float> [[TMP29]], <16 x float>* [[TMP37]], i32 4, <16 x i1> [[TMP13]]), !alias.scope !26, !noalias !28			; AVX512-NEXT: call void @llvm.masked.store.v16f32.p0v16f32(<16 x float> [[TMP29]], <16 x float>* [[TMP37]], i32 4, <16 x i1> [[TMP13]]), !alias.scope !26, !noalias !28
	; AVX512-NEXT: [[INDEX_NEXT]] = add i64 [[INDEX]], 64			; AVX512-NEXT: [[INDEX_NEXT]] = add i64 [[INDEX]], 64
	; AVX512-NEXT: [[TMP38:%.*]] = icmp eq i64 [[INDEX_NEXT]], 9984			; AVX512-NEXT: [[TMP38:%.*]] = icmp eq i64 [[INDEX]], 9920
	; AVX512-NEXT: br i1 [[TMP38]], label [[FOR_BODY_PREHEADER]], label [[VECTOR_BODY]], !llvm.loop !29			; AVX512-NEXT: br i1 [[TMP38]], label [[FOR_BODY_PREHEADER]], label [[VECTOR_BODY]], !llvm.loop !29
	; AVX512: for.body.preheader:			; AVX512: for.body.preheader:
	; AVX512-NEXT: [[INDVARS_IV_PH:%.*]] = phi i64 [ 0, [[ENTRY]] ], [ 9984, [[VECTOR_BODY]] ]			; AVX512-NEXT: [[INDVARS_IV_PH:%.*]] = phi i64 [ 0, [[ENTRY]] ], [ 9984, [[VECTOR_BODY]] ]
	; AVX512-NEXT: br label [[FOR_BODY:%.*]]			; AVX512-NEXT: br label [[FOR_BODY:%.*]]
	; AVX512: for.body:			; AVX512: for.body:
	; AVX512-NEXT: [[INDVARS_IV:%.]] = phi i64 [ [[INDVARS_IV_PH]], [[FOR_BODY_PREHEADER]] ], [ [[INDVARS_IV_NEXT_3:%.]], [[FOR_INC_3:%.*]] ]			; AVX512-NEXT: [[INDVARS_IV:%.]] = phi i64 [ [[INDVARS_IV_PH]], [[FOR_BODY_PREHEADER]] ], [ [[INDVARS_IV_NEXT_3:%.]], [[FOR_INC_3:%.*]] ]
	; AVX512-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds i32, i32 [[TRIGGER]], i64 [[INDVARS_IV]]			; AVX512-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds i32, i32 [[TRIGGER]], i64 [[INDVARS_IV]]
	; AVX512-NEXT: [[TMP39:%.]] = load i32, i32 [[ARRAYIDX]], align 4			; AVX512-NEXT: [[TMP39:%.]] = load i32, i32 [[ARRAYIDX]], align 4
	▲ Show 20 Lines • Show All 48 Lines • ▼ Show 20 Lines
	; AVX512-NEXT: [[TMP46:%.]] = load float, float [[ARRAYIDX3_3]], align 4			; AVX512-NEXT: [[TMP46:%.]] = load float, float [[ARRAYIDX3_3]], align 4
	; AVX512-NEXT: [[CONV_3:%.*]] = sitofp i32 [[TMP45]] to float			; AVX512-NEXT: [[CONV_3:%.*]] = sitofp i32 [[TMP45]] to float
	; AVX512-NEXT: [[ADD_3:%.*]] = fadd float [[TMP46]], [[CONV_3]]			; AVX512-NEXT: [[ADD_3:%.*]] = fadd float [[TMP46]], [[CONV_3]]
	; AVX512-NEXT: [[ARRAYIDX7_3:%.]] = getelementptr inbounds float, float [[A]], i64 [[INDVARS_IV_NEXT_2]]			; AVX512-NEXT: [[ARRAYIDX7_3:%.]] = getelementptr inbounds float, float [[A]], i64 [[INDVARS_IV_NEXT_2]]
	; AVX512-NEXT: store float [[ADD_3]], float* [[ARRAYIDX7_3]], align 4			; AVX512-NEXT: store float [[ADD_3]], float* [[ARRAYIDX7_3]], align 4
	; AVX512-NEXT: br label [[FOR_INC_3]]			; AVX512-NEXT: br label [[FOR_INC_3]]
	; AVX512: for.inc.3:			; AVX512: for.inc.3:
	; AVX512-NEXT: [[INDVARS_IV_NEXT_3]] = add nuw nsw i64 [[INDVARS_IV]], 4			; AVX512-NEXT: [[INDVARS_IV_NEXT_3]] = add nuw nsw i64 [[INDVARS_IV]], 4
	; AVX512-NEXT: [[EXITCOND_3:%.*]] = icmp eq i64 [[INDVARS_IV_NEXT_3]], 10000			; AVX512-NEXT: [[EXITCOND_3:%.*]] = icmp eq i64 [[INDVARS_IV]], 9996
	; AVX512-NEXT: br i1 [[EXITCOND_3]], label [[FOR_END:%.*]], label [[FOR_BODY]], !llvm.loop !30			; AVX512-NEXT: br i1 [[EXITCOND_3]], label [[FOR_END:%.*]], label [[FOR_BODY]], !llvm.loop !30
	;			;
	entry:			entry:
	%A.addr = alloca float*, align 8			%A.addr = alloca float*, align 8
	%B.addr = alloca float*, align 8			%B.addr = alloca float*, align 8
	%trigger.addr = alloca i32*, align 8			%trigger.addr = alloca i32*, align 8
	%i = alloca i32, align 4			%i = alloca i32, align 4
	store float* %A, float** %A.addr, align 8			store float* %A, float** %A.addr, align 8
	▲ Show 20 Lines • Show All 123 Lines • ▼ Show 20 Lines
	; AVX1-NEXT: call void @llvm.masked.store.v4f64.p0v4f64(<4 x double> [[TMP27]], <4 x double>* [[TMP33]], i32 8, <4 x i1> [[TMP11]]), !alias.scope !36, !noalias !38			; AVX1-NEXT: call void @llvm.masked.store.v4f64.p0v4f64(<4 x double> [[TMP27]], <4 x double>* [[TMP33]], i32 8, <4 x i1> [[TMP11]]), !alias.scope !36, !noalias !38
	; AVX1-NEXT: [[TMP34:%.]] = getelementptr inbounds double, double [[TMP30]], i64 8			; AVX1-NEXT: [[TMP34:%.]] = getelementptr inbounds double, double [[TMP30]], i64 8
	; AVX1-NEXT: [[TMP35:%.]] = bitcast double [[TMP34]] to <4 x double>*			; AVX1-NEXT: [[TMP35:%.]] = bitcast double [[TMP34]] to <4 x double>*
	; AVX1-NEXT: call void @llvm.masked.store.v4f64.p0v4f64(<4 x double> [[TMP28]], <4 x double>* [[TMP35]], i32 8, <4 x i1> [[TMP12]]), !alias.scope !36, !noalias !38			; AVX1-NEXT: call void @llvm.masked.store.v4f64.p0v4f64(<4 x double> [[TMP28]], <4 x double>* [[TMP35]], i32 8, <4 x i1> [[TMP12]]), !alias.scope !36, !noalias !38
	; AVX1-NEXT: [[TMP36:%.]] = getelementptr inbounds double, double [[TMP30]], i64 12			; AVX1-NEXT: [[TMP36:%.]] = getelementptr inbounds double, double [[TMP30]], i64 12
	; AVX1-NEXT: [[TMP37:%.]] = bitcast double [[TMP36]] to <4 x double>*			; AVX1-NEXT: [[TMP37:%.]] = bitcast double [[TMP36]] to <4 x double>*
	; AVX1-NEXT: call void @llvm.masked.store.v4f64.p0v4f64(<4 x double> [[TMP29]], <4 x double>* [[TMP37]], i32 8, <4 x i1> [[TMP13]]), !alias.scope !36, !noalias !38			; AVX1-NEXT: call void @llvm.masked.store.v4f64.p0v4f64(<4 x double> [[TMP29]], <4 x double>* [[TMP37]], i32 8, <4 x i1> [[TMP13]]), !alias.scope !36, !noalias !38
	; AVX1-NEXT: [[INDEX_NEXT]] = add i64 [[INDEX]], 16			; AVX1-NEXT: [[INDEX_NEXT]] = add i64 [[INDEX]], 16
	; AVX1-NEXT: [[TMP38:%.*]] = icmp eq i64 [[INDEX_NEXT]], 10000			; AVX1-NEXT: [[TMP38:%.*]] = icmp eq i64 [[INDEX]], 9984
	; AVX1-NEXT: br i1 [[TMP38]], label [[FOR_END:%.*]], label [[VECTOR_BODY]], !llvm.loop !39			; AVX1-NEXT: br i1 [[TMP38]], label [[FOR_END:%.*]], label [[VECTOR_BODY]], !llvm.loop !39
	; AVX1: for.body:			; AVX1: for.body:
	; AVX1-NEXT: [[INDVARS_IV:%.]] = phi i64 [ [[INDVARS_IV_NEXT_1:%.]], [[FOR_INC_1:%.*]] ], [ 0, [[ENTRY]] ]			; AVX1-NEXT: [[INDVARS_IV:%.]] = phi i64 [ [[INDVARS_IV_NEXT_1:%.]], [[FOR_INC_1:%.*]] ], [ 0, [[ENTRY]] ]
	; AVX1-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds i32, i32 [[TRIGGER]], i64 [[INDVARS_IV]]			; AVX1-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds i32, i32 [[TRIGGER]], i64 [[INDVARS_IV]]
	; AVX1-NEXT: [[TMP39:%.]] = load i32, i32 [[ARRAYIDX]], align 4			; AVX1-NEXT: [[TMP39:%.]] = load i32, i32 [[ARRAYIDX]], align 4
	; AVX1-NEXT: [[CMP1:%.*]] = icmp slt i32 [[TMP39]], 100			; AVX1-NEXT: [[CMP1:%.*]] = icmp slt i32 [[TMP39]], 100
	; AVX1-NEXT: br i1 [[CMP1]], label [[IF_THEN:%.]], label [[FOR_INC:%.]]			; AVX1-NEXT: br i1 [[CMP1]], label [[IF_THEN:%.]], label [[FOR_INC:%.]]
	; AVX1: if.then:			; AVX1: if.then:
	Show All 17 Lines
	; AVX1-NEXT: [[TMP42:%.]] = load double, double [[ARRAYIDX3_1]], align 8			; AVX1-NEXT: [[TMP42:%.]] = load double, double [[ARRAYIDX3_1]], align 8
	; AVX1-NEXT: [[CONV_1:%.*]] = sitofp i32 [[TMP41]] to double			; AVX1-NEXT: [[CONV_1:%.*]] = sitofp i32 [[TMP41]] to double
	; AVX1-NEXT: [[ADD_1:%.*]] = fadd double [[TMP42]], [[CONV_1]]			; AVX1-NEXT: [[ADD_1:%.*]] = fadd double [[TMP42]], [[CONV_1]]
	; AVX1-NEXT: [[ARRAYIDX7_1:%.]] = getelementptr inbounds double, double [[A]], i64 [[INDVARS_IV_NEXT]]			; AVX1-NEXT: [[ARRAYIDX7_1:%.]] = getelementptr inbounds double, double [[A]], i64 [[INDVARS_IV_NEXT]]
	; AVX1-NEXT: store double [[ADD_1]], double* [[ARRAYIDX7_1]], align 8			; AVX1-NEXT: store double [[ADD_1]], double* [[ARRAYIDX7_1]], align 8
	; AVX1-NEXT: br label [[FOR_INC_1]]			; AVX1-NEXT: br label [[FOR_INC_1]]
	; AVX1: for.inc.1:			; AVX1: for.inc.1:
	; AVX1-NEXT: [[INDVARS_IV_NEXT_1]] = add nuw nsw i64 [[INDVARS_IV]], 2			; AVX1-NEXT: [[INDVARS_IV_NEXT_1]] = add nuw nsw i64 [[INDVARS_IV]], 2
	; AVX1-NEXT: [[EXITCOND_1:%.*]] = icmp eq i64 [[INDVARS_IV_NEXT_1]], 10000			; AVX1-NEXT: [[EXITCOND_1:%.*]] = icmp eq i64 [[INDVARS_IV]], 9998
	; AVX1-NEXT: br i1 [[EXITCOND_1]], label [[FOR_END]], label [[FOR_BODY]], !llvm.loop !40			; AVX1-NEXT: br i1 [[EXITCOND_1]], label [[FOR_END]], label [[FOR_BODY]], !llvm.loop !40
	;			;
	; AVX2-LABEL: @foo3(			; AVX2-LABEL: @foo3(
	; AVX2-NEXT: entry:			; AVX2-NEXT: entry:
	; AVX2-NEXT: [[SCEVGEP:%.]] = getelementptr double, double [[A:%.*]], i64 10000			; AVX2-NEXT: [[SCEVGEP:%.]] = getelementptr double, double [[A:%.*]], i64 10000
	; AVX2-NEXT: [[SCEVGEP11:%.]] = getelementptr i32, i32 [[TRIGGER:%.*]], i64 10000			; AVX2-NEXT: [[SCEVGEP11:%.]] = getelementptr i32, i32 [[TRIGGER:%.*]], i64 10000
	; AVX2-NEXT: [[SCEVGEP14:%.]] = getelementptr double, double [[B:%.*]], i64 10000			; AVX2-NEXT: [[SCEVGEP14:%.]] = getelementptr double, double [[B:%.*]], i64 10000
	; AVX2-NEXT: [[TMP0:%.]] = bitcast i32 [[SCEVGEP11]] to double*			; AVX2-NEXT: [[TMP0:%.]] = bitcast i32 [[SCEVGEP11]] to double*
	▲ Show 20 Lines • Show All 52 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: call void @llvm.masked.store.v4f64.p0v4f64(<4 x double> [[TMP27]], <4 x double>* [[TMP33]], i32 8, <4 x i1> [[TMP11]]), !alias.scope !36, !noalias !38			; AVX2-NEXT: call void @llvm.masked.store.v4f64.p0v4f64(<4 x double> [[TMP27]], <4 x double>* [[TMP33]], i32 8, <4 x i1> [[TMP11]]), !alias.scope !36, !noalias !38
	; AVX2-NEXT: [[TMP34:%.]] = getelementptr inbounds double, double [[TMP30]], i64 8			; AVX2-NEXT: [[TMP34:%.]] = getelementptr inbounds double, double [[TMP30]], i64 8
	; AVX2-NEXT: [[TMP35:%.]] = bitcast double [[TMP34]] to <4 x double>*			; AVX2-NEXT: [[TMP35:%.]] = bitcast double [[TMP34]] to <4 x double>*
	; AVX2-NEXT: call void @llvm.masked.store.v4f64.p0v4f64(<4 x double> [[TMP28]], <4 x double>* [[TMP35]], i32 8, <4 x i1> [[TMP12]]), !alias.scope !36, !noalias !38			; AVX2-NEXT: call void @llvm.masked.store.v4f64.p0v4f64(<4 x double> [[TMP28]], <4 x double>* [[TMP35]], i32 8, <4 x i1> [[TMP12]]), !alias.scope !36, !noalias !38
	; AVX2-NEXT: [[TMP36:%.]] = getelementptr inbounds double, double [[TMP30]], i64 12			; AVX2-NEXT: [[TMP36:%.]] = getelementptr inbounds double, double [[TMP30]], i64 12
	; AVX2-NEXT: [[TMP37:%.]] = bitcast double [[TMP36]] to <4 x double>*			; AVX2-NEXT: [[TMP37:%.]] = bitcast double [[TMP36]] to <4 x double>*
	; AVX2-NEXT: call void @llvm.masked.store.v4f64.p0v4f64(<4 x double> [[TMP29]], <4 x double>* [[TMP37]], i32 8, <4 x i1> [[TMP13]]), !alias.scope !36, !noalias !38			; AVX2-NEXT: call void @llvm.masked.store.v4f64.p0v4f64(<4 x double> [[TMP29]], <4 x double>* [[TMP37]], i32 8, <4 x i1> [[TMP13]]), !alias.scope !36, !noalias !38
	; AVX2-NEXT: [[INDEX_NEXT]] = add i64 [[INDEX]], 16			; AVX2-NEXT: [[INDEX_NEXT]] = add i64 [[INDEX]], 16
	; AVX2-NEXT: [[TMP38:%.*]] = icmp eq i64 [[INDEX_NEXT]], 10000			; AVX2-NEXT: [[TMP38:%.*]] = icmp eq i64 [[INDEX]], 9984
	; AVX2-NEXT: br i1 [[TMP38]], label [[FOR_END:%.*]], label [[VECTOR_BODY]], !llvm.loop !39			; AVX2-NEXT: br i1 [[TMP38]], label [[FOR_END:%.*]], label [[VECTOR_BODY]], !llvm.loop !39
	; AVX2: for.body:			; AVX2: for.body:
	; AVX2-NEXT: [[INDVARS_IV:%.]] = phi i64 [ [[INDVARS_IV_NEXT_3:%.]], [[FOR_INC_3:%.*]] ], [ 0, [[ENTRY]] ]			; AVX2-NEXT: [[INDVARS_IV:%.]] = phi i64 [ [[INDVARS_IV_NEXT_3:%.]], [[FOR_INC_3:%.*]] ], [ 0, [[ENTRY]] ]
	; AVX2-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds i32, i32 [[TRIGGER]], i64 [[INDVARS_IV]]			; AVX2-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds i32, i32 [[TRIGGER]], i64 [[INDVARS_IV]]
	; AVX2-NEXT: [[TMP39:%.]] = load i32, i32 [[ARRAYIDX]], align 4			; AVX2-NEXT: [[TMP39:%.]] = load i32, i32 [[ARRAYIDX]], align 4
	; AVX2-NEXT: [[CMP1:%.*]] = icmp slt i32 [[TMP39]], 100			; AVX2-NEXT: [[CMP1:%.*]] = icmp slt i32 [[TMP39]], 100
	; AVX2-NEXT: br i1 [[CMP1]], label [[IF_THEN:%.]], label [[FOR_INC:%.]]			; AVX2-NEXT: br i1 [[CMP1]], label [[IF_THEN:%.]], label [[FOR_INC:%.]]
	; AVX2: if.then:			; AVX2: if.then:
	▲ Show 20 Lines • Show All 45 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: [[TMP46:%.]] = load double, double [[ARRAYIDX3_3]], align 8			; AVX2-NEXT: [[TMP46:%.]] = load double, double [[ARRAYIDX3_3]], align 8
	; AVX2-NEXT: [[CONV_3:%.*]] = sitofp i32 [[TMP45]] to double			; AVX2-NEXT: [[CONV_3:%.*]] = sitofp i32 [[TMP45]] to double
	; AVX2-NEXT: [[ADD_3:%.*]] = fadd double [[TMP46]], [[CONV_3]]			; AVX2-NEXT: [[ADD_3:%.*]] = fadd double [[TMP46]], [[CONV_3]]
	; AVX2-NEXT: [[ARRAYIDX7_3:%.]] = getelementptr inbounds double, double [[A]], i64 [[INDVARS_IV_NEXT_2]]			; AVX2-NEXT: [[ARRAYIDX7_3:%.]] = getelementptr inbounds double, double [[A]], i64 [[INDVARS_IV_NEXT_2]]
	; AVX2-NEXT: store double [[ADD_3]], double* [[ARRAYIDX7_3]], align 8			; AVX2-NEXT: store double [[ADD_3]], double* [[ARRAYIDX7_3]], align 8
	; AVX2-NEXT: br label [[FOR_INC_3]]			; AVX2-NEXT: br label [[FOR_INC_3]]
	; AVX2: for.inc.3:			; AVX2: for.inc.3:
	; AVX2-NEXT: [[INDVARS_IV_NEXT_3]] = add nuw nsw i64 [[INDVARS_IV]], 4			; AVX2-NEXT: [[INDVARS_IV_NEXT_3]] = add nuw nsw i64 [[INDVARS_IV]], 4
	; AVX2-NEXT: [[EXITCOND_3:%.*]] = icmp eq i64 [[INDVARS_IV_NEXT_3]], 10000			; AVX2-NEXT: [[EXITCOND_3:%.*]] = icmp eq i64 [[INDVARS_IV]], 9996
	; AVX2-NEXT: br i1 [[EXITCOND_3]], label [[FOR_END]], label [[FOR_BODY]], !llvm.loop !40			; AVX2-NEXT: br i1 [[EXITCOND_3]], label [[FOR_END]], label [[FOR_BODY]], !llvm.loop !40
	;			;
	; AVX512-LABEL: @foo3(			; AVX512-LABEL: @foo3(
	; AVX512-NEXT: entry:			; AVX512-NEXT: entry:
	; AVX512-NEXT: [[SCEVGEP:%.]] = getelementptr double, double [[A:%.*]], i64 10000			; AVX512-NEXT: [[SCEVGEP:%.]] = getelementptr double, double [[A:%.*]], i64 10000
	; AVX512-NEXT: [[SCEVGEP11:%.]] = getelementptr i32, i32 [[TRIGGER:%.*]], i64 10000			; AVX512-NEXT: [[SCEVGEP11:%.]] = getelementptr i32, i32 [[TRIGGER:%.*]], i64 10000
	; AVX512-NEXT: [[SCEVGEP14:%.]] = getelementptr double, double [[B:%.*]], i64 10000			; AVX512-NEXT: [[SCEVGEP14:%.]] = getelementptr double, double [[B:%.*]], i64 10000
	; AVX512-NEXT: [[TMP0:%.]] = bitcast i32 [[SCEVGEP11]] to double*			; AVX512-NEXT: [[TMP0:%.]] = bitcast i32 [[SCEVGEP11]] to double*
	▲ Show 20 Lines • Show All 52 Lines • ▼ Show 20 Lines
	; AVX512-NEXT: call void @llvm.masked.store.v8f64.p0v8f64(<8 x double> [[TMP27]], <8 x double>* [[TMP33]], i32 8, <8 x i1> [[TMP11]]), !alias.scope !36, !noalias !38			; AVX512-NEXT: call void @llvm.masked.store.v8f64.p0v8f64(<8 x double> [[TMP27]], <8 x double>* [[TMP33]], i32 8, <8 x i1> [[TMP11]]), !alias.scope !36, !noalias !38
	; AVX512-NEXT: [[TMP34:%.]] = getelementptr inbounds double, double [[TMP30]], i64 16			; AVX512-NEXT: [[TMP34:%.]] = getelementptr inbounds double, double [[TMP30]], i64 16
	; AVX512-NEXT: [[TMP35:%.]] = bitcast double [[TMP34]] to <8 x double>*			; AVX512-NEXT: [[TMP35:%.]] = bitcast double [[TMP34]] to <8 x double>*
	; AVX512-NEXT: call void @llvm.masked.store.v8f64.p0v8f64(<8 x double> [[TMP28]], <8 x double>* [[TMP35]], i32 8, <8 x i1> [[TMP12]]), !alias.scope !36, !noalias !38			; AVX512-NEXT: call void @llvm.masked.store.v8f64.p0v8f64(<8 x double> [[TMP28]], <8 x double>* [[TMP35]], i32 8, <8 x i1> [[TMP12]]), !alias.scope !36, !noalias !38
	; AVX512-NEXT: [[TMP36:%.]] = getelementptr inbounds double, double [[TMP30]], i64 24			; AVX512-NEXT: [[TMP36:%.]] = getelementptr inbounds double, double [[TMP30]], i64 24
	; AVX512-NEXT: [[TMP37:%.]] = bitcast double [[TMP36]] to <8 x double>*			; AVX512-NEXT: [[TMP37:%.]] = bitcast double [[TMP36]] to <8 x double>*
	; AVX512-NEXT: call void @llvm.masked.store.v8f64.p0v8f64(<8 x double> [[TMP29]], <8 x double>* [[TMP37]], i32 8, <8 x i1> [[TMP13]]), !alias.scope !36, !noalias !38			; AVX512-NEXT: call void @llvm.masked.store.v8f64.p0v8f64(<8 x double> [[TMP29]], <8 x double>* [[TMP37]], i32 8, <8 x i1> [[TMP13]]), !alias.scope !36, !noalias !38
	; AVX512-NEXT: [[INDEX_NEXT]] = add i64 [[INDEX]], 32			; AVX512-NEXT: [[INDEX_NEXT]] = add i64 [[INDEX]], 32
	; AVX512-NEXT: [[TMP38:%.*]] = icmp eq i64 [[INDEX_NEXT]], 9984			; AVX512-NEXT: [[TMP38:%.*]] = icmp eq i64 [[INDEX]], 9952
	; AVX512-NEXT: br i1 [[TMP38]], label [[FOR_BODY_PREHEADER]], label [[VECTOR_BODY]], !llvm.loop !39			; AVX512-NEXT: br i1 [[TMP38]], label [[FOR_BODY_PREHEADER]], label [[VECTOR_BODY]], !llvm.loop !39
	; AVX512: for.body.preheader:			; AVX512: for.body.preheader:
	; AVX512-NEXT: [[INDVARS_IV_PH:%.*]] = phi i64 [ 0, [[ENTRY]] ], [ 9984, [[VECTOR_BODY]] ]			; AVX512-NEXT: [[INDVARS_IV_PH:%.*]] = phi i64 [ 0, [[ENTRY]] ], [ 9984, [[VECTOR_BODY]] ]
	; AVX512-NEXT: br label [[FOR_BODY:%.*]]			; AVX512-NEXT: br label [[FOR_BODY:%.*]]
	; AVX512: for.body:			; AVX512: for.body:
	; AVX512-NEXT: [[INDVARS_IV:%.]] = phi i64 [ [[INDVARS_IV_PH]], [[FOR_BODY_PREHEADER]] ], [ [[INDVARS_IV_NEXT_3:%.]], [[FOR_INC_3:%.*]] ]			; AVX512-NEXT: [[INDVARS_IV:%.]] = phi i64 [ [[INDVARS_IV_PH]], [[FOR_BODY_PREHEADER]] ], [ [[INDVARS_IV_NEXT_3:%.]], [[FOR_INC_3:%.*]] ]
	; AVX512-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds i32, i32 [[TRIGGER]], i64 [[INDVARS_IV]]			; AVX512-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds i32, i32 [[TRIGGER]], i64 [[INDVARS_IV]]
	; AVX512-NEXT: [[TMP39:%.]] = load i32, i32 [[ARRAYIDX]], align 4			; AVX512-NEXT: [[TMP39:%.]] = load i32, i32 [[ARRAYIDX]], align 4
	▲ Show 20 Lines • Show All 48 Lines • ▼ Show 20 Lines
	; AVX512-NEXT: [[TMP46:%.]] = load double, double [[ARRAYIDX3_3]], align 8			; AVX512-NEXT: [[TMP46:%.]] = load double, double [[ARRAYIDX3_3]], align 8
	; AVX512-NEXT: [[CONV_3:%.*]] = sitofp i32 [[TMP45]] to double			; AVX512-NEXT: [[CONV_3:%.*]] = sitofp i32 [[TMP45]] to double
	; AVX512-NEXT: [[ADD_3:%.*]] = fadd double [[TMP46]], [[CONV_3]]			; AVX512-NEXT: [[ADD_3:%.*]] = fadd double [[TMP46]], [[CONV_3]]
	; AVX512-NEXT: [[ARRAYIDX7_3:%.]] = getelementptr inbounds double, double [[A]], i64 [[INDVARS_IV_NEXT_2]]			; AVX512-NEXT: [[ARRAYIDX7_3:%.]] = getelementptr inbounds double, double [[A]], i64 [[INDVARS_IV_NEXT_2]]
	; AVX512-NEXT: store double [[ADD_3]], double* [[ARRAYIDX7_3]], align 8			; AVX512-NEXT: store double [[ADD_3]], double* [[ARRAYIDX7_3]], align 8
	; AVX512-NEXT: br label [[FOR_INC_3]]			; AVX512-NEXT: br label [[FOR_INC_3]]
	; AVX512: for.inc.3:			; AVX512: for.inc.3:
	; AVX512-NEXT: [[INDVARS_IV_NEXT_3]] = add nuw nsw i64 [[INDVARS_IV]], 4			; AVX512-NEXT: [[INDVARS_IV_NEXT_3]] = add nuw nsw i64 [[INDVARS_IV]], 4
	; AVX512-NEXT: [[EXITCOND_3:%.*]] = icmp eq i64 [[INDVARS_IV_NEXT_3]], 10000			; AVX512-NEXT: [[EXITCOND_3:%.*]] = icmp eq i64 [[INDVARS_IV]], 9996
	; AVX512-NEXT: br i1 [[EXITCOND_3]], label [[FOR_END:%.*]], label [[FOR_BODY]], !llvm.loop !40			; AVX512-NEXT: br i1 [[EXITCOND_3]], label [[FOR_END:%.*]], label [[FOR_BODY]], !llvm.loop !40
	;			;
	entry:			entry:
	%A.addr = alloca double*, align 8			%A.addr = alloca double*, align 8
	%B.addr = alloca double*, align 8			%B.addr = alloca double*, align 8
	%trigger.addr = alloca i32*, align 8			%trigger.addr = alloca i32*, align 8
	%i = alloca i32, align 4			%i = alloca i32, align 4
	store double* %A, double** %A.addr, align 8			store double* %A, double** %A.addr, align 8
	▲ Show 20 Lines • Show All 174 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: br label [[FOR_INC_3]]			; AVX2-NEXT: br label [[FOR_INC_3]]
	; AVX2: for.inc.3:			; AVX2: for.inc.3:
	; AVX2-NEXT: [[INDVARS_IV_NEXT_3]] = add nuw nsw i64 [[INDVARS_IV]], 64			; AVX2-NEXT: [[INDVARS_IV_NEXT_3]] = add nuw nsw i64 [[INDVARS_IV]], 64
	; AVX2-NEXT: br label [[FOR_BODY]]			; AVX2-NEXT: br label [[FOR_BODY]]
	;			;
	; AVX512-LABEL: @foo4(			; AVX512-LABEL: @foo4(
	; AVX512-NEXT: entry:			; AVX512-NEXT: entry:
	; AVX512-NEXT: [[SCEVGEP:%.]] = getelementptr double, double [[A:%.*]], i64 9985			; AVX512-NEXT: [[SCEVGEP:%.]] = getelementptr double, double [[A:%.*]], i64 9985
	; AVX512-NEXT: [[SCEVGEP12:%.]] = getelementptr i32, i32 [[TRIGGER:%.*]], i64 9985			; AVX512-NEXT: [[SCEVGEP13:%.]] = getelementptr i32, i32 [[TRIGGER:%.*]], i64 9985
	; AVX512-NEXT: [[SCEVGEP15:%.]] = getelementptr double, double [[B:%.*]], i64 19969			; AVX512-NEXT: [[SCEVGEP16:%.]] = getelementptr double, double [[B:%.*]], i64 19969
	; AVX512-NEXT: [[TMP0:%.]] = bitcast i32 [[SCEVGEP12]] to double*			; AVX512-NEXT: [[TMP0:%.]] = bitcast i32 [[SCEVGEP13]] to double*
	; AVX512-NEXT: [[BOUND0:%.]] = icmp ugt double [[TMP0]], [[A]]			; AVX512-NEXT: [[BOUND0:%.]] = icmp ugt double [[TMP0]], [[A]]
	; AVX512-NEXT: [[TMP1:%.]] = bitcast double [[SCEVGEP]] to i32*			; AVX512-NEXT: [[TMP1:%.]] = bitcast double [[SCEVGEP]] to i32*
	; AVX512-NEXT: [[BOUND1:%.]] = icmp ugt i32 [[TMP1]], [[TRIGGER]]			; AVX512-NEXT: [[BOUND1:%.]] = icmp ugt i32 [[TMP1]], [[TRIGGER]]
	; AVX512-NEXT: [[FOUND_CONFLICT:%.*]] = and i1 [[BOUND0]], [[BOUND1]]			; AVX512-NEXT: [[FOUND_CONFLICT:%.*]] = and i1 [[BOUND0]], [[BOUND1]]
	; AVX512-NEXT: [[BOUND017:%.]] = icmp ugt double [[SCEVGEP15]], [[A]]			; AVX512-NEXT: [[BOUND018:%.]] = icmp ugt double [[SCEVGEP16]], [[A]]
	; AVX512-NEXT: [[BOUND118:%.]] = icmp ugt double [[SCEVGEP]], [[B]]			; AVX512-NEXT: [[BOUND119:%.]] = icmp ugt double [[SCEVGEP]], [[B]]
	; AVX512-NEXT: [[FOUND_CONFLICT19:%.*]] = and i1 [[BOUND017]], [[BOUND118]]			; AVX512-NEXT: [[FOUND_CONFLICT20:%.*]] = and i1 [[BOUND018]], [[BOUND119]]
	; AVX512-NEXT: [[CONFLICT_RDX:%.*]] = or i1 [[FOUND_CONFLICT]], [[FOUND_CONFLICT19]]			; AVX512-NEXT: [[CONFLICT_RDX:%.*]] = or i1 [[FOUND_CONFLICT]], [[FOUND_CONFLICT20]]
	; AVX512-NEXT: br i1 [[CONFLICT_RDX]], label [[FOR_BODY_PREHEADER:%.]], label [[VECTOR_BODY:%.]]			; AVX512-NEXT: br i1 [[CONFLICT_RDX]], label [[FOR_BODY_PREHEADER:%.]], label [[VECTOR_BODY:%.]]
	; AVX512: vector.body:			; AVX512: vector.body:
	; AVX512-NEXT: [[INDEX:%.]] = phi i64 [ [[INDEX_NEXT_2:%.]], [[VECTOR_BODY]] ], [ 0, [[ENTRY:%.*]] ]			; AVX512-NEXT: [[INDEX:%.]] = phi i64 [ [[INDEX_NEXT_2:%.]], [[VECTOR_BODY]] ], [ 0, [[ENTRY:%.*]] ]
	; AVX512-NEXT: [[VEC_IND:%.]] = phi <8 x i64> [ [[VEC_IND_NEXT_2:%.]], [[VECTOR_BODY]] ], [ <i64 0, i64 16, i64 32, i64 48, i64 64, i64 80, i64 96, i64 112>, [[ENTRY]] ]			; AVX512-NEXT: [[VEC_IND:%.]] = phi <8 x i64> [ [[VEC_IND_NEXT_2:%.]], [[VECTOR_BODY]] ], [ <i64 0, i64 16, i64 32, i64 48, i64 64, i64 80, i64 96, i64 112>, [[ENTRY]] ]
	; AVX512-NEXT: [[TMP2:%.]] = getelementptr inbounds i32, i32 [[TRIGGER]], <8 x i64> [[VEC_IND]]			; AVX512-NEXT: [[TMP2:%.]] = getelementptr inbounds i32, i32 [[TRIGGER]], <8 x i64> [[VEC_IND]]
	; AVX512-NEXT: [[WIDE_MASKED_GATHER:%.]] = call <8 x i32> @llvm.masked.gather.v8i32.v8p0i32(<8 x i32> [[TMP2]], i32 4, <8 x i1> <i1 true, i1 true, i1 true, i1 true, i1 true, i1 true, i1 true, i1 true>, <8 x i32> undef), !alias.scope !41			; AVX512-NEXT: [[WIDE_MASKED_GATHER:%.]] = call <8 x i32> @llvm.masked.gather.v8i32.v8p0i32(<8 x i32> [[TMP2]], i32 4, <8 x i1> <i1 true, i1 true, i1 true, i1 true, i1 true, i1 true, i1 true, i1 true>, <8 x i32> undef), !alias.scope !41
	; AVX512-NEXT: [[TMP3:%.*]] = icmp slt <8 x i32> [[WIDE_MASKED_GATHER]], <i32 100, i32 100, i32 100, i32 100, i32 100, i32 100, i32 100, i32 100>			; AVX512-NEXT: [[TMP3:%.*]] = icmp slt <8 x i32> [[WIDE_MASKED_GATHER]], <i32 100, i32 100, i32 100, i32 100, i32 100, i32 100, i32 100, i32 100>
	; AVX512-NEXT: [[TMP4:%.*]] = shl nuw nsw <8 x i64> [[VEC_IND]], <i64 1, i64 1, i64 1, i64 1, i64 1, i64 1, i64 1, i64 1>			; AVX512-NEXT: [[TMP4:%.*]] = shl nuw nsw <8 x i64> [[VEC_IND]], <i64 1, i64 1, i64 1, i64 1, i64 1, i64 1, i64 1, i64 1>
	; AVX512-NEXT: [[TMP5:%.]] = getelementptr inbounds double, double [[B]], <8 x i64> [[TMP4]]			; AVX512-NEXT: [[TMP5:%.]] = getelementptr inbounds double, double [[B]], <8 x i64> [[TMP4]]
	; AVX512-NEXT: [[WIDE_MASKED_GATHER20:%.]] = call <8 x double> @llvm.masked.gather.v8f64.v8p0f64(<8 x double> [[TMP5]], i32 8, <8 x i1> [[TMP3]], <8 x double> undef), !alias.scope !44			; AVX512-NEXT: [[WIDE_MASKED_GATHER21:%.]] = call <8 x double> @llvm.masked.gather.v8f64.v8p0f64(<8 x double> [[TMP5]], i32 8, <8 x i1> [[TMP3]], <8 x double> undef), !alias.scope !44
	; AVX512-NEXT: [[TMP6:%.*]] = sitofp <8 x i32> [[WIDE_MASKED_GATHER]] to <8 x double>			; AVX512-NEXT: [[TMP6:%.*]] = sitofp <8 x i32> [[WIDE_MASKED_GATHER]] to <8 x double>
	; AVX512-NEXT: [[TMP7:%.*]] = fadd <8 x double> [[WIDE_MASKED_GATHER20]], [[TMP6]]			; AVX512-NEXT: [[TMP7:%.*]] = fadd <8 x double> [[WIDE_MASKED_GATHER21]], [[TMP6]]
	; AVX512-NEXT: [[TMP8:%.]] = getelementptr inbounds double, double [[A]], <8 x i64> [[VEC_IND]]			; AVX512-NEXT: [[TMP8:%.]] = getelementptr inbounds double, double [[A]], <8 x i64> [[VEC_IND]]
	; AVX512-NEXT: call void @llvm.masked.scatter.v8f64.v8p0f64(<8 x double> [[TMP7]], <8 x double*> [[TMP8]], i32 8, <8 x i1> [[TMP3]]), !alias.scope !46, !noalias !48			; AVX512-NEXT: call void @llvm.masked.scatter.v8f64.v8p0f64(<8 x double> [[TMP7]], <8 x double*> [[TMP8]], i32 8, <8 x i1> [[TMP3]]), !alias.scope !46, !noalias !48
	; AVX512-NEXT: [[VEC_IND_NEXT:%.*]] = add <8 x i64> [[VEC_IND]], <i64 128, i64 128, i64 128, i64 128, i64 128, i64 128, i64 128, i64 128>			; AVX512-NEXT: [[VEC_IND_NEXT:%.*]] = add <8 x i64> [[VEC_IND]], <i64 128, i64 128, i64 128, i64 128, i64 128, i64 128, i64 128, i64 128>
	; AVX512-NEXT: [[TMP9:%.]] = getelementptr inbounds i32, i32 [[TRIGGER]], <8 x i64> [[VEC_IND_NEXT]]			; AVX512-NEXT: [[TMP9:%.]] = getelementptr inbounds i32, i32 [[TRIGGER]], <8 x i64> [[VEC_IND_NEXT]]
	; AVX512-NEXT: [[WIDE_MASKED_GATHER_1:%.]] = call <8 x i32> @llvm.masked.gather.v8i32.v8p0i32(<8 x i32> [[TMP9]], i32 4, <8 x i1> <i1 true, i1 true, i1 true, i1 true, i1 true, i1 true, i1 true, i1 true>, <8 x i32> undef), !alias.scope !41			; AVX512-NEXT: [[WIDE_MASKED_GATHER_1:%.]] = call <8 x i32> @llvm.masked.gather.v8i32.v8p0i32(<8 x i32> [[TMP9]], i32 4, <8 x i1> <i1 true, i1 true, i1 true, i1 true, i1 true, i1 true, i1 true, i1 true>, <8 x i32> undef), !alias.scope !41
	; AVX512-NEXT: [[TMP10:%.*]] = icmp slt <8 x i32> [[WIDE_MASKED_GATHER_1]], <i32 100, i32 100, i32 100, i32 100, i32 100, i32 100, i32 100, i32 100>			; AVX512-NEXT: [[TMP10:%.*]] = icmp slt <8 x i32> [[WIDE_MASKED_GATHER_1]], <i32 100, i32 100, i32 100, i32 100, i32 100, i32 100, i32 100, i32 100>
	; AVX512-NEXT: [[TMP11:%.*]] = shl nuw nsw <8 x i64> [[VEC_IND_NEXT]], <i64 1, i64 1, i64 1, i64 1, i64 1, i64 1, i64 1, i64 1>			; AVX512-NEXT: [[TMP11:%.*]] = shl nuw nsw <8 x i64> [[VEC_IND_NEXT]], <i64 1, i64 1, i64 1, i64 1, i64 1, i64 1, i64 1, i64 1>
	; AVX512-NEXT: [[TMP12:%.]] = getelementptr inbounds double, double [[B]], <8 x i64> [[TMP11]]			; AVX512-NEXT: [[TMP12:%.]] = getelementptr inbounds double, double [[B]], <8 x i64> [[TMP11]]
	; AVX512-NEXT: [[WIDE_MASKED_GATHER20_1:%.]] = call <8 x double> @llvm.masked.gather.v8f64.v8p0f64(<8 x double> [[TMP12]], i32 8, <8 x i1> [[TMP10]], <8 x double> undef), !alias.scope !44			; AVX512-NEXT: [[WIDE_MASKED_GATHER21_1:%.]] = call <8 x double> @llvm.masked.gather.v8f64.v8p0f64(<8 x double> [[TMP12]], i32 8, <8 x i1> [[TMP10]], <8 x double> undef), !alias.scope !44
	; AVX512-NEXT: [[TMP13:%.*]] = sitofp <8 x i32> [[WIDE_MASKED_GATHER_1]] to <8 x double>			; AVX512-NEXT: [[TMP13:%.*]] = sitofp <8 x i32> [[WIDE_MASKED_GATHER_1]] to <8 x double>
	; AVX512-NEXT: [[TMP14:%.*]] = fadd <8 x double> [[WIDE_MASKED_GATHER20_1]], [[TMP13]]			; AVX512-NEXT: [[TMP14:%.*]] = fadd <8 x double> [[WIDE_MASKED_GATHER21_1]], [[TMP13]]
	; AVX512-NEXT: [[TMP15:%.]] = getelementptr inbounds double, double [[A]], <8 x i64> [[VEC_IND_NEXT]]			; AVX512-NEXT: [[TMP15:%.]] = getelementptr inbounds double, double [[A]], <8 x i64> [[VEC_IND_NEXT]]
	; AVX512-NEXT: call void @llvm.masked.scatter.v8f64.v8p0f64(<8 x double> [[TMP14]], <8 x double*> [[TMP15]], i32 8, <8 x i1> [[TMP10]]), !alias.scope !46, !noalias !48			; AVX512-NEXT: call void @llvm.masked.scatter.v8f64.v8p0f64(<8 x double> [[TMP14]], <8 x double*> [[TMP15]], i32 8, <8 x i1> [[TMP10]]), !alias.scope !46, !noalias !48
	; AVX512-NEXT: [[VEC_IND_NEXT_1:%.*]] = add <8 x i64> [[VEC_IND]], <i64 256, i64 256, i64 256, i64 256, i64 256, i64 256, i64 256, i64 256>			; AVX512-NEXT: [[VEC_IND_NEXT_1:%.*]] = add <8 x i64> [[VEC_IND]], <i64 256, i64 256, i64 256, i64 256, i64 256, i64 256, i64 256, i64 256>
	; AVX512-NEXT: [[TMP16:%.]] = getelementptr inbounds i32, i32 [[TRIGGER]], <8 x i64> [[VEC_IND_NEXT_1]]			; AVX512-NEXT: [[TMP16:%.]] = getelementptr inbounds i32, i32 [[TRIGGER]], <8 x i64> [[VEC_IND_NEXT_1]]
	; AVX512-NEXT: [[WIDE_MASKED_GATHER_2:%.]] = call <8 x i32> @llvm.masked.gather.v8i32.v8p0i32(<8 x i32> [[TMP16]], i32 4, <8 x i1> <i1 true, i1 true, i1 true, i1 true, i1 true, i1 true, i1 true, i1 true>, <8 x i32> undef), !alias.scope !41			; AVX512-NEXT: [[WIDE_MASKED_GATHER_2:%.]] = call <8 x i32> @llvm.masked.gather.v8i32.v8p0i32(<8 x i32> [[TMP16]], i32 4, <8 x i1> <i1 true, i1 true, i1 true, i1 true, i1 true, i1 true, i1 true, i1 true>, <8 x i32> undef), !alias.scope !41
	; AVX512-NEXT: [[TMP17:%.*]] = icmp slt <8 x i32> [[WIDE_MASKED_GATHER_2]], <i32 100, i32 100, i32 100, i32 100, i32 100, i32 100, i32 100, i32 100>			; AVX512-NEXT: [[TMP17:%.*]] = icmp slt <8 x i32> [[WIDE_MASKED_GATHER_2]], <i32 100, i32 100, i32 100, i32 100, i32 100, i32 100, i32 100, i32 100>
	; AVX512-NEXT: [[TMP18:%.*]] = shl nuw nsw <8 x i64> [[VEC_IND_NEXT_1]], <i64 1, i64 1, i64 1, i64 1, i64 1, i64 1, i64 1, i64 1>			; AVX512-NEXT: [[TMP18:%.*]] = shl nuw nsw <8 x i64> [[VEC_IND_NEXT_1]], <i64 1, i64 1, i64 1, i64 1, i64 1, i64 1, i64 1, i64 1>
	; AVX512-NEXT: [[TMP19:%.]] = getelementptr inbounds double, double [[B]], <8 x i64> [[TMP18]]			; AVX512-NEXT: [[TMP19:%.]] = getelementptr inbounds double, double [[B]], <8 x i64> [[TMP18]]
	; AVX512-NEXT: [[WIDE_MASKED_GATHER20_2:%.]] = call <8 x double> @llvm.masked.gather.v8f64.v8p0f64(<8 x double> [[TMP19]], i32 8, <8 x i1> [[TMP17]], <8 x double> undef), !alias.scope !44			; AVX512-NEXT: [[WIDE_MASKED_GATHER21_2:%.]] = call <8 x double> @llvm.masked.gather.v8f64.v8p0f64(<8 x double> [[TMP19]], i32 8, <8 x i1> [[TMP17]], <8 x double> undef), !alias.scope !44
	; AVX512-NEXT: [[TMP20:%.*]] = sitofp <8 x i32> [[WIDE_MASKED_GATHER_2]] to <8 x double>			; AVX512-NEXT: [[TMP20:%.*]] = sitofp <8 x i32> [[WIDE_MASKED_GATHER_2]] to <8 x double>
	; AVX512-NEXT: [[TMP21:%.*]] = fadd <8 x double> [[WIDE_MASKED_GATHER20_2]], [[TMP20]]			; AVX512-NEXT: [[TMP21:%.*]] = fadd <8 x double> [[WIDE_MASKED_GATHER21_2]], [[TMP20]]
	; AVX512-NEXT: [[TMP22:%.]] = getelementptr inbounds double, double [[A]], <8 x i64> [[VEC_IND_NEXT_1]]			; AVX512-NEXT: [[TMP22:%.]] = getelementptr inbounds double, double [[A]], <8 x i64> [[VEC_IND_NEXT_1]]
	; AVX512-NEXT: call void @llvm.masked.scatter.v8f64.v8p0f64(<8 x double> [[TMP21]], <8 x double*> [[TMP22]], i32 8, <8 x i1> [[TMP17]]), !alias.scope !46, !noalias !48			; AVX512-NEXT: call void @llvm.masked.scatter.v8f64.v8p0f64(<8 x double> [[TMP21]], <8 x double*> [[TMP22]], i32 8, <8 x i1> [[TMP17]]), !alias.scope !46, !noalias !48
	; AVX512-NEXT: [[INDEX_NEXT_2]] = add nuw nsw i64 [[INDEX]], 24			; AVX512-NEXT: [[INDEX_NEXT_2]] = add nuw nsw i64 [[INDEX]], 24
	; AVX512-NEXT: [[VEC_IND_NEXT_2]] = add <8 x i64> [[VEC_IND]], <i64 384, i64 384, i64 384, i64 384, i64 384, i64 384, i64 384, i64 384>			; AVX512-NEXT: [[VEC_IND_NEXT_2]] = add <8 x i64> [[VEC_IND]], <i64 384, i64 384, i64 384, i64 384, i64 384, i64 384, i64 384, i64 384>
	; AVX512-NEXT: [[TMP23:%.*]] = icmp eq i64 [[INDEX_NEXT_2]], 624			; AVX512-NEXT: [[TMP23:%.*]] = icmp eq i64 [[INDEX]], 600
	; AVX512-NEXT: br i1 [[TMP23]], label [[FOR_BODY_PREHEADER]], label [[VECTOR_BODY]], !llvm.loop !49			; AVX512-NEXT: br i1 [[TMP23]], label [[FOR_BODY_PREHEADER]], label [[VECTOR_BODY]], !llvm.loop !49
	; AVX512: for.body.preheader:			; AVX512: for.body.preheader:
	; AVX512-NEXT: [[INDVARS_IV_PH:%.*]] = phi i64 [ 0, [[ENTRY]] ], [ 9984, [[VECTOR_BODY]] ]			; AVX512-NEXT: [[INDVARS_IV_PH:%.*]] = phi i64 [ 0, [[ENTRY]] ], [ 9984, [[VECTOR_BODY]] ]
	; AVX512-NEXT: [[TMP24:%.*]] = sub nsw i64 9999, [[INDVARS_IV_PH]]			; AVX512-NEXT: [[TMP24:%.*]] = sub nsw i64 9999, [[INDVARS_IV_PH]]
	; AVX512-NEXT: br label [[FOR_BODY_PROL:%.*]]			; AVX512-NEXT: br label [[FOR_BODY_PROL:%.*]]
	; AVX512: for.body.prol:			; AVX512: for.body.prol:
	; AVX512-NEXT: [[INDVARS_IV_PROL:%.]] = phi i64 [ [[INDVARS_IV_NEXT_PROL:%.]], [[FOR_INC_PROL:%.*]] ], [ [[INDVARS_IV_PH]], [[FOR_BODY_PREHEADER]] ]			; AVX512-NEXT: [[INDVARS_IV_PROL:%.]] = phi i64 [ [[INDVARS_IV_NEXT_PROL:%.]], [[FOR_INC_PROL:%.*]] ], [ [[INDVARS_IV_PH]], [[FOR_BODY_PREHEADER]] ]
	; AVX512-NEXT: [[PROL_ITER:%.]] = phi i64 [ [[PROL_ITER_SUB:%.]], [[FOR_INC_PROL]] ], [ 1, [[FOR_BODY_PREHEADER]] ]			; AVX512-NEXT: [[PROL_ITER:%.]] = phi i64 [ [[PROL_ITER_SUB:%.]], [[FOR_INC_PROL]] ], [ 1, [[FOR_BODY_PREHEADER]] ]
	; AVX512-NEXT: [[ARRAYIDX_PROL:%.]] = getelementptr inbounds i32, i32 [[TRIGGER]], i64 [[INDVARS_IV_PROL]]			; AVX512-NEXT: [[ARRAYIDX_PROL:%.]] = getelementptr inbounds i32, i32 [[TRIGGER]], i64 [[INDVARS_IV_PROL]]
	; AVX512-NEXT: [[TMP25:%.]] = load i32, i32 [[ARRAYIDX_PROL]], align 4			; AVX512-NEXT: [[TMP25:%.]] = load i32, i32 [[ARRAYIDX_PROL]], align 4
	; AVX512-NEXT: [[CMP1_PROL:%.*]] = icmp slt i32 [[TMP25]], 100			; AVX512-NEXT: [[CMP1_PROL:%.*]] = icmp slt i32 [[TMP25]], 100
	; AVX512-NEXT: br i1 [[CMP1_PROL]], label [[IF_THEN_PROL:%.*]], label [[FOR_INC_PROL]]			; AVX512-NEXT: br i1 [[CMP1_PROL]], label [[IF_THEN_PROL:%.*]], label [[FOR_INC_PROL]]
	; AVX512: if.then.prol:			; AVX512: if.then.prol:
	; AVX512-NEXT: [[TMP26:%.*]] = shl nuw nsw i64 [[INDVARS_IV_PROL]], 1			; AVX512-NEXT: [[TMP26:%.*]] = shl nuw nsw i64 [[INDVARS_IV_PROL]], 1
	; AVX512-NEXT: [[ARRAYIDX3_PROL:%.]] = getelementptr inbounds double, double [[B]], i64 [[TMP26]]			; AVX512-NEXT: [[ARRAYIDX3_PROL:%.]] = getelementptr inbounds double, double [[B]], i64 [[TMP26]]
	; AVX512-NEXT: [[TMP27:%.]] = load double, double [[ARRAYIDX3_PROL]], align 8			; AVX512-NEXT: [[TMP27:%.]] = load double, double [[ARRAYIDX3_PROL]], align 8
	; AVX512-NEXT: [[CONV_PROL:%.*]] = sitofp i32 [[TMP25]] to double			; AVX512-NEXT: [[CONV_PROL:%.*]] = sitofp i32 [[TMP25]] to double
	; AVX512-NEXT: [[ADD_PROL:%.*]] = fadd double [[TMP27]], [[CONV_PROL]]			; AVX512-NEXT: [[ADD_PROL:%.*]] = fadd double [[TMP27]], [[CONV_PROL]]
	; AVX512-NEXT: [[ARRAYIDX7_PROL:%.]] = getelementptr inbounds double, double [[A]], i64 [[INDVARS_IV_PROL]]			; AVX512-NEXT: [[ARRAYIDX7_PROL:%.]] = getelementptr inbounds double, double [[A]], i64 [[INDVARS_IV_PROL]]
	; AVX512-NEXT: store double [[ADD_PROL]], double* [[ARRAYIDX7_PROL]], align 8			; AVX512-NEXT: store double [[ADD_PROL]], double* [[ARRAYIDX7_PROL]], align 8
	; AVX512-NEXT: br label [[FOR_INC_PROL]]			; AVX512-NEXT: br label [[FOR_INC_PROL]]
	; AVX512: for.inc.prol:			; AVX512: for.inc.prol:
	; AVX512-NEXT: [[INDVARS_IV_NEXT_PROL]] = add nuw nsw i64 [[INDVARS_IV_PROL]], 16			; AVX512-NEXT: [[INDVARS_IV_NEXT_PROL]] = add nuw nsw i64 [[INDVARS_IV_PROL]], 16
	; AVX512-NEXT: [[PROL_ITER_SUB]] = add i64 [[PROL_ITER]], -1			; AVX512-NEXT: [[PROL_ITER_SUB]] = add i64 [[PROL_ITER]], -1
	; AVX512-NEXT: [[PROL_ITER_CMP:%.*]] = icmp eq i64 [[PROL_ITER_SUB]], 0			; AVX512-NEXT: [[PROL_ITER_CMP:%.*]] = icmp eq i64 [[PROL_ITER]], 1
	; AVX512-NEXT: br i1 [[PROL_ITER_CMP]], label [[FOR_BODY_PROL_LOOPEXIT:%.*]], label [[FOR_BODY_PROL]], !llvm.loop !50			; AVX512-NEXT: br i1 [[PROL_ITER_CMP]], label [[FOR_BODY_PROL_LOOPEXIT:%.*]], label [[FOR_BODY_PROL]], !llvm.loop !50
	; AVX512: for.body.prol.loopexit:			; AVX512: for.body.prol.loopexit:
	; AVX512-NEXT: [[DOTMASK:%.*]] = and i64 [[TMP24]], 9984			; AVX512-NEXT: [[DOTMASK:%.*]] = and i64 [[TMP24]], 9984
	; AVX512-NEXT: [[TMP28:%.*]] = icmp eq i64 [[DOTMASK]], 0			; AVX512-NEXT: [[TMP28:%.*]] = icmp eq i64 [[DOTMASK]], 0
	; AVX512-NEXT: br i1 [[TMP28]], label [[FOR_END:%.]], label [[FOR_BODY:%.]]			; AVX512-NEXT: br i1 [[TMP28]], label [[FOR_END:%.]], label [[FOR_BODY:%.]]
	; AVX512: for.body:			; AVX512: for.body:
	; AVX512-NEXT: [[INDVARS_IV:%.]] = phi i64 [ [[INDVARS_IV_NEXT_3:%.]], [[FOR_INC_3:%.*]] ], [ [[INDVARS_IV_NEXT_PROL]], [[FOR_BODY_PROL_LOOPEXIT]] ]			; AVX512-NEXT: [[INDVARS_IV:%.]] = phi i64 [ [[INDVARS_IV_NEXT_3:%.]], [[FOR_INC_3:%.*]] ], [ [[INDVARS_IV_NEXT_PROL]], [[FOR_BODY_PROL_LOOPEXIT]] ]
	; AVX512-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds i32, i32 [[TRIGGER]], i64 [[INDVARS_IV]]			; AVX512-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds i32, i32 [[TRIGGER]], i64 [[INDVARS_IV]]
	▲ Show 20 Lines • Show All 149 Lines • ▼ Show 20 Lines
	; AVX1: for.end:			; AVX1: for.end:
	; AVX1-NEXT: ret void			; AVX1-NEXT: ret void
	; AVX1: if.then.1:			; AVX1: if.then.1:
	; AVX1-NEXT: [[ARRAYIDX7_1:%.]] = getelementptr inbounds i32, i32 [[A]], i64 [[INDVARS_IV_NEXT]]			; AVX1-NEXT: [[ARRAYIDX7_1:%.]] = getelementptr inbounds i32, i32 [[A]], i64 [[INDVARS_IV_NEXT]]
	; AVX1-NEXT: store i32 sdiv (i32 1, i32 zext (i1 icmp eq (i32** getelementptr inbounds ([1 x i32], [1 x i32]* @a, i64 1, i64 0), i32** @c) to i32)), i32* [[ARRAYIDX7_1]], align 4			; AVX1-NEXT: store i32 sdiv (i32 1, i32 zext (i1 icmp eq (i32** getelementptr inbounds ([1 x i32], [1 x i32]* @a, i64 1, i64 0), i32** @c) to i32)), i32* [[ARRAYIDX7_1]], align 4
	; AVX1-NEXT: br label [[FOR_INC_1]]			; AVX1-NEXT: br label [[FOR_INC_1]]
	; AVX1: for.inc.1:			; AVX1: for.inc.1:
	; AVX1-NEXT: [[INDVARS_IV_NEXT_1]] = add nuw nsw i64 [[INDVARS_IV]], 2			; AVX1-NEXT: [[INDVARS_IV_NEXT_1]] = add nuw nsw i64 [[INDVARS_IV]], 2
	; AVX1-NEXT: [[EXITCOND_1:%.*]] = icmp eq i64 [[INDVARS_IV_NEXT_1]], 10000			; AVX1-NEXT: [[EXITCOND_1:%.*]] = icmp eq i64 [[INDVARS_IV]], 9998
	; AVX1-NEXT: br i1 [[EXITCOND_1]], label [[FOR_END:%.*]], label [[FOR_BODY]]			; AVX1-NEXT: br i1 [[EXITCOND_1]], label [[FOR_END:%.*]], label [[FOR_BODY]]
	;			;
	; AVX2-LABEL: @foo5(			; AVX2-LABEL: @foo5(
	; AVX2-NEXT: entry:			; AVX2-NEXT: entry:
	; AVX2-NEXT: br label [[FOR_BODY:%.*]]			; AVX2-NEXT: br label [[FOR_BODY:%.*]]
	; AVX2: for.body:			; AVX2: for.body:
	; AVX2-NEXT: [[INDVARS_IV:%.]] = phi i64 [ 0, [[ENTRY:%.]] ], [ [[INDVARS_IV_NEXT_4:%.]], [[FOR_INC_4:%.]] ]			; AVX2-NEXT: [[INDVARS_IV:%.]] = phi i64 [ 0, [[ENTRY:%.]] ], [ [[INDVARS_IV_NEXT_4:%.]], [[FOR_INC_4:%.]] ]
	; AVX2-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds i32, i32 [[TRIGGER:%.*]], i64 [[INDVARS_IV]]			; AVX2-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds i32, i32 [[TRIGGER:%.*]], i64 [[INDVARS_IV]]
	▲ Show 20 Lines • Show All 43 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: [[CMP1_4:%.*]] = icmp slt i32 [[TMP4]], 100			; AVX2-NEXT: [[CMP1_4:%.*]] = icmp slt i32 [[TMP4]], 100
	; AVX2-NEXT: br i1 [[CMP1_4]], label [[IF_THEN_4:%.*]], label [[FOR_INC_4]]			; AVX2-NEXT: br i1 [[CMP1_4]], label [[IF_THEN_4:%.*]], label [[FOR_INC_4]]
	; AVX2: if.then.4:			; AVX2: if.then.4:
	; AVX2-NEXT: [[ARRAYIDX7_4:%.]] = getelementptr inbounds i32, i32 [[A]], i64 [[INDVARS_IV_NEXT_3]]			; AVX2-NEXT: [[ARRAYIDX7_4:%.]] = getelementptr inbounds i32, i32 [[A]], i64 [[INDVARS_IV_NEXT_3]]
	; AVX2-NEXT: store i32 sdiv (i32 1, i32 zext (i1 icmp eq (i32** getelementptr inbounds ([1 x i32], [1 x i32]* @a, i64 1, i64 0), i32** @c) to i32)), i32* [[ARRAYIDX7_4]], align 4			; AVX2-NEXT: store i32 sdiv (i32 1, i32 zext (i1 icmp eq (i32** getelementptr inbounds ([1 x i32], [1 x i32]* @a, i64 1, i64 0), i32** @c) to i32)), i32* [[ARRAYIDX7_4]], align 4
	; AVX2-NEXT: br label [[FOR_INC_4]]			; AVX2-NEXT: br label [[FOR_INC_4]]
	; AVX2: for.inc.4:			; AVX2: for.inc.4:
	; AVX2-NEXT: [[INDVARS_IV_NEXT_4]] = add nuw nsw i64 [[INDVARS_IV]], 5			; AVX2-NEXT: [[INDVARS_IV_NEXT_4]] = add nuw nsw i64 [[INDVARS_IV]], 5
	; AVX2-NEXT: [[EXITCOND_4:%.*]] = icmp eq i64 [[INDVARS_IV_NEXT_4]], 10000			; AVX2-NEXT: [[EXITCOND_4:%.*]] = icmp eq i64 [[INDVARS_IV]], 9995
	; AVX2-NEXT: br i1 [[EXITCOND_4]], label [[FOR_END:%.*]], label [[FOR_BODY]]			; AVX2-NEXT: br i1 [[EXITCOND_4]], label [[FOR_END:%.*]], label [[FOR_BODY]]
	;			;
	; AVX512-LABEL: @foo5(			; AVX512-LABEL: @foo5(
	; AVX512-NEXT: entry:			; AVX512-NEXT: entry:
	; AVX512-NEXT: br label [[FOR_BODY:%.*]]			; AVX512-NEXT: br label [[FOR_BODY:%.*]]
	; AVX512: for.body:			; AVX512: for.body:
	; AVX512-NEXT: [[INDVARS_IV:%.]] = phi i64 [ 0, [[ENTRY:%.]] ], [ [[INDVARS_IV_NEXT_4:%.]], [[FOR_INC_4:%.]] ]			; AVX512-NEXT: [[INDVARS_IV:%.]] = phi i64 [ 0, [[ENTRY:%.]] ], [ [[INDVARS_IV_NEXT_4:%.]], [[FOR_INC_4:%.]] ]
	; AVX512-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds i32, i32 [[TRIGGER:%.*]], i64 [[INDVARS_IV]]			; AVX512-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds i32, i32 [[TRIGGER:%.*]], i64 [[INDVARS_IV]]
	▲ Show 20 Lines • Show All 43 Lines • ▼ Show 20 Lines
	; AVX512-NEXT: [[CMP1_4:%.*]] = icmp slt i32 [[TMP4]], 100			; AVX512-NEXT: [[CMP1_4:%.*]] = icmp slt i32 [[TMP4]], 100
	; AVX512-NEXT: br i1 [[CMP1_4]], label [[IF_THEN_4:%.*]], label [[FOR_INC_4]]			; AVX512-NEXT: br i1 [[CMP1_4]], label [[IF_THEN_4:%.*]], label [[FOR_INC_4]]
	; AVX512: if.then.4:			; AVX512: if.then.4:
	; AVX512-NEXT: [[ARRAYIDX7_4:%.]] = getelementptr inbounds i32, i32 [[A]], i64 [[INDVARS_IV_NEXT_3]]			; AVX512-NEXT: [[ARRAYIDX7_4:%.]] = getelementptr inbounds i32, i32 [[A]], i64 [[INDVARS_IV_NEXT_3]]
	; AVX512-NEXT: store i32 sdiv (i32 1, i32 zext (i1 icmp eq (i32** getelementptr inbounds ([1 x i32], [1 x i32]* @a, i64 1, i64 0), i32** @c) to i32)), i32* [[ARRAYIDX7_4]], align 4			; AVX512-NEXT: store i32 sdiv (i32 1, i32 zext (i1 icmp eq (i32** getelementptr inbounds ([1 x i32], [1 x i32]* @a, i64 1, i64 0), i32** @c) to i32)), i32* [[ARRAYIDX7_4]], align 4
	; AVX512-NEXT: br label [[FOR_INC_4]]			; AVX512-NEXT: br label [[FOR_INC_4]]
	; AVX512: for.inc.4:			; AVX512: for.inc.4:
	; AVX512-NEXT: [[INDVARS_IV_NEXT_4]] = add nuw nsw i64 [[INDVARS_IV]], 5			; AVX512-NEXT: [[INDVARS_IV_NEXT_4]] = add nuw nsw i64 [[INDVARS_IV]], 5
	; AVX512-NEXT: [[EXITCOND_4:%.*]] = icmp eq i64 [[INDVARS_IV_NEXT_4]], 10000			; AVX512-NEXT: [[EXITCOND_4:%.*]] = icmp eq i64 [[INDVARS_IV]], 9995
	; AVX512-NEXT: br i1 [[EXITCOND_4]], label [[FOR_END:%.*]], label [[FOR_BODY]]			; AVX512-NEXT: br i1 [[EXITCOND_4]], label [[FOR_END:%.*]], label [[FOR_BODY]]
	;			;
	entry:			entry:
	%A.addr = alloca i32*, align 8			%A.addr = alloca i32*, align 8
	%B.addr = alloca i32*, align 8			%B.addr = alloca i32*, align 8
	%trigger.addr = alloca i32*, align 8			%trigger.addr = alloca i32*, align 8
	%i = alloca i32, align 4			%i = alloca i32, align 4
	store i32* %A, i32** %A.addr, align 8			store i32* %A, i32** %A.addr, align 8
	▲ Show 20 Lines • Show All 138 Lines • ▼ Show 20 Lines
	; AVX1-NEXT: [[TMP41:%.]] = getelementptr inbounds double, double [[TMP40]], i64 -3			; AVX1-NEXT: [[TMP41:%.]] = getelementptr inbounds double, double [[TMP40]], i64 -3
	; AVX1-NEXT: [[TMP42:%.]] = bitcast double [[TMP41]] to <4 x double>*			; AVX1-NEXT: [[TMP42:%.]] = bitcast double [[TMP41]] to <4 x double>*
	; AVX1-NEXT: call void @llvm.masked.store.v4f64.p0v4f64(<4 x double> [[TMP32]], <4 x double>* [[TMP42]], i32 8, <4 x i1> [[REVERSE31]]), !alias.scope !46, !noalias !48			; AVX1-NEXT: call void @llvm.masked.store.v4f64.p0v4f64(<4 x double> [[TMP32]], <4 x double>* [[TMP42]], i32 8, <4 x i1> [[REVERSE31]]), !alias.scope !46, !noalias !48
	; AVX1-NEXT: [[TMP43:%.]] = getelementptr inbounds double, double [[TMP34]], i64 -12			; AVX1-NEXT: [[TMP43:%.]] = getelementptr inbounds double, double [[TMP34]], i64 -12
	; AVX1-NEXT: [[TMP44:%.]] = getelementptr inbounds double, double [[TMP43]], i64 -3			; AVX1-NEXT: [[TMP44:%.]] = getelementptr inbounds double, double [[TMP43]], i64 -3
	; AVX1-NEXT: [[TMP45:%.]] = bitcast double [[TMP44]] to <4 x double>*			; AVX1-NEXT: [[TMP45:%.]] = bitcast double [[TMP44]] to <4 x double>*
	; AVX1-NEXT: call void @llvm.masked.store.v4f64.p0v4f64(<4 x double> [[TMP33]], <4 x double>* [[TMP45]], i32 8, <4 x i1> [[REVERSE34]]), !alias.scope !46, !noalias !48			; AVX1-NEXT: call void @llvm.masked.store.v4f64.p0v4f64(<4 x double> [[TMP33]], <4 x double>* [[TMP45]], i32 8, <4 x i1> [[REVERSE34]]), !alias.scope !46, !noalias !48
	; AVX1-NEXT: [[INDEX_NEXT]] = add i64 [[INDEX]], 16			; AVX1-NEXT: [[INDEX_NEXT]] = add i64 [[INDEX]], 16
	; AVX1-NEXT: [[TMP46:%.*]] = icmp eq i64 [[INDEX_NEXT]], 4096			; AVX1-NEXT: [[TMP46:%.*]] = icmp eq i64 [[INDEX]], 4080
	; AVX1-NEXT: br i1 [[TMP46]], label [[FOR_END:%.*]], label [[VECTOR_BODY]], !llvm.loop !49			; AVX1-NEXT: br i1 [[TMP46]], label [[FOR_END:%.*]], label [[VECTOR_BODY]], !llvm.loop !49
	; AVX1: for.body:			; AVX1: for.body:
	; AVX1-NEXT: [[INDVARS_IV:%.]] = phi i64 [ [[INDVARS_IV_NEXT_1:%.]], [[FOR_INC_1:%.*]] ], [ 4095, [[ENTRY]] ]			; AVX1-NEXT: [[INDVARS_IV:%.]] = phi i64 [ [[INDVARS_IV_NEXT_1:%.]], [[FOR_INC_1:%.*]] ], [ 4095, [[ENTRY]] ]
	; AVX1-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds i32, i32 [[TRIGGER]], i64 [[INDVARS_IV]]			; AVX1-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds i32, i32 [[TRIGGER]], i64 [[INDVARS_IV]]
	; AVX1-NEXT: [[TMP47:%.]] = load i32, i32 [[ARRAYIDX]], align 4			; AVX1-NEXT: [[TMP47:%.]] = load i32, i32 [[ARRAYIDX]], align 4
	; AVX1-NEXT: [[CMP1:%.*]] = icmp sgt i32 [[TMP47]], 0			; AVX1-NEXT: [[CMP1:%.*]] = icmp sgt i32 [[TMP47]], 0
	; AVX1-NEXT: br i1 [[CMP1]], label [[IF_THEN:%.]], label [[FOR_INC:%.]]			; AVX1-NEXT: br i1 [[CMP1]], label [[IF_THEN:%.]], label [[FOR_INC:%.]]
	; AVX1: if.then:			; AVX1: if.then:
	Show All 15 Lines
	; AVX1-NEXT: [[ARRAYIDX3_1:%.]] = getelementptr inbounds double, double [[IN]], i64 [[INDVARS_IV_NEXT]]			; AVX1-NEXT: [[ARRAYIDX3_1:%.]] = getelementptr inbounds double, double [[IN]], i64 [[INDVARS_IV_NEXT]]
	; AVX1-NEXT: [[TMP50:%.]] = load double, double [[ARRAYIDX3_1]], align 8			; AVX1-NEXT: [[TMP50:%.]] = load double, double [[ARRAYIDX3_1]], align 8
	; AVX1-NEXT: [[ADD_1:%.*]] = fadd double [[TMP50]], 5.000000e-01			; AVX1-NEXT: [[ADD_1:%.*]] = fadd double [[TMP50]], 5.000000e-01
	; AVX1-NEXT: [[ARRAYIDX5_1:%.]] = getelementptr inbounds double, double [[OUT]], i64 [[INDVARS_IV_NEXT]]			; AVX1-NEXT: [[ARRAYIDX5_1:%.]] = getelementptr inbounds double, double [[OUT]], i64 [[INDVARS_IV_NEXT]]
	; AVX1-NEXT: store double [[ADD_1]], double* [[ARRAYIDX5_1]], align 8			; AVX1-NEXT: store double [[ADD_1]], double* [[ARRAYIDX5_1]], align 8
	; AVX1-NEXT: br label [[FOR_INC_1]]			; AVX1-NEXT: br label [[FOR_INC_1]]
	; AVX1: for.inc.1:			; AVX1: for.inc.1:
	; AVX1-NEXT: [[INDVARS_IV_NEXT_1]] = add nsw i64 [[INDVARS_IV]], -2			; AVX1-NEXT: [[INDVARS_IV_NEXT_1]] = add nsw i64 [[INDVARS_IV]], -2
	; AVX1-NEXT: [[CMP_1:%.*]] = icmp eq i64 [[INDVARS_IV_NEXT]], 0			; AVX1-NEXT: [[CMP_1:%.*]] = icmp eq i64 [[INDVARS_IV]], 1
	; AVX1-NEXT: br i1 [[CMP_1]], label [[FOR_END]], label [[FOR_BODY]], !llvm.loop !50			; AVX1-NEXT: br i1 [[CMP_1]], label [[FOR_END]], label [[FOR_BODY]], !llvm.loop !50
	;			;
	; AVX2-LABEL: @foo6(			; AVX2-LABEL: @foo6(
	; AVX2-NEXT: entry:			; AVX2-NEXT: entry:
	; AVX2-NEXT: [[SCEVGEP:%.]] = getelementptr double, double [[OUT:%.*]], i64 4096			; AVX2-NEXT: [[SCEVGEP:%.]] = getelementptr double, double [[OUT:%.*]], i64 4096
	; AVX2-NEXT: [[SCEVGEP9:%.]] = getelementptr i32, i32 [[TRIGGER:%.*]], i64 4096			; AVX2-NEXT: [[SCEVGEP9:%.]] = getelementptr i32, i32 [[TRIGGER:%.*]], i64 4096
	; AVX2-NEXT: [[SCEVGEP12:%.]] = getelementptr double, double [[IN:%.*]], i64 4096			; AVX2-NEXT: [[SCEVGEP12:%.]] = getelementptr double, double [[IN:%.*]], i64 4096
	; AVX2-NEXT: [[TMP0:%.]] = bitcast i32 [[SCEVGEP9]] to double*			; AVX2-NEXT: [[TMP0:%.]] = bitcast i32 [[SCEVGEP9]] to double*
	▲ Show 20 Lines • Show All 69 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: [[TMP41:%.]] = getelementptr inbounds double, double [[TMP40]], i64 -3			; AVX2-NEXT: [[TMP41:%.]] = getelementptr inbounds double, double [[TMP40]], i64 -3
	; AVX2-NEXT: [[TMP42:%.]] = bitcast double [[TMP41]] to <4 x double>*			; AVX2-NEXT: [[TMP42:%.]] = bitcast double [[TMP41]] to <4 x double>*
	; AVX2-NEXT: call void @llvm.masked.store.v4f64.p0v4f64(<4 x double> [[TMP32]], <4 x double>* [[TMP42]], i32 8, <4 x i1> [[REVERSE31]]), !alias.scope !46, !noalias !48			; AVX2-NEXT: call void @llvm.masked.store.v4f64.p0v4f64(<4 x double> [[TMP32]], <4 x double>* [[TMP42]], i32 8, <4 x i1> [[REVERSE31]]), !alias.scope !46, !noalias !48
	; AVX2-NEXT: [[TMP43:%.]] = getelementptr inbounds double, double [[TMP34]], i64 -12			; AVX2-NEXT: [[TMP43:%.]] = getelementptr inbounds double, double [[TMP34]], i64 -12
	; AVX2-NEXT: [[TMP44:%.]] = getelementptr inbounds double, double [[TMP43]], i64 -3			; AVX2-NEXT: [[TMP44:%.]] = getelementptr inbounds double, double [[TMP43]], i64 -3
	; AVX2-NEXT: [[TMP45:%.]] = bitcast double [[TMP44]] to <4 x double>*			; AVX2-NEXT: [[TMP45:%.]] = bitcast double [[TMP44]] to <4 x double>*
	; AVX2-NEXT: call void @llvm.masked.store.v4f64.p0v4f64(<4 x double> [[TMP33]], <4 x double>* [[TMP45]], i32 8, <4 x i1> [[REVERSE34]]), !alias.scope !46, !noalias !48			; AVX2-NEXT: call void @llvm.masked.store.v4f64.p0v4f64(<4 x double> [[TMP33]], <4 x double>* [[TMP45]], i32 8, <4 x i1> [[REVERSE34]]), !alias.scope !46, !noalias !48
	; AVX2-NEXT: [[INDEX_NEXT]] = add i64 [[INDEX]], 16			; AVX2-NEXT: [[INDEX_NEXT]] = add i64 [[INDEX]], 16
	; AVX2-NEXT: [[TMP46:%.*]] = icmp eq i64 [[INDEX_NEXT]], 4096			; AVX2-NEXT: [[TMP46:%.*]] = icmp eq i64 [[INDEX]], 4080
	; AVX2-NEXT: br i1 [[TMP46]], label [[FOR_END:%.*]], label [[VECTOR_BODY]], !llvm.loop !49			; AVX2-NEXT: br i1 [[TMP46]], label [[FOR_END:%.*]], label [[VECTOR_BODY]], !llvm.loop !49
	; AVX2: for.body:			; AVX2: for.body:
	; AVX2-NEXT: [[INDVARS_IV:%.]] = phi i64 [ [[INDVARS_IV_NEXT_3:%.]], [[FOR_INC_3:%.*]] ], [ 4095, [[ENTRY]] ]			; AVX2-NEXT: [[INDVARS_IV:%.]] = phi i64 [ [[INDVARS_IV_NEXT_3:%.]], [[FOR_INC_3:%.*]] ], [ 4095, [[ENTRY]] ]
	; AVX2-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds i32, i32 [[TRIGGER]], i64 [[INDVARS_IV]]			; AVX2-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds i32, i32 [[TRIGGER]], i64 [[INDVARS_IV]]
	; AVX2-NEXT: [[TMP47:%.]] = load i32, i32 [[ARRAYIDX]], align 4			; AVX2-NEXT: [[TMP47:%.]] = load i32, i32 [[ARRAYIDX]], align 4
	; AVX2-NEXT: [[CMP1:%.*]] = icmp sgt i32 [[TMP47]], 0			; AVX2-NEXT: [[CMP1:%.*]] = icmp sgt i32 [[TMP47]], 0
	; AVX2-NEXT: br i1 [[CMP1]], label [[IF_THEN:%.]], label [[FOR_INC:%.]]			; AVX2-NEXT: br i1 [[CMP1]], label [[IF_THEN:%.]], label [[FOR_INC:%.]]
	; AVX2: if.then:			; AVX2: if.then:
	▲ Show 20 Lines • Show All 41 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: [[ARRAYIDX3_3:%.]] = getelementptr inbounds double, double [[IN]], i64 [[INDVARS_IV_NEXT_2]]			; AVX2-NEXT: [[ARRAYIDX3_3:%.]] = getelementptr inbounds double, double [[IN]], i64 [[INDVARS_IV_NEXT_2]]
	; AVX2-NEXT: [[TMP54:%.]] = load double, double [[ARRAYIDX3_3]], align 8			; AVX2-NEXT: [[TMP54:%.]] = load double, double [[ARRAYIDX3_3]], align 8
	; AVX2-NEXT: [[ADD_3:%.*]] = fadd double [[TMP54]], 5.000000e-01			; AVX2-NEXT: [[ADD_3:%.*]] = fadd double [[TMP54]], 5.000000e-01
	; AVX2-NEXT: [[ARRAYIDX5_3:%.]] = getelementptr inbounds double, double [[OUT]], i64 [[INDVARS_IV_NEXT_2]]			; AVX2-NEXT: [[ARRAYIDX5_3:%.]] = getelementptr inbounds double, double [[OUT]], i64 [[INDVARS_IV_NEXT_2]]
	; AVX2-NEXT: store double [[ADD_3]], double* [[ARRAYIDX5_3]], align 8			; AVX2-NEXT: store double [[ADD_3]], double* [[ARRAYIDX5_3]], align 8
	; AVX2-NEXT: br label [[FOR_INC_3]]			; AVX2-NEXT: br label [[FOR_INC_3]]
	; AVX2: for.inc.3:			; AVX2: for.inc.3:
	; AVX2-NEXT: [[INDVARS_IV_NEXT_3]] = add nsw i64 [[INDVARS_IV]], -4			; AVX2-NEXT: [[INDVARS_IV_NEXT_3]] = add nsw i64 [[INDVARS_IV]], -4
	; AVX2-NEXT: [[CMP_3:%.*]] = icmp eq i64 [[INDVARS_IV_NEXT_2]], 0			; AVX2-NEXT: [[CMP_3:%.*]] = icmp eq i64 [[INDVARS_IV]], 3
	; AVX2-NEXT: br i1 [[CMP_3]], label [[FOR_END]], label [[FOR_BODY]], !llvm.loop !50			; AVX2-NEXT: br i1 [[CMP_3]], label [[FOR_END]], label [[FOR_BODY]], !llvm.loop !50
	;			;
	; AVX512-LABEL: @foo6(			; AVX512-LABEL: @foo6(
	; AVX512-NEXT: entry:			; AVX512-NEXT: entry:
	; AVX512-NEXT: [[SCEVGEP:%.]] = getelementptr double, double [[OUT:%.*]], i64 4096			; AVX512-NEXT: [[SCEVGEP:%.]] = getelementptr double, double [[OUT:%.*]], i64 4096
	; AVX512-NEXT: [[SCEVGEP9:%.]] = getelementptr i32, i32 [[TRIGGER:%.*]], i64 4096			; AVX512-NEXT: [[SCEVGEP9:%.]] = getelementptr i32, i32 [[TRIGGER:%.*]], i64 4096
	; AVX512-NEXT: [[SCEVGEP12:%.]] = getelementptr double, double [[IN:%.*]], i64 4096			; AVX512-NEXT: [[SCEVGEP12:%.]] = getelementptr double, double [[IN:%.*]], i64 4096
	; AVX512-NEXT: [[TMP0:%.]] = bitcast i32 [[SCEVGEP9]] to double*			; AVX512-NEXT: [[TMP0:%.]] = bitcast i32 [[SCEVGEP9]] to double*
	▲ Show 20 Lines • Show All 69 Lines • ▼ Show 20 Lines
	; AVX512-NEXT: [[TMP41:%.]] = getelementptr inbounds double, double [[TMP40]], i64 -7			; AVX512-NEXT: [[TMP41:%.]] = getelementptr inbounds double, double [[TMP40]], i64 -7
	; AVX512-NEXT: [[TMP42:%.]] = bitcast double [[TMP41]] to <8 x double>*			; AVX512-NEXT: [[TMP42:%.]] = bitcast double [[TMP41]] to <8 x double>*
	; AVX512-NEXT: call void @llvm.masked.store.v8f64.p0v8f64(<8 x double> [[TMP32]], <8 x double>* [[TMP42]], i32 8, <8 x i1> [[REVERSE31]]), !alias.scope !58, !noalias !60			; AVX512-NEXT: call void @llvm.masked.store.v8f64.p0v8f64(<8 x double> [[TMP32]], <8 x double>* [[TMP42]], i32 8, <8 x i1> [[REVERSE31]]), !alias.scope !58, !noalias !60
	; AVX512-NEXT: [[TMP43:%.]] = getelementptr inbounds double, double [[TMP34]], i64 -24			; AVX512-NEXT: [[TMP43:%.]] = getelementptr inbounds double, double [[TMP34]], i64 -24
	; AVX512-NEXT: [[TMP44:%.]] = getelementptr inbounds double, double [[TMP43]], i64 -7			; AVX512-NEXT: [[TMP44:%.]] = getelementptr inbounds double, double [[TMP43]], i64 -7
	; AVX512-NEXT: [[TMP45:%.]] = bitcast double [[TMP44]] to <8 x double>*			; AVX512-NEXT: [[TMP45:%.]] = bitcast double [[TMP44]] to <8 x double>*
	; AVX512-NEXT: call void @llvm.masked.store.v8f64.p0v8f64(<8 x double> [[TMP33]], <8 x double>* [[TMP45]], i32 8, <8 x i1> [[REVERSE34]]), !alias.scope !58, !noalias !60			; AVX512-NEXT: call void @llvm.masked.store.v8f64.p0v8f64(<8 x double> [[TMP33]], <8 x double>* [[TMP45]], i32 8, <8 x i1> [[REVERSE34]]), !alias.scope !58, !noalias !60
	; AVX512-NEXT: [[INDEX_NEXT]] = add i64 [[INDEX]], 32			; AVX512-NEXT: [[INDEX_NEXT]] = add i64 [[INDEX]], 32
	; AVX512-NEXT: [[TMP46:%.*]] = icmp eq i64 [[INDEX_NEXT]], 4096			; AVX512-NEXT: [[TMP46:%.*]] = icmp eq i64 [[INDEX]], 4064
	; AVX512-NEXT: br i1 [[TMP46]], label [[FOR_END:%.*]], label [[VECTOR_BODY]], !llvm.loop !61			; AVX512-NEXT: br i1 [[TMP46]], label [[FOR_END:%.*]], label [[VECTOR_BODY]], !llvm.loop !61
	; AVX512: for.body:			; AVX512: for.body:
	; AVX512-NEXT: [[INDVARS_IV:%.]] = phi i64 [ [[INDVARS_IV_NEXT_3:%.]], [[FOR_INC_3:%.*]] ], [ 4095, [[ENTRY]] ]			; AVX512-NEXT: [[INDVARS_IV:%.]] = phi i64 [ [[INDVARS_IV_NEXT_3:%.]], [[FOR_INC_3:%.*]] ], [ 4095, [[ENTRY]] ]
	; AVX512-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds i32, i32 [[TRIGGER]], i64 [[INDVARS_IV]]			; AVX512-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds i32, i32 [[TRIGGER]], i64 [[INDVARS_IV]]
	; AVX512-NEXT: [[TMP47:%.]] = load i32, i32 [[ARRAYIDX]], align 4			; AVX512-NEXT: [[TMP47:%.]] = load i32, i32 [[ARRAYIDX]], align 4
	; AVX512-NEXT: [[CMP1:%.*]] = icmp sgt i32 [[TMP47]], 0			; AVX512-NEXT: [[CMP1:%.*]] = icmp sgt i32 [[TMP47]], 0
	; AVX512-NEXT: br i1 [[CMP1]], label [[IF_THEN:%.]], label [[FOR_INC:%.]]			; AVX512-NEXT: br i1 [[CMP1]], label [[IF_THEN:%.]], label [[FOR_INC:%.]]
	; AVX512: if.then:			; AVX512: if.then:
	▲ Show 20 Lines • Show All 41 Lines • ▼ Show 20 Lines
	; AVX512-NEXT: [[ARRAYIDX3_3:%.]] = getelementptr inbounds double, double [[IN]], i64 [[INDVARS_IV_NEXT_2]]			; AVX512-NEXT: [[ARRAYIDX3_3:%.]] = getelementptr inbounds double, double [[IN]], i64 [[INDVARS_IV_NEXT_2]]
	; AVX512-NEXT: [[TMP54:%.]] = load double, double [[ARRAYIDX3_3]], align 8			; AVX512-NEXT: [[TMP54:%.]] = load double, double [[ARRAYIDX3_3]], align 8
	; AVX512-NEXT: [[ADD_3:%.*]] = fadd double [[TMP54]], 5.000000e-01			; AVX512-NEXT: [[ADD_3:%.*]] = fadd double [[TMP54]], 5.000000e-01
	; AVX512-NEXT: [[ARRAYIDX5_3:%.]] = getelementptr inbounds double, double [[OUT]], i64 [[INDVARS_IV_NEXT_2]]			; AVX512-NEXT: [[ARRAYIDX5_3:%.]] = getelementptr inbounds double, double [[OUT]], i64 [[INDVARS_IV_NEXT_2]]
	; AVX512-NEXT: store double [[ADD_3]], double* [[ARRAYIDX5_3]], align 8			; AVX512-NEXT: store double [[ADD_3]], double* [[ARRAYIDX5_3]], align 8
	; AVX512-NEXT: br label [[FOR_INC_3]]			; AVX512-NEXT: br label [[FOR_INC_3]]
	; AVX512: for.inc.3:			; AVX512: for.inc.3:
	; AVX512-NEXT: [[INDVARS_IV_NEXT_3]] = add nsw i64 [[INDVARS_IV]], -4			; AVX512-NEXT: [[INDVARS_IV_NEXT_3]] = add nsw i64 [[INDVARS_IV]], -4
	; AVX512-NEXT: [[CMP_3:%.*]] = icmp eq i64 [[INDVARS_IV_NEXT_2]], 0			; AVX512-NEXT: [[CMP_3:%.*]] = icmp eq i64 [[INDVARS_IV]], 3
	; AVX512-NEXT: br i1 [[CMP_3]], label [[FOR_END]], label [[FOR_BODY]], !llvm.loop !62			; AVX512-NEXT: br i1 [[CMP_3]], label [[FOR_END]], label [[FOR_BODY]], !llvm.loop !62
	;			;
	entry:			entry:
	%in.addr = alloca double*, align 8			%in.addr = alloca double*, align 8
	%out.addr = alloca double*, align 8			%out.addr = alloca double*, align 8
	%size.addr = alloca i32, align 4			%size.addr = alloca i32, align 4
	%trigger.addr = alloca i32*, align 8			%trigger.addr = alloca i32*, align 8
	%i = alloca i32, align 4			%i = alloca i32, align 4
	▲ Show 20 Lines • Show All 553 Lines • Show Last 20 Lines

llvm/test/Transforms/LoopVectorize/X86/metadata-enable.ll

	Show First 20 Lines • Show All 1,331 Lines • ▼ Show 20 Lines
	; O1: for.body:			; O1: for.body:
	; O1-NEXT: [[INDVARS_IV:%.]] = phi i64 [ 0, [[ENTRY:%.]] ], [ [[INDVARS_IV_NEXT:%.*]], [[FOR_BODY]] ]			; O1-NEXT: [[INDVARS_IV:%.]] = phi i64 [ 0, [[ENTRY:%.]] ], [ [[INDVARS_IV_NEXT:%.*]], [[FOR_BODY]] ]
	; O1-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds i32, i32 [[B:%.*]], i64 [[INDVARS_IV]]			; O1-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds i32, i32 [[B:%.*]], i64 [[INDVARS_IV]]
	; O1-NEXT: [[TMP0:%.]] = load i32, i32 [[ARRAYIDX]], align 4			; O1-NEXT: [[TMP0:%.]] = load i32, i32 [[ARRAYIDX]], align 4
	; O1-NEXT: [[ADD:%.]] = add nsw i32 [[TMP0]], [[N:%.]]			; O1-NEXT: [[ADD:%.]] = add nsw i32 [[TMP0]], [[N:%.]]
	; O1-NEXT: [[ARRAYIDX2:%.]] = getelementptr inbounds i32, i32 [[A:%.*]], i64 [[INDVARS_IV]]			; O1-NEXT: [[ARRAYIDX2:%.]] = getelementptr inbounds i32, i32 [[A:%.*]], i64 [[INDVARS_IV]]
	; O1-NEXT: store i32 [[ADD]], i32* [[ARRAYIDX2]], align 4			; O1-NEXT: store i32 [[ADD]], i32* [[ARRAYIDX2]], align 4
	; O1-NEXT: [[INDVARS_IV_NEXT]] = add nuw nsw i64 [[INDVARS_IV]], 1			; O1-NEXT: [[INDVARS_IV_NEXT]] = add nuw nsw i64 [[INDVARS_IV]], 1
	; O1-NEXT: [[EXITCOND:%.*]] = icmp eq i64 [[INDVARS_IV_NEXT]], 64			; O1-NEXT: [[EXITCOND:%.*]] = icmp eq i64 [[INDVARS_IV]], 63
	; O1-NEXT: br i1 [[EXITCOND]], label [[FOR_END:%.*]], label [[FOR_BODY]]			; O1-NEXT: br i1 [[EXITCOND]], label [[FOR_END:%.*]], label [[FOR_BODY]]
	; O1: for.end:			; O1: for.end:
	; O1-NEXT: [[TMP1:%.]] = load i32, i32 [[A]], align 4			; O1-NEXT: [[TMP1:%.]] = load i32, i32 [[A]], align 4
	; O1-NEXT: ret i32 [[TMP1]]			; O1-NEXT: ret i32 [[TMP1]]
	;			;
	; O2-LABEL: @nopragma(			; O2-LABEL: @nopragma(
	; O2-NEXT: entry:			; O2-NEXT: entry:
	; O2-NEXT: [[BROADCAST_SPLATINSERT1:%.]] = insertelement <4 x i32> undef, i32 [[N:%.]], i32 0			; O2-NEXT: [[BROADCAST_SPLATINSERT1:%.]] = insertelement <4 x i32> undef, i32 [[N:%.]], i32 0
	▲ Show 20 Lines • Show All 468 Lines • ▼ Show 20 Lines
	; Oz: for.body:			; Oz: for.body:
	; Oz-NEXT: [[INDVARS_IV:%.]] = phi i64 [ 0, [[ENTRY:%.]] ], [ [[INDVARS_IV_NEXT:%.*]], [[FOR_BODY]] ]			; Oz-NEXT: [[INDVARS_IV:%.]] = phi i64 [ 0, [[ENTRY:%.]] ], [ [[INDVARS_IV_NEXT:%.*]], [[FOR_BODY]] ]
	; Oz-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds i32, i32 [[B:%.*]], i64 [[INDVARS_IV]]			; Oz-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds i32, i32 [[B:%.*]], i64 [[INDVARS_IV]]
	; Oz-NEXT: [[TMP0:%.]] = load i32, i32 [[ARRAYIDX]], align 4			; Oz-NEXT: [[TMP0:%.]] = load i32, i32 [[ARRAYIDX]], align 4
	; Oz-NEXT: [[ADD:%.]] = add nsw i32 [[TMP0]], [[N:%.]]			; Oz-NEXT: [[ADD:%.]] = add nsw i32 [[TMP0]], [[N:%.]]
	; Oz-NEXT: [[ARRAYIDX2:%.]] = getelementptr inbounds i32, i32 [[A:%.*]], i64 [[INDVARS_IV]]			; Oz-NEXT: [[ARRAYIDX2:%.]] = getelementptr inbounds i32, i32 [[A:%.*]], i64 [[INDVARS_IV]]
	; Oz-NEXT: store i32 [[ADD]], i32* [[ARRAYIDX2]], align 4			; Oz-NEXT: store i32 [[ADD]], i32* [[ARRAYIDX2]], align 4
	; Oz-NEXT: [[INDVARS_IV_NEXT]] = add nuw nsw i64 [[INDVARS_IV]], 1			; Oz-NEXT: [[INDVARS_IV_NEXT]] = add nuw nsw i64 [[INDVARS_IV]], 1
	; Oz-NEXT: [[EXITCOND:%.*]] = icmp eq i64 [[INDVARS_IV_NEXT]], 64			; Oz-NEXT: [[EXITCOND:%.*]] = icmp eq i64 [[INDVARS_IV]], 63
	; Oz-NEXT: br i1 [[EXITCOND]], label [[FOR_END:%.*]], label [[FOR_BODY]]			; Oz-NEXT: br i1 [[EXITCOND]], label [[FOR_END:%.*]], label [[FOR_BODY]]
	; Oz: for.end:			; Oz: for.end:
	; Oz-NEXT: [[TMP1:%.]] = load i32, i32 [[A]], align 4			; Oz-NEXT: [[TMP1:%.]] = load i32, i32 [[A]], align 4
	; Oz-NEXT: ret i32 [[TMP1]]			; Oz-NEXT: ret i32 [[TMP1]]
	;			;
	; O1VEC-LABEL: @nopragma(			; O1VEC-LABEL: @nopragma(
	; O1VEC-NEXT: entry:			; O1VEC-NEXT: entry:
	; O1VEC-NEXT: [[BROADCAST_SPLATINSERT1:%.]] = insertelement <4 x i32> undef, i32 [[N:%.]], i32 0			; O1VEC-NEXT: [[BROADCAST_SPLATINSERT1:%.]] = insertelement <4 x i32> undef, i32 [[N:%.]], i32 0
	▲ Show 20 Lines • Show All 262 Lines • ▼ Show 20 Lines
	; O1VEC2: for.body:			; O1VEC2: for.body:
	; O1VEC2-NEXT: [[INDVARS_IV:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[INDVARS_IV_NEXT:%.]], [[FOR_BODY]] ]			; O1VEC2-NEXT: [[INDVARS_IV:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[INDVARS_IV_NEXT:%.]], [[FOR_BODY]] ]
	; O1VEC2-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds i32, i32 [[B]], i64 [[INDVARS_IV]]			; O1VEC2-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds i32, i32 [[B]], i64 [[INDVARS_IV]]
	; O1VEC2-NEXT: [[TMP9:%.]] = load i32, i32 [[ARRAYIDX]], align 4			; O1VEC2-NEXT: [[TMP9:%.]] = load i32, i32 [[ARRAYIDX]], align 4
	; O1VEC2-NEXT: [[ADD:%.*]] = add nsw i32 [[TMP9]], [[N]]			; O1VEC2-NEXT: [[ADD:%.*]] = add nsw i32 [[TMP9]], [[N]]
	; O1VEC2-NEXT: [[ARRAYIDX2:%.]] = getelementptr inbounds i32, i32 [[A]], i64 [[INDVARS_IV]]			; O1VEC2-NEXT: [[ARRAYIDX2:%.]] = getelementptr inbounds i32, i32 [[A]], i64 [[INDVARS_IV]]
	; O1VEC2-NEXT: store i32 [[ADD]], i32* [[ARRAYIDX2]], align 4			; O1VEC2-NEXT: store i32 [[ADD]], i32* [[ARRAYIDX2]], align 4
	; O1VEC2-NEXT: [[INDVARS_IV_NEXT]] = add nuw nsw i64 [[INDVARS_IV]], 1			; O1VEC2-NEXT: [[INDVARS_IV_NEXT]] = add nuw nsw i64 [[INDVARS_IV]], 1
	; O1VEC2-NEXT: [[EXITCOND:%.*]] = icmp eq i64 [[INDVARS_IV_NEXT]], 64			; O1VEC2-NEXT: [[EXITCOND:%.*]] = icmp eq i64 [[INDVARS_IV]], 63
	; O1VEC2-NEXT: br i1 [[EXITCOND]], label [[FOR_END]], label [[FOR_BODY]], !llvm.loop !2			; O1VEC2-NEXT: br i1 [[EXITCOND]], label [[FOR_END]], label [[FOR_BODY]], !llvm.loop !2
	; O1VEC2: for.end:			; O1VEC2: for.end:
	; O1VEC2-NEXT: [[TMP10:%.]] = load i32, i32 [[A]], align 4			; O1VEC2-NEXT: [[TMP10:%.]] = load i32, i32 [[A]], align 4
	; O1VEC2-NEXT: ret i32 [[TMP10]]			; O1VEC2-NEXT: ret i32 [[TMP10]]
	;			;
	; OzVEC2-LABEL: @nopragma(			; OzVEC2-LABEL: @nopragma(
	; OzVEC2-NEXT: entry:			; OzVEC2-NEXT: entry:
	; OzVEC2-NEXT: br i1 false, label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]			; OzVEC2-NEXT: br i1 false, label [[SCALAR_PH:%.]], label [[VECTOR_PH:%.]]
	Show All 28 Lines
	; OzVEC2: for.body:			; OzVEC2: for.body:
	; OzVEC2-NEXT: [[INDVARS_IV:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[INDVARS_IV_NEXT:%.]], [[FOR_BODY]] ]			; OzVEC2-NEXT: [[INDVARS_IV:%.]] = phi i64 [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ], [ [[INDVARS_IV_NEXT:%.]], [[FOR_BODY]] ]
	; OzVEC2-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds i32, i32 [[B]], i64 [[INDVARS_IV]]			; OzVEC2-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds i32, i32 [[B]], i64 [[INDVARS_IV]]
	; OzVEC2-NEXT: [[TMP9:%.]] = load i32, i32 [[ARRAYIDX]], align 4			; OzVEC2-NEXT: [[TMP9:%.]] = load i32, i32 [[ARRAYIDX]], align 4
	; OzVEC2-NEXT: [[ADD:%.*]] = add nsw i32 [[TMP9]], [[N]]			; OzVEC2-NEXT: [[ADD:%.*]] = add nsw i32 [[TMP9]], [[N]]
	; OzVEC2-NEXT: [[ARRAYIDX2:%.]] = getelementptr inbounds i32, i32 [[A]], i64 [[INDVARS_IV]]			; OzVEC2-NEXT: [[ARRAYIDX2:%.]] = getelementptr inbounds i32, i32 [[A]], i64 [[INDVARS_IV]]
	; OzVEC2-NEXT: store i32 [[ADD]], i32* [[ARRAYIDX2]], align 4			; OzVEC2-NEXT: store i32 [[ADD]], i32* [[ARRAYIDX2]], align 4
	; OzVEC2-NEXT: [[INDVARS_IV_NEXT]] = add nuw nsw i64 [[INDVARS_IV]], 1			; OzVEC2-NEXT: [[INDVARS_IV_NEXT]] = add nuw nsw i64 [[INDVARS_IV]], 1
	; OzVEC2-NEXT: [[EXITCOND:%.*]] = icmp eq i64 [[INDVARS_IV_NEXT]], 64			; OzVEC2-NEXT: [[EXITCOND:%.*]] = icmp eq i64 [[INDVARS_IV]], 63
	; OzVEC2-NEXT: br i1 [[EXITCOND]], label [[FOR_END]], label [[FOR_BODY]], !llvm.loop !2			; OzVEC2-NEXT: br i1 [[EXITCOND]], label [[FOR_END]], label [[FOR_BODY]], !llvm.loop !2
	; OzVEC2: for.end:			; OzVEC2: for.end:
	; OzVEC2-NEXT: [[TMP10:%.]] = load i32, i32 [[A]], align 4			; OzVEC2-NEXT: [[TMP10:%.]] = load i32, i32 [[A]], align 4
	; OzVEC2-NEXT: ret i32 [[TMP10]]			; OzVEC2-NEXT: ret i32 [[TMP10]]
	;			;
	; O3DIS-LABEL: @nopragma(			; O3DIS-LABEL: @nopragma(
	; O3DIS-NEXT: entry:			; O3DIS-NEXT: entry:
	; O3DIS-NEXT: br label [[FOR_BODY:%.*]]			; O3DIS-NEXT: br label [[FOR_BODY:%.*]]
	; O3DIS: for.body:			; O3DIS: for.body:
	; O3DIS-NEXT: [[INDVARS_IV:%.]] = phi i64 [ 0, [[ENTRY:%.]] ], [ [[INDVARS_IV_NEXT:%.*]], [[FOR_BODY]] ]			; O3DIS-NEXT: [[INDVARS_IV:%.]] = phi i64 [ 0, [[ENTRY:%.]] ], [ [[INDVARS_IV_NEXT:%.*]], [[FOR_BODY]] ]
	; O3DIS-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds i32, i32 [[B:%.*]], i64 [[INDVARS_IV]]			; O3DIS-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds i32, i32 [[B:%.*]], i64 [[INDVARS_IV]]
	; O3DIS-NEXT: [[TMP0:%.]] = load i32, i32 [[ARRAYIDX]], align 4			; O3DIS-NEXT: [[TMP0:%.]] = load i32, i32 [[ARRAYIDX]], align 4
	; O3DIS-NEXT: [[ADD:%.]] = add nsw i32 [[TMP0]], [[N:%.]]			; O3DIS-NEXT: [[ADD:%.]] = add nsw i32 [[TMP0]], [[N:%.]]
	; O3DIS-NEXT: [[ARRAYIDX2:%.]] = getelementptr inbounds i32, i32 [[A:%.*]], i64 [[INDVARS_IV]]			; O3DIS-NEXT: [[ARRAYIDX2:%.]] = getelementptr inbounds i32, i32 [[A:%.*]], i64 [[INDVARS_IV]]
	; O3DIS-NEXT: store i32 [[ADD]], i32* [[ARRAYIDX2]], align 4			; O3DIS-NEXT: store i32 [[ADD]], i32* [[ARRAYIDX2]], align 4
	; O3DIS-NEXT: [[INDVARS_IV_NEXT]] = add nuw nsw i64 [[INDVARS_IV]], 1			; O3DIS-NEXT: [[INDVARS_IV_NEXT]] = add nuw nsw i64 [[INDVARS_IV]], 1
	; O3DIS-NEXT: [[EXITCOND:%.*]] = icmp eq i64 [[INDVARS_IV_NEXT]], 64			; O3DIS-NEXT: [[EXITCOND:%.*]] = icmp eq i64 [[INDVARS_IV]], 63
	; O3DIS-NEXT: br i1 [[EXITCOND]], label [[FOR_END:%.*]], label [[FOR_BODY]]			; O3DIS-NEXT: br i1 [[EXITCOND]], label [[FOR_END:%.*]], label [[FOR_BODY]]
	; O3DIS: for.end:			; O3DIS: for.end:
	; O3DIS-NEXT: [[TMP1:%.]] = load i32, i32 [[A]], align 4			; O3DIS-NEXT: [[TMP1:%.]] = load i32, i32 [[A]], align 4
	; O3DIS-NEXT: ret i32 [[TMP1]]			; O3DIS-NEXT: ret i32 [[TMP1]]
	;			;
	entry:			entry:
	br label %for.body			br label %for.body

	Show All 20 Lines
	; O1: for.body:			; O1: for.body:
	; O1-NEXT: [[INDVARS_IV:%.]] = phi i64 [ 0, [[ENTRY:%.]] ], [ [[INDVARS_IV_NEXT:%.*]], [[FOR_BODY]] ]			; O1-NEXT: [[INDVARS_IV:%.]] = phi i64 [ 0, [[ENTRY:%.]] ], [ [[INDVARS_IV_NEXT:%.*]], [[FOR_BODY]] ]
	; O1-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds i32, i32 [[B:%.*]], i64 [[INDVARS_IV]]			; O1-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds i32, i32 [[B:%.*]], i64 [[INDVARS_IV]]
	; O1-NEXT: [[TMP0:%.]] = load i32, i32 [[ARRAYIDX]], align 4			; O1-NEXT: [[TMP0:%.]] = load i32, i32 [[ARRAYIDX]], align 4
	; O1-NEXT: [[ADD:%.]] = add nsw i32 [[TMP0]], [[N:%.]]			; O1-NEXT: [[ADD:%.]] = add nsw i32 [[TMP0]], [[N:%.]]
	; O1-NEXT: [[ARRAYIDX2:%.]] = getelementptr inbounds i32, i32 [[A:%.*]], i64 [[INDVARS_IV]]			; O1-NEXT: [[ARRAYIDX2:%.]] = getelementptr inbounds i32, i32 [[A:%.*]], i64 [[INDVARS_IV]]
	; O1-NEXT: store i32 [[ADD]], i32* [[ARRAYIDX2]], align 4			; O1-NEXT: store i32 [[ADD]], i32* [[ARRAYIDX2]], align 4
	; O1-NEXT: [[INDVARS_IV_NEXT]] = add nuw nsw i64 [[INDVARS_IV]], 1			; O1-NEXT: [[INDVARS_IV_NEXT]] = add nuw nsw i64 [[INDVARS_IV]], 1
	; O1-NEXT: [[EXITCOND:%.*]] = icmp eq i64 [[INDVARS_IV_NEXT]], 48			; O1-NEXT: [[EXITCOND:%.*]] = icmp eq i64 [[INDVARS_IV]], 47
	; O1-NEXT: br i1 [[EXITCOND]], label [[FOR_END:%.*]], label [[FOR_BODY]], !llvm.loop !0			; O1-NEXT: br i1 [[EXITCOND]], label [[FOR_END:%.*]], label [[FOR_BODY]], !llvm.loop !0
	; O1: for.end:			; O1: for.end:
	; O1-NEXT: [[TMP1:%.]] = load i32, i32 [[A]], align 4			; O1-NEXT: [[TMP1:%.]] = load i32, i32 [[A]], align 4
	; O1-NEXT: ret i32 [[TMP1]]			; O1-NEXT: ret i32 [[TMP1]]
	;			;
	; O2-LABEL: @disabled(			; O2-LABEL: @disabled(
	; O2-NEXT: entry:			; O2-NEXT: entry:
	; O2-NEXT: br label [[FOR_BODY:%.*]]			; O2-NEXT: br label [[FOR_BODY:%.*]]
	; O2: for.body:			; O2: for.body:
	; O2-NEXT: [[INDVARS_IV:%.]] = phi i64 [ 0, [[ENTRY:%.]] ], [ [[INDVARS_IV_NEXT:%.*]], [[FOR_BODY]] ]			; O2-NEXT: [[INDVARS_IV:%.]] = phi i64 [ 0, [[ENTRY:%.]] ], [ [[INDVARS_IV_NEXT:%.*]], [[FOR_BODY]] ]
	; O2-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds i32, i32 [[B:%.*]], i64 [[INDVARS_IV]]			; O2-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds i32, i32 [[B:%.*]], i64 [[INDVARS_IV]]
	; O2-NEXT: [[TMP0:%.]] = load i32, i32 [[ARRAYIDX]], align 4			; O2-NEXT: [[TMP0:%.]] = load i32, i32 [[ARRAYIDX]], align 4
	; O2-NEXT: [[ADD:%.]] = add nsw i32 [[TMP0]], [[N:%.]]			; O2-NEXT: [[ADD:%.]] = add nsw i32 [[TMP0]], [[N:%.]]
	; O2-NEXT: [[ARRAYIDX2:%.]] = getelementptr inbounds i32, i32 [[A:%.*]], i64 [[INDVARS_IV]]			; O2-NEXT: [[ARRAYIDX2:%.]] = getelementptr inbounds i32, i32 [[A:%.*]], i64 [[INDVARS_IV]]
	; O2-NEXT: store i32 [[ADD]], i32* [[ARRAYIDX2]], align 4			; O2-NEXT: store i32 [[ADD]], i32* [[ARRAYIDX2]], align 4
	; O2-NEXT: [[INDVARS_IV_NEXT]] = add nuw nsw i64 [[INDVARS_IV]], 1			; O2-NEXT: [[INDVARS_IV_NEXT]] = add nuw nsw i64 [[INDVARS_IV]], 1
	; O2-NEXT: [[EXITCOND:%.*]] = icmp eq i64 [[INDVARS_IV_NEXT]], 48			; O2-NEXT: [[EXITCOND:%.*]] = icmp eq i64 [[INDVARS_IV]], 47
	; O2-NEXT: br i1 [[EXITCOND]], label [[FOR_END:%.*]], label [[FOR_BODY]], !llvm.loop !0			; O2-NEXT: br i1 [[EXITCOND]], label [[FOR_END:%.*]], label [[FOR_BODY]], !llvm.loop !0
	; O2: for.end:			; O2: for.end:
	; O2-NEXT: [[TMP1:%.]] = load i32, i32 [[A]], align 4			; O2-NEXT: [[TMP1:%.]] = load i32, i32 [[A]], align 4
	; O2-NEXT: ret i32 [[TMP1]]			; O2-NEXT: ret i32 [[TMP1]]
	;			;
	; O3-LABEL: @disabled(			; O3-LABEL: @disabled(
	; O3-NEXT: entry:			; O3-NEXT: entry:
	; O3-NEXT: br label [[FOR_BODY:%.*]]			; O3-NEXT: br label [[FOR_BODY:%.*]]
	; O3: for.body:			; O3: for.body:
	; O3-NEXT: [[INDVARS_IV:%.]] = phi i64 [ 0, [[ENTRY:%.]] ], [ [[INDVARS_IV_NEXT:%.*]], [[FOR_BODY]] ]			; O3-NEXT: [[INDVARS_IV:%.]] = phi i64 [ 0, [[ENTRY:%.]] ], [ [[INDVARS_IV_NEXT:%.*]], [[FOR_BODY]] ]
	; O3-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds i32, i32 [[B:%.*]], i64 [[INDVARS_IV]]			; O3-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds i32, i32 [[B:%.*]], i64 [[INDVARS_IV]]
	; O3-NEXT: [[TMP0:%.]] = load i32, i32 [[ARRAYIDX]], align 4			; O3-NEXT: [[TMP0:%.]] = load i32, i32 [[ARRAYIDX]], align 4
	; O3-NEXT: [[ADD:%.]] = add nsw i32 [[TMP0]], [[N:%.]]			; O3-NEXT: [[ADD:%.]] = add nsw i32 [[TMP0]], [[N:%.]]
	; O3-NEXT: [[ARRAYIDX2:%.]] = getelementptr inbounds i32, i32 [[A:%.*]], i64 [[INDVARS_IV]]			; O3-NEXT: [[ARRAYIDX2:%.]] = getelementptr inbounds i32, i32 [[A:%.*]], i64 [[INDVARS_IV]]
	; O3-NEXT: store i32 [[ADD]], i32* [[ARRAYIDX2]], align 4			; O3-NEXT: store i32 [[ADD]], i32* [[ARRAYIDX2]], align 4
	; O3-NEXT: [[INDVARS_IV_NEXT]] = add nuw nsw i64 [[INDVARS_IV]], 1			; O3-NEXT: [[INDVARS_IV_NEXT]] = add nuw nsw i64 [[INDVARS_IV]], 1
	; O3-NEXT: [[EXITCOND:%.*]] = icmp eq i64 [[INDVARS_IV_NEXT]], 48			; O3-NEXT: [[EXITCOND:%.*]] = icmp eq i64 [[INDVARS_IV]], 47
	; O3-NEXT: br i1 [[EXITCOND]], label [[FOR_END:%.*]], label [[FOR_BODY]], !llvm.loop !0			; O3-NEXT: br i1 [[EXITCOND]], label [[FOR_END:%.*]], label [[FOR_BODY]], !llvm.loop !0
	; O3: for.end:			; O3: for.end:
	; O3-NEXT: [[TMP1:%.]] = load i32, i32 [[A]], align 4			; O3-NEXT: [[TMP1:%.]] = load i32, i32 [[A]], align 4
	; O3-NEXT: ret i32 [[TMP1]]			; O3-NEXT: ret i32 [[TMP1]]
	;			;
	; O3DEFAULT-LABEL: @disabled(			; O3DEFAULT-LABEL: @disabled(
	; O3DEFAULT-NEXT: entry:			; O3DEFAULT-NEXT: entry:
	; O3DEFAULT-NEXT: [[TMP0:%.]] = bitcast i32 [[B:%.]] to <4 x i32>			; O3DEFAULT-NEXT: [[TMP0:%.]] = bitcast i32 [[B:%.]] to <4 x i32>
	▲ Show 20 Lines • Show All 89 Lines • ▼ Show 20 Lines
	; Os: for.body:			; Os: for.body:
	; Os-NEXT: [[INDVARS_IV:%.]] = phi i64 [ 0, [[ENTRY:%.]] ], [ [[INDVARS_IV_NEXT:%.*]], [[FOR_BODY]] ]			; Os-NEXT: [[INDVARS_IV:%.]] = phi i64 [ 0, [[ENTRY:%.]] ], [ [[INDVARS_IV_NEXT:%.*]], [[FOR_BODY]] ]
	; Os-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds i32, i32 [[B:%.*]], i64 [[INDVARS_IV]]			; Os-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds i32, i32 [[B:%.*]], i64 [[INDVARS_IV]]
	; Os-NEXT: [[TMP0:%.]] = load i32, i32 [[ARRAYIDX]], align 4			; Os-NEXT: [[TMP0:%.]] = load i32, i32 [[ARRAYIDX]], align 4
	; Os-NEXT: [[ADD:%.]] = add nsw i32 [[TMP0]], [[N:%.]]			; Os-NEXT: [[ADD:%.]] = add nsw i32 [[TMP0]], [[N:%.]]
	; Os-NEXT: [[ARRAYIDX2:%.]] = getelementptr inbounds i32, i32 [[A:%.*]], i64 [[INDVARS_IV]]			; Os-NEXT: [[ARRAYIDX2:%.]] = getelementptr inbounds i32, i32 [[A:%.*]], i64 [[INDVARS_IV]]
	; Os-NEXT: store i32 [[ADD]], i32* [[ARRAYIDX2]], align 4			; Os-NEXT: store i32 [[ADD]], i32* [[ARRAYIDX2]], align 4
	; Os-NEXT: [[INDVARS_IV_NEXT]] = add nuw nsw i64 [[INDVARS_IV]], 1			; Os-NEXT: [[INDVARS_IV_NEXT]] = add nuw nsw i64 [[INDVARS_IV]], 1
	; Os-NEXT: [[EXITCOND:%.*]] = icmp eq i64 [[INDVARS_IV_NEXT]], 48			; Os-NEXT: [[EXITCOND:%.*]] = icmp eq i64 [[INDVARS_IV]], 47
	; Os-NEXT: br i1 [[EXITCOND]], label [[FOR_END:%.*]], label [[FOR_BODY]], !llvm.loop !0			; Os-NEXT: br i1 [[EXITCOND]], label [[FOR_END:%.*]], label [[FOR_BODY]], !llvm.loop !0
	; Os: for.end:			; Os: for.end:
	; Os-NEXT: [[TMP1:%.]] = load i32, i32 [[A]], align 4			; Os-NEXT: [[TMP1:%.]] = load i32, i32 [[A]], align 4
	; Os-NEXT: ret i32 [[TMP1]]			; Os-NEXT: ret i32 [[TMP1]]
	;			;
	; Oz-LABEL: @disabled(			; Oz-LABEL: @disabled(
	; Oz-NEXT: entry:			; Oz-NEXT: entry:
	; Oz-NEXT: br label [[FOR_BODY:%.*]]			; Oz-NEXT: br label [[FOR_BODY:%.*]]
	; Oz: for.body:			; Oz: for.body:
	; Oz-NEXT: [[INDVARS_IV:%.]] = phi i64 [ 0, [[ENTRY:%.]] ], [ [[INDVARS_IV_NEXT:%.*]], [[FOR_BODY]] ]			; Oz-NEXT: [[INDVARS_IV:%.]] = phi i64 [ 0, [[ENTRY:%.]] ], [ [[INDVARS_IV_NEXT:%.*]], [[FOR_BODY]] ]
	; Oz-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds i32, i32 [[B:%.*]], i64 [[INDVARS_IV]]			; Oz-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds i32, i32 [[B:%.*]], i64 [[INDVARS_IV]]
	; Oz-NEXT: [[TMP0:%.]] = load i32, i32 [[ARRAYIDX]], align 4			; Oz-NEXT: [[TMP0:%.]] = load i32, i32 [[ARRAYIDX]], align 4
	; Oz-NEXT: [[ADD:%.]] = add nsw i32 [[TMP0]], [[N:%.]]			; Oz-NEXT: [[ADD:%.]] = add nsw i32 [[TMP0]], [[N:%.]]
	; Oz-NEXT: [[ARRAYIDX2:%.]] = getelementptr inbounds i32, i32 [[A:%.*]], i64 [[INDVARS_IV]]			; Oz-NEXT: [[ARRAYIDX2:%.]] = getelementptr inbounds i32, i32 [[A:%.*]], i64 [[INDVARS_IV]]
	; Oz-NEXT: store i32 [[ADD]], i32* [[ARRAYIDX2]], align 4			; Oz-NEXT: store i32 [[ADD]], i32* [[ARRAYIDX2]], align 4
	; Oz-NEXT: [[INDVARS_IV_NEXT]] = add nuw nsw i64 [[INDVARS_IV]], 1			; Oz-NEXT: [[INDVARS_IV_NEXT]] = add nuw nsw i64 [[INDVARS_IV]], 1
	; Oz-NEXT: [[EXITCOND:%.*]] = icmp eq i64 [[INDVARS_IV_NEXT]], 48			; Oz-NEXT: [[EXITCOND:%.*]] = icmp eq i64 [[INDVARS_IV]], 47
	; Oz-NEXT: br i1 [[EXITCOND]], label [[FOR_END:%.*]], label [[FOR_BODY]], !llvm.loop !0			; Oz-NEXT: br i1 [[EXITCOND]], label [[FOR_END:%.*]], label [[FOR_BODY]], !llvm.loop !0
	; Oz: for.end:			; Oz: for.end:
	; Oz-NEXT: [[TMP1:%.]] = load i32, i32 [[A]], align 4			; Oz-NEXT: [[TMP1:%.]] = load i32, i32 [[A]], align 4
	; Oz-NEXT: ret i32 [[TMP1]]			; Oz-NEXT: ret i32 [[TMP1]]
	;			;
	; O1VEC-LABEL: @disabled(			; O1VEC-LABEL: @disabled(
	; O1VEC-NEXT: entry:			; O1VEC-NEXT: entry:
	; O1VEC-NEXT: br label [[FOR_BODY:%.*]]			; O1VEC-NEXT: br label [[FOR_BODY:%.*]]
	; O1VEC: for.body:			; O1VEC: for.body:
	; O1VEC-NEXT: [[INDVARS_IV:%.]] = phi i64 [ 0, [[ENTRY:%.]] ], [ [[INDVARS_IV_NEXT:%.*]], [[FOR_BODY]] ]			; O1VEC-NEXT: [[INDVARS_IV:%.]] = phi i64 [ 0, [[ENTRY:%.]] ], [ [[INDVARS_IV_NEXT:%.*]], [[FOR_BODY]] ]
	; O1VEC-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds i32, i32 [[B:%.*]], i64 [[INDVARS_IV]]			; O1VEC-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds i32, i32 [[B:%.*]], i64 [[INDVARS_IV]]
	; O1VEC-NEXT: [[TMP0:%.]] = load i32, i32 [[ARRAYIDX]], align 4			; O1VEC-NEXT: [[TMP0:%.]] = load i32, i32 [[ARRAYIDX]], align 4
	; O1VEC-NEXT: [[ADD:%.]] = add nsw i32 [[TMP0]], [[N:%.]]			; O1VEC-NEXT: [[ADD:%.]] = add nsw i32 [[TMP0]], [[N:%.]]
	; O1VEC-NEXT: [[ARRAYIDX2:%.]] = getelementptr inbounds i32, i32 [[A:%.*]], i64 [[INDVARS_IV]]			; O1VEC-NEXT: [[ARRAYIDX2:%.]] = getelementptr inbounds i32, i32 [[A:%.*]], i64 [[INDVARS_IV]]
	; O1VEC-NEXT: store i32 [[ADD]], i32* [[ARRAYIDX2]], align 4			; O1VEC-NEXT: store i32 [[ADD]], i32* [[ARRAYIDX2]], align 4
	; O1VEC-NEXT: [[INDVARS_IV_NEXT]] = add nuw nsw i64 [[INDVARS_IV]], 1			; O1VEC-NEXT: [[INDVARS_IV_NEXT]] = add nuw nsw i64 [[INDVARS_IV]], 1
	; O1VEC-NEXT: [[EXITCOND:%.*]] = icmp eq i64 [[INDVARS_IV_NEXT]], 48			; O1VEC-NEXT: [[EXITCOND:%.*]] = icmp eq i64 [[INDVARS_IV]], 47
	; O1VEC-NEXT: br i1 [[EXITCOND]], label [[FOR_END:%.*]], label [[FOR_BODY]], !llvm.loop !0			; O1VEC-NEXT: br i1 [[EXITCOND]], label [[FOR_END:%.*]], label [[FOR_BODY]], !llvm.loop !0
	; O1VEC: for.end:			; O1VEC: for.end:
	; O1VEC-NEXT: [[TMP1:%.]] = load i32, i32 [[A]], align 4			; O1VEC-NEXT: [[TMP1:%.]] = load i32, i32 [[A]], align 4
	; O1VEC-NEXT: ret i32 [[TMP1]]			; O1VEC-NEXT: ret i32 [[TMP1]]
	;			;
	; OzVEC-LABEL: @disabled(			; OzVEC-LABEL: @disabled(
	; OzVEC-NEXT: entry:			; OzVEC-NEXT: entry:
	; OzVEC-NEXT: br label [[FOR_BODY:%.*]]			; OzVEC-NEXT: br label [[FOR_BODY:%.*]]
	; OzVEC: for.body:			; OzVEC: for.body:
	; OzVEC-NEXT: [[INDVARS_IV:%.]] = phi i64 [ 0, [[ENTRY:%.]] ], [ [[INDVARS_IV_NEXT:%.*]], [[FOR_BODY]] ]			; OzVEC-NEXT: [[INDVARS_IV:%.]] = phi i64 [ 0, [[ENTRY:%.]] ], [ [[INDVARS_IV_NEXT:%.*]], [[FOR_BODY]] ]
	; OzVEC-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds i32, i32 [[B:%.*]], i64 [[INDVARS_IV]]			; OzVEC-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds i32, i32 [[B:%.*]], i64 [[INDVARS_IV]]
	; OzVEC-NEXT: [[TMP0:%.]] = load i32, i32 [[ARRAYIDX]], align 4			; OzVEC-NEXT: [[TMP0:%.]] = load i32, i32 [[ARRAYIDX]], align 4
	; OzVEC-NEXT: [[ADD:%.]] = add nsw i32 [[TMP0]], [[N:%.]]			; OzVEC-NEXT: [[ADD:%.]] = add nsw i32 [[TMP0]], [[N:%.]]
	; OzVEC-NEXT: [[ARRAYIDX2:%.]] = getelementptr inbounds i32, i32 [[A:%.*]], i64 [[INDVARS_IV]]			; OzVEC-NEXT: [[ARRAYIDX2:%.]] = getelementptr inbounds i32, i32 [[A:%.*]], i64 [[INDVARS_IV]]
	; OzVEC-NEXT: store i32 [[ADD]], i32* [[ARRAYIDX2]], align 4			; OzVEC-NEXT: store i32 [[ADD]], i32* [[ARRAYIDX2]], align 4
	; OzVEC-NEXT: [[INDVARS_IV_NEXT]] = add nuw nsw i64 [[INDVARS_IV]], 1			; OzVEC-NEXT: [[INDVARS_IV_NEXT]] = add nuw nsw i64 [[INDVARS_IV]], 1
	; OzVEC-NEXT: [[EXITCOND:%.*]] = icmp eq i64 [[INDVARS_IV_NEXT]], 48			; OzVEC-NEXT: [[EXITCOND:%.*]] = icmp eq i64 [[INDVARS_IV]], 47
	; OzVEC-NEXT: br i1 [[EXITCOND]], label [[FOR_END:%.*]], label [[FOR_BODY]], !llvm.loop !0			; OzVEC-NEXT: br i1 [[EXITCOND]], label [[FOR_END:%.*]], label [[FOR_BODY]], !llvm.loop !0
	; OzVEC: for.end:			; OzVEC: for.end:
	; OzVEC-NEXT: [[TMP1:%.]] = load i32, i32 [[A]], align 4			; OzVEC-NEXT: [[TMP1:%.]] = load i32, i32 [[A]], align 4
	; OzVEC-NEXT: ret i32 [[TMP1]]			; OzVEC-NEXT: ret i32 [[TMP1]]
	;			;
	; O1VEC2-LABEL: @disabled(			; O1VEC2-LABEL: @disabled(
	; O1VEC2-NEXT: entry:			; O1VEC2-NEXT: entry:
	; O1VEC2-NEXT: br label [[FOR_BODY:%.*]]			; O1VEC2-NEXT: br label [[FOR_BODY:%.*]]
	; O1VEC2: for.body:			; O1VEC2: for.body:
	; O1VEC2-NEXT: [[INDVARS_IV:%.]] = phi i64 [ 0, [[ENTRY:%.]] ], [ [[INDVARS_IV_NEXT:%.*]], [[FOR_BODY]] ]			; O1VEC2-NEXT: [[INDVARS_IV:%.]] = phi i64 [ 0, [[ENTRY:%.]] ], [ [[INDVARS_IV_NEXT:%.*]], [[FOR_BODY]] ]
	; O1VEC2-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds i32, i32 [[B:%.*]], i64 [[INDVARS_IV]]			; O1VEC2-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds i32, i32 [[B:%.*]], i64 [[INDVARS_IV]]
	; O1VEC2-NEXT: [[TMP0:%.]] = load i32, i32 [[ARRAYIDX]], align 4			; O1VEC2-NEXT: [[TMP0:%.]] = load i32, i32 [[ARRAYIDX]], align 4
	; O1VEC2-NEXT: [[ADD:%.]] = add nsw i32 [[TMP0]], [[N:%.]]			; O1VEC2-NEXT: [[ADD:%.]] = add nsw i32 [[TMP0]], [[N:%.]]
	; O1VEC2-NEXT: [[ARRAYIDX2:%.]] = getelementptr inbounds i32, i32 [[A:%.*]], i64 [[INDVARS_IV]]			; O1VEC2-NEXT: [[ARRAYIDX2:%.]] = getelementptr inbounds i32, i32 [[A:%.*]], i64 [[INDVARS_IV]]
	; O1VEC2-NEXT: store i32 [[ADD]], i32* [[ARRAYIDX2]], align 4			; O1VEC2-NEXT: store i32 [[ADD]], i32* [[ARRAYIDX2]], align 4
	; O1VEC2-NEXT: [[INDVARS_IV_NEXT]] = add nuw nsw i64 [[INDVARS_IV]], 1			; O1VEC2-NEXT: [[INDVARS_IV_NEXT]] = add nuw nsw i64 [[INDVARS_IV]], 1
	; O1VEC2-NEXT: [[EXITCOND:%.*]] = icmp eq i64 [[INDVARS_IV_NEXT]], 48			; O1VEC2-NEXT: [[EXITCOND:%.*]] = icmp eq i64 [[INDVARS_IV]], 47
	; O1VEC2-NEXT: br i1 [[EXITCOND]], label [[FOR_END:%.*]], label [[FOR_BODY]], !llvm.loop !4			; O1VEC2-NEXT: br i1 [[EXITCOND]], label [[FOR_END:%.*]], label [[FOR_BODY]], !llvm.loop !4
	; O1VEC2: for.end:			; O1VEC2: for.end:
	; O1VEC2-NEXT: [[TMP1:%.]] = load i32, i32 [[A]], align 4			; O1VEC2-NEXT: [[TMP1:%.]] = load i32, i32 [[A]], align 4
	; O1VEC2-NEXT: ret i32 [[TMP1]]			; O1VEC2-NEXT: ret i32 [[TMP1]]
	;			;
	; OzVEC2-LABEL: @disabled(			; OzVEC2-LABEL: @disabled(
	; OzVEC2-NEXT: entry:			; OzVEC2-NEXT: entry:
	; OzVEC2-NEXT: br label [[FOR_BODY:%.*]]			; OzVEC2-NEXT: br label [[FOR_BODY:%.*]]
	; OzVEC2: for.body:			; OzVEC2: for.body:
	; OzVEC2-NEXT: [[INDVARS_IV:%.]] = phi i64 [ 0, [[ENTRY:%.]] ], [ [[INDVARS_IV_NEXT:%.*]], [[FOR_BODY]] ]			; OzVEC2-NEXT: [[INDVARS_IV:%.]] = phi i64 [ 0, [[ENTRY:%.]] ], [ [[INDVARS_IV_NEXT:%.*]], [[FOR_BODY]] ]
	; OzVEC2-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds i32, i32 [[B:%.*]], i64 [[INDVARS_IV]]			; OzVEC2-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds i32, i32 [[B:%.*]], i64 [[INDVARS_IV]]
	; OzVEC2-NEXT: [[TMP0:%.]] = load i32, i32 [[ARRAYIDX]], align 4			; OzVEC2-NEXT: [[TMP0:%.]] = load i32, i32 [[ARRAYIDX]], align 4
	; OzVEC2-NEXT: [[ADD:%.]] = add nsw i32 [[TMP0]], [[N:%.]]			; OzVEC2-NEXT: [[ADD:%.]] = add nsw i32 [[TMP0]], [[N:%.]]
	; OzVEC2-NEXT: [[ARRAYIDX2:%.]] = getelementptr inbounds i32, i32 [[A:%.*]], i64 [[INDVARS_IV]]			; OzVEC2-NEXT: [[ARRAYIDX2:%.]] = getelementptr inbounds i32, i32 [[A:%.*]], i64 [[INDVARS_IV]]
	; OzVEC2-NEXT: store i32 [[ADD]], i32* [[ARRAYIDX2]], align 4			; OzVEC2-NEXT: store i32 [[ADD]], i32* [[ARRAYIDX2]], align 4
	; OzVEC2-NEXT: [[INDVARS_IV_NEXT]] = add nuw nsw i64 [[INDVARS_IV]], 1			; OzVEC2-NEXT: [[INDVARS_IV_NEXT]] = add nuw nsw i64 [[INDVARS_IV]], 1
	; OzVEC2-NEXT: [[EXITCOND:%.*]] = icmp eq i64 [[INDVARS_IV_NEXT]], 48			; OzVEC2-NEXT: [[EXITCOND:%.*]] = icmp eq i64 [[INDVARS_IV]], 47
	; OzVEC2-NEXT: br i1 [[EXITCOND]], label [[FOR_END:%.*]], label [[FOR_BODY]], !llvm.loop !4			; OzVEC2-NEXT: br i1 [[EXITCOND]], label [[FOR_END:%.*]], label [[FOR_BODY]], !llvm.loop !4
	; OzVEC2: for.end:			; OzVEC2: for.end:
	; OzVEC2-NEXT: [[TMP1:%.]] = load i32, i32 [[A]], align 4			; OzVEC2-NEXT: [[TMP1:%.]] = load i32, i32 [[A]], align 4
	; OzVEC2-NEXT: ret i32 [[TMP1]]			; OzVEC2-NEXT: ret i32 [[TMP1]]
	;			;
	; O3DIS-LABEL: @disabled(			; O3DIS-LABEL: @disabled(
	; O3DIS-NEXT: entry:			; O3DIS-NEXT: entry:
	; O3DIS-NEXT: br label [[FOR_BODY:%.*]]			; O3DIS-NEXT: br label [[FOR_BODY:%.*]]
	; O3DIS: for.body:			; O3DIS: for.body:
	; O3DIS-NEXT: [[INDVARS_IV:%.]] = phi i64 [ 0, [[ENTRY:%.]] ], [ [[INDVARS_IV_NEXT:%.*]], [[FOR_BODY]] ]			; O3DIS-NEXT: [[INDVARS_IV:%.]] = phi i64 [ 0, [[ENTRY:%.]] ], [ [[INDVARS_IV_NEXT:%.*]], [[FOR_BODY]] ]
	; O3DIS-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds i32, i32 [[B:%.*]], i64 [[INDVARS_IV]]			; O3DIS-NEXT: [[ARRAYIDX:%.]] = getelementptr inbounds i32, i32 [[B:%.*]], i64 [[INDVARS_IV]]
	; O3DIS-NEXT: [[TMP0:%.]] = load i32, i32 [[ARRAYIDX]], align 4			; O3DIS-NEXT: [[TMP0:%.]] = load i32, i32 [[ARRAYIDX]], align 4
	; O3DIS-NEXT: [[ADD:%.]] = add nsw i32 [[TMP0]], [[N:%.]]			; O3DIS-NEXT: [[ADD:%.]] = add nsw i32 [[TMP0]], [[N:%.]]
	; O3DIS-NEXT: [[ARRAYIDX2:%.]] = getelementptr inbounds i32, i32 [[A:%.*]], i64 [[INDVARS_IV]]			; O3DIS-NEXT: [[ARRAYIDX2:%.]] = getelementptr inbounds i32, i32 [[A:%.*]], i64 [[INDVARS_IV]]
	; O3DIS-NEXT: store i32 [[ADD]], i32* [[ARRAYIDX2]], align 4			; O3DIS-NEXT: store i32 [[ADD]], i32* [[ARRAYIDX2]], align 4
	; O3DIS-NEXT: [[INDVARS_IV_NEXT]] = add nuw nsw i64 [[INDVARS_IV]], 1			; O3DIS-NEXT: [[INDVARS_IV_NEXT]] = add nuw nsw i64 [[INDVARS_IV]], 1
	; O3DIS-NEXT: [[EXITCOND:%.*]] = icmp eq i64 [[INDVARS_IV_NEXT]], 48			; O3DIS-NEXT: [[EXITCOND:%.*]] = icmp eq i64 [[INDVARS_IV]], 47
	; O3DIS-NEXT: br i1 [[EXITCOND]], label [[FOR_END:%.*]], label [[FOR_BODY]], !llvm.loop !0			; O3DIS-NEXT: br i1 [[EXITCOND]], label [[FOR_END:%.*]], label [[FOR_BODY]], !llvm.loop !0
	; O3DIS: for.end:			; O3DIS: for.end:
	; O3DIS-NEXT: [[TMP1:%.]] = load i32, i32 [[A]], align 4			; O3DIS-NEXT: [[TMP1:%.]] = load i32, i32 [[A]], align 4
	; O3DIS-NEXT: ret i32 [[TMP1]]			; O3DIS-NEXT: ret i32 [[TMP1]]
	;			;
	entry:			entry:
	br label %for.body			br label %for.body

	Show All 20 Lines

llvm/test/Transforms/LoopVectorize/X86/small-size.ll

	Show All 33 Lines
	; CHECK-NEXT: [[TMP3:%.]] = getelementptr inbounds [2048 x i32], [2048 x i32] @c, i64 0, i64 [[INDEX]]			; CHECK-NEXT: [[TMP3:%.]] = getelementptr inbounds [2048 x i32], [2048 x i32] @c, i64 0, i64 [[INDEX]]
	; CHECK-NEXT: [[TMP4:%.]] = bitcast i32 [[TMP3]] to <4 x i32>*			; CHECK-NEXT: [[TMP4:%.]] = bitcast i32 [[TMP3]] to <4 x i32>*
	; CHECK-NEXT: [[WIDE_LOAD1:%.]] = load <4 x i32>, <4 x i32> [[TMP4]], align 16			; CHECK-NEXT: [[WIDE_LOAD1:%.]] = load <4 x i32>, <4 x i32> [[TMP4]], align 16
	; CHECK-NEXT: [[TMP5:%.*]] = add nsw <4 x i32> [[WIDE_LOAD1]], [[WIDE_LOAD]]			; CHECK-NEXT: [[TMP5:%.*]] = add nsw <4 x i32> [[WIDE_LOAD1]], [[WIDE_LOAD]]
	; CHECK-NEXT: [[TMP6:%.]] = getelementptr inbounds [2048 x i32], [2048 x i32] @a, i64 0, i64 [[INDEX]]			; CHECK-NEXT: [[TMP6:%.]] = getelementptr inbounds [2048 x i32], [2048 x i32] @a, i64 0, i64 [[INDEX]]
	; CHECK-NEXT: [[TMP7:%.]] = bitcast i32 [[TMP6]] to <4 x i32>*			; CHECK-NEXT: [[TMP7:%.]] = bitcast i32 [[TMP6]] to <4 x i32>*
	; CHECK-NEXT: store <4 x i32> [[TMP5]], <4 x i32>* [[TMP7]], align 16			; CHECK-NEXT: store <4 x i32> [[TMP5]], <4 x i32>* [[TMP7]], align 16
	; CHECK-NEXT: [[INDEX_NEXT]] = add i64 [[INDEX]], 4			; CHECK-NEXT: [[INDEX_NEXT]] = add i64 [[INDEX]], 4
	; CHECK-NEXT: [[TMP8:%.*]] = icmp eq i64 [[INDEX_NEXT]], 256			; CHECK-NEXT: [[TMP8:%.*]] = icmp eq i64 [[INDEX]], 252
	; CHECK-NEXT: br i1 [[TMP8]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop !0			; CHECK-NEXT: br i1 [[TMP8]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop !0
	; CHECK: middle.block:			; CHECK: middle.block:
	; CHECK-NEXT: br i1 true, label [[TMP10:%.*]], label [[SCALAR_PH]]			; CHECK-NEXT: br i1 true, label [[TMP10:%.*]], label [[SCALAR_PH]]
	; CHECK: scalar.ph:			; CHECK: scalar.ph:
	; CHECK-NEXT: br label [[TMP9:%.*]]			; CHECK-NEXT: br label [[TMP9:%.*]]
	; CHECK: br i1 undef, label [[TMP10]], label [[TMP9]], !llvm.loop !2			; CHECK: br i1 undef, label [[TMP10]], label [[TMP9]], !llvm.loop !2
	; CHECK: ret void			; CHECK: ret void
	;			;
	▲ Show 20 Lines • Show All 182 Lines • ▼ Show 20 Lines
	; CHECK-NEXT: [[NEXT_GEP4:%.]] = getelementptr i32, i32 [[DST:%.*]], i64 [[INDEX]]			; CHECK-NEXT: [[NEXT_GEP4:%.]] = getelementptr i32, i32 [[DST:%.*]], i64 [[INDEX]]
	; CHECK-NEXT: [[TMP1:%.]] = bitcast i16 [[NEXT_GEP]] to <4 x i16>*			; CHECK-NEXT: [[TMP1:%.]] = bitcast i16 [[NEXT_GEP]] to <4 x i16>*
	; CHECK-NEXT: [[WIDE_LOAD:%.]] = load <4 x i16>, <4 x i16> [[TMP1]], align 2			; CHECK-NEXT: [[WIDE_LOAD:%.]] = load <4 x i16>, <4 x i16> [[TMP1]], align 2
	; CHECK-NEXT: [[TMP2:%.*]] = zext <4 x i16> [[WIDE_LOAD]] to <4 x i32>			; CHECK-NEXT: [[TMP2:%.*]] = zext <4 x i16> [[WIDE_LOAD]] to <4 x i32>
	; CHECK-NEXT: [[TMP3:%.*]] = shl nuw nsw <4 x i32> [[TMP2]], <i32 7, i32 7, i32 7, i32 7>			; CHECK-NEXT: [[TMP3:%.*]] = shl nuw nsw <4 x i32> [[TMP2]], <i32 7, i32 7, i32 7, i32 7>
	; CHECK-NEXT: [[TMP4:%.]] = bitcast i32 [[NEXT_GEP4]] to <4 x i32>*			; CHECK-NEXT: [[TMP4:%.]] = bitcast i32 [[NEXT_GEP4]] to <4 x i32>*
	; CHECK-NEXT: store <4 x i32> [[TMP3]], <4 x i32>* [[TMP4]], align 4			; CHECK-NEXT: store <4 x i32> [[TMP3]], <4 x i32>* [[TMP4]], align 4
	; CHECK-NEXT: [[INDEX_NEXT]] = add i64 [[INDEX]], 4			; CHECK-NEXT: [[INDEX_NEXT]] = add i64 [[INDEX]], 4
	; CHECK-NEXT: [[TMP5:%.*]] = icmp eq i64 [[INDEX_NEXT]], 256			; CHECK-NEXT: [[TMP5:%.*]] = icmp eq i64 [[INDEX]], 252
	; CHECK-NEXT: br i1 [[TMP5]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop !6			; CHECK-NEXT: br i1 [[TMP5]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop !6
	; CHECK: middle.block:			; CHECK: middle.block:
	; CHECK-NEXT: br i1 true, label [[TMP7:%.*]], label [[SCALAR_PH]]			; CHECK-NEXT: br i1 true, label [[TMP7:%.*]], label [[SCALAR_PH]]
	; CHECK: scalar.ph:			; CHECK: scalar.ph:
	; CHECK-NEXT: br label [[TMP6:%.*]]			; CHECK-NEXT: br label [[TMP6:%.*]]
	; CHECK: br i1 undef, label [[TMP7]], label [[TMP6]], !llvm.loop !7			; CHECK: br i1 undef, label [[TMP7]], label [[TMP6]], !llvm.loop !7
	; CHECK: ret void			; CHECK: ret void
	;			;
	▲ Show 20 Lines • Show All 99 Lines • ▼ Show 20 Lines
	; CHECK-NEXT: [[TMP29:%.*]] = zext i16 [[TMP16]] to i32			; CHECK-NEXT: [[TMP29:%.*]] = zext i16 [[TMP16]] to i32
	; CHECK-NEXT: [[TMP30:%.*]] = shl nuw nsw i32 [[TMP29]], 7			; CHECK-NEXT: [[TMP30:%.*]] = shl nuw nsw i32 [[TMP29]], 7
	; CHECK-NEXT: [[TMP31:%.*]] = or i64 [[INDEX]], 3			; CHECK-NEXT: [[TMP31:%.*]] = or i64 [[INDEX]], 3
	; CHECK-NEXT: [[NEXT_GEP10:%.]] = getelementptr i32, i32 [[DST]], i64 [[TMP31]]			; CHECK-NEXT: [[NEXT_GEP10:%.]] = getelementptr i32, i32 [[DST]], i64 [[TMP31]]
	; CHECK-NEXT: store i32 [[TMP30]], i32* [[NEXT_GEP10]], align 4			; CHECK-NEXT: store i32 [[TMP30]], i32* [[NEXT_GEP10]], align 4
	; CHECK-NEXT: br label [[PRED_STORE_CONTINUE22]]			; CHECK-NEXT: br label [[PRED_STORE_CONTINUE22]]
	; CHECK: pred.store.continue22:			; CHECK: pred.store.continue22:
	; CHECK-NEXT: [[INDEX_NEXT]] = add i64 [[INDEX]], 4			; CHECK-NEXT: [[INDEX_NEXT]] = add i64 [[INDEX]], 4
	; CHECK-NEXT: [[TMP32:%.*]] = icmp eq i64 [[INDEX_NEXT]], 260			; CHECK-NEXT: [[TMP32:%.*]] = icmp eq i64 [[INDEX]], 256
	; CHECK-NEXT: br i1 [[TMP32]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop !8			; CHECK-NEXT: br i1 [[TMP32]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop !8
	; CHECK: middle.block:			; CHECK: middle.block:
	; CHECK-NEXT: br i1 true, label [[TMP34:%.*]], label [[SCALAR_PH]]			; CHECK-NEXT: br i1 true, label [[TMP34:%.*]], label [[SCALAR_PH]]
	; CHECK: scalar.ph:			; CHECK: scalar.ph:
	; CHECK-NEXT: br label [[TMP33:%.*]]			; CHECK-NEXT: br label [[TMP33:%.*]]
	; CHECK: br i1 undef, label [[TMP34]], label [[TMP33]], !llvm.loop !9			; CHECK: br i1 undef, label [[TMP34]], label [[TMP33]], !llvm.loop !9
	; CHECK: ret void			; CHECK: ret void
	;			;
	▲ Show 20 Lines • Show All 45 Lines • Show Last 20 Lines

llvm/test/Transforms/LoopVectorize/X86/x86-interleaved-accesses-masked-group.ll

	Show First 20 Lines • Show All 105 Lines • ▼ Show 20 Lines
	;ENABLED_MASKED_STRIDED-NEXT: [[TMP4:%.*]] = and <16 x i1> [[INTERLEAVED_MASK]], <i1 true, i1 false, i1 true, i1 false, i1 true, i1 false, i1 true, i1 false, i1 true, i1 false, i1 true, i1 false, i1 true, i1 false, i1 true, i1 false>			;ENABLED_MASKED_STRIDED-NEXT: [[TMP4:%.*]] = and <16 x i1> [[INTERLEAVED_MASK]], <i1 true, i1 false, i1 true, i1 false, i1 true, i1 false, i1 true, i1 false, i1 true, i1 false, i1 true, i1 false, i1 true, i1 false, i1 true, i1 false>
	;ENABLED_MASKED_STRIDED-NEXT: [[WIDE_MASKED_VEC:%.]] = call <16 x i8> @llvm.masked.load.v16i8.p0v16i8(<16 x i8> [[TMP3]], i32 1, <16 x i1> [[TMP4]], <16 x i8> undef)			;ENABLED_MASKED_STRIDED-NEXT: [[WIDE_MASKED_VEC:%.]] = call <16 x i8> @llvm.masked.load.v16i8.p0v16i8(<16 x i8> [[TMP3]], i32 1, <16 x i1> [[TMP4]], <16 x i8> undef)
	;ENABLED_MASKED_STRIDED-NEXT: [[STRIDED_VEC:%.*]] = shufflevector <16 x i8> [[WIDE_MASKED_VEC]], <16 x i8> undef, <8 x i32> <i32 0, i32 2, i32 4, i32 6, i32 8, i32 10, i32 12, i32 14>			;ENABLED_MASKED_STRIDED-NEXT: [[STRIDED_VEC:%.*]] = shufflevector <16 x i8> [[WIDE_MASKED_VEC]], <16 x i8> undef, <8 x i32> <i32 0, i32 2, i32 4, i32 6, i32 8, i32 10, i32 12, i32 14>
	;ENABLED_MASKED_STRIDED-NEXT: [[TMP5:%.]] = getelementptr inbounds i8, i8 [[Q:%.*]], i32 [[INDEX]]			;ENABLED_MASKED_STRIDED-NEXT: [[TMP5:%.]] = getelementptr inbounds i8, i8 [[Q:%.*]], i32 [[INDEX]]
	;ENABLED_MASKED_STRIDED-NEXT: [[TMP6:%.]] = bitcast i8 [[TMP5]] to <8 x i8>*			;ENABLED_MASKED_STRIDED-NEXT: [[TMP6:%.]] = bitcast i8 [[TMP5]] to <8 x i8>*
	;ENABLED_MASKED_STRIDED-NEXT: call void @llvm.masked.store.v8i8.p0v8i8(<8 x i8> [[STRIDED_VEC]], <8 x i8>* [[TMP6]], i32 1, <8 x i1> [[TMP0]])			;ENABLED_MASKED_STRIDED-NEXT: call void @llvm.masked.store.v8i8.p0v8i8(<8 x i8> [[STRIDED_VEC]], <8 x i8>* [[TMP6]], i32 1, <8 x i1> [[TMP0]])
	;ENABLED_MASKED_STRIDED-NEXT: [[INDEX_NEXT]] = add i32 [[INDEX]], 8			;ENABLED_MASKED_STRIDED-NEXT: [[INDEX_NEXT]] = add i32 [[INDEX]], 8
	;ENABLED_MASKED_STRIDED-NEXT: [[VEC_IND_NEXT]] = add <8 x i32> [[VEC_IND]], <i32 8, i32 8, i32 8, i32 8, i32 8, i32 8, i32 8, i32 8>			;ENABLED_MASKED_STRIDED-NEXT: [[VEC_IND_NEXT]] = add <8 x i32> [[VEC_IND]], <i32 8, i32 8, i32 8, i32 8, i32 8, i32 8, i32 8, i32 8>
	;ENABLED_MASKED_STRIDED-NEXT: [[TMP7:%.*]] = icmp eq i32 [[INDEX_NEXT]], 1024			;ENABLED_MASKED_STRIDED-NEXT: [[TMP7:%.*]] = icmp eq i32 [[INDEX]], 1016
	;ENABLED_MASKED_STRIDED-NEXT: br i1 [[TMP7]]			;ENABLED_MASKED_STRIDED-NEXT: br i1 [[TMP7]]
	;ENABLED_MASKED_STRIDED-NOT: for.body:			;ENABLED_MASKED_STRIDED-NOT: for.body:
	;ENABLED_MASKED_STRIDED: for.end:			;ENABLED_MASKED_STRIDED: for.end:
	;ENABLED_MASKED_STRIDED-NEXT: ret void			;ENABLED_MASKED_STRIDED-NEXT: ret void


	define dso_local void @masked_strided1_optsize(i8* noalias nocapture readonly %p, i8* noalias nocapture %q, i8 zeroext %guard) local_unnamed_addr optsize {			define dso_local void @masked_strided1_optsize(i8* noalias nocapture readonly %p, i8* noalias nocapture %q, i8 zeroext %guard) local_unnamed_addr optsize {
	entry:			entry:
	▲ Show 20 Lines • Show All 276 Lines • ▼ Show 20 Lines
	;ENABLED_MASKED_STRIDED-NEXT: [[TMP1:%.]] = getelementptr inbounds i8, i8 [[P:%.*]], i32 [[TMP0]]			;ENABLED_MASKED_STRIDED-NEXT: [[TMP1:%.]] = getelementptr inbounds i8, i8 [[P:%.*]], i32 [[TMP0]]
	;ENABLED_MASKED_STRIDED-NEXT: [[TMP2:%.]] = bitcast i8 [[TMP1]] to <16 x i8>*			;ENABLED_MASKED_STRIDED-NEXT: [[TMP2:%.]] = bitcast i8 [[TMP1]] to <16 x i8>*
	;ENABLED_MASKED_STRIDED-NEXT: [[WIDE_MASKED_VEC:%.]] = call <16 x i8> @llvm.masked.load.v16i8.p0v16i8(<16 x i8> [[TMP2]], i32 1, <16 x i1> <i1 true, i1 false, i1 true, i1 false, i1 true, i1 false, i1 true, i1 false, i1 true, i1 false, i1 true, i1 false, i1 true, i1 false, i1 true, i1 false>, <16 x i8> undef)			;ENABLED_MASKED_STRIDED-NEXT: [[WIDE_MASKED_VEC:%.]] = call <16 x i8> @llvm.masked.load.v16i8.p0v16i8(<16 x i8> [[TMP2]], i32 1, <16 x i1> <i1 true, i1 false, i1 true, i1 false, i1 true, i1 false, i1 true, i1 false, i1 true, i1 false, i1 true, i1 false, i1 true, i1 false, i1 true, i1 false>, <16 x i8> undef)
	;ENABLED_MASKED_STRIDED-NEXT: [[STRIDED_VEC:%.*]] = shufflevector <16 x i8> [[WIDE_MASKED_VEC]], <16 x i8> undef, <8 x i32> <i32 0, i32 2, i32 4, i32 6, i32 8, i32 10, i32 12, i32 14>			;ENABLED_MASKED_STRIDED-NEXT: [[STRIDED_VEC:%.*]] = shufflevector <16 x i8> [[WIDE_MASKED_VEC]], <16 x i8> undef, <8 x i32> <i32 0, i32 2, i32 4, i32 6, i32 8, i32 10, i32 12, i32 14>
	;ENABLED_MASKED_STRIDED-NEXT: [[TMP3:%.]] = getelementptr inbounds i8, i8 [[Q:%.*]], i32 [[INDEX]]			;ENABLED_MASKED_STRIDED-NEXT: [[TMP3:%.]] = getelementptr inbounds i8, i8 [[Q:%.*]], i32 [[INDEX]]
	;ENABLED_MASKED_STRIDED-NEXT: [[TMP4:%.]] = bitcast i8 [[TMP3]] to <8 x i8>*			;ENABLED_MASKED_STRIDED-NEXT: [[TMP4:%.]] = bitcast i8 [[TMP3]] to <8 x i8>*
	;ENABLED_MASKED_STRIDED-NEXT: store <8 x i8> [[STRIDED_VEC]], <8 x i8>* [[TMP4]], align 1			;ENABLED_MASKED_STRIDED-NEXT: store <8 x i8> [[STRIDED_VEC]], <8 x i8>* [[TMP4]], align 1
	;ENABLED_MASKED_STRIDED-NEXT: [[INDEX_NEXT]] = add i32 [[INDEX]], 8			;ENABLED_MASKED_STRIDED-NEXT: [[INDEX_NEXT]] = add i32 [[INDEX]], 8
	;ENABLED_MASKED_STRIDED-NEXT: [[TMP5:%.*]] = icmp eq i32 [[INDEX_NEXT]], 1024			;ENABLED_MASKED_STRIDED-NEXT: [[TMP5:%.*]] = icmp eq i32 [[INDEX]], 1016
	;ENABLED_MASKED_STRIDED-NEXT: br i1 [[TMP5]], label [[FOR_END:%.*]], label [[VECTOR_BODY]]			;ENABLED_MASKED_STRIDED-NEXT: br i1 [[TMP5]], label [[FOR_END:%.*]], label [[VECTOR_BODY]]
	;ENABLED_MASKED_STRIDED-NOT: for.body:			;ENABLED_MASKED_STRIDED-NOT: for.body:
	;ENABLED_MASKED_STRIDED: for.end:			;ENABLED_MASKED_STRIDED: for.end:
	;ENABLED_MASKED_STRIDED-NEXT: ret void			;ENABLED_MASKED_STRIDED-NEXT: ret void


	define dso_local void @unconditional_strided1_optsize(i8* noalias nocapture readonly %p, i8* noalias nocapture %q, i8 zeroext %guard) local_unnamed_addr optsize {			define dso_local void @unconditional_strided1_optsize(i8* noalias nocapture readonly %p, i8* noalias nocapture %q, i8 zeroext %guard) local_unnamed_addr optsize {
	entry:			entry:
	▲ Show 20 Lines • Show All 411 Lines • Show Last 20 Lines

llvm/test/Transforms/LoopVectorize/interleaved-accesses.ll

	Show First 20 Lines • Show All 297 Lines • ▼ Show 20 Lines
	; for (unsigned i = 0; i < 1024; i+=2)			; for (unsigned i = 0; i < 1024; i+=2)
	; B[i/2] = A[i] * 2;			; B[i/2] = A[i] * 2;
	; }			; }

	; CHECK-LABEL: @even_load_static_tc(			; CHECK-LABEL: @even_load_static_tc(
	; CHECK: vector.body:			; CHECK: vector.body:
	; CHECK: %wide.vec = load <8 x i32>, <8 x i32>* %{{.*}}, align 4			; CHECK: %wide.vec = load <8 x i32>, <8 x i32>* %{{.*}}, align 4
	; CHECK: %strided.vec = shufflevector <8 x i32> %wide.vec, <8 x i32> undef, <4 x i32> <i32 0, i32 2, i32 4, i32 6>			; CHECK: %strided.vec = shufflevector <8 x i32> %wide.vec, <8 x i32> undef, <4 x i32> <i32 0, i32 2, i32 4, i32 6>
	; CHECK: icmp eq i64 %index.next, 508			; CHECK: icmp eq i64 %index, 504
	; CHECK: middle.block:			; CHECK: middle.block:
	; CHECK: br i1 false, label %for.cond.cleanup, label %scalar.ph			; CHECK: br i1 false, label %for.cond.cleanup, label %scalar.ph

	define void @even_load_static_tc(i32* noalias nocapture readonly %A, i32* noalias nocapture %B) {			define void @even_load_static_tc(i32* noalias nocapture readonly %A, i32* noalias nocapture %B) {
	entry:			entry:
	br label %for.body			br label %for.body

	for.cond.cleanup: ; preds = %for.body			for.cond.cleanup: ; preds = %for.body
	▲ Show 20 Lines • Show All 607 Lines • Show Last 20 Lines

This is an archive of the discontinued LLVM Phabricator instance.

[InstCombine] remove one-use restriction for icmp+add constant foldAbandonedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 188201

llvm/lib/Transforms/InstCombine/InstCombineCompares.cpp

llvm/test/Transforms/InstCombine/gep-combine-loop-invariant.ll

llvm/test/Transforms/InstCombine/narrow.ll

llvm/test/Transforms/InstCombine/uaddo.ll

llvm/test/Transforms/LoopUnroll/runtime-loop-multiple-exits.ll

llvm/test/Transforms/LoopUnroll/runtime-unroll-remainder.ll

llvm/test/Transforms/LoopVectorize/X86/gather_scatter.ll

llvm/test/Transforms/LoopVectorize/X86/masked_load_store.ll

llvm/test/Transforms/LoopVectorize/X86/metadata-enable.ll

llvm/test/Transforms/LoopVectorize/X86/small-size.ll

llvm/test/Transforms/LoopVectorize/X86/x86-interleaved-accesses-masked-group.ll

llvm/test/Transforms/LoopVectorize/interleaved-accesses.ll

[InstCombine] remove one-use restriction for icmp+add constant fold
AbandonedPublic