This is an archive of the discontinued LLVM Phabricator instance.

Paths

Table of Contentst

-
llvm/
-
lib/Transforms/AggressiveInstCombine/
-
Transforms/
-
AggressiveInstCombine/
1/3
AggressiveInstCombine.cpp
-
test/Transforms/AggressiveInstCombine/
-
Transforms/
-
AggressiveInstCombine/
-
AArch64/
-
or-load.ll
-
X86/
-
or-load.ll

Differential D137201

[AggressiveInstCombine] Handle the insert point of the merged load correctly.
ClosedPublic

Authored by bipmis on Nov 1 2022, 3:12 PM.

Download Raw Diff

Details

Reviewers

dmgreen
spatel
nikic
eaeltsin

Commits

rGe9393789a9fa: [AggressiveInstCombine] Handle the insert point of the merged load correctly.

Summary

This patch updates the load insert point of the merged load in AggressiveInstCombine() as implemeted in
https://reviews.llvm.org/D135137
This is done to handle the reported test breaks.

Diff Detail

Repository: rG LLVM Github Monorepo

Event Timeline

bipmis requested review of this revision.Nov 1 2022, 3:12 PM

bipmis created this revision.

Harbormaster completed remote builds in B195567: Diff 472423.Nov 1 2022, 4:32 PM

asmok-g added a subscriber: asmok-g.Nov 2 2022, 7:14 AM

asbirlea added a subscriber: asbirlea.Nov 2 2022, 11:12 AM

asbirlea added inline comments.

llvm/lib/Transforms/AggressiveInstCombine/AggressiveInstCombine.cpp
755	Is it possible for InsertPoint to be `nullptr` here?

dmgreen mentioned this in D135137: [AggressiveInstCombine] Load merge the reverse load pattern of consecutive loads..Nov 3 2022, 3:02 AM

We found another case, that looks like this where the p3 is read out of order. We are looking into getting that fixed too.

define i32 @loadCombine_4consecutive_badinsert(ptr %p) {
; LE-LABEL: @loadCombine_4consecutive_badinsert(
; LE-NEXT:    [[P3:%.*]] = getelementptr i8, ptr [[P:%.*]], i32 3
; LE-NEXT:    [[L1:%.*]] = load i32, ptr [[P]], align 1
; LE-NEXT:    store i8 0, ptr [[P3]], align 1
; LE-NEXT:    ret i32 [[L1]]
;
  %p1 = getelementptr i8, ptr %p, i32 1
  %p2 = getelementptr i8, ptr %p, i32 2
  %p3 = getelementptr i8, ptr %p, i32 3
  %l2 = load i8, ptr %p1
  store i8 0, ptr %p3, align 1
  %l3 = load i8, ptr %p2
  %l4 = load i8, ptr %p3
  %l1 = load i8, ptr %p

  %e1 = zext i8 %l1 to i32
  %e2 = zext i8 %l2 to i32
  %e3 = zext i8 %l3 to i32
  %e4 = zext i8 %l4 to i32

  %s2 = shl i32 %e2, 8
  %s3 = shl i32 %e3, 16
  %s4 = shl i32 %e4, 24

  %o1 = or i32 %e1, %s2
  %o2 = or i32 %o1, %s3
  %o3 = or i32 %o2, %s4
  ret i32 %o3
}

bipmis mentioned this in D137333: [AggressiveInstCombine] Avoid load merge/widen if stores are present b/w loads.Nov 3 2022, 5:48 AM

Update the patch to handle various corner cases of Alias Analysis by handling the insert point of the load and associated pointer. For 2 loads move the insert point to the one which occurs first. Additionally look for clobber in the merged load when the merged load occurs later.

Harbormaster completed remote builds in B196881: Diff 474234.Nov 9 2022, 7:05 AM

dmgreen added inline comments.Nov 10 2022, 9:03 AM

llvm/lib/Transforms/AggressiveInstCombine/AggressiveInstCombine.cpp
794	If the pointer operand isn't in the same block, is that a problem? If they are in different blocks, and we know all the loads are in the same block, then we know the pointer operand dominates the RootInsert I think. It wont need the moveBefore below.

bipmis added inline comments.Nov 18 2022, 7:52 AM

llvm/lib/Transforms/AggressiveInstCombine/AggressiveInstCombine.cpp
794	Good Point. Will update the patch with this change.

Handle review comments on Load and Load pointer in separate BB's.
@dstuttard Would be good if the patch can be tested with non-Opaque Pointers as well. I have done a sanity test and it should work OK. Thanks.

Harbormaster completed remote builds in B198749: Diff 476842.Nov 21 2022, 2:09 PM

Thanks for the update. This LGTM.

This revision is now accepted and ready to land.Nov 23 2022, 6:45 AM

This revision was landed with ongoing or failed builds.Nov 29 2022, 2:54 AM

Closed by commit rGe9393789a9fa: [AggressiveInstCombine] Handle the insert point of the merged load correctly. (authored by bipmis). · Explain Why

This revision was automatically updated to reflect the committed changes.

bipmis added a commit: rGe9393789a9fa: [AggressiveInstCombine] Handle the insert point of the merged load correctly..

Hi, this patch is creating malformed IR for some cases. Test case here: https://github.com/llvm/llvm-project/issues/62756

Herald added a subscriber: StephenFan. · View Herald TranscriptMay 16 2023, 5:37 PM

In D137201#4348346, @mnadeem wrote:

Hi, this patch is creating malformed IR for some cases. Test case here: https://github.com/llvm/llvm-project/issues/62756

Thanks for reporting. I can see the issue and have fixed it in https://reviews.llvm.org/D150864.
I have not optimised it exclusively in the AggressiveInstCombine Pass because the InstCombine does the same and generates a single GEP for the nested patterns which can be reduced. This is then Load merged by the AggressiveInstCombine.

Revision Contents

Path

Size

llvm/

lib/

Transforms/

AggressiveInstCombine/

AggressiveInstCombine.cpp

46 lines

test/

Transforms/

AggressiveInstCombine/

AArch64/

or-load.ll

136 lines

X86/

or-load.ll

218 lines

Diff 478498

llvm/lib/Transforms/AggressiveInstCombine/AggressiveInstCombine.cpp

Show First 20 Lines • Show All 604 Lines • ▼ Show 20 Lines	static bool tryToRecognizeTableBasedCttz(Instruction &I) {
return true;		return true;
}		}

/// This is used by foldLoadsRecursive() to capture a Root Load node which is		/// This is used by foldLoadsRecursive() to capture a Root Load node which is
/// of type or(load, load) and recursively build the wide load. Also capture the		/// of type or(load, load) and recursively build the wide load. Also capture the
/// shift amount, zero extend type and loadSize.		/// shift amount, zero extend type and loadSize.
struct LoadOps {		struct LoadOps {
LoadInst *Root = nullptr;		LoadInst *Root = nullptr;
		LoadInst *RootInsert = nullptr;
bool FoundRoot = false;		bool FoundRoot = false;
uint64_t LoadSize = 0;		uint64_t LoadSize = 0;
Value *Shift = nullptr;		Value *Shift = nullptr;
Type *ZextType;		Type *ZextType;
AAMDNodes AATags;		AAMDNodes AATags;
};		};

// Identify and Merge consecutive loads recursively which is of the form		// Identify and Merge consecutive loads recursively which is of the form
▲ Show 20 Lines • Show All 49 Lines • ▼ Show 20 Lines	Load1Ptr =
/* AllowNonInbounds */ true);		/* AllowNonInbounds */ true);

Value *Load2Ptr = LI2->getPointerOperand();		Value *Load2Ptr = LI2->getPointerOperand();
APInt Offset2(DL.getIndexTypeSizeInBits(Load2Ptr->getType()), 0);		APInt Offset2(DL.getIndexTypeSizeInBits(Load2Ptr->getType()), 0);
Load2Ptr =		Load2Ptr =
Load2Ptr->stripAndAccumulateConstantOffsets(DL, Offset2,		Load2Ptr->stripAndAccumulateConstantOffsets(DL, Offset2,
/* AllowNonInbounds */ true);		/* AllowNonInbounds */ true);

// Make sure Load with lower Offset is at LI1
bool Reverse = false;
if (Offset2.slt(Offset1)) {
std::swap(LI1, LI2);
std::swap(ShAmt1, ShAmt2);
std::swap(Offset1, Offset2);
std::swap(Load1Ptr, Load2Ptr);
Reverse = true;
}

// Verify if both loads have same base pointers and load sizes are same.		// Verify if both loads have same base pointers and load sizes are same.
uint64_t LoadSize1 = LI1->getType()->getPrimitiveSizeInBits();		uint64_t LoadSize1 = LI1->getType()->getPrimitiveSizeInBits();
uint64_t LoadSize2 = LI2->getType()->getPrimitiveSizeInBits();		uint64_t LoadSize2 = LI2->getType()->getPrimitiveSizeInBits();
if (Load1Ptr != Load2Ptr \|\| LoadSize1 != LoadSize2)		if (Load1Ptr != Load2Ptr \|\| LoadSize1 != LoadSize2)
return false;		return false;

// Support Loadsizes greater or equal to 8bits and only power of 2.		// Support Loadsizes greater or equal to 8bits and only power of 2.
if (LoadSize1 < 8 \|\| !isPowerOf2_64(LoadSize1))		if (LoadSize1 < 8 \|\| !isPowerOf2_64(LoadSize1))
return false;		return false;

// TODO: Alias Analysis to check for stores b/w the loads.		// Alias Analysis to check for stores b/w the loads.
// Currently bail out if there are stores b/w the loads.		LoadInst Start = LOps.FoundRoot ? LOps.RootInsert : LI1, End = LI2;
LoadInst Start = LI1, End = LI2;		MemoryLocation Loc;
if (!LI1->comesBefore(LI2))		if (!Start->comesBefore(End)) {
std::swap(Start, End);		std::swap(Start, End);
		Loc = MemoryLocation::get(End);
		if (LOps.FoundRoot)
		Loc = Loc.getWithNewSize(LOps.LoadSize);
		} else
		Loc = MemoryLocation::get(End);
unsigned NumScanned = 0;		unsigned NumScanned = 0;
for (Instruction &Inst :		for (Instruction &Inst :
make_range(Start->getIterator(), End->getIterator())) {		make_range(Start->getIterator(), End->getIterator())) {
if (Inst.mayWriteToMemory())		if (Inst.mayWriteToMemory() && isModSet(AA.getModRefInfo(&Inst, Loc)))
return false;		return false;
if (++NumScanned > MaxInstrsToScan)		if (++NumScanned > MaxInstrsToScan)
return false;		return false;
}		}

		// Make sure Load with lower Offset is at LI1
		bool Reverse = false;
		if (Offset2.slt(Offset1)) {
		std::swap(LI1, LI2);
		std::swap(ShAmt1, ShAmt2);
		std::swap(Offset1, Offset2);
		std::swap(Load1Ptr, Load2Ptr);
		std::swap(LoadSize1, LoadSize2);
		Reverse = true;
		}

// Big endian swap the shifts		// Big endian swap the shifts
if (IsBigEndian)		if (IsBigEndian)
std::swap(ShAmt1, ShAmt2);		std::swap(ShAmt1, ShAmt2);

// Find Shifts values.		// Find Shifts values.
const APInt *Temp;		const APInt *Temp;
uint64_t Shift1 = 0, Shift2 = 0;		uint64_t Shift1 = 0, Shift2 = 0;
if (ShAmt1 && match(ShAmt1, m_APInt(Temp)))		if (ShAmt1 && match(ShAmt1, m_APInt(Temp)))
Show All 20 Lines	static bool foldLoadsRecursive(Value *V, LoadOps &LOps, const DataLayout &DL,

// Update LOps		// Update LOps
AAMDNodes AATags1 = LOps.AATags;		AAMDNodes AATags1 = LOps.AATags;
AAMDNodes AATags2 = LI2->getAAMetadata();		AAMDNodes AATags2 = LI2->getAAMetadata();
if (LOps.FoundRoot == false) {		if (LOps.FoundRoot == false) {
LOps.FoundRoot = true;		LOps.FoundRoot = true;
AATags1 = LI1->getAAMetadata();		AATags1 = LI1->getAAMetadata();
}		}
LOps.LoadSize = LoadSize1 + LoadSize2;		LOps.LoadSize = LoadSize1 + LoadSize2;
		asbirleaUnsubmitted Not Done Reply Inline Actions Is it possible for InsertPoint to be `nullptr` here? asbirlea: Is it possible for InsertPoint to be `nullptr` here?
		LOps.RootInsert = Start;

// Concatenate the AATags of the Merged Loads.		// Concatenate the AATags of the Merged Loads.
LOps.AATags = AATags1.concat(AATags2);		LOps.AATags = AATags1.concat(AATags2);

LOps.Root = LI1;		LOps.Root = LI1;
LOps.Shift = ShAmt1;		LOps.Shift = ShAmt1;
LOps.ZextType = X->getType();		LOps.ZextType = X->getType();
return true;		return true;
Show All 19 Lines	static bool foldConsecutiveLoads(Instruction &I, const DataLayout &DL,

unsigned AS = LI1->getPointerAddressSpace();		unsigned AS = LI1->getPointerAddressSpace();
unsigned Fast = 0;		unsigned Fast = 0;
Allowed = TTI.allowsMisalignedMemoryAccesses(I.getContext(), LOps.LoadSize,		Allowed = TTI.allowsMisalignedMemoryAccesses(I.getContext(), LOps.LoadSize,
AS, LI1->getAlign(), &Fast);		AS, LI1->getAlign(), &Fast);
if (!Allowed \|\| !Fast)		if (!Allowed \|\| !Fast)
return false;		return false;

		// Make sure the Load pointer of type GEP/non-GEP is above insert point
		Instruction *Inst = dyn_cast<Instruction>(LI1->getPointerOperand());
		if (Inst && Inst->getParent() == LI1->getParent() &&
		dmgreenUnsubmitted Not Done Reply Inline Actions If the pointer operand isn't in the same block, is that a problem? If they are in different blocks, and we know all the loads are in the same block, then we know the pointer operand dominates the RootInsert I think. It wont need the moveBefore below. dmgreen: If the pointer operand isn't in the same block, is that a problem? If they are in different…
		bipmisAuthorUnsubmitted Done Reply Inline Actions Good Point. Will update the patch with this change. bipmis: Good Point. Will update the patch with this change.
		!Inst->comesBefore(LOps.RootInsert))
		Inst->moveBefore(LOps.RootInsert);

// New load can be generated		// New load can be generated
Value *Load1Ptr = LI1->getPointerOperand();		Value *Load1Ptr = LI1->getPointerOperand();
Builder.SetInsertPoint(LI1);		Builder.SetInsertPoint(LOps.RootInsert);
Value *NewPtr = Builder.CreateBitCast(Load1Ptr, WiderType->getPointerTo(AS));		Value *NewPtr = Builder.CreateBitCast(Load1Ptr, WiderType->getPointerTo(AS));
NewLoad = Builder.CreateAlignedLoad(WiderType, NewPtr, LI1->getAlign(),		NewLoad = Builder.CreateAlignedLoad(WiderType, NewPtr, LI1->getAlign(),
LI1->isVolatile(), "");		LI1->isVolatile(), "");
NewLoad->takeName(LI1);		NewLoad->takeName(LI1);
// Set the New Load AATags Metadata.		// Set the New Load AATags Metadata.
if (LOps.AATags)		if (LOps.AATags)
NewLoad->setAAMetadata(LOps.AATags);		NewLoad->setAAMetadata(LOps.AATags);

▲ Show 20 Lines • Show All 84 Lines • Show Last 20 Lines

llvm/test/Transforms/AggressiveInstCombine/AArch64/or-load.ll

Show First 20 Lines • Show All 136 Lines • ▼ Show 20 Lines	;

%o1 = or i32 %s1, %s2		%o1 = or i32 %s1, %s2
%o2 = or i32 %o1, %s3		%o2 = or i32 %o1, %s3
%o3 = or i32 %o2, %e4		%o3 = or i32 %o2, %e4
ret i32 %o3		ret i32 %o3
}		}

define i32 @loadCombine_4consecutive_alias(ptr %p) {		define i32 @loadCombine_4consecutive_alias(ptr %p) {
; ALL-LABEL: @loadCombine_4consecutive_alias(		; LE-LABEL: @loadCombine_4consecutive_alias(
; ALL-NEXT: [[P1:%.]] = getelementptr i8, ptr [[P:%.]], i32 1		; LE-NEXT: [[L1:%.]] = load i32, ptr [[P:%.]], align 1
; ALL-NEXT: [[P2:%.*]] = getelementptr i8, ptr [[P]], i32 2		; LE-NEXT: store i8 10, ptr [[P]], align 1
; ALL-NEXT: [[P3:%.*]] = getelementptr i8, ptr [[P]], i32 3		; LE-NEXT: ret i32 [[L1]]
; ALL-NEXT: [[L1:%.*]] = load i8, ptr [[P]], align 1		;
; ALL-NEXT: store i8 10, ptr [[P]], align 1		; BE-LABEL: @loadCombine_4consecutive_alias(
; ALL-NEXT: [[L2:%.*]] = load i8, ptr [[P1]], align 1		; BE-NEXT: [[P1:%.]] = getelementptr i8, ptr [[P:%.]], i32 1
; ALL-NEXT: [[L3:%.*]] = load i8, ptr [[P2]], align 1		; BE-NEXT: [[P2:%.*]] = getelementptr i8, ptr [[P]], i32 2
; ALL-NEXT: [[L4:%.*]] = load i8, ptr [[P3]], align 1		; BE-NEXT: [[P3:%.*]] = getelementptr i8, ptr [[P]], i32 3
; ALL-NEXT: [[E1:%.*]] = zext i8 [[L1]] to i32		; BE-NEXT: [[L1:%.*]] = load i8, ptr [[P]], align 1
; ALL-NEXT: [[E2:%.*]] = zext i8 [[L2]] to i32		; BE-NEXT: store i8 10, ptr [[P]], align 1
; ALL-NEXT: [[E3:%.*]] = zext i8 [[L3]] to i32		; BE-NEXT: [[L2:%.*]] = load i8, ptr [[P1]], align 1
; ALL-NEXT: [[E4:%.*]] = zext i8 [[L4]] to i32		; BE-NEXT: [[L3:%.*]] = load i8, ptr [[P2]], align 1
; ALL-NEXT: [[S2:%.*]] = shl i32 [[E2]], 8		; BE-NEXT: [[L4:%.*]] = load i8, ptr [[P3]], align 1
; ALL-NEXT: [[S3:%.*]] = shl i32 [[E3]], 16		; BE-NEXT: [[E1:%.*]] = zext i8 [[L1]] to i32
; ALL-NEXT: [[S4:%.*]] = shl i32 [[E4]], 24		; BE-NEXT: [[E2:%.*]] = zext i8 [[L2]] to i32
; ALL-NEXT: [[O1:%.*]] = or i32 [[E1]], [[S2]]		; BE-NEXT: [[E3:%.*]] = zext i8 [[L3]] to i32
; ALL-NEXT: [[O2:%.*]] = or i32 [[O1]], [[S3]]		; BE-NEXT: [[E4:%.*]] = zext i8 [[L4]] to i32
; ALL-NEXT: [[O3:%.*]] = or i32 [[O2]], [[S4]]		; BE-NEXT: [[S2:%.*]] = shl i32 [[E2]], 8
; ALL-NEXT: ret i32 [[O3]]		; BE-NEXT: [[S3:%.*]] = shl i32 [[E3]], 16
		; BE-NEXT: [[S4:%.*]] = shl i32 [[E4]], 24
		; BE-NEXT: [[O1:%.*]] = or i32 [[E1]], [[S2]]
		; BE-NEXT: [[O2:%.*]] = or i32 [[O1]], [[S3]]
		; BE-NEXT: [[O3:%.*]] = or i32 [[O2]], [[S4]]
		; BE-NEXT: ret i32 [[O3]]
;		;
%p1 = getelementptr i8, ptr %p, i32 1		%p1 = getelementptr i8, ptr %p, i32 1
%p2 = getelementptr i8, ptr %p, i32 2		%p2 = getelementptr i8, ptr %p, i32 2
%p3 = getelementptr i8, ptr %p, i32 3		%p3 = getelementptr i8, ptr %p, i32 3
%l1 = load i8, ptr %p		%l1 = load i8, ptr %p
store i8 10, i8* %p		store i8 10, i8* %p
%l2 = load i8, ptr %p1		%l2 = load i8, ptr %p1
%l3 = load i8, ptr %p2		%l3 = load i8, ptr %p2
Show All 10 Lines	;

%o1 = or i32 %e1, %s2		%o1 = or i32 %e1, %s2
%o2 = or i32 %o1, %s3		%o2 = or i32 %o1, %s3
%o3 = or i32 %o2, %s4		%o3 = or i32 %o2, %s4
ret i32 %o3		ret i32 %o3
}		}

define i32 @loadCombine_4consecutive_alias_BE(ptr %p) {		define i32 @loadCombine_4consecutive_alias_BE(ptr %p) {
; ALL-LABEL: @loadCombine_4consecutive_alias_BE(		; LE-LABEL: @loadCombine_4consecutive_alias_BE(
; ALL-NEXT: [[P1:%.]] = getelementptr i8, ptr [[P:%.]], i32 1		; LE-NEXT: [[P1:%.]] = getelementptr i8, ptr [[P:%.]], i32 1
; ALL-NEXT: [[P2:%.*]] = getelementptr i8, ptr [[P]], i32 2		; LE-NEXT: [[P2:%.*]] = getelementptr i8, ptr [[P]], i32 2
; ALL-NEXT: [[P3:%.*]] = getelementptr i8, ptr [[P]], i32 3		; LE-NEXT: [[P3:%.*]] = getelementptr i8, ptr [[P]], i32 3
; ALL-NEXT: [[L1:%.*]] = load i8, ptr [[P]], align 1		; LE-NEXT: [[L1:%.*]] = load i8, ptr [[P]], align 1
; ALL-NEXT: store i8 10, ptr [[P]], align 1		; LE-NEXT: store i8 10, ptr [[P]], align 1
; ALL-NEXT: [[L2:%.*]] = load i8, ptr [[P1]], align 1		; LE-NEXT: [[L2:%.*]] = load i8, ptr [[P1]], align 1
; ALL-NEXT: [[L3:%.*]] = load i8, ptr [[P2]], align 1		; LE-NEXT: [[L3:%.*]] = load i8, ptr [[P2]], align 1
; ALL-NEXT: [[L4:%.*]] = load i8, ptr [[P3]], align 1		; LE-NEXT: [[L4:%.*]] = load i8, ptr [[P3]], align 1
; ALL-NEXT: [[E1:%.*]] = zext i8 [[L1]] to i32		; LE-NEXT: [[E1:%.*]] = zext i8 [[L1]] to i32
; ALL-NEXT: [[E2:%.*]] = zext i8 [[L2]] to i32		; LE-NEXT: [[E2:%.*]] = zext i8 [[L2]] to i32
; ALL-NEXT: [[E3:%.*]] = zext i8 [[L3]] to i32		; LE-NEXT: [[E3:%.*]] = zext i8 [[L3]] to i32
; ALL-NEXT: [[E4:%.*]] = zext i8 [[L4]] to i32		; LE-NEXT: [[E4:%.*]] = zext i8 [[L4]] to i32
; ALL-NEXT: [[S1:%.*]] = shl i32 [[E1]], 24		; LE-NEXT: [[S1:%.*]] = shl i32 [[E1]], 24
; ALL-NEXT: [[S2:%.*]] = shl i32 [[E2]], 16		; LE-NEXT: [[S2:%.*]] = shl i32 [[E2]], 16
; ALL-NEXT: [[S3:%.*]] = shl i32 [[E3]], 8		; LE-NEXT: [[S3:%.*]] = shl i32 [[E3]], 8
; ALL-NEXT: [[O1:%.*]] = or i32 [[S1]], [[S2]]		; LE-NEXT: [[O1:%.*]] = or i32 [[S1]], [[S2]]
; ALL-NEXT: [[O2:%.*]] = or i32 [[O1]], [[S3]]		; LE-NEXT: [[O2:%.*]] = or i32 [[O1]], [[S3]]
; ALL-NEXT: [[O3:%.*]] = or i32 [[O2]], [[E4]]		; LE-NEXT: [[O3:%.*]] = or i32 [[O2]], [[E4]]
; ALL-NEXT: ret i32 [[O3]]		; LE-NEXT: ret i32 [[O3]]
		;
		; BE-LABEL: @loadCombine_4consecutive_alias_BE(
		; BE-NEXT: [[L1:%.]] = load i32, ptr [[P:%.]], align 1
		; BE-NEXT: store i8 10, ptr [[P]], align 1
		; BE-NEXT: ret i32 [[L1]]
;		;
%p1 = getelementptr i8, ptr %p, i32 1		%p1 = getelementptr i8, ptr %p, i32 1
%p2 = getelementptr i8, ptr %p, i32 2		%p2 = getelementptr i8, ptr %p, i32 2
%p3 = getelementptr i8, ptr %p, i32 3		%p3 = getelementptr i8, ptr %p, i32 3
%l1 = load i8, ptr %p		%l1 = load i8, ptr %p
store i8 10, i8* %p		store i8 10, i8* %p
%l2 = load i8, ptr %p1		%l2 = load i8, ptr %p1
%l3 = load i8, ptr %p2		%l3 = load i8, ptr %p2
▲ Show 20 Lines • Show All 1,536 Lines • ▼ Show 20 Lines	;
%e1 = zext i8 %l1 to i16		%e1 = zext i8 %l1 to i16
%e2 = zext i8 %l2 to i16		%e2 = zext i8 %l2 to i16
%s2 = shl i16 %e2, 8		%s2 = shl i16 %e2, 8
%o1 = or i16 %e1, %s2		%o1 = or i16 %e1, %s2
ret i16 %o1		ret i16 %o1
}		}

define i32 @loadCombine_4consecutive_badinsert(ptr %p) {		define i32 @loadCombine_4consecutive_badinsert(ptr %p) {
; ALL-LABEL: @loadCombine_4consecutive_badinsert(		; LE-LABEL: @loadCombine_4consecutive_badinsert(
; ALL-NEXT: [[P1:%.]] = getelementptr i8, ptr [[P:%.]], i32 1		; LE-NEXT: [[P1:%.]] = getelementptr i8, ptr [[P:%.]], i32 1
; ALL-NEXT: [[P2:%.*]] = getelementptr i8, ptr [[P]], i32 2		; LE-NEXT: [[L1:%.*]] = load i32, ptr [[P]], align 1
; ALL-NEXT: [[P3:%.*]] = getelementptr i8, ptr [[P]], i32 3		; LE-NEXT: store i8 0, ptr [[P1]], align 1
; ALL-NEXT: [[L2:%.*]] = load i8, ptr [[P1]], align 1		; LE-NEXT: ret i32 [[L1]]
; ALL-NEXT: [[L3:%.*]] = load i8, ptr [[P2]], align 1		;
; ALL-NEXT: store i8 0, ptr [[P1]], align 1		; BE-LABEL: @loadCombine_4consecutive_badinsert(
; ALL-NEXT: [[L4:%.*]] = load i8, ptr [[P3]], align 1		; BE-NEXT: [[P1:%.]] = getelementptr i8, ptr [[P:%.]], i32 1
; ALL-NEXT: [[L1:%.*]] = load i8, ptr [[P]], align 1		; BE-NEXT: [[P2:%.*]] = getelementptr i8, ptr [[P]], i32 2
; ALL-NEXT: [[E1:%.*]] = zext i8 [[L1]] to i32		; BE-NEXT: [[P3:%.*]] = getelementptr i8, ptr [[P]], i32 3
; ALL-NEXT: [[E2:%.*]] = zext i8 [[L2]] to i32		; BE-NEXT: [[L2:%.*]] = load i8, ptr [[P1]], align 1
; ALL-NEXT: [[E3:%.*]] = zext i8 [[L3]] to i32		; BE-NEXT: [[L3:%.*]] = load i8, ptr [[P2]], align 1
; ALL-NEXT: [[E4:%.*]] = zext i8 [[L4]] to i32		; BE-NEXT: store i8 0, ptr [[P1]], align 1
; ALL-NEXT: [[S2:%.*]] = shl i32 [[E2]], 8		; BE-NEXT: [[L4:%.*]] = load i8, ptr [[P3]], align 1
; ALL-NEXT: [[S3:%.*]] = shl i32 [[E3]], 16		; BE-NEXT: [[L1:%.*]] = load i8, ptr [[P]], align 1
; ALL-NEXT: [[S4:%.*]] = shl i32 [[E4]], 24		; BE-NEXT: [[E1:%.*]] = zext i8 [[L1]] to i32
; ALL-NEXT: [[O1:%.*]] = or i32 [[E1]], [[S2]]		; BE-NEXT: [[E2:%.*]] = zext i8 [[L2]] to i32
; ALL-NEXT: [[O2:%.*]] = or i32 [[O1]], [[S3]]		; BE-NEXT: [[E3:%.*]] = zext i8 [[L3]] to i32
; ALL-NEXT: [[O3:%.*]] = or i32 [[O2]], [[S4]]		; BE-NEXT: [[E4:%.*]] = zext i8 [[L4]] to i32
; ALL-NEXT: ret i32 [[O3]]		; BE-NEXT: [[S2:%.*]] = shl i32 [[E2]], 8
		; BE-NEXT: [[S3:%.*]] = shl i32 [[E3]], 16
		; BE-NEXT: [[S4:%.*]] = shl i32 [[E4]], 24
		; BE-NEXT: [[O1:%.*]] = or i32 [[E1]], [[S2]]
		; BE-NEXT: [[O2:%.*]] = or i32 [[O1]], [[S3]]
		; BE-NEXT: [[O3:%.*]] = or i32 [[O2]], [[S4]]
		; BE-NEXT: ret i32 [[O3]]
;		;
%p1 = getelementptr i8, ptr %p, i32 1		%p1 = getelementptr i8, ptr %p, i32 1
%p2 = getelementptr i8, ptr %p, i32 2		%p2 = getelementptr i8, ptr %p, i32 2
%p3 = getelementptr i8, ptr %p, i32 3		%p3 = getelementptr i8, ptr %p, i32 3
%l2 = load i8, ptr %p1		%l2 = load i8, ptr %p1
%l3 = load i8, ptr %p2		%l3 = load i8, ptr %p2
store i8 0, ptr %p1, align 1		store i8 0, ptr %p1, align 1
%l4 = load i8, ptr %p3		%l4 = load i8, ptr %p3
▲ Show 20 Lines • Show All 281 Lines • Show Last 20 Lines

llvm/test/Transforms/AggressiveInstCombine/X86/or-load.ll

Show First 20 Lines • Show All 144 Lines • ▼ Show 20 Lines	;

%o1 = or i32 %s1, %s2		%o1 = or i32 %s1, %s2
%o2 = or i32 %o1, %s3		%o2 = or i32 %o1, %s3
%o3 = or i32 %o2, %e4		%o3 = or i32 %o2, %e4
ret i32 %o3		ret i32 %o3
}		}

define i32 @loadCombine_4consecutive_alias(ptr %p) {		define i32 @loadCombine_4consecutive_alias(ptr %p) {
; ALL-LABEL: @loadCombine_4consecutive_alias(		; LE-LABEL: @loadCombine_4consecutive_alias(
; ALL-NEXT: [[P1:%.]] = getelementptr i8, ptr [[P:%.]], i32 1		; LE-NEXT: [[L1:%.]] = load i32, ptr [[P:%.]], align 1
; ALL-NEXT: [[P2:%.*]] = getelementptr i8, ptr [[P]], i32 2		; LE-NEXT: store i8 10, ptr [[P]], align 1
; ALL-NEXT: [[P3:%.*]] = getelementptr i8, ptr [[P]], i32 3		; LE-NEXT: ret i32 [[L1]]
; ALL-NEXT: [[L1:%.*]] = load i8, ptr [[P]], align 1		;
; ALL-NEXT: store i8 10, ptr [[P]], align 1		; BE-LABEL: @loadCombine_4consecutive_alias(
; ALL-NEXT: [[L2:%.*]] = load i8, ptr [[P1]], align 1		; BE-NEXT: [[P1:%.]] = getelementptr i8, ptr [[P:%.]], i32 1
; ALL-NEXT: [[L3:%.*]] = load i8, ptr [[P2]], align 1		; BE-NEXT: [[P2:%.*]] = getelementptr i8, ptr [[P]], i32 2
; ALL-NEXT: [[L4:%.*]] = load i8, ptr [[P3]], align 1		; BE-NEXT: [[P3:%.*]] = getelementptr i8, ptr [[P]], i32 3
; ALL-NEXT: [[E1:%.*]] = zext i8 [[L1]] to i32		; BE-NEXT: [[L1:%.*]] = load i8, ptr [[P]], align 1
; ALL-NEXT: [[E2:%.*]] = zext i8 [[L2]] to i32		; BE-NEXT: store i8 10, ptr [[P]], align 1
; ALL-NEXT: [[E3:%.*]] = zext i8 [[L3]] to i32		; BE-NEXT: [[L2:%.*]] = load i8, ptr [[P1]], align 1
; ALL-NEXT: [[E4:%.*]] = zext i8 [[L4]] to i32		; BE-NEXT: [[L3:%.*]] = load i8, ptr [[P2]], align 1
; ALL-NEXT: [[S2:%.*]] = shl i32 [[E2]], 8		; BE-NEXT: [[L4:%.*]] = load i8, ptr [[P3]], align 1
; ALL-NEXT: [[S3:%.*]] = shl i32 [[E3]], 16		; BE-NEXT: [[E1:%.*]] = zext i8 [[L1]] to i32
; ALL-NEXT: [[S4:%.*]] = shl i32 [[E4]], 24		; BE-NEXT: [[E2:%.*]] = zext i8 [[L2]] to i32
; ALL-NEXT: [[O1:%.*]] = or i32 [[E1]], [[S2]]		; BE-NEXT: [[E3:%.*]] = zext i8 [[L3]] to i32
; ALL-NEXT: [[O2:%.*]] = or i32 [[O1]], [[S3]]		; BE-NEXT: [[E4:%.*]] = zext i8 [[L4]] to i32
; ALL-NEXT: [[O3:%.*]] = or i32 [[O2]], [[S4]]		; BE-NEXT: [[S2:%.*]] = shl i32 [[E2]], 8
; ALL-NEXT: ret i32 [[O3]]		; BE-NEXT: [[S3:%.*]] = shl i32 [[E3]], 16
		; BE-NEXT: [[S4:%.*]] = shl i32 [[E4]], 24
		; BE-NEXT: [[O1:%.*]] = or i32 [[E1]], [[S2]]
		; BE-NEXT: [[O2:%.*]] = or i32 [[O1]], [[S3]]
		; BE-NEXT: [[O3:%.*]] = or i32 [[O2]], [[S4]]
		; BE-NEXT: ret i32 [[O3]]
;		;
%p1 = getelementptr i8, ptr %p, i32 1		%p1 = getelementptr i8, ptr %p, i32 1
%p2 = getelementptr i8, ptr %p, i32 2		%p2 = getelementptr i8, ptr %p, i32 2
%p3 = getelementptr i8, ptr %p, i32 3		%p3 = getelementptr i8, ptr %p, i32 3
%l1 = load i8, ptr %p		%l1 = load i8, ptr %p
store i8 10, i8* %p		store i8 10, i8* %p
%l2 = load i8, ptr %p1		%l2 = load i8, ptr %p1
%l3 = load i8, ptr %p2		%l3 = load i8, ptr %p2
Show All 10 Lines	;

%o1 = or i32 %e1, %s2		%o1 = or i32 %e1, %s2
%o2 = or i32 %o1, %s3		%o2 = or i32 %o1, %s3
%o3 = or i32 %o2, %s4		%o3 = or i32 %o2, %s4
ret i32 %o3		ret i32 %o3
}		}

define i32 @loadCombine_4consecutive_alias_BE(ptr %p) {		define i32 @loadCombine_4consecutive_alias_BE(ptr %p) {
; ALL-LABEL: @loadCombine_4consecutive_alias_BE(		; LE-LABEL: @loadCombine_4consecutive_alias_BE(
; ALL-NEXT: [[P1:%.]] = getelementptr i8, ptr [[P:%.]], i32 1		; LE-NEXT: [[P1:%.]] = getelementptr i8, ptr [[P:%.]], i32 1
; ALL-NEXT: [[P2:%.*]] = getelementptr i8, ptr [[P]], i32 2		; LE-NEXT: [[P2:%.*]] = getelementptr i8, ptr [[P]], i32 2
; ALL-NEXT: [[P3:%.*]] = getelementptr i8, ptr [[P]], i32 3		; LE-NEXT: [[P3:%.*]] = getelementptr i8, ptr [[P]], i32 3
; ALL-NEXT: [[L1:%.*]] = load i8, ptr [[P]], align 1		; LE-NEXT: [[L1:%.*]] = load i8, ptr [[P]], align 1
; ALL-NEXT: store i8 10, ptr [[P]], align 1		; LE-NEXT: store i8 10, ptr [[P]], align 1
; ALL-NEXT: [[L2:%.*]] = load i8, ptr [[P1]], align 1		; LE-NEXT: [[L2:%.*]] = load i8, ptr [[P1]], align 1
; ALL-NEXT: [[L3:%.*]] = load i8, ptr [[P2]], align 1		; LE-NEXT: [[L3:%.*]] = load i8, ptr [[P2]], align 1
; ALL-NEXT: [[L4:%.*]] = load i8, ptr [[P3]], align 1		; LE-NEXT: [[L4:%.*]] = load i8, ptr [[P3]], align 1
; ALL-NEXT: [[E1:%.*]] = zext i8 [[L1]] to i32		; LE-NEXT: [[E1:%.*]] = zext i8 [[L1]] to i32
; ALL-NEXT: [[E2:%.*]] = zext i8 [[L2]] to i32		; LE-NEXT: [[E2:%.*]] = zext i8 [[L2]] to i32
; ALL-NEXT: [[E3:%.*]] = zext i8 [[L3]] to i32		; LE-NEXT: [[E3:%.*]] = zext i8 [[L3]] to i32
; ALL-NEXT: [[E4:%.*]] = zext i8 [[L4]] to i32		; LE-NEXT: [[E4:%.*]] = zext i8 [[L4]] to i32
; ALL-NEXT: [[S1:%.*]] = shl i32 [[E1]], 24		; LE-NEXT: [[S1:%.*]] = shl i32 [[E1]], 24
; ALL-NEXT: [[S2:%.*]] = shl i32 [[E2]], 16		; LE-NEXT: [[S2:%.*]] = shl i32 [[E2]], 16
; ALL-NEXT: [[S3:%.*]] = shl i32 [[E3]], 8		; LE-NEXT: [[S3:%.*]] = shl i32 [[E3]], 8
; ALL-NEXT: [[O1:%.*]] = or i32 [[S1]], [[S2]]		; LE-NEXT: [[O1:%.*]] = or i32 [[S1]], [[S2]]
; ALL-NEXT: [[O2:%.*]] = or i32 [[O1]], [[S3]]		; LE-NEXT: [[O2:%.*]] = or i32 [[O1]], [[S3]]
; ALL-NEXT: [[O3:%.*]] = or i32 [[O2]], [[E4]]		; LE-NEXT: [[O3:%.*]] = or i32 [[O2]], [[E4]]
; ALL-NEXT: ret i32 [[O3]]		; LE-NEXT: ret i32 [[O3]]
		;
		; BE-LABEL: @loadCombine_4consecutive_alias_BE(
		; BE-NEXT: [[L1:%.]] = load i32, ptr [[P:%.]], align 1
		; BE-NEXT: store i8 10, ptr [[P]], align 1
		; BE-NEXT: ret i32 [[L1]]
;		;
%p1 = getelementptr i8, ptr %p, i32 1		%p1 = getelementptr i8, ptr %p, i32 1
%p2 = getelementptr i8, ptr %p, i32 2		%p2 = getelementptr i8, ptr %p, i32 2
%p3 = getelementptr i8, ptr %p, i32 3		%p3 = getelementptr i8, ptr %p, i32 3
%l1 = load i8, ptr %p		%l1 = load i8, ptr %p
store i8 10, i8* %p		store i8 10, i8* %p
%l2 = load i8, ptr %p1		%l2 = load i8, ptr %p1
%l3 = load i8, ptr %p2		%l3 = load i8, ptr %p2
▲ Show 20 Lines • Show All 1,619 Lines • ▼ Show 20 Lines	;

%o1 = or i32 %e1, %s2		%o1 = or i32 %e1, %s2
%o2 = or i32 %o1, %s3		%o2 = or i32 %o1, %s3
%o3 = or i32 %o2, %s4		%o3 = or i32 %o2, %s4
ret i32 %o3		ret i32 %o3
}		}

define i16 @loadCombine_2consecutive_badinsert(ptr %p) {		define i16 @loadCombine_2consecutive_badinsert(ptr %p) {
; ALL-LABEL: @loadCombine_2consecutive_badinsert(		; LE-LABEL: @loadCombine_2consecutive_badinsert(
; ALL-NEXT: [[P1:%.]] = getelementptr i8, ptr [[P:%.]], i32 1		; LE-NEXT: [[P1:%.]] = getelementptr i8, ptr [[P:%.]], i32 1
; ALL-NEXT: [[L2:%.*]] = load i8, ptr [[P1]], align 1		; LE-NEXT: [[L1:%.*]] = load i16, ptr [[P]], align 1
; ALL-NEXT: store i8 0, ptr [[P1]], align 1		; LE-NEXT: store i8 0, ptr [[P1]], align 1
; ALL-NEXT: [[L1:%.*]] = load i8, ptr [[P]], align 1		; LE-NEXT: ret i16 [[L1]]
; ALL-NEXT: [[E1:%.*]] = zext i8 [[L1]] to i16		;
; ALL-NEXT: [[E2:%.*]] = zext i8 [[L2]] to i16		; BE-LABEL: @loadCombine_2consecutive_badinsert(
; ALL-NEXT: [[S2:%.*]] = shl i16 [[E2]], 8		; BE-NEXT: [[P1:%.]] = getelementptr i8, ptr [[P:%.]], i32 1
; ALL-NEXT: [[O1:%.*]] = or i16 [[E1]], [[S2]]		; BE-NEXT: [[L2:%.*]] = load i8, ptr [[P1]], align 1
; ALL-NEXT: ret i16 [[O1]]		; BE-NEXT: store i8 0, ptr [[P1]], align 1
		; BE-NEXT: [[L1:%.*]] = load i8, ptr [[P]], align 1
		; BE-NEXT: [[E1:%.*]] = zext i8 [[L1]] to i16
		; BE-NEXT: [[E2:%.*]] = zext i8 [[L2]] to i16
		; BE-NEXT: [[S2:%.*]] = shl i16 [[E2]], 8
		; BE-NEXT: [[O1:%.*]] = or i16 [[E1]], [[S2]]
		; BE-NEXT: ret i16 [[O1]]
;		;
%p1 = getelementptr i8, ptr %p, i32 1		%p1 = getelementptr i8, ptr %p, i32 1
%l2 = load i8, ptr %p1		%l2 = load i8, ptr %p1
store i8 0, ptr %p1, align 1		store i8 0, ptr %p1, align 1
%l1 = load i8, ptr %p		%l1 = load i8, ptr %p
%e1 = zext i8 %l1 to i16		%e1 = zext i8 %l1 to i16
%e2 = zext i8 %l2 to i16		%e2 = zext i8 %l2 to i16
%s2 = shl i16 %e2, 8		%s2 = shl i16 %e2, 8
%o1 = or i16 %e1, %s2		%o1 = or i16 %e1, %s2
ret i16 %o1		ret i16 %o1
}		}

define i32 @loadCombine_4consecutive_badinsert(ptr %p) {		define i32 @loadCombine_4consecutive_badinsert(ptr %p) {
; ALL-LABEL: @loadCombine_4consecutive_badinsert(		; LE-LABEL: @loadCombine_4consecutive_badinsert(
; ALL-NEXT: [[P1:%.]] = getelementptr i8, ptr [[P:%.]], i32 1		; LE-NEXT: [[P1:%.]] = getelementptr i8, ptr [[P:%.]], i32 1
; ALL-NEXT: [[P2:%.*]] = getelementptr i8, ptr [[P]], i32 2		; LE-NEXT: [[L1:%.*]] = load i32, ptr [[P]], align 1
; ALL-NEXT: [[P3:%.*]] = getelementptr i8, ptr [[P]], i32 3		; LE-NEXT: store i8 0, ptr [[P1]], align 1
; ALL-NEXT: [[L2:%.*]] = load i8, ptr [[P1]], align 1		; LE-NEXT: ret i32 [[L1]]
; ALL-NEXT: [[L3:%.*]] = load i8, ptr [[P2]], align 1		;
; ALL-NEXT: store i8 0, ptr [[P1]], align 1		; BE-LABEL: @loadCombine_4consecutive_badinsert(
; ALL-NEXT: [[L4:%.*]] = load i8, ptr [[P3]], align 1		; BE-NEXT: [[P1:%.]] = getelementptr i8, ptr [[P:%.]], i32 1
; ALL-NEXT: [[L1:%.*]] = load i8, ptr [[P]], align 1		; BE-NEXT: [[P2:%.*]] = getelementptr i8, ptr [[P]], i32 2
; ALL-NEXT: [[E1:%.*]] = zext i8 [[L1]] to i32		; BE-NEXT: [[P3:%.*]] = getelementptr i8, ptr [[P]], i32 3
; ALL-NEXT: [[E2:%.*]] = zext i8 [[L2]] to i32		; BE-NEXT: [[L2:%.*]] = load i8, ptr [[P1]], align 1
; ALL-NEXT: [[E3:%.*]] = zext i8 [[L3]] to i32		; BE-NEXT: [[L3:%.*]] = load i8, ptr [[P2]], align 1
; ALL-NEXT: [[E4:%.*]] = zext i8 [[L4]] to i32		; BE-NEXT: store i8 0, ptr [[P1]], align 1
; ALL-NEXT: [[S2:%.*]] = shl i32 [[E2]], 8		; BE-NEXT: [[L4:%.*]] = load i8, ptr [[P3]], align 1
; ALL-NEXT: [[S3:%.*]] = shl i32 [[E3]], 16		; BE-NEXT: [[L1:%.*]] = load i8, ptr [[P]], align 1
; ALL-NEXT: [[S4:%.*]] = shl i32 [[E4]], 24		; BE-NEXT: [[E1:%.*]] = zext i8 [[L1]] to i32
; ALL-NEXT: [[O1:%.*]] = or i32 [[E1]], [[S2]]		; BE-NEXT: [[E2:%.*]] = zext i8 [[L2]] to i32
; ALL-NEXT: [[O2:%.*]] = or i32 [[O1]], [[S3]]		; BE-NEXT: [[E3:%.*]] = zext i8 [[L3]] to i32
; ALL-NEXT: [[O3:%.*]] = or i32 [[O2]], [[S4]]		; BE-NEXT: [[E4:%.*]] = zext i8 [[L4]] to i32
; ALL-NEXT: ret i32 [[O3]]		; BE-NEXT: [[S2:%.*]] = shl i32 [[E2]], 8
		; BE-NEXT: [[S3:%.*]] = shl i32 [[E3]], 16
		; BE-NEXT: [[S4:%.*]] = shl i32 [[E4]], 24
		; BE-NEXT: [[O1:%.*]] = or i32 [[E1]], [[S2]]
		; BE-NEXT: [[O2:%.*]] = or i32 [[O1]], [[S3]]
		; BE-NEXT: [[O3:%.*]] = or i32 [[O2]], [[S4]]
		; BE-NEXT: ret i32 [[O3]]
;		;
%p1 = getelementptr i8, ptr %p, i32 1		%p1 = getelementptr i8, ptr %p, i32 1
%p2 = getelementptr i8, ptr %p, i32 2		%p2 = getelementptr i8, ptr %p, i32 2
%p3 = getelementptr i8, ptr %p, i32 3		%p3 = getelementptr i8, ptr %p, i32 3
%l2 = load i8, ptr %p1		%l2 = load i8, ptr %p1
%l3 = load i8, ptr %p2		%l3 = load i8, ptr %p2
store i8 0, ptr %p1, align 1		store i8 0, ptr %p1, align 1
%l4 = load i8, ptr %p3		%l4 = load i8, ptr %p3
Show All 10 Lines	;

%o1 = or i32 %e1, %s2		%o1 = or i32 %e1, %s2
%o2 = or i32 %o1, %s3		%o2 = or i32 %o1, %s3
%o3 = or i32 %o2, %s4		%o3 = or i32 %o2, %s4
ret i32 %o3		ret i32 %o3
}		}

define i32 @loadCombine_4consecutive_badinsert2(ptr %p) {		define i32 @loadCombine_4consecutive_badinsert2(ptr %p) {
; ALL-LABEL: @loadCombine_4consecutive_badinsert2(		; LE-LABEL: @loadCombine_4consecutive_badinsert2(
; ALL-NEXT: [[P1:%.]] = getelementptr i8, ptr [[P:%.]], i32 1		; LE-NEXT: [[P2:%.]] = getelementptr i8, ptr [[P:%.]], i32 2
; ALL-NEXT: [[P2:%.*]] = getelementptr i8, ptr [[P]], i32 2		; LE-NEXT: [[P3:%.*]] = getelementptr i8, ptr [[P]], i32 3
; ALL-NEXT: [[P3:%.*]] = getelementptr i8, ptr [[P]], i32 3		; LE-NEXT: [[L1:%.*]] = load i16, ptr [[P]], align 1
; ALL-NEXT: [[L2:%.*]] = load i8, ptr [[P1]], align 1		; LE-NEXT: [[TMP1:%.*]] = zext i16 [[L1]] to i32
; ALL-NEXT: store i8 0, ptr [[P3]], align 1		; LE-NEXT: store i8 0, ptr [[P3]], align 1
; ALL-NEXT: [[L3:%.*]] = load i8, ptr [[P2]], align 1		; LE-NEXT: [[L3:%.*]] = load i8, ptr [[P2]], align 1
; ALL-NEXT: [[L4:%.*]] = load i8, ptr [[P3]], align 1		; LE-NEXT: [[L4:%.*]] = load i8, ptr [[P3]], align 1
; ALL-NEXT: [[L1:%.*]] = load i8, ptr [[P]], align 1		; LE-NEXT: [[E3:%.*]] = zext i8 [[L3]] to i32
; ALL-NEXT: [[E1:%.*]] = zext i8 [[L1]] to i32		; LE-NEXT: [[E4:%.*]] = zext i8 [[L4]] to i32
; ALL-NEXT: [[E2:%.*]] = zext i8 [[L2]] to i32		; LE-NEXT: [[S3:%.*]] = shl i32 [[E3]], 16
; ALL-NEXT: [[E3:%.*]] = zext i8 [[L3]] to i32		; LE-NEXT: [[S4:%.*]] = shl i32 [[E4]], 24
; ALL-NEXT: [[E4:%.*]] = zext i8 [[L4]] to i32		; LE-NEXT: [[O2:%.*]] = or i32 [[TMP1]], [[S3]]
; ALL-NEXT: [[S2:%.*]] = shl i32 [[E2]], 8		; LE-NEXT: [[O3:%.*]] = or i32 [[O2]], [[S4]]
; ALL-NEXT: [[S3:%.*]] = shl i32 [[E3]], 16		; LE-NEXT: ret i32 [[O3]]
; ALL-NEXT: [[S4:%.*]] = shl i32 [[E4]], 24		;
; ALL-NEXT: [[O1:%.*]] = or i32 [[E1]], [[S2]]		; BE-LABEL: @loadCombine_4consecutive_badinsert2(
; ALL-NEXT: [[O2:%.*]] = or i32 [[O1]], [[S3]]		; BE-NEXT: [[P1:%.]] = getelementptr i8, ptr [[P:%.]], i32 1
; ALL-NEXT: [[O3:%.*]] = or i32 [[O2]], [[S4]]		; BE-NEXT: [[P2:%.*]] = getelementptr i8, ptr [[P]], i32 2
; ALL-NEXT: ret i32 [[O3]]		; BE-NEXT: [[P3:%.*]] = getelementptr i8, ptr [[P]], i32 3
		; BE-NEXT: [[L2:%.*]] = load i8, ptr [[P1]], align 1
		; BE-NEXT: store i8 0, ptr [[P3]], align 1
		; BE-NEXT: [[L3:%.*]] = load i8, ptr [[P2]], align 1
		; BE-NEXT: [[L4:%.*]] = load i8, ptr [[P3]], align 1
		; BE-NEXT: [[L1:%.*]] = load i8, ptr [[P]], align 1
		; BE-NEXT: [[E1:%.*]] = zext i8 [[L1]] to i32
		; BE-NEXT: [[E2:%.*]] = zext i8 [[L2]] to i32
		; BE-NEXT: [[E3:%.*]] = zext i8 [[L3]] to i32
		; BE-NEXT: [[E4:%.*]] = zext i8 [[L4]] to i32
		; BE-NEXT: [[S2:%.*]] = shl i32 [[E2]], 8
		; BE-NEXT: [[S3:%.*]] = shl i32 [[E3]], 16
		; BE-NEXT: [[S4:%.*]] = shl i32 [[E4]], 24
		; BE-NEXT: [[O1:%.*]] = or i32 [[E1]], [[S2]]
		; BE-NEXT: [[O2:%.*]] = or i32 [[O1]], [[S3]]
		; BE-NEXT: [[O3:%.*]] = or i32 [[O2]], [[S4]]
		; BE-NEXT: ret i32 [[O3]]
;		;
%p1 = getelementptr i8, ptr %p, i32 1		%p1 = getelementptr i8, ptr %p, i32 1
%p2 = getelementptr i8, ptr %p, i32 2		%p2 = getelementptr i8, ptr %p, i32 2
%p3 = getelementptr i8, ptr %p, i32 3		%p3 = getelementptr i8, ptr %p, i32 3
%l2 = load i8, ptr %p1		%l2 = load i8, ptr %p1
store i8 0, ptr %p3, align 1		store i8 0, ptr %p3, align 1
%l3 = load i8, ptr %p2		%l3 = load i8, ptr %p2
%l4 = load i8, ptr %p3		%l4 = load i8, ptr %p3
▲ Show 20 Lines • Show All 267 Lines • Show Last 20 Lines