This is an archive of the discontinued LLVM Phabricator instance.

Paths

Table of Contentst

-
llvm/
-
lib/Target/PowerPC/
-
Target/
-
PowerPC/
31/41
PPCISelDAGToDAG.cpp
-
test/CodeGen/PowerPC/
-
CodeGen/
-
PowerPC/
-
aix-cc-abi.ll
1/3
arr-fp-arg-no-copy.ll
-
bperm.ll
-
combine_ext_trunc.ll
-
constants-i64.ll
-
f128-fma.ll
-
f128-passByValue.ll
-
fast-isel-pcrel.ll
-
fp-strict-f128.ll
-
fp-to-int-to-fp.ll
-
fp128-bitcast-after-operation.ll
-
funnel-shift.ll
-
memCmpUsedInZeroEqualityComparison.ll
-
negctr.ll
-
ori_imm32.ll
-
ori_imm64.ll
-
pr43976.ll
-
pr45448.ll
-
rematerializable-instruction-machine-licm.ll
-
sms-grp-order.ll
-
srem-vector-lkk.ll
-
tailcall-speculatable-callee.ll
1/2
unaligned-addressing-mode.ll
-
urem-vector-lkk.ll

Differential D92089

[PowerPC] Materialize i64 constants by enumerated patterns.
ClosedPublic

Authored by Esme on Nov 25 2020, 3:21 AM.

Download Raw Diff

Details

Reviewers

jsji
steven.zhang
nemanjai
shchenz
hfinkel
qiucf
lkail
stefanp

Group Reviewers

Restricted Project

Commits

rG29eb3dcfe628: [PowerPC] Materialize i64 constants by enumerated patterns.

Summary

Some constants can be handled with less instructions than our current results. And it seems our original approach is not very easy to extend. Therefore this patch proposes to materialize all 64-bit constants by enumerated patterns.

I traversed almost all constants to verified the functionality of these pattens. A traversed comparison of the number of instructions used by the original method and the new method has also been completed, where no degradation was caused by this patch. This patch also passed Bootstrap test and SPEC test.

Improvements of this patch are shown in llvm/test/CodeGen/PowerPC/constants-i64.ll

Diff Detail

Repository: rG LLVM Github Monorepo

Event Timeline

Esme created this revision.Nov 25 2020, 3:21 AM

Herald added a project: Restricted Project. · View Herald TranscriptNov 25 2020, 3:21 AM

Herald added subscribers: llvm-commits, asbirlea, kbarton, hiraditya. · View Herald Transcript

Esme requested review of this revision.Nov 25 2020, 3:21 AM

Esme updated this revision to Diff 307572.Nov 25 2020, 3:33 AM

Harbormaster completed remote builds in B80077: Diff 307563.Nov 25 2020, 3:42 AM

Harbormaster completed remote builds in B80079: Diff 307572.Nov 25 2020, 3:46 AM

laytonio added a subscriber: laytonio.Nov 25 2020, 8:08 AM

Esme mentioned this in D88539: [PowerPC] Handle the constant with many trailing ones..Nov 25 2020, 6:03 PM

Esme mentioned this in D88538: [PowerPC] Materialize the immediate that is Uint32 but not Int32..

I think, this patch overrall looks great as it simplify our logic of the instruction selection for i64 imm. Please update the check with isS[U]Int<>() to make the code more clear. And I assume that, you have run the bmk and bootstrap with this patch.

llvm/lib/Target/PowerPC/PPCISelDAGToDAG.cpp
803	It should be static at least. And please add necessary documentation on the semantics for this function.
813	I prefer to use reference for the InstrCnt and if for the case that we don't need it, just pass a dummy cnt.
835	Is it more clear to use isInt<N>() ?
841	Is it more clear to use: TZ > 15 && isInt<16>(Imm >> 16) ?

Added more comments and made some minor changes.

Harbormaster completed remote builds in B80905: Diff 309141.Dec 2 2020, 9:53 PM

In D92089#2427656, @steven.zhang wrote:

I think, this patch overrall looks great as it simplify our logic of the instruction selection for i64 imm. Please update the check with isS[U]Int<>() to make the code more clear. And I assume that, you have run the bmk and bootstrap with this patch.

Thanks for your review. Yes I agree it would be much more readable to define patterns with isS[U]Int<>(). But it's hard to present all patterns by this way. Sorry that I didn't update the check. More documentations were added, and I hope it made the code more clear.

Some coding style comments.

llvm/lib/Target/PowerPC/PPCISelDAGToDAG.cpp
803	Please use C++ comment style: //
809	It makes more sense to me to have int findContiguousZerosAtLeast(Imm, Num). And you can check it like this: if ((Shift=findContiguousZerosAtLeast(Imm, 49)) \|\| (Shift = ...))
820	The ByPattern here is a bit confusing. How about selectSimpleI64Imm() ?
837	Use C++ comment style.
859	ImmHi16 ?
860	Opcode is ok as you don't know if it is LIS or LI.
861	The logic here is not quite right. If the High 16 bits of the Imm is zero, you still produce the LI which is not needed.
879	How about if LZ == 48 ?
880	Some comments on bit pattern changed during these two instructions are needed to help understand what you are trying to do.
888	Again, you need some comments to indicate that, you are trying to leverage the sign extend of LI to make them as ones, then, rotate and clear it.
893	The implementation is not align with the comments.
903	There is rotate routines for you to do this.
983	It is more clean to have code like this: if (SDNode Result = ...) { If (InstCnt) InstCnt = ... return Result; }
998	++InstCntDirect
2047	Add the assertion here to make sure that, the return value from selectI64Imm is not nullptr.
2276–2281	NumOfInstrs?

Added more documentations.

Esme marked 3 inline comments as done.Dec 6 2020, 7:06 PM

Esme added inline comments.

llvm/lib/Target/PowerPC/PPCISelDAGToDAG.cpp
861	The logic here is not quite right. If the High 16 bits of the Imm is zero, you still produce the LI which is not needed. Consider an immediate which is uint<16> but not int<16>, where the High 16 bits is zero but we can't use a single `LI` to handle it. For example 0x8003, we have to use 2 instructions to materialize it, i.e. li 3, 0 ori 3, 3, 32771

Harbormaster completed remote builds in B81241: Diff 309802.Dec 6 2020, 7:46 PM

steven.zhang mentioned this in D92879: [PowerPC] Materialize 34 bit constants with pli on Power 10..Dec 8 2020, 5:38 PM

I see most of the benefit is from llvm/test/CodeGen/PowerPC/constants-i64.ll. Does the benefit come from the same pattern or several ? And you'd better visit all the f64 and compare the new algorithm with old to make sure that, there is no deg.

llvm/lib/Target/PowerPC/PPCISelDAGToDAG.cpp
806	So, why do we need this assertion ?
868	You can use SLDI if the TZ and LZ meet some requirement. A better idea is to fix it in InstAlias.
llvm/test/CodeGen/PowerPC/arr-fp-arg-no-copy.ll
15	Some follow up to fix the missing instr aliasing for rldic -> sldi ?

jsji added inline comments.Dec 8 2020, 7:39 PM

llvm/test/CodeGen/PowerPC/arr-fp-arg-no-copy.ll
15	See https://reviews.llvm.org/D81819

In D92089#2441712, @steven.zhang wrote:

I see most of the benefit is from llvm/test/CodeGen/PowerPC/constants-i64.ll. Does the benefit come from the same pattern or several ? And you'd better visit all the f64 and compare the new algorithm with old to make sure that, there is no deg.

Thanks for reviews! The benefit come from several patterns and I compared the results by sampling traversal to make sure there is no deg. Since visiting all the i64 is very time consuming, I took 2^12/2^16/2^17 unique numbers for each interval (i.g. take 2^17 unique numbers from 2^62 ~ 2^63).

llvm/test/CodeGen/PowerPC/arr-fp-arg-no-copy.ll
15	See https://reviews.llvm.org/D81819 Thanks! I have commandeered this patch to myself, I will follow it up ASAP.

Esme added inline comments.Dec 9 2020, 12:54 AM

llvm/lib/Target/PowerPC/PPCISelDAGToDAG.cpp
806	So, why do we need this assertion ? This function only works for 32 < Num < 64. As for other Nums, we will get an incorrect result. Perhaps we should change the assertion to a `return 0`?
868	You can use SLDI if the TZ and LZ meet some requirement. A better idea is to fix it in InstAlias. RLDIC was chosen over RLDICR because RLDIC can cover more patterns than RLDICR, even though RLDICR can be transformed to SLDI in InstAlias. I prefer to add InstAlias for RLDIC as a follow-up work.
903	There is rotate routines for you to do this. I know we have `APInt APInt::rotr(unsigned rotateAmt)` for rotation right, but it's not convenient enough since I have to transform `uint64_t Imm` to `APInt`. Is there any other rotation routines?

steven.zhang added inline comments.Dec 9 2020, 2:30 AM

llvm/lib/Target/PowerPC/PPCISelDAGToDAG.cpp
806	The semantics for this function is to get the pos of the Num at least consecutive zeros across Hi32 and Lo32. Otherwise, return zero. Is it right ? So, I am confused about the incorrect result you mean.
903	In fact, you can declare the Imm as APInt and it will make the bit operation more easy. But it is up to you.

Esme added inline comments.Dec 9 2020, 6:27 AM

llvm/lib/Target/PowerPC/PPCISelDAGToDAG.cpp
806	If an immediate have Num (which is less than 32) consecutive zeros across Hi32 and Lo32 we will return the pos, but if all of these consecutive zeros are within Lo32/Hi32, we will return 0. I assumed this is not a correct result. Well, after reconsidering I think it's OK to have no assertion. I will remove it in the next update. Thanks!

Thank you for pointing me to this patch.

I've taken a look but other than a handful of nits this looks good.

llvm/lib/Target/PowerPC/PPCISelDAGToDAG.cpp
835	I agree. I think it would be clearer if you used `isInt<16>(Imm)`.
852	Same goes here: `isInt<32>(Imm)`
1015	nit: So if `ImmHi16 == 0` we still add: LI8 <reg>, 0 ORI8 <reg>, <reg>, (RotImm & 0xffff) Why does it matter whether or not that first instruction is LIS8 or LI8? The two instructions will do the same thing if you feed them zero.
llvm/test/CodeGen/PowerPC/unaligned-addressing-mode.ll
86	Question: Why does this test change?

Esme added inline comments.Dec 10 2020, 4:44 AM

llvm/lib/Target/PowerPC/PPCISelDAGToDAG.cpp
835	Yes I agree with you, but it's hard to express all the patterns with `isInt<N>()`. In order to unify the expression of the patterns, I am very sorry that I did not modify them. I added some documentations and hope that's helpful.
1015	Thanks for reviews! Yes, there is actually no difference between `LI 0` and `LIS 0`. I chose LI over LIS, just to avoid a fair amount of changes from `LI 0` to `LIS 0` in the .ll files, since we preferred `LI 0` in the legacy code.
llvm/test/CodeGen/PowerPC/unaligned-addressing-mode.ll
86	Sorry I didn't notice this, I will have a look into it.

Thank you for the explanations!
I'm fine with keeping the if conditions looking similar and avoiding too many test changes.

I have one more question related to the patterns.

llvm/lib/Target/PowerPC/PPCISelDAGToDAG.cpp
900	One more question: Isn't this the pattern above just a subset of this one? if ((LZ + TO) > 48) { ... } if ((LZ + FO + TO) > 48) { ... } They both use only two instructions to materialize the constant. If you delete the first one the second one will also catch all of those cases and be the same number of instructions.

Esme added inline comments.Dec 10 2020, 7:18 PM

llvm/lib/Target/PowerPC/PPCISelDAGToDAG.cpp

900

One more question: Isn't this the pattern above just a subset of this one?
if ((LZ + TO) > 48) {
 ...
}

if ((LZ + FO + TO) > 48) {
  ...
}
They both use only two instructions to materialize the constant. If you delete the first one the second one will also catch all of those cases and be the same number of instructions.

They are similar but different :D The patterns are very tricky indeed. Hope the following sketches can make you clear.
First one (LZ + TO) > 48

// +--LZ--||-15-bit-||--TO--+     +-------------|--16-bit--+
// |00000001bbbbbbbbb1111111| ->  |00000000000001bbbbbbbbb1|
// +------------------------+     +------------------------+
// 63                      0      63                      0
//          Imm                   (Imm >> (48 - LZ) & 0xffff)
// +----sext-----|--16-bit--+     +clear-|-----------------+
// |11111111111111bbbbbbbbb1| ->  |00000001bbbbbbbbb1111111|
// +------------------------+     +------------------------+
// 63                      0      63                      0
// LI8 : sext many leading zeros   RLDICL : rotate left (48 - LZ), clear left LZ

Second one (LZ + FO + TO) > 48 (I will add this in next update)

// +-LZ-FO||-15-bit-||--TO--+     +-------------|--16-bit--+
// |00011110bbbbbbbbb1111111| ->  |000000000011110bbbbbbbbb|
// +------------------------+     +------------------------+
// 63                      0      63                      0
//            Imm                    (Imm >> TO) & 0xffff
// +----sext-----|--16-bit--+     +LZ|---------------------+
// |111111111111110bbbbbbbbb| ->  |00011110bbbbbbbbb1111111|
// +------------------------+     +------------------------+
// 63                      0      63                      0
// LI8 : sext many leading zeros   RLDICL : rotate left TO, clear left LZ

Assume we use the second pattern to handle the first case :

// +--LZ--||-15-bit-||--TO--+     +--------------|-15-bit--+
// |00000001bbbbbbbbb1111111| ->  |000000000000001bbbbbbbbb|
// +------------------------+     +------------------------+
// 63                      0      63                      0
//         Imm                       (Imm >> TO) & 0xffff)
// +----sext------|-15-bit--+     +------------------------+
// |000000000000001bbbbbbbbb| ->  |00000001bbbbbbbbb0000000|
// +------------------------+     +------------------------+
// 63                      0      63                      0
// LI : no leading ones             incorrect result :(

stefanp added inline comments.Dec 11 2020, 7:56 AM

llvm/lib/Target/PowerPC/PPCISelDAGToDAG.cpp
900	I see! You don't get the sign extend that you need in that case. Thank you for the explanation.

Updated documentations.

Harbormaster completed remote builds in B82180: Diff 311443.Dec 13 2020, 7:27 AM

stefanp added a child revision: D92879: [PowerPC] Materialize 34 bit constants with pli on Power 10..Dec 15 2020, 7:34 AM

Replaced some checks by isInt<>().

Harbormaster completed remote builds in B82563: Diff 312083.Dec 15 2020, 6:09 PM

Esme marked 5 inline comments as done.Dec 15 2020, 6:13 PM

Esme added inline comments.

llvm/lib/Target/PowerPC/PPCISelDAGToDAG.cpp
841	The case with the pattern of `{ones}{15-bit valve}{16 zeros}` does not equal to `TZ > 15 && isInt<16>(Imm >> 16)`.

LGTM now. But please hold on for several days to see if Stepfan or others have more comments.

This revision is now accepted and ready to land.Dec 15 2020, 6:37 PM

Minor nit to be addressed upon commit. Thx!

llvm/lib/Target/PowerPC/PPCISelDAGToDAG.cpp
803	nit: sentences should end with a '.'
804	nit: Complete sentence please. All sentences should start with a capital.

I do not have any more questions.
Thank you for refactoring this. It looks a lot cleaner.
LGTM.

Esme added inline comments.Dec 19 2020, 1:54 AM

llvm/lib/Target/PowerPC/PPCISelDAGToDAG.cpp
804	These two lines are the same sentence. I will check all sentences before committing. Thanks for reminding!

This revision was landed with ongoing or failed builds.Dec 20 2020, 9:22 PM

Closed by commit rG29eb3dcfe628: [PowerPC] Materialize i64 constants by enumerated patterns. (authored by Esme). · Explain Why

This revision was automatically updated to reflect the committed changes.

Esme added a commit: rG29eb3dcfe628: [PowerPC] Materialize i64 constants by enumerated patterns..

Revision Contents

Path

Size

llvm/

lib/

Target/

PowerPC/

PPCISelDAGToDAG.cpp

455 lines

test/

CodeGen/

PowerPC/

aix-cc-abi.ll

2 lines

arr-fp-arg-no-copy.ll

4 lines

26 lines

11 lines

145 lines

8 lines

4 lines

6 lines

6 lines

8 lines

fp128-bitcast-after-operation.ll

12 lines

funnel-shift.ll

12 lines

memCmpUsedInZeroEqualityComparison.ll

8 lines

7 lines

2 lines

9 lines

2 lines

5 lines

rematerializable-instruction-machine-licm.ll

147 lines

sms-grp-order.ll

36 lines

srem-vector-lkk.ll

72 lines

tailcall-speculatable-callee.ll

6 lines

unaligned-addressing-mode.ll

5 lines

urem-vector-lkk.ll

56 lines

Diff 307572

llvm/lib/Target/PowerPC/PPCISelDAGToDAG.cpp

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 737 Lines • ▼ Show 20 Lines	if (isRunOfOnes(InsertMask, MB, ME)) {
getI32Imm(ME, dl) };		getI32Imm(ME, dl) };
ReplaceNode(N, CurDAG->getMachineNode(PPC::RLWIMI, dl, MVT::i32, Ops));		ReplaceNode(N, CurDAG->getMachineNode(PPC::RLWIMI, dl, MVT::i32, Ops));
return true;		return true;
}		}
}		}
return false;		return false;
}		}

// Predict the number of instructions that would be generated by calling
// selectI64Imm(N).
static unsigned selectI64ImmInstrCountDirect(int64_t Imm) {
// Assume no remaining bits.
unsigned Remainder = 0;
// Assume no shift required.
unsigned Shift = 0;

// If it can't be represented as a 32 bit value.
if (!isInt<32>(Imm)) {
Shift = countTrailingZeros<uint64_t>(Imm);
int64_t ImmSh = static_cast<uint64_t>(Imm) >> Shift;

// If the shifted value fits 32 bits.
if (isInt<32>(ImmSh)) {
// Go with the shifted value.
Imm = ImmSh;
} else {
// Still stuck with a 64 bit value.
Remainder = Imm;
Shift = 32;
Imm >>= 32;
}
}

// Intermediate operand.
unsigned Result = 0;

// Handle first 32 bits.
unsigned Lo = Imm & 0xFFFF;

// Simple value.
if (isInt<16>(Imm)) {
// Just the Lo bits.
++Result;
} else if (Lo) {
// Handle the Hi bits and Lo bits.
Result += 2;
} else {
// Just the Hi bits.
++Result;
}

// If no shift, we're done.
if (!Shift) return Result;

// If Hi word == Lo word,
// we can use rldimi to insert the Lo word into Hi word.
if ((unsigned)(Imm & 0xFFFFFFFF) == Remainder) {
++Result;
return Result;
}

// Shift for next step if the upper 32-bits were not zero.
if (Imm)
++Result;

// Add in the last bits as required.
if ((Remainder >> 16) & 0xFFFF)
++Result;
if (Remainder & 0xFFFF)
++Result;

return Result;
}

static uint64_t Rot64(uint64_t Imm, unsigned R) {
return (Imm << R) \| (Imm >> (64 - R));
}

static unsigned selectI64ImmInstrCount(int64_t Imm) {
unsigned Count = selectI64ImmInstrCountDirect(Imm);

// If the instruction count is 1 or 2, we do not need further analysis
// since rotate + load constant requires at least 2 instructions.
if (Count <= 2)
return Count;

for (unsigned r = 1; r < 63; ++r) {
uint64_t RImm = Rot64(Imm, r);
unsigned RCount = selectI64ImmInstrCountDirect(RImm) + 1;
Count = std::min(Count, RCount);

// See comments in selectI64Imm for an explanation of the logic below.
unsigned LS = findLastSet(RImm);
if (LS != r-1)
continue;

uint64_t OnesMask = -(int64_t) (UINT64_C(1) << (LS+1));
uint64_t RImmWithOnes = RImm \| OnesMask;

RCount = selectI64ImmInstrCountDirect(RImmWithOnes) + 1;
Count = std::min(Count, RCount);
}

return Count;
}

// Select a 64-bit constant. For cost-modeling purposes, selectI64ImmInstrCount
// (above) needs to be kept in sync with this function.
static SDNode selectI64ImmDirect(SelectionDAG CurDAG, const SDLoc &dl,
int64_t Imm) {
// Assume no remaining bits.
unsigned Remainder = 0;
// Assume no shift required.
unsigned Shift = 0;

// If it can't be represented as a 32 bit value.
if (!isInt<32>(Imm)) {
Shift = countTrailingZeros<uint64_t>(Imm);
int64_t ImmSh = static_cast<uint64_t>(Imm) >> Shift;

// If the shifted value fits 32 bits.
if (isInt<32>(ImmSh)) {
// Go with the shifted value.
Imm = ImmSh;
} else {
// Still stuck with a 64 bit value.
Remainder = Imm;
Shift = 32;
Imm >>= 32;
}
}

// Intermediate operand.
SDNode *Result;

// Handle first 32 bits.
unsigned Lo = Imm & 0xFFFF;
unsigned Hi = (Imm >> 16) & 0xFFFF;

auto getI32Imm = [CurDAG, dl](unsigned Imm) {
return CurDAG->getTargetConstant(Imm, dl, MVT::i32);
};

// Simple value.
if (isInt<16>(Imm)) {
uint64_t SextImm = SignExtend64(Lo, 16);
SDValue SDImm = CurDAG->getTargetConstant(SextImm, dl, MVT::i64);
// Just the Lo bits.
Result = CurDAG->getMachineNode(PPC::LI8, dl, MVT::i64, SDImm);
} else if (Lo) {
// Handle the Hi bits.
unsigned OpC = Hi ? PPC::LIS8 : PPC::LI8;
Result = CurDAG->getMachineNode(OpC, dl, MVT::i64, getI32Imm(Hi));
// And Lo bits.
Result = CurDAG->getMachineNode(PPC::ORI8, dl, MVT::i64,
SDValue(Result, 0), getI32Imm(Lo));
} else {
// Just the Hi bits.
Result = CurDAG->getMachineNode(PPC::LIS8, dl, MVT::i64, getI32Imm(Hi));
}

// If no shift, we're done.
if (!Shift) return Result;

// If Hi word == Lo word,
// we can use rldimi to insert the Lo word into Hi word.
if ((unsigned)(Imm & 0xFFFFFFFF) == Remainder) {
SDValue Ops[] =
{ SDValue(Result, 0), SDValue(Result, 0), getI32Imm(Shift), getI32Imm(0)};
return CurDAG->getMachineNode(PPC::RLDIMI, dl, MVT::i64, Ops);
}

// Shift for next step if the upper 32-bits were not zero.
if (Imm) {
Result = CurDAG->getMachineNode(PPC::RLDICR, dl, MVT::i64,
SDValue(Result, 0),
getI32Imm(Shift),
getI32Imm(63 - Shift));
}

// Add in the last bits as required.
if ((Hi = (Remainder >> 16) & 0xFFFF)) {
Result = CurDAG->getMachineNode(PPC::ORIS8, dl, MVT::i64,
SDValue(Result, 0), getI32Imm(Hi));
}
if ((Lo = Remainder & 0xFFFF)) {
Result = CurDAG->getMachineNode(PPC::ORI8, dl, MVT::i64,
SDValue(Result, 0), getI32Imm(Lo));
}

return Result;
}

static SDNode selectI64Imm(SelectionDAG CurDAG, const SDLoc &dl,
int64_t Imm) {
unsigned Count = selectI64ImmInstrCountDirect(Imm);

// If the instruction count is 1 or 2, we do not need further analysis
// since rotate + load constant requires at least 2 instructions.
if (Count <= 2)
return selectI64ImmDirect(CurDAG, dl, Imm);

unsigned RMin = 0;

int64_t MatImm;
unsigned MaskEnd;

for (unsigned r = 1; r < 63; ++r) {
uint64_t RImm = Rot64(Imm, r);
unsigned RCount = selectI64ImmInstrCountDirect(RImm) + 1;
if (RCount < Count) {
Count = RCount;
RMin = r;
MatImm = RImm;
MaskEnd = 63;
}

// If the immediate to generate has many trailing zeros, it might be
// worthwhile to generate a rotated value with too many leading ones
// (because that's free with li/lis's sign-extension semantics), and then
// mask them off after rotation.

unsigned LS = findLastSet(RImm);
// We're adding (63-LS) higher-order ones, and we expect to mask them off
// after performing the inverse rotation by (64-r). So we need that:
// 63-LS == 64-r => LS == r-1
if (LS != r-1)
continue;

uint64_t OnesMask = -(int64_t) (UINT64_C(1) << (LS+1));
uint64_t RImmWithOnes = RImm \| OnesMask;

RCount = selectI64ImmInstrCountDirect(RImmWithOnes) + 1;
if (RCount < Count) {
Count = RCount;
RMin = r;
MatImm = RImmWithOnes;
MaskEnd = LS;
}
}

if (!RMin)
return selectI64ImmDirect(CurDAG, dl, Imm);

auto getI32Imm = [CurDAG, dl](unsigned Imm) {
return CurDAG->getTargetConstant(Imm, dl, MVT::i32);
};

SDValue Val = SDValue(selectI64ImmDirect(CurDAG, dl, MatImm), 0);
return CurDAG->getMachineNode(PPC::RLDICR, dl, MVT::i64, Val,
getI32Imm(64 - RMin), getI32Imm(MaskEnd));
}

static unsigned allUsesTruncate(SelectionDAG CurDAG, SDNode N) {		static unsigned allUsesTruncate(SelectionDAG CurDAG, SDNode N) {
unsigned MaxTruncation = 0;		unsigned MaxTruncation = 0;
// Cannot use range-based for loop here as we need the actual use (i.e. we		// Cannot use range-based for loop here as we need the actual use (i.e. we
// need the operand number corresponding to the use). A range-based for		// need the operand number corresponding to the use). A range-based for
// will unbox the use and provide an SDNode*.		// will unbox the use and provide an SDNode*.
for (SDNode::use_iterator Use = N->use_begin(), UseEnd = N->use_end();		for (SDNode::use_iterator Use = N->use_begin(), UseEnd = N->use_end();
Use != UseEnd; ++Use) {		Use != UseEnd; ++Use) {
▲ Show 20 Lines • Show All 41 Lines • ▼ Show 20 Lines	case PPC::STBUX8:
return 0;		return 0;
MaxTruncation = std::max(MaxTruncation, 8u);		MaxTruncation = std::max(MaxTruncation, 8u);
continue;		continue;
}		}
}		}
return MaxTruncation;		return MaxTruncation;
}		}

		bool findContiguousZeros(uint64_t Imm, unsigned Num, unsigned &Shift) {
		steven.zhangUnsubmitted Done Reply Inline Actions It should be static at least. And please add necessary documentation on the semantics for this function. steven.zhang: It should be static at least. And please add necessary documentation on the semantics for this…
		steven.zhangUnsubmitted Done Reply Inline Actions Please use C++ comment style: // steven.zhang: Please use C++ comment style: //
		leiUnsubmitted Not Done Reply Inline Actions nit: sentences should end with a '.' lei: nit: sentences should end with a '.'
		unsigned Hi_tz = countTrailingZeros<uint32_t>(Hi_32(Imm));
		Lint: Pre-merge checks Inline Actions clang-tidy: warning: invalid case style for variable 'Hi_tz' [readability-identifier-naming] not useful Lint: Pre-merge checks: clang-tidy: warning: invalid case style for variable 'Hi_tz' [readability-identifier-naming]…
		leiUnsubmitted Not Done Reply Inline Actions nit: Complete sentence please. All sentences should start with a capital. lei: nit: Complete sentence please. All sentences should start with a capital.
		EsmeAuthorUnsubmitted Done Reply Inline Actions These two lines are the same sentence. I will check all sentences before committing. Thanks for reminding! Esme: These two lines are the same sentence. I will check all sentences before committing. Thanks for…
		unsigned Lo_lz = countLeadingZeros<uint32_t>(Lo_32(Imm));
		Lint: Pre-merge checks Inline Actions clang-tidy: warning: invalid case style for variable 'Lo_lz' [readability-identifier-naming] not useful Lint: Pre-merge checks: clang-tidy: warning: invalid case style for variable 'Lo_lz' [readability-identifier-naming]…
		if ((Hi_tz + Lo_lz) >= Num) {
		steven.zhangUnsubmitted Not Done Reply Inline Actions So, why do we need this assertion ? steven.zhang: So, why do we need this assertion ?
		EsmeAuthorUnsubmitted Done Reply Inline Actions So, why do we need this assertion ? This function only works for 32 < Num < 64. As for other Nums, we will get an incorrect result. Perhaps we should change the assertion to a `return 0`? Esme: > So, why do we need this assertion ? This function only works for 32 < Num < 64. As for other…
		steven.zhangUnsubmitted Not Done Reply Inline Actions The semantics for this function is to get the pos of the Num at least consecutive zeros across Hi32 and Lo32. Otherwise, return zero. Is it right ? So, I am confused about the incorrect result you mean. steven.zhang: The semantics for this function is to get the pos of the Num at least consecutive zeros across…
		EsmeAuthorUnsubmitted Done Reply Inline Actions If an immediate have Num (which is less than 32) consecutive zeros across Hi32 and Lo32 we will return the pos, but if all of these consecutive zeros are within Lo32/Hi32, we will return 0. I assumed this is not a correct result. Well, after reconsidering I think it's OK to have no assertion. I will remove it in the next update. Thanks! Esme: If an immediate have Num (which is less than 32) consecutive zeros across Hi32 and Lo32 we will…
		Shift = 32 + Hi_tz;
		return true;
		}
		steven.zhangUnsubmitted Done Reply Inline Actions It makes more sense to me to have int findContiguousZerosAtLeast(Imm, Num). And you can check it like this: if ((Shift=findContiguousZerosAtLeast(Imm, 49)) \|\| (Shift = ...)) steven.zhang: It makes more sense to me to have int findContiguousZerosAtLeast(Imm, Num). And you can check…
		return false;
		}

		static SDNode selectI64ImmByPattern(SelectionDAG CurDAG, const SDLoc &dl,
		Lint: Pre-merge checks Inline Actions clang-tidy: warning: invalid case style for parameter 'dl' [readability-identifier-naming] not useful Lint: Pre-merge checks: clang-tidy: warning: invalid case style for parameter 'dl' [readability-identifier-naming]…
		steven.zhangUnsubmitted Done Reply Inline Actions I prefer to use reference for the InstrCnt and if for the case that we don't need it, just pass a dummy cnt. steven.zhang: I prefer to use reference for the InstrCnt and if for the case that we don't need it, just pass…
		uint64_t Imm, unsigned *InstCnt) {
		unsigned TZ = countTrailingZeros<uint64_t>(Imm);
		unsigned LZ = countLeadingZeros<uint64_t>(Imm);
		unsigned TO = countTrailingOnes<uint64_t>(Imm);
		unsigned LO = countLeadingOnes<uint64_t>(Imm);
		// Count of ones follwing the leading zeros.
		unsigned FO = countLeadingOnes<uint64_t>(Imm << LZ);
		steven.zhangUnsubmitted Done Reply Inline Actions The ByPattern here is a bit confusing. How about selectSimpleI64Imm() ? steven.zhang: The ByPattern here is a bit confusing. How about selectSimpleI64Imm() ?
		unsigned Hi32 = Hi_32(Imm);
		unsigned Lo32 = Lo_32(Imm);
		SDNode *Result = nullptr;
		unsigned Shift = 0;

		auto getI32Imm = [CurDAG, dl](unsigned Imm) {
		Lint: Pre-merge checks Inline Actions clang-tidy: warning: invalid case style for variable 'getI32Imm' [readability-identifier-naming] not useful Lint: Pre-merge checks: clang-tidy: warning: invalid case style for variable 'getI32Imm' [readability-identifier…
		return CurDAG->getTargetConstant(Imm, dl, MVT::i32);
		};

		/* Following patterns use 1 instructions to materialize the big constant */
		if (InstCnt)
		*InstCnt = 1;
		// {zeros}{15-bit valve}
		// {ones}{15-bit valve}
		if ((64 - LZ) < 16 \|\| (64 - LO) < 16) {
		steven.zhangUnsubmitted Done Reply Inline Actions Is it more clear to use isInt<N>() ? steven.zhang: Is it more clear to use isInt<N>() ?
		stefanpUnsubmitted Not Done Reply Inline Actions I agree. I think it would be clearer if you used `isInt<16>(Imm)`. stefanp: I agree. I think it would be clearer if you used `isInt<16>(Imm)`.
		EsmeAuthorUnsubmitted Done Reply Inline Actions Yes I agree with you, but it's hard to express all the patterns with `isInt<N>()`. In order to unify the expression of the patterns, I am very sorry that I did not modify them. I added some documentations and hope that's helpful. Esme: Yes I agree with you, but it's hard to express all the patterns with `isInt<N>()`. In order to…
		SDValue SDImm = CurDAG->getTargetConstant(Imm, dl, MVT::i64);
		return CurDAG->getMachineNode(PPC::LI8, dl, MVT::i64, SDImm);
		steven.zhangUnsubmitted Done Reply Inline Actions Use C++ comment style. steven.zhang: Use C++ comment style.
		}
		// {zeros}{15-bit valve}{16 zeros}
		// {ones}{15-bit valve}{16 zeros}
		if (TZ > 15 && (LZ > 32 \|\| LO > 32))
		steven.zhangUnsubmitted Not Done Reply Inline Actions Is it more clear to use: TZ > 15 && isInt<16>(Imm >> 16) ? steven.zhang: Is it more clear to use: TZ > 15 && isInt<16>(Imm >> 16) ?
		EsmeAuthorUnsubmitted Done Reply Inline Actions The case with the pattern of `{ones}{15-bit valve}{16 zeros}` does not equal to `TZ > 15 && isInt<16>(Imm >> 16)`. Esme: The case with the pattern of `{ones}{15-bit valve}{16 zeros}` does not equal to `TZ > 15 &&…
		return CurDAG->getMachineNode(PPC::LIS8, dl, MVT::i64,
		getI32Imm((Imm >> 16) & 0xffff));

		/* Following patterns use 2 instructions to materialize the big constant */
		if (InstCnt)
		*InstCnt = 2;
		// {zeros}{31-bit value}
		// {ones}{31-bit value}
		if (LZ > 32 \|\| LO > 32) {
		uint64_t LiImm = (Imm >> 16) & 0xffff;
		unsigned LiOpcode = LiImm ? PPC::LIS8 : PPC::LI8;
		stefanpUnsubmitted Done Reply Inline Actions Same goes here: `isInt<32>(Imm)` stefanp: Same goes here: `isInt<32>(Imm)`
		Result = CurDAG->getMachineNode(LiOpcode, dl, MVT::i64, getI32Imm(LiImm));
		return CurDAG->getMachineNode(PPC::ORI8, dl, MVT::i64, SDValue(Result, 0),
		getI32Imm(Imm & 0xffff));
		}
		// {zeros}{ones}{15-bit value}{zeros}
		// {zeros}{15-bit value}{zeros}
		// {zeros}{ones}{15-bit value}
		steven.zhangUnsubmitted Done Reply Inline Actions ImmHi16 ? steven.zhang: ImmHi16 ?
		// {ones}{15-bit value}{zeros}
		steven.zhangUnsubmitted Done Reply Inline Actions Opcode is ok as you don't know if it is LIS or LI. steven.zhang: Opcode is ok as you don't know if it is LIS or LI.
		if ((64 - (LZ + FO + TZ)) < 16) {
		steven.zhangUnsubmitted Not Done Reply Inline Actions The logic here is not quite right. If the High 16 bits of the Imm is zero, you still produce the LI which is not needed. steven.zhang: The logic here is not quite right. If the High 16 bits of the Imm is zero, you still produce…
		EsmeAuthorUnsubmitted Done Reply Inline Actions The logic here is not quite right. If the High 16 bits of the Imm is zero, you still produce the LI which is not needed. Consider an immediate which is uint<16> but not int<16>, where the High 16 bits is zero but we can't use a single `LI` to handle it. For example 0x8003, we have to use 2 instructions to materialize it, i.e. li 3, 0 ori 3, 3, 32771 Esme: > The logic here is not quite right. If the High 16 bits of the Imm is zero, you still produce…
		Result = CurDAG->getMachineNode(PPC::LI8, dl, MVT::i64,
		getI32Imm((Imm >> TZ) & 0xffff));
		return CurDAG->getMachineNode(PPC::RLDIC, dl, MVT::i64, SDValue(Result, 0),
		getI32Imm(TZ), getI32Imm(LZ));
		}
		// {zeros}{15-bit value}{ones}
		if ((64 - (LZ + TO)) < 16) {
		steven.zhangUnsubmitted Not Done Reply Inline Actions You can use SLDI if the TZ and LZ meet some requirement. A better idea is to fix it in InstAlias. steven.zhang: You can use SLDI if the TZ and LZ meet some requirement. A better idea is to fix it in…
		EsmeAuthorUnsubmitted Done Reply Inline Actions You can use SLDI if the TZ and LZ meet some requirement. A better idea is to fix it in InstAlias. RLDIC was chosen over RLDICR because RLDIC can cover more patterns than RLDICR, even though RLDICR can be transformed to SLDI in InstAlias. I prefer to add InstAlias for RLDIC as a follow-up work. Esme: > You can use SLDI if the TZ and LZ meet some requirement. A better idea is to fix it in…
		assert(LZ < 48 && "Unexpected shift value.");
		Result = CurDAG->getMachineNode(PPC::LI8, dl, MVT::i64,
		getI32Imm((Imm >> (48 - LZ) & 0xffff)));
		return CurDAG->getMachineNode(PPC::RLDICL, dl, MVT::i64, SDValue(Result, 0),
		getI32Imm(48 - LZ), getI32Imm(LZ));
		}
		// {zeros}{ones}{15-bit value}{ones}
		// {ones}{15-bit value}{ones}
		if ((64 - (LZ + FO + TO)) < 16) {
		Result = CurDAG->getMachineNode(PPC::LI8, dl, MVT::i64,
		getI32Imm((Imm >> TO) & 0xffff));
		steven.zhangUnsubmitted Done Reply Inline Actions How about if LZ == 48 ? steven.zhang: How about if LZ == 48 ?
		return CurDAG->getMachineNode(PPC::RLDICL, dl, MVT::i64, SDValue(Result, 0),
		steven.zhangUnsubmitted Done Reply Inline Actions Some comments on bit pattern changed during these two instructions are needed to help understand what you are trying to do. steven.zhang: Some comments on bit pattern changed during these two instructions are needed to help…
		getI32Imm(TO), getI32Imm(LZ));
		}
		// {32 zeros}{****}{15-bit value}
		if (LZ == 32 && ((Lo32 & 0x8000) == 0)) {
		Result = CurDAG->getMachineNode(PPC::LI8, dl, MVT::i64,
		getI32Imm(Lo32 & 0xffff));
		return CurDAG->getMachineNode(PPC::ORIS8, dl, MVT::i64, SDValue(Result, 0),
		getI32Imm(Lo32 >> 16));
		steven.zhangUnsubmitted Done Reply Inline Actions Again, you need some comments to indicate that, you are trying to leverage the sign extend of LI to make them as ones, then, rotate and clear it. steven.zhang: Again, you need some comments to indicate that, you are trying to leverage the sign extend of…
		}
		// {****}{49 zeros or ones}{****}
		if (findContiguousZeros(Imm, 49, Shift) \|\|
		findContiguousZeros(~Imm, 49, Shift)) {
		uint64_t RotImm = (Imm >> Shift) \| (Imm << (64 - Shift));
		steven.zhangUnsubmitted Done Reply Inline Actions The implementation is not align with the comments. steven.zhang: The implementation is not align with the comments.
		Result = CurDAG->getMachineNode(PPC::LI8, dl, MVT::i64,
		getI32Imm(RotImm & 0xffff));
		return CurDAG->getMachineNode(PPC::RLDICL, dl, MVT::i64, SDValue(Result, 0),
		getI32Imm(Shift), getI32Imm(0));
		}

		/* Following patterns use 3 instructions to materialize the big constant. */
		stefanpUnsubmitted Done Reply Inline Actions One more question: Isn't this the pattern above just a subset of this one? if ((LZ + TO) > 48) { ... } if ((LZ + FO + TO) > 48) { ... } They both use only two instructions to materialize the constant. If you delete the first one the second one will also catch all of those cases and be the same number of instructions. stefanp: One more question: Isn't this the pattern above just a subset of this one? ``` if ((LZ + TO) >…
		EsmeAuthorUnsubmitted Done Reply Inline Actions One more question: Isn't this the pattern above just a subset of this one? if ((LZ + TO) > 48) { ... } if ((LZ + FO + TO) > 48) { ... } They both use only two instructions to materialize the constant. If you delete the first one the second one will also catch all of those cases and be the same number of instructions. They are similar but different :D The patterns are very tricky indeed. Hope the following sketches can make you clear. First one (LZ + TO) > 48 // +--LZ--\|\|-15-bit-\|\|--TO--+ +-------------\|--16-bit--+ // \|00000001bbbbbbbbb1111111\| -> \|00000000000001bbbbbbbbb1\| // +------------------------+ +------------------------+ // 63 0 63 0 // Imm (Imm >> (48 - LZ) & 0xffff) // +----sext-----\|--16-bit--+ +clear-\|-----------------+ // \|11111111111111bbbbbbbbb1\| -> \|00000001bbbbbbbbb1111111\| // +------------------------+ +------------------------+ // 63 0 63 0 // LI8 : sext many leading zeros RLDICL : rotate left (48 - LZ), clear left LZ Second one (LZ + FO + TO) > 48 (I will add this in next update) // +-LZ-FO\|\|-15-bit-\|\|--TO--+ +-------------\|--16-bit--+ // \|00011110bbbbbbbbb1111111\| -> \|000000000011110bbbbbbbbb\| // +------------------------+ +------------------------+ // 63 0 63 0 // Imm (Imm >> TO) & 0xffff // +----sext-----\|--16-bit--+ +LZ\|---------------------+ // \|111111111111110bbbbbbbbb\| -> \|00011110bbbbbbbbb1111111\| // +------------------------+ +------------------------+ // 63 0 63 0 // LI8 : sext many leading zeros RLDICL : rotate left TO, clear left LZ Assume we use the second pattern to handle the first case : // +--LZ--\|\|-15-bit-\|\|--TO--+ +--------------\|-15-bit--+ // \|00000001bbbbbbbbb1111111\| -> \|000000000000001bbbbbbbbb\| // +------------------------+ +------------------------+ // 63 0 63 0 // Imm (Imm >> TO) & 0xffff) // +----sext------\|-15-bit--+ +------------------------+ // \|000000000000001bbbbbbbbb\| -> \|00000001bbbbbbbbb0000000\| // +------------------------+ +------------------------+ // 63 0 63 0 // LI : no leading ones incorrect result :( Esme: > One more question: Isn't this the pattern above just a subset of this one? > > ``` > if ((LZ…
		stefanpUnsubmitted Done Reply Inline Actions I see! You don't get the sign extend that you need in that case. Thank you for the explanation. stefanp: I see! You don't get the sign extend that you need in that case. Thank you for the explanation.
		if (InstCnt)
		*InstCnt = 3;
		// {zeros}{ones}{31-bit value}{zeros}
		steven.zhangUnsubmitted Not Done Reply Inline Actions There is rotate routines for you to do this. steven.zhang: There is rotate routines for you to do this.
		EsmeAuthorUnsubmitted Done Reply Inline Actions There is rotate routines for you to do this. I know we have `APInt APInt::rotr(unsigned rotateAmt)` for rotation right, but it's not convenient enough since I have to transform `uint64_t Imm` to `APInt`. Is there any other rotation routines? Esme: > There is rotate routines for you to do this. I know we have `APInt APInt::rotr(unsigned…
		steven.zhangUnsubmitted Not Done Reply Inline Actions In fact, you can declare the Imm as APInt and it will make the bit operation more easy. But it is up to you. steven.zhang: In fact, you can declare the Imm as APInt and it will make the bit operation more easy. But it…
		// {zeros}{31-bit value}{zeros}
		// {zeros}{ones}{31-bit value}
		// {ones}{31-bit value}{zeros}
		if ((64 - (LZ + FO + TZ)) < 32) {
		uint64_t LiImm = (Imm >> (TZ + 16)) & 0xffff;
		unsigned LiOpcode = LiImm ? PPC::LIS8 : PPC::LI8;
		Result = CurDAG->getMachineNode(LiOpcode, dl, MVT::i64, getI32Imm(LiImm));
		Result = CurDAG->getMachineNode(PPC::ORI8, dl, MVT::i64, SDValue(Result, 0),
		getI32Imm((Imm >> TZ) & 0xffff));
		return CurDAG->getMachineNode(PPC::RLDIC, dl, MVT::i64, SDValue(Result, 0),
		getI32Imm(TZ), getI32Imm(LZ));
		}
		// {zeros}{31-bit value}{ones}
		if ((64 - (LZ + TO)) < 32) {
		assert(LZ < 32 && "Unexpected shift value.");
		uint64_t LiImm = (Imm >> (48 - LZ)) & 0xffff;
		unsigned LiOpcode = LiImm ? PPC::LIS8 : PPC::LI8;
		Result = CurDAG->getMachineNode(LiOpcode, dl, MVT::i64, getI32Imm(LiImm));
		Result = CurDAG->getMachineNode(PPC::ORI8, dl, MVT::i64, SDValue(Result, 0),
		getI32Imm((Imm >> (32 - LZ)) & 0xffff));
		return CurDAG->getMachineNode(PPC::RLDICL, dl, MVT::i64, SDValue(Result, 0),
		getI32Imm(32 - LZ), getI32Imm(LZ));
		}
		// {zeros}{ones}{31-bit value}{ones}
		// {ones}{31-bit value}{ones}
		if ((64 - (LZ + FO + TO)) < 32) {
		uint64_t LiImm = (Imm >> (TO + 16)) & 0xffff;
		unsigned LiOpcode = LiImm ? PPC::LIS8 : PPC::LI8;
		Result = CurDAG->getMachineNode(LiOpcode, dl, MVT::i64, getI32Imm(LiImm));
		Result = CurDAG->getMachineNode(PPC::ORI8, dl, MVT::i64, SDValue(Result, 0),
		getI32Imm((Imm >> TO) & 0xffff));
		return CurDAG->getMachineNode(PPC::RLDICL, dl, MVT::i64, SDValue(Result, 0),
		getI32Imm(TO), getI32Imm(LZ));
		}
		// High word == Low word
		if (Hi32 == Lo32) {
		// Handle the first 32 bits.
		uint64_t LiImm = (Lo32 >> 16) & 0xffff;
		unsigned LiOpcode = LiImm ? PPC::LIS8 : PPC::LI8;
		Result = CurDAG->getMachineNode(LiOpcode, dl, MVT::i64, getI32Imm(LiImm));
		Result = CurDAG->getMachineNode(PPC::ORI8, dl, MVT::i64, SDValue(Result, 0),
		getI32Imm(Lo32 & 0xffff));
		// Use rldimi to insert the Low word into High word.
		SDValue Ops[] = {SDValue(Result, 0), SDValue(Result, 0), getI32Imm(32),
		getI32Imm(0)};
		return CurDAG->getMachineNode(PPC::RLDIMI, dl, MVT::i64, Ops);
		}
		// {31-SH}{33 zeros or ones}{SH}
		if (findContiguousZeros(Imm, 33, Shift) \|\|
		findContiguousZeros(~Imm, 33, Shift)) {
		uint64_t RotImm = (Imm >> Shift) \| (Imm << (64 - Shift));
		uint64_t LiImm = (RotImm >> 16) & 0xffff;
		unsigned LiOpcode = LiImm ? PPC::LIS8 : PPC::LI8;
		Result = CurDAG->getMachineNode(LiOpcode, dl, MVT::i64, getI32Imm(LiImm));
		Result = CurDAG->getMachineNode(PPC::ORI8, dl, MVT::i64, SDValue(Result, 0),
		getI32Imm(RotImm & 0xffff));
		return CurDAG->getMachineNode(PPC::RLDICL, dl, MVT::i64, SDValue(Result, 0),
		getI32Imm(Shift), getI32Imm(0));
		}

		if (InstCnt)
		*InstCnt = 0;
		return nullptr;
		}

		static SDNode selectI64Imm(SelectionDAG CurDAG, const SDLoc &dl, uint64_t Imm,
		Lint: Pre-merge checks Inline Actions clang-tidy: warning: invalid case style for parameter 'dl' [readability-identifier-naming] not useful Lint: Pre-merge checks: clang-tidy: warning: invalid case style for parameter 'dl' [readability-identifier-naming]…
		unsigned *InstCnt = nullptr) {
		if (InstCnt)
		*InstCnt = 0;
		// No more than 3 instructions.
		SDNode *Result = selectI64ImmByPattern(CurDAG, dl, Imm, InstCnt);
		if (Result)
		return Result;
		auto getI32Imm = [CurDAG, dl](unsigned Imm) {
		Lint: Pre-merge checks Inline Actions clang-tidy: warning: invalid case style for variable 'getI32Imm' [readability-identifier-naming] not useful Lint: Pre-merge checks: clang-tidy: warning: invalid case style for variable 'getI32Imm' [readability-identifier…
		return CurDAG->getTargetConstant(Imm, dl, MVT::i32);
		};
		// Handle the upper 32 bit value.
		Result = selectI64ImmByPattern(CurDAG, dl, Imm & 0xffffffff00000000, InstCnt);
		// Add in the last bits as required.
		if (uint32_t Hi16 = (Lo_32(Imm) >> 16) & 0xffff) {
		steven.zhangUnsubmitted Done Reply Inline Actions It is more clean to have code like this: if (SDNode Result = ...) { If (InstCnt) InstCnt = ... return Result; } steven.zhang: It is more clean to have code like this: ``` if (SDNode *Result = ...) { If (InstCnt)…
		Result = CurDAG->getMachineNode(PPC::ORIS8, dl, MVT::i64,
		SDValue(Result, 0), getI32Imm(Hi16));
		if (InstCnt)
		*InstCnt += 1;
		}
		if (uint32_t Lo16 = Lo_32(Imm) & 0xffff) {
		Result = CurDAG->getMachineNode(PPC::ORI8, dl, MVT::i64, SDValue(Result, 0),
		getI32Imm(Lo16));
		if (InstCnt)
		*InstCnt += 1;
		}
		return Result;
		}

// Select a 64-bit constant.		// Select a 64-bit constant.
		steven.zhangUnsubmitted Done Reply Inline Actions ++InstCntDirect steven.zhang: ++InstCntDirect
static SDNode selectI64Imm(SelectionDAG CurDAG, SDNode *N) {		static SDNode selectI64Imm(SelectionDAG CurDAG, SDNode *N) {
SDLoc dl(N);		SDLoc dl(N);

// Get 64 bit value.		// Get 64 bit value.
int64_t Imm = cast<ConstantSDNode>(N)->getZExtValue();		int64_t Imm = cast<ConstantSDNode>(N)->getZExtValue();
if (unsigned MinSize = allUsesTruncate(CurDAG, N)) {		if (unsigned MinSize = allUsesTruncate(CurDAG, N)) {
uint64_t SextImm = SignExtend64(Imm, MinSize);		uint64_t SextImm = SignExtend64(Imm, MinSize);
SDValue SDImm = CurDAG->getTargetConstant(SextImm, dl, MVT::i64);		SDValue SDImm = CurDAG->getTargetConstant(SextImm, dl, MVT::i64);
if (isInt<16>(SextImm))		if (isInt<16>(SextImm))
return CurDAG->getMachineNode(PPC::LI8, dl, MVT::i64, SDImm);		return CurDAG->getMachineNode(PPC::LI8, dl, MVT::i64, SDImm);
}		}
return selectI64Imm(CurDAG, dl, Imm);		return selectI64Imm(CurDAG, dl, Imm);
}		}

namespace {		namespace {

class BitPermutationSelector {		class BitPermutationSelector {
		stefanpUnsubmitted Done Reply Inline Actions nit: So if `ImmHi16 == 0` we still add: LI8 <reg>, 0 ORI8 <reg>, <reg>, (RotImm & 0xffff) Why does it matter whether or not that first instruction is LIS8 or LI8? The two instructions will do the same thing if you feed them zero. stefanp: nit: So if `ImmHi16 == 0` we still add: ``` LI8 <reg>, 0 ORI8 <reg>, <reg>, (RotImm & 0xffff)…
		EsmeAuthorUnsubmitted Done Reply Inline Actions Thanks for reviews! Yes, there is actually no difference between `LI 0` and `LIS 0`. I chose LI over LIS, just to avoid a fair amount of changes from `LI 0` to `LIS 0` in the .ll files, since we preferred `LI 0` in the legacy code. Esme: Thanks for reviews! Yes, there is actually no difference between `LI 0` and `LIS 0`. I chose LI…
struct ValueBit {		struct ValueBit {
SDValue V;		SDValue V;

// The bit number in the value, using a convention where bit 0 is the		// The bit number in the value, using a convention where bit 0 is the
// lowest-order bit.		// lowest-order bit.
unsigned Idx;		unsigned Idx;

// ConstZero means a bit we need to mask off.		// ConstZero means a bit we need to mask off.
▲ Show 20 Lines • Show All 1,014 Lines • ▼ Show 20 Lines	for (ValueRotInfo &VRI : ValueRotsVec) {
// Compute the masks for andi/andis that would be necessary.		// Compute the masks for andi/andis that would be necessary.
unsigned ANDIMask = (Mask & UINT16_MAX),		unsigned ANDIMask = (Mask & UINT16_MAX),
ANDISMask = (Mask >> 16) & UINT16_MAX;		ANDISMask = (Mask >> 16) & UINT16_MAX;

bool NeedsRotate = VRI.RLAmt \|\| (VRI.Repl32 && !isUInt<32>(Mask));		bool NeedsRotate = VRI.RLAmt \|\| (VRI.Repl32 && !isUInt<32>(Mask));

unsigned NumAndInsts = (unsigned) NeedsRotate +		unsigned NumAndInsts = (unsigned) NeedsRotate +
(unsigned) (bool) Res;		(unsigned) (bool) Res;
		unsigned NumSelectInsts = 0;
		selectI64Imm(CurDAG, dl, Mask, &NumSelectInsts);
		steven.zhangUnsubmitted Done Reply Inline Actions Add the assertion here to make sure that, the return value from selectI64Imm is not nullptr. steven.zhang: Add the assertion here to make sure that, the return value from selectI64Imm is not nullptr.
if (Use32BitInsts)		if (Use32BitInsts)
NumAndInsts += (unsigned) (ANDIMask != 0) + (unsigned) (ANDISMask != 0) +		NumAndInsts += (unsigned) (ANDIMask != 0) + (unsigned) (ANDISMask != 0) +
(unsigned) (ANDIMask != 0 && ANDISMask != 0);		(unsigned) (ANDIMask != 0 && ANDISMask != 0);
else		else
NumAndInsts += selectI64ImmInstrCount(Mask) + /* and */ 1;		NumAndInsts += NumSelectInsts + /* and */ 1;

unsigned NumRLInsts = 0;		unsigned NumRLInsts = 0;
bool FirstBG = true;		bool FirstBG = true;
bool MoreBG = false;		bool MoreBG = false;
for (auto &BG : BitGroups) {		for (auto &BG : BitGroups) {
if (!MatchingBG(BG)) {		if (!MatchingBG(BG)) {
MoreBG = true;		MoreBG = true;
continue;		continue;
▲ Show 20 Lines • Show All 207 Lines • ▼ Show 20 Lines	if (LateMask) {
if (!ANDIVal)		if (!ANDIVal)
Res = ANDISVal;		Res = ANDISVal;
else if (!ANDISVal)		else if (!ANDISVal)
Res = ANDIVal;		Res = ANDIVal;
else		else
Res = SDValue(CurDAG->getMachineNode(PPC::OR8, dl, MVT::i64,		Res = SDValue(CurDAG->getMachineNode(PPC::OR8, dl, MVT::i64,
ExtendToInt64(ANDIVal, dl), ANDISVal), 0);		ExtendToInt64(ANDIVal, dl), ANDISVal), 0);
} else {		} else {
if (InstCnt) InstCnt += selectI64ImmInstrCount(Mask) + / and */ 1;		unsigned NumSelectInsts = 0;
		SDValue MaskVal =
SDValue MaskVal = SDValue(selectI64Imm(CurDAG, dl, Mask), 0);		SDValue(selectI64Imm(CurDAG, dl, Mask, &NumSelectInsts), 0);
Res =		Res = SDValue(CurDAG->getMachineNode(PPC::AND8, dl, MVT::i64,
SDValue(CurDAG->getMachineNode(PPC::AND8, dl, MVT::i64,
ExtendToInt64(Res, dl), MaskVal), 0);		ExtendToInt64(Res, dl), MaskVal), 0);
		Lint: Pre-merge checks Inline Actions clang-format: please reformat the code - ExtendToInt64(Res, dl), MaskVal), 0); - if (InstCnt) InstCnt += NumSelectInsts + / and / 1; + ExtendToInt64(Res, dl), MaskVal), + 0); + if (InstCnt) + InstCnt += NumSelectInsts + /* and / 1; Lint: Pre-merge checks:* clang-format: please reformat the code ``` - …
		if (InstCnt) InstCnt += NumSelectInsts + / and */ 1;
		steven.zhangUnsubmitted Done Reply Inline Actions NumOfInstrs? steven.zhang: NumOfInstrs?
}		}
}		}

return Res.getNode();		return Res.getNode();
}		}

SDNode Select(SDNode N, bool LateMask, unsigned *InstCnt = nullptr) {		SDNode Select(SDNode N, bool LateMask, unsigned *InstCnt = nullptr) {
// Fill in BitGroups.		// Fill in BitGroups.
▲ Show 20 Lines • Show All 4,458 Lines • Show Last 20 Lines

llvm/test/CodeGen/PowerPC/aix-cc-abi.ll

Show First 20 Lines • Show All 235 Lines • ▼ Show 20 Lines	entry:
call i32 @test_ints(i32 signext 1, i32 zeroext 1, i32 zeroext 2147483648, i32 signext -2147483648, i32 signext 1, i32 signext 1, i32 signext 1, i32 signext 1)		call i32 @test_ints(i32 signext 1, i32 zeroext 1, i32 zeroext 2147483648, i32 signext -2147483648, i32 signext 1, i32 signext 1, i32 signext 1, i32 signext 1)
ret void		ret void
}		}

; CHECK-LABEL: name: call_test_ints		; CHECK-LABEL: name: call_test_ints

; 64BIT: ADJCALLSTACKDOWN 112, 0, implicit-def dead $r1, implicit $r1		; 64BIT: ADJCALLSTACKDOWN 112, 0, implicit-def dead $r1, implicit $r1
; 64BIT: renamable $x3 = LI8 1		; 64BIT: renamable $x3 = LI8 1
; 64BIT: renamable $x5 = RLDICR killed renamable $x3, 31, 32		; 64BIT: renamable $x5 = RLDIC killed renamable $x3, 31, 32
; 64BIT: $x3 = LI8 1		; 64BIT: $x3 = LI8 1
; 64BIT: $x4 = LI8 1		; 64BIT: $x4 = LI8 1
; 64BIT: $x6 = LIS8 32768		; 64BIT: $x6 = LIS8 32768
; 64BIT: $x7 = LI8 1		; 64BIT: $x7 = LI8 1
; 64BIT: $x8 = LI8 1		; 64BIT: $x8 = LI8 1
; 64BIT: $x9 = LI8 1		; 64BIT: $x9 = LI8 1
; 64BIT: $x10 = LI8 1		; 64BIT: $x10 = LI8 1
; 64BIT: BL8_NOP <mcsymbol .test_ints>, csr_ppc64, implicit-def dead $lr8, implicit $rm, implicit $x3, implicit killed $x4, implicit $x5, implicit killed $x6, implicit killed $x7, implicit killed $x8, implicit killed $x9, implicit killed $x10, implicit $x2, implicit-def $r1, implicit-def dead $x3		; 64BIT: BL8_NOP <mcsymbol .test_ints>, csr_ppc64, implicit-def dead $lr8, implicit $rm, implicit $x3, implicit killed $x4, implicit $x5, implicit killed $x6, implicit killed $x7, implicit killed $x8, implicit killed $x9, implicit killed $x10, implicit $x2, implicit-def $r1, implicit-def dead $x3
▲ Show 20 Lines • Show All 2,103 Lines • Show Last 20 Lines

llvm/test/CodeGen/PowerPC/arr-fp-arg-no-copy.ll

	; RUN: llc -verify-machineinstrs -mcpu=ppc64 < %s \| FileCheck %s			; RUN: llc -verify-machineinstrs -mcpu=ppc64 < %s \| FileCheck %s
	target datalayout = "E-m:e-i64:64-n32:64"			target datalayout = "E-m:e-i64:64-n32:64"
	target triple = "powerpc64-unknown-linux-gnu"			target triple = "powerpc64-unknown-linux-gnu"

	; Function Attrs: nounwind			; Function Attrs: nounwind
	define void @bar() #0 {			define void @bar() #0 {
	entry:			entry:
	tail call void @xxx([2 x i64] [i64 4607182418800017408, i64 4611686018427387904]) #0			tail call void @xxx([2 x i64] [i64 4607182418800017408, i64 4611686018427387904]) #0
	ret void			ret void

	; CHECK-LABEL: @bar			; CHECK-LABEL: @bar
	; CHECK-DAG: li [[REG1:[0-9]+]], 1023			; CHECK-DAG: li [[REG1:[0-9]+]], 1023
	; CHECK-DAG: li [[REG2:[0-9]+]], {{1$}}			; CHECK-DAG: li [[REG2:[0-9]+]], {{1$}}
	; CHECK-DAG: sldi 3, [[REG1]], 52			; CHECK-DAG: rldic 3, [[REG1]], 52, 2
	; CHECK-DAG: sldi 4, [[REG2]], 62			; CHECK-DAG: rldic 4, [[REG2]], 62, 1
				steven.zhangUnsubmitted Not Done Reply Inline Actions Some follow up to fix the missing instr aliasing for rldic -> sldi ? steven.zhang: Some follow up to fix the missing instr aliasing for rldic -> sldi ?
				jsjiUnsubmitted Not Done Reply Inline Actions See https://reviews.llvm.org/D81819 jsji: See https://reviews.llvm.org/D81819
				EsmeAuthorUnsubmitted Done Reply Inline Actions See https://reviews.llvm.org/D81819 Thanks! I have commandeered this patch to myself, I will follow it up ASAP. Esme: > See https://reviews.llvm.org/D81819 Thanks! I have commandeered this patch to myself, I will…
	; CHECK: bl xxx			; CHECK: bl xxx
	; CHECK: blr			; CHECK: blr
	}			}

	declare void @xxx([2 x i64])			declare void @xxx([2 x i64])

	attributes #0 = { nounwind }			attributes #0 = { nounwind }

llvm/test/CodeGen/PowerPC/bperm.ll

Show First 20 Lines • Show All 41 Lines • ▼ Show 20 Lines
entry:		entry:
%0 = lshr i64 %i1, 8		%0 = lshr i64 %i1, 8
%and = and i64 %0, 5963776000		%and = and i64 %0, 5963776000
ret i64 %and		ret i64 %and

; CHECK-LABEL: @test1		; CHECK-LABEL: @test1
; CHECK-DAG: li [[REG1:[0-9]+]], 11375		; CHECK-DAG: li [[REG1:[0-9]+]], 11375
; CHECK-DAG: rotldi [[REG3:[0-9]+]], 4, 56		; CHECK-DAG: rotldi [[REG3:[0-9]+]], 4, 56
; CHECK-DAG: sldi [[REG2:[0-9]+]], [[REG1]], 19		; CHECK-DAG: rldic [[REG2:[0-9]+]], [[REG1]], 19, 31
; CHECK: and 3, [[REG3]], [[REG2]]		; CHECK: and 3, [[REG3]], [[REG2]]
; CHECK: blr		; CHECK: blr
}		}

define i64 @test2(i64 %i0, i64 %i1) #0 {		define i64 @test2(i64 %i0, i64 %i1) #0 {
entry:		entry:
%0 = lshr i64 %i1, 6		%0 = lshr i64 %i1, 6
%and = and i64 %0, 133434808670355456		%and = and i64 %0, 133434808670355456
ret i64 %and		ret i64 %and

; CHECK-LABEL: @test2		; CHECK-LABEL: @test2
; CHECK-DAG: lis [[REG1:[0-9]+]], 474		; CHECK-DAG: lis [[REG1:[0-9]+]], 7
; CHECK-DAG: rotldi [[REG5:[0-9]+]], 4, 58		; CHECK-DAG: rotldi [[REG5:[0-9]+]], 4, 58
; CHECK-DAG: ori [[REG2:[0-9]+]], [[REG1]], 3648		; CHECK-DAG: ori [[REG2:[0-9]+]], [[REG1]], 26681
; CHECK-DAG: sldi [[REG3:[0-9]+]], [[REG2]], 32		; CHECK-DAG: rldic [[REG3:[0-9]+]], [[REG2]], 38, 7
; CHECK-DAG: oris [[REG4:[0-9]+]], [[REG3]], 25464		; CHECK-DAG: oris [[REG4:[0-9]+]], [[REG3]], 25464
; CHECK: and 3, [[REG5]], [[REG4]]		; CHECK: and 3, [[REG5]], [[REG4]]
; CHECK: blr		; CHECK: blr
}		}

define i64 @test3(i64 %i0, i64 %i1) #0 {		define i64 @test3(i64 %i0, i64 %i1) #0 {
entry:		entry:
%0 = shl i64 %i0, 34		%0 = shl i64 %i0, 34
%and = and i64 %0, 191795733152661504		%and = and i64 %0, 191795733152661504
ret i64 %and		ret i64 %and

; CHECK-LABEL: @test3		; CHECK-LABEL: @test3
; CHECK-DAG: lis [[REG1:[0-9]+]], 170		; CHECK-DAG: lis [[REG1:[0-9]+]], 170
; CHECK-DAG: rotldi [[REG4:[0-9]+]], 3, 34		; CHECK-DAG: rotldi [[REG4:[0-9]+]], 3, 34
; CHECK-DAG: ori [[REG2:[0-9]+]], [[REG1]], 22861		; CHECK-DAG: ori [[REG2:[0-9]+]], [[REG1]], 22861
; CHECK-DAG: sldi [[REG3:[0-9]+]], [[REG2]], 34		; CHECK-DAG: rldic [[REG3:[0-9]+]], [[REG2]], 34, 6
; CHECK: and 3, [[REG4]], [[REG3]]		; CHECK: and 3, [[REG4]], [[REG3]]
; CHECK: blr		; CHECK: blr
}		}

define i64 @test4(i64 %i0, i64 %i1) #0 {		define i64 @test4(i64 %i0, i64 %i1) #0 {
entry:		entry:
%0 = lshr i64 %i1, 15		%0 = lshr i64 %i1, 15
%and = and i64 %0, 58195968		%and = and i64 %0, 58195968
Show All 10 Lines	entry:
%0 = shl i64 %i1, 12		%0 = shl i64 %i1, 12
%and = and i64 %0, 127252959854592		%and = and i64 %0, 127252959854592
ret i64 %and		ret i64 %and

; CHECK-LABEL: @test5		; CHECK-LABEL: @test5
; CHECK-DAG: lis [[REG1:[0-9]+]], 3703		; CHECK-DAG: lis [[REG1:[0-9]+]], 3703
; CHECK-DAG: rotldi [[REG4:[0-9]+]], 4, 12		; CHECK-DAG: rotldi [[REG4:[0-9]+]], 4, 12
; CHECK-DAG: ori [[REG2:[0-9]+]], [[REG1]], 35951		; CHECK-DAG: ori [[REG2:[0-9]+]], [[REG1]], 35951
; CHECK-DAG: sldi [[REG3:[0-9]+]], [[REG2]], 19		; CHECK-DAG: rldic [[REG3:[0-9]+]], [[REG2]], 19, 17
; CHECK: and 3, [[REG4]], [[REG3]]		; CHECK: and 3, [[REG4]], [[REG3]]
; CHECK: blr		; CHECK: blr
}		}

; Function Attrs: nounwind readnone		; Function Attrs: nounwind readnone
define zeroext i32 @test6(i32 zeroext %x) #0 {		define zeroext i32 @test6(i32 zeroext %x) #0 {
entry:		entry:
%and = lshr i32 %x, 16		%and = lshr i32 %x, 16
Show All 28 Lines	entry:
%0 = lshr i64 %i0, 1		%0 = lshr i64 %i0, 1
%and = and i64 %0, 169172533248		%and = and i64 %0, 169172533248
ret i64 %and		ret i64 %and

; CHECK-LABEL: @test8		; CHECK-LABEL: @test8
; CHECK-DAG: lis [[REG1:[0-9]+]], 4		; CHECK-DAG: lis [[REG1:[0-9]+]], 4
; CHECK-DAG: rotldi [[REG4:[0-9]+]], 3, 63		; CHECK-DAG: rotldi [[REG4:[0-9]+]], 3, 63
; CHECK-DAG: ori [[REG2:[0-9]+]], [[REG1]], 60527		; CHECK-DAG: ori [[REG2:[0-9]+]], [[REG1]], 60527
; CHECK-DAG: sldi [[REG3:[0-9]+]], [[REG2]], 19		; CHECK-DAG: rldic [[REG3:[0-9]+]], [[REG2]], 19, 26
; CHECK: and 3, [[REG4]], [[REG3]]		; CHECK: and 3, [[REG4]], [[REG3]]
; CHECK: blr		; CHECK: blr
}		}

define i64 @test9(i64 %i0, i64 %i1) #0 {		define i64 @test9(i64 %i0, i64 %i1) #0 {
entry:		entry:
%0 = lshr i64 %i1, 14		%0 = lshr i64 %i1, 14
%and = and i64 %0, 18848677888		%and = and i64 %0, 18848677888
%1 = shl i64 %i1, 51		%1 = shl i64 %i1, 51
%and3 = and i64 %1, 405323966463344640		%and3 = and i64 %1, 405323966463344640
%or4 = or i64 %and, %and3		%or4 = or i64 %and, %and3
ret i64 %or4		ret i64 %or4

; CHECK-LABEL: @test9		; CHECK-LABEL: @test9
; CHECK-DAG: lis [[REG1:[0-9]+]], 1440		; CHECK-DAG: lis [[REG1:[0-9]+]], 360
; CHECK-DAG: rotldi [[REG5:[0-9]+]], 4, 62		; CHECK-DAG: rotldi [[REG5:[0-9]+]], 4, 62
; CHECK-DAG: rotldi [[REG6:[0-9]+]], 4, 50		; CHECK-DAG: rotldi [[REG6:[0-9]+]], 4, 50
; CHECK-DAG: ori [[REG2:[0-9]+]], [[REG1]], 4		; CHECK-DAG: ori [[REG2:[0-9]+]], [[REG1]], 1
; CHECK-DAG: rldimi [[REG6]], [[REG5]], 53, 0		; CHECK-DAG: rldimi [[REG6]], [[REG5]], 53, 0
; CHECK-DAG: sldi [[REG3:[0-9]+]], [[REG2]], 32		; CHECK-DAG: rldic [[REG3:[0-9]+]], [[REG2]], 34, 5
; CHECK-DAG: oris [[REG4:[0-9]+]], [[REG3]], 25464		; CHECK-DAG: oris [[REG4:[0-9]+]], [[REG3]], 25464
; CHECK: and 3, [[REG6]], [[REG4]]		; CHECK: and 3, [[REG6]], [[REG4]]
; CHECK: blr		; CHECK: blr
}		}

define i64 @test10(i64 %i0, i64 %i1) #0 {		define i64 @test10(i64 %i0, i64 %i1) #0 {
entry:		entry:
%0 = shl i64 %i0, 37		%0 = shl i64 %i0, 37
%and = and i64 %0, 15881483390550016		%and = and i64 %0, 15881483390550016
%1 = shl i64 %i0, 25		%1 = shl i64 %i0, 25
%and3 = and i64 %1, 2473599172608		%and3 = and i64 %1, 2473599172608
%or4 = or i64 %and, %and3		%or4 = or i64 %and, %and3
ret i64 %or4		ret i64 %or4

; CHECK-LABEL: @test10		; CHECK-LABEL: @test10
; CHECK-DAG: lis [[REG1:[0-9]+]], 1		; CHECK-DAG: lis [[REG1:[0-9]+]], 1
; CHECK-DAG: rotldi [[REG6:[0-9]+]], 3, 25		; CHECK-DAG: rotldi [[REG6:[0-9]+]], 3, 25
; CHECK-DAG: rotldi [[REG7:[0-9]+]], 3, 37		; CHECK-DAG: rotldi [[REG7:[0-9]+]], 3, 37
; CHECK-DAG: ori [[REG2:[0-9]+]], [[REG1]], 8183		; CHECK-DAG: ori [[REG2:[0-9]+]], [[REG1]], 8183
; CHECK-DAG: ori [[REG3:[0-9]+]], [[REG1]], 50017		; CHECK-DAG: li [[REG3:[0-9]+]], -15519
; CHECK-DAG: sldi [[REG4:[0-9]+]], [[REG2]], 25		; CHECK-DAG: rldic [[REG4:[0-9]+]], [[REG2]], 25, 22
; CHECK-DAG: sldi [[REG5:[0-9]+]], [[REG3]], 37		; CHECK-DAG: rldic [[REG5:[0-9]+]], [[REG3]], 37, 10
; CHECK-DAG: and [[REG8:[0-9]+]], [[REG6]], [[REG4]]		; CHECK-DAG: and [[REG8:[0-9]+]], [[REG6]], [[REG4]]
; CHECK-DAG: and [[REG9:[0-9]+]], [[REG7]], [[REG5]]		; CHECK-DAG: and [[REG9:[0-9]+]], [[REG7]], [[REG5]]
; CHECK: or 3, [[REG9]], [[REG8]]		; CHECK: or 3, [[REG9]], [[REG8]]
; CHECK: blr		; CHECK: blr
}		}

define i64 @test11(i64 %x) #0 {		define i64 @test11(i64 %x) #0 {
entry:		entry:
▲ Show 20 Lines • Show All 88 Lines • Show Last 20 Lines

llvm/test/CodeGen/PowerPC/combine_ext_trunc.ll

Show All 32 Lines	; CHECK-NEXT: blr
%c = or i32 %b, %y		%c = or i32 %b, %y
ret i32 %c		ret i32 %c
}		}

; fold (and (select Cond, 0, -1), X) to (select Cond, 0, X)		; fold (and (select Cond, 0, -1), X) to (select Cond, 0, X)
define i32 @pattern3(i1 %cond, i32 %x) {		define i32 @pattern3(i1 %cond, i32 %x) {
; CHECK-LABEL: pattern3:		; CHECK-LABEL: pattern3:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: li 5, 0		; CHECK-NEXT: li 5, -1
; CHECK-NEXT: andi. 3, 3, 1		; CHECK-NEXT: andi. 3, 3, 1
; CHECK-NEXT: oris 3, 5, 65535		; CHECK-NEXT: rldic 3, 5, 0, 32
; CHECK-NEXT: ori 3, 3, 65535
; CHECK-NEXT: iselgt 3, 0, 3		; CHECK-NEXT: iselgt 3, 0, 3
; CHECK-NEXT: and 3, 3, 4		; CHECK-NEXT: and 3, 3, 4
; CHECK-NEXT: blr		; CHECK-NEXT: blr
%sel = select i1 %cond, i32 0, i32 -1		%sel = select i1 %cond, i32 0, i32 -1
%res = and i32 %sel, %x		%res = and i32 %sel, %x
ret i32 %res		ret i32 %res
}		}

; fold (or X, (select Cond, -1, 0)) to (select Cond, -1, X)		; fold (or X, (select Cond, -1, 0)) to (select Cond, -1, X)
define i32 @pattern4(i1 %cond, i32 %x) {		define i32 @pattern4(i1 %cond, i32 %x) {
; CHECK-LABEL: pattern4:		; CHECK-LABEL: pattern4:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: li 5, 0		; CHECK-NEXT: li 5, -1
; CHECK-NEXT: andi. 3, 3, 1		; CHECK-NEXT: andi. 3, 3, 1
; CHECK-NEXT: oris 3, 5, 65535		; CHECK-NEXT: rldic 3, 5, 0, 32
; CHECK-NEXT: ori 3, 3, 65535		; CHECK-NEXT: li 5, 0
; CHECK-NEXT: iselgt 3, 3, 5		; CHECK-NEXT: iselgt 3, 3, 5
; CHECK-NEXT: or 3, 4, 3		; CHECK-NEXT: or 3, 4, 3
; CHECK-NEXT: blr		; CHECK-NEXT: blr
%sel = select i1 %cond, i32 -1, i32 0		%sel = select i1 %cond, i32 -1, i32 0
%res = or i32 %x, %sel		%res = or i32 %x, %sel
ret i32 %res		ret i32 %res
}		}

llvm/test/CodeGen/PowerPC/constants-i64.ll

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: llc -verify-machineinstrs -mcpu=ppc64 < %s \| FileCheck %s			; RUN: llc -verify-machineinstrs -mcpu=ppc64 < %s \| FileCheck %s
	target datalayout = "E-m:e-i64:64-n32:64"			target datalayout = "E-m:e-i64:64-n32:64"
	target triple = "powerpc64-unknown-linux-gnu"			target triple = "powerpc64-unknown-linux-gnu"

	; Function Attrs: nounwind readnone			; Function Attrs: nounwind readnone
	define i64 @cn1() #0 {			define i64 @cn1() #0 {
	; CHECK-LABEL: cn1:			; CHECK-LABEL: cn1:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: lis 3, -1			; CHECK-NEXT: li 3, -1
	; CHECK-NEXT: rldicr 3, 3, 48, 63			; CHECK-NEXT: rldic 3, 3, 0, 16
	; CHECK-NEXT: blr			; CHECK-NEXT: blr
	entry:			entry:
	ret i64 281474976710655			ret i64 281474976710655

	}			}

	; Function Attrs: nounwind readnone			; Function Attrs: nounwind readnone
	define i64 @cnb() #0 {			define i64 @cnb() #0 {
	; CHECK-LABEL: cnb:			; CHECK-LABEL: cnb:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: lis 3, -81			; CHECK-NEXT: li 3, -81
	; CHECK-NEXT: rldicr 3, 3, 48, 63			; CHECK-NEXT: rldic 3, 3, 0, 16
	; CHECK-NEXT: blr			; CHECK-NEXT: blr
	entry:			entry:
	ret i64 281474976710575			ret i64 281474976710575

	}			}

	; Function Attrs: nounwind readnone			; Function Attrs: nounwind readnone
	define i64 @f2(i64 %x) #0 {			define i64 @f2(i64 %x) #0 {
	; CHECK-LABEL: f2:			; CHECK-LABEL: f2:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: li 3, -1			; CHECK-NEXT: li 3, -1
	; CHECK-NEXT: sldi 3, 3, 36			; CHECK-NEXT: rldic 3, 3, 36, 0
	; CHECK-NEXT: blr			; CHECK-NEXT: blr
	entry:			entry:
	ret i64 -68719476736			ret i64 -68719476736

	}			}

	; Function Attrs: nounwind readnone			; Function Attrs: nounwind readnone
	define i64 @f2a(i64 %x) #0 {			define i64 @f2a(i64 %x) #0 {
	; CHECK-LABEL: f2a:			; CHECK-LABEL: f2a:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: li 3, -337			; CHECK-NEXT: li 3, -337
	; CHECK-NEXT: sldi 3, 3, 30			; CHECK-NEXT: rldic 3, 3, 30, 0
	; CHECK-NEXT: blr			; CHECK-NEXT: blr
	entry:			entry:
	ret i64 -361850994688			ret i64 -361850994688

	}			}

	; Function Attrs: nounwind readnone			; Function Attrs: nounwind readnone
	define i64 @f2n(i64 %x) #0 {			define i64 @f2n(i64 %x) #0 {
	; CHECK-LABEL: f2n:			; CHECK-LABEL: f2n:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: lis 3, -4096			; CHECK-NEXT: li 3, -1
	; CHECK-NEXT: rldicr 3, 3, 36, 63			; CHECK-NEXT: rldic 3, 3, 0, 28
	; CHECK-NEXT: blr			; CHECK-NEXT: blr
	entry:			entry:
	ret i64 68719476735			ret i64 68719476735

	}			}

	; Function Attrs: nounwind readnone			; Function Attrs: nounwind readnone
	define i64 @f3(i64 %x) #0 {			define i64 @f3(i64 %x) #0 {
	; CHECK-LABEL: f3:			; CHECK-LABEL: f3:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: lis 3, -32768			; CHECK-NEXT: li 3, -1
	; CHECK-NEXT: rldicr 3, 3, 33, 63			; CHECK-NEXT: rldic 3, 3, 0, 31
	; CHECK-NEXT: blr			; CHECK-NEXT: blr
	entry:			entry:
	ret i64 8589934591			ret i64 8589934591

	}			}

	; Function Attrs: nounwind readnone			; Function Attrs: nounwind readnone
	define i64 @cn2n() #0 {			define i64 @cn2n() #0 {
	; CHECK-LABEL: cn2n:			; CHECK-LABEL: cn2n:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: lis 3, -5121			; CHECK-NEXT: lis 3, -5121
	; CHECK-NEXT: ori 3, 3, 65534			; CHECK-NEXT: ori 3, 3, 65534
	; CHECK-NEXT: rldicr 3, 3, 22, 63			; CHECK-NEXT: rotldi 3, 3, 22
	; CHECK-NEXT: blr			; CHECK-NEXT: blr
	entry:			entry:
	ret i64 -1407374887747585			ret i64 -1407374887747585

	}			}

	define i64 @uint32_1() #0 {			define i64 @uint32_1() #0 {
	; CHECK-LABEL: uint32_1:			; CHECK-LABEL: uint32_1:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: lis 3, 232			; CHECK-NEXT: li 3, 18176
	; CHECK-NEXT: ori 3, 3, 30023			; CHECK-NEXT: oris 3, 3, 59509
	; CHECK-NEXT: sldi 3, 3, 8
	; CHECK-NEXT: blr			; CHECK-NEXT: blr
	entry:			entry:
	ret i64 3900000000			ret i64 3900000000

	}			}

	define i32 @uint32_1_i32() #0 {			define i32 @uint32_1_i32() #0 {
	; CHECK-LABEL: uint32_1_i32:			; CHECK-LABEL: uint32_1_i32:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: lis 3, 232			; CHECK-NEXT: li 3, 18176
	; CHECK-NEXT: ori 3, 3, 30023			; CHECK-NEXT: oris 3, 3, 59509
	; CHECK-NEXT: sldi 3, 3, 8
	; CHECK-NEXT: blr			; CHECK-NEXT: blr
	entry:			entry:
	ret i32 -394967296			ret i32 -394967296

	}			}

	define i64 @uint32_2() #0 {			define i64 @uint32_2() #0 {
	; CHECK-LABEL: uint32_2:			; CHECK-LABEL: uint32_2:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: li 3, 0			; CHECK-NEXT: li 3, -1
	; CHECK-NEXT: oris 3, 3, 65535			; CHECK-NEXT: rldic 3, 3, 0, 32
	; CHECK-NEXT: ori 3, 3, 65535
	; CHECK-NEXT: blr			; CHECK-NEXT: blr
	entry:			entry:
	ret i64 4294967295			ret i64 4294967295

	}			}

	define i32 @uint32_2_i32() #0 {			define i32 @uint32_2_i32() #0 {
	; CHECK-LABEL: uint32_2_i32:			; CHECK-LABEL: uint32_2_i32:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: li 3, 0			; CHECK-NEXT: li 3, -1
	; CHECK-NEXT: oris 3, 3, 65535			; CHECK-NEXT: rldic 3, 3, 0, 32
	; CHECK-NEXT: ori 3, 3, 65535
	; CHECK-NEXT: blr			; CHECK-NEXT: blr
	entry:			entry:
	ret i32 -1			ret i32 -1

	}			}

	define i64 @uint32_3() #0 {			define i64 @uint32_3() #0 {
	; CHECK-LABEL: uint32_3:			; CHECK-LABEL: uint32_3:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: li 3, 1			; CHECK-NEXT: li 3, 1
	; CHECK-NEXT: sldi 3, 3, 31			; CHECK-NEXT: rldic 3, 3, 31, 32
	; CHECK-NEXT: blr			; CHECK-NEXT: blr
	entry:			entry:
	ret i64 2147483648			ret i64 2147483648

	}			}

	define i64 @uint32_4() #0 {			define i64 @uint32_4() #0 {
	; CHECK-LABEL: uint32_4:			; CHECK-LABEL: uint32_4:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: li 3, 29			; CHECK-NEXT: lis 3, -6027
	; CHECK-NEXT: sldi 3, 3, 32			; CHECK-NEXT: ori 3, 3, 18177
	; CHECK-NEXT: oris 3, 3, 3752			; CHECK-NEXT: rldic 3, 3, 5, 27
	; CHECK-NEXT: ori 3, 3, 57376
	; CHECK-NEXT: blr			; CHECK-NEXT: blr
	entry:			entry:
	ret i64 124800000032			ret i64 124800000032

	}			}

	define i64 @cn_ones_1() #0 {			define i64 @cn_ones_1() #0 {
	; CHECK-LABEL: cn_ones_1:			; CHECK-LABEL: cn_ones_1:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: li 3, 2			; CHECK-NEXT: li 3, -25633
	; CHECK-NEXT: sldi 3, 3, 32			; CHECK-NEXT: rldicl 3, 3, 18, 30
	; CHECK-NEXT: oris 3, 3, 28543
	; CHECK-NEXT: ori 3, 3, 65535
	; CHECK-NEXT: blr			; CHECK-NEXT: blr
	entry:			entry:
	ret i64 10460594175			ret i64 10460594175

	}			}

	define i64 @cn_ones_2() #0 {			define i64 @cn_ones_2() #0 {
	; CHECK-LABEL: cn_ones_2:			; CHECK-LABEL: cn_ones_2:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: li 3, 2			; CHECK-NEXT: lis 3, -25638
	; CHECK-NEXT: sldi 3, 3, 32			; CHECK-NEXT: ori 3, 3, 24575
	; CHECK-NEXT: oris 3, 3, 28521			; CHECK-NEXT: rldicl 3, 3, 2, 30
	; CHECK-NEXT: ori 3, 3, 32767
	; CHECK-NEXT: blr			; CHECK-NEXT: blr
	entry:			entry:
	ret i64 10459119615			ret i64 10459119615

	}			}

	define i64 @imm1() #0 {			define i64 @imm1() #0 {
	; CHECK-LABEL: imm1:			; CHECK-LABEL: imm1:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: li 3, 8465			; CHECK-NEXT: li 3, 8465
	; CHECK-NEXT: sldi 3, 3, 28			; CHECK-NEXT: rldic 3, 3, 28, 22
	; CHECK-NEXT: blr			; CHECK-NEXT: blr
	entry:			entry:
	ret i64 2272306135040 ;0x21110000000			ret i64 2272306135040 ;0x21110000000
	}			}

	define i64 @imm2() #0 {			define i64 @imm2() #0 {
	; CHECK-LABEL: imm2:			; CHECK-LABEL: imm2:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: li 3, 0			; CHECK-NEXT: li 3, -28536
	; CHECK-NEXT: oris 3, 3, 65535			; CHECK-NEXT: rldicl 3, 3, 1, 32
	; CHECK-NEXT: ori 3, 3, 8465
	; CHECK-NEXT: blr			; CHECK-NEXT: blr
	entry:			entry:
	ret i64 4294910225 ;0xFFFF2111			ret i64 4294910225 ;0xFFFF2111
	}			}

	define i64 @imm3() #0 {			define i64 @imm3() #0 {
	; CHECK-LABEL: imm3:			; CHECK-LABEL: imm3:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: li 3, 0			; CHECK-NEXT: li 3, -32495
	; CHECK-NEXT: oris 3, 3, 65535			; CHECK-NEXT: rldic 3, 3, 0, 32
	; CHECK-NEXT: ori 3, 3, 33041
	; CHECK-NEXT: blr			; CHECK-NEXT: blr
	entry:			entry:
	ret i64 4294934801 ;0xFFFF8111			ret i64 4294934801 ;0xFFFF8111
	}			}

	define i64 @imm4() #0 {			define i64 @imm4() #0 {
	; CHECK-LABEL: imm4:			; CHECK-LABEL: imm4:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: lis 3, 33			; CHECK-NEXT: lis 3, 33
	; CHECK-NEXT: ori 3, 3, 4352			; CHECK-NEXT: ori 3, 3, 4352
	; CHECK-NEXT: rldimi 3, 3, 32, 0			; CHECK-NEXT: rldimi 3, 3, 32, 0
	; CHECK-NEXT: blr			; CHECK-NEXT: blr
	entry:			entry:
	ret i64 9307365931290880 ;0x21110000211100			ret i64 9307365931290880 ;0x21110000211100
	}			}

	define i64 @imm5() #0 {			define i64 @imm5() #0 {
	; CHECK-LABEL: imm5:			; CHECK-LABEL: imm5:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: li 3, 28685			; CHECK-NEXT: li 3, 28685
	; CHECK-NEXT: rldicr 3, 3, 52, 63			; CHECK-NEXT: rotldi 3, 3, 52
	; CHECK-NEXT: blr			; CHECK-NEXT: blr
	entry:			entry:
	ret i64 58546795155816455 ;0xd0000000000007			ret i64 58546795155816455 ;0xd0000000000007
	}			}

	define i64 @imm6() #0 {			define i64 @imm6() #0 {
	; CHECK-LABEL: imm6:			; CHECK-LABEL: imm6:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: lis 3, -1			; CHECK-NEXT: lis 3, -1
	; CHECK-NEXT: ori 3, 3, 28674			; CHECK-NEXT: ori 3, 3, 28674
	; CHECK-NEXT: rldicr 3, 3, 52, 63			; CHECK-NEXT: rotldi 3, 3, 52
	; CHECK-NEXT: blr			; CHECK-NEXT: blr
	entry:			entry:
	ret i64 13510798882111479 ;0x2ffffffffffff7			ret i64 13510798882111479 ;0x2ffffffffffff7
	}			}

	define i64 @imm7() #0 {			define i64 @imm7() #0 {
	; CHECK-LABEL: imm7:			; CHECK-LABEL: imm7:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: li 3, 0			; CHECK-NEXT: li 3, -3823
	; CHECK-NEXT: ori 3, 3, 61713			; CHECK-NEXT: rldic 3, 3, 28, 20
	; CHECK-NEXT: sldi 3, 3, 28
	; CHECK-NEXT: blr			; CHECK-NEXT: blr
	entry:			entry:
	ret i64 16565957296128 ;0xf1110000000			ret i64 16565957296128 ;0xf1110000000
	}			}

	define i64 @imm8() #0 {			define i64 @imm8() #0 {
	; CHECK-LABEL: imm8:			; CHECK-LABEL: imm8:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: lis 3, 15			; CHECK-NEXT: li 3, -7919
	; CHECK-NEXT: ori 3, 3, 57617			; CHECK-NEXT: rldic 3, 3, 22, 22
	; CHECK-NEXT: sldi 3, 3, 22
	; CHECK-NEXT: blr			; CHECK-NEXT: blr
	entry:			entry:
	ret i64 4364831817728 ;0x3f844400000			ret i64 4364831817728 ;0x3f844400000
	}			}

	define i64 @imm9() #0 {			define i64 @imm9() #0 {
	; CHECK-LABEL: imm9:			; CHECK-LABEL: imm9:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: lis 3, -1			; CHECK-NEXT: lis 3, -1
	; CHECK-NEXT: ori 3, 3, 28674			; CHECK-NEXT: ori 3, 3, 28674
	; CHECK-NEXT: rldicr 3, 3, 52, 63			; CHECK-NEXT: rotldi 3, 3, 52
	; CHECK-NEXT: blr			; CHECK-NEXT: blr
	entry:			entry:
	ret i64 13510798882111479 ;0x2ffffffffffff7			ret i64 13510798882111479 ;0x2ffffffffffff7
	}			}

	define i64 @imm10() #0 {			define i64 @imm10() #0 {
	; CHECK-LABEL: imm10:			; CHECK-LABEL: imm10:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: li 3, 0			; CHECK-NEXT: li 3, -3823
	; CHECK-NEXT: ori 3, 3, 61713			; CHECK-NEXT: rldic 3, 3, 28, 20
	; CHECK-NEXT: sldi 3, 3, 28
	; CHECK-NEXT: blr			; CHECK-NEXT: blr
	entry:			entry:
	ret i64 16565957296128 ;0xf1110000000			ret i64 16565957296128 ;0xf1110000000
	}			}

	define i64 @imm11() #0 {			define i64 @imm11() #0 {
	; CHECK-LABEL: imm11:			; CHECK-LABEL: imm11:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: lis 3, 15			; CHECK-NEXT: li 3, -7919
	; CHECK-NEXT: ori 3, 3, 57617			; CHECK-NEXT: rldic 3, 3, 22, 22
	; CHECK-NEXT: sldi 3, 3, 22
	; CHECK-NEXT: blr			; CHECK-NEXT: blr
	entry:			entry:
	ret i64 4364831817728 ;0x3f844400000			ret i64 4364831817728 ;0x3f844400000
	}			}

	define i64 @imm12() #0 {			define i64 @imm12() #0 {
	; CHECK-LABEL: imm12:			; CHECK-LABEL: imm12:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: li 3, 4094			; CHECK-NEXT: lis 3, -29
	; CHECK-NEXT: sldi 3, 3, 32			; CHECK-NEXT: ori 3, 3, 64577
	; CHECK-NEXT: oris 3, 3, 16324			; CHECK-NEXT: rldic 3, 3, 12, 20
	; CHECK-NEXT: ori 3, 3, 4096
	; CHECK-NEXT: blr			; CHECK-NEXT: blr
	entry:			entry:
	ret i64 17584665923584 ;0xffe3fc41000			ret i64 17584665923584 ;0xffe3fc41000
	}			}

	define i64 @imm13() #0 {			define i64 @imm13() #0 {
	; CHECK-LABEL: imm13:			; CHECK-LABEL: imm13:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: li 3, 19			; CHECK-NEXT: li 3, -24847
	; CHECK-NEXT: sldi 3, 3, 32			; CHECK-NEXT: rldicl 3, 3, 21, 27
	; CHECK-NEXT: oris 3, 3, 56895
	; CHECK-NEXT: ori 3, 3, 65535
	; CHECK-NEXT: blr			; CHECK-NEXT: blr
	entry:			entry:
	ret i64 85333114879 ;0x13de3fffff			ret i64 85333114879 ;0x13de3fffff
	}			}

	define i64 @imm13_2() #0 {			define i64 @imm13_2() #0 {
	; CHECK-LABEL: imm13_2:			; CHECK-LABEL: imm13_2:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: li 3, 51			; CHECK-NEXT: li 3, -12424
	; CHECK-NEXT: sldi 3, 3, 32			; CHECK-NEXT: rldicl 3, 3, 22, 26
	; CHECK-NEXT: oris 3, 3, 56895
	; CHECK-NEXT: ori 3, 3, 65535
	; CHECK-NEXT: blr			; CHECK-NEXT: blr
	entry:			entry:
	ret i64 222772068351 ;0x33de3fffff			ret i64 222772068351 ;0x33de3fffff
	}			}

	define i64 @imm14() #0 {			define i64 @imm14() #0 {
	; CHECK-LABEL: imm14:			; CHECK-LABEL: imm14:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: li 3, 254			; CHECK-NEXT: li 3, -3960
	; CHECK-NEXT: sldi 3, 3, 32			; CHECK-NEXT: rldicl 3, 3, 21, 24
	; CHECK-NEXT: oris 3, 3, 4383
	; CHECK-NEXT: ori 3, 3, 65535
	; CHECK-NEXT: blr			; CHECK-NEXT: blr
	entry:			entry:
	ret i64 1091209003007 ;0xfe111fffff			ret i64 1091209003007 ;0xfe111fffff
	}			}

	define i64 @imm15() #0 {			define i64 @imm15() #0 {
	; CHECK-LABEL: imm15:			; CHECK-LABEL: imm15:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: li 3, -8065			; CHECK-NEXT: li 3, -8065
	; CHECK-NEXT: sldi 3, 3, 24			; CHECK-NEXT: rldic 3, 3, 24, 0
	; CHECK-NEXT: blr			; CHECK-NEXT: blr
	entry:			entry:
	ret i64 -135308247040			ret i64 -135308247040
	}			}

	define i64 @imm16() #0 {			define i64 @imm16() #0 {
	; CHECK-LABEL: imm16:			; CHECK-LABEL: imm16:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: li 3, -16392			; CHECK-NEXT: lis 3, -16392
	; CHECK-NEXT: sldi 3, 3, 32			; CHECK-NEXT: ori 3, 3, 57217
	; CHECK-NEXT: oris 3, 3, 57217			; CHECK-NEXT: rldic 3, 3, 16, 0
	; CHECK-NEXT: blr			; CHECK-NEXT: blr
	entry:			entry:
	ret i64 -70399354142720			ret i64 -70399354142720
	}			}

	define i64 @imm17() #0 {			define i64 @imm17() #0 {
	; CHECK-LABEL: imm17:			; CHECK-LABEL: imm17:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: lis 3, 158			; CHECK-NEXT: lis 3, 20344
	; CHECK-NEXT: sldi 3, 3, 32			; CHECK-NEXT: ori 3, 3, 32847
	; CHECK-NEXT: ori 3, 3, 40689			; CHECK-NEXT: rotldi 3, 3, 49
	; CHECK-NEXT: blr			; CHECK-NEXT: blr
	entry:			entry:
	ret i64 44473046320324337 ;0x9e000000009ef1			ret i64 44473046320324337 ;0x9e000000009ef1
	}			}

	define i64 @imm18() #0 {			define i64 @imm18() #0 {
	; CHECK-LABEL: imm18:			; CHECK-LABEL: imm18:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: li 3, 2			; CHECK-NEXT: li 3, 1
	; CHECK-NEXT: sldi 3, 3, 32			; CHECK-NEXT: rldic 3, 3, 33, 30
	; CHECK-NEXT: oris 3, 3, 39436			; CHECK-NEXT: oris 3, 3, 39436
	; CHECK-NEXT: ori 3, 3, 61633			; CHECK-NEXT: ori 3, 3, 61633
	; CHECK-NEXT: blr			; CHECK-NEXT: blr
	entry:			entry:
	ret i64 11174473921			ret i64 11174473921
	}			}

	attributes #0 = { nounwind readnone }			attributes #0 = { nounwind readnone }

llvm/test/CodeGen/PowerPC/f128-fma.ll

	Show First 20 Lines • Show All 221 Lines • ▼ Show 20 Lines
	; CHECK-P8-NEXT: mr r5, r3			; CHECK-P8-NEXT: mr r5, r3
	; CHECK-P8-NEXT: mr r6, r4			; CHECK-P8-NEXT: mr r6, r4
	; CHECK-P8-NEXT: mr r3, r30			; CHECK-P8-NEXT: mr r3, r30
	; CHECK-P8-NEXT: mr r4, r29			; CHECK-P8-NEXT: mr r4, r29
	; CHECK-P8-NEXT: bl __addkf3			; CHECK-P8-NEXT: bl __addkf3
	; CHECK-P8-NEXT: nop			; CHECK-P8-NEXT: nop
	; CHECK-P8-NEXT: li r5, 1			; CHECK-P8-NEXT: li r5, 1
	; CHECK-P8-NEXT: std r3, 0(r28)			; CHECK-P8-NEXT: std r3, 0(r28)
	; CHECK-P8-NEXT: sldi r5, r5, 63			; CHECK-P8-NEXT: rldic r5, r5, 63, 0
	; CHECK-P8-NEXT: xor r4, r4, r5			; CHECK-P8-NEXT: xor r4, r4, r5
	; CHECK-P8-NEXT: std r4, 8(r28)			; CHECK-P8-NEXT: std r4, 8(r28)
	; CHECK-P8-NEXT: addi r1, r1, 64			; CHECK-P8-NEXT: addi r1, r1, 64
	; CHECK-P8-NEXT: ld r0, 16(r1)			; CHECK-P8-NEXT: ld r0, 16(r1)
	; CHECK-P8-NEXT: ld r30, -16(r1) # 8-byte Folded Reload			; CHECK-P8-NEXT: ld r30, -16(r1) # 8-byte Folded Reload
	; CHECK-P8-NEXT: ld r29, -24(r1) # 8-byte Folded Reload			; CHECK-P8-NEXT: ld r29, -24(r1) # 8-byte Folded Reload
	; CHECK-P8-NEXT: ld r28, -32(r1) # 8-byte Folded Reload			; CHECK-P8-NEXT: ld r28, -32(r1) # 8-byte Folded Reload
	; CHECK-P8-NEXT: mtlr r0			; CHECK-P8-NEXT: mtlr r0
	▲ Show 20 Lines • Show All 45 Lines • ▼ Show 20 Lines
	; CHECK-P8-NEXT: bl __mulkf3			; CHECK-P8-NEXT: bl __mulkf3
	; CHECK-P8-NEXT: nop			; CHECK-P8-NEXT: nop
	; CHECK-P8-NEXT: ld r5, 0(r29)			; CHECK-P8-NEXT: ld r5, 0(r29)
	; CHECK-P8-NEXT: ld r6, 8(r29)			; CHECK-P8-NEXT: ld r6, 8(r29)
	; CHECK-P8-NEXT: bl __addkf3			; CHECK-P8-NEXT: bl __addkf3
	; CHECK-P8-NEXT: nop			; CHECK-P8-NEXT: nop
	; CHECK-P8-NEXT: li r5, 1			; CHECK-P8-NEXT: li r5, 1
	; CHECK-P8-NEXT: std r3, 0(r30)			; CHECK-P8-NEXT: std r3, 0(r30)
	; CHECK-P8-NEXT: sldi r5, r5, 63			; CHECK-P8-NEXT: rldic r5, r5, 63, 0
	; CHECK-P8-NEXT: xor r4, r4, r5			; CHECK-P8-NEXT: xor r4, r4, r5
	; CHECK-P8-NEXT: std r4, 8(r30)			; CHECK-P8-NEXT: std r4, 8(r30)
	; CHECK-P8-NEXT: addi r1, r1, 64			; CHECK-P8-NEXT: addi r1, r1, 64
	; CHECK-P8-NEXT: ld r0, 16(r1)			; CHECK-P8-NEXT: ld r0, 16(r1)
	; CHECK-P8-NEXT: ld r30, -16(r1) # 8-byte Folded Reload			; CHECK-P8-NEXT: ld r30, -16(r1) # 8-byte Folded Reload
	; CHECK-P8-NEXT: ld r29, -24(r1) # 8-byte Folded Reload			; CHECK-P8-NEXT: ld r29, -24(r1) # 8-byte Folded Reload
	; CHECK-P8-NEXT: mtlr r0			; CHECK-P8-NEXT: mtlr r0
	; CHECK-P8-NEXT: blr			; CHECK-P8-NEXT: blr
	▲ Show 20 Lines • Show All 168 Lines • ▼ Show 20 Lines
	; CHECK-P8-NEXT: mr r5, r3			; CHECK-P8-NEXT: mr r5, r3
	; CHECK-P8-NEXT: mr r6, r4			; CHECK-P8-NEXT: mr r6, r4
	; CHECK-P8-NEXT: mr r3, r30			; CHECK-P8-NEXT: mr r3, r30
	; CHECK-P8-NEXT: mr r4, r29			; CHECK-P8-NEXT: mr r4, r29
	; CHECK-P8-NEXT: bl __subkf3			; CHECK-P8-NEXT: bl __subkf3
	; CHECK-P8-NEXT: nop			; CHECK-P8-NEXT: nop
	; CHECK-P8-NEXT: li r5, 1			; CHECK-P8-NEXT: li r5, 1
	; CHECK-P8-NEXT: std r3, 0(r28)			; CHECK-P8-NEXT: std r3, 0(r28)
	; CHECK-P8-NEXT: sldi r5, r5, 63			; CHECK-P8-NEXT: rldic r5, r5, 63, 0
	; CHECK-P8-NEXT: xor r4, r4, r5			; CHECK-P8-NEXT: xor r4, r4, r5
	; CHECK-P8-NEXT: std r4, 8(r28)			; CHECK-P8-NEXT: std r4, 8(r28)
	; CHECK-P8-NEXT: addi r1, r1, 64			; CHECK-P8-NEXT: addi r1, r1, 64
	; CHECK-P8-NEXT: ld r0, 16(r1)			; CHECK-P8-NEXT: ld r0, 16(r1)
	; CHECK-P8-NEXT: ld r30, -16(r1) # 8-byte Folded Reload			; CHECK-P8-NEXT: ld r30, -16(r1) # 8-byte Folded Reload
	; CHECK-P8-NEXT: ld r29, -24(r1) # 8-byte Folded Reload			; CHECK-P8-NEXT: ld r29, -24(r1) # 8-byte Folded Reload
	; CHECK-P8-NEXT: ld r28, -32(r1) # 8-byte Folded Reload			; CHECK-P8-NEXT: ld r28, -32(r1) # 8-byte Folded Reload
	; CHECK-P8-NEXT: mtlr r0			; CHECK-P8-NEXT: mtlr r0
	▲ Show 20 Lines • Show All 45 Lines • ▼ Show 20 Lines
	; CHECK-P8-NEXT: bl __mulkf3			; CHECK-P8-NEXT: bl __mulkf3
	; CHECK-P8-NEXT: nop			; CHECK-P8-NEXT: nop
	; CHECK-P8-NEXT: ld r5, 0(r29)			; CHECK-P8-NEXT: ld r5, 0(r29)
	; CHECK-P8-NEXT: ld r6, 8(r29)			; CHECK-P8-NEXT: ld r6, 8(r29)
	; CHECK-P8-NEXT: bl __subkf3			; CHECK-P8-NEXT: bl __subkf3
	; CHECK-P8-NEXT: nop			; CHECK-P8-NEXT: nop
	; CHECK-P8-NEXT: li r5, 1			; CHECK-P8-NEXT: li r5, 1
	; CHECK-P8-NEXT: std r3, 0(r30)			; CHECK-P8-NEXT: std r3, 0(r30)
	; CHECK-P8-NEXT: sldi r5, r5, 63			; CHECK-P8-NEXT: rldic r5, r5, 63, 0
	; CHECK-P8-NEXT: xor r4, r4, r5			; CHECK-P8-NEXT: xor r4, r4, r5
	; CHECK-P8-NEXT: std r4, 8(r30)			; CHECK-P8-NEXT: std r4, 8(r30)
	; CHECK-P8-NEXT: addi r1, r1, 64			; CHECK-P8-NEXT: addi r1, r1, 64
	; CHECK-P8-NEXT: ld r0, 16(r1)			; CHECK-P8-NEXT: ld r0, 16(r1)
	; CHECK-P8-NEXT: ld r30, -16(r1) # 8-byte Folded Reload			; CHECK-P8-NEXT: ld r30, -16(r1) # 8-byte Folded Reload
	; CHECK-P8-NEXT: ld r29, -24(r1) # 8-byte Folded Reload			; CHECK-P8-NEXT: ld r29, -24(r1) # 8-byte Folded Reload
	; CHECK-P8-NEXT: mtlr r0			; CHECK-P8-NEXT: mtlr r0
	; CHECK-P8-NEXT: blr			; CHECK-P8-NEXT: blr
	Show All 12 Lines

llvm/test/CodeGen/PowerPC/f128-passByValue.ll

	Show All 12 Lines
	; CHECK-NEXT: addi r3, r3, .LCPI0_0@toc@l			; CHECK-NEXT: addi r3, r3, .LCPI0_0@toc@l
	; CHECK-NEXT: lxvx v2, 0, r3			; CHECK-NEXT: lxvx v2, 0, r3
	; CHECK-NEXT: blr			; CHECK-NEXT: blr
	;			;
	; CHECK-P8-LABEL: loadConstant:			; CHECK-P8-LABEL: loadConstant:
	; CHECK-P8: # %bb.0: # %entry			; CHECK-P8: # %bb.0: # %entry
	; CHECK-P8-NEXT: lis r3, 1			; CHECK-P8-NEXT: lis r3, 1
	; CHECK-P8-NEXT: ori r3, r3, 5			; CHECK-P8-NEXT: ori r3, r3, 5
	; CHECK-P8-NEXT: sldi r4, r3, 46			; CHECK-P8-NEXT: rldic r4, r3, 46, 1
	; CHECK-P8-NEXT: li r3, 0			; CHECK-P8-NEXT: li r3, 0
	; CHECK-P8-NEXT: blr			; CHECK-P8-NEXT: blr
	entry:			entry:
	ret fp128 0xL00000000000000004001400000000000			ret fp128 0xL00000000000000004001400000000000
	}			}

	; Function Attrs: norecurse nounwind readnone			; Function Attrs: norecurse nounwind readnone
	define fp128 @loadConstant2(fp128 %a, fp128 %b) {			define fp128 @loadConstant2(fp128 %a, fp128 %b) {
	Show All 12 Lines
	; CHECK-P8-NEXT: std r0, 16(r1)			; CHECK-P8-NEXT: std r0, 16(r1)
	; CHECK-P8-NEXT: stdu r1, -32(r1)			; CHECK-P8-NEXT: stdu r1, -32(r1)
	; CHECK-P8-NEXT: .cfi_def_cfa_offset 32			; CHECK-P8-NEXT: .cfi_def_cfa_offset 32
	; CHECK-P8-NEXT: .cfi_offset lr, 16			; CHECK-P8-NEXT: .cfi_offset lr, 16
	; CHECK-P8-NEXT: bl __addkf3			; CHECK-P8-NEXT: bl __addkf3
	; CHECK-P8-NEXT: nop			; CHECK-P8-NEXT: nop
	; CHECK-P8-NEXT: lis r5, 1			; CHECK-P8-NEXT: lis r5, 1
	; CHECK-P8-NEXT: ori r5, r5, 5			; CHECK-P8-NEXT: ori r5, r5, 5
	; CHECK-P8-NEXT: sldi r6, r5, 46			; CHECK-P8-NEXT: rldic r6, r5, 46, 1
	; CHECK-P8-NEXT: li r5, 0			; CHECK-P8-NEXT: li r5, 0
	; CHECK-P8-NEXT: bl __addkf3			; CHECK-P8-NEXT: bl __addkf3
	; CHECK-P8-NEXT: nop			; CHECK-P8-NEXT: nop
	; CHECK-P8-NEXT: addi r1, r1, 32			; CHECK-P8-NEXT: addi r1, r1, 32
	; CHECK-P8-NEXT: ld r0, 16(r1)			; CHECK-P8-NEXT: ld r0, 16(r1)
	; CHECK-P8-NEXT: mtlr r0			; CHECK-P8-NEXT: mtlr r0
	; CHECK-P8-NEXT: blr			; CHECK-P8-NEXT: blr
	entry:			entry:
	▲ Show 20 Lines • Show All 723 Lines • Show Last 20 Lines

llvm/test/CodeGen/PowerPC/fast-isel-pcrel.ll

	Show All 16 Lines
	; CHECK-NEXT: # %bb.0: # %entry			; CHECK-NEXT: # %bb.0: # %entry
	; CHECK-NEXT: mflr r0			; CHECK-NEXT: mflr r0
	; CHECK-NEXT: std r0, 16(r1)			; CHECK-NEXT: std r0, 16(r1)
	; CHECK-NEXT: stdu r1, -112(r1)			; CHECK-NEXT: stdu r1, -112(r1)
	; CHECK-NEXT: std r3, 104(r1)			; CHECK-NEXT: std r3, 104(r1)
	; CHECK-NEXT: paddi r3, 0, .L.str@PCREL, 1			; CHECK-NEXT: paddi r3, 0, .L.str@PCREL, 1
	; CHECK-NEXT: bl printf@notoc			; CHECK-NEXT: bl printf@notoc
	; CHECK-NEXT: ld r4, 104(r1)			; CHECK-NEXT: ld r4, 104(r1)
	; CHECK-NEXT: lis r3, 16403			; CHECK-NEXT: lis r3, 8201
	; CHECK-NEXT: ori r3, r3, 62914			; CHECK-NEXT: ori r3, r3, 64225
	; CHECK-NEXT: sldi r3, r3, 32			; CHECK-NEXT: rldic r3, r3, 33, 1
	; CHECK-NEXT: oris r3, r3, 36700			; CHECK-NEXT: oris r3, r3, 36700
	; CHECK-NEXT: ori r3, r3, 10486			; CHECK-NEXT: ori r3, r3, 10486
	; CHECK-NEXT: std r3, 0(r4)			; CHECK-NEXT: std r3, 0(r4)
	; CHECK-NEXT: addi r1, r1, 112			; CHECK-NEXT: addi r1, r1, 112
	; CHECK-NEXT: ld r0, 16(r1)			; CHECK-NEXT: ld r0, 16(r1)
	; CHECK-NEXT: mtlr r0			; CHECK-NEXT: mtlr r0
	; CHECK-NEXT: blr			; CHECK-NEXT: blr
	entry:			entry:
	Show All 38 Lines

llvm/test/CodeGen/PowerPC/fp-strict-f128.ll

	Show First 20 Lines • Show All 152 Lines • ▼ Show 20 Lines
	; CHECK-P8-LABEL: fmsub_f128:			; CHECK-P8-LABEL: fmsub_f128:
	; CHECK-P8: # %bb.0:			; CHECK-P8: # %bb.0:
	; CHECK-P8-NEXT: mflr r0			; CHECK-P8-NEXT: mflr r0
	; CHECK-P8-NEXT: std r0, 16(r1)			; CHECK-P8-NEXT: std r0, 16(r1)
	; CHECK-P8-NEXT: stdu r1, -32(r1)			; CHECK-P8-NEXT: stdu r1, -32(r1)
	; CHECK-P8-NEXT: .cfi_def_cfa_offset 32			; CHECK-P8-NEXT: .cfi_def_cfa_offset 32
	; CHECK-P8-NEXT: .cfi_offset lr, 16			; CHECK-P8-NEXT: .cfi_offset lr, 16
	; CHECK-P8-NEXT: li r9, 1			; CHECK-P8-NEXT: li r9, 1
	; CHECK-P8-NEXT: sldi r9, r9, 63			; CHECK-P8-NEXT: rldic r9, r9, 63, 0
	; CHECK-P8-NEXT: xor r8, r8, r9			; CHECK-P8-NEXT: xor r8, r8, r9
	; CHECK-P8-NEXT: bl fmal			; CHECK-P8-NEXT: bl fmal
	; CHECK-P8-NEXT: nop			; CHECK-P8-NEXT: nop
	; CHECK-P8-NEXT: addi r1, r1, 32			; CHECK-P8-NEXT: addi r1, r1, 32
	; CHECK-P8-NEXT: ld r0, 16(r1)			; CHECK-P8-NEXT: ld r0, 16(r1)
	; CHECK-P8-NEXT: mtlr r0			; CHECK-P8-NEXT: mtlr r0
	; CHECK-P8-NEXT: blr			; CHECK-P8-NEXT: blr
	%neg = fneg fp128 %f2			%neg = fneg fp128 %f2
	Show All 16 Lines
	; CHECK-P8-NEXT: mflr r0			; CHECK-P8-NEXT: mflr r0
	; CHECK-P8-NEXT: std r0, 16(r1)			; CHECK-P8-NEXT: std r0, 16(r1)
	; CHECK-P8-NEXT: stdu r1, -32(r1)			; CHECK-P8-NEXT: stdu r1, -32(r1)
	; CHECK-P8-NEXT: .cfi_def_cfa_offset 32			; CHECK-P8-NEXT: .cfi_def_cfa_offset 32
	; CHECK-P8-NEXT: .cfi_offset lr, 16			; CHECK-P8-NEXT: .cfi_offset lr, 16
	; CHECK-P8-NEXT: bl fmal			; CHECK-P8-NEXT: bl fmal
	; CHECK-P8-NEXT: nop			; CHECK-P8-NEXT: nop
	; CHECK-P8-NEXT: li r5, 1			; CHECK-P8-NEXT: li r5, 1
	; CHECK-P8-NEXT: sldi r5, r5, 63			; CHECK-P8-NEXT: rldic r5, r5, 63, 0
	; CHECK-P8-NEXT: xor r4, r4, r5			; CHECK-P8-NEXT: xor r4, r4, r5
	; CHECK-P8-NEXT: addi r1, r1, 32			; CHECK-P8-NEXT: addi r1, r1, 32
	; CHECK-P8-NEXT: ld r0, 16(r1)			; CHECK-P8-NEXT: ld r0, 16(r1)
	; CHECK-P8-NEXT: mtlr r0			; CHECK-P8-NEXT: mtlr r0
	; CHECK-P8-NEXT: blr			; CHECK-P8-NEXT: blr
	%fma = call fp128 @llvm.experimental.constrained.fma.f128(			%fma = call fp128 @llvm.experimental.constrained.fma.f128(
	fp128 %f0, fp128 %f1, fp128 %f2,			fp128 %f0, fp128 %f1, fp128 %f2,
	metadata !"round.dynamic",			metadata !"round.dynamic",
	Show All 14 Lines
	; CHECK-P8-NEXT: mflr r0			; CHECK-P8-NEXT: mflr r0
	; CHECK-P8-NEXT: .cfi_def_cfa_offset 48			; CHECK-P8-NEXT: .cfi_def_cfa_offset 48
	; CHECK-P8-NEXT: .cfi_offset lr, 16			; CHECK-P8-NEXT: .cfi_offset lr, 16
	; CHECK-P8-NEXT: .cfi_offset r30, -16			; CHECK-P8-NEXT: .cfi_offset r30, -16
	; CHECK-P8-NEXT: std r30, -16(r1) # 8-byte Folded Spill			; CHECK-P8-NEXT: std r30, -16(r1) # 8-byte Folded Spill
	; CHECK-P8-NEXT: std r0, 16(r1)			; CHECK-P8-NEXT: std r0, 16(r1)
	; CHECK-P8-NEXT: stdu r1, -48(r1)			; CHECK-P8-NEXT: stdu r1, -48(r1)
	; CHECK-P8-NEXT: li r9, 1			; CHECK-P8-NEXT: li r9, 1
	; CHECK-P8-NEXT: sldi r30, r9, 63			; CHECK-P8-NEXT: rldic r30, r9, 63, 0
	; CHECK-P8-NEXT: xor r8, r8, r30			; CHECK-P8-NEXT: xor r8, r8, r30
	; CHECK-P8-NEXT: bl fmal			; CHECK-P8-NEXT: bl fmal
	; CHECK-P8-NEXT: nop			; CHECK-P8-NEXT: nop
	; CHECK-P8-NEXT: xor r4, r4, r30			; CHECK-P8-NEXT: xor r4, r4, r30
	; CHECK-P8-NEXT: addi r1, r1, 48			; CHECK-P8-NEXT: addi r1, r1, 48
	; CHECK-P8-NEXT: ld r0, 16(r1)			; CHECK-P8-NEXT: ld r0, 16(r1)
	; CHECK-P8-NEXT: ld r30, -16(r1) # 8-byte Folded Reload			; CHECK-P8-NEXT: ld r30, -16(r1) # 8-byte Folded Reload
	; CHECK-P8-NEXT: mtlr r0			; CHECK-P8-NEXT: mtlr r0
	Show All 38 Lines

llvm/test/CodeGen/PowerPC/fp-to-int-to-fp.ll

	Show First 20 Lines • Show All 62 Lines • ▼ Show 20 Lines
	; FPCVT-NEXT: friz 1, 1			; FPCVT-NEXT: friz 1, 1
	; FPCVT-NEXT: blr			; FPCVT-NEXT: blr
	;			;
	; PPC64-LABEL: fooul:			; PPC64-LABEL: fooul:
	; PPC64: # %bb.0: # %entry			; PPC64: # %bb.0: # %entry
	; PPC64-NEXT: addis 3, 2, .LCPI2_0@toc@ha			; PPC64-NEXT: addis 3, 2, .LCPI2_0@toc@ha
	; PPC64-NEXT: li 4, 1			; PPC64-NEXT: li 4, 1
	; PPC64-NEXT: lfs 0, .LCPI2_0@toc@l(3)			; PPC64-NEXT: lfs 0, .LCPI2_0@toc@l(3)
	; PPC64-NEXT: sldi 4, 4, 63			; PPC64-NEXT: rldic 4, 4, 63, 0
	; PPC64-NEXT: fsubs 2, 1, 0			; PPC64-NEXT: fsubs 2, 1, 0
	; PPC64-NEXT: fcmpu 0, 1, 0			; PPC64-NEXT: fcmpu 0, 1, 0
	; PPC64-NEXT: fctidz 2, 2			; PPC64-NEXT: fctidz 2, 2
	; PPC64-NEXT: stfd 2, -8(1)			; PPC64-NEXT: stfd 2, -8(1)
	; PPC64-NEXT: fctidz 2, 1			; PPC64-NEXT: fctidz 2, 1
	; PPC64-NEXT: stfd 2, -16(1)			; PPC64-NEXT: stfd 2, -16(1)
	; PPC64-NEXT: ld 3, -8(1)			; PPC64-NEXT: ld 3, -8(1)
	; PPC64-NEXT: ld 5, -16(1)			; PPC64-NEXT: ld 5, -16(1)
	▲ Show 20 Lines • Show All 65 Lines • ▼ Show 20 Lines
	; FPCVT-NEXT: friz 1, 1			; FPCVT-NEXT: friz 1, 1
	; FPCVT-NEXT: blr			; FPCVT-NEXT: blr
	;			;
	; PPC64-LABEL: fooudl:			; PPC64-LABEL: fooudl:
	; PPC64: # %bb.0: # %entry			; PPC64: # %bb.0: # %entry
	; PPC64-NEXT: addis 3, 2, .LCPI3_0@toc@ha			; PPC64-NEXT: addis 3, 2, .LCPI3_0@toc@ha
	; PPC64-NEXT: li 4, 1			; PPC64-NEXT: li 4, 1
	; PPC64-NEXT: lfs 0, .LCPI3_0@toc@l(3)			; PPC64-NEXT: lfs 0, .LCPI3_0@toc@l(3)
	; PPC64-NEXT: sldi 4, 4, 63			; PPC64-NEXT: rldic 4, 4, 63, 0
	; PPC64-NEXT: fsub 2, 1, 0			; PPC64-NEXT: fsub 2, 1, 0
	; PPC64-NEXT: fcmpu 0, 1, 0			; PPC64-NEXT: fcmpu 0, 1, 0
	; PPC64-NEXT: fctidz 2, 2			; PPC64-NEXT: fctidz 2, 2
	; PPC64-NEXT: stfd 2, -8(1)			; PPC64-NEXT: stfd 2, -8(1)
	; PPC64-NEXT: fctidz 2, 1			; PPC64-NEXT: fctidz 2, 1
	; PPC64-NEXT: stfd 2, -16(1)			; PPC64-NEXT: stfd 2, -16(1)
	; PPC64-NEXT: ld 3, -8(1)			; PPC64-NEXT: ld 3, -8(1)
	; PPC64-NEXT: ld 5, -16(1)			; PPC64-NEXT: ld 5, -16(1)
	; PPC64-NEXT: xor 3, 3, 4			; PPC64-NEXT: xor 3, 3, 4
	; PPC64-NEXT: li 4, 1107			; PPC64-NEXT: li 4, 1107
	; PPC64-NEXT: sldi 4, 4, 52			; PPC64-NEXT: rldic 4, 4, 52, 1
	; PPC64-NEXT: bc 12, 0, .LBB3_1			; PPC64-NEXT: bc 12, 0, .LBB3_1
	; PPC64-NEXT: b .LBB3_2			; PPC64-NEXT: b .LBB3_2
	; PPC64-NEXT: .LBB3_1: # %entry			; PPC64-NEXT: .LBB3_1: # %entry
	; PPC64-NEXT: addi 3, 5, 0			; PPC64-NEXT: addi 3, 5, 0
	; PPC64-NEXT: .LBB3_2: # %entry			; PPC64-NEXT: .LBB3_2: # %entry
	; PPC64-NEXT: rldicl 5, 3, 32, 32			; PPC64-NEXT: rldicl 5, 3, 32, 32
	; PPC64-NEXT: clrldi 3, 3, 32			; PPC64-NEXT: clrldi 3, 3, 32
	; PPC64-NEXT: or 4, 5, 4			; PPC64-NEXT: or 4, 5, 4
	; PPC64-NEXT: addis 5, 2, .LCPI3_1@toc@ha			; PPC64-NEXT: addis 5, 2, .LCPI3_1@toc@ha
	; PPC64-NEXT: std 4, -24(1)			; PPC64-NEXT: std 4, -24(1)
	; PPC64-NEXT: li 4, 1075			; PPC64-NEXT: li 4, 1075
	; PPC64-NEXT: sldi 4, 4, 52			; PPC64-NEXT: rldic 4, 4, 52, 1
	; PPC64-NEXT: or 3, 3, 4			; PPC64-NEXT: or 3, 3, 4
	; PPC64-NEXT: lfd 0, .LCPI3_1@toc@l(5)			; PPC64-NEXT: lfd 0, .LCPI3_1@toc@l(5)
	; PPC64-NEXT: std 3, -32(1)			; PPC64-NEXT: std 3, -32(1)
	; PPC64-NEXT: lfd 1, -24(1)			; PPC64-NEXT: lfd 1, -24(1)
	; PPC64-NEXT: lfd 2, -32(1)			; PPC64-NEXT: lfd 2, -32(1)
	; PPC64-NEXT: fsub 0, 1, 0			; PPC64-NEXT: fsub 0, 1, 0
	; PPC64-NEXT: fadd 1, 2, 0			; PPC64-NEXT: fadd 1, 2, 0
	; PPC64-NEXT: blr			; PPC64-NEXT: blr
	Show All 14 Lines

llvm/test/CodeGen/PowerPC/fp128-bitcast-after-operation.ll

	Show All 39 Lines
	}			}

	define i128 @test_neg(ppc_fp128 %x) nounwind {			define i128 @test_neg(ppc_fp128 %x) nounwind {
	entry:			entry:
	; PPC64-LABEL: test_neg:			; PPC64-LABEL: test_neg:
	; PPC64-DAG: stfd 2, [[OFFSET_HI:-?[0-9]+]]([[SP:[0-9]+]])			; PPC64-DAG: stfd 2, [[OFFSET_HI:-?[0-9]+]]([[SP:[0-9]+]])
	; PPC64-DAG: stfd 1, [[OFFSET_LO:-?[0-9]+]]([[SP]])			; PPC64-DAG: stfd 1, [[OFFSET_LO:-?[0-9]+]]([[SP]])
	; PPC64-DAG: li [[FLIP_BIT:[0-9]+]], 1			; PPC64-DAG: li [[FLIP_BIT:[0-9]+]], 1
	; PPC64-DAG: sldi [[FLIP_BIT]], [[FLIP_BIT]], 63			; PPC64-DAG: rldic [[FLIP_BIT]], [[FLIP_BIT]], 63, 0
	; PPC64-DAG: ld [[HI:[0-9]+]], [[OFFSET_LO]]([[SP]])			; PPC64-DAG: ld [[HI:[0-9]+]], [[OFFSET_LO]]([[SP]])
	; PPC64-DAG: ld [[LO:[0-9]+]], [[OFFSET_HI]]([[SP]])			; PPC64-DAG: ld [[LO:[0-9]+]], [[OFFSET_HI]]([[SP]])
	; PPC64-NOT: BARRIER			; PPC64-NOT: BARRIER
	; PPC64-DAG: xor 3, [[HI]], [[FLIP_BIT]]			; PPC64-DAG: xor 3, [[HI]], [[FLIP_BIT]]
	; PPC64-DAG: xor 4, [[LO]], [[FLIP_BIT]]			; PPC64-DAG: xor 4, [[LO]], [[FLIP_BIT]]
	; PPC64: blr			; PPC64: blr

	; PPC64-P8-LABEL: test_neg:			; PPC64-P8-LABEL: test_neg:
	; PPC64-P8-DAG: mffprd [[LO:[0-9]+]], 2			; PPC64-P8-DAG: mffprd [[LO:[0-9]+]], 2
	; PPC64-P8-DAG: mffprd [[HI:[0-9]+]], 1			; PPC64-P8-DAG: mffprd [[HI:[0-9]+]], 1
	; PPC64-P8-DAG: li [[IMM1:[0-9]+]], 1			; PPC64-P8-DAG: li [[IMM1:[0-9]+]], 1
	; PPC64-P8-DAG: sldi [[FLIP_BIT:[0-9]+]], [[IMM1]], 63			; PPC64-P8-DAG: rldic [[FLIP_BIT:[0-9]+]], [[IMM1]], 63, 0
	; PPC64-P8-NOT: BARRIER			; PPC64-P8-NOT: BARRIER
	; PPC64-P8-DAG: xor 3, [[HI]], [[FLIP_BIT]]			; PPC64-P8-DAG: xor 3, [[HI]], [[FLIP_BIT]]
	; PPC64-P8-DAG: xor 4, [[LO]], [[FLIP_BIT]]			; PPC64-P8-DAG: xor 4, [[LO]], [[FLIP_BIT]]
	; PPC64-P8: blr			; PPC64-P8: blr

	; PPC32-DAG: stfd 1, 24(1)			; PPC32-DAG: stfd 1, 24(1)
	; PPC32-DAG: stfd 2, 16(1)			; PPC32-DAG: stfd 2, 16(1)
	; PPC32-DAG: lwz [[HI0:[0-9]+]], 24(1)			; PPC32-DAG: lwz [[HI0:[0-9]+]], 24(1)
	Show All 11 Lines

	define i128 @test_copysign(ppc_fp128 %x) nounwind {			define i128 @test_copysign(ppc_fp128 %x) nounwind {
	entry:			entry:
	; PPC64-LABEL: test_copysign:			; PPC64-LABEL: test_copysign:
	; PPC64-DAG: stfd 1, [[OFFSET:-?[0-9]+]](1)			; PPC64-DAG: stfd 1, [[OFFSET:-?[0-9]+]](1)
	; PPC64-DAG: li [[HI_TMP:[0-9]+]], 16399			; PPC64-DAG: li [[HI_TMP:[0-9]+]], 16399
	; PPC64-DAG: li [[LO_TMP:[0-9]+]], 3019			; PPC64-DAG: li [[LO_TMP:[0-9]+]], 3019
	; PPC64-NOT: BARRIER			; PPC64-NOT: BARRIER
	; PPC64-DAG: sldi [[CST_HI:[0-9]+]], [[HI_TMP]], 48			; PPC64-DAG: rldic [[CST_HI:[0-9]+]], [[HI_TMP]], 48, 1
	; PPC64-DAG: sldi [[CST_LO:[0-9]+]], [[LO_TMP]], 52			; PPC64-DAG: rldic [[CST_LO:[0-9]+]], [[LO_TMP]], 52, 0
	; PPC64-DAG: ld [[X_HI:[0-9]+]], [[OFFSET]](1)			; PPC64-DAG: ld [[X_HI:[0-9]+]], [[OFFSET]](1)
	; PPC64-DAG: rldicr [[NEW_HI_TMP:[0-9]+]], [[X_HI]], 0, 0			; PPC64-DAG: rldicr [[NEW_HI_TMP:[0-9]+]], [[X_HI]], 0, 0
	; PPC64-DAG: or 3, [[NEW_HI_TMP]], [[CST_HI]]			; PPC64-DAG: or 3, [[NEW_HI_TMP]], [[CST_HI]]
	; PPC64-DAG: xor 4, [[NEW_HI_TMP]], [[CST_LO]]			; PPC64-DAG: xor 4, [[NEW_HI_TMP]], [[CST_LO]]
	; PPC64: blr			; PPC64: blr

	; PPC64-P8-LABEL: test_copysign:			; PPC64-P8-LABEL: test_copysign:
	; PPC64-P8-DAG: mffprd [[X_HI:[0-9]+]], 1			; PPC64-P8-DAG: mffprd [[X_HI:[0-9]+]], 1
	; PPC64-P8-DAG: li [[HI_TMP:[0-9]+]], 16399			; PPC64-P8-DAG: li [[HI_TMP:[0-9]+]], 16399
	; PPC64-P8-DAG: li [[LO_TMP:[0-9]+]], 3019			; PPC64-P8-DAG: li [[LO_TMP:[0-9]+]], 3019
	; PPC64-P8-NOT: BARRIER			; PPC64-P8-NOT: BARRIER
	; PPC64-P8-DAG: sldi [[CST_HI:[0-9]+]], [[HI_TMP]], 48			; PPC64-P8-DAG: rldic [[CST_HI:[0-9]+]], [[HI_TMP]], 48, 1
	; PPC64-P8-DAG: sldi [[CST_LO:[0-9]+]], [[LO_TMP]], 52			; PPC64-P8-DAG: rldic [[CST_LO:[0-9]+]], [[LO_TMP]], 52, 0
	; PPC64-P8-DAG: rldicr [[NEW_HI_TMP:[0-9]+]], [[X_HI]], 0, 0			; PPC64-P8-DAG: rldicr [[NEW_HI_TMP:[0-9]+]], [[X_HI]], 0, 0
	; PPC64-P8-DAG: or 3, [[NEW_HI_TMP]], [[CST_HI]]			; PPC64-P8-DAG: or 3, [[NEW_HI_TMP]], [[CST_HI]]
	; PPC64-P8-DAG: xor 4, [[NEW_HI_TMP]], [[CST_LO]]			; PPC64-P8-DAG: xor 4, [[NEW_HI_TMP]], [[CST_LO]]
	; PPC64-P8: blr			; PPC64-P8: blr

	; PPC32: stfd 1, [[STACK:[0-9]+]](1)			; PPC32: stfd 1, [[STACK:[0-9]+]](1)
	; PPC32: lwz [[HI:[0-9]+]], [[STACK]](1)			; PPC32: lwz [[HI:[0-9]+]], [[STACK]](1)
	; PPC32: rlwinm [[FLIP_BIT:[0-9]+]], [[HI]], 0, 0, 0			; PPC32: rlwinm [[FLIP_BIT:[0-9]+]], [[HI]], 0, 0, 0
	Show All 11 Lines

llvm/test/CodeGen/PowerPC/funnel-shift.ll

	Show First 20 Lines • Show All 221 Lines • ▼ Show 20 Lines
	; CHECK32_64-NEXT: lwz 0, 36(1)			; CHECK32_64-NEXT: lwz 0, 36(1)
	; CHECK32_64-NEXT: or 4, 6, 4			; CHECK32_64-NEXT: or 4, 6, 4
	; CHECK32_64-NEXT: addi 1, 1, 32			; CHECK32_64-NEXT: addi 1, 1, 32
	; CHECK32_64-NEXT: mtlr 0			; CHECK32_64-NEXT: mtlr 0
	; CHECK32_64-NEXT: blr			; CHECK32_64-NEXT: blr
	;			;
	; CHECK64-LABEL: fshl_i37:			; CHECK64-LABEL: fshl_i37:
	; CHECK64: # %bb.0:			; CHECK64: # %bb.0:
	; CHECK64-NEXT: lis 6, -8857			; CHECK64-NEXT: lis 6, 28339
	; CHECK64-NEXT: sldi 4, 4, 27			; CHECK64-NEXT: sldi 4, 4, 27
	; CHECK64-NEXT: ori 6, 6, 51366			; CHECK64-NEXT: ori 6, 6, 58451
	; CHECK64-NEXT: sldi 6, 6, 32			; CHECK64-NEXT: rldic 6, 6, 33, 0
	; CHECK64-NEXT: oris 6, 6, 3542			; CHECK64-NEXT: oris 6, 6, 3542
	; CHECK64-NEXT: ori 6, 6, 31883			; CHECK64-NEXT: ori 6, 6, 31883
	; CHECK64-NEXT: mulhdu 6, 5, 6			; CHECK64-NEXT: mulhdu 6, 5, 6
	; CHECK64-NEXT: rldicl 6, 6, 59, 5			; CHECK64-NEXT: rldicl 6, 6, 59, 5
	; CHECK64-NEXT: mulli 6, 6, 37			; CHECK64-NEXT: mulli 6, 6, 37
	; CHECK64-NEXT: sub 5, 5, 6			; CHECK64-NEXT: sub 5, 5, 6
	; CHECK64-NEXT: clrlwi 5, 5, 26			; CHECK64-NEXT: clrlwi 5, 5, 26
	; CHECK64-NEXT: subfic 6, 5, 64			; CHECK64-NEXT: subfic 6, 5, 64
	▲ Show 20 Lines • Show All 293 Lines • ▼ Show 20 Lines
	; CHECK32_64-NEXT: or 4, 10, 3			; CHECK32_64-NEXT: or 4, 10, 3
	; CHECK32_64-NEXT: or 3, 5, 8			; CHECK32_64-NEXT: or 3, 5, 8
	; CHECK32_64-NEXT: addi 1, 1, 32			; CHECK32_64-NEXT: addi 1, 1, 32
	; CHECK32_64-NEXT: mtlr 0			; CHECK32_64-NEXT: mtlr 0
	; CHECK32_64-NEXT: blr			; CHECK32_64-NEXT: blr
	;			;
	; CHECK64-LABEL: fshr_i37:			; CHECK64-LABEL: fshr_i37:
	; CHECK64: # %bb.0:			; CHECK64: # %bb.0:
	; CHECK64-NEXT: lis 6, -8857			; CHECK64-NEXT: lis 6, 28339
	; CHECK64-NEXT: sldi 4, 4, 27			; CHECK64-NEXT: sldi 4, 4, 27
	; CHECK64-NEXT: ori 6, 6, 51366			; CHECK64-NEXT: ori 6, 6, 58451
	; CHECK64-NEXT: sldi 6, 6, 32			; CHECK64-NEXT: rldic 6, 6, 33, 0
	; CHECK64-NEXT: oris 6, 6, 3542			; CHECK64-NEXT: oris 6, 6, 3542
	; CHECK64-NEXT: ori 6, 6, 31883			; CHECK64-NEXT: ori 6, 6, 31883
	; CHECK64-NEXT: mulhdu 6, 5, 6			; CHECK64-NEXT: mulhdu 6, 5, 6
	; CHECK64-NEXT: rldicl 6, 6, 59, 5			; CHECK64-NEXT: rldicl 6, 6, 59, 5
	; CHECK64-NEXT: mulli 6, 6, 37			; CHECK64-NEXT: mulli 6, 6, 37
	; CHECK64-NEXT: sub 5, 5, 6			; CHECK64-NEXT: sub 5, 5, 6
	; CHECK64-NEXT: addi 5, 5, 27			; CHECK64-NEXT: addi 5, 5, 27
	; CHECK64-NEXT: clrlwi 5, 5, 26			; CHECK64-NEXT: clrlwi 5, 5, 26
	▲ Show 20 Lines • Show All 128 Lines • Show Last 20 Lines

llvm/test/CodeGen/PowerPC/memCmpUsedInZeroEqualityComparison.ll

Show First 20 Lines • Show All 121 Lines • ▼ Show 20 Lines	; CHECK-NEXT: blr
ret i32 %cond		ret i32 %cond
}		}

define signext i32 @equalityFoldOneConstant(i8* %X) {		define signext i32 @equalityFoldOneConstant(i8* %X) {
; CHECK-LABEL: equalityFoldOneConstant:		; CHECK-LABEL: equalityFoldOneConstant:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: ldx 4, 0, 3		; CHECK-NEXT: ldx 4, 0, 3
; CHECK-NEXT: li 5, 1		; CHECK-NEXT: li 5, 1
; CHECK-NEXT: sldi 5, 5, 32		; CHECK-NEXT: rldic 5, 5, 32, 31
; CHECK-NEXT: cmpld 4, 5		; CHECK-NEXT: cmpld 4, 5
; CHECK-NEXT: bne 0, .LBB6_2		; CHECK-NEXT: bne 0, .LBB6_2
; CHECK-NEXT: # %bb.1: # %loadbb1		; CHECK-NEXT: # %bb.1: # %loadbb1
; CHECK-NEXT: li 4, 3		; CHECK-NEXT: lis 4, -32768
; CHECK-NEXT: ld 3, 8(3)		; CHECK-NEXT: ld 3, 8(3)
; CHECK-NEXT: sldi 4, 4, 32		; CHECK-NEXT: ori 4, 4, 1
; CHECK-NEXT: ori 4, 4, 2		; CHECK-NEXT: rldic 4, 4, 1, 30
; CHECK-NEXT: cmpld 3, 4		; CHECK-NEXT: cmpld 3, 4
; CHECK-NEXT: li 3, 0		; CHECK-NEXT: li 3, 0
; CHECK-NEXT: beq 0, .LBB6_3		; CHECK-NEXT: beq 0, .LBB6_3
; CHECK-NEXT: .LBB6_2: # %res_block		; CHECK-NEXT: .LBB6_2: # %res_block
; CHECK-NEXT: li 3, 1		; CHECK-NEXT: li 3, 1
; CHECK-NEXT: .LBB6_3: # %endblock		; CHECK-NEXT: .LBB6_3: # %endblock
; CHECK-NEXT: cntlzw 3, 3		; CHECK-NEXT: cntlzw 3, 3
; CHECK-NEXT: srwi 3, 3, 5		; CHECK-NEXT: srwi 3, 3, 5
Show All 27 Lines

llvm/test/CodeGen/PowerPC/negctr.ll

	Show All 9 Lines
	for.body: ; preds = %for.body, %entry			for.body: ; preds = %for.body, %entry
	%indvars.iv = phi i64 [ %indvars.iv.next, %for.body ], [ 1, %entry ]			%indvars.iv = phi i64 [ %indvars.iv.next, %for.body ], [ 1, %entry ]
	%indvars.iv.next = add i64 %indvars.iv, 1			%indvars.iv.next = add i64 %indvars.iv, 1
	%lftr.wideiv = trunc i64 %indvars.iv.next to i32			%lftr.wideiv = trunc i64 %indvars.iv.next to i32
	%exitcond = icmp eq i32 %lftr.wideiv, 0			%exitcond = icmp eq i32 %lftr.wideiv, 0
	br i1 %exitcond, label %for.end, label %for.body			br i1 %exitcond, label %for.end, label %for.body

	; CHECK: @main			; CHECK: @main
	; CHECK: li [[REG:[0-9]+]], 0			; CHECK: li [[REG:[0-9]+]], -1
	; CHECK: oris [[REG2:[0-9]+]], [[REG]], 65535			; CHECK: rldic [[REG2:[0-9]+]], [[REG]], 0, 32
	; CHECK: ori [[REG3:[0-9]+]], [[REG2]], 65535			; CHECK: mtctr [[REG2]]
	; CHECK: mtctr [[REG3]]
	; CHECK: bdnz			; CHECK: bdnz

	for.end: ; preds = %for.body, %entry			for.end: ; preds = %for.body, %entry
	ret void			ret void
	}			}

	define void @main1() #0 {			define void @main1() #0 {
	entry:			entry:
	▲ Show 20 Lines • Show All 61 Lines • Show Last 20 Lines

llvm/test/CodeGen/PowerPC/ori_imm32.ll

Show First 20 Lines • Show All 64 Lines • ▼ Show 20 Lines	entry:
%xor = xor i64 %a, 4294967295		%xor = xor i64 %a, 4294967295
ret i64 %xor		ret i64 %xor
}		}

define i64 @xori_test_b(i64 %a) {		define i64 @xori_test_b(i64 %a) {
; CHECK-LABEL: xori_test_b:		; CHECK-LABEL: xori_test_b:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: li 4, 1		; CHECK-NEXT: li 4, 1
; CHECK-NEXT: sldi 4, 4, 32		; CHECK-NEXT: rldic 4, 4, 32, 31
; CHECK-NEXT: xor 3, 3, 4		; CHECK-NEXT: xor 3, 3, 4
; CHECK-NEXT: blr		; CHECK-NEXT: blr
entry:		entry:
%xor = xor i64 %a, 4294967296		%xor = xor i64 %a, 4294967296
ret i64 %xor		ret i64 %xor
}		}

define i64 @xori_test_c(i64 %a) {		define i64 @xori_test_c(i64 %a) {
Show All 29 Lines

llvm/test/CodeGen/PowerPC/ori_imm64.ll

	Show All 31 Lines
	entry:			entry:
	%or = or i64 %a, 68719476728 ; 0xffffffff8			%or = or i64 %a, 68719476728 ; 0xffffffff8
	ret i64 %or			ret i64 %or
	}			}

	define i64 @ori_test_4(i64 %a) {			define i64 @ori_test_4(i64 %a) {
	; CHECK-LABEL: ori_test_4:			; CHECK-LABEL: ori_test_4:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: li 4, 4112			; CHECK-NEXT: lis 4, -32640
	; CHECK-NEXT: sldi 4, 4, 32			; CHECK-NEXT: ori 4, 4, 32903
	; CHECK-NEXT: oris 4, 4, 4112			; CHECK-NEXT: rldicl 4, 4, 13, 19
	; CHECK-NEXT: ori 4, 4, 65535
	; CHECK-NEXT: or 3, 3, 4			; CHECK-NEXT: or 3, 3, 4
	; CHECK-NEXT: blr			; CHECK-NEXT: blr
	entry:			entry:
	%or = or i64 %a, 17661175070719 ; 0x10101010ffff			%or = or i64 %a, 17661175070719 ; 0x10101010ffff
	ret i64 %or			ret i64 %or
	}			}

	; Don't exploit rldimi if operand has multiple uses			; Don't exploit rldimi if operand has multiple uses
	define i64 @test_test_5(i64 %a, i64 %b) {			define i64 @test_test_5(i64 %a, i64 %b) {
	; CHECK-LABEL: test_test_5:			; CHECK-LABEL: test_test_5:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: li 5, 1			; CHECK-NEXT: li 5, 1
	; CHECK-NEXT: sldi 5, 5, 32			; CHECK-NEXT: rldic 5, 5, 32, 31
	; CHECK-NEXT: or 5, 3, 5			; CHECK-NEXT: or 5, 3, 5
	; CHECK-NEXT: add 4, 5, 4			; CHECK-NEXT: add 4, 5, 4
	; CHECK-NEXT: sub 3, 3, 4			; CHECK-NEXT: sub 3, 3, 4
	; CHECK-NEXT: blr			; CHECK-NEXT: blr
	entry:			entry:
	%or = or i64 %a, 4294967296			%or = or i64 %a, 4294967296
	%add = add i64 %or, %b			%add = add i64 %or, %b
	%div = sub i64 %a, %add			%div = sub i64 %a, %add
	ret i64 %div			ret i64 %div
	}			}

llvm/test/CodeGen/PowerPC/pr43976.ll

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: llc -mtriple=powerpc64-unknown-unknown -verify-machineinstrs \			; RUN: llc -mtriple=powerpc64-unknown-unknown -verify-machineinstrs \
	; RUN: -ppc-asm-full-reg-names < %s \| FileCheck %s			; RUN: -ppc-asm-full-reg-names < %s \| FileCheck %s
	@a = dso_local local_unnamed_addr global double 0.000000e+00, align 8			@a = dso_local local_unnamed_addr global double 0.000000e+00, align 8

	define dso_local signext i32 @b() local_unnamed_addr #0 {			define dso_local signext i32 @b() local_unnamed_addr #0 {
	; CHECK-LABEL: b:			; CHECK-LABEL: b:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: mflr r0			; CHECK-NEXT: mflr r0
	; CHECK-NEXT: std r0, 16(r1)			; CHECK-NEXT: std r0, 16(r1)
	; CHECK-NEXT: stdu r1, -144(r1)			; CHECK-NEXT: stdu r1, -144(r1)
	; CHECK-NEXT: addis r3, r2, a@toc@ha			; CHECK-NEXT: addis r3, r2, a@toc@ha
	; CHECK-NEXT: li r4, 1			; CHECK-NEXT: li r4, 1
	; CHECK-NEXT: lfd f0, a@toc@l(r3)			; CHECK-NEXT: lfd f0, a@toc@l(r3)
	; CHECK-NEXT: addis r3, r2, .LCPI0_0@toc@ha			; CHECK-NEXT: addis r3, r2, .LCPI0_0@toc@ha
	; CHECK-NEXT: sldi r4, r4, 63			; CHECK-NEXT: rldic r4, r4, 63, 0
	; CHECK-NEXT: lfs f1, .LCPI0_0@toc@l(r3)			; CHECK-NEXT: lfs f1, .LCPI0_0@toc@l(r3)
	; CHECK-NEXT: fsub f2, f0, f1			; CHECK-NEXT: fsub f2, f0, f1
	; CHECK-NEXT: fctidz f2, f2			; CHECK-NEXT: fctidz f2, f2
	; CHECK-NEXT: stfd f2, 128(r1)			; CHECK-NEXT: stfd f2, 128(r1)
	; CHECK-NEXT: fctidz f2, f0			; CHECK-NEXT: fctidz f2, f0
	; CHECK-NEXT: stfd f2, 120(r1)			; CHECK-NEXT: stfd f2, 120(r1)
	; CHECK-NEXT: ld r3, 128(r1)			; CHECK-NEXT: ld r3, 128(r1)
	; CHECK-NEXT: ld r5, 120(r1)			; CHECK-NEXT: ld r5, 120(r1)
	Show All 35 Lines

llvm/test/CodeGen/PowerPC/pr45448.ll

	Show All 13 Lines
	; CHECK-NEXT: # %bb.2: # %top			; CHECK-NEXT: # %bb.2: # %top
	; CHECK-NEXT: .LBB0_3: # %fail194			; CHECK-NEXT: .LBB0_3: # %fail194
	; CHECK-NEXT: .LBB0_4: # %L294			; CHECK-NEXT: .LBB0_4: # %L294
	; CHECK-NEXT: bc 12, 4*cr5+lt, .LBB0_6			; CHECK-NEXT: bc 12, 4*cr5+lt, .LBB0_6
	; CHECK-NEXT: # %bb.5: # %L294			; CHECK-NEXT: # %bb.5: # %L294
	; CHECK-NEXT: bc 4, 4*cr5+lt, .LBB0_7			; CHECK-NEXT: bc 4, 4*cr5+lt, .LBB0_7
	; CHECK-NEXT: .LBB0_6: # %L1057.preheader			; CHECK-NEXT: .LBB0_6: # %L1057.preheader
	; CHECK-NEXT: .LBB0_7: # %L670			; CHECK-NEXT: .LBB0_7: # %L670
	; CHECK-NEXT: lis r5, 4095			; CHECK-NEXT: li r5, -3
	; CHECK-NEXT: cmpdi r3, 0			; CHECK-NEXT: cmpdi r3, 0
	; CHECK-NEXT: sradi r4, r3, 63			; CHECK-NEXT: sradi r4, r3, 63
	; CHECK-NEXT: ori r5, r5, 65533			; CHECK-NEXT: rldic r5, r5, 4, 32
	; CHECK-NEXT: crnot 4*cr5+gt, eq			; CHECK-NEXT: crnot 4*cr5+gt, eq
	; CHECK-NEXT: sldi r5, r5, 4
	; CHECK-NEXT: mulhdu r3, r3, r5			; CHECK-NEXT: mulhdu r3, r3, r5
	; CHECK-NEXT: maddld r6, r4, r5, r3			; CHECK-NEXT: maddld r6, r4, r5, r3
	; CHECK-NEXT: cmpld r6, r3			; CHECK-NEXT: cmpld r6, r3
	; CHECK-NEXT: mulld r3, r4, r5			; CHECK-NEXT: mulld r3, r4, r5
	; CHECK-NEXT: cmpldi cr1, r3, 0			; CHECK-NEXT: cmpldi cr1, r3, 0
	; CHECK-NEXT: crandc 4cr5+lt, lt, 4cr1+eq			; CHECK-NEXT: crandc 4cr5+lt, lt, 4cr1+eq
	; CHECK-NEXT: mulhdu. r3, r4, r5			; CHECK-NEXT: mulhdu. r3, r4, r5
	; CHECK-NEXT: bc 4, 4*cr5+gt, .LBB0_10			; CHECK-NEXT: bc 4, 4*cr5+gt, .LBB0_10
	▲ Show 20 Lines • Show All 55 Lines • Show Last 20 Lines

llvm/test/CodeGen/PowerPC/rematerializable-instruction-machine-licm.ll

	Show All 21 Lines
	; CHECK-NEXT: .cfi_offset r25, -56			; CHECK-NEXT: .cfi_offset r25, -56
	; CHECK-NEXT: .cfi_offset r26, -48			; CHECK-NEXT: .cfi_offset r26, -48
	; CHECK-NEXT: .cfi_offset r27, -40			; CHECK-NEXT: .cfi_offset r27, -40
	; CHECK-NEXT: .cfi_offset r28, -32			; CHECK-NEXT: .cfi_offset r28, -32
	; CHECK-NEXT: .cfi_offset r29, -24			; CHECK-NEXT: .cfi_offset r29, -24
	; CHECK-NEXT: .cfi_offset r30, -16			; CHECK-NEXT: .cfi_offset r30, -16
	; CHECK-NEXT: .cfi_offset r31, -8			; CHECK-NEXT: .cfi_offset r31, -8
	; CHECK-NEXT: .cfi_offset r2, -152			; CHECK-NEXT: .cfi_offset r2, -152
	; CHECK-NEXT: lis 5, 4			; CHECK-NEXT: lis 5, 1
	; CHECK-NEXT: std 30, 704(1) # 8-byte Folded Spill			; CHECK-NEXT: std 30, 704(1) # 8-byte Folded Spill
	; CHECK-NEXT: std 29, 696(1) # 8-byte Folded Spill			; CHECK-NEXT: std 29, 696(1) # 8-byte Folded Spill
	; CHECK-NEXT: ori 6, 5, 6292			; CHECK-NEXT: ori 5, 5, 1573
	; CHECK-NEXT: std 28, 688(1) # 8-byte Folded Spill			; CHECK-NEXT: std 28, 688(1) # 8-byte Folded Spill
	; CHECK-NEXT: std 27, 680(1) # 8-byte Folded Spill			; CHECK-NEXT: std 27, 680(1) # 8-byte Folded Spill
	; CHECK-NEXT: std 26, 672(1) # 8-byte Folded Spill			; CHECK-NEXT: std 26, 672(1) # 8-byte Folded Spill
	; CHECK-NEXT: std 25, 664(1) # 8-byte Folded Spill
	; CHECK-NEXT: ori 5, 5, 6291
	; CHECK-NEXT: std 14, 576(1) # 8-byte Folded Spill			; CHECK-NEXT: std 14, 576(1) # 8-byte Folded Spill
				; CHECK-NEXT: rldic 5, 5, 34, 13
	; CHECK-NEXT: std 15, 584(1) # 8-byte Folded Spill			; CHECK-NEXT: std 15, 584(1) # 8-byte Folded Spill
	; CHECK-NEXT: std 16, 592(1) # 8-byte Folded Spill			; CHECK-NEXT: std 16, 592(1) # 8-byte Folded Spill
	; CHECK-NEXT: std 17, 600(1) # 8-byte Folded Spill			; CHECK-NEXT: std 17, 600(1) # 8-byte Folded Spill
				; CHECK-NEXT: oris 6, 5, 13030
				; CHECK-NEXT: oris 7, 5, 13066
				; CHECK-NEXT: oris 8, 5, 13054
				; CHECK-NEXT: oris 9, 5, 13042
				; CHECK-NEXT: oris 10, 5, 13078
				; CHECK-NEXT: oris 11, 5, 13115
				; CHECK-NEXT: oris 12, 5, 13103
				; CHECK-NEXT: oris 0, 5, 13091
				; CHECK-NEXT: oris 30, 5, 13127
				; CHECK-NEXT: oris 29, 5, 13164
				; CHECK-NEXT: oris 28, 5, 13152
				; CHECK-NEXT: oris 27, 5, 13139
				; CHECK-NEXT: oris 26, 5, 13176
				; CHECK-NEXT: ori 6, 6, 3704
				; CHECK-NEXT: ori 7, 7, 44408
				; CHECK-NEXT: ori 8, 8, 30840
				; CHECK-NEXT: ori 9, 9, 17272
				; CHECK-NEXT: ori 10, 10, 57976
				; CHECK-NEXT: ori 11, 11, 33144
				; CHECK-NEXT: ori 12, 12, 19576
				; CHECK-NEXT: ori 0, 0, 6008
				; CHECK-NEXT: ori 30, 30, 46712
				; CHECK-NEXT: ori 29, 29, 21880
				; CHECK-NEXT: ori 28, 28, 8312
				; CHECK-NEXT: ori 27, 27, 60280
				; CHECK-NEXT: ori 26, 26, 35448
	; CHECK-NEXT: std 18, 608(1) # 8-byte Folded Spill			; CHECK-NEXT: std 18, 608(1) # 8-byte Folded Spill
				; CHECK-NEXT: add 6, 4, 6
	; CHECK-NEXT: std 19, 616(1) # 8-byte Folded Spill			; CHECK-NEXT: std 19, 616(1) # 8-byte Folded Spill
	; CHECK-NEXT: std 20, 624(1) # 8-byte Folded Spill			; CHECK-NEXT: std 20, 624(1) # 8-byte Folded Spill
	; CHECK-NEXT: std 21, 632(1) # 8-byte Folded Spill			; CHECK-NEXT: std 21, 632(1) # 8-byte Folded Spill
	; CHECK-NEXT: std 22, 640(1) # 8-byte Folded Spill			; CHECK-NEXT: std 22, 640(1) # 8-byte Folded Spill
	; CHECK-NEXT: std 23, 648(1) # 8-byte Folded Spill			; CHECK-NEXT: std 23, 648(1) # 8-byte Folded Spill
	; CHECK-NEXT: std 24, 656(1) # 8-byte Folded Spill			; CHECK-NEXT: std 24, 656(1) # 8-byte Folded Spill
				; CHECK-NEXT: std 25, 664(1) # 8-byte Folded Spill
	; CHECK-NEXT: std 31, 712(1) # 8-byte Folded Spill			; CHECK-NEXT: std 31, 712(1) # 8-byte Folded Spill
	; CHECK-NEXT: std 2, 568(1) # 8-byte Folded Spill			; CHECK-NEXT: std 2, 568(1) # 8-byte Folded Spill
	; CHECK-NEXT: sldi 6, 6, 32			; CHECK-NEXT: std 6, 384(1) # 8-byte Folded Spill
	; CHECK-NEXT: oris 7, 6, 13030			; CHECK-NEXT: add 6, 4, 7
	; CHECK-NEXT: oris 8, 6, 13066			; CHECK-NEXT: lis 7, 354
	; CHECK-NEXT: oris 9, 6, 13054			; CHECK-NEXT: std 6, 376(1) # 8-byte Folded Spill
	; CHECK-NEXT: oris 10, 6, 13042			; CHECK-NEXT: add 6, 4, 8
	; CHECK-NEXT: oris 11, 6, 13078
	; CHECK-NEXT: oris 12, 6, 13115
	; CHECK-NEXT: oris 0, 6, 13103
	; CHECK-NEXT: oris 30, 6, 13091
	; CHECK-NEXT: oris 29, 6, 13127
	; CHECK-NEXT: oris 28, 6, 13164
	; CHECK-NEXT: oris 27, 6, 13152
	; CHECK-NEXT: oris 26, 6, 13139
	; CHECK-NEXT: oris 25, 6, 13176
	; CHECK-NEXT: ori 7, 7, 3704
	; CHECK-NEXT: ori 8, 8, 44408
	; CHECK-NEXT: ori 9, 9, 30840
	; CHECK-NEXT: ori 10, 10, 17272
	; CHECK-NEXT: ori 11, 11, 57976
	; CHECK-NEXT: ori 12, 12, 33144
	; CHECK-NEXT: ori 0, 0, 19576
	; CHECK-NEXT: ori 30, 30, 6008
	; CHECK-NEXT: ori 29, 29, 46712
	; CHECK-NEXT: ori 28, 28, 21880
	; CHECK-NEXT: ori 27, 27, 8312
	; CHECK-NEXT: ori 26, 26, 60280
	; CHECK-NEXT: ori 25, 25, 35448
	; CHECK-NEXT: add 7, 4, 7
	; CHECK-NEXT: sldi 5, 5, 32
	; CHECK-NEXT: oris 5, 5, 29347
	; CHECK-NEXT: ori 5, 5, 20088
	; CHECK-NEXT: std 7, 384(1) # 8-byte Folded Spill
	; CHECK-NEXT: add 7, 4, 8
	; CHECK-NEXT: lis 8, 402			; CHECK-NEXT: lis 8, 402
	; CHECK-NEXT: std 7, 376(1) # 8-byte Folded Spill			; CHECK-NEXT: std 6, 368(1) # 8-byte Folded Spill
	; CHECK-NEXT: add 7, 4, 9			; CHECK-NEXT: add 6, 4, 9
	; CHECK-NEXT: lis 9, 451			; CHECK-NEXT: lis 9, 451
	; CHECK-NEXT: std 7, 368(1) # 8-byte Folded Spill			; CHECK-NEXT: std 6, 360(1) # 8-byte Folded Spill
	; CHECK-NEXT: add 7, 4, 10			; CHECK-NEXT: add 6, 4, 10
	; CHECK-NEXT: lis 10, 500			; CHECK-NEXT: lis 10, 500
	; CHECK-NEXT: std 7, 360(1) # 8-byte Folded Spill			; CHECK-NEXT: std 6, 352(1) # 8-byte Folded Spill
	; CHECK-NEXT: add 7, 4, 11			; CHECK-NEXT: add 6, 4, 11
	; CHECK-NEXT: lis 11, 549			; CHECK-NEXT: lis 11, 549
	; CHECK-NEXT: std 7, 352(1) # 8-byte Folded Spill			; CHECK-NEXT: std 6, 344(1) # 8-byte Folded Spill
	; CHECK-NEXT: add 7, 4, 12			; CHECK-NEXT: add 6, 4, 12
	; CHECK-NEXT: std 7, 344(1) # 8-byte Folded Spill			; CHECK-NEXT: std 6, 336(1) # 8-byte Folded Spill
	; CHECK-NEXT: add 7, 4, 0			; CHECK-NEXT: add 6, 4, 0
	; CHECK-NEXT: std 7, 336(1) # 8-byte Folded Spill			; CHECK-NEXT: std 6, 328(1) # 8-byte Folded Spill
	; CHECK-NEXT: add 7, 4, 30			; CHECK-NEXT: add 6, 4, 30
	; CHECK-NEXT: std 7, 328(1) # 8-byte Folded Spill			; CHECK-NEXT: std 6, 320(1) # 8-byte Folded Spill
	; CHECK-NEXT: add 7, 4, 29			; CHECK-NEXT: add 6, 4, 29
	; CHECK-NEXT: std 7, 320(1) # 8-byte Folded Spill			; CHECK-NEXT: std 6, 312(1) # 8-byte Folded Spill
	; CHECK-NEXT: add 7, 4, 28			; CHECK-NEXT: add 6, 4, 28
	; CHECK-NEXT: std 7, 312(1) # 8-byte Folded Spill			; CHECK-NEXT: std 6, 304(1) # 8-byte Folded Spill
	; CHECK-NEXT: add 7, 4, 27			; CHECK-NEXT: add 6, 4, 27
	; CHECK-NEXT: std 7, 304(1) # 8-byte Folded Spill			; CHECK-NEXT: std 6, 296(1) # 8-byte Folded Spill
	; CHECK-NEXT: add 7, 4, 26			; CHECK-NEXT: add 6, 4, 26
	; CHECK-NEXT: std 7, 296(1) # 8-byte Folded Spill			; CHECK-NEXT: std 6, 288(1) # 8-byte Folded Spill
	; CHECK-NEXT: add 7, 4, 25			; CHECK-NEXT: oris 6, 5, 13213
	; CHECK-NEXT: std 7, 288(1) # 8-byte Folded Spill			; CHECK-NEXT: ori 6, 6, 10616
	; CHECK-NEXT: oris 7, 6, 13213
	; CHECK-NEXT: ori 7, 7, 10616
	; CHECK-NEXT: add 7, 4, 7
	; CHECK-NEXT: std 7, 280(1) # 8-byte Folded Spill
	; CHECK-NEXT: oris 7, 6, 13200
	; CHECK-NEXT: oris 6, 6, 13188
	; CHECK-NEXT: ori 7, 7, 62584
	; CHECK-NEXT: ori 6, 6, 49016
	; CHECK-NEXT: add 7, 4, 7
	; CHECK-NEXT: add 6, 4, 6			; CHECK-NEXT: add 6, 4, 6
				; CHECK-NEXT: std 6, 280(1) # 8-byte Folded Spill
				; CHECK-NEXT: oris 6, 5, 13200
				; CHECK-NEXT: oris 5, 5, 13188
				; CHECK-NEXT: ori 5, 5, 49016
				; CHECK-NEXT: ori 6, 6, 62584
				; CHECK-NEXT: add 5, 4, 5
				; CHECK-NEXT: add 6, 4, 6
				; CHECK-NEXT: std 5, 264(1) # 8-byte Folded Spill
				; CHECK-NEXT: lis 5, 4
				; CHECK-NEXT: std 6, 272(1) # 8-byte Folded Spill
				; CHECK-NEXT: lis 6, 305
				; CHECK-NEXT: ori 5, 5, 6291
				; CHECK-NEXT: rldic 5, 5, 32, 13
				; CHECK-NEXT: oris 5, 5, 29347
				; CHECK-NEXT: ori 5, 5, 20088
	; CHECK-NEXT: add 4, 4, 5			; CHECK-NEXT: add 4, 4, 5
	; CHECK-NEXT: lis 5, 268			; CHECK-NEXT: lis 5, 268
	; CHECK-NEXT: std 4, 256(1) # 8-byte Folded Spill			; CHECK-NEXT: std 4, 256(1) # 8-byte Folded Spill
	; CHECK-NEXT: lis 4, 585			; CHECK-NEXT: lis 4, 585
	; CHECK-NEXT: std 6, 264(1) # 8-byte Folded Spill
	; CHECK-NEXT: lis 6, 305
	; CHECK-NEXT: std 7, 272(1) # 8-byte Folded Spill
	; CHECK-NEXT: lis 7, 354
	; CHECK-NEXT: ori 4, 4, 61440			; CHECK-NEXT: ori 4, 4, 61440
	; CHECK-NEXT: std 4, 560(1) # 8-byte Folded Spill			; CHECK-NEXT: std 4, 560(1) # 8-byte Folded Spill
	; CHECK-NEXT: lis 4, 48			; CHECK-NEXT: lis 4, 48
	; CHECK-NEXT: ori 4, 4, 54272			; CHECK-NEXT: ori 4, 4, 54272
	; CHECK-NEXT: std 4, 552(1) # 8-byte Folded Spill			; CHECK-NEXT: std 4, 552(1) # 8-byte Folded Spill
	; CHECK-NEXT: lis 4, 97			; CHECK-NEXT: lis 4, 97
	; CHECK-NEXT: ori 4, 4, 43008			; CHECK-NEXT: ori 4, 4, 43008
	; CHECK-NEXT: std 4, 544(1) # 8-byte Folded Spill			; CHECK-NEXT: std 4, 544(1) # 8-byte Folded Spill
	▲ Show 20 Lines • Show All 481 Lines • Show Last 20 Lines

llvm/test/CodeGen/PowerPC/sms-grp-order.ll

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: llc < %s -mtriple=powerpc64le-unknown-linux-gnu -verify-machineinstrs\			; RUN: llc < %s -mtriple=powerpc64le-unknown-linux-gnu -verify-machineinstrs\
	; RUN: -mcpu=pwr9 --ppc-enable-pipeliner \| FileCheck %s			; RUN: -mcpu=pwr9 --ppc-enable-pipeliner \| FileCheck %s

	define void @lame_encode_buffer_interleaved() local_unnamed_addr {			define void @lame_encode_buffer_interleaved() local_unnamed_addr {
	; CHECK-LABEL: lame_encode_buffer_interleaved:			; CHECK-LABEL: lame_encode_buffer_interleaved:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: lha 3, 0(3)			; CHECK-NEXT: lha 3, 0(3)
	; CHECK-NEXT: li 5, 1			; CHECK-NEXT: li 5, 1
	; CHECK-NEXT: lhz 4, 0(0)			; CHECK-NEXT: lhz 4, 0(0)
	; CHECK-NEXT: sldi 5, 5, 62			; CHECK-NEXT: rldic 5, 5, 62, 1
	; CHECK-NEXT: mtctr 5			; CHECK-NEXT: mtctr 5
	; CHECK-NEXT: srawi 3, 3, 1			; CHECK-NEXT: srawi 3, 3, 1
	; CHECK-NEXT: addze 3, 3			; CHECK-NEXT: addze 3, 3
	; CHECK-NEXT: .p2align 4			; CHECK-NEXT: .p2align 4
	; CHECK-NEXT: .LBB0_1:			; CHECK-NEXT: .LBB0_1:
	; CHECK-NEXT: extsh 4, 4			; CHECK-NEXT: extsh 4, 4
	; CHECK-NEXT: srawi 4, 4, 1			; CHECK-NEXT: srawi 4, 4, 1
	; CHECK-NEXT: addze 4, 4			; CHECK-NEXT: addze 4, 4
	; CHECK-NEXT: bdnz .LBB0_1			; CHECK-NEXT: bdnz .LBB0_1
	; CHECK-NEXT: # %bb.2:			; CHECK-NEXT: # %bb.2:
	; CHECK-NEXT: sth 4, 0(0)			; CHECK-NEXT: sth 4, 0(0)
	; CHECK-NEXT: sth 3, 0(3)			; CHECK-NEXT: sth 3, 0(3)
	; CHECK-NEXT: blr			; CHECK-NEXT: blr
	br label %1			br label %1

	1: ; preds = %1, %0			1: ; preds = %1, %0
	%2 = phi i64 [ 0, %0 ], [ %13, %1 ]			%2 = phi i64 [ 0, %0 ], [ %13, %1 ]
	%3 = load i16, i16* null, align 2			%3 = load i16, i16* null, align 2
	%4 = load i16, i16* undef, align 2			%4 = load i16, i16* undef, align 2
	%5 = sext i16 %3 to i32			%5 = sext i16 %3 to i32
	%6 = sext i16 %4 to i32			%6 = sext i16 %4 to i32
	Show All 15 Lines

llvm/test/CodeGen/PowerPC/srem-vector-lkk.ll

Show First 20 Lines • Show All 1,283 Lines • ▼ Show 20 Lines	; P8BE-NEXT: blr
%1 = srem <4 x i16> %x, <i16 1, i16 32768, i16 23, i16 5423>		%1 = srem <4 x i16> %x, <i16 1, i16 32768, i16 23, i16 5423>
ret <4 x i16> %1		ret <4 x i16> %1
}		}

; Don't fold i64 srem.		; Don't fold i64 srem.
define <4 x i64> @dont_fold_srem_i64(<4 x i64> %x) {		define <4 x i64> @dont_fold_srem_i64(<4 x i64> %x) {
; P9LE-LABEL: dont_fold_srem_i64:		; P9LE-LABEL: dont_fold_srem_i64:
; P9LE: # %bb.0:		; P9LE: # %bb.0:
; P9LE-NEXT: lis r4, 24749		; P9LE-NEXT: lis r4, 12374
; P9LE-NEXT: mfvsrd r3, v3		; P9LE-NEXT: mfvsrd r3, v3
; P9LE-NEXT: ori r4, r4, 47142		; P9LE-NEXT: ori r4, r4, 56339
; P9LE-NEXT: sldi r4, r4, 32		; P9LE-NEXT: rldic r4, r4, 33, 1
; P9LE-NEXT: oris r4, r4, 58853		; P9LE-NEXT: oris r4, r4, 58853
; P9LE-NEXT: ori r4, r4, 6055		; P9LE-NEXT: ori r4, r4, 6055
; P9LE-NEXT: mulhd r4, r3, r4		; P9LE-NEXT: mulhd r4, r3, r4
; P9LE-NEXT: rldicl r5, r4, 1, 63		; P9LE-NEXT: rldicl r5, r4, 1, 63
; P9LE-NEXT: sradi r4, r4, 11		; P9LE-NEXT: sradi r4, r4, 11
; P9LE-NEXT: add r4, r4, r5		; P9LE-NEXT: add r4, r4, r5
; P9LE-NEXT: lis r5, -19946		; P9LE-NEXT: lis r5, 5698
; P9LE-NEXT: mulli r4, r4, 5423		; P9LE-NEXT: mulli r4, r4, 5423
; P9LE-NEXT: ori r5, r5, 17096		; P9LE-NEXT: ori r5, r5, 51289
; P9LE-NEXT: sldi r5, r5, 32		; P9LE-NEXT: rldic r5, r5, 35, 0
; P9LE-NEXT: oris r5, r5, 22795		; P9LE-NEXT: oris r5, r5, 22795
; P9LE-NEXT: sub r3, r3, r4		; P9LE-NEXT: sub r3, r3, r4
; P9LE-NEXT: mfvsrld r4, v3		; P9LE-NEXT: mfvsrld r4, v3
; P9LE-NEXT: ori r5, r5, 8549		; P9LE-NEXT: ori r5, r5, 8549
; P9LE-NEXT: mulhd r5, r4, r5		; P9LE-NEXT: mulhd r5, r4, r5
; P9LE-NEXT: add r5, r5, r4		; P9LE-NEXT: add r5, r5, r4
; P9LE-NEXT: rldicl r6, r5, 1, 63		; P9LE-NEXT: rldicl r6, r5, 1, 63
; P9LE-NEXT: sradi r5, r5, 4		; P9LE-NEXT: sradi r5, r5, 4
; P9LE-NEXT: add r5, r5, r6		; P9LE-NEXT: add r5, r5, r6
; P9LE-NEXT: mulli r5, r5, 23		; P9LE-NEXT: mulli r5, r5, 23
; P9LE-NEXT: sub r4, r4, r5		; P9LE-NEXT: sub r4, r4, r5
; P9LE-NEXT: mtvsrdd v3, r3, r4		; P9LE-NEXT: mtvsrdd v3, r3, r4
; P9LE-NEXT: lis r4, 25653		; P9LE-NEXT: lis r4, 3206
; P9LE-NEXT: mfvsrd r3, v2		; P9LE-NEXT: mfvsrd r3, v2
; P9LE-NEXT: ori r4, r4, 15432		; P9LE-NEXT: ori r4, r4, 42889
; P9LE-NEXT: sldi r4, r4, 32		; P9LE-NEXT: rldic r4, r4, 35, 1
; P9LE-NEXT: oris r4, r4, 1603		; P9LE-NEXT: oris r4, r4, 1603
; P9LE-NEXT: ori r4, r4, 21445		; P9LE-NEXT: ori r4, r4, 21445
; P9LE-NEXT: mulhd r4, r3, r4		; P9LE-NEXT: mulhd r4, r3, r4
; P9LE-NEXT: rldicl r5, r4, 1, 63		; P9LE-NEXT: rldicl r5, r4, 1, 63
; P9LE-NEXT: sradi r4, r4, 8		; P9LE-NEXT: sradi r4, r4, 8
; P9LE-NEXT: add r4, r4, r5		; P9LE-NEXT: add r4, r4, r5
; P9LE-NEXT: mulli r4, r4, 654		; P9LE-NEXT: mulli r4, r4, 654
; P9LE-NEXT: sub r3, r3, r4		; P9LE-NEXT: sub r3, r3, r4
; P9LE-NEXT: li r4, 0		; P9LE-NEXT: li r4, 0
; P9LE-NEXT: mtvsrdd v2, r3, r4		; P9LE-NEXT: mtvsrdd v2, r3, r4
; P9LE-NEXT: blr		; P9LE-NEXT: blr
;		;
; P9BE-LABEL: dont_fold_srem_i64:		; P9BE-LABEL: dont_fold_srem_i64:
; P9BE: # %bb.0:		; P9BE: # %bb.0:
; P9BE-NEXT: lis r4, 24749		; P9BE-NEXT: lis r4, 12374
; P9BE-NEXT: mfvsrld r3, v3		; P9BE-NEXT: mfvsrld r3, v3
; P9BE-NEXT: ori r4, r4, 47142		; P9BE-NEXT: ori r4, r4, 56339
; P9BE-NEXT: sldi r4, r4, 32		; P9BE-NEXT: rldic r4, r4, 33, 1
; P9BE-NEXT: oris r4, r4, 58853		; P9BE-NEXT: oris r4, r4, 58853
; P9BE-NEXT: ori r4, r4, 6055		; P9BE-NEXT: ori r4, r4, 6055
; P9BE-NEXT: mulhd r4, r3, r4		; P9BE-NEXT: mulhd r4, r3, r4
; P9BE-NEXT: rldicl r5, r4, 1, 63		; P9BE-NEXT: rldicl r5, r4, 1, 63
; P9BE-NEXT: sradi r4, r4, 11		; P9BE-NEXT: sradi r4, r4, 11
; P9BE-NEXT: add r4, r4, r5		; P9BE-NEXT: add r4, r4, r5
; P9BE-NEXT: lis r5, -19946		; P9BE-NEXT: lis r5, 5698
; P9BE-NEXT: ori r5, r5, 17096		; P9BE-NEXT: ori r5, r5, 51289
; P9BE-NEXT: mulli r4, r4, 5423		; P9BE-NEXT: mulli r4, r4, 5423
; P9BE-NEXT: sldi r5, r5, 32		; P9BE-NEXT: rldic r5, r5, 35, 0
; P9BE-NEXT: oris r5, r5, 22795		; P9BE-NEXT: oris r5, r5, 22795
; P9BE-NEXT: sub r3, r3, r4		; P9BE-NEXT: sub r3, r3, r4
; P9BE-NEXT: mfvsrd r4, v3		; P9BE-NEXT: mfvsrd r4, v3
; P9BE-NEXT: ori r5, r5, 8549		; P9BE-NEXT: ori r5, r5, 8549
; P9BE-NEXT: mulhd r5, r4, r5		; P9BE-NEXT: mulhd r5, r4, r5
; P9BE-NEXT: add r5, r5, r4		; P9BE-NEXT: add r5, r5, r4
; P9BE-NEXT: rldicl r6, r5, 1, 63		; P9BE-NEXT: rldicl r6, r5, 1, 63
; P9BE-NEXT: sradi r5, r5, 4		; P9BE-NEXT: sradi r5, r5, 4
; P9BE-NEXT: add r5, r5, r6		; P9BE-NEXT: add r5, r5, r6
; P9BE-NEXT: mulli r5, r5, 23		; P9BE-NEXT: mulli r5, r5, 23
; P9BE-NEXT: sub r4, r4, r5		; P9BE-NEXT: sub r4, r4, r5
; P9BE-NEXT: mtvsrdd v3, r4, r3		; P9BE-NEXT: mtvsrdd v3, r4, r3
; P9BE-NEXT: lis r4, 25653		; P9BE-NEXT: lis r4, 3206
; P9BE-NEXT: mfvsrld r3, v2		; P9BE-NEXT: mfvsrld r3, v2
; P9BE-NEXT: ori r4, r4, 15432		; P9BE-NEXT: ori r4, r4, 42889
; P9BE-NEXT: sldi r4, r4, 32		; P9BE-NEXT: rldic r4, r4, 35, 1
; P9BE-NEXT: oris r4, r4, 1603		; P9BE-NEXT: oris r4, r4, 1603
; P9BE-NEXT: ori r4, r4, 21445		; P9BE-NEXT: ori r4, r4, 21445
; P9BE-NEXT: mulhd r4, r3, r4		; P9BE-NEXT: mulhd r4, r3, r4
; P9BE-NEXT: rldicl r5, r4, 1, 63		; P9BE-NEXT: rldicl r5, r4, 1, 63
; P9BE-NEXT: sradi r4, r4, 8		; P9BE-NEXT: sradi r4, r4, 8
; P9BE-NEXT: add r4, r4, r5		; P9BE-NEXT: add r4, r4, r5
; P9BE-NEXT: mulli r4, r4, 654		; P9BE-NEXT: mulli r4, r4, 654
; P9BE-NEXT: sub r3, r3, r4		; P9BE-NEXT: sub r3, r3, r4
; P9BE-NEXT: mtvsrdd v2, 0, r3		; P9BE-NEXT: mtvsrdd v2, 0, r3
; P9BE-NEXT: blr		; P9BE-NEXT: blr
;		;
; P8LE-LABEL: dont_fold_srem_i64:		; P8LE-LABEL: dont_fold_srem_i64:
; P8LE: # %bb.0:		; P8LE: # %bb.0:
; P8LE-NEXT: lis r3, 24749		; P8LE-NEXT: lis r3, 12374
; P8LE-NEXT: lis r4, -19946		; P8LE-NEXT: lis r4, 5698
; P8LE-NEXT: lis r5, 25653		; P8LE-NEXT: lis r5, 3206
; P8LE-NEXT: xxswapd vs0, v3		; P8LE-NEXT: xxswapd vs0, v3
; P8LE-NEXT: mfvsrd r6, v3		; P8LE-NEXT: mfvsrd r6, v3
; P8LE-NEXT: ori r3, r3, 47142		; P8LE-NEXT: ori r3, r3, 56339
; P8LE-NEXT: ori r4, r4, 17096		; P8LE-NEXT: ori r4, r4, 51289
; P8LE-NEXT: ori r5, r5, 15432		; P8LE-NEXT: ori r5, r5, 42889
; P8LE-NEXT: mfvsrd r7, v2		; P8LE-NEXT: mfvsrd r7, v2
; P8LE-NEXT: sldi r3, r3, 32		; P8LE-NEXT: rldic r3, r3, 33, 1
; P8LE-NEXT: sldi r4, r4, 32		; P8LE-NEXT: rldic r4, r4, 35, 0
; P8LE-NEXT: sldi r5, r5, 32		; P8LE-NEXT: rldic r5, r5, 35, 1
; P8LE-NEXT: oris r3, r3, 58853		; P8LE-NEXT: oris r3, r3, 58853
; P8LE-NEXT: oris r4, r4, 22795		; P8LE-NEXT: oris r4, r4, 22795
; P8LE-NEXT: mffprd r8, f0		; P8LE-NEXT: mffprd r8, f0
; P8LE-NEXT: oris r5, r5, 1603		; P8LE-NEXT: oris r5, r5, 1603
; P8LE-NEXT: ori r3, r3, 6055		; P8LE-NEXT: ori r3, r3, 6055
; P8LE-NEXT: ori r4, r4, 8549		; P8LE-NEXT: ori r4, r4, 8549
; P8LE-NEXT: ori r5, r5, 21445		; P8LE-NEXT: ori r5, r5, 21445
; P8LE-NEXT: mulhd r3, r6, r3		; P8LE-NEXT: mulhd r3, r6, r3
Show All 21 Lines
; P8LE-NEXT: mtfprd f2, r3		; P8LE-NEXT: mtfprd f2, r3
; P8LE-NEXT: mtfprd f3, r4		; P8LE-NEXT: mtfprd f3, r4
; P8LE-NEXT: xxmrghd v3, vs0, vs2		; P8LE-NEXT: xxmrghd v3, vs0, vs2
; P8LE-NEXT: xxmrghd v2, vs1, vs3		; P8LE-NEXT: xxmrghd v2, vs1, vs3
; P8LE-NEXT: blr		; P8LE-NEXT: blr
;		;
; P8BE-LABEL: dont_fold_srem_i64:		; P8BE-LABEL: dont_fold_srem_i64:
; P8BE: # %bb.0:		; P8BE: # %bb.0:
; P8BE-NEXT: lis r4, -19946		; P8BE-NEXT: lis r4, 5698
; P8BE-NEXT: lis r3, 24749		; P8BE-NEXT: lis r3, 12374
; P8BE-NEXT: xxswapd vs0, v3		; P8BE-NEXT: xxswapd vs0, v3
; P8BE-NEXT: lis r5, 25653		; P8BE-NEXT: lis r5, 3206
; P8BE-NEXT: xxswapd vs1, v2		; P8BE-NEXT: xxswapd vs1, v2
; P8BE-NEXT: ori r4, r4, 17096		; P8BE-NEXT: ori r4, r4, 51289
; P8BE-NEXT: ori r3, r3, 47142		; P8BE-NEXT: ori r3, r3, 56339
; P8BE-NEXT: ori r5, r5, 15432		; P8BE-NEXT: ori r5, r5, 42889
; P8BE-NEXT: mfvsrd r6, v3		; P8BE-NEXT: mfvsrd r6, v3
; P8BE-NEXT: sldi r4, r4, 32		; P8BE-NEXT: rldic r4, r4, 35, 0
; P8BE-NEXT: sldi r3, r3, 32		; P8BE-NEXT: rldic r3, r3, 33, 1
; P8BE-NEXT: oris r4, r4, 22795		; P8BE-NEXT: oris r4, r4, 22795
; P8BE-NEXT: sldi r5, r5, 32		; P8BE-NEXT: rldic r5, r5, 35, 1
; P8BE-NEXT: oris r3, r3, 58853		; P8BE-NEXT: oris r3, r3, 58853
; P8BE-NEXT: mffprd r7, f0		; P8BE-NEXT: mffprd r7, f0
; P8BE-NEXT: ori r4, r4, 8549		; P8BE-NEXT: ori r4, r4, 8549
; P8BE-NEXT: ori r3, r3, 6055		; P8BE-NEXT: ori r3, r3, 6055
; P8BE-NEXT: oris r5, r5, 1603		; P8BE-NEXT: oris r5, r5, 1603
; P8BE-NEXT: mffprd r8, f1		; P8BE-NEXT: mffprd r8, f1
; P8BE-NEXT: mulhd r4, r6, r4		; P8BE-NEXT: mulhd r4, r6, r4
; P8BE-NEXT: mulhd r3, r7, r3		; P8BE-NEXT: mulhd r3, r7, r3
Show All 29 Lines

llvm/test/CodeGen/PowerPC/tailcall-speculatable-callee.ll

Show First 20 Lines • Show All 62 Lines • ▼ Show 20 Lines	define dso_local double @speculatable_callee_intermediate_instructions (double* nocapture %res, double %a) #0 {
; CHECK-LABEL: speculatable_callee_intermediate_instructions:		; CHECK-LABEL: speculatable_callee_intermediate_instructions:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: mflr r0		; CHECK-NEXT: mflr r0
; CHECK-NEXT: std r30, -16(r1) # 8-byte Folded Spill		; CHECK-NEXT: std r30, -16(r1) # 8-byte Folded Spill
; CHECK-NEXT: std r0, 16(r1)		; CHECK-NEXT: std r0, 16(r1)
; CHECK-NEXT: stdu r1, -48(r1)		; CHECK-NEXT: stdu r1, -48(r1)
; CHECK-NEXT: mr r30, r3		; CHECK-NEXT: mr r30, r3
; CHECK-NEXT: bl callee		; CHECK-NEXT: bl callee
; CHECK-NEXT: lis r3, 16404		; CHECK-NEXT: lis r3, 4101
; CHECK-NEXT: ori r3, r3, 52428		; CHECK-NEXT: ori r3, r3, 13107
; CHECK-NEXT: sldi r3, r3, 32		; CHECK-NEXT: rldic r3, r3, 34, 1
; CHECK-NEXT: oris r3, r3, 52428		; CHECK-NEXT: oris r3, r3, 52428
; CHECK-NEXT: ori r3, r3, 52429		; CHECK-NEXT: ori r3, r3, 52429
; CHECK-NEXT: std r3, 0(r30)		; CHECK-NEXT: std r3, 0(r30)
; CHECK-NEXT: addi r1, r1, 48		; CHECK-NEXT: addi r1, r1, 48
; CHECK-NEXT: ld r0, 16(r1)		; CHECK-NEXT: ld r0, 16(r1)
; CHECK-NEXT: ld r30, -16(r1) # 8-byte Folded Reload		; CHECK-NEXT: ld r30, -16(r1) # 8-byte Folded Reload
; CHECK-NEXT: mtlr r0		; CHECK-NEXT: mtlr r0
; CHECK-NEXT: blr		; CHECK-NEXT: blr
Show All 15 Lines

llvm/test/CodeGen/PowerPC/unaligned-addressing-mode.ll

	Show First 20 Lines • Show All 74 Lines • ▼ Show 20 Lines
	define i64 @test_xaddrX4_loop(i8* %p) {			define i64 @test_xaddrX4_loop(i8* %p) {
	; CHECK-LABEL: test_xaddrX4_loop:			; CHECK-LABEL: test_xaddrX4_loop:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: addi r4, r3, -8			; CHECK-NEXT: addi r4, r3, -8
	; CHECK-NEXT: li r3, 8			; CHECK-NEXT: li r3, 8
	; CHECK-NEXT: li r5, 3			; CHECK-NEXT: li r5, 3
	; CHECK-NEXT: mtctr r3			; CHECK-NEXT: mtctr r3
	; CHECK-NEXT: li r3, 0			; CHECK-NEXT: li r3, 0
	; loop instruction number is changed from 5 to 4, so its align is changed from 5 to 4.
	; CHECK-NEXT: .p2align 4			; CHECK-NEXT: .p2align 4
	; CHECK-NEXT: .LBB4_1: # %for.body			; CHECK-NEXT: .LBB4_1: # %for.body
	; CHECK: ldu r6, 8(r4)			; CHECK-NEXT: #
				; CHECK-NEXT: ldu r6, 8(r4)
				stefanpUnsubmitted Not Done Reply Inline Actions Question: Why does this test change? stefanp: Question: Why does this test change?
				EsmeAuthorUnsubmitted Done Reply Inline Actions Sorry I didn't notice this, I will have a look into it. Esme: Sorry I didn't notice this, I will have a look into it.
	; CHECK-NEXT: ldx r7, r4, r5			; CHECK-NEXT: ldx r7, r4, r5
	; CHECK-NEXT: maddld r3, r7, r6, r3			; CHECK-NEXT: maddld r3, r7, r6, r3
	; CHECK-NEXT: bdnz .LBB4_1			; CHECK-NEXT: bdnz .LBB4_1
	; CHECK-NEXT: # %bb.2: # %for.end			; CHECK-NEXT: # %bb.2: # %for.end
	; CHECK-NEXT: blr			; CHECK-NEXT: blr
				; loop instruction number is changed from 5 to 4, so its align is changed from 5 to 4.
	entry:			entry:
	br label %for.body			br label %for.body

	for.body: ; preds = %for.body, %entry			for.body: ; preds = %for.body, %entry
	%i.015 = phi i64 [ 0, %entry ], [ %inc, %for.body ]			%i.015 = phi i64 [ 0, %entry ], [ %inc, %for.body ]
	%res.014 = phi i64 [ 0, %entry ], [ %add, %for.body ]			%res.014 = phi i64 [ 0, %entry ], [ %add, %for.body ]
	%mul = shl i64 %i.015, 3			%mul = shl i64 %i.015, 3
	%add.ptr = getelementptr inbounds i8, i8* %p, i64 %mul			%add.ptr = getelementptr inbounds i8, i8* %p, i64 %mul
	Show All 15 Lines

llvm/test/CodeGen/PowerPC/urem-vector-lkk.ll

Show First 20 Lines • Show All 1,016 Lines • ▼ Show 20 Lines	; CHECK-NEXT: blr
%1 = urem <4 x i16> %x, <i16 1, i16 65536, i16 23, i16 5423>		%1 = urem <4 x i16> %x, <i16 1, i16 65536, i16 23, i16 5423>
ret <4 x i16> %1		ret <4 x i16> %1
}		}

; Don't fold i64 urem.		; Don't fold i64 urem.
define <4 x i64> @dont_fold_urem_i64(<4 x i64> %x) {		define <4 x i64> @dont_fold_urem_i64(<4 x i64> %x) {
; P9LE-LABEL: dont_fold_urem_i64:		; P9LE-LABEL: dont_fold_urem_i64:
; P9LE: # %bb.0:		; P9LE: # %bb.0:
; P9LE-NEXT: lis r4, 25644		; P9LE-NEXT: lis r4, 1602
; P9LE-NEXT: mfvsrld r3, v3		; P9LE-NEXT: mfvsrld r3, v3
; P9LE-NEXT: ori r4, r4, 34192		; P9LE-NEXT: ori r4, r4, 51289
; P9LE-NEXT: sldi r4, r4, 32		; P9LE-NEXT: rldic r4, r4, 36, 1
; P9LE-NEXT: oris r4, r4, 45590		; P9LE-NEXT: oris r4, r4, 45590
; P9LE-NEXT: ori r4, r4, 17097		; P9LE-NEXT: ori r4, r4, 17097
; P9LE-NEXT: mulhdu r4, r3, r4		; P9LE-NEXT: mulhdu r4, r3, r4
; P9LE-NEXT: sub r5, r3, r4		; P9LE-NEXT: sub r5, r3, r4
; P9LE-NEXT: rldicl r5, r5, 63, 1		; P9LE-NEXT: rldicl r5, r5, 63, 1
; P9LE-NEXT: add r4, r5, r4		; P9LE-NEXT: add r4, r5, r4
; P9LE-NEXT: lis r5, -16037		; P9LE-NEXT: lis r5, -16037
; P9LE-NEXT: rldicl r4, r4, 60, 4		; P9LE-NEXT: rldicl r4, r4, 60, 4
; P9LE-NEXT: ori r5, r5, 28749		; P9LE-NEXT: ori r5, r5, 28749
; P9LE-NEXT: mulli r4, r4, 23		; P9LE-NEXT: mulli r4, r4, 23
; P9LE-NEXT: sldi r5, r5, 32		; P9LE-NEXT: rldic r5, r5, 32, 0
; P9LE-NEXT: oris r5, r5, 52170		; P9LE-NEXT: oris r5, r5, 52170
; P9LE-NEXT: ori r5, r5, 12109		; P9LE-NEXT: ori r5, r5, 12109
; P9LE-NEXT: sub r3, r3, r4		; P9LE-NEXT: sub r3, r3, r4
; P9LE-NEXT: mfvsrd r4, v3		; P9LE-NEXT: mfvsrd r4, v3
; P9LE-NEXT: mulhdu r5, r4, r5		; P9LE-NEXT: mulhdu r5, r4, r5
; P9LE-NEXT: rldicl r5, r5, 52, 12		; P9LE-NEXT: rldicl r5, r5, 52, 12
; P9LE-NEXT: mulli r5, r5, 5423		; P9LE-NEXT: mulli r5, r5, 5423
; P9LE-NEXT: sub r4, r4, r5		; P9LE-NEXT: sub r4, r4, r5
; P9LE-NEXT: lis r5, 25653		; P9LE-NEXT: lis r5, 3206
; P9LE-NEXT: ori r5, r5, 15432		; P9LE-NEXT: ori r5, r5, 42889
; P9LE-NEXT: mtvsrdd v3, r4, r3		; P9LE-NEXT: mtvsrdd v3, r4, r3
; P9LE-NEXT: mfvsrd r3, v2		; P9LE-NEXT: mfvsrd r3, v2
; P9LE-NEXT: sldi r5, r5, 32		; P9LE-NEXT: rldic r5, r5, 35, 1
; P9LE-NEXT: rldicl r4, r3, 63, 1		; P9LE-NEXT: rldicl r4, r3, 63, 1
; P9LE-NEXT: oris r5, r5, 1603		; P9LE-NEXT: oris r5, r5, 1603
; P9LE-NEXT: ori r5, r5, 21445		; P9LE-NEXT: ori r5, r5, 21445
; P9LE-NEXT: mulhdu r4, r4, r5		; P9LE-NEXT: mulhdu r4, r4, r5
; P9LE-NEXT: rldicl r4, r4, 57, 7		; P9LE-NEXT: rldicl r4, r4, 57, 7
; P9LE-NEXT: mulli r4, r4, 654		; P9LE-NEXT: mulli r4, r4, 654
; P9LE-NEXT: sub r3, r3, r4		; P9LE-NEXT: sub r3, r3, r4
; P9LE-NEXT: li r4, 0		; P9LE-NEXT: li r4, 0
; P9LE-NEXT: mtvsrdd v2, r3, r4		; P9LE-NEXT: mtvsrdd v2, r3, r4
; P9LE-NEXT: blr		; P9LE-NEXT: blr
;		;
; P9BE-LABEL: dont_fold_urem_i64:		; P9BE-LABEL: dont_fold_urem_i64:
; P9BE: # %bb.0:		; P9BE: # %bb.0:
; P9BE-NEXT: lis r4, 25644		; P9BE-NEXT: lis r4, 1602
; P9BE-NEXT: mfvsrd r3, v3		; P9BE-NEXT: mfvsrd r3, v3
; P9BE-NEXT: ori r4, r4, 34192		; P9BE-NEXT: ori r4, r4, 51289
; P9BE-NEXT: sldi r4, r4, 32		; P9BE-NEXT: rldic r4, r4, 36, 1
; P9BE-NEXT: oris r4, r4, 45590		; P9BE-NEXT: oris r4, r4, 45590
; P9BE-NEXT: ori r4, r4, 17097		; P9BE-NEXT: ori r4, r4, 17097
; P9BE-NEXT: mulhdu r4, r3, r4		; P9BE-NEXT: mulhdu r4, r3, r4
; P9BE-NEXT: sub r5, r3, r4		; P9BE-NEXT: sub r5, r3, r4
; P9BE-NEXT: rldicl r5, r5, 63, 1		; P9BE-NEXT: rldicl r5, r5, 63, 1
; P9BE-NEXT: add r4, r5, r4		; P9BE-NEXT: add r4, r5, r4
; P9BE-NEXT: lis r5, -16037		; P9BE-NEXT: lis r5, -16037
; P9BE-NEXT: rldicl r4, r4, 60, 4		; P9BE-NEXT: rldicl r4, r4, 60, 4
; P9BE-NEXT: ori r5, r5, 28749		; P9BE-NEXT: ori r5, r5, 28749
; P9BE-NEXT: mulli r4, r4, 23		; P9BE-NEXT: mulli r4, r4, 23
; P9BE-NEXT: sldi r5, r5, 32		; P9BE-NEXT: rldic r5, r5, 32, 0
; P9BE-NEXT: oris r5, r5, 52170		; P9BE-NEXT: oris r5, r5, 52170
; P9BE-NEXT: ori r5, r5, 12109		; P9BE-NEXT: ori r5, r5, 12109
; P9BE-NEXT: sub r3, r3, r4		; P9BE-NEXT: sub r3, r3, r4
; P9BE-NEXT: mfvsrld r4, v3		; P9BE-NEXT: mfvsrld r4, v3
; P9BE-NEXT: mulhdu r5, r4, r5		; P9BE-NEXT: mulhdu r5, r4, r5
; P9BE-NEXT: rldicl r5, r5, 52, 12		; P9BE-NEXT: rldicl r5, r5, 52, 12
; P9BE-NEXT: mulli r5, r5, 5423		; P9BE-NEXT: mulli r5, r5, 5423
; P9BE-NEXT: sub r4, r4, r5		; P9BE-NEXT: sub r4, r4, r5
; P9BE-NEXT: lis r5, 25653		; P9BE-NEXT: lis r5, 3206
; P9BE-NEXT: ori r5, r5, 15432		; P9BE-NEXT: ori r5, r5, 42889
; P9BE-NEXT: mtvsrdd v3, r3, r4		; P9BE-NEXT: mtvsrdd v3, r3, r4
; P9BE-NEXT: mfvsrld r3, v2		; P9BE-NEXT: mfvsrld r3, v2
; P9BE-NEXT: sldi r5, r5, 32		; P9BE-NEXT: rldic r5, r5, 35, 1
; P9BE-NEXT: rldicl r4, r3, 63, 1		; P9BE-NEXT: rldicl r4, r3, 63, 1
; P9BE-NEXT: oris r5, r5, 1603		; P9BE-NEXT: oris r5, r5, 1603
; P9BE-NEXT: ori r5, r5, 21445		; P9BE-NEXT: ori r5, r5, 21445
; P9BE-NEXT: mulhdu r4, r4, r5		; P9BE-NEXT: mulhdu r4, r4, r5
; P9BE-NEXT: rldicl r4, r4, 57, 7		; P9BE-NEXT: rldicl r4, r4, 57, 7
; P9BE-NEXT: mulli r4, r4, 654		; P9BE-NEXT: mulli r4, r4, 654
; P9BE-NEXT: sub r3, r3, r4		; P9BE-NEXT: sub r3, r3, r4
; P9BE-NEXT: mtvsrdd v2, 0, r3		; P9BE-NEXT: mtvsrdd v2, 0, r3
; P9BE-NEXT: blr		; P9BE-NEXT: blr
;		;
; P8LE-LABEL: dont_fold_urem_i64:		; P8LE-LABEL: dont_fold_urem_i64:
; P8LE: # %bb.0:		; P8LE: # %bb.0:
; P8LE-NEXT: lis r3, 25644		; P8LE-NEXT: lis r3, 1602
; P8LE-NEXT: xxswapd vs0, v3		; P8LE-NEXT: xxswapd vs0, v3
; P8LE-NEXT: lis r4, -16037		; P8LE-NEXT: lis r4, -16037
; P8LE-NEXT: lis r5, 25653		; P8LE-NEXT: lis r5, 3206
; P8LE-NEXT: mfvsrd r6, v2		; P8LE-NEXT: mfvsrd r6, v2
; P8LE-NEXT: ori r3, r3, 34192		; P8LE-NEXT: ori r3, r3, 51289
; P8LE-NEXT: ori r4, r4, 28749		; P8LE-NEXT: ori r4, r4, 28749
; P8LE-NEXT: ori r5, r5, 15432		; P8LE-NEXT: ori r5, r5, 42889
; P8LE-NEXT: mfvsrd r8, v3		; P8LE-NEXT: mfvsrd r8, v3
; P8LE-NEXT: sldi r3, r3, 32		; P8LE-NEXT: rldic r3, r3, 36, 1
; P8LE-NEXT: sldi r4, r4, 32		; P8LE-NEXT: rldic r4, r4, 32, 0
; P8LE-NEXT: oris r3, r3, 45590		; P8LE-NEXT: oris r3, r3, 45590
; P8LE-NEXT: mffprd r7, f0		; P8LE-NEXT: mffprd r7, f0
; P8LE-NEXT: sldi r5, r5, 32		; P8LE-NEXT: rldic r5, r5, 35, 1
; P8LE-NEXT: oris r4, r4, 52170		; P8LE-NEXT: oris r4, r4, 52170
; P8LE-NEXT: ori r3, r3, 17097		; P8LE-NEXT: ori r3, r3, 17097
; P8LE-NEXT: oris r5, r5, 1603		; P8LE-NEXT: oris r5, r5, 1603
; P8LE-NEXT: ori r4, r4, 12109		; P8LE-NEXT: ori r4, r4, 12109
; P8LE-NEXT: mulhdu r3, r7, r3		; P8LE-NEXT: mulhdu r3, r7, r3
; P8LE-NEXT: rldicl r9, r6, 63, 1		; P8LE-NEXT: rldicl r9, r6, 63, 1
; P8LE-NEXT: ori r5, r5, 21445		; P8LE-NEXT: ori r5, r5, 21445
; P8LE-NEXT: mulhdu r4, r8, r4		; P8LE-NEXT: mulhdu r4, r8, r4
Show All 16 Lines
; P8LE-NEXT: mtfprd f2, r3		; P8LE-NEXT: mtfprd f2, r3
; P8LE-NEXT: mtfprd f3, r4		; P8LE-NEXT: mtfprd f3, r4
; P8LE-NEXT: xxmrghd v3, vs0, vs2		; P8LE-NEXT: xxmrghd v3, vs0, vs2
; P8LE-NEXT: xxmrghd v2, vs1, vs3		; P8LE-NEXT: xxmrghd v2, vs1, vs3
; P8LE-NEXT: blr		; P8LE-NEXT: blr
;		;
; P8BE-LABEL: dont_fold_urem_i64:		; P8BE-LABEL: dont_fold_urem_i64:
; P8BE: # %bb.0:		; P8BE: # %bb.0:
; P8BE-NEXT: lis r3, 25644		; P8BE-NEXT: lis r3, 1602
; P8BE-NEXT: lis r4, -16037		; P8BE-NEXT: lis r4, -16037
; P8BE-NEXT: xxswapd vs0, v3		; P8BE-NEXT: xxswapd vs0, v3
; P8BE-NEXT: xxswapd vs1, v2		; P8BE-NEXT: xxswapd vs1, v2
; P8BE-NEXT: lis r5, 25653		; P8BE-NEXT: lis r5, 3206
; P8BE-NEXT: ori r3, r3, 34192		; P8BE-NEXT: ori r3, r3, 51289
; P8BE-NEXT: ori r4, r4, 28749		; P8BE-NEXT: ori r4, r4, 28749
; P8BE-NEXT: mfvsrd r6, v3		; P8BE-NEXT: mfvsrd r6, v3
; P8BE-NEXT: ori r5, r5, 15432		; P8BE-NEXT: ori r5, r5, 42889
; P8BE-NEXT: sldi r3, r3, 32		; P8BE-NEXT: rldic r3, r3, 36, 1
; P8BE-NEXT: sldi r4, r4, 32		; P8BE-NEXT: rldic r4, r4, 32, 0
; P8BE-NEXT: oris r3, r3, 45590		; P8BE-NEXT: oris r3, r3, 45590
; P8BE-NEXT: sldi r5, r5, 32		; P8BE-NEXT: rldic r5, r5, 35, 1
; P8BE-NEXT: mffprd r7, f0		; P8BE-NEXT: mffprd r7, f0
; P8BE-NEXT: oris r4, r4, 52170		; P8BE-NEXT: oris r4, r4, 52170
; P8BE-NEXT: ori r3, r3, 17097		; P8BE-NEXT: ori r3, r3, 17097
; P8BE-NEXT: mffprd r8, f1		; P8BE-NEXT: mffprd r8, f1
; P8BE-NEXT: oris r5, r5, 1603		; P8BE-NEXT: oris r5, r5, 1603
; P8BE-NEXT: ori r4, r4, 12109		; P8BE-NEXT: ori r4, r4, 12109
; P8BE-NEXT: mulhdu r3, r6, r3		; P8BE-NEXT: mulhdu r3, r6, r3
; P8BE-NEXT: ori r5, r5, 21445		; P8BE-NEXT: ori r5, r5, 21445
Show All 26 Lines

This is an archive of the discontinued LLVM Phabricator instance.

[PowerPC] Materialize i64 constants by enumerated patterns.ClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 307572

llvm/lib/Target/PowerPC/PPCISelDAGToDAG.cpp

llvm/test/CodeGen/PowerPC/aix-cc-abi.ll

llvm/test/CodeGen/PowerPC/arr-fp-arg-no-copy.ll

llvm/test/CodeGen/PowerPC/bperm.ll

llvm/test/CodeGen/PowerPC/combine_ext_trunc.ll

llvm/test/CodeGen/PowerPC/constants-i64.ll

llvm/test/CodeGen/PowerPC/f128-fma.ll

llvm/test/CodeGen/PowerPC/f128-passByValue.ll

llvm/test/CodeGen/PowerPC/fast-isel-pcrel.ll

llvm/test/CodeGen/PowerPC/fp-strict-f128.ll

llvm/test/CodeGen/PowerPC/fp-to-int-to-fp.ll

llvm/test/CodeGen/PowerPC/fp128-bitcast-after-operation.ll

llvm/test/CodeGen/PowerPC/funnel-shift.ll

llvm/test/CodeGen/PowerPC/memCmpUsedInZeroEqualityComparison.ll

llvm/test/CodeGen/PowerPC/negctr.ll

llvm/test/CodeGen/PowerPC/ori_imm32.ll

llvm/test/CodeGen/PowerPC/ori_imm64.ll

llvm/test/CodeGen/PowerPC/pr43976.ll

llvm/test/CodeGen/PowerPC/pr45448.ll

llvm/test/CodeGen/PowerPC/rematerializable-instruction-machine-licm.ll

llvm/test/CodeGen/PowerPC/sms-grp-order.ll

llvm/test/CodeGen/PowerPC/srem-vector-lkk.ll

llvm/test/CodeGen/PowerPC/tailcall-speculatable-callee.ll

llvm/test/CodeGen/PowerPC/unaligned-addressing-mode.ll

llvm/test/CodeGen/PowerPC/urem-vector-lkk.ll

[PowerPC] Materialize i64 constants by enumerated patterns.
ClosedPublic