This is an archive of the discontinued LLVM Phabricator instance.

Though maybe the exact patterns can be automatically generated with nested loops, for reduced mental burden to prove correctness? I've sketched something and it seems doable:

>>> alsl = lambda j, k, imm: (j << imm) + k
>>> a = [alsl(alsl(1, 1, i), alsl(1, 1, i), j) for j in range(1,5) for i in range(1,5)]
>>> a
[9, 15, 27, 51, 15, 25, 45, 85, 27, 45, 81, 153, 51, 85, 153, 289]
>>> list(sorted(set(a)))
[9, 15, 25, 27, 45, 51, 81, 85, 153, 289]
>>> b = [alsl(alsl(1, 1, i), 1, j) for j in range(1,5) for i in range(1,5)]
>>> b
[7, 11, 19, 35, 13, 21, 37, 69, 25, 41, 73, 137, 49, 81, 145, 273]
>>> ab = set(a).union(set(b))
>>> len(ab)
24
>>> list(sorted(set(a).intersection(set(b))))
[25, 81]

>>> c = [alsl(1, alsl(1, 1, i), j) for j in range(1,5) for i in range(1,5)]
>>> c
[5, 7, 11, 19, 7, 9, 13, 21, 11, 13, 17, 25, 19, 21, 25, 33]
>>> list(sorted(set(c)))
[5, 7, 9, 11, 13, 17, 19, 21, 25, 33]

>>> set(c).difference(ab)
{33, 5, 17}
>>> all = set(c).union(ab).difference({3, 5, 9, 17})
>>> len(all)
24
>>> list(sorted(all))
[7, 11, 13, 15, 19, 21, 25, 27, 33, 35, 37, 41, 45, 49, 51, 69, 73, 81, 85, 137, 145, 153, 273, 289]

So basically, we can strength-reduce a total of 24 different constant-multiplications with two alsl's:

case 1: alsl T, X, X, i; alsl Y, T, T, j: 15, 25, 27, 45, 51, 81, 85, 153, 289
case 2: alsl T, X, X, i; alsl Y, T, X, j: 7, 11, 13, 19, 21, 25, 35, 37, 41, 49, 69, 73, 81, 137, 145, 273
case 3: alsl T, X, X, i; alsl Y, X, T, j: 7, 11, 13, 19, 21, 25, 33

Problem is that there are some overlaps between the 3 possible combinations, and some inside case 1 and 3. If we could somehow avoid producing conflicting rules then probably leveraging TableGen's loop and computation abilities would produce code that's easier to maintain. Otherwise, simplifying the code with some macros could also be beneficial.

llvm/lib/Target/LoongArch/LoongArchInstrInfo.td
840–841	The inner `if` could be simplified into just `return N1C->hasOneUse()`. The outer `return false` could be kept though, for avoiding an overly complex single return expression.

Harbormaster completed remote builds in B222936: Diff 509937.Mar 31 2023, 3:22 AM

In D147305#4236071, @xen0n wrote:
This is good strength reduction overall, thanks for the insight!

Though maybe the exact patterns can be automatically generated with nested loops, for reduced mental burden to prove correctness? I've sketched something and it seems doable:
>>> alsl = lambda j, k, imm: (j << imm) + k
>>> a = [alsl(alsl(1, 1, i), alsl(1, 1, i), j) for j in range(1,5) for i in range(1,5)]
>>> a
[9, 15, 27, 51, 15, 25, 45, 85, 27, 45, 81, 153, 51, 85, 153, 289]
>>> list(sorted(set(a)))
[9, 15, 25, 27, 45, 51, 81, 85, 153, 289]
>>> b = [alsl(alsl(1, 1, i), 1, j) for j in range(1,5) for i in range(1,5)]
>>> b
[7, 11, 19, 35, 13, 21, 37, 69, 25, 41, 73, 137, 49, 81, 145, 273]
>>> ab = set(a).union(set(b))
>>> len(ab)
24
>>> list(sorted(set(a).intersection(set(b))))
[25, 81]

>>> c = [alsl(1, alsl(1, 1, i), j) for j in range(1,5) for i in range(1,5)]
>>> c
[5, 7, 11, 19, 7, 9, 13, 21, 11, 13, 17, 25, 19, 21, 25, 33]
>>> list(sorted(set(c)))
[5, 7, 9, 11, 13, 17, 19, 21, 25, 33]

>>> set(c).difference(ab)
{33, 5, 17}
>>> all = set(c).union(ab).difference({3, 5, 9, 17})
>>> len(all)
24
>>> list(sorted(all))
[7, 11, 13, 15, 19, 21, 25, 27, 33, 35, 37, 41, 45, 49, 51, 69, 73, 81, 85, 137, 145, 153, 273, 289]
So basically, we can strength-reduce a total of 24 different constant-multiplications with two alsl's:

case 1: alsl T, X, X, i; alsl Y, T, T, j: 15, 25, 27, 45, 51, 81, 85, 153, 289

case 2: alsl T, X, X, i; alsl Y, T, X, j: 7, 11, 13, 19, 21, 25, 35, 37, 41, 49, 69, 73, 81, 137, 145, 273

case 3: alsl T, X, X, i; alsl Y, X, T, j: 7, 11, 13, 19, 21, 25, 33

Problem is that there are some overlaps between the 3 possible combinations, and some inside case 1 and 3. If we could somehow avoid producing conflicting rules then probably leveraging TableGen's loop and computation abilities would produce code that's easier to maintain. Otherwise, simplifying the code with some macros could also be beneficial.

Thanks for your suggestion! Using foreach really makes the code more clear!

BTW: ALSL only accepts shift amount 1,2,3,4, the value 5 is not supported.

In D147305#4236226, @benshi001 wrote:
In D147305#4236071, @xen0n wrote:
This is good strength reduction overall, thanks for the insight!

Though maybe the exact patterns can be automatically generated with nested loops, for reduced mental burden to prove correctness? I've sketched something and it seems doable:
>>> alsl = lambda j, k, imm: (j << imm) + k
>>> a = [alsl(alsl(1, 1, i), alsl(1, 1, i), j) for j in range(1,5) for i in range(1,5)]
>>> a
[9, 15, 27, 51, 15, 25, 45, 85, 27, 45, 81, 153, 51, 85, 153, 289]
>>> list(sorted(set(a)))
[9, 15, 25, 27, 45, 51, 81, 85, 153, 289]
>>> b = [alsl(alsl(1, 1, i), 1, j) for j in range(1,5) for i in range(1,5)]
>>> b
[7, 11, 19, 35, 13, 21, 37, 69, 25, 41, 73, 137, 49, 81, 145, 273]
>>> ab = set(a).union(set(b))
>>> len(ab)
24
>>> list(sorted(set(a).intersection(set(b))))
[25, 81]

>>> c = [alsl(1, alsl(1, 1, i), j) for j in range(1,5) for i in range(1,5)]
>>> c
[5, 7, 11, 19, 7, 9, 13, 21, 11, 13, 17, 25, 19, 21, 25, 33]
>>> list(sorted(set(c)))
[5, 7, 9, 11, 13, 17, 19, 21, 25, 33]

>>> set(c).difference(ab)
{33, 5, 17}
>>> all = set(c).union(ab).difference({3, 5, 9, 17})
>>> len(all)
24
>>> list(sorted(all))
[7, 11, 13, 15, 19, 21, 25, 27, 33, 35, 37, 41, 45, 49, 51, 69, 73, 81, 85, 137, 145, 153, 273, 289]
So basically, we can strength-reduce a total of 24 different constant-multiplications with two alsl's:

case 1: alsl T, X, X, i; alsl Y, T, T, j: 15, 25, 27, 45, 51, 81, 85, 153, 289

case 2: alsl T, X, X, i; alsl Y, T, X, j: 7, 11, 13, 19, 21, 25, 35, 37, 41, 49, 69, 73, 81, 137, 145, 273

case 3: alsl T, X, X, i; alsl Y, X, T, j: 7, 11, 13, 19, 21, 25, 33

Problem is that there are some overlaps between the 3 possible combinations, and some inside case 1 and 3. If we could somehow avoid producing conflicting rules then probably leveraging TableGen's loop and computation abilities would produce code that's easier to maintain. Otherwise, simplifying the code with some macros could also be beneficial.
Thanks for your suggestion! Using foreach really makes the code more clear!

My pleasure. ;-)

BTW: ALSL only accepts shift amount 1,2,3,4, the value 5 is not supported.

It's just one of the Python idiosyncrasies: range(1, 5) really yields 1, 2, 3, 4. Just like how for (int i = 1; i < 5; i++) is the same in C.

Harbormaster completed remote builds in B222972: Diff 509975.Mar 31 2023, 8:22 AM

Thanks for the improvements.
So this is only for the case 2 mentioned by @xen0n, right? Seems that the test for 81 is missing.

Will case 1 and case 3 be handled later?

benshi001 updated this revision to Diff 510162.Mar 31 2023, 7:26 PM

Harbormaster completed remote builds in B223102: Diff 510162.Mar 31 2023, 7:27 PM

In D147305#4237944, @SixWeining wrote:

Thanks for the improvements.
So this is only for the case 2 mentioned by @xen0n, right? Seems that the test for 81 is missing.

Will case 1 and case 3 be handled later?

Thanks for your comments.

The missing case 81 is added.
I will implement case 1 and case 3 later in another patch. BTW: Total amount of these two cases is small, and they even have redundant values with case 2, so how about implementing them without foreach, just standalone Pat one by one ?

benshi001 updated this revision to Diff 510164.Mar 31 2023, 7:46 PM

Harbormaster completed remote builds in B223104: Diff 510164.Mar 31 2023, 8:26 PM

In D147305#4237973, @benshi001 wrote:

In D147305#4237944, @SixWeining wrote:

Thanks for the improvements.
So this is only for the case 2 mentioned by @xen0n, right? Seems that the test for 81 is missing.

Will case 1 and case 3 be handled later?

Thanks for your comments.

The missing case 81 is added.

I will implement case 1 and case 3 later in another patch. BTW: Total amount of these two cases is small, and they even have redundant values with case 2, so how about implementing them without foreach, just standalone Pat one by one ?

As for point 2, fine by me. Case 1 would still have many remaining constants so a macro would go a long way (you could only go over the distinct Imm1 and Imm2 and auto-compute the source constant as you did for Case 2), and only 33 would be left for Case 3 so you may write the pattern straight-forward.

In D147305#4238054, @xen0n wrote:

In D147305#4237973, @benshi001 wrote:

In D147305#4237944, @SixWeining wrote:

Thanks for the improvements.
So this is only for the case 2 mentioned by @xen0n, right? Seems that the test for 81 is missing.

Will case 1 and case 3 be handled later?

Thanks for your comments.

The missing case 81 is added.

I will implement case 1 and case 3 later in another patch. BTW: Total amount of these two cases is small, and they even have redundant values with case 2, so how about implementing them without foreach, just standalone Pat one by one ?

As for point 2, fine by me. Case 1 would still have many remaining constants so a macro would go a long way (you could only go over the distinct Imm1 and Imm2 and auto-compute the source constant as you did for Case 2), and only 33 would be left for Case 3 so you may write the pattern straight-forward.

Thanks for your suggestion. I will do in my next patch.

benshi001 edited the summary of this revision. (Show Details)Apr 1 2023, 12:53 AM

xen0n accepted this revision.Apr 1 2023, 1:12 AM

This revision is now accepted and ready to land.Apr 1 2023, 1:12 AM

LGTM.

Closed by commit rG734c21300430: [LoongArch] Optimize multiplication with immediates (authored by benshi001). · Explain WhyApr 1 2023, 3:12 AM

This revision was automatically updated to reflect the committed changes.

benshi001 added a commit: rG734c21300430: [LoongArch] Optimize multiplication with immediates.

benshi001 mentioned this in rG918209bf856e: [LoongArch][NFC] Add tests of multiplication with immediates (for D147305).

In D147305#4238054, @xen0n wrote:

In D147305#4237973, @benshi001 wrote:

In D147305#4237944, @SixWeining wrote:

Thanks for the improvements.
So this is only for the case 2 mentioned by @xen0n, right? Seems that the test for 81 is missing.

Will case 1 and case 3 be handled later?

Thanks for your comments.

The missing case 81 is added.

I will implement case 1 and case 3 later in another patch. BTW: Total amount of these two cases is small, and they even have redundant values with case 2, so how about implementing them without foreach, just standalone Pat one by one ?

As for point 2, fine by me. Case 1 would still have many remaining constants so a macro would go a long way (you could only go over the distinct Imm1 and Imm2 and auto-compute the source constant as you did for Case 2), and only 33 would be left for Case 3 so you may write the pattern straight-forward.

Unfortanately the case 3 you mentioned can not be implemented, besides other duplicates to case 2, the remaining immediate x * 33 will be optimized to (x << 5) + x.

Revision Contents

Path

Size

llvm/

lib/

Target/

LoongArch/

LoongArchInstrInfo.td

141 lines

test/

CodeGen/

LoongArch/

ir-instruction/

mul.ll

182 lines

Diff 509933

llvm/lib/Target/LoongArch/LoongArchInstrInfo.td

Show First 20 Lines • Show All 828 Lines • ▼ Show 20 Lines

class shiftop<SDPatternOperator operator>		class shiftop<SDPatternOperator operator>
: PatFrag<(ops node:$val, node:$count),		: PatFrag<(ops node:$val, node:$count),
(operator node:$val, (GRLenVT (shiftMaskGRLen node:$count)))>;		(operator node:$val, (GRLenVT (shiftMaskGRLen node:$count)))>;
class shiftopw<SDPatternOperator operator>		class shiftopw<SDPatternOperator operator>
: PatFrag<(ops node:$val, node:$count),		: PatFrag<(ops node:$val, node:$count),
(operator node:$val, (i64 (shiftMask32 node:$count)))>;		(operator node:$val, (i64 (shiftMask32 node:$count)))>;

		def mul_const_oneuse : PatFrag<(ops node:$A, node:$B),
		(mul node:$A, node:$B), [{
		if (auto *N1C = dyn_cast<ConstantSDNode>(N->getOperand(1)))
		if (N1C->hasOneUse())
		return true;
		xen0nUnsubmitted Done Reply Inline Actions The inner `if` could be simplified into just `return N1C->hasOneUse()`. The outer `return false` could be kept though, for avoiding an overly complex single return expression. xen0n: The inner `if` could be simplified into just `return N1C->hasOneUse()`. The outer `return…
		return false;
		}]>;

let Predicates = [IsLA32] in {		let Predicates = [IsLA32] in {
def : PatGprGpr<add, ADD_W>;		def : PatGprGpr<add, ADD_W>;
def : PatGprImm<add, ADDI_W, simm12>;		def : PatGprImm<add, ADDI_W, simm12>;
def : PatGprGpr<sub, SUB_W>;		def : PatGprGpr<sub, SUB_W>;
def : PatGprGpr<sdiv, DIV_W>;		def : PatGprGpr<sdiv, DIV_W>;
def : PatGprGpr<udiv, DIV_WU>;		def : PatGprGpr<udiv, DIV_WU>;
def : PatGprGpr<srem, MOD_W>;		def : PatGprGpr<srem, MOD_W>;
def : PatGprGpr<urem, MOD_WU>;		def : PatGprGpr<urem, MOD_WU>;
▲ Show 20 Lines • Show All 49 Lines • ▼ Show 20 Lines	def : Pat<(add GPR:$rj, simm16_lsl16:$imm),
(ADDU16I_D GPR:$rj, (HI16 $imm))>;		(ADDU16I_D GPR:$rj, (HI16 $imm))>;
def : Pat<(add GPR:$rj, simm32_hi16_lo12:$imm),		def : Pat<(add GPR:$rj, simm32_hi16_lo12:$imm),
(ADDI_D (ADDU16I_D GPR:$rj, (HI16ForAddu16idAddiPair $imm)),		(ADDI_D (ADDU16I_D GPR:$rj, (HI16ForAddu16idAddiPair $imm)),
(LO12 $imm))>;		(LO12 $imm))>;
def : Pat<(sext_inreg (add GPR:$rj, simm32_hi16_lo12:$imm), i32),		def : Pat<(sext_inreg (add GPR:$rj, simm32_hi16_lo12:$imm), i32),
(ADDI_W (ADDU16I_D GPR:$rj, (HI16ForAddu16idAddiPair $imm)),		(ADDI_W (ADDU16I_D GPR:$rj, (HI16ForAddu16idAddiPair $imm)),
(LO12 $imm))>;		(LO12 $imm))>;

		let Predicates = [IsLA32] in {
		def : Pat<(mul_const_oneuse GPR:$r, (i32 13)),
		(ALSL_W (ALSL_W GPR:$r, GPR:$r, (i32 1)),
		GPR:$r, (i32 2))>;
		def : Pat<(mul_const_oneuse GPR:$r, (i32 25)),
		(ALSL_W (ALSL_W GPR:$r, GPR:$r, (i32 1)),
		GPR:$r, (i32 3))>;
		def : Pat<(mul_const_oneuse GPR:$r, (i32 49)),
		(ALSL_W (ALSL_W GPR:$r, GPR:$r, (i32 1)),
		GPR:$r, (i32 4))>;
		def : Pat<(mul_const_oneuse GPR:$r, (i32 11)),
		(ALSL_W (ALSL_W GPR:$r, GPR:$r, (i32 2)),
		GPR:$r, (i32 1))>;
		def : Pat<(mul_const_oneuse GPR:$r, (i32 21)),
		(ALSL_W (ALSL_W GPR:$r, GPR:$r, (i32 2)),
		GPR:$r, (i32 2))>;
		def : Pat<(mul_const_oneuse GPR:$r, (i32 41)),
		(ALSL_W (ALSL_W GPR:$r, GPR:$r, (i32 2)),
		GPR:$r, (i32 3))>;
		def : Pat<(mul_const_oneuse GPR:$r, (i32 19)),
		(ALSL_W (ALSL_W GPR:$r, GPR:$r, (i32 3)),
		GPR:$r, (i32 1))>;
		def : Pat<(mul_const_oneuse GPR:$r, (i32 37)),
		(ALSL_W (ALSL_W GPR:$r, GPR:$r, (i32 3)),
		GPR:$r, (i32 2))>;
		def : Pat<(mul_const_oneuse GPR:$r, (i32 73)),
		(ALSL_W (ALSL_W GPR:$r, GPR:$r, (i32 3)),
		GPR:$r, (i32 3))>;
		def : Pat<(mul_const_oneuse GPR:$r, (i32 145)),
		(ALSL_W (ALSL_W GPR:$r, GPR:$r, (i32 3)),
		GPR:$r, (i32 4))>;
		def : Pat<(mul_const_oneuse GPR:$r, (i32 35)),
		(ALSL_W (ALSL_W GPR:$r, GPR:$r, (i32 4)),
		GPR:$r, (i32 1))>;
		def : Pat<(mul_const_oneuse GPR:$r, (i32 69)),
		(ALSL_W (ALSL_W GPR:$r, GPR:$r, (i32 4)),
		GPR:$r, (i32 2))>;
		def : Pat<(mul_const_oneuse GPR:$r, (i32 137)),
		(ALSL_W (ALSL_W GPR:$r, GPR:$r, (i32 4)),
		GPR:$r, (i32 3))>;
		def : Pat<(mul_const_oneuse GPR:$r, (i32 273)),
		(ALSL_W (ALSL_W GPR:$r, GPR:$r, (i32 4)),
		GPR:$r, (i32 4))>;
		} // Predicates = [IsLA32]

		let Predicates = [IsLA64] in {
		def : Pat<(sext_inreg (mul_const_oneuse GPR:$r, (i64 13)), i32),
		(ALSL_W (ALSL_W GPR:$r, GPR:$r, (i64 1)),
		GPR:$r, (i64 2))>;
		def : Pat<(sext_inreg (mul_const_oneuse GPR:$r, (i64 25)), i32),
		(ALSL_W (ALSL_W GPR:$r, GPR:$r, (i64 1)),
		GPR:$r, (i64 3))>;
		def : Pat<(sext_inreg (mul_const_oneuse GPR:$r, (i64 49)), i32),
		(ALSL_W (ALSL_W GPR:$r, GPR:$r, (i64 1)),
		GPR:$r, (i64 4))>;
		def : Pat<(sext_inreg (mul_const_oneuse GPR:$r, (i64 11)), i32),
		(ALSL_W (ALSL_W GPR:$r, GPR:$r, (i64 2)),
		GPR:$r, (i64 1))>;
		def : Pat<(sext_inreg (mul_const_oneuse GPR:$r, (i64 21)), i32),
		(ALSL_W (ALSL_W GPR:$r, GPR:$r, (i64 2)),
		GPR:$r, (i64 2))>;
		def : Pat<(sext_inreg (mul_const_oneuse GPR:$r, (i64 41)), i32),
		(ALSL_W (ALSL_W GPR:$r, GPR:$r, (i64 2)),
		GPR:$r, (i64 3))>;
		def : Pat<(sext_inreg (mul_const_oneuse GPR:$r, (i64 19)), i32),
		(ALSL_W (ALSL_W GPR:$r, GPR:$r, (i64 3)),
		GPR:$r, (i64 1))>;
		def : Pat<(sext_inreg (mul_const_oneuse GPR:$r, (i64 37)), i32),
		(ALSL_W (ALSL_W GPR:$r, GPR:$r, (i64 3)),
		GPR:$r, (i64 2))>;
		def : Pat<(sext_inreg (mul_const_oneuse GPR:$r, (i64 73)), i32),
		(ALSL_W (ALSL_W GPR:$r, GPR:$r, (i64 3)),
		GPR:$r, (i64 3))>;
		def : Pat<(sext_inreg (mul_const_oneuse GPR:$r, (i64 145)), i32),
		(ALSL_W (ALSL_W GPR:$r, GPR:$r, (i64 3)),
		GPR:$r, (i64 4))>;
		def : Pat<(sext_inreg (mul_const_oneuse GPR:$r, (i64 35)), i32),
		(ALSL_W (ALSL_W GPR:$r, GPR:$r, (i64 4)),
		GPR:$r, (i64 1))>;
		def : Pat<(sext_inreg (mul_const_oneuse GPR:$r, (i64 69)), i32),
		(ALSL_W (ALSL_W GPR:$r, GPR:$r, (i64 4)),
		GPR:$r, (i64 2))>;
		def : Pat<(sext_inreg (mul_const_oneuse GPR:$r, (i64 137)), i32),
		(ALSL_W (ALSL_W GPR:$r, GPR:$r, (i64 4)),
		GPR:$r, (i64 3))>;
		def : Pat<(sext_inreg (mul_const_oneuse GPR:$r, (i64 273)), i32),
		(ALSL_W (ALSL_W GPR:$r, GPR:$r, (i64 4)),
		GPR:$r, (i64 4))>;

		def : Pat<(mul_const_oneuse GPR:$r, (i64 13)),
		(ALSL_D (ALSL_D GPR:$r, GPR:$r, (i64 1)),
		GPR:$r, (i64 2))>;
		def : Pat<(mul_const_oneuse GPR:$r, (i64 25)),
		(ALSL_D (ALSL_D GPR:$r, GPR:$r, (i64 1)),
		GPR:$r, (i64 3))>;
		def : Pat<(mul_const_oneuse GPR:$r, (i64 49)),
		(ALSL_D (ALSL_D GPR:$r, GPR:$r, (i64 1)),
		GPR:$r, (i64 4))>;
		def : Pat<(mul_const_oneuse GPR:$r, (i64 11)),
		(ALSL_D (ALSL_D GPR:$r, GPR:$r, (i64 2)),
		GPR:$r, (i64 1))>;
		def : Pat<(mul_const_oneuse GPR:$r, (i64 21)),
		(ALSL_D (ALSL_D GPR:$r, GPR:$r, (i64 2)),
		GPR:$r, (i64 2))>;
		def : Pat<(mul_const_oneuse GPR:$r, (i64 41)),
		(ALSL_D (ALSL_D GPR:$r, GPR:$r, (i64 2)),
		GPR:$r, (i64 3))>;
		def : Pat<(mul_const_oneuse GPR:$r, (i64 19)),
		(ALSL_D (ALSL_D GPR:$r, GPR:$r, (i64 3)),
		GPR:$r, (i64 1))>;
		def : Pat<(mul_const_oneuse GPR:$r, (i64 37)),
		(ALSL_D (ALSL_D GPR:$r, GPR:$r, (i64 3)),
		GPR:$r, (i64 2))>;
		def : Pat<(mul_const_oneuse GPR:$r, (i64 73)),
		(ALSL_D (ALSL_D GPR:$r, GPR:$r, (i64 3)),
		GPR:$r, (i64 3))>;
		def : Pat<(mul_const_oneuse GPR:$r, (i64 145)),
		(ALSL_D (ALSL_D GPR:$r, GPR:$r, (i64 3)),
		GPR:$r, (i64 4))>;
		def : Pat<(mul_const_oneuse GPR:$r, (i64 35)),
		(ALSL_D (ALSL_D GPR:$r, GPR:$r, (i64 4)),
		GPR:$r, (i64 1))>;
		def : Pat<(mul_const_oneuse GPR:$r, (i64 69)),
		(ALSL_D (ALSL_D GPR:$r, GPR:$r, (i64 4)),
		GPR:$r, (i64 2))>;
		def : Pat<(mul_const_oneuse GPR:$r, (i64 137)),
		(ALSL_D (ALSL_D GPR:$r, GPR:$r, (i64 4)),
		GPR:$r, (i64 3))>;
		def : Pat<(mul_const_oneuse GPR:$r, (i64 273)),
		(ALSL_D (ALSL_D GPR:$r, GPR:$r, (i64 4)),
		GPR:$r, (i64 4))>;
		} // Predicates = [IsLA64]

foreach Idx = 1...7 in {		foreach Idx = 1...7 in {
defvar ShamtA = !mul(8, Idx);		defvar ShamtA = !mul(8, Idx);
defvar ShamtB = !mul(8, !sub(8, Idx));		defvar ShamtB = !mul(8, !sub(8, Idx));
def : Pat<(or (shl GPR:$rk, (i64 ShamtA)), (srl GPR:$rj, (i64 ShamtB))),		def : Pat<(or (shl GPR:$rk, (i64 ShamtA)), (srl GPR:$rj, (i64 ShamtB))),
(BYTEPICK_D GPR:$rj, GPR:$rk, Idx)>;		(BYTEPICK_D GPR:$rj, GPR:$rk, Idx)>;
}		}

foreach Idx = 1...3 in {		foreach Idx = 1...3 in {
▲ Show 20 Lines • Show All 897 Lines • Show Last 20 Lines

llvm/test/CodeGen/LoongArch/ir-instruction/mul.ll

Show First 20 Lines • Show All 282 Lines • ▼ Show 20 Lines	; LA64-NEXT: ret
%2 = zext i32 %b to i64		%2 = zext i32 %b to i64
%3 = mul i64 %1, %2		%3 = mul i64 %1, %2
ret i64 %3		ret i64 %3
}		}

define signext i32 @mul_i32_11(i32 %a) {		define signext i32 @mul_i32_11(i32 %a) {
; LA32-LABEL: mul_i32_11:		; LA32-LABEL: mul_i32_11:
; LA32: # %bb.0:		; LA32: # %bb.0:
; LA32-NEXT: ori $a1, $zero, 11		; LA32-NEXT: alsl.w $a1, $a0, $a0, 2
; LA32-NEXT: mul.w $a0, $a0, $a1		; LA32-NEXT: alsl.w $a0, $a1, $a0, 1
; LA32-NEXT: ret		; LA32-NEXT: ret
;		;
; LA64-LABEL: mul_i32_11:		; LA64-LABEL: mul_i32_11:
; LA64: # %bb.0:		; LA64: # %bb.0:
; LA64-NEXT: ori $a1, $zero, 11		; LA64-NEXT: alsl.w $a1, $a0, $a0, 2
; LA64-NEXT: mul.d $a0, $a0, $a1		; LA64-NEXT: alsl.w $a0, $a1, $a0, 1
; LA64-NEXT: addi.w $a0, $a0, 0
; LA64-NEXT: ret		; LA64-NEXT: ret
%b = mul i32 %a, 11		%b = mul i32 %a, 11
ret i32 %b		ret i32 %b
}		}

define signext i32 @mul_i32_13(i32 %a) {		define signext i32 @mul_i32_13(i32 %a) {
; LA32-LABEL: mul_i32_13:		; LA32-LABEL: mul_i32_13:
; LA32: # %bb.0:		; LA32: # %bb.0:
; LA32-NEXT: ori $a1, $zero, 13		; LA32-NEXT: alsl.w $a1, $a0, $a0, 1
; LA32-NEXT: mul.w $a0, $a0, $a1		; LA32-NEXT: alsl.w $a0, $a1, $a0, 2
; LA32-NEXT: ret		; LA32-NEXT: ret
;		;
; LA64-LABEL: mul_i32_13:		; LA64-LABEL: mul_i32_13:
; LA64: # %bb.0:		; LA64: # %bb.0:
; LA64-NEXT: ori $a1, $zero, 13		; LA64-NEXT: alsl.w $a1, $a0, $a0, 1
; LA64-NEXT: mul.d $a0, $a0, $a1		; LA64-NEXT: alsl.w $a0, $a1, $a0, 2
; LA64-NEXT: addi.w $a0, $a0, 0
; LA64-NEXT: ret		; LA64-NEXT: ret
%b = mul i32 %a, 13		%b = mul i32 %a, 13
ret i32 %b		ret i32 %b
}		}

define signext i32 @mul_i32_19(i32 %a) {		define signext i32 @mul_i32_19(i32 %a) {
; LA32-LABEL: mul_i32_19:		; LA32-LABEL: mul_i32_19:
; LA32: # %bb.0:		; LA32: # %bb.0:
; LA32-NEXT: ori $a1, $zero, 19		; LA32-NEXT: alsl.w $a1, $a0, $a0, 3
; LA32-NEXT: mul.w $a0, $a0, $a1		; LA32-NEXT: alsl.w $a0, $a1, $a0, 1
; LA32-NEXT: ret		; LA32-NEXT: ret
;		;
; LA64-LABEL: mul_i32_19:		; LA64-LABEL: mul_i32_19:
; LA64: # %bb.0:		; LA64: # %bb.0:
; LA64-NEXT: ori $a1, $zero, 19		; LA64-NEXT: alsl.w $a1, $a0, $a0, 3
; LA64-NEXT: mul.d $a0, $a0, $a1		; LA64-NEXT: alsl.w $a0, $a1, $a0, 1
; LA64-NEXT: addi.w $a0, $a0, 0
; LA64-NEXT: ret		; LA64-NEXT: ret
%b = mul i32 %a, 19		%b = mul i32 %a, 19
ret i32 %b		ret i32 %b
}		}

define signext i32 @mul_i32_21(i32 %a) {		define signext i32 @mul_i32_21(i32 %a) {
; LA32-LABEL: mul_i32_21:		; LA32-LABEL: mul_i32_21:
; LA32: # %bb.0:		; LA32: # %bb.0:
; LA32-NEXT: ori $a1, $zero, 21		; LA32-NEXT: alsl.w $a1, $a0, $a0, 2
; LA32-NEXT: mul.w $a0, $a0, $a1		; LA32-NEXT: alsl.w $a0, $a1, $a0, 2
; LA32-NEXT: ret		; LA32-NEXT: ret
;		;
; LA64-LABEL: mul_i32_21:		; LA64-LABEL: mul_i32_21:
; LA64: # %bb.0:		; LA64: # %bb.0:
; LA64-NEXT: ori $a1, $zero, 21		; LA64-NEXT: alsl.w $a1, $a0, $a0, 2
; LA64-NEXT: mul.d $a0, $a0, $a1		; LA64-NEXT: alsl.w $a0, $a1, $a0, 2
; LA64-NEXT: addi.w $a0, $a0, 0
; LA64-NEXT: ret		; LA64-NEXT: ret
%b = mul i32 %a, 21		%b = mul i32 %a, 21
ret i32 %b		ret i32 %b
}		}

define signext i32 @mul_i32_25(i32 %a) {		define signext i32 @mul_i32_25(i32 %a) {
; LA32-LABEL: mul_i32_25:		; LA32-LABEL: mul_i32_25:
; LA32: # %bb.0:		; LA32: # %bb.0:
; LA32-NEXT: ori $a1, $zero, 25		; LA32-NEXT: alsl.w $a1, $a0, $a0, 1
; LA32-NEXT: mul.w $a0, $a0, $a1		; LA32-NEXT: alsl.w $a0, $a1, $a0, 3
; LA32-NEXT: ret		; LA32-NEXT: ret
;		;
; LA64-LABEL: mul_i32_25:		; LA64-LABEL: mul_i32_25:
; LA64: # %bb.0:		; LA64: # %bb.0:
; LA64-NEXT: ori $a1, $zero, 25		; LA64-NEXT: alsl.w $a1, $a0, $a0, 1
; LA64-NEXT: mul.d $a0, $a0, $a1		; LA64-NEXT: alsl.w $a0, $a1, $a0, 3
; LA64-NEXT: addi.w $a0, $a0, 0
; LA64-NEXT: ret		; LA64-NEXT: ret
%b = mul i32 %a, 25		%b = mul i32 %a, 25
ret i32 %b		ret i32 %b
}		}

define signext i32 @mul_i32_35(i32 %a) {		define signext i32 @mul_i32_35(i32 %a) {
; LA32-LABEL: mul_i32_35:		; LA32-LABEL: mul_i32_35:
; LA32: # %bb.0:		; LA32: # %bb.0:
; LA32-NEXT: ori $a1, $zero, 35		; LA32-NEXT: alsl.w $a1, $a0, $a0, 4
; LA32-NEXT: mul.w $a0, $a0, $a1		; LA32-NEXT: alsl.w $a0, $a1, $a0, 1
; LA32-NEXT: ret		; LA32-NEXT: ret
;		;
; LA64-LABEL: mul_i32_35:		; LA64-LABEL: mul_i32_35:
; LA64: # %bb.0:		; LA64: # %bb.0:
; LA64-NEXT: ori $a1, $zero, 35		; LA64-NEXT: alsl.w $a1, $a0, $a0, 4
; LA64-NEXT: mul.d $a0, $a0, $a1		; LA64-NEXT: alsl.w $a0, $a1, $a0, 1
; LA64-NEXT: addi.w $a0, $a0, 0
; LA64-NEXT: ret		; LA64-NEXT: ret
%b = mul i32 %a, 35		%b = mul i32 %a, 35
ret i32 %b		ret i32 %b
}		}

define signext i32 @mul_i32_37(i32 %a) {		define signext i32 @mul_i32_37(i32 %a) {
; LA32-LABEL: mul_i32_37:		; LA32-LABEL: mul_i32_37:
; LA32: # %bb.0:		; LA32: # %bb.0:
; LA32-NEXT: ori $a1, $zero, 37		; LA32-NEXT: alsl.w $a1, $a0, $a0, 3
; LA32-NEXT: mul.w $a0, $a0, $a1		; LA32-NEXT: alsl.w $a0, $a1, $a0, 2
; LA32-NEXT: ret		; LA32-NEXT: ret
;		;
; LA64-LABEL: mul_i32_37:		; LA64-LABEL: mul_i32_37:
; LA64: # %bb.0:		; LA64: # %bb.0:
; LA64-NEXT: ori $a1, $zero, 37		; LA64-NEXT: alsl.w $a1, $a0, $a0, 3
; LA64-NEXT: mul.d $a0, $a0, $a1		; LA64-NEXT: alsl.w $a0, $a1, $a0, 2
; LA64-NEXT: addi.w $a0, $a0, 0
; LA64-NEXT: ret		; LA64-NEXT: ret
%b = mul i32 %a, 37		%b = mul i32 %a, 37
ret i32 %b		ret i32 %b
}		}

define signext i32 @mul_i32_41(i32 %a) {		define signext i32 @mul_i32_41(i32 %a) {
; LA32-LABEL: mul_i32_41:		; LA32-LABEL: mul_i32_41:
; LA32: # %bb.0:		; LA32: # %bb.0:
; LA32-NEXT: ori $a1, $zero, 41		; LA32-NEXT: alsl.w $a1, $a0, $a0, 2
; LA32-NEXT: mul.w $a0, $a0, $a1		; LA32-NEXT: alsl.w $a0, $a1, $a0, 3
; LA32-NEXT: ret		; LA32-NEXT: ret
;		;
; LA64-LABEL: mul_i32_41:		; LA64-LABEL: mul_i32_41:
; LA64: # %bb.0:		; LA64: # %bb.0:
; LA64-NEXT: ori $a1, $zero, 41		; LA64-NEXT: alsl.w $a1, $a0, $a0, 2
; LA64-NEXT: mul.d $a0, $a0, $a1		; LA64-NEXT: alsl.w $a0, $a1, $a0, 3
; LA64-NEXT: addi.w $a0, $a0, 0
; LA64-NEXT: ret		; LA64-NEXT: ret
%b = mul i32 %a, 41		%b = mul i32 %a, 41
ret i32 %b		ret i32 %b
}		}

define signext i32 @mul_i32_49(i32 %a) {		define signext i32 @mul_i32_49(i32 %a) {
; LA32-LABEL: mul_i32_49:		; LA32-LABEL: mul_i32_49:
; LA32: # %bb.0:		; LA32: # %bb.0:
; LA32-NEXT: ori $a1, $zero, 49		; LA32-NEXT: alsl.w $a1, $a0, $a0, 1
; LA32-NEXT: mul.w $a0, $a0, $a1		; LA32-NEXT: alsl.w $a0, $a1, $a0, 4
; LA32-NEXT: ret		; LA32-NEXT: ret
;		;
; LA64-LABEL: mul_i32_49:		; LA64-LABEL: mul_i32_49:
; LA64: # %bb.0:		; LA64: # %bb.0:
; LA64-NEXT: ori $a1, $zero, 49		; LA64-NEXT: alsl.w $a1, $a0, $a0, 1
; LA64-NEXT: mul.d $a0, $a0, $a1		; LA64-NEXT: alsl.w $a0, $a1, $a0, 4
; LA64-NEXT: addi.w $a0, $a0, 0
; LA64-NEXT: ret		; LA64-NEXT: ret
%b = mul i32 %a, 49		%b = mul i32 %a, 49
ret i32 %b		ret i32 %b
}		}

define signext i32 @mul_i32_69(i32 %a) {		define signext i32 @mul_i32_69(i32 %a) {
; LA32-LABEL: mul_i32_69:		; LA32-LABEL: mul_i32_69:
; LA32: # %bb.0:		; LA32: # %bb.0:
; LA32-NEXT: ori $a1, $zero, 69		; LA32-NEXT: alsl.w $a1, $a0, $a0, 4
; LA32-NEXT: mul.w $a0, $a0, $a1		; LA32-NEXT: alsl.w $a0, $a1, $a0, 2
; LA32-NEXT: ret		; LA32-NEXT: ret
;		;
; LA64-LABEL: mul_i32_69:		; LA64-LABEL: mul_i32_69:
; LA64: # %bb.0:		; LA64: # %bb.0:
; LA64-NEXT: ori $a1, $zero, 69		; LA64-NEXT: alsl.w $a1, $a0, $a0, 4
; LA64-NEXT: mul.d $a0, $a0, $a1		; LA64-NEXT: alsl.w $a0, $a1, $a0, 2
; LA64-NEXT: addi.w $a0, $a0, 0
; LA64-NEXT: ret		; LA64-NEXT: ret
%b = mul i32 %a, 69		%b = mul i32 %a, 69
ret i32 %b		ret i32 %b
}		}

define signext i32 @mul_i32_73(i32 %a) {		define signext i32 @mul_i32_73(i32 %a) {
; LA32-LABEL: mul_i32_73:		; LA32-LABEL: mul_i32_73:
; LA32: # %bb.0:		; LA32: # %bb.0:
; LA32-NEXT: ori $a1, $zero, 73		; LA32-NEXT: alsl.w $a1, $a0, $a0, 3
; LA32-NEXT: mul.w $a0, $a0, $a1		; LA32-NEXT: alsl.w $a0, $a1, $a0, 3
; LA32-NEXT: ret		; LA32-NEXT: ret
;		;
; LA64-LABEL: mul_i32_73:		; LA64-LABEL: mul_i32_73:
; LA64: # %bb.0:		; LA64: # %bb.0:
; LA64-NEXT: ori $a1, $zero, 73		; LA64-NEXT: alsl.w $a1, $a0, $a0, 3
; LA64-NEXT: mul.d $a0, $a0, $a1		; LA64-NEXT: alsl.w $a0, $a1, $a0, 3
; LA64-NEXT: addi.w $a0, $a0, 0
; LA64-NEXT: ret		; LA64-NEXT: ret
%b = mul i32 %a, 73		%b = mul i32 %a, 73
ret i32 %b		ret i32 %b
}		}

define signext i32 @mul_i32_137(i32 %a) {		define signext i32 @mul_i32_137(i32 %a) {
; LA32-LABEL: mul_i32_137:		; LA32-LABEL: mul_i32_137:
; LA32: # %bb.0:		; LA32: # %bb.0:
; LA32-NEXT: ori $a1, $zero, 137		; LA32-NEXT: alsl.w $a1, $a0, $a0, 4
; LA32-NEXT: mul.w $a0, $a0, $a1		; LA32-NEXT: alsl.w $a0, $a1, $a0, 3
; LA32-NEXT: ret		; LA32-NEXT: ret
;		;
; LA64-LABEL: mul_i32_137:		; LA64-LABEL: mul_i32_137:
; LA64: # %bb.0:		; LA64: # %bb.0:
; LA64-NEXT: ori $a1, $zero, 137		; LA64-NEXT: alsl.w $a1, $a0, $a0, 4
; LA64-NEXT: mul.d $a0, $a0, $a1		; LA64-NEXT: alsl.w $a0, $a1, $a0, 3
; LA64-NEXT: addi.w $a0, $a0, 0
; LA64-NEXT: ret		; LA64-NEXT: ret
%b = mul i32 %a, 137		%b = mul i32 %a, 137
ret i32 %b		ret i32 %b
}		}

define signext i32 @mul_i32_145(i32 %a) {		define signext i32 @mul_i32_145(i32 %a) {
; LA32-LABEL: mul_i32_145:		; LA32-LABEL: mul_i32_145:
; LA32: # %bb.0:		; LA32: # %bb.0:
; LA32-NEXT: ori $a1, $zero, 145		; LA32-NEXT: alsl.w $a1, $a0, $a0, 3
; LA32-NEXT: mul.w $a0, $a0, $a1		; LA32-NEXT: alsl.w $a0, $a1, $a0, 4
; LA32-NEXT: ret		; LA32-NEXT: ret
;		;
; LA64-LABEL: mul_i32_145:		; LA64-LABEL: mul_i32_145:
; LA64: # %bb.0:		; LA64: # %bb.0:
; LA64-NEXT: ori $a1, $zero, 145		; LA64-NEXT: alsl.w $a1, $a0, $a0, 3
; LA64-NEXT: mul.d $a0, $a0, $a1		; LA64-NEXT: alsl.w $a0, $a1, $a0, 4
; LA64-NEXT: addi.w $a0, $a0, 0
; LA64-NEXT: ret		; LA64-NEXT: ret
%b = mul i32 %a, 145		%b = mul i32 %a, 145
ret i32 %b		ret i32 %b
}		}

define signext i32 @mul_i32_273(i32 %a) {		define signext i32 @mul_i32_273(i32 %a) {
; LA32-LABEL: mul_i32_273:		; LA32-LABEL: mul_i32_273:
; LA32: # %bb.0:		; LA32: # %bb.0:
; LA32-NEXT: ori $a1, $zero, 273		; LA32-NEXT: alsl.w $a1, $a0, $a0, 4
; LA32-NEXT: mul.w $a0, $a0, $a1		; LA32-NEXT: alsl.w $a0, $a1, $a0, 4
; LA32-NEXT: ret		; LA32-NEXT: ret
;		;
; LA64-LABEL: mul_i32_273:		; LA64-LABEL: mul_i32_273:
; LA64: # %bb.0:		; LA64: # %bb.0:
; LA64-NEXT: ori $a1, $zero, 273		; LA64-NEXT: alsl.w $a1, $a0, $a0, 4
; LA64-NEXT: mul.d $a0, $a0, $a1		; LA64-NEXT: alsl.w $a0, $a1, $a0, 4
; LA64-NEXT: addi.w $a0, $a0, 0
; LA64-NEXT: ret		; LA64-NEXT: ret
%b = mul i32 %a, 273		%b = mul i32 %a, 273
ret i32 %b		ret i32 %b
}		}

define i64 @mul_i64_11(i64 %a) {		define i64 @mul_i64_11(i64 %a) {
; LA32-LABEL: mul_i64_11:		; LA32-LABEL: mul_i64_11:
; LA32: # %bb.0:		; LA32: # %bb.0:
; LA32-NEXT: ori $a2, $zero, 11		; LA32-NEXT: ori $a2, $zero, 11
; LA32-NEXT: mul.w $a1, $a1, $a2		; LA32-NEXT: mul.w $a1, $a1, $a2
; LA32-NEXT: mulh.wu $a3, $a0, $a2		; LA32-NEXT: mulh.wu $a3, $a0, $a2
; LA32-NEXT: add.w $a1, $a3, $a1		; LA32-NEXT: add.w $a1, $a3, $a1
; LA32-NEXT: mul.w $a0, $a0, $a2		; LA32-NEXT: mul.w $a0, $a0, $a2
; LA32-NEXT: ret		; LA32-NEXT: ret
;		;
; LA64-LABEL: mul_i64_11:		; LA64-LABEL: mul_i64_11:
; LA64: # %bb.0:		; LA64: # %bb.0:
; LA64-NEXT: ori $a1, $zero, 11		; LA64-NEXT: alsl.d $a1, $a0, $a0, 2
; LA64-NEXT: mul.d $a0, $a0, $a1		; LA64-NEXT: alsl.d $a0, $a1, $a0, 1
; LA64-NEXT: ret		; LA64-NEXT: ret
%b = mul i64 %a, 11		%b = mul i64 %a, 11
ret i64 %b		ret i64 %b
}		}

define i64 @mul_i64_13(i64 %a) {		define i64 @mul_i64_13(i64 %a) {
; LA32-LABEL: mul_i64_13:		; LA32-LABEL: mul_i64_13:
; LA32: # %bb.0:		; LA32: # %bb.0:
; LA32-NEXT: ori $a2, $zero, 13		; LA32-NEXT: ori $a2, $zero, 13
; LA32-NEXT: mul.w $a1, $a1, $a2		; LA32-NEXT: mul.w $a1, $a1, $a2
; LA32-NEXT: mulh.wu $a3, $a0, $a2		; LA32-NEXT: mulh.wu $a3, $a0, $a2
; LA32-NEXT: add.w $a1, $a3, $a1		; LA32-NEXT: add.w $a1, $a3, $a1
; LA32-NEXT: mul.w $a0, $a0, $a2		; LA32-NEXT: mul.w $a0, $a0, $a2
; LA32-NEXT: ret		; LA32-NEXT: ret
;		;
; LA64-LABEL: mul_i64_13:		; LA64-LABEL: mul_i64_13:
; LA64: # %bb.0:		; LA64: # %bb.0:
; LA64-NEXT: ori $a1, $zero, 13		; LA64-NEXT: alsl.d $a1, $a0, $a0, 1
; LA64-NEXT: mul.d $a0, $a0, $a1		; LA64-NEXT: alsl.d $a0, $a1, $a0, 2
; LA64-NEXT: ret		; LA64-NEXT: ret
%b = mul i64 %a, 13		%b = mul i64 %a, 13
ret i64 %b		ret i64 %b
}		}

define i64 @mul_i64_19(i64 %a) {		define i64 @mul_i64_19(i64 %a) {
; LA32-LABEL: mul_i64_19:		; LA32-LABEL: mul_i64_19:
; LA32: # %bb.0:		; LA32: # %bb.0:
; LA32-NEXT: ori $a2, $zero, 19		; LA32-NEXT: ori $a2, $zero, 19
; LA32-NEXT: mul.w $a1, $a1, $a2		; LA32-NEXT: mul.w $a1, $a1, $a2
; LA32-NEXT: mulh.wu $a3, $a0, $a2		; LA32-NEXT: mulh.wu $a3, $a0, $a2
; LA32-NEXT: add.w $a1, $a3, $a1		; LA32-NEXT: add.w $a1, $a3, $a1
; LA32-NEXT: mul.w $a0, $a0, $a2		; LA32-NEXT: mul.w $a0, $a0, $a2
; LA32-NEXT: ret		; LA32-NEXT: ret
;		;
; LA64-LABEL: mul_i64_19:		; LA64-LABEL: mul_i64_19:
; LA64: # %bb.0:		; LA64: # %bb.0:
; LA64-NEXT: ori $a1, $zero, 19		; LA64-NEXT: alsl.d $a1, $a0, $a0, 3
; LA64-NEXT: mul.d $a0, $a0, $a1		; LA64-NEXT: alsl.d $a0, $a1, $a0, 1
; LA64-NEXT: ret		; LA64-NEXT: ret
%b = mul i64 %a, 19		%b = mul i64 %a, 19
ret i64 %b		ret i64 %b
}		}

define i64 @mul_i64_21(i64 %a) {		define i64 @mul_i64_21(i64 %a) {
; LA32-LABEL: mul_i64_21:		; LA32-LABEL: mul_i64_21:
; LA32: # %bb.0:		; LA32: # %bb.0:
; LA32-NEXT: ori $a2, $zero, 21		; LA32-NEXT: ori $a2, $zero, 21
; LA32-NEXT: mul.w $a1, $a1, $a2		; LA32-NEXT: mul.w $a1, $a1, $a2
; LA32-NEXT: mulh.wu $a3, $a0, $a2		; LA32-NEXT: mulh.wu $a3, $a0, $a2
; LA32-NEXT: add.w $a1, $a3, $a1		; LA32-NEXT: add.w $a1, $a3, $a1
; LA32-NEXT: mul.w $a0, $a0, $a2		; LA32-NEXT: mul.w $a0, $a0, $a2
; LA32-NEXT: ret		; LA32-NEXT: ret
;		;
; LA64-LABEL: mul_i64_21:		; LA64-LABEL: mul_i64_21:
; LA64: # %bb.0:		; LA64: # %bb.0:
; LA64-NEXT: ori $a1, $zero, 21		; LA64-NEXT: alsl.d $a1, $a0, $a0, 2
; LA64-NEXT: mul.d $a0, $a0, $a1		; LA64-NEXT: alsl.d $a0, $a1, $a0, 2
; LA64-NEXT: ret		; LA64-NEXT: ret
%b = mul i64 %a, 21		%b = mul i64 %a, 21
ret i64 %b		ret i64 %b
}		}

define i64 @mul_i64_25(i64 %a) {		define i64 @mul_i64_25(i64 %a) {
; LA32-LABEL: mul_i64_25:		; LA32-LABEL: mul_i64_25:
; LA32: # %bb.0:		; LA32: # %bb.0:
; LA32-NEXT: ori $a2, $zero, 25		; LA32-NEXT: ori $a2, $zero, 25
; LA32-NEXT: mul.w $a1, $a1, $a2		; LA32-NEXT: mul.w $a1, $a1, $a2
; LA32-NEXT: mulh.wu $a3, $a0, $a2		; LA32-NEXT: mulh.wu $a3, $a0, $a2
; LA32-NEXT: add.w $a1, $a3, $a1		; LA32-NEXT: add.w $a1, $a3, $a1
; LA32-NEXT: mul.w $a0, $a0, $a2		; LA32-NEXT: mul.w $a0, $a0, $a2
; LA32-NEXT: ret		; LA32-NEXT: ret
;		;
; LA64-LABEL: mul_i64_25:		; LA64-LABEL: mul_i64_25:
; LA64: # %bb.0:		; LA64: # %bb.0:
; LA64-NEXT: ori $a1, $zero, 25		; LA64-NEXT: alsl.d $a1, $a0, $a0, 1
; LA64-NEXT: mul.d $a0, $a0, $a1		; LA64-NEXT: alsl.d $a0, $a1, $a0, 3
; LA64-NEXT: ret		; LA64-NEXT: ret
%b = mul i64 %a, 25		%b = mul i64 %a, 25
ret i64 %b		ret i64 %b
}		}

define i64 @mul_i64_35(i64 %a) {		define i64 @mul_i64_35(i64 %a) {
; LA32-LABEL: mul_i64_35:		; LA32-LABEL: mul_i64_35:
; LA32: # %bb.0:		; LA32: # %bb.0:
; LA32-NEXT: ori $a2, $zero, 35		; LA32-NEXT: ori $a2, $zero, 35
; LA32-NEXT: mul.w $a1, $a1, $a2		; LA32-NEXT: mul.w $a1, $a1, $a2
; LA32-NEXT: mulh.wu $a3, $a0, $a2		; LA32-NEXT: mulh.wu $a3, $a0, $a2
; LA32-NEXT: add.w $a1, $a3, $a1		; LA32-NEXT: add.w $a1, $a3, $a1
; LA32-NEXT: mul.w $a0, $a0, $a2		; LA32-NEXT: mul.w $a0, $a0, $a2
; LA32-NEXT: ret		; LA32-NEXT: ret
;		;
; LA64-LABEL: mul_i64_35:		; LA64-LABEL: mul_i64_35:
; LA64: # %bb.0:		; LA64: # %bb.0:
; LA64-NEXT: ori $a1, $zero, 35		; LA64-NEXT: alsl.d $a1, $a0, $a0, 4
; LA64-NEXT: mul.d $a0, $a0, $a1		; LA64-NEXT: alsl.d $a0, $a1, $a0, 1
; LA64-NEXT: ret		; LA64-NEXT: ret
%b = mul i64 %a, 35		%b = mul i64 %a, 35
ret i64 %b		ret i64 %b
}		}

define i64 @mul_i64_37(i64 %a) {		define i64 @mul_i64_37(i64 %a) {
; LA32-LABEL: mul_i64_37:		; LA32-LABEL: mul_i64_37:
; LA32: # %bb.0:		; LA32: # %bb.0:
; LA32-NEXT: ori $a2, $zero, 37		; LA32-NEXT: ori $a2, $zero, 37
; LA32-NEXT: mul.w $a1, $a1, $a2		; LA32-NEXT: mul.w $a1, $a1, $a2
; LA32-NEXT: mulh.wu $a3, $a0, $a2		; LA32-NEXT: mulh.wu $a3, $a0, $a2
; LA32-NEXT: add.w $a1, $a3, $a1		; LA32-NEXT: add.w $a1, $a3, $a1
; LA32-NEXT: mul.w $a0, $a0, $a2		; LA32-NEXT: mul.w $a0, $a0, $a2
; LA32-NEXT: ret		; LA32-NEXT: ret
;		;
; LA64-LABEL: mul_i64_37:		; LA64-LABEL: mul_i64_37:
; LA64: # %bb.0:		; LA64: # %bb.0:
; LA64-NEXT: ori $a1, $zero, 37		; LA64-NEXT: alsl.d $a1, $a0, $a0, 3
; LA64-NEXT: mul.d $a0, $a0, $a1		; LA64-NEXT: alsl.d $a0, $a1, $a0, 2
; LA64-NEXT: ret		; LA64-NEXT: ret
%b = mul i64 %a, 37		%b = mul i64 %a, 37
ret i64 %b		ret i64 %b
}		}

define i64 @mul_i64_41(i64 %a) {		define i64 @mul_i64_41(i64 %a) {
; LA32-LABEL: mul_i64_41:		; LA32-LABEL: mul_i64_41:
; LA32: # %bb.0:		; LA32: # %bb.0:
; LA32-NEXT: ori $a2, $zero, 41		; LA32-NEXT: ori $a2, $zero, 41
; LA32-NEXT: mul.w $a1, $a1, $a2		; LA32-NEXT: mul.w $a1, $a1, $a2
; LA32-NEXT: mulh.wu $a3, $a0, $a2		; LA32-NEXT: mulh.wu $a3, $a0, $a2
; LA32-NEXT: add.w $a1, $a3, $a1		; LA32-NEXT: add.w $a1, $a3, $a1
; LA32-NEXT: mul.w $a0, $a0, $a2		; LA32-NEXT: mul.w $a0, $a0, $a2
; LA32-NEXT: ret		; LA32-NEXT: ret
;		;
; LA64-LABEL: mul_i64_41:		; LA64-LABEL: mul_i64_41:
; LA64: # %bb.0:		; LA64: # %bb.0:
; LA64-NEXT: ori $a1, $zero, 41		; LA64-NEXT: alsl.d $a1, $a0, $a0, 2
; LA64-NEXT: mul.d $a0, $a0, $a1		; LA64-NEXT: alsl.d $a0, $a1, $a0, 3
; LA64-NEXT: ret		; LA64-NEXT: ret
%b = mul i64 %a, 41		%b = mul i64 %a, 41
ret i64 %b		ret i64 %b
}		}

define i64 @mul_i64_49(i64 %a) {		define i64 @mul_i64_49(i64 %a) {
; LA32-LABEL: mul_i64_49:		; LA32-LABEL: mul_i64_49:
; LA32: # %bb.0:		; LA32: # %bb.0:
; LA32-NEXT: ori $a2, $zero, 49		; LA32-NEXT: ori $a2, $zero, 49
; LA32-NEXT: mul.w $a1, $a1, $a2		; LA32-NEXT: mul.w $a1, $a1, $a2
; LA32-NEXT: mulh.wu $a3, $a0, $a2		; LA32-NEXT: mulh.wu $a3, $a0, $a2
; LA32-NEXT: add.w $a1, $a3, $a1		; LA32-NEXT: add.w $a1, $a3, $a1
; LA32-NEXT: mul.w $a0, $a0, $a2		; LA32-NEXT: mul.w $a0, $a0, $a2
; LA32-NEXT: ret		; LA32-NEXT: ret
;		;
; LA64-LABEL: mul_i64_49:		; LA64-LABEL: mul_i64_49:
; LA64: # %bb.0:		; LA64: # %bb.0:
; LA64-NEXT: ori $a1, $zero, 49		; LA64-NEXT: alsl.d $a1, $a0, $a0, 1
; LA64-NEXT: mul.d $a0, $a0, $a1		; LA64-NEXT: alsl.d $a0, $a1, $a0, 4
; LA64-NEXT: ret		; LA64-NEXT: ret
%b = mul i64 %a, 49		%b = mul i64 %a, 49
ret i64 %b		ret i64 %b
}		}

define i64 @mul_i64_69(i64 %a) {		define i64 @mul_i64_69(i64 %a) {
; LA32-LABEL: mul_i64_69:		; LA32-LABEL: mul_i64_69:
; LA32: # %bb.0:		; LA32: # %bb.0:
; LA32-NEXT: ori $a2, $zero, 69		; LA32-NEXT: ori $a2, $zero, 69
; LA32-NEXT: mul.w $a1, $a1, $a2		; LA32-NEXT: mul.w $a1, $a1, $a2
; LA32-NEXT: mulh.wu $a3, $a0, $a2		; LA32-NEXT: mulh.wu $a3, $a0, $a2
; LA32-NEXT: add.w $a1, $a3, $a1		; LA32-NEXT: add.w $a1, $a3, $a1
; LA32-NEXT: mul.w $a0, $a0, $a2		; LA32-NEXT: mul.w $a0, $a0, $a2
; LA32-NEXT: ret		; LA32-NEXT: ret
;		;
; LA64-LABEL: mul_i64_69:		; LA64-LABEL: mul_i64_69:
; LA64: # %bb.0:		; LA64: # %bb.0:
; LA64-NEXT: ori $a1, $zero, 69		; LA64-NEXT: alsl.d $a1, $a0, $a0, 4
; LA64-NEXT: mul.d $a0, $a0, $a1		; LA64-NEXT: alsl.d $a0, $a1, $a0, 2
; LA64-NEXT: ret		; LA64-NEXT: ret
%b = mul i64 %a, 69		%b = mul i64 %a, 69
ret i64 %b		ret i64 %b
}		}

define i64 @mul_i64_73(i64 %a) {		define i64 @mul_i64_73(i64 %a) {
; LA32-LABEL: mul_i64_73:		; LA32-LABEL: mul_i64_73:
; LA32: # %bb.0:		; LA32: # %bb.0:
; LA32-NEXT: ori $a2, $zero, 73		; LA32-NEXT: ori $a2, $zero, 73
; LA32-NEXT: mul.w $a1, $a1, $a2		; LA32-NEXT: mul.w $a1, $a1, $a2
; LA32-NEXT: mulh.wu $a3, $a0, $a2		; LA32-NEXT: mulh.wu $a3, $a0, $a2
; LA32-NEXT: add.w $a1, $a3, $a1		; LA32-NEXT: add.w $a1, $a3, $a1
; LA32-NEXT: mul.w $a0, $a0, $a2		; LA32-NEXT: mul.w $a0, $a0, $a2
; LA32-NEXT: ret		; LA32-NEXT: ret
;		;
; LA64-LABEL: mul_i64_73:		; LA64-LABEL: mul_i64_73:
; LA64: # %bb.0:		; LA64: # %bb.0:
; LA64-NEXT: ori $a1, $zero, 73		; LA64-NEXT: alsl.d $a1, $a0, $a0, 3
; LA64-NEXT: mul.d $a0, $a0, $a1		; LA64-NEXT: alsl.d $a0, $a1, $a0, 3
; LA64-NEXT: ret		; LA64-NEXT: ret
%b = mul i64 %a, 73		%b = mul i64 %a, 73
ret i64 %b		ret i64 %b
}		}

define i64 @mul_i64_137(i64 %a) {		define i64 @mul_i64_137(i64 %a) {
; LA32-LABEL: mul_i64_137:		; LA32-LABEL: mul_i64_137:
; LA32: # %bb.0:		; LA32: # %bb.0:
; LA32-NEXT: ori $a2, $zero, 137		; LA32-NEXT: ori $a2, $zero, 137
; LA32-NEXT: mul.w $a1, $a1, $a2		; LA32-NEXT: mul.w $a1, $a1, $a2
; LA32-NEXT: mulh.wu $a3, $a0, $a2		; LA32-NEXT: mulh.wu $a3, $a0, $a2
; LA32-NEXT: add.w $a1, $a3, $a1		; LA32-NEXT: add.w $a1, $a3, $a1
; LA32-NEXT: mul.w $a0, $a0, $a2		; LA32-NEXT: mul.w $a0, $a0, $a2
; LA32-NEXT: ret		; LA32-NEXT: ret
;		;
; LA64-LABEL: mul_i64_137:		; LA64-LABEL: mul_i64_137:
; LA64: # %bb.0:		; LA64: # %bb.0:
; LA64-NEXT: ori $a1, $zero, 137		; LA64-NEXT: alsl.d $a1, $a0, $a0, 4
; LA64-NEXT: mul.d $a0, $a0, $a1		; LA64-NEXT: alsl.d $a0, $a1, $a0, 3
; LA64-NEXT: ret		; LA64-NEXT: ret
%b = mul i64 %a, 137		%b = mul i64 %a, 137
ret i64 %b		ret i64 %b
}		}

define i64 @mul_i64_145(i64 %a) {		define i64 @mul_i64_145(i64 %a) {
; LA32-LABEL: mul_i64_145:		; LA32-LABEL: mul_i64_145:
; LA32: # %bb.0:		; LA32: # %bb.0:
; LA32-NEXT: ori $a2, $zero, 145		; LA32-NEXT: ori $a2, $zero, 145
; LA32-NEXT: mul.w $a1, $a1, $a2		; LA32-NEXT: mul.w $a1, $a1, $a2
; LA32-NEXT: mulh.wu $a3, $a0, $a2		; LA32-NEXT: mulh.wu $a3, $a0, $a2
; LA32-NEXT: add.w $a1, $a3, $a1		; LA32-NEXT: add.w $a1, $a3, $a1
; LA32-NEXT: mul.w $a0, $a0, $a2		; LA32-NEXT: mul.w $a0, $a0, $a2
; LA32-NEXT: ret		; LA32-NEXT: ret
;		;
; LA64-LABEL: mul_i64_145:		; LA64-LABEL: mul_i64_145:
; LA64: # %bb.0:		; LA64: # %bb.0:
; LA64-NEXT: ori $a1, $zero, 145		; LA64-NEXT: alsl.d $a1, $a0, $a0, 3
; LA64-NEXT: mul.d $a0, $a0, $a1		; LA64-NEXT: alsl.d $a0, $a1, $a0, 4
; LA64-NEXT: ret		; LA64-NEXT: ret
%b = mul i64 %a, 145		%b = mul i64 %a, 145
ret i64 %b		ret i64 %b
}		}

define i64 @mul_i64_273(i64 %a) {		define i64 @mul_i64_273(i64 %a) {
; LA32-LABEL: mul_i64_273:		; LA32-LABEL: mul_i64_273:
; LA32: # %bb.0:		; LA32: # %bb.0:
; LA32-NEXT: ori $a2, $zero, 273		; LA32-NEXT: ori $a2, $zero, 273
; LA32-NEXT: mul.w $a1, $a1, $a2		; LA32-NEXT: mul.w $a1, $a1, $a2
; LA32-NEXT: mulh.wu $a3, $a0, $a2		; LA32-NEXT: mulh.wu $a3, $a0, $a2
; LA32-NEXT: add.w $a1, $a3, $a1		; LA32-NEXT: add.w $a1, $a3, $a1
; LA32-NEXT: mul.w $a0, $a0, $a2		; LA32-NEXT: mul.w $a0, $a0, $a2
; LA32-NEXT: ret		; LA32-NEXT: ret
;		;
; LA64-LABEL: mul_i64_273:		; LA64-LABEL: mul_i64_273:
; LA64: # %bb.0:		; LA64: # %bb.0:
; LA64-NEXT: ori $a1, $zero, 273		; LA64-NEXT: alsl.d $a1, $a0, $a0, 4
; LA64-NEXT: mul.d $a0, $a0, $a1		; LA64-NEXT: alsl.d $a0, $a1, $a0, 4
; LA64-NEXT: ret		; LA64-NEXT: ret
%b = mul i64 %a, 273		%b = mul i64 %a, 273
ret i64 %b		ret i64 %b
}		}

This is an archive of the discontinued LLVM Phabricator instance.

[LoongArch] Optimize multiplication with immediatesClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 509933

llvm/lib/Target/LoongArch/LoongArchInstrInfo.td

llvm/test/CodeGen/LoongArch/ir-instruction/mul.ll

[LoongArch] Optimize multiplication with immediates
ClosedPublic