Download Raw Diff

Details

Reviewers

craig.topper
asb
luismarques
jrtc27

Summary

Optimize (add (shl x, c0), (shl y, c1)) to

(SLLI (SHxADD y, x), c0) if applicable.

Diff Detail

Event Timeline

benshi001 created this revision.Sep 13 2021, 4:36 PM

Herald added subscribers: vkmr, frasercrmck, evandro and 22 others. · View Herald TranscriptSep 13 2021, 4:36 PM

benshi001 requested review of this revision.Sep 13 2021, 4:36 PM

Herald added a project: Restricted Project. · View Herald TranscriptSep 13 2021, 4:36 PM

Herald added subscribers: llvm-commits, MaskRay. · View Herald Transcript

The reason I write both AddShlShl_1A and def AddShlShl_1B, is that add is not commutative in PatFrag.

jrtc27 added inline comments.Sep 13 2021, 4:42 PM

llvm/lib/Target/RISCV/RISCVInstrInfoB.td
215 ↗	(On Diff #372366)	This should just be a templated class that takes the +/- 1/2/3 as an argument rather than copy-pasting the same thing 6 times. Though the number of patterns and special cases for all the bitmanip stuff seems to be getting rather crazy; is there an end in sight?

In D109729#2998731, @benshi001 wrote:

The reason I write both AddShlShl_1A and def AddShlShl_1B, is that add is not commutative in PatFrag.

You should write that as a comment in the code.

In D109729#2998734, @craig.topper wrote:

In D109729#2998731, @benshi001 wrote:

The reason I write both AddShlShl_1A and def AddShlShl_1B, is that add is not commutative in PatFrag.

You should write that as a comment in the code.

Actually it's worse than that. Tablegen does know the pattern is commutable and will call you predicate function twice. But one of the calls will be wrong. I hope it is guaranteed that the correct check always happens first. There is a feature to make this work. It involves setting "let PredicateCodeUsesOperands = 1;" on the PatFrag. Only AMDGPU uses it. You should look up the patch that added it.

Harbormaster completed remote builds in B123763: Diff 372366.Sep 13 2021, 5:15 PM

Using let PredicateCodeUsesOperands = 1 makes code more boring and complex. So I have resorted to using DAG2GAG selection which looks more clear.

benshi001 updated this revision to Diff 372396.Sep 13 2021, 9:19 PM

In D109729#2998980, @benshi001 wrote:

Using let PredicateCodeUsesOperands = 1 makes code more boring and complex. So I have resorted to using DAG2GAG selection which looks more clear.

I'm not sure what you mean by boring here. Can you share one of the PatFrags using that feature?

In D109729#2998986, @craig.topper wrote:

In D109729#2998980, @benshi001 wrote:

Using let PredicateCodeUsesOperands = 1 makes code more boring and complex. So I have resorted to using DAG2GAG selection which looks more clear.

I'm not sure what you mean by boring here. Can you share one of the PatFrags using that feature?

I mean the similar code is copied 6 times which is boring, and it becomes more complex than I expected. and I think using DAG2DAG is more clear.

In D109729#2998986, @craig.topper wrote:

In D109729#2998980, @benshi001 wrote:

Using let PredicateCodeUsesOperands = 1 makes code more boring and complex. So I have resorted to using DAG2GAG selection which looks more clear.

I'm not sure what you mean by boring here. Can you share one of the PatFrags using that feature?

Using let PredicateCodeUsesOperands = 1 also needs implementing let GISelPredicateCode = [{...}], otherwise the TableGen will failed.

such as

def patfrags_test_pat : PatFrags<
  (ops node:$x, node:$y, node:$z),
  [ (xor (add node:$x, node:$y), node:$z),
    (xor (sub node:$x, node:$y), node:$z)
  ], [{ return foo(); }]> {
  let GISelPredicateCode = [{
    return doesComplexCheck(MI);
  }];

  let PredicateCodeUsesOperands = 1;
}

That make the code becomes more redundant and complex.

In D109729#2998987, @benshi001 wrote:

In D109729#2998986, @craig.topper wrote:

In D109729#2998980, @benshi001 wrote:

Using let PredicateCodeUsesOperands = 1 makes code more boring and complex. So I have resorted to using DAG2GAG selection which looks more clear.

I'm not sure what you mean by boring here. Can you share one of the PatFrags using that feature?

I mean the similar code is copied 6 times which is boring, and it becomes more complex than I expected. and I think using DAG2DAG is more clear.

The PredicateCodeUsesOperands feature should only require 3 PatFrags that look like this, but I can't get it to compile.

let PredicateCodeUsesOperands = 1 in
def AddShlShl_1A : PatFrag<(ops node:$A, node:$B, node:$C, node:$D),
                           (add (shl node:$A, node:$B),
                                (shl node:$C, node:$D)), [{
  SDValue N0 = Operands[0], N1 = Operands[1];
  if (!N0.hasOneUse() || !N1.hasOneUse())
    return false;
  auto *N0C = cast<ConstantSDNode>(N0.getOperand(1));
  auto *N1C = cast<ConstantSDNode>(N1.getOperand(1));
  uint64_t C0 = N0C->getZExtValue(), C1 = N1C->getZExtValue();
  return C0 == C1 + 1;                                                                                                                                                       
}]>;

llvm/lib/Target/RISCV/RISCVISelDAGToDAG.cpp
539	vevtor->vector
540	The `VT.getSizeInBits() > Subtarget->getXLen()` should never fail. If the VT is scalar it must be XLenVT.
584	There's already a DL in the top of this function.

benshi001 updated this revision to Diff 372399.Sep 13 2021, 9:51 PM

benshi001 edited the summary of this revision. (Show Details)

benshi001 marked 3 inline comments as done.

Harbormaster completed remote builds in B123789: Diff 372399.Sep 13 2021, 10:28 PM

benshi001 updated this revision to Diff 372637.Sep 14 2021, 11:22 PM

Harbormaster completed remote builds in B123964: Diff 372637.Sep 14 2021, 11:39 PM

benshi001 updated this revision to Diff 372646.Sep 15 2021, 1:06 AM

Harbormaster completed remote builds in B123969: Diff 372646.Sep 15 2021, 1:55 AM

benshi001 updated this revision to Diff 372702.Sep 15 2021, 7:25 AM

Harbormaster completed remote builds in B124011: Diff 372702.Sep 15 2021, 8:02 AM

luismarques mentioned this in D108916: [RISCV] Optimize (add (shl x, c0), (shl y, c1)) with SH*ADD.Sep 16 2021, 5:15 AM

I'm inclined to prefer D108916 over this.

benshi001 abandoned this revision.Sep 18 2021, 5:04 PM

Diff 372702

llvm/lib/Target/RISCV/RISCVISelDAGToDAG.cpp

Show First 20 Lines • Show All 522 Lines • ▼ Show 20 Lines	if (N1C) {
ReplaceNode(Node, SRLI);		ReplaceNode(Node, SRLI);
return;		return;
}		}
}		}
}		}

break;		break;
}		}

		// Optimize (add (shl x, c0), (shl y, c1)) ->
		// (SLLI (SH*ADD y, x), c0), if c1-c0 equals to [1\|2\|3].
		case ISD::ADD: {
		// Perform this optimization only in the zba extension.
		if (!Subtarget->hasStdExtZba())
		break;

		// Skip for vector types.
		craig.topperUnsubmitted Done Reply Inline Actions vevtor->vector craig.topper: vevtor->vector
		if (VT.isVector())
		craig.topperUnsubmitted Done Reply Inline Actions The `VT.getSizeInBits() > Subtarget->getXLen()` should never fail. If the VT is scalar it must be XLenVT. craig.topper: The `VT.getSizeInBits() > Subtarget->getXLen()` should never fail. If the VT is scalar it must…
		break;

		// The two operand nodes must be SHL and have no other use.
		SDValue N0 = Node->getOperand(0);
		SDValue N1 = Node->getOperand(1);
		if (N0.getOpcode() != ISD::SHL \|\| N1.getOpcode() != ISD::SHL \|\|
		!N0.hasOneUse() \|\| !N1.hasOneUse())
		break;

		// Check c0 and c1.
		auto *NC0 = dyn_cast<ConstantSDNode>(N0->getOperand(1));
		auto *NC1 = dyn_cast<ConstantSDNode>(N1->getOperand(1));
		if (!NC0 \|\| !NC1)
		break;
		int64_t C0 = NC0->getSExtValue();
		int64_t C1 = NC1->getSExtValue();
		if (C0 <= 0 \|\| C1 <= 0 \|\| C0 >= Subtarget->getXLen() \|\|
		C1 >= Subtarget->getXLen())
		break;
		int64_t Bits = std::min(C0, C1);
		int64_t Diff = std::max(C0, C1) - Bits;

		// Select SH1ADD/SH2ADD/SH3ADD or skip.
		unsigned Opc;
		if (Diff == 1)
		Opc = RISCV::SH1ADD;
		else if (Diff == 2)
		Opc = RISCV::SH2ADD;
		else if (Diff == 3)
		Opc = RISCV::SH3ADD;
		else
		break;

		// Build machine nodes and replace SDNodes.
		SDValue NS = (C0 < C1) ? N0->getOperand(0) : N1->getOperand(0);
		SDValue NL = (C0 > C1) ? N0->getOperand(0) : N1->getOperand(0);
		SDNode *NAD = CurDAG->getMachineNode(Opc, DL, VT, NL, NS);
		SDNode *NSH =
		CurDAG->getMachineNode(RISCV::SLLI, DL, VT, SDValue(NAD, 0),
		CurDAG->getTargetConstant(Bits, DL, VT));
		ReplaceNode(Node, NSH);
		return;
		}

		craig.topperUnsubmitted Done Reply Inline Actions There's already a DL in the top of this function. craig.topper: There's already a DL in the top of this function.
case ISD::AND: {		case ISD::AND: {
auto *N1C = dyn_cast<ConstantSDNode>(Node->getOperand(1));		auto *N1C = dyn_cast<ConstantSDNode>(Node->getOperand(1));
if (!N1C)		if (!N1C)
break;		break;

SDValue N0 = Node->getOperand(0);		SDValue N0 = Node->getOperand(0);

bool LeftShift = N0.getOpcode() == ISD::SHL;		bool LeftShift = N0.getOpcode() == ISD::SHL;
▲ Show 20 Lines • Show All 1,346 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/rv32zba.ll

	Show First 20 Lines • Show All 790 Lines • ▼ Show 20 Lines
	; RV32I: # %bb.0:			; RV32I: # %bb.0:
	; RV32I-NEXT: slli a0, a0, 5			; RV32I-NEXT: slli a0, a0, 5
	; RV32I-NEXT: slli a1, a1, 6			; RV32I-NEXT: slli a1, a1, 6
	; RV32I-NEXT: add a0, a0, a1			; RV32I-NEXT: add a0, a0, a1
	; RV32I-NEXT: ret			; RV32I-NEXT: ret
	;			;
	; RV32B-LABEL: addshl_5_6:			; RV32B-LABEL: addshl_5_6:
	; RV32B: # %bb.0:			; RV32B: # %bb.0:
				; RV32B-NEXT: sh1add a0, a1, a0
	; RV32B-NEXT: slli a0, a0, 5			; RV32B-NEXT: slli a0, a0, 5
	; RV32B-NEXT: slli a1, a1, 6
	; RV32B-NEXT: add a0, a0, a1
	; RV32B-NEXT: ret			; RV32B-NEXT: ret
	;			;
	; RV32ZBA-LABEL: addshl_5_6:			; RV32ZBA-LABEL: addshl_5_6:
	; RV32ZBA: # %bb.0:			; RV32ZBA: # %bb.0:
				; RV32ZBA-NEXT: sh1add a0, a1, a0
	; RV32ZBA-NEXT: slli a0, a0, 5			; RV32ZBA-NEXT: slli a0, a0, 5
	; RV32ZBA-NEXT: slli a1, a1, 6
	; RV32ZBA-NEXT: add a0, a0, a1
	; RV32ZBA-NEXT: ret			; RV32ZBA-NEXT: ret
	%c = shl i32 %a, 5			%c = shl i32 %a, 5
	%d = shl i32 %b, 6			%d = shl i32 %b, 6
	%e = add i32 %c, %d			%e = add i32 %c, %d
	ret i32 %e			ret i32 %e
	}			}

	define i32 @addshl_5_7(i32 %a, i32 %b) {			define i32 @addshl_5_7(i32 %a, i32 %b) {
	; RV32I-LABEL: addshl_5_7:			; RV32I-LABEL: addshl_5_7:
	; RV32I: # %bb.0:			; RV32I: # %bb.0:
	; RV32I-NEXT: slli a0, a0, 5			; RV32I-NEXT: slli a0, a0, 5
	; RV32I-NEXT: slli a1, a1, 7			; RV32I-NEXT: slli a1, a1, 7
	; RV32I-NEXT: add a0, a0, a1			; RV32I-NEXT: add a0, a0, a1
	; RV32I-NEXT: ret			; RV32I-NEXT: ret
	;			;
	; RV32B-LABEL: addshl_5_7:			; RV32B-LABEL: addshl_5_7:
	; RV32B: # %bb.0:			; RV32B: # %bb.0:
				; RV32B-NEXT: sh2add a0, a1, a0
	; RV32B-NEXT: slli a0, a0, 5			; RV32B-NEXT: slli a0, a0, 5
	; RV32B-NEXT: slli a1, a1, 7
	; RV32B-NEXT: add a0, a0, a1
	; RV32B-NEXT: ret			; RV32B-NEXT: ret
	;			;
	; RV32ZBA-LABEL: addshl_5_7:			; RV32ZBA-LABEL: addshl_5_7:
	; RV32ZBA: # %bb.0:			; RV32ZBA: # %bb.0:
				; RV32ZBA-NEXT: sh2add a0, a1, a0
	; RV32ZBA-NEXT: slli a0, a0, 5			; RV32ZBA-NEXT: slli a0, a0, 5
	; RV32ZBA-NEXT: slli a1, a1, 7
	; RV32ZBA-NEXT: add a0, a0, a1
	; RV32ZBA-NEXT: ret			; RV32ZBA-NEXT: ret
	%c = shl i32 %a, 5			%c = shl i32 %a, 5
	%d = shl i32 %b, 7			%d = shl i32 %b, 7
	%e = add i32 %c, %d			%e = add i32 %c, %d
	ret i32 %e			ret i32 %e
	}			}

	define i32 @addshl_5_8(i32 %a, i32 %b) {			define i32 @addshl_5_8(i32 %a, i32 %b) {
	; RV32I-LABEL: addshl_5_8:			; RV32I-LABEL: addshl_5_8:
	; RV32I: # %bb.0:			; RV32I: # %bb.0:
	; RV32I-NEXT: slli a0, a0, 5			; RV32I-NEXT: slli a0, a0, 5
	; RV32I-NEXT: slli a1, a1, 8			; RV32I-NEXT: slli a1, a1, 8
	; RV32I-NEXT: add a0, a0, a1			; RV32I-NEXT: add a0, a0, a1
	; RV32I-NEXT: ret			; RV32I-NEXT: ret
	;			;
	; RV32B-LABEL: addshl_5_8:			; RV32B-LABEL: addshl_5_8:
	; RV32B: # %bb.0:			; RV32B: # %bb.0:
				; RV32B-NEXT: sh3add a0, a1, a0
	; RV32B-NEXT: slli a0, a0, 5			; RV32B-NEXT: slli a0, a0, 5
	; RV32B-NEXT: slli a1, a1, 8
	; RV32B-NEXT: add a0, a0, a1
	; RV32B-NEXT: ret			; RV32B-NEXT: ret
	;			;
	; RV32ZBA-LABEL: addshl_5_8:			; RV32ZBA-LABEL: addshl_5_8:
	; RV32ZBA: # %bb.0:			; RV32ZBA: # %bb.0:
				; RV32ZBA-NEXT: sh3add a0, a1, a0
	; RV32ZBA-NEXT: slli a0, a0, 5			; RV32ZBA-NEXT: slli a0, a0, 5
	; RV32ZBA-NEXT: slli a1, a1, 8
	; RV32ZBA-NEXT: add a0, a0, a1
	; RV32ZBA-NEXT: ret			; RV32ZBA-NEXT: ret
	%c = shl i32 %a, 5			%c = shl i32 %a, 5
	%d = shl i32 %b, 8			%d = shl i32 %b, 8
	%e = add i32 %c, %d			%e = add i32 %c, %d
	ret i32 %e			ret i32 %e
	}			}

llvm/test/CodeGen/RISCV/rv64zba.ll

	Show First 20 Lines • Show All 1,401 Lines • ▼ Show 20 Lines
	; RV64I: # %bb.0:			; RV64I: # %bb.0:
	; RV64I-NEXT: slliw a0, a0, 5			; RV64I-NEXT: slliw a0, a0, 5
	; RV64I-NEXT: slliw a1, a1, 6			; RV64I-NEXT: slliw a1, a1, 6
	; RV64I-NEXT: addw a0, a0, a1			; RV64I-NEXT: addw a0, a0, a1
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64B-LABEL: addshl32_5_6:			; RV64B-LABEL: addshl32_5_6:
	; RV64B: # %bb.0:			; RV64B: # %bb.0:
				; RV64B-NEXT: sh1add a0, a1, a0
	; RV64B-NEXT: slliw a0, a0, 5			; RV64B-NEXT: slliw a0, a0, 5
	; RV64B-NEXT: slliw a1, a1, 6
	; RV64B-NEXT: addw a0, a0, a1
	; RV64B-NEXT: ret			; RV64B-NEXT: ret
	;			;
	; RV64ZBA-LABEL: addshl32_5_6:			; RV64ZBA-LABEL: addshl32_5_6:
	; RV64ZBA: # %bb.0:			; RV64ZBA: # %bb.0:
				; RV64ZBA-NEXT: sh1add a0, a1, a0
	; RV64ZBA-NEXT: slliw a0, a0, 5			; RV64ZBA-NEXT: slliw a0, a0, 5
	; RV64ZBA-NEXT: slliw a1, a1, 6
	; RV64ZBA-NEXT: addw a0, a0, a1
	; RV64ZBA-NEXT: ret			; RV64ZBA-NEXT: ret
	%c = shl i32 %a, 5			%c = shl i32 %a, 5
	%d = shl i32 %b, 6			%d = shl i32 %b, 6
	%e = add i32 %c, %d			%e = add i32 %c, %d
	ret i32 %e			ret i32 %e
	}			}

	define i64 @addshl64_5_6(i64 %a, i64 %b) {			define i64 @addshl64_5_6(i64 %a, i64 %b) {
	; RV64I-LABEL: addshl64_5_6:			; RV64I-LABEL: addshl64_5_6:
	; RV64I: # %bb.0:			; RV64I: # %bb.0:
	; RV64I-NEXT: slli a0, a0, 5			; RV64I-NEXT: slli a0, a0, 5
	; RV64I-NEXT: slli a1, a1, 6			; RV64I-NEXT: slli a1, a1, 6
	; RV64I-NEXT: add a0, a0, a1			; RV64I-NEXT: add a0, a0, a1
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64B-LABEL: addshl64_5_6:			; RV64B-LABEL: addshl64_5_6:
	; RV64B: # %bb.0:			; RV64B: # %bb.0:
				; RV64B-NEXT: sh1add a0, a1, a0
	; RV64B-NEXT: slli a0, a0, 5			; RV64B-NEXT: slli a0, a0, 5
	; RV64B-NEXT: slli a1, a1, 6
	; RV64B-NEXT: add a0, a0, a1
	; RV64B-NEXT: ret			; RV64B-NEXT: ret
	;			;
	; RV64ZBA-LABEL: addshl64_5_6:			; RV64ZBA-LABEL: addshl64_5_6:
	; RV64ZBA: # %bb.0:			; RV64ZBA: # %bb.0:
				; RV64ZBA-NEXT: sh1add a0, a1, a0
	; RV64ZBA-NEXT: slli a0, a0, 5			; RV64ZBA-NEXT: slli a0, a0, 5
	; RV64ZBA-NEXT: slli a1, a1, 6
	; RV64ZBA-NEXT: add a0, a0, a1
	; RV64ZBA-NEXT: ret			; RV64ZBA-NEXT: ret
	%c = shl i64 %a, 5			%c = shl i64 %a, 5
	%d = shl i64 %b, 6			%d = shl i64 %b, 6
	%e = add i64 %c, %d			%e = add i64 %c, %d
	ret i64 %e			ret i64 %e
	}			}

	define signext i32 @addshl32_5_7(i32 signext %a, i32 signext %b) {			define signext i32 @addshl32_5_7(i32 signext %a, i32 signext %b) {
	; RV64I-LABEL: addshl32_5_7:			; RV64I-LABEL: addshl32_5_7:
	; RV64I: # %bb.0:			; RV64I: # %bb.0:
	; RV64I-NEXT: slliw a0, a0, 5			; RV64I-NEXT: slliw a0, a0, 5
	; RV64I-NEXT: slliw a1, a1, 7			; RV64I-NEXT: slliw a1, a1, 7
	; RV64I-NEXT: addw a0, a0, a1			; RV64I-NEXT: addw a0, a0, a1
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64B-LABEL: addshl32_5_7:			; RV64B-LABEL: addshl32_5_7:
	; RV64B: # %bb.0:			; RV64B: # %bb.0:
				; RV64B-NEXT: sh2add a0, a1, a0
	; RV64B-NEXT: slliw a0, a0, 5			; RV64B-NEXT: slliw a0, a0, 5
	; RV64B-NEXT: slliw a1, a1, 7
	; RV64B-NEXT: addw a0, a0, a1
	; RV64B-NEXT: ret			; RV64B-NEXT: ret
	;			;
	; RV64ZBA-LABEL: addshl32_5_7:			; RV64ZBA-LABEL: addshl32_5_7:
	; RV64ZBA: # %bb.0:			; RV64ZBA: # %bb.0:
				; RV64ZBA-NEXT: sh2add a0, a1, a0
	; RV64ZBA-NEXT: slliw a0, a0, 5			; RV64ZBA-NEXT: slliw a0, a0, 5
	; RV64ZBA-NEXT: slliw a1, a1, 7
	; RV64ZBA-NEXT: addw a0, a0, a1
	; RV64ZBA-NEXT: ret			; RV64ZBA-NEXT: ret
	%c = shl i32 %a, 5			%c = shl i32 %a, 5
	%d = shl i32 %b, 7			%d = shl i32 %b, 7
	%e = add i32 %c, %d			%e = add i32 %c, %d
	ret i32 %e			ret i32 %e
	}			}

	define i64 @addshl64_5_7(i64 %a, i64 %b) {			define i64 @addshl64_5_7(i64 %a, i64 %b) {
	; RV64I-LABEL: addshl64_5_7:			; RV64I-LABEL: addshl64_5_7:
	; RV64I: # %bb.0:			; RV64I: # %bb.0:
	; RV64I-NEXT: slli a0, a0, 5			; RV64I-NEXT: slli a0, a0, 5
	; RV64I-NEXT: slli a1, a1, 7			; RV64I-NEXT: slli a1, a1, 7
	; RV64I-NEXT: add a0, a0, a1			; RV64I-NEXT: add a0, a0, a1
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64B-LABEL: addshl64_5_7:			; RV64B-LABEL: addshl64_5_7:
	; RV64B: # %bb.0:			; RV64B: # %bb.0:
				; RV64B-NEXT: sh2add a0, a1, a0
	; RV64B-NEXT: slli a0, a0, 5			; RV64B-NEXT: slli a0, a0, 5
	; RV64B-NEXT: slli a1, a1, 7
	; RV64B-NEXT: add a0, a0, a1
	; RV64B-NEXT: ret			; RV64B-NEXT: ret
	;			;
	; RV64ZBA-LABEL: addshl64_5_7:			; RV64ZBA-LABEL: addshl64_5_7:
	; RV64ZBA: # %bb.0:			; RV64ZBA: # %bb.0:
				; RV64ZBA-NEXT: sh2add a0, a1, a0
	; RV64ZBA-NEXT: slli a0, a0, 5			; RV64ZBA-NEXT: slli a0, a0, 5
	; RV64ZBA-NEXT: slli a1, a1, 7
	; RV64ZBA-NEXT: add a0, a0, a1
	; RV64ZBA-NEXT: ret			; RV64ZBA-NEXT: ret
	%c = shl i64 %a, 5			%c = shl i64 %a, 5
	%d = shl i64 %b, 7			%d = shl i64 %b, 7
	%e = add i64 %c, %d			%e = add i64 %c, %d
	ret i64 %e			ret i64 %e
	}			}

	define signext i32 @addshl32_5_8(i32 signext %a, i32 signext %b) {			define signext i32 @addshl32_5_8(i32 signext %a, i32 signext %b) {
	; RV64I-LABEL: addshl32_5_8:			; RV64I-LABEL: addshl32_5_8:
	; RV64I: # %bb.0:			; RV64I: # %bb.0:
	; RV64I-NEXT: slliw a0, a0, 5			; RV64I-NEXT: slliw a0, a0, 5
	; RV64I-NEXT: slliw a1, a1, 8			; RV64I-NEXT: slliw a1, a1, 8
	; RV64I-NEXT: addw a0, a0, a1			; RV64I-NEXT: addw a0, a0, a1
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64B-LABEL: addshl32_5_8:			; RV64B-LABEL: addshl32_5_8:
	; RV64B: # %bb.0:			; RV64B: # %bb.0:
				; RV64B-NEXT: sh3add a0, a1, a0
	; RV64B-NEXT: slliw a0, a0, 5			; RV64B-NEXT: slliw a0, a0, 5
	; RV64B-NEXT: slliw a1, a1, 8
	; RV64B-NEXT: addw a0, a0, a1
	; RV64B-NEXT: ret			; RV64B-NEXT: ret
	;			;
	; RV64ZBA-LABEL: addshl32_5_8:			; RV64ZBA-LABEL: addshl32_5_8:
	; RV64ZBA: # %bb.0:			; RV64ZBA: # %bb.0:
				; RV64ZBA-NEXT: sh3add a0, a1, a0
	; RV64ZBA-NEXT: slliw a0, a0, 5			; RV64ZBA-NEXT: slliw a0, a0, 5
	; RV64ZBA-NEXT: slliw a1, a1, 8
	; RV64ZBA-NEXT: addw a0, a0, a1
	; RV64ZBA-NEXT: ret			; RV64ZBA-NEXT: ret
	%c = shl i32 %a, 5			%c = shl i32 %a, 5
	%d = shl i32 %b, 8			%d = shl i32 %b, 8
	%e = add i32 %c, %d			%e = add i32 %c, %d
	ret i32 %e			ret i32 %e
	}			}

	define i64 @addshl64_5_8(i64 %a, i64 %b) {			define i64 @addshl64_5_8(i64 %a, i64 %b) {
	; RV64I-LABEL: addshl64_5_8:			; RV64I-LABEL: addshl64_5_8:
	; RV64I: # %bb.0:			; RV64I: # %bb.0:
	; RV64I-NEXT: slli a0, a0, 5			; RV64I-NEXT: slli a0, a0, 5
	; RV64I-NEXT: slli a1, a1, 8			; RV64I-NEXT: slli a1, a1, 8
	; RV64I-NEXT: add a0, a0, a1			; RV64I-NEXT: add a0, a0, a1
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64B-LABEL: addshl64_5_8:			; RV64B-LABEL: addshl64_5_8:
	; RV64B: # %bb.0:			; RV64B: # %bb.0:
				; RV64B-NEXT: sh3add a0, a1, a0
	; RV64B-NEXT: slli a0, a0, 5			; RV64B-NEXT: slli a0, a0, 5
	; RV64B-NEXT: slli a1, a1, 8
	; RV64B-NEXT: add a0, a0, a1
	; RV64B-NEXT: ret			; RV64B-NEXT: ret
	;			;
	; RV64ZBA-LABEL: addshl64_5_8:			; RV64ZBA-LABEL: addshl64_5_8:
	; RV64ZBA: # %bb.0:			; RV64ZBA: # %bb.0:
				; RV64ZBA-NEXT: sh3add a0, a1, a0
	; RV64ZBA-NEXT: slli a0, a0, 5			; RV64ZBA-NEXT: slli a0, a0, 5
	; RV64ZBA-NEXT: slli a1, a1, 8
	; RV64ZBA-NEXT: add a0, a0, a1
	; RV64ZBA-NEXT: ret			; RV64ZBA-NEXT: ret
	%c = shl i64 %a, 5			%c = shl i64 %a, 5
	%d = shl i64 %b, 8			%d = shl i64 %b, 8
	%e = add i64 %c, %d			%e = add i64 %c, %d
	ret i64 %e			ret i64 %e
	}			}

This is an archive of the discontinued LLVM Phabricator instance.

[RISCV] Optimize (add (shl x, c0), (shl y, c1))
AbandonedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 372702

llvm/lib/Target/RISCV/RISCVISelDAGToDAG.cpp

llvm/test/CodeGen/RISCV/rv32zba.ll

llvm/test/CodeGen/RISCV/rv64zba.ll

This is an archive of the discontinued LLVM Phabricator instance.

[RISCV] Optimize (add (shl x, c0), (shl y, c1))AbandonedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 372702

llvm/lib/Target/RISCV/RISCVISelDAGToDAG.cpp

llvm/test/CodeGen/RISCV/rv32zba.ll

llvm/test/CodeGen/RISCV/rv64zba.ll

[RISCV] Optimize (add (shl x, c0), (shl y, c1))
AbandonedPublic