This is an archive of the discontinued LLVM Phabricator instance.

Paths

Table of Contentst

-
llvm/test/CodeGen/RISCV/
-
test/
-
CodeGen/
-
RISCV/
-
add-before-mul.ll

Differential D74725

Demonstrate behaviour of add mul instruction sequence
Needs ReviewPublic

Authored by davidb on Feb 17 2020, 9:01 AM.

Download Raw Diff

This revision needs review, but there are no reviewers specified.

Details

Reviewers: None

Summary

Noticed a couple of issues with the sequence and folding of mul (add x, c1), c2 -> (add (mul x, c2), c1*c2).

In some cases, the result of c1*c2 cannot be represented as an immediate without materialising into a register. In this case, it would be better not to perform this reordering of the add instruction.

In the bitcast case the constant c1 and c2 are marked as opaque and cannot be folded, resulting in a second mul instruction.

I have a fix that is a WIP that prevents this transformation in the case that 1. The value of c1*c2 cannot be represented as an immediate without a register, or 2. if either of the constants are opaque. Sadly this generates regressions on other targets that I am still investigating...

NOTE: not tagged as [RISCV] as I can demonstrate this on other targets, and might be worth adding here.

Diff Detail

Repository

rG LLVM Github Monorepo

Build Status

Buildable 46647
Build 49204: arc lint + arc unit

Event Timeline

davidb created this revision.Feb 17 2020, 9:01 AM

Herald added a project: Restricted Project. · View Herald TranscriptFeb 17 2020, 9:01 AM

Herald added subscribers: llvm-commits, luismarques, apazos and 21 others. · View Herald Transcript

Harbormaster completed remote builds in B46647: Diff 244989.Feb 17 2020, 9:06 AM

davidb edited the summary of this revision. (Show Details)Feb 17 2020, 9:10 AM

davidb added a subscriber: JonChesterfield.

davidb edited the summary of this revision. (Show Details)Feb 17 2020, 9:13 AM

Revision Contents

Path

Size

llvm/

test/

CodeGen/

RISCV/

add-before-mul.ll

177 lines

Diff 244989

llvm/test/CodeGen/RISCV/add-before-mul.ll

This file was added.

				; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
				; RUN: llc -mtriple=riscv32 -verify-machineinstrs < %s \
				; RUN: \| FileCheck -check-prefix=RV32I %s
				; RUN: llc -mtriple=riscv64 -verify-machineinstrs < %s \
				; RUN: \| FileCheck -check-prefix=RV64I %s


				define i32 @add_mul_small_imm(i32 %0, i32 %1, i32 %2) {
				; RV32I-LABEL: add_mul_small_imm:
				; RV32I: # %bb.0:
				; RV32I-NEXT: addi sp, sp, -16
				; RV32I-NEXT: .cfi_def_cfa_offset 16
				; RV32I-NEXT: sw ra, 12(sp)
				; RV32I-NEXT: .cfi_offset ra, -4
				; RV32I-NEXT: addi a1, zero, 9
				; RV32I-NEXT: call __mulsi3
				; RV32I-NEXT: addi a0, a0, 27
				; RV32I-NEXT: lw ra, 12(sp)
				; RV32I-NEXT: addi sp, sp, 16
				; RV32I-NEXT: ret
				;
				; RV64I-LABEL: add_mul_small_imm:
				; RV64I: # %bb.0:
				; RV64I-NEXT: addi sp, sp, -16
				; RV64I-NEXT: .cfi_def_cfa_offset 16
				; RV64I-NEXT: sd ra, 8(sp)
				; RV64I-NEXT: .cfi_offset ra, -8
				; RV64I-NEXT: addi a1, zero, 9
				; RV64I-NEXT: call __muldi3
				; RV64I-NEXT: addi a0, a0, 27
				; RV64I-NEXT: ld ra, 8(sp)
				; RV64I-NEXT: addi sp, sp, 16
				; RV64I-NEXT: ret
				%tmp1 = add i32 %0, 3
				%tmp3 = mul i32 %tmp1, 9
				ret i32 %tmp3
				}

				define i32 @add_mul_large_imm(i32 %0, i32 %1, i32 %2) {
				; RV32I-LABEL: add_mul_large_imm:
				; RV32I: # %bb.0:
				; RV32I-NEXT: addi sp, sp, -16
				; RV32I-NEXT: .cfi_def_cfa_offset 16
				; RV32I-NEXT: sw ra, 12(sp)
				; RV32I-NEXT: .cfi_offset ra, -4
				; RV32I-NEXT: lui a1, 6
				; RV32I-NEXT: addi a1, a1, -2048
				; RV32I-NEXT: call __mulsi3
				; RV32I-NEXT: lui a1, 17
				; RV32I-NEXT: addi a1, a1, -2048
				; RV32I-NEXT: add a0, a0, a1
				; RV32I-NEXT: lw ra, 12(sp)
				; RV32I-NEXT: addi sp, sp, 16
				; RV32I-NEXT: ret
				;
				; RV64I-LABEL: add_mul_large_imm:
				; RV64I: # %bb.0:
				; RV64I-NEXT: addi sp, sp, -16
				; RV64I-NEXT: .cfi_def_cfa_offset 16
				; RV64I-NEXT: sd ra, 8(sp)
				; RV64I-NEXT: .cfi_offset ra, -8
				; RV64I-NEXT: lui a1, 6
				; RV64I-NEXT: addiw a1, a1, -2048
				; RV64I-NEXT: call __muldi3
				; RV64I-NEXT: lui a1, 17
				; RV64I-NEXT: addiw a1, a1, -2048
				; RV64I-NEXT: add a0, a0, a1
				; RV64I-NEXT: ld ra, 8(sp)
				; RV64I-NEXT: addi sp, sp, 16
				; RV64I-NEXT: ret
				%tmp1 = add i32 %0, 3
				%tmp3 = mul i32 %tmp1, 22528
				ret i32 %tmp3
				}


				define i32 @add_mul_large_imm_bitcast(i32 %in) {
				; RV32I-LABEL: add_mul_large_imm_bitcast:
				; RV32I: # %bb.0:
				; RV32I-NEXT: addi sp, sp, -16
				; RV32I-NEXT: .cfi_def_cfa_offset 16
				; RV32I-NEXT: sw ra, 12(sp)
				; RV32I-NEXT: sw s0, 8(sp)
				; RV32I-NEXT: sw s1, 4(sp)
				; RV32I-NEXT: .cfi_offset ra, -4
				; RV32I-NEXT: .cfi_offset s0, -8
				; RV32I-NEXT: .cfi_offset s1, -12
				; RV32I-NEXT: lui a1, 912092
				; RV32I-NEXT: addi s0, a1, -273
				; RV32I-NEXT: mv a1, s0
				; RV32I-NEXT: call __mulsi3
				; RV32I-NEXT: mv s1, a0
				; RV32I-NEXT: mv a0, s0
				; RV32I-NEXT: mv a1, s0
				; RV32I-NEXT: call __mulsi3
				; RV32I-NEXT: add a0, s1, a0
				; RV32I-NEXT: lw s1, 4(sp)
				; RV32I-NEXT: lw s0, 8(sp)
				; RV32I-NEXT: lw ra, 12(sp)
				; RV32I-NEXT: addi sp, sp, 16
				; RV32I-NEXT: ret
				;
				; RV64I-LABEL: add_mul_large_imm_bitcast:
				; RV64I: # %bb.0:
				; RV64I-NEXT: addi sp, sp, -32
				; RV64I-NEXT: .cfi_def_cfa_offset 32
				; RV64I-NEXT: sd ra, 24(sp)
				; RV64I-NEXT: sd s0, 16(sp)
				; RV64I-NEXT: sd s1, 8(sp)
				; RV64I-NEXT: .cfi_offset ra, -8
				; RV64I-NEXT: .cfi_offset s0, -16
				; RV64I-NEXT: .cfi_offset s1, -24
				; RV64I-NEXT: lui a1, 912092
				; RV64I-NEXT: addiw s0, a1, -273
				; RV64I-NEXT: mv a1, s0
				; RV64I-NEXT: call __muldi3
				; RV64I-NEXT: mv s1, a0
				; RV64I-NEXT: mv a0, s0
				; RV64I-NEXT: mv a1, s0
				; RV64I-NEXT: call __muldi3
				; RV64I-NEXT: addw a0, s1, a0
				; RV64I-NEXT: ld s1, 8(sp)
				; RV64I-NEXT: ld s0, 16(sp)
				; RV64I-NEXT: ld ra, 24(sp)
				; RV64I-NEXT: addi sp, sp, 32
				; RV64I-NEXT: ret
				%const = bitcast i32 3735928559 to i32
				%add = add i32 %in, %const
				%mul = mul i32 %add, %const
				ret i32 %mul
				}

				define i32 @add_mul_small_imm_bitcast(i32 %in) {
				; RV32I-LABEL: add_mul_small_imm_bitcast:
				; RV32I: # %bb.0:
				; RV32I-NEXT: addi sp, sp, -16
				; RV32I-NEXT: .cfi_def_cfa_offset 16
				; RV32I-NEXT: sw ra, 12(sp)
				; RV32I-NEXT: sw s0, 8(sp)
				; RV32I-NEXT: .cfi_offset ra, -4
				; RV32I-NEXT: .cfi_offset s0, -8
				; RV32I-NEXT: addi a1, zero, 24
				; RV32I-NEXT: call __mulsi3
				; RV32I-NEXT: mv s0, a0
				; RV32I-NEXT: addi a0, zero, 24
				; RV32I-NEXT: addi a1, zero, 24
				; RV32I-NEXT: call __mulsi3
				; RV32I-NEXT: add a0, s0, a0
				; RV32I-NEXT: lw s0, 8(sp)
				; RV32I-NEXT: lw ra, 12(sp)
				; RV32I-NEXT: addi sp, sp, 16
				; RV32I-NEXT: ret
				;
				; RV64I-LABEL: add_mul_small_imm_bitcast:
				; RV64I: # %bb.0:
				; RV64I-NEXT: addi sp, sp, -16
				; RV64I-NEXT: .cfi_def_cfa_offset 16
				; RV64I-NEXT: sd ra, 8(sp)
				; RV64I-NEXT: sd s0, 0(sp)
				; RV64I-NEXT: .cfi_offset ra, -8
				; RV64I-NEXT: .cfi_offset s0, -16
				; RV64I-NEXT: addi a1, zero, 24
				; RV64I-NEXT: call __muldi3
				; RV64I-NEXT: mv s0, a0
				; RV64I-NEXT: addi a0, zero, 24
				; RV64I-NEXT: addi a1, zero, 24
				; RV64I-NEXT: call __muldi3
				; RV64I-NEXT: addw a0, s0, a0
				; RV64I-NEXT: ld s0, 0(sp)
				; RV64I-NEXT: ld ra, 8(sp)
				; RV64I-NEXT: addi sp, sp, 16
				; RV64I-NEXT: ret
				%const = bitcast i32 24 to i32
				%add = add i32 %in, %const
				%mul = mul i32 %add, 24
				ret i32 %mul
				}