Diff 276299

llvm/lib/Target/RISCV/RISCVISelLowering.h

Show First 20 Lines • Show All 179 Lines • ▼ Show 20 Lines	public:

bool shouldConvertConstantLoadToIntImm(const APInt &Imm,		bool shouldConvertConstantLoadToIntImm(const APInt &Imm,
Type *Ty) const override {		Type *Ty) const override {
return true;		return true;
}		}
bool mayBeEmittedAsTailCall(const CallInst *CI) const override;		bool mayBeEmittedAsTailCall(const CallInst *CI) const override;
bool shouldConsiderGEPOffsetSplit() const override { return true; }		bool shouldConsiderGEPOffsetSplit() const override { return true; }

		bool decomposeMulByConstant(LLVMContext &Context, EVT VT,
		SDValue C) const override;

TargetLowering::AtomicExpansionKind		TargetLowering::AtomicExpansionKind
shouldExpandAtomicRMWInIR(AtomicRMWInst *AI) const override;		shouldExpandAtomicRMWInIR(AtomicRMWInst *AI) const override;
Value emitMaskedAtomicRMWIntrinsic(IRBuilder<> &Builder, AtomicRMWInst AI,		Value emitMaskedAtomicRMWIntrinsic(IRBuilder<> &Builder, AtomicRMWInst AI,
Value AlignedAddr, Value Incr,		Value AlignedAddr, Value Incr,
Value Mask, Value ShiftAmt,		Value Mask, Value ShiftAmt,
AtomicOrdering Ord) const override;		AtomicOrdering Ord) const override;
TargetLowering::AtomicExpansionKind		TargetLowering::AtomicExpansionKind
shouldExpandAtomicCmpXchgInIR(AtomicCmpXchgInst *CI) const override;		shouldExpandAtomicCmpXchgInIR(AtomicCmpXchgInst *CI) const override;
▲ Show 20 Lines • Show All 46 Lines • Show Last 20 Lines

llvm/lib/Target/RISCV/RISCVISelLowering.cpp

Show All 27 Lines
#include "llvm/CodeGen/SelectionDAGISel.h"		#include "llvm/CodeGen/SelectionDAGISel.h"
#include "llvm/CodeGen/TargetLoweringObjectFileImpl.h"		#include "llvm/CodeGen/TargetLoweringObjectFileImpl.h"
#include "llvm/CodeGen/ValueTypes.h"		#include "llvm/CodeGen/ValueTypes.h"
#include "llvm/IR/DiagnosticInfo.h"		#include "llvm/IR/DiagnosticInfo.h"
#include "llvm/IR/DiagnosticPrinter.h"		#include "llvm/IR/DiagnosticPrinter.h"
#include "llvm/IR/IntrinsicsRISCV.h"		#include "llvm/IR/IntrinsicsRISCV.h"
#include "llvm/Support/Debug.h"		#include "llvm/Support/Debug.h"
#include "llvm/Support/ErrorHandling.h"		#include "llvm/Support/ErrorHandling.h"
		#include "llvm/Support/MathExtras.h"
#include "llvm/Support/raw_ostream.h"		#include "llvm/Support/raw_ostream.h"

using namespace llvm;		using namespace llvm;

#define DEBUG_TYPE "riscv-lower"		#define DEBUG_TYPE "riscv-lower"

STATISTIC(NumTailCalls, "Number of tail calls");		STATISTIC(NumTailCalls, "Number of tail calls");

▲ Show 20 Lines • Show All 2,929 Lines • ▼ Show 20 Lines	bool RISCVTargetLowering::shouldExtendTypeInLibCall(EVT Type) const {
// arguments or return value is f32 type for LP64 ABI.		// arguments or return value is f32 type for LP64 ABI.
RISCVABI::ABI ABI = Subtarget.getTargetABI();		RISCVABI::ABI ABI = Subtarget.getTargetABI();
if (ABI == RISCVABI::ABI_LP64 && (Type == MVT::f32))		if (ABI == RISCVABI::ABI_LP64 && (Type == MVT::f32))
return false;		return false;

return true;		return true;
}		}

		bool RISCVTargetLowering::decomposeMulByConstant(LLVMContext &Context, EVT VT,
		SDValue C) const {
		// Check integral scalar types.
		if (VT.isScalarInteger()) {
		// Do not perform the transformation on riscv32 with the M extension.
		if (!Subtarget.is64Bit() && Subtarget.hasStdExtM())
		return false;
		if (auto *ConstNode = dyn_cast<ConstantSDNode>(C.getNode())) {
		if (ConstNode->getAPIntValue().getBitWidth() > 8 * sizeof(int64_t))
		lenaryUnsubmitted Done Reply Inline Actions getSExtValue will assert if the value does not fit into 64 bits - you need to do a check before you get there. I think this hook can be called before legalisation, so you may not get only legal types in this call. lenary: getSExtValue will assert if the value does not fit into 64 bits - you need to do a check before…
		return false;
		int64_t Imm = ConstNode->getSExtValue();
		if (isPowerOf2_64(Imm + 1) \|\| isPowerOf2_64(Imm - 1) \|\|
		isPowerOf2_64(1 - Imm) \|\| isPowerOf2_64(-1 - Imm))
		return true;
		lenaryUnsubmitted Done Reply Inline Actions This TODO should not apply to RISC-V, yet. lenary: This TODO should not apply to RISC-V, yet.
		benshi001AuthorUnsubmitted Done Reply Inline Actions Thanks. I have rebased and fixed according to what you suggested. benshi001: Thanks. I have rebased and fixed according to what you suggested.
		}
		}

		return false;
		}

#define GET_REGISTER_MATCHER		#define GET_REGISTER_MATCHER
#include "RISCVGenAsmMatcher.inc"		#include "RISCVGenAsmMatcher.inc"

Register		Register
RISCVTargetLowering::getRegisterByName(const char *RegName, LLT VT,		RISCVTargetLowering::getRegisterByName(const char *RegName, LLT VT,
const MachineFunction &MF) const {		const MachineFunction &MF) const {
Register Reg = MatchRegisterAltName(RegName);		Register Reg = MatchRegisterAltName(RegName);
if (Reg == RISCV::NoRegister)		if (Reg == RISCV::NoRegister)
Show All 10 Lines

llvm/test/CodeGen/RISCV/mul.ll

Show First 20 Lines • Show All 73 Lines • ▼ Show 20 Lines
; RV64IM-NEXT: ret		; RV64IM-NEXT: ret
%1 = mul i32 %a, %b		%1 = mul i32 %a, %b
ret i32 %1		ret i32 %1
}		}

define signext i32 @mul_constant(i32 %a) nounwind {		define signext i32 @mul_constant(i32 %a) nounwind {
; RV32I-LABEL: mul_constant:		; RV32I-LABEL: mul_constant:
; RV32I: # %bb.0:		; RV32I: # %bb.0:
; RV32I-NEXT: addi sp, sp, -16		; RV32I-NEXT: slli a1, a0, 2
; RV32I-NEXT: sw ra, 12(sp)		; RV32I-NEXT: add a0, a1, a0
; RV32I-NEXT: addi a1, zero, 5
; RV32I-NEXT: call __mulsi3
; RV32I-NEXT: lw ra, 12(sp)
; RV32I-NEXT: addi sp, sp, 16
; RV32I-NEXT: ret		; RV32I-NEXT: ret
;		;
; RV32IM-LABEL: mul_constant:		; RV32IM-LABEL: mul_constant:
; RV32IM: # %bb.0:		; RV32IM: # %bb.0:
; RV32IM-NEXT: addi a1, zero, 5		; RV32IM-NEXT: addi a1, zero, 5
; RV32IM-NEXT: mul a0, a0, a1		; RV32IM-NEXT: mul a0, a0, a1
; RV32IM-NEXT: ret		; RV32IM-NEXT: ret
;		;
; RV64I-LABEL: mul_constant:		; RV64I-LABEL: mul_constant:
; RV64I: # %bb.0:		; RV64I: # %bb.0:
; RV64I-NEXT: addi sp, sp, -16		; RV64I-NEXT: slli a1, a0, 2
; RV64I-NEXT: sd ra, 8(sp)		; RV64I-NEXT: addw a0, a1, a0
; RV64I-NEXT: addi a1, zero, 5
; RV64I-NEXT: call __muldi3
; RV64I-NEXT: sext.w a0, a0
; RV64I-NEXT: ld ra, 8(sp)
; RV64I-NEXT: addi sp, sp, 16
; RV64I-NEXT: ret		; RV64I-NEXT: ret
;		;
; RV64IM-LABEL: mul_constant:		; RV64IM-LABEL: mul_constant:
; RV64IM: # %bb.0:		; RV64IM: # %bb.0:
; RV64IM-NEXT: addi a1, zero, 5		; RV64IM-NEXT: slli a1, a0, 2
; RV64IM-NEXT: mulw a0, a0, a1		; RV64IM-NEXT: addw a0, a1, a0
; RV64IM-NEXT: ret		; RV64IM-NEXT: ret
%1 = mul i32 %a, 5		%1 = mul i32 %a, 5
ret i32 %1		ret i32 %1
}		}

define i32 @mul_pow2(i32 %a) nounwind {		define i32 @mul_pow2(i32 %a) nounwind {
; RV32I-LABEL: mul_pow2:		; RV32I-LABEL: mul_pow2:
; RV32I: # %bb.0:		; RV32I: # %bb.0:
▲ Show 20 Lines • Show All 53 Lines • ▼ Show 20 Lines
; RV64IM-NEXT: ret		; RV64IM-NEXT: ret
%1 = mul i64 %a, %b		%1 = mul i64 %a, %b
ret i64 %1		ret i64 %1
}		}

define i64 @mul64_constant(i64 %a) nounwind {		define i64 @mul64_constant(i64 %a) nounwind {
; RV32I-LABEL: mul64_constant:		; RV32I-LABEL: mul64_constant:
; RV32I: # %bb.0:		; RV32I: # %bb.0:
; RV32I-NEXT: addi sp, sp, -16		; RV32I-NEXT: slli a3, a0, 2
; RV32I-NEXT: sw ra, 12(sp)		; RV32I-NEXT: add a2, a3, a0
; RV32I-NEXT: addi a2, zero, 5		; RV32I-NEXT: sltu a3, a2, a3
; RV32I-NEXT: mv a3, zero		; RV32I-NEXT: srli a0, a0, 30
; RV32I-NEXT: call __muldi3		; RV32I-NEXT: slli a4, a1, 2
; RV32I-NEXT: lw ra, 12(sp)		; RV32I-NEXT: or a0, a4, a0
; RV32I-NEXT: addi sp, sp, 16		; RV32I-NEXT: add a0, a0, a1
		; RV32I-NEXT: add a1, a0, a3
		; RV32I-NEXT: mv a0, a2
; RV32I-NEXT: ret		; RV32I-NEXT: ret
;		;
; RV32IM-LABEL: mul64_constant:		; RV32IM-LABEL: mul64_constant:
; RV32IM: # %bb.0:		; RV32IM: # %bb.0:
; RV32IM-NEXT: addi a2, zero, 5		; RV32IM-NEXT: addi a2, zero, 5
; RV32IM-NEXT: mul a1, a1, a2		; RV32IM-NEXT: mul a1, a1, a2
; RV32IM-NEXT: mulhu a3, a0, a2		; RV32IM-NEXT: mulhu a3, a0, a2
; RV32IM-NEXT: add a1, a3, a1		; RV32IM-NEXT: add a1, a3, a1
; RV32IM-NEXT: mul a0, a0, a2		; RV32IM-NEXT: mul a0, a0, a2
; RV32IM-NEXT: ret		; RV32IM-NEXT: ret
;		;
; RV64I-LABEL: mul64_constant:		; RV64I-LABEL: mul64_constant:
; RV64I: # %bb.0:		; RV64I: # %bb.0:
; RV64I-NEXT: addi sp, sp, -16		; RV64I-NEXT: slli a1, a0, 2
; RV64I-NEXT: sd ra, 8(sp)		; RV64I-NEXT: add a0, a1, a0
; RV64I-NEXT: addi a1, zero, 5
; RV64I-NEXT: call __muldi3
; RV64I-NEXT: ld ra, 8(sp)
; RV64I-NEXT: addi sp, sp, 16
; RV64I-NEXT: ret		; RV64I-NEXT: ret
;		;
; RV64IM-LABEL: mul64_constant:		; RV64IM-LABEL: mul64_constant:
; RV64IM: # %bb.0:		; RV64IM: # %bb.0:
; RV64IM-NEXT: addi a1, zero, 5		; RV64IM-NEXT: slli a1, a0, 2
; RV64IM-NEXT: mul a0, a0, a1		; RV64IM-NEXT: add a0, a1, a0
; RV64IM-NEXT: ret		; RV64IM-NEXT: ret
%1 = mul i64 %a, 5		%1 = mul i64 %a, 5
ret i64 %1		ret i64 %1
}		}

define i32 @mulhs(i32 %a, i32 %b) nounwind {		define i32 @mulhs(i32 %a, i32 %b) nounwind {
; RV32I-LABEL: mulhs:		; RV32I-LABEL: mulhs:
; RV32I: # %bb.0:		; RV32I: # %bb.0:
▲ Show 20 Lines • Show All 80 Lines • ▼ Show 20 Lines	; RV64IM-NEXT: ret
%4 = lshr i64 %3, 32		%4 = lshr i64 %3, 32
%5 = trunc i64 %4 to i32		%5 = trunc i64 %4 to i32
ret i32 %5		ret i32 %5
}		}

define i32 @muli32_p65(i32 %a) nounwind {		define i32 @muli32_p65(i32 %a) nounwind {
; RV32I-LABEL: muli32_p65:		; RV32I-LABEL: muli32_p65:
; RV32I: # %bb.0:		; RV32I: # %bb.0:
; RV32I-NEXT: addi sp, sp, -16		; RV32I-NEXT: slli a1, a0, 6
; RV32I-NEXT: sw ra, 12(sp)		; RV32I-NEXT: add a0, a1, a0
; RV32I-NEXT: addi a1, zero, 65
; RV32I-NEXT: call __mulsi3
; RV32I-NEXT: lw ra, 12(sp)
; RV32I-NEXT: addi sp, sp, 16
; RV32I-NEXT: ret		; RV32I-NEXT: ret
;		;
; RV32IM-LABEL: muli32_p65:		; RV32IM-LABEL: muli32_p65:
; RV32IM: # %bb.0:		; RV32IM: # %bb.0:
; RV32IM-NEXT: addi a1, zero, 65		; RV32IM-NEXT: addi a1, zero, 65
; RV32IM-NEXT: mul a0, a0, a1		; RV32IM-NEXT: mul a0, a0, a1
; RV32IM-NEXT: ret		; RV32IM-NEXT: ret
;		;
; RV64I-LABEL: muli32_p65:		; RV64I-LABEL: muli32_p65:
; RV64I: # %bb.0:		; RV64I: # %bb.0:
; RV64I-NEXT: addi sp, sp, -16		; RV64I-NEXT: slli a1, a0, 6
; RV64I-NEXT: sd ra, 8(sp)		; RV64I-NEXT: addw a0, a1, a0
; RV64I-NEXT: addi a1, zero, 65
; RV64I-NEXT: call __muldi3
; RV64I-NEXT: ld ra, 8(sp)
; RV64I-NEXT: addi sp, sp, 16
; RV64I-NEXT: ret		; RV64I-NEXT: ret
;		;
; RV64IM-LABEL: muli32_p65:		; RV64IM-LABEL: muli32_p65:
; RV64IM: # %bb.0:		; RV64IM: # %bb.0:
; RV64IM-NEXT: addi a1, zero, 65		; RV64IM-NEXT: slli a1, a0, 6
; RV64IM-NEXT: mul a0, a0, a1		; RV64IM-NEXT: addw a0, a1, a0
; RV64IM-NEXT: ret		; RV64IM-NEXT: ret
%1 = mul i32 %a, 65		%1 = mul i32 %a, 65
ret i32 %1		ret i32 %1
}		}

define i32 @muli32_p63(i32 %a) nounwind {		define i32 @muli32_p63(i32 %a) nounwind {
; RV32I-LABEL: muli32_p63:		; RV32I-LABEL: muli32_p63:
; RV32I: # %bb.0:		; RV32I: # %bb.0:
; RV32I-NEXT: addi sp, sp, -16		; RV32I-NEXT: slli a1, a0, 6
; RV32I-NEXT: sw ra, 12(sp)		; RV32I-NEXT: sub a0, a1, a0
; RV32I-NEXT: addi a1, zero, 63
; RV32I-NEXT: call __mulsi3
; RV32I-NEXT: lw ra, 12(sp)
; RV32I-NEXT: addi sp, sp, 16
; RV32I-NEXT: ret		; RV32I-NEXT: ret
;		;
; RV32IM-LABEL: muli32_p63:		; RV32IM-LABEL: muli32_p63:
; RV32IM: # %bb.0:		; RV32IM: # %bb.0:
; RV32IM-NEXT: addi a1, zero, 63		; RV32IM-NEXT: addi a1, zero, 63
; RV32IM-NEXT: mul a0, a0, a1		; RV32IM-NEXT: mul a0, a0, a1
; RV32IM-NEXT: ret		; RV32IM-NEXT: ret
;		;
; RV64I-LABEL: muli32_p63:		; RV64I-LABEL: muli32_p63:
; RV64I: # %bb.0:		; RV64I: # %bb.0:
; RV64I-NEXT: addi sp, sp, -16		; RV64I-NEXT: slli a1, a0, 6
; RV64I-NEXT: sd ra, 8(sp)		; RV64I-NEXT: subw a0, a1, a0
; RV64I-NEXT: addi a1, zero, 63
; RV64I-NEXT: call __muldi3
; RV64I-NEXT: ld ra, 8(sp)
; RV64I-NEXT: addi sp, sp, 16
; RV64I-NEXT: ret		; RV64I-NEXT: ret
;		;
; RV64IM-LABEL: muli32_p63:		; RV64IM-LABEL: muli32_p63:
; RV64IM: # %bb.0:		; RV64IM: # %bb.0:
; RV64IM-NEXT: addi a1, zero, 63		; RV64IM-NEXT: slli a1, a0, 6
; RV64IM-NEXT: mul a0, a0, a1		; RV64IM-NEXT: subw a0, a1, a0
; RV64IM-NEXT: ret		; RV64IM-NEXT: ret
%1 = mul i32 %a, 63		%1 = mul i32 %a, 63
ret i32 %1		ret i32 %1
}		}

define i64 @muli64_p65(i64 %a) nounwind {		define i64 @muli64_p65(i64 %a) nounwind {
; RV32I-LABEL: muli64_p65:		; RV32I-LABEL: muli64_p65:
; RV32I: # %bb.0:		; RV32I: # %bb.0:
; RV32I-NEXT: addi sp, sp, -16		; RV32I-NEXT: slli a3, a0, 6
; RV32I-NEXT: sw ra, 12(sp)		; RV32I-NEXT: add a2, a3, a0
; RV32I-NEXT: addi a2, zero, 65		; RV32I-NEXT: sltu a3, a2, a3
; RV32I-NEXT: mv a3, zero		; RV32I-NEXT: srli a0, a0, 26
; RV32I-NEXT: call __muldi3		; RV32I-NEXT: slli a4, a1, 6
; RV32I-NEXT: lw ra, 12(sp)		; RV32I-NEXT: or a0, a4, a0
; RV32I-NEXT: addi sp, sp, 16		; RV32I-NEXT: add a0, a0, a1
		; RV32I-NEXT: add a1, a0, a3
		; RV32I-NEXT: mv a0, a2
; RV32I-NEXT: ret		; RV32I-NEXT: ret
;		;
; RV32IM-LABEL: muli64_p65:		; RV32IM-LABEL: muli64_p65:
; RV32IM: # %bb.0:		; RV32IM: # %bb.0:
; RV32IM-NEXT: addi a2, zero, 65		; RV32IM-NEXT: addi a2, zero, 65
; RV32IM-NEXT: mul a1, a1, a2		; RV32IM-NEXT: mul a1, a1, a2
; RV32IM-NEXT: mulhu a3, a0, a2		; RV32IM-NEXT: mulhu a3, a0, a2
; RV32IM-NEXT: add a1, a3, a1		; RV32IM-NEXT: add a1, a3, a1
; RV32IM-NEXT: mul a0, a0, a2		; RV32IM-NEXT: mul a0, a0, a2
; RV32IM-NEXT: ret		; RV32IM-NEXT: ret
;		;
; RV64I-LABEL: muli64_p65:		; RV64I-LABEL: muli64_p65:
; RV64I: # %bb.0:		; RV64I: # %bb.0:
; RV64I-NEXT: addi sp, sp, -16		; RV64I-NEXT: slli a1, a0, 6
; RV64I-NEXT: sd ra, 8(sp)		; RV64I-NEXT: add a0, a1, a0
; RV64I-NEXT: addi a1, zero, 65
; RV64I-NEXT: call __muldi3
; RV64I-NEXT: ld ra, 8(sp)
; RV64I-NEXT: addi sp, sp, 16
; RV64I-NEXT: ret		; RV64I-NEXT: ret
;		;
; RV64IM-LABEL: muli64_p65:		; RV64IM-LABEL: muli64_p65:
; RV64IM: # %bb.0:		; RV64IM: # %bb.0:
; RV64IM-NEXT: addi a1, zero, 65		; RV64IM-NEXT: slli a1, a0, 6
; RV64IM-NEXT: mul a0, a0, a1		; RV64IM-NEXT: add a0, a1, a0
; RV64IM-NEXT: ret		; RV64IM-NEXT: ret
%1 = mul i64 %a, 65		%1 = mul i64 %a, 65
ret i64 %1		ret i64 %1
}		}

define i64 @muli64_p63(i64 %a) nounwind {		define i64 @muli64_p63(i64 %a) nounwind {
; RV32I-LABEL: muli64_p63:		; RV32I-LABEL: muli64_p63:
; RV32I: # %bb.0:		; RV32I: # %bb.0:
; RV32I-NEXT: addi sp, sp, -16		; RV32I-NEXT: slli a2, a0, 6
; RV32I-NEXT: sw ra, 12(sp)		; RV32I-NEXT: sltu a3, a2, a0
; RV32I-NEXT: addi a2, zero, 63		; RV32I-NEXT: srli a4, a0, 26
; RV32I-NEXT: mv a3, zero		; RV32I-NEXT: slli a5, a1, 6
; RV32I-NEXT: call __muldi3		; RV32I-NEXT: or a4, a5, a4
; RV32I-NEXT: lw ra, 12(sp)		; RV32I-NEXT: sub a1, a4, a1
; RV32I-NEXT: addi sp, sp, 16		; RV32I-NEXT: sub a1, a1, a3
		; RV32I-NEXT: sub a0, a2, a0
; RV32I-NEXT: ret		; RV32I-NEXT: ret
;		;
; RV32IM-LABEL: muli64_p63:		; RV32IM-LABEL: muli64_p63:
; RV32IM: # %bb.0:		; RV32IM: # %bb.0:
; RV32IM-NEXT: addi a2, zero, 63		; RV32IM-NEXT: addi a2, zero, 63
; RV32IM-NEXT: mul a1, a1, a2		; RV32IM-NEXT: mul a1, a1, a2
; RV32IM-NEXT: mulhu a3, a0, a2		; RV32IM-NEXT: mulhu a3, a0, a2
; RV32IM-NEXT: add a1, a3, a1		; RV32IM-NEXT: add a1, a3, a1
; RV32IM-NEXT: mul a0, a0, a2		; RV32IM-NEXT: mul a0, a0, a2
; RV32IM-NEXT: ret		; RV32IM-NEXT: ret
;		;
; RV64I-LABEL: muli64_p63:		; RV64I-LABEL: muli64_p63:
; RV64I: # %bb.0:		; RV64I: # %bb.0:
; RV64I-NEXT: addi sp, sp, -16		; RV64I-NEXT: slli a1, a0, 6
; RV64I-NEXT: sd ra, 8(sp)		; RV64I-NEXT: sub a0, a1, a0
; RV64I-NEXT: addi a1, zero, 63
; RV64I-NEXT: call __muldi3
; RV64I-NEXT: ld ra, 8(sp)
; RV64I-NEXT: addi sp, sp, 16
; RV64I-NEXT: ret		; RV64I-NEXT: ret
;		;
; RV64IM-LABEL: muli64_p63:		; RV64IM-LABEL: muli64_p63:
; RV64IM: # %bb.0:		; RV64IM: # %bb.0:
; RV64IM-NEXT: addi a1, zero, 63		; RV64IM-NEXT: slli a1, a0, 6
; RV64IM-NEXT: mul a0, a0, a1		; RV64IM-NEXT: sub a0, a1, a0
; RV64IM-NEXT: ret		; RV64IM-NEXT: ret
%1 = mul i64 %a, 63		%1 = mul i64 %a, 63
ret i64 %1		ret i64 %1
}		}

define i32 @muli32_m63(i32 %a) nounwind {		define i32 @muli32_m63(i32 %a) nounwind {
; RV32I-LABEL: muli32_m63:		; RV32I-LABEL: muli32_m63:
; RV32I: # %bb.0:		; RV32I: # %bb.0:
; RV32I-NEXT: addi sp, sp, -16		; RV32I-NEXT: slli a1, a0, 6
; RV32I-NEXT: sw ra, 12(sp)		; RV32I-NEXT: sub a0, a0, a1
; RV32I-NEXT: addi a1, zero, -63
; RV32I-NEXT: call __mulsi3
; RV32I-NEXT: lw ra, 12(sp)
; RV32I-NEXT: addi sp, sp, 16
; RV32I-NEXT: ret		; RV32I-NEXT: ret
;		;
; RV32IM-LABEL: muli32_m63:		; RV32IM-LABEL: muli32_m63:
; RV32IM: # %bb.0:		; RV32IM: # %bb.0:
; RV32IM-NEXT: addi a1, zero, -63		; RV32IM-NEXT: addi a1, zero, -63
; RV32IM-NEXT: mul a0, a0, a1		; RV32IM-NEXT: mul a0, a0, a1
; RV32IM-NEXT: ret		; RV32IM-NEXT: ret
;		;
; RV64I-LABEL: muli32_m63:		; RV64I-LABEL: muli32_m63:
; RV64I: # %bb.0:		; RV64I: # %bb.0:
; RV64I-NEXT: addi sp, sp, -16		; RV64I-NEXT: slli a1, a0, 6
; RV64I-NEXT: sd ra, 8(sp)		; RV64I-NEXT: subw a0, a0, a1
; RV64I-NEXT: addi a1, zero, -63
; RV64I-NEXT: call __muldi3
; RV64I-NEXT: ld ra, 8(sp)
; RV64I-NEXT: addi sp, sp, 16
; RV64I-NEXT: ret		; RV64I-NEXT: ret
;		;
; RV64IM-LABEL: muli32_m63:		; RV64IM-LABEL: muli32_m63:
; RV64IM: # %bb.0:		; RV64IM: # %bb.0:
; RV64IM-NEXT: addi a1, zero, -63		; RV64IM-NEXT: slli a1, a0, 6
; RV64IM-NEXT: mul a0, a0, a1		; RV64IM-NEXT: subw a0, a0, a1
; RV64IM-NEXT: ret		; RV64IM-NEXT: ret
%1 = mul i32 %a, -63		%1 = mul i32 %a, -63
ret i32 %1		ret i32 %1
}		}

define i32 @muli32_m65(i32 %a) nounwind {		define i32 @muli32_m65(i32 %a) nounwind {
; RV32I-LABEL: muli32_m65:		; RV32I-LABEL: muli32_m65:
; RV32I: # %bb.0:		; RV32I: # %bb.0:
; RV32I-NEXT: addi sp, sp, -16		; RV32I-NEXT: slli a1, a0, 6
; RV32I-NEXT: sw ra, 12(sp)		; RV32I-NEXT: add a0, a1, a0
; RV32I-NEXT: addi a1, zero, -65		; RV32I-NEXT: neg a0, a0
; RV32I-NEXT: call __mulsi3
; RV32I-NEXT: lw ra, 12(sp)
; RV32I-NEXT: addi sp, sp, 16
; RV32I-NEXT: ret		; RV32I-NEXT: ret
;		;
; RV32IM-LABEL: muli32_m65:		; RV32IM-LABEL: muli32_m65:
; RV32IM: # %bb.0:		; RV32IM: # %bb.0:
; RV32IM-NEXT: addi a1, zero, -65		; RV32IM-NEXT: addi a1, zero, -65
; RV32IM-NEXT: mul a0, a0, a1		; RV32IM-NEXT: mul a0, a0, a1
; RV32IM-NEXT: ret		; RV32IM-NEXT: ret
;		;
; RV64I-LABEL: muli32_m65:		; RV64I-LABEL: muli32_m65:
; RV64I: # %bb.0:		; RV64I: # %bb.0:
; RV64I-NEXT: addi sp, sp, -16		; RV64I-NEXT: slli a1, a0, 6
; RV64I-NEXT: sd ra, 8(sp)		; RV64I-NEXT: add a0, a1, a0
; RV64I-NEXT: addi a1, zero, -65		; RV64I-NEXT: negw a0, a0
; RV64I-NEXT: call __muldi3
; RV64I-NEXT: ld ra, 8(sp)
; RV64I-NEXT: addi sp, sp, 16
; RV64I-NEXT: ret		; RV64I-NEXT: ret
;		;
; RV64IM-LABEL: muli32_m65:		; RV64IM-LABEL: muli32_m65:
; RV64IM: # %bb.0:		; RV64IM: # %bb.0:
; RV64IM-NEXT: addi a1, zero, -65		; RV64IM-NEXT: slli a1, a0, 6
; RV64IM-NEXT: mul a0, a0, a1		; RV64IM-NEXT: add a0, a1, a0
		; RV64IM-NEXT: negw a0, a0
; RV64IM-NEXT: ret		; RV64IM-NEXT: ret
%1 = mul i32 %a, -65		%1 = mul i32 %a, -65
ret i32 %1		ret i32 %1
}		}

define i64 @muli64_m63(i64 %a) nounwind {		define i64 @muli64_m63(i64 %a) nounwind {
; RV32I-LABEL: muli64_m63:		; RV32I-LABEL: muli64_m63:
; RV32I: # %bb.0:		; RV32I: # %bb.0:
; RV32I-NEXT: addi sp, sp, -16		; RV32I-NEXT: slli a2, a0, 6
; RV32I-NEXT: sw ra, 12(sp)		; RV32I-NEXT: sltu a3, a0, a2
; RV32I-NEXT: addi a2, zero, -63		; RV32I-NEXT: srli a4, a0, 26
; RV32I-NEXT: addi a3, zero, -1		; RV32I-NEXT: slli a5, a1, 6
; RV32I-NEXT: call __muldi3		; RV32I-NEXT: or a4, a5, a4
; RV32I-NEXT: lw ra, 12(sp)		; RV32I-NEXT: sub a1, a1, a4
; RV32I-NEXT: addi sp, sp, 16		; RV32I-NEXT: sub a1, a1, a3
		; RV32I-NEXT: sub a0, a0, a2
; RV32I-NEXT: ret		; RV32I-NEXT: ret
;		;
; RV32IM-LABEL: muli64_m63:		; RV32IM-LABEL: muli64_m63:
; RV32IM: # %bb.0:		; RV32IM: # %bb.0:
; RV32IM-NEXT: addi a2, zero, -63		; RV32IM-NEXT: addi a2, zero, -63
; RV32IM-NEXT: mul a1, a1, a2		; RV32IM-NEXT: mul a1, a1, a2
; RV32IM-NEXT: mulhu a3, a0, a2		; RV32IM-NEXT: mulhu a3, a0, a2
; RV32IM-NEXT: sub a3, a3, a0		; RV32IM-NEXT: sub a3, a3, a0
; RV32IM-NEXT: add a1, a3, a1		; RV32IM-NEXT: add a1, a3, a1
; RV32IM-NEXT: mul a0, a0, a2		; RV32IM-NEXT: mul a0, a0, a2
; RV32IM-NEXT: ret		; RV32IM-NEXT: ret
;		;
; RV64I-LABEL: muli64_m63:		; RV64I-LABEL: muli64_m63:
; RV64I: # %bb.0:		; RV64I: # %bb.0:
; RV64I-NEXT: addi sp, sp, -16		; RV64I-NEXT: slli a1, a0, 6
; RV64I-NEXT: sd ra, 8(sp)		; RV64I-NEXT: sub a0, a0, a1
; RV64I-NEXT: addi a1, zero, -63
; RV64I-NEXT: call __muldi3
; RV64I-NEXT: ld ra, 8(sp)
; RV64I-NEXT: addi sp, sp, 16
; RV64I-NEXT: ret		; RV64I-NEXT: ret
;		;
; RV64IM-LABEL: muli64_m63:		; RV64IM-LABEL: muli64_m63:
; RV64IM: # %bb.0:		; RV64IM: # %bb.0:
; RV64IM-NEXT: addi a1, zero, -63		; RV64IM-NEXT: slli a1, a0, 6
; RV64IM-NEXT: mul a0, a0, a1		; RV64IM-NEXT: sub a0, a0, a1
; RV64IM-NEXT: ret		; RV64IM-NEXT: ret
%1 = mul i64 %a, -63		%1 = mul i64 %a, -63
ret i64 %1		ret i64 %1
}		}

define i64 @muli64_m65(i64 %a) nounwind {		define i64 @muli64_m65(i64 %a) nounwind {
; RV32I-LABEL: muli64_m65:		; RV32I-LABEL: muli64_m65:
; RV32I: # %bb.0:		; RV32I: # %bb.0:
; RV32I-NEXT: addi sp, sp, -16		; RV32I-NEXT: slli a2, a0, 6
; RV32I-NEXT: sw ra, 12(sp)		; RV32I-NEXT: add a3, a2, a0
; RV32I-NEXT: addi a2, zero, -65		; RV32I-NEXT: sltu a2, a3, a2
; RV32I-NEXT: addi a3, zero, -1		; RV32I-NEXT: srli a0, a0, 26
; RV32I-NEXT: call __muldi3		; RV32I-NEXT: slli a4, a1, 6
; RV32I-NEXT: lw ra, 12(sp)		; RV32I-NEXT: or a0, a4, a0
; RV32I-NEXT: addi sp, sp, 16		; RV32I-NEXT: add a0, a0, a1
		; RV32I-NEXT: add a0, a0, a2
		; RV32I-NEXT: snez a1, a3
		; RV32I-NEXT: add a0, a0, a1
		; RV32I-NEXT: neg a1, a0
		; RV32I-NEXT: neg a0, a3
; RV32I-NEXT: ret		; RV32I-NEXT: ret
;		;
; RV32IM-LABEL: muli64_m65:		; RV32IM-LABEL: muli64_m65:
; RV32IM: # %bb.0:		; RV32IM: # %bb.0:
; RV32IM-NEXT: addi a2, zero, -65		; RV32IM-NEXT: addi a2, zero, -65
; RV32IM-NEXT: mul a1, a1, a2		; RV32IM-NEXT: mul a1, a1, a2
; RV32IM-NEXT: mulhu a3, a0, a2		; RV32IM-NEXT: mulhu a3, a0, a2
; RV32IM-NEXT: sub a3, a3, a0		; RV32IM-NEXT: sub a3, a3, a0
; RV32IM-NEXT: add a1, a3, a1		; RV32IM-NEXT: add a1, a3, a1
; RV32IM-NEXT: mul a0, a0, a2		; RV32IM-NEXT: mul a0, a0, a2
; RV32IM-NEXT: ret		; RV32IM-NEXT: ret
		lenaryUnsubmitted Done Reply Inline Actions I think this is a pessimisation, though I realise that depends on how slow the 32-bit multiplier is compared to add/shift. lenary: I think this is a pessimisation, though I realise that depends on how slow the 32-bit…
;		;
; RV64I-LABEL: muli64_m65:		; RV64I-LABEL: muli64_m65:
; RV64I: # %bb.0:		; RV64I: # %bb.0:
; RV64I-NEXT: addi sp, sp, -16		; RV64I-NEXT: slli a1, a0, 6
; RV64I-NEXT: sd ra, 8(sp)		; RV64I-NEXT: add a0, a1, a0
; RV64I-NEXT: addi a1, zero, -65		; RV64I-NEXT: neg a0, a0
; RV64I-NEXT: call __muldi3
; RV64I-NEXT: ld ra, 8(sp)
; RV64I-NEXT: addi sp, sp, 16
; RV64I-NEXT: ret		; RV64I-NEXT: ret
;		;
; RV64IM-LABEL: muli64_m65:		; RV64IM-LABEL: muli64_m65:
; RV64IM: # %bb.0:		; RV64IM: # %bb.0:
; RV64IM-NEXT: addi a1, zero, -65		; RV64IM-NEXT: slli a1, a0, 6
; RV64IM-NEXT: mul a0, a0, a1		; RV64IM-NEXT: add a0, a1, a0
		; RV64IM-NEXT: neg a0, a0
; RV64IM-NEXT: ret		; RV64IM-NEXT: ret
%1 = mul i64 %a, -65		%1 = mul i64 %a, -65
ret i64 %1		ret i64 %1
}		}

This is an archive of the discontinued LLVM Phabricator instance.

[RISCV] Optimize multiplication by constant
ClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 276299

llvm/lib/Target/RISCV/RISCVISelLowering.h

llvm/lib/Target/RISCV/RISCVISelLowering.cpp

llvm/test/CodeGen/RISCV/mul.ll

This is an archive of the discontinued LLVM Phabricator instance.

[RISCV] Optimize multiplication by constantClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 276299

llvm/lib/Target/RISCV/RISCVISelLowering.h

llvm/lib/Target/RISCV/RISCVISelLowering.cpp

llvm/test/CodeGen/RISCV/mul.ll

[RISCV] Optimize multiplication by constant
ClosedPublic