Diff 391296

llvm/lib/Target/RISCV/RISCVISelDAGToDAG.cpp

Show First 20 Lines • Show All 121 Lines • ▼ Show 20 Lines	void RISCVDAGToDAGISel::PostprocessISelDAG() {
}		}

if (MadeChange)		if (MadeChange)
CurDAG->RemoveDeadNodes();		CurDAG->RemoveDeadNodes();
}		}

static SDNode selectImm(SelectionDAG CurDAG, const SDLoc &DL, int64_t Imm,		static SDNode selectImm(SelectionDAG CurDAG, const SDLoc &DL, int64_t Imm,
const RISCVSubtarget &Subtarget) {		const RISCVSubtarget &Subtarget) {
MVT XLenVT = Subtarget.getXLenVT();		MVT XLenVT = Subtarget.getXLenVT();
		craig.topperUnsubmitted Done Reply Inline Actions We should probably pass `int64_t Imm` here and call ConstantInt::get(EVT(VT).getTypeForEVT(CurDAG->getContext(), Imm)` to get the ConstantInt* that getConstantPool needs. That would solve the problems in my other comments. craig.topper: We should probably pass `int64_t Imm` here and call ConstantInt::get(EVT(VT).getTypeForEVT…
RISCVMatInt::InstSeq Seq =		RISCVMatInt::InstSeq Seq =
RISCVMatInt::generateInstSeq(Imm, Subtarget.getFeatureBits());		RISCVMatInt::generateInstSeq(Imm, Subtarget.getFeatureBits());

		// If it is expensive to split input integer, then we return nullptr so that
		// it can be promoted to constant pool.
		if (Seq.size() > Subtarget.getMaxBuildIntCost())
		return nullptr;
		craig.topperUnsubmitted Done Reply Inline Actions This should be `getTargetConstant(0, DL, VT)` craig.topper: This should be `getTargetConstant(0, DL, VT)`

SDNode *Result = nullptr;		SDNode *Result = nullptr;
SDValue SrcReg = CurDAG->getRegister(RISCV::X0, XLenVT);		SDValue SrcReg = CurDAG->getRegister(RISCV::X0, XLenVT);
for (RISCVMatInt::Inst &Inst : Seq) {		for (RISCVMatInt::Inst &Inst : Seq) {
SDValue SDImm = CurDAG->getTargetConstant(Inst.Imm, DL, XLenVT);		SDValue SDImm = CurDAG->getTargetConstant(Inst.Imm, DL, XLenVT);
if (Inst.Opc == RISCV::LUI)		if (Inst.Opc == RISCV::LUI)
Result = CurDAG->getMachineNode(RISCV::LUI, DL, XLenVT, SDImm);		Result = CurDAG->getMachineNode(RISCV::LUI, DL, XLenVT, SDImm);
else if (Inst.Opc == RISCV::ADDUW)		else if (Inst.Opc == RISCV::ADDUW)
Result = CurDAG->getMachineNode(RISCV::ADDUW, DL, XLenVT, SrcReg,		Result = CurDAG->getMachineNode(RISCV::ADDUW, DL, XLenVT, SrcReg,
CurDAG->getRegister(RISCV::X0, XLenVT));		CurDAG->getRegister(RISCV::X0, XLenVT));
else if (Inst.Opc == RISCV::SH1ADD \|\| Inst.Opc == RISCV::SH2ADD \|\|		else if (Inst.Opc == RISCV::SH1ADD \|\| Inst.Opc == RISCV::SH2ADD \|\|
Inst.Opc == RISCV::SH3ADD)		Inst.Opc == RISCV::SH3ADD)
Result = CurDAG->getMachineNode(Inst.Opc, DL, XLenVT, SrcReg, SrcReg);		Result = CurDAG->getMachineNode(Inst.Opc, DL, XLenVT, SrcReg, SrcReg);
else		else
Result = CurDAG->getMachineNode(Inst.Opc, DL, XLenVT, SrcReg, SDImm);		Result = CurDAG->getMachineNode(Inst.Opc, DL, XLenVT, SrcReg, SDImm);

// Only the first instruction has X0 as its source.		// Only the first instruction has X0 as its source.
SrcReg = SDValue(Result, 0);		SrcReg = SDValue(Result, 0);
}		}

return Result;		return Result;
}		}

		static SDNode selectGlobalImm(SelectionDAG CurDAG, const SDLoc &DL,
		craig.topperUnsubmitted Done Reply Inline Actions This makes it sound like the immediate is global which doesn't make sense. `selectImmWithConstantPool` or `selectImmUsingConstantPool` would be a better name, I think. craig.topper: This makes it sound like the immediate is global which doesn't make sense.
		const MVT &VT, ConstantSDNode *ConstNode,
		craig.topperUnsubmitted Done Reply Inline Actions MVT should always be passed by value. It's an 8-bit integer. craig.topper: MVT should always be passed by value. It's an 8-bit integer.
		const RISCVSubtarget &Subtarget) {
		const RISCVTargetLowering *TLI = Subtarget.getTargetLowering();
		SDValue CP = CurDAG->getConstantPool(ConstNode->getConstantIntValue(), VT);
		SDValue Addr = TLI->getAddr(cast<ConstantPoolSDNode>(CP), *CurDAG);
		SDValue Offset = CurDAG->getConstant(0, DL, VT);
		// Since there is no data race, the chain could be the entry node.
		craig.topperUnsubmitted Done Reply Inline Actions could -> can craig.topper: could -> can
		return CurDAG->getMachineNode(RISCV::LD, DL, VT, Addr, Offset,
		craig.topperUnsubmitted Done Reply Inline Actions LD assumes VT is MVT::i64. Should we assert that? craig.topper: LD assumes VT is MVT::i64. Should we assert that?
		craig.topperUnsubmitted Done Reply Inline Actions This needs a MemOperand to be added. craig.topper: This needs a MemOperand to be added.
		CurDAG->getEntryNode());
		}

static SDValue createTupleImpl(SelectionDAG &CurDAG, ArrayRef<SDValue> Regs,		static SDValue createTupleImpl(SelectionDAG &CurDAG, ArrayRef<SDValue> Regs,
unsigned RegClassID, unsigned SubReg0) {		unsigned RegClassID, unsigned SubReg0) {
assert(Regs.size() >= 2 && Regs.size() <= 8);		assert(Regs.size() >= 2 && Regs.size() <= 8);

SDLoc DL(Regs[0]);		SDLoc DL(Regs[0]);
SmallVector<SDValue, 8> Ops;		SmallVector<SDValue, 8> Ops;

Ops.push_back(CurDAG.getTargetConstant(RegClassID, DL, MVT::i32));		Ops.push_back(CurDAG.getTargetConstant(RegClassID, DL, MVT::i32));
▲ Show 20 Lines • Show All 329 Lines • ▼ Show 20 Lines	case ISD::Constant: {
if (isUInt<16>(Imm) && isInt<12>(SignExtend64(Imm, 16)) &&		if (isUInt<16>(Imm) && isInt<12>(SignExtend64(Imm, 16)) &&
hasAllHUsers(Node))		hasAllHUsers(Node))
Imm = SignExtend64(Imm, 16);		Imm = SignExtend64(Imm, 16);
// If the upper 32-bits are not used try to convert this into a simm32 by		// If the upper 32-bits are not used try to convert this into a simm32 by
// sign extending bit 32.		// sign extending bit 32.
if (!isInt<32>(Imm) && isUInt<32>(Imm) && hasAllWUsers(Node))		if (!isInt<32>(Imm) && isUInt<32>(Imm) && hasAllWUsers(Node))
Imm = SignExtend64(Imm, 32);		Imm = SignExtend64(Imm, 32);

ReplaceNode(Node, selectImm(CurDAG, DL, Imm, *Subtarget));		SDNode ImmNode = selectImm(CurDAG, DL, Imm, Subtarget);
		if (!ImmNode)
		ImmNode = selectGlobalImm(CurDAG, DL, VT, ConstNode, *Subtarget);
		craig.topperUnsubmitted Done Reply Inline Actions Can we call this from inside selectImm instead of returning nullptr? selectImm only has 1 caller right now, but it has add other callers in the past. craig.topper: Can we call this from inside selectImm instead of returning nullptr? selectImm only has 1…

		ReplaceNode(Node, ImmNode);
return;		return;
}		}
case ISD::FrameIndex: {		case ISD::FrameIndex: {
SDValue Imm = CurDAG->getTargetConstant(0, DL, XLenVT);		SDValue Imm = CurDAG->getTargetConstant(0, DL, XLenVT);
int FI = cast<FrameIndexSDNode>(Node)->getIndex();		int FI = cast<FrameIndexSDNode>(Node)->getIndex();
SDValue TFI = CurDAG->getTargetFrameIndex(FI, VT);		SDValue TFI = CurDAG->getTargetFrameIndex(FI, VT);
ReplaceNode(Node, CurDAG->getMachineNode(RISCV::ADDI, DL, VT, TFI, Imm));		ReplaceNode(Node, CurDAG->getMachineNode(RISCV::ADDI, DL, VT, TFI, Imm));
return;		return;
▲ Show 20 Lines • Show All 202 Lines • ▼ Show 20 Lines	if (LeftShift && isShiftedMask_64(C1)) {
CurDAG->getMachineNode(RISCV::SLLI, DL, XLenVT, SDValue(SRLIW, 0),		CurDAG->getMachineNode(RISCV::SLLI, DL, XLenVT, SDValue(SRLIW, 0),
CurDAG->getTargetConstant(C3, DL, XLenVT));		CurDAG->getTargetConstant(C3, DL, XLenVT));
ReplaceNode(Node, SLLI);		ReplaceNode(Node, SLLI);
return;		return;
}		}
}		}

break;		break;
}		}
case ISD::INTRINSIC_WO_CHAIN: {		case ISD::INTRINSIC_WO_CHAIN: {
		craig.topperUnsubmitted Done Reply Inline Actions N1C does not contain the same constant as ShiftedC1. craig.topper: N1C does not contain the same constant as ShiftedC1.
unsigned IntNo = Node->getConstantOperandVal(0);		unsigned IntNo = Node->getConstantOperandVal(0);
switch (IntNo) {		switch (IntNo) {
// By default we do not custom select any intrinsic.		// By default we do not custom select any intrinsic.
default:		default:
break;		break;
case Intrinsic::riscv_vmsgeu:		case Intrinsic::riscv_vmsgeu:
case Intrinsic::riscv_vmsge: {		case Intrinsic::riscv_vmsge: {
SDValue Src1 = Node->getOperand(1);		SDValue Src1 = Node->getOperand(1);
▲ Show 20 Lines • Show All 1,234 Lines • Show Last 20 Lines

llvm/lib/Target/RISCV/RISCVISelLowering.h

Show First 20 Lines • Show All 448 Lines • ▼ Show 20 Lines	bool CanLowerReturn(CallingConv::ID CallConv, MachineFunction &MF,
const SmallVectorImpl<ISD::OutputArg> &Outs,		const SmallVectorImpl<ISD::OutputArg> &Outs,
LLVMContext &Context) const override;		LLVMContext &Context) const override;
SDValue LowerReturn(SDValue Chain, CallingConv::ID CallConv, bool IsVarArg,		SDValue LowerReturn(SDValue Chain, CallingConv::ID CallConv, bool IsVarArg,
const SmallVectorImpl<ISD::OutputArg> &Outs,		const SmallVectorImpl<ISD::OutputArg> &Outs,
const SmallVectorImpl<SDValue> &OutVals, const SDLoc &DL,		const SmallVectorImpl<SDValue> &OutVals, const SDLoc &DL,
SelectionDAG &DAG) const override;		SelectionDAG &DAG) const override;
SDValue LowerCall(TargetLowering::CallLoweringInfo &CLI,		SDValue LowerCall(TargetLowering::CallLoweringInfo &CLI,
SmallVectorImpl<SDValue> &InVals) const override;		SmallVectorImpl<SDValue> &InVals) const override;
		template <class NodeTy>
		SDValue getAddr(NodeTy *N, SelectionDAG &DAG, bool IsLocal = true) const;

bool shouldConvertConstantLoadToIntImm(const APInt &Imm,		bool shouldConvertConstantLoadToIntImm(const APInt &Imm,
Type *Ty) const override {		Type *Ty) const override {
return true;		return true;
}		}
bool mayBeEmittedAsTailCall(const CallInst *CI) const override;		bool mayBeEmittedAsTailCall(const CallInst *CI) const override;
bool shouldConsiderGEPOffsetSplit() const override { return true; }		bool shouldConsiderGEPOffsetSplit() const override { return true; }

▲ Show 20 Lines • Show All 66 Lines • ▼ Show 20 Lines	private:
void analyzeInputArgs(MachineFunction &MF, CCState &CCInfo,		void analyzeInputArgs(MachineFunction &MF, CCState &CCInfo,
const SmallVectorImpl<ISD::InputArg> &Ins, bool IsRet,		const SmallVectorImpl<ISD::InputArg> &Ins, bool IsRet,
RISCVCCAssignFn Fn) const;		RISCVCCAssignFn Fn) const;
void analyzeOutputArgs(MachineFunction &MF, CCState &CCInfo,		void analyzeOutputArgs(MachineFunction &MF, CCState &CCInfo,
const SmallVectorImpl<ISD::OutputArg> &Outs,		const SmallVectorImpl<ISD::OutputArg> &Outs,
bool IsRet, CallLoweringInfo *CLI,		bool IsRet, CallLoweringInfo *CLI,
RISCVCCAssignFn Fn) const;		RISCVCCAssignFn Fn) const;

template <class NodeTy>
SDValue getAddr(NodeTy *N, SelectionDAG &DAG, bool IsLocal = true) const;

SDValue getStaticTLSAddr(GlobalAddressSDNode *N, SelectionDAG &DAG,		SDValue getStaticTLSAddr(GlobalAddressSDNode *N, SelectionDAG &DAG,
bool UseGOT) const;		bool UseGOT) const;
SDValue getDynamicTLSAddr(GlobalAddressSDNode *N, SelectionDAG &DAG) const;		SDValue getDynamicTLSAddr(GlobalAddressSDNode *N, SelectionDAG &DAG) const;

SDValue lowerGlobalAddress(SDValue Op, SelectionDAG &DAG) const;		SDValue lowerGlobalAddress(SDValue Op, SelectionDAG &DAG) const;
SDValue lowerBlockAddress(SDValue Op, SelectionDAG &DAG) const;		SDValue lowerBlockAddress(SDValue Op, SelectionDAG &DAG) const;
SDValue lowerConstantPool(SDValue Op, SelectionDAG &DAG) const;		SDValue lowerConstantPool(SDValue Op, SelectionDAG &DAG) const;
SDValue lowerJumpTable(SDValue Op, SelectionDAG &DAG) const;		SDValue lowerJumpTable(SDValue Op, SelectionDAG &DAG) const;
▲ Show 20 Lines • Show All 107 Lines • Show Last 20 Lines

llvm/lib/Target/RISCV/RISCVSubtarget.h

Show First 20 Lines • Show All 153 Lines • ▼ Show 20 Lines	protected:
std::unique_ptr<RegisterBankInfo> RegBankInfo;		std::unique_ptr<RegisterBankInfo> RegBankInfo;

public:		public:
const CallLowering *getCallLowering() const override;		const CallLowering *getCallLowering() const override;
InstructionSelector *getInstructionSelector() const override;		InstructionSelector *getInstructionSelector() const override;
const LegalizerInfo *getLegalizerInfo() const override;		const LegalizerInfo *getLegalizerInfo() const override;
const RegisterBankInfo *getRegBankInfo() const override;		const RegisterBankInfo *getRegBankInfo() const override;

		// Maximum instructions used for building integers, integers will
		// be promoted to constant pool if exceeded.
		unsigned getMaxBuildIntCost() const;

// Return the known range for the bit length of RVV data registers. A value		// Return the known range for the bit length of RVV data registers. A value
// of 0 means nothing is known about that particular limit beyond what's		// of 0 means nothing is known about that particular limit beyond what's
// implied by the architecture.		// implied by the architecture.
unsigned getMaxRVVVectorSizeInBits() const;		unsigned getMaxRVVVectorSizeInBits() const;
unsigned getMinRVVVectorSizeInBits() const;		unsigned getMinRVVVectorSizeInBits() const;
unsigned getMaxLMULForFixedLengthVectors() const;		unsigned getMaxLMULForFixedLengthVectors() const;
unsigned getMaxELENForFixedLengthVectors() const;		unsigned getMaxELENForFixedLengthVectors() const;
bool useRVVForFixedLengthVectors() const;		bool useRVVForFixedLengthVectors() const;
};		};
} // End llvm namespace		} // End llvm namespace

#endif		#endif

llvm/lib/Target/RISCV/RISCVSubtarget.cpp

Show First 20 Lines • Show All 44 Lines • ▼ Show 20 Lines	cl::desc("The maximum LMUL value to use for fixed length vectors. "
"Fractional LMUL values are not supported."),		"Fractional LMUL values are not supported."),
cl::init(8), cl::Hidden);		cl::init(8), cl::Hidden);

static cl::opt<unsigned> RVVVectorELENMax(		static cl::opt<unsigned> RVVVectorELENMax(
"riscv-v-fixed-length-vector-elen-max",		"riscv-v-fixed-length-vector-elen-max",
cl::desc("The maximum ELEN value to use for fixed length vectors."),		cl::desc("The maximum ELEN value to use for fixed length vectors."),
cl::init(64), cl::Hidden);		cl::init(64), cl::Hidden);

void RISCVSubtarget::anchor() {}		void RISCVSubtarget::anchor() {}
		craig.topperUnsubmitted Done Reply Inline Actions Make this a disable flag that defaults to 0. craig.topper: Make this a disable flag that defaults to 0.

RISCVSubtarget &		RISCVSubtarget &
RISCVSubtarget::initializeSubtargetDependencies(const Triple &TT, StringRef CPU,		RISCVSubtarget::initializeSubtargetDependencies(const Triple &TT, StringRef CPU,
StringRef TuneCPU, StringRef FS,		StringRef TuneCPU, StringRef FS,
StringRef ABIName) {		StringRef ABIName) {
// Determine default and user-specified characteristics		// Determine default and user-specified characteristics
bool Is64Bit = TT.isArch64Bit();		bool Is64Bit = TT.isArch64Bit();
if (CPU.empty())		if (CPU.empty())
▲ Show 20 Lines • Show All 43 Lines • ▼ Show 20 Lines
const LegalizerInfo *RISCVSubtarget::getLegalizerInfo() const {		const LegalizerInfo *RISCVSubtarget::getLegalizerInfo() const {
return Legalizer.get();		return Legalizer.get();
}		}

const RegisterBankInfo *RISCVSubtarget::getRegBankInfo() const {		const RegisterBankInfo *RISCVSubtarget::getRegBankInfo() const {
return RegBankInfo.get();		return RegBankInfo.get();
}		}

		unsigned RISCVSubtarget::getMaxBuildIntCost() const {
		zixuan-wuUnsubmitted Done Reply Inline Actions Since we can get schedmodel and load latency, is there still need that such API to adapt different subtarget cost? Other body can give some suggestion to talk. zixuan-wu: Since we can get schedmodel and load latency, is there still need that such API to adapt…
		craig.topperUnsubmitted Done Reply Inline Actions I'm not sure Promote is clear term in this context. Something like `useConstantPoolForLargeInts` might be better? craig.topper: I'm not sure Promote is clear term in this context. Something like…
		// LoadLatency + 1
		craig.topperUnsubmitted Done Reply Inline Actions LoadLatency is going to very for different CPUs so saying LoadLatency+1 and then having a hardcoded constant doesn't make sense. I'm not opposed to the hard coded constant, it matches what gcc uses. I just don't like the comment. craig.topper: LoadLatency is going to very for different CPUs so saying LoadLatency+1 and then having a…
		return 4;
		}

unsigned RISCVSubtarget::getMaxRVVVectorSizeInBits() const {		unsigned RISCVSubtarget::getMaxRVVVectorSizeInBits() const {
assert(hasVInstructions() &&		assert(hasVInstructions() &&
"Tried to get vector length without Zve or V extension support!");		"Tried to get vector length without Zve or V extension support!");
if (RVVVectorBitsMax == 0)		if (RVVVectorBitsMax == 0)
return 0;		return 0;
assert(RVVVectorBitsMax >= 128 && RVVVectorBitsMax <= 65536 &&		assert(RVVVectorBitsMax >= 128 && RVVVectorBitsMax <= 65536 &&
isPowerOf2_32(RVVVectorBitsMax) &&		isPowerOf2_32(RVVVectorBitsMax) &&
"V extension requires vector length to be in the range of 128 to "		"V extension requires vector length to be in the range of 128 to "
▲ Show 20 Lines • Show All 47 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/bswap-ctlz-cttz-ctpop.ll

	Show First 20 Lines • Show All 507 Lines • ▼ Show 20 Lines
	; RV64I: # %bb.0:			; RV64I: # %bb.0:
	; RV64I-NEXT: beqz a0, .LBB7_2			; RV64I-NEXT: beqz a0, .LBB7_2
	; RV64I-NEXT: # %bb.1: # %cond.false			; RV64I-NEXT: # %bb.1: # %cond.false
	; RV64I-NEXT: addi sp, sp, -16			; RV64I-NEXT: addi sp, sp, -16
	; RV64I-NEXT: sd ra, 8(sp) # 8-byte Folded Spill			; RV64I-NEXT: sd ra, 8(sp) # 8-byte Folded Spill
	; RV64I-NEXT: addi a1, a0, -1			; RV64I-NEXT: addi a1, a0, -1
	; RV64I-NEXT: not a0, a0			; RV64I-NEXT: not a0, a0
	; RV64I-NEXT: and a0, a0, a1			; RV64I-NEXT: and a0, a0, a1
	; RV64I-NEXT: srli a1, a0, 1			; RV64I-NEXT: lui a1, %hi(.LCPI7_0)
	; RV64I-NEXT: lui a2, 21845			; RV64I-NEXT: ld a1, %lo(.LCPI7_0)(a1)
	; RV64I-NEXT: addiw a2, a2, 1365			; RV64I-NEXT: lui a2, %hi(.LCPI7_1)
	; RV64I-NEXT: slli a2, a2, 12			; RV64I-NEXT: ld a2, %lo(.LCPI7_1)(a2)
	; RV64I-NEXT: addi a2, a2, 1365			; RV64I-NEXT: srli a3, a0, 1
	; RV64I-NEXT: slli a2, a2, 12			; RV64I-NEXT: and a1, a3, a1
	; RV64I-NEXT: addi a2, a2, 1365
	; RV64I-NEXT: slli a2, a2, 12
	; RV64I-NEXT: addi a2, a2, 1365
	; RV64I-NEXT: and a1, a1, a2
	; RV64I-NEXT: sub a0, a0, a1			; RV64I-NEXT: sub a0, a0, a1
	; RV64I-NEXT: lui a1, 13107			; RV64I-NEXT: and a1, a0, a2
	; RV64I-NEXT: addiw a1, a1, 819
	; RV64I-NEXT: slli a1, a1, 12
	; RV64I-NEXT: addi a1, a1, 819
	; RV64I-NEXT: slli a1, a1, 12
	; RV64I-NEXT: addi a1, a1, 819
	; RV64I-NEXT: slli a1, a1, 12
	; RV64I-NEXT: addi a1, a1, 819
	; RV64I-NEXT: and a2, a0, a1
	; RV64I-NEXT: srli a0, a0, 2			; RV64I-NEXT: srli a0, a0, 2
	; RV64I-NEXT: and a0, a0, a1			; RV64I-NEXT: and a0, a0, a2
	; RV64I-NEXT: add a0, a2, a0			; RV64I-NEXT: lui a2, %hi(.LCPI7_2)
				; RV64I-NEXT: ld a2, %lo(.LCPI7_2)(a2)
				; RV64I-NEXT: add a0, a1, a0
	; RV64I-NEXT: srli a1, a0, 4			; RV64I-NEXT: srli a1, a0, 4
	; RV64I-NEXT: add a0, a0, a1			; RV64I-NEXT: add a0, a0, a1
	; RV64I-NEXT: lui a1, 3855			; RV64I-NEXT: and a0, a0, a2
	; RV64I-NEXT: addiw a1, a1, 241			; RV64I-NEXT: lui a1, %hi(.LCPI7_3)
	; RV64I-NEXT: slli a1, a1, 12			; RV64I-NEXT: ld a1, %lo(.LCPI7_3)(a1)
	; RV64I-NEXT: addi a1, a1, -241
	; RV64I-NEXT: slli a1, a1, 12
	; RV64I-NEXT: addi a1, a1, 241
	; RV64I-NEXT: slli a1, a1, 12
	; RV64I-NEXT: addi a1, a1, -241
	; RV64I-NEXT: and a0, a0, a1
	; RV64I-NEXT: lui a1, 4112
	; RV64I-NEXT: addiw a1, a1, 257
	; RV64I-NEXT: slli a1, a1, 16
	; RV64I-NEXT: addi a1, a1, 257
	; RV64I-NEXT: slli a1, a1, 16
	; RV64I-NEXT: addi a1, a1, 257
	; RV64I-NEXT: call __muldi3@plt			; RV64I-NEXT: call __muldi3@plt
	; RV64I-NEXT: srli a0, a0, 56			; RV64I-NEXT: srli a0, a0, 56
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	; RV64I-NEXT: .LBB7_2:			; RV64I-NEXT: .LBB7_2:
	; RV64I-NEXT: li a0, 64			; RV64I-NEXT: li a0, 64
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	▲ Show 20 Lines • Show All 242 Lines • ▼ Show 20 Lines
	;			;
	; RV64I-LABEL: test_cttz_i64_zero_undef:			; RV64I-LABEL: test_cttz_i64_zero_undef:
	; RV64I: # %bb.0:			; RV64I: # %bb.0:
	; RV64I-NEXT: addi sp, sp, -16			; RV64I-NEXT: addi sp, sp, -16
	; RV64I-NEXT: sd ra, 8(sp) # 8-byte Folded Spill			; RV64I-NEXT: sd ra, 8(sp) # 8-byte Folded Spill
	; RV64I-NEXT: addi a1, a0, -1			; RV64I-NEXT: addi a1, a0, -1
	; RV64I-NEXT: not a0, a0			; RV64I-NEXT: not a0, a0
	; RV64I-NEXT: and a0, a0, a1			; RV64I-NEXT: and a0, a0, a1
	; RV64I-NEXT: srli a1, a0, 1			; RV64I-NEXT: lui a1, %hi(.LCPI11_0)
	; RV64I-NEXT: lui a2, 21845			; RV64I-NEXT: ld a1, %lo(.LCPI11_0)(a1)
	; RV64I-NEXT: addiw a2, a2, 1365			; RV64I-NEXT: lui a2, %hi(.LCPI11_1)
	; RV64I-NEXT: slli a2, a2, 12			; RV64I-NEXT: ld a2, %lo(.LCPI11_1)(a2)
	; RV64I-NEXT: addi a2, a2, 1365			; RV64I-NEXT: srli a3, a0, 1
	; RV64I-NEXT: slli a2, a2, 12			; RV64I-NEXT: and a1, a3, a1
	; RV64I-NEXT: addi a2, a2, 1365
	; RV64I-NEXT: slli a2, a2, 12
	; RV64I-NEXT: addi a2, a2, 1365
	; RV64I-NEXT: and a1, a1, a2
	; RV64I-NEXT: sub a0, a0, a1			; RV64I-NEXT: sub a0, a0, a1
	; RV64I-NEXT: lui a1, 13107			; RV64I-NEXT: and a1, a0, a2
	; RV64I-NEXT: addiw a1, a1, 819
	; RV64I-NEXT: slli a1, a1, 12
	; RV64I-NEXT: addi a1, a1, 819
	; RV64I-NEXT: slli a1, a1, 12
	; RV64I-NEXT: addi a1, a1, 819
	; RV64I-NEXT: slli a1, a1, 12
	; RV64I-NEXT: addi a1, a1, 819
	; RV64I-NEXT: and a2, a0, a1
	; RV64I-NEXT: srli a0, a0, 2			; RV64I-NEXT: srli a0, a0, 2
	; RV64I-NEXT: and a0, a0, a1			; RV64I-NEXT: and a0, a0, a2
	; RV64I-NEXT: add a0, a2, a0			; RV64I-NEXT: lui a2, %hi(.LCPI11_2)
				; RV64I-NEXT: ld a2, %lo(.LCPI11_2)(a2)
				; RV64I-NEXT: add a0, a1, a0
	; RV64I-NEXT: srli a1, a0, 4			; RV64I-NEXT: srli a1, a0, 4
	; RV64I-NEXT: add a0, a0, a1			; RV64I-NEXT: add a0, a0, a1
	; RV64I-NEXT: lui a1, 3855			; RV64I-NEXT: and a0, a0, a2
	; RV64I-NEXT: addiw a1, a1, 241			; RV64I-NEXT: lui a1, %hi(.LCPI11_3)
	; RV64I-NEXT: slli a1, a1, 12			; RV64I-NEXT: ld a1, %lo(.LCPI11_3)(a1)
	; RV64I-NEXT: addi a1, a1, -241
	; RV64I-NEXT: slli a1, a1, 12
	; RV64I-NEXT: addi a1, a1, 241
	; RV64I-NEXT: slli a1, a1, 12
	; RV64I-NEXT: addi a1, a1, -241
	; RV64I-NEXT: and a0, a0, a1
	; RV64I-NEXT: lui a1, 4112
	; RV64I-NEXT: addiw a1, a1, 257
	; RV64I-NEXT: slli a1, a1, 16
	; RV64I-NEXT: addi a1, a1, 257
	; RV64I-NEXT: slli a1, a1, 16
	; RV64I-NEXT: addi a1, a1, 257
	; RV64I-NEXT: call __muldi3@plt			; RV64I-NEXT: call __muldi3@plt
	; RV64I-NEXT: srli a0, a0, 56			; RV64I-NEXT: srli a0, a0, 56
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	%tmp = call i64 @llvm.cttz.i64(i64 %a, i1 true)			%tmp = call i64 @llvm.cttz.i64(i64 %a, i1 true)
	ret i64 %tmp			ret i64 %tmp
	}			}
	▲ Show 20 Lines • Show All 115 Lines • ▼ Show 20 Lines
	; RV32I-NEXT: lw s5, 4(sp) # 4-byte Folded Reload			; RV32I-NEXT: lw s5, 4(sp) # 4-byte Folded Reload
	; RV32I-NEXT: addi sp, sp, 32			; RV32I-NEXT: addi sp, sp, 32
	; RV32I-NEXT: ret			; RV32I-NEXT: ret
	;			;
	; RV64I-LABEL: test_ctpop_i64:			; RV64I-LABEL: test_ctpop_i64:
	; RV64I: # %bb.0:			; RV64I: # %bb.0:
	; RV64I-NEXT: addi sp, sp, -16			; RV64I-NEXT: addi sp, sp, -16
	; RV64I-NEXT: sd ra, 8(sp) # 8-byte Folded Spill			; RV64I-NEXT: sd ra, 8(sp) # 8-byte Folded Spill
	; RV64I-NEXT: srli a1, a0, 1			; RV64I-NEXT: lui a1, %hi(.LCPI13_0)
	; RV64I-NEXT: lui a2, 21845			; RV64I-NEXT: ld a1, %lo(.LCPI13_0)(a1)
	; RV64I-NEXT: addiw a2, a2, 1365			; RV64I-NEXT: lui a2, %hi(.LCPI13_1)
	; RV64I-NEXT: slli a2, a2, 12			; RV64I-NEXT: ld a2, %lo(.LCPI13_1)(a2)
	; RV64I-NEXT: addi a2, a2, 1365			; RV64I-NEXT: srli a3, a0, 1
	; RV64I-NEXT: slli a2, a2, 12			; RV64I-NEXT: and a1, a3, a1
	; RV64I-NEXT: addi a2, a2, 1365
	; RV64I-NEXT: slli a2, a2, 12
	; RV64I-NEXT: addi a2, a2, 1365
	; RV64I-NEXT: and a1, a1, a2
	; RV64I-NEXT: sub a0, a0, a1			; RV64I-NEXT: sub a0, a0, a1
	; RV64I-NEXT: lui a1, 13107			; RV64I-NEXT: and a1, a0, a2
	; RV64I-NEXT: addiw a1, a1, 819
	; RV64I-NEXT: slli a1, a1, 12
	; RV64I-NEXT: addi a1, a1, 819
	; RV64I-NEXT: slli a1, a1, 12
	; RV64I-NEXT: addi a1, a1, 819
	; RV64I-NEXT: slli a1, a1, 12
	; RV64I-NEXT: addi a1, a1, 819
	; RV64I-NEXT: and a2, a0, a1
	; RV64I-NEXT: srli a0, a0, 2			; RV64I-NEXT: srli a0, a0, 2
	; RV64I-NEXT: and a0, a0, a1			; RV64I-NEXT: and a0, a0, a2
	; RV64I-NEXT: add a0, a2, a0			; RV64I-NEXT: lui a2, %hi(.LCPI13_2)
				; RV64I-NEXT: ld a2, %lo(.LCPI13_2)(a2)
				; RV64I-NEXT: add a0, a1, a0
	; RV64I-NEXT: srli a1, a0, 4			; RV64I-NEXT: srli a1, a0, 4
	; RV64I-NEXT: add a0, a0, a1			; RV64I-NEXT: add a0, a0, a1
	; RV64I-NEXT: lui a1, 3855			; RV64I-NEXT: and a0, a0, a2
	; RV64I-NEXT: addiw a1, a1, 241			; RV64I-NEXT: lui a1, %hi(.LCPI13_3)
	; RV64I-NEXT: slli a1, a1, 12			; RV64I-NEXT: ld a1, %lo(.LCPI13_3)(a1)
	; RV64I-NEXT: addi a1, a1, -241
	; RV64I-NEXT: slli a1, a1, 12
	; RV64I-NEXT: addi a1, a1, 241
	; RV64I-NEXT: slli a1, a1, 12
	; RV64I-NEXT: addi a1, a1, -241
	; RV64I-NEXT: and a0, a0, a1
	; RV64I-NEXT: lui a1, 4112
	; RV64I-NEXT: addiw a1, a1, 257
	; RV64I-NEXT: slli a1, a1, 16
	; RV64I-NEXT: addi a1, a1, 257
	; RV64I-NEXT: slli a1, a1, 16
	; RV64I-NEXT: addi a1, a1, 257
	; RV64I-NEXT: call __muldi3@plt			; RV64I-NEXT: call __muldi3@plt
	; RV64I-NEXT: srli a0, a0, 56			; RV64I-NEXT: srli a0, a0, 56
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	%1 = call i64 @llvm.ctpop.i64(i64 %a)			%1 = call i64 @llvm.ctpop.i64(i64 %a)
	ret i64 %1			ret i64 %1
	}			}
	▲ Show 20 Lines • Show All 76 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/div.ll

	Show First 20 Lines • Show All 216 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: li a1, 5			; RV64I-NEXT: li a1, 5
	; RV64I-NEXT: call __udivdi3@plt			; RV64I-NEXT: call __udivdi3@plt
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IM-LABEL: udiv64_constant:			; RV64IM-LABEL: udiv64_constant:
	; RV64IM: # %bb.0:			; RV64IM: # %bb.0:
	; RV64IM-NEXT: lui a1, 1035469			; RV64IM-NEXT: lui a1, %hi(.LCPI5_0)
	; RV64IM-NEXT: addiw a1, a1, -819			; RV64IM-NEXT: ld a1, %lo(.LCPI5_0)(a1)
	; RV64IM-NEXT: slli a1, a1, 12
	; RV64IM-NEXT: addi a1, a1, -819
	; RV64IM-NEXT: slli a1, a1, 12
	; RV64IM-NEXT: addi a1, a1, -819
	; RV64IM-NEXT: slli a1, a1, 12
	; RV64IM-NEXT: addi a1, a1, -819
	; RV64IM-NEXT: mulhu a0, a0, a1			; RV64IM-NEXT: mulhu a0, a0, a1
	; RV64IM-NEXT: srli a0, a0, 2			; RV64IM-NEXT: srli a0, a0, 2
	; RV64IM-NEXT: ret			; RV64IM-NEXT: ret
	%1 = udiv i64 %a, 5			%1 = udiv i64 %a, 5
	ret i64 %1			ret i64 %1
	}			}

	define i64 @udiv64_constant_lhs(i64 %a) nounwind {			define i64 @udiv64_constant_lhs(i64 %a) nounwind {
	▲ Show 20 Lines • Show All 625 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: li a1, 5			; RV64I-NEXT: li a1, 5
	; RV64I-NEXT: call __divdi3@plt			; RV64I-NEXT: call __divdi3@plt
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IM-LABEL: sdiv64_constant:			; RV64IM-LABEL: sdiv64_constant:
	; RV64IM: # %bb.0:			; RV64IM: # %bb.0:
	; RV64IM-NEXT: lui a1, 13107			; RV64IM-NEXT: lui a1, %hi(.LCPI21_0)
	; RV64IM-NEXT: addiw a1, a1, 819			; RV64IM-NEXT: ld a1, %lo(.LCPI21_0)(a1)
	; RV64IM-NEXT: slli a1, a1, 12
	; RV64IM-NEXT: addi a1, a1, 819
	; RV64IM-NEXT: slli a1, a1, 12
	; RV64IM-NEXT: addi a1, a1, 819
	; RV64IM-NEXT: slli a1, a1, 13
	; RV64IM-NEXT: addi a1, a1, 1639
	; RV64IM-NEXT: mulh a0, a0, a1			; RV64IM-NEXT: mulh a0, a0, a1
	; RV64IM-NEXT: srli a1, a0, 63			; RV64IM-NEXT: srli a1, a0, 63
	; RV64IM-NEXT: srai a0, a0, 1			; RV64IM-NEXT: srai a0, a0, 1
	; RV64IM-NEXT: add a0, a0, a1			; RV64IM-NEXT: add a0, a0, a1
	; RV64IM-NEXT: ret			; RV64IM-NEXT: ret
	%1 = sdiv i64 %a, 5			%1 = sdiv i64 %a, 5
	ret i64 %1			ret i64 %1
	}			}
	▲ Show 20 Lines • Show All 482 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/double-imm.ll

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: llc -mtriple=riscv32 -mattr=+d -verify-machineinstrs < %s \			; RUN: llc -mtriple=riscv32 -mattr=+d -verify-machineinstrs < %s \
	; RUN: \| FileCheck -check-prefix=RV32IFD %s			; RUN: \| FileCheck -check-prefix=RV32IFD %s
	; RUN: llc -mtriple=riscv64 -mattr=+d -verify-machineinstrs < %s \			; RUN: llc -mtriple=riscv64 -mattr=+d -verify-machineinstrs < %s \
	; RUN: \| FileCheck -check-prefix=RV64IFD %s			; RUN: \| FileCheck -check-prefix=RV64IFD %s

	define double @double_imm() nounwind {			define double @double_imm() nounwind {
	; TODO: Should probably prefer fld or ld on RV64 rather than materialising an			; TODO: Should probably prefer fld or ld on RV64 rather than materialising an
				craig.topperUnsubmitted Done Reply Inline Actions Seems like this TODO is addressed by this patch? craig.topper: Seems like this TODO is addressed by this patch?
	; expensive constant.			; expensive constant.
	;			;
	; RV32IFD-LABEL: double_imm:			; RV32IFD-LABEL: double_imm:
	; RV32IFD: # %bb.0:			; RV32IFD: # %bb.0:
	; RV32IFD-NEXT: lui a0, 345155			; RV32IFD-NEXT: lui a0, 345155
	; RV32IFD-NEXT: addi a0, a0, -744			; RV32IFD-NEXT: addi a0, a0, -744
	; RV32IFD-NEXT: lui a1, 262290			; RV32IFD-NEXT: lui a1, 262290
	; RV32IFD-NEXT: addi a1, a1, 507			; RV32IFD-NEXT: addi a1, a1, 507
	; RV32IFD-NEXT: ret			; RV32IFD-NEXT: ret
	;			;
	; RV64IFD-LABEL: double_imm:			; RV64IFD-LABEL: double_imm:
	; RV64IFD: # %bb.0:			; RV64IFD: # %bb.0:
	; RV64IFD-NEXT: lui a0, 512			; RV64IFD-NEXT: lui a0, %hi(.LCPI0_0)
	; RV64IFD-NEXT: addiw a0, a0, 1169			; RV64IFD-NEXT: ld a0, %lo(.LCPI0_0)(a0)
	; RV64IFD-NEXT: slli a0, a0, 15
	; RV64IFD-NEXT: addi a0, a0, -299
	; RV64IFD-NEXT: slli a0, a0, 14
	; RV64IFD-NEXT: addi a0, a0, 1091
	; RV64IFD-NEXT: slli a0, a0, 12
	; RV64IFD-NEXT: addi a0, a0, -744
	; RV64IFD-NEXT: ret			; RV64IFD-NEXT: ret
	ret double 3.1415926535897931159979634685441851615905761718750			ret double 3.1415926535897931159979634685441851615905761718750
	}			}

	define double @double_imm_op(double %a) nounwind {			define double @double_imm_op(double %a) nounwind {
	; RV32IFD-LABEL: double_imm_op:			; RV32IFD-LABEL: double_imm_op:
	; RV32IFD: # %bb.0:			; RV32IFD: # %bb.0:
	; RV32IFD-NEXT: addi sp, sp, -16			; RV32IFD-NEXT: addi sp, sp, -16
	Show All 23 Lines

llvm/test/CodeGen/RISCV/imm.ll

	Show First 20 Lines • Show All 440 Lines • ▼ Show 20 Lines
	; RV32I: # %bb.0:			; RV32I: # %bb.0:
	; RV32I-NEXT: lui a0, 45056			; RV32I-NEXT: lui a0, 45056
	; RV32I-NEXT: addi a0, a0, 15			; RV32I-NEXT: addi a0, a0, 15
	; RV32I-NEXT: lui a1, 458752			; RV32I-NEXT: lui a1, 458752
	; RV32I-NEXT: ret			; RV32I-NEXT: ret
	;			;
	; RV64I-LABEL: imm64_7:			; RV64I-LABEL: imm64_7:
	; RV64I: # %bb.0:			; RV64I: # %bb.0:
	; RV64I-NEXT: li a0, 7			; RV64I-NEXT: lui a0, %hi(.LCPI16_0)
	; RV64I-NEXT: slli a0, a0, 36			; RV64I-NEXT: ld a0, %lo(.LCPI16_0)(a0)
	; RV64I-NEXT: addi a0, a0, 11
	; RV64I-NEXT: slli a0, a0, 24
	; RV64I-NEXT: addi a0, a0, 15
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IZBA-LABEL: imm64_7:			; RV64IZBA-LABEL: imm64_7:
	; RV64IZBA: # %bb.0:			; RV64IZBA: # %bb.0:
	; RV64IZBA-NEXT: li a0, 7			; RV64IZBA-NEXT: lui a0, %hi(.LCPI16_0)
	; RV64IZBA-NEXT: slli a0, a0, 36			; RV64IZBA-NEXT: ld a0, %lo(.LCPI16_0)(a0)
	; RV64IZBA-NEXT: addi a0, a0, 11
	; RV64IZBA-NEXT: slli a0, a0, 24
	; RV64IZBA-NEXT: addi a0, a0, 15
	; RV64IZBA-NEXT: ret			; RV64IZBA-NEXT: ret
	;			;
	; RV64IZBS-LABEL: imm64_7:			; RV64IZBS-LABEL: imm64_7:
	; RV64IZBS: # %bb.0:			; RV64IZBS: # %bb.0:
	; RV64IZBS-NEXT: li a0, 7			; RV64IZBS-NEXT: lui a0, %hi(.LCPI16_0)
	; RV64IZBS-NEXT: slli a0, a0, 36			; RV64IZBS-NEXT: ld a0, %lo(.LCPI16_0)(a0)
	; RV64IZBS-NEXT: addi a0, a0, 11
	; RV64IZBS-NEXT: slli a0, a0, 24
	; RV64IZBS-NEXT: addi a0, a0, 15
	; RV64IZBS-NEXT: ret			; RV64IZBS-NEXT: ret
	ret i64 8070450532432478223 ; 0x7000_0000_0B00_000F			ret i64 8070450532432478223 ; 0x7000_0000_0B00_000F
	}			}

	; TODO: it can be preferable to put constants that are expensive to materialise			; TODO: it can be preferable to put constants that are expensive to materialise
	; into the constant pool, especially for -Os.			; into the constant pool, especially for -Os.
	define i64 @imm64_8() nounwind {			define i64 @imm64_8() nounwind {
	; RV32I-LABEL: imm64_8:			; RV32I-LABEL: imm64_8:
	; RV32I: # %bb.0:			; RV32I: # %bb.0:
	; RV32I-NEXT: lui a0, 633806			; RV32I-NEXT: lui a0, 633806
	; RV32I-NEXT: addi a0, a0, -272			; RV32I-NEXT: addi a0, a0, -272
	; RV32I-NEXT: lui a1, 74565			; RV32I-NEXT: lui a1, 74565
	; RV32I-NEXT: addi a1, a1, 1656			; RV32I-NEXT: addi a1, a1, 1656
	; RV32I-NEXT: ret			; RV32I-NEXT: ret
	;			;
	; RV64I-LABEL: imm64_8:			; RV64I-LABEL: imm64_8:
	; RV64I: # %bb.0:			; RV64I: # %bb.0:
	; RV64I-NEXT: lui a0, 583			; RV64I-NEXT: lui a0, %hi(.LCPI17_0)
	; RV64I-NEXT: addiw a0, a0, -1875			; RV64I-NEXT: ld a0, %lo(.LCPI17_0)(a0)
	; RV64I-NEXT: slli a0, a0, 14
	; RV64I-NEXT: addi a0, a0, -947
	; RV64I-NEXT: slli a0, a0, 12
	; RV64I-NEXT: addi a0, a0, 1511
	; RV64I-NEXT: slli a0, a0, 13
	; RV64I-NEXT: addi a0, a0, -272
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IZBA-LABEL: imm64_8:			; RV64IZBA-LABEL: imm64_8:
	; RV64IZBA: # %bb.0:			; RV64IZBA: # %bb.0:
	; RV64IZBA-NEXT: lui a0, 583			; RV64IZBA-NEXT: lui a0, %hi(.LCPI17_0)
	; RV64IZBA-NEXT: addiw a0, a0, -1875			; RV64IZBA-NEXT: ld a0, %lo(.LCPI17_0)(a0)
	; RV64IZBA-NEXT: slli a0, a0, 14
	; RV64IZBA-NEXT: addi a0, a0, -947
	; RV64IZBA-NEXT: slli a0, a0, 12
	; RV64IZBA-NEXT: addi a0, a0, 1511
	; RV64IZBA-NEXT: slli a0, a0, 13
	; RV64IZBA-NEXT: addi a0, a0, -272
	; RV64IZBA-NEXT: ret			; RV64IZBA-NEXT: ret
	;			;
	; RV64IZBS-LABEL: imm64_8:			; RV64IZBS-LABEL: imm64_8:
	; RV64IZBS: # %bb.0:			; RV64IZBS: # %bb.0:
	; RV64IZBS-NEXT: lui a0, 583			; RV64IZBS-NEXT: lui a0, %hi(.LCPI17_0)
	; RV64IZBS-NEXT: addiw a0, a0, -1875			; RV64IZBS-NEXT: ld a0, %lo(.LCPI17_0)(a0)
	; RV64IZBS-NEXT: slli a0, a0, 14
	; RV64IZBS-NEXT: addi a0, a0, -947
	; RV64IZBS-NEXT: slli a0, a0, 12
	; RV64IZBS-NEXT: addi a0, a0, 1511
	; RV64IZBS-NEXT: slli a0, a0, 13
	; RV64IZBS-NEXT: addi a0, a0, -272
	; RV64IZBS-NEXT: ret			; RV64IZBS-NEXT: ret
	ret i64 1311768467463790320 ; 0x1234_5678_9ABC_DEF0			ret i64 1311768467463790320 ; 0x1234_5678_9ABC_DEF0
	}			}

	define i64 @imm64_9() nounwind {			define i64 @imm64_9() nounwind {
	; RV32I-LABEL: imm64_9:			; RV32I-LABEL: imm64_9:
	; RV32I: # %bb.0:			; RV32I: # %bb.0:
	; RV32I-NEXT: li a0, -1			; RV32I-NEXT: li a0, -1
	▲ Show 20 Lines • Show All 205 Lines • ▼ Show 20 Lines
	; RV32I: # %bb.0:			; RV32I: # %bb.0:
	; RV32I-NEXT: lui a0, 8192			; RV32I-NEXT: lui a0, 8192
	; RV32I-NEXT: addi a0, a0, -1			; RV32I-NEXT: addi a0, a0, -1
	; RV32I-NEXT: lui a1, 917504			; RV32I-NEXT: lui a1, 917504
	; RV32I-NEXT: ret			; RV32I-NEXT: ret
	;			;
	; RV64I-LABEL: imm_end_xori_1:			; RV64I-LABEL: imm_end_xori_1:
	; RV64I: # %bb.0:			; RV64I: # %bb.0:
	; RV64I-NEXT: li a0, -1			; RV64I-NEXT: lui a0, %hi(.LCPI25_0)
	; RV64I-NEXT: slli a0, a0, 36			; RV64I-NEXT: ld a0, %lo(.LCPI25_0)(a0)
	; RV64I-NEXT: addi a0, a0, 1
	; RV64I-NEXT: slli a0, a0, 25
	; RV64I-NEXT: addi a0, a0, -1
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IZBA-LABEL: imm_end_xori_1:			; RV64IZBA-LABEL: imm_end_xori_1:
	; RV64IZBA: # %bb.0:			; RV64IZBA: # %bb.0:
	; RV64IZBA-NEXT: li a0, -1			; RV64IZBA-NEXT: lui a0, %hi(.LCPI25_0)
	; RV64IZBA-NEXT: slli a0, a0, 36			; RV64IZBA-NEXT: ld a0, %lo(.LCPI25_0)(a0)
	; RV64IZBA-NEXT: addi a0, a0, 1
	; RV64IZBA-NEXT: slli a0, a0, 25
	; RV64IZBA-NEXT: addi a0, a0, -1
	; RV64IZBA-NEXT: ret			; RV64IZBA-NEXT: ret
	;			;
	; RV64IZBS-LABEL: imm_end_xori_1:			; RV64IZBS-LABEL: imm_end_xori_1:
	; RV64IZBS: # %bb.0:			; RV64IZBS: # %bb.0:
	; RV64IZBS-NEXT: li a0, -1			; RV64IZBS-NEXT: lui a0, %hi(.LCPI25_0)
	; RV64IZBS-NEXT: slli a0, a0, 36			; RV64IZBS-NEXT: ld a0, %lo(.LCPI25_0)(a0)
	; RV64IZBS-NEXT: addi a0, a0, 1
	; RV64IZBS-NEXT: slli a0, a0, 25
	; RV64IZBS-NEXT: addi a0, a0, -1
	; RV64IZBS-NEXT: ret			; RV64IZBS-NEXT: ret
	ret i64 -2305843009180139521 ; 0xE000_0000_01FF_FFFF			ret i64 -2305843009180139521 ; 0xE000_0000_01FF_FFFF
	}			}

	; This constant can be materialized for RV64 with ADDI+SLLI+ADDI+ADDI.			; This constant can be materialized for RV64 with ADDI+SLLI+ADDI+ADDI.

	define i64 @imm_end_2addi_1() nounwind {			define i64 @imm_end_2addi_1() nounwind {
	; RV32I-LABEL: imm_end_2addi_1:			; RV32I-LABEL: imm_end_2addi_1:
	; RV32I: # %bb.0:			; RV32I: # %bb.0:
	; RV32I-NEXT: lui a0, 1048575			; RV32I-NEXT: lui a0, 1048575
	; RV32I-NEXT: addi a0, a0, 2047			; RV32I-NEXT: addi a0, a0, 2047
	; RV32I-NEXT: lui a1, 1048512			; RV32I-NEXT: lui a1, 1048512
	; RV32I-NEXT: addi a1, a1, 127			; RV32I-NEXT: addi a1, a1, 127
	; RV32I-NEXT: ret			; RV32I-NEXT: ret
	;			;
	; RV64I-LABEL: imm_end_2addi_1:			; RV64I-LABEL: imm_end_2addi_1:
	; RV64I: # %bb.0:			; RV64I: # %bb.0:
	; RV64I-NEXT: li a0, -2047			; RV64I-NEXT: lui a0, %hi(.LCPI26_0)
	; RV64I-NEXT: slli a0, a0, 27			; RV64I-NEXT: ld a0, %lo(.LCPI26_0)(a0)
	; RV64I-NEXT: addi a0, a0, -1
	; RV64I-NEXT: slli a0, a0, 12
	; RV64I-NEXT: addi a0, a0, 2047
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IZBA-LABEL: imm_end_2addi_1:			; RV64IZBA-LABEL: imm_end_2addi_1:
	; RV64IZBA: # %bb.0:			; RV64IZBA: # %bb.0:
	; RV64IZBA-NEXT: li a0, -2047			; RV64IZBA-NEXT: lui a0, %hi(.LCPI26_0)
	; RV64IZBA-NEXT: slli a0, a0, 27			; RV64IZBA-NEXT: ld a0, %lo(.LCPI26_0)(a0)
	; RV64IZBA-NEXT: addi a0, a0, -1
	; RV64IZBA-NEXT: slli a0, a0, 12
	; RV64IZBA-NEXT: addi a0, a0, 2047
	; RV64IZBA-NEXT: ret			; RV64IZBA-NEXT: ret
	;			;
	; RV64IZBS-LABEL: imm_end_2addi_1:			; RV64IZBS-LABEL: imm_end_2addi_1:
	; RV64IZBS: # %bb.0:			; RV64IZBS: # %bb.0:
	; RV64IZBS-NEXT: li a0, -2047			; RV64IZBS-NEXT: lui a0, %hi(.LCPI26_0)
	; RV64IZBS-NEXT: slli a0, a0, 27			; RV64IZBS-NEXT: ld a0, %lo(.LCPI26_0)(a0)
	; RV64IZBS-NEXT: addi a0, a0, -1
	; RV64IZBS-NEXT: slli a0, a0, 12
	; RV64IZBS-NEXT: addi a0, a0, 2047
	; RV64IZBS-NEXT: ret			; RV64IZBS-NEXT: ret
	ret i64 -1125350151030785 ; 0xFFFC_007F_FFFF_F7FF			ret i64 -1125350151030785 ; 0xFFFC_007F_FFFF_F7FF
	}			}

	; This constant can be more efficiently materialized for RV64 if we use two			; This constant can be more efficiently materialized for RV64 if we use two
	; registers instead of one.			; registers instead of one.

	define i64 @imm_2reg_1() nounwind {			define i64 @imm_2reg_1() nounwind {
	; RV32I-LABEL: imm_2reg_1:			; RV32I-LABEL: imm_2reg_1:
	; RV32I: # %bb.0:			; RV32I: # %bb.0:
	; RV32I-NEXT: lui a0, 74565			; RV32I-NEXT: lui a0, 74565
	; RV32I-NEXT: addi a0, a0, 1656			; RV32I-NEXT: addi a0, a0, 1656
	; RV32I-NEXT: lui a1, 983040			; RV32I-NEXT: lui a1, 983040
	; RV32I-NEXT: ret			; RV32I-NEXT: ret
	;			;
	; RV64I-LABEL: imm_2reg_1:			; RV64I-LABEL: imm_2reg_1:
	; RV64I: # %bb.0:			; RV64I: # %bb.0:
	; RV64I-NEXT: li a0, -1			; RV64I-NEXT: lui a0, %hi(.LCPI27_0)
	; RV64I-NEXT: slli a0, a0, 35			; RV64I-NEXT: ld a0, %lo(.LCPI27_0)(a0)
	; RV64I-NEXT: addi a0, a0, 9
	; RV64I-NEXT: slli a0, a0, 13
	; RV64I-NEXT: addi a0, a0, 837
	; RV64I-NEXT: slli a0, a0, 12
	; RV64I-NEXT: addi a0, a0, 1656
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IZBA-LABEL: imm_2reg_1:			; RV64IZBA-LABEL: imm_2reg_1:
	; RV64IZBA: # %bb.0:			; RV64IZBA: # %bb.0:
	; RV64IZBA-NEXT: li a0, -1			; RV64IZBA-NEXT: lui a0, %hi(.LCPI27_0)
	; RV64IZBA-NEXT: slli a0, a0, 35			; RV64IZBA-NEXT: ld a0, %lo(.LCPI27_0)(a0)
	; RV64IZBA-NEXT: addi a0, a0, 9
	; RV64IZBA-NEXT: slli a0, a0, 13
	; RV64IZBA-NEXT: addi a0, a0, 837
	; RV64IZBA-NEXT: slli a0, a0, 12
	; RV64IZBA-NEXT: addi a0, a0, 1656
	; RV64IZBA-NEXT: ret			; RV64IZBA-NEXT: ret
	;			;
	; RV64IZBS-LABEL: imm_2reg_1:			; RV64IZBS-LABEL: imm_2reg_1:
	; RV64IZBS: # %bb.0:			; RV64IZBS: # %bb.0:
	; RV64IZBS-NEXT: lui a0, 74565			; RV64IZBS-NEXT: lui a0, %hi(.LCPI27_0)
	; RV64IZBS-NEXT: addiw a0, a0, 1656			; RV64IZBS-NEXT: ld a0, %lo(.LCPI27_0)(a0)
	; RV64IZBS-NEXT: bseti a0, a0, 60
	; RV64IZBS-NEXT: bseti a0, a0, 61
	; RV64IZBS-NEXT: bseti a0, a0, 62
	; RV64IZBS-NEXT: bseti a0, a0, 63
	; RV64IZBS-NEXT: ret			; RV64IZBS-NEXT: ret
	ret i64 -1152921504301427080 ; 0xF000_0000_1234_5678			ret i64 -1152921504301427080 ; 0xF000_0000_1234_5678
	}			}

	; FIXME: This should use a single ADDI for the immediate.			; FIXME: This should use a single ADDI for the immediate.
	define void @imm_store_i16_neg1(i16* %p) nounwind {			define void @imm_store_i16_neg1(i16* %p) nounwind {
	; RV32I-LABEL: imm_store_i16_neg1:			; RV32I-LABEL: imm_store_i16_neg1:
	; RV32I: # %bb.0:			; RV32I: # %bb.0:
	▲ Show 20 Lines • Show All 281 Lines • ▼ Show 20 Lines
	; RV32I: # %bb.0:			; RV32I: # %bb.0:
	; RV32I-NEXT: lui a0, 506812			; RV32I-NEXT: lui a0, 506812
	; RV32I-NEXT: addi a0, a0, -1093			; RV32I-NEXT: addi a0, a0, -1093
	; RV32I-NEXT: lui a1, 4			; RV32I-NEXT: lui a1, 4
	; RV32I-NEXT: ret			; RV32I-NEXT: ret
	;			;
	; RV64I-LABEL: imm_70370820078523:			; RV64I-LABEL: imm_70370820078523:
	; RV64I: # %bb.0:			; RV64I: # %bb.0:
	; RV64I-NEXT: lui a0, 256			; RV64I-NEXT: lui a0, %hi(.LCPI37_0)
	; RV64I-NEXT: addiw a0, a0, 31			; RV64I-NEXT: ld a0, %lo(.LCPI37_0)(a0)
	; RV64I-NEXT: slli a0, a0, 12
	; RV64I-NEXT: addi a0, a0, -273
	; RV64I-NEXT: slli a0, a0, 14
	; RV64I-NEXT: addi a0, a0, -1093
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IZBA-LABEL: imm_70370820078523:			; RV64IZBA-LABEL: imm_70370820078523:
	; RV64IZBA: # %bb.0:			; RV64IZBA: # %bb.0:
	; RV64IZBA-NEXT: lui a0, 256			; RV64IZBA-NEXT: lui a0, %hi(.LCPI37_0)
	; RV64IZBA-NEXT: addiw a0, a0, 31			; RV64IZBA-NEXT: ld a0, %lo(.LCPI37_0)(a0)
	; RV64IZBA-NEXT: slli a0, a0, 12
	; RV64IZBA-NEXT: addi a0, a0, -273
	; RV64IZBA-NEXT: slli a0, a0, 14
	; RV64IZBA-NEXT: addi a0, a0, -1093
	; RV64IZBA-NEXT: ret			; RV64IZBA-NEXT: ret
	;			;
	; RV64IZBS-LABEL: imm_70370820078523:			; RV64IZBS-LABEL: imm_70370820078523:
	; RV64IZBS: # %bb.0:			; RV64IZBS: # %bb.0:
	; RV64IZBS-NEXT: lui a0, 506812			; RV64IZBS-NEXT: lui a0, 506812
	; RV64IZBS-NEXT: addiw a0, a0, -1093			; RV64IZBS-NEXT: addiw a0, a0, -1093
	; RV64IZBS-NEXT: bseti a0, a0, 46			; RV64IZBS-NEXT: bseti a0, a0, 46
	; RV64IZBS-NEXT: ret			; RV64IZBS-NEXT: ret
	ret i64 70370820078523 ; 0x40007bbbbbbb			ret i64 70370820078523 ; 0x40007bbbbbbb
	}			}

	define i64 @imm_neg_9223372034778874949() {			define i64 @imm_neg_9223372034778874949() {
	; RV32I-LABEL: imm_neg_9223372034778874949:			; RV32I-LABEL: imm_neg_9223372034778874949:
	; RV32I: # %bb.0:			; RV32I: # %bb.0:
	; RV32I-NEXT: lui a0, 506812			; RV32I-NEXT: lui a0, 506812
	; RV32I-NEXT: addi a0, a0, -1093			; RV32I-NEXT: addi a0, a0, -1093
	; RV32I-NEXT: lui a1, 524288			; RV32I-NEXT: lui a1, 524288
	; RV32I-NEXT: ret			; RV32I-NEXT: ret
	;			;
	; RV64I-LABEL: imm_neg_9223372034778874949:			; RV64I-LABEL: imm_neg_9223372034778874949:
	; RV64I: # %bb.0:			; RV64I: # %bb.0:
	; RV64I-NEXT: li a0, -1			; RV64I-NEXT: lui a0, %hi(.LCPI38_0)
	; RV64I-NEXT: slli a0, a0, 37			; RV64I-NEXT: ld a0, %lo(.LCPI38_0)(a0)
	; RV64I-NEXT: addi a0, a0, 31
	; RV64I-NEXT: slli a0, a0, 12
	; RV64I-NEXT: addi a0, a0, -273
	; RV64I-NEXT: slli a0, a0, 14
	; RV64I-NEXT: addi a0, a0, -1093
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IZBA-LABEL: imm_neg_9223372034778874949:			; RV64IZBA-LABEL: imm_neg_9223372034778874949:
	; RV64IZBA: # %bb.0:			; RV64IZBA: # %bb.0:
	; RV64IZBA-NEXT: li a0, -1			; RV64IZBA-NEXT: lui a0, %hi(.LCPI38_0)
	; RV64IZBA-NEXT: slli a0, a0, 37			; RV64IZBA-NEXT: ld a0, %lo(.LCPI38_0)(a0)
	; RV64IZBA-NEXT: addi a0, a0, 31
	; RV64IZBA-NEXT: slli a0, a0, 12
	; RV64IZBA-NEXT: addi a0, a0, -273
	; RV64IZBA-NEXT: slli a0, a0, 14
	; RV64IZBA-NEXT: addi a0, a0, -1093
	; RV64IZBA-NEXT: ret			; RV64IZBA-NEXT: ret
	;			;
	; RV64IZBS-LABEL: imm_neg_9223372034778874949:			; RV64IZBS-LABEL: imm_neg_9223372034778874949:
	; RV64IZBS: # %bb.0:			; RV64IZBS: # %bb.0:
	; RV64IZBS-NEXT: lui a0, 506812			; RV64IZBS-NEXT: lui a0, 506812
	; RV64IZBS-NEXT: addiw a0, a0, -1093			; RV64IZBS-NEXT: addiw a0, a0, -1093
	; RV64IZBS-NEXT: bseti a0, a0, 63			; RV64IZBS-NEXT: bseti a0, a0, 63
	; RV64IZBS-NEXT: ret			; RV64IZBS-NEXT: ret
	ret i64 -9223372034778874949 ; 0x800000007bbbbbbb			ret i64 -9223372034778874949 ; 0x800000007bbbbbbb
	}			}

	define i64 @imm_neg_9223301666034697285() {			define i64 @imm_neg_9223301666034697285() {
	; RV32I-LABEL: imm_neg_9223301666034697285:			; RV32I-LABEL: imm_neg_9223301666034697285:
	; RV32I: # %bb.0:			; RV32I: # %bb.0:
	; RV32I-NEXT: lui a0, 506812			; RV32I-NEXT: lui a0, 506812
	; RV32I-NEXT: addi a0, a0, -1093			; RV32I-NEXT: addi a0, a0, -1093
	; RV32I-NEXT: lui a1, 524292			; RV32I-NEXT: lui a1, 524292
	; RV32I-NEXT: ret			; RV32I-NEXT: ret
	;			;
	; RV64I-LABEL: imm_neg_9223301666034697285:			; RV64I-LABEL: imm_neg_9223301666034697285:
	; RV64I: # %bb.0:			; RV64I: # %bb.0:
	; RV64I-NEXT: lui a0, 917505			; RV64I-NEXT: lui a0, %hi(.LCPI39_0)
	; RV64I-NEXT: slli a0, a0, 8			; RV64I-NEXT: ld a0, %lo(.LCPI39_0)(a0)
	; RV64I-NEXT: addi a0, a0, 31
	; RV64I-NEXT: slli a0, a0, 12
	; RV64I-NEXT: addi a0, a0, -273
	; RV64I-NEXT: slli a0, a0, 14
	; RV64I-NEXT: addi a0, a0, -1093
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IZBA-LABEL: imm_neg_9223301666034697285:			; RV64IZBA-LABEL: imm_neg_9223301666034697285:
	; RV64IZBA: # %bb.0:			; RV64IZBA: # %bb.0:
	; RV64IZBA-NEXT: lui a0, 917505			; RV64IZBA-NEXT: lui a0, %hi(.LCPI39_0)
	; RV64IZBA-NEXT: slli a0, a0, 8			; RV64IZBA-NEXT: ld a0, %lo(.LCPI39_0)(a0)
	; RV64IZBA-NEXT: addi a0, a0, 31
	; RV64IZBA-NEXT: slli a0, a0, 12
	; RV64IZBA-NEXT: addi a0, a0, -273
	; RV64IZBA-NEXT: slli a0, a0, 14
	; RV64IZBA-NEXT: addi a0, a0, -1093
	; RV64IZBA-NEXT: ret			; RV64IZBA-NEXT: ret
	;			;
	; RV64IZBS-LABEL: imm_neg_9223301666034697285:			; RV64IZBS-LABEL: imm_neg_9223301666034697285:
	; RV64IZBS: # %bb.0:			; RV64IZBS: # %bb.0:
	; RV64IZBS-NEXT: lui a0, 506812			; RV64IZBS-NEXT: lui a0, 506812
	; RV64IZBS-NEXT: addiw a0, a0, -1093			; RV64IZBS-NEXT: addiw a0, a0, -1093
	; RV64IZBS-NEXT: bseti a0, a0, 46			; RV64IZBS-NEXT: bseti a0, a0, 46
	; RV64IZBS-NEXT: bseti a0, a0, 63			; RV64IZBS-NEXT: bseti a0, a0, 63
	▲ Show 20 Lines • Show All 72 Lines • ▼ Show 20 Lines
	; RV32I-NEXT: lui a0, 572348			; RV32I-NEXT: lui a0, 572348
	; RV32I-NEXT: addi a0, a0, -1093			; RV32I-NEXT: addi a0, a0, -1093
	; RV32I-NEXT: lui a1, 524288			; RV32I-NEXT: lui a1, 524288
	; RV32I-NEXT: addi a1, a1, -1			; RV32I-NEXT: addi a1, a1, -1
	; RV32I-NEXT: ret			; RV32I-NEXT: ret
	;			;
	; RV64I-LABEL: imm_9223372034904144827:			; RV64I-LABEL: imm_9223372034904144827:
	; RV64I: # %bb.0:			; RV64I: # %bb.0:
	; RV64I-NEXT: lui a0, 1048343			; RV64I-NEXT: lui a0, %hi(.LCPI42_0)
	; RV64I-NEXT: addiw a0, a0, 1911			; RV64I-NEXT: ld a0, %lo(.LCPI42_0)(a0)
	; RV64I-NEXT: slli a0, a0, 12
	; RV64I-NEXT: addi a0, a0, 1911
	; RV64I-NEXT: srli a0, a0, 1
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IZBA-LABEL: imm_9223372034904144827:			; RV64IZBA-LABEL: imm_9223372034904144827:
	; RV64IZBA: # %bb.0:			; RV64IZBA: # %bb.0:
	; RV64IZBA-NEXT: lui a0, 1048343			; RV64IZBA-NEXT: lui a0, %hi(.LCPI42_0)
	; RV64IZBA-NEXT: addiw a0, a0, 1911			; RV64IZBA-NEXT: ld a0, %lo(.LCPI42_0)(a0)
	; RV64IZBA-NEXT: slli a0, a0, 12
	; RV64IZBA-NEXT: addi a0, a0, 1911
	; RV64IZBA-NEXT: srli a0, a0, 1
	; RV64IZBA-NEXT: ret			; RV64IZBA-NEXT: ret
	;			;
	; RV64IZBS-LABEL: imm_9223372034904144827:			; RV64IZBS-LABEL: imm_9223372034904144827:
	; RV64IZBS: # %bb.0:			; RV64IZBS: # %bb.0:
	; RV64IZBS-NEXT: lui a0, 572348			; RV64IZBS-NEXT: lui a0, 572348
	; RV64IZBS-NEXT: addiw a0, a0, -1093			; RV64IZBS-NEXT: addiw a0, a0, -1093
	; RV64IZBS-NEXT: bclri a0, a0, 63			; RV64IZBS-NEXT: bclri a0, a0, 63
	; RV64IZBS-NEXT: ret			; RV64IZBS-NEXT: ret
	ret i64 9223372034904144827 ; 0x7fffffff8bbbbbbb			ret i64 9223372034904144827 ; 0x7fffffff8bbbbbbb
	}			}

	define i64 @imm_neg_9223354442718100411() {			define i64 @imm_neg_9223354442718100411() {
	; RV32I-LABEL: imm_neg_9223354442718100411:			; RV32I-LABEL: imm_neg_9223354442718100411:
	; RV32I: # %bb.0:			; RV32I: # %bb.0:
	; RV32I-NEXT: lui a0, 572348			; RV32I-NEXT: lui a0, 572348
	; RV32I-NEXT: addi a0, a0, -1093			; RV32I-NEXT: addi a0, a0, -1093
	; RV32I-NEXT: lui a1, 524287			; RV32I-NEXT: lui a1, 524287
	; RV32I-NEXT: addi a1, a1, -1			; RV32I-NEXT: addi a1, a1, -1
	; RV32I-NEXT: ret			; RV32I-NEXT: ret
	;			;
	; RV64I-LABEL: imm_neg_9223354442718100411:			; RV64I-LABEL: imm_neg_9223354442718100411:
	; RV64I: # %bb.0:			; RV64I: # %bb.0:
	; RV64I-NEXT: lui a0, 524287			; RV64I-NEXT: lui a0, %hi(.LCPI43_0)
	; RV64I-NEXT: slli a0, a0, 6			; RV64I-NEXT: ld a0, %lo(.LCPI43_0)(a0)
	; RV64I-NEXT: addi a0, a0, -29
	; RV64I-NEXT: slli a0, a0, 12
	; RV64I-NEXT: addi a0, a0, -273
	; RV64I-NEXT: slli a0, a0, 14
	; RV64I-NEXT: addi a0, a0, -1093
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IZBA-LABEL: imm_neg_9223354442718100411:			; RV64IZBA-LABEL: imm_neg_9223354442718100411:
	; RV64IZBA: # %bb.0:			; RV64IZBA: # %bb.0:
	; RV64IZBA-NEXT: lui a0, 524287			; RV64IZBA-NEXT: lui a0, %hi(.LCPI43_0)
	; RV64IZBA-NEXT: slli a0, a0, 6			; RV64IZBA-NEXT: ld a0, %lo(.LCPI43_0)(a0)
	; RV64IZBA-NEXT: addi a0, a0, -29
	; RV64IZBA-NEXT: slli a0, a0, 12
	; RV64IZBA-NEXT: addi a0, a0, -273
	; RV64IZBA-NEXT: slli a0, a0, 14
	; RV64IZBA-NEXT: addi a0, a0, -1093
	; RV64IZBA-NEXT: ret			; RV64IZBA-NEXT: ret
	;			;
	; RV64IZBS-LABEL: imm_neg_9223354442718100411:			; RV64IZBS-LABEL: imm_neg_9223354442718100411:
	; RV64IZBS: # %bb.0:			; RV64IZBS: # %bb.0:
	; RV64IZBS-NEXT: lui a0, 572348			; RV64IZBS-NEXT: lui a0, 572348
	; RV64IZBS-NEXT: addiw a0, a0, -1093			; RV64IZBS-NEXT: addiw a0, a0, -1093
	; RV64IZBS-NEXT: bclri a0, a0, 44			; RV64IZBS-NEXT: bclri a0, a0, 44
	; RV64IZBS-NEXT: bclri a0, a0, 63			; RV64IZBS-NEXT: bclri a0, a0, 63
	▲ Show 20 Lines • Show All 194 Lines • ▼ Show 20 Lines
	; RV32I-NEXT: lui a0, 768955			; RV32I-NEXT: lui a0, 768955
	; RV32I-NEXT: addi a0, a0, 1911			; RV32I-NEXT: addi a0, a0, 1911
	; RV32I-NEXT: lui a1, 1			; RV32I-NEXT: lui a1, 1
	; RV32I-NEXT: addi a1, a1, -1093			; RV32I-NEXT: addi a1, a1, -1093
	; RV32I-NEXT: ret			; RV32I-NEXT: ret
	;			;
	; RV64I-LABEL: imm_12900936431479:			; RV64I-LABEL: imm_12900936431479:
	; RV64I: # %bb.0:			; RV64I: # %bb.0:
	; RV64I-NEXT: lui a0, 192239			; RV64I-NEXT: lui a0, %hi(.LCPI50_0)
	; RV64I-NEXT: slli a0, a0, 2			; RV64I-NEXT: ld a0, %lo(.LCPI50_0)(a0)
	; RV64I-NEXT: addi a0, a0, -1093
	; RV64I-NEXT: slli a0, a0, 12
	; RV64I-NEXT: addi a0, a0, 1911
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IZBA-LABEL: imm_12900936431479:			; RV64IZBA-LABEL: imm_12900936431479:
	; RV64IZBA: # %bb.0:			; RV64IZBA: # %bb.0:
	; RV64IZBA-NEXT: lui a0, 768956			; RV64IZBA-NEXT: lui a0, 768956
	; RV64IZBA-NEXT: addiw a0, a0, -1093			; RV64IZBA-NEXT: addiw a0, a0, -1093
	; RV64IZBA-NEXT: slli.uw a0, a0, 12			; RV64IZBA-NEXT: slli.uw a0, a0, 12
	; RV64IZBA-NEXT: addi a0, a0, 1911			; RV64IZBA-NEXT: addi a0, a0, 1911
	; RV64IZBA-NEXT: ret			; RV64IZBA-NEXT: ret
	;			;
	; RV64IZBS-LABEL: imm_12900936431479:			; RV64IZBS-LABEL: imm_12900936431479:
	; RV64IZBS: # %bb.0:			; RV64IZBS: # %bb.0:
	; RV64IZBS-NEXT: lui a0, 192239			; RV64IZBS-NEXT: lui a0, %hi(.LCPI50_0)
	; RV64IZBS-NEXT: slli a0, a0, 2			; RV64IZBS-NEXT: ld a0, %lo(.LCPI50_0)(a0)
	; RV64IZBS-NEXT: addi a0, a0, -1093
	; RV64IZBS-NEXT: slli a0, a0, 12
	; RV64IZBS-NEXT: addi a0, a0, 1911
	; RV64IZBS-NEXT: ret			; RV64IZBS-NEXT: ret
	ret i64 12900936431479			ret i64 12900936431479
	}			}

	define i64 @imm_12900918536874() {			define i64 @imm_12900918536874() {
	; RV32I-LABEL: imm_12900918536874:			; RV32I-LABEL: imm_12900918536874:
	; RV32I: # %bb.0:			; RV32I: # %bb.0:
	; RV32I-NEXT: lui a0, 764587			; RV32I-NEXT: lui a0, 764587
	; RV32I-NEXT: addi a0, a0, -1366			; RV32I-NEXT: addi a0, a0, -1366
	; RV32I-NEXT: lui a1, 1			; RV32I-NEXT: lui a1, 1
	; RV32I-NEXT: addi a1, a1, -1093			; RV32I-NEXT: addi a1, a1, -1093
	; RV32I-NEXT: ret			; RV32I-NEXT: ret
	;			;
	; RV64I-LABEL: imm_12900918536874:			; RV64I-LABEL: imm_12900918536874:
	; RV64I: # %bb.0:			; RV64I: # %bb.0:
	; RV64I-NEXT: lui a0, 188			; RV64I-NEXT: lui a0, %hi(.LCPI51_0)
	; RV64I-NEXT: addiw a0, a0, -1093			; RV64I-NEXT: ld a0, %lo(.LCPI51_0)(a0)
	; RV64I-NEXT: slli a0, a0, 12
	; RV64I-NEXT: addi a0, a0, -1365
	; RV64I-NEXT: slli a0, a0, 12
	; RV64I-NEXT: addi a0, a0, -1366
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IZBA-LABEL: imm_12900918536874:			; RV64IZBA-LABEL: imm_12900918536874:
	; RV64IZBA: # %bb.0:			; RV64IZBA: # %bb.0:
	; RV64IZBA-NEXT: lui a0, 768955			; RV64IZBA-NEXT: lui a0, 768955
	; RV64IZBA-NEXT: addiw a0, a0, -1365			; RV64IZBA-NEXT: addiw a0, a0, -1365
	; RV64IZBA-NEXT: slli.uw a0, a0, 12			; RV64IZBA-NEXT: slli.uw a0, a0, 12
	; RV64IZBA-NEXT: addi a0, a0, -1366			; RV64IZBA-NEXT: addi a0, a0, -1366
	; RV64IZBA-NEXT: ret			; RV64IZBA-NEXT: ret
	;			;
	; RV64IZBS-LABEL: imm_12900918536874:			; RV64IZBS-LABEL: imm_12900918536874:
	; RV64IZBS: # %bb.0:			; RV64IZBS: # %bb.0:
	; RV64IZBS-NEXT: lui a0, 188			; RV64IZBS-NEXT: lui a0, %hi(.LCPI51_0)
	; RV64IZBS-NEXT: addiw a0, a0, -1093			; RV64IZBS-NEXT: ld a0, %lo(.LCPI51_0)(a0)
	; RV64IZBS-NEXT: slli a0, a0, 12
	; RV64IZBS-NEXT: addi a0, a0, -1365
	; RV64IZBS-NEXT: slli a0, a0, 12
	; RV64IZBS-NEXT: addi a0, a0, -1366
	; RV64IZBS-NEXT: ret			; RV64IZBS-NEXT: ret
	ret i64 12900918536874			ret i64 12900918536874
	}			}

	define i64 @imm_12900925247761() {			define i64 @imm_12900925247761() {
	; RV32I-LABEL: imm_12900925247761:			; RV32I-LABEL: imm_12900925247761:
	; RV32I: # %bb.0:			; RV32I: # %bb.0:
	; RV32I-NEXT: lui a0, 766225			; RV32I-NEXT: lui a0, 766225
	; RV32I-NEXT: addi a0, a0, 273			; RV32I-NEXT: addi a0, a0, 273
	; RV32I-NEXT: lui a1, 1			; RV32I-NEXT: lui a1, 1
	; RV32I-NEXT: addi a1, a1, -1093			; RV32I-NEXT: addi a1, a1, -1093
	; RV32I-NEXT: ret			; RV32I-NEXT: ret
	;			;
	; RV64I-LABEL: imm_12900925247761:			; RV64I-LABEL: imm_12900925247761:
	; RV64I: # %bb.0:			; RV64I: # %bb.0:
	; RV64I-NEXT: lui a0, 188			; RV64I-NEXT: lui a0, %hi(.LCPI52_0)
	; RV64I-NEXT: addiw a0, a0, -1093			; RV64I-NEXT: ld a0, %lo(.LCPI52_0)(a0)
	; RV64I-NEXT: slli a0, a0, 12
	; RV64I-NEXT: addi a0, a0, 273
	; RV64I-NEXT: slli a0, a0, 12
	; RV64I-NEXT: addi a0, a0, 273
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IZBA-LABEL: imm_12900925247761:			; RV64IZBA-LABEL: imm_12900925247761:
	; RV64IZBA: # %bb.0:			; RV64IZBA: # %bb.0:
	; RV64IZBA-NEXT: lui a0, 768955			; RV64IZBA-NEXT: lui a0, 768955
	; RV64IZBA-NEXT: addiw a0, a0, 273			; RV64IZBA-NEXT: addiw a0, a0, 273
	; RV64IZBA-NEXT: slli.uw a0, a0, 12			; RV64IZBA-NEXT: slli.uw a0, a0, 12
	; RV64IZBA-NEXT: addi a0, a0, 273			; RV64IZBA-NEXT: addi a0, a0, 273
	; RV64IZBA-NEXT: ret			; RV64IZBA-NEXT: ret
	;			;
	; RV64IZBS-LABEL: imm_12900925247761:			; RV64IZBS-LABEL: imm_12900925247761:
	; RV64IZBS: # %bb.0:			; RV64IZBS: # %bb.0:
	; RV64IZBS-NEXT: lui a0, 188			; RV64IZBS-NEXT: lui a0, %hi(.LCPI52_0)
	; RV64IZBS-NEXT: addiw a0, a0, -1093			; RV64IZBS-NEXT: ld a0, %lo(.LCPI52_0)(a0)
	; RV64IZBS-NEXT: slli a0, a0, 12
	; RV64IZBS-NEXT: addi a0, a0, 273
	; RV64IZBS-NEXT: slli a0, a0, 12
	; RV64IZBS-NEXT: addi a0, a0, 273
	; RV64IZBS-NEXT: ret			; RV64IZBS-NEXT: ret
	ret i64 12900925247761			ret i64 12900925247761
	}			}

	define i64 @imm_7158272001() {			define i64 @imm_7158272001() {
	; RV32I-LABEL: imm_7158272001:			; RV32I-LABEL: imm_7158272001:
	; RV32I: # %bb.0:			; RV32I: # %bb.0:
	; RV32I-NEXT: lui a0, 699049			; RV32I-NEXT: lui a0, 699049
	▲ Show 20 Lines • Show All 157 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/rv64zbb.ll

	Show First 20 Lines • Show All 322 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: or a0, a0, a1			; RV64I-NEXT: or a0, a0, a1
	; RV64I-NEXT: srli a1, a0, 8			; RV64I-NEXT: srli a1, a0, 8
	; RV64I-NEXT: or a0, a0, a1			; RV64I-NEXT: or a0, a0, a1
	; RV64I-NEXT: srli a1, a0, 16			; RV64I-NEXT: srli a1, a0, 16
	; RV64I-NEXT: or a0, a0, a1			; RV64I-NEXT: or a0, a0, a1
	; RV64I-NEXT: srli a1, a0, 32			; RV64I-NEXT: srli a1, a0, 32
	; RV64I-NEXT: or a0, a0, a1			; RV64I-NEXT: or a0, a0, a1
	; RV64I-NEXT: not a0, a0			; RV64I-NEXT: not a0, a0
	; RV64I-NEXT: srli a1, a0, 1			; RV64I-NEXT: lui a1, %hi(.LCPI5_0)
	; RV64I-NEXT: lui a2, 21845			; RV64I-NEXT: ld a1, %lo(.LCPI5_0)(a1)
	; RV64I-NEXT: addiw a2, a2, 1365			; RV64I-NEXT: lui a2, %hi(.LCPI5_1)
	; RV64I-NEXT: slli a2, a2, 12			; RV64I-NEXT: ld a2, %lo(.LCPI5_1)(a2)
	; RV64I-NEXT: addi a2, a2, 1365			; RV64I-NEXT: srli a3, a0, 1
	; RV64I-NEXT: slli a2, a2, 12			; RV64I-NEXT: and a1, a3, a1
	; RV64I-NEXT: addi a2, a2, 1365
	; RV64I-NEXT: slli a2, a2, 12
	; RV64I-NEXT: addi a2, a2, 1365
	; RV64I-NEXT: and a1, a1, a2
	; RV64I-NEXT: sub a0, a0, a1			; RV64I-NEXT: sub a0, a0, a1
	; RV64I-NEXT: lui a1, 13107			; RV64I-NEXT: and a1, a0, a2
	; RV64I-NEXT: addiw a1, a1, 819
	; RV64I-NEXT: slli a1, a1, 12
	; RV64I-NEXT: addi a1, a1, 819
	; RV64I-NEXT: slli a1, a1, 12
	; RV64I-NEXT: addi a1, a1, 819
	; RV64I-NEXT: slli a1, a1, 12
	; RV64I-NEXT: addi a1, a1, 819
	; RV64I-NEXT: and a2, a0, a1
	; RV64I-NEXT: srli a0, a0, 2			; RV64I-NEXT: srli a0, a0, 2
	; RV64I-NEXT: and a0, a0, a1			; RV64I-NEXT: and a0, a0, a2
	; RV64I-NEXT: add a0, a2, a0			; RV64I-NEXT: lui a2, %hi(.LCPI5_2)
				; RV64I-NEXT: ld a2, %lo(.LCPI5_2)(a2)
				; RV64I-NEXT: add a0, a1, a0
	; RV64I-NEXT: srli a1, a0, 4			; RV64I-NEXT: srli a1, a0, 4
	; RV64I-NEXT: add a0, a0, a1			; RV64I-NEXT: add a0, a0, a1
	; RV64I-NEXT: lui a1, 3855			; RV64I-NEXT: and a0, a0, a2
	; RV64I-NEXT: addiw a1, a1, 241			; RV64I-NEXT: lui a1, %hi(.LCPI5_3)
	; RV64I-NEXT: slli a1, a1, 12			; RV64I-NEXT: ld a1, %lo(.LCPI5_3)(a1)
	; RV64I-NEXT: addi a1, a1, -241
	; RV64I-NEXT: slli a1, a1, 12
	; RV64I-NEXT: addi a1, a1, 241
	; RV64I-NEXT: slli a1, a1, 12
	; RV64I-NEXT: addi a1, a1, -241
	; RV64I-NEXT: and a0, a0, a1
	; RV64I-NEXT: lui a1, 4112
	; RV64I-NEXT: addiw a1, a1, 257
	; RV64I-NEXT: slli a1, a1, 16
	; RV64I-NEXT: addi a1, a1, 257
	; RV64I-NEXT: slli a1, a1, 16
	; RV64I-NEXT: addi a1, a1, 257
	; RV64I-NEXT: call __muldi3@plt			; RV64I-NEXT: call __muldi3@plt
	; RV64I-NEXT: srli a0, a0, 56			; RV64I-NEXT: srli a0, a0, 56
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	; RV64I-NEXT: .LBB5_2:			; RV64I-NEXT: .LBB5_2:
	; RV64I-NEXT: li a0, 64			; RV64I-NEXT: li a0, 64
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	▲ Show 20 Lines • Show All 213 Lines • ▼ Show 20 Lines
	; RV64I: # %bb.0:			; RV64I: # %bb.0:
	; RV64I-NEXT: beqz a0, .LBB10_2			; RV64I-NEXT: beqz a0, .LBB10_2
	; RV64I-NEXT: # %bb.1: # %cond.false			; RV64I-NEXT: # %bb.1: # %cond.false
	; RV64I-NEXT: addi sp, sp, -16			; RV64I-NEXT: addi sp, sp, -16
	; RV64I-NEXT: sd ra, 8(sp) # 8-byte Folded Spill			; RV64I-NEXT: sd ra, 8(sp) # 8-byte Folded Spill
	; RV64I-NEXT: addi a1, a0, -1			; RV64I-NEXT: addi a1, a0, -1
	; RV64I-NEXT: not a0, a0			; RV64I-NEXT: not a0, a0
	; RV64I-NEXT: and a0, a0, a1			; RV64I-NEXT: and a0, a0, a1
	; RV64I-NEXT: srli a1, a0, 1			; RV64I-NEXT: lui a1, %hi(.LCPI10_0)
	; RV64I-NEXT: lui a2, 21845			; RV64I-NEXT: ld a1, %lo(.LCPI10_0)(a1)
	; RV64I-NEXT: addiw a2, a2, 1365			; RV64I-NEXT: lui a2, %hi(.LCPI10_1)
	; RV64I-NEXT: slli a2, a2, 12			; RV64I-NEXT: ld a2, %lo(.LCPI10_1)(a2)
	; RV64I-NEXT: addi a2, a2, 1365			; RV64I-NEXT: srli a3, a0, 1
	; RV64I-NEXT: slli a2, a2, 12			; RV64I-NEXT: and a1, a3, a1
	; RV64I-NEXT: addi a2, a2, 1365
	; RV64I-NEXT: slli a2, a2, 12
	; RV64I-NEXT: addi a2, a2, 1365
	; RV64I-NEXT: and a1, a1, a2
	; RV64I-NEXT: sub a0, a0, a1			; RV64I-NEXT: sub a0, a0, a1
	; RV64I-NEXT: lui a1, 13107			; RV64I-NEXT: and a1, a0, a2
	; RV64I-NEXT: addiw a1, a1, 819
	; RV64I-NEXT: slli a1, a1, 12
	; RV64I-NEXT: addi a1, a1, 819
	; RV64I-NEXT: slli a1, a1, 12
	; RV64I-NEXT: addi a1, a1, 819
	; RV64I-NEXT: slli a1, a1, 12
	; RV64I-NEXT: addi a1, a1, 819
	; RV64I-NEXT: and a2, a0, a1
	; RV64I-NEXT: srli a0, a0, 2			; RV64I-NEXT: srli a0, a0, 2
	; RV64I-NEXT: and a0, a0, a1			; RV64I-NEXT: and a0, a0, a2
	; RV64I-NEXT: add a0, a2, a0			; RV64I-NEXT: lui a2, %hi(.LCPI10_2)
				; RV64I-NEXT: ld a2, %lo(.LCPI10_2)(a2)
				; RV64I-NEXT: add a0, a1, a0
	; RV64I-NEXT: srli a1, a0, 4			; RV64I-NEXT: srli a1, a0, 4
	; RV64I-NEXT: add a0, a0, a1			; RV64I-NEXT: add a0, a0, a1
	; RV64I-NEXT: lui a1, 3855			; RV64I-NEXT: and a0, a0, a2
	; RV64I-NEXT: addiw a1, a1, 241			; RV64I-NEXT: lui a1, %hi(.LCPI10_3)
	; RV64I-NEXT: slli a1, a1, 12			; RV64I-NEXT: ld a1, %lo(.LCPI10_3)(a1)
	; RV64I-NEXT: addi a1, a1, -241
	; RV64I-NEXT: slli a1, a1, 12
	; RV64I-NEXT: addi a1, a1, 241
	; RV64I-NEXT: slli a1, a1, 12
	; RV64I-NEXT: addi a1, a1, -241
	; RV64I-NEXT: and a0, a0, a1
	; RV64I-NEXT: lui a1, 4112
	; RV64I-NEXT: addiw a1, a1, 257
	; RV64I-NEXT: slli a1, a1, 16
	; RV64I-NEXT: addi a1, a1, 257
	; RV64I-NEXT: slli a1, a1, 16
	; RV64I-NEXT: addi a1, a1, 257
	; RV64I-NEXT: call __muldi3@plt			; RV64I-NEXT: call __muldi3@plt
	; RV64I-NEXT: srli a0, a0, 56			; RV64I-NEXT: srli a0, a0, 56
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	; RV64I-NEXT: .LBB10_2:			; RV64I-NEXT: .LBB10_2:
	; RV64I-NEXT: li a0, 64			; RV64I-NEXT: li a0, 64
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	▲ Show 20 Lines • Show All 87 Lines • ▼ Show 20 Lines

	declare i64 @llvm.ctpop.i64(i64)			declare i64 @llvm.ctpop.i64(i64)

	define i64 @ctpop_i64(i64 %a) nounwind {			define i64 @ctpop_i64(i64 %a) nounwind {
	; RV64I-LABEL: ctpop_i64:			; RV64I-LABEL: ctpop_i64:
	; RV64I: # %bb.0:			; RV64I: # %bb.0:
	; RV64I-NEXT: addi sp, sp, -16			; RV64I-NEXT: addi sp, sp, -16
	; RV64I-NEXT: sd ra, 8(sp) # 8-byte Folded Spill			; RV64I-NEXT: sd ra, 8(sp) # 8-byte Folded Spill
	; RV64I-NEXT: srli a1, a0, 1			; RV64I-NEXT: lui a1, %hi(.LCPI13_0)
	; RV64I-NEXT: lui a2, 21845			; RV64I-NEXT: ld a1, %lo(.LCPI13_0)(a1)
	; RV64I-NEXT: addiw a2, a2, 1365			; RV64I-NEXT: lui a2, %hi(.LCPI13_1)
	; RV64I-NEXT: slli a2, a2, 12			; RV64I-NEXT: ld a2, %lo(.LCPI13_1)(a2)
	; RV64I-NEXT: addi a2, a2, 1365			; RV64I-NEXT: srli a3, a0, 1
	; RV64I-NEXT: slli a2, a2, 12			; RV64I-NEXT: and a1, a3, a1
	; RV64I-NEXT: addi a2, a2, 1365
	; RV64I-NEXT: slli a2, a2, 12
	; RV64I-NEXT: addi a2, a2, 1365
	; RV64I-NEXT: and a1, a1, a2
	; RV64I-NEXT: sub a0, a0, a1			; RV64I-NEXT: sub a0, a0, a1
	; RV64I-NEXT: lui a1, 13107			; RV64I-NEXT: and a1, a0, a2
	; RV64I-NEXT: addiw a1, a1, 819
	; RV64I-NEXT: slli a1, a1, 12
	; RV64I-NEXT: addi a1, a1, 819
	; RV64I-NEXT: slli a1, a1, 12
	; RV64I-NEXT: addi a1, a1, 819
	; RV64I-NEXT: slli a1, a1, 12
	; RV64I-NEXT: addi a1, a1, 819
	; RV64I-NEXT: and a2, a0, a1
	; RV64I-NEXT: srli a0, a0, 2			; RV64I-NEXT: srli a0, a0, 2
	; RV64I-NEXT: and a0, a0, a1			; RV64I-NEXT: and a0, a0, a2
	; RV64I-NEXT: add a0, a2, a0			; RV64I-NEXT: lui a2, %hi(.LCPI13_2)
				; RV64I-NEXT: ld a2, %lo(.LCPI13_2)(a2)
				; RV64I-NEXT: add a0, a1, a0
	; RV64I-NEXT: srli a1, a0, 4			; RV64I-NEXT: srli a1, a0, 4
	; RV64I-NEXT: add a0, a0, a1			; RV64I-NEXT: add a0, a0, a1
	; RV64I-NEXT: lui a1, 3855			; RV64I-NEXT: and a0, a0, a2
	; RV64I-NEXT: addiw a1, a1, 241			; RV64I-NEXT: lui a1, %hi(.LCPI13_3)
	; RV64I-NEXT: slli a1, a1, 12			; RV64I-NEXT: ld a1, %lo(.LCPI13_3)(a1)
	; RV64I-NEXT: addi a1, a1, -241
	; RV64I-NEXT: slli a1, a1, 12
	; RV64I-NEXT: addi a1, a1, 241
	; RV64I-NEXT: slli a1, a1, 12
	; RV64I-NEXT: addi a1, a1, -241
	; RV64I-NEXT: and a0, a0, a1
	; RV64I-NEXT: lui a1, 4112
	; RV64I-NEXT: addiw a1, a1, 257
	; RV64I-NEXT: slli a1, a1, 16
	; RV64I-NEXT: addi a1, a1, 257
	; RV64I-NEXT: slli a1, a1, 16
	; RV64I-NEXT: addi a1, a1, 257
	; RV64I-NEXT: call __muldi3@plt			; RV64I-NEXT: call __muldi3@plt
	; RV64I-NEXT: srli a0, a0, 56			; RV64I-NEXT: srli a0, a0, 56
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64ZBB-LABEL: ctpop_i64:			; RV64ZBB-LABEL: ctpop_i64:
	; RV64ZBB: # %bb.0:			; RV64ZBB: # %bb.0:
	▲ Show 20 Lines • Show All 386 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/rv64zbp.ll

Show All 29 Lines	; RV64ZBP-NEXT: ret
%or = or i32 %shr, %a		%or = or i32 %shr, %a
%or2 = or i32 %or, %shl		%or2 = or i32 %or, %shl
ret i32 %or2		ret i32 %or2
}		}

define i64 @gorc1_i64(i64 %a) nounwind {		define i64 @gorc1_i64(i64 %a) nounwind {
; RV64I-LABEL: gorc1_i64:		; RV64I-LABEL: gorc1_i64:
; RV64I: # %bb.0:		; RV64I: # %bb.0:
; RV64I-NEXT: slli a1, a0, 1		; RV64I-NEXT: lui a1, %hi(.LCPI1_0)
; RV64I-NEXT: lui a2, 1026731		; RV64I-NEXT: ld a1, %lo(.LCPI1_0)(a1)
; RV64I-NEXT: addiw a2, a2, -1365		; RV64I-NEXT: lui a2, %hi(.LCPI1_1)
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: ld a2, %lo(.LCPI1_1)(a2)
; RV64I-NEXT: addi a2, a2, -1365		; RV64I-NEXT: slli a3, a0, 1
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: and a1, a3, a1
; RV64I-NEXT: addi a2, a2, -1365		; RV64I-NEXT: srli a3, a0, 1
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: and a2, a3, a2
; RV64I-NEXT: addi a2, a2, -1366
; RV64I-NEXT: and a1, a1, a2
; RV64I-NEXT: srli a2, a0, 1
; RV64I-NEXT: lui a3, 21845
; RV64I-NEXT: addiw a3, a3, 1365
; RV64I-NEXT: slli a3, a3, 12
; RV64I-NEXT: addi a3, a3, 1365
; RV64I-NEXT: slli a3, a3, 12
; RV64I-NEXT: addi a3, a3, 1365
; RV64I-NEXT: slli a3, a3, 12
; RV64I-NEXT: addi a3, a3, 1365
; RV64I-NEXT: and a2, a2, a3
; RV64I-NEXT: or a0, a2, a0		; RV64I-NEXT: or a0, a2, a0
; RV64I-NEXT: or a0, a0, a1		; RV64I-NEXT: or a0, a0, a1
; RV64I-NEXT: ret		; RV64I-NEXT: ret
;		;
; RV64ZBP-LABEL: gorc1_i64:		; RV64ZBP-LABEL: gorc1_i64:
; RV64ZBP: # %bb.0:		; RV64ZBP: # %bb.0:
; RV64ZBP-NEXT: orc.p a0, a0		; RV64ZBP-NEXT: orc.p a0, a0
; RV64ZBP-NEXT: ret		; RV64ZBP-NEXT: ret
Show All 32 Lines	; RV64ZBP-NEXT: ret
%or = or i32 %shr, %a		%or = or i32 %shr, %a
%or2 = or i32 %or, %shl		%or2 = or i32 %or, %shl
ret i32 %or2		ret i32 %or2
}		}

define i64 @gorc2_i64(i64 %a) nounwind {		define i64 @gorc2_i64(i64 %a) nounwind {
; RV64I-LABEL: gorc2_i64:		; RV64I-LABEL: gorc2_i64:
; RV64I: # %bb.0:		; RV64I: # %bb.0:
; RV64I-NEXT: slli a1, a0, 2		; RV64I-NEXT: lui a1, %hi(.LCPI3_0)
; RV64I-NEXT: lui a2, 1035469		; RV64I-NEXT: ld a1, %lo(.LCPI3_0)(a1)
; RV64I-NEXT: addiw a2, a2, -819		; RV64I-NEXT: lui a2, %hi(.LCPI3_1)
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: ld a2, %lo(.LCPI3_1)(a2)
; RV64I-NEXT: addi a2, a2, -819		; RV64I-NEXT: slli a3, a0, 2
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: and a1, a3, a1
; RV64I-NEXT: addi a2, a2, -819		; RV64I-NEXT: srli a3, a0, 2
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: and a2, a3, a2
; RV64I-NEXT: addi a2, a2, -820
; RV64I-NEXT: and a1, a1, a2
; RV64I-NEXT: srli a2, a0, 2
; RV64I-NEXT: lui a3, 13107
; RV64I-NEXT: addiw a3, a3, 819
; RV64I-NEXT: slli a3, a3, 12
; RV64I-NEXT: addi a3, a3, 819
; RV64I-NEXT: slli a3, a3, 12
; RV64I-NEXT: addi a3, a3, 819
; RV64I-NEXT: slli a3, a3, 12
; RV64I-NEXT: addi a3, a3, 819
; RV64I-NEXT: and a2, a2, a3
; RV64I-NEXT: or a0, a2, a0		; RV64I-NEXT: or a0, a2, a0
; RV64I-NEXT: or a0, a0, a1		; RV64I-NEXT: or a0, a0, a1
; RV64I-NEXT: ret		; RV64I-NEXT: ret
;		;
; RV64ZBP-LABEL: gorc2_i64:		; RV64ZBP-LABEL: gorc2_i64:
; RV64ZBP: # %bb.0:		; RV64ZBP: # %bb.0:
; RV64ZBP-NEXT: orc2.n a0, a0		; RV64ZBP-NEXT: orc2.n a0, a0
; RV64ZBP-NEXT: ret		; RV64ZBP-NEXT: ret
▲ Show 20 Lines • Show All 48 Lines • ▼ Show 20 Lines	; RV64ZBP-NEXT: ret
%or2 = or i32 %shr2, %or1b		%or2 = or i32 %shr2, %or1b
%or2b = or i32 %or2, %shl2		%or2b = or i32 %or2, %shl2
ret i32 %or2b		ret i32 %or2b
}		}

define i64 @gorc3_i64(i64 %a) nounwind {		define i64 @gorc3_i64(i64 %a) nounwind {
; RV64I-LABEL: gorc3_i64:		; RV64I-LABEL: gorc3_i64:
; RV64I: # %bb.0:		; RV64I: # %bb.0:
; RV64I-NEXT: slli a1, a0, 1		; RV64I-NEXT: lui a1, %hi(.LCPI5_0)
; RV64I-NEXT: lui a2, 1026731		; RV64I-NEXT: ld a1, %lo(.LCPI5_0)(a1)
; RV64I-NEXT: addiw a2, a2, -1365		; RV64I-NEXT: lui a2, %hi(.LCPI5_1)
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: ld a2, %lo(.LCPI5_1)(a2)
; RV64I-NEXT: addi a2, a2, -1365		; RV64I-NEXT: slli a3, a0, 1
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: and a1, a3, a1
; RV64I-NEXT: addi a2, a2, -1365		; RV64I-NEXT: srli a3, a0, 1
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: and a2, a3, a2
; RV64I-NEXT: addi a2, a2, -1366
; RV64I-NEXT: and a1, a1, a2
; RV64I-NEXT: srli a2, a0, 1
; RV64I-NEXT: lui a3, 21845
; RV64I-NEXT: addiw a3, a3, 1365
; RV64I-NEXT: slli a3, a3, 12
; RV64I-NEXT: addi a3, a3, 1365
; RV64I-NEXT: slli a3, a3, 12
; RV64I-NEXT: addi a3, a3, 1365
; RV64I-NEXT: slli a3, a3, 12
; RV64I-NEXT: addi a3, a3, 1365
; RV64I-NEXT: and a2, a2, a3
; RV64I-NEXT: or a0, a2, a0		; RV64I-NEXT: or a0, a2, a0
; RV64I-NEXT: or a0, a0, a1		; RV64I-NEXT: or a0, a0, a1
; RV64I-NEXT: slli a1, a0, 2		; RV64I-NEXT: lui a1, %hi(.LCPI5_2)
; RV64I-NEXT: lui a2, 1035469		; RV64I-NEXT: ld a1, %lo(.LCPI5_2)(a1)
; RV64I-NEXT: addiw a2, a2, -819		; RV64I-NEXT: lui a2, %hi(.LCPI5_3)
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: ld a2, %lo(.LCPI5_3)(a2)
; RV64I-NEXT: addi a2, a2, -819		; RV64I-NEXT: slli a3, a0, 2
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: and a1, a3, a1
; RV64I-NEXT: addi a2, a2, -819		; RV64I-NEXT: srli a3, a0, 2
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: and a2, a3, a2
; RV64I-NEXT: addi a2, a2, -820
; RV64I-NEXT: and a1, a1, a2
; RV64I-NEXT: srli a2, a0, 2
; RV64I-NEXT: lui a3, 13107
; RV64I-NEXT: addiw a3, a3, 819
; RV64I-NEXT: slli a3, a3, 12
; RV64I-NEXT: addi a3, a3, 819
; RV64I-NEXT: slli a3, a3, 12
; RV64I-NEXT: addi a3, a3, 819
; RV64I-NEXT: slli a3, a3, 12
; RV64I-NEXT: addi a3, a3, 819
; RV64I-NEXT: and a2, a2, a3
; RV64I-NEXT: or a0, a2, a0		; RV64I-NEXT: or a0, a2, a0
; RV64I-NEXT: or a0, a0, a1		; RV64I-NEXT: or a0, a0, a1
; RV64I-NEXT: ret		; RV64I-NEXT: ret
;		;
; RV64ZBP-LABEL: gorc3_i64:		; RV64ZBP-LABEL: gorc3_i64:
; RV64ZBP: # %bb.0:		; RV64ZBP: # %bb.0:
; RV64ZBP-NEXT: orc.n a0, a0		; RV64ZBP-NEXT: orc.n a0, a0
; RV64ZBP-NEXT: ret		; RV64ZBP-NEXT: ret
Show All 38 Lines	; RV64ZBP-NEXT: ret
%or = or i32 %shr, %a		%or = or i32 %shr, %a
%or2 = or i32 %or, %shl		%or2 = or i32 %or, %shl
ret i32 %or2		ret i32 %or2
}		}

define i64 @gorc4_i64(i64 %a) nounwind {		define i64 @gorc4_i64(i64 %a) nounwind {
; RV64I-LABEL: gorc4_i64:		; RV64I-LABEL: gorc4_i64:
; RV64I: # %bb.0:		; RV64I: # %bb.0:
; RV64I-NEXT: slli a1, a0, 4		; RV64I-NEXT: lui a1, %hi(.LCPI7_0)
; RV64I-NEXT: lui a2, 1044721		; RV64I-NEXT: ld a1, %lo(.LCPI7_0)(a1)
; RV64I-NEXT: addiw a2, a2, -241		; RV64I-NEXT: lui a2, %hi(.LCPI7_1)
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: ld a2, %lo(.LCPI7_1)(a2)
; RV64I-NEXT: addi a2, a2, 241		; RV64I-NEXT: slli a3, a0, 4
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: and a1, a3, a1
; RV64I-NEXT: addi a2, a2, -241		; RV64I-NEXT: srli a3, a0, 4
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: and a2, a3, a2
; RV64I-NEXT: addi a2, a2, 240
; RV64I-NEXT: and a1, a1, a2
; RV64I-NEXT: srli a2, a0, 4
; RV64I-NEXT: lui a3, 3855
; RV64I-NEXT: addiw a3, a3, 241
; RV64I-NEXT: slli a3, a3, 12
; RV64I-NEXT: addi a3, a3, -241
; RV64I-NEXT: slli a3, a3, 12
; RV64I-NEXT: addi a3, a3, 241
; RV64I-NEXT: slli a3, a3, 12
; RV64I-NEXT: addi a3, a3, -241
; RV64I-NEXT: and a2, a2, a3
; RV64I-NEXT: or a0, a2, a0		; RV64I-NEXT: or a0, a2, a0
; RV64I-NEXT: or a0, a0, a1		; RV64I-NEXT: or a0, a0, a1
; RV64I-NEXT: ret		; RV64I-NEXT: ret
;		;
; RV64ZBP-LABEL: gorc4_i64:		; RV64ZBP-LABEL: gorc4_i64:
; RV64ZBP: # %bb.0:		; RV64ZBP: # %bb.0:
; RV64ZBP-NEXT: orc4.b a0, a0		; RV64ZBP-NEXT: orc4.b a0, a0
; RV64ZBP-NEXT: ret		; RV64ZBP-NEXT: ret
▲ Show 20 Lines • Show All 48 Lines • ▼ Show 20 Lines	; RV64ZBP-NEXT: ret
%or2 = or i32 %shr2, %or1b		%or2 = or i32 %shr2, %or1b
%or2b = or i32 %or2, %shl2		%or2b = or i32 %or2, %shl2
ret i32 %or2b		ret i32 %or2b
}		}

define i64 @gorc5_i64(i64 %a) nounwind {		define i64 @gorc5_i64(i64 %a) nounwind {
; RV64I-LABEL: gorc5_i64:		; RV64I-LABEL: gorc5_i64:
; RV64I: # %bb.0:		; RV64I: # %bb.0:
; RV64I-NEXT: slli a1, a0, 1		; RV64I-NEXT: lui a1, %hi(.LCPI9_0)
; RV64I-NEXT: lui a2, 1026731		; RV64I-NEXT: ld a1, %lo(.LCPI9_0)(a1)
; RV64I-NEXT: addiw a2, a2, -1365		; RV64I-NEXT: lui a2, %hi(.LCPI9_1)
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: ld a2, %lo(.LCPI9_1)(a2)
; RV64I-NEXT: addi a2, a2, -1365		; RV64I-NEXT: slli a3, a0, 1
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: and a1, a3, a1
; RV64I-NEXT: addi a2, a2, -1365		; RV64I-NEXT: srli a3, a0, 1
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: and a2, a3, a2
; RV64I-NEXT: addi a2, a2, -1366
; RV64I-NEXT: and a1, a1, a2
; RV64I-NEXT: srli a2, a0, 1
; RV64I-NEXT: lui a3, 21845
; RV64I-NEXT: addiw a3, a3, 1365
; RV64I-NEXT: slli a3, a3, 12
; RV64I-NEXT: addi a3, a3, 1365
; RV64I-NEXT: slli a3, a3, 12
; RV64I-NEXT: addi a3, a3, 1365
; RV64I-NEXT: slli a3, a3, 12
; RV64I-NEXT: addi a3, a3, 1365
; RV64I-NEXT: and a2, a2, a3
; RV64I-NEXT: or a0, a2, a0		; RV64I-NEXT: or a0, a2, a0
; RV64I-NEXT: or a0, a0, a1		; RV64I-NEXT: or a0, a0, a1
; RV64I-NEXT: slli a1, a0, 4		; RV64I-NEXT: lui a1, %hi(.LCPI9_2)
; RV64I-NEXT: lui a2, 1044721		; RV64I-NEXT: ld a1, %lo(.LCPI9_2)(a1)
; RV64I-NEXT: addiw a2, a2, -241		; RV64I-NEXT: lui a2, %hi(.LCPI9_3)
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: ld a2, %lo(.LCPI9_3)(a2)
; RV64I-NEXT: addi a2, a2, 241		; RV64I-NEXT: slli a3, a0, 4
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: and a1, a3, a1
; RV64I-NEXT: addi a2, a2, -241		; RV64I-NEXT: srli a3, a0, 4
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: and a2, a3, a2
; RV64I-NEXT: addi a2, a2, 240
; RV64I-NEXT: and a1, a1, a2
; RV64I-NEXT: srli a2, a0, 4
; RV64I-NEXT: lui a3, 3855
; RV64I-NEXT: addiw a3, a3, 241
; RV64I-NEXT: slli a3, a3, 12
; RV64I-NEXT: addi a3, a3, -241
; RV64I-NEXT: slli a3, a3, 12
; RV64I-NEXT: addi a3, a3, 241
; RV64I-NEXT: slli a3, a3, 12
; RV64I-NEXT: addi a3, a3, -241
; RV64I-NEXT: and a2, a2, a3
; RV64I-NEXT: or a0, a2, a0		; RV64I-NEXT: or a0, a2, a0
; RV64I-NEXT: or a0, a0, a1		; RV64I-NEXT: or a0, a0, a1
; RV64I-NEXT: ret		; RV64I-NEXT: ret
;		;
; RV64ZBP-LABEL: gorc5_i64:		; RV64ZBP-LABEL: gorc5_i64:
; RV64ZBP: # %bb.0:		; RV64ZBP: # %bb.0:
; RV64ZBP-NEXT: gorci a0, a0, 5		; RV64ZBP-NEXT: gorci a0, a0, 5
; RV64ZBP-NEXT: ret		; RV64ZBP-NEXT: ret
▲ Show 20 Lines • Show All 54 Lines • ▼ Show 20 Lines	; RV64ZBP-NEXT: ret
%or2 = or i32 %shr2, %or1b		%or2 = or i32 %shr2, %or1b
%or2b = or i32 %or2, %shl2		%or2b = or i32 %or2, %shl2
ret i32 %or2b		ret i32 %or2b
}		}

define i64 @gorc6_i64(i64 %a) nounwind {		define i64 @gorc6_i64(i64 %a) nounwind {
; RV64I-LABEL: gorc6_i64:		; RV64I-LABEL: gorc6_i64:
; RV64I: # %bb.0:		; RV64I: # %bb.0:
; RV64I-NEXT: slli a1, a0, 2		; RV64I-NEXT: lui a1, %hi(.LCPI11_0)
; RV64I-NEXT: lui a2, 1035469		; RV64I-NEXT: ld a1, %lo(.LCPI11_0)(a1)
; RV64I-NEXT: addiw a2, a2, -819		; RV64I-NEXT: lui a2, %hi(.LCPI11_1)
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: ld a2, %lo(.LCPI11_1)(a2)
; RV64I-NEXT: addi a2, a2, -819		; RV64I-NEXT: slli a3, a0, 2
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: and a1, a3, a1
; RV64I-NEXT: addi a2, a2, -819		; RV64I-NEXT: srli a3, a0, 2
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: and a2, a3, a2
; RV64I-NEXT: addi a2, a2, -820
; RV64I-NEXT: and a1, a1, a2
; RV64I-NEXT: srli a2, a0, 2
; RV64I-NEXT: lui a3, 13107
; RV64I-NEXT: addiw a3, a3, 819
; RV64I-NEXT: slli a3, a3, 12
; RV64I-NEXT: addi a3, a3, 819
; RV64I-NEXT: slli a3, a3, 12
; RV64I-NEXT: addi a3, a3, 819
; RV64I-NEXT: slli a3, a3, 12
; RV64I-NEXT: addi a3, a3, 819
; RV64I-NEXT: and a2, a2, a3
; RV64I-NEXT: or a0, a2, a0		; RV64I-NEXT: or a0, a2, a0
; RV64I-NEXT: or a0, a0, a1		; RV64I-NEXT: or a0, a0, a1
; RV64I-NEXT: slli a1, a0, 4		; RV64I-NEXT: lui a1, %hi(.LCPI11_2)
; RV64I-NEXT: lui a2, 1044721		; RV64I-NEXT: ld a1, %lo(.LCPI11_2)(a1)
; RV64I-NEXT: addiw a2, a2, -241		; RV64I-NEXT: lui a2, %hi(.LCPI11_3)
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: ld a2, %lo(.LCPI11_3)(a2)
; RV64I-NEXT: addi a2, a2, 241		; RV64I-NEXT: slli a3, a0, 4
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: and a1, a3, a1
; RV64I-NEXT: addi a2, a2, -241		; RV64I-NEXT: srli a3, a0, 4
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: and a2, a3, a2
; RV64I-NEXT: addi a2, a2, 240
; RV64I-NEXT: and a1, a1, a2
; RV64I-NEXT: srli a2, a0, 4
; RV64I-NEXT: lui a3, 3855
; RV64I-NEXT: addiw a3, a3, 241
; RV64I-NEXT: slli a3, a3, 12
; RV64I-NEXT: addi a3, a3, -241
; RV64I-NEXT: slli a3, a3, 12
; RV64I-NEXT: addi a3, a3, 241
; RV64I-NEXT: slli a3, a3, 12
; RV64I-NEXT: addi a3, a3, -241
; RV64I-NEXT: and a2, a2, a3
; RV64I-NEXT: or a0, a2, a0		; RV64I-NEXT: or a0, a2, a0
; RV64I-NEXT: or a0, a0, a1		; RV64I-NEXT: or a0, a0, a1
; RV64I-NEXT: ret		; RV64I-NEXT: ret
;		;
; RV64ZBP-LABEL: gorc6_i64:		; RV64ZBP-LABEL: gorc6_i64:
; RV64ZBP: # %bb.0:		; RV64ZBP: # %bb.0:
; RV64ZBP-NEXT: orc2.b a0, a0		; RV64ZBP-NEXT: orc2.b a0, a0
; RV64ZBP-NEXT: ret		; RV64ZBP-NEXT: ret
▲ Show 20 Lines • Show All 71 Lines • ▼ Show 20 Lines	; RV64ZBP-NEXT: ret
%or3 = or i32 %shr3, %or2b		%or3 = or i32 %shr3, %or2b
%or3b = or i32 %or3, %shl3		%or3b = or i32 %or3, %shl3
ret i32 %or3b		ret i32 %or3b
}		}

define i64 @gorc7_i64(i64 %a) nounwind {		define i64 @gorc7_i64(i64 %a) nounwind {
; RV64I-LABEL: gorc7_i64:		; RV64I-LABEL: gorc7_i64:
; RV64I: # %bb.0:		; RV64I: # %bb.0:
; RV64I-NEXT: slli a1, a0, 1		; RV64I-NEXT: lui a1, %hi(.LCPI13_0)
; RV64I-NEXT: lui a2, 1026731		; RV64I-NEXT: ld a1, %lo(.LCPI13_0)(a1)
; RV64I-NEXT: addiw a2, a2, -1365		; RV64I-NEXT: lui a2, %hi(.LCPI13_1)
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: ld a2, %lo(.LCPI13_1)(a2)
; RV64I-NEXT: addi a2, a2, -1365		; RV64I-NEXT: slli a3, a0, 1
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: and a1, a3, a1
; RV64I-NEXT: addi a2, a2, -1365		; RV64I-NEXT: srli a3, a0, 1
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: and a2, a3, a2
; RV64I-NEXT: addi a2, a2, -1366
; RV64I-NEXT: and a1, a1, a2
; RV64I-NEXT: srli a2, a0, 1
; RV64I-NEXT: lui a3, 21845
; RV64I-NEXT: addiw a3, a3, 1365
; RV64I-NEXT: slli a3, a3, 12
; RV64I-NEXT: addi a3, a3, 1365
; RV64I-NEXT: slli a3, a3, 12
; RV64I-NEXT: addi a3, a3, 1365
; RV64I-NEXT: slli a3, a3, 12
; RV64I-NEXT: addi a3, a3, 1365
; RV64I-NEXT: and a2, a2, a3
; RV64I-NEXT: or a0, a2, a0		; RV64I-NEXT: or a0, a2, a0
; RV64I-NEXT: or a0, a0, a1		; RV64I-NEXT: or a0, a0, a1
; RV64I-NEXT: slli a1, a0, 2		; RV64I-NEXT: lui a1, %hi(.LCPI13_2)
; RV64I-NEXT: lui a2, 1035469		; RV64I-NEXT: ld a1, %lo(.LCPI13_2)(a1)
; RV64I-NEXT: addiw a2, a2, -819		; RV64I-NEXT: lui a2, %hi(.LCPI13_3)
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: ld a2, %lo(.LCPI13_3)(a2)
; RV64I-NEXT: addi a2, a2, -819		; RV64I-NEXT: slli a3, a0, 2
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: and a1, a3, a1
; RV64I-NEXT: addi a2, a2, -819		; RV64I-NEXT: srli a3, a0, 2
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: and a2, a3, a2
; RV64I-NEXT: addi a2, a2, -820
; RV64I-NEXT: and a1, a1, a2
; RV64I-NEXT: srli a2, a0, 2
; RV64I-NEXT: lui a3, 13107
; RV64I-NEXT: addiw a3, a3, 819
; RV64I-NEXT: slli a3, a3, 12
; RV64I-NEXT: addi a3, a3, 819
; RV64I-NEXT: slli a3, a3, 12
; RV64I-NEXT: addi a3, a3, 819
; RV64I-NEXT: slli a3, a3, 12
; RV64I-NEXT: addi a3, a3, 819
; RV64I-NEXT: and a2, a2, a3
; RV64I-NEXT: or a0, a2, a0		; RV64I-NEXT: or a0, a2, a0
; RV64I-NEXT: or a0, a0, a1		; RV64I-NEXT: or a0, a0, a1
; RV64I-NEXT: slli a1, a0, 4		; RV64I-NEXT: lui a1, %hi(.LCPI13_4)
; RV64I-NEXT: lui a2, 1044721		; RV64I-NEXT: ld a1, %lo(.LCPI13_4)(a1)
; RV64I-NEXT: addiw a2, a2, -241		; RV64I-NEXT: lui a2, %hi(.LCPI13_5)
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: ld a2, %lo(.LCPI13_5)(a2)
; RV64I-NEXT: addi a2, a2, 241		; RV64I-NEXT: slli a3, a0, 4
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: and a1, a3, a1
; RV64I-NEXT: addi a2, a2, -241		; RV64I-NEXT: srli a3, a0, 4
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: and a2, a3, a2
; RV64I-NEXT: addi a2, a2, 240
; RV64I-NEXT: and a1, a1, a2
; RV64I-NEXT: srli a2, a0, 4
; RV64I-NEXT: lui a3, 3855
; RV64I-NEXT: addiw a3, a3, 241
; RV64I-NEXT: slli a3, a3, 12
; RV64I-NEXT: addi a3, a3, -241
; RV64I-NEXT: slli a3, a3, 12
; RV64I-NEXT: addi a3, a3, 241
; RV64I-NEXT: slli a3, a3, 12
; RV64I-NEXT: addi a3, a3, -241
; RV64I-NEXT: and a2, a2, a3
; RV64I-NEXT: or a0, a2, a0		; RV64I-NEXT: or a0, a2, a0
; RV64I-NEXT: or a0, a0, a1		; RV64I-NEXT: or a0, a0, a1
; RV64I-NEXT: ret		; RV64I-NEXT: ret
;		;
; RV64ZBP-LABEL: gorc7_i64:		; RV64ZBP-LABEL: gorc7_i64:
; RV64ZBP: # %bb.0:		; RV64ZBP: # %bb.0:
; RV64ZBP-NEXT: orc.b a0, a0		; RV64ZBP-NEXT: orc.b a0, a0
; RV64ZBP-NEXT: ret		; RV64ZBP-NEXT: ret
▲ Show 20 Lines • Show All 44 Lines • ▼ Show 20 Lines	; RV64ZBP-NEXT: ret
%or = or i32 %shr, %a		%or = or i32 %shr, %a
%or2 = or i32 %or, %shl		%or2 = or i32 %or, %shl
ret i32 %or2		ret i32 %or2
}		}

define i64 @gorc8_i64(i64 %a) nounwind {		define i64 @gorc8_i64(i64 %a) nounwind {
; RV64I-LABEL: gorc8_i64:		; RV64I-LABEL: gorc8_i64:
; RV64I: # %bb.0:		; RV64I: # %bb.0:
; RV64I-NEXT: slli a1, a0, 8		; RV64I-NEXT: lui a1, %hi(.LCPI15_0)
; RV64I-NEXT: lui a2, 1044496		; RV64I-NEXT: ld a1, %lo(.LCPI15_0)(a1)
; RV64I-NEXT: addiw a2, a2, -255		; RV64I-NEXT: lui a2, %hi(.LCPI15_1)
; RV64I-NEXT: slli a2, a2, 16		; RV64I-NEXT: ld a2, %lo(.LCPI15_1)(a2)
; RV64I-NEXT: addi a2, a2, -255		; RV64I-NEXT: slli a3, a0, 8
; RV64I-NEXT: slli a2, a2, 16		; RV64I-NEXT: and a1, a3, a1
; RV64I-NEXT: addi a2, a2, -256		; RV64I-NEXT: srli a3, a0, 8
; RV64I-NEXT: and a1, a1, a2		; RV64I-NEXT: and a2, a3, a2
; RV64I-NEXT: srli a2, a0, 8
; RV64I-NEXT: lui a3, 4080
; RV64I-NEXT: addiw a3, a3, 255
; RV64I-NEXT: slli a3, a3, 16
; RV64I-NEXT: addi a3, a3, 255
; RV64I-NEXT: slli a3, a3, 16
; RV64I-NEXT: addi a3, a3, 255
; RV64I-NEXT: and a2, a2, a3
; RV64I-NEXT: or a0, a2, a0		; RV64I-NEXT: or a0, a2, a0
; RV64I-NEXT: or a0, a0, a1		; RV64I-NEXT: or a0, a0, a1
; RV64I-NEXT: ret		; RV64I-NEXT: ret
;		;
; RV64ZBP-LABEL: gorc8_i64:		; RV64ZBP-LABEL: gorc8_i64:
; RV64ZBP: # %bb.0:		; RV64ZBP: # %bb.0:
; RV64ZBP-NEXT: orc8.h a0, a0		; RV64ZBP-NEXT: orc8.h a0, a0
; RV64ZBP-NEXT: ret		; RV64ZBP-NEXT: ret
▲ Show 20 Lines • Show All 153 Lines • ▼ Show 20 Lines	; RV64ZBP-NEXT: ret
%or2b = or i32 %or2, %shl2		%or2b = or i32 %or2, %shl2
ret i32 %or2b		ret i32 %or2b
}		}

; gorc2, gorc2 -> gorc2		; gorc2, gorc2 -> gorc2
define i64 @gorc2b_i64(i64 %a) nounwind {		define i64 @gorc2b_i64(i64 %a) nounwind {
; RV64I-LABEL: gorc2b_i64:		; RV64I-LABEL: gorc2b_i64:
; RV64I: # %bb.0:		; RV64I: # %bb.0:
; RV64I-NEXT: slli a1, a0, 2		; RV64I-NEXT: lui a1, %hi(.LCPI22_0)
; RV64I-NEXT: lui a2, 1035469		; RV64I-NEXT: ld a1, %lo(.LCPI22_0)(a1)
; RV64I-NEXT: addiw a2, a2, -819		; RV64I-NEXT: lui a2, %hi(.LCPI22_1)
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: ld a2, %lo(.LCPI22_1)(a2)
; RV64I-NEXT: addi a2, a2, -819		; RV64I-NEXT: slli a3, a0, 2
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: and a3, a3, a1
; RV64I-NEXT: addi a2, a2, -819		; RV64I-NEXT: srli a4, a0, 2
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: and a4, a4, a2
; RV64I-NEXT: addi a2, a2, -820		; RV64I-NEXT: or a0, a4, a0
; RV64I-NEXT: and a1, a1, a2		; RV64I-NEXT: or a0, a0, a3
		; RV64I-NEXT: slli a3, a0, 2
		; RV64I-NEXT: and a1, a3, a1
; RV64I-NEXT: srli a3, a0, 2		; RV64I-NEXT: srli a3, a0, 2
; RV64I-NEXT: lui a4, 13107		; RV64I-NEXT: and a2, a3, a2
; RV64I-NEXT: addiw a4, a4, 819
; RV64I-NEXT: slli a4, a4, 12
; RV64I-NEXT: addi a4, a4, 819
; RV64I-NEXT: slli a4, a4, 12
; RV64I-NEXT: addi a4, a4, 819
; RV64I-NEXT: slli a4, a4, 12
; RV64I-NEXT: addi a4, a4, 819
; RV64I-NEXT: and a3, a3, a4
; RV64I-NEXT: or a0, a3, a0
; RV64I-NEXT: or a0, a0, a1
; RV64I-NEXT: slli a1, a0, 2
; RV64I-NEXT: and a1, a1, a2
; RV64I-NEXT: srli a2, a0, 2
; RV64I-NEXT: and a2, a2, a4
; RV64I-NEXT: or a0, a2, a0		; RV64I-NEXT: or a0, a2, a0
; RV64I-NEXT: or a0, a0, a1		; RV64I-NEXT: or a0, a0, a1
; RV64I-NEXT: ret		; RV64I-NEXT: ret
;		;
; RV64ZBP-LABEL: gorc2b_i64:		; RV64ZBP-LABEL: gorc2b_i64:
; RV64ZBP: # %bb.0:		; RV64ZBP: # %bb.0:
; RV64ZBP-NEXT: orc2.n a0, a0		; RV64ZBP-NEXT: orc2.n a0, a0
; RV64ZBP-NEXT: ret		; RV64ZBP-NEXT: ret
▲ Show 20 Lines • Show All 69 Lines • ▼ Show 20 Lines	; RV64ZBP-NEXT: ret
%or3b = or i32 %or3, %shl3		%or3b = or i32 %or3, %shl3
ret i32 %or3b		ret i32 %or3b
}		}

; gorc1, gorc2, gorc1 -> gorc2		; gorc1, gorc2, gorc1 -> gorc2
define i64 @gorc3b_i64(i64 %a) nounwind {		define i64 @gorc3b_i64(i64 %a) nounwind {
; RV64I-LABEL: gorc3b_i64:		; RV64I-LABEL: gorc3b_i64:
; RV64I: # %bb.0:		; RV64I: # %bb.0:
; RV64I-NEXT: slli a1, a0, 1		; RV64I-NEXT: lui a1, %hi(.LCPI24_0)
; RV64I-NEXT: lui a2, 1026731		; RV64I-NEXT: ld a1, %lo(.LCPI24_0)(a1)
; RV64I-NEXT: addiw a2, a2, -1365		; RV64I-NEXT: lui a2, %hi(.LCPI24_1)
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: ld a2, %lo(.LCPI24_1)(a2)
; RV64I-NEXT: addi a2, a2, -1365		; RV64I-NEXT: slli a3, a0, 1
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: and a3, a3, a1
; RV64I-NEXT: addi a2, a2, -1365		; RV64I-NEXT: srli a4, a0, 1
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: and a4, a4, a2
; RV64I-NEXT: addi a2, a2, -1366		; RV64I-NEXT: or a0, a4, a0
; RV64I-NEXT: and a1, a1, a2		; RV64I-NEXT: or a0, a0, a3
		; RV64I-NEXT: lui a3, %hi(.LCPI24_2)
		; RV64I-NEXT: ld a3, %lo(.LCPI24_2)(a3)
		; RV64I-NEXT: lui a4, %hi(.LCPI24_3)
		; RV64I-NEXT: ld a4, %lo(.LCPI24_3)(a4)
		; RV64I-NEXT: slli a5, a0, 2
		; RV64I-NEXT: and a3, a5, a3
		; RV64I-NEXT: srli a5, a0, 2
		; RV64I-NEXT: and a4, a5, a4
		; RV64I-NEXT: or a0, a4, a0
		; RV64I-NEXT: or a0, a0, a3
		; RV64I-NEXT: slli a3, a0, 1
		; RV64I-NEXT: and a1, a3, a1
; RV64I-NEXT: srli a3, a0, 1		; RV64I-NEXT: srli a3, a0, 1
; RV64I-NEXT: lui a4, 21845		; RV64I-NEXT: and a2, a3, a2
; RV64I-NEXT: addiw a4, a4, 1365
; RV64I-NEXT: slli a4, a4, 12
; RV64I-NEXT: addi a4, a4, 1365
; RV64I-NEXT: slli a4, a4, 12
; RV64I-NEXT: addi a4, a4, 1365
; RV64I-NEXT: slli a4, a4, 12
; RV64I-NEXT: addi a4, a4, 1365
; RV64I-NEXT: and a3, a3, a4
; RV64I-NEXT: or a0, a3, a0
; RV64I-NEXT: or a0, a0, a1
; RV64I-NEXT: slli a1, a0, 2
; RV64I-NEXT: lui a3, 1035469
; RV64I-NEXT: addiw a3, a3, -819
; RV64I-NEXT: slli a3, a3, 12
; RV64I-NEXT: addi a3, a3, -819
; RV64I-NEXT: slli a3, a3, 12
; RV64I-NEXT: addi a3, a3, -819
; RV64I-NEXT: slli a3, a3, 12
; RV64I-NEXT: addi a3, a3, -820
; RV64I-NEXT: and a1, a1, a3
; RV64I-NEXT: srli a3, a0, 2
; RV64I-NEXT: lui a5, 13107
; RV64I-NEXT: addiw a5, a5, 819
; RV64I-NEXT: slli a5, a5, 12
; RV64I-NEXT: addi a5, a5, 819
; RV64I-NEXT: slli a5, a5, 12
; RV64I-NEXT: addi a5, a5, 819
; RV64I-NEXT: slli a5, a5, 12
; RV64I-NEXT: addi a5, a5, 819
; RV64I-NEXT: and a3, a3, a5
; RV64I-NEXT: or a0, a3, a0
; RV64I-NEXT: or a0, a0, a1
; RV64I-NEXT: slli a1, a0, 1
; RV64I-NEXT: and a1, a1, a2
; RV64I-NEXT: srli a2, a0, 1
; RV64I-NEXT: and a2, a2, a4
; RV64I-NEXT: or a0, a2, a0		; RV64I-NEXT: or a0, a2, a0
; RV64I-NEXT: or a0, a0, a1		; RV64I-NEXT: or a0, a0, a1
; RV64I-NEXT: ret		; RV64I-NEXT: ret
;		;
; RV64ZBP-LABEL: gorc3b_i64:		; RV64ZBP-LABEL: gorc3b_i64:
; RV64ZBP: # %bb.0:		; RV64ZBP: # %bb.0:
; RV64ZBP-NEXT: orc.n a0, a0		; RV64ZBP-NEXT: orc.n a0, a0
; RV64ZBP-NEXT: ret		; RV64ZBP-NEXT: ret
▲ Show 20 Lines • Show All 78 Lines • ▼ Show 20 Lines	; RV64ZBP-NEXT: ret
%shr = and i32 %and1, 1431655765		%shr = and i32 %and1, 1431655765
%or = or i32 %shl, %shr		%or = or i32 %shl, %shr
ret i32 %or		ret i32 %or
}		}

define i64 @grev1_i64(i64 %a) nounwind {		define i64 @grev1_i64(i64 %a) nounwind {
; RV64I-LABEL: grev1_i64:		; RV64I-LABEL: grev1_i64:
; RV64I: # %bb.0:		; RV64I: # %bb.0:
; RV64I-NEXT: slli a1, a0, 1		; RV64I-NEXT: lui a1, %hi(.LCPI28_0)
; RV64I-NEXT: lui a2, 1026731		; RV64I-NEXT: ld a1, %lo(.LCPI28_0)(a1)
; RV64I-NEXT: addiw a2, a2, -1365		; RV64I-NEXT: lui a2, %hi(.LCPI28_1)
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: ld a2, %lo(.LCPI28_1)(a2)
; RV64I-NEXT: addi a2, a2, -1365		; RV64I-NEXT: slli a3, a0, 1
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: and a1, a3, a1
; RV64I-NEXT: addi a2, a2, -1365
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, -1366
; RV64I-NEXT: and a1, a1, a2
; RV64I-NEXT: srli a0, a0, 1		; RV64I-NEXT: srli a0, a0, 1
; RV64I-NEXT: lui a2, 21845
; RV64I-NEXT: addiw a2, a2, 1365
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, 1365
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, 1365
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, 1365
; RV64I-NEXT: and a0, a0, a2		; RV64I-NEXT: and a0, a0, a2
; RV64I-NEXT: or a0, a1, a0		; RV64I-NEXT: or a0, a1, a0
; RV64I-NEXT: ret		; RV64I-NEXT: ret
;		;
; RV64ZBP-LABEL: grev1_i64:		; RV64ZBP-LABEL: grev1_i64:
; RV64ZBP: # %bb.0:		; RV64ZBP: # %bb.0:
; RV64ZBP-NEXT: rev.p a0, a0		; RV64ZBP-NEXT: rev.p a0, a0
; RV64ZBP-NEXT: ret		; RV64ZBP-NEXT: ret
Show All 29 Lines	; RV64ZBP-NEXT: ret
%shr = and i32 %and1, 858993459		%shr = and i32 %and1, 858993459
%or = or i32 %shl, %shr		%or = or i32 %shl, %shr
ret i32 %or		ret i32 %or
}		}

define i64 @grev2_i64(i64 %a) nounwind {		define i64 @grev2_i64(i64 %a) nounwind {
; RV64I-LABEL: grev2_i64:		; RV64I-LABEL: grev2_i64:
; RV64I: # %bb.0:		; RV64I: # %bb.0:
; RV64I-NEXT: slli a1, a0, 2		; RV64I-NEXT: lui a1, %hi(.LCPI30_0)
; RV64I-NEXT: lui a2, 1035469		; RV64I-NEXT: ld a1, %lo(.LCPI30_0)(a1)
; RV64I-NEXT: addiw a2, a2, -819		; RV64I-NEXT: lui a2, %hi(.LCPI30_1)
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: ld a2, %lo(.LCPI30_1)(a2)
; RV64I-NEXT: addi a2, a2, -819		; RV64I-NEXT: slli a3, a0, 2
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: and a1, a3, a1
; RV64I-NEXT: addi a2, a2, -819
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, -820
; RV64I-NEXT: and a1, a1, a2
; RV64I-NEXT: srli a0, a0, 2		; RV64I-NEXT: srli a0, a0, 2
; RV64I-NEXT: lui a2, 13107
; RV64I-NEXT: addiw a2, a2, 819
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, 819
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, 819
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, 819
; RV64I-NEXT: and a0, a0, a2		; RV64I-NEXT: and a0, a0, a2
; RV64I-NEXT: or a0, a1, a0		; RV64I-NEXT: or a0, a1, a0
; RV64I-NEXT: ret		; RV64I-NEXT: ret
;		;
; RV64ZBP-LABEL: grev2_i64:		; RV64ZBP-LABEL: grev2_i64:
; RV64ZBP: # %bb.0:		; RV64ZBP: # %bb.0:
; RV64ZBP-NEXT: rev2.n a0, a0		; RV64ZBP-NEXT: rev2.n a0, a0
; RV64ZBP-NEXT: ret		; RV64ZBP-NEXT: ret
▲ Show 20 Lines • Show All 43 Lines • ▼ Show 20 Lines	; RV64ZBP-NEXT: ret
%shr2 = and i32 %and2b, 858993459		%shr2 = and i32 %and2b, 858993459
%or2 = or i32 %shl2, %shr2		%or2 = or i32 %shl2, %shr2
ret i32 %or2		ret i32 %or2
}		}

define i64 @grev3_i64(i64 %a) nounwind {		define i64 @grev3_i64(i64 %a) nounwind {
; RV64I-LABEL: grev3_i64:		; RV64I-LABEL: grev3_i64:
; RV64I: # %bb.0:		; RV64I: # %bb.0:
; RV64I-NEXT: slli a1, a0, 1		; RV64I-NEXT: lui a1, %hi(.LCPI32_0)
; RV64I-NEXT: lui a2, 1026731		; RV64I-NEXT: ld a1, %lo(.LCPI32_0)(a1)
; RV64I-NEXT: addiw a2, a2, -1365		; RV64I-NEXT: lui a2, %hi(.LCPI32_1)
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: ld a2, %lo(.LCPI32_1)(a2)
; RV64I-NEXT: addi a2, a2, -1365		; RV64I-NEXT: slli a3, a0, 1
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: and a1, a3, a1
; RV64I-NEXT: addi a2, a2, -1365
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, -1366
; RV64I-NEXT: and a1, a1, a2
; RV64I-NEXT: srli a0, a0, 1		; RV64I-NEXT: srli a0, a0, 1
; RV64I-NEXT: lui a2, 21845
; RV64I-NEXT: addiw a2, a2, 1365
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, 1365
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, 1365
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, 1365
; RV64I-NEXT: and a0, a0, a2		; RV64I-NEXT: and a0, a0, a2
; RV64I-NEXT: or a0, a1, a0		; RV64I-NEXT: or a0, a1, a0
; RV64I-NEXT: slli a1, a0, 2		; RV64I-NEXT: lui a1, %hi(.LCPI32_2)
; RV64I-NEXT: lui a2, 1035469		; RV64I-NEXT: ld a1, %lo(.LCPI32_2)(a1)
; RV64I-NEXT: addiw a2, a2, -819		; RV64I-NEXT: lui a2, %hi(.LCPI32_3)
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: ld a2, %lo(.LCPI32_3)(a2)
; RV64I-NEXT: addi a2, a2, -819		; RV64I-NEXT: slli a3, a0, 2
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: and a1, a3, a1
; RV64I-NEXT: addi a2, a2, -819
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, -820
; RV64I-NEXT: and a1, a1, a2
; RV64I-NEXT: srli a0, a0, 2		; RV64I-NEXT: srli a0, a0, 2
; RV64I-NEXT: lui a2, 13107
; RV64I-NEXT: addiw a2, a2, 819
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, 819
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, 819
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, 819
; RV64I-NEXT: and a0, a0, a2		; RV64I-NEXT: and a0, a0, a2
; RV64I-NEXT: or a0, a1, a0		; RV64I-NEXT: or a0, a1, a0
; RV64I-NEXT: ret		; RV64I-NEXT: ret
;		;
; RV64ZBP-LABEL: grev3_i64:		; RV64ZBP-LABEL: grev3_i64:
; RV64ZBP: # %bb.0:		; RV64ZBP: # %bb.0:
; RV64ZBP-NEXT: rev.n a0, a0		; RV64ZBP-NEXT: rev.n a0, a0
; RV64ZBP-NEXT: ret		; RV64ZBP-NEXT: ret
Show All 34 Lines	; RV64ZBP-NEXT: ret
%shr = and i32 %and1, 252645135		%shr = and i32 %and1, 252645135
%or = or i32 %shl, %shr		%or = or i32 %shl, %shr
ret i32 %or		ret i32 %or
}		}

define i64 @grev4_i64(i64 %a) nounwind {		define i64 @grev4_i64(i64 %a) nounwind {
; RV64I-LABEL: grev4_i64:		; RV64I-LABEL: grev4_i64:
; RV64I: # %bb.0:		; RV64I: # %bb.0:
; RV64I-NEXT: slli a1, a0, 4		; RV64I-NEXT: lui a1, %hi(.LCPI34_0)
; RV64I-NEXT: lui a2, 1044721		; RV64I-NEXT: ld a1, %lo(.LCPI34_0)(a1)
; RV64I-NEXT: addiw a2, a2, -241		; RV64I-NEXT: lui a2, %hi(.LCPI34_1)
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: ld a2, %lo(.LCPI34_1)(a2)
; RV64I-NEXT: addi a2, a2, 241		; RV64I-NEXT: slli a3, a0, 4
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: and a1, a3, a1
; RV64I-NEXT: addi a2, a2, -241
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, 240
; RV64I-NEXT: and a1, a1, a2
; RV64I-NEXT: srli a0, a0, 4		; RV64I-NEXT: srli a0, a0, 4
; RV64I-NEXT: lui a2, 3855
; RV64I-NEXT: addiw a2, a2, 241
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, -241
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, 241
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, -241
; RV64I-NEXT: and a0, a0, a2		; RV64I-NEXT: and a0, a0, a2
; RV64I-NEXT: or a0, a1, a0		; RV64I-NEXT: or a0, a1, a0
; RV64I-NEXT: ret		; RV64I-NEXT: ret
;		;
; RV64ZBP-LABEL: grev4_i64:		; RV64ZBP-LABEL: grev4_i64:
; RV64ZBP: # %bb.0:		; RV64ZBP: # %bb.0:
; RV64ZBP-NEXT: rev4.b a0, a0		; RV64ZBP-NEXT: rev4.b a0, a0
; RV64ZBP-NEXT: ret		; RV64ZBP-NEXT: ret
▲ Show 20 Lines • Show All 43 Lines • ▼ Show 20 Lines	; RV64ZBP-NEXT: ret
%shr2 = and i32 %and2b, 252645135		%shr2 = and i32 %and2b, 252645135
%or2 = or i32 %shl2, %shr2		%or2 = or i32 %shl2, %shr2
ret i32 %or2		ret i32 %or2
}		}

define i64 @grev5_i64(i64 %a) nounwind {		define i64 @grev5_i64(i64 %a) nounwind {
; RV64I-LABEL: grev5_i64:		; RV64I-LABEL: grev5_i64:
; RV64I: # %bb.0:		; RV64I: # %bb.0:
; RV64I-NEXT: slli a1, a0, 1		; RV64I-NEXT: lui a1, %hi(.LCPI36_0)
; RV64I-NEXT: lui a2, 1026731		; RV64I-NEXT: ld a1, %lo(.LCPI36_0)(a1)
; RV64I-NEXT: addiw a2, a2, -1365		; RV64I-NEXT: lui a2, %hi(.LCPI36_1)
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: ld a2, %lo(.LCPI36_1)(a2)
; RV64I-NEXT: addi a2, a2, -1365		; RV64I-NEXT: slli a3, a0, 1
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: and a1, a3, a1
; RV64I-NEXT: addi a2, a2, -1365
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, -1366
; RV64I-NEXT: and a1, a1, a2
; RV64I-NEXT: srli a0, a0, 1		; RV64I-NEXT: srli a0, a0, 1
; RV64I-NEXT: lui a2, 21845
; RV64I-NEXT: addiw a2, a2, 1365
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, 1365
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, 1365
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, 1365
; RV64I-NEXT: and a0, a0, a2		; RV64I-NEXT: and a0, a0, a2
; RV64I-NEXT: or a0, a1, a0		; RV64I-NEXT: or a0, a1, a0
; RV64I-NEXT: slli a1, a0, 4		; RV64I-NEXT: lui a1, %hi(.LCPI36_2)
; RV64I-NEXT: lui a2, 1044721		; RV64I-NEXT: ld a1, %lo(.LCPI36_2)(a1)
; RV64I-NEXT: addiw a2, a2, -241		; RV64I-NEXT: lui a2, %hi(.LCPI36_3)
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: ld a2, %lo(.LCPI36_3)(a2)
; RV64I-NEXT: addi a2, a2, 241		; RV64I-NEXT: slli a3, a0, 4
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: and a1, a3, a1
; RV64I-NEXT: addi a2, a2, -241
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, 240
; RV64I-NEXT: and a1, a1, a2
; RV64I-NEXT: srli a0, a0, 4		; RV64I-NEXT: srli a0, a0, 4
; RV64I-NEXT: lui a2, 3855
; RV64I-NEXT: addiw a2, a2, 241
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, -241
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, 241
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, -241
; RV64I-NEXT: and a0, a0, a2		; RV64I-NEXT: and a0, a0, a2
; RV64I-NEXT: or a0, a1, a0		; RV64I-NEXT: or a0, a1, a0
; RV64I-NEXT: ret		; RV64I-NEXT: ret
;		;
; RV64ZBP-LABEL: grev5_i64:		; RV64ZBP-LABEL: grev5_i64:
; RV64ZBP: # %bb.0:		; RV64ZBP: # %bb.0:
; RV64ZBP-NEXT: grevi a0, a0, 5		; RV64ZBP-NEXT: grevi a0, a0, 5
; RV64ZBP-NEXT: ret		; RV64ZBP-NEXT: ret
▲ Show 20 Lines • Show All 49 Lines • ▼ Show 20 Lines	; RV64ZBP-NEXT: ret
%shr2 = and i32 %and2b, 252645135		%shr2 = and i32 %and2b, 252645135
%or2 = or i32 %shl2, %shr2		%or2 = or i32 %shl2, %shr2
ret i32 %or2		ret i32 %or2
}		}

define i64 @grev6_i64(i64 %a) nounwind {		define i64 @grev6_i64(i64 %a) nounwind {
; RV64I-LABEL: grev6_i64:		; RV64I-LABEL: grev6_i64:
; RV64I: # %bb.0:		; RV64I: # %bb.0:
; RV64I-NEXT: slli a1, a0, 2		; RV64I-NEXT: lui a1, %hi(.LCPI38_0)
; RV64I-NEXT: lui a2, 1035469		; RV64I-NEXT: ld a1, %lo(.LCPI38_0)(a1)
; RV64I-NEXT: addiw a2, a2, -819		; RV64I-NEXT: lui a2, %hi(.LCPI38_1)
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: ld a2, %lo(.LCPI38_1)(a2)
; RV64I-NEXT: addi a2, a2, -819		; RV64I-NEXT: slli a3, a0, 2
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: and a1, a3, a1
; RV64I-NEXT: addi a2, a2, -819
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, -820
; RV64I-NEXT: and a1, a1, a2
; RV64I-NEXT: srli a0, a0, 2		; RV64I-NEXT: srli a0, a0, 2
; RV64I-NEXT: lui a2, 13107
; RV64I-NEXT: addiw a2, a2, 819
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, 819
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, 819
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, 819
; RV64I-NEXT: and a0, a0, a2		; RV64I-NEXT: and a0, a0, a2
; RV64I-NEXT: or a0, a1, a0		; RV64I-NEXT: or a0, a1, a0
; RV64I-NEXT: slli a1, a0, 4		; RV64I-NEXT: lui a1, %hi(.LCPI38_2)
; RV64I-NEXT: lui a2, 1044721		; RV64I-NEXT: ld a1, %lo(.LCPI38_2)(a1)
; RV64I-NEXT: addiw a2, a2, -241		; RV64I-NEXT: lui a2, %hi(.LCPI38_3)
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: ld a2, %lo(.LCPI38_3)(a2)
; RV64I-NEXT: addi a2, a2, 241		; RV64I-NEXT: slli a3, a0, 4
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: and a1, a3, a1
; RV64I-NEXT: addi a2, a2, -241
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, 240
; RV64I-NEXT: and a1, a1, a2
; RV64I-NEXT: srli a0, a0, 4		; RV64I-NEXT: srli a0, a0, 4
; RV64I-NEXT: lui a2, 3855
; RV64I-NEXT: addiw a2, a2, 241
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, -241
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, 241
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, -241
; RV64I-NEXT: and a0, a0, a2		; RV64I-NEXT: and a0, a0, a2
; RV64I-NEXT: or a0, a1, a0		; RV64I-NEXT: or a0, a1, a0
; RV64I-NEXT: ret		; RV64I-NEXT: ret
;		;
; RV64ZBP-LABEL: grev6_i64:		; RV64ZBP-LABEL: grev6_i64:
; RV64ZBP: # %bb.0:		; RV64ZBP: # %bb.0:
; RV64ZBP-NEXT: rev2.b a0, a0		; RV64ZBP-NEXT: rev2.b a0, a0
; RV64ZBP-NEXT: ret		; RV64ZBP-NEXT: ret
▲ Show 20 Lines • Show All 62 Lines • ▼ Show 20 Lines	; RV64ZBP-NEXT: ret
%shr3 = and i32 %and3b, 252645135		%shr3 = and i32 %and3b, 252645135
%or3 = or i32 %shl3, %shr3		%or3 = or i32 %shl3, %shr3
ret i32 %or3		ret i32 %or3
}		}

define i64 @grev7_i64(i64 %a) nounwind {		define i64 @grev7_i64(i64 %a) nounwind {
; RV64I-LABEL: grev7_i64:		; RV64I-LABEL: grev7_i64:
; RV64I: # %bb.0:		; RV64I: # %bb.0:
; RV64I-NEXT: slli a1, a0, 1		; RV64I-NEXT: lui a1, %hi(.LCPI40_0)
; RV64I-NEXT: lui a2, 1026731		; RV64I-NEXT: ld a1, %lo(.LCPI40_0)(a1)
; RV64I-NEXT: addiw a2, a2, -1365		; RV64I-NEXT: lui a2, %hi(.LCPI40_1)
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: ld a2, %lo(.LCPI40_1)(a2)
; RV64I-NEXT: addi a2, a2, -1365		; RV64I-NEXT: slli a3, a0, 1
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: and a1, a3, a1
; RV64I-NEXT: addi a2, a2, -1365
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, -1366
; RV64I-NEXT: and a1, a1, a2
; RV64I-NEXT: srli a0, a0, 1		; RV64I-NEXT: srli a0, a0, 1
; RV64I-NEXT: lui a2, 21845
; RV64I-NEXT: addiw a2, a2, 1365
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, 1365
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, 1365
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, 1365
; RV64I-NEXT: and a0, a0, a2		; RV64I-NEXT: and a0, a0, a2
; RV64I-NEXT: or a0, a1, a0		; RV64I-NEXT: or a0, a1, a0
; RV64I-NEXT: slli a1, a0, 2		; RV64I-NEXT: lui a1, %hi(.LCPI40_2)
; RV64I-NEXT: lui a2, 1035469		; RV64I-NEXT: ld a1, %lo(.LCPI40_2)(a1)
; RV64I-NEXT: addiw a2, a2, -819		; RV64I-NEXT: lui a2, %hi(.LCPI40_3)
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: ld a2, %lo(.LCPI40_3)(a2)
; RV64I-NEXT: addi a2, a2, -819		; RV64I-NEXT: slli a3, a0, 2
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: and a1, a3, a1
; RV64I-NEXT: addi a2, a2, -819
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, -820
; RV64I-NEXT: and a1, a1, a2
; RV64I-NEXT: srli a0, a0, 2		; RV64I-NEXT: srli a0, a0, 2
; RV64I-NEXT: lui a2, 13107
; RV64I-NEXT: addiw a2, a2, 819
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, 819
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, 819
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, 819
; RV64I-NEXT: and a0, a0, a2		; RV64I-NEXT: and a0, a0, a2
; RV64I-NEXT: or a0, a1, a0		; RV64I-NEXT: or a0, a1, a0
; RV64I-NEXT: slli a1, a0, 4		; RV64I-NEXT: lui a1, %hi(.LCPI40_4)
; RV64I-NEXT: lui a2, 1044721		; RV64I-NEXT: ld a1, %lo(.LCPI40_4)(a1)
; RV64I-NEXT: addiw a2, a2, -241		; RV64I-NEXT: lui a2, %hi(.LCPI40_5)
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: ld a2, %lo(.LCPI40_5)(a2)
; RV64I-NEXT: addi a2, a2, 241		; RV64I-NEXT: slli a3, a0, 4
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: and a1, a3, a1
; RV64I-NEXT: addi a2, a2, -241
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, 240
; RV64I-NEXT: and a1, a1, a2
; RV64I-NEXT: srli a0, a0, 4		; RV64I-NEXT: srli a0, a0, 4
; RV64I-NEXT: lui a2, 3855
; RV64I-NEXT: addiw a2, a2, 241
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, -241
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, 241
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, -241
; RV64I-NEXT: and a0, a0, a2		; RV64I-NEXT: and a0, a0, a2
; RV64I-NEXT: or a0, a1, a0		; RV64I-NEXT: or a0, a1, a0
; RV64I-NEXT: ret		; RV64I-NEXT: ret
;		;
; RV64ZBP-LABEL: grev7_i64:		; RV64ZBP-LABEL: grev7_i64:
; RV64ZBP: # %bb.0:		; RV64ZBP: # %bb.0:
; RV64ZBP-NEXT: rev.b a0, a0		; RV64ZBP-NEXT: rev.b a0, a0
; RV64ZBP-NEXT: ret		; RV64ZBP-NEXT: ret
Show All 39 Lines	; RV64ZBP-NEXT: ret
%shr = and i32 %and1, 16711935		%shr = and i32 %and1, 16711935
%or = or i32 %shl, %shr		%or = or i32 %shl, %shr
ret i32 %or		ret i32 %or
}		}

define i64 @grev8_i64(i64 %a) nounwind {		define i64 @grev8_i64(i64 %a) nounwind {
; RV64I-LABEL: grev8_i64:		; RV64I-LABEL: grev8_i64:
; RV64I: # %bb.0:		; RV64I: # %bb.0:
; RV64I-NEXT: slli a1, a0, 8		; RV64I-NEXT: lui a1, %hi(.LCPI42_0)
; RV64I-NEXT: lui a2, 1044496		; RV64I-NEXT: ld a1, %lo(.LCPI42_0)(a1)
; RV64I-NEXT: addiw a2, a2, -255		; RV64I-NEXT: lui a2, %hi(.LCPI42_1)
; RV64I-NEXT: slli a2, a2, 16		; RV64I-NEXT: ld a2, %lo(.LCPI42_1)(a2)
; RV64I-NEXT: addi a2, a2, -255		; RV64I-NEXT: slli a3, a0, 8
; RV64I-NEXT: slli a2, a2, 16		; RV64I-NEXT: and a1, a3, a1
; RV64I-NEXT: addi a2, a2, -256
; RV64I-NEXT: and a1, a1, a2
; RV64I-NEXT: srli a0, a0, 8		; RV64I-NEXT: srli a0, a0, 8
; RV64I-NEXT: lui a2, 4080
; RV64I-NEXT: addiw a2, a2, 255
; RV64I-NEXT: slli a2, a2, 16
; RV64I-NEXT: addi a2, a2, 255
; RV64I-NEXT: slli a2, a2, 16
; RV64I-NEXT: addi a2, a2, 255
; RV64I-NEXT: and a0, a0, a2		; RV64I-NEXT: and a0, a0, a2
; RV64I-NEXT: or a0, a1, a0		; RV64I-NEXT: or a0, a1, a0
; RV64I-NEXT: ret		; RV64I-NEXT: ret
;		;
; RV64ZBP-LABEL: grev8_i64:		; RV64ZBP-LABEL: grev8_i64:
; RV64ZBP: # %bb.0:		; RV64ZBP: # %bb.0:
; RV64ZBP-NEXT: rev8.h a0, a0		; RV64ZBP-NEXT: rev8.h a0, a0
; RV64ZBP-NEXT: ret		; RV64ZBP-NEXT: ret
▲ Show 20 Lines • Show All 143 Lines • ▼ Show 20 Lines	; RV64ZBP-NEXT: ret
%shr1 = and i32 %and1b, 1431655765		%shr1 = and i32 %and1b, 1431655765
%or1 = or i32 %shl1, %shr1		%or1 = or i32 %shl1, %shr1
ret i32 %or1		ret i32 %or1
}		}

define i64 @grev3b_i64(i64 %a) nounwind {		define i64 @grev3b_i64(i64 %a) nounwind {
; RV64I-LABEL: grev3b_i64:		; RV64I-LABEL: grev3b_i64:
; RV64I: # %bb.0:		; RV64I: # %bb.0:
; RV64I-NEXT: slli a1, a0, 2		; RV64I-NEXT: lui a1, %hi(.LCPI49_0)
; RV64I-NEXT: lui a2, 1035469		; RV64I-NEXT: ld a1, %lo(.LCPI49_0)(a1)
; RV64I-NEXT: addiw a2, a2, -819		; RV64I-NEXT: lui a2, %hi(.LCPI49_1)
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: ld a2, %lo(.LCPI49_1)(a2)
; RV64I-NEXT: addi a2, a2, -819		; RV64I-NEXT: slli a3, a0, 2
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: and a1, a3, a1
; RV64I-NEXT: addi a2, a2, -819
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, -820
; RV64I-NEXT: and a1, a1, a2
; RV64I-NEXT: srli a0, a0, 2		; RV64I-NEXT: srli a0, a0, 2
; RV64I-NEXT: lui a2, 13107
; RV64I-NEXT: addiw a2, a2, 819
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, 819
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, 819
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, 819
; RV64I-NEXT: and a0, a0, a2		; RV64I-NEXT: and a0, a0, a2
; RV64I-NEXT: or a0, a1, a0		; RV64I-NEXT: or a0, a1, a0
; RV64I-NEXT: slli a1, a0, 1		; RV64I-NEXT: lui a1, %hi(.LCPI49_2)
; RV64I-NEXT: lui a2, 1026731		; RV64I-NEXT: ld a1, %lo(.LCPI49_2)(a1)
; RV64I-NEXT: addiw a2, a2, -1365		; RV64I-NEXT: lui a2, %hi(.LCPI49_3)
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: ld a2, %lo(.LCPI49_3)(a2)
; RV64I-NEXT: addi a2, a2, -1365		; RV64I-NEXT: slli a3, a0, 1
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: and a1, a3, a1
; RV64I-NEXT: addi a2, a2, -1365
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, -1366
; RV64I-NEXT: and a1, a1, a2
; RV64I-NEXT: srli a0, a0, 1		; RV64I-NEXT: srli a0, a0, 1
; RV64I-NEXT: lui a2, 21845
; RV64I-NEXT: addiw a2, a2, 1365
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, 1365
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, 1365
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, 1365
; RV64I-NEXT: and a0, a0, a2		; RV64I-NEXT: and a0, a0, a2
; RV64I-NEXT: or a0, a1, a0		; RV64I-NEXT: or a0, a1, a0
; RV64I-NEXT: ret		; RV64I-NEXT: ret
;		;
; RV64ZBP-LABEL: grev3b_i64:		; RV64ZBP-LABEL: grev3b_i64:
; RV64ZBP: # %bb.0:		; RV64ZBP: # %bb.0:
; RV64ZBP-NEXT: rev.n a0, a0		; RV64ZBP-NEXT: rev.n a0, a0
; RV64ZBP-NEXT: ret		; RV64ZBP-NEXT: ret
▲ Show 20 Lines • Show All 60 Lines • ▼ Show 20 Lines	; RV64ZBP-NEXT: ret
%or3 = or i32 %shl3, %shr3		%or3 = or i32 %shl3, %shr3
ret i32 %or3		ret i32 %or3
}		}

; grev1, grev2, grev1 -> grev2		; grev1, grev2, grev1 -> grev2
define i64 @grev2b_i64(i64 %a) nounwind {		define i64 @grev2b_i64(i64 %a) nounwind {
; RV64I-LABEL: grev2b_i64:		; RV64I-LABEL: grev2b_i64:
; RV64I: # %bb.0:		; RV64I: # %bb.0:
; RV64I-NEXT: slli a1, a0, 1		; RV64I-NEXT: lui a1, %hi(.LCPI51_0)
; RV64I-NEXT: lui a2, 1026731		; RV64I-NEXT: ld a1, %lo(.LCPI51_0)(a1)
; RV64I-NEXT: addiw a2, a2, -1365		; RV64I-NEXT: lui a2, %hi(.LCPI51_1)
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: ld a2, %lo(.LCPI51_1)(a2)
; RV64I-NEXT: addi a2, a2, -1365		; RV64I-NEXT: slli a3, a0, 1
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: and a3, a3, a1
; RV64I-NEXT: addi a2, a2, -1365
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, -1366
; RV64I-NEXT: and a1, a1, a2
; RV64I-NEXT: srli a0, a0, 1		; RV64I-NEXT: srli a0, a0, 1
; RV64I-NEXT: lui a3, 21845		; RV64I-NEXT: and a0, a0, a2
; RV64I-NEXT: addiw a3, a3, 1365		; RV64I-NEXT: or a0, a3, a0
; RV64I-NEXT: slli a3, a3, 12		; RV64I-NEXT: lui a3, %hi(.LCPI51_2)
; RV64I-NEXT: addi a3, a3, 1365		; RV64I-NEXT: ld a3, %lo(.LCPI51_2)(a3)
; RV64I-NEXT: slli a3, a3, 12		; RV64I-NEXT: lui a4, %hi(.LCPI51_3)
; RV64I-NEXT: addi a3, a3, 1365		; RV64I-NEXT: ld a4, %lo(.LCPI51_3)(a4)
; RV64I-NEXT: slli a3, a3, 12		; RV64I-NEXT: slli a5, a0, 2
; RV64I-NEXT: addi a3, a3, 1365		; RV64I-NEXT: and a3, a5, a3
; RV64I-NEXT: and a0, a0, a3
; RV64I-NEXT: or a0, a1, a0
; RV64I-NEXT: slli a1, a0, 2
; RV64I-NEXT: lui a4, 1035469
; RV64I-NEXT: addiw a4, a4, -819
; RV64I-NEXT: slli a4, a4, 12
; RV64I-NEXT: addi a4, a4, -819
; RV64I-NEXT: slli a4, a4, 12
; RV64I-NEXT: addi a4, a4, -819
; RV64I-NEXT: slli a4, a4, 12
; RV64I-NEXT: addi a4, a4, -820
; RV64I-NEXT: and a1, a1, a4
; RV64I-NEXT: srli a0, a0, 2		; RV64I-NEXT: srli a0, a0, 2
; RV64I-NEXT: lui a4, 13107
; RV64I-NEXT: addiw a4, a4, 819
; RV64I-NEXT: slli a4, a4, 12
; RV64I-NEXT: addi a4, a4, 819
; RV64I-NEXT: slli a4, a4, 12
; RV64I-NEXT: addi a4, a4, 819
; RV64I-NEXT: slli a4, a4, 12
; RV64I-NEXT: addi a4, a4, 819
; RV64I-NEXT: and a0, a0, a4		; RV64I-NEXT: and a0, a0, a4
; RV64I-NEXT: or a0, a1, a0		; RV64I-NEXT: or a0, a3, a0
; RV64I-NEXT: slli a1, a0, 1		; RV64I-NEXT: slli a3, a0, 1
; RV64I-NEXT: and a1, a1, a2		; RV64I-NEXT: and a1, a3, a1
; RV64I-NEXT: srli a0, a0, 1		; RV64I-NEXT: srli a0, a0, 1
; RV64I-NEXT: and a0, a0, a3		; RV64I-NEXT: and a0, a0, a2
; RV64I-NEXT: or a0, a1, a0		; RV64I-NEXT: or a0, a1, a0
; RV64I-NEXT: ret		; RV64I-NEXT: ret
;		;
; RV64ZBP-LABEL: grev2b_i64:		; RV64ZBP-LABEL: grev2b_i64:
; RV64ZBP: # %bb.0:		; RV64ZBP: # %bb.0:
; RV64ZBP-NEXT: rev2.n a0, a0		; RV64ZBP-NEXT: rev2.n a0, a0
; RV64ZBP-NEXT: ret		; RV64ZBP-NEXT: ret
%and1 = shl i64 %a, 1		%and1 = shl i64 %a, 1
▲ Show 20 Lines • Show All 73 Lines • ▼ Show 20 Lines	; RV64ZBP-NEXT: ret
%or4 = or i32 %shl4, %shr4		%or4 = or i32 %shl4, %shr4
ret i32 %or4		ret i32 %or4
}		}

; grev1, grev2, grev1, grev2 -> identity		; grev1, grev2, grev1, grev2 -> identity
define i64 @grev0_i64(i64 %a) nounwind {		define i64 @grev0_i64(i64 %a) nounwind {
; RV64I-LABEL: grev0_i64:		; RV64I-LABEL: grev0_i64:
; RV64I: # %bb.0:		; RV64I: # %bb.0:
; RV64I-NEXT: slli a1, a0, 1		; RV64I-NEXT: lui a1, %hi(.LCPI53_0)
; RV64I-NEXT: lui a2, 1026731		; RV64I-NEXT: ld a1, %lo(.LCPI53_0)(a1)
; RV64I-NEXT: addiw a2, a2, -1365		; RV64I-NEXT: lui a2, %hi(.LCPI53_1)
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: ld a2, %lo(.LCPI53_1)(a2)
; RV64I-NEXT: addi a2, a2, -1365		; RV64I-NEXT: slli a3, a0, 1
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: and a3, a3, a1
; RV64I-NEXT: addi a2, a2, -1365
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, -1366
; RV64I-NEXT: and a1, a1, a2
; RV64I-NEXT: srli a0, a0, 1		; RV64I-NEXT: srli a0, a0, 1
; RV64I-NEXT: lui a3, 21845		; RV64I-NEXT: and a0, a0, a2
; RV64I-NEXT: addiw a3, a3, 1365		; RV64I-NEXT: or a0, a3, a0
; RV64I-NEXT: slli a3, a3, 12		; RV64I-NEXT: lui a3, %hi(.LCPI53_2)
; RV64I-NEXT: addi a3, a3, 1365		; RV64I-NEXT: ld a3, %lo(.LCPI53_2)(a3)
; RV64I-NEXT: slli a3, a3, 12		; RV64I-NEXT: lui a4, %hi(.LCPI53_3)
; RV64I-NEXT: addi a3, a3, 1365		; RV64I-NEXT: ld a4, %lo(.LCPI53_3)(a4)
; RV64I-NEXT: slli a3, a3, 12		; RV64I-NEXT: slli a5, a0, 2
; RV64I-NEXT: addi a3, a3, 1365		; RV64I-NEXT: and a5, a5, a3
; RV64I-NEXT: and a0, a0, a3
; RV64I-NEXT: or a0, a1, a0
; RV64I-NEXT: slli a1, a0, 2
; RV64I-NEXT: lui a4, 1035469
; RV64I-NEXT: addiw a4, a4, -819
; RV64I-NEXT: slli a4, a4, 12
; RV64I-NEXT: addi a4, a4, -819
; RV64I-NEXT: slli a4, a4, 12
; RV64I-NEXT: addi a4, a4, -819
; RV64I-NEXT: slli a4, a4, 12
; RV64I-NEXT: addi a4, a4, -820
; RV64I-NEXT: and a1, a1, a4
; RV64I-NEXT: srli a0, a0, 2		; RV64I-NEXT: srli a0, a0, 2
; RV64I-NEXT: lui a5, 13107		; RV64I-NEXT: and a0, a0, a4
; RV64I-NEXT: addiw a5, a5, 819		; RV64I-NEXT: or a0, a5, a0
; RV64I-NEXT: slli a5, a5, 12		; RV64I-NEXT: slli a5, a0, 1
; RV64I-NEXT: addi a5, a5, 819		; RV64I-NEXT: and a1, a5, a1
; RV64I-NEXT: slli a5, a5, 12
; RV64I-NEXT: addi a5, a5, 819
; RV64I-NEXT: slli a5, a5, 12
; RV64I-NEXT: addi a5, a5, 819
; RV64I-NEXT: and a0, a0, a5
; RV64I-NEXT: or a0, a1, a0
; RV64I-NEXT: slli a1, a0, 1
; RV64I-NEXT: and a1, a1, a2
; RV64I-NEXT: srli a0, a0, 1		; RV64I-NEXT: srli a0, a0, 1
; RV64I-NEXT: and a0, a0, a3		; RV64I-NEXT: and a0, a0, a2
; RV64I-NEXT: or a0, a1, a0		; RV64I-NEXT: or a0, a1, a0
; RV64I-NEXT: slli a1, a0, 2		; RV64I-NEXT: slli a1, a0, 2
; RV64I-NEXT: and a1, a1, a4		; RV64I-NEXT: and a1, a1, a3
; RV64I-NEXT: srli a0, a0, 2		; RV64I-NEXT: srli a0, a0, 2
; RV64I-NEXT: and a0, a0, a5		; RV64I-NEXT: and a0, a0, a4
; RV64I-NEXT: or a0, a1, a0		; RV64I-NEXT: or a0, a1, a0
; RV64I-NEXT: ret		; RV64I-NEXT: ret
;		;
; RV64ZBP-LABEL: grev0_i64:		; RV64ZBP-LABEL: grev0_i64:
; RV64ZBP: # %bb.0:		; RV64ZBP: # %bb.0:
; RV64ZBP-NEXT: ret		; RV64ZBP-NEXT: ret
%and1 = shl i64 %a, 1		%and1 = shl i64 %a, 1
%shl1 = and i64 %and1, -6148914691236517206		%shl1 = and i64 %and1, -6148914691236517206
▲ Show 20 Lines • Show All 365 Lines • ▼ Show 20 Lines
; RV64I-NEXT: srliw a4, a0, 24		; RV64I-NEXT: srliw a4, a0, 24
; RV64I-NEXT: slli a4, a4, 32		; RV64I-NEXT: slli a4, a4, 32
; RV64I-NEXT: or a2, a2, a4		; RV64I-NEXT: or a2, a2, a4
; RV64I-NEXT: slli a4, a0, 40		; RV64I-NEXT: slli a4, a0, 40
; RV64I-NEXT: slli a3, a3, 48		; RV64I-NEXT: slli a3, a3, 48
; RV64I-NEXT: and a3, a4, a3		; RV64I-NEXT: and a3, a4, a3
; RV64I-NEXT: slli a0, a0, 56		; RV64I-NEXT: slli a0, a0, 56
; RV64I-NEXT: or a0, a0, a3		; RV64I-NEXT: or a0, a0, a3
		; RV64I-NEXT: lui a3, %hi(.LCPI64_0)
		; RV64I-NEXT: ld a3, %lo(.LCPI64_0)(a3)
; RV64I-NEXT: or a0, a0, a2		; RV64I-NEXT: or a0, a0, a2
; RV64I-NEXT: or a0, a0, a1		; RV64I-NEXT: or a0, a0, a1
; RV64I-NEXT: srli a1, a0, 4		; RV64I-NEXT: srli a1, a0, 4
; RV64I-NEXT: lui a2, 3855		; RV64I-NEXT: and a1, a1, a3
; RV64I-NEXT: addiw a2, a2, 241		; RV64I-NEXT: and a0, a0, a3
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: lui a2, %hi(.LCPI64_1)
; RV64I-NEXT: addi a2, a2, -241		; RV64I-NEXT: ld a2, %lo(.LCPI64_1)(a2)
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, 241
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, -241
; RV64I-NEXT: and a1, a1, a2
; RV64I-NEXT: and a0, a0, a2
; RV64I-NEXT: slli a0, a0, 4		; RV64I-NEXT: slli a0, a0, 4
; RV64I-NEXT: or a0, a1, a0		; RV64I-NEXT: or a0, a1, a0
; RV64I-NEXT: srli a1, a0, 2		; RV64I-NEXT: srli a1, a0, 2
; RV64I-NEXT: lui a2, 13107
; RV64I-NEXT: addiw a2, a2, 819
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, 819
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, 819
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, 819
; RV64I-NEXT: and a1, a1, a2		; RV64I-NEXT: and a1, a1, a2
; RV64I-NEXT: and a0, a0, a2		; RV64I-NEXT: and a0, a0, a2
		; RV64I-NEXT: lui a2, %hi(.LCPI64_2)
		; RV64I-NEXT: ld a2, %lo(.LCPI64_2)(a2)
; RV64I-NEXT: slli a0, a0, 2		; RV64I-NEXT: slli a0, a0, 2
; RV64I-NEXT: or a0, a1, a0		; RV64I-NEXT: or a0, a1, a0
; RV64I-NEXT: srli a1, a0, 1		; RV64I-NEXT: srli a1, a0, 1
; RV64I-NEXT: lui a2, 21845
; RV64I-NEXT: addiw a2, a2, 1365
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, 1365
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, 1365
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, 1365
; RV64I-NEXT: and a1, a1, a2		; RV64I-NEXT: and a1, a1, a2
; RV64I-NEXT: and a0, a0, a2		; RV64I-NEXT: and a0, a0, a2
; RV64I-NEXT: slli a0, a0, 1		; RV64I-NEXT: slli a0, a0, 1
; RV64I-NEXT: or a0, a1, a0		; RV64I-NEXT: or a0, a1, a0
; RV64I-NEXT: ret		; RV64I-NEXT: ret
;		;
; RV64ZBP-LABEL: bitreverse_i64:		; RV64ZBP-LABEL: bitreverse_i64:
; RV64ZBP: # %bb.0:		; RV64ZBP: # %bb.0:
▲ Show 20 Lines • Show All 109 Lines • ▼ Show 20 Lines	; RV64ZBP-NEXT: ret
%1 = call i32 @llvm.bitreverse.i32(i32 %a)		%1 = call i32 @llvm.bitreverse.i32(i32 %a)
%2 = call i32 @llvm.bswap.i32(i32 %1)		%2 = call i32 @llvm.bswap.i32(i32 %1)
ret i32 %2		ret i32 %2
}		}

define i64 @bitreverse_bswap_i64(i64 %a) {		define i64 @bitreverse_bswap_i64(i64 %a) {
; RV64I-LABEL: bitreverse_bswap_i64:		; RV64I-LABEL: bitreverse_bswap_i64:
; RV64I: # %bb.0:		; RV64I: # %bb.0:
; RV64I-NEXT: srli a2, a0, 24		; RV64I-NEXT: srli a1, a0, 24
; RV64I-NEXT: lui a6, 4080		; RV64I-NEXT: lui a6, 4080
; RV64I-NEXT: and a3, a2, a6		; RV64I-NEXT: and a1, a1, a6
; RV64I-NEXT: srli a4, a0, 8		; RV64I-NEXT: srli a3, a0, 8
; RV64I-NEXT: li a1, 255		; RV64I-NEXT: li a4, 255
; RV64I-NEXT: slli a7, a1, 24		; RV64I-NEXT: slli a7, a4, 24
; RV64I-NEXT: and a4, a4, a7		; RV64I-NEXT: and a3, a3, a7
; RV64I-NEXT: or a3, a4, a3		; RV64I-NEXT: or a1, a3, a1
; RV64I-NEXT: srli a4, a0, 40		; RV64I-NEXT: srli a3, a0, 40
; RV64I-NEXT: lui a5, 16		; RV64I-NEXT: lui a2, 16
; RV64I-NEXT: addiw a5, a5, -256		; RV64I-NEXT: addiw a2, a2, -256
; RV64I-NEXT: and a4, a4, a5		; RV64I-NEXT: and a3, a3, a2
; RV64I-NEXT: srli a2, a0, 56		; RV64I-NEXT: srli a5, a0, 56
; RV64I-NEXT: or a2, a4, a2		; RV64I-NEXT: or a3, a3, a5
; RV64I-NEXT: or a2, a3, a2		; RV64I-NEXT: or a1, a1, a3
; RV64I-NEXT: slli a4, a0, 24		; RV64I-NEXT: slli a3, a0, 24
; RV64I-NEXT: slli t0, a1, 40		; RV64I-NEXT: slli t0, a4, 40
; RV64I-NEXT: and a4, a4, t0		; RV64I-NEXT: and a3, a3, t0
; RV64I-NEXT: srliw a3, a0, 24		; RV64I-NEXT: srliw a5, a0, 24
; RV64I-NEXT: slli a3, a3, 32		; RV64I-NEXT: slli a5, a5, 32
; RV64I-NEXT: or a3, a4, a3		; RV64I-NEXT: or a3, a3, a5
; RV64I-NEXT: slli a4, a0, 40		; RV64I-NEXT: slli a5, a0, 40
; RV64I-NEXT: slli a1, a1, 48		; RV64I-NEXT: slli a4, a4, 48
; RV64I-NEXT: and a4, a4, a1		; RV64I-NEXT: and a5, a5, a4
; RV64I-NEXT: slli a0, a0, 56		; RV64I-NEXT: slli a0, a0, 56
; RV64I-NEXT: or a0, a0, a4		; RV64I-NEXT: or a0, a0, a5
		; RV64I-NEXT: lui a5, %hi(.LCPI68_0)
		; RV64I-NEXT: ld a5, %lo(.LCPI68_0)(a5)
; RV64I-NEXT: or a0, a0, a3		; RV64I-NEXT: or a0, a0, a3
; RV64I-NEXT: or a0, a0, a2		; RV64I-NEXT: or a0, a0, a1
; RV64I-NEXT: srli a2, a0, 4		; RV64I-NEXT: srli a1, a0, 4
; RV64I-NEXT: lui a3, 3855		; RV64I-NEXT: and a1, a1, a5
; RV64I-NEXT: addiw a3, a3, 241		; RV64I-NEXT: and a0, a0, a5
; RV64I-NEXT: slli a3, a3, 12		; RV64I-NEXT: lui a3, %hi(.LCPI68_1)
; RV64I-NEXT: addi a3, a3, -241		; RV64I-NEXT: ld a3, %lo(.LCPI68_1)(a3)
; RV64I-NEXT: slli a3, a3, 12
; RV64I-NEXT: addi a3, a3, 241
; RV64I-NEXT: slli a3, a3, 12
; RV64I-NEXT: addi a3, a3, -241
; RV64I-NEXT: and a2, a2, a3
; RV64I-NEXT: and a0, a0, a3
; RV64I-NEXT: slli a0, a0, 4		; RV64I-NEXT: slli a0, a0, 4
; RV64I-NEXT: or a0, a2, a0		; RV64I-NEXT: or a0, a1, a0
; RV64I-NEXT: srli a2, a0, 2		; RV64I-NEXT: srli a1, a0, 2
; RV64I-NEXT: lui a3, 13107		; RV64I-NEXT: and a1, a1, a3
; RV64I-NEXT: addiw a3, a3, 819
; RV64I-NEXT: slli a3, a3, 12
; RV64I-NEXT: addi a3, a3, 819
; RV64I-NEXT: slli a3, a3, 12
; RV64I-NEXT: addi a3, a3, 819
; RV64I-NEXT: slli a3, a3, 12
; RV64I-NEXT: addi a3, a3, 819
; RV64I-NEXT: and a2, a2, a3
; RV64I-NEXT: and a0, a0, a3		; RV64I-NEXT: and a0, a0, a3
		; RV64I-NEXT: lui a3, %hi(.LCPI68_2)
		; RV64I-NEXT: ld a3, %lo(.LCPI68_2)(a3)
; RV64I-NEXT: slli a0, a0, 2		; RV64I-NEXT: slli a0, a0, 2
; RV64I-NEXT: or a0, a2, a0		; RV64I-NEXT: or a0, a1, a0
; RV64I-NEXT: srli a2, a0, 1		; RV64I-NEXT: srli a1, a0, 1
; RV64I-NEXT: lui a3, 21845		; RV64I-NEXT: and a1, a1, a3
; RV64I-NEXT: addiw a3, a3, 1365
; RV64I-NEXT: slli a3, a3, 12
; RV64I-NEXT: addi a3, a3, 1365
; RV64I-NEXT: slli a3, a3, 12
; RV64I-NEXT: addi a3, a3, 1365
; RV64I-NEXT: slli a3, a3, 12
; RV64I-NEXT: addi a3, a3, 1365
; RV64I-NEXT: and a2, a2, a3
; RV64I-NEXT: and a0, a0, a3		; RV64I-NEXT: and a0, a0, a3
; RV64I-NEXT: slli a0, a0, 1		; RV64I-NEXT: slli a0, a0, 1
; RV64I-NEXT: or a0, a2, a0		; RV64I-NEXT: or a0, a1, a0
; RV64I-NEXT: srli a2, a0, 40		; RV64I-NEXT: srli a1, a0, 40
; RV64I-NEXT: and a2, a2, a5		; RV64I-NEXT: and a1, a1, a2
; RV64I-NEXT: srli a3, a0, 56		; RV64I-NEXT: srli a2, a0, 56
; RV64I-NEXT: or a2, a2, a3		; RV64I-NEXT: or a1, a1, a2
; RV64I-NEXT: srli a3, a0, 24		; RV64I-NEXT: srli a2, a0, 24
; RV64I-NEXT: and a3, a3, a6		; RV64I-NEXT: and a2, a2, a6
; RV64I-NEXT: srli a4, a0, 8		; RV64I-NEXT: srli a3, a0, 8
; RV64I-NEXT: and a4, a4, a7		; RV64I-NEXT: and a3, a3, a7
; RV64I-NEXT: or a3, a4, a3
; RV64I-NEXT: or a2, a3, a2		; RV64I-NEXT: or a2, a3, a2
; RV64I-NEXT: slli a3, a0, 24		; RV64I-NEXT: or a1, a2, a1
; RV64I-NEXT: and a3, a3, t0		; RV64I-NEXT: slli a2, a0, 24
; RV64I-NEXT: srliw a4, a0, 24		; RV64I-NEXT: and a2, a2, t0
; RV64I-NEXT: slli a4, a4, 32		; RV64I-NEXT: srliw a3, a0, 24
; RV64I-NEXT: or a3, a3, a4		; RV64I-NEXT: slli a3, a3, 32
; RV64I-NEXT: slli a4, a0, 40		; RV64I-NEXT: or a2, a2, a3
; RV64I-NEXT: and a1, a4, a1		; RV64I-NEXT: slli a3, a0, 40
		; RV64I-NEXT: and a3, a3, a4
; RV64I-NEXT: slli a0, a0, 56		; RV64I-NEXT: slli a0, a0, 56
; RV64I-NEXT: or a0, a0, a1
; RV64I-NEXT: or a0, a0, a3		; RV64I-NEXT: or a0, a0, a3
; RV64I-NEXT: or a0, a0, a2		; RV64I-NEXT: or a0, a0, a2
		; RV64I-NEXT: or a0, a0, a1
; RV64I-NEXT: ret		; RV64I-NEXT: ret
;		;
; RV64ZBP-LABEL: bitreverse_bswap_i64:		; RV64ZBP-LABEL: bitreverse_bswap_i64:
; RV64ZBP: # %bb.0:		; RV64ZBP: # %bb.0:
; RV64ZBP-NEXT: rev.b a0, a0		; RV64ZBP-NEXT: rev.b a0, a0
; RV64ZBP-NEXT: ret		; RV64ZBP-NEXT: ret
%1 = call i64 @llvm.bitreverse.i64(i64 %a)		%1 = call i64 @llvm.bitreverse.i64(i64 %a)
%2 = call i64 @llvm.bswap.i64(i64 %1)		%2 = call i64 @llvm.bswap.i64(i64 %1)
Show All 30 Lines	; RV64ZBP-NEXT: ret
%and2 = and i32 %shr, 572662306		%and2 = and i32 %shr, 572662306
%or3 = or i32 %or, %and2		%or3 = or i32 %or, %and2
ret i32 %or3		ret i32 %or3
}		}

define i64 @shfl1_i64(i64 %a, i64 %b) nounwind {		define i64 @shfl1_i64(i64 %a, i64 %b) nounwind {
; RV64I-LABEL: shfl1_i64:		; RV64I-LABEL: shfl1_i64:
; RV64I: # %bb.0:		; RV64I: # %bb.0:
; RV64I-NEXT: lui a1, 1035469		; RV64I-NEXT: lui a1, %hi(.LCPI70_0)
; RV64I-NEXT: addiw a1, a1, -819		; RV64I-NEXT: ld a1, %lo(.LCPI70_0)(a1)
; RV64I-NEXT: slli a1, a1, 12		; RV64I-NEXT: lui a2, %hi(.LCPI70_1)
; RV64I-NEXT: addi a1, a1, -819		; RV64I-NEXT: ld a2, %lo(.LCPI70_1)(a2)
; RV64I-NEXT: slli a1, a1, 12		; RV64I-NEXT: slli a3, a0, 1
; RV64I-NEXT: addi a1, a1, -819		; RV64I-NEXT: and a2, a3, a2
; RV64I-NEXT: slli a1, a1, 13		; RV64I-NEXT: lui a3, %hi(.LCPI70_2)
; RV64I-NEXT: addi a1, a1, -1639		; RV64I-NEXT: ld a3, %lo(.LCPI70_2)(a3)
; RV64I-NEXT: and a1, a0, a1		; RV64I-NEXT: and a1, a0, a1
; RV64I-NEXT: slli a2, a0, 1
; RV64I-NEXT: lui a3, 4369
; RV64I-NEXT: addiw a3, a3, 273
; RV64I-NEXT: slli a3, a3, 12
; RV64I-NEXT: addi a3, a3, 273
; RV64I-NEXT: slli a3, a3, 12
; RV64I-NEXT: addi a3, a3, 273
; RV64I-NEXT: slli a4, a3, 14
; RV64I-NEXT: addi a4, a4, 1092
; RV64I-NEXT: and a2, a2, a4
; RV64I-NEXT: or a1, a1, a2		; RV64I-NEXT: or a1, a1, a2
; RV64I-NEXT: srli a0, a0, 1		; RV64I-NEXT: srli a0, a0, 1
; RV64I-NEXT: slli a2, a3, 13		; RV64I-NEXT: and a0, a0, a3
; RV64I-NEXT: addi a2, a2, 546
; RV64I-NEXT: and a0, a0, a2
; RV64I-NEXT: or a0, a1, a0		; RV64I-NEXT: or a0, a1, a0
; RV64I-NEXT: ret		; RV64I-NEXT: ret
;		;
; RV64ZBP-LABEL: shfl1_i64:		; RV64ZBP-LABEL: shfl1_i64:
; RV64ZBP: # %bb.0:		; RV64ZBP: # %bb.0:
; RV64ZBP-NEXT: zip.n a0, a0		; RV64ZBP-NEXT: zip.n a0, a0
; RV64ZBP-NEXT: ret		; RV64ZBP-NEXT: ret
%and = and i64 %a, -7378697629483820647		%and = and i64 %a, -7378697629483820647
Show All 36 Lines	; RV64ZBP-NEXT: ret
%and2 = and i32 %shr, 202116108		%and2 = and i32 %shr, 202116108
%or3 = or i32 %and2, %or		%or3 = or i32 %and2, %or
ret i32 %or3		ret i32 %or3
}		}

define i64 @shfl2_i64(i64 %a, i64 %b) nounwind {		define i64 @shfl2_i64(i64 %a, i64 %b) nounwind {
; RV64I-LABEL: shfl2_i64:		; RV64I-LABEL: shfl2_i64:
; RV64I: # %bb.0:		; RV64I: # %bb.0:
; RV64I-NEXT: lui a1, 1044721		; RV64I-NEXT: lui a1, %hi(.LCPI72_0)
; RV64I-NEXT: addiw a1, a1, -241		; RV64I-NEXT: ld a1, %lo(.LCPI72_0)(a1)
; RV64I-NEXT: slli a1, a1, 12		; RV64I-NEXT: lui a2, %hi(.LCPI72_1)
; RV64I-NEXT: addi a1, a1, 241		; RV64I-NEXT: ld a2, %lo(.LCPI72_1)(a2)
; RV64I-NEXT: slli a1, a1, 12		; RV64I-NEXT: slli a3, a0, 2
; RV64I-NEXT: addi a1, a1, -241		; RV64I-NEXT: and a2, a3, a2
; RV64I-NEXT: slli a1, a1, 14		; RV64I-NEXT: lui a3, %hi(.LCPI72_2)
; RV64I-NEXT: addi a1, a1, 963		; RV64I-NEXT: ld a3, %lo(.LCPI72_2)(a3)
; RV64I-NEXT: and a1, a0, a1		; RV64I-NEXT: and a1, a0, a1
; RV64I-NEXT: slli a2, a0, 2
; RV64I-NEXT: lui a3, 197379
; RV64I-NEXT: slli a3, a3, 4
; RV64I-NEXT: addi a3, a3, 771
; RV64I-NEXT: slli a4, a3, 16
; RV64I-NEXT: addi a4, a4, 771
; RV64I-NEXT: slli a4, a4, 12
; RV64I-NEXT: addi a4, a4, 48
; RV64I-NEXT: and a2, a2, a4
; RV64I-NEXT: or a1, a1, a2		; RV64I-NEXT: or a1, a1, a2
; RV64I-NEXT: srli a0, a0, 2		; RV64I-NEXT: srli a0, a0, 2
; RV64I-NEXT: slli a2, a3, 14		; RV64I-NEXT: and a0, a0, a3
; RV64I-NEXT: addi a2, a2, 193
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, -1012
; RV64I-NEXT: and a0, a0, a2
; RV64I-NEXT: or a0, a0, a1		; RV64I-NEXT: or a0, a0, a1
; RV64I-NEXT: ret		; RV64I-NEXT: ret
;		;
; RV64ZBP-LABEL: shfl2_i64:		; RV64ZBP-LABEL: shfl2_i64:
; RV64ZBP: # %bb.0:		; RV64ZBP: # %bb.0:
; RV64ZBP-NEXT: zip2.b a0, a0		; RV64ZBP-NEXT: zip2.b a0, a0
; RV64ZBP-NEXT: ret		; RV64ZBP-NEXT: ret
%and = and i64 %a, -4340410370284600381		%and = and i64 %a, -4340410370284600381
Show All 36 Lines	; RV64ZBP-NEXT: ret
%or = or i32 %and2, %and		%or = or i32 %and2, %and
%or3 = or i32 %or, %and1		%or3 = or i32 %or, %and1
ret i32 %or3		ret i32 %or3
}		}

define i64 @shfl4_i64(i64 %a, i64 %b) nounwind {		define i64 @shfl4_i64(i64 %a, i64 %b) nounwind {
; RV64I-LABEL: shfl4_i64:		; RV64I-LABEL: shfl4_i64:
; RV64I: # %bb.0:		; RV64I: # %bb.0:
; RV64I-NEXT: lui a1, 983295		; RV64I-NEXT: lui a1, %hi(.LCPI74_0)
; RV64I-NEXT: slli a1, a1, 4		; RV64I-NEXT: ld a1, %lo(.LCPI74_0)(a1)
; RV64I-NEXT: addi a1, a1, 255		; RV64I-NEXT: lui a2, %hi(.LCPI74_1)
; RV64I-NEXT: slli a1, a1, 16		; RV64I-NEXT: ld a2, %lo(.LCPI74_1)(a2)
; RV64I-NEXT: addi a1, a1, 255		; RV64I-NEXT: slli a3, a0, 4
; RV64I-NEXT: slli a1, a1, 12		; RV64I-NEXT: lui a4, %hi(.LCPI74_2)
; RV64I-NEXT: addi a1, a1, 15		; RV64I-NEXT: ld a4, %lo(.LCPI74_2)(a4)
		; RV64I-NEXT: and a2, a3, a2
; RV64I-NEXT: and a1, a0, a1		; RV64I-NEXT: and a1, a0, a1
; RV64I-NEXT: slli a2, a0, 4
; RV64I-NEXT: lui a3, 983055
; RV64I-NEXT: slli a3, a3, 4
; RV64I-NEXT: addi a3, a3, 15
; RV64I-NEXT: slli a3, a3, 16
; RV64I-NEXT: addi a3, a3, 15
; RV64I-NEXT: slli a3, a3, 12
; RV64I-NEXT: srli a3, a3, 4
; RV64I-NEXT: and a2, a2, a3
; RV64I-NEXT: srli a0, a0, 4		; RV64I-NEXT: srli a0, a0, 4
; RV64I-NEXT: lui a3, 240		; RV64I-NEXT: and a0, a0, a4
; RV64I-NEXT: addiw a3, a3, 15
; RV64I-NEXT: slli a3, a3, 16
; RV64I-NEXT: addi a3, a3, 15
; RV64I-NEXT: slli a3, a3, 20
; RV64I-NEXT: addi a3, a3, 240
; RV64I-NEXT: and a0, a0, a3
; RV64I-NEXT: or a0, a2, a0		; RV64I-NEXT: or a0, a2, a0
; RV64I-NEXT: or a0, a0, a1		; RV64I-NEXT: or a0, a0, a1
; RV64I-NEXT: ret		; RV64I-NEXT: ret
;		;
; RV64ZBP-LABEL: shfl4_i64:		; RV64ZBP-LABEL: shfl4_i64:
; RV64ZBP: # %bb.0:		; RV64ZBP: # %bb.0:
; RV64ZBP-NEXT: zip4.h a0, a0		; RV64ZBP-NEXT: zip4.h a0, a0
; RV64ZBP-NEXT: ret		; RV64ZBP-NEXT: ret
Show All 36 Lines	; RV64ZBP-NEXT: ret
%or = or i32 %and, %and2		%or = or i32 %and, %and2
%or3 = or i32 %or, %and1		%or3 = or i32 %or, %and1
ret i32 %or3		ret i32 %or3
}		}

define i64 @shfl8_i64(i64 %a, i64 %b) nounwind {		define i64 @shfl8_i64(i64 %a, i64 %b) nounwind {
; RV64I-LABEL: shfl8_i64:		; RV64I-LABEL: shfl8_i64:
; RV64I: # %bb.0:		; RV64I: # %bb.0:
; RV64I-NEXT: lui a1, 983041		; RV64I-NEXT: lui a1, %hi(.LCPI76_0)
; RV64I-NEXT: slli a1, a1, 4		; RV64I-NEXT: ld a1, %lo(.LCPI76_0)(a1)
; RV64I-NEXT: addi a1, a1, -1
; RV64I-NEXT: slli a1, a1, 24
; RV64I-NEXT: addi a1, a1, 255
; RV64I-NEXT: and a1, a0, a1
; RV64I-NEXT: slli a2, a0, 8		; RV64I-NEXT: slli a2, a0, 8
; RV64I-NEXT: li a3, 255		; RV64I-NEXT: li a3, 255
; RV64I-NEXT: slli a4, a3, 32		; RV64I-NEXT: slli a3, a3, 32
; RV64I-NEXT: addi a4, a4, 255		; RV64I-NEXT: addi a3, a3, 255
; RV64I-NEXT: slli a4, a4, 16
; RV64I-NEXT: and a2, a2, a4
; RV64I-NEXT: srli a0, a0, 8
; RV64I-NEXT: slli a3, a3, 24
; RV64I-NEXT: addi a3, a3, 1
; RV64I-NEXT: slli a3, a3, 16		; RV64I-NEXT: slli a3, a3, 16
; RV64I-NEXT: addi a3, a3, -256		; RV64I-NEXT: lui a4, %hi(.LCPI76_1)
; RV64I-NEXT: and a0, a0, a3		; RV64I-NEXT: ld a4, %lo(.LCPI76_1)(a4)
		; RV64I-NEXT: and a2, a2, a3
		; RV64I-NEXT: and a1, a0, a1
		; RV64I-NEXT: srli a0, a0, 8
		; RV64I-NEXT: and a0, a0, a4
; RV64I-NEXT: or a0, a0, a1		; RV64I-NEXT: or a0, a0, a1
; RV64I-NEXT: or a0, a2, a0		; RV64I-NEXT: or a0, a2, a0
; RV64I-NEXT: ret		; RV64I-NEXT: ret
;		;
; RV64ZBP-LABEL: shfl8_i64:		; RV64ZBP-LABEL: shfl8_i64:
; RV64ZBP: # %bb.0:		; RV64ZBP: # %bb.0:
; RV64ZBP-NEXT: zip8.w a0, a0		; RV64ZBP-NEXT: zip8.w a0, a0
; RV64ZBP-NEXT: ret		; RV64ZBP-NEXT: ret
%and = and i64 %a, -72056494543077121		%and = and i64 %a, -72056494543077121
%shl = shl i64 %a, 8		%shl = shl i64 %a, 8
%and1 = and i64 %shl, 71776119077928960		%and1 = and i64 %shl, 71776119077928960
%shr = lshr i64 %a, 8		%shr = lshr i64 %a, 8
%and2 = and i64 %shr, 280375465148160		%and2 = and i64 %shr, 280375465148160
%or = or i64 %and2, %and		%or = or i64 %and2, %and
%or3 = or i64 %and1, %or		%or3 = or i64 %and1, %or
ret i64 %or3		ret i64 %or3
}		}

define i64 @shfl16(i64 %a, i64 %b) nounwind {		define i64 @shfl16(i64 %a, i64 %b) nounwind {
; RV64I-LABEL: shfl16:		; RV64I-LABEL: shfl16:
; RV64I: # %bb.0:		; RV64I: # %bb.0:
; RV64I-NEXT: li a1, -1		; RV64I-NEXT: lui a1, %hi(.LCPI77_0)
; RV64I-NEXT: slli a1, a1, 32		; RV64I-NEXT: ld a1, %lo(.LCPI77_0)(a1)
; RV64I-NEXT: addi a1, a1, 1
; RV64I-NEXT: slli a1, a1, 16
; RV64I-NEXT: addi a1, a1, -1
; RV64I-NEXT: and a1, a0, a1		; RV64I-NEXT: and a1, a0, a1
; RV64I-NEXT: srliw a2, a0, 16		; RV64I-NEXT: srliw a2, a0, 16
; RV64I-NEXT: slli a2, a2, 32		; RV64I-NEXT: slli a2, a2, 32
; RV64I-NEXT: or a1, a2, a1		; RV64I-NEXT: or a1, a2, a1
; RV64I-NEXT: srli a0, a0, 16		; RV64I-NEXT: srli a0, a0, 16
; RV64I-NEXT: lui a2, 65535		; RV64I-NEXT: lui a2, 65535
; RV64I-NEXT: slli a2, a2, 4		; RV64I-NEXT: slli a2, a2, 4
; RV64I-NEXT: and a0, a0, a2		; RV64I-NEXT: and a0, a0, a2
▲ Show 20 Lines • Show All 166 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/rvv/bitreverse-sdnode.ll

	Show First 20 Lines • Show All 1,084 Lines • ▼ Show 20 Lines
	; RV64-NEXT: slli a3, a2, 40			; RV64-NEXT: slli a3, a2, 40
	; RV64-NEXT: vand.vx v11, v11, a3			; RV64-NEXT: vand.vx v11, v11, a3
	; RV64-NEXT: vor.vv v10, v11, v10			; RV64-NEXT: vor.vv v10, v11, v10
	; RV64-NEXT: vsll.vx v11, v8, a0			; RV64-NEXT: vsll.vx v11, v8, a0
	; RV64-NEXT: vsll.vx v8, v8, a1			; RV64-NEXT: vsll.vx v8, v8, a1
	; RV64-NEXT: slli a0, a2, 48			; RV64-NEXT: slli a0, a2, 48
	; RV64-NEXT: vand.vx v8, v8, a0			; RV64-NEXT: vand.vx v8, v8, a0
	; RV64-NEXT: vor.vv v8, v11, v8			; RV64-NEXT: vor.vv v8, v11, v8
				; RV64-NEXT: lui a0, %hi(.LCPI18_0)
				; RV64-NEXT: ld a0, %lo(.LCPI18_0)(a0)
	; RV64-NEXT: vor.vv v8, v8, v10			; RV64-NEXT: vor.vv v8, v8, v10
	; RV64-NEXT: vor.vv v8, v8, v9			; RV64-NEXT: vor.vv v8, v8, v9
	; RV64-NEXT: vsrl.vi v9, v8, 4			; RV64-NEXT: vsrl.vi v9, v8, 4
	; RV64-NEXT: lui a0, 3855
	; RV64-NEXT: addiw a0, a0, 241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, -241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, -241
	; RV64-NEXT: vand.vx v9, v9, a0			; RV64-NEXT: vand.vx v9, v9, a0
	; RV64-NEXT: vand.vx v8, v8, a0			; RV64-NEXT: vand.vx v8, v8, a0
				; RV64-NEXT: lui a0, %hi(.LCPI18_1)
				; RV64-NEXT: ld a0, %lo(.LCPI18_1)(a0)
	; RV64-NEXT: vsll.vi v8, v8, 4			; RV64-NEXT: vsll.vi v8, v8, 4
	; RV64-NEXT: vor.vv v8, v9, v8			; RV64-NEXT: vor.vv v8, v9, v8
	; RV64-NEXT: vsrl.vi v9, v8, 2			; RV64-NEXT: vsrl.vi v9, v8, 2
	; RV64-NEXT: lui a0, 13107
	; RV64-NEXT: addiw a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: vand.vx v9, v9, a0			; RV64-NEXT: vand.vx v9, v9, a0
	; RV64-NEXT: vand.vx v8, v8, a0			; RV64-NEXT: vand.vx v8, v8, a0
				; RV64-NEXT: lui a0, %hi(.LCPI18_2)
				; RV64-NEXT: ld a0, %lo(.LCPI18_2)(a0)
	; RV64-NEXT: vsll.vi v8, v8, 2			; RV64-NEXT: vsll.vi v8, v8, 2
	; RV64-NEXT: vor.vv v8, v9, v8			; RV64-NEXT: vor.vv v8, v9, v8
	; RV64-NEXT: vsrl.vi v9, v8, 1			; RV64-NEXT: vsrl.vi v9, v8, 1
	; RV64-NEXT: lui a0, 21845
	; RV64-NEXT: addiw a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: vand.vx v9, v9, a0			; RV64-NEXT: vand.vx v9, v9, a0
	; RV64-NEXT: vand.vx v8, v8, a0			; RV64-NEXT: vand.vx v8, v8, a0
	; RV64-NEXT: vadd.vv v8, v8, v8			; RV64-NEXT: vadd.vv v8, v8, v8
	; RV64-NEXT: vor.vv v8, v9, v8			; RV64-NEXT: vor.vv v8, v9, v8
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%a = call <vscale x 1 x i64> @llvm.bitreverse.nxv1i64(<vscale x 1 x i64> %va)			%a = call <vscale x 1 x i64> @llvm.bitreverse.nxv1i64(<vscale x 1 x i64> %va)
	ret <vscale x 1 x i64> %a			ret <vscale x 1 x i64> %a
	}			}
	▲ Show 20 Lines • Show All 110 Lines • ▼ Show 20 Lines
	; RV64-NEXT: slli a3, a2, 40			; RV64-NEXT: slli a3, a2, 40
	; RV64-NEXT: vand.vx v14, v14, a3			; RV64-NEXT: vand.vx v14, v14, a3
	; RV64-NEXT: vor.vv v12, v14, v12			; RV64-NEXT: vor.vv v12, v14, v12
	; RV64-NEXT: vsll.vx v14, v8, a0			; RV64-NEXT: vsll.vx v14, v8, a0
	; RV64-NEXT: vsll.vx v8, v8, a1			; RV64-NEXT: vsll.vx v8, v8, a1
	; RV64-NEXT: slli a0, a2, 48			; RV64-NEXT: slli a0, a2, 48
	; RV64-NEXT: vand.vx v8, v8, a0			; RV64-NEXT: vand.vx v8, v8, a0
	; RV64-NEXT: vor.vv v8, v14, v8			; RV64-NEXT: vor.vv v8, v14, v8
				; RV64-NEXT: lui a0, %hi(.LCPI19_0)
				; RV64-NEXT: ld a0, %lo(.LCPI19_0)(a0)
	; RV64-NEXT: vor.vv v8, v8, v12			; RV64-NEXT: vor.vv v8, v8, v12
	; RV64-NEXT: vor.vv v8, v8, v10			; RV64-NEXT: vor.vv v8, v8, v10
	; RV64-NEXT: vsrl.vi v10, v8, 4			; RV64-NEXT: vsrl.vi v10, v8, 4
	; RV64-NEXT: lui a0, 3855
	; RV64-NEXT: addiw a0, a0, 241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, -241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, -241
	; RV64-NEXT: vand.vx v10, v10, a0			; RV64-NEXT: vand.vx v10, v10, a0
	; RV64-NEXT: vand.vx v8, v8, a0			; RV64-NEXT: vand.vx v8, v8, a0
				; RV64-NEXT: lui a0, %hi(.LCPI19_1)
				; RV64-NEXT: ld a0, %lo(.LCPI19_1)(a0)
	; RV64-NEXT: vsll.vi v8, v8, 4			; RV64-NEXT: vsll.vi v8, v8, 4
	; RV64-NEXT: vor.vv v8, v10, v8			; RV64-NEXT: vor.vv v8, v10, v8
	; RV64-NEXT: vsrl.vi v10, v8, 2			; RV64-NEXT: vsrl.vi v10, v8, 2
	; RV64-NEXT: lui a0, 13107
	; RV64-NEXT: addiw a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: vand.vx v10, v10, a0			; RV64-NEXT: vand.vx v10, v10, a0
	; RV64-NEXT: vand.vx v8, v8, a0			; RV64-NEXT: vand.vx v8, v8, a0
				; RV64-NEXT: lui a0, %hi(.LCPI19_2)
				; RV64-NEXT: ld a0, %lo(.LCPI19_2)(a0)
	; RV64-NEXT: vsll.vi v8, v8, 2			; RV64-NEXT: vsll.vi v8, v8, 2
	; RV64-NEXT: vor.vv v8, v10, v8			; RV64-NEXT: vor.vv v8, v10, v8
	; RV64-NEXT: vsrl.vi v10, v8, 1			; RV64-NEXT: vsrl.vi v10, v8, 1
	; RV64-NEXT: lui a0, 21845
	; RV64-NEXT: addiw a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: vand.vx v10, v10, a0			; RV64-NEXT: vand.vx v10, v10, a0
	; RV64-NEXT: vand.vx v8, v8, a0			; RV64-NEXT: vand.vx v8, v8, a0
	; RV64-NEXT: vadd.vv v8, v8, v8			; RV64-NEXT: vadd.vv v8, v8, v8
	; RV64-NEXT: vor.vv v8, v10, v8			; RV64-NEXT: vor.vv v8, v10, v8
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%a = call <vscale x 2 x i64> @llvm.bitreverse.nxv2i64(<vscale x 2 x i64> %va)			%a = call <vscale x 2 x i64> @llvm.bitreverse.nxv2i64(<vscale x 2 x i64> %va)
	ret <vscale x 2 x i64> %a			ret <vscale x 2 x i64> %a
	}			}
	▲ Show 20 Lines • Show All 110 Lines • ▼ Show 20 Lines
	; RV64-NEXT: slli a3, a2, 40			; RV64-NEXT: slli a3, a2, 40
	; RV64-NEXT: vand.vx v20, v20, a3			; RV64-NEXT: vand.vx v20, v20, a3
	; RV64-NEXT: vor.vv v16, v20, v16			; RV64-NEXT: vor.vv v16, v20, v16
	; RV64-NEXT: vsll.vx v20, v8, a0			; RV64-NEXT: vsll.vx v20, v8, a0
	; RV64-NEXT: vsll.vx v8, v8, a1			; RV64-NEXT: vsll.vx v8, v8, a1
	; RV64-NEXT: slli a0, a2, 48			; RV64-NEXT: slli a0, a2, 48
	; RV64-NEXT: vand.vx v8, v8, a0			; RV64-NEXT: vand.vx v8, v8, a0
	; RV64-NEXT: vor.vv v8, v20, v8			; RV64-NEXT: vor.vv v8, v20, v8
				; RV64-NEXT: lui a0, %hi(.LCPI20_0)
				; RV64-NEXT: ld a0, %lo(.LCPI20_0)(a0)
	; RV64-NEXT: vor.vv v8, v8, v16			; RV64-NEXT: vor.vv v8, v8, v16
	; RV64-NEXT: vor.vv v8, v8, v12			; RV64-NEXT: vor.vv v8, v8, v12
	; RV64-NEXT: vsrl.vi v12, v8, 4			; RV64-NEXT: vsrl.vi v12, v8, 4
	; RV64-NEXT: lui a0, 3855
	; RV64-NEXT: addiw a0, a0, 241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, -241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, -241
	; RV64-NEXT: vand.vx v12, v12, a0			; RV64-NEXT: vand.vx v12, v12, a0
	; RV64-NEXT: vand.vx v8, v8, a0			; RV64-NEXT: vand.vx v8, v8, a0
				; RV64-NEXT: lui a0, %hi(.LCPI20_1)
				; RV64-NEXT: ld a0, %lo(.LCPI20_1)(a0)
	; RV64-NEXT: vsll.vi v8, v8, 4			; RV64-NEXT: vsll.vi v8, v8, 4
	; RV64-NEXT: vor.vv v8, v12, v8			; RV64-NEXT: vor.vv v8, v12, v8
	; RV64-NEXT: vsrl.vi v12, v8, 2			; RV64-NEXT: vsrl.vi v12, v8, 2
	; RV64-NEXT: lui a0, 13107
	; RV64-NEXT: addiw a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: vand.vx v12, v12, a0			; RV64-NEXT: vand.vx v12, v12, a0
	; RV64-NEXT: vand.vx v8, v8, a0			; RV64-NEXT: vand.vx v8, v8, a0
				; RV64-NEXT: lui a0, %hi(.LCPI20_2)
				; RV64-NEXT: ld a0, %lo(.LCPI20_2)(a0)
	; RV64-NEXT: vsll.vi v8, v8, 2			; RV64-NEXT: vsll.vi v8, v8, 2
	; RV64-NEXT: vor.vv v8, v12, v8			; RV64-NEXT: vor.vv v8, v12, v8
	; RV64-NEXT: vsrl.vi v12, v8, 1			; RV64-NEXT: vsrl.vi v12, v8, 1
	; RV64-NEXT: lui a0, 21845
	; RV64-NEXT: addiw a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: vand.vx v12, v12, a0			; RV64-NEXT: vand.vx v12, v12, a0
	; RV64-NEXT: vand.vx v8, v8, a0			; RV64-NEXT: vand.vx v8, v8, a0
	; RV64-NEXT: vadd.vv v8, v8, v8			; RV64-NEXT: vadd.vv v8, v8, v8
	; RV64-NEXT: vor.vv v8, v12, v8			; RV64-NEXT: vor.vv v8, v12, v8
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%a = call <vscale x 4 x i64> @llvm.bitreverse.nxv4i64(<vscale x 4 x i64> %va)			%a = call <vscale x 4 x i64> @llvm.bitreverse.nxv4i64(<vscale x 4 x i64> %va)
	ret <vscale x 4 x i64> %a			ret <vscale x 4 x i64> %a
	}			}
	▲ Show 20 Lines • Show All 140 Lines • ▼ Show 20 Lines
	; RV64-NEXT: slli a3, a2, 40			; RV64-NEXT: slli a3, a2, 40
	; RV64-NEXT: vand.vx v0, v0, a3			; RV64-NEXT: vand.vx v0, v0, a3
	; RV64-NEXT: vor.vv v24, v0, v24			; RV64-NEXT: vor.vv v24, v0, v24
	; RV64-NEXT: vsll.vx v0, v8, a0			; RV64-NEXT: vsll.vx v0, v8, a0
	; RV64-NEXT: vsll.vx v8, v8, a1			; RV64-NEXT: vsll.vx v8, v8, a1
	; RV64-NEXT: slli a0, a2, 48			; RV64-NEXT: slli a0, a2, 48
	; RV64-NEXT: vand.vx v8, v8, a0			; RV64-NEXT: vand.vx v8, v8, a0
	; RV64-NEXT: vor.vv v8, v0, v8			; RV64-NEXT: vor.vv v8, v0, v8
				; RV64-NEXT: lui a0, %hi(.LCPI21_0)
				; RV64-NEXT: ld a0, %lo(.LCPI21_0)(a0)
	; RV64-NEXT: vor.vv v8, v8, v24			; RV64-NEXT: vor.vv v8, v8, v24
	; RV64-NEXT: vor.vv v8, v8, v16			; RV64-NEXT: vor.vv v8, v8, v16
	; RV64-NEXT: vsrl.vi v16, v8, 4			; RV64-NEXT: vsrl.vi v16, v8, 4
	; RV64-NEXT: lui a0, 3855
	; RV64-NEXT: addiw a0, a0, 241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, -241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, -241
	; RV64-NEXT: vand.vx v16, v16, a0			; RV64-NEXT: vand.vx v16, v16, a0
	; RV64-NEXT: vand.vx v8, v8, a0			; RV64-NEXT: vand.vx v8, v8, a0
				; RV64-NEXT: lui a0, %hi(.LCPI21_1)
				; RV64-NEXT: ld a0, %lo(.LCPI21_1)(a0)
	; RV64-NEXT: vsll.vi v8, v8, 4			; RV64-NEXT: vsll.vi v8, v8, 4
	; RV64-NEXT: vor.vv v8, v16, v8			; RV64-NEXT: vor.vv v8, v16, v8
	; RV64-NEXT: vsrl.vi v16, v8, 2			; RV64-NEXT: vsrl.vi v16, v8, 2
	; RV64-NEXT: lui a0, 13107
	; RV64-NEXT: addiw a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: vand.vx v16, v16, a0			; RV64-NEXT: vand.vx v16, v16, a0
	; RV64-NEXT: vand.vx v8, v8, a0			; RV64-NEXT: vand.vx v8, v8, a0
				; RV64-NEXT: lui a0, %hi(.LCPI21_2)
				; RV64-NEXT: ld a0, %lo(.LCPI21_2)(a0)
	; RV64-NEXT: vsll.vi v8, v8, 2			; RV64-NEXT: vsll.vi v8, v8, 2
	; RV64-NEXT: vor.vv v8, v16, v8			; RV64-NEXT: vor.vv v8, v16, v8
	; RV64-NEXT: vsrl.vi v16, v8, 1			; RV64-NEXT: vsrl.vi v16, v8, 1
	; RV64-NEXT: lui a0, 21845
	; RV64-NEXT: addiw a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: vand.vx v16, v16, a0			; RV64-NEXT: vand.vx v16, v16, a0
	; RV64-NEXT: vand.vx v8, v8, a0			; RV64-NEXT: vand.vx v8, v8, a0
	; RV64-NEXT: vadd.vv v8, v8, v8			; RV64-NEXT: vadd.vv v8, v8, v8
	; RV64-NEXT: vor.vv v8, v16, v8			; RV64-NEXT: vor.vv v8, v16, v8
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%a = call <vscale x 8 x i64> @llvm.bitreverse.nxv8i64(<vscale x 8 x i64> %va)			%a = call <vscale x 8 x i64> @llvm.bitreverse.nxv8i64(<vscale x 8 x i64> %va)
	ret <vscale x 8 x i64> %a			ret <vscale x 8 x i64> %a
	}			}
	declare <vscale x 8 x i64> @llvm.bitreverse.nxv8i64(<vscale x 8 x i64>)			declare <vscale x 8 x i64> @llvm.bitreverse.nxv8i64(<vscale x 8 x i64>)

llvm/test/CodeGen/RISCV/rvv/ctlz-sdnode.ll

	Show First 20 Lines • Show All 1,647 Lines • ▼ Show 20 Lines
	; RV64-NEXT: vsrl.vi v9, v8, 8			; RV64-NEXT: vsrl.vi v9, v8, 8
	; RV64-NEXT: vor.vv v8, v8, v9			; RV64-NEXT: vor.vv v8, v8, v9
	; RV64-NEXT: vsrl.vi v9, v8, 16			; RV64-NEXT: vsrl.vi v9, v8, 16
	; RV64-NEXT: vor.vv v8, v8, v9			; RV64-NEXT: vor.vv v8, v8, v9
	; RV64-NEXT: li a0, 32			; RV64-NEXT: li a0, 32
	; RV64-NEXT: vsrl.vx v9, v8, a0			; RV64-NEXT: vsrl.vx v9, v8, a0
	; RV64-NEXT: vor.vv v8, v8, v9			; RV64-NEXT: vor.vv v8, v8, v9
	; RV64-NEXT: vxor.vi v8, v8, -1			; RV64-NEXT: vxor.vi v8, v8, -1
				; RV64-NEXT: lui a0, %hi(.LCPI18_0)
				; RV64-NEXT: ld a0, %lo(.LCPI18_0)(a0)
				; RV64-NEXT: lui a1, %hi(.LCPI18_1)
				; RV64-NEXT: ld a1, %lo(.LCPI18_1)(a1)
	; RV64-NEXT: vsrl.vi v9, v8, 1			; RV64-NEXT: vsrl.vi v9, v8, 1
	; RV64-NEXT: lui a0, 21845
	; RV64-NEXT: addiw a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: vand.vx v9, v9, a0			; RV64-NEXT: vand.vx v9, v9, a0
	; RV64-NEXT: vsub.vv v8, v8, v9			; RV64-NEXT: vsub.vv v8, v8, v9
	; RV64-NEXT: lui a0, 13107			; RV64-NEXT: vand.vx v9, v8, a1
	; RV64-NEXT: addiw a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: vand.vx v9, v8, a0
	; RV64-NEXT: vsrl.vi v8, v8, 2			; RV64-NEXT: vsrl.vi v8, v8, 2
	; RV64-NEXT: vand.vx v8, v8, a0			; RV64-NEXT: vand.vx v8, v8, a1
	; RV64-NEXT: vadd.vv v8, v9, v8			; RV64-NEXT: vadd.vv v8, v9, v8
				; RV64-NEXT: lui a0, %hi(.LCPI18_2)
				; RV64-NEXT: ld a0, %lo(.LCPI18_2)(a0)
				; RV64-NEXT: lui a1, %hi(.LCPI18_3)
				; RV64-NEXT: ld a1, %lo(.LCPI18_3)(a1)
	; RV64-NEXT: vsrl.vi v9, v8, 4			; RV64-NEXT: vsrl.vi v9, v8, 4
	; RV64-NEXT: vadd.vv v8, v8, v9			; RV64-NEXT: vadd.vv v8, v8, v9
	; RV64-NEXT: lui a0, 3855
	; RV64-NEXT: addiw a0, a0, 241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, -241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, -241
	; RV64-NEXT: vand.vx v8, v8, a0			; RV64-NEXT: vand.vx v8, v8, a0
	; RV64-NEXT: lui a0, 4112			; RV64-NEXT: vmul.vx v8, v8, a1
	; RV64-NEXT: addiw a0, a0, 257
	; RV64-NEXT: slli a0, a0, 16
	; RV64-NEXT: addi a0, a0, 257
	; RV64-NEXT: slli a0, a0, 16
	; RV64-NEXT: addi a0, a0, 257
	; RV64-NEXT: vmul.vx v8, v8, a0
	; RV64-NEXT: li a0, 56			; RV64-NEXT: li a0, 56
	; RV64-NEXT: vsrl.vx v8, v8, a0			; RV64-NEXT: vsrl.vx v8, v8, a0
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%a = call <vscale x 1 x i64> @llvm.ctlz.nxv1i64(<vscale x 1 x i64> %va, i1 false)			%a = call <vscale x 1 x i64> @llvm.ctlz.nxv1i64(<vscale x 1 x i64> %va, i1 false)
	ret <vscale x 1 x i64> %a			ret <vscale x 1 x i64> %a
	}			}
	declare <vscale x 1 x i64> @llvm.ctlz.nxv1i64(<vscale x 1 x i64>, i1)			declare <vscale x 1 x i64> @llvm.ctlz.nxv1i64(<vscale x 1 x i64>, i1)

	▲ Show 20 Lines • Show All 69 Lines • ▼ Show 20 Lines
	; RV64-NEXT: vsrl.vi v10, v8, 8			; RV64-NEXT: vsrl.vi v10, v8, 8
	; RV64-NEXT: vor.vv v8, v8, v10			; RV64-NEXT: vor.vv v8, v8, v10
	; RV64-NEXT: vsrl.vi v10, v8, 16			; RV64-NEXT: vsrl.vi v10, v8, 16
	; RV64-NEXT: vor.vv v8, v8, v10			; RV64-NEXT: vor.vv v8, v8, v10
	; RV64-NEXT: li a0, 32			; RV64-NEXT: li a0, 32
	; RV64-NEXT: vsrl.vx v10, v8, a0			; RV64-NEXT: vsrl.vx v10, v8, a0
	; RV64-NEXT: vor.vv v8, v8, v10			; RV64-NEXT: vor.vv v8, v8, v10
	; RV64-NEXT: vxor.vi v8, v8, -1			; RV64-NEXT: vxor.vi v8, v8, -1
				; RV64-NEXT: lui a0, %hi(.LCPI19_0)
				; RV64-NEXT: ld a0, %lo(.LCPI19_0)(a0)
				; RV64-NEXT: lui a1, %hi(.LCPI19_1)
				; RV64-NEXT: ld a1, %lo(.LCPI19_1)(a1)
	; RV64-NEXT: vsrl.vi v10, v8, 1			; RV64-NEXT: vsrl.vi v10, v8, 1
	; RV64-NEXT: lui a0, 21845
	; RV64-NEXT: addiw a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: vand.vx v10, v10, a0			; RV64-NEXT: vand.vx v10, v10, a0
	; RV64-NEXT: vsub.vv v8, v8, v10			; RV64-NEXT: vsub.vv v8, v8, v10
	; RV64-NEXT: lui a0, 13107			; RV64-NEXT: vand.vx v10, v8, a1
	; RV64-NEXT: addiw a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: vand.vx v10, v8, a0
	; RV64-NEXT: vsrl.vi v8, v8, 2			; RV64-NEXT: vsrl.vi v8, v8, 2
	; RV64-NEXT: vand.vx v8, v8, a0			; RV64-NEXT: vand.vx v8, v8, a1
	; RV64-NEXT: vadd.vv v8, v10, v8			; RV64-NEXT: vadd.vv v8, v10, v8
				; RV64-NEXT: lui a0, %hi(.LCPI19_2)
				; RV64-NEXT: ld a0, %lo(.LCPI19_2)(a0)
				; RV64-NEXT: lui a1, %hi(.LCPI19_3)
				; RV64-NEXT: ld a1, %lo(.LCPI19_3)(a1)
	; RV64-NEXT: vsrl.vi v10, v8, 4			; RV64-NEXT: vsrl.vi v10, v8, 4
	; RV64-NEXT: vadd.vv v8, v8, v10			; RV64-NEXT: vadd.vv v8, v8, v10
	; RV64-NEXT: lui a0, 3855
	; RV64-NEXT: addiw a0, a0, 241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, -241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, -241
	; RV64-NEXT: vand.vx v8, v8, a0			; RV64-NEXT: vand.vx v8, v8, a0
	; RV64-NEXT: lui a0, 4112			; RV64-NEXT: vmul.vx v8, v8, a1
	; RV64-NEXT: addiw a0, a0, 257
	; RV64-NEXT: slli a0, a0, 16
	; RV64-NEXT: addi a0, a0, 257
	; RV64-NEXT: slli a0, a0, 16
	; RV64-NEXT: addi a0, a0, 257
	; RV64-NEXT: vmul.vx v8, v8, a0
	; RV64-NEXT: li a0, 56			; RV64-NEXT: li a0, 56
	; RV64-NEXT: vsrl.vx v8, v8, a0			; RV64-NEXT: vsrl.vx v8, v8, a0
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%a = call <vscale x 2 x i64> @llvm.ctlz.nxv2i64(<vscale x 2 x i64> %va, i1 false)			%a = call <vscale x 2 x i64> @llvm.ctlz.nxv2i64(<vscale x 2 x i64> %va, i1 false)
	ret <vscale x 2 x i64> %a			ret <vscale x 2 x i64> %a
	}			}
	declare <vscale x 2 x i64> @llvm.ctlz.nxv2i64(<vscale x 2 x i64>, i1)			declare <vscale x 2 x i64> @llvm.ctlz.nxv2i64(<vscale x 2 x i64>, i1)

	▲ Show 20 Lines • Show All 69 Lines • ▼ Show 20 Lines
	; RV64-NEXT: vsrl.vi v12, v8, 8			; RV64-NEXT: vsrl.vi v12, v8, 8
	; RV64-NEXT: vor.vv v8, v8, v12			; RV64-NEXT: vor.vv v8, v8, v12
	; RV64-NEXT: vsrl.vi v12, v8, 16			; RV64-NEXT: vsrl.vi v12, v8, 16
	; RV64-NEXT: vor.vv v8, v8, v12			; RV64-NEXT: vor.vv v8, v8, v12
	; RV64-NEXT: li a0, 32			; RV64-NEXT: li a0, 32
	; RV64-NEXT: vsrl.vx v12, v8, a0			; RV64-NEXT: vsrl.vx v12, v8, a0
	; RV64-NEXT: vor.vv v8, v8, v12			; RV64-NEXT: vor.vv v8, v8, v12
	; RV64-NEXT: vxor.vi v8, v8, -1			; RV64-NEXT: vxor.vi v8, v8, -1
				; RV64-NEXT: lui a0, %hi(.LCPI20_0)
				; RV64-NEXT: ld a0, %lo(.LCPI20_0)(a0)
				; RV64-NEXT: lui a1, %hi(.LCPI20_1)
				; RV64-NEXT: ld a1, %lo(.LCPI20_1)(a1)
	; RV64-NEXT: vsrl.vi v12, v8, 1			; RV64-NEXT: vsrl.vi v12, v8, 1
	; RV64-NEXT: lui a0, 21845
	; RV64-NEXT: addiw a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: vand.vx v12, v12, a0			; RV64-NEXT: vand.vx v12, v12, a0
	; RV64-NEXT: vsub.vv v8, v8, v12			; RV64-NEXT: vsub.vv v8, v8, v12
	; RV64-NEXT: lui a0, 13107			; RV64-NEXT: vand.vx v12, v8, a1
	; RV64-NEXT: addiw a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: vand.vx v12, v8, a0
	; RV64-NEXT: vsrl.vi v8, v8, 2			; RV64-NEXT: vsrl.vi v8, v8, 2
	; RV64-NEXT: vand.vx v8, v8, a0			; RV64-NEXT: vand.vx v8, v8, a1
	; RV64-NEXT: vadd.vv v8, v12, v8			; RV64-NEXT: vadd.vv v8, v12, v8
				; RV64-NEXT: lui a0, %hi(.LCPI20_2)
				; RV64-NEXT: ld a0, %lo(.LCPI20_2)(a0)
				; RV64-NEXT: lui a1, %hi(.LCPI20_3)
				; RV64-NEXT: ld a1, %lo(.LCPI20_3)(a1)
	; RV64-NEXT: vsrl.vi v12, v8, 4			; RV64-NEXT: vsrl.vi v12, v8, 4
	; RV64-NEXT: vadd.vv v8, v8, v12			; RV64-NEXT: vadd.vv v8, v8, v12
	; RV64-NEXT: lui a0, 3855
	; RV64-NEXT: addiw a0, a0, 241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, -241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, -241
	; RV64-NEXT: vand.vx v8, v8, a0			; RV64-NEXT: vand.vx v8, v8, a0
	; RV64-NEXT: lui a0, 4112			; RV64-NEXT: vmul.vx v8, v8, a1
	; RV64-NEXT: addiw a0, a0, 257
	; RV64-NEXT: slli a0, a0, 16
	; RV64-NEXT: addi a0, a0, 257
	; RV64-NEXT: slli a0, a0, 16
	; RV64-NEXT: addi a0, a0, 257
	; RV64-NEXT: vmul.vx v8, v8, a0
	; RV64-NEXT: li a0, 56			; RV64-NEXT: li a0, 56
	; RV64-NEXT: vsrl.vx v8, v8, a0			; RV64-NEXT: vsrl.vx v8, v8, a0
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%a = call <vscale x 4 x i64> @llvm.ctlz.nxv4i64(<vscale x 4 x i64> %va, i1 false)			%a = call <vscale x 4 x i64> @llvm.ctlz.nxv4i64(<vscale x 4 x i64> %va, i1 false)
	ret <vscale x 4 x i64> %a			ret <vscale x 4 x i64> %a
	}			}
	declare <vscale x 4 x i64> @llvm.ctlz.nxv4i64(<vscale x 4 x i64>, i1)			declare <vscale x 4 x i64> @llvm.ctlz.nxv4i64(<vscale x 4 x i64>, i1)

	▲ Show 20 Lines • Show All 69 Lines • ▼ Show 20 Lines
	; RV64-NEXT: vsrl.vi v16, v8, 8			; RV64-NEXT: vsrl.vi v16, v8, 8
	; RV64-NEXT: vor.vv v8, v8, v16			; RV64-NEXT: vor.vv v8, v8, v16
	; RV64-NEXT: vsrl.vi v16, v8, 16			; RV64-NEXT: vsrl.vi v16, v8, 16
	; RV64-NEXT: vor.vv v8, v8, v16			; RV64-NEXT: vor.vv v8, v8, v16
	; RV64-NEXT: li a0, 32			; RV64-NEXT: li a0, 32
	; RV64-NEXT: vsrl.vx v16, v8, a0			; RV64-NEXT: vsrl.vx v16, v8, a0
	; RV64-NEXT: vor.vv v8, v8, v16			; RV64-NEXT: vor.vv v8, v8, v16
	; RV64-NEXT: vxor.vi v8, v8, -1			; RV64-NEXT: vxor.vi v8, v8, -1
				; RV64-NEXT: lui a0, %hi(.LCPI21_0)
				; RV64-NEXT: ld a0, %lo(.LCPI21_0)(a0)
				; RV64-NEXT: lui a1, %hi(.LCPI21_1)
				; RV64-NEXT: ld a1, %lo(.LCPI21_1)(a1)
	; RV64-NEXT: vsrl.vi v16, v8, 1			; RV64-NEXT: vsrl.vi v16, v8, 1
	; RV64-NEXT: lui a0, 21845
	; RV64-NEXT: addiw a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: vand.vx v16, v16, a0			; RV64-NEXT: vand.vx v16, v16, a0
	; RV64-NEXT: vsub.vv v8, v8, v16			; RV64-NEXT: vsub.vv v8, v8, v16
	; RV64-NEXT: lui a0, 13107			; RV64-NEXT: vand.vx v16, v8, a1
	; RV64-NEXT: addiw a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: vand.vx v16, v8, a0
	; RV64-NEXT: vsrl.vi v8, v8, 2			; RV64-NEXT: vsrl.vi v8, v8, 2
	; RV64-NEXT: vand.vx v8, v8, a0			; RV64-NEXT: vand.vx v8, v8, a1
	; RV64-NEXT: vadd.vv v8, v16, v8			; RV64-NEXT: vadd.vv v8, v16, v8
				; RV64-NEXT: lui a0, %hi(.LCPI21_2)
				; RV64-NEXT: ld a0, %lo(.LCPI21_2)(a0)
				; RV64-NEXT: lui a1, %hi(.LCPI21_3)
				; RV64-NEXT: ld a1, %lo(.LCPI21_3)(a1)
	; RV64-NEXT: vsrl.vi v16, v8, 4			; RV64-NEXT: vsrl.vi v16, v8, 4
	; RV64-NEXT: vadd.vv v8, v8, v16			; RV64-NEXT: vadd.vv v8, v8, v16
	; RV64-NEXT: lui a0, 3855
	; RV64-NEXT: addiw a0, a0, 241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, -241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, -241
	; RV64-NEXT: vand.vx v8, v8, a0			; RV64-NEXT: vand.vx v8, v8, a0
	; RV64-NEXT: lui a0, 4112			; RV64-NEXT: vmul.vx v8, v8, a1
	; RV64-NEXT: addiw a0, a0, 257
	; RV64-NEXT: slli a0, a0, 16
	; RV64-NEXT: addi a0, a0, 257
	; RV64-NEXT: slli a0, a0, 16
	; RV64-NEXT: addi a0, a0, 257
	; RV64-NEXT: vmul.vx v8, v8, a0
	; RV64-NEXT: li a0, 56			; RV64-NEXT: li a0, 56
	; RV64-NEXT: vsrl.vx v8, v8, a0			; RV64-NEXT: vsrl.vx v8, v8, a0
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%a = call <vscale x 8 x i64> @llvm.ctlz.nxv8i64(<vscale x 8 x i64> %va, i1 false)			%a = call <vscale x 8 x i64> @llvm.ctlz.nxv8i64(<vscale x 8 x i64> %va, i1 false)
	ret <vscale x 8 x i64> %a			ret <vscale x 8 x i64> %a
	}			}
	declare <vscale x 8 x i64> @llvm.ctlz.nxv8i64(<vscale x 8 x i64>, i1)			declare <vscale x 8 x i64> @llvm.ctlz.nxv8i64(<vscale x 8 x i64>, i1)

	▲ Show 20 Lines • Show All 1,549 Lines • ▼ Show 20 Lines
	; RV64-NEXT: vsrl.vi v9, v8, 8			; RV64-NEXT: vsrl.vi v9, v8, 8
	; RV64-NEXT: vor.vv v8, v8, v9			; RV64-NEXT: vor.vv v8, v8, v9
	; RV64-NEXT: vsrl.vi v9, v8, 16			; RV64-NEXT: vsrl.vi v9, v8, 16
	; RV64-NEXT: vor.vv v8, v8, v9			; RV64-NEXT: vor.vv v8, v8, v9
	; RV64-NEXT: li a0, 32			; RV64-NEXT: li a0, 32
	; RV64-NEXT: vsrl.vx v9, v8, a0			; RV64-NEXT: vsrl.vx v9, v8, a0
	; RV64-NEXT: vor.vv v8, v8, v9			; RV64-NEXT: vor.vv v8, v8, v9
	; RV64-NEXT: vxor.vi v8, v8, -1			; RV64-NEXT: vxor.vi v8, v8, -1
				; RV64-NEXT: lui a0, %hi(.LCPI40_0)
				; RV64-NEXT: ld a0, %lo(.LCPI40_0)(a0)
				; RV64-NEXT: lui a1, %hi(.LCPI40_1)
				; RV64-NEXT: ld a1, %lo(.LCPI40_1)(a1)
	; RV64-NEXT: vsrl.vi v9, v8, 1			; RV64-NEXT: vsrl.vi v9, v8, 1
	; RV64-NEXT: lui a0, 21845
	; RV64-NEXT: addiw a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: vand.vx v9, v9, a0			; RV64-NEXT: vand.vx v9, v9, a0
	; RV64-NEXT: vsub.vv v8, v8, v9			; RV64-NEXT: vsub.vv v8, v8, v9
	; RV64-NEXT: lui a0, 13107			; RV64-NEXT: vand.vx v9, v8, a1
	; RV64-NEXT: addiw a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: vand.vx v9, v8, a0
	; RV64-NEXT: vsrl.vi v8, v8, 2			; RV64-NEXT: vsrl.vi v8, v8, 2
	; RV64-NEXT: vand.vx v8, v8, a0			; RV64-NEXT: vand.vx v8, v8, a1
	; RV64-NEXT: vadd.vv v8, v9, v8			; RV64-NEXT: vadd.vv v8, v9, v8
				; RV64-NEXT: lui a0, %hi(.LCPI40_2)
				; RV64-NEXT: ld a0, %lo(.LCPI40_2)(a0)
				; RV64-NEXT: lui a1, %hi(.LCPI40_3)
				; RV64-NEXT: ld a1, %lo(.LCPI40_3)(a1)
	; RV64-NEXT: vsrl.vi v9, v8, 4			; RV64-NEXT: vsrl.vi v9, v8, 4
	; RV64-NEXT: vadd.vv v8, v8, v9			; RV64-NEXT: vadd.vv v8, v8, v9
	; RV64-NEXT: lui a0, 3855
	; RV64-NEXT: addiw a0, a0, 241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, -241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, -241
	; RV64-NEXT: vand.vx v8, v8, a0			; RV64-NEXT: vand.vx v8, v8, a0
	; RV64-NEXT: lui a0, 4112			; RV64-NEXT: vmul.vx v8, v8, a1
	; RV64-NEXT: addiw a0, a0, 257
	; RV64-NEXT: slli a0, a0, 16
	; RV64-NEXT: addi a0, a0, 257
	; RV64-NEXT: slli a0, a0, 16
	; RV64-NEXT: addi a0, a0, 257
	; RV64-NEXT: vmul.vx v8, v8, a0
	; RV64-NEXT: li a0, 56			; RV64-NEXT: li a0, 56
	; RV64-NEXT: vsrl.vx v8, v8, a0			; RV64-NEXT: vsrl.vx v8, v8, a0
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%a = call <vscale x 1 x i64> @llvm.ctlz.nxv1i64(<vscale x 1 x i64> %va, i1 true)			%a = call <vscale x 1 x i64> @llvm.ctlz.nxv1i64(<vscale x 1 x i64> %va, i1 true)
	ret <vscale x 1 x i64> %a			ret <vscale x 1 x i64> %a
	}			}

	define <vscale x 2 x i64> @ctlz_zero_undef_nxv2i64(<vscale x 2 x i64> %va) {			define <vscale x 2 x i64> @ctlz_zero_undef_nxv2i64(<vscale x 2 x i64> %va) {
	▲ Show 20 Lines • Show All 68 Lines • ▼ Show 20 Lines
	; RV64-NEXT: vsrl.vi v10, v8, 8			; RV64-NEXT: vsrl.vi v10, v8, 8
	; RV64-NEXT: vor.vv v8, v8, v10			; RV64-NEXT: vor.vv v8, v8, v10
	; RV64-NEXT: vsrl.vi v10, v8, 16			; RV64-NEXT: vsrl.vi v10, v8, 16
	; RV64-NEXT: vor.vv v8, v8, v10			; RV64-NEXT: vor.vv v8, v8, v10
	; RV64-NEXT: li a0, 32			; RV64-NEXT: li a0, 32
	; RV64-NEXT: vsrl.vx v10, v8, a0			; RV64-NEXT: vsrl.vx v10, v8, a0
	; RV64-NEXT: vor.vv v8, v8, v10			; RV64-NEXT: vor.vv v8, v8, v10
	; RV64-NEXT: vxor.vi v8, v8, -1			; RV64-NEXT: vxor.vi v8, v8, -1
				; RV64-NEXT: lui a0, %hi(.LCPI41_0)
				; RV64-NEXT: ld a0, %lo(.LCPI41_0)(a0)
				; RV64-NEXT: lui a1, %hi(.LCPI41_1)
				; RV64-NEXT: ld a1, %lo(.LCPI41_1)(a1)
	; RV64-NEXT: vsrl.vi v10, v8, 1			; RV64-NEXT: vsrl.vi v10, v8, 1
	; RV64-NEXT: lui a0, 21845
	; RV64-NEXT: addiw a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: vand.vx v10, v10, a0			; RV64-NEXT: vand.vx v10, v10, a0
	; RV64-NEXT: vsub.vv v8, v8, v10			; RV64-NEXT: vsub.vv v8, v8, v10
	; RV64-NEXT: lui a0, 13107			; RV64-NEXT: vand.vx v10, v8, a1
	; RV64-NEXT: addiw a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: vand.vx v10, v8, a0
	; RV64-NEXT: vsrl.vi v8, v8, 2			; RV64-NEXT: vsrl.vi v8, v8, 2
	; RV64-NEXT: vand.vx v8, v8, a0			; RV64-NEXT: vand.vx v8, v8, a1
	; RV64-NEXT: vadd.vv v8, v10, v8			; RV64-NEXT: vadd.vv v8, v10, v8
				; RV64-NEXT: lui a0, %hi(.LCPI41_2)
				; RV64-NEXT: ld a0, %lo(.LCPI41_2)(a0)
				; RV64-NEXT: lui a1, %hi(.LCPI41_3)
				; RV64-NEXT: ld a1, %lo(.LCPI41_3)(a1)
	; RV64-NEXT: vsrl.vi v10, v8, 4			; RV64-NEXT: vsrl.vi v10, v8, 4
	; RV64-NEXT: vadd.vv v8, v8, v10			; RV64-NEXT: vadd.vv v8, v8, v10
	; RV64-NEXT: lui a0, 3855
	; RV64-NEXT: addiw a0, a0, 241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, -241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, -241
	; RV64-NEXT: vand.vx v8, v8, a0			; RV64-NEXT: vand.vx v8, v8, a0
	; RV64-NEXT: lui a0, 4112			; RV64-NEXT: vmul.vx v8, v8, a1
	; RV64-NEXT: addiw a0, a0, 257
	; RV64-NEXT: slli a0, a0, 16
	; RV64-NEXT: addi a0, a0, 257
	; RV64-NEXT: slli a0, a0, 16
	; RV64-NEXT: addi a0, a0, 257
	; RV64-NEXT: vmul.vx v8, v8, a0
	; RV64-NEXT: li a0, 56			; RV64-NEXT: li a0, 56
	; RV64-NEXT: vsrl.vx v8, v8, a0			; RV64-NEXT: vsrl.vx v8, v8, a0
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%a = call <vscale x 2 x i64> @llvm.ctlz.nxv2i64(<vscale x 2 x i64> %va, i1 true)			%a = call <vscale x 2 x i64> @llvm.ctlz.nxv2i64(<vscale x 2 x i64> %va, i1 true)
	ret <vscale x 2 x i64> %a			ret <vscale x 2 x i64> %a
	}			}

	define <vscale x 4 x i64> @ctlz_zero_undef_nxv4i64(<vscale x 4 x i64> %va) {			define <vscale x 4 x i64> @ctlz_zero_undef_nxv4i64(<vscale x 4 x i64> %va) {
	▲ Show 20 Lines • Show All 68 Lines • ▼ Show 20 Lines
	; RV64-NEXT: vsrl.vi v12, v8, 8			; RV64-NEXT: vsrl.vi v12, v8, 8
	; RV64-NEXT: vor.vv v8, v8, v12			; RV64-NEXT: vor.vv v8, v8, v12
	; RV64-NEXT: vsrl.vi v12, v8, 16			; RV64-NEXT: vsrl.vi v12, v8, 16
	; RV64-NEXT: vor.vv v8, v8, v12			; RV64-NEXT: vor.vv v8, v8, v12
	; RV64-NEXT: li a0, 32			; RV64-NEXT: li a0, 32
	; RV64-NEXT: vsrl.vx v12, v8, a0			; RV64-NEXT: vsrl.vx v12, v8, a0
	; RV64-NEXT: vor.vv v8, v8, v12			; RV64-NEXT: vor.vv v8, v8, v12
	; RV64-NEXT: vxor.vi v8, v8, -1			; RV64-NEXT: vxor.vi v8, v8, -1
				; RV64-NEXT: lui a0, %hi(.LCPI42_0)
				; RV64-NEXT: ld a0, %lo(.LCPI42_0)(a0)
				; RV64-NEXT: lui a1, %hi(.LCPI42_1)
				; RV64-NEXT: ld a1, %lo(.LCPI42_1)(a1)
	; RV64-NEXT: vsrl.vi v12, v8, 1			; RV64-NEXT: vsrl.vi v12, v8, 1
	; RV64-NEXT: lui a0, 21845
	; RV64-NEXT: addiw a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: vand.vx v12, v12, a0			; RV64-NEXT: vand.vx v12, v12, a0
	; RV64-NEXT: vsub.vv v8, v8, v12			; RV64-NEXT: vsub.vv v8, v8, v12
	; RV64-NEXT: lui a0, 13107			; RV64-NEXT: vand.vx v12, v8, a1
	; RV64-NEXT: addiw a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: vand.vx v12, v8, a0
	; RV64-NEXT: vsrl.vi v8, v8, 2			; RV64-NEXT: vsrl.vi v8, v8, 2
	; RV64-NEXT: vand.vx v8, v8, a0			; RV64-NEXT: vand.vx v8, v8, a1
	; RV64-NEXT: vadd.vv v8, v12, v8			; RV64-NEXT: vadd.vv v8, v12, v8
				; RV64-NEXT: lui a0, %hi(.LCPI42_2)
				; RV64-NEXT: ld a0, %lo(.LCPI42_2)(a0)
				; RV64-NEXT: lui a1, %hi(.LCPI42_3)
				; RV64-NEXT: ld a1, %lo(.LCPI42_3)(a1)
	; RV64-NEXT: vsrl.vi v12, v8, 4			; RV64-NEXT: vsrl.vi v12, v8, 4
	; RV64-NEXT: vadd.vv v8, v8, v12			; RV64-NEXT: vadd.vv v8, v8, v12
	; RV64-NEXT: lui a0, 3855
	; RV64-NEXT: addiw a0, a0, 241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, -241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, -241
	; RV64-NEXT: vand.vx v8, v8, a0			; RV64-NEXT: vand.vx v8, v8, a0
	; RV64-NEXT: lui a0, 4112			; RV64-NEXT: vmul.vx v8, v8, a1
	; RV64-NEXT: addiw a0, a0, 257
	; RV64-NEXT: slli a0, a0, 16
	; RV64-NEXT: addi a0, a0, 257
	; RV64-NEXT: slli a0, a0, 16
	; RV64-NEXT: addi a0, a0, 257
	; RV64-NEXT: vmul.vx v8, v8, a0
	; RV64-NEXT: li a0, 56			; RV64-NEXT: li a0, 56
	; RV64-NEXT: vsrl.vx v8, v8, a0			; RV64-NEXT: vsrl.vx v8, v8, a0
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%a = call <vscale x 4 x i64> @llvm.ctlz.nxv4i64(<vscale x 4 x i64> %va, i1 true)			%a = call <vscale x 4 x i64> @llvm.ctlz.nxv4i64(<vscale x 4 x i64> %va, i1 true)
	ret <vscale x 4 x i64> %a			ret <vscale x 4 x i64> %a
	}			}

	define <vscale x 8 x i64> @ctlz_zero_undef_nxv8i64(<vscale x 8 x i64> %va) {			define <vscale x 8 x i64> @ctlz_zero_undef_nxv8i64(<vscale x 8 x i64> %va) {
	▲ Show 20 Lines • Show All 68 Lines • ▼ Show 20 Lines
	; RV64-NEXT: vsrl.vi v16, v8, 8			; RV64-NEXT: vsrl.vi v16, v8, 8
	; RV64-NEXT: vor.vv v8, v8, v16			; RV64-NEXT: vor.vv v8, v8, v16
	; RV64-NEXT: vsrl.vi v16, v8, 16			; RV64-NEXT: vsrl.vi v16, v8, 16
	; RV64-NEXT: vor.vv v8, v8, v16			; RV64-NEXT: vor.vv v8, v8, v16
	; RV64-NEXT: li a0, 32			; RV64-NEXT: li a0, 32
	; RV64-NEXT: vsrl.vx v16, v8, a0			; RV64-NEXT: vsrl.vx v16, v8, a0
	; RV64-NEXT: vor.vv v8, v8, v16			; RV64-NEXT: vor.vv v8, v8, v16
	; RV64-NEXT: vxor.vi v8, v8, -1			; RV64-NEXT: vxor.vi v8, v8, -1
				; RV64-NEXT: lui a0, %hi(.LCPI43_0)
				; RV64-NEXT: ld a0, %lo(.LCPI43_0)(a0)
				; RV64-NEXT: lui a1, %hi(.LCPI43_1)
				; RV64-NEXT: ld a1, %lo(.LCPI43_1)(a1)
	; RV64-NEXT: vsrl.vi v16, v8, 1			; RV64-NEXT: vsrl.vi v16, v8, 1
	; RV64-NEXT: lui a0, 21845
	; RV64-NEXT: addiw a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: vand.vx v16, v16, a0			; RV64-NEXT: vand.vx v16, v16, a0
	; RV64-NEXT: vsub.vv v8, v8, v16			; RV64-NEXT: vsub.vv v8, v8, v16
	; RV64-NEXT: lui a0, 13107			; RV64-NEXT: vand.vx v16, v8, a1
	; RV64-NEXT: addiw a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: vand.vx v16, v8, a0
	; RV64-NEXT: vsrl.vi v8, v8, 2			; RV64-NEXT: vsrl.vi v8, v8, 2
	; RV64-NEXT: vand.vx v8, v8, a0			; RV64-NEXT: vand.vx v8, v8, a1
	; RV64-NEXT: vadd.vv v8, v16, v8			; RV64-NEXT: vadd.vv v8, v16, v8
				; RV64-NEXT: lui a0, %hi(.LCPI43_2)
				; RV64-NEXT: ld a0, %lo(.LCPI43_2)(a0)
				; RV64-NEXT: lui a1, %hi(.LCPI43_3)
				; RV64-NEXT: ld a1, %lo(.LCPI43_3)(a1)
	; RV64-NEXT: vsrl.vi v16, v8, 4			; RV64-NEXT: vsrl.vi v16, v8, 4
	; RV64-NEXT: vadd.vv v8, v8, v16			; RV64-NEXT: vadd.vv v8, v8, v16
	; RV64-NEXT: lui a0, 3855
	; RV64-NEXT: addiw a0, a0, 241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, -241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, -241
	; RV64-NEXT: vand.vx v8, v8, a0			; RV64-NEXT: vand.vx v8, v8, a0
	; RV64-NEXT: lui a0, 4112			; RV64-NEXT: vmul.vx v8, v8, a1
	; RV64-NEXT: addiw a0, a0, 257
	; RV64-NEXT: slli a0, a0, 16
	; RV64-NEXT: addi a0, a0, 257
	; RV64-NEXT: slli a0, a0, 16
	; RV64-NEXT: addi a0, a0, 257
	; RV64-NEXT: vmul.vx v8, v8, a0
	; RV64-NEXT: li a0, 56			; RV64-NEXT: li a0, 56
	; RV64-NEXT: vsrl.vx v8, v8, a0			; RV64-NEXT: vsrl.vx v8, v8, a0
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%a = call <vscale x 8 x i64> @llvm.ctlz.nxv8i64(<vscale x 8 x i64> %va, i1 true)			%a = call <vscale x 8 x i64> @llvm.ctlz.nxv8i64(<vscale x 8 x i64> %va, i1 true)
	ret <vscale x 8 x i64> %a			ret <vscale x 8 x i64> %a
	}			}

llvm/test/CodeGen/RISCV/rvv/ctpop-sdnode.ll

	Show First 20 Lines • Show All 792 Lines • ▼ Show 20 Lines
	; RV32-NEXT: li a0, 56			; RV32-NEXT: li a0, 56
	; RV32-NEXT: vsrl.vx v8, v8, a0			; RV32-NEXT: vsrl.vx v8, v8, a0
	; RV32-NEXT: addi sp, sp, 16			; RV32-NEXT: addi sp, sp, 16
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: ctpop_nxv1i64:			; RV64-LABEL: ctpop_nxv1i64:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: vsetvli a0, zero, e64, m1, ta, mu			; RV64-NEXT: vsetvli a0, zero, e64, m1, ta, mu
				; RV64-NEXT: lui a0, %hi(.LCPI18_0)
				; RV64-NEXT: ld a0, %lo(.LCPI18_0)(a0)
				; RV64-NEXT: lui a1, %hi(.LCPI18_1)
				; RV64-NEXT: ld a1, %lo(.LCPI18_1)(a1)
	; RV64-NEXT: vsrl.vi v9, v8, 1			; RV64-NEXT: vsrl.vi v9, v8, 1
	; RV64-NEXT: lui a0, 21845
	; RV64-NEXT: addiw a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: vand.vx v9, v9, a0			; RV64-NEXT: vand.vx v9, v9, a0
	; RV64-NEXT: vsub.vv v8, v8, v9			; RV64-NEXT: vsub.vv v8, v8, v9
	; RV64-NEXT: lui a0, 13107			; RV64-NEXT: vand.vx v9, v8, a1
	; RV64-NEXT: addiw a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: vand.vx v9, v8, a0
	; RV64-NEXT: vsrl.vi v8, v8, 2			; RV64-NEXT: vsrl.vi v8, v8, 2
	; RV64-NEXT: vand.vx v8, v8, a0			; RV64-NEXT: vand.vx v8, v8, a1
	; RV64-NEXT: vadd.vv v8, v9, v8			; RV64-NEXT: vadd.vv v8, v9, v8
				; RV64-NEXT: lui a0, %hi(.LCPI18_2)
				; RV64-NEXT: ld a0, %lo(.LCPI18_2)(a0)
				; RV64-NEXT: lui a1, %hi(.LCPI18_3)
				; RV64-NEXT: ld a1, %lo(.LCPI18_3)(a1)
	; RV64-NEXT: vsrl.vi v9, v8, 4			; RV64-NEXT: vsrl.vi v9, v8, 4
	; RV64-NEXT: vadd.vv v8, v8, v9			; RV64-NEXT: vadd.vv v8, v8, v9
	; RV64-NEXT: lui a0, 3855
	; RV64-NEXT: addiw a0, a0, 241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, -241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, -241
	; RV64-NEXT: vand.vx v8, v8, a0			; RV64-NEXT: vand.vx v8, v8, a0
	; RV64-NEXT: lui a0, 4112			; RV64-NEXT: vmul.vx v8, v8, a1
	; RV64-NEXT: addiw a0, a0, 257
	; RV64-NEXT: slli a0, a0, 16
	; RV64-NEXT: addi a0, a0, 257
	; RV64-NEXT: slli a0, a0, 16
	; RV64-NEXT: addi a0, a0, 257
	; RV64-NEXT: vmul.vx v8, v8, a0
	; RV64-NEXT: li a0, 56			; RV64-NEXT: li a0, 56
	; RV64-NEXT: vsrl.vx v8, v8, a0			; RV64-NEXT: vsrl.vx v8, v8, a0
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%a = call <vscale x 1 x i64> @llvm.ctpop.nxv1i64(<vscale x 1 x i64> %va)			%a = call <vscale x 1 x i64> @llvm.ctpop.nxv1i64(<vscale x 1 x i64> %va)
	ret <vscale x 1 x i64> %a			ret <vscale x 1 x i64> %a
	}			}
	declare <vscale x 1 x i64> @llvm.ctpop.nxv1i64(<vscale x 1 x i64>)			declare <vscale x 1 x i64> @llvm.ctpop.nxv1i64(<vscale x 1 x i64>)

	▲ Show 20 Lines • Show All 41 Lines • ▼ Show 20 Lines
	; RV32-NEXT: li a0, 56			; RV32-NEXT: li a0, 56
	; RV32-NEXT: vsrl.vx v8, v8, a0			; RV32-NEXT: vsrl.vx v8, v8, a0
	; RV32-NEXT: addi sp, sp, 16			; RV32-NEXT: addi sp, sp, 16
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: ctpop_nxv2i64:			; RV64-LABEL: ctpop_nxv2i64:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: vsetvli a0, zero, e64, m2, ta, mu			; RV64-NEXT: vsetvli a0, zero, e64, m2, ta, mu
				; RV64-NEXT: lui a0, %hi(.LCPI19_0)
				; RV64-NEXT: ld a0, %lo(.LCPI19_0)(a0)
				; RV64-NEXT: lui a1, %hi(.LCPI19_1)
				; RV64-NEXT: ld a1, %lo(.LCPI19_1)(a1)
	; RV64-NEXT: vsrl.vi v10, v8, 1			; RV64-NEXT: vsrl.vi v10, v8, 1
	; RV64-NEXT: lui a0, 21845
	; RV64-NEXT: addiw a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: vand.vx v10, v10, a0			; RV64-NEXT: vand.vx v10, v10, a0
	; RV64-NEXT: vsub.vv v8, v8, v10			; RV64-NEXT: vsub.vv v8, v8, v10
	; RV64-NEXT: lui a0, 13107			; RV64-NEXT: vand.vx v10, v8, a1
	; RV64-NEXT: addiw a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: vand.vx v10, v8, a0
	; RV64-NEXT: vsrl.vi v8, v8, 2			; RV64-NEXT: vsrl.vi v8, v8, 2
	; RV64-NEXT: vand.vx v8, v8, a0			; RV64-NEXT: vand.vx v8, v8, a1
	; RV64-NEXT: vadd.vv v8, v10, v8			; RV64-NEXT: vadd.vv v8, v10, v8
				; RV64-NEXT: lui a0, %hi(.LCPI19_2)
				; RV64-NEXT: ld a0, %lo(.LCPI19_2)(a0)
				; RV64-NEXT: lui a1, %hi(.LCPI19_3)
				; RV64-NEXT: ld a1, %lo(.LCPI19_3)(a1)
	; RV64-NEXT: vsrl.vi v10, v8, 4			; RV64-NEXT: vsrl.vi v10, v8, 4
	; RV64-NEXT: vadd.vv v8, v8, v10			; RV64-NEXT: vadd.vv v8, v8, v10
	; RV64-NEXT: lui a0, 3855
	; RV64-NEXT: addiw a0, a0, 241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, -241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, -241
	; RV64-NEXT: vand.vx v8, v8, a0			; RV64-NEXT: vand.vx v8, v8, a0
	; RV64-NEXT: lui a0, 4112			; RV64-NEXT: vmul.vx v8, v8, a1
	; RV64-NEXT: addiw a0, a0, 257
	; RV64-NEXT: slli a0, a0, 16
	; RV64-NEXT: addi a0, a0, 257
	; RV64-NEXT: slli a0, a0, 16
	; RV64-NEXT: addi a0, a0, 257
	; RV64-NEXT: vmul.vx v8, v8, a0
	; RV64-NEXT: li a0, 56			; RV64-NEXT: li a0, 56
	; RV64-NEXT: vsrl.vx v8, v8, a0			; RV64-NEXT: vsrl.vx v8, v8, a0
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%a = call <vscale x 2 x i64> @llvm.ctpop.nxv2i64(<vscale x 2 x i64> %va)			%a = call <vscale x 2 x i64> @llvm.ctpop.nxv2i64(<vscale x 2 x i64> %va)
	ret <vscale x 2 x i64> %a			ret <vscale x 2 x i64> %a
	}			}
	declare <vscale x 2 x i64> @llvm.ctpop.nxv2i64(<vscale x 2 x i64>)			declare <vscale x 2 x i64> @llvm.ctpop.nxv2i64(<vscale x 2 x i64>)

	▲ Show 20 Lines • Show All 41 Lines • ▼ Show 20 Lines
	; RV32-NEXT: li a0, 56			; RV32-NEXT: li a0, 56
	; RV32-NEXT: vsrl.vx v8, v8, a0			; RV32-NEXT: vsrl.vx v8, v8, a0
	; RV32-NEXT: addi sp, sp, 16			; RV32-NEXT: addi sp, sp, 16
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: ctpop_nxv4i64:			; RV64-LABEL: ctpop_nxv4i64:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: vsetvli a0, zero, e64, m4, ta, mu			; RV64-NEXT: vsetvli a0, zero, e64, m4, ta, mu
				; RV64-NEXT: lui a0, %hi(.LCPI20_0)
				; RV64-NEXT: ld a0, %lo(.LCPI20_0)(a0)
				; RV64-NEXT: lui a1, %hi(.LCPI20_1)
				; RV64-NEXT: ld a1, %lo(.LCPI20_1)(a1)
	; RV64-NEXT: vsrl.vi v12, v8, 1			; RV64-NEXT: vsrl.vi v12, v8, 1
	; RV64-NEXT: lui a0, 21845
	; RV64-NEXT: addiw a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: vand.vx v12, v12, a0			; RV64-NEXT: vand.vx v12, v12, a0
	; RV64-NEXT: vsub.vv v8, v8, v12			; RV64-NEXT: vsub.vv v8, v8, v12
	; RV64-NEXT: lui a0, 13107			; RV64-NEXT: vand.vx v12, v8, a1
	; RV64-NEXT: addiw a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: vand.vx v12, v8, a0
	; RV64-NEXT: vsrl.vi v8, v8, 2			; RV64-NEXT: vsrl.vi v8, v8, 2
	; RV64-NEXT: vand.vx v8, v8, a0			; RV64-NEXT: vand.vx v8, v8, a1
	; RV64-NEXT: vadd.vv v8, v12, v8			; RV64-NEXT: vadd.vv v8, v12, v8
				; RV64-NEXT: lui a0, %hi(.LCPI20_2)
				; RV64-NEXT: ld a0, %lo(.LCPI20_2)(a0)
				; RV64-NEXT: lui a1, %hi(.LCPI20_3)
				; RV64-NEXT: ld a1, %lo(.LCPI20_3)(a1)
	; RV64-NEXT: vsrl.vi v12, v8, 4			; RV64-NEXT: vsrl.vi v12, v8, 4
	; RV64-NEXT: vadd.vv v8, v8, v12			; RV64-NEXT: vadd.vv v8, v8, v12
	; RV64-NEXT: lui a0, 3855
	; RV64-NEXT: addiw a0, a0, 241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, -241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, -241
	; RV64-NEXT: vand.vx v8, v8, a0			; RV64-NEXT: vand.vx v8, v8, a0
	; RV64-NEXT: lui a0, 4112			; RV64-NEXT: vmul.vx v8, v8, a1
	; RV64-NEXT: addiw a0, a0, 257
	; RV64-NEXT: slli a0, a0, 16
	; RV64-NEXT: addi a0, a0, 257
	; RV64-NEXT: slli a0, a0, 16
	; RV64-NEXT: addi a0, a0, 257
	; RV64-NEXT: vmul.vx v8, v8, a0
	; RV64-NEXT: li a0, 56			; RV64-NEXT: li a0, 56
	; RV64-NEXT: vsrl.vx v8, v8, a0			; RV64-NEXT: vsrl.vx v8, v8, a0
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%a = call <vscale x 4 x i64> @llvm.ctpop.nxv4i64(<vscale x 4 x i64> %va)			%a = call <vscale x 4 x i64> @llvm.ctpop.nxv4i64(<vscale x 4 x i64> %va)
	ret <vscale x 4 x i64> %a			ret <vscale x 4 x i64> %a
	}			}
	declare <vscale x 4 x i64> @llvm.ctpop.nxv4i64(<vscale x 4 x i64>)			declare <vscale x 4 x i64> @llvm.ctpop.nxv4i64(<vscale x 4 x i64>)

	▲ Show 20 Lines • Show All 41 Lines • ▼ Show 20 Lines
	; RV32-NEXT: li a0, 56			; RV32-NEXT: li a0, 56
	; RV32-NEXT: vsrl.vx v8, v8, a0			; RV32-NEXT: vsrl.vx v8, v8, a0
	; RV32-NEXT: addi sp, sp, 16			; RV32-NEXT: addi sp, sp, 16
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: ctpop_nxv8i64:			; RV64-LABEL: ctpop_nxv8i64:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: vsetvli a0, zero, e64, m8, ta, mu			; RV64-NEXT: vsetvli a0, zero, e64, m8, ta, mu
				; RV64-NEXT: lui a0, %hi(.LCPI21_0)
				; RV64-NEXT: ld a0, %lo(.LCPI21_0)(a0)
				; RV64-NEXT: lui a1, %hi(.LCPI21_1)
				; RV64-NEXT: ld a1, %lo(.LCPI21_1)(a1)
	; RV64-NEXT: vsrl.vi v16, v8, 1			; RV64-NEXT: vsrl.vi v16, v8, 1
	; RV64-NEXT: lui a0, 21845
	; RV64-NEXT: addiw a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: vand.vx v16, v16, a0			; RV64-NEXT: vand.vx v16, v16, a0
	; RV64-NEXT: vsub.vv v8, v8, v16			; RV64-NEXT: vsub.vv v8, v8, v16
	; RV64-NEXT: lui a0, 13107			; RV64-NEXT: vand.vx v16, v8, a1
	; RV64-NEXT: addiw a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: vand.vx v16, v8, a0
	; RV64-NEXT: vsrl.vi v8, v8, 2			; RV64-NEXT: vsrl.vi v8, v8, 2
	; RV64-NEXT: vand.vx v8, v8, a0			; RV64-NEXT: vand.vx v8, v8, a1
	; RV64-NEXT: vadd.vv v8, v16, v8			; RV64-NEXT: vadd.vv v8, v16, v8
				; RV64-NEXT: lui a0, %hi(.LCPI21_2)
				; RV64-NEXT: ld a0, %lo(.LCPI21_2)(a0)
				; RV64-NEXT: lui a1, %hi(.LCPI21_3)
				; RV64-NEXT: ld a1, %lo(.LCPI21_3)(a1)
	; RV64-NEXT: vsrl.vi v16, v8, 4			; RV64-NEXT: vsrl.vi v16, v8, 4
	; RV64-NEXT: vadd.vv v8, v8, v16			; RV64-NEXT: vadd.vv v8, v8, v16
	; RV64-NEXT: lui a0, 3855
	; RV64-NEXT: addiw a0, a0, 241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, -241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, -241
	; RV64-NEXT: vand.vx v8, v8, a0			; RV64-NEXT: vand.vx v8, v8, a0
	; RV64-NEXT: lui a0, 4112			; RV64-NEXT: vmul.vx v8, v8, a1
	; RV64-NEXT: addiw a0, a0, 257
	; RV64-NEXT: slli a0, a0, 16
	; RV64-NEXT: addi a0, a0, 257
	; RV64-NEXT: slli a0, a0, 16
	; RV64-NEXT: addi a0, a0, 257
	; RV64-NEXT: vmul.vx v8, v8, a0
	; RV64-NEXT: li a0, 56			; RV64-NEXT: li a0, 56
	; RV64-NEXT: vsrl.vx v8, v8, a0			; RV64-NEXT: vsrl.vx v8, v8, a0
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%a = call <vscale x 8 x i64> @llvm.ctpop.nxv8i64(<vscale x 8 x i64> %va)			%a = call <vscale x 8 x i64> @llvm.ctpop.nxv8i64(<vscale x 8 x i64> %va)
	ret <vscale x 8 x i64> %a			ret <vscale x 8 x i64> %a
	}			}
	declare <vscale x 8 x i64> @llvm.ctpop.nxv8i64(<vscale x 8 x i64>)			declare <vscale x 8 x i64> @llvm.ctpop.nxv8i64(<vscale x 8 x i64>)

llvm/test/CodeGen/RISCV/rvv/cttz-sdnode.ll

	Show First 20 Lines • Show All 1,551 Lines • ▼ Show 20 Lines
	;			;
	; RV64-LABEL: cttz_nxv1i64:			; RV64-LABEL: cttz_nxv1i64:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: li a0, 1			; RV64-NEXT: li a0, 1
	; RV64-NEXT: vsetvli a1, zero, e64, m1, ta, mu			; RV64-NEXT: vsetvli a1, zero, e64, m1, ta, mu
	; RV64-NEXT: vsub.vx v9, v8, a0			; RV64-NEXT: vsub.vx v9, v8, a0
	; RV64-NEXT: vxor.vi v8, v8, -1			; RV64-NEXT: vxor.vi v8, v8, -1
	; RV64-NEXT: vand.vv v8, v8, v9			; RV64-NEXT: vand.vv v8, v8, v9
				; RV64-NEXT: lui a0, %hi(.LCPI18_0)
				; RV64-NEXT: ld a0, %lo(.LCPI18_0)(a0)
				; RV64-NEXT: lui a1, %hi(.LCPI18_1)
				; RV64-NEXT: ld a1, %lo(.LCPI18_1)(a1)
	; RV64-NEXT: vsrl.vi v9, v8, 1			; RV64-NEXT: vsrl.vi v9, v8, 1
	; RV64-NEXT: lui a0, 21845
	; RV64-NEXT: addiw a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: vand.vx v9, v9, a0			; RV64-NEXT: vand.vx v9, v9, a0
	; RV64-NEXT: vsub.vv v8, v8, v9			; RV64-NEXT: vsub.vv v8, v8, v9
	; RV64-NEXT: lui a0, 13107			; RV64-NEXT: vand.vx v9, v8, a1
	; RV64-NEXT: addiw a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: vand.vx v9, v8, a0
	; RV64-NEXT: vsrl.vi v8, v8, 2			; RV64-NEXT: vsrl.vi v8, v8, 2
	; RV64-NEXT: vand.vx v8, v8, a0			; RV64-NEXT: vand.vx v8, v8, a1
	; RV64-NEXT: vadd.vv v8, v9, v8			; RV64-NEXT: vadd.vv v8, v9, v8
				; RV64-NEXT: lui a0, %hi(.LCPI18_2)
				; RV64-NEXT: ld a0, %lo(.LCPI18_2)(a0)
				; RV64-NEXT: lui a1, %hi(.LCPI18_3)
				; RV64-NEXT: ld a1, %lo(.LCPI18_3)(a1)
	; RV64-NEXT: vsrl.vi v9, v8, 4			; RV64-NEXT: vsrl.vi v9, v8, 4
	; RV64-NEXT: vadd.vv v8, v8, v9			; RV64-NEXT: vadd.vv v8, v8, v9
	; RV64-NEXT: lui a0, 3855
	; RV64-NEXT: addiw a0, a0, 241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, -241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, -241
	; RV64-NEXT: vand.vx v8, v8, a0			; RV64-NEXT: vand.vx v8, v8, a0
	; RV64-NEXT: lui a0, 4112			; RV64-NEXT: vmul.vx v8, v8, a1
	; RV64-NEXT: addiw a0, a0, 257
	; RV64-NEXT: slli a0, a0, 16
	; RV64-NEXT: addi a0, a0, 257
	; RV64-NEXT: slli a0, a0, 16
	; RV64-NEXT: addi a0, a0, 257
	; RV64-NEXT: vmul.vx v8, v8, a0
	; RV64-NEXT: li a0, 56			; RV64-NEXT: li a0, 56
	; RV64-NEXT: vsrl.vx v8, v8, a0			; RV64-NEXT: vsrl.vx v8, v8, a0
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%a = call <vscale x 1 x i64> @llvm.cttz.nxv1i64(<vscale x 1 x i64> %va, i1 false)			%a = call <vscale x 1 x i64> @llvm.cttz.nxv1i64(<vscale x 1 x i64> %va, i1 false)
	ret <vscale x 1 x i64> %a			ret <vscale x 1 x i64> %a
	}			}
	declare <vscale x 1 x i64> @llvm.cttz.nxv1i64(<vscale x 1 x i64>, i1)			declare <vscale x 1 x i64> @llvm.cttz.nxv1i64(<vscale x 1 x i64>, i1)

	▲ Show 20 Lines • Show All 49 Lines • ▼ Show 20 Lines
	;			;
	; RV64-LABEL: cttz_nxv2i64:			; RV64-LABEL: cttz_nxv2i64:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: li a0, 1			; RV64-NEXT: li a0, 1
	; RV64-NEXT: vsetvli a1, zero, e64, m2, ta, mu			; RV64-NEXT: vsetvli a1, zero, e64, m2, ta, mu
	; RV64-NEXT: vsub.vx v10, v8, a0			; RV64-NEXT: vsub.vx v10, v8, a0
	; RV64-NEXT: vxor.vi v8, v8, -1			; RV64-NEXT: vxor.vi v8, v8, -1
	; RV64-NEXT: vand.vv v8, v8, v10			; RV64-NEXT: vand.vv v8, v8, v10
				; RV64-NEXT: lui a0, %hi(.LCPI19_0)
				; RV64-NEXT: ld a0, %lo(.LCPI19_0)(a0)
				; RV64-NEXT: lui a1, %hi(.LCPI19_1)
				; RV64-NEXT: ld a1, %lo(.LCPI19_1)(a1)
	; RV64-NEXT: vsrl.vi v10, v8, 1			; RV64-NEXT: vsrl.vi v10, v8, 1
	; RV64-NEXT: lui a0, 21845
	; RV64-NEXT: addiw a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: vand.vx v10, v10, a0			; RV64-NEXT: vand.vx v10, v10, a0
	; RV64-NEXT: vsub.vv v8, v8, v10			; RV64-NEXT: vsub.vv v8, v8, v10
	; RV64-NEXT: lui a0, 13107			; RV64-NEXT: vand.vx v10, v8, a1
	; RV64-NEXT: addiw a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: vand.vx v10, v8, a0
	; RV64-NEXT: vsrl.vi v8, v8, 2			; RV64-NEXT: vsrl.vi v8, v8, 2
	; RV64-NEXT: vand.vx v8, v8, a0			; RV64-NEXT: vand.vx v8, v8, a1
	; RV64-NEXT: vadd.vv v8, v10, v8			; RV64-NEXT: vadd.vv v8, v10, v8
				; RV64-NEXT: lui a0, %hi(.LCPI19_2)
				; RV64-NEXT: ld a0, %lo(.LCPI19_2)(a0)
				; RV64-NEXT: lui a1, %hi(.LCPI19_3)
				; RV64-NEXT: ld a1, %lo(.LCPI19_3)(a1)
	; RV64-NEXT: vsrl.vi v10, v8, 4			; RV64-NEXT: vsrl.vi v10, v8, 4
	; RV64-NEXT: vadd.vv v8, v8, v10			; RV64-NEXT: vadd.vv v8, v8, v10
	; RV64-NEXT: lui a0, 3855
	; RV64-NEXT: addiw a0, a0, 241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, -241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, -241
	; RV64-NEXT: vand.vx v8, v8, a0			; RV64-NEXT: vand.vx v8, v8, a0
	; RV64-NEXT: lui a0, 4112			; RV64-NEXT: vmul.vx v8, v8, a1
	; RV64-NEXT: addiw a0, a0, 257
	; RV64-NEXT: slli a0, a0, 16
	; RV64-NEXT: addi a0, a0, 257
	; RV64-NEXT: slli a0, a0, 16
	; RV64-NEXT: addi a0, a0, 257
	; RV64-NEXT: vmul.vx v8, v8, a0
	; RV64-NEXT: li a0, 56			; RV64-NEXT: li a0, 56
	; RV64-NEXT: vsrl.vx v8, v8, a0			; RV64-NEXT: vsrl.vx v8, v8, a0
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%a = call <vscale x 2 x i64> @llvm.cttz.nxv2i64(<vscale x 2 x i64> %va, i1 false)			%a = call <vscale x 2 x i64> @llvm.cttz.nxv2i64(<vscale x 2 x i64> %va, i1 false)
	ret <vscale x 2 x i64> %a			ret <vscale x 2 x i64> %a
	}			}
	declare <vscale x 2 x i64> @llvm.cttz.nxv2i64(<vscale x 2 x i64>, i1)			declare <vscale x 2 x i64> @llvm.cttz.nxv2i64(<vscale x 2 x i64>, i1)

	▲ Show 20 Lines • Show All 49 Lines • ▼ Show 20 Lines
	;			;
	; RV64-LABEL: cttz_nxv4i64:			; RV64-LABEL: cttz_nxv4i64:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: li a0, 1			; RV64-NEXT: li a0, 1
	; RV64-NEXT: vsetvli a1, zero, e64, m4, ta, mu			; RV64-NEXT: vsetvli a1, zero, e64, m4, ta, mu
	; RV64-NEXT: vsub.vx v12, v8, a0			; RV64-NEXT: vsub.vx v12, v8, a0
	; RV64-NEXT: vxor.vi v8, v8, -1			; RV64-NEXT: vxor.vi v8, v8, -1
	; RV64-NEXT: vand.vv v8, v8, v12			; RV64-NEXT: vand.vv v8, v8, v12
				; RV64-NEXT: lui a0, %hi(.LCPI20_0)
				; RV64-NEXT: ld a0, %lo(.LCPI20_0)(a0)
				; RV64-NEXT: lui a1, %hi(.LCPI20_1)
				; RV64-NEXT: ld a1, %lo(.LCPI20_1)(a1)
	; RV64-NEXT: vsrl.vi v12, v8, 1			; RV64-NEXT: vsrl.vi v12, v8, 1
	; RV64-NEXT: lui a0, 21845
	; RV64-NEXT: addiw a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: vand.vx v12, v12, a0			; RV64-NEXT: vand.vx v12, v12, a0
	; RV64-NEXT: vsub.vv v8, v8, v12			; RV64-NEXT: vsub.vv v8, v8, v12
	; RV64-NEXT: lui a0, 13107			; RV64-NEXT: vand.vx v12, v8, a1
	; RV64-NEXT: addiw a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: vand.vx v12, v8, a0
	; RV64-NEXT: vsrl.vi v8, v8, 2			; RV64-NEXT: vsrl.vi v8, v8, 2
	; RV64-NEXT: vand.vx v8, v8, a0			; RV64-NEXT: vand.vx v8, v8, a1
	; RV64-NEXT: vadd.vv v8, v12, v8			; RV64-NEXT: vadd.vv v8, v12, v8
				; RV64-NEXT: lui a0, %hi(.LCPI20_2)
				; RV64-NEXT: ld a0, %lo(.LCPI20_2)(a0)
				; RV64-NEXT: lui a1, %hi(.LCPI20_3)
				; RV64-NEXT: ld a1, %lo(.LCPI20_3)(a1)
	; RV64-NEXT: vsrl.vi v12, v8, 4			; RV64-NEXT: vsrl.vi v12, v8, 4
	; RV64-NEXT: vadd.vv v8, v8, v12			; RV64-NEXT: vadd.vv v8, v8, v12
	; RV64-NEXT: lui a0, 3855
	; RV64-NEXT: addiw a0, a0, 241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, -241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, -241
	; RV64-NEXT: vand.vx v8, v8, a0			; RV64-NEXT: vand.vx v8, v8, a0
	; RV64-NEXT: lui a0, 4112			; RV64-NEXT: vmul.vx v8, v8, a1
	; RV64-NEXT: addiw a0, a0, 257
	; RV64-NEXT: slli a0, a0, 16
	; RV64-NEXT: addi a0, a0, 257
	; RV64-NEXT: slli a0, a0, 16
	; RV64-NEXT: addi a0, a0, 257
	; RV64-NEXT: vmul.vx v8, v8, a0
	; RV64-NEXT: li a0, 56			; RV64-NEXT: li a0, 56
	; RV64-NEXT: vsrl.vx v8, v8, a0			; RV64-NEXT: vsrl.vx v8, v8, a0
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%a = call <vscale x 4 x i64> @llvm.cttz.nxv4i64(<vscale x 4 x i64> %va, i1 false)			%a = call <vscale x 4 x i64> @llvm.cttz.nxv4i64(<vscale x 4 x i64> %va, i1 false)
	ret <vscale x 4 x i64> %a			ret <vscale x 4 x i64> %a
	}			}
	declare <vscale x 4 x i64> @llvm.cttz.nxv4i64(<vscale x 4 x i64>, i1)			declare <vscale x 4 x i64> @llvm.cttz.nxv4i64(<vscale x 4 x i64>, i1)

	▲ Show 20 Lines • Show All 49 Lines • ▼ Show 20 Lines
	;			;
	; RV64-LABEL: cttz_nxv8i64:			; RV64-LABEL: cttz_nxv8i64:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: li a0, 1			; RV64-NEXT: li a0, 1
	; RV64-NEXT: vsetvli a1, zero, e64, m8, ta, mu			; RV64-NEXT: vsetvli a1, zero, e64, m8, ta, mu
	; RV64-NEXT: vsub.vx v16, v8, a0			; RV64-NEXT: vsub.vx v16, v8, a0
	; RV64-NEXT: vxor.vi v8, v8, -1			; RV64-NEXT: vxor.vi v8, v8, -1
	; RV64-NEXT: vand.vv v8, v8, v16			; RV64-NEXT: vand.vv v8, v8, v16
				; RV64-NEXT: lui a0, %hi(.LCPI21_0)
				; RV64-NEXT: ld a0, %lo(.LCPI21_0)(a0)
				; RV64-NEXT: lui a1, %hi(.LCPI21_1)
				; RV64-NEXT: ld a1, %lo(.LCPI21_1)(a1)
	; RV64-NEXT: vsrl.vi v16, v8, 1			; RV64-NEXT: vsrl.vi v16, v8, 1
	; RV64-NEXT: lui a0, 21845
	; RV64-NEXT: addiw a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: vand.vx v16, v16, a0			; RV64-NEXT: vand.vx v16, v16, a0
	; RV64-NEXT: vsub.vv v8, v8, v16			; RV64-NEXT: vsub.vv v8, v8, v16
	; RV64-NEXT: lui a0, 13107			; RV64-NEXT: vand.vx v16, v8, a1
	; RV64-NEXT: addiw a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: vand.vx v16, v8, a0
	; RV64-NEXT: vsrl.vi v8, v8, 2			; RV64-NEXT: vsrl.vi v8, v8, 2
	; RV64-NEXT: vand.vx v8, v8, a0			; RV64-NEXT: vand.vx v8, v8, a1
	; RV64-NEXT: vadd.vv v8, v16, v8			; RV64-NEXT: vadd.vv v8, v16, v8
				; RV64-NEXT: lui a0, %hi(.LCPI21_2)
				; RV64-NEXT: ld a0, %lo(.LCPI21_2)(a0)
				; RV64-NEXT: lui a1, %hi(.LCPI21_3)
				; RV64-NEXT: ld a1, %lo(.LCPI21_3)(a1)
	; RV64-NEXT: vsrl.vi v16, v8, 4			; RV64-NEXT: vsrl.vi v16, v8, 4
	; RV64-NEXT: vadd.vv v8, v8, v16			; RV64-NEXT: vadd.vv v8, v8, v16
	; RV64-NEXT: lui a0, 3855
	; RV64-NEXT: addiw a0, a0, 241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, -241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, -241
	; RV64-NEXT: vand.vx v8, v8, a0			; RV64-NEXT: vand.vx v8, v8, a0
	; RV64-NEXT: lui a0, 4112			; RV64-NEXT: vmul.vx v8, v8, a1
	; RV64-NEXT: addiw a0, a0, 257
	; RV64-NEXT: slli a0, a0, 16
	; RV64-NEXT: addi a0, a0, 257
	; RV64-NEXT: slli a0, a0, 16
	; RV64-NEXT: addi a0, a0, 257
	; RV64-NEXT: vmul.vx v8, v8, a0
	; RV64-NEXT: li a0, 56			; RV64-NEXT: li a0, 56
	; RV64-NEXT: vsrl.vx v8, v8, a0			; RV64-NEXT: vsrl.vx v8, v8, a0
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%a = call <vscale x 8 x i64> @llvm.cttz.nxv8i64(<vscale x 8 x i64> %va, i1 false)			%a = call <vscale x 8 x i64> @llvm.cttz.nxv8i64(<vscale x 8 x i64> %va, i1 false)
	ret <vscale x 8 x i64> %a			ret <vscale x 8 x i64> %a
	}			}
	declare <vscale x 8 x i64> @llvm.cttz.nxv8i64(<vscale x 8 x i64>, i1)			declare <vscale x 8 x i64> @llvm.cttz.nxv8i64(<vscale x 8 x i64>, i1)

	▲ Show 20 Lines • Show All 1,429 Lines • ▼ Show 20 Lines
	;			;
	; RV64-LABEL: cttz_zero_undef_nxv1i64:			; RV64-LABEL: cttz_zero_undef_nxv1i64:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: li a0, 1			; RV64-NEXT: li a0, 1
	; RV64-NEXT: vsetvli a1, zero, e64, m1, ta, mu			; RV64-NEXT: vsetvli a1, zero, e64, m1, ta, mu
	; RV64-NEXT: vsub.vx v9, v8, a0			; RV64-NEXT: vsub.vx v9, v8, a0
	; RV64-NEXT: vxor.vi v8, v8, -1			; RV64-NEXT: vxor.vi v8, v8, -1
	; RV64-NEXT: vand.vv v8, v8, v9			; RV64-NEXT: vand.vv v8, v8, v9
				; RV64-NEXT: lui a0, %hi(.LCPI40_0)
				; RV64-NEXT: ld a0, %lo(.LCPI40_0)(a0)
				; RV64-NEXT: lui a1, %hi(.LCPI40_1)
				; RV64-NEXT: ld a1, %lo(.LCPI40_1)(a1)
	; RV64-NEXT: vsrl.vi v9, v8, 1			; RV64-NEXT: vsrl.vi v9, v8, 1
	; RV64-NEXT: lui a0, 21845
	; RV64-NEXT: addiw a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: vand.vx v9, v9, a0			; RV64-NEXT: vand.vx v9, v9, a0
	; RV64-NEXT: vsub.vv v8, v8, v9			; RV64-NEXT: vsub.vv v8, v8, v9
	; RV64-NEXT: lui a0, 13107			; RV64-NEXT: vand.vx v9, v8, a1
	; RV64-NEXT: addiw a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: vand.vx v9, v8, a0
	; RV64-NEXT: vsrl.vi v8, v8, 2			; RV64-NEXT: vsrl.vi v8, v8, 2
	; RV64-NEXT: vand.vx v8, v8, a0			; RV64-NEXT: vand.vx v8, v8, a1
	; RV64-NEXT: vadd.vv v8, v9, v8			; RV64-NEXT: vadd.vv v8, v9, v8
				; RV64-NEXT: lui a0, %hi(.LCPI40_2)
				; RV64-NEXT: ld a0, %lo(.LCPI40_2)(a0)
				; RV64-NEXT: lui a1, %hi(.LCPI40_3)
				; RV64-NEXT: ld a1, %lo(.LCPI40_3)(a1)
	; RV64-NEXT: vsrl.vi v9, v8, 4			; RV64-NEXT: vsrl.vi v9, v8, 4
	; RV64-NEXT: vadd.vv v8, v8, v9			; RV64-NEXT: vadd.vv v8, v8, v9
	; RV64-NEXT: lui a0, 3855
	; RV64-NEXT: addiw a0, a0, 241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, -241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, -241
	; RV64-NEXT: vand.vx v8, v8, a0			; RV64-NEXT: vand.vx v8, v8, a0
	; RV64-NEXT: lui a0, 4112			; RV64-NEXT: vmul.vx v8, v8, a1
	; RV64-NEXT: addiw a0, a0, 257
	; RV64-NEXT: slli a0, a0, 16
	; RV64-NEXT: addi a0, a0, 257
	; RV64-NEXT: slli a0, a0, 16
	; RV64-NEXT: addi a0, a0, 257
	; RV64-NEXT: vmul.vx v8, v8, a0
	; RV64-NEXT: li a0, 56			; RV64-NEXT: li a0, 56
	; RV64-NEXT: vsrl.vx v8, v8, a0			; RV64-NEXT: vsrl.vx v8, v8, a0
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%a = call <vscale x 1 x i64> @llvm.cttz.nxv1i64(<vscale x 1 x i64> %va, i1 true)			%a = call <vscale x 1 x i64> @llvm.cttz.nxv1i64(<vscale x 1 x i64> %va, i1 true)
	ret <vscale x 1 x i64> %a			ret <vscale x 1 x i64> %a
	}			}

	define <vscale x 2 x i64> @cttz_zero_undef_nxv2i64(<vscale x 2 x i64> %va) {			define <vscale x 2 x i64> @cttz_zero_undef_nxv2i64(<vscale x 2 x i64> %va) {
	▲ Show 20 Lines • Show All 48 Lines • ▼ Show 20 Lines
	;			;
	; RV64-LABEL: cttz_zero_undef_nxv2i64:			; RV64-LABEL: cttz_zero_undef_nxv2i64:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: li a0, 1			; RV64-NEXT: li a0, 1
	; RV64-NEXT: vsetvli a1, zero, e64, m2, ta, mu			; RV64-NEXT: vsetvli a1, zero, e64, m2, ta, mu
	; RV64-NEXT: vsub.vx v10, v8, a0			; RV64-NEXT: vsub.vx v10, v8, a0
	; RV64-NEXT: vxor.vi v8, v8, -1			; RV64-NEXT: vxor.vi v8, v8, -1
	; RV64-NEXT: vand.vv v8, v8, v10			; RV64-NEXT: vand.vv v8, v8, v10
				; RV64-NEXT: lui a0, %hi(.LCPI41_0)
				; RV64-NEXT: ld a0, %lo(.LCPI41_0)(a0)
				; RV64-NEXT: lui a1, %hi(.LCPI41_1)
				; RV64-NEXT: ld a1, %lo(.LCPI41_1)(a1)
	; RV64-NEXT: vsrl.vi v10, v8, 1			; RV64-NEXT: vsrl.vi v10, v8, 1
	; RV64-NEXT: lui a0, 21845
	; RV64-NEXT: addiw a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: vand.vx v10, v10, a0			; RV64-NEXT: vand.vx v10, v10, a0
	; RV64-NEXT: vsub.vv v8, v8, v10			; RV64-NEXT: vsub.vv v8, v8, v10
	; RV64-NEXT: lui a0, 13107			; RV64-NEXT: vand.vx v10, v8, a1
	; RV64-NEXT: addiw a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: vand.vx v10, v8, a0
	; RV64-NEXT: vsrl.vi v8, v8, 2			; RV64-NEXT: vsrl.vi v8, v8, 2
	; RV64-NEXT: vand.vx v8, v8, a0			; RV64-NEXT: vand.vx v8, v8, a1
	; RV64-NEXT: vadd.vv v8, v10, v8			; RV64-NEXT: vadd.vv v8, v10, v8
				; RV64-NEXT: lui a0, %hi(.LCPI41_2)
				; RV64-NEXT: ld a0, %lo(.LCPI41_2)(a0)
				; RV64-NEXT: lui a1, %hi(.LCPI41_3)
				; RV64-NEXT: ld a1, %lo(.LCPI41_3)(a1)
	; RV64-NEXT: vsrl.vi v10, v8, 4			; RV64-NEXT: vsrl.vi v10, v8, 4
	; RV64-NEXT: vadd.vv v8, v8, v10			; RV64-NEXT: vadd.vv v8, v8, v10
	; RV64-NEXT: lui a0, 3855
	; RV64-NEXT: addiw a0, a0, 241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, -241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, -241
	; RV64-NEXT: vand.vx v8, v8, a0			; RV64-NEXT: vand.vx v8, v8, a0
	; RV64-NEXT: lui a0, 4112			; RV64-NEXT: vmul.vx v8, v8, a1
	; RV64-NEXT: addiw a0, a0, 257
	; RV64-NEXT: slli a0, a0, 16
	; RV64-NEXT: addi a0, a0, 257
	; RV64-NEXT: slli a0, a0, 16
	; RV64-NEXT: addi a0, a0, 257
	; RV64-NEXT: vmul.vx v8, v8, a0
	; RV64-NEXT: li a0, 56			; RV64-NEXT: li a0, 56
	; RV64-NEXT: vsrl.vx v8, v8, a0			; RV64-NEXT: vsrl.vx v8, v8, a0
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%a = call <vscale x 2 x i64> @llvm.cttz.nxv2i64(<vscale x 2 x i64> %va, i1 true)			%a = call <vscale x 2 x i64> @llvm.cttz.nxv2i64(<vscale x 2 x i64> %va, i1 true)
	ret <vscale x 2 x i64> %a			ret <vscale x 2 x i64> %a
	}			}

	define <vscale x 4 x i64> @cttz_zero_undef_nxv4i64(<vscale x 4 x i64> %va) {			define <vscale x 4 x i64> @cttz_zero_undef_nxv4i64(<vscale x 4 x i64> %va) {
	▲ Show 20 Lines • Show All 48 Lines • ▼ Show 20 Lines
	;			;
	; RV64-LABEL: cttz_zero_undef_nxv4i64:			; RV64-LABEL: cttz_zero_undef_nxv4i64:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: li a0, 1			; RV64-NEXT: li a0, 1
	; RV64-NEXT: vsetvli a1, zero, e64, m4, ta, mu			; RV64-NEXT: vsetvli a1, zero, e64, m4, ta, mu
	; RV64-NEXT: vsub.vx v12, v8, a0			; RV64-NEXT: vsub.vx v12, v8, a0
	; RV64-NEXT: vxor.vi v8, v8, -1			; RV64-NEXT: vxor.vi v8, v8, -1
	; RV64-NEXT: vand.vv v8, v8, v12			; RV64-NEXT: vand.vv v8, v8, v12
				; RV64-NEXT: lui a0, %hi(.LCPI42_0)
				; RV64-NEXT: ld a0, %lo(.LCPI42_0)(a0)
				; RV64-NEXT: lui a1, %hi(.LCPI42_1)
				; RV64-NEXT: ld a1, %lo(.LCPI42_1)(a1)
	; RV64-NEXT: vsrl.vi v12, v8, 1			; RV64-NEXT: vsrl.vi v12, v8, 1
	; RV64-NEXT: lui a0, 21845
	; RV64-NEXT: addiw a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: vand.vx v12, v12, a0			; RV64-NEXT: vand.vx v12, v12, a0
	; RV64-NEXT: vsub.vv v8, v8, v12			; RV64-NEXT: vsub.vv v8, v8, v12
	; RV64-NEXT: lui a0, 13107			; RV64-NEXT: vand.vx v12, v8, a1
	; RV64-NEXT: addiw a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: vand.vx v12, v8, a0
	; RV64-NEXT: vsrl.vi v8, v8, 2			; RV64-NEXT: vsrl.vi v8, v8, 2
	; RV64-NEXT: vand.vx v8, v8, a0			; RV64-NEXT: vand.vx v8, v8, a1
	; RV64-NEXT: vadd.vv v8, v12, v8			; RV64-NEXT: vadd.vv v8, v12, v8
				; RV64-NEXT: lui a0, %hi(.LCPI42_2)
				; RV64-NEXT: ld a0, %lo(.LCPI42_2)(a0)
				; RV64-NEXT: lui a1, %hi(.LCPI42_3)
				; RV64-NEXT: ld a1, %lo(.LCPI42_3)(a1)
	; RV64-NEXT: vsrl.vi v12, v8, 4			; RV64-NEXT: vsrl.vi v12, v8, 4
	; RV64-NEXT: vadd.vv v8, v8, v12			; RV64-NEXT: vadd.vv v8, v8, v12
	; RV64-NEXT: lui a0, 3855
	; RV64-NEXT: addiw a0, a0, 241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, -241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, -241
	; RV64-NEXT: vand.vx v8, v8, a0			; RV64-NEXT: vand.vx v8, v8, a0
	; RV64-NEXT: lui a0, 4112			; RV64-NEXT: vmul.vx v8, v8, a1
	; RV64-NEXT: addiw a0, a0, 257
	; RV64-NEXT: slli a0, a0, 16
	; RV64-NEXT: addi a0, a0, 257
	; RV64-NEXT: slli a0, a0, 16
	; RV64-NEXT: addi a0, a0, 257
	; RV64-NEXT: vmul.vx v8, v8, a0
	; RV64-NEXT: li a0, 56			; RV64-NEXT: li a0, 56
	; RV64-NEXT: vsrl.vx v8, v8, a0			; RV64-NEXT: vsrl.vx v8, v8, a0
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%a = call <vscale x 4 x i64> @llvm.cttz.nxv4i64(<vscale x 4 x i64> %va, i1 true)			%a = call <vscale x 4 x i64> @llvm.cttz.nxv4i64(<vscale x 4 x i64> %va, i1 true)
	ret <vscale x 4 x i64> %a			ret <vscale x 4 x i64> %a
	}			}

	define <vscale x 8 x i64> @cttz_zero_undef_nxv8i64(<vscale x 8 x i64> %va) {			define <vscale x 8 x i64> @cttz_zero_undef_nxv8i64(<vscale x 8 x i64> %va) {
	▲ Show 20 Lines • Show All 48 Lines • ▼ Show 20 Lines
	;			;
	; RV64-LABEL: cttz_zero_undef_nxv8i64:			; RV64-LABEL: cttz_zero_undef_nxv8i64:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: li a0, 1			; RV64-NEXT: li a0, 1
	; RV64-NEXT: vsetvli a1, zero, e64, m8, ta, mu			; RV64-NEXT: vsetvli a1, zero, e64, m8, ta, mu
	; RV64-NEXT: vsub.vx v16, v8, a0			; RV64-NEXT: vsub.vx v16, v8, a0
	; RV64-NEXT: vxor.vi v8, v8, -1			; RV64-NEXT: vxor.vi v8, v8, -1
	; RV64-NEXT: vand.vv v8, v8, v16			; RV64-NEXT: vand.vv v8, v8, v16
				; RV64-NEXT: lui a0, %hi(.LCPI43_0)
				; RV64-NEXT: ld a0, %lo(.LCPI43_0)(a0)
				; RV64-NEXT: lui a1, %hi(.LCPI43_1)
				; RV64-NEXT: ld a1, %lo(.LCPI43_1)(a1)
	; RV64-NEXT: vsrl.vi v16, v8, 1			; RV64-NEXT: vsrl.vi v16, v8, 1
	; RV64-NEXT: lui a0, 21845
	; RV64-NEXT: addiw a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: vand.vx v16, v16, a0			; RV64-NEXT: vand.vx v16, v16, a0
	; RV64-NEXT: vsub.vv v8, v8, v16			; RV64-NEXT: vsub.vv v8, v8, v16
	; RV64-NEXT: lui a0, 13107			; RV64-NEXT: vand.vx v16, v8, a1
	; RV64-NEXT: addiw a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: vand.vx v16, v8, a0
	; RV64-NEXT: vsrl.vi v8, v8, 2			; RV64-NEXT: vsrl.vi v8, v8, 2
	; RV64-NEXT: vand.vx v8, v8, a0			; RV64-NEXT: vand.vx v8, v8, a1
	; RV64-NEXT: vadd.vv v8, v16, v8			; RV64-NEXT: vadd.vv v8, v16, v8
				; RV64-NEXT: lui a0, %hi(.LCPI43_2)
				; RV64-NEXT: ld a0, %lo(.LCPI43_2)(a0)
				; RV64-NEXT: lui a1, %hi(.LCPI43_3)
				; RV64-NEXT: ld a1, %lo(.LCPI43_3)(a1)
	; RV64-NEXT: vsrl.vi v16, v8, 4			; RV64-NEXT: vsrl.vi v16, v8, 4
	; RV64-NEXT: vadd.vv v8, v8, v16			; RV64-NEXT: vadd.vv v8, v8, v16
	; RV64-NEXT: lui a0, 3855
	; RV64-NEXT: addiw a0, a0, 241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, -241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, -241
	; RV64-NEXT: vand.vx v8, v8, a0			; RV64-NEXT: vand.vx v8, v8, a0
	; RV64-NEXT: lui a0, 4112			; RV64-NEXT: vmul.vx v8, v8, a1
	; RV64-NEXT: addiw a0, a0, 257
	; RV64-NEXT: slli a0, a0, 16
	; RV64-NEXT: addi a0, a0, 257
	; RV64-NEXT: slli a0, a0, 16
	; RV64-NEXT: addi a0, a0, 257
	; RV64-NEXT: vmul.vx v8, v8, a0
	; RV64-NEXT: li a0, 56			; RV64-NEXT: li a0, 56
	; RV64-NEXT: vsrl.vx v8, v8, a0			; RV64-NEXT: vsrl.vx v8, v8, a0
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%a = call <vscale x 8 x i64> @llvm.cttz.nxv8i64(<vscale x 8 x i64> %va, i1 true)			%a = call <vscale x 8 x i64> @llvm.cttz.nxv8i64(<vscale x 8 x i64> %va, i1 true)
	ret <vscale x 8 x i64> %a			ret <vscale x 8 x i64> %a
	}			}

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-bitreverse.ll

	Show First 20 Lines • Show All 416 Lines • ▼ Show 20 Lines
	; LMULMAX2-RV64-NEXT: slli a4, a3, 40			; LMULMAX2-RV64-NEXT: slli a4, a3, 40
	; LMULMAX2-RV64-NEXT: vand.vx v11, v11, a4			; LMULMAX2-RV64-NEXT: vand.vx v11, v11, a4
	; LMULMAX2-RV64-NEXT: vor.vv v10, v11, v10			; LMULMAX2-RV64-NEXT: vor.vv v10, v11, v10
	; LMULMAX2-RV64-NEXT: vsll.vx v11, v8, a1			; LMULMAX2-RV64-NEXT: vsll.vx v11, v8, a1
	; LMULMAX2-RV64-NEXT: vsll.vx v8, v8, a2			; LMULMAX2-RV64-NEXT: vsll.vx v8, v8, a2
	; LMULMAX2-RV64-NEXT: slli a1, a3, 48			; LMULMAX2-RV64-NEXT: slli a1, a3, 48
	; LMULMAX2-RV64-NEXT: vand.vx v8, v8, a1			; LMULMAX2-RV64-NEXT: vand.vx v8, v8, a1
	; LMULMAX2-RV64-NEXT: vor.vv v8, v11, v8			; LMULMAX2-RV64-NEXT: vor.vv v8, v11, v8
				; LMULMAX2-RV64-NEXT: lui a1, %hi(.LCPI2_0)
				; LMULMAX2-RV64-NEXT: ld a1, %lo(.LCPI2_0)(a1)
	; LMULMAX2-RV64-NEXT: vor.vv v8, v8, v10			; LMULMAX2-RV64-NEXT: vor.vv v8, v8, v10
	; LMULMAX2-RV64-NEXT: vor.vv v8, v8, v9			; LMULMAX2-RV64-NEXT: vor.vv v8, v8, v9
	; LMULMAX2-RV64-NEXT: vsrl.vi v9, v8, 4			; LMULMAX2-RV64-NEXT: vsrl.vi v9, v8, 4
	; LMULMAX2-RV64-NEXT: lui a1, 3855
	; LMULMAX2-RV64-NEXT: addiw a1, a1, 241
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, -241
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 241
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, -241
	; LMULMAX2-RV64-NEXT: vand.vx v9, v9, a1			; LMULMAX2-RV64-NEXT: vand.vx v9, v9, a1
	; LMULMAX2-RV64-NEXT: vand.vx v8, v8, a1			; LMULMAX2-RV64-NEXT: vand.vx v8, v8, a1
				; LMULMAX2-RV64-NEXT: lui a1, %hi(.LCPI2_1)
				; LMULMAX2-RV64-NEXT: ld a1, %lo(.LCPI2_1)(a1)
	; LMULMAX2-RV64-NEXT: vsll.vi v8, v8, 4			; LMULMAX2-RV64-NEXT: vsll.vi v8, v8, 4
	; LMULMAX2-RV64-NEXT: vor.vv v8, v9, v8			; LMULMAX2-RV64-NEXT: vor.vv v8, v9, v8
	; LMULMAX2-RV64-NEXT: vsrl.vi v9, v8, 2			; LMULMAX2-RV64-NEXT: vsrl.vi v9, v8, 2
	; LMULMAX2-RV64-NEXT: lui a1, 13107
	; LMULMAX2-RV64-NEXT: addiw a1, a1, 819
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 819
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 819
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 819
	; LMULMAX2-RV64-NEXT: vand.vx v9, v9, a1			; LMULMAX2-RV64-NEXT: vand.vx v9, v9, a1
	; LMULMAX2-RV64-NEXT: vand.vx v8, v8, a1			; LMULMAX2-RV64-NEXT: vand.vx v8, v8, a1
				; LMULMAX2-RV64-NEXT: lui a1, %hi(.LCPI2_2)
				; LMULMAX2-RV64-NEXT: ld a1, %lo(.LCPI2_2)(a1)
	; LMULMAX2-RV64-NEXT: vsll.vi v8, v8, 2			; LMULMAX2-RV64-NEXT: vsll.vi v8, v8, 2
	; LMULMAX2-RV64-NEXT: vor.vv v8, v9, v8			; LMULMAX2-RV64-NEXT: vor.vv v8, v9, v8
	; LMULMAX2-RV64-NEXT: vsrl.vi v9, v8, 1			; LMULMAX2-RV64-NEXT: vsrl.vi v9, v8, 1
	; LMULMAX2-RV64-NEXT: lui a1, 21845
	; LMULMAX2-RV64-NEXT: addiw a1, a1, 1365
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 1365
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 1365
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 1365
	; LMULMAX2-RV64-NEXT: vand.vx v9, v9, a1			; LMULMAX2-RV64-NEXT: vand.vx v9, v9, a1
	; LMULMAX2-RV64-NEXT: vand.vx v8, v8, a1			; LMULMAX2-RV64-NEXT: vand.vx v8, v8, a1
	; LMULMAX2-RV64-NEXT: vadd.vv v8, v8, v8			; LMULMAX2-RV64-NEXT: vadd.vv v8, v8, v8
	; LMULMAX2-RV64-NEXT: vor.vv v8, v9, v8			; LMULMAX2-RV64-NEXT: vor.vv v8, v9, v8
	; LMULMAX2-RV64-NEXT: vse64.v v8, (a0)			; LMULMAX2-RV64-NEXT: vse64.v v8, (a0)
	; LMULMAX2-RV64-NEXT: ret			; LMULMAX2-RV64-NEXT: ret
	;			;
	; LMULMAX1-RV32-LABEL: bitreverse_v2i64:			; LMULMAX1-RV32-LABEL: bitreverse_v2i64:
	▲ Show 20 Lines • Show All 108 Lines • ▼ Show 20 Lines
	; LMULMAX1-RV64-NEXT: slli a4, a3, 40			; LMULMAX1-RV64-NEXT: slli a4, a3, 40
	; LMULMAX1-RV64-NEXT: vand.vx v11, v11, a4			; LMULMAX1-RV64-NEXT: vand.vx v11, v11, a4
	; LMULMAX1-RV64-NEXT: vor.vv v10, v11, v10			; LMULMAX1-RV64-NEXT: vor.vv v10, v11, v10
	; LMULMAX1-RV64-NEXT: vsll.vx v11, v8, a1			; LMULMAX1-RV64-NEXT: vsll.vx v11, v8, a1
	; LMULMAX1-RV64-NEXT: vsll.vx v8, v8, a2			; LMULMAX1-RV64-NEXT: vsll.vx v8, v8, a2
	; LMULMAX1-RV64-NEXT: slli a1, a3, 48			; LMULMAX1-RV64-NEXT: slli a1, a3, 48
	; LMULMAX1-RV64-NEXT: vand.vx v8, v8, a1			; LMULMAX1-RV64-NEXT: vand.vx v8, v8, a1
	; LMULMAX1-RV64-NEXT: vor.vv v8, v11, v8			; LMULMAX1-RV64-NEXT: vor.vv v8, v11, v8
				; LMULMAX1-RV64-NEXT: lui a1, %hi(.LCPI2_0)
				; LMULMAX1-RV64-NEXT: ld a1, %lo(.LCPI2_0)(a1)
	; LMULMAX1-RV64-NEXT: vor.vv v8, v8, v10			; LMULMAX1-RV64-NEXT: vor.vv v8, v8, v10
	; LMULMAX1-RV64-NEXT: vor.vv v8, v8, v9			; LMULMAX1-RV64-NEXT: vor.vv v8, v8, v9
	; LMULMAX1-RV64-NEXT: vsrl.vi v9, v8, 4			; LMULMAX1-RV64-NEXT: vsrl.vi v9, v8, 4
	; LMULMAX1-RV64-NEXT: lui a1, 3855
	; LMULMAX1-RV64-NEXT: addiw a1, a1, 241
	; LMULMAX1-RV64-NEXT: slli a1, a1, 12
	; LMULMAX1-RV64-NEXT: addi a1, a1, -241
	; LMULMAX1-RV64-NEXT: slli a1, a1, 12
	; LMULMAX1-RV64-NEXT: addi a1, a1, 241
	; LMULMAX1-RV64-NEXT: slli a1, a1, 12
	; LMULMAX1-RV64-NEXT: addi a1, a1, -241
	; LMULMAX1-RV64-NEXT: vand.vx v9, v9, a1			; LMULMAX1-RV64-NEXT: vand.vx v9, v9, a1
	; LMULMAX1-RV64-NEXT: vand.vx v8, v8, a1			; LMULMAX1-RV64-NEXT: vand.vx v8, v8, a1
				; LMULMAX1-RV64-NEXT: lui a1, %hi(.LCPI2_1)
				; LMULMAX1-RV64-NEXT: ld a1, %lo(.LCPI2_1)(a1)
	; LMULMAX1-RV64-NEXT: vsll.vi v8, v8, 4			; LMULMAX1-RV64-NEXT: vsll.vi v8, v8, 4
	; LMULMAX1-RV64-NEXT: vor.vv v8, v9, v8			; LMULMAX1-RV64-NEXT: vor.vv v8, v9, v8
	; LMULMAX1-RV64-NEXT: vsrl.vi v9, v8, 2			; LMULMAX1-RV64-NEXT: vsrl.vi v9, v8, 2
	; LMULMAX1-RV64-NEXT: lui a1, 13107
	; LMULMAX1-RV64-NEXT: addiw a1, a1, 819
	; LMULMAX1-RV64-NEXT: slli a1, a1, 12
	; LMULMAX1-RV64-NEXT: addi a1, a1, 819
	; LMULMAX1-RV64-NEXT: slli a1, a1, 12
	; LMULMAX1-RV64-NEXT: addi a1, a1, 819
	; LMULMAX1-RV64-NEXT: slli a1, a1, 12
	; LMULMAX1-RV64-NEXT: addi a1, a1, 819
	; LMULMAX1-RV64-NEXT: vand.vx v9, v9, a1			; LMULMAX1-RV64-NEXT: vand.vx v9, v9, a1
	; LMULMAX1-RV64-NEXT: vand.vx v8, v8, a1			; LMULMAX1-RV64-NEXT: vand.vx v8, v8, a1
				; LMULMAX1-RV64-NEXT: lui a1, %hi(.LCPI2_2)
				; LMULMAX1-RV64-NEXT: ld a1, %lo(.LCPI2_2)(a1)
	; LMULMAX1-RV64-NEXT: vsll.vi v8, v8, 2			; LMULMAX1-RV64-NEXT: vsll.vi v8, v8, 2
	; LMULMAX1-RV64-NEXT: vor.vv v8, v9, v8			; LMULMAX1-RV64-NEXT: vor.vv v8, v9, v8
	; LMULMAX1-RV64-NEXT: vsrl.vi v9, v8, 1			; LMULMAX1-RV64-NEXT: vsrl.vi v9, v8, 1
	; LMULMAX1-RV64-NEXT: lui a1, 21845
	; LMULMAX1-RV64-NEXT: addiw a1, a1, 1365
	; LMULMAX1-RV64-NEXT: slli a1, a1, 12
	; LMULMAX1-RV64-NEXT: addi a1, a1, 1365
	; LMULMAX1-RV64-NEXT: slli a1, a1, 12
	; LMULMAX1-RV64-NEXT: addi a1, a1, 1365
	; LMULMAX1-RV64-NEXT: slli a1, a1, 12
	; LMULMAX1-RV64-NEXT: addi a1, a1, 1365
	; LMULMAX1-RV64-NEXT: vand.vx v9, v9, a1			; LMULMAX1-RV64-NEXT: vand.vx v9, v9, a1
	; LMULMAX1-RV64-NEXT: vand.vx v8, v8, a1			; LMULMAX1-RV64-NEXT: vand.vx v8, v8, a1
	; LMULMAX1-RV64-NEXT: vadd.vv v8, v8, v8			; LMULMAX1-RV64-NEXT: vadd.vv v8, v8, v8
	; LMULMAX1-RV64-NEXT: vor.vv v8, v9, v8			; LMULMAX1-RV64-NEXT: vor.vv v8, v9, v8
	; LMULMAX1-RV64-NEXT: vse64.v v8, (a0)			; LMULMAX1-RV64-NEXT: vse64.v v8, (a0)
	; LMULMAX1-RV64-NEXT: ret			; LMULMAX1-RV64-NEXT: ret
	%a = load <2 x i64>, <2 x i64>* %x			%a = load <2 x i64>, <2 x i64>* %x
	%b = load <2 x i64>, <2 x i64>* %y			%b = load <2 x i64>, <2 x i64>* %y
	▲ Show 20 Lines • Show All 512 Lines • ▼ Show 20 Lines
	; LMULMAX2-RV64-NEXT: slli a4, a3, 40			; LMULMAX2-RV64-NEXT: slli a4, a3, 40
	; LMULMAX2-RV64-NEXT: vand.vx v14, v14, a4			; LMULMAX2-RV64-NEXT: vand.vx v14, v14, a4
	; LMULMAX2-RV64-NEXT: vor.vv v12, v14, v12			; LMULMAX2-RV64-NEXT: vor.vv v12, v14, v12
	; LMULMAX2-RV64-NEXT: vsll.vx v14, v8, a1			; LMULMAX2-RV64-NEXT: vsll.vx v14, v8, a1
	; LMULMAX2-RV64-NEXT: vsll.vx v8, v8, a2			; LMULMAX2-RV64-NEXT: vsll.vx v8, v8, a2
	; LMULMAX2-RV64-NEXT: slli a1, a3, 48			; LMULMAX2-RV64-NEXT: slli a1, a3, 48
	; LMULMAX2-RV64-NEXT: vand.vx v8, v8, a1			; LMULMAX2-RV64-NEXT: vand.vx v8, v8, a1
	; LMULMAX2-RV64-NEXT: vor.vv v8, v14, v8			; LMULMAX2-RV64-NEXT: vor.vv v8, v14, v8
				; LMULMAX2-RV64-NEXT: lui a1, %hi(.LCPI5_0)
				; LMULMAX2-RV64-NEXT: ld a1, %lo(.LCPI5_0)(a1)
	; LMULMAX2-RV64-NEXT: vor.vv v8, v8, v12			; LMULMAX2-RV64-NEXT: vor.vv v8, v8, v12
	; LMULMAX2-RV64-NEXT: vor.vv v8, v8, v10			; LMULMAX2-RV64-NEXT: vor.vv v8, v8, v10
	; LMULMAX2-RV64-NEXT: vsrl.vi v10, v8, 4			; LMULMAX2-RV64-NEXT: vsrl.vi v10, v8, 4
	; LMULMAX2-RV64-NEXT: lui a1, 3855
	; LMULMAX2-RV64-NEXT: addiw a1, a1, 241
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, -241
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 241
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, -241
	; LMULMAX2-RV64-NEXT: vand.vx v10, v10, a1			; LMULMAX2-RV64-NEXT: vand.vx v10, v10, a1
	; LMULMAX2-RV64-NEXT: vand.vx v8, v8, a1			; LMULMAX2-RV64-NEXT: vand.vx v8, v8, a1
				; LMULMAX2-RV64-NEXT: lui a1, %hi(.LCPI5_1)
				; LMULMAX2-RV64-NEXT: ld a1, %lo(.LCPI5_1)(a1)
	; LMULMAX2-RV64-NEXT: vsll.vi v8, v8, 4			; LMULMAX2-RV64-NEXT: vsll.vi v8, v8, 4
	; LMULMAX2-RV64-NEXT: vor.vv v8, v10, v8			; LMULMAX2-RV64-NEXT: vor.vv v8, v10, v8
	; LMULMAX2-RV64-NEXT: vsrl.vi v10, v8, 2			; LMULMAX2-RV64-NEXT: vsrl.vi v10, v8, 2
	; LMULMAX2-RV64-NEXT: lui a1, 13107
	; LMULMAX2-RV64-NEXT: addiw a1, a1, 819
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 819
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 819
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 819
	; LMULMAX2-RV64-NEXT: vand.vx v10, v10, a1			; LMULMAX2-RV64-NEXT: vand.vx v10, v10, a1
	; LMULMAX2-RV64-NEXT: vand.vx v8, v8, a1			; LMULMAX2-RV64-NEXT: vand.vx v8, v8, a1
				; LMULMAX2-RV64-NEXT: lui a1, %hi(.LCPI5_2)
				; LMULMAX2-RV64-NEXT: ld a1, %lo(.LCPI5_2)(a1)
	; LMULMAX2-RV64-NEXT: vsll.vi v8, v8, 2			; LMULMAX2-RV64-NEXT: vsll.vi v8, v8, 2
	; LMULMAX2-RV64-NEXT: vor.vv v8, v10, v8			; LMULMAX2-RV64-NEXT: vor.vv v8, v10, v8
	; LMULMAX2-RV64-NEXT: vsrl.vi v10, v8, 1			; LMULMAX2-RV64-NEXT: vsrl.vi v10, v8, 1
	; LMULMAX2-RV64-NEXT: lui a1, 21845
	; LMULMAX2-RV64-NEXT: addiw a1, a1, 1365
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 1365
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 1365
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 1365
	; LMULMAX2-RV64-NEXT: vand.vx v10, v10, a1			; LMULMAX2-RV64-NEXT: vand.vx v10, v10, a1
	; LMULMAX2-RV64-NEXT: vand.vx v8, v8, a1			; LMULMAX2-RV64-NEXT: vand.vx v8, v8, a1
	; LMULMAX2-RV64-NEXT: vadd.vv v8, v8, v8			; LMULMAX2-RV64-NEXT: vadd.vv v8, v8, v8
	; LMULMAX2-RV64-NEXT: vor.vv v8, v10, v8			; LMULMAX2-RV64-NEXT: vor.vv v8, v10, v8
	; LMULMAX2-RV64-NEXT: vse64.v v8, (a0)			; LMULMAX2-RV64-NEXT: vse64.v v8, (a0)
	; LMULMAX2-RV64-NEXT: ret			; LMULMAX2-RV64-NEXT: ret
	;			;
	; LMULMAX1-RV32-LABEL: bitreverse_v4i64:			; LMULMAX1-RV32-LABEL: bitreverse_v4i64:
	▲ Show 20 Lines • Show All 124 Lines • ▼ Show 20 Lines
	; LMULMAX1-RV64-NEXT: vsetivli zero, 2, e64, m1, ta, mu			; LMULMAX1-RV64-NEXT: vsetivli zero, 2, e64, m1, ta, mu
	; LMULMAX1-RV64-NEXT: addi a7, a0, 16			; LMULMAX1-RV64-NEXT: addi a7, a0, 16
	; LMULMAX1-RV64-NEXT: vle64.v v9, (a7)			; LMULMAX1-RV64-NEXT: vle64.v v9, (a7)
	; LMULMAX1-RV64-NEXT: vle64.v v8, (a0)			; LMULMAX1-RV64-NEXT: vle64.v v8, (a0)
	; LMULMAX1-RV64-NEXT: li t0, 56			; LMULMAX1-RV64-NEXT: li t0, 56
	; LMULMAX1-RV64-NEXT: vsrl.vx v10, v9, t0			; LMULMAX1-RV64-NEXT: vsrl.vx v10, v9, t0
	; LMULMAX1-RV64-NEXT: li t1, 40			; LMULMAX1-RV64-NEXT: li t1, 40
	; LMULMAX1-RV64-NEXT: vsrl.vx v11, v9, t1			; LMULMAX1-RV64-NEXT: vsrl.vx v11, v9, t1
	; LMULMAX1-RV64-NEXT: lui a1, 16			; LMULMAX1-RV64-NEXT: lui a4, 16
	; LMULMAX1-RV64-NEXT: addiw t2, a1, -256			; LMULMAX1-RV64-NEXT: addiw t2, a4, -256
	; LMULMAX1-RV64-NEXT: vand.vx v11, v11, t2			; LMULMAX1-RV64-NEXT: vand.vx v11, v11, t2
	; LMULMAX1-RV64-NEXT: vor.vv v10, v11, v10			; LMULMAX1-RV64-NEXT: vor.vv v10, v11, v10
	; LMULMAX1-RV64-NEXT: vsrl.vi v11, v9, 24			; LMULMAX1-RV64-NEXT: vsrl.vi v11, v9, 24
	; LMULMAX1-RV64-NEXT: lui a6, 4080			; LMULMAX1-RV64-NEXT: lui a6, 4080
	; LMULMAX1-RV64-NEXT: vand.vx v11, v11, a6			; LMULMAX1-RV64-NEXT: vand.vx v11, v11, a6
	; LMULMAX1-RV64-NEXT: vsrl.vi v12, v9, 8			; LMULMAX1-RV64-NEXT: vsrl.vi v12, v9, 8
	; LMULMAX1-RV64-NEXT: li a3, 255			; LMULMAX1-RV64-NEXT: li a5, 255
	; LMULMAX1-RV64-NEXT: slli t3, a3, 24			; LMULMAX1-RV64-NEXT: slli t3, a5, 24
	; LMULMAX1-RV64-NEXT: vand.vx v12, v12, t3			; LMULMAX1-RV64-NEXT: vand.vx v12, v12, t3
	; LMULMAX1-RV64-NEXT: vor.vv v11, v12, v11			; LMULMAX1-RV64-NEXT: vor.vv v11, v12, v11
	; LMULMAX1-RV64-NEXT: vor.vv v10, v11, v10			; LMULMAX1-RV64-NEXT: vor.vv v10, v11, v10
	; LMULMAX1-RV64-NEXT: vsll.vi v11, v9, 8			; LMULMAX1-RV64-NEXT: vsll.vi v11, v9, 8
	; LMULMAX1-RV64-NEXT: slli t4, a3, 32			; LMULMAX1-RV64-NEXT: slli t4, a5, 32
	; LMULMAX1-RV64-NEXT: vand.vx v11, v11, t4			; LMULMAX1-RV64-NEXT: vand.vx v11, v11, t4
	; LMULMAX1-RV64-NEXT: vsll.vi v12, v9, 24			; LMULMAX1-RV64-NEXT: vsll.vi v12, v9, 24
	; LMULMAX1-RV64-NEXT: slli a2, a3, 40			; LMULMAX1-RV64-NEXT: slli a3, a5, 40
	; LMULMAX1-RV64-NEXT: vand.vx v12, v12, a2			; LMULMAX1-RV64-NEXT: vand.vx v12, v12, a3
	; LMULMAX1-RV64-NEXT: vor.vv v11, v12, v11			; LMULMAX1-RV64-NEXT: vor.vv v11, v12, v11
	; LMULMAX1-RV64-NEXT: vsll.vx v12, v9, t0			; LMULMAX1-RV64-NEXT: vsll.vx v12, v9, t0
	; LMULMAX1-RV64-NEXT: vsll.vx v9, v9, t1			; LMULMAX1-RV64-NEXT: vsll.vx v9, v9, t1
	; LMULMAX1-RV64-NEXT: slli a3, a3, 48			; LMULMAX1-RV64-NEXT: slli a5, a5, 48
	; LMULMAX1-RV64-NEXT: vand.vx v9, v9, a3			; LMULMAX1-RV64-NEXT: vand.vx v9, v9, a5
	; LMULMAX1-RV64-NEXT: vor.vv v9, v12, v9			; LMULMAX1-RV64-NEXT: vor.vv v9, v12, v9
				; LMULMAX1-RV64-NEXT: lui a4, %hi(.LCPI5_0)
				; LMULMAX1-RV64-NEXT: ld a4, %lo(.LCPI5_0)(a4)
	; LMULMAX1-RV64-NEXT: vor.vv v9, v9, v11			; LMULMAX1-RV64-NEXT: vor.vv v9, v9, v11
	; LMULMAX1-RV64-NEXT: vor.vv v9, v9, v10			; LMULMAX1-RV64-NEXT: vor.vv v9, v9, v10
	; LMULMAX1-RV64-NEXT: vsrl.vi v10, v9, 4			; LMULMAX1-RV64-NEXT: vsrl.vi v10, v9, 4
	; LMULMAX1-RV64-NEXT: lui a4, 3855
	; LMULMAX1-RV64-NEXT: addiw a4, a4, 241
	; LMULMAX1-RV64-NEXT: slli a4, a4, 12
	; LMULMAX1-RV64-NEXT: addi a4, a4, -241
	; LMULMAX1-RV64-NEXT: slli a4, a4, 12
	; LMULMAX1-RV64-NEXT: addi a4, a4, 241
	; LMULMAX1-RV64-NEXT: slli a4, a4, 12
	; LMULMAX1-RV64-NEXT: addi a4, a4, -241
	; LMULMAX1-RV64-NEXT: vand.vx v10, v10, a4			; LMULMAX1-RV64-NEXT: vand.vx v10, v10, a4
	; LMULMAX1-RV64-NEXT: vand.vx v9, v9, a4			; LMULMAX1-RV64-NEXT: vand.vx v9, v9, a4
				; LMULMAX1-RV64-NEXT: lui a1, %hi(.LCPI5_1)
				; LMULMAX1-RV64-NEXT: ld a1, %lo(.LCPI5_1)(a1)
	; LMULMAX1-RV64-NEXT: vsll.vi v9, v9, 4			; LMULMAX1-RV64-NEXT: vsll.vi v9, v9, 4
	; LMULMAX1-RV64-NEXT: vor.vv v9, v10, v9			; LMULMAX1-RV64-NEXT: vor.vv v9, v10, v9
	; LMULMAX1-RV64-NEXT: vsrl.vi v10, v9, 2			; LMULMAX1-RV64-NEXT: vsrl.vi v10, v9, 2
	; LMULMAX1-RV64-NEXT: lui a5, 13107			; LMULMAX1-RV64-NEXT: vand.vx v10, v10, a1
	; LMULMAX1-RV64-NEXT: addiw a5, a5, 819			; LMULMAX1-RV64-NEXT: vand.vx v9, v9, a1
	; LMULMAX1-RV64-NEXT: slli a5, a5, 12			; LMULMAX1-RV64-NEXT: lui a2, %hi(.LCPI5_2)
	; LMULMAX1-RV64-NEXT: addi a5, a5, 819			; LMULMAX1-RV64-NEXT: ld a2, %lo(.LCPI5_2)(a2)
	; LMULMAX1-RV64-NEXT: slli a5, a5, 12
	; LMULMAX1-RV64-NEXT: addi a5, a5, 819
	; LMULMAX1-RV64-NEXT: slli a5, a5, 12
	; LMULMAX1-RV64-NEXT: addi a5, a5, 819
	; LMULMAX1-RV64-NEXT: vand.vx v10, v10, a5
	; LMULMAX1-RV64-NEXT: vand.vx v9, v9, a5
	; LMULMAX1-RV64-NEXT: vsll.vi v9, v9, 2			; LMULMAX1-RV64-NEXT: vsll.vi v9, v9, 2
	; LMULMAX1-RV64-NEXT: vor.vv v9, v10, v9			; LMULMAX1-RV64-NEXT: vor.vv v9, v10, v9
	; LMULMAX1-RV64-NEXT: vsrl.vi v10, v9, 1			; LMULMAX1-RV64-NEXT: vsrl.vi v10, v9, 1
	; LMULMAX1-RV64-NEXT: lui a1, 21845			; LMULMAX1-RV64-NEXT: vand.vx v10, v10, a2
	; LMULMAX1-RV64-NEXT: addiw a1, a1, 1365			; LMULMAX1-RV64-NEXT: vand.vx v9, v9, a2
	; LMULMAX1-RV64-NEXT: slli a1, a1, 12
	; LMULMAX1-RV64-NEXT: addi a1, a1, 1365
	; LMULMAX1-RV64-NEXT: slli a1, a1, 12
	; LMULMAX1-RV64-NEXT: addi a1, a1, 1365
	; LMULMAX1-RV64-NEXT: slli a1, a1, 12
	; LMULMAX1-RV64-NEXT: addi a1, a1, 1365
	; LMULMAX1-RV64-NEXT: vand.vx v10, v10, a1
	; LMULMAX1-RV64-NEXT: vand.vx v9, v9, a1
	; LMULMAX1-RV64-NEXT: vadd.vv v9, v9, v9			; LMULMAX1-RV64-NEXT: vadd.vv v9, v9, v9
	; LMULMAX1-RV64-NEXT: vor.vv v9, v10, v9			; LMULMAX1-RV64-NEXT: vor.vv v9, v10, v9
	; LMULMAX1-RV64-NEXT: vsrl.vx v10, v8, t0			; LMULMAX1-RV64-NEXT: vsrl.vx v10, v8, t0
	; LMULMAX1-RV64-NEXT: vsrl.vx v11, v8, t1			; LMULMAX1-RV64-NEXT: vsrl.vx v11, v8, t1
	; LMULMAX1-RV64-NEXT: vand.vx v11, v11, t2			; LMULMAX1-RV64-NEXT: vand.vx v11, v11, t2
	; LMULMAX1-RV64-NEXT: vor.vv v10, v11, v10			; LMULMAX1-RV64-NEXT: vor.vv v10, v11, v10
	; LMULMAX1-RV64-NEXT: vsrl.vi v11, v8, 24			; LMULMAX1-RV64-NEXT: vsrl.vi v11, v8, 24
	; LMULMAX1-RV64-NEXT: vand.vx v11, v11, a6			; LMULMAX1-RV64-NEXT: vand.vx v11, v11, a6
	; LMULMAX1-RV64-NEXT: vsrl.vi v12, v8, 8			; LMULMAX1-RV64-NEXT: vsrl.vi v12, v8, 8
	; LMULMAX1-RV64-NEXT: vand.vx v12, v12, t3			; LMULMAX1-RV64-NEXT: vand.vx v12, v12, t3
	; LMULMAX1-RV64-NEXT: vor.vv v11, v12, v11			; LMULMAX1-RV64-NEXT: vor.vv v11, v12, v11
	; LMULMAX1-RV64-NEXT: vor.vv v10, v11, v10			; LMULMAX1-RV64-NEXT: vor.vv v10, v11, v10
	; LMULMAX1-RV64-NEXT: vsll.vi v11, v8, 8			; LMULMAX1-RV64-NEXT: vsll.vi v11, v8, 8
	; LMULMAX1-RV64-NEXT: vand.vx v11, v11, t4			; LMULMAX1-RV64-NEXT: vand.vx v11, v11, t4
	; LMULMAX1-RV64-NEXT: vsll.vi v12, v8, 24			; LMULMAX1-RV64-NEXT: vsll.vi v12, v8, 24
	; LMULMAX1-RV64-NEXT: vand.vx v12, v12, a2			; LMULMAX1-RV64-NEXT: vand.vx v12, v12, a3
	; LMULMAX1-RV64-NEXT: vor.vv v11, v12, v11			; LMULMAX1-RV64-NEXT: vor.vv v11, v12, v11
	; LMULMAX1-RV64-NEXT: vsll.vx v12, v8, t0			; LMULMAX1-RV64-NEXT: vsll.vx v12, v8, t0
	; LMULMAX1-RV64-NEXT: vsll.vx v8, v8, t1			; LMULMAX1-RV64-NEXT: vsll.vx v8, v8, t1
	; LMULMAX1-RV64-NEXT: vand.vx v8, v8, a3			; LMULMAX1-RV64-NEXT: vand.vx v8, v8, a5
	; LMULMAX1-RV64-NEXT: vor.vv v8, v12, v8			; LMULMAX1-RV64-NEXT: vor.vv v8, v12, v8
	; LMULMAX1-RV64-NEXT: vor.vv v8, v8, v11			; LMULMAX1-RV64-NEXT: vor.vv v8, v8, v11
	; LMULMAX1-RV64-NEXT: vor.vv v8, v8, v10			; LMULMAX1-RV64-NEXT: vor.vv v8, v8, v10
	; LMULMAX1-RV64-NEXT: vsrl.vi v10, v8, 4			; LMULMAX1-RV64-NEXT: vsrl.vi v10, v8, 4
	; LMULMAX1-RV64-NEXT: vand.vx v10, v10, a4			; LMULMAX1-RV64-NEXT: vand.vx v10, v10, a4
	; LMULMAX1-RV64-NEXT: vand.vx v8, v8, a4			; LMULMAX1-RV64-NEXT: vand.vx v8, v8, a4
	; LMULMAX1-RV64-NEXT: vsll.vi v8, v8, 4			; LMULMAX1-RV64-NEXT: vsll.vi v8, v8, 4
	; LMULMAX1-RV64-NEXT: vor.vv v8, v10, v8			; LMULMAX1-RV64-NEXT: vor.vv v8, v10, v8
	; LMULMAX1-RV64-NEXT: vsrl.vi v10, v8, 2			; LMULMAX1-RV64-NEXT: vsrl.vi v10, v8, 2
	; LMULMAX1-RV64-NEXT: vand.vx v10, v10, a5			; LMULMAX1-RV64-NEXT: vand.vx v10, v10, a1
	; LMULMAX1-RV64-NEXT: vand.vx v8, v8, a5			; LMULMAX1-RV64-NEXT: vand.vx v8, v8, a1
	; LMULMAX1-RV64-NEXT: vsll.vi v8, v8, 2			; LMULMAX1-RV64-NEXT: vsll.vi v8, v8, 2
	; LMULMAX1-RV64-NEXT: vor.vv v8, v10, v8			; LMULMAX1-RV64-NEXT: vor.vv v8, v10, v8
	; LMULMAX1-RV64-NEXT: vsrl.vi v10, v8, 1			; LMULMAX1-RV64-NEXT: vsrl.vi v10, v8, 1
	; LMULMAX1-RV64-NEXT: vand.vx v10, v10, a1			; LMULMAX1-RV64-NEXT: vand.vx v10, v10, a2
	; LMULMAX1-RV64-NEXT: vand.vx v8, v8, a1			; LMULMAX1-RV64-NEXT: vand.vx v8, v8, a2
	; LMULMAX1-RV64-NEXT: vadd.vv v8, v8, v8			; LMULMAX1-RV64-NEXT: vadd.vv v8, v8, v8
	; LMULMAX1-RV64-NEXT: vor.vv v8, v10, v8			; LMULMAX1-RV64-NEXT: vor.vv v8, v10, v8
	; LMULMAX1-RV64-NEXT: vse64.v v8, (a0)			; LMULMAX1-RV64-NEXT: vse64.v v8, (a0)
	; LMULMAX1-RV64-NEXT: vse64.v v9, (a7)			; LMULMAX1-RV64-NEXT: vse64.v v9, (a7)
	; LMULMAX1-RV64-NEXT: ret			; LMULMAX1-RV64-NEXT: ret
	%a = load <4 x i64>, <4 x i64>* %x			%a = load <4 x i64>, <4 x i64>* %x
	%b = load <4 x i64>, <4 x i64>* %y			%b = load <4 x i64>, <4 x i64>* %y
	%c = call <4 x i64> @llvm.bitreverse.v4i64(<4 x i64> %a)			%c = call <4 x i64> @llvm.bitreverse.v4i64(<4 x i64> %a)
	store <4 x i64> %c, <4 x i64>* %x			store <4 x i64> %c, <4 x i64>* %x
	ret void			ret void
	}			}
	declare <4 x i64> @llvm.bitreverse.v4i64(<4 x i64>)			declare <4 x i64> @llvm.bitreverse.v4i64(<4 x i64>)

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-ctlz.ll

	Show First 20 Lines • Show All 652 Lines • ▼ Show 20 Lines
	; LMULMAX2-RV64-NEXT: vsrl.vi v9, v8, 8			; LMULMAX2-RV64-NEXT: vsrl.vi v9, v8, 8
	; LMULMAX2-RV64-NEXT: vor.vv v8, v8, v9			; LMULMAX2-RV64-NEXT: vor.vv v8, v8, v9
	; LMULMAX2-RV64-NEXT: vsrl.vi v9, v8, 16			; LMULMAX2-RV64-NEXT: vsrl.vi v9, v8, 16
	; LMULMAX2-RV64-NEXT: vor.vv v8, v8, v9			; LMULMAX2-RV64-NEXT: vor.vv v8, v8, v9
	; LMULMAX2-RV64-NEXT: li a1, 32			; LMULMAX2-RV64-NEXT: li a1, 32
	; LMULMAX2-RV64-NEXT: vsrl.vx v9, v8, a1			; LMULMAX2-RV64-NEXT: vsrl.vx v9, v8, a1
	; LMULMAX2-RV64-NEXT: vor.vv v8, v8, v9			; LMULMAX2-RV64-NEXT: vor.vv v8, v8, v9
	; LMULMAX2-RV64-NEXT: vxor.vi v8, v8, -1			; LMULMAX2-RV64-NEXT: vxor.vi v8, v8, -1
				; LMULMAX2-RV64-NEXT: lui a1, %hi(.LCPI3_0)
				; LMULMAX2-RV64-NEXT: ld a1, %lo(.LCPI3_0)(a1)
				; LMULMAX2-RV64-NEXT: lui a2, %hi(.LCPI3_1)
				; LMULMAX2-RV64-NEXT: ld a2, %lo(.LCPI3_1)(a2)
	; LMULMAX2-RV64-NEXT: vsrl.vi v9, v8, 1			; LMULMAX2-RV64-NEXT: vsrl.vi v9, v8, 1
	; LMULMAX2-RV64-NEXT: lui a1, 21845
	; LMULMAX2-RV64-NEXT: addiw a1, a1, 1365
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 1365
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 1365
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 1365
	; LMULMAX2-RV64-NEXT: vand.vx v9, v9, a1			; LMULMAX2-RV64-NEXT: vand.vx v9, v9, a1
	; LMULMAX2-RV64-NEXT: vsub.vv v8, v8, v9			; LMULMAX2-RV64-NEXT: vsub.vv v8, v8, v9
	; LMULMAX2-RV64-NEXT: lui a1, 13107			; LMULMAX2-RV64-NEXT: vand.vx v9, v8, a2
	; LMULMAX2-RV64-NEXT: addiw a1, a1, 819
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 819
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 819
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 819
	; LMULMAX2-RV64-NEXT: vand.vx v9, v8, a1
	; LMULMAX2-RV64-NEXT: vsrl.vi v8, v8, 2			; LMULMAX2-RV64-NEXT: vsrl.vi v8, v8, 2
	; LMULMAX2-RV64-NEXT: vand.vx v8, v8, a1			; LMULMAX2-RV64-NEXT: vand.vx v8, v8, a2
	; LMULMAX2-RV64-NEXT: vadd.vv v8, v9, v8			; LMULMAX2-RV64-NEXT: vadd.vv v8, v9, v8
				; LMULMAX2-RV64-NEXT: lui a1, %hi(.LCPI3_2)
				; LMULMAX2-RV64-NEXT: ld a1, %lo(.LCPI3_2)(a1)
				; LMULMAX2-RV64-NEXT: lui a2, %hi(.LCPI3_3)
				; LMULMAX2-RV64-NEXT: ld a2, %lo(.LCPI3_3)(a2)
	; LMULMAX2-RV64-NEXT: vsrl.vi v9, v8, 4			; LMULMAX2-RV64-NEXT: vsrl.vi v9, v8, 4
	; LMULMAX2-RV64-NEXT: vadd.vv v8, v8, v9			; LMULMAX2-RV64-NEXT: vadd.vv v8, v8, v9
	; LMULMAX2-RV64-NEXT: lui a1, 3855
	; LMULMAX2-RV64-NEXT: addiw a1, a1, 241
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, -241
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 241
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, -241
	; LMULMAX2-RV64-NEXT: vand.vx v8, v8, a1			; LMULMAX2-RV64-NEXT: vand.vx v8, v8, a1
	; LMULMAX2-RV64-NEXT: lui a1, 4112			; LMULMAX2-RV64-NEXT: vmul.vx v8, v8, a2
	; LMULMAX2-RV64-NEXT: addiw a1, a1, 257
	; LMULMAX2-RV64-NEXT: slli a1, a1, 16
	; LMULMAX2-RV64-NEXT: addi a1, a1, 257
	; LMULMAX2-RV64-NEXT: slli a1, a1, 16
	; LMULMAX2-RV64-NEXT: addi a1, a1, 257
	; LMULMAX2-RV64-NEXT: vmul.vx v8, v8, a1
	; LMULMAX2-RV64-NEXT: li a1, 56			; LMULMAX2-RV64-NEXT: li a1, 56
	; LMULMAX2-RV64-NEXT: vsrl.vx v8, v8, a1			; LMULMAX2-RV64-NEXT: vsrl.vx v8, v8, a1
	; LMULMAX2-RV64-NEXT: vse64.v v8, (a0)			; LMULMAX2-RV64-NEXT: vse64.v v8, (a0)
	; LMULMAX2-RV64-NEXT: ret			; LMULMAX2-RV64-NEXT: ret
	;			;
	; LMULMAX1-RV32-LABEL: ctlz_v2i64:			; LMULMAX1-RV32-LABEL: ctlz_v2i64:
	; LMULMAX1-RV32: # %bb.0:			; LMULMAX1-RV32: # %bb.0:
	; LMULMAX1-RV32-NEXT: vsetivli zero, 2, e64, m1, ta, mu			; LMULMAX1-RV32-NEXT: vsetivli zero, 2, e64, m1, ta, mu
	▲ Show 20 Lines • Show All 64 Lines • ▼ Show 20 Lines
	; LMULMAX1-RV64-NEXT: vsrl.vi v9, v8, 8			; LMULMAX1-RV64-NEXT: vsrl.vi v9, v8, 8
	; LMULMAX1-RV64-NEXT: vor.vv v8, v8, v9			; LMULMAX1-RV64-NEXT: vor.vv v8, v8, v9
	; LMULMAX1-RV64-NEXT: vsrl.vi v9, v8, 16			; LMULMAX1-RV64-NEXT: vsrl.vi v9, v8, 16
	; LMULMAX1-RV64-NEXT: vor.vv v8, v8, v9			; LMULMAX1-RV64-NEXT: vor.vv v8, v8, v9
	; LMULMAX1-RV64-NEXT: li a1, 32			; LMULMAX1-RV64-NEXT: li a1, 32
	; LMULMAX1-RV64-NEXT: vsrl.vx v9, v8, a1			; LMULMAX1-RV64-NEXT: vsrl.vx v9, v8, a1
	; LMULMAX1-RV64-NEXT: vor.vv v8, v8, v9			; LMULMAX1-RV64-NEXT: vor.vv v8, v8, v9
	; LMULMAX1-RV64-NEXT: vxor.vi v8, v8, -1			; LMULMAX1-RV64-NEXT: vxor.vi v8, v8, -1
				; LMULMAX1-RV64-NEXT: lui a1, %hi(.LCPI3_0)
				; LMULMAX1-RV64-NEXT: ld a1, %lo(.LCPI3_0)(a1)
				; LMULMAX1-RV64-NEXT: lui a2, %hi(.LCPI3_1)
				; LMULMAX1-RV64-NEXT: ld a2, %lo(.LCPI3_1)(a2)
	; LMULMAX1-RV64-NEXT: vsrl.vi v9, v8, 1			; LMULMAX1-RV64-NEXT: vsrl.vi v9, v8, 1
	; LMULMAX1-RV64-NEXT: lui a1, 21845
	; LMULMAX1-RV64-NEXT: addiw a1, a1, 1365
	; LMULMAX1-RV64-NEXT: slli a1, a1, 12
	; LMULMAX1-RV64-NEXT: addi a1, a1, 1365
	; LMULMAX1-RV64-NEXT: slli a1, a1, 12
	; LMULMAX1-RV64-NEXT: addi a1, a1, 1365
	; LMULMAX1-RV64-NEXT: slli a1, a1, 12
	; LMULMAX1-RV64-NEXT: addi a1, a1, 1365
	; LMULMAX1-RV64-NEXT: vand.vx v9, v9, a1			; LMULMAX1-RV64-NEXT: vand.vx v9, v9, a1
	; LMULMAX1-RV64-NEXT: vsub.vv v8, v8, v9			; LMULMAX1-RV64-NEXT: vsub.vv v8, v8, v9
	; LMULMAX1-RV64-NEXT: lui a1, 13107			; LMULMAX1-RV64-NEXT: vand.vx v9, v8, a2
	; LMULMAX1-RV64-NEXT: addiw a1, a1, 819
	; LMULMAX1-RV64-NEXT: slli a1, a1, 12
	; LMULMAX1-RV64-NEXT: addi a1, a1, 819
	; LMULMAX1-RV64-NEXT: slli a1, a1, 12
	; LMULMAX1-RV64-NEXT: addi a1, a1, 819
	; LMULMAX1-RV64-NEXT: slli a1, a1, 12
	; LMULMAX1-RV64-NEXT: addi a1, a1, 819
	; LMULMAX1-RV64-NEXT: vand.vx v9, v8, a1
	; LMULMAX1-RV64-NEXT: vsrl.vi v8, v8, 2			; LMULMAX1-RV64-NEXT: vsrl.vi v8, v8, 2
	; LMULMAX1-RV64-NEXT: vand.vx v8, v8, a1			; LMULMAX1-RV64-NEXT: vand.vx v8, v8, a2
	; LMULMAX1-RV64-NEXT: vadd.vv v8, v9, v8			; LMULMAX1-RV64-NEXT: vadd.vv v8, v9, v8
				; LMULMAX1-RV64-NEXT: lui a1, %hi(.LCPI3_2)
				; LMULMAX1-RV64-NEXT: ld a1, %lo(.LCPI3_2)(a1)
				; LMULMAX1-RV64-NEXT: lui a2, %hi(.LCPI3_3)
				; LMULMAX1-RV64-NEXT: ld a2, %lo(.LCPI3_3)(a2)
	; LMULMAX1-RV64-NEXT: vsrl.vi v9, v8, 4			; LMULMAX1-RV64-NEXT: vsrl.vi v9, v8, 4
	; LMULMAX1-RV64-NEXT: vadd.vv v8, v8, v9			; LMULMAX1-RV64-NEXT: vadd.vv v8, v8, v9
	; LMULMAX1-RV64-NEXT: lui a1, 3855
	; LMULMAX1-RV64-NEXT: addiw a1, a1, 241
	; LMULMAX1-RV64-NEXT: slli a1, a1, 12
	; LMULMAX1-RV64-NEXT: addi a1, a1, -241
	; LMULMAX1-RV64-NEXT: slli a1, a1, 12
	; LMULMAX1-RV64-NEXT: addi a1, a1, 241
	; LMULMAX1-RV64-NEXT: slli a1, a1, 12
	; LMULMAX1-RV64-NEXT: addi a1, a1, -241
	; LMULMAX1-RV64-NEXT: vand.vx v8, v8, a1			; LMULMAX1-RV64-NEXT: vand.vx v8, v8, a1
	; LMULMAX1-RV64-NEXT: lui a1, 4112			; LMULMAX1-RV64-NEXT: vmul.vx v8, v8, a2
	; LMULMAX1-RV64-NEXT: addiw a1, a1, 257
	; LMULMAX1-RV64-NEXT: slli a1, a1, 16
	; LMULMAX1-RV64-NEXT: addi a1, a1, 257
	; LMULMAX1-RV64-NEXT: slli a1, a1, 16
	; LMULMAX1-RV64-NEXT: addi a1, a1, 257
	; LMULMAX1-RV64-NEXT: vmul.vx v8, v8, a1
	; LMULMAX1-RV64-NEXT: li a1, 56			; LMULMAX1-RV64-NEXT: li a1, 56
	; LMULMAX1-RV64-NEXT: vsrl.vx v8, v8, a1			; LMULMAX1-RV64-NEXT: vsrl.vx v8, v8, a1
	; LMULMAX1-RV64-NEXT: vse64.v v8, (a0)			; LMULMAX1-RV64-NEXT: vse64.v v8, (a0)
	; LMULMAX1-RV64-NEXT: ret			; LMULMAX1-RV64-NEXT: ret
	;			;
	; LMULMAX8-RV32-LABEL: ctlz_v2i64:			; LMULMAX8-RV32-LABEL: ctlz_v2i64:
	; LMULMAX8-RV32: # %bb.0:			; LMULMAX8-RV32: # %bb.0:
	; LMULMAX8-RV32-NEXT: vsetivli zero, 2, e64, m1, ta, mu			; LMULMAX8-RV32-NEXT: vsetivli zero, 2, e64, m1, ta, mu
	▲ Show 20 Lines • Show All 64 Lines • ▼ Show 20 Lines
	; LMULMAX8-RV64-NEXT: vsrl.vi v9, v8, 8			; LMULMAX8-RV64-NEXT: vsrl.vi v9, v8, 8
	; LMULMAX8-RV64-NEXT: vor.vv v8, v8, v9			; LMULMAX8-RV64-NEXT: vor.vv v8, v8, v9
	; LMULMAX8-RV64-NEXT: vsrl.vi v9, v8, 16			; LMULMAX8-RV64-NEXT: vsrl.vi v9, v8, 16
	; LMULMAX8-RV64-NEXT: vor.vv v8, v8, v9			; LMULMAX8-RV64-NEXT: vor.vv v8, v8, v9
	; LMULMAX8-RV64-NEXT: li a1, 32			; LMULMAX8-RV64-NEXT: li a1, 32
	; LMULMAX8-RV64-NEXT: vsrl.vx v9, v8, a1			; LMULMAX8-RV64-NEXT: vsrl.vx v9, v8, a1
	; LMULMAX8-RV64-NEXT: vor.vv v8, v8, v9			; LMULMAX8-RV64-NEXT: vor.vv v8, v8, v9
	; LMULMAX8-RV64-NEXT: vxor.vi v8, v8, -1			; LMULMAX8-RV64-NEXT: vxor.vi v8, v8, -1
				; LMULMAX8-RV64-NEXT: lui a1, %hi(.LCPI3_0)
				; LMULMAX8-RV64-NEXT: ld a1, %lo(.LCPI3_0)(a1)
				; LMULMAX8-RV64-NEXT: lui a2, %hi(.LCPI3_1)
				; LMULMAX8-RV64-NEXT: ld a2, %lo(.LCPI3_1)(a2)
	; LMULMAX8-RV64-NEXT: vsrl.vi v9, v8, 1			; LMULMAX8-RV64-NEXT: vsrl.vi v9, v8, 1
	; LMULMAX8-RV64-NEXT: lui a1, 21845
	; LMULMAX8-RV64-NEXT: addiw a1, a1, 1365
	; LMULMAX8-RV64-NEXT: slli a1, a1, 12
	; LMULMAX8-RV64-NEXT: addi a1, a1, 1365
	; LMULMAX8-RV64-NEXT: slli a1, a1, 12
	; LMULMAX8-RV64-NEXT: addi a1, a1, 1365
	; LMULMAX8-RV64-NEXT: slli a1, a1, 12
	; LMULMAX8-RV64-NEXT: addi a1, a1, 1365
	; LMULMAX8-RV64-NEXT: vand.vx v9, v9, a1			; LMULMAX8-RV64-NEXT: vand.vx v9, v9, a1
	; LMULMAX8-RV64-NEXT: vsub.vv v8, v8, v9			; LMULMAX8-RV64-NEXT: vsub.vv v8, v8, v9
	; LMULMAX8-RV64-NEXT: lui a1, 13107			; LMULMAX8-RV64-NEXT: vand.vx v9, v8, a2
	; LMULMAX8-RV64-NEXT: addiw a1, a1, 819
	; LMULMAX8-RV64-NEXT: slli a1, a1, 12
	; LMULMAX8-RV64-NEXT: addi a1, a1, 819
	; LMULMAX8-RV64-NEXT: slli a1, a1, 12
	; LMULMAX8-RV64-NEXT: addi a1, a1, 819
	; LMULMAX8-RV64-NEXT: slli a1, a1, 12
	; LMULMAX8-RV64-NEXT: addi a1, a1, 819
	; LMULMAX8-RV64-NEXT: vand.vx v9, v8, a1
	; LMULMAX8-RV64-NEXT: vsrl.vi v8, v8, 2			; LMULMAX8-RV64-NEXT: vsrl.vi v8, v8, 2
	; LMULMAX8-RV64-NEXT: vand.vx v8, v8, a1			; LMULMAX8-RV64-NEXT: vand.vx v8, v8, a2
	; LMULMAX8-RV64-NEXT: vadd.vv v8, v9, v8			; LMULMAX8-RV64-NEXT: vadd.vv v8, v9, v8
				; LMULMAX8-RV64-NEXT: lui a1, %hi(.LCPI3_2)
				; LMULMAX8-RV64-NEXT: ld a1, %lo(.LCPI3_2)(a1)
				; LMULMAX8-RV64-NEXT: lui a2, %hi(.LCPI3_3)
				; LMULMAX8-RV64-NEXT: ld a2, %lo(.LCPI3_3)(a2)
	; LMULMAX8-RV64-NEXT: vsrl.vi v9, v8, 4			; LMULMAX8-RV64-NEXT: vsrl.vi v9, v8, 4
	; LMULMAX8-RV64-NEXT: vadd.vv v8, v8, v9			; LMULMAX8-RV64-NEXT: vadd.vv v8, v8, v9
	; LMULMAX8-RV64-NEXT: lui a1, 3855
	; LMULMAX8-RV64-NEXT: addiw a1, a1, 241
	; LMULMAX8-RV64-NEXT: slli a1, a1, 12
	; LMULMAX8-RV64-NEXT: addi a1, a1, -241
	; LMULMAX8-RV64-NEXT: slli a1, a1, 12
	; LMULMAX8-RV64-NEXT: addi a1, a1, 241
	; LMULMAX8-RV64-NEXT: slli a1, a1, 12
	; LMULMAX8-RV64-NEXT: addi a1, a1, -241
	; LMULMAX8-RV64-NEXT: vand.vx v8, v8, a1			; LMULMAX8-RV64-NEXT: vand.vx v8, v8, a1
	; LMULMAX8-RV64-NEXT: lui a1, 4112			; LMULMAX8-RV64-NEXT: vmul.vx v8, v8, a2
	; LMULMAX8-RV64-NEXT: addiw a1, a1, 257
	; LMULMAX8-RV64-NEXT: slli a1, a1, 16
	; LMULMAX8-RV64-NEXT: addi a1, a1, 257
	; LMULMAX8-RV64-NEXT: slli a1, a1, 16
	; LMULMAX8-RV64-NEXT: addi a1, a1, 257
	; LMULMAX8-RV64-NEXT: vmul.vx v8, v8, a1
	; LMULMAX8-RV64-NEXT: li a1, 56			; LMULMAX8-RV64-NEXT: li a1, 56
	; LMULMAX8-RV64-NEXT: vsrl.vx v8, v8, a1			; LMULMAX8-RV64-NEXT: vsrl.vx v8, v8, a1
	; LMULMAX8-RV64-NEXT: vse64.v v8, (a0)			; LMULMAX8-RV64-NEXT: vse64.v v8, (a0)
	; LMULMAX8-RV64-NEXT: ret			; LMULMAX8-RV64-NEXT: ret
	%a = load <2 x i64>, <2 x i64>* %x			%a = load <2 x i64>, <2 x i64>* %x
	%b = load <2 x i64>, <2 x i64>* %y			%b = load <2 x i64>, <2 x i64>* %y
	%c = call <2 x i64> @llvm.ctlz.v2i64(<2 x i64> %a, i1 false)			%c = call <2 x i64> @llvm.ctlz.v2i64(<2 x i64> %a, i1 false)
	store <2 x i64> %c, <2 x i64>* %x			store <2 x i64> %c, <2 x i64>* %x
	▲ Show 20 Lines • Show All 730 Lines • ▼ Show 20 Lines
	; LMULMAX2-RV64-NEXT: vsrl.vi v10, v8, 8			; LMULMAX2-RV64-NEXT: vsrl.vi v10, v8, 8
	; LMULMAX2-RV64-NEXT: vor.vv v8, v8, v10			; LMULMAX2-RV64-NEXT: vor.vv v8, v8, v10
	; LMULMAX2-RV64-NEXT: vsrl.vi v10, v8, 16			; LMULMAX2-RV64-NEXT: vsrl.vi v10, v8, 16
	; LMULMAX2-RV64-NEXT: vor.vv v8, v8, v10			; LMULMAX2-RV64-NEXT: vor.vv v8, v8, v10
	; LMULMAX2-RV64-NEXT: li a1, 32			; LMULMAX2-RV64-NEXT: li a1, 32
	; LMULMAX2-RV64-NEXT: vsrl.vx v10, v8, a1			; LMULMAX2-RV64-NEXT: vsrl.vx v10, v8, a1
	; LMULMAX2-RV64-NEXT: vor.vv v8, v8, v10			; LMULMAX2-RV64-NEXT: vor.vv v8, v8, v10
	; LMULMAX2-RV64-NEXT: vxor.vi v8, v8, -1			; LMULMAX2-RV64-NEXT: vxor.vi v8, v8, -1
				; LMULMAX2-RV64-NEXT: lui a1, %hi(.LCPI7_0)
				; LMULMAX2-RV64-NEXT: ld a1, %lo(.LCPI7_0)(a1)
				; LMULMAX2-RV64-NEXT: lui a2, %hi(.LCPI7_1)
				; LMULMAX2-RV64-NEXT: ld a2, %lo(.LCPI7_1)(a2)
	; LMULMAX2-RV64-NEXT: vsrl.vi v10, v8, 1			; LMULMAX2-RV64-NEXT: vsrl.vi v10, v8, 1
	; LMULMAX2-RV64-NEXT: lui a1, 21845
	; LMULMAX2-RV64-NEXT: addiw a1, a1, 1365
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 1365
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 1365
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 1365
	; LMULMAX2-RV64-NEXT: vand.vx v10, v10, a1			; LMULMAX2-RV64-NEXT: vand.vx v10, v10, a1
	; LMULMAX2-RV64-NEXT: vsub.vv v8, v8, v10			; LMULMAX2-RV64-NEXT: vsub.vv v8, v8, v10
	; LMULMAX2-RV64-NEXT: lui a1, 13107			; LMULMAX2-RV64-NEXT: vand.vx v10, v8, a2
	; LMULMAX2-RV64-NEXT: addiw a1, a1, 819
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 819
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 819
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 819
	; LMULMAX2-RV64-NEXT: vand.vx v10, v8, a1
	; LMULMAX2-RV64-NEXT: vsrl.vi v8, v8, 2			; LMULMAX2-RV64-NEXT: vsrl.vi v8, v8, 2
	; LMULMAX2-RV64-NEXT: vand.vx v8, v8, a1			; LMULMAX2-RV64-NEXT: vand.vx v8, v8, a2
	; LMULMAX2-RV64-NEXT: vadd.vv v8, v10, v8			; LMULMAX2-RV64-NEXT: vadd.vv v8, v10, v8
				; LMULMAX2-RV64-NEXT: lui a1, %hi(.LCPI7_2)
				; LMULMAX2-RV64-NEXT: ld a1, %lo(.LCPI7_2)(a1)
				; LMULMAX2-RV64-NEXT: lui a2, %hi(.LCPI7_3)
				; LMULMAX2-RV64-NEXT: ld a2, %lo(.LCPI7_3)(a2)
	; LMULMAX2-RV64-NEXT: vsrl.vi v10, v8, 4			; LMULMAX2-RV64-NEXT: vsrl.vi v10, v8, 4
	; LMULMAX2-RV64-NEXT: vadd.vv v8, v8, v10			; LMULMAX2-RV64-NEXT: vadd.vv v8, v8, v10
	; LMULMAX2-RV64-NEXT: lui a1, 3855
	; LMULMAX2-RV64-NEXT: addiw a1, a1, 241
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, -241
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 241
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, -241
	; LMULMAX2-RV64-NEXT: vand.vx v8, v8, a1			; LMULMAX2-RV64-NEXT: vand.vx v8, v8, a1
	; LMULMAX2-RV64-NEXT: lui a1, 4112			; LMULMAX2-RV64-NEXT: vmul.vx v8, v8, a2
	; LMULMAX2-RV64-NEXT: addiw a1, a1, 257
	; LMULMAX2-RV64-NEXT: slli a1, a1, 16
	; LMULMAX2-RV64-NEXT: addi a1, a1, 257
	; LMULMAX2-RV64-NEXT: slli a1, a1, 16
	; LMULMAX2-RV64-NEXT: addi a1, a1, 257
	; LMULMAX2-RV64-NEXT: vmul.vx v8, v8, a1
	; LMULMAX2-RV64-NEXT: li a1, 56			; LMULMAX2-RV64-NEXT: li a1, 56
	; LMULMAX2-RV64-NEXT: vsrl.vx v8, v8, a1			; LMULMAX2-RV64-NEXT: vsrl.vx v8, v8, a1
	; LMULMAX2-RV64-NEXT: vse64.v v8, (a0)			; LMULMAX2-RV64-NEXT: vse64.v v8, (a0)
	; LMULMAX2-RV64-NEXT: ret			; LMULMAX2-RV64-NEXT: ret
	;			;
	; LMULMAX1-RV32-LABEL: ctlz_v4i64:			; LMULMAX1-RV32-LABEL: ctlz_v4i64:
	; LMULMAX1-RV32: # %bb.0:			; LMULMAX1-RV32: # %bb.0:
	; LMULMAX1-RV32-NEXT: vsetivli zero, 2, e64, m1, ta, mu			; LMULMAX1-RV32-NEXT: vsetivli zero, 2, e64, m1, ta, mu
	▲ Show 20 Lines • Show All 77 Lines • ▼ Show 20 Lines
	; LMULMAX1-RV32-NEXT: vsrl.vx v9, v9, a3			; LMULMAX1-RV32-NEXT: vsrl.vx v9, v9, a3
	; LMULMAX1-RV32-NEXT: vse64.v v9, (a0)			; LMULMAX1-RV32-NEXT: vse64.v v9, (a0)
	; LMULMAX1-RV32-NEXT: vse64.v v8, (a1)			; LMULMAX1-RV32-NEXT: vse64.v v8, (a1)
	; LMULMAX1-RV32-NEXT: ret			; LMULMAX1-RV32-NEXT: ret
	;			;
	; LMULMAX1-RV64-LABEL: ctlz_v4i64:			; LMULMAX1-RV64-LABEL: ctlz_v4i64:
	; LMULMAX1-RV64: # %bb.0:			; LMULMAX1-RV64: # %bb.0:
	; LMULMAX1-RV64-NEXT: vsetivli zero, 2, e64, m1, ta, mu			; LMULMAX1-RV64-NEXT: vsetivli zero, 2, e64, m1, ta, mu
	; LMULMAX1-RV64-NEXT: addi a7, a0, 16			; LMULMAX1-RV64-NEXT: addi a1, a0, 16
	; LMULMAX1-RV64-NEXT: vle64.v v8, (a7)			; LMULMAX1-RV64-NEXT: vle64.v v8, (a1)
	; LMULMAX1-RV64-NEXT: vle64.v v9, (a0)			; LMULMAX1-RV64-NEXT: vle64.v v9, (a0)
	; LMULMAX1-RV64-NEXT: vsrl.vi v10, v8, 1			; LMULMAX1-RV64-NEXT: vsrl.vi v10, v8, 1
	; LMULMAX1-RV64-NEXT: vor.vv v8, v8, v10			; LMULMAX1-RV64-NEXT: vor.vv v8, v8, v10
	; LMULMAX1-RV64-NEXT: vsrl.vi v10, v8, 2			; LMULMAX1-RV64-NEXT: vsrl.vi v10, v8, 2
	; LMULMAX1-RV64-NEXT: vor.vv v8, v8, v10			; LMULMAX1-RV64-NEXT: vor.vv v8, v8, v10
	; LMULMAX1-RV64-NEXT: vsrl.vi v10, v8, 4			; LMULMAX1-RV64-NEXT: vsrl.vi v10, v8, 4
	; LMULMAX1-RV64-NEXT: vor.vv v8, v8, v10			; LMULMAX1-RV64-NEXT: vor.vv v8, v8, v10
	; LMULMAX1-RV64-NEXT: vsrl.vi v10, v8, 8			; LMULMAX1-RV64-NEXT: vsrl.vi v10, v8, 8
	; LMULMAX1-RV64-NEXT: vor.vv v8, v8, v10			; LMULMAX1-RV64-NEXT: vor.vv v8, v8, v10
	; LMULMAX1-RV64-NEXT: vsrl.vi v10, v8, 16			; LMULMAX1-RV64-NEXT: vsrl.vi v10, v8, 16
	; LMULMAX1-RV64-NEXT: vor.vv v8, v8, v10			; LMULMAX1-RV64-NEXT: vor.vv v8, v8, v10
	; LMULMAX1-RV64-NEXT: li a6, 32			; LMULMAX1-RV64-NEXT: li a6, 32
	; LMULMAX1-RV64-NEXT: vsrl.vx v10, v8, a6			; LMULMAX1-RV64-NEXT: vsrl.vx v10, v8, a6
	; LMULMAX1-RV64-NEXT: vor.vv v8, v8, v10			; LMULMAX1-RV64-NEXT: vor.vv v8, v8, v10
	; LMULMAX1-RV64-NEXT: vxor.vi v8, v8, -1			; LMULMAX1-RV64-NEXT: vxor.vi v8, v8, -1
				; LMULMAX1-RV64-NEXT: lui a3, %hi(.LCPI7_0)
				; LMULMAX1-RV64-NEXT: ld a3, %lo(.LCPI7_0)(a3)
				; LMULMAX1-RV64-NEXT: lui a4, %hi(.LCPI7_1)
				; LMULMAX1-RV64-NEXT: ld a4, %lo(.LCPI7_1)(a4)
	; LMULMAX1-RV64-NEXT: vsrl.vi v10, v8, 1			; LMULMAX1-RV64-NEXT: vsrl.vi v10, v8, 1
	; LMULMAX1-RV64-NEXT: lui a3, 21845
	; LMULMAX1-RV64-NEXT: addiw a3, a3, 1365
	; LMULMAX1-RV64-NEXT: slli a3, a3, 12
	; LMULMAX1-RV64-NEXT: addi a3, a3, 1365
	; LMULMAX1-RV64-NEXT: slli a3, a3, 12
	; LMULMAX1-RV64-NEXT: addi a3, a3, 1365
	; LMULMAX1-RV64-NEXT: slli a3, a3, 12
	; LMULMAX1-RV64-NEXT: addi a3, a3, 1365
	; LMULMAX1-RV64-NEXT: vand.vx v10, v10, a3			; LMULMAX1-RV64-NEXT: vand.vx v10, v10, a3
	; LMULMAX1-RV64-NEXT: vsub.vv v8, v8, v10			; LMULMAX1-RV64-NEXT: vsub.vv v8, v8, v10
	; LMULMAX1-RV64-NEXT: lui a4, 13107
	; LMULMAX1-RV64-NEXT: addiw a4, a4, 819
	; LMULMAX1-RV64-NEXT: slli a4, a4, 12
	; LMULMAX1-RV64-NEXT: addi a4, a4, 819
	; LMULMAX1-RV64-NEXT: slli a4, a4, 12
	; LMULMAX1-RV64-NEXT: addi a4, a4, 819
	; LMULMAX1-RV64-NEXT: slli a4, a4, 12
	; LMULMAX1-RV64-NEXT: addi a4, a4, 819
	; LMULMAX1-RV64-NEXT: vand.vx v10, v8, a4			; LMULMAX1-RV64-NEXT: vand.vx v10, v8, a4
	; LMULMAX1-RV64-NEXT: vsrl.vi v8, v8, 2			; LMULMAX1-RV64-NEXT: vsrl.vi v8, v8, 2
	; LMULMAX1-RV64-NEXT: vand.vx v8, v8, a4			; LMULMAX1-RV64-NEXT: vand.vx v8, v8, a4
	; LMULMAX1-RV64-NEXT: vadd.vv v8, v10, v8			; LMULMAX1-RV64-NEXT: vadd.vv v8, v10, v8
				; LMULMAX1-RV64-NEXT: lui a5, %hi(.LCPI7_2)
				; LMULMAX1-RV64-NEXT: ld a5, %lo(.LCPI7_2)(a5)
				; LMULMAX1-RV64-NEXT: lui a2, %hi(.LCPI7_3)
				; LMULMAX1-RV64-NEXT: ld a2, %lo(.LCPI7_3)(a2)
	; LMULMAX1-RV64-NEXT: vsrl.vi v10, v8, 4			; LMULMAX1-RV64-NEXT: vsrl.vi v10, v8, 4
	; LMULMAX1-RV64-NEXT: vadd.vv v8, v8, v10			; LMULMAX1-RV64-NEXT: vadd.vv v8, v8, v10
	; LMULMAX1-RV64-NEXT: lui a5, 3855
	; LMULMAX1-RV64-NEXT: addiw a5, a5, 241
	; LMULMAX1-RV64-NEXT: slli a5, a5, 12
	; LMULMAX1-RV64-NEXT: addi a5, a5, -241
	; LMULMAX1-RV64-NEXT: slli a5, a5, 12
	; LMULMAX1-RV64-NEXT: addi a5, a5, 241
	; LMULMAX1-RV64-NEXT: slli a5, a5, 12
	; LMULMAX1-RV64-NEXT: addi a5, a5, -241
	; LMULMAX1-RV64-NEXT: vand.vx v8, v8, a5			; LMULMAX1-RV64-NEXT: vand.vx v8, v8, a5
	; LMULMAX1-RV64-NEXT: lui a2, 4112
	; LMULMAX1-RV64-NEXT: addiw a2, a2, 257
	; LMULMAX1-RV64-NEXT: slli a2, a2, 16
	; LMULMAX1-RV64-NEXT: addi a2, a2, 257
	; LMULMAX1-RV64-NEXT: slli a2, a2, 16
	; LMULMAX1-RV64-NEXT: addi a2, a2, 257
	; LMULMAX1-RV64-NEXT: vmul.vx v8, v8, a2			; LMULMAX1-RV64-NEXT: vmul.vx v8, v8, a2
	; LMULMAX1-RV64-NEXT: li a1, 56			; LMULMAX1-RV64-NEXT: li a7, 56
	; LMULMAX1-RV64-NEXT: vsrl.vx v8, v8, a1			; LMULMAX1-RV64-NEXT: vsrl.vx v8, v8, a7
	; LMULMAX1-RV64-NEXT: vsrl.vi v10, v9, 1			; LMULMAX1-RV64-NEXT: vsrl.vi v10, v9, 1
	; LMULMAX1-RV64-NEXT: vor.vv v9, v9, v10			; LMULMAX1-RV64-NEXT: vor.vv v9, v9, v10
	; LMULMAX1-RV64-NEXT: vsrl.vi v10, v9, 2			; LMULMAX1-RV64-NEXT: vsrl.vi v10, v9, 2
	; LMULMAX1-RV64-NEXT: vor.vv v9, v9, v10			; LMULMAX1-RV64-NEXT: vor.vv v9, v9, v10
	; LMULMAX1-RV64-NEXT: vsrl.vi v10, v9, 4			; LMULMAX1-RV64-NEXT: vsrl.vi v10, v9, 4
	; LMULMAX1-RV64-NEXT: vor.vv v9, v9, v10			; LMULMAX1-RV64-NEXT: vor.vv v9, v9, v10
	; LMULMAX1-RV64-NEXT: vsrl.vi v10, v9, 8			; LMULMAX1-RV64-NEXT: vsrl.vi v10, v9, 8
	; LMULMAX1-RV64-NEXT: vor.vv v9, v9, v10			; LMULMAX1-RV64-NEXT: vor.vv v9, v9, v10
	; LMULMAX1-RV64-NEXT: vsrl.vi v10, v9, 16			; LMULMAX1-RV64-NEXT: vsrl.vi v10, v9, 16
	; LMULMAX1-RV64-NEXT: vor.vv v9, v9, v10			; LMULMAX1-RV64-NEXT: vor.vv v9, v9, v10
	; LMULMAX1-RV64-NEXT: vsrl.vx v10, v9, a6			; LMULMAX1-RV64-NEXT: vsrl.vx v10, v9, a6
	; LMULMAX1-RV64-NEXT: vor.vv v9, v9, v10			; LMULMAX1-RV64-NEXT: vor.vv v9, v9, v10
	; LMULMAX1-RV64-NEXT: vxor.vi v9, v9, -1			; LMULMAX1-RV64-NEXT: vxor.vi v9, v9, -1
	; LMULMAX1-RV64-NEXT: vsrl.vi v10, v9, 1			; LMULMAX1-RV64-NEXT: vsrl.vi v10, v9, 1
	; LMULMAX1-RV64-NEXT: vand.vx v10, v10, a3			; LMULMAX1-RV64-NEXT: vand.vx v10, v10, a3
	; LMULMAX1-RV64-NEXT: vsub.vv v9, v9, v10			; LMULMAX1-RV64-NEXT: vsub.vv v9, v9, v10
	; LMULMAX1-RV64-NEXT: vand.vx v10, v9, a4			; LMULMAX1-RV64-NEXT: vand.vx v10, v9, a4
	; LMULMAX1-RV64-NEXT: vsrl.vi v9, v9, 2			; LMULMAX1-RV64-NEXT: vsrl.vi v9, v9, 2
	; LMULMAX1-RV64-NEXT: vand.vx v9, v9, a4			; LMULMAX1-RV64-NEXT: vand.vx v9, v9, a4
	; LMULMAX1-RV64-NEXT: vadd.vv v9, v10, v9			; LMULMAX1-RV64-NEXT: vadd.vv v9, v10, v9
	; LMULMAX1-RV64-NEXT: vsrl.vi v10, v9, 4			; LMULMAX1-RV64-NEXT: vsrl.vi v10, v9, 4
	; LMULMAX1-RV64-NEXT: vadd.vv v9, v9, v10			; LMULMAX1-RV64-NEXT: vadd.vv v9, v9, v10
	; LMULMAX1-RV64-NEXT: vand.vx v9, v9, a5			; LMULMAX1-RV64-NEXT: vand.vx v9, v9, a5
	; LMULMAX1-RV64-NEXT: vmul.vx v9, v9, a2			; LMULMAX1-RV64-NEXT: vmul.vx v9, v9, a2
	; LMULMAX1-RV64-NEXT: vsrl.vx v9, v9, a1			; LMULMAX1-RV64-NEXT: vsrl.vx v9, v9, a7
	; LMULMAX1-RV64-NEXT: vse64.v v9, (a0)			; LMULMAX1-RV64-NEXT: vse64.v v9, (a0)
	; LMULMAX1-RV64-NEXT: vse64.v v8, (a7)			; LMULMAX1-RV64-NEXT: vse64.v v8, (a1)
	; LMULMAX1-RV64-NEXT: ret			; LMULMAX1-RV64-NEXT: ret
	;			;
	; LMULMAX8-RV32-LABEL: ctlz_v4i64:			; LMULMAX8-RV32-LABEL: ctlz_v4i64:
	; LMULMAX8-RV32: # %bb.0:			; LMULMAX8-RV32: # %bb.0:
	; LMULMAX8-RV32-NEXT: vsetivli zero, 4, e64, m2, ta, mu			; LMULMAX8-RV32-NEXT: vsetivli zero, 4, e64, m2, ta, mu
	; LMULMAX8-RV32-NEXT: vle64.v v8, (a0)			; LMULMAX8-RV32-NEXT: vle64.v v8, (a0)
	; LMULMAX8-RV32-NEXT: vsrl.vi v10, v8, 1			; LMULMAX8-RV32-NEXT: vsrl.vi v10, v8, 1
	; LMULMAX8-RV32-NEXT: vor.vv v8, v8, v10			; LMULMAX8-RV32-NEXT: vor.vv v8, v8, v10
	▲ Show 20 Lines • Show All 61 Lines • ▼ Show 20 Lines
	; LMULMAX8-RV64-NEXT: vsrl.vi v10, v8, 8			; LMULMAX8-RV64-NEXT: vsrl.vi v10, v8, 8
	; LMULMAX8-RV64-NEXT: vor.vv v8, v8, v10			; LMULMAX8-RV64-NEXT: vor.vv v8, v8, v10
	; LMULMAX8-RV64-NEXT: vsrl.vi v10, v8, 16			; LMULMAX8-RV64-NEXT: vsrl.vi v10, v8, 16
	; LMULMAX8-RV64-NEXT: vor.vv v8, v8, v10			; LMULMAX8-RV64-NEXT: vor.vv v8, v8, v10
	; LMULMAX8-RV64-NEXT: li a1, 32			; LMULMAX8-RV64-NEXT: li a1, 32
	; LMULMAX8-RV64-NEXT: vsrl.vx v10, v8, a1			; LMULMAX8-RV64-NEXT: vsrl.vx v10, v8, a1
	; LMULMAX8-RV64-NEXT: vor.vv v8, v8, v10			; LMULMAX8-RV64-NEXT: vor.vv v8, v8, v10
	; LMULMAX8-RV64-NEXT: vxor.vi v8, v8, -1			; LMULMAX8-RV64-NEXT: vxor.vi v8, v8, -1
				; LMULMAX8-RV64-NEXT: lui a1, %hi(.LCPI7_0)
				; LMULMAX8-RV64-NEXT: ld a1, %lo(.LCPI7_0)(a1)
				; LMULMAX8-RV64-NEXT: lui a2, %hi(.LCPI7_1)
				; LMULMAX8-RV64-NEXT: ld a2, %lo(.LCPI7_1)(a2)
	; LMULMAX8-RV64-NEXT: vsrl.vi v10, v8, 1			; LMULMAX8-RV64-NEXT: vsrl.vi v10, v8, 1
	; LMULMAX8-RV64-NEXT: lui a1, 21845
	; LMULMAX8-RV64-NEXT: addiw a1, a1, 1365
	; LMULMAX8-RV64-NEXT: slli a1, a1, 12
	; LMULMAX8-RV64-NEXT: addi a1, a1, 1365
	; LMULMAX8-RV64-NEXT: slli a1, a1, 12
	; LMULMAX8-RV64-NEXT: addi a1, a1, 1365
	; LMULMAX8-RV64-NEXT: slli a1, a1, 12
	; LMULMAX8-RV64-NEXT: addi a1, a1, 1365
	; LMULMAX8-RV64-NEXT: vand.vx v10, v10, a1			; LMULMAX8-RV64-NEXT: vand.vx v10, v10, a1
	; LMULMAX8-RV64-NEXT: vsub.vv v8, v8, v10			; LMULMAX8-RV64-NEXT: vsub.vv v8, v8, v10
	; LMULMAX8-RV64-NEXT: lui a1, 13107			; LMULMAX8-RV64-NEXT: vand.vx v10, v8, a2
	; LMULMAX8-RV64-NEXT: addiw a1, a1, 819
	; LMULMAX8-RV64-NEXT: slli a1, a1, 12
	; LMULMAX8-RV64-NEXT: addi a1, a1, 819
	; LMULMAX8-RV64-NEXT: slli a1, a1, 12
	; LMULMAX8-RV64-NEXT: addi a1, a1, 819
	; LMULMAX8-RV64-NEXT: slli a1, a1, 12
	; LMULMAX8-RV64-NEXT: addi a1, a1, 819
	; LMULMAX8-RV64-NEXT: vand.vx v10, v8, a1
	; LMULMAX8-RV64-NEXT: vsrl.vi v8, v8, 2			; LMULMAX8-RV64-NEXT: vsrl.vi v8, v8, 2
	; LMULMAX8-RV64-NEXT: vand.vx v8, v8, a1			; LMULMAX8-RV64-NEXT: vand.vx v8, v8, a2
	; LMULMAX8-RV64-NEXT: vadd.vv v8, v10, v8			; LMULMAX8-RV64-NEXT: vadd.vv v8, v10, v8
				; LMULMAX8-RV64-NEXT: lui a1, %hi(.LCPI7_2)
				; LMULMAX8-RV64-NEXT: ld a1, %lo(.LCPI7_2)(a1)
				; LMULMAX8-RV64-NEXT: lui a2, %hi(.LCPI7_3)
				; LMULMAX8-RV64-NEXT: ld a2, %lo(.LCPI7_3)(a2)
	; LMULMAX8-RV64-NEXT: vsrl.vi v10, v8, 4			; LMULMAX8-RV64-NEXT: vsrl.vi v10, v8, 4
	; LMULMAX8-RV64-NEXT: vadd.vv v8, v8, v10			; LMULMAX8-RV64-NEXT: vadd.vv v8, v8, v10
	; LMULMAX8-RV64-NEXT: lui a1, 3855
	; LMULMAX8-RV64-NEXT: addiw a1, a1, 241
	; LMULMAX8-RV64-NEXT: slli a1, a1, 12
	; LMULMAX8-RV64-NEXT: addi a1, a1, -241
	; LMULMAX8-RV64-NEXT: slli a1, a1, 12
	; LMULMAX8-RV64-NEXT: addi a1, a1, 241
	; LMULMAX8-RV64-NEXT: slli a1, a1, 12
	; LMULMAX8-RV64-NEXT: addi a1, a1, -241
	; LMULMAX8-RV64-NEXT: vand.vx v8, v8, a1			; LMULMAX8-RV64-NEXT: vand.vx v8, v8, a1
	; LMULMAX8-RV64-NEXT: lui a1, 4112			; LMULMAX8-RV64-NEXT: vmul.vx v8, v8, a2
	; LMULMAX8-RV64-NEXT: addiw a1, a1, 257
	; LMULMAX8-RV64-NEXT: slli a1, a1, 16
	; LMULMAX8-RV64-NEXT: addi a1, a1, 257
	; LMULMAX8-RV64-NEXT: slli a1, a1, 16
	; LMULMAX8-RV64-NEXT: addi a1, a1, 257
	; LMULMAX8-RV64-NEXT: vmul.vx v8, v8, a1
	; LMULMAX8-RV64-NEXT: li a1, 56			; LMULMAX8-RV64-NEXT: li a1, 56
	; LMULMAX8-RV64-NEXT: vsrl.vx v8, v8, a1			; LMULMAX8-RV64-NEXT: vsrl.vx v8, v8, a1
	; LMULMAX8-RV64-NEXT: vse64.v v8, (a0)			; LMULMAX8-RV64-NEXT: vse64.v v8, (a0)
	; LMULMAX8-RV64-NEXT: ret			; LMULMAX8-RV64-NEXT: ret
	%a = load <4 x i64>, <4 x i64>* %x			%a = load <4 x i64>, <4 x i64>* %x
	%b = load <4 x i64>, <4 x i64>* %y			%b = load <4 x i64>, <4 x i64>* %y
	%c = call <4 x i64> @llvm.ctlz.v4i64(<4 x i64> %a, i1 false)			%c = call <4 x i64> @llvm.ctlz.v4i64(<4 x i64> %a, i1 false)
	store <4 x i64> %c, <4 x i64>* %x			store <4 x i64> %c, <4 x i64>* %x
	ret void			ret void
	}			}
	declare <4 x i64> @llvm.ctlz.v4i64(<4 x i64>, i1)			declare <4 x i64> @llvm.ctlz.v4i64(<4 x i64>, i1)

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-ctpop.ll

	Show First 20 Lines • Show All 298 Lines • ▼ Show 20 Lines
	; LMULMAX2-RV32-NEXT: vsrl.vx v8, v8, a1			; LMULMAX2-RV32-NEXT: vsrl.vx v8, v8, a1
	; LMULMAX2-RV32-NEXT: vse64.v v8, (a0)			; LMULMAX2-RV32-NEXT: vse64.v v8, (a0)
	; LMULMAX2-RV32-NEXT: ret			; LMULMAX2-RV32-NEXT: ret
	;			;
	; LMULMAX2-RV64-LABEL: ctpop_v2i64:			; LMULMAX2-RV64-LABEL: ctpop_v2i64:
	; LMULMAX2-RV64: # %bb.0:			; LMULMAX2-RV64: # %bb.0:
	; LMULMAX2-RV64-NEXT: vsetivli zero, 2, e64, m1, ta, mu			; LMULMAX2-RV64-NEXT: vsetivli zero, 2, e64, m1, ta, mu
	; LMULMAX2-RV64-NEXT: vle64.v v8, (a0)			; LMULMAX2-RV64-NEXT: vle64.v v8, (a0)
				; LMULMAX2-RV64-NEXT: lui a1, %hi(.LCPI3_0)
				; LMULMAX2-RV64-NEXT: ld a1, %lo(.LCPI3_0)(a1)
				; LMULMAX2-RV64-NEXT: lui a2, %hi(.LCPI3_1)
				; LMULMAX2-RV64-NEXT: ld a2, %lo(.LCPI3_1)(a2)
	; LMULMAX2-RV64-NEXT: vsrl.vi v9, v8, 1			; LMULMAX2-RV64-NEXT: vsrl.vi v9, v8, 1
	; LMULMAX2-RV64-NEXT: lui a1, 21845
	; LMULMAX2-RV64-NEXT: addiw a1, a1, 1365
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 1365
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 1365
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 1365
	; LMULMAX2-RV64-NEXT: vand.vx v9, v9, a1			; LMULMAX2-RV64-NEXT: vand.vx v9, v9, a1
	; LMULMAX2-RV64-NEXT: vsub.vv v8, v8, v9			; LMULMAX2-RV64-NEXT: vsub.vv v8, v8, v9
	; LMULMAX2-RV64-NEXT: lui a1, 13107			; LMULMAX2-RV64-NEXT: vand.vx v9, v8, a2
	; LMULMAX2-RV64-NEXT: addiw a1, a1, 819
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 819
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 819
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 819
	; LMULMAX2-RV64-NEXT: vand.vx v9, v8, a1
	; LMULMAX2-RV64-NEXT: vsrl.vi v8, v8, 2			; LMULMAX2-RV64-NEXT: vsrl.vi v8, v8, 2
	; LMULMAX2-RV64-NEXT: vand.vx v8, v8, a1			; LMULMAX2-RV64-NEXT: vand.vx v8, v8, a2
	; LMULMAX2-RV64-NEXT: vadd.vv v8, v9, v8			; LMULMAX2-RV64-NEXT: vadd.vv v8, v9, v8
				; LMULMAX2-RV64-NEXT: lui a1, %hi(.LCPI3_2)
				; LMULMAX2-RV64-NEXT: ld a1, %lo(.LCPI3_2)(a1)
				; LMULMAX2-RV64-NEXT: lui a2, %hi(.LCPI3_3)
				; LMULMAX2-RV64-NEXT: ld a2, %lo(.LCPI3_3)(a2)
	; LMULMAX2-RV64-NEXT: vsrl.vi v9, v8, 4			; LMULMAX2-RV64-NEXT: vsrl.vi v9, v8, 4
	; LMULMAX2-RV64-NEXT: vadd.vv v8, v8, v9			; LMULMAX2-RV64-NEXT: vadd.vv v8, v8, v9
	; LMULMAX2-RV64-NEXT: lui a1, 3855
	; LMULMAX2-RV64-NEXT: addiw a1, a1, 241
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, -241
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 241
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, -241
	; LMULMAX2-RV64-NEXT: vand.vx v8, v8, a1			; LMULMAX2-RV64-NEXT: vand.vx v8, v8, a1
	; LMULMAX2-RV64-NEXT: lui a1, 4112			; LMULMAX2-RV64-NEXT: vmul.vx v8, v8, a2
	; LMULMAX2-RV64-NEXT: addiw a1, a1, 257
	; LMULMAX2-RV64-NEXT: slli a1, a1, 16
	; LMULMAX2-RV64-NEXT: addi a1, a1, 257
	; LMULMAX2-RV64-NEXT: slli a1, a1, 16
	; LMULMAX2-RV64-NEXT: addi a1, a1, 257
	; LMULMAX2-RV64-NEXT: vmul.vx v8, v8, a1
	; LMULMAX2-RV64-NEXT: li a1, 56			; LMULMAX2-RV64-NEXT: li a1, 56
	; LMULMAX2-RV64-NEXT: vsrl.vx v8, v8, a1			; LMULMAX2-RV64-NEXT: vsrl.vx v8, v8, a1
	; LMULMAX2-RV64-NEXT: vse64.v v8, (a0)			; LMULMAX2-RV64-NEXT: vse64.v v8, (a0)
	; LMULMAX2-RV64-NEXT: ret			; LMULMAX2-RV64-NEXT: ret
	;			;
	; LMULMAX1-RV32-LABEL: ctpop_v2i64:			; LMULMAX1-RV32-LABEL: ctpop_v2i64:
	; LMULMAX1-RV32: # %bb.0:			; LMULMAX1-RV32: # %bb.0:
	; LMULMAX1-RV32-NEXT: vsetivli zero, 2, e64, m1, ta, mu			; LMULMAX1-RV32-NEXT: vsetivli zero, 2, e64, m1, ta, mu
	Show All 33 Lines
	; LMULMAX1-RV32-NEXT: vsrl.vx v8, v8, a1			; LMULMAX1-RV32-NEXT: vsrl.vx v8, v8, a1
	; LMULMAX1-RV32-NEXT: vse64.v v8, (a0)			; LMULMAX1-RV32-NEXT: vse64.v v8, (a0)
	; LMULMAX1-RV32-NEXT: ret			; LMULMAX1-RV32-NEXT: ret
	;			;
	; LMULMAX1-RV64-LABEL: ctpop_v2i64:			; LMULMAX1-RV64-LABEL: ctpop_v2i64:
	; LMULMAX1-RV64: # %bb.0:			; LMULMAX1-RV64: # %bb.0:
	; LMULMAX1-RV64-NEXT: vsetivli zero, 2, e64, m1, ta, mu			; LMULMAX1-RV64-NEXT: vsetivli zero, 2, e64, m1, ta, mu
	; LMULMAX1-RV64-NEXT: vle64.v v8, (a0)			; LMULMAX1-RV64-NEXT: vle64.v v8, (a0)
				; LMULMAX1-RV64-NEXT: lui a1, %hi(.LCPI3_0)
				; LMULMAX1-RV64-NEXT: ld a1, %lo(.LCPI3_0)(a1)
				; LMULMAX1-RV64-NEXT: lui a2, %hi(.LCPI3_1)
				; LMULMAX1-RV64-NEXT: ld a2, %lo(.LCPI3_1)(a2)
	; LMULMAX1-RV64-NEXT: vsrl.vi v9, v8, 1			; LMULMAX1-RV64-NEXT: vsrl.vi v9, v8, 1
	; LMULMAX1-RV64-NEXT: lui a1, 21845
	; LMULMAX1-RV64-NEXT: addiw a1, a1, 1365
	; LMULMAX1-RV64-NEXT: slli a1, a1, 12
	; LMULMAX1-RV64-NEXT: addi a1, a1, 1365
	; LMULMAX1-RV64-NEXT: slli a1, a1, 12
	; LMULMAX1-RV64-NEXT: addi a1, a1, 1365
	; LMULMAX1-RV64-NEXT: slli a1, a1, 12
	; LMULMAX1-RV64-NEXT: addi a1, a1, 1365
	; LMULMAX1-RV64-NEXT: vand.vx v9, v9, a1			; LMULMAX1-RV64-NEXT: vand.vx v9, v9, a1
	; LMULMAX1-RV64-NEXT: vsub.vv v8, v8, v9			; LMULMAX1-RV64-NEXT: vsub.vv v8, v8, v9
	; LMULMAX1-RV64-NEXT: lui a1, 13107			; LMULMAX1-RV64-NEXT: vand.vx v9, v8, a2
	; LMULMAX1-RV64-NEXT: addiw a1, a1, 819
	; LMULMAX1-RV64-NEXT: slli a1, a1, 12
	; LMULMAX1-RV64-NEXT: addi a1, a1, 819
	; LMULMAX1-RV64-NEXT: slli a1, a1, 12
	; LMULMAX1-RV64-NEXT: addi a1, a1, 819
	; LMULMAX1-RV64-NEXT: slli a1, a1, 12
	; LMULMAX1-RV64-NEXT: addi a1, a1, 819
	; LMULMAX1-RV64-NEXT: vand.vx v9, v8, a1
	; LMULMAX1-RV64-NEXT: vsrl.vi v8, v8, 2			; LMULMAX1-RV64-NEXT: vsrl.vi v8, v8, 2
	; LMULMAX1-RV64-NEXT: vand.vx v8, v8, a1			; LMULMAX1-RV64-NEXT: vand.vx v8, v8, a2
	; LMULMAX1-RV64-NEXT: vadd.vv v8, v9, v8			; LMULMAX1-RV64-NEXT: vadd.vv v8, v9, v8
				; LMULMAX1-RV64-NEXT: lui a1, %hi(.LCPI3_2)
				; LMULMAX1-RV64-NEXT: ld a1, %lo(.LCPI3_2)(a1)
				; LMULMAX1-RV64-NEXT: lui a2, %hi(.LCPI3_3)
				; LMULMAX1-RV64-NEXT: ld a2, %lo(.LCPI3_3)(a2)
	; LMULMAX1-RV64-NEXT: vsrl.vi v9, v8, 4			; LMULMAX1-RV64-NEXT: vsrl.vi v9, v8, 4
	; LMULMAX1-RV64-NEXT: vadd.vv v8, v8, v9			; LMULMAX1-RV64-NEXT: vadd.vv v8, v8, v9
	; LMULMAX1-RV64-NEXT: lui a1, 3855
	; LMULMAX1-RV64-NEXT: addiw a1, a1, 241
	; LMULMAX1-RV64-NEXT: slli a1, a1, 12
	; LMULMAX1-RV64-NEXT: addi a1, a1, -241
	; LMULMAX1-RV64-NEXT: slli a1, a1, 12
	; LMULMAX1-RV64-NEXT: addi a1, a1, 241
	; LMULMAX1-RV64-NEXT: slli a1, a1, 12
	; LMULMAX1-RV64-NEXT: addi a1, a1, -241
	; LMULMAX1-RV64-NEXT: vand.vx v8, v8, a1			; LMULMAX1-RV64-NEXT: vand.vx v8, v8, a1
	; LMULMAX1-RV64-NEXT: lui a1, 4112			; LMULMAX1-RV64-NEXT: vmul.vx v8, v8, a2
	; LMULMAX1-RV64-NEXT: addiw a1, a1, 257
	; LMULMAX1-RV64-NEXT: slli a1, a1, 16
	; LMULMAX1-RV64-NEXT: addi a1, a1, 257
	; LMULMAX1-RV64-NEXT: slli a1, a1, 16
	; LMULMAX1-RV64-NEXT: addi a1, a1, 257
	; LMULMAX1-RV64-NEXT: vmul.vx v8, v8, a1
	; LMULMAX1-RV64-NEXT: li a1, 56			; LMULMAX1-RV64-NEXT: li a1, 56
	; LMULMAX1-RV64-NEXT: vsrl.vx v8, v8, a1			; LMULMAX1-RV64-NEXT: vsrl.vx v8, v8, a1
	; LMULMAX1-RV64-NEXT: vse64.v v8, (a0)			; LMULMAX1-RV64-NEXT: vse64.v v8, (a0)
	; LMULMAX1-RV64-NEXT: ret			; LMULMAX1-RV64-NEXT: ret
	%a = load <2 x i64>, <2 x i64>* %x			%a = load <2 x i64>, <2 x i64>* %x
	%b = load <2 x i64>, <2 x i64>* %y			%b = load <2 x i64>, <2 x i64>* %y
	%c = call <2 x i64> @llvm.ctpop.v2i64(<2 x i64> %a)			%c = call <2 x i64> @llvm.ctpop.v2i64(<2 x i64> %a)
	store <2 x i64> %c, <2 x i64>* %x			store <2 x i64> %c, <2 x i64>* %x
	▲ Show 20 Lines • Show All 389 Lines • ▼ Show 20 Lines
	; LMULMAX2-RV32-NEXT: vsrl.vx v8, v8, a1			; LMULMAX2-RV32-NEXT: vsrl.vx v8, v8, a1
	; LMULMAX2-RV32-NEXT: vse64.v v8, (a0)			; LMULMAX2-RV32-NEXT: vse64.v v8, (a0)
	; LMULMAX2-RV32-NEXT: ret			; LMULMAX2-RV32-NEXT: ret
	;			;
	; LMULMAX2-RV64-LABEL: ctpop_v4i64:			; LMULMAX2-RV64-LABEL: ctpop_v4i64:
	; LMULMAX2-RV64: # %bb.0:			; LMULMAX2-RV64: # %bb.0:
	; LMULMAX2-RV64-NEXT: vsetivli zero, 4, e64, m2, ta, mu			; LMULMAX2-RV64-NEXT: vsetivli zero, 4, e64, m2, ta, mu
	; LMULMAX2-RV64-NEXT: vle64.v v8, (a0)			; LMULMAX2-RV64-NEXT: vle64.v v8, (a0)
				; LMULMAX2-RV64-NEXT: lui a1, %hi(.LCPI7_0)
				; LMULMAX2-RV64-NEXT: ld a1, %lo(.LCPI7_0)(a1)
				; LMULMAX2-RV64-NEXT: lui a2, %hi(.LCPI7_1)
				; LMULMAX2-RV64-NEXT: ld a2, %lo(.LCPI7_1)(a2)
	; LMULMAX2-RV64-NEXT: vsrl.vi v10, v8, 1			; LMULMAX2-RV64-NEXT: vsrl.vi v10, v8, 1
	; LMULMAX2-RV64-NEXT: lui a1, 21845
	; LMULMAX2-RV64-NEXT: addiw a1, a1, 1365
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 1365
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 1365
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 1365
	; LMULMAX2-RV64-NEXT: vand.vx v10, v10, a1			; LMULMAX2-RV64-NEXT: vand.vx v10, v10, a1
	; LMULMAX2-RV64-NEXT: vsub.vv v8, v8, v10			; LMULMAX2-RV64-NEXT: vsub.vv v8, v8, v10
	; LMULMAX2-RV64-NEXT: lui a1, 13107			; LMULMAX2-RV64-NEXT: vand.vx v10, v8, a2
	; LMULMAX2-RV64-NEXT: addiw a1, a1, 819
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 819
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 819
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 819
	; LMULMAX2-RV64-NEXT: vand.vx v10, v8, a1
	; LMULMAX2-RV64-NEXT: vsrl.vi v8, v8, 2			; LMULMAX2-RV64-NEXT: vsrl.vi v8, v8, 2
	; LMULMAX2-RV64-NEXT: vand.vx v8, v8, a1			; LMULMAX2-RV64-NEXT: vand.vx v8, v8, a2
	; LMULMAX2-RV64-NEXT: vadd.vv v8, v10, v8			; LMULMAX2-RV64-NEXT: vadd.vv v8, v10, v8
				; LMULMAX2-RV64-NEXT: lui a1, %hi(.LCPI7_2)
				; LMULMAX2-RV64-NEXT: ld a1, %lo(.LCPI7_2)(a1)
				; LMULMAX2-RV64-NEXT: lui a2, %hi(.LCPI7_3)
				; LMULMAX2-RV64-NEXT: ld a2, %lo(.LCPI7_3)(a2)
	; LMULMAX2-RV64-NEXT: vsrl.vi v10, v8, 4			; LMULMAX2-RV64-NEXT: vsrl.vi v10, v8, 4
	; LMULMAX2-RV64-NEXT: vadd.vv v8, v8, v10			; LMULMAX2-RV64-NEXT: vadd.vv v8, v8, v10
	; LMULMAX2-RV64-NEXT: lui a1, 3855
	; LMULMAX2-RV64-NEXT: addiw a1, a1, 241
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, -241
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 241
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, -241
	; LMULMAX2-RV64-NEXT: vand.vx v8, v8, a1			; LMULMAX2-RV64-NEXT: vand.vx v8, v8, a1
	; LMULMAX2-RV64-NEXT: lui a1, 4112			; LMULMAX2-RV64-NEXT: vmul.vx v8, v8, a2
	; LMULMAX2-RV64-NEXT: addiw a1, a1, 257
	; LMULMAX2-RV64-NEXT: slli a1, a1, 16
	; LMULMAX2-RV64-NEXT: addi a1, a1, 257
	; LMULMAX2-RV64-NEXT: slli a1, a1, 16
	; LMULMAX2-RV64-NEXT: addi a1, a1, 257
	; LMULMAX2-RV64-NEXT: vmul.vx v8, v8, a1
	; LMULMAX2-RV64-NEXT: li a1, 56			; LMULMAX2-RV64-NEXT: li a1, 56
	; LMULMAX2-RV64-NEXT: vsrl.vx v8, v8, a1			; LMULMAX2-RV64-NEXT: vsrl.vx v8, v8, a1
	; LMULMAX2-RV64-NEXT: vse64.v v8, (a0)			; LMULMAX2-RV64-NEXT: vse64.v v8, (a0)
	; LMULMAX2-RV64-NEXT: ret			; LMULMAX2-RV64-NEXT: ret
	;			;
	; LMULMAX1-RV32-LABEL: ctpop_v4i64:			; LMULMAX1-RV32-LABEL: ctpop_v4i64:
	; LMULMAX1-RV32: # %bb.0:			; LMULMAX1-RV32: # %bb.0:
	; LMULMAX1-RV32-NEXT: vsetivli zero, 2, e64, m1, ta, mu			; LMULMAX1-RV32-NEXT: vsetivli zero, 2, e64, m1, ta, mu
	▲ Show 20 Lines • Show All 47 Lines • ▼ Show 20 Lines
	; LMULMAX1-RV32-NEXT: vsrl.vx v9, v9, a2			; LMULMAX1-RV32-NEXT: vsrl.vx v9, v9, a2
	; LMULMAX1-RV32-NEXT: vse64.v v9, (a0)			; LMULMAX1-RV32-NEXT: vse64.v v9, (a0)
	; LMULMAX1-RV32-NEXT: vse64.v v8, (a1)			; LMULMAX1-RV32-NEXT: vse64.v v8, (a1)
	; LMULMAX1-RV32-NEXT: ret			; LMULMAX1-RV32-NEXT: ret
	;			;
	; LMULMAX1-RV64-LABEL: ctpop_v4i64:			; LMULMAX1-RV64-LABEL: ctpop_v4i64:
	; LMULMAX1-RV64: # %bb.0:			; LMULMAX1-RV64: # %bb.0:
	; LMULMAX1-RV64-NEXT: vsetivli zero, 2, e64, m1, ta, mu			; LMULMAX1-RV64-NEXT: vsetivli zero, 2, e64, m1, ta, mu
	; LMULMAX1-RV64-NEXT: addi a6, a0, 16			; LMULMAX1-RV64-NEXT: vle64.v v8, (a0)
	; LMULMAX1-RV64-NEXT: vle64.v v8, (a6)			; LMULMAX1-RV64-NEXT: addi a1, a0, 16
	; LMULMAX1-RV64-NEXT: vle64.v v9, (a0)			; LMULMAX1-RV64-NEXT: vle64.v v9, (a1)
	; LMULMAX1-RV64-NEXT: vsrl.vi v10, v8, 1			; LMULMAX1-RV64-NEXT: lui a2, %hi(.LCPI7_0)
	; LMULMAX1-RV64-NEXT: lui a2, 21845			; LMULMAX1-RV64-NEXT: ld a2, %lo(.LCPI7_0)(a2)
	; LMULMAX1-RV64-NEXT: addiw a2, a2, 1365			; LMULMAX1-RV64-NEXT: lui a3, %hi(.LCPI7_1)
	; LMULMAX1-RV64-NEXT: slli a2, a2, 12			; LMULMAX1-RV64-NEXT: ld a3, %lo(.LCPI7_1)(a3)
	; LMULMAX1-RV64-NEXT: addi a2, a2, 1365
	; LMULMAX1-RV64-NEXT: slli a2, a2, 12
	; LMULMAX1-RV64-NEXT: addi a2, a2, 1365
	; LMULMAX1-RV64-NEXT: slli a2, a2, 12
	; LMULMAX1-RV64-NEXT: addi a2, a2, 1365
	; LMULMAX1-RV64-NEXT: vand.vx v10, v10, a2
	; LMULMAX1-RV64-NEXT: vsub.vv v8, v8, v10
	; LMULMAX1-RV64-NEXT: lui a3, 13107
	; LMULMAX1-RV64-NEXT: addiw a3, a3, 819
	; LMULMAX1-RV64-NEXT: slli a3, a3, 12
	; LMULMAX1-RV64-NEXT: addi a3, a3, 819
	; LMULMAX1-RV64-NEXT: slli a3, a3, 12
	; LMULMAX1-RV64-NEXT: addi a3, a3, 819
	; LMULMAX1-RV64-NEXT: slli a3, a3, 12
	; LMULMAX1-RV64-NEXT: addi a3, a3, 819
	; LMULMAX1-RV64-NEXT: vand.vx v10, v8, a3
	; LMULMAX1-RV64-NEXT: vsrl.vi v8, v8, 2
	; LMULMAX1-RV64-NEXT: vand.vx v8, v8, a3
	; LMULMAX1-RV64-NEXT: vadd.vv v8, v10, v8
	; LMULMAX1-RV64-NEXT: vsrl.vi v10, v8, 4
	; LMULMAX1-RV64-NEXT: vadd.vv v8, v8, v10
	; LMULMAX1-RV64-NEXT: lui a4, 3855
	; LMULMAX1-RV64-NEXT: addiw a4, a4, 241
	; LMULMAX1-RV64-NEXT: slli a4, a4, 12
	; LMULMAX1-RV64-NEXT: addi a4, a4, -241
	; LMULMAX1-RV64-NEXT: slli a4, a4, 12
	; LMULMAX1-RV64-NEXT: addi a4, a4, 241
	; LMULMAX1-RV64-NEXT: slli a4, a4, 12
	; LMULMAX1-RV64-NEXT: addi a4, a4, -241
	; LMULMAX1-RV64-NEXT: vand.vx v8, v8, a4
	; LMULMAX1-RV64-NEXT: lui a5, 4112
	; LMULMAX1-RV64-NEXT: addiw a5, a5, 257
	; LMULMAX1-RV64-NEXT: slli a5, a5, 16
	; LMULMAX1-RV64-NEXT: addi a5, a5, 257
	; LMULMAX1-RV64-NEXT: slli a5, a5, 16
	; LMULMAX1-RV64-NEXT: addi a5, a5, 257
	; LMULMAX1-RV64-NEXT: vmul.vx v8, v8, a5
	; LMULMAX1-RV64-NEXT: li a1, 56
	; LMULMAX1-RV64-NEXT: vsrl.vx v8, v8, a1
	; LMULMAX1-RV64-NEXT: vsrl.vi v10, v9, 1			; LMULMAX1-RV64-NEXT: vsrl.vi v10, v9, 1
	; LMULMAX1-RV64-NEXT: vand.vx v10, v10, a2			; LMULMAX1-RV64-NEXT: vand.vx v10, v10, a2
	; LMULMAX1-RV64-NEXT: vsub.vv v9, v9, v10			; LMULMAX1-RV64-NEXT: vsub.vv v9, v9, v10
	; LMULMAX1-RV64-NEXT: vand.vx v10, v9, a3			; LMULMAX1-RV64-NEXT: vand.vx v10, v9, a3
	; LMULMAX1-RV64-NEXT: vsrl.vi v9, v9, 2			; LMULMAX1-RV64-NEXT: vsrl.vi v9, v9, 2
	; LMULMAX1-RV64-NEXT: vand.vx v9, v9, a3			; LMULMAX1-RV64-NEXT: vand.vx v9, v9, a3
	; LMULMAX1-RV64-NEXT: vadd.vv v9, v10, v9			; LMULMAX1-RV64-NEXT: vadd.vv v9, v10, v9
				; LMULMAX1-RV64-NEXT: lui a4, %hi(.LCPI7_2)
				; LMULMAX1-RV64-NEXT: ld a4, %lo(.LCPI7_2)(a4)
				; LMULMAX1-RV64-NEXT: lui a5, %hi(.LCPI7_3)
				; LMULMAX1-RV64-NEXT: ld a5, %lo(.LCPI7_3)(a5)
	; LMULMAX1-RV64-NEXT: vsrl.vi v10, v9, 4			; LMULMAX1-RV64-NEXT: vsrl.vi v10, v9, 4
	; LMULMAX1-RV64-NEXT: vadd.vv v9, v9, v10			; LMULMAX1-RV64-NEXT: vadd.vv v9, v9, v10
	; LMULMAX1-RV64-NEXT: vand.vx v9, v9, a4			; LMULMAX1-RV64-NEXT: vand.vx v9, v9, a4
	; LMULMAX1-RV64-NEXT: vmul.vx v9, v9, a5			; LMULMAX1-RV64-NEXT: vmul.vx v9, v9, a5
	; LMULMAX1-RV64-NEXT: vsrl.vx v9, v9, a1			; LMULMAX1-RV64-NEXT: li a6, 56
	; LMULMAX1-RV64-NEXT: vse64.v v9, (a0)			; LMULMAX1-RV64-NEXT: vsrl.vx v9, v9, a6
	; LMULMAX1-RV64-NEXT: vse64.v v8, (a6)			; LMULMAX1-RV64-NEXT: vsrl.vi v10, v8, 1
				; LMULMAX1-RV64-NEXT: vand.vx v10, v10, a2
				; LMULMAX1-RV64-NEXT: vsub.vv v8, v8, v10
				; LMULMAX1-RV64-NEXT: vand.vx v10, v8, a3
				; LMULMAX1-RV64-NEXT: vsrl.vi v8, v8, 2
				; LMULMAX1-RV64-NEXT: vand.vx v8, v8, a3
				; LMULMAX1-RV64-NEXT: vadd.vv v8, v10, v8
				; LMULMAX1-RV64-NEXT: vsrl.vi v10, v8, 4
				; LMULMAX1-RV64-NEXT: vadd.vv v8, v8, v10
				; LMULMAX1-RV64-NEXT: vand.vx v8, v8, a4
				; LMULMAX1-RV64-NEXT: vmul.vx v8, v8, a5
				; LMULMAX1-RV64-NEXT: vsrl.vx v8, v8, a6
				; LMULMAX1-RV64-NEXT: vse64.v v8, (a0)
				; LMULMAX1-RV64-NEXT: vse64.v v9, (a1)
	; LMULMAX1-RV64-NEXT: ret			; LMULMAX1-RV64-NEXT: ret
	%a = load <4 x i64>, <4 x i64>* %x			%a = load <4 x i64>, <4 x i64>* %x
	%b = load <4 x i64>, <4 x i64>* %y			%b = load <4 x i64>, <4 x i64>* %y
	%c = call <4 x i64> @llvm.ctpop.v4i64(<4 x i64> %a)			%c = call <4 x i64> @llvm.ctpop.v4i64(<4 x i64> %a)
	store <4 x i64> %c, <4 x i64>* %x			store <4 x i64> %c, <4 x i64>* %x
	ret void			ret void
	}			}
	declare <4 x i64> @llvm.ctpop.v4i64(<4 x i64>)			declare <4 x i64> @llvm.ctpop.v4i64(<4 x i64>)

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-cttz.ll

	Show First 20 Lines • Show All 592 Lines • ▼ Show 20 Lines
	; LMULMAX2-RV64-LABEL: cttz_v2i64:			; LMULMAX2-RV64-LABEL: cttz_v2i64:
	; LMULMAX2-RV64: # %bb.0:			; LMULMAX2-RV64: # %bb.0:
	; LMULMAX2-RV64-NEXT: vsetivli zero, 2, e64, m1, ta, mu			; LMULMAX2-RV64-NEXT: vsetivli zero, 2, e64, m1, ta, mu
	; LMULMAX2-RV64-NEXT: vle64.v v8, (a0)			; LMULMAX2-RV64-NEXT: vle64.v v8, (a0)
	; LMULMAX2-RV64-NEXT: li a1, 1			; LMULMAX2-RV64-NEXT: li a1, 1
	; LMULMAX2-RV64-NEXT: vsub.vx v9, v8, a1			; LMULMAX2-RV64-NEXT: vsub.vx v9, v8, a1
	; LMULMAX2-RV64-NEXT: vxor.vi v8, v8, -1			; LMULMAX2-RV64-NEXT: vxor.vi v8, v8, -1
	; LMULMAX2-RV64-NEXT: vand.vv v8, v8, v9			; LMULMAX2-RV64-NEXT: vand.vv v8, v8, v9
				; LMULMAX2-RV64-NEXT: lui a1, %hi(.LCPI3_0)
				; LMULMAX2-RV64-NEXT: ld a1, %lo(.LCPI3_0)(a1)
				; LMULMAX2-RV64-NEXT: lui a2, %hi(.LCPI3_1)
				; LMULMAX2-RV64-NEXT: ld a2, %lo(.LCPI3_1)(a2)
	; LMULMAX2-RV64-NEXT: vsrl.vi v9, v8, 1			; LMULMAX2-RV64-NEXT: vsrl.vi v9, v8, 1
	; LMULMAX2-RV64-NEXT: lui a1, 21845
	; LMULMAX2-RV64-NEXT: addiw a1, a1, 1365
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 1365
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 1365
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 1365
	; LMULMAX2-RV64-NEXT: vand.vx v9, v9, a1			; LMULMAX2-RV64-NEXT: vand.vx v9, v9, a1
	; LMULMAX2-RV64-NEXT: vsub.vv v8, v8, v9			; LMULMAX2-RV64-NEXT: vsub.vv v8, v8, v9
	; LMULMAX2-RV64-NEXT: lui a1, 13107			; LMULMAX2-RV64-NEXT: vand.vx v9, v8, a2
	; LMULMAX2-RV64-NEXT: addiw a1, a1, 819
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 819
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 819
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 819
	; LMULMAX2-RV64-NEXT: vand.vx v9, v8, a1
	; LMULMAX2-RV64-NEXT: vsrl.vi v8, v8, 2			; LMULMAX2-RV64-NEXT: vsrl.vi v8, v8, 2
	; LMULMAX2-RV64-NEXT: vand.vx v8, v8, a1			; LMULMAX2-RV64-NEXT: vand.vx v8, v8, a2
	; LMULMAX2-RV64-NEXT: vadd.vv v8, v9, v8			; LMULMAX2-RV64-NEXT: vadd.vv v8, v9, v8
				; LMULMAX2-RV64-NEXT: lui a1, %hi(.LCPI3_2)
				; LMULMAX2-RV64-NEXT: ld a1, %lo(.LCPI3_2)(a1)
				; LMULMAX2-RV64-NEXT: lui a2, %hi(.LCPI3_3)
				; LMULMAX2-RV64-NEXT: ld a2, %lo(.LCPI3_3)(a2)
	; LMULMAX2-RV64-NEXT: vsrl.vi v9, v8, 4			; LMULMAX2-RV64-NEXT: vsrl.vi v9, v8, 4
	; LMULMAX2-RV64-NEXT: vadd.vv v8, v8, v9			; LMULMAX2-RV64-NEXT: vadd.vv v8, v8, v9
	; LMULMAX2-RV64-NEXT: lui a1, 3855
	; LMULMAX2-RV64-NEXT: addiw a1, a1, 241
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, -241
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 241
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, -241
	; LMULMAX2-RV64-NEXT: vand.vx v8, v8, a1			; LMULMAX2-RV64-NEXT: vand.vx v8, v8, a1
	; LMULMAX2-RV64-NEXT: lui a1, 4112			; LMULMAX2-RV64-NEXT: vmul.vx v8, v8, a2
	; LMULMAX2-RV64-NEXT: addiw a1, a1, 257
	; LMULMAX2-RV64-NEXT: slli a1, a1, 16
	; LMULMAX2-RV64-NEXT: addi a1, a1, 257
	; LMULMAX2-RV64-NEXT: slli a1, a1, 16
	; LMULMAX2-RV64-NEXT: addi a1, a1, 257
	; LMULMAX2-RV64-NEXT: vmul.vx v8, v8, a1
	; LMULMAX2-RV64-NEXT: li a1, 56			; LMULMAX2-RV64-NEXT: li a1, 56
	; LMULMAX2-RV64-NEXT: vsrl.vx v8, v8, a1			; LMULMAX2-RV64-NEXT: vsrl.vx v8, v8, a1
	; LMULMAX2-RV64-NEXT: vse64.v v8, (a0)			; LMULMAX2-RV64-NEXT: vse64.v v8, (a0)
	; LMULMAX2-RV64-NEXT: ret			; LMULMAX2-RV64-NEXT: ret
	;			;
	; LMULMAX1-RV32-LABEL: cttz_v2i64:			; LMULMAX1-RV32-LABEL: cttz_v2i64:
	; LMULMAX1-RV32: # %bb.0:			; LMULMAX1-RV32: # %bb.0:
	; LMULMAX1-RV32-NEXT: vsetivli zero, 2, e64, m1, ta, mu			; LMULMAX1-RV32-NEXT: vsetivli zero, 2, e64, m1, ta, mu
	▲ Show 20 Lines • Show All 44 Lines • ▼ Show 20 Lines
	; LMULMAX1-RV64-LABEL: cttz_v2i64:			; LMULMAX1-RV64-LABEL: cttz_v2i64:
	; LMULMAX1-RV64: # %bb.0:			; LMULMAX1-RV64: # %bb.0:
	; LMULMAX1-RV64-NEXT: vsetivli zero, 2, e64, m1, ta, mu			; LMULMAX1-RV64-NEXT: vsetivli zero, 2, e64, m1, ta, mu
	; LMULMAX1-RV64-NEXT: vle64.v v8, (a0)			; LMULMAX1-RV64-NEXT: vle64.v v8, (a0)
	; LMULMAX1-RV64-NEXT: li a1, 1			; LMULMAX1-RV64-NEXT: li a1, 1
	; LMULMAX1-RV64-NEXT: vsub.vx v9, v8, a1			; LMULMAX1-RV64-NEXT: vsub.vx v9, v8, a1
	; LMULMAX1-RV64-NEXT: vxor.vi v8, v8, -1			; LMULMAX1-RV64-NEXT: vxor.vi v8, v8, -1
	; LMULMAX1-RV64-NEXT: vand.vv v8, v8, v9			; LMULMAX1-RV64-NEXT: vand.vv v8, v8, v9
				; LMULMAX1-RV64-NEXT: lui a1, %hi(.LCPI3_0)
				; LMULMAX1-RV64-NEXT: ld a1, %lo(.LCPI3_0)(a1)
				; LMULMAX1-RV64-NEXT: lui a2, %hi(.LCPI3_1)
				; LMULMAX1-RV64-NEXT: ld a2, %lo(.LCPI3_1)(a2)
	; LMULMAX1-RV64-NEXT: vsrl.vi v9, v8, 1			; LMULMAX1-RV64-NEXT: vsrl.vi v9, v8, 1
	; LMULMAX1-RV64-NEXT: lui a1, 21845
	; LMULMAX1-RV64-NEXT: addiw a1, a1, 1365
	; LMULMAX1-RV64-NEXT: slli a1, a1, 12
	; LMULMAX1-RV64-NEXT: addi a1, a1, 1365
	; LMULMAX1-RV64-NEXT: slli a1, a1, 12
	; LMULMAX1-RV64-NEXT: addi a1, a1, 1365
	; LMULMAX1-RV64-NEXT: slli a1, a1, 12
	; LMULMAX1-RV64-NEXT: addi a1, a1, 1365
	; LMULMAX1-RV64-NEXT: vand.vx v9, v9, a1			; LMULMAX1-RV64-NEXT: vand.vx v9, v9, a1
	; LMULMAX1-RV64-NEXT: vsub.vv v8, v8, v9			; LMULMAX1-RV64-NEXT: vsub.vv v8, v8, v9
	; LMULMAX1-RV64-NEXT: lui a1, 13107			; LMULMAX1-RV64-NEXT: vand.vx v9, v8, a2
	; LMULMAX1-RV64-NEXT: addiw a1, a1, 819
	; LMULMAX1-RV64-NEXT: slli a1, a1, 12
	; LMULMAX1-RV64-NEXT: addi a1, a1, 819
	; LMULMAX1-RV64-NEXT: slli a1, a1, 12
	; LMULMAX1-RV64-NEXT: addi a1, a1, 819
	; LMULMAX1-RV64-NEXT: slli a1, a1, 12
	; LMULMAX1-RV64-NEXT: addi a1, a1, 819
	; LMULMAX1-RV64-NEXT: vand.vx v9, v8, a1
	; LMULMAX1-RV64-NEXT: vsrl.vi v8, v8, 2			; LMULMAX1-RV64-NEXT: vsrl.vi v8, v8, 2
	; LMULMAX1-RV64-NEXT: vand.vx v8, v8, a1			; LMULMAX1-RV64-NEXT: vand.vx v8, v8, a2
	; LMULMAX1-RV64-NEXT: vadd.vv v8, v9, v8			; LMULMAX1-RV64-NEXT: vadd.vv v8, v9, v8
				; LMULMAX1-RV64-NEXT: lui a1, %hi(.LCPI3_2)
				; LMULMAX1-RV64-NEXT: ld a1, %lo(.LCPI3_2)(a1)
				; LMULMAX1-RV64-NEXT: lui a2, %hi(.LCPI3_3)
				; LMULMAX1-RV64-NEXT: ld a2, %lo(.LCPI3_3)(a2)
	; LMULMAX1-RV64-NEXT: vsrl.vi v9, v8, 4			; LMULMAX1-RV64-NEXT: vsrl.vi v9, v8, 4
	; LMULMAX1-RV64-NEXT: vadd.vv v8, v8, v9			; LMULMAX1-RV64-NEXT: vadd.vv v8, v8, v9
	; LMULMAX1-RV64-NEXT: lui a1, 3855
	; LMULMAX1-RV64-NEXT: addiw a1, a1, 241
	; LMULMAX1-RV64-NEXT: slli a1, a1, 12
	; LMULMAX1-RV64-NEXT: addi a1, a1, -241
	; LMULMAX1-RV64-NEXT: slli a1, a1, 12
	; LMULMAX1-RV64-NEXT: addi a1, a1, 241
	; LMULMAX1-RV64-NEXT: slli a1, a1, 12
	; LMULMAX1-RV64-NEXT: addi a1, a1, -241
	; LMULMAX1-RV64-NEXT: vand.vx v8, v8, a1			; LMULMAX1-RV64-NEXT: vand.vx v8, v8, a1
	; LMULMAX1-RV64-NEXT: lui a1, 4112			; LMULMAX1-RV64-NEXT: vmul.vx v8, v8, a2
	; LMULMAX1-RV64-NEXT: addiw a1, a1, 257
	; LMULMAX1-RV64-NEXT: slli a1, a1, 16
	; LMULMAX1-RV64-NEXT: addi a1, a1, 257
	; LMULMAX1-RV64-NEXT: slli a1, a1, 16
	; LMULMAX1-RV64-NEXT: addi a1, a1, 257
	; LMULMAX1-RV64-NEXT: vmul.vx v8, v8, a1
	; LMULMAX1-RV64-NEXT: li a1, 56			; LMULMAX1-RV64-NEXT: li a1, 56
	; LMULMAX1-RV64-NEXT: vsrl.vx v8, v8, a1			; LMULMAX1-RV64-NEXT: vsrl.vx v8, v8, a1
	; LMULMAX1-RV64-NEXT: vse64.v v8, (a0)			; LMULMAX1-RV64-NEXT: vse64.v v8, (a0)
	; LMULMAX1-RV64-NEXT: ret			; LMULMAX1-RV64-NEXT: ret
	;			;
	; LMULMAX8-RV32-LABEL: cttz_v2i64:			; LMULMAX8-RV32-LABEL: cttz_v2i64:
	; LMULMAX8-RV32: # %bb.0:			; LMULMAX8-RV32: # %bb.0:
	; LMULMAX8-RV32-NEXT: vsetivli zero, 2, e64, m1, ta, mu			; LMULMAX8-RV32-NEXT: vsetivli zero, 2, e64, m1, ta, mu
	▲ Show 20 Lines • Show All 44 Lines • ▼ Show 20 Lines
	; LMULMAX8-RV64-LABEL: cttz_v2i64:			; LMULMAX8-RV64-LABEL: cttz_v2i64:
	; LMULMAX8-RV64: # %bb.0:			; LMULMAX8-RV64: # %bb.0:
	; LMULMAX8-RV64-NEXT: vsetivli zero, 2, e64, m1, ta, mu			; LMULMAX8-RV64-NEXT: vsetivli zero, 2, e64, m1, ta, mu
	; LMULMAX8-RV64-NEXT: vle64.v v8, (a0)			; LMULMAX8-RV64-NEXT: vle64.v v8, (a0)
	; LMULMAX8-RV64-NEXT: li a1, 1			; LMULMAX8-RV64-NEXT: li a1, 1
	; LMULMAX8-RV64-NEXT: vsub.vx v9, v8, a1			; LMULMAX8-RV64-NEXT: vsub.vx v9, v8, a1
	; LMULMAX8-RV64-NEXT: vxor.vi v8, v8, -1			; LMULMAX8-RV64-NEXT: vxor.vi v8, v8, -1
	; LMULMAX8-RV64-NEXT: vand.vv v8, v8, v9			; LMULMAX8-RV64-NEXT: vand.vv v8, v8, v9
				; LMULMAX8-RV64-NEXT: lui a1, %hi(.LCPI3_0)
				; LMULMAX8-RV64-NEXT: ld a1, %lo(.LCPI3_0)(a1)
				; LMULMAX8-RV64-NEXT: lui a2, %hi(.LCPI3_1)
				; LMULMAX8-RV64-NEXT: ld a2, %lo(.LCPI3_1)(a2)
	; LMULMAX8-RV64-NEXT: vsrl.vi v9, v8, 1			; LMULMAX8-RV64-NEXT: vsrl.vi v9, v8, 1
	; LMULMAX8-RV64-NEXT: lui a1, 21845
	; LMULMAX8-RV64-NEXT: addiw a1, a1, 1365
	; LMULMAX8-RV64-NEXT: slli a1, a1, 12
	; LMULMAX8-RV64-NEXT: addi a1, a1, 1365
	; LMULMAX8-RV64-NEXT: slli a1, a1, 12
	; LMULMAX8-RV64-NEXT: addi a1, a1, 1365
	; LMULMAX8-RV64-NEXT: slli a1, a1, 12
	; LMULMAX8-RV64-NEXT: addi a1, a1, 1365
	; LMULMAX8-RV64-NEXT: vand.vx v9, v9, a1			; LMULMAX8-RV64-NEXT: vand.vx v9, v9, a1
	; LMULMAX8-RV64-NEXT: vsub.vv v8, v8, v9			; LMULMAX8-RV64-NEXT: vsub.vv v8, v8, v9
	; LMULMAX8-RV64-NEXT: lui a1, 13107			; LMULMAX8-RV64-NEXT: vand.vx v9, v8, a2
	; LMULMAX8-RV64-NEXT: addiw a1, a1, 819
	; LMULMAX8-RV64-NEXT: slli a1, a1, 12
	; LMULMAX8-RV64-NEXT: addi a1, a1, 819
	; LMULMAX8-RV64-NEXT: slli a1, a1, 12
	; LMULMAX8-RV64-NEXT: addi a1, a1, 819
	; LMULMAX8-RV64-NEXT: slli a1, a1, 12
	; LMULMAX8-RV64-NEXT: addi a1, a1, 819
	; LMULMAX8-RV64-NEXT: vand.vx v9, v8, a1
	; LMULMAX8-RV64-NEXT: vsrl.vi v8, v8, 2			; LMULMAX8-RV64-NEXT: vsrl.vi v8, v8, 2
	; LMULMAX8-RV64-NEXT: vand.vx v8, v8, a1			; LMULMAX8-RV64-NEXT: vand.vx v8, v8, a2
	; LMULMAX8-RV64-NEXT: vadd.vv v8, v9, v8			; LMULMAX8-RV64-NEXT: vadd.vv v8, v9, v8
				; LMULMAX8-RV64-NEXT: lui a1, %hi(.LCPI3_2)
				; LMULMAX8-RV64-NEXT: ld a1, %lo(.LCPI3_2)(a1)
				; LMULMAX8-RV64-NEXT: lui a2, %hi(.LCPI3_3)
				; LMULMAX8-RV64-NEXT: ld a2, %lo(.LCPI3_3)(a2)
	; LMULMAX8-RV64-NEXT: vsrl.vi v9, v8, 4			; LMULMAX8-RV64-NEXT: vsrl.vi v9, v8, 4
	; LMULMAX8-RV64-NEXT: vadd.vv v8, v8, v9			; LMULMAX8-RV64-NEXT: vadd.vv v8, v8, v9
	; LMULMAX8-RV64-NEXT: lui a1, 3855
	; LMULMAX8-RV64-NEXT: addiw a1, a1, 241
	; LMULMAX8-RV64-NEXT: slli a1, a1, 12
	; LMULMAX8-RV64-NEXT: addi a1, a1, -241
	; LMULMAX8-RV64-NEXT: slli a1, a1, 12
	; LMULMAX8-RV64-NEXT: addi a1, a1, 241
	; LMULMAX8-RV64-NEXT: slli a1, a1, 12
	; LMULMAX8-RV64-NEXT: addi a1, a1, -241
	; LMULMAX8-RV64-NEXT: vand.vx v8, v8, a1			; LMULMAX8-RV64-NEXT: vand.vx v8, v8, a1
	; LMULMAX8-RV64-NEXT: lui a1, 4112			; LMULMAX8-RV64-NEXT: vmul.vx v8, v8, a2
	; LMULMAX8-RV64-NEXT: addiw a1, a1, 257
	; LMULMAX8-RV64-NEXT: slli a1, a1, 16
	; LMULMAX8-RV64-NEXT: addi a1, a1, 257
	; LMULMAX8-RV64-NEXT: slli a1, a1, 16
	; LMULMAX8-RV64-NEXT: addi a1, a1, 257
	; LMULMAX8-RV64-NEXT: vmul.vx v8, v8, a1
	; LMULMAX8-RV64-NEXT: li a1, 56			; LMULMAX8-RV64-NEXT: li a1, 56
	; LMULMAX8-RV64-NEXT: vsrl.vx v8, v8, a1			; LMULMAX8-RV64-NEXT: vsrl.vx v8, v8, a1
	; LMULMAX8-RV64-NEXT: vse64.v v8, (a0)			; LMULMAX8-RV64-NEXT: vse64.v v8, (a0)
	; LMULMAX8-RV64-NEXT: ret			; LMULMAX8-RV64-NEXT: ret
	%a = load <2 x i64>, <2 x i64>* %x			%a = load <2 x i64>, <2 x i64>* %x
	%b = load <2 x i64>, <2 x i64>* %y			%b = load <2 x i64>, <2 x i64>* %y
	%c = call <2 x i64> @llvm.cttz.v2i64(<2 x i64> %a, i1 false)			%c = call <2 x i64> @llvm.cttz.v2i64(<2 x i64> %a, i1 false)
	store <2 x i64> %c, <2 x i64>* %x			store <2 x i64> %c, <2 x i64>* %x
	▲ Show 20 Lines • Show All 626 Lines • ▼ Show 20 Lines
	; LMULMAX2-RV64-LABEL: cttz_v4i64:			; LMULMAX2-RV64-LABEL: cttz_v4i64:
	; LMULMAX2-RV64: # %bb.0:			; LMULMAX2-RV64: # %bb.0:
	; LMULMAX2-RV64-NEXT: vsetivli zero, 4, e64, m2, ta, mu			; LMULMAX2-RV64-NEXT: vsetivli zero, 4, e64, m2, ta, mu
	; LMULMAX2-RV64-NEXT: vle64.v v8, (a0)			; LMULMAX2-RV64-NEXT: vle64.v v8, (a0)
	; LMULMAX2-RV64-NEXT: li a1, 1			; LMULMAX2-RV64-NEXT: li a1, 1
	; LMULMAX2-RV64-NEXT: vsub.vx v10, v8, a1			; LMULMAX2-RV64-NEXT: vsub.vx v10, v8, a1
	; LMULMAX2-RV64-NEXT: vxor.vi v8, v8, -1			; LMULMAX2-RV64-NEXT: vxor.vi v8, v8, -1
	; LMULMAX2-RV64-NEXT: vand.vv v8, v8, v10			; LMULMAX2-RV64-NEXT: vand.vv v8, v8, v10
				; LMULMAX2-RV64-NEXT: lui a1, %hi(.LCPI7_0)
				; LMULMAX2-RV64-NEXT: ld a1, %lo(.LCPI7_0)(a1)
				; LMULMAX2-RV64-NEXT: lui a2, %hi(.LCPI7_1)
				; LMULMAX2-RV64-NEXT: ld a2, %lo(.LCPI7_1)(a2)
	; LMULMAX2-RV64-NEXT: vsrl.vi v10, v8, 1			; LMULMAX2-RV64-NEXT: vsrl.vi v10, v8, 1
	; LMULMAX2-RV64-NEXT: lui a1, 21845
	; LMULMAX2-RV64-NEXT: addiw a1, a1, 1365
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 1365
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 1365
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 1365
	; LMULMAX2-RV64-NEXT: vand.vx v10, v10, a1			; LMULMAX2-RV64-NEXT: vand.vx v10, v10, a1
	; LMULMAX2-RV64-NEXT: vsub.vv v8, v8, v10			; LMULMAX2-RV64-NEXT: vsub.vv v8, v8, v10
	; LMULMAX2-RV64-NEXT: lui a1, 13107			; LMULMAX2-RV64-NEXT: vand.vx v10, v8, a2
	; LMULMAX2-RV64-NEXT: addiw a1, a1, 819
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 819
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 819
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 819
	; LMULMAX2-RV64-NEXT: vand.vx v10, v8, a1
	; LMULMAX2-RV64-NEXT: vsrl.vi v8, v8, 2			; LMULMAX2-RV64-NEXT: vsrl.vi v8, v8, 2
	; LMULMAX2-RV64-NEXT: vand.vx v8, v8, a1			; LMULMAX2-RV64-NEXT: vand.vx v8, v8, a2
	; LMULMAX2-RV64-NEXT: vadd.vv v8, v10, v8			; LMULMAX2-RV64-NEXT: vadd.vv v8, v10, v8
				; LMULMAX2-RV64-NEXT: lui a1, %hi(.LCPI7_2)
				; LMULMAX2-RV64-NEXT: ld a1, %lo(.LCPI7_2)(a1)
				; LMULMAX2-RV64-NEXT: lui a2, %hi(.LCPI7_3)
				; LMULMAX2-RV64-NEXT: ld a2, %lo(.LCPI7_3)(a2)
	; LMULMAX2-RV64-NEXT: vsrl.vi v10, v8, 4			; LMULMAX2-RV64-NEXT: vsrl.vi v10, v8, 4
	; LMULMAX2-RV64-NEXT: vadd.vv v8, v8, v10			; LMULMAX2-RV64-NEXT: vadd.vv v8, v8, v10
	; LMULMAX2-RV64-NEXT: lui a1, 3855
	; LMULMAX2-RV64-NEXT: addiw a1, a1, 241
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, -241
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 241
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, -241
	; LMULMAX2-RV64-NEXT: vand.vx v8, v8, a1			; LMULMAX2-RV64-NEXT: vand.vx v8, v8, a1
	; LMULMAX2-RV64-NEXT: lui a1, 4112			; LMULMAX2-RV64-NEXT: vmul.vx v8, v8, a2
	; LMULMAX2-RV64-NEXT: addiw a1, a1, 257
	; LMULMAX2-RV64-NEXT: slli a1, a1, 16
	; LMULMAX2-RV64-NEXT: addi a1, a1, 257
	; LMULMAX2-RV64-NEXT: slli a1, a1, 16
	; LMULMAX2-RV64-NEXT: addi a1, a1, 257
	; LMULMAX2-RV64-NEXT: vmul.vx v8, v8, a1
	; LMULMAX2-RV64-NEXT: li a1, 56			; LMULMAX2-RV64-NEXT: li a1, 56
	; LMULMAX2-RV64-NEXT: vsrl.vx v8, v8, a1			; LMULMAX2-RV64-NEXT: vsrl.vx v8, v8, a1
	; LMULMAX2-RV64-NEXT: vse64.v v8, (a0)			; LMULMAX2-RV64-NEXT: vse64.v v8, (a0)
	; LMULMAX2-RV64-NEXT: ret			; LMULMAX2-RV64-NEXT: ret
	;			;
	; LMULMAX1-RV32-LABEL: cttz_v4i64:			; LMULMAX1-RV32-LABEL: cttz_v4i64:
	; LMULMAX1-RV32: # %bb.0:			; LMULMAX1-RV32: # %bb.0:
	; LMULMAX1-RV32-NEXT: vsetivli zero, 2, e64, m1, ta, mu			; LMULMAX1-RV32-NEXT: vsetivli zero, 2, e64, m1, ta, mu
	▲ Show 20 Lines • Show All 57 Lines • ▼ Show 20 Lines
	; LMULMAX1-RV32-NEXT: vsrl.vx v9, v9, a3			; LMULMAX1-RV32-NEXT: vsrl.vx v9, v9, a3
	; LMULMAX1-RV32-NEXT: vse64.v v9, (a0)			; LMULMAX1-RV32-NEXT: vse64.v v9, (a0)
	; LMULMAX1-RV32-NEXT: vse64.v v8, (a1)			; LMULMAX1-RV32-NEXT: vse64.v v8, (a1)
	; LMULMAX1-RV32-NEXT: ret			; LMULMAX1-RV32-NEXT: ret
	;			;
	; LMULMAX1-RV64-LABEL: cttz_v4i64:			; LMULMAX1-RV64-LABEL: cttz_v4i64:
	; LMULMAX1-RV64: # %bb.0:			; LMULMAX1-RV64: # %bb.0:
	; LMULMAX1-RV64-NEXT: vsetivli zero, 2, e64, m1, ta, mu			; LMULMAX1-RV64-NEXT: vsetivli zero, 2, e64, m1, ta, mu
	; LMULMAX1-RV64-NEXT: addi a7, a0, 16			; LMULMAX1-RV64-NEXT: addi a1, a0, 16
	; LMULMAX1-RV64-NEXT: vle64.v v8, (a7)			; LMULMAX1-RV64-NEXT: vle64.v v8, (a1)
	; LMULMAX1-RV64-NEXT: vle64.v v9, (a0)			; LMULMAX1-RV64-NEXT: vle64.v v9, (a0)
	; LMULMAX1-RV64-NEXT: li a6, 1			; LMULMAX1-RV64-NEXT: li a6, 1
	; LMULMAX1-RV64-NEXT: vsub.vx v10, v8, a6			; LMULMAX1-RV64-NEXT: vsub.vx v10, v8, a6
	; LMULMAX1-RV64-NEXT: vxor.vi v8, v8, -1			; LMULMAX1-RV64-NEXT: vxor.vi v8, v8, -1
	; LMULMAX1-RV64-NEXT: vand.vv v8, v8, v10			; LMULMAX1-RV64-NEXT: vand.vv v8, v8, v10
				; LMULMAX1-RV64-NEXT: lui a3, %hi(.LCPI7_0)
				; LMULMAX1-RV64-NEXT: ld a3, %lo(.LCPI7_0)(a3)
				; LMULMAX1-RV64-NEXT: lui a4, %hi(.LCPI7_1)
				; LMULMAX1-RV64-NEXT: ld a4, %lo(.LCPI7_1)(a4)
	; LMULMAX1-RV64-NEXT: vsrl.vi v10, v8, 1			; LMULMAX1-RV64-NEXT: vsrl.vi v10, v8, 1
	; LMULMAX1-RV64-NEXT: lui a3, 21845
	; LMULMAX1-RV64-NEXT: addiw a3, a3, 1365
	; LMULMAX1-RV64-NEXT: slli a3, a3, 12
	; LMULMAX1-RV64-NEXT: addi a3, a3, 1365
	; LMULMAX1-RV64-NEXT: slli a3, a3, 12
	; LMULMAX1-RV64-NEXT: addi a3, a3, 1365
	; LMULMAX1-RV64-NEXT: slli a3, a3, 12
	; LMULMAX1-RV64-NEXT: addi a3, a3, 1365
	; LMULMAX1-RV64-NEXT: vand.vx v10, v10, a3			; LMULMAX1-RV64-NEXT: vand.vx v10, v10, a3
	; LMULMAX1-RV64-NEXT: vsub.vv v8, v8, v10			; LMULMAX1-RV64-NEXT: vsub.vv v8, v8, v10
	; LMULMAX1-RV64-NEXT: lui a4, 13107
	; LMULMAX1-RV64-NEXT: addiw a4, a4, 819
	; LMULMAX1-RV64-NEXT: slli a4, a4, 12
	; LMULMAX1-RV64-NEXT: addi a4, a4, 819
	; LMULMAX1-RV64-NEXT: slli a4, a4, 12
	; LMULMAX1-RV64-NEXT: addi a4, a4, 819
	; LMULMAX1-RV64-NEXT: slli a4, a4, 12
	; LMULMAX1-RV64-NEXT: addi a4, a4, 819
	; LMULMAX1-RV64-NEXT: vand.vx v10, v8, a4			; LMULMAX1-RV64-NEXT: vand.vx v10, v8, a4
	; LMULMAX1-RV64-NEXT: vsrl.vi v8, v8, 2			; LMULMAX1-RV64-NEXT: vsrl.vi v8, v8, 2
	; LMULMAX1-RV64-NEXT: vand.vx v8, v8, a4			; LMULMAX1-RV64-NEXT: vand.vx v8, v8, a4
	; LMULMAX1-RV64-NEXT: vadd.vv v8, v10, v8			; LMULMAX1-RV64-NEXT: vadd.vv v8, v10, v8
				; LMULMAX1-RV64-NEXT: lui a5, %hi(.LCPI7_2)
				; LMULMAX1-RV64-NEXT: ld a5, %lo(.LCPI7_2)(a5)
				; LMULMAX1-RV64-NEXT: lui a2, %hi(.LCPI7_3)
				; LMULMAX1-RV64-NEXT: ld a2, %lo(.LCPI7_3)(a2)
	; LMULMAX1-RV64-NEXT: vsrl.vi v10, v8, 4			; LMULMAX1-RV64-NEXT: vsrl.vi v10, v8, 4
	; LMULMAX1-RV64-NEXT: vadd.vv v8, v8, v10			; LMULMAX1-RV64-NEXT: vadd.vv v8, v8, v10
	; LMULMAX1-RV64-NEXT: lui a5, 3855
	; LMULMAX1-RV64-NEXT: addiw a5, a5, 241
	; LMULMAX1-RV64-NEXT: slli a5, a5, 12
	; LMULMAX1-RV64-NEXT: addi a5, a5, -241
	; LMULMAX1-RV64-NEXT: slli a5, a5, 12
	; LMULMAX1-RV64-NEXT: addi a5, a5, 241
	; LMULMAX1-RV64-NEXT: slli a5, a5, 12
	; LMULMAX1-RV64-NEXT: addi a5, a5, -241
	; LMULMAX1-RV64-NEXT: vand.vx v8, v8, a5			; LMULMAX1-RV64-NEXT: vand.vx v8, v8, a5
	; LMULMAX1-RV64-NEXT: lui a2, 4112
	; LMULMAX1-RV64-NEXT: addiw a2, a2, 257
	; LMULMAX1-RV64-NEXT: slli a2, a2, 16
	; LMULMAX1-RV64-NEXT: addi a2, a2, 257
	; LMULMAX1-RV64-NEXT: slli a2, a2, 16
	; LMULMAX1-RV64-NEXT: addi a2, a2, 257
	; LMULMAX1-RV64-NEXT: vmul.vx v8, v8, a2			; LMULMAX1-RV64-NEXT: vmul.vx v8, v8, a2
	; LMULMAX1-RV64-NEXT: li a1, 56			; LMULMAX1-RV64-NEXT: li a7, 56
	; LMULMAX1-RV64-NEXT: vsrl.vx v8, v8, a1			; LMULMAX1-RV64-NEXT: vsrl.vx v8, v8, a7
	; LMULMAX1-RV64-NEXT: vsub.vx v10, v9, a6			; LMULMAX1-RV64-NEXT: vsub.vx v10, v9, a6
	; LMULMAX1-RV64-NEXT: vxor.vi v9, v9, -1			; LMULMAX1-RV64-NEXT: vxor.vi v9, v9, -1
	; LMULMAX1-RV64-NEXT: vand.vv v9, v9, v10			; LMULMAX1-RV64-NEXT: vand.vv v9, v9, v10
	; LMULMAX1-RV64-NEXT: vsrl.vi v10, v9, 1			; LMULMAX1-RV64-NEXT: vsrl.vi v10, v9, 1
	; LMULMAX1-RV64-NEXT: vand.vx v10, v10, a3			; LMULMAX1-RV64-NEXT: vand.vx v10, v10, a3
	; LMULMAX1-RV64-NEXT: vsub.vv v9, v9, v10			; LMULMAX1-RV64-NEXT: vsub.vv v9, v9, v10
	; LMULMAX1-RV64-NEXT: vand.vx v10, v9, a4			; LMULMAX1-RV64-NEXT: vand.vx v10, v9, a4
	; LMULMAX1-RV64-NEXT: vsrl.vi v9, v9, 2			; LMULMAX1-RV64-NEXT: vsrl.vi v9, v9, 2
	; LMULMAX1-RV64-NEXT: vand.vx v9, v9, a4			; LMULMAX1-RV64-NEXT: vand.vx v9, v9, a4
	; LMULMAX1-RV64-NEXT: vadd.vv v9, v10, v9			; LMULMAX1-RV64-NEXT: vadd.vv v9, v10, v9
	; LMULMAX1-RV64-NEXT: vsrl.vi v10, v9, 4			; LMULMAX1-RV64-NEXT: vsrl.vi v10, v9, 4
	; LMULMAX1-RV64-NEXT: vadd.vv v9, v9, v10			; LMULMAX1-RV64-NEXT: vadd.vv v9, v9, v10
	; LMULMAX1-RV64-NEXT: vand.vx v9, v9, a5			; LMULMAX1-RV64-NEXT: vand.vx v9, v9, a5
	; LMULMAX1-RV64-NEXT: vmul.vx v9, v9, a2			; LMULMAX1-RV64-NEXT: vmul.vx v9, v9, a2
	; LMULMAX1-RV64-NEXT: vsrl.vx v9, v9, a1			; LMULMAX1-RV64-NEXT: vsrl.vx v9, v9, a7
	; LMULMAX1-RV64-NEXT: vse64.v v9, (a0)			; LMULMAX1-RV64-NEXT: vse64.v v9, (a0)
	; LMULMAX1-RV64-NEXT: vse64.v v8, (a7)			; LMULMAX1-RV64-NEXT: vse64.v v8, (a1)
	; LMULMAX1-RV64-NEXT: ret			; LMULMAX1-RV64-NEXT: ret
	;			;
	; LMULMAX8-RV32-LABEL: cttz_v4i64:			; LMULMAX8-RV32-LABEL: cttz_v4i64:
	; LMULMAX8-RV32: # %bb.0:			; LMULMAX8-RV32: # %bb.0:
	; LMULMAX8-RV32-NEXT: vsetivli zero, 4, e64, m2, ta, mu			; LMULMAX8-RV32-NEXT: vsetivli zero, 4, e64, m2, ta, mu
	; LMULMAX8-RV32-NEXT: vle64.v v8, (a0)			; LMULMAX8-RV32-NEXT: vle64.v v8, (a0)
	; LMULMAX8-RV32-NEXT: li a1, 1			; LMULMAX8-RV32-NEXT: li a1, 1
	; LMULMAX8-RV32-NEXT: vsub.vx v10, v8, a1			; LMULMAX8-RV32-NEXT: vsub.vx v10, v8, a1
	▲ Show 20 Lines • Show All 41 Lines • ▼ Show 20 Lines
	; LMULMAX8-RV64-LABEL: cttz_v4i64:			; LMULMAX8-RV64-LABEL: cttz_v4i64:
	; LMULMAX8-RV64: # %bb.0:			; LMULMAX8-RV64: # %bb.0:
	; LMULMAX8-RV64-NEXT: vsetivli zero, 4, e64, m2, ta, mu			; LMULMAX8-RV64-NEXT: vsetivli zero, 4, e64, m2, ta, mu
	; LMULMAX8-RV64-NEXT: vle64.v v8, (a0)			; LMULMAX8-RV64-NEXT: vle64.v v8, (a0)
	; LMULMAX8-RV64-NEXT: li a1, 1			; LMULMAX8-RV64-NEXT: li a1, 1
	; LMULMAX8-RV64-NEXT: vsub.vx v10, v8, a1			; LMULMAX8-RV64-NEXT: vsub.vx v10, v8, a1
	; LMULMAX8-RV64-NEXT: vxor.vi v8, v8, -1			; LMULMAX8-RV64-NEXT: vxor.vi v8, v8, -1
	; LMULMAX8-RV64-NEXT: vand.vv v8, v8, v10			; LMULMAX8-RV64-NEXT: vand.vv v8, v8, v10
				; LMULMAX8-RV64-NEXT: lui a1, %hi(.LCPI7_0)
				; LMULMAX8-RV64-NEXT: ld a1, %lo(.LCPI7_0)(a1)
				; LMULMAX8-RV64-NEXT: lui a2, %hi(.LCPI7_1)
				; LMULMAX8-RV64-NEXT: ld a2, %lo(.LCPI7_1)(a2)
	; LMULMAX8-RV64-NEXT: vsrl.vi v10, v8, 1			; LMULMAX8-RV64-NEXT: vsrl.vi v10, v8, 1
	; LMULMAX8-RV64-NEXT: lui a1, 21845
	; LMULMAX8-RV64-NEXT: addiw a1, a1, 1365
	; LMULMAX8-RV64-NEXT: slli a1, a1, 12
	; LMULMAX8-RV64-NEXT: addi a1, a1, 1365
	; LMULMAX8-RV64-NEXT: slli a1, a1, 12
	; LMULMAX8-RV64-NEXT: addi a1, a1, 1365
	; LMULMAX8-RV64-NEXT: slli a1, a1, 12
	; LMULMAX8-RV64-NEXT: addi a1, a1, 1365
	; LMULMAX8-RV64-NEXT: vand.vx v10, v10, a1			; LMULMAX8-RV64-NEXT: vand.vx v10, v10, a1
	; LMULMAX8-RV64-NEXT: vsub.vv v8, v8, v10			; LMULMAX8-RV64-NEXT: vsub.vv v8, v8, v10
	; LMULMAX8-RV64-NEXT: lui a1, 13107			; LMULMAX8-RV64-NEXT: vand.vx v10, v8, a2
	; LMULMAX8-RV64-NEXT: addiw a1, a1, 819
	; LMULMAX8-RV64-NEXT: slli a1, a1, 12
	; LMULMAX8-RV64-NEXT: addi a1, a1, 819
	; LMULMAX8-RV64-NEXT: slli a1, a1, 12
	; LMULMAX8-RV64-NEXT: addi a1, a1, 819
	; LMULMAX8-RV64-NEXT: slli a1, a1, 12
	; LMULMAX8-RV64-NEXT: addi a1, a1, 819
	; LMULMAX8-RV64-NEXT: vand.vx v10, v8, a1
	; LMULMAX8-RV64-NEXT: vsrl.vi v8, v8, 2			; LMULMAX8-RV64-NEXT: vsrl.vi v8, v8, 2
	; LMULMAX8-RV64-NEXT: vand.vx v8, v8, a1			; LMULMAX8-RV64-NEXT: vand.vx v8, v8, a2
	; LMULMAX8-RV64-NEXT: vadd.vv v8, v10, v8			; LMULMAX8-RV64-NEXT: vadd.vv v8, v10, v8
				; LMULMAX8-RV64-NEXT: lui a1, %hi(.LCPI7_2)
				; LMULMAX8-RV64-NEXT: ld a1, %lo(.LCPI7_2)(a1)
				; LMULMAX8-RV64-NEXT: lui a2, %hi(.LCPI7_3)
				; LMULMAX8-RV64-NEXT: ld a2, %lo(.LCPI7_3)(a2)
	; LMULMAX8-RV64-NEXT: vsrl.vi v10, v8, 4			; LMULMAX8-RV64-NEXT: vsrl.vi v10, v8, 4
	; LMULMAX8-RV64-NEXT: vadd.vv v8, v8, v10			; LMULMAX8-RV64-NEXT: vadd.vv v8, v8, v10
	; LMULMAX8-RV64-NEXT: lui a1, 3855
	; LMULMAX8-RV64-NEXT: addiw a1, a1, 241
	; LMULMAX8-RV64-NEXT: slli a1, a1, 12
	; LMULMAX8-RV64-NEXT: addi a1, a1, -241
	; LMULMAX8-RV64-NEXT: slli a1, a1, 12
	; LMULMAX8-RV64-NEXT: addi a1, a1, 241
	; LMULMAX8-RV64-NEXT: slli a1, a1, 12
	; LMULMAX8-RV64-NEXT: addi a1, a1, -241
	; LMULMAX8-RV64-NEXT: vand.vx v8, v8, a1			; LMULMAX8-RV64-NEXT: vand.vx v8, v8, a1
	; LMULMAX8-RV64-NEXT: lui a1, 4112			; LMULMAX8-RV64-NEXT: vmul.vx v8, v8, a2
	; LMULMAX8-RV64-NEXT: addiw a1, a1, 257
	; LMULMAX8-RV64-NEXT: slli a1, a1, 16
	; LMULMAX8-RV64-NEXT: addi a1, a1, 257
	; LMULMAX8-RV64-NEXT: slli a1, a1, 16
	; LMULMAX8-RV64-NEXT: addi a1, a1, 257
	; LMULMAX8-RV64-NEXT: vmul.vx v8, v8, a1
	; LMULMAX8-RV64-NEXT: li a1, 56			; LMULMAX8-RV64-NEXT: li a1, 56
	; LMULMAX8-RV64-NEXT: vsrl.vx v8, v8, a1			; LMULMAX8-RV64-NEXT: vsrl.vx v8, v8, a1
	; LMULMAX8-RV64-NEXT: vse64.v v8, (a0)			; LMULMAX8-RV64-NEXT: vse64.v v8, (a0)
	; LMULMAX8-RV64-NEXT: ret			; LMULMAX8-RV64-NEXT: ret
	%a = load <4 x i64>, <4 x i64>* %x			%a = load <4 x i64>, <4 x i64>* %x
	%b = load <4 x i64>, <4 x i64>* %y			%b = load <4 x i64>, <4 x i64>* %y
	%c = call <4 x i64> @llvm.cttz.v4i64(<4 x i64> %a, i1 false)			%c = call <4 x i64> @llvm.cttz.v4i64(<4 x i64> %a, i1 false)
	store <4 x i64> %c, <4 x i64>* %x			store <4 x i64> %c, <4 x i64>* %x
	ret void			ret void
	}			}
	declare <4 x i64> @llvm.cttz.v4i64(<4 x i64>, i1)			declare <4 x i64> @llvm.cttz.v4i64(<4 x i64>, i1)

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-int-buildvec.ll

	Show First 20 Lines • Show All 371 Lines • ▼ Show 20 Lines
	; RV32-NEXT: vsetivli zero, 4, e32, m1, ta, mu			; RV32-NEXT: vsetivli zero, 4, e32, m1, ta, mu
	; RV32-NEXT: vle32.v v8, (a1)			; RV32-NEXT: vle32.v v8, (a1)
	; RV32-NEXT: vse32.v v8, (a0)			; RV32-NEXT: vse32.v v8, (a0)
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: buildvec_dominant0_v2i32:			; RV64-LABEL: buildvec_dominant0_v2i32:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: vsetivli zero, 2, e64, m1, ta, mu			; RV64-NEXT: vsetivli zero, 2, e64, m1, ta, mu
				; RV64-NEXT: lui a1, %hi(.LCPI20_0)
				; RV64-NEXT: ld a1, %lo(.LCPI20_0)(a1)
	; RV64-NEXT: vmv.v.i v8, -1			; RV64-NEXT: vmv.v.i v8, -1
	; RV64-NEXT: lui a1, 3641
	; RV64-NEXT: addiw a1, a1, -455
	; RV64-NEXT: slli a1, a1, 12
	; RV64-NEXT: addi a1, a1, -455
	; RV64-NEXT: slli a1, a1, 12
	; RV64-NEXT: addi a1, a1, -455
	; RV64-NEXT: slli a1, a1, 13
	; RV64-NEXT: addi a1, a1, -910
	; RV64-NEXT: vsetvli zero, zero, e64, m1, tu, mu			; RV64-NEXT: vsetvli zero, zero, e64, m1, tu, mu
	; RV64-NEXT: vmv.s.x v8, a1			; RV64-NEXT: vmv.s.x v8, a1
	; RV64-NEXT: vse64.v v8, (a0)			; RV64-NEXT: vse64.v v8, (a0)
	; RV64-NEXT: ret			; RV64-NEXT: ret
	store <2 x i64> <i64 2049638230412172402, i64 -1>, <2 x i64>* %x			store <2 x i64> <i64 2049638230412172402, i64 -1>, <2 x i64>* %x
	ret void			ret void
	}			}

	▲ Show 20 Lines • Show All 63 Lines • ▼ Show 20 Lines
	; RV32-NEXT: addi a1, a1, %lo(.LCPI24_0)			; RV32-NEXT: addi a1, a1, %lo(.LCPI24_0)
	; RV32-NEXT: vsetivli zero, 16, e8, m1, ta, mu			; RV32-NEXT: vsetivli zero, 16, e8, m1, ta, mu
	; RV32-NEXT: vle8.v v8, (a1)			; RV32-NEXT: vle8.v v8, (a1)
	; RV32-NEXT: vse8.v v8, (a0)			; RV32-NEXT: vse8.v v8, (a0)
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: buildvec_seq_v16i8_v2i64:			; RV64-LABEL: buildvec_seq_v16i8_v2i64:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: lui a1, 32880			; RV64-NEXT: lui a1, %hi(.LCPI24_0)
	; RV64-NEXT: addiw a1, a1, 1541			; RV64-NEXT: ld a1, %lo(.LCPI24_0)(a1)
	; RV64-NEXT: slli a1, a1, 16
	; RV64-NEXT: addi a1, a1, 1027
	; RV64-NEXT: slli a1, a1, 16
	; RV64-NEXT: addi a1, a1, 513
	; RV64-NEXT: vsetivli zero, 2, e64, m1, ta, mu			; RV64-NEXT: vsetivli zero, 2, e64, m1, ta, mu
	; RV64-NEXT: vmv.v.x v8, a1			; RV64-NEXT: vmv.v.x v8, a1
	; RV64-NEXT: vsetivli zero, 16, e8, m1, ta, mu			; RV64-NEXT: vsetivli zero, 16, e8, m1, ta, mu
	; RV64-NEXT: vse8.v v8, (a0)			; RV64-NEXT: vse8.v v8, (a0)
	; RV64-NEXT: ret			; RV64-NEXT: ret
	store <16 x i8> <i8 1, i8 2, i8 3, i8 4, i8 5, i8 6, i8 7, i8 8, i8 1, i8 2, i8 3, i8 4, i8 5, i8 6, i8 7, i8 8>, <16 x i8>* %x			store <16 x i8> <i8 1, i8 2, i8 3, i8 4, i8 5, i8 6, i8 7, i8 8, i8 1, i8 2, i8 3, i8 4, i8 5, i8 6, i8 7, i8 8>, <16 x i8>* %x
	ret void			ret void
	}			}
	Show All 40 Lines
	; RV32-NEXT: vmerge.vim v8, v8, 3, v0			; RV32-NEXT: vmerge.vim v8, v8, 3, v0
	; RV32-NEXT: vse8.v v8, (a0)			; RV32-NEXT: vse8.v v8, (a0)
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: buildvec_seq_v9i8:			; RV64-LABEL: buildvec_seq_v9i8:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: li a1, 3			; RV64-NEXT: li a1, 3
	; RV64-NEXT: sb a1, 8(a0)			; RV64-NEXT: sb a1, 8(a0)
	; RV64-NEXT: lui a1, 4104			; RV64-NEXT: lui a1, %hi(.LCPI26_0)
	; RV64-NEXT: addiw a1, a1, 385			; RV64-NEXT: ld a1, %lo(.LCPI26_0)(a1)
	; RV64-NEXT: slli a1, a1, 17
	; RV64-NEXT: addi a1, a1, 259
	; RV64-NEXT: slli a1, a1, 16
	; RV64-NEXT: addi a1, a1, 513
	; RV64-NEXT: sd a1, 0(a0)			; RV64-NEXT: sd a1, 0(a0)
	; RV64-NEXT: ret			; RV64-NEXT: ret
	store <9 x i8> <i8 1, i8 2, i8 3, i8 1, i8 2, i8 3, i8 1, i8 2, i8 3>, <9 x i8>* %x			store <9 x i8> <i8 1, i8 2, i8 3, i8 1, i8 2, i8 3, i8 1, i8 2, i8 3>, <9 x i8>* %x
	ret void			ret void
	}			}

	define void @buildvec_seq_v4i16_v2i32(<4 x i16>* %x) {			define void @buildvec_seq_v4i16_v2i32(<4 x i16>* %x) {
	; CHECK-LABEL: buildvec_seq_v4i16_v2i32:			; CHECK-LABEL: buildvec_seq_v4i16_v2i32:
	▲ Show 20 Lines • Show All 97 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-int.ll

This file is larger than 256 KB, so syntax highlighting is disabled by default.

	Show First 20 Lines • Show All 1,028 Lines • ▼ Show 20 Lines
	; RV32-NEXT: vsrl.vv v8, v8, v9			; RV32-NEXT: vsrl.vv v8, v8, v9
	; RV32-NEXT: vse64.v v8, (a0)			; RV32-NEXT: vse64.v v8, (a0)
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: mulhu_v2i64:			; RV64-LABEL: mulhu_v2i64:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: vsetivli zero, 2, e64, m1, ta, mu			; RV64-NEXT: vsetivli zero, 2, e64, m1, ta, mu
	; RV64-NEXT: vle64.v v8, (a0)			; RV64-NEXT: vle64.v v8, (a0)
	; RV64-NEXT: lui a1, 1035469			; RV64-NEXT: lui a1, %hi(.LCPI55_0)
	; RV64-NEXT: addiw a1, a1, -819			; RV64-NEXT: ld a1, %lo(.LCPI55_0)(a1)
	; RV64-NEXT: slli a1, a1, 12			; RV64-NEXT: lui a2, %hi(.LCPI55_1)
	; RV64-NEXT: addi a1, a1, -819			; RV64-NEXT: ld a2, %lo(.LCPI55_1)(a2)
	; RV64-NEXT: slli a1, a1, 12
	; RV64-NEXT: addi a1, a1, -819
	; RV64-NEXT: slli a1, a1, 12
	; RV64-NEXT: addi a1, a1, -819
	; RV64-NEXT: vmv.v.x v9, a1			; RV64-NEXT: vmv.v.x v9, a1
	; RV64-NEXT: lui a1, 1026731
	; RV64-NEXT: addiw a1, a1, -1365
	; RV64-NEXT: slli a1, a1, 12
	; RV64-NEXT: addi a1, a1, -1365
	; RV64-NEXT: slli a1, a1, 12
	; RV64-NEXT: addi a1, a1, -1365
	; RV64-NEXT: slli a1, a1, 12
	; RV64-NEXT: addi a1, a1, -1365
	; RV64-NEXT: vsetvli zero, zero, e64, m1, tu, mu			; RV64-NEXT: vsetvli zero, zero, e64, m1, tu, mu
	; RV64-NEXT: vmv.s.x v9, a1			; RV64-NEXT: vmv.s.x v9, a2
	; RV64-NEXT: vsetvli zero, zero, e64, m1, ta, mu			; RV64-NEXT: vsetvli zero, zero, e64, m1, ta, mu
	; RV64-NEXT: vmulhu.vv v8, v8, v9			; RV64-NEXT: vmulhu.vv v8, v8, v9
	; RV64-NEXT: vid.v v9			; RV64-NEXT: vid.v v9
	; RV64-NEXT: vadd.vi v9, v9, 1			; RV64-NEXT: vadd.vi v9, v9, 1
	; RV64-NEXT: vsrl.vv v8, v8, v9			; RV64-NEXT: vsrl.vv v8, v8, v9
	; RV64-NEXT: vse64.v v8, (a0)			; RV64-NEXT: vse64.v v8, (a0)
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%a = load <2 x i64>, <2 x i64>* %x			%a = load <2 x i64>, <2 x i64>* %x
	▲ Show 20 Lines • Show All 117 Lines • ▼ Show 20 Lines
	; RV32-NEXT: vadd.vv v8, v8, v9			; RV32-NEXT: vadd.vv v8, v8, v9
	; RV32-NEXT: vse32.v v8, (a0)			; RV32-NEXT: vse32.v v8, (a0)
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: mulhs_v4i32:			; RV64-LABEL: mulhs_v4i32:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: vsetivli zero, 4, e32, m1, ta, mu			; RV64-NEXT: vsetivli zero, 4, e32, m1, ta, mu
	; RV64-NEXT: vle32.v v8, (a0)			; RV64-NEXT: vle32.v v8, (a0)
	; RV64-NEXT: lui a1, 13107			; RV64-NEXT: lui a1, %hi(.LCPI58_0)
	; RV64-NEXT: addiw a1, a1, 819			; RV64-NEXT: ld a1, %lo(.LCPI58_0)(a1)
	; RV64-NEXT: slli a1, a1, 12
	; RV64-NEXT: addi a1, a1, 973
	; RV64-NEXT: slli a1, a1, 12
	; RV64-NEXT: addi a1, a1, -819
	; RV64-NEXT: slli a1, a1, 13
	; RV64-NEXT: addi a1, a1, -1639
	; RV64-NEXT: vsetivli zero, 2, e64, m1, ta, mu			; RV64-NEXT: vsetivli zero, 2, e64, m1, ta, mu
	; RV64-NEXT: vmv.v.x v9, a1			; RV64-NEXT: vmv.v.x v9, a1
	; RV64-NEXT: vsetivli zero, 4, e32, m1, ta, mu			; RV64-NEXT: vsetivli zero, 4, e32, m1, ta, mu
	; RV64-NEXT: vmulh.vv v8, v8, v9			; RV64-NEXT: vmulh.vv v8, v8, v9
	; RV64-NEXT: vsra.vi v8, v8, 1			; RV64-NEXT: vsra.vi v8, v8, 1
	; RV64-NEXT: vsrl.vi v9, v8, 31			; RV64-NEXT: vsrl.vi v9, v8, 31
	; RV64-NEXT: vadd.vv v8, v8, v9			; RV64-NEXT: vadd.vv v8, v8, v9
	; RV64-NEXT: vse32.v v8, (a0)			; RV64-NEXT: vse32.v v8, (a0)
	Show All 37 Lines
	; RV32-NEXT: vadd.vv v8, v8, v9			; RV32-NEXT: vadd.vv v8, v8, v9
	; RV32-NEXT: vse64.v v8, (a0)			; RV32-NEXT: vse64.v v8, (a0)
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: mulhs_v2i64:			; RV64-LABEL: mulhs_v2i64:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: vsetivli zero, 2, e64, m1, ta, mu			; RV64-NEXT: vsetivli zero, 2, e64, m1, ta, mu
	; RV64-NEXT: vle64.v v8, (a0)			; RV64-NEXT: vle64.v v8, (a0)
	; RV64-NEXT: lui a1, 21845			; RV64-NEXT: lui a1, %hi(.LCPI59_0)
	; RV64-NEXT: addiw a1, a1, 1365			; RV64-NEXT: ld a1, %lo(.LCPI59_0)(a1)
	; RV64-NEXT: slli a1, a1, 12			; RV64-NEXT: lui a2, %hi(.LCPI59_1)
	; RV64-NEXT: addi a1, a1, 1365			; RV64-NEXT: ld a2, %lo(.LCPI59_1)(a2)
	; RV64-NEXT: slli a1, a1, 12			; RV64-NEXT: vmv.v.x v9, a1
	; RV64-NEXT: addi a1, a1, 1365
	; RV64-NEXT: slli a1, a1, 12
	; RV64-NEXT: addi a2, a1, 1365
	; RV64-NEXT: vmv.v.x v9, a2
	; RV64-NEXT: addi a1, a1, 1366
	; RV64-NEXT: vsetvli zero, zero, e64, m1, tu, mu			; RV64-NEXT: vsetvli zero, zero, e64, m1, tu, mu
	; RV64-NEXT: vmv.s.x v9, a1			; RV64-NEXT: vmv.s.x v9, a2
	; RV64-NEXT: vsetvli zero, zero, e64, m1, ta, mu			; RV64-NEXT: vsetvli zero, zero, e64, m1, ta, mu
	; RV64-NEXT: vmulh.vv v9, v8, v9			; RV64-NEXT: vmulh.vv v9, v8, v9
	; RV64-NEXT: vid.v v10			; RV64-NEXT: vid.v v10
	; RV64-NEXT: vrsub.vi v11, v10, 0			; RV64-NEXT: vrsub.vi v11, v10, 0
	; RV64-NEXT: vmadd.vv v11, v8, v9			; RV64-NEXT: vmadd.vv v11, v8, v9
	; RV64-NEXT: li a1, 63			; RV64-NEXT: li a1, 63
	; RV64-NEXT: vsrl.vx v8, v11, a1			; RV64-NEXT: vsrl.vx v8, v11, a1
	; RV64-NEXT: vsra.vv v9, v11, v10			; RV64-NEXT: vsra.vv v9, v11, v10
	▲ Show 20 Lines • Show All 3,103 Lines • ▼ Show 20 Lines
	; LMULMAX1-RV64-NEXT: vle64.v v8, (a0)			; LMULMAX1-RV64-NEXT: vle64.v v8, (a0)
	; LMULMAX1-RV64-NEXT: addi a1, a0, 16			; LMULMAX1-RV64-NEXT: addi a1, a0, 16
	; LMULMAX1-RV64-NEXT: vle64.v v9, (a1)			; LMULMAX1-RV64-NEXT: vle64.v v9, (a1)
	; LMULMAX1-RV64-NEXT: vmv.v.i v10, 0			; LMULMAX1-RV64-NEXT: vmv.v.i v10, 0
	; LMULMAX1-RV64-NEXT: li a2, -1			; LMULMAX1-RV64-NEXT: li a2, -1
	; LMULMAX1-RV64-NEXT: slli a2, a2, 63			; LMULMAX1-RV64-NEXT: slli a2, a2, 63
	; LMULMAX1-RV64-NEXT: vsetvli zero, zero, e64, m1, tu, mu			; LMULMAX1-RV64-NEXT: vsetvli zero, zero, e64, m1, tu, mu
	; LMULMAX1-RV64-NEXT: vmv.s.x v10, a2			; LMULMAX1-RV64-NEXT: vmv.s.x v10, a2
	; LMULMAX1-RV64-NEXT: lui a2, 1044935			; LMULMAX1-RV64-NEXT: lui a2, %hi(.LCPI132_0)
	; LMULMAX1-RV64-NEXT: addiw a2, a2, 455			; LMULMAX1-RV64-NEXT: ld a2, %lo(.LCPI132_0)(a2)
	; LMULMAX1-RV64-NEXT: slli a2, a2, 12
	; LMULMAX1-RV64-NEXT: addi a2, a2, 455
	; LMULMAX1-RV64-NEXT: slli a2, a2, 12
	; LMULMAX1-RV64-NEXT: addi a2, a2, 455
	; LMULMAX1-RV64-NEXT: slli a2, a2, 13
	; LMULMAX1-RV64-NEXT: addi a2, a2, 911
	; LMULMAX1-RV64-NEXT: vsetvli zero, zero, e64, m1, ta, mu			; LMULMAX1-RV64-NEXT: vsetvli zero, zero, e64, m1, ta, mu
				; LMULMAX1-RV64-NEXT: lui a3, %hi(.LCPI132_1)
				; LMULMAX1-RV64-NEXT: ld a3, %lo(.LCPI132_1)(a3)
	; LMULMAX1-RV64-NEXT: vmv.v.x v11, a2			; LMULMAX1-RV64-NEXT: vmv.v.x v11, a2
	; LMULMAX1-RV64-NEXT: lui a2, 4681
	; LMULMAX1-RV64-NEXT: addiw a2, a2, 585
	; LMULMAX1-RV64-NEXT: slli a2, a2, 12
	; LMULMAX1-RV64-NEXT: addi a2, a2, 585
	; LMULMAX1-RV64-NEXT: slli a2, a2, 12
	; LMULMAX1-RV64-NEXT: addi a2, a2, 585
	; LMULMAX1-RV64-NEXT: slli a2, a2, 13
	; LMULMAX1-RV64-NEXT: addi a2, a2, 1171
	; LMULMAX1-RV64-NEXT: vsetvli zero, zero, e64, m1, tu, mu			; LMULMAX1-RV64-NEXT: vsetvli zero, zero, e64, m1, tu, mu
	; LMULMAX1-RV64-NEXT: vmv.s.x v11, a2			; LMULMAX1-RV64-NEXT: vmv.s.x v11, a3
	; LMULMAX1-RV64-NEXT: vsetvli zero, zero, e64, m1, ta, mu			; LMULMAX1-RV64-NEXT: vsetvli zero, zero, e64, m1, ta, mu
	; LMULMAX1-RV64-NEXT: vmulhu.vv v11, v9, v11			; LMULMAX1-RV64-NEXT: vmulhu.vv v11, v9, v11
	; LMULMAX1-RV64-NEXT: vsub.vv v9, v9, v11			; LMULMAX1-RV64-NEXT: vsub.vv v9, v9, v11
				; LMULMAX1-RV64-NEXT: lui a2, %hi(.LCPI132_2)
				; LMULMAX1-RV64-NEXT: ld a2, %lo(.LCPI132_2)(a2)
	; LMULMAX1-RV64-NEXT: vmulhu.vv v9, v9, v10			; LMULMAX1-RV64-NEXT: vmulhu.vv v9, v9, v10
	; LMULMAX1-RV64-NEXT: vadd.vv v9, v9, v11			; LMULMAX1-RV64-NEXT: vadd.vv v9, v9, v11
	; LMULMAX1-RV64-NEXT: vid.v v10			; LMULMAX1-RV64-NEXT: vid.v v10
	; LMULMAX1-RV64-NEXT: vadd.vi v11, v10, 2
	; LMULMAX1-RV64-NEXT: vsrl.vv v9, v9, v11
	; LMULMAX1-RV64-NEXT: lui a2, 1035469
	; LMULMAX1-RV64-NEXT: addiw a2, a2, -819
	; LMULMAX1-RV64-NEXT: slli a2, a2, 12
	; LMULMAX1-RV64-NEXT: addi a2, a2, -819
	; LMULMAX1-RV64-NEXT: slli a2, a2, 12
	; LMULMAX1-RV64-NEXT: addi a2, a2, -819
	; LMULMAX1-RV64-NEXT: slli a2, a2, 12
	; LMULMAX1-RV64-NEXT: addi a2, a2, -819
	; LMULMAX1-RV64-NEXT: vmv.v.x v11, a2			; LMULMAX1-RV64-NEXT: vmv.v.x v11, a2
	; LMULMAX1-RV64-NEXT: lui a2, 1026731			; LMULMAX1-RV64-NEXT: lui a2, %hi(.LCPI132_3)
	; LMULMAX1-RV64-NEXT: addiw a2, a2, -1365			; LMULMAX1-RV64-NEXT: ld a2, %lo(.LCPI132_3)(a2)
	; LMULMAX1-RV64-NEXT: slli a2, a2, 12			; LMULMAX1-RV64-NEXT: vadd.vi v12, v10, 2
	; LMULMAX1-RV64-NEXT: addi a2, a2, -1365			; LMULMAX1-RV64-NEXT: vsrl.vv v9, v9, v12
	; LMULMAX1-RV64-NEXT: slli a2, a2, 12
	; LMULMAX1-RV64-NEXT: addi a2, a2, -1365
	; LMULMAX1-RV64-NEXT: slli a2, a2, 12
	; LMULMAX1-RV64-NEXT: addi a2, a2, -1365
	; LMULMAX1-RV64-NEXT: vsetvli zero, zero, e64, m1, tu, mu			; LMULMAX1-RV64-NEXT: vsetvli zero, zero, e64, m1, tu, mu
	; LMULMAX1-RV64-NEXT: vmv.s.x v11, a2			; LMULMAX1-RV64-NEXT: vmv.s.x v11, a2
	; LMULMAX1-RV64-NEXT: vsetvli zero, zero, e64, m1, ta, mu			; LMULMAX1-RV64-NEXT: vsetvli zero, zero, e64, m1, ta, mu
	; LMULMAX1-RV64-NEXT: vmulhu.vv v8, v8, v11			; LMULMAX1-RV64-NEXT: vmulhu.vv v8, v8, v11
	; LMULMAX1-RV64-NEXT: vadd.vi v10, v10, 1			; LMULMAX1-RV64-NEXT: vadd.vi v10, v10, 1
	; LMULMAX1-RV64-NEXT: vsrl.vv v8, v8, v10			; LMULMAX1-RV64-NEXT: vsrl.vv v8, v8, v10
	; LMULMAX1-RV64-NEXT: vse64.v v8, (a0)			; LMULMAX1-RV64-NEXT: vse64.v v8, (a0)
	; LMULMAX1-RV64-NEXT: vse64.v v9, (a1)			; LMULMAX1-RV64-NEXT: vse64.v v9, (a1)
	▲ Show 20 Lines • Show All 179 Lines • ▼ Show 20 Lines
	; LMULMAX2-RV32-NEXT: vadd.vv v8, v8, v10			; LMULMAX2-RV32-NEXT: vadd.vv v8, v8, v10
	; LMULMAX2-RV32-NEXT: vse32.v v8, (a0)			; LMULMAX2-RV32-NEXT: vse32.v v8, (a0)
	; LMULMAX2-RV32-NEXT: ret			; LMULMAX2-RV32-NEXT: ret
	;			;
	; LMULMAX2-RV64-LABEL: mulhs_v8i32:			; LMULMAX2-RV64-LABEL: mulhs_v8i32:
	; LMULMAX2-RV64: # %bb.0:			; LMULMAX2-RV64: # %bb.0:
	; LMULMAX2-RV64-NEXT: vsetivli zero, 8, e32, m2, ta, mu			; LMULMAX2-RV64-NEXT: vsetivli zero, 8, e32, m2, ta, mu
	; LMULMAX2-RV64-NEXT: vle32.v v8, (a0)			; LMULMAX2-RV64-NEXT: vle32.v v8, (a0)
	; LMULMAX2-RV64-NEXT: lui a1, 13107			; LMULMAX2-RV64-NEXT: lui a1, %hi(.LCPI135_0)
	; LMULMAX2-RV64-NEXT: addiw a1, a1, 819			; LMULMAX2-RV64-NEXT: ld a1, %lo(.LCPI135_0)(a1)
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 973
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, -819
	; LMULMAX2-RV64-NEXT: slli a1, a1, 13
	; LMULMAX2-RV64-NEXT: addi a1, a1, -1639
	; LMULMAX2-RV64-NEXT: vsetivli zero, 4, e64, m2, ta, mu			; LMULMAX2-RV64-NEXT: vsetivli zero, 4, e64, m2, ta, mu
	; LMULMAX2-RV64-NEXT: vmv.v.x v10, a1			; LMULMAX2-RV64-NEXT: vmv.v.x v10, a1
	; LMULMAX2-RV64-NEXT: vsetivli zero, 8, e32, m2, ta, mu			; LMULMAX2-RV64-NEXT: vsetivli zero, 8, e32, m2, ta, mu
	; LMULMAX2-RV64-NEXT: vmulh.vv v8, v8, v10			; LMULMAX2-RV64-NEXT: vmulh.vv v8, v8, v10
	; LMULMAX2-RV64-NEXT: vsra.vi v8, v8, 1			; LMULMAX2-RV64-NEXT: vsra.vi v8, v8, 1
	; LMULMAX2-RV64-NEXT: vsrl.vi v10, v8, 31			; LMULMAX2-RV64-NEXT: vsrl.vi v10, v8, 31
	; LMULMAX2-RV64-NEXT: vadd.vv v8, v8, v10			; LMULMAX2-RV64-NEXT: vadd.vv v8, v8, v10
	; LMULMAX2-RV64-NEXT: vse32.v v8, (a0)			; LMULMAX2-RV64-NEXT: vse32.v v8, (a0)
	▲ Show 20 Lines • Show All 91 Lines • ▼ Show 20 Lines
	; LMULMAX2-RV64-LABEL: mulhs_v4i64:			; LMULMAX2-RV64-LABEL: mulhs_v4i64:
	; LMULMAX2-RV64: # %bb.0:			; LMULMAX2-RV64: # %bb.0:
	; LMULMAX2-RV64-NEXT: vsetivli zero, 4, e64, m2, ta, mu			; LMULMAX2-RV64-NEXT: vsetivli zero, 4, e64, m2, ta, mu
	; LMULMAX2-RV64-NEXT: vle64.v v8, (a0)			; LMULMAX2-RV64-NEXT: vle64.v v8, (a0)
	; LMULMAX2-RV64-NEXT: li a1, 5			; LMULMAX2-RV64-NEXT: li a1, 5
	; LMULMAX2-RV64-NEXT: vsetivli zero, 1, e8, mf8, ta, mu			; LMULMAX2-RV64-NEXT: vsetivli zero, 1, e8, mf8, ta, mu
	; LMULMAX2-RV64-NEXT: vmv.s.x v0, a1			; LMULMAX2-RV64-NEXT: vmv.s.x v0, a1
	; LMULMAX2-RV64-NEXT: vsetivli zero, 4, e64, m2, ta, mu			; LMULMAX2-RV64-NEXT: vsetivli zero, 4, e64, m2, ta, mu
	; LMULMAX2-RV64-NEXT: vmv.v.i v10, -1			; LMULMAX2-RV64-NEXT: lui a1, %hi(.LCPI136_0)
	; LMULMAX2-RV64-NEXT: vmerge.vim v10, v10, 0, v0			; LMULMAX2-RV64-NEXT: ld a1, %lo(.LCPI136_0)(a1)
	; LMULMAX2-RV64-NEXT: lui a1, 21845			; LMULMAX2-RV64-NEXT: lui a2, %hi(.LCPI136_1)
	; LMULMAX2-RV64-NEXT: addiw a1, a1, 1365			; LMULMAX2-RV64-NEXT: ld a2, %lo(.LCPI136_1)(a2)
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12			; LMULMAX2-RV64-NEXT: vmv.v.x v10, a1
	; LMULMAX2-RV64-NEXT: addi a1, a1, 1365			; LMULMAX2-RV64-NEXT: vmv.v.i v12, -1
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12			; LMULMAX2-RV64-NEXT: vmerge.vim v12, v12, 0, v0
	; LMULMAX2-RV64-NEXT: addi a1, a1, 1365			; LMULMAX2-RV64-NEXT: vmerge.vxm v10, v10, a2, v0
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12			; LMULMAX2-RV64-NEXT: vmulh.vv v10, v8, v10
	; LMULMAX2-RV64-NEXT: addi a2, a1, 1365			; LMULMAX2-RV64-NEXT: vmacc.vv v10, v8, v12
	; LMULMAX2-RV64-NEXT: vmv.v.x v12, a2
	; LMULMAX2-RV64-NEXT: addi a1, a1, 1366
	; LMULMAX2-RV64-NEXT: vmerge.vxm v12, v12, a1, v0
	; LMULMAX2-RV64-NEXT: vmulh.vv v12, v8, v12
	; LMULMAX2-RV64-NEXT: vmacc.vv v12, v8, v10
	; LMULMAX2-RV64-NEXT: li a1, 63			; LMULMAX2-RV64-NEXT: li a1, 63
	; LMULMAX2-RV64-NEXT: vsrl.vx v8, v12, a1			; LMULMAX2-RV64-NEXT: vsrl.vx v8, v10, a1
	; LMULMAX2-RV64-NEXT: vmv.v.i v10, 1			; LMULMAX2-RV64-NEXT: vmv.v.i v12, 1
	; LMULMAX2-RV64-NEXT: vmerge.vim v10, v10, 0, v0			; LMULMAX2-RV64-NEXT: vmerge.vim v12, v12, 0, v0
	; LMULMAX2-RV64-NEXT: vsra.vv v10, v12, v10			; LMULMAX2-RV64-NEXT: vsra.vv v10, v10, v12
	; LMULMAX2-RV64-NEXT: vadd.vv v8, v10, v8			; LMULMAX2-RV64-NEXT: vadd.vv v8, v10, v8
	; LMULMAX2-RV64-NEXT: vse64.v v8, (a0)			; LMULMAX2-RV64-NEXT: vse64.v v8, (a0)
	; LMULMAX2-RV64-NEXT: ret			; LMULMAX2-RV64-NEXT: ret
	;			;
	; LMULMAX1-RV32-LABEL: mulhs_v4i64:			; LMULMAX1-RV32-LABEL: mulhs_v4i64:
	; LMULMAX1-RV32: # %bb.0:			; LMULMAX1-RV32: # %bb.0:
	; LMULMAX1-RV32-NEXT: vsetivli zero, 2, e64, m1, ta, mu			; LMULMAX1-RV32-NEXT: vsetivli zero, 2, e64, m1, ta, mu
	; LMULMAX1-RV32-NEXT: vle64.v v8, (a0)			; LMULMAX1-RV32-NEXT: vle64.v v8, (a0)
	Show All 11 Lines
	; LMULMAX1-RV32-NEXT: ret			; LMULMAX1-RV32-NEXT: ret
	;			;
	; LMULMAX1-RV64-LABEL: mulhs_v4i64:			; LMULMAX1-RV64-LABEL: mulhs_v4i64:
	; LMULMAX1-RV64: # %bb.0:			; LMULMAX1-RV64: # %bb.0:
	; LMULMAX1-RV64-NEXT: vsetivli zero, 2, e64, m1, ta, mu			; LMULMAX1-RV64-NEXT: vsetivli zero, 2, e64, m1, ta, mu
	; LMULMAX1-RV64-NEXT: vle64.v v8, (a0)			; LMULMAX1-RV64-NEXT: vle64.v v8, (a0)
	; LMULMAX1-RV64-NEXT: addi a1, a0, 16			; LMULMAX1-RV64-NEXT: addi a1, a0, 16
	; LMULMAX1-RV64-NEXT: vle64.v v9, (a1)			; LMULMAX1-RV64-NEXT: vle64.v v9, (a1)
	; LMULMAX1-RV64-NEXT: lui a2, 21845			; LMULMAX1-RV64-NEXT: lui a2, %hi(.LCPI136_0)
	; LMULMAX1-RV64-NEXT: addiw a2, a2, 1365			; LMULMAX1-RV64-NEXT: ld a2, %lo(.LCPI136_0)(a2)
	; LMULMAX1-RV64-NEXT: slli a2, a2, 12			; LMULMAX1-RV64-NEXT: lui a3, %hi(.LCPI136_1)
	; LMULMAX1-RV64-NEXT: addi a2, a2, 1365			; LMULMAX1-RV64-NEXT: ld a3, %lo(.LCPI136_1)(a3)
	; LMULMAX1-RV64-NEXT: slli a2, a2, 12			; LMULMAX1-RV64-NEXT: vmv.v.x v10, a2
	; LMULMAX1-RV64-NEXT: addi a2, a2, 1365
	; LMULMAX1-RV64-NEXT: slli a2, a2, 12
	; LMULMAX1-RV64-NEXT: addi a3, a2, 1365
	; LMULMAX1-RV64-NEXT: vmv.v.x v10, a3
	; LMULMAX1-RV64-NEXT: addi a2, a2, 1366
	; LMULMAX1-RV64-NEXT: vsetvli zero, zero, e64, m1, tu, mu			; LMULMAX1-RV64-NEXT: vsetvli zero, zero, e64, m1, tu, mu
	; LMULMAX1-RV64-NEXT: vmv.s.x v10, a2			; LMULMAX1-RV64-NEXT: vmv.s.x v10, a3
	; LMULMAX1-RV64-NEXT: vsetvli zero, zero, e64, m1, ta, mu			; LMULMAX1-RV64-NEXT: vsetvli zero, zero, e64, m1, ta, mu
	; LMULMAX1-RV64-NEXT: vmulh.vv v11, v9, v10			; LMULMAX1-RV64-NEXT: vmulh.vv v11, v9, v10
	; LMULMAX1-RV64-NEXT: vid.v v12			; LMULMAX1-RV64-NEXT: vid.v v12
	; LMULMAX1-RV64-NEXT: vrsub.vi v13, v12, 0			; LMULMAX1-RV64-NEXT: vrsub.vi v13, v12, 0
	; LMULMAX1-RV64-NEXT: vmacc.vv v11, v13, v9			; LMULMAX1-RV64-NEXT: vmacc.vv v11, v13, v9
	; LMULMAX1-RV64-NEXT: li a2, 63			; LMULMAX1-RV64-NEXT: li a2, 63
	; LMULMAX1-RV64-NEXT: vsrl.vx v9, v11, a2			; LMULMAX1-RV64-NEXT: vsrl.vx v9, v11, a2
	; LMULMAX1-RV64-NEXT: vsra.vv v11, v11, v12			; LMULMAX1-RV64-NEXT: vsra.vv v11, v11, v12
	▲ Show 20 Lines • Show All 2,613 Lines • ▼ Show 20 Lines
	; RV32-NEXT: vse64.v v8, (a0)			; RV32-NEXT: vse64.v v8, (a0)
	; RV32-NEXT: addi sp, sp, 16			; RV32-NEXT: addi sp, sp, 16
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: mulhu_vx_v2i64:			; RV64-LABEL: mulhu_vx_v2i64:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: vsetivli zero, 2, e64, m1, ta, mu			; RV64-NEXT: vsetivli zero, 2, e64, m1, ta, mu
	; RV64-NEXT: vle64.v v8, (a0)			; RV64-NEXT: vle64.v v8, (a0)
	; RV64-NEXT: lui a1, 1026731			; RV64-NEXT: lui a1, %hi(.LCPI265_0)
	; RV64-NEXT: addiw a1, a1, -1365			; RV64-NEXT: ld a1, %lo(.LCPI265_0)(a1)
	; RV64-NEXT: slli a1, a1, 12
	; RV64-NEXT: addi a1, a1, -1365
	; RV64-NEXT: slli a1, a1, 12
	; RV64-NEXT: addi a1, a1, -1365
	; RV64-NEXT: slli a1, a1, 12
	; RV64-NEXT: addi a1, a1, -1365
	; RV64-NEXT: vmulhu.vx v8, v8, a1			; RV64-NEXT: vmulhu.vx v8, v8, a1
	; RV64-NEXT: vsrl.vi v8, v8, 1			; RV64-NEXT: vsrl.vi v8, v8, 1
	; RV64-NEXT: vse64.v v8, (a0)			; RV64-NEXT: vse64.v v8, (a0)
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%a = load <2 x i64>, <2 x i64>* %x			%a = load <2 x i64>, <2 x i64>* %x
	%b = udiv <2 x i64> %a, <i64 3, i64 3>			%b = udiv <2 x i64> %a, <i64 3, i64 3>
	store <2 x i64> %b, <2 x i64>* %x			store <2 x i64> %b, <2 x i64>* %x
	ret void			ret void
	▲ Show 20 Lines • Show All 100 Lines • ▼ Show 20 Lines
	; RV32-NEXT: vse64.v v8, (a0)			; RV32-NEXT: vse64.v v8, (a0)
	; RV32-NEXT: addi sp, sp, 16			; RV32-NEXT: addi sp, sp, 16
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: mulhs_vx_v2i64:			; RV64-LABEL: mulhs_vx_v2i64:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: vsetivli zero, 2, e64, m1, ta, mu			; RV64-NEXT: vsetivli zero, 2, e64, m1, ta, mu
	; RV64-NEXT: vle64.v v8, (a0)			; RV64-NEXT: vle64.v v8, (a0)
	; RV64-NEXT: lui a1, 21845			; RV64-NEXT: lui a1, %hi(.LCPI269_0)
	; RV64-NEXT: addiw a1, a1, 1365			; RV64-NEXT: ld a1, %lo(.LCPI269_0)(a1)
	; RV64-NEXT: slli a1, a1, 12
	; RV64-NEXT: addi a1, a1, 1365
	; RV64-NEXT: slli a1, a1, 12
	; RV64-NEXT: addi a1, a1, 1365
	; RV64-NEXT: slli a1, a1, 12
	; RV64-NEXT: addi a1, a1, 1366
	; RV64-NEXT: vmulh.vx v8, v8, a1			; RV64-NEXT: vmulh.vx v8, v8, a1
	; RV64-NEXT: li a1, 63			; RV64-NEXT: li a1, 63
	; RV64-NEXT: vsrl.vx v9, v8, a1			; RV64-NEXT: vsrl.vx v9, v8, a1
	; RV64-NEXT: vadd.vv v8, v8, v9			; RV64-NEXT: vadd.vv v8, v8, v9
	; RV64-NEXT: vse64.v v8, (a0)			; RV64-NEXT: vse64.v v8, (a0)
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%a = load <2 x i64>, <2 x i64>* %x			%a = load <2 x i64>, <2 x i64>* %x
	%b = sdiv <2 x i64> %a, <i64 3, i64 3>			%b = sdiv <2 x i64> %a, <i64 3, i64 3>
	store <2 x i64> %b, <2 x i64>* %x			store <2 x i64> %b, <2 x i64>* %x
	ret void			ret void
	}			}

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-mask-buildvec.ll

	Show First 20 Lines • Show All 463 Lines • ▼ Show 20 Lines
	; RV32-LMULMAX4-NEXT: addi a0, a0, 1776			; RV32-LMULMAX4-NEXT: addi a0, a0, 1776
	; RV32-LMULMAX4-NEXT: vmv.s.x v0, a0			; RV32-LMULMAX4-NEXT: vmv.s.x v0, a0
	; RV32-LMULMAX4-NEXT: vsetvli zero, zero, e32, mf2, tu, mu			; RV32-LMULMAX4-NEXT: vsetvli zero, zero, e32, mf2, tu, mu
	; RV32-LMULMAX4-NEXT: vslideup.vi v0, v8, 1			; RV32-LMULMAX4-NEXT: vslideup.vi v0, v8, 1
	; RV32-LMULMAX4-NEXT: ret			; RV32-LMULMAX4-NEXT: ret
	;			;
	; RV64-LMULMAX4-LABEL: buildvec_mask_v64i1:			; RV64-LMULMAX4-LABEL: buildvec_mask_v64i1:
	; RV64-LMULMAX4: # %bb.0:			; RV64-LMULMAX4: # %bb.0:
	; RV64-LMULMAX4-NEXT: lui a0, 1048429			; RV64-LMULMAX4-NEXT: lui a0, %hi(.LCPI19_0)
	; RV64-LMULMAX4-NEXT: addiw a0, a0, 1735			; RV64-LMULMAX4-NEXT: ld a0, %lo(.LCPI19_0)(a0)
	; RV64-LMULMAX4-NEXT: slli a0, a0, 13
	; RV64-LMULMAX4-NEXT: addi a0, a0, 1023
	; RV64-LMULMAX4-NEXT: slli a0, a0, 13
	; RV64-LMULMAX4-NEXT: addi a0, a0, -1189
	; RV64-LMULMAX4-NEXT: slli a0, a0, 17
	; RV64-LMULMAX4-NEXT: addi a0, a0, 1776
	; RV64-LMULMAX4-NEXT: vsetivli zero, 1, e64, m1, ta, mu			; RV64-LMULMAX4-NEXT: vsetivli zero, 1, e64, m1, ta, mu
	; RV64-LMULMAX4-NEXT: vmv.s.x v0, a0			; RV64-LMULMAX4-NEXT: vmv.s.x v0, a0
	; RV64-LMULMAX4-NEXT: ret			; RV64-LMULMAX4-NEXT: ret
	;			;
	; RV32-LMULMAX8-LABEL: buildvec_mask_v64i1:			; RV32-LMULMAX8-LABEL: buildvec_mask_v64i1:
	; RV32-LMULMAX8: # %bb.0:			; RV32-LMULMAX8: # %bb.0:
	; RV32-LMULMAX8-NEXT: lui a0, 748388			; RV32-LMULMAX8-NEXT: lui a0, 748388
	; RV32-LMULMAX8-NEXT: addi a0, a0, -1793			; RV32-LMULMAX8-NEXT: addi a0, a0, -1793
	; RV32-LMULMAX8-NEXT: vsetivli zero, 2, e32, mf2, ta, mu			; RV32-LMULMAX8-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
	; RV32-LMULMAX8-NEXT: vmv.s.x v8, a0			; RV32-LMULMAX8-NEXT: vmv.s.x v8, a0
	; RV32-LMULMAX8-NEXT: lui a0, 748384			; RV32-LMULMAX8-NEXT: lui a0, 748384
	; RV32-LMULMAX8-NEXT: addi a0, a0, 1776			; RV32-LMULMAX8-NEXT: addi a0, a0, 1776
	; RV32-LMULMAX8-NEXT: vmv.s.x v0, a0			; RV32-LMULMAX8-NEXT: vmv.s.x v0, a0
	; RV32-LMULMAX8-NEXT: vsetvli zero, zero, e32, mf2, tu, mu			; RV32-LMULMAX8-NEXT: vsetvli zero, zero, e32, mf2, tu, mu
	; RV32-LMULMAX8-NEXT: vslideup.vi v0, v8, 1			; RV32-LMULMAX8-NEXT: vslideup.vi v0, v8, 1
	; RV32-LMULMAX8-NEXT: ret			; RV32-LMULMAX8-NEXT: ret
	;			;
	; RV64-LMULMAX8-LABEL: buildvec_mask_v64i1:			; RV64-LMULMAX8-LABEL: buildvec_mask_v64i1:
	; RV64-LMULMAX8: # %bb.0:			; RV64-LMULMAX8: # %bb.0:
	; RV64-LMULMAX8-NEXT: lui a0, 1048429			; RV64-LMULMAX8-NEXT: lui a0, %hi(.LCPI19_0)
	; RV64-LMULMAX8-NEXT: addiw a0, a0, 1735			; RV64-LMULMAX8-NEXT: ld a0, %lo(.LCPI19_0)(a0)
	; RV64-LMULMAX8-NEXT: slli a0, a0, 13
	; RV64-LMULMAX8-NEXT: addi a0, a0, 1023
	; RV64-LMULMAX8-NEXT: slli a0, a0, 13
	; RV64-LMULMAX8-NEXT: addi a0, a0, -1189
	; RV64-LMULMAX8-NEXT: slli a0, a0, 17
	; RV64-LMULMAX8-NEXT: addi a0, a0, 1776
	; RV64-LMULMAX8-NEXT: vsetivli zero, 1, e64, m1, ta, mu			; RV64-LMULMAX8-NEXT: vsetivli zero, 1, e64, m1, ta, mu
	; RV64-LMULMAX8-NEXT: vmv.s.x v0, a0			; RV64-LMULMAX8-NEXT: vmv.s.x v0, a0
	; RV64-LMULMAX8-NEXT: ret			; RV64-LMULMAX8-NEXT: ret
	ret <64 x i1> <i1 0, i1 0, i1 0, i1 0, i1 1, i1 1, i1 1, i1 1, i1 0, i1 1, i1 1, i1 0, i1 0, i1 0, i1 0, i1 0, i1 0, i1 1, i1 1, i1 0, i1 1, i1 1, i1 0, i1 1, i1 0, i1 1, i1 1, i1 0, i1 1, i1 1, i1 0, i1 1, i1 1, i1 1, i1 1, i1 1, i1 1, i1 1, i1 1, i1 1, i1 0, i1 0, i1 0, i1 1, i1 1, i1 1, i1 0, i1 0, i1 0, i1 1, i1 1, i1 0, i1 1, i1 1, i1 0, i1 1, i1 0, i1 1, i1 1, i1 0, i1 1, i1 1, i1 0, i1 1>			ret <64 x i1> <i1 0, i1 0, i1 0, i1 0, i1 1, i1 1, i1 1, i1 1, i1 0, i1 1, i1 1, i1 0, i1 0, i1 0, i1 0, i1 0, i1 0, i1 1, i1 1, i1 0, i1 1, i1 1, i1 0, i1 1, i1 0, i1 1, i1 1, i1 0, i1 1, i1 1, i1 0, i1 1, i1 1, i1 1, i1 1, i1 1, i1 1, i1 1, i1 1, i1 1, i1 0, i1 0, i1 0, i1 1, i1 1, i1 1, i1 0, i1 0, i1 0, i1 1, i1 1, i1 0, i1 1, i1 1, i1 0, i1 1, i1 0, i1 1, i1 1, i1 0, i1 1, i1 1, i1 0, i1 1>
	}			}

	define <128 x i1> @buildvec_mask_v128i1() {			define <128 x i1> @buildvec_mask_v128i1() {
	; RV32-LMULMAX1-LABEL: buildvec_mask_v128i1:			; RV32-LMULMAX1-LABEL: buildvec_mask_v128i1:
	▲ Show 20 Lines • Show All 93 Lines • ▼ Show 20 Lines
	; RV32-LMULMAX4-NEXT: addi a0, a0, 1776			; RV32-LMULMAX4-NEXT: addi a0, a0, 1776
	; RV32-LMULMAX4-NEXT: vmv.s.x v8, a0			; RV32-LMULMAX4-NEXT: vmv.s.x v8, a0
	; RV32-LMULMAX4-NEXT: vsetvli zero, zero, e32, mf2, tu, mu			; RV32-LMULMAX4-NEXT: vsetvli zero, zero, e32, mf2, tu, mu
	; RV32-LMULMAX4-NEXT: vslideup.vi v8, v9, 1			; RV32-LMULMAX4-NEXT: vslideup.vi v8, v9, 1
	; RV32-LMULMAX4-NEXT: ret			; RV32-LMULMAX4-NEXT: ret
	;			;
	; RV64-LMULMAX4-LABEL: buildvec_mask_v128i1:			; RV64-LMULMAX4-LABEL: buildvec_mask_v128i1:
	; RV64-LMULMAX4: # %bb.0:			; RV64-LMULMAX4: # %bb.0:
	; RV64-LMULMAX4-NEXT: lui a0, 841543			; RV64-LMULMAX4-NEXT: lui a0, %hi(.LCPI20_0)
	; RV64-LMULMAX4-NEXT: addiw a0, a0, 511			; RV64-LMULMAX4-NEXT: ld a0, %lo(.LCPI20_0)(a0)
	; RV64-LMULMAX4-NEXT: slli a0, a0, 14
	; RV64-LMULMAX4-NEXT: addi a0, a0, 859
	; RV64-LMULMAX4-NEXT: slli a0, a0, 17
	; RV64-LMULMAX4-NEXT: addi a0, a0, 1776
	; RV64-LMULMAX4-NEXT: vsetivli zero, 1, e64, m1, ta, mu			; RV64-LMULMAX4-NEXT: vsetivli zero, 1, e64, m1, ta, mu
	; RV64-LMULMAX4-NEXT: vmv.s.x v8, a0			; RV64-LMULMAX4-NEXT: lui a1, %hi(.LCPI20_1)
	; RV64-LMULMAX4-NEXT: lui a0, 1048429			; RV64-LMULMAX4-NEXT: ld a1, %lo(.LCPI20_1)(a1)
	; RV64-LMULMAX4-NEXT: addiw a0, a0, 1735
	; RV64-LMULMAX4-NEXT: slli a0, a0, 13
	; RV64-LMULMAX4-NEXT: addi a0, a0, 1023
	; RV64-LMULMAX4-NEXT: slli a0, a0, 13
	; RV64-LMULMAX4-NEXT: addi a0, a0, -1189
	; RV64-LMULMAX4-NEXT: slli a0, a0, 17
	; RV64-LMULMAX4-NEXT: addi a0, a0, 1776
	; RV64-LMULMAX4-NEXT: vmv.s.x v0, a0			; RV64-LMULMAX4-NEXT: vmv.s.x v0, a0
				; RV64-LMULMAX4-NEXT: vmv.s.x v8, a1
	; RV64-LMULMAX4-NEXT: ret			; RV64-LMULMAX4-NEXT: ret
	;			;
	; RV32-LMULMAX8-LABEL: buildvec_mask_v128i1:			; RV32-LMULMAX8-LABEL: buildvec_mask_v128i1:
	; RV32-LMULMAX8: # %bb.0:			; RV32-LMULMAX8: # %bb.0:
	; RV32-LMULMAX8-NEXT: lui a0, 748388			; RV32-LMULMAX8-NEXT: lui a0, 748388
	; RV32-LMULMAX8-NEXT: addi a0, a0, -1793			; RV32-LMULMAX8-NEXT: addi a0, a0, -1793
	; RV32-LMULMAX8-NEXT: vsetivli zero, 4, e32, m1, ta, mu			; RV32-LMULMAX8-NEXT: vsetivli zero, 4, e32, m1, ta, mu
	; RV32-LMULMAX8-NEXT: vmv.s.x v8, a0			; RV32-LMULMAX8-NEXT: vmv.s.x v8, a0
	Show All 13 Lines
	; RV32-LMULMAX8-NEXT: vsetivli zero, 4, e32, m1, ta, mu			; RV32-LMULMAX8-NEXT: vsetivli zero, 4, e32, m1, ta, mu
	; RV32-LMULMAX8-NEXT: vmv.s.x v8, a0			; RV32-LMULMAX8-NEXT: vmv.s.x v8, a0
	; RV32-LMULMAX8-NEXT: vsetvli zero, zero, e32, m1, tu, mu			; RV32-LMULMAX8-NEXT: vsetvli zero, zero, e32, m1, tu, mu
	; RV32-LMULMAX8-NEXT: vslideup.vi v0, v8, 3			; RV32-LMULMAX8-NEXT: vslideup.vi v0, v8, 3
	; RV32-LMULMAX8-NEXT: ret			; RV32-LMULMAX8-NEXT: ret
	;			;
	; RV64-LMULMAX8-LABEL: buildvec_mask_v128i1:			; RV64-LMULMAX8-LABEL: buildvec_mask_v128i1:
	; RV64-LMULMAX8: # %bb.0:			; RV64-LMULMAX8: # %bb.0:
	; RV64-LMULMAX8-NEXT: lui a0, 841543			; RV64-LMULMAX8-NEXT: lui a0, %hi(.LCPI20_0)
	; RV64-LMULMAX8-NEXT: addiw a0, a0, 511			; RV64-LMULMAX8-NEXT: ld a0, %lo(.LCPI20_0)(a0)
	; RV64-LMULMAX8-NEXT: slli a0, a0, 14
	; RV64-LMULMAX8-NEXT: addi a0, a0, 859
	; RV64-LMULMAX8-NEXT: slli a0, a0, 17
	; RV64-LMULMAX8-NEXT: addi a0, a0, 1776
	; RV64-LMULMAX8-NEXT: vsetivli zero, 2, e64, m1, ta, mu			; RV64-LMULMAX8-NEXT: vsetivli zero, 2, e64, m1, ta, mu
				; RV64-LMULMAX8-NEXT: lui a1, %hi(.LCPI20_1)
				; RV64-LMULMAX8-NEXT: ld a1, %lo(.LCPI20_1)(a1)
	; RV64-LMULMAX8-NEXT: vmv.s.x v8, a0			; RV64-LMULMAX8-NEXT: vmv.s.x v8, a0
	; RV64-LMULMAX8-NEXT: lui a0, 1048429			; RV64-LMULMAX8-NEXT: vmv.s.x v0, a1
	; RV64-LMULMAX8-NEXT: addiw a0, a0, 1735
	; RV64-LMULMAX8-NEXT: slli a0, a0, 13
	; RV64-LMULMAX8-NEXT: addi a0, a0, 1023
	; RV64-LMULMAX8-NEXT: slli a0, a0, 13
	; RV64-LMULMAX8-NEXT: addi a0, a0, -1189
	; RV64-LMULMAX8-NEXT: slli a0, a0, 17
	; RV64-LMULMAX8-NEXT: addi a0, a0, 1776
	; RV64-LMULMAX8-NEXT: vmv.s.x v0, a0
	; RV64-LMULMAX8-NEXT: vsetvli zero, zero, e64, m1, tu, mu			; RV64-LMULMAX8-NEXT: vsetvli zero, zero, e64, m1, tu, mu
	; RV64-LMULMAX8-NEXT: vslideup.vi v0, v8, 1			; RV64-LMULMAX8-NEXT: vslideup.vi v0, v8, 1
	; RV64-LMULMAX8-NEXT: ret			; RV64-LMULMAX8-NEXT: ret
	ret <128 x i1> <i1 0, i1 0, i1 0, i1 0, i1 1, i1 1, i1 1, i1 1, i1 0, i1 1, i1 1, i1 0, i1 0, i1 0, i1 0, i1 0, i1 0, i1 1, i1 1, i1 0, i1 1, i1 1, i1 0, i1 1, i1 0, i1 1, i1 1, i1 0, i1 1, i1 1, i1 0, i1 1, i1 1, i1 1, i1 1, i1 1, i1 1, i1 1, i1 1, i1 1, i1 0, i1 0, i1 0, i1 1, i1 1, i1 1, i1 0, i1 0, i1 0, i1 1, i1 1, i1 0, i1 1, i1 1, i1 0, i1 1, i1 0, i1 1, i1 1, i1 0, i1 1, i1 1, i1 0, i1 1, i1 0, i1 0, i1 0, i1 0, i1 1, i1 1, i1 1, i1 1, i1 0, i1 1, i1 1, i1 0, i1 0, i1 0, i1 0, i1 0, i1 0, i1 1, i1 1, i1 0, i1 1, i1 1, i1 0, i1 1, i1 0, i1 1, i1 1, i1 0, i1 0, i1 0, i1 0, i1 1, i1 1, i1 1, i1 1, i1 1, i1 1, i1 1, i1 1, i1 1, i1 0, i1 0, i1 0, i1 1, i1 1, i1 1, i1 0, i1 0, i1 0, i1 1, i1 0, i1 1, i1 1, i1 1, i1 0, i1 1, i1 0, i1 1, i1 1, i1 0, i1 0, i1 1, i1 1, i1 1>			ret <128 x i1> <i1 0, i1 0, i1 0, i1 0, i1 1, i1 1, i1 1, i1 1, i1 0, i1 1, i1 1, i1 0, i1 0, i1 0, i1 0, i1 0, i1 0, i1 1, i1 1, i1 0, i1 1, i1 1, i1 0, i1 1, i1 0, i1 1, i1 1, i1 0, i1 1, i1 1, i1 0, i1 1, i1 1, i1 1, i1 1, i1 1, i1 1, i1 1, i1 1, i1 1, i1 0, i1 0, i1 0, i1 1, i1 1, i1 1, i1 0, i1 0, i1 0, i1 1, i1 1, i1 0, i1 1, i1 1, i1 0, i1 1, i1 0, i1 1, i1 1, i1 0, i1 1, i1 1, i1 0, i1 1, i1 0, i1 0, i1 0, i1 0, i1 1, i1 1, i1 1, i1 1, i1 0, i1 1, i1 1, i1 0, i1 0, i1 0, i1 0, i1 0, i1 0, i1 1, i1 1, i1 0, i1 1, i1 1, i1 0, i1 1, i1 0, i1 1, i1 1, i1 0, i1 0, i1 0, i1 0, i1 1, i1 1, i1 1, i1 1, i1 1, i1 1, i1 1, i1 1, i1 1, i1 0, i1 0, i1 0, i1 1, i1 1, i1 1, i1 0, i1 0, i1 0, i1 1, i1 0, i1 1, i1 1, i1 1, i1 0, i1 1, i1 0, i1 1, i1 1, i1 0, i1 0, i1 1, i1 1, i1 1>
	}			}

	define <128 x i1> @buildvec_mask_optsize_v128i1() optsize {			define <128 x i1> @buildvec_mask_optsize_v128i1() optsize {
	; RV32-LMULMAX1-LABEL: buildvec_mask_optsize_v128i1:			; RV32-LMULMAX1-LABEL: buildvec_mask_optsize_v128i1:
	▲ Show 20 Lines • Show All 83 Lines • ▼ Show 20 Lines
	; RV32-LMULMAX4-NEXT: vlm.v v0, (a0)			; RV32-LMULMAX4-NEXT: vlm.v v0, (a0)
	; RV32-LMULMAX4-NEXT: lui a0, %hi(.LCPI21_1)			; RV32-LMULMAX4-NEXT: lui a0, %hi(.LCPI21_1)
	; RV32-LMULMAX4-NEXT: addi a0, a0, %lo(.LCPI21_1)			; RV32-LMULMAX4-NEXT: addi a0, a0, %lo(.LCPI21_1)
	; RV32-LMULMAX4-NEXT: vlm.v v8, (a0)			; RV32-LMULMAX4-NEXT: vlm.v v8, (a0)
	; RV32-LMULMAX4-NEXT: ret			; RV32-LMULMAX4-NEXT: ret
	;			;
	; RV64-LMULMAX4-LABEL: buildvec_mask_optsize_v128i1:			; RV64-LMULMAX4-LABEL: buildvec_mask_optsize_v128i1:
	; RV64-LMULMAX4: # %bb.0:			; RV64-LMULMAX4: # %bb.0:
	; RV64-LMULMAX4-NEXT: lui a0, 841543			; RV64-LMULMAX4-NEXT: lui a0, %hi(.LCPI21_0)
	; RV64-LMULMAX4-NEXT: addiw a0, a0, 511			; RV64-LMULMAX4-NEXT: ld a0, %lo(.LCPI21_0)(a0)
	; RV64-LMULMAX4-NEXT: slli a0, a0, 14
	; RV64-LMULMAX4-NEXT: addi a0, a0, 859
	; RV64-LMULMAX4-NEXT: slli a0, a0, 17
	; RV64-LMULMAX4-NEXT: addi a0, a0, 1776
	; RV64-LMULMAX4-NEXT: vsetivli zero, 1, e64, m1, ta, mu			; RV64-LMULMAX4-NEXT: vsetivli zero, 1, e64, m1, ta, mu
	; RV64-LMULMAX4-NEXT: vmv.s.x v8, a0			; RV64-LMULMAX4-NEXT: lui a1, %hi(.LCPI21_1)
	; RV64-LMULMAX4-NEXT: lui a0, 1048429			; RV64-LMULMAX4-NEXT: ld a1, %lo(.LCPI21_1)(a1)
	; RV64-LMULMAX4-NEXT: addiw a0, a0, 1735
	; RV64-LMULMAX4-NEXT: slli a0, a0, 13
	; RV64-LMULMAX4-NEXT: addi a0, a0, 1023
	; RV64-LMULMAX4-NEXT: slli a0, a0, 13
	; RV64-LMULMAX4-NEXT: addi a0, a0, -1189
	; RV64-LMULMAX4-NEXT: slli a0, a0, 17
	; RV64-LMULMAX4-NEXT: addi a0, a0, 1776
	; RV64-LMULMAX4-NEXT: vmv.s.x v0, a0			; RV64-LMULMAX4-NEXT: vmv.s.x v0, a0
				; RV64-LMULMAX4-NEXT: vmv.s.x v8, a1
	; RV64-LMULMAX4-NEXT: ret			; RV64-LMULMAX4-NEXT: ret
	;			;
	; RV32-LMULMAX8-LABEL: buildvec_mask_optsize_v128i1:			; RV32-LMULMAX8-LABEL: buildvec_mask_optsize_v128i1:
	; RV32-LMULMAX8: # %bb.0:			; RV32-LMULMAX8: # %bb.0:
	; RV32-LMULMAX8-NEXT: lui a0, %hi(.LCPI21_0)			; RV32-LMULMAX8-NEXT: lui a0, %hi(.LCPI21_0)
	; RV32-LMULMAX8-NEXT: addi a0, a0, %lo(.LCPI21_0)			; RV32-LMULMAX8-NEXT: addi a0, a0, %lo(.LCPI21_0)
	; RV32-LMULMAX8-NEXT: li a1, 128			; RV32-LMULMAX8-NEXT: li a1, 128
	; RV32-LMULMAX8-NEXT: vsetvli zero, a1, e8, m8, ta, mu			; RV32-LMULMAX8-NEXT: vsetvli zero, a1, e8, m8, ta, mu
	Show All 13 Lines

llvm/test/CodeGen/RISCV/rvv/interleave-crash.ll

	Show All 22 Lines
	; RV64-1024-NEXT: vid.v v28			; RV64-1024-NEXT: vid.v v28
	; RV64-1024-NEXT: vsrl.vi v12, v28, 1			; RV64-1024-NEXT: vsrl.vi v12, v28, 1
	; RV64-1024-NEXT: vrgather.vv v0, v20, v12			; RV64-1024-NEXT: vrgather.vv v0, v20, v12
	; RV64-1024-NEXT: vsetvli zero, a3, e16, m4, tu, mu			; RV64-1024-NEXT: vsetvli zero, a3, e16, m4, tu, mu
	; RV64-1024-NEXT: vslideup.vi v8, v16, 0			; RV64-1024-NEXT: vslideup.vi v8, v16, 0
	; RV64-1024-NEXT: vsetvli zero, a1, e16, m4, tu, mu			; RV64-1024-NEXT: vsetvli zero, a1, e16, m4, tu, mu
	; RV64-1024-NEXT: vslideup.vx v8, v24, a3			; RV64-1024-NEXT: vslideup.vx v8, v24, a3
	; RV64-1024-NEXT: vsetvli zero, zero, e16, m4, ta, mu			; RV64-1024-NEXT: vsetvli zero, zero, e16, m4, ta, mu
				; RV64-1024-NEXT: lui a2, %hi(.LCPI0_0)
				; RV64-1024-NEXT: ld a2, %lo(.LCPI0_0)(a2)
	; RV64-1024-NEXT: vrgather.vv v16, v0, v28			; RV64-1024-NEXT: vrgather.vv v16, v0, v28
	; RV64-1024-NEXT: lui a2, 1026731
	; RV64-1024-NEXT: addiw a2, a2, -1365
	; RV64-1024-NEXT: slli a2, a2, 12
	; RV64-1024-NEXT: addi a2, a2, -1365
	; RV64-1024-NEXT: slli a2, a2, 12
	; RV64-1024-NEXT: addi a2, a2, -1365
	; RV64-1024-NEXT: slli a2, a2, 12
	; RV64-1024-NEXT: addi a2, a2, -1366
	; RV64-1024-NEXT: vsetivli zero, 4, e64, m1, ta, mu			; RV64-1024-NEXT: vsetivli zero, 4, e64, m1, ta, mu
	; RV64-1024-NEXT: vmv.s.x v20, a2			; RV64-1024-NEXT: vmv.s.x v20, a2
	; RV64-1024-NEXT: vsetivli zero, 2, e64, m1, tu, mu			; RV64-1024-NEXT: vsetivli zero, 2, e64, m1, tu, mu
	; RV64-1024-NEXT: vmv1r.v v0, v20			; RV64-1024-NEXT: vmv1r.v v0, v20
	; RV64-1024-NEXT: vslideup.vi v0, v20, 1			; RV64-1024-NEXT: vslideup.vi v0, v20, 1
	; RV64-1024-NEXT: vsetivli zero, 3, e64, m1, tu, mu			; RV64-1024-NEXT: vsetivli zero, 3, e64, m1, tu, mu
	; RV64-1024-NEXT: vslideup.vi v0, v20, 2			; RV64-1024-NEXT: vslideup.vi v0, v20, 2
	; RV64-1024-NEXT: vsetivli zero, 4, e64, m1, tu, mu			; RV64-1024-NEXT: vsetivli zero, 4, e64, m1, tu, mu
	Show All 11 Lines
	; RV64-2048-NEXT: vle16.v v12, (a2)			; RV64-2048-NEXT: vle16.v v12, (a2)
	; RV64-2048-NEXT: li a1, 256			; RV64-2048-NEXT: li a1, 256
	; RV64-2048-NEXT: vsetvli zero, a1, e16, m2, ta, mu			; RV64-2048-NEXT: vsetvli zero, a1, e16, m2, ta, mu
	; RV64-2048-NEXT: vmv.v.i v8, 0			; RV64-2048-NEXT: vmv.v.i v8, 0
	; RV64-2048-NEXT: vsetvli zero, a3, e16, m2, tu, mu			; RV64-2048-NEXT: vsetvli zero, a3, e16, m2, tu, mu
	; RV64-2048-NEXT: vmv2r.v v14, v8			; RV64-2048-NEXT: vmv2r.v v14, v8
	; RV64-2048-NEXT: vslideup.vi v14, v10, 0			; RV64-2048-NEXT: vslideup.vi v14, v10, 0
	; RV64-2048-NEXT: vsetvli zero, a3, e16, m1, ta, mu			; RV64-2048-NEXT: vsetvli zero, a3, e16, m1, ta, mu
	; RV64-2048-NEXT: vmv.v.i v16, 0			; RV64-2048-NEXT: vmv.v.i v10, 0
	; RV64-2048-NEXT: vsetvli zero, a1, e16, m2, tu, mu			; RV64-2048-NEXT: vsetvli zero, a1, e16, m2, tu, mu
	; RV64-2048-NEXT: vslideup.vx v14, v16, a3			; RV64-2048-NEXT: vslideup.vx v14, v10, a3
	; RV64-2048-NEXT: vsetvli zero, zero, e16, m2, ta, mu			; RV64-2048-NEXT: vsetvli zero, zero, e16, m2, ta, mu
	; RV64-2048-NEXT: vid.v v18			; RV64-2048-NEXT: vid.v v16
	; RV64-2048-NEXT: vsrl.vi v10, v18, 1			; RV64-2048-NEXT: vsrl.vi v18, v16, 1
	; RV64-2048-NEXT: vrgather.vv v20, v14, v10			; RV64-2048-NEXT: vrgather.vv v20, v14, v18
	; RV64-2048-NEXT: vsetvli zero, a3, e16, m2, tu, mu			; RV64-2048-NEXT: vsetvli zero, a3, e16, m2, tu, mu
	; RV64-2048-NEXT: vslideup.vi v8, v12, 0			; RV64-2048-NEXT: vslideup.vi v8, v12, 0
	; RV64-2048-NEXT: vsetvli zero, a1, e16, m2, tu, mu			; RV64-2048-NEXT: vsetvli zero, a1, e16, m2, tu, mu
	; RV64-2048-NEXT: vslideup.vx v8, v16, a3			; RV64-2048-NEXT: vslideup.vx v8, v10, a3
	; RV64-2048-NEXT: vsetvli zero, zero, e16, m2, ta, mu			; RV64-2048-NEXT: vsetvli zero, zero, e16, m2, ta, mu
	; RV64-2048-NEXT: vrgather.vv v12, v20, v18			; RV64-2048-NEXT: lui a2, %hi(.LCPI0_0)
	; RV64-2048-NEXT: lui a2, 1026731			; RV64-2048-NEXT: ld a2, %lo(.LCPI0_0)(a2)
	; RV64-2048-NEXT: addiw a2, a2, -1365			; RV64-2048-NEXT: vrgather.vv v10, v20, v16
	; RV64-2048-NEXT: slli a2, a2, 12
	; RV64-2048-NEXT: addi a2, a2, -1365
	; RV64-2048-NEXT: slli a2, a2, 12
	; RV64-2048-NEXT: addi a2, a2, -1365
	; RV64-2048-NEXT: slli a2, a2, 12
	; RV64-2048-NEXT: addi a2, a2, -1366
	; RV64-2048-NEXT: vsetivli zero, 4, e64, m1, ta, mu			; RV64-2048-NEXT: vsetivli zero, 4, e64, m1, ta, mu
	; RV64-2048-NEXT: vmv.s.x v14, a2			; RV64-2048-NEXT: vmv.s.x v12, a2
	; RV64-2048-NEXT: vsetivli zero, 2, e64, m1, tu, mu			; RV64-2048-NEXT: vsetivli zero, 2, e64, m1, tu, mu
	; RV64-2048-NEXT: vmv1r.v v0, v14			; RV64-2048-NEXT: vmv1r.v v0, v12
	; RV64-2048-NEXT: vslideup.vi v0, v14, 1			; RV64-2048-NEXT: vslideup.vi v0, v12, 1
	; RV64-2048-NEXT: vsetivli zero, 3, e64, m1, tu, mu			; RV64-2048-NEXT: vsetivli zero, 3, e64, m1, tu, mu
	; RV64-2048-NEXT: vslideup.vi v0, v14, 2			; RV64-2048-NEXT: vslideup.vi v0, v12, 2
	; RV64-2048-NEXT: vsetivli zero, 4, e64, m1, tu, mu			; RV64-2048-NEXT: vsetivli zero, 4, e64, m1, tu, mu
	; RV64-2048-NEXT: vslideup.vi v0, v14, 3			; RV64-2048-NEXT: vslideup.vi v0, v12, 3
	; RV64-2048-NEXT: vsetvli zero, a1, e16, m2, ta, mu			; RV64-2048-NEXT: vsetvli zero, a1, e16, m2, ta, mu
	; RV64-2048-NEXT: vrgather.vv v12, v8, v10, v0.t			; RV64-2048-NEXT: vrgather.vv v10, v8, v18, v0.t
	; RV64-2048-NEXT: vse16.v v12, (a0)			; RV64-2048-NEXT: vse16.v v10, (a0)
	; RV64-2048-NEXT: ret			; RV64-2048-NEXT: ret
	entry:			entry:
	%ve = load <128 x i16>, <128 x i16>* %0, align 256			%ve = load <128 x i16>, <128 x i16>* %0, align 256
	%vo = load <128 x i16>, <128 x i16>* %1, align 256			%vo = load <128 x i16>, <128 x i16>* %1, align 256
	%2 = shufflevector <128 x i16> %ve, <128 x i16> poison, <256 x i32> <i32 0, i32 undef, i32 1, i32 undef, i32 2, i32 undef, i32 3, i32 undef, i32 4, i32 undef, i32 5, i32 undef, i32 6, i32 undef, i32 7, i32 undef, i32 8, i32 undef, i32 9, i32 undef, i32 10, i32 undef, i32 11, i32 undef, i32 12, i32 undef, i32 13, i32 undef, i32 14, i32 undef, i32 15, i32 undef, i32 16, i32 undef, i32 17, i32 undef, i32 18, i32 undef, i32 19, i32 undef, i32 20, i32 undef, i32 21, i32 undef, i32 22, i32 undef, i32 23, i32 undef, i32 24, i32 undef, i32 25, i32 undef, i32 26, i32 undef, i32 27, i32 undef, i32 28, i32 undef, i32 29, i32 undef, i32 30, i32 undef, i32 31, i32 undef, i32 32, i32 undef, i32 33, i32 undef, i32 34, i32 undef, i32 35, i32 undef, i32 36, i32 undef, i32 37, i32 undef, i32 38, i32 undef, i32 39, i32 undef, i32 40, i32 undef, i32 41, i32 undef, i32 42, i32 undef, i32 43, i32 undef, i32 44, i32 undef, i32 45, i32 undef, i32 46, i32 undef, i32 47, i32 undef, i32 48, i32 undef, i32 49, i32 undef, i32 50, i32 undef, i32 51, i32 undef, i32 52, i32 undef, i32 53, i32 undef, i32 54, i32 undef, i32 55, i32 undef, i32 56, i32 undef, i32 57, i32 undef, i32 58, i32 undef, i32 59, i32 undef, i32 60, i32 undef, i32 61, i32 undef, i32 62, i32 undef, i32 63, i32 undef, i32 64, i32 undef, i32 65, i32 undef, i32 66, i32 undef, i32 67, i32 undef, i32 68, i32 undef, i32 69, i32 undef, i32 70, i32 undef, i32 71, i32 undef, i32 72, i32 undef, i32 73, i32 undef, i32 74, i32 undef, i32 75, i32 undef, i32 76, i32 undef, i32 77, i32 undef, i32 78, i32 undef, i32 79, i32 undef, i32 80, i32 undef, i32 81, i32 undef, i32 82, i32 undef, i32 83, i32 undef, i32 84, i32 undef, i32 85, i32 undef, i32 86, i32 undef, i32 87, i32 undef, i32 88, i32 undef, i32 89, i32 undef, i32 90, i32 undef, i32 91, i32 undef, i32 92, i32 undef, i32 93, i32 undef, i32 94, i32 undef, i32 95, i32 undef, i32 96, i32 undef, i32 97, i32 undef, i32 98, i32 undef, i32 99, i32 undef, i32 100, i32 undef, i32 101, i32 undef, i32 102, i32 undef, i32 103, i32 undef, i32 104, i32 undef, i32 105, i32 undef, i32 106, i32 undef, i32 107, i32 undef, i32 108, i32 undef, i32 109, i32 undef, i32 110, i32 undef, i32 111, i32 undef, i32 112, i32 undef, i32 113, i32 undef, i32 114, i32 undef, i32 115, i32 undef, i32 116, i32 undef, i32 117, i32 undef, i32 118, i32 undef, i32 119, i32 undef, i32 120, i32 undef, i32 121, i32 undef, i32 122, i32 undef, i32 123, i32 undef, i32 124, i32 undef, i32 125, i32 undef, i32 126, i32 undef, i32 127, i32 undef>			%2 = shufflevector <128 x i16> %ve, <128 x i16> poison, <256 x i32> <i32 0, i32 undef, i32 1, i32 undef, i32 2, i32 undef, i32 3, i32 undef, i32 4, i32 undef, i32 5, i32 undef, i32 6, i32 undef, i32 7, i32 undef, i32 8, i32 undef, i32 9, i32 undef, i32 10, i32 undef, i32 11, i32 undef, i32 12, i32 undef, i32 13, i32 undef, i32 14, i32 undef, i32 15, i32 undef, i32 16, i32 undef, i32 17, i32 undef, i32 18, i32 undef, i32 19, i32 undef, i32 20, i32 undef, i32 21, i32 undef, i32 22, i32 undef, i32 23, i32 undef, i32 24, i32 undef, i32 25, i32 undef, i32 26, i32 undef, i32 27, i32 undef, i32 28, i32 undef, i32 29, i32 undef, i32 30, i32 undef, i32 31, i32 undef, i32 32, i32 undef, i32 33, i32 undef, i32 34, i32 undef, i32 35, i32 undef, i32 36, i32 undef, i32 37, i32 undef, i32 38, i32 undef, i32 39, i32 undef, i32 40, i32 undef, i32 41, i32 undef, i32 42, i32 undef, i32 43, i32 undef, i32 44, i32 undef, i32 45, i32 undef, i32 46, i32 undef, i32 47, i32 undef, i32 48, i32 undef, i32 49, i32 undef, i32 50, i32 undef, i32 51, i32 undef, i32 52, i32 undef, i32 53, i32 undef, i32 54, i32 undef, i32 55, i32 undef, i32 56, i32 undef, i32 57, i32 undef, i32 58, i32 undef, i32 59, i32 undef, i32 60, i32 undef, i32 61, i32 undef, i32 62, i32 undef, i32 63, i32 undef, i32 64, i32 undef, i32 65, i32 undef, i32 66, i32 undef, i32 67, i32 undef, i32 68, i32 undef, i32 69, i32 undef, i32 70, i32 undef, i32 71, i32 undef, i32 72, i32 undef, i32 73, i32 undef, i32 74, i32 undef, i32 75, i32 undef, i32 76, i32 undef, i32 77, i32 undef, i32 78, i32 undef, i32 79, i32 undef, i32 80, i32 undef, i32 81, i32 undef, i32 82, i32 undef, i32 83, i32 undef, i32 84, i32 undef, i32 85, i32 undef, i32 86, i32 undef, i32 87, i32 undef, i32 88, i32 undef, i32 89, i32 undef, i32 90, i32 undef, i32 91, i32 undef, i32 92, i32 undef, i32 93, i32 undef, i32 94, i32 undef, i32 95, i32 undef, i32 96, i32 undef, i32 97, i32 undef, i32 98, i32 undef, i32 99, i32 undef, i32 100, i32 undef, i32 101, i32 undef, i32 102, i32 undef, i32 103, i32 undef, i32 104, i32 undef, i32 105, i32 undef, i32 106, i32 undef, i32 107, i32 undef, i32 108, i32 undef, i32 109, i32 undef, i32 110, i32 undef, i32 111, i32 undef, i32 112, i32 undef, i32 113, i32 undef, i32 114, i32 undef, i32 115, i32 undef, i32 116, i32 undef, i32 117, i32 undef, i32 118, i32 undef, i32 119, i32 undef, i32 120, i32 undef, i32 121, i32 undef, i32 122, i32 undef, i32 123, i32 undef, i32 124, i32 undef, i32 125, i32 undef, i32 126, i32 undef, i32 127, i32 undef>
	%3 = shufflevector <128 x i16> %vo, <128 x i16> poison, <256 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7, i32 8, i32 9, i32 10, i32 11, i32 12, i32 13, i32 14, i32 15, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31, i32 32, i32 33, i32 34, i32 35, i32 36, i32 37, i32 38, i32 39, i32 40, i32 41, i32 42, i32 43, i32 44, i32 45, i32 46, i32 47, i32 48, i32 49, i32 50, i32 51, i32 52, i32 53, i32 54, i32 55, i32 56, i32 57, i32 58, i32 59, i32 60, i32 61, i32 62, i32 63, i32 64, i32 65, i32 66, i32 67, i32 68, i32 69, i32 70, i32 71, i32 72, i32 73, i32 74, i32 75, i32 76, i32 77, i32 78, i32 79, i32 80, i32 81, i32 82, i32 83, i32 84, i32 85, i32 86, i32 87, i32 88, i32 89, i32 90, i32 91, i32 92, i32 93, i32 94, i32 95, i32 96, i32 97, i32 98, i32 99, i32 100, i32 101, i32 102, i32 103, i32 104, i32 105, i32 106, i32 107, i32 108, i32 109, i32 110, i32 111, i32 112, i32 113, i32 114, i32 115, i32 116, i32 117, i32 118, i32 119, i32 120, i32 121, i32 122, i32 123, i32 124, i32 125, i32 126, i32 127, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef>			%3 = shufflevector <128 x i16> %vo, <128 x i16> poison, <256 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7, i32 8, i32 9, i32 10, i32 11, i32 12, i32 13, i32 14, i32 15, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31, i32 32, i32 33, i32 34, i32 35, i32 36, i32 37, i32 38, i32 39, i32 40, i32 41, i32 42, i32 43, i32 44, i32 45, i32 46, i32 47, i32 48, i32 49, i32 50, i32 51, i32 52, i32 53, i32 54, i32 55, i32 56, i32 57, i32 58, i32 59, i32 60, i32 61, i32 62, i32 63, i32 64, i32 65, i32 66, i32 67, i32 68, i32 69, i32 70, i32 71, i32 72, i32 73, i32 74, i32 75, i32 76, i32 77, i32 78, i32 79, i32 80, i32 81, i32 82, i32 83, i32 84, i32 85, i32 86, i32 87, i32 88, i32 89, i32 90, i32 91, i32 92, i32 93, i32 94, i32 95, i32 96, i32 97, i32 98, i32 99, i32 100, i32 101, i32 102, i32 103, i32 104, i32 105, i32 106, i32 107, i32 108, i32 109, i32 110, i32 111, i32 112, i32 113, i32 114, i32 115, i32 116, i32 117, i32 118, i32 119, i32 120, i32 121, i32 122, i32 123, i32 124, i32 125, i32 126, i32 127, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef>
	%4 = shufflevector <256 x i16> %2, <256 x i16> %3, <256 x i32> <i32 0, i32 256, i32 2, i32 257, i32 4, i32 258, i32 6, i32 259, i32 8, i32 260, i32 10, i32 261, i32 12, i32 262, i32 14, i32 263, i32 16, i32 264, i32 18, i32 265, i32 20, i32 266, i32 22, i32 267, i32 24, i32 268, i32 26, i32 269, i32 28, i32 270, i32 30, i32 271, i32 32, i32 272, i32 34, i32 273, i32 36, i32 274, i32 38, i32 275, i32 40, i32 276, i32 42, i32 277, i32 44, i32 278, i32 46, i32 279, i32 48, i32 280, i32 50, i32 281, i32 52, i32 282, i32 54, i32 283, i32 56, i32 284, i32 58, i32 285, i32 60, i32 286, i32 62, i32 287, i32 64, i32 288, i32 66, i32 289, i32 68, i32 290, i32 70, i32 291, i32 72, i32 292, i32 74, i32 293, i32 76, i32 294, i32 78, i32 295, i32 80, i32 296, i32 82, i32 297, i32 84, i32 298, i32 86, i32 299, i32 88, i32 300, i32 90, i32 301, i32 92, i32 302, i32 94, i32 303, i32 96, i32 304, i32 98, i32 305, i32 100, i32 306, i32 102, i32 307, i32 104, i32 308, i32 106, i32 309, i32 108, i32 310, i32 110, i32 311, i32 112, i32 312, i32 114, i32 313, i32 116, i32 314, i32 118, i32 315, i32 120, i32 316, i32 122, i32 317, i32 124, i32 318, i32 126, i32 319, i32 128, i32 320, i32 130, i32 321, i32 132, i32 322, i32 134, i32 323, i32 136, i32 324, i32 138, i32 325, i32 140, i32 326, i32 142, i32 327, i32 144, i32 328, i32 146, i32 329, i32 148, i32 330, i32 150, i32 331, i32 152, i32 332, i32 154, i32 333, i32 156, i32 334, i32 158, i32 335, i32 160, i32 336, i32 162, i32 337, i32 164, i32 338, i32 166, i32 339, i32 168, i32 340, i32 170, i32 341, i32 172, i32 342, i32 174, i32 343, i32 176, i32 344, i32 178, i32 345, i32 180, i32 346, i32 182, i32 347, i32 184, i32 348, i32 186, i32 349, i32 188, i32 350, i32 190, i32 351, i32 192, i32 352, i32 194, i32 353, i32 196, i32 354, i32 198, i32 355, i32 200, i32 356, i32 202, i32 357, i32 204, i32 358, i32 206, i32 359, i32 208, i32 360, i32 210, i32 361, i32 212, i32 362, i32 214, i32 363, i32 216, i32 364, i32 218, i32 365, i32 220, i32 366, i32 222, i32 367, i32 224, i32 368, i32 226, i32 369, i32 228, i32 370, i32 230, i32 371, i32 232, i32 372, i32 234, i32 373, i32 236, i32 374, i32 238, i32 375, i32 240, i32 376, i32 242, i32 377, i32 244, i32 378, i32 246, i32 379, i32 248, i32 380, i32 250, i32 381, i32 252, i32 382, i32 254, i32 383>			%4 = shufflevector <256 x i16> %2, <256 x i16> %3, <256 x i32> <i32 0, i32 256, i32 2, i32 257, i32 4, i32 258, i32 6, i32 259, i32 8, i32 260, i32 10, i32 261, i32 12, i32 262, i32 14, i32 263, i32 16, i32 264, i32 18, i32 265, i32 20, i32 266, i32 22, i32 267, i32 24, i32 268, i32 26, i32 269, i32 28, i32 270, i32 30, i32 271, i32 32, i32 272, i32 34, i32 273, i32 36, i32 274, i32 38, i32 275, i32 40, i32 276, i32 42, i32 277, i32 44, i32 278, i32 46, i32 279, i32 48, i32 280, i32 50, i32 281, i32 52, i32 282, i32 54, i32 283, i32 56, i32 284, i32 58, i32 285, i32 60, i32 286, i32 62, i32 287, i32 64, i32 288, i32 66, i32 289, i32 68, i32 290, i32 70, i32 291, i32 72, i32 292, i32 74, i32 293, i32 76, i32 294, i32 78, i32 295, i32 80, i32 296, i32 82, i32 297, i32 84, i32 298, i32 86, i32 299, i32 88, i32 300, i32 90, i32 301, i32 92, i32 302, i32 94, i32 303, i32 96, i32 304, i32 98, i32 305, i32 100, i32 306, i32 102, i32 307, i32 104, i32 308, i32 106, i32 309, i32 108, i32 310, i32 110, i32 311, i32 112, i32 312, i32 114, i32 313, i32 116, i32 314, i32 118, i32 315, i32 120, i32 316, i32 122, i32 317, i32 124, i32 318, i32 126, i32 319, i32 128, i32 320, i32 130, i32 321, i32 132, i32 322, i32 134, i32 323, i32 136, i32 324, i32 138, i32 325, i32 140, i32 326, i32 142, i32 327, i32 144, i32 328, i32 146, i32 329, i32 148, i32 330, i32 150, i32 331, i32 152, i32 332, i32 154, i32 333, i32 156, i32 334, i32 158, i32 335, i32 160, i32 336, i32 162, i32 337, i32 164, i32 338, i32 166, i32 339, i32 168, i32 340, i32 170, i32 341, i32 172, i32 342, i32 174, i32 343, i32 176, i32 344, i32 178, i32 345, i32 180, i32 346, i32 182, i32 347, i32 184, i32 348, i32 186, i32 349, i32 188, i32 350, i32 190, i32 351, i32 192, i32 352, i32 194, i32 353, i32 196, i32 354, i32 198, i32 355, i32 200, i32 356, i32 202, i32 357, i32 204, i32 358, i32 206, i32 359, i32 208, i32 360, i32 210, i32 361, i32 212, i32 362, i32 214, i32 363, i32 216, i32 364, i32 218, i32 365, i32 220, i32 366, i32 222, i32 367, i32 224, i32 368, i32 226, i32 369, i32 228, i32 370, i32 230, i32 371, i32 232, i32 372, i32 234, i32 373, i32 236, i32 374, i32 238, i32 375, i32 240, i32 376, i32 242, i32 377, i32 244, i32 378, i32 246, i32 379, i32 248, i32 380, i32 250, i32 381, i32 252, i32 382, i32 254, i32 383>
	store <256 x i16> %4, <256 x i16>* %agg.result, align 512			store <256 x i16> %4, <256 x i16>* %agg.result, align 512
	ret void			ret void
	}			}

	define void @interleave512(<512 x i16>* %agg.result, <256 x i16>* %0, <256 x i16>* %1) local_unnamed_addr {			define void @interleave512(<512 x i16>* %agg.result, <256 x i16>* %0, <256 x i16>* %1) local_unnamed_addr {
	; RV64-1024-LABEL: interleave512:			; RV64-1024-LABEL: interleave512:
	; RV64-1024: # %bb.0: # %entry			; RV64-1024: # %bb.0: # %entry
	; RV64-1024-NEXT: addi sp, sp, -16			; RV64-1024-NEXT: addi sp, sp, -16
	; RV64-1024-NEXT: .cfi_def_cfa_offset 16			; RV64-1024-NEXT: .cfi_def_cfa_offset 16
	; RV64-1024-NEXT: csrr a3, vlenb			; RV64-1024-NEXT: csrr a3, vlenb
	; RV64-1024-NEXT: li a4, 40			; RV64-1024-NEXT: li a4, 40
	; RV64-1024-NEXT: mul a3, a3, a4			; RV64-1024-NEXT: mul a3, a3, a4
	; RV64-1024-NEXT: sub sp, sp, a3			; RV64-1024-NEXT: sub sp, sp, a3
	; RV64-1024-NEXT: li a3, 256			; RV64-1024-NEXT: li a3, 256
	; RV64-1024-NEXT: vsetvli zero, a3, e16, m4, ta, mu			; RV64-1024-NEXT: vsetvli zero, a3, e16, m4, ta, mu
	; RV64-1024-NEXT: vle16.v v16, (a1)			; RV64-1024-NEXT: vle16.v v24, (a1)
	; RV64-1024-NEXT: vle16.v v8, (a2)			; RV64-1024-NEXT: vle16.v v8, (a2)
	; RV64-1024-NEXT: csrr a1, vlenb			; RV64-1024-NEXT: csrr a1, vlenb
	; RV64-1024-NEXT: slli a1, a1, 4			; RV64-1024-NEXT: li a2, 24
				; RV64-1024-NEXT: mul a1, a1, a2
	; RV64-1024-NEXT: add a1, sp, a1			; RV64-1024-NEXT: add a1, sp, a1
	; RV64-1024-NEXT: addi a1, a1, 16			; RV64-1024-NEXT: addi a1, a1, 16
	; RV64-1024-NEXT: vs8r.v v8, (a1) # Unknown-size Folded Spill			; RV64-1024-NEXT: vs8r.v v8, (a1) # Unknown-size Folded Spill
	; RV64-1024-NEXT: li a1, 512			; RV64-1024-NEXT: li a1, 512
	; RV64-1024-NEXT: vsetvli zero, a1, e16, m8, ta, mu			; RV64-1024-NEXT: vsetvli zero, a1, e16, m8, ta, mu
	; RV64-1024-NEXT: vmv.v.i v8, 0			; RV64-1024-NEXT: vmv.v.i v8, 0
	; RV64-1024-NEXT: csrr a2, vlenb			; RV64-1024-NEXT: csrr a2, vlenb
	; RV64-1024-NEXT: slli a2, a2, 5			; RV64-1024-NEXT: slli a2, a2, 4
	; RV64-1024-NEXT: add a2, sp, a2			; RV64-1024-NEXT: add a2, sp, a2
	; RV64-1024-NEXT: addi a2, a2, 16			; RV64-1024-NEXT: addi a2, a2, 16
	; RV64-1024-NEXT: vs8r.v v8, (a2) # Unknown-size Folded Spill			; RV64-1024-NEXT: vs8r.v v8, (a2) # Unknown-size Folded Spill
	; RV64-1024-NEXT: vsetvli zero, a3, e16, m8, tu, mu			; RV64-1024-NEXT: vsetvli zero, a3, e16, m8, tu, mu
	; RV64-1024-NEXT: vslideup.vi v8, v16, 0			; RV64-1024-NEXT: vslideup.vi v8, v24, 0
	; RV64-1024-NEXT: vsetvli zero, a3, e16, m4, ta, mu			; RV64-1024-NEXT: vsetvli zero, a3, e16, m4, ta, mu
	; RV64-1024-NEXT: vmv.v.i v16, 0			; RV64-1024-NEXT: vmv.v.i v16, 0
	; RV64-1024-NEXT: addi a2, sp, 16			; RV64-1024-NEXT: addi a2, sp, 16
	; RV64-1024-NEXT: vs8r.v v16, (a2) # Unknown-size Folded Spill			; RV64-1024-NEXT: vs8r.v v16, (a2) # Unknown-size Folded Spill
	; RV64-1024-NEXT: vsetvli zero, a1, e16, m8, tu, mu			; RV64-1024-NEXT: vsetvli zero, a1, e16, m8, tu, mu
	; RV64-1024-NEXT: vslideup.vx v8, v16, a3			; RV64-1024-NEXT: vslideup.vx v8, v16, a3
	; RV64-1024-NEXT: vsetvli zero, zero, e16, m8, ta, mu			; RV64-1024-NEXT: vsetvli zero, zero, e16, m8, ta, mu
	; RV64-1024-NEXT: vid.v v24			; RV64-1024-NEXT: vid.v v24
	; RV64-1024-NEXT: vsrl.vi v16, v24, 1			; RV64-1024-NEXT: vsrl.vi v16, v24, 1
	; RV64-1024-NEXT: csrr a2, vlenb			; RV64-1024-NEXT: csrr a2, vlenb
	; RV64-1024-NEXT: li a4, 24			; RV64-1024-NEXT: slli a2, a2, 5
	; RV64-1024-NEXT: mul a2, a2, a4
	; RV64-1024-NEXT: add a2, sp, a2			; RV64-1024-NEXT: add a2, sp, a2
	; RV64-1024-NEXT: addi a2, a2, 16			; RV64-1024-NEXT: addi a2, a2, 16
	; RV64-1024-NEXT: vs8r.v v16, (a2) # Unknown-size Folded Spill			; RV64-1024-NEXT: vs8r.v v16, (a2) # Unknown-size Folded Spill
	; RV64-1024-NEXT: vrgather.vv v0, v8, v16			; RV64-1024-NEXT: vrgather.vv v0, v8, v16
	; RV64-1024-NEXT: csrr a2, vlenb			; RV64-1024-NEXT: csrr a2, vlenb
	; RV64-1024-NEXT: slli a2, a2, 3			; RV64-1024-NEXT: slli a2, a2, 3
	; RV64-1024-NEXT: add a2, sp, a2			; RV64-1024-NEXT: add a2, sp, a2
	; RV64-1024-NEXT: addi a2, a2, 16			; RV64-1024-NEXT: addi a2, a2, 16
	; RV64-1024-NEXT: vs8r.v v0, (a2) # Unknown-size Folded Spill			; RV64-1024-NEXT: vs8r.v v0, (a2) # Unknown-size Folded Spill
	; RV64-1024-NEXT: vsetvli zero, a3, e16, m8, tu, mu			; RV64-1024-NEXT: vsetvli zero, a3, e16, m8, tu, mu
	; RV64-1024-NEXT: csrr a2, vlenb			; RV64-1024-NEXT: csrr a2, vlenb
	; RV64-1024-NEXT: slli a2, a2, 5
	; RV64-1024-NEXT: add a2, sp, a2
	; RV64-1024-NEXT: addi a2, a2, 16
	; RV64-1024-NEXT: vl8re8.v v8, (a2) # Unknown-size Folded Reload
	; RV64-1024-NEXT: csrr a2, vlenb
	; RV64-1024-NEXT: slli a2, a2, 4			; RV64-1024-NEXT: slli a2, a2, 4
	; RV64-1024-NEXT: add a2, sp, a2			; RV64-1024-NEXT: add a2, sp, a2
	; RV64-1024-NEXT: addi a2, a2, 16			; RV64-1024-NEXT: addi a2, a2, 16
	; RV64-1024-NEXT: vl8re8.v v16, (a2) # Unknown-size Folded Reload			; RV64-1024-NEXT: vl8re8.v v16, (a2) # Unknown-size Folded Reload
	; RV64-1024-NEXT: vslideup.vi v8, v16, 0
	; RV64-1024-NEXT: vsetvli zero, a1, e16, m8, tu, mu
	; RV64-1024-NEXT: addi a2, sp, 16
	; RV64-1024-NEXT: vl8re8.v v16, (a2) # Unknown-size Folded Reload
	; RV64-1024-NEXT: vslideup.vx v8, v16, a3
	; RV64-1024-NEXT: csrr a2, vlenb			; RV64-1024-NEXT: csrr a2, vlenb
	; RV64-1024-NEXT: slli a2, a2, 5			; RV64-1024-NEXT: li a4, 24
				; RV64-1024-NEXT: mul a2, a2, a4
	; RV64-1024-NEXT: add a2, sp, a2			; RV64-1024-NEXT: add a2, sp, a2
	; RV64-1024-NEXT: addi a2, a2, 16			; RV64-1024-NEXT: addi a2, a2, 16
	; RV64-1024-NEXT: vs8r.v v8, (a2) # Unknown-size Folded Spill			; RV64-1024-NEXT: vl8re8.v v8, (a2) # Unknown-size Folded Reload
				; RV64-1024-NEXT: vslideup.vi v16, v8, 0
				; RV64-1024-NEXT: vsetvli zero, a1, e16, m8, tu, mu
				; RV64-1024-NEXT: addi a2, sp, 16
				; RV64-1024-NEXT: vl8re8.v v8, (a2) # Unknown-size Folded Reload
				; RV64-1024-NEXT: vslideup.vx v16, v8, a3
	; RV64-1024-NEXT: vsetvli zero, zero, e16, m8, ta, mu			; RV64-1024-NEXT: vsetvli zero, zero, e16, m8, ta, mu
	; RV64-1024-NEXT: csrr a2, vlenb			; RV64-1024-NEXT: lui a2, %hi(.LCPI1_0)
	; RV64-1024-NEXT: slli a2, a2, 3			; RV64-1024-NEXT: ld a2, %lo(.LCPI1_0)(a2)
	; RV64-1024-NEXT: add a2, sp, a2			; RV64-1024-NEXT: csrr a3, vlenb
	; RV64-1024-NEXT: addi a2, a2, 16			; RV64-1024-NEXT: slli a3, a3, 3
	; RV64-1024-NEXT: vl8re8.v v16, (a2) # Unknown-size Folded Reload			; RV64-1024-NEXT: add a3, sp, a3
	; RV64-1024-NEXT: vrgather.vv v8, v16, v24			; RV64-1024-NEXT: addi a3, a3, 16
	; RV64-1024-NEXT: lui a2, 1026731			; RV64-1024-NEXT: vl8re8.v v0, (a3) # Unknown-size Folded Reload
	; RV64-1024-NEXT: addiw a2, a2, -1365			; RV64-1024-NEXT: vrgather.vv v8, v0, v24
	; RV64-1024-NEXT: slli a2, a2, 12
	; RV64-1024-NEXT: addi a2, a2, -1365
	; RV64-1024-NEXT: slli a2, a2, 12
	; RV64-1024-NEXT: addi a2, a2, -1365
	; RV64-1024-NEXT: slli a2, a2, 12
	; RV64-1024-NEXT: addi a2, a2, -1366
	; RV64-1024-NEXT: vsetivli zero, 8, e64, m1, ta, mu			; RV64-1024-NEXT: vsetivli zero, 8, e64, m1, ta, mu
	; RV64-1024-NEXT: vmv.s.x v16, a2			; RV64-1024-NEXT: vmv.s.x v24, a2
	; RV64-1024-NEXT: vsetivli zero, 2, e64, m1, tu, mu			; RV64-1024-NEXT: vsetivli zero, 2, e64, m1, tu, mu
	; RV64-1024-NEXT: vmv1r.v v0, v16			; RV64-1024-NEXT: vmv1r.v v0, v24
	; RV64-1024-NEXT: vslideup.vi v0, v16, 1			; RV64-1024-NEXT: vslideup.vi v0, v24, 1
	; RV64-1024-NEXT: vsetivli zero, 3, e64, m1, tu, mu			; RV64-1024-NEXT: vsetivli zero, 3, e64, m1, tu, mu
	; RV64-1024-NEXT: vslideup.vi v0, v16, 2			; RV64-1024-NEXT: vslideup.vi v0, v24, 2
	; RV64-1024-NEXT: vsetivli zero, 4, e64, m1, tu, mu			; RV64-1024-NEXT: vsetivli zero, 4, e64, m1, tu, mu
	; RV64-1024-NEXT: vslideup.vi v0, v16, 3			; RV64-1024-NEXT: vslideup.vi v0, v24, 3
	; RV64-1024-NEXT: vsetivli zero, 5, e64, m1, tu, mu			; RV64-1024-NEXT: vsetivli zero, 5, e64, m1, tu, mu
	; RV64-1024-NEXT: vslideup.vi v0, v16, 4			; RV64-1024-NEXT: vslideup.vi v0, v24, 4
	; RV64-1024-NEXT: vsetivli zero, 6, e64, m1, tu, mu			; RV64-1024-NEXT: vsetivli zero, 6, e64, m1, tu, mu
	; RV64-1024-NEXT: vslideup.vi v0, v16, 5			; RV64-1024-NEXT: vslideup.vi v0, v24, 5
	; RV64-1024-NEXT: vsetivli zero, 7, e64, m1, tu, mu			; RV64-1024-NEXT: vsetivli zero, 7, e64, m1, tu, mu
	; RV64-1024-NEXT: vslideup.vi v0, v16, 6			; RV64-1024-NEXT: vslideup.vi v0, v24, 6
	; RV64-1024-NEXT: vsetivli zero, 8, e64, m1, tu, mu			; RV64-1024-NEXT: vsetivli zero, 8, e64, m1, tu, mu
	; RV64-1024-NEXT: vslideup.vi v0, v16, 7			; RV64-1024-NEXT: vslideup.vi v0, v24, 7
	; RV64-1024-NEXT: vsetvli zero, a1, e16, m8, ta, mu			; RV64-1024-NEXT: vsetvli zero, a1, e16, m8, ta, mu
	; RV64-1024-NEXT: csrr a1, vlenb			; RV64-1024-NEXT: csrr a1, vlenb
	; RV64-1024-NEXT: li a2, 24
	; RV64-1024-NEXT: mul a1, a1, a2
	; RV64-1024-NEXT: add a1, sp, a1
	; RV64-1024-NEXT: addi a1, a1, 16
	; RV64-1024-NEXT: vl8re8.v v16, (a1) # Unknown-size Folded Reload
	; RV64-1024-NEXT: csrr a1, vlenb
	; RV64-1024-NEXT: slli a1, a1, 5			; RV64-1024-NEXT: slli a1, a1, 5
	; RV64-1024-NEXT: add a1, sp, a1			; RV64-1024-NEXT: add a1, sp, a1
	; RV64-1024-NEXT: addi a1, a1, 16			; RV64-1024-NEXT: addi a1, a1, 16
	; RV64-1024-NEXT: vl8re8.v v24, (a1) # Unknown-size Folded Reload			; RV64-1024-NEXT: vl8re8.v v24, (a1) # Unknown-size Folded Reload
	; RV64-1024-NEXT: vrgather.vv v8, v24, v16, v0.t			; RV64-1024-NEXT: vrgather.vv v8, v16, v24, v0.t
	; RV64-1024-NEXT: vse16.v v8, (a0)			; RV64-1024-NEXT: vse16.v v8, (a0)
	; RV64-1024-NEXT: csrr a0, vlenb			; RV64-1024-NEXT: csrr a0, vlenb
	; RV64-1024-NEXT: li a1, 40			; RV64-1024-NEXT: li a1, 40
	; RV64-1024-NEXT: mul a0, a0, a1			; RV64-1024-NEXT: mul a0, a0, a1
	; RV64-1024-NEXT: add sp, sp, a0			; RV64-1024-NEXT: add sp, sp, a0
	; RV64-1024-NEXT: addi sp, sp, 16			; RV64-1024-NEXT: addi sp, sp, 16
	; RV64-1024-NEXT: ret			; RV64-1024-NEXT: ret
	;			;
	Show All 17 Lines
	; RV64-2048-NEXT: vid.v v28			; RV64-2048-NEXT: vid.v v28
	; RV64-2048-NEXT: vsrl.vi v12, v28, 1			; RV64-2048-NEXT: vsrl.vi v12, v28, 1
	; RV64-2048-NEXT: vrgather.vv v0, v20, v12			; RV64-2048-NEXT: vrgather.vv v0, v20, v12
	; RV64-2048-NEXT: vsetvli zero, a3, e16, m4, tu, mu			; RV64-2048-NEXT: vsetvli zero, a3, e16, m4, tu, mu
	; RV64-2048-NEXT: vslideup.vi v8, v16, 0			; RV64-2048-NEXT: vslideup.vi v8, v16, 0
	; RV64-2048-NEXT: vsetvli zero, a1, e16, m4, tu, mu			; RV64-2048-NEXT: vsetvli zero, a1, e16, m4, tu, mu
	; RV64-2048-NEXT: vslideup.vx v8, v24, a3			; RV64-2048-NEXT: vslideup.vx v8, v24, a3
	; RV64-2048-NEXT: vsetvli zero, zero, e16, m4, ta, mu			; RV64-2048-NEXT: vsetvli zero, zero, e16, m4, ta, mu
				; RV64-2048-NEXT: lui a2, %hi(.LCPI1_0)
				; RV64-2048-NEXT: ld a2, %lo(.LCPI1_0)(a2)
	; RV64-2048-NEXT: vrgather.vv v16, v0, v28			; RV64-2048-NEXT: vrgather.vv v16, v0, v28
	; RV64-2048-NEXT: lui a2, 1026731
	; RV64-2048-NEXT: addiw a2, a2, -1365
	; RV64-2048-NEXT: slli a2, a2, 12
	; RV64-2048-NEXT: addi a2, a2, -1365
	; RV64-2048-NEXT: slli a2, a2, 12
	; RV64-2048-NEXT: addi a2, a2, -1365
	; RV64-2048-NEXT: slli a2, a2, 12
	; RV64-2048-NEXT: addi a2, a2, -1366
	; RV64-2048-NEXT: vsetivli zero, 8, e64, m1, ta, mu			; RV64-2048-NEXT: vsetivli zero, 8, e64, m1, ta, mu
	; RV64-2048-NEXT: vmv.s.x v20, a2			; RV64-2048-NEXT: vmv.s.x v20, a2
	; RV64-2048-NEXT: vsetivli zero, 2, e64, m1, tu, mu			; RV64-2048-NEXT: vsetivli zero, 2, e64, m1, tu, mu
	; RV64-2048-NEXT: vmv1r.v v0, v20			; RV64-2048-NEXT: vmv1r.v v0, v20
	; RV64-2048-NEXT: vslideup.vi v0, v20, 1			; RV64-2048-NEXT: vslideup.vi v0, v20, 1
	; RV64-2048-NEXT: vsetivli zero, 3, e64, m1, tu, mu			; RV64-2048-NEXT: vsetivli zero, 3, e64, m1, tu, mu
	; RV64-2048-NEXT: vslideup.vi v0, v20, 2			; RV64-2048-NEXT: vslideup.vi v0, v20, 2
	; RV64-2048-NEXT: vsetivli zero, 4, e64, m1, tu, mu			; RV64-2048-NEXT: vsetivli zero, 4, e64, m1, tu, mu
	Show All 22 Lines

llvm/test/CodeGen/RISCV/rvv/vdiv-sdnode.ll

	Show First 20 Lines • Show All 912 Lines • ▼ Show 20 Lines
	; RV32-NEXT: vsrl.vx v9, v8, a0			; RV32-NEXT: vsrl.vx v9, v8, a0
	; RV32-NEXT: vsra.vi v8, v8, 1			; RV32-NEXT: vsra.vi v8, v8, 1
	; RV32-NEXT: vadd.vv v8, v8, v9			; RV32-NEXT: vadd.vv v8, v8, v9
	; RV32-NEXT: addi sp, sp, 16			; RV32-NEXT: addi sp, sp, 16
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: vdiv_vi_nxv1i64_0:			; RV64-LABEL: vdiv_vi_nxv1i64_0:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: lui a0, 1029851			; RV64-NEXT: lui a0, %hi(.LCPI58_0)
	; RV64-NEXT: addiw a0, a0, 1755			; RV64-NEXT: ld a0, %lo(.LCPI58_0)(a0)
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1755
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1755
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1755
	; RV64-NEXT: vsetvli a1, zero, e64, m1, ta, mu			; RV64-NEXT: vsetvli a1, zero, e64, m1, ta, mu
	; RV64-NEXT: vmulh.vx v8, v8, a0			; RV64-NEXT: vmulh.vx v8, v8, a0
	; RV64-NEXT: li a0, 63			; RV64-NEXT: li a0, 63
	; RV64-NEXT: vsrl.vx v9, v8, a0			; RV64-NEXT: vsrl.vx v9, v8, a0
	; RV64-NEXT: vsra.vi v8, v8, 1			; RV64-NEXT: vsra.vi v8, v8, 1
	; RV64-NEXT: vadd.vv v8, v8, v9			; RV64-NEXT: vadd.vv v8, v8, v9
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%head = insertelement <vscale x 1 x i64> undef, i64 -7, i32 0			%head = insertelement <vscale x 1 x i64> undef, i64 -7, i32 0
	▲ Show 20 Lines • Show All 56 Lines • ▼ Show 20 Lines
	; RV32-NEXT: vsrl.vx v10, v8, a0			; RV32-NEXT: vsrl.vx v10, v8, a0
	; RV32-NEXT: vsra.vi v8, v8, 1			; RV32-NEXT: vsra.vi v8, v8, 1
	; RV32-NEXT: vadd.vv v8, v8, v10			; RV32-NEXT: vadd.vv v8, v8, v10
	; RV32-NEXT: addi sp, sp, 16			; RV32-NEXT: addi sp, sp, 16
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: vdiv_vi_nxv2i64_0:			; RV64-LABEL: vdiv_vi_nxv2i64_0:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: lui a0, 1029851			; RV64-NEXT: lui a0, %hi(.LCPI61_0)
	; RV64-NEXT: addiw a0, a0, 1755			; RV64-NEXT: ld a0, %lo(.LCPI61_0)(a0)
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1755
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1755
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1755
	; RV64-NEXT: vsetvli a1, zero, e64, m2, ta, mu			; RV64-NEXT: vsetvli a1, zero, e64, m2, ta, mu
	; RV64-NEXT: vmulh.vx v8, v8, a0			; RV64-NEXT: vmulh.vx v8, v8, a0
	; RV64-NEXT: li a0, 63			; RV64-NEXT: li a0, 63
	; RV64-NEXT: vsrl.vx v10, v8, a0			; RV64-NEXT: vsrl.vx v10, v8, a0
	; RV64-NEXT: vsra.vi v8, v8, 1			; RV64-NEXT: vsra.vi v8, v8, 1
	; RV64-NEXT: vadd.vv v8, v8, v10			; RV64-NEXT: vadd.vv v8, v8, v10
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%head = insertelement <vscale x 2 x i64> undef, i64 -7, i32 0			%head = insertelement <vscale x 2 x i64> undef, i64 -7, i32 0
	▲ Show 20 Lines • Show All 56 Lines • ▼ Show 20 Lines
	; RV32-NEXT: vsrl.vx v12, v8, a0			; RV32-NEXT: vsrl.vx v12, v8, a0
	; RV32-NEXT: vsra.vi v8, v8, 1			; RV32-NEXT: vsra.vi v8, v8, 1
	; RV32-NEXT: vadd.vv v8, v8, v12			; RV32-NEXT: vadd.vv v8, v8, v12
	; RV32-NEXT: addi sp, sp, 16			; RV32-NEXT: addi sp, sp, 16
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: vdiv_vi_nxv4i64_0:			; RV64-LABEL: vdiv_vi_nxv4i64_0:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: lui a0, 1029851			; RV64-NEXT: lui a0, %hi(.LCPI64_0)
	; RV64-NEXT: addiw a0, a0, 1755			; RV64-NEXT: ld a0, %lo(.LCPI64_0)(a0)
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1755
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1755
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1755
	; RV64-NEXT: vsetvli a1, zero, e64, m4, ta, mu			; RV64-NEXT: vsetvli a1, zero, e64, m4, ta, mu
	; RV64-NEXT: vmulh.vx v8, v8, a0			; RV64-NEXT: vmulh.vx v8, v8, a0
	; RV64-NEXT: li a0, 63			; RV64-NEXT: li a0, 63
	; RV64-NEXT: vsrl.vx v12, v8, a0			; RV64-NEXT: vsrl.vx v12, v8, a0
	; RV64-NEXT: vsra.vi v8, v8, 1			; RV64-NEXT: vsra.vi v8, v8, 1
	; RV64-NEXT: vadd.vv v8, v8, v12			; RV64-NEXT: vadd.vv v8, v8, v12
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%head = insertelement <vscale x 4 x i64> undef, i64 -7, i32 0			%head = insertelement <vscale x 4 x i64> undef, i64 -7, i32 0
	▲ Show 20 Lines • Show All 56 Lines • ▼ Show 20 Lines
	; RV32-NEXT: vsrl.vx v16, v8, a0			; RV32-NEXT: vsrl.vx v16, v8, a0
	; RV32-NEXT: vsra.vi v8, v8, 1			; RV32-NEXT: vsra.vi v8, v8, 1
	; RV32-NEXT: vadd.vv v8, v8, v16			; RV32-NEXT: vadd.vv v8, v8, v16
	; RV32-NEXT: addi sp, sp, 16			; RV32-NEXT: addi sp, sp, 16
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: vdiv_vi_nxv8i64_0:			; RV64-LABEL: vdiv_vi_nxv8i64_0:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: lui a0, 1029851			; RV64-NEXT: lui a0, %hi(.LCPI67_0)
	; RV64-NEXT: addiw a0, a0, 1755			; RV64-NEXT: ld a0, %lo(.LCPI67_0)(a0)
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1755
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1755
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1755
	; RV64-NEXT: vsetvli a1, zero, e64, m8, ta, mu			; RV64-NEXT: vsetvli a1, zero, e64, m8, ta, mu
	; RV64-NEXT: vmulh.vx v8, v8, a0			; RV64-NEXT: vmulh.vx v8, v8, a0
	; RV64-NEXT: li a0, 63			; RV64-NEXT: li a0, 63
	; RV64-NEXT: vsrl.vx v16, v8, a0			; RV64-NEXT: vsrl.vx v16, v8, a0
	; RV64-NEXT: vsra.vi v8, v8, 1			; RV64-NEXT: vsra.vi v8, v8, 1
	; RV64-NEXT: vadd.vv v8, v8, v16			; RV64-NEXT: vadd.vv v8, v8, v16
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%head = insertelement <vscale x 8 x i64> undef, i64 -7, i32 0			%head = insertelement <vscale x 8 x i64> undef, i64 -7, i32 0
	%splat = shufflevector <vscale x 8 x i64> %head, <vscale x 8 x i64> undef, <vscale x 8 x i32> zeroinitializer			%splat = shufflevector <vscale x 8 x i64> %head, <vscale x 8 x i64> undef, <vscale x 8 x i32> zeroinitializer
	%vc = sdiv <vscale x 8 x i64> %va, %splat			%vc = sdiv <vscale x 8 x i64> %va, %splat
	ret <vscale x 8 x i64> %vc			ret <vscale x 8 x i64> %vc
	}			}

llvm/test/CodeGen/RISCV/rvv/vrem-sdnode.ll

	Show First 20 Lines • Show All 948 Lines • ▼ Show 20 Lines
	; RV32-NEXT: vadd.vv v9, v9, v10			; RV32-NEXT: vadd.vv v9, v9, v10
	; RV32-NEXT: li a0, -7			; RV32-NEXT: li a0, -7
	; RV32-NEXT: vnmsac.vx v8, a0, v9			; RV32-NEXT: vnmsac.vx v8, a0, v9
	; RV32-NEXT: addi sp, sp, 16			; RV32-NEXT: addi sp, sp, 16
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: vrem_vi_nxv1i64_0:			; RV64-LABEL: vrem_vi_nxv1i64_0:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: lui a0, 1029851			; RV64-NEXT: lui a0, %hi(.LCPI56_0)
	; RV64-NEXT: addiw a0, a0, 1755			; RV64-NEXT: ld a0, %lo(.LCPI56_0)(a0)
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1755
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1755
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1755
	; RV64-NEXT: vsetvli a1, zero, e64, m1, ta, mu			; RV64-NEXT: vsetvli a1, zero, e64, m1, ta, mu
	; RV64-NEXT: vmulh.vx v9, v8, a0			; RV64-NEXT: vmulh.vx v9, v8, a0
	; RV64-NEXT: li a0, 63			; RV64-NEXT: li a0, 63
	; RV64-NEXT: vsrl.vx v10, v9, a0			; RV64-NEXT: vsrl.vx v10, v9, a0
	; RV64-NEXT: vsra.vi v9, v9, 1			; RV64-NEXT: vsra.vi v9, v9, 1
	; RV64-NEXT: vadd.vv v9, v9, v10			; RV64-NEXT: vadd.vv v9, v9, v10
	; RV64-NEXT: li a0, -7			; RV64-NEXT: li a0, -7
	; RV64-NEXT: vnmsac.vx v8, a0, v9			; RV64-NEXT: vnmsac.vx v8, a0, v9
	▲ Show 20 Lines • Show All 60 Lines • ▼ Show 20 Lines
	; RV32-NEXT: vadd.vv v10, v10, v12			; RV32-NEXT: vadd.vv v10, v10, v12
	; RV32-NEXT: li a0, -7			; RV32-NEXT: li a0, -7
	; RV32-NEXT: vnmsac.vx v8, a0, v10			; RV32-NEXT: vnmsac.vx v8, a0, v10
	; RV32-NEXT: addi sp, sp, 16			; RV32-NEXT: addi sp, sp, 16
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: vrem_vi_nxv2i64_0:			; RV64-LABEL: vrem_vi_nxv2i64_0:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: lui a0, 1029851			; RV64-NEXT: lui a0, %hi(.LCPI59_0)
	; RV64-NEXT: addiw a0, a0, 1755			; RV64-NEXT: ld a0, %lo(.LCPI59_0)(a0)
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1755
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1755
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1755
	; RV64-NEXT: vsetvli a1, zero, e64, m2, ta, mu			; RV64-NEXT: vsetvli a1, zero, e64, m2, ta, mu
	; RV64-NEXT: vmulh.vx v10, v8, a0			; RV64-NEXT: vmulh.vx v10, v8, a0
	; RV64-NEXT: li a0, 63			; RV64-NEXT: li a0, 63
	; RV64-NEXT: vsrl.vx v12, v10, a0			; RV64-NEXT: vsrl.vx v12, v10, a0
	; RV64-NEXT: vsra.vi v10, v10, 1			; RV64-NEXT: vsra.vi v10, v10, 1
	; RV64-NEXT: vadd.vv v10, v10, v12			; RV64-NEXT: vadd.vv v10, v10, v12
	; RV64-NEXT: li a0, -7			; RV64-NEXT: li a0, -7
	; RV64-NEXT: vnmsac.vx v8, a0, v10			; RV64-NEXT: vnmsac.vx v8, a0, v10
	▲ Show 20 Lines • Show All 60 Lines • ▼ Show 20 Lines
	; RV32-NEXT: vadd.vv v12, v12, v16			; RV32-NEXT: vadd.vv v12, v12, v16
	; RV32-NEXT: li a0, -7			; RV32-NEXT: li a0, -7
	; RV32-NEXT: vnmsac.vx v8, a0, v12			; RV32-NEXT: vnmsac.vx v8, a0, v12
	; RV32-NEXT: addi sp, sp, 16			; RV32-NEXT: addi sp, sp, 16
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: vrem_vi_nxv4i64_0:			; RV64-LABEL: vrem_vi_nxv4i64_0:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: lui a0, 1029851			; RV64-NEXT: lui a0, %hi(.LCPI62_0)
	; RV64-NEXT: addiw a0, a0, 1755			; RV64-NEXT: ld a0, %lo(.LCPI62_0)(a0)
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1755
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1755
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1755
	; RV64-NEXT: vsetvli a1, zero, e64, m4, ta, mu			; RV64-NEXT: vsetvli a1, zero, e64, m4, ta, mu
	; RV64-NEXT: vmulh.vx v12, v8, a0			; RV64-NEXT: vmulh.vx v12, v8, a0
	; RV64-NEXT: li a0, 63			; RV64-NEXT: li a0, 63
	; RV64-NEXT: vsrl.vx v16, v12, a0			; RV64-NEXT: vsrl.vx v16, v12, a0
	; RV64-NEXT: vsra.vi v12, v12, 1			; RV64-NEXT: vsra.vi v12, v12, 1
	; RV64-NEXT: vadd.vv v12, v12, v16			; RV64-NEXT: vadd.vv v12, v12, v16
	; RV64-NEXT: li a0, -7			; RV64-NEXT: li a0, -7
	; RV64-NEXT: vnmsac.vx v8, a0, v12			; RV64-NEXT: vnmsac.vx v8, a0, v12
	▲ Show 20 Lines • Show All 60 Lines • ▼ Show 20 Lines
	; RV32-NEXT: vadd.vv v16, v16, v24			; RV32-NEXT: vadd.vv v16, v16, v24
	; RV32-NEXT: li a0, -7			; RV32-NEXT: li a0, -7
	; RV32-NEXT: vnmsac.vx v8, a0, v16			; RV32-NEXT: vnmsac.vx v8, a0, v16
	; RV32-NEXT: addi sp, sp, 16			; RV32-NEXT: addi sp, sp, 16
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: vrem_vi_nxv8i64_0:			; RV64-LABEL: vrem_vi_nxv8i64_0:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: lui a0, 1029851			; RV64-NEXT: lui a0, %hi(.LCPI65_0)
	; RV64-NEXT: addiw a0, a0, 1755			; RV64-NEXT: ld a0, %lo(.LCPI65_0)(a0)
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1755
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1755
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1755
	; RV64-NEXT: vsetvli a1, zero, e64, m8, ta, mu			; RV64-NEXT: vsetvli a1, zero, e64, m8, ta, mu
	; RV64-NEXT: vmulh.vx v16, v8, a0			; RV64-NEXT: vmulh.vx v16, v8, a0
	; RV64-NEXT: li a0, 63			; RV64-NEXT: li a0, 63
	; RV64-NEXT: vsrl.vx v24, v16, a0			; RV64-NEXT: vsrl.vx v24, v16, a0
	; RV64-NEXT: vsra.vi v16, v16, 1			; RV64-NEXT: vsra.vi v16, v16, 1
	; RV64-NEXT: vadd.vv v16, v16, v24			; RV64-NEXT: vadd.vv v16, v16, v24
	; RV64-NEXT: li a0, -7			; RV64-NEXT: li a0, -7
	; RV64-NEXT: vnmsac.vx v8, a0, v16			; RV64-NEXT: vnmsac.vx v8, a0, v16
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%head = insertelement <vscale x 8 x i64> undef, i64 -7, i32 0			%head = insertelement <vscale x 8 x i64> undef, i64 -7, i32 0
	%splat = shufflevector <vscale x 8 x i64> %head, <vscale x 8 x i64> undef, <vscale x 8 x i32> zeroinitializer			%splat = shufflevector <vscale x 8 x i64> %head, <vscale x 8 x i64> undef, <vscale x 8 x i32> zeroinitializer
	%vc = srem <vscale x 8 x i64> %va, %splat			%vc = srem <vscale x 8 x i64> %va, %splat
	ret <vscale x 8 x i64> %vc			ret <vscale x 8 x i64> %vc
	}			}

llvm/test/CodeGen/RISCV/srem-lkk.ll

	Show First 20 Lines • Show All 433 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: li a1, 98			; RV64I-NEXT: li a1, 98
	; RV64I-NEXT: call __moddi3@plt			; RV64I-NEXT: call __moddi3@plt
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IM-LABEL: dont_fold_srem_i64:			; RV64IM-LABEL: dont_fold_srem_i64:
	; RV64IM: # %bb.0:			; RV64IM: # %bb.0:
	; RV64IM-NEXT: lui a1, 2675			; RV64IM-NEXT: lui a1, %hi(.LCPI8_0)
	; RV64IM-NEXT: addiw a1, a1, -251			; RV64IM-NEXT: ld a1, %lo(.LCPI8_0)(a1)
	; RV64IM-NEXT: slli a1, a1, 13
	; RV64IM-NEXT: addi a1, a1, 1839
	; RV64IM-NEXT: slli a1, a1, 13
	; RV64IM-NEXT: addi a1, a1, 167
	; RV64IM-NEXT: slli a1, a1, 13
	; RV64IM-NEXT: addi a1, a1, 1505
	; RV64IM-NEXT: mulh a1, a0, a1			; RV64IM-NEXT: mulh a1, a0, a1
	; RV64IM-NEXT: srli a2, a1, 63			; RV64IM-NEXT: srli a2, a1, 63
	; RV64IM-NEXT: srai a1, a1, 5			; RV64IM-NEXT: srai a1, a1, 5
	; RV64IM-NEXT: add a1, a1, a2			; RV64IM-NEXT: add a1, a1, a2
	; RV64IM-NEXT: li a2, 98			; RV64IM-NEXT: li a2, 98
	; RV64IM-NEXT: mul a1, a1, a2			; RV64IM-NEXT: mul a1, a1, a2
	; RV64IM-NEXT: sub a0, a0, a1			; RV64IM-NEXT: sub a0, a0, a1
	; RV64IM-NEXT: ret			; RV64IM-NEXT: ret
	%1 = srem i64 %x, 98			%1 = srem i64 %x, 98
	ret i64 %1			ret i64 %1
	}			}

llvm/test/CodeGen/RISCV/srem-seteq-illegal-types.ll

	Show First 20 Lines • Show All 156 Lines • ▼ Show 20 Lines
	; RV32M-NEXT: mul a1, a1, a2			; RV32M-NEXT: mul a1, a1, a2
	; RV32M-NEXT: sub a0, a0, a1			; RV32M-NEXT: sub a0, a0, a1
	; RV32M-NEXT: addi a0, a0, -1			; RV32M-NEXT: addi a0, a0, -1
	; RV32M-NEXT: seqz a0, a0			; RV32M-NEXT: seqz a0, a0
	; RV32M-NEXT: ret			; RV32M-NEXT: ret
	;			;
	; RV64M-LABEL: test_srem_even:			; RV64M-LABEL: test_srem_even:
	; RV64M: # %bb.0:			; RV64M: # %bb.0:
				; RV64M-NEXT: lui a1, %hi(.LCPI1_0)
				; RV64M-NEXT: ld a1, %lo(.LCPI1_0)(a1)
	; RV64M-NEXT: slli a0, a0, 60			; RV64M-NEXT: slli a0, a0, 60
	; RV64M-NEXT: srai a0, a0, 60			; RV64M-NEXT: srai a0, a0, 60
	; RV64M-NEXT: lui a1, 10923
	; RV64M-NEXT: addiw a1, a1, -1365
	; RV64M-NEXT: slli a1, a1, 12
	; RV64M-NEXT: addi a1, a1, -1365
	; RV64M-NEXT: slli a1, a1, 12
	; RV64M-NEXT: addi a1, a1, -1365
	; RV64M-NEXT: slli a1, a1, 12
	; RV64M-NEXT: addi a1, a1, -1365
	; RV64M-NEXT: mulh a1, a0, a1			; RV64M-NEXT: mulh a1, a0, a1
	; RV64M-NEXT: srli a2, a1, 63			; RV64M-NEXT: srli a2, a1, 63
	; RV64M-NEXT: add a1, a1, a2			; RV64M-NEXT: add a1, a1, a2
	; RV64M-NEXT: li a2, 6			; RV64M-NEXT: li a2, 6
	; RV64M-NEXT: mul a1, a1, a2			; RV64M-NEXT: mul a1, a1, a2
	; RV64M-NEXT: sub a0, a0, a1			; RV64M-NEXT: sub a0, a0, a1
	; RV64M-NEXT: addi a0, a0, -1			; RV64M-NEXT: addi a0, a0, -1
	; RV64M-NEXT: seqz a0, a0			; RV64M-NEXT: seqz a0, a0
	Show All 12 Lines
	; RV32MV-NEXT: mul a1, a1, a2			; RV32MV-NEXT: mul a1, a1, a2
	; RV32MV-NEXT: sub a0, a0, a1			; RV32MV-NEXT: sub a0, a0, a1
	; RV32MV-NEXT: addi a0, a0, -1			; RV32MV-NEXT: addi a0, a0, -1
	; RV32MV-NEXT: seqz a0, a0			; RV32MV-NEXT: seqz a0, a0
	; RV32MV-NEXT: ret			; RV32MV-NEXT: ret
	;			;
	; RV64MV-LABEL: test_srem_even:			; RV64MV-LABEL: test_srem_even:
	; RV64MV: # %bb.0:			; RV64MV: # %bb.0:
				; RV64MV-NEXT: lui a1, %hi(.LCPI1_0)
				; RV64MV-NEXT: ld a1, %lo(.LCPI1_0)(a1)
	; RV64MV-NEXT: slli a0, a0, 60			; RV64MV-NEXT: slli a0, a0, 60
	; RV64MV-NEXT: srai a0, a0, 60			; RV64MV-NEXT: srai a0, a0, 60
	; RV64MV-NEXT: lui a1, 10923
	; RV64MV-NEXT: addiw a1, a1, -1365
	; RV64MV-NEXT: slli a1, a1, 12
	; RV64MV-NEXT: addi a1, a1, -1365
	; RV64MV-NEXT: slli a1, a1, 12
	; RV64MV-NEXT: addi a1, a1, -1365
	; RV64MV-NEXT: slli a1, a1, 12
	; RV64MV-NEXT: addi a1, a1, -1365
	; RV64MV-NEXT: mulh a1, a0, a1			; RV64MV-NEXT: mulh a1, a0, a1
	; RV64MV-NEXT: srli a2, a1, 63			; RV64MV-NEXT: srli a2, a1, 63
	; RV64MV-NEXT: add a1, a1, a2			; RV64MV-NEXT: add a1, a1, a2
	; RV64MV-NEXT: li a2, 6			; RV64MV-NEXT: li a2, 6
	; RV64MV-NEXT: mul a1, a1, a2			; RV64MV-NEXT: mul a1, a1, a2
	; RV64MV-NEXT: sub a0, a0, a1			; RV64MV-NEXT: sub a0, a0, a1
	; RV64MV-NEXT: addi a0, a0, -1			; RV64MV-NEXT: addi a0, a0, -1
	; RV64MV-NEXT: seqz a0, a0			; RV64MV-NEXT: seqz a0, a0
	▲ Show 20 Lines • Show All 200 Lines • ▼ Show 20 Lines
	; RV64-NEXT: li a1, 7			; RV64-NEXT: li a1, 7
	; RV64-NEXT: li s5, 7			; RV64-NEXT: li s5, 7
	; RV64-NEXT: call __moddi3@plt			; RV64-NEXT: call __moddi3@plt
	; RV64-NEXT: mv s3, a0			; RV64-NEXT: mv s3, a0
	; RV64-NEXT: li a1, -5			; RV64-NEXT: li a1, -5
	; RV64-NEXT: mv a0, s1			; RV64-NEXT: mv a0, s1
	; RV64-NEXT: call __moddi3@plt			; RV64-NEXT: call __moddi3@plt
	; RV64-NEXT: mv s1, a0			; RV64-NEXT: mv s1, a0
	; RV64-NEXT: lui a0, 1026731			; RV64-NEXT: lui a0, %hi(.LCPI3_0)
	; RV64-NEXT: addiw a0, a0, -1365			; RV64-NEXT: ld a1, %lo(.LCPI3_0)(a0)
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, -1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, -1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a1, a0, -1365
	; RV64-NEXT: mv a0, s2			; RV64-NEXT: mv a0, s2
	; RV64-NEXT: call __muldi3@plt			; RV64-NEXT: call __muldi3@plt
	; RV64-NEXT: lui a1, 10923			; RV64-NEXT: lui a1, %hi(.LCPI3_1)
	; RV64-NEXT: addiw a1, a1, -1365			; RV64-NEXT: ld a1, %lo(.LCPI3_1)(a1)
	; RV64-NEXT: slli a1, a1, 12
	; RV64-NEXT: addi a1, a1, -1365
	; RV64-NEXT: slli a1, a1, 12
	; RV64-NEXT: addi a1, a1, -1365
	; RV64-NEXT: slli a1, a1, 12
	; RV64-NEXT: addi a1, a1, -1366
	; RV64-NEXT: add a0, a0, a1			; RV64-NEXT: add a0, a0, a1
	; RV64-NEXT: slli a2, a0, 63			; RV64-NEXT: slli a2, a0, 63
	; RV64-NEXT: srli a0, a0, 1			; RV64-NEXT: srli a0, a0, 1
	; RV64-NEXT: or a0, a0, a2			; RV64-NEXT: or a0, a0, a2
	; RV64-NEXT: sltu a0, a1, a0			; RV64-NEXT: sltu a0, a1, a0
	; RV64-NEXT: addi a1, s1, -2			; RV64-NEXT: addi a1, s1, -2
	; RV64-NEXT: snez a1, a1			; RV64-NEXT: snez a1, a1
	; RV64-NEXT: addi a2, s3, -1			; RV64-NEXT: addi a2, s3, -1
	▲ Show 20 Lines • Show All 107 Lines • ▼ Show 20 Lines
	; RV32M-NEXT: addi sp, sp, 32			; RV32M-NEXT: addi sp, sp, 32
	; RV32M-NEXT: ret			; RV32M-NEXT: ret
	;			;
	; RV64M-LABEL: test_srem_vec:			; RV64M-LABEL: test_srem_vec:
	; RV64M: # %bb.0:			; RV64M: # %bb.0:
	; RV64M-NEXT: lb a1, 12(a0)			; RV64M-NEXT: lb a1, 12(a0)
	; RV64M-NEXT: lwu a2, 8(a0)			; RV64M-NEXT: lwu a2, 8(a0)
	; RV64M-NEXT: slli a1, a1, 32			; RV64M-NEXT: slli a1, a1, 32
	; RV64M-NEXT: or a2, a2, a1			; RV64M-NEXT: or a1, a2, a1
	; RV64M-NEXT: li a6, -1			; RV64M-NEXT: li a6, -1
	; RV64M-NEXT: srli a3, a6, 24			; RV64M-NEXT: srli a3, a6, 24
	; RV64M-NEXT: and a2, a2, a3			; RV64M-NEXT: and a1, a1, a3
	; RV64M-NEXT: ld a3, 0(a0)			; RV64M-NEXT: ld a3, 0(a0)
	; RV64M-NEXT: slli a4, a2, 29			; RV64M-NEXT: slli a4, a1, 29
	; RV64M-NEXT: srai a4, a4, 31			; RV64M-NEXT: srai a4, a4, 31
	; RV64M-NEXT: slli a2, a2, 31			; RV64M-NEXT: slli a1, a1, 31
	; RV64M-NEXT: srli a5, a3, 33			; RV64M-NEXT: srli a5, a3, 33
	; RV64M-NEXT: or a2, a5, a2			; RV64M-NEXT: lui a2, %hi(.LCPI3_0)
	; RV64M-NEXT: slli a2, a2, 31			; RV64M-NEXT: ld a2, %lo(.LCPI3_0)(a2)
	; RV64M-NEXT: srai a2, a2, 31			; RV64M-NEXT: or a1, a5, a1
				; RV64M-NEXT: slli a1, a1, 31
				; RV64M-NEXT: srai a1, a1, 31
				; RV64M-NEXT: mulh a2, a1, a2
				; RV64M-NEXT: srli a5, a2, 63
				; RV64M-NEXT: srai a2, a2, 1
				; RV64M-NEXT: add a2, a2, a5
				; RV64M-NEXT: slli a5, a2, 3
				; RV64M-NEXT: sub a2, a2, a5
				; RV64M-NEXT: lui a5, %hi(.LCPI3_1)
				; RV64M-NEXT: ld a5, %lo(.LCPI3_1)(a5)
	; RV64M-NEXT: slli a3, a3, 31			; RV64M-NEXT: slli a3, a3, 31
	; RV64M-NEXT: srai a3, a3, 31			; RV64M-NEXT: srai a3, a3, 31
	; RV64M-NEXT: lui a5, 18725			; RV64M-NEXT: add a1, a1, a2
	; RV64M-NEXT: addiw a5, a5, -1755			; RV64M-NEXT: mulh a2, a4, a5
	; RV64M-NEXT: slli a5, a5, 12
	; RV64M-NEXT: addi a5, a5, -1755
	; RV64M-NEXT: slli a5, a5, 12
	; RV64M-NEXT: addi a5, a5, -1755
	; RV64M-NEXT: slli a5, a5, 12
	; RV64M-NEXT: addi a5, a5, -1755
	; RV64M-NEXT: mulh a5, a2, a5
	; RV64M-NEXT: srli a1, a5, 63
	; RV64M-NEXT: srai a5, a5, 1
	; RV64M-NEXT: add a1, a5, a1
	; RV64M-NEXT: slli a5, a1, 3
	; RV64M-NEXT: sub a1, a1, a5
	; RV64M-NEXT: add a1, a2, a1
	; RV64M-NEXT: lui a2, 1035469
	; RV64M-NEXT: addiw a2, a2, -819
	; RV64M-NEXT: slli a2, a2, 12
	; RV64M-NEXT: addi a2, a2, -819
	; RV64M-NEXT: slli a2, a2, 12
	; RV64M-NEXT: addi a2, a2, -819
	; RV64M-NEXT: slli a2, a2, 13
	; RV64M-NEXT: addi a2, a2, -1639
	; RV64M-NEXT: mulh a2, a4, a2
	; RV64M-NEXT: srli a5, a2, 63			; RV64M-NEXT: srli a5, a2, 63
	; RV64M-NEXT: srai a2, a2, 1			; RV64M-NEXT: srai a2, a2, 1
	; RV64M-NEXT: add a2, a2, a5			; RV64M-NEXT: add a2, a2, a5
	; RV64M-NEXT: slli a5, a2, 2			; RV64M-NEXT: slli a5, a2, 2
	; RV64M-NEXT: add a2, a5, a2			; RV64M-NEXT: add a2, a5, a2
	; RV64M-NEXT: add a2, a4, a2			; RV64M-NEXT: add a2, a4, a2
	; RV64M-NEXT: addi a2, a2, -2			; RV64M-NEXT: addi a2, a2, -2
	; RV64M-NEXT: snez a2, a2			; RV64M-NEXT: snez a2, a2
				; RV64M-NEXT: lui a4, %hi(.LCPI3_2)
				; RV64M-NEXT: ld a4, %lo(.LCPI3_2)(a4)
				; RV64M-NEXT: lui a5, %hi(.LCPI3_3)
				; RV64M-NEXT: ld a5, %lo(.LCPI3_3)(a5)
	; RV64M-NEXT: addi a1, a1, -1			; RV64M-NEXT: addi a1, a1, -1
	; RV64M-NEXT: snez a1, a1			; RV64M-NEXT: snez a1, a1
	; RV64M-NEXT: lui a4, 1026731
	; RV64M-NEXT: addiw a4, a4, -1365
	; RV64M-NEXT: slli a4, a4, 12
	; RV64M-NEXT: addi a4, a4, -1365
	; RV64M-NEXT: slli a4, a4, 12
	; RV64M-NEXT: addi a4, a4, -1365
	; RV64M-NEXT: slli a4, a4, 12
	; RV64M-NEXT: addi a4, a4, -1365
	; RV64M-NEXT: mul a3, a3, a4			; RV64M-NEXT: mul a3, a3, a4
	; RV64M-NEXT: lui a4, 10923			; RV64M-NEXT: add a3, a3, a5
	; RV64M-NEXT: addiw a4, a4, -1365			; RV64M-NEXT: slli a4, a3, 63
	; RV64M-NEXT: slli a4, a4, 12
	; RV64M-NEXT: addi a4, a4, -1365
	; RV64M-NEXT: slli a4, a4, 12
	; RV64M-NEXT: addi a4, a4, -1365
	; RV64M-NEXT: slli a4, a4, 12
	; RV64M-NEXT: addi a4, a4, -1366
	; RV64M-NEXT: add a3, a3, a4
	; RV64M-NEXT: slli a5, a3, 63
	; RV64M-NEXT: srli a3, a3, 1			; RV64M-NEXT: srli a3, a3, 1
	; RV64M-NEXT: or a3, a3, a5			; RV64M-NEXT: or a3, a3, a4
	; RV64M-NEXT: sltu a3, a4, a3			; RV64M-NEXT: sltu a3, a5, a3
	; RV64M-NEXT: neg a1, a1			; RV64M-NEXT: neg a1, a1
	; RV64M-NEXT: neg a4, a2			; RV64M-NEXT: neg a4, a2
	; RV64M-NEXT: neg a3, a3			; RV64M-NEXT: neg a3, a3
	; RV64M-NEXT: li a5, 7			; RV64M-NEXT: li a5, 7
	; RV64M-NEXT: slli a5, a5, 32			; RV64M-NEXT: slli a5, a5, 32
	; RV64M-NEXT: and a4, a4, a5			; RV64M-NEXT: and a4, a4, a5
	; RV64M-NEXT: srli a4, a4, 32			; RV64M-NEXT: srli a4, a4, 32
	; RV64M-NEXT: sb a4, 12(a0)			; RV64M-NEXT: sb a4, 12(a0)
	▲ Show 20 Lines • Show All 118 Lines • ▼ Show 20 Lines
	; RV64MV-NEXT: addi sp, sp, -96			; RV64MV-NEXT: addi sp, sp, -96
	; RV64MV-NEXT: sd ra, 88(sp) # 8-byte Folded Spill			; RV64MV-NEXT: sd ra, 88(sp) # 8-byte Folded Spill
	; RV64MV-NEXT: sd s0, 80(sp) # 8-byte Folded Spill			; RV64MV-NEXT: sd s0, 80(sp) # 8-byte Folded Spill
	; RV64MV-NEXT: addi s0, sp, 96			; RV64MV-NEXT: addi s0, sp, 96
	; RV64MV-NEXT: andi sp, sp, -32			; RV64MV-NEXT: andi sp, sp, -32
	; RV64MV-NEXT: lb a1, 12(a0)			; RV64MV-NEXT: lb a1, 12(a0)
	; RV64MV-NEXT: lwu a2, 8(a0)			; RV64MV-NEXT: lwu a2, 8(a0)
	; RV64MV-NEXT: slli a1, a1, 32			; RV64MV-NEXT: slli a1, a1, 32
	; RV64MV-NEXT: or a2, a2, a1			; RV64MV-NEXT: or a1, a2, a1
	; RV64MV-NEXT: li a6, -1			; RV64MV-NEXT: li a6, -1
	; RV64MV-NEXT: ld a3, 0(a0)			; RV64MV-NEXT: srli a3, a6, 24
	; RV64MV-NEXT: srli a4, a6, 24			; RV64MV-NEXT: ld a4, 0(a0)
	; RV64MV-NEXT: and a2, a2, a4			; RV64MV-NEXT: lui a5, %hi(.LCPI3_0)
	; RV64MV-NEXT: slli a4, a2, 31			; RV64MV-NEXT: ld a5, %lo(.LCPI3_0)(a5)
	; RV64MV-NEXT: srli a5, a3, 33			; RV64MV-NEXT: and a1, a1, a3
	; RV64MV-NEXT: or a4, a5, a4			; RV64MV-NEXT: slli a3, a4, 31
	; RV64MV-NEXT: slli a4, a4, 31
	; RV64MV-NEXT: srai a4, a4, 31
	; RV64MV-NEXT: slli a2, a2, 29
	; RV64MV-NEXT: srai a2, a2, 31
	; RV64MV-NEXT: slli a3, a3, 31
	; RV64MV-NEXT: srai a3, a3, 31			; RV64MV-NEXT: srai a3, a3, 31
	; RV64MV-NEXT: lui a5, 10923
	; RV64MV-NEXT: addiw a5, a5, -1365
	; RV64MV-NEXT: slli a5, a5, 12
	; RV64MV-NEXT: addi a5, a5, -1365
	; RV64MV-NEXT: slli a5, a5, 12
	; RV64MV-NEXT: addi a5, a5, -1365
	; RV64MV-NEXT: slli a5, a5, 12
	; RV64MV-NEXT: addi a5, a5, -1365
	; RV64MV-NEXT: mulh a5, a3, a5			; RV64MV-NEXT: mulh a5, a3, a5
	; RV64MV-NEXT: srli a1, a5, 63			; RV64MV-NEXT: srli a2, a5, 63
	; RV64MV-NEXT: add a1, a5, a1			; RV64MV-NEXT: add a2, a5, a2
	; RV64MV-NEXT: li a5, 6			; RV64MV-NEXT: li a5, 6
	; RV64MV-NEXT: mul a1, a1, a5			; RV64MV-NEXT: mul a2, a2, a5
	; RV64MV-NEXT: sub a1, a3, a1			; RV64MV-NEXT: slli a5, a1, 31
	; RV64MV-NEXT: sd a1, 32(sp)			; RV64MV-NEXT: sub a2, a3, a2
	; RV64MV-NEXT: lui a1, 1035469			; RV64MV-NEXT: sd a2, 32(sp)
	; RV64MV-NEXT: addiw a1, a1, -819			; RV64MV-NEXT: lui a2, %hi(.LCPI3_1)
	; RV64MV-NEXT: slli a1, a1, 12			; RV64MV-NEXT: ld a2, %lo(.LCPI3_1)(a2)
	; RV64MV-NEXT: addi a1, a1, -819			; RV64MV-NEXT: srli a3, a4, 33
	; RV64MV-NEXT: slli a1, a1, 12			; RV64MV-NEXT: slli a1, a1, 29
	; RV64MV-NEXT: addi a1, a1, -819			; RV64MV-NEXT: srai a1, a1, 31
	; RV64MV-NEXT: slli a1, a1, 13			; RV64MV-NEXT: mulh a2, a1, a2
	; RV64MV-NEXT: addi a1, a1, -1639			; RV64MV-NEXT: srli a4, a2, 63
				; RV64MV-NEXT: srai a2, a2, 1
				; RV64MV-NEXT: add a2, a2, a4
				; RV64MV-NEXT: slli a4, a2, 2
				; RV64MV-NEXT: add a2, a4, a2
				; RV64MV-NEXT: add a1, a1, a2
				; RV64MV-NEXT: sd a1, 48(sp)
				; RV64MV-NEXT: lui a1, %hi(.LCPI3_2)
				; RV64MV-NEXT: ld a1, %lo(.LCPI3_2)(a1)
				; RV64MV-NEXT: or a2, a3, a5
				; RV64MV-NEXT: slli a2, a2, 31
				; RV64MV-NEXT: srai a2, a2, 31
	; RV64MV-NEXT: mulh a1, a2, a1			; RV64MV-NEXT: mulh a1, a2, a1
	; RV64MV-NEXT: srli a3, a1, 63			; RV64MV-NEXT: srli a3, a1, 63
	; RV64MV-NEXT: srai a1, a1, 1			; RV64MV-NEXT: srai a1, a1, 1
	; RV64MV-NEXT: add a1, a1, a3			; RV64MV-NEXT: add a1, a1, a3
	; RV64MV-NEXT: slli a3, a1, 2			; RV64MV-NEXT: slli a3, a1, 3
	; RV64MV-NEXT: add a1, a3, a1			; RV64MV-NEXT: sub a1, a1, a3
	; RV64MV-NEXT: add a1, a2, a1			; RV64MV-NEXT: add a1, a2, a1
	; RV64MV-NEXT: sd a1, 48(sp)
	; RV64MV-NEXT: lui a1, 18725
	; RV64MV-NEXT: addiw a1, a1, -1755
	; RV64MV-NEXT: slli a1, a1, 12
	; RV64MV-NEXT: addi a1, a1, -1755
	; RV64MV-NEXT: slli a1, a1, 12
	; RV64MV-NEXT: addi a1, a1, -1755
	; RV64MV-NEXT: slli a1, a1, 12
	; RV64MV-NEXT: addi a1, a1, -1755
	; RV64MV-NEXT: mulh a1, a4, a1
	; RV64MV-NEXT: srli a2, a1, 63
	; RV64MV-NEXT: srai a1, a1, 1
	; RV64MV-NEXT: add a1, a1, a2
	; RV64MV-NEXT: slli a2, a1, 3
	; RV64MV-NEXT: sub a1, a1, a2
	; RV64MV-NEXT: add a1, a4, a1
	; RV64MV-NEXT: sd a1, 40(sp)			; RV64MV-NEXT: sd a1, 40(sp)
	; RV64MV-NEXT: vsetivli zero, 4, e64, m2, ta, mu			; RV64MV-NEXT: vsetivli zero, 4, e64, m2, ta, mu
	; RV64MV-NEXT: addi a1, sp, 32			; RV64MV-NEXT: addi a1, sp, 32
	; RV64MV-NEXT: vle64.v v8, (a1)			; RV64MV-NEXT: vle64.v v8, (a1)
	; RV64MV-NEXT: lui a1, %hi(.LCPI3_0)			; RV64MV-NEXT: lui a1, %hi(.LCPI3_3)
	; RV64MV-NEXT: addi a1, a1, %lo(.LCPI3_0)			; RV64MV-NEXT: addi a1, a1, %lo(.LCPI3_3)
	; RV64MV-NEXT: vle64.v v10, (a1)			; RV64MV-NEXT: vle64.v v10, (a1)
	; RV64MV-NEXT: srli a1, a6, 31			; RV64MV-NEXT: srli a1, a6, 31
	; RV64MV-NEXT: vand.vx v8, v8, a1			; RV64MV-NEXT: vand.vx v8, v8, a1
	; RV64MV-NEXT: vmsne.vv v0, v8, v10			; RV64MV-NEXT: vmsne.vv v0, v8, v10
	; RV64MV-NEXT: vmv.v.i v8, 0			; RV64MV-NEXT: vmv.v.i v8, 0
	; RV64MV-NEXT: vmerge.vim v8, v8, -1, v0			; RV64MV-NEXT: vmerge.vim v8, v8, -1, v0
	; RV64MV-NEXT: vsetivli zero, 1, e64, m2, ta, mu			; RV64MV-NEXT: vsetivli zero, 1, e64, m2, ta, mu
	; RV64MV-NEXT: vslidedown.vi v10, v8, 2			; RV64MV-NEXT: vslidedown.vi v10, v8, 2
	Show All 28 Lines

llvm/test/CodeGen/RISCV/srem-vector-lkk.ll

	Show First 20 Lines • Show All 144 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: ld s4, 16(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld s4, 16(sp) # 8-byte Folded Reload
	; RV64I-NEXT: ld s5, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld s5, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 64			; RV64I-NEXT: addi sp, sp, 64
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IM-LABEL: fold_srem_vec_1:			; RV64IM-LABEL: fold_srem_vec_1:
	; RV64IM: # %bb.0:			; RV64IM: # %bb.0:
	; RV64IM-NEXT: lh a6, 24(a1)			; RV64IM-NEXT: lh a6, 24(a1)
	; RV64IM-NEXT: lh a3, 16(a1)			; RV64IM-NEXT: lh a7, 16(a1)
	; RV64IM-NEXT: lh a4, 8(a1)			; RV64IM-NEXT: lh a4, 8(a1)
	; RV64IM-NEXT: lh a1, 0(a1)			; RV64IM-NEXT: lh a1, 0(a1)
	; RV64IM-NEXT: lui a5, 1045903			; RV64IM-NEXT: lui a5, %hi(.LCPI0_0)
	; RV64IM-NEXT: addiw a5, a5, -733			; RV64IM-NEXT: ld a5, %lo(.LCPI0_0)(a5)
	; RV64IM-NEXT: slli a5, a5, 15
	; RV64IM-NEXT: addi a5, a5, 1035
	; RV64IM-NEXT: slli a5, a5, 12
	; RV64IM-NEXT: addi a5, a5, -905
	; RV64IM-NEXT: slli a5, a5, 12
	; RV64IM-NEXT: addi a5, a5, -1767
	; RV64IM-NEXT: mulh a5, a1, a5			; RV64IM-NEXT: mulh a5, a1, a5
	; RV64IM-NEXT: add a5, a5, a1			; RV64IM-NEXT: add a5, a5, a1
	; RV64IM-NEXT: srli a2, a5, 63			; RV64IM-NEXT: srli a2, a5, 63
	; RV64IM-NEXT: srli a5, a5, 6			; RV64IM-NEXT: srli a5, a5, 6
	; RV64IM-NEXT: addw a2, a5, a2			; RV64IM-NEXT: addw a2, a5, a2
	; RV64IM-NEXT: li a5, 95			; RV64IM-NEXT: lui a5, %hi(.LCPI0_1)
	; RV64IM-NEXT: mulw a2, a2, a5			; RV64IM-NEXT: ld a5, %lo(.LCPI0_1)(a5)
				; RV64IM-NEXT: li a3, 95
				; RV64IM-NEXT: mulw a2, a2, a3
	; RV64IM-NEXT: subw a1, a1, a2			; RV64IM-NEXT: subw a1, a1, a2
	; RV64IM-NEXT: lui a2, 777976			; RV64IM-NEXT: mulh a2, a4, a5
	; RV64IM-NEXT: addiw a2, a2, -1057
	; RV64IM-NEXT: slli a2, a2, 15
	; RV64IM-NEXT: addi a2, a2, -1057
	; RV64IM-NEXT: slli a2, a2, 14
	; RV64IM-NEXT: addi a2, a2, -529
	; RV64IM-NEXT: srli a2, a2, 1
	; RV64IM-NEXT: mulh a2, a4, a2
	; RV64IM-NEXT: sub a2, a2, a4			; RV64IM-NEXT: sub a2, a2, a4
	; RV64IM-NEXT: srli a5, a2, 63			; RV64IM-NEXT: srli a3, a2, 63
	; RV64IM-NEXT: srli a2, a2, 6			; RV64IM-NEXT: srli a2, a2, 6
	; RV64IM-NEXT: addw a2, a2, a5			; RV64IM-NEXT: addw a2, a2, a3
				; RV64IM-NEXT: lui a3, %hi(.LCPI0_2)
				; RV64IM-NEXT: ld a3, %lo(.LCPI0_2)(a3)
	; RV64IM-NEXT: li a5, -124			; RV64IM-NEXT: li a5, -124
	; RV64IM-NEXT: mulw a2, a2, a5			; RV64IM-NEXT: mulw a2, a2, a5
	; RV64IM-NEXT: subw a2, a4, a2			; RV64IM-NEXT: subw a2, a4, a2
	; RV64IM-NEXT: lui a4, 2675			; RV64IM-NEXT: mulh a3, a7, a3
	; RV64IM-NEXT: addiw a4, a4, -251			; RV64IM-NEXT: srli a4, a3, 63
	; RV64IM-NEXT: slli a4, a4, 13			; RV64IM-NEXT: srli a3, a3, 5
	; RV64IM-NEXT: addi a4, a4, 1839			; RV64IM-NEXT: addw a3, a3, a4
	; RV64IM-NEXT: slli a4, a4, 13			; RV64IM-NEXT: lui a4, %hi(.LCPI0_3)
	; RV64IM-NEXT: addi a4, a4, 167			; RV64IM-NEXT: ld a4, %lo(.LCPI0_3)(a4)
	; RV64IM-NEXT: slli a4, a4, 13
	; RV64IM-NEXT: addi a4, a4, 1505
	; RV64IM-NEXT: mulh a4, a3, a4
	; RV64IM-NEXT: srli a5, a4, 63
	; RV64IM-NEXT: srli a4, a4, 5
	; RV64IM-NEXT: addw a4, a4, a5
	; RV64IM-NEXT: li a5, 98			; RV64IM-NEXT: li a5, 98
	; RV64IM-NEXT: mulw a4, a4, a5			; RV64IM-NEXT: mulw a3, a3, a5
	; RV64IM-NEXT: subw a3, a3, a4			; RV64IM-NEXT: subw a3, a7, a3
	; RV64IM-NEXT: lui a4, 1040212
	; RV64IM-NEXT: addiw a4, a4, 1977
	; RV64IM-NEXT: slli a4, a4, 12
	; RV64IM-NEXT: addi a4, a4, -1907
	; RV64IM-NEXT: slli a4, a4, 12
	; RV64IM-NEXT: addi a4, a4, -453
	; RV64IM-NEXT: slli a4, a4, 12
	; RV64IM-NEXT: addi a4, a4, -1213
	; RV64IM-NEXT: mulh a4, a6, a4			; RV64IM-NEXT: mulh a4, a6, a4
	; RV64IM-NEXT: srli a5, a4, 63			; RV64IM-NEXT: srli a5, a4, 63
	; RV64IM-NEXT: srli a4, a4, 7			; RV64IM-NEXT: srli a4, a4, 7
	; RV64IM-NEXT: addw a4, a4, a5			; RV64IM-NEXT: addw a4, a4, a5
	; RV64IM-NEXT: li a5, -1003			; RV64IM-NEXT: li a5, -1003
	; RV64IM-NEXT: mulw a4, a4, a5			; RV64IM-NEXT: mulw a4, a4, a5
	; RV64IM-NEXT: subw a4, a6, a4			; RV64IM-NEXT: subw a4, a6, a4
	; RV64IM-NEXT: sh a4, 6(a0)			; RV64IM-NEXT: sh a4, 6(a0)
	▲ Show 20 Lines • Show All 135 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: ld s4, 16(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld s4, 16(sp) # 8-byte Folded Reload
	; RV64I-NEXT: ld s5, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld s5, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 64			; RV64I-NEXT: addi sp, sp, 64
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IM-LABEL: fold_srem_vec_2:			; RV64IM-LABEL: fold_srem_vec_2:
	; RV64IM: # %bb.0:			; RV64IM: # %bb.0:
	; RV64IM-NEXT: lh a6, 24(a1)			; RV64IM-NEXT: lh a6, 24(a1)
	; RV64IM-NEXT: lh a7, 16(a1)			; RV64IM-NEXT: lh a3, 16(a1)
	; RV64IM-NEXT: lh a4, 8(a1)			; RV64IM-NEXT: lh a4, 8(a1)
	; RV64IM-NEXT: lh a1, 0(a1)			; RV64IM-NEXT: lh a1, 0(a1)
	; RV64IM-NEXT: lui a5, 1045903			; RV64IM-NEXT: lui a5, %hi(.LCPI1_0)
	; RV64IM-NEXT: addiw a5, a5, -733			; RV64IM-NEXT: ld a5, %lo(.LCPI1_0)(a5)
	; RV64IM-NEXT: slli a5, a5, 15
	; RV64IM-NEXT: addi a5, a5, 1035
	; RV64IM-NEXT: slli a5, a5, 12
	; RV64IM-NEXT: addi a5, a5, -905
	; RV64IM-NEXT: slli a5, a5, 12
	; RV64IM-NEXT: addi a5, a5, -1767
	; RV64IM-NEXT: mulh a2, a1, a5			; RV64IM-NEXT: mulh a2, a1, a5
	; RV64IM-NEXT: add a2, a2, a1			; RV64IM-NEXT: add a2, a2, a1
	; RV64IM-NEXT: srli a3, a2, 63			; RV64IM-NEXT: srli a7, a2, 63
	; RV64IM-NEXT: srli a2, a2, 6			; RV64IM-NEXT: srli a2, a2, 6
	; RV64IM-NEXT: addw a2, a2, a3			; RV64IM-NEXT: addw a2, a2, a7
	; RV64IM-NEXT: li a3, 95			; RV64IM-NEXT: li a7, 95
	; RV64IM-NEXT: mulw a2, a2, a3			; RV64IM-NEXT: mulw a2, a2, a7
	; RV64IM-NEXT: subw t0, a1, a2			; RV64IM-NEXT: subw t0, a1, a2
	; RV64IM-NEXT: mulh a2, a4, a5			; RV64IM-NEXT: mulh a2, a4, a5
	; RV64IM-NEXT: add a2, a2, a4			; RV64IM-NEXT: add a2, a2, a4
	; RV64IM-NEXT: srli a1, a2, 63			; RV64IM-NEXT: srli a1, a2, 63
	; RV64IM-NEXT: srli a2, a2, 6			; RV64IM-NEXT: srli a2, a2, 6
	; RV64IM-NEXT: addw a1, a2, a1			; RV64IM-NEXT: addw a1, a2, a1
	; RV64IM-NEXT: mulw a1, a1, a3			; RV64IM-NEXT: mulw a1, a1, a7
	; RV64IM-NEXT: subw a1, a4, a1			; RV64IM-NEXT: subw a1, a4, a1
	; RV64IM-NEXT: mulh a2, a7, a5			; RV64IM-NEXT: mulh a2, a3, a5
	; RV64IM-NEXT: add a2, a2, a7			; RV64IM-NEXT: add a2, a2, a3
	; RV64IM-NEXT: srli a4, a2, 63			; RV64IM-NEXT: srli a4, a2, 63
	; RV64IM-NEXT: srli a2, a2, 6			; RV64IM-NEXT: srli a2, a2, 6
	; RV64IM-NEXT: addw a2, a2, a4			; RV64IM-NEXT: addw a2, a2, a4
	; RV64IM-NEXT: mulw a2, a2, a3			; RV64IM-NEXT: mulw a2, a2, a7
	; RV64IM-NEXT: subw a2, a7, a2			; RV64IM-NEXT: subw a2, a3, a2
	; RV64IM-NEXT: mulh a4, a6, a5			; RV64IM-NEXT: mulh a3, a6, a5
	; RV64IM-NEXT: add a4, a4, a6			; RV64IM-NEXT: add a3, a3, a6
	; RV64IM-NEXT: srli a5, a4, 63			; RV64IM-NEXT: srli a4, a3, 63
	; RV64IM-NEXT: srli a4, a4, 6			; RV64IM-NEXT: srli a3, a3, 6
	; RV64IM-NEXT: addw a4, a4, a5			; RV64IM-NEXT: addw a3, a3, a4
	; RV64IM-NEXT: mulw a3, a4, a3			; RV64IM-NEXT: mulw a3, a3, a7
	; RV64IM-NEXT: subw a3, a6, a3			; RV64IM-NEXT: subw a3, a6, a3
	; RV64IM-NEXT: sh a3, 6(a0)			; RV64IM-NEXT: sh a3, 6(a0)
	; RV64IM-NEXT: sh a2, 4(a0)			; RV64IM-NEXT: sh a2, 4(a0)
	; RV64IM-NEXT: sh a1, 2(a0)			; RV64IM-NEXT: sh a1, 2(a0)
	; RV64IM-NEXT: sh t0, 0(a0)			; RV64IM-NEXT: sh t0, 0(a0)
	; RV64IM-NEXT: ret			; RV64IM-NEXT: ret
	%1 = srem <4 x i16> %x, <i16 95, i16 95, i16 95, i16 95>			%1 = srem <4 x i16> %x, <i16 95, i16 95, i16 95, i16 95>
	ret <4 x i16> %1			ret <4 x i16> %1
	▲ Show 20 Lines • Show All 191 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: ld s8, 16(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld s8, 16(sp) # 8-byte Folded Reload
	; RV64I-NEXT: ld s9, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld s9, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 96			; RV64I-NEXT: addi sp, sp, 96
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IM-LABEL: combine_srem_sdiv:			; RV64IM-LABEL: combine_srem_sdiv:
	; RV64IM: # %bb.0:			; RV64IM: # %bb.0:
	; RV64IM-NEXT: lh a6, 0(a1)			; RV64IM-NEXT: lh a6, 0(a1)
	; RV64IM-NEXT: lh a7, 8(a1)			; RV64IM-NEXT: lh a3, 8(a1)
	; RV64IM-NEXT: lh a4, 16(a1)			; RV64IM-NEXT: lh a4, 16(a1)
	; RV64IM-NEXT: lh a1, 24(a1)			; RV64IM-NEXT: lh a1, 24(a1)
	; RV64IM-NEXT: lui a5, 1045903			; RV64IM-NEXT: lui a5, %hi(.LCPI2_0)
	; RV64IM-NEXT: addiw a5, a5, -733			; RV64IM-NEXT: ld a5, %lo(.LCPI2_0)(a5)
	; RV64IM-NEXT: slli a5, a5, 15
	; RV64IM-NEXT: addi a5, a5, 1035
	; RV64IM-NEXT: slli a5, a5, 12
	; RV64IM-NEXT: addi a5, a5, -905
	; RV64IM-NEXT: slli a5, a5, 12
	; RV64IM-NEXT: addi a5, a5, -1767
	; RV64IM-NEXT: mulh a2, a1, a5			; RV64IM-NEXT: mulh a2, a1, a5
	; RV64IM-NEXT: add a2, a2, a1			; RV64IM-NEXT: add a2, a2, a1
	; RV64IM-NEXT: srli a3, a2, 63			; RV64IM-NEXT: srli a7, a2, 63
	; RV64IM-NEXT: srai a2, a2, 6			; RV64IM-NEXT: srai a2, a2, 6
	; RV64IM-NEXT: addw t3, a2, a3			; RV64IM-NEXT: addw t0, a2, a7
	; RV64IM-NEXT: li t0, 95			; RV64IM-NEXT: li a7, 95
	; RV64IM-NEXT: mulw a3, t3, t0			; RV64IM-NEXT: mulw a2, t0, a7
	; RV64IM-NEXT: subw t1, a1, a3			; RV64IM-NEXT: subw t1, a1, a2
	; RV64IM-NEXT: mulh a3, a4, a5			; RV64IM-NEXT: mulh a2, a4, a5
	; RV64IM-NEXT: add a3, a3, a4			; RV64IM-NEXT: add a2, a2, a4
	; RV64IM-NEXT: srli a1, a3, 63			; RV64IM-NEXT: srli a1, a2, 63
	; RV64IM-NEXT: srai a3, a3, 6			; RV64IM-NEXT: srai a2, a2, 6
	; RV64IM-NEXT: addw a1, a3, a1			; RV64IM-NEXT: addw a1, a2, a1
	; RV64IM-NEXT: mulw a3, a1, t0			; RV64IM-NEXT: mulw a2, a1, a7
	; RV64IM-NEXT: subw t2, a4, a3			; RV64IM-NEXT: subw t2, a4, a2
	; RV64IM-NEXT: mulh a4, a7, a5			; RV64IM-NEXT: mulh a4, a3, a5
	; RV64IM-NEXT: add a4, a4, a7			; RV64IM-NEXT: add a4, a4, a3
	; RV64IM-NEXT: srli a3, a4, 63			; RV64IM-NEXT: srli a2, a4, 63
	; RV64IM-NEXT: srai a4, a4, 6			; RV64IM-NEXT: srai a4, a4, 6
	; RV64IM-NEXT: addw a3, a4, a3			; RV64IM-NEXT: addw a2, a4, a2
	; RV64IM-NEXT: mulw a4, a3, t0			; RV64IM-NEXT: mulw a4, a2, a7
	; RV64IM-NEXT: subw a4, a7, a4			; RV64IM-NEXT: subw a3, a3, a4
	; RV64IM-NEXT: mulh a5, a6, a5			; RV64IM-NEXT: mulh a4, a6, a5
	; RV64IM-NEXT: add a5, a5, a6			; RV64IM-NEXT: add a4, a4, a6
	; RV64IM-NEXT: srli a2, a5, 63			; RV64IM-NEXT: srli a5, a4, 63
	; RV64IM-NEXT: srai a5, a5, 6			; RV64IM-NEXT: srai a4, a4, 6
	; RV64IM-NEXT: addw a2, a5, a2			; RV64IM-NEXT: addw a4, a4, a5
	; RV64IM-NEXT: mulw a5, a2, t0			; RV64IM-NEXT: mulw a5, a4, a7
	; RV64IM-NEXT: subw a5, a6, a5			; RV64IM-NEXT: subw a5, a6, a5
	; RV64IM-NEXT: addw a2, a5, a2			; RV64IM-NEXT: addw a4, a5, a4
	; RV64IM-NEXT: addw a3, a4, a3			; RV64IM-NEXT: addw a2, a3, a2
	; RV64IM-NEXT: addw a1, t2, a1			; RV64IM-NEXT: addw a1, t2, a1
	; RV64IM-NEXT: addw a4, t1, t3			; RV64IM-NEXT: addw a3, t1, t0
	; RV64IM-NEXT: sh a4, 6(a0)			; RV64IM-NEXT: sh a3, 6(a0)
	; RV64IM-NEXT: sh a1, 4(a0)			; RV64IM-NEXT: sh a1, 4(a0)
	; RV64IM-NEXT: sh a3, 2(a0)			; RV64IM-NEXT: sh a2, 2(a0)
	; RV64IM-NEXT: sh a2, 0(a0)			; RV64IM-NEXT: sh a4, 0(a0)
	; RV64IM-NEXT: ret			; RV64IM-NEXT: ret
	%1 = srem <4 x i16> %x, <i16 95, i16 95, i16 95, i16 95>			%1 = srem <4 x i16> %x, <i16 95, i16 95, i16 95, i16 95>
	%2 = sdiv <4 x i16> %x, <i16 95, i16 95, i16 95, i16 95>			%2 = sdiv <4 x i16> %x, <i16 95, i16 95, i16 95, i16 95>
	%3 = add <4 x i16> %1, %2			%3 = add <4 x i16> %1, %2
	ret <4 x i16> %3			ret <4 x i16> %3
	}			}

	; Don't fold for divisors that are a power of two.			; Don't fold for divisors that are a power of two.
	▲ Show 20 Lines • Show All 107 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: ld s1, 24(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld s1, 24(sp) # 8-byte Folded Reload
	; RV64I-NEXT: ld s2, 16(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld s2, 16(sp) # 8-byte Folded Reload
	; RV64I-NEXT: ld s3, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld s3, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 48			; RV64I-NEXT: addi sp, sp, 48
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IM-LABEL: dont_fold_srem_power_of_two:			; RV64IM-LABEL: dont_fold_srem_power_of_two:
	; RV64IM: # %bb.0:			; RV64IM: # %bb.0:
	; RV64IM-NEXT: lh a6, 16(a1)			; RV64IM-NEXT: lh a2, 16(a1)
	; RV64IM-NEXT: lh a3, 8(a1)			; RV64IM-NEXT: lh a3, 8(a1)
	; RV64IM-NEXT: lh a4, 0(a1)			; RV64IM-NEXT: lh a4, 0(a1)
	; RV64IM-NEXT: lh a1, 24(a1)			; RV64IM-NEXT: lh a1, 24(a1)
	; RV64IM-NEXT: lui a5, 1045903			; RV64IM-NEXT: lui a5, %hi(.LCPI3_0)
	; RV64IM-NEXT: addiw a5, a5, -733			; RV64IM-NEXT: ld a5, %lo(.LCPI3_0)(a5)
	; RV64IM-NEXT: slli a5, a5, 15
	; RV64IM-NEXT: addi a5, a5, 1035
	; RV64IM-NEXT: slli a5, a5, 12
	; RV64IM-NEXT: addi a5, a5, -905
	; RV64IM-NEXT: slli a5, a5, 12
	; RV64IM-NEXT: addi a5, a5, -1767
	; RV64IM-NEXT: mulh a5, a1, a5			; RV64IM-NEXT: mulh a5, a1, a5
	; RV64IM-NEXT: add a5, a5, a1			; RV64IM-NEXT: add a5, a5, a1
	; RV64IM-NEXT: srli a2, a5, 63			; RV64IM-NEXT: srli a6, a5, 63
	; RV64IM-NEXT: srli a5, a5, 6			; RV64IM-NEXT: srli a5, a5, 6
	; RV64IM-NEXT: addw a2, a5, a2			; RV64IM-NEXT: addw a6, a5, a6
	; RV64IM-NEXT: li a5, 95			; RV64IM-NEXT: li a5, 95
	; RV64IM-NEXT: mulw a2, a2, a5			; RV64IM-NEXT: mulw a5, a6, a5
	; RV64IM-NEXT: subw a1, a1, a2			; RV64IM-NEXT: subw a1, a1, a5
	; RV64IM-NEXT: srli a2, a4, 58			; RV64IM-NEXT: srli a5, a4, 58
	; RV64IM-NEXT: add a2, a4, a2			; RV64IM-NEXT: add a5, a4, a5
	; RV64IM-NEXT: andi a2, a2, -64			; RV64IM-NEXT: andi a5, a5, -64
	; RV64IM-NEXT: subw a2, a4, a2			; RV64IM-NEXT: subw a4, a4, a5
	; RV64IM-NEXT: srli a4, a3, 59			; RV64IM-NEXT: srli a5, a3, 59
	; RV64IM-NEXT: add a4, a3, a4			; RV64IM-NEXT: add a5, a3, a5
	; RV64IM-NEXT: andi a4, a4, -32			; RV64IM-NEXT: andi a5, a5, -32
	; RV64IM-NEXT: subw a3, a3, a4			; RV64IM-NEXT: subw a3, a3, a5
	; RV64IM-NEXT: srli a4, a6, 61			; RV64IM-NEXT: srli a5, a2, 61
	; RV64IM-NEXT: add a4, a6, a4			; RV64IM-NEXT: add a5, a2, a5
	; RV64IM-NEXT: andi a4, a4, -8			; RV64IM-NEXT: andi a5, a5, -8
	; RV64IM-NEXT: subw a4, a6, a4			; RV64IM-NEXT: subw a2, a2, a5
	; RV64IM-NEXT: sh a4, 4(a0)			; RV64IM-NEXT: sh a2, 4(a0)
	; RV64IM-NEXT: sh a3, 2(a0)			; RV64IM-NEXT: sh a3, 2(a0)
	; RV64IM-NEXT: sh a2, 0(a0)			; RV64IM-NEXT: sh a4, 0(a0)
	; RV64IM-NEXT: sh a1, 6(a0)			; RV64IM-NEXT: sh a1, 6(a0)
	; RV64IM-NEXT: ret			; RV64IM-NEXT: ret
	%1 = srem <4 x i16> %x, <i16 64, i16 32, i16 8, i16 95>			%1 = srem <4 x i16> %x, <i16 64, i16 32, i16 8, i16 95>
	ret <4 x i16> %1			ret <4 x i16> %1
	}			}

	; Don't fold if the divisor is one.			; Don't fold if the divisor is one.
	define <4 x i16> @dont_fold_srem_one(<4 x i16> %x) nounwind {			define <4 x i16> @dont_fold_srem_one(<4 x i16> %x) nounwind {
	▲ Show 20 Lines • Show All 107 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: ld s1, 24(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld s1, 24(sp) # 8-byte Folded Reload
	; RV64I-NEXT: ld s2, 16(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld s2, 16(sp) # 8-byte Folded Reload
	; RV64I-NEXT: ld s3, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld s3, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 48			; RV64I-NEXT: addi sp, sp, 48
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IM-LABEL: dont_fold_srem_one:			; RV64IM-LABEL: dont_fold_srem_one:
	; RV64IM: # %bb.0:			; RV64IM: # %bb.0:
	; RV64IM-NEXT: lh a2, 24(a1)			; RV64IM-NEXT: lh a6, 24(a1)
	; RV64IM-NEXT: lh a3, 8(a1)			; RV64IM-NEXT: lh a3, 8(a1)
	; RV64IM-NEXT: lh a1, 16(a1)			; RV64IM-NEXT: lh a1, 16(a1)
	; RV64IM-NEXT: lui a4, 1043590			; RV64IM-NEXT: lui a4, %hi(.LCPI4_0)
	; RV64IM-NEXT: addiw a4, a4, -1781			; RV64IM-NEXT: addi a4, a4, %lo(.LCPI4_0)
	; RV64IM-NEXT: slli a4, a4, 13			; RV64IM-NEXT: ld a4, zero(a4)
	; RV64IM-NEXT: addi a4, a4, 1069
	; RV64IM-NEXT: slli a4, a4, 12
	; RV64IM-NEXT: addi a4, a4, -1959
	; RV64IM-NEXT: slli a4, a4, 13
	; RV64IM-NEXT: addi a4, a4, 357
	; RV64IM-NEXT: mulh a4, a1, a4			; RV64IM-NEXT: mulh a4, a1, a4
	; RV64IM-NEXT: add a4, a4, a1			; RV64IM-NEXT: add a4, a4, a1
	; RV64IM-NEXT: srli a5, a4, 63			; RV64IM-NEXT: srli a5, a4, 63
	; RV64IM-NEXT: srli a4, a4, 4			; RV64IM-NEXT: srli a4, a4, 4
	; RV64IM-NEXT: addw a4, a4, a5			; RV64IM-NEXT: addw a4, a4, a5
	; RV64IM-NEXT: li a5, 23			; RV64IM-NEXT: lui a5, %hi(.LCPI4_1)
	; RV64IM-NEXT: mulw a4, a4, a5			; RV64IM-NEXT: addi a5, a5, %lo(.LCPI4_1)
	; RV64IM-NEXT: subw a1, a1, a4			; RV64IM-NEXT: ld a5, zero(a5)
	; RV64IM-NEXT: lui a4, 6413			; RV64IM-NEXT: li a2, 23
	; RV64IM-NEXT: addiw a4, a4, 1265			; RV64IM-NEXT: mulw a2, a4, a2
	; RV64IM-NEXT: slli a4, a4, 13			; RV64IM-NEXT: subw a1, a1, a2
	; RV64IM-NEXT: addi a4, a4, 1027			; RV64IM-NEXT: mulh a2, a3, a5
	; RV64IM-NEXT: slli a4, a4, 13			; RV64IM-NEXT: srli a4, a2, 63
	; RV64IM-NEXT: addi a4, a4, 1077			; RV64IM-NEXT: srli a2, a2, 8
	; RV64IM-NEXT: slli a4, a4, 12			; RV64IM-NEXT: addw a2, a2, a4
	; RV64IM-NEXT: addi a4, a4, 965			; RV64IM-NEXT: lui a4, %hi(.LCPI4_2)
	; RV64IM-NEXT: mulh a4, a3, a4			; RV64IM-NEXT: addi a4, a4, %lo(.LCPI4_2)
	; RV64IM-NEXT: srli a5, a4, 63			; RV64IM-NEXT: ld a4, zero(a4)
	; RV64IM-NEXT: srli a4, a4, 8
	; RV64IM-NEXT: addw a4, a4, a5
	; RV64IM-NEXT: li a5, 654			; RV64IM-NEXT: li a5, 654
	; RV64IM-NEXT: mulw a4, a4, a5			; RV64IM-NEXT: mulw a2, a2, a5
	; RV64IM-NEXT: subw a3, a3, a4			; RV64IM-NEXT: subw a2, a3, a2
	; RV64IM-NEXT: lui a4, 12375			; RV64IM-NEXT: mulh a3, a6, a4
	; RV64IM-NEXT: addiw a4, a4, -575			; RV64IM-NEXT: srli a4, a3, 63
	; RV64IM-NEXT: slli a4, a4, 12			; RV64IM-NEXT: srli a3, a3, 11
	; RV64IM-NEXT: addi a4, a4, 883			; RV64IM-NEXT: addw a3, a3, a4
	; RV64IM-NEXT: slli a4, a4, 13			; RV64IM-NEXT: lui a4, 1
	; RV64IM-NEXT: addi a4, a4, -431			; RV64IM-NEXT: addiw a4, a4, 1327
	; RV64IM-NEXT: slli a4, a4, 12			; RV64IM-NEXT: mulw a3, a3, a4
	; RV64IM-NEXT: addi a4, a4, 1959			; RV64IM-NEXT: subw a3, a6, a3
	; RV64IM-NEXT: mulh a4, a2, a4
	; RV64IM-NEXT: srli a5, a4, 63
	; RV64IM-NEXT: srli a4, a4, 11
	; RV64IM-NEXT: addw a4, a4, a5
	; RV64IM-NEXT: lui a5, 1
	; RV64IM-NEXT: addiw a5, a5, 1327
	; RV64IM-NEXT: mulw a4, a4, a5
	; RV64IM-NEXT: subw a2, a2, a4
	; RV64IM-NEXT: sh zero, 0(a0)			; RV64IM-NEXT: sh zero, 0(a0)
	; RV64IM-NEXT: sh a2, 6(a0)			; RV64IM-NEXT: sh a3, 6(a0)
	; RV64IM-NEXT: sh a3, 2(a0)			; RV64IM-NEXT: sh a2, 2(a0)
	; RV64IM-NEXT: sh a1, 4(a0)			; RV64IM-NEXT: sh a1, 4(a0)
	; RV64IM-NEXT: ret			; RV64IM-NEXT: ret
	%1 = srem <4 x i16> %x, <i16 1, i16 654, i16 23, i16 5423>			%1 = srem <4 x i16> %x, <i16 1, i16 654, i16 23, i16 5423>
	ret <4 x i16> %1			ret <4 x i16> %1
	}			}

	; Don't fold if the divisor is 2^15.			; Don't fold if the divisor is 2^15.
	define <4 x i16> @dont_fold_urem_i16_smax(<4 x i16> %x) nounwind {			define <4 x i16> @dont_fold_urem_i16_smax(<4 x i16> %x) nounwind {
	▲ Show 20 Lines • Show All 103 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: ld s2, 16(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld s2, 16(sp) # 8-byte Folded Reload
	; RV64I-NEXT: ld s3, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld s3, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 48			; RV64I-NEXT: addi sp, sp, 48
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IM-LABEL: dont_fold_urem_i16_smax:			; RV64IM-LABEL: dont_fold_urem_i16_smax:
	; RV64IM: # %bb.0:			; RV64IM: # %bb.0:
	; RV64IM-NEXT: lh a2, 8(a1)			; RV64IM-NEXT: lh a2, 8(a1)
	; RV64IM-NEXT: lh a3, 24(a1)			; RV64IM-NEXT: lh a6, 24(a1)
	; RV64IM-NEXT: lh a1, 16(a1)			; RV64IM-NEXT: lh a1, 16(a1)
	; RV64IM-NEXT: lui a4, 1043590			; RV64IM-NEXT: lui a4, %hi(.LCPI5_0)
	; RV64IM-NEXT: addiw a4, a4, -1781			; RV64IM-NEXT: addi a4, a4, %lo(.LCPI5_0)
	; RV64IM-NEXT: slli a4, a4, 13			; RV64IM-NEXT: ld a4, zero(a4)
	; RV64IM-NEXT: addi a4, a4, 1069
	; RV64IM-NEXT: slli a4, a4, 12
	; RV64IM-NEXT: addi a4, a4, -1959
	; RV64IM-NEXT: slli a4, a4, 13
	; RV64IM-NEXT: addi a4, a4, 357
	; RV64IM-NEXT: mulh a4, a1, a4			; RV64IM-NEXT: mulh a4, a1, a4
	; RV64IM-NEXT: add a4, a4, a1			; RV64IM-NEXT: add a4, a4, a1
	; RV64IM-NEXT: srli a5, a4, 63			; RV64IM-NEXT: srli a5, a4, 63
	; RV64IM-NEXT: srli a4, a4, 4			; RV64IM-NEXT: srli a4, a4, 4
	; RV64IM-NEXT: addw a4, a4, a5			; RV64IM-NEXT: addw a4, a4, a5
	; RV64IM-NEXT: li a5, 23			; RV64IM-NEXT: lui a5, %hi(.LCPI5_1)
	; RV64IM-NEXT: mulw a4, a4, a5			; RV64IM-NEXT: addi a5, a5, %lo(.LCPI5_1)
	; RV64IM-NEXT: subw a1, a1, a4			; RV64IM-NEXT: ld a5, zero(a5)
	; RV64IM-NEXT: lui a4, 12375			; RV64IM-NEXT: li a3, 23
	; RV64IM-NEXT: addiw a4, a4, -575			; RV64IM-NEXT: mulw a3, a4, a3
	; RV64IM-NEXT: slli a4, a4, 12			; RV64IM-NEXT: subw a1, a1, a3
	; RV64IM-NEXT: addi a4, a4, 883			; RV64IM-NEXT: mulh a3, a6, a5
	; RV64IM-NEXT: slli a4, a4, 13			; RV64IM-NEXT: srli a4, a3, 63
	; RV64IM-NEXT: addi a4, a4, -431			; RV64IM-NEXT: srli a3, a3, 11
	; RV64IM-NEXT: slli a4, a4, 12			; RV64IM-NEXT: addw a3, a3, a4
	; RV64IM-NEXT: addi a4, a4, 1959			; RV64IM-NEXT: lui a4, 1
	; RV64IM-NEXT: mulh a4, a3, a4			; RV64IM-NEXT: addiw a4, a4, 1327
	; RV64IM-NEXT: srli a5, a4, 63			; RV64IM-NEXT: mulw a3, a3, a4
	; RV64IM-NEXT: srli a4, a4, 11			; RV64IM-NEXT: subw a3, a6, a3
	; RV64IM-NEXT: addw a4, a4, a5
	; RV64IM-NEXT: lui a5, 1
	; RV64IM-NEXT: addiw a5, a5, 1327
	; RV64IM-NEXT: mulw a4, a4, a5
	; RV64IM-NEXT: subw a3, a3, a4
	; RV64IM-NEXT: srli a4, a2, 49			; RV64IM-NEXT: srli a4, a2, 49
	; RV64IM-NEXT: add a4, a2, a4			; RV64IM-NEXT: add a4, a2, a4
	; RV64IM-NEXT: lui a5, 8			; RV64IM-NEXT: lui a5, 8
	; RV64IM-NEXT: and a4, a4, a5			; RV64IM-NEXT: and a4, a4, a5
	; RV64IM-NEXT: subw a2, a2, a4			; RV64IM-NEXT: subw a2, a2, a4
	; RV64IM-NEXT: sh zero, 0(a0)			; RV64IM-NEXT: sh zero, 0(a0)
	; RV64IM-NEXT: sh a2, 2(a0)			; RV64IM-NEXT: sh a2, 2(a0)
	; RV64IM-NEXT: sh a3, 6(a0)			; RV64IM-NEXT: sh a3, 6(a0)
	▲ Show 20 Lines • Show All 180 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: ld s1, 24(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld s1, 24(sp) # 8-byte Folded Reload
	; RV64I-NEXT: ld s2, 16(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld s2, 16(sp) # 8-byte Folded Reload
	; RV64I-NEXT: ld s3, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld s3, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 48			; RV64I-NEXT: addi sp, sp, 48
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IM-LABEL: dont_fold_srem_i64:			; RV64IM-LABEL: dont_fold_srem_i64:
	; RV64IM: # %bb.0:			; RV64IM: # %bb.0:
	; RV64IM-NEXT: ld a2, 24(a1)			; RV64IM-NEXT: ld a6, 24(a1)
	; RV64IM-NEXT: ld a3, 8(a1)			; RV64IM-NEXT: ld a3, 8(a1)
	; RV64IM-NEXT: ld a1, 16(a1)			; RV64IM-NEXT: ld a1, 16(a1)
	; RV64IM-NEXT: lui a4, 1043590			; RV64IM-NEXT: lui a4, %hi(.LCPI6_0)
	; RV64IM-NEXT: addiw a4, a4, -1781			; RV64IM-NEXT: ld a4, %lo(.LCPI6_0)(a4)
	; RV64IM-NEXT: slli a4, a4, 13
	; RV64IM-NEXT: addi a4, a4, 1069
	; RV64IM-NEXT: slli a4, a4, 12
	; RV64IM-NEXT: addi a4, a4, -1959
	; RV64IM-NEXT: slli a4, a4, 13
	; RV64IM-NEXT: addi a4, a4, 357
	; RV64IM-NEXT: mulh a4, a1, a4			; RV64IM-NEXT: mulh a4, a1, a4
	; RV64IM-NEXT: add a4, a4, a1			; RV64IM-NEXT: add a4, a4, a1
	; RV64IM-NEXT: srli a5, a4, 63			; RV64IM-NEXT: srli a5, a4, 63
	; RV64IM-NEXT: srai a4, a4, 4			; RV64IM-NEXT: srai a4, a4, 4
	; RV64IM-NEXT: add a4, a4, a5			; RV64IM-NEXT: add a4, a4, a5
	; RV64IM-NEXT: li a5, 23			; RV64IM-NEXT: lui a5, %hi(.LCPI6_1)
	; RV64IM-NEXT: mul a4, a4, a5			; RV64IM-NEXT: ld a5, %lo(.LCPI6_1)(a5)
	; RV64IM-NEXT: sub a1, a1, a4			; RV64IM-NEXT: li a2, 23
	; RV64IM-NEXT: lui a4, 6413			; RV64IM-NEXT: mul a2, a4, a2
	; RV64IM-NEXT: addiw a4, a4, 1265			; RV64IM-NEXT: sub a1, a1, a2
	; RV64IM-NEXT: slli a4, a4, 13			; RV64IM-NEXT: mulh a2, a3, a5
	; RV64IM-NEXT: addi a4, a4, 1027			; RV64IM-NEXT: srli a4, a2, 63
	; RV64IM-NEXT: slli a4, a4, 13			; RV64IM-NEXT: srai a2, a2, 8
	; RV64IM-NEXT: addi a4, a4, 1077			; RV64IM-NEXT: add a2, a2, a4
	; RV64IM-NEXT: slli a4, a4, 12			; RV64IM-NEXT: lui a4, %hi(.LCPI6_2)
	; RV64IM-NEXT: addi a4, a4, 965			; RV64IM-NEXT: ld a4, %lo(.LCPI6_2)(a4)
	; RV64IM-NEXT: mulh a4, a3, a4
	; RV64IM-NEXT: srli a5, a4, 63
	; RV64IM-NEXT: srai a4, a4, 8
	; RV64IM-NEXT: add a4, a4, a5
	; RV64IM-NEXT: li a5, 654			; RV64IM-NEXT: li a5, 654
	; RV64IM-NEXT: mul a4, a4, a5			; RV64IM-NEXT: mul a2, a2, a5
	; RV64IM-NEXT: sub a3, a3, a4			; RV64IM-NEXT: sub a2, a3, a2
	; RV64IM-NEXT: lui a4, 12375			; RV64IM-NEXT: mulh a3, a6, a4
	; RV64IM-NEXT: addiw a4, a4, -575			; RV64IM-NEXT: srli a4, a3, 63
	; RV64IM-NEXT: slli a4, a4, 12			; RV64IM-NEXT: srai a3, a3, 11
	; RV64IM-NEXT: addi a4, a4, 883			; RV64IM-NEXT: add a3, a3, a4
	; RV64IM-NEXT: slli a4, a4, 13			; RV64IM-NEXT: lui a4, 1
	; RV64IM-NEXT: addi a4, a4, -431			; RV64IM-NEXT: addiw a4, a4, 1327
	; RV64IM-NEXT: slli a4, a4, 12			; RV64IM-NEXT: mul a3, a3, a4
	; RV64IM-NEXT: addi a4, a4, 1959			; RV64IM-NEXT: sub a3, a6, a3
	; RV64IM-NEXT: mulh a4, a2, a4
	; RV64IM-NEXT: srli a5, a4, 63
	; RV64IM-NEXT: srai a4, a4, 11
	; RV64IM-NEXT: add a4, a4, a5
	; RV64IM-NEXT: lui a5, 1
	; RV64IM-NEXT: addiw a5, a5, 1327
	; RV64IM-NEXT: mul a4, a4, a5
	; RV64IM-NEXT: sub a2, a2, a4
	; RV64IM-NEXT: sd zero, 0(a0)			; RV64IM-NEXT: sd zero, 0(a0)
	; RV64IM-NEXT: sd a2, 24(a0)			; RV64IM-NEXT: sd a3, 24(a0)
	; RV64IM-NEXT: sd a3, 8(a0)			; RV64IM-NEXT: sd a2, 8(a0)
	; RV64IM-NEXT: sd a1, 16(a0)			; RV64IM-NEXT: sd a1, 16(a0)
	; RV64IM-NEXT: ret			; RV64IM-NEXT: ret
	%1 = srem <4 x i64> %x, <i64 1, i64 654, i64 23, i64 5423>			%1 = srem <4 x i64> %x, <i64 1, i64 654, i64 23, i64 5423>
	ret <4 x i64> %1			ret <4 x i64> %1
	}			}

llvm/test/CodeGen/RISCV/urem-lkk.ll

	Show First 20 Lines • Show All 258 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: li a1, 98			; RV64I-NEXT: li a1, 98
	; RV64I-NEXT: call __umoddi3@plt			; RV64I-NEXT: call __umoddi3@plt
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IM-LABEL: dont_fold_urem_i64:			; RV64IM-LABEL: dont_fold_urem_i64:
	; RV64IM: # %bb.0:			; RV64IM: # %bb.0:
	; RV64IM-NEXT: srli a1, a0, 1			; RV64IM-NEXT: lui a1, %hi(.LCPI6_0)
	; RV64IM-NEXT: lui a2, 2675			; RV64IM-NEXT: ld a1, %lo(.LCPI6_0)(a1)
	; RV64IM-NEXT: addiw a2, a2, -251			; RV64IM-NEXT: srli a2, a0, 1
	; RV64IM-NEXT: slli a2, a2, 13			; RV64IM-NEXT: mulhu a1, a2, a1
	; RV64IM-NEXT: addi a2, a2, 1839
	; RV64IM-NEXT: slli a2, a2, 13
	; RV64IM-NEXT: addi a2, a2, 167
	; RV64IM-NEXT: slli a2, a2, 13
	; RV64IM-NEXT: addi a2, a2, 1505
	; RV64IM-NEXT: mulhu a1, a1, a2
	; RV64IM-NEXT: srli a1, a1, 4			; RV64IM-NEXT: srli a1, a1, 4
	; RV64IM-NEXT: li a2, 98			; RV64IM-NEXT: li a2, 98
	; RV64IM-NEXT: mul a1, a1, a2			; RV64IM-NEXT: mul a1, a1, a2
	; RV64IM-NEXT: sub a0, a0, a1			; RV64IM-NEXT: sub a0, a0, a1
	; RV64IM-NEXT: ret			; RV64IM-NEXT: ret
	%1 = urem i64 %x, 98			%1 = urem i64 %x, 98
	ret i64 %1			ret i64 %1
	}			}

llvm/test/CodeGen/RISCV/urem-vector-lkk.ll

	Show First 20 Lines • Show All 142 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IM-LABEL: fold_urem_vec_1:			; RV64IM-LABEL: fold_urem_vec_1:
	; RV64IM: # %bb.0:			; RV64IM: # %bb.0:
	; RV64IM-NEXT: lhu a6, 24(a1)			; RV64IM-NEXT: lhu a6, 24(a1)
	; RV64IM-NEXT: lhu a3, 16(a1)			; RV64IM-NEXT: lhu a3, 16(a1)
	; RV64IM-NEXT: lhu a4, 8(a1)			; RV64IM-NEXT: lhu a4, 8(a1)
	; RV64IM-NEXT: lhu a1, 0(a1)			; RV64IM-NEXT: lhu a1, 0(a1)
	; RV64IM-NEXT: lui a5, 1423			; RV64IM-NEXT: lui a5, %hi(.LCPI0_0)
	; RV64IM-NEXT: addiw a5, a5, -733			; RV64IM-NEXT: ld a5, %lo(.LCPI0_0)(a5)
	; RV64IM-NEXT: slli a5, a5, 15
	; RV64IM-NEXT: addi a5, a5, 1035
	; RV64IM-NEXT: slli a5, a5, 13
	; RV64IM-NEXT: addi a5, a5, -1811
	; RV64IM-NEXT: slli a5, a5, 12
	; RV64IM-NEXT: addi a5, a5, 561
	; RV64IM-NEXT: mulhu a5, a1, a5			; RV64IM-NEXT: mulhu a5, a1, a5
	; RV64IM-NEXT: sub a2, a1, a5			; RV64IM-NEXT: sub a2, a1, a5
	; RV64IM-NEXT: srli a2, a2, 1			; RV64IM-NEXT: srli a2, a2, 1
	; RV64IM-NEXT: add a2, a2, a5			; RV64IM-NEXT: add a2, a2, a5
	; RV64IM-NEXT: srli a2, a2, 6			; RV64IM-NEXT: srli a2, a2, 6
	; RV64IM-NEXT: li a5, 95			; RV64IM-NEXT: li a7, 95
	; RV64IM-NEXT: mulw a2, a2, a5			; RV64IM-NEXT: lui a5, %hi(.LCPI0_1)
	; RV64IM-NEXT: subw a1, a1, a2			; RV64IM-NEXT: ld a5, %lo(.LCPI0_1)(a5)
				; RV64IM-NEXT: mulw a2, a2, a7
				; RV64IM-NEXT: subw t0, a1, a2
	; RV64IM-NEXT: srli a2, a4, 2			; RV64IM-NEXT: srli a2, a4, 2
	; RV64IM-NEXT: lui a5, 264
	; RV64IM-NEXT: addiw a5, a5, 1057
	; RV64IM-NEXT: slli a5, a5, 15
	; RV64IM-NEXT: addi a5, a5, 1057
	; RV64IM-NEXT: slli a5, a5, 15
	; RV64IM-NEXT: addi a5, a5, 1057
	; RV64IM-NEXT: slli a5, a5, 12
	; RV64IM-NEXT: addi a5, a5, 133
	; RV64IM-NEXT: mulhu a2, a2, a5			; RV64IM-NEXT: mulhu a2, a2, a5
	; RV64IM-NEXT: srli a2, a2, 3			; RV64IM-NEXT: srli a2, a2, 3
	; RV64IM-NEXT: li a5, 124			; RV64IM-NEXT: li a7, 124
	; RV64IM-NEXT: mulw a2, a2, a5			; RV64IM-NEXT: lui a5, %hi(.LCPI0_2)
				; RV64IM-NEXT: ld a5, %lo(.LCPI0_2)(a5)
				; RV64IM-NEXT: mulw a2, a2, a7
	; RV64IM-NEXT: subw a2, a4, a2			; RV64IM-NEXT: subw a2, a4, a2
	; RV64IM-NEXT: srli a4, a3, 1			; RV64IM-NEXT: srli a4, a3, 1
	; RV64IM-NEXT: lui a5, 2675
	; RV64IM-NEXT: addiw a5, a5, -251
	; RV64IM-NEXT: slli a5, a5, 13
	; RV64IM-NEXT: addi a5, a5, 1839
	; RV64IM-NEXT: slli a5, a5, 13
	; RV64IM-NEXT: addi a5, a5, 167
	; RV64IM-NEXT: slli a5, a5, 13
	; RV64IM-NEXT: addi a5, a5, 1505
	; RV64IM-NEXT: mulhu a4, a4, a5			; RV64IM-NEXT: mulhu a4, a4, a5
	; RV64IM-NEXT: srli a4, a4, 4			; RV64IM-NEXT: srli a4, a4, 4
	; RV64IM-NEXT: li a5, 98			; RV64IM-NEXT: lui a5, %hi(.LCPI0_3)
	; RV64IM-NEXT: mulw a4, a4, a5			; RV64IM-NEXT: ld a5, %lo(.LCPI0_3)(a5)
	; RV64IM-NEXT: subw a3, a3, a4			; RV64IM-NEXT: li a1, 98
	; RV64IM-NEXT: lui a4, 8364			; RV64IM-NEXT: mulw a1, a4, a1
	; RV64IM-NEXT: addiw a4, a4, -1977			; RV64IM-NEXT: subw a1, a3, a1
	; RV64IM-NEXT: slli a4, a4, 12			; RV64IM-NEXT: mulhu a3, a6, a5
	; RV64IM-NEXT: addi a4, a4, 1907			; RV64IM-NEXT: srli a3, a3, 7
	; RV64IM-NEXT: slli a4, a4, 12			; RV64IM-NEXT: li a4, 1003
	; RV64IM-NEXT: addi a4, a4, 453			; RV64IM-NEXT: mulw a3, a3, a4
	; RV64IM-NEXT: slli a4, a4, 12			; RV64IM-NEXT: subw a3, a6, a3
	; RV64IM-NEXT: addi a4, a4, 1213			; RV64IM-NEXT: sh a3, 6(a0)
	; RV64IM-NEXT: mulhu a4, a6, a4			; RV64IM-NEXT: sh a1, 4(a0)
	; RV64IM-NEXT: srli a4, a4, 7
	; RV64IM-NEXT: li a5, 1003
	; RV64IM-NEXT: mulw a4, a4, a5
	; RV64IM-NEXT: subw a4, a6, a4
	; RV64IM-NEXT: sh a4, 6(a0)
	; RV64IM-NEXT: sh a3, 4(a0)
	; RV64IM-NEXT: sh a2, 2(a0)			; RV64IM-NEXT: sh a2, 2(a0)
	; RV64IM-NEXT: sh a1, 0(a0)			; RV64IM-NEXT: sh t0, 0(a0)
	; RV64IM-NEXT: ret			; RV64IM-NEXT: ret
	%1 = urem <4 x i16> %x, <i16 95, i16 124, i16 98, i16 1003>			%1 = urem <4 x i16> %x, <i16 95, i16 124, i16 98, i16 1003>
	ret <4 x i16> %1			ret <4 x i16> %1
	}			}

	define <4 x i16> @fold_urem_vec_2(<4 x i16> %x) nounwind {			define <4 x i16> @fold_urem_vec_2(<4 x i16> %x) nounwind {
	; RV32I-LABEL: fold_urem_vec_2:			; RV32I-LABEL: fold_urem_vec_2:
	; RV32I: # %bb.0:			; RV32I: # %bb.0:
	▲ Show 20 Lines • Show All 127 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IM-LABEL: fold_urem_vec_2:			; RV64IM-LABEL: fold_urem_vec_2:
	; RV64IM: # %bb.0:			; RV64IM: # %bb.0:
	; RV64IM-NEXT: lhu a6, 24(a1)			; RV64IM-NEXT: lhu a6, 24(a1)
	; RV64IM-NEXT: lhu a7, 16(a1)			; RV64IM-NEXT: lhu a7, 16(a1)
	; RV64IM-NEXT: lhu a4, 8(a1)			; RV64IM-NEXT: lhu a4, 8(a1)
	; RV64IM-NEXT: lhu a1, 0(a1)			; RV64IM-NEXT: lhu a1, 0(a1)
	; RV64IM-NEXT: lui a5, 1423			; RV64IM-NEXT: lui a5, %hi(.LCPI1_0)
	; RV64IM-NEXT: addiw a5, a5, -733			; RV64IM-NEXT: ld a5, %lo(.LCPI1_0)(a5)
	; RV64IM-NEXT: slli a5, a5, 15
	; RV64IM-NEXT: addi a5, a5, 1035
	; RV64IM-NEXT: slli a5, a5, 13
	; RV64IM-NEXT: addi a5, a5, -1811
	; RV64IM-NEXT: slli a5, a5, 12
	; RV64IM-NEXT: addi a5, a5, 561
	; RV64IM-NEXT: mulhu a2, a1, a5			; RV64IM-NEXT: mulhu a2, a1, a5
	; RV64IM-NEXT: sub a3, a1, a2			; RV64IM-NEXT: sub a3, a1, a2
	; RV64IM-NEXT: srli a3, a3, 1			; RV64IM-NEXT: srli a3, a3, 1
	; RV64IM-NEXT: add a2, a3, a2			; RV64IM-NEXT: add a2, a3, a2
	; RV64IM-NEXT: srli a2, a2, 6			; RV64IM-NEXT: srli a2, a2, 6
	; RV64IM-NEXT: li a3, 95			; RV64IM-NEXT: li a3, 95
	; RV64IM-NEXT: mulw a2, a2, a3			; RV64IM-NEXT: mulw a2, a2, a3
	; RV64IM-NEXT: subw t0, a1, a2			; RV64IM-NEXT: subw t0, a1, a2
	▲ Show 20 Lines • Show All 222 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IM-LABEL: combine_urem_udiv:			; RV64IM-LABEL: combine_urem_udiv:
	; RV64IM: # %bb.0:			; RV64IM: # %bb.0:
	; RV64IM-NEXT: lhu a6, 0(a1)			; RV64IM-NEXT: lhu a6, 0(a1)
	; RV64IM-NEXT: lhu a7, 8(a1)			; RV64IM-NEXT: lhu a7, 8(a1)
	; RV64IM-NEXT: lhu a4, 16(a1)			; RV64IM-NEXT: lhu a4, 16(a1)
	; RV64IM-NEXT: lhu a1, 24(a1)			; RV64IM-NEXT: lhu a1, 24(a1)
	; RV64IM-NEXT: lui a5, 1423			; RV64IM-NEXT: lui a5, %hi(.LCPI2_0)
	; RV64IM-NEXT: addiw a5, a5, -733			; RV64IM-NEXT: ld a5, %lo(.LCPI2_0)(a5)
	; RV64IM-NEXT: slli a5, a5, 15
	; RV64IM-NEXT: addi a5, a5, 1035
	; RV64IM-NEXT: slli a5, a5, 13
	; RV64IM-NEXT: addi a5, a5, -1811
	; RV64IM-NEXT: slli a5, a5, 12
	; RV64IM-NEXT: addi a5, a5, 561
	; RV64IM-NEXT: mulhu a2, a1, a5			; RV64IM-NEXT: mulhu a2, a1, a5
	; RV64IM-NEXT: sub a3, a1, a2			; RV64IM-NEXT: sub a3, a1, a2
	; RV64IM-NEXT: srli a3, a3, 1			; RV64IM-NEXT: srli a3, a3, 1
	; RV64IM-NEXT: add a2, a3, a2			; RV64IM-NEXT: add a2, a3, a2
	; RV64IM-NEXT: srli t3, a2, 6			; RV64IM-NEXT: srli t3, a2, 6
	; RV64IM-NEXT: li t0, 95			; RV64IM-NEXT: li t0, 95
	; RV64IM-NEXT: mulw a3, t3, t0			; RV64IM-NEXT: mulw a3, t3, t0
	; RV64IM-NEXT: subw t1, a1, a3			; RV64IM-NEXT: subw t1, a1, a3
	▲ Show 20 Lines • Show All 123 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IM-LABEL: dont_fold_urem_power_of_two:			; RV64IM-LABEL: dont_fold_urem_power_of_two:
	; RV64IM: # %bb.0:			; RV64IM: # %bb.0:
	; RV64IM-NEXT: lhu a6, 16(a1)			; RV64IM-NEXT: lhu a6, 16(a1)
	; RV64IM-NEXT: lhu a3, 8(a1)			; RV64IM-NEXT: lhu a3, 8(a1)
	; RV64IM-NEXT: lhu a4, 0(a1)			; RV64IM-NEXT: lhu a4, 0(a1)
	; RV64IM-NEXT: lhu a1, 24(a1)			; RV64IM-NEXT: lhu a1, 24(a1)
	; RV64IM-NEXT: lui a5, 1423			; RV64IM-NEXT: lui a5, %hi(.LCPI3_0)
	; RV64IM-NEXT: addiw a5, a5, -733			; RV64IM-NEXT: ld a5, %lo(.LCPI3_0)(a5)
	; RV64IM-NEXT: slli a5, a5, 15
	; RV64IM-NEXT: addi a5, a5, 1035
	; RV64IM-NEXT: slli a5, a5, 13
	; RV64IM-NEXT: addi a5, a5, -1811
	; RV64IM-NEXT: slli a5, a5, 12
	; RV64IM-NEXT: addi a5, a5, 561
	; RV64IM-NEXT: mulhu a5, a1, a5			; RV64IM-NEXT: mulhu a5, a1, a5
	; RV64IM-NEXT: sub a2, a1, a5			; RV64IM-NEXT: sub a2, a1, a5
	; RV64IM-NEXT: srli a2, a2, 1			; RV64IM-NEXT: srli a2, a2, 1
	; RV64IM-NEXT: add a2, a2, a5			; RV64IM-NEXT: add a2, a2, a5
	; RV64IM-NEXT: srli a2, a2, 6			; RV64IM-NEXT: srli a2, a2, 6
	; RV64IM-NEXT: li a5, 95			; RV64IM-NEXT: li a5, 95
	; RV64IM-NEXT: mulw a2, a2, a5			; RV64IM-NEXT: mulw a2, a2, a5
	; RV64IM-NEXT: subw a1, a1, a2			; RV64IM-NEXT: subw a1, a1, a2
	▲ Show 20 Lines • Show All 117 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: addi sp, sp, 48			; RV64I-NEXT: addi sp, sp, 48
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IM-LABEL: dont_fold_urem_one:			; RV64IM-LABEL: dont_fold_urem_one:
	; RV64IM: # %bb.0:			; RV64IM: # %bb.0:
	; RV64IM-NEXT: lhu a2, 24(a1)			; RV64IM-NEXT: lhu a2, 24(a1)
	; RV64IM-NEXT: lhu a3, 8(a1)			; RV64IM-NEXT: lhu a3, 8(a1)
	; RV64IM-NEXT: lhu a1, 16(a1)			; RV64IM-NEXT: lhu a1, 16(a1)
	; RV64IM-NEXT: lui a4, 3206			; RV64IM-NEXT: lui a4, %hi(.LCPI4_0)
	; RV64IM-NEXT: addiw a4, a4, -1781			; RV64IM-NEXT: addi a4, a4, %lo(.LCPI4_0)
	; RV64IM-NEXT: slli a4, a4, 13			; RV64IM-NEXT: ld a4, zero(a4)
	; RV64IM-NEXT: addi a4, a4, 1069
	; RV64IM-NEXT: slli a4, a4, 12
	; RV64IM-NEXT: addi a4, a4, -1959
	; RV64IM-NEXT: slli a4, a4, 14
	; RV64IM-NEXT: addi a4, a4, 713
	; RV64IM-NEXT: mulhu a4, a1, a4			; RV64IM-NEXT: mulhu a4, a1, a4
	; RV64IM-NEXT: sub a5, a1, a4			; RV64IM-NEXT: sub a5, a1, a4
	; RV64IM-NEXT: srli a5, a5, 1			; RV64IM-NEXT: srli a5, a5, 1
	; RV64IM-NEXT: add a4, a5, a4			; RV64IM-NEXT: add a4, a5, a4
	; RV64IM-NEXT: srli a4, a4, 4			; RV64IM-NEXT: srli a4, a4, 4
	; RV64IM-NEXT: li a5, 23			; RV64IM-NEXT: li a6, 23
	; RV64IM-NEXT: mulw a4, a4, a5			; RV64IM-NEXT: lui a5, %hi(.LCPI4_1)
	; RV64IM-NEXT: subw a1, a1, a4			; RV64IM-NEXT: addi a5, a5, %lo(.LCPI4_1)
				; RV64IM-NEXT: ld a5, zero(a5)
				; RV64IM-NEXT: mulw a4, a4, a6
				; RV64IM-NEXT: subw a6, a1, a4
	; RV64IM-NEXT: srli a4, a3, 1			; RV64IM-NEXT: srli a4, a3, 1
	; RV64IM-NEXT: lui a5, 6413
	; RV64IM-NEXT: addiw a5, a5, 1265
	; RV64IM-NEXT: slli a5, a5, 13
	; RV64IM-NEXT: addi a5, a5, 1027
	; RV64IM-NEXT: slli a5, a5, 13
	; RV64IM-NEXT: addi a5, a5, 1077
	; RV64IM-NEXT: slli a5, a5, 12
	; RV64IM-NEXT: addi a5, a5, 965
	; RV64IM-NEXT: mulhu a4, a4, a5			; RV64IM-NEXT: mulhu a4, a4, a5
	; RV64IM-NEXT: srli a4, a4, 7			; RV64IM-NEXT: srli a4, a4, 7
	; RV64IM-NEXT: li a5, 654			; RV64IM-NEXT: lui a5, %hi(.LCPI4_2)
	; RV64IM-NEXT: mulw a4, a4, a5			; RV64IM-NEXT: addi a5, a5, %lo(.LCPI4_2)
	; RV64IM-NEXT: subw a3, a3, a4			; RV64IM-NEXT: ld a5, zero(a5)
	; RV64IM-NEXT: lui a4, 1044567			; RV64IM-NEXT: li a1, 654
	; RV64IM-NEXT: addiw a4, a4, -575			; RV64IM-NEXT: mulw a1, a4, a1
	; RV64IM-NEXT: slli a4, a4, 12			; RV64IM-NEXT: subw a1, a3, a1
	; RV64IM-NEXT: addi a4, a4, 883			; RV64IM-NEXT: mulhu a3, a2, a5
	; RV64IM-NEXT: slli a4, a4, 14			; RV64IM-NEXT: srli a3, a3, 12
	; RV64IM-NEXT: addi a4, a4, -861			; RV64IM-NEXT: lui a4, 1
	; RV64IM-NEXT: slli a4, a4, 12			; RV64IM-NEXT: addiw a4, a4, 1327
	; RV64IM-NEXT: addi a4, a4, -179			; RV64IM-NEXT: mulw a3, a3, a4
	; RV64IM-NEXT: mulhu a4, a2, a4			; RV64IM-NEXT: subw a2, a2, a3
	; RV64IM-NEXT: srli a4, a4, 12
	; RV64IM-NEXT: lui a5, 1
	; RV64IM-NEXT: addiw a5, a5, 1327
	; RV64IM-NEXT: mulw a4, a4, a5
	; RV64IM-NEXT: subw a2, a2, a4
	; RV64IM-NEXT: sh zero, 0(a0)			; RV64IM-NEXT: sh zero, 0(a0)
	; RV64IM-NEXT: sh a2, 6(a0)			; RV64IM-NEXT: sh a2, 6(a0)
	; RV64IM-NEXT: sh a3, 2(a0)			; RV64IM-NEXT: sh a1, 2(a0)
	; RV64IM-NEXT: sh a1, 4(a0)			; RV64IM-NEXT: sh a6, 4(a0)
	; RV64IM-NEXT: ret			; RV64IM-NEXT: ret
	%1 = urem <4 x i16> %x, <i16 1, i16 654, i16 23, i16 5423>			%1 = urem <4 x i16> %x, <i16 1, i16 654, i16 23, i16 5423>
	ret <4 x i16> %1			ret <4 x i16> %1
	}			}

	; Don't fold if the divisor is 2^16.			; Don't fold if the divisor is 2^16.
	define <4 x i16> @dont_fold_urem_i16_smax(<4 x i16> %x) nounwind {			define <4 x i16> @dont_fold_urem_i16_smax(<4 x i16> %x) nounwind {
	; CHECK-LABEL: dont_fold_urem_i16_smax:			; CHECK-LABEL: dont_fold_urem_i16_smax:
	▲ Show 20 Lines • Show All 183 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: addi sp, sp, 48			; RV64I-NEXT: addi sp, sp, 48
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IM-LABEL: dont_fold_urem_i64:			; RV64IM-LABEL: dont_fold_urem_i64:
	; RV64IM: # %bb.0:			; RV64IM: # %bb.0:
	; RV64IM-NEXT: ld a2, 24(a1)			; RV64IM-NEXT: ld a2, 24(a1)
	; RV64IM-NEXT: ld a3, 8(a1)			; RV64IM-NEXT: ld a3, 8(a1)
	; RV64IM-NEXT: ld a1, 16(a1)			; RV64IM-NEXT: ld a1, 16(a1)
	; RV64IM-NEXT: lui a4, 3206			; RV64IM-NEXT: lui a4, %hi(.LCPI6_0)
	; RV64IM-NEXT: addiw a4, a4, -1781			; RV64IM-NEXT: ld a4, %lo(.LCPI6_0)(a4)
	; RV64IM-NEXT: slli a4, a4, 13
	; RV64IM-NEXT: addi a4, a4, 1069
	; RV64IM-NEXT: slli a4, a4, 12
	; RV64IM-NEXT: addi a4, a4, -1959
	; RV64IM-NEXT: slli a4, a4, 14
	; RV64IM-NEXT: addi a4, a4, 713
	; RV64IM-NEXT: mulhu a4, a1, a4			; RV64IM-NEXT: mulhu a4, a1, a4
	; RV64IM-NEXT: sub a5, a1, a4			; RV64IM-NEXT: sub a5, a1, a4
	; RV64IM-NEXT: srli a5, a5, 1			; RV64IM-NEXT: srli a5, a5, 1
	; RV64IM-NEXT: add a4, a5, a4			; RV64IM-NEXT: add a4, a5, a4
	; RV64IM-NEXT: srli a4, a4, 4			; RV64IM-NEXT: srli a4, a4, 4
	; RV64IM-NEXT: li a5, 23			; RV64IM-NEXT: li a6, 23
	; RV64IM-NEXT: mul a4, a4, a5			; RV64IM-NEXT: lui a5, %hi(.LCPI6_1)
	; RV64IM-NEXT: sub a1, a1, a4			; RV64IM-NEXT: ld a5, %lo(.LCPI6_1)(a5)
				; RV64IM-NEXT: mul a4, a4, a6
				; RV64IM-NEXT: sub a6, a1, a4
	; RV64IM-NEXT: srli a4, a3, 1			; RV64IM-NEXT: srli a4, a3, 1
	; RV64IM-NEXT: lui a5, 6413
	; RV64IM-NEXT: addiw a5, a5, 1265
	; RV64IM-NEXT: slli a5, a5, 13
	; RV64IM-NEXT: addi a5, a5, 1027
	; RV64IM-NEXT: slli a5, a5, 13
	; RV64IM-NEXT: addi a5, a5, 1077
	; RV64IM-NEXT: slli a5, a5, 12
	; RV64IM-NEXT: addi a5, a5, 965
	; RV64IM-NEXT: mulhu a4, a4, a5			; RV64IM-NEXT: mulhu a4, a4, a5
	; RV64IM-NEXT: srli a4, a4, 7			; RV64IM-NEXT: srli a4, a4, 7
	; RV64IM-NEXT: li a5, 654			; RV64IM-NEXT: lui a5, %hi(.LCPI6_2)
	; RV64IM-NEXT: mul a4, a4, a5			; RV64IM-NEXT: ld a5, %lo(.LCPI6_2)(a5)
	; RV64IM-NEXT: sub a3, a3, a4			; RV64IM-NEXT: li a1, 654
	; RV64IM-NEXT: lui a4, 1044567			; RV64IM-NEXT: mul a1, a4, a1
	; RV64IM-NEXT: addiw a4, a4, -575			; RV64IM-NEXT: sub a1, a3, a1
	; RV64IM-NEXT: slli a4, a4, 12			; RV64IM-NEXT: mulhu a3, a2, a5
	; RV64IM-NEXT: addi a4, a4, 883			; RV64IM-NEXT: srli a3, a3, 12
	; RV64IM-NEXT: slli a4, a4, 14			; RV64IM-NEXT: lui a4, 1
	; RV64IM-NEXT: addi a4, a4, -861			; RV64IM-NEXT: addiw a4, a4, 1327
	; RV64IM-NEXT: slli a4, a4, 12			; RV64IM-NEXT: mul a3, a3, a4
	; RV64IM-NEXT: addi a4, a4, -179			; RV64IM-NEXT: sub a2, a2, a3
	; RV64IM-NEXT: mulhu a4, a2, a4
	; RV64IM-NEXT: srli a4, a4, 12
	; RV64IM-NEXT: lui a5, 1
	; RV64IM-NEXT: addiw a5, a5, 1327
	; RV64IM-NEXT: mul a4, a4, a5
	; RV64IM-NEXT: sub a2, a2, a4
	; RV64IM-NEXT: sd zero, 0(a0)			; RV64IM-NEXT: sd zero, 0(a0)
	; RV64IM-NEXT: sd a2, 24(a0)			; RV64IM-NEXT: sd a2, 24(a0)
	; RV64IM-NEXT: sd a3, 8(a0)			; RV64IM-NEXT: sd a1, 8(a0)
	; RV64IM-NEXT: sd a1, 16(a0)			; RV64IM-NEXT: sd a6, 16(a0)
	; RV64IM-NEXT: ret			; RV64IM-NEXT: ret
	%1 = urem <4 x i64> %x, <i64 1, i64 654, i64 23, i64 5423>			%1 = urem <4 x i64> %x, <i64 1, i64 654, i64 23, i64 5423>
	ret <4 x i64> %1			ret <4 x i64> %1
	}			}

llvm/test/CodeGen/RISCV/vararg.ll

	Show First 20 Lines • Show All 1,528 Lines • ▼ Show 20 Lines
	; LP64-LP64F-LP64D-FPELIM-NEXT: addi sp, sp, -48			; LP64-LP64F-LP64D-FPELIM-NEXT: addi sp, sp, -48
	; LP64-LP64F-LP64D-FPELIM-NEXT: sd ra, 40(sp) # 8-byte Folded Spill			; LP64-LP64F-LP64D-FPELIM-NEXT: sd ra, 40(sp) # 8-byte Folded Spill
	; LP64-LP64F-LP64D-FPELIM-NEXT: li a0, 17			; LP64-LP64F-LP64D-FPELIM-NEXT: li a0, 17
	; LP64-LP64F-LP64D-FPELIM-NEXT: sd a0, 24(sp)			; LP64-LP64F-LP64D-FPELIM-NEXT: sd a0, 24(sp)
	; LP64-LP64F-LP64D-FPELIM-NEXT: li a0, 16			; LP64-LP64F-LP64D-FPELIM-NEXT: li a0, 16
	; LP64-LP64F-LP64D-FPELIM-NEXT: sd a0, 16(sp)			; LP64-LP64F-LP64D-FPELIM-NEXT: sd a0, 16(sp)
	; LP64-LP64F-LP64D-FPELIM-NEXT: li a0, 15			; LP64-LP64F-LP64D-FPELIM-NEXT: li a0, 15
	; LP64-LP64F-LP64D-FPELIM-NEXT: sd a0, 8(sp)			; LP64-LP64F-LP64D-FPELIM-NEXT: sd a0, 8(sp)
	; LP64-LP64F-LP64D-FPELIM-NEXT: lui a0, 2049			; LP64-LP64F-LP64D-FPELIM-NEXT: lui a0, %hi(.LCPI11_0)
	; LP64-LP64F-LP64D-FPELIM-NEXT: addiw a0, a0, -1147			; LP64-LP64F-LP64D-FPELIM-NEXT: ld a0, %lo(.LCPI11_0)(a0)
	; LP64-LP64F-LP64D-FPELIM-NEXT: slli a0, a0, 13			; LP64-LP64F-LP64D-FPELIM-NEXT: sd a0, 0(sp)
	; LP64-LP64F-LP64D-FPELIM-NEXT: addi a0, a0, 983			; LP64-LP64F-LP64D-FPELIM-NEXT: lui a0, %hi(.LCPI11_1)
	; LP64-LP64F-LP64D-FPELIM-NEXT: slli a0, a0, 14			; LP64-LP64F-LP64D-FPELIM-NEXT: ld a2, %lo(.LCPI11_1)(a0)
	; LP64-LP64F-LP64D-FPELIM-NEXT: addi a0, a0, 655			; LP64-LP64F-LP64D-FPELIM-NEXT: lui a0, %hi(.LCPI11_2)
	; LP64-LP64F-LP64D-FPELIM-NEXT: slli a0, a0, 12			; LP64-LP64F-LP64D-FPELIM-NEXT: ld a3, %lo(.LCPI11_2)(a0)
	; LP64-LP64F-LP64D-FPELIM-NEXT: addi t0, a0, 1475
	; LP64-LP64F-LP64D-FPELIM-NEXT: lui a0, 1192			; LP64-LP64F-LP64D-FPELIM-NEXT: lui a0, 1192
	; LP64-LP64F-LP64D-FPELIM-NEXT: addiw a0, a0, 381			; LP64-LP64F-LP64D-FPELIM-NEXT: addiw a0, a0, 381
	; LP64-LP64F-LP64D-FPELIM-NEXT: slli a0, a0, 12			; LP64-LP64F-LP64D-FPELIM-NEXT: slli a0, a0, 12
	; LP64-LP64F-LP64D-FPELIM-NEXT: addi a6, a0, -2048			; LP64-LP64F-LP64D-FPELIM-NEXT: addi a6, a0, -2048
	; LP64-LP64F-LP64D-FPELIM-NEXT: lui a0, 1048248
	; LP64-LP64F-LP64D-FPELIM-NEXT: addiw a0, a0, 1311
	; LP64-LP64F-LP64D-FPELIM-NEXT: slli a0, a0, 12
	; LP64-LP64F-LP64D-FPELIM-NEXT: addi a0, a0, -1147
	; LP64-LP64F-LP64D-FPELIM-NEXT: slli a0, a0, 13
	; LP64-LP64F-LP64D-FPELIM-NEXT: addi a0, a0, 983
	; LP64-LP64F-LP64D-FPELIM-NEXT: slli a0, a0, 15
	; LP64-LP64F-LP64D-FPELIM-NEXT: addi a2, a0, 1311
	; LP64-LP64F-LP64D-FPELIM-NEXT: lui a0, 512
	; LP64-LP64F-LP64D-FPELIM-NEXT: addiw a0, a0, 73
	; LP64-LP64F-LP64D-FPELIM-NEXT: slli a0, a0, 15
	; LP64-LP64F-LP64D-FPELIM-NEXT: addi a0, a0, -1311
	; LP64-LP64F-LP64D-FPELIM-NEXT: slli a0, a0, 12
	; LP64-LP64F-LP64D-FPELIM-NEXT: addi a0, a0, 1147
	; LP64-LP64F-LP64D-FPELIM-NEXT: slli a0, a0, 14
	; LP64-LP64F-LP64D-FPELIM-NEXT: addi a3, a0, -1967
	; LP64-LP64F-LP64D-FPELIM-NEXT: li a0, 1			; LP64-LP64F-LP64D-FPELIM-NEXT: li a0, 1
	; LP64-LP64F-LP64D-FPELIM-NEXT: li a1, 11			; LP64-LP64F-LP64D-FPELIM-NEXT: li a1, 11
	; LP64-LP64F-LP64D-FPELIM-NEXT: li a4, 12			; LP64-LP64F-LP64D-FPELIM-NEXT: li a4, 12
	; LP64-LP64F-LP64D-FPELIM-NEXT: li a5, 13			; LP64-LP64F-LP64D-FPELIM-NEXT: li a5, 13
	; LP64-LP64F-LP64D-FPELIM-NEXT: li a7, 14			; LP64-LP64F-LP64D-FPELIM-NEXT: li a7, 14
	; LP64-LP64F-LP64D-FPELIM-NEXT: sd t0, 0(sp)
	; LP64-LP64F-LP64D-FPELIM-NEXT: call va5_aligned_stack_callee@plt			; LP64-LP64F-LP64D-FPELIM-NEXT: call va5_aligned_stack_callee@plt
	; LP64-LP64F-LP64D-FPELIM-NEXT: ld ra, 40(sp) # 8-byte Folded Reload			; LP64-LP64F-LP64D-FPELIM-NEXT: ld ra, 40(sp) # 8-byte Folded Reload
	; LP64-LP64F-LP64D-FPELIM-NEXT: addi sp, sp, 48			; LP64-LP64F-LP64D-FPELIM-NEXT: addi sp, sp, 48
	; LP64-LP64F-LP64D-FPELIM-NEXT: ret			; LP64-LP64F-LP64D-FPELIM-NEXT: ret
	;			;
	; LP64-LP64F-LP64D-WITHFP-LABEL: va5_aligned_stack_caller:			; LP64-LP64F-LP64D-WITHFP-LABEL: va5_aligned_stack_caller:
	; LP64-LP64F-LP64D-WITHFP: # %bb.0:			; LP64-LP64F-LP64D-WITHFP: # %bb.0:
	; LP64-LP64F-LP64D-WITHFP-NEXT: addi sp, sp, -48			; LP64-LP64F-LP64D-WITHFP-NEXT: addi sp, sp, -48
	; LP64-LP64F-LP64D-WITHFP-NEXT: sd ra, 40(sp) # 8-byte Folded Spill			; LP64-LP64F-LP64D-WITHFP-NEXT: sd ra, 40(sp) # 8-byte Folded Spill
	; LP64-LP64F-LP64D-WITHFP-NEXT: sd s0, 32(sp) # 8-byte Folded Spill			; LP64-LP64F-LP64D-WITHFP-NEXT: sd s0, 32(sp) # 8-byte Folded Spill
	; LP64-LP64F-LP64D-WITHFP-NEXT: addi s0, sp, 48			; LP64-LP64F-LP64D-WITHFP-NEXT: addi s0, sp, 48
	; LP64-LP64F-LP64D-WITHFP-NEXT: li a0, 17			; LP64-LP64F-LP64D-WITHFP-NEXT: li a0, 17
	; LP64-LP64F-LP64D-WITHFP-NEXT: sd a0, 24(sp)			; LP64-LP64F-LP64D-WITHFP-NEXT: sd a0, 24(sp)
	; LP64-LP64F-LP64D-WITHFP-NEXT: li a0, 16			; LP64-LP64F-LP64D-WITHFP-NEXT: li a0, 16
	; LP64-LP64F-LP64D-WITHFP-NEXT: sd a0, 16(sp)			; LP64-LP64F-LP64D-WITHFP-NEXT: sd a0, 16(sp)
	; LP64-LP64F-LP64D-WITHFP-NEXT: li a0, 15			; LP64-LP64F-LP64D-WITHFP-NEXT: li a0, 15
	; LP64-LP64F-LP64D-WITHFP-NEXT: sd a0, 8(sp)			; LP64-LP64F-LP64D-WITHFP-NEXT: sd a0, 8(sp)
	; LP64-LP64F-LP64D-WITHFP-NEXT: lui a0, 2049			; LP64-LP64F-LP64D-WITHFP-NEXT: lui a0, %hi(.LCPI11_0)
	; LP64-LP64F-LP64D-WITHFP-NEXT: addiw a0, a0, -1147			; LP64-LP64F-LP64D-WITHFP-NEXT: ld a0, %lo(.LCPI11_0)(a0)
	; LP64-LP64F-LP64D-WITHFP-NEXT: slli a0, a0, 13			; LP64-LP64F-LP64D-WITHFP-NEXT: sd a0, 0(sp)
	; LP64-LP64F-LP64D-WITHFP-NEXT: addi a0, a0, 983			; LP64-LP64F-LP64D-WITHFP-NEXT: lui a0, %hi(.LCPI11_1)
	; LP64-LP64F-LP64D-WITHFP-NEXT: slli a0, a0, 14			; LP64-LP64F-LP64D-WITHFP-NEXT: ld a2, %lo(.LCPI11_1)(a0)
	; LP64-LP64F-LP64D-WITHFP-NEXT: addi a0, a0, 655			; LP64-LP64F-LP64D-WITHFP-NEXT: lui a0, %hi(.LCPI11_2)
	; LP64-LP64F-LP64D-WITHFP-NEXT: slli a0, a0, 12			; LP64-LP64F-LP64D-WITHFP-NEXT: ld a3, %lo(.LCPI11_2)(a0)
	; LP64-LP64F-LP64D-WITHFP-NEXT: addi t0, a0, 1475
	; LP64-LP64F-LP64D-WITHFP-NEXT: lui a0, 1192			; LP64-LP64F-LP64D-WITHFP-NEXT: lui a0, 1192
	; LP64-LP64F-LP64D-WITHFP-NEXT: addiw a0, a0, 381			; LP64-LP64F-LP64D-WITHFP-NEXT: addiw a0, a0, 381
	; LP64-LP64F-LP64D-WITHFP-NEXT: slli a0, a0, 12			; LP64-LP64F-LP64D-WITHFP-NEXT: slli a0, a0, 12
	; LP64-LP64F-LP64D-WITHFP-NEXT: addi a6, a0, -2048			; LP64-LP64F-LP64D-WITHFP-NEXT: addi a6, a0, -2048
	; LP64-LP64F-LP64D-WITHFP-NEXT: lui a0, 1048248
	; LP64-LP64F-LP64D-WITHFP-NEXT: addiw a0, a0, 1311
	; LP64-LP64F-LP64D-WITHFP-NEXT: slli a0, a0, 12
	; LP64-LP64F-LP64D-WITHFP-NEXT: addi a0, a0, -1147
	; LP64-LP64F-LP64D-WITHFP-NEXT: slli a0, a0, 13
	; LP64-LP64F-LP64D-WITHFP-NEXT: addi a0, a0, 983
	; LP64-LP64F-LP64D-WITHFP-NEXT: slli a0, a0, 15
	; LP64-LP64F-LP64D-WITHFP-NEXT: addi a2, a0, 1311
	; LP64-LP64F-LP64D-WITHFP-NEXT: lui a0, 512
	; LP64-LP64F-LP64D-WITHFP-NEXT: addiw a0, a0, 73
	; LP64-LP64F-LP64D-WITHFP-NEXT: slli a0, a0, 15
	; LP64-LP64F-LP64D-WITHFP-NEXT: addi a0, a0, -1311
	; LP64-LP64F-LP64D-WITHFP-NEXT: slli a0, a0, 12
	; LP64-LP64F-LP64D-WITHFP-NEXT: addi a0, a0, 1147
	; LP64-LP64F-LP64D-WITHFP-NEXT: slli a0, a0, 14
	; LP64-LP64F-LP64D-WITHFP-NEXT: addi a3, a0, -1967
	; LP64-LP64F-LP64D-WITHFP-NEXT: li a0, 1			; LP64-LP64F-LP64D-WITHFP-NEXT: li a0, 1
	; LP64-LP64F-LP64D-WITHFP-NEXT: li a1, 11			; LP64-LP64F-LP64D-WITHFP-NEXT: li a1, 11
	; LP64-LP64F-LP64D-WITHFP-NEXT: li a4, 12			; LP64-LP64F-LP64D-WITHFP-NEXT: li a4, 12
	; LP64-LP64F-LP64D-WITHFP-NEXT: li a5, 13			; LP64-LP64F-LP64D-WITHFP-NEXT: li a5, 13
	; LP64-LP64F-LP64D-WITHFP-NEXT: li a7, 14			; LP64-LP64F-LP64D-WITHFP-NEXT: li a7, 14
	; LP64-LP64F-LP64D-WITHFP-NEXT: sd t0, 0(sp)
	; LP64-LP64F-LP64D-WITHFP-NEXT: call va5_aligned_stack_callee@plt			; LP64-LP64F-LP64D-WITHFP-NEXT: call va5_aligned_stack_callee@plt
	; LP64-LP64F-LP64D-WITHFP-NEXT: ld ra, 40(sp) # 8-byte Folded Reload			; LP64-LP64F-LP64D-WITHFP-NEXT: ld ra, 40(sp) # 8-byte Folded Reload
	; LP64-LP64F-LP64D-WITHFP-NEXT: ld s0, 32(sp) # 8-byte Folded Reload			; LP64-LP64F-LP64D-WITHFP-NEXT: ld s0, 32(sp) # 8-byte Folded Reload
	; LP64-LP64F-LP64D-WITHFP-NEXT: addi sp, sp, 48			; LP64-LP64F-LP64D-WITHFP-NEXT: addi sp, sp, 48
	; LP64-LP64F-LP64D-WITHFP-NEXT: ret			; LP64-LP64F-LP64D-WITHFP-NEXT: ret
	%1 = call i32 (i32, ...) @va5_aligned_stack_callee(i32 1, i32 11,			%1 = call i32 (i32, ...) @va5_aligned_stack_callee(i32 1, i32 11,
	fp128 0xLEB851EB851EB851F400091EB851EB851, i32 12, i32 13, i64 20000000000,			fp128 0xLEB851EB851EB851F400091EB851EB851, i32 12, i32 13, i64 20000000000,
	i32 14, double 2.720000e+00, i32 15, [2 x i32] [i32 16, i32 17])			i32 14, double 2.720000e+00, i32 15, [2 x i32] [i32 16, i32 17])
	▲ Show 20 Lines • Show All 322 Lines • Show Last 20 Lines

This is an archive of the discontinued LLVM Phabricator instance.

[RISCV] Use constant pool for large integers
ClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 391296

llvm/lib/Target/RISCV/RISCVISelDAGToDAG.cpp

llvm/lib/Target/RISCV/RISCVISelLowering.h

llvm/lib/Target/RISCV/RISCVSubtarget.h

llvm/lib/Target/RISCV/RISCVSubtarget.cpp

llvm/test/CodeGen/RISCV/bswap-ctlz-cttz-ctpop.ll

llvm/test/CodeGen/RISCV/div.ll

llvm/test/CodeGen/RISCV/double-imm.ll

llvm/test/CodeGen/RISCV/imm.ll

llvm/test/CodeGen/RISCV/rv64zbb.ll

llvm/test/CodeGen/RISCV/rv64zbp.ll

llvm/test/CodeGen/RISCV/rvv/bitreverse-sdnode.ll

llvm/test/CodeGen/RISCV/rvv/ctlz-sdnode.ll

llvm/test/CodeGen/RISCV/rvv/ctpop-sdnode.ll

llvm/test/CodeGen/RISCV/rvv/cttz-sdnode.ll

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-bitreverse.ll

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-ctlz.ll

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-ctpop.ll

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-cttz.ll

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-int-buildvec.ll

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-int.ll

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-mask-buildvec.ll

llvm/test/CodeGen/RISCV/rvv/interleave-crash.ll

llvm/test/CodeGen/RISCV/rvv/vdiv-sdnode.ll

llvm/test/CodeGen/RISCV/rvv/vrem-sdnode.ll

llvm/test/CodeGen/RISCV/srem-lkk.ll

llvm/test/CodeGen/RISCV/srem-seteq-illegal-types.ll

llvm/test/CodeGen/RISCV/srem-vector-lkk.ll

llvm/test/CodeGen/RISCV/urem-lkk.ll

llvm/test/CodeGen/RISCV/urem-vector-lkk.ll

llvm/test/CodeGen/RISCV/vararg.ll

This is an archive of the discontinued LLVM Phabricator instance.

[RISCV] Use constant pool for large integersClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 391296

llvm/lib/Target/RISCV/RISCVISelDAGToDAG.cpp

llvm/lib/Target/RISCV/RISCVISelLowering.h

llvm/lib/Target/RISCV/RISCVSubtarget.h

llvm/lib/Target/RISCV/RISCVSubtarget.cpp

llvm/test/CodeGen/RISCV/bswap-ctlz-cttz-ctpop.ll

llvm/test/CodeGen/RISCV/div.ll

llvm/test/CodeGen/RISCV/double-imm.ll

llvm/test/CodeGen/RISCV/imm.ll

llvm/test/CodeGen/RISCV/rv64zbb.ll

llvm/test/CodeGen/RISCV/rv64zbp.ll

llvm/test/CodeGen/RISCV/rvv/bitreverse-sdnode.ll

llvm/test/CodeGen/RISCV/rvv/ctlz-sdnode.ll

llvm/test/CodeGen/RISCV/rvv/ctpop-sdnode.ll

llvm/test/CodeGen/RISCV/rvv/cttz-sdnode.ll

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-bitreverse.ll

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-ctlz.ll

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-ctpop.ll

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-cttz.ll

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-int-buildvec.ll

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-int.ll

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-mask-buildvec.ll

llvm/test/CodeGen/RISCV/rvv/interleave-crash.ll

llvm/test/CodeGen/RISCV/rvv/vdiv-sdnode.ll

llvm/test/CodeGen/RISCV/rvv/vrem-sdnode.ll

llvm/test/CodeGen/RISCV/srem-lkk.ll

llvm/test/CodeGen/RISCV/srem-seteq-illegal-types.ll

llvm/test/CodeGen/RISCV/srem-vector-lkk.ll

llvm/test/CodeGen/RISCV/urem-lkk.ll

llvm/test/CodeGen/RISCV/urem-vector-lkk.ll

llvm/test/CodeGen/RISCV/vararg.ll

[RISCV] Use constant pool for large integers
ClosedPublic