Diff 396756

llvm/lib/Target/RISCV/RISCVISelDAGToDAG.cpp

Show First 20 Lines • Show All 119 Lines • ▼ Show 20 Lines	while (Position != CurDAG->allnodes_begin()) {
MadeChange \|= doPeepholeSExtW(N);		MadeChange \|= doPeepholeSExtW(N);
MadeChange \|= doPeepholeLoadStoreADDI(N);		MadeChange \|= doPeepholeLoadStoreADDI(N);
}		}

if (MadeChange)		if (MadeChange)
CurDAG->RemoveDeadNodes();		CurDAG->RemoveDeadNodes();
}		}

static SDNode selectImm(SelectionDAG CurDAG, const SDLoc &DL, int64_t Imm,		static SDNode selectImmWithConstantPool(SelectionDAG CurDAG, const SDLoc &DL,
		const MVT VT, int64_t Imm,
		craig.topperUnsubmitted Done Reply Inline Actions We should probably pass `int64_t Imm` here and call ConstantInt::get(EVT(VT).getTypeForEVT(CurDAG->getContext(), Imm)` to get the ConstantInt* that getConstantPool needs. That would solve the problems in my other comments. craig.topper: We should probably pass `int64_t Imm` here and call ConstantInt::get(EVT(VT).getTypeForEVT…
const RISCVSubtarget &Subtarget) {		const RISCVSubtarget &Subtarget) {
		assert(VT == MVT::i64 && "Expecting MVT::i64");
		const RISCVTargetLowering *TLI = Subtarget.getTargetLowering();
		ConstantPoolSDNode *CP = cast<ConstantPoolSDNode>(CurDAG->getConstantPool(
		ConstantInt::get(EVT(VT).getTypeForEVT(*CurDAG->getContext()), Imm), VT));
		SDValue Addr = TLI->getAddr(CP, *CurDAG);
		SDValue Offset = CurDAG->getTargetConstant(0, DL, VT);
		craig.topperUnsubmitted Done Reply Inline Actions This should be `getTargetConstant(0, DL, VT)` craig.topper: This should be `getTargetConstant(0, DL, VT)`
		// Since there is no data race, the chain can be the entry node.
		SDNode *Load = CurDAG->getMachineNode(RISCV::LD, DL, VT, Addr, Offset,
		CurDAG->getEntryNode());
		MachineFunction &MF = CurDAG->getMachineFunction();
		MachineMemOperand *MemOp = MF.getMachineMemOperand(
		MachinePointerInfo::getConstantPool(MF), MachineMemOperand::MOLoad,
		LLT(VT), CP->getAlign());
		CurDAG->setNodeMemRefs(cast<MachineSDNode>(Load), {MemOp});
		return Load;
		}

		static SDNode selectImm(SelectionDAG CurDAG, const SDLoc &DL, const MVT VT,
		int64_t Imm, const RISCVSubtarget &Subtarget) {
MVT XLenVT = Subtarget.getXLenVT();		MVT XLenVT = Subtarget.getXLenVT();
RISCVMatInt::InstSeq Seq =		RISCVMatInt::InstSeq Seq =
RISCVMatInt::generateInstSeq(Imm, Subtarget.getFeatureBits());		RISCVMatInt::generateInstSeq(Imm, Subtarget.getFeatureBits());

		// If Imm is expensive to build, then we put it into constant pool.
		if (Subtarget.useConstantPoolForLargeInts() &&
		Seq.size() > Subtarget.getMaxBuildIntsCost())
		return selectImmWithConstantPool(CurDAG, DL, VT, Imm, Subtarget);

SDNode *Result = nullptr;		SDNode *Result = nullptr;
SDValue SrcReg = CurDAG->getRegister(RISCV::X0, XLenVT);		SDValue SrcReg = CurDAG->getRegister(RISCV::X0, XLenVT);
for (RISCVMatInt::Inst &Inst : Seq) {		for (RISCVMatInt::Inst &Inst : Seq) {
SDValue SDImm = CurDAG->getTargetConstant(Inst.Imm, DL, XLenVT);		SDValue SDImm = CurDAG->getTargetConstant(Inst.Imm, DL, XLenVT);
if (Inst.Opc == RISCV::LUI)		if (Inst.Opc == RISCV::LUI)
Result = CurDAG->getMachineNode(RISCV::LUI, DL, XLenVT, SDImm);		Result = CurDAG->getMachineNode(RISCV::LUI, DL, XLenVT, SDImm);
else if (Inst.Opc == RISCV::ADDUW)		else if (Inst.Opc == RISCV::ADDUW)
Result = CurDAG->getMachineNode(RISCV::ADDUW, DL, XLenVT, SrcReg,		Result = CurDAG->getMachineNode(RISCV::ADDUW, DL, XLenVT, SrcReg,
CurDAG->getRegister(RISCV::X0, XLenVT));		CurDAG->getRegister(RISCV::X0, XLenVT));
else if (Inst.Opc == RISCV::SH1ADD \|\| Inst.Opc == RISCV::SH2ADD \|\|		else if (Inst.Opc == RISCV::SH1ADD \|\| Inst.Opc == RISCV::SH2ADD \|\|
Inst.Opc == RISCV::SH3ADD)		Inst.Opc == RISCV::SH3ADD)
Result = CurDAG->getMachineNode(Inst.Opc, DL, XLenVT, SrcReg, SrcReg);		Result = CurDAG->getMachineNode(Inst.Opc, DL, XLenVT, SrcReg, SrcReg);
else		else
Result = CurDAG->getMachineNode(Inst.Opc, DL, XLenVT, SrcReg, SDImm);		Result = CurDAG->getMachineNode(Inst.Opc, DL, XLenVT, SrcReg, SDImm);

// Only the first instruction has X0 as its source.		// Only the first instruction has X0 as its source.
SrcReg = SDValue(Result, 0);		SrcReg = SDValue(Result, 0);
}		}

return Result;		return Result;
}		}

static SDValue createTupleImpl(SelectionDAG &CurDAG, ArrayRef<SDValue> Regs,		static SDValue createTupleImpl(SelectionDAG &CurDAG, ArrayRef<SDValue> Regs,
		craig.topperUnsubmitted Done Reply Inline Actions This makes it sound like the immediate is global which doesn't make sense. `selectImmWithConstantPool` or `selectImmUsingConstantPool` would be a better name, I think. craig.topper: This makes it sound like the immediate is global which doesn't make sense.
unsigned RegClassID, unsigned SubReg0) {		unsigned RegClassID, unsigned SubReg0) {
		craig.topperUnsubmitted Done Reply Inline Actions MVT should always be passed by value. It's an 8-bit integer. craig.topper: MVT should always be passed by value. It's an 8-bit integer.
assert(Regs.size() >= 2 && Regs.size() <= 8);		assert(Regs.size() >= 2 && Regs.size() <= 8);

SDLoc DL(Regs[0]);		SDLoc DL(Regs[0]);
SmallVector<SDValue, 8> Ops;		SmallVector<SDValue, 8> Ops;

Ops.push_back(CurDAG.getTargetConstant(RegClassID, DL, MVT::i32));		Ops.push_back(CurDAG.getTargetConstant(RegClassID, DL, MVT::i32));
		craig.topperUnsubmitted Done Reply Inline Actions could -> can craig.topper: could -> can

		craig.topperUnsubmitted Done Reply Inline Actions LD assumes VT is MVT::i64. Should we assert that? craig.topper: LD assumes VT is MVT::i64. Should we assert that?
		craig.topperUnsubmitted Done Reply Inline Actions This needs a MemOperand to be added. craig.topper: This needs a MemOperand to be added.
for (unsigned I = 0; I < Regs.size(); ++I) {		for (unsigned I = 0; I < Regs.size(); ++I) {
Ops.push_back(Regs[I]);		Ops.push_back(Regs[I]);
Ops.push_back(CurDAG.getTargetConstant(SubReg0 + I, DL, MVT::i32));		Ops.push_back(CurDAG.getTargetConstant(SubReg0 + I, DL, MVT::i32));
}		}
SDNode *N =		SDNode *N =
CurDAG.getMachineNode(TargetOpcode::REG_SEQUENCE, DL, MVT::Untyped, Ops);		CurDAG.getMachineNode(TargetOpcode::REG_SEQUENCE, DL, MVT::Untyped, Ops);
return SDValue(N, 0);		return SDValue(N, 0);
}		}
▲ Show 20 Lines • Show All 320 Lines • ▼ Show 20 Lines	case ISD::Constant: {
if (isUInt<16>(Imm) && isInt<12>(SignExtend64(Imm, 16)) &&		if (isUInt<16>(Imm) && isInt<12>(SignExtend64(Imm, 16)) &&
hasAllHUsers(Node))		hasAllHUsers(Node))
Imm = SignExtend64(Imm, 16);		Imm = SignExtend64(Imm, 16);
// If the upper 32-bits are not used try to convert this into a simm32 by		// If the upper 32-bits are not used try to convert this into a simm32 by
// sign extending bit 32.		// sign extending bit 32.
if (!isInt<32>(Imm) && isUInt<32>(Imm) && hasAllWUsers(Node))		if (!isInt<32>(Imm) && isUInt<32>(Imm) && hasAllWUsers(Node))
Imm = SignExtend64(Imm, 32);		Imm = SignExtend64(Imm, 32);

ReplaceNode(Node, selectImm(CurDAG, DL, Imm, *Subtarget));		ReplaceNode(Node, selectImm(CurDAG, DL, VT, Imm, *Subtarget));
return;		return;
}		}
		craig.topperUnsubmitted Done Reply Inline Actions Can we call this from inside selectImm instead of returning nullptr? selectImm only has 1 caller right now, but it has add other callers in the past. craig.topper: Can we call this from inside selectImm instead of returning nullptr? selectImm only has 1…
case ISD::FrameIndex: {		case ISD::FrameIndex: {
SDValue Imm = CurDAG->getTargetConstant(0, DL, XLenVT);		SDValue Imm = CurDAG->getTargetConstant(0, DL, XLenVT);
int FI = cast<FrameIndexSDNode>(Node)->getIndex();		int FI = cast<FrameIndexSDNode>(Node)->getIndex();
SDValue TFI = CurDAG->getTargetFrameIndex(FI, VT);		SDValue TFI = CurDAG->getTargetFrameIndex(FI, VT);
ReplaceNode(Node, CurDAG->getMachineNode(RISCV::ADDI, DL, VT, TFI, Imm));		ReplaceNode(Node, CurDAG->getMachineNode(RISCV::ADDI, DL, VT, TFI, Imm));
return;		return;
}		}
case ISD::SRL: {		case ISD::SRL: {
▲ Show 20 Lines • Show All 257 Lines • ▼ Show 20 Lines	if (ConstantShift > (XLen - (64 - countLeadingZeros(C1))))
break;		break;

uint64_t ShiftedC1 = C1 << ConstantShift;		uint64_t ShiftedC1 = C1 << ConstantShift;
// If this RV32, we need to sign extend the constant.		// If this RV32, we need to sign extend the constant.
if (XLen == 32)		if (XLen == 32)
ShiftedC1 = SignExtend64(ShiftedC1, 32);		ShiftedC1 = SignExtend64(ShiftedC1, 32);

// Create (mulhu (slli X, lzcnt(C2)), C1 << (XLen - lzcnt(C2))).		// Create (mulhu (slli X, lzcnt(C2)), C1 << (XLen - lzcnt(C2))).
SDNode Imm = selectImm(CurDAG, DL, ShiftedC1, Subtarget);		SDNode Imm = selectImm(CurDAG, DL, VT, ShiftedC1, Subtarget);
		craig.topperUnsubmitted Done Reply Inline Actions N1C does not contain the same constant as ShiftedC1. craig.topper: N1C does not contain the same constant as ShiftedC1.
SDNode *SLLI =		SDNode *SLLI =
CurDAG->getMachineNode(RISCV::SLLI, DL, VT, N0.getOperand(0),		CurDAG->getMachineNode(RISCV::SLLI, DL, VT, N0.getOperand(0),
CurDAG->getTargetConstant(LeadingZeros, DL, VT));		CurDAG->getTargetConstant(LeadingZeros, DL, VT));
SDNode *MULHU = CurDAG->getMachineNode(RISCV::MULHU, DL, VT,		SDNode *MULHU = CurDAG->getMachineNode(RISCV::MULHU, DL, VT,
SDValue(SLLI, 0), SDValue(Imm, 0));		SDValue(SLLI, 0), SDValue(Imm, 0));
ReplaceNode(Node, MULHU);		ReplaceNode(Node, MULHU);
return;		return;
}		}
▲ Show 20 Lines • Show All 1,261 Lines • Show Last 20 Lines

llvm/lib/Target/RISCV/RISCVISelLowering.h

Show First 20 Lines • Show All 456 Lines • ▼ Show 20 Lines	bool CanLowerReturn(CallingConv::ID CallConv, MachineFunction &MF,
const SmallVectorImpl<ISD::OutputArg> &Outs,		const SmallVectorImpl<ISD::OutputArg> &Outs,
LLVMContext &Context) const override;		LLVMContext &Context) const override;
SDValue LowerReturn(SDValue Chain, CallingConv::ID CallConv, bool IsVarArg,		SDValue LowerReturn(SDValue Chain, CallingConv::ID CallConv, bool IsVarArg,
const SmallVectorImpl<ISD::OutputArg> &Outs,		const SmallVectorImpl<ISD::OutputArg> &Outs,
const SmallVectorImpl<SDValue> &OutVals, const SDLoc &DL,		const SmallVectorImpl<SDValue> &OutVals, const SDLoc &DL,
SelectionDAG &DAG) const override;		SelectionDAG &DAG) const override;
SDValue LowerCall(TargetLowering::CallLoweringInfo &CLI,		SDValue LowerCall(TargetLowering::CallLoweringInfo &CLI,
SmallVectorImpl<SDValue> &InVals) const override;		SmallVectorImpl<SDValue> &InVals) const override;
		template <class NodeTy>
		SDValue getAddr(NodeTy *N, SelectionDAG &DAG, bool IsLocal = true) const;

bool shouldConvertConstantLoadToIntImm(const APInt &Imm,		bool shouldConvertConstantLoadToIntImm(const APInt &Imm,
Type *Ty) const override {		Type *Ty) const override {
return true;		return true;
}		}
bool mayBeEmittedAsTailCall(const CallInst *CI) const override;		bool mayBeEmittedAsTailCall(const CallInst *CI) const override;
bool shouldConsiderGEPOffsetSplit() const override { return true; }		bool shouldConsiderGEPOffsetSplit() const override { return true; }

▲ Show 20 Lines • Show All 66 Lines • ▼ Show 20 Lines	private:
void analyzeInputArgs(MachineFunction &MF, CCState &CCInfo,		void analyzeInputArgs(MachineFunction &MF, CCState &CCInfo,
const SmallVectorImpl<ISD::InputArg> &Ins, bool IsRet,		const SmallVectorImpl<ISD::InputArg> &Ins, bool IsRet,
RISCVCCAssignFn Fn) const;		RISCVCCAssignFn Fn) const;
void analyzeOutputArgs(MachineFunction &MF, CCState &CCInfo,		void analyzeOutputArgs(MachineFunction &MF, CCState &CCInfo,
const SmallVectorImpl<ISD::OutputArg> &Outs,		const SmallVectorImpl<ISD::OutputArg> &Outs,
bool IsRet, CallLoweringInfo *CLI,		bool IsRet, CallLoweringInfo *CLI,
RISCVCCAssignFn Fn) const;		RISCVCCAssignFn Fn) const;

template <class NodeTy>
SDValue getAddr(NodeTy *N, SelectionDAG &DAG, bool IsLocal = true) const;

SDValue getStaticTLSAddr(GlobalAddressSDNode *N, SelectionDAG &DAG,		SDValue getStaticTLSAddr(GlobalAddressSDNode *N, SelectionDAG &DAG,
bool UseGOT) const;		bool UseGOT) const;
SDValue getDynamicTLSAddr(GlobalAddressSDNode *N, SelectionDAG &DAG) const;		SDValue getDynamicTLSAddr(GlobalAddressSDNode *N, SelectionDAG &DAG) const;

SDValue lowerGlobalAddress(SDValue Op, SelectionDAG &DAG) const;		SDValue lowerGlobalAddress(SDValue Op, SelectionDAG &DAG) const;
SDValue lowerBlockAddress(SDValue Op, SelectionDAG &DAG) const;		SDValue lowerBlockAddress(SDValue Op, SelectionDAG &DAG) const;
SDValue lowerConstantPool(SDValue Op, SelectionDAG &DAG) const;		SDValue lowerConstantPool(SDValue Op, SelectionDAG &DAG) const;
SDValue lowerJumpTable(SDValue Op, SelectionDAG &DAG) const;		SDValue lowerJumpTable(SDValue Op, SelectionDAG &DAG) const;
▲ Show 20 Lines • Show All 109 Lines • Show Last 20 Lines

llvm/lib/Target/RISCV/RISCVSubtarget.h

Show First 20 Lines • Show All 151 Lines • ▼ Show 20 Lines	protected:
std::unique_ptr<RegisterBankInfo> RegBankInfo;		std::unique_ptr<RegisterBankInfo> RegBankInfo;

public:		public:
const CallLowering *getCallLowering() const override;		const CallLowering *getCallLowering() const override;
InstructionSelector *getInstructionSelector() const override;		InstructionSelector *getInstructionSelector() const override;
const LegalizerInfo *getLegalizerInfo() const override;		const LegalizerInfo *getLegalizerInfo() const override;
const RegisterBankInfo *getRegBankInfo() const override;		const RegisterBankInfo *getRegBankInfo() const override;

		bool useConstantPoolForLargeInts() const;

		// Maximum cost used for building integers, integers will be put into constant
		// pool if exceeded.
		unsigned getMaxBuildIntsCost() const;

// Return the known range for the bit length of RVV data registers. A value		// Return the known range for the bit length of RVV data registers. A value
// of 0 means nothing is known about that particular limit beyond what's		// of 0 means nothing is known about that particular limit beyond what's
// implied by the architecture.		// implied by the architecture.
unsigned getMaxRVVVectorSizeInBits() const;		unsigned getMaxRVVVectorSizeInBits() const;
unsigned getMinRVVVectorSizeInBits() const;		unsigned getMinRVVVectorSizeInBits() const;
unsigned getMaxLMULForFixedLengthVectors() const;		unsigned getMaxLMULForFixedLengthVectors() const;
unsigned getMaxELENForFixedLengthVectors() const;		unsigned getMaxELENForFixedLengthVectors() const;
bool useRVVForFixedLengthVectors() const;		bool useRVVForFixedLengthVectors() const;
};		};
} // End llvm namespace		} // End llvm namespace

#endif		#endif

llvm/lib/Target/RISCV/RISCVSubtarget.cpp

Show First 20 Lines • Show All 44 Lines • ▼ Show 20 Lines	cl::desc("The maximum LMUL value to use for fixed length vectors. "
"Fractional LMUL values are not supported."),		"Fractional LMUL values are not supported."),
cl::init(8), cl::Hidden);		cl::init(8), cl::Hidden);

static cl::opt<unsigned> RVVVectorELENMax(		static cl::opt<unsigned> RVVVectorELENMax(
"riscv-v-fixed-length-vector-elen-max",		"riscv-v-fixed-length-vector-elen-max",
cl::desc("The maximum ELEN value to use for fixed length vectors."),		cl::desc("The maximum ELEN value to use for fixed length vectors."),
cl::init(64), cl::Hidden);		cl::init(64), cl::Hidden);

		static cl::opt<bool> RISCVDisableUsingConstantPoolForLargeInts(
		craig.topperUnsubmitted Done Reply Inline Actions Make this a disable flag that defaults to 0. craig.topper: Make this a disable flag that defaults to 0.
		"riscv-disable-using-constant-pool-for-large-ints",
		cl::desc("Disable using constant pool for large integers."),
		cl::init(false), cl::Hidden);

		static cl::opt<unsigned> RISCVMaxBuildIntsCost(
		"riscv-max-build-ints-cost",
		cl::desc("The maximum cost used for building integers."), cl::init(0),
		cl::Hidden);

void RISCVSubtarget::anchor() {}		void RISCVSubtarget::anchor() {}

RISCVSubtarget &		RISCVSubtarget &
RISCVSubtarget::initializeSubtargetDependencies(const Triple &TT, StringRef CPU,		RISCVSubtarget::initializeSubtargetDependencies(const Triple &TT, StringRef CPU,
StringRef TuneCPU, StringRef FS,		StringRef TuneCPU, StringRef FS,
StringRef ABIName) {		StringRef ABIName) {
// Determine default and user-specified characteristics		// Determine default and user-specified characteristics
bool Is64Bit = TT.isArch64Bit();		bool Is64Bit = TT.isArch64Bit();
▲ Show 20 Lines • Show All 44 Lines • ▼ Show 20 Lines
const LegalizerInfo *RISCVSubtarget::getLegalizerInfo() const {		const LegalizerInfo *RISCVSubtarget::getLegalizerInfo() const {
return Legalizer.get();		return Legalizer.get();
}		}

const RegisterBankInfo *RISCVSubtarget::getRegBankInfo() const {		const RegisterBankInfo *RISCVSubtarget::getRegBankInfo() const {
return RegBankInfo.get();		return RegBankInfo.get();
}		}

		bool RISCVSubtarget::useConstantPoolForLargeInts() const {
		zixuan-wuUnsubmitted Done Reply Inline Actions Since we can get schedmodel and load latency, is there still need that such API to adapt different subtarget cost? Other body can give some suggestion to talk. zixuan-wu: Since we can get schedmodel and load latency, is there still need that such API to adapt…
		craig.topperUnsubmitted Done Reply Inline Actions I'm not sure Promote is clear term in this context. Something like `useConstantPoolForLargeInts` might be better? craig.topper: I'm not sure Promote is clear term in this context. Something like…
		return !RISCVDisableUsingConstantPoolForLargeInts;
		craig.topperUnsubmitted Done Reply Inline Actions LoadLatency is going to very for different CPUs so saying LoadLatency+1 and then having a hardcoded constant doesn't make sense. I'm not opposed to the hard coded constant, it matches what gcc uses. I just don't like the comment. craig.topper: LoadLatency is going to very for different CPUs so saying LoadLatency+1 and then having a…
		}

		unsigned RISCVSubtarget::getMaxBuildIntsCost() const {
		// Loading integer from constant pool needs two instructions (the reason why
		// the minimum cost is 2): an address calculation instruction and a load
		// instruction. Usually, address calculation and instructions used for
		// building integers (addi, slli, etc.) can be done in one cycle, so here we
		// set the default cost to (LoadLatency + 1) if no threshold is provided.
		return RISCVMaxBuildIntsCost == 0
		? getSchedModel().LoadLatency + 1
		: std::max<unsigned>(2, RISCVMaxBuildIntsCost);
		}

unsigned RISCVSubtarget::getMaxRVVVectorSizeInBits() const {		unsigned RISCVSubtarget::getMaxRVVVectorSizeInBits() const {
assert(hasVInstructions() &&		assert(hasVInstructions() &&
"Tried to get vector length without Zve or V extension support!");		"Tried to get vector length without Zve or V extension support!");
if (RVVVectorBitsMax == 0)		if (RVVVectorBitsMax == 0)
return 0;		return 0;
assert(RVVVectorBitsMax >= 128 && RVVVectorBitsMax <= 65536 &&		assert(RVVVectorBitsMax >= 128 && RVVVectorBitsMax <= 65536 &&
isPowerOf2_32(RVVVectorBitsMax) &&		isPowerOf2_32(RVVVectorBitsMax) &&
"V extension requires vector length to be in the range of 128 to "		"V extension requires vector length to be in the range of 128 to "
▲ Show 20 Lines • Show All 47 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/bswap-ctlz-cttz-ctpop.ll

	Show First 20 Lines • Show All 507 Lines • ▼ Show 20 Lines
	; RV64I: # %bb.0:			; RV64I: # %bb.0:
	; RV64I-NEXT: beqz a0, .LBB7_2			; RV64I-NEXT: beqz a0, .LBB7_2
	; RV64I-NEXT: # %bb.1: # %cond.false			; RV64I-NEXT: # %bb.1: # %cond.false
	; RV64I-NEXT: addi sp, sp, -16			; RV64I-NEXT: addi sp, sp, -16
	; RV64I-NEXT: sd ra, 8(sp) # 8-byte Folded Spill			; RV64I-NEXT: sd ra, 8(sp) # 8-byte Folded Spill
	; RV64I-NEXT: addi a1, a0, -1			; RV64I-NEXT: addi a1, a0, -1
	; RV64I-NEXT: not a0, a0			; RV64I-NEXT: not a0, a0
	; RV64I-NEXT: and a0, a0, a1			; RV64I-NEXT: and a0, a0, a1
	; RV64I-NEXT: srli a1, a0, 1			; RV64I-NEXT: lui a1, %hi(.LCPI7_0)
	; RV64I-NEXT: lui a2, 21845			; RV64I-NEXT: ld a1, %lo(.LCPI7_0)(a1)
	; RV64I-NEXT: addiw a2, a2, 1365			; RV64I-NEXT: lui a2, %hi(.LCPI7_1)
	; RV64I-NEXT: slli a2, a2, 12			; RV64I-NEXT: ld a2, %lo(.LCPI7_1)(a2)
	; RV64I-NEXT: addi a2, a2, 1365			; RV64I-NEXT: srli a3, a0, 1
	; RV64I-NEXT: slli a2, a2, 12			; RV64I-NEXT: and a1, a3, a1
	; RV64I-NEXT: addi a2, a2, 1365
	; RV64I-NEXT: slli a2, a2, 12
	; RV64I-NEXT: addi a2, a2, 1365
	; RV64I-NEXT: and a1, a1, a2
	; RV64I-NEXT: sub a0, a0, a1			; RV64I-NEXT: sub a0, a0, a1
	; RV64I-NEXT: lui a1, 13107			; RV64I-NEXT: and a1, a0, a2
	; RV64I-NEXT: addiw a1, a1, 819
	; RV64I-NEXT: slli a1, a1, 12
	; RV64I-NEXT: addi a1, a1, 819
	; RV64I-NEXT: slli a1, a1, 12
	; RV64I-NEXT: addi a1, a1, 819
	; RV64I-NEXT: slli a1, a1, 12
	; RV64I-NEXT: addi a1, a1, 819
	; RV64I-NEXT: and a2, a0, a1
	; RV64I-NEXT: srli a0, a0, 2			; RV64I-NEXT: srli a0, a0, 2
	; RV64I-NEXT: and a0, a0, a1			; RV64I-NEXT: and a0, a0, a2
	; RV64I-NEXT: add a0, a2, a0			; RV64I-NEXT: lui a2, %hi(.LCPI7_2)
				; RV64I-NEXT: ld a2, %lo(.LCPI7_2)(a2)
				; RV64I-NEXT: add a0, a1, a0
	; RV64I-NEXT: srli a1, a0, 4			; RV64I-NEXT: srli a1, a0, 4
	; RV64I-NEXT: add a0, a0, a1			; RV64I-NEXT: add a0, a0, a1
	; RV64I-NEXT: lui a1, 3855			; RV64I-NEXT: and a0, a0, a2
	; RV64I-NEXT: addiw a1, a1, 241			; RV64I-NEXT: lui a1, %hi(.LCPI7_3)
	; RV64I-NEXT: slli a1, a1, 12			; RV64I-NEXT: ld a1, %lo(.LCPI7_3)(a1)
	; RV64I-NEXT: addi a1, a1, -241
	; RV64I-NEXT: slli a1, a1, 12
	; RV64I-NEXT: addi a1, a1, 241
	; RV64I-NEXT: slli a1, a1, 12
	; RV64I-NEXT: addi a1, a1, -241
	; RV64I-NEXT: and a0, a0, a1
	; RV64I-NEXT: lui a1, 4112
	; RV64I-NEXT: addiw a1, a1, 257
	; RV64I-NEXT: slli a1, a1, 16
	; RV64I-NEXT: addi a1, a1, 257
	; RV64I-NEXT: slli a1, a1, 16
	; RV64I-NEXT: addi a1, a1, 257
	; RV64I-NEXT: call __muldi3@plt			; RV64I-NEXT: call __muldi3@plt
	; RV64I-NEXT: srli a0, a0, 56			; RV64I-NEXT: srli a0, a0, 56
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	; RV64I-NEXT: .LBB7_2:			; RV64I-NEXT: .LBB7_2:
	; RV64I-NEXT: li a0, 64			; RV64I-NEXT: li a0, 64
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	▲ Show 20 Lines • Show All 242 Lines • ▼ Show 20 Lines
	;			;
	; RV64I-LABEL: test_cttz_i64_zero_undef:			; RV64I-LABEL: test_cttz_i64_zero_undef:
	; RV64I: # %bb.0:			; RV64I: # %bb.0:
	; RV64I-NEXT: addi sp, sp, -16			; RV64I-NEXT: addi sp, sp, -16
	; RV64I-NEXT: sd ra, 8(sp) # 8-byte Folded Spill			; RV64I-NEXT: sd ra, 8(sp) # 8-byte Folded Spill
	; RV64I-NEXT: addi a1, a0, -1			; RV64I-NEXT: addi a1, a0, -1
	; RV64I-NEXT: not a0, a0			; RV64I-NEXT: not a0, a0
	; RV64I-NEXT: and a0, a0, a1			; RV64I-NEXT: and a0, a0, a1
	; RV64I-NEXT: srli a1, a0, 1			; RV64I-NEXT: lui a1, %hi(.LCPI11_0)
	; RV64I-NEXT: lui a2, 21845			; RV64I-NEXT: ld a1, %lo(.LCPI11_0)(a1)
	; RV64I-NEXT: addiw a2, a2, 1365			; RV64I-NEXT: lui a2, %hi(.LCPI11_1)
	; RV64I-NEXT: slli a2, a2, 12			; RV64I-NEXT: ld a2, %lo(.LCPI11_1)(a2)
	; RV64I-NEXT: addi a2, a2, 1365			; RV64I-NEXT: srli a3, a0, 1
	; RV64I-NEXT: slli a2, a2, 12			; RV64I-NEXT: and a1, a3, a1
	; RV64I-NEXT: addi a2, a2, 1365
	; RV64I-NEXT: slli a2, a2, 12
	; RV64I-NEXT: addi a2, a2, 1365
	; RV64I-NEXT: and a1, a1, a2
	; RV64I-NEXT: sub a0, a0, a1			; RV64I-NEXT: sub a0, a0, a1
	; RV64I-NEXT: lui a1, 13107			; RV64I-NEXT: and a1, a0, a2
	; RV64I-NEXT: addiw a1, a1, 819
	; RV64I-NEXT: slli a1, a1, 12
	; RV64I-NEXT: addi a1, a1, 819
	; RV64I-NEXT: slli a1, a1, 12
	; RV64I-NEXT: addi a1, a1, 819
	; RV64I-NEXT: slli a1, a1, 12
	; RV64I-NEXT: addi a1, a1, 819
	; RV64I-NEXT: and a2, a0, a1
	; RV64I-NEXT: srli a0, a0, 2			; RV64I-NEXT: srli a0, a0, 2
	; RV64I-NEXT: and a0, a0, a1			; RV64I-NEXT: and a0, a0, a2
	; RV64I-NEXT: add a0, a2, a0			; RV64I-NEXT: lui a2, %hi(.LCPI11_2)
				; RV64I-NEXT: ld a2, %lo(.LCPI11_2)(a2)
				; RV64I-NEXT: add a0, a1, a0
	; RV64I-NEXT: srli a1, a0, 4			; RV64I-NEXT: srli a1, a0, 4
	; RV64I-NEXT: add a0, a0, a1			; RV64I-NEXT: add a0, a0, a1
	; RV64I-NEXT: lui a1, 3855			; RV64I-NEXT: and a0, a0, a2
	; RV64I-NEXT: addiw a1, a1, 241			; RV64I-NEXT: lui a1, %hi(.LCPI11_3)
	; RV64I-NEXT: slli a1, a1, 12			; RV64I-NEXT: ld a1, %lo(.LCPI11_3)(a1)
	; RV64I-NEXT: addi a1, a1, -241
	; RV64I-NEXT: slli a1, a1, 12
	; RV64I-NEXT: addi a1, a1, 241
	; RV64I-NEXT: slli a1, a1, 12
	; RV64I-NEXT: addi a1, a1, -241
	; RV64I-NEXT: and a0, a0, a1
	; RV64I-NEXT: lui a1, 4112
	; RV64I-NEXT: addiw a1, a1, 257
	; RV64I-NEXT: slli a1, a1, 16
	; RV64I-NEXT: addi a1, a1, 257
	; RV64I-NEXT: slli a1, a1, 16
	; RV64I-NEXT: addi a1, a1, 257
	; RV64I-NEXT: call __muldi3@plt			; RV64I-NEXT: call __muldi3@plt
	; RV64I-NEXT: srli a0, a0, 56			; RV64I-NEXT: srli a0, a0, 56
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	%tmp = call i64 @llvm.cttz.i64(i64 %a, i1 true)			%tmp = call i64 @llvm.cttz.i64(i64 %a, i1 true)
	ret i64 %tmp			ret i64 %tmp
	}			}
	▲ Show 20 Lines • Show All 115 Lines • ▼ Show 20 Lines
	; RV32I-NEXT: lw s5, 4(sp) # 4-byte Folded Reload			; RV32I-NEXT: lw s5, 4(sp) # 4-byte Folded Reload
	; RV32I-NEXT: addi sp, sp, 32			; RV32I-NEXT: addi sp, sp, 32
	; RV32I-NEXT: ret			; RV32I-NEXT: ret
	;			;
	; RV64I-LABEL: test_ctpop_i64:			; RV64I-LABEL: test_ctpop_i64:
	; RV64I: # %bb.0:			; RV64I: # %bb.0:
	; RV64I-NEXT: addi sp, sp, -16			; RV64I-NEXT: addi sp, sp, -16
	; RV64I-NEXT: sd ra, 8(sp) # 8-byte Folded Spill			; RV64I-NEXT: sd ra, 8(sp) # 8-byte Folded Spill
	; RV64I-NEXT: srli a1, a0, 1			; RV64I-NEXT: lui a1, %hi(.LCPI13_0)
	; RV64I-NEXT: lui a2, 21845			; RV64I-NEXT: ld a1, %lo(.LCPI13_0)(a1)
	; RV64I-NEXT: addiw a2, a2, 1365			; RV64I-NEXT: lui a2, %hi(.LCPI13_1)
	; RV64I-NEXT: slli a2, a2, 12			; RV64I-NEXT: ld a2, %lo(.LCPI13_1)(a2)
	; RV64I-NEXT: addi a2, a2, 1365			; RV64I-NEXT: srli a3, a0, 1
	; RV64I-NEXT: slli a2, a2, 12			; RV64I-NEXT: and a1, a3, a1
	; RV64I-NEXT: addi a2, a2, 1365
	; RV64I-NEXT: slli a2, a2, 12
	; RV64I-NEXT: addi a2, a2, 1365
	; RV64I-NEXT: and a1, a1, a2
	; RV64I-NEXT: sub a0, a0, a1			; RV64I-NEXT: sub a0, a0, a1
	; RV64I-NEXT: lui a1, 13107			; RV64I-NEXT: and a1, a0, a2
	; RV64I-NEXT: addiw a1, a1, 819
	; RV64I-NEXT: slli a1, a1, 12
	; RV64I-NEXT: addi a1, a1, 819
	; RV64I-NEXT: slli a1, a1, 12
	; RV64I-NEXT: addi a1, a1, 819
	; RV64I-NEXT: slli a1, a1, 12
	; RV64I-NEXT: addi a1, a1, 819
	; RV64I-NEXT: and a2, a0, a1
	; RV64I-NEXT: srli a0, a0, 2			; RV64I-NEXT: srli a0, a0, 2
	; RV64I-NEXT: and a0, a0, a1			; RV64I-NEXT: and a0, a0, a2
	; RV64I-NEXT: add a0, a2, a0			; RV64I-NEXT: lui a2, %hi(.LCPI13_2)
				; RV64I-NEXT: ld a2, %lo(.LCPI13_2)(a2)
				; RV64I-NEXT: add a0, a1, a0
	; RV64I-NEXT: srli a1, a0, 4			; RV64I-NEXT: srli a1, a0, 4
	; RV64I-NEXT: add a0, a0, a1			; RV64I-NEXT: add a0, a0, a1
	; RV64I-NEXT: lui a1, 3855			; RV64I-NEXT: and a0, a0, a2
	; RV64I-NEXT: addiw a1, a1, 241			; RV64I-NEXT: lui a1, %hi(.LCPI13_3)
	; RV64I-NEXT: slli a1, a1, 12			; RV64I-NEXT: ld a1, %lo(.LCPI13_3)(a1)
	; RV64I-NEXT: addi a1, a1, -241
	; RV64I-NEXT: slli a1, a1, 12
	; RV64I-NEXT: addi a1, a1, 241
	; RV64I-NEXT: slli a1, a1, 12
	; RV64I-NEXT: addi a1, a1, -241
	; RV64I-NEXT: and a0, a0, a1
	; RV64I-NEXT: lui a1, 4112
	; RV64I-NEXT: addiw a1, a1, 257
	; RV64I-NEXT: slli a1, a1, 16
	; RV64I-NEXT: addi a1, a1, 257
	; RV64I-NEXT: slli a1, a1, 16
	; RV64I-NEXT: addi a1, a1, 257
	; RV64I-NEXT: call __muldi3@plt			; RV64I-NEXT: call __muldi3@plt
	; RV64I-NEXT: srli a0, a0, 56			; RV64I-NEXT: srli a0, a0, 56
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	%1 = call i64 @llvm.ctpop.i64(i64 %a)			%1 = call i64 @llvm.ctpop.i64(i64 %a)
	ret i64 %1			ret i64 %1
	}			}
	▲ Show 20 Lines • Show All 76 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/div-by-constant.ll

	Show First 20 Lines • Show All 94 Lines • ▼ Show 20 Lines
	; RV32-NEXT: li a3, 0			; RV32-NEXT: li a3, 0
	; RV32-NEXT: call __udivdi3@plt			; RV32-NEXT: call __udivdi3@plt
	; RV32-NEXT: lw ra, 12(sp) # 4-byte Folded Reload			; RV32-NEXT: lw ra, 12(sp) # 4-byte Folded Reload
	; RV32-NEXT: addi sp, sp, 16			; RV32-NEXT: addi sp, sp, 16
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: udiv64_constant_no_add:			; RV64-LABEL: udiv64_constant_no_add:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: lui a1, 1035469			; RV64-NEXT: lui a1, %hi(.LCPI2_0)
	; RV64-NEXT: addiw a1, a1, -819			; RV64-NEXT: ld a1, %lo(.LCPI2_0)(a1)
	; RV64-NEXT: slli a1, a1, 12
	; RV64-NEXT: addi a1, a1, -819
	; RV64-NEXT: slli a1, a1, 12
	; RV64-NEXT: addi a1, a1, -819
	; RV64-NEXT: slli a1, a1, 12
	; RV64-NEXT: addi a1, a1, -819
	; RV64-NEXT: mulhu a0, a0, a1			; RV64-NEXT: mulhu a0, a0, a1
	; RV64-NEXT: srli a0, a0, 2			; RV64-NEXT: srli a0, a0, 2
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%1 = udiv i64 %a, 5			%1 = udiv i64 %a, 5
	ret i64 %1			ret i64 %1
	}			}

	define i64 @udiv64_constant_add(i64 %a) nounwind {			define i64 @udiv64_constant_add(i64 %a) nounwind {
	; RV32-LABEL: udiv64_constant_add:			; RV32-LABEL: udiv64_constant_add:
	; RV32: # %bb.0:			; RV32: # %bb.0:
	; RV32-NEXT: addi sp, sp, -16			; RV32-NEXT: addi sp, sp, -16
	; RV32-NEXT: sw ra, 12(sp) # 4-byte Folded Spill			; RV32-NEXT: sw ra, 12(sp) # 4-byte Folded Spill
	; RV32-NEXT: li a2, 7			; RV32-NEXT: li a2, 7
	; RV32-NEXT: li a3, 0			; RV32-NEXT: li a3, 0
	; RV32-NEXT: call __udivdi3@plt			; RV32-NEXT: call __udivdi3@plt
	; RV32-NEXT: lw ra, 12(sp) # 4-byte Folded Reload			; RV32-NEXT: lw ra, 12(sp) # 4-byte Folded Reload
	; RV32-NEXT: addi sp, sp, 16			; RV32-NEXT: addi sp, sp, 16
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: udiv64_constant_add:			; RV64-LABEL: udiv64_constant_add:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: lui a1, 4681			; RV64-NEXT: lui a1, %hi(.LCPI3_0)
	; RV64-NEXT: addiw a1, a1, 585			; RV64-NEXT: ld a1, %lo(.LCPI3_0)(a1)
	; RV64-NEXT: slli a1, a1, 12
	; RV64-NEXT: addi a1, a1, 585
	; RV64-NEXT: slli a1, a1, 12
	; RV64-NEXT: addi a1, a1, 585
	; RV64-NEXT: slli a1, a1, 13
	; RV64-NEXT: addi a1, a1, 1171
	; RV64-NEXT: mulhu a1, a0, a1			; RV64-NEXT: mulhu a1, a0, a1
	; RV64-NEXT: sub a0, a0, a1			; RV64-NEXT: sub a0, a0, a1
	; RV64-NEXT: srli a0, a0, 1			; RV64-NEXT: srli a0, a0, 1
	; RV64-NEXT: add a0, a0, a1			; RV64-NEXT: add a0, a0, a1
	; RV64-NEXT: srli a0, a0, 2			; RV64-NEXT: srli a0, a0, 2
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%1 = udiv i64 %a, 7			%1 = udiv i64 %a, 7
	ret i64 %1			ret i64 %1
	▲ Show 20 Lines • Show All 290 Lines • ▼ Show 20 Lines
	; RV32-NEXT: li a3, 0			; RV32-NEXT: li a3, 0
	; RV32-NEXT: call __divdi3@plt			; RV32-NEXT: call __divdi3@plt
	; RV32-NEXT: lw ra, 12(sp) # 4-byte Folded Reload			; RV32-NEXT: lw ra, 12(sp) # 4-byte Folded Reload
	; RV32-NEXT: addi sp, sp, 16			; RV32-NEXT: addi sp, sp, 16
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: sdiv64_constant_no_srai:			; RV64-LABEL: sdiv64_constant_no_srai:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: lui a1, 21845			; RV64-NEXT: lui a1, %hi(.LCPI12_0)
	; RV64-NEXT: addiw a1, a1, 1365			; RV64-NEXT: ld a1, %lo(.LCPI12_0)(a1)
	; RV64-NEXT: slli a1, a1, 12
	; RV64-NEXT: addi a1, a1, 1365
	; RV64-NEXT: slli a1, a1, 12
	; RV64-NEXT: addi a1, a1, 1365
	; RV64-NEXT: slli a1, a1, 12
	; RV64-NEXT: addi a1, a1, 1366
	; RV64-NEXT: mulh a0, a0, a1			; RV64-NEXT: mulh a0, a0, a1
	; RV64-NEXT: srli a1, a0, 63			; RV64-NEXT: srli a1, a0, 63
	; RV64-NEXT: add a0, a0, a1			; RV64-NEXT: add a0, a0, a1
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%1 = sdiv i64 %a, 3			%1 = sdiv i64 %a, 3
	ret i64 %1			ret i64 %1
	}			}

	define i64 @sdiv64_constant_srai(i64 %a) nounwind {			define i64 @sdiv64_constant_srai(i64 %a) nounwind {
	; RV32-LABEL: sdiv64_constant_srai:			; RV32-LABEL: sdiv64_constant_srai:
	; RV32: # %bb.0:			; RV32: # %bb.0:
	; RV32-NEXT: addi sp, sp, -16			; RV32-NEXT: addi sp, sp, -16
	; RV32-NEXT: sw ra, 12(sp) # 4-byte Folded Spill			; RV32-NEXT: sw ra, 12(sp) # 4-byte Folded Spill
	; RV32-NEXT: li a2, 5			; RV32-NEXT: li a2, 5
	; RV32-NEXT: li a3, 0			; RV32-NEXT: li a3, 0
	; RV32-NEXT: call __divdi3@plt			; RV32-NEXT: call __divdi3@plt
	; RV32-NEXT: lw ra, 12(sp) # 4-byte Folded Reload			; RV32-NEXT: lw ra, 12(sp) # 4-byte Folded Reload
	; RV32-NEXT: addi sp, sp, 16			; RV32-NEXT: addi sp, sp, 16
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: sdiv64_constant_srai:			; RV64-LABEL: sdiv64_constant_srai:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: lui a1, 13107			; RV64-NEXT: lui a1, %hi(.LCPI13_0)
	; RV64-NEXT: addiw a1, a1, 819			; RV64-NEXT: ld a1, %lo(.LCPI13_0)(a1)
	; RV64-NEXT: slli a1, a1, 12
	; RV64-NEXT: addi a1, a1, 819
	; RV64-NEXT: slli a1, a1, 12
	; RV64-NEXT: addi a1, a1, 819
	; RV64-NEXT: slli a1, a1, 13
	; RV64-NEXT: addi a1, a1, 1639
	; RV64-NEXT: mulh a0, a0, a1			; RV64-NEXT: mulh a0, a0, a1
	; RV64-NEXT: srli a1, a0, 63			; RV64-NEXT: srli a1, a0, 63
	; RV64-NEXT: srai a0, a0, 1			; RV64-NEXT: srai a0, a0, 1
	; RV64-NEXT: add a0, a0, a1			; RV64-NEXT: add a0, a0, a1
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%1 = sdiv i64 %a, 5			%1 = sdiv i64 %a, 5
	ret i64 %1			ret i64 %1
	}			}

	define i64 @sdiv64_constant_add_srai(i64 %a) nounwind {			define i64 @sdiv64_constant_add_srai(i64 %a) nounwind {
	; RV32-LABEL: sdiv64_constant_add_srai:			; RV32-LABEL: sdiv64_constant_add_srai:
	; RV32: # %bb.0:			; RV32: # %bb.0:
	; RV32-NEXT: addi sp, sp, -16			; RV32-NEXT: addi sp, sp, -16
	; RV32-NEXT: sw ra, 12(sp) # 4-byte Folded Spill			; RV32-NEXT: sw ra, 12(sp) # 4-byte Folded Spill
	; RV32-NEXT: li a2, 15			; RV32-NEXT: li a2, 15
	; RV32-NEXT: li a3, 0			; RV32-NEXT: li a3, 0
	; RV32-NEXT: call __divdi3@plt			; RV32-NEXT: call __divdi3@plt
	; RV32-NEXT: lw ra, 12(sp) # 4-byte Folded Reload			; RV32-NEXT: lw ra, 12(sp) # 4-byte Folded Reload
	; RV32-NEXT: addi sp, sp, 16			; RV32-NEXT: addi sp, sp, 16
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: sdiv64_constant_add_srai:			; RV64-LABEL: sdiv64_constant_add_srai:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: lui a1, 1017993			; RV64-NEXT: lui a1, %hi(.LCPI14_0)
	; RV64-NEXT: addiw a1, a1, -1911			; RV64-NEXT: ld a1, %lo(.LCPI14_0)(a1)
	; RV64-NEXT: slli a1, a1, 12
	; RV64-NEXT: addi a1, a1, -1911
	; RV64-NEXT: slli a1, a1, 12
	; RV64-NEXT: addi a1, a1, -1911
	; RV64-NEXT: slli a1, a1, 12
	; RV64-NEXT: addi a1, a1, -1911
	; RV64-NEXT: mulh a1, a0, a1			; RV64-NEXT: mulh a1, a0, a1
	; RV64-NEXT: add a0, a1, a0			; RV64-NEXT: add a0, a1, a0
	; RV64-NEXT: srli a1, a0, 63			; RV64-NEXT: srli a1, a0, 63
	; RV64-NEXT: srai a0, a0, 3			; RV64-NEXT: srai a0, a0, 3
	; RV64-NEXT: add a0, a0, a1			; RV64-NEXT: add a0, a0, a1
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%1 = sdiv i64 %a, 15			%1 = sdiv i64 %a, 15
	ret i64 %1			ret i64 %1
	}			}

	define i64 @sdiv64_constant_sub_srai(i64 %a) nounwind {			define i64 @sdiv64_constant_sub_srai(i64 %a) nounwind {
	; RV32-LABEL: sdiv64_constant_sub_srai:			; RV32-LABEL: sdiv64_constant_sub_srai:
	; RV32: # %bb.0:			; RV32: # %bb.0:
	; RV32-NEXT: addi sp, sp, -16			; RV32-NEXT: addi sp, sp, -16
	; RV32-NEXT: sw ra, 12(sp) # 4-byte Folded Spill			; RV32-NEXT: sw ra, 12(sp) # 4-byte Folded Spill
	; RV32-NEXT: li a2, -3			; RV32-NEXT: li a2, -3
	; RV32-NEXT: li a3, -1			; RV32-NEXT: li a3, -1
	; RV32-NEXT: call __divdi3@plt			; RV32-NEXT: call __divdi3@plt
	; RV32-NEXT: lw ra, 12(sp) # 4-byte Folded Reload			; RV32-NEXT: lw ra, 12(sp) # 4-byte Folded Reload
	; RV32-NEXT: addi sp, sp, 16			; RV32-NEXT: addi sp, sp, 16
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: sdiv64_constant_sub_srai:			; RV64-LABEL: sdiv64_constant_sub_srai:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: lui a1, 21845			; RV64-NEXT: lui a1, %hi(.LCPI15_0)
	; RV64-NEXT: addiw a1, a1, 1365			; RV64-NEXT: ld a1, %lo(.LCPI15_0)(a1)
	; RV64-NEXT: slli a1, a1, 12
	; RV64-NEXT: addi a1, a1, 1365
	; RV64-NEXT: slli a1, a1, 12
	; RV64-NEXT: addi a1, a1, 1365
	; RV64-NEXT: slli a1, a1, 12
	; RV64-NEXT: addi a1, a1, 1365
	; RV64-NEXT: mulh a1, a0, a1			; RV64-NEXT: mulh a1, a0, a1
	; RV64-NEXT: sub a0, a1, a0			; RV64-NEXT: sub a0, a1, a0
	; RV64-NEXT: srli a1, a0, 63			; RV64-NEXT: srli a1, a0, 63
	; RV64-NEXT: srai a0, a0, 1			; RV64-NEXT: srai a0, a0, 1
	; RV64-NEXT: add a0, a0, a1			; RV64-NEXT: add a0, a0, a1
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%1 = sdiv i64 %a, -3			%1 = sdiv i64 %a, -3
	ret i64 %1			ret i64 %1
	▲ Show 20 Lines • Show All 461 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/div.ll

	Show First 20 Lines • Show All 216 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: li a1, 5			; RV64I-NEXT: li a1, 5
	; RV64I-NEXT: call __udivdi3@plt			; RV64I-NEXT: call __udivdi3@plt
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IM-LABEL: udiv64_constant:			; RV64IM-LABEL: udiv64_constant:
	; RV64IM: # %bb.0:			; RV64IM: # %bb.0:
	; RV64IM-NEXT: lui a1, 1035469			; RV64IM-NEXT: lui a1, %hi(.LCPI5_0)
	; RV64IM-NEXT: addiw a1, a1, -819			; RV64IM-NEXT: ld a1, %lo(.LCPI5_0)(a1)
	; RV64IM-NEXT: slli a1, a1, 12
	; RV64IM-NEXT: addi a1, a1, -819
	; RV64IM-NEXT: slli a1, a1, 12
	; RV64IM-NEXT: addi a1, a1, -819
	; RV64IM-NEXT: slli a1, a1, 12
	; RV64IM-NEXT: addi a1, a1, -819
	; RV64IM-NEXT: mulhu a0, a0, a1			; RV64IM-NEXT: mulhu a0, a0, a1
	; RV64IM-NEXT: srli a0, a0, 2			; RV64IM-NEXT: srli a0, a0, 2
	; RV64IM-NEXT: ret			; RV64IM-NEXT: ret
	%1 = udiv i64 %a, 5			%1 = udiv i64 %a, 5
	ret i64 %1			ret i64 %1
	}			}

	define i64 @udiv64_constant_lhs(i64 %a) nounwind {			define i64 @udiv64_constant_lhs(i64 %a) nounwind {
	▲ Show 20 Lines • Show All 620 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: li a1, 5			; RV64I-NEXT: li a1, 5
	; RV64I-NEXT: call __divdi3@plt			; RV64I-NEXT: call __divdi3@plt
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IM-LABEL: sdiv64_constant:			; RV64IM-LABEL: sdiv64_constant:
	; RV64IM: # %bb.0:			; RV64IM: # %bb.0:
	; RV64IM-NEXT: lui a1, 13107			; RV64IM-NEXT: lui a1, %hi(.LCPI21_0)
	; RV64IM-NEXT: addiw a1, a1, 819			; RV64IM-NEXT: ld a1, %lo(.LCPI21_0)(a1)
	; RV64IM-NEXT: slli a1, a1, 12
	; RV64IM-NEXT: addi a1, a1, 819
	; RV64IM-NEXT: slli a1, a1, 12
	; RV64IM-NEXT: addi a1, a1, 819
	; RV64IM-NEXT: slli a1, a1, 13
	; RV64IM-NEXT: addi a1, a1, 1639
	; RV64IM-NEXT: mulh a0, a0, a1			; RV64IM-NEXT: mulh a0, a0, a1
	; RV64IM-NEXT: srli a1, a0, 63			; RV64IM-NEXT: srli a1, a0, 63
	; RV64IM-NEXT: srai a0, a0, 1			; RV64IM-NEXT: srai a0, a0, 1
	; RV64IM-NEXT: add a0, a0, a1			; RV64IM-NEXT: add a0, a0, a1
	; RV64IM-NEXT: ret			; RV64IM-NEXT: ret
	%1 = sdiv i64 %a, 5			%1 = sdiv i64 %a, 5
	ret i64 %1			ret i64 %1
	}			}
	▲ Show 20 Lines • Show All 482 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/double-imm.ll

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: llc -mtriple=riscv32 -mattr=+d -verify-machineinstrs < %s \			; RUN: llc -mtriple=riscv32 -mattr=+d -verify-machineinstrs < %s \
	; RUN: \| FileCheck -check-prefix=RV32IFD %s			; RUN: \| FileCheck -check-prefix=RV32IFD %s
	; RUN: llc -mtriple=riscv64 -mattr=+d -verify-machineinstrs < %s \			; RUN: llc -mtriple=riscv64 -mattr=+d -verify-machineinstrs < %s \
	; RUN: \| FileCheck -check-prefix=RV64IFD %s			; RUN: \| FileCheck -check-prefix=RV64IFD %s

	define double @double_imm() nounwind {			define double @double_imm() nounwind {
	; TODO: Should probably prefer fld or ld on RV64 rather than materialising an
	; expensive constant.
	;
	; RV32IFD-LABEL: double_imm:			; RV32IFD-LABEL: double_imm:
				craig.topperUnsubmitted Done Reply Inline Actions Seems like this TODO is addressed by this patch? craig.topper: Seems like this TODO is addressed by this patch?
	; RV32IFD: # %bb.0:			; RV32IFD: # %bb.0:
	; RV32IFD-NEXT: lui a0, 345155			; RV32IFD-NEXT: lui a0, 345155
	; RV32IFD-NEXT: addi a0, a0, -744			; RV32IFD-NEXT: addi a0, a0, -744
	; RV32IFD-NEXT: lui a1, 262290			; RV32IFD-NEXT: lui a1, 262290
	; RV32IFD-NEXT: addi a1, a1, 507			; RV32IFD-NEXT: addi a1, a1, 507
	; RV32IFD-NEXT: ret			; RV32IFD-NEXT: ret
	;			;
	; RV64IFD-LABEL: double_imm:			; RV64IFD-LABEL: double_imm:
	; RV64IFD: # %bb.0:			; RV64IFD: # %bb.0:
	; RV64IFD-NEXT: lui a0, 512			; RV64IFD-NEXT: lui a0, %hi(.LCPI0_0)
	; RV64IFD-NEXT: addiw a0, a0, 1169			; RV64IFD-NEXT: ld a0, %lo(.LCPI0_0)(a0)
	; RV64IFD-NEXT: slli a0, a0, 15
	; RV64IFD-NEXT: addi a0, a0, -299
	; RV64IFD-NEXT: slli a0, a0, 14
	; RV64IFD-NEXT: addi a0, a0, 1091
	; RV64IFD-NEXT: slli a0, a0, 12
	; RV64IFD-NEXT: addi a0, a0, -744
	; RV64IFD-NEXT: ret			; RV64IFD-NEXT: ret
	ret double 3.1415926535897931159979634685441851615905761718750			ret double 3.1415926535897931159979634685441851615905761718750
	}			}

	define double @double_imm_op(double %a) nounwind {			define double @double_imm_op(double %a) nounwind {
	; RV32IFD-LABEL: double_imm_op:			; RV32IFD-LABEL: double_imm_op:
	; RV32IFD: # %bb.0:			; RV32IFD: # %bb.0:
	; RV32IFD-NEXT: addi sp, sp, -16			; RV32IFD-NEXT: addi sp, sp, -16
	Show All 23 Lines

llvm/test/CodeGen/RISCV/imm.ll

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: llc -mtriple=riscv32 -verify-machineinstrs < %s \			; RUN: llc -mtriple=riscv32 -riscv-disable-using-constant-pool-for-large-ints -verify-machineinstrs < %s \
	; RUN: \| FileCheck %s -check-prefix=RV32I			; RUN: \| FileCheck %s -check-prefix=RV32I
	; RUN: llc -mtriple=riscv64 -verify-machineinstrs < %s \			; RUN: llc -mtriple=riscv64 -riscv-disable-using-constant-pool-for-large-ints -verify-machineinstrs < %s \
	; RUN: \| FileCheck %s -check-prefix=RV64I			; RUN: \| FileCheck %s -check-prefix=RV64I
	; RUN: llc -mtriple=riscv64 -mattr=+experimental-zba \			; RUN: llc -mtriple=riscv64 -riscv-disable-using-constant-pool-for-large-ints -mattr=+experimental-zba \
	; RUN: -verify-machineinstrs < %s \| FileCheck %s -check-prefix=RV64IZBA			; RUN: -verify-machineinstrs < %s \| FileCheck %s -check-prefix=RV64IZBA
	; RUN: llc -mtriple=riscv64 -mattr=+experimental-zbs \			; RUN: llc -mtriple=riscv64 -riscv-disable-using-constant-pool-for-large-ints -mattr=+experimental-zbs \
	; RUN: -verify-machineinstrs < %s \| FileCheck %s -check-prefix=RV64IZBS			; RUN: -verify-machineinstrs < %s \| FileCheck %s -check-prefix=RV64IZBS

	; Materializing constants			; Materializing constants

	; TODO: It would be preferable if anyext constant returns were sign rather			; TODO: It would be preferable if anyext constant returns were sign rather
	; than zero extended. See PR39092. For now, mark returns as explicitly signext			; than zero extended. See PR39092. For now, mark returns as explicitly signext
	; (this matches what Clang would generate for equivalent C/C++ anyway).			; (this matches what Clang would generate for equivalent C/C++ anyway).

	▲ Show 20 Lines • Show All 1,841 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/rv64zbb.ll

	Show First 20 Lines • Show All 322 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: or a0, a0, a1			; RV64I-NEXT: or a0, a0, a1
	; RV64I-NEXT: srli a1, a0, 8			; RV64I-NEXT: srli a1, a0, 8
	; RV64I-NEXT: or a0, a0, a1			; RV64I-NEXT: or a0, a0, a1
	; RV64I-NEXT: srli a1, a0, 16			; RV64I-NEXT: srli a1, a0, 16
	; RV64I-NEXT: or a0, a0, a1			; RV64I-NEXT: or a0, a0, a1
	; RV64I-NEXT: srli a1, a0, 32			; RV64I-NEXT: srli a1, a0, 32
	; RV64I-NEXT: or a0, a0, a1			; RV64I-NEXT: or a0, a0, a1
	; RV64I-NEXT: not a0, a0			; RV64I-NEXT: not a0, a0
	; RV64I-NEXT: srli a1, a0, 1			; RV64I-NEXT: lui a1, %hi(.LCPI5_0)
	; RV64I-NEXT: lui a2, 21845			; RV64I-NEXT: ld a1, %lo(.LCPI5_0)(a1)
	; RV64I-NEXT: addiw a2, a2, 1365			; RV64I-NEXT: lui a2, %hi(.LCPI5_1)
	; RV64I-NEXT: slli a2, a2, 12			; RV64I-NEXT: ld a2, %lo(.LCPI5_1)(a2)
	; RV64I-NEXT: addi a2, a2, 1365			; RV64I-NEXT: srli a3, a0, 1
	; RV64I-NEXT: slli a2, a2, 12			; RV64I-NEXT: and a1, a3, a1
	; RV64I-NEXT: addi a2, a2, 1365
	; RV64I-NEXT: slli a2, a2, 12
	; RV64I-NEXT: addi a2, a2, 1365
	; RV64I-NEXT: and a1, a1, a2
	; RV64I-NEXT: sub a0, a0, a1			; RV64I-NEXT: sub a0, a0, a1
	; RV64I-NEXT: lui a1, 13107			; RV64I-NEXT: and a1, a0, a2
	; RV64I-NEXT: addiw a1, a1, 819
	; RV64I-NEXT: slli a1, a1, 12
	; RV64I-NEXT: addi a1, a1, 819
	; RV64I-NEXT: slli a1, a1, 12
	; RV64I-NEXT: addi a1, a1, 819
	; RV64I-NEXT: slli a1, a1, 12
	; RV64I-NEXT: addi a1, a1, 819
	; RV64I-NEXT: and a2, a0, a1
	; RV64I-NEXT: srli a0, a0, 2			; RV64I-NEXT: srli a0, a0, 2
	; RV64I-NEXT: and a0, a0, a1			; RV64I-NEXT: and a0, a0, a2
	; RV64I-NEXT: add a0, a2, a0			; RV64I-NEXT: lui a2, %hi(.LCPI5_2)
				; RV64I-NEXT: ld a2, %lo(.LCPI5_2)(a2)
				; RV64I-NEXT: add a0, a1, a0
	; RV64I-NEXT: srli a1, a0, 4			; RV64I-NEXT: srli a1, a0, 4
	; RV64I-NEXT: add a0, a0, a1			; RV64I-NEXT: add a0, a0, a1
	; RV64I-NEXT: lui a1, 3855			; RV64I-NEXT: and a0, a0, a2
	; RV64I-NEXT: addiw a1, a1, 241			; RV64I-NEXT: lui a1, %hi(.LCPI5_3)
	; RV64I-NEXT: slli a1, a1, 12			; RV64I-NEXT: ld a1, %lo(.LCPI5_3)(a1)
	; RV64I-NEXT: addi a1, a1, -241
	; RV64I-NEXT: slli a1, a1, 12
	; RV64I-NEXT: addi a1, a1, 241
	; RV64I-NEXT: slli a1, a1, 12
	; RV64I-NEXT: addi a1, a1, -241
	; RV64I-NEXT: and a0, a0, a1
	; RV64I-NEXT: lui a1, 4112
	; RV64I-NEXT: addiw a1, a1, 257
	; RV64I-NEXT: slli a1, a1, 16
	; RV64I-NEXT: addi a1, a1, 257
	; RV64I-NEXT: slli a1, a1, 16
	; RV64I-NEXT: addi a1, a1, 257
	; RV64I-NEXT: call __muldi3@plt			; RV64I-NEXT: call __muldi3@plt
	; RV64I-NEXT: srli a0, a0, 56			; RV64I-NEXT: srli a0, a0, 56
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	; RV64I-NEXT: .LBB5_2:			; RV64I-NEXT: .LBB5_2:
	; RV64I-NEXT: li a0, 64			; RV64I-NEXT: li a0, 64
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	▲ Show 20 Lines • Show All 213 Lines • ▼ Show 20 Lines
	; RV64I: # %bb.0:			; RV64I: # %bb.0:
	; RV64I-NEXT: beqz a0, .LBB10_2			; RV64I-NEXT: beqz a0, .LBB10_2
	; RV64I-NEXT: # %bb.1: # %cond.false			; RV64I-NEXT: # %bb.1: # %cond.false
	; RV64I-NEXT: addi sp, sp, -16			; RV64I-NEXT: addi sp, sp, -16
	; RV64I-NEXT: sd ra, 8(sp) # 8-byte Folded Spill			; RV64I-NEXT: sd ra, 8(sp) # 8-byte Folded Spill
	; RV64I-NEXT: addi a1, a0, -1			; RV64I-NEXT: addi a1, a0, -1
	; RV64I-NEXT: not a0, a0			; RV64I-NEXT: not a0, a0
	; RV64I-NEXT: and a0, a0, a1			; RV64I-NEXT: and a0, a0, a1
	; RV64I-NEXT: srli a1, a0, 1			; RV64I-NEXT: lui a1, %hi(.LCPI10_0)
	; RV64I-NEXT: lui a2, 21845			; RV64I-NEXT: ld a1, %lo(.LCPI10_0)(a1)
	; RV64I-NEXT: addiw a2, a2, 1365			; RV64I-NEXT: lui a2, %hi(.LCPI10_1)
	; RV64I-NEXT: slli a2, a2, 12			; RV64I-NEXT: ld a2, %lo(.LCPI10_1)(a2)
	; RV64I-NEXT: addi a2, a2, 1365			; RV64I-NEXT: srli a3, a0, 1
	; RV64I-NEXT: slli a2, a2, 12			; RV64I-NEXT: and a1, a3, a1
	; RV64I-NEXT: addi a2, a2, 1365
	; RV64I-NEXT: slli a2, a2, 12
	; RV64I-NEXT: addi a2, a2, 1365
	; RV64I-NEXT: and a1, a1, a2
	; RV64I-NEXT: sub a0, a0, a1			; RV64I-NEXT: sub a0, a0, a1
	; RV64I-NEXT: lui a1, 13107			; RV64I-NEXT: and a1, a0, a2
	; RV64I-NEXT: addiw a1, a1, 819
	; RV64I-NEXT: slli a1, a1, 12
	; RV64I-NEXT: addi a1, a1, 819
	; RV64I-NEXT: slli a1, a1, 12
	; RV64I-NEXT: addi a1, a1, 819
	; RV64I-NEXT: slli a1, a1, 12
	; RV64I-NEXT: addi a1, a1, 819
	; RV64I-NEXT: and a2, a0, a1
	; RV64I-NEXT: srli a0, a0, 2			; RV64I-NEXT: srli a0, a0, 2
	; RV64I-NEXT: and a0, a0, a1			; RV64I-NEXT: and a0, a0, a2
	; RV64I-NEXT: add a0, a2, a0			; RV64I-NEXT: lui a2, %hi(.LCPI10_2)
				; RV64I-NEXT: ld a2, %lo(.LCPI10_2)(a2)
				; RV64I-NEXT: add a0, a1, a0
	; RV64I-NEXT: srli a1, a0, 4			; RV64I-NEXT: srli a1, a0, 4
	; RV64I-NEXT: add a0, a0, a1			; RV64I-NEXT: add a0, a0, a1
	; RV64I-NEXT: lui a1, 3855			; RV64I-NEXT: and a0, a0, a2
	; RV64I-NEXT: addiw a1, a1, 241			; RV64I-NEXT: lui a1, %hi(.LCPI10_3)
	; RV64I-NEXT: slli a1, a1, 12			; RV64I-NEXT: ld a1, %lo(.LCPI10_3)(a1)
	; RV64I-NEXT: addi a1, a1, -241
	; RV64I-NEXT: slli a1, a1, 12
	; RV64I-NEXT: addi a1, a1, 241
	; RV64I-NEXT: slli a1, a1, 12
	; RV64I-NEXT: addi a1, a1, -241
	; RV64I-NEXT: and a0, a0, a1
	; RV64I-NEXT: lui a1, 4112
	; RV64I-NEXT: addiw a1, a1, 257
	; RV64I-NEXT: slli a1, a1, 16
	; RV64I-NEXT: addi a1, a1, 257
	; RV64I-NEXT: slli a1, a1, 16
	; RV64I-NEXT: addi a1, a1, 257
	; RV64I-NEXT: call __muldi3@plt			; RV64I-NEXT: call __muldi3@plt
	; RV64I-NEXT: srli a0, a0, 56			; RV64I-NEXT: srli a0, a0, 56
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	; RV64I-NEXT: .LBB10_2:			; RV64I-NEXT: .LBB10_2:
	; RV64I-NEXT: li a0, 64			; RV64I-NEXT: li a0, 64
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	▲ Show 20 Lines • Show All 87 Lines • ▼ Show 20 Lines

	declare i64 @llvm.ctpop.i64(i64)			declare i64 @llvm.ctpop.i64(i64)

	define i64 @ctpop_i64(i64 %a) nounwind {			define i64 @ctpop_i64(i64 %a) nounwind {
	; RV64I-LABEL: ctpop_i64:			; RV64I-LABEL: ctpop_i64:
	; RV64I: # %bb.0:			; RV64I: # %bb.0:
	; RV64I-NEXT: addi sp, sp, -16			; RV64I-NEXT: addi sp, sp, -16
	; RV64I-NEXT: sd ra, 8(sp) # 8-byte Folded Spill			; RV64I-NEXT: sd ra, 8(sp) # 8-byte Folded Spill
	; RV64I-NEXT: srli a1, a0, 1			; RV64I-NEXT: lui a1, %hi(.LCPI13_0)
	; RV64I-NEXT: lui a2, 21845			; RV64I-NEXT: ld a1, %lo(.LCPI13_0)(a1)
	; RV64I-NEXT: addiw a2, a2, 1365			; RV64I-NEXT: lui a2, %hi(.LCPI13_1)
	; RV64I-NEXT: slli a2, a2, 12			; RV64I-NEXT: ld a2, %lo(.LCPI13_1)(a2)
	; RV64I-NEXT: addi a2, a2, 1365			; RV64I-NEXT: srli a3, a0, 1
	; RV64I-NEXT: slli a2, a2, 12			; RV64I-NEXT: and a1, a3, a1
	; RV64I-NEXT: addi a2, a2, 1365
	; RV64I-NEXT: slli a2, a2, 12
	; RV64I-NEXT: addi a2, a2, 1365
	; RV64I-NEXT: and a1, a1, a2
	; RV64I-NEXT: sub a0, a0, a1			; RV64I-NEXT: sub a0, a0, a1
	; RV64I-NEXT: lui a1, 13107			; RV64I-NEXT: and a1, a0, a2
	; RV64I-NEXT: addiw a1, a1, 819
	; RV64I-NEXT: slli a1, a1, 12
	; RV64I-NEXT: addi a1, a1, 819
	; RV64I-NEXT: slli a1, a1, 12
	; RV64I-NEXT: addi a1, a1, 819
	; RV64I-NEXT: slli a1, a1, 12
	; RV64I-NEXT: addi a1, a1, 819
	; RV64I-NEXT: and a2, a0, a1
	; RV64I-NEXT: srli a0, a0, 2			; RV64I-NEXT: srli a0, a0, 2
	; RV64I-NEXT: and a0, a0, a1			; RV64I-NEXT: and a0, a0, a2
	; RV64I-NEXT: add a0, a2, a0			; RV64I-NEXT: lui a2, %hi(.LCPI13_2)
				; RV64I-NEXT: ld a2, %lo(.LCPI13_2)(a2)
				; RV64I-NEXT: add a0, a1, a0
	; RV64I-NEXT: srli a1, a0, 4			; RV64I-NEXT: srli a1, a0, 4
	; RV64I-NEXT: add a0, a0, a1			; RV64I-NEXT: add a0, a0, a1
	; RV64I-NEXT: lui a1, 3855			; RV64I-NEXT: and a0, a0, a2
	; RV64I-NEXT: addiw a1, a1, 241			; RV64I-NEXT: lui a1, %hi(.LCPI13_3)
	; RV64I-NEXT: slli a1, a1, 12			; RV64I-NEXT: ld a1, %lo(.LCPI13_3)(a1)
	; RV64I-NEXT: addi a1, a1, -241
	; RV64I-NEXT: slli a1, a1, 12
	; RV64I-NEXT: addi a1, a1, 241
	; RV64I-NEXT: slli a1, a1, 12
	; RV64I-NEXT: addi a1, a1, -241
	; RV64I-NEXT: and a0, a0, a1
	; RV64I-NEXT: lui a1, 4112
	; RV64I-NEXT: addiw a1, a1, 257
	; RV64I-NEXT: slli a1, a1, 16
	; RV64I-NEXT: addi a1, a1, 257
	; RV64I-NEXT: slli a1, a1, 16
	; RV64I-NEXT: addi a1, a1, 257
	; RV64I-NEXT: call __muldi3@plt			; RV64I-NEXT: call __muldi3@plt
	; RV64I-NEXT: srli a0, a0, 56			; RV64I-NEXT: srli a0, a0, 56
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64ZBB-LABEL: ctpop_i64:			; RV64ZBB-LABEL: ctpop_i64:
	; RV64ZBB: # %bb.0:			; RV64ZBB: # %bb.0:
	▲ Show 20 Lines • Show All 386 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/rv64zbp.ll

Show All 29 Lines	; RV64ZBP-NEXT: ret
%or = or i32 %shr, %a		%or = or i32 %shr, %a
%or2 = or i32 %or, %shl		%or2 = or i32 %or, %shl
ret i32 %or2		ret i32 %or2
}		}

define i64 @gorc1_i64(i64 %a) nounwind {		define i64 @gorc1_i64(i64 %a) nounwind {
; RV64I-LABEL: gorc1_i64:		; RV64I-LABEL: gorc1_i64:
; RV64I: # %bb.0:		; RV64I: # %bb.0:
; RV64I-NEXT: slli a1, a0, 1		; RV64I-NEXT: lui a1, %hi(.LCPI1_0)
; RV64I-NEXT: lui a2, 1026731		; RV64I-NEXT: ld a1, %lo(.LCPI1_0)(a1)
; RV64I-NEXT: addiw a2, a2, -1365		; RV64I-NEXT: lui a2, %hi(.LCPI1_1)
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: ld a2, %lo(.LCPI1_1)(a2)
; RV64I-NEXT: addi a2, a2, -1365		; RV64I-NEXT: slli a3, a0, 1
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: and a1, a3, a1
; RV64I-NEXT: addi a2, a2, -1365		; RV64I-NEXT: srli a3, a0, 1
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: and a2, a3, a2
; RV64I-NEXT: addi a2, a2, -1366
; RV64I-NEXT: and a1, a1, a2
; RV64I-NEXT: srli a2, a0, 1
; RV64I-NEXT: lui a3, 21845
; RV64I-NEXT: addiw a3, a3, 1365
; RV64I-NEXT: slli a3, a3, 12
; RV64I-NEXT: addi a3, a3, 1365
; RV64I-NEXT: slli a3, a3, 12
; RV64I-NEXT: addi a3, a3, 1365
; RV64I-NEXT: slli a3, a3, 12
; RV64I-NEXT: addi a3, a3, 1365
; RV64I-NEXT: and a2, a2, a3
; RV64I-NEXT: or a0, a2, a0		; RV64I-NEXT: or a0, a2, a0
; RV64I-NEXT: or a0, a0, a1		; RV64I-NEXT: or a0, a0, a1
; RV64I-NEXT: ret		; RV64I-NEXT: ret
;		;
; RV64ZBP-LABEL: gorc1_i64:		; RV64ZBP-LABEL: gorc1_i64:
; RV64ZBP: # %bb.0:		; RV64ZBP: # %bb.0:
; RV64ZBP-NEXT: orc.p a0, a0		; RV64ZBP-NEXT: orc.p a0, a0
; RV64ZBP-NEXT: ret		; RV64ZBP-NEXT: ret
Show All 32 Lines	; RV64ZBP-NEXT: ret
%or = or i32 %shr, %a		%or = or i32 %shr, %a
%or2 = or i32 %or, %shl		%or2 = or i32 %or, %shl
ret i32 %or2		ret i32 %or2
}		}

define i64 @gorc2_i64(i64 %a) nounwind {		define i64 @gorc2_i64(i64 %a) nounwind {
; RV64I-LABEL: gorc2_i64:		; RV64I-LABEL: gorc2_i64:
; RV64I: # %bb.0:		; RV64I: # %bb.0:
; RV64I-NEXT: slli a1, a0, 2		; RV64I-NEXT: lui a1, %hi(.LCPI3_0)
; RV64I-NEXT: lui a2, 1035469		; RV64I-NEXT: ld a1, %lo(.LCPI3_0)(a1)
; RV64I-NEXT: addiw a2, a2, -819		; RV64I-NEXT: lui a2, %hi(.LCPI3_1)
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: ld a2, %lo(.LCPI3_1)(a2)
; RV64I-NEXT: addi a2, a2, -819		; RV64I-NEXT: slli a3, a0, 2
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: and a1, a3, a1
; RV64I-NEXT: addi a2, a2, -819		; RV64I-NEXT: srli a3, a0, 2
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: and a2, a3, a2
; RV64I-NEXT: addi a2, a2, -820
; RV64I-NEXT: and a1, a1, a2
; RV64I-NEXT: srli a2, a0, 2
; RV64I-NEXT: lui a3, 13107
; RV64I-NEXT: addiw a3, a3, 819
; RV64I-NEXT: slli a3, a3, 12
; RV64I-NEXT: addi a3, a3, 819
; RV64I-NEXT: slli a3, a3, 12
; RV64I-NEXT: addi a3, a3, 819
; RV64I-NEXT: slli a3, a3, 12
; RV64I-NEXT: addi a3, a3, 819
; RV64I-NEXT: and a2, a2, a3
; RV64I-NEXT: or a0, a2, a0		; RV64I-NEXT: or a0, a2, a0
; RV64I-NEXT: or a0, a0, a1		; RV64I-NEXT: or a0, a0, a1
; RV64I-NEXT: ret		; RV64I-NEXT: ret
;		;
; RV64ZBP-LABEL: gorc2_i64:		; RV64ZBP-LABEL: gorc2_i64:
; RV64ZBP: # %bb.0:		; RV64ZBP: # %bb.0:
; RV64ZBP-NEXT: orc2.n a0, a0		; RV64ZBP-NEXT: orc2.n a0, a0
; RV64ZBP-NEXT: ret		; RV64ZBP-NEXT: ret
▲ Show 20 Lines • Show All 48 Lines • ▼ Show 20 Lines	; RV64ZBP-NEXT: ret
%or2 = or i32 %shr2, %or1b		%or2 = or i32 %shr2, %or1b
%or2b = or i32 %or2, %shl2		%or2b = or i32 %or2, %shl2
ret i32 %or2b		ret i32 %or2b
}		}

define i64 @gorc3_i64(i64 %a) nounwind {		define i64 @gorc3_i64(i64 %a) nounwind {
; RV64I-LABEL: gorc3_i64:		; RV64I-LABEL: gorc3_i64:
; RV64I: # %bb.0:		; RV64I: # %bb.0:
; RV64I-NEXT: slli a1, a0, 1		; RV64I-NEXT: lui a1, %hi(.LCPI5_0)
; RV64I-NEXT: lui a2, 1026731		; RV64I-NEXT: ld a1, %lo(.LCPI5_0)(a1)
; RV64I-NEXT: addiw a2, a2, -1365		; RV64I-NEXT: lui a2, %hi(.LCPI5_1)
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: ld a2, %lo(.LCPI5_1)(a2)
; RV64I-NEXT: addi a2, a2, -1365		; RV64I-NEXT: slli a3, a0, 1
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: and a1, a3, a1
; RV64I-NEXT: addi a2, a2, -1365		; RV64I-NEXT: srli a3, a0, 1
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: and a2, a3, a2
; RV64I-NEXT: addi a2, a2, -1366
; RV64I-NEXT: and a1, a1, a2
; RV64I-NEXT: srli a2, a0, 1
; RV64I-NEXT: lui a3, 21845
; RV64I-NEXT: addiw a3, a3, 1365
; RV64I-NEXT: slli a3, a3, 12
; RV64I-NEXT: addi a3, a3, 1365
; RV64I-NEXT: slli a3, a3, 12
; RV64I-NEXT: addi a3, a3, 1365
; RV64I-NEXT: slli a3, a3, 12
; RV64I-NEXT: addi a3, a3, 1365
; RV64I-NEXT: and a2, a2, a3
; RV64I-NEXT: or a0, a2, a0		; RV64I-NEXT: or a0, a2, a0
; RV64I-NEXT: or a0, a0, a1		; RV64I-NEXT: or a0, a0, a1
; RV64I-NEXT: slli a1, a0, 2		; RV64I-NEXT: lui a1, %hi(.LCPI5_2)
; RV64I-NEXT: lui a2, 1035469		; RV64I-NEXT: ld a1, %lo(.LCPI5_2)(a1)
; RV64I-NEXT: addiw a2, a2, -819		; RV64I-NEXT: lui a2, %hi(.LCPI5_3)
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: ld a2, %lo(.LCPI5_3)(a2)
; RV64I-NEXT: addi a2, a2, -819		; RV64I-NEXT: slli a3, a0, 2
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: and a1, a3, a1
; RV64I-NEXT: addi a2, a2, -819		; RV64I-NEXT: srli a3, a0, 2
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: and a2, a3, a2
; RV64I-NEXT: addi a2, a2, -820
; RV64I-NEXT: and a1, a1, a2
; RV64I-NEXT: srli a2, a0, 2
; RV64I-NEXT: lui a3, 13107
; RV64I-NEXT: addiw a3, a3, 819
; RV64I-NEXT: slli a3, a3, 12
; RV64I-NEXT: addi a3, a3, 819
; RV64I-NEXT: slli a3, a3, 12
; RV64I-NEXT: addi a3, a3, 819
; RV64I-NEXT: slli a3, a3, 12
; RV64I-NEXT: addi a3, a3, 819
; RV64I-NEXT: and a2, a2, a3
; RV64I-NEXT: or a0, a2, a0		; RV64I-NEXT: or a0, a2, a0
; RV64I-NEXT: or a0, a0, a1		; RV64I-NEXT: or a0, a0, a1
; RV64I-NEXT: ret		; RV64I-NEXT: ret
;		;
; RV64ZBP-LABEL: gorc3_i64:		; RV64ZBP-LABEL: gorc3_i64:
; RV64ZBP: # %bb.0:		; RV64ZBP: # %bb.0:
; RV64ZBP-NEXT: orc.n a0, a0		; RV64ZBP-NEXT: orc.n a0, a0
; RV64ZBP-NEXT: ret		; RV64ZBP-NEXT: ret
Show All 38 Lines	; RV64ZBP-NEXT: ret
%or = or i32 %shr, %a		%or = or i32 %shr, %a
%or2 = or i32 %or, %shl		%or2 = or i32 %or, %shl
ret i32 %or2		ret i32 %or2
}		}

define i64 @gorc4_i64(i64 %a) nounwind {		define i64 @gorc4_i64(i64 %a) nounwind {
; RV64I-LABEL: gorc4_i64:		; RV64I-LABEL: gorc4_i64:
; RV64I: # %bb.0:		; RV64I: # %bb.0:
; RV64I-NEXT: slli a1, a0, 4		; RV64I-NEXT: lui a1, %hi(.LCPI7_0)
; RV64I-NEXT: lui a2, 1044721		; RV64I-NEXT: ld a1, %lo(.LCPI7_0)(a1)
; RV64I-NEXT: addiw a2, a2, -241		; RV64I-NEXT: lui a2, %hi(.LCPI7_1)
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: ld a2, %lo(.LCPI7_1)(a2)
; RV64I-NEXT: addi a2, a2, 241		; RV64I-NEXT: slli a3, a0, 4
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: and a1, a3, a1
; RV64I-NEXT: addi a2, a2, -241		; RV64I-NEXT: srli a3, a0, 4
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: and a2, a3, a2
; RV64I-NEXT: addi a2, a2, 240
; RV64I-NEXT: and a1, a1, a2
; RV64I-NEXT: srli a2, a0, 4
; RV64I-NEXT: lui a3, 3855
; RV64I-NEXT: addiw a3, a3, 241
; RV64I-NEXT: slli a3, a3, 12
; RV64I-NEXT: addi a3, a3, -241
; RV64I-NEXT: slli a3, a3, 12
; RV64I-NEXT: addi a3, a3, 241
; RV64I-NEXT: slli a3, a3, 12
; RV64I-NEXT: addi a3, a3, -241
; RV64I-NEXT: and a2, a2, a3
; RV64I-NEXT: or a0, a2, a0		; RV64I-NEXT: or a0, a2, a0
; RV64I-NEXT: or a0, a0, a1		; RV64I-NEXT: or a0, a0, a1
; RV64I-NEXT: ret		; RV64I-NEXT: ret
;		;
; RV64ZBP-LABEL: gorc4_i64:		; RV64ZBP-LABEL: gorc4_i64:
; RV64ZBP: # %bb.0:		; RV64ZBP: # %bb.0:
; RV64ZBP-NEXT: orc4.b a0, a0		; RV64ZBP-NEXT: orc4.b a0, a0
; RV64ZBP-NEXT: ret		; RV64ZBP-NEXT: ret
▲ Show 20 Lines • Show All 48 Lines • ▼ Show 20 Lines	; RV64ZBP-NEXT: ret
%or2 = or i32 %shr2, %or1b		%or2 = or i32 %shr2, %or1b
%or2b = or i32 %or2, %shl2		%or2b = or i32 %or2, %shl2
ret i32 %or2b		ret i32 %or2b
}		}

define i64 @gorc5_i64(i64 %a) nounwind {		define i64 @gorc5_i64(i64 %a) nounwind {
; RV64I-LABEL: gorc5_i64:		; RV64I-LABEL: gorc5_i64:
; RV64I: # %bb.0:		; RV64I: # %bb.0:
; RV64I-NEXT: slli a1, a0, 1		; RV64I-NEXT: lui a1, %hi(.LCPI9_0)
; RV64I-NEXT: lui a2, 1026731		; RV64I-NEXT: ld a1, %lo(.LCPI9_0)(a1)
; RV64I-NEXT: addiw a2, a2, -1365		; RV64I-NEXT: lui a2, %hi(.LCPI9_1)
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: ld a2, %lo(.LCPI9_1)(a2)
; RV64I-NEXT: addi a2, a2, -1365		; RV64I-NEXT: slli a3, a0, 1
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: and a1, a3, a1
; RV64I-NEXT: addi a2, a2, -1365		; RV64I-NEXT: srli a3, a0, 1
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: and a2, a3, a2
; RV64I-NEXT: addi a2, a2, -1366
; RV64I-NEXT: and a1, a1, a2
; RV64I-NEXT: srli a2, a0, 1
; RV64I-NEXT: lui a3, 21845
; RV64I-NEXT: addiw a3, a3, 1365
; RV64I-NEXT: slli a3, a3, 12
; RV64I-NEXT: addi a3, a3, 1365
; RV64I-NEXT: slli a3, a3, 12
; RV64I-NEXT: addi a3, a3, 1365
; RV64I-NEXT: slli a3, a3, 12
; RV64I-NEXT: addi a3, a3, 1365
; RV64I-NEXT: and a2, a2, a3
; RV64I-NEXT: or a0, a2, a0		; RV64I-NEXT: or a0, a2, a0
; RV64I-NEXT: or a0, a0, a1		; RV64I-NEXT: or a0, a0, a1
; RV64I-NEXT: slli a1, a0, 4		; RV64I-NEXT: lui a1, %hi(.LCPI9_2)
; RV64I-NEXT: lui a2, 1044721		; RV64I-NEXT: ld a1, %lo(.LCPI9_2)(a1)
; RV64I-NEXT: addiw a2, a2, -241		; RV64I-NEXT: lui a2, %hi(.LCPI9_3)
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: ld a2, %lo(.LCPI9_3)(a2)
; RV64I-NEXT: addi a2, a2, 241		; RV64I-NEXT: slli a3, a0, 4
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: and a1, a3, a1
; RV64I-NEXT: addi a2, a2, -241		; RV64I-NEXT: srli a3, a0, 4
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: and a2, a3, a2
; RV64I-NEXT: addi a2, a2, 240
; RV64I-NEXT: and a1, a1, a2
; RV64I-NEXT: srli a2, a0, 4
; RV64I-NEXT: lui a3, 3855
; RV64I-NEXT: addiw a3, a3, 241
; RV64I-NEXT: slli a3, a3, 12
; RV64I-NEXT: addi a3, a3, -241
; RV64I-NEXT: slli a3, a3, 12
; RV64I-NEXT: addi a3, a3, 241
; RV64I-NEXT: slli a3, a3, 12
; RV64I-NEXT: addi a3, a3, -241
; RV64I-NEXT: and a2, a2, a3
; RV64I-NEXT: or a0, a2, a0		; RV64I-NEXT: or a0, a2, a0
; RV64I-NEXT: or a0, a0, a1		; RV64I-NEXT: or a0, a0, a1
; RV64I-NEXT: ret		; RV64I-NEXT: ret
;		;
; RV64ZBP-LABEL: gorc5_i64:		; RV64ZBP-LABEL: gorc5_i64:
; RV64ZBP: # %bb.0:		; RV64ZBP: # %bb.0:
; RV64ZBP-NEXT: gorci a0, a0, 5		; RV64ZBP-NEXT: gorci a0, a0, 5
; RV64ZBP-NEXT: ret		; RV64ZBP-NEXT: ret
▲ Show 20 Lines • Show All 54 Lines • ▼ Show 20 Lines	; RV64ZBP-NEXT: ret
%or2 = or i32 %shr2, %or1b		%or2 = or i32 %shr2, %or1b
%or2b = or i32 %or2, %shl2		%or2b = or i32 %or2, %shl2
ret i32 %or2b		ret i32 %or2b
}		}

define i64 @gorc6_i64(i64 %a) nounwind {		define i64 @gorc6_i64(i64 %a) nounwind {
; RV64I-LABEL: gorc6_i64:		; RV64I-LABEL: gorc6_i64:
; RV64I: # %bb.0:		; RV64I: # %bb.0:
; RV64I-NEXT: slli a1, a0, 2		; RV64I-NEXT: lui a1, %hi(.LCPI11_0)
; RV64I-NEXT: lui a2, 1035469		; RV64I-NEXT: ld a1, %lo(.LCPI11_0)(a1)
; RV64I-NEXT: addiw a2, a2, -819		; RV64I-NEXT: lui a2, %hi(.LCPI11_1)
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: ld a2, %lo(.LCPI11_1)(a2)
; RV64I-NEXT: addi a2, a2, -819		; RV64I-NEXT: slli a3, a0, 2
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: and a1, a3, a1
; RV64I-NEXT: addi a2, a2, -819		; RV64I-NEXT: srli a3, a0, 2
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: and a2, a3, a2
; RV64I-NEXT: addi a2, a2, -820
; RV64I-NEXT: and a1, a1, a2
; RV64I-NEXT: srli a2, a0, 2
; RV64I-NEXT: lui a3, 13107
; RV64I-NEXT: addiw a3, a3, 819
; RV64I-NEXT: slli a3, a3, 12
; RV64I-NEXT: addi a3, a3, 819
; RV64I-NEXT: slli a3, a3, 12
; RV64I-NEXT: addi a3, a3, 819
; RV64I-NEXT: slli a3, a3, 12
; RV64I-NEXT: addi a3, a3, 819
; RV64I-NEXT: and a2, a2, a3
; RV64I-NEXT: or a0, a2, a0		; RV64I-NEXT: or a0, a2, a0
; RV64I-NEXT: or a0, a0, a1		; RV64I-NEXT: or a0, a0, a1
; RV64I-NEXT: slli a1, a0, 4		; RV64I-NEXT: lui a1, %hi(.LCPI11_2)
; RV64I-NEXT: lui a2, 1044721		; RV64I-NEXT: ld a1, %lo(.LCPI11_2)(a1)
; RV64I-NEXT: addiw a2, a2, -241		; RV64I-NEXT: lui a2, %hi(.LCPI11_3)
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: ld a2, %lo(.LCPI11_3)(a2)
; RV64I-NEXT: addi a2, a2, 241		; RV64I-NEXT: slli a3, a0, 4
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: and a1, a3, a1
; RV64I-NEXT: addi a2, a2, -241		; RV64I-NEXT: srli a3, a0, 4
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: and a2, a3, a2
; RV64I-NEXT: addi a2, a2, 240
; RV64I-NEXT: and a1, a1, a2
; RV64I-NEXT: srli a2, a0, 4
; RV64I-NEXT: lui a3, 3855
; RV64I-NEXT: addiw a3, a3, 241
; RV64I-NEXT: slli a3, a3, 12
; RV64I-NEXT: addi a3, a3, -241
; RV64I-NEXT: slli a3, a3, 12
; RV64I-NEXT: addi a3, a3, 241
; RV64I-NEXT: slli a3, a3, 12
; RV64I-NEXT: addi a3, a3, -241
; RV64I-NEXT: and a2, a2, a3
; RV64I-NEXT: or a0, a2, a0		; RV64I-NEXT: or a0, a2, a0
; RV64I-NEXT: or a0, a0, a1		; RV64I-NEXT: or a0, a0, a1
; RV64I-NEXT: ret		; RV64I-NEXT: ret
;		;
; RV64ZBP-LABEL: gorc6_i64:		; RV64ZBP-LABEL: gorc6_i64:
; RV64ZBP: # %bb.0:		; RV64ZBP: # %bb.0:
; RV64ZBP-NEXT: orc2.b a0, a0		; RV64ZBP-NEXT: orc2.b a0, a0
; RV64ZBP-NEXT: ret		; RV64ZBP-NEXT: ret
▲ Show 20 Lines • Show All 71 Lines • ▼ Show 20 Lines	; RV64ZBP-NEXT: ret
%or3 = or i32 %shr3, %or2b		%or3 = or i32 %shr3, %or2b
%or3b = or i32 %or3, %shl3		%or3b = or i32 %or3, %shl3
ret i32 %or3b		ret i32 %or3b
}		}

define i64 @gorc7_i64(i64 %a) nounwind {		define i64 @gorc7_i64(i64 %a) nounwind {
; RV64I-LABEL: gorc7_i64:		; RV64I-LABEL: gorc7_i64:
; RV64I: # %bb.0:		; RV64I: # %bb.0:
; RV64I-NEXT: slli a1, a0, 1		; RV64I-NEXT: lui a1, %hi(.LCPI13_0)
; RV64I-NEXT: lui a2, 1026731		; RV64I-NEXT: ld a1, %lo(.LCPI13_0)(a1)
; RV64I-NEXT: addiw a2, a2, -1365		; RV64I-NEXT: lui a2, %hi(.LCPI13_1)
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: ld a2, %lo(.LCPI13_1)(a2)
; RV64I-NEXT: addi a2, a2, -1365		; RV64I-NEXT: slli a3, a0, 1
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: and a1, a3, a1
; RV64I-NEXT: addi a2, a2, -1365		; RV64I-NEXT: srli a3, a0, 1
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: and a2, a3, a2
; RV64I-NEXT: addi a2, a2, -1366
; RV64I-NEXT: and a1, a1, a2
; RV64I-NEXT: srli a2, a0, 1
; RV64I-NEXT: lui a3, 21845
; RV64I-NEXT: addiw a3, a3, 1365
; RV64I-NEXT: slli a3, a3, 12
; RV64I-NEXT: addi a3, a3, 1365
; RV64I-NEXT: slli a3, a3, 12
; RV64I-NEXT: addi a3, a3, 1365
; RV64I-NEXT: slli a3, a3, 12
; RV64I-NEXT: addi a3, a3, 1365
; RV64I-NEXT: and a2, a2, a3
; RV64I-NEXT: or a0, a2, a0		; RV64I-NEXT: or a0, a2, a0
; RV64I-NEXT: or a0, a0, a1		; RV64I-NEXT: or a0, a0, a1
; RV64I-NEXT: slli a1, a0, 2		; RV64I-NEXT: lui a1, %hi(.LCPI13_2)
; RV64I-NEXT: lui a2, 1035469		; RV64I-NEXT: ld a1, %lo(.LCPI13_2)(a1)
; RV64I-NEXT: addiw a2, a2, -819		; RV64I-NEXT: lui a2, %hi(.LCPI13_3)
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: ld a2, %lo(.LCPI13_3)(a2)
; RV64I-NEXT: addi a2, a2, -819		; RV64I-NEXT: slli a3, a0, 2
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: and a1, a3, a1
; RV64I-NEXT: addi a2, a2, -819		; RV64I-NEXT: srli a3, a0, 2
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: and a2, a3, a2
; RV64I-NEXT: addi a2, a2, -820
; RV64I-NEXT: and a1, a1, a2
; RV64I-NEXT: srli a2, a0, 2
; RV64I-NEXT: lui a3, 13107
; RV64I-NEXT: addiw a3, a3, 819
; RV64I-NEXT: slli a3, a3, 12
; RV64I-NEXT: addi a3, a3, 819
; RV64I-NEXT: slli a3, a3, 12
; RV64I-NEXT: addi a3, a3, 819
; RV64I-NEXT: slli a3, a3, 12
; RV64I-NEXT: addi a3, a3, 819
; RV64I-NEXT: and a2, a2, a3
; RV64I-NEXT: or a0, a2, a0		; RV64I-NEXT: or a0, a2, a0
; RV64I-NEXT: or a0, a0, a1		; RV64I-NEXT: or a0, a0, a1
; RV64I-NEXT: slli a1, a0, 4		; RV64I-NEXT: lui a1, %hi(.LCPI13_4)
; RV64I-NEXT: lui a2, 1044721		; RV64I-NEXT: ld a1, %lo(.LCPI13_4)(a1)
; RV64I-NEXT: addiw a2, a2, -241		; RV64I-NEXT: lui a2, %hi(.LCPI13_5)
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: ld a2, %lo(.LCPI13_5)(a2)
; RV64I-NEXT: addi a2, a2, 241		; RV64I-NEXT: slli a3, a0, 4
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: and a1, a3, a1
; RV64I-NEXT: addi a2, a2, -241		; RV64I-NEXT: srli a3, a0, 4
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: and a2, a3, a2
; RV64I-NEXT: addi a2, a2, 240
; RV64I-NEXT: and a1, a1, a2
; RV64I-NEXT: srli a2, a0, 4
; RV64I-NEXT: lui a3, 3855
; RV64I-NEXT: addiw a3, a3, 241
; RV64I-NEXT: slli a3, a3, 12
; RV64I-NEXT: addi a3, a3, -241
; RV64I-NEXT: slli a3, a3, 12
; RV64I-NEXT: addi a3, a3, 241
; RV64I-NEXT: slli a3, a3, 12
; RV64I-NEXT: addi a3, a3, -241
; RV64I-NEXT: and a2, a2, a3
; RV64I-NEXT: or a0, a2, a0		; RV64I-NEXT: or a0, a2, a0
; RV64I-NEXT: or a0, a0, a1		; RV64I-NEXT: or a0, a0, a1
; RV64I-NEXT: ret		; RV64I-NEXT: ret
;		;
; RV64ZBP-LABEL: gorc7_i64:		; RV64ZBP-LABEL: gorc7_i64:
; RV64ZBP: # %bb.0:		; RV64ZBP: # %bb.0:
; RV64ZBP-NEXT: orc.b a0, a0		; RV64ZBP-NEXT: orc.b a0, a0
; RV64ZBP-NEXT: ret		; RV64ZBP-NEXT: ret
▲ Show 20 Lines • Show All 44 Lines • ▼ Show 20 Lines	; RV64ZBP-NEXT: ret
%or = or i32 %shr, %a		%or = or i32 %shr, %a
%or2 = or i32 %or, %shl		%or2 = or i32 %or, %shl
ret i32 %or2		ret i32 %or2
}		}

define i64 @gorc8_i64(i64 %a) nounwind {		define i64 @gorc8_i64(i64 %a) nounwind {
; RV64I-LABEL: gorc8_i64:		; RV64I-LABEL: gorc8_i64:
; RV64I: # %bb.0:		; RV64I: # %bb.0:
; RV64I-NEXT: slli a1, a0, 8		; RV64I-NEXT: lui a1, %hi(.LCPI15_0)
; RV64I-NEXT: lui a2, 1044496		; RV64I-NEXT: ld a1, %lo(.LCPI15_0)(a1)
; RV64I-NEXT: addiw a2, a2, -255		; RV64I-NEXT: lui a2, %hi(.LCPI15_1)
; RV64I-NEXT: slli a2, a2, 16		; RV64I-NEXT: ld a2, %lo(.LCPI15_1)(a2)
; RV64I-NEXT: addi a2, a2, -255		; RV64I-NEXT: slli a3, a0, 8
; RV64I-NEXT: slli a2, a2, 16		; RV64I-NEXT: and a1, a3, a1
; RV64I-NEXT: addi a2, a2, -256		; RV64I-NEXT: srli a3, a0, 8
; RV64I-NEXT: and a1, a1, a2		; RV64I-NEXT: and a2, a3, a2
; RV64I-NEXT: srli a2, a0, 8
; RV64I-NEXT: lui a3, 4080
; RV64I-NEXT: addiw a3, a3, 255
; RV64I-NEXT: slli a3, a3, 16
; RV64I-NEXT: addi a3, a3, 255
; RV64I-NEXT: slli a3, a3, 16
; RV64I-NEXT: addi a3, a3, 255
; RV64I-NEXT: and a2, a2, a3
; RV64I-NEXT: or a0, a2, a0		; RV64I-NEXT: or a0, a2, a0
; RV64I-NEXT: or a0, a0, a1		; RV64I-NEXT: or a0, a0, a1
; RV64I-NEXT: ret		; RV64I-NEXT: ret
;		;
; RV64ZBP-LABEL: gorc8_i64:		; RV64ZBP-LABEL: gorc8_i64:
; RV64ZBP: # %bb.0:		; RV64ZBP: # %bb.0:
; RV64ZBP-NEXT: orc8.h a0, a0		; RV64ZBP-NEXT: orc8.h a0, a0
; RV64ZBP-NEXT: ret		; RV64ZBP-NEXT: ret
▲ Show 20 Lines • Show All 153 Lines • ▼ Show 20 Lines	; RV64ZBP-NEXT: ret
%or2b = or i32 %or2, %shl2		%or2b = or i32 %or2, %shl2
ret i32 %or2b		ret i32 %or2b
}		}

; gorc2, gorc2 -> gorc2		; gorc2, gorc2 -> gorc2
define i64 @gorc2b_i64(i64 %a) nounwind {		define i64 @gorc2b_i64(i64 %a) nounwind {
; RV64I-LABEL: gorc2b_i64:		; RV64I-LABEL: gorc2b_i64:
; RV64I: # %bb.0:		; RV64I: # %bb.0:
; RV64I-NEXT: slli a1, a0, 2		; RV64I-NEXT: lui a1, %hi(.LCPI22_0)
; RV64I-NEXT: lui a2, 1035469		; RV64I-NEXT: ld a1, %lo(.LCPI22_0)(a1)
; RV64I-NEXT: addiw a2, a2, -819		; RV64I-NEXT: lui a2, %hi(.LCPI22_1)
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: ld a2, %lo(.LCPI22_1)(a2)
; RV64I-NEXT: addi a2, a2, -819		; RV64I-NEXT: slli a3, a0, 2
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: and a3, a3, a1
; RV64I-NEXT: addi a2, a2, -819		; RV64I-NEXT: srli a4, a0, 2
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: and a4, a4, a2
; RV64I-NEXT: addi a2, a2, -820		; RV64I-NEXT: or a0, a4, a0
; RV64I-NEXT: and a1, a1, a2		; RV64I-NEXT: or a0, a0, a3
		; RV64I-NEXT: slli a3, a0, 2
		; RV64I-NEXT: and a1, a3, a1
; RV64I-NEXT: srli a3, a0, 2		; RV64I-NEXT: srli a3, a0, 2
; RV64I-NEXT: lui a4, 13107		; RV64I-NEXT: and a2, a3, a2
; RV64I-NEXT: addiw a4, a4, 819
; RV64I-NEXT: slli a4, a4, 12
; RV64I-NEXT: addi a4, a4, 819
; RV64I-NEXT: slli a4, a4, 12
; RV64I-NEXT: addi a4, a4, 819
; RV64I-NEXT: slli a4, a4, 12
; RV64I-NEXT: addi a4, a4, 819
; RV64I-NEXT: and a3, a3, a4
; RV64I-NEXT: or a0, a3, a0
; RV64I-NEXT: or a0, a0, a1
; RV64I-NEXT: slli a1, a0, 2
; RV64I-NEXT: and a1, a1, a2
; RV64I-NEXT: srli a2, a0, 2
; RV64I-NEXT: and a2, a2, a4
; RV64I-NEXT: or a0, a2, a0		; RV64I-NEXT: or a0, a2, a0
; RV64I-NEXT: or a0, a0, a1		; RV64I-NEXT: or a0, a0, a1
; RV64I-NEXT: ret		; RV64I-NEXT: ret
;		;
; RV64ZBP-LABEL: gorc2b_i64:		; RV64ZBP-LABEL: gorc2b_i64:
; RV64ZBP: # %bb.0:		; RV64ZBP: # %bb.0:
; RV64ZBP-NEXT: orc2.n a0, a0		; RV64ZBP-NEXT: orc2.n a0, a0
; RV64ZBP-NEXT: ret		; RV64ZBP-NEXT: ret
▲ Show 20 Lines • Show All 69 Lines • ▼ Show 20 Lines	; RV64ZBP-NEXT: ret
%or3b = or i32 %or3, %shl3		%or3b = or i32 %or3, %shl3
ret i32 %or3b		ret i32 %or3b
}		}

; gorc1, gorc2, gorc1 -> gorc2		; gorc1, gorc2, gorc1 -> gorc2
define i64 @gorc3b_i64(i64 %a) nounwind {		define i64 @gorc3b_i64(i64 %a) nounwind {
; RV64I-LABEL: gorc3b_i64:		; RV64I-LABEL: gorc3b_i64:
; RV64I: # %bb.0:		; RV64I: # %bb.0:
; RV64I-NEXT: slli a1, a0, 1		; RV64I-NEXT: lui a1, %hi(.LCPI24_0)
; RV64I-NEXT: lui a2, 1026731		; RV64I-NEXT: ld a1, %lo(.LCPI24_0)(a1)
; RV64I-NEXT: addiw a2, a2, -1365		; RV64I-NEXT: lui a2, %hi(.LCPI24_1)
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: ld a2, %lo(.LCPI24_1)(a2)
; RV64I-NEXT: addi a2, a2, -1365		; RV64I-NEXT: slli a3, a0, 1
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: and a3, a3, a1
; RV64I-NEXT: addi a2, a2, -1365		; RV64I-NEXT: srli a4, a0, 1
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: and a4, a4, a2
; RV64I-NEXT: addi a2, a2, -1366		; RV64I-NEXT: or a0, a4, a0
; RV64I-NEXT: and a1, a1, a2		; RV64I-NEXT: or a0, a0, a3
		; RV64I-NEXT: lui a3, %hi(.LCPI24_2)
		; RV64I-NEXT: ld a3, %lo(.LCPI24_2)(a3)
		; RV64I-NEXT: lui a4, %hi(.LCPI24_3)
		; RV64I-NEXT: ld a4, %lo(.LCPI24_3)(a4)
		; RV64I-NEXT: slli a5, a0, 2
		; RV64I-NEXT: and a3, a5, a3
		; RV64I-NEXT: srli a5, a0, 2
		; RV64I-NEXT: and a4, a5, a4
		; RV64I-NEXT: or a0, a4, a0
		; RV64I-NEXT: or a0, a0, a3
		; RV64I-NEXT: slli a3, a0, 1
		; RV64I-NEXT: and a1, a3, a1
; RV64I-NEXT: srli a3, a0, 1		; RV64I-NEXT: srli a3, a0, 1
; RV64I-NEXT: lui a4, 21845		; RV64I-NEXT: and a2, a3, a2
; RV64I-NEXT: addiw a4, a4, 1365
; RV64I-NEXT: slli a4, a4, 12
; RV64I-NEXT: addi a4, a4, 1365
; RV64I-NEXT: slli a4, a4, 12
; RV64I-NEXT: addi a4, a4, 1365
; RV64I-NEXT: slli a4, a4, 12
; RV64I-NEXT: addi a4, a4, 1365
; RV64I-NEXT: and a3, a3, a4
; RV64I-NEXT: or a0, a3, a0
; RV64I-NEXT: or a0, a0, a1
; RV64I-NEXT: slli a1, a0, 2
; RV64I-NEXT: lui a3, 1035469
; RV64I-NEXT: addiw a3, a3, -819
; RV64I-NEXT: slli a3, a3, 12
; RV64I-NEXT: addi a3, a3, -819
; RV64I-NEXT: slli a3, a3, 12
; RV64I-NEXT: addi a3, a3, -819
; RV64I-NEXT: slli a3, a3, 12
; RV64I-NEXT: addi a3, a3, -820
; RV64I-NEXT: and a1, a1, a3
; RV64I-NEXT: srli a3, a0, 2
; RV64I-NEXT: lui a5, 13107
; RV64I-NEXT: addiw a5, a5, 819
; RV64I-NEXT: slli a5, a5, 12
; RV64I-NEXT: addi a5, a5, 819
; RV64I-NEXT: slli a5, a5, 12
; RV64I-NEXT: addi a5, a5, 819
; RV64I-NEXT: slli a5, a5, 12
; RV64I-NEXT: addi a5, a5, 819
; RV64I-NEXT: and a3, a3, a5
; RV64I-NEXT: or a0, a3, a0
; RV64I-NEXT: or a0, a0, a1
; RV64I-NEXT: slli a1, a0, 1
; RV64I-NEXT: and a1, a1, a2
; RV64I-NEXT: srli a2, a0, 1
; RV64I-NEXT: and a2, a2, a4
; RV64I-NEXT: or a0, a2, a0		; RV64I-NEXT: or a0, a2, a0
; RV64I-NEXT: or a0, a0, a1		; RV64I-NEXT: or a0, a0, a1
; RV64I-NEXT: ret		; RV64I-NEXT: ret
;		;
; RV64ZBP-LABEL: gorc3b_i64:		; RV64ZBP-LABEL: gorc3b_i64:
; RV64ZBP: # %bb.0:		; RV64ZBP: # %bb.0:
; RV64ZBP-NEXT: orc.n a0, a0		; RV64ZBP-NEXT: orc.n a0, a0
; RV64ZBP-NEXT: ret		; RV64ZBP-NEXT: ret
▲ Show 20 Lines • Show All 78 Lines • ▼ Show 20 Lines	; RV64ZBP-NEXT: ret
%shr = and i32 %and1, 1431655765		%shr = and i32 %and1, 1431655765
%or = or i32 %shl, %shr		%or = or i32 %shl, %shr
ret i32 %or		ret i32 %or
}		}

define i64 @grev1_i64(i64 %a) nounwind {		define i64 @grev1_i64(i64 %a) nounwind {
; RV64I-LABEL: grev1_i64:		; RV64I-LABEL: grev1_i64:
; RV64I: # %bb.0:		; RV64I: # %bb.0:
; RV64I-NEXT: slli a1, a0, 1		; RV64I-NEXT: lui a1, %hi(.LCPI28_0)
; RV64I-NEXT: lui a2, 1026731		; RV64I-NEXT: ld a1, %lo(.LCPI28_0)(a1)
; RV64I-NEXT: addiw a2, a2, -1365		; RV64I-NEXT: lui a2, %hi(.LCPI28_1)
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: ld a2, %lo(.LCPI28_1)(a2)
; RV64I-NEXT: addi a2, a2, -1365		; RV64I-NEXT: slli a3, a0, 1
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: and a1, a3, a1
; RV64I-NEXT: addi a2, a2, -1365
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, -1366
; RV64I-NEXT: and a1, a1, a2
; RV64I-NEXT: srli a0, a0, 1		; RV64I-NEXT: srli a0, a0, 1
; RV64I-NEXT: lui a2, 21845
; RV64I-NEXT: addiw a2, a2, 1365
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, 1365
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, 1365
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, 1365
; RV64I-NEXT: and a0, a0, a2		; RV64I-NEXT: and a0, a0, a2
; RV64I-NEXT: or a0, a1, a0		; RV64I-NEXT: or a0, a1, a0
; RV64I-NEXT: ret		; RV64I-NEXT: ret
;		;
; RV64ZBP-LABEL: grev1_i64:		; RV64ZBP-LABEL: grev1_i64:
; RV64ZBP: # %bb.0:		; RV64ZBP: # %bb.0:
; RV64ZBP-NEXT: rev.p a0, a0		; RV64ZBP-NEXT: rev.p a0, a0
; RV64ZBP-NEXT: ret		; RV64ZBP-NEXT: ret
Show All 29 Lines	; RV64ZBP-NEXT: ret
%shr = and i32 %and1, 858993459		%shr = and i32 %and1, 858993459
%or = or i32 %shl, %shr		%or = or i32 %shl, %shr
ret i32 %or		ret i32 %or
}		}

define i64 @grev2_i64(i64 %a) nounwind {		define i64 @grev2_i64(i64 %a) nounwind {
; RV64I-LABEL: grev2_i64:		; RV64I-LABEL: grev2_i64:
; RV64I: # %bb.0:		; RV64I: # %bb.0:
; RV64I-NEXT: slli a1, a0, 2		; RV64I-NEXT: lui a1, %hi(.LCPI30_0)
; RV64I-NEXT: lui a2, 1035469		; RV64I-NEXT: ld a1, %lo(.LCPI30_0)(a1)
; RV64I-NEXT: addiw a2, a2, -819		; RV64I-NEXT: lui a2, %hi(.LCPI30_1)
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: ld a2, %lo(.LCPI30_1)(a2)
; RV64I-NEXT: addi a2, a2, -819		; RV64I-NEXT: slli a3, a0, 2
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: and a1, a3, a1
; RV64I-NEXT: addi a2, a2, -819
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, -820
; RV64I-NEXT: and a1, a1, a2
; RV64I-NEXT: srli a0, a0, 2		; RV64I-NEXT: srli a0, a0, 2
; RV64I-NEXT: lui a2, 13107
; RV64I-NEXT: addiw a2, a2, 819
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, 819
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, 819
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, 819
; RV64I-NEXT: and a0, a0, a2		; RV64I-NEXT: and a0, a0, a2
; RV64I-NEXT: or a0, a1, a0		; RV64I-NEXT: or a0, a1, a0
; RV64I-NEXT: ret		; RV64I-NEXT: ret
;		;
; RV64ZBP-LABEL: grev2_i64:		; RV64ZBP-LABEL: grev2_i64:
; RV64ZBP: # %bb.0:		; RV64ZBP: # %bb.0:
; RV64ZBP-NEXT: rev2.n a0, a0		; RV64ZBP-NEXT: rev2.n a0, a0
; RV64ZBP-NEXT: ret		; RV64ZBP-NEXT: ret
▲ Show 20 Lines • Show All 43 Lines • ▼ Show 20 Lines	; RV64ZBP-NEXT: ret
%shr2 = and i32 %and2b, 858993459		%shr2 = and i32 %and2b, 858993459
%or2 = or i32 %shl2, %shr2		%or2 = or i32 %shl2, %shr2
ret i32 %or2		ret i32 %or2
}		}

define i64 @grev3_i64(i64 %a) nounwind {		define i64 @grev3_i64(i64 %a) nounwind {
; RV64I-LABEL: grev3_i64:		; RV64I-LABEL: grev3_i64:
; RV64I: # %bb.0:		; RV64I: # %bb.0:
; RV64I-NEXT: slli a1, a0, 1		; RV64I-NEXT: lui a1, %hi(.LCPI32_0)
; RV64I-NEXT: lui a2, 1026731		; RV64I-NEXT: ld a1, %lo(.LCPI32_0)(a1)
; RV64I-NEXT: addiw a2, a2, -1365		; RV64I-NEXT: lui a2, %hi(.LCPI32_1)
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: ld a2, %lo(.LCPI32_1)(a2)
; RV64I-NEXT: addi a2, a2, -1365		; RV64I-NEXT: slli a3, a0, 1
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: and a1, a3, a1
; RV64I-NEXT: addi a2, a2, -1365
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, -1366
; RV64I-NEXT: and a1, a1, a2
; RV64I-NEXT: srli a0, a0, 1		; RV64I-NEXT: srli a0, a0, 1
; RV64I-NEXT: lui a2, 21845
; RV64I-NEXT: addiw a2, a2, 1365
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, 1365
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, 1365
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, 1365
; RV64I-NEXT: and a0, a0, a2		; RV64I-NEXT: and a0, a0, a2
; RV64I-NEXT: or a0, a1, a0		; RV64I-NEXT: or a0, a1, a0
; RV64I-NEXT: slli a1, a0, 2		; RV64I-NEXT: lui a1, %hi(.LCPI32_2)
; RV64I-NEXT: lui a2, 1035469		; RV64I-NEXT: ld a1, %lo(.LCPI32_2)(a1)
; RV64I-NEXT: addiw a2, a2, -819		; RV64I-NEXT: lui a2, %hi(.LCPI32_3)
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: ld a2, %lo(.LCPI32_3)(a2)
; RV64I-NEXT: addi a2, a2, -819		; RV64I-NEXT: slli a3, a0, 2
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: and a1, a3, a1
; RV64I-NEXT: addi a2, a2, -819
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, -820
; RV64I-NEXT: and a1, a1, a2
; RV64I-NEXT: srli a0, a0, 2		; RV64I-NEXT: srli a0, a0, 2
; RV64I-NEXT: lui a2, 13107
; RV64I-NEXT: addiw a2, a2, 819
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, 819
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, 819
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, 819
; RV64I-NEXT: and a0, a0, a2		; RV64I-NEXT: and a0, a0, a2
; RV64I-NEXT: or a0, a1, a0		; RV64I-NEXT: or a0, a1, a0
; RV64I-NEXT: ret		; RV64I-NEXT: ret
;		;
; RV64ZBP-LABEL: grev3_i64:		; RV64ZBP-LABEL: grev3_i64:
; RV64ZBP: # %bb.0:		; RV64ZBP: # %bb.0:
; RV64ZBP-NEXT: rev.n a0, a0		; RV64ZBP-NEXT: rev.n a0, a0
; RV64ZBP-NEXT: ret		; RV64ZBP-NEXT: ret
Show All 34 Lines	; RV64ZBP-NEXT: ret
%shr = and i32 %and1, 252645135		%shr = and i32 %and1, 252645135
%or = or i32 %shl, %shr		%or = or i32 %shl, %shr
ret i32 %or		ret i32 %or
}		}

define i64 @grev4_i64(i64 %a) nounwind {		define i64 @grev4_i64(i64 %a) nounwind {
; RV64I-LABEL: grev4_i64:		; RV64I-LABEL: grev4_i64:
; RV64I: # %bb.0:		; RV64I: # %bb.0:
; RV64I-NEXT: slli a1, a0, 4		; RV64I-NEXT: lui a1, %hi(.LCPI34_0)
; RV64I-NEXT: lui a2, 1044721		; RV64I-NEXT: ld a1, %lo(.LCPI34_0)(a1)
; RV64I-NEXT: addiw a2, a2, -241		; RV64I-NEXT: lui a2, %hi(.LCPI34_1)
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: ld a2, %lo(.LCPI34_1)(a2)
; RV64I-NEXT: addi a2, a2, 241		; RV64I-NEXT: slli a3, a0, 4
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: and a1, a3, a1
; RV64I-NEXT: addi a2, a2, -241
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, 240
; RV64I-NEXT: and a1, a1, a2
; RV64I-NEXT: srli a0, a0, 4		; RV64I-NEXT: srli a0, a0, 4
; RV64I-NEXT: lui a2, 3855
; RV64I-NEXT: addiw a2, a2, 241
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, -241
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, 241
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, -241
; RV64I-NEXT: and a0, a0, a2		; RV64I-NEXT: and a0, a0, a2
; RV64I-NEXT: or a0, a1, a0		; RV64I-NEXT: or a0, a1, a0
; RV64I-NEXT: ret		; RV64I-NEXT: ret
;		;
; RV64ZBP-LABEL: grev4_i64:		; RV64ZBP-LABEL: grev4_i64:
; RV64ZBP: # %bb.0:		; RV64ZBP: # %bb.0:
; RV64ZBP-NEXT: rev4.b a0, a0		; RV64ZBP-NEXT: rev4.b a0, a0
; RV64ZBP-NEXT: ret		; RV64ZBP-NEXT: ret
▲ Show 20 Lines • Show All 43 Lines • ▼ Show 20 Lines	; RV64ZBP-NEXT: ret
%shr2 = and i32 %and2b, 252645135		%shr2 = and i32 %and2b, 252645135
%or2 = or i32 %shl2, %shr2		%or2 = or i32 %shl2, %shr2
ret i32 %or2		ret i32 %or2
}		}

define i64 @grev5_i64(i64 %a) nounwind {		define i64 @grev5_i64(i64 %a) nounwind {
; RV64I-LABEL: grev5_i64:		; RV64I-LABEL: grev5_i64:
; RV64I: # %bb.0:		; RV64I: # %bb.0:
; RV64I-NEXT: slli a1, a0, 1		; RV64I-NEXT: lui a1, %hi(.LCPI36_0)
; RV64I-NEXT: lui a2, 1026731		; RV64I-NEXT: ld a1, %lo(.LCPI36_0)(a1)
; RV64I-NEXT: addiw a2, a2, -1365		; RV64I-NEXT: lui a2, %hi(.LCPI36_1)
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: ld a2, %lo(.LCPI36_1)(a2)
; RV64I-NEXT: addi a2, a2, -1365		; RV64I-NEXT: slli a3, a0, 1
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: and a1, a3, a1
; RV64I-NEXT: addi a2, a2, -1365
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, -1366
; RV64I-NEXT: and a1, a1, a2
; RV64I-NEXT: srli a0, a0, 1		; RV64I-NEXT: srli a0, a0, 1
; RV64I-NEXT: lui a2, 21845
; RV64I-NEXT: addiw a2, a2, 1365
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, 1365
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, 1365
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, 1365
; RV64I-NEXT: and a0, a0, a2		; RV64I-NEXT: and a0, a0, a2
; RV64I-NEXT: or a0, a1, a0		; RV64I-NEXT: or a0, a1, a0
; RV64I-NEXT: slli a1, a0, 4		; RV64I-NEXT: lui a1, %hi(.LCPI36_2)
; RV64I-NEXT: lui a2, 1044721		; RV64I-NEXT: ld a1, %lo(.LCPI36_2)(a1)
; RV64I-NEXT: addiw a2, a2, -241		; RV64I-NEXT: lui a2, %hi(.LCPI36_3)
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: ld a2, %lo(.LCPI36_3)(a2)
; RV64I-NEXT: addi a2, a2, 241		; RV64I-NEXT: slli a3, a0, 4
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: and a1, a3, a1
; RV64I-NEXT: addi a2, a2, -241
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, 240
; RV64I-NEXT: and a1, a1, a2
; RV64I-NEXT: srli a0, a0, 4		; RV64I-NEXT: srli a0, a0, 4
; RV64I-NEXT: lui a2, 3855
; RV64I-NEXT: addiw a2, a2, 241
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, -241
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, 241
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, -241
; RV64I-NEXT: and a0, a0, a2		; RV64I-NEXT: and a0, a0, a2
; RV64I-NEXT: or a0, a1, a0		; RV64I-NEXT: or a0, a1, a0
; RV64I-NEXT: ret		; RV64I-NEXT: ret
;		;
; RV64ZBP-LABEL: grev5_i64:		; RV64ZBP-LABEL: grev5_i64:
; RV64ZBP: # %bb.0:		; RV64ZBP: # %bb.0:
; RV64ZBP-NEXT: grevi a0, a0, 5		; RV64ZBP-NEXT: grevi a0, a0, 5
; RV64ZBP-NEXT: ret		; RV64ZBP-NEXT: ret
▲ Show 20 Lines • Show All 49 Lines • ▼ Show 20 Lines	; RV64ZBP-NEXT: ret
%shr2 = and i32 %and2b, 252645135		%shr2 = and i32 %and2b, 252645135
%or2 = or i32 %shl2, %shr2		%or2 = or i32 %shl2, %shr2
ret i32 %or2		ret i32 %or2
}		}

define i64 @grev6_i64(i64 %a) nounwind {		define i64 @grev6_i64(i64 %a) nounwind {
; RV64I-LABEL: grev6_i64:		; RV64I-LABEL: grev6_i64:
; RV64I: # %bb.0:		; RV64I: # %bb.0:
; RV64I-NEXT: slli a1, a0, 2		; RV64I-NEXT: lui a1, %hi(.LCPI38_0)
; RV64I-NEXT: lui a2, 1035469		; RV64I-NEXT: ld a1, %lo(.LCPI38_0)(a1)
; RV64I-NEXT: addiw a2, a2, -819		; RV64I-NEXT: lui a2, %hi(.LCPI38_1)
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: ld a2, %lo(.LCPI38_1)(a2)
; RV64I-NEXT: addi a2, a2, -819		; RV64I-NEXT: slli a3, a0, 2
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: and a1, a3, a1
; RV64I-NEXT: addi a2, a2, -819
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, -820
; RV64I-NEXT: and a1, a1, a2
; RV64I-NEXT: srli a0, a0, 2		; RV64I-NEXT: srli a0, a0, 2
; RV64I-NEXT: lui a2, 13107
; RV64I-NEXT: addiw a2, a2, 819
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, 819
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, 819
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, 819
; RV64I-NEXT: and a0, a0, a2		; RV64I-NEXT: and a0, a0, a2
; RV64I-NEXT: or a0, a1, a0		; RV64I-NEXT: or a0, a1, a0
; RV64I-NEXT: slli a1, a0, 4		; RV64I-NEXT: lui a1, %hi(.LCPI38_2)
; RV64I-NEXT: lui a2, 1044721		; RV64I-NEXT: ld a1, %lo(.LCPI38_2)(a1)
; RV64I-NEXT: addiw a2, a2, -241		; RV64I-NEXT: lui a2, %hi(.LCPI38_3)
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: ld a2, %lo(.LCPI38_3)(a2)
; RV64I-NEXT: addi a2, a2, 241		; RV64I-NEXT: slli a3, a0, 4
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: and a1, a3, a1
; RV64I-NEXT: addi a2, a2, -241
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, 240
; RV64I-NEXT: and a1, a1, a2
; RV64I-NEXT: srli a0, a0, 4		; RV64I-NEXT: srli a0, a0, 4
; RV64I-NEXT: lui a2, 3855
; RV64I-NEXT: addiw a2, a2, 241
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, -241
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, 241
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, -241
; RV64I-NEXT: and a0, a0, a2		; RV64I-NEXT: and a0, a0, a2
; RV64I-NEXT: or a0, a1, a0		; RV64I-NEXT: or a0, a1, a0
; RV64I-NEXT: ret		; RV64I-NEXT: ret
;		;
; RV64ZBP-LABEL: grev6_i64:		; RV64ZBP-LABEL: grev6_i64:
; RV64ZBP: # %bb.0:		; RV64ZBP: # %bb.0:
; RV64ZBP-NEXT: rev2.b a0, a0		; RV64ZBP-NEXT: rev2.b a0, a0
; RV64ZBP-NEXT: ret		; RV64ZBP-NEXT: ret
▲ Show 20 Lines • Show All 62 Lines • ▼ Show 20 Lines	; RV64ZBP-NEXT: ret
%shr3 = and i32 %and3b, 252645135		%shr3 = and i32 %and3b, 252645135
%or3 = or i32 %shl3, %shr3		%or3 = or i32 %shl3, %shr3
ret i32 %or3		ret i32 %or3
}		}

define i64 @grev7_i64(i64 %a) nounwind {		define i64 @grev7_i64(i64 %a) nounwind {
; RV64I-LABEL: grev7_i64:		; RV64I-LABEL: grev7_i64:
; RV64I: # %bb.0:		; RV64I: # %bb.0:
; RV64I-NEXT: slli a1, a0, 1		; RV64I-NEXT: lui a1, %hi(.LCPI40_0)
; RV64I-NEXT: lui a2, 1026731		; RV64I-NEXT: ld a1, %lo(.LCPI40_0)(a1)
; RV64I-NEXT: addiw a2, a2, -1365		; RV64I-NEXT: lui a2, %hi(.LCPI40_1)
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: ld a2, %lo(.LCPI40_1)(a2)
; RV64I-NEXT: addi a2, a2, -1365		; RV64I-NEXT: slli a3, a0, 1
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: and a1, a3, a1
; RV64I-NEXT: addi a2, a2, -1365
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, -1366
; RV64I-NEXT: and a1, a1, a2
; RV64I-NEXT: srli a0, a0, 1		; RV64I-NEXT: srli a0, a0, 1
; RV64I-NEXT: lui a2, 21845
; RV64I-NEXT: addiw a2, a2, 1365
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, 1365
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, 1365
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, 1365
; RV64I-NEXT: and a0, a0, a2		; RV64I-NEXT: and a0, a0, a2
; RV64I-NEXT: or a0, a1, a0		; RV64I-NEXT: or a0, a1, a0
; RV64I-NEXT: slli a1, a0, 2		; RV64I-NEXT: lui a1, %hi(.LCPI40_2)
; RV64I-NEXT: lui a2, 1035469		; RV64I-NEXT: ld a1, %lo(.LCPI40_2)(a1)
; RV64I-NEXT: addiw a2, a2, -819		; RV64I-NEXT: lui a2, %hi(.LCPI40_3)
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: ld a2, %lo(.LCPI40_3)(a2)
; RV64I-NEXT: addi a2, a2, -819		; RV64I-NEXT: slli a3, a0, 2
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: and a1, a3, a1
; RV64I-NEXT: addi a2, a2, -819
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, -820
; RV64I-NEXT: and a1, a1, a2
; RV64I-NEXT: srli a0, a0, 2		; RV64I-NEXT: srli a0, a0, 2
; RV64I-NEXT: lui a2, 13107
; RV64I-NEXT: addiw a2, a2, 819
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, 819
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, 819
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, 819
; RV64I-NEXT: and a0, a0, a2		; RV64I-NEXT: and a0, a0, a2
; RV64I-NEXT: or a0, a1, a0		; RV64I-NEXT: or a0, a1, a0
; RV64I-NEXT: slli a1, a0, 4		; RV64I-NEXT: lui a1, %hi(.LCPI40_4)
; RV64I-NEXT: lui a2, 1044721		; RV64I-NEXT: ld a1, %lo(.LCPI40_4)(a1)
; RV64I-NEXT: addiw a2, a2, -241		; RV64I-NEXT: lui a2, %hi(.LCPI40_5)
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: ld a2, %lo(.LCPI40_5)(a2)
; RV64I-NEXT: addi a2, a2, 241		; RV64I-NEXT: slli a3, a0, 4
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: and a1, a3, a1
; RV64I-NEXT: addi a2, a2, -241
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, 240
; RV64I-NEXT: and a1, a1, a2
; RV64I-NEXT: srli a0, a0, 4		; RV64I-NEXT: srli a0, a0, 4
; RV64I-NEXT: lui a2, 3855
; RV64I-NEXT: addiw a2, a2, 241
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, -241
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, 241
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, -241
; RV64I-NEXT: and a0, a0, a2		; RV64I-NEXT: and a0, a0, a2
; RV64I-NEXT: or a0, a1, a0		; RV64I-NEXT: or a0, a1, a0
; RV64I-NEXT: ret		; RV64I-NEXT: ret
;		;
; RV64ZBP-LABEL: grev7_i64:		; RV64ZBP-LABEL: grev7_i64:
; RV64ZBP: # %bb.0:		; RV64ZBP: # %bb.0:
; RV64ZBP-NEXT: rev.b a0, a0		; RV64ZBP-NEXT: rev.b a0, a0
; RV64ZBP-NEXT: ret		; RV64ZBP-NEXT: ret
Show All 39 Lines	; RV64ZBP-NEXT: ret
%shr = and i32 %and1, 16711935		%shr = and i32 %and1, 16711935
%or = or i32 %shl, %shr		%or = or i32 %shl, %shr
ret i32 %or		ret i32 %or
}		}

define i64 @grev8_i64(i64 %a) nounwind {		define i64 @grev8_i64(i64 %a) nounwind {
; RV64I-LABEL: grev8_i64:		; RV64I-LABEL: grev8_i64:
; RV64I: # %bb.0:		; RV64I: # %bb.0:
; RV64I-NEXT: slli a1, a0, 8		; RV64I-NEXT: lui a1, %hi(.LCPI42_0)
; RV64I-NEXT: lui a2, 1044496		; RV64I-NEXT: ld a1, %lo(.LCPI42_0)(a1)
; RV64I-NEXT: addiw a2, a2, -255		; RV64I-NEXT: lui a2, %hi(.LCPI42_1)
; RV64I-NEXT: slli a2, a2, 16		; RV64I-NEXT: ld a2, %lo(.LCPI42_1)(a2)
; RV64I-NEXT: addi a2, a2, -255		; RV64I-NEXT: slli a3, a0, 8
; RV64I-NEXT: slli a2, a2, 16		; RV64I-NEXT: and a1, a3, a1
; RV64I-NEXT: addi a2, a2, -256
; RV64I-NEXT: and a1, a1, a2
; RV64I-NEXT: srli a0, a0, 8		; RV64I-NEXT: srli a0, a0, 8
; RV64I-NEXT: lui a2, 4080
; RV64I-NEXT: addiw a2, a2, 255
; RV64I-NEXT: slli a2, a2, 16
; RV64I-NEXT: addi a2, a2, 255
; RV64I-NEXT: slli a2, a2, 16
; RV64I-NEXT: addi a2, a2, 255
; RV64I-NEXT: and a0, a0, a2		; RV64I-NEXT: and a0, a0, a2
; RV64I-NEXT: or a0, a1, a0		; RV64I-NEXT: or a0, a1, a0
; RV64I-NEXT: ret		; RV64I-NEXT: ret
;		;
; RV64ZBP-LABEL: grev8_i64:		; RV64ZBP-LABEL: grev8_i64:
; RV64ZBP: # %bb.0:		; RV64ZBP: # %bb.0:
; RV64ZBP-NEXT: rev8.h a0, a0		; RV64ZBP-NEXT: rev8.h a0, a0
; RV64ZBP-NEXT: ret		; RV64ZBP-NEXT: ret
▲ Show 20 Lines • Show All 143 Lines • ▼ Show 20 Lines	; RV64ZBP-NEXT: ret
%shr1 = and i32 %and1b, 1431655765		%shr1 = and i32 %and1b, 1431655765
%or1 = or i32 %shl1, %shr1		%or1 = or i32 %shl1, %shr1
ret i32 %or1		ret i32 %or1
}		}

define i64 @grev3b_i64(i64 %a) nounwind {		define i64 @grev3b_i64(i64 %a) nounwind {
; RV64I-LABEL: grev3b_i64:		; RV64I-LABEL: grev3b_i64:
; RV64I: # %bb.0:		; RV64I: # %bb.0:
; RV64I-NEXT: slli a1, a0, 2		; RV64I-NEXT: lui a1, %hi(.LCPI49_0)
; RV64I-NEXT: lui a2, 1035469		; RV64I-NEXT: ld a1, %lo(.LCPI49_0)(a1)
; RV64I-NEXT: addiw a2, a2, -819		; RV64I-NEXT: lui a2, %hi(.LCPI49_1)
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: ld a2, %lo(.LCPI49_1)(a2)
; RV64I-NEXT: addi a2, a2, -819		; RV64I-NEXT: slli a3, a0, 2
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: and a1, a3, a1
; RV64I-NEXT: addi a2, a2, -819
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, -820
; RV64I-NEXT: and a1, a1, a2
; RV64I-NEXT: srli a0, a0, 2		; RV64I-NEXT: srli a0, a0, 2
; RV64I-NEXT: lui a2, 13107
; RV64I-NEXT: addiw a2, a2, 819
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, 819
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, 819
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, 819
; RV64I-NEXT: and a0, a0, a2		; RV64I-NEXT: and a0, a0, a2
; RV64I-NEXT: or a0, a1, a0		; RV64I-NEXT: or a0, a1, a0
; RV64I-NEXT: slli a1, a0, 1		; RV64I-NEXT: lui a1, %hi(.LCPI49_2)
; RV64I-NEXT: lui a2, 1026731		; RV64I-NEXT: ld a1, %lo(.LCPI49_2)(a1)
; RV64I-NEXT: addiw a2, a2, -1365		; RV64I-NEXT: lui a2, %hi(.LCPI49_3)
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: ld a2, %lo(.LCPI49_3)(a2)
; RV64I-NEXT: addi a2, a2, -1365		; RV64I-NEXT: slli a3, a0, 1
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: and a1, a3, a1
; RV64I-NEXT: addi a2, a2, -1365
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, -1366
; RV64I-NEXT: and a1, a1, a2
; RV64I-NEXT: srli a0, a0, 1		; RV64I-NEXT: srli a0, a0, 1
; RV64I-NEXT: lui a2, 21845
; RV64I-NEXT: addiw a2, a2, 1365
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, 1365
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, 1365
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, 1365
; RV64I-NEXT: and a0, a0, a2		; RV64I-NEXT: and a0, a0, a2
; RV64I-NEXT: or a0, a1, a0		; RV64I-NEXT: or a0, a1, a0
; RV64I-NEXT: ret		; RV64I-NEXT: ret
;		;
; RV64ZBP-LABEL: grev3b_i64:		; RV64ZBP-LABEL: grev3b_i64:
; RV64ZBP: # %bb.0:		; RV64ZBP: # %bb.0:
; RV64ZBP-NEXT: rev.n a0, a0		; RV64ZBP-NEXT: rev.n a0, a0
; RV64ZBP-NEXT: ret		; RV64ZBP-NEXT: ret
▲ Show 20 Lines • Show All 60 Lines • ▼ Show 20 Lines	; RV64ZBP-NEXT: ret
%or3 = or i32 %shl3, %shr3		%or3 = or i32 %shl3, %shr3
ret i32 %or3		ret i32 %or3
}		}

; grev1, grev2, grev1 -> grev2		; grev1, grev2, grev1 -> grev2
define i64 @grev2b_i64(i64 %a) nounwind {		define i64 @grev2b_i64(i64 %a) nounwind {
; RV64I-LABEL: grev2b_i64:		; RV64I-LABEL: grev2b_i64:
; RV64I: # %bb.0:		; RV64I: # %bb.0:
; RV64I-NEXT: slli a1, a0, 1		; RV64I-NEXT: lui a1, %hi(.LCPI51_0)
; RV64I-NEXT: lui a2, 1026731		; RV64I-NEXT: ld a1, %lo(.LCPI51_0)(a1)
; RV64I-NEXT: addiw a2, a2, -1365		; RV64I-NEXT: lui a2, %hi(.LCPI51_1)
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: ld a2, %lo(.LCPI51_1)(a2)
; RV64I-NEXT: addi a2, a2, -1365		; RV64I-NEXT: slli a3, a0, 1
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: and a3, a3, a1
; RV64I-NEXT: addi a2, a2, -1365
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, -1366
; RV64I-NEXT: and a1, a1, a2
; RV64I-NEXT: srli a0, a0, 1		; RV64I-NEXT: srli a0, a0, 1
; RV64I-NEXT: lui a3, 21845		; RV64I-NEXT: and a0, a0, a2
; RV64I-NEXT: addiw a3, a3, 1365		; RV64I-NEXT: or a0, a3, a0
; RV64I-NEXT: slli a3, a3, 12		; RV64I-NEXT: lui a3, %hi(.LCPI51_2)
; RV64I-NEXT: addi a3, a3, 1365		; RV64I-NEXT: ld a3, %lo(.LCPI51_2)(a3)
; RV64I-NEXT: slli a3, a3, 12		; RV64I-NEXT: lui a4, %hi(.LCPI51_3)
; RV64I-NEXT: addi a3, a3, 1365		; RV64I-NEXT: ld a4, %lo(.LCPI51_3)(a4)
; RV64I-NEXT: slli a3, a3, 12		; RV64I-NEXT: slli a5, a0, 2
; RV64I-NEXT: addi a3, a3, 1365		; RV64I-NEXT: and a3, a5, a3
; RV64I-NEXT: and a0, a0, a3
; RV64I-NEXT: or a0, a1, a0
; RV64I-NEXT: slli a1, a0, 2
; RV64I-NEXT: lui a4, 1035469
; RV64I-NEXT: addiw a4, a4, -819
; RV64I-NEXT: slli a4, a4, 12
; RV64I-NEXT: addi a4, a4, -819
; RV64I-NEXT: slli a4, a4, 12
; RV64I-NEXT: addi a4, a4, -819
; RV64I-NEXT: slli a4, a4, 12
; RV64I-NEXT: addi a4, a4, -820
; RV64I-NEXT: and a1, a1, a4
; RV64I-NEXT: srli a0, a0, 2		; RV64I-NEXT: srli a0, a0, 2
; RV64I-NEXT: lui a4, 13107
; RV64I-NEXT: addiw a4, a4, 819
; RV64I-NEXT: slli a4, a4, 12
; RV64I-NEXT: addi a4, a4, 819
; RV64I-NEXT: slli a4, a4, 12
; RV64I-NEXT: addi a4, a4, 819
; RV64I-NEXT: slli a4, a4, 12
; RV64I-NEXT: addi a4, a4, 819
; RV64I-NEXT: and a0, a0, a4		; RV64I-NEXT: and a0, a0, a4
; RV64I-NEXT: or a0, a1, a0		; RV64I-NEXT: or a0, a3, a0
; RV64I-NEXT: slli a1, a0, 1		; RV64I-NEXT: slli a3, a0, 1
; RV64I-NEXT: and a1, a1, a2		; RV64I-NEXT: and a1, a3, a1
; RV64I-NEXT: srli a0, a0, 1		; RV64I-NEXT: srli a0, a0, 1
; RV64I-NEXT: and a0, a0, a3		; RV64I-NEXT: and a0, a0, a2
; RV64I-NEXT: or a0, a1, a0		; RV64I-NEXT: or a0, a1, a0
; RV64I-NEXT: ret		; RV64I-NEXT: ret
;		;
; RV64ZBP-LABEL: grev2b_i64:		; RV64ZBP-LABEL: grev2b_i64:
; RV64ZBP: # %bb.0:		; RV64ZBP: # %bb.0:
; RV64ZBP-NEXT: rev2.n a0, a0		; RV64ZBP-NEXT: rev2.n a0, a0
; RV64ZBP-NEXT: ret		; RV64ZBP-NEXT: ret
%and1 = shl i64 %a, 1		%and1 = shl i64 %a, 1
▲ Show 20 Lines • Show All 73 Lines • ▼ Show 20 Lines	; RV64ZBP-NEXT: ret
%or4 = or i32 %shl4, %shr4		%or4 = or i32 %shl4, %shr4
ret i32 %or4		ret i32 %or4
}		}

; grev1, grev2, grev1, grev2 -> identity		; grev1, grev2, grev1, grev2 -> identity
define i64 @grev0_i64(i64 %a) nounwind {		define i64 @grev0_i64(i64 %a) nounwind {
; RV64I-LABEL: grev0_i64:		; RV64I-LABEL: grev0_i64:
; RV64I: # %bb.0:		; RV64I: # %bb.0:
; RV64I-NEXT: slli a1, a0, 1		; RV64I-NEXT: lui a1, %hi(.LCPI53_0)
; RV64I-NEXT: lui a2, 1026731		; RV64I-NEXT: ld a1, %lo(.LCPI53_0)(a1)
; RV64I-NEXT: addiw a2, a2, -1365		; RV64I-NEXT: lui a2, %hi(.LCPI53_1)
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: ld a2, %lo(.LCPI53_1)(a2)
; RV64I-NEXT: addi a2, a2, -1365		; RV64I-NEXT: slli a3, a0, 1
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: and a3, a3, a1
; RV64I-NEXT: addi a2, a2, -1365
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, -1366
; RV64I-NEXT: and a1, a1, a2
; RV64I-NEXT: srli a0, a0, 1		; RV64I-NEXT: srli a0, a0, 1
; RV64I-NEXT: lui a3, 21845		; RV64I-NEXT: and a0, a0, a2
; RV64I-NEXT: addiw a3, a3, 1365		; RV64I-NEXT: or a0, a3, a0
; RV64I-NEXT: slli a3, a3, 12		; RV64I-NEXT: lui a3, %hi(.LCPI53_2)
; RV64I-NEXT: addi a3, a3, 1365		; RV64I-NEXT: ld a3, %lo(.LCPI53_2)(a3)
; RV64I-NEXT: slli a3, a3, 12		; RV64I-NEXT: lui a4, %hi(.LCPI53_3)
; RV64I-NEXT: addi a3, a3, 1365		; RV64I-NEXT: ld a4, %lo(.LCPI53_3)(a4)
; RV64I-NEXT: slli a3, a3, 12		; RV64I-NEXT: slli a5, a0, 2
; RV64I-NEXT: addi a3, a3, 1365		; RV64I-NEXT: and a5, a5, a3
; RV64I-NEXT: and a0, a0, a3
; RV64I-NEXT: or a0, a1, a0
; RV64I-NEXT: slli a1, a0, 2
; RV64I-NEXT: lui a4, 1035469
; RV64I-NEXT: addiw a4, a4, -819
; RV64I-NEXT: slli a4, a4, 12
; RV64I-NEXT: addi a4, a4, -819
; RV64I-NEXT: slli a4, a4, 12
; RV64I-NEXT: addi a4, a4, -819
; RV64I-NEXT: slli a4, a4, 12
; RV64I-NEXT: addi a4, a4, -820
; RV64I-NEXT: and a1, a1, a4
; RV64I-NEXT: srli a0, a0, 2		; RV64I-NEXT: srli a0, a0, 2
; RV64I-NEXT: lui a5, 13107		; RV64I-NEXT: and a0, a0, a4
; RV64I-NEXT: addiw a5, a5, 819		; RV64I-NEXT: or a0, a5, a0
; RV64I-NEXT: slli a5, a5, 12		; RV64I-NEXT: slli a5, a0, 1
; RV64I-NEXT: addi a5, a5, 819		; RV64I-NEXT: and a1, a5, a1
; RV64I-NEXT: slli a5, a5, 12
; RV64I-NEXT: addi a5, a5, 819
; RV64I-NEXT: slli a5, a5, 12
; RV64I-NEXT: addi a5, a5, 819
; RV64I-NEXT: and a0, a0, a5
; RV64I-NEXT: or a0, a1, a0
; RV64I-NEXT: slli a1, a0, 1
; RV64I-NEXT: and a1, a1, a2
; RV64I-NEXT: srli a0, a0, 1		; RV64I-NEXT: srli a0, a0, 1
; RV64I-NEXT: and a0, a0, a3		; RV64I-NEXT: and a0, a0, a2
; RV64I-NEXT: or a0, a1, a0		; RV64I-NEXT: or a0, a1, a0
; RV64I-NEXT: slli a1, a0, 2		; RV64I-NEXT: slli a1, a0, 2
; RV64I-NEXT: and a1, a1, a4		; RV64I-NEXT: and a1, a1, a3
; RV64I-NEXT: srli a0, a0, 2		; RV64I-NEXT: srli a0, a0, 2
; RV64I-NEXT: and a0, a0, a5		; RV64I-NEXT: and a0, a0, a4
; RV64I-NEXT: or a0, a1, a0		; RV64I-NEXT: or a0, a1, a0
; RV64I-NEXT: ret		; RV64I-NEXT: ret
;		;
; RV64ZBP-LABEL: grev0_i64:		; RV64ZBP-LABEL: grev0_i64:
; RV64ZBP: # %bb.0:		; RV64ZBP: # %bb.0:
; RV64ZBP-NEXT: ret		; RV64ZBP-NEXT: ret
%and1 = shl i64 %a, 1		%and1 = shl i64 %a, 1
%shl1 = and i64 %and1, -6148914691236517206		%shl1 = and i64 %and1, -6148914691236517206
▲ Show 20 Lines • Show All 365 Lines • ▼ Show 20 Lines
; RV64I-NEXT: srliw a4, a0, 24		; RV64I-NEXT: srliw a4, a0, 24
; RV64I-NEXT: slli a4, a4, 32		; RV64I-NEXT: slli a4, a4, 32
; RV64I-NEXT: or a2, a2, a4		; RV64I-NEXT: or a2, a2, a4
; RV64I-NEXT: slli a4, a0, 40		; RV64I-NEXT: slli a4, a0, 40
; RV64I-NEXT: slli a3, a3, 48		; RV64I-NEXT: slli a3, a3, 48
; RV64I-NEXT: and a3, a4, a3		; RV64I-NEXT: and a3, a4, a3
; RV64I-NEXT: slli a0, a0, 56		; RV64I-NEXT: slli a0, a0, 56
; RV64I-NEXT: or a0, a0, a3		; RV64I-NEXT: or a0, a0, a3
		; RV64I-NEXT: lui a3, %hi(.LCPI64_0)
		; RV64I-NEXT: ld a3, %lo(.LCPI64_0)(a3)
; RV64I-NEXT: or a0, a0, a2		; RV64I-NEXT: or a0, a0, a2
; RV64I-NEXT: or a0, a0, a1		; RV64I-NEXT: or a0, a0, a1
; RV64I-NEXT: srli a1, a0, 4		; RV64I-NEXT: srli a1, a0, 4
; RV64I-NEXT: lui a2, 3855		; RV64I-NEXT: and a1, a1, a3
; RV64I-NEXT: addiw a2, a2, 241		; RV64I-NEXT: and a0, a0, a3
; RV64I-NEXT: slli a2, a2, 12		; RV64I-NEXT: lui a2, %hi(.LCPI64_1)
; RV64I-NEXT: addi a2, a2, -241		; RV64I-NEXT: ld a2, %lo(.LCPI64_1)(a2)
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, 241
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, -241
; RV64I-NEXT: and a1, a1, a2
; RV64I-NEXT: and a0, a0, a2
; RV64I-NEXT: slli a0, a0, 4		; RV64I-NEXT: slli a0, a0, 4
; RV64I-NEXT: or a0, a1, a0		; RV64I-NEXT: or a0, a1, a0
; RV64I-NEXT: srli a1, a0, 2		; RV64I-NEXT: srli a1, a0, 2
; RV64I-NEXT: lui a2, 13107
; RV64I-NEXT: addiw a2, a2, 819
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, 819
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, 819
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, 819
; RV64I-NEXT: and a1, a1, a2		; RV64I-NEXT: and a1, a1, a2
; RV64I-NEXT: and a0, a0, a2		; RV64I-NEXT: and a0, a0, a2
		; RV64I-NEXT: lui a2, %hi(.LCPI64_2)
		; RV64I-NEXT: ld a2, %lo(.LCPI64_2)(a2)
; RV64I-NEXT: slli a0, a0, 2		; RV64I-NEXT: slli a0, a0, 2
; RV64I-NEXT: or a0, a1, a0		; RV64I-NEXT: or a0, a1, a0
; RV64I-NEXT: srli a1, a0, 1		; RV64I-NEXT: srli a1, a0, 1
; RV64I-NEXT: lui a2, 21845
; RV64I-NEXT: addiw a2, a2, 1365
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, 1365
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, 1365
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, 1365
; RV64I-NEXT: and a1, a1, a2		; RV64I-NEXT: and a1, a1, a2
; RV64I-NEXT: and a0, a0, a2		; RV64I-NEXT: and a0, a0, a2
; RV64I-NEXT: slli a0, a0, 1		; RV64I-NEXT: slli a0, a0, 1
; RV64I-NEXT: or a0, a1, a0		; RV64I-NEXT: or a0, a1, a0
; RV64I-NEXT: ret		; RV64I-NEXT: ret
;		;
; RV64ZBP-LABEL: bitreverse_i64:		; RV64ZBP-LABEL: bitreverse_i64:
; RV64ZBP: # %bb.0:		; RV64ZBP: # %bb.0:
▲ Show 20 Lines • Show All 109 Lines • ▼ Show 20 Lines	; RV64ZBP-NEXT: ret
%1 = call i32 @llvm.bitreverse.i32(i32 %a)		%1 = call i32 @llvm.bitreverse.i32(i32 %a)
%2 = call i32 @llvm.bswap.i32(i32 %1)		%2 = call i32 @llvm.bswap.i32(i32 %1)
ret i32 %2		ret i32 %2
}		}

define i64 @bitreverse_bswap_i64(i64 %a) {		define i64 @bitreverse_bswap_i64(i64 %a) {
; RV64I-LABEL: bitreverse_bswap_i64:		; RV64I-LABEL: bitreverse_bswap_i64:
; RV64I: # %bb.0:		; RV64I: # %bb.0:
; RV64I-NEXT: srli a2, a0, 24		; RV64I-NEXT: srli a1, a0, 24
; RV64I-NEXT: lui a6, 4080		; RV64I-NEXT: lui a6, 4080
; RV64I-NEXT: and a3, a2, a6		; RV64I-NEXT: and a1, a1, a6
; RV64I-NEXT: srli a4, a0, 8		; RV64I-NEXT: srli a3, a0, 8
; RV64I-NEXT: li a1, 255		; RV64I-NEXT: li a4, 255
; RV64I-NEXT: slli a7, a1, 24		; RV64I-NEXT: slli a7, a4, 24
; RV64I-NEXT: and a4, a4, a7		; RV64I-NEXT: and a3, a3, a7
; RV64I-NEXT: or a3, a4, a3		; RV64I-NEXT: or a1, a3, a1
; RV64I-NEXT: srli a4, a0, 40		; RV64I-NEXT: srli a3, a0, 40
; RV64I-NEXT: lui a5, 16		; RV64I-NEXT: lui a2, 16
; RV64I-NEXT: addiw a5, a5, -256		; RV64I-NEXT: addiw a2, a2, -256
; RV64I-NEXT: and a4, a4, a5		; RV64I-NEXT: and a3, a3, a2
; RV64I-NEXT: srli a2, a0, 56		; RV64I-NEXT: srli a5, a0, 56
; RV64I-NEXT: or a2, a4, a2		; RV64I-NEXT: or a3, a3, a5
; RV64I-NEXT: or a2, a3, a2		; RV64I-NEXT: or a1, a1, a3
; RV64I-NEXT: slli a4, a0, 24		; RV64I-NEXT: slli a3, a0, 24
; RV64I-NEXT: slli t0, a1, 40		; RV64I-NEXT: slli t0, a4, 40
; RV64I-NEXT: and a4, a4, t0		; RV64I-NEXT: and a3, a3, t0
; RV64I-NEXT: srliw a3, a0, 24		; RV64I-NEXT: srliw a5, a0, 24
; RV64I-NEXT: slli a3, a3, 32		; RV64I-NEXT: slli a5, a5, 32
; RV64I-NEXT: or a3, a4, a3		; RV64I-NEXT: or a3, a3, a5
; RV64I-NEXT: slli a4, a0, 40		; RV64I-NEXT: slli a5, a0, 40
; RV64I-NEXT: slli a1, a1, 48		; RV64I-NEXT: slli a4, a4, 48
; RV64I-NEXT: and a4, a4, a1		; RV64I-NEXT: and a5, a5, a4
; RV64I-NEXT: slli a0, a0, 56		; RV64I-NEXT: slli a0, a0, 56
; RV64I-NEXT: or a0, a0, a4		; RV64I-NEXT: or a0, a0, a5
		; RV64I-NEXT: lui a5, %hi(.LCPI68_0)
		; RV64I-NEXT: ld a5, %lo(.LCPI68_0)(a5)
; RV64I-NEXT: or a0, a0, a3		; RV64I-NEXT: or a0, a0, a3
; RV64I-NEXT: or a0, a0, a2		; RV64I-NEXT: or a0, a0, a1
; RV64I-NEXT: srli a2, a0, 4		; RV64I-NEXT: srli a1, a0, 4
; RV64I-NEXT: lui a3, 3855		; RV64I-NEXT: and a1, a1, a5
; RV64I-NEXT: addiw a3, a3, 241		; RV64I-NEXT: and a0, a0, a5
; RV64I-NEXT: slli a3, a3, 12		; RV64I-NEXT: lui a3, %hi(.LCPI68_1)
; RV64I-NEXT: addi a3, a3, -241		; RV64I-NEXT: ld a3, %lo(.LCPI68_1)(a3)
; RV64I-NEXT: slli a3, a3, 12
; RV64I-NEXT: addi a3, a3, 241
; RV64I-NEXT: slli a3, a3, 12
; RV64I-NEXT: addi a3, a3, -241
; RV64I-NEXT: and a2, a2, a3
; RV64I-NEXT: and a0, a0, a3
; RV64I-NEXT: slli a0, a0, 4		; RV64I-NEXT: slli a0, a0, 4
; RV64I-NEXT: or a0, a2, a0		; RV64I-NEXT: or a0, a1, a0
; RV64I-NEXT: srli a2, a0, 2		; RV64I-NEXT: srli a1, a0, 2
; RV64I-NEXT: lui a3, 13107		; RV64I-NEXT: and a1, a1, a3
; RV64I-NEXT: addiw a3, a3, 819
; RV64I-NEXT: slli a3, a3, 12
; RV64I-NEXT: addi a3, a3, 819
; RV64I-NEXT: slli a3, a3, 12
; RV64I-NEXT: addi a3, a3, 819
; RV64I-NEXT: slli a3, a3, 12
; RV64I-NEXT: addi a3, a3, 819
; RV64I-NEXT: and a2, a2, a3
; RV64I-NEXT: and a0, a0, a3		; RV64I-NEXT: and a0, a0, a3
		; RV64I-NEXT: lui a3, %hi(.LCPI68_2)
		; RV64I-NEXT: ld a3, %lo(.LCPI68_2)(a3)
; RV64I-NEXT: slli a0, a0, 2		; RV64I-NEXT: slli a0, a0, 2
; RV64I-NEXT: or a0, a2, a0		; RV64I-NEXT: or a0, a1, a0
; RV64I-NEXT: srli a2, a0, 1		; RV64I-NEXT: srli a1, a0, 1
; RV64I-NEXT: lui a3, 21845		; RV64I-NEXT: and a1, a1, a3
; RV64I-NEXT: addiw a3, a3, 1365
; RV64I-NEXT: slli a3, a3, 12
; RV64I-NEXT: addi a3, a3, 1365
; RV64I-NEXT: slli a3, a3, 12
; RV64I-NEXT: addi a3, a3, 1365
; RV64I-NEXT: slli a3, a3, 12
; RV64I-NEXT: addi a3, a3, 1365
; RV64I-NEXT: and a2, a2, a3
; RV64I-NEXT: and a0, a0, a3		; RV64I-NEXT: and a0, a0, a3
; RV64I-NEXT: slli a0, a0, 1		; RV64I-NEXT: slli a0, a0, 1
; RV64I-NEXT: or a0, a2, a0		; RV64I-NEXT: or a0, a1, a0
; RV64I-NEXT: srli a2, a0, 40		; RV64I-NEXT: srli a1, a0, 40
; RV64I-NEXT: and a2, a2, a5		; RV64I-NEXT: and a1, a1, a2
; RV64I-NEXT: srli a3, a0, 56		; RV64I-NEXT: srli a2, a0, 56
; RV64I-NEXT: or a2, a2, a3		; RV64I-NEXT: or a1, a1, a2
; RV64I-NEXT: srli a3, a0, 24		; RV64I-NEXT: srli a2, a0, 24
; RV64I-NEXT: and a3, a3, a6		; RV64I-NEXT: and a2, a2, a6
; RV64I-NEXT: srli a4, a0, 8		; RV64I-NEXT: srli a3, a0, 8
; RV64I-NEXT: and a4, a4, a7		; RV64I-NEXT: and a3, a3, a7
; RV64I-NEXT: or a3, a4, a3
; RV64I-NEXT: or a2, a3, a2		; RV64I-NEXT: or a2, a3, a2
; RV64I-NEXT: slli a3, a0, 24		; RV64I-NEXT: or a1, a2, a1
; RV64I-NEXT: and a3, a3, t0		; RV64I-NEXT: slli a2, a0, 24
; RV64I-NEXT: srliw a4, a0, 24		; RV64I-NEXT: and a2, a2, t0
; RV64I-NEXT: slli a4, a4, 32		; RV64I-NEXT: srliw a3, a0, 24
; RV64I-NEXT: or a3, a3, a4		; RV64I-NEXT: slli a3, a3, 32
; RV64I-NEXT: slli a4, a0, 40		; RV64I-NEXT: or a2, a2, a3
; RV64I-NEXT: and a1, a4, a1		; RV64I-NEXT: slli a3, a0, 40
		; RV64I-NEXT: and a3, a3, a4
; RV64I-NEXT: slli a0, a0, 56		; RV64I-NEXT: slli a0, a0, 56
; RV64I-NEXT: or a0, a0, a1
; RV64I-NEXT: or a0, a0, a3		; RV64I-NEXT: or a0, a0, a3
; RV64I-NEXT: or a0, a0, a2		; RV64I-NEXT: or a0, a0, a2
		; RV64I-NEXT: or a0, a0, a1
; RV64I-NEXT: ret		; RV64I-NEXT: ret
;		;
; RV64ZBP-LABEL: bitreverse_bswap_i64:		; RV64ZBP-LABEL: bitreverse_bswap_i64:
; RV64ZBP: # %bb.0:		; RV64ZBP: # %bb.0:
; RV64ZBP-NEXT: rev.b a0, a0		; RV64ZBP-NEXT: rev.b a0, a0
; RV64ZBP-NEXT: ret		; RV64ZBP-NEXT: ret
%1 = call i64 @llvm.bitreverse.i64(i64 %a)		%1 = call i64 @llvm.bitreverse.i64(i64 %a)
%2 = call i64 @llvm.bswap.i64(i64 %1)		%2 = call i64 @llvm.bswap.i64(i64 %1)
Show All 30 Lines	; RV64ZBP-NEXT: ret
%and2 = and i32 %shr, 572662306		%and2 = and i32 %shr, 572662306
%or3 = or i32 %or, %and2		%or3 = or i32 %or, %and2
ret i32 %or3		ret i32 %or3
}		}

define i64 @shfl1_i64(i64 %a, i64 %b) nounwind {		define i64 @shfl1_i64(i64 %a, i64 %b) nounwind {
; RV64I-LABEL: shfl1_i64:		; RV64I-LABEL: shfl1_i64:
; RV64I: # %bb.0:		; RV64I: # %bb.0:
; RV64I-NEXT: lui a1, 1035469		; RV64I-NEXT: lui a1, %hi(.LCPI70_1)
; RV64I-NEXT: addiw a1, a1, -819		; RV64I-NEXT: ld a1, %lo(.LCPI70_1)(a1)
; RV64I-NEXT: slli a1, a1, 12		; RV64I-NEXT: lui a2, %hi(.LCPI70_0)
; RV64I-NEXT: addi a1, a1, -819		; RV64I-NEXT: ld a2, %lo(.LCPI70_0)(a2)
; RV64I-NEXT: slli a1, a1, 12		; RV64I-NEXT: slli a3, a0, 1
; RV64I-NEXT: addi a1, a1, -819		; RV64I-NEXT: and a1, a3, a1
; RV64I-NEXT: slli a1, a1, 13		; RV64I-NEXT: lui a3, %hi(.LCPI70_2)
; RV64I-NEXT: addi a1, a1, -1639		; RV64I-NEXT: ld a3, %lo(.LCPI70_2)(a3)
; RV64I-NEXT: and a1, a0, a1		; RV64I-NEXT: and a2, a0, a2
; RV64I-NEXT: slli a2, a0, 1		; RV64I-NEXT: or a1, a2, a1
; RV64I-NEXT: lui a3, 4369
; RV64I-NEXT: addiw a3, a3, 273
; RV64I-NEXT: slli a3, a3, 12
; RV64I-NEXT: addi a3, a3, 273
; RV64I-NEXT: slli a3, a3, 12
; RV64I-NEXT: addi a3, a3, 273
; RV64I-NEXT: slli a4, a3, 14
; RV64I-NEXT: addi a4, a4, 1092
; RV64I-NEXT: and a2, a2, a4
; RV64I-NEXT: or a1, a1, a2
; RV64I-NEXT: srli a0, a0, 1		; RV64I-NEXT: srli a0, a0, 1
; RV64I-NEXT: slli a2, a3, 13		; RV64I-NEXT: and a0, a0, a3
; RV64I-NEXT: addi a2, a2, 546
; RV64I-NEXT: and a0, a0, a2
; RV64I-NEXT: or a0, a1, a0		; RV64I-NEXT: or a0, a1, a0
; RV64I-NEXT: ret		; RV64I-NEXT: ret
;		;
; RV64ZBP-LABEL: shfl1_i64:		; RV64ZBP-LABEL: shfl1_i64:
; RV64ZBP: # %bb.0:		; RV64ZBP: # %bb.0:
; RV64ZBP-NEXT: zip.n a0, a0		; RV64ZBP-NEXT: zip.n a0, a0
; RV64ZBP-NEXT: ret		; RV64ZBP-NEXT: ret
%and = and i64 %a, -7378697629483820647		%and = and i64 %a, -7378697629483820647
Show All 36 Lines	; RV64ZBP-NEXT: ret
%and2 = and i32 %shr, 202116108		%and2 = and i32 %shr, 202116108
%or3 = or i32 %and2, %or		%or3 = or i32 %and2, %or
ret i32 %or3		ret i32 %or3
}		}

define i64 @shfl2_i64(i64 %a, i64 %b) nounwind {		define i64 @shfl2_i64(i64 %a, i64 %b) nounwind {
; RV64I-LABEL: shfl2_i64:		; RV64I-LABEL: shfl2_i64:
; RV64I: # %bb.0:		; RV64I: # %bb.0:
; RV64I-NEXT: lui a1, 1044721		; RV64I-NEXT: lui a1, %hi(.LCPI72_1)
; RV64I-NEXT: addiw a1, a1, -241		; RV64I-NEXT: ld a1, %lo(.LCPI72_1)(a1)
; RV64I-NEXT: slli a1, a1, 12		; RV64I-NEXT: lui a2, %hi(.LCPI72_0)
; RV64I-NEXT: addi a1, a1, 241		; RV64I-NEXT: ld a2, %lo(.LCPI72_0)(a2)
; RV64I-NEXT: slli a1, a1, 12		; RV64I-NEXT: slli a3, a0, 2
; RV64I-NEXT: addi a1, a1, -241		; RV64I-NEXT: and a1, a3, a1
; RV64I-NEXT: slli a1, a1, 14		; RV64I-NEXT: lui a3, %hi(.LCPI72_2)
; RV64I-NEXT: addi a1, a1, 963		; RV64I-NEXT: ld a3, %lo(.LCPI72_2)(a3)
; RV64I-NEXT: and a1, a0, a1		; RV64I-NEXT: and a2, a0, a2
; RV64I-NEXT: slli a2, a0, 2		; RV64I-NEXT: or a1, a2, a1
; RV64I-NEXT: lui a3, 197379
; RV64I-NEXT: slli a3, a3, 4
; RV64I-NEXT: addi a3, a3, 771
; RV64I-NEXT: slli a4, a3, 16
; RV64I-NEXT: addi a4, a4, 771
; RV64I-NEXT: slli a4, a4, 12
; RV64I-NEXT: addi a4, a4, 48
; RV64I-NEXT: and a2, a2, a4
; RV64I-NEXT: or a1, a1, a2
; RV64I-NEXT: srli a0, a0, 2		; RV64I-NEXT: srli a0, a0, 2
; RV64I-NEXT: slli a2, a3, 14		; RV64I-NEXT: and a0, a0, a3
; RV64I-NEXT: addi a2, a2, 193
; RV64I-NEXT: slli a2, a2, 12
; RV64I-NEXT: addi a2, a2, -1012
; RV64I-NEXT: and a0, a0, a2
; RV64I-NEXT: or a0, a0, a1		; RV64I-NEXT: or a0, a0, a1
; RV64I-NEXT: ret		; RV64I-NEXT: ret
;		;
; RV64ZBP-LABEL: shfl2_i64:		; RV64ZBP-LABEL: shfl2_i64:
; RV64ZBP: # %bb.0:		; RV64ZBP: # %bb.0:
; RV64ZBP-NEXT: zip2.b a0, a0		; RV64ZBP-NEXT: zip2.b a0, a0
; RV64ZBP-NEXT: ret		; RV64ZBP-NEXT: ret
%and = and i64 %a, -4340410370284600381		%and = and i64 %a, -4340410370284600381
Show All 36 Lines	; RV64ZBP-NEXT: ret
%or = or i32 %and2, %and		%or = or i32 %and2, %and
%or3 = or i32 %or, %and1		%or3 = or i32 %or, %and1
ret i32 %or3		ret i32 %or3
}		}

define i64 @shfl4_i64(i64 %a, i64 %b) nounwind {		define i64 @shfl4_i64(i64 %a, i64 %b) nounwind {
; RV64I-LABEL: shfl4_i64:		; RV64I-LABEL: shfl4_i64:
; RV64I: # %bb.0:		; RV64I: # %bb.0:
; RV64I-NEXT: lui a1, 983295		; RV64I-NEXT: lui a1, %hi(.LCPI74_0)
; RV64I-NEXT: slli a1, a1, 4		; RV64I-NEXT: ld a1, %lo(.LCPI74_0)(a1)
; RV64I-NEXT: addi a1, a1, 255		; RV64I-NEXT: lui a2, %hi(.LCPI74_1)
; RV64I-NEXT: slli a1, a1, 16		; RV64I-NEXT: ld a2, %lo(.LCPI74_1)(a2)
; RV64I-NEXT: addi a1, a1, 255		; RV64I-NEXT: slli a3, a0, 4
; RV64I-NEXT: slli a1, a1, 12		; RV64I-NEXT: lui a4, %hi(.LCPI74_2)
; RV64I-NEXT: addi a1, a1, 15		; RV64I-NEXT: ld a4, %lo(.LCPI74_2)(a4)
		; RV64I-NEXT: and a2, a3, a2
; RV64I-NEXT: and a1, a0, a1		; RV64I-NEXT: and a1, a0, a1
; RV64I-NEXT: slli a2, a0, 4
; RV64I-NEXT: lui a3, 983055
; RV64I-NEXT: slli a3, a3, 4
; RV64I-NEXT: addi a3, a3, 15
; RV64I-NEXT: slli a3, a3, 16
; RV64I-NEXT: addi a3, a3, 15
; RV64I-NEXT: slli a3, a3, 12
; RV64I-NEXT: srli a3, a3, 4
; RV64I-NEXT: and a2, a2, a3
; RV64I-NEXT: srli a0, a0, 4		; RV64I-NEXT: srli a0, a0, 4
; RV64I-NEXT: lui a3, 240		; RV64I-NEXT: and a0, a0, a4
; RV64I-NEXT: addiw a3, a3, 15
; RV64I-NEXT: slli a3, a3, 16
; RV64I-NEXT: addi a3, a3, 15
; RV64I-NEXT: slli a3, a3, 20
; RV64I-NEXT: addi a3, a3, 240
; RV64I-NEXT: and a0, a0, a3
; RV64I-NEXT: or a0, a2, a0		; RV64I-NEXT: or a0, a2, a0
; RV64I-NEXT: or a0, a0, a1		; RV64I-NEXT: or a0, a0, a1
; RV64I-NEXT: ret		; RV64I-NEXT: ret
;		;
; RV64ZBP-LABEL: shfl4_i64:		; RV64ZBP-LABEL: shfl4_i64:
; RV64ZBP: # %bb.0:		; RV64ZBP: # %bb.0:
; RV64ZBP-NEXT: zip4.h a0, a0		; RV64ZBP-NEXT: zip4.h a0, a0
; RV64ZBP-NEXT: ret		; RV64ZBP-NEXT: ret
▲ Show 20 Lines • Show All 262 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/rvv/bitreverse-sdnode.ll

	Show First 20 Lines • Show All 1,084 Lines • ▼ Show 20 Lines
	; RV64-NEXT: slli a3, a2, 40			; RV64-NEXT: slli a3, a2, 40
	; RV64-NEXT: vand.vx v11, v11, a3			; RV64-NEXT: vand.vx v11, v11, a3
	; RV64-NEXT: vor.vv v10, v11, v10			; RV64-NEXT: vor.vv v10, v11, v10
	; RV64-NEXT: vsll.vx v11, v8, a0			; RV64-NEXT: vsll.vx v11, v8, a0
	; RV64-NEXT: vsll.vx v8, v8, a1			; RV64-NEXT: vsll.vx v8, v8, a1
	; RV64-NEXT: slli a0, a2, 48			; RV64-NEXT: slli a0, a2, 48
	; RV64-NEXT: vand.vx v8, v8, a0			; RV64-NEXT: vand.vx v8, v8, a0
	; RV64-NEXT: vor.vv v8, v11, v8			; RV64-NEXT: vor.vv v8, v11, v8
				; RV64-NEXT: lui a0, %hi(.LCPI18_0)
				; RV64-NEXT: ld a0, %lo(.LCPI18_0)(a0)
	; RV64-NEXT: vor.vv v8, v8, v10			; RV64-NEXT: vor.vv v8, v8, v10
	; RV64-NEXT: vor.vv v8, v8, v9			; RV64-NEXT: vor.vv v8, v8, v9
	; RV64-NEXT: vsrl.vi v9, v8, 4			; RV64-NEXT: vsrl.vi v9, v8, 4
	; RV64-NEXT: lui a0, 3855
	; RV64-NEXT: addiw a0, a0, 241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, -241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, -241
	; RV64-NEXT: vand.vx v9, v9, a0			; RV64-NEXT: vand.vx v9, v9, a0
	; RV64-NEXT: vand.vx v8, v8, a0			; RV64-NEXT: vand.vx v8, v8, a0
				; RV64-NEXT: lui a0, %hi(.LCPI18_1)
				; RV64-NEXT: ld a0, %lo(.LCPI18_1)(a0)
	; RV64-NEXT: vsll.vi v8, v8, 4			; RV64-NEXT: vsll.vi v8, v8, 4
	; RV64-NEXT: vor.vv v8, v9, v8			; RV64-NEXT: vor.vv v8, v9, v8
	; RV64-NEXT: vsrl.vi v9, v8, 2			; RV64-NEXT: vsrl.vi v9, v8, 2
	; RV64-NEXT: lui a0, 13107
	; RV64-NEXT: addiw a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: vand.vx v9, v9, a0			; RV64-NEXT: vand.vx v9, v9, a0
	; RV64-NEXT: vand.vx v8, v8, a0			; RV64-NEXT: vand.vx v8, v8, a0
				; RV64-NEXT: lui a0, %hi(.LCPI18_2)
				; RV64-NEXT: ld a0, %lo(.LCPI18_2)(a0)
	; RV64-NEXT: vsll.vi v8, v8, 2			; RV64-NEXT: vsll.vi v8, v8, 2
	; RV64-NEXT: vor.vv v8, v9, v8			; RV64-NEXT: vor.vv v8, v9, v8
	; RV64-NEXT: vsrl.vi v9, v8, 1			; RV64-NEXT: vsrl.vi v9, v8, 1
	; RV64-NEXT: lui a0, 21845
	; RV64-NEXT: addiw a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: vand.vx v9, v9, a0			; RV64-NEXT: vand.vx v9, v9, a0
	; RV64-NEXT: vand.vx v8, v8, a0			; RV64-NEXT: vand.vx v8, v8, a0
	; RV64-NEXT: vadd.vv v8, v8, v8			; RV64-NEXT: vadd.vv v8, v8, v8
	; RV64-NEXT: vor.vv v8, v9, v8			; RV64-NEXT: vor.vv v8, v9, v8
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%a = call <vscale x 1 x i64> @llvm.bitreverse.nxv1i64(<vscale x 1 x i64> %va)			%a = call <vscale x 1 x i64> @llvm.bitreverse.nxv1i64(<vscale x 1 x i64> %va)
	ret <vscale x 1 x i64> %a			ret <vscale x 1 x i64> %a
	}			}
	▲ Show 20 Lines • Show All 110 Lines • ▼ Show 20 Lines
	; RV64-NEXT: slli a3, a2, 40			; RV64-NEXT: slli a3, a2, 40
	; RV64-NEXT: vand.vx v14, v14, a3			; RV64-NEXT: vand.vx v14, v14, a3
	; RV64-NEXT: vor.vv v12, v14, v12			; RV64-NEXT: vor.vv v12, v14, v12
	; RV64-NEXT: vsll.vx v14, v8, a0			; RV64-NEXT: vsll.vx v14, v8, a0
	; RV64-NEXT: vsll.vx v8, v8, a1			; RV64-NEXT: vsll.vx v8, v8, a1
	; RV64-NEXT: slli a0, a2, 48			; RV64-NEXT: slli a0, a2, 48
	; RV64-NEXT: vand.vx v8, v8, a0			; RV64-NEXT: vand.vx v8, v8, a0
	; RV64-NEXT: vor.vv v8, v14, v8			; RV64-NEXT: vor.vv v8, v14, v8
				; RV64-NEXT: lui a0, %hi(.LCPI19_0)
				; RV64-NEXT: ld a0, %lo(.LCPI19_0)(a0)
	; RV64-NEXT: vor.vv v8, v8, v12			; RV64-NEXT: vor.vv v8, v8, v12
	; RV64-NEXT: vor.vv v8, v8, v10			; RV64-NEXT: vor.vv v8, v8, v10
	; RV64-NEXT: vsrl.vi v10, v8, 4			; RV64-NEXT: vsrl.vi v10, v8, 4
	; RV64-NEXT: lui a0, 3855
	; RV64-NEXT: addiw a0, a0, 241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, -241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, -241
	; RV64-NEXT: vand.vx v10, v10, a0			; RV64-NEXT: vand.vx v10, v10, a0
	; RV64-NEXT: vand.vx v8, v8, a0			; RV64-NEXT: vand.vx v8, v8, a0
				; RV64-NEXT: lui a0, %hi(.LCPI19_1)
				; RV64-NEXT: ld a0, %lo(.LCPI19_1)(a0)
	; RV64-NEXT: vsll.vi v8, v8, 4			; RV64-NEXT: vsll.vi v8, v8, 4
	; RV64-NEXT: vor.vv v8, v10, v8			; RV64-NEXT: vor.vv v8, v10, v8
	; RV64-NEXT: vsrl.vi v10, v8, 2			; RV64-NEXT: vsrl.vi v10, v8, 2
	; RV64-NEXT: lui a0, 13107
	; RV64-NEXT: addiw a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: vand.vx v10, v10, a0			; RV64-NEXT: vand.vx v10, v10, a0
	; RV64-NEXT: vand.vx v8, v8, a0			; RV64-NEXT: vand.vx v8, v8, a0
				; RV64-NEXT: lui a0, %hi(.LCPI19_2)
				; RV64-NEXT: ld a0, %lo(.LCPI19_2)(a0)
	; RV64-NEXT: vsll.vi v8, v8, 2			; RV64-NEXT: vsll.vi v8, v8, 2
	; RV64-NEXT: vor.vv v8, v10, v8			; RV64-NEXT: vor.vv v8, v10, v8
	; RV64-NEXT: vsrl.vi v10, v8, 1			; RV64-NEXT: vsrl.vi v10, v8, 1
	; RV64-NEXT: lui a0, 21845
	; RV64-NEXT: addiw a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: vand.vx v10, v10, a0			; RV64-NEXT: vand.vx v10, v10, a0
	; RV64-NEXT: vand.vx v8, v8, a0			; RV64-NEXT: vand.vx v8, v8, a0
	; RV64-NEXT: vadd.vv v8, v8, v8			; RV64-NEXT: vadd.vv v8, v8, v8
	; RV64-NEXT: vor.vv v8, v10, v8			; RV64-NEXT: vor.vv v8, v10, v8
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%a = call <vscale x 2 x i64> @llvm.bitreverse.nxv2i64(<vscale x 2 x i64> %va)			%a = call <vscale x 2 x i64> @llvm.bitreverse.nxv2i64(<vscale x 2 x i64> %va)
	ret <vscale x 2 x i64> %a			ret <vscale x 2 x i64> %a
	}			}
	▲ Show 20 Lines • Show All 110 Lines • ▼ Show 20 Lines
	; RV64-NEXT: slli a3, a2, 40			; RV64-NEXT: slli a3, a2, 40
	; RV64-NEXT: vand.vx v20, v20, a3			; RV64-NEXT: vand.vx v20, v20, a3
	; RV64-NEXT: vor.vv v16, v20, v16			; RV64-NEXT: vor.vv v16, v20, v16
	; RV64-NEXT: vsll.vx v20, v8, a0			; RV64-NEXT: vsll.vx v20, v8, a0
	; RV64-NEXT: vsll.vx v8, v8, a1			; RV64-NEXT: vsll.vx v8, v8, a1
	; RV64-NEXT: slli a0, a2, 48			; RV64-NEXT: slli a0, a2, 48
	; RV64-NEXT: vand.vx v8, v8, a0			; RV64-NEXT: vand.vx v8, v8, a0
	; RV64-NEXT: vor.vv v8, v20, v8			; RV64-NEXT: vor.vv v8, v20, v8
				; RV64-NEXT: lui a0, %hi(.LCPI20_0)
				; RV64-NEXT: ld a0, %lo(.LCPI20_0)(a0)
	; RV64-NEXT: vor.vv v8, v8, v16			; RV64-NEXT: vor.vv v8, v8, v16
	; RV64-NEXT: vor.vv v8, v8, v12			; RV64-NEXT: vor.vv v8, v8, v12
	; RV64-NEXT: vsrl.vi v12, v8, 4			; RV64-NEXT: vsrl.vi v12, v8, 4
	; RV64-NEXT: lui a0, 3855
	; RV64-NEXT: addiw a0, a0, 241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, -241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, -241
	; RV64-NEXT: vand.vx v12, v12, a0			; RV64-NEXT: vand.vx v12, v12, a0
	; RV64-NEXT: vand.vx v8, v8, a0			; RV64-NEXT: vand.vx v8, v8, a0
				; RV64-NEXT: lui a0, %hi(.LCPI20_1)
				; RV64-NEXT: ld a0, %lo(.LCPI20_1)(a0)
	; RV64-NEXT: vsll.vi v8, v8, 4			; RV64-NEXT: vsll.vi v8, v8, 4
	; RV64-NEXT: vor.vv v8, v12, v8			; RV64-NEXT: vor.vv v8, v12, v8
	; RV64-NEXT: vsrl.vi v12, v8, 2			; RV64-NEXT: vsrl.vi v12, v8, 2
	; RV64-NEXT: lui a0, 13107
	; RV64-NEXT: addiw a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: vand.vx v12, v12, a0			; RV64-NEXT: vand.vx v12, v12, a0
	; RV64-NEXT: vand.vx v8, v8, a0			; RV64-NEXT: vand.vx v8, v8, a0
				; RV64-NEXT: lui a0, %hi(.LCPI20_2)
				; RV64-NEXT: ld a0, %lo(.LCPI20_2)(a0)
	; RV64-NEXT: vsll.vi v8, v8, 2			; RV64-NEXT: vsll.vi v8, v8, 2
	; RV64-NEXT: vor.vv v8, v12, v8			; RV64-NEXT: vor.vv v8, v12, v8
	; RV64-NEXT: vsrl.vi v12, v8, 1			; RV64-NEXT: vsrl.vi v12, v8, 1
	; RV64-NEXT: lui a0, 21845
	; RV64-NEXT: addiw a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: vand.vx v12, v12, a0			; RV64-NEXT: vand.vx v12, v12, a0
	; RV64-NEXT: vand.vx v8, v8, a0			; RV64-NEXT: vand.vx v8, v8, a0
	; RV64-NEXT: vadd.vv v8, v8, v8			; RV64-NEXT: vadd.vv v8, v8, v8
	; RV64-NEXT: vor.vv v8, v12, v8			; RV64-NEXT: vor.vv v8, v12, v8
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%a = call <vscale x 4 x i64> @llvm.bitreverse.nxv4i64(<vscale x 4 x i64> %va)			%a = call <vscale x 4 x i64> @llvm.bitreverse.nxv4i64(<vscale x 4 x i64> %va)
	ret <vscale x 4 x i64> %a			ret <vscale x 4 x i64> %a
	}			}
	▲ Show 20 Lines • Show All 140 Lines • ▼ Show 20 Lines
	; RV64-NEXT: slli a3, a2, 40			; RV64-NEXT: slli a3, a2, 40
	; RV64-NEXT: vand.vx v0, v0, a3			; RV64-NEXT: vand.vx v0, v0, a3
	; RV64-NEXT: vor.vv v24, v0, v24			; RV64-NEXT: vor.vv v24, v0, v24
	; RV64-NEXT: vsll.vx v0, v8, a0			; RV64-NEXT: vsll.vx v0, v8, a0
	; RV64-NEXT: vsll.vx v8, v8, a1			; RV64-NEXT: vsll.vx v8, v8, a1
	; RV64-NEXT: slli a0, a2, 48			; RV64-NEXT: slli a0, a2, 48
	; RV64-NEXT: vand.vx v8, v8, a0			; RV64-NEXT: vand.vx v8, v8, a0
	; RV64-NEXT: vor.vv v8, v0, v8			; RV64-NEXT: vor.vv v8, v0, v8
				; RV64-NEXT: lui a0, %hi(.LCPI21_0)
				; RV64-NEXT: ld a0, %lo(.LCPI21_0)(a0)
	; RV64-NEXT: vor.vv v8, v8, v24			; RV64-NEXT: vor.vv v8, v8, v24
	; RV64-NEXT: vor.vv v8, v8, v16			; RV64-NEXT: vor.vv v8, v8, v16
	; RV64-NEXT: vsrl.vi v16, v8, 4			; RV64-NEXT: vsrl.vi v16, v8, 4
	; RV64-NEXT: lui a0, 3855
	; RV64-NEXT: addiw a0, a0, 241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, -241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, -241
	; RV64-NEXT: vand.vx v16, v16, a0			; RV64-NEXT: vand.vx v16, v16, a0
	; RV64-NEXT: vand.vx v8, v8, a0			; RV64-NEXT: vand.vx v8, v8, a0
				; RV64-NEXT: lui a0, %hi(.LCPI21_1)
				; RV64-NEXT: ld a0, %lo(.LCPI21_1)(a0)
	; RV64-NEXT: vsll.vi v8, v8, 4			; RV64-NEXT: vsll.vi v8, v8, 4
	; RV64-NEXT: vor.vv v8, v16, v8			; RV64-NEXT: vor.vv v8, v16, v8
	; RV64-NEXT: vsrl.vi v16, v8, 2			; RV64-NEXT: vsrl.vi v16, v8, 2
	; RV64-NEXT: lui a0, 13107
	; RV64-NEXT: addiw a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: vand.vx v16, v16, a0			; RV64-NEXT: vand.vx v16, v16, a0
	; RV64-NEXT: vand.vx v8, v8, a0			; RV64-NEXT: vand.vx v8, v8, a0
				; RV64-NEXT: lui a0, %hi(.LCPI21_2)
				; RV64-NEXT: ld a0, %lo(.LCPI21_2)(a0)
	; RV64-NEXT: vsll.vi v8, v8, 2			; RV64-NEXT: vsll.vi v8, v8, 2
	; RV64-NEXT: vor.vv v8, v16, v8			; RV64-NEXT: vor.vv v8, v16, v8
	; RV64-NEXT: vsrl.vi v16, v8, 1			; RV64-NEXT: vsrl.vi v16, v8, 1
	; RV64-NEXT: lui a0, 21845
	; RV64-NEXT: addiw a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: vand.vx v16, v16, a0			; RV64-NEXT: vand.vx v16, v16, a0
	; RV64-NEXT: vand.vx v8, v8, a0			; RV64-NEXT: vand.vx v8, v8, a0
	; RV64-NEXT: vadd.vv v8, v8, v8			; RV64-NEXT: vadd.vv v8, v8, v8
	; RV64-NEXT: vor.vv v8, v16, v8			; RV64-NEXT: vor.vv v8, v16, v8
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%a = call <vscale x 8 x i64> @llvm.bitreverse.nxv8i64(<vscale x 8 x i64> %va)			%a = call <vscale x 8 x i64> @llvm.bitreverse.nxv8i64(<vscale x 8 x i64> %va)
	ret <vscale x 8 x i64> %a			ret <vscale x 8 x i64> %a
	}			}
	declare <vscale x 8 x i64> @llvm.bitreverse.nxv8i64(<vscale x 8 x i64>)			declare <vscale x 8 x i64> @llvm.bitreverse.nxv8i64(<vscale x 8 x i64>)

llvm/test/CodeGen/RISCV/rvv/ctlz-sdnode.ll

	Show First 20 Lines • Show All 1,647 Lines • ▼ Show 20 Lines
	; RV64-NEXT: vsrl.vi v9, v8, 8			; RV64-NEXT: vsrl.vi v9, v8, 8
	; RV64-NEXT: vor.vv v8, v8, v9			; RV64-NEXT: vor.vv v8, v8, v9
	; RV64-NEXT: vsrl.vi v9, v8, 16			; RV64-NEXT: vsrl.vi v9, v8, 16
	; RV64-NEXT: vor.vv v8, v8, v9			; RV64-NEXT: vor.vv v8, v8, v9
	; RV64-NEXT: li a0, 32			; RV64-NEXT: li a0, 32
	; RV64-NEXT: vsrl.vx v9, v8, a0			; RV64-NEXT: vsrl.vx v9, v8, a0
	; RV64-NEXT: vor.vv v8, v8, v9			; RV64-NEXT: vor.vv v8, v8, v9
	; RV64-NEXT: vxor.vi v8, v8, -1			; RV64-NEXT: vxor.vi v8, v8, -1
				; RV64-NEXT: lui a0, %hi(.LCPI18_0)
				; RV64-NEXT: ld a0, %lo(.LCPI18_0)(a0)
				; RV64-NEXT: lui a1, %hi(.LCPI18_1)
				; RV64-NEXT: ld a1, %lo(.LCPI18_1)(a1)
	; RV64-NEXT: vsrl.vi v9, v8, 1			; RV64-NEXT: vsrl.vi v9, v8, 1
	; RV64-NEXT: lui a0, 21845
	; RV64-NEXT: addiw a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: vand.vx v9, v9, a0			; RV64-NEXT: vand.vx v9, v9, a0
	; RV64-NEXT: vsub.vv v8, v8, v9			; RV64-NEXT: vsub.vv v8, v8, v9
	; RV64-NEXT: lui a0, 13107			; RV64-NEXT: vand.vx v9, v8, a1
	; RV64-NEXT: addiw a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: vand.vx v9, v8, a0
	; RV64-NEXT: vsrl.vi v8, v8, 2			; RV64-NEXT: vsrl.vi v8, v8, 2
	; RV64-NEXT: vand.vx v8, v8, a0			; RV64-NEXT: vand.vx v8, v8, a1
	; RV64-NEXT: vadd.vv v8, v9, v8			; RV64-NEXT: vadd.vv v8, v9, v8
				; RV64-NEXT: lui a0, %hi(.LCPI18_2)
				; RV64-NEXT: ld a0, %lo(.LCPI18_2)(a0)
				; RV64-NEXT: lui a1, %hi(.LCPI18_3)
				; RV64-NEXT: ld a1, %lo(.LCPI18_3)(a1)
	; RV64-NEXT: vsrl.vi v9, v8, 4			; RV64-NEXT: vsrl.vi v9, v8, 4
	; RV64-NEXT: vadd.vv v8, v8, v9			; RV64-NEXT: vadd.vv v8, v8, v9
	; RV64-NEXT: lui a0, 3855
	; RV64-NEXT: addiw a0, a0, 241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, -241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, -241
	; RV64-NEXT: vand.vx v8, v8, a0			; RV64-NEXT: vand.vx v8, v8, a0
	; RV64-NEXT: lui a0, 4112			; RV64-NEXT: vmul.vx v8, v8, a1
	; RV64-NEXT: addiw a0, a0, 257
	; RV64-NEXT: slli a0, a0, 16
	; RV64-NEXT: addi a0, a0, 257
	; RV64-NEXT: slli a0, a0, 16
	; RV64-NEXT: addi a0, a0, 257
	; RV64-NEXT: vmul.vx v8, v8, a0
	; RV64-NEXT: li a0, 56			; RV64-NEXT: li a0, 56
	; RV64-NEXT: vsrl.vx v8, v8, a0			; RV64-NEXT: vsrl.vx v8, v8, a0
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%a = call <vscale x 1 x i64> @llvm.ctlz.nxv1i64(<vscale x 1 x i64> %va, i1 false)			%a = call <vscale x 1 x i64> @llvm.ctlz.nxv1i64(<vscale x 1 x i64> %va, i1 false)
	ret <vscale x 1 x i64> %a			ret <vscale x 1 x i64> %a
	}			}
	declare <vscale x 1 x i64> @llvm.ctlz.nxv1i64(<vscale x 1 x i64>, i1)			declare <vscale x 1 x i64> @llvm.ctlz.nxv1i64(<vscale x 1 x i64>, i1)

	▲ Show 20 Lines • Show All 69 Lines • ▼ Show 20 Lines
	; RV64-NEXT: vsrl.vi v10, v8, 8			; RV64-NEXT: vsrl.vi v10, v8, 8
	; RV64-NEXT: vor.vv v8, v8, v10			; RV64-NEXT: vor.vv v8, v8, v10
	; RV64-NEXT: vsrl.vi v10, v8, 16			; RV64-NEXT: vsrl.vi v10, v8, 16
	; RV64-NEXT: vor.vv v8, v8, v10			; RV64-NEXT: vor.vv v8, v8, v10
	; RV64-NEXT: li a0, 32			; RV64-NEXT: li a0, 32
	; RV64-NEXT: vsrl.vx v10, v8, a0			; RV64-NEXT: vsrl.vx v10, v8, a0
	; RV64-NEXT: vor.vv v8, v8, v10			; RV64-NEXT: vor.vv v8, v8, v10
	; RV64-NEXT: vxor.vi v8, v8, -1			; RV64-NEXT: vxor.vi v8, v8, -1
				; RV64-NEXT: lui a0, %hi(.LCPI19_0)
				; RV64-NEXT: ld a0, %lo(.LCPI19_0)(a0)
				; RV64-NEXT: lui a1, %hi(.LCPI19_1)
				; RV64-NEXT: ld a1, %lo(.LCPI19_1)(a1)
	; RV64-NEXT: vsrl.vi v10, v8, 1			; RV64-NEXT: vsrl.vi v10, v8, 1
	; RV64-NEXT: lui a0, 21845
	; RV64-NEXT: addiw a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: vand.vx v10, v10, a0			; RV64-NEXT: vand.vx v10, v10, a0
	; RV64-NEXT: vsub.vv v8, v8, v10			; RV64-NEXT: vsub.vv v8, v8, v10
	; RV64-NEXT: lui a0, 13107			; RV64-NEXT: vand.vx v10, v8, a1
	; RV64-NEXT: addiw a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: vand.vx v10, v8, a0
	; RV64-NEXT: vsrl.vi v8, v8, 2			; RV64-NEXT: vsrl.vi v8, v8, 2
	; RV64-NEXT: vand.vx v8, v8, a0			; RV64-NEXT: vand.vx v8, v8, a1
	; RV64-NEXT: vadd.vv v8, v10, v8			; RV64-NEXT: vadd.vv v8, v10, v8
				; RV64-NEXT: lui a0, %hi(.LCPI19_2)
				; RV64-NEXT: ld a0, %lo(.LCPI19_2)(a0)
				; RV64-NEXT: lui a1, %hi(.LCPI19_3)
				; RV64-NEXT: ld a1, %lo(.LCPI19_3)(a1)
	; RV64-NEXT: vsrl.vi v10, v8, 4			; RV64-NEXT: vsrl.vi v10, v8, 4
	; RV64-NEXT: vadd.vv v8, v8, v10			; RV64-NEXT: vadd.vv v8, v8, v10
	; RV64-NEXT: lui a0, 3855
	; RV64-NEXT: addiw a0, a0, 241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, -241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, -241
	; RV64-NEXT: vand.vx v8, v8, a0			; RV64-NEXT: vand.vx v8, v8, a0
	; RV64-NEXT: lui a0, 4112			; RV64-NEXT: vmul.vx v8, v8, a1
	; RV64-NEXT: addiw a0, a0, 257
	; RV64-NEXT: slli a0, a0, 16
	; RV64-NEXT: addi a0, a0, 257
	; RV64-NEXT: slli a0, a0, 16
	; RV64-NEXT: addi a0, a0, 257
	; RV64-NEXT: vmul.vx v8, v8, a0
	; RV64-NEXT: li a0, 56			; RV64-NEXT: li a0, 56
	; RV64-NEXT: vsrl.vx v8, v8, a0			; RV64-NEXT: vsrl.vx v8, v8, a0
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%a = call <vscale x 2 x i64> @llvm.ctlz.nxv2i64(<vscale x 2 x i64> %va, i1 false)			%a = call <vscale x 2 x i64> @llvm.ctlz.nxv2i64(<vscale x 2 x i64> %va, i1 false)
	ret <vscale x 2 x i64> %a			ret <vscale x 2 x i64> %a
	}			}
	declare <vscale x 2 x i64> @llvm.ctlz.nxv2i64(<vscale x 2 x i64>, i1)			declare <vscale x 2 x i64> @llvm.ctlz.nxv2i64(<vscale x 2 x i64>, i1)

	▲ Show 20 Lines • Show All 69 Lines • ▼ Show 20 Lines
	; RV64-NEXT: vsrl.vi v12, v8, 8			; RV64-NEXT: vsrl.vi v12, v8, 8
	; RV64-NEXT: vor.vv v8, v8, v12			; RV64-NEXT: vor.vv v8, v8, v12
	; RV64-NEXT: vsrl.vi v12, v8, 16			; RV64-NEXT: vsrl.vi v12, v8, 16
	; RV64-NEXT: vor.vv v8, v8, v12			; RV64-NEXT: vor.vv v8, v8, v12
	; RV64-NEXT: li a0, 32			; RV64-NEXT: li a0, 32
	; RV64-NEXT: vsrl.vx v12, v8, a0			; RV64-NEXT: vsrl.vx v12, v8, a0
	; RV64-NEXT: vor.vv v8, v8, v12			; RV64-NEXT: vor.vv v8, v8, v12
	; RV64-NEXT: vxor.vi v8, v8, -1			; RV64-NEXT: vxor.vi v8, v8, -1
				; RV64-NEXT: lui a0, %hi(.LCPI20_0)
				; RV64-NEXT: ld a0, %lo(.LCPI20_0)(a0)
				; RV64-NEXT: lui a1, %hi(.LCPI20_1)
				; RV64-NEXT: ld a1, %lo(.LCPI20_1)(a1)
	; RV64-NEXT: vsrl.vi v12, v8, 1			; RV64-NEXT: vsrl.vi v12, v8, 1
	; RV64-NEXT: lui a0, 21845
	; RV64-NEXT: addiw a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: vand.vx v12, v12, a0			; RV64-NEXT: vand.vx v12, v12, a0
	; RV64-NEXT: vsub.vv v8, v8, v12			; RV64-NEXT: vsub.vv v8, v8, v12
	; RV64-NEXT: lui a0, 13107			; RV64-NEXT: vand.vx v12, v8, a1
	; RV64-NEXT: addiw a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: vand.vx v12, v8, a0
	; RV64-NEXT: vsrl.vi v8, v8, 2			; RV64-NEXT: vsrl.vi v8, v8, 2
	; RV64-NEXT: vand.vx v8, v8, a0			; RV64-NEXT: vand.vx v8, v8, a1
	; RV64-NEXT: vadd.vv v8, v12, v8			; RV64-NEXT: vadd.vv v8, v12, v8
				; RV64-NEXT: lui a0, %hi(.LCPI20_2)
				; RV64-NEXT: ld a0, %lo(.LCPI20_2)(a0)
				; RV64-NEXT: lui a1, %hi(.LCPI20_3)
				; RV64-NEXT: ld a1, %lo(.LCPI20_3)(a1)
	; RV64-NEXT: vsrl.vi v12, v8, 4			; RV64-NEXT: vsrl.vi v12, v8, 4
	; RV64-NEXT: vadd.vv v8, v8, v12			; RV64-NEXT: vadd.vv v8, v8, v12
	; RV64-NEXT: lui a0, 3855
	; RV64-NEXT: addiw a0, a0, 241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, -241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, -241
	; RV64-NEXT: vand.vx v8, v8, a0			; RV64-NEXT: vand.vx v8, v8, a0
	; RV64-NEXT: lui a0, 4112			; RV64-NEXT: vmul.vx v8, v8, a1
	; RV64-NEXT: addiw a0, a0, 257
	; RV64-NEXT: slli a0, a0, 16
	; RV64-NEXT: addi a0, a0, 257
	; RV64-NEXT: slli a0, a0, 16
	; RV64-NEXT: addi a0, a0, 257
	; RV64-NEXT: vmul.vx v8, v8, a0
	; RV64-NEXT: li a0, 56			; RV64-NEXT: li a0, 56
	; RV64-NEXT: vsrl.vx v8, v8, a0			; RV64-NEXT: vsrl.vx v8, v8, a0
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%a = call <vscale x 4 x i64> @llvm.ctlz.nxv4i64(<vscale x 4 x i64> %va, i1 false)			%a = call <vscale x 4 x i64> @llvm.ctlz.nxv4i64(<vscale x 4 x i64> %va, i1 false)
	ret <vscale x 4 x i64> %a			ret <vscale x 4 x i64> %a
	}			}
	declare <vscale x 4 x i64> @llvm.ctlz.nxv4i64(<vscale x 4 x i64>, i1)			declare <vscale x 4 x i64> @llvm.ctlz.nxv4i64(<vscale x 4 x i64>, i1)

	▲ Show 20 Lines • Show All 69 Lines • ▼ Show 20 Lines
	; RV64-NEXT: vsrl.vi v16, v8, 8			; RV64-NEXT: vsrl.vi v16, v8, 8
	; RV64-NEXT: vor.vv v8, v8, v16			; RV64-NEXT: vor.vv v8, v8, v16
	; RV64-NEXT: vsrl.vi v16, v8, 16			; RV64-NEXT: vsrl.vi v16, v8, 16
	; RV64-NEXT: vor.vv v8, v8, v16			; RV64-NEXT: vor.vv v8, v8, v16
	; RV64-NEXT: li a0, 32			; RV64-NEXT: li a0, 32
	; RV64-NEXT: vsrl.vx v16, v8, a0			; RV64-NEXT: vsrl.vx v16, v8, a0
	; RV64-NEXT: vor.vv v8, v8, v16			; RV64-NEXT: vor.vv v8, v8, v16
	; RV64-NEXT: vxor.vi v8, v8, -1			; RV64-NEXT: vxor.vi v8, v8, -1
				; RV64-NEXT: lui a0, %hi(.LCPI21_0)
				; RV64-NEXT: ld a0, %lo(.LCPI21_0)(a0)
				; RV64-NEXT: lui a1, %hi(.LCPI21_1)
				; RV64-NEXT: ld a1, %lo(.LCPI21_1)(a1)
	; RV64-NEXT: vsrl.vi v16, v8, 1			; RV64-NEXT: vsrl.vi v16, v8, 1
	; RV64-NEXT: lui a0, 21845
	; RV64-NEXT: addiw a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: vand.vx v16, v16, a0			; RV64-NEXT: vand.vx v16, v16, a0
	; RV64-NEXT: vsub.vv v8, v8, v16			; RV64-NEXT: vsub.vv v8, v8, v16
	; RV64-NEXT: lui a0, 13107			; RV64-NEXT: vand.vx v16, v8, a1
	; RV64-NEXT: addiw a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: vand.vx v16, v8, a0
	; RV64-NEXT: vsrl.vi v8, v8, 2			; RV64-NEXT: vsrl.vi v8, v8, 2
	; RV64-NEXT: vand.vx v8, v8, a0			; RV64-NEXT: vand.vx v8, v8, a1
	; RV64-NEXT: vadd.vv v8, v16, v8			; RV64-NEXT: vadd.vv v8, v16, v8
				; RV64-NEXT: lui a0, %hi(.LCPI21_2)
				; RV64-NEXT: ld a0, %lo(.LCPI21_2)(a0)
				; RV64-NEXT: lui a1, %hi(.LCPI21_3)
				; RV64-NEXT: ld a1, %lo(.LCPI21_3)(a1)
	; RV64-NEXT: vsrl.vi v16, v8, 4			; RV64-NEXT: vsrl.vi v16, v8, 4
	; RV64-NEXT: vadd.vv v8, v8, v16			; RV64-NEXT: vadd.vv v8, v8, v16
	; RV64-NEXT: lui a0, 3855
	; RV64-NEXT: addiw a0, a0, 241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, -241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, -241
	; RV64-NEXT: vand.vx v8, v8, a0			; RV64-NEXT: vand.vx v8, v8, a0
	; RV64-NEXT: lui a0, 4112			; RV64-NEXT: vmul.vx v8, v8, a1
	; RV64-NEXT: addiw a0, a0, 257
	; RV64-NEXT: slli a0, a0, 16
	; RV64-NEXT: addi a0, a0, 257
	; RV64-NEXT: slli a0, a0, 16
	; RV64-NEXT: addi a0, a0, 257
	; RV64-NEXT: vmul.vx v8, v8, a0
	; RV64-NEXT: li a0, 56			; RV64-NEXT: li a0, 56
	; RV64-NEXT: vsrl.vx v8, v8, a0			; RV64-NEXT: vsrl.vx v8, v8, a0
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%a = call <vscale x 8 x i64> @llvm.ctlz.nxv8i64(<vscale x 8 x i64> %va, i1 false)			%a = call <vscale x 8 x i64> @llvm.ctlz.nxv8i64(<vscale x 8 x i64> %va, i1 false)
	ret <vscale x 8 x i64> %a			ret <vscale x 8 x i64> %a
	}			}
	declare <vscale x 8 x i64> @llvm.ctlz.nxv8i64(<vscale x 8 x i64>, i1)			declare <vscale x 8 x i64> @llvm.ctlz.nxv8i64(<vscale x 8 x i64>, i1)

	▲ Show 20 Lines • Show All 1,549 Lines • ▼ Show 20 Lines
	; RV64-NEXT: vsrl.vi v9, v8, 8			; RV64-NEXT: vsrl.vi v9, v8, 8
	; RV64-NEXT: vor.vv v8, v8, v9			; RV64-NEXT: vor.vv v8, v8, v9
	; RV64-NEXT: vsrl.vi v9, v8, 16			; RV64-NEXT: vsrl.vi v9, v8, 16
	; RV64-NEXT: vor.vv v8, v8, v9			; RV64-NEXT: vor.vv v8, v8, v9
	; RV64-NEXT: li a0, 32			; RV64-NEXT: li a0, 32
	; RV64-NEXT: vsrl.vx v9, v8, a0			; RV64-NEXT: vsrl.vx v9, v8, a0
	; RV64-NEXT: vor.vv v8, v8, v9			; RV64-NEXT: vor.vv v8, v8, v9
	; RV64-NEXT: vxor.vi v8, v8, -1			; RV64-NEXT: vxor.vi v8, v8, -1
				; RV64-NEXT: lui a0, %hi(.LCPI40_0)
				; RV64-NEXT: ld a0, %lo(.LCPI40_0)(a0)
				; RV64-NEXT: lui a1, %hi(.LCPI40_1)
				; RV64-NEXT: ld a1, %lo(.LCPI40_1)(a1)
	; RV64-NEXT: vsrl.vi v9, v8, 1			; RV64-NEXT: vsrl.vi v9, v8, 1
	; RV64-NEXT: lui a0, 21845
	; RV64-NEXT: addiw a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: vand.vx v9, v9, a0			; RV64-NEXT: vand.vx v9, v9, a0
	; RV64-NEXT: vsub.vv v8, v8, v9			; RV64-NEXT: vsub.vv v8, v8, v9
	; RV64-NEXT: lui a0, 13107			; RV64-NEXT: vand.vx v9, v8, a1
	; RV64-NEXT: addiw a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: vand.vx v9, v8, a0
	; RV64-NEXT: vsrl.vi v8, v8, 2			; RV64-NEXT: vsrl.vi v8, v8, 2
	; RV64-NEXT: vand.vx v8, v8, a0			; RV64-NEXT: vand.vx v8, v8, a1
	; RV64-NEXT: vadd.vv v8, v9, v8			; RV64-NEXT: vadd.vv v8, v9, v8
				; RV64-NEXT: lui a0, %hi(.LCPI40_2)
				; RV64-NEXT: ld a0, %lo(.LCPI40_2)(a0)
				; RV64-NEXT: lui a1, %hi(.LCPI40_3)
				; RV64-NEXT: ld a1, %lo(.LCPI40_3)(a1)
	; RV64-NEXT: vsrl.vi v9, v8, 4			; RV64-NEXT: vsrl.vi v9, v8, 4
	; RV64-NEXT: vadd.vv v8, v8, v9			; RV64-NEXT: vadd.vv v8, v8, v9
	; RV64-NEXT: lui a0, 3855
	; RV64-NEXT: addiw a0, a0, 241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, -241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, -241
	; RV64-NEXT: vand.vx v8, v8, a0			; RV64-NEXT: vand.vx v8, v8, a0
	; RV64-NEXT: lui a0, 4112			; RV64-NEXT: vmul.vx v8, v8, a1
	; RV64-NEXT: addiw a0, a0, 257
	; RV64-NEXT: slli a0, a0, 16
	; RV64-NEXT: addi a0, a0, 257
	; RV64-NEXT: slli a0, a0, 16
	; RV64-NEXT: addi a0, a0, 257
	; RV64-NEXT: vmul.vx v8, v8, a0
	; RV64-NEXT: li a0, 56			; RV64-NEXT: li a0, 56
	; RV64-NEXT: vsrl.vx v8, v8, a0			; RV64-NEXT: vsrl.vx v8, v8, a0
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%a = call <vscale x 1 x i64> @llvm.ctlz.nxv1i64(<vscale x 1 x i64> %va, i1 true)			%a = call <vscale x 1 x i64> @llvm.ctlz.nxv1i64(<vscale x 1 x i64> %va, i1 true)
	ret <vscale x 1 x i64> %a			ret <vscale x 1 x i64> %a
	}			}

	define <vscale x 2 x i64> @ctlz_zero_undef_nxv2i64(<vscale x 2 x i64> %va) {			define <vscale x 2 x i64> @ctlz_zero_undef_nxv2i64(<vscale x 2 x i64> %va) {
	▲ Show 20 Lines • Show All 68 Lines • ▼ Show 20 Lines
	; RV64-NEXT: vsrl.vi v10, v8, 8			; RV64-NEXT: vsrl.vi v10, v8, 8
	; RV64-NEXT: vor.vv v8, v8, v10			; RV64-NEXT: vor.vv v8, v8, v10
	; RV64-NEXT: vsrl.vi v10, v8, 16			; RV64-NEXT: vsrl.vi v10, v8, 16
	; RV64-NEXT: vor.vv v8, v8, v10			; RV64-NEXT: vor.vv v8, v8, v10
	; RV64-NEXT: li a0, 32			; RV64-NEXT: li a0, 32
	; RV64-NEXT: vsrl.vx v10, v8, a0			; RV64-NEXT: vsrl.vx v10, v8, a0
	; RV64-NEXT: vor.vv v8, v8, v10			; RV64-NEXT: vor.vv v8, v8, v10
	; RV64-NEXT: vxor.vi v8, v8, -1			; RV64-NEXT: vxor.vi v8, v8, -1
				; RV64-NEXT: lui a0, %hi(.LCPI41_0)
				; RV64-NEXT: ld a0, %lo(.LCPI41_0)(a0)
				; RV64-NEXT: lui a1, %hi(.LCPI41_1)
				; RV64-NEXT: ld a1, %lo(.LCPI41_1)(a1)
	; RV64-NEXT: vsrl.vi v10, v8, 1			; RV64-NEXT: vsrl.vi v10, v8, 1
	; RV64-NEXT: lui a0, 21845
	; RV64-NEXT: addiw a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: vand.vx v10, v10, a0			; RV64-NEXT: vand.vx v10, v10, a0
	; RV64-NEXT: vsub.vv v8, v8, v10			; RV64-NEXT: vsub.vv v8, v8, v10
	; RV64-NEXT: lui a0, 13107			; RV64-NEXT: vand.vx v10, v8, a1
	; RV64-NEXT: addiw a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: vand.vx v10, v8, a0
	; RV64-NEXT: vsrl.vi v8, v8, 2			; RV64-NEXT: vsrl.vi v8, v8, 2
	; RV64-NEXT: vand.vx v8, v8, a0			; RV64-NEXT: vand.vx v8, v8, a1
	; RV64-NEXT: vadd.vv v8, v10, v8			; RV64-NEXT: vadd.vv v8, v10, v8
				; RV64-NEXT: lui a0, %hi(.LCPI41_2)
				; RV64-NEXT: ld a0, %lo(.LCPI41_2)(a0)
				; RV64-NEXT: lui a1, %hi(.LCPI41_3)
				; RV64-NEXT: ld a1, %lo(.LCPI41_3)(a1)
	; RV64-NEXT: vsrl.vi v10, v8, 4			; RV64-NEXT: vsrl.vi v10, v8, 4
	; RV64-NEXT: vadd.vv v8, v8, v10			; RV64-NEXT: vadd.vv v8, v8, v10
	; RV64-NEXT: lui a0, 3855
	; RV64-NEXT: addiw a0, a0, 241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, -241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, -241
	; RV64-NEXT: vand.vx v8, v8, a0			; RV64-NEXT: vand.vx v8, v8, a0
	; RV64-NEXT: lui a0, 4112			; RV64-NEXT: vmul.vx v8, v8, a1
	; RV64-NEXT: addiw a0, a0, 257
	; RV64-NEXT: slli a0, a0, 16
	; RV64-NEXT: addi a0, a0, 257
	; RV64-NEXT: slli a0, a0, 16
	; RV64-NEXT: addi a0, a0, 257
	; RV64-NEXT: vmul.vx v8, v8, a0
	; RV64-NEXT: li a0, 56			; RV64-NEXT: li a0, 56
	; RV64-NEXT: vsrl.vx v8, v8, a0			; RV64-NEXT: vsrl.vx v8, v8, a0
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%a = call <vscale x 2 x i64> @llvm.ctlz.nxv2i64(<vscale x 2 x i64> %va, i1 true)			%a = call <vscale x 2 x i64> @llvm.ctlz.nxv2i64(<vscale x 2 x i64> %va, i1 true)
	ret <vscale x 2 x i64> %a			ret <vscale x 2 x i64> %a
	}			}

	define <vscale x 4 x i64> @ctlz_zero_undef_nxv4i64(<vscale x 4 x i64> %va) {			define <vscale x 4 x i64> @ctlz_zero_undef_nxv4i64(<vscale x 4 x i64> %va) {
	▲ Show 20 Lines • Show All 68 Lines • ▼ Show 20 Lines
	; RV64-NEXT: vsrl.vi v12, v8, 8			; RV64-NEXT: vsrl.vi v12, v8, 8
	; RV64-NEXT: vor.vv v8, v8, v12			; RV64-NEXT: vor.vv v8, v8, v12
	; RV64-NEXT: vsrl.vi v12, v8, 16			; RV64-NEXT: vsrl.vi v12, v8, 16
	; RV64-NEXT: vor.vv v8, v8, v12			; RV64-NEXT: vor.vv v8, v8, v12
	; RV64-NEXT: li a0, 32			; RV64-NEXT: li a0, 32
	; RV64-NEXT: vsrl.vx v12, v8, a0			; RV64-NEXT: vsrl.vx v12, v8, a0
	; RV64-NEXT: vor.vv v8, v8, v12			; RV64-NEXT: vor.vv v8, v8, v12
	; RV64-NEXT: vxor.vi v8, v8, -1			; RV64-NEXT: vxor.vi v8, v8, -1
				; RV64-NEXT: lui a0, %hi(.LCPI42_0)
				; RV64-NEXT: ld a0, %lo(.LCPI42_0)(a0)
				; RV64-NEXT: lui a1, %hi(.LCPI42_1)
				; RV64-NEXT: ld a1, %lo(.LCPI42_1)(a1)
	; RV64-NEXT: vsrl.vi v12, v8, 1			; RV64-NEXT: vsrl.vi v12, v8, 1
	; RV64-NEXT: lui a0, 21845
	; RV64-NEXT: addiw a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: vand.vx v12, v12, a0			; RV64-NEXT: vand.vx v12, v12, a0
	; RV64-NEXT: vsub.vv v8, v8, v12			; RV64-NEXT: vsub.vv v8, v8, v12
	; RV64-NEXT: lui a0, 13107			; RV64-NEXT: vand.vx v12, v8, a1
	; RV64-NEXT: addiw a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: vand.vx v12, v8, a0
	; RV64-NEXT: vsrl.vi v8, v8, 2			; RV64-NEXT: vsrl.vi v8, v8, 2
	; RV64-NEXT: vand.vx v8, v8, a0			; RV64-NEXT: vand.vx v8, v8, a1
	; RV64-NEXT: vadd.vv v8, v12, v8			; RV64-NEXT: vadd.vv v8, v12, v8
				; RV64-NEXT: lui a0, %hi(.LCPI42_2)
				; RV64-NEXT: ld a0, %lo(.LCPI42_2)(a0)
				; RV64-NEXT: lui a1, %hi(.LCPI42_3)
				; RV64-NEXT: ld a1, %lo(.LCPI42_3)(a1)
	; RV64-NEXT: vsrl.vi v12, v8, 4			; RV64-NEXT: vsrl.vi v12, v8, 4
	; RV64-NEXT: vadd.vv v8, v8, v12			; RV64-NEXT: vadd.vv v8, v8, v12
	; RV64-NEXT: lui a0, 3855
	; RV64-NEXT: addiw a0, a0, 241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, -241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, -241
	; RV64-NEXT: vand.vx v8, v8, a0			; RV64-NEXT: vand.vx v8, v8, a0
	; RV64-NEXT: lui a0, 4112			; RV64-NEXT: vmul.vx v8, v8, a1
	; RV64-NEXT: addiw a0, a0, 257
	; RV64-NEXT: slli a0, a0, 16
	; RV64-NEXT: addi a0, a0, 257
	; RV64-NEXT: slli a0, a0, 16
	; RV64-NEXT: addi a0, a0, 257
	; RV64-NEXT: vmul.vx v8, v8, a0
	; RV64-NEXT: li a0, 56			; RV64-NEXT: li a0, 56
	; RV64-NEXT: vsrl.vx v8, v8, a0			; RV64-NEXT: vsrl.vx v8, v8, a0
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%a = call <vscale x 4 x i64> @llvm.ctlz.nxv4i64(<vscale x 4 x i64> %va, i1 true)			%a = call <vscale x 4 x i64> @llvm.ctlz.nxv4i64(<vscale x 4 x i64> %va, i1 true)
	ret <vscale x 4 x i64> %a			ret <vscale x 4 x i64> %a
	}			}

	define <vscale x 8 x i64> @ctlz_zero_undef_nxv8i64(<vscale x 8 x i64> %va) {			define <vscale x 8 x i64> @ctlz_zero_undef_nxv8i64(<vscale x 8 x i64> %va) {
	▲ Show 20 Lines • Show All 68 Lines • ▼ Show 20 Lines
	; RV64-NEXT: vsrl.vi v16, v8, 8			; RV64-NEXT: vsrl.vi v16, v8, 8
	; RV64-NEXT: vor.vv v8, v8, v16			; RV64-NEXT: vor.vv v8, v8, v16
	; RV64-NEXT: vsrl.vi v16, v8, 16			; RV64-NEXT: vsrl.vi v16, v8, 16
	; RV64-NEXT: vor.vv v8, v8, v16			; RV64-NEXT: vor.vv v8, v8, v16
	; RV64-NEXT: li a0, 32			; RV64-NEXT: li a0, 32
	; RV64-NEXT: vsrl.vx v16, v8, a0			; RV64-NEXT: vsrl.vx v16, v8, a0
	; RV64-NEXT: vor.vv v8, v8, v16			; RV64-NEXT: vor.vv v8, v8, v16
	; RV64-NEXT: vxor.vi v8, v8, -1			; RV64-NEXT: vxor.vi v8, v8, -1
				; RV64-NEXT: lui a0, %hi(.LCPI43_0)
				; RV64-NEXT: ld a0, %lo(.LCPI43_0)(a0)
				; RV64-NEXT: lui a1, %hi(.LCPI43_1)
				; RV64-NEXT: ld a1, %lo(.LCPI43_1)(a1)
	; RV64-NEXT: vsrl.vi v16, v8, 1			; RV64-NEXT: vsrl.vi v16, v8, 1
	; RV64-NEXT: lui a0, 21845
	; RV64-NEXT: addiw a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: vand.vx v16, v16, a0			; RV64-NEXT: vand.vx v16, v16, a0
	; RV64-NEXT: vsub.vv v8, v8, v16			; RV64-NEXT: vsub.vv v8, v8, v16
	; RV64-NEXT: lui a0, 13107			; RV64-NEXT: vand.vx v16, v8, a1
	; RV64-NEXT: addiw a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: vand.vx v16, v8, a0
	; RV64-NEXT: vsrl.vi v8, v8, 2			; RV64-NEXT: vsrl.vi v8, v8, 2
	; RV64-NEXT: vand.vx v8, v8, a0			; RV64-NEXT: vand.vx v8, v8, a1
	; RV64-NEXT: vadd.vv v8, v16, v8			; RV64-NEXT: vadd.vv v8, v16, v8
				; RV64-NEXT: lui a0, %hi(.LCPI43_2)
				; RV64-NEXT: ld a0, %lo(.LCPI43_2)(a0)
				; RV64-NEXT: lui a1, %hi(.LCPI43_3)
				; RV64-NEXT: ld a1, %lo(.LCPI43_3)(a1)
	; RV64-NEXT: vsrl.vi v16, v8, 4			; RV64-NEXT: vsrl.vi v16, v8, 4
	; RV64-NEXT: vadd.vv v8, v8, v16			; RV64-NEXT: vadd.vv v8, v8, v16
	; RV64-NEXT: lui a0, 3855
	; RV64-NEXT: addiw a0, a0, 241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, -241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, -241
	; RV64-NEXT: vand.vx v8, v8, a0			; RV64-NEXT: vand.vx v8, v8, a0
	; RV64-NEXT: lui a0, 4112			; RV64-NEXT: vmul.vx v8, v8, a1
	; RV64-NEXT: addiw a0, a0, 257
	; RV64-NEXT: slli a0, a0, 16
	; RV64-NEXT: addi a0, a0, 257
	; RV64-NEXT: slli a0, a0, 16
	; RV64-NEXT: addi a0, a0, 257
	; RV64-NEXT: vmul.vx v8, v8, a0
	; RV64-NEXT: li a0, 56			; RV64-NEXT: li a0, 56
	; RV64-NEXT: vsrl.vx v8, v8, a0			; RV64-NEXT: vsrl.vx v8, v8, a0
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%a = call <vscale x 8 x i64> @llvm.ctlz.nxv8i64(<vscale x 8 x i64> %va, i1 true)			%a = call <vscale x 8 x i64> @llvm.ctlz.nxv8i64(<vscale x 8 x i64> %va, i1 true)
	ret <vscale x 8 x i64> %a			ret <vscale x 8 x i64> %a
	}			}

llvm/test/CodeGen/RISCV/rvv/ctpop-sdnode.ll

	Show First 20 Lines • Show All 792 Lines • ▼ Show 20 Lines
	; RV32-NEXT: li a0, 56			; RV32-NEXT: li a0, 56
	; RV32-NEXT: vsrl.vx v8, v8, a0			; RV32-NEXT: vsrl.vx v8, v8, a0
	; RV32-NEXT: addi sp, sp, 16			; RV32-NEXT: addi sp, sp, 16
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: ctpop_nxv1i64:			; RV64-LABEL: ctpop_nxv1i64:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: vsetvli a0, zero, e64, m1, ta, mu			; RV64-NEXT: vsetvli a0, zero, e64, m1, ta, mu
				; RV64-NEXT: lui a0, %hi(.LCPI18_0)
				; RV64-NEXT: ld a0, %lo(.LCPI18_0)(a0)
				; RV64-NEXT: lui a1, %hi(.LCPI18_1)
				; RV64-NEXT: ld a1, %lo(.LCPI18_1)(a1)
	; RV64-NEXT: vsrl.vi v9, v8, 1			; RV64-NEXT: vsrl.vi v9, v8, 1
	; RV64-NEXT: lui a0, 21845
	; RV64-NEXT: addiw a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: vand.vx v9, v9, a0			; RV64-NEXT: vand.vx v9, v9, a0
	; RV64-NEXT: vsub.vv v8, v8, v9			; RV64-NEXT: vsub.vv v8, v8, v9
	; RV64-NEXT: lui a0, 13107			; RV64-NEXT: vand.vx v9, v8, a1
	; RV64-NEXT: addiw a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: vand.vx v9, v8, a0
	; RV64-NEXT: vsrl.vi v8, v8, 2			; RV64-NEXT: vsrl.vi v8, v8, 2
	; RV64-NEXT: vand.vx v8, v8, a0			; RV64-NEXT: vand.vx v8, v8, a1
	; RV64-NEXT: vadd.vv v8, v9, v8			; RV64-NEXT: vadd.vv v8, v9, v8
				; RV64-NEXT: lui a0, %hi(.LCPI18_2)
				; RV64-NEXT: ld a0, %lo(.LCPI18_2)(a0)
				; RV64-NEXT: lui a1, %hi(.LCPI18_3)
				; RV64-NEXT: ld a1, %lo(.LCPI18_3)(a1)
	; RV64-NEXT: vsrl.vi v9, v8, 4			; RV64-NEXT: vsrl.vi v9, v8, 4
	; RV64-NEXT: vadd.vv v8, v8, v9			; RV64-NEXT: vadd.vv v8, v8, v9
	; RV64-NEXT: lui a0, 3855
	; RV64-NEXT: addiw a0, a0, 241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, -241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, -241
	; RV64-NEXT: vand.vx v8, v8, a0			; RV64-NEXT: vand.vx v8, v8, a0
	; RV64-NEXT: lui a0, 4112			; RV64-NEXT: vmul.vx v8, v8, a1
	; RV64-NEXT: addiw a0, a0, 257
	; RV64-NEXT: slli a0, a0, 16
	; RV64-NEXT: addi a0, a0, 257
	; RV64-NEXT: slli a0, a0, 16
	; RV64-NEXT: addi a0, a0, 257
	; RV64-NEXT: vmul.vx v8, v8, a0
	; RV64-NEXT: li a0, 56			; RV64-NEXT: li a0, 56
	; RV64-NEXT: vsrl.vx v8, v8, a0			; RV64-NEXT: vsrl.vx v8, v8, a0
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%a = call <vscale x 1 x i64> @llvm.ctpop.nxv1i64(<vscale x 1 x i64> %va)			%a = call <vscale x 1 x i64> @llvm.ctpop.nxv1i64(<vscale x 1 x i64> %va)
	ret <vscale x 1 x i64> %a			ret <vscale x 1 x i64> %a
	}			}
	declare <vscale x 1 x i64> @llvm.ctpop.nxv1i64(<vscale x 1 x i64>)			declare <vscale x 1 x i64> @llvm.ctpop.nxv1i64(<vscale x 1 x i64>)

	▲ Show 20 Lines • Show All 41 Lines • ▼ Show 20 Lines
	; RV32-NEXT: li a0, 56			; RV32-NEXT: li a0, 56
	; RV32-NEXT: vsrl.vx v8, v8, a0			; RV32-NEXT: vsrl.vx v8, v8, a0
	; RV32-NEXT: addi sp, sp, 16			; RV32-NEXT: addi sp, sp, 16
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: ctpop_nxv2i64:			; RV64-LABEL: ctpop_nxv2i64:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: vsetvli a0, zero, e64, m2, ta, mu			; RV64-NEXT: vsetvli a0, zero, e64, m2, ta, mu
				; RV64-NEXT: lui a0, %hi(.LCPI19_0)
				; RV64-NEXT: ld a0, %lo(.LCPI19_0)(a0)
				; RV64-NEXT: lui a1, %hi(.LCPI19_1)
				; RV64-NEXT: ld a1, %lo(.LCPI19_1)(a1)
	; RV64-NEXT: vsrl.vi v10, v8, 1			; RV64-NEXT: vsrl.vi v10, v8, 1
	; RV64-NEXT: lui a0, 21845
	; RV64-NEXT: addiw a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: vand.vx v10, v10, a0			; RV64-NEXT: vand.vx v10, v10, a0
	; RV64-NEXT: vsub.vv v8, v8, v10			; RV64-NEXT: vsub.vv v8, v8, v10
	; RV64-NEXT: lui a0, 13107			; RV64-NEXT: vand.vx v10, v8, a1
	; RV64-NEXT: addiw a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: vand.vx v10, v8, a0
	; RV64-NEXT: vsrl.vi v8, v8, 2			; RV64-NEXT: vsrl.vi v8, v8, 2
	; RV64-NEXT: vand.vx v8, v8, a0			; RV64-NEXT: vand.vx v8, v8, a1
	; RV64-NEXT: vadd.vv v8, v10, v8			; RV64-NEXT: vadd.vv v8, v10, v8
				; RV64-NEXT: lui a0, %hi(.LCPI19_2)
				; RV64-NEXT: ld a0, %lo(.LCPI19_2)(a0)
				; RV64-NEXT: lui a1, %hi(.LCPI19_3)
				; RV64-NEXT: ld a1, %lo(.LCPI19_3)(a1)
	; RV64-NEXT: vsrl.vi v10, v8, 4			; RV64-NEXT: vsrl.vi v10, v8, 4
	; RV64-NEXT: vadd.vv v8, v8, v10			; RV64-NEXT: vadd.vv v8, v8, v10
	; RV64-NEXT: lui a0, 3855
	; RV64-NEXT: addiw a0, a0, 241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, -241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, -241
	; RV64-NEXT: vand.vx v8, v8, a0			; RV64-NEXT: vand.vx v8, v8, a0
	; RV64-NEXT: lui a0, 4112			; RV64-NEXT: vmul.vx v8, v8, a1
	; RV64-NEXT: addiw a0, a0, 257
	; RV64-NEXT: slli a0, a0, 16
	; RV64-NEXT: addi a0, a0, 257
	; RV64-NEXT: slli a0, a0, 16
	; RV64-NEXT: addi a0, a0, 257
	; RV64-NEXT: vmul.vx v8, v8, a0
	; RV64-NEXT: li a0, 56			; RV64-NEXT: li a0, 56
	; RV64-NEXT: vsrl.vx v8, v8, a0			; RV64-NEXT: vsrl.vx v8, v8, a0
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%a = call <vscale x 2 x i64> @llvm.ctpop.nxv2i64(<vscale x 2 x i64> %va)			%a = call <vscale x 2 x i64> @llvm.ctpop.nxv2i64(<vscale x 2 x i64> %va)
	ret <vscale x 2 x i64> %a			ret <vscale x 2 x i64> %a
	}			}
	declare <vscale x 2 x i64> @llvm.ctpop.nxv2i64(<vscale x 2 x i64>)			declare <vscale x 2 x i64> @llvm.ctpop.nxv2i64(<vscale x 2 x i64>)

	▲ Show 20 Lines • Show All 41 Lines • ▼ Show 20 Lines
	; RV32-NEXT: li a0, 56			; RV32-NEXT: li a0, 56
	; RV32-NEXT: vsrl.vx v8, v8, a0			; RV32-NEXT: vsrl.vx v8, v8, a0
	; RV32-NEXT: addi sp, sp, 16			; RV32-NEXT: addi sp, sp, 16
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: ctpop_nxv4i64:			; RV64-LABEL: ctpop_nxv4i64:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: vsetvli a0, zero, e64, m4, ta, mu			; RV64-NEXT: vsetvli a0, zero, e64, m4, ta, mu
				; RV64-NEXT: lui a0, %hi(.LCPI20_0)
				; RV64-NEXT: ld a0, %lo(.LCPI20_0)(a0)
				; RV64-NEXT: lui a1, %hi(.LCPI20_1)
				; RV64-NEXT: ld a1, %lo(.LCPI20_1)(a1)
	; RV64-NEXT: vsrl.vi v12, v8, 1			; RV64-NEXT: vsrl.vi v12, v8, 1
	; RV64-NEXT: lui a0, 21845
	; RV64-NEXT: addiw a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: vand.vx v12, v12, a0			; RV64-NEXT: vand.vx v12, v12, a0
	; RV64-NEXT: vsub.vv v8, v8, v12			; RV64-NEXT: vsub.vv v8, v8, v12
	; RV64-NEXT: lui a0, 13107			; RV64-NEXT: vand.vx v12, v8, a1
	; RV64-NEXT: addiw a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: vand.vx v12, v8, a0
	; RV64-NEXT: vsrl.vi v8, v8, 2			; RV64-NEXT: vsrl.vi v8, v8, 2
	; RV64-NEXT: vand.vx v8, v8, a0			; RV64-NEXT: vand.vx v8, v8, a1
	; RV64-NEXT: vadd.vv v8, v12, v8			; RV64-NEXT: vadd.vv v8, v12, v8
				; RV64-NEXT: lui a0, %hi(.LCPI20_2)
				; RV64-NEXT: ld a0, %lo(.LCPI20_2)(a0)
				; RV64-NEXT: lui a1, %hi(.LCPI20_3)
				; RV64-NEXT: ld a1, %lo(.LCPI20_3)(a1)
	; RV64-NEXT: vsrl.vi v12, v8, 4			; RV64-NEXT: vsrl.vi v12, v8, 4
	; RV64-NEXT: vadd.vv v8, v8, v12			; RV64-NEXT: vadd.vv v8, v8, v12
	; RV64-NEXT: lui a0, 3855
	; RV64-NEXT: addiw a0, a0, 241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, -241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, -241
	; RV64-NEXT: vand.vx v8, v8, a0			; RV64-NEXT: vand.vx v8, v8, a0
	; RV64-NEXT: lui a0, 4112			; RV64-NEXT: vmul.vx v8, v8, a1
	; RV64-NEXT: addiw a0, a0, 257
	; RV64-NEXT: slli a0, a0, 16
	; RV64-NEXT: addi a0, a0, 257
	; RV64-NEXT: slli a0, a0, 16
	; RV64-NEXT: addi a0, a0, 257
	; RV64-NEXT: vmul.vx v8, v8, a0
	; RV64-NEXT: li a0, 56			; RV64-NEXT: li a0, 56
	; RV64-NEXT: vsrl.vx v8, v8, a0			; RV64-NEXT: vsrl.vx v8, v8, a0
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%a = call <vscale x 4 x i64> @llvm.ctpop.nxv4i64(<vscale x 4 x i64> %va)			%a = call <vscale x 4 x i64> @llvm.ctpop.nxv4i64(<vscale x 4 x i64> %va)
	ret <vscale x 4 x i64> %a			ret <vscale x 4 x i64> %a
	}			}
	declare <vscale x 4 x i64> @llvm.ctpop.nxv4i64(<vscale x 4 x i64>)			declare <vscale x 4 x i64> @llvm.ctpop.nxv4i64(<vscale x 4 x i64>)

	▲ Show 20 Lines • Show All 41 Lines • ▼ Show 20 Lines
	; RV32-NEXT: li a0, 56			; RV32-NEXT: li a0, 56
	; RV32-NEXT: vsrl.vx v8, v8, a0			; RV32-NEXT: vsrl.vx v8, v8, a0
	; RV32-NEXT: addi sp, sp, 16			; RV32-NEXT: addi sp, sp, 16
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: ctpop_nxv8i64:			; RV64-LABEL: ctpop_nxv8i64:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: vsetvli a0, zero, e64, m8, ta, mu			; RV64-NEXT: vsetvli a0, zero, e64, m8, ta, mu
				; RV64-NEXT: lui a0, %hi(.LCPI21_0)
				; RV64-NEXT: ld a0, %lo(.LCPI21_0)(a0)
				; RV64-NEXT: lui a1, %hi(.LCPI21_1)
				; RV64-NEXT: ld a1, %lo(.LCPI21_1)(a1)
	; RV64-NEXT: vsrl.vi v16, v8, 1			; RV64-NEXT: vsrl.vi v16, v8, 1
	; RV64-NEXT: lui a0, 21845
	; RV64-NEXT: addiw a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: vand.vx v16, v16, a0			; RV64-NEXT: vand.vx v16, v16, a0
	; RV64-NEXT: vsub.vv v8, v8, v16			; RV64-NEXT: vsub.vv v8, v8, v16
	; RV64-NEXT: lui a0, 13107			; RV64-NEXT: vand.vx v16, v8, a1
	; RV64-NEXT: addiw a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: vand.vx v16, v8, a0
	; RV64-NEXT: vsrl.vi v8, v8, 2			; RV64-NEXT: vsrl.vi v8, v8, 2
	; RV64-NEXT: vand.vx v8, v8, a0			; RV64-NEXT: vand.vx v8, v8, a1
	; RV64-NEXT: vadd.vv v8, v16, v8			; RV64-NEXT: vadd.vv v8, v16, v8
				; RV64-NEXT: lui a0, %hi(.LCPI21_2)
				; RV64-NEXT: ld a0, %lo(.LCPI21_2)(a0)
				; RV64-NEXT: lui a1, %hi(.LCPI21_3)
				; RV64-NEXT: ld a1, %lo(.LCPI21_3)(a1)
	; RV64-NEXT: vsrl.vi v16, v8, 4			; RV64-NEXT: vsrl.vi v16, v8, 4
	; RV64-NEXT: vadd.vv v8, v8, v16			; RV64-NEXT: vadd.vv v8, v8, v16
	; RV64-NEXT: lui a0, 3855
	; RV64-NEXT: addiw a0, a0, 241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, -241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, -241
	; RV64-NEXT: vand.vx v8, v8, a0			; RV64-NEXT: vand.vx v8, v8, a0
	; RV64-NEXT: lui a0, 4112			; RV64-NEXT: vmul.vx v8, v8, a1
	; RV64-NEXT: addiw a0, a0, 257
	; RV64-NEXT: slli a0, a0, 16
	; RV64-NEXT: addi a0, a0, 257
	; RV64-NEXT: slli a0, a0, 16
	; RV64-NEXT: addi a0, a0, 257
	; RV64-NEXT: vmul.vx v8, v8, a0
	; RV64-NEXT: li a0, 56			; RV64-NEXT: li a0, 56
	; RV64-NEXT: vsrl.vx v8, v8, a0			; RV64-NEXT: vsrl.vx v8, v8, a0
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%a = call <vscale x 8 x i64> @llvm.ctpop.nxv8i64(<vscale x 8 x i64> %va)			%a = call <vscale x 8 x i64> @llvm.ctpop.nxv8i64(<vscale x 8 x i64> %va)
	ret <vscale x 8 x i64> %a			ret <vscale x 8 x i64> %a
	}			}
	declare <vscale x 8 x i64> @llvm.ctpop.nxv8i64(<vscale x 8 x i64>)			declare <vscale x 8 x i64> @llvm.ctpop.nxv8i64(<vscale x 8 x i64>)

llvm/test/CodeGen/RISCV/rvv/cttz-sdnode.ll

	Show First 20 Lines • Show All 1,551 Lines • ▼ Show 20 Lines
	;			;
	; RV64-LABEL: cttz_nxv1i64:			; RV64-LABEL: cttz_nxv1i64:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: li a0, 1			; RV64-NEXT: li a0, 1
	; RV64-NEXT: vsetvli a1, zero, e64, m1, ta, mu			; RV64-NEXT: vsetvli a1, zero, e64, m1, ta, mu
	; RV64-NEXT: vsub.vx v9, v8, a0			; RV64-NEXT: vsub.vx v9, v8, a0
	; RV64-NEXT: vxor.vi v8, v8, -1			; RV64-NEXT: vxor.vi v8, v8, -1
	; RV64-NEXT: vand.vv v8, v8, v9			; RV64-NEXT: vand.vv v8, v8, v9
				; RV64-NEXT: lui a0, %hi(.LCPI18_0)
				; RV64-NEXT: ld a0, %lo(.LCPI18_0)(a0)
				; RV64-NEXT: lui a1, %hi(.LCPI18_1)
				; RV64-NEXT: ld a1, %lo(.LCPI18_1)(a1)
	; RV64-NEXT: vsrl.vi v9, v8, 1			; RV64-NEXT: vsrl.vi v9, v8, 1
	; RV64-NEXT: lui a0, 21845
	; RV64-NEXT: addiw a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: vand.vx v9, v9, a0			; RV64-NEXT: vand.vx v9, v9, a0
	; RV64-NEXT: vsub.vv v8, v8, v9			; RV64-NEXT: vsub.vv v8, v8, v9
	; RV64-NEXT: lui a0, 13107			; RV64-NEXT: vand.vx v9, v8, a1
	; RV64-NEXT: addiw a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: vand.vx v9, v8, a0
	; RV64-NEXT: vsrl.vi v8, v8, 2			; RV64-NEXT: vsrl.vi v8, v8, 2
	; RV64-NEXT: vand.vx v8, v8, a0			; RV64-NEXT: vand.vx v8, v8, a1
	; RV64-NEXT: vadd.vv v8, v9, v8			; RV64-NEXT: vadd.vv v8, v9, v8
				; RV64-NEXT: lui a0, %hi(.LCPI18_2)
				; RV64-NEXT: ld a0, %lo(.LCPI18_2)(a0)
				; RV64-NEXT: lui a1, %hi(.LCPI18_3)
				; RV64-NEXT: ld a1, %lo(.LCPI18_3)(a1)
	; RV64-NEXT: vsrl.vi v9, v8, 4			; RV64-NEXT: vsrl.vi v9, v8, 4
	; RV64-NEXT: vadd.vv v8, v8, v9			; RV64-NEXT: vadd.vv v8, v8, v9
	; RV64-NEXT: lui a0, 3855
	; RV64-NEXT: addiw a0, a0, 241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, -241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, -241
	; RV64-NEXT: vand.vx v8, v8, a0			; RV64-NEXT: vand.vx v8, v8, a0
	; RV64-NEXT: lui a0, 4112			; RV64-NEXT: vmul.vx v8, v8, a1
	; RV64-NEXT: addiw a0, a0, 257
	; RV64-NEXT: slli a0, a0, 16
	; RV64-NEXT: addi a0, a0, 257
	; RV64-NEXT: slli a0, a0, 16
	; RV64-NEXT: addi a0, a0, 257
	; RV64-NEXT: vmul.vx v8, v8, a0
	; RV64-NEXT: li a0, 56			; RV64-NEXT: li a0, 56
	; RV64-NEXT: vsrl.vx v8, v8, a0			; RV64-NEXT: vsrl.vx v8, v8, a0
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%a = call <vscale x 1 x i64> @llvm.cttz.nxv1i64(<vscale x 1 x i64> %va, i1 false)			%a = call <vscale x 1 x i64> @llvm.cttz.nxv1i64(<vscale x 1 x i64> %va, i1 false)
	ret <vscale x 1 x i64> %a			ret <vscale x 1 x i64> %a
	}			}
	declare <vscale x 1 x i64> @llvm.cttz.nxv1i64(<vscale x 1 x i64>, i1)			declare <vscale x 1 x i64> @llvm.cttz.nxv1i64(<vscale x 1 x i64>, i1)

	▲ Show 20 Lines • Show All 49 Lines • ▼ Show 20 Lines
	;			;
	; RV64-LABEL: cttz_nxv2i64:			; RV64-LABEL: cttz_nxv2i64:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: li a0, 1			; RV64-NEXT: li a0, 1
	; RV64-NEXT: vsetvli a1, zero, e64, m2, ta, mu			; RV64-NEXT: vsetvli a1, zero, e64, m2, ta, mu
	; RV64-NEXT: vsub.vx v10, v8, a0			; RV64-NEXT: vsub.vx v10, v8, a0
	; RV64-NEXT: vxor.vi v8, v8, -1			; RV64-NEXT: vxor.vi v8, v8, -1
	; RV64-NEXT: vand.vv v8, v8, v10			; RV64-NEXT: vand.vv v8, v8, v10
				; RV64-NEXT: lui a0, %hi(.LCPI19_0)
				; RV64-NEXT: ld a0, %lo(.LCPI19_0)(a0)
				; RV64-NEXT: lui a1, %hi(.LCPI19_1)
				; RV64-NEXT: ld a1, %lo(.LCPI19_1)(a1)
	; RV64-NEXT: vsrl.vi v10, v8, 1			; RV64-NEXT: vsrl.vi v10, v8, 1
	; RV64-NEXT: lui a0, 21845
	; RV64-NEXT: addiw a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: vand.vx v10, v10, a0			; RV64-NEXT: vand.vx v10, v10, a0
	; RV64-NEXT: vsub.vv v8, v8, v10			; RV64-NEXT: vsub.vv v8, v8, v10
	; RV64-NEXT: lui a0, 13107			; RV64-NEXT: vand.vx v10, v8, a1
	; RV64-NEXT: addiw a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: vand.vx v10, v8, a0
	; RV64-NEXT: vsrl.vi v8, v8, 2			; RV64-NEXT: vsrl.vi v8, v8, 2
	; RV64-NEXT: vand.vx v8, v8, a0			; RV64-NEXT: vand.vx v8, v8, a1
	; RV64-NEXT: vadd.vv v8, v10, v8			; RV64-NEXT: vadd.vv v8, v10, v8
				; RV64-NEXT: lui a0, %hi(.LCPI19_2)
				; RV64-NEXT: ld a0, %lo(.LCPI19_2)(a0)
				; RV64-NEXT: lui a1, %hi(.LCPI19_3)
				; RV64-NEXT: ld a1, %lo(.LCPI19_3)(a1)
	; RV64-NEXT: vsrl.vi v10, v8, 4			; RV64-NEXT: vsrl.vi v10, v8, 4
	; RV64-NEXT: vadd.vv v8, v8, v10			; RV64-NEXT: vadd.vv v8, v8, v10
	; RV64-NEXT: lui a0, 3855
	; RV64-NEXT: addiw a0, a0, 241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, -241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, -241
	; RV64-NEXT: vand.vx v8, v8, a0			; RV64-NEXT: vand.vx v8, v8, a0
	; RV64-NEXT: lui a0, 4112			; RV64-NEXT: vmul.vx v8, v8, a1
	; RV64-NEXT: addiw a0, a0, 257
	; RV64-NEXT: slli a0, a0, 16
	; RV64-NEXT: addi a0, a0, 257
	; RV64-NEXT: slli a0, a0, 16
	; RV64-NEXT: addi a0, a0, 257
	; RV64-NEXT: vmul.vx v8, v8, a0
	; RV64-NEXT: li a0, 56			; RV64-NEXT: li a0, 56
	; RV64-NEXT: vsrl.vx v8, v8, a0			; RV64-NEXT: vsrl.vx v8, v8, a0
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%a = call <vscale x 2 x i64> @llvm.cttz.nxv2i64(<vscale x 2 x i64> %va, i1 false)			%a = call <vscale x 2 x i64> @llvm.cttz.nxv2i64(<vscale x 2 x i64> %va, i1 false)
	ret <vscale x 2 x i64> %a			ret <vscale x 2 x i64> %a
	}			}
	declare <vscale x 2 x i64> @llvm.cttz.nxv2i64(<vscale x 2 x i64>, i1)			declare <vscale x 2 x i64> @llvm.cttz.nxv2i64(<vscale x 2 x i64>, i1)

	▲ Show 20 Lines • Show All 49 Lines • ▼ Show 20 Lines
	;			;
	; RV64-LABEL: cttz_nxv4i64:			; RV64-LABEL: cttz_nxv4i64:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: li a0, 1			; RV64-NEXT: li a0, 1
	; RV64-NEXT: vsetvli a1, zero, e64, m4, ta, mu			; RV64-NEXT: vsetvli a1, zero, e64, m4, ta, mu
	; RV64-NEXT: vsub.vx v12, v8, a0			; RV64-NEXT: vsub.vx v12, v8, a0
	; RV64-NEXT: vxor.vi v8, v8, -1			; RV64-NEXT: vxor.vi v8, v8, -1
	; RV64-NEXT: vand.vv v8, v8, v12			; RV64-NEXT: vand.vv v8, v8, v12
				; RV64-NEXT: lui a0, %hi(.LCPI20_0)
				; RV64-NEXT: ld a0, %lo(.LCPI20_0)(a0)
				; RV64-NEXT: lui a1, %hi(.LCPI20_1)
				; RV64-NEXT: ld a1, %lo(.LCPI20_1)(a1)
	; RV64-NEXT: vsrl.vi v12, v8, 1			; RV64-NEXT: vsrl.vi v12, v8, 1
	; RV64-NEXT: lui a0, 21845
	; RV64-NEXT: addiw a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: vand.vx v12, v12, a0			; RV64-NEXT: vand.vx v12, v12, a0
	; RV64-NEXT: vsub.vv v8, v8, v12			; RV64-NEXT: vsub.vv v8, v8, v12
	; RV64-NEXT: lui a0, 13107			; RV64-NEXT: vand.vx v12, v8, a1
	; RV64-NEXT: addiw a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: vand.vx v12, v8, a0
	; RV64-NEXT: vsrl.vi v8, v8, 2			; RV64-NEXT: vsrl.vi v8, v8, 2
	; RV64-NEXT: vand.vx v8, v8, a0			; RV64-NEXT: vand.vx v8, v8, a1
	; RV64-NEXT: vadd.vv v8, v12, v8			; RV64-NEXT: vadd.vv v8, v12, v8
				; RV64-NEXT: lui a0, %hi(.LCPI20_2)
				; RV64-NEXT: ld a0, %lo(.LCPI20_2)(a0)
				; RV64-NEXT: lui a1, %hi(.LCPI20_3)
				; RV64-NEXT: ld a1, %lo(.LCPI20_3)(a1)
	; RV64-NEXT: vsrl.vi v12, v8, 4			; RV64-NEXT: vsrl.vi v12, v8, 4
	; RV64-NEXT: vadd.vv v8, v8, v12			; RV64-NEXT: vadd.vv v8, v8, v12
	; RV64-NEXT: lui a0, 3855
	; RV64-NEXT: addiw a0, a0, 241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, -241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, -241
	; RV64-NEXT: vand.vx v8, v8, a0			; RV64-NEXT: vand.vx v8, v8, a0
	; RV64-NEXT: lui a0, 4112			; RV64-NEXT: vmul.vx v8, v8, a1
	; RV64-NEXT: addiw a0, a0, 257
	; RV64-NEXT: slli a0, a0, 16
	; RV64-NEXT: addi a0, a0, 257
	; RV64-NEXT: slli a0, a0, 16
	; RV64-NEXT: addi a0, a0, 257
	; RV64-NEXT: vmul.vx v8, v8, a0
	; RV64-NEXT: li a0, 56			; RV64-NEXT: li a0, 56
	; RV64-NEXT: vsrl.vx v8, v8, a0			; RV64-NEXT: vsrl.vx v8, v8, a0
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%a = call <vscale x 4 x i64> @llvm.cttz.nxv4i64(<vscale x 4 x i64> %va, i1 false)			%a = call <vscale x 4 x i64> @llvm.cttz.nxv4i64(<vscale x 4 x i64> %va, i1 false)
	ret <vscale x 4 x i64> %a			ret <vscale x 4 x i64> %a
	}			}
	declare <vscale x 4 x i64> @llvm.cttz.nxv4i64(<vscale x 4 x i64>, i1)			declare <vscale x 4 x i64> @llvm.cttz.nxv4i64(<vscale x 4 x i64>, i1)

	▲ Show 20 Lines • Show All 49 Lines • ▼ Show 20 Lines
	;			;
	; RV64-LABEL: cttz_nxv8i64:			; RV64-LABEL: cttz_nxv8i64:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: li a0, 1			; RV64-NEXT: li a0, 1
	; RV64-NEXT: vsetvli a1, zero, e64, m8, ta, mu			; RV64-NEXT: vsetvli a1, zero, e64, m8, ta, mu
	; RV64-NEXT: vsub.vx v16, v8, a0			; RV64-NEXT: vsub.vx v16, v8, a0
	; RV64-NEXT: vxor.vi v8, v8, -1			; RV64-NEXT: vxor.vi v8, v8, -1
	; RV64-NEXT: vand.vv v8, v8, v16			; RV64-NEXT: vand.vv v8, v8, v16
				; RV64-NEXT: lui a0, %hi(.LCPI21_0)
				; RV64-NEXT: ld a0, %lo(.LCPI21_0)(a0)
				; RV64-NEXT: lui a1, %hi(.LCPI21_1)
				; RV64-NEXT: ld a1, %lo(.LCPI21_1)(a1)
	; RV64-NEXT: vsrl.vi v16, v8, 1			; RV64-NEXT: vsrl.vi v16, v8, 1
	; RV64-NEXT: lui a0, 21845
	; RV64-NEXT: addiw a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: vand.vx v16, v16, a0			; RV64-NEXT: vand.vx v16, v16, a0
	; RV64-NEXT: vsub.vv v8, v8, v16			; RV64-NEXT: vsub.vv v8, v8, v16
	; RV64-NEXT: lui a0, 13107			; RV64-NEXT: vand.vx v16, v8, a1
	; RV64-NEXT: addiw a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: vand.vx v16, v8, a0
	; RV64-NEXT: vsrl.vi v8, v8, 2			; RV64-NEXT: vsrl.vi v8, v8, 2
	; RV64-NEXT: vand.vx v8, v8, a0			; RV64-NEXT: vand.vx v8, v8, a1
	; RV64-NEXT: vadd.vv v8, v16, v8			; RV64-NEXT: vadd.vv v8, v16, v8
				; RV64-NEXT: lui a0, %hi(.LCPI21_2)
				; RV64-NEXT: ld a0, %lo(.LCPI21_2)(a0)
				; RV64-NEXT: lui a1, %hi(.LCPI21_3)
				; RV64-NEXT: ld a1, %lo(.LCPI21_3)(a1)
	; RV64-NEXT: vsrl.vi v16, v8, 4			; RV64-NEXT: vsrl.vi v16, v8, 4
	; RV64-NEXT: vadd.vv v8, v8, v16			; RV64-NEXT: vadd.vv v8, v8, v16
	; RV64-NEXT: lui a0, 3855
	; RV64-NEXT: addiw a0, a0, 241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, -241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, -241
	; RV64-NEXT: vand.vx v8, v8, a0			; RV64-NEXT: vand.vx v8, v8, a0
	; RV64-NEXT: lui a0, 4112			; RV64-NEXT: vmul.vx v8, v8, a1
	; RV64-NEXT: addiw a0, a0, 257
	; RV64-NEXT: slli a0, a0, 16
	; RV64-NEXT: addi a0, a0, 257
	; RV64-NEXT: slli a0, a0, 16
	; RV64-NEXT: addi a0, a0, 257
	; RV64-NEXT: vmul.vx v8, v8, a0
	; RV64-NEXT: li a0, 56			; RV64-NEXT: li a0, 56
	; RV64-NEXT: vsrl.vx v8, v8, a0			; RV64-NEXT: vsrl.vx v8, v8, a0
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%a = call <vscale x 8 x i64> @llvm.cttz.nxv8i64(<vscale x 8 x i64> %va, i1 false)			%a = call <vscale x 8 x i64> @llvm.cttz.nxv8i64(<vscale x 8 x i64> %va, i1 false)
	ret <vscale x 8 x i64> %a			ret <vscale x 8 x i64> %a
	}			}
	declare <vscale x 8 x i64> @llvm.cttz.nxv8i64(<vscale x 8 x i64>, i1)			declare <vscale x 8 x i64> @llvm.cttz.nxv8i64(<vscale x 8 x i64>, i1)

	▲ Show 20 Lines • Show All 1,429 Lines • ▼ Show 20 Lines
	;			;
	; RV64-LABEL: cttz_zero_undef_nxv1i64:			; RV64-LABEL: cttz_zero_undef_nxv1i64:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: li a0, 1			; RV64-NEXT: li a0, 1
	; RV64-NEXT: vsetvli a1, zero, e64, m1, ta, mu			; RV64-NEXT: vsetvli a1, zero, e64, m1, ta, mu
	; RV64-NEXT: vsub.vx v9, v8, a0			; RV64-NEXT: vsub.vx v9, v8, a0
	; RV64-NEXT: vxor.vi v8, v8, -1			; RV64-NEXT: vxor.vi v8, v8, -1
	; RV64-NEXT: vand.vv v8, v8, v9			; RV64-NEXT: vand.vv v8, v8, v9
				; RV64-NEXT: lui a0, %hi(.LCPI40_0)
				; RV64-NEXT: ld a0, %lo(.LCPI40_0)(a0)
				; RV64-NEXT: lui a1, %hi(.LCPI40_1)
				; RV64-NEXT: ld a1, %lo(.LCPI40_1)(a1)
	; RV64-NEXT: vsrl.vi v9, v8, 1			; RV64-NEXT: vsrl.vi v9, v8, 1
	; RV64-NEXT: lui a0, 21845
	; RV64-NEXT: addiw a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: vand.vx v9, v9, a0			; RV64-NEXT: vand.vx v9, v9, a0
	; RV64-NEXT: vsub.vv v8, v8, v9			; RV64-NEXT: vsub.vv v8, v8, v9
	; RV64-NEXT: lui a0, 13107			; RV64-NEXT: vand.vx v9, v8, a1
	; RV64-NEXT: addiw a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: vand.vx v9, v8, a0
	; RV64-NEXT: vsrl.vi v8, v8, 2			; RV64-NEXT: vsrl.vi v8, v8, 2
	; RV64-NEXT: vand.vx v8, v8, a0			; RV64-NEXT: vand.vx v8, v8, a1
	; RV64-NEXT: vadd.vv v8, v9, v8			; RV64-NEXT: vadd.vv v8, v9, v8
				; RV64-NEXT: lui a0, %hi(.LCPI40_2)
				; RV64-NEXT: ld a0, %lo(.LCPI40_2)(a0)
				; RV64-NEXT: lui a1, %hi(.LCPI40_3)
				; RV64-NEXT: ld a1, %lo(.LCPI40_3)(a1)
	; RV64-NEXT: vsrl.vi v9, v8, 4			; RV64-NEXT: vsrl.vi v9, v8, 4
	; RV64-NEXT: vadd.vv v8, v8, v9			; RV64-NEXT: vadd.vv v8, v8, v9
	; RV64-NEXT: lui a0, 3855
	; RV64-NEXT: addiw a0, a0, 241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, -241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, -241
	; RV64-NEXT: vand.vx v8, v8, a0			; RV64-NEXT: vand.vx v8, v8, a0
	; RV64-NEXT: lui a0, 4112			; RV64-NEXT: vmul.vx v8, v8, a1
	; RV64-NEXT: addiw a0, a0, 257
	; RV64-NEXT: slli a0, a0, 16
	; RV64-NEXT: addi a0, a0, 257
	; RV64-NEXT: slli a0, a0, 16
	; RV64-NEXT: addi a0, a0, 257
	; RV64-NEXT: vmul.vx v8, v8, a0
	; RV64-NEXT: li a0, 56			; RV64-NEXT: li a0, 56
	; RV64-NEXT: vsrl.vx v8, v8, a0			; RV64-NEXT: vsrl.vx v8, v8, a0
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%a = call <vscale x 1 x i64> @llvm.cttz.nxv1i64(<vscale x 1 x i64> %va, i1 true)			%a = call <vscale x 1 x i64> @llvm.cttz.nxv1i64(<vscale x 1 x i64> %va, i1 true)
	ret <vscale x 1 x i64> %a			ret <vscale x 1 x i64> %a
	}			}

	define <vscale x 2 x i64> @cttz_zero_undef_nxv2i64(<vscale x 2 x i64> %va) {			define <vscale x 2 x i64> @cttz_zero_undef_nxv2i64(<vscale x 2 x i64> %va) {
	▲ Show 20 Lines • Show All 48 Lines • ▼ Show 20 Lines
	;			;
	; RV64-LABEL: cttz_zero_undef_nxv2i64:			; RV64-LABEL: cttz_zero_undef_nxv2i64:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: li a0, 1			; RV64-NEXT: li a0, 1
	; RV64-NEXT: vsetvli a1, zero, e64, m2, ta, mu			; RV64-NEXT: vsetvli a1, zero, e64, m2, ta, mu
	; RV64-NEXT: vsub.vx v10, v8, a0			; RV64-NEXT: vsub.vx v10, v8, a0
	; RV64-NEXT: vxor.vi v8, v8, -1			; RV64-NEXT: vxor.vi v8, v8, -1
	; RV64-NEXT: vand.vv v8, v8, v10			; RV64-NEXT: vand.vv v8, v8, v10
				; RV64-NEXT: lui a0, %hi(.LCPI41_0)
				; RV64-NEXT: ld a0, %lo(.LCPI41_0)(a0)
				; RV64-NEXT: lui a1, %hi(.LCPI41_1)
				; RV64-NEXT: ld a1, %lo(.LCPI41_1)(a1)
	; RV64-NEXT: vsrl.vi v10, v8, 1			; RV64-NEXT: vsrl.vi v10, v8, 1
	; RV64-NEXT: lui a0, 21845
	; RV64-NEXT: addiw a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: vand.vx v10, v10, a0			; RV64-NEXT: vand.vx v10, v10, a0
	; RV64-NEXT: vsub.vv v8, v8, v10			; RV64-NEXT: vsub.vv v8, v8, v10
	; RV64-NEXT: lui a0, 13107			; RV64-NEXT: vand.vx v10, v8, a1
	; RV64-NEXT: addiw a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: vand.vx v10, v8, a0
	; RV64-NEXT: vsrl.vi v8, v8, 2			; RV64-NEXT: vsrl.vi v8, v8, 2
	; RV64-NEXT: vand.vx v8, v8, a0			; RV64-NEXT: vand.vx v8, v8, a1
	; RV64-NEXT: vadd.vv v8, v10, v8			; RV64-NEXT: vadd.vv v8, v10, v8
				; RV64-NEXT: lui a0, %hi(.LCPI41_2)
				; RV64-NEXT: ld a0, %lo(.LCPI41_2)(a0)
				; RV64-NEXT: lui a1, %hi(.LCPI41_3)
				; RV64-NEXT: ld a1, %lo(.LCPI41_3)(a1)
	; RV64-NEXT: vsrl.vi v10, v8, 4			; RV64-NEXT: vsrl.vi v10, v8, 4
	; RV64-NEXT: vadd.vv v8, v8, v10			; RV64-NEXT: vadd.vv v8, v8, v10
	; RV64-NEXT: lui a0, 3855
	; RV64-NEXT: addiw a0, a0, 241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, -241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, -241
	; RV64-NEXT: vand.vx v8, v8, a0			; RV64-NEXT: vand.vx v8, v8, a0
	; RV64-NEXT: lui a0, 4112			; RV64-NEXT: vmul.vx v8, v8, a1
	; RV64-NEXT: addiw a0, a0, 257
	; RV64-NEXT: slli a0, a0, 16
	; RV64-NEXT: addi a0, a0, 257
	; RV64-NEXT: slli a0, a0, 16
	; RV64-NEXT: addi a0, a0, 257
	; RV64-NEXT: vmul.vx v8, v8, a0
	; RV64-NEXT: li a0, 56			; RV64-NEXT: li a0, 56
	; RV64-NEXT: vsrl.vx v8, v8, a0			; RV64-NEXT: vsrl.vx v8, v8, a0
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%a = call <vscale x 2 x i64> @llvm.cttz.nxv2i64(<vscale x 2 x i64> %va, i1 true)			%a = call <vscale x 2 x i64> @llvm.cttz.nxv2i64(<vscale x 2 x i64> %va, i1 true)
	ret <vscale x 2 x i64> %a			ret <vscale x 2 x i64> %a
	}			}

	define <vscale x 4 x i64> @cttz_zero_undef_nxv4i64(<vscale x 4 x i64> %va) {			define <vscale x 4 x i64> @cttz_zero_undef_nxv4i64(<vscale x 4 x i64> %va) {
	▲ Show 20 Lines • Show All 48 Lines • ▼ Show 20 Lines
	;			;
	; RV64-LABEL: cttz_zero_undef_nxv4i64:			; RV64-LABEL: cttz_zero_undef_nxv4i64:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: li a0, 1			; RV64-NEXT: li a0, 1
	; RV64-NEXT: vsetvli a1, zero, e64, m4, ta, mu			; RV64-NEXT: vsetvli a1, zero, e64, m4, ta, mu
	; RV64-NEXT: vsub.vx v12, v8, a0			; RV64-NEXT: vsub.vx v12, v8, a0
	; RV64-NEXT: vxor.vi v8, v8, -1			; RV64-NEXT: vxor.vi v8, v8, -1
	; RV64-NEXT: vand.vv v8, v8, v12			; RV64-NEXT: vand.vv v8, v8, v12
				; RV64-NEXT: lui a0, %hi(.LCPI42_0)
				; RV64-NEXT: ld a0, %lo(.LCPI42_0)(a0)
				; RV64-NEXT: lui a1, %hi(.LCPI42_1)
				; RV64-NEXT: ld a1, %lo(.LCPI42_1)(a1)
	; RV64-NEXT: vsrl.vi v12, v8, 1			; RV64-NEXT: vsrl.vi v12, v8, 1
	; RV64-NEXT: lui a0, 21845
	; RV64-NEXT: addiw a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: vand.vx v12, v12, a0			; RV64-NEXT: vand.vx v12, v12, a0
	; RV64-NEXT: vsub.vv v8, v8, v12			; RV64-NEXT: vsub.vv v8, v8, v12
	; RV64-NEXT: lui a0, 13107			; RV64-NEXT: vand.vx v12, v8, a1
	; RV64-NEXT: addiw a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: vand.vx v12, v8, a0
	; RV64-NEXT: vsrl.vi v8, v8, 2			; RV64-NEXT: vsrl.vi v8, v8, 2
	; RV64-NEXT: vand.vx v8, v8, a0			; RV64-NEXT: vand.vx v8, v8, a1
	; RV64-NEXT: vadd.vv v8, v12, v8			; RV64-NEXT: vadd.vv v8, v12, v8
				; RV64-NEXT: lui a0, %hi(.LCPI42_2)
				; RV64-NEXT: ld a0, %lo(.LCPI42_2)(a0)
				; RV64-NEXT: lui a1, %hi(.LCPI42_3)
				; RV64-NEXT: ld a1, %lo(.LCPI42_3)(a1)
	; RV64-NEXT: vsrl.vi v12, v8, 4			; RV64-NEXT: vsrl.vi v12, v8, 4
	; RV64-NEXT: vadd.vv v8, v8, v12			; RV64-NEXT: vadd.vv v8, v8, v12
	; RV64-NEXT: lui a0, 3855
	; RV64-NEXT: addiw a0, a0, 241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, -241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, -241
	; RV64-NEXT: vand.vx v8, v8, a0			; RV64-NEXT: vand.vx v8, v8, a0
	; RV64-NEXT: lui a0, 4112			; RV64-NEXT: vmul.vx v8, v8, a1
	; RV64-NEXT: addiw a0, a0, 257
	; RV64-NEXT: slli a0, a0, 16
	; RV64-NEXT: addi a0, a0, 257
	; RV64-NEXT: slli a0, a0, 16
	; RV64-NEXT: addi a0, a0, 257
	; RV64-NEXT: vmul.vx v8, v8, a0
	; RV64-NEXT: li a0, 56			; RV64-NEXT: li a0, 56
	; RV64-NEXT: vsrl.vx v8, v8, a0			; RV64-NEXT: vsrl.vx v8, v8, a0
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%a = call <vscale x 4 x i64> @llvm.cttz.nxv4i64(<vscale x 4 x i64> %va, i1 true)			%a = call <vscale x 4 x i64> @llvm.cttz.nxv4i64(<vscale x 4 x i64> %va, i1 true)
	ret <vscale x 4 x i64> %a			ret <vscale x 4 x i64> %a
	}			}

	define <vscale x 8 x i64> @cttz_zero_undef_nxv8i64(<vscale x 8 x i64> %va) {			define <vscale x 8 x i64> @cttz_zero_undef_nxv8i64(<vscale x 8 x i64> %va) {
	▲ Show 20 Lines • Show All 48 Lines • ▼ Show 20 Lines
	;			;
	; RV64-LABEL: cttz_zero_undef_nxv8i64:			; RV64-LABEL: cttz_zero_undef_nxv8i64:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: li a0, 1			; RV64-NEXT: li a0, 1
	; RV64-NEXT: vsetvli a1, zero, e64, m8, ta, mu			; RV64-NEXT: vsetvli a1, zero, e64, m8, ta, mu
	; RV64-NEXT: vsub.vx v16, v8, a0			; RV64-NEXT: vsub.vx v16, v8, a0
	; RV64-NEXT: vxor.vi v8, v8, -1			; RV64-NEXT: vxor.vi v8, v8, -1
	; RV64-NEXT: vand.vv v8, v8, v16			; RV64-NEXT: vand.vv v8, v8, v16
				; RV64-NEXT: lui a0, %hi(.LCPI43_0)
				; RV64-NEXT: ld a0, %lo(.LCPI43_0)(a0)
				; RV64-NEXT: lui a1, %hi(.LCPI43_1)
				; RV64-NEXT: ld a1, %lo(.LCPI43_1)(a1)
	; RV64-NEXT: vsrl.vi v16, v8, 1			; RV64-NEXT: vsrl.vi v16, v8, 1
	; RV64-NEXT: lui a0, 21845
	; RV64-NEXT: addiw a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1365
	; RV64-NEXT: vand.vx v16, v16, a0			; RV64-NEXT: vand.vx v16, v16, a0
	; RV64-NEXT: vsub.vv v8, v8, v16			; RV64-NEXT: vsub.vv v8, v8, v16
	; RV64-NEXT: lui a0, 13107			; RV64-NEXT: vand.vx v16, v8, a1
	; RV64-NEXT: addiw a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 819
	; RV64-NEXT: vand.vx v16, v8, a0
	; RV64-NEXT: vsrl.vi v8, v8, 2			; RV64-NEXT: vsrl.vi v8, v8, 2
	; RV64-NEXT: vand.vx v8, v8, a0			; RV64-NEXT: vand.vx v8, v8, a1
	; RV64-NEXT: vadd.vv v8, v16, v8			; RV64-NEXT: vadd.vv v8, v16, v8
				; RV64-NEXT: lui a0, %hi(.LCPI43_2)
				; RV64-NEXT: ld a0, %lo(.LCPI43_2)(a0)
				; RV64-NEXT: lui a1, %hi(.LCPI43_3)
				; RV64-NEXT: ld a1, %lo(.LCPI43_3)(a1)
	; RV64-NEXT: vsrl.vi v16, v8, 4			; RV64-NEXT: vsrl.vi v16, v8, 4
	; RV64-NEXT: vadd.vv v8, v8, v16			; RV64-NEXT: vadd.vv v8, v8, v16
	; RV64-NEXT: lui a0, 3855
	; RV64-NEXT: addiw a0, a0, 241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, -241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 241
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, -241
	; RV64-NEXT: vand.vx v8, v8, a0			; RV64-NEXT: vand.vx v8, v8, a0
	; RV64-NEXT: lui a0, 4112			; RV64-NEXT: vmul.vx v8, v8, a1
	; RV64-NEXT: addiw a0, a0, 257
	; RV64-NEXT: slli a0, a0, 16
	; RV64-NEXT: addi a0, a0, 257
	; RV64-NEXT: slli a0, a0, 16
	; RV64-NEXT: addi a0, a0, 257
	; RV64-NEXT: vmul.vx v8, v8, a0
	; RV64-NEXT: li a0, 56			; RV64-NEXT: li a0, 56
	; RV64-NEXT: vsrl.vx v8, v8, a0			; RV64-NEXT: vsrl.vx v8, v8, a0
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%a = call <vscale x 8 x i64> @llvm.cttz.nxv8i64(<vscale x 8 x i64> %va, i1 true)			%a = call <vscale x 8 x i64> @llvm.cttz.nxv8i64(<vscale x 8 x i64> %va, i1 true)
	ret <vscale x 8 x i64> %a			ret <vscale x 8 x i64> %a
	}			}

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-bitreverse.ll

	Show First 20 Lines • Show All 416 Lines • ▼ Show 20 Lines
	; LMULMAX2-RV64-NEXT: slli a4, a3, 40			; LMULMAX2-RV64-NEXT: slli a4, a3, 40
	; LMULMAX2-RV64-NEXT: vand.vx v11, v11, a4			; LMULMAX2-RV64-NEXT: vand.vx v11, v11, a4
	; LMULMAX2-RV64-NEXT: vor.vv v10, v11, v10			; LMULMAX2-RV64-NEXT: vor.vv v10, v11, v10
	; LMULMAX2-RV64-NEXT: vsll.vx v11, v8, a1			; LMULMAX2-RV64-NEXT: vsll.vx v11, v8, a1
	; LMULMAX2-RV64-NEXT: vsll.vx v8, v8, a2			; LMULMAX2-RV64-NEXT: vsll.vx v8, v8, a2
	; LMULMAX2-RV64-NEXT: slli a1, a3, 48			; LMULMAX2-RV64-NEXT: slli a1, a3, 48
	; LMULMAX2-RV64-NEXT: vand.vx v8, v8, a1			; LMULMAX2-RV64-NEXT: vand.vx v8, v8, a1
	; LMULMAX2-RV64-NEXT: vor.vv v8, v11, v8			; LMULMAX2-RV64-NEXT: vor.vv v8, v11, v8
				; LMULMAX2-RV64-NEXT: lui a1, %hi(.LCPI2_0)
				; LMULMAX2-RV64-NEXT: ld a1, %lo(.LCPI2_0)(a1)
	; LMULMAX2-RV64-NEXT: vor.vv v8, v8, v10			; LMULMAX2-RV64-NEXT: vor.vv v8, v8, v10
	; LMULMAX2-RV64-NEXT: vor.vv v8, v8, v9			; LMULMAX2-RV64-NEXT: vor.vv v8, v8, v9
	; LMULMAX2-RV64-NEXT: vsrl.vi v9, v8, 4			; LMULMAX2-RV64-NEXT: vsrl.vi v9, v8, 4
	; LMULMAX2-RV64-NEXT: lui a1, 3855
	; LMULMAX2-RV64-NEXT: addiw a1, a1, 241
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, -241
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 241
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, -241
	; LMULMAX2-RV64-NEXT: vand.vx v9, v9, a1			; LMULMAX2-RV64-NEXT: vand.vx v9, v9, a1
	; LMULMAX2-RV64-NEXT: vand.vx v8, v8, a1			; LMULMAX2-RV64-NEXT: vand.vx v8, v8, a1
				; LMULMAX2-RV64-NEXT: lui a1, %hi(.LCPI2_1)
				; LMULMAX2-RV64-NEXT: ld a1, %lo(.LCPI2_1)(a1)
	; LMULMAX2-RV64-NEXT: vsll.vi v8, v8, 4			; LMULMAX2-RV64-NEXT: vsll.vi v8, v8, 4
	; LMULMAX2-RV64-NEXT: vor.vv v8, v9, v8			; LMULMAX2-RV64-NEXT: vor.vv v8, v9, v8
	; LMULMAX2-RV64-NEXT: vsrl.vi v9, v8, 2			; LMULMAX2-RV64-NEXT: vsrl.vi v9, v8, 2
	; LMULMAX2-RV64-NEXT: lui a1, 13107
	; LMULMAX2-RV64-NEXT: addiw a1, a1, 819
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 819
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 819
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 819
	; LMULMAX2-RV64-NEXT: vand.vx v9, v9, a1			; LMULMAX2-RV64-NEXT: vand.vx v9, v9, a1
	; LMULMAX2-RV64-NEXT: vand.vx v8, v8, a1			; LMULMAX2-RV64-NEXT: vand.vx v8, v8, a1
				; LMULMAX2-RV64-NEXT: lui a1, %hi(.LCPI2_2)
				; LMULMAX2-RV64-NEXT: ld a1, %lo(.LCPI2_2)(a1)
	; LMULMAX2-RV64-NEXT: vsll.vi v8, v8, 2			; LMULMAX2-RV64-NEXT: vsll.vi v8, v8, 2
	; LMULMAX2-RV64-NEXT: vor.vv v8, v9, v8			; LMULMAX2-RV64-NEXT: vor.vv v8, v9, v8
	; LMULMAX2-RV64-NEXT: vsrl.vi v9, v8, 1			; LMULMAX2-RV64-NEXT: vsrl.vi v9, v8, 1
	; LMULMAX2-RV64-NEXT: lui a1, 21845
	; LMULMAX2-RV64-NEXT: addiw a1, a1, 1365
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 1365
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 1365
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 1365
	; LMULMAX2-RV64-NEXT: vand.vx v9, v9, a1			; LMULMAX2-RV64-NEXT: vand.vx v9, v9, a1
	; LMULMAX2-RV64-NEXT: vand.vx v8, v8, a1			; LMULMAX2-RV64-NEXT: vand.vx v8, v8, a1
	; LMULMAX2-RV64-NEXT: vadd.vv v8, v8, v8			; LMULMAX2-RV64-NEXT: vadd.vv v8, v8, v8
	; LMULMAX2-RV64-NEXT: vor.vv v8, v9, v8			; LMULMAX2-RV64-NEXT: vor.vv v8, v9, v8
	; LMULMAX2-RV64-NEXT: vse64.v v8, (a0)			; LMULMAX2-RV64-NEXT: vse64.v v8, (a0)
	; LMULMAX2-RV64-NEXT: ret			; LMULMAX2-RV64-NEXT: ret
	;			;
	; LMULMAX1-RV32-LABEL: bitreverse_v2i64:			; LMULMAX1-RV32-LABEL: bitreverse_v2i64:
	▲ Show 20 Lines • Show All 108 Lines • ▼ Show 20 Lines
	; LMULMAX1-RV64-NEXT: slli a4, a3, 40			; LMULMAX1-RV64-NEXT: slli a4, a3, 40
	; LMULMAX1-RV64-NEXT: vand.vx v11, v11, a4			; LMULMAX1-RV64-NEXT: vand.vx v11, v11, a4
	; LMULMAX1-RV64-NEXT: vor.vv v10, v11, v10			; LMULMAX1-RV64-NEXT: vor.vv v10, v11, v10
	; LMULMAX1-RV64-NEXT: vsll.vx v11, v8, a1			; LMULMAX1-RV64-NEXT: vsll.vx v11, v8, a1
	; LMULMAX1-RV64-NEXT: vsll.vx v8, v8, a2			; LMULMAX1-RV64-NEXT: vsll.vx v8, v8, a2
	; LMULMAX1-RV64-NEXT: slli a1, a3, 48			; LMULMAX1-RV64-NEXT: slli a1, a3, 48
	; LMULMAX1-RV64-NEXT: vand.vx v8, v8, a1			; LMULMAX1-RV64-NEXT: vand.vx v8, v8, a1
	; LMULMAX1-RV64-NEXT: vor.vv v8, v11, v8			; LMULMAX1-RV64-NEXT: vor.vv v8, v11, v8
				; LMULMAX1-RV64-NEXT: lui a1, %hi(.LCPI2_0)
				; LMULMAX1-RV64-NEXT: ld a1, %lo(.LCPI2_0)(a1)
	; LMULMAX1-RV64-NEXT: vor.vv v8, v8, v10			; LMULMAX1-RV64-NEXT: vor.vv v8, v8, v10
	; LMULMAX1-RV64-NEXT: vor.vv v8, v8, v9			; LMULMAX1-RV64-NEXT: vor.vv v8, v8, v9
	; LMULMAX1-RV64-NEXT: vsrl.vi v9, v8, 4			; LMULMAX1-RV64-NEXT: vsrl.vi v9, v8, 4
	; LMULMAX1-RV64-NEXT: lui a1, 3855
	; LMULMAX1-RV64-NEXT: addiw a1, a1, 241
	; LMULMAX1-RV64-NEXT: slli a1, a1, 12
	; LMULMAX1-RV64-NEXT: addi a1, a1, -241
	; LMULMAX1-RV64-NEXT: slli a1, a1, 12
	; LMULMAX1-RV64-NEXT: addi a1, a1, 241
	; LMULMAX1-RV64-NEXT: slli a1, a1, 12
	; LMULMAX1-RV64-NEXT: addi a1, a1, -241
	; LMULMAX1-RV64-NEXT: vand.vx v9, v9, a1			; LMULMAX1-RV64-NEXT: vand.vx v9, v9, a1
	; LMULMAX1-RV64-NEXT: vand.vx v8, v8, a1			; LMULMAX1-RV64-NEXT: vand.vx v8, v8, a1
				; LMULMAX1-RV64-NEXT: lui a1, %hi(.LCPI2_1)
				; LMULMAX1-RV64-NEXT: ld a1, %lo(.LCPI2_1)(a1)
	; LMULMAX1-RV64-NEXT: vsll.vi v8, v8, 4			; LMULMAX1-RV64-NEXT: vsll.vi v8, v8, 4
	; LMULMAX1-RV64-NEXT: vor.vv v8, v9, v8			; LMULMAX1-RV64-NEXT: vor.vv v8, v9, v8
	; LMULMAX1-RV64-NEXT: vsrl.vi v9, v8, 2			; LMULMAX1-RV64-NEXT: vsrl.vi v9, v8, 2
	; LMULMAX1-RV64-NEXT: lui a1, 13107
	; LMULMAX1-RV64-NEXT: addiw a1, a1, 819
	; LMULMAX1-RV64-NEXT: slli a1, a1, 12
	; LMULMAX1-RV64-NEXT: addi a1, a1, 819
	; LMULMAX1-RV64-NEXT: slli a1, a1, 12
	; LMULMAX1-RV64-NEXT: addi a1, a1, 819
	; LMULMAX1-RV64-NEXT: slli a1, a1, 12
	; LMULMAX1-RV64-NEXT: addi a1, a1, 819
	; LMULMAX1-RV64-NEXT: vand.vx v9, v9, a1			; LMULMAX1-RV64-NEXT: vand.vx v9, v9, a1
	; LMULMAX1-RV64-NEXT: vand.vx v8, v8, a1			; LMULMAX1-RV64-NEXT: vand.vx v8, v8, a1
				; LMULMAX1-RV64-NEXT: lui a1, %hi(.LCPI2_2)
				; LMULMAX1-RV64-NEXT: ld a1, %lo(.LCPI2_2)(a1)
	; LMULMAX1-RV64-NEXT: vsll.vi v8, v8, 2			; LMULMAX1-RV64-NEXT: vsll.vi v8, v8, 2
	; LMULMAX1-RV64-NEXT: vor.vv v8, v9, v8			; LMULMAX1-RV64-NEXT: vor.vv v8, v9, v8
	; LMULMAX1-RV64-NEXT: vsrl.vi v9, v8, 1			; LMULMAX1-RV64-NEXT: vsrl.vi v9, v8, 1
	; LMULMAX1-RV64-NEXT: lui a1, 21845
	; LMULMAX1-RV64-NEXT: addiw a1, a1, 1365
	; LMULMAX1-RV64-NEXT: slli a1, a1, 12
	; LMULMAX1-RV64-NEXT: addi a1, a1, 1365
	; LMULMAX1-RV64-NEXT: slli a1, a1, 12
	; LMULMAX1-RV64-NEXT: addi a1, a1, 1365
	; LMULMAX1-RV64-NEXT: slli a1, a1, 12
	; LMULMAX1-RV64-NEXT: addi a1, a1, 1365
	; LMULMAX1-RV64-NEXT: vand.vx v9, v9, a1			; LMULMAX1-RV64-NEXT: vand.vx v9, v9, a1
	; LMULMAX1-RV64-NEXT: vand.vx v8, v8, a1			; LMULMAX1-RV64-NEXT: vand.vx v8, v8, a1
	; LMULMAX1-RV64-NEXT: vadd.vv v8, v8, v8			; LMULMAX1-RV64-NEXT: vadd.vv v8, v8, v8
	; LMULMAX1-RV64-NEXT: vor.vv v8, v9, v8			; LMULMAX1-RV64-NEXT: vor.vv v8, v9, v8
	; LMULMAX1-RV64-NEXT: vse64.v v8, (a0)			; LMULMAX1-RV64-NEXT: vse64.v v8, (a0)
	; LMULMAX1-RV64-NEXT: ret			; LMULMAX1-RV64-NEXT: ret
	%a = load <2 x i64>, <2 x i64>* %x			%a = load <2 x i64>, <2 x i64>* %x
	%b = load <2 x i64>, <2 x i64>* %y			%b = load <2 x i64>, <2 x i64>* %y
	▲ Show 20 Lines • Show All 512 Lines • ▼ Show 20 Lines
	; LMULMAX2-RV64-NEXT: slli a4, a3, 40			; LMULMAX2-RV64-NEXT: slli a4, a3, 40
	; LMULMAX2-RV64-NEXT: vand.vx v14, v14, a4			; LMULMAX2-RV64-NEXT: vand.vx v14, v14, a4
	; LMULMAX2-RV64-NEXT: vor.vv v12, v14, v12			; LMULMAX2-RV64-NEXT: vor.vv v12, v14, v12
	; LMULMAX2-RV64-NEXT: vsll.vx v14, v8, a1			; LMULMAX2-RV64-NEXT: vsll.vx v14, v8, a1
	; LMULMAX2-RV64-NEXT: vsll.vx v8, v8, a2			; LMULMAX2-RV64-NEXT: vsll.vx v8, v8, a2
	; LMULMAX2-RV64-NEXT: slli a1, a3, 48			; LMULMAX2-RV64-NEXT: slli a1, a3, 48
	; LMULMAX2-RV64-NEXT: vand.vx v8, v8, a1			; LMULMAX2-RV64-NEXT: vand.vx v8, v8, a1
	; LMULMAX2-RV64-NEXT: vor.vv v8, v14, v8			; LMULMAX2-RV64-NEXT: vor.vv v8, v14, v8
				; LMULMAX2-RV64-NEXT: lui a1, %hi(.LCPI5_0)
				; LMULMAX2-RV64-NEXT: ld a1, %lo(.LCPI5_0)(a1)
	; LMULMAX2-RV64-NEXT: vor.vv v8, v8, v12			; LMULMAX2-RV64-NEXT: vor.vv v8, v8, v12
	; LMULMAX2-RV64-NEXT: vor.vv v8, v8, v10			; LMULMAX2-RV64-NEXT: vor.vv v8, v8, v10
	; LMULMAX2-RV64-NEXT: vsrl.vi v10, v8, 4			; LMULMAX2-RV64-NEXT: vsrl.vi v10, v8, 4
	; LMULMAX2-RV64-NEXT: lui a1, 3855
	; LMULMAX2-RV64-NEXT: addiw a1, a1, 241
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, -241
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 241
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, -241
	; LMULMAX2-RV64-NEXT: vand.vx v10, v10, a1			; LMULMAX2-RV64-NEXT: vand.vx v10, v10, a1
	; LMULMAX2-RV64-NEXT: vand.vx v8, v8, a1			; LMULMAX2-RV64-NEXT: vand.vx v8, v8, a1
				; LMULMAX2-RV64-NEXT: lui a1, %hi(.LCPI5_1)
				; LMULMAX2-RV64-NEXT: ld a1, %lo(.LCPI5_1)(a1)
	; LMULMAX2-RV64-NEXT: vsll.vi v8, v8, 4			; LMULMAX2-RV64-NEXT: vsll.vi v8, v8, 4
	; LMULMAX2-RV64-NEXT: vor.vv v8, v10, v8			; LMULMAX2-RV64-NEXT: vor.vv v8, v10, v8
	; LMULMAX2-RV64-NEXT: vsrl.vi v10, v8, 2			; LMULMAX2-RV64-NEXT: vsrl.vi v10, v8, 2
	; LMULMAX2-RV64-NEXT: lui a1, 13107
	; LMULMAX2-RV64-NEXT: addiw a1, a1, 819
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 819
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 819
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 819
	; LMULMAX2-RV64-NEXT: vand.vx v10, v10, a1			; LMULMAX2-RV64-NEXT: vand.vx v10, v10, a1
	; LMULMAX2-RV64-NEXT: vand.vx v8, v8, a1			; LMULMAX2-RV64-NEXT: vand.vx v8, v8, a1
				; LMULMAX2-RV64-NEXT: lui a1, %hi(.LCPI5_2)
				; LMULMAX2-RV64-NEXT: ld a1, %lo(.LCPI5_2)(a1)
	; LMULMAX2-RV64-NEXT: vsll.vi v8, v8, 2			; LMULMAX2-RV64-NEXT: vsll.vi v8, v8, 2
	; LMULMAX2-RV64-NEXT: vor.vv v8, v10, v8			; LMULMAX2-RV64-NEXT: vor.vv v8, v10, v8
	; LMULMAX2-RV64-NEXT: vsrl.vi v10, v8, 1			; LMULMAX2-RV64-NEXT: vsrl.vi v10, v8, 1
	; LMULMAX2-RV64-NEXT: lui a1, 21845
	; LMULMAX2-RV64-NEXT: addiw a1, a1, 1365
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 1365
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 1365
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 1365
	; LMULMAX2-RV64-NEXT: vand.vx v10, v10, a1			; LMULMAX2-RV64-NEXT: vand.vx v10, v10, a1
	; LMULMAX2-RV64-NEXT: vand.vx v8, v8, a1			; LMULMAX2-RV64-NEXT: vand.vx v8, v8, a1
	; LMULMAX2-RV64-NEXT: vadd.vv v8, v8, v8			; LMULMAX2-RV64-NEXT: vadd.vv v8, v8, v8
	; LMULMAX2-RV64-NEXT: vor.vv v8, v10, v8			; LMULMAX2-RV64-NEXT: vor.vv v8, v10, v8
	; LMULMAX2-RV64-NEXT: vse64.v v8, (a0)			; LMULMAX2-RV64-NEXT: vse64.v v8, (a0)
	; LMULMAX2-RV64-NEXT: ret			; LMULMAX2-RV64-NEXT: ret
	;			;
	; LMULMAX1-RV32-LABEL: bitreverse_v4i64:			; LMULMAX1-RV32-LABEL: bitreverse_v4i64:
	▲ Show 20 Lines • Show All 124 Lines • ▼ Show 20 Lines
	; LMULMAX1-RV64-NEXT: vsetivli zero, 2, e64, m1, ta, mu			; LMULMAX1-RV64-NEXT: vsetivli zero, 2, e64, m1, ta, mu
	; LMULMAX1-RV64-NEXT: addi a7, a0, 16			; LMULMAX1-RV64-NEXT: addi a7, a0, 16
	; LMULMAX1-RV64-NEXT: vle64.v v9, (a7)			; LMULMAX1-RV64-NEXT: vle64.v v9, (a7)
	; LMULMAX1-RV64-NEXT: vle64.v v8, (a0)			; LMULMAX1-RV64-NEXT: vle64.v v8, (a0)
	; LMULMAX1-RV64-NEXT: li t0, 56			; LMULMAX1-RV64-NEXT: li t0, 56
	; LMULMAX1-RV64-NEXT: vsrl.vx v10, v9, t0			; LMULMAX1-RV64-NEXT: vsrl.vx v10, v9, t0
	; LMULMAX1-RV64-NEXT: li t1, 40			; LMULMAX1-RV64-NEXT: li t1, 40
	; LMULMAX1-RV64-NEXT: vsrl.vx v11, v9, t1			; LMULMAX1-RV64-NEXT: vsrl.vx v11, v9, t1
	; LMULMAX1-RV64-NEXT: lui a1, 16			; LMULMAX1-RV64-NEXT: lui a4, 16
	; LMULMAX1-RV64-NEXT: addiw t2, a1, -256			; LMULMAX1-RV64-NEXT: addiw t2, a4, -256
	; LMULMAX1-RV64-NEXT: vand.vx v11, v11, t2			; LMULMAX1-RV64-NEXT: vand.vx v11, v11, t2
	; LMULMAX1-RV64-NEXT: vor.vv v10, v11, v10			; LMULMAX1-RV64-NEXT: vor.vv v10, v11, v10
	; LMULMAX1-RV64-NEXT: vsrl.vi v11, v9, 24			; LMULMAX1-RV64-NEXT: vsrl.vi v11, v9, 24
	; LMULMAX1-RV64-NEXT: lui a6, 4080			; LMULMAX1-RV64-NEXT: lui a6, 4080
	; LMULMAX1-RV64-NEXT: vand.vx v11, v11, a6			; LMULMAX1-RV64-NEXT: vand.vx v11, v11, a6
	; LMULMAX1-RV64-NEXT: vsrl.vi v12, v9, 8			; LMULMAX1-RV64-NEXT: vsrl.vi v12, v9, 8
	; LMULMAX1-RV64-NEXT: li a3, 255			; LMULMAX1-RV64-NEXT: li a5, 255
	; LMULMAX1-RV64-NEXT: slli t3, a3, 24			; LMULMAX1-RV64-NEXT: slli t3, a5, 24
	; LMULMAX1-RV64-NEXT: vand.vx v12, v12, t3			; LMULMAX1-RV64-NEXT: vand.vx v12, v12, t3
	; LMULMAX1-RV64-NEXT: vor.vv v11, v12, v11			; LMULMAX1-RV64-NEXT: vor.vv v11, v12, v11
	; LMULMAX1-RV64-NEXT: vor.vv v10, v11, v10			; LMULMAX1-RV64-NEXT: vor.vv v10, v11, v10
	; LMULMAX1-RV64-NEXT: vsll.vi v11, v9, 8			; LMULMAX1-RV64-NEXT: vsll.vi v11, v9, 8
	; LMULMAX1-RV64-NEXT: slli t4, a3, 32			; LMULMAX1-RV64-NEXT: slli t4, a5, 32
	; LMULMAX1-RV64-NEXT: vand.vx v11, v11, t4			; LMULMAX1-RV64-NEXT: vand.vx v11, v11, t4
	; LMULMAX1-RV64-NEXT: vsll.vi v12, v9, 24			; LMULMAX1-RV64-NEXT: vsll.vi v12, v9, 24
	; LMULMAX1-RV64-NEXT: slli a2, a3, 40			; LMULMAX1-RV64-NEXT: slli a3, a5, 40
	; LMULMAX1-RV64-NEXT: vand.vx v12, v12, a2			; LMULMAX1-RV64-NEXT: vand.vx v12, v12, a3
	; LMULMAX1-RV64-NEXT: vor.vv v11, v12, v11			; LMULMAX1-RV64-NEXT: vor.vv v11, v12, v11
	; LMULMAX1-RV64-NEXT: vsll.vx v12, v9, t0			; LMULMAX1-RV64-NEXT: vsll.vx v12, v9, t0
	; LMULMAX1-RV64-NEXT: vsll.vx v9, v9, t1			; LMULMAX1-RV64-NEXT: vsll.vx v9, v9, t1
	; LMULMAX1-RV64-NEXT: slli a3, a3, 48			; LMULMAX1-RV64-NEXT: slli a5, a5, 48
	; LMULMAX1-RV64-NEXT: vand.vx v9, v9, a3			; LMULMAX1-RV64-NEXT: vand.vx v9, v9, a5
	; LMULMAX1-RV64-NEXT: vor.vv v9, v12, v9			; LMULMAX1-RV64-NEXT: vor.vv v9, v12, v9
				; LMULMAX1-RV64-NEXT: lui a4, %hi(.LCPI5_0)
				; LMULMAX1-RV64-NEXT: ld a4, %lo(.LCPI5_0)(a4)
	; LMULMAX1-RV64-NEXT: vor.vv v9, v9, v11			; LMULMAX1-RV64-NEXT: vor.vv v9, v9, v11
	; LMULMAX1-RV64-NEXT: vor.vv v9, v9, v10			; LMULMAX1-RV64-NEXT: vor.vv v9, v9, v10
	; LMULMAX1-RV64-NEXT: vsrl.vi v10, v9, 4			; LMULMAX1-RV64-NEXT: vsrl.vi v10, v9, 4
	; LMULMAX1-RV64-NEXT: lui a4, 3855
	; LMULMAX1-RV64-NEXT: addiw a4, a4, 241
	; LMULMAX1-RV64-NEXT: slli a4, a4, 12
	; LMULMAX1-RV64-NEXT: addi a4, a4, -241
	; LMULMAX1-RV64-NEXT: slli a4, a4, 12
	; LMULMAX1-RV64-NEXT: addi a4, a4, 241
	; LMULMAX1-RV64-NEXT: slli a4, a4, 12
	; LMULMAX1-RV64-NEXT: addi a4, a4, -241
	; LMULMAX1-RV64-NEXT: vand.vx v10, v10, a4			; LMULMAX1-RV64-NEXT: vand.vx v10, v10, a4
	; LMULMAX1-RV64-NEXT: vand.vx v9, v9, a4			; LMULMAX1-RV64-NEXT: vand.vx v9, v9, a4
				; LMULMAX1-RV64-NEXT: lui a1, %hi(.LCPI5_1)
				; LMULMAX1-RV64-NEXT: ld a1, %lo(.LCPI5_1)(a1)
	; LMULMAX1-RV64-NEXT: vsll.vi v9, v9, 4			; LMULMAX1-RV64-NEXT: vsll.vi v9, v9, 4
	; LMULMAX1-RV64-NEXT: vor.vv v9, v10, v9			; LMULMAX1-RV64-NEXT: vor.vv v9, v10, v9
	; LMULMAX1-RV64-NEXT: vsrl.vi v10, v9, 2			; LMULMAX1-RV64-NEXT: vsrl.vi v10, v9, 2
	; LMULMAX1-RV64-NEXT: lui a5, 13107			; LMULMAX1-RV64-NEXT: vand.vx v10, v10, a1
	; LMULMAX1-RV64-NEXT: addiw a5, a5, 819			; LMULMAX1-RV64-NEXT: vand.vx v9, v9, a1
	; LMULMAX1-RV64-NEXT: slli a5, a5, 12			; LMULMAX1-RV64-NEXT: lui a2, %hi(.LCPI5_2)
	; LMULMAX1-RV64-NEXT: addi a5, a5, 819			; LMULMAX1-RV64-NEXT: ld a2, %lo(.LCPI5_2)(a2)
	; LMULMAX1-RV64-NEXT: slli a5, a5, 12
	; LMULMAX1-RV64-NEXT: addi a5, a5, 819
	; LMULMAX1-RV64-NEXT: slli a5, a5, 12
	; LMULMAX1-RV64-NEXT: addi a5, a5, 819
	; LMULMAX1-RV64-NEXT: vand.vx v10, v10, a5
	; LMULMAX1-RV64-NEXT: vand.vx v9, v9, a5
	; LMULMAX1-RV64-NEXT: vsll.vi v9, v9, 2			; LMULMAX1-RV64-NEXT: vsll.vi v9, v9, 2
	; LMULMAX1-RV64-NEXT: vor.vv v9, v10, v9			; LMULMAX1-RV64-NEXT: vor.vv v9, v10, v9
	; LMULMAX1-RV64-NEXT: vsrl.vi v10, v9, 1			; LMULMAX1-RV64-NEXT: vsrl.vi v10, v9, 1
	; LMULMAX1-RV64-NEXT: lui a1, 21845			; LMULMAX1-RV64-NEXT: vand.vx v10, v10, a2
	; LMULMAX1-RV64-NEXT: addiw a1, a1, 1365			; LMULMAX1-RV64-NEXT: vand.vx v9, v9, a2
	; LMULMAX1-RV64-NEXT: slli a1, a1, 12
	; LMULMAX1-RV64-NEXT: addi a1, a1, 1365
	; LMULMAX1-RV64-NEXT: slli a1, a1, 12
	; LMULMAX1-RV64-NEXT: addi a1, a1, 1365
	; LMULMAX1-RV64-NEXT: slli a1, a1, 12
	; LMULMAX1-RV64-NEXT: addi a1, a1, 1365
	; LMULMAX1-RV64-NEXT: vand.vx v10, v10, a1
	; LMULMAX1-RV64-NEXT: vand.vx v9, v9, a1
	; LMULMAX1-RV64-NEXT: vadd.vv v9, v9, v9			; LMULMAX1-RV64-NEXT: vadd.vv v9, v9, v9
	; LMULMAX1-RV64-NEXT: vor.vv v9, v10, v9			; LMULMAX1-RV64-NEXT: vor.vv v9, v10, v9
	; LMULMAX1-RV64-NEXT: vsrl.vx v10, v8, t0			; LMULMAX1-RV64-NEXT: vsrl.vx v10, v8, t0
	; LMULMAX1-RV64-NEXT: vsrl.vx v11, v8, t1			; LMULMAX1-RV64-NEXT: vsrl.vx v11, v8, t1
	; LMULMAX1-RV64-NEXT: vand.vx v11, v11, t2			; LMULMAX1-RV64-NEXT: vand.vx v11, v11, t2
	; LMULMAX1-RV64-NEXT: vor.vv v10, v11, v10			; LMULMAX1-RV64-NEXT: vor.vv v10, v11, v10
	; LMULMAX1-RV64-NEXT: vsrl.vi v11, v8, 24			; LMULMAX1-RV64-NEXT: vsrl.vi v11, v8, 24
	; LMULMAX1-RV64-NEXT: vand.vx v11, v11, a6			; LMULMAX1-RV64-NEXT: vand.vx v11, v11, a6
	; LMULMAX1-RV64-NEXT: vsrl.vi v12, v8, 8			; LMULMAX1-RV64-NEXT: vsrl.vi v12, v8, 8
	; LMULMAX1-RV64-NEXT: vand.vx v12, v12, t3			; LMULMAX1-RV64-NEXT: vand.vx v12, v12, t3
	; LMULMAX1-RV64-NEXT: vor.vv v11, v12, v11			; LMULMAX1-RV64-NEXT: vor.vv v11, v12, v11
	; LMULMAX1-RV64-NEXT: vor.vv v10, v11, v10			; LMULMAX1-RV64-NEXT: vor.vv v10, v11, v10
	; LMULMAX1-RV64-NEXT: vsll.vi v11, v8, 8			; LMULMAX1-RV64-NEXT: vsll.vi v11, v8, 8
	; LMULMAX1-RV64-NEXT: vand.vx v11, v11, t4			; LMULMAX1-RV64-NEXT: vand.vx v11, v11, t4
	; LMULMAX1-RV64-NEXT: vsll.vi v12, v8, 24			; LMULMAX1-RV64-NEXT: vsll.vi v12, v8, 24
	; LMULMAX1-RV64-NEXT: vand.vx v12, v12, a2			; LMULMAX1-RV64-NEXT: vand.vx v12, v12, a3
	; LMULMAX1-RV64-NEXT: vor.vv v11, v12, v11			; LMULMAX1-RV64-NEXT: vor.vv v11, v12, v11
	; LMULMAX1-RV64-NEXT: vsll.vx v12, v8, t0			; LMULMAX1-RV64-NEXT: vsll.vx v12, v8, t0
	; LMULMAX1-RV64-NEXT: vsll.vx v8, v8, t1			; LMULMAX1-RV64-NEXT: vsll.vx v8, v8, t1
	; LMULMAX1-RV64-NEXT: vand.vx v8, v8, a3			; LMULMAX1-RV64-NEXT: vand.vx v8, v8, a5
	; LMULMAX1-RV64-NEXT: vor.vv v8, v12, v8			; LMULMAX1-RV64-NEXT: vor.vv v8, v12, v8
	; LMULMAX1-RV64-NEXT: vor.vv v8, v8, v11			; LMULMAX1-RV64-NEXT: vor.vv v8, v8, v11
	; LMULMAX1-RV64-NEXT: vor.vv v8, v8, v10			; LMULMAX1-RV64-NEXT: vor.vv v8, v8, v10
	; LMULMAX1-RV64-NEXT: vsrl.vi v10, v8, 4			; LMULMAX1-RV64-NEXT: vsrl.vi v10, v8, 4
	; LMULMAX1-RV64-NEXT: vand.vx v10, v10, a4			; LMULMAX1-RV64-NEXT: vand.vx v10, v10, a4
	; LMULMAX1-RV64-NEXT: vand.vx v8, v8, a4			; LMULMAX1-RV64-NEXT: vand.vx v8, v8, a4
	; LMULMAX1-RV64-NEXT: vsll.vi v8, v8, 4			; LMULMAX1-RV64-NEXT: vsll.vi v8, v8, 4
	; LMULMAX1-RV64-NEXT: vor.vv v8, v10, v8			; LMULMAX1-RV64-NEXT: vor.vv v8, v10, v8
	; LMULMAX1-RV64-NEXT: vsrl.vi v10, v8, 2			; LMULMAX1-RV64-NEXT: vsrl.vi v10, v8, 2
	; LMULMAX1-RV64-NEXT: vand.vx v10, v10, a5			; LMULMAX1-RV64-NEXT: vand.vx v10, v10, a1
	; LMULMAX1-RV64-NEXT: vand.vx v8, v8, a5			; LMULMAX1-RV64-NEXT: vand.vx v8, v8, a1
	; LMULMAX1-RV64-NEXT: vsll.vi v8, v8, 2			; LMULMAX1-RV64-NEXT: vsll.vi v8, v8, 2
	; LMULMAX1-RV64-NEXT: vor.vv v8, v10, v8			; LMULMAX1-RV64-NEXT: vor.vv v8, v10, v8
	; LMULMAX1-RV64-NEXT: vsrl.vi v10, v8, 1			; LMULMAX1-RV64-NEXT: vsrl.vi v10, v8, 1
	; LMULMAX1-RV64-NEXT: vand.vx v10, v10, a1			; LMULMAX1-RV64-NEXT: vand.vx v10, v10, a2
	; LMULMAX1-RV64-NEXT: vand.vx v8, v8, a1			; LMULMAX1-RV64-NEXT: vand.vx v8, v8, a2
	; LMULMAX1-RV64-NEXT: vadd.vv v8, v8, v8			; LMULMAX1-RV64-NEXT: vadd.vv v8, v8, v8
	; LMULMAX1-RV64-NEXT: vor.vv v8, v10, v8			; LMULMAX1-RV64-NEXT: vor.vv v8, v10, v8
	; LMULMAX1-RV64-NEXT: vse64.v v8, (a0)			; LMULMAX1-RV64-NEXT: vse64.v v8, (a0)
	; LMULMAX1-RV64-NEXT: vse64.v v9, (a7)			; LMULMAX1-RV64-NEXT: vse64.v v9, (a7)
	; LMULMAX1-RV64-NEXT: ret			; LMULMAX1-RV64-NEXT: ret
	%a = load <4 x i64>, <4 x i64>* %x			%a = load <4 x i64>, <4 x i64>* %x
	%b = load <4 x i64>, <4 x i64>* %y			%b = load <4 x i64>, <4 x i64>* %y
	%c = call <4 x i64> @llvm.bitreverse.v4i64(<4 x i64> %a)			%c = call <4 x i64> @llvm.bitreverse.v4i64(<4 x i64> %a)
	store <4 x i64> %c, <4 x i64>* %x			store <4 x i64> %c, <4 x i64>* %x
	ret void			ret void
	}			}
	declare <4 x i64> @llvm.bitreverse.v4i64(<4 x i64>)			declare <4 x i64> @llvm.bitreverse.v4i64(<4 x i64>)

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-ctlz.ll

	Show First 20 Lines • Show All 652 Lines • ▼ Show 20 Lines
	; LMULMAX2-RV64-NEXT: vsrl.vi v9, v8, 8			; LMULMAX2-RV64-NEXT: vsrl.vi v9, v8, 8
	; LMULMAX2-RV64-NEXT: vor.vv v8, v8, v9			; LMULMAX2-RV64-NEXT: vor.vv v8, v8, v9
	; LMULMAX2-RV64-NEXT: vsrl.vi v9, v8, 16			; LMULMAX2-RV64-NEXT: vsrl.vi v9, v8, 16
	; LMULMAX2-RV64-NEXT: vor.vv v8, v8, v9			; LMULMAX2-RV64-NEXT: vor.vv v8, v8, v9
	; LMULMAX2-RV64-NEXT: li a1, 32			; LMULMAX2-RV64-NEXT: li a1, 32
	; LMULMAX2-RV64-NEXT: vsrl.vx v9, v8, a1			; LMULMAX2-RV64-NEXT: vsrl.vx v9, v8, a1
	; LMULMAX2-RV64-NEXT: vor.vv v8, v8, v9			; LMULMAX2-RV64-NEXT: vor.vv v8, v8, v9
	; LMULMAX2-RV64-NEXT: vxor.vi v8, v8, -1			; LMULMAX2-RV64-NEXT: vxor.vi v8, v8, -1
				; LMULMAX2-RV64-NEXT: lui a1, %hi(.LCPI3_0)
				; LMULMAX2-RV64-NEXT: ld a1, %lo(.LCPI3_0)(a1)
				; LMULMAX2-RV64-NEXT: lui a2, %hi(.LCPI3_1)
				; LMULMAX2-RV64-NEXT: ld a2, %lo(.LCPI3_1)(a2)
	; LMULMAX2-RV64-NEXT: vsrl.vi v9, v8, 1			; LMULMAX2-RV64-NEXT: vsrl.vi v9, v8, 1
	; LMULMAX2-RV64-NEXT: lui a1, 21845
	; LMULMAX2-RV64-NEXT: addiw a1, a1, 1365
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 1365
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 1365
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 1365
	; LMULMAX2-RV64-NEXT: vand.vx v9, v9, a1			; LMULMAX2-RV64-NEXT: vand.vx v9, v9, a1
	; LMULMAX2-RV64-NEXT: vsub.vv v8, v8, v9			; LMULMAX2-RV64-NEXT: vsub.vv v8, v8, v9
	; LMULMAX2-RV64-NEXT: lui a1, 13107			; LMULMAX2-RV64-NEXT: vand.vx v9, v8, a2
	; LMULMAX2-RV64-NEXT: addiw a1, a1, 819
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 819
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 819
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 819
	; LMULMAX2-RV64-NEXT: vand.vx v9, v8, a1
	; LMULMAX2-RV64-NEXT: vsrl.vi v8, v8, 2			; LMULMAX2-RV64-NEXT: vsrl.vi v8, v8, 2
	; LMULMAX2-RV64-NEXT: vand.vx v8, v8, a1			; LMULMAX2-RV64-NEXT: vand.vx v8, v8, a2
	; LMULMAX2-RV64-NEXT: vadd.vv v8, v9, v8			; LMULMAX2-RV64-NEXT: vadd.vv v8, v9, v8
				; LMULMAX2-RV64-NEXT: lui a1, %hi(.LCPI3_2)
				; LMULMAX2-RV64-NEXT: ld a1, %lo(.LCPI3_2)(a1)
				; LMULMAX2-RV64-NEXT: lui a2, %hi(.LCPI3_3)
				; LMULMAX2-RV64-NEXT: ld a2, %lo(.LCPI3_3)(a2)
	; LMULMAX2-RV64-NEXT: vsrl.vi v9, v8, 4			; LMULMAX2-RV64-NEXT: vsrl.vi v9, v8, 4
	; LMULMAX2-RV64-NEXT: vadd.vv v8, v8, v9			; LMULMAX2-RV64-NEXT: vadd.vv v8, v8, v9
	; LMULMAX2-RV64-NEXT: lui a1, 3855
	; LMULMAX2-RV64-NEXT: addiw a1, a1, 241
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, -241
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 241
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, -241
	; LMULMAX2-RV64-NEXT: vand.vx v8, v8, a1			; LMULMAX2-RV64-NEXT: vand.vx v8, v8, a1
	; LMULMAX2-RV64-NEXT: lui a1, 4112			; LMULMAX2-RV64-NEXT: vmul.vx v8, v8, a2
	; LMULMAX2-RV64-NEXT: addiw a1, a1, 257
	; LMULMAX2-RV64-NEXT: slli a1, a1, 16
	; LMULMAX2-RV64-NEXT: addi a1, a1, 257
	; LMULMAX2-RV64-NEXT: slli a1, a1, 16
	; LMULMAX2-RV64-NEXT: addi a1, a1, 257
	; LMULMAX2-RV64-NEXT: vmul.vx v8, v8, a1
	; LMULMAX2-RV64-NEXT: li a1, 56			; LMULMAX2-RV64-NEXT: li a1, 56
	; LMULMAX2-RV64-NEXT: vsrl.vx v8, v8, a1			; LMULMAX2-RV64-NEXT: vsrl.vx v8, v8, a1
	; LMULMAX2-RV64-NEXT: vse64.v v8, (a0)			; LMULMAX2-RV64-NEXT: vse64.v v8, (a0)
	; LMULMAX2-RV64-NEXT: ret			; LMULMAX2-RV64-NEXT: ret
	;			;
	; LMULMAX1-RV32-LABEL: ctlz_v2i64:			; LMULMAX1-RV32-LABEL: ctlz_v2i64:
	; LMULMAX1-RV32: # %bb.0:			; LMULMAX1-RV32: # %bb.0:
	; LMULMAX1-RV32-NEXT: vsetivli zero, 2, e64, m1, ta, mu			; LMULMAX1-RV32-NEXT: vsetivli zero, 2, e64, m1, ta, mu
	▲ Show 20 Lines • Show All 64 Lines • ▼ Show 20 Lines
	; LMULMAX1-RV64-NEXT: vsrl.vi v9, v8, 8			; LMULMAX1-RV64-NEXT: vsrl.vi v9, v8, 8
	; LMULMAX1-RV64-NEXT: vor.vv v8, v8, v9			; LMULMAX1-RV64-NEXT: vor.vv v8, v8, v9
	; LMULMAX1-RV64-NEXT: vsrl.vi v9, v8, 16			; LMULMAX1-RV64-NEXT: vsrl.vi v9, v8, 16
	; LMULMAX1-RV64-NEXT: vor.vv v8, v8, v9			; LMULMAX1-RV64-NEXT: vor.vv v8, v8, v9
	; LMULMAX1-RV64-NEXT: li a1, 32			; LMULMAX1-RV64-NEXT: li a1, 32
	; LMULMAX1-RV64-NEXT: vsrl.vx v9, v8, a1			; LMULMAX1-RV64-NEXT: vsrl.vx v9, v8, a1
	; LMULMAX1-RV64-NEXT: vor.vv v8, v8, v9			; LMULMAX1-RV64-NEXT: vor.vv v8, v8, v9
	; LMULMAX1-RV64-NEXT: vxor.vi v8, v8, -1			; LMULMAX1-RV64-NEXT: vxor.vi v8, v8, -1
				; LMULMAX1-RV64-NEXT: lui a1, %hi(.LCPI3_0)
				; LMULMAX1-RV64-NEXT: ld a1, %lo(.LCPI3_0)(a1)
				; LMULMAX1-RV64-NEXT: lui a2, %hi(.LCPI3_1)
				; LMULMAX1-RV64-NEXT: ld a2, %lo(.LCPI3_1)(a2)
	; LMULMAX1-RV64-NEXT: vsrl.vi v9, v8, 1			; LMULMAX1-RV64-NEXT: vsrl.vi v9, v8, 1
	; LMULMAX1-RV64-NEXT: lui a1, 21845
	; LMULMAX1-RV64-NEXT: addiw a1, a1, 1365
	; LMULMAX1-RV64-NEXT: slli a1, a1, 12
	; LMULMAX1-RV64-NEXT: addi a1, a1, 1365
	; LMULMAX1-RV64-NEXT: slli a1, a1, 12
	; LMULMAX1-RV64-NEXT: addi a1, a1, 1365
	; LMULMAX1-RV64-NEXT: slli a1, a1, 12
	; LMULMAX1-RV64-NEXT: addi a1, a1, 1365
	; LMULMAX1-RV64-NEXT: vand.vx v9, v9, a1			; LMULMAX1-RV64-NEXT: vand.vx v9, v9, a1
	; LMULMAX1-RV64-NEXT: vsub.vv v8, v8, v9			; LMULMAX1-RV64-NEXT: vsub.vv v8, v8, v9
	; LMULMAX1-RV64-NEXT: lui a1, 13107			; LMULMAX1-RV64-NEXT: vand.vx v9, v8, a2
	; LMULMAX1-RV64-NEXT: addiw a1, a1, 819
	; LMULMAX1-RV64-NEXT: slli a1, a1, 12
	; LMULMAX1-RV64-NEXT: addi a1, a1, 819
	; LMULMAX1-RV64-NEXT: slli a1, a1, 12
	; LMULMAX1-RV64-NEXT: addi a1, a1, 819
	; LMULMAX1-RV64-NEXT: slli a1, a1, 12
	; LMULMAX1-RV64-NEXT: addi a1, a1, 819
	; LMULMAX1-RV64-NEXT: vand.vx v9, v8, a1
	; LMULMAX1-RV64-NEXT: vsrl.vi v8, v8, 2			; LMULMAX1-RV64-NEXT: vsrl.vi v8, v8, 2
	; LMULMAX1-RV64-NEXT: vand.vx v8, v8, a1			; LMULMAX1-RV64-NEXT: vand.vx v8, v8, a2
	; LMULMAX1-RV64-NEXT: vadd.vv v8, v9, v8			; LMULMAX1-RV64-NEXT: vadd.vv v8, v9, v8
				; LMULMAX1-RV64-NEXT: lui a1, %hi(.LCPI3_2)
				; LMULMAX1-RV64-NEXT: ld a1, %lo(.LCPI3_2)(a1)
				; LMULMAX1-RV64-NEXT: lui a2, %hi(.LCPI3_3)
				; LMULMAX1-RV64-NEXT: ld a2, %lo(.LCPI3_3)(a2)
	; LMULMAX1-RV64-NEXT: vsrl.vi v9, v8, 4			; LMULMAX1-RV64-NEXT: vsrl.vi v9, v8, 4
	; LMULMAX1-RV64-NEXT: vadd.vv v8, v8, v9			; LMULMAX1-RV64-NEXT: vadd.vv v8, v8, v9
	; LMULMAX1-RV64-NEXT: lui a1, 3855
	; LMULMAX1-RV64-NEXT: addiw a1, a1, 241
	; LMULMAX1-RV64-NEXT: slli a1, a1, 12
	; LMULMAX1-RV64-NEXT: addi a1, a1, -241
	; LMULMAX1-RV64-NEXT: slli a1, a1, 12
	; LMULMAX1-RV64-NEXT: addi a1, a1, 241
	; LMULMAX1-RV64-NEXT: slli a1, a1, 12
	; LMULMAX1-RV64-NEXT: addi a1, a1, -241
	; LMULMAX1-RV64-NEXT: vand.vx v8, v8, a1			; LMULMAX1-RV64-NEXT: vand.vx v8, v8, a1
	; LMULMAX1-RV64-NEXT: lui a1, 4112			; LMULMAX1-RV64-NEXT: vmul.vx v8, v8, a2
	; LMULMAX1-RV64-NEXT: addiw a1, a1, 257
	; LMULMAX1-RV64-NEXT: slli a1, a1, 16
	; LMULMAX1-RV64-NEXT: addi a1, a1, 257
	; LMULMAX1-RV64-NEXT: slli a1, a1, 16
	; LMULMAX1-RV64-NEXT: addi a1, a1, 257
	; LMULMAX1-RV64-NEXT: vmul.vx v8, v8, a1
	; LMULMAX1-RV64-NEXT: li a1, 56			; LMULMAX1-RV64-NEXT: li a1, 56
	; LMULMAX1-RV64-NEXT: vsrl.vx v8, v8, a1			; LMULMAX1-RV64-NEXT: vsrl.vx v8, v8, a1
	; LMULMAX1-RV64-NEXT: vse64.v v8, (a0)			; LMULMAX1-RV64-NEXT: vse64.v v8, (a0)
	; LMULMAX1-RV64-NEXT: ret			; LMULMAX1-RV64-NEXT: ret
	;			;
	; LMULMAX8-RV32-LABEL: ctlz_v2i64:			; LMULMAX8-RV32-LABEL: ctlz_v2i64:
	; LMULMAX8-RV32: # %bb.0:			; LMULMAX8-RV32: # %bb.0:
	; LMULMAX8-RV32-NEXT: vsetivli zero, 2, e64, m1, ta, mu			; LMULMAX8-RV32-NEXT: vsetivli zero, 2, e64, m1, ta, mu
	▲ Show 20 Lines • Show All 64 Lines • ▼ Show 20 Lines
	; LMULMAX8-RV64-NEXT: vsrl.vi v9, v8, 8			; LMULMAX8-RV64-NEXT: vsrl.vi v9, v8, 8
	; LMULMAX8-RV64-NEXT: vor.vv v8, v8, v9			; LMULMAX8-RV64-NEXT: vor.vv v8, v8, v9
	; LMULMAX8-RV64-NEXT: vsrl.vi v9, v8, 16			; LMULMAX8-RV64-NEXT: vsrl.vi v9, v8, 16
	; LMULMAX8-RV64-NEXT: vor.vv v8, v8, v9			; LMULMAX8-RV64-NEXT: vor.vv v8, v8, v9
	; LMULMAX8-RV64-NEXT: li a1, 32			; LMULMAX8-RV64-NEXT: li a1, 32
	; LMULMAX8-RV64-NEXT: vsrl.vx v9, v8, a1			; LMULMAX8-RV64-NEXT: vsrl.vx v9, v8, a1
	; LMULMAX8-RV64-NEXT: vor.vv v8, v8, v9			; LMULMAX8-RV64-NEXT: vor.vv v8, v8, v9
	; LMULMAX8-RV64-NEXT: vxor.vi v8, v8, -1			; LMULMAX8-RV64-NEXT: vxor.vi v8, v8, -1
				; LMULMAX8-RV64-NEXT: lui a1, %hi(.LCPI3_0)
				; LMULMAX8-RV64-NEXT: ld a1, %lo(.LCPI3_0)(a1)
				; LMULMAX8-RV64-NEXT: lui a2, %hi(.LCPI3_1)
				; LMULMAX8-RV64-NEXT: ld a2, %lo(.LCPI3_1)(a2)
	; LMULMAX8-RV64-NEXT: vsrl.vi v9, v8, 1			; LMULMAX8-RV64-NEXT: vsrl.vi v9, v8, 1
	; LMULMAX8-RV64-NEXT: lui a1, 21845
	; LMULMAX8-RV64-NEXT: addiw a1, a1, 1365
	; LMULMAX8-RV64-NEXT: slli a1, a1, 12
	; LMULMAX8-RV64-NEXT: addi a1, a1, 1365
	; LMULMAX8-RV64-NEXT: slli a1, a1, 12
	; LMULMAX8-RV64-NEXT: addi a1, a1, 1365
	; LMULMAX8-RV64-NEXT: slli a1, a1, 12
	; LMULMAX8-RV64-NEXT: addi a1, a1, 1365
	; LMULMAX8-RV64-NEXT: vand.vx v9, v9, a1			; LMULMAX8-RV64-NEXT: vand.vx v9, v9, a1
	; LMULMAX8-RV64-NEXT: vsub.vv v8, v8, v9			; LMULMAX8-RV64-NEXT: vsub.vv v8, v8, v9
	; LMULMAX8-RV64-NEXT: lui a1, 13107			; LMULMAX8-RV64-NEXT: vand.vx v9, v8, a2
	; LMULMAX8-RV64-NEXT: addiw a1, a1, 819
	; LMULMAX8-RV64-NEXT: slli a1, a1, 12
	; LMULMAX8-RV64-NEXT: addi a1, a1, 819
	; LMULMAX8-RV64-NEXT: slli a1, a1, 12
	; LMULMAX8-RV64-NEXT: addi a1, a1, 819
	; LMULMAX8-RV64-NEXT: slli a1, a1, 12
	; LMULMAX8-RV64-NEXT: addi a1, a1, 819
	; LMULMAX8-RV64-NEXT: vand.vx v9, v8, a1
	; LMULMAX8-RV64-NEXT: vsrl.vi v8, v8, 2			; LMULMAX8-RV64-NEXT: vsrl.vi v8, v8, 2
	; LMULMAX8-RV64-NEXT: vand.vx v8, v8, a1			; LMULMAX8-RV64-NEXT: vand.vx v8, v8, a2
	; LMULMAX8-RV64-NEXT: vadd.vv v8, v9, v8			; LMULMAX8-RV64-NEXT: vadd.vv v8, v9, v8
				; LMULMAX8-RV64-NEXT: lui a1, %hi(.LCPI3_2)
				; LMULMAX8-RV64-NEXT: ld a1, %lo(.LCPI3_2)(a1)
				; LMULMAX8-RV64-NEXT: lui a2, %hi(.LCPI3_3)
				; LMULMAX8-RV64-NEXT: ld a2, %lo(.LCPI3_3)(a2)
	; LMULMAX8-RV64-NEXT: vsrl.vi v9, v8, 4			; LMULMAX8-RV64-NEXT: vsrl.vi v9, v8, 4
	; LMULMAX8-RV64-NEXT: vadd.vv v8, v8, v9			; LMULMAX8-RV64-NEXT: vadd.vv v8, v8, v9
	; LMULMAX8-RV64-NEXT: lui a1, 3855
	; LMULMAX8-RV64-NEXT: addiw a1, a1, 241
	; LMULMAX8-RV64-NEXT: slli a1, a1, 12
	; LMULMAX8-RV64-NEXT: addi a1, a1, -241
	; LMULMAX8-RV64-NEXT: slli a1, a1, 12
	; LMULMAX8-RV64-NEXT: addi a1, a1, 241
	; LMULMAX8-RV64-NEXT: slli a1, a1, 12
	; LMULMAX8-RV64-NEXT: addi a1, a1, -241
	; LMULMAX8-RV64-NEXT: vand.vx v8, v8, a1			; LMULMAX8-RV64-NEXT: vand.vx v8, v8, a1
	; LMULMAX8-RV64-NEXT: lui a1, 4112			; LMULMAX8-RV64-NEXT: vmul.vx v8, v8, a2
	; LMULMAX8-RV64-NEXT: addiw a1, a1, 257
	; LMULMAX8-RV64-NEXT: slli a1, a1, 16
	; LMULMAX8-RV64-NEXT: addi a1, a1, 257
	; LMULMAX8-RV64-NEXT: slli a1, a1, 16
	; LMULMAX8-RV64-NEXT: addi a1, a1, 257
	; LMULMAX8-RV64-NEXT: vmul.vx v8, v8, a1
	; LMULMAX8-RV64-NEXT: li a1, 56			; LMULMAX8-RV64-NEXT: li a1, 56
	; LMULMAX8-RV64-NEXT: vsrl.vx v8, v8, a1			; LMULMAX8-RV64-NEXT: vsrl.vx v8, v8, a1
	; LMULMAX8-RV64-NEXT: vse64.v v8, (a0)			; LMULMAX8-RV64-NEXT: vse64.v v8, (a0)
	; LMULMAX8-RV64-NEXT: ret			; LMULMAX8-RV64-NEXT: ret
	%a = load <2 x i64>, <2 x i64>* %x			%a = load <2 x i64>, <2 x i64>* %x
	%b = load <2 x i64>, <2 x i64>* %y			%b = load <2 x i64>, <2 x i64>* %y
	%c = call <2 x i64> @llvm.ctlz.v2i64(<2 x i64> %a, i1 false)			%c = call <2 x i64> @llvm.ctlz.v2i64(<2 x i64> %a, i1 false)
	store <2 x i64> %c, <2 x i64>* %x			store <2 x i64> %c, <2 x i64>* %x
	▲ Show 20 Lines • Show All 730 Lines • ▼ Show 20 Lines
	; LMULMAX2-RV64-NEXT: vsrl.vi v10, v8, 8			; LMULMAX2-RV64-NEXT: vsrl.vi v10, v8, 8
	; LMULMAX2-RV64-NEXT: vor.vv v8, v8, v10			; LMULMAX2-RV64-NEXT: vor.vv v8, v8, v10
	; LMULMAX2-RV64-NEXT: vsrl.vi v10, v8, 16			; LMULMAX2-RV64-NEXT: vsrl.vi v10, v8, 16
	; LMULMAX2-RV64-NEXT: vor.vv v8, v8, v10			; LMULMAX2-RV64-NEXT: vor.vv v8, v8, v10
	; LMULMAX2-RV64-NEXT: li a1, 32			; LMULMAX2-RV64-NEXT: li a1, 32
	; LMULMAX2-RV64-NEXT: vsrl.vx v10, v8, a1			; LMULMAX2-RV64-NEXT: vsrl.vx v10, v8, a1
	; LMULMAX2-RV64-NEXT: vor.vv v8, v8, v10			; LMULMAX2-RV64-NEXT: vor.vv v8, v8, v10
	; LMULMAX2-RV64-NEXT: vxor.vi v8, v8, -1			; LMULMAX2-RV64-NEXT: vxor.vi v8, v8, -1
				; LMULMAX2-RV64-NEXT: lui a1, %hi(.LCPI7_0)
				; LMULMAX2-RV64-NEXT: ld a1, %lo(.LCPI7_0)(a1)
				; LMULMAX2-RV64-NEXT: lui a2, %hi(.LCPI7_1)
				; LMULMAX2-RV64-NEXT: ld a2, %lo(.LCPI7_1)(a2)
	; LMULMAX2-RV64-NEXT: vsrl.vi v10, v8, 1			; LMULMAX2-RV64-NEXT: vsrl.vi v10, v8, 1
	; LMULMAX2-RV64-NEXT: lui a1, 21845
	; LMULMAX2-RV64-NEXT: addiw a1, a1, 1365
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 1365
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 1365
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 1365
	; LMULMAX2-RV64-NEXT: vand.vx v10, v10, a1			; LMULMAX2-RV64-NEXT: vand.vx v10, v10, a1
	; LMULMAX2-RV64-NEXT: vsub.vv v8, v8, v10			; LMULMAX2-RV64-NEXT: vsub.vv v8, v8, v10
	; LMULMAX2-RV64-NEXT: lui a1, 13107			; LMULMAX2-RV64-NEXT: vand.vx v10, v8, a2
	; LMULMAX2-RV64-NEXT: addiw a1, a1, 819
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 819
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 819
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 819
	; LMULMAX2-RV64-NEXT: vand.vx v10, v8, a1
	; LMULMAX2-RV64-NEXT: vsrl.vi v8, v8, 2			; LMULMAX2-RV64-NEXT: vsrl.vi v8, v8, 2
	; LMULMAX2-RV64-NEXT: vand.vx v8, v8, a1			; LMULMAX2-RV64-NEXT: vand.vx v8, v8, a2
	; LMULMAX2-RV64-NEXT: vadd.vv v8, v10, v8			; LMULMAX2-RV64-NEXT: vadd.vv v8, v10, v8
				; LMULMAX2-RV64-NEXT: lui a1, %hi(.LCPI7_2)
				; LMULMAX2-RV64-NEXT: ld a1, %lo(.LCPI7_2)(a1)
				; LMULMAX2-RV64-NEXT: lui a2, %hi(.LCPI7_3)
				; LMULMAX2-RV64-NEXT: ld a2, %lo(.LCPI7_3)(a2)
	; LMULMAX2-RV64-NEXT: vsrl.vi v10, v8, 4			; LMULMAX2-RV64-NEXT: vsrl.vi v10, v8, 4
	; LMULMAX2-RV64-NEXT: vadd.vv v8, v8, v10			; LMULMAX2-RV64-NEXT: vadd.vv v8, v8, v10
	; LMULMAX2-RV64-NEXT: lui a1, 3855
	; LMULMAX2-RV64-NEXT: addiw a1, a1, 241
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, -241
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 241
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, -241
	; LMULMAX2-RV64-NEXT: vand.vx v8, v8, a1			; LMULMAX2-RV64-NEXT: vand.vx v8, v8, a1
	; LMULMAX2-RV64-NEXT: lui a1, 4112			; LMULMAX2-RV64-NEXT: vmul.vx v8, v8, a2
	; LMULMAX2-RV64-NEXT: addiw a1, a1, 257
	; LMULMAX2-RV64-NEXT: slli a1, a1, 16
	; LMULMAX2-RV64-NEXT: addi a1, a1, 257
	; LMULMAX2-RV64-NEXT: slli a1, a1, 16
	; LMULMAX2-RV64-NEXT: addi a1, a1, 257
	; LMULMAX2-RV64-NEXT: vmul.vx v8, v8, a1
	; LMULMAX2-RV64-NEXT: li a1, 56			; LMULMAX2-RV64-NEXT: li a1, 56
	; LMULMAX2-RV64-NEXT: vsrl.vx v8, v8, a1			; LMULMAX2-RV64-NEXT: vsrl.vx v8, v8, a1
	; LMULMAX2-RV64-NEXT: vse64.v v8, (a0)			; LMULMAX2-RV64-NEXT: vse64.v v8, (a0)
	; LMULMAX2-RV64-NEXT: ret			; LMULMAX2-RV64-NEXT: ret
	;			;
	; LMULMAX1-RV32-LABEL: ctlz_v4i64:			; LMULMAX1-RV32-LABEL: ctlz_v4i64:
	; LMULMAX1-RV32: # %bb.0:			; LMULMAX1-RV32: # %bb.0:
	; LMULMAX1-RV32-NEXT: vsetivli zero, 2, e64, m1, ta, mu			; LMULMAX1-RV32-NEXT: vsetivli zero, 2, e64, m1, ta, mu
	▲ Show 20 Lines • Show All 77 Lines • ▼ Show 20 Lines
	; LMULMAX1-RV32-NEXT: vsrl.vx v9, v9, a3			; LMULMAX1-RV32-NEXT: vsrl.vx v9, v9, a3
	; LMULMAX1-RV32-NEXT: vse64.v v9, (a0)			; LMULMAX1-RV32-NEXT: vse64.v v9, (a0)
	; LMULMAX1-RV32-NEXT: vse64.v v8, (a1)			; LMULMAX1-RV32-NEXT: vse64.v v8, (a1)
	; LMULMAX1-RV32-NEXT: ret			; LMULMAX1-RV32-NEXT: ret
	;			;
	; LMULMAX1-RV64-LABEL: ctlz_v4i64:			; LMULMAX1-RV64-LABEL: ctlz_v4i64:
	; LMULMAX1-RV64: # %bb.0:			; LMULMAX1-RV64: # %bb.0:
	; LMULMAX1-RV64-NEXT: vsetivli zero, 2, e64, m1, ta, mu			; LMULMAX1-RV64-NEXT: vsetivli zero, 2, e64, m1, ta, mu
	; LMULMAX1-RV64-NEXT: addi a7, a0, 16			; LMULMAX1-RV64-NEXT: addi a1, a0, 16
	; LMULMAX1-RV64-NEXT: vle64.v v8, (a7)			; LMULMAX1-RV64-NEXT: vle64.v v8, (a1)
	; LMULMAX1-RV64-NEXT: vle64.v v9, (a0)			; LMULMAX1-RV64-NEXT: vle64.v v9, (a0)
	; LMULMAX1-RV64-NEXT: vsrl.vi v10, v8, 1			; LMULMAX1-RV64-NEXT: vsrl.vi v10, v8, 1
	; LMULMAX1-RV64-NEXT: vor.vv v8, v8, v10			; LMULMAX1-RV64-NEXT: vor.vv v8, v8, v10
	; LMULMAX1-RV64-NEXT: vsrl.vi v10, v8, 2			; LMULMAX1-RV64-NEXT: vsrl.vi v10, v8, 2
	; LMULMAX1-RV64-NEXT: vor.vv v8, v8, v10			; LMULMAX1-RV64-NEXT: vor.vv v8, v8, v10
	; LMULMAX1-RV64-NEXT: vsrl.vi v10, v8, 4			; LMULMAX1-RV64-NEXT: vsrl.vi v10, v8, 4
	; LMULMAX1-RV64-NEXT: vor.vv v8, v8, v10			; LMULMAX1-RV64-NEXT: vor.vv v8, v8, v10
	; LMULMAX1-RV64-NEXT: vsrl.vi v10, v8, 8			; LMULMAX1-RV64-NEXT: vsrl.vi v10, v8, 8
	; LMULMAX1-RV64-NEXT: vor.vv v8, v8, v10			; LMULMAX1-RV64-NEXT: vor.vv v8, v8, v10
	; LMULMAX1-RV64-NEXT: vsrl.vi v10, v8, 16			; LMULMAX1-RV64-NEXT: vsrl.vi v10, v8, 16
	; LMULMAX1-RV64-NEXT: vor.vv v8, v8, v10			; LMULMAX1-RV64-NEXT: vor.vv v8, v8, v10
	; LMULMAX1-RV64-NEXT: li a6, 32			; LMULMAX1-RV64-NEXT: li a6, 32
	; LMULMAX1-RV64-NEXT: vsrl.vx v10, v8, a6			; LMULMAX1-RV64-NEXT: vsrl.vx v10, v8, a6
	; LMULMAX1-RV64-NEXT: vor.vv v8, v8, v10			; LMULMAX1-RV64-NEXT: vor.vv v8, v8, v10
	; LMULMAX1-RV64-NEXT: vxor.vi v8, v8, -1			; LMULMAX1-RV64-NEXT: vxor.vi v8, v8, -1
				; LMULMAX1-RV64-NEXT: lui a3, %hi(.LCPI7_0)
				; LMULMAX1-RV64-NEXT: ld a3, %lo(.LCPI7_0)(a3)
				; LMULMAX1-RV64-NEXT: lui a4, %hi(.LCPI7_1)
				; LMULMAX1-RV64-NEXT: ld a4, %lo(.LCPI7_1)(a4)
	; LMULMAX1-RV64-NEXT: vsrl.vi v10, v8, 1			; LMULMAX1-RV64-NEXT: vsrl.vi v10, v8, 1
	; LMULMAX1-RV64-NEXT: lui a3, 21845
	; LMULMAX1-RV64-NEXT: addiw a3, a3, 1365
	; LMULMAX1-RV64-NEXT: slli a3, a3, 12
	; LMULMAX1-RV64-NEXT: addi a3, a3, 1365
	; LMULMAX1-RV64-NEXT: slli a3, a3, 12
	; LMULMAX1-RV64-NEXT: addi a3, a3, 1365
	; LMULMAX1-RV64-NEXT: slli a3, a3, 12
	; LMULMAX1-RV64-NEXT: addi a3, a3, 1365
	; LMULMAX1-RV64-NEXT: vand.vx v10, v10, a3			; LMULMAX1-RV64-NEXT: vand.vx v10, v10, a3
	; LMULMAX1-RV64-NEXT: vsub.vv v8, v8, v10			; LMULMAX1-RV64-NEXT: vsub.vv v8, v8, v10
	; LMULMAX1-RV64-NEXT: lui a4, 13107
	; LMULMAX1-RV64-NEXT: addiw a4, a4, 819
	; LMULMAX1-RV64-NEXT: slli a4, a4, 12
	; LMULMAX1-RV64-NEXT: addi a4, a4, 819
	; LMULMAX1-RV64-NEXT: slli a4, a4, 12
	; LMULMAX1-RV64-NEXT: addi a4, a4, 819
	; LMULMAX1-RV64-NEXT: slli a4, a4, 12
	; LMULMAX1-RV64-NEXT: addi a4, a4, 819
	; LMULMAX1-RV64-NEXT: vand.vx v10, v8, a4			; LMULMAX1-RV64-NEXT: vand.vx v10, v8, a4
	; LMULMAX1-RV64-NEXT: vsrl.vi v8, v8, 2			; LMULMAX1-RV64-NEXT: vsrl.vi v8, v8, 2
	; LMULMAX1-RV64-NEXT: vand.vx v8, v8, a4			; LMULMAX1-RV64-NEXT: vand.vx v8, v8, a4
	; LMULMAX1-RV64-NEXT: vadd.vv v8, v10, v8			; LMULMAX1-RV64-NEXT: vadd.vv v8, v10, v8
				; LMULMAX1-RV64-NEXT: lui a5, %hi(.LCPI7_2)
				; LMULMAX1-RV64-NEXT: ld a5, %lo(.LCPI7_2)(a5)
				; LMULMAX1-RV64-NEXT: lui a2, %hi(.LCPI7_3)
				; LMULMAX1-RV64-NEXT: ld a2, %lo(.LCPI7_3)(a2)
	; LMULMAX1-RV64-NEXT: vsrl.vi v10, v8, 4			; LMULMAX1-RV64-NEXT: vsrl.vi v10, v8, 4
	; LMULMAX1-RV64-NEXT: vadd.vv v8, v8, v10			; LMULMAX1-RV64-NEXT: vadd.vv v8, v8, v10
	; LMULMAX1-RV64-NEXT: lui a5, 3855
	; LMULMAX1-RV64-NEXT: addiw a5, a5, 241
	; LMULMAX1-RV64-NEXT: slli a5, a5, 12
	; LMULMAX1-RV64-NEXT: addi a5, a5, -241
	; LMULMAX1-RV64-NEXT: slli a5, a5, 12
	; LMULMAX1-RV64-NEXT: addi a5, a5, 241
	; LMULMAX1-RV64-NEXT: slli a5, a5, 12
	; LMULMAX1-RV64-NEXT: addi a5, a5, -241
	; LMULMAX1-RV64-NEXT: vand.vx v8, v8, a5			; LMULMAX1-RV64-NEXT: vand.vx v8, v8, a5
	; LMULMAX1-RV64-NEXT: lui a2, 4112
	; LMULMAX1-RV64-NEXT: addiw a2, a2, 257
	; LMULMAX1-RV64-NEXT: slli a2, a2, 16
	; LMULMAX1-RV64-NEXT: addi a2, a2, 257
	; LMULMAX1-RV64-NEXT: slli a2, a2, 16
	; LMULMAX1-RV64-NEXT: addi a2, a2, 257
	; LMULMAX1-RV64-NEXT: vmul.vx v8, v8, a2			; LMULMAX1-RV64-NEXT: vmul.vx v8, v8, a2
	; LMULMAX1-RV64-NEXT: li a1, 56			; LMULMAX1-RV64-NEXT: li a7, 56
	; LMULMAX1-RV64-NEXT: vsrl.vx v8, v8, a1			; LMULMAX1-RV64-NEXT: vsrl.vx v8, v8, a7
	; LMULMAX1-RV64-NEXT: vsrl.vi v10, v9, 1			; LMULMAX1-RV64-NEXT: vsrl.vi v10, v9, 1
	; LMULMAX1-RV64-NEXT: vor.vv v9, v9, v10			; LMULMAX1-RV64-NEXT: vor.vv v9, v9, v10
	; LMULMAX1-RV64-NEXT: vsrl.vi v10, v9, 2			; LMULMAX1-RV64-NEXT: vsrl.vi v10, v9, 2
	; LMULMAX1-RV64-NEXT: vor.vv v9, v9, v10			; LMULMAX1-RV64-NEXT: vor.vv v9, v9, v10
	; LMULMAX1-RV64-NEXT: vsrl.vi v10, v9, 4			; LMULMAX1-RV64-NEXT: vsrl.vi v10, v9, 4
	; LMULMAX1-RV64-NEXT: vor.vv v9, v9, v10			; LMULMAX1-RV64-NEXT: vor.vv v9, v9, v10
	; LMULMAX1-RV64-NEXT: vsrl.vi v10, v9, 8			; LMULMAX1-RV64-NEXT: vsrl.vi v10, v9, 8
	; LMULMAX1-RV64-NEXT: vor.vv v9, v9, v10			; LMULMAX1-RV64-NEXT: vor.vv v9, v9, v10
	; LMULMAX1-RV64-NEXT: vsrl.vi v10, v9, 16			; LMULMAX1-RV64-NEXT: vsrl.vi v10, v9, 16
	; LMULMAX1-RV64-NEXT: vor.vv v9, v9, v10			; LMULMAX1-RV64-NEXT: vor.vv v9, v9, v10
	; LMULMAX1-RV64-NEXT: vsrl.vx v10, v9, a6			; LMULMAX1-RV64-NEXT: vsrl.vx v10, v9, a6
	; LMULMAX1-RV64-NEXT: vor.vv v9, v9, v10			; LMULMAX1-RV64-NEXT: vor.vv v9, v9, v10
	; LMULMAX1-RV64-NEXT: vxor.vi v9, v9, -1			; LMULMAX1-RV64-NEXT: vxor.vi v9, v9, -1
	; LMULMAX1-RV64-NEXT: vsrl.vi v10, v9, 1			; LMULMAX1-RV64-NEXT: vsrl.vi v10, v9, 1
	; LMULMAX1-RV64-NEXT: vand.vx v10, v10, a3			; LMULMAX1-RV64-NEXT: vand.vx v10, v10, a3
	; LMULMAX1-RV64-NEXT: vsub.vv v9, v9, v10			; LMULMAX1-RV64-NEXT: vsub.vv v9, v9, v10
	; LMULMAX1-RV64-NEXT: vand.vx v10, v9, a4			; LMULMAX1-RV64-NEXT: vand.vx v10, v9, a4
	; LMULMAX1-RV64-NEXT: vsrl.vi v9, v9, 2			; LMULMAX1-RV64-NEXT: vsrl.vi v9, v9, 2
	; LMULMAX1-RV64-NEXT: vand.vx v9, v9, a4			; LMULMAX1-RV64-NEXT: vand.vx v9, v9, a4
	; LMULMAX1-RV64-NEXT: vadd.vv v9, v10, v9			; LMULMAX1-RV64-NEXT: vadd.vv v9, v10, v9
	; LMULMAX1-RV64-NEXT: vsrl.vi v10, v9, 4			; LMULMAX1-RV64-NEXT: vsrl.vi v10, v9, 4
	; LMULMAX1-RV64-NEXT: vadd.vv v9, v9, v10			; LMULMAX1-RV64-NEXT: vadd.vv v9, v9, v10
	; LMULMAX1-RV64-NEXT: vand.vx v9, v9, a5			; LMULMAX1-RV64-NEXT: vand.vx v9, v9, a5
	; LMULMAX1-RV64-NEXT: vmul.vx v9, v9, a2			; LMULMAX1-RV64-NEXT: vmul.vx v9, v9, a2
	; LMULMAX1-RV64-NEXT: vsrl.vx v9, v9, a1			; LMULMAX1-RV64-NEXT: vsrl.vx v9, v9, a7
	; LMULMAX1-RV64-NEXT: vse64.v v9, (a0)			; LMULMAX1-RV64-NEXT: vse64.v v9, (a0)
	; LMULMAX1-RV64-NEXT: vse64.v v8, (a7)			; LMULMAX1-RV64-NEXT: vse64.v v8, (a1)
	; LMULMAX1-RV64-NEXT: ret			; LMULMAX1-RV64-NEXT: ret
	;			;
	; LMULMAX8-RV32-LABEL: ctlz_v4i64:			; LMULMAX8-RV32-LABEL: ctlz_v4i64:
	; LMULMAX8-RV32: # %bb.0:			; LMULMAX8-RV32: # %bb.0:
	; LMULMAX8-RV32-NEXT: vsetivli zero, 4, e64, m2, ta, mu			; LMULMAX8-RV32-NEXT: vsetivli zero, 4, e64, m2, ta, mu
	; LMULMAX8-RV32-NEXT: vle64.v v8, (a0)			; LMULMAX8-RV32-NEXT: vle64.v v8, (a0)
	; LMULMAX8-RV32-NEXT: vsrl.vi v10, v8, 1			; LMULMAX8-RV32-NEXT: vsrl.vi v10, v8, 1
	; LMULMAX8-RV32-NEXT: vor.vv v8, v8, v10			; LMULMAX8-RV32-NEXT: vor.vv v8, v8, v10
	▲ Show 20 Lines • Show All 61 Lines • ▼ Show 20 Lines
	; LMULMAX8-RV64-NEXT: vsrl.vi v10, v8, 8			; LMULMAX8-RV64-NEXT: vsrl.vi v10, v8, 8
	; LMULMAX8-RV64-NEXT: vor.vv v8, v8, v10			; LMULMAX8-RV64-NEXT: vor.vv v8, v8, v10
	; LMULMAX8-RV64-NEXT: vsrl.vi v10, v8, 16			; LMULMAX8-RV64-NEXT: vsrl.vi v10, v8, 16
	; LMULMAX8-RV64-NEXT: vor.vv v8, v8, v10			; LMULMAX8-RV64-NEXT: vor.vv v8, v8, v10
	; LMULMAX8-RV64-NEXT: li a1, 32			; LMULMAX8-RV64-NEXT: li a1, 32
	; LMULMAX8-RV64-NEXT: vsrl.vx v10, v8, a1			; LMULMAX8-RV64-NEXT: vsrl.vx v10, v8, a1
	; LMULMAX8-RV64-NEXT: vor.vv v8, v8, v10			; LMULMAX8-RV64-NEXT: vor.vv v8, v8, v10
	; LMULMAX8-RV64-NEXT: vxor.vi v8, v8, -1			; LMULMAX8-RV64-NEXT: vxor.vi v8, v8, -1
				; LMULMAX8-RV64-NEXT: lui a1, %hi(.LCPI7_0)
				; LMULMAX8-RV64-NEXT: ld a1, %lo(.LCPI7_0)(a1)
				; LMULMAX8-RV64-NEXT: lui a2, %hi(.LCPI7_1)
				; LMULMAX8-RV64-NEXT: ld a2, %lo(.LCPI7_1)(a2)
	; LMULMAX8-RV64-NEXT: vsrl.vi v10, v8, 1			; LMULMAX8-RV64-NEXT: vsrl.vi v10, v8, 1
	; LMULMAX8-RV64-NEXT: lui a1, 21845
	; LMULMAX8-RV64-NEXT: addiw a1, a1, 1365
	; LMULMAX8-RV64-NEXT: slli a1, a1, 12
	; LMULMAX8-RV64-NEXT: addi a1, a1, 1365
	; LMULMAX8-RV64-NEXT: slli a1, a1, 12
	; LMULMAX8-RV64-NEXT: addi a1, a1, 1365
	; LMULMAX8-RV64-NEXT: slli a1, a1, 12
	; LMULMAX8-RV64-NEXT: addi a1, a1, 1365
	; LMULMAX8-RV64-NEXT: vand.vx v10, v10, a1			; LMULMAX8-RV64-NEXT: vand.vx v10, v10, a1
	; LMULMAX8-RV64-NEXT: vsub.vv v8, v8, v10			; LMULMAX8-RV64-NEXT: vsub.vv v8, v8, v10
	; LMULMAX8-RV64-NEXT: lui a1, 13107			; LMULMAX8-RV64-NEXT: vand.vx v10, v8, a2
	; LMULMAX8-RV64-NEXT: addiw a1, a1, 819
	; LMULMAX8-RV64-NEXT: slli a1, a1, 12
	; LMULMAX8-RV64-NEXT: addi a1, a1, 819
	; LMULMAX8-RV64-NEXT: slli a1, a1, 12
	; LMULMAX8-RV64-NEXT: addi a1, a1, 819
	; LMULMAX8-RV64-NEXT: slli a1, a1, 12
	; LMULMAX8-RV64-NEXT: addi a1, a1, 819
	; LMULMAX8-RV64-NEXT: vand.vx v10, v8, a1
	; LMULMAX8-RV64-NEXT: vsrl.vi v8, v8, 2			; LMULMAX8-RV64-NEXT: vsrl.vi v8, v8, 2
	; LMULMAX8-RV64-NEXT: vand.vx v8, v8, a1			; LMULMAX8-RV64-NEXT: vand.vx v8, v8, a2
	; LMULMAX8-RV64-NEXT: vadd.vv v8, v10, v8			; LMULMAX8-RV64-NEXT: vadd.vv v8, v10, v8
				; LMULMAX8-RV64-NEXT: lui a1, %hi(.LCPI7_2)
				; LMULMAX8-RV64-NEXT: ld a1, %lo(.LCPI7_2)(a1)
				; LMULMAX8-RV64-NEXT: lui a2, %hi(.LCPI7_3)
				; LMULMAX8-RV64-NEXT: ld a2, %lo(.LCPI7_3)(a2)
	; LMULMAX8-RV64-NEXT: vsrl.vi v10, v8, 4			; LMULMAX8-RV64-NEXT: vsrl.vi v10, v8, 4
	; LMULMAX8-RV64-NEXT: vadd.vv v8, v8, v10			; LMULMAX8-RV64-NEXT: vadd.vv v8, v8, v10
	; LMULMAX8-RV64-NEXT: lui a1, 3855
	; LMULMAX8-RV64-NEXT: addiw a1, a1, 241
	; LMULMAX8-RV64-NEXT: slli a1, a1, 12
	; LMULMAX8-RV64-NEXT: addi a1, a1, -241
	; LMULMAX8-RV64-NEXT: slli a1, a1, 12
	; LMULMAX8-RV64-NEXT: addi a1, a1, 241
	; LMULMAX8-RV64-NEXT: slli a1, a1, 12
	; LMULMAX8-RV64-NEXT: addi a1, a1, -241
	; LMULMAX8-RV64-NEXT: vand.vx v8, v8, a1			; LMULMAX8-RV64-NEXT: vand.vx v8, v8, a1
	; LMULMAX8-RV64-NEXT: lui a1, 4112			; LMULMAX8-RV64-NEXT: vmul.vx v8, v8, a2
	; LMULMAX8-RV64-NEXT: addiw a1, a1, 257
	; LMULMAX8-RV64-NEXT: slli a1, a1, 16
	; LMULMAX8-RV64-NEXT: addi a1, a1, 257
	; LMULMAX8-RV64-NEXT: slli a1, a1, 16
	; LMULMAX8-RV64-NEXT: addi a1, a1, 257
	; LMULMAX8-RV64-NEXT: vmul.vx v8, v8, a1
	; LMULMAX8-RV64-NEXT: li a1, 56			; LMULMAX8-RV64-NEXT: li a1, 56
	; LMULMAX8-RV64-NEXT: vsrl.vx v8, v8, a1			; LMULMAX8-RV64-NEXT: vsrl.vx v8, v8, a1
	; LMULMAX8-RV64-NEXT: vse64.v v8, (a0)			; LMULMAX8-RV64-NEXT: vse64.v v8, (a0)
	; LMULMAX8-RV64-NEXT: ret			; LMULMAX8-RV64-NEXT: ret
	%a = load <4 x i64>, <4 x i64>* %x			%a = load <4 x i64>, <4 x i64>* %x
	%b = load <4 x i64>, <4 x i64>* %y			%b = load <4 x i64>, <4 x i64>* %y
	%c = call <4 x i64> @llvm.ctlz.v4i64(<4 x i64> %a, i1 false)			%c = call <4 x i64> @llvm.ctlz.v4i64(<4 x i64> %a, i1 false)
	store <4 x i64> %c, <4 x i64>* %x			store <4 x i64> %c, <4 x i64>* %x
	ret void			ret void
	}			}
	declare <4 x i64> @llvm.ctlz.v4i64(<4 x i64>, i1)			declare <4 x i64> @llvm.ctlz.v4i64(<4 x i64>, i1)

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-ctpop.ll

	Show First 20 Lines • Show All 298 Lines • ▼ Show 20 Lines
	; LMULMAX2-RV32-NEXT: vsrl.vx v8, v8, a1			; LMULMAX2-RV32-NEXT: vsrl.vx v8, v8, a1
	; LMULMAX2-RV32-NEXT: vse64.v v8, (a0)			; LMULMAX2-RV32-NEXT: vse64.v v8, (a0)
	; LMULMAX2-RV32-NEXT: ret			; LMULMAX2-RV32-NEXT: ret
	;			;
	; LMULMAX2-RV64-LABEL: ctpop_v2i64:			; LMULMAX2-RV64-LABEL: ctpop_v2i64:
	; LMULMAX2-RV64: # %bb.0:			; LMULMAX2-RV64: # %bb.0:
	; LMULMAX2-RV64-NEXT: vsetivli zero, 2, e64, m1, ta, mu			; LMULMAX2-RV64-NEXT: vsetivli zero, 2, e64, m1, ta, mu
	; LMULMAX2-RV64-NEXT: vle64.v v8, (a0)			; LMULMAX2-RV64-NEXT: vle64.v v8, (a0)
				; LMULMAX2-RV64-NEXT: lui a1, %hi(.LCPI3_0)
				; LMULMAX2-RV64-NEXT: ld a1, %lo(.LCPI3_0)(a1)
				; LMULMAX2-RV64-NEXT: lui a2, %hi(.LCPI3_1)
				; LMULMAX2-RV64-NEXT: ld a2, %lo(.LCPI3_1)(a2)
	; LMULMAX2-RV64-NEXT: vsrl.vi v9, v8, 1			; LMULMAX2-RV64-NEXT: vsrl.vi v9, v8, 1
	; LMULMAX2-RV64-NEXT: lui a1, 21845
	; LMULMAX2-RV64-NEXT: addiw a1, a1, 1365
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 1365
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 1365
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 1365
	; LMULMAX2-RV64-NEXT: vand.vx v9, v9, a1			; LMULMAX2-RV64-NEXT: vand.vx v9, v9, a1
	; LMULMAX2-RV64-NEXT: vsub.vv v8, v8, v9			; LMULMAX2-RV64-NEXT: vsub.vv v8, v8, v9
	; LMULMAX2-RV64-NEXT: lui a1, 13107			; LMULMAX2-RV64-NEXT: vand.vx v9, v8, a2
	; LMULMAX2-RV64-NEXT: addiw a1, a1, 819
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 819
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 819
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 819
	; LMULMAX2-RV64-NEXT: vand.vx v9, v8, a1
	; LMULMAX2-RV64-NEXT: vsrl.vi v8, v8, 2			; LMULMAX2-RV64-NEXT: vsrl.vi v8, v8, 2
	; LMULMAX2-RV64-NEXT: vand.vx v8, v8, a1			; LMULMAX2-RV64-NEXT: vand.vx v8, v8, a2
	; LMULMAX2-RV64-NEXT: vadd.vv v8, v9, v8			; LMULMAX2-RV64-NEXT: vadd.vv v8, v9, v8
				; LMULMAX2-RV64-NEXT: lui a1, %hi(.LCPI3_2)
				; LMULMAX2-RV64-NEXT: ld a1, %lo(.LCPI3_2)(a1)
				; LMULMAX2-RV64-NEXT: lui a2, %hi(.LCPI3_3)
				; LMULMAX2-RV64-NEXT: ld a2, %lo(.LCPI3_3)(a2)
	; LMULMAX2-RV64-NEXT: vsrl.vi v9, v8, 4			; LMULMAX2-RV64-NEXT: vsrl.vi v9, v8, 4
	; LMULMAX2-RV64-NEXT: vadd.vv v8, v8, v9			; LMULMAX2-RV64-NEXT: vadd.vv v8, v8, v9
	; LMULMAX2-RV64-NEXT: lui a1, 3855
	; LMULMAX2-RV64-NEXT: addiw a1, a1, 241
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, -241
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 241
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, -241
	; LMULMAX2-RV64-NEXT: vand.vx v8, v8, a1			; LMULMAX2-RV64-NEXT: vand.vx v8, v8, a1
	; LMULMAX2-RV64-NEXT: lui a1, 4112			; LMULMAX2-RV64-NEXT: vmul.vx v8, v8, a2
	; LMULMAX2-RV64-NEXT: addiw a1, a1, 257
	; LMULMAX2-RV64-NEXT: slli a1, a1, 16
	; LMULMAX2-RV64-NEXT: addi a1, a1, 257
	; LMULMAX2-RV64-NEXT: slli a1, a1, 16
	; LMULMAX2-RV64-NEXT: addi a1, a1, 257
	; LMULMAX2-RV64-NEXT: vmul.vx v8, v8, a1
	; LMULMAX2-RV64-NEXT: li a1, 56			; LMULMAX2-RV64-NEXT: li a1, 56
	; LMULMAX2-RV64-NEXT: vsrl.vx v8, v8, a1			; LMULMAX2-RV64-NEXT: vsrl.vx v8, v8, a1
	; LMULMAX2-RV64-NEXT: vse64.v v8, (a0)			; LMULMAX2-RV64-NEXT: vse64.v v8, (a0)
	; LMULMAX2-RV64-NEXT: ret			; LMULMAX2-RV64-NEXT: ret
	;			;
	; LMULMAX1-RV32-LABEL: ctpop_v2i64:			; LMULMAX1-RV32-LABEL: ctpop_v2i64:
	; LMULMAX1-RV32: # %bb.0:			; LMULMAX1-RV32: # %bb.0:
	; LMULMAX1-RV32-NEXT: vsetivli zero, 2, e64, m1, ta, mu			; LMULMAX1-RV32-NEXT: vsetivli zero, 2, e64, m1, ta, mu
	Show All 33 Lines
	; LMULMAX1-RV32-NEXT: vsrl.vx v8, v8, a1			; LMULMAX1-RV32-NEXT: vsrl.vx v8, v8, a1
	; LMULMAX1-RV32-NEXT: vse64.v v8, (a0)			; LMULMAX1-RV32-NEXT: vse64.v v8, (a0)
	; LMULMAX1-RV32-NEXT: ret			; LMULMAX1-RV32-NEXT: ret
	;			;
	; LMULMAX1-RV64-LABEL: ctpop_v2i64:			; LMULMAX1-RV64-LABEL: ctpop_v2i64:
	; LMULMAX1-RV64: # %bb.0:			; LMULMAX1-RV64: # %bb.0:
	; LMULMAX1-RV64-NEXT: vsetivli zero, 2, e64, m1, ta, mu			; LMULMAX1-RV64-NEXT: vsetivli zero, 2, e64, m1, ta, mu
	; LMULMAX1-RV64-NEXT: vle64.v v8, (a0)			; LMULMAX1-RV64-NEXT: vle64.v v8, (a0)
				; LMULMAX1-RV64-NEXT: lui a1, %hi(.LCPI3_0)
				; LMULMAX1-RV64-NEXT: ld a1, %lo(.LCPI3_0)(a1)
				; LMULMAX1-RV64-NEXT: lui a2, %hi(.LCPI3_1)
				; LMULMAX1-RV64-NEXT: ld a2, %lo(.LCPI3_1)(a2)
	; LMULMAX1-RV64-NEXT: vsrl.vi v9, v8, 1			; LMULMAX1-RV64-NEXT: vsrl.vi v9, v8, 1
	; LMULMAX1-RV64-NEXT: lui a1, 21845
	; LMULMAX1-RV64-NEXT: addiw a1, a1, 1365
	; LMULMAX1-RV64-NEXT: slli a1, a1, 12
	; LMULMAX1-RV64-NEXT: addi a1, a1, 1365
	; LMULMAX1-RV64-NEXT: slli a1, a1, 12
	; LMULMAX1-RV64-NEXT: addi a1, a1, 1365
	; LMULMAX1-RV64-NEXT: slli a1, a1, 12
	; LMULMAX1-RV64-NEXT: addi a1, a1, 1365
	; LMULMAX1-RV64-NEXT: vand.vx v9, v9, a1			; LMULMAX1-RV64-NEXT: vand.vx v9, v9, a1
	; LMULMAX1-RV64-NEXT: vsub.vv v8, v8, v9			; LMULMAX1-RV64-NEXT: vsub.vv v8, v8, v9
	; LMULMAX1-RV64-NEXT: lui a1, 13107			; LMULMAX1-RV64-NEXT: vand.vx v9, v8, a2
	; LMULMAX1-RV64-NEXT: addiw a1, a1, 819
	; LMULMAX1-RV64-NEXT: slli a1, a1, 12
	; LMULMAX1-RV64-NEXT: addi a1, a1, 819
	; LMULMAX1-RV64-NEXT: slli a1, a1, 12
	; LMULMAX1-RV64-NEXT: addi a1, a1, 819
	; LMULMAX1-RV64-NEXT: slli a1, a1, 12
	; LMULMAX1-RV64-NEXT: addi a1, a1, 819
	; LMULMAX1-RV64-NEXT: vand.vx v9, v8, a1
	; LMULMAX1-RV64-NEXT: vsrl.vi v8, v8, 2			; LMULMAX1-RV64-NEXT: vsrl.vi v8, v8, 2
	; LMULMAX1-RV64-NEXT: vand.vx v8, v8, a1			; LMULMAX1-RV64-NEXT: vand.vx v8, v8, a2
	; LMULMAX1-RV64-NEXT: vadd.vv v8, v9, v8			; LMULMAX1-RV64-NEXT: vadd.vv v8, v9, v8
				; LMULMAX1-RV64-NEXT: lui a1, %hi(.LCPI3_2)
				; LMULMAX1-RV64-NEXT: ld a1, %lo(.LCPI3_2)(a1)
				; LMULMAX1-RV64-NEXT: lui a2, %hi(.LCPI3_3)
				; LMULMAX1-RV64-NEXT: ld a2, %lo(.LCPI3_3)(a2)
	; LMULMAX1-RV64-NEXT: vsrl.vi v9, v8, 4			; LMULMAX1-RV64-NEXT: vsrl.vi v9, v8, 4
	; LMULMAX1-RV64-NEXT: vadd.vv v8, v8, v9			; LMULMAX1-RV64-NEXT: vadd.vv v8, v8, v9
	; LMULMAX1-RV64-NEXT: lui a1, 3855
	; LMULMAX1-RV64-NEXT: addiw a1, a1, 241
	; LMULMAX1-RV64-NEXT: slli a1, a1, 12
	; LMULMAX1-RV64-NEXT: addi a1, a1, -241
	; LMULMAX1-RV64-NEXT: slli a1, a1, 12
	; LMULMAX1-RV64-NEXT: addi a1, a1, 241
	; LMULMAX1-RV64-NEXT: slli a1, a1, 12
	; LMULMAX1-RV64-NEXT: addi a1, a1, -241
	; LMULMAX1-RV64-NEXT: vand.vx v8, v8, a1			; LMULMAX1-RV64-NEXT: vand.vx v8, v8, a1
	; LMULMAX1-RV64-NEXT: lui a1, 4112			; LMULMAX1-RV64-NEXT: vmul.vx v8, v8, a2
	; LMULMAX1-RV64-NEXT: addiw a1, a1, 257
	; LMULMAX1-RV64-NEXT: slli a1, a1, 16
	; LMULMAX1-RV64-NEXT: addi a1, a1, 257
	; LMULMAX1-RV64-NEXT: slli a1, a1, 16
	; LMULMAX1-RV64-NEXT: addi a1, a1, 257
	; LMULMAX1-RV64-NEXT: vmul.vx v8, v8, a1
	; LMULMAX1-RV64-NEXT: li a1, 56			; LMULMAX1-RV64-NEXT: li a1, 56
	; LMULMAX1-RV64-NEXT: vsrl.vx v8, v8, a1			; LMULMAX1-RV64-NEXT: vsrl.vx v8, v8, a1
	; LMULMAX1-RV64-NEXT: vse64.v v8, (a0)			; LMULMAX1-RV64-NEXT: vse64.v v8, (a0)
	; LMULMAX1-RV64-NEXT: ret			; LMULMAX1-RV64-NEXT: ret
	%a = load <2 x i64>, <2 x i64>* %x			%a = load <2 x i64>, <2 x i64>* %x
	%b = load <2 x i64>, <2 x i64>* %y			%b = load <2 x i64>, <2 x i64>* %y
	%c = call <2 x i64> @llvm.ctpop.v2i64(<2 x i64> %a)			%c = call <2 x i64> @llvm.ctpop.v2i64(<2 x i64> %a)
	store <2 x i64> %c, <2 x i64>* %x			store <2 x i64> %c, <2 x i64>* %x
	▲ Show 20 Lines • Show All 389 Lines • ▼ Show 20 Lines
	; LMULMAX2-RV32-NEXT: vsrl.vx v8, v8, a1			; LMULMAX2-RV32-NEXT: vsrl.vx v8, v8, a1
	; LMULMAX2-RV32-NEXT: vse64.v v8, (a0)			; LMULMAX2-RV32-NEXT: vse64.v v8, (a0)
	; LMULMAX2-RV32-NEXT: ret			; LMULMAX2-RV32-NEXT: ret
	;			;
	; LMULMAX2-RV64-LABEL: ctpop_v4i64:			; LMULMAX2-RV64-LABEL: ctpop_v4i64:
	; LMULMAX2-RV64: # %bb.0:			; LMULMAX2-RV64: # %bb.0:
	; LMULMAX2-RV64-NEXT: vsetivli zero, 4, e64, m2, ta, mu			; LMULMAX2-RV64-NEXT: vsetivli zero, 4, e64, m2, ta, mu
	; LMULMAX2-RV64-NEXT: vle64.v v8, (a0)			; LMULMAX2-RV64-NEXT: vle64.v v8, (a0)
				; LMULMAX2-RV64-NEXT: lui a1, %hi(.LCPI7_0)
				; LMULMAX2-RV64-NEXT: ld a1, %lo(.LCPI7_0)(a1)
				; LMULMAX2-RV64-NEXT: lui a2, %hi(.LCPI7_1)
				; LMULMAX2-RV64-NEXT: ld a2, %lo(.LCPI7_1)(a2)
	; LMULMAX2-RV64-NEXT: vsrl.vi v10, v8, 1			; LMULMAX2-RV64-NEXT: vsrl.vi v10, v8, 1
	; LMULMAX2-RV64-NEXT: lui a1, 21845
	; LMULMAX2-RV64-NEXT: addiw a1, a1, 1365
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 1365
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 1365
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 1365
	; LMULMAX2-RV64-NEXT: vand.vx v10, v10, a1			; LMULMAX2-RV64-NEXT: vand.vx v10, v10, a1
	; LMULMAX2-RV64-NEXT: vsub.vv v8, v8, v10			; LMULMAX2-RV64-NEXT: vsub.vv v8, v8, v10
	; LMULMAX2-RV64-NEXT: lui a1, 13107			; LMULMAX2-RV64-NEXT: vand.vx v10, v8, a2
	; LMULMAX2-RV64-NEXT: addiw a1, a1, 819
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 819
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 819
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 819
	; LMULMAX2-RV64-NEXT: vand.vx v10, v8, a1
	; LMULMAX2-RV64-NEXT: vsrl.vi v8, v8, 2			; LMULMAX2-RV64-NEXT: vsrl.vi v8, v8, 2
	; LMULMAX2-RV64-NEXT: vand.vx v8, v8, a1			; LMULMAX2-RV64-NEXT: vand.vx v8, v8, a2
	; LMULMAX2-RV64-NEXT: vadd.vv v8, v10, v8			; LMULMAX2-RV64-NEXT: vadd.vv v8, v10, v8
				; LMULMAX2-RV64-NEXT: lui a1, %hi(.LCPI7_2)
				; LMULMAX2-RV64-NEXT: ld a1, %lo(.LCPI7_2)(a1)
				; LMULMAX2-RV64-NEXT: lui a2, %hi(.LCPI7_3)
				; LMULMAX2-RV64-NEXT: ld a2, %lo(.LCPI7_3)(a2)
	; LMULMAX2-RV64-NEXT: vsrl.vi v10, v8, 4			; LMULMAX2-RV64-NEXT: vsrl.vi v10, v8, 4
	; LMULMAX2-RV64-NEXT: vadd.vv v8, v8, v10			; LMULMAX2-RV64-NEXT: vadd.vv v8, v8, v10
	; LMULMAX2-RV64-NEXT: lui a1, 3855
	; LMULMAX2-RV64-NEXT: addiw a1, a1, 241
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, -241
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 241
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, -241
	; LMULMAX2-RV64-NEXT: vand.vx v8, v8, a1			; LMULMAX2-RV64-NEXT: vand.vx v8, v8, a1
	; LMULMAX2-RV64-NEXT: lui a1, 4112			; LMULMAX2-RV64-NEXT: vmul.vx v8, v8, a2
	; LMULMAX2-RV64-NEXT: addiw a1, a1, 257
	; LMULMAX2-RV64-NEXT: slli a1, a1, 16
	; LMULMAX2-RV64-NEXT: addi a1, a1, 257
	; LMULMAX2-RV64-NEXT: slli a1, a1, 16
	; LMULMAX2-RV64-NEXT: addi a1, a1, 257
	; LMULMAX2-RV64-NEXT: vmul.vx v8, v8, a1
	; LMULMAX2-RV64-NEXT: li a1, 56			; LMULMAX2-RV64-NEXT: li a1, 56
	; LMULMAX2-RV64-NEXT: vsrl.vx v8, v8, a1			; LMULMAX2-RV64-NEXT: vsrl.vx v8, v8, a1
	; LMULMAX2-RV64-NEXT: vse64.v v8, (a0)			; LMULMAX2-RV64-NEXT: vse64.v v8, (a0)
	; LMULMAX2-RV64-NEXT: ret			; LMULMAX2-RV64-NEXT: ret
	;			;
	; LMULMAX1-RV32-LABEL: ctpop_v4i64:			; LMULMAX1-RV32-LABEL: ctpop_v4i64:
	; LMULMAX1-RV32: # %bb.0:			; LMULMAX1-RV32: # %bb.0:
	; LMULMAX1-RV32-NEXT: vsetivli zero, 2, e64, m1, ta, mu			; LMULMAX1-RV32-NEXT: vsetivli zero, 2, e64, m1, ta, mu
	▲ Show 20 Lines • Show All 47 Lines • ▼ Show 20 Lines
	; LMULMAX1-RV32-NEXT: vsrl.vx v9, v9, a2			; LMULMAX1-RV32-NEXT: vsrl.vx v9, v9, a2
	; LMULMAX1-RV32-NEXT: vse64.v v9, (a0)			; LMULMAX1-RV32-NEXT: vse64.v v9, (a0)
	; LMULMAX1-RV32-NEXT: vse64.v v8, (a1)			; LMULMAX1-RV32-NEXT: vse64.v v8, (a1)
	; LMULMAX1-RV32-NEXT: ret			; LMULMAX1-RV32-NEXT: ret
	;			;
	; LMULMAX1-RV64-LABEL: ctpop_v4i64:			; LMULMAX1-RV64-LABEL: ctpop_v4i64:
	; LMULMAX1-RV64: # %bb.0:			; LMULMAX1-RV64: # %bb.0:
	; LMULMAX1-RV64-NEXT: vsetivli zero, 2, e64, m1, ta, mu			; LMULMAX1-RV64-NEXT: vsetivli zero, 2, e64, m1, ta, mu
	; LMULMAX1-RV64-NEXT: addi a6, a0, 16			; LMULMAX1-RV64-NEXT: vle64.v v8, (a0)
	; LMULMAX1-RV64-NEXT: vle64.v v8, (a6)			; LMULMAX1-RV64-NEXT: addi a1, a0, 16
	; LMULMAX1-RV64-NEXT: vle64.v v9, (a0)			; LMULMAX1-RV64-NEXT: vle64.v v9, (a1)
	; LMULMAX1-RV64-NEXT: vsrl.vi v10, v8, 1			; LMULMAX1-RV64-NEXT: lui a2, %hi(.LCPI7_0)
	; LMULMAX1-RV64-NEXT: lui a2, 21845			; LMULMAX1-RV64-NEXT: ld a2, %lo(.LCPI7_0)(a2)
	; LMULMAX1-RV64-NEXT: addiw a2, a2, 1365			; LMULMAX1-RV64-NEXT: lui a3, %hi(.LCPI7_1)
	; LMULMAX1-RV64-NEXT: slli a2, a2, 12			; LMULMAX1-RV64-NEXT: ld a3, %lo(.LCPI7_1)(a3)
	; LMULMAX1-RV64-NEXT: addi a2, a2, 1365
	; LMULMAX1-RV64-NEXT: slli a2, a2, 12
	; LMULMAX1-RV64-NEXT: addi a2, a2, 1365
	; LMULMAX1-RV64-NEXT: slli a2, a2, 12
	; LMULMAX1-RV64-NEXT: addi a2, a2, 1365
	; LMULMAX1-RV64-NEXT: vand.vx v10, v10, a2
	; LMULMAX1-RV64-NEXT: vsub.vv v8, v8, v10
	; LMULMAX1-RV64-NEXT: lui a3, 13107
	; LMULMAX1-RV64-NEXT: addiw a3, a3, 819
	; LMULMAX1-RV64-NEXT: slli a3, a3, 12
	; LMULMAX1-RV64-NEXT: addi a3, a3, 819
	; LMULMAX1-RV64-NEXT: slli a3, a3, 12
	; LMULMAX1-RV64-NEXT: addi a3, a3, 819
	; LMULMAX1-RV64-NEXT: slli a3, a3, 12
	; LMULMAX1-RV64-NEXT: addi a3, a3, 819
	; LMULMAX1-RV64-NEXT: vand.vx v10, v8, a3
	; LMULMAX1-RV64-NEXT: vsrl.vi v8, v8, 2
	; LMULMAX1-RV64-NEXT: vand.vx v8, v8, a3
	; LMULMAX1-RV64-NEXT: vadd.vv v8, v10, v8
	; LMULMAX1-RV64-NEXT: vsrl.vi v10, v8, 4
	; LMULMAX1-RV64-NEXT: vadd.vv v8, v8, v10
	; LMULMAX1-RV64-NEXT: lui a4, 3855
	; LMULMAX1-RV64-NEXT: addiw a4, a4, 241
	; LMULMAX1-RV64-NEXT: slli a4, a4, 12
	; LMULMAX1-RV64-NEXT: addi a4, a4, -241
	; LMULMAX1-RV64-NEXT: slli a4, a4, 12
	; LMULMAX1-RV64-NEXT: addi a4, a4, 241
	; LMULMAX1-RV64-NEXT: slli a4, a4, 12
	; LMULMAX1-RV64-NEXT: addi a4, a4, -241
	; LMULMAX1-RV64-NEXT: vand.vx v8, v8, a4
	; LMULMAX1-RV64-NEXT: lui a5, 4112
	; LMULMAX1-RV64-NEXT: addiw a5, a5, 257
	; LMULMAX1-RV64-NEXT: slli a5, a5, 16
	; LMULMAX1-RV64-NEXT: addi a5, a5, 257
	; LMULMAX1-RV64-NEXT: slli a5, a5, 16
	; LMULMAX1-RV64-NEXT: addi a5, a5, 257
	; LMULMAX1-RV64-NEXT: vmul.vx v8, v8, a5
	; LMULMAX1-RV64-NEXT: li a1, 56
	; LMULMAX1-RV64-NEXT: vsrl.vx v8, v8, a1
	; LMULMAX1-RV64-NEXT: vsrl.vi v10, v9, 1			; LMULMAX1-RV64-NEXT: vsrl.vi v10, v9, 1
	; LMULMAX1-RV64-NEXT: vand.vx v10, v10, a2			; LMULMAX1-RV64-NEXT: vand.vx v10, v10, a2
	; LMULMAX1-RV64-NEXT: vsub.vv v9, v9, v10			; LMULMAX1-RV64-NEXT: vsub.vv v9, v9, v10
	; LMULMAX1-RV64-NEXT: vand.vx v10, v9, a3			; LMULMAX1-RV64-NEXT: vand.vx v10, v9, a3
	; LMULMAX1-RV64-NEXT: vsrl.vi v9, v9, 2			; LMULMAX1-RV64-NEXT: vsrl.vi v9, v9, 2
	; LMULMAX1-RV64-NEXT: vand.vx v9, v9, a3			; LMULMAX1-RV64-NEXT: vand.vx v9, v9, a3
	; LMULMAX1-RV64-NEXT: vadd.vv v9, v10, v9			; LMULMAX1-RV64-NEXT: vadd.vv v9, v10, v9
				; LMULMAX1-RV64-NEXT: lui a4, %hi(.LCPI7_2)
				; LMULMAX1-RV64-NEXT: ld a4, %lo(.LCPI7_2)(a4)
				; LMULMAX1-RV64-NEXT: lui a5, %hi(.LCPI7_3)
				; LMULMAX1-RV64-NEXT: ld a5, %lo(.LCPI7_3)(a5)
	; LMULMAX1-RV64-NEXT: vsrl.vi v10, v9, 4			; LMULMAX1-RV64-NEXT: vsrl.vi v10, v9, 4
	; LMULMAX1-RV64-NEXT: vadd.vv v9, v9, v10			; LMULMAX1-RV64-NEXT: vadd.vv v9, v9, v10
	; LMULMAX1-RV64-NEXT: vand.vx v9, v9, a4			; LMULMAX1-RV64-NEXT: vand.vx v9, v9, a4
	; LMULMAX1-RV64-NEXT: vmul.vx v9, v9, a5			; LMULMAX1-RV64-NEXT: vmul.vx v9, v9, a5
	; LMULMAX1-RV64-NEXT: vsrl.vx v9, v9, a1			; LMULMAX1-RV64-NEXT: li a6, 56
	; LMULMAX1-RV64-NEXT: vse64.v v9, (a0)			; LMULMAX1-RV64-NEXT: vsrl.vx v9, v9, a6
	; LMULMAX1-RV64-NEXT: vse64.v v8, (a6)			; LMULMAX1-RV64-NEXT: vsrl.vi v10, v8, 1
				; LMULMAX1-RV64-NEXT: vand.vx v10, v10, a2
				; LMULMAX1-RV64-NEXT: vsub.vv v8, v8, v10
				; LMULMAX1-RV64-NEXT: vand.vx v10, v8, a3
				; LMULMAX1-RV64-NEXT: vsrl.vi v8, v8, 2
				; LMULMAX1-RV64-NEXT: vand.vx v8, v8, a3
				; LMULMAX1-RV64-NEXT: vadd.vv v8, v10, v8
				; LMULMAX1-RV64-NEXT: vsrl.vi v10, v8, 4
				; LMULMAX1-RV64-NEXT: vadd.vv v8, v8, v10
				; LMULMAX1-RV64-NEXT: vand.vx v8, v8, a4
				; LMULMAX1-RV64-NEXT: vmul.vx v8, v8, a5
				; LMULMAX1-RV64-NEXT: vsrl.vx v8, v8, a6
				; LMULMAX1-RV64-NEXT: vse64.v v8, (a0)
				; LMULMAX1-RV64-NEXT: vse64.v v9, (a1)
	; LMULMAX1-RV64-NEXT: ret			; LMULMAX1-RV64-NEXT: ret
	%a = load <4 x i64>, <4 x i64>* %x			%a = load <4 x i64>, <4 x i64>* %x
	%b = load <4 x i64>, <4 x i64>* %y			%b = load <4 x i64>, <4 x i64>* %y
	%c = call <4 x i64> @llvm.ctpop.v4i64(<4 x i64> %a)			%c = call <4 x i64> @llvm.ctpop.v4i64(<4 x i64> %a)
	store <4 x i64> %c, <4 x i64>* %x			store <4 x i64> %c, <4 x i64>* %x
	ret void			ret void
	}			}
	declare <4 x i64> @llvm.ctpop.v4i64(<4 x i64>)			declare <4 x i64> @llvm.ctpop.v4i64(<4 x i64>)

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-cttz.ll

	Show First 20 Lines • Show All 592 Lines • ▼ Show 20 Lines
	; LMULMAX2-RV64-LABEL: cttz_v2i64:			; LMULMAX2-RV64-LABEL: cttz_v2i64:
	; LMULMAX2-RV64: # %bb.0:			; LMULMAX2-RV64: # %bb.0:
	; LMULMAX2-RV64-NEXT: vsetivli zero, 2, e64, m1, ta, mu			; LMULMAX2-RV64-NEXT: vsetivli zero, 2, e64, m1, ta, mu
	; LMULMAX2-RV64-NEXT: vle64.v v8, (a0)			; LMULMAX2-RV64-NEXT: vle64.v v8, (a0)
	; LMULMAX2-RV64-NEXT: li a1, 1			; LMULMAX2-RV64-NEXT: li a1, 1
	; LMULMAX2-RV64-NEXT: vsub.vx v9, v8, a1			; LMULMAX2-RV64-NEXT: vsub.vx v9, v8, a1
	; LMULMAX2-RV64-NEXT: vxor.vi v8, v8, -1			; LMULMAX2-RV64-NEXT: vxor.vi v8, v8, -1
	; LMULMAX2-RV64-NEXT: vand.vv v8, v8, v9			; LMULMAX2-RV64-NEXT: vand.vv v8, v8, v9
				; LMULMAX2-RV64-NEXT: lui a1, %hi(.LCPI3_0)
				; LMULMAX2-RV64-NEXT: ld a1, %lo(.LCPI3_0)(a1)
				; LMULMAX2-RV64-NEXT: lui a2, %hi(.LCPI3_1)
				; LMULMAX2-RV64-NEXT: ld a2, %lo(.LCPI3_1)(a2)
	; LMULMAX2-RV64-NEXT: vsrl.vi v9, v8, 1			; LMULMAX2-RV64-NEXT: vsrl.vi v9, v8, 1
	; LMULMAX2-RV64-NEXT: lui a1, 21845
	; LMULMAX2-RV64-NEXT: addiw a1, a1, 1365
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 1365
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 1365
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 1365
	; LMULMAX2-RV64-NEXT: vand.vx v9, v9, a1			; LMULMAX2-RV64-NEXT: vand.vx v9, v9, a1
	; LMULMAX2-RV64-NEXT: vsub.vv v8, v8, v9			; LMULMAX2-RV64-NEXT: vsub.vv v8, v8, v9
	; LMULMAX2-RV64-NEXT: lui a1, 13107			; LMULMAX2-RV64-NEXT: vand.vx v9, v8, a2
	; LMULMAX2-RV64-NEXT: addiw a1, a1, 819
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 819
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 819
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 819
	; LMULMAX2-RV64-NEXT: vand.vx v9, v8, a1
	; LMULMAX2-RV64-NEXT: vsrl.vi v8, v8, 2			; LMULMAX2-RV64-NEXT: vsrl.vi v8, v8, 2
	; LMULMAX2-RV64-NEXT: vand.vx v8, v8, a1			; LMULMAX2-RV64-NEXT: vand.vx v8, v8, a2
	; LMULMAX2-RV64-NEXT: vadd.vv v8, v9, v8			; LMULMAX2-RV64-NEXT: vadd.vv v8, v9, v8
				; LMULMAX2-RV64-NEXT: lui a1, %hi(.LCPI3_2)
				; LMULMAX2-RV64-NEXT: ld a1, %lo(.LCPI3_2)(a1)
				; LMULMAX2-RV64-NEXT: lui a2, %hi(.LCPI3_3)
				; LMULMAX2-RV64-NEXT: ld a2, %lo(.LCPI3_3)(a2)
	; LMULMAX2-RV64-NEXT: vsrl.vi v9, v8, 4			; LMULMAX2-RV64-NEXT: vsrl.vi v9, v8, 4
	; LMULMAX2-RV64-NEXT: vadd.vv v8, v8, v9			; LMULMAX2-RV64-NEXT: vadd.vv v8, v8, v9
	; LMULMAX2-RV64-NEXT: lui a1, 3855
	; LMULMAX2-RV64-NEXT: addiw a1, a1, 241
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, -241
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 241
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, -241
	; LMULMAX2-RV64-NEXT: vand.vx v8, v8, a1			; LMULMAX2-RV64-NEXT: vand.vx v8, v8, a1
	; LMULMAX2-RV64-NEXT: lui a1, 4112			; LMULMAX2-RV64-NEXT: vmul.vx v8, v8, a2
	; LMULMAX2-RV64-NEXT: addiw a1, a1, 257
	; LMULMAX2-RV64-NEXT: slli a1, a1, 16
	; LMULMAX2-RV64-NEXT: addi a1, a1, 257
	; LMULMAX2-RV64-NEXT: slli a1, a1, 16
	; LMULMAX2-RV64-NEXT: addi a1, a1, 257
	; LMULMAX2-RV64-NEXT: vmul.vx v8, v8, a1
	; LMULMAX2-RV64-NEXT: li a1, 56			; LMULMAX2-RV64-NEXT: li a1, 56
	; LMULMAX2-RV64-NEXT: vsrl.vx v8, v8, a1			; LMULMAX2-RV64-NEXT: vsrl.vx v8, v8, a1
	; LMULMAX2-RV64-NEXT: vse64.v v8, (a0)			; LMULMAX2-RV64-NEXT: vse64.v v8, (a0)
	; LMULMAX2-RV64-NEXT: ret			; LMULMAX2-RV64-NEXT: ret
	;			;
	; LMULMAX1-RV32-LABEL: cttz_v2i64:			; LMULMAX1-RV32-LABEL: cttz_v2i64:
	; LMULMAX1-RV32: # %bb.0:			; LMULMAX1-RV32: # %bb.0:
	; LMULMAX1-RV32-NEXT: vsetivli zero, 2, e64, m1, ta, mu			; LMULMAX1-RV32-NEXT: vsetivli zero, 2, e64, m1, ta, mu
	▲ Show 20 Lines • Show All 44 Lines • ▼ Show 20 Lines
	; LMULMAX1-RV64-LABEL: cttz_v2i64:			; LMULMAX1-RV64-LABEL: cttz_v2i64:
	; LMULMAX1-RV64: # %bb.0:			; LMULMAX1-RV64: # %bb.0:
	; LMULMAX1-RV64-NEXT: vsetivli zero, 2, e64, m1, ta, mu			; LMULMAX1-RV64-NEXT: vsetivli zero, 2, e64, m1, ta, mu
	; LMULMAX1-RV64-NEXT: vle64.v v8, (a0)			; LMULMAX1-RV64-NEXT: vle64.v v8, (a0)
	; LMULMAX1-RV64-NEXT: li a1, 1			; LMULMAX1-RV64-NEXT: li a1, 1
	; LMULMAX1-RV64-NEXT: vsub.vx v9, v8, a1			; LMULMAX1-RV64-NEXT: vsub.vx v9, v8, a1
	; LMULMAX1-RV64-NEXT: vxor.vi v8, v8, -1			; LMULMAX1-RV64-NEXT: vxor.vi v8, v8, -1
	; LMULMAX1-RV64-NEXT: vand.vv v8, v8, v9			; LMULMAX1-RV64-NEXT: vand.vv v8, v8, v9
				; LMULMAX1-RV64-NEXT: lui a1, %hi(.LCPI3_0)
				; LMULMAX1-RV64-NEXT: ld a1, %lo(.LCPI3_0)(a1)
				; LMULMAX1-RV64-NEXT: lui a2, %hi(.LCPI3_1)
				; LMULMAX1-RV64-NEXT: ld a2, %lo(.LCPI3_1)(a2)
	; LMULMAX1-RV64-NEXT: vsrl.vi v9, v8, 1			; LMULMAX1-RV64-NEXT: vsrl.vi v9, v8, 1
	; LMULMAX1-RV64-NEXT: lui a1, 21845
	; LMULMAX1-RV64-NEXT: addiw a1, a1, 1365
	; LMULMAX1-RV64-NEXT: slli a1, a1, 12
	; LMULMAX1-RV64-NEXT: addi a1, a1, 1365
	; LMULMAX1-RV64-NEXT: slli a1, a1, 12
	; LMULMAX1-RV64-NEXT: addi a1, a1, 1365
	; LMULMAX1-RV64-NEXT: slli a1, a1, 12
	; LMULMAX1-RV64-NEXT: addi a1, a1, 1365
	; LMULMAX1-RV64-NEXT: vand.vx v9, v9, a1			; LMULMAX1-RV64-NEXT: vand.vx v9, v9, a1
	; LMULMAX1-RV64-NEXT: vsub.vv v8, v8, v9			; LMULMAX1-RV64-NEXT: vsub.vv v8, v8, v9
	; LMULMAX1-RV64-NEXT: lui a1, 13107			; LMULMAX1-RV64-NEXT: vand.vx v9, v8, a2
	; LMULMAX1-RV64-NEXT: addiw a1, a1, 819
	; LMULMAX1-RV64-NEXT: slli a1, a1, 12
	; LMULMAX1-RV64-NEXT: addi a1, a1, 819
	; LMULMAX1-RV64-NEXT: slli a1, a1, 12
	; LMULMAX1-RV64-NEXT: addi a1, a1, 819
	; LMULMAX1-RV64-NEXT: slli a1, a1, 12
	; LMULMAX1-RV64-NEXT: addi a1, a1, 819
	; LMULMAX1-RV64-NEXT: vand.vx v9, v8, a1
	; LMULMAX1-RV64-NEXT: vsrl.vi v8, v8, 2			; LMULMAX1-RV64-NEXT: vsrl.vi v8, v8, 2
	; LMULMAX1-RV64-NEXT: vand.vx v8, v8, a1			; LMULMAX1-RV64-NEXT: vand.vx v8, v8, a2
	; LMULMAX1-RV64-NEXT: vadd.vv v8, v9, v8			; LMULMAX1-RV64-NEXT: vadd.vv v8, v9, v8
				; LMULMAX1-RV64-NEXT: lui a1, %hi(.LCPI3_2)
				; LMULMAX1-RV64-NEXT: ld a1, %lo(.LCPI3_2)(a1)
				; LMULMAX1-RV64-NEXT: lui a2, %hi(.LCPI3_3)
				; LMULMAX1-RV64-NEXT: ld a2, %lo(.LCPI3_3)(a2)
	; LMULMAX1-RV64-NEXT: vsrl.vi v9, v8, 4			; LMULMAX1-RV64-NEXT: vsrl.vi v9, v8, 4
	; LMULMAX1-RV64-NEXT: vadd.vv v8, v8, v9			; LMULMAX1-RV64-NEXT: vadd.vv v8, v8, v9
	; LMULMAX1-RV64-NEXT: lui a1, 3855
	; LMULMAX1-RV64-NEXT: addiw a1, a1, 241
	; LMULMAX1-RV64-NEXT: slli a1, a1, 12
	; LMULMAX1-RV64-NEXT: addi a1, a1, -241
	; LMULMAX1-RV64-NEXT: slli a1, a1, 12
	; LMULMAX1-RV64-NEXT: addi a1, a1, 241
	; LMULMAX1-RV64-NEXT: slli a1, a1, 12
	; LMULMAX1-RV64-NEXT: addi a1, a1, -241
	; LMULMAX1-RV64-NEXT: vand.vx v8, v8, a1			; LMULMAX1-RV64-NEXT: vand.vx v8, v8, a1
	; LMULMAX1-RV64-NEXT: lui a1, 4112			; LMULMAX1-RV64-NEXT: vmul.vx v8, v8, a2
	; LMULMAX1-RV64-NEXT: addiw a1, a1, 257
	; LMULMAX1-RV64-NEXT: slli a1, a1, 16
	; LMULMAX1-RV64-NEXT: addi a1, a1, 257
	; LMULMAX1-RV64-NEXT: slli a1, a1, 16
	; LMULMAX1-RV64-NEXT: addi a1, a1, 257
	; LMULMAX1-RV64-NEXT: vmul.vx v8, v8, a1
	; LMULMAX1-RV64-NEXT: li a1, 56			; LMULMAX1-RV64-NEXT: li a1, 56
	; LMULMAX1-RV64-NEXT: vsrl.vx v8, v8, a1			; LMULMAX1-RV64-NEXT: vsrl.vx v8, v8, a1
	; LMULMAX1-RV64-NEXT: vse64.v v8, (a0)			; LMULMAX1-RV64-NEXT: vse64.v v8, (a0)
	; LMULMAX1-RV64-NEXT: ret			; LMULMAX1-RV64-NEXT: ret
	;			;
	; LMULMAX8-RV32-LABEL: cttz_v2i64:			; LMULMAX8-RV32-LABEL: cttz_v2i64:
	; LMULMAX8-RV32: # %bb.0:			; LMULMAX8-RV32: # %bb.0:
	; LMULMAX8-RV32-NEXT: vsetivli zero, 2, e64, m1, ta, mu			; LMULMAX8-RV32-NEXT: vsetivli zero, 2, e64, m1, ta, mu
	▲ Show 20 Lines • Show All 44 Lines • ▼ Show 20 Lines
	; LMULMAX8-RV64-LABEL: cttz_v2i64:			; LMULMAX8-RV64-LABEL: cttz_v2i64:
	; LMULMAX8-RV64: # %bb.0:			; LMULMAX8-RV64: # %bb.0:
	; LMULMAX8-RV64-NEXT: vsetivli zero, 2, e64, m1, ta, mu			; LMULMAX8-RV64-NEXT: vsetivli zero, 2, e64, m1, ta, mu
	; LMULMAX8-RV64-NEXT: vle64.v v8, (a0)			; LMULMAX8-RV64-NEXT: vle64.v v8, (a0)
	; LMULMAX8-RV64-NEXT: li a1, 1			; LMULMAX8-RV64-NEXT: li a1, 1
	; LMULMAX8-RV64-NEXT: vsub.vx v9, v8, a1			; LMULMAX8-RV64-NEXT: vsub.vx v9, v8, a1
	; LMULMAX8-RV64-NEXT: vxor.vi v8, v8, -1			; LMULMAX8-RV64-NEXT: vxor.vi v8, v8, -1
	; LMULMAX8-RV64-NEXT: vand.vv v8, v8, v9			; LMULMAX8-RV64-NEXT: vand.vv v8, v8, v9
				; LMULMAX8-RV64-NEXT: lui a1, %hi(.LCPI3_0)
				; LMULMAX8-RV64-NEXT: ld a1, %lo(.LCPI3_0)(a1)
				; LMULMAX8-RV64-NEXT: lui a2, %hi(.LCPI3_1)
				; LMULMAX8-RV64-NEXT: ld a2, %lo(.LCPI3_1)(a2)
	; LMULMAX8-RV64-NEXT: vsrl.vi v9, v8, 1			; LMULMAX8-RV64-NEXT: vsrl.vi v9, v8, 1
	; LMULMAX8-RV64-NEXT: lui a1, 21845
	; LMULMAX8-RV64-NEXT: addiw a1, a1, 1365
	; LMULMAX8-RV64-NEXT: slli a1, a1, 12
	; LMULMAX8-RV64-NEXT: addi a1, a1, 1365
	; LMULMAX8-RV64-NEXT: slli a1, a1, 12
	; LMULMAX8-RV64-NEXT: addi a1, a1, 1365
	; LMULMAX8-RV64-NEXT: slli a1, a1, 12
	; LMULMAX8-RV64-NEXT: addi a1, a1, 1365
	; LMULMAX8-RV64-NEXT: vand.vx v9, v9, a1			; LMULMAX8-RV64-NEXT: vand.vx v9, v9, a1
	; LMULMAX8-RV64-NEXT: vsub.vv v8, v8, v9			; LMULMAX8-RV64-NEXT: vsub.vv v8, v8, v9
	; LMULMAX8-RV64-NEXT: lui a1, 13107			; LMULMAX8-RV64-NEXT: vand.vx v9, v8, a2
	; LMULMAX8-RV64-NEXT: addiw a1, a1, 819
	; LMULMAX8-RV64-NEXT: slli a1, a1, 12
	; LMULMAX8-RV64-NEXT: addi a1, a1, 819
	; LMULMAX8-RV64-NEXT: slli a1, a1, 12
	; LMULMAX8-RV64-NEXT: addi a1, a1, 819
	; LMULMAX8-RV64-NEXT: slli a1, a1, 12
	; LMULMAX8-RV64-NEXT: addi a1, a1, 819
	; LMULMAX8-RV64-NEXT: vand.vx v9, v8, a1
	; LMULMAX8-RV64-NEXT: vsrl.vi v8, v8, 2			; LMULMAX8-RV64-NEXT: vsrl.vi v8, v8, 2
	; LMULMAX8-RV64-NEXT: vand.vx v8, v8, a1			; LMULMAX8-RV64-NEXT: vand.vx v8, v8, a2
	; LMULMAX8-RV64-NEXT: vadd.vv v8, v9, v8			; LMULMAX8-RV64-NEXT: vadd.vv v8, v9, v8
				; LMULMAX8-RV64-NEXT: lui a1, %hi(.LCPI3_2)
				; LMULMAX8-RV64-NEXT: ld a1, %lo(.LCPI3_2)(a1)
				; LMULMAX8-RV64-NEXT: lui a2, %hi(.LCPI3_3)
				; LMULMAX8-RV64-NEXT: ld a2, %lo(.LCPI3_3)(a2)
	; LMULMAX8-RV64-NEXT: vsrl.vi v9, v8, 4			; LMULMAX8-RV64-NEXT: vsrl.vi v9, v8, 4
	; LMULMAX8-RV64-NEXT: vadd.vv v8, v8, v9			; LMULMAX8-RV64-NEXT: vadd.vv v8, v8, v9
	; LMULMAX8-RV64-NEXT: lui a1, 3855
	; LMULMAX8-RV64-NEXT: addiw a1, a1, 241
	; LMULMAX8-RV64-NEXT: slli a1, a1, 12
	; LMULMAX8-RV64-NEXT: addi a1, a1, -241
	; LMULMAX8-RV64-NEXT: slli a1, a1, 12
	; LMULMAX8-RV64-NEXT: addi a1, a1, 241
	; LMULMAX8-RV64-NEXT: slli a1, a1, 12
	; LMULMAX8-RV64-NEXT: addi a1, a1, -241
	; LMULMAX8-RV64-NEXT: vand.vx v8, v8, a1			; LMULMAX8-RV64-NEXT: vand.vx v8, v8, a1
	; LMULMAX8-RV64-NEXT: lui a1, 4112			; LMULMAX8-RV64-NEXT: vmul.vx v8, v8, a2
	; LMULMAX8-RV64-NEXT: addiw a1, a1, 257
	; LMULMAX8-RV64-NEXT: slli a1, a1, 16
	; LMULMAX8-RV64-NEXT: addi a1, a1, 257
	; LMULMAX8-RV64-NEXT: slli a1, a1, 16
	; LMULMAX8-RV64-NEXT: addi a1, a1, 257
	; LMULMAX8-RV64-NEXT: vmul.vx v8, v8, a1
	; LMULMAX8-RV64-NEXT: li a1, 56			; LMULMAX8-RV64-NEXT: li a1, 56
	; LMULMAX8-RV64-NEXT: vsrl.vx v8, v8, a1			; LMULMAX8-RV64-NEXT: vsrl.vx v8, v8, a1
	; LMULMAX8-RV64-NEXT: vse64.v v8, (a0)			; LMULMAX8-RV64-NEXT: vse64.v v8, (a0)
	; LMULMAX8-RV64-NEXT: ret			; LMULMAX8-RV64-NEXT: ret
	%a = load <2 x i64>, <2 x i64>* %x			%a = load <2 x i64>, <2 x i64>* %x
	%b = load <2 x i64>, <2 x i64>* %y			%b = load <2 x i64>, <2 x i64>* %y
	%c = call <2 x i64> @llvm.cttz.v2i64(<2 x i64> %a, i1 false)			%c = call <2 x i64> @llvm.cttz.v2i64(<2 x i64> %a, i1 false)
	store <2 x i64> %c, <2 x i64>* %x			store <2 x i64> %c, <2 x i64>* %x
	▲ Show 20 Lines • Show All 626 Lines • ▼ Show 20 Lines
	; LMULMAX2-RV64-LABEL: cttz_v4i64:			; LMULMAX2-RV64-LABEL: cttz_v4i64:
	; LMULMAX2-RV64: # %bb.0:			; LMULMAX2-RV64: # %bb.0:
	; LMULMAX2-RV64-NEXT: vsetivli zero, 4, e64, m2, ta, mu			; LMULMAX2-RV64-NEXT: vsetivli zero, 4, e64, m2, ta, mu
	; LMULMAX2-RV64-NEXT: vle64.v v8, (a0)			; LMULMAX2-RV64-NEXT: vle64.v v8, (a0)
	; LMULMAX2-RV64-NEXT: li a1, 1			; LMULMAX2-RV64-NEXT: li a1, 1
	; LMULMAX2-RV64-NEXT: vsub.vx v10, v8, a1			; LMULMAX2-RV64-NEXT: vsub.vx v10, v8, a1
	; LMULMAX2-RV64-NEXT: vxor.vi v8, v8, -1			; LMULMAX2-RV64-NEXT: vxor.vi v8, v8, -1
	; LMULMAX2-RV64-NEXT: vand.vv v8, v8, v10			; LMULMAX2-RV64-NEXT: vand.vv v8, v8, v10
				; LMULMAX2-RV64-NEXT: lui a1, %hi(.LCPI7_0)
				; LMULMAX2-RV64-NEXT: ld a1, %lo(.LCPI7_0)(a1)
				; LMULMAX2-RV64-NEXT: lui a2, %hi(.LCPI7_1)
				; LMULMAX2-RV64-NEXT: ld a2, %lo(.LCPI7_1)(a2)
	; LMULMAX2-RV64-NEXT: vsrl.vi v10, v8, 1			; LMULMAX2-RV64-NEXT: vsrl.vi v10, v8, 1
	; LMULMAX2-RV64-NEXT: lui a1, 21845
	; LMULMAX2-RV64-NEXT: addiw a1, a1, 1365
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 1365
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 1365
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 1365
	; LMULMAX2-RV64-NEXT: vand.vx v10, v10, a1			; LMULMAX2-RV64-NEXT: vand.vx v10, v10, a1
	; LMULMAX2-RV64-NEXT: vsub.vv v8, v8, v10			; LMULMAX2-RV64-NEXT: vsub.vv v8, v8, v10
	; LMULMAX2-RV64-NEXT: lui a1, 13107			; LMULMAX2-RV64-NEXT: vand.vx v10, v8, a2
	; LMULMAX2-RV64-NEXT: addiw a1, a1, 819
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 819
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 819
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 819
	; LMULMAX2-RV64-NEXT: vand.vx v10, v8, a1
	; LMULMAX2-RV64-NEXT: vsrl.vi v8, v8, 2			; LMULMAX2-RV64-NEXT: vsrl.vi v8, v8, 2
	; LMULMAX2-RV64-NEXT: vand.vx v8, v8, a1			; LMULMAX2-RV64-NEXT: vand.vx v8, v8, a2
	; LMULMAX2-RV64-NEXT: vadd.vv v8, v10, v8			; LMULMAX2-RV64-NEXT: vadd.vv v8, v10, v8
				; LMULMAX2-RV64-NEXT: lui a1, %hi(.LCPI7_2)
				; LMULMAX2-RV64-NEXT: ld a1, %lo(.LCPI7_2)(a1)
				; LMULMAX2-RV64-NEXT: lui a2, %hi(.LCPI7_3)
				; LMULMAX2-RV64-NEXT: ld a2, %lo(.LCPI7_3)(a2)
	; LMULMAX2-RV64-NEXT: vsrl.vi v10, v8, 4			; LMULMAX2-RV64-NEXT: vsrl.vi v10, v8, 4
	; LMULMAX2-RV64-NEXT: vadd.vv v8, v8, v10			; LMULMAX2-RV64-NEXT: vadd.vv v8, v8, v10
	; LMULMAX2-RV64-NEXT: lui a1, 3855
	; LMULMAX2-RV64-NEXT: addiw a1, a1, 241
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, -241
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 241
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, -241
	; LMULMAX2-RV64-NEXT: vand.vx v8, v8, a1			; LMULMAX2-RV64-NEXT: vand.vx v8, v8, a1
	; LMULMAX2-RV64-NEXT: lui a1, 4112			; LMULMAX2-RV64-NEXT: vmul.vx v8, v8, a2
	; LMULMAX2-RV64-NEXT: addiw a1, a1, 257
	; LMULMAX2-RV64-NEXT: slli a1, a1, 16
	; LMULMAX2-RV64-NEXT: addi a1, a1, 257
	; LMULMAX2-RV64-NEXT: slli a1, a1, 16
	; LMULMAX2-RV64-NEXT: addi a1, a1, 257
	; LMULMAX2-RV64-NEXT: vmul.vx v8, v8, a1
	; LMULMAX2-RV64-NEXT: li a1, 56			; LMULMAX2-RV64-NEXT: li a1, 56
	; LMULMAX2-RV64-NEXT: vsrl.vx v8, v8, a1			; LMULMAX2-RV64-NEXT: vsrl.vx v8, v8, a1
	; LMULMAX2-RV64-NEXT: vse64.v v8, (a0)			; LMULMAX2-RV64-NEXT: vse64.v v8, (a0)
	; LMULMAX2-RV64-NEXT: ret			; LMULMAX2-RV64-NEXT: ret
	;			;
	; LMULMAX1-RV32-LABEL: cttz_v4i64:			; LMULMAX1-RV32-LABEL: cttz_v4i64:
	; LMULMAX1-RV32: # %bb.0:			; LMULMAX1-RV32: # %bb.0:
	; LMULMAX1-RV32-NEXT: vsetivli zero, 2, e64, m1, ta, mu			; LMULMAX1-RV32-NEXT: vsetivli zero, 2, e64, m1, ta, mu
	▲ Show 20 Lines • Show All 57 Lines • ▼ Show 20 Lines
	; LMULMAX1-RV32-NEXT: vsrl.vx v9, v9, a3			; LMULMAX1-RV32-NEXT: vsrl.vx v9, v9, a3
	; LMULMAX1-RV32-NEXT: vse64.v v9, (a0)			; LMULMAX1-RV32-NEXT: vse64.v v9, (a0)
	; LMULMAX1-RV32-NEXT: vse64.v v8, (a1)			; LMULMAX1-RV32-NEXT: vse64.v v8, (a1)
	; LMULMAX1-RV32-NEXT: ret			; LMULMAX1-RV32-NEXT: ret
	;			;
	; LMULMAX1-RV64-LABEL: cttz_v4i64:			; LMULMAX1-RV64-LABEL: cttz_v4i64:
	; LMULMAX1-RV64: # %bb.0:			; LMULMAX1-RV64: # %bb.0:
	; LMULMAX1-RV64-NEXT: vsetivli zero, 2, e64, m1, ta, mu			; LMULMAX1-RV64-NEXT: vsetivli zero, 2, e64, m1, ta, mu
	; LMULMAX1-RV64-NEXT: addi a7, a0, 16			; LMULMAX1-RV64-NEXT: addi a1, a0, 16
	; LMULMAX1-RV64-NEXT: vle64.v v8, (a7)			; LMULMAX1-RV64-NEXT: vle64.v v8, (a1)
	; LMULMAX1-RV64-NEXT: vle64.v v9, (a0)			; LMULMAX1-RV64-NEXT: vle64.v v9, (a0)
	; LMULMAX1-RV64-NEXT: li a6, 1			; LMULMAX1-RV64-NEXT: li a6, 1
	; LMULMAX1-RV64-NEXT: vsub.vx v10, v8, a6			; LMULMAX1-RV64-NEXT: vsub.vx v10, v8, a6
	; LMULMAX1-RV64-NEXT: vxor.vi v8, v8, -1			; LMULMAX1-RV64-NEXT: vxor.vi v8, v8, -1
	; LMULMAX1-RV64-NEXT: vand.vv v8, v8, v10			; LMULMAX1-RV64-NEXT: vand.vv v8, v8, v10
				; LMULMAX1-RV64-NEXT: lui a3, %hi(.LCPI7_0)
				; LMULMAX1-RV64-NEXT: ld a3, %lo(.LCPI7_0)(a3)
				; LMULMAX1-RV64-NEXT: lui a4, %hi(.LCPI7_1)
				; LMULMAX1-RV64-NEXT: ld a4, %lo(.LCPI7_1)(a4)
	; LMULMAX1-RV64-NEXT: vsrl.vi v10, v8, 1			; LMULMAX1-RV64-NEXT: vsrl.vi v10, v8, 1
	; LMULMAX1-RV64-NEXT: lui a3, 21845
	; LMULMAX1-RV64-NEXT: addiw a3, a3, 1365
	; LMULMAX1-RV64-NEXT: slli a3, a3, 12
	; LMULMAX1-RV64-NEXT: addi a3, a3, 1365
	; LMULMAX1-RV64-NEXT: slli a3, a3, 12
	; LMULMAX1-RV64-NEXT: addi a3, a3, 1365
	; LMULMAX1-RV64-NEXT: slli a3, a3, 12
	; LMULMAX1-RV64-NEXT: addi a3, a3, 1365
	; LMULMAX1-RV64-NEXT: vand.vx v10, v10, a3			; LMULMAX1-RV64-NEXT: vand.vx v10, v10, a3
	; LMULMAX1-RV64-NEXT: vsub.vv v8, v8, v10			; LMULMAX1-RV64-NEXT: vsub.vv v8, v8, v10
	; LMULMAX1-RV64-NEXT: lui a4, 13107
	; LMULMAX1-RV64-NEXT: addiw a4, a4, 819
	; LMULMAX1-RV64-NEXT: slli a4, a4, 12
	; LMULMAX1-RV64-NEXT: addi a4, a4, 819
	; LMULMAX1-RV64-NEXT: slli a4, a4, 12
	; LMULMAX1-RV64-NEXT: addi a4, a4, 819
	; LMULMAX1-RV64-NEXT: slli a4, a4, 12
	; LMULMAX1-RV64-NEXT: addi a4, a4, 819
	; LMULMAX1-RV64-NEXT: vand.vx v10, v8, a4			; LMULMAX1-RV64-NEXT: vand.vx v10, v8, a4
	; LMULMAX1-RV64-NEXT: vsrl.vi v8, v8, 2			; LMULMAX1-RV64-NEXT: vsrl.vi v8, v8, 2
	; LMULMAX1-RV64-NEXT: vand.vx v8, v8, a4			; LMULMAX1-RV64-NEXT: vand.vx v8, v8, a4
	; LMULMAX1-RV64-NEXT: vadd.vv v8, v10, v8			; LMULMAX1-RV64-NEXT: vadd.vv v8, v10, v8
				; LMULMAX1-RV64-NEXT: lui a5, %hi(.LCPI7_2)
				; LMULMAX1-RV64-NEXT: ld a5, %lo(.LCPI7_2)(a5)
				; LMULMAX1-RV64-NEXT: lui a2, %hi(.LCPI7_3)
				; LMULMAX1-RV64-NEXT: ld a2, %lo(.LCPI7_3)(a2)
	; LMULMAX1-RV64-NEXT: vsrl.vi v10, v8, 4			; LMULMAX1-RV64-NEXT: vsrl.vi v10, v8, 4
	; LMULMAX1-RV64-NEXT: vadd.vv v8, v8, v10			; LMULMAX1-RV64-NEXT: vadd.vv v8, v8, v10
	; LMULMAX1-RV64-NEXT: lui a5, 3855
	; LMULMAX1-RV64-NEXT: addiw a5, a5, 241
	; LMULMAX1-RV64-NEXT: slli a5, a5, 12
	; LMULMAX1-RV64-NEXT: addi a5, a5, -241
	; LMULMAX1-RV64-NEXT: slli a5, a5, 12
	; LMULMAX1-RV64-NEXT: addi a5, a5, 241
	; LMULMAX1-RV64-NEXT: slli a5, a5, 12
	; LMULMAX1-RV64-NEXT: addi a5, a5, -241
	; LMULMAX1-RV64-NEXT: vand.vx v8, v8, a5			; LMULMAX1-RV64-NEXT: vand.vx v8, v8, a5
	; LMULMAX1-RV64-NEXT: lui a2, 4112
	; LMULMAX1-RV64-NEXT: addiw a2, a2, 257
	; LMULMAX1-RV64-NEXT: slli a2, a2, 16
	; LMULMAX1-RV64-NEXT: addi a2, a2, 257
	; LMULMAX1-RV64-NEXT: slli a2, a2, 16
	; LMULMAX1-RV64-NEXT: addi a2, a2, 257
	; LMULMAX1-RV64-NEXT: vmul.vx v8, v8, a2			; LMULMAX1-RV64-NEXT: vmul.vx v8, v8, a2
	; LMULMAX1-RV64-NEXT: li a1, 56			; LMULMAX1-RV64-NEXT: li a7, 56
	; LMULMAX1-RV64-NEXT: vsrl.vx v8, v8, a1			; LMULMAX1-RV64-NEXT: vsrl.vx v8, v8, a7
	; LMULMAX1-RV64-NEXT: vsub.vx v10, v9, a6			; LMULMAX1-RV64-NEXT: vsub.vx v10, v9, a6
	; LMULMAX1-RV64-NEXT: vxor.vi v9, v9, -1			; LMULMAX1-RV64-NEXT: vxor.vi v9, v9, -1
	; LMULMAX1-RV64-NEXT: vand.vv v9, v9, v10			; LMULMAX1-RV64-NEXT: vand.vv v9, v9, v10
	; LMULMAX1-RV64-NEXT: vsrl.vi v10, v9, 1			; LMULMAX1-RV64-NEXT: vsrl.vi v10, v9, 1
	; LMULMAX1-RV64-NEXT: vand.vx v10, v10, a3			; LMULMAX1-RV64-NEXT: vand.vx v10, v10, a3
	; LMULMAX1-RV64-NEXT: vsub.vv v9, v9, v10			; LMULMAX1-RV64-NEXT: vsub.vv v9, v9, v10
	; LMULMAX1-RV64-NEXT: vand.vx v10, v9, a4			; LMULMAX1-RV64-NEXT: vand.vx v10, v9, a4
	; LMULMAX1-RV64-NEXT: vsrl.vi v9, v9, 2			; LMULMAX1-RV64-NEXT: vsrl.vi v9, v9, 2
	; LMULMAX1-RV64-NEXT: vand.vx v9, v9, a4			; LMULMAX1-RV64-NEXT: vand.vx v9, v9, a4
	; LMULMAX1-RV64-NEXT: vadd.vv v9, v10, v9			; LMULMAX1-RV64-NEXT: vadd.vv v9, v10, v9
	; LMULMAX1-RV64-NEXT: vsrl.vi v10, v9, 4			; LMULMAX1-RV64-NEXT: vsrl.vi v10, v9, 4
	; LMULMAX1-RV64-NEXT: vadd.vv v9, v9, v10			; LMULMAX1-RV64-NEXT: vadd.vv v9, v9, v10
	; LMULMAX1-RV64-NEXT: vand.vx v9, v9, a5			; LMULMAX1-RV64-NEXT: vand.vx v9, v9, a5
	; LMULMAX1-RV64-NEXT: vmul.vx v9, v9, a2			; LMULMAX1-RV64-NEXT: vmul.vx v9, v9, a2
	; LMULMAX1-RV64-NEXT: vsrl.vx v9, v9, a1			; LMULMAX1-RV64-NEXT: vsrl.vx v9, v9, a7
	; LMULMAX1-RV64-NEXT: vse64.v v9, (a0)			; LMULMAX1-RV64-NEXT: vse64.v v9, (a0)
	; LMULMAX1-RV64-NEXT: vse64.v v8, (a7)			; LMULMAX1-RV64-NEXT: vse64.v v8, (a1)
	; LMULMAX1-RV64-NEXT: ret			; LMULMAX1-RV64-NEXT: ret
	;			;
	; LMULMAX8-RV32-LABEL: cttz_v4i64:			; LMULMAX8-RV32-LABEL: cttz_v4i64:
	; LMULMAX8-RV32: # %bb.0:			; LMULMAX8-RV32: # %bb.0:
	; LMULMAX8-RV32-NEXT: vsetivli zero, 4, e64, m2, ta, mu			; LMULMAX8-RV32-NEXT: vsetivli zero, 4, e64, m2, ta, mu
	; LMULMAX8-RV32-NEXT: vle64.v v8, (a0)			; LMULMAX8-RV32-NEXT: vle64.v v8, (a0)
	; LMULMAX8-RV32-NEXT: li a1, 1			; LMULMAX8-RV32-NEXT: li a1, 1
	; LMULMAX8-RV32-NEXT: vsub.vx v10, v8, a1			; LMULMAX8-RV32-NEXT: vsub.vx v10, v8, a1
	▲ Show 20 Lines • Show All 41 Lines • ▼ Show 20 Lines
	; LMULMAX8-RV64-LABEL: cttz_v4i64:			; LMULMAX8-RV64-LABEL: cttz_v4i64:
	; LMULMAX8-RV64: # %bb.0:			; LMULMAX8-RV64: # %bb.0:
	; LMULMAX8-RV64-NEXT: vsetivli zero, 4, e64, m2, ta, mu			; LMULMAX8-RV64-NEXT: vsetivli zero, 4, e64, m2, ta, mu
	; LMULMAX8-RV64-NEXT: vle64.v v8, (a0)			; LMULMAX8-RV64-NEXT: vle64.v v8, (a0)
	; LMULMAX8-RV64-NEXT: li a1, 1			; LMULMAX8-RV64-NEXT: li a1, 1
	; LMULMAX8-RV64-NEXT: vsub.vx v10, v8, a1			; LMULMAX8-RV64-NEXT: vsub.vx v10, v8, a1
	; LMULMAX8-RV64-NEXT: vxor.vi v8, v8, -1			; LMULMAX8-RV64-NEXT: vxor.vi v8, v8, -1
	; LMULMAX8-RV64-NEXT: vand.vv v8, v8, v10			; LMULMAX8-RV64-NEXT: vand.vv v8, v8, v10
				; LMULMAX8-RV64-NEXT: lui a1, %hi(.LCPI7_0)
				; LMULMAX8-RV64-NEXT: ld a1, %lo(.LCPI7_0)(a1)
				; LMULMAX8-RV64-NEXT: lui a2, %hi(.LCPI7_1)
				; LMULMAX8-RV64-NEXT: ld a2, %lo(.LCPI7_1)(a2)
	; LMULMAX8-RV64-NEXT: vsrl.vi v10, v8, 1			; LMULMAX8-RV64-NEXT: vsrl.vi v10, v8, 1
	; LMULMAX8-RV64-NEXT: lui a1, 21845
	; LMULMAX8-RV64-NEXT: addiw a1, a1, 1365
	; LMULMAX8-RV64-NEXT: slli a1, a1, 12
	; LMULMAX8-RV64-NEXT: addi a1, a1, 1365
	; LMULMAX8-RV64-NEXT: slli a1, a1, 12
	; LMULMAX8-RV64-NEXT: addi a1, a1, 1365
	; LMULMAX8-RV64-NEXT: slli a1, a1, 12
	; LMULMAX8-RV64-NEXT: addi a1, a1, 1365
	; LMULMAX8-RV64-NEXT: vand.vx v10, v10, a1			; LMULMAX8-RV64-NEXT: vand.vx v10, v10, a1
	; LMULMAX8-RV64-NEXT: vsub.vv v8, v8, v10			; LMULMAX8-RV64-NEXT: vsub.vv v8, v8, v10
	; LMULMAX8-RV64-NEXT: lui a1, 13107			; LMULMAX8-RV64-NEXT: vand.vx v10, v8, a2
	; LMULMAX8-RV64-NEXT: addiw a1, a1, 819
	; LMULMAX8-RV64-NEXT: slli a1, a1, 12
	; LMULMAX8-RV64-NEXT: addi a1, a1, 819
	; LMULMAX8-RV64-NEXT: slli a1, a1, 12
	; LMULMAX8-RV64-NEXT: addi a1, a1, 819
	; LMULMAX8-RV64-NEXT: slli a1, a1, 12
	; LMULMAX8-RV64-NEXT: addi a1, a1, 819
	; LMULMAX8-RV64-NEXT: vand.vx v10, v8, a1
	; LMULMAX8-RV64-NEXT: vsrl.vi v8, v8, 2			; LMULMAX8-RV64-NEXT: vsrl.vi v8, v8, 2
	; LMULMAX8-RV64-NEXT: vand.vx v8, v8, a1			; LMULMAX8-RV64-NEXT: vand.vx v8, v8, a2
	; LMULMAX8-RV64-NEXT: vadd.vv v8, v10, v8			; LMULMAX8-RV64-NEXT: vadd.vv v8, v10, v8
				; LMULMAX8-RV64-NEXT: lui a1, %hi(.LCPI7_2)
				; LMULMAX8-RV64-NEXT: ld a1, %lo(.LCPI7_2)(a1)
				; LMULMAX8-RV64-NEXT: lui a2, %hi(.LCPI7_3)
				; LMULMAX8-RV64-NEXT: ld a2, %lo(.LCPI7_3)(a2)
	; LMULMAX8-RV64-NEXT: vsrl.vi v10, v8, 4			; LMULMAX8-RV64-NEXT: vsrl.vi v10, v8, 4
	; LMULMAX8-RV64-NEXT: vadd.vv v8, v8, v10			; LMULMAX8-RV64-NEXT: vadd.vv v8, v8, v10
	; LMULMAX8-RV64-NEXT: lui a1, 3855
	; LMULMAX8-RV64-NEXT: addiw a1, a1, 241
	; LMULMAX8-RV64-NEXT: slli a1, a1, 12
	; LMULMAX8-RV64-NEXT: addi a1, a1, -241
	; LMULMAX8-RV64-NEXT: slli a1, a1, 12
	; LMULMAX8-RV64-NEXT: addi a1, a1, 241
	; LMULMAX8-RV64-NEXT: slli a1, a1, 12
	; LMULMAX8-RV64-NEXT: addi a1, a1, -241
	; LMULMAX8-RV64-NEXT: vand.vx v8, v8, a1			; LMULMAX8-RV64-NEXT: vand.vx v8, v8, a1
	; LMULMAX8-RV64-NEXT: lui a1, 4112			; LMULMAX8-RV64-NEXT: vmul.vx v8, v8, a2
	; LMULMAX8-RV64-NEXT: addiw a1, a1, 257
	; LMULMAX8-RV64-NEXT: slli a1, a1, 16
	; LMULMAX8-RV64-NEXT: addi a1, a1, 257
	; LMULMAX8-RV64-NEXT: slli a1, a1, 16
	; LMULMAX8-RV64-NEXT: addi a1, a1, 257
	; LMULMAX8-RV64-NEXT: vmul.vx v8, v8, a1
	; LMULMAX8-RV64-NEXT: li a1, 56			; LMULMAX8-RV64-NEXT: li a1, 56
	; LMULMAX8-RV64-NEXT: vsrl.vx v8, v8, a1			; LMULMAX8-RV64-NEXT: vsrl.vx v8, v8, a1
	; LMULMAX8-RV64-NEXT: vse64.v v8, (a0)			; LMULMAX8-RV64-NEXT: vse64.v v8, (a0)
	; LMULMAX8-RV64-NEXT: ret			; LMULMAX8-RV64-NEXT: ret
	%a = load <4 x i64>, <4 x i64>* %x			%a = load <4 x i64>, <4 x i64>* %x
	%b = load <4 x i64>, <4 x i64>* %y			%b = load <4 x i64>, <4 x i64>* %y
	%c = call <4 x i64> @llvm.cttz.v4i64(<4 x i64> %a, i1 false)			%c = call <4 x i64> @llvm.cttz.v4i64(<4 x i64> %a, i1 false)
	store <4 x i64> %c, <4 x i64>* %x			store <4 x i64> %c, <4 x i64>* %x
	ret void			ret void
	}			}
	declare <4 x i64> @llvm.cttz.v4i64(<4 x i64>, i1)			declare <4 x i64> @llvm.cttz.v4i64(<4 x i64>, i1)

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-int-buildvec.ll

	Show First 20 Lines • Show All 370 Lines • ▼ Show 20 Lines
	; RV32-NEXT: addi a1, a1, %lo(.LCPI20_0)			; RV32-NEXT: addi a1, a1, %lo(.LCPI20_0)
	; RV32-NEXT: vsetivli zero, 4, e32, m1, ta, mu			; RV32-NEXT: vsetivli zero, 4, e32, m1, ta, mu
	; RV32-NEXT: vle32.v v8, (a1)			; RV32-NEXT: vle32.v v8, (a1)
	; RV32-NEXT: vse32.v v8, (a0)			; RV32-NEXT: vse32.v v8, (a0)
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: buildvec_dominant0_v2i32:			; RV64-LABEL: buildvec_dominant0_v2i32:
	; RV64: # %bb.0:			; RV64: # %bb.0:
				; RV64-NEXT: lui a1, %hi(.LCPI20_0)
				; RV64-NEXT: ld a1, %lo(.LCPI20_0)(a1)
	; RV64-NEXT: vsetivli zero, 2, e64, m1, ta, mu			; RV64-NEXT: vsetivli zero, 2, e64, m1, ta, mu
	; RV64-NEXT: vmv.v.i v8, -1			; RV64-NEXT: vmv.v.i v8, -1
	; RV64-NEXT: lui a1, 3641
	; RV64-NEXT: addiw a1, a1, -455
	; RV64-NEXT: slli a1, a1, 12
	; RV64-NEXT: addi a1, a1, -455
	; RV64-NEXT: slli a1, a1, 12
	; RV64-NEXT: addi a1, a1, -455
	; RV64-NEXT: slli a1, a1, 13
	; RV64-NEXT: addi a1, a1, -910
	; RV64-NEXT: vsetvli zero, zero, e64, m1, tu, mu			; RV64-NEXT: vsetvli zero, zero, e64, m1, tu, mu
	; RV64-NEXT: vmv.s.x v8, a1			; RV64-NEXT: vmv.s.x v8, a1
	; RV64-NEXT: vse64.v v8, (a0)			; RV64-NEXT: vse64.v v8, (a0)
	; RV64-NEXT: ret			; RV64-NEXT: ret
	store <2 x i64> <i64 2049638230412172402, i64 -1>, <2 x i64>* %x			store <2 x i64> <i64 2049638230412172402, i64 -1>, <2 x i64>* %x
	ret void			ret void
	}			}

	▲ Show 20 Lines • Show All 63 Lines • ▼ Show 20 Lines
	; RV32-NEXT: addi a1, a1, %lo(.LCPI24_0)			; RV32-NEXT: addi a1, a1, %lo(.LCPI24_0)
	; RV32-NEXT: vsetivli zero, 16, e8, m1, ta, mu			; RV32-NEXT: vsetivli zero, 16, e8, m1, ta, mu
	; RV32-NEXT: vle8.v v8, (a1)			; RV32-NEXT: vle8.v v8, (a1)
	; RV32-NEXT: vse8.v v8, (a0)			; RV32-NEXT: vse8.v v8, (a0)
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: buildvec_seq_v16i8_v2i64:			; RV64-LABEL: buildvec_seq_v16i8_v2i64:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: lui a1, 32880			; RV64-NEXT: lui a1, %hi(.LCPI24_0)
	; RV64-NEXT: addiw a1, a1, 1541			; RV64-NEXT: ld a1, %lo(.LCPI24_0)(a1)
	; RV64-NEXT: slli a1, a1, 16
	; RV64-NEXT: addi a1, a1, 1027
	; RV64-NEXT: slli a1, a1, 16
	; RV64-NEXT: addi a1, a1, 513
	; RV64-NEXT: vsetivli zero, 2, e64, m1, ta, mu			; RV64-NEXT: vsetivli zero, 2, e64, m1, ta, mu
	; RV64-NEXT: vmv.v.x v8, a1			; RV64-NEXT: vmv.v.x v8, a1
	; RV64-NEXT: vsetivli zero, 16, e8, m1, ta, mu			; RV64-NEXT: vsetivli zero, 16, e8, m1, ta, mu
	; RV64-NEXT: vse8.v v8, (a0)			; RV64-NEXT: vse8.v v8, (a0)
	; RV64-NEXT: ret			; RV64-NEXT: ret
	store <16 x i8> <i8 1, i8 2, i8 3, i8 4, i8 5, i8 6, i8 7, i8 8, i8 1, i8 2, i8 3, i8 4, i8 5, i8 6, i8 7, i8 8>, <16 x i8>* %x			store <16 x i8> <i8 1, i8 2, i8 3, i8 4, i8 5, i8 6, i8 7, i8 8, i8 1, i8 2, i8 3, i8 4, i8 5, i8 6, i8 7, i8 8>, <16 x i8>* %x
	ret void			ret void
	}			}
	Show All 37 Lines
	; RV32-NEXT: vmerge.vim v9, v9, 1, v0			; RV32-NEXT: vmerge.vim v9, v9, 1, v0
	; RV32-NEXT: vmv1r.v v0, v8			; RV32-NEXT: vmv1r.v v0, v8
	; RV32-NEXT: vmerge.vim v8, v9, 3, v0			; RV32-NEXT: vmerge.vim v8, v9, 3, v0
	; RV32-NEXT: vse8.v v8, (a0)			; RV32-NEXT: vse8.v v8, (a0)
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: buildvec_seq_v9i8:			; RV64-LABEL: buildvec_seq_v9i8:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: li a1, 3			; RV64-NEXT: lui a1, %hi(.LCPI26_0)
	; RV64-NEXT: sb a1, 8(a0)			; RV64-NEXT: ld a1, %lo(.LCPI26_0)(a1)
	; RV64-NEXT: lui a1, 4104			; RV64-NEXT: li a2, 3
	; RV64-NEXT: addiw a1, a1, 385			; RV64-NEXT: sb a2, 8(a0)
	; RV64-NEXT: slli a1, a1, 17
	; RV64-NEXT: addi a1, a1, 259
	; RV64-NEXT: slli a1, a1, 16
	; RV64-NEXT: addi a1, a1, 513
	; RV64-NEXT: sd a1, 0(a0)			; RV64-NEXT: sd a1, 0(a0)
	; RV64-NEXT: ret			; RV64-NEXT: ret
	store <9 x i8> <i8 1, i8 2, i8 3, i8 1, i8 2, i8 3, i8 1, i8 2, i8 3>, <9 x i8>* %x			store <9 x i8> <i8 1, i8 2, i8 3, i8 1, i8 2, i8 3, i8 1, i8 2, i8 3>, <9 x i8>* %x
	ret void			ret void
	}			}

	define void @buildvec_seq_v4i16_v2i32(<4 x i16>* %x) {			define void @buildvec_seq_v4i16_v2i32(<4 x i16>* %x) {
	; CHECK-LABEL: buildvec_seq_v4i16_v2i32:			; CHECK-LABEL: buildvec_seq_v4i16_v2i32:
	▲ Show 20 Lines • Show All 122 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-int.ll

This file is larger than 256 KB, so syntax highlighting is disabled by default.

	Show First 20 Lines • Show All 1,026 Lines • ▼ Show 20 Lines
	; RV32-NEXT: vle32.v v9, (a1)			; RV32-NEXT: vle32.v v9, (a1)
	; RV32-NEXT: vsetivli zero, 2, e64, m1, ta, mu			; RV32-NEXT: vsetivli zero, 2, e64, m1, ta, mu
	; RV32-NEXT: vsrl.vv v8, v8, v9			; RV32-NEXT: vsrl.vv v8, v8, v9
	; RV32-NEXT: vse64.v v8, (a0)			; RV32-NEXT: vse64.v v8, (a0)
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: mulhu_v2i64:			; RV64-LABEL: mulhu_v2i64:
	; RV64: # %bb.0:			; RV64: # %bb.0:
				; RV64-NEXT: lui a1, %hi(.LCPI55_0)
				; RV64-NEXT: ld a1, %lo(.LCPI55_0)(a1)
	; RV64-NEXT: vsetivli zero, 2, e64, m1, ta, mu			; RV64-NEXT: vsetivli zero, 2, e64, m1, ta, mu
	; RV64-NEXT: vle64.v v8, (a0)			; RV64-NEXT: lui a2, %hi(.LCPI55_1)
	; RV64-NEXT: lui a1, 1035469			; RV64-NEXT: ld a2, %lo(.LCPI55_1)(a2)
	; RV64-NEXT: addiw a1, a1, -819			; RV64-NEXT: vmv.v.x v8, a1
	; RV64-NEXT: slli a1, a1, 12			; RV64-NEXT: vle64.v v9, (a0)
	; RV64-NEXT: addi a1, a1, -819
	; RV64-NEXT: slli a1, a1, 12
	; RV64-NEXT: addi a1, a1, -819
	; RV64-NEXT: slli a1, a1, 12
	; RV64-NEXT: addi a1, a1, -819
	; RV64-NEXT: vmv.v.x v9, a1
	; RV64-NEXT: lui a1, 1026731
	; RV64-NEXT: addiw a1, a1, -1365
	; RV64-NEXT: slli a1, a1, 12
	; RV64-NEXT: addi a1, a1, -1365
	; RV64-NEXT: slli a1, a1, 12
	; RV64-NEXT: addi a1, a1, -1365
	; RV64-NEXT: slli a1, a1, 12
	; RV64-NEXT: addi a1, a1, -1365
	; RV64-NEXT: vsetvli zero, zero, e64, m1, tu, mu			; RV64-NEXT: vsetvli zero, zero, e64, m1, tu, mu
	; RV64-NEXT: vmv.s.x v9, a1			; RV64-NEXT: vmv.s.x v8, a2
	; RV64-NEXT: vsetvli zero, zero, e64, m1, ta, mu			; RV64-NEXT: vsetvli zero, zero, e64, m1, ta, mu
	; RV64-NEXT: vmulhu.vv v8, v8, v9			; RV64-NEXT: vmulhu.vv v8, v9, v8
	; RV64-NEXT: vid.v v9			; RV64-NEXT: vid.v v9
	; RV64-NEXT: vadd.vi v9, v9, 1			; RV64-NEXT: vadd.vi v9, v9, 1
	; RV64-NEXT: vsrl.vv v8, v8, v9			; RV64-NEXT: vsrl.vv v8, v8, v9
	; RV64-NEXT: vse64.v v8, (a0)			; RV64-NEXT: vse64.v v8, (a0)
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%a = load <2 x i64>, <2 x i64>* %x			%a = load <2 x i64>, <2 x i64>* %x
	%b = udiv <2 x i64> %a, <i64 3, i64 5>			%b = udiv <2 x i64> %a, <i64 3, i64 5>
	store <2 x i64> %b, <2 x i64>* %x			store <2 x i64> %b, <2 x i64>* %x
	▲ Show 20 Lines • Show All 113 Lines • ▼ Show 20 Lines
	; RV32-NEXT: vsrl.vi v9, v8, 31			; RV32-NEXT: vsrl.vi v9, v8, 31
	; RV32-NEXT: vsra.vi v8, v8, 1			; RV32-NEXT: vsra.vi v8, v8, 1
	; RV32-NEXT: vadd.vv v8, v8, v9			; RV32-NEXT: vadd.vv v8, v8, v9
	; RV32-NEXT: vse32.v v8, (a0)			; RV32-NEXT: vse32.v v8, (a0)
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: mulhs_v4i32:			; RV64-LABEL: mulhs_v4i32:
	; RV64: # %bb.0:			; RV64: # %bb.0:
				; RV64-NEXT: lui a1, %hi(.LCPI58_0)
				; RV64-NEXT: ld a1, %lo(.LCPI58_0)(a1)
	; RV64-NEXT: vsetivli zero, 4, e32, m1, ta, mu			; RV64-NEXT: vsetivli zero, 4, e32, m1, ta, mu
	; RV64-NEXT: vle32.v v8, (a0)			; RV64-NEXT: vle32.v v8, (a0)
	; RV64-NEXT: lui a1, 13107
	; RV64-NEXT: addiw a1, a1, 819
	; RV64-NEXT: slli a1, a1, 12
	; RV64-NEXT: addi a1, a1, 973
	; RV64-NEXT: slli a1, a1, 12
	; RV64-NEXT: addi a1, a1, -819
	; RV64-NEXT: slli a1, a1, 13
	; RV64-NEXT: addi a1, a1, -1639
	; RV64-NEXT: vsetivli zero, 2, e64, m1, ta, mu			; RV64-NEXT: vsetivli zero, 2, e64, m1, ta, mu
	; RV64-NEXT: vmv.v.x v9, a1			; RV64-NEXT: vmv.v.x v9, a1
	; RV64-NEXT: vsetivli zero, 4, e32, m1, ta, mu			; RV64-NEXT: vsetivli zero, 4, e32, m1, ta, mu
	; RV64-NEXT: vmulh.vv v8, v8, v9			; RV64-NEXT: vmulh.vv v8, v8, v9
	; RV64-NEXT: vsra.vi v8, v8, 1			; RV64-NEXT: vsra.vi v8, v8, 1
	; RV64-NEXT: vsrl.vi v9, v8, 31			; RV64-NEXT: vsrl.vi v9, v8, 31
	; RV64-NEXT: vadd.vv v8, v8, v9			; RV64-NEXT: vadd.vv v8, v8, v9
	; RV64-NEXT: vse32.v v8, (a0)			; RV64-NEXT: vse32.v v8, (a0)
	Show All 35 Lines
	; RV32-NEXT: li a1, 63			; RV32-NEXT: li a1, 63
	; RV32-NEXT: vsrl.vx v9, v10, a1			; RV32-NEXT: vsrl.vx v9, v10, a1
	; RV32-NEXT: vadd.vv v8, v8, v9			; RV32-NEXT: vadd.vv v8, v8, v9
	; RV32-NEXT: vse64.v v8, (a0)			; RV32-NEXT: vse64.v v8, (a0)
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: mulhs_v2i64:			; RV64-LABEL: mulhs_v2i64:
	; RV64: # %bb.0:			; RV64: # %bb.0:
				; RV64-NEXT: lui a1, %hi(.LCPI59_0)
				; RV64-NEXT: ld a1, %lo(.LCPI59_0)(a1)
	; RV64-NEXT: vsetivli zero, 2, e64, m1, ta, mu			; RV64-NEXT: vsetivli zero, 2, e64, m1, ta, mu
	; RV64-NEXT: vle64.v v8, (a0)			; RV64-NEXT: lui a2, %hi(.LCPI59_1)
	; RV64-NEXT: lui a1, 21845			; RV64-NEXT: ld a2, %lo(.LCPI59_1)(a2)
	; RV64-NEXT: addiw a1, a1, 1365			; RV64-NEXT: vmv.v.x v8, a1
	; RV64-NEXT: slli a1, a1, 12			; RV64-NEXT: vle64.v v9, (a0)
	; RV64-NEXT: addi a1, a1, 1365
	; RV64-NEXT: slli a1, a1, 12
	; RV64-NEXT: addi a1, a1, 1365
	; RV64-NEXT: slli a1, a1, 12
	; RV64-NEXT: addi a2, a1, 1365
	; RV64-NEXT: vmv.v.x v9, a2
	; RV64-NEXT: addi a1, a1, 1366
	; RV64-NEXT: vsetvli zero, zero, e64, m1, tu, mu			; RV64-NEXT: vsetvli zero, zero, e64, m1, tu, mu
	; RV64-NEXT: vmv.s.x v9, a1			; RV64-NEXT: vmv.s.x v8, a2
	; RV64-NEXT: vsetvli zero, zero, e64, m1, ta, mu			; RV64-NEXT: vsetvli zero, zero, e64, m1, ta, mu
	; RV64-NEXT: vmulh.vv v9, v8, v9			; RV64-NEXT: vmulh.vv v8, v9, v8
	; RV64-NEXT: vid.v v10			; RV64-NEXT: vid.v v10
	; RV64-NEXT: vrsub.vi v11, v10, 0			; RV64-NEXT: vrsub.vi v11, v10, 0
	; RV64-NEXT: vmadd.vv v11, v8, v9			; RV64-NEXT: vmadd.vv v11, v9, v8
	; RV64-NEXT: li a1, 63			; RV64-NEXT: li a1, 63
	; RV64-NEXT: vsrl.vx v8, v11, a1			; RV64-NEXT: vsrl.vx v8, v11, a1
	; RV64-NEXT: vsra.vv v9, v11, v10			; RV64-NEXT: vsra.vv v9, v11, v10
	; RV64-NEXT: vadd.vv v8, v9, v8			; RV64-NEXT: vadd.vv v8, v9, v8
	; RV64-NEXT: vse64.v v8, (a0)			; RV64-NEXT: vse64.v v8, (a0)
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%a = load <2 x i64>, <2 x i64>* %x			%a = load <2 x i64>, <2 x i64>* %x
	%b = sdiv <2 x i64> %a, <i64 3, i64 -3>			%b = sdiv <2 x i64> %a, <i64 3, i64 -3>
	▲ Show 20 Lines • Show All 3,086 Lines • ▼ Show 20 Lines
	; LMULMAX1-RV64-NEXT: vle64.v v8, (a0)			; LMULMAX1-RV64-NEXT: vle64.v v8, (a0)
	; LMULMAX1-RV64-NEXT: addi a1, a0, 16			; LMULMAX1-RV64-NEXT: addi a1, a0, 16
	; LMULMAX1-RV64-NEXT: vle64.v v9, (a1)			; LMULMAX1-RV64-NEXT: vle64.v v9, (a1)
	; LMULMAX1-RV64-NEXT: vmv.v.i v10, 0			; LMULMAX1-RV64-NEXT: vmv.v.i v10, 0
	; LMULMAX1-RV64-NEXT: li a2, -1			; LMULMAX1-RV64-NEXT: li a2, -1
	; LMULMAX1-RV64-NEXT: slli a2, a2, 63			; LMULMAX1-RV64-NEXT: slli a2, a2, 63
	; LMULMAX1-RV64-NEXT: vsetvli zero, zero, e64, m1, tu, mu			; LMULMAX1-RV64-NEXT: vsetvli zero, zero, e64, m1, tu, mu
	; LMULMAX1-RV64-NEXT: vmv.s.x v10, a2			; LMULMAX1-RV64-NEXT: vmv.s.x v10, a2
	; LMULMAX1-RV64-NEXT: lui a2, 1044935			; LMULMAX1-RV64-NEXT: lui a2, %hi(.LCPI132_0)
	; LMULMAX1-RV64-NEXT: addiw a2, a2, 455			; LMULMAX1-RV64-NEXT: ld a2, %lo(.LCPI132_0)(a2)
	; LMULMAX1-RV64-NEXT: slli a2, a2, 12			; LMULMAX1-RV64-NEXT: lui a3, %hi(.LCPI132_1)
	; LMULMAX1-RV64-NEXT: addi a2, a2, 455			; LMULMAX1-RV64-NEXT: ld a3, %lo(.LCPI132_1)(a3)
	; LMULMAX1-RV64-NEXT: slli a2, a2, 12
	; LMULMAX1-RV64-NEXT: addi a2, a2, 455
	; LMULMAX1-RV64-NEXT: slli a2, a2, 13
	; LMULMAX1-RV64-NEXT: addi a2, a2, 911
	; LMULMAX1-RV64-NEXT: vsetvli zero, zero, e64, m1, ta, mu			; LMULMAX1-RV64-NEXT: vsetvli zero, zero, e64, m1, ta, mu
	; LMULMAX1-RV64-NEXT: vmv.v.x v11, a2			; LMULMAX1-RV64-NEXT: vmv.v.x v11, a2
	; LMULMAX1-RV64-NEXT: lui a2, 4681
	; LMULMAX1-RV64-NEXT: addiw a2, a2, 585
	; LMULMAX1-RV64-NEXT: slli a2, a2, 12
	; LMULMAX1-RV64-NEXT: addi a2, a2, 585
	; LMULMAX1-RV64-NEXT: slli a2, a2, 12
	; LMULMAX1-RV64-NEXT: addi a2, a2, 585
	; LMULMAX1-RV64-NEXT: slli a2, a2, 13
	; LMULMAX1-RV64-NEXT: addi a2, a2, 1171
	; LMULMAX1-RV64-NEXT: vsetvli zero, zero, e64, m1, tu, mu			; LMULMAX1-RV64-NEXT: vsetvli zero, zero, e64, m1, tu, mu
	; LMULMAX1-RV64-NEXT: vmv.s.x v11, a2			; LMULMAX1-RV64-NEXT: vmv.s.x v11, a3
	; LMULMAX1-RV64-NEXT: vsetvli zero, zero, e64, m1, ta, mu			; LMULMAX1-RV64-NEXT: vsetvli zero, zero, e64, m1, ta, mu
	; LMULMAX1-RV64-NEXT: vmulhu.vv v11, v9, v11			; LMULMAX1-RV64-NEXT: vmulhu.vv v11, v9, v11
	; LMULMAX1-RV64-NEXT: vsub.vv v9, v9, v11			; LMULMAX1-RV64-NEXT: vsub.vv v9, v9, v11
				; LMULMAX1-RV64-NEXT: lui a2, %hi(.LCPI132_2)
				; LMULMAX1-RV64-NEXT: ld a2, %lo(.LCPI132_2)(a2)
	; LMULMAX1-RV64-NEXT: vmulhu.vv v9, v9, v10			; LMULMAX1-RV64-NEXT: vmulhu.vv v9, v9, v10
	; LMULMAX1-RV64-NEXT: vadd.vv v9, v9, v11			; LMULMAX1-RV64-NEXT: vadd.vv v9, v9, v11
	; LMULMAX1-RV64-NEXT: vid.v v10			; LMULMAX1-RV64-NEXT: vid.v v10
	; LMULMAX1-RV64-NEXT: vadd.vi v11, v10, 2
	; LMULMAX1-RV64-NEXT: vsrl.vv v9, v9, v11
	; LMULMAX1-RV64-NEXT: lui a2, 1035469
	; LMULMAX1-RV64-NEXT: addiw a2, a2, -819
	; LMULMAX1-RV64-NEXT: slli a2, a2, 12
	; LMULMAX1-RV64-NEXT: addi a2, a2, -819
	; LMULMAX1-RV64-NEXT: slli a2, a2, 12
	; LMULMAX1-RV64-NEXT: addi a2, a2, -819
	; LMULMAX1-RV64-NEXT: slli a2, a2, 12
	; LMULMAX1-RV64-NEXT: addi a2, a2, -819
	; LMULMAX1-RV64-NEXT: vmv.v.x v11, a2			; LMULMAX1-RV64-NEXT: vmv.v.x v11, a2
	; LMULMAX1-RV64-NEXT: lui a2, 1026731			; LMULMAX1-RV64-NEXT: lui a2, %hi(.LCPI132_3)
	; LMULMAX1-RV64-NEXT: addiw a2, a2, -1365			; LMULMAX1-RV64-NEXT: ld a2, %lo(.LCPI132_3)(a2)
	; LMULMAX1-RV64-NEXT: slli a2, a2, 12			; LMULMAX1-RV64-NEXT: vadd.vi v12, v10, 2
	; LMULMAX1-RV64-NEXT: addi a2, a2, -1365			; LMULMAX1-RV64-NEXT: vsrl.vv v9, v9, v12
	; LMULMAX1-RV64-NEXT: slli a2, a2, 12
	; LMULMAX1-RV64-NEXT: addi a2, a2, -1365
	; LMULMAX1-RV64-NEXT: slli a2, a2, 12
	; LMULMAX1-RV64-NEXT: addi a2, a2, -1365
	; LMULMAX1-RV64-NEXT: vsetvli zero, zero, e64, m1, tu, mu			; LMULMAX1-RV64-NEXT: vsetvli zero, zero, e64, m1, tu, mu
	; LMULMAX1-RV64-NEXT: vmv.s.x v11, a2			; LMULMAX1-RV64-NEXT: vmv.s.x v11, a2
	; LMULMAX1-RV64-NEXT: vsetvli zero, zero, e64, m1, ta, mu			; LMULMAX1-RV64-NEXT: vsetvli zero, zero, e64, m1, ta, mu
	; LMULMAX1-RV64-NEXT: vmulhu.vv v8, v8, v11			; LMULMAX1-RV64-NEXT: vmulhu.vv v8, v8, v11
	; LMULMAX1-RV64-NEXT: vadd.vi v10, v10, 1			; LMULMAX1-RV64-NEXT: vadd.vi v10, v10, 1
	; LMULMAX1-RV64-NEXT: vsrl.vv v8, v8, v10			; LMULMAX1-RV64-NEXT: vsrl.vv v8, v8, v10
	; LMULMAX1-RV64-NEXT: vse64.v v8, (a0)			; LMULMAX1-RV64-NEXT: vse64.v v8, (a0)
	; LMULMAX1-RV64-NEXT: vse64.v v9, (a1)			; LMULMAX1-RV64-NEXT: vse64.v v9, (a1)
	▲ Show 20 Lines • Show All 173 Lines • ▼ Show 20 Lines
	; LMULMAX2-RV32-NEXT: vsrl.vi v10, v8, 31			; LMULMAX2-RV32-NEXT: vsrl.vi v10, v8, 31
	; LMULMAX2-RV32-NEXT: vsra.vi v8, v8, 1			; LMULMAX2-RV32-NEXT: vsra.vi v8, v8, 1
	; LMULMAX2-RV32-NEXT: vadd.vv v8, v8, v10			; LMULMAX2-RV32-NEXT: vadd.vv v8, v8, v10
	; LMULMAX2-RV32-NEXT: vse32.v v8, (a0)			; LMULMAX2-RV32-NEXT: vse32.v v8, (a0)
	; LMULMAX2-RV32-NEXT: ret			; LMULMAX2-RV32-NEXT: ret
	;			;
	; LMULMAX2-RV64-LABEL: mulhs_v8i32:			; LMULMAX2-RV64-LABEL: mulhs_v8i32:
	; LMULMAX2-RV64: # %bb.0:			; LMULMAX2-RV64: # %bb.0:
				; LMULMAX2-RV64-NEXT: lui a1, %hi(.LCPI135_0)
				; LMULMAX2-RV64-NEXT: ld a1, %lo(.LCPI135_0)(a1)
	; LMULMAX2-RV64-NEXT: vsetivli zero, 8, e32, m2, ta, mu			; LMULMAX2-RV64-NEXT: vsetivli zero, 8, e32, m2, ta, mu
	; LMULMAX2-RV64-NEXT: vle32.v v8, (a0)			; LMULMAX2-RV64-NEXT: vle32.v v8, (a0)
	; LMULMAX2-RV64-NEXT: lui a1, 13107
	; LMULMAX2-RV64-NEXT: addiw a1, a1, 819
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, 973
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a1, a1, -819
	; LMULMAX2-RV64-NEXT: slli a1, a1, 13
	; LMULMAX2-RV64-NEXT: addi a1, a1, -1639
	; LMULMAX2-RV64-NEXT: vsetivli zero, 4, e64, m2, ta, mu			; LMULMAX2-RV64-NEXT: vsetivli zero, 4, e64, m2, ta, mu
	; LMULMAX2-RV64-NEXT: vmv.v.x v10, a1			; LMULMAX2-RV64-NEXT: vmv.v.x v10, a1
	; LMULMAX2-RV64-NEXT: vsetivli zero, 8, e32, m2, ta, mu			; LMULMAX2-RV64-NEXT: vsetivli zero, 8, e32, m2, ta, mu
	; LMULMAX2-RV64-NEXT: vmulh.vv v8, v8, v10			; LMULMAX2-RV64-NEXT: vmulh.vv v8, v8, v10
	; LMULMAX2-RV64-NEXT: vsra.vi v8, v8, 1			; LMULMAX2-RV64-NEXT: vsra.vi v8, v8, 1
	; LMULMAX2-RV64-NEXT: vsrl.vi v10, v8, 31			; LMULMAX2-RV64-NEXT: vsrl.vi v10, v8, 31
	; LMULMAX2-RV64-NEXT: vadd.vv v8, v8, v10			; LMULMAX2-RV64-NEXT: vadd.vv v8, v8, v10
	; LMULMAX2-RV64-NEXT: vse32.v v8, (a0)			; LMULMAX2-RV64-NEXT: vse32.v v8, (a0)
	▲ Show 20 Lines • Show All 90 Lines • ▼ Show 20 Lines
	;			;
	; LMULMAX2-RV64-LABEL: mulhs_v4i64:			; LMULMAX2-RV64-LABEL: mulhs_v4i64:
	; LMULMAX2-RV64: # %bb.0:			; LMULMAX2-RV64: # %bb.0:
	; LMULMAX2-RV64-NEXT: vsetivli zero, 4, e64, m2, ta, mu			; LMULMAX2-RV64-NEXT: vsetivli zero, 4, e64, m2, ta, mu
	; LMULMAX2-RV64-NEXT: vle64.v v8, (a0)			; LMULMAX2-RV64-NEXT: vle64.v v8, (a0)
	; LMULMAX2-RV64-NEXT: li a1, 5			; LMULMAX2-RV64-NEXT: li a1, 5
	; LMULMAX2-RV64-NEXT: vsetivli zero, 1, e8, mf8, ta, mu			; LMULMAX2-RV64-NEXT: vsetivli zero, 1, e8, mf8, ta, mu
	; LMULMAX2-RV64-NEXT: vmv.s.x v0, a1			; LMULMAX2-RV64-NEXT: vmv.s.x v0, a1
				; LMULMAX2-RV64-NEXT: lui a1, %hi(.LCPI136_0)
				; LMULMAX2-RV64-NEXT: ld a1, %lo(.LCPI136_0)(a1)
	; LMULMAX2-RV64-NEXT: vsetivli zero, 4, e64, m2, ta, mu			; LMULMAX2-RV64-NEXT: vsetivli zero, 4, e64, m2, ta, mu
	; LMULMAX2-RV64-NEXT: vmv.v.i v10, -1			; LMULMAX2-RV64-NEXT: lui a2, %hi(.LCPI136_1)
	; LMULMAX2-RV64-NEXT: vmerge.vim v10, v10, 0, v0			; LMULMAX2-RV64-NEXT: ld a2, %lo(.LCPI136_1)(a2)
	; LMULMAX2-RV64-NEXT: lui a1, 21845			; LMULMAX2-RV64-NEXT: vmv.v.x v10, a1
	; LMULMAX2-RV64-NEXT: addiw a1, a1, 1365			; LMULMAX2-RV64-NEXT: vmv.v.i v12, -1
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12			; LMULMAX2-RV64-NEXT: vmerge.vim v12, v12, 0, v0
	; LMULMAX2-RV64-NEXT: addi a1, a1, 1365			; LMULMAX2-RV64-NEXT: vmerge.vxm v10, v10, a2, v0
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12			; LMULMAX2-RV64-NEXT: vmulh.vv v10, v8, v10
	; LMULMAX2-RV64-NEXT: addi a1, a1, 1365			; LMULMAX2-RV64-NEXT: vmacc.vv v10, v8, v12
	; LMULMAX2-RV64-NEXT: slli a1, a1, 12
	; LMULMAX2-RV64-NEXT: addi a2, a1, 1365
	; LMULMAX2-RV64-NEXT: vmv.v.x v12, a2
	; LMULMAX2-RV64-NEXT: addi a1, a1, 1366
	; LMULMAX2-RV64-NEXT: vmerge.vxm v12, v12, a1, v0
	; LMULMAX2-RV64-NEXT: vmulh.vv v12, v8, v12
	; LMULMAX2-RV64-NEXT: vmacc.vv v12, v8, v10
	; LMULMAX2-RV64-NEXT: li a1, 63			; LMULMAX2-RV64-NEXT: li a1, 63
	; LMULMAX2-RV64-NEXT: vsrl.vx v8, v12, a1			; LMULMAX2-RV64-NEXT: vsrl.vx v8, v10, a1
	; LMULMAX2-RV64-NEXT: vmv.v.i v10, 1			; LMULMAX2-RV64-NEXT: vmv.v.i v12, 1
	; LMULMAX2-RV64-NEXT: vmerge.vim v10, v10, 0, v0			; LMULMAX2-RV64-NEXT: vmerge.vim v12, v12, 0, v0
	; LMULMAX2-RV64-NEXT: vsra.vv v10, v12, v10			; LMULMAX2-RV64-NEXT: vsra.vv v10, v10, v12
	; LMULMAX2-RV64-NEXT: vadd.vv v8, v10, v8			; LMULMAX2-RV64-NEXT: vadd.vv v8, v10, v8
	; LMULMAX2-RV64-NEXT: vse64.v v8, (a0)			; LMULMAX2-RV64-NEXT: vse64.v v8, (a0)
	; LMULMAX2-RV64-NEXT: ret			; LMULMAX2-RV64-NEXT: ret
	;			;
	; LMULMAX1-RV32-LABEL: mulhs_v4i64:			; LMULMAX1-RV32-LABEL: mulhs_v4i64:
	; LMULMAX1-RV32: # %bb.0:			; LMULMAX1-RV32: # %bb.0:
	; LMULMAX1-RV32-NEXT: vsetivli zero, 2, e64, m1, ta, mu			; LMULMAX1-RV32-NEXT: vsetivli zero, 2, e64, m1, ta, mu
	; LMULMAX1-RV32-NEXT: vle64.v v8, (a0)			; LMULMAX1-RV32-NEXT: vle64.v v8, (a0)
	; LMULMAX1-RV32-NEXT: addi a1, a0, 16			; LMULMAX1-RV32-NEXT: addi a1, a0, 16
	; LMULMAX1-RV32-NEXT: vle64.v v9, (a1)			; LMULMAX1-RV32-NEXT: vle64.v v9, (a1)
	; LMULMAX1-RV32-NEXT: lui a2, %hi(.LCPI136_0)			; LMULMAX1-RV32-NEXT: lui a2, %hi(.LCPI136_0)
	; LMULMAX1-RV32-NEXT: addi a2, a2, %lo(.LCPI136_0)			; LMULMAX1-RV32-NEXT: addi a2, a2, %lo(.LCPI136_0)
	; LMULMAX1-RV32-NEXT: vsetivli zero, 4, e32, m1, ta, mu			; LMULMAX1-RV32-NEXT: vsetivli zero, 4, e32, m1, ta, mu
	; LMULMAX1-RV32-NEXT: vle32.v v10, (a2)			; LMULMAX1-RV32-NEXT: vle32.v v10, (a2)
	; LMULMAX1-RV32-NEXT: vsetivli zero, 2, e64, m1, ta, mu			; LMULMAX1-RV32-NEXT: vsetivli zero, 2, e64, m1, ta, mu
	; LMULMAX1-RV32-NEXT: vdiv.vv v9, v9, v10			; LMULMAX1-RV32-NEXT: vdiv.vv v9, v9, v10
	; LMULMAX1-RV32-NEXT: vdiv.vv v8, v8, v10			; LMULMAX1-RV32-NEXT: vdiv.vv v8, v8, v10
	; LMULMAX1-RV32-NEXT: vse64.v v8, (a0)			; LMULMAX1-RV32-NEXT: vse64.v v8, (a0)
	; LMULMAX1-RV32-NEXT: vse64.v v9, (a1)			; LMULMAX1-RV32-NEXT: vse64.v v9, (a1)
	; LMULMAX1-RV32-NEXT: ret			; LMULMAX1-RV32-NEXT: ret
	;			;
	; LMULMAX1-RV64-LABEL: mulhs_v4i64:			; LMULMAX1-RV64-LABEL: mulhs_v4i64:
	; LMULMAX1-RV64: # %bb.0:			; LMULMAX1-RV64: # %bb.0:
				; LMULMAX1-RV64-NEXT: lui a1, %hi(.LCPI136_0)
				; LMULMAX1-RV64-NEXT: ld a1, %lo(.LCPI136_0)(a1)
	; LMULMAX1-RV64-NEXT: vsetivli zero, 2, e64, m1, ta, mu			; LMULMAX1-RV64-NEXT: vsetivli zero, 2, e64, m1, ta, mu
	; LMULMAX1-RV64-NEXT: vle64.v v8, (a0)			; LMULMAX1-RV64-NEXT: vle64.v v8, (a0)
	; LMULMAX1-RV64-NEXT: addi a1, a0, 16			; LMULMAX1-RV64-NEXT: vmv.v.x v9, a1
	; LMULMAX1-RV64-NEXT: vle64.v v9, (a1)			; LMULMAX1-RV64-NEXT: lui a1, %hi(.LCPI136_1)
	; LMULMAX1-RV64-NEXT: lui a2, 21845			; LMULMAX1-RV64-NEXT: ld a1, %lo(.LCPI136_1)(a1)
	; LMULMAX1-RV64-NEXT: addiw a2, a2, 1365			; LMULMAX1-RV64-NEXT: addi a2, a0, 16
	; LMULMAX1-RV64-NEXT: slli a2, a2, 12			; LMULMAX1-RV64-NEXT: vle64.v v10, (a2)
	; LMULMAX1-RV64-NEXT: addi a2, a2, 1365
	; LMULMAX1-RV64-NEXT: slli a2, a2, 12
	; LMULMAX1-RV64-NEXT: addi a2, a2, 1365
	; LMULMAX1-RV64-NEXT: slli a2, a2, 12
	; LMULMAX1-RV64-NEXT: addi a3, a2, 1365
	; LMULMAX1-RV64-NEXT: vmv.v.x v10, a3
	; LMULMAX1-RV64-NEXT: addi a2, a2, 1366
	; LMULMAX1-RV64-NEXT: vsetvli zero, zero, e64, m1, tu, mu			; LMULMAX1-RV64-NEXT: vsetvli zero, zero, e64, m1, tu, mu
	; LMULMAX1-RV64-NEXT: vmv.s.x v10, a2			; LMULMAX1-RV64-NEXT: vmv.s.x v9, a1
	; LMULMAX1-RV64-NEXT: vsetvli zero, zero, e64, m1, ta, mu			; LMULMAX1-RV64-NEXT: vsetvli zero, zero, e64, m1, ta, mu
	; LMULMAX1-RV64-NEXT: vmulh.vv v11, v9, v10			; LMULMAX1-RV64-NEXT: vmulh.vv v11, v10, v9
	; LMULMAX1-RV64-NEXT: vid.v v12			; LMULMAX1-RV64-NEXT: vid.v v12
	; LMULMAX1-RV64-NEXT: vrsub.vi v13, v12, 0			; LMULMAX1-RV64-NEXT: vrsub.vi v13, v12, 0
	; LMULMAX1-RV64-NEXT: vmacc.vv v11, v13, v9			; LMULMAX1-RV64-NEXT: vmacc.vv v11, v13, v10
	; LMULMAX1-RV64-NEXT: li a2, 63			; LMULMAX1-RV64-NEXT: li a1, 63
	; LMULMAX1-RV64-NEXT: vsrl.vx v9, v11, a2			; LMULMAX1-RV64-NEXT: vsrl.vx v10, v11, a1
	; LMULMAX1-RV64-NEXT: vsra.vv v11, v11, v12			; LMULMAX1-RV64-NEXT: vsra.vv v11, v11, v12
	; LMULMAX1-RV64-NEXT: vadd.vv v9, v11, v9			; LMULMAX1-RV64-NEXT: vadd.vv v10, v11, v10
	; LMULMAX1-RV64-NEXT: vmulh.vv v10, v8, v10			; LMULMAX1-RV64-NEXT: vmulh.vv v9, v8, v9
	; LMULMAX1-RV64-NEXT: vmacc.vv v10, v8, v13			; LMULMAX1-RV64-NEXT: vmacc.vv v9, v8, v13
	; LMULMAX1-RV64-NEXT: vsrl.vx v8, v10, a2			; LMULMAX1-RV64-NEXT: vsrl.vx v8, v9, a1
	; LMULMAX1-RV64-NEXT: vsra.vv v10, v10, v12			; LMULMAX1-RV64-NEXT: vsra.vv v9, v9, v12
	; LMULMAX1-RV64-NEXT: vadd.vv v8, v10, v8			; LMULMAX1-RV64-NEXT: vadd.vv v8, v9, v8
	; LMULMAX1-RV64-NEXT: vse64.v v8, (a0)			; LMULMAX1-RV64-NEXT: vse64.v v8, (a0)
	; LMULMAX1-RV64-NEXT: vse64.v v9, (a1)			; LMULMAX1-RV64-NEXT: vse64.v v10, (a2)
	; LMULMAX1-RV64-NEXT: ret			; LMULMAX1-RV64-NEXT: ret
	%a = load <4 x i64>, <4 x i64>* %x			%a = load <4 x i64>, <4 x i64>* %x
	%b = sdiv <4 x i64> %a, <i64 3, i64 -3, i64 3, i64 -3>			%b = sdiv <4 x i64> %a, <i64 3, i64 -3, i64 3, i64 -3>
	store <4 x i64> %b, <4 x i64>* %x			store <4 x i64> %b, <4 x i64>* %x
	ret void			ret void
	}			}

	define void @smin_v32i8(<32 x i8>* %x, <32 x i8>* %y) {			define void @smin_v32i8(<32 x i8>* %x, <32 x i8>* %y) {
	▲ Show 20 Lines • Show All 2,597 Lines • ▼ Show 20 Lines
	; RV32-NEXT: vse64.v v8, (a0)			; RV32-NEXT: vse64.v v8, (a0)
	; RV32-NEXT: addi sp, sp, 16			; RV32-NEXT: addi sp, sp, 16
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: mulhu_vx_v2i64:			; RV64-LABEL: mulhu_vx_v2i64:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: vsetivli zero, 2, e64, m1, ta, mu			; RV64-NEXT: vsetivli zero, 2, e64, m1, ta, mu
	; RV64-NEXT: vle64.v v8, (a0)			; RV64-NEXT: vle64.v v8, (a0)
	; RV64-NEXT: lui a1, 1026731			; RV64-NEXT: lui a1, %hi(.LCPI265_0)
	; RV64-NEXT: addiw a1, a1, -1365			; RV64-NEXT: ld a1, %lo(.LCPI265_0)(a1)
	; RV64-NEXT: slli a1, a1, 12
	; RV64-NEXT: addi a1, a1, -1365
	; RV64-NEXT: slli a1, a1, 12
	; RV64-NEXT: addi a1, a1, -1365
	; RV64-NEXT: slli a1, a1, 12
	; RV64-NEXT: addi a1, a1, -1365
	; RV64-NEXT: vmulhu.vx v8, v8, a1			; RV64-NEXT: vmulhu.vx v8, v8, a1
	; RV64-NEXT: vsrl.vi v8, v8, 1			; RV64-NEXT: vsrl.vi v8, v8, 1
	; RV64-NEXT: vse64.v v8, (a0)			; RV64-NEXT: vse64.v v8, (a0)
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%a = load <2 x i64>, <2 x i64>* %x			%a = load <2 x i64>, <2 x i64>* %x
	%b = udiv <2 x i64> %a, <i64 3, i64 3>			%b = udiv <2 x i64> %a, <i64 3, i64 3>
	store <2 x i64> %b, <2 x i64>* %x			store <2 x i64> %b, <2 x i64>* %x
	ret void			ret void
	▲ Show 20 Lines • Show All 100 Lines • ▼ Show 20 Lines
	; RV32-NEXT: vse64.v v8, (a0)			; RV32-NEXT: vse64.v v8, (a0)
	; RV32-NEXT: addi sp, sp, 16			; RV32-NEXT: addi sp, sp, 16
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: mulhs_vx_v2i64:			; RV64-LABEL: mulhs_vx_v2i64:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: vsetivli zero, 2, e64, m1, ta, mu			; RV64-NEXT: vsetivli zero, 2, e64, m1, ta, mu
	; RV64-NEXT: vle64.v v8, (a0)			; RV64-NEXT: vle64.v v8, (a0)
	; RV64-NEXT: lui a1, 21845			; RV64-NEXT: lui a1, %hi(.LCPI269_0)
	; RV64-NEXT: addiw a1, a1, 1365			; RV64-NEXT: ld a1, %lo(.LCPI269_0)(a1)
	; RV64-NEXT: slli a1, a1, 12
	; RV64-NEXT: addi a1, a1, 1365
	; RV64-NEXT: slli a1, a1, 12
	; RV64-NEXT: addi a1, a1, 1365
	; RV64-NEXT: slli a1, a1, 12
	; RV64-NEXT: addi a1, a1, 1366
	; RV64-NEXT: vmulh.vx v8, v8, a1			; RV64-NEXT: vmulh.vx v8, v8, a1
	; RV64-NEXT: li a1, 63			; RV64-NEXT: li a1, 63
	; RV64-NEXT: vsrl.vx v9, v8, a1			; RV64-NEXT: vsrl.vx v9, v8, a1
	; RV64-NEXT: vadd.vv v8, v8, v9			; RV64-NEXT: vadd.vv v8, v8, v9
	; RV64-NEXT: vse64.v v8, (a0)			; RV64-NEXT: vse64.v v8, (a0)
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%a = load <2 x i64>, <2 x i64>* %x			%a = load <2 x i64>, <2 x i64>* %x
	%b = sdiv <2 x i64> %a, <i64 3, i64 3>			%b = sdiv <2 x i64> %a, <i64 3, i64 3>
	store <2 x i64> %b, <2 x i64>* %x			store <2 x i64> %b, <2 x i64>* %x
	ret void			ret void
	}			}

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-mask-buildvec.ll

	Show First 20 Lines • Show All 463 Lines • ▼ Show 20 Lines
	; RV32-LMULMAX4-NEXT: addi a0, a0, 1776			; RV32-LMULMAX4-NEXT: addi a0, a0, 1776
	; RV32-LMULMAX4-NEXT: vmv.s.x v0, a0			; RV32-LMULMAX4-NEXT: vmv.s.x v0, a0
	; RV32-LMULMAX4-NEXT: vsetvli zero, zero, e32, mf2, tu, mu			; RV32-LMULMAX4-NEXT: vsetvli zero, zero, e32, mf2, tu, mu
	; RV32-LMULMAX4-NEXT: vslideup.vi v0, v8, 1			; RV32-LMULMAX4-NEXT: vslideup.vi v0, v8, 1
	; RV32-LMULMAX4-NEXT: ret			; RV32-LMULMAX4-NEXT: ret
	;			;
	; RV64-LMULMAX4-LABEL: buildvec_mask_v64i1:			; RV64-LMULMAX4-LABEL: buildvec_mask_v64i1:
	; RV64-LMULMAX4: # %bb.0:			; RV64-LMULMAX4: # %bb.0:
	; RV64-LMULMAX4-NEXT: lui a0, 1048429			; RV64-LMULMAX4-NEXT: lui a0, %hi(.LCPI19_0)
	; RV64-LMULMAX4-NEXT: addiw a0, a0, 1735			; RV64-LMULMAX4-NEXT: ld a0, %lo(.LCPI19_0)(a0)
	; RV64-LMULMAX4-NEXT: slli a0, a0, 13
	; RV64-LMULMAX4-NEXT: addi a0, a0, 1023
	; RV64-LMULMAX4-NEXT: slli a0, a0, 13
	; RV64-LMULMAX4-NEXT: addi a0, a0, -1189
	; RV64-LMULMAX4-NEXT: slli a0, a0, 17
	; RV64-LMULMAX4-NEXT: addi a0, a0, 1776
	; RV64-LMULMAX4-NEXT: vsetivli zero, 1, e64, m1, ta, mu			; RV64-LMULMAX4-NEXT: vsetivli zero, 1, e64, m1, ta, mu
	; RV64-LMULMAX4-NEXT: vmv.s.x v0, a0			; RV64-LMULMAX4-NEXT: vmv.s.x v0, a0
	; RV64-LMULMAX4-NEXT: ret			; RV64-LMULMAX4-NEXT: ret
	;			;
	; RV32-LMULMAX8-LABEL: buildvec_mask_v64i1:			; RV32-LMULMAX8-LABEL: buildvec_mask_v64i1:
	; RV32-LMULMAX8: # %bb.0:			; RV32-LMULMAX8: # %bb.0:
	; RV32-LMULMAX8-NEXT: lui a0, 748388			; RV32-LMULMAX8-NEXT: lui a0, 748388
	; RV32-LMULMAX8-NEXT: addi a0, a0, -1793			; RV32-LMULMAX8-NEXT: addi a0, a0, -1793
	; RV32-LMULMAX8-NEXT: vsetivli zero, 2, e32, mf2, ta, mu			; RV32-LMULMAX8-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
	; RV32-LMULMAX8-NEXT: vmv.s.x v8, a0			; RV32-LMULMAX8-NEXT: vmv.s.x v8, a0
	; RV32-LMULMAX8-NEXT: lui a0, 748384			; RV32-LMULMAX8-NEXT: lui a0, 748384
	; RV32-LMULMAX8-NEXT: addi a0, a0, 1776			; RV32-LMULMAX8-NEXT: addi a0, a0, 1776
	; RV32-LMULMAX8-NEXT: vmv.s.x v0, a0			; RV32-LMULMAX8-NEXT: vmv.s.x v0, a0
	; RV32-LMULMAX8-NEXT: vsetvli zero, zero, e32, mf2, tu, mu			; RV32-LMULMAX8-NEXT: vsetvli zero, zero, e32, mf2, tu, mu
	; RV32-LMULMAX8-NEXT: vslideup.vi v0, v8, 1			; RV32-LMULMAX8-NEXT: vslideup.vi v0, v8, 1
	; RV32-LMULMAX8-NEXT: ret			; RV32-LMULMAX8-NEXT: ret
	;			;
	; RV64-LMULMAX8-LABEL: buildvec_mask_v64i1:			; RV64-LMULMAX8-LABEL: buildvec_mask_v64i1:
	; RV64-LMULMAX8: # %bb.0:			; RV64-LMULMAX8: # %bb.0:
	; RV64-LMULMAX8-NEXT: lui a0, 1048429			; RV64-LMULMAX8-NEXT: lui a0, %hi(.LCPI19_0)
	; RV64-LMULMAX8-NEXT: addiw a0, a0, 1735			; RV64-LMULMAX8-NEXT: ld a0, %lo(.LCPI19_0)(a0)
	; RV64-LMULMAX8-NEXT: slli a0, a0, 13
	; RV64-LMULMAX8-NEXT: addi a0, a0, 1023
	; RV64-LMULMAX8-NEXT: slli a0, a0, 13
	; RV64-LMULMAX8-NEXT: addi a0, a0, -1189
	; RV64-LMULMAX8-NEXT: slli a0, a0, 17
	; RV64-LMULMAX8-NEXT: addi a0, a0, 1776
	; RV64-LMULMAX8-NEXT: vsetivli zero, 1, e64, m1, ta, mu			; RV64-LMULMAX8-NEXT: vsetivli zero, 1, e64, m1, ta, mu
	; RV64-LMULMAX8-NEXT: vmv.s.x v0, a0			; RV64-LMULMAX8-NEXT: vmv.s.x v0, a0
	; RV64-LMULMAX8-NEXT: ret			; RV64-LMULMAX8-NEXT: ret
	ret <64 x i1> <i1 0, i1 0, i1 0, i1 0, i1 1, i1 1, i1 1, i1 1, i1 0, i1 1, i1 1, i1 0, i1 0, i1 0, i1 0, i1 0, i1 0, i1 1, i1 1, i1 0, i1 1, i1 1, i1 0, i1 1, i1 0, i1 1, i1 1, i1 0, i1 1, i1 1, i1 0, i1 1, i1 1, i1 1, i1 1, i1 1, i1 1, i1 1, i1 1, i1 1, i1 0, i1 0, i1 0, i1 1, i1 1, i1 1, i1 0, i1 0, i1 0, i1 1, i1 1, i1 0, i1 1, i1 1, i1 0, i1 1, i1 0, i1 1, i1 1, i1 0, i1 1, i1 1, i1 0, i1 1>			ret <64 x i1> <i1 0, i1 0, i1 0, i1 0, i1 1, i1 1, i1 1, i1 1, i1 0, i1 1, i1 1, i1 0, i1 0, i1 0, i1 0, i1 0, i1 0, i1 1, i1 1, i1 0, i1 1, i1 1, i1 0, i1 1, i1 0, i1 1, i1 1, i1 0, i1 1, i1 1, i1 0, i1 1, i1 1, i1 1, i1 1, i1 1, i1 1, i1 1, i1 1, i1 1, i1 0, i1 0, i1 0, i1 1, i1 1, i1 1, i1 0, i1 0, i1 0, i1 1, i1 1, i1 0, i1 1, i1 1, i1 0, i1 1, i1 0, i1 1, i1 1, i1 0, i1 1, i1 1, i1 0, i1 1>
	}			}

	define <128 x i1> @buildvec_mask_v128i1() {			define <128 x i1> @buildvec_mask_v128i1() {
	; RV32-LMULMAX1-LABEL: buildvec_mask_v128i1:			; RV32-LMULMAX1-LABEL: buildvec_mask_v128i1:
	▲ Show 20 Lines • Show All 93 Lines • ▼ Show 20 Lines
	; RV32-LMULMAX4-NEXT: addi a0, a0, 1776			; RV32-LMULMAX4-NEXT: addi a0, a0, 1776
	; RV32-LMULMAX4-NEXT: vmv.s.x v8, a0			; RV32-LMULMAX4-NEXT: vmv.s.x v8, a0
	; RV32-LMULMAX4-NEXT: vsetvli zero, zero, e32, mf2, tu, mu			; RV32-LMULMAX4-NEXT: vsetvli zero, zero, e32, mf2, tu, mu
	; RV32-LMULMAX4-NEXT: vslideup.vi v8, v9, 1			; RV32-LMULMAX4-NEXT: vslideup.vi v8, v9, 1
	; RV32-LMULMAX4-NEXT: ret			; RV32-LMULMAX4-NEXT: ret
	;			;
	; RV64-LMULMAX4-LABEL: buildvec_mask_v128i1:			; RV64-LMULMAX4-LABEL: buildvec_mask_v128i1:
	; RV64-LMULMAX4: # %bb.0:			; RV64-LMULMAX4: # %bb.0:
	; RV64-LMULMAX4-NEXT: lui a0, 841543			; RV64-LMULMAX4-NEXT: lui a0, %hi(.LCPI20_0)
	; RV64-LMULMAX4-NEXT: addiw a0, a0, 511			; RV64-LMULMAX4-NEXT: ld a0, %lo(.LCPI20_0)(a0)
	; RV64-LMULMAX4-NEXT: slli a0, a0, 14			; RV64-LMULMAX4-NEXT: lui a1, %hi(.LCPI20_1)
	; RV64-LMULMAX4-NEXT: addi a0, a0, 859			; RV64-LMULMAX4-NEXT: ld a1, %lo(.LCPI20_1)(a1)
	; RV64-LMULMAX4-NEXT: slli a0, a0, 17
	; RV64-LMULMAX4-NEXT: addi a0, a0, 1776
	; RV64-LMULMAX4-NEXT: vsetivli zero, 1, e64, m1, ta, mu			; RV64-LMULMAX4-NEXT: vsetivli zero, 1, e64, m1, ta, mu
	; RV64-LMULMAX4-NEXT: vmv.s.x v8, a0
	; RV64-LMULMAX4-NEXT: lui a0, 1048429
	; RV64-LMULMAX4-NEXT: addiw a0, a0, 1735
	; RV64-LMULMAX4-NEXT: slli a0, a0, 13
	; RV64-LMULMAX4-NEXT: addi a0, a0, 1023
	; RV64-LMULMAX4-NEXT: slli a0, a0, 13
	; RV64-LMULMAX4-NEXT: addi a0, a0, -1189
	; RV64-LMULMAX4-NEXT: slli a0, a0, 17
	; RV64-LMULMAX4-NEXT: addi a0, a0, 1776
	; RV64-LMULMAX4-NEXT: vmv.s.x v0, a0			; RV64-LMULMAX4-NEXT: vmv.s.x v0, a0
				; RV64-LMULMAX4-NEXT: vmv.s.x v8, a1
	; RV64-LMULMAX4-NEXT: ret			; RV64-LMULMAX4-NEXT: ret
	;			;
	; RV32-LMULMAX8-LABEL: buildvec_mask_v128i1:			; RV32-LMULMAX8-LABEL: buildvec_mask_v128i1:
	; RV32-LMULMAX8: # %bb.0:			; RV32-LMULMAX8: # %bb.0:
	; RV32-LMULMAX8-NEXT: lui a0, 748388			; RV32-LMULMAX8-NEXT: lui a0, 748388
	; RV32-LMULMAX8-NEXT: addi a0, a0, -1793			; RV32-LMULMAX8-NEXT: addi a0, a0, -1793
	; RV32-LMULMAX8-NEXT: vsetivli zero, 4, e32, m1, ta, mu			; RV32-LMULMAX8-NEXT: vsetivli zero, 4, e32, m1, ta, mu
	; RV32-LMULMAX8-NEXT: vmv.s.x v8, a0			; RV32-LMULMAX8-NEXT: vmv.s.x v8, a0
	Show All 13 Lines
	; RV32-LMULMAX8-NEXT: vsetivli zero, 4, e32, m1, ta, mu			; RV32-LMULMAX8-NEXT: vsetivli zero, 4, e32, m1, ta, mu
	; RV32-LMULMAX8-NEXT: vmv.s.x v8, a0			; RV32-LMULMAX8-NEXT: vmv.s.x v8, a0
	; RV32-LMULMAX8-NEXT: vsetvli zero, zero, e32, m1, tu, mu			; RV32-LMULMAX8-NEXT: vsetvli zero, zero, e32, m1, tu, mu
	; RV32-LMULMAX8-NEXT: vslideup.vi v0, v8, 3			; RV32-LMULMAX8-NEXT: vslideup.vi v0, v8, 3
	; RV32-LMULMAX8-NEXT: ret			; RV32-LMULMAX8-NEXT: ret
	;			;
	; RV64-LMULMAX8-LABEL: buildvec_mask_v128i1:			; RV64-LMULMAX8-LABEL: buildvec_mask_v128i1:
	; RV64-LMULMAX8: # %bb.0:			; RV64-LMULMAX8: # %bb.0:
	; RV64-LMULMAX8-NEXT: lui a0, 841543			; RV64-LMULMAX8-NEXT: lui a0, %hi(.LCPI20_0)
	; RV64-LMULMAX8-NEXT: addiw a0, a0, 511			; RV64-LMULMAX8-NEXT: ld a0, %lo(.LCPI20_0)(a0)
	; RV64-LMULMAX8-NEXT: slli a0, a0, 14			; RV64-LMULMAX8-NEXT: lui a1, %hi(.LCPI20_1)
	; RV64-LMULMAX8-NEXT: addi a0, a0, 859			; RV64-LMULMAX8-NEXT: ld a1, %lo(.LCPI20_1)(a1)
	; RV64-LMULMAX8-NEXT: slli a0, a0, 17
	; RV64-LMULMAX8-NEXT: addi a0, a0, 1776
	; RV64-LMULMAX8-NEXT: vsetivli zero, 2, e64, m1, ta, mu			; RV64-LMULMAX8-NEXT: vsetivli zero, 2, e64, m1, ta, mu
	; RV64-LMULMAX8-NEXT: vmv.s.x v8, a0			; RV64-LMULMAX8-NEXT: vmv.s.x v8, a0
	; RV64-LMULMAX8-NEXT: lui a0, 1048429			; RV64-LMULMAX8-NEXT: vmv.s.x v0, a1
	; RV64-LMULMAX8-NEXT: addiw a0, a0, 1735
	; RV64-LMULMAX8-NEXT: slli a0, a0, 13
	; RV64-LMULMAX8-NEXT: addi a0, a0, 1023
	; RV64-LMULMAX8-NEXT: slli a0, a0, 13
	; RV64-LMULMAX8-NEXT: addi a0, a0, -1189
	; RV64-LMULMAX8-NEXT: slli a0, a0, 17
	; RV64-LMULMAX8-NEXT: addi a0, a0, 1776
	; RV64-LMULMAX8-NEXT: vmv.s.x v0, a0
	; RV64-LMULMAX8-NEXT: vsetvli zero, zero, e64, m1, tu, mu			; RV64-LMULMAX8-NEXT: vsetvli zero, zero, e64, m1, tu, mu
	; RV64-LMULMAX8-NEXT: vslideup.vi v0, v8, 1			; RV64-LMULMAX8-NEXT: vslideup.vi v0, v8, 1
	; RV64-LMULMAX8-NEXT: ret			; RV64-LMULMAX8-NEXT: ret
	ret <128 x i1> <i1 0, i1 0, i1 0, i1 0, i1 1, i1 1, i1 1, i1 1, i1 0, i1 1, i1 1, i1 0, i1 0, i1 0, i1 0, i1 0, i1 0, i1 1, i1 1, i1 0, i1 1, i1 1, i1 0, i1 1, i1 0, i1 1, i1 1, i1 0, i1 1, i1 1, i1 0, i1 1, i1 1, i1 1, i1 1, i1 1, i1 1, i1 1, i1 1, i1 1, i1 0, i1 0, i1 0, i1 1, i1 1, i1 1, i1 0, i1 0, i1 0, i1 1, i1 1, i1 0, i1 1, i1 1, i1 0, i1 1, i1 0, i1 1, i1 1, i1 0, i1 1, i1 1, i1 0, i1 1, i1 0, i1 0, i1 0, i1 0, i1 1, i1 1, i1 1, i1 1, i1 0, i1 1, i1 1, i1 0, i1 0, i1 0, i1 0, i1 0, i1 0, i1 1, i1 1, i1 0, i1 1, i1 1, i1 0, i1 1, i1 0, i1 1, i1 1, i1 0, i1 0, i1 0, i1 0, i1 1, i1 1, i1 1, i1 1, i1 1, i1 1, i1 1, i1 1, i1 1, i1 0, i1 0, i1 0, i1 1, i1 1, i1 1, i1 0, i1 0, i1 0, i1 1, i1 0, i1 1, i1 1, i1 1, i1 0, i1 1, i1 0, i1 1, i1 1, i1 0, i1 0, i1 1, i1 1, i1 1>			ret <128 x i1> <i1 0, i1 0, i1 0, i1 0, i1 1, i1 1, i1 1, i1 1, i1 0, i1 1, i1 1, i1 0, i1 0, i1 0, i1 0, i1 0, i1 0, i1 1, i1 1, i1 0, i1 1, i1 1, i1 0, i1 1, i1 0, i1 1, i1 1, i1 0, i1 1, i1 1, i1 0, i1 1, i1 1, i1 1, i1 1, i1 1, i1 1, i1 1, i1 1, i1 1, i1 0, i1 0, i1 0, i1 1, i1 1, i1 1, i1 0, i1 0, i1 0, i1 1, i1 1, i1 0, i1 1, i1 1, i1 0, i1 1, i1 0, i1 1, i1 1, i1 0, i1 1, i1 1, i1 0, i1 1, i1 0, i1 0, i1 0, i1 0, i1 1, i1 1, i1 1, i1 1, i1 0, i1 1, i1 1, i1 0, i1 0, i1 0, i1 0, i1 0, i1 0, i1 1, i1 1, i1 0, i1 1, i1 1, i1 0, i1 1, i1 0, i1 1, i1 1, i1 0, i1 0, i1 0, i1 0, i1 1, i1 1, i1 1, i1 1, i1 1, i1 1, i1 1, i1 1, i1 1, i1 0, i1 0, i1 0, i1 1, i1 1, i1 1, i1 0, i1 0, i1 0, i1 1, i1 0, i1 1, i1 1, i1 1, i1 0, i1 1, i1 0, i1 1, i1 1, i1 0, i1 0, i1 1, i1 1, i1 1>
	}			}

	define <128 x i1> @buildvec_mask_optsize_v128i1() optsize {			define <128 x i1> @buildvec_mask_optsize_v128i1() optsize {
	; RV32-LMULMAX1-LABEL: buildvec_mask_optsize_v128i1:			; RV32-LMULMAX1-LABEL: buildvec_mask_optsize_v128i1:
	▲ Show 20 Lines • Show All 83 Lines • ▼ Show 20 Lines
	; RV32-LMULMAX4-NEXT: vlm.v v0, (a0)			; RV32-LMULMAX4-NEXT: vlm.v v0, (a0)
	; RV32-LMULMAX4-NEXT: lui a0, %hi(.LCPI21_1)			; RV32-LMULMAX4-NEXT: lui a0, %hi(.LCPI21_1)
	; RV32-LMULMAX4-NEXT: addi a0, a0, %lo(.LCPI21_1)			; RV32-LMULMAX4-NEXT: addi a0, a0, %lo(.LCPI21_1)
	; RV32-LMULMAX4-NEXT: vlm.v v8, (a0)			; RV32-LMULMAX4-NEXT: vlm.v v8, (a0)
	; RV32-LMULMAX4-NEXT: ret			; RV32-LMULMAX4-NEXT: ret
	;			;
	; RV64-LMULMAX4-LABEL: buildvec_mask_optsize_v128i1:			; RV64-LMULMAX4-LABEL: buildvec_mask_optsize_v128i1:
	; RV64-LMULMAX4: # %bb.0:			; RV64-LMULMAX4: # %bb.0:
	; RV64-LMULMAX4-NEXT: lui a0, 841543			; RV64-LMULMAX4-NEXT: lui a0, %hi(.LCPI21_0)
	; RV64-LMULMAX4-NEXT: addiw a0, a0, 511			; RV64-LMULMAX4-NEXT: ld a0, %lo(.LCPI21_0)(a0)
	; RV64-LMULMAX4-NEXT: slli a0, a0, 14			; RV64-LMULMAX4-NEXT: lui a1, %hi(.LCPI21_1)
	; RV64-LMULMAX4-NEXT: addi a0, a0, 859			; RV64-LMULMAX4-NEXT: ld a1, %lo(.LCPI21_1)(a1)
	; RV64-LMULMAX4-NEXT: slli a0, a0, 17
	; RV64-LMULMAX4-NEXT: addi a0, a0, 1776
	; RV64-LMULMAX4-NEXT: vsetivli zero, 1, e64, m1, ta, mu			; RV64-LMULMAX4-NEXT: vsetivli zero, 1, e64, m1, ta, mu
	; RV64-LMULMAX4-NEXT: vmv.s.x v8, a0
	; RV64-LMULMAX4-NEXT: lui a0, 1048429
	; RV64-LMULMAX4-NEXT: addiw a0, a0, 1735
	; RV64-LMULMAX4-NEXT: slli a0, a0, 13
	; RV64-LMULMAX4-NEXT: addi a0, a0, 1023
	; RV64-LMULMAX4-NEXT: slli a0, a0, 13
	; RV64-LMULMAX4-NEXT: addi a0, a0, -1189
	; RV64-LMULMAX4-NEXT: slli a0, a0, 17
	; RV64-LMULMAX4-NEXT: addi a0, a0, 1776
	; RV64-LMULMAX4-NEXT: vmv.s.x v0, a0			; RV64-LMULMAX4-NEXT: vmv.s.x v0, a0
				; RV64-LMULMAX4-NEXT: vmv.s.x v8, a1
	; RV64-LMULMAX4-NEXT: ret			; RV64-LMULMAX4-NEXT: ret
	;			;
	; RV32-LMULMAX8-LABEL: buildvec_mask_optsize_v128i1:			; RV32-LMULMAX8-LABEL: buildvec_mask_optsize_v128i1:
	; RV32-LMULMAX8: # %bb.0:			; RV32-LMULMAX8: # %bb.0:
	; RV32-LMULMAX8-NEXT: lui a0, %hi(.LCPI21_0)			; RV32-LMULMAX8-NEXT: lui a0, %hi(.LCPI21_0)
	; RV32-LMULMAX8-NEXT: addi a0, a0, %lo(.LCPI21_0)			; RV32-LMULMAX8-NEXT: addi a0, a0, %lo(.LCPI21_0)
	; RV32-LMULMAX8-NEXT: li a1, 128			; RV32-LMULMAX8-NEXT: li a1, 128
	; RV32-LMULMAX8-NEXT: vsetvli zero, a1, e8, m8, ta, mu			; RV32-LMULMAX8-NEXT: vsetvli zero, a1, e8, m8, ta, mu
	Show All 13 Lines

llvm/test/CodeGen/RISCV/rvv/interleave-crash.ll

	Show All 21 Lines
	; RV64-1024-NEXT: vsetvli zero, zero, e16, m4, ta, mu			; RV64-1024-NEXT: vsetvli zero, zero, e16, m4, ta, mu
	; RV64-1024-NEXT: vid.v v28			; RV64-1024-NEXT: vid.v v28
	; RV64-1024-NEXT: vsrl.vi v12, v28, 1			; RV64-1024-NEXT: vsrl.vi v12, v28, 1
	; RV64-1024-NEXT: vrgather.vv v0, v20, v12			; RV64-1024-NEXT: vrgather.vv v0, v20, v12
	; RV64-1024-NEXT: vsetvli zero, a3, e16, m4, tu, mu			; RV64-1024-NEXT: vsetvli zero, a3, e16, m4, tu, mu
	; RV64-1024-NEXT: vslideup.vi v8, v16, 0			; RV64-1024-NEXT: vslideup.vi v8, v16, 0
	; RV64-1024-NEXT: vsetvli zero, a1, e16, m4, tu, mu			; RV64-1024-NEXT: vsetvli zero, a1, e16, m4, tu, mu
	; RV64-1024-NEXT: vslideup.vx v8, v24, a3			; RV64-1024-NEXT: vslideup.vx v8, v24, a3
				; RV64-1024-NEXT: lui a2, %hi(.LCPI0_0)
				; RV64-1024-NEXT: ld a2, %lo(.LCPI0_0)(a2)
	; RV64-1024-NEXT: vsetvli zero, zero, e16, m4, ta, mu			; RV64-1024-NEXT: vsetvli zero, zero, e16, m4, ta, mu
	; RV64-1024-NEXT: vrgather.vv v16, v0, v28			; RV64-1024-NEXT: vrgather.vv v16, v0, v28
	; RV64-1024-NEXT: lui a2, 1026731
	; RV64-1024-NEXT: addiw a2, a2, -1365
	; RV64-1024-NEXT: slli a2, a2, 12
	; RV64-1024-NEXT: addi a2, a2, -1365
	; RV64-1024-NEXT: slli a2, a2, 12
	; RV64-1024-NEXT: addi a2, a2, -1365
	; RV64-1024-NEXT: slli a2, a2, 12
	; RV64-1024-NEXT: addi a2, a2, -1366
	; RV64-1024-NEXT: vsetivli zero, 4, e64, m1, ta, mu			; RV64-1024-NEXT: vsetivli zero, 4, e64, m1, ta, mu
	; RV64-1024-NEXT: vmv.s.x v20, a2			; RV64-1024-NEXT: vmv.s.x v20, a2
	; RV64-1024-NEXT: vsetivli zero, 2, e64, m1, tu, mu			; RV64-1024-NEXT: vsetivli zero, 2, e64, m1, tu, mu
	; RV64-1024-NEXT: vmv1r.v v0, v20			; RV64-1024-NEXT: vmv1r.v v0, v20
	; RV64-1024-NEXT: vslideup.vi v0, v20, 1			; RV64-1024-NEXT: vslideup.vi v0, v20, 1
	; RV64-1024-NEXT: vsetivli zero, 3, e64, m1, tu, mu			; RV64-1024-NEXT: vsetivli zero, 3, e64, m1, tu, mu
	; RV64-1024-NEXT: vslideup.vi v0, v20, 2			; RV64-1024-NEXT: vslideup.vi v0, v20, 2
	; RV64-1024-NEXT: vsetivli zero, 4, e64, m1, tu, mu			; RV64-1024-NEXT: vsetivli zero, 4, e64, m1, tu, mu
	Show All 11 Lines
	; RV64-2048-NEXT: vle16.v v12, (a2)			; RV64-2048-NEXT: vle16.v v12, (a2)
	; RV64-2048-NEXT: li a1, 256			; RV64-2048-NEXT: li a1, 256
	; RV64-2048-NEXT: vsetvli zero, a1, e16, m2, ta, mu			; RV64-2048-NEXT: vsetvli zero, a1, e16, m2, ta, mu
	; RV64-2048-NEXT: vmv.v.i v8, 0			; RV64-2048-NEXT: vmv.v.i v8, 0
	; RV64-2048-NEXT: vsetvli zero, a3, e16, m2, tu, mu			; RV64-2048-NEXT: vsetvli zero, a3, e16, m2, tu, mu
	; RV64-2048-NEXT: vmv2r.v v14, v8			; RV64-2048-NEXT: vmv2r.v v14, v8
	; RV64-2048-NEXT: vslideup.vi v14, v10, 0			; RV64-2048-NEXT: vslideup.vi v14, v10, 0
	; RV64-2048-NEXT: vsetvli zero, a3, e16, m1, ta, mu			; RV64-2048-NEXT: vsetvli zero, a3, e16, m1, ta, mu
	; RV64-2048-NEXT: vmv.v.i v16, 0			; RV64-2048-NEXT: vmv.v.i v10, 0
	; RV64-2048-NEXT: vsetvli zero, a1, e16, m2, tu, mu			; RV64-2048-NEXT: vsetvli zero, a1, e16, m2, tu, mu
	; RV64-2048-NEXT: vslideup.vx v14, v16, a3			; RV64-2048-NEXT: vslideup.vx v14, v10, a3
	; RV64-2048-NEXT: vsetvli zero, zero, e16, m2, ta, mu			; RV64-2048-NEXT: vsetvli zero, zero, e16, m2, ta, mu
	; RV64-2048-NEXT: vid.v v18			; RV64-2048-NEXT: vid.v v16
	; RV64-2048-NEXT: vsrl.vi v10, v18, 1			; RV64-2048-NEXT: vsrl.vi v18, v16, 1
	; RV64-2048-NEXT: vrgather.vv v20, v14, v10			; RV64-2048-NEXT: vrgather.vv v20, v14, v18
	; RV64-2048-NEXT: vsetvli zero, a3, e16, m2, tu, mu			; RV64-2048-NEXT: vsetvli zero, a3, e16, m2, tu, mu
	; RV64-2048-NEXT: vslideup.vi v8, v12, 0			; RV64-2048-NEXT: vslideup.vi v8, v12, 0
	; RV64-2048-NEXT: vsetvli zero, a1, e16, m2, tu, mu			; RV64-2048-NEXT: vsetvli zero, a1, e16, m2, tu, mu
	; RV64-2048-NEXT: vslideup.vx v8, v16, a3			; RV64-2048-NEXT: vslideup.vx v8, v10, a3
				; RV64-2048-NEXT: lui a2, %hi(.LCPI0_0)
				; RV64-2048-NEXT: ld a2, %lo(.LCPI0_0)(a2)
	; RV64-2048-NEXT: vsetvli zero, zero, e16, m2, ta, mu			; RV64-2048-NEXT: vsetvli zero, zero, e16, m2, ta, mu
	; RV64-2048-NEXT: vrgather.vv v12, v20, v18			; RV64-2048-NEXT: vrgather.vv v10, v20, v16
	; RV64-2048-NEXT: lui a2, 1026731
	; RV64-2048-NEXT: addiw a2, a2, -1365
	; RV64-2048-NEXT: slli a2, a2, 12
	; RV64-2048-NEXT: addi a2, a2, -1365
	; RV64-2048-NEXT: slli a2, a2, 12
	; RV64-2048-NEXT: addi a2, a2, -1365
	; RV64-2048-NEXT: slli a2, a2, 12
	; RV64-2048-NEXT: addi a2, a2, -1366
	; RV64-2048-NEXT: vsetivli zero, 4, e64, m1, ta, mu			; RV64-2048-NEXT: vsetivli zero, 4, e64, m1, ta, mu
	; RV64-2048-NEXT: vmv.s.x v14, a2			; RV64-2048-NEXT: vmv.s.x v12, a2
	; RV64-2048-NEXT: vsetivli zero, 2, e64, m1, tu, mu			; RV64-2048-NEXT: vsetivli zero, 2, e64, m1, tu, mu
	; RV64-2048-NEXT: vmv1r.v v0, v14			; RV64-2048-NEXT: vmv1r.v v0, v12
	; RV64-2048-NEXT: vslideup.vi v0, v14, 1			; RV64-2048-NEXT: vslideup.vi v0, v12, 1
	; RV64-2048-NEXT: vsetivli zero, 3, e64, m1, tu, mu			; RV64-2048-NEXT: vsetivli zero, 3, e64, m1, tu, mu
	; RV64-2048-NEXT: vslideup.vi v0, v14, 2			; RV64-2048-NEXT: vslideup.vi v0, v12, 2
	; RV64-2048-NEXT: vsetivli zero, 4, e64, m1, tu, mu			; RV64-2048-NEXT: vsetivli zero, 4, e64, m1, tu, mu
	; RV64-2048-NEXT: vslideup.vi v0, v14, 3			; RV64-2048-NEXT: vslideup.vi v0, v12, 3
	; RV64-2048-NEXT: vsetvli zero, a1, e16, m2, ta, mu			; RV64-2048-NEXT: vsetvli zero, a1, e16, m2, ta, mu
	; RV64-2048-NEXT: vrgather.vv v12, v8, v10, v0.t			; RV64-2048-NEXT: vrgather.vv v10, v8, v18, v0.t
	; RV64-2048-NEXT: vse16.v v12, (a0)			; RV64-2048-NEXT: vse16.v v10, (a0)
	; RV64-2048-NEXT: ret			; RV64-2048-NEXT: ret
	entry:			entry:
	%ve = load <128 x i16>, <128 x i16>* %0, align 256			%ve = load <128 x i16>, <128 x i16>* %0, align 256
	%vo = load <128 x i16>, <128 x i16>* %1, align 256			%vo = load <128 x i16>, <128 x i16>* %1, align 256
	%2 = shufflevector <128 x i16> %ve, <128 x i16> poison, <256 x i32> <i32 0, i32 undef, i32 1, i32 undef, i32 2, i32 undef, i32 3, i32 undef, i32 4, i32 undef, i32 5, i32 undef, i32 6, i32 undef, i32 7, i32 undef, i32 8, i32 undef, i32 9, i32 undef, i32 10, i32 undef, i32 11, i32 undef, i32 12, i32 undef, i32 13, i32 undef, i32 14, i32 undef, i32 15, i32 undef, i32 16, i32 undef, i32 17, i32 undef, i32 18, i32 undef, i32 19, i32 undef, i32 20, i32 undef, i32 21, i32 undef, i32 22, i32 undef, i32 23, i32 undef, i32 24, i32 undef, i32 25, i32 undef, i32 26, i32 undef, i32 27, i32 undef, i32 28, i32 undef, i32 29, i32 undef, i32 30, i32 undef, i32 31, i32 undef, i32 32, i32 undef, i32 33, i32 undef, i32 34, i32 undef, i32 35, i32 undef, i32 36, i32 undef, i32 37, i32 undef, i32 38, i32 undef, i32 39, i32 undef, i32 40, i32 undef, i32 41, i32 undef, i32 42, i32 undef, i32 43, i32 undef, i32 44, i32 undef, i32 45, i32 undef, i32 46, i32 undef, i32 47, i32 undef, i32 48, i32 undef, i32 49, i32 undef, i32 50, i32 undef, i32 51, i32 undef, i32 52, i32 undef, i32 53, i32 undef, i32 54, i32 undef, i32 55, i32 undef, i32 56, i32 undef, i32 57, i32 undef, i32 58, i32 undef, i32 59, i32 undef, i32 60, i32 undef, i32 61, i32 undef, i32 62, i32 undef, i32 63, i32 undef, i32 64, i32 undef, i32 65, i32 undef, i32 66, i32 undef, i32 67, i32 undef, i32 68, i32 undef, i32 69, i32 undef, i32 70, i32 undef, i32 71, i32 undef, i32 72, i32 undef, i32 73, i32 undef, i32 74, i32 undef, i32 75, i32 undef, i32 76, i32 undef, i32 77, i32 undef, i32 78, i32 undef, i32 79, i32 undef, i32 80, i32 undef, i32 81, i32 undef, i32 82, i32 undef, i32 83, i32 undef, i32 84, i32 undef, i32 85, i32 undef, i32 86, i32 undef, i32 87, i32 undef, i32 88, i32 undef, i32 89, i32 undef, i32 90, i32 undef, i32 91, i32 undef, i32 92, i32 undef, i32 93, i32 undef, i32 94, i32 undef, i32 95, i32 undef, i32 96, i32 undef, i32 97, i32 undef, i32 98, i32 undef, i32 99, i32 undef, i32 100, i32 undef, i32 101, i32 undef, i32 102, i32 undef, i32 103, i32 undef, i32 104, i32 undef, i32 105, i32 undef, i32 106, i32 undef, i32 107, i32 undef, i32 108, i32 undef, i32 109, i32 undef, i32 110, i32 undef, i32 111, i32 undef, i32 112, i32 undef, i32 113, i32 undef, i32 114, i32 undef, i32 115, i32 undef, i32 116, i32 undef, i32 117, i32 undef, i32 118, i32 undef, i32 119, i32 undef, i32 120, i32 undef, i32 121, i32 undef, i32 122, i32 undef, i32 123, i32 undef, i32 124, i32 undef, i32 125, i32 undef, i32 126, i32 undef, i32 127, i32 undef>			%2 = shufflevector <128 x i16> %ve, <128 x i16> poison, <256 x i32> <i32 0, i32 undef, i32 1, i32 undef, i32 2, i32 undef, i32 3, i32 undef, i32 4, i32 undef, i32 5, i32 undef, i32 6, i32 undef, i32 7, i32 undef, i32 8, i32 undef, i32 9, i32 undef, i32 10, i32 undef, i32 11, i32 undef, i32 12, i32 undef, i32 13, i32 undef, i32 14, i32 undef, i32 15, i32 undef, i32 16, i32 undef, i32 17, i32 undef, i32 18, i32 undef, i32 19, i32 undef, i32 20, i32 undef, i32 21, i32 undef, i32 22, i32 undef, i32 23, i32 undef, i32 24, i32 undef, i32 25, i32 undef, i32 26, i32 undef, i32 27, i32 undef, i32 28, i32 undef, i32 29, i32 undef, i32 30, i32 undef, i32 31, i32 undef, i32 32, i32 undef, i32 33, i32 undef, i32 34, i32 undef, i32 35, i32 undef, i32 36, i32 undef, i32 37, i32 undef, i32 38, i32 undef, i32 39, i32 undef, i32 40, i32 undef, i32 41, i32 undef, i32 42, i32 undef, i32 43, i32 undef, i32 44, i32 undef, i32 45, i32 undef, i32 46, i32 undef, i32 47, i32 undef, i32 48, i32 undef, i32 49, i32 undef, i32 50, i32 undef, i32 51, i32 undef, i32 52, i32 undef, i32 53, i32 undef, i32 54, i32 undef, i32 55, i32 undef, i32 56, i32 undef, i32 57, i32 undef, i32 58, i32 undef, i32 59, i32 undef, i32 60, i32 undef, i32 61, i32 undef, i32 62, i32 undef, i32 63, i32 undef, i32 64, i32 undef, i32 65, i32 undef, i32 66, i32 undef, i32 67, i32 undef, i32 68, i32 undef, i32 69, i32 undef, i32 70, i32 undef, i32 71, i32 undef, i32 72, i32 undef, i32 73, i32 undef, i32 74, i32 undef, i32 75, i32 undef, i32 76, i32 undef, i32 77, i32 undef, i32 78, i32 undef, i32 79, i32 undef, i32 80, i32 undef, i32 81, i32 undef, i32 82, i32 undef, i32 83, i32 undef, i32 84, i32 undef, i32 85, i32 undef, i32 86, i32 undef, i32 87, i32 undef, i32 88, i32 undef, i32 89, i32 undef, i32 90, i32 undef, i32 91, i32 undef, i32 92, i32 undef, i32 93, i32 undef, i32 94, i32 undef, i32 95, i32 undef, i32 96, i32 undef, i32 97, i32 undef, i32 98, i32 undef, i32 99, i32 undef, i32 100, i32 undef, i32 101, i32 undef, i32 102, i32 undef, i32 103, i32 undef, i32 104, i32 undef, i32 105, i32 undef, i32 106, i32 undef, i32 107, i32 undef, i32 108, i32 undef, i32 109, i32 undef, i32 110, i32 undef, i32 111, i32 undef, i32 112, i32 undef, i32 113, i32 undef, i32 114, i32 undef, i32 115, i32 undef, i32 116, i32 undef, i32 117, i32 undef, i32 118, i32 undef, i32 119, i32 undef, i32 120, i32 undef, i32 121, i32 undef, i32 122, i32 undef, i32 123, i32 undef, i32 124, i32 undef, i32 125, i32 undef, i32 126, i32 undef, i32 127, i32 undef>
	%3 = shufflevector <128 x i16> %vo, <128 x i16> poison, <256 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7, i32 8, i32 9, i32 10, i32 11, i32 12, i32 13, i32 14, i32 15, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31, i32 32, i32 33, i32 34, i32 35, i32 36, i32 37, i32 38, i32 39, i32 40, i32 41, i32 42, i32 43, i32 44, i32 45, i32 46, i32 47, i32 48, i32 49, i32 50, i32 51, i32 52, i32 53, i32 54, i32 55, i32 56, i32 57, i32 58, i32 59, i32 60, i32 61, i32 62, i32 63, i32 64, i32 65, i32 66, i32 67, i32 68, i32 69, i32 70, i32 71, i32 72, i32 73, i32 74, i32 75, i32 76, i32 77, i32 78, i32 79, i32 80, i32 81, i32 82, i32 83, i32 84, i32 85, i32 86, i32 87, i32 88, i32 89, i32 90, i32 91, i32 92, i32 93, i32 94, i32 95, i32 96, i32 97, i32 98, i32 99, i32 100, i32 101, i32 102, i32 103, i32 104, i32 105, i32 106, i32 107, i32 108, i32 109, i32 110, i32 111, i32 112, i32 113, i32 114, i32 115, i32 116, i32 117, i32 118, i32 119, i32 120, i32 121, i32 122, i32 123, i32 124, i32 125, i32 126, i32 127, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef>			%3 = shufflevector <128 x i16> %vo, <128 x i16> poison, <256 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7, i32 8, i32 9, i32 10, i32 11, i32 12, i32 13, i32 14, i32 15, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31, i32 32, i32 33, i32 34, i32 35, i32 36, i32 37, i32 38, i32 39, i32 40, i32 41, i32 42, i32 43, i32 44, i32 45, i32 46, i32 47, i32 48, i32 49, i32 50, i32 51, i32 52, i32 53, i32 54, i32 55, i32 56, i32 57, i32 58, i32 59, i32 60, i32 61, i32 62, i32 63, i32 64, i32 65, i32 66, i32 67, i32 68, i32 69, i32 70, i32 71, i32 72, i32 73, i32 74, i32 75, i32 76, i32 77, i32 78, i32 79, i32 80, i32 81, i32 82, i32 83, i32 84, i32 85, i32 86, i32 87, i32 88, i32 89, i32 90, i32 91, i32 92, i32 93, i32 94, i32 95, i32 96, i32 97, i32 98, i32 99, i32 100, i32 101, i32 102, i32 103, i32 104, i32 105, i32 106, i32 107, i32 108, i32 109, i32 110, i32 111, i32 112, i32 113, i32 114, i32 115, i32 116, i32 117, i32 118, i32 119, i32 120, i32 121, i32 122, i32 123, i32 124, i32 125, i32 126, i32 127, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef>
	%4 = shufflevector <256 x i16> %2, <256 x i16> %3, <256 x i32> <i32 0, i32 256, i32 2, i32 257, i32 4, i32 258, i32 6, i32 259, i32 8, i32 260, i32 10, i32 261, i32 12, i32 262, i32 14, i32 263, i32 16, i32 264, i32 18, i32 265, i32 20, i32 266, i32 22, i32 267, i32 24, i32 268, i32 26, i32 269, i32 28, i32 270, i32 30, i32 271, i32 32, i32 272, i32 34, i32 273, i32 36, i32 274, i32 38, i32 275, i32 40, i32 276, i32 42, i32 277, i32 44, i32 278, i32 46, i32 279, i32 48, i32 280, i32 50, i32 281, i32 52, i32 282, i32 54, i32 283, i32 56, i32 284, i32 58, i32 285, i32 60, i32 286, i32 62, i32 287, i32 64, i32 288, i32 66, i32 289, i32 68, i32 290, i32 70, i32 291, i32 72, i32 292, i32 74, i32 293, i32 76, i32 294, i32 78, i32 295, i32 80, i32 296, i32 82, i32 297, i32 84, i32 298, i32 86, i32 299, i32 88, i32 300, i32 90, i32 301, i32 92, i32 302, i32 94, i32 303, i32 96, i32 304, i32 98, i32 305, i32 100, i32 306, i32 102, i32 307, i32 104, i32 308, i32 106, i32 309, i32 108, i32 310, i32 110, i32 311, i32 112, i32 312, i32 114, i32 313, i32 116, i32 314, i32 118, i32 315, i32 120, i32 316, i32 122, i32 317, i32 124, i32 318, i32 126, i32 319, i32 128, i32 320, i32 130, i32 321, i32 132, i32 322, i32 134, i32 323, i32 136, i32 324, i32 138, i32 325, i32 140, i32 326, i32 142, i32 327, i32 144, i32 328, i32 146, i32 329, i32 148, i32 330, i32 150, i32 331, i32 152, i32 332, i32 154, i32 333, i32 156, i32 334, i32 158, i32 335, i32 160, i32 336, i32 162, i32 337, i32 164, i32 338, i32 166, i32 339, i32 168, i32 340, i32 170, i32 341, i32 172, i32 342, i32 174, i32 343, i32 176, i32 344, i32 178, i32 345, i32 180, i32 346, i32 182, i32 347, i32 184, i32 348, i32 186, i32 349, i32 188, i32 350, i32 190, i32 351, i32 192, i32 352, i32 194, i32 353, i32 196, i32 354, i32 198, i32 355, i32 200, i32 356, i32 202, i32 357, i32 204, i32 358, i32 206, i32 359, i32 208, i32 360, i32 210, i32 361, i32 212, i32 362, i32 214, i32 363, i32 216, i32 364, i32 218, i32 365, i32 220, i32 366, i32 222, i32 367, i32 224, i32 368, i32 226, i32 369, i32 228, i32 370, i32 230, i32 371, i32 232, i32 372, i32 234, i32 373, i32 236, i32 374, i32 238, i32 375, i32 240, i32 376, i32 242, i32 377, i32 244, i32 378, i32 246, i32 379, i32 248, i32 380, i32 250, i32 381, i32 252, i32 382, i32 254, i32 383>			%4 = shufflevector <256 x i16> %2, <256 x i16> %3, <256 x i32> <i32 0, i32 256, i32 2, i32 257, i32 4, i32 258, i32 6, i32 259, i32 8, i32 260, i32 10, i32 261, i32 12, i32 262, i32 14, i32 263, i32 16, i32 264, i32 18, i32 265, i32 20, i32 266, i32 22, i32 267, i32 24, i32 268, i32 26, i32 269, i32 28, i32 270, i32 30, i32 271, i32 32, i32 272, i32 34, i32 273, i32 36, i32 274, i32 38, i32 275, i32 40, i32 276, i32 42, i32 277, i32 44, i32 278, i32 46, i32 279, i32 48, i32 280, i32 50, i32 281, i32 52, i32 282, i32 54, i32 283, i32 56, i32 284, i32 58, i32 285, i32 60, i32 286, i32 62, i32 287, i32 64, i32 288, i32 66, i32 289, i32 68, i32 290, i32 70, i32 291, i32 72, i32 292, i32 74, i32 293, i32 76, i32 294, i32 78, i32 295, i32 80, i32 296, i32 82, i32 297, i32 84, i32 298, i32 86, i32 299, i32 88, i32 300, i32 90, i32 301, i32 92, i32 302, i32 94, i32 303, i32 96, i32 304, i32 98, i32 305, i32 100, i32 306, i32 102, i32 307, i32 104, i32 308, i32 106, i32 309, i32 108, i32 310, i32 110, i32 311, i32 112, i32 312, i32 114, i32 313, i32 116, i32 314, i32 118, i32 315, i32 120, i32 316, i32 122, i32 317, i32 124, i32 318, i32 126, i32 319, i32 128, i32 320, i32 130, i32 321, i32 132, i32 322, i32 134, i32 323, i32 136, i32 324, i32 138, i32 325, i32 140, i32 326, i32 142, i32 327, i32 144, i32 328, i32 146, i32 329, i32 148, i32 330, i32 150, i32 331, i32 152, i32 332, i32 154, i32 333, i32 156, i32 334, i32 158, i32 335, i32 160, i32 336, i32 162, i32 337, i32 164, i32 338, i32 166, i32 339, i32 168, i32 340, i32 170, i32 341, i32 172, i32 342, i32 174, i32 343, i32 176, i32 344, i32 178, i32 345, i32 180, i32 346, i32 182, i32 347, i32 184, i32 348, i32 186, i32 349, i32 188, i32 350, i32 190, i32 351, i32 192, i32 352, i32 194, i32 353, i32 196, i32 354, i32 198, i32 355, i32 200, i32 356, i32 202, i32 357, i32 204, i32 358, i32 206, i32 359, i32 208, i32 360, i32 210, i32 361, i32 212, i32 362, i32 214, i32 363, i32 216, i32 364, i32 218, i32 365, i32 220, i32 366, i32 222, i32 367, i32 224, i32 368, i32 226, i32 369, i32 228, i32 370, i32 230, i32 371, i32 232, i32 372, i32 234, i32 373, i32 236, i32 374, i32 238, i32 375, i32 240, i32 376, i32 242, i32 377, i32 244, i32 378, i32 246, i32 379, i32 248, i32 380, i32 250, i32 381, i32 252, i32 382, i32 254, i32 383>
	store <256 x i16> %4, <256 x i16>* %agg.result, align 512			store <256 x i16> %4, <256 x i16>* %agg.result, align 512
	ret void			ret void
	}			}

	define void @interleave512(<512 x i16>* %agg.result, <256 x i16>* %0, <256 x i16>* %1) local_unnamed_addr {			define void @interleave512(<512 x i16>* %agg.result, <256 x i16>* %0, <256 x i16>* %1) local_unnamed_addr {
	; RV64-1024-LABEL: interleave512:			; RV64-1024-LABEL: interleave512:
	; RV64-1024: # %bb.0: # %entry			; RV64-1024: # %bb.0: # %entry
	; RV64-1024-NEXT: addi sp, sp, -16			; RV64-1024-NEXT: addi sp, sp, -16
	; RV64-1024-NEXT: .cfi_def_cfa_offset 16			; RV64-1024-NEXT: .cfi_def_cfa_offset 16
	; RV64-1024-NEXT: csrr a3, vlenb			; RV64-1024-NEXT: csrr a3, vlenb
	; RV64-1024-NEXT: li a4, 40			; RV64-1024-NEXT: li a4, 40
	; RV64-1024-NEXT: mul a3, a3, a4			; RV64-1024-NEXT: mul a3, a3, a4
	; RV64-1024-NEXT: sub sp, sp, a3			; RV64-1024-NEXT: sub sp, sp, a3
	; RV64-1024-NEXT: li a3, 256			; RV64-1024-NEXT: li a3, 256
	; RV64-1024-NEXT: vsetvli zero, a3, e16, m4, ta, mu			; RV64-1024-NEXT: vsetvli zero, a3, e16, m4, ta, mu
	; RV64-1024-NEXT: vle16.v v16, (a1)			; RV64-1024-NEXT: vle16.v v24, (a1)
	; RV64-1024-NEXT: vle16.v v8, (a2)			; RV64-1024-NEXT: vle16.v v8, (a2)
	; RV64-1024-NEXT: csrr a1, vlenb			; RV64-1024-NEXT: csrr a1, vlenb
	; RV64-1024-NEXT: slli a1, a1, 4			; RV64-1024-NEXT: li a2, 24
				; RV64-1024-NEXT: mul a1, a1, a2
	; RV64-1024-NEXT: add a1, sp, a1			; RV64-1024-NEXT: add a1, sp, a1
	; RV64-1024-NEXT: addi a1, a1, 16			; RV64-1024-NEXT: addi a1, a1, 16
	; RV64-1024-NEXT: vs8r.v v8, (a1) # Unknown-size Folded Spill			; RV64-1024-NEXT: vs8r.v v8, (a1) # Unknown-size Folded Spill
	; RV64-1024-NEXT: li a1, 512			; RV64-1024-NEXT: li a1, 512
	; RV64-1024-NEXT: vsetvli zero, a1, e16, m8, ta, mu			; RV64-1024-NEXT: vsetvli zero, a1, e16, m8, ta, mu
	; RV64-1024-NEXT: vmv.v.i v8, 0			; RV64-1024-NEXT: vmv.v.i v8, 0
	; RV64-1024-NEXT: csrr a2, vlenb			; RV64-1024-NEXT: csrr a2, vlenb
	; RV64-1024-NEXT: slli a2, a2, 5			; RV64-1024-NEXT: slli a2, a2, 4
	; RV64-1024-NEXT: add a2, sp, a2			; RV64-1024-NEXT: add a2, sp, a2
	; RV64-1024-NEXT: addi a2, a2, 16			; RV64-1024-NEXT: addi a2, a2, 16
	; RV64-1024-NEXT: vs8r.v v8, (a2) # Unknown-size Folded Spill			; RV64-1024-NEXT: vs8r.v v8, (a2) # Unknown-size Folded Spill
	; RV64-1024-NEXT: vsetvli zero, a3, e16, m8, tu, mu			; RV64-1024-NEXT: vsetvli zero, a3, e16, m8, tu, mu
	; RV64-1024-NEXT: vslideup.vi v8, v16, 0			; RV64-1024-NEXT: vslideup.vi v8, v24, 0
	; RV64-1024-NEXT: vsetvli zero, a3, e16, m4, ta, mu			; RV64-1024-NEXT: vsetvli zero, a3, e16, m4, ta, mu
	; RV64-1024-NEXT: vmv.v.i v16, 0			; RV64-1024-NEXT: vmv.v.i v16, 0
	; RV64-1024-NEXT: addi a2, sp, 16			; RV64-1024-NEXT: addi a2, sp, 16
	; RV64-1024-NEXT: vs8r.v v16, (a2) # Unknown-size Folded Spill			; RV64-1024-NEXT: vs8r.v v16, (a2) # Unknown-size Folded Spill
	; RV64-1024-NEXT: vsetvli zero, a1, e16, m8, tu, mu			; RV64-1024-NEXT: vsetvli zero, a1, e16, m8, tu, mu
	; RV64-1024-NEXT: vslideup.vx v8, v16, a3			; RV64-1024-NEXT: vslideup.vx v8, v16, a3
	; RV64-1024-NEXT: vsetvli zero, zero, e16, m8, ta, mu			; RV64-1024-NEXT: vsetvli zero, zero, e16, m8, ta, mu
	; RV64-1024-NEXT: vid.v v24			; RV64-1024-NEXT: vid.v v24
	; RV64-1024-NEXT: vsrl.vi v16, v24, 1			; RV64-1024-NEXT: vsrl.vi v16, v24, 1
	; RV64-1024-NEXT: csrr a2, vlenb			; RV64-1024-NEXT: csrr a2, vlenb
	; RV64-1024-NEXT: li a4, 24			; RV64-1024-NEXT: slli a2, a2, 5
	; RV64-1024-NEXT: mul a2, a2, a4
	; RV64-1024-NEXT: add a2, sp, a2			; RV64-1024-NEXT: add a2, sp, a2
	; RV64-1024-NEXT: addi a2, a2, 16			; RV64-1024-NEXT: addi a2, a2, 16
	; RV64-1024-NEXT: vs8r.v v16, (a2) # Unknown-size Folded Spill			; RV64-1024-NEXT: vs8r.v v16, (a2) # Unknown-size Folded Spill
	; RV64-1024-NEXT: vrgather.vv v0, v8, v16			; RV64-1024-NEXT: vrgather.vv v0, v8, v16
	; RV64-1024-NEXT: csrr a2, vlenb			; RV64-1024-NEXT: csrr a2, vlenb
	; RV64-1024-NEXT: slli a2, a2, 3			; RV64-1024-NEXT: slli a2, a2, 3
	; RV64-1024-NEXT: add a2, sp, a2			; RV64-1024-NEXT: add a2, sp, a2
	; RV64-1024-NEXT: addi a2, a2, 16			; RV64-1024-NEXT: addi a2, a2, 16
	; RV64-1024-NEXT: vs8r.v v0, (a2) # Unknown-size Folded Spill			; RV64-1024-NEXT: vs8r.v v0, (a2) # Unknown-size Folded Spill
	; RV64-1024-NEXT: vsetvli zero, a3, e16, m8, tu, mu			; RV64-1024-NEXT: vsetvli zero, a3, e16, m8, tu, mu
	; RV64-1024-NEXT: csrr a2, vlenb			; RV64-1024-NEXT: csrr a2, vlenb
	; RV64-1024-NEXT: slli a2, a2, 5
	; RV64-1024-NEXT: add a2, sp, a2
	; RV64-1024-NEXT: addi a2, a2, 16
	; RV64-1024-NEXT: vl8re8.v v8, (a2) # Unknown-size Folded Reload
	; RV64-1024-NEXT: csrr a2, vlenb
	; RV64-1024-NEXT: slli a2, a2, 4			; RV64-1024-NEXT: slli a2, a2, 4
	; RV64-1024-NEXT: add a2, sp, a2			; RV64-1024-NEXT: add a2, sp, a2
	; RV64-1024-NEXT: addi a2, a2, 16			; RV64-1024-NEXT: addi a2, a2, 16
	; RV64-1024-NEXT: vl8re8.v v16, (a2) # Unknown-size Folded Reload			; RV64-1024-NEXT: vl8re8.v v16, (a2) # Unknown-size Folded Reload
	; RV64-1024-NEXT: vslideup.vi v8, v16, 0
	; RV64-1024-NEXT: vsetvli zero, a1, e16, m8, tu, mu
	; RV64-1024-NEXT: addi a2, sp, 16
	; RV64-1024-NEXT: vl8re8.v v16, (a2) # Unknown-size Folded Reload
	; RV64-1024-NEXT: vslideup.vx v8, v16, a3
	; RV64-1024-NEXT: csrr a2, vlenb			; RV64-1024-NEXT: csrr a2, vlenb
	; RV64-1024-NEXT: slli a2, a2, 5			; RV64-1024-NEXT: li a4, 24
				; RV64-1024-NEXT: mul a2, a2, a4
	; RV64-1024-NEXT: add a2, sp, a2			; RV64-1024-NEXT: add a2, sp, a2
	; RV64-1024-NEXT: addi a2, a2, 16			; RV64-1024-NEXT: addi a2, a2, 16
	; RV64-1024-NEXT: vs8r.v v8, (a2) # Unknown-size Folded Spill			; RV64-1024-NEXT: vl8re8.v v8, (a2) # Unknown-size Folded Reload
				; RV64-1024-NEXT: vslideup.vi v16, v8, 0
				; RV64-1024-NEXT: vsetvli zero, a1, e16, m8, tu, mu
				; RV64-1024-NEXT: addi a2, sp, 16
				; RV64-1024-NEXT: vl8re8.v v8, (a2) # Unknown-size Folded Reload
				; RV64-1024-NEXT: vslideup.vx v16, v8, a3
				; RV64-1024-NEXT: lui a2, %hi(.LCPI1_0)
				; RV64-1024-NEXT: ld a2, %lo(.LCPI1_0)(a2)
	; RV64-1024-NEXT: vsetvli zero, zero, e16, m8, ta, mu			; RV64-1024-NEXT: vsetvli zero, zero, e16, m8, ta, mu
	; RV64-1024-NEXT: csrr a2, vlenb			; RV64-1024-NEXT: csrr a3, vlenb
	; RV64-1024-NEXT: slli a2, a2, 3			; RV64-1024-NEXT: slli a3, a3, 3
	; RV64-1024-NEXT: add a2, sp, a2			; RV64-1024-NEXT: add a3, sp, a3
	; RV64-1024-NEXT: addi a2, a2, 16			; RV64-1024-NEXT: addi a3, a3, 16
	; RV64-1024-NEXT: vl8re8.v v16, (a2) # Unknown-size Folded Reload			; RV64-1024-NEXT: vl8re8.v v0, (a3) # Unknown-size Folded Reload
	; RV64-1024-NEXT: vrgather.vv v8, v16, v24			; RV64-1024-NEXT: vrgather.vv v8, v0, v24
	; RV64-1024-NEXT: lui a2, 1026731
	; RV64-1024-NEXT: addiw a2, a2, -1365
	; RV64-1024-NEXT: slli a2, a2, 12
	; RV64-1024-NEXT: addi a2, a2, -1365
	; RV64-1024-NEXT: slli a2, a2, 12
	; RV64-1024-NEXT: addi a2, a2, -1365
	; RV64-1024-NEXT: slli a2, a2, 12
	; RV64-1024-NEXT: addi a2, a2, -1366
	; RV64-1024-NEXT: vsetivli zero, 8, e64, m1, ta, mu			; RV64-1024-NEXT: vsetivli zero, 8, e64, m1, ta, mu
	; RV64-1024-NEXT: vmv.s.x v16, a2			; RV64-1024-NEXT: vmv.s.x v24, a2
	; RV64-1024-NEXT: vsetivli zero, 2, e64, m1, tu, mu			; RV64-1024-NEXT: vsetivli zero, 2, e64, m1, tu, mu
	; RV64-1024-NEXT: vmv1r.v v0, v16			; RV64-1024-NEXT: vmv1r.v v0, v24
	; RV64-1024-NEXT: vslideup.vi v0, v16, 1			; RV64-1024-NEXT: vslideup.vi v0, v24, 1
	; RV64-1024-NEXT: vsetivli zero, 3, e64, m1, tu, mu			; RV64-1024-NEXT: vsetivli zero, 3, e64, m1, tu, mu
	; RV64-1024-NEXT: vslideup.vi v0, v16, 2			; RV64-1024-NEXT: vslideup.vi v0, v24, 2
	; RV64-1024-NEXT: vsetivli zero, 4, e64, m1, tu, mu			; RV64-1024-NEXT: vsetivli zero, 4, e64, m1, tu, mu
	; RV64-1024-NEXT: vslideup.vi v0, v16, 3			; RV64-1024-NEXT: vslideup.vi v0, v24, 3
	; RV64-1024-NEXT: vsetivli zero, 5, e64, m1, tu, mu			; RV64-1024-NEXT: vsetivli zero, 5, e64, m1, tu, mu
	; RV64-1024-NEXT: vslideup.vi v0, v16, 4			; RV64-1024-NEXT: vslideup.vi v0, v24, 4
	; RV64-1024-NEXT: vsetivli zero, 6, e64, m1, tu, mu			; RV64-1024-NEXT: vsetivli zero, 6, e64, m1, tu, mu
	; RV64-1024-NEXT: vslideup.vi v0, v16, 5			; RV64-1024-NEXT: vslideup.vi v0, v24, 5
	; RV64-1024-NEXT: vsetivli zero, 7, e64, m1, tu, mu			; RV64-1024-NEXT: vsetivli zero, 7, e64, m1, tu, mu
	; RV64-1024-NEXT: vslideup.vi v0, v16, 6			; RV64-1024-NEXT: vslideup.vi v0, v24, 6
	; RV64-1024-NEXT: vsetivli zero, 8, e64, m1, tu, mu			; RV64-1024-NEXT: vsetivli zero, 8, e64, m1, tu, mu
	; RV64-1024-NEXT: vslideup.vi v0, v16, 7			; RV64-1024-NEXT: vslideup.vi v0, v24, 7
	; RV64-1024-NEXT: vsetvli zero, a1, e16, m8, ta, mu			; RV64-1024-NEXT: vsetvli zero, a1, e16, m8, ta, mu
	; RV64-1024-NEXT: csrr a1, vlenb			; RV64-1024-NEXT: csrr a1, vlenb
	; RV64-1024-NEXT: li a2, 24
	; RV64-1024-NEXT: mul a1, a1, a2
	; RV64-1024-NEXT: add a1, sp, a1
	; RV64-1024-NEXT: addi a1, a1, 16
	; RV64-1024-NEXT: vl8re8.v v16, (a1) # Unknown-size Folded Reload
	; RV64-1024-NEXT: csrr a1, vlenb
	; RV64-1024-NEXT: slli a1, a1, 5			; RV64-1024-NEXT: slli a1, a1, 5
	; RV64-1024-NEXT: add a1, sp, a1			; RV64-1024-NEXT: add a1, sp, a1
	; RV64-1024-NEXT: addi a1, a1, 16			; RV64-1024-NEXT: addi a1, a1, 16
	; RV64-1024-NEXT: vl8re8.v v24, (a1) # Unknown-size Folded Reload			; RV64-1024-NEXT: vl8re8.v v24, (a1) # Unknown-size Folded Reload
	; RV64-1024-NEXT: vrgather.vv v8, v24, v16, v0.t			; RV64-1024-NEXT: vrgather.vv v8, v16, v24, v0.t
	; RV64-1024-NEXT: vse16.v v8, (a0)			; RV64-1024-NEXT: vse16.v v8, (a0)
	; RV64-1024-NEXT: csrr a0, vlenb			; RV64-1024-NEXT: csrr a0, vlenb
	; RV64-1024-NEXT: li a1, 40			; RV64-1024-NEXT: li a1, 40
	; RV64-1024-NEXT: mul a0, a0, a1			; RV64-1024-NEXT: mul a0, a0, a1
	; RV64-1024-NEXT: add sp, sp, a0			; RV64-1024-NEXT: add sp, sp, a0
	; RV64-1024-NEXT: addi sp, sp, 16			; RV64-1024-NEXT: addi sp, sp, 16
	; RV64-1024-NEXT: ret			; RV64-1024-NEXT: ret
	;			;
	Show All 16 Lines
	; RV64-2048-NEXT: vsetvli zero, zero, e16, m4, ta, mu			; RV64-2048-NEXT: vsetvli zero, zero, e16, m4, ta, mu
	; RV64-2048-NEXT: vid.v v28			; RV64-2048-NEXT: vid.v v28
	; RV64-2048-NEXT: vsrl.vi v12, v28, 1			; RV64-2048-NEXT: vsrl.vi v12, v28, 1
	; RV64-2048-NEXT: vrgather.vv v0, v20, v12			; RV64-2048-NEXT: vrgather.vv v0, v20, v12
	; RV64-2048-NEXT: vsetvli zero, a3, e16, m4, tu, mu			; RV64-2048-NEXT: vsetvli zero, a3, e16, m4, tu, mu
	; RV64-2048-NEXT: vslideup.vi v8, v16, 0			; RV64-2048-NEXT: vslideup.vi v8, v16, 0
	; RV64-2048-NEXT: vsetvli zero, a1, e16, m4, tu, mu			; RV64-2048-NEXT: vsetvli zero, a1, e16, m4, tu, mu
	; RV64-2048-NEXT: vslideup.vx v8, v24, a3			; RV64-2048-NEXT: vslideup.vx v8, v24, a3
				; RV64-2048-NEXT: lui a2, %hi(.LCPI1_0)
				; RV64-2048-NEXT: ld a2, %lo(.LCPI1_0)(a2)
	; RV64-2048-NEXT: vsetvli zero, zero, e16, m4, ta, mu			; RV64-2048-NEXT: vsetvli zero, zero, e16, m4, ta, mu
	; RV64-2048-NEXT: vrgather.vv v16, v0, v28			; RV64-2048-NEXT: vrgather.vv v16, v0, v28
	; RV64-2048-NEXT: lui a2, 1026731
	; RV64-2048-NEXT: addiw a2, a2, -1365
	; RV64-2048-NEXT: slli a2, a2, 12
	; RV64-2048-NEXT: addi a2, a2, -1365
	; RV64-2048-NEXT: slli a2, a2, 12
	; RV64-2048-NEXT: addi a2, a2, -1365
	; RV64-2048-NEXT: slli a2, a2, 12
	; RV64-2048-NEXT: addi a2, a2, -1366
	; RV64-2048-NEXT: vsetivli zero, 8, e64, m1, ta, mu			; RV64-2048-NEXT: vsetivli zero, 8, e64, m1, ta, mu
	; RV64-2048-NEXT: vmv.s.x v20, a2			; RV64-2048-NEXT: vmv.s.x v20, a2
	; RV64-2048-NEXT: vsetivli zero, 2, e64, m1, tu, mu			; RV64-2048-NEXT: vsetivli zero, 2, e64, m1, tu, mu
	; RV64-2048-NEXT: vmv1r.v v0, v20			; RV64-2048-NEXT: vmv1r.v v0, v20
	; RV64-2048-NEXT: vslideup.vi v0, v20, 1			; RV64-2048-NEXT: vslideup.vi v0, v20, 1
	; RV64-2048-NEXT: vsetivli zero, 3, e64, m1, tu, mu			; RV64-2048-NEXT: vsetivli zero, 3, e64, m1, tu, mu
	; RV64-2048-NEXT: vslideup.vi v0, v20, 2			; RV64-2048-NEXT: vslideup.vi v0, v20, 2
	; RV64-2048-NEXT: vsetivli zero, 4, e64, m1, tu, mu			; RV64-2048-NEXT: vsetivli zero, 4, e64, m1, tu, mu
	Show All 22 Lines

llvm/test/CodeGen/RISCV/rvv/vdiv-sdnode.ll

	Show First 20 Lines • Show All 912 Lines • ▼ Show 20 Lines
	; RV32-NEXT: vsrl.vx v9, v8, a0			; RV32-NEXT: vsrl.vx v9, v8, a0
	; RV32-NEXT: vsra.vi v8, v8, 1			; RV32-NEXT: vsra.vi v8, v8, 1
	; RV32-NEXT: vadd.vv v8, v8, v9			; RV32-NEXT: vadd.vv v8, v8, v9
	; RV32-NEXT: addi sp, sp, 16			; RV32-NEXT: addi sp, sp, 16
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: vdiv_vi_nxv1i64_0:			; RV64-LABEL: vdiv_vi_nxv1i64_0:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: lui a0, 1029851			; RV64-NEXT: lui a0, %hi(.LCPI58_0)
	; RV64-NEXT: addiw a0, a0, 1755			; RV64-NEXT: ld a0, %lo(.LCPI58_0)(a0)
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1755
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1755
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1755
	; RV64-NEXT: vsetvli a1, zero, e64, m1, ta, mu			; RV64-NEXT: vsetvli a1, zero, e64, m1, ta, mu
	; RV64-NEXT: vmulh.vx v8, v8, a0			; RV64-NEXT: vmulh.vx v8, v8, a0
	; RV64-NEXT: li a0, 63			; RV64-NEXT: li a0, 63
	; RV64-NEXT: vsrl.vx v9, v8, a0			; RV64-NEXT: vsrl.vx v9, v8, a0
	; RV64-NEXT: vsra.vi v8, v8, 1			; RV64-NEXT: vsra.vi v8, v8, 1
	; RV64-NEXT: vadd.vv v8, v8, v9			; RV64-NEXT: vadd.vv v8, v8, v9
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%head = insertelement <vscale x 1 x i64> undef, i64 -7, i32 0			%head = insertelement <vscale x 1 x i64> undef, i64 -7, i32 0
	▲ Show 20 Lines • Show All 56 Lines • ▼ Show 20 Lines
	; RV32-NEXT: vsrl.vx v10, v8, a0			; RV32-NEXT: vsrl.vx v10, v8, a0
	; RV32-NEXT: vsra.vi v8, v8, 1			; RV32-NEXT: vsra.vi v8, v8, 1
	; RV32-NEXT: vadd.vv v8, v8, v10			; RV32-NEXT: vadd.vv v8, v8, v10
	; RV32-NEXT: addi sp, sp, 16			; RV32-NEXT: addi sp, sp, 16
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: vdiv_vi_nxv2i64_0:			; RV64-LABEL: vdiv_vi_nxv2i64_0:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: lui a0, 1029851			; RV64-NEXT: lui a0, %hi(.LCPI61_0)
	; RV64-NEXT: addiw a0, a0, 1755			; RV64-NEXT: ld a0, %lo(.LCPI61_0)(a0)
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1755
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1755
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1755
	; RV64-NEXT: vsetvli a1, zero, e64, m2, ta, mu			; RV64-NEXT: vsetvli a1, zero, e64, m2, ta, mu
	; RV64-NEXT: vmulh.vx v8, v8, a0			; RV64-NEXT: vmulh.vx v8, v8, a0
	; RV64-NEXT: li a0, 63			; RV64-NEXT: li a0, 63
	; RV64-NEXT: vsrl.vx v10, v8, a0			; RV64-NEXT: vsrl.vx v10, v8, a0
	; RV64-NEXT: vsra.vi v8, v8, 1			; RV64-NEXT: vsra.vi v8, v8, 1
	; RV64-NEXT: vadd.vv v8, v8, v10			; RV64-NEXT: vadd.vv v8, v8, v10
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%head = insertelement <vscale x 2 x i64> undef, i64 -7, i32 0			%head = insertelement <vscale x 2 x i64> undef, i64 -7, i32 0
	▲ Show 20 Lines • Show All 56 Lines • ▼ Show 20 Lines
	; RV32-NEXT: vsrl.vx v12, v8, a0			; RV32-NEXT: vsrl.vx v12, v8, a0
	; RV32-NEXT: vsra.vi v8, v8, 1			; RV32-NEXT: vsra.vi v8, v8, 1
	; RV32-NEXT: vadd.vv v8, v8, v12			; RV32-NEXT: vadd.vv v8, v8, v12
	; RV32-NEXT: addi sp, sp, 16			; RV32-NEXT: addi sp, sp, 16
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: vdiv_vi_nxv4i64_0:			; RV64-LABEL: vdiv_vi_nxv4i64_0:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: lui a0, 1029851			; RV64-NEXT: lui a0, %hi(.LCPI64_0)
	; RV64-NEXT: addiw a0, a0, 1755			; RV64-NEXT: ld a0, %lo(.LCPI64_0)(a0)
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1755
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1755
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1755
	; RV64-NEXT: vsetvli a1, zero, e64, m4, ta, mu			; RV64-NEXT: vsetvli a1, zero, e64, m4, ta, mu
	; RV64-NEXT: vmulh.vx v8, v8, a0			; RV64-NEXT: vmulh.vx v8, v8, a0
	; RV64-NEXT: li a0, 63			; RV64-NEXT: li a0, 63
	; RV64-NEXT: vsrl.vx v12, v8, a0			; RV64-NEXT: vsrl.vx v12, v8, a0
	; RV64-NEXT: vsra.vi v8, v8, 1			; RV64-NEXT: vsra.vi v8, v8, 1
	; RV64-NEXT: vadd.vv v8, v8, v12			; RV64-NEXT: vadd.vv v8, v8, v12
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%head = insertelement <vscale x 4 x i64> undef, i64 -7, i32 0			%head = insertelement <vscale x 4 x i64> undef, i64 -7, i32 0
	▲ Show 20 Lines • Show All 56 Lines • ▼ Show 20 Lines
	; RV32-NEXT: vsrl.vx v16, v8, a0			; RV32-NEXT: vsrl.vx v16, v8, a0
	; RV32-NEXT: vsra.vi v8, v8, 1			; RV32-NEXT: vsra.vi v8, v8, 1
	; RV32-NEXT: vadd.vv v8, v8, v16			; RV32-NEXT: vadd.vv v8, v8, v16
	; RV32-NEXT: addi sp, sp, 16			; RV32-NEXT: addi sp, sp, 16
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: vdiv_vi_nxv8i64_0:			; RV64-LABEL: vdiv_vi_nxv8i64_0:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: lui a0, 1029851			; RV64-NEXT: lui a0, %hi(.LCPI67_0)
	; RV64-NEXT: addiw a0, a0, 1755			; RV64-NEXT: ld a0, %lo(.LCPI67_0)(a0)
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1755
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1755
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1755
	; RV64-NEXT: vsetvli a1, zero, e64, m8, ta, mu			; RV64-NEXT: vsetvli a1, zero, e64, m8, ta, mu
	; RV64-NEXT: vmulh.vx v8, v8, a0			; RV64-NEXT: vmulh.vx v8, v8, a0
	; RV64-NEXT: li a0, 63			; RV64-NEXT: li a0, 63
	; RV64-NEXT: vsrl.vx v16, v8, a0			; RV64-NEXT: vsrl.vx v16, v8, a0
	; RV64-NEXT: vsra.vi v8, v8, 1			; RV64-NEXT: vsra.vi v8, v8, 1
	; RV64-NEXT: vadd.vv v8, v8, v16			; RV64-NEXT: vadd.vv v8, v8, v16
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%head = insertelement <vscale x 8 x i64> undef, i64 -7, i32 0			%head = insertelement <vscale x 8 x i64> undef, i64 -7, i32 0
	%splat = shufflevector <vscale x 8 x i64> %head, <vscale x 8 x i64> undef, <vscale x 8 x i32> zeroinitializer			%splat = shufflevector <vscale x 8 x i64> %head, <vscale x 8 x i64> undef, <vscale x 8 x i32> zeroinitializer
	%vc = sdiv <vscale x 8 x i64> %va, %splat			%vc = sdiv <vscale x 8 x i64> %va, %splat
	ret <vscale x 8 x i64> %vc			ret <vscale x 8 x i64> %vc
	}			}

llvm/test/CodeGen/RISCV/rvv/vrem-sdnode.ll

	Show First 20 Lines • Show All 948 Lines • ▼ Show 20 Lines
	; RV32-NEXT: vadd.vv v9, v9, v10			; RV32-NEXT: vadd.vv v9, v9, v10
	; RV32-NEXT: li a0, -7			; RV32-NEXT: li a0, -7
	; RV32-NEXT: vnmsac.vx v8, a0, v9			; RV32-NEXT: vnmsac.vx v8, a0, v9
	; RV32-NEXT: addi sp, sp, 16			; RV32-NEXT: addi sp, sp, 16
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: vrem_vi_nxv1i64_0:			; RV64-LABEL: vrem_vi_nxv1i64_0:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: lui a0, 1029851			; RV64-NEXT: lui a0, %hi(.LCPI56_0)
	; RV64-NEXT: addiw a0, a0, 1755			; RV64-NEXT: ld a0, %lo(.LCPI56_0)(a0)
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1755
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1755
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1755
	; RV64-NEXT: vsetvli a1, zero, e64, m1, ta, mu			; RV64-NEXT: vsetvli a1, zero, e64, m1, ta, mu
	; RV64-NEXT: vmulh.vx v9, v8, a0			; RV64-NEXT: vmulh.vx v9, v8, a0
	; RV64-NEXT: li a0, 63			; RV64-NEXT: li a0, 63
	; RV64-NEXT: vsrl.vx v10, v9, a0			; RV64-NEXT: vsrl.vx v10, v9, a0
	; RV64-NEXT: vsra.vi v9, v9, 1			; RV64-NEXT: vsra.vi v9, v9, 1
	; RV64-NEXT: vadd.vv v9, v9, v10			; RV64-NEXT: vadd.vv v9, v9, v10
	; RV64-NEXT: li a0, -7			; RV64-NEXT: li a0, -7
	; RV64-NEXT: vnmsac.vx v8, a0, v9			; RV64-NEXT: vnmsac.vx v8, a0, v9
	▲ Show 20 Lines • Show All 60 Lines • ▼ Show 20 Lines
	; RV32-NEXT: vadd.vv v10, v10, v12			; RV32-NEXT: vadd.vv v10, v10, v12
	; RV32-NEXT: li a0, -7			; RV32-NEXT: li a0, -7
	; RV32-NEXT: vnmsac.vx v8, a0, v10			; RV32-NEXT: vnmsac.vx v8, a0, v10
	; RV32-NEXT: addi sp, sp, 16			; RV32-NEXT: addi sp, sp, 16
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: vrem_vi_nxv2i64_0:			; RV64-LABEL: vrem_vi_nxv2i64_0:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: lui a0, 1029851			; RV64-NEXT: lui a0, %hi(.LCPI59_0)
	; RV64-NEXT: addiw a0, a0, 1755			; RV64-NEXT: ld a0, %lo(.LCPI59_0)(a0)
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1755
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1755
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1755
	; RV64-NEXT: vsetvli a1, zero, e64, m2, ta, mu			; RV64-NEXT: vsetvli a1, zero, e64, m2, ta, mu
	; RV64-NEXT: vmulh.vx v10, v8, a0			; RV64-NEXT: vmulh.vx v10, v8, a0
	; RV64-NEXT: li a0, 63			; RV64-NEXT: li a0, 63
	; RV64-NEXT: vsrl.vx v12, v10, a0			; RV64-NEXT: vsrl.vx v12, v10, a0
	; RV64-NEXT: vsra.vi v10, v10, 1			; RV64-NEXT: vsra.vi v10, v10, 1
	; RV64-NEXT: vadd.vv v10, v10, v12			; RV64-NEXT: vadd.vv v10, v10, v12
	; RV64-NEXT: li a0, -7			; RV64-NEXT: li a0, -7
	; RV64-NEXT: vnmsac.vx v8, a0, v10			; RV64-NEXT: vnmsac.vx v8, a0, v10
	▲ Show 20 Lines • Show All 60 Lines • ▼ Show 20 Lines
	; RV32-NEXT: vadd.vv v12, v12, v16			; RV32-NEXT: vadd.vv v12, v12, v16
	; RV32-NEXT: li a0, -7			; RV32-NEXT: li a0, -7
	; RV32-NEXT: vnmsac.vx v8, a0, v12			; RV32-NEXT: vnmsac.vx v8, a0, v12
	; RV32-NEXT: addi sp, sp, 16			; RV32-NEXT: addi sp, sp, 16
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: vrem_vi_nxv4i64_0:			; RV64-LABEL: vrem_vi_nxv4i64_0:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: lui a0, 1029851			; RV64-NEXT: lui a0, %hi(.LCPI62_0)
	; RV64-NEXT: addiw a0, a0, 1755			; RV64-NEXT: ld a0, %lo(.LCPI62_0)(a0)
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1755
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1755
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1755
	; RV64-NEXT: vsetvli a1, zero, e64, m4, ta, mu			; RV64-NEXT: vsetvli a1, zero, e64, m4, ta, mu
	; RV64-NEXT: vmulh.vx v12, v8, a0			; RV64-NEXT: vmulh.vx v12, v8, a0
	; RV64-NEXT: li a0, 63			; RV64-NEXT: li a0, 63
	; RV64-NEXT: vsrl.vx v16, v12, a0			; RV64-NEXT: vsrl.vx v16, v12, a0
	; RV64-NEXT: vsra.vi v12, v12, 1			; RV64-NEXT: vsra.vi v12, v12, 1
	; RV64-NEXT: vadd.vv v12, v12, v16			; RV64-NEXT: vadd.vv v12, v12, v16
	; RV64-NEXT: li a0, -7			; RV64-NEXT: li a0, -7
	; RV64-NEXT: vnmsac.vx v8, a0, v12			; RV64-NEXT: vnmsac.vx v8, a0, v12
	▲ Show 20 Lines • Show All 60 Lines • ▼ Show 20 Lines
	; RV32-NEXT: vadd.vv v16, v16, v24			; RV32-NEXT: vadd.vv v16, v16, v24
	; RV32-NEXT: li a0, -7			; RV32-NEXT: li a0, -7
	; RV32-NEXT: vnmsac.vx v8, a0, v16			; RV32-NEXT: vnmsac.vx v8, a0, v16
	; RV32-NEXT: addi sp, sp, 16			; RV32-NEXT: addi sp, sp, 16
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: vrem_vi_nxv8i64_0:			; RV64-LABEL: vrem_vi_nxv8i64_0:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: lui a0, 1029851			; RV64-NEXT: lui a0, %hi(.LCPI65_0)
	; RV64-NEXT: addiw a0, a0, 1755			; RV64-NEXT: ld a0, %lo(.LCPI65_0)(a0)
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1755
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1755
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, 1755
	; RV64-NEXT: vsetvli a1, zero, e64, m8, ta, mu			; RV64-NEXT: vsetvli a1, zero, e64, m8, ta, mu
	; RV64-NEXT: vmulh.vx v16, v8, a0			; RV64-NEXT: vmulh.vx v16, v8, a0
	; RV64-NEXT: li a0, 63			; RV64-NEXT: li a0, 63
	; RV64-NEXT: vsrl.vx v24, v16, a0			; RV64-NEXT: vsrl.vx v24, v16, a0
	; RV64-NEXT: vsra.vi v16, v16, 1			; RV64-NEXT: vsra.vi v16, v16, 1
	; RV64-NEXT: vadd.vv v16, v16, v24			; RV64-NEXT: vadd.vv v16, v16, v24
	; RV64-NEXT: li a0, -7			; RV64-NEXT: li a0, -7
	; RV64-NEXT: vnmsac.vx v8, a0, v16			; RV64-NEXT: vnmsac.vx v8, a0, v16
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%head = insertelement <vscale x 8 x i64> undef, i64 -7, i32 0			%head = insertelement <vscale x 8 x i64> undef, i64 -7, i32 0
	%splat = shufflevector <vscale x 8 x i64> %head, <vscale x 8 x i64> undef, <vscale x 8 x i32> zeroinitializer			%splat = shufflevector <vscale x 8 x i64> %head, <vscale x 8 x i64> undef, <vscale x 8 x i32> zeroinitializer
	%vc = srem <vscale x 8 x i64> %va, %splat			%vc = srem <vscale x 8 x i64> %va, %splat
	ret <vscale x 8 x i64> %vc			ret <vscale x 8 x i64> %vc
	}			}

llvm/test/CodeGen/RISCV/srem-lkk.ll

	Show First 20 Lines • Show All 433 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: li a1, 98			; RV64I-NEXT: li a1, 98
	; RV64I-NEXT: call __moddi3@plt			; RV64I-NEXT: call __moddi3@plt
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IM-LABEL: dont_fold_srem_i64:			; RV64IM-LABEL: dont_fold_srem_i64:
	; RV64IM: # %bb.0:			; RV64IM: # %bb.0:
	; RV64IM-NEXT: lui a1, 2675			; RV64IM-NEXT: lui a1, %hi(.LCPI8_0)
	; RV64IM-NEXT: addiw a1, a1, -251			; RV64IM-NEXT: ld a1, %lo(.LCPI8_0)(a1)
	; RV64IM-NEXT: slli a1, a1, 13
	; RV64IM-NEXT: addi a1, a1, 1839
	; RV64IM-NEXT: slli a1, a1, 13
	; RV64IM-NEXT: addi a1, a1, 167
	; RV64IM-NEXT: slli a1, a1, 13
	; RV64IM-NEXT: addi a1, a1, 1505
	; RV64IM-NEXT: mulh a1, a0, a1			; RV64IM-NEXT: mulh a1, a0, a1
	; RV64IM-NEXT: srli a2, a1, 63			; RV64IM-NEXT: srli a2, a1, 63
	; RV64IM-NEXT: srai a1, a1, 5			; RV64IM-NEXT: srai a1, a1, 5
	; RV64IM-NEXT: add a1, a1, a2			; RV64IM-NEXT: add a1, a1, a2
	; RV64IM-NEXT: li a2, 98			; RV64IM-NEXT: li a2, 98
	; RV64IM-NEXT: mul a1, a1, a2			; RV64IM-NEXT: mul a1, a1, a2
	; RV64IM-NEXT: sub a0, a0, a1			; RV64IM-NEXT: sub a0, a0, a1
	; RV64IM-NEXT: ret			; RV64IM-NEXT: ret
	%1 = srem i64 %x, 98			%1 = srem i64 %x, 98
	ret i64 %1			ret i64 %1
	}			}

llvm/test/CodeGen/RISCV/srem-seteq-illegal-types.ll

	Show First 20 Lines • Show All 156 Lines • ▼ Show 20 Lines
	; RV32M-NEXT: mul a1, a1, a2			; RV32M-NEXT: mul a1, a1, a2
	; RV32M-NEXT: sub a0, a0, a1			; RV32M-NEXT: sub a0, a0, a1
	; RV32M-NEXT: addi a0, a0, -1			; RV32M-NEXT: addi a0, a0, -1
	; RV32M-NEXT: seqz a0, a0			; RV32M-NEXT: seqz a0, a0
	; RV32M-NEXT: ret			; RV32M-NEXT: ret
	;			;
	; RV64M-LABEL: test_srem_even:			; RV64M-LABEL: test_srem_even:
	; RV64M: # %bb.0:			; RV64M: # %bb.0:
				; RV64M-NEXT: lui a1, %hi(.LCPI1_0)
				; RV64M-NEXT: ld a1, %lo(.LCPI1_0)(a1)
	; RV64M-NEXT: slli a0, a0, 60			; RV64M-NEXT: slli a0, a0, 60
	; RV64M-NEXT: srai a0, a0, 60			; RV64M-NEXT: srai a0, a0, 60
	; RV64M-NEXT: lui a1, 10923
	; RV64M-NEXT: addiw a1, a1, -1365
	; RV64M-NEXT: slli a1, a1, 12
	; RV64M-NEXT: addi a1, a1, -1365
	; RV64M-NEXT: slli a1, a1, 12
	; RV64M-NEXT: addi a1, a1, -1365
	; RV64M-NEXT: slli a1, a1, 12
	; RV64M-NEXT: addi a1, a1, -1365
	; RV64M-NEXT: mulh a1, a0, a1			; RV64M-NEXT: mulh a1, a0, a1
	; RV64M-NEXT: srli a2, a1, 63			; RV64M-NEXT: srli a2, a1, 63
	; RV64M-NEXT: add a1, a1, a2			; RV64M-NEXT: add a1, a1, a2
	; RV64M-NEXT: li a2, 6			; RV64M-NEXT: li a2, 6
	; RV64M-NEXT: mul a1, a1, a2			; RV64M-NEXT: mul a1, a1, a2
	; RV64M-NEXT: sub a0, a0, a1			; RV64M-NEXT: sub a0, a0, a1
	; RV64M-NEXT: addi a0, a0, -1			; RV64M-NEXT: addi a0, a0, -1
	; RV64M-NEXT: seqz a0, a0			; RV64M-NEXT: seqz a0, a0
	Show All 12 Lines
	; RV32MV-NEXT: mul a1, a1, a2			; RV32MV-NEXT: mul a1, a1, a2
	; RV32MV-NEXT: sub a0, a0, a1			; RV32MV-NEXT: sub a0, a0, a1
	; RV32MV-NEXT: addi a0, a0, -1			; RV32MV-NEXT: addi a0, a0, -1
	; RV32MV-NEXT: seqz a0, a0			; RV32MV-NEXT: seqz a0, a0
	; RV32MV-NEXT: ret			; RV32MV-NEXT: ret
	;			;
	; RV64MV-LABEL: test_srem_even:			; RV64MV-LABEL: test_srem_even:
	; RV64MV: # %bb.0:			; RV64MV: # %bb.0:
				; RV64MV-NEXT: lui a1, %hi(.LCPI1_0)
				; RV64MV-NEXT: ld a1, %lo(.LCPI1_0)(a1)
	; RV64MV-NEXT: slli a0, a0, 60			; RV64MV-NEXT: slli a0, a0, 60
	; RV64MV-NEXT: srai a0, a0, 60			; RV64MV-NEXT: srai a0, a0, 60
	; RV64MV-NEXT: lui a1, 10923
	; RV64MV-NEXT: addiw a1, a1, -1365
	; RV64MV-NEXT: slli a1, a1, 12
	; RV64MV-NEXT: addi a1, a1, -1365
	; RV64MV-NEXT: slli a1, a1, 12
	; RV64MV-NEXT: addi a1, a1, -1365
	; RV64MV-NEXT: slli a1, a1, 12
	; RV64MV-NEXT: addi a1, a1, -1365
	; RV64MV-NEXT: mulh a1, a0, a1			; RV64MV-NEXT: mulh a1, a0, a1
	; RV64MV-NEXT: srli a2, a1, 63			; RV64MV-NEXT: srli a2, a1, 63
	; RV64MV-NEXT: add a1, a1, a2			; RV64MV-NEXT: add a1, a1, a2
	; RV64MV-NEXT: li a2, 6			; RV64MV-NEXT: li a2, 6
	; RV64MV-NEXT: mul a1, a1, a2			; RV64MV-NEXT: mul a1, a1, a2
	; RV64MV-NEXT: sub a0, a0, a1			; RV64MV-NEXT: sub a0, a0, a1
	; RV64MV-NEXT: addi a0, a0, -1			; RV64MV-NEXT: addi a0, a0, -1
	; RV64MV-NEXT: seqz a0, a0			; RV64MV-NEXT: seqz a0, a0
	▲ Show 20 Lines • Show All 200 Lines • ▼ Show 20 Lines
	; RV64-NEXT: li a1, 7			; RV64-NEXT: li a1, 7
	; RV64-NEXT: li s5, 7			; RV64-NEXT: li s5, 7
	; RV64-NEXT: call __moddi3@plt			; RV64-NEXT: call __moddi3@plt
	; RV64-NEXT: mv s3, a0			; RV64-NEXT: mv s3, a0
	; RV64-NEXT: li a1, -5			; RV64-NEXT: li a1, -5
	; RV64-NEXT: mv a0, s1			; RV64-NEXT: mv a0, s1
	; RV64-NEXT: call __moddi3@plt			; RV64-NEXT: call __moddi3@plt
	; RV64-NEXT: mv s1, a0			; RV64-NEXT: mv s1, a0
	; RV64-NEXT: lui a0, 1026731			; RV64-NEXT: lui a0, %hi(.LCPI3_0)
	; RV64-NEXT: addiw a0, a0, -1365			; RV64-NEXT: ld a1, %lo(.LCPI3_0)(a0)
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, -1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a0, a0, -1365
	; RV64-NEXT: slli a0, a0, 12
	; RV64-NEXT: addi a1, a0, -1365
	; RV64-NEXT: mv a0, s2			; RV64-NEXT: mv a0, s2
	; RV64-NEXT: call __muldi3@plt			; RV64-NEXT: call __muldi3@plt
	; RV64-NEXT: lui a1, 10923			; RV64-NEXT: lui a1, %hi(.LCPI3_1)
	; RV64-NEXT: addiw a1, a1, -1365			; RV64-NEXT: ld a1, %lo(.LCPI3_1)(a1)
	; RV64-NEXT: slli a1, a1, 12
	; RV64-NEXT: addi a1, a1, -1365
	; RV64-NEXT: slli a1, a1, 12
	; RV64-NEXT: addi a1, a1, -1365
	; RV64-NEXT: slli a1, a1, 12
	; RV64-NEXT: addi a1, a1, -1366
	; RV64-NEXT: add a0, a0, a1			; RV64-NEXT: add a0, a0, a1
	; RV64-NEXT: slli a2, a0, 63			; RV64-NEXT: slli a2, a0, 63
	; RV64-NEXT: srli a0, a0, 1			; RV64-NEXT: srli a0, a0, 1
	; RV64-NEXT: or a0, a0, a2			; RV64-NEXT: or a0, a0, a2
	; RV64-NEXT: sltu a0, a1, a0			; RV64-NEXT: sltu a0, a1, a0
	; RV64-NEXT: addi a1, s1, -2			; RV64-NEXT: addi a1, s1, -2
	; RV64-NEXT: snez a1, a1			; RV64-NEXT: snez a1, a1
	; RV64-NEXT: addi a2, s3, -1			; RV64-NEXT: addi a2, s3, -1
	▲ Show 20 Lines • Show All 107 Lines • ▼ Show 20 Lines
	; RV32M-NEXT: addi sp, sp, 32			; RV32M-NEXT: addi sp, sp, 32
	; RV32M-NEXT: ret			; RV32M-NEXT: ret
	;			;
	; RV64M-LABEL: test_srem_vec:			; RV64M-LABEL: test_srem_vec:
	; RV64M: # %bb.0:			; RV64M: # %bb.0:
	; RV64M-NEXT: lb a1, 12(a0)			; RV64M-NEXT: lb a1, 12(a0)
	; RV64M-NEXT: lwu a2, 8(a0)			; RV64M-NEXT: lwu a2, 8(a0)
	; RV64M-NEXT: slli a1, a1, 32			; RV64M-NEXT: slli a1, a1, 32
	; RV64M-NEXT: or a2, a2, a1			; RV64M-NEXT: or a1, a2, a1
	; RV64M-NEXT: li a6, -1			; RV64M-NEXT: li a6, -1
	; RV64M-NEXT: srli a3, a6, 24			; RV64M-NEXT: srli a3, a6, 24
	; RV64M-NEXT: and a2, a2, a3			; RV64M-NEXT: and a1, a1, a3
	; RV64M-NEXT: ld a3, 0(a0)			; RV64M-NEXT: ld a3, 0(a0)
	; RV64M-NEXT: slli a4, a2, 29			; RV64M-NEXT: slli a4, a1, 29
	; RV64M-NEXT: srai a4, a4, 31			; RV64M-NEXT: srai a4, a4, 31
	; RV64M-NEXT: slli a2, a2, 31			; RV64M-NEXT: slli a1, a1, 31
	; RV64M-NEXT: srli a5, a3, 33			; RV64M-NEXT: srli a5, a3, 33
	; RV64M-NEXT: or a2, a5, a2			; RV64M-NEXT: lui a2, %hi(.LCPI3_0)
	; RV64M-NEXT: slli a2, a2, 31			; RV64M-NEXT: ld a2, %lo(.LCPI3_0)(a2)
	; RV64M-NEXT: srai a2, a2, 31			; RV64M-NEXT: or a1, a5, a1
				; RV64M-NEXT: slli a1, a1, 31
				; RV64M-NEXT: srai a1, a1, 31
				; RV64M-NEXT: mulh a2, a1, a2
				; RV64M-NEXT: srli a5, a2, 63
				; RV64M-NEXT: srai a2, a2, 1
				; RV64M-NEXT: add a2, a2, a5
				; RV64M-NEXT: slli a5, a2, 3
				; RV64M-NEXT: sub a2, a2, a5
				; RV64M-NEXT: lui a5, %hi(.LCPI3_1)
				; RV64M-NEXT: ld a5, %lo(.LCPI3_1)(a5)
	; RV64M-NEXT: slli a3, a3, 31			; RV64M-NEXT: slli a3, a3, 31
	; RV64M-NEXT: srai a3, a3, 31			; RV64M-NEXT: srai a3, a3, 31
	; RV64M-NEXT: lui a5, 18725			; RV64M-NEXT: add a1, a1, a2
	; RV64M-NEXT: addiw a5, a5, -1755			; RV64M-NEXT: mulh a2, a4, a5
	; RV64M-NEXT: slli a5, a5, 12
	; RV64M-NEXT: addi a5, a5, -1755
	; RV64M-NEXT: slli a5, a5, 12
	; RV64M-NEXT: addi a5, a5, -1755
	; RV64M-NEXT: slli a5, a5, 12
	; RV64M-NEXT: addi a5, a5, -1755
	; RV64M-NEXT: mulh a5, a2, a5
	; RV64M-NEXT: srli a1, a5, 63
	; RV64M-NEXT: srai a5, a5, 1
	; RV64M-NEXT: add a1, a5, a1
	; RV64M-NEXT: slli a5, a1, 3
	; RV64M-NEXT: sub a1, a1, a5
	; RV64M-NEXT: add a1, a2, a1
	; RV64M-NEXT: lui a2, 1035469
	; RV64M-NEXT: addiw a2, a2, -819
	; RV64M-NEXT: slli a2, a2, 12
	; RV64M-NEXT: addi a2, a2, -819
	; RV64M-NEXT: slli a2, a2, 12
	; RV64M-NEXT: addi a2, a2, -819
	; RV64M-NEXT: slli a2, a2, 13
	; RV64M-NEXT: addi a2, a2, -1639
	; RV64M-NEXT: mulh a2, a4, a2
	; RV64M-NEXT: srli a5, a2, 63			; RV64M-NEXT: srli a5, a2, 63
	; RV64M-NEXT: srai a2, a2, 1			; RV64M-NEXT: srai a2, a2, 1
	; RV64M-NEXT: add a2, a2, a5			; RV64M-NEXT: add a2, a2, a5
	; RV64M-NEXT: slli a5, a2, 2			; RV64M-NEXT: slli a5, a2, 2
	; RV64M-NEXT: add a2, a5, a2			; RV64M-NEXT: add a2, a5, a2
	; RV64M-NEXT: add a2, a4, a2			; RV64M-NEXT: add a2, a4, a2
	; RV64M-NEXT: addi a2, a2, -2			; RV64M-NEXT: addi a2, a2, -2
	; RV64M-NEXT: snez a2, a2			; RV64M-NEXT: snez a2, a2
				; RV64M-NEXT: lui a4, %hi(.LCPI3_2)
				; RV64M-NEXT: ld a4, %lo(.LCPI3_2)(a4)
				; RV64M-NEXT: lui a5, %hi(.LCPI3_3)
				; RV64M-NEXT: ld a5, %lo(.LCPI3_3)(a5)
	; RV64M-NEXT: addi a1, a1, -1			; RV64M-NEXT: addi a1, a1, -1
	; RV64M-NEXT: snez a1, a1			; RV64M-NEXT: snez a1, a1
	; RV64M-NEXT: lui a4, 1026731
	; RV64M-NEXT: addiw a4, a4, -1365
	; RV64M-NEXT: slli a4, a4, 12
	; RV64M-NEXT: addi a4, a4, -1365
	; RV64M-NEXT: slli a4, a4, 12
	; RV64M-NEXT: addi a4, a4, -1365
	; RV64M-NEXT: slli a4, a4, 12
	; RV64M-NEXT: addi a4, a4, -1365
	; RV64M-NEXT: mul a3, a3, a4			; RV64M-NEXT: mul a3, a3, a4
	; RV64M-NEXT: lui a4, 10923			; RV64M-NEXT: add a3, a3, a5
	; RV64M-NEXT: addiw a4, a4, -1365			; RV64M-NEXT: slli a4, a3, 63
	; RV64M-NEXT: slli a4, a4, 12
	; RV64M-NEXT: addi a4, a4, -1365
	; RV64M-NEXT: slli a4, a4, 12
	; RV64M-NEXT: addi a4, a4, -1365
	; RV64M-NEXT: slli a4, a4, 12
	; RV64M-NEXT: addi a4, a4, -1366
	; RV64M-NEXT: add a3, a3, a4
	; RV64M-NEXT: slli a5, a3, 63
	; RV64M-NEXT: srli a3, a3, 1			; RV64M-NEXT: srli a3, a3, 1
	; RV64M-NEXT: or a3, a3, a5			; RV64M-NEXT: or a3, a3, a4
	; RV64M-NEXT: sltu a3, a4, a3			; RV64M-NEXT: sltu a3, a5, a3
	; RV64M-NEXT: neg a1, a1			; RV64M-NEXT: neg a1, a1
	; RV64M-NEXT: neg a4, a2			; RV64M-NEXT: neg a4, a2
	; RV64M-NEXT: neg a3, a3			; RV64M-NEXT: neg a3, a3
	; RV64M-NEXT: li a5, 7			; RV64M-NEXT: li a5, 7
	; RV64M-NEXT: slli a5, a5, 32			; RV64M-NEXT: slli a5, a5, 32
	; RV64M-NEXT: and a4, a4, a5			; RV64M-NEXT: and a4, a4, a5
	; RV64M-NEXT: srli a4, a4, 32			; RV64M-NEXT: srli a4, a4, 32
	; RV64M-NEXT: sb a4, 12(a0)			; RV64M-NEXT: sb a4, 12(a0)
	▲ Show 20 Lines • Show All 118 Lines • ▼ Show 20 Lines
	; RV64MV-NEXT: addi sp, sp, -96			; RV64MV-NEXT: addi sp, sp, -96
	; RV64MV-NEXT: sd ra, 88(sp) # 8-byte Folded Spill			; RV64MV-NEXT: sd ra, 88(sp) # 8-byte Folded Spill
	; RV64MV-NEXT: sd s0, 80(sp) # 8-byte Folded Spill			; RV64MV-NEXT: sd s0, 80(sp) # 8-byte Folded Spill
	; RV64MV-NEXT: addi s0, sp, 96			; RV64MV-NEXT: addi s0, sp, 96
	; RV64MV-NEXT: andi sp, sp, -32			; RV64MV-NEXT: andi sp, sp, -32
	; RV64MV-NEXT: lb a1, 12(a0)			; RV64MV-NEXT: lb a1, 12(a0)
	; RV64MV-NEXT: lwu a2, 8(a0)			; RV64MV-NEXT: lwu a2, 8(a0)
	; RV64MV-NEXT: slli a1, a1, 32			; RV64MV-NEXT: slli a1, a1, 32
	; RV64MV-NEXT: or a2, a2, a1			; RV64MV-NEXT: or a1, a2, a1
	; RV64MV-NEXT: li a6, -1			; RV64MV-NEXT: li a6, -1
	; RV64MV-NEXT: ld a3, 0(a0)			; RV64MV-NEXT: ld a3, 0(a0)
	; RV64MV-NEXT: srli a4, a6, 24			; RV64MV-NEXT: srli a4, a6, 24
	; RV64MV-NEXT: and a2, a2, a4			; RV64MV-NEXT: and a1, a1, a4
	; RV64MV-NEXT: slli a4, a2, 31			; RV64MV-NEXT: slli a4, a1, 31
	; RV64MV-NEXT: srli a5, a3, 33			; RV64MV-NEXT: srli a5, a3, 33
	; RV64MV-NEXT: or a4, a5, a4			; RV64MV-NEXT: or a4, a5, a4
	; RV64MV-NEXT: slli a4, a4, 31			; RV64MV-NEXT: slli a4, a4, 31
	; RV64MV-NEXT: srai a4, a4, 31			; RV64MV-NEXT: srai a4, a4, 31
	; RV64MV-NEXT: slli a2, a2, 29			; RV64MV-NEXT: lui a5, %hi(.LCPI3_0)
	; RV64MV-NEXT: srai a2, a2, 31			; RV64MV-NEXT: ld a5, %lo(.LCPI3_0)(a5)
				; RV64MV-NEXT: slli a1, a1, 29
	; RV64MV-NEXT: slli a3, a3, 31			; RV64MV-NEXT: slli a3, a3, 31
	; RV64MV-NEXT: srai a3, a3, 31			; RV64MV-NEXT: srai a3, a3, 31
	; RV64MV-NEXT: lui a5, 10923
	; RV64MV-NEXT: addiw a5, a5, -1365
	; RV64MV-NEXT: slli a5, a5, 12
	; RV64MV-NEXT: addi a5, a5, -1365
	; RV64MV-NEXT: slli a5, a5, 12
	; RV64MV-NEXT: addi a5, a5, -1365
	; RV64MV-NEXT: slli a5, a5, 12
	; RV64MV-NEXT: addi a5, a5, -1365
	; RV64MV-NEXT: mulh a5, a3, a5			; RV64MV-NEXT: mulh a5, a3, a5
	; RV64MV-NEXT: srli a1, a5, 63			; RV64MV-NEXT: srli a2, a5, 63
	; RV64MV-NEXT: add a1, a5, a1			; RV64MV-NEXT: add a2, a5, a2
	; RV64MV-NEXT: li a5, 6			; RV64MV-NEXT: li a5, 6
	; RV64MV-NEXT: mul a1, a1, a5			; RV64MV-NEXT: mul a2, a2, a5
	; RV64MV-NEXT: sub a1, a3, a1			; RV64MV-NEXT: lui a5, %hi(.LCPI3_1)
	; RV64MV-NEXT: sd a1, 32(sp)			; RV64MV-NEXT: ld a5, %lo(.LCPI3_1)(a5)
	; RV64MV-NEXT: lui a1, 1035469			; RV64MV-NEXT: srai a1, a1, 31
	; RV64MV-NEXT: addiw a1, a1, -819			; RV64MV-NEXT: sub a2, a3, a2
	; RV64MV-NEXT: slli a1, a1, 12			; RV64MV-NEXT: sd a2, 32(sp)
	; RV64MV-NEXT: addi a1, a1, -819			; RV64MV-NEXT: mulh a2, a1, a5
	; RV64MV-NEXT: slli a1, a1, 12			; RV64MV-NEXT: srli a3, a2, 63
	; RV64MV-NEXT: addi a1, a1, -819			; RV64MV-NEXT: srai a2, a2, 1
	; RV64MV-NEXT: slli a1, a1, 13			; RV64MV-NEXT: add a2, a2, a3
	; RV64MV-NEXT: addi a1, a1, -1639			; RV64MV-NEXT: slli a3, a2, 2
	; RV64MV-NEXT: mulh a1, a2, a1			; RV64MV-NEXT: lui a5, %hi(.LCPI3_2)
	; RV64MV-NEXT: srli a3, a1, 63			; RV64MV-NEXT: ld a5, %lo(.LCPI3_2)(a5)
	; RV64MV-NEXT: srai a1, a1, 1			; RV64MV-NEXT: add a2, a3, a2
	; RV64MV-NEXT: add a1, a1, a3			; RV64MV-NEXT: add a1, a1, a2
	; RV64MV-NEXT: slli a3, a1, 2
	; RV64MV-NEXT: add a1, a3, a1
	; RV64MV-NEXT: add a1, a2, a1
	; RV64MV-NEXT: sd a1, 48(sp)			; RV64MV-NEXT: sd a1, 48(sp)
	; RV64MV-NEXT: lui a1, 18725			; RV64MV-NEXT: mulh a1, a4, a5
	; RV64MV-NEXT: addiw a1, a1, -1755
	; RV64MV-NEXT: slli a1, a1, 12
	; RV64MV-NEXT: addi a1, a1, -1755
	; RV64MV-NEXT: slli a1, a1, 12
	; RV64MV-NEXT: addi a1, a1, -1755
	; RV64MV-NEXT: slli a1, a1, 12
	; RV64MV-NEXT: addi a1, a1, -1755
	; RV64MV-NEXT: mulh a1, a4, a1
	; RV64MV-NEXT: srli a2, a1, 63			; RV64MV-NEXT: srli a2, a1, 63
	; RV64MV-NEXT: srai a1, a1, 1			; RV64MV-NEXT: srai a1, a1, 1
	; RV64MV-NEXT: add a1, a1, a2			; RV64MV-NEXT: add a1, a1, a2
	; RV64MV-NEXT: slli a2, a1, 3			; RV64MV-NEXT: slli a2, a1, 3
	; RV64MV-NEXT: sub a1, a1, a2			; RV64MV-NEXT: sub a1, a1, a2
	; RV64MV-NEXT: add a1, a4, a1			; RV64MV-NEXT: add a1, a4, a1
	; RV64MV-NEXT: sd a1, 40(sp)			; RV64MV-NEXT: sd a1, 40(sp)
	; RV64MV-NEXT: vsetivli zero, 4, e64, m2, ta, mu			; RV64MV-NEXT: vsetivli zero, 4, e64, m2, ta, mu
	; RV64MV-NEXT: addi a1, sp, 32			; RV64MV-NEXT: addi a1, sp, 32
	; RV64MV-NEXT: vle64.v v8, (a1)			; RV64MV-NEXT: vle64.v v8, (a1)
	; RV64MV-NEXT: lui a1, %hi(.LCPI3_0)			; RV64MV-NEXT: lui a1, %hi(.LCPI3_3)
	; RV64MV-NEXT: addi a1, a1, %lo(.LCPI3_0)			; RV64MV-NEXT: addi a1, a1, %lo(.LCPI3_3)
	; RV64MV-NEXT: vle64.v v10, (a1)			; RV64MV-NEXT: vle64.v v10, (a1)
	; RV64MV-NEXT: srli a1, a6, 31			; RV64MV-NEXT: srli a1, a6, 31
	; RV64MV-NEXT: vand.vx v8, v8, a1			; RV64MV-NEXT: vand.vx v8, v8, a1
	; RV64MV-NEXT: vmsne.vv v0, v8, v10			; RV64MV-NEXT: vmsne.vv v0, v8, v10
	; RV64MV-NEXT: vmv.v.i v8, 0			; RV64MV-NEXT: vmv.v.i v8, 0
	; RV64MV-NEXT: vmerge.vim v8, v8, -1, v0			; RV64MV-NEXT: vmerge.vim v8, v8, -1, v0
	; RV64MV-NEXT: vsetivli zero, 1, e64, m2, ta, mu			; RV64MV-NEXT: vsetivli zero, 1, e64, m2, ta, mu
	; RV64MV-NEXT: vslidedown.vi v10, v8, 2			; RV64MV-NEXT: vslidedown.vi v10, v8, 2
	Show All 28 Lines

llvm/test/CodeGen/RISCV/srem-vector-lkk.ll

	Show First 20 Lines • Show All 143 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: ld s3, 24(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld s3, 24(sp) # 8-byte Folded Reload
	; RV64I-NEXT: ld s4, 16(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld s4, 16(sp) # 8-byte Folded Reload
	; RV64I-NEXT: ld s5, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld s5, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 64			; RV64I-NEXT: addi sp, sp, 64
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IM-LABEL: fold_srem_vec_1:			; RV64IM-LABEL: fold_srem_vec_1:
	; RV64IM: # %bb.0:			; RV64IM: # %bb.0:
				; RV64IM-NEXT: lh a2, 0(a1)
				; RV64IM-NEXT: lui a3, %hi(.LCPI0_0)
				; RV64IM-NEXT: ld a3, %lo(.LCPI0_0)(a3)
	; RV64IM-NEXT: lh a6, 24(a1)			; RV64IM-NEXT: lh a6, 24(a1)
	; RV64IM-NEXT: lh a3, 16(a1)			; RV64IM-NEXT: lh a7, 16(a1)
	; RV64IM-NEXT: lh a4, 8(a1)			; RV64IM-NEXT: lh a1, 8(a1)
	; RV64IM-NEXT: lh a1, 0(a1)			; RV64IM-NEXT: mulh a3, a2, a3
	; RV64IM-NEXT: lui a5, 1045903			; RV64IM-NEXT: add a3, a3, a2
	; RV64IM-NEXT: addiw a5, a5, -733			; RV64IM-NEXT: srli a4, a3, 63
	; RV64IM-NEXT: slli a5, a5, 15			; RV64IM-NEXT: srli a3, a3, 6
	; RV64IM-NEXT: addi a5, a5, 1035			; RV64IM-NEXT: addw a3, a3, a4
	; RV64IM-NEXT: slli a5, a5, 12			; RV64IM-NEXT: lui a4, %hi(.LCPI0_1)
	; RV64IM-NEXT: addi a5, a5, -905			; RV64IM-NEXT: ld a4, %lo(.LCPI0_1)(a4)
	; RV64IM-NEXT: slli a5, a5, 12
	; RV64IM-NEXT: addi a5, a5, -1767
	; RV64IM-NEXT: mulh a5, a1, a5
	; RV64IM-NEXT: add a5, a5, a1
	; RV64IM-NEXT: srli a2, a5, 63
	; RV64IM-NEXT: srli a5, a5, 6
	; RV64IM-NEXT: addw a2, a5, a2
	; RV64IM-NEXT: li a5, 95			; RV64IM-NEXT: li a5, 95
	; RV64IM-NEXT: mulw a2, a2, a5			; RV64IM-NEXT: mulw a3, a3, a5
	; RV64IM-NEXT: subw a1, a1, a2			; RV64IM-NEXT: subw a2, a2, a3
	; RV64IM-NEXT: lui a2, 777976			; RV64IM-NEXT: mulh a3, a1, a4
	; RV64IM-NEXT: addiw a2, a2, -1057			; RV64IM-NEXT: sub a3, a3, a1
	; RV64IM-NEXT: slli a2, a2, 15			; RV64IM-NEXT: srli a4, a3, 63
	; RV64IM-NEXT: addi a2, a2, -1057			; RV64IM-NEXT: srli a3, a3, 6
	; RV64IM-NEXT: slli a2, a2, 14			; RV64IM-NEXT: addw a3, a3, a4
	; RV64IM-NEXT: addi a2, a2, -529			; RV64IM-NEXT: lui a4, %hi(.LCPI0_2)
	; RV64IM-NEXT: srli a2, a2, 1			; RV64IM-NEXT: ld a4, %lo(.LCPI0_2)(a4)
	; RV64IM-NEXT: mulh a2, a4, a2
	; RV64IM-NEXT: sub a2, a2, a4
	; RV64IM-NEXT: srli a5, a2, 63
	; RV64IM-NEXT: srli a2, a2, 6
	; RV64IM-NEXT: addw a2, a2, a5
	; RV64IM-NEXT: li a5, -124			; RV64IM-NEXT: li a5, -124
	; RV64IM-NEXT: mulw a2, a2, a5			; RV64IM-NEXT: mulw a3, a3, a5
	; RV64IM-NEXT: subw a2, a4, a2			; RV64IM-NEXT: subw a1, a1, a3
	; RV64IM-NEXT: lui a4, 2675			; RV64IM-NEXT: mulh a3, a7, a4
	; RV64IM-NEXT: addiw a4, a4, -251			; RV64IM-NEXT: srli a4, a3, 63
	; RV64IM-NEXT: slli a4, a4, 13			; RV64IM-NEXT: srli a3, a3, 5
	; RV64IM-NEXT: addi a4, a4, 1839			; RV64IM-NEXT: addw a3, a3, a4
	; RV64IM-NEXT: slli a4, a4, 13			; RV64IM-NEXT: lui a4, %hi(.LCPI0_3)
	; RV64IM-NEXT: addi a4, a4, 167			; RV64IM-NEXT: ld a4, %lo(.LCPI0_3)(a4)
	; RV64IM-NEXT: slli a4, a4, 13
	; RV64IM-NEXT: addi a4, a4, 1505
	; RV64IM-NEXT: mulh a4, a3, a4
	; RV64IM-NEXT: srli a5, a4, 63
	; RV64IM-NEXT: srli a4, a4, 5
	; RV64IM-NEXT: addw a4, a4, a5
	; RV64IM-NEXT: li a5, 98			; RV64IM-NEXT: li a5, 98
	; RV64IM-NEXT: mulw a4, a4, a5			; RV64IM-NEXT: mulw a3, a3, a5
	; RV64IM-NEXT: subw a3, a3, a4			; RV64IM-NEXT: subw a3, a7, a3
	; RV64IM-NEXT: lui a4, 1040212
	; RV64IM-NEXT: addiw a4, a4, 1977
	; RV64IM-NEXT: slli a4, a4, 12
	; RV64IM-NEXT: addi a4, a4, -1907
	; RV64IM-NEXT: slli a4, a4, 12
	; RV64IM-NEXT: addi a4, a4, -453
	; RV64IM-NEXT: slli a4, a4, 12
	; RV64IM-NEXT: addi a4, a4, -1213
	; RV64IM-NEXT: mulh a4, a6, a4			; RV64IM-NEXT: mulh a4, a6, a4
	; RV64IM-NEXT: srli a5, a4, 63			; RV64IM-NEXT: srli a5, a4, 63
	; RV64IM-NEXT: srli a4, a4, 7			; RV64IM-NEXT: srli a4, a4, 7
	; RV64IM-NEXT: addw a4, a4, a5			; RV64IM-NEXT: addw a4, a4, a5
	; RV64IM-NEXT: li a5, -1003			; RV64IM-NEXT: li a5, -1003
	; RV64IM-NEXT: mulw a4, a4, a5			; RV64IM-NEXT: mulw a4, a4, a5
	; RV64IM-NEXT: subw a4, a6, a4			; RV64IM-NEXT: subw a4, a6, a4
	; RV64IM-NEXT: sh a4, 6(a0)			; RV64IM-NEXT: sh a4, 6(a0)
	; RV64IM-NEXT: sh a3, 4(a0)			; RV64IM-NEXT: sh a3, 4(a0)
	; RV64IM-NEXT: sh a2, 2(a0)			; RV64IM-NEXT: sh a1, 2(a0)
	; RV64IM-NEXT: sh a1, 0(a0)			; RV64IM-NEXT: sh a2, 0(a0)
	; RV64IM-NEXT: ret			; RV64IM-NEXT: ret
	%1 = srem <4 x i16> %x, <i16 95, i16 -124, i16 98, i16 -1003>			%1 = srem <4 x i16> %x, <i16 95, i16 -124, i16 98, i16 -1003>
	ret <4 x i16> %1			ret <4 x i16> %1
	}			}

	define <4 x i16> @fold_srem_vec_2(<4 x i16> %x) nounwind {			define <4 x i16> @fold_srem_vec_2(<4 x i16> %x) nounwind {
	; RV32I-LABEL: fold_srem_vec_2:			; RV32I-LABEL: fold_srem_vec_2:
	; RV32I: # %bb.0:			; RV32I: # %bb.0:
	▲ Show 20 Lines • Show All 123 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: ld s3, 24(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld s3, 24(sp) # 8-byte Folded Reload
	; RV64I-NEXT: ld s4, 16(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld s4, 16(sp) # 8-byte Folded Reload
	; RV64I-NEXT: ld s5, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld s5, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 64			; RV64I-NEXT: addi sp, sp, 64
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IM-LABEL: fold_srem_vec_2:			; RV64IM-LABEL: fold_srem_vec_2:
	; RV64IM: # %bb.0:			; RV64IM: # %bb.0:
				; RV64IM-NEXT: lh a2, 0(a1)
				; RV64IM-NEXT: lui a3, %hi(.LCPI1_0)
				; RV64IM-NEXT: ld a3, %lo(.LCPI1_0)(a3)
	; RV64IM-NEXT: lh a6, 24(a1)			; RV64IM-NEXT: lh a6, 24(a1)
	; RV64IM-NEXT: lh a7, 16(a1)			; RV64IM-NEXT: lh a5, 16(a1)
	; RV64IM-NEXT: lh a4, 8(a1)			; RV64IM-NEXT: lh a1, 8(a1)
	; RV64IM-NEXT: lh a1, 0(a1)			; RV64IM-NEXT: mulh a4, a2, a3
	; RV64IM-NEXT: lui a5, 1045903			; RV64IM-NEXT: add a4, a4, a2
	; RV64IM-NEXT: addiw a5, a5, -733			; RV64IM-NEXT: srli a7, a4, 63
	; RV64IM-NEXT: slli a5, a5, 15			; RV64IM-NEXT: srli a4, a4, 6
	; RV64IM-NEXT: addi a5, a5, 1035			; RV64IM-NEXT: addw a4, a4, a7
	; RV64IM-NEXT: slli a5, a5, 12			; RV64IM-NEXT: li a7, 95
	; RV64IM-NEXT: addi a5, a5, -905			; RV64IM-NEXT: mulw a4, a4, a7
	; RV64IM-NEXT: slli a5, a5, 12			; RV64IM-NEXT: subw t0, a2, a4
	; RV64IM-NEXT: addi a5, a5, -1767			; RV64IM-NEXT: mulh a4, a1, a3
	; RV64IM-NEXT: mulh a2, a1, a5			; RV64IM-NEXT: add a4, a4, a1
	; RV64IM-NEXT: add a2, a2, a1			; RV64IM-NEXT: srli a2, a4, 63
	; RV64IM-NEXT: srli a3, a2, 63			; RV64IM-NEXT: srli a4, a4, 6
	; RV64IM-NEXT: srli a2, a2, 6			; RV64IM-NEXT: addw a2, a4, a2
	; RV64IM-NEXT: addw a2, a2, a3			; RV64IM-NEXT: mulw a2, a2, a7
	; RV64IM-NEXT: li a3, 95			; RV64IM-NEXT: subw a1, a1, a2
	; RV64IM-NEXT: mulw a2, a2, a3			; RV64IM-NEXT: mulh a2, a5, a3
	; RV64IM-NEXT: subw t0, a1, a2			; RV64IM-NEXT: add a2, a2, a5
	; RV64IM-NEXT: mulh a2, a4, a5
	; RV64IM-NEXT: add a2, a2, a4
	; RV64IM-NEXT: srli a1, a2, 63
	; RV64IM-NEXT: srli a2, a2, 6
	; RV64IM-NEXT: addw a1, a2, a1
	; RV64IM-NEXT: mulw a1, a1, a3
	; RV64IM-NEXT: subw a1, a4, a1
	; RV64IM-NEXT: mulh a2, a7, a5
	; RV64IM-NEXT: add a2, a2, a7
	; RV64IM-NEXT: srli a4, a2, 63			; RV64IM-NEXT: srli a4, a2, 63
	; RV64IM-NEXT: srli a2, a2, 6			; RV64IM-NEXT: srli a2, a2, 6
	; RV64IM-NEXT: addw a2, a2, a4			; RV64IM-NEXT: addw a2, a2, a4
	; RV64IM-NEXT: mulw a2, a2, a3			; RV64IM-NEXT: mulw a2, a2, a7
	; RV64IM-NEXT: subw a2, a7, a2			; RV64IM-NEXT: subw a2, a5, a2
	; RV64IM-NEXT: mulh a4, a6, a5			; RV64IM-NEXT: mulh a3, a6, a3
	; RV64IM-NEXT: add a4, a4, a6			; RV64IM-NEXT: add a3, a3, a6
	; RV64IM-NEXT: srli a5, a4, 63			; RV64IM-NEXT: srli a4, a3, 63
	; RV64IM-NEXT: srli a4, a4, 6			; RV64IM-NEXT: srli a3, a3, 6
	; RV64IM-NEXT: addw a4, a4, a5			; RV64IM-NEXT: addw a3, a3, a4
	; RV64IM-NEXT: mulw a3, a4, a3			; RV64IM-NEXT: mulw a3, a3, a7
	; RV64IM-NEXT: subw a3, a6, a3			; RV64IM-NEXT: subw a3, a6, a3
	; RV64IM-NEXT: sh a3, 6(a0)			; RV64IM-NEXT: sh a3, 6(a0)
	; RV64IM-NEXT: sh a2, 4(a0)			; RV64IM-NEXT: sh a2, 4(a0)
	; RV64IM-NEXT: sh a1, 2(a0)			; RV64IM-NEXT: sh a1, 2(a0)
	; RV64IM-NEXT: sh t0, 0(a0)			; RV64IM-NEXT: sh t0, 0(a0)
	; RV64IM-NEXT: ret			; RV64IM-NEXT: ret
	%1 = srem <4 x i16> %x, <i16 95, i16 95, i16 95, i16 95>			%1 = srem <4 x i16> %x, <i16 95, i16 95, i16 95, i16 95>
	ret <4 x i16> %1			ret <4 x i16> %1
	▲ Show 20 Lines • Show All 190 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: ld s7, 24(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld s7, 24(sp) # 8-byte Folded Reload
	; RV64I-NEXT: ld s8, 16(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld s8, 16(sp) # 8-byte Folded Reload
	; RV64I-NEXT: ld s9, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld s9, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 96			; RV64I-NEXT: addi sp, sp, 96
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IM-LABEL: combine_srem_sdiv:			; RV64IM-LABEL: combine_srem_sdiv:
	; RV64IM: # %bb.0:			; RV64IM: # %bb.0:
				; RV64IM-NEXT: lh a2, 24(a1)
				; RV64IM-NEXT: lui a3, %hi(.LCPI2_0)
				; RV64IM-NEXT: ld a3, %lo(.LCPI2_0)(a3)
	; RV64IM-NEXT: lh a6, 0(a1)			; RV64IM-NEXT: lh a6, 0(a1)
	; RV64IM-NEXT: lh a7, 8(a1)			; RV64IM-NEXT: lh a5, 8(a1)
	; RV64IM-NEXT: lh a4, 16(a1)			; RV64IM-NEXT: lh a1, 16(a1)
	; RV64IM-NEXT: lh a1, 24(a1)			; RV64IM-NEXT: mulh a4, a2, a3
	; RV64IM-NEXT: lui a5, 1045903			; RV64IM-NEXT: add a4, a4, a2
	; RV64IM-NEXT: addiw a5, a5, -733			; RV64IM-NEXT: srli a7, a4, 63
	; RV64IM-NEXT: slli a5, a5, 15			; RV64IM-NEXT: srai a4, a4, 6
	; RV64IM-NEXT: addi a5, a5, 1035			; RV64IM-NEXT: addw t0, a4, a7
	; RV64IM-NEXT: slli a5, a5, 12			; RV64IM-NEXT: li a7, 95
	; RV64IM-NEXT: addi a5, a5, -905			; RV64IM-NEXT: mulw a4, t0, a7
	; RV64IM-NEXT: slli a5, a5, 12			; RV64IM-NEXT: subw t1, a2, a4
	; RV64IM-NEXT: addi a5, a5, -1767			; RV64IM-NEXT: mulh a4, a1, a3
	; RV64IM-NEXT: mulh a2, a1, a5			; RV64IM-NEXT: add a4, a4, a1
	; RV64IM-NEXT: add a2, a2, a1			; RV64IM-NEXT: srli a2, a4, 63
	; RV64IM-NEXT: srli a3, a2, 63
	; RV64IM-NEXT: srai a2, a2, 6
	; RV64IM-NEXT: addw t3, a2, a3
	; RV64IM-NEXT: li t0, 95
	; RV64IM-NEXT: mulw a3, t3, t0
	; RV64IM-NEXT: subw t1, a1, a3
	; RV64IM-NEXT: mulh a3, a4, a5
	; RV64IM-NEXT: add a3, a3, a4
	; RV64IM-NEXT: srli a1, a3, 63
	; RV64IM-NEXT: srai a3, a3, 6
	; RV64IM-NEXT: addw a1, a3, a1
	; RV64IM-NEXT: mulw a3, a1, t0
	; RV64IM-NEXT: subw t2, a4, a3
	; RV64IM-NEXT: mulh a4, a7, a5
	; RV64IM-NEXT: add a4, a4, a7
	; RV64IM-NEXT: srli a3, a4, 63
	; RV64IM-NEXT: srai a4, a4, 6			; RV64IM-NEXT: srai a4, a4, 6
	; RV64IM-NEXT: addw a3, a4, a3			; RV64IM-NEXT: addw a2, a4, a2
	; RV64IM-NEXT: mulw a4, a3, t0			; RV64IM-NEXT: mulw a4, a2, a7
	; RV64IM-NEXT: subw a4, a7, a4			; RV64IM-NEXT: subw t2, a1, a4
	; RV64IM-NEXT: mulh a5, a6, a5			; RV64IM-NEXT: mulh a4, a5, a3
	; RV64IM-NEXT: add a5, a5, a6			; RV64IM-NEXT: add a4, a4, a5
	; RV64IM-NEXT: srli a2, a5, 63			; RV64IM-NEXT: srli a1, a4, 63
	; RV64IM-NEXT: srai a5, a5, 6			; RV64IM-NEXT: srai a4, a4, 6
	; RV64IM-NEXT: addw a2, a5, a2			; RV64IM-NEXT: addw a1, a4, a1
	; RV64IM-NEXT: mulw a5, a2, t0			; RV64IM-NEXT: mulw a4, a1, a7
				; RV64IM-NEXT: subw a4, a5, a4
				; RV64IM-NEXT: mulh a3, a6, a3
				; RV64IM-NEXT: add a3, a3, a6
				; RV64IM-NEXT: srli a5, a3, 63
				; RV64IM-NEXT: srai a3, a3, 6
				; RV64IM-NEXT: addw a3, a3, a5
				; RV64IM-NEXT: mulw a5, a3, a7
	; RV64IM-NEXT: subw a5, a6, a5			; RV64IM-NEXT: subw a5, a6, a5
	; RV64IM-NEXT: addw a2, a5, a2			; RV64IM-NEXT: addw a3, a5, a3
	; RV64IM-NEXT: addw a3, a4, a3			; RV64IM-NEXT: addw a1, a4, a1
	; RV64IM-NEXT: addw a1, t2, a1			; RV64IM-NEXT: addw a2, t2, a2
	; RV64IM-NEXT: addw a4, t1, t3			; RV64IM-NEXT: addw a4, t1, t0
	; RV64IM-NEXT: sh a4, 6(a0)			; RV64IM-NEXT: sh a4, 6(a0)
	; RV64IM-NEXT: sh a1, 4(a0)			; RV64IM-NEXT: sh a2, 4(a0)
	; RV64IM-NEXT: sh a3, 2(a0)			; RV64IM-NEXT: sh a1, 2(a0)
	; RV64IM-NEXT: sh a2, 0(a0)			; RV64IM-NEXT: sh a3, 0(a0)
	; RV64IM-NEXT: ret			; RV64IM-NEXT: ret
	%1 = srem <4 x i16> %x, <i16 95, i16 95, i16 95, i16 95>			%1 = srem <4 x i16> %x, <i16 95, i16 95, i16 95, i16 95>
	%2 = sdiv <4 x i16> %x, <i16 95, i16 95, i16 95, i16 95>			%2 = sdiv <4 x i16> %x, <i16 95, i16 95, i16 95, i16 95>
	%3 = add <4 x i16> %1, %2			%3 = add <4 x i16> %1, %2
	ret <4 x i16> %3			ret <4 x i16> %3
	}			}

	; Don't fold for divisors that are a power of two.			; Don't fold for divisors that are a power of two.
	▲ Show 20 Lines • Show All 107 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: ld s1, 24(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld s1, 24(sp) # 8-byte Folded Reload
	; RV64I-NEXT: ld s2, 16(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld s2, 16(sp) # 8-byte Folded Reload
	; RV64I-NEXT: ld s3, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld s3, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 48			; RV64I-NEXT: addi sp, sp, 48
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IM-LABEL: dont_fold_srem_power_of_two:			; RV64IM-LABEL: dont_fold_srem_power_of_two:
	; RV64IM: # %bb.0:			; RV64IM: # %bb.0:
	; RV64IM-NEXT: lh a6, 16(a1)			; RV64IM-NEXT: lh a2, 24(a1)
	; RV64IM-NEXT: lh a3, 8(a1)			; RV64IM-NEXT: lui a3, %hi(.LCPI3_0)
	; RV64IM-NEXT: lh a4, 0(a1)			; RV64IM-NEXT: ld a3, %lo(.LCPI3_0)(a3)
	; RV64IM-NEXT: lh a1, 24(a1)			; RV64IM-NEXT: lh a4, 16(a1)
	; RV64IM-NEXT: lui a5, 1045903			; RV64IM-NEXT: lh a5, 8(a1)
	; RV64IM-NEXT: addiw a5, a5, -733			; RV64IM-NEXT: lh a1, 0(a1)
	; RV64IM-NEXT: slli a5, a5, 15			; RV64IM-NEXT: mulh a3, a2, a3
	; RV64IM-NEXT: addi a5, a5, 1035			; RV64IM-NEXT: add a3, a3, a2
	; RV64IM-NEXT: slli a5, a5, 12			; RV64IM-NEXT: srli a6, a3, 63
	; RV64IM-NEXT: addi a5, a5, -905			; RV64IM-NEXT: srli a3, a3, 6
	; RV64IM-NEXT: slli a5, a5, 12			; RV64IM-NEXT: addw a6, a3, a6
	; RV64IM-NEXT: addi a5, a5, -1767			; RV64IM-NEXT: li a3, 95
	; RV64IM-NEXT: mulh a5, a1, a5			; RV64IM-NEXT: mulw a3, a6, a3
	; RV64IM-NEXT: add a5, a5, a1			; RV64IM-NEXT: subw a2, a2, a3
	; RV64IM-NEXT: srli a2, a5, 63			; RV64IM-NEXT: srli a3, a1, 58
	; RV64IM-NEXT: srli a5, a5, 6			; RV64IM-NEXT: add a3, a1, a3
	; RV64IM-NEXT: addw a2, a5, a2			; RV64IM-NEXT: andi a3, a3, -64
	; RV64IM-NEXT: li a5, 95			; RV64IM-NEXT: subw a1, a1, a3
	; RV64IM-NEXT: mulw a2, a2, a5			; RV64IM-NEXT: srli a3, a5, 59
	; RV64IM-NEXT: subw a1, a1, a2			; RV64IM-NEXT: add a3, a5, a3
	; RV64IM-NEXT: srli a2, a4, 58			; RV64IM-NEXT: andi a3, a3, -32
	; RV64IM-NEXT: add a2, a4, a2			; RV64IM-NEXT: subw a3, a5, a3
	; RV64IM-NEXT: andi a2, a2, -64			; RV64IM-NEXT: srli a5, a4, 61
	; RV64IM-NEXT: subw a2, a4, a2			; RV64IM-NEXT: add a5, a4, a5
	; RV64IM-NEXT: srli a4, a3, 59			; RV64IM-NEXT: andi a5, a5, -8
	; RV64IM-NEXT: add a4, a3, a4			; RV64IM-NEXT: subw a4, a4, a5
	; RV64IM-NEXT: andi a4, a4, -32
	; RV64IM-NEXT: subw a3, a3, a4
	; RV64IM-NEXT: srli a4, a6, 61
	; RV64IM-NEXT: add a4, a6, a4
	; RV64IM-NEXT: andi a4, a4, -8
	; RV64IM-NEXT: subw a4, a6, a4
	; RV64IM-NEXT: sh a4, 4(a0)			; RV64IM-NEXT: sh a4, 4(a0)
	; RV64IM-NEXT: sh a3, 2(a0)			; RV64IM-NEXT: sh a3, 2(a0)
	; RV64IM-NEXT: sh a2, 0(a0)			; RV64IM-NEXT: sh a1, 0(a0)
	; RV64IM-NEXT: sh a1, 6(a0)			; RV64IM-NEXT: sh a2, 6(a0)
	; RV64IM-NEXT: ret			; RV64IM-NEXT: ret
	%1 = srem <4 x i16> %x, <i16 64, i16 32, i16 8, i16 95>			%1 = srem <4 x i16> %x, <i16 64, i16 32, i16 8, i16 95>
	ret <4 x i16> %1			ret <4 x i16> %1
	}			}

	; Don't fold if the divisor is one.			; Don't fold if the divisor is one.
	define <4 x i16> @dont_fold_srem_one(<4 x i16> %x) nounwind {			define <4 x i16> @dont_fold_srem_one(<4 x i16> %x) nounwind {
	; RV32I-LABEL: dont_fold_srem_one:			; RV32I-LABEL: dont_fold_srem_one:
	▲ Show 20 Lines • Show All 106 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: ld s1, 24(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld s1, 24(sp) # 8-byte Folded Reload
	; RV64I-NEXT: ld s2, 16(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld s2, 16(sp) # 8-byte Folded Reload
	; RV64I-NEXT: ld s3, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld s3, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 48			; RV64I-NEXT: addi sp, sp, 48
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IM-LABEL: dont_fold_srem_one:			; RV64IM-LABEL: dont_fold_srem_one:
	; RV64IM: # %bb.0:			; RV64IM: # %bb.0:
	; RV64IM-NEXT: lh a2, 24(a1)			; RV64IM-NEXT: lh a2, 16(a1)
	; RV64IM-NEXT: lh a3, 8(a1)			; RV64IM-NEXT: lui a3, %hi(.LCPI4_0)
	; RV64IM-NEXT: lh a1, 16(a1)			; RV64IM-NEXT: ld a3, %lo(.LCPI4_0)(a3)
	; RV64IM-NEXT: lui a4, 1043590			; RV64IM-NEXT: lh a6, 24(a1)
	; RV64IM-NEXT: addiw a4, a4, -1781			; RV64IM-NEXT: lh a1, 8(a1)
	; RV64IM-NEXT: slli a4, a4, 13			; RV64IM-NEXT: mulh a3, a2, a3
	; RV64IM-NEXT: addi a4, a4, 1069			; RV64IM-NEXT: add a3, a3, a2
	; RV64IM-NEXT: slli a4, a4, 12			; RV64IM-NEXT: srli a5, a3, 63
	; RV64IM-NEXT: addi a4, a4, -1959			; RV64IM-NEXT: srli a3, a3, 4
	; RV64IM-NEXT: slli a4, a4, 13			; RV64IM-NEXT: addw a3, a3, a5
	; RV64IM-NEXT: addi a4, a4, 357			; RV64IM-NEXT: lui a5, %hi(.LCPI4_1)
	; RV64IM-NEXT: mulh a4, a1, a4			; RV64IM-NEXT: ld a5, %lo(.LCPI4_1)(a5)
	; RV64IM-NEXT: add a4, a4, a1			; RV64IM-NEXT: li a4, 23
	; RV64IM-NEXT: srli a5, a4, 63			; RV64IM-NEXT: mulw a3, a3, a4
	; RV64IM-NEXT: srli a4, a4, 4			; RV64IM-NEXT: subw a2, a2, a3
	; RV64IM-NEXT: addw a4, a4, a5			; RV64IM-NEXT: mulh a3, a1, a5
	; RV64IM-NEXT: li a5, 23			; RV64IM-NEXT: srli a4, a3, 63
	; RV64IM-NEXT: mulw a4, a4, a5			; RV64IM-NEXT: srli a3, a3, 8
	; RV64IM-NEXT: subw a1, a1, a4			; RV64IM-NEXT: addw a3, a3, a4
	; RV64IM-NEXT: lui a4, 6413			; RV64IM-NEXT: lui a4, %hi(.LCPI4_2)
	; RV64IM-NEXT: addiw a4, a4, 1265			; RV64IM-NEXT: ld a4, %lo(.LCPI4_2)(a4)
	; RV64IM-NEXT: slli a4, a4, 13
	; RV64IM-NEXT: addi a4, a4, 1027
	; RV64IM-NEXT: slli a4, a4, 13
	; RV64IM-NEXT: addi a4, a4, 1077
	; RV64IM-NEXT: slli a4, a4, 12
	; RV64IM-NEXT: addi a4, a4, 965
	; RV64IM-NEXT: mulh a4, a3, a4
	; RV64IM-NEXT: srli a5, a4, 63
	; RV64IM-NEXT: srli a4, a4, 8
	; RV64IM-NEXT: addw a4, a4, a5
	; RV64IM-NEXT: li a5, 654			; RV64IM-NEXT: li a5, 654
	; RV64IM-NEXT: mulw a4, a4, a5			; RV64IM-NEXT: mulw a3, a3, a5
	; RV64IM-NEXT: subw a3, a3, a4			; RV64IM-NEXT: subw a1, a1, a3
	; RV64IM-NEXT: lui a4, 12375			; RV64IM-NEXT: mulh a3, a6, a4
	; RV64IM-NEXT: addiw a4, a4, -575			; RV64IM-NEXT: srli a4, a3, 63
	; RV64IM-NEXT: slli a4, a4, 12			; RV64IM-NEXT: srli a3, a3, 11
	; RV64IM-NEXT: addi a4, a4, 883			; RV64IM-NEXT: addw a3, a3, a4
	; RV64IM-NEXT: slli a4, a4, 13			; RV64IM-NEXT: lui a4, 1
	; RV64IM-NEXT: addi a4, a4, -431			; RV64IM-NEXT: addiw a4, a4, 1327
	; RV64IM-NEXT: slli a4, a4, 12			; RV64IM-NEXT: mulw a3, a3, a4
	; RV64IM-NEXT: addi a4, a4, 1959			; RV64IM-NEXT: subw a3, a6, a3
	; RV64IM-NEXT: mulh a4, a2, a4
	; RV64IM-NEXT: srli a5, a4, 63
	; RV64IM-NEXT: srli a4, a4, 11
	; RV64IM-NEXT: addw a4, a4, a5
	; RV64IM-NEXT: lui a5, 1
	; RV64IM-NEXT: addiw a5, a5, 1327
	; RV64IM-NEXT: mulw a4, a4, a5
	; RV64IM-NEXT: subw a2, a2, a4
	; RV64IM-NEXT: sh zero, 0(a0)			; RV64IM-NEXT: sh zero, 0(a0)
	; RV64IM-NEXT: sh a2, 6(a0)			; RV64IM-NEXT: sh a3, 6(a0)
	; RV64IM-NEXT: sh a3, 2(a0)			; RV64IM-NEXT: sh a1, 2(a0)
	; RV64IM-NEXT: sh a1, 4(a0)			; RV64IM-NEXT: sh a2, 4(a0)
	; RV64IM-NEXT: ret			; RV64IM-NEXT: ret
	%1 = srem <4 x i16> %x, <i16 1, i16 654, i16 23, i16 5423>			%1 = srem <4 x i16> %x, <i16 1, i16 654, i16 23, i16 5423>
	ret <4 x i16> %1			ret <4 x i16> %1
	}			}

	; Don't fold if the divisor is 2^15.			; Don't fold if the divisor is 2^15.
	define <4 x i16> @dont_fold_urem_i16_smax(<4 x i16> %x) nounwind {			define <4 x i16> @dont_fold_urem_i16_smax(<4 x i16> %x) nounwind {
	; RV32I-LABEL: dont_fold_urem_i16_smax:			; RV32I-LABEL: dont_fold_urem_i16_smax:
	▲ Show 20 Lines • Show All 101 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: ld s1, 24(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld s1, 24(sp) # 8-byte Folded Reload
	; RV64I-NEXT: ld s2, 16(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld s2, 16(sp) # 8-byte Folded Reload
	; RV64I-NEXT: ld s3, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld s3, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 48			; RV64I-NEXT: addi sp, sp, 48
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IM-LABEL: dont_fold_urem_i16_smax:			; RV64IM-LABEL: dont_fold_urem_i16_smax:
	; RV64IM: # %bb.0:			; RV64IM: # %bb.0:
	; RV64IM-NEXT: lh a2, 8(a1)			; RV64IM-NEXT: lh a2, 16(a1)
	; RV64IM-NEXT: lh a3, 24(a1)			; RV64IM-NEXT: lui a3, %hi(.LCPI5_0)
	; RV64IM-NEXT: lh a1, 16(a1)			; RV64IM-NEXT: ld a3, %lo(.LCPI5_0)(a3)
	; RV64IM-NEXT: lui a4, 1043590			; RV64IM-NEXT: lh a4, 24(a1)
	; RV64IM-NEXT: addiw a4, a4, -1781			; RV64IM-NEXT: mulh a3, a2, a3
	; RV64IM-NEXT: slli a4, a4, 13			; RV64IM-NEXT: add a3, a3, a2
	; RV64IM-NEXT: addi a4, a4, 1069			; RV64IM-NEXT: srli a5, a3, 63
	; RV64IM-NEXT: slli a4, a4, 12			; RV64IM-NEXT: srli a3, a3, 4
	; RV64IM-NEXT: addi a4, a4, -1959			; RV64IM-NEXT: addw a3, a3, a5
	; RV64IM-NEXT: slli a4, a4, 13			; RV64IM-NEXT: li a6, 23
	; RV64IM-NEXT: addi a4, a4, 357			; RV64IM-NEXT: lui a5, %hi(.LCPI5_1)
	; RV64IM-NEXT: mulh a4, a1, a4			; RV64IM-NEXT: ld a5, %lo(.LCPI5_1)(a5)
	; RV64IM-NEXT: add a4, a4, a1			; RV64IM-NEXT: mulw a3, a3, a6
	; RV64IM-NEXT: srli a5, a4, 63			; RV64IM-NEXT: lh a1, 8(a1)
	; RV64IM-NEXT: srli a4, a4, 4			; RV64IM-NEXT: subw a2, a2, a3
	; RV64IM-NEXT: addw a4, a4, a5			; RV64IM-NEXT: mulh a3, a4, a5
	; RV64IM-NEXT: li a5, 23			; RV64IM-NEXT: srli a5, a3, 63
	; RV64IM-NEXT: mulw a4, a4, a5			; RV64IM-NEXT: srli a3, a3, 11
	; RV64IM-NEXT: subw a1, a1, a4			; RV64IM-NEXT: addw a3, a3, a5
	; RV64IM-NEXT: lui a4, 12375
	; RV64IM-NEXT: addiw a4, a4, -575
	; RV64IM-NEXT: slli a4, a4, 12
	; RV64IM-NEXT: addi a4, a4, 883
	; RV64IM-NEXT: slli a4, a4, 13
	; RV64IM-NEXT: addi a4, a4, -431
	; RV64IM-NEXT: slli a4, a4, 12
	; RV64IM-NEXT: addi a4, a4, 1959
	; RV64IM-NEXT: mulh a4, a3, a4
	; RV64IM-NEXT: srli a5, a4, 63
	; RV64IM-NEXT: srli a4, a4, 11
	; RV64IM-NEXT: addw a4, a4, a5
	; RV64IM-NEXT: lui a5, 1			; RV64IM-NEXT: lui a5, 1
	; RV64IM-NEXT: addiw a5, a5, 1327			; RV64IM-NEXT: addiw a5, a5, 1327
	; RV64IM-NEXT: mulw a4, a4, a5			; RV64IM-NEXT: mulw a3, a3, a5
	; RV64IM-NEXT: subw a3, a3, a4			; RV64IM-NEXT: subw a3, a4, a3
	; RV64IM-NEXT: srli a4, a2, 49			; RV64IM-NEXT: srli a4, a1, 49
	; RV64IM-NEXT: add a4, a2, a4			; RV64IM-NEXT: add a4, a1, a4
	; RV64IM-NEXT: lui a5, 8			; RV64IM-NEXT: lui a5, 8
	; RV64IM-NEXT: and a4, a4, a5			; RV64IM-NEXT: and a4, a4, a5
	; RV64IM-NEXT: subw a2, a2, a4			; RV64IM-NEXT: subw a1, a1, a4
	; RV64IM-NEXT: sh zero, 0(a0)			; RV64IM-NEXT: sh zero, 0(a0)
	; RV64IM-NEXT: sh a2, 2(a0)			; RV64IM-NEXT: sh a1, 2(a0)
	; RV64IM-NEXT: sh a3, 6(a0)			; RV64IM-NEXT: sh a3, 6(a0)
	; RV64IM-NEXT: sh a1, 4(a0)			; RV64IM-NEXT: sh a2, 4(a0)
	; RV64IM-NEXT: ret			; RV64IM-NEXT: ret
	%1 = srem <4 x i16> %x, <i16 1, i16 32768, i16 23, i16 5423>			%1 = srem <4 x i16> %x, <i16 1, i16 32768, i16 23, i16 5423>
	ret <4 x i16> %1			ret <4 x i16> %1
	}			}

	; Don't fold i64 srem.			; Don't fold i64 srem.
	define <4 x i64> @dont_fold_srem_i64(<4 x i64> %x) nounwind {			define <4 x i64> @dont_fold_srem_i64(<4 x i64> %x) nounwind {
	; RV32I-LABEL: dont_fold_srem_i64:			; RV32I-LABEL: dont_fold_srem_i64:
	▲ Show 20 Lines • Show All 171 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: ld s1, 24(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld s1, 24(sp) # 8-byte Folded Reload
	; RV64I-NEXT: ld s2, 16(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld s2, 16(sp) # 8-byte Folded Reload
	; RV64I-NEXT: ld s3, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld s3, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 48			; RV64I-NEXT: addi sp, sp, 48
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IM-LABEL: dont_fold_srem_i64:			; RV64IM-LABEL: dont_fold_srem_i64:
	; RV64IM: # %bb.0:			; RV64IM: # %bb.0:
	; RV64IM-NEXT: ld a2, 24(a1)			; RV64IM-NEXT: ld a2, 16(a1)
	; RV64IM-NEXT: ld a3, 8(a1)			; RV64IM-NEXT: lui a3, %hi(.LCPI6_0)
	; RV64IM-NEXT: ld a1, 16(a1)			; RV64IM-NEXT: ld a3, %lo(.LCPI6_0)(a3)
	; RV64IM-NEXT: lui a4, 1043590			; RV64IM-NEXT: ld a6, 24(a1)
	; RV64IM-NEXT: addiw a4, a4, -1781			; RV64IM-NEXT: ld a1, 8(a1)
	; RV64IM-NEXT: slli a4, a4, 13			; RV64IM-NEXT: mulh a3, a2, a3
	; RV64IM-NEXT: addi a4, a4, 1069			; RV64IM-NEXT: add a3, a3, a2
	; RV64IM-NEXT: slli a4, a4, 12			; RV64IM-NEXT: srli a5, a3, 63
	; RV64IM-NEXT: addi a4, a4, -1959			; RV64IM-NEXT: srai a3, a3, 4
	; RV64IM-NEXT: slli a4, a4, 13			; RV64IM-NEXT: add a3, a3, a5
	; RV64IM-NEXT: addi a4, a4, 357			; RV64IM-NEXT: lui a5, %hi(.LCPI6_1)
	; RV64IM-NEXT: mulh a4, a1, a4			; RV64IM-NEXT: ld a5, %lo(.LCPI6_1)(a5)
	; RV64IM-NEXT: add a4, a4, a1			; RV64IM-NEXT: li a4, 23
	; RV64IM-NEXT: srli a5, a4, 63			; RV64IM-NEXT: mul a3, a3, a4
	; RV64IM-NEXT: srai a4, a4, 4			; RV64IM-NEXT: sub a2, a2, a3
	; RV64IM-NEXT: add a4, a4, a5			; RV64IM-NEXT: mulh a3, a1, a5
	; RV64IM-NEXT: li a5, 23			; RV64IM-NEXT: srli a4, a3, 63
	; RV64IM-NEXT: mul a4, a4, a5			; RV64IM-NEXT: srai a3, a3, 8
	; RV64IM-NEXT: sub a1, a1, a4			; RV64IM-NEXT: add a3, a3, a4
	; RV64IM-NEXT: lui a4, 6413			; RV64IM-NEXT: lui a4, %hi(.LCPI6_2)
	; RV64IM-NEXT: addiw a4, a4, 1265			; RV64IM-NEXT: ld a4, %lo(.LCPI6_2)(a4)
	; RV64IM-NEXT: slli a4, a4, 13
	; RV64IM-NEXT: addi a4, a4, 1027
	; RV64IM-NEXT: slli a4, a4, 13
	; RV64IM-NEXT: addi a4, a4, 1077
	; RV64IM-NEXT: slli a4, a4, 12
	; RV64IM-NEXT: addi a4, a4, 965
	; RV64IM-NEXT: mulh a4, a3, a4
	; RV64IM-NEXT: srli a5, a4, 63
	; RV64IM-NEXT: srai a4, a4, 8
	; RV64IM-NEXT: add a4, a4, a5
	; RV64IM-NEXT: li a5, 654			; RV64IM-NEXT: li a5, 654
	; RV64IM-NEXT: mul a4, a4, a5			; RV64IM-NEXT: mul a3, a3, a5
	; RV64IM-NEXT: sub a3, a3, a4			; RV64IM-NEXT: sub a1, a1, a3
	; RV64IM-NEXT: lui a4, 12375			; RV64IM-NEXT: mulh a3, a6, a4
	; RV64IM-NEXT: addiw a4, a4, -575			; RV64IM-NEXT: srli a4, a3, 63
	; RV64IM-NEXT: slli a4, a4, 12			; RV64IM-NEXT: srai a3, a3, 11
	; RV64IM-NEXT: addi a4, a4, 883			; RV64IM-NEXT: add a3, a3, a4
	; RV64IM-NEXT: slli a4, a4, 13			; RV64IM-NEXT: lui a4, 1
	; RV64IM-NEXT: addi a4, a4, -431			; RV64IM-NEXT: addiw a4, a4, 1327
	; RV64IM-NEXT: slli a4, a4, 12			; RV64IM-NEXT: mul a3, a3, a4
	; RV64IM-NEXT: addi a4, a4, 1959			; RV64IM-NEXT: sub a3, a6, a3
	; RV64IM-NEXT: mulh a4, a2, a4
	; RV64IM-NEXT: srli a5, a4, 63
	; RV64IM-NEXT: srai a4, a4, 11
	; RV64IM-NEXT: add a4, a4, a5
	; RV64IM-NEXT: lui a5, 1
	; RV64IM-NEXT: addiw a5, a5, 1327
	; RV64IM-NEXT: mul a4, a4, a5
	; RV64IM-NEXT: sub a2, a2, a4
	; RV64IM-NEXT: sd zero, 0(a0)			; RV64IM-NEXT: sd zero, 0(a0)
	; RV64IM-NEXT: sd a2, 24(a0)			; RV64IM-NEXT: sd a3, 24(a0)
	; RV64IM-NEXT: sd a3, 8(a0)			; RV64IM-NEXT: sd a1, 8(a0)
	; RV64IM-NEXT: sd a1, 16(a0)			; RV64IM-NEXT: sd a2, 16(a0)
	; RV64IM-NEXT: ret			; RV64IM-NEXT: ret
	%1 = srem <4 x i64> %x, <i64 1, i64 654, i64 23, i64 5423>			%1 = srem <4 x i64> %x, <i64 1, i64 654, i64 23, i64 5423>
	ret <4 x i64> %1			ret <4 x i64> %1
	}			}

llvm/test/CodeGen/RISCV/urem-lkk.ll

	Show First 20 Lines • Show All 258 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: li a1, 98			; RV64I-NEXT: li a1, 98
	; RV64I-NEXT: call __umoddi3@plt			; RV64I-NEXT: call __umoddi3@plt
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IM-LABEL: dont_fold_urem_i64:			; RV64IM-LABEL: dont_fold_urem_i64:
	; RV64IM: # %bb.0:			; RV64IM: # %bb.0:
	; RV64IM-NEXT: srli a1, a0, 1			; RV64IM-NEXT: lui a1, %hi(.LCPI6_0)
	; RV64IM-NEXT: lui a2, 2675			; RV64IM-NEXT: ld a1, %lo(.LCPI6_0)(a1)
	; RV64IM-NEXT: addiw a2, a2, -251			; RV64IM-NEXT: srli a2, a0, 1
	; RV64IM-NEXT: slli a2, a2, 13			; RV64IM-NEXT: mulhu a1, a2, a1
	; RV64IM-NEXT: addi a2, a2, 1839
	; RV64IM-NEXT: slli a2, a2, 13
	; RV64IM-NEXT: addi a2, a2, 167
	; RV64IM-NEXT: slli a2, a2, 13
	; RV64IM-NEXT: addi a2, a2, 1505
	; RV64IM-NEXT: mulhu a1, a1, a2
	; RV64IM-NEXT: srli a1, a1, 4			; RV64IM-NEXT: srli a1, a1, 4
	; RV64IM-NEXT: li a2, 98			; RV64IM-NEXT: li a2, 98
	; RV64IM-NEXT: mul a1, a1, a2			; RV64IM-NEXT: mul a1, a1, a2
	; RV64IM-NEXT: sub a0, a0, a1			; RV64IM-NEXT: sub a0, a0, a1
	; RV64IM-NEXT: ret			; RV64IM-NEXT: ret
	%1 = urem i64 %x, 98			%1 = urem i64 %x, 98
	ret i64 %1			ret i64 %1
	}			}

llvm/test/CodeGen/RISCV/urem-vector-lkk.ll

	Show First 20 Lines • Show All 138 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: ld s3, 24(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld s3, 24(sp) # 8-byte Folded Reload
	; RV64I-NEXT: ld s4, 16(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld s4, 16(sp) # 8-byte Folded Reload
	; RV64I-NEXT: ld s5, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld s5, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 64			; RV64I-NEXT: addi sp, sp, 64
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IM-LABEL: fold_urem_vec_1:			; RV64IM-LABEL: fold_urem_vec_1:
	; RV64IM: # %bb.0:			; RV64IM: # %bb.0:
				; RV64IM-NEXT: lhu a2, 0(a1)
				; RV64IM-NEXT: lui a3, %hi(.LCPI0_0)
				; RV64IM-NEXT: ld a3, %lo(.LCPI0_0)(a3)
	; RV64IM-NEXT: lhu a6, 24(a1)			; RV64IM-NEXT: lhu a6, 24(a1)
	; RV64IM-NEXT: lhu a3, 16(a1)			; RV64IM-NEXT: lhu a5, 16(a1)
	; RV64IM-NEXT: lhu a4, 8(a1)			; RV64IM-NEXT: lhu a1, 8(a1)
	; RV64IM-NEXT: lhu a1, 0(a1)			; RV64IM-NEXT: mulhu a3, a2, a3
	; RV64IM-NEXT: lui a5, 1423			; RV64IM-NEXT: sub a4, a2, a3
	; RV64IM-NEXT: addiw a5, a5, -733			; RV64IM-NEXT: srli a4, a4, 1
	; RV64IM-NEXT: slli a5, a5, 15			; RV64IM-NEXT: add a3, a4, a3
	; RV64IM-NEXT: addi a5, a5, 1035			; RV64IM-NEXT: srli a3, a3, 6
	; RV64IM-NEXT: slli a5, a5, 13			; RV64IM-NEXT: li a7, 95
	; RV64IM-NEXT: addi a5, a5, -1811			; RV64IM-NEXT: lui a4, %hi(.LCPI0_1)
	; RV64IM-NEXT: slli a5, a5, 12			; RV64IM-NEXT: ld a4, %lo(.LCPI0_1)(a4)
	; RV64IM-NEXT: addi a5, a5, 561			; RV64IM-NEXT: mulw a3, a3, a7
	; RV64IM-NEXT: mulhu a5, a1, a5			; RV64IM-NEXT: subw t0, a2, a3
	; RV64IM-NEXT: sub a2, a1, a5			; RV64IM-NEXT: srli a3, a1, 2
	; RV64IM-NEXT: srli a2, a2, 1			; RV64IM-NEXT: mulhu a3, a3, a4
	; RV64IM-NEXT: add a2, a2, a5			; RV64IM-NEXT: srli a3, a3, 3
	; RV64IM-NEXT: srli a2, a2, 6			; RV64IM-NEXT: li a7, 124
	; RV64IM-NEXT: li a5, 95			; RV64IM-NEXT: lui a4, %hi(.LCPI0_2)
	; RV64IM-NEXT: mulw a2, a2, a5			; RV64IM-NEXT: ld a4, %lo(.LCPI0_2)(a4)
	; RV64IM-NEXT: subw a1, a1, a2			; RV64IM-NEXT: mulw a3, a3, a7
	; RV64IM-NEXT: srli a2, a4, 2			; RV64IM-NEXT: subw a1, a1, a3
	; RV64IM-NEXT: lui a5, 264			; RV64IM-NEXT: srli a3, a5, 1
	; RV64IM-NEXT: addiw a5, a5, 1057			; RV64IM-NEXT: mulhu a3, a3, a4
	; RV64IM-NEXT: slli a5, a5, 15			; RV64IM-NEXT: srli a3, a3, 4
	; RV64IM-NEXT: addi a5, a5, 1057			; RV64IM-NEXT: lui a4, %hi(.LCPI0_3)
	; RV64IM-NEXT: slli a5, a5, 15			; RV64IM-NEXT: ld a4, %lo(.LCPI0_3)(a4)
	; RV64IM-NEXT: addi a5, a5, 1057			; RV64IM-NEXT: li a2, 98
	; RV64IM-NEXT: slli a5, a5, 12			; RV64IM-NEXT: mulw a2, a3, a2
	; RV64IM-NEXT: addi a5, a5, 133			; RV64IM-NEXT: subw a2, a5, a2
	; RV64IM-NEXT: mulhu a2, a2, a5			; RV64IM-NEXT: mulhu a3, a6, a4
	; RV64IM-NEXT: srli a2, a2, 3			; RV64IM-NEXT: srli a3, a3, 7
	; RV64IM-NEXT: li a5, 124			; RV64IM-NEXT: li a4, 1003
	; RV64IM-NEXT: mulw a2, a2, a5			; RV64IM-NEXT: mulw a3, a3, a4
	; RV64IM-NEXT: subw a2, a4, a2			; RV64IM-NEXT: subw a3, a6, a3
	; RV64IM-NEXT: srli a4, a3, 1			; RV64IM-NEXT: sh a3, 6(a0)
	; RV64IM-NEXT: lui a5, 2675			; RV64IM-NEXT: sh a2, 4(a0)
	; RV64IM-NEXT: addiw a5, a5, -251			; RV64IM-NEXT: sh a1, 2(a0)
	; RV64IM-NEXT: slli a5, a5, 13			; RV64IM-NEXT: sh t0, 0(a0)
	; RV64IM-NEXT: addi a5, a5, 1839
	; RV64IM-NEXT: slli a5, a5, 13
	; RV64IM-NEXT: addi a5, a5, 167
	; RV64IM-NEXT: slli a5, a5, 13
	; RV64IM-NEXT: addi a5, a5, 1505
	; RV64IM-NEXT: mulhu a4, a4, a5
	; RV64IM-NEXT: srli a4, a4, 4
	; RV64IM-NEXT: li a5, 98
	; RV64IM-NEXT: mulw a4, a4, a5
	; RV64IM-NEXT: subw a3, a3, a4
	; RV64IM-NEXT: lui a4, 8364
	; RV64IM-NEXT: addiw a4, a4, -1977
	; RV64IM-NEXT: slli a4, a4, 12
	; RV64IM-NEXT: addi a4, a4, 1907
	; RV64IM-NEXT: slli a4, a4, 12
	; RV64IM-NEXT: addi a4, a4, 453
	; RV64IM-NEXT: slli a4, a4, 12
	; RV64IM-NEXT: addi a4, a4, 1213
	; RV64IM-NEXT: mulhu a4, a6, a4
	; RV64IM-NEXT: srli a4, a4, 7
	; RV64IM-NEXT: li a5, 1003
	; RV64IM-NEXT: mulw a4, a4, a5
	; RV64IM-NEXT: subw a4, a6, a4
	; RV64IM-NEXT: sh a4, 6(a0)
	; RV64IM-NEXT: sh a3, 4(a0)
	; RV64IM-NEXT: sh a2, 2(a0)
	; RV64IM-NEXT: sh a1, 0(a0)
	; RV64IM-NEXT: ret			; RV64IM-NEXT: ret
	%1 = urem <4 x i16> %x, <i16 95, i16 124, i16 98, i16 1003>			%1 = urem <4 x i16> %x, <i16 95, i16 124, i16 98, i16 1003>
	ret <4 x i16> %1			ret <4 x i16> %1
	}			}

	define <4 x i16> @fold_urem_vec_2(<4 x i16> %x) nounwind {			define <4 x i16> @fold_urem_vec_2(<4 x i16> %x) nounwind {
	; RV32I-LABEL: fold_urem_vec_2:			; RV32I-LABEL: fold_urem_vec_2:
	; RV32I: # %bb.0:			; RV32I: # %bb.0:
	▲ Show 20 Lines • Show All 123 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: ld s3, 24(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld s3, 24(sp) # 8-byte Folded Reload
	; RV64I-NEXT: ld s4, 16(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld s4, 16(sp) # 8-byte Folded Reload
	; RV64I-NEXT: ld s5, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld s5, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 64			; RV64I-NEXT: addi sp, sp, 64
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IM-LABEL: fold_urem_vec_2:			; RV64IM-LABEL: fold_urem_vec_2:
	; RV64IM: # %bb.0:			; RV64IM: # %bb.0:
				; RV64IM-NEXT: lhu a2, 0(a1)
				; RV64IM-NEXT: lui a3, %hi(.LCPI1_0)
				; RV64IM-NEXT: ld a3, %lo(.LCPI1_0)(a3)
	; RV64IM-NEXT: lhu a6, 24(a1)			; RV64IM-NEXT: lhu a6, 24(a1)
	; RV64IM-NEXT: lhu a7, 16(a1)			; RV64IM-NEXT: lhu a7, 16(a1)
	; RV64IM-NEXT: lhu a4, 8(a1)			; RV64IM-NEXT: lhu a1, 8(a1)
	; RV64IM-NEXT: lhu a1, 0(a1)			; RV64IM-NEXT: mulhu a4, a2, a3
	; RV64IM-NEXT: lui a5, 1423			; RV64IM-NEXT: sub a5, a2, a4
	; RV64IM-NEXT: addiw a5, a5, -733			; RV64IM-NEXT: srli a5, a5, 1
	; RV64IM-NEXT: slli a5, a5, 15			; RV64IM-NEXT: add a4, a5, a4
	; RV64IM-NEXT: addi a5, a5, 1035			; RV64IM-NEXT: srli a4, a4, 6
	; RV64IM-NEXT: slli a5, a5, 13			; RV64IM-NEXT: li a5, 95
	; RV64IM-NEXT: addi a5, a5, -1811			; RV64IM-NEXT: mulw a4, a4, a5
	; RV64IM-NEXT: slli a5, a5, 12			; RV64IM-NEXT: subw t0, a2, a4
	; RV64IM-NEXT: addi a5, a5, 561			; RV64IM-NEXT: mulhu a4, a1, a3
	; RV64IM-NEXT: mulhu a2, a1, a5			; RV64IM-NEXT: sub a2, a1, a4
	; RV64IM-NEXT: sub a3, a1, a2			; RV64IM-NEXT: srli a2, a2, 1
	; RV64IM-NEXT: srli a3, a3, 1			; RV64IM-NEXT: add a2, a2, a4
	; RV64IM-NEXT: add a2, a3, a2
	; RV64IM-NEXT: srli a2, a2, 6			; RV64IM-NEXT: srli a2, a2, 6
	; RV64IM-NEXT: li a3, 95			; RV64IM-NEXT: mulw a2, a2, a5
	; RV64IM-NEXT: mulw a2, a2, a3			; RV64IM-NEXT: subw a1, a1, a2
	; RV64IM-NEXT: subw t0, a1, a2			; RV64IM-NEXT: mulhu a2, a7, a3
	; RV64IM-NEXT: mulhu a2, a4, a5
	; RV64IM-NEXT: sub a1, a4, a2
	; RV64IM-NEXT: srli a1, a1, 1
	; RV64IM-NEXT: add a1, a1, a2
	; RV64IM-NEXT: srli a1, a1, 6
	; RV64IM-NEXT: mulw a1, a1, a3
	; RV64IM-NEXT: subw a1, a4, a1
	; RV64IM-NEXT: mulhu a2, a7, a5
	; RV64IM-NEXT: sub a4, a7, a2			; RV64IM-NEXT: sub a4, a7, a2
	; RV64IM-NEXT: srli a4, a4, 1			; RV64IM-NEXT: srli a4, a4, 1
	; RV64IM-NEXT: add a2, a4, a2			; RV64IM-NEXT: add a2, a4, a2
	; RV64IM-NEXT: srli a2, a2, 6			; RV64IM-NEXT: srli a2, a2, 6
	; RV64IM-NEXT: mulw a2, a2, a3			; RV64IM-NEXT: mulw a2, a2, a5
	; RV64IM-NEXT: subw a2, a7, a2			; RV64IM-NEXT: subw a2, a7, a2
	; RV64IM-NEXT: mulhu a4, a6, a5			; RV64IM-NEXT: mulhu a3, a6, a3
	; RV64IM-NEXT: sub a5, a6, a4			; RV64IM-NEXT: sub a4, a6, a3
	; RV64IM-NEXT: srli a5, a5, 1			; RV64IM-NEXT: srli a4, a4, 1
	; RV64IM-NEXT: add a4, a5, a4			; RV64IM-NEXT: add a3, a4, a3
	; RV64IM-NEXT: srli a4, a4, 6			; RV64IM-NEXT: srli a3, a3, 6
	; RV64IM-NEXT: mulw a3, a4, a3			; RV64IM-NEXT: mulw a3, a3, a5
	; RV64IM-NEXT: subw a3, a6, a3			; RV64IM-NEXT: subw a3, a6, a3
	; RV64IM-NEXT: sh a3, 6(a0)			; RV64IM-NEXT: sh a3, 6(a0)
	; RV64IM-NEXT: sh a2, 4(a0)			; RV64IM-NEXT: sh a2, 4(a0)
	; RV64IM-NEXT: sh a1, 2(a0)			; RV64IM-NEXT: sh a1, 2(a0)
	; RV64IM-NEXT: sh t0, 0(a0)			; RV64IM-NEXT: sh t0, 0(a0)
	; RV64IM-NEXT: ret			; RV64IM-NEXT: ret
	%1 = urem <4 x i16> %x, <i16 95, i16 95, i16 95, i16 95>			%1 = urem <4 x i16> %x, <i16 95, i16 95, i16 95, i16 95>
	ret <4 x i16> %1			ret <4 x i16> %1
	▲ Show 20 Lines • Show All 190 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: ld s7, 24(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld s7, 24(sp) # 8-byte Folded Reload
	; RV64I-NEXT: ld s8, 16(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld s8, 16(sp) # 8-byte Folded Reload
	; RV64I-NEXT: ld s9, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld s9, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 96			; RV64I-NEXT: addi sp, sp, 96
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IM-LABEL: combine_urem_udiv:			; RV64IM-LABEL: combine_urem_udiv:
	; RV64IM: # %bb.0:			; RV64IM: # %bb.0:
				; RV64IM-NEXT: lhu a2, 24(a1)
				; RV64IM-NEXT: lui a3, %hi(.LCPI2_0)
				; RV64IM-NEXT: ld a3, %lo(.LCPI2_0)(a3)
	; RV64IM-NEXT: lhu a6, 0(a1)			; RV64IM-NEXT: lhu a6, 0(a1)
	; RV64IM-NEXT: lhu a7, 8(a1)			; RV64IM-NEXT: lhu a7, 8(a1)
	; RV64IM-NEXT: lhu a4, 16(a1)			; RV64IM-NEXT: lhu a1, 16(a1)
	; RV64IM-NEXT: lhu a1, 24(a1)			; RV64IM-NEXT: mulhu a4, a2, a3
	; RV64IM-NEXT: lui a5, 1423			; RV64IM-NEXT: sub a5, a2, a4
	; RV64IM-NEXT: addiw a5, a5, -733			; RV64IM-NEXT: srli a5, a5, 1
	; RV64IM-NEXT: slli a5, a5, 15			; RV64IM-NEXT: add a4, a5, a4
	; RV64IM-NEXT: addi a5, a5, 1035			; RV64IM-NEXT: srli t3, a4, 6
	; RV64IM-NEXT: slli a5, a5, 13
	; RV64IM-NEXT: addi a5, a5, -1811
	; RV64IM-NEXT: slli a5, a5, 12
	; RV64IM-NEXT: addi a5, a5, 561
	; RV64IM-NEXT: mulhu a2, a1, a5
	; RV64IM-NEXT: sub a3, a1, a2
	; RV64IM-NEXT: srli a3, a3, 1
	; RV64IM-NEXT: add a2, a3, a2
	; RV64IM-NEXT: srli t3, a2, 6
	; RV64IM-NEXT: li t0, 95			; RV64IM-NEXT: li t0, 95
	; RV64IM-NEXT: mulw a3, t3, t0			; RV64IM-NEXT: mulw a5, t3, t0
	; RV64IM-NEXT: subw t1, a1, a3			; RV64IM-NEXT: subw t1, a2, a5
	; RV64IM-NEXT: mulhu a3, a4, a5			; RV64IM-NEXT: mulhu a5, a1, a3
	; RV64IM-NEXT: sub a1, a4, a3			; RV64IM-NEXT: sub a2, a1, a5
	; RV64IM-NEXT: srli a1, a1, 1
	; RV64IM-NEXT: add a1, a1, a3
	; RV64IM-NEXT: srli a1, a1, 6
	; RV64IM-NEXT: mulw a3, a1, t0
	; RV64IM-NEXT: subw t2, a4, a3
	; RV64IM-NEXT: mulhu a4, a7, a5
	; RV64IM-NEXT: sub a3, a7, a4
	; RV64IM-NEXT: srli a3, a3, 1
	; RV64IM-NEXT: add a3, a3, a4
	; RV64IM-NEXT: srli a3, a3, 6
	; RV64IM-NEXT: mulw a4, a3, t0
	; RV64IM-NEXT: subw a4, a7, a4
	; RV64IM-NEXT: mulhu a5, a6, a5
	; RV64IM-NEXT: sub a2, a6, a5
	; RV64IM-NEXT: srli a2, a2, 1			; RV64IM-NEXT: srli a2, a2, 1
	; RV64IM-NEXT: add a2, a2, a5			; RV64IM-NEXT: add a2, a2, a5
	; RV64IM-NEXT: srli a2, a2, 6			; RV64IM-NEXT: srli a2, a2, 6
	; RV64IM-NEXT: mulw a5, a2, t0			; RV64IM-NEXT: mulw a5, a2, t0
	; RV64IM-NEXT: subw a5, a6, a5			; RV64IM-NEXT: subw t2, a1, a5
	; RV64IM-NEXT: addw a2, a5, a2			; RV64IM-NEXT: mulhu a5, a7, a3
				; RV64IM-NEXT: sub a1, a7, a5
				; RV64IM-NEXT: srli a1, a1, 1
				; RV64IM-NEXT: add a1, a1, a5
				; RV64IM-NEXT: srli a1, a1, 6
				; RV64IM-NEXT: mulw a5, a1, t0
				; RV64IM-NEXT: subw a5, a7, a5
				; RV64IM-NEXT: mulhu a3, a6, a3
				; RV64IM-NEXT: sub a4, a6, a3
				; RV64IM-NEXT: srli a4, a4, 1
				; RV64IM-NEXT: add a3, a4, a3
				; RV64IM-NEXT: srli a3, a3, 6
				; RV64IM-NEXT: mulw a4, a3, t0
				; RV64IM-NEXT: subw a4, a6, a4
	; RV64IM-NEXT: addw a3, a4, a3			; RV64IM-NEXT: addw a3, a4, a3
	; RV64IM-NEXT: addw a1, t2, a1			; RV64IM-NEXT: addw a1, a5, a1
				; RV64IM-NEXT: addw a2, t2, a2
	; RV64IM-NEXT: addw a4, t1, t3			; RV64IM-NEXT: addw a4, t1, t3
	; RV64IM-NEXT: sh a4, 6(a0)			; RV64IM-NEXT: sh a4, 6(a0)
	; RV64IM-NEXT: sh a1, 4(a0)			; RV64IM-NEXT: sh a2, 4(a0)
	; RV64IM-NEXT: sh a3, 2(a0)			; RV64IM-NEXT: sh a1, 2(a0)
	; RV64IM-NEXT: sh a2, 0(a0)			; RV64IM-NEXT: sh a3, 0(a0)
	; RV64IM-NEXT: ret			; RV64IM-NEXT: ret
	%1 = urem <4 x i16> %x, <i16 95, i16 95, i16 95, i16 95>			%1 = urem <4 x i16> %x, <i16 95, i16 95, i16 95, i16 95>
	%2 = udiv <4 x i16> %x, <i16 95, i16 95, i16 95, i16 95>			%2 = udiv <4 x i16> %x, <i16 95, i16 95, i16 95, i16 95>
	%3 = add <4 x i16> %1, %2			%3 = add <4 x i16> %1, %2
	ret <4 x i16> %3			ret <4 x i16> %3
	}			}

	; Don't fold for divisors that are a power of two.			; Don't fold for divisors that are a power of two.
	▲ Show 20 Lines • Show All 82 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: ld s1, 24(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld s1, 24(sp) # 8-byte Folded Reload
	; RV64I-NEXT: ld s2, 16(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld s2, 16(sp) # 8-byte Folded Reload
	; RV64I-NEXT: ld s3, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld s3, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 48			; RV64I-NEXT: addi sp, sp, 48
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IM-LABEL: dont_fold_urem_power_of_two:			; RV64IM-LABEL: dont_fold_urem_power_of_two:
	; RV64IM: # %bb.0:			; RV64IM: # %bb.0:
				; RV64IM-NEXT: lhu a2, 24(a1)
				; RV64IM-NEXT: lui a3, %hi(.LCPI3_0)
				; RV64IM-NEXT: ld a3, %lo(.LCPI3_0)(a3)
	; RV64IM-NEXT: lhu a6, 16(a1)			; RV64IM-NEXT: lhu a6, 16(a1)
	; RV64IM-NEXT: lhu a3, 8(a1)			; RV64IM-NEXT: lhu a5, 8(a1)
	; RV64IM-NEXT: lhu a4, 0(a1)			; RV64IM-NEXT: lhu a1, 0(a1)
	; RV64IM-NEXT: lhu a1, 24(a1)			; RV64IM-NEXT: mulhu a3, a2, a3
	; RV64IM-NEXT: lui a5, 1423			; RV64IM-NEXT: sub a4, a2, a3
	; RV64IM-NEXT: addiw a5, a5, -733			; RV64IM-NEXT: srli a4, a4, 1
	; RV64IM-NEXT: slli a5, a5, 15			; RV64IM-NEXT: add a3, a4, a3
	; RV64IM-NEXT: addi a5, a5, 1035			; RV64IM-NEXT: srli a3, a3, 6
	; RV64IM-NEXT: slli a5, a5, 13			; RV64IM-NEXT: li a4, 95
	; RV64IM-NEXT: addi a5, a5, -1811			; RV64IM-NEXT: mulw a3, a3, a4
	; RV64IM-NEXT: slli a5, a5, 12			; RV64IM-NEXT: subw a2, a2, a3
	; RV64IM-NEXT: addi a5, a5, 561			; RV64IM-NEXT: andi a1, a1, 63
	; RV64IM-NEXT: mulhu a5, a1, a5			; RV64IM-NEXT: andi a3, a5, 31
	; RV64IM-NEXT: sub a2, a1, a5
	; RV64IM-NEXT: srli a2, a2, 1
	; RV64IM-NEXT: add a2, a2, a5
	; RV64IM-NEXT: srli a2, a2, 6
	; RV64IM-NEXT: li a5, 95
	; RV64IM-NEXT: mulw a2, a2, a5
	; RV64IM-NEXT: subw a1, a1, a2
	; RV64IM-NEXT: andi a2, a4, 63
	; RV64IM-NEXT: andi a3, a3, 31
	; RV64IM-NEXT: andi a4, a6, 7			; RV64IM-NEXT: andi a4, a6, 7
	; RV64IM-NEXT: sh a4, 4(a0)			; RV64IM-NEXT: sh a4, 4(a0)
	; RV64IM-NEXT: sh a3, 2(a0)			; RV64IM-NEXT: sh a3, 2(a0)
	; RV64IM-NEXT: sh a2, 0(a0)			; RV64IM-NEXT: sh a1, 0(a0)
	; RV64IM-NEXT: sh a1, 6(a0)			; RV64IM-NEXT: sh a2, 6(a0)
	; RV64IM-NEXT: ret			; RV64IM-NEXT: ret
	%1 = urem <4 x i16> %x, <i16 64, i16 32, i16 8, i16 95>			%1 = urem <4 x i16> %x, <i16 64, i16 32, i16 8, i16 95>
	ret <4 x i16> %1			ret <4 x i16> %1
	}			}

	; Don't fold if the divisor is one.			; Don't fold if the divisor is one.
	define <4 x i16> @dont_fold_urem_one(<4 x i16> %x) nounwind {			define <4 x i16> @dont_fold_urem_one(<4 x i16> %x) nounwind {
	; RV32I-LABEL: dont_fold_urem_one:			; RV32I-LABEL: dont_fold_urem_one:
	▲ Show 20 Lines • Show All 99 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: ld s1, 24(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld s1, 24(sp) # 8-byte Folded Reload
	; RV64I-NEXT: ld s2, 16(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld s2, 16(sp) # 8-byte Folded Reload
	; RV64I-NEXT: ld s3, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld s3, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 48			; RV64I-NEXT: addi sp, sp, 48
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IM-LABEL: dont_fold_urem_one:			; RV64IM-LABEL: dont_fold_urem_one:
	; RV64IM: # %bb.0:			; RV64IM: # %bb.0:
	; RV64IM-NEXT: lhu a2, 24(a1)			; RV64IM-NEXT: lhu a2, 16(a1)
	; RV64IM-NEXT: lhu a3, 8(a1)			; RV64IM-NEXT: lui a3, %hi(.LCPI4_0)
	; RV64IM-NEXT: lhu a1, 16(a1)			; RV64IM-NEXT: ld a3, %lo(.LCPI4_0)(a3)
	; RV64IM-NEXT: lui a4, 3206			; RV64IM-NEXT: lhu a4, 24(a1)
	; RV64IM-NEXT: addiw a4, a4, -1781			; RV64IM-NEXT: lhu a1, 8(a1)
	; RV64IM-NEXT: slli a4, a4, 13			; RV64IM-NEXT: mulhu a3, a2, a3
	; RV64IM-NEXT: addi a4, a4, 1069			; RV64IM-NEXT: sub a5, a2, a3
	; RV64IM-NEXT: slli a4, a4, 12
	; RV64IM-NEXT: addi a4, a4, -1959
	; RV64IM-NEXT: slli a4, a4, 14
	; RV64IM-NEXT: addi a4, a4, 713
	; RV64IM-NEXT: mulhu a4, a1, a4
	; RV64IM-NEXT: sub a5, a1, a4
	; RV64IM-NEXT: srli a5, a5, 1			; RV64IM-NEXT: srli a5, a5, 1
	; RV64IM-NEXT: add a4, a5, a4			; RV64IM-NEXT: add a3, a5, a3
	; RV64IM-NEXT: srli a4, a4, 4			; RV64IM-NEXT: srli a3, a3, 4
	; RV64IM-NEXT: li a5, 23			; RV64IM-NEXT: li a6, 23
	; RV64IM-NEXT: mulw a4, a4, a5			; RV64IM-NEXT: lui a5, %hi(.LCPI4_1)
	; RV64IM-NEXT: subw a1, a1, a4			; RV64IM-NEXT: ld a5, %lo(.LCPI4_1)(a5)
	; RV64IM-NEXT: srli a4, a3, 1			; RV64IM-NEXT: mulw a3, a3, a6
	; RV64IM-NEXT: lui a5, 6413			; RV64IM-NEXT: subw a6, a2, a3
	; RV64IM-NEXT: addiw a5, a5, 1265			; RV64IM-NEXT: srli a3, a1, 1
	; RV64IM-NEXT: slli a5, a5, 13			; RV64IM-NEXT: mulhu a3, a3, a5
	; RV64IM-NEXT: addi a5, a5, 1027			; RV64IM-NEXT: srli a3, a3, 7
	; RV64IM-NEXT: slli a5, a5, 13			; RV64IM-NEXT: lui a5, %hi(.LCPI4_2)
	; RV64IM-NEXT: addi a5, a5, 1077			; RV64IM-NEXT: ld a5, %lo(.LCPI4_2)(a5)
	; RV64IM-NEXT: slli a5, a5, 12			; RV64IM-NEXT: li a2, 654
	; RV64IM-NEXT: addi a5, a5, 965			; RV64IM-NEXT: mulw a2, a3, a2
	; RV64IM-NEXT: mulhu a4, a4, a5			; RV64IM-NEXT: subw a1, a1, a2
	; RV64IM-NEXT: srli a4, a4, 7			; RV64IM-NEXT: mulhu a2, a4, a5
	; RV64IM-NEXT: li a5, 654			; RV64IM-NEXT: srli a2, a2, 12
	; RV64IM-NEXT: mulw a4, a4, a5			; RV64IM-NEXT: lui a3, 1
	; RV64IM-NEXT: subw a3, a3, a4			; RV64IM-NEXT: addiw a3, a3, 1327
	; RV64IM-NEXT: lui a4, 1044567			; RV64IM-NEXT: mulw a2, a2, a3
	; RV64IM-NEXT: addiw a4, a4, -575			; RV64IM-NEXT: subw a2, a4, a2
	; RV64IM-NEXT: slli a4, a4, 12
	; RV64IM-NEXT: addi a4, a4, 883
	; RV64IM-NEXT: slli a4, a4, 14
	; RV64IM-NEXT: addi a4, a4, -861
	; RV64IM-NEXT: slli a4, a4, 12
	; RV64IM-NEXT: addi a4, a4, -179
	; RV64IM-NEXT: mulhu a4, a2, a4
	; RV64IM-NEXT: srli a4, a4, 12
	; RV64IM-NEXT: lui a5, 1
	; RV64IM-NEXT: addiw a5, a5, 1327
	; RV64IM-NEXT: mulw a4, a4, a5
	; RV64IM-NEXT: subw a2, a2, a4
	; RV64IM-NEXT: sh zero, 0(a0)			; RV64IM-NEXT: sh zero, 0(a0)
	; RV64IM-NEXT: sh a2, 6(a0)			; RV64IM-NEXT: sh a2, 6(a0)
	; RV64IM-NEXT: sh a3, 2(a0)			; RV64IM-NEXT: sh a1, 2(a0)
	; RV64IM-NEXT: sh a1, 4(a0)			; RV64IM-NEXT: sh a6, 4(a0)
	; RV64IM-NEXT: ret			; RV64IM-NEXT: ret
	%1 = urem <4 x i16> %x, <i16 1, i16 654, i16 23, i16 5423>			%1 = urem <4 x i16> %x, <i16 1, i16 654, i16 23, i16 5423>
	ret <4 x i16> %1			ret <4 x i16> %1
	}			}

	; Don't fold if the divisor is 2^16.			; Don't fold if the divisor is 2^16.
	define <4 x i16> @dont_fold_urem_i16_smax(<4 x i16> %x) nounwind {			define <4 x i16> @dont_fold_urem_i16_smax(<4 x i16> %x) nounwind {
	; CHECK-LABEL: dont_fold_urem_i16_smax:			; CHECK-LABEL: dont_fold_urem_i16_smax:
	▲ Show 20 Lines • Show All 180 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: ld s1, 24(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld s1, 24(sp) # 8-byte Folded Reload
	; RV64I-NEXT: ld s2, 16(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld s2, 16(sp) # 8-byte Folded Reload
	; RV64I-NEXT: ld s3, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld s3, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 48			; RV64I-NEXT: addi sp, sp, 48
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IM-LABEL: dont_fold_urem_i64:			; RV64IM-LABEL: dont_fold_urem_i64:
	; RV64IM: # %bb.0:			; RV64IM: # %bb.0:
	; RV64IM-NEXT: ld a2, 24(a1)			; RV64IM-NEXT: ld a2, 16(a1)
	; RV64IM-NEXT: ld a3, 8(a1)			; RV64IM-NEXT: lui a3, %hi(.LCPI6_0)
	; RV64IM-NEXT: ld a1, 16(a1)			; RV64IM-NEXT: ld a3, %lo(.LCPI6_0)(a3)
	; RV64IM-NEXT: lui a4, 3206			; RV64IM-NEXT: ld a4, 24(a1)
	; RV64IM-NEXT: addiw a4, a4, -1781			; RV64IM-NEXT: ld a1, 8(a1)
	; RV64IM-NEXT: slli a4, a4, 13			; RV64IM-NEXT: mulhu a3, a2, a3
	; RV64IM-NEXT: addi a4, a4, 1069			; RV64IM-NEXT: sub a5, a2, a3
	; RV64IM-NEXT: slli a4, a4, 12
	; RV64IM-NEXT: addi a4, a4, -1959
	; RV64IM-NEXT: slli a4, a4, 14
	; RV64IM-NEXT: addi a4, a4, 713
	; RV64IM-NEXT: mulhu a4, a1, a4
	; RV64IM-NEXT: sub a5, a1, a4
	; RV64IM-NEXT: srli a5, a5, 1			; RV64IM-NEXT: srli a5, a5, 1
	; RV64IM-NEXT: add a4, a5, a4			; RV64IM-NEXT: add a3, a5, a3
	; RV64IM-NEXT: srli a4, a4, 4			; RV64IM-NEXT: srli a3, a3, 4
	; RV64IM-NEXT: li a5, 23			; RV64IM-NEXT: li a6, 23
	; RV64IM-NEXT: mul a4, a4, a5			; RV64IM-NEXT: lui a5, %hi(.LCPI6_1)
	; RV64IM-NEXT: sub a1, a1, a4			; RV64IM-NEXT: ld a5, %lo(.LCPI6_1)(a5)
	; RV64IM-NEXT: srli a4, a3, 1			; RV64IM-NEXT: mul a3, a3, a6
	; RV64IM-NEXT: lui a5, 6413			; RV64IM-NEXT: sub a6, a2, a3
	; RV64IM-NEXT: addiw a5, a5, 1265			; RV64IM-NEXT: srli a3, a1, 1
	; RV64IM-NEXT: slli a5, a5, 13			; RV64IM-NEXT: mulhu a3, a3, a5
	; RV64IM-NEXT: addi a5, a5, 1027			; RV64IM-NEXT: srli a3, a3, 7
	; RV64IM-NEXT: slli a5, a5, 13			; RV64IM-NEXT: lui a5, %hi(.LCPI6_2)
	; RV64IM-NEXT: addi a5, a5, 1077			; RV64IM-NEXT: ld a5, %lo(.LCPI6_2)(a5)
	; RV64IM-NEXT: slli a5, a5, 12			; RV64IM-NEXT: li a2, 654
	; RV64IM-NEXT: addi a5, a5, 965			; RV64IM-NEXT: mul a2, a3, a2
	; RV64IM-NEXT: mulhu a4, a4, a5			; RV64IM-NEXT: sub a1, a1, a2
	; RV64IM-NEXT: srli a4, a4, 7			; RV64IM-NEXT: mulhu a2, a4, a5
	; RV64IM-NEXT: li a5, 654			; RV64IM-NEXT: srli a2, a2, 12
	; RV64IM-NEXT: mul a4, a4, a5			; RV64IM-NEXT: lui a3, 1
	; RV64IM-NEXT: sub a3, a3, a4			; RV64IM-NEXT: addiw a3, a3, 1327
	; RV64IM-NEXT: lui a4, 1044567			; RV64IM-NEXT: mul a2, a2, a3
	; RV64IM-NEXT: addiw a4, a4, -575			; RV64IM-NEXT: sub a2, a4, a2
	; RV64IM-NEXT: slli a4, a4, 12
	; RV64IM-NEXT: addi a4, a4, 883
	; RV64IM-NEXT: slli a4, a4, 14
	; RV64IM-NEXT: addi a4, a4, -861
	; RV64IM-NEXT: slli a4, a4, 12
	; RV64IM-NEXT: addi a4, a4, -179
	; RV64IM-NEXT: mulhu a4, a2, a4
	; RV64IM-NEXT: srli a4, a4, 12
	; RV64IM-NEXT: lui a5, 1
	; RV64IM-NEXT: addiw a5, a5, 1327
	; RV64IM-NEXT: mul a4, a4, a5
	; RV64IM-NEXT: sub a2, a2, a4
	; RV64IM-NEXT: sd zero, 0(a0)			; RV64IM-NEXT: sd zero, 0(a0)
	; RV64IM-NEXT: sd a2, 24(a0)			; RV64IM-NEXT: sd a2, 24(a0)
	; RV64IM-NEXT: sd a3, 8(a0)			; RV64IM-NEXT: sd a1, 8(a0)
	; RV64IM-NEXT: sd a1, 16(a0)			; RV64IM-NEXT: sd a6, 16(a0)
	; RV64IM-NEXT: ret			; RV64IM-NEXT: ret
	%1 = urem <4 x i64> %x, <i64 1, i64 654, i64 23, i64 5423>			%1 = urem <4 x i64> %x, <i64 1, i64 654, i64 23, i64 5423>
	ret <4 x i64> %1			ret <4 x i64> %1
	}			}

llvm/test/CodeGen/RISCV/vararg.ll

	Show First 20 Lines • Show All 1,528 Lines • ▼ Show 20 Lines
	; LP64-LP64F-LP64D-FPELIM-NEXT: addi sp, sp, -48			; LP64-LP64F-LP64D-FPELIM-NEXT: addi sp, sp, -48
	; LP64-LP64F-LP64D-FPELIM-NEXT: sd ra, 40(sp) # 8-byte Folded Spill			; LP64-LP64F-LP64D-FPELIM-NEXT: sd ra, 40(sp) # 8-byte Folded Spill
	; LP64-LP64F-LP64D-FPELIM-NEXT: li a0, 17			; LP64-LP64F-LP64D-FPELIM-NEXT: li a0, 17
	; LP64-LP64F-LP64D-FPELIM-NEXT: sd a0, 24(sp)			; LP64-LP64F-LP64D-FPELIM-NEXT: sd a0, 24(sp)
	; LP64-LP64F-LP64D-FPELIM-NEXT: li a0, 16			; LP64-LP64F-LP64D-FPELIM-NEXT: li a0, 16
	; LP64-LP64F-LP64D-FPELIM-NEXT: sd a0, 16(sp)			; LP64-LP64F-LP64D-FPELIM-NEXT: sd a0, 16(sp)
	; LP64-LP64F-LP64D-FPELIM-NEXT: li a0, 15			; LP64-LP64F-LP64D-FPELIM-NEXT: li a0, 15
	; LP64-LP64F-LP64D-FPELIM-NEXT: sd a0, 8(sp)			; LP64-LP64F-LP64D-FPELIM-NEXT: sd a0, 8(sp)
	; LP64-LP64F-LP64D-FPELIM-NEXT: lui a0, 2049			; LP64-LP64F-LP64D-FPELIM-NEXT: lui a0, %hi(.LCPI11_0)
	; LP64-LP64F-LP64D-FPELIM-NEXT: addiw a0, a0, -1147			; LP64-LP64F-LP64D-FPELIM-NEXT: ld t0, %lo(.LCPI11_0)(a0)
	; LP64-LP64F-LP64D-FPELIM-NEXT: slli a0, a0, 13			; LP64-LP64F-LP64D-FPELIM-NEXT: lui a0, %hi(.LCPI11_1)
	; LP64-LP64F-LP64D-FPELIM-NEXT: addi a0, a0, 983			; LP64-LP64F-LP64D-FPELIM-NEXT: ld a2, %lo(.LCPI11_1)(a0)
	; LP64-LP64F-LP64D-FPELIM-NEXT: slli a0, a0, 14			; LP64-LP64F-LP64D-FPELIM-NEXT: lui a0, %hi(.LCPI11_2)
	; LP64-LP64F-LP64D-FPELIM-NEXT: addi a0, a0, 655			; LP64-LP64F-LP64D-FPELIM-NEXT: ld a3, %lo(.LCPI11_2)(a0)
	; LP64-LP64F-LP64D-FPELIM-NEXT: slli a0, a0, 12
	; LP64-LP64F-LP64D-FPELIM-NEXT: addi t0, a0, 1475
	; LP64-LP64F-LP64D-FPELIM-NEXT: lui a0, 1192			; LP64-LP64F-LP64D-FPELIM-NEXT: lui a0, 1192
	; LP64-LP64F-LP64D-FPELIM-NEXT: addiw a0, a0, 381			; LP64-LP64F-LP64D-FPELIM-NEXT: addiw a0, a0, 381
	; LP64-LP64F-LP64D-FPELIM-NEXT: slli a0, a0, 12			; LP64-LP64F-LP64D-FPELIM-NEXT: slli a0, a0, 12
	; LP64-LP64F-LP64D-FPELIM-NEXT: addi a6, a0, -2048			; LP64-LP64F-LP64D-FPELIM-NEXT: addi a6, a0, -2048
	; LP64-LP64F-LP64D-FPELIM-NEXT: lui a0, 1048248
	; LP64-LP64F-LP64D-FPELIM-NEXT: addiw a0, a0, 1311
	; LP64-LP64F-LP64D-FPELIM-NEXT: slli a0, a0, 12
	; LP64-LP64F-LP64D-FPELIM-NEXT: addi a0, a0, -1147
	; LP64-LP64F-LP64D-FPELIM-NEXT: slli a0, a0, 13
	; LP64-LP64F-LP64D-FPELIM-NEXT: addi a0, a0, 983
	; LP64-LP64F-LP64D-FPELIM-NEXT: slli a0, a0, 15
	; LP64-LP64F-LP64D-FPELIM-NEXT: addi a2, a0, 1311
	; LP64-LP64F-LP64D-FPELIM-NEXT: lui a0, 512
	; LP64-LP64F-LP64D-FPELIM-NEXT: addiw a0, a0, 73
	; LP64-LP64F-LP64D-FPELIM-NEXT: slli a0, a0, 15
	; LP64-LP64F-LP64D-FPELIM-NEXT: addi a0, a0, -1311
	; LP64-LP64F-LP64D-FPELIM-NEXT: slli a0, a0, 12
	; LP64-LP64F-LP64D-FPELIM-NEXT: addi a0, a0, 1147
	; LP64-LP64F-LP64D-FPELIM-NEXT: slli a0, a0, 14
	; LP64-LP64F-LP64D-FPELIM-NEXT: addi a3, a0, -1967
	; LP64-LP64F-LP64D-FPELIM-NEXT: li a0, 1			; LP64-LP64F-LP64D-FPELIM-NEXT: li a0, 1
	; LP64-LP64F-LP64D-FPELIM-NEXT: li a1, 11			; LP64-LP64F-LP64D-FPELIM-NEXT: li a1, 11
	; LP64-LP64F-LP64D-FPELIM-NEXT: li a4, 12			; LP64-LP64F-LP64D-FPELIM-NEXT: li a4, 12
	; LP64-LP64F-LP64D-FPELIM-NEXT: li a5, 13			; LP64-LP64F-LP64D-FPELIM-NEXT: li a5, 13
	; LP64-LP64F-LP64D-FPELIM-NEXT: li a7, 14			; LP64-LP64F-LP64D-FPELIM-NEXT: li a7, 14
	; LP64-LP64F-LP64D-FPELIM-NEXT: sd t0, 0(sp)			; LP64-LP64F-LP64D-FPELIM-NEXT: sd t0, 0(sp)
	; LP64-LP64F-LP64D-FPELIM-NEXT: call va5_aligned_stack_callee@plt			; LP64-LP64F-LP64D-FPELIM-NEXT: call va5_aligned_stack_callee@plt
	; LP64-LP64F-LP64D-FPELIM-NEXT: ld ra, 40(sp) # 8-byte Folded Reload			; LP64-LP64F-LP64D-FPELIM-NEXT: ld ra, 40(sp) # 8-byte Folded Reload
	; LP64-LP64F-LP64D-FPELIM-NEXT: addi sp, sp, 48			; LP64-LP64F-LP64D-FPELIM-NEXT: addi sp, sp, 48
	; LP64-LP64F-LP64D-FPELIM-NEXT: ret			; LP64-LP64F-LP64D-FPELIM-NEXT: ret
	;			;
	; LP64-LP64F-LP64D-WITHFP-LABEL: va5_aligned_stack_caller:			; LP64-LP64F-LP64D-WITHFP-LABEL: va5_aligned_stack_caller:
	; LP64-LP64F-LP64D-WITHFP: # %bb.0:			; LP64-LP64F-LP64D-WITHFP: # %bb.0:
	; LP64-LP64F-LP64D-WITHFP-NEXT: addi sp, sp, -48			; LP64-LP64F-LP64D-WITHFP-NEXT: addi sp, sp, -48
	; LP64-LP64F-LP64D-WITHFP-NEXT: sd ra, 40(sp) # 8-byte Folded Spill			; LP64-LP64F-LP64D-WITHFP-NEXT: sd ra, 40(sp) # 8-byte Folded Spill
	; LP64-LP64F-LP64D-WITHFP-NEXT: sd s0, 32(sp) # 8-byte Folded Spill			; LP64-LP64F-LP64D-WITHFP-NEXT: sd s0, 32(sp) # 8-byte Folded Spill
	; LP64-LP64F-LP64D-WITHFP-NEXT: addi s0, sp, 48			; LP64-LP64F-LP64D-WITHFP-NEXT: addi s0, sp, 48
	; LP64-LP64F-LP64D-WITHFP-NEXT: li a0, 17			; LP64-LP64F-LP64D-WITHFP-NEXT: li a0, 17
	; LP64-LP64F-LP64D-WITHFP-NEXT: sd a0, 24(sp)			; LP64-LP64F-LP64D-WITHFP-NEXT: sd a0, 24(sp)
	; LP64-LP64F-LP64D-WITHFP-NEXT: li a0, 16			; LP64-LP64F-LP64D-WITHFP-NEXT: li a0, 16
	; LP64-LP64F-LP64D-WITHFP-NEXT: sd a0, 16(sp)			; LP64-LP64F-LP64D-WITHFP-NEXT: sd a0, 16(sp)
	; LP64-LP64F-LP64D-WITHFP-NEXT: li a0, 15			; LP64-LP64F-LP64D-WITHFP-NEXT: li a0, 15
	; LP64-LP64F-LP64D-WITHFP-NEXT: sd a0, 8(sp)			; LP64-LP64F-LP64D-WITHFP-NEXT: sd a0, 8(sp)
	; LP64-LP64F-LP64D-WITHFP-NEXT: lui a0, 2049			; LP64-LP64F-LP64D-WITHFP-NEXT: lui a0, %hi(.LCPI11_0)
	; LP64-LP64F-LP64D-WITHFP-NEXT: addiw a0, a0, -1147			; LP64-LP64F-LP64D-WITHFP-NEXT: ld t0, %lo(.LCPI11_0)(a0)
	; LP64-LP64F-LP64D-WITHFP-NEXT: slli a0, a0, 13			; LP64-LP64F-LP64D-WITHFP-NEXT: lui a0, %hi(.LCPI11_1)
	; LP64-LP64F-LP64D-WITHFP-NEXT: addi a0, a0, 983			; LP64-LP64F-LP64D-WITHFP-NEXT: ld a2, %lo(.LCPI11_1)(a0)
	; LP64-LP64F-LP64D-WITHFP-NEXT: slli a0, a0, 14			; LP64-LP64F-LP64D-WITHFP-NEXT: lui a0, %hi(.LCPI11_2)
	; LP64-LP64F-LP64D-WITHFP-NEXT: addi a0, a0, 655			; LP64-LP64F-LP64D-WITHFP-NEXT: ld a3, %lo(.LCPI11_2)(a0)
	; LP64-LP64F-LP64D-WITHFP-NEXT: slli a0, a0, 12
	; LP64-LP64F-LP64D-WITHFP-NEXT: addi t0, a0, 1475
	; LP64-LP64F-LP64D-WITHFP-NEXT: lui a0, 1192			; LP64-LP64F-LP64D-WITHFP-NEXT: lui a0, 1192
	; LP64-LP64F-LP64D-WITHFP-NEXT: addiw a0, a0, 381			; LP64-LP64F-LP64D-WITHFP-NEXT: addiw a0, a0, 381
	; LP64-LP64F-LP64D-WITHFP-NEXT: slli a0, a0, 12			; LP64-LP64F-LP64D-WITHFP-NEXT: slli a0, a0, 12
	; LP64-LP64F-LP64D-WITHFP-NEXT: addi a6, a0, -2048			; LP64-LP64F-LP64D-WITHFP-NEXT: addi a6, a0, -2048
	; LP64-LP64F-LP64D-WITHFP-NEXT: lui a0, 1048248
	; LP64-LP64F-LP64D-WITHFP-NEXT: addiw a0, a0, 1311
	; LP64-LP64F-LP64D-WITHFP-NEXT: slli a0, a0, 12
	; LP64-LP64F-LP64D-WITHFP-NEXT: addi a0, a0, -1147
	; LP64-LP64F-LP64D-WITHFP-NEXT: slli a0, a0, 13
	; LP64-LP64F-LP64D-WITHFP-NEXT: addi a0, a0, 983
	; LP64-LP64F-LP64D-WITHFP-NEXT: slli a0, a0, 15
	; LP64-LP64F-LP64D-WITHFP-NEXT: addi a2, a0, 1311
	; LP64-LP64F-LP64D-WITHFP-NEXT: lui a0, 512
	; LP64-LP64F-LP64D-WITHFP-NEXT: addiw a0, a0, 73
	; LP64-LP64F-LP64D-WITHFP-NEXT: slli a0, a0, 15
	; LP64-LP64F-LP64D-WITHFP-NEXT: addi a0, a0, -1311
	; LP64-LP64F-LP64D-WITHFP-NEXT: slli a0, a0, 12
	; LP64-LP64F-LP64D-WITHFP-NEXT: addi a0, a0, 1147
	; LP64-LP64F-LP64D-WITHFP-NEXT: slli a0, a0, 14
	; LP64-LP64F-LP64D-WITHFP-NEXT: addi a3, a0, -1967
	; LP64-LP64F-LP64D-WITHFP-NEXT: li a0, 1			; LP64-LP64F-LP64D-WITHFP-NEXT: li a0, 1
	; LP64-LP64F-LP64D-WITHFP-NEXT: li a1, 11			; LP64-LP64F-LP64D-WITHFP-NEXT: li a1, 11
	; LP64-LP64F-LP64D-WITHFP-NEXT: li a4, 12			; LP64-LP64F-LP64D-WITHFP-NEXT: li a4, 12
	; LP64-LP64F-LP64D-WITHFP-NEXT: li a5, 13			; LP64-LP64F-LP64D-WITHFP-NEXT: li a5, 13
	; LP64-LP64F-LP64D-WITHFP-NEXT: li a7, 14			; LP64-LP64F-LP64D-WITHFP-NEXT: li a7, 14
	; LP64-LP64F-LP64D-WITHFP-NEXT: sd t0, 0(sp)			; LP64-LP64F-LP64D-WITHFP-NEXT: sd t0, 0(sp)
	; LP64-LP64F-LP64D-WITHFP-NEXT: call va5_aligned_stack_callee@plt			; LP64-LP64F-LP64D-WITHFP-NEXT: call va5_aligned_stack_callee@plt
	; LP64-LP64F-LP64D-WITHFP-NEXT: ld ra, 40(sp) # 8-byte Folded Reload			; LP64-LP64F-LP64D-WITHFP-NEXT: ld ra, 40(sp) # 8-byte Folded Reload
	▲ Show 20 Lines • Show All 328 Lines • Show Last 20 Lines

This is an archive of the discontinued LLVM Phabricator instance.

[RISCV] Use constant pool for large integers
ClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 396756

llvm/lib/Target/RISCV/RISCVISelDAGToDAG.cpp

llvm/lib/Target/RISCV/RISCVISelLowering.h

llvm/lib/Target/RISCV/RISCVSubtarget.h

llvm/lib/Target/RISCV/RISCVSubtarget.cpp

llvm/test/CodeGen/RISCV/bswap-ctlz-cttz-ctpop.ll

llvm/test/CodeGen/RISCV/div-by-constant.ll

llvm/test/CodeGen/RISCV/div.ll

llvm/test/CodeGen/RISCV/double-imm.ll

llvm/test/CodeGen/RISCV/imm.ll

llvm/test/CodeGen/RISCV/rv64zbb.ll

llvm/test/CodeGen/RISCV/rv64zbp.ll

llvm/test/CodeGen/RISCV/rvv/bitreverse-sdnode.ll

llvm/test/CodeGen/RISCV/rvv/ctlz-sdnode.ll

llvm/test/CodeGen/RISCV/rvv/ctpop-sdnode.ll

llvm/test/CodeGen/RISCV/rvv/cttz-sdnode.ll

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-bitreverse.ll

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-ctlz.ll

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-ctpop.ll

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-cttz.ll

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-int-buildvec.ll

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-int.ll

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-mask-buildvec.ll

llvm/test/CodeGen/RISCV/rvv/interleave-crash.ll

llvm/test/CodeGen/RISCV/rvv/vdiv-sdnode.ll

llvm/test/CodeGen/RISCV/rvv/vrem-sdnode.ll

llvm/test/CodeGen/RISCV/srem-lkk.ll

llvm/test/CodeGen/RISCV/srem-seteq-illegal-types.ll

llvm/test/CodeGen/RISCV/srem-vector-lkk.ll

llvm/test/CodeGen/RISCV/urem-lkk.ll

llvm/test/CodeGen/RISCV/urem-vector-lkk.ll

llvm/test/CodeGen/RISCV/vararg.ll

This is an archive of the discontinued LLVM Phabricator instance.

[RISCV] Use constant pool for large integersClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 396756

llvm/lib/Target/RISCV/RISCVISelDAGToDAG.cpp

llvm/lib/Target/RISCV/RISCVISelLowering.h

llvm/lib/Target/RISCV/RISCVSubtarget.h

llvm/lib/Target/RISCV/RISCVSubtarget.cpp

llvm/test/CodeGen/RISCV/bswap-ctlz-cttz-ctpop.ll

llvm/test/CodeGen/RISCV/div-by-constant.ll

llvm/test/CodeGen/RISCV/div.ll

llvm/test/CodeGen/RISCV/double-imm.ll

llvm/test/CodeGen/RISCV/imm.ll

llvm/test/CodeGen/RISCV/rv64zbb.ll

llvm/test/CodeGen/RISCV/rv64zbp.ll

llvm/test/CodeGen/RISCV/rvv/bitreverse-sdnode.ll

llvm/test/CodeGen/RISCV/rvv/ctlz-sdnode.ll

llvm/test/CodeGen/RISCV/rvv/ctpop-sdnode.ll

llvm/test/CodeGen/RISCV/rvv/cttz-sdnode.ll

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-bitreverse.ll

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-ctlz.ll

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-ctpop.ll

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-cttz.ll

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-int-buildvec.ll

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-int.ll

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-mask-buildvec.ll

llvm/test/CodeGen/RISCV/rvv/interleave-crash.ll

llvm/test/CodeGen/RISCV/rvv/vdiv-sdnode.ll

llvm/test/CodeGen/RISCV/rvv/vrem-sdnode.ll

llvm/test/CodeGen/RISCV/srem-lkk.ll

llvm/test/CodeGen/RISCV/srem-seteq-illegal-types.ll

llvm/test/CodeGen/RISCV/srem-vector-lkk.ll

llvm/test/CodeGen/RISCV/urem-lkk.ll

llvm/test/CodeGen/RISCV/urem-vector-lkk.ll

llvm/test/CodeGen/RISCV/vararg.ll

[RISCV] Use constant pool for large integers
ClosedPublic