This is an archive of the discontinued LLVM Phabricator instance.

Paths

Table of Contentst

-
llvm/
-
lib/Target/RISCV/
-
Target/
-
RISCV/
1/1
RISCVISelDAGToDAG.h
3
RISCVISelDAGToDAG.cpp
4/5
RISCVInstrInfo.td
1
RISCVInstrInfoM.td
-
test/CodeGen/RISCV/
-
CodeGen/
-
RISCV/
-
add-before-shl.ll
-
add-imm.ll
-
addimm-mulimm.ll
-
atomic-cmpxchg.ll
-
atomic-rmw.ll
-
atomic-signext.ll
-
calling-conv-lp64-lp64f-lp64d-common.ll
-
div.ll
-
mul.ll
-
rv64i-demanded-bits.ll
-
rv64i-exhaustive-w-insts.ll
-
rv64i-w-insts-legalization.ll
-
rv64m-exhaustive-w-insts.ll
-
rv64zbb-zbp.ll
-
rv64zbb.ll
-
rvv/
-
fixed-vectors-ctlz.ll
-
sadd_sat_plus.ll
-
shadowcallstack.ll
-
shift-masked-shamt.ll
-
srem-lkk.ll
-
srem-seteq-illegal-types.ll
-
srem-vector-lkk.ll
-
ssub_sat_plus.ll
-
uadd_sat_plus.ll
-
urem-lkk.ll
-
urem-vector-lkk.ll
-
usub_sat_plus.ll
-
vararg.ll
-
xaluo.ll

Differential D107658

[RISCV] Teach isel to select ADDW/SUBW/MULW/SLLIW when only the lower 32-bits are used.
ClosedPublic

Authored by craig.topper on Aug 6 2021, 10:08 AM.

Download Raw Diff

Details

Reviewers

asb
luismarques
frasercrmck
jrtc27
evandro
khchen
arcbbb
HsiangKai

Commits

rGd9ba1a9c5cac: [RISCV] Teach isel to select ADDW/SUBW/MULW/SLLIW when only the lower 32-bits…

Summary

We normally select these when the root node is a sext_inreg, but
SimplifyDemandedBits can sometimes bypass the sext_inreg for some
users. This can create situation where sext_inreg+add/sub/mul/shl
is selected to a W instruction, and then the add/sub/mul/shl is
separately selected to a non-W instruction with the same inputs.

This patch tries to detect when it would still be ok to use a W
instruction without the sext_inreg by checking the direct users.
This can allow the W instruction to CSE with any created for a
sext_inreg+add/sub/mul/shl. To minimize complexity and cost of
checking, we make no attempt to determine if the CSE will happen
and just always use a W instruction when we can.

Diff Detail

Repository: rG LLVM Github Monorepo

Event Timeline

craig.topper created this revision.Aug 6 2021, 10:08 AM

Herald added subscribers: StephenFan, vkmr, apazos and 21 others. · View Herald TranscriptAug 6 2021, 10:08 AM

craig.topper requested review of this revision.Aug 6 2021, 10:08 AM

Herald added a project: Restricted Project. · View Herald TranscriptAug 6 2021, 10:08 AM

Herald added a subscriber: MaskRay. · View Herald Transcript

Harbormaster completed remote builds in B118413: Diff 364839.Aug 6 2021, 10:38 AM

craig.topper mentioned this in D107697: [RISCV] Insert sext_inreg when type legalizing add/sub/mul with constant LHS..Aug 7 2021, 10:37 AM

Fix subw pattern. Add mulw pattern.

Update one test I missed.

craig.topper added a child revision: D107697: [RISCV] Insert sext_inreg when type legalizing add/sub/mul with constant LHS..Aug 7 2021, 5:17 PM

Harbormaster completed remote builds in B118529: Diff 364994.Aug 7 2021, 5:56 PM

craig.topper mentioned this in D107708: [RISCV] Remove sext_inreg+add/sub/mul/shl isel patterns..Aug 8 2021, 12:12 AM

Add SLLI with shift amount >= 32 to the list of W user instructions.

Harbormaster completed remote builds in B118565: Diff 365035.Aug 8 2021, 10:57 AM

craig.topper mentioned this in D107860: [RISCV] Add test cases showing inefficient materialization for stores of immediates. NFC.Aug 10 2021, 12:35 PM

craig.topper mentioned this in rGe25665f52eff: [RISCV] Add test cases showing inefficient materialization for stores of….Aug 12 2021, 10:14 AM

Rebase

Harbormaster completed remote builds in B119466: Diff 366309.Aug 13 2021, 11:01 AM

Make hasAllWUsers more generic so it can be used for HUsers or BUsers as well.

Harbormaster completed remote builds in B119484: Diff 366331.Aug 13 2021, 12:41 PM

craig.topper mentioned this in D108052: [RISCV] Improve constant materialization for stores of i16 or i32 negative constants..Aug 13 2021, 12:43 PM

craig.topper added a child revision: D108052: [RISCV] Improve constant materialization for stores of i16 or i32 negative constants..Aug 13 2021, 12:43 PM

Ping

What's the reasoning behind the current set of opcodes? E.g. are there cases where div[u]w/rem[u]w or sra[i]w/srl[i]w are worth using?

llvm/lib/Target/RISCV/RISCVISelDAGToDAG.h
61	NBit with N being the SDNode is slightly confusing at first glance, though obvious once you stop and think. Unfortunate collision.
llvm/lib/Target/RISCV/RISCVInstrInfo.td
1258	You could have a class for this so you just `def addw : PatFragFoo<add>;` etc and avoid the repetition
1294	Nit: 32-bit but 32 bits
1296	PatGprGpr/PatGprSimm12?

In D107658#2951066, @jrtc27 wrote:

What's the reasoning behind the current set of opcodes? E.g. are there cases where div[u]w/rem[u]w or sra[i]w/srl[i]w are worth using?

These are the only opcodes that are type legalized by any_extend because the result in the lower 32 bits doesn't depend on the upper 32 bits after promotion. The other binary operators use RISCVISD::*W ISD opcodes or require a sign_extend_inreg/zero_extend_inreg because the upper 32 bits can effect the lower 32 bits. These are also the only opcodes used in an isel pattern that starts with sext_inreg.

I'm probably going to explain the rest of this poorly, but I'll try.

div[u]w/remuw are converted to their own special ISD opcode during type legalization. I believe there was a subtle issue with pattern matching ISD::DIV/UDIV/UREM and zext_inreg/sext_inreg to the W instructions. We can only pattern match ISD::SREM+sext_inreg to REMW.

sraiw/srliw are type legalized by inserting a sext_inreg or zext_inreg. We select SRAIW/SRLIW based on the inputs being a sext_inreg/zext_inreg(or the equivalent computeKnownBits/computeNumSignBits) and the immediate fitting in 5 bits. We can't select SRAIW/SRLIW based on how the result is used. We need to know that sign bits or 0 are supposed to be shifted into bit 31.

sraw/srlw are type legalized using their own RISCVISD::SRAW/SRLW nodes. Since we can't see the shift amount, we need these ISD opcodes in order to know that it was UB for the shift amount to be more than 5 bits. Default type legalization would insert a sext_inreg/zext_inreg, but we can't pattern match that if we don't know sure that it came from a type legalized i32 shift and an i64 shift that happened to have a sext_inreg/zext_inreg input. If it came from an i64 shift we might incorrectly ignore bit 5 of the shift amount by turning it into a W instruction.

Address review comments

craig.topper marked 4 inline comments as done.Aug 17 2021, 7:07 PM

Harbormaster completed remote builds in B120031: Diff 367087.Aug 17 2021, 7:40 PM

In D107658#2951152, @craig.topper wrote:

In D107658#2951066, @jrtc27 wrote:

What's the reasoning behind the current set of opcodes? E.g. are there cases where div[u]w/rem[u]w or sra[i]w/srl[i]w are worth using?

These are the only opcodes that are type legalized by any_extend because the result in the lower 32 bits doesn't depend on the upper 32 bits after promotion. The other binary operators use RISCVISD::*W ISD opcodes or require a sign_extend_inreg/zero_extend_inreg because the upper 32 bits can effect the lower 32 bits. These are also the only opcodes used in an isel pattern that starts with sext_inreg.

I'm probably going to explain the rest of this poorly, but I'll try.

div[u]w/remuw are converted to their own special ISD opcode during type legalization. I believe there was a subtle issue with pattern matching ISD::DIV/UDIV/UREM and zext_inreg/sext_inreg to the W instructions. We can only pattern match ISD::SREM+sext_inreg to REMW.

sraiw/srliw are type legalized by inserting a sext_inreg or zext_inreg. We select SRAIW/SRLIW based on the inputs being a sext_inreg/zext_inreg(or the equivalent computeKnownBits/computeNumSignBits) and the immediate fitting in 5 bits. We can't select SRAIW/SRLIW based on how the result is used. We need to know that sign bits or 0 are supposed to be shifted into bit 31.

sraw/srlw are type legalized using their own RISCVISD::SRAW/SRLW nodes. Since we can't see the shift amount, we need these ISD opcodes in order to know that it was UB for the shift amount to be more than 5 bits. Default type legalization would insert a sext_inreg/zext_inreg, but we can't pattern match that if we don't know sure that it came from a type legalized i32 shift and an i64 shift that happened to have a sext_inreg/zext_inreg input. If it came from an i64 shift we might incorrectly ignore bit 5 of the shift amount by turning it into a W instruction.

Thanks, that makes sense.

llvm/lib/Target/RISCV/RISCVInstrInfoM.td
74	You can use your new class here too

luismarques added inline comments.Aug 18 2021, 5:12 AM

llvm/lib/Target/RISCV/RISCVISelDAGToDAG.cpp
1566–1574	Are these Bits inequality comparisons correct?

jrtc27 added inline comments.Aug 18 2021, 5:27 AM

llvm/lib/Target/RISCV/RISCVISelDAGToDAG.cpp
1552	This != 32 is a bit weird, would expect it to be at least < 32. But I think you can instead do something more general (and I think also clearer) like: if (Bits < XLen - cast<ConstantSDNode>(User->getOperand(1))->getZExtValue()) return false; (don't know if we need to care about SLLI with an immediate >= XLen; it's an illegal instruction so presumably shouldn't come out of CodeGen no matter what the input is?)
1566–1574	Hm, indeed, I believe this one is wrong, and the others are correct? (Bits being how many bits you want to truncate the value to). This just happens to work because x > 32 and x < 32 behave identically when you only use x=32.

Address review comments

LGTM.

This revision is now accepted and ready to land.Aug 18 2021, 10:13 AM

This revision was landed with ongoing or failed builds.Aug 18 2021, 10:23 AM

Closed by commit rGd9ba1a9c5cac: [RISCV] Teach isel to select ADDW/SUBW/MULW/SLLIW when only the lower 32-bits… (authored by craig.topper). · Explain Why

This revision was automatically updated to reflect the committed changes.

craig.topper added a commit: rGd9ba1a9c5cac: [RISCV] Teach isel to select ADDW/SUBW/MULW/SLLIW when only the lower 32-bits….

craig.topper mentioned this in rG20e62658735a: [RISCV] Improve constant materialization for stores of i16 or i32 negative….Aug 18 2021, 10:37 AM

Harbormaster completed remote builds in B120145: Diff 367238.Aug 18 2021, 10:41 AM

craig.topper mentioned this in rG6d7ea597efee: [RISCV] Insert sext_inreg when type legalizing add/sub/mul with constant LHS..Aug 18 2021, 10:44 AM

craig.topper mentioned this in rG3f9b37ccb15a: [RISCV] Remove sext_inreg+add/sub/mul/shl isel patterns..Aug 18 2021, 11:12 AM

llvm/lib/Target/RISCV/RISCVInstrInfo.td
1259	I am wondering could it be applied to more complicated condition with 3 operands or 1 operand? For example, mulaw, or unary operator.

craig.topper added inline comments.Sep 21 2021, 11:48 PM

llvm/lib/Target/RISCV/RISCVInstrInfo.td
1259	We would need a different PatFrag for different number of operates, but the underlying helper function hasAllWUsers can be shared.

Revision Contents

Path

Size

llvm/

lib/

Target/

RISCV/

RISCVISelDAGToDAG.h

3 lines

RISCVISelDAGToDAG.cpp

82 lines

RISCVInstrInfo.td

15 lines

RISCVInstrInfoM.td

4 lines

test/

CodeGen/

RISCV/

12 lines

9 lines

8 lines

40 lines

180 lines

36 lines

calling-conv-lp64-lp64f-lp64d-common.ll

10 lines

div.ll

16 lines

mul.ll

48 lines

rv64i-demanded-bits.ll

8 lines

rv64i-exhaustive-w-insts.ll

42 lines

rv64i-w-insts-legalization.ll

22 lines

rv64m-exhaustive-w-insts.ll

18 lines

rv64zbb-zbp.ll

12 lines

rv64zbb.ll

4 lines

rvv/

fixed-vectors-ctlz.ll

336 lines

sadd_sat_plus.ll

8 lines

shadowcallstack.ll

4 lines

shift-masked-shamt.ll

6 lines

srem-lkk.ll

27 lines

srem-seteq-illegal-types.ll

8 lines

140 lines

8 lines

2 lines

12 lines

80 lines

2 lines

8 lines

92 lines

Diff 367245

llvm/lib/Target/RISCV/RISCVISelDAGToDAG.h

Show First 20 Lines • Show All 52 Lines • ▼ Show 20 Lines	public:
}		}
bool selectShiftMask32(SDValue N, SDValue &ShAmt) {		bool selectShiftMask32(SDValue N, SDValue &ShAmt) {
return selectShiftMask(N, 32, ShAmt);		return selectShiftMask(N, 32, ShAmt);
}		}

bool selectSExti32(SDValue N, SDValue &Val);		bool selectSExti32(SDValue N, SDValue &Val);
bool selectZExti32(SDValue N, SDValue &Val);		bool selectZExti32(SDValue N, SDValue &Val);

		bool hasAllNBitUsers(SDNode *Node, unsigned Bits) const;
		jrtc27Unsubmitted Done Reply Inline Actions NBit with N being the SDNode is slightly confusing at first glance, though obvious once you stop and think. Unfortunate collision. jrtc27: NBit with N being the SDNode is slightly confusing at first glance, though obvious once you…
		bool hasAllWUsers(SDNode *Node) const { return hasAllNBitUsers(Node, 32); }

bool selectVLOp(SDValue N, SDValue &VL);		bool selectVLOp(SDValue N, SDValue &VL);

bool selectVSplat(SDValue N, SDValue &SplatVal);		bool selectVSplat(SDValue N, SDValue &SplatVal);
bool selectVSplatSimm5(SDValue N, SDValue &SplatVal);		bool selectVSplatSimm5(SDValue N, SDValue &SplatVal);
bool selectVSplatUimm5(SDValue N, SDValue &SplatVal);		bool selectVSplatUimm5(SDValue N, SDValue &SplatVal);
bool selectVSplatSimm5Plus1(SDValue N, SDValue &SplatVal);		bool selectVSplatSimm5Plus1(SDValue N, SDValue &SplatVal);
bool selectVSplatSimm5Plus1NonZero(SDValue N, SDValue &SplatVal);		bool selectVSplatSimm5Plus1NonZero(SDValue N, SDValue &SplatVal);

▲ Show 20 Lines • Show All 126 Lines • Show Last 20 Lines

llvm/lib/Target/RISCV/RISCVISelDAGToDAG.cpp

Show First 20 Lines • Show All 1,490 Lines • ▼ Show 20 Lines	bool RISCVDAGToDAGISel::selectZExti32(SDValue N, SDValue &Val) {
if (CurDAG->MaskedValueIsZero(N, Mask)) {		if (CurDAG->MaskedValueIsZero(N, Mask)) {
Val = N;		Val = N;
return true;		return true;
}		}

return false;		return false;
}		}

		// Return true if all users of this SDNode* only consume the lower \p Bits.
		// This can be used to form W instructions for add/sub/mul/shl even when the
		// root isn't a sext_inreg. This can allow the ADDW/SUBW/MULW/SLLIW to CSE if
		// SimplifyDemandedBits has made it so some users see a sext_inreg and some
		// don't. The sext_inreg+add/sub/mul/shl will get selected, but still leave
		// the add/sub/mul/shl to become non-W instructions. By checking the users we
		// may be able to use a W instruction and CSE with the other instruction if
		// this has happened. We could try to detect that the CSE opportunity exists
		// before doing this, but that would be more complicated.
		// TODO: Does this need to look through AND/OR/XOR to their users to find more
		// opportunities.
		bool RISCVDAGToDAGISel::hasAllNBitUsers(SDNode *Node, unsigned Bits) const {
		assert((Node->getOpcode() == ISD::ADD \|\| Node->getOpcode() == ISD::SUB \|\|
		Node->getOpcode() == ISD::MUL \|\| Node->getOpcode() == ISD::SHL) &&
		"Unexpected opcode");

		for (auto UI = Node->use_begin(), UE = Node->use_end(); UI != UE; ++UI) {
		SDNode User = UI;
		// Users of this node should have already been instruction selected
		if (!User->isMachineOpcode())
		return false;

		// TODO: Add more opcodes?
		switch (User->getMachineOpcode()) {
		default:
		return false;
		case RISCV::ADDW:
		case RISCV::ADDIW:
		case RISCV::SUBW:
		case RISCV::MULW:
		case RISCV::SLLW:
		case RISCV::SLLIW:
		case RISCV::SRAW:
		case RISCV::SRAIW:
		case RISCV::SRLW:
		case RISCV::SRLIW:
		case RISCV::DIVW:
		case RISCV::DIVUW:
		case RISCV::REMW:
		case RISCV::REMUW:
		case RISCV::ROLW:
		case RISCV::RORW:
		case RISCV::RORIW:
		case RISCV::CLZW:
		case RISCV::CTZW:
		case RISCV::CPOPW:
		case RISCV::SLLIUW:
		if (Bits < 32)
		return false;
		break;
		case RISCV::SLLI:
		// SLLI only uses the lower (XLen - ShAmt) bits.
		if (Bits < Subtarget->getXLen() - User->getConstantOperandVal(1))
		return false;
		jrtc27Unsubmitted Not Done Reply Inline Actions This != 32 is a bit weird, would expect it to be at least < 32. But I think you can instead do something more general (and I think also clearer) like: if (Bits < XLen - cast<ConstantSDNode>(User->getOperand(1))->getZExtValue()) return false; (don't know if we need to care about SLLI with an immediate >= XLen; it's an illegal instruction so presumably shouldn't come out of CodeGen no matter what the input is?) jrtc27: This != 32 is a bit weird, would expect it to be at least < 32. But I think you can instead do…
		break;
		case RISCV::ADDUW:
		case RISCV::SH1ADDUW:
		case RISCV::SH2ADDUW:
		case RISCV::SH3ADDUW:
		// The first operand to add.uw/shXadd.uw is implicitly zero extended from
		// 32 bits.
		if (UI.getOperandNo() != 0 \|\| Bits < 32)
		return false;
		break;
		case RISCV::SB:
		if (UI.getOperandNo() != 0 \|\| Bits < 8)
		return false;
		break;
		case RISCV::SH:
		if (UI.getOperandNo() != 0 \|\| Bits < 16)
		return false;
		break;
		case RISCV::SW:
		if (UI.getOperandNo() != 0 \|\| Bits < 32)
		return false;
		break;
		luismarquesUnsubmitted Not Done Reply Inline Actions Are these Bits inequality comparisons correct? luismarques: Are these Bits inequality comparisons correct?
		jrtc27Unsubmitted Not Done Reply Inline Actions Hm, indeed, I believe this one is wrong, and the others are correct? (Bits being how many bits you want to truncate the value to). This just happens to work because x > 32 and x < 32 behave identically when you only use x=32. jrtc27: Hm, indeed, I believe this one is wrong, and the others are correct? (Bits being how many bits…
		}
		}

		return true;
		}

// Select VL as a 5 bit immediate or a value that will become a register. This		// Select VL as a 5 bit immediate or a value that will become a register. This
// allows us to choose betwen VSETIVLI or VSETVLI later.		// allows us to choose betwen VSETIVLI or VSETVLI later.
bool RISCVDAGToDAGISel::selectVLOp(SDValue N, SDValue &VL) {		bool RISCVDAGToDAGISel::selectVLOp(SDValue N, SDValue &VL) {
auto *C = dyn_cast<ConstantSDNode>(N);		auto *C = dyn_cast<ConstantSDNode>(N);
if (C && isUInt<5>(C->getZExtValue()))		if (C && isUInt<5>(C->getZExtValue()))
VL = CurDAG->getTargetConstant(C->getZExtValue(), SDLoc(N),		VL = CurDAG->getTargetConstant(C->getZExtValue(), SDLoc(N),
N->getValueType(0));		N->getValueType(0));
else		else
▲ Show 20 Lines • Show All 219 Lines • Show Last 20 Lines

llvm/lib/Target/RISCV/RISCVInstrInfo.td

Show First 20 Lines • Show All 1,248 Lines • ▼ Show 20 Lines
def : Pat<(i64 (and GPR:$rs1, 0xffffffff)), (SRLI (SLLI GPR:$rs1, 32), 32)>;		def : Pat<(i64 (and GPR:$rs1, 0xffffffff)), (SRLI (SLLI GPR:$rs1, 32), 32)>;

// If we're shifting a 32-bit zero extended value left by 0-31 bits, use 2		// If we're shifting a 32-bit zero extended value left by 0-31 bits, use 2
// shifts instead of 3. This can occur when unsigned is used to index an array.		// shifts instead of 3. This can occur when unsigned is used to index an array.
def : Pat<(i64 (shl (and GPR:$rs1, 0xffffffff), uimm5:$shamt)),		def : Pat<(i64 (shl (and GPR:$rs1, 0xffffffff), uimm5:$shamt)),
(SRLI (SLLI GPR:$rs1, 32), (ImmSubFrom32 uimm5:$shamt))>;		(SRLI (SLLI GPR:$rs1, 32), (ImmSubFrom32 uimm5:$shamt))>;
}		}

		// PatFrag to allow ADDW/SUBW/MULW/SLLW to be selected from i64 add/sub/mul/shl
		// if only the lower 32 bits of their result is used.
		jrtc27Unsubmitted Done Reply Inline Actions You could have a class for this so you just `def addw : PatFragFoo<add>;` etc and avoid the repetition jrtc27: You could have a class for this so you just `def addw : PatFragFoo<add>;` etc and avoid the…
		class overflowingbinopw<SDPatternOperator operator>
		zixuan-wuUnsubmitted Not Done Reply Inline Actions I am wondering could it be applied to more complicated condition with 3 operands or 1 operand? For example, mulaw, or unary operator. zixuan-wu: I am wondering could it be applied to more complicated condition with 3 operands or 1 operand?
		craig.topperAuthorUnsubmitted Done Reply Inline Actions We would need a different PatFrag for different number of operates, but the underlying helper function hasAllWUsers can be shared. craig.topper: We would need a different PatFrag for different number of operates, but the underlying helper…
		: PatFrag<(ops node:$lhs, node:$rhs),
		(operator node:$lhs, node:$rhs), [{
		return hasAllWUsers(Node);
		}]>;

let Predicates = [IsRV64] in {		let Predicates = [IsRV64] in {

/// sext and zext		/// sext and zext

def : Pat<(sext_inreg GPR:$rs1, i32), (ADDIW GPR:$rs1, 0)>;		def : Pat<(sext_inreg GPR:$rs1, i32), (ADDIW GPR:$rs1, 0)>;

/// ALU operations		/// ALU operations

Show All 13 Lines	def : Pat<(sra (sext_inreg GPR:$rs1, i32), uimm5:$shamt),
(SRAIW GPR:$rs1, uimm5:$shamt)>;		(SRAIW GPR:$rs1, uimm5:$shamt)>;
def : Pat<(i64 (sra (shl GPR:$rs1, (i64 32)), uimm6gt32:$shamt)),		def : Pat<(i64 (sra (shl GPR:$rs1, (i64 32)), uimm6gt32:$shamt)),
(SRAIW GPR:$rs1, (ImmSub32 uimm6gt32:$shamt))>;		(SRAIW GPR:$rs1, (ImmSub32 uimm6gt32:$shamt))>;

def : PatGprGpr<shiftopw<riscv_sllw>, SLLW>;		def : PatGprGpr<shiftopw<riscv_sllw>, SLLW>;
def : PatGprGpr<shiftopw<riscv_srlw>, SRLW>;		def : PatGprGpr<shiftopw<riscv_srlw>, SRLW>;
def : PatGprGpr<shiftopw<riscv_sraw>, SRAW>;		def : PatGprGpr<shiftopw<riscv_sraw>, SRAW>;

		// Select W instructions without sext_inreg if only the lower 32 bits of the
		jrtc27Unsubmitted Done Reply Inline Actions Nit: 32-bit but 32 bits jrtc27: Nit: 32-bit but 32 bits
		// result are used.
		def : PatGprGpr<overflowingbinopw<add>, ADDW>;
		jrtc27Unsubmitted Done Reply Inline Actions PatGprGpr/PatGprSimm12? jrtc27: PatGprGpr/PatGprSimm12?
		def : PatGprSimm12<overflowingbinopw<add>, ADDIW>;
		def : PatGprGpr<overflowingbinopw<sub>, SUBW>;
		def : PatGprImm<overflowingbinopw<shl>, SLLIW, uimm5>;

/// Loads		/// Loads

defm : LdPat<sextloadi32, LW, i64>;		defm : LdPat<sextloadi32, LW, i64>;
defm : LdPat<extloadi32, LW, i64>;		defm : LdPat<extloadi32, LW, i64>;
defm : LdPat<zextloadi32, LWU, i64>;		defm : LdPat<zextloadi32, LWU, i64>;
defm : LdPat<load, LD, i64>;		defm : LdPat<load, LD, i64>;

/// Stores		/// Stores
▲ Show 20 Lines • Show All 49 Lines • Show Last 20 Lines

llvm/lib/Target/RISCV/RISCVInstrInfoM.td

	Show First 20 Lines • Show All 65 Lines • ▼ Show 20 Lines
	def : PatGprGpr<mulhu, MULHU>;			def : PatGprGpr<mulhu, MULHU>;
	def : PatGprGpr<riscv_mulhsu, MULHSU>;			def : PatGprGpr<riscv_mulhsu, MULHSU>;
	def : PatGprGpr<sdiv, DIV>;			def : PatGprGpr<sdiv, DIV>;
	def : PatGprGpr<udiv, DIVU>;			def : PatGprGpr<udiv, DIVU>;
	def : PatGprGpr<srem, REM>;			def : PatGprGpr<srem, REM>;
	def : PatGprGpr<urem, REMU>;			def : PatGprGpr<urem, REMU>;
	} // Predicates = [HasStdExtM]			} // Predicates = [HasStdExtM]

	let Predicates = [HasStdExtM, IsRV64] in {			let Predicates = [HasStdExtM, IsRV64] in {
				jrtc27Unsubmitted Not Done Reply Inline Actions You can use your new class here too jrtc27: You can use your new class here too
	def : Pat<(sext_inreg (mul GPR:$rs1, GPR:$rs2), i32),			def : Pat<(sext_inreg (mul GPR:$rs1, GPR:$rs2), i32),
	(MULW GPR:$rs1, GPR:$rs2)>;			(MULW GPR:$rs1, GPR:$rs2)>;

				// Select W instructions without sext_inreg if only the lower 32-bits of the
				// result are used.
				def : PatGprGpr<overflowingbinopw<mul>, MULW>;

	def : PatGprGpr<riscv_divw, DIVW>;			def : PatGprGpr<riscv_divw, DIVW>;
	def : PatGprGpr<riscv_divuw, DIVUW>;			def : PatGprGpr<riscv_divuw, DIVUW>;
	def : PatGprGpr<riscv_remuw, REMUW>;			def : PatGprGpr<riscv_remuw, REMUW>;

	// Handle the specific cases where using DIVU/REMU would be correct and result			// Handle the specific cases where using DIVU/REMU would be correct and result
	// in fewer instructions than emitting DIVUW/REMUW then zero-extending the			// in fewer instructions than emitting DIVUW/REMUW then zero-extending the
	// result.			// result.
	def : Pat<(and (riscv_divuw (assertzexti32 GPR:$rs1),			def : Pat<(and (riscv_divuw (assertzexti32 GPR:$rs1),
	Show All 30 Lines

llvm/test/CodeGen/RISCV/add-before-shl.ll

	Show All 15 Lines
	; RV32I: # %bb.0:			; RV32I: # %bb.0:
	; RV32I-NEXT: addi a0, a0, 1			; RV32I-NEXT: addi a0, a0, 1
	; RV32I-NEXT: slli a0, a0, 24			; RV32I-NEXT: slli a0, a0, 24
	; RV32I-NEXT: srai a0, a0, 24			; RV32I-NEXT: srai a0, a0, 24
	; RV32I-NEXT: jalr zero, 0(ra)			; RV32I-NEXT: jalr zero, 0(ra)
	;			;
	; RV64I-LABEL: add_small_const:			; RV64I-LABEL: add_small_const:
	; RV64I: # %bb.0:			; RV64I: # %bb.0:
	; RV64I-NEXT: addi a0, a0, 1			; RV64I-NEXT: addiw a0, a0, 1
	; RV64I-NEXT: slli a0, a0, 56			; RV64I-NEXT: slli a0, a0, 56
	; RV64I-NEXT: srai a0, a0, 56			; RV64I-NEXT: srai a0, a0, 56
	; RV64I-NEXT: jalr zero, 0(ra)			; RV64I-NEXT: jalr zero, 0(ra)
	;			;
	; RV32C-LABEL: add_small_const:			; RV32C-LABEL: add_small_const:
	; RV32C: # %bb.0:			; RV32C: # %bb.0:
	; RV32C-NEXT: c.addi a0, 1			; RV32C-NEXT: c.addi a0, 1
	; RV32C-NEXT: c.slli a0, 24			; RV32C-NEXT: c.slli a0, 24
	; RV32C-NEXT: c.srai a0, 24			; RV32C-NEXT: c.srai a0, 24
	; RV32C-NEXT: c.jr ra			; RV32C-NEXT: c.jr ra
	;			;
	; RV64C-LABEL: add_small_const:			; RV64C-LABEL: add_small_const:
	; RV64C: # %bb.0:			; RV64C: # %bb.0:
	; RV64C-NEXT: c.addi a0, 1			; RV64C-NEXT: c.addiw a0, 1
	; RV64C-NEXT: c.slli a0, 56			; RV64C-NEXT: c.slli a0, 56
	; RV64C-NEXT: c.srai a0, 56			; RV64C-NEXT: c.srai a0, 56
	; RV64C-NEXT: c.jr ra			; RV64C-NEXT: c.jr ra
	%1 = add i32 %a, 1			%1 = add i32 %a, 1
	%2 = shl i32 %1, 24			%2 = shl i32 %1, 24
	%3 = ashr i32 %2, 24			%3 = ashr i32 %2, 24
	ret i32 %3			ret i32 %3
	}			}
	Show All 23 Lines
	; RV32C-NEXT: c.add a0, a1			; RV32C-NEXT: c.add a0, a1
	; RV32C-NEXT: c.srai a0, 16			; RV32C-NEXT: c.srai a0, 16
	; RV32C-NEXT: c.jr ra			; RV32C-NEXT: c.jr ra
	;			;
	; RV64C-LABEL: add_large_const:			; RV64C-LABEL: add_large_const:
	; RV64C: # %bb.0:			; RV64C: # %bb.0:
	; RV64C-NEXT: c.lui a1, 1			; RV64C-NEXT: c.lui a1, 1
	; RV64C-NEXT: c.addiw a1, -1			; RV64C-NEXT: c.addiw a1, -1
	; RV64C-NEXT: c.add a0, a1			; RV64C-NEXT: c.addw a0, a1
	; RV64C-NEXT: c.slli a0, 48			; RV64C-NEXT: c.slli a0, 48
	; RV64C-NEXT: c.srai a0, 48			; RV64C-NEXT: c.srai a0, 48
	; RV64C-NEXT: c.jr ra			; RV64C-NEXT: c.jr ra
	%1 = add i32 %a, 4095			%1 = add i32 %a, 4095
	%2 = shl i32 %1, 16			%2 = shl i32 %1, 16
	%3 = ashr i32 %2, 16			%3 = ashr i32 %2, 16
	ret i32 %3			ret i32 %3
	}			}
	Show All 23 Lines
	; RV32C-NEXT: c.add a0, a1			; RV32C-NEXT: c.add a0, a1
	; RV32C-NEXT: c.srai a0, 16			; RV32C-NEXT: c.srai a0, 16
	; RV32C-NEXT: c.jr ra			; RV32C-NEXT: c.jr ra
	;			;
	; RV64C-LABEL: add_huge_const:			; RV64C-LABEL: add_huge_const:
	; RV64C: # %bb.0:			; RV64C: # %bb.0:
	; RV64C-NEXT: c.lui a1, 8			; RV64C-NEXT: c.lui a1, 8
	; RV64C-NEXT: c.addiw a1, -1			; RV64C-NEXT: c.addiw a1, -1
	; RV64C-NEXT: c.add a0, a1			; RV64C-NEXT: c.addw a0, a1
	; RV64C-NEXT: c.slli a0, 48			; RV64C-NEXT: c.slli a0, 48
	; RV64C-NEXT: c.srai a0, 48			; RV64C-NEXT: c.srai a0, 48
	; RV64C-NEXT: c.jr ra			; RV64C-NEXT: c.jr ra
	%1 = add i32 %a, 32767			%1 = add i32 %a, 32767
	%2 = shl i32 %1, 16			%2 = shl i32 %1, 16
	%3 = ashr i32 %2, 16			%3 = ashr i32 %2, 16
	ret i32 %3			ret i32 %3
	}			}

	define signext i24 @add_non_machine_type(i24 signext %a) nounwind {			define signext i24 @add_non_machine_type(i24 signext %a) nounwind {
	; RV32I-LABEL: add_non_machine_type:			; RV32I-LABEL: add_non_machine_type:
	; RV32I: # %bb.0:			; RV32I: # %bb.0:
	; RV32I-NEXT: addi a0, a0, 256			; RV32I-NEXT: addi a0, a0, 256
	; RV32I-NEXT: slli a0, a0, 20			; RV32I-NEXT: slli a0, a0, 20
	; RV32I-NEXT: srai a0, a0, 8			; RV32I-NEXT: srai a0, a0, 8
	; RV32I-NEXT: jalr zero, 0(ra)			; RV32I-NEXT: jalr zero, 0(ra)
	;			;
	; RV64I-LABEL: add_non_machine_type:			; RV64I-LABEL: add_non_machine_type:
	; RV64I: # %bb.0:			; RV64I: # %bb.0:
	; RV64I-NEXT: addi a0, a0, 256			; RV64I-NEXT: addiw a0, a0, 256
	; RV64I-NEXT: slli a0, a0, 52			; RV64I-NEXT: slli a0, a0, 52
	; RV64I-NEXT: srai a0, a0, 40			; RV64I-NEXT: srai a0, a0, 40
	; RV64I-NEXT: jalr zero, 0(ra)			; RV64I-NEXT: jalr zero, 0(ra)
	;			;
	; RV32C-LABEL: add_non_machine_type:			; RV32C-LABEL: add_non_machine_type:
	; RV32C: # %bb.0:			; RV32C: # %bb.0:
	; RV32C-NEXT: addi a0, a0, 256			; RV32C-NEXT: addi a0, a0, 256
	; RV32C-NEXT: c.slli a0, 20			; RV32C-NEXT: c.slli a0, 20
	; RV32C-NEXT: c.srai a0, 8			; RV32C-NEXT: c.srai a0, 8
	; RV32C-NEXT: c.jr ra			; RV32C-NEXT: c.jr ra
	;			;
	; RV64C-LABEL: add_non_machine_type:			; RV64C-LABEL: add_non_machine_type:
	; RV64C: # %bb.0:			; RV64C: # %bb.0:
	; RV64C-NEXT: addi a0, a0, 256			; RV64C-NEXT: addiw a0, a0, 256
	; RV64C-NEXT: c.slli a0, 52			; RV64C-NEXT: c.slli a0, 52
	; RV64C-NEXT: c.srai a0, 40			; RV64C-NEXT: c.srai a0, 40
	; RV64C-NEXT: c.jr ra			; RV64C-NEXT: c.jr ra
	%1 = add i24 %a, 256			%1 = add i24 %a, 256
	%2 = shl i24 %1, 12			%2 = shl i24 %1, 12
	ret i24 %2			ret i24 %2
	}			}

	▲ Show 20 Lines • Show All 74 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/add-imm.ll

	Show First 20 Lines • Show All 174 Lines • ▼ Show 20 Lines
	; RV32I-NEXT: lui a1, %hi(gv0)			; RV32I-NEXT: lui a1, %hi(gv0)
	; RV32I-NEXT: sw a0, %lo(gv0)(a1)			; RV32I-NEXT: sw a0, %lo(gv0)(a1)
	; RV32I-NEXT: ret			; RV32I-NEXT: ret
	;			;
	; RV64I-LABEL: add32_sext_reject_on_rv64:			; RV64I-LABEL: add32_sext_reject_on_rv64:
	; RV64I: # %bb.0:			; RV64I: # %bb.0:
	; RV64I-NEXT: lui a1, 1			; RV64I-NEXT: lui a1, 1
	; RV64I-NEXT: addiw a1, a1, -1096			; RV64I-NEXT: addiw a1, a1, -1096
	; RV64I-NEXT: add a2, a0, a1
	; RV64I-NEXT: lui a3, %hi(gv0)
	; RV64I-NEXT: addw a0, a0, a1			; RV64I-NEXT: addw a0, a0, a1
	; RV64I-NEXT: sw a2, %lo(gv0)(a3)			; RV64I-NEXT: lui a1, %hi(gv0)
				; RV64I-NEXT: sw a0, %lo(gv0)(a1)
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	%b = add nsw i32 %a, 3000			%b = add nsw i32 %a, 3000
	store i32 %b, i32* @gv0, align 4			store i32 %b, i32* @gv0, align 4
	ret i32 %b			ret i32 %b
	}			}

	define i64 @add64_accept(i64 %a) nounwind {			define i64 @add64_accept(i64 %a) nounwind {
	; RV32I-LABEL: add64_accept:			; RV32I-LABEL: add64_accept:
	Show All 34 Lines
	; RV64I-LABEL: add32_reject:			; RV64I-LABEL: add32_reject:
	; RV64I: # %bb.0:			; RV64I: # %bb.0:
	; RV64I-NEXT: lui a0, %hi(ga)			; RV64I-NEXT: lui a0, %hi(ga)
	; RV64I-NEXT: lw a1, %lo(ga)(a0)			; RV64I-NEXT: lw a1, %lo(ga)(a0)
	; RV64I-NEXT: lui a2, %hi(gb)			; RV64I-NEXT: lui a2, %hi(gb)
	; RV64I-NEXT: lw a3, %lo(gb)(a2)			; RV64I-NEXT: lw a3, %lo(gb)(a2)
	; RV64I-NEXT: lui a4, 1			; RV64I-NEXT: lui a4, 1
	; RV64I-NEXT: addiw a4, a4, -1096			; RV64I-NEXT: addiw a4, a4, -1096
	; RV64I-NEXT: add a1, a1, a4			; RV64I-NEXT: addw a1, a1, a4
	; RV64I-NEXT: add a3, a3, a4			; RV64I-NEXT: addw a3, a3, a4
	; RV64I-NEXT: sw a1, %lo(ga)(a0)			; RV64I-NEXT: sw a1, %lo(ga)(a0)
	; RV64I-NEXT: sw a3, %lo(gb)(a2)			; RV64I-NEXT: sw a3, %lo(gb)(a2)
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	%1 = load i32, i32* @ga, align 4			%1 = load i32, i32* @ga, align 4
	%2 = load i32, i32* @gb, align 4			%2 = load i32, i32* @gb, align 4
	%3 = add i32 %1, 3000			%3 = add i32 %1, 3000
	%4 = add i32 %2, 3000			%4 = add i32 %2, 3000
	store i32 %3, i32* @ga, align 4			store i32 %3, i32* @ga, align 4
	store i32 %4, i32* @gb, align 4			store i32 %4, i32* @gb, align 4
	ret void			ret void
	}			}

llvm/test/CodeGen/RISCV/addimm-mulimm.ll

	Show All 12 Lines
	; RV32IM-NEXT: addi a1, zero, 11			; RV32IM-NEXT: addi a1, zero, 11
	; RV32IM-NEXT: mul a0, a0, a1			; RV32IM-NEXT: mul a0, a0, a1
	; RV32IM-NEXT: addi a0, a0, 407			; RV32IM-NEXT: addi a0, a0, 407
	; RV32IM-NEXT: ret			; RV32IM-NEXT: ret
	;			;
	; RV64IM-LABEL: add_mul_trans_accept_1:			; RV64IM-LABEL: add_mul_trans_accept_1:
	; RV64IM: # %bb.0:			; RV64IM: # %bb.0:
	; RV64IM-NEXT: addi a1, zero, 11			; RV64IM-NEXT: addi a1, zero, 11
	; RV64IM-NEXT: mul a0, a0, a1			; RV64IM-NEXT: mulw a0, a0, a1
	; RV64IM-NEXT: addiw a0, a0, 407			; RV64IM-NEXT: addiw a0, a0, 407
	; RV64IM-NEXT: ret			; RV64IM-NEXT: ret
	%tmp0 = add i32 %x, 37			%tmp0 = add i32 %x, 37
	%tmp1 = mul i32 %tmp0, 11			%tmp1 = mul i32 %tmp0, 11
	ret i32 %tmp1			ret i32 %tmp1
	}			}

	define signext i32 @add_mul_trans_accept_2(i32 %x) {			define signext i32 @add_mul_trans_accept_2(i32 %x) {
	; RV32IM-LABEL: add_mul_trans_accept_2:			; RV32IM-LABEL: add_mul_trans_accept_2:
	; RV32IM: # %bb.0:			; RV32IM: # %bb.0:
	; RV32IM-NEXT: addi a1, zero, 13			; RV32IM-NEXT: addi a1, zero, 13
	; RV32IM-NEXT: mul a0, a0, a1			; RV32IM-NEXT: mul a0, a0, a1
	; RV32IM-NEXT: lui a1, 28			; RV32IM-NEXT: lui a1, 28
	; RV32IM-NEXT: addi a1, a1, 1701			; RV32IM-NEXT: addi a1, a1, 1701
	; RV32IM-NEXT: add a0, a0, a1			; RV32IM-NEXT: add a0, a0, a1
	; RV32IM-NEXT: ret			; RV32IM-NEXT: ret
	;			;
	; RV64IM-LABEL: add_mul_trans_accept_2:			; RV64IM-LABEL: add_mul_trans_accept_2:
	; RV64IM: # %bb.0:			; RV64IM: # %bb.0:
	; RV64IM-NEXT: addi a1, zero, 13			; RV64IM-NEXT: addi a1, zero, 13
	; RV64IM-NEXT: mul a0, a0, a1			; RV64IM-NEXT: mulw a0, a0, a1
	; RV64IM-NEXT: lui a1, 28			; RV64IM-NEXT: lui a1, 28
	; RV64IM-NEXT: addiw a1, a1, 1701			; RV64IM-NEXT: addiw a1, a1, 1701
	; RV64IM-NEXT: addw a0, a0, a1			; RV64IM-NEXT: addw a0, a0, a1
	; RV64IM-NEXT: ret			; RV64IM-NEXT: ret
	%tmp0 = add i32 %x, 8953			%tmp0 = add i32 %x, 8953
	%tmp1 = mul i32 %tmp0, 13			%tmp1 = mul i32 %tmp0, 13
	ret i32 %tmp1			ret i32 %tmp1
	}			}

	define signext i32 @add_mul_trans_reject_1(i32 %x) {			define signext i32 @add_mul_trans_reject_1(i32 %x) {
	; RV32IM-LABEL: add_mul_trans_reject_1:			; RV32IM-LABEL: add_mul_trans_reject_1:
	; RV32IM: # %bb.0:			; RV32IM: # %bb.0:
	; RV32IM-NEXT: addi a1, zero, 19			; RV32IM-NEXT: addi a1, zero, 19
	; RV32IM-NEXT: mul a0, a0, a1			; RV32IM-NEXT: mul a0, a0, a1
	; RV32IM-NEXT: lui a1, 9			; RV32IM-NEXT: lui a1, 9
	; RV32IM-NEXT: addi a1, a1, 585			; RV32IM-NEXT: addi a1, a1, 585
	; RV32IM-NEXT: add a0, a0, a1			; RV32IM-NEXT: add a0, a0, a1
	; RV32IM-NEXT: ret			; RV32IM-NEXT: ret
	;			;
	; RV64IM-LABEL: add_mul_trans_reject_1:			; RV64IM-LABEL: add_mul_trans_reject_1:
	; RV64IM: # %bb.0:			; RV64IM: # %bb.0:
	; RV64IM-NEXT: addi a1, zero, 19			; RV64IM-NEXT: addi a1, zero, 19
	; RV64IM-NEXT: mul a0, a0, a1			; RV64IM-NEXT: mulw a0, a0, a1
	; RV64IM-NEXT: lui a1, 9			; RV64IM-NEXT: lui a1, 9
	; RV64IM-NEXT: addiw a1, a1, 585			; RV64IM-NEXT: addiw a1, a1, 585
	; RV64IM-NEXT: addw a0, a0, a1			; RV64IM-NEXT: addw a0, a0, a1
	; RV64IM-NEXT: ret			; RV64IM-NEXT: ret
	%tmp0 = add i32 %x, 1971			%tmp0 = add i32 %x, 1971
	%tmp1 = mul i32 %tmp0, 19			%tmp1 = mul i32 %tmp0, 19
	ret i32 %tmp1			ret i32 %tmp1
	}			}

	define signext i32 @add_mul_trans_reject_2(i32 %x) {			define signext i32 @add_mul_trans_reject_2(i32 %x) {
	; RV32IM-LABEL: add_mul_trans_reject_2:			; RV32IM-LABEL: add_mul_trans_reject_2:
	; RV32IM: # %bb.0:			; RV32IM: # %bb.0:
	; RV32IM-NEXT: lui a1, 792			; RV32IM-NEXT: lui a1, 792
	; RV32IM-NEXT: addi a1, a1, -1709			; RV32IM-NEXT: addi a1, a1, -1709
	; RV32IM-NEXT: mul a0, a0, a1			; RV32IM-NEXT: mul a0, a0, a1
	; RV32IM-NEXT: lui a1, 1014660			; RV32IM-NEXT: lui a1, 1014660
	; RV32IM-NEXT: addi a1, a1, -1891			; RV32IM-NEXT: addi a1, a1, -1891
	; RV32IM-NEXT: add a0, a0, a1			; RV32IM-NEXT: add a0, a0, a1
	; RV32IM-NEXT: ret			; RV32IM-NEXT: ret
	;			;
	; RV64IM-LABEL: add_mul_trans_reject_2:			; RV64IM-LABEL: add_mul_trans_reject_2:
	; RV64IM: # %bb.0:			; RV64IM: # %bb.0:
	; RV64IM-NEXT: lui a1, 792			; RV64IM-NEXT: lui a1, 792
	; RV64IM-NEXT: addiw a1, a1, -1709			; RV64IM-NEXT: addiw a1, a1, -1709
	; RV64IM-NEXT: mul a0, a0, a1			; RV64IM-NEXT: mulw a0, a0, a1
	; RV64IM-NEXT: lui a1, 1014660			; RV64IM-NEXT: lui a1, 1014660
	; RV64IM-NEXT: addiw a1, a1, -1891			; RV64IM-NEXT: addiw a1, a1, -1891
	; RV64IM-NEXT: addw a0, a0, a1			; RV64IM-NEXT: addw a0, a0, a1
	; RV64IM-NEXT: ret			; RV64IM-NEXT: ret
	%tmp0 = add i32 %x, 1841231			%tmp0 = add i32 %x, 1841231
	%tmp1 = mul i32 %tmp0, 3242323			%tmp1 = mul i32 %tmp0, 3242323
	ret i32 %tmp1			ret i32 %tmp1
	}			}

llvm/test/CodeGen/RISCV/atomic-cmpxchg.ll

	Show First 20 Lines • Show All 55 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: call __atomic_compare_exchange_1@plt			; RV64I-NEXT: call __atomic_compare_exchange_1@plt
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: cmpxchg_i8_monotonic_monotonic:			; RV64IA-LABEL: cmpxchg_i8_monotonic_monotonic:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a3, a0, -4			; RV64IA-NEXT: andi a3, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: addi a4, zero, 255			; RV64IA-NEXT: addi a4, zero, 255
	; RV64IA-NEXT: sllw a4, a4, a0			; RV64IA-NEXT: sllw a4, a4, a0
	; RV64IA-NEXT: andi a1, a1, 255			; RV64IA-NEXT: andi a1, a1, 255
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: andi a2, a2, 255			; RV64IA-NEXT: andi a2, a2, 255
	; RV64IA-NEXT: sllw a0, a2, a0			; RV64IA-NEXT: sllw a0, a2, a0
	; RV64IA-NEXT: .LBB0_1: # =>This Inner Loop Header: Depth=1			; RV64IA-NEXT: .LBB0_1: # =>This Inner Loop Header: Depth=1
	; RV64IA-NEXT: lr.w a2, (a3)			; RV64IA-NEXT: lr.w a2, (a3)
	▲ Show 20 Lines • Show All 59 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: call __atomic_compare_exchange_1@plt			; RV64I-NEXT: call __atomic_compare_exchange_1@plt
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: cmpxchg_i8_acquire_monotonic:			; RV64IA-LABEL: cmpxchg_i8_acquire_monotonic:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a3, a0, -4			; RV64IA-NEXT: andi a3, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: addi a4, zero, 255			; RV64IA-NEXT: addi a4, zero, 255
	; RV64IA-NEXT: sllw a4, a4, a0			; RV64IA-NEXT: sllw a4, a4, a0
	; RV64IA-NEXT: andi a1, a1, 255			; RV64IA-NEXT: andi a1, a1, 255
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: andi a2, a2, 255			; RV64IA-NEXT: andi a2, a2, 255
	; RV64IA-NEXT: sllw a0, a2, a0			; RV64IA-NEXT: sllw a0, a2, a0
	; RV64IA-NEXT: .LBB1_1: # =>This Inner Loop Header: Depth=1			; RV64IA-NEXT: .LBB1_1: # =>This Inner Loop Header: Depth=1
	; RV64IA-NEXT: lr.w.aq a2, (a3)			; RV64IA-NEXT: lr.w.aq a2, (a3)
	▲ Show 20 Lines • Show All 59 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: call __atomic_compare_exchange_1@plt			; RV64I-NEXT: call __atomic_compare_exchange_1@plt
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: cmpxchg_i8_acquire_acquire:			; RV64IA-LABEL: cmpxchg_i8_acquire_acquire:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a3, a0, -4			; RV64IA-NEXT: andi a3, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: addi a4, zero, 255			; RV64IA-NEXT: addi a4, zero, 255
	; RV64IA-NEXT: sllw a4, a4, a0			; RV64IA-NEXT: sllw a4, a4, a0
	; RV64IA-NEXT: andi a1, a1, 255			; RV64IA-NEXT: andi a1, a1, 255
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: andi a2, a2, 255			; RV64IA-NEXT: andi a2, a2, 255
	; RV64IA-NEXT: sllw a0, a2, a0			; RV64IA-NEXT: sllw a0, a2, a0
	; RV64IA-NEXT: .LBB2_1: # =>This Inner Loop Header: Depth=1			; RV64IA-NEXT: .LBB2_1: # =>This Inner Loop Header: Depth=1
	; RV64IA-NEXT: lr.w.aq a2, (a3)			; RV64IA-NEXT: lr.w.aq a2, (a3)
	▲ Show 20 Lines • Show All 59 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: call __atomic_compare_exchange_1@plt			; RV64I-NEXT: call __atomic_compare_exchange_1@plt
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: cmpxchg_i8_release_monotonic:			; RV64IA-LABEL: cmpxchg_i8_release_monotonic:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a3, a0, -4			; RV64IA-NEXT: andi a3, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: addi a4, zero, 255			; RV64IA-NEXT: addi a4, zero, 255
	; RV64IA-NEXT: sllw a4, a4, a0			; RV64IA-NEXT: sllw a4, a4, a0
	; RV64IA-NEXT: andi a1, a1, 255			; RV64IA-NEXT: andi a1, a1, 255
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: andi a2, a2, 255			; RV64IA-NEXT: andi a2, a2, 255
	; RV64IA-NEXT: sllw a0, a2, a0			; RV64IA-NEXT: sllw a0, a2, a0
	; RV64IA-NEXT: .LBB3_1: # =>This Inner Loop Header: Depth=1			; RV64IA-NEXT: .LBB3_1: # =>This Inner Loop Header: Depth=1
	; RV64IA-NEXT: lr.w a2, (a3)			; RV64IA-NEXT: lr.w a2, (a3)
	▲ Show 20 Lines • Show All 59 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: call __atomic_compare_exchange_1@plt			; RV64I-NEXT: call __atomic_compare_exchange_1@plt
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: cmpxchg_i8_release_acquire:			; RV64IA-LABEL: cmpxchg_i8_release_acquire:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a3, a0, -4			; RV64IA-NEXT: andi a3, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: addi a4, zero, 255			; RV64IA-NEXT: addi a4, zero, 255
	; RV64IA-NEXT: sllw a4, a4, a0			; RV64IA-NEXT: sllw a4, a4, a0
	; RV64IA-NEXT: andi a1, a1, 255			; RV64IA-NEXT: andi a1, a1, 255
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: andi a2, a2, 255			; RV64IA-NEXT: andi a2, a2, 255
	; RV64IA-NEXT: sllw a0, a2, a0			; RV64IA-NEXT: sllw a0, a2, a0
	; RV64IA-NEXT: .LBB4_1: # =>This Inner Loop Header: Depth=1			; RV64IA-NEXT: .LBB4_1: # =>This Inner Loop Header: Depth=1
	; RV64IA-NEXT: lr.w.aq a2, (a3)			; RV64IA-NEXT: lr.w.aq a2, (a3)
	▲ Show 20 Lines • Show All 59 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: call __atomic_compare_exchange_1@plt			; RV64I-NEXT: call __atomic_compare_exchange_1@plt
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: cmpxchg_i8_acq_rel_monotonic:			; RV64IA-LABEL: cmpxchg_i8_acq_rel_monotonic:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a3, a0, -4			; RV64IA-NEXT: andi a3, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: addi a4, zero, 255			; RV64IA-NEXT: addi a4, zero, 255
	; RV64IA-NEXT: sllw a4, a4, a0			; RV64IA-NEXT: sllw a4, a4, a0
	; RV64IA-NEXT: andi a1, a1, 255			; RV64IA-NEXT: andi a1, a1, 255
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: andi a2, a2, 255			; RV64IA-NEXT: andi a2, a2, 255
	; RV64IA-NEXT: sllw a0, a2, a0			; RV64IA-NEXT: sllw a0, a2, a0
	; RV64IA-NEXT: .LBB5_1: # =>This Inner Loop Header: Depth=1			; RV64IA-NEXT: .LBB5_1: # =>This Inner Loop Header: Depth=1
	; RV64IA-NEXT: lr.w.aq a2, (a3)			; RV64IA-NEXT: lr.w.aq a2, (a3)
	▲ Show 20 Lines • Show All 59 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: call __atomic_compare_exchange_1@plt			; RV64I-NEXT: call __atomic_compare_exchange_1@plt
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: cmpxchg_i8_acq_rel_acquire:			; RV64IA-LABEL: cmpxchg_i8_acq_rel_acquire:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a3, a0, -4			; RV64IA-NEXT: andi a3, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: addi a4, zero, 255			; RV64IA-NEXT: addi a4, zero, 255
	; RV64IA-NEXT: sllw a4, a4, a0			; RV64IA-NEXT: sllw a4, a4, a0
	; RV64IA-NEXT: andi a1, a1, 255			; RV64IA-NEXT: andi a1, a1, 255
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: andi a2, a2, 255			; RV64IA-NEXT: andi a2, a2, 255
	; RV64IA-NEXT: sllw a0, a2, a0			; RV64IA-NEXT: sllw a0, a2, a0
	; RV64IA-NEXT: .LBB6_1: # =>This Inner Loop Header: Depth=1			; RV64IA-NEXT: .LBB6_1: # =>This Inner Loop Header: Depth=1
	; RV64IA-NEXT: lr.w.aq a2, (a3)			; RV64IA-NEXT: lr.w.aq a2, (a3)
	▲ Show 20 Lines • Show All 59 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: call __atomic_compare_exchange_1@plt			; RV64I-NEXT: call __atomic_compare_exchange_1@plt
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: cmpxchg_i8_seq_cst_monotonic:			; RV64IA-LABEL: cmpxchg_i8_seq_cst_monotonic:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a3, a0, -4			; RV64IA-NEXT: andi a3, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: addi a4, zero, 255			; RV64IA-NEXT: addi a4, zero, 255
	; RV64IA-NEXT: sllw a4, a4, a0			; RV64IA-NEXT: sllw a4, a4, a0
	; RV64IA-NEXT: andi a1, a1, 255			; RV64IA-NEXT: andi a1, a1, 255
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: andi a2, a2, 255			; RV64IA-NEXT: andi a2, a2, 255
	; RV64IA-NEXT: sllw a0, a2, a0			; RV64IA-NEXT: sllw a0, a2, a0
	; RV64IA-NEXT: .LBB7_1: # =>This Inner Loop Header: Depth=1			; RV64IA-NEXT: .LBB7_1: # =>This Inner Loop Header: Depth=1
	; RV64IA-NEXT: lr.w.aqrl a2, (a3)			; RV64IA-NEXT: lr.w.aqrl a2, (a3)
	▲ Show 20 Lines • Show All 59 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: call __atomic_compare_exchange_1@plt			; RV64I-NEXT: call __atomic_compare_exchange_1@plt
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: cmpxchg_i8_seq_cst_acquire:			; RV64IA-LABEL: cmpxchg_i8_seq_cst_acquire:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a3, a0, -4			; RV64IA-NEXT: andi a3, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: addi a4, zero, 255			; RV64IA-NEXT: addi a4, zero, 255
	; RV64IA-NEXT: sllw a4, a4, a0			; RV64IA-NEXT: sllw a4, a4, a0
	; RV64IA-NEXT: andi a1, a1, 255			; RV64IA-NEXT: andi a1, a1, 255
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: andi a2, a2, 255			; RV64IA-NEXT: andi a2, a2, 255
	; RV64IA-NEXT: sllw a0, a2, a0			; RV64IA-NEXT: sllw a0, a2, a0
	; RV64IA-NEXT: .LBB8_1: # =>This Inner Loop Header: Depth=1			; RV64IA-NEXT: .LBB8_1: # =>This Inner Loop Header: Depth=1
	; RV64IA-NEXT: lr.w.aqrl a2, (a3)			; RV64IA-NEXT: lr.w.aqrl a2, (a3)
	▲ Show 20 Lines • Show All 59 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: call __atomic_compare_exchange_1@plt			; RV64I-NEXT: call __atomic_compare_exchange_1@plt
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: cmpxchg_i8_seq_cst_seq_cst:			; RV64IA-LABEL: cmpxchg_i8_seq_cst_seq_cst:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a3, a0, -4			; RV64IA-NEXT: andi a3, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: addi a4, zero, 255			; RV64IA-NEXT: addi a4, zero, 255
	; RV64IA-NEXT: sllw a4, a4, a0			; RV64IA-NEXT: sllw a4, a4, a0
	; RV64IA-NEXT: andi a1, a1, 255			; RV64IA-NEXT: andi a1, a1, 255
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: andi a2, a2, 255			; RV64IA-NEXT: andi a2, a2, 255
	; RV64IA-NEXT: sllw a0, a2, a0			; RV64IA-NEXT: sllw a0, a2, a0
	; RV64IA-NEXT: .LBB9_1: # =>This Inner Loop Header: Depth=1			; RV64IA-NEXT: .LBB9_1: # =>This Inner Loop Header: Depth=1
	; RV64IA-NEXT: lr.w.aqrl a2, (a3)			; RV64IA-NEXT: lr.w.aqrl a2, (a3)
	▲ Show 20 Lines • Show All 60 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: call __atomic_compare_exchange_2@plt			; RV64I-NEXT: call __atomic_compare_exchange_2@plt
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: cmpxchg_i16_monotonic_monotonic:			; RV64IA-LABEL: cmpxchg_i16_monotonic_monotonic:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a3, a0, -4			; RV64IA-NEXT: andi a3, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: lui a4, 16			; RV64IA-NEXT: lui a4, 16
	; RV64IA-NEXT: addiw a4, a4, -1			; RV64IA-NEXT: addiw a4, a4, -1
	; RV64IA-NEXT: sllw a5, a4, a0			; RV64IA-NEXT: sllw a5, a4, a0
	; RV64IA-NEXT: and a1, a1, a4			; RV64IA-NEXT: and a1, a1, a4
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: and a2, a2, a4			; RV64IA-NEXT: and a2, a2, a4
	; RV64IA-NEXT: sllw a0, a2, a0			; RV64IA-NEXT: sllw a0, a2, a0
	; RV64IA-NEXT: .LBB10_1: # =>This Inner Loop Header: Depth=1			; RV64IA-NEXT: .LBB10_1: # =>This Inner Loop Header: Depth=1
	▲ Show 20 Lines • Show All 61 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: call __atomic_compare_exchange_2@plt			; RV64I-NEXT: call __atomic_compare_exchange_2@plt
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: cmpxchg_i16_acquire_monotonic:			; RV64IA-LABEL: cmpxchg_i16_acquire_monotonic:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a3, a0, -4			; RV64IA-NEXT: andi a3, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: lui a4, 16			; RV64IA-NEXT: lui a4, 16
	; RV64IA-NEXT: addiw a4, a4, -1			; RV64IA-NEXT: addiw a4, a4, -1
	; RV64IA-NEXT: sllw a5, a4, a0			; RV64IA-NEXT: sllw a5, a4, a0
	; RV64IA-NEXT: and a1, a1, a4			; RV64IA-NEXT: and a1, a1, a4
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: and a2, a2, a4			; RV64IA-NEXT: and a2, a2, a4
	; RV64IA-NEXT: sllw a0, a2, a0			; RV64IA-NEXT: sllw a0, a2, a0
	; RV64IA-NEXT: .LBB11_1: # =>This Inner Loop Header: Depth=1			; RV64IA-NEXT: .LBB11_1: # =>This Inner Loop Header: Depth=1
	▲ Show 20 Lines • Show All 61 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: call __atomic_compare_exchange_2@plt			; RV64I-NEXT: call __atomic_compare_exchange_2@plt
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: cmpxchg_i16_acquire_acquire:			; RV64IA-LABEL: cmpxchg_i16_acquire_acquire:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a3, a0, -4			; RV64IA-NEXT: andi a3, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: lui a4, 16			; RV64IA-NEXT: lui a4, 16
	; RV64IA-NEXT: addiw a4, a4, -1			; RV64IA-NEXT: addiw a4, a4, -1
	; RV64IA-NEXT: sllw a5, a4, a0			; RV64IA-NEXT: sllw a5, a4, a0
	; RV64IA-NEXT: and a1, a1, a4			; RV64IA-NEXT: and a1, a1, a4
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: and a2, a2, a4			; RV64IA-NEXT: and a2, a2, a4
	; RV64IA-NEXT: sllw a0, a2, a0			; RV64IA-NEXT: sllw a0, a2, a0
	; RV64IA-NEXT: .LBB12_1: # =>This Inner Loop Header: Depth=1			; RV64IA-NEXT: .LBB12_1: # =>This Inner Loop Header: Depth=1
	▲ Show 20 Lines • Show All 61 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: call __atomic_compare_exchange_2@plt			; RV64I-NEXT: call __atomic_compare_exchange_2@plt
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: cmpxchg_i16_release_monotonic:			; RV64IA-LABEL: cmpxchg_i16_release_monotonic:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a3, a0, -4			; RV64IA-NEXT: andi a3, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: lui a4, 16			; RV64IA-NEXT: lui a4, 16
	; RV64IA-NEXT: addiw a4, a4, -1			; RV64IA-NEXT: addiw a4, a4, -1
	; RV64IA-NEXT: sllw a5, a4, a0			; RV64IA-NEXT: sllw a5, a4, a0
	; RV64IA-NEXT: and a1, a1, a4			; RV64IA-NEXT: and a1, a1, a4
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: and a2, a2, a4			; RV64IA-NEXT: and a2, a2, a4
	; RV64IA-NEXT: sllw a0, a2, a0			; RV64IA-NEXT: sllw a0, a2, a0
	; RV64IA-NEXT: .LBB13_1: # =>This Inner Loop Header: Depth=1			; RV64IA-NEXT: .LBB13_1: # =>This Inner Loop Header: Depth=1
	▲ Show 20 Lines • Show All 61 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: call __atomic_compare_exchange_2@plt			; RV64I-NEXT: call __atomic_compare_exchange_2@plt
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: cmpxchg_i16_release_acquire:			; RV64IA-LABEL: cmpxchg_i16_release_acquire:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a3, a0, -4			; RV64IA-NEXT: andi a3, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: lui a4, 16			; RV64IA-NEXT: lui a4, 16
	; RV64IA-NEXT: addiw a4, a4, -1			; RV64IA-NEXT: addiw a4, a4, -1
	; RV64IA-NEXT: sllw a5, a4, a0			; RV64IA-NEXT: sllw a5, a4, a0
	; RV64IA-NEXT: and a1, a1, a4			; RV64IA-NEXT: and a1, a1, a4
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: and a2, a2, a4			; RV64IA-NEXT: and a2, a2, a4
	; RV64IA-NEXT: sllw a0, a2, a0			; RV64IA-NEXT: sllw a0, a2, a0
	; RV64IA-NEXT: .LBB14_1: # =>This Inner Loop Header: Depth=1			; RV64IA-NEXT: .LBB14_1: # =>This Inner Loop Header: Depth=1
	▲ Show 20 Lines • Show All 61 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: call __atomic_compare_exchange_2@plt			; RV64I-NEXT: call __atomic_compare_exchange_2@plt
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: cmpxchg_i16_acq_rel_monotonic:			; RV64IA-LABEL: cmpxchg_i16_acq_rel_monotonic:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a3, a0, -4			; RV64IA-NEXT: andi a3, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: lui a4, 16			; RV64IA-NEXT: lui a4, 16
	; RV64IA-NEXT: addiw a4, a4, -1			; RV64IA-NEXT: addiw a4, a4, -1
	; RV64IA-NEXT: sllw a5, a4, a0			; RV64IA-NEXT: sllw a5, a4, a0
	; RV64IA-NEXT: and a1, a1, a4			; RV64IA-NEXT: and a1, a1, a4
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: and a2, a2, a4			; RV64IA-NEXT: and a2, a2, a4
	; RV64IA-NEXT: sllw a0, a2, a0			; RV64IA-NEXT: sllw a0, a2, a0
	; RV64IA-NEXT: .LBB15_1: # =>This Inner Loop Header: Depth=1			; RV64IA-NEXT: .LBB15_1: # =>This Inner Loop Header: Depth=1
	▲ Show 20 Lines • Show All 61 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: call __atomic_compare_exchange_2@plt			; RV64I-NEXT: call __atomic_compare_exchange_2@plt
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: cmpxchg_i16_acq_rel_acquire:			; RV64IA-LABEL: cmpxchg_i16_acq_rel_acquire:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a3, a0, -4			; RV64IA-NEXT: andi a3, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: lui a4, 16			; RV64IA-NEXT: lui a4, 16
	; RV64IA-NEXT: addiw a4, a4, -1			; RV64IA-NEXT: addiw a4, a4, -1
	; RV64IA-NEXT: sllw a5, a4, a0			; RV64IA-NEXT: sllw a5, a4, a0
	; RV64IA-NEXT: and a1, a1, a4			; RV64IA-NEXT: and a1, a1, a4
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: and a2, a2, a4			; RV64IA-NEXT: and a2, a2, a4
	; RV64IA-NEXT: sllw a0, a2, a0			; RV64IA-NEXT: sllw a0, a2, a0
	; RV64IA-NEXT: .LBB16_1: # =>This Inner Loop Header: Depth=1			; RV64IA-NEXT: .LBB16_1: # =>This Inner Loop Header: Depth=1
	▲ Show 20 Lines • Show All 61 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: call __atomic_compare_exchange_2@plt			; RV64I-NEXT: call __atomic_compare_exchange_2@plt
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: cmpxchg_i16_seq_cst_monotonic:			; RV64IA-LABEL: cmpxchg_i16_seq_cst_monotonic:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a3, a0, -4			; RV64IA-NEXT: andi a3, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: lui a4, 16			; RV64IA-NEXT: lui a4, 16
	; RV64IA-NEXT: addiw a4, a4, -1			; RV64IA-NEXT: addiw a4, a4, -1
	; RV64IA-NEXT: sllw a5, a4, a0			; RV64IA-NEXT: sllw a5, a4, a0
	; RV64IA-NEXT: and a1, a1, a4			; RV64IA-NEXT: and a1, a1, a4
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: and a2, a2, a4			; RV64IA-NEXT: and a2, a2, a4
	; RV64IA-NEXT: sllw a0, a2, a0			; RV64IA-NEXT: sllw a0, a2, a0
	; RV64IA-NEXT: .LBB17_1: # =>This Inner Loop Header: Depth=1			; RV64IA-NEXT: .LBB17_1: # =>This Inner Loop Header: Depth=1
	▲ Show 20 Lines • Show All 61 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: call __atomic_compare_exchange_2@plt			; RV64I-NEXT: call __atomic_compare_exchange_2@plt
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: cmpxchg_i16_seq_cst_acquire:			; RV64IA-LABEL: cmpxchg_i16_seq_cst_acquire:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a3, a0, -4			; RV64IA-NEXT: andi a3, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: lui a4, 16			; RV64IA-NEXT: lui a4, 16
	; RV64IA-NEXT: addiw a4, a4, -1			; RV64IA-NEXT: addiw a4, a4, -1
	; RV64IA-NEXT: sllw a5, a4, a0			; RV64IA-NEXT: sllw a5, a4, a0
	; RV64IA-NEXT: and a1, a1, a4			; RV64IA-NEXT: and a1, a1, a4
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: and a2, a2, a4			; RV64IA-NEXT: and a2, a2, a4
	; RV64IA-NEXT: sllw a0, a2, a0			; RV64IA-NEXT: sllw a0, a2, a0
	; RV64IA-NEXT: .LBB18_1: # =>This Inner Loop Header: Depth=1			; RV64IA-NEXT: .LBB18_1: # =>This Inner Loop Header: Depth=1
	▲ Show 20 Lines • Show All 61 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: call __atomic_compare_exchange_2@plt			; RV64I-NEXT: call __atomic_compare_exchange_2@plt
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: cmpxchg_i16_seq_cst_seq_cst:			; RV64IA-LABEL: cmpxchg_i16_seq_cst_seq_cst:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a3, a0, -4			; RV64IA-NEXT: andi a3, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: lui a4, 16			; RV64IA-NEXT: lui a4, 16
	; RV64IA-NEXT: addiw a4, a4, -1			; RV64IA-NEXT: addiw a4, a4, -1
	; RV64IA-NEXT: sllw a5, a4, a0			; RV64IA-NEXT: sllw a5, a4, a0
	; RV64IA-NEXT: and a1, a1, a4			; RV64IA-NEXT: and a1, a1, a4
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: and a2, a2, a4			; RV64IA-NEXT: and a2, a2, a4
	; RV64IA-NEXT: sllw a0, a2, a0			; RV64IA-NEXT: sllw a0, a2, a0
	; RV64IA-NEXT: .LBB19_1: # =>This Inner Loop Header: Depth=1			; RV64IA-NEXT: .LBB19_1: # =>This Inner Loop Header: Depth=1
	▲ Show 20 Lines • Show All 1,162 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/atomic-rmw.ll

This file is larger than 256 KB, so syntax highlighting is disabled by default.

	Show First 20 Lines • Show All 46 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: call __atomic_exchange_1@plt			; RV64I-NEXT: call __atomic_exchange_1@plt
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: atomicrmw_xchg_i8_monotonic:			; RV64IA-LABEL: atomicrmw_xchg_i8_monotonic:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a2, a0, -4			; RV64IA-NEXT: andi a2, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: addi a3, zero, 255			; RV64IA-NEXT: addi a3, zero, 255
	; RV64IA-NEXT: sllw a3, a3, a0			; RV64IA-NEXT: sllw a3, a3, a0
	; RV64IA-NEXT: andi a1, a1, 255			; RV64IA-NEXT: andi a1, a1, 255
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: .LBB0_1: # =>This Inner Loop Header: Depth=1			; RV64IA-NEXT: .LBB0_1: # =>This Inner Loop Header: Depth=1
	; RV64IA-NEXT: lr.w a4, (a2)			; RV64IA-NEXT: lr.w a4, (a2)
	; RV64IA-NEXT: mv a5, a1			; RV64IA-NEXT: mv a5, a1
	; RV64IA-NEXT: xor a5, a4, a5			; RV64IA-NEXT: xor a5, a4, a5
	▲ Show 20 Lines • Show All 47 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: call __atomic_exchange_1@plt			; RV64I-NEXT: call __atomic_exchange_1@plt
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: atomicrmw_xchg_i8_acquire:			; RV64IA-LABEL: atomicrmw_xchg_i8_acquire:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a2, a0, -4			; RV64IA-NEXT: andi a2, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: addi a3, zero, 255			; RV64IA-NEXT: addi a3, zero, 255
	; RV64IA-NEXT: sllw a3, a3, a0			; RV64IA-NEXT: sllw a3, a3, a0
	; RV64IA-NEXT: andi a1, a1, 255			; RV64IA-NEXT: andi a1, a1, 255
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: .LBB1_1: # =>This Inner Loop Header: Depth=1			; RV64IA-NEXT: .LBB1_1: # =>This Inner Loop Header: Depth=1
	; RV64IA-NEXT: lr.w.aq a4, (a2)			; RV64IA-NEXT: lr.w.aq a4, (a2)
	; RV64IA-NEXT: mv a5, a1			; RV64IA-NEXT: mv a5, a1
	; RV64IA-NEXT: xor a5, a4, a5			; RV64IA-NEXT: xor a5, a4, a5
	▲ Show 20 Lines • Show All 47 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: call __atomic_exchange_1@plt			; RV64I-NEXT: call __atomic_exchange_1@plt
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: atomicrmw_xchg_i8_release:			; RV64IA-LABEL: atomicrmw_xchg_i8_release:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a2, a0, -4			; RV64IA-NEXT: andi a2, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: addi a3, zero, 255			; RV64IA-NEXT: addi a3, zero, 255
	; RV64IA-NEXT: sllw a3, a3, a0			; RV64IA-NEXT: sllw a3, a3, a0
	; RV64IA-NEXT: andi a1, a1, 255			; RV64IA-NEXT: andi a1, a1, 255
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: .LBB2_1: # =>This Inner Loop Header: Depth=1			; RV64IA-NEXT: .LBB2_1: # =>This Inner Loop Header: Depth=1
	; RV64IA-NEXT: lr.w a4, (a2)			; RV64IA-NEXT: lr.w a4, (a2)
	; RV64IA-NEXT: mv a5, a1			; RV64IA-NEXT: mv a5, a1
	; RV64IA-NEXT: xor a5, a4, a5			; RV64IA-NEXT: xor a5, a4, a5
	▲ Show 20 Lines • Show All 47 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: call __atomic_exchange_1@plt			; RV64I-NEXT: call __atomic_exchange_1@plt
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: atomicrmw_xchg_i8_acq_rel:			; RV64IA-LABEL: atomicrmw_xchg_i8_acq_rel:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a2, a0, -4			; RV64IA-NEXT: andi a2, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: addi a3, zero, 255			; RV64IA-NEXT: addi a3, zero, 255
	; RV64IA-NEXT: sllw a3, a3, a0			; RV64IA-NEXT: sllw a3, a3, a0
	; RV64IA-NEXT: andi a1, a1, 255			; RV64IA-NEXT: andi a1, a1, 255
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: .LBB3_1: # =>This Inner Loop Header: Depth=1			; RV64IA-NEXT: .LBB3_1: # =>This Inner Loop Header: Depth=1
	; RV64IA-NEXT: lr.w.aq a4, (a2)			; RV64IA-NEXT: lr.w.aq a4, (a2)
	; RV64IA-NEXT: mv a5, a1			; RV64IA-NEXT: mv a5, a1
	; RV64IA-NEXT: xor a5, a4, a5			; RV64IA-NEXT: xor a5, a4, a5
	▲ Show 20 Lines • Show All 47 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: call __atomic_exchange_1@plt			; RV64I-NEXT: call __atomic_exchange_1@plt
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: atomicrmw_xchg_i8_seq_cst:			; RV64IA-LABEL: atomicrmw_xchg_i8_seq_cst:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a2, a0, -4			; RV64IA-NEXT: andi a2, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: addi a3, zero, 255			; RV64IA-NEXT: addi a3, zero, 255
	; RV64IA-NEXT: sllw a3, a3, a0			; RV64IA-NEXT: sllw a3, a3, a0
	; RV64IA-NEXT: andi a1, a1, 255			; RV64IA-NEXT: andi a1, a1, 255
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: .LBB4_1: # =>This Inner Loop Header: Depth=1			; RV64IA-NEXT: .LBB4_1: # =>This Inner Loop Header: Depth=1
	; RV64IA-NEXT: lr.w.aqrl a4, (a2)			; RV64IA-NEXT: lr.w.aqrl a4, (a2)
	; RV64IA-NEXT: mv a5, a1			; RV64IA-NEXT: mv a5, a1
	; RV64IA-NEXT: xor a5, a4, a5			; RV64IA-NEXT: xor a5, a4, a5
	▲ Show 20 Lines • Show All 47 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: call __atomic_fetch_add_1@plt			; RV64I-NEXT: call __atomic_fetch_add_1@plt
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: atomicrmw_add_i8_monotonic:			; RV64IA-LABEL: atomicrmw_add_i8_monotonic:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a2, a0, -4			; RV64IA-NEXT: andi a2, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: addi a3, zero, 255			; RV64IA-NEXT: addi a3, zero, 255
	; RV64IA-NEXT: sllw a3, a3, a0			; RV64IA-NEXT: sllw a3, a3, a0
	; RV64IA-NEXT: andi a1, a1, 255			; RV64IA-NEXT: andi a1, a1, 255
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: .LBB5_1: # =>This Inner Loop Header: Depth=1			; RV64IA-NEXT: .LBB5_1: # =>This Inner Loop Header: Depth=1
	; RV64IA-NEXT: lr.w a4, (a2)			; RV64IA-NEXT: lr.w a4, (a2)
	; RV64IA-NEXT: add a5, a4, a1			; RV64IA-NEXT: add a5, a4, a1
	; RV64IA-NEXT: xor a5, a4, a5			; RV64IA-NEXT: xor a5, a4, a5
	▲ Show 20 Lines • Show All 47 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: call __atomic_fetch_add_1@plt			; RV64I-NEXT: call __atomic_fetch_add_1@plt
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: atomicrmw_add_i8_acquire:			; RV64IA-LABEL: atomicrmw_add_i8_acquire:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a2, a0, -4			; RV64IA-NEXT: andi a2, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: addi a3, zero, 255			; RV64IA-NEXT: addi a3, zero, 255
	; RV64IA-NEXT: sllw a3, a3, a0			; RV64IA-NEXT: sllw a3, a3, a0
	; RV64IA-NEXT: andi a1, a1, 255			; RV64IA-NEXT: andi a1, a1, 255
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: .LBB6_1: # =>This Inner Loop Header: Depth=1			; RV64IA-NEXT: .LBB6_1: # =>This Inner Loop Header: Depth=1
	; RV64IA-NEXT: lr.w.aq a4, (a2)			; RV64IA-NEXT: lr.w.aq a4, (a2)
	; RV64IA-NEXT: add a5, a4, a1			; RV64IA-NEXT: add a5, a4, a1
	; RV64IA-NEXT: xor a5, a4, a5			; RV64IA-NEXT: xor a5, a4, a5
	▲ Show 20 Lines • Show All 47 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: call __atomic_fetch_add_1@plt			; RV64I-NEXT: call __atomic_fetch_add_1@plt
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: atomicrmw_add_i8_release:			; RV64IA-LABEL: atomicrmw_add_i8_release:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a2, a0, -4			; RV64IA-NEXT: andi a2, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: addi a3, zero, 255			; RV64IA-NEXT: addi a3, zero, 255
	; RV64IA-NEXT: sllw a3, a3, a0			; RV64IA-NEXT: sllw a3, a3, a0
	; RV64IA-NEXT: andi a1, a1, 255			; RV64IA-NEXT: andi a1, a1, 255
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: .LBB7_1: # =>This Inner Loop Header: Depth=1			; RV64IA-NEXT: .LBB7_1: # =>This Inner Loop Header: Depth=1
	; RV64IA-NEXT: lr.w a4, (a2)			; RV64IA-NEXT: lr.w a4, (a2)
	; RV64IA-NEXT: add a5, a4, a1			; RV64IA-NEXT: add a5, a4, a1
	; RV64IA-NEXT: xor a5, a4, a5			; RV64IA-NEXT: xor a5, a4, a5
	▲ Show 20 Lines • Show All 47 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: call __atomic_fetch_add_1@plt			; RV64I-NEXT: call __atomic_fetch_add_1@plt
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: atomicrmw_add_i8_acq_rel:			; RV64IA-LABEL: atomicrmw_add_i8_acq_rel:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a2, a0, -4			; RV64IA-NEXT: andi a2, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: addi a3, zero, 255			; RV64IA-NEXT: addi a3, zero, 255
	; RV64IA-NEXT: sllw a3, a3, a0			; RV64IA-NEXT: sllw a3, a3, a0
	; RV64IA-NEXT: andi a1, a1, 255			; RV64IA-NEXT: andi a1, a1, 255
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: .LBB8_1: # =>This Inner Loop Header: Depth=1			; RV64IA-NEXT: .LBB8_1: # =>This Inner Loop Header: Depth=1
	; RV64IA-NEXT: lr.w.aq a4, (a2)			; RV64IA-NEXT: lr.w.aq a4, (a2)
	; RV64IA-NEXT: add a5, a4, a1			; RV64IA-NEXT: add a5, a4, a1
	; RV64IA-NEXT: xor a5, a4, a5			; RV64IA-NEXT: xor a5, a4, a5
	▲ Show 20 Lines • Show All 47 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: call __atomic_fetch_add_1@plt			; RV64I-NEXT: call __atomic_fetch_add_1@plt
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: atomicrmw_add_i8_seq_cst:			; RV64IA-LABEL: atomicrmw_add_i8_seq_cst:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a2, a0, -4			; RV64IA-NEXT: andi a2, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: addi a3, zero, 255			; RV64IA-NEXT: addi a3, zero, 255
	; RV64IA-NEXT: sllw a3, a3, a0			; RV64IA-NEXT: sllw a3, a3, a0
	; RV64IA-NEXT: andi a1, a1, 255			; RV64IA-NEXT: andi a1, a1, 255
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: .LBB9_1: # =>This Inner Loop Header: Depth=1			; RV64IA-NEXT: .LBB9_1: # =>This Inner Loop Header: Depth=1
	; RV64IA-NEXT: lr.w.aqrl a4, (a2)			; RV64IA-NEXT: lr.w.aqrl a4, (a2)
	; RV64IA-NEXT: add a5, a4, a1			; RV64IA-NEXT: add a5, a4, a1
	; RV64IA-NEXT: xor a5, a4, a5			; RV64IA-NEXT: xor a5, a4, a5
	▲ Show 20 Lines • Show All 47 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: call __atomic_fetch_sub_1@plt			; RV64I-NEXT: call __atomic_fetch_sub_1@plt
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: atomicrmw_sub_i8_monotonic:			; RV64IA-LABEL: atomicrmw_sub_i8_monotonic:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a2, a0, -4			; RV64IA-NEXT: andi a2, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: addi a3, zero, 255			; RV64IA-NEXT: addi a3, zero, 255
	; RV64IA-NEXT: sllw a3, a3, a0			; RV64IA-NEXT: sllw a3, a3, a0
	; RV64IA-NEXT: andi a1, a1, 255			; RV64IA-NEXT: andi a1, a1, 255
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: .LBB10_1: # =>This Inner Loop Header: Depth=1			; RV64IA-NEXT: .LBB10_1: # =>This Inner Loop Header: Depth=1
	; RV64IA-NEXT: lr.w a4, (a2)			; RV64IA-NEXT: lr.w a4, (a2)
	; RV64IA-NEXT: sub a5, a4, a1			; RV64IA-NEXT: sub a5, a4, a1
	; RV64IA-NEXT: xor a5, a4, a5			; RV64IA-NEXT: xor a5, a4, a5
	▲ Show 20 Lines • Show All 47 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: call __atomic_fetch_sub_1@plt			; RV64I-NEXT: call __atomic_fetch_sub_1@plt
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: atomicrmw_sub_i8_acquire:			; RV64IA-LABEL: atomicrmw_sub_i8_acquire:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a2, a0, -4			; RV64IA-NEXT: andi a2, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: addi a3, zero, 255			; RV64IA-NEXT: addi a3, zero, 255
	; RV64IA-NEXT: sllw a3, a3, a0			; RV64IA-NEXT: sllw a3, a3, a0
	; RV64IA-NEXT: andi a1, a1, 255			; RV64IA-NEXT: andi a1, a1, 255
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: .LBB11_1: # =>This Inner Loop Header: Depth=1			; RV64IA-NEXT: .LBB11_1: # =>This Inner Loop Header: Depth=1
	; RV64IA-NEXT: lr.w.aq a4, (a2)			; RV64IA-NEXT: lr.w.aq a4, (a2)
	; RV64IA-NEXT: sub a5, a4, a1			; RV64IA-NEXT: sub a5, a4, a1
	; RV64IA-NEXT: xor a5, a4, a5			; RV64IA-NEXT: xor a5, a4, a5
	▲ Show 20 Lines • Show All 47 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: call __atomic_fetch_sub_1@plt			; RV64I-NEXT: call __atomic_fetch_sub_1@plt
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: atomicrmw_sub_i8_release:			; RV64IA-LABEL: atomicrmw_sub_i8_release:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a2, a0, -4			; RV64IA-NEXT: andi a2, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: addi a3, zero, 255			; RV64IA-NEXT: addi a3, zero, 255
	; RV64IA-NEXT: sllw a3, a3, a0			; RV64IA-NEXT: sllw a3, a3, a0
	; RV64IA-NEXT: andi a1, a1, 255			; RV64IA-NEXT: andi a1, a1, 255
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: .LBB12_1: # =>This Inner Loop Header: Depth=1			; RV64IA-NEXT: .LBB12_1: # =>This Inner Loop Header: Depth=1
	; RV64IA-NEXT: lr.w a4, (a2)			; RV64IA-NEXT: lr.w a4, (a2)
	; RV64IA-NEXT: sub a5, a4, a1			; RV64IA-NEXT: sub a5, a4, a1
	; RV64IA-NEXT: xor a5, a4, a5			; RV64IA-NEXT: xor a5, a4, a5
	▲ Show 20 Lines • Show All 47 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: call __atomic_fetch_sub_1@plt			; RV64I-NEXT: call __atomic_fetch_sub_1@plt
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: atomicrmw_sub_i8_acq_rel:			; RV64IA-LABEL: atomicrmw_sub_i8_acq_rel:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a2, a0, -4			; RV64IA-NEXT: andi a2, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: addi a3, zero, 255			; RV64IA-NEXT: addi a3, zero, 255
	; RV64IA-NEXT: sllw a3, a3, a0			; RV64IA-NEXT: sllw a3, a3, a0
	; RV64IA-NEXT: andi a1, a1, 255			; RV64IA-NEXT: andi a1, a1, 255
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: .LBB13_1: # =>This Inner Loop Header: Depth=1			; RV64IA-NEXT: .LBB13_1: # =>This Inner Loop Header: Depth=1
	; RV64IA-NEXT: lr.w.aq a4, (a2)			; RV64IA-NEXT: lr.w.aq a4, (a2)
	; RV64IA-NEXT: sub a5, a4, a1			; RV64IA-NEXT: sub a5, a4, a1
	; RV64IA-NEXT: xor a5, a4, a5			; RV64IA-NEXT: xor a5, a4, a5
	▲ Show 20 Lines • Show All 47 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: call __atomic_fetch_sub_1@plt			; RV64I-NEXT: call __atomic_fetch_sub_1@plt
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: atomicrmw_sub_i8_seq_cst:			; RV64IA-LABEL: atomicrmw_sub_i8_seq_cst:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a2, a0, -4			; RV64IA-NEXT: andi a2, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: addi a3, zero, 255			; RV64IA-NEXT: addi a3, zero, 255
	; RV64IA-NEXT: sllw a3, a3, a0			; RV64IA-NEXT: sllw a3, a3, a0
	; RV64IA-NEXT: andi a1, a1, 255			; RV64IA-NEXT: andi a1, a1, 255
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: .LBB14_1: # =>This Inner Loop Header: Depth=1			; RV64IA-NEXT: .LBB14_1: # =>This Inner Loop Header: Depth=1
	; RV64IA-NEXT: lr.w.aqrl a4, (a2)			; RV64IA-NEXT: lr.w.aqrl a4, (a2)
	; RV64IA-NEXT: sub a5, a4, a1			; RV64IA-NEXT: sub a5, a4, a1
	; RV64IA-NEXT: xor a5, a4, a5			; RV64IA-NEXT: xor a5, a4, a5
	▲ Show 20 Lines • Show All 41 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: call __atomic_fetch_and_1@plt			; RV64I-NEXT: call __atomic_fetch_and_1@plt
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: atomicrmw_and_i8_monotonic:			; RV64IA-LABEL: atomicrmw_and_i8_monotonic:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a2, a0, -4			; RV64IA-NEXT: andi a2, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: addi a3, zero, 255			; RV64IA-NEXT: addi a3, zero, 255
	; RV64IA-NEXT: sllw a3, a3, a0			; RV64IA-NEXT: sllw a3, a3, a0
	; RV64IA-NEXT: not a3, a3			; RV64IA-NEXT: not a3, a3
	; RV64IA-NEXT: andi a1, a1, 255			; RV64IA-NEXT: andi a1, a1, 255
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: or a1, a3, a1			; RV64IA-NEXT: or a1, a3, a1
	; RV64IA-NEXT: amoand.w a1, a1, (a2)			; RV64IA-NEXT: amoand.w a1, a1, (a2)
	; RV64IA-NEXT: srlw a0, a1, a0			; RV64IA-NEXT: srlw a0, a1, a0
	Show All 35 Lines
	; RV64I-NEXT: call __atomic_fetch_and_1@plt			; RV64I-NEXT: call __atomic_fetch_and_1@plt
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: atomicrmw_and_i8_acquire:			; RV64IA-LABEL: atomicrmw_and_i8_acquire:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a2, a0, -4			; RV64IA-NEXT: andi a2, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: addi a3, zero, 255			; RV64IA-NEXT: addi a3, zero, 255
	; RV64IA-NEXT: sllw a3, a3, a0			; RV64IA-NEXT: sllw a3, a3, a0
	; RV64IA-NEXT: not a3, a3			; RV64IA-NEXT: not a3, a3
	; RV64IA-NEXT: andi a1, a1, 255			; RV64IA-NEXT: andi a1, a1, 255
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: or a1, a3, a1			; RV64IA-NEXT: or a1, a3, a1
	; RV64IA-NEXT: amoand.w.aq a1, a1, (a2)			; RV64IA-NEXT: amoand.w.aq a1, a1, (a2)
	; RV64IA-NEXT: srlw a0, a1, a0			; RV64IA-NEXT: srlw a0, a1, a0
	Show All 35 Lines
	; RV64I-NEXT: call __atomic_fetch_and_1@plt			; RV64I-NEXT: call __atomic_fetch_and_1@plt
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: atomicrmw_and_i8_release:			; RV64IA-LABEL: atomicrmw_and_i8_release:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a2, a0, -4			; RV64IA-NEXT: andi a2, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: addi a3, zero, 255			; RV64IA-NEXT: addi a3, zero, 255
	; RV64IA-NEXT: sllw a3, a3, a0			; RV64IA-NEXT: sllw a3, a3, a0
	; RV64IA-NEXT: not a3, a3			; RV64IA-NEXT: not a3, a3
	; RV64IA-NEXT: andi a1, a1, 255			; RV64IA-NEXT: andi a1, a1, 255
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: or a1, a3, a1			; RV64IA-NEXT: or a1, a3, a1
	; RV64IA-NEXT: amoand.w.rl a1, a1, (a2)			; RV64IA-NEXT: amoand.w.rl a1, a1, (a2)
	; RV64IA-NEXT: srlw a0, a1, a0			; RV64IA-NEXT: srlw a0, a1, a0
	Show All 35 Lines
	; RV64I-NEXT: call __atomic_fetch_and_1@plt			; RV64I-NEXT: call __atomic_fetch_and_1@plt
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: atomicrmw_and_i8_acq_rel:			; RV64IA-LABEL: atomicrmw_and_i8_acq_rel:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a2, a0, -4			; RV64IA-NEXT: andi a2, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: addi a3, zero, 255			; RV64IA-NEXT: addi a3, zero, 255
	; RV64IA-NEXT: sllw a3, a3, a0			; RV64IA-NEXT: sllw a3, a3, a0
	; RV64IA-NEXT: not a3, a3			; RV64IA-NEXT: not a3, a3
	; RV64IA-NEXT: andi a1, a1, 255			; RV64IA-NEXT: andi a1, a1, 255
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: or a1, a3, a1			; RV64IA-NEXT: or a1, a3, a1
	; RV64IA-NEXT: amoand.w.aqrl a1, a1, (a2)			; RV64IA-NEXT: amoand.w.aqrl a1, a1, (a2)
	; RV64IA-NEXT: srlw a0, a1, a0			; RV64IA-NEXT: srlw a0, a1, a0
	Show All 35 Lines
	; RV64I-NEXT: call __atomic_fetch_and_1@plt			; RV64I-NEXT: call __atomic_fetch_and_1@plt
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: atomicrmw_and_i8_seq_cst:			; RV64IA-LABEL: atomicrmw_and_i8_seq_cst:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a2, a0, -4			; RV64IA-NEXT: andi a2, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: addi a3, zero, 255			; RV64IA-NEXT: addi a3, zero, 255
	; RV64IA-NEXT: sllw a3, a3, a0			; RV64IA-NEXT: sllw a3, a3, a0
	; RV64IA-NEXT: not a3, a3			; RV64IA-NEXT: not a3, a3
	; RV64IA-NEXT: andi a1, a1, 255			; RV64IA-NEXT: andi a1, a1, 255
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: or a1, a3, a1			; RV64IA-NEXT: or a1, a3, a1
	; RV64IA-NEXT: amoand.w.aqrl a1, a1, (a2)			; RV64IA-NEXT: amoand.w.aqrl a1, a1, (a2)
	; RV64IA-NEXT: srlw a0, a1, a0			; RV64IA-NEXT: srlw a0, a1, a0
	▲ Show 20 Lines • Show All 42 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: call __atomic_fetch_nand_1@plt			; RV64I-NEXT: call __atomic_fetch_nand_1@plt
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: atomicrmw_nand_i8_monotonic:			; RV64IA-LABEL: atomicrmw_nand_i8_monotonic:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a2, a0, -4			; RV64IA-NEXT: andi a2, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: addi a3, zero, 255			; RV64IA-NEXT: addi a3, zero, 255
	; RV64IA-NEXT: sllw a3, a3, a0			; RV64IA-NEXT: sllw a3, a3, a0
	; RV64IA-NEXT: andi a1, a1, 255			; RV64IA-NEXT: andi a1, a1, 255
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: .LBB20_1: # =>This Inner Loop Header: Depth=1			; RV64IA-NEXT: .LBB20_1: # =>This Inner Loop Header: Depth=1
	; RV64IA-NEXT: lr.w a4, (a2)			; RV64IA-NEXT: lr.w a4, (a2)
	; RV64IA-NEXT: and a5, a4, a1			; RV64IA-NEXT: and a5, a4, a1
	; RV64IA-NEXT: not a5, a5			; RV64IA-NEXT: not a5, a5
	▲ Show 20 Lines • Show All 49 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: call __atomic_fetch_nand_1@plt			; RV64I-NEXT: call __atomic_fetch_nand_1@plt
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: atomicrmw_nand_i8_acquire:			; RV64IA-LABEL: atomicrmw_nand_i8_acquire:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a2, a0, -4			; RV64IA-NEXT: andi a2, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: addi a3, zero, 255			; RV64IA-NEXT: addi a3, zero, 255
	; RV64IA-NEXT: sllw a3, a3, a0			; RV64IA-NEXT: sllw a3, a3, a0
	; RV64IA-NEXT: andi a1, a1, 255			; RV64IA-NEXT: andi a1, a1, 255
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: .LBB21_1: # =>This Inner Loop Header: Depth=1			; RV64IA-NEXT: .LBB21_1: # =>This Inner Loop Header: Depth=1
	; RV64IA-NEXT: lr.w.aq a4, (a2)			; RV64IA-NEXT: lr.w.aq a4, (a2)
	; RV64IA-NEXT: and a5, a4, a1			; RV64IA-NEXT: and a5, a4, a1
	; RV64IA-NEXT: not a5, a5			; RV64IA-NEXT: not a5, a5
	▲ Show 20 Lines • Show All 49 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: call __atomic_fetch_nand_1@plt			; RV64I-NEXT: call __atomic_fetch_nand_1@plt
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: atomicrmw_nand_i8_release:			; RV64IA-LABEL: atomicrmw_nand_i8_release:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a2, a0, -4			; RV64IA-NEXT: andi a2, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: addi a3, zero, 255			; RV64IA-NEXT: addi a3, zero, 255
	; RV64IA-NEXT: sllw a3, a3, a0			; RV64IA-NEXT: sllw a3, a3, a0
	; RV64IA-NEXT: andi a1, a1, 255			; RV64IA-NEXT: andi a1, a1, 255
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: .LBB22_1: # =>This Inner Loop Header: Depth=1			; RV64IA-NEXT: .LBB22_1: # =>This Inner Loop Header: Depth=1
	; RV64IA-NEXT: lr.w a4, (a2)			; RV64IA-NEXT: lr.w a4, (a2)
	; RV64IA-NEXT: and a5, a4, a1			; RV64IA-NEXT: and a5, a4, a1
	; RV64IA-NEXT: not a5, a5			; RV64IA-NEXT: not a5, a5
	▲ Show 20 Lines • Show All 49 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: call __atomic_fetch_nand_1@plt			; RV64I-NEXT: call __atomic_fetch_nand_1@plt
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: atomicrmw_nand_i8_acq_rel:			; RV64IA-LABEL: atomicrmw_nand_i8_acq_rel:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a2, a0, -4			; RV64IA-NEXT: andi a2, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: addi a3, zero, 255			; RV64IA-NEXT: addi a3, zero, 255
	; RV64IA-NEXT: sllw a3, a3, a0			; RV64IA-NEXT: sllw a3, a3, a0
	; RV64IA-NEXT: andi a1, a1, 255			; RV64IA-NEXT: andi a1, a1, 255
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: .LBB23_1: # =>This Inner Loop Header: Depth=1			; RV64IA-NEXT: .LBB23_1: # =>This Inner Loop Header: Depth=1
	; RV64IA-NEXT: lr.w.aq a4, (a2)			; RV64IA-NEXT: lr.w.aq a4, (a2)
	; RV64IA-NEXT: and a5, a4, a1			; RV64IA-NEXT: and a5, a4, a1
	; RV64IA-NEXT: not a5, a5			; RV64IA-NEXT: not a5, a5
	▲ Show 20 Lines • Show All 49 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: call __atomic_fetch_nand_1@plt			; RV64I-NEXT: call __atomic_fetch_nand_1@plt
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: atomicrmw_nand_i8_seq_cst:			; RV64IA-LABEL: atomicrmw_nand_i8_seq_cst:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a2, a0, -4			; RV64IA-NEXT: andi a2, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: addi a3, zero, 255			; RV64IA-NEXT: addi a3, zero, 255
	; RV64IA-NEXT: sllw a3, a3, a0			; RV64IA-NEXT: sllw a3, a3, a0
	; RV64IA-NEXT: andi a1, a1, 255			; RV64IA-NEXT: andi a1, a1, 255
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: .LBB24_1: # =>This Inner Loop Header: Depth=1			; RV64IA-NEXT: .LBB24_1: # =>This Inner Loop Header: Depth=1
	; RV64IA-NEXT: lr.w.aqrl a4, (a2)			; RV64IA-NEXT: lr.w.aqrl a4, (a2)
	; RV64IA-NEXT: and a5, a4, a1			; RV64IA-NEXT: and a5, a4, a1
	; RV64IA-NEXT: not a5, a5			; RV64IA-NEXT: not a5, a5
	Show All 38 Lines
	; RV64I-NEXT: call __atomic_fetch_or_1@plt			; RV64I-NEXT: call __atomic_fetch_or_1@plt
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: atomicrmw_or_i8_monotonic:			; RV64IA-LABEL: atomicrmw_or_i8_monotonic:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a2, a0, -4			; RV64IA-NEXT: andi a2, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: andi a1, a1, 255			; RV64IA-NEXT: andi a1, a1, 255
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: amoor.w a1, a1, (a2)			; RV64IA-NEXT: amoor.w a1, a1, (a2)
	; RV64IA-NEXT: srlw a0, a1, a0			; RV64IA-NEXT: srlw a0, a1, a0
	; RV64IA-NEXT: ret			; RV64IA-NEXT: ret
	%1 = atomicrmw or i8* %a, i8 %b monotonic			%1 = atomicrmw or i8* %a, i8 %b monotonic
	ret i8 %1			ret i8 %1
	}			}
	Show All 27 Lines
	; RV64I-NEXT: call __atomic_fetch_or_1@plt			; RV64I-NEXT: call __atomic_fetch_or_1@plt
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: atomicrmw_or_i8_acquire:			; RV64IA-LABEL: atomicrmw_or_i8_acquire:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a2, a0, -4			; RV64IA-NEXT: andi a2, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: andi a1, a1, 255			; RV64IA-NEXT: andi a1, a1, 255
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: amoor.w.aq a1, a1, (a2)			; RV64IA-NEXT: amoor.w.aq a1, a1, (a2)
	; RV64IA-NEXT: srlw a0, a1, a0			; RV64IA-NEXT: srlw a0, a1, a0
	; RV64IA-NEXT: ret			; RV64IA-NEXT: ret
	%1 = atomicrmw or i8* %a, i8 %b acquire			%1 = atomicrmw or i8* %a, i8 %b acquire
	ret i8 %1			ret i8 %1
	}			}
	Show All 27 Lines
	; RV64I-NEXT: call __atomic_fetch_or_1@plt			; RV64I-NEXT: call __atomic_fetch_or_1@plt
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: atomicrmw_or_i8_release:			; RV64IA-LABEL: atomicrmw_or_i8_release:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a2, a0, -4			; RV64IA-NEXT: andi a2, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: andi a1, a1, 255			; RV64IA-NEXT: andi a1, a1, 255
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: amoor.w.rl a1, a1, (a2)			; RV64IA-NEXT: amoor.w.rl a1, a1, (a2)
	; RV64IA-NEXT: srlw a0, a1, a0			; RV64IA-NEXT: srlw a0, a1, a0
	; RV64IA-NEXT: ret			; RV64IA-NEXT: ret
	%1 = atomicrmw or i8* %a, i8 %b release			%1 = atomicrmw or i8* %a, i8 %b release
	ret i8 %1			ret i8 %1
	}			}
	Show All 27 Lines
	; RV64I-NEXT: call __atomic_fetch_or_1@plt			; RV64I-NEXT: call __atomic_fetch_or_1@plt
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: atomicrmw_or_i8_acq_rel:			; RV64IA-LABEL: atomicrmw_or_i8_acq_rel:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a2, a0, -4			; RV64IA-NEXT: andi a2, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: andi a1, a1, 255			; RV64IA-NEXT: andi a1, a1, 255
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: amoor.w.aqrl a1, a1, (a2)			; RV64IA-NEXT: amoor.w.aqrl a1, a1, (a2)
	; RV64IA-NEXT: srlw a0, a1, a0			; RV64IA-NEXT: srlw a0, a1, a0
	; RV64IA-NEXT: ret			; RV64IA-NEXT: ret
	%1 = atomicrmw or i8* %a, i8 %b acq_rel			%1 = atomicrmw or i8* %a, i8 %b acq_rel
	ret i8 %1			ret i8 %1
	}			}
	Show All 27 Lines
	; RV64I-NEXT: call __atomic_fetch_or_1@plt			; RV64I-NEXT: call __atomic_fetch_or_1@plt
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: atomicrmw_or_i8_seq_cst:			; RV64IA-LABEL: atomicrmw_or_i8_seq_cst:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a2, a0, -4			; RV64IA-NEXT: andi a2, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: andi a1, a1, 255			; RV64IA-NEXT: andi a1, a1, 255
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: amoor.w.aqrl a1, a1, (a2)			; RV64IA-NEXT: amoor.w.aqrl a1, a1, (a2)
	; RV64IA-NEXT: srlw a0, a1, a0			; RV64IA-NEXT: srlw a0, a1, a0
	; RV64IA-NEXT: ret			; RV64IA-NEXT: ret
	%1 = atomicrmw or i8* %a, i8 %b seq_cst			%1 = atomicrmw or i8* %a, i8 %b seq_cst
	ret i8 %1			ret i8 %1
	}			}
	Show All 27 Lines
	; RV64I-NEXT: call __atomic_fetch_xor_1@plt			; RV64I-NEXT: call __atomic_fetch_xor_1@plt
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: atomicrmw_xor_i8_monotonic:			; RV64IA-LABEL: atomicrmw_xor_i8_monotonic:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a2, a0, -4			; RV64IA-NEXT: andi a2, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: andi a1, a1, 255			; RV64IA-NEXT: andi a1, a1, 255
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: amoxor.w a1, a1, (a2)			; RV64IA-NEXT: amoxor.w a1, a1, (a2)
	; RV64IA-NEXT: srlw a0, a1, a0			; RV64IA-NEXT: srlw a0, a1, a0
	; RV64IA-NEXT: ret			; RV64IA-NEXT: ret
	%1 = atomicrmw xor i8* %a, i8 %b monotonic			%1 = atomicrmw xor i8* %a, i8 %b monotonic
	ret i8 %1			ret i8 %1
	}			}
	Show All 27 Lines
	; RV64I-NEXT: call __atomic_fetch_xor_1@plt			; RV64I-NEXT: call __atomic_fetch_xor_1@plt
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: atomicrmw_xor_i8_acquire:			; RV64IA-LABEL: atomicrmw_xor_i8_acquire:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a2, a0, -4			; RV64IA-NEXT: andi a2, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: andi a1, a1, 255			; RV64IA-NEXT: andi a1, a1, 255
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: amoxor.w.aq a1, a1, (a2)			; RV64IA-NEXT: amoxor.w.aq a1, a1, (a2)
	; RV64IA-NEXT: srlw a0, a1, a0			; RV64IA-NEXT: srlw a0, a1, a0
	; RV64IA-NEXT: ret			; RV64IA-NEXT: ret
	%1 = atomicrmw xor i8* %a, i8 %b acquire			%1 = atomicrmw xor i8* %a, i8 %b acquire
	ret i8 %1			ret i8 %1
	}			}
	Show All 27 Lines
	; RV64I-NEXT: call __atomic_fetch_xor_1@plt			; RV64I-NEXT: call __atomic_fetch_xor_1@plt
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: atomicrmw_xor_i8_release:			; RV64IA-LABEL: atomicrmw_xor_i8_release:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a2, a0, -4			; RV64IA-NEXT: andi a2, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: andi a1, a1, 255			; RV64IA-NEXT: andi a1, a1, 255
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: amoxor.w.rl a1, a1, (a2)			; RV64IA-NEXT: amoxor.w.rl a1, a1, (a2)
	; RV64IA-NEXT: srlw a0, a1, a0			; RV64IA-NEXT: srlw a0, a1, a0
	; RV64IA-NEXT: ret			; RV64IA-NEXT: ret
	%1 = atomicrmw xor i8* %a, i8 %b release			%1 = atomicrmw xor i8* %a, i8 %b release
	ret i8 %1			ret i8 %1
	}			}
	Show All 27 Lines
	; RV64I-NEXT: call __atomic_fetch_xor_1@plt			; RV64I-NEXT: call __atomic_fetch_xor_1@plt
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: atomicrmw_xor_i8_acq_rel:			; RV64IA-LABEL: atomicrmw_xor_i8_acq_rel:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a2, a0, -4			; RV64IA-NEXT: andi a2, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: andi a1, a1, 255			; RV64IA-NEXT: andi a1, a1, 255
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: amoxor.w.aqrl a1, a1, (a2)			; RV64IA-NEXT: amoxor.w.aqrl a1, a1, (a2)
	; RV64IA-NEXT: srlw a0, a1, a0			; RV64IA-NEXT: srlw a0, a1, a0
	; RV64IA-NEXT: ret			; RV64IA-NEXT: ret
	%1 = atomicrmw xor i8* %a, i8 %b acq_rel			%1 = atomicrmw xor i8* %a, i8 %b acq_rel
	ret i8 %1			ret i8 %1
	}			}
	Show All 27 Lines
	; RV64I-NEXT: call __atomic_fetch_xor_1@plt			; RV64I-NEXT: call __atomic_fetch_xor_1@plt
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: atomicrmw_xor_i8_seq_cst:			; RV64IA-LABEL: atomicrmw_xor_i8_seq_cst:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a2, a0, -4			; RV64IA-NEXT: andi a2, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: andi a1, a1, 255			; RV64IA-NEXT: andi a1, a1, 255
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: amoxor.w.aqrl a1, a1, (a2)			; RV64IA-NEXT: amoxor.w.aqrl a1, a1, (a2)
	; RV64IA-NEXT: srlw a0, a1, a0			; RV64IA-NEXT: srlw a0, a1, a0
	; RV64IA-NEXT: ret			; RV64IA-NEXT: ret
	%1 = atomicrmw xor i8* %a, i8 %b seq_cst			%1 = atomicrmw xor i8* %a, i8 %b seq_cst
	ret i8 %1			ret i8 %1
	}			}
	▲ Show 20 Lines • Show All 1,581 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: ld s0, 32(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld s0, 32(sp) # 8-byte Folded Reload
	; RV64I-NEXT: ld ra, 40(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 40(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 48			; RV64I-NEXT: addi sp, sp, 48
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: atomicrmw_umax_i8_monotonic:			; RV64IA-LABEL: atomicrmw_umax_i8_monotonic:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a6, a0, -4			; RV64IA-NEXT: andi a6, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: addi a3, zero, 255			; RV64IA-NEXT: addi a3, zero, 255
	; RV64IA-NEXT: sllw a3, a3, a0			; RV64IA-NEXT: sllw a3, a3, a0
	; RV64IA-NEXT: andi a1, a1, 255			; RV64IA-NEXT: andi a1, a1, 255
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: .LBB45_1: # =>This Inner Loop Header: Depth=1			; RV64IA-NEXT: .LBB45_1: # =>This Inner Loop Header: Depth=1
	; RV64IA-NEXT: lr.w a4, (a6)			; RV64IA-NEXT: lr.w a4, (a6)
	; RV64IA-NEXT: and a2, a4, a3			; RV64IA-NEXT: and a2, a4, a3
	; RV64IA-NEXT: mv a5, a4			; RV64IA-NEXT: mv a5, a4
	▲ Show 20 Lines • Show All 115 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: ld s0, 32(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld s0, 32(sp) # 8-byte Folded Reload
	; RV64I-NEXT: ld ra, 40(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 40(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 48			; RV64I-NEXT: addi sp, sp, 48
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: atomicrmw_umax_i8_acquire:			; RV64IA-LABEL: atomicrmw_umax_i8_acquire:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a6, a0, -4			; RV64IA-NEXT: andi a6, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: addi a3, zero, 255			; RV64IA-NEXT: addi a3, zero, 255
	; RV64IA-NEXT: sllw a3, a3, a0			; RV64IA-NEXT: sllw a3, a3, a0
	; RV64IA-NEXT: andi a1, a1, 255			; RV64IA-NEXT: andi a1, a1, 255
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: .LBB46_1: # =>This Inner Loop Header: Depth=1			; RV64IA-NEXT: .LBB46_1: # =>This Inner Loop Header: Depth=1
	; RV64IA-NEXT: lr.w.aq a4, (a6)			; RV64IA-NEXT: lr.w.aq a4, (a6)
	; RV64IA-NEXT: and a2, a4, a3			; RV64IA-NEXT: and a2, a4, a3
	; RV64IA-NEXT: mv a5, a4			; RV64IA-NEXT: mv a5, a4
	▲ Show 20 Lines • Show All 115 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: ld s0, 32(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld s0, 32(sp) # 8-byte Folded Reload
	; RV64I-NEXT: ld ra, 40(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 40(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 48			; RV64I-NEXT: addi sp, sp, 48
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: atomicrmw_umax_i8_release:			; RV64IA-LABEL: atomicrmw_umax_i8_release:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a6, a0, -4			; RV64IA-NEXT: andi a6, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: addi a3, zero, 255			; RV64IA-NEXT: addi a3, zero, 255
	; RV64IA-NEXT: sllw a3, a3, a0			; RV64IA-NEXT: sllw a3, a3, a0
	; RV64IA-NEXT: andi a1, a1, 255			; RV64IA-NEXT: andi a1, a1, 255
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: .LBB47_1: # =>This Inner Loop Header: Depth=1			; RV64IA-NEXT: .LBB47_1: # =>This Inner Loop Header: Depth=1
	; RV64IA-NEXT: lr.w a4, (a6)			; RV64IA-NEXT: lr.w a4, (a6)
	; RV64IA-NEXT: and a2, a4, a3			; RV64IA-NEXT: and a2, a4, a3
	; RV64IA-NEXT: mv a5, a4			; RV64IA-NEXT: mv a5, a4
	▲ Show 20 Lines • Show All 115 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: ld s0, 32(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld s0, 32(sp) # 8-byte Folded Reload
	; RV64I-NEXT: ld ra, 40(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 40(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 48			; RV64I-NEXT: addi sp, sp, 48
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: atomicrmw_umax_i8_acq_rel:			; RV64IA-LABEL: atomicrmw_umax_i8_acq_rel:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a6, a0, -4			; RV64IA-NEXT: andi a6, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: addi a3, zero, 255			; RV64IA-NEXT: addi a3, zero, 255
	; RV64IA-NEXT: sllw a3, a3, a0			; RV64IA-NEXT: sllw a3, a3, a0
	; RV64IA-NEXT: andi a1, a1, 255			; RV64IA-NEXT: andi a1, a1, 255
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: .LBB48_1: # =>This Inner Loop Header: Depth=1			; RV64IA-NEXT: .LBB48_1: # =>This Inner Loop Header: Depth=1
	; RV64IA-NEXT: lr.w.aq a4, (a6)			; RV64IA-NEXT: lr.w.aq a4, (a6)
	; RV64IA-NEXT: and a2, a4, a3			; RV64IA-NEXT: and a2, a4, a3
	; RV64IA-NEXT: mv a5, a4			; RV64IA-NEXT: mv a5, a4
	▲ Show 20 Lines • Show All 115 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: ld s0, 32(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld s0, 32(sp) # 8-byte Folded Reload
	; RV64I-NEXT: ld ra, 40(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 40(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 48			; RV64I-NEXT: addi sp, sp, 48
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: atomicrmw_umax_i8_seq_cst:			; RV64IA-LABEL: atomicrmw_umax_i8_seq_cst:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a6, a0, -4			; RV64IA-NEXT: andi a6, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: addi a3, zero, 255			; RV64IA-NEXT: addi a3, zero, 255
	; RV64IA-NEXT: sllw a3, a3, a0			; RV64IA-NEXT: sllw a3, a3, a0
	; RV64IA-NEXT: andi a1, a1, 255			; RV64IA-NEXT: andi a1, a1, 255
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: .LBB49_1: # =>This Inner Loop Header: Depth=1			; RV64IA-NEXT: .LBB49_1: # =>This Inner Loop Header: Depth=1
	; RV64IA-NEXT: lr.w.aqrl a4, (a6)			; RV64IA-NEXT: lr.w.aqrl a4, (a6)
	; RV64IA-NEXT: and a2, a4, a3			; RV64IA-NEXT: and a2, a4, a3
	; RV64IA-NEXT: mv a5, a4			; RV64IA-NEXT: mv a5, a4
	▲ Show 20 Lines • Show All 115 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: ld s0, 32(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld s0, 32(sp) # 8-byte Folded Reload
	; RV64I-NEXT: ld ra, 40(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 40(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 48			; RV64I-NEXT: addi sp, sp, 48
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: atomicrmw_umin_i8_monotonic:			; RV64IA-LABEL: atomicrmw_umin_i8_monotonic:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a6, a0, -4			; RV64IA-NEXT: andi a6, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: addi a3, zero, 255			; RV64IA-NEXT: addi a3, zero, 255
	; RV64IA-NEXT: sllw a3, a3, a0			; RV64IA-NEXT: sllw a3, a3, a0
	; RV64IA-NEXT: andi a1, a1, 255			; RV64IA-NEXT: andi a1, a1, 255
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: .LBB50_1: # =>This Inner Loop Header: Depth=1			; RV64IA-NEXT: .LBB50_1: # =>This Inner Loop Header: Depth=1
	; RV64IA-NEXT: lr.w a4, (a6)			; RV64IA-NEXT: lr.w a4, (a6)
	; RV64IA-NEXT: and a2, a4, a3			; RV64IA-NEXT: and a2, a4, a3
	; RV64IA-NEXT: mv a5, a4			; RV64IA-NEXT: mv a5, a4
	▲ Show 20 Lines • Show All 115 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: ld s0, 32(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld s0, 32(sp) # 8-byte Folded Reload
	; RV64I-NEXT: ld ra, 40(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 40(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 48			; RV64I-NEXT: addi sp, sp, 48
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: atomicrmw_umin_i8_acquire:			; RV64IA-LABEL: atomicrmw_umin_i8_acquire:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a6, a0, -4			; RV64IA-NEXT: andi a6, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: addi a3, zero, 255			; RV64IA-NEXT: addi a3, zero, 255
	; RV64IA-NEXT: sllw a3, a3, a0			; RV64IA-NEXT: sllw a3, a3, a0
	; RV64IA-NEXT: andi a1, a1, 255			; RV64IA-NEXT: andi a1, a1, 255
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: .LBB51_1: # =>This Inner Loop Header: Depth=1			; RV64IA-NEXT: .LBB51_1: # =>This Inner Loop Header: Depth=1
	; RV64IA-NEXT: lr.w.aq a4, (a6)			; RV64IA-NEXT: lr.w.aq a4, (a6)
	; RV64IA-NEXT: and a2, a4, a3			; RV64IA-NEXT: and a2, a4, a3
	; RV64IA-NEXT: mv a5, a4			; RV64IA-NEXT: mv a5, a4
	▲ Show 20 Lines • Show All 115 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: ld s0, 32(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld s0, 32(sp) # 8-byte Folded Reload
	; RV64I-NEXT: ld ra, 40(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 40(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 48			; RV64I-NEXT: addi sp, sp, 48
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: atomicrmw_umin_i8_release:			; RV64IA-LABEL: atomicrmw_umin_i8_release:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a6, a0, -4			; RV64IA-NEXT: andi a6, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: addi a3, zero, 255			; RV64IA-NEXT: addi a3, zero, 255
	; RV64IA-NEXT: sllw a3, a3, a0			; RV64IA-NEXT: sllw a3, a3, a0
	; RV64IA-NEXT: andi a1, a1, 255			; RV64IA-NEXT: andi a1, a1, 255
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: .LBB52_1: # =>This Inner Loop Header: Depth=1			; RV64IA-NEXT: .LBB52_1: # =>This Inner Loop Header: Depth=1
	; RV64IA-NEXT: lr.w a4, (a6)			; RV64IA-NEXT: lr.w a4, (a6)
	; RV64IA-NEXT: and a2, a4, a3			; RV64IA-NEXT: and a2, a4, a3
	; RV64IA-NEXT: mv a5, a4			; RV64IA-NEXT: mv a5, a4
	▲ Show 20 Lines • Show All 115 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: ld s0, 32(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld s0, 32(sp) # 8-byte Folded Reload
	; RV64I-NEXT: ld ra, 40(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 40(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 48			; RV64I-NEXT: addi sp, sp, 48
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: atomicrmw_umin_i8_acq_rel:			; RV64IA-LABEL: atomicrmw_umin_i8_acq_rel:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a6, a0, -4			; RV64IA-NEXT: andi a6, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: addi a3, zero, 255			; RV64IA-NEXT: addi a3, zero, 255
	; RV64IA-NEXT: sllw a3, a3, a0			; RV64IA-NEXT: sllw a3, a3, a0
	; RV64IA-NEXT: andi a1, a1, 255			; RV64IA-NEXT: andi a1, a1, 255
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: .LBB53_1: # =>This Inner Loop Header: Depth=1			; RV64IA-NEXT: .LBB53_1: # =>This Inner Loop Header: Depth=1
	; RV64IA-NEXT: lr.w.aq a4, (a6)			; RV64IA-NEXT: lr.w.aq a4, (a6)
	; RV64IA-NEXT: and a2, a4, a3			; RV64IA-NEXT: and a2, a4, a3
	; RV64IA-NEXT: mv a5, a4			; RV64IA-NEXT: mv a5, a4
	▲ Show 20 Lines • Show All 115 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: ld s0, 32(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld s0, 32(sp) # 8-byte Folded Reload
	; RV64I-NEXT: ld ra, 40(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 40(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 48			; RV64I-NEXT: addi sp, sp, 48
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: atomicrmw_umin_i8_seq_cst:			; RV64IA-LABEL: atomicrmw_umin_i8_seq_cst:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a6, a0, -4			; RV64IA-NEXT: andi a6, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: addi a3, zero, 255			; RV64IA-NEXT: addi a3, zero, 255
	; RV64IA-NEXT: sllw a3, a3, a0			; RV64IA-NEXT: sllw a3, a3, a0
	; RV64IA-NEXT: andi a1, a1, 255			; RV64IA-NEXT: andi a1, a1, 255
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: .LBB54_1: # =>This Inner Loop Header: Depth=1			; RV64IA-NEXT: .LBB54_1: # =>This Inner Loop Header: Depth=1
	; RV64IA-NEXT: lr.w.aqrl a4, (a6)			; RV64IA-NEXT: lr.w.aqrl a4, (a6)
	; RV64IA-NEXT: and a2, a4, a3			; RV64IA-NEXT: and a2, a4, a3
	; RV64IA-NEXT: mv a5, a4			; RV64IA-NEXT: mv a5, a4
	▲ Show 20 Lines • Show All 52 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: call __atomic_exchange_2@plt			; RV64I-NEXT: call __atomic_exchange_2@plt
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: atomicrmw_xchg_i16_monotonic:			; RV64IA-LABEL: atomicrmw_xchg_i16_monotonic:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a2, a0, -4			; RV64IA-NEXT: andi a2, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: lui a3, 16			; RV64IA-NEXT: lui a3, 16
	; RV64IA-NEXT: addiw a3, a3, -1			; RV64IA-NEXT: addiw a3, a3, -1
	; RV64IA-NEXT: sllw a4, a3, a0			; RV64IA-NEXT: sllw a4, a3, a0
	; RV64IA-NEXT: and a1, a1, a3			; RV64IA-NEXT: and a1, a1, a3
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: .LBB55_1: # =>This Inner Loop Header: Depth=1			; RV64IA-NEXT: .LBB55_1: # =>This Inner Loop Header: Depth=1
	; RV64IA-NEXT: lr.w a3, (a2)			; RV64IA-NEXT: lr.w a3, (a2)
	; RV64IA-NEXT: mv a5, a1			; RV64IA-NEXT: mv a5, a1
	▲ Show 20 Lines • Show All 49 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: call __atomic_exchange_2@plt			; RV64I-NEXT: call __atomic_exchange_2@plt
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: atomicrmw_xchg_i16_acquire:			; RV64IA-LABEL: atomicrmw_xchg_i16_acquire:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a2, a0, -4			; RV64IA-NEXT: andi a2, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: lui a3, 16			; RV64IA-NEXT: lui a3, 16
	; RV64IA-NEXT: addiw a3, a3, -1			; RV64IA-NEXT: addiw a3, a3, -1
	; RV64IA-NEXT: sllw a4, a3, a0			; RV64IA-NEXT: sllw a4, a3, a0
	; RV64IA-NEXT: and a1, a1, a3			; RV64IA-NEXT: and a1, a1, a3
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: .LBB56_1: # =>This Inner Loop Header: Depth=1			; RV64IA-NEXT: .LBB56_1: # =>This Inner Loop Header: Depth=1
	; RV64IA-NEXT: lr.w.aq a3, (a2)			; RV64IA-NEXT: lr.w.aq a3, (a2)
	; RV64IA-NEXT: mv a5, a1			; RV64IA-NEXT: mv a5, a1
	▲ Show 20 Lines • Show All 49 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: call __atomic_exchange_2@plt			; RV64I-NEXT: call __atomic_exchange_2@plt
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: atomicrmw_xchg_i16_release:			; RV64IA-LABEL: atomicrmw_xchg_i16_release:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a2, a0, -4			; RV64IA-NEXT: andi a2, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: lui a3, 16			; RV64IA-NEXT: lui a3, 16
	; RV64IA-NEXT: addiw a3, a3, -1			; RV64IA-NEXT: addiw a3, a3, -1
	; RV64IA-NEXT: sllw a4, a3, a0			; RV64IA-NEXT: sllw a4, a3, a0
	; RV64IA-NEXT: and a1, a1, a3			; RV64IA-NEXT: and a1, a1, a3
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: .LBB57_1: # =>This Inner Loop Header: Depth=1			; RV64IA-NEXT: .LBB57_1: # =>This Inner Loop Header: Depth=1
	; RV64IA-NEXT: lr.w a3, (a2)			; RV64IA-NEXT: lr.w a3, (a2)
	; RV64IA-NEXT: mv a5, a1			; RV64IA-NEXT: mv a5, a1
	▲ Show 20 Lines • Show All 49 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: call __atomic_exchange_2@plt			; RV64I-NEXT: call __atomic_exchange_2@plt
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: atomicrmw_xchg_i16_acq_rel:			; RV64IA-LABEL: atomicrmw_xchg_i16_acq_rel:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a2, a0, -4			; RV64IA-NEXT: andi a2, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: lui a3, 16			; RV64IA-NEXT: lui a3, 16
	; RV64IA-NEXT: addiw a3, a3, -1			; RV64IA-NEXT: addiw a3, a3, -1
	; RV64IA-NEXT: sllw a4, a3, a0			; RV64IA-NEXT: sllw a4, a3, a0
	; RV64IA-NEXT: and a1, a1, a3			; RV64IA-NEXT: and a1, a1, a3
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: .LBB58_1: # =>This Inner Loop Header: Depth=1			; RV64IA-NEXT: .LBB58_1: # =>This Inner Loop Header: Depth=1
	; RV64IA-NEXT: lr.w.aq a3, (a2)			; RV64IA-NEXT: lr.w.aq a3, (a2)
	; RV64IA-NEXT: mv a5, a1			; RV64IA-NEXT: mv a5, a1
	▲ Show 20 Lines • Show All 49 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: call __atomic_exchange_2@plt			; RV64I-NEXT: call __atomic_exchange_2@plt
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: atomicrmw_xchg_i16_seq_cst:			; RV64IA-LABEL: atomicrmw_xchg_i16_seq_cst:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a2, a0, -4			; RV64IA-NEXT: andi a2, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: lui a3, 16			; RV64IA-NEXT: lui a3, 16
	; RV64IA-NEXT: addiw a3, a3, -1			; RV64IA-NEXT: addiw a3, a3, -1
	; RV64IA-NEXT: sllw a4, a3, a0			; RV64IA-NEXT: sllw a4, a3, a0
	; RV64IA-NEXT: and a1, a1, a3			; RV64IA-NEXT: and a1, a1, a3
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: .LBB59_1: # =>This Inner Loop Header: Depth=1			; RV64IA-NEXT: .LBB59_1: # =>This Inner Loop Header: Depth=1
	; RV64IA-NEXT: lr.w.aqrl a3, (a2)			; RV64IA-NEXT: lr.w.aqrl a3, (a2)
	; RV64IA-NEXT: mv a5, a1			; RV64IA-NEXT: mv a5, a1
	▲ Show 20 Lines • Show All 49 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: call __atomic_fetch_add_2@plt			; RV64I-NEXT: call __atomic_fetch_add_2@plt
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: atomicrmw_add_i16_monotonic:			; RV64IA-LABEL: atomicrmw_add_i16_monotonic:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a2, a0, -4			; RV64IA-NEXT: andi a2, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: lui a3, 16			; RV64IA-NEXT: lui a3, 16
	; RV64IA-NEXT: addiw a3, a3, -1			; RV64IA-NEXT: addiw a3, a3, -1
	; RV64IA-NEXT: sllw a4, a3, a0			; RV64IA-NEXT: sllw a4, a3, a0
	; RV64IA-NEXT: and a1, a1, a3			; RV64IA-NEXT: and a1, a1, a3
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: .LBB60_1: # =>This Inner Loop Header: Depth=1			; RV64IA-NEXT: .LBB60_1: # =>This Inner Loop Header: Depth=1
	; RV64IA-NEXT: lr.w a3, (a2)			; RV64IA-NEXT: lr.w a3, (a2)
	; RV64IA-NEXT: add a5, a3, a1			; RV64IA-NEXT: add a5, a3, a1
	▲ Show 20 Lines • Show All 49 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: call __atomic_fetch_add_2@plt			; RV64I-NEXT: call __atomic_fetch_add_2@plt
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: atomicrmw_add_i16_acquire:			; RV64IA-LABEL: atomicrmw_add_i16_acquire:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a2, a0, -4			; RV64IA-NEXT: andi a2, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: lui a3, 16			; RV64IA-NEXT: lui a3, 16
	; RV64IA-NEXT: addiw a3, a3, -1			; RV64IA-NEXT: addiw a3, a3, -1
	; RV64IA-NEXT: sllw a4, a3, a0			; RV64IA-NEXT: sllw a4, a3, a0
	; RV64IA-NEXT: and a1, a1, a3			; RV64IA-NEXT: and a1, a1, a3
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: .LBB61_1: # =>This Inner Loop Header: Depth=1			; RV64IA-NEXT: .LBB61_1: # =>This Inner Loop Header: Depth=1
	; RV64IA-NEXT: lr.w.aq a3, (a2)			; RV64IA-NEXT: lr.w.aq a3, (a2)
	; RV64IA-NEXT: add a5, a3, a1			; RV64IA-NEXT: add a5, a3, a1
	▲ Show 20 Lines • Show All 49 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: call __atomic_fetch_add_2@plt			; RV64I-NEXT: call __atomic_fetch_add_2@plt
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: atomicrmw_add_i16_release:			; RV64IA-LABEL: atomicrmw_add_i16_release:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a2, a0, -4			; RV64IA-NEXT: andi a2, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: lui a3, 16			; RV64IA-NEXT: lui a3, 16
	; RV64IA-NEXT: addiw a3, a3, -1			; RV64IA-NEXT: addiw a3, a3, -1
	; RV64IA-NEXT: sllw a4, a3, a0			; RV64IA-NEXT: sllw a4, a3, a0
	; RV64IA-NEXT: and a1, a1, a3			; RV64IA-NEXT: and a1, a1, a3
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: .LBB62_1: # =>This Inner Loop Header: Depth=1			; RV64IA-NEXT: .LBB62_1: # =>This Inner Loop Header: Depth=1
	; RV64IA-NEXT: lr.w a3, (a2)			; RV64IA-NEXT: lr.w a3, (a2)
	; RV64IA-NEXT: add a5, a3, a1			; RV64IA-NEXT: add a5, a3, a1
	▲ Show 20 Lines • Show All 49 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: call __atomic_fetch_add_2@plt			; RV64I-NEXT: call __atomic_fetch_add_2@plt
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: atomicrmw_add_i16_acq_rel:			; RV64IA-LABEL: atomicrmw_add_i16_acq_rel:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a2, a0, -4			; RV64IA-NEXT: andi a2, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: lui a3, 16			; RV64IA-NEXT: lui a3, 16
	; RV64IA-NEXT: addiw a3, a3, -1			; RV64IA-NEXT: addiw a3, a3, -1
	; RV64IA-NEXT: sllw a4, a3, a0			; RV64IA-NEXT: sllw a4, a3, a0
	; RV64IA-NEXT: and a1, a1, a3			; RV64IA-NEXT: and a1, a1, a3
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: .LBB63_1: # =>This Inner Loop Header: Depth=1			; RV64IA-NEXT: .LBB63_1: # =>This Inner Loop Header: Depth=1
	; RV64IA-NEXT: lr.w.aq a3, (a2)			; RV64IA-NEXT: lr.w.aq a3, (a2)
	; RV64IA-NEXT: add a5, a3, a1			; RV64IA-NEXT: add a5, a3, a1
	▲ Show 20 Lines • Show All 49 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: call __atomic_fetch_add_2@plt			; RV64I-NEXT: call __atomic_fetch_add_2@plt
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: atomicrmw_add_i16_seq_cst:			; RV64IA-LABEL: atomicrmw_add_i16_seq_cst:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a2, a0, -4			; RV64IA-NEXT: andi a2, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: lui a3, 16			; RV64IA-NEXT: lui a3, 16
	; RV64IA-NEXT: addiw a3, a3, -1			; RV64IA-NEXT: addiw a3, a3, -1
	; RV64IA-NEXT: sllw a4, a3, a0			; RV64IA-NEXT: sllw a4, a3, a0
	; RV64IA-NEXT: and a1, a1, a3			; RV64IA-NEXT: and a1, a1, a3
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: .LBB64_1: # =>This Inner Loop Header: Depth=1			; RV64IA-NEXT: .LBB64_1: # =>This Inner Loop Header: Depth=1
	; RV64IA-NEXT: lr.w.aqrl a3, (a2)			; RV64IA-NEXT: lr.w.aqrl a3, (a2)
	; RV64IA-NEXT: add a5, a3, a1			; RV64IA-NEXT: add a5, a3, a1
	▲ Show 20 Lines • Show All 49 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: call __atomic_fetch_sub_2@plt			; RV64I-NEXT: call __atomic_fetch_sub_2@plt
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: atomicrmw_sub_i16_monotonic:			; RV64IA-LABEL: atomicrmw_sub_i16_monotonic:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a2, a0, -4			; RV64IA-NEXT: andi a2, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: lui a3, 16			; RV64IA-NEXT: lui a3, 16
	; RV64IA-NEXT: addiw a3, a3, -1			; RV64IA-NEXT: addiw a3, a3, -1
	; RV64IA-NEXT: sllw a4, a3, a0			; RV64IA-NEXT: sllw a4, a3, a0
	; RV64IA-NEXT: and a1, a1, a3			; RV64IA-NEXT: and a1, a1, a3
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: .LBB65_1: # =>This Inner Loop Header: Depth=1			; RV64IA-NEXT: .LBB65_1: # =>This Inner Loop Header: Depth=1
	; RV64IA-NEXT: lr.w a3, (a2)			; RV64IA-NEXT: lr.w a3, (a2)
	; RV64IA-NEXT: sub a5, a3, a1			; RV64IA-NEXT: sub a5, a3, a1
	▲ Show 20 Lines • Show All 49 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: call __atomic_fetch_sub_2@plt			; RV64I-NEXT: call __atomic_fetch_sub_2@plt
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: atomicrmw_sub_i16_acquire:			; RV64IA-LABEL: atomicrmw_sub_i16_acquire:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a2, a0, -4			; RV64IA-NEXT: andi a2, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: lui a3, 16			; RV64IA-NEXT: lui a3, 16
	; RV64IA-NEXT: addiw a3, a3, -1			; RV64IA-NEXT: addiw a3, a3, -1
	; RV64IA-NEXT: sllw a4, a3, a0			; RV64IA-NEXT: sllw a4, a3, a0
	; RV64IA-NEXT: and a1, a1, a3			; RV64IA-NEXT: and a1, a1, a3
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: .LBB66_1: # =>This Inner Loop Header: Depth=1			; RV64IA-NEXT: .LBB66_1: # =>This Inner Loop Header: Depth=1
	; RV64IA-NEXT: lr.w.aq a3, (a2)			; RV64IA-NEXT: lr.w.aq a3, (a2)
	; RV64IA-NEXT: sub a5, a3, a1			; RV64IA-NEXT: sub a5, a3, a1
	▲ Show 20 Lines • Show All 49 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: call __atomic_fetch_sub_2@plt			; RV64I-NEXT: call __atomic_fetch_sub_2@plt
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: atomicrmw_sub_i16_release:			; RV64IA-LABEL: atomicrmw_sub_i16_release:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a2, a0, -4			; RV64IA-NEXT: andi a2, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: lui a3, 16			; RV64IA-NEXT: lui a3, 16
	; RV64IA-NEXT: addiw a3, a3, -1			; RV64IA-NEXT: addiw a3, a3, -1
	; RV64IA-NEXT: sllw a4, a3, a0			; RV64IA-NEXT: sllw a4, a3, a0
	; RV64IA-NEXT: and a1, a1, a3			; RV64IA-NEXT: and a1, a1, a3
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: .LBB67_1: # =>This Inner Loop Header: Depth=1			; RV64IA-NEXT: .LBB67_1: # =>This Inner Loop Header: Depth=1
	; RV64IA-NEXT: lr.w a3, (a2)			; RV64IA-NEXT: lr.w a3, (a2)
	; RV64IA-NEXT: sub a5, a3, a1			; RV64IA-NEXT: sub a5, a3, a1
	▲ Show 20 Lines • Show All 49 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: call __atomic_fetch_sub_2@plt			; RV64I-NEXT: call __atomic_fetch_sub_2@plt
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: atomicrmw_sub_i16_acq_rel:			; RV64IA-LABEL: atomicrmw_sub_i16_acq_rel:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a2, a0, -4			; RV64IA-NEXT: andi a2, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: lui a3, 16			; RV64IA-NEXT: lui a3, 16
	; RV64IA-NEXT: addiw a3, a3, -1			; RV64IA-NEXT: addiw a3, a3, -1
	; RV64IA-NEXT: sllw a4, a3, a0			; RV64IA-NEXT: sllw a4, a3, a0
	; RV64IA-NEXT: and a1, a1, a3			; RV64IA-NEXT: and a1, a1, a3
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: .LBB68_1: # =>This Inner Loop Header: Depth=1			; RV64IA-NEXT: .LBB68_1: # =>This Inner Loop Header: Depth=1
	; RV64IA-NEXT: lr.w.aq a3, (a2)			; RV64IA-NEXT: lr.w.aq a3, (a2)
	; RV64IA-NEXT: sub a5, a3, a1			; RV64IA-NEXT: sub a5, a3, a1
	▲ Show 20 Lines • Show All 49 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: call __atomic_fetch_sub_2@plt			; RV64I-NEXT: call __atomic_fetch_sub_2@plt
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: atomicrmw_sub_i16_seq_cst:			; RV64IA-LABEL: atomicrmw_sub_i16_seq_cst:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a2, a0, -4			; RV64IA-NEXT: andi a2, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: lui a3, 16			; RV64IA-NEXT: lui a3, 16
	; RV64IA-NEXT: addiw a3, a3, -1			; RV64IA-NEXT: addiw a3, a3, -1
	; RV64IA-NEXT: sllw a4, a3, a0			; RV64IA-NEXT: sllw a4, a3, a0
	; RV64IA-NEXT: and a1, a1, a3			; RV64IA-NEXT: and a1, a1, a3
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: .LBB69_1: # =>This Inner Loop Header: Depth=1			; RV64IA-NEXT: .LBB69_1: # =>This Inner Loop Header: Depth=1
	; RV64IA-NEXT: lr.w.aqrl a3, (a2)			; RV64IA-NEXT: lr.w.aqrl a3, (a2)
	; RV64IA-NEXT: sub a5, a3, a1			; RV64IA-NEXT: sub a5, a3, a1
	▲ Show 20 Lines • Show All 43 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: call __atomic_fetch_and_2@plt			; RV64I-NEXT: call __atomic_fetch_and_2@plt
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: atomicrmw_and_i16_monotonic:			; RV64IA-LABEL: atomicrmw_and_i16_monotonic:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a2, a0, -4			; RV64IA-NEXT: andi a2, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: lui a3, 16			; RV64IA-NEXT: lui a3, 16
	; RV64IA-NEXT: addiw a3, a3, -1			; RV64IA-NEXT: addiw a3, a3, -1
	; RV64IA-NEXT: sllw a4, a3, a0			; RV64IA-NEXT: sllw a4, a3, a0
	; RV64IA-NEXT: not a4, a4			; RV64IA-NEXT: not a4, a4
	; RV64IA-NEXT: and a1, a1, a3			; RV64IA-NEXT: and a1, a1, a3
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: or a1, a4, a1			; RV64IA-NEXT: or a1, a4, a1
	; RV64IA-NEXT: amoand.w a1, a1, (a2)			; RV64IA-NEXT: amoand.w a1, a1, (a2)
	Show All 37 Lines
	; RV64I-NEXT: call __atomic_fetch_and_2@plt			; RV64I-NEXT: call __atomic_fetch_and_2@plt
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: atomicrmw_and_i16_acquire:			; RV64IA-LABEL: atomicrmw_and_i16_acquire:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a2, a0, -4			; RV64IA-NEXT: andi a2, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: lui a3, 16			; RV64IA-NEXT: lui a3, 16
	; RV64IA-NEXT: addiw a3, a3, -1			; RV64IA-NEXT: addiw a3, a3, -1
	; RV64IA-NEXT: sllw a4, a3, a0			; RV64IA-NEXT: sllw a4, a3, a0
	; RV64IA-NEXT: not a4, a4			; RV64IA-NEXT: not a4, a4
	; RV64IA-NEXT: and a1, a1, a3			; RV64IA-NEXT: and a1, a1, a3
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: or a1, a4, a1			; RV64IA-NEXT: or a1, a4, a1
	; RV64IA-NEXT: amoand.w.aq a1, a1, (a2)			; RV64IA-NEXT: amoand.w.aq a1, a1, (a2)
	Show All 37 Lines
	; RV64I-NEXT: call __atomic_fetch_and_2@plt			; RV64I-NEXT: call __atomic_fetch_and_2@plt
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: atomicrmw_and_i16_release:			; RV64IA-LABEL: atomicrmw_and_i16_release:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a2, a0, -4			; RV64IA-NEXT: andi a2, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: lui a3, 16			; RV64IA-NEXT: lui a3, 16
	; RV64IA-NEXT: addiw a3, a3, -1			; RV64IA-NEXT: addiw a3, a3, -1
	; RV64IA-NEXT: sllw a4, a3, a0			; RV64IA-NEXT: sllw a4, a3, a0
	; RV64IA-NEXT: not a4, a4			; RV64IA-NEXT: not a4, a4
	; RV64IA-NEXT: and a1, a1, a3			; RV64IA-NEXT: and a1, a1, a3
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: or a1, a4, a1			; RV64IA-NEXT: or a1, a4, a1
	; RV64IA-NEXT: amoand.w.rl a1, a1, (a2)			; RV64IA-NEXT: amoand.w.rl a1, a1, (a2)
	Show All 37 Lines
	; RV64I-NEXT: call __atomic_fetch_and_2@plt			; RV64I-NEXT: call __atomic_fetch_and_2@plt
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: atomicrmw_and_i16_acq_rel:			; RV64IA-LABEL: atomicrmw_and_i16_acq_rel:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a2, a0, -4			; RV64IA-NEXT: andi a2, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: lui a3, 16			; RV64IA-NEXT: lui a3, 16
	; RV64IA-NEXT: addiw a3, a3, -1			; RV64IA-NEXT: addiw a3, a3, -1
	; RV64IA-NEXT: sllw a4, a3, a0			; RV64IA-NEXT: sllw a4, a3, a0
	; RV64IA-NEXT: not a4, a4			; RV64IA-NEXT: not a4, a4
	; RV64IA-NEXT: and a1, a1, a3			; RV64IA-NEXT: and a1, a1, a3
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: or a1, a4, a1			; RV64IA-NEXT: or a1, a4, a1
	; RV64IA-NEXT: amoand.w.aqrl a1, a1, (a2)			; RV64IA-NEXT: amoand.w.aqrl a1, a1, (a2)
	Show All 37 Lines
	; RV64I-NEXT: call __atomic_fetch_and_2@plt			; RV64I-NEXT: call __atomic_fetch_and_2@plt
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: atomicrmw_and_i16_seq_cst:			; RV64IA-LABEL: atomicrmw_and_i16_seq_cst:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a2, a0, -4			; RV64IA-NEXT: andi a2, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: lui a3, 16			; RV64IA-NEXT: lui a3, 16
	; RV64IA-NEXT: addiw a3, a3, -1			; RV64IA-NEXT: addiw a3, a3, -1
	; RV64IA-NEXT: sllw a4, a3, a0			; RV64IA-NEXT: sllw a4, a3, a0
	; RV64IA-NEXT: not a4, a4			; RV64IA-NEXT: not a4, a4
	; RV64IA-NEXT: and a1, a1, a3			; RV64IA-NEXT: and a1, a1, a3
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: or a1, a4, a1			; RV64IA-NEXT: or a1, a4, a1
	; RV64IA-NEXT: amoand.w.aqrl a1, a1, (a2)			; RV64IA-NEXT: amoand.w.aqrl a1, a1, (a2)
	▲ Show 20 Lines • Show All 44 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: call __atomic_fetch_nand_2@plt			; RV64I-NEXT: call __atomic_fetch_nand_2@plt
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: atomicrmw_nand_i16_monotonic:			; RV64IA-LABEL: atomicrmw_nand_i16_monotonic:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a2, a0, -4			; RV64IA-NEXT: andi a2, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: lui a3, 16			; RV64IA-NEXT: lui a3, 16
	; RV64IA-NEXT: addiw a3, a3, -1			; RV64IA-NEXT: addiw a3, a3, -1
	; RV64IA-NEXT: sllw a4, a3, a0			; RV64IA-NEXT: sllw a4, a3, a0
	; RV64IA-NEXT: and a1, a1, a3			; RV64IA-NEXT: and a1, a1, a3
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: .LBB75_1: # =>This Inner Loop Header: Depth=1			; RV64IA-NEXT: .LBB75_1: # =>This Inner Loop Header: Depth=1
	; RV64IA-NEXT: lr.w a3, (a2)			; RV64IA-NEXT: lr.w a3, (a2)
	; RV64IA-NEXT: and a5, a3, a1			; RV64IA-NEXT: and a5, a3, a1
	▲ Show 20 Lines • Show All 51 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: call __atomic_fetch_nand_2@plt			; RV64I-NEXT: call __atomic_fetch_nand_2@plt
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: atomicrmw_nand_i16_acquire:			; RV64IA-LABEL: atomicrmw_nand_i16_acquire:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a2, a0, -4			; RV64IA-NEXT: andi a2, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: lui a3, 16			; RV64IA-NEXT: lui a3, 16
	; RV64IA-NEXT: addiw a3, a3, -1			; RV64IA-NEXT: addiw a3, a3, -1
	; RV64IA-NEXT: sllw a4, a3, a0			; RV64IA-NEXT: sllw a4, a3, a0
	; RV64IA-NEXT: and a1, a1, a3			; RV64IA-NEXT: and a1, a1, a3
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: .LBB76_1: # =>This Inner Loop Header: Depth=1			; RV64IA-NEXT: .LBB76_1: # =>This Inner Loop Header: Depth=1
	; RV64IA-NEXT: lr.w.aq a3, (a2)			; RV64IA-NEXT: lr.w.aq a3, (a2)
	; RV64IA-NEXT: and a5, a3, a1			; RV64IA-NEXT: and a5, a3, a1
	▲ Show 20 Lines • Show All 51 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: call __atomic_fetch_nand_2@plt			; RV64I-NEXT: call __atomic_fetch_nand_2@plt
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: atomicrmw_nand_i16_release:			; RV64IA-LABEL: atomicrmw_nand_i16_release:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a2, a0, -4			; RV64IA-NEXT: andi a2, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: lui a3, 16			; RV64IA-NEXT: lui a3, 16
	; RV64IA-NEXT: addiw a3, a3, -1			; RV64IA-NEXT: addiw a3, a3, -1
	; RV64IA-NEXT: sllw a4, a3, a0			; RV64IA-NEXT: sllw a4, a3, a0
	; RV64IA-NEXT: and a1, a1, a3			; RV64IA-NEXT: and a1, a1, a3
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: .LBB77_1: # =>This Inner Loop Header: Depth=1			; RV64IA-NEXT: .LBB77_1: # =>This Inner Loop Header: Depth=1
	; RV64IA-NEXT: lr.w a3, (a2)			; RV64IA-NEXT: lr.w a3, (a2)
	; RV64IA-NEXT: and a5, a3, a1			; RV64IA-NEXT: and a5, a3, a1
	▲ Show 20 Lines • Show All 51 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: call __atomic_fetch_nand_2@plt			; RV64I-NEXT: call __atomic_fetch_nand_2@plt
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: atomicrmw_nand_i16_acq_rel:			; RV64IA-LABEL: atomicrmw_nand_i16_acq_rel:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a2, a0, -4			; RV64IA-NEXT: andi a2, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: lui a3, 16			; RV64IA-NEXT: lui a3, 16
	; RV64IA-NEXT: addiw a3, a3, -1			; RV64IA-NEXT: addiw a3, a3, -1
	; RV64IA-NEXT: sllw a4, a3, a0			; RV64IA-NEXT: sllw a4, a3, a0
	; RV64IA-NEXT: and a1, a1, a3			; RV64IA-NEXT: and a1, a1, a3
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: .LBB78_1: # =>This Inner Loop Header: Depth=1			; RV64IA-NEXT: .LBB78_1: # =>This Inner Loop Header: Depth=1
	; RV64IA-NEXT: lr.w.aq a3, (a2)			; RV64IA-NEXT: lr.w.aq a3, (a2)
	; RV64IA-NEXT: and a5, a3, a1			; RV64IA-NEXT: and a5, a3, a1
	▲ Show 20 Lines • Show All 51 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: call __atomic_fetch_nand_2@plt			; RV64I-NEXT: call __atomic_fetch_nand_2@plt
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: atomicrmw_nand_i16_seq_cst:			; RV64IA-LABEL: atomicrmw_nand_i16_seq_cst:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a2, a0, -4			; RV64IA-NEXT: andi a2, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: lui a3, 16			; RV64IA-NEXT: lui a3, 16
	; RV64IA-NEXT: addiw a3, a3, -1			; RV64IA-NEXT: addiw a3, a3, -1
	; RV64IA-NEXT: sllw a4, a3, a0			; RV64IA-NEXT: sllw a4, a3, a0
	; RV64IA-NEXT: and a1, a1, a3			; RV64IA-NEXT: and a1, a1, a3
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: .LBB79_1: # =>This Inner Loop Header: Depth=1			; RV64IA-NEXT: .LBB79_1: # =>This Inner Loop Header: Depth=1
	; RV64IA-NEXT: lr.w.aqrl a3, (a2)			; RV64IA-NEXT: lr.w.aqrl a3, (a2)
	; RV64IA-NEXT: and a5, a3, a1			; RV64IA-NEXT: and a5, a3, a1
	▲ Show 20 Lines • Show All 41 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: call __atomic_fetch_or_2@plt			; RV64I-NEXT: call __atomic_fetch_or_2@plt
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: atomicrmw_or_i16_monotonic:			; RV64IA-LABEL: atomicrmw_or_i16_monotonic:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a2, a0, -4			; RV64IA-NEXT: andi a2, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: lui a3, 16			; RV64IA-NEXT: lui a3, 16
	; RV64IA-NEXT: addiw a3, a3, -1			; RV64IA-NEXT: addiw a3, a3, -1
	; RV64IA-NEXT: and a1, a1, a3			; RV64IA-NEXT: and a1, a1, a3
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: amoor.w a1, a1, (a2)			; RV64IA-NEXT: amoor.w a1, a1, (a2)
	; RV64IA-NEXT: srlw a0, a1, a0			; RV64IA-NEXT: srlw a0, a1, a0
	; RV64IA-NEXT: ret			; RV64IA-NEXT: ret
	%1 = atomicrmw or i16* %a, i16 %b monotonic			%1 = atomicrmw or i16* %a, i16 %b monotonic
	Show All 31 Lines
	; RV64I-NEXT: call __atomic_fetch_or_2@plt			; RV64I-NEXT: call __atomic_fetch_or_2@plt
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: atomicrmw_or_i16_acquire:			; RV64IA-LABEL: atomicrmw_or_i16_acquire:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a2, a0, -4			; RV64IA-NEXT: andi a2, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: lui a3, 16			; RV64IA-NEXT: lui a3, 16
	; RV64IA-NEXT: addiw a3, a3, -1			; RV64IA-NEXT: addiw a3, a3, -1
	; RV64IA-NEXT: and a1, a1, a3			; RV64IA-NEXT: and a1, a1, a3
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: amoor.w.aq a1, a1, (a2)			; RV64IA-NEXT: amoor.w.aq a1, a1, (a2)
	; RV64IA-NEXT: srlw a0, a1, a0			; RV64IA-NEXT: srlw a0, a1, a0
	; RV64IA-NEXT: ret			; RV64IA-NEXT: ret
	%1 = atomicrmw or i16* %a, i16 %b acquire			%1 = atomicrmw or i16* %a, i16 %b acquire
	Show All 31 Lines
	; RV64I-NEXT: call __atomic_fetch_or_2@plt			; RV64I-NEXT: call __atomic_fetch_or_2@plt
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: atomicrmw_or_i16_release:			; RV64IA-LABEL: atomicrmw_or_i16_release:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a2, a0, -4			; RV64IA-NEXT: andi a2, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: lui a3, 16			; RV64IA-NEXT: lui a3, 16
	; RV64IA-NEXT: addiw a3, a3, -1			; RV64IA-NEXT: addiw a3, a3, -1
	; RV64IA-NEXT: and a1, a1, a3			; RV64IA-NEXT: and a1, a1, a3
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: amoor.w.rl a1, a1, (a2)			; RV64IA-NEXT: amoor.w.rl a1, a1, (a2)
	; RV64IA-NEXT: srlw a0, a1, a0			; RV64IA-NEXT: srlw a0, a1, a0
	; RV64IA-NEXT: ret			; RV64IA-NEXT: ret
	%1 = atomicrmw or i16* %a, i16 %b release			%1 = atomicrmw or i16* %a, i16 %b release
	Show All 31 Lines
	; RV64I-NEXT: call __atomic_fetch_or_2@plt			; RV64I-NEXT: call __atomic_fetch_or_2@plt
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: atomicrmw_or_i16_acq_rel:			; RV64IA-LABEL: atomicrmw_or_i16_acq_rel:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a2, a0, -4			; RV64IA-NEXT: andi a2, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: lui a3, 16			; RV64IA-NEXT: lui a3, 16
	; RV64IA-NEXT: addiw a3, a3, -1			; RV64IA-NEXT: addiw a3, a3, -1
	; RV64IA-NEXT: and a1, a1, a3			; RV64IA-NEXT: and a1, a1, a3
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: amoor.w.aqrl a1, a1, (a2)			; RV64IA-NEXT: amoor.w.aqrl a1, a1, (a2)
	; RV64IA-NEXT: srlw a0, a1, a0			; RV64IA-NEXT: srlw a0, a1, a0
	; RV64IA-NEXT: ret			; RV64IA-NEXT: ret
	%1 = atomicrmw or i16* %a, i16 %b acq_rel			%1 = atomicrmw or i16* %a, i16 %b acq_rel
	Show All 31 Lines
	; RV64I-NEXT: call __atomic_fetch_or_2@plt			; RV64I-NEXT: call __atomic_fetch_or_2@plt
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: atomicrmw_or_i16_seq_cst:			; RV64IA-LABEL: atomicrmw_or_i16_seq_cst:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a2, a0, -4			; RV64IA-NEXT: andi a2, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: lui a3, 16			; RV64IA-NEXT: lui a3, 16
	; RV64IA-NEXT: addiw a3, a3, -1			; RV64IA-NEXT: addiw a3, a3, -1
	; RV64IA-NEXT: and a1, a1, a3			; RV64IA-NEXT: and a1, a1, a3
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: amoor.w.aqrl a1, a1, (a2)			; RV64IA-NEXT: amoor.w.aqrl a1, a1, (a2)
	; RV64IA-NEXT: srlw a0, a1, a0			; RV64IA-NEXT: srlw a0, a1, a0
	; RV64IA-NEXT: ret			; RV64IA-NEXT: ret
	%1 = atomicrmw or i16* %a, i16 %b seq_cst			%1 = atomicrmw or i16* %a, i16 %b seq_cst
	Show All 31 Lines
	; RV64I-NEXT: call __atomic_fetch_xor_2@plt			; RV64I-NEXT: call __atomic_fetch_xor_2@plt
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: atomicrmw_xor_i16_monotonic:			; RV64IA-LABEL: atomicrmw_xor_i16_monotonic:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a2, a0, -4			; RV64IA-NEXT: andi a2, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: lui a3, 16			; RV64IA-NEXT: lui a3, 16
	; RV64IA-NEXT: addiw a3, a3, -1			; RV64IA-NEXT: addiw a3, a3, -1
	; RV64IA-NEXT: and a1, a1, a3			; RV64IA-NEXT: and a1, a1, a3
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: amoxor.w a1, a1, (a2)			; RV64IA-NEXT: amoxor.w a1, a1, (a2)
	; RV64IA-NEXT: srlw a0, a1, a0			; RV64IA-NEXT: srlw a0, a1, a0
	; RV64IA-NEXT: ret			; RV64IA-NEXT: ret
	%1 = atomicrmw xor i16* %a, i16 %b monotonic			%1 = atomicrmw xor i16* %a, i16 %b monotonic
	Show All 31 Lines
	; RV64I-NEXT: call __atomic_fetch_xor_2@plt			; RV64I-NEXT: call __atomic_fetch_xor_2@plt
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: atomicrmw_xor_i16_acquire:			; RV64IA-LABEL: atomicrmw_xor_i16_acquire:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a2, a0, -4			; RV64IA-NEXT: andi a2, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: lui a3, 16			; RV64IA-NEXT: lui a3, 16
	; RV64IA-NEXT: addiw a3, a3, -1			; RV64IA-NEXT: addiw a3, a3, -1
	; RV64IA-NEXT: and a1, a1, a3			; RV64IA-NEXT: and a1, a1, a3
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: amoxor.w.aq a1, a1, (a2)			; RV64IA-NEXT: amoxor.w.aq a1, a1, (a2)
	; RV64IA-NEXT: srlw a0, a1, a0			; RV64IA-NEXT: srlw a0, a1, a0
	; RV64IA-NEXT: ret			; RV64IA-NEXT: ret
	%1 = atomicrmw xor i16* %a, i16 %b acquire			%1 = atomicrmw xor i16* %a, i16 %b acquire
	Show All 31 Lines
	; RV64I-NEXT: call __atomic_fetch_xor_2@plt			; RV64I-NEXT: call __atomic_fetch_xor_2@plt
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: atomicrmw_xor_i16_release:			; RV64IA-LABEL: atomicrmw_xor_i16_release:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a2, a0, -4			; RV64IA-NEXT: andi a2, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: lui a3, 16			; RV64IA-NEXT: lui a3, 16
	; RV64IA-NEXT: addiw a3, a3, -1			; RV64IA-NEXT: addiw a3, a3, -1
	; RV64IA-NEXT: and a1, a1, a3			; RV64IA-NEXT: and a1, a1, a3
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: amoxor.w.rl a1, a1, (a2)			; RV64IA-NEXT: amoxor.w.rl a1, a1, (a2)
	; RV64IA-NEXT: srlw a0, a1, a0			; RV64IA-NEXT: srlw a0, a1, a0
	; RV64IA-NEXT: ret			; RV64IA-NEXT: ret
	%1 = atomicrmw xor i16* %a, i16 %b release			%1 = atomicrmw xor i16* %a, i16 %b release
	Show All 31 Lines
	; RV64I-NEXT: call __atomic_fetch_xor_2@plt			; RV64I-NEXT: call __atomic_fetch_xor_2@plt
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: atomicrmw_xor_i16_acq_rel:			; RV64IA-LABEL: atomicrmw_xor_i16_acq_rel:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a2, a0, -4			; RV64IA-NEXT: andi a2, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: lui a3, 16			; RV64IA-NEXT: lui a3, 16
	; RV64IA-NEXT: addiw a3, a3, -1			; RV64IA-NEXT: addiw a3, a3, -1
	; RV64IA-NEXT: and a1, a1, a3			; RV64IA-NEXT: and a1, a1, a3
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: amoxor.w.aqrl a1, a1, (a2)			; RV64IA-NEXT: amoxor.w.aqrl a1, a1, (a2)
	; RV64IA-NEXT: srlw a0, a1, a0			; RV64IA-NEXT: srlw a0, a1, a0
	; RV64IA-NEXT: ret			; RV64IA-NEXT: ret
	%1 = atomicrmw xor i16* %a, i16 %b acq_rel			%1 = atomicrmw xor i16* %a, i16 %b acq_rel
	Show All 31 Lines
	; RV64I-NEXT: call __atomic_fetch_xor_2@plt			; RV64I-NEXT: call __atomic_fetch_xor_2@plt
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: atomicrmw_xor_i16_seq_cst:			; RV64IA-LABEL: atomicrmw_xor_i16_seq_cst:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a2, a0, -4			; RV64IA-NEXT: andi a2, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: lui a3, 16			; RV64IA-NEXT: lui a3, 16
	; RV64IA-NEXT: addiw a3, a3, -1			; RV64IA-NEXT: addiw a3, a3, -1
	; RV64IA-NEXT: and a1, a1, a3			; RV64IA-NEXT: and a1, a1, a3
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: amoxor.w.aqrl a1, a1, (a2)			; RV64IA-NEXT: amoxor.w.aqrl a1, a1, (a2)
	; RV64IA-NEXT: srlw a0, a1, a0			; RV64IA-NEXT: srlw a0, a1, a0
	; RV64IA-NEXT: ret			; RV64IA-NEXT: ret
	%1 = atomicrmw xor i16* %a, i16 %b seq_cst			%1 = atomicrmw xor i16* %a, i16 %b seq_cst
	▲ Show 20 Lines • Show All 1,612 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: ld s0, 32(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld s0, 32(sp) # 8-byte Folded Reload
	; RV64I-NEXT: ld ra, 40(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 40(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 48			; RV64I-NEXT: addi sp, sp, 48
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: atomicrmw_umax_i16_monotonic:			; RV64IA-LABEL: atomicrmw_umax_i16_monotonic:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a6, a0, -4			; RV64IA-NEXT: andi a6, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: lui a3, 16			; RV64IA-NEXT: lui a3, 16
	; RV64IA-NEXT: addiw a3, a3, -1			; RV64IA-NEXT: addiw a3, a3, -1
	; RV64IA-NEXT: sllw a4, a3, a0			; RV64IA-NEXT: sllw a4, a3, a0
	; RV64IA-NEXT: and a1, a1, a3			; RV64IA-NEXT: and a1, a1, a3
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: .LBB100_1: # =>This Inner Loop Header: Depth=1			; RV64IA-NEXT: .LBB100_1: # =>This Inner Loop Header: Depth=1
	; RV64IA-NEXT: lr.w a3, (a6)			; RV64IA-NEXT: lr.w a3, (a6)
	; RV64IA-NEXT: and a2, a3, a4			; RV64IA-NEXT: and a2, a3, a4
	▲ Show 20 Lines • Show All 125 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: ld s0, 32(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld s0, 32(sp) # 8-byte Folded Reload
	; RV64I-NEXT: ld ra, 40(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 40(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 48			; RV64I-NEXT: addi sp, sp, 48
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: atomicrmw_umax_i16_acquire:			; RV64IA-LABEL: atomicrmw_umax_i16_acquire:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a6, a0, -4			; RV64IA-NEXT: andi a6, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: lui a3, 16			; RV64IA-NEXT: lui a3, 16
	; RV64IA-NEXT: addiw a3, a3, -1			; RV64IA-NEXT: addiw a3, a3, -1
	; RV64IA-NEXT: sllw a4, a3, a0			; RV64IA-NEXT: sllw a4, a3, a0
	; RV64IA-NEXT: and a1, a1, a3			; RV64IA-NEXT: and a1, a1, a3
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: .LBB101_1: # =>This Inner Loop Header: Depth=1			; RV64IA-NEXT: .LBB101_1: # =>This Inner Loop Header: Depth=1
	; RV64IA-NEXT: lr.w.aq a3, (a6)			; RV64IA-NEXT: lr.w.aq a3, (a6)
	; RV64IA-NEXT: and a2, a3, a4			; RV64IA-NEXT: and a2, a3, a4
	▲ Show 20 Lines • Show All 125 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: ld s0, 32(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld s0, 32(sp) # 8-byte Folded Reload
	; RV64I-NEXT: ld ra, 40(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 40(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 48			; RV64I-NEXT: addi sp, sp, 48
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: atomicrmw_umax_i16_release:			; RV64IA-LABEL: atomicrmw_umax_i16_release:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a6, a0, -4			; RV64IA-NEXT: andi a6, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: lui a3, 16			; RV64IA-NEXT: lui a3, 16
	; RV64IA-NEXT: addiw a3, a3, -1			; RV64IA-NEXT: addiw a3, a3, -1
	; RV64IA-NEXT: sllw a4, a3, a0			; RV64IA-NEXT: sllw a4, a3, a0
	; RV64IA-NEXT: and a1, a1, a3			; RV64IA-NEXT: and a1, a1, a3
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: .LBB102_1: # =>This Inner Loop Header: Depth=1			; RV64IA-NEXT: .LBB102_1: # =>This Inner Loop Header: Depth=1
	; RV64IA-NEXT: lr.w a3, (a6)			; RV64IA-NEXT: lr.w a3, (a6)
	; RV64IA-NEXT: and a2, a3, a4			; RV64IA-NEXT: and a2, a3, a4
	▲ Show 20 Lines • Show All 125 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: ld s0, 32(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld s0, 32(sp) # 8-byte Folded Reload
	; RV64I-NEXT: ld ra, 40(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 40(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 48			; RV64I-NEXT: addi sp, sp, 48
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: atomicrmw_umax_i16_acq_rel:			; RV64IA-LABEL: atomicrmw_umax_i16_acq_rel:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a6, a0, -4			; RV64IA-NEXT: andi a6, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: lui a3, 16			; RV64IA-NEXT: lui a3, 16
	; RV64IA-NEXT: addiw a3, a3, -1			; RV64IA-NEXT: addiw a3, a3, -1
	; RV64IA-NEXT: sllw a4, a3, a0			; RV64IA-NEXT: sllw a4, a3, a0
	; RV64IA-NEXT: and a1, a1, a3			; RV64IA-NEXT: and a1, a1, a3
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: .LBB103_1: # =>This Inner Loop Header: Depth=1			; RV64IA-NEXT: .LBB103_1: # =>This Inner Loop Header: Depth=1
	; RV64IA-NEXT: lr.w.aq a3, (a6)			; RV64IA-NEXT: lr.w.aq a3, (a6)
	; RV64IA-NEXT: and a2, a3, a4			; RV64IA-NEXT: and a2, a3, a4
	▲ Show 20 Lines • Show All 125 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: ld s0, 32(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld s0, 32(sp) # 8-byte Folded Reload
	; RV64I-NEXT: ld ra, 40(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 40(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 48			; RV64I-NEXT: addi sp, sp, 48
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: atomicrmw_umax_i16_seq_cst:			; RV64IA-LABEL: atomicrmw_umax_i16_seq_cst:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a6, a0, -4			; RV64IA-NEXT: andi a6, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: lui a3, 16			; RV64IA-NEXT: lui a3, 16
	; RV64IA-NEXT: addiw a3, a3, -1			; RV64IA-NEXT: addiw a3, a3, -1
	; RV64IA-NEXT: sllw a4, a3, a0			; RV64IA-NEXT: sllw a4, a3, a0
	; RV64IA-NEXT: and a1, a1, a3			; RV64IA-NEXT: and a1, a1, a3
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: .LBB104_1: # =>This Inner Loop Header: Depth=1			; RV64IA-NEXT: .LBB104_1: # =>This Inner Loop Header: Depth=1
	; RV64IA-NEXT: lr.w.aqrl a3, (a6)			; RV64IA-NEXT: lr.w.aqrl a3, (a6)
	; RV64IA-NEXT: and a2, a3, a4			; RV64IA-NEXT: and a2, a3, a4
	▲ Show 20 Lines • Show All 125 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: ld s0, 32(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld s0, 32(sp) # 8-byte Folded Reload
	; RV64I-NEXT: ld ra, 40(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 40(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 48			; RV64I-NEXT: addi sp, sp, 48
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: atomicrmw_umin_i16_monotonic:			; RV64IA-LABEL: atomicrmw_umin_i16_monotonic:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a6, a0, -4			; RV64IA-NEXT: andi a6, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: lui a3, 16			; RV64IA-NEXT: lui a3, 16
	; RV64IA-NEXT: addiw a3, a3, -1			; RV64IA-NEXT: addiw a3, a3, -1
	; RV64IA-NEXT: sllw a4, a3, a0			; RV64IA-NEXT: sllw a4, a3, a0
	; RV64IA-NEXT: and a1, a1, a3			; RV64IA-NEXT: and a1, a1, a3
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: .LBB105_1: # =>This Inner Loop Header: Depth=1			; RV64IA-NEXT: .LBB105_1: # =>This Inner Loop Header: Depth=1
	; RV64IA-NEXT: lr.w a3, (a6)			; RV64IA-NEXT: lr.w a3, (a6)
	; RV64IA-NEXT: and a2, a3, a4			; RV64IA-NEXT: and a2, a3, a4
	▲ Show 20 Lines • Show All 125 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: ld s0, 32(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld s0, 32(sp) # 8-byte Folded Reload
	; RV64I-NEXT: ld ra, 40(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 40(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 48			; RV64I-NEXT: addi sp, sp, 48
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: atomicrmw_umin_i16_acquire:			; RV64IA-LABEL: atomicrmw_umin_i16_acquire:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a6, a0, -4			; RV64IA-NEXT: andi a6, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: lui a3, 16			; RV64IA-NEXT: lui a3, 16
	; RV64IA-NEXT: addiw a3, a3, -1			; RV64IA-NEXT: addiw a3, a3, -1
	; RV64IA-NEXT: sllw a4, a3, a0			; RV64IA-NEXT: sllw a4, a3, a0
	; RV64IA-NEXT: and a1, a1, a3			; RV64IA-NEXT: and a1, a1, a3
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: .LBB106_1: # =>This Inner Loop Header: Depth=1			; RV64IA-NEXT: .LBB106_1: # =>This Inner Loop Header: Depth=1
	; RV64IA-NEXT: lr.w.aq a3, (a6)			; RV64IA-NEXT: lr.w.aq a3, (a6)
	; RV64IA-NEXT: and a2, a3, a4			; RV64IA-NEXT: and a2, a3, a4
	▲ Show 20 Lines • Show All 125 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: ld s0, 32(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld s0, 32(sp) # 8-byte Folded Reload
	; RV64I-NEXT: ld ra, 40(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 40(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 48			; RV64I-NEXT: addi sp, sp, 48
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: atomicrmw_umin_i16_release:			; RV64IA-LABEL: atomicrmw_umin_i16_release:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a6, a0, -4			; RV64IA-NEXT: andi a6, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: lui a3, 16			; RV64IA-NEXT: lui a3, 16
	; RV64IA-NEXT: addiw a3, a3, -1			; RV64IA-NEXT: addiw a3, a3, -1
	; RV64IA-NEXT: sllw a4, a3, a0			; RV64IA-NEXT: sllw a4, a3, a0
	; RV64IA-NEXT: and a1, a1, a3			; RV64IA-NEXT: and a1, a1, a3
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: .LBB107_1: # =>This Inner Loop Header: Depth=1			; RV64IA-NEXT: .LBB107_1: # =>This Inner Loop Header: Depth=1
	; RV64IA-NEXT: lr.w a3, (a6)			; RV64IA-NEXT: lr.w a3, (a6)
	; RV64IA-NEXT: and a2, a3, a4			; RV64IA-NEXT: and a2, a3, a4
	▲ Show 20 Lines • Show All 125 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: ld s0, 32(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld s0, 32(sp) # 8-byte Folded Reload
	; RV64I-NEXT: ld ra, 40(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 40(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 48			; RV64I-NEXT: addi sp, sp, 48
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: atomicrmw_umin_i16_acq_rel:			; RV64IA-LABEL: atomicrmw_umin_i16_acq_rel:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a6, a0, -4			; RV64IA-NEXT: andi a6, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: lui a3, 16			; RV64IA-NEXT: lui a3, 16
	; RV64IA-NEXT: addiw a3, a3, -1			; RV64IA-NEXT: addiw a3, a3, -1
	; RV64IA-NEXT: sllw a4, a3, a0			; RV64IA-NEXT: sllw a4, a3, a0
	; RV64IA-NEXT: and a1, a1, a3			; RV64IA-NEXT: and a1, a1, a3
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: .LBB108_1: # =>This Inner Loop Header: Depth=1			; RV64IA-NEXT: .LBB108_1: # =>This Inner Loop Header: Depth=1
	; RV64IA-NEXT: lr.w.aq a3, (a6)			; RV64IA-NEXT: lr.w.aq a3, (a6)
	; RV64IA-NEXT: and a2, a3, a4			; RV64IA-NEXT: and a2, a3, a4
	▲ Show 20 Lines • Show All 125 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: ld s0, 32(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld s0, 32(sp) # 8-byte Folded Reload
	; RV64I-NEXT: ld ra, 40(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 40(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 48			; RV64I-NEXT: addi sp, sp, 48
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: atomicrmw_umin_i16_seq_cst:			; RV64IA-LABEL: atomicrmw_umin_i16_seq_cst:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a6, a0, -4			; RV64IA-NEXT: andi a6, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: lui a3, 16			; RV64IA-NEXT: lui a3, 16
	; RV64IA-NEXT: addiw a3, a3, -1			; RV64IA-NEXT: addiw a3, a3, -1
	; RV64IA-NEXT: sllw a4, a3, a0			; RV64IA-NEXT: sllw a4, a3, a0
	; RV64IA-NEXT: and a1, a1, a3			; RV64IA-NEXT: and a1, a1, a3
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: .LBB109_1: # =>This Inner Loop Header: Depth=1			; RV64IA-NEXT: .LBB109_1: # =>This Inner Loop Header: Depth=1
	; RV64IA-NEXT: lr.w.aqrl a3, (a6)			; RV64IA-NEXT: lr.w.aqrl a3, (a6)
	; RV64IA-NEXT: and a2, a3, a4			; RV64IA-NEXT: and a2, a3, a4
	▲ Show 20 Lines • Show All 7,570 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/atomic-signext.ll

	Show First 20 Lines • Show All 164 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: srai a0, a0, 56			; RV64I-NEXT: srai a0, a0, 56
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: atomicrmw_xchg_i8_monotonic:			; RV64IA-LABEL: atomicrmw_xchg_i8_monotonic:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a2, a0, -4			; RV64IA-NEXT: andi a2, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: addi a3, zero, 255			; RV64IA-NEXT: addi a3, zero, 255
	; RV64IA-NEXT: sllw a3, a3, a0			; RV64IA-NEXT: sllw a3, a3, a0
	; RV64IA-NEXT: andi a1, a1, 255			; RV64IA-NEXT: andi a1, a1, 255
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: .LBB3_1: # =>This Inner Loop Header: Depth=1			; RV64IA-NEXT: .LBB3_1: # =>This Inner Loop Header: Depth=1
	; RV64IA-NEXT: lr.w a4, (a2)			; RV64IA-NEXT: lr.w a4, (a2)
	; RV64IA-NEXT: mv a5, a1			; RV64IA-NEXT: mv a5, a1
	; RV64IA-NEXT: xor a5, a4, a5			; RV64IA-NEXT: xor a5, a4, a5
	▲ Show 20 Lines • Show All 55 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: srai a0, a0, 56			; RV64I-NEXT: srai a0, a0, 56
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: atomicrmw_add_i8_monotonic:			; RV64IA-LABEL: atomicrmw_add_i8_monotonic:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a2, a0, -4			; RV64IA-NEXT: andi a2, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: addi a3, zero, 255			; RV64IA-NEXT: addi a3, zero, 255
	; RV64IA-NEXT: sllw a3, a3, a0			; RV64IA-NEXT: sllw a3, a3, a0
	; RV64IA-NEXT: andi a1, a1, 255			; RV64IA-NEXT: andi a1, a1, 255
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: .LBB4_1: # =>This Inner Loop Header: Depth=1			; RV64IA-NEXT: .LBB4_1: # =>This Inner Loop Header: Depth=1
	; RV64IA-NEXT: lr.w a4, (a2)			; RV64IA-NEXT: lr.w a4, (a2)
	; RV64IA-NEXT: add a5, a4, a1			; RV64IA-NEXT: add a5, a4, a1
	; RV64IA-NEXT: xor a5, a4, a5			; RV64IA-NEXT: xor a5, a4, a5
	▲ Show 20 Lines • Show All 55 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: srai a0, a0, 56			; RV64I-NEXT: srai a0, a0, 56
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: atomicrmw_sub_i8_monotonic:			; RV64IA-LABEL: atomicrmw_sub_i8_monotonic:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a2, a0, -4			; RV64IA-NEXT: andi a2, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: addi a3, zero, 255			; RV64IA-NEXT: addi a3, zero, 255
	; RV64IA-NEXT: sllw a3, a3, a0			; RV64IA-NEXT: sllw a3, a3, a0
	; RV64IA-NEXT: andi a1, a1, 255			; RV64IA-NEXT: andi a1, a1, 255
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: .LBB5_1: # =>This Inner Loop Header: Depth=1			; RV64IA-NEXT: .LBB5_1: # =>This Inner Loop Header: Depth=1
	; RV64IA-NEXT: lr.w a4, (a2)			; RV64IA-NEXT: lr.w a4, (a2)
	; RV64IA-NEXT: sub a5, a4, a1			; RV64IA-NEXT: sub a5, a4, a1
	; RV64IA-NEXT: xor a5, a4, a5			; RV64IA-NEXT: xor a5, a4, a5
	▲ Show 20 Lines • Show All 49 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: srai a0, a0, 56			; RV64I-NEXT: srai a0, a0, 56
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: atomicrmw_and_i8_monotonic:			; RV64IA-LABEL: atomicrmw_and_i8_monotonic:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a2, a0, -4			; RV64IA-NEXT: andi a2, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: addi a3, zero, 255			; RV64IA-NEXT: addi a3, zero, 255
	; RV64IA-NEXT: sllw a3, a3, a0			; RV64IA-NEXT: sllw a3, a3, a0
	; RV64IA-NEXT: not a3, a3			; RV64IA-NEXT: not a3, a3
	; RV64IA-NEXT: andi a1, a1, 255			; RV64IA-NEXT: andi a1, a1, 255
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: or a1, a3, a1			; RV64IA-NEXT: or a1, a3, a1
	; RV64IA-NEXT: amoand.w a1, a1, (a2)			; RV64IA-NEXT: amoand.w a1, a1, (a2)
	; RV64IA-NEXT: srlw a0, a1, a0			; RV64IA-NEXT: srlw a0, a1, a0
	▲ Show 20 Lines • Show All 50 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: srai a0, a0, 56			; RV64I-NEXT: srai a0, a0, 56
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: atomicrmw_nand_i8_monotonic:			; RV64IA-LABEL: atomicrmw_nand_i8_monotonic:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a2, a0, -4			; RV64IA-NEXT: andi a2, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: addi a3, zero, 255			; RV64IA-NEXT: addi a3, zero, 255
	; RV64IA-NEXT: sllw a3, a3, a0			; RV64IA-NEXT: sllw a3, a3, a0
	; RV64IA-NEXT: andi a1, a1, 255			; RV64IA-NEXT: andi a1, a1, 255
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: .LBB7_1: # =>This Inner Loop Header: Depth=1			; RV64IA-NEXT: .LBB7_1: # =>This Inner Loop Header: Depth=1
	; RV64IA-NEXT: lr.w a4, (a2)			; RV64IA-NEXT: lr.w a4, (a2)
	; RV64IA-NEXT: and a5, a4, a1			; RV64IA-NEXT: and a5, a4, a1
	; RV64IA-NEXT: not a5, a5			; RV64IA-NEXT: not a5, a5
	▲ Show 20 Lines • Show All 46 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: srai a0, a0, 56			; RV64I-NEXT: srai a0, a0, 56
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: atomicrmw_or_i8_monotonic:			; RV64IA-LABEL: atomicrmw_or_i8_monotonic:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a2, a0, -4			; RV64IA-NEXT: andi a2, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: andi a1, a1, 255			; RV64IA-NEXT: andi a1, a1, 255
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: amoor.w a1, a1, (a2)			; RV64IA-NEXT: amoor.w a1, a1, (a2)
	; RV64IA-NEXT: srlw a0, a1, a0			; RV64IA-NEXT: srlw a0, a1, a0
	; RV64IA-NEXT: slli a0, a0, 56			; RV64IA-NEXT: slli a0, a0, 56
	; RV64IA-NEXT: srai a0, a0, 56			; RV64IA-NEXT: srai a0, a0, 56
	; RV64IA-NEXT: ret			; RV64IA-NEXT: ret
	%1 = atomicrmw or i8* %a, i8 %b monotonic			%1 = atomicrmw or i8* %a, i8 %b monotonic
	Show All 35 Lines
	; RV64I-NEXT: srai a0, a0, 56			; RV64I-NEXT: srai a0, a0, 56
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: atomicrmw_xor_i8_monotonic:			; RV64IA-LABEL: atomicrmw_xor_i8_monotonic:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a2, a0, -4			; RV64IA-NEXT: andi a2, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: andi a1, a1, 255			; RV64IA-NEXT: andi a1, a1, 255
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: amoxor.w a1, a1, (a2)			; RV64IA-NEXT: amoxor.w a1, a1, (a2)
	; RV64IA-NEXT: srlw a0, a1, a0			; RV64IA-NEXT: srlw a0, a1, a0
	; RV64IA-NEXT: slli a0, a0, 56			; RV64IA-NEXT: slli a0, a0, 56
	; RV64IA-NEXT: srai a0, a0, 56			; RV64IA-NEXT: srai a0, a0, 56
	; RV64IA-NEXT: ret			; RV64IA-NEXT: ret
	%1 = atomicrmw xor i8* %a, i8 %b monotonic			%1 = atomicrmw xor i8* %a, i8 %b monotonic
	▲ Show 20 Lines • Show All 415 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: ld s0, 32(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld s0, 32(sp) # 8-byte Folded Reload
	; RV64I-NEXT: ld ra, 40(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 40(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 48			; RV64I-NEXT: addi sp, sp, 48
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: atomicrmw_umax_i8_monotonic:			; RV64IA-LABEL: atomicrmw_umax_i8_monotonic:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a6, a0, -4			; RV64IA-NEXT: andi a6, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: addi a3, zero, 255			; RV64IA-NEXT: addi a3, zero, 255
	; RV64IA-NEXT: sllw a3, a3, a0			; RV64IA-NEXT: sllw a3, a3, a0
	; RV64IA-NEXT: andi a1, a1, 255			; RV64IA-NEXT: andi a1, a1, 255
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: .LBB12_1: # =>This Inner Loop Header: Depth=1			; RV64IA-NEXT: .LBB12_1: # =>This Inner Loop Header: Depth=1
	; RV64IA-NEXT: lr.w a4, (a6)			; RV64IA-NEXT: lr.w a4, (a6)
	; RV64IA-NEXT: and a2, a4, a3			; RV64IA-NEXT: and a2, a4, a3
	; RV64IA-NEXT: mv a5, a4			; RV64IA-NEXT: mv a5, a4
	▲ Show 20 Lines • Show All 121 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: ld s0, 32(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld s0, 32(sp) # 8-byte Folded Reload
	; RV64I-NEXT: ld ra, 40(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 40(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 48			; RV64I-NEXT: addi sp, sp, 48
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: atomicrmw_umin_i8_monotonic:			; RV64IA-LABEL: atomicrmw_umin_i8_monotonic:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a6, a0, -4			; RV64IA-NEXT: andi a6, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: addi a3, zero, 255			; RV64IA-NEXT: addi a3, zero, 255
	; RV64IA-NEXT: sllw a3, a3, a0			; RV64IA-NEXT: sllw a3, a3, a0
	; RV64IA-NEXT: andi a1, a1, 255			; RV64IA-NEXT: andi a1, a1, 255
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: .LBB13_1: # =>This Inner Loop Header: Depth=1			; RV64IA-NEXT: .LBB13_1: # =>This Inner Loop Header: Depth=1
	; RV64IA-NEXT: lr.w a4, (a6)			; RV64IA-NEXT: lr.w a4, (a6)
	; RV64IA-NEXT: and a2, a4, a3			; RV64IA-NEXT: and a2, a4, a3
	; RV64IA-NEXT: mv a5, a4			; RV64IA-NEXT: mv a5, a4
	▲ Show 20 Lines • Show All 60 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: srai a0, a0, 48			; RV64I-NEXT: srai a0, a0, 48
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: atomicrmw_xchg_i16_monotonic:			; RV64IA-LABEL: atomicrmw_xchg_i16_monotonic:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a2, a0, -4			; RV64IA-NEXT: andi a2, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: lui a3, 16			; RV64IA-NEXT: lui a3, 16
	; RV64IA-NEXT: addiw a3, a3, -1			; RV64IA-NEXT: addiw a3, a3, -1
	; RV64IA-NEXT: sllw a4, a3, a0			; RV64IA-NEXT: sllw a4, a3, a0
	; RV64IA-NEXT: and a1, a1, a3			; RV64IA-NEXT: and a1, a1, a3
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: .LBB14_1: # =>This Inner Loop Header: Depth=1			; RV64IA-NEXT: .LBB14_1: # =>This Inner Loop Header: Depth=1
	; RV64IA-NEXT: lr.w a3, (a2)			; RV64IA-NEXT: lr.w a3, (a2)
	; RV64IA-NEXT: mv a5, a1			; RV64IA-NEXT: mv a5, a1
	▲ Show 20 Lines • Show All 57 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: srai a0, a0, 48			; RV64I-NEXT: srai a0, a0, 48
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: atomicrmw_add_i16_monotonic:			; RV64IA-LABEL: atomicrmw_add_i16_monotonic:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a2, a0, -4			; RV64IA-NEXT: andi a2, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: lui a3, 16			; RV64IA-NEXT: lui a3, 16
	; RV64IA-NEXT: addiw a3, a3, -1			; RV64IA-NEXT: addiw a3, a3, -1
	; RV64IA-NEXT: sllw a4, a3, a0			; RV64IA-NEXT: sllw a4, a3, a0
	; RV64IA-NEXT: and a1, a1, a3			; RV64IA-NEXT: and a1, a1, a3
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: .LBB15_1: # =>This Inner Loop Header: Depth=1			; RV64IA-NEXT: .LBB15_1: # =>This Inner Loop Header: Depth=1
	; RV64IA-NEXT: lr.w a3, (a2)			; RV64IA-NEXT: lr.w a3, (a2)
	; RV64IA-NEXT: add a5, a3, a1			; RV64IA-NEXT: add a5, a3, a1
	▲ Show 20 Lines • Show All 57 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: srai a0, a0, 48			; RV64I-NEXT: srai a0, a0, 48
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: atomicrmw_sub_i16_monotonic:			; RV64IA-LABEL: atomicrmw_sub_i16_monotonic:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a2, a0, -4			; RV64IA-NEXT: andi a2, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: lui a3, 16			; RV64IA-NEXT: lui a3, 16
	; RV64IA-NEXT: addiw a3, a3, -1			; RV64IA-NEXT: addiw a3, a3, -1
	; RV64IA-NEXT: sllw a4, a3, a0			; RV64IA-NEXT: sllw a4, a3, a0
	; RV64IA-NEXT: and a1, a1, a3			; RV64IA-NEXT: and a1, a1, a3
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: .LBB16_1: # =>This Inner Loop Header: Depth=1			; RV64IA-NEXT: .LBB16_1: # =>This Inner Loop Header: Depth=1
	; RV64IA-NEXT: lr.w a3, (a2)			; RV64IA-NEXT: lr.w a3, (a2)
	; RV64IA-NEXT: sub a5, a3, a1			; RV64IA-NEXT: sub a5, a3, a1
	▲ Show 20 Lines • Show All 51 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: srai a0, a0, 48			; RV64I-NEXT: srai a0, a0, 48
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: atomicrmw_and_i16_monotonic:			; RV64IA-LABEL: atomicrmw_and_i16_monotonic:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a2, a0, -4			; RV64IA-NEXT: andi a2, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: lui a3, 16			; RV64IA-NEXT: lui a3, 16
	; RV64IA-NEXT: addiw a3, a3, -1			; RV64IA-NEXT: addiw a3, a3, -1
	; RV64IA-NEXT: sllw a4, a3, a0			; RV64IA-NEXT: sllw a4, a3, a0
	; RV64IA-NEXT: not a4, a4			; RV64IA-NEXT: not a4, a4
	; RV64IA-NEXT: and a1, a1, a3			; RV64IA-NEXT: and a1, a1, a3
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: or a1, a4, a1			; RV64IA-NEXT: or a1, a4, a1
	; RV64IA-NEXT: amoand.w a1, a1, (a2)			; RV64IA-NEXT: amoand.w a1, a1, (a2)
	▲ Show 20 Lines • Show All 52 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: srai a0, a0, 48			; RV64I-NEXT: srai a0, a0, 48
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: atomicrmw_nand_i16_monotonic:			; RV64IA-LABEL: atomicrmw_nand_i16_monotonic:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a2, a0, -4			; RV64IA-NEXT: andi a2, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: lui a3, 16			; RV64IA-NEXT: lui a3, 16
	; RV64IA-NEXT: addiw a3, a3, -1			; RV64IA-NEXT: addiw a3, a3, -1
	; RV64IA-NEXT: sllw a4, a3, a0			; RV64IA-NEXT: sllw a4, a3, a0
	; RV64IA-NEXT: and a1, a1, a3			; RV64IA-NEXT: and a1, a1, a3
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: .LBB18_1: # =>This Inner Loop Header: Depth=1			; RV64IA-NEXT: .LBB18_1: # =>This Inner Loop Header: Depth=1
	; RV64IA-NEXT: lr.w a3, (a2)			; RV64IA-NEXT: lr.w a3, (a2)
	; RV64IA-NEXT: and a5, a3, a1			; RV64IA-NEXT: and a5, a3, a1
	▲ Show 20 Lines • Show All 49 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: srai a0, a0, 48			; RV64I-NEXT: srai a0, a0, 48
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: atomicrmw_or_i16_monotonic:			; RV64IA-LABEL: atomicrmw_or_i16_monotonic:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a2, a0, -4			; RV64IA-NEXT: andi a2, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: lui a3, 16			; RV64IA-NEXT: lui a3, 16
	; RV64IA-NEXT: addiw a3, a3, -1			; RV64IA-NEXT: addiw a3, a3, -1
	; RV64IA-NEXT: and a1, a1, a3			; RV64IA-NEXT: and a1, a1, a3
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: amoor.w a1, a1, (a2)			; RV64IA-NEXT: amoor.w a1, a1, (a2)
	; RV64IA-NEXT: srlw a0, a1, a0			; RV64IA-NEXT: srlw a0, a1, a0
	; RV64IA-NEXT: slli a0, a0, 48			; RV64IA-NEXT: slli a0, a0, 48
	; RV64IA-NEXT: srai a0, a0, 48			; RV64IA-NEXT: srai a0, a0, 48
	Show All 39 Lines
	; RV64I-NEXT: srai a0, a0, 48			; RV64I-NEXT: srai a0, a0, 48
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: atomicrmw_xor_i16_monotonic:			; RV64IA-LABEL: atomicrmw_xor_i16_monotonic:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a2, a0, -4			; RV64IA-NEXT: andi a2, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: lui a3, 16			; RV64IA-NEXT: lui a3, 16
	; RV64IA-NEXT: addiw a3, a3, -1			; RV64IA-NEXT: addiw a3, a3, -1
	; RV64IA-NEXT: and a1, a1, a3			; RV64IA-NEXT: and a1, a1, a3
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: amoxor.w a1, a1, (a2)			; RV64IA-NEXT: amoxor.w a1, a1, (a2)
	; RV64IA-NEXT: srlw a0, a1, a0			; RV64IA-NEXT: srlw a0, a1, a0
	; RV64IA-NEXT: slli a0, a0, 48			; RV64IA-NEXT: slli a0, a0, 48
	; RV64IA-NEXT: srai a0, a0, 48			; RV64IA-NEXT: srai a0, a0, 48
	▲ Show 20 Lines • Show All 430 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: ld s0, 32(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld s0, 32(sp) # 8-byte Folded Reload
	; RV64I-NEXT: ld ra, 40(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 40(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 48			; RV64I-NEXT: addi sp, sp, 48
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: atomicrmw_umax_i16_monotonic:			; RV64IA-LABEL: atomicrmw_umax_i16_monotonic:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a6, a0, -4			; RV64IA-NEXT: andi a6, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: lui a3, 16			; RV64IA-NEXT: lui a3, 16
	; RV64IA-NEXT: addiw a3, a3, -1			; RV64IA-NEXT: addiw a3, a3, -1
	; RV64IA-NEXT: sllw a4, a3, a0			; RV64IA-NEXT: sllw a4, a3, a0
	; RV64IA-NEXT: and a1, a1, a3			; RV64IA-NEXT: and a1, a1, a3
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: .LBB23_1: # =>This Inner Loop Header: Depth=1			; RV64IA-NEXT: .LBB23_1: # =>This Inner Loop Header: Depth=1
	; RV64IA-NEXT: lr.w a3, (a6)			; RV64IA-NEXT: lr.w a3, (a6)
	; RV64IA-NEXT: and a2, a3, a4			; RV64IA-NEXT: and a2, a3, a4
	▲ Show 20 Lines • Show All 131 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: ld s0, 32(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld s0, 32(sp) # 8-byte Folded Reload
	; RV64I-NEXT: ld ra, 40(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 40(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 48			; RV64I-NEXT: addi sp, sp, 48
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IA-LABEL: atomicrmw_umin_i16_monotonic:			; RV64IA-LABEL: atomicrmw_umin_i16_monotonic:
	; RV64IA: # %bb.0:			; RV64IA: # %bb.0:
	; RV64IA-NEXT: andi a6, a0, -4			; RV64IA-NEXT: andi a6, a0, -4
	; RV64IA-NEXT: slli a0, a0, 3			; RV64IA-NEXT: slliw a0, a0, 3
	; RV64IA-NEXT: lui a3, 16			; RV64IA-NEXT: lui a3, 16
	; RV64IA-NEXT: addiw a3, a3, -1			; RV64IA-NEXT: addiw a3, a3, -1
	; RV64IA-NEXT: sllw a4, a3, a0			; RV64IA-NEXT: sllw a4, a3, a0
	; RV64IA-NEXT: and a1, a1, a3			; RV64IA-NEXT: and a1, a1, a3
	; RV64IA-NEXT: sllw a1, a1, a0			; RV64IA-NEXT: sllw a1, a1, a0
	; RV64IA-NEXT: .LBB24_1: # =>This Inner Loop Header: Depth=1			; RV64IA-NEXT: .LBB24_1: # =>This Inner Loop Header: Depth=1
	; RV64IA-NEXT: lr.w a3, (a6)			; RV64IA-NEXT: lr.w a3, (a6)
	; RV64IA-NEXT: and a2, a3, a4			; RV64IA-NEXT: and a2, a3, a4
	▲ Show 20 Lines • Show All 1,535 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/calling-conv-lp64-lp64f-lp64d-common.ll

	Show First 20 Lines • Show All 48 Lines • ▼ Show 20 Lines
	; RV64I-LABEL: callee_many_scalars:			; RV64I-LABEL: callee_many_scalars:
	; RV64I: # %bb.0:			; RV64I: # %bb.0:
	; RV64I-NEXT: lw t0, 8(sp)			; RV64I-NEXT: lw t0, 8(sp)
	; RV64I-NEXT: ld t1, 0(sp)			; RV64I-NEXT: ld t1, 0(sp)
	; RV64I-NEXT: andi t2, a0, 255			; RV64I-NEXT: andi t2, a0, 255
	; RV64I-NEXT: lui a0, 16			; RV64I-NEXT: lui a0, 16
	; RV64I-NEXT: addiw a0, a0, -1			; RV64I-NEXT: addiw a0, a0, -1
	; RV64I-NEXT: and a0, a1, a0			; RV64I-NEXT: and a0, a1, a0
	; RV64I-NEXT: add a0, t2, a0			; RV64I-NEXT: addw a0, t2, a0
	; RV64I-NEXT: add a0, a0, a2			; RV64I-NEXT: addw a0, a0, a2
	; RV64I-NEXT: xor a1, a4, t1			; RV64I-NEXT: xor a1, a4, t1
	; RV64I-NEXT: xor a2, a3, a7			; RV64I-NEXT: xor a2, a3, a7
	; RV64I-NEXT: or a1, a2, a1			; RV64I-NEXT: or a1, a2, a1
	; RV64I-NEXT: seqz a1, a1			; RV64I-NEXT: seqz a1, a1
	; RV64I-NEXT: add a0, a1, a0			; RV64I-NEXT: addw a0, a1, a0
	; RV64I-NEXT: add a0, a0, a5			; RV64I-NEXT: addw a0, a0, a5
	; RV64I-NEXT: add a0, a0, a6			; RV64I-NEXT: addw a0, a0, a6
	; RV64I-NEXT: addw a0, a0, t0			; RV64I-NEXT: addw a0, a0, t0
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	%a_ext = zext i8 %a to i32			%a_ext = zext i8 %a to i32
	%b_ext = zext i16 %b to i32			%b_ext = zext i16 %b to i32
	%1 = add i32 %a_ext, %b_ext			%1 = add i32 %a_ext, %b_ext
	%2 = add i32 %1, %c			%2 = add i32 %1, %c
	%3 = icmp eq i128 %d, %g			%3 = icmp eq i128 %d, %g
	%4 = zext i1 %3 to i32			%4 = zext i1 %3 to i32
	▲ Show 20 Lines • Show All 457 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/div.ll

	Show First 20 Lines • Show All 707 Lines • ▼ Show 20 Lines
	; RV32IM-NEXT: add a0, a0, a1			; RV32IM-NEXT: add a0, a0, a1
	; RV32IM-NEXT: srai a0, a0, 3			; RV32IM-NEXT: srai a0, a0, 3
	; RV32IM-NEXT: ret			; RV32IM-NEXT: ret
	;			;
	; RV64I-LABEL: sdiv_pow2:			; RV64I-LABEL: sdiv_pow2:
	; RV64I: # %bb.0:			; RV64I: # %bb.0:
	; RV64I-NEXT: sraiw a1, a0, 31			; RV64I-NEXT: sraiw a1, a0, 31
	; RV64I-NEXT: srliw a1, a1, 29			; RV64I-NEXT: srliw a1, a1, 29
	; RV64I-NEXT: add a0, a0, a1			; RV64I-NEXT: addw a0, a0, a1
	; RV64I-NEXT: sraiw a0, a0, 3			; RV64I-NEXT: sraiw a0, a0, 3
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IM-LABEL: sdiv_pow2:			; RV64IM-LABEL: sdiv_pow2:
	; RV64IM: # %bb.0:			; RV64IM: # %bb.0:
	; RV64IM-NEXT: sraiw a1, a0, 31			; RV64IM-NEXT: sraiw a1, a0, 31
	; RV64IM-NEXT: srliw a1, a1, 29			; RV64IM-NEXT: srliw a1, a1, 29
	; RV64IM-NEXT: add a0, a0, a1			; RV64IM-NEXT: addw a0, a0, a1
	; RV64IM-NEXT: sraiw a0, a0, 3			; RV64IM-NEXT: sraiw a0, a0, 3
	; RV64IM-NEXT: ret			; RV64IM-NEXT: ret
	%1 = sdiv i32 %a, 8			%1 = sdiv i32 %a, 8
	ret i32 %1			ret i32 %1
	}			}

	define i32 @sdiv_pow2_2(i32 %a) nounwind {			define i32 @sdiv_pow2_2(i32 %a) nounwind {
	; RV32I-LABEL: sdiv_pow2_2:			; RV32I-LABEL: sdiv_pow2_2:
	Show All 11 Lines
	; RV32IM-NEXT: add a0, a0, a1			; RV32IM-NEXT: add a0, a0, a1
	; RV32IM-NEXT: srai a0, a0, 16			; RV32IM-NEXT: srai a0, a0, 16
	; RV32IM-NEXT: ret			; RV32IM-NEXT: ret
	;			;
	; RV64I-LABEL: sdiv_pow2_2:			; RV64I-LABEL: sdiv_pow2_2:
	; RV64I: # %bb.0:			; RV64I: # %bb.0:
	; RV64I-NEXT: sraiw a1, a0, 31			; RV64I-NEXT: sraiw a1, a0, 31
	; RV64I-NEXT: srliw a1, a1, 16			; RV64I-NEXT: srliw a1, a1, 16
	; RV64I-NEXT: add a0, a0, a1			; RV64I-NEXT: addw a0, a0, a1
	; RV64I-NEXT: sraiw a0, a0, 16			; RV64I-NEXT: sraiw a0, a0, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IM-LABEL: sdiv_pow2_2:			; RV64IM-LABEL: sdiv_pow2_2:
	; RV64IM: # %bb.0:			; RV64IM: # %bb.0:
	; RV64IM-NEXT: sraiw a1, a0, 31			; RV64IM-NEXT: sraiw a1, a0, 31
	; RV64IM-NEXT: srliw a1, a1, 16			; RV64IM-NEXT: srliw a1, a1, 16
	; RV64IM-NEXT: add a0, a0, a1			; RV64IM-NEXT: addw a0, a0, a1
	; RV64IM-NEXT: sraiw a0, a0, 16			; RV64IM-NEXT: sraiw a0, a0, 16
	; RV64IM-NEXT: ret			; RV64IM-NEXT: ret
	%1 = sdiv i32 %a, 65536			%1 = sdiv i32 %a, 65536
	ret i32 %1			ret i32 %1
	}			}

	define i32 @sdiv_constant_lhs(i32 %a) nounwind {			define i32 @sdiv_constant_lhs(i32 %a) nounwind {
	; RV32I-LABEL: sdiv_constant_lhs:			; RV32I-LABEL: sdiv_constant_lhs:
	▲ Show 20 Lines • Show All 343 Lines • ▼ Show 20 Lines
	; RV32IM-NEXT: ret			; RV32IM-NEXT: ret
	;			;
	; RV64I-LABEL: sdiv8_pow2:			; RV64I-LABEL: sdiv8_pow2:
	; RV64I: # %bb.0:			; RV64I: # %bb.0:
	; RV64I-NEXT: slli a1, a0, 56			; RV64I-NEXT: slli a1, a0, 56
	; RV64I-NEXT: srai a1, a1, 56			; RV64I-NEXT: srai a1, a1, 56
	; RV64I-NEXT: srli a1, a1, 12			; RV64I-NEXT: srli a1, a1, 12
	; RV64I-NEXT: andi a1, a1, 7			; RV64I-NEXT: andi a1, a1, 7
	; RV64I-NEXT: add a0, a0, a1			; RV64I-NEXT: addw a0, a0, a1
	; RV64I-NEXT: slli a0, a0, 56			; RV64I-NEXT: slli a0, a0, 56
	; RV64I-NEXT: srai a0, a0, 59			; RV64I-NEXT: srai a0, a0, 59
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IM-LABEL: sdiv8_pow2:			; RV64IM-LABEL: sdiv8_pow2:
	; RV64IM: # %bb.0:			; RV64IM: # %bb.0:
	; RV64IM-NEXT: slli a1, a0, 56			; RV64IM-NEXT: slli a1, a0, 56
	; RV64IM-NEXT: srai a1, a1, 56			; RV64IM-NEXT: srai a1, a1, 56
	; RV64IM-NEXT: srli a1, a1, 12			; RV64IM-NEXT: srli a1, a1, 12
	; RV64IM-NEXT: andi a1, a1, 7			; RV64IM-NEXT: andi a1, a1, 7
	; RV64IM-NEXT: add a0, a0, a1			; RV64IM-NEXT: addw a0, a0, a1
	; RV64IM-NEXT: slli a0, a0, 56			; RV64IM-NEXT: slli a0, a0, 56
	; RV64IM-NEXT: srai a0, a0, 59			; RV64IM-NEXT: srai a0, a0, 59
	; RV64IM-NEXT: ret			; RV64IM-NEXT: ret
	%1 = sdiv i8 %a, 8			%1 = sdiv i8 %a, 8
	ret i8 %1			ret i8 %1
	}			}

	define i8 @sdiv8_constant_lhs(i8 %a) nounwind {			define i8 @sdiv8_constant_lhs(i8 %a) nounwind {
	▲ Show 20 Lines • Show All 164 Lines • ▼ Show 20 Lines
	; RV32IM-NEXT: ret			; RV32IM-NEXT: ret
	;			;
	; RV64I-LABEL: sdiv16_pow2:			; RV64I-LABEL: sdiv16_pow2:
	; RV64I: # %bb.0:			; RV64I: # %bb.0:
	; RV64I-NEXT: slli a1, a0, 48			; RV64I-NEXT: slli a1, a0, 48
	; RV64I-NEXT: srai a1, a1, 48			; RV64I-NEXT: srai a1, a1, 48
	; RV64I-NEXT: srli a1, a1, 28			; RV64I-NEXT: srli a1, a1, 28
	; RV64I-NEXT: andi a1, a1, 7			; RV64I-NEXT: andi a1, a1, 7
	; RV64I-NEXT: add a0, a0, a1			; RV64I-NEXT: addw a0, a0, a1
	; RV64I-NEXT: slli a0, a0, 48			; RV64I-NEXT: slli a0, a0, 48
	; RV64I-NEXT: srai a0, a0, 51			; RV64I-NEXT: srai a0, a0, 51
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IM-LABEL: sdiv16_pow2:			; RV64IM-LABEL: sdiv16_pow2:
	; RV64IM: # %bb.0:			; RV64IM: # %bb.0:
	; RV64IM-NEXT: slli a1, a0, 48			; RV64IM-NEXT: slli a1, a0, 48
	; RV64IM-NEXT: srai a1, a1, 48			; RV64IM-NEXT: srai a1, a1, 48
	; RV64IM-NEXT: srli a1, a1, 28			; RV64IM-NEXT: srli a1, a1, 28
	; RV64IM-NEXT: andi a1, a1, 7			; RV64IM-NEXT: andi a1, a1, 7
	; RV64IM-NEXT: add a0, a0, a1			; RV64IM-NEXT: addw a0, a0, a1
	; RV64IM-NEXT: slli a0, a0, 48			; RV64IM-NEXT: slli a0, a0, 48
	; RV64IM-NEXT: srai a0, a0, 51			; RV64IM-NEXT: srai a0, a0, 51
	; RV64IM-NEXT: ret			; RV64IM-NEXT: ret
	%1 = sdiv i16 %a, 8			%1 = sdiv i16 %a, 8
	ret i16 %1			ret i16 %1
	}			}

	define i16 @sdiv16_constant_lhs(i16 %a) nounwind {			define i16 @sdiv16_constant_lhs(i16 %a) nounwind {
	▲ Show 20 Lines • Show All 42 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/mul.ll

	Show First 20 Lines • Show All 85 Lines • ▼ Show 20 Lines
	; RV32IM-LABEL: mul_constant:			; RV32IM-LABEL: mul_constant:
	; RV32IM: # %bb.0:			; RV32IM: # %bb.0:
	; RV32IM-NEXT: slli a1, a0, 2			; RV32IM-NEXT: slli a1, a0, 2
	; RV32IM-NEXT: add a0, a1, a0			; RV32IM-NEXT: add a0, a1, a0
	; RV32IM-NEXT: ret			; RV32IM-NEXT: ret
	;			;
	; RV64I-LABEL: mul_constant:			; RV64I-LABEL: mul_constant:
	; RV64I: # %bb.0:			; RV64I: # %bb.0:
	; RV64I-NEXT: slli a1, a0, 2			; RV64I-NEXT: slliw a1, a0, 2
	; RV64I-NEXT: addw a0, a1, a0			; RV64I-NEXT: addw a0, a1, a0
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IM-LABEL: mul_constant:			; RV64IM-LABEL: mul_constant:
	; RV64IM: # %bb.0:			; RV64IM: # %bb.0:
	; RV64IM-NEXT: slli a1, a0, 2			; RV64IM-NEXT: slliw a1, a0, 2
	; RV64IM-NEXT: addw a0, a1, a0			; RV64IM-NEXT: addw a0, a1, a0
	; RV64IM-NEXT: ret			; RV64IM-NEXT: ret
	%1 = mul i32 %a, 5			%1 = mul i32 %a, 5
	ret i32 %1			ret i32 %1
	}			}

	define i32 @mul_pow2(i32 %a) nounwind {			define i32 @mul_pow2(i32 %a) nounwind {
	; RV32I-LABEL: mul_pow2:			; RV32I-LABEL: mul_pow2:
	▲ Show 20 Lines • Show All 371 Lines • ▼ Show 20 Lines
	; RV32IM-LABEL: muli32_p65:			; RV32IM-LABEL: muli32_p65:
	; RV32IM: # %bb.0:			; RV32IM: # %bb.0:
	; RV32IM-NEXT: slli a1, a0, 6			; RV32IM-NEXT: slli a1, a0, 6
	; RV32IM-NEXT: add a0, a1, a0			; RV32IM-NEXT: add a0, a1, a0
	; RV32IM-NEXT: ret			; RV32IM-NEXT: ret
	;			;
	; RV64I-LABEL: muli32_p65:			; RV64I-LABEL: muli32_p65:
	; RV64I: # %bb.0:			; RV64I: # %bb.0:
	; RV64I-NEXT: slli a1, a0, 6			; RV64I-NEXT: slliw a1, a0, 6
	; RV64I-NEXT: addw a0, a1, a0			; RV64I-NEXT: addw a0, a1, a0
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IM-LABEL: muli32_p65:			; RV64IM-LABEL: muli32_p65:
	; RV64IM: # %bb.0:			; RV64IM: # %bb.0:
	; RV64IM-NEXT: slli a1, a0, 6			; RV64IM-NEXT: slliw a1, a0, 6
	; RV64IM-NEXT: addw a0, a1, a0			; RV64IM-NEXT: addw a0, a1, a0
	; RV64IM-NEXT: ret			; RV64IM-NEXT: ret
	%1 = mul i32 %a, 65			%1 = mul i32 %a, 65
	ret i32 %1			ret i32 %1
	}			}

	define i32 @muli32_p63(i32 %a) nounwind {			define i32 @muli32_p63(i32 %a) nounwind {
	; RV32I-LABEL: muli32_p63:			; RV32I-LABEL: muli32_p63:
	; RV32I: # %bb.0:			; RV32I: # %bb.0:
	; RV32I-NEXT: slli a1, a0, 6			; RV32I-NEXT: slli a1, a0, 6
	; RV32I-NEXT: sub a0, a1, a0			; RV32I-NEXT: sub a0, a1, a0
	; RV32I-NEXT: ret			; RV32I-NEXT: ret
	;			;
	; RV32IM-LABEL: muli32_p63:			; RV32IM-LABEL: muli32_p63:
	; RV32IM: # %bb.0:			; RV32IM: # %bb.0:
	; RV32IM-NEXT: slli a1, a0, 6			; RV32IM-NEXT: slli a1, a0, 6
	; RV32IM-NEXT: sub a0, a1, a0			; RV32IM-NEXT: sub a0, a1, a0
	; RV32IM-NEXT: ret			; RV32IM-NEXT: ret
	;			;
	; RV64I-LABEL: muli32_p63:			; RV64I-LABEL: muli32_p63:
	; RV64I: # %bb.0:			; RV64I: # %bb.0:
	; RV64I-NEXT: slli a1, a0, 6			; RV64I-NEXT: slliw a1, a0, 6
	; RV64I-NEXT: subw a0, a1, a0			; RV64I-NEXT: subw a0, a1, a0
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IM-LABEL: muli32_p63:			; RV64IM-LABEL: muli32_p63:
	; RV64IM: # %bb.0:			; RV64IM: # %bb.0:
	; RV64IM-NEXT: slli a1, a0, 6			; RV64IM-NEXT: slliw a1, a0, 6
	; RV64IM-NEXT: subw a0, a1, a0			; RV64IM-NEXT: subw a0, a1, a0
	; RV64IM-NEXT: ret			; RV64IM-NEXT: ret
	%1 = mul i32 %a, 63			%1 = mul i32 %a, 63
	ret i32 %1			ret i32 %1
	}			}

	define i64 @muli64_p65(i64 %a) nounwind {			define i64 @muli64_p65(i64 %a) nounwind {
	; RV32I-LABEL: muli64_p65:			; RV32I-LABEL: muli64_p65:
	▲ Show 20 Lines • Show All 84 Lines • ▼ Show 20 Lines
	; RV32IM-LABEL: muli32_m63:			; RV32IM-LABEL: muli32_m63:
	; RV32IM: # %bb.0:			; RV32IM: # %bb.0:
	; RV32IM-NEXT: slli a1, a0, 6			; RV32IM-NEXT: slli a1, a0, 6
	; RV32IM-NEXT: sub a0, a0, a1			; RV32IM-NEXT: sub a0, a0, a1
	; RV32IM-NEXT: ret			; RV32IM-NEXT: ret
	;			;
	; RV64I-LABEL: muli32_m63:			; RV64I-LABEL: muli32_m63:
	; RV64I: # %bb.0:			; RV64I: # %bb.0:
	; RV64I-NEXT: slli a1, a0, 6			; RV64I-NEXT: slliw a1, a0, 6
	; RV64I-NEXT: subw a0, a0, a1			; RV64I-NEXT: subw a0, a0, a1
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IM-LABEL: muli32_m63:			; RV64IM-LABEL: muli32_m63:
	; RV64IM: # %bb.0:			; RV64IM: # %bb.0:
	; RV64IM-NEXT: slli a1, a0, 6			; RV64IM-NEXT: slliw a1, a0, 6
	; RV64IM-NEXT: subw a0, a0, a1			; RV64IM-NEXT: subw a0, a0, a1
	; RV64IM-NEXT: ret			; RV64IM-NEXT: ret
	%1 = mul i32 %a, -63			%1 = mul i32 %a, -63
	ret i32 %1			ret i32 %1
	}			}

	define i32 @muli32_m65(i32 %a) nounwind {			define i32 @muli32_m65(i32 %a) nounwind {
	; RV32I-LABEL: muli32_m65:			; RV32I-LABEL: muli32_m65:
	; RV32I: # %bb.0:			; RV32I: # %bb.0:
	; RV32I-NEXT: slli a1, a0, 6			; RV32I-NEXT: slli a1, a0, 6
	; RV32I-NEXT: add a0, a1, a0			; RV32I-NEXT: add a0, a1, a0
	; RV32I-NEXT: neg a0, a0			; RV32I-NEXT: neg a0, a0
	; RV32I-NEXT: ret			; RV32I-NEXT: ret
	;			;
	; RV32IM-LABEL: muli32_m65:			; RV32IM-LABEL: muli32_m65:
	; RV32IM: # %bb.0:			; RV32IM: # %bb.0:
	; RV32IM-NEXT: slli a1, a0, 6			; RV32IM-NEXT: slli a1, a0, 6
	; RV32IM-NEXT: add a0, a1, a0			; RV32IM-NEXT: add a0, a1, a0
	; RV32IM-NEXT: neg a0, a0			; RV32IM-NEXT: neg a0, a0
	; RV32IM-NEXT: ret			; RV32IM-NEXT: ret
	;			;
	; RV64I-LABEL: muli32_m65:			; RV64I-LABEL: muli32_m65:
	; RV64I: # %bb.0:			; RV64I: # %bb.0:
	; RV64I-NEXT: slli a1, a0, 6			; RV64I-NEXT: slliw a1, a0, 6
	; RV64I-NEXT: add a0, a1, a0			; RV64I-NEXT: addw a0, a1, a0
	; RV64I-NEXT: negw a0, a0			; RV64I-NEXT: negw a0, a0
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IM-LABEL: muli32_m65:			; RV64IM-LABEL: muli32_m65:
	; RV64IM: # %bb.0:			; RV64IM: # %bb.0:
	; RV64IM-NEXT: slli a1, a0, 6			; RV64IM-NEXT: slliw a1, a0, 6
	; RV64IM-NEXT: add a0, a1, a0			; RV64IM-NEXT: addw a0, a1, a0
	; RV64IM-NEXT: negw a0, a0			; RV64IM-NEXT: negw a0, a0
	; RV64IM-NEXT: ret			; RV64IM-NEXT: ret
	%1 = mul i32 %a, -65			%1 = mul i32 %a, -65
	ret i32 %1			ret i32 %1
	}			}

	define i64 @muli64_m63(i64 %a) nounwind {			define i64 @muli64_m63(i64 %a) nounwind {
	; RV32I-LABEL: muli64_m63:			; RV32I-LABEL: muli64_m63:
	▲ Show 20 Lines • Show All 166 Lines • ▼ Show 20 Lines
	; RV32IM: # %bb.0:			; RV32IM: # %bb.0:
	; RV32IM-NEXT: lui a1, 1			; RV32IM-NEXT: lui a1, 1
	; RV32IM-NEXT: addi a1, a1, 256			; RV32IM-NEXT: addi a1, a1, 256
	; RV32IM-NEXT: mul a0, a0, a1			; RV32IM-NEXT: mul a0, a0, a1
	; RV32IM-NEXT: ret			; RV32IM-NEXT: ret
	;			;
	; RV64I-LABEL: muli32_p4352:			; RV64I-LABEL: muli32_p4352:
	; RV64I: # %bb.0:			; RV64I: # %bb.0:
	; RV64I-NEXT: slli a1, a0, 8			; RV64I-NEXT: slliw a1, a0, 8
	; RV64I-NEXT: slli a0, a0, 12			; RV64I-NEXT: slliw a0, a0, 12
	; RV64I-NEXT: addw a0, a0, a1			; RV64I-NEXT: addw a0, a0, a1
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IM-LABEL: muli32_p4352:			; RV64IM-LABEL: muli32_p4352:
	; RV64IM: # %bb.0:			; RV64IM: # %bb.0:
	; RV64IM-NEXT: slli a1, a0, 8			; RV64IM-NEXT: slliw a1, a0, 8
	; RV64IM-NEXT: slli a0, a0, 12			; RV64IM-NEXT: slliw a0, a0, 12
	; RV64IM-NEXT: addw a0, a0, a1			; RV64IM-NEXT: addw a0, a0, a1
	; RV64IM-NEXT: ret			; RV64IM-NEXT: ret
	%1 = mul i32 %a, 4352			%1 = mul i32 %a, 4352
	ret i32 %1			ret i32 %1
	}			}

	define i32 @muli32_p3840(i32 %a) nounwind {			define i32 @muli32_p3840(i32 %a) nounwind {
	; RV32I-LABEL: muli32_p3840:			; RV32I-LABEL: muli32_p3840:
	; RV32I: # %bb.0:			; RV32I: # %bb.0:
	; RV32I-NEXT: slli a1, a0, 8			; RV32I-NEXT: slli a1, a0, 8
	; RV32I-NEXT: slli a0, a0, 12			; RV32I-NEXT: slli a0, a0, 12
	; RV32I-NEXT: sub a0, a0, a1			; RV32I-NEXT: sub a0, a0, a1
	; RV32I-NEXT: ret			; RV32I-NEXT: ret
	;			;
	; RV32IM-LABEL: muli32_p3840:			; RV32IM-LABEL: muli32_p3840:
	; RV32IM: # %bb.0:			; RV32IM: # %bb.0:
	; RV32IM-NEXT: lui a1, 1			; RV32IM-NEXT: lui a1, 1
	; RV32IM-NEXT: addi a1, a1, -256			; RV32IM-NEXT: addi a1, a1, -256
	; RV32IM-NEXT: mul a0, a0, a1			; RV32IM-NEXT: mul a0, a0, a1
	; RV32IM-NEXT: ret			; RV32IM-NEXT: ret
	;			;
	; RV64I-LABEL: muli32_p3840:			; RV64I-LABEL: muli32_p3840:
	; RV64I: # %bb.0:			; RV64I: # %bb.0:
	; RV64I-NEXT: slli a1, a0, 8			; RV64I-NEXT: slliw a1, a0, 8
	; RV64I-NEXT: slli a0, a0, 12			; RV64I-NEXT: slliw a0, a0, 12
	; RV64I-NEXT: subw a0, a0, a1			; RV64I-NEXT: subw a0, a0, a1
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IM-LABEL: muli32_p3840:			; RV64IM-LABEL: muli32_p3840:
	; RV64IM: # %bb.0:			; RV64IM: # %bb.0:
	; RV64IM-NEXT: slli a1, a0, 8			; RV64IM-NEXT: slliw a1, a0, 8
	; RV64IM-NEXT: slli a0, a0, 12			; RV64IM-NEXT: slliw a0, a0, 12
	; RV64IM-NEXT: subw a0, a0, a1			; RV64IM-NEXT: subw a0, a0, a1
	; RV64IM-NEXT: ret			; RV64IM-NEXT: ret
	%1 = mul i32 %a, 3840			%1 = mul i32 %a, 3840
	ret i32 %1			ret i32 %1
	}			}

	define i32 @muli32_m3840(i32 %a) nounwind {			define i32 @muli32_m3840(i32 %a) nounwind {
	; RV32I-LABEL: muli32_m3840:			; RV32I-LABEL: muli32_m3840:
	; RV32I: # %bb.0:			; RV32I: # %bb.0:
	; RV32I-NEXT: slli a1, a0, 12			; RV32I-NEXT: slli a1, a0, 12
	; RV32I-NEXT: slli a0, a0, 8			; RV32I-NEXT: slli a0, a0, 8
	; RV32I-NEXT: sub a0, a0, a1			; RV32I-NEXT: sub a0, a0, a1
	; RV32I-NEXT: ret			; RV32I-NEXT: ret
	;			;
	; RV32IM-LABEL: muli32_m3840:			; RV32IM-LABEL: muli32_m3840:
	; RV32IM: # %bb.0:			; RV32IM: # %bb.0:
	; RV32IM-NEXT: lui a1, 1048575			; RV32IM-NEXT: lui a1, 1048575
	; RV32IM-NEXT: addi a1, a1, 256			; RV32IM-NEXT: addi a1, a1, 256
	; RV32IM-NEXT: mul a0, a0, a1			; RV32IM-NEXT: mul a0, a0, a1
	; RV32IM-NEXT: ret			; RV32IM-NEXT: ret
	;			;
	; RV64I-LABEL: muli32_m3840:			; RV64I-LABEL: muli32_m3840:
	; RV64I: # %bb.0:			; RV64I: # %bb.0:
	; RV64I-NEXT: slli a1, a0, 12			; RV64I-NEXT: slliw a1, a0, 12
	; RV64I-NEXT: slli a0, a0, 8			; RV64I-NEXT: slliw a0, a0, 8
	; RV64I-NEXT: subw a0, a0, a1			; RV64I-NEXT: subw a0, a0, a1
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IM-LABEL: muli32_m3840:			; RV64IM-LABEL: muli32_m3840:
	; RV64IM: # %bb.0:			; RV64IM: # %bb.0:
	; RV64IM-NEXT: slli a1, a0, 12			; RV64IM-NEXT: slliw a1, a0, 12
	; RV64IM-NEXT: slli a0, a0, 8			; RV64IM-NEXT: slliw a0, a0, 8
	; RV64IM-NEXT: subw a0, a0, a1			; RV64IM-NEXT: subw a0, a0, a1
	; RV64IM-NEXT: ret			; RV64IM-NEXT: ret
	%1 = mul i32 %a, -3840			%1 = mul i32 %a, -3840
	ret i32 %1			ret i32 %1
	}			}

	define i32 @muli32_m4352(i32 %a) nounwind {			define i32 @muli32_m4352(i32 %a) nounwind {
	; RV32I-LABEL: muli32_m4352:			; RV32I-LABEL: muli32_m4352:
	▲ Show 20 Lines • Show All 508 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/rv64i-demanded-bits.ll

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: llc -mtriple=riscv64 -mattr=+m -verify-machineinstrs < %s \| FileCheck %s			; RUN: llc -mtriple=riscv64 -mattr=+m -verify-machineinstrs < %s \| FileCheck %s

	; This test has multiple opportunities for SimplifyDemandedBits after type			; This test has multiple opportunities for SimplifyDemandedBits after type
	; legalization. There are 2 opportunities on the chain feeding the LHS of the			; legalization. There are 2 opportunities on the chain feeding the LHS of the
	; shl. And one opportunity on the shift amount. We previously weren't managing			; shl. And one opportunity on the shift amount. We previously weren't managing
	; the DAGCombiner worklist correctly and failed to get the RHS.			; the DAGCombiner worklist correctly and failed to get the RHS.

	define i32 @foo(i32 %x, i32 %y, i32 %z) {			define i32 @foo(i32 %x, i32 %y, i32 %z) {
	; CHECK-LABEL: foo:			; CHECK-LABEL: foo:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: mulw a0, a0, a0			; CHECK-NEXT: mulw a0, a0, a0
	; CHECK-NEXT: addi a0, a0, 1			; CHECK-NEXT: addiw a0, a0, 1
	; CHECK-NEXT: mul a0, a0, a0			; CHECK-NEXT: mulw a0, a0, a0
	; CHECK-NEXT: add a0, a0, a2			; CHECK-NEXT: addw a0, a0, a2
	; CHECK-NEXT: addi a0, a0, 1			; CHECK-NEXT: addiw a0, a0, 1
	; CHECK-NEXT: sllw a0, a0, a1			; CHECK-NEXT: sllw a0, a0, a1
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%b = mul i32 %x, %x			%b = mul i32 %x, %x
	%c = add i32 %b, 1			%c = add i32 %b, 1
	%d = mul i32 %c, %c			%d = mul i32 %c, %c
	%e = add i32 %d, %z			%e = add i32 %d, %z
	%f = add i32 %e, 1			%f = add i32 %e, 1
	%g = shl i32 %f, %y			%g = shl i32 %f, %y
	ret i32 %g			ret i32 %g
	}			}

llvm/test/CodeGen/RISCV/rv64i-exhaustive-w-insts.ll

Show First 20 Lines • Show All 172 Lines • ▼ Show 20 Lines
}		}

; 64-bit add followed by zero-extension is a safe option when a zeroext result		; 64-bit add followed by zero-extension is a safe option when a zeroext result
; is required.		; is required.

define zeroext i32 @zext_addw_aext_aext(i32 %a, i32 %b) nounwind {		define zeroext i32 @zext_addw_aext_aext(i32 %a, i32 %b) nounwind {
; RV64I-LABEL: zext_addw_aext_aext:		; RV64I-LABEL: zext_addw_aext_aext:
; RV64I: # %bb.0:		; RV64I: # %bb.0:
; RV64I-NEXT: add a0, a0, a1		; RV64I-NEXT: addw a0, a0, a1
; RV64I-NEXT: slli a0, a0, 32		; RV64I-NEXT: slli a0, a0, 32
; RV64I-NEXT: srli a0, a0, 32		; RV64I-NEXT: srli a0, a0, 32
; RV64I-NEXT: ret		; RV64I-NEXT: ret
%1 = add i32 %a, %b		%1 = add i32 %a, %b
ret i32 %1		ret i32 %1
}		}

define zeroext i32 @zext_addw_aext_sext(i32 %a, i32 signext %b) nounwind {		define zeroext i32 @zext_addw_aext_sext(i32 %a, i32 signext %b) nounwind {
; RV64I-LABEL: zext_addw_aext_sext:		; RV64I-LABEL: zext_addw_aext_sext:
; RV64I: # %bb.0:		; RV64I: # %bb.0:
; RV64I-NEXT: add a0, a0, a1		; RV64I-NEXT: addw a0, a0, a1
; RV64I-NEXT: slli a0, a0, 32		; RV64I-NEXT: slli a0, a0, 32
; RV64I-NEXT: srli a0, a0, 32		; RV64I-NEXT: srli a0, a0, 32
; RV64I-NEXT: ret		; RV64I-NEXT: ret
%1 = add i32 %a, %b		%1 = add i32 %a, %b
ret i32 %1		ret i32 %1
}		}

define zeroext i32 @zext_addw_aext_zext(i32 %a, i32 zeroext %b) nounwind {		define zeroext i32 @zext_addw_aext_zext(i32 %a, i32 zeroext %b) nounwind {
; RV64I-LABEL: zext_addw_aext_zext:		; RV64I-LABEL: zext_addw_aext_zext:
; RV64I: # %bb.0:		; RV64I: # %bb.0:
; RV64I-NEXT: add a0, a0, a1		; RV64I-NEXT: addw a0, a0, a1
; RV64I-NEXT: slli a0, a0, 32		; RV64I-NEXT: slli a0, a0, 32
; RV64I-NEXT: srli a0, a0, 32		; RV64I-NEXT: srli a0, a0, 32
; RV64I-NEXT: ret		; RV64I-NEXT: ret
%1 = add i32 %a, %b		%1 = add i32 %a, %b
ret i32 %1		ret i32 %1
}		}

define zeroext i32 @zext_addw_sext_aext(i32 signext %a, i32 %b) nounwind {		define zeroext i32 @zext_addw_sext_aext(i32 signext %a, i32 %b) nounwind {
; RV64I-LABEL: zext_addw_sext_aext:		; RV64I-LABEL: zext_addw_sext_aext:
; RV64I: # %bb.0:		; RV64I: # %bb.0:
; RV64I-NEXT: add a0, a0, a1		; RV64I-NEXT: addw a0, a0, a1
; RV64I-NEXT: slli a0, a0, 32		; RV64I-NEXT: slli a0, a0, 32
; RV64I-NEXT: srli a0, a0, 32		; RV64I-NEXT: srli a0, a0, 32
; RV64I-NEXT: ret		; RV64I-NEXT: ret
%1 = add i32 %a, %b		%1 = add i32 %a, %b
ret i32 %1		ret i32 %1
}		}

define zeroext i32 @zext_addw_sext_sext(i32 signext %a, i32 signext %b) nounwind {		define zeroext i32 @zext_addw_sext_sext(i32 signext %a, i32 signext %b) nounwind {
; RV64I-LABEL: zext_addw_sext_sext:		; RV64I-LABEL: zext_addw_sext_sext:
; RV64I: # %bb.0:		; RV64I: # %bb.0:
; RV64I-NEXT: add a0, a0, a1		; RV64I-NEXT: addw a0, a0, a1
; RV64I-NEXT: slli a0, a0, 32		; RV64I-NEXT: slli a0, a0, 32
; RV64I-NEXT: srli a0, a0, 32		; RV64I-NEXT: srli a0, a0, 32
; RV64I-NEXT: ret		; RV64I-NEXT: ret
%1 = add i32 %a, %b		%1 = add i32 %a, %b
ret i32 %1		ret i32 %1
}		}

define zeroext i32 @zext_addw_sext_zext(i32 signext %a, i32 zeroext %b) nounwind {		define zeroext i32 @zext_addw_sext_zext(i32 signext %a, i32 zeroext %b) nounwind {
; RV64I-LABEL: zext_addw_sext_zext:		; RV64I-LABEL: zext_addw_sext_zext:
; RV64I: # %bb.0:		; RV64I: # %bb.0:
; RV64I-NEXT: add a0, a0, a1		; RV64I-NEXT: addw a0, a0, a1
; RV64I-NEXT: slli a0, a0, 32		; RV64I-NEXT: slli a0, a0, 32
; RV64I-NEXT: srli a0, a0, 32		; RV64I-NEXT: srli a0, a0, 32
; RV64I-NEXT: ret		; RV64I-NEXT: ret
%1 = add i32 %a, %b		%1 = add i32 %a, %b
ret i32 %1		ret i32 %1
}		}

define zeroext i32 @zext_addw_zext_aext(i32 zeroext %a, i32 %b) nounwind {		define zeroext i32 @zext_addw_zext_aext(i32 zeroext %a, i32 %b) nounwind {
; RV64I-LABEL: zext_addw_zext_aext:		; RV64I-LABEL: zext_addw_zext_aext:
; RV64I: # %bb.0:		; RV64I: # %bb.0:
; RV64I-NEXT: add a0, a0, a1		; RV64I-NEXT: addw a0, a0, a1
; RV64I-NEXT: slli a0, a0, 32		; RV64I-NEXT: slli a0, a0, 32
; RV64I-NEXT: srli a0, a0, 32		; RV64I-NEXT: srli a0, a0, 32
; RV64I-NEXT: ret		; RV64I-NEXT: ret
%1 = add i32 %a, %b		%1 = add i32 %a, %b
ret i32 %1		ret i32 %1
}		}

define zeroext i32 @zext_addw_zext_sext(i32 zeroext %a, i32 signext %b) nounwind {		define zeroext i32 @zext_addw_zext_sext(i32 zeroext %a, i32 signext %b) nounwind {
; RV64I-LABEL: zext_addw_zext_sext:		; RV64I-LABEL: zext_addw_zext_sext:
; RV64I: # %bb.0:		; RV64I: # %bb.0:
; RV64I-NEXT: add a0, a0, a1		; RV64I-NEXT: addw a0, a0, a1
; RV64I-NEXT: slli a0, a0, 32		; RV64I-NEXT: slli a0, a0, 32
; RV64I-NEXT: srli a0, a0, 32		; RV64I-NEXT: srli a0, a0, 32
; RV64I-NEXT: ret		; RV64I-NEXT: ret
%1 = add i32 %a, %b		%1 = add i32 %a, %b
ret i32 %1		ret i32 %1
}		}

define zeroext i32 @zext_addw_zext_zext(i32 zeroext %a, i32 zeroext %b) nounwind {		define zeroext i32 @zext_addw_zext_zext(i32 zeroext %a, i32 zeroext %b) nounwind {
; RV64I-LABEL: zext_addw_zext_zext:		; RV64I-LABEL: zext_addw_zext_zext:
; RV64I: # %bb.0:		; RV64I: # %bb.0:
; RV64I-NEXT: add a0, a0, a1		; RV64I-NEXT: addw a0, a0, a1
; RV64I-NEXT: slli a0, a0, 32		; RV64I-NEXT: slli a0, a0, 32
; RV64I-NEXT: srli a0, a0, 32		; RV64I-NEXT: srli a0, a0, 32
; RV64I-NEXT: ret		; RV64I-NEXT: ret
%1 = add i32 %a, %b		%1 = add i32 %a, %b
ret i32 %1		ret i32 %1
}		}

; 64-bit sub is safe for an anyext result.		; 64-bit sub is safe for an anyext result.
▲ Show 20 Lines • Show All 162 Lines • ▼ Show 20 Lines	; RV64I-NEXT: ret
ret i32 %1		ret i32 %1
}		}

; 64-bit sub followed by zero-extension is safe for a zeroext result.		; 64-bit sub followed by zero-extension is safe for a zeroext result.

define zeroext i32 @zext_subw_aext_aext(i32 %a, i32 %b) nounwind {		define zeroext i32 @zext_subw_aext_aext(i32 %a, i32 %b) nounwind {
; RV64I-LABEL: zext_subw_aext_aext:		; RV64I-LABEL: zext_subw_aext_aext:
; RV64I: # %bb.0:		; RV64I: # %bb.0:
; RV64I-NEXT: sub a0, a0, a1		; RV64I-NEXT: subw a0, a0, a1
; RV64I-NEXT: slli a0, a0, 32		; RV64I-NEXT: slli a0, a0, 32
; RV64I-NEXT: srli a0, a0, 32		; RV64I-NEXT: srli a0, a0, 32
; RV64I-NEXT: ret		; RV64I-NEXT: ret
%1 = sub i32 %a, %b		%1 = sub i32 %a, %b
ret i32 %1		ret i32 %1
}		}

define zeroext i32 @zext_subw_aext_sext(i32 %a, i32 signext %b) nounwind {		define zeroext i32 @zext_subw_aext_sext(i32 %a, i32 signext %b) nounwind {
; RV64I-LABEL: zext_subw_aext_sext:		; RV64I-LABEL: zext_subw_aext_sext:
; RV64I: # %bb.0:		; RV64I: # %bb.0:
; RV64I-NEXT: sub a0, a0, a1		; RV64I-NEXT: subw a0, a0, a1
; RV64I-NEXT: slli a0, a0, 32		; RV64I-NEXT: slli a0, a0, 32
; RV64I-NEXT: srli a0, a0, 32		; RV64I-NEXT: srli a0, a0, 32
; RV64I-NEXT: ret		; RV64I-NEXT: ret
%1 = sub i32 %a, %b		%1 = sub i32 %a, %b
ret i32 %1		ret i32 %1
}		}

define zeroext i32 @zext_subw_aext_zext(i32 %a, i32 zeroext %b) nounwind {		define zeroext i32 @zext_subw_aext_zext(i32 %a, i32 zeroext %b) nounwind {
; RV64I-LABEL: zext_subw_aext_zext:		; RV64I-LABEL: zext_subw_aext_zext:
; RV64I: # %bb.0:		; RV64I: # %bb.0:
; RV64I-NEXT: sub a0, a0, a1		; RV64I-NEXT: subw a0, a0, a1
; RV64I-NEXT: slli a0, a0, 32		; RV64I-NEXT: slli a0, a0, 32
; RV64I-NEXT: srli a0, a0, 32		; RV64I-NEXT: srli a0, a0, 32
; RV64I-NEXT: ret		; RV64I-NEXT: ret
%1 = sub i32 %a, %b		%1 = sub i32 %a, %b
ret i32 %1		ret i32 %1
}		}

define zeroext i32 @zext_subw_sext_aext(i32 signext %a, i32 %b) nounwind {		define zeroext i32 @zext_subw_sext_aext(i32 signext %a, i32 %b) nounwind {
; RV64I-LABEL: zext_subw_sext_aext:		; RV64I-LABEL: zext_subw_sext_aext:
; RV64I: # %bb.0:		; RV64I: # %bb.0:
; RV64I-NEXT: sub a0, a0, a1		; RV64I-NEXT: subw a0, a0, a1
; RV64I-NEXT: slli a0, a0, 32		; RV64I-NEXT: slli a0, a0, 32
; RV64I-NEXT: srli a0, a0, 32		; RV64I-NEXT: srli a0, a0, 32
; RV64I-NEXT: ret		; RV64I-NEXT: ret
%1 = sub i32 %a, %b		%1 = sub i32 %a, %b
ret i32 %1		ret i32 %1
}		}

define zeroext i32 @zext_subw_sext_sext(i32 signext %a, i32 signext %b) nounwind {		define zeroext i32 @zext_subw_sext_sext(i32 signext %a, i32 signext %b) nounwind {
; RV64I-LABEL: zext_subw_sext_sext:		; RV64I-LABEL: zext_subw_sext_sext:
; RV64I: # %bb.0:		; RV64I: # %bb.0:
; RV64I-NEXT: sub a0, a0, a1		; RV64I-NEXT: subw a0, a0, a1
; RV64I-NEXT: slli a0, a0, 32		; RV64I-NEXT: slli a0, a0, 32
; RV64I-NEXT: srli a0, a0, 32		; RV64I-NEXT: srli a0, a0, 32
; RV64I-NEXT: ret		; RV64I-NEXT: ret
%1 = sub i32 %a, %b		%1 = sub i32 %a, %b
ret i32 %1		ret i32 %1
}		}

define zeroext i32 @zext_subw_sext_zext(i32 signext %a, i32 zeroext %b) nounwind {		define zeroext i32 @zext_subw_sext_zext(i32 signext %a, i32 zeroext %b) nounwind {
; RV64I-LABEL: zext_subw_sext_zext:		; RV64I-LABEL: zext_subw_sext_zext:
; RV64I: # %bb.0:		; RV64I: # %bb.0:
; RV64I-NEXT: sub a0, a0, a1		; RV64I-NEXT: subw a0, a0, a1
; RV64I-NEXT: slli a0, a0, 32		; RV64I-NEXT: slli a0, a0, 32
; RV64I-NEXT: srli a0, a0, 32		; RV64I-NEXT: srli a0, a0, 32
; RV64I-NEXT: ret		; RV64I-NEXT: ret
%1 = sub i32 %a, %b		%1 = sub i32 %a, %b
ret i32 %1		ret i32 %1
}		}

define zeroext i32 @zext_subw_zext_aext(i32 zeroext %a, i32 %b) nounwind {		define zeroext i32 @zext_subw_zext_aext(i32 zeroext %a, i32 %b) nounwind {
; RV64I-LABEL: zext_subw_zext_aext:		; RV64I-LABEL: zext_subw_zext_aext:
; RV64I: # %bb.0:		; RV64I: # %bb.0:
; RV64I-NEXT: sub a0, a0, a1		; RV64I-NEXT: subw a0, a0, a1
; RV64I-NEXT: slli a0, a0, 32		; RV64I-NEXT: slli a0, a0, 32
; RV64I-NEXT: srli a0, a0, 32		; RV64I-NEXT: srli a0, a0, 32
; RV64I-NEXT: ret		; RV64I-NEXT: ret
%1 = sub i32 %a, %b		%1 = sub i32 %a, %b
ret i32 %1		ret i32 %1
}		}

define zeroext i32 @zext_subw_zext_sext(i32 zeroext %a, i32 signext %b) nounwind {		define zeroext i32 @zext_subw_zext_sext(i32 zeroext %a, i32 signext %b) nounwind {
; RV64I-LABEL: zext_subw_zext_sext:		; RV64I-LABEL: zext_subw_zext_sext:
; RV64I: # %bb.0:		; RV64I: # %bb.0:
; RV64I-NEXT: sub a0, a0, a1		; RV64I-NEXT: subw a0, a0, a1
; RV64I-NEXT: slli a0, a0, 32		; RV64I-NEXT: slli a0, a0, 32
; RV64I-NEXT: srli a0, a0, 32		; RV64I-NEXT: srli a0, a0, 32
; RV64I-NEXT: ret		; RV64I-NEXT: ret
%1 = sub i32 %a, %b		%1 = sub i32 %a, %b
ret i32 %1		ret i32 %1
}		}

define zeroext i32 @zext_subw_zext_zext(i32 zeroext %a, i32 zeroext %b) nounwind {		define zeroext i32 @zext_subw_zext_zext(i32 zeroext %a, i32 zeroext %b) nounwind {
; RV64I-LABEL: zext_subw_zext_zext:		; RV64I-LABEL: zext_subw_zext_zext:
; RV64I: # %bb.0:		; RV64I: # %bb.0:
; RV64I-NEXT: sub a0, a0, a1		; RV64I-NEXT: subw a0, a0, a1
; RV64I-NEXT: slli a0, a0, 32		; RV64I-NEXT: slli a0, a0, 32
; RV64I-NEXT: srli a0, a0, 32		; RV64I-NEXT: srli a0, a0, 32
; RV64I-NEXT: ret		; RV64I-NEXT: ret
%1 = sub i32 %a, %b		%1 = sub i32 %a, %b
ret i32 %1		ret i32 %1
}		}

; 64-bit sll is a safe choice for an anyext result.		; 64-bit sll is a safe choice for an anyext result.
▲ Show 20 Lines • Show All 837 Lines • ▼ Show 20 Lines
; RV64I-NEXT: ret		; RV64I-NEXT: ret
%1 = add i32 %a, 6		%1 = add i32 %a, 6
ret i32 %1		ret i32 %1
}		}

define zeroext i32 @zext_addiw_aext(i32 %a) nounwind {		define zeroext i32 @zext_addiw_aext(i32 %a) nounwind {
; RV64I-LABEL: zext_addiw_aext:		; RV64I-LABEL: zext_addiw_aext:
; RV64I: # %bb.0:		; RV64I: # %bb.0:
; RV64I-NEXT: addi a0, a0, 7		; RV64I-NEXT: addiw a0, a0, 7
; RV64I-NEXT: slli a0, a0, 32		; RV64I-NEXT: slli a0, a0, 32
; RV64I-NEXT: srli a0, a0, 32		; RV64I-NEXT: srli a0, a0, 32
; RV64I-NEXT: ret		; RV64I-NEXT: ret
%1 = add i32 %a, 7		%1 = add i32 %a, 7
ret i32 %1		ret i32 %1
}		}

define zeroext i32 @zext_addiw_sext(i32 signext %a) nounwind {		define zeroext i32 @zext_addiw_sext(i32 signext %a) nounwind {
; RV64I-LABEL: zext_addiw_sext:		; RV64I-LABEL: zext_addiw_sext:
; RV64I: # %bb.0:		; RV64I: # %bb.0:
; RV64I-NEXT: addi a0, a0, 8		; RV64I-NEXT: addiw a0, a0, 8
; RV64I-NEXT: slli a0, a0, 32		; RV64I-NEXT: slli a0, a0, 32
; RV64I-NEXT: srli a0, a0, 32		; RV64I-NEXT: srli a0, a0, 32
; RV64I-NEXT: ret		; RV64I-NEXT: ret
%1 = add i32 %a, 8		%1 = add i32 %a, 8
ret i32 %1		ret i32 %1
}		}

define zeroext i32 @zext_addiw_zext(i32 zeroext %a) nounwind {		define zeroext i32 @zext_addiw_zext(i32 zeroext %a) nounwind {
; RV64I-LABEL: zext_addiw_zext:		; RV64I-LABEL: zext_addiw_zext:
; RV64I: # %bb.0:		; RV64I: # %bb.0:
; RV64I-NEXT: addi a0, a0, 9		; RV64I-NEXT: addiw a0, a0, 9
; RV64I-NEXT: slli a0, a0, 32		; RV64I-NEXT: slli a0, a0, 32
; RV64I-NEXT: srli a0, a0, 32		; RV64I-NEXT: srli a0, a0, 32
; RV64I-NEXT: ret		; RV64I-NEXT: ret
%1 = add i32 %a, 9		%1 = add i32 %a, 9
ret i32 %1		ret i32 %1
}		}

; slliw should be selected whenever the return is signext.		; slliw should be selected whenever the return is signext.
▲ Show 20 Lines • Show All 264 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/rv64i-w-insts-legalization.ll

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: llc -mtriple=riscv64 -mattr=+m -verify-machineinstrs < %s \| FileCheck %s			; RUN: llc -mtriple=riscv64 -mattr=+m -verify-machineinstrs < %s \| FileCheck %s

	define signext i32 @addw(i32 signext %s, i32 signext %n, i32 signext %k) nounwind {			define signext i32 @addw(i32 signext %s, i32 signext %n, i32 signext %k) nounwind {
	; CHECK-LABEL: addw:			; CHECK-LABEL: addw:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: bge a0, a1, .LBB0_2			; CHECK-NEXT: bge a0, a1, .LBB0_2
	; CHECK-NEXT: # %bb.1: # %for.body.preheader			; CHECK-NEXT: # %bb.1: # %for.body.preheader
	; CHECK-NEXT: not a2, a0			; CHECK-NEXT: not a2, a0
	; CHECK-NEXT: add a2, a2, a1			; CHECK-NEXT: addw a2, a2, a1
	; CHECK-NEXT: addi a3, a0, 1			; CHECK-NEXT: addiw a3, a0, 1
	; CHECK-NEXT: mul a3, a2, a3			; CHECK-NEXT: mulw a3, a2, a3
	; CHECK-NEXT: sub a1, a1, a0			; CHECK-NEXT: subw a1, a1, a0
	; CHECK-NEXT: addi a1, a1, -2			; CHECK-NEXT: addiw a1, a1, -2
	; CHECK-NEXT: slli a1, a1, 32			; CHECK-NEXT: slli a1, a1, 32
	; CHECK-NEXT: slli a2, a2, 32			; CHECK-NEXT: slli a2, a2, 32
	; CHECK-NEXT: mulhu a1, a2, a1			; CHECK-NEXT: mulhu a1, a2, a1
	; CHECK-NEXT: srli a1, a1, 1			; CHECK-NEXT: srli a1, a1, 1
	; CHECK-NEXT: add a0, a3, a0			; CHECK-NEXT: addw a0, a3, a0
	; CHECK-NEXT: addw a0, a0, a1			; CHECK-NEXT: addw a0, a0, a1
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	; CHECK-NEXT: .LBB0_2:			; CHECK-NEXT: .LBB0_2:
	; CHECK-NEXT: mv a0, zero			; CHECK-NEXT: mv a0, zero
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	entry:			entry:
	%cmp6 = icmp slt i32 %s, %n			%cmp6 = icmp slt i32 %s, %n
	br i1 %cmp6, label %for.body.preheader, label %for.cond.cleanup			br i1 %cmp6, label %for.body.preheader, label %for.cond.cleanup
	Show All 20 Lines
	}			}

	define signext i32 @subw(i32 signext %s, i32 signext %n, i32 signext %k) nounwind {			define signext i32 @subw(i32 signext %s, i32 signext %n, i32 signext %k) nounwind {
	; CHECK-LABEL: subw:			; CHECK-LABEL: subw:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: bge a0, a1, .LBB1_2			; CHECK-NEXT: bge a0, a1, .LBB1_2
	; CHECK-NEXT: # %bb.1: # %for.body.preheader			; CHECK-NEXT: # %bb.1: # %for.body.preheader
	; CHECK-NEXT: not a2, a0			; CHECK-NEXT: not a2, a0
	; CHECK-NEXT: add a3, a2, a1			; CHECK-NEXT: addw a3, a2, a1
	; CHECK-NEXT: mul a2, a3, a2			; CHECK-NEXT: mulw a2, a3, a2
	; CHECK-NEXT: sub a1, a1, a0			; CHECK-NEXT: subw a1, a1, a0
	; CHECK-NEXT: addi a1, a1, -2			; CHECK-NEXT: addiw a1, a1, -2
	; CHECK-NEXT: slli a1, a1, 32			; CHECK-NEXT: slli a1, a1, 32
	; CHECK-NEXT: slli a3, a3, 32			; CHECK-NEXT: slli a3, a3, 32
	; CHECK-NEXT: mulhu a1, a3, a1			; CHECK-NEXT: mulhu a1, a3, a1
	; CHECK-NEXT: srli a1, a1, 1			; CHECK-NEXT: srli a1, a1, 1
	; CHECK-NEXT: sub a0, a2, a0			; CHECK-NEXT: subw a0, a2, a0
	; CHECK-NEXT: subw a0, a0, a1			; CHECK-NEXT: subw a0, a0, a1
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	; CHECK-NEXT: .LBB1_2:			; CHECK-NEXT: .LBB1_2:
	; CHECK-NEXT: mv a0, zero			; CHECK-NEXT: mv a0, zero
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	entry:			entry:
	%cmp6 = icmp slt i32 %s, %n			%cmp6 = icmp slt i32 %s, %n
	br i1 %cmp6, label %for.body.preheader, label %for.cond.cleanup			br i1 %cmp6, label %for.body.preheader, label %for.cond.cleanup
	Show All 21 Lines

llvm/test/CodeGen/RISCV/rv64m-exhaustive-w-insts.ll

	Show First 20 Lines • Show All 165 Lines • ▼ Show 20 Lines
	; RV64IM-NEXT: ret			; RV64IM-NEXT: ret
	%1 = mul i32 %a, %b			%1 = mul i32 %a, %b
	ret i32 %1			ret i32 %1
	}			}

	define zeroext i32 @zext_mulw_aext_aext(i32 %a, i32 %b) nounwind {			define zeroext i32 @zext_mulw_aext_aext(i32 %a, i32 %b) nounwind {
	; RV64IM-LABEL: zext_mulw_aext_aext:			; RV64IM-LABEL: zext_mulw_aext_aext:
	; RV64IM: # %bb.0:			; RV64IM: # %bb.0:
	; RV64IM-NEXT: mul a0, a0, a1			; RV64IM-NEXT: mulw a0, a0, a1
	; RV64IM-NEXT: slli a0, a0, 32			; RV64IM-NEXT: slli a0, a0, 32
	; RV64IM-NEXT: srli a0, a0, 32			; RV64IM-NEXT: srli a0, a0, 32
	; RV64IM-NEXT: ret			; RV64IM-NEXT: ret
	%1 = mul i32 %a, %b			%1 = mul i32 %a, %b
	ret i32 %1			ret i32 %1
	}			}

	define zeroext i32 @zext_mulw_aext_sext(i32 %a, i32 signext %b) nounwind {			define zeroext i32 @zext_mulw_aext_sext(i32 %a, i32 signext %b) nounwind {
	; RV64IM-LABEL: zext_mulw_aext_sext:			; RV64IM-LABEL: zext_mulw_aext_sext:
	; RV64IM: # %bb.0:			; RV64IM: # %bb.0:
	; RV64IM-NEXT: mul a0, a0, a1			; RV64IM-NEXT: mulw a0, a0, a1
	; RV64IM-NEXT: slli a0, a0, 32			; RV64IM-NEXT: slli a0, a0, 32
	; RV64IM-NEXT: srli a0, a0, 32			; RV64IM-NEXT: srli a0, a0, 32
	; RV64IM-NEXT: ret			; RV64IM-NEXT: ret
	%1 = mul i32 %a, %b			%1 = mul i32 %a, %b
	ret i32 %1			ret i32 %1
	}			}

	define zeroext i32 @zext_mulw_aext_zext(i32 %a, i32 zeroext %b) nounwind {			define zeroext i32 @zext_mulw_aext_zext(i32 %a, i32 zeroext %b) nounwind {
	; RV64IM-LABEL: zext_mulw_aext_zext:			; RV64IM-LABEL: zext_mulw_aext_zext:
	; RV64IM: # %bb.0:			; RV64IM: # %bb.0:
	; RV64IM-NEXT: mul a0, a0, a1			; RV64IM-NEXT: mulw a0, a0, a1
	; RV64IM-NEXT: slli a0, a0, 32			; RV64IM-NEXT: slli a0, a0, 32
	; RV64IM-NEXT: srli a0, a0, 32			; RV64IM-NEXT: srli a0, a0, 32
	; RV64IM-NEXT: ret			; RV64IM-NEXT: ret
	%1 = mul i32 %a, %b			%1 = mul i32 %a, %b
	ret i32 %1			ret i32 %1
	}			}

	define zeroext i32 @zext_mulw_sext_aext(i32 signext %a, i32 %b) nounwind {			define zeroext i32 @zext_mulw_sext_aext(i32 signext %a, i32 %b) nounwind {
	; RV64IM-LABEL: zext_mulw_sext_aext:			; RV64IM-LABEL: zext_mulw_sext_aext:
	; RV64IM: # %bb.0:			; RV64IM: # %bb.0:
	; RV64IM-NEXT: mul a0, a0, a1			; RV64IM-NEXT: mulw a0, a0, a1
	; RV64IM-NEXT: slli a0, a0, 32			; RV64IM-NEXT: slli a0, a0, 32
	; RV64IM-NEXT: srli a0, a0, 32			; RV64IM-NEXT: srli a0, a0, 32
	; RV64IM-NEXT: ret			; RV64IM-NEXT: ret
	%1 = mul i32 %a, %b			%1 = mul i32 %a, %b
	ret i32 %1			ret i32 %1
	}			}

	define zeroext i32 @zext_mulw_sext_sext(i32 signext %a, i32 signext %b) nounwind {			define zeroext i32 @zext_mulw_sext_sext(i32 signext %a, i32 signext %b) nounwind {
	; RV64IM-LABEL: zext_mulw_sext_sext:			; RV64IM-LABEL: zext_mulw_sext_sext:
	; RV64IM: # %bb.0:			; RV64IM: # %bb.0:
	; RV64IM-NEXT: mul a0, a0, a1			; RV64IM-NEXT: mulw a0, a0, a1
	; RV64IM-NEXT: slli a0, a0, 32			; RV64IM-NEXT: slli a0, a0, 32
	; RV64IM-NEXT: srli a0, a0, 32			; RV64IM-NEXT: srli a0, a0, 32
	; RV64IM-NEXT: ret			; RV64IM-NEXT: ret
	%1 = mul i32 %a, %b			%1 = mul i32 %a, %b
	ret i32 %1			ret i32 %1
	}			}

	define zeroext i32 @zext_mulw_sext_zext(i32 signext %a, i32 zeroext %b) nounwind {			define zeroext i32 @zext_mulw_sext_zext(i32 signext %a, i32 zeroext %b) nounwind {
	; RV64IM-LABEL: zext_mulw_sext_zext:			; RV64IM-LABEL: zext_mulw_sext_zext:
	; RV64IM: # %bb.0:			; RV64IM: # %bb.0:
	; RV64IM-NEXT: mul a0, a0, a1			; RV64IM-NEXT: mulw a0, a0, a1
	; RV64IM-NEXT: slli a0, a0, 32			; RV64IM-NEXT: slli a0, a0, 32
	; RV64IM-NEXT: srli a0, a0, 32			; RV64IM-NEXT: srli a0, a0, 32
	; RV64IM-NEXT: ret			; RV64IM-NEXT: ret
	%1 = mul i32 %a, %b			%1 = mul i32 %a, %b
	ret i32 %1			ret i32 %1
	}			}

	define zeroext i32 @zext_mulw_zext_aext(i32 zeroext %a, i32 %b) nounwind {			define zeroext i32 @zext_mulw_zext_aext(i32 zeroext %a, i32 %b) nounwind {
	; RV64IM-LABEL: zext_mulw_zext_aext:			; RV64IM-LABEL: zext_mulw_zext_aext:
	; RV64IM: # %bb.0:			; RV64IM: # %bb.0:
	; RV64IM-NEXT: mul a0, a0, a1			; RV64IM-NEXT: mulw a0, a0, a1
	; RV64IM-NEXT: slli a0, a0, 32			; RV64IM-NEXT: slli a0, a0, 32
	; RV64IM-NEXT: srli a0, a0, 32			; RV64IM-NEXT: srli a0, a0, 32
	; RV64IM-NEXT: ret			; RV64IM-NEXT: ret
	%1 = mul i32 %a, %b			%1 = mul i32 %a, %b
	ret i32 %1			ret i32 %1
	}			}

	define zeroext i32 @zext_mulw_zext_sext(i32 zeroext %a, i32 signext %b) nounwind {			define zeroext i32 @zext_mulw_zext_sext(i32 zeroext %a, i32 signext %b) nounwind {
	; RV64IM-LABEL: zext_mulw_zext_sext:			; RV64IM-LABEL: zext_mulw_zext_sext:
	; RV64IM: # %bb.0:			; RV64IM: # %bb.0:
	; RV64IM-NEXT: mul a0, a0, a1			; RV64IM-NEXT: mulw a0, a0, a1
	; RV64IM-NEXT: slli a0, a0, 32			; RV64IM-NEXT: slli a0, a0, 32
	; RV64IM-NEXT: srli a0, a0, 32			; RV64IM-NEXT: srli a0, a0, 32
	; RV64IM-NEXT: ret			; RV64IM-NEXT: ret
	%1 = mul i32 %a, %b			%1 = mul i32 %a, %b
	ret i32 %1			ret i32 %1
	}			}

	define zeroext i32 @zext_mulw_zext_zext(i32 zeroext %a, i32 zeroext %b) nounwind {			define zeroext i32 @zext_mulw_zext_zext(i32 zeroext %a, i32 zeroext %b) nounwind {
	; RV64IM-LABEL: zext_mulw_zext_zext:			; RV64IM-LABEL: zext_mulw_zext_zext:
	; RV64IM: # %bb.0:			; RV64IM: # %bb.0:
	; RV64IM-NEXT: mul a0, a0, a1			; RV64IM-NEXT: mulw a0, a0, a1
	; RV64IM-NEXT: slli a0, a0, 32			; RV64IM-NEXT: slli a0, a0, 32
	; RV64IM-NEXT: srli a0, a0, 32			; RV64IM-NEXT: srli a0, a0, 32
	; RV64IM-NEXT: ret			; RV64IM-NEXT: ret
	%1 = mul i32 %a, %b			%1 = mul i32 %a, %b
	ret i32 %1			ret i32 %1
	}			}

	define i32 @aext_divuw_aext_aext(i32 %a, i32 %b) nounwind {			define i32 @aext_divuw_aext_aext(i32 %a, i32 %b) nounwind {
	▲ Show 20 Lines • Show All 1,136 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/rv64zbb-zbp.ll

Show First 20 Lines • Show All 164 Lines • ▼ Show 20 Lines
}		}

declare i32 @llvm.fshl.i32(i32, i32, i32)		declare i32 @llvm.fshl.i32(i32, i32, i32)

define signext i32 @rol_i32(i32 signext %a, i32 signext %b) nounwind {		define signext i32 @rol_i32(i32 signext %a, i32 signext %b) nounwind {
; RV64I-LABEL: rol_i32:		; RV64I-LABEL: rol_i32:
; RV64I: # %bb.0:		; RV64I: # %bb.0:
; RV64I-NEXT: sllw a2, a0, a1		; RV64I-NEXT: sllw a2, a0, a1
; RV64I-NEXT: neg a1, a1		; RV64I-NEXT: negw a1, a1
; RV64I-NEXT: srlw a0, a0, a1		; RV64I-NEXT: srlw a0, a0, a1
; RV64I-NEXT: or a0, a2, a0		; RV64I-NEXT: or a0, a2, a0
; RV64I-NEXT: ret		; RV64I-NEXT: ret
;		;
; RV64B-LABEL: rol_i32:		; RV64B-LABEL: rol_i32:
; RV64B: # %bb.0:		; RV64B: # %bb.0:
; RV64B-NEXT: rolw a0, a0, a1		; RV64B-NEXT: rolw a0, a0, a1
; RV64B-NEXT: ret		; RV64B-NEXT: ret
Show All 11 Lines	; RV64ZBP-NEXT: ret
ret i32 %1		ret i32 %1
}		}

; Similar to rol_i32, but doesn't sign extend the result.		; Similar to rol_i32, but doesn't sign extend the result.
define void @rol_i32_nosext(i32 signext %a, i32 signext %b, i32* %x) nounwind {		define void @rol_i32_nosext(i32 signext %a, i32 signext %b, i32* %x) nounwind {
; RV64I-LABEL: rol_i32_nosext:		; RV64I-LABEL: rol_i32_nosext:
; RV64I: # %bb.0:		; RV64I: # %bb.0:
; RV64I-NEXT: sllw a3, a0, a1		; RV64I-NEXT: sllw a3, a0, a1
; RV64I-NEXT: neg a1, a1		; RV64I-NEXT: negw a1, a1
; RV64I-NEXT: srlw a0, a0, a1		; RV64I-NEXT: srlw a0, a0, a1
; RV64I-NEXT: or a0, a3, a0		; RV64I-NEXT: or a0, a3, a0
; RV64I-NEXT: sw a0, 0(a2)		; RV64I-NEXT: sw a0, 0(a2)
; RV64I-NEXT: ret		; RV64I-NEXT: ret
;		;
; RV64B-LABEL: rol_i32_nosext:		; RV64B-LABEL: rol_i32_nosext:
; RV64B: # %bb.0:		; RV64B: # %bb.0:
; RV64B-NEXT: rolw a0, a0, a1		; RV64B-NEXT: rolw a0, a0, a1
Show All 16 Lines	; RV64ZBP-NEXT: ret
ret void		ret void
}		}

define signext i32 @rol_i32_neg_constant_rhs(i32 signext %a) nounwind {		define signext i32 @rol_i32_neg_constant_rhs(i32 signext %a) nounwind {
; RV64I-LABEL: rol_i32_neg_constant_rhs:		; RV64I-LABEL: rol_i32_neg_constant_rhs:
; RV64I: # %bb.0:		; RV64I: # %bb.0:
; RV64I-NEXT: addi a1, zero, -2		; RV64I-NEXT: addi a1, zero, -2
; RV64I-NEXT: sllw a2, a1, a0		; RV64I-NEXT: sllw a2, a1, a0
; RV64I-NEXT: neg a0, a0		; RV64I-NEXT: negw a0, a0
; RV64I-NEXT: srlw a0, a1, a0		; RV64I-NEXT: srlw a0, a1, a0
; RV64I-NEXT: or a0, a2, a0		; RV64I-NEXT: or a0, a2, a0
; RV64I-NEXT: ret		; RV64I-NEXT: ret
;		;
; RV64B-LABEL: rol_i32_neg_constant_rhs:		; RV64B-LABEL: rol_i32_neg_constant_rhs:
; RV64B: # %bb.0:		; RV64B: # %bb.0:
; RV64B-NEXT: addi a1, zero, -2		; RV64B-NEXT: addi a1, zero, -2
; RV64B-NEXT: rolw a0, a1, a0		; RV64B-NEXT: rolw a0, a1, a0
▲ Show 20 Lines • Show All 44 Lines • ▼ Show 20 Lines
}		}

declare i32 @llvm.fshr.i32(i32, i32, i32)		declare i32 @llvm.fshr.i32(i32, i32, i32)

define signext i32 @ror_i32(i32 signext %a, i32 signext %b) nounwind {		define signext i32 @ror_i32(i32 signext %a, i32 signext %b) nounwind {
; RV64I-LABEL: ror_i32:		; RV64I-LABEL: ror_i32:
; RV64I: # %bb.0:		; RV64I: # %bb.0:
; RV64I-NEXT: srlw a2, a0, a1		; RV64I-NEXT: srlw a2, a0, a1
; RV64I-NEXT: neg a1, a1		; RV64I-NEXT: negw a1, a1
; RV64I-NEXT: sllw a0, a0, a1		; RV64I-NEXT: sllw a0, a0, a1
; RV64I-NEXT: or a0, a2, a0		; RV64I-NEXT: or a0, a2, a0
; RV64I-NEXT: ret		; RV64I-NEXT: ret
;		;
; RV64B-LABEL: ror_i32:		; RV64B-LABEL: ror_i32:
; RV64B: # %bb.0:		; RV64B: # %bb.0:
; RV64B-NEXT: rorw a0, a0, a1		; RV64B-NEXT: rorw a0, a0, a1
; RV64B-NEXT: ret		; RV64B-NEXT: ret
Show All 11 Lines	; RV64ZBP-NEXT: ret
ret i32 %1		ret i32 %1
}		}

; Similar to ror_i32, but doesn't sign extend the result.		; Similar to ror_i32, but doesn't sign extend the result.
define void @ror_i32_nosext(i32 signext %a, i32 signext %b, i32* %x) nounwind {		define void @ror_i32_nosext(i32 signext %a, i32 signext %b, i32* %x) nounwind {
; RV64I-LABEL: ror_i32_nosext:		; RV64I-LABEL: ror_i32_nosext:
; RV64I: # %bb.0:		; RV64I: # %bb.0:
; RV64I-NEXT: srlw a3, a0, a1		; RV64I-NEXT: srlw a3, a0, a1
; RV64I-NEXT: neg a1, a1		; RV64I-NEXT: negw a1, a1
; RV64I-NEXT: sllw a0, a0, a1		; RV64I-NEXT: sllw a0, a0, a1
; RV64I-NEXT: or a0, a3, a0		; RV64I-NEXT: or a0, a3, a0
; RV64I-NEXT: sw a0, 0(a2)		; RV64I-NEXT: sw a0, 0(a2)
; RV64I-NEXT: ret		; RV64I-NEXT: ret
;		;
; RV64B-LABEL: ror_i32_nosext:		; RV64B-LABEL: ror_i32_nosext:
; RV64B: # %bb.0:		; RV64B: # %bb.0:
; RV64B-NEXT: rorw a0, a0, a1		; RV64B-NEXT: rorw a0, a0, a1
Show All 16 Lines	; RV64ZBP-NEXT: ret
ret void		ret void
}		}

define signext i32 @ror_i32_neg_constant_rhs(i32 signext %a) nounwind {		define signext i32 @ror_i32_neg_constant_rhs(i32 signext %a) nounwind {
; RV64I-LABEL: ror_i32_neg_constant_rhs:		; RV64I-LABEL: ror_i32_neg_constant_rhs:
; RV64I: # %bb.0:		; RV64I: # %bb.0:
; RV64I-NEXT: addi a1, zero, -2		; RV64I-NEXT: addi a1, zero, -2
; RV64I-NEXT: srlw a2, a1, a0		; RV64I-NEXT: srlw a2, a1, a0
; RV64I-NEXT: neg a0, a0		; RV64I-NEXT: negw a0, a0
; RV64I-NEXT: sllw a0, a1, a0		; RV64I-NEXT: sllw a0, a1, a0
; RV64I-NEXT: or a0, a2, a0		; RV64I-NEXT: or a0, a2, a0
; RV64I-NEXT: ret		; RV64I-NEXT: ret
;		;
; RV64B-LABEL: ror_i32_neg_constant_rhs:		; RV64B-LABEL: ror_i32_neg_constant_rhs:
; RV64B: # %bb.0:		; RV64B: # %bb.0:
; RV64B-NEXT: addi a1, zero, -2		; RV64B-NEXT: addi a1, zero, -2
; RV64B-NEXT: rorw a0, a1, a0		; RV64B-NEXT: rorw a0, a1, a0
▲ Show 20 Lines • Show All 421 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/rv64zbb.ll

	Show First 20 Lines • Show All 259 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: sub a0, s0, a1			; RV64I-NEXT: sub a0, s0, a1
	; RV64I-NEXT: ld s0, 0(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld s0, 0(sp) # 8-byte Folded Reload
	; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld ra, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: addi sp, sp, 16			; RV64I-NEXT: addi sp, sp, 16
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64B-LABEL: log2_ceil_i32:			; RV64B-LABEL: log2_ceil_i32:
	; RV64B: # %bb.0:			; RV64B: # %bb.0:
	; RV64B-NEXT: addi a0, a0, -1			; RV64B-NEXT: addiw a0, a0, -1
	; RV64B-NEXT: clzw a0, a0			; RV64B-NEXT: clzw a0, a0
	; RV64B-NEXT: addi a1, zero, 32			; RV64B-NEXT: addi a1, zero, 32
	; RV64B-NEXT: sub a0, a1, a0			; RV64B-NEXT: sub a0, a1, a0
	; RV64B-NEXT: ret			; RV64B-NEXT: ret
	;			;
	; RV64ZBB-LABEL: log2_ceil_i32:			; RV64ZBB-LABEL: log2_ceil_i32:
	; RV64ZBB: # %bb.0:			; RV64ZBB: # %bb.0:
	; RV64ZBB-NEXT: addi a0, a0, -1			; RV64ZBB-NEXT: addiw a0, a0, -1
	; RV64ZBB-NEXT: clzw a0, a0			; RV64ZBB-NEXT: clzw a0, a0
	; RV64ZBB-NEXT: addi a1, zero, 32			; RV64ZBB-NEXT: addi a1, zero, 32
	; RV64ZBB-NEXT: sub a0, a1, a0			; RV64ZBB-NEXT: sub a0, a1, a0
	; RV64ZBB-NEXT: ret			; RV64ZBB-NEXT: ret
	%1 = sub i32 %a, 1			%1 = sub i32 %a, 1
	%2 = call i32 @llvm.ctlz.i32(i32 %1, i1 false)			%2 = call i32 @llvm.ctlz.i32(i32 %1, i1 false)
	%3 = sub i32 32, %2			%3 = sub i32 32, %2
	ret i32 %3			ret i32 %3
	▲ Show 20 Lines • Show All 1,337 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-ctlz.ll

This file is larger than 256 KB, so syntax highlighting is disabled by default.

	Show First 20 Lines • Show All 531 Lines • ▼ Show 20 Lines
	; LMULMAX2-RV64-NEXT: lui a4, 4112			; LMULMAX2-RV64-NEXT: lui a4, 4112
	; LMULMAX2-RV64-NEXT: addiw a4, a4, 257			; LMULMAX2-RV64-NEXT: addiw a4, a4, 257
	; LMULMAX2-RV64-NEXT: slli a4, a4, 16			; LMULMAX2-RV64-NEXT: slli a4, a4, 16
	; LMULMAX2-RV64-NEXT: addi a4, a4, 257			; LMULMAX2-RV64-NEXT: addi a4, a4, 257
	; LMULMAX2-RV64-NEXT: slli a4, a4, 16			; LMULMAX2-RV64-NEXT: slli a4, a4, 16
	; LMULMAX2-RV64-NEXT: addi a4, a4, 257			; LMULMAX2-RV64-NEXT: addi a4, a4, 257
	; LMULMAX2-RV64-NEXT: mul a5, a5, a4			; LMULMAX2-RV64-NEXT: mul a5, a5, a4
	; LMULMAX2-RV64-NEXT: srli a5, a5, 56			; LMULMAX2-RV64-NEXT: srli a5, a5, 56
	; LMULMAX2-RV64-NEXT: addi a5, a5, -56			; LMULMAX2-RV64-NEXT: addiw a5, a5, -56
	; LMULMAX2-RV64-NEXT: sb a5, 16(sp)			; LMULMAX2-RV64-NEXT: sb a5, 16(sp)
	; LMULMAX2-RV64-NEXT: vsetivli zero, 1, e8, m1, ta, mu			; LMULMAX2-RV64-NEXT: vsetivli zero, 1, e8, m1, ta, mu
	; LMULMAX2-RV64-NEXT: vslidedown.vi v26, v25, 15			; LMULMAX2-RV64-NEXT: vslidedown.vi v26, v25, 15
	; LMULMAX2-RV64-NEXT: vmv.x.s a5, v26			; LMULMAX2-RV64-NEXT: vmv.x.s a5, v26
	; LMULMAX2-RV64-NEXT: andi a5, a5, 255			; LMULMAX2-RV64-NEXT: andi a5, a5, 255
	; LMULMAX2-RV64-NEXT: srli a1, a5, 1			; LMULMAX2-RV64-NEXT: srli a1, a5, 1
	; LMULMAX2-RV64-NEXT: or a1, a5, a1			; LMULMAX2-RV64-NEXT: or a1, a5, a1
	; LMULMAX2-RV64-NEXT: srli a5, a1, 2			; LMULMAX2-RV64-NEXT: srli a5, a1, 2
	Show All 14 Lines
	; LMULMAX2-RV64-NEXT: srli a1, a1, 2			; LMULMAX2-RV64-NEXT: srli a1, a1, 2
	; LMULMAX2-RV64-NEXT: and a1, a1, a2			; LMULMAX2-RV64-NEXT: and a1, a1, a2
	; LMULMAX2-RV64-NEXT: add a1, a5, a1			; LMULMAX2-RV64-NEXT: add a1, a5, a1
	; LMULMAX2-RV64-NEXT: srli a5, a1, 4			; LMULMAX2-RV64-NEXT: srli a5, a1, 4
	; LMULMAX2-RV64-NEXT: add a1, a1, a5			; LMULMAX2-RV64-NEXT: add a1, a1, a5
	; LMULMAX2-RV64-NEXT: and a1, a1, a3			; LMULMAX2-RV64-NEXT: and a1, a1, a3
	; LMULMAX2-RV64-NEXT: mul a1, a1, a4			; LMULMAX2-RV64-NEXT: mul a1, a1, a4
	; LMULMAX2-RV64-NEXT: srli a1, a1, 56			; LMULMAX2-RV64-NEXT: srli a1, a1, 56
	; LMULMAX2-RV64-NEXT: addi a1, a1, -56			; LMULMAX2-RV64-NEXT: addiw a1, a1, -56
	; LMULMAX2-RV64-NEXT: sb a1, 31(sp)			; LMULMAX2-RV64-NEXT: sb a1, 31(sp)
	; LMULMAX2-RV64-NEXT: vslidedown.vi v26, v25, 14			; LMULMAX2-RV64-NEXT: vslidedown.vi v26, v25, 14
	; LMULMAX2-RV64-NEXT: vmv.x.s a1, v26			; LMULMAX2-RV64-NEXT: vmv.x.s a1, v26
	; LMULMAX2-RV64-NEXT: andi a1, a1, 255			; LMULMAX2-RV64-NEXT: andi a1, a1, 255
	; LMULMAX2-RV64-NEXT: srli a5, a1, 1			; LMULMAX2-RV64-NEXT: srli a5, a1, 1
	; LMULMAX2-RV64-NEXT: or a1, a1, a5			; LMULMAX2-RV64-NEXT: or a1, a1, a5
	; LMULMAX2-RV64-NEXT: srli a5, a1, 2			; LMULMAX2-RV64-NEXT: srli a5, a1, 2
	; LMULMAX2-RV64-NEXT: or a1, a1, a5			; LMULMAX2-RV64-NEXT: or a1, a1, a5
	Show All 13 Lines
	; LMULMAX2-RV64-NEXT: srli a1, a1, 2			; LMULMAX2-RV64-NEXT: srli a1, a1, 2
	; LMULMAX2-RV64-NEXT: and a1, a1, a2			; LMULMAX2-RV64-NEXT: and a1, a1, a2
	; LMULMAX2-RV64-NEXT: add a1, a5, a1			; LMULMAX2-RV64-NEXT: add a1, a5, a1
	; LMULMAX2-RV64-NEXT: srli a5, a1, 4			; LMULMAX2-RV64-NEXT: srli a5, a1, 4
	; LMULMAX2-RV64-NEXT: add a1, a1, a5			; LMULMAX2-RV64-NEXT: add a1, a1, a5
	; LMULMAX2-RV64-NEXT: and a1, a1, a3			; LMULMAX2-RV64-NEXT: and a1, a1, a3
	; LMULMAX2-RV64-NEXT: mul a1, a1, a4			; LMULMAX2-RV64-NEXT: mul a1, a1, a4
	; LMULMAX2-RV64-NEXT: srli a1, a1, 56			; LMULMAX2-RV64-NEXT: srli a1, a1, 56
	; LMULMAX2-RV64-NEXT: addi a1, a1, -56			; LMULMAX2-RV64-NEXT: addiw a1, a1, -56
	; LMULMAX2-RV64-NEXT: sb a1, 30(sp)			; LMULMAX2-RV64-NEXT: sb a1, 30(sp)
	; LMULMAX2-RV64-NEXT: vslidedown.vi v26, v25, 13			; LMULMAX2-RV64-NEXT: vslidedown.vi v26, v25, 13
	; LMULMAX2-RV64-NEXT: vmv.x.s a1, v26			; LMULMAX2-RV64-NEXT: vmv.x.s a1, v26
	; LMULMAX2-RV64-NEXT: andi a1, a1, 255			; LMULMAX2-RV64-NEXT: andi a1, a1, 255
	; LMULMAX2-RV64-NEXT: srli a5, a1, 1			; LMULMAX2-RV64-NEXT: srli a5, a1, 1
	; LMULMAX2-RV64-NEXT: or a1, a1, a5			; LMULMAX2-RV64-NEXT: or a1, a1, a5
	; LMULMAX2-RV64-NEXT: srli a5, a1, 2			; LMULMAX2-RV64-NEXT: srli a5, a1, 2
	; LMULMAX2-RV64-NEXT: or a1, a1, a5			; LMULMAX2-RV64-NEXT: or a1, a1, a5
	Show All 13 Lines
	; LMULMAX2-RV64-NEXT: srli a1, a1, 2			; LMULMAX2-RV64-NEXT: srli a1, a1, 2
	; LMULMAX2-RV64-NEXT: and a1, a1, a2			; LMULMAX2-RV64-NEXT: and a1, a1, a2
	; LMULMAX2-RV64-NEXT: add a1, a5, a1			; LMULMAX2-RV64-NEXT: add a1, a5, a1
	; LMULMAX2-RV64-NEXT: srli a5, a1, 4			; LMULMAX2-RV64-NEXT: srli a5, a1, 4
	; LMULMAX2-RV64-NEXT: add a1, a1, a5			; LMULMAX2-RV64-NEXT: add a1, a1, a5
	; LMULMAX2-RV64-NEXT: and a1, a1, a3			; LMULMAX2-RV64-NEXT: and a1, a1, a3
	; LMULMAX2-RV64-NEXT: mul a1, a1, a4			; LMULMAX2-RV64-NEXT: mul a1, a1, a4
	; LMULMAX2-RV64-NEXT: srli a1, a1, 56			; LMULMAX2-RV64-NEXT: srli a1, a1, 56
	; LMULMAX2-RV64-NEXT: addi a1, a1, -56			; LMULMAX2-RV64-NEXT: addiw a1, a1, -56
	; LMULMAX2-RV64-NEXT: sb a1, 29(sp)			; LMULMAX2-RV64-NEXT: sb a1, 29(sp)
	; LMULMAX2-RV64-NEXT: vslidedown.vi v26, v25, 12			; LMULMAX2-RV64-NEXT: vslidedown.vi v26, v25, 12
	; LMULMAX2-RV64-NEXT: vmv.x.s a1, v26			; LMULMAX2-RV64-NEXT: vmv.x.s a1, v26
	; LMULMAX2-RV64-NEXT: andi a1, a1, 255			; LMULMAX2-RV64-NEXT: andi a1, a1, 255
	; LMULMAX2-RV64-NEXT: srli a5, a1, 1			; LMULMAX2-RV64-NEXT: srli a5, a1, 1
	; LMULMAX2-RV64-NEXT: or a1, a1, a5			; LMULMAX2-RV64-NEXT: or a1, a1, a5
	; LMULMAX2-RV64-NEXT: srli a5, a1, 2			; LMULMAX2-RV64-NEXT: srli a5, a1, 2
	; LMULMAX2-RV64-NEXT: or a1, a1, a5			; LMULMAX2-RV64-NEXT: or a1, a1, a5
	Show All 13 Lines
	; LMULMAX2-RV64-NEXT: srli a1, a1, 2			; LMULMAX2-RV64-NEXT: srli a1, a1, 2
	; LMULMAX2-RV64-NEXT: and a1, a1, a2			; LMULMAX2-RV64-NEXT: and a1, a1, a2
	; LMULMAX2-RV64-NEXT: add a1, a5, a1			; LMULMAX2-RV64-NEXT: add a1, a5, a1
	; LMULMAX2-RV64-NEXT: srli a5, a1, 4			; LMULMAX2-RV64-NEXT: srli a5, a1, 4
	; LMULMAX2-RV64-NEXT: add a1, a1, a5			; LMULMAX2-RV64-NEXT: add a1, a1, a5
	; LMULMAX2-RV64-NEXT: and a1, a1, a3			; LMULMAX2-RV64-NEXT: and a1, a1, a3
	; LMULMAX2-RV64-NEXT: mul a1, a1, a4			; LMULMAX2-RV64-NEXT: mul a1, a1, a4
	; LMULMAX2-RV64-NEXT: srli a1, a1, 56			; LMULMAX2-RV64-NEXT: srli a1, a1, 56
	; LMULMAX2-RV64-NEXT: addi a1, a1, -56			; LMULMAX2-RV64-NEXT: addiw a1, a1, -56
	; LMULMAX2-RV64-NEXT: sb a1, 28(sp)			; LMULMAX2-RV64-NEXT: sb a1, 28(sp)
	; LMULMAX2-RV64-NEXT: vslidedown.vi v26, v25, 11			; LMULMAX2-RV64-NEXT: vslidedown.vi v26, v25, 11
	; LMULMAX2-RV64-NEXT: vmv.x.s a1, v26			; LMULMAX2-RV64-NEXT: vmv.x.s a1, v26
	; LMULMAX2-RV64-NEXT: andi a1, a1, 255			; LMULMAX2-RV64-NEXT: andi a1, a1, 255
	; LMULMAX2-RV64-NEXT: srli a5, a1, 1			; LMULMAX2-RV64-NEXT: srli a5, a1, 1
	; LMULMAX2-RV64-NEXT: or a1, a1, a5			; LMULMAX2-RV64-NEXT: or a1, a1, a5
	; LMULMAX2-RV64-NEXT: srli a5, a1, 2			; LMULMAX2-RV64-NEXT: srli a5, a1, 2
	; LMULMAX2-RV64-NEXT: or a1, a1, a5			; LMULMAX2-RV64-NEXT: or a1, a1, a5
	Show All 13 Lines
	; LMULMAX2-RV64-NEXT: srli a1, a1, 2			; LMULMAX2-RV64-NEXT: srli a1, a1, 2
	; LMULMAX2-RV64-NEXT: and a1, a1, a2			; LMULMAX2-RV64-NEXT: and a1, a1, a2
	; LMULMAX2-RV64-NEXT: add a1, a5, a1			; LMULMAX2-RV64-NEXT: add a1, a5, a1
	; LMULMAX2-RV64-NEXT: srli a5, a1, 4			; LMULMAX2-RV64-NEXT: srli a5, a1, 4
	; LMULMAX2-RV64-NEXT: add a1, a1, a5			; LMULMAX2-RV64-NEXT: add a1, a1, a5
	; LMULMAX2-RV64-NEXT: and a1, a1, a3			; LMULMAX2-RV64-NEXT: and a1, a1, a3
	; LMULMAX2-RV64-NEXT: mul a1, a1, a4			; LMULMAX2-RV64-NEXT: mul a1, a1, a4
	; LMULMAX2-RV64-NEXT: srli a1, a1, 56			; LMULMAX2-RV64-NEXT: srli a1, a1, 56
	; LMULMAX2-RV64-NEXT: addi a1, a1, -56			; LMULMAX2-RV64-NEXT: addiw a1, a1, -56
	; LMULMAX2-RV64-NEXT: sb a1, 27(sp)			; LMULMAX2-RV64-NEXT: sb a1, 27(sp)
	; LMULMAX2-RV64-NEXT: vslidedown.vi v26, v25, 10			; LMULMAX2-RV64-NEXT: vslidedown.vi v26, v25, 10
	; LMULMAX2-RV64-NEXT: vmv.x.s a1, v26			; LMULMAX2-RV64-NEXT: vmv.x.s a1, v26
	; LMULMAX2-RV64-NEXT: andi a1, a1, 255			; LMULMAX2-RV64-NEXT: andi a1, a1, 255
	; LMULMAX2-RV64-NEXT: srli a5, a1, 1			; LMULMAX2-RV64-NEXT: srli a5, a1, 1
	; LMULMAX2-RV64-NEXT: or a1, a1, a5			; LMULMAX2-RV64-NEXT: or a1, a1, a5
	; LMULMAX2-RV64-NEXT: srli a5, a1, 2			; LMULMAX2-RV64-NEXT: srli a5, a1, 2
	; LMULMAX2-RV64-NEXT: or a1, a1, a5			; LMULMAX2-RV64-NEXT: or a1, a1, a5
	Show All 13 Lines
	; LMULMAX2-RV64-NEXT: srli a1, a1, 2			; LMULMAX2-RV64-NEXT: srli a1, a1, 2
	; LMULMAX2-RV64-NEXT: and a1, a1, a2			; LMULMAX2-RV64-NEXT: and a1, a1, a2
	; LMULMAX2-RV64-NEXT: add a1, a5, a1			; LMULMAX2-RV64-NEXT: add a1, a5, a1
	; LMULMAX2-RV64-NEXT: srli a5, a1, 4			; LMULMAX2-RV64-NEXT: srli a5, a1, 4
	; LMULMAX2-RV64-NEXT: add a1, a1, a5			; LMULMAX2-RV64-NEXT: add a1, a1, a5
	; LMULMAX2-RV64-NEXT: and a1, a1, a3			; LMULMAX2-RV64-NEXT: and a1, a1, a3
	; LMULMAX2-RV64-NEXT: mul a1, a1, a4			; LMULMAX2-RV64-NEXT: mul a1, a1, a4
	; LMULMAX2-RV64-NEXT: srli a1, a1, 56			; LMULMAX2-RV64-NEXT: srli a1, a1, 56
	; LMULMAX2-RV64-NEXT: addi a1, a1, -56			; LMULMAX2-RV64-NEXT: addiw a1, a1, -56
	; LMULMAX2-RV64-NEXT: sb a1, 26(sp)			; LMULMAX2-RV64-NEXT: sb a1, 26(sp)
	; LMULMAX2-RV64-NEXT: vslidedown.vi v26, v25, 9			; LMULMAX2-RV64-NEXT: vslidedown.vi v26, v25, 9
	; LMULMAX2-RV64-NEXT: vmv.x.s a1, v26			; LMULMAX2-RV64-NEXT: vmv.x.s a1, v26
	; LMULMAX2-RV64-NEXT: andi a1, a1, 255			; LMULMAX2-RV64-NEXT: andi a1, a1, 255
	; LMULMAX2-RV64-NEXT: srli a5, a1, 1			; LMULMAX2-RV64-NEXT: srli a5, a1, 1
	; LMULMAX2-RV64-NEXT: or a1, a1, a5			; LMULMAX2-RV64-NEXT: or a1, a1, a5
	; LMULMAX2-RV64-NEXT: srli a5, a1, 2			; LMULMAX2-RV64-NEXT: srli a5, a1, 2
	; LMULMAX2-RV64-NEXT: or a1, a1, a5			; LMULMAX2-RV64-NEXT: or a1, a1, a5
	Show All 13 Lines
	; LMULMAX2-RV64-NEXT: srli a1, a1, 2			; LMULMAX2-RV64-NEXT: srli a1, a1, 2
	; LMULMAX2-RV64-NEXT: and a1, a1, a2			; LMULMAX2-RV64-NEXT: and a1, a1, a2
	; LMULMAX2-RV64-NEXT: add a1, a5, a1			; LMULMAX2-RV64-NEXT: add a1, a5, a1
	; LMULMAX2-RV64-NEXT: srli a5, a1, 4			; LMULMAX2-RV64-NEXT: srli a5, a1, 4
	; LMULMAX2-RV64-NEXT: add a1, a1, a5			; LMULMAX2-RV64-NEXT: add a1, a1, a5
	; LMULMAX2-RV64-NEXT: and a1, a1, a3			; LMULMAX2-RV64-NEXT: and a1, a1, a3
	; LMULMAX2-RV64-NEXT: mul a1, a1, a4			; LMULMAX2-RV64-NEXT: mul a1, a1, a4
	; LMULMAX2-RV64-NEXT: srli a1, a1, 56			; LMULMAX2-RV64-NEXT: srli a1, a1, 56
	; LMULMAX2-RV64-NEXT: addi a1, a1, -56			; LMULMAX2-RV64-NEXT: addiw a1, a1, -56
	; LMULMAX2-RV64-NEXT: sb a1, 25(sp)			; LMULMAX2-RV64-NEXT: sb a1, 25(sp)
	; LMULMAX2-RV64-NEXT: vslidedown.vi v26, v25, 8			; LMULMAX2-RV64-NEXT: vslidedown.vi v26, v25, 8
	; LMULMAX2-RV64-NEXT: vmv.x.s a1, v26			; LMULMAX2-RV64-NEXT: vmv.x.s a1, v26
	; LMULMAX2-RV64-NEXT: andi a1, a1, 255			; LMULMAX2-RV64-NEXT: andi a1, a1, 255
	; LMULMAX2-RV64-NEXT: srli a5, a1, 1			; LMULMAX2-RV64-NEXT: srli a5, a1, 1
	; LMULMAX2-RV64-NEXT: or a1, a1, a5			; LMULMAX2-RV64-NEXT: or a1, a1, a5
	; LMULMAX2-RV64-NEXT: srli a5, a1, 2			; LMULMAX2-RV64-NEXT: srli a5, a1, 2
	; LMULMAX2-RV64-NEXT: or a1, a1, a5			; LMULMAX2-RV64-NEXT: or a1, a1, a5
	Show All 13 Lines
	; LMULMAX2-RV64-NEXT: srli a1, a1, 2			; LMULMAX2-RV64-NEXT: srli a1, a1, 2
	; LMULMAX2-RV64-NEXT: and a1, a1, a2			; LMULMAX2-RV64-NEXT: and a1, a1, a2
	; LMULMAX2-RV64-NEXT: add a1, a5, a1			; LMULMAX2-RV64-NEXT: add a1, a5, a1
	; LMULMAX2-RV64-NEXT: srli a5, a1, 4			; LMULMAX2-RV64-NEXT: srli a5, a1, 4
	; LMULMAX2-RV64-NEXT: add a1, a1, a5			; LMULMAX2-RV64-NEXT: add a1, a1, a5
	; LMULMAX2-RV64-NEXT: and a1, a1, a3			; LMULMAX2-RV64-NEXT: and a1, a1, a3
	; LMULMAX2-RV64-NEXT: mul a1, a1, a4			; LMULMAX2-RV64-NEXT: mul a1, a1, a4
	; LMULMAX2-RV64-NEXT: srli a1, a1, 56			; LMULMAX2-RV64-NEXT: srli a1, a1, 56
	; LMULMAX2-RV64-NEXT: addi a1, a1, -56			; LMULMAX2-RV64-NEXT: addiw a1, a1, -56
	; LMULMAX2-RV64-NEXT: sb a1, 24(sp)			; LMULMAX2-RV64-NEXT: sb a1, 24(sp)
	; LMULMAX2-RV64-NEXT: vslidedown.vi v26, v25, 7			; LMULMAX2-RV64-NEXT: vslidedown.vi v26, v25, 7
	; LMULMAX2-RV64-NEXT: vmv.x.s a1, v26			; LMULMAX2-RV64-NEXT: vmv.x.s a1, v26
	; LMULMAX2-RV64-NEXT: andi a1, a1, 255			; LMULMAX2-RV64-NEXT: andi a1, a1, 255
	; LMULMAX2-RV64-NEXT: srli a5, a1, 1			; LMULMAX2-RV64-NEXT: srli a5, a1, 1
	; LMULMAX2-RV64-NEXT: or a1, a1, a5			; LMULMAX2-RV64-NEXT: or a1, a1, a5
	; LMULMAX2-RV64-NEXT: srli a5, a1, 2			; LMULMAX2-RV64-NEXT: srli a5, a1, 2
	; LMULMAX2-RV64-NEXT: or a1, a1, a5			; LMULMAX2-RV64-NEXT: or a1, a1, a5
	Show All 13 Lines
	; LMULMAX2-RV64-NEXT: srli a1, a1, 2			; LMULMAX2-RV64-NEXT: srli a1, a1, 2
	; LMULMAX2-RV64-NEXT: and a1, a1, a2			; LMULMAX2-RV64-NEXT: and a1, a1, a2
	; LMULMAX2-RV64-NEXT: add a1, a5, a1			; LMULMAX2-RV64-NEXT: add a1, a5, a1
	; LMULMAX2-RV64-NEXT: srli a5, a1, 4			; LMULMAX2-RV64-NEXT: srli a5, a1, 4
	; LMULMAX2-RV64-NEXT: add a1, a1, a5			; LMULMAX2-RV64-NEXT: add a1, a1, a5
	; LMULMAX2-RV64-NEXT: and a1, a1, a3			; LMULMAX2-RV64-NEXT: and a1, a1, a3
	; LMULMAX2-RV64-NEXT: mul a1, a1, a4			; LMULMAX2-RV64-NEXT: mul a1, a1, a4
	; LMULMAX2-RV64-NEXT: srli a1, a1, 56			; LMULMAX2-RV64-NEXT: srli a1, a1, 56
	; LMULMAX2-RV64-NEXT: addi a1, a1, -56			; LMULMAX2-RV64-NEXT: addiw a1, a1, -56
	; LMULMAX2-RV64-NEXT: sb a1, 23(sp)			; LMULMAX2-RV64-NEXT: sb a1, 23(sp)
	; LMULMAX2-RV64-NEXT: vslidedown.vi v26, v25, 6			; LMULMAX2-RV64-NEXT: vslidedown.vi v26, v25, 6
	; LMULMAX2-RV64-NEXT: vmv.x.s a1, v26			; LMULMAX2-RV64-NEXT: vmv.x.s a1, v26
	; LMULMAX2-RV64-NEXT: andi a1, a1, 255			; LMULMAX2-RV64-NEXT: andi a1, a1, 255
	; LMULMAX2-RV64-NEXT: srli a5, a1, 1			; LMULMAX2-RV64-NEXT: srli a5, a1, 1
	; LMULMAX2-RV64-NEXT: or a1, a1, a5			; LMULMAX2-RV64-NEXT: or a1, a1, a5
	; LMULMAX2-RV64-NEXT: srli a5, a1, 2			; LMULMAX2-RV64-NEXT: srli a5, a1, 2
	; LMULMAX2-RV64-NEXT: or a1, a1, a5			; LMULMAX2-RV64-NEXT: or a1, a1, a5
	Show All 13 Lines
	; LMULMAX2-RV64-NEXT: srli a1, a1, 2			; LMULMAX2-RV64-NEXT: srli a1, a1, 2
	; LMULMAX2-RV64-NEXT: and a1, a1, a2			; LMULMAX2-RV64-NEXT: and a1, a1, a2
	; LMULMAX2-RV64-NEXT: add a1, a5, a1			; LMULMAX2-RV64-NEXT: add a1, a5, a1
	; LMULMAX2-RV64-NEXT: srli a5, a1, 4			; LMULMAX2-RV64-NEXT: srli a5, a1, 4
	; LMULMAX2-RV64-NEXT: add a1, a1, a5			; LMULMAX2-RV64-NEXT: add a1, a1, a5
	; LMULMAX2-RV64-NEXT: and a1, a1, a3			; LMULMAX2-RV64-NEXT: and a1, a1, a3
	; LMULMAX2-RV64-NEXT: mul a1, a1, a4			; LMULMAX2-RV64-NEXT: mul a1, a1, a4
	; LMULMAX2-RV64-NEXT: srli a1, a1, 56			; LMULMAX2-RV64-NEXT: srli a1, a1, 56
	; LMULMAX2-RV64-NEXT: addi a1, a1, -56			; LMULMAX2-RV64-NEXT: addiw a1, a1, -56
	; LMULMAX2-RV64-NEXT: sb a1, 22(sp)			; LMULMAX2-RV64-NEXT: sb a1, 22(sp)
	; LMULMAX2-RV64-NEXT: vslidedown.vi v26, v25, 5			; LMULMAX2-RV64-NEXT: vslidedown.vi v26, v25, 5
	; LMULMAX2-RV64-NEXT: vmv.x.s a1, v26			; LMULMAX2-RV64-NEXT: vmv.x.s a1, v26
	; LMULMAX2-RV64-NEXT: andi a1, a1, 255			; LMULMAX2-RV64-NEXT: andi a1, a1, 255
	; LMULMAX2-RV64-NEXT: srli a5, a1, 1			; LMULMAX2-RV64-NEXT: srli a5, a1, 1
	; LMULMAX2-RV64-NEXT: or a1, a1, a5			; LMULMAX2-RV64-NEXT: or a1, a1, a5
	; LMULMAX2-RV64-NEXT: srli a5, a1, 2			; LMULMAX2-RV64-NEXT: srli a5, a1, 2
	; LMULMAX2-RV64-NEXT: or a1, a1, a5			; LMULMAX2-RV64-NEXT: or a1, a1, a5
	Show All 13 Lines
	; LMULMAX2-RV64-NEXT: srli a1, a1, 2			; LMULMAX2-RV64-NEXT: srli a1, a1, 2
	; LMULMAX2-RV64-NEXT: and a1, a1, a2			; LMULMAX2-RV64-NEXT: and a1, a1, a2
	; LMULMAX2-RV64-NEXT: add a1, a5, a1			; LMULMAX2-RV64-NEXT: add a1, a5, a1
	; LMULMAX2-RV64-NEXT: srli a5, a1, 4			; LMULMAX2-RV64-NEXT: srli a5, a1, 4
	; LMULMAX2-RV64-NEXT: add a1, a1, a5			; LMULMAX2-RV64-NEXT: add a1, a1, a5
	; LMULMAX2-RV64-NEXT: and a1, a1, a3			; LMULMAX2-RV64-NEXT: and a1, a1, a3
	; LMULMAX2-RV64-NEXT: mul a1, a1, a4			; LMULMAX2-RV64-NEXT: mul a1, a1, a4
	; LMULMAX2-RV64-NEXT: srli a1, a1, 56			; LMULMAX2-RV64-NEXT: srli a1, a1, 56
	; LMULMAX2-RV64-NEXT: addi a1, a1, -56			; LMULMAX2-RV64-NEXT: addiw a1, a1, -56
	; LMULMAX2-RV64-NEXT: sb a1, 21(sp)			; LMULMAX2-RV64-NEXT: sb a1, 21(sp)
	; LMULMAX2-RV64-NEXT: vslidedown.vi v26, v25, 4			; LMULMAX2-RV64-NEXT: vslidedown.vi v26, v25, 4
	; LMULMAX2-RV64-NEXT: vmv.x.s a1, v26			; LMULMAX2-RV64-NEXT: vmv.x.s a1, v26
	; LMULMAX2-RV64-NEXT: andi a1, a1, 255			; LMULMAX2-RV64-NEXT: andi a1, a1, 255
	; LMULMAX2-RV64-NEXT: srli a5, a1, 1			; LMULMAX2-RV64-NEXT: srli a5, a1, 1
	; LMULMAX2-RV64-NEXT: or a1, a1, a5			; LMULMAX2-RV64-NEXT: or a1, a1, a5
	; LMULMAX2-RV64-NEXT: srli a5, a1, 2			; LMULMAX2-RV64-NEXT: srli a5, a1, 2
	; LMULMAX2-RV64-NEXT: or a1, a1, a5			; LMULMAX2-RV64-NEXT: or a1, a1, a5
	Show All 13 Lines
	; LMULMAX2-RV64-NEXT: srli a1, a1, 2			; LMULMAX2-RV64-NEXT: srli a1, a1, 2
	; LMULMAX2-RV64-NEXT: and a1, a1, a2			; LMULMAX2-RV64-NEXT: and a1, a1, a2
	; LMULMAX2-RV64-NEXT: add a1, a5, a1			; LMULMAX2-RV64-NEXT: add a1, a5, a1
	; LMULMAX2-RV64-NEXT: srli a5, a1, 4			; LMULMAX2-RV64-NEXT: srli a5, a1, 4
	; LMULMAX2-RV64-NEXT: add a1, a1, a5			; LMULMAX2-RV64-NEXT: add a1, a1, a5
	; LMULMAX2-RV64-NEXT: and a1, a1, a3			; LMULMAX2-RV64-NEXT: and a1, a1, a3
	; LMULMAX2-RV64-NEXT: mul a1, a1, a4			; LMULMAX2-RV64-NEXT: mul a1, a1, a4
	; LMULMAX2-RV64-NEXT: srli a1, a1, 56			; LMULMAX2-RV64-NEXT: srli a1, a1, 56
	; LMULMAX2-RV64-NEXT: addi a1, a1, -56			; LMULMAX2-RV64-NEXT: addiw a1, a1, -56
	; LMULMAX2-RV64-NEXT: sb a1, 20(sp)			; LMULMAX2-RV64-NEXT: sb a1, 20(sp)
	; LMULMAX2-RV64-NEXT: vslidedown.vi v26, v25, 3			; LMULMAX2-RV64-NEXT: vslidedown.vi v26, v25, 3
	; LMULMAX2-RV64-NEXT: vmv.x.s a1, v26			; LMULMAX2-RV64-NEXT: vmv.x.s a1, v26
	; LMULMAX2-RV64-NEXT: andi a1, a1, 255			; LMULMAX2-RV64-NEXT: andi a1, a1, 255
	; LMULMAX2-RV64-NEXT: srli a5, a1, 1			; LMULMAX2-RV64-NEXT: srli a5, a1, 1
	; LMULMAX2-RV64-NEXT: or a1, a1, a5			; LMULMAX2-RV64-NEXT: or a1, a1, a5
	; LMULMAX2-RV64-NEXT: srli a5, a1, 2			; LMULMAX2-RV64-NEXT: srli a5, a1, 2
	; LMULMAX2-RV64-NEXT: or a1, a1, a5			; LMULMAX2-RV64-NEXT: or a1, a1, a5
	Show All 13 Lines
	; LMULMAX2-RV64-NEXT: srli a1, a1, 2			; LMULMAX2-RV64-NEXT: srli a1, a1, 2
	; LMULMAX2-RV64-NEXT: and a1, a1, a2			; LMULMAX2-RV64-NEXT: and a1, a1, a2
	; LMULMAX2-RV64-NEXT: add a1, a5, a1			; LMULMAX2-RV64-NEXT: add a1, a5, a1
	; LMULMAX2-RV64-NEXT: srli a5, a1, 4			; LMULMAX2-RV64-NEXT: srli a5, a1, 4
	; LMULMAX2-RV64-NEXT: add a1, a1, a5			; LMULMAX2-RV64-NEXT: add a1, a1, a5
	; LMULMAX2-RV64-NEXT: and a1, a1, a3			; LMULMAX2-RV64-NEXT: and a1, a1, a3
	; LMULMAX2-RV64-NEXT: mul a1, a1, a4			; LMULMAX2-RV64-NEXT: mul a1, a1, a4
	; LMULMAX2-RV64-NEXT: srli a1, a1, 56			; LMULMAX2-RV64-NEXT: srli a1, a1, 56
	; LMULMAX2-RV64-NEXT: addi a1, a1, -56			; LMULMAX2-RV64-NEXT: addiw a1, a1, -56
	; LMULMAX2-RV64-NEXT: sb a1, 19(sp)			; LMULMAX2-RV64-NEXT: sb a1, 19(sp)
	; LMULMAX2-RV64-NEXT: vslidedown.vi v26, v25, 2			; LMULMAX2-RV64-NEXT: vslidedown.vi v26, v25, 2
	; LMULMAX2-RV64-NEXT: vmv.x.s a1, v26			; LMULMAX2-RV64-NEXT: vmv.x.s a1, v26
	; LMULMAX2-RV64-NEXT: andi a1, a1, 255			; LMULMAX2-RV64-NEXT: andi a1, a1, 255
	; LMULMAX2-RV64-NEXT: srli a5, a1, 1			; LMULMAX2-RV64-NEXT: srli a5, a1, 1
	; LMULMAX2-RV64-NEXT: or a1, a1, a5			; LMULMAX2-RV64-NEXT: or a1, a1, a5
	; LMULMAX2-RV64-NEXT: srli a5, a1, 2			; LMULMAX2-RV64-NEXT: srli a5, a1, 2
	; LMULMAX2-RV64-NEXT: or a1, a1, a5			; LMULMAX2-RV64-NEXT: or a1, a1, a5
	Show All 13 Lines
	; LMULMAX2-RV64-NEXT: srli a1, a1, 2			; LMULMAX2-RV64-NEXT: srli a1, a1, 2
	; LMULMAX2-RV64-NEXT: and a1, a1, a2			; LMULMAX2-RV64-NEXT: and a1, a1, a2
	; LMULMAX2-RV64-NEXT: add a1, a5, a1			; LMULMAX2-RV64-NEXT: add a1, a5, a1
	; LMULMAX2-RV64-NEXT: srli a5, a1, 4			; LMULMAX2-RV64-NEXT: srli a5, a1, 4
	; LMULMAX2-RV64-NEXT: add a1, a1, a5			; LMULMAX2-RV64-NEXT: add a1, a1, a5
	; LMULMAX2-RV64-NEXT: and a1, a1, a3			; LMULMAX2-RV64-NEXT: and a1, a1, a3
	; LMULMAX2-RV64-NEXT: mul a1, a1, a4			; LMULMAX2-RV64-NEXT: mul a1, a1, a4
	; LMULMAX2-RV64-NEXT: srli a1, a1, 56			; LMULMAX2-RV64-NEXT: srli a1, a1, 56
	; LMULMAX2-RV64-NEXT: addi a1, a1, -56			; LMULMAX2-RV64-NEXT: addiw a1, a1, -56
	; LMULMAX2-RV64-NEXT: sb a1, 18(sp)			; LMULMAX2-RV64-NEXT: sb a1, 18(sp)
	; LMULMAX2-RV64-NEXT: vslidedown.vi v25, v25, 1			; LMULMAX2-RV64-NEXT: vslidedown.vi v25, v25, 1
	; LMULMAX2-RV64-NEXT: vmv.x.s a1, v25			; LMULMAX2-RV64-NEXT: vmv.x.s a1, v25
	; LMULMAX2-RV64-NEXT: andi a1, a1, 255			; LMULMAX2-RV64-NEXT: andi a1, a1, 255
	; LMULMAX2-RV64-NEXT: srli a5, a1, 1			; LMULMAX2-RV64-NEXT: srli a5, a1, 1
	; LMULMAX2-RV64-NEXT: or a1, a1, a5			; LMULMAX2-RV64-NEXT: or a1, a1, a5
	; LMULMAX2-RV64-NEXT: srli a5, a1, 2			; LMULMAX2-RV64-NEXT: srli a5, a1, 2
	; LMULMAX2-RV64-NEXT: or a1, a1, a5			; LMULMAX2-RV64-NEXT: or a1, a1, a5
	Show All 13 Lines
	; LMULMAX2-RV64-NEXT: srli a1, a1, 2			; LMULMAX2-RV64-NEXT: srli a1, a1, 2
	; LMULMAX2-RV64-NEXT: and a1, a1, a2			; LMULMAX2-RV64-NEXT: and a1, a1, a2
	; LMULMAX2-RV64-NEXT: add a1, a5, a1			; LMULMAX2-RV64-NEXT: add a1, a5, a1
	; LMULMAX2-RV64-NEXT: srli a2, a1, 4			; LMULMAX2-RV64-NEXT: srli a2, a1, 4
	; LMULMAX2-RV64-NEXT: add a1, a1, a2			; LMULMAX2-RV64-NEXT: add a1, a1, a2
	; LMULMAX2-RV64-NEXT: and a1, a1, a3			; LMULMAX2-RV64-NEXT: and a1, a1, a3
	; LMULMAX2-RV64-NEXT: mul a1, a1, a4			; LMULMAX2-RV64-NEXT: mul a1, a1, a4
	; LMULMAX2-RV64-NEXT: srli a1, a1, 56			; LMULMAX2-RV64-NEXT: srli a1, a1, 56
	; LMULMAX2-RV64-NEXT: addi a1, a1, -56			; LMULMAX2-RV64-NEXT: addiw a1, a1, -56
	; LMULMAX2-RV64-NEXT: sb a1, 17(sp)			; LMULMAX2-RV64-NEXT: sb a1, 17(sp)
	; LMULMAX2-RV64-NEXT: vsetivli zero, 16, e8, m1, ta, mu			; LMULMAX2-RV64-NEXT: vsetivli zero, 16, e8, m1, ta, mu
	; LMULMAX2-RV64-NEXT: addi a1, sp, 16			; LMULMAX2-RV64-NEXT: addi a1, sp, 16
	; LMULMAX2-RV64-NEXT: vle8.v v25, (a1)			; LMULMAX2-RV64-NEXT: vle8.v v25, (a1)
	; LMULMAX2-RV64-NEXT: vse8.v v25, (a0)			; LMULMAX2-RV64-NEXT: vse8.v v25, (a0)
	; LMULMAX2-RV64-NEXT: addi sp, sp, 32			; LMULMAX2-RV64-NEXT: addi sp, sp, 32
	; LMULMAX2-RV64-NEXT: ret			; LMULMAX2-RV64-NEXT: ret
	;			;
	▲ Show 20 Lines • Show All 524 Lines • ▼ Show 20 Lines
	; LMULMAX1-RV64-NEXT: lui a4, 4112			; LMULMAX1-RV64-NEXT: lui a4, 4112
	; LMULMAX1-RV64-NEXT: addiw a4, a4, 257			; LMULMAX1-RV64-NEXT: addiw a4, a4, 257
	; LMULMAX1-RV64-NEXT: slli a4, a4, 16			; LMULMAX1-RV64-NEXT: slli a4, a4, 16
	; LMULMAX1-RV64-NEXT: addi a4, a4, 257			; LMULMAX1-RV64-NEXT: addi a4, a4, 257
	; LMULMAX1-RV64-NEXT: slli a4, a4, 16			; LMULMAX1-RV64-NEXT: slli a4, a4, 16
	; LMULMAX1-RV64-NEXT: addi a4, a4, 257			; LMULMAX1-RV64-NEXT: addi a4, a4, 257
	; LMULMAX1-RV64-NEXT: mul a5, a5, a4			; LMULMAX1-RV64-NEXT: mul a5, a5, a4
	; LMULMAX1-RV64-NEXT: srli a5, a5, 56			; LMULMAX1-RV64-NEXT: srli a5, a5, 56
	; LMULMAX1-RV64-NEXT: addi a5, a5, -56			; LMULMAX1-RV64-NEXT: addiw a5, a5, -56
	; LMULMAX1-RV64-NEXT: sb a5, 16(sp)			; LMULMAX1-RV64-NEXT: sb a5, 16(sp)
	; LMULMAX1-RV64-NEXT: vsetivli zero, 1, e8, m1, ta, mu			; LMULMAX1-RV64-NEXT: vsetivli zero, 1, e8, m1, ta, mu
	; LMULMAX1-RV64-NEXT: vslidedown.vi v26, v25, 15			; LMULMAX1-RV64-NEXT: vslidedown.vi v26, v25, 15
	; LMULMAX1-RV64-NEXT: vmv.x.s a5, v26			; LMULMAX1-RV64-NEXT: vmv.x.s a5, v26
	; LMULMAX1-RV64-NEXT: andi a5, a5, 255			; LMULMAX1-RV64-NEXT: andi a5, a5, 255
	; LMULMAX1-RV64-NEXT: srli a1, a5, 1			; LMULMAX1-RV64-NEXT: srli a1, a5, 1
	; LMULMAX1-RV64-NEXT: or a1, a5, a1			; LMULMAX1-RV64-NEXT: or a1, a5, a1
	; LMULMAX1-RV64-NEXT: srli a5, a1, 2			; LMULMAX1-RV64-NEXT: srli a5, a1, 2
	Show All 14 Lines
	; LMULMAX1-RV64-NEXT: srli a1, a1, 2			; LMULMAX1-RV64-NEXT: srli a1, a1, 2
	; LMULMAX1-RV64-NEXT: and a1, a1, a2			; LMULMAX1-RV64-NEXT: and a1, a1, a2
	; LMULMAX1-RV64-NEXT: add a1, a5, a1			; LMULMAX1-RV64-NEXT: add a1, a5, a1
	; LMULMAX1-RV64-NEXT: srli a5, a1, 4			; LMULMAX1-RV64-NEXT: srli a5, a1, 4
	; LMULMAX1-RV64-NEXT: add a1, a1, a5			; LMULMAX1-RV64-NEXT: add a1, a1, a5
	; LMULMAX1-RV64-NEXT: and a1, a1, a3			; LMULMAX1-RV64-NEXT: and a1, a1, a3
	; LMULMAX1-RV64-NEXT: mul a1, a1, a4			; LMULMAX1-RV64-NEXT: mul a1, a1, a4
	; LMULMAX1-RV64-NEXT: srli a1, a1, 56			; LMULMAX1-RV64-NEXT: srli a1, a1, 56
	; LMULMAX1-RV64-NEXT: addi a1, a1, -56			; LMULMAX1-RV64-NEXT: addiw a1, a1, -56
	; LMULMAX1-RV64-NEXT: sb a1, 31(sp)			; LMULMAX1-RV64-NEXT: sb a1, 31(sp)
	; LMULMAX1-RV64-NEXT: vslidedown.vi v26, v25, 14			; LMULMAX1-RV64-NEXT: vslidedown.vi v26, v25, 14
	; LMULMAX1-RV64-NEXT: vmv.x.s a1, v26			; LMULMAX1-RV64-NEXT: vmv.x.s a1, v26
	; LMULMAX1-RV64-NEXT: andi a1, a1, 255			; LMULMAX1-RV64-NEXT: andi a1, a1, 255
	; LMULMAX1-RV64-NEXT: srli a5, a1, 1			; LMULMAX1-RV64-NEXT: srli a5, a1, 1
	; LMULMAX1-RV64-NEXT: or a1, a1, a5			; LMULMAX1-RV64-NEXT: or a1, a1, a5
	; LMULMAX1-RV64-NEXT: srli a5, a1, 2			; LMULMAX1-RV64-NEXT: srli a5, a1, 2
	; LMULMAX1-RV64-NEXT: or a1, a1, a5			; LMULMAX1-RV64-NEXT: or a1, a1, a5
	Show All 13 Lines
	; LMULMAX1-RV64-NEXT: srli a1, a1, 2			; LMULMAX1-RV64-NEXT: srli a1, a1, 2
	; LMULMAX1-RV64-NEXT: and a1, a1, a2			; LMULMAX1-RV64-NEXT: and a1, a1, a2
	; LMULMAX1-RV64-NEXT: add a1, a5, a1			; LMULMAX1-RV64-NEXT: add a1, a5, a1
	; LMULMAX1-RV64-NEXT: srli a5, a1, 4			; LMULMAX1-RV64-NEXT: srli a5, a1, 4
	; LMULMAX1-RV64-NEXT: add a1, a1, a5			; LMULMAX1-RV64-NEXT: add a1, a1, a5
	; LMULMAX1-RV64-NEXT: and a1, a1, a3			; LMULMAX1-RV64-NEXT: and a1, a1, a3
	; LMULMAX1-RV64-NEXT: mul a1, a1, a4			; LMULMAX1-RV64-NEXT: mul a1, a1, a4
	; LMULMAX1-RV64-NEXT: srli a1, a1, 56			; LMULMAX1-RV64-NEXT: srli a1, a1, 56
	; LMULMAX1-RV64-NEXT: addi a1, a1, -56			; LMULMAX1-RV64-NEXT: addiw a1, a1, -56
	; LMULMAX1-RV64-NEXT: sb a1, 30(sp)			; LMULMAX1-RV64-NEXT: sb a1, 30(sp)
	; LMULMAX1-RV64-NEXT: vslidedown.vi v26, v25, 13			; LMULMAX1-RV64-NEXT: vslidedown.vi v26, v25, 13
	; LMULMAX1-RV64-NEXT: vmv.x.s a1, v26			; LMULMAX1-RV64-NEXT: vmv.x.s a1, v26
	; LMULMAX1-RV64-NEXT: andi a1, a1, 255			; LMULMAX1-RV64-NEXT: andi a1, a1, 255
	; LMULMAX1-RV64-NEXT: srli a5, a1, 1			; LMULMAX1-RV64-NEXT: srli a5, a1, 1
	; LMULMAX1-RV64-NEXT: or a1, a1, a5			; LMULMAX1-RV64-NEXT: or a1, a1, a5
	; LMULMAX1-RV64-NEXT: srli a5, a1, 2			; LMULMAX1-RV64-NEXT: srli a5, a1, 2
	; LMULMAX1-RV64-NEXT: or a1, a1, a5			; LMULMAX1-RV64-NEXT: or a1, a1, a5
	Show All 13 Lines
	; LMULMAX1-RV64-NEXT: srli a1, a1, 2			; LMULMAX1-RV64-NEXT: srli a1, a1, 2
	; LMULMAX1-RV64-NEXT: and a1, a1, a2			; LMULMAX1-RV64-NEXT: and a1, a1, a2
	; LMULMAX1-RV64-NEXT: add a1, a5, a1			; LMULMAX1-RV64-NEXT: add a1, a5, a1
	; LMULMAX1-RV64-NEXT: srli a5, a1, 4			; LMULMAX1-RV64-NEXT: srli a5, a1, 4
	; LMULMAX1-RV64-NEXT: add a1, a1, a5			; LMULMAX1-RV64-NEXT: add a1, a1, a5
	; LMULMAX1-RV64-NEXT: and a1, a1, a3			; LMULMAX1-RV64-NEXT: and a1, a1, a3
	; LMULMAX1-RV64-NEXT: mul a1, a1, a4			; LMULMAX1-RV64-NEXT: mul a1, a1, a4
	; LMULMAX1-RV64-NEXT: srli a1, a1, 56			; LMULMAX1-RV64-NEXT: srli a1, a1, 56
	; LMULMAX1-RV64-NEXT: addi a1, a1, -56			; LMULMAX1-RV64-NEXT: addiw a1, a1, -56
	; LMULMAX1-RV64-NEXT: sb a1, 29(sp)			; LMULMAX1-RV64-NEXT: sb a1, 29(sp)
	; LMULMAX1-RV64-NEXT: vslidedown.vi v26, v25, 12			; LMULMAX1-RV64-NEXT: vslidedown.vi v26, v25, 12
	; LMULMAX1-RV64-NEXT: vmv.x.s a1, v26			; LMULMAX1-RV64-NEXT: vmv.x.s a1, v26
	; LMULMAX1-RV64-NEXT: andi a1, a1, 255			; LMULMAX1-RV64-NEXT: andi a1, a1, 255
	; LMULMAX1-RV64-NEXT: srli a5, a1, 1			; LMULMAX1-RV64-NEXT: srli a5, a1, 1
	; LMULMAX1-RV64-NEXT: or a1, a1, a5			; LMULMAX1-RV64-NEXT: or a1, a1, a5
	; LMULMAX1-RV64-NEXT: srli a5, a1, 2			; LMULMAX1-RV64-NEXT: srli a5, a1, 2
	; LMULMAX1-RV64-NEXT: or a1, a1, a5			; LMULMAX1-RV64-NEXT: or a1, a1, a5
	Show All 13 Lines
	; LMULMAX1-RV64-NEXT: srli a1, a1, 2			; LMULMAX1-RV64-NEXT: srli a1, a1, 2
	; LMULMAX1-RV64-NEXT: and a1, a1, a2			; LMULMAX1-RV64-NEXT: and a1, a1, a2
	; LMULMAX1-RV64-NEXT: add a1, a5, a1			; LMULMAX1-RV64-NEXT: add a1, a5, a1
	; LMULMAX1-RV64-NEXT: srli a5, a1, 4			; LMULMAX1-RV64-NEXT: srli a5, a1, 4
	; LMULMAX1-RV64-NEXT: add a1, a1, a5			; LMULMAX1-RV64-NEXT: add a1, a1, a5
	; LMULMAX1-RV64-NEXT: and a1, a1, a3			; LMULMAX1-RV64-NEXT: and a1, a1, a3
	; LMULMAX1-RV64-NEXT: mul a1, a1, a4			; LMULMAX1-RV64-NEXT: mul a1, a1, a4
	; LMULMAX1-RV64-NEXT: srli a1, a1, 56			; LMULMAX1-RV64-NEXT: srli a1, a1, 56
	; LMULMAX1-RV64-NEXT: addi a1, a1, -56			; LMULMAX1-RV64-NEXT: addiw a1, a1, -56
	; LMULMAX1-RV64-NEXT: sb a1, 28(sp)			; LMULMAX1-RV64-NEXT: sb a1, 28(sp)
	; LMULMAX1-RV64-NEXT: vslidedown.vi v26, v25, 11			; LMULMAX1-RV64-NEXT: vslidedown.vi v26, v25, 11
	; LMULMAX1-RV64-NEXT: vmv.x.s a1, v26			; LMULMAX1-RV64-NEXT: vmv.x.s a1, v26
	; LMULMAX1-RV64-NEXT: andi a1, a1, 255			; LMULMAX1-RV64-NEXT: andi a1, a1, 255
	; LMULMAX1-RV64-NEXT: srli a5, a1, 1			; LMULMAX1-RV64-NEXT: srli a5, a1, 1
	; LMULMAX1-RV64-NEXT: or a1, a1, a5			; LMULMAX1-RV64-NEXT: or a1, a1, a5
	; LMULMAX1-RV64-NEXT: srli a5, a1, 2			; LMULMAX1-RV64-NEXT: srli a5, a1, 2
	; LMULMAX1-RV64-NEXT: or a1, a1, a5			; LMULMAX1-RV64-NEXT: or a1, a1, a5
	Show All 13 Lines
	; LMULMAX1-RV64-NEXT: srli a1, a1, 2			; LMULMAX1-RV64-NEXT: srli a1, a1, 2
	; LMULMAX1-RV64-NEXT: and a1, a1, a2			; LMULMAX1-RV64-NEXT: and a1, a1, a2
	; LMULMAX1-RV64-NEXT: add a1, a5, a1			; LMULMAX1-RV64-NEXT: add a1, a5, a1
	; LMULMAX1-RV64-NEXT: srli a5, a1, 4			; LMULMAX1-RV64-NEXT: srli a5, a1, 4
	; LMULMAX1-RV64-NEXT: add a1, a1, a5			; LMULMAX1-RV64-NEXT: add a1, a1, a5
	; LMULMAX1-RV64-NEXT: and a1, a1, a3			; LMULMAX1-RV64-NEXT: and a1, a1, a3
	; LMULMAX1-RV64-NEXT: mul a1, a1, a4			; LMULMAX1-RV64-NEXT: mul a1, a1, a4
	; LMULMAX1-RV64-NEXT: srli a1, a1, 56			; LMULMAX1-RV64-NEXT: srli a1, a1, 56
	; LMULMAX1-RV64-NEXT: addi a1, a1, -56			; LMULMAX1-RV64-NEXT: addiw a1, a1, -56
	; LMULMAX1-RV64-NEXT: sb a1, 27(sp)			; LMULMAX1-RV64-NEXT: sb a1, 27(sp)
	; LMULMAX1-RV64-NEXT: vslidedown.vi v26, v25, 10			; LMULMAX1-RV64-NEXT: vslidedown.vi v26, v25, 10
	; LMULMAX1-RV64-NEXT: vmv.x.s a1, v26			; LMULMAX1-RV64-NEXT: vmv.x.s a1, v26
	; LMULMAX1-RV64-NEXT: andi a1, a1, 255			; LMULMAX1-RV64-NEXT: andi a1, a1, 255
	; LMULMAX1-RV64-NEXT: srli a5, a1, 1			; LMULMAX1-RV64-NEXT: srli a5, a1, 1
	; LMULMAX1-RV64-NEXT: or a1, a1, a5			; LMULMAX1-RV64-NEXT: or a1, a1, a5
	; LMULMAX1-RV64-NEXT: srli a5, a1, 2			; LMULMAX1-RV64-NEXT: srli a5, a1, 2
	; LMULMAX1-RV64-NEXT: or a1, a1, a5			; LMULMAX1-RV64-NEXT: or a1, a1, a5
	Show All 13 Lines
	; LMULMAX1-RV64-NEXT: srli a1, a1, 2			; LMULMAX1-RV64-NEXT: srli a1, a1, 2
	; LMULMAX1-RV64-NEXT: and a1, a1, a2			; LMULMAX1-RV64-NEXT: and a1, a1, a2
	; LMULMAX1-RV64-NEXT: add a1, a5, a1			; LMULMAX1-RV64-NEXT: add a1, a5, a1
	; LMULMAX1-RV64-NEXT: srli a5, a1, 4			; LMULMAX1-RV64-NEXT: srli a5, a1, 4
	; LMULMAX1-RV64-NEXT: add a1, a1, a5			; LMULMAX1-RV64-NEXT: add a1, a1, a5
	; LMULMAX1-RV64-NEXT: and a1, a1, a3			; LMULMAX1-RV64-NEXT: and a1, a1, a3
	; LMULMAX1-RV64-NEXT: mul a1, a1, a4			; LMULMAX1-RV64-NEXT: mul a1, a1, a4
	; LMULMAX1-RV64-NEXT: srli a1, a1, 56			; LMULMAX1-RV64-NEXT: srli a1, a1, 56
	; LMULMAX1-RV64-NEXT: addi a1, a1, -56			; LMULMAX1-RV64-NEXT: addiw a1, a1, -56
	; LMULMAX1-RV64-NEXT: sb a1, 26(sp)			; LMULMAX1-RV64-NEXT: sb a1, 26(sp)
	; LMULMAX1-RV64-NEXT: vslidedown.vi v26, v25, 9			; LMULMAX1-RV64-NEXT: vslidedown.vi v26, v25, 9
	; LMULMAX1-RV64-NEXT: vmv.x.s a1, v26			; LMULMAX1-RV64-NEXT: vmv.x.s a1, v26
	; LMULMAX1-RV64-NEXT: andi a1, a1, 255			; LMULMAX1-RV64-NEXT: andi a1, a1, 255
	; LMULMAX1-RV64-NEXT: srli a5, a1, 1			; LMULMAX1-RV64-NEXT: srli a5, a1, 1
	; LMULMAX1-RV64-NEXT: or a1, a1, a5			; LMULMAX1-RV64-NEXT: or a1, a1, a5
	; LMULMAX1-RV64-NEXT: srli a5, a1, 2			; LMULMAX1-RV64-NEXT: srli a5, a1, 2
	; LMULMAX1-RV64-NEXT: or a1, a1, a5			; LMULMAX1-RV64-NEXT: or a1, a1, a5
	Show All 13 Lines
	; LMULMAX1-RV64-NEXT: srli a1, a1, 2			; LMULMAX1-RV64-NEXT: srli a1, a1, 2
	; LMULMAX1-RV64-NEXT: and a1, a1, a2			; LMULMAX1-RV64-NEXT: and a1, a1, a2
	; LMULMAX1-RV64-NEXT: add a1, a5, a1			; LMULMAX1-RV64-NEXT: add a1, a5, a1
	; LMULMAX1-RV64-NEXT: srli a5, a1, 4			; LMULMAX1-RV64-NEXT: srli a5, a1, 4
	; LMULMAX1-RV64-NEXT: add a1, a1, a5			; LMULMAX1-RV64-NEXT: add a1, a1, a5
	; LMULMAX1-RV64-NEXT: and a1, a1, a3			; LMULMAX1-RV64-NEXT: and a1, a1, a3
	; LMULMAX1-RV64-NEXT: mul a1, a1, a4			; LMULMAX1-RV64-NEXT: mul a1, a1, a4
	; LMULMAX1-RV64-NEXT: srli a1, a1, 56			; LMULMAX1-RV64-NEXT: srli a1, a1, 56
	; LMULMAX1-RV64-NEXT: addi a1, a1, -56			; LMULMAX1-RV64-NEXT: addiw a1, a1, -56
	; LMULMAX1-RV64-NEXT: sb a1, 25(sp)			; LMULMAX1-RV64-NEXT: sb a1, 25(sp)
	; LMULMAX1-RV64-NEXT: vslidedown.vi v26, v25, 8			; LMULMAX1-RV64-NEXT: vslidedown.vi v26, v25, 8
	; LMULMAX1-RV64-NEXT: vmv.x.s a1, v26			; LMULMAX1-RV64-NEXT: vmv.x.s a1, v26
	; LMULMAX1-RV64-NEXT: andi a1, a1, 255			; LMULMAX1-RV64-NEXT: andi a1, a1, 255
	; LMULMAX1-RV64-NEXT: srli a5, a1, 1			; LMULMAX1-RV64-NEXT: srli a5, a1, 1
	; LMULMAX1-RV64-NEXT: or a1, a1, a5			; LMULMAX1-RV64-NEXT: or a1, a1, a5
	; LMULMAX1-RV64-NEXT: srli a5, a1, 2			; LMULMAX1-RV64-NEXT: srli a5, a1, 2
	; LMULMAX1-RV64-NEXT: or a1, a1, a5			; LMULMAX1-RV64-NEXT: or a1, a1, a5
	Show All 13 Lines
	; LMULMAX1-RV64-NEXT: srli a1, a1, 2			; LMULMAX1-RV64-NEXT: srli a1, a1, 2
	; LMULMAX1-RV64-NEXT: and a1, a1, a2			; LMULMAX1-RV64-NEXT: and a1, a1, a2
	; LMULMAX1-RV64-NEXT: add a1, a5, a1			; LMULMAX1-RV64-NEXT: add a1, a5, a1
	; LMULMAX1-RV64-NEXT: srli a5, a1, 4			; LMULMAX1-RV64-NEXT: srli a5, a1, 4
	; LMULMAX1-RV64-NEXT: add a1, a1, a5			; LMULMAX1-RV64-NEXT: add a1, a1, a5
	; LMULMAX1-RV64-NEXT: and a1, a1, a3			; LMULMAX1-RV64-NEXT: and a1, a1, a3
	; LMULMAX1-RV64-NEXT: mul a1, a1, a4			; LMULMAX1-RV64-NEXT: mul a1, a1, a4
	; LMULMAX1-RV64-NEXT: srli a1, a1, 56			; LMULMAX1-RV64-NEXT: srli a1, a1, 56
	; LMULMAX1-RV64-NEXT: addi a1, a1, -56			; LMULMAX1-RV64-NEXT: addiw a1, a1, -56
	; LMULMAX1-RV64-NEXT: sb a1, 24(sp)			; LMULMAX1-RV64-NEXT: sb a1, 24(sp)
	; LMULMAX1-RV64-NEXT: vslidedown.vi v26, v25, 7			; LMULMAX1-RV64-NEXT: vslidedown.vi v26, v25, 7
	; LMULMAX1-RV64-NEXT: vmv.x.s a1, v26			; LMULMAX1-RV64-NEXT: vmv.x.s a1, v26
	; LMULMAX1-RV64-NEXT: andi a1, a1, 255			; LMULMAX1-RV64-NEXT: andi a1, a1, 255
	; LMULMAX1-RV64-NEXT: srli a5, a1, 1			; LMULMAX1-RV64-NEXT: srli a5, a1, 1
	; LMULMAX1-RV64-NEXT: or a1, a1, a5			; LMULMAX1-RV64-NEXT: or a1, a1, a5
	; LMULMAX1-RV64-NEXT: srli a5, a1, 2			; LMULMAX1-RV64-NEXT: srli a5, a1, 2
	; LMULMAX1-RV64-NEXT: or a1, a1, a5			; LMULMAX1-RV64-NEXT: or a1, a1, a5
	Show All 13 Lines
	; LMULMAX1-RV64-NEXT: srli a1, a1, 2			; LMULMAX1-RV64-NEXT: srli a1, a1, 2
	; LMULMAX1-RV64-NEXT: and a1, a1, a2			; LMULMAX1-RV64-NEXT: and a1, a1, a2
	; LMULMAX1-RV64-NEXT: add a1, a5, a1			; LMULMAX1-RV64-NEXT: add a1, a5, a1
	; LMULMAX1-RV64-NEXT: srli a5, a1, 4			; LMULMAX1-RV64-NEXT: srli a5, a1, 4
	; LMULMAX1-RV64-NEXT: add a1, a1, a5			; LMULMAX1-RV64-NEXT: add a1, a1, a5
	; LMULMAX1-RV64-NEXT: and a1, a1, a3			; LMULMAX1-RV64-NEXT: and a1, a1, a3
	; LMULMAX1-RV64-NEXT: mul a1, a1, a4			; LMULMAX1-RV64-NEXT: mul a1, a1, a4
	; LMULMAX1-RV64-NEXT: srli a1, a1, 56			; LMULMAX1-RV64-NEXT: srli a1, a1, 56
	; LMULMAX1-RV64-NEXT: addi a1, a1, -56			; LMULMAX1-RV64-NEXT: addiw a1, a1, -56
	; LMULMAX1-RV64-NEXT: sb a1, 23(sp)			; LMULMAX1-RV64-NEXT: sb a1, 23(sp)
	; LMULMAX1-RV64-NEXT: vslidedown.vi v26, v25, 6			; LMULMAX1-RV64-NEXT: vslidedown.vi v26, v25, 6
	; LMULMAX1-RV64-NEXT: vmv.x.s a1, v26			; LMULMAX1-RV64-NEXT: vmv.x.s a1, v26
	; LMULMAX1-RV64-NEXT: andi a1, a1, 255			; LMULMAX1-RV64-NEXT: andi a1, a1, 255
	; LMULMAX1-RV64-NEXT: srli a5, a1, 1			; LMULMAX1-RV64-NEXT: srli a5, a1, 1
	; LMULMAX1-RV64-NEXT: or a1, a1, a5			; LMULMAX1-RV64-NEXT: or a1, a1, a5
	; LMULMAX1-RV64-NEXT: srli a5, a1, 2			; LMULMAX1-RV64-NEXT: srli a5, a1, 2
	; LMULMAX1-RV64-NEXT: or a1, a1, a5			; LMULMAX1-RV64-NEXT: or a1, a1, a5
	Show All 13 Lines
	; LMULMAX1-RV64-NEXT: srli a1, a1, 2			; LMULMAX1-RV64-NEXT: srli a1, a1, 2
	; LMULMAX1-RV64-NEXT: and a1, a1, a2			; LMULMAX1-RV64-NEXT: and a1, a1, a2
	; LMULMAX1-RV64-NEXT: add a1, a5, a1			; LMULMAX1-RV64-NEXT: add a1, a5, a1
	; LMULMAX1-RV64-NEXT: srli a5, a1, 4			; LMULMAX1-RV64-NEXT: srli a5, a1, 4
	; LMULMAX1-RV64-NEXT: add a1, a1, a5			; LMULMAX1-RV64-NEXT: add a1, a1, a5
	; LMULMAX1-RV64-NEXT: and a1, a1, a3			; LMULMAX1-RV64-NEXT: and a1, a1, a3
	; LMULMAX1-RV64-NEXT: mul a1, a1, a4			; LMULMAX1-RV64-NEXT: mul a1, a1, a4
	; LMULMAX1-RV64-NEXT: srli a1, a1, 56			; LMULMAX1-RV64-NEXT: srli a1, a1, 56
	; LMULMAX1-RV64-NEXT: addi a1, a1, -56			; LMULMAX1-RV64-NEXT: addiw a1, a1, -56
	; LMULMAX1-RV64-NEXT: sb a1, 22(sp)			; LMULMAX1-RV64-NEXT: sb a1, 22(sp)
	; LMULMAX1-RV64-NEXT: vslidedown.vi v26, v25, 5			; LMULMAX1-RV64-NEXT: vslidedown.vi v26, v25, 5
	; LMULMAX1-RV64-NEXT: vmv.x.s a1, v26			; LMULMAX1-RV64-NEXT: vmv.x.s a1, v26
	; LMULMAX1-RV64-NEXT: andi a1, a1, 255			; LMULMAX1-RV64-NEXT: andi a1, a1, 255
	; LMULMAX1-RV64-NEXT: srli a5, a1, 1			; LMULMAX1-RV64-NEXT: srli a5, a1, 1
	; LMULMAX1-RV64-NEXT: or a1, a1, a5			; LMULMAX1-RV64-NEXT: or a1, a1, a5
	; LMULMAX1-RV64-NEXT: srli a5, a1, 2			; LMULMAX1-RV64-NEXT: srli a5, a1, 2
	; LMULMAX1-RV64-NEXT: or a1, a1, a5			; LMULMAX1-RV64-NEXT: or a1, a1, a5
	Show All 13 Lines
	; LMULMAX1-RV64-NEXT: srli a1, a1, 2			; LMULMAX1-RV64-NEXT: srli a1, a1, 2
	; LMULMAX1-RV64-NEXT: and a1, a1, a2			; LMULMAX1-RV64-NEXT: and a1, a1, a2
	; LMULMAX1-RV64-NEXT: add a1, a5, a1			; LMULMAX1-RV64-NEXT: add a1, a5, a1
	; LMULMAX1-RV64-NEXT: srli a5, a1, 4			; LMULMAX1-RV64-NEXT: srli a5, a1, 4
	; LMULMAX1-RV64-NEXT: add a1, a1, a5			; LMULMAX1-RV64-NEXT: add a1, a1, a5
	; LMULMAX1-RV64-NEXT: and a1, a1, a3			; LMULMAX1-RV64-NEXT: and a1, a1, a3
	; LMULMAX1-RV64-NEXT: mul a1, a1, a4			; LMULMAX1-RV64-NEXT: mul a1, a1, a4
	; LMULMAX1-RV64-NEXT: srli a1, a1, 56			; LMULMAX1-RV64-NEXT: srli a1, a1, 56
	; LMULMAX1-RV64-NEXT: addi a1, a1, -56			; LMULMAX1-RV64-NEXT: addiw a1, a1, -56
	; LMULMAX1-RV64-NEXT: sb a1, 21(sp)			; LMULMAX1-RV64-NEXT: sb a1, 21(sp)
	; LMULMAX1-RV64-NEXT: vslidedown.vi v26, v25, 4			; LMULMAX1-RV64-NEXT: vslidedown.vi v26, v25, 4
	; LMULMAX1-RV64-NEXT: vmv.x.s a1, v26			; LMULMAX1-RV64-NEXT: vmv.x.s a1, v26
	; LMULMAX1-RV64-NEXT: andi a1, a1, 255			; LMULMAX1-RV64-NEXT: andi a1, a1, 255
	; LMULMAX1-RV64-NEXT: srli a5, a1, 1			; LMULMAX1-RV64-NEXT: srli a5, a1, 1
	; LMULMAX1-RV64-NEXT: or a1, a1, a5			; LMULMAX1-RV64-NEXT: or a1, a1, a5
	; LMULMAX1-RV64-NEXT: srli a5, a1, 2			; LMULMAX1-RV64-NEXT: srli a5, a1, 2
	; LMULMAX1-RV64-NEXT: or a1, a1, a5			; LMULMAX1-RV64-NEXT: or a1, a1, a5
	Show All 13 Lines
	; LMULMAX1-RV64-NEXT: srli a1, a1, 2			; LMULMAX1-RV64-NEXT: srli a1, a1, 2
	; LMULMAX1-RV64-NEXT: and a1, a1, a2			; LMULMAX1-RV64-NEXT: and a1, a1, a2
	; LMULMAX1-RV64-NEXT: add a1, a5, a1			; LMULMAX1-RV64-NEXT: add a1, a5, a1
	; LMULMAX1-RV64-NEXT: srli a5, a1, 4			; LMULMAX1-RV64-NEXT: srli a5, a1, 4
	; LMULMAX1-RV64-NEXT: add a1, a1, a5			; LMULMAX1-RV64-NEXT: add a1, a1, a5
	; LMULMAX1-RV64-NEXT: and a1, a1, a3			; LMULMAX1-RV64-NEXT: and a1, a1, a3
	; LMULMAX1-RV64-NEXT: mul a1, a1, a4			; LMULMAX1-RV64-NEXT: mul a1, a1, a4
	; LMULMAX1-RV64-NEXT: srli a1, a1, 56			; LMULMAX1-RV64-NEXT: srli a1, a1, 56
	; LMULMAX1-RV64-NEXT: addi a1, a1, -56			; LMULMAX1-RV64-NEXT: addiw a1, a1, -56
	; LMULMAX1-RV64-NEXT: sb a1, 20(sp)			; LMULMAX1-RV64-NEXT: sb a1, 20(sp)
	; LMULMAX1-RV64-NEXT: vslidedown.vi v26, v25, 3			; LMULMAX1-RV64-NEXT: vslidedown.vi v26, v25, 3
	; LMULMAX1-RV64-NEXT: vmv.x.s a1, v26			; LMULMAX1-RV64-NEXT: vmv.x.s a1, v26
	; LMULMAX1-RV64-NEXT: andi a1, a1, 255			; LMULMAX1-RV64-NEXT: andi a1, a1, 255
	; LMULMAX1-RV64-NEXT: srli a5, a1, 1			; LMULMAX1-RV64-NEXT: srli a5, a1, 1
	; LMULMAX1-RV64-NEXT: or a1, a1, a5			; LMULMAX1-RV64-NEXT: or a1, a1, a5
	; LMULMAX1-RV64-NEXT: srli a5, a1, 2			; LMULMAX1-RV64-NEXT: srli a5, a1, 2
	; LMULMAX1-RV64-NEXT: or a1, a1, a5			; LMULMAX1-RV64-NEXT: or a1, a1, a5
	Show All 13 Lines
	; LMULMAX1-RV64-NEXT: srli a1, a1, 2			; LMULMAX1-RV64-NEXT: srli a1, a1, 2
	; LMULMAX1-RV64-NEXT: and a1, a1, a2			; LMULMAX1-RV64-NEXT: and a1, a1, a2
	; LMULMAX1-RV64-NEXT: add a1, a5, a1			; LMULMAX1-RV64-NEXT: add a1, a5, a1
	; LMULMAX1-RV64-NEXT: srli a5, a1, 4			; LMULMAX1-RV64-NEXT: srli a5, a1, 4
	; LMULMAX1-RV64-NEXT: add a1, a1, a5			; LMULMAX1-RV64-NEXT: add a1, a1, a5
	; LMULMAX1-RV64-NEXT: and a1, a1, a3			; LMULMAX1-RV64-NEXT: and a1, a1, a3
	; LMULMAX1-RV64-NEXT: mul a1, a1, a4			; LMULMAX1-RV64-NEXT: mul a1, a1, a4
	; LMULMAX1-RV64-NEXT: srli a1, a1, 56			; LMULMAX1-RV64-NEXT: srli a1, a1, 56
	; LMULMAX1-RV64-NEXT: addi a1, a1, -56			; LMULMAX1-RV64-NEXT: addiw a1, a1, -56
	; LMULMAX1-RV64-NEXT: sb a1, 19(sp)			; LMULMAX1-RV64-NEXT: sb a1, 19(sp)
	; LMULMAX1-RV64-NEXT: vslidedown.vi v26, v25, 2			; LMULMAX1-RV64-NEXT: vslidedown.vi v26, v25, 2
	; LMULMAX1-RV64-NEXT: vmv.x.s a1, v26			; LMULMAX1-RV64-NEXT: vmv.x.s a1, v26
	; LMULMAX1-RV64-NEXT: andi a1, a1, 255			; LMULMAX1-RV64-NEXT: andi a1, a1, 255
	; LMULMAX1-RV64-NEXT: srli a5, a1, 1			; LMULMAX1-RV64-NEXT: srli a5, a1, 1
	; LMULMAX1-RV64-NEXT: or a1, a1, a5			; LMULMAX1-RV64-NEXT: or a1, a1, a5
	; LMULMAX1-RV64-NEXT: srli a5, a1, 2			; LMULMAX1-RV64-NEXT: srli a5, a1, 2
	; LMULMAX1-RV64-NEXT: or a1, a1, a5			; LMULMAX1-RV64-NEXT: or a1, a1, a5
	Show All 13 Lines
	; LMULMAX1-RV64-NEXT: srli a1, a1, 2			; LMULMAX1-RV64-NEXT: srli a1, a1, 2
	; LMULMAX1-RV64-NEXT: and a1, a1, a2			; LMULMAX1-RV64-NEXT: and a1, a1, a2
	; LMULMAX1-RV64-NEXT: add a1, a5, a1			; LMULMAX1-RV64-NEXT: add a1, a5, a1
	; LMULMAX1-RV64-NEXT: srli a5, a1, 4			; LMULMAX1-RV64-NEXT: srli a5, a1, 4
	; LMULMAX1-RV64-NEXT: add a1, a1, a5			; LMULMAX1-RV64-NEXT: add a1, a1, a5
	; LMULMAX1-RV64-NEXT: and a1, a1, a3			; LMULMAX1-RV64-NEXT: and a1, a1, a3
	; LMULMAX1-RV64-NEXT: mul a1, a1, a4			; LMULMAX1-RV64-NEXT: mul a1, a1, a4
	; LMULMAX1-RV64-NEXT: srli a1, a1, 56			; LMULMAX1-RV64-NEXT: srli a1, a1, 56
	; LMULMAX1-RV64-NEXT: addi a1, a1, -56			; LMULMAX1-RV64-NEXT: addiw a1, a1, -56
	; LMULMAX1-RV64-NEXT: sb a1, 18(sp)			; LMULMAX1-RV64-NEXT: sb a1, 18(sp)
	; LMULMAX1-RV64-NEXT: vslidedown.vi v25, v25, 1			; LMULMAX1-RV64-NEXT: vslidedown.vi v25, v25, 1
	; LMULMAX1-RV64-NEXT: vmv.x.s a1, v25			; LMULMAX1-RV64-NEXT: vmv.x.s a1, v25
	; LMULMAX1-RV64-NEXT: andi a1, a1, 255			; LMULMAX1-RV64-NEXT: andi a1, a1, 255
	; LMULMAX1-RV64-NEXT: srli a5, a1, 1			; LMULMAX1-RV64-NEXT: srli a5, a1, 1
	; LMULMAX1-RV64-NEXT: or a1, a1, a5			; LMULMAX1-RV64-NEXT: or a1, a1, a5
	; LMULMAX1-RV64-NEXT: srli a5, a1, 2			; LMULMAX1-RV64-NEXT: srli a5, a1, 2
	; LMULMAX1-RV64-NEXT: or a1, a1, a5			; LMULMAX1-RV64-NEXT: or a1, a1, a5
	Show All 13 Lines
	; LMULMAX1-RV64-NEXT: srli a1, a1, 2			; LMULMAX1-RV64-NEXT: srli a1, a1, 2
	; LMULMAX1-RV64-NEXT: and a1, a1, a2			; LMULMAX1-RV64-NEXT: and a1, a1, a2
	; LMULMAX1-RV64-NEXT: add a1, a5, a1			; LMULMAX1-RV64-NEXT: add a1, a5, a1
	; LMULMAX1-RV64-NEXT: srli a2, a1, 4			; LMULMAX1-RV64-NEXT: srli a2, a1, 4
	; LMULMAX1-RV64-NEXT: add a1, a1, a2			; LMULMAX1-RV64-NEXT: add a1, a1, a2
	; LMULMAX1-RV64-NEXT: and a1, a1, a3			; LMULMAX1-RV64-NEXT: and a1, a1, a3
	; LMULMAX1-RV64-NEXT: mul a1, a1, a4			; LMULMAX1-RV64-NEXT: mul a1, a1, a4
	; LMULMAX1-RV64-NEXT: srli a1, a1, 56			; LMULMAX1-RV64-NEXT: srli a1, a1, 56
	; LMULMAX1-RV64-NEXT: addi a1, a1, -56			; LMULMAX1-RV64-NEXT: addiw a1, a1, -56
	; LMULMAX1-RV64-NEXT: sb a1, 17(sp)			; LMULMAX1-RV64-NEXT: sb a1, 17(sp)
	; LMULMAX1-RV64-NEXT: vsetivli zero, 16, e8, m1, ta, mu			; LMULMAX1-RV64-NEXT: vsetivli zero, 16, e8, m1, ta, mu
	; LMULMAX1-RV64-NEXT: addi a1, sp, 16			; LMULMAX1-RV64-NEXT: addi a1, sp, 16
	; LMULMAX1-RV64-NEXT: vle8.v v25, (a1)			; LMULMAX1-RV64-NEXT: vle8.v v25, (a1)
	; LMULMAX1-RV64-NEXT: vse8.v v25, (a0)			; LMULMAX1-RV64-NEXT: vse8.v v25, (a0)
	; LMULMAX1-RV64-NEXT: addi sp, sp, 32			; LMULMAX1-RV64-NEXT: addi sp, sp, 32
	; LMULMAX1-RV64-NEXT: ret			; LMULMAX1-RV64-NEXT: ret
	%a = load <16 x i8>, <16 x i8>* %x			%a = load <16 x i8>, <16 x i8>* %x
	▲ Show 20 Lines • Show All 312 Lines • ▼ Show 20 Lines
	; LMULMAX2-RV64-NEXT: lui a5, 4112			; LMULMAX2-RV64-NEXT: lui a5, 4112
	; LMULMAX2-RV64-NEXT: addiw a5, a5, 257			; LMULMAX2-RV64-NEXT: addiw a5, a5, 257
	; LMULMAX2-RV64-NEXT: slli a5, a5, 16			; LMULMAX2-RV64-NEXT: slli a5, a5, 16
	; LMULMAX2-RV64-NEXT: addi a5, a5, 257			; LMULMAX2-RV64-NEXT: addi a5, a5, 257
	; LMULMAX2-RV64-NEXT: slli a5, a5, 16			; LMULMAX2-RV64-NEXT: slli a5, a5, 16
	; LMULMAX2-RV64-NEXT: addi a5, a5, 257			; LMULMAX2-RV64-NEXT: addi a5, a5, 257
	; LMULMAX2-RV64-NEXT: mul a1, a1, a5			; LMULMAX2-RV64-NEXT: mul a1, a1, a5
	; LMULMAX2-RV64-NEXT: srli a1, a1, 56			; LMULMAX2-RV64-NEXT: srli a1, a1, 56
	; LMULMAX2-RV64-NEXT: addi a1, a1, -48			; LMULMAX2-RV64-NEXT: addiw a1, a1, -48
	; LMULMAX2-RV64-NEXT: sh a1, 16(sp)			; LMULMAX2-RV64-NEXT: sh a1, 16(sp)
	; LMULMAX2-RV64-NEXT: vsetivli zero, 1, e16, m1, ta, mu			; LMULMAX2-RV64-NEXT: vsetivli zero, 1, e16, m1, ta, mu
	; LMULMAX2-RV64-NEXT: vslidedown.vi v26, v25, 7			; LMULMAX2-RV64-NEXT: vslidedown.vi v26, v25, 7
	; LMULMAX2-RV64-NEXT: vmv.x.s a1, v26			; LMULMAX2-RV64-NEXT: vmv.x.s a1, v26
	; LMULMAX2-RV64-NEXT: and a1, a1, a6			; LMULMAX2-RV64-NEXT: and a1, a1, a6
	; LMULMAX2-RV64-NEXT: srli a2, a1, 1			; LMULMAX2-RV64-NEXT: srli a2, a1, 1
	; LMULMAX2-RV64-NEXT: or a1, a1, a2			; LMULMAX2-RV64-NEXT: or a1, a1, a2
	; LMULMAX2-RV64-NEXT: srli a2, a1, 2			; LMULMAX2-RV64-NEXT: srli a2, a1, 2
	Show All 14 Lines
	; LMULMAX2-RV64-NEXT: srli a1, a1, 2			; LMULMAX2-RV64-NEXT: srli a1, a1, 2
	; LMULMAX2-RV64-NEXT: and a1, a1, a3			; LMULMAX2-RV64-NEXT: and a1, a1, a3
	; LMULMAX2-RV64-NEXT: add a1, a2, a1			; LMULMAX2-RV64-NEXT: add a1, a2, a1
	; LMULMAX2-RV64-NEXT: srli a2, a1, 4			; LMULMAX2-RV64-NEXT: srli a2, a1, 4
	; LMULMAX2-RV64-NEXT: add a1, a1, a2			; LMULMAX2-RV64-NEXT: add a1, a1, a2
	; LMULMAX2-RV64-NEXT: and a1, a1, a4			; LMULMAX2-RV64-NEXT: and a1, a1, a4
	; LMULMAX2-RV64-NEXT: mul a1, a1, a5			; LMULMAX2-RV64-NEXT: mul a1, a1, a5
	; LMULMAX2-RV64-NEXT: srli a1, a1, 56			; LMULMAX2-RV64-NEXT: srli a1, a1, 56
	; LMULMAX2-RV64-NEXT: addi a1, a1, -48			; LMULMAX2-RV64-NEXT: addiw a1, a1, -48
	; LMULMAX2-RV64-NEXT: sh a1, 30(sp)			; LMULMAX2-RV64-NEXT: sh a1, 30(sp)
	; LMULMAX2-RV64-NEXT: vslidedown.vi v26, v25, 6			; LMULMAX2-RV64-NEXT: vslidedown.vi v26, v25, 6
	; LMULMAX2-RV64-NEXT: vmv.x.s a1, v26			; LMULMAX2-RV64-NEXT: vmv.x.s a1, v26
	; LMULMAX2-RV64-NEXT: and a1, a1, a6			; LMULMAX2-RV64-NEXT: and a1, a1, a6
	; LMULMAX2-RV64-NEXT: srli a2, a1, 1			; LMULMAX2-RV64-NEXT: srli a2, a1, 1
	; LMULMAX2-RV64-NEXT: or a1, a1, a2			; LMULMAX2-RV64-NEXT: or a1, a1, a2
	; LMULMAX2-RV64-NEXT: srli a2, a1, 2			; LMULMAX2-RV64-NEXT: srli a2, a1, 2
	; LMULMAX2-RV64-NEXT: or a1, a1, a2			; LMULMAX2-RV64-NEXT: or a1, a1, a2
	Show All 13 Lines
	; LMULMAX2-RV64-NEXT: srli a1, a1, 2			; LMULMAX2-RV64-NEXT: srli a1, a1, 2
	; LMULMAX2-RV64-NEXT: and a1, a1, a3			; LMULMAX2-RV64-NEXT: and a1, a1, a3
	; LMULMAX2-RV64-NEXT: add a1, a2, a1			; LMULMAX2-RV64-NEXT: add a1, a2, a1
	; LMULMAX2-RV64-NEXT: srli a2, a1, 4			; LMULMAX2-RV64-NEXT: srli a2, a1, 4
	; LMULMAX2-RV64-NEXT: add a1, a1, a2			; LMULMAX2-RV64-NEXT: add a1, a1, a2
	; LMULMAX2-RV64-NEXT: and a1, a1, a4			; LMULMAX2-RV64-NEXT: and a1, a1, a4
	; LMULMAX2-RV64-NEXT: mul a1, a1, a5			; LMULMAX2-RV64-NEXT: mul a1, a1, a5
	; LMULMAX2-RV64-NEXT: srli a1, a1, 56			; LMULMAX2-RV64-NEXT: srli a1, a1, 56
	; LMULMAX2-RV64-NEXT: addi a1, a1, -48			; LMULMAX2-RV64-NEXT: addiw a1, a1, -48
	; LMULMAX2-RV64-NEXT: sh a1, 28(sp)			; LMULMAX2-RV64-NEXT: sh a1, 28(sp)
	; LMULMAX2-RV64-NEXT: vslidedown.vi v26, v25, 5			; LMULMAX2-RV64-NEXT: vslidedown.vi v26, v25, 5
	; LMULMAX2-RV64-NEXT: vmv.x.s a1, v26			; LMULMAX2-RV64-NEXT: vmv.x.s a1, v26
	; LMULMAX2-RV64-NEXT: and a1, a1, a6			; LMULMAX2-RV64-NEXT: and a1, a1, a6
	; LMULMAX2-RV64-NEXT: srli a2, a1, 1			; LMULMAX2-RV64-NEXT: srli a2, a1, 1
	; LMULMAX2-RV64-NEXT: or a1, a1, a2			; LMULMAX2-RV64-NEXT: or a1, a1, a2
	; LMULMAX2-RV64-NEXT: srli a2, a1, 2			; LMULMAX2-RV64-NEXT: srli a2, a1, 2
	; LMULMAX2-RV64-NEXT: or a1, a1, a2			; LMULMAX2-RV64-NEXT: or a1, a1, a2
	Show All 13 Lines
	; LMULMAX2-RV64-NEXT: srli a1, a1, 2			; LMULMAX2-RV64-NEXT: srli a1, a1, 2
	; LMULMAX2-RV64-NEXT: and a1, a1, a3			; LMULMAX2-RV64-NEXT: and a1, a1, a3
	; LMULMAX2-RV64-NEXT: add a1, a2, a1			; LMULMAX2-RV64-NEXT: add a1, a2, a1
	; LMULMAX2-RV64-NEXT: srli a2, a1, 4			; LMULMAX2-RV64-NEXT: srli a2, a1, 4
	; LMULMAX2-RV64-NEXT: add a1, a1, a2			; LMULMAX2-RV64-NEXT: add a1, a1, a2
	; LMULMAX2-RV64-NEXT: and a1, a1, a4			; LMULMAX2-RV64-NEXT: and a1, a1, a4
	; LMULMAX2-RV64-NEXT: mul a1, a1, a5			; LMULMAX2-RV64-NEXT: mul a1, a1, a5
	; LMULMAX2-RV64-NEXT: srli a1, a1, 56			; LMULMAX2-RV64-NEXT: srli a1, a1, 56
	; LMULMAX2-RV64-NEXT: addi a1, a1, -48			; LMULMAX2-RV64-NEXT: addiw a1, a1, -48
	; LMULMAX2-RV64-NEXT: sh a1, 26(sp)			; LMULMAX2-RV64-NEXT: sh a1, 26(sp)
	; LMULMAX2-RV64-NEXT: vslidedown.vi v26, v25, 4			; LMULMAX2-RV64-NEXT: vslidedown.vi v26, v25, 4
	; LMULMAX2-RV64-NEXT: vmv.x.s a1, v26			; LMULMAX2-RV64-NEXT: vmv.x.s a1, v26
	; LMULMAX2-RV64-NEXT: and a1, a1, a6			; LMULMAX2-RV64-NEXT: and a1, a1, a6
	; LMULMAX2-RV64-NEXT: srli a2, a1, 1			; LMULMAX2-RV64-NEXT: srli a2, a1, 1
	; LMULMAX2-RV64-NEXT: or a1, a1, a2			; LMULMAX2-RV64-NEXT: or a1, a1, a2
	; LMULMAX2-RV64-NEXT: srli a2, a1, 2			; LMULMAX2-RV64-NEXT: srli a2, a1, 2
	; LMULMAX2-RV64-NEXT: or a1, a1, a2			; LMULMAX2-RV64-NEXT: or a1, a1, a2
	Show All 13 Lines
	; LMULMAX2-RV64-NEXT: srli a1, a1, 2			; LMULMAX2-RV64-NEXT: srli a1, a1, 2
	; LMULMAX2-RV64-NEXT: and a1, a1, a3			; LMULMAX2-RV64-NEXT: and a1, a1, a3
	; LMULMAX2-RV64-NEXT: add a1, a2, a1			; LMULMAX2-RV64-NEXT: add a1, a2, a1
	; LMULMAX2-RV64-NEXT: srli a2, a1, 4			; LMULMAX2-RV64-NEXT: srli a2, a1, 4
	; LMULMAX2-RV64-NEXT: add a1, a1, a2			; LMULMAX2-RV64-NEXT: add a1, a1, a2
	; LMULMAX2-RV64-NEXT: and a1, a1, a4			; LMULMAX2-RV64-NEXT: and a1, a1, a4
	; LMULMAX2-RV64-NEXT: mul a1, a1, a5			; LMULMAX2-RV64-NEXT: mul a1, a1, a5
	; LMULMAX2-RV64-NEXT: srli a1, a1, 56			; LMULMAX2-RV64-NEXT: srli a1, a1, 56
	; LMULMAX2-RV64-NEXT: addi a1, a1, -48			; LMULMAX2-RV64-NEXT: addiw a1, a1, -48
	; LMULMAX2-RV64-NEXT: sh a1, 24(sp)			; LMULMAX2-RV64-NEXT: sh a1, 24(sp)
	; LMULMAX2-RV64-NEXT: vslidedown.vi v26, v25, 3			; LMULMAX2-RV64-NEXT: vslidedown.vi v26, v25, 3
	; LMULMAX2-RV64-NEXT: vmv.x.s a1, v26			; LMULMAX2-RV64-NEXT: vmv.x.s a1, v26
	; LMULMAX2-RV64-NEXT: and a1, a1, a6			; LMULMAX2-RV64-NEXT: and a1, a1, a6
	; LMULMAX2-RV64-NEXT: srli a2, a1, 1			; LMULMAX2-RV64-NEXT: srli a2, a1, 1
	; LMULMAX2-RV64-NEXT: or a1, a1, a2			; LMULMAX2-RV64-NEXT: or a1, a1, a2
	; LMULMAX2-RV64-NEXT: srli a2, a1, 2			; LMULMAX2-RV64-NEXT: srli a2, a1, 2
	; LMULMAX2-RV64-NEXT: or a1, a1, a2			; LMULMAX2-RV64-NEXT: or a1, a1, a2
	Show All 13 Lines
	; LMULMAX2-RV64-NEXT: srli a1, a1, 2			; LMULMAX2-RV64-NEXT: srli a1, a1, 2
	; LMULMAX2-RV64-NEXT: and a1, a1, a3			; LMULMAX2-RV64-NEXT: and a1, a1, a3
	; LMULMAX2-RV64-NEXT: add a1, a2, a1			; LMULMAX2-RV64-NEXT: add a1, a2, a1
	; LMULMAX2-RV64-NEXT: srli a2, a1, 4			; LMULMAX2-RV64-NEXT: srli a2, a1, 4
	; LMULMAX2-RV64-NEXT: add a1, a1, a2			; LMULMAX2-RV64-NEXT: add a1, a1, a2
	; LMULMAX2-RV64-NEXT: and a1, a1, a4			; LMULMAX2-RV64-NEXT: and a1, a1, a4
	; LMULMAX2-RV64-NEXT: mul a1, a1, a5			; LMULMAX2-RV64-NEXT: mul a1, a1, a5
	; LMULMAX2-RV64-NEXT: srli a1, a1, 56			; LMULMAX2-RV64-NEXT: srli a1, a1, 56
	; LMULMAX2-RV64-NEXT: addi a1, a1, -48			; LMULMAX2-RV64-NEXT: addiw a1, a1, -48
	; LMULMAX2-RV64-NEXT: sh a1, 22(sp)			; LMULMAX2-RV64-NEXT: sh a1, 22(sp)
	; LMULMAX2-RV64-NEXT: vslidedown.vi v26, v25, 2			; LMULMAX2-RV64-NEXT: vslidedown.vi v26, v25, 2
	; LMULMAX2-RV64-NEXT: vmv.x.s a1, v26			; LMULMAX2-RV64-NEXT: vmv.x.s a1, v26
	; LMULMAX2-RV64-NEXT: and a1, a1, a6			; LMULMAX2-RV64-NEXT: and a1, a1, a6
	; LMULMAX2-RV64-NEXT: srli a2, a1, 1			; LMULMAX2-RV64-NEXT: srli a2, a1, 1
	; LMULMAX2-RV64-NEXT: or a1, a1, a2			; LMULMAX2-RV64-NEXT: or a1, a1, a2
	; LMULMAX2-RV64-NEXT: srli a2, a1, 2			; LMULMAX2-RV64-NEXT: srli a2, a1, 2
	; LMULMAX2-RV64-NEXT: or a1, a1, a2			; LMULMAX2-RV64-NEXT: or a1, a1, a2
	Show All 13 Lines
	; LMULMAX2-RV64-NEXT: srli a1, a1, 2			; LMULMAX2-RV64-NEXT: srli a1, a1, 2
	; LMULMAX2-RV64-NEXT: and a1, a1, a3			; LMULMAX2-RV64-NEXT: and a1, a1, a3
	; LMULMAX2-RV64-NEXT: add a1, a2, a1			; LMULMAX2-RV64-NEXT: add a1, a2, a1
	; LMULMAX2-RV64-NEXT: srli a2, a1, 4			; LMULMAX2-RV64-NEXT: srli a2, a1, 4
	; LMULMAX2-RV64-NEXT: add a1, a1, a2			; LMULMAX2-RV64-NEXT: add a1, a1, a2
	; LMULMAX2-RV64-NEXT: and a1, a1, a4			; LMULMAX2-RV64-NEXT: and a1, a1, a4
	; LMULMAX2-RV64-NEXT: mul a1, a1, a5			; LMULMAX2-RV64-NEXT: mul a1, a1, a5
	; LMULMAX2-RV64-NEXT: srli a1, a1, 56			; LMULMAX2-RV64-NEXT: srli a1, a1, 56
	; LMULMAX2-RV64-NEXT: addi a1, a1, -48			; LMULMAX2-RV64-NEXT: addiw a1, a1, -48
	; LMULMAX2-RV64-NEXT: sh a1, 20(sp)			; LMULMAX2-RV64-NEXT: sh a1, 20(sp)
	; LMULMAX2-RV64-NEXT: vslidedown.vi v25, v25, 1			; LMULMAX2-RV64-NEXT: vslidedown.vi v25, v25, 1
	; LMULMAX2-RV64-NEXT: vmv.x.s a1, v25			; LMULMAX2-RV64-NEXT: vmv.x.s a1, v25
	; LMULMAX2-RV64-NEXT: and a1, a1, a6			; LMULMAX2-RV64-NEXT: and a1, a1, a6
	; LMULMAX2-RV64-NEXT: srli a2, a1, 1			; LMULMAX2-RV64-NEXT: srli a2, a1, 1
	; LMULMAX2-RV64-NEXT: or a1, a1, a2			; LMULMAX2-RV64-NEXT: or a1, a1, a2
	; LMULMAX2-RV64-NEXT: srli a2, a1, 2			; LMULMAX2-RV64-NEXT: srli a2, a1, 2
	; LMULMAX2-RV64-NEXT: or a1, a1, a2			; LMULMAX2-RV64-NEXT: or a1, a1, a2
	Show All 13 Lines
	; LMULMAX2-RV64-NEXT: srli a1, a1, 2			; LMULMAX2-RV64-NEXT: srli a1, a1, 2
	; LMULMAX2-RV64-NEXT: and a1, a1, a3			; LMULMAX2-RV64-NEXT: and a1, a1, a3
	; LMULMAX2-RV64-NEXT: add a1, a2, a1			; LMULMAX2-RV64-NEXT: add a1, a2, a1
	; LMULMAX2-RV64-NEXT: srli a2, a1, 4			; LMULMAX2-RV64-NEXT: srli a2, a1, 4
	; LMULMAX2-RV64-NEXT: add a1, a1, a2			; LMULMAX2-RV64-NEXT: add a1, a1, a2
	; LMULMAX2-RV64-NEXT: and a1, a1, a4			; LMULMAX2-RV64-NEXT: and a1, a1, a4
	; LMULMAX2-RV64-NEXT: mul a1, a1, a5			; LMULMAX2-RV64-NEXT: mul a1, a1, a5
	; LMULMAX2-RV64-NEXT: srli a1, a1, 56			; LMULMAX2-RV64-NEXT: srli a1, a1, 56
	; LMULMAX2-RV64-NEXT: addi a1, a1, -48			; LMULMAX2-RV64-NEXT: addiw a1, a1, -48
	; LMULMAX2-RV64-NEXT: sh a1, 18(sp)			; LMULMAX2-RV64-NEXT: sh a1, 18(sp)
	; LMULMAX2-RV64-NEXT: vsetivli zero, 8, e16, m1, ta, mu			; LMULMAX2-RV64-NEXT: vsetivli zero, 8, e16, m1, ta, mu
	; LMULMAX2-RV64-NEXT: addi a1, sp, 16			; LMULMAX2-RV64-NEXT: addi a1, sp, 16
	; LMULMAX2-RV64-NEXT: vle16.v v25, (a1)			; LMULMAX2-RV64-NEXT: vle16.v v25, (a1)
	; LMULMAX2-RV64-NEXT: vse16.v v25, (a0)			; LMULMAX2-RV64-NEXT: vse16.v v25, (a0)
	; LMULMAX2-RV64-NEXT: addi sp, sp, 32			; LMULMAX2-RV64-NEXT: addi sp, sp, 32
	; LMULMAX2-RV64-NEXT: ret			; LMULMAX2-RV64-NEXT: ret
	;			;
	▲ Show 20 Lines • Show All 304 Lines • ▼ Show 20 Lines
	; LMULMAX1-RV64-NEXT: lui a5, 4112			; LMULMAX1-RV64-NEXT: lui a5, 4112
	; LMULMAX1-RV64-NEXT: addiw a5, a5, 257			; LMULMAX1-RV64-NEXT: addiw a5, a5, 257
	; LMULMAX1-RV64-NEXT: slli a5, a5, 16			; LMULMAX1-RV64-NEXT: slli a5, a5, 16
	; LMULMAX1-RV64-NEXT: addi a5, a5, 257			; LMULMAX1-RV64-NEXT: addi a5, a5, 257
	; LMULMAX1-RV64-NEXT: slli a5, a5, 16			; LMULMAX1-RV64-NEXT: slli a5, a5, 16
	; LMULMAX1-RV64-NEXT: addi a5, a5, 257			; LMULMAX1-RV64-NEXT: addi a5, a5, 257
	; LMULMAX1-RV64-NEXT: mul a1, a1, a5			; LMULMAX1-RV64-NEXT: mul a1, a1, a5
	; LMULMAX1-RV64-NEXT: srli a1, a1, 56			; LMULMAX1-RV64-NEXT: srli a1, a1, 56
	; LMULMAX1-RV64-NEXT: addi a1, a1, -48			; LMULMAX1-RV64-NEXT: addiw a1, a1, -48
	; LMULMAX1-RV64-NEXT: sh a1, 16(sp)			; LMULMAX1-RV64-NEXT: sh a1, 16(sp)
	; LMULMAX1-RV64-NEXT: vsetivli zero, 1, e16, m1, ta, mu			; LMULMAX1-RV64-NEXT: vsetivli zero, 1, e16, m1, ta, mu
	; LMULMAX1-RV64-NEXT: vslidedown.vi v26, v25, 7			; LMULMAX1-RV64-NEXT: vslidedown.vi v26, v25, 7
	; LMULMAX1-RV64-NEXT: vmv.x.s a1, v26			; LMULMAX1-RV64-NEXT: vmv.x.s a1, v26
	; LMULMAX1-RV64-NEXT: and a1, a1, a6			; LMULMAX1-RV64-NEXT: and a1, a1, a6
	; LMULMAX1-RV64-NEXT: srli a2, a1, 1			; LMULMAX1-RV64-NEXT: srli a2, a1, 1
	; LMULMAX1-RV64-NEXT: or a1, a1, a2			; LMULMAX1-RV64-NEXT: or a1, a1, a2
	; LMULMAX1-RV64-NEXT: srli a2, a1, 2			; LMULMAX1-RV64-NEXT: srli a2, a1, 2
	Show All 14 Lines
	; LMULMAX1-RV64-NEXT: srli a1, a1, 2			; LMULMAX1-RV64-NEXT: srli a1, a1, 2
	; LMULMAX1-RV64-NEXT: and a1, a1, a3			; LMULMAX1-RV64-NEXT: and a1, a1, a3
	; LMULMAX1-RV64-NEXT: add a1, a2, a1			; LMULMAX1-RV64-NEXT: add a1, a2, a1
	; LMULMAX1-RV64-NEXT: srli a2, a1, 4			; LMULMAX1-RV64-NEXT: srli a2, a1, 4
	; LMULMAX1-RV64-NEXT: add a1, a1, a2			; LMULMAX1-RV64-NEXT: add a1, a1, a2
	; LMULMAX1-RV64-NEXT: and a1, a1, a4			; LMULMAX1-RV64-NEXT: and a1, a1, a4
	; LMULMAX1-RV64-NEXT: mul a1, a1, a5			; LMULMAX1-RV64-NEXT: mul a1, a1, a5
	; LMULMAX1-RV64-NEXT: srli a1, a1, 56			; LMULMAX1-RV64-NEXT: srli a1, a1, 56
	; LMULMAX1-RV64-NEXT: addi a1, a1, -48			; LMULMAX1-RV64-NEXT: addiw a1, a1, -48
	; LMULMAX1-RV64-NEXT: sh a1, 30(sp)			; LMULMAX1-RV64-NEXT: sh a1, 30(sp)
	; LMULMAX1-RV64-NEXT: vslidedown.vi v26, v25, 6			; LMULMAX1-RV64-NEXT: vslidedown.vi v26, v25, 6
	; LMULMAX1-RV64-NEXT: vmv.x.s a1, v26			; LMULMAX1-RV64-NEXT: vmv.x.s a1, v26
	; LMULMAX1-RV64-NEXT: and a1, a1, a6			; LMULMAX1-RV64-NEXT: and a1, a1, a6
	; LMULMAX1-RV64-NEXT: srli a2, a1, 1			; LMULMAX1-RV64-NEXT: srli a2, a1, 1
	; LMULMAX1-RV64-NEXT: or a1, a1, a2			; LMULMAX1-RV64-NEXT: or a1, a1, a2
	; LMULMAX1-RV64-NEXT: srli a2, a1, 2			; LMULMAX1-RV64-NEXT: srli a2, a1, 2
	; LMULMAX1-RV64-NEXT: or a1, a1, a2			; LMULMAX1-RV64-NEXT: or a1, a1, a2
	Show All 13 Lines
	; LMULMAX1-RV64-NEXT: srli a1, a1, 2			; LMULMAX1-RV64-NEXT: srli a1, a1, 2
	; LMULMAX1-RV64-NEXT: and a1, a1, a3			; LMULMAX1-RV64-NEXT: and a1, a1, a3
	; LMULMAX1-RV64-NEXT: add a1, a2, a1			; LMULMAX1-RV64-NEXT: add a1, a2, a1
	; LMULMAX1-RV64-NEXT: srli a2, a1, 4			; LMULMAX1-RV64-NEXT: srli a2, a1, 4
	; LMULMAX1-RV64-NEXT: add a1, a1, a2			; LMULMAX1-RV64-NEXT: add a1, a1, a2
	; LMULMAX1-RV64-NEXT: and a1, a1, a4			; LMULMAX1-RV64-NEXT: and a1, a1, a4
	; LMULMAX1-RV64-NEXT: mul a1, a1, a5			; LMULMAX1-RV64-NEXT: mul a1, a1, a5
	; LMULMAX1-RV64-NEXT: srli a1, a1, 56			; LMULMAX1-RV64-NEXT: srli a1, a1, 56
	; LMULMAX1-RV64-NEXT: addi a1, a1, -48			; LMULMAX1-RV64-NEXT: addiw a1, a1, -48
	; LMULMAX1-RV64-NEXT: sh a1, 28(sp)			; LMULMAX1-RV64-NEXT: sh a1, 28(sp)
	; LMULMAX1-RV64-NEXT: vslidedown.vi v26, v25, 5			; LMULMAX1-RV64-NEXT: vslidedown.vi v26, v25, 5
	; LMULMAX1-RV64-NEXT: vmv.x.s a1, v26			; LMULMAX1-RV64-NEXT: vmv.x.s a1, v26
	; LMULMAX1-RV64-NEXT: and a1, a1, a6			; LMULMAX1-RV64-NEXT: and a1, a1, a6
	; LMULMAX1-RV64-NEXT: srli a2, a1, 1			; LMULMAX1-RV64-NEXT: srli a2, a1, 1
	; LMULMAX1-RV64-NEXT: or a1, a1, a2			; LMULMAX1-RV64-NEXT: or a1, a1, a2
	; LMULMAX1-RV64-NEXT: srli a2, a1, 2			; LMULMAX1-RV64-NEXT: srli a2, a1, 2
	; LMULMAX1-RV64-NEXT: or a1, a1, a2			; LMULMAX1-RV64-NEXT: or a1, a1, a2
	Show All 13 Lines
	; LMULMAX1-RV64-NEXT: srli a1, a1, 2			; LMULMAX1-RV64-NEXT: srli a1, a1, 2
	; LMULMAX1-RV64-NEXT: and a1, a1, a3			; LMULMAX1-RV64-NEXT: and a1, a1, a3
	; LMULMAX1-RV64-NEXT: add a1, a2, a1			; LMULMAX1-RV64-NEXT: add a1, a2, a1
	; LMULMAX1-RV64-NEXT: srli a2, a1, 4			; LMULMAX1-RV64-NEXT: srli a2, a1, 4
	; LMULMAX1-RV64-NEXT: add a1, a1, a2			; LMULMAX1-RV64-NEXT: add a1, a1, a2
	; LMULMAX1-RV64-NEXT: and a1, a1, a4			; LMULMAX1-RV64-NEXT: and a1, a1, a4
	; LMULMAX1-RV64-NEXT: mul a1, a1, a5			; LMULMAX1-RV64-NEXT: mul a1, a1, a5
	; LMULMAX1-RV64-NEXT: srli a1, a1, 56			; LMULMAX1-RV64-NEXT: srli a1, a1, 56
	; LMULMAX1-RV64-NEXT: addi a1, a1, -48			; LMULMAX1-RV64-NEXT: addiw a1, a1, -48
	; LMULMAX1-RV64-NEXT: sh a1, 26(sp)			; LMULMAX1-RV64-NEXT: sh a1, 26(sp)
	; LMULMAX1-RV64-NEXT: vslidedown.vi v26, v25, 4			; LMULMAX1-RV64-NEXT: vslidedown.vi v26, v25, 4
	; LMULMAX1-RV64-NEXT: vmv.x.s a1, v26			; LMULMAX1-RV64-NEXT: vmv.x.s a1, v26
	; LMULMAX1-RV64-NEXT: and a1, a1, a6			; LMULMAX1-RV64-NEXT: and a1, a1, a6
	; LMULMAX1-RV64-NEXT: srli a2, a1, 1			; LMULMAX1-RV64-NEXT: srli a2, a1, 1
	; LMULMAX1-RV64-NEXT: or a1, a1, a2			; LMULMAX1-RV64-NEXT: or a1, a1, a2
	; LMULMAX1-RV64-NEXT: srli a2, a1, 2			; LMULMAX1-RV64-NEXT: srli a2, a1, 2
	; LMULMAX1-RV64-NEXT: or a1, a1, a2			; LMULMAX1-RV64-NEXT: or a1, a1, a2
	Show All 13 Lines
	; LMULMAX1-RV64-NEXT: srli a1, a1, 2			; LMULMAX1-RV64-NEXT: srli a1, a1, 2
	; LMULMAX1-RV64-NEXT: and a1, a1, a3			; LMULMAX1-RV64-NEXT: and a1, a1, a3
	; LMULMAX1-RV64-NEXT: add a1, a2, a1			; LMULMAX1-RV64-NEXT: add a1, a2, a1
	; LMULMAX1-RV64-NEXT: srli a2, a1, 4			; LMULMAX1-RV64-NEXT: srli a2, a1, 4
	; LMULMAX1-RV64-NEXT: add a1, a1, a2			; LMULMAX1-RV64-NEXT: add a1, a1, a2
	; LMULMAX1-RV64-NEXT: and a1, a1, a4			; LMULMAX1-RV64-NEXT: and a1, a1, a4
	; LMULMAX1-RV64-NEXT: mul a1, a1, a5			; LMULMAX1-RV64-NEXT: mul a1, a1, a5
	; LMULMAX1-RV64-NEXT: srli a1, a1, 56			; LMULMAX1-RV64-NEXT: srli a1, a1, 56
	; LMULMAX1-RV64-NEXT: addi a1, a1, -48			; LMULMAX1-RV64-NEXT: addiw a1, a1, -48
	; LMULMAX1-RV64-NEXT: sh a1, 24(sp)			; LMULMAX1-RV64-NEXT: sh a1, 24(sp)
	; LMULMAX1-RV64-NEXT: vslidedown.vi v26, v25, 3			; LMULMAX1-RV64-NEXT: vslidedown.vi v26, v25, 3
	; LMULMAX1-RV64-NEXT: vmv.x.s a1, v26			; LMULMAX1-RV64-NEXT: vmv.x.s a1, v26
	; LMULMAX1-RV64-NEXT: and a1, a1, a6			; LMULMAX1-RV64-NEXT: and a1, a1, a6
	; LMULMAX1-RV64-NEXT: srli a2, a1, 1			; LMULMAX1-RV64-NEXT: srli a2, a1, 1
	; LMULMAX1-RV64-NEXT: or a1, a1, a2			; LMULMAX1-RV64-NEXT: or a1, a1, a2
	; LMULMAX1-RV64-NEXT: srli a2, a1, 2			; LMULMAX1-RV64-NEXT: srli a2, a1, 2
	; LMULMAX1-RV64-NEXT: or a1, a1, a2			; LMULMAX1-RV64-NEXT: or a1, a1, a2
	Show All 13 Lines
	; LMULMAX1-RV64-NEXT: srli a1, a1, 2			; LMULMAX1-RV64-NEXT: srli a1, a1, 2
	; LMULMAX1-RV64-NEXT: and a1, a1, a3			; LMULMAX1-RV64-NEXT: and a1, a1, a3
	; LMULMAX1-RV64-NEXT: add a1, a2, a1			; LMULMAX1-RV64-NEXT: add a1, a2, a1
	; LMULMAX1-RV64-NEXT: srli a2, a1, 4			; LMULMAX1-RV64-NEXT: srli a2, a1, 4
	; LMULMAX1-RV64-NEXT: add a1, a1, a2			; LMULMAX1-RV64-NEXT: add a1, a1, a2
	; LMULMAX1-RV64-NEXT: and a1, a1, a4			; LMULMAX1-RV64-NEXT: and a1, a1, a4
	; LMULMAX1-RV64-NEXT: mul a1, a1, a5			; LMULMAX1-RV64-NEXT: mul a1, a1, a5
	; LMULMAX1-RV64-NEXT: srli a1, a1, 56			; LMULMAX1-RV64-NEXT: srli a1, a1, 56
	; LMULMAX1-RV64-NEXT: addi a1, a1, -48			; LMULMAX1-RV64-NEXT: addiw a1, a1, -48
	; LMULMAX1-RV64-NEXT: sh a1, 22(sp)			; LMULMAX1-RV64-NEXT: sh a1, 22(sp)
	; LMULMAX1-RV64-NEXT: vslidedown.vi v26, v25, 2			; LMULMAX1-RV64-NEXT: vslidedown.vi v26, v25, 2
	; LMULMAX1-RV64-NEXT: vmv.x.s a1, v26			; LMULMAX1-RV64-NEXT: vmv.x.s a1, v26
	; LMULMAX1-RV64-NEXT: and a1, a1, a6			; LMULMAX1-RV64-NEXT: and a1, a1, a6
	; LMULMAX1-RV64-NEXT: srli a2, a1, 1			; LMULMAX1-RV64-NEXT: srli a2, a1, 1
	; LMULMAX1-RV64-NEXT: or a1, a1, a2			; LMULMAX1-RV64-NEXT: or a1, a1, a2
	; LMULMAX1-RV64-NEXT: srli a2, a1, 2			; LMULMAX1-RV64-NEXT: srli a2, a1, 2
	; LMULMAX1-RV64-NEXT: or a1, a1, a2			; LMULMAX1-RV64-NEXT: or a1, a1, a2
	Show All 13 Lines
	; LMULMAX1-RV64-NEXT: srli a1, a1, 2			; LMULMAX1-RV64-NEXT: srli a1, a1, 2
	; LMULMAX1-RV64-NEXT: and a1, a1, a3			; LMULMAX1-RV64-NEXT: and a1, a1, a3
	; LMULMAX1-RV64-NEXT: add a1, a2, a1			; LMULMAX1-RV64-NEXT: add a1, a2, a1
	; LMULMAX1-RV64-NEXT: srli a2, a1, 4			; LMULMAX1-RV64-NEXT: srli a2, a1, 4
	; LMULMAX1-RV64-NEXT: add a1, a1, a2			; LMULMAX1-RV64-NEXT: add a1, a1, a2
	; LMULMAX1-RV64-NEXT: and a1, a1, a4			; LMULMAX1-RV64-NEXT: and a1, a1, a4
	; LMULMAX1-RV64-NEXT: mul a1, a1, a5			; LMULMAX1-RV64-NEXT: mul a1, a1, a5
	; LMULMAX1-RV64-NEXT: srli a1, a1, 56			; LMULMAX1-RV64-NEXT: srli a1, a1, 56
	; LMULMAX1-RV64-NEXT: addi a1, a1, -48			; LMULMAX1-RV64-NEXT: addiw a1, a1, -48
	; LMULMAX1-RV64-NEXT: sh a1, 20(sp)			; LMULMAX1-RV64-NEXT: sh a1, 20(sp)
	; LMULMAX1-RV64-NEXT: vslidedown.vi v25, v25, 1			; LMULMAX1-RV64-NEXT: vslidedown.vi v25, v25, 1
	; LMULMAX1-RV64-NEXT: vmv.x.s a1, v25			; LMULMAX1-RV64-NEXT: vmv.x.s a1, v25
	; LMULMAX1-RV64-NEXT: and a1, a1, a6			; LMULMAX1-RV64-NEXT: and a1, a1, a6
	; LMULMAX1-RV64-NEXT: srli a2, a1, 1			; LMULMAX1-RV64-NEXT: srli a2, a1, 1
	; LMULMAX1-RV64-NEXT: or a1, a1, a2			; LMULMAX1-RV64-NEXT: or a1, a1, a2
	; LMULMAX1-RV64-NEXT: srli a2, a1, 2			; LMULMAX1-RV64-NEXT: srli a2, a1, 2
	; LMULMAX1-RV64-NEXT: or a1, a1, a2			; LMULMAX1-RV64-NEXT: or a1, a1, a2
	Show All 13 Lines
	; LMULMAX1-RV64-NEXT: srli a1, a1, 2			; LMULMAX1-RV64-NEXT: srli a1, a1, 2
	; LMULMAX1-RV64-NEXT: and a1, a1, a3			; LMULMAX1-RV64-NEXT: and a1, a1, a3
	; LMULMAX1-RV64-NEXT: add a1, a2, a1			; LMULMAX1-RV64-NEXT: add a1, a2, a1
	; LMULMAX1-RV64-NEXT: srli a2, a1, 4			; LMULMAX1-RV64-NEXT: srli a2, a1, 4
	; LMULMAX1-RV64-NEXT: add a1, a1, a2			; LMULMAX1-RV64-NEXT: add a1, a1, a2
	; LMULMAX1-RV64-NEXT: and a1, a1, a4			; LMULMAX1-RV64-NEXT: and a1, a1, a4
	; LMULMAX1-RV64-NEXT: mul a1, a1, a5			; LMULMAX1-RV64-NEXT: mul a1, a1, a5
	; LMULMAX1-RV64-NEXT: srli a1, a1, 56			; LMULMAX1-RV64-NEXT: srli a1, a1, 56
	; LMULMAX1-RV64-NEXT: addi a1, a1, -48			; LMULMAX1-RV64-NEXT: addiw a1, a1, -48
	; LMULMAX1-RV64-NEXT: sh a1, 18(sp)			; LMULMAX1-RV64-NEXT: sh a1, 18(sp)
	; LMULMAX1-RV64-NEXT: vsetivli zero, 8, e16, m1, ta, mu			; LMULMAX1-RV64-NEXT: vsetivli zero, 8, e16, m1, ta, mu
	; LMULMAX1-RV64-NEXT: addi a1, sp, 16			; LMULMAX1-RV64-NEXT: addi a1, sp, 16
	; LMULMAX1-RV64-NEXT: vle16.v v25, (a1)			; LMULMAX1-RV64-NEXT: vle16.v v25, (a1)
	; LMULMAX1-RV64-NEXT: vse16.v v25, (a0)			; LMULMAX1-RV64-NEXT: vse16.v v25, (a0)
	; LMULMAX1-RV64-NEXT: addi sp, sp, 32			; LMULMAX1-RV64-NEXT: addi sp, sp, 32
	; LMULMAX1-RV64-NEXT: ret			; LMULMAX1-RV64-NEXT: ret
	%a = load <8 x i16>, <8 x i16>* %x			%a = load <8 x i16>, <8 x i16>* %x
	▲ Show 20 Lines • Show All 189 Lines • ▼ Show 20 Lines
	; LMULMAX2-RV64-NEXT: lui a4, 4112			; LMULMAX2-RV64-NEXT: lui a4, 4112
	; LMULMAX2-RV64-NEXT: addiw a4, a4, 257			; LMULMAX2-RV64-NEXT: addiw a4, a4, 257
	; LMULMAX2-RV64-NEXT: slli a4, a4, 16			; LMULMAX2-RV64-NEXT: slli a4, a4, 16
	; LMULMAX2-RV64-NEXT: addi a4, a4, 257			; LMULMAX2-RV64-NEXT: addi a4, a4, 257
	; LMULMAX2-RV64-NEXT: slli a4, a4, 16			; LMULMAX2-RV64-NEXT: slli a4, a4, 16
	; LMULMAX2-RV64-NEXT: addi a4, a4, 257			; LMULMAX2-RV64-NEXT: addi a4, a4, 257
	; LMULMAX2-RV64-NEXT: mul a5, a5, a4			; LMULMAX2-RV64-NEXT: mul a5, a5, a4
	; LMULMAX2-RV64-NEXT: srli a5, a5, 56			; LMULMAX2-RV64-NEXT: srli a5, a5, 56
	; LMULMAX2-RV64-NEXT: addi a5, a5, -32			; LMULMAX2-RV64-NEXT: addiw a5, a5, -32
	; LMULMAX2-RV64-NEXT: sw a5, 16(sp)			; LMULMAX2-RV64-NEXT: sw a5, 16(sp)
	; LMULMAX2-RV64-NEXT: vsetivli zero, 1, e32, m1, ta, mu			; LMULMAX2-RV64-NEXT: vsetivli zero, 1, e32, m1, ta, mu
	; LMULMAX2-RV64-NEXT: vslidedown.vi v26, v25, 3			; LMULMAX2-RV64-NEXT: vslidedown.vi v26, v25, 3
	; LMULMAX2-RV64-NEXT: vmv.x.s a5, v26			; LMULMAX2-RV64-NEXT: vmv.x.s a5, v26
	; LMULMAX2-RV64-NEXT: srliw a1, a5, 1			; LMULMAX2-RV64-NEXT: srliw a1, a5, 1
	; LMULMAX2-RV64-NEXT: slli a5, a5, 32			; LMULMAX2-RV64-NEXT: slli a5, a5, 32
	; LMULMAX2-RV64-NEXT: srli a5, a5, 32			; LMULMAX2-RV64-NEXT: srli a5, a5, 32
	; LMULMAX2-RV64-NEXT: or a1, a5, a1			; LMULMAX2-RV64-NEXT: or a1, a5, a1
	Show All 15 Lines
	; LMULMAX2-RV64-NEXT: srli a1, a1, 2			; LMULMAX2-RV64-NEXT: srli a1, a1, 2
	; LMULMAX2-RV64-NEXT: and a1, a1, a2			; LMULMAX2-RV64-NEXT: and a1, a1, a2
	; LMULMAX2-RV64-NEXT: add a1, a5, a1			; LMULMAX2-RV64-NEXT: add a1, a5, a1
	; LMULMAX2-RV64-NEXT: srli a5, a1, 4			; LMULMAX2-RV64-NEXT: srli a5, a1, 4
	; LMULMAX2-RV64-NEXT: add a1, a1, a5			; LMULMAX2-RV64-NEXT: add a1, a1, a5
	; LMULMAX2-RV64-NEXT: and a1, a1, a3			; LMULMAX2-RV64-NEXT: and a1, a1, a3
	; LMULMAX2-RV64-NEXT: mul a1, a1, a4			; LMULMAX2-RV64-NEXT: mul a1, a1, a4
	; LMULMAX2-RV64-NEXT: srli a1, a1, 56			; LMULMAX2-RV64-NEXT: srli a1, a1, 56
	; LMULMAX2-RV64-NEXT: addi a1, a1, -32			; LMULMAX2-RV64-NEXT: addiw a1, a1, -32
	; LMULMAX2-RV64-NEXT: sw a1, 28(sp)			; LMULMAX2-RV64-NEXT: sw a1, 28(sp)
	; LMULMAX2-RV64-NEXT: vslidedown.vi v26, v25, 2			; LMULMAX2-RV64-NEXT: vslidedown.vi v26, v25, 2
	; LMULMAX2-RV64-NEXT: vmv.x.s a1, v26			; LMULMAX2-RV64-NEXT: vmv.x.s a1, v26
	; LMULMAX2-RV64-NEXT: srliw a5, a1, 1			; LMULMAX2-RV64-NEXT: srliw a5, a1, 1
	; LMULMAX2-RV64-NEXT: slli a1, a1, 32			; LMULMAX2-RV64-NEXT: slli a1, a1, 32
	; LMULMAX2-RV64-NEXT: srli a1, a1, 32			; LMULMAX2-RV64-NEXT: srli a1, a1, 32
	; LMULMAX2-RV64-NEXT: or a1, a1, a5			; LMULMAX2-RV64-NEXT: or a1, a1, a5
	; LMULMAX2-RV64-NEXT: srli a5, a1, 2			; LMULMAX2-RV64-NEXT: srli a5, a1, 2
	Show All 14 Lines
	; LMULMAX2-RV64-NEXT: srli a1, a1, 2			; LMULMAX2-RV64-NEXT: srli a1, a1, 2
	; LMULMAX2-RV64-NEXT: and a1, a1, a2			; LMULMAX2-RV64-NEXT: and a1, a1, a2
	; LMULMAX2-RV64-NEXT: add a1, a5, a1			; LMULMAX2-RV64-NEXT: add a1, a5, a1
	; LMULMAX2-RV64-NEXT: srli a5, a1, 4			; LMULMAX2-RV64-NEXT: srli a5, a1, 4
	; LMULMAX2-RV64-NEXT: add a1, a1, a5			; LMULMAX2-RV64-NEXT: add a1, a1, a5
	; LMULMAX2-RV64-NEXT: and a1, a1, a3			; LMULMAX2-RV64-NEXT: and a1, a1, a3
	; LMULMAX2-RV64-NEXT: mul a1, a1, a4			; LMULMAX2-RV64-NEXT: mul a1, a1, a4
	; LMULMAX2-RV64-NEXT: srli a1, a1, 56			; LMULMAX2-RV64-NEXT: srli a1, a1, 56
	; LMULMAX2-RV64-NEXT: addi a1, a1, -32			; LMULMAX2-RV64-NEXT: addiw a1, a1, -32
	; LMULMAX2-RV64-NEXT: sw a1, 24(sp)			; LMULMAX2-RV64-NEXT: sw a1, 24(sp)
	; LMULMAX2-RV64-NEXT: vslidedown.vi v25, v25, 1			; LMULMAX2-RV64-NEXT: vslidedown.vi v25, v25, 1
	; LMULMAX2-RV64-NEXT: vmv.x.s a1, v25			; LMULMAX2-RV64-NEXT: vmv.x.s a1, v25
	; LMULMAX2-RV64-NEXT: srliw a5, a1, 1			; LMULMAX2-RV64-NEXT: srliw a5, a1, 1
	; LMULMAX2-RV64-NEXT: slli a1, a1, 32			; LMULMAX2-RV64-NEXT: slli a1, a1, 32
	; LMULMAX2-RV64-NEXT: srli a1, a1, 32			; LMULMAX2-RV64-NEXT: srli a1, a1, 32
	; LMULMAX2-RV64-NEXT: or a1, a1, a5			; LMULMAX2-RV64-NEXT: or a1, a1, a5
	; LMULMAX2-RV64-NEXT: srli a5, a1, 2			; LMULMAX2-RV64-NEXT: srli a5, a1, 2
	Show All 14 Lines
	; LMULMAX2-RV64-NEXT: srli a1, a1, 2			; LMULMAX2-RV64-NEXT: srli a1, a1, 2
	; LMULMAX2-RV64-NEXT: and a1, a1, a2			; LMULMAX2-RV64-NEXT: and a1, a1, a2
	; LMULMAX2-RV64-NEXT: add a1, a5, a1			; LMULMAX2-RV64-NEXT: add a1, a5, a1
	; LMULMAX2-RV64-NEXT: srli a2, a1, 4			; LMULMAX2-RV64-NEXT: srli a2, a1, 4
	; LMULMAX2-RV64-NEXT: add a1, a1, a2			; LMULMAX2-RV64-NEXT: add a1, a1, a2
	; LMULMAX2-RV64-NEXT: and a1, a1, a3			; LMULMAX2-RV64-NEXT: and a1, a1, a3
	; LMULMAX2-RV64-NEXT: mul a1, a1, a4			; LMULMAX2-RV64-NEXT: mul a1, a1, a4
	; LMULMAX2-RV64-NEXT: srli a1, a1, 56			; LMULMAX2-RV64-NEXT: srli a1, a1, 56
	; LMULMAX2-RV64-NEXT: addi a1, a1, -32			; LMULMAX2-RV64-NEXT: addiw a1, a1, -32
	; LMULMAX2-RV64-NEXT: sw a1, 20(sp)			; LMULMAX2-RV64-NEXT: sw a1, 20(sp)
	; LMULMAX2-RV64-NEXT: vsetivli zero, 4, e32, m1, ta, mu			; LMULMAX2-RV64-NEXT: vsetivli zero, 4, e32, m1, ta, mu
	; LMULMAX2-RV64-NEXT: addi a1, sp, 16			; LMULMAX2-RV64-NEXT: addi a1, sp, 16
	; LMULMAX2-RV64-NEXT: vle32.v v25, (a1)			; LMULMAX2-RV64-NEXT: vle32.v v25, (a1)
	; LMULMAX2-RV64-NEXT: vse32.v v25, (a0)			; LMULMAX2-RV64-NEXT: vse32.v v25, (a0)
	; LMULMAX2-RV64-NEXT: addi sp, sp, 32			; LMULMAX2-RV64-NEXT: addi sp, sp, 32
	; LMULMAX2-RV64-NEXT: ret			; LMULMAX2-RV64-NEXT: ret
	;			;
	▲ Show 20 Lines • Show All 181 Lines • ▼ Show 20 Lines
	; LMULMAX1-RV64-NEXT: lui a4, 4112			; LMULMAX1-RV64-NEXT: lui a4, 4112
	; LMULMAX1-RV64-NEXT: addiw a4, a4, 257			; LMULMAX1-RV64-NEXT: addiw a4, a4, 257
	; LMULMAX1-RV64-NEXT: slli a4, a4, 16			; LMULMAX1-RV64-NEXT: slli a4, a4, 16
	; LMULMAX1-RV64-NEXT: addi a4, a4, 257			; LMULMAX1-RV64-NEXT: addi a4, a4, 257
	; LMULMAX1-RV64-NEXT: slli a4, a4, 16			; LMULMAX1-RV64-NEXT: slli a4, a4, 16
	; LMULMAX1-RV64-NEXT: addi a4, a4, 257			; LMULMAX1-RV64-NEXT: addi a4, a4, 257
	; LMULMAX1-RV64-NEXT: mul a5, a5, a4			; LMULMAX1-RV64-NEXT: mul a5, a5, a4
	; LMULMAX1-RV64-NEXT: srli a5, a5, 56			; LMULMAX1-RV64-NEXT: srli a5, a5, 56
	; LMULMAX1-RV64-NEXT: addi a5, a5, -32			; LMULMAX1-RV64-NEXT: addiw a5, a5, -32
	; LMULMAX1-RV64-NEXT: sw a5, 16(sp)			; LMULMAX1-RV64-NEXT: sw a5, 16(sp)
	; LMULMAX1-RV64-NEXT: vsetivli zero, 1, e32, m1, ta, mu			; LMULMAX1-RV64-NEXT: vsetivli zero, 1, e32, m1, ta, mu
	; LMULMAX1-RV64-NEXT: vslidedown.vi v26, v25, 3			; LMULMAX1-RV64-NEXT: vslidedown.vi v26, v25, 3
	; LMULMAX1-RV64-NEXT: vmv.x.s a5, v26			; LMULMAX1-RV64-NEXT: vmv.x.s a5, v26
	; LMULMAX1-RV64-NEXT: srliw a1, a5, 1			; LMULMAX1-RV64-NEXT: srliw a1, a5, 1
	; LMULMAX1-RV64-NEXT: slli a5, a5, 32			; LMULMAX1-RV64-NEXT: slli a5, a5, 32
	; LMULMAX1-RV64-NEXT: srli a5, a5, 32			; LMULMAX1-RV64-NEXT: srli a5, a5, 32
	; LMULMAX1-RV64-NEXT: or a1, a5, a1			; LMULMAX1-RV64-NEXT: or a1, a5, a1
	Show All 15 Lines
	; LMULMAX1-RV64-NEXT: srli a1, a1, 2			; LMULMAX1-RV64-NEXT: srli a1, a1, 2
	; LMULMAX1-RV64-NEXT: and a1, a1, a2			; LMULMAX1-RV64-NEXT: and a1, a1, a2
	; LMULMAX1-RV64-NEXT: add a1, a5, a1			; LMULMAX1-RV64-NEXT: add a1, a5, a1
	; LMULMAX1-RV64-NEXT: srli a5, a1, 4			; LMULMAX1-RV64-NEXT: srli a5, a1, 4
	; LMULMAX1-RV64-NEXT: add a1, a1, a5			; LMULMAX1-RV64-NEXT: add a1, a1, a5
	; LMULMAX1-RV64-NEXT: and a1, a1, a3			; LMULMAX1-RV64-NEXT: and a1, a1, a3
	; LMULMAX1-RV64-NEXT: mul a1, a1, a4			; LMULMAX1-RV64-NEXT: mul a1, a1, a4
	; LMULMAX1-RV64-NEXT: srli a1, a1, 56			; LMULMAX1-RV64-NEXT: srli a1, a1, 56
	; LMULMAX1-RV64-NEXT: addi a1, a1, -32			; LMULMAX1-RV64-NEXT: addiw a1, a1, -32
	; LMULMAX1-RV64-NEXT: sw a1, 28(sp)			; LMULMAX1-RV64-NEXT: sw a1, 28(sp)
	; LMULMAX1-RV64-NEXT: vslidedown.vi v26, v25, 2			; LMULMAX1-RV64-NEXT: vslidedown.vi v26, v25, 2
	; LMULMAX1-RV64-NEXT: vmv.x.s a1, v26			; LMULMAX1-RV64-NEXT: vmv.x.s a1, v26
	; LMULMAX1-RV64-NEXT: srliw a5, a1, 1			; LMULMAX1-RV64-NEXT: srliw a5, a1, 1
	; LMULMAX1-RV64-NEXT: slli a1, a1, 32			; LMULMAX1-RV64-NEXT: slli a1, a1, 32
	; LMULMAX1-RV64-NEXT: srli a1, a1, 32			; LMULMAX1-RV64-NEXT: srli a1, a1, 32
	; LMULMAX1-RV64-NEXT: or a1, a1, a5			; LMULMAX1-RV64-NEXT: or a1, a1, a5
	; LMULMAX1-RV64-NEXT: srli a5, a1, 2			; LMULMAX1-RV64-NEXT: srli a5, a1, 2
	Show All 14 Lines
	; LMULMAX1-RV64-NEXT: srli a1, a1, 2			; LMULMAX1-RV64-NEXT: srli a1, a1, 2
	; LMULMAX1-RV64-NEXT: and a1, a1, a2			; LMULMAX1-RV64-NEXT: and a1, a1, a2
	; LMULMAX1-RV64-NEXT: add a1, a5, a1			; LMULMAX1-RV64-NEXT: add a1, a5, a1
	; LMULMAX1-RV64-NEXT: srli a5, a1, 4			; LMULMAX1-RV64-NEXT: srli a5, a1, 4
	; LMULMAX1-RV64-NEXT: add a1, a1, a5			; LMULMAX1-RV64-NEXT: add a1, a1, a5
	; LMULMAX1-RV64-NEXT: and a1, a1, a3			; LMULMAX1-RV64-NEXT: and a1, a1, a3
	; LMULMAX1-RV64-NEXT: mul a1, a1, a4			; LMULMAX1-RV64-NEXT: mul a1, a1, a4
	; LMULMAX1-RV64-NEXT: srli a1, a1, 56			; LMULMAX1-RV64-NEXT: srli a1, a1, 56
	; LMULMAX1-RV64-NEXT: addi a1, a1, -32			; LMULMAX1-RV64-NEXT: addiw a1, a1, -32
	; LMULMAX1-RV64-NEXT: sw a1, 24(sp)			; LMULMAX1-RV64-NEXT: sw a1, 24(sp)
	; LMULMAX1-RV64-NEXT: vslidedown.vi v25, v25, 1			; LMULMAX1-RV64-NEXT: vslidedown.vi v25, v25, 1
	; LMULMAX1-RV64-NEXT: vmv.x.s a1, v25			; LMULMAX1-RV64-NEXT: vmv.x.s a1, v25
	; LMULMAX1-RV64-NEXT: srliw a5, a1, 1			; LMULMAX1-RV64-NEXT: srliw a5, a1, 1
	; LMULMAX1-RV64-NEXT: slli a1, a1, 32			; LMULMAX1-RV64-NEXT: slli a1, a1, 32
	; LMULMAX1-RV64-NEXT: srli a1, a1, 32			; LMULMAX1-RV64-NEXT: srli a1, a1, 32
	; LMULMAX1-RV64-NEXT: or a1, a1, a5			; LMULMAX1-RV64-NEXT: or a1, a1, a5
	; LMULMAX1-RV64-NEXT: srli a5, a1, 2			; LMULMAX1-RV64-NEXT: srli a5, a1, 2
	Show All 14 Lines
	; LMULMAX1-RV64-NEXT: srli a1, a1, 2			; LMULMAX1-RV64-NEXT: srli a1, a1, 2
	; LMULMAX1-RV64-NEXT: and a1, a1, a2			; LMULMAX1-RV64-NEXT: and a1, a1, a2
	; LMULMAX1-RV64-NEXT: add a1, a5, a1			; LMULMAX1-RV64-NEXT: add a1, a5, a1
	; LMULMAX1-RV64-NEXT: srli a2, a1, 4			; LMULMAX1-RV64-NEXT: srli a2, a1, 4
	; LMULMAX1-RV64-NEXT: add a1, a1, a2			; LMULMAX1-RV64-NEXT: add a1, a1, a2
	; LMULMAX1-RV64-NEXT: and a1, a1, a3			; LMULMAX1-RV64-NEXT: and a1, a1, a3
	; LMULMAX1-RV64-NEXT: mul a1, a1, a4			; LMULMAX1-RV64-NEXT: mul a1, a1, a4
	; LMULMAX1-RV64-NEXT: srli a1, a1, 56			; LMULMAX1-RV64-NEXT: srli a1, a1, 56
	; LMULMAX1-RV64-NEXT: addi a1, a1, -32			; LMULMAX1-RV64-NEXT: addiw a1, a1, -32
	; LMULMAX1-RV64-NEXT: sw a1, 20(sp)			; LMULMAX1-RV64-NEXT: sw a1, 20(sp)
	; LMULMAX1-RV64-NEXT: vsetivli zero, 4, e32, m1, ta, mu			; LMULMAX1-RV64-NEXT: vsetivli zero, 4, e32, m1, ta, mu
	; LMULMAX1-RV64-NEXT: addi a1, sp, 16			; LMULMAX1-RV64-NEXT: addi a1, sp, 16
	; LMULMAX1-RV64-NEXT: vle32.v v25, (a1)			; LMULMAX1-RV64-NEXT: vle32.v v25, (a1)
	; LMULMAX1-RV64-NEXT: vse32.v v25, (a0)			; LMULMAX1-RV64-NEXT: vse32.v v25, (a0)
	; LMULMAX1-RV64-NEXT: addi sp, sp, 32			; LMULMAX1-RV64-NEXT: addi sp, sp, 32
	; LMULMAX1-RV64-NEXT: ret			; LMULMAX1-RV64-NEXT: ret
	%a = load <4 x i32>, <4 x i32>* %x			%a = load <4 x i32>, <4 x i32>* %x
	▲ Show 20 Lines • Show All 1,477 Lines • ▼ Show 20 Lines
	; LMULMAX2-RV64-NEXT: lui a5, 4112			; LMULMAX2-RV64-NEXT: lui a5, 4112
	; LMULMAX2-RV64-NEXT: addiw a5, a5, 257			; LMULMAX2-RV64-NEXT: addiw a5, a5, 257
	; LMULMAX2-RV64-NEXT: slli a5, a5, 16			; LMULMAX2-RV64-NEXT: slli a5, a5, 16
	; LMULMAX2-RV64-NEXT: addi a5, a5, 257			; LMULMAX2-RV64-NEXT: addi a5, a5, 257
	; LMULMAX2-RV64-NEXT: slli a5, a5, 16			; LMULMAX2-RV64-NEXT: slli a5, a5, 16
	; LMULMAX2-RV64-NEXT: addi a5, a5, 257			; LMULMAX2-RV64-NEXT: addi a5, a5, 257
	; LMULMAX2-RV64-NEXT: mul a1, a1, a5			; LMULMAX2-RV64-NEXT: mul a1, a1, a5
	; LMULMAX2-RV64-NEXT: srli a1, a1, 56			; LMULMAX2-RV64-NEXT: srli a1, a1, 56
	; LMULMAX2-RV64-NEXT: addi a1, a1, -56			; LMULMAX2-RV64-NEXT: addiw a1, a1, -56
	; LMULMAX2-RV64-NEXT: sb a1, 32(sp)			; LMULMAX2-RV64-NEXT: sb a1, 32(sp)
	; LMULMAX2-RV64-NEXT: vsetivli zero, 1, e8, m2, ta, mu			; LMULMAX2-RV64-NEXT: vsetivli zero, 1, e8, m2, ta, mu
	; LMULMAX2-RV64-NEXT: vslidedown.vi v28, v26, 31			; LMULMAX2-RV64-NEXT: vslidedown.vi v28, v26, 31
	; LMULMAX2-RV64-NEXT: vmv.x.s a1, v28			; LMULMAX2-RV64-NEXT: vmv.x.s a1, v28
	; LMULMAX2-RV64-NEXT: andi a1, a1, 255			; LMULMAX2-RV64-NEXT: andi a1, a1, 255
	; LMULMAX2-RV64-NEXT: srli a2, a1, 1			; LMULMAX2-RV64-NEXT: srli a2, a1, 1
	; LMULMAX2-RV64-NEXT: or a1, a1, a2			; LMULMAX2-RV64-NEXT: or a1, a1, a2
	; LMULMAX2-RV64-NEXT: srli a2, a1, 2			; LMULMAX2-RV64-NEXT: srli a2, a1, 2
	Show All 14 Lines
	; LMULMAX2-RV64-NEXT: srli a1, a1, 2			; LMULMAX2-RV64-NEXT: srli a1, a1, 2
	; LMULMAX2-RV64-NEXT: and a1, a1, a3			; LMULMAX2-RV64-NEXT: and a1, a1, a3
	; LMULMAX2-RV64-NEXT: add a1, a2, a1			; LMULMAX2-RV64-NEXT: add a1, a2, a1
	; LMULMAX2-RV64-NEXT: srli a2, a1, 4			; LMULMAX2-RV64-NEXT: srli a2, a1, 4
	; LMULMAX2-RV64-NEXT: add a1, a1, a2			; LMULMAX2-RV64-NEXT: add a1, a1, a2
	; LMULMAX2-RV64-NEXT: and a1, a1, a4			; LMULMAX2-RV64-NEXT: and a1, a1, a4
	; LMULMAX2-RV64-NEXT: mul a1, a1, a5			; LMULMAX2-RV64-NEXT: mul a1, a1, a5
	; LMULMAX2-RV64-NEXT: srli a1, a1, 56			; LMULMAX2-RV64-NEXT: srli a1, a1, 56
	; LMULMAX2-RV64-NEXT: addi a1, a1, -56			; LMULMAX2-RV64-NEXT: addiw a1, a1, -56
	; LMULMAX2-RV64-NEXT: sb a1, 63(sp)			; LMULMAX2-RV64-NEXT: sb a1, 63(sp)
	; LMULMAX2-RV64-NEXT: vslidedown.vi v28, v26, 30			; LMULMAX2-RV64-NEXT: vslidedown.vi v28, v26, 30
	; LMULMAX2-RV64-NEXT: vmv.x.s a1, v28			; LMULMAX2-RV64-NEXT: vmv.x.s a1, v28
	; LMULMAX2-RV64-NEXT: andi a1, a1, 255			; LMULMAX2-RV64-NEXT: andi a1, a1, 255
	; LMULMAX2-RV64-NEXT: srli a2, a1, 1			; LMULMAX2-RV64-NEXT: srli a2, a1, 1
	; LMULMAX2-RV64-NEXT: or a1, a1, a2			; LMULMAX2-RV64-NEXT: or a1, a1, a2
	; LMULMAX2-RV64-NEXT: srli a2, a1, 2			; LMULMAX2-RV64-NEXT: srli a2, a1, 2
	; LMULMAX2-RV64-NEXT: or a1, a1, a2			; LMULMAX2-RV64-NEXT: or a1, a1, a2
	Show All 13 Lines
	; LMULMAX2-RV64-NEXT: srli a1, a1, 2			; LMULMAX2-RV64-NEXT: srli a1, a1, 2
	; LMULMAX2-RV64-NEXT: and a1, a1, a3			; LMULMAX2-RV64-NEXT: and a1, a1, a3
	; LMULMAX2-RV64-NEXT: add a1, a2, a1			; LMULMAX2-RV64-NEXT: add a1, a2, a1
	; LMULMAX2-RV64-NEXT: srli a2, a1, 4			; LMULMAX2-RV64-NEXT: srli a2, a1, 4
	; LMULMAX2-RV64-NEXT: add a1, a1, a2			; LMULMAX2-RV64-NEXT: add a1, a1, a2
	; LMULMAX2-RV64-NEXT: and a1, a1, a4			; LMULMAX2-RV64-NEXT: and a1, a1, a4
	; LMULMAX2-RV64-NEXT: mul a1, a1, a5			; LMULMAX2-RV64-NEXT: mul a1, a1, a5
	; LMULMAX2-RV64-NEXT: srli a1, a1, 56			; LMULMAX2-RV64-NEXT: srli a1, a1, 56
	; LMULMAX2-RV64-NEXT: addi a1, a1, -56			; LMULMAX2-RV64-NEXT: addiw a1, a1, -56
	; LMULMAX2-RV64-NEXT: sb a1, 62(sp)			; LMULMAX2-RV64-NEXT: sb a1, 62(sp)
	; LMULMAX2-RV64-NEXT: vslidedown.vi v28, v26, 29			; LMULMAX2-RV64-NEXT: vslidedown.vi v28, v26, 29
	; LMULMAX2-RV64-NEXT: vmv.x.s a1, v28			; LMULMAX2-RV64-NEXT: vmv.x.s a1, v28
	; LMULMAX2-RV64-NEXT: andi a1, a1, 255			; LMULMAX2-RV64-NEXT: andi a1, a1, 255
	; LMULMAX2-RV64-NEXT: srli a2, a1, 1			; LMULMAX2-RV64-NEXT: srli a2, a1, 1
	; LMULMAX2-RV64-NEXT: or a1, a1, a2			; LMULMAX2-RV64-NEXT: or a1, a1, a2
	; LMULMAX2-RV64-NEXT: srli a2, a1, 2			; LMULMAX2-RV64-NEXT: srli a2, a1, 2
	; LMULMAX2-RV64-NEXT: or a1, a1, a2			; LMULMAX2-RV64-NEXT: or a1, a1, a2
	Show All 13 Lines
	; LMULMAX2-RV64-NEXT: srli a1, a1, 2			; LMULMAX2-RV64-NEXT: srli a1, a1, 2
	; LMULMAX2-RV64-NEXT: and a1, a1, a3			; LMULMAX2-RV64-NEXT: and a1, a1, a3
	; LMULMAX2-RV64-NEXT: add a1, a2, a1			; LMULMAX2-RV64-NEXT: add a1, a2, a1
	; LMULMAX2-RV64-NEXT: srli a2, a1, 4			; LMULMAX2-RV64-NEXT: srli a2, a1, 4
	; LMULMAX2-RV64-NEXT: add a1, a1, a2			; LMULMAX2-RV64-NEXT: add a1, a1, a2
	; LMULMAX2-RV64-NEXT: and a1, a1, a4			; LMULMAX2-RV64-NEXT: and a1, a1, a4
	; LMULMAX2-RV64-NEXT: mul a1, a1, a5			; LMULMAX2-RV64-NEXT: mul a1, a1, a5
	; LMULMAX2-RV64-NEXT: srli a1, a1, 56			; LMULMAX2-RV64-NEXT: srli a1, a1, 56
	; LMULMAX2-RV64-NEXT: addi a1, a1, -56			; LMULMAX2-RV64-NEXT: addiw a1, a1, -56
	; LMULMAX2-RV64-NEXT: sb a1, 61(sp)			; LMULMAX2-RV64-NEXT: sb a1, 61(sp)
	; LMULMAX2-RV64-NEXT: vslidedown.vi v28, v26, 28			; LMULMAX2-RV64-NEXT: vslidedown.vi v28, v26, 28
	; LMULMAX2-RV64-NEXT: vmv.x.s a1, v28			; LMULMAX2-RV64-NEXT: vmv.x.s a1, v28
	; LMULMAX2-RV64-NEXT: andi a1, a1, 255			; LMULMAX2-RV64-NEXT: andi a1, a1, 255
	; LMULMAX2-RV64-NEXT: srli a2, a1, 1			; LMULMAX2-RV64-NEXT: srli a2, a1, 1
	; LMULMAX2-RV64-NEXT: or a1, a1, a2			; LMULMAX2-RV64-NEXT: or a1, a1, a2
	; LMULMAX2-RV64-NEXT: srli a2, a1, 2			; LMULMAX2-RV64-NEXT: srli a2, a1, 2
	; LMULMAX2-RV64-NEXT: or a1, a1, a2			; LMULMAX2-RV64-NEXT: or a1, a1, a2
	Show All 13 Lines
	; LMULMAX2-RV64-NEXT: srli a1, a1, 2			; LMULMAX2-RV64-NEXT: srli a1, a1, 2
	; LMULMAX2-RV64-NEXT: and a1, a1, a3			; LMULMAX2-RV64-NEXT: and a1, a1, a3
	; LMULMAX2-RV64-NEXT: add a1, a2, a1			; LMULMAX2-RV64-NEXT: add a1, a2, a1
	; LMULMAX2-RV64-NEXT: srli a2, a1, 4			; LMULMAX2-RV64-NEXT: srli a2, a1, 4
	; LMULMAX2-RV64-NEXT: add a1, a1, a2			; LMULMAX2-RV64-NEXT: add a1, a1, a2
	; LMULMAX2-RV64-NEXT: and a1, a1, a4			; LMULMAX2-RV64-NEXT: and a1, a1, a4
	; LMULMAX2-RV64-NEXT: mul a1, a1, a5			; LMULMAX2-RV64-NEXT: mul a1, a1, a5
	; LMULMAX2-RV64-NEXT: srli a1, a1, 56			; LMULMAX2-RV64-NEXT: srli a1, a1, 56
	; LMULMAX2-RV64-NEXT: addi a1, a1, -56			; LMULMAX2-RV64-NEXT: addiw a1, a1, -56
	; LMULMAX2-RV64-NEXT: sb a1, 60(sp)			; LMULMAX2-RV64-NEXT: sb a1, 60(sp)
	; LMULMAX2-RV64-NEXT: vslidedown.vi v28, v26, 27			; LMULMAX2-RV64-NEXT: vslidedown.vi v28, v26, 27
	; LMULMAX2-RV64-NEXT: vmv.x.s a1, v28			; LMULMAX2-RV64-NEXT: vmv.x.s a1, v28
	; LMULMAX2-RV64-NEXT: andi a1, a1, 255			; LMULMAX2-RV64-NEXT: andi a1, a1, 255
	; LMULMAX2-RV64-NEXT: srli a2, a1, 1			; LMULMAX2-RV64-NEXT: srli a2, a1, 1
	; LMULMAX2-RV64-NEXT: or a1, a1, a2			; LMULMAX2-RV64-NEXT: or a1, a1, a2
	; LMULMAX2-RV64-NEXT: srli a2, a1, 2			; LMULMAX2-RV64-NEXT: srli a2, a1, 2
	; LMULMAX2-RV64-NEXT: or a1, a1, a2			; LMULMAX2-RV64-NEXT: or a1, a1, a2
	Show All 13 Lines
	; LMULMAX2-RV64-NEXT: srli a1, a1, 2			; LMULMAX2-RV64-NEXT: srli a1, a1, 2
	; LMULMAX2-RV64-NEXT: and a1, a1, a3			; LMULMAX2-RV64-NEXT: and a1, a1, a3
	; LMULMAX2-RV64-NEXT: add a1, a2, a1			; LMULMAX2-RV64-NEXT: add a1, a2, a1
	; LMULMAX2-RV64-NEXT: srli a2, a1, 4			; LMULMAX2-RV64-NEXT: srli a2, a1, 4
	; LMULMAX2-RV64-NEXT: add a1, a1, a2			; LMULMAX2-RV64-NEXT: add a1, a1, a2
	; LMULMAX2-RV64-NEXT: and a1, a1, a4			; LMULMAX2-RV64-NEXT: and a1, a1, a4
	; LMULMAX2-RV64-NEXT: mul a1, a1, a5			; LMULMAX2-RV64-NEXT: mul a1, a1, a5
	; LMULMAX2-RV64-NEXT: srli a1, a1, 56			; LMULMAX2-RV64-NEXT: srli a1, a1, 56
	; LMULMAX2-RV64-NEXT: addi a1, a1, -56			; LMULMAX2-RV64-NEXT: addiw a1, a1, -56
	; LMULMAX2-RV64-NEXT: sb a1, 59(sp)			; LMULMAX2-RV64-NEXT: sb a1, 59(sp)
	; LMULMAX2-RV64-NEXT: vslidedown.vi v28, v26, 26			; LMULMAX2-RV64-NEXT: vslidedown.vi v28, v26, 26
	; LMULMAX2-RV64-NEXT: vmv.x.s a1, v28			; LMULMAX2-RV64-NEXT: vmv.x.s a1, v28
	; LMULMAX2-RV64-NEXT: andi a1, a1, 255			; LMULMAX2-RV64-NEXT: andi a1, a1, 255
	; LMULMAX2-RV64-NEXT: srli a2, a1, 1			; LMULMAX2-RV64-NEXT: srli a2, a1, 1
	; LMULMAX2-RV64-NEXT: or a1, a1, a2			; LMULMAX2-RV64-NEXT: or a1, a1, a2
	; LMULMAX2-RV64-NEXT: srli a2, a1, 2			; LMULMAX2-RV64-NEXT: srli a2, a1, 2
	; LMULMAX2-RV64-NEXT: or a1, a1, a2			; LMULMAX2-RV64-NEXT: or a1, a1, a2
	Show All 13 Lines
	; LMULMAX2-RV64-NEXT: srli a1, a1, 2			; LMULMAX2-RV64-NEXT: srli a1, a1, 2
	; LMULMAX2-RV64-NEXT: and a1, a1, a3			; LMULMAX2-RV64-NEXT: and a1, a1, a3
	; LMULMAX2-RV64-NEXT: add a1, a2, a1			; LMULMAX2-RV64-NEXT: add a1, a2, a1
	; LMULMAX2-RV64-NEXT: srli a2, a1, 4			; LMULMAX2-RV64-NEXT: srli a2, a1, 4
	; LMULMAX2-RV64-NEXT: add a1, a1, a2			; LMULMAX2-RV64-NEXT: add a1, a1, a2
	; LMULMAX2-RV64-NEXT: and a1, a1, a4			; LMULMAX2-RV64-NEXT: and a1, a1, a4
	; LMULMAX2-RV64-NEXT: mul a1, a1, a5			; LMULMAX2-RV64-NEXT: mul a1, a1, a5
	; LMULMAX2-RV64-NEXT: srli a1, a1, 56			; LMULMAX2-RV64-NEXT: srli a1, a1, 56
	; LMULMAX2-RV64-NEXT: addi a1, a1, -56			; LMULMAX2-RV64-NEXT: addiw a1, a1, -56
	; LMULMAX2-RV64-NEXT: sb a1, 58(sp)			; LMULMAX2-RV64-NEXT: sb a1, 58(sp)
	; LMULMAX2-RV64-NEXT: vslidedown.vi v28, v26, 25			; LMULMAX2-RV64-NEXT: vslidedown.vi v28, v26, 25
	; LMULMAX2-RV64-NEXT: vmv.x.s a1, v28			; LMULMAX2-RV64-NEXT: vmv.x.s a1, v28
	; LMULMAX2-RV64-NEXT: andi a1, a1, 255			; LMULMAX2-RV64-NEXT: andi a1, a1, 255
	; LMULMAX2-RV64-NEXT: srli a2, a1, 1			; LMULMAX2-RV64-NEXT: srli a2, a1, 1
	; LMULMAX2-RV64-NEXT: or a1, a1, a2			; LMULMAX2-RV64-NEXT: or a1, a1, a2
	; LMULMAX2-RV64-NEXT: srli a2, a1, 2			; LMULMAX2-RV64-NEXT: srli a2, a1, 2
	; LMULMAX2-RV64-NEXT: or a1, a1, a2			; LMULMAX2-RV64-NEXT: or a1, a1, a2
	Show All 13 Lines
	; LMULMAX2-RV64-NEXT: srli a1, a1, 2			; LMULMAX2-RV64-NEXT: srli a1, a1, 2
	; LMULMAX2-RV64-NEXT: and a1, a1, a3			; LMULMAX2-RV64-NEXT: and a1, a1, a3
	; LMULMAX2-RV64-NEXT: add a1, a2, a1			; LMULMAX2-RV64-NEXT: add a1, a2, a1
	; LMULMAX2-RV64-NEXT: srli a2, a1, 4			; LMULMAX2-RV64-NEXT: srli a2, a1, 4
	; LMULMAX2-RV64-NEXT: add a1, a1, a2			; LMULMAX2-RV64-NEXT: add a1, a1, a2
	; LMULMAX2-RV64-NEXT: and a1, a1, a4			; LMULMAX2-RV64-NEXT: and a1, a1, a4
	; LMULMAX2-RV64-NEXT: mul a1, a1, a5			; LMULMAX2-RV64-NEXT: mul a1, a1, a5
	; LMULMAX2-RV64-NEXT: srli a1, a1, 56			; LMULMAX2-RV64-NEXT: srli a1, a1, 56
	; LMULMAX2-RV64-NEXT: addi a1, a1, -56			; LMULMAX2-RV64-NEXT: addiw a1, a1, -56
	; LMULMAX2-RV64-NEXT: sb a1, 57(sp)			; LMULMAX2-RV64-NEXT: sb a1, 57(sp)
	; LMULMAX2-RV64-NEXT: vslidedown.vi v28, v26, 24			; LMULMAX2-RV64-NEXT: vslidedown.vi v28, v26, 24
	; LMULMAX2-RV64-NEXT: vmv.x.s a1, v28			; LMULMAX2-RV64-NEXT: vmv.x.s a1, v28
	; LMULMAX2-RV64-NEXT: andi a1, a1, 255			; LMULMAX2-RV64-NEXT: andi a1, a1, 255
	; LMULMAX2-RV64-NEXT: srli a2, a1, 1			; LMULMAX2-RV64-NEXT: srli a2, a1, 1
	; LMULMAX2-RV64-NEXT: or a1, a1, a2			; LMULMAX2-RV64-NEXT: or a1, a1, a2
	; LMULMAX2-RV64-NEXT: srli a2, a1, 2			; LMULMAX2-RV64-NEXT: srli a2, a1, 2
	; LMULMAX2-RV64-NEXT: or a1, a1, a2			; LMULMAX2-RV64-NEXT: or a1, a1, a2
	Show All 13 Lines
	; LMULMAX2-RV64-NEXT: srli a1, a1, 2			; LMULMAX2-RV64-NEXT: srli a1, a1, 2
	; LMULMAX2-RV64-NEXT: and a1, a1, a3			; LMULMAX2-RV64-NEXT: and a1, a1, a3
	; LMULMAX2-RV64-NEXT: add a1, a2, a1			; LMULMAX2-RV64-NEXT: add a1, a2, a1
	; LMULMAX2-RV64-NEXT: srli a2, a1, 4			; LMULMAX2-RV64-NEXT: srli a2, a1, 4
	; LMULMAX2-RV64-NEXT: add a1, a1, a2			; LMULMAX2-RV64-NEXT: add a1, a1, a2
	; LMULMAX2-RV64-NEXT: and a1, a1, a4			; LMULMAX2-RV64-NEXT: and a1, a1, a4
	; LMULMAX2-RV64-NEXT: mul a1, a1, a5			; LMULMAX2-RV64-NEXT: mul a1, a1, a5
	; LMULMAX2-RV64-NEXT: srli a1, a1, 56			; LMULMAX2-RV64-NEXT: srli a1, a1, 56
	; LMULMAX2-RV64-NEXT: addi a1, a1, -56			; LMULMAX2-RV64-NEXT: addiw a1, a1, -56
	; LMULMAX2-RV64-NEXT: sb a1, 56(sp)			; LMULMAX2-RV64-NEXT: sb a1, 56(sp)
	; LMULMAX2-RV64-NEXT: vslidedown.vi v28, v26, 23			; LMULMAX2-RV64-NEXT: vslidedown.vi v28, v26, 23
	; LMULMAX2-RV64-NEXT: vmv.x.s a1, v28			; LMULMAX2-RV64-NEXT: vmv.x.s a1, v28
	; LMULMAX2-RV64-NEXT: andi a1, a1, 255			; LMULMAX2-RV64-NEXT: andi a1, a1, 255
	; LMULMAX2-RV64-NEXT: srli a2, a1, 1			; LMULMAX2-RV64-NEXT: srli a2, a1, 1
	; LMULMAX2-RV64-NEXT: or a1, a1, a2			; LMULMAX2-RV64-NEXT: or a1, a1, a2
	; LMULMAX2-RV64-NEXT: srli a2, a1, 2			; LMULMAX2-RV64-NEXT: srli a2, a1, 2
	; LMULMAX2-RV64-NEXT: or a1, a1, a2			; LMULMAX2-RV64-NEXT: or a1, a1, a2
	Show All 13 Lines
	; LMULMAX2-RV64-NEXT: srli a1, a1, 2			; LMULMAX2-RV64-NEXT: srli a1, a1, 2
	; LMULMAX2-RV64-NEXT: and a1, a1, a3			; LMULMAX2-RV64-NEXT: and a1, a1, a3
	; LMULMAX2-RV64-NEXT: add a1, a2, a1			; LMULMAX2-RV64-NEXT: add a1, a2, a1
	; LMULMAX2-RV64-NEXT: srli a2, a1, 4			; LMULMAX2-RV64-NEXT: srli a2, a1, 4
	; LMULMAX2-RV64-NEXT: add a1, a1, a2			; LMULMAX2-RV64-NEXT: add a1, a1, a2
	; LMULMAX2-RV64-NEXT: and a1, a1, a4			; LMULMAX2-RV64-NEXT: and a1, a1, a4
	; LMULMAX2-RV64-NEXT: mul a1, a1, a5			; LMULMAX2-RV64-NEXT: mul a1, a1, a5
	; LMULMAX2-RV64-NEXT: srli a1, a1, 56			; LMULMAX2-RV64-NEXT: srli a1, a1, 56
	; LMULMAX2-RV64-NEXT: addi a1, a1, -56			; LMULMAX2-RV64-NEXT: addiw a1, a1, -56
	; LMULMAX2-RV64-NEXT: sb a1, 55(sp)			; LMULMAX2-RV64-NEXT: sb a1, 55(sp)
	; LMULMAX2-RV64-NEXT: vslidedown.vi v28, v26, 22			; LMULMAX2-RV64-NEXT: vslidedown.vi v28, v26, 22
	; LMULMAX2-RV64-NEXT: vmv.x.s a1, v28			; LMULMAX2-RV64-NEXT: vmv.x.s a1, v28
	; LMULMAX2-RV64-NEXT: andi a1, a1, 255			; LMULMAX2-RV64-NEXT: andi a1, a1, 255
	; LMULMAX2-RV64-NEXT: srli a2, a1, 1			; LMULMAX2-RV64-NEXT: srli a2, a1, 1
	; LMULMAX2-RV64-NEXT: or a1, a1, a2			; LMULMAX2-RV64-NEXT: or a1, a1, a2
	; LMULMAX2-RV64-NEXT: srli a2, a1, 2			; LMULMAX2-RV64-NEXT: srli a2, a1, 2
	; LMULMAX2-RV64-NEXT: or a1, a1, a2			; LMULMAX2-RV64-NEXT: or a1, a1, a2
	Show All 13 Lines
	; LMULMAX2-RV64-NEXT: srli a1, a1, 2			; LMULMAX2-RV64-NEXT: srli a1, a1, 2
	; LMULMAX2-RV64-NEXT: and a1, a1, a3			; LMULMAX2-RV64-NEXT: and a1, a1, a3
	; LMULMAX2-RV64-NEXT: add a1, a2, a1			; LMULMAX2-RV64-NEXT: add a1, a2, a1
	; LMULMAX2-RV64-NEXT: srli a2, a1, 4			; LMULMAX2-RV64-NEXT: srli a2, a1, 4
	; LMULMAX2-RV64-NEXT: add a1, a1, a2			; LMULMAX2-RV64-NEXT: add a1, a1, a2
	; LMULMAX2-RV64-NEXT: and a1, a1, a4			; LMULMAX2-RV64-NEXT: and a1, a1, a4
	; LMULMAX2-RV64-NEXT: mul a1, a1, a5			; LMULMAX2-RV64-NEXT: mul a1, a1, a5
	; LMULMAX2-RV64-NEXT: srli a1, a1, 56			; LMULMAX2-RV64-NEXT: srli a1, a1, 56
	; LMULMAX2-RV64-NEXT: addi a1, a1, -56			; LMULMAX2-RV64-NEXT: addiw a1, a1, -56
	; LMULMAX2-RV64-NEXT: sb a1, 54(sp)			; LMULMAX2-RV64-NEXT: sb a1, 54(sp)
	; LMULMAX2-RV64-NEXT: vslidedown.vi v28, v26, 21			; LMULMAX2-RV64-NEXT: vslidedown.vi v28, v26, 21
	; LMULMAX2-RV64-NEXT: vmv.x.s a1, v28			; LMULMAX2-RV64-NEXT: vmv.x.s a1, v28
	; LMULMAX2-RV64-NEXT: andi a1, a1, 255			; LMULMAX2-RV64-NEXT: andi a1, a1, 255
	; LMULMAX2-RV64-NEXT: srli a2, a1, 1			; LMULMAX2-RV64-NEXT: srli a2, a1, 1
	; LMULMAX2-RV64-NEXT: or a1, a1, a2			; LMULMAX2-RV64-NEXT: or a1, a1, a2
	; LMULMAX2-RV64-NEXT: srli a2, a1, 2			; LMULMAX2-RV64-NEXT: srli a2, a1, 2
	; LMULMAX2-RV64-NEXT: or a1, a1, a2			; LMULMAX2-RV64-NEXT: or a1, a1, a2
	Show All 13 Lines
	; LMULMAX2-RV64-NEXT: srli a1, a1, 2			; LMULMAX2-RV64-NEXT: srli a1, a1, 2
	; LMULMAX2-RV64-NEXT: and a1, a1, a3			; LMULMAX2-RV64-NEXT: and a1, a1, a3
	; LMULMAX2-RV64-NEXT: add a1, a2, a1			; LMULMAX2-RV64-NEXT: add a1, a2, a1
	; LMULMAX2-RV64-NEXT: srli a2, a1, 4			; LMULMAX2-RV64-NEXT: srli a2, a1, 4
	; LMULMAX2-RV64-NEXT: add a1, a1, a2			; LMULMAX2-RV64-NEXT: add a1, a1, a2
	; LMULMAX2-RV64-NEXT: and a1, a1, a4			; LMULMAX2-RV64-NEXT: and a1, a1, a4
	; LMULMAX2-RV64-NEXT: mul a1, a1, a5			; LMULMAX2-RV64-NEXT: mul a1, a1, a5
	; LMULMAX2-RV64-NEXT: srli a1, a1, 56			; LMULMAX2-RV64-NEXT: srli a1, a1, 56
	; LMULMAX2-RV64-NEXT: addi a1, a1, -56			; LMULMAX2-RV64-NEXT: addiw a1, a1, -56
	; LMULMAX2-RV64-NEXT: sb a1, 53(sp)			; LMULMAX2-RV64-NEXT: sb a1, 53(sp)
	; LMULMAX2-RV64-NEXT: vslidedown.vi v28, v26, 20			; LMULMAX2-RV64-NEXT: vslidedown.vi v28, v26, 20
	; LMULMAX2-RV64-NEXT: vmv.x.s a1, v28			; LMULMAX2-RV64-NEXT: vmv.x.s a1, v28
	; LMULMAX2-RV64-NEXT: andi a1, a1, 255			; LMULMAX2-RV64-NEXT: andi a1, a1, 255
	; LMULMAX2-RV64-NEXT: srli a2, a1, 1			; LMULMAX2-RV64-NEXT: srli a2, a1, 1
	; LMULMAX2-RV64-NEXT: or a1, a1, a2			; LMULMAX2-RV64-NEXT: or a1, a1, a2
	; LMULMAX2-RV64-NEXT: srli a2, a1, 2			; LMULMAX2-RV64-NEXT: srli a2, a1, 2
	; LMULMAX2-RV64-NEXT: or a1, a1, a2			; LMULMAX2-RV64-NEXT: or a1, a1, a2
	Show All 13 Lines
	; LMULMAX2-RV64-NEXT: srli a1, a1, 2			; LMULMAX2-RV64-NEXT: srli a1, a1, 2
	; LMULMAX2-RV64-NEXT: and a1, a1, a3			; LMULMAX2-RV64-NEXT: and a1, a1, a3
	; LMULMAX2-RV64-NEXT: add a1, a2, a1			; LMULMAX2-RV64-NEXT: add a1, a2, a1
	; LMULMAX2-RV64-NEXT: srli a2, a1, 4			; LMULMAX2-RV64-NEXT: srli a2, a1, 4
	; LMULMAX2-RV64-NEXT: add a1, a1, a2			; LMULMAX2-RV64-NEXT: add a1, a1, a2
	; LMULMAX2-RV64-NEXT: and a1, a1, a4			; LMULMAX2-RV64-NEXT: and a1, a1, a4
	; LMULMAX2-RV64-NEXT: mul a1, a1, a5			; LMULMAX2-RV64-NEXT: mul a1, a1, a5
	; LMULMAX2-RV64-NEXT: srli a1, a1, 56			; LMULMAX2-RV64-NEXT: srli a1, a1, 56
	; LMULMAX2-RV64-NEXT: addi a1, a1, -56			; LMULMAX2-RV64-NEXT: addiw a1, a1, -56
	; LMULMAX2-RV64-NEXT: sb a1, 52(sp)			; LMULMAX2-RV64-NEXT: sb a1, 52(sp)
	; LMULMAX2-RV64-NEXT: vslidedown.vi v28, v26, 19			; LMULMAX2-RV64-NEXT: vslidedown.vi v28, v26, 19
	; LMULMAX2-RV64-NEXT: vmv.x.s a1, v28			; LMULMAX2-RV64-NEXT: vmv.x.s a1, v28
	; LMULMAX2-RV64-NEXT: andi a1, a1, 255			; LMULMAX2-RV64-NEXT: andi a1, a1, 255
	; LMULMAX2-RV64-NEXT: srli a2, a1, 1			; LMULMAX2-RV64-NEXT: srli a2, a1, 1
	; LMULMAX2-RV64-NEXT: or a1, a1, a2			; LMULMAX2-RV64-NEXT: or a1, a1, a2
	; LMULMAX2-RV64-NEXT: srli a2, a1, 2			; LMULMAX2-RV64-NEXT: srli a2, a1, 2
	; LMULMAX2-RV64-NEXT: or a1, a1, a2			; LMULMAX2-RV64-NEXT: or a1, a1, a2
	Show All 13 Lines
	; LMULMAX2-RV64-NEXT: srli a1, a1, 2			; LMULMAX2-RV64-NEXT: srli a1, a1, 2
	; LMULMAX2-RV64-NEXT: and a1, a1, a3			; LMULMAX2-RV64-NEXT: and a1, a1, a3
	; LMULMAX2-RV64-NEXT: add a1, a2, a1			; LMULMAX2-RV64-NEXT: add a1, a2, a1
	; LMULMAX2-RV64-NEXT: srli a2, a1, 4			; LMULMAX2-RV64-NEXT: srli a2, a1, 4
	; LMULMAX2-RV64-NEXT: add a1, a1, a2			; LMULMAX2-RV64-NEXT: add a1, a1, a2
	; LMULMAX2-RV64-NEXT: and a1, a1, a4			; LMULMAX2-RV64-NEXT: and a1, a1, a4
	; LMULMAX2-RV64-NEXT: mul a1, a1, a5			; LMULMAX2-RV64-NEXT: mul a1, a1, a5
	; LMULMAX2-RV64-NEXT: srli a1, a1, 56			; LMULMAX2-RV64-NEXT: srli a1, a1, 56
	; LMULMAX2-RV64-NEXT: addi a1, a1, -56			; LMULMAX2-RV64-NEXT: addiw a1, a1, -56
	; LMULMAX2-RV64-NEXT: sb a1, 51(sp)			; LMULMAX2-RV64-NEXT: sb a1, 51(sp)
	; LMULMAX2-RV64-NEXT: vslidedown.vi v28, v26, 18			; LMULMAX2-RV64-NEXT: vslidedown.vi v28, v26, 18
	; LMULMAX2-RV64-NEXT: vmv.x.s a1, v28			; LMULMAX2-RV64-NEXT: vmv.x.s a1, v28
	; LMULMAX2-RV64-NEXT: andi a1, a1, 255			; LMULMAX2-RV64-NEXT: andi a1, a1, 255
	; LMULMAX2-RV64-NEXT: srli a2, a1, 1			; LMULMAX2-RV64-NEXT: srli a2, a1, 1
	; LMULMAX2-RV64-NEXT: or a1, a1, a2			; LMULMAX2-RV64-NEXT: or a1, a1, a2
	; LMULMAX2-RV64-NEXT: srli a2, a1, 2			; LMULMAX2-RV64-NEXT: srli a2, a1, 2
	; LMULMAX2-RV64-NEXT: or a1, a1, a2			; LMULMAX2-RV64-NEXT: or a1, a1, a2
	Show All 13 Lines
	; LMULMAX2-RV64-NEXT: srli a1, a1, 2			; LMULMAX2-RV64-NEXT: srli a1, a1, 2
	; LMULMAX2-RV64-NEXT: and a1, a1, a3			; LMULMAX2-RV64-NEXT: and a1, a1, a3
	; LMULMAX2-RV64-NEXT: add a1, a2, a1			; LMULMAX2-RV64-NEXT: add a1, a2, a1
	; LMULMAX2-RV64-NEXT: srli a2, a1, 4			; LMULMAX2-RV64-NEXT: srli a2, a1, 4
	; LMULMAX2-RV64-NEXT: add a1, a1, a2			; LMULMAX2-RV64-NEXT: add a1, a1, a2
	; LMULMAX2-RV64-NEXT: and a1, a1, a4			; LMULMAX2-RV64-NEXT: and a1, a1, a4
	; LMULMAX2-RV64-NEXT: mul a1, a1, a5			; LMULMAX2-RV64-NEXT: mul a1, a1, a5
	; LMULMAX2-RV64-NEXT: srli a1, a1, 56			; LMULMAX2-RV64-NEXT: srli a1, a1, 56
	; LMULMAX2-RV64-NEXT: addi a1, a1, -56			; LMULMAX2-RV64-NEXT: addiw a1, a1, -56
	; LMULMAX2-RV64-NEXT: sb a1, 50(sp)			; LMULMAX2-RV64-NEXT: sb a1, 50(sp)
	; LMULMAX2-RV64-NEXT: vslidedown.vi v28, v26, 17			; LMULMAX2-RV64-NEXT: vslidedown.vi v28, v26, 17
	; LMULMAX2-RV64-NEXT: vmv.x.s a1, v28			; LMULMAX2-RV64-NEXT: vmv.x.s a1, v28
	; LMULMAX2-RV64-NEXT: andi a1, a1, 255			; LMULMAX2-RV64-NEXT: andi a1, a1, 255
	; LMULMAX2-RV64-NEXT: srli a2, a1, 1			; LMULMAX2-RV64-NEXT: srli a2, a1, 1
	; LMULMAX2-RV64-NEXT: or a1, a1, a2			; LMULMAX2-RV64-NEXT: or a1, a1, a2
	; LMULMAX2-RV64-NEXT: srli a2, a1, 2			; LMULMAX2-RV64-NEXT: srli a2, a1, 2
	; LMULMAX2-RV64-NEXT: or a1, a1, a2			; LMULMAX2-RV64-NEXT: or a1, a1, a2
	Show All 13 Lines
	; LMULMAX2-RV64-NEXT: srli a1, a1, 2			; LMULMAX2-RV64-NEXT: srli a1, a1, 2
	; LMULMAX2-RV64-NEXT: and a1, a1, a3			; LMULMAX2-RV64-NEXT: and a1, a1, a3
	; LMULMAX2-RV64-NEXT: add a1, a2, a1			; LMULMAX2-RV64-NEXT: add a1, a2, a1
	; LMULMAX2-RV64-NEXT: srli a2, a1, 4			; LMULMAX2-RV64-NEXT: srli a2, a1, 4
	; LMULMAX2-RV64-NEXT: add a1, a1, a2			; LMULMAX2-RV64-NEXT: add a1, a1, a2
	; LMULMAX2-RV64-NEXT: and a1, a1, a4			; LMULMAX2-RV64-NEXT: and a1, a1, a4
	; LMULMAX2-RV64-NEXT: mul a1, a1, a5			; LMULMAX2-RV64-NEXT: mul a1, a1, a5
	; LMULMAX2-RV64-NEXT: srli a1, a1, 56			; LMULMAX2-RV64-NEXT: srli a1, a1, 56
	; LMULMAX2-RV64-NEXT: addi a1, a1, -56			; LMULMAX2-RV64-NEXT: addiw a1, a1, -56
	; LMULMAX2-RV64-NEXT: sb a1, 49(sp)			; LMULMAX2-RV64-NEXT: sb a1, 49(sp)
	; LMULMAX2-RV64-NEXT: vslidedown.vi v28, v26, 16			; LMULMAX2-RV64-NEXT: vslidedown.vi v28, v26, 16
	; LMULMAX2-RV64-NEXT: vmv.x.s a1, v28			; LMULMAX2-RV64-NEXT: vmv.x.s a1, v28
	; LMULMAX2-RV64-NEXT: andi a1, a1, 255			; LMULMAX2-RV64-NEXT: andi a1, a1, 255
	; LMULMAX2-RV64-NEXT: srli a2, a1, 1			; LMULMAX2-RV64-NEXT: srli a2, a1, 1
	; LMULMAX2-RV64-NEXT: or a1, a1, a2			; LMULMAX2-RV64-NEXT: or a1, a1, a2
	; LMULMAX2-RV64-NEXT: srli a2, a1, 2			; LMULMAX2-RV64-NEXT: srli a2, a1, 2
	; LMULMAX2-RV64-NEXT: or a1, a1, a2			; LMULMAX2-RV64-NEXT: or a1, a1, a2
	Show All 13 Lines
	; LMULMAX2-RV64-NEXT: srli a1, a1, 2			; LMULMAX2-RV64-NEXT: srli a1, a1, 2
	; LMULMAX2-RV64-NEXT: and a1, a1, a3			; LMULMAX2-RV64-NEXT: and a1, a1, a3
	; LMULMAX2-RV64-NEXT: add a1, a2, a1			; LMULMAX2-RV64-NEXT: add a1, a2, a1
	; LMULMAX2-RV64-NEXT: srli a2, a1, 4			; LMULMAX2-RV64-NEXT: srli a2, a1, 4
	; LMULMAX2-RV64-NEXT: add a1, a1, a2			; LMULMAX2-RV64-NEXT: add a1, a1, a2
	; LMULMAX2-RV64-NEXT: and a1, a1, a4			; LMULMAX2-RV64-NEXT: and a1, a1, a4
	; LMULMAX2-RV64-NEXT: mul a1, a1, a5			; LMULMAX2-RV64-NEXT: mul a1, a1, a5
	; LMULMAX2-RV64-NEXT: srli a1, a1, 56			; LMULMAX2-RV64-NEXT: srli a1, a1, 56
	; LMULMAX2-RV64-NEXT: addi a1, a1, -56			; LMULMAX2-RV64-NEXT: addiw a1, a1, -56
	; LMULMAX2-RV64-NEXT: sb a1, 48(sp)			; LMULMAX2-RV64-NEXT: sb a1, 48(sp)
	; LMULMAX2-RV64-NEXT: vslidedown.vi v28, v26, 15			; LMULMAX2-RV64-NEXT: vslidedown.vi v28, v26, 15
	; LMULMAX2-RV64-NEXT: vmv.x.s a1, v28			; LMULMAX2-RV64-NEXT: vmv.x.s a1, v28
	; LMULMAX2-RV64-NEXT: andi a1, a1, 255			; LMULMAX2-RV64-NEXT: andi a1, a1, 255
	; LMULMAX2-RV64-NEXT: srli a2, a1, 1			; LMULMAX2-RV64-NEXT: srli a2, a1, 1
	; LMULMAX2-RV64-NEXT: or a1, a1, a2			; LMULMAX2-RV64-NEXT: or a1, a1, a2
	; LMULMAX2-RV64-NEXT: srli a2, a1, 2			; LMULMAX2-RV64-NEXT: srli a2, a1, 2
	; LMULMAX2-RV64-NEXT: or a1, a1, a2			; LMULMAX2-RV64-NEXT: or a1, a1, a2
	Show All 13 Lines
	; LMULMAX2-RV64-NEXT: srli a1, a1, 2			; LMULMAX2-RV64-NEXT: srli a1, a1, 2
	; LMULMAX2-RV64-NEXT: and a1, a1, a3			; LMULMAX2-RV64-NEXT: and a1, a1, a3
	; LMULMAX2-RV64-NEXT: add a1, a2, a1			; LMULMAX2-RV64-NEXT: add a1, a2, a1
	; LMULMAX2-RV64-NEXT: srli a2, a1, 4			; LMULMAX2-RV64-NEXT: srli a2, a1, 4
	; LMULMAX2-RV64-NEXT: add a1, a1, a2			; LMULMAX2-RV64-NEXT: add a1, a1, a2
	; LMULMAX2-RV64-NEXT: and a1, a1, a4			; LMULMAX2-RV64-NEXT: and a1, a1, a4
	; LMULMAX2-RV64-NEXT: mul a1, a1, a5			; LMULMAX2-RV64-NEXT: mul a1, a1, a5
	; LMULMAX2-RV64-NEXT: srli a1, a1, 56			; LMULMAX2-RV64-NEXT: srli a1, a1, 56
	; LMULMAX2-RV64-NEXT: addi a1, a1, -56			; LMULMAX2-RV64-NEXT: addiw a1, a1, -56
	; LMULMAX2-RV64-NEXT: sb a1, 47(sp)			; LMULMAX2-RV64-NEXT: sb a1, 47(sp)
	; LMULMAX2-RV64-NEXT: vslidedown.vi v28, v26, 14			; LMULMAX2-RV64-NEXT: vslidedown.vi v28, v26, 14
	; LMULMAX2-RV64-NEXT: vmv.x.s a1, v28			; LMULMAX2-RV64-NEXT: vmv.x.s a1, v28
	; LMULMAX2-RV64-NEXT: andi a1, a1, 255			; LMULMAX2-RV64-NEXT: andi a1, a1, 255
	; LMULMAX2-RV64-NEXT: srli a2, a1, 1			; LMULMAX2-RV64-NEXT: srli a2, a1, 1
	; LMULMAX2-RV64-NEXT: or a1, a1, a2			; LMULMAX2-RV64-NEXT: or a1, a1, a2
	; LMULMAX2-RV64-NEXT: srli a2, a1, 2			; LMULMAX2-RV64-NEXT: srli a2, a1, 2
	; LMULMAX2-RV64-NEXT: or a1, a1, a2			; LMULMAX2-RV64-NEXT: or a1, a1, a2
	Show All 13 Lines
	; LMULMAX2-RV64-NEXT: srli a1, a1, 2			; LMULMAX2-RV64-NEXT: srli a1, a1, 2
	; LMULMAX2-RV64-NEXT: and a1, a1, a3			; LMULMAX2-RV64-NEXT: and a1, a1, a3
	; LMULMAX2-RV64-NEXT: add a1, a2, a1			; LMULMAX2-RV64-NEXT: add a1, a2, a1
	; LMULMAX2-RV64-NEXT: srli a2, a1, 4			; LMULMAX2-RV64-NEXT: srli a2, a1, 4
	; LMULMAX2-RV64-NEXT: add a1, a1, a2			; LMULMAX2-RV64-NEXT: add a1, a1, a2
	; LMULMAX2-RV64-NEXT: and a1, a1, a4			; LMULMAX2-RV64-NEXT: and a1, a1, a4
	; LMULMAX2-RV64-NEXT: mul a1, a1, a5			; LMULMAX2-RV64-NEXT: mul a1, a1, a5
	; LMULMAX2-RV64-NEXT: srli a1, a1, 56			; LMULMAX2-RV64-NEXT: srli a1, a1, 56
	; LMULMAX2-RV64-NEXT: addi a1, a1, -56			; LMULMAX2-RV64-NEXT: addiw a1, a1, -56
	; LMULMAX2-RV64-NEXT: sb a1, 46(sp)			; LMULMAX2-RV64-NEXT: sb a1, 46(sp)
	; LMULMAX2-RV64-NEXT: vslidedown.vi v28, v26, 13			; LMULMAX2-RV64-NEXT: vslidedown.vi v28, v26, 13
	; LMULMAX2-RV64-NEXT: vmv.x.s a1, v28			; LMULMAX2-RV64-NEXT: vmv.x.s a1, v28
	; LMULMAX2-RV64-NEXT: andi a1, a1, 255			; LMULMAX2-RV64-NEXT: andi a1, a1, 255
	; LMULMAX2-RV64-NEXT: srli a2, a1, 1			; LMULMAX2-RV64-NEXT: srli a2, a1, 1
	; LMULMAX2-RV64-NEXT: or a1, a1, a2			; LMULMAX2-RV64-NEXT: or a1, a1, a2
	; LMULMAX2-RV64-NEXT: srli a2, a1, 2			; LMULMAX2-RV64-NEXT: srli a2, a1, 2
	; LMULMAX2-RV64-NEXT: or a1, a1, a2			; LMULMAX2-RV64-NEXT: or a1, a1, a2
	Show All 13 Lines
	; LMULMAX2-RV64-NEXT: srli a1, a1, 2			; LMULMAX2-RV64-NEXT: srli a1, a1, 2
	; LMULMAX2-RV64-NEXT: and a1, a1, a3			; LMULMAX2-RV64-NEXT: and a1, a1, a3
	; LMULMAX2-RV64-NEXT: add a1, a2, a1			; LMULMAX2-RV64-NEXT: add a1, a2, a1
	; LMULMAX2-RV64-NEXT: srli a2, a1, 4			; LMULMAX2-RV64-NEXT: srli a2, a1, 4
	; LMULMAX2-RV64-NEXT: add a1, a1, a2			; LMULMAX2-RV64-NEXT: add a1, a1, a2
	; LMULMAX2-RV64-NEXT: and a1, a1, a4			; LMULMAX2-RV64-NEXT: and a1, a1, a4
	; LMULMAX2-RV64-NEXT: mul a1, a1, a5			; LMULMAX2-RV64-NEXT: mul a1, a1, a5
	; LMULMAX2-RV64-NEXT: srli a1, a1, 56			; LMULMAX2-RV64-NEXT: srli a1, a1, 56
	; LMULMAX2-RV64-NEXT: addi a1, a1, -56			; LMULMAX2-RV64-NEXT: addiw a1, a1, -56
	; LMULMAX2-RV64-NEXT: sb a1, 45(sp)			; LMULMAX2-RV64-NEXT: sb a1, 45(sp)
	; LMULMAX2-RV64-NEXT: vslidedown.vi v28, v26, 12			; LMULMAX2-RV64-NEXT: vslidedown.vi v28, v26, 12
	; LMULMAX2-RV64-NEXT: vmv.x.s a1, v28			; LMULMAX2-RV64-NEXT: vmv.x.s a1, v28
	; LMULMAX2-RV64-NEXT: andi a1, a1, 255			; LMULMAX2-RV64-NEXT: andi a1, a1, 255
	; LMULMAX2-RV64-NEXT: srli a2, a1, 1			; LMULMAX2-RV64-NEXT: srli a2, a1, 1
	; LMULMAX2-RV64-NEXT: or a1, a1, a2			; LMULMAX2-RV64-NEXT: or a1, a1, a2
	; LMULMAX2-RV64-NEXT: srli a2, a1, 2			; LMULMAX2-RV64-NEXT: srli a2, a1, 2
	; LMULMAX2-RV64-NEXT: or a1, a1, a2			; LMULMAX2-RV64-NEXT: or a1, a1, a2
	Show All 13 Lines
	; LMULMAX2-RV64-NEXT: srli a1, a1, 2			; LMULMAX2-RV64-NEXT: srli a1, a1, 2
	; LMULMAX2-RV64-NEXT: and a1, a1, a3			; LMULMAX2-RV64-NEXT: and a1, a1, a3
	; LMULMAX2-RV64-NEXT: add a1, a2, a1			; LMULMAX2-RV64-NEXT: add a1, a2, a1
	; LMULMAX2-RV64-NEXT: srli a2, a1, 4			; LMULMAX2-RV64-NEXT: srli a2, a1, 4
	; LMULMAX2-RV64-NEXT: add a1, a1, a2			; LMULMAX2-RV64-NEXT: add a1, a1, a2
	; LMULMAX2-RV64-NEXT: and a1, a1, a4			; LMULMAX2-RV64-NEXT: and a1, a1, a4
	; LMULMAX2-RV64-NEXT: mul a1, a1, a5			; LMULMAX2-RV64-NEXT: mul a1, a1, a5
	; LMULMAX2-RV64-NEXT: srli a1, a1, 56			; LMULMAX2-RV64-NEXT: srli a1, a1, 56
	; LMULMAX2-RV64-NEXT: addi a1, a1, -56			; LMULMAX2-RV64-NEXT: addiw a1, a1, -56
	; LMULMAX2-RV64-NEXT: sb a1, 44(sp)			; LMULMAX2-RV64-NEXT: sb a1, 44(sp)
	; LMULMAX2-RV64-NEXT: vslidedown.vi v28, v26, 11			; LMULMAX2-RV64-NEXT: vslidedown.vi v28, v26, 11
	; LMULMAX2-RV64-NEXT: vmv.x.s a1, v28			; LMULMAX2-RV64-NEXT: vmv.x.s a1, v28
	; LMULMAX2-RV64-NEXT: andi a1, a1, 255			; LMULMAX2-RV64-NEXT: andi a1, a1, 255
	; LMULMAX2-RV64-NEXT: srli a2, a1, 1			; LMULMAX2-RV64-NEXT: srli a2, a1, 1
	; LMULMAX2-RV64-NEXT: or a1, a1, a2			; LMULMAX2-RV64-NEXT: or a1, a1, a2
	; LMULMAX2-RV64-NEXT: srli a2, a1, 2			; LMULMAX2-RV64-NEXT: srli a2, a1, 2
	; LMULMAX2-RV64-NEXT: or a1, a1, a2			; LMULMAX2-RV64-NEXT: or a1, a1, a2
	Show All 13 Lines
	; LMULMAX2-RV64-NEXT: srli a1, a1, 2			; LMULMAX2-RV64-NEXT: srli a1, a1, 2
	; LMULMAX2-RV64-NEXT: and a1, a1, a3			; LMULMAX2-RV64-NEXT: and a1, a1, a3
	; LMULMAX2-RV64-NEXT: add a1, a2, a1			; LMULMAX2-RV64-NEXT: add a1, a2, a1
	; LMULMAX2-RV64-NEXT: srli a2, a1, 4			; LMULMAX2-RV64-NEXT: srli a2, a1, 4
	; LMULMAX2-RV64-NEXT: add a1, a1, a2			; LMULMAX2-RV64-NEXT: add a1, a1, a2
	; LMULMAX2-RV64-NEXT: and a1, a1, a4			; LMULMAX2-RV64-NEXT: and a1, a1, a4
	; LMULMAX2-RV64-NEXT: mul a1, a1, a5			; LMULMAX2-RV64-NEXT: mul a1, a1, a5
	; LMULMAX2-RV64-NEXT: srli a1, a1, 56			; LMULMAX2-RV64-NEXT: srli a1, a1, 56
	; LMULMAX2-RV64-NEXT: addi a1, a1, -56			; LMULMAX2-RV64-NEXT: addiw a1, a1, -56
	; LMULMAX2-RV64-NEXT: sb a1, 43(sp)			; LMULMAX2-RV64-NEXT: sb a1, 43(sp)
	; LMULMAX2-RV64-NEXT: vslidedown.vi v28, v26, 10			; LMULMAX2-RV64-NEXT: vslidedown.vi v28, v26, 10
	; LMULMAX2-RV64-NEXT: vmv.x.s a1, v28			; LMULMAX2-RV64-NEXT: vmv.x.s a1, v28
	; LMULMAX2-RV64-NEXT: andi a1, a1, 255			; LMULMAX2-RV64-NEXT: andi a1, a1, 255
	; LMULMAX2-RV64-NEXT: srli a2, a1, 1			; LMULMAX2-RV64-NEXT: srli a2, a1, 1
	; LMULMAX2-RV64-NEXT: or a1, a1, a2			; LMULMAX2-RV64-NEXT: or a1, a1, a2
	; LMULMAX2-RV64-NEXT: srli a2, a1, 2			; LMULMAX2-RV64-NEXT: srli a2, a1, 2
	; LMULMAX2-RV64-NEXT: or a1, a1, a2			; LMULMAX2-RV64-NEXT: or a1, a1, a2
	Show All 13 Lines
	; LMULMAX2-RV64-NEXT: srli a1, a1, 2			; LMULMAX2-RV64-NEXT: srli a1, a1, 2
	; LMULMAX2-RV64-NEXT: and a1, a1, a3			; LMULMAX2-RV64-NEXT: and a1, a1, a3
	; LMULMAX2-RV64-NEXT: add a1, a2, a1			; LMULMAX2-RV64-NEXT: add a1, a2, a1
	; LMULMAX2-RV64-NEXT: srli a2, a1, 4			; LMULMAX2-RV64-NEXT: srli a2, a1, 4
	; LMULMAX2-RV64-NEXT: add a1, a1, a2			; LMULMAX2-RV64-NEXT: add a1, a1, a2
	; LMULMAX2-RV64-NEXT: and a1, a1, a4			; LMULMAX2-RV64-NEXT: and a1, a1, a4
	; LMULMAX2-RV64-NEXT: mul a1, a1, a5			; LMULMAX2-RV64-NEXT: mul a1, a1, a5
	; LMULMAX2-RV64-NEXT: srli a1, a1, 56			; LMULMAX2-RV64-NEXT: srli a1, a1, 56
	; LMULMAX2-RV64-NEXT: addi a1, a1, -56			; LMULMAX2-RV64-NEXT: addiw a1, a1, -56
	; LMULMAX2-RV64-NEXT: sb a1, 42(sp)			; LMULMAX2-RV64-NEXT: sb a1, 42(sp)
	; LMULMAX2-RV64-NEXT: vslidedown.vi v28, v26, 9			; LMULMAX2-RV64-NEXT: vslidedown.vi v28, v26, 9
	; LMULMAX2-RV64-NEXT: vmv.x.s a1, v28			; LMULMAX2-RV64-NEXT: vmv.x.s a1, v28
	; LMULMAX2-RV64-NEXT: andi a1, a1, 255			; LMULMAX2-RV64-NEXT: andi a1, a1, 255
	; LMULMAX2-RV64-NEXT: srli a2, a1, 1			; LMULMAX2-RV64-NEXT: srli a2, a1, 1
	; LMULMAX2-RV64-NEXT: or a1, a1, a2			; LMULMAX2-RV64-NEXT: or a1, a1, a2
	; LMULMAX2-RV64-NEXT: srli a2, a1, 2			; LMULMAX2-RV64-NEXT: srli a2, a1, 2
	; LMULMAX2-RV64-NEXT: or a1, a1, a2			; LMULMAX2-RV64-NEXT: or a1, a1, a2
	Show All 13 Lines
	; LMULMAX2-RV64-NEXT: srli a1, a1, 2			; LMULMAX2-RV64-NEXT: srli a1, a1, 2
	; LMULMAX2-RV64-NEXT: and a1, a1, a3			; LMULMAX2-RV64-NEXT: and a1, a1, a3
	; LMULMAX2-RV64-NEXT: add a1, a2, a1			; LMULMAX2-RV64-NEXT: add a1, a2, a1
	; LMULMAX2-RV64-NEXT: srli a2, a1, 4			; LMULMAX2-RV64-NEXT: srli a2, a1, 4
	; LMULMAX2-RV64-NEXT: add a1, a1, a2			; LMULMAX2-RV64-NEXT: add a1, a1, a2
	; LMULMAX2-RV64-NEXT: and a1, a1, a4			; LMULMAX2-RV64-NEXT: and a1, a1, a4
	; LMULMAX2-RV64-NEXT: mul a1, a1, a5			; LMULMAX2-RV64-NEXT: mul a1, a1, a5
	; LMULMAX2-RV64-NEXT: srli a1, a1, 56			; LMULMAX2-RV64-NEXT: srli a1, a1, 56
	; LMULMAX2-RV64-NEXT: addi a1, a1, -56			; LMULMAX2-RV64-NEXT: addiw a1, a1, -56
	; LMULMAX2-RV64-NEXT: sb a1, 41(sp)			; LMULMAX2-RV64-NEXT: sb a1, 41(sp)
	; LMULMAX2-RV64-NEXT: vslidedown.vi v28, v26, 8			; LMULMAX2-RV64-NEXT: vslidedown.vi v28, v26, 8
	; LMULMAX2-RV64-NEXT: vmv.x.s a1, v28			; LMULMAX2-RV64-NEXT: vmv.x.s a1, v28
	; LMULMAX2-RV64-NEXT: andi a1, a1, 255			; LMULMAX2-RV64-NEXT: andi a1, a1, 255
	; LMULMAX2-RV64-NEXT: srli a2, a1, 1			; LMULMAX2-RV64-NEXT: srli a2, a1, 1
	; LMULMAX2-RV64-NEXT: or a1, a1, a2			; LMULMAX2-RV64-NEXT: or a1, a1, a2
	; LMULMAX2-RV64-NEXT: srli a2, a1, 2			; LMULMAX2-RV64-NEXT: srli a2, a1, 2
	; LMULMAX2-RV64-NEXT: or a1, a1, a2			; LMULMAX2-RV64-NEXT: or a1, a1, a2
	Show All 13 Lines
	; LMULMAX2-RV64-NEXT: srli a1, a1, 2			; LMULMAX2-RV64-NEXT: srli a1, a1, 2
	; LMULMAX2-RV64-NEXT: and a1, a1, a3			; LMULMAX2-RV64-NEXT: and a1, a1, a3
	; LMULMAX2-RV64-NEXT: add a1, a2, a1			; LMULMAX2-RV64-NEXT: add a1, a2, a1
	; LMULMAX2-RV64-NEXT: srli a2, a1, 4			; LMULMAX2-RV64-NEXT: srli a2, a1, 4
	; LMULMAX2-RV64-NEXT: add a1, a1, a2			; LMULMAX2-RV64-NEXT: add a1, a1, a2
	; LMULMAX2-RV64-NEXT: and a1, a1, a4			; LMULMAX2-RV64-NEXT: and a1, a1, a4
	; LMULMAX2-RV64-NEXT: mul a1, a1, a5			; LMULMAX2-RV64-NEXT: mul a1, a1, a5
	; LMULMAX2-RV64-NEXT: srli a1, a1, 56			; LMULMAX2-RV64-NEXT: srli a1, a1, 56
	; LMULMAX2-RV64-NEXT: addi a1, a1, -56			; LMULMAX2-RV64-NEXT: addiw a1, a1, -56
	; LMULMAX2-RV64-NEXT: sb a1, 40(sp)			; LMULMAX2-RV64-NEXT: sb a1, 40(sp)
	; LMULMAX2-RV64-NEXT: vslidedown.vi v28, v26, 7			; LMULMAX2-RV64-NEXT: vslidedown.vi v28, v26, 7
	; LMULMAX2-RV64-NEXT: vmv.x.s a1, v28			; LMULMAX2-RV64-NEXT: vmv.x.s a1, v28
	; LMULMAX2-RV64-NEXT: andi a1, a1, 255			; LMULMAX2-RV64-NEXT: andi a1, a1, 255
	; LMULMAX2-RV64-NEXT: srli a2, a1, 1			; LMULMAX2-RV64-NEXT: srli a2, a1, 1
	; LMULMAX2-RV64-NEXT: or a1, a1, a2			; LMULMAX2-RV64-NEXT: or a1, a1, a2
	; LMULMAX2-RV64-NEXT: srli a2, a1, 2			; LMULMAX2-RV64-NEXT: srli a2, a1, 2
	; LMULMAX2-RV64-NEXT: or a1, a1, a2			; LMULMAX2-RV64-NEXT: or a1, a1, a2
	Show All 13 Lines
	; LMULMAX2-RV64-NEXT: srli a1, a1, 2			; LMULMAX2-RV64-NEXT: srli a1, a1, 2
	; LMULMAX2-RV64-NEXT: and a1, a1, a3			; LMULMAX2-RV64-NEXT: and a1, a1, a3
	; LMULMAX2-RV64-NEXT: add a1, a2, a1			; LMULMAX2-RV64-NEXT: add a1, a2, a1
	; LMULMAX2-RV64-NEXT: srli a2, a1, 4			; LMULMAX2-RV64-NEXT: srli a2, a1, 4
	; LMULMAX2-RV64-NEXT: add a1, a1, a2			; LMULMAX2-RV64-NEXT: add a1, a1, a2
	; LMULMAX2-RV64-NEXT: and a1, a1, a4			; LMULMAX2-RV64-NEXT: and a1, a1, a4
	; LMULMAX2-RV64-NEXT: mul a1, a1, a5			; LMULMAX2-RV64-NEXT: mul a1, a1, a5
	; LMULMAX2-RV64-NEXT: srli a1, a1, 56			; LMULMAX2-RV64-NEXT: srli a1, a1, 56
	; LMULMAX2-RV64-NEXT: addi a1, a1, -56			; LMULMAX2-RV64-NEXT: addiw a1, a1, -56
	; LMULMAX2-RV64-NEXT: sb a1, 39(sp)			; LMULMAX2-RV64-NEXT: sb a1, 39(sp)
	; LMULMAX2-RV64-NEXT: vslidedown.vi v28, v26, 6			; LMULMAX2-RV64-NEXT: vslidedown.vi v28, v26, 6
	; LMULMAX2-RV64-NEXT: vmv.x.s a1, v28			; LMULMAX2-RV64-NEXT: vmv.x.s a1, v28
	; LMULMAX2-RV64-NEXT: andi a1, a1, 255			; LMULMAX2-RV64-NEXT: andi a1, a1, 255
	; LMULMAX2-RV64-NEXT: srli a2, a1, 1			; LMULMAX2-RV64-NEXT: srli a2, a1, 1
	; LMULMAX2-RV64-NEXT: or a1, a1, a2			; LMULMAX2-RV64-NEXT: or a1, a1, a2
	; LMULMAX2-RV64-NEXT: srli a2, a1, 2			; LMULMAX2-RV64-NEXT: srli a2, a1, 2
	; LMULMAX2-RV64-NEXT: or a1, a1, a2			; LMULMAX2-RV64-NEXT: or a1, a1, a2
	Show All 13 Lines
	; LMULMAX2-RV64-NEXT: srli a1, a1, 2			; LMULMAX2-RV64-NEXT: srli a1, a1, 2
	; LMULMAX2-RV64-NEXT: and a1, a1, a3			; LMULMAX2-RV64-NEXT: and a1, a1, a3
	; LMULMAX2-RV64-NEXT: add a1, a2, a1			; LMULMAX2-RV64-NEXT: add a1, a2, a1
	; LMULMAX2-RV64-NEXT: srli a2, a1, 4			; LMULMAX2-RV64-NEXT: srli a2, a1, 4
	; LMULMAX2-RV64-NEXT: add a1, a1, a2			; LMULMAX2-RV64-NEXT: add a1, a1, a2
	; LMULMAX2-RV64-NEXT: and a1, a1, a4			; LMULMAX2-RV64-NEXT: and a1, a1, a4
	; LMULMAX2-RV64-NEXT: mul a1, a1, a5			; LMULMAX2-RV64-NEXT: mul a1, a1, a5
	; LMULMAX2-RV64-NEXT: srli a1, a1, 56			; LMULMAX2-RV64-NEXT: srli a1, a1, 56
	; LMULMAX2-RV64-NEXT: addi a1, a1, -56			; LMULMAX2-RV64-NEXT: addiw a1, a1, -56
	; LMULMAX2-RV64-NEXT: sb a1, 38(sp)			; LMULMAX2-RV64-NEXT: sb a1, 38(sp)
	; LMULMAX2-RV64-NEXT: vslidedown.vi v28, v26, 5			; LMULMAX2-RV64-NEXT: vslidedown.vi v28, v26, 5
	; LMULMAX2-RV64-NEXT: vmv.x.s a1, v28			; LMULMAX2-RV64-NEXT: vmv.x.s a1, v28
	; LMULMAX2-RV64-NEXT: andi a1, a1, 255			; LMULMAX2-RV64-NEXT: andi a1, a1, 255
	; LMULMAX2-RV64-NEXT: srli a2, a1, 1			; LMULMAX2-RV64-NEXT: srli a2, a1, 1
	; LMULMAX2-RV64-NEXT: or a1, a1, a2			; LMULMAX2-RV64-NEXT: or a1, a1, a2
	; LMULMAX2-RV64-NEXT: srli a2, a1, 2			; LMULMAX2-RV64-NEXT: srli a2, a1, 2
	; LMULMAX2-RV64-NEXT: or a1, a1, a2			; LMULMAX2-RV64-NEXT: or a1, a1, a2
	Show All 13 Lines
	; LMULMAX2-RV64-NEXT: srli a1, a1, 2			; LMULMAX2-RV64-NEXT: srli a1, a1, 2
	; LMULMAX2-RV64-NEXT: and a1, a1, a3			; LMULMAX2-RV64-NEXT: and a1, a1, a3
	; LMULMAX2-RV64-NEXT: add a1, a2, a1			; LMULMAX2-RV64-NEXT: add a1, a2, a1
	; LMULMAX2-RV64-NEXT: srli a2, a1, 4			; LMULMAX2-RV64-NEXT: srli a2, a1, 4
	; LMULMAX2-RV64-NEXT: add a1, a1, a2			; LMULMAX2-RV64-NEXT: add a1, a1, a2
	; LMULMAX2-RV64-NEXT: and a1, a1, a4			; LMULMAX2-RV64-NEXT: and a1, a1, a4
	; LMULMAX2-RV64-NEXT: mul a1, a1, a5			; LMULMAX2-RV64-NEXT: mul a1, a1, a5
	; LMULMAX2-RV64-NEXT: srli a1, a1, 56			; LMULMAX2-RV64-NEXT: srli a1, a1, 56
	; LMULMAX2-RV64-NEXT: addi a1, a1, -56			; LMULMAX2-RV64-NEXT: addiw a1, a1, -56
	; LMULMAX2-RV64-NEXT: sb a1, 37(sp)			; LMULMAX2-RV64-NEXT: sb a1, 37(sp)
	; LMULMAX2-RV64-NEXT: vslidedown.vi v28, v26, 4			; LMULMAX2-RV64-NEXT: vslidedown.vi v28, v26, 4
	; LMULMAX2-RV64-NEXT: vmv.x.s a1, v28			; LMULMAX2-RV64-NEXT: vmv.x.s a1, v28
	; LMULMAX2-RV64-NEXT: andi a1, a1, 255			; LMULMAX2-RV64-NEXT: andi a1, a1, 255
	; LMULMAX2-RV64-NEXT: srli a2, a1, 1			; LMULMAX2-RV64-NEXT: srli a2, a1, 1
	; LMULMAX2-RV64-NEXT: or a1, a1, a2			; LMULMAX2-RV64-NEXT: or a1, a1, a2
	; LMULMAX2-RV64-NEXT: srli a2, a1, 2			; LMULMAX2-RV64-NEXT: srli a2, a1, 2
	; LMULMAX2-RV64-NEXT: or a1, a1, a2			; LMULMAX2-RV64-NEXT: or a1, a1, a2
	Show All 13 Lines
	; LMULMAX2-RV64-NEXT: srli a1, a1, 2			; LMULMAX2-RV64-NEXT: srli a1, a1, 2
	; LMULMAX2-RV64-NEXT: and a1, a1, a3			; LMULMAX2-RV64-NEXT: and a1, a1, a3
	; LMULMAX2-RV64-NEXT: add a1, a2, a1			; LMULMAX2-RV64-NEXT: add a1, a2, a1
	; LMULMAX2-RV64-NEXT: srli a2, a1, 4			; LMULMAX2-RV64-NEXT: srli a2, a1, 4
	; LMULMAX2-RV64-NEXT: add a1, a1, a2			; LMULMAX2-RV64-NEXT: add a1, a1, a2
	; LMULMAX2-RV64-NEXT: and a1, a1, a4			; LMULMAX2-RV64-NEXT: and a1, a1, a4
	; LMULMAX2-RV64-NEXT: mul a1, a1, a5			; LMULMAX2-RV64-NEXT: mul a1, a1, a5
	; LMULMAX2-RV64-NEXT: srli a1, a1, 56			; LMULMAX2-RV64-NEXT: srli a1, a1, 56
	; LMULMAX2-RV64-NEXT: addi a1, a1, -56			; LMULMAX2-RV64-NEXT: addiw a1, a1, -56
	; LMULMAX2-RV64-NEXT: sb a1, 36(sp)			; LMULMAX2-RV64-NEXT: sb a1, 36(sp)
	; LMULMAX2-RV64-NEXT: vslidedown.vi v28, v26, 3			; LMULMAX2-RV64-NEXT: vslidedown.vi v28, v26, 3
	; LMULMAX2-RV64-NEXT: vmv.x.s a1, v28			; LMULMAX2-RV64-NEXT: vmv.x.s a1, v28
	; LMULMAX2-RV64-NEXT: andi a1, a1, 255			; LMULMAX2-RV64-NEXT: andi a1, a1, 255
	; LMULMAX2-RV64-NEXT: srli a2, a1, 1			; LMULMAX2-RV64-NEXT: srli a2, a1, 1
	; LMULMAX2-RV64-NEXT: or a1, a1, a2			; LMULMAX2-RV64-NEXT: or a1, a1, a2
	; LMULMAX2-RV64-NEXT: srli a2, a1, 2			; LMULMAX2-RV64-NEXT: srli a2, a1, 2
	; LMULMAX2-RV64-NEXT: or a1, a1, a2			; LMULMAX2-RV64-NEXT: or a1, a1, a2
	Show All 13 Lines
	; LMULMAX2-RV64-NEXT: srli a1, a1, 2			; LMULMAX2-RV64-NEXT: srli a1, a1, 2
	; LMULMAX2-RV64-NEXT: and a1, a1, a3			; LMULMAX2-RV64-NEXT: and a1, a1, a3
	; LMULMAX2-RV64-NEXT: add a1, a2, a1			; LMULMAX2-RV64-NEXT: add a1, a2, a1
	; LMULMAX2-RV64-NEXT: srli a2, a1, 4			; LMULMAX2-RV64-NEXT: srli a2, a1, 4
	; LMULMAX2-RV64-NEXT: add a1, a1, a2			; LMULMAX2-RV64-NEXT: add a1, a1, a2
	; LMULMAX2-RV64-NEXT: and a1, a1, a4			; LMULMAX2-RV64-NEXT: and a1, a1, a4
	; LMULMAX2-RV64-NEXT: mul a1, a1, a5			; LMULMAX2-RV64-NEXT: mul a1, a1, a5
	; LMULMAX2-RV64-NEXT: srli a1, a1, 56			; LMULMAX2-RV64-NEXT: srli a1, a1, 56
	; LMULMAX2-RV64-NEXT: addi a1, a1, -56			; LMULMAX2-RV64-NEXT: addiw a1, a1, -56
	; LMULMAX2-RV64-NEXT: sb a1, 35(sp)			; LMULMAX2-RV64-NEXT: sb a1, 35(sp)
	; LMULMAX2-RV64-NEXT: vslidedown.vi v28, v26, 2			; LMULMAX2-RV64-NEXT: vslidedown.vi v28, v26, 2
	; LMULMAX2-RV64-NEXT: vmv.x.s a1, v28			; LMULMAX2-RV64-NEXT: vmv.x.s a1, v28
	; LMULMAX2-RV64-NEXT: andi a1, a1, 255			; LMULMAX2-RV64-NEXT: andi a1, a1, 255
	; LMULMAX2-RV64-NEXT: srli a2, a1, 1			; LMULMAX2-RV64-NEXT: srli a2, a1, 1
	; LMULMAX2-RV64-NEXT: or a1, a1, a2			; LMULMAX2-RV64-NEXT: or a1, a1, a2
	; LMULMAX2-RV64-NEXT: srli a2, a1, 2			; LMULMAX2-RV64-NEXT: srli a2, a1, 2
	; LMULMAX2-RV64-NEXT: or a1, a1, a2			; LMULMAX2-RV64-NEXT: or a1, a1, a2
	Show All 13 Lines
	; LMULMAX2-RV64-NEXT: srli a1, a1, 2			; LMULMAX2-RV64-NEXT: srli a1, a1, 2
	; LMULMAX2-RV64-NEXT: and a1, a1, a3			; LMULMAX2-RV64-NEXT: and a1, a1, a3
	; LMULMAX2-RV64-NEXT: add a1, a2, a1			; LMULMAX2-RV64-NEXT: add a1, a2, a1
	; LMULMAX2-RV64-NEXT: srli a2, a1, 4			; LMULMAX2-RV64-NEXT: srli a2, a1, 4
	; LMULMAX2-RV64-NEXT: add a1, a1, a2			; LMULMAX2-RV64-NEXT: add a1, a1, a2
	; LMULMAX2-RV64-NEXT: and a1, a1, a4			; LMULMAX2-RV64-NEXT: and a1, a1, a4
	; LMULMAX2-RV64-NEXT: mul a1, a1, a5			; LMULMAX2-RV64-NEXT: mul a1, a1, a5
	; LMULMAX2-RV64-NEXT: srli a1, a1, 56			; LMULMAX2-RV64-NEXT: srli a1, a1, 56
	; LMULMAX2-RV64-NEXT: addi a1, a1, -56			; LMULMAX2-RV64-NEXT: addiw a1, a1, -56
	; LMULMAX2-RV64-NEXT: sb a1, 34(sp)			; LMULMAX2-RV64-NEXT: sb a1, 34(sp)
	; LMULMAX2-RV64-NEXT: vslidedown.vi v26, v26, 1			; LMULMAX2-RV64-NEXT: vslidedown.vi v26, v26, 1
	; LMULMAX2-RV64-NEXT: vmv.x.s a1, v26			; LMULMAX2-RV64-NEXT: vmv.x.s a1, v26
	; LMULMAX2-RV64-NEXT: andi a1, a1, 255			; LMULMAX2-RV64-NEXT: andi a1, a1, 255
	; LMULMAX2-RV64-NEXT: srli a2, a1, 1			; LMULMAX2-RV64-NEXT: srli a2, a1, 1
	; LMULMAX2-RV64-NEXT: or a1, a1, a2			; LMULMAX2-RV64-NEXT: or a1, a1, a2
	; LMULMAX2-RV64-NEXT: srli a2, a1, 2			; LMULMAX2-RV64-NEXT: srli a2, a1, 2
	; LMULMAX2-RV64-NEXT: or a1, a1, a2			; LMULMAX2-RV64-NEXT: or a1, a1, a2
	Show All 13 Lines
	; LMULMAX2-RV64-NEXT: srli a1, a1, 2			; LMULMAX2-RV64-NEXT: srli a1, a1, 2
	; LMULMAX2-RV64-NEXT: and a1, a1, a3			; LMULMAX2-RV64-NEXT: and a1, a1, a3
	; LMULMAX2-RV64-NEXT: add a1, a2, a1			; LMULMAX2-RV64-NEXT: add a1, a2, a1
	; LMULMAX2-RV64-NEXT: srli a2, a1, 4			; LMULMAX2-RV64-NEXT: srli a2, a1, 4
	; LMULMAX2-RV64-NEXT: add a1, a1, a2			; LMULMAX2-RV64-NEXT: add a1, a1, a2
	; LMULMAX2-RV64-NEXT: and a1, a1, a4			; LMULMAX2-RV64-NEXT: and a1, a1, a4
	; LMULMAX2-RV64-NEXT: mul a1, a1, a5			; LMULMAX2-RV64-NEXT: mul a1, a1, a5
	; LMULMAX2-RV64-NEXT: srli a1, a1, 56			; LMULMAX2-RV64-NEXT: srli a1, a1, 56
	; LMULMAX2-RV64-NEXT: addi a1, a1, -56			; LMULMAX2-RV64-NEXT: addiw a1, a1, -56
	; LMULMAX2-RV64-NEXT: sb a1, 33(sp)			; LMULMAX2-RV64-NEXT: sb a1, 33(sp)
	; LMULMAX2-RV64-NEXT: vsetvli zero, a6, e8, m2, ta, mu			; LMULMAX2-RV64-NEXT: vsetvli zero, a6, e8, m2, ta, mu
	; LMULMAX2-RV64-NEXT: addi a1, sp, 32			; LMULMAX2-RV64-NEXT: addi a1, sp, 32
	; LMULMAX2-RV64-NEXT: vle8.v v26, (a1)			; LMULMAX2-RV64-NEXT: vle8.v v26, (a1)
	; LMULMAX2-RV64-NEXT: vse8.v v26, (a0)			; LMULMAX2-RV64-NEXT: vse8.v v26, (a0)
	; LMULMAX2-RV64-NEXT: addi sp, s0, -96			; LMULMAX2-RV64-NEXT: addi sp, s0, -96
	; LMULMAX2-RV64-NEXT: ld s0, 80(sp) # 8-byte Folded Reload			; LMULMAX2-RV64-NEXT: ld s0, 80(sp) # 8-byte Folded Reload
	; LMULMAX2-RV64-NEXT: ld ra, 88(sp) # 8-byte Folded Reload			; LMULMAX2-RV64-NEXT: ld ra, 88(sp) # 8-byte Folded Reload
	▲ Show 20 Lines • Show All 981 Lines • ▼ Show 20 Lines
	; LMULMAX1-RV64-NEXT: lui a5, 4112			; LMULMAX1-RV64-NEXT: lui a5, 4112
	; LMULMAX1-RV64-NEXT: addiw a5, a5, 257			; LMULMAX1-RV64-NEXT: addiw a5, a5, 257
	; LMULMAX1-RV64-NEXT: slli a5, a5, 16			; LMULMAX1-RV64-NEXT: slli a5, a5, 16
	; LMULMAX1-RV64-NEXT: addi a5, a5, 257			; LMULMAX1-RV64-NEXT: addi a5, a5, 257
	; LMULMAX1-RV64-NEXT: slli a5, a5, 16			; LMULMAX1-RV64-NEXT: slli a5, a5, 16
	; LMULMAX1-RV64-NEXT: addi a5, a5, 257			; LMULMAX1-RV64-NEXT: addi a5, a5, 257
	; LMULMAX1-RV64-NEXT: mul a1, a1, a5			; LMULMAX1-RV64-NEXT: mul a1, a1, a5
	; LMULMAX1-RV64-NEXT: srli a1, a1, 56			; LMULMAX1-RV64-NEXT: srli a1, a1, 56
	; LMULMAX1-RV64-NEXT: addi a1, a1, -56			; LMULMAX1-RV64-NEXT: addiw a1, a1, -56
	; LMULMAX1-RV64-NEXT: sb a1, 32(sp)			; LMULMAX1-RV64-NEXT: sb a1, 32(sp)
	; LMULMAX1-RV64-NEXT: vsetivli zero, 1, e8, m1, ta, mu			; LMULMAX1-RV64-NEXT: vsetivli zero, 1, e8, m1, ta, mu
	; LMULMAX1-RV64-NEXT: vslidedown.vi v27, v26, 15			; LMULMAX1-RV64-NEXT: vslidedown.vi v27, v26, 15
	; LMULMAX1-RV64-NEXT: vmv.x.s a1, v27			; LMULMAX1-RV64-NEXT: vmv.x.s a1, v27
	; LMULMAX1-RV64-NEXT: andi a1, a1, 255			; LMULMAX1-RV64-NEXT: andi a1, a1, 255
	; LMULMAX1-RV64-NEXT: srli a2, a1, 1			; LMULMAX1-RV64-NEXT: srli a2, a1, 1
	; LMULMAX1-RV64-NEXT: or a1, a1, a2			; LMULMAX1-RV64-NEXT: or a1, a1, a2
	; LMULMAX1-RV64-NEXT: srli a2, a1, 2			; LMULMAX1-RV64-NEXT: srli a2, a1, 2
	Show All 14 Lines
	; LMULMAX1-RV64-NEXT: srli a1, a1, 2			; LMULMAX1-RV64-NEXT: srli a1, a1, 2
	; LMULMAX1-RV64-NEXT: and a1, a1, a3			; LMULMAX1-RV64-NEXT: and a1, a1, a3
	; LMULMAX1-RV64-NEXT: add a1, a2, a1			; LMULMAX1-RV64-NEXT: add a1, a2, a1
	; LMULMAX1-RV64-NEXT: srli a2, a1, 4			; LMULMAX1-RV64-NEXT: srli a2, a1, 4
	; LMULMAX1-RV64-NEXT: add a1, a1, a2			; LMULMAX1-RV64-NEXT: add a1, a1, a2
	; LMULMAX1-RV64-NEXT: and a1, a1, a4			; LMULMAX1-RV64-NEXT: and a1, a1, a4
	; LMULMAX1-RV64-NEXT: mul a1, a1, a5			; LMULMAX1-RV64-NEXT: mul a1, a1, a5
	; LMULMAX1-RV64-NEXT: srli a1, a1, 56			; LMULMAX1-RV64-NEXT: srli a1, a1, 56
	; LMULMAX1-RV64-NEXT: addi a1, a1, -56			; LMULMAX1-RV64-NEXT: addiw a1, a1, -56
	; LMULMAX1-RV64-NEXT: sb a1, 47(sp)			; LMULMAX1-RV64-NEXT: sb a1, 47(sp)
	; LMULMAX1-RV64-NEXT: vslidedown.vi v27, v26, 14			; LMULMAX1-RV64-NEXT: vslidedown.vi v27, v26, 14
	; LMULMAX1-RV64-NEXT: vmv.x.s a1, v27			; LMULMAX1-RV64-NEXT: vmv.x.s a1, v27
	; LMULMAX1-RV64-NEXT: andi a1, a1, 255			; LMULMAX1-RV64-NEXT: andi a1, a1, 255
	; LMULMAX1-RV64-NEXT: srli a2, a1, 1			; LMULMAX1-RV64-NEXT: srli a2, a1, 1
	; LMULMAX1-RV64-NEXT: or a1, a1, a2			; LMULMAX1-RV64-NEXT: or a1, a1, a2
	; LMULMAX1-RV64-NEXT: srli a2, a1, 2			; LMULMAX1-RV64-NEXT: srli a2, a1, 2
	; LMULMAX1-RV64-NEXT: or a1, a1, a2			; LMULMAX1-RV64-NEXT: or a1, a1, a2
	Show All 13 Lines
	; LMULMAX1-RV64-NEXT: srli a1, a1, 2			; LMULMAX1-RV64-NEXT: srli a1, a1, 2
	; LMULMAX1-RV64-NEXT: and a1, a1, a3			; LMULMAX1-RV64-NEXT: and a1, a1, a3
	; LMULMAX1-RV64-NEXT: add a1, a2, a1			; LMULMAX1-RV64-NEXT: add a1, a2, a1
	; LMULMAX1-RV64-NEXT: srli a2, a1, 4			; LMULMAX1-RV64-NEXT: srli a2, a1, 4
	; LMULMAX1-RV64-NEXT: add a1, a1, a2			; LMULMAX1-RV64-NEXT: add a1, a1, a2
	; LMULMAX1-RV64-NEXT: and a1, a1, a4			; LMULMAX1-RV64-NEXT: and a1, a1, a4
	; LMULMAX1-RV64-NEXT: mul a1, a1, a5			; LMULMAX1-RV64-NEXT: mul a1, a1, a5
	; LMULMAX1-RV64-NEXT: srli a1, a1, 56			; LMULMAX1-RV64-NEXT: srli a1, a1, 56
	; LMULMAX1-RV64-NEXT: addi a1, a1, -56			; LMULMAX1-RV64-NEXT: addiw a1, a1, -56
	; LMULMAX1-RV64-NEXT: sb a1, 46(sp)			; LMULMAX1-RV64-NEXT: sb a1, 46(sp)
	; LMULMAX1-RV64-NEXT: vslidedown.vi v27, v26, 13			; LMULMAX1-RV64-NEXT: vslidedown.vi v27, v26, 13
	; LMULMAX1-RV64-NEXT: vmv.x.s a1, v27			; LMULMAX1-RV64-NEXT: vmv.x.s a1, v27
	; LMULMAX1-RV64-NEXT: andi a1, a1, 255			; LMULMAX1-RV64-NEXT: andi a1, a1, 255
	; LMULMAX1-RV64-NEXT: srli a2, a1, 1			; LMULMAX1-RV64-NEXT: srli a2, a1, 1
	; LMULMAX1-RV64-NEXT: or a1, a1, a2			; LMULMAX1-RV64-NEXT: or a1, a1, a2
	; LMULMAX1-RV64-NEXT: srli a2, a1, 2			; LMULMAX1-RV64-NEXT: srli a2, a1, 2
	; LMULMAX1-RV64-NEXT: or a1, a1, a2			; LMULMAX1-RV64-NEXT: or a1, a1, a2
	Show All 13 Lines
	; LMULMAX1-RV64-NEXT: srli a1, a1, 2			; LMULMAX1-RV64-NEXT: srli a1, a1, 2
	; LMULMAX1-RV64-NEXT: and a1, a1, a3			; LMULMAX1-RV64-NEXT: and a1, a1, a3
	; LMULMAX1-RV64-NEXT: add a1, a2, a1			; LMULMAX1-RV64-NEXT: add a1, a2, a1
	; LMULMAX1-RV64-NEXT: srli a2, a1, 4			; LMULMAX1-RV64-NEXT: srli a2, a1, 4
	; LMULMAX1-RV64-NEXT: add a1, a1, a2			; LMULMAX1-RV64-NEXT: add a1, a1, a2
	; LMULMAX1-RV64-NEXT: and a1, a1, a4			; LMULMAX1-RV64-NEXT: and a1, a1, a4
	; LMULMAX1-RV64-NEXT: mul a1, a1, a5			; LMULMAX1-RV64-NEXT: mul a1, a1, a5
	; LMULMAX1-RV64-NEXT: srli a1, a1, 56			; LMULMAX1-RV64-NEXT: srli a1, a1, 56
	; LMULMAX1-RV64-NEXT: addi a1, a1, -56			; LMULMAX1-RV64-NEXT: addiw a1, a1, -56
	; LMULMAX1-RV64-NEXT: sb a1, 45(sp)			; LMULMAX1-RV64-NEXT: sb a1, 45(sp)
	; LMULMAX1-RV64-NEXT: vslidedown.vi v27, v26, 12			; LMULMAX1-RV64-NEXT: vslidedown.vi v27, v26, 12
	; LMULMAX1-RV64-NEXT: vmv.x.s a1, v27			; LMULMAX1-RV64-NEXT: vmv.x.s a1, v27
	; LMULMAX1-RV64-NEXT: andi a1, a1, 255			; LMULMAX1-RV64-NEXT: andi a1, a1, 255
	; LMULMAX1-RV64-NEXT: srli a2, a1, 1			; LMULMAX1-RV64-NEXT: srli a2, a1, 1
	; LMULMAX1-RV64-NEXT: or a1, a1, a2			; LMULMAX1-RV64-NEXT: or a1, a1, a2
	; LMULMAX1-RV64-NEXT: srli a2, a1, 2			; LMULMAX1-RV64-NEXT: srli a2, a1, 2
	; LMULMAX1-RV64-NEXT: or a1, a1, a2			; LMULMAX1-RV64-NEXT: or a1, a1, a2
	Show All 13 Lines
	; LMULMAX1-RV64-NEXT: srli a1, a1, 2			; LMULMAX1-RV64-NEXT: srli a1, a1, 2
	; LMULMAX1-RV64-NEXT: and a1, a1, a3			; LMULMAX1-RV64-NEXT: and a1, a1, a3
	; LMULMAX1-RV64-NEXT: add a1, a2, a1			; LMULMAX1-RV64-NEXT: add a1, a2, a1
	; LMULMAX1-RV64-NEXT: srli a2, a1, 4			; LMULMAX1-RV64-NEXT: srli a2, a1, 4
	; LMULMAX1-RV64-NEXT: add a1, a1, a2			; LMULMAX1-RV64-NEXT: add a1, a1, a2
	; LMULMAX1-RV64-NEXT: and a1, a1, a4			; LMULMAX1-RV64-NEXT: and a1, a1, a4
	; LMULMAX1-RV64-NEXT: mul a1, a1, a5			; LMULMAX1-RV64-NEXT: mul a1, a1, a5
	; LMULMAX1-RV64-NEXT: srli a1, a1, 56			; LMULMAX1-RV64-NEXT: srli a1, a1, 56
	; LMULMAX1-RV64-NEXT: addi a1, a1, -56			; LMULMAX1-RV64-NEXT: addiw a1, a1, -56
	; LMULMAX1-RV64-NEXT: sb a1, 44(sp)			; LMULMAX1-RV64-NEXT: sb a1, 44(sp)
	; LMULMAX1-RV64-NEXT: vslidedown.vi v27, v26, 11			; LMULMAX1-RV64-NEXT: vslidedown.vi v27, v26, 11
	; LMULMAX1-RV64-NEXT: vmv.x.s a1, v27			; LMULMAX1-RV64-NEXT: vmv.x.s a1, v27
	; LMULMAX1-RV64-NEXT: andi a1, a1, 255			; LMULMAX1-RV64-NEXT: andi a1, a1, 255
	; LMULMAX1-RV64-NEXT: srli a2, a1, 1			; LMULMAX1-RV64-NEXT: srli a2, a1, 1
	; LMULMAX1-RV64-NEXT: or a1, a1, a2			; LMULMAX1-RV64-NEXT: or a1, a1, a2
	; LMULMAX1-RV64-NEXT: srli a2, a1, 2			; LMULMAX1-RV64-NEXT: srli a2, a1, 2
	; LMULMAX1-RV64-NEXT: or a1, a1, a2			; LMULMAX1-RV64-NEXT: or a1, a1, a2
	Show All 13 Lines
	; LMULMAX1-RV64-NEXT: srli a1, a1, 2			; LMULMAX1-RV64-NEXT: srli a1, a1, 2
	; LMULMAX1-RV64-NEXT: and a1, a1, a3			; LMULMAX1-RV64-NEXT: and a1, a1, a3
	; LMULMAX1-RV64-NEXT: add a1, a2, a1			; LMULMAX1-RV64-NEXT: add a1, a2, a1
	; LMULMAX1-RV64-NEXT: srli a2, a1, 4			; LMULMAX1-RV64-NEXT: srli a2, a1, 4
	; LMULMAX1-RV64-NEXT: add a1, a1, a2			; LMULMAX1-RV64-NEXT: add a1, a1, a2
	; LMULMAX1-RV64-NEXT: and a1, a1, a4			; LMULMAX1-RV64-NEXT: and a1, a1, a4
	; LMULMAX1-RV64-NEXT: mul a1, a1, a5			; LMULMAX1-RV64-NEXT: mul a1, a1, a5
	; LMULMAX1-RV64-NEXT: srli a1, a1, 56			; LMULMAX1-RV64-NEXT: srli a1, a1, 56
	; LMULMAX1-RV64-NEXT: addi a1, a1, -56			; LMULMAX1-RV64-NEXT: addiw a1, a1, -56
	; LMULMAX1-RV64-NEXT: sb a1, 43(sp)			; LMULMAX1-RV64-NEXT: sb a1, 43(sp)
	; LMULMAX1-RV64-NEXT: vslidedown.vi v27, v26, 10			; LMULMAX1-RV64-NEXT: vslidedown.vi v27, v26, 10
	; LMULMAX1-RV64-NEXT: vmv.x.s a1, v27			; LMULMAX1-RV64-NEXT: vmv.x.s a1, v27
	; LMULMAX1-RV64-NEXT: andi a1, a1, 255			; LMULMAX1-RV64-NEXT: andi a1, a1, 255
	; LMULMAX1-RV64-NEXT: srli a2, a1, 1			; LMULMAX1-RV64-NEXT: srli a2, a1, 1
	; LMULMAX1-RV64-NEXT: or a1, a1, a2			; LMULMAX1-RV64-NEXT: or a1, a1, a2
	; LMULMAX1-RV64-NEXT: srli a2, a1, 2			; LMULMAX1-RV64-NEXT: srli a2, a1, 2
	; LMULMAX1-RV64-NEXT: or a1, a1, a2			; LMULMAX1-RV64-NEXT: or a1, a1, a2
	Show All 13 Lines
	; LMULMAX1-RV64-NEXT: srli a1, a1, 2			; LMULMAX1-RV64-NEXT: srli a1, a1, 2
	; LMULMAX1-RV64-NEXT: and a1, a1, a3			; LMULMAX1-RV64-NEXT: and a1, a1, a3
	; LMULMAX1-RV64-NEXT: add a1, a2, a1			; LMULMAX1-RV64-NEXT: add a1, a2, a1
	; LMULMAX1-RV64-NEXT: srli a2, a1, 4			; LMULMAX1-RV64-NEXT: srli a2, a1, 4
	; LMULMAX1-RV64-NEXT: add a1, a1, a2			; LMULMAX1-RV64-NEXT: add a1, a1, a2
	; LMULMAX1-RV64-NEXT: and a1, a1, a4			; LMULMAX1-RV64-NEXT: and a1, a1, a4
	; LMULMAX1-RV64-NEXT: mul a1, a1, a5			; LMULMAX1-RV64-NEXT: mul a1, a1, a5
	; LMULMAX1-RV64-NEXT: srli a1, a1, 56			; LMULMAX1-RV64-NEXT: srli a1, a1, 56
	; LMULMAX1-RV64-NEXT: addi a1, a1, -56			; LMULMAX1-RV64-NEXT: addiw a1, a1, -56
	; LMULMAX1-RV64-NEXT: sb a1, 42(sp)			; LMULMAX1-RV64-NEXT: sb a1, 42(sp)
	; LMULMAX1-RV64-NEXT: vslidedown.vi v27, v26, 9			; LMULMAX1-RV64-NEXT: vslidedown.vi v27, v26, 9
	; LMULMAX1-RV64-NEXT: vmv.x.s a1, v27			; LMULMAX1-RV64-NEXT: vmv.x.s a1, v27
	; LMULMAX1-RV64-NEXT: andi a1, a1, 255			; LMULMAX1-RV64-NEXT: andi a1, a1, 255
	; LMULMAX1-RV64-NEXT: srli a2, a1, 1			; LMULMAX1-RV64-NEXT: srli a2, a1, 1
	; LMULMAX1-RV64-NEXT: or a1, a1, a2			; LMULMAX1-RV64-NEXT: or a1, a1, a2
	; LMULMAX1-RV64-NEXT: srli a2, a1, 2			; LMULMAX1-RV64-NEXT: srli a2, a1, 2
	; LMULMAX1-RV64-NEXT: or a1, a1, a2			; LMULMAX1-RV64-NEXT: or a1, a1, a2
	Show All 13 Lines
	; LMULMAX1-RV64-NEXT: srli a1, a1, 2			; LMULMAX1-RV64-NEXT: srli a1, a1, 2
	; LMULMAX1-RV64-NEXT: and a1, a1, a3			; LMULMAX1-RV64-NEXT: and a1, a1, a3
	; LMULMAX1-RV64-NEXT: add a1, a2, a1			; LMULMAX1-RV64-NEXT: add a1, a2, a1
	; LMULMAX1-RV64-NEXT: srli a2, a1, 4			; LMULMAX1-RV64-NEXT: srli a2, a1, 4
	; LMULMAX1-RV64-NEXT: add a1, a1, a2			; LMULMAX1-RV64-NEXT: add a1, a1, a2
	; LMULMAX1-RV64-NEXT: and a1, a1, a4			; LMULMAX1-RV64-NEXT: and a1, a1, a4
	; LMULMAX1-RV64-NEXT: mul a1, a1, a5			; LMULMAX1-RV64-NEXT: mul a1, a1, a5
	; LMULMAX1-RV64-NEXT: srli a1, a1, 56			; LMULMAX1-RV64-NEXT: srli a1, a1, 56
	; LMULMAX1-RV64-NEXT: addi a1, a1, -56			; LMULMAX1-RV64-NEXT: addiw a1, a1, -56
	; LMULMAX1-RV64-NEXT: sb a1, 41(sp)			; LMULMAX1-RV64-NEXT: sb a1, 41(sp)
	; LMULMAX1-RV64-NEXT: vslidedown.vi v27, v26, 8			; LMULMAX1-RV64-NEXT: vslidedown.vi v27, v26, 8
	; LMULMAX1-RV64-NEXT: vmv.x.s a1, v27			; LMULMAX1-RV64-NEXT: vmv.x.s a1, v27
	; LMULMAX1-RV64-NEXT: andi a1, a1, 255			; LMULMAX1-RV64-NEXT: andi a1, a1, 255
	; LMULMAX1-RV64-NEXT: srli a2, a1, 1			; LMULMAX1-RV64-NEXT: srli a2, a1, 1
	; LMULMAX1-RV64-NEXT: or a1, a1, a2			; LMULMAX1-RV64-NEXT: or a1, a1, a2
	; LMULMAX1-RV64-NEXT: srli a2, a1, 2			; LMULMAX1-RV64-NEXT: srli a2, a1, 2
	; LMULMAX1-RV64-NEXT: or a1, a1, a2			; LMULMAX1-RV64-NEXT: or a1, a1, a2
	Show All 13 Lines
	; LMULMAX1-RV64-NEXT: srli a1, a1, 2			; LMULMAX1-RV64-NEXT: srli a1, a1, 2
	; LMULMAX1-RV64-NEXT: and a1, a1, a3			; LMULMAX1-RV64-NEXT: and a1, a1, a3
	; LMULMAX1-RV64-NEXT: add a1, a2, a1			; LMULMAX1-RV64-NEXT: add a1, a2, a1
	; LMULMAX1-RV64-NEXT: srli a2, a1, 4			; LMULMAX1-RV64-NEXT: srli a2, a1, 4
	; LMULMAX1-RV64-NEXT: add a1, a1, a2			; LMULMAX1-RV64-NEXT: add a1, a1, a2
	; LMULMAX1-RV64-NEXT: and a1, a1, a4			; LMULMAX1-RV64-NEXT: and a1, a1, a4
	; LMULMAX1-RV64-NEXT: mul a1, a1, a5			; LMULMAX1-RV64-NEXT: mul a1, a1, a5
	; LMULMAX1-RV64-NEXT: srli a1, a1, 56			; LMULMAX1-RV64-NEXT: srli a1, a1, 56
	; LMULMAX1-RV64-NEXT: addi a1, a1, -56			; LMULMAX1-RV64-NEXT: addiw a1, a1, -56
	; LMULMAX1-RV64-NEXT: sb a1, 40(sp)			; LMULMAX1-RV64-NEXT: sb a1, 40(sp)
	; LMULMAX1-RV64-NEXT: vslidedown.vi v27, v26, 7			; LMULMAX1-RV64-NEXT: vslidedown.vi v27, v26, 7
	; LMULMAX1-RV64-NEXT: vmv.x.s a1, v27			; LMULMAX1-RV64-NEXT: vmv.x.s a1, v27
	; LMULMAX1-RV64-NEXT: andi a1, a1, 255			; LMULMAX1-RV64-NEXT: andi a1, a1, 255
	; LMULMAX1-RV64-NEXT: srli a2, a1, 1			; LMULMAX1-RV64-NEXT: srli a2, a1, 1
	; LMULMAX1-RV64-NEXT: or a1, a1, a2			; LMULMAX1-RV64-NEXT: or a1, a1, a2
	; LMULMAX1-RV64-NEXT: srli a2, a1, 2			; LMULMAX1-RV64-NEXT: srli a2, a1, 2
	; LMULMAX1-RV64-NEXT: or a1, a1, a2			; LMULMAX1-RV64-NEXT: or a1, a1, a2
	Show All 13 Lines
	; LMULMAX1-RV64-NEXT: srli a1, a1, 2			; LMULMAX1-RV64-NEXT: srli a1, a1, 2
	; LMULMAX1-RV64-NEXT: and a1, a1, a3			; LMULMAX1-RV64-NEXT: and a1, a1, a3
	; LMULMAX1-RV64-NEXT: add a1, a2, a1			; LMULMAX1-RV64-NEXT: add a1, a2, a1
	; LMULMAX1-RV64-NEXT: srli a2, a1, 4			; LMULMAX1-RV64-NEXT: srli a2, a1, 4
	; LMULMAX1-RV64-NEXT: add a1, a1, a2			; LMULMAX1-RV64-NEXT: add a1, a1, a2
	; LMULMAX1-RV64-NEXT: and a1, a1, a4			; LMULMAX1-RV64-NEXT: and a1, a1, a4
	; LMULMAX1-RV64-NEXT: mul a1, a1, a5			; LMULMAX1-RV64-NEXT: mul a1, a1, a5
	; LMULMAX1-RV64-NEXT: srli a1, a1, 56			; LMULMAX1-RV64-NEXT: srli a1, a1, 56
	; LMULMAX1-RV64-NEXT: addi a1, a1, -56			; LMULMAX1-RV64-NEXT: addiw a1, a1, -56
	; LMULMAX1-RV64-NEXT: sb a1, 39(sp)			; LMULMAX1-RV64-NEXT: sb a1, 39(sp)
	; LMULMAX1-RV64-NEXT: vslidedown.vi v27, v26, 6			; LMULMAX1-RV64-NEXT: vslidedown.vi v27, v26, 6
	; LMULMAX1-RV64-NEXT: vmv.x.s a1, v27			; LMULMAX1-RV64-NEXT: vmv.x.s a1, v27
	; LMULMAX1-RV64-NEXT: andi a1, a1, 255			; LMULMAX1-RV64-NEXT: andi a1, a1, 255
	; LMULMAX1-RV64-NEXT: srli a2, a1, 1			; LMULMAX1-RV64-NEXT: srli a2, a1, 1
	; LMULMAX1-RV64-NEXT: or a1, a1, a2			; LMULMAX1-RV64-NEXT: or a1, a1, a2
	; LMULMAX1-RV64-NEXT: srli a2, a1, 2			; LMULMAX1-RV64-NEXT: srli a2, a1, 2
	; LMULMAX1-RV64-NEXT: or a1, a1, a2			; LMULMAX1-RV64-NEXT: or a1, a1, a2
	Show All 13 Lines
	; LMULMAX1-RV64-NEXT: srli a1, a1, 2			; LMULMAX1-RV64-NEXT: srli a1, a1, 2
	; LMULMAX1-RV64-NEXT: and a1, a1, a3			; LMULMAX1-RV64-NEXT: and a1, a1, a3
	; LMULMAX1-RV64-NEXT: add a1, a2, a1			; LMULMAX1-RV64-NEXT: add a1, a2, a1
	; LMULMAX1-RV64-NEXT: srli a2, a1, 4			; LMULMAX1-RV64-NEXT: srli a2, a1, 4
	; LMULMAX1-RV64-NEXT: add a1, a1, a2			; LMULMAX1-RV64-NEXT: add a1, a1, a2
	; LMULMAX1-RV64-NEXT: and a1, a1, a4			; LMULMAX1-RV64-NEXT: and a1, a1, a4
	; LMULMAX1-RV64-NEXT: mul a1, a1, a5			; LMULMAX1-RV64-NEXT: mul a1, a1, a5
	; LMULMAX1-RV64-NEXT: srli a1, a1, 56			; LMULMAX1-RV64-NEXT: srli a1, a1, 56
	; LMULMAX1-RV64-NEXT: addi a1, a1, -56			; LMULMAX1-RV64-NEXT: addiw a1, a1, -56
	; LMULMAX1-RV64-NEXT: sb a1, 38(sp)			; LMULMAX1-RV64-NEXT: sb a1, 38(sp)
	; LMULMAX1-RV64-NEXT: vslidedown.vi v27, v26, 5			; LMULMAX1-RV64-NEXT: vslidedown.vi v27, v26, 5
	; LMULMAX1-RV64-NEXT: vmv.x.s a1, v27			; LMULMAX1-RV64-NEXT: vmv.x.s a1, v27
	; LMULMAX1-RV64-NEXT: andi a1, a1, 255			; LMULMAX1-RV64-NEXT: andi a1, a1, 255
	; LMULMAX1-RV64-NEXT: srli a2, a1, 1			; LMULMAX1-RV64-NEXT: srli a2, a1, 1
	; LMULMAX1-RV64-NEXT: or a1, a1, a2			; LMULMAX1-RV64-NEXT: or a1, a1, a2
	; LMULMAX1-RV64-NEXT: srli a2, a1, 2			; LMULMAX1-RV64-NEXT: srli a2, a1, 2
	; LMULMAX1-RV64-NEXT: or a1, a1, a2			; LMULMAX1-RV64-NEXT: or a1, a1, a2
	Show All 13 Lines
	; LMULMAX1-RV64-NEXT: srli a1, a1, 2			; LMULMAX1-RV64-NEXT: srli a1, a1, 2
	; LMULMAX1-RV64-NEXT: and a1, a1, a3			; LMULMAX1-RV64-NEXT: and a1, a1, a3
	; LMULMAX1-RV64-NEXT: add a1, a2, a1			; LMULMAX1-RV64-NEXT: add a1, a2, a1
	; LMULMAX1-RV64-NEXT: srli a2, a1, 4			; LMULMAX1-RV64-NEXT: srli a2, a1, 4
	; LMULMAX1-RV64-NEXT: add a1, a1, a2			; LMULMAX1-RV64-NEXT: add a1, a1, a2
	; LMULMAX1-RV64-NEXT: and a1, a1, a4			; LMULMAX1-RV64-NEXT: and a1, a1, a4
	; LMULMAX1-RV64-NEXT: mul a1, a1, a5			; LMULMAX1-RV64-NEXT: mul a1, a1, a5
	; LMULMAX1-RV64-NEXT: srli a1, a1, 56			; LMULMAX1-RV64-NEXT: srli a1, a1, 56
	; LMULMAX1-RV64-NEXT: addi a1, a1, -56			; LMULMAX1-RV64-NEXT: addiw a1, a1, -56
	; LMULMAX1-RV64-NEXT: sb a1, 37(sp)			; LMULMAX1-RV64-NEXT: sb a1, 37(sp)
	; LMULMAX1-RV64-NEXT: vslidedown.vi v27, v26, 4			; LMULMAX1-RV64-NEXT: vslidedown.vi v27, v26, 4
	; LMULMAX1-RV64-NEXT: vmv.x.s a1, v27			; LMULMAX1-RV64-NEXT: vmv.x.s a1, v27
	; LMULMAX1-RV64-NEXT: andi a1, a1, 255			; LMULMAX1-RV64-NEXT: andi a1, a1, 255
	; LMULMAX1-RV64-NEXT: srli a2, a1, 1			; LMULMAX1-RV64-NEXT: srli a2, a1, 1
	; LMULMAX1-RV64-NEXT: or a1, a1, a2			; LMULMAX1-RV64-NEXT: or a1, a1, a2
	; LMULMAX1-RV64-NEXT: srli a2, a1, 2			; LMULMAX1-RV64-NEXT: srli a2, a1, 2
	; LMULMAX1-RV64-NEXT: or a1, a1, a2			; LMULMAX1-RV64-NEXT: or a1, a1, a2
	Show All 13 Lines
	; LMULMAX1-RV64-NEXT: srli a1, a1, 2			; LMULMAX1-RV64-NEXT: srli a1, a1, 2
	; LMULMAX1-RV64-NEXT: and a1, a1, a3			; LMULMAX1-RV64-NEXT: and a1, a1, a3
	; LMULMAX1-RV64-NEXT: add a1, a2, a1			; LMULMAX1-RV64-NEXT: add a1, a2, a1
	; LMULMAX1-RV64-NEXT: srli a2, a1, 4			; LMULMAX1-RV64-NEXT: srli a2, a1, 4
	; LMULMAX1-RV64-NEXT: add a1, a1, a2			; LMULMAX1-RV64-NEXT: add a1, a1, a2
	; LMULMAX1-RV64-NEXT: and a1, a1, a4			; LMULMAX1-RV64-NEXT: and a1, a1, a4
	; LMULMAX1-RV64-NEXT: mul a1, a1, a5			; LMULMAX1-RV64-NEXT: mul a1, a1, a5
	; LMULMAX1-RV64-NEXT: srli a1, a1, 56			; LMULMAX1-RV64-NEXT: srli a1, a1, 56
	; LMULMAX1-RV64-NEXT: addi a1, a1, -56			; LMULMAX1-RV64-NEXT: addiw a1, a1, -56
	; LMULMAX1-RV64-NEXT: sb a1, 36(sp)			; LMULMAX1-RV64-NEXT: sb a1, 36(sp)
	; LMULMAX1-RV64-NEXT: vslidedown.vi v27, v26, 3			; LMULMAX1-RV64-NEXT: vslidedown.vi v27, v26, 3
	; LMULMAX1-RV64-NEXT: vmv.x.s a1, v27			; LMULMAX1-RV64-NEXT: vmv.x.s a1, v27
	; LMULMAX1-RV64-NEXT: andi a1, a1, 255			; LMULMAX1-RV64-NEXT: andi a1, a1, 255
	; LMULMAX1-RV64-NEXT: srli a2, a1, 1			; LMULMAX1-RV64-NEXT: srli a2, a1, 1
	; LMULMAX1-RV64-NEXT: or a1, a1, a2			; LMULMAX1-RV64-NEXT: or a1, a1, a2
	; LMULMAX1-RV64-NEXT: srli a2, a1, 2			; LMULMAX1-RV64-NEXT: srli a2, a1, 2
	; LMULMAX1-RV64-NEXT: or a1, a1, a2			; LMULMAX1-RV64-NEXT: or a1, a1, a2
	Show All 13 Lines
	; LMULMAX1-RV64-NEXT: srli a1, a1, 2			; LMULMAX1-RV64-NEXT: srli a1, a1, 2
	; LMULMAX1-RV64-NEXT: and a1, a1, a3			; LMULMAX1-RV64-NEXT: and a1, a1, a3
	; LMULMAX1-RV64-NEXT: add a1, a2, a1			; LMULMAX1-RV64-NEXT: add a1, a2, a1
	; LMULMAX1-RV64-NEXT: srli a2, a1, 4			; LMULMAX1-RV64-NEXT: srli a2, a1, 4
	; LMULMAX1-RV64-NEXT: add a1, a1, a2			; LMULMAX1-RV64-NEXT: add a1, a1, a2
	; LMULMAX1-RV64-NEXT: and a1, a1, a4			; LMULMAX1-RV64-NEXT: and a1, a1, a4
	; LMULMAX1-RV64-NEXT: mul a1, a1, a5			; LMULMAX1-RV64-NEXT: mul a1, a1, a5
	; LMULMAX1-RV64-NEXT: srli a1, a1, 56			; LMULMAX1-RV64-NEXT: srli a1, a1, 56
	; LMULMAX1-RV64-NEXT: addi a1, a1, -56			; LMULMAX1-RV64-NEXT: addiw a1, a1, -56
	; LMULMAX1-RV64-NEXT: sb a1, 35(sp)			; LMULMAX1-RV64-NEXT: sb a1, 35(sp)
	; LMULMAX1-RV64-NEXT: vslidedown.vi v27, v26, 2			; LMULMAX1-RV64-NEXT: vslidedown.vi v27, v26, 2
	; LMULMAX1-RV64-NEXT: vmv.x.s a1, v27			; LMULMAX1-RV64-NEXT: vmv.x.s a1, v27
	; LMULMAX1-RV64-NEXT: andi a1, a1, 255			; LMULMAX1-RV64-NEXT: andi a1, a1, 255
	; LMULMAX1-RV64-NEXT: srli a2, a1, 1			; LMULMAX1-RV64-NEXT: srli a2, a1, 1
	; LMULMAX1-RV64-NEXT: or a1, a1, a2			; LMULMAX1-RV64-NEXT: or a1, a1, a2
	; LMULMAX1-RV64-NEXT: srli a2, a1, 2			; LMULMAX1-RV64-NEXT: srli a2, a1, 2
	; LMULMAX1-RV64-NEXT: or a1, a1, a2			; LMULMAX1-RV64-NEXT: or a1, a1, a2
	Show All 13 Lines
	; LMULMAX1-RV64-NEXT: srli a1, a1, 2			; LMULMAX1-RV64-NEXT: srli a1, a1, 2
	; LMULMAX1-RV64-NEXT: and a1, a1, a3			; LMULMAX1-RV64-NEXT: and a1, a1, a3
	; LMULMAX1-RV64-NEXT: add a1, a2, a1			; LMULMAX1-RV64-NEXT: add a1, a2, a1
	; LMULMAX1-RV64-NEXT: srli a2, a1, 4			; LMULMAX1-RV64-NEXT: srli a2, a1, 4
	; LMULMAX1-RV64-NEXT: add a1, a1, a2			; LMULMAX1-RV64-NEXT: add a1, a1, a2
	; LMULMAX1-RV64-NEXT: and a1, a1, a4			; LMULMAX1-RV64-NEXT: and a1, a1, a4
	; LMULMAX1-RV64-NEXT: mul a1, a1, a5			; LMULMAX1-RV64-NEXT: mul a1, a1, a5
	; LMULMAX1-RV64-NEXT: srli a1, a1, 56			; LMULMAX1-RV64-NEXT: srli a1, a1, 56
	; LMULMAX1-RV64-NEXT: addi a1, a1, -56			; LMULMAX1-RV64-NEXT: addiw a1, a1, -56
	; LMULMAX1-RV64-NEXT: sb a1, 34(sp)			; LMULMAX1-RV64-NEXT: sb a1, 34(sp)
	; LMULMAX1-RV64-NEXT: vslidedown.vi v26, v26, 1			; LMULMAX1-RV64-NEXT: vslidedown.vi v26, v26, 1
	; LMULMAX1-RV64-NEXT: vmv.x.s a1, v26			; LMULMAX1-RV64-NEXT: vmv.x.s a1, v26
	; LMULMAX1-RV64-NEXT: andi a1, a1, 255			; LMULMAX1-RV64-NEXT: andi a1, a1, 255
	; LMULMAX1-RV64-NEXT: srli a2, a1, 1			; LMULMAX1-RV64-NEXT: srli a2, a1, 1
	; LMULMAX1-RV64-NEXT: or a1, a1, a2			; LMULMAX1-RV64-NEXT: or a1, a1, a2
	; LMULMAX1-RV64-NEXT: srli a2, a1, 2			; LMULMAX1-RV64-NEXT: srli a2, a1, 2
	; LMULMAX1-RV64-NEXT: or a1, a1, a2			; LMULMAX1-RV64-NEXT: or a1, a1, a2
	Show All 13 Lines
	; LMULMAX1-RV64-NEXT: srli a1, a1, 2			; LMULMAX1-RV64-NEXT: srli a1, a1, 2
	; LMULMAX1-RV64-NEXT: and a1, a1, a3			; LMULMAX1-RV64-NEXT: and a1, a1, a3
	; LMULMAX1-RV64-NEXT: add a1, a2, a1			; LMULMAX1-RV64-NEXT: add a1, a2, a1
	; LMULMAX1-RV64-NEXT: srli a2, a1, 4			; LMULMAX1-RV64-NEXT: srli a2, a1, 4
	; LMULMAX1-RV64-NEXT: add a1, a1, a2			; LMULMAX1-RV64-NEXT: add a1, a1, a2
	; LMULMAX1-RV64-NEXT: and a1, a1, a4			; LMULMAX1-RV64-NEXT: and a1, a1, a4
	; LMULMAX1-RV64-NEXT: mul a1, a1, a5			; LMULMAX1-RV64-NEXT: mul a1, a1, a5
	; LMULMAX1-RV64-NEXT: srli a1, a1, 56			; LMULMAX1-RV64-NEXT: srli a1, a1, 56
	; LMULMAX1-RV64-NEXT: addi a1, a1, -56			; LMULMAX1-RV64-NEXT: addiw a1, a1, -56
	; LMULMAX1-RV64-NEXT: sb a1, 33(sp)			; LMULMAX1-RV64-NEXT: sb a1, 33(sp)
	; LMULMAX1-RV64-NEXT: vmv.x.s a1, v25			; LMULMAX1-RV64-NEXT: vmv.x.s a1, v25
	; LMULMAX1-RV64-NEXT: andi a1, a1, 255			; LMULMAX1-RV64-NEXT: andi a1, a1, 255
	; LMULMAX1-RV64-NEXT: srli a2, a1, 1			; LMULMAX1-RV64-NEXT: srli a2, a1, 1
	; LMULMAX1-RV64-NEXT: or a1, a1, a2			; LMULMAX1-RV64-NEXT: or a1, a1, a2
	; LMULMAX1-RV64-NEXT: srli a2, a1, 2			; LMULMAX1-RV64-NEXT: srli a2, a1, 2
	; LMULMAX1-RV64-NEXT: or a1, a1, a2			; LMULMAX1-RV64-NEXT: or a1, a1, a2
	; LMULMAX1-RV64-NEXT: srli a2, a1, 4			; LMULMAX1-RV64-NEXT: srli a2, a1, 4
	Show All 12 Lines
	; LMULMAX1-RV64-NEXT: srli a1, a1, 2			; LMULMAX1-RV64-NEXT: srli a1, a1, 2
	; LMULMAX1-RV64-NEXT: and a1, a1, a3			; LMULMAX1-RV64-NEXT: and a1, a1, a3
	; LMULMAX1-RV64-NEXT: add a1, a2, a1			; LMULMAX1-RV64-NEXT: add a1, a2, a1
	; LMULMAX1-RV64-NEXT: srli a2, a1, 4			; LMULMAX1-RV64-NEXT: srli a2, a1, 4
	; LMULMAX1-RV64-NEXT: add a1, a1, a2			; LMULMAX1-RV64-NEXT: add a1, a1, a2
	; LMULMAX1-RV64-NEXT: and a1, a1, a4			; LMULMAX1-RV64-NEXT: and a1, a1, a4
	; LMULMAX1-RV64-NEXT: mul a1, a1, a5			; LMULMAX1-RV64-NEXT: mul a1, a1, a5
	; LMULMAX1-RV64-NEXT: srli a1, a1, 56			; LMULMAX1-RV64-NEXT: srli a1, a1, 56
	; LMULMAX1-RV64-NEXT: addi a1, a1, -56			; LMULMAX1-RV64-NEXT: addiw a1, a1, -56
	; LMULMAX1-RV64-NEXT: sb a1, 16(sp)			; LMULMAX1-RV64-NEXT: sb a1, 16(sp)
	; LMULMAX1-RV64-NEXT: vslidedown.vi v26, v25, 15			; LMULMAX1-RV64-NEXT: vslidedown.vi v26, v25, 15
	; LMULMAX1-RV64-NEXT: vmv.x.s a1, v26			; LMULMAX1-RV64-NEXT: vmv.x.s a1, v26
	; LMULMAX1-RV64-NEXT: andi a1, a1, 255			; LMULMAX1-RV64-NEXT: andi a1, a1, 255
	; LMULMAX1-RV64-NEXT: srli a2, a1, 1			; LMULMAX1-RV64-NEXT: srli a2, a1, 1
	; LMULMAX1-RV64-NEXT: or a1, a1, a2			; LMULMAX1-RV64-NEXT: or a1, a1, a2
	; LMULMAX1-RV64-NEXT: srli a2, a1, 2			; LMULMAX1-RV64-NEXT: srli a2, a1, 2
	; LMULMAX1-RV64-NEXT: or a1, a1, a2			; LMULMAX1-RV64-NEXT: or a1, a1, a2
	Show All 13 Lines
	; LMULMAX1-RV64-NEXT: srli a1, a1, 2			; LMULMAX1-RV64-NEXT: srli a1, a1, 2
	; LMULMAX1-RV64-NEXT: and a1, a1, a3			; LMULMAX1-RV64-NEXT: and a1, a1, a3
	; LMULMAX1-RV64-NEXT: add a1, a2, a1			; LMULMAX1-RV64-NEXT: add a1, a2, a1
	; LMULMAX1-RV64-NEXT: srli a2, a1, 4			; LMULMAX1-RV64-NEXT: srli a2, a1, 4
	; LMULMAX1-RV64-NEXT: add a1, a1, a2			; LMULMAX1-RV64-NEXT: add a1, a1, a2
	; LMULMAX1-RV64-NEXT: and a1, a1, a4			; LMULMAX1-RV64-NEXT: and a1, a1, a4
	; LMULMAX1-RV64-NEXT: mul a1, a1, a5			; LMULMAX1-RV64-NEXT: mul a1, a1, a5
	; LMULMAX1-RV64-NEXT: srli a1, a1, 56			; LMULMAX1-RV64-NEXT: srli a1, a1, 56
	; LMULMAX1-RV64-NEXT: addi a1, a1, -56			; LMULMAX1-RV64-NEXT: addiw a1, a1, -56
	; LMULMAX1-RV64-NEXT: sb a1, 31(sp)			; LMULMAX1-RV64-NEXT: sb a1, 31(sp)
	; LMULMAX1-RV64-NEXT: vslidedown.vi v26, v25, 14			; LMULMAX1-RV64-NEXT: vslidedown.vi v26, v25, 14
	; LMULMAX1-RV64-NEXT: vmv.x.s a1, v26			; LMULMAX1-RV64-NEXT: vmv.x.s a1, v26
	; LMULMAX1-RV64-NEXT: andi a1, a1, 255			; LMULMAX1-RV64-NEXT: andi a1, a1, 255
	; LMULMAX1-RV64-NEXT: srli a2, a1, 1			; LMULMAX1-RV64-NEXT: srli a2, a1, 1
	; LMULMAX1-RV64-NEXT: or a1, a1, a2			; LMULMAX1-RV64-NEXT: or a1, a1, a2
	; LMULMAX1-RV64-NEXT: srli a2, a1, 2			; LMULMAX1-RV64-NEXT: srli a2, a1, 2
	; LMULMAX1-RV64-NEXT: or a1, a1, a2			; LMULMAX1-RV64-NEXT: or a1, a1, a2
	Show All 13 Lines
	; LMULMAX1-RV64-NEXT: srli a1, a1, 2			; LMULMAX1-RV64-NEXT: srli a1, a1, 2
	; LMULMAX1-RV64-NEXT: and a1, a1, a3			; LMULMAX1-RV64-NEXT: and a1, a1, a3
	; LMULMAX1-RV64-NEXT: add a1, a2, a1			; LMULMAX1-RV64-NEXT: add a1, a2, a1
	; LMULMAX1-RV64-NEXT: srli a2, a1, 4			; LMULMAX1-RV64-NEXT: srli a2, a1, 4
	; LMULMAX1-RV64-NEXT: add a1, a1, a2			; LMULMAX1-RV64-NEXT: add a1, a1, a2
	; LMULMAX1-RV64-NEXT: and a1, a1, a4			; LMULMAX1-RV64-NEXT: and a1, a1, a4
	; LMULMAX1-RV64-NEXT: mul a1, a1, a5			; LMULMAX1-RV64-NEXT: mul a1, a1, a5
	; LMULMAX1-RV64-NEXT: srli a1, a1, 56			; LMULMAX1-RV64-NEXT: srli a1, a1, 56
	; LMULMAX1-RV64-NEXT: addi a1, a1, -56			; LMULMAX1-RV64-NEXT: addiw a1, a1, -56
	; LMULMAX1-RV64-NEXT: sb a1, 30(sp)			; LMULMAX1-RV64-NEXT: sb a1, 30(sp)
	; LMULMAX1-RV64-NEXT: vslidedown.vi v26, v25, 13			; LMULMAX1-RV64-NEXT: vslidedown.vi v26, v25, 13
	; LMULMAX1-RV64-NEXT: vmv.x.s a1, v26			; LMULMAX1-RV64-NEXT: vmv.x.s a1, v26
	; LMULMAX1-RV64-NEXT: andi a1, a1, 255			; LMULMAX1-RV64-NEXT: andi a1, a1, 255
	; LMULMAX1-RV64-NEXT: srli a2, a1, 1			; LMULMAX1-RV64-NEXT: srli a2, a1, 1
	; LMULMAX1-RV64-NEXT: or a1, a1, a2			; LMULMAX1-RV64-NEXT: or a1, a1, a2
	; LMULMAX1-RV64-NEXT: srli a2, a1, 2			; LMULMAX1-RV64-NEXT: srli a2, a1, 2
	; LMULMAX1-RV64-NEXT: or a1, a1, a2			; LMULMAX1-RV64-NEXT: or a1, a1, a2
	Show All 13 Lines
	; LMULMAX1-RV64-NEXT: srli a1, a1, 2			; LMULMAX1-RV64-NEXT: srli a1, a1, 2
	; LMULMAX1-RV64-NEXT: and a1, a1, a3			; LMULMAX1-RV64-NEXT: and a1, a1, a3
	; LMULMAX1-RV64-NEXT: add a1, a2, a1			; LMULMAX1-RV64-NEXT: add a1, a2, a1
	; LMULMAX1-RV64-NEXT: srli a2, a1, 4			; LMULMAX1-RV64-NEXT: srli a2, a1, 4
	; LMULMAX1-RV64-NEXT: add a1, a1, a2			; LMULMAX1-RV64-NEXT: add a1, a1, a2
	; LMULMAX1-RV64-NEXT: and a1, a1, a4			; LMULMAX1-RV64-NEXT: and a1, a1, a4
	; LMULMAX1-RV64-NEXT: mul a1, a1, a5			; LMULMAX1-RV64-NEXT: mul a1, a1, a5
	; LMULMAX1-RV64-NEXT: srli a1, a1, 56			; LMULMAX1-RV64-NEXT: srli a1, a1, 56
	; LMULMAX1-RV64-NEXT: addi a1, a1, -56			; LMULMAX1-RV64-NEXT: addiw a1, a1, -56
	; LMULMAX1-RV64-NEXT: sb a1, 29(sp)			; LMULMAX1-RV64-NEXT: sb a1, 29(sp)
	; LMULMAX1-RV64-NEXT: vslidedown.vi v26, v25, 12			; LMULMAX1-RV64-NEXT: vslidedown.vi v26, v25, 12
	; LMULMAX1-RV64-NEXT: vmv.x.s a1, v26			; LMULMAX1-RV64-NEXT: vmv.x.s a1, v26
	; LMULMAX1-RV64-NEXT: andi a1, a1, 255			; LMULMAX1-RV64-NEXT: andi a1, a1, 255
	; LMULMAX1-RV64-NEXT: srli a2, a1, 1			; LMULMAX1-RV64-NEXT: srli a2, a1, 1
	; LMULMAX1-RV64-NEXT: or a1, a1, a2			; LMULMAX1-RV64-NEXT: or a1, a1, a2
	; LMULMAX1-RV64-NEXT: srli a2, a1, 2			; LMULMAX1-RV64-NEXT: srli a2, a1, 2
	; LMULMAX1-RV64-NEXT: or a1, a1, a2			; LMULMAX1-RV64-NEXT: or a1, a1, a2
	Show All 13 Lines
	; LMULMAX1-RV64-NEXT: srli a1, a1, 2			; LMULMAX1-RV64-NEXT: srli a1, a1, 2
	; LMULMAX1-RV64-NEXT: and a1, a1, a3			; LMULMAX1-RV64-NEXT: and a1, a1, a3
	; LMULMAX1-RV64-NEXT: add a1, a2, a1			; LMULMAX1-RV64-NEXT: add a1, a2, a1
	; LMULMAX1-RV64-NEXT: srli a2, a1, 4			; LMULMAX1-RV64-NEXT: srli a2, a1, 4
	; LMULMAX1-RV64-NEXT: add a1, a1, a2			; LMULMAX1-RV64-NEXT: add a1, a1, a2
	; LMULMAX1-RV64-NEXT: and a1, a1, a4			; LMULMAX1-RV64-NEXT: and a1, a1, a4
	; LMULMAX1-RV64-NEXT: mul a1, a1, a5			; LMULMAX1-RV64-NEXT: mul a1, a1, a5
	; LMULMAX1-RV64-NEXT: srli a1, a1, 56			; LMULMAX1-RV64-NEXT: srli a1, a1, 56
	; LMULMAX1-RV64-NEXT: addi a1, a1, -56			; LMULMAX1-RV64-NEXT: addiw a1, a1, -56
	; LMULMAX1-RV64-NEXT: sb a1, 28(sp)			; LMULMAX1-RV64-NEXT: sb a1, 28(sp)
	; LMULMAX1-RV64-NEXT: vslidedown.vi v26, v25, 11			; LMULMAX1-RV64-NEXT: vslidedown.vi v26, v25, 11
	; LMULMAX1-RV64-NEXT: vmv.x.s a1, v26			; LMULMAX1-RV64-NEXT: vmv.x.s a1, v26
	; LMULMAX1-RV64-NEXT: andi a1, a1, 255			; LMULMAX1-RV64-NEXT: andi a1, a1, 255
	; LMULMAX1-RV64-NEXT: srli a2, a1, 1			; LMULMAX1-RV64-NEXT: srli a2, a1, 1
	; LMULMAX1-RV64-NEXT: or a1, a1, a2			; LMULMAX1-RV64-NEXT: or a1, a1, a2
	; LMULMAX1-RV64-NEXT: srli a2, a1, 2			; LMULMAX1-RV64-NEXT: srli a2, a1, 2
	; LMULMAX1-RV64-NEXT: or a1, a1, a2			; LMULMAX1-RV64-NEXT: or a1, a1, a2
	Show All 13 Lines
	; LMULMAX1-RV64-NEXT: srli a1, a1, 2			; LMULMAX1-RV64-NEXT: srli a1, a1, 2
	; LMULMAX1-RV64-NEXT: and a1, a1, a3			; LMULMAX1-RV64-NEXT: and a1, a1, a3
	; LMULMAX1-RV64-NEXT: add a1, a2, a1			; LMULMAX1-RV64-NEXT: add a1, a2, a1
	; LMULMAX1-RV64-NEXT: srli a2, a1, 4			; LMULMAX1-RV64-NEXT: srli a2, a1, 4
	; LMULMAX1-RV64-NEXT: add a1, a1, a2			; LMULMAX1-RV64-NEXT: add a1, a1, a2
	; LMULMAX1-RV64-NEXT: and a1, a1, a4			; LMULMAX1-RV64-NEXT: and a1, a1, a4
	; LMULMAX1-RV64-NEXT: mul a1, a1, a5			; LMULMAX1-RV64-NEXT: mul a1, a1, a5
	; LMULMAX1-RV64-NEXT: srli a1, a1, 56			; LMULMAX1-RV64-NEXT: srli a1, a1, 56
	; LMULMAX1-RV64-NEXT: addi a1, a1, -56			; LMULMAX1-RV64-NEXT: addiw a1, a1, -56
	; LMULMAX1-RV64-NEXT: sb a1, 27(sp)			; LMULMAX1-RV64-NEXT: sb a1, 27(sp)
	; LMULMAX1-RV64-NEXT: vslidedown.vi v26, v25, 10			; LMULMAX1-RV64-NEXT: vslidedown.vi v26, v25, 10
	; LMULMAX1-RV64-NEXT: vmv.x.s a1, v26			; LMULMAX1-RV64-NEXT: vmv.x.s a1, v26
	; LMULMAX1-RV64-NEXT: andi a1, a1, 255			; LMULMAX1-RV64-NEXT: andi a1, a1, 255
	; LMULMAX1-RV64-NEXT: srli a2, a1, 1			; LMULMAX1-RV64-NEXT: srli a2, a1, 1
	; LMULMAX1-RV64-NEXT: or a1, a1, a2			; LMULMAX1-RV64-NEXT: or a1, a1, a2
	; LMULMAX1-RV64-NEXT: srli a2, a1, 2			; LMULMAX1-RV64-NEXT: srli a2, a1, 2
	; LMULMAX1-RV64-NEXT: or a1, a1, a2			; LMULMAX1-RV64-NEXT: or a1, a1, a2
	Show All 13 Lines
	; LMULMAX1-RV64-NEXT: srli a1, a1, 2			; LMULMAX1-RV64-NEXT: srli a1, a1, 2
	; LMULMAX1-RV64-NEXT: and a1, a1, a3			; LMULMAX1-RV64-NEXT: and a1, a1, a3
	; LMULMAX1-RV64-NEXT: add a1, a2, a1			; LMULMAX1-RV64-NEXT: add a1, a2, a1
	; LMULMAX1-RV64-NEXT: srli a2, a1, 4			; LMULMAX1-RV64-NEXT: srli a2, a1, 4
	; LMULMAX1-RV64-NEXT: add a1, a1, a2			; LMULMAX1-RV64-NEXT: add a1, a1, a2
	; LMULMAX1-RV64-NEXT: and a1, a1, a4			; LMULMAX1-RV64-NEXT: and a1, a1, a4
	; LMULMAX1-RV64-NEXT: mul a1, a1, a5			; LMULMAX1-RV64-NEXT: mul a1, a1, a5
	; LMULMAX1-RV64-NEXT: srli a1, a1, 56			; LMULMAX1-RV64-NEXT: srli a1, a1, 56
	; LMULMAX1-RV64-NEXT: addi a1, a1, -56			; LMULMAX1-RV64-NEXT: addiw a1, a1, -56
	; LMULMAX1-RV64-NEXT: sb a1, 26(sp)			; LMULMAX1-RV64-NEXT: sb a1, 26(sp)
	; LMULMAX1-RV64-NEXT: vslidedown.vi v26, v25, 9			; LMULMAX1-RV64-NEXT: vslidedown.vi v26, v25, 9
	; LMULMAX1-RV64-NEXT: vmv.x.s a1, v26			; LMULMAX1-RV64-NEXT: vmv.x.s a1, v26
	; LMULMAX1-RV64-NEXT: andi a1, a1, 255			; LMULMAX1-RV64-NEXT: andi a1, a1, 255
	; LMULMAX1-RV64-NEXT: srli a2, a1, 1			; LMULMAX1-RV64-NEXT: srli a2, a1, 1
	; LMULMAX1-RV64-NEXT: or a1, a1, a2			; LMULMAX1-RV64-NEXT: or a1, a1, a2
	; LMULMAX1-RV64-NEXT: srli a2, a1, 2			; LMULMAX1-RV64-NEXT: srli a2, a1, 2
	; LMULMAX1-RV64-NEXT: or a1, a1, a2			; LMULMAX1-RV64-NEXT: or a1, a1, a2
	Show All 13 Lines
	; LMULMAX1-RV64-NEXT: srli a1, a1, 2			; LMULMAX1-RV64-NEXT: srli a1, a1, 2
	; LMULMAX1-RV64-NEXT: and a1, a1, a3			; LMULMAX1-RV64-NEXT: and a1, a1, a3
	; LMULMAX1-RV64-NEXT: add a1, a2, a1			; LMULMAX1-RV64-NEXT: add a1, a2, a1
	; LMULMAX1-RV64-NEXT: srli a2, a1, 4			; LMULMAX1-RV64-NEXT: srli a2, a1, 4
	; LMULMAX1-RV64-NEXT: add a1, a1, a2			; LMULMAX1-RV64-NEXT: add a1, a1, a2
	; LMULMAX1-RV64-NEXT: and a1, a1, a4			; LMULMAX1-RV64-NEXT: and a1, a1, a4
	; LMULMAX1-RV64-NEXT: mul a1, a1, a5			; LMULMAX1-RV64-NEXT: mul a1, a1, a5
	; LMULMAX1-RV64-NEXT: srli a1, a1, 56			; LMULMAX1-RV64-NEXT: srli a1, a1, 56
	; LMULMAX1-RV64-NEXT: addi a1, a1, -56			; LMULMAX1-RV64-NEXT: addiw a1, a1, -56
	; LMULMAX1-RV64-NEXT: sb a1, 25(sp)			; LMULMAX1-RV64-NEXT: sb a1, 25(sp)
	; LMULMAX1-RV64-NEXT: vslidedown.vi v26, v25, 8			; LMULMAX1-RV64-NEXT: vslidedown.vi v26, v25, 8
	; LMULMAX1-RV64-NEXT: vmv.x.s a1, v26			; LMULMAX1-RV64-NEXT: vmv.x.s a1, v26
	; LMULMAX1-RV64-NEXT: andi a1, a1, 255			; LMULMAX1-RV64-NEXT: andi a1, a1, 255
	; LMULMAX1-RV64-NEXT: srli a2, a1, 1			; LMULMAX1-RV64-NEXT: srli a2, a1, 1
	; LMULMAX1-RV64-NEXT: or a1, a1, a2			; LMULMAX1-RV64-NEXT: or a1, a1, a2
	; LMULMAX1-RV64-NEXT: srli a2, a1, 2			; LMULMAX1-RV64-NEXT: srli a2, a1, 2
	; LMULMAX1-RV64-NEXT: or a1, a1, a2			; LMULMAX1-RV64-NEXT: or a1, a1, a2
	Show All 13 Lines
	; LMULMAX1-RV64-NEXT: srli a1, a1, 2			; LMULMAX1-RV64-NEXT: srli a1, a1, 2
	; LMULMAX1-RV64-NEXT: and a1, a1, a3			; LMULMAX1-RV64-NEXT: and a1, a1, a3
	; LMULMAX1-RV64-NEXT: add a1, a2, a1			; LMULMAX1-RV64-NEXT: add a1, a2, a1
	; LMULMAX1-RV64-NEXT: srli a2, a1, 4			; LMULMAX1-RV64-NEXT: srli a2, a1, 4
	; LMULMAX1-RV64-NEXT: add a1, a1, a2			; LMULMAX1-RV64-NEXT: add a1, a1, a2
	; LMULMAX1-RV64-NEXT: and a1, a1, a4			; LMULMAX1-RV64-NEXT: and a1, a1, a4
	; LMULMAX1-RV64-NEXT: mul a1, a1, a5			; LMULMAX1-RV64-NEXT: mul a1, a1, a5
	; LMULMAX1-RV64-NEXT: srli a1, a1, 56			; LMULMAX1-RV64-NEXT: srli a1, a1, 56
	; LMULMAX1-RV64-NEXT: addi a1, a1, -56			; LMULMAX1-RV64-NEXT: addiw a1, a1, -56
	; LMULMAX1-RV64-NEXT: sb a1, 24(sp)			; LMULMAX1-RV64-NEXT: sb a1, 24(sp)
	; LMULMAX1-RV64-NEXT: vslidedown.vi v26, v25, 7			; LMULMAX1-RV64-NEXT: vslidedown.vi v26, v25, 7
	; LMULMAX1-RV64-NEXT: vmv.x.s a1, v26			; LMULMAX1-RV64-NEXT: vmv.x.s a1, v26
	; LMULMAX1-RV64-NEXT: andi a1, a1, 255			; LMULMAX1-RV64-NEXT: andi a1, a1, 255
	; LMULMAX1-RV64-NEXT: srli a2, a1, 1			; LMULMAX1-RV64-NEXT: srli a2, a1, 1
	; LMULMAX1-RV64-NEXT: or a1, a1, a2			; LMULMAX1-RV64-NEXT: or a1, a1, a2
	; LMULMAX1-RV64-NEXT: srli a2, a1, 2			; LMULMAX1-RV64-NEXT: srli a2, a1, 2
	; LMULMAX1-RV64-NEXT: or a1, a1, a2			; LMULMAX1-RV64-NEXT: or a1, a1, a2
	Show All 13 Lines
	; LMULMAX1-RV64-NEXT: srli a1, a1, 2			; LMULMAX1-RV64-NEXT: srli a1, a1, 2
	; LMULMAX1-RV64-NEXT: and a1, a1, a3			; LMULMAX1-RV64-NEXT: and a1, a1, a3
	; LMULMAX1-RV64-NEXT: add a1, a2, a1			; LMULMAX1-RV64-NEXT: add a1, a2, a1
	; LMULMAX1-RV64-NEXT: srli a2, a1, 4			; LMULMAX1-RV64-NEXT: srli a2, a1, 4
	; LMULMAX1-RV64-NEXT: add a1, a1, a2			; LMULMAX1-RV64-NEXT: add a1, a1, a2
	; LMULMAX1-RV64-NEXT: and a1, a1, a4			; LMULMAX1-RV64-NEXT: and a1, a1, a4
	; LMULMAX1-RV64-NEXT: mul a1, a1, a5			; LMULMAX1-RV64-NEXT: mul a1, a1, a5
	; LMULMAX1-RV64-NEXT: srli a1, a1, 56			; LMULMAX1-RV64-NEXT: srli a1, a1, 56
	; LMULMAX1-RV64-NEXT: addi a1, a1, -56			; LMULMAX1-RV64-NEXT: addiw a1, a1, -56
	; LMULMAX1-RV64-NEXT: sb a1, 23(sp)			; LMULMAX1-RV64-NEXT: sb a1, 23(sp)
	; LMULMAX1-RV64-NEXT: vslidedown.vi v26, v25, 6			; LMULMAX1-RV64-NEXT: vslidedown.vi v26, v25, 6
	; LMULMAX1-RV64-NEXT: vmv.x.s a1, v26			; LMULMAX1-RV64-NEXT: vmv.x.s a1, v26
	; LMULMAX1-RV64-NEXT: andi a1, a1, 255			; LMULMAX1-RV64-NEXT: andi a1, a1, 255
	; LMULMAX1-RV64-NEXT: srli a2, a1, 1			; LMULMAX1-RV64-NEXT: srli a2, a1, 1
	; LMULMAX1-RV64-NEXT: or a1, a1, a2			; LMULMAX1-RV64-NEXT: or a1, a1, a2
	; LMULMAX1-RV64-NEXT: srli a2, a1, 2			; LMULMAX1-RV64-NEXT: srli a2, a1, 2
	; LMULMAX1-RV64-NEXT: or a1, a1, a2			; LMULMAX1-RV64-NEXT: or a1, a1, a2
	Show All 13 Lines
	; LMULMAX1-RV64-NEXT: srli a1, a1, 2			; LMULMAX1-RV64-NEXT: srli a1, a1, 2
	; LMULMAX1-RV64-NEXT: and a1, a1, a3			; LMULMAX1-RV64-NEXT: and a1, a1, a3
	; LMULMAX1-RV64-NEXT: add a1, a2, a1			; LMULMAX1-RV64-NEXT: add a1, a2, a1
	; LMULMAX1-RV64-NEXT: srli a2, a1, 4			; LMULMAX1-RV64-NEXT: srli a2, a1, 4
	; LMULMAX1-RV64-NEXT: add a1, a1, a2			; LMULMAX1-RV64-NEXT: add a1, a1, a2
	; LMULMAX1-RV64-NEXT: and a1, a1, a4			; LMULMAX1-RV64-NEXT: and a1, a1, a4
	; LMULMAX1-RV64-NEXT: mul a1, a1, a5			; LMULMAX1-RV64-NEXT: mul a1, a1, a5
	; LMULMAX1-RV64-NEXT: srli a1, a1, 56			; LMULMAX1-RV64-NEXT: srli a1, a1, 56
	; LMULMAX1-RV64-NEXT: addi a1, a1, -56			; LMULMAX1-RV64-NEXT: addiw a1, a1, -56
	; LMULMAX1-RV64-NEXT: sb a1, 22(sp)			; LMULMAX1-RV64-NEXT: sb a1, 22(sp)
	; LMULMAX1-RV64-NEXT: vslidedown.vi v26, v25, 5			; LMULMAX1-RV64-NEXT: vslidedown.vi v26, v25, 5
	; LMULMAX1-RV64-NEXT: vmv.x.s a1, v26			; LMULMAX1-RV64-NEXT: vmv.x.s a1, v26
	; LMULMAX1-RV64-NEXT: andi a1, a1, 255			; LMULMAX1-RV64-NEXT: andi a1, a1, 255
	; LMULMAX1-RV64-NEXT: srli a2, a1, 1			; LMULMAX1-RV64-NEXT: srli a2, a1, 1
	; LMULMAX1-RV64-NEXT: or a1, a1, a2			; LMULMAX1-RV64-NEXT: or a1, a1, a2
	; LMULMAX1-RV64-NEXT: srli a2, a1, 2			; LMULMAX1-RV64-NEXT: srli a2, a1, 2
	; LMULMAX1-RV64-NEXT: or a1, a1, a2			; LMULMAX1-RV64-NEXT: or a1, a1, a2
	Show All 13 Lines
	; LMULMAX1-RV64-NEXT: srli a1, a1, 2			; LMULMAX1-RV64-NEXT: srli a1, a1, 2
	; LMULMAX1-RV64-NEXT: and a1, a1, a3			; LMULMAX1-RV64-NEXT: and a1, a1, a3
	; LMULMAX1-RV64-NEXT: add a1, a2, a1			; LMULMAX1-RV64-NEXT: add a1, a2, a1
	; LMULMAX1-RV64-NEXT: srli a2, a1, 4			; LMULMAX1-RV64-NEXT: srli a2, a1, 4
	; LMULMAX1-RV64-NEXT: add a1, a1, a2			; LMULMAX1-RV64-NEXT: add a1, a1, a2
	; LMULMAX1-RV64-NEXT: and a1, a1, a4			; LMULMAX1-RV64-NEXT: and a1, a1, a4
	; LMULMAX1-RV64-NEXT: mul a1, a1, a5			; LMULMAX1-RV64-NEXT: mul a1, a1, a5
	; LMULMAX1-RV64-NEXT: srli a1, a1, 56			; LMULMAX1-RV64-NEXT: srli a1, a1, 56
	; LMULMAX1-RV64-NEXT: addi a1, a1, -56			; LMULMAX1-RV64-NEXT: addiw a1, a1, -56
	; LMULMAX1-RV64-NEXT: sb a1, 21(sp)			; LMULMAX1-RV64-NEXT: sb a1, 21(sp)
	; LMULMAX1-RV64-NEXT: vslidedown.vi v26, v25, 4			; LMULMAX1-RV64-NEXT: vslidedown.vi v26, v25, 4
	; LMULMAX1-RV64-NEXT: vmv.x.s a1, v26			; LMULMAX1-RV64-NEXT: vmv.x.s a1, v26
	; LMULMAX1-RV64-NEXT: andi a1, a1, 255			; LMULMAX1-RV64-NEXT: andi a1, a1, 255
	; LMULMAX1-RV64-NEXT: srli a2, a1, 1			; LMULMAX1-RV64-NEXT: srli a2, a1, 1
	; LMULMAX1-RV64-NEXT: or a1, a1, a2			; LMULMAX1-RV64-NEXT: or a1, a1, a2
	; LMULMAX1-RV64-NEXT: srli a2, a1, 2			; LMULMAX1-RV64-NEXT: srli a2, a1, 2
	; LMULMAX1-RV64-NEXT: or a1, a1, a2			; LMULMAX1-RV64-NEXT: or a1, a1, a2
	Show All 13 Lines
	; LMULMAX1-RV64-NEXT: srli a1, a1, 2			; LMULMAX1-RV64-NEXT: srli a1, a1, 2
	; LMULMAX1-RV64-NEXT: and a1, a1, a3			; LMULMAX1-RV64-NEXT: and a1, a1, a3
	; LMULMAX1-RV64-NEXT: add a1, a2, a1			; LMULMAX1-RV64-NEXT: add a1, a2, a1
	; LMULMAX1-RV64-NEXT: srli a2, a1, 4			; LMULMAX1-RV64-NEXT: srli a2, a1, 4
	; LMULMAX1-RV64-NEXT: add a1, a1, a2			; LMULMAX1-RV64-NEXT: add a1, a1, a2
	; LMULMAX1-RV64-NEXT: and a1, a1, a4			; LMULMAX1-RV64-NEXT: and a1, a1, a4
	; LMULMAX1-RV64-NEXT: mul a1, a1, a5			; LMULMAX1-RV64-NEXT: mul a1, a1, a5
	; LMULMAX1-RV64-NEXT: srli a1, a1, 56			; LMULMAX1-RV64-NEXT: srli a1, a1, 56
	; LMULMAX1-RV64-NEXT: addi a1, a1, -56			; LMULMAX1-RV64-NEXT: addiw a1, a1, -56
	; LMULMAX1-RV64-NEXT: sb a1, 20(sp)			; LMULMAX1-RV64-NEXT: sb a1, 20(sp)
	; LMULMAX1-RV64-NEXT: vslidedown.vi v26, v25, 3			; LMULMAX1-RV64-NEXT: vslidedown.vi v26, v25, 3
	; LMULMAX1-RV64-NEXT: vmv.x.s a1, v26			; LMULMAX1-RV64-NEXT: vmv.x.s a1, v26
	; LMULMAX1-RV64-NEXT: andi a1, a1, 255			; LMULMAX1-RV64-NEXT: andi a1, a1, 255
	; LMULMAX1-RV64-NEXT: srli a2, a1, 1			; LMULMAX1-RV64-NEXT: srli a2, a1, 1
	; LMULMAX1-RV64-NEXT: or a1, a1, a2			; LMULMAX1-RV64-NEXT: or a1, a1, a2
	; LMULMAX1-RV64-NEXT: srli a2, a1, 2			; LMULMAX1-RV64-NEXT: srli a2, a1, 2
	; LMULMAX1-RV64-NEXT: or a1, a1, a2			; LMULMAX1-RV64-NEXT: or a1, a1, a2
	Show All 13 Lines
	; LMULMAX1-RV64-NEXT: srli a1, a1, 2			; LMULMAX1-RV64-NEXT: srli a1, a1, 2
	; LMULMAX1-RV64-NEXT: and a1, a1, a3			; LMULMAX1-RV64-NEXT: and a1, a1, a3
	; LMULMAX1-RV64-NEXT: add a1, a2, a1			; LMULMAX1-RV64-NEXT: add a1, a2, a1
	; LMULMAX1-RV64-NEXT: srli a2, a1, 4			; LMULMAX1-RV64-NEXT: srli a2, a1, 4
	; LMULMAX1-RV64-NEXT: add a1, a1, a2			; LMULMAX1-RV64-NEXT: add a1, a1, a2
	; LMULMAX1-RV64-NEXT: and a1, a1, a4			; LMULMAX1-RV64-NEXT: and a1, a1, a4
	; LMULMAX1-RV64-NEXT: mul a1, a1, a5			; LMULMAX1-RV64-NEXT: mul a1, a1, a5
	; LMULMAX1-RV64-NEXT: srli a1, a1, 56			; LMULMAX1-RV64-NEXT: srli a1, a1, 56
	; LMULMAX1-RV64-NEXT: addi a1, a1, -56			; LMULMAX1-RV64-NEXT: addiw a1, a1, -56
	; LMULMAX1-RV64-NEXT: sb a1, 19(sp)			; LMULMAX1-RV64-NEXT: sb a1, 19(sp)
	; LMULMAX1-RV64-NEXT: vslidedown.vi v26, v25, 2			; LMULMAX1-RV64-NEXT: vslidedown.vi v26, v25, 2
	; LMULMAX1-RV64-NEXT: vmv.x.s a1, v26			; LMULMAX1-RV64-NEXT: vmv.x.s a1, v26
	; LMULMAX1-RV64-NEXT: andi a1, a1, 255			; LMULMAX1-RV64-NEXT: andi a1, a1, 255
	; LMULMAX1-RV64-NEXT: srli a2, a1, 1			; LMULMAX1-RV64-NEXT: srli a2, a1, 1
	; LMULMAX1-RV64-NEXT: or a1, a1, a2			; LMULMAX1-RV64-NEXT: or a1, a1, a2
	; LMULMAX1-RV64-NEXT: srli a2, a1, 2			; LMULMAX1-RV64-NEXT: srli a2, a1, 2
	; LMULMAX1-RV64-NEXT: or a1, a1, a2			; LMULMAX1-RV64-NEXT: or a1, a1, a2
	Show All 13 Lines
	; LMULMAX1-RV64-NEXT: srli a1, a1, 2			; LMULMAX1-RV64-NEXT: srli a1, a1, 2
	; LMULMAX1-RV64-NEXT: and a1, a1, a3			; LMULMAX1-RV64-NEXT: and a1, a1, a3
	; LMULMAX1-RV64-NEXT: add a1, a2, a1			; LMULMAX1-RV64-NEXT: add a1, a2, a1
	; LMULMAX1-RV64-NEXT: srli a2, a1, 4			; LMULMAX1-RV64-NEXT: srli a2, a1, 4
	; LMULMAX1-RV64-NEXT: add a1, a1, a2			; LMULMAX1-RV64-NEXT: add a1, a1, a2
	; LMULMAX1-RV64-NEXT: and a1, a1, a4			; LMULMAX1-RV64-NEXT: and a1, a1, a4
	; LMULMAX1-RV64-NEXT: mul a1, a1, a5			; LMULMAX1-RV64-NEXT: mul a1, a1, a5
	; LMULMAX1-RV64-NEXT: srli a1, a1, 56			; LMULMAX1-RV64-NEXT: srli a1, a1, 56
	; LMULMAX1-RV64-NEXT: addi a1, a1, -56			; LMULMAX1-RV64-NEXT: addiw a1, a1, -56
	; LMULMAX1-RV64-NEXT: sb a1, 18(sp)			; LMULMAX1-RV64-NEXT: sb a1, 18(sp)
	; LMULMAX1-RV64-NEXT: vslidedown.vi v25, v25, 1			; LMULMAX1-RV64-NEXT: vslidedown.vi v25, v25, 1
	; LMULMAX1-RV64-NEXT: vmv.x.s a1, v25			; LMULMAX1-RV64-NEXT: vmv.x.s a1, v25
	; LMULMAX1-RV64-NEXT: andi a1, a1, 255			; LMULMAX1-RV64-NEXT: andi a1, a1, 255
	; LMULMAX1-RV64-NEXT: srli a2, a1, 1			; LMULMAX1-RV64-NEXT: srli a2, a1, 1
	; LMULMAX1-RV64-NEXT: or a1, a1, a2			; LMULMAX1-RV64-NEXT: or a1, a1, a2
	; LMULMAX1-RV64-NEXT: srli a2, a1, 2			; LMULMAX1-RV64-NEXT: srli a2, a1, 2
	; LMULMAX1-RV64-NEXT: or a1, a1, a2			; LMULMAX1-RV64-NEXT: or a1, a1, a2
	Show All 13 Lines
	; LMULMAX1-RV64-NEXT: srli a1, a1, 2			; LMULMAX1-RV64-NEXT: srli a1, a1, 2
	; LMULMAX1-RV64-NEXT: and a1, a1, a3			; LMULMAX1-RV64-NEXT: and a1, a1, a3
	; LMULMAX1-RV64-NEXT: add a1, a2, a1			; LMULMAX1-RV64-NEXT: add a1, a2, a1
	; LMULMAX1-RV64-NEXT: srli a2, a1, 4			; LMULMAX1-RV64-NEXT: srli a2, a1, 4
	; LMULMAX1-RV64-NEXT: add a1, a1, a2			; LMULMAX1-RV64-NEXT: add a1, a1, a2
	; LMULMAX1-RV64-NEXT: and a1, a1, a4			; LMULMAX1-RV64-NEXT: and a1, a1, a4
	; LMULMAX1-RV64-NEXT: mul a1, a1, a5			; LMULMAX1-RV64-NEXT: mul a1, a1, a5
	; LMULMAX1-RV64-NEXT: srli a1, a1, 56			; LMULMAX1-RV64-NEXT: srli a1, a1, 56
	; LMULMAX1-RV64-NEXT: addi a1, a1, -56			; LMULMAX1-RV64-NEXT: addiw a1, a1, -56
	; LMULMAX1-RV64-NEXT: sb a1, 17(sp)			; LMULMAX1-RV64-NEXT: sb a1, 17(sp)
	; LMULMAX1-RV64-NEXT: vsetivli zero, 16, e8, m1, ta, mu			; LMULMAX1-RV64-NEXT: vsetivli zero, 16, e8, m1, ta, mu
	; LMULMAX1-RV64-NEXT: addi a1, sp, 16			; LMULMAX1-RV64-NEXT: addi a1, sp, 16
	; LMULMAX1-RV64-NEXT: vle8.v v25, (a1)			; LMULMAX1-RV64-NEXT: vle8.v v25, (a1)
	; LMULMAX1-RV64-NEXT: addi a1, sp, 32			; LMULMAX1-RV64-NEXT: addi a1, sp, 32
	; LMULMAX1-RV64-NEXT: vle8.v v26, (a1)			; LMULMAX1-RV64-NEXT: vle8.v v26, (a1)
	; LMULMAX1-RV64-NEXT: vse8.v v25, (a0)			; LMULMAX1-RV64-NEXT: vse8.v v25, (a0)
	; LMULMAX1-RV64-NEXT: vse8.v v26, (a6)			; LMULMAX1-RV64-NEXT: vse8.v v26, (a6)
	▲ Show 20 Lines • Show All 556 Lines • ▼ Show 20 Lines
	; LMULMAX2-RV64-NEXT: lui a5, 4112			; LMULMAX2-RV64-NEXT: lui a5, 4112
	; LMULMAX2-RV64-NEXT: addiw a5, a5, 257			; LMULMAX2-RV64-NEXT: addiw a5, a5, 257
	; LMULMAX2-RV64-NEXT: slli a5, a5, 16			; LMULMAX2-RV64-NEXT: slli a5, a5, 16
	; LMULMAX2-RV64-NEXT: addi a5, a5, 257			; LMULMAX2-RV64-NEXT: addi a5, a5, 257
	; LMULMAX2-RV64-NEXT: slli a5, a5, 16			; LMULMAX2-RV64-NEXT: slli a5, a5, 16
	; LMULMAX2-RV64-NEXT: addi a5, a5, 257			; LMULMAX2-RV64-NEXT: addi a5, a5, 257
	; LMULMAX2-RV64-NEXT: mul a1, a1, a5			; LMULMAX2-RV64-NEXT: mul a1, a1, a5
	; LMULMAX2-RV64-NEXT: srli a1, a1, 56			; LMULMAX2-RV64-NEXT: srli a1, a1, 56
	; LMULMAX2-RV64-NEXT: addi a1, a1, -48			; LMULMAX2-RV64-NEXT: addiw a1, a1, -48
	; LMULMAX2-RV64-NEXT: sh a1, 32(sp)			; LMULMAX2-RV64-NEXT: sh a1, 32(sp)
	; LMULMAX2-RV64-NEXT: vsetivli zero, 1, e16, m2, ta, mu			; LMULMAX2-RV64-NEXT: vsetivli zero, 1, e16, m2, ta, mu
	; LMULMAX2-RV64-NEXT: vslidedown.vi v28, v26, 15			; LMULMAX2-RV64-NEXT: vslidedown.vi v28, v26, 15
	; LMULMAX2-RV64-NEXT: vmv.x.s a1, v28			; LMULMAX2-RV64-NEXT: vmv.x.s a1, v28
	; LMULMAX2-RV64-NEXT: and a1, a1, a6			; LMULMAX2-RV64-NEXT: and a1, a1, a6
	; LMULMAX2-RV64-NEXT: srli a2, a1, 1			; LMULMAX2-RV64-NEXT: srli a2, a1, 1
	; LMULMAX2-RV64-NEXT: or a1, a1, a2			; LMULMAX2-RV64-NEXT: or a1, a1, a2
	; LMULMAX2-RV64-NEXT: srli a2, a1, 2			; LMULMAX2-RV64-NEXT: srli a2, a1, 2
	Show All 14 Lines
	; LMULMAX2-RV64-NEXT: srli a1, a1, 2			; LMULMAX2-RV64-NEXT: srli a1, a1, 2
	; LMULMAX2-RV64-NEXT: and a1, a1, a3			; LMULMAX2-RV64-NEXT: and a1, a1, a3
	; LMULMAX2-RV64-NEXT: add a1, a2, a1			; LMULMAX2-RV64-NEXT: add a1, a2, a1
	; LMULMAX2-RV64-NEXT: srli a2, a1, 4			; LMULMAX2-RV64-NEXT: srli a2, a1, 4
	; LMULMAX2-RV64-NEXT: add a1, a1, a2			; LMULMAX2-RV64-NEXT: add a1, a1, a2
	; LMULMAX2-RV64-NEXT: and a1, a1, a4			; LMULMAX2-RV64-NEXT: and a1, a1, a4
	; LMULMAX2-RV64-NEXT: mul a1, a1, a5			; LMULMAX2-RV64-NEXT: mul a1, a1, a5
	; LMULMAX2-RV64-NEXT: srli a1, a1, 56			; LMULMAX2-RV64-NEXT: srli a1, a1, 56
	; LMULMAX2-RV64-NEXT: addi a1, a1, -48			; LMULMAX2-RV64-NEXT: addiw a1, a1, -48
	; LMULMAX2-RV64-NEXT: sh a1, 62(sp)			; LMULMAX2-RV64-NEXT: sh a1, 62(sp)
	; LMULMAX2-RV64-NEXT: vslidedown.vi v28, v26, 14			; LMULMAX2-RV64-NEXT: vslidedown.vi v28, v26, 14
	; LMULMAX2-RV64-NEXT: vmv.x.s a1, v28			; LMULMAX2-RV64-NEXT: vmv.x.s a1, v28
	; LMULMAX2-RV64-NEXT: and a1, a1, a6			; LMULMAX2-RV64-NEXT: and a1, a1, a6
	; LMULMAX2-RV64-NEXT: srli a2, a1, 1			; LMULMAX2-RV64-NEXT: srli a2, a1, 1
	; LMULMAX2-RV64-NEXT: or a1, a1, a2			; LMULMAX2-RV64-NEXT: or a1, a1, a2
	; LMULMAX2-RV64-NEXT: srli a2, a1, 2			; LMULMAX2-RV64-NEXT: srli a2, a1, 2
	; LMULMAX2-RV64-NEXT: or a1, a1, a2			; LMULMAX2-RV64-NEXT: or a1, a1, a2
	Show All 13 Lines
	; LMULMAX2-RV64-NEXT: srli a1, a1, 2			; LMULMAX2-RV64-NEXT: srli a1, a1, 2
	; LMULMAX2-RV64-NEXT: and a1, a1, a3			; LMULMAX2-RV64-NEXT: and a1, a1, a3
	; LMULMAX2-RV64-NEXT: add a1, a2, a1			; LMULMAX2-RV64-NEXT: add a1, a2, a1
	; LMULMAX2-RV64-NEXT: srli a2, a1, 4			; LMULMAX2-RV64-NEXT: srli a2, a1, 4
	; LMULMAX2-RV64-NEXT: add a1, a1, a2			; LMULMAX2-RV64-NEXT: add a1, a1, a2
	; LMULMAX2-RV64-NEXT: and a1, a1, a4			; LMULMAX2-RV64-NEXT: and a1, a1, a4
	; LMULMAX2-RV64-NEXT: mul a1, a1, a5			; LMULMAX2-RV64-NEXT: mul a1, a1, a5
	; LMULMAX2-RV64-NEXT: srli a1, a1, 56			; LMULMAX2-RV64-NEXT: srli a1, a1, 56
	; LMULMAX2-RV64-NEXT: addi a1, a1, -48			; LMULMAX2-RV64-NEXT: addiw a1, a1, -48
	; LMULMAX2-RV64-NEXT: sh a1, 60(sp)			; LMULMAX2-RV64-NEXT: sh a1, 60(sp)
	; LMULMAX2-RV64-NEXT: vslidedown.vi v28, v26, 13			; LMULMAX2-RV64-NEXT: vslidedown.vi v28, v26, 13
	; LMULMAX2-RV64-NEXT: vmv.x.s a1, v28			; LMULMAX2-RV64-NEXT: vmv.x.s a1, v28
	; LMULMAX2-RV64-NEXT: and a1, a1, a6			; LMULMAX2-RV64-NEXT: and a1, a1, a6
	; LMULMAX2-RV64-NEXT: srli a2, a1, 1			; LMULMAX2-RV64-NEXT: srli a2, a1, 1
	; LMULMAX2-RV64-NEXT: or a1, a1, a2			; LMULMAX2-RV64-NEXT: or a1, a1, a2
	; LMULMAX2-RV64-NEXT: srli a2, a1, 2			; LMULMAX2-RV64-NEXT: srli a2, a1, 2
	; LMULMAX2-RV64-NEXT: or a1, a1, a2			; LMULMAX2-RV64-NEXT: or a1, a1, a2
	Show All 13 Lines
	; LMULMAX2-RV64-NEXT: srli a1, a1, 2			; LMULMAX2-RV64-NEXT: srli a1, a1, 2
	; LMULMAX2-RV64-NEXT: and a1, a1, a3			; LMULMAX2-RV64-NEXT: and a1, a1, a3
	; LMULMAX2-RV64-NEXT: add a1, a2, a1			; LMULMAX2-RV64-NEXT: add a1, a2, a1
	; LMULMAX2-RV64-NEXT: srli a2, a1, 4			; LMULMAX2-RV64-NEXT: srli a2, a1, 4
	; LMULMAX2-RV64-NEXT: add a1, a1, a2			; LMULMAX2-RV64-NEXT: add a1, a1, a2
	; LMULMAX2-RV64-NEXT: and a1, a1, a4			; LMULMAX2-RV64-NEXT: and a1, a1, a4
	; LMULMAX2-RV64-NEXT: mul a1, a1, a5			; LMULMAX2-RV64-NEXT: mul a1, a1, a5
	; LMULMAX2-RV64-NEXT: srli a1, a1, 56			; LMULMAX2-RV64-NEXT: srli a1, a1, 56
	; LMULMAX2-RV64-NEXT: addi a1, a1, -48			; LMULMAX2-RV64-NEXT: addiw a1, a1, -48
	; LMULMAX2-RV64-NEXT: sh a1, 58(sp)			; LMULMAX2-RV64-NEXT: sh a1, 58(sp)
	; LMULMAX2-RV64-NEXT: vslidedown.vi v28, v26, 12			; LMULMAX2-RV64-NEXT: vslidedown.vi v28, v26, 12
	; LMULMAX2-RV64-NEXT: vmv.x.s a1, v28			; LMULMAX2-RV64-NEXT: vmv.x.s a1, v28
	; LMULMAX2-RV64-NEXT: and a1, a1, a6			; LMULMAX2-RV64-NEXT: and a1, a1, a6
	; LMULMAX2-RV64-NEXT: srli a2, a1, 1			; LMULMAX2-RV64-NEXT: srli a2, a1, 1
	; LMULMAX2-RV64-NEXT: or a1, a1, a2			; LMULMAX2-RV64-NEXT: or a1, a1, a2
	; LMULMAX2-RV64-NEXT: srli a2, a1, 2			; LMULMAX2-RV64-NEXT: srli a2, a1, 2
	; LMULMAX2-RV64-NEXT: or a1, a1, a2			; LMULMAX2-RV64-NEXT: or a1, a1, a2
	Show All 13 Lines
	; LMULMAX2-RV64-NEXT: srli a1, a1, 2			; LMULMAX2-RV64-NEXT: srli a1, a1, 2
	; LMULMAX2-RV64-NEXT: and a1, a1, a3			; LMULMAX2-RV64-NEXT: and a1, a1, a3
	; LMULMAX2-RV64-NEXT: add a1, a2, a1			; LMULMAX2-RV64-NEXT: add a1, a2, a1
	; LMULMAX2-RV64-NEXT: srli a2, a1, 4			; LMULMAX2-RV64-NEXT: srli a2, a1, 4
	; LMULMAX2-RV64-NEXT: add a1, a1, a2			; LMULMAX2-RV64-NEXT: add a1, a1, a2
	; LMULMAX2-RV64-NEXT: and a1, a1, a4			; LMULMAX2-RV64-NEXT: and a1, a1, a4
	; LMULMAX2-RV64-NEXT: mul a1, a1, a5			; LMULMAX2-RV64-NEXT: mul a1, a1, a5
	; LMULMAX2-RV64-NEXT: srli a1, a1, 56			; LMULMAX2-RV64-NEXT: srli a1, a1, 56
	; LMULMAX2-RV64-NEXT: addi a1, a1, -48			; LMULMAX2-RV64-NEXT: addiw a1, a1, -48
	; LMULMAX2-RV64-NEXT: sh a1, 56(sp)			; LMULMAX2-RV64-NEXT: sh a1, 56(sp)
	; LMULMAX2-RV64-NEXT: vslidedown.vi v28, v26, 11			; LMULMAX2-RV64-NEXT: vslidedown.vi v28, v26, 11
	; LMULMAX2-RV64-NEXT: vmv.x.s a1, v28			; LMULMAX2-RV64-NEXT: vmv.x.s a1, v28
	; LMULMAX2-RV64-NEXT: and a1, a1, a6			; LMULMAX2-RV64-NEXT: and a1, a1, a6
	; LMULMAX2-RV64-NEXT: srli a2, a1, 1			; LMULMAX2-RV64-NEXT: srli a2, a1, 1
	; LMULMAX2-RV64-NEXT: or a1, a1, a2			; LMULMAX2-RV64-NEXT: or a1, a1, a2
	; LMULMAX2-RV64-NEXT: srli a2, a1, 2			; LMULMAX2-RV64-NEXT: srli a2, a1, 2
	; LMULMAX2-RV64-NEXT: or a1, a1, a2			; LMULMAX2-RV64-NEXT: or a1, a1, a2
	Show All 13 Lines
	; LMULMAX2-RV64-NEXT: srli a1, a1, 2			; LMULMAX2-RV64-NEXT: srli a1, a1, 2
	; LMULMAX2-RV64-NEXT: and a1, a1, a3			; LMULMAX2-RV64-NEXT: and a1, a1, a3
	; LMULMAX2-RV64-NEXT: add a1, a2, a1			; LMULMAX2-RV64-NEXT: add a1, a2, a1
	; LMULMAX2-RV64-NEXT: srli a2, a1, 4			; LMULMAX2-RV64-NEXT: srli a2, a1, 4
	; LMULMAX2-RV64-NEXT: add a1, a1, a2			; LMULMAX2-RV64-NEXT: add a1, a1, a2
	; LMULMAX2-RV64-NEXT: and a1, a1, a4			; LMULMAX2-RV64-NEXT: and a1, a1, a4
	; LMULMAX2-RV64-NEXT: mul a1, a1, a5			; LMULMAX2-RV64-NEXT: mul a1, a1, a5
	; LMULMAX2-RV64-NEXT: srli a1, a1, 56			; LMULMAX2-RV64-NEXT: srli a1, a1, 56
	; LMULMAX2-RV64-NEXT: addi a1, a1, -48			; LMULMAX2-RV64-NEXT: addiw a1, a1, -48
	; LMULMAX2-RV64-NEXT: sh a1, 54(sp)			; LMULMAX2-RV64-NEXT: sh a1, 54(sp)
	; LMULMAX2-RV64-NEXT: vslidedown.vi v28, v26, 10			; LMULMAX2-RV64-NEXT: vslidedown.vi v28, v26, 10
	; LMULMAX2-RV64-NEXT: vmv.x.s a1, v28			; LMULMAX2-RV64-NEXT: vmv.x.s a1, v28
	; LMULMAX2-RV64-NEXT: and a1, a1, a6			; LMULMAX2-RV64-NEXT: and a1, a1, a6
	; LMULMAX2-RV64-NEXT: srli a2, a1, 1			; LMULMAX2-RV64-NEXT: srli a2, a1, 1
	; LMULMAX2-RV64-NEXT: or a1, a1, a2			; LMULMAX2-RV64-NEXT: or a1, a1, a2
	; LMULMAX2-RV64-NEXT: srli a2, a1, 2			; LMULMAX2-RV64-NEXT: srli a2, a1, 2
	; LMULMAX2-RV64-NEXT: or a1, a1, a2			; LMULMAX2-RV64-NEXT: or a1, a1, a2
	Show All 13 Lines
	; LMULMAX2-RV64-NEXT: srli a1, a1, 2			; LMULMAX2-RV64-NEXT: srli a1, a1, 2
	; LMULMAX2-RV64-NEXT: and a1, a1, a3			; LMULMAX2-RV64-NEXT: and a1, a1, a3
	; LMULMAX2-RV64-NEXT: add a1, a2, a1			; LMULMAX2-RV64-NEXT: add a1, a2, a1
	; LMULMAX2-RV64-NEXT: srli a2, a1, 4			; LMULMAX2-RV64-NEXT: srli a2, a1, 4
	; LMULMAX2-RV64-NEXT: add a1, a1, a2			; LMULMAX2-RV64-NEXT: add a1, a1, a2
	; LMULMAX2-RV64-NEXT: and a1, a1, a4			; LMULMAX2-RV64-NEXT: and a1, a1, a4
	; LMULMAX2-RV64-NEXT: mul a1, a1, a5			; LMULMAX2-RV64-NEXT: mul a1, a1, a5
	; LMULMAX2-RV64-NEXT: srli a1, a1, 56			; LMULMAX2-RV64-NEXT: srli a1, a1, 56
	; LMULMAX2-RV64-NEXT: addi a1, a1, -48			; LMULMAX2-RV64-NEXT: addiw a1, a1, -48
	; LMULMAX2-RV64-NEXT: sh a1, 52(sp)			; LMULMAX2-RV64-NEXT: sh a1, 52(sp)
	; LMULMAX2-RV64-NEXT: vslidedown.vi v28, v26, 9			; LMULMAX2-RV64-NEXT: vslidedown.vi v28, v26, 9
	; LMULMAX2-RV64-NEXT: vmv.x.s a1, v28			; LMULMAX2-RV64-NEXT: vmv.x.s a1, v28
	; LMULMAX2-RV64-NEXT: and a1, a1, a6			; LMULMAX2-RV64-NEXT: and a1, a1, a6
	; LMULMAX2-RV64-NEXT: srli a2, a1, 1			; LMULMAX2-RV64-NEXT: srli a2, a1, 1
	; LMULMAX2-RV64-NEXT: or a1, a1, a2			; LMULMAX2-RV64-NEXT: or a1, a1, a2
	; LMULMAX2-RV64-NEXT: srli a2, a1, 2			; LMULMAX2-RV64-NEXT: srli a2, a1, 2
	; LMULMAX2-RV64-NEXT: or a1, a1, a2			; LMULMAX2-RV64-NEXT: or a1, a1, a2
	Show All 13 Lines
	; LMULMAX2-RV64-NEXT: srli a1, a1, 2			; LMULMAX2-RV64-NEXT: srli a1, a1, 2
	; LMULMAX2-RV64-NEXT: and a1, a1, a3			; LMULMAX2-RV64-NEXT: and a1, a1, a3
	; LMULMAX2-RV64-NEXT: add a1, a2, a1			; LMULMAX2-RV64-NEXT: add a1, a2, a1
	; LMULMAX2-RV64-NEXT: srli a2, a1, 4			; LMULMAX2-RV64-NEXT: srli a2, a1, 4
	; LMULMAX2-RV64-NEXT: add a1, a1, a2			; LMULMAX2-RV64-NEXT: add a1, a1, a2
	; LMULMAX2-RV64-NEXT: and a1, a1, a4			; LMULMAX2-RV64-NEXT: and a1, a1, a4
	; LMULMAX2-RV64-NEXT: mul a1, a1, a5			; LMULMAX2-RV64-NEXT: mul a1, a1, a5
	; LMULMAX2-RV64-NEXT: srli a1, a1, 56			; LMULMAX2-RV64-NEXT: srli a1, a1, 56
	; LMULMAX2-RV64-NEXT: addi a1, a1, -48			; LMULMAX2-RV64-NEXT: addiw a1, a1, -48
	; LMULMAX2-RV64-NEXT: sh a1, 50(sp)			; LMULMAX2-RV64-NEXT: sh a1, 50(sp)
	; LMULMAX2-RV64-NEXT: vslidedown.vi v28, v26, 8			; LMULMAX2-RV64-NEXT: vslidedown.vi v28, v26, 8
	; LMULMAX2-RV64-NEXT: vmv.x.s a1, v28			; LMULMAX2-RV64-NEXT: vmv.x.s a1, v28
	; LMULMAX2-RV64-NEXT: and a1, a1, a6			; LMULMAX2-RV64-NEXT: and a1, a1, a6
	; LMULMAX2-RV64-NEXT: srli a2, a1, 1			; LMULMAX2-RV64-NEXT: srli a2, a1, 1
	; LMULMAX2-RV64-NEXT: or a1, a1, a2			; LMULMAX2-RV64-NEXT: or a1, a1, a2
	; LMULMAX2-RV64-NEXT: srli a2, a1, 2			; LMULMAX2-RV64-NEXT: srli a2, a1, 2
	; LMULMAX2-RV64-NEXT: or a1, a1, a2			; LMULMAX2-RV64-NEXT: or a1, a1, a2
	Show All 13 Lines
	; LMULMAX2-RV64-NEXT: srli a1, a1, 2			; LMULMAX2-RV64-NEXT: srli a1, a1, 2
	; LMULMAX2-RV64-NEXT: and a1, a1, a3			; LMULMAX2-RV64-NEXT: and a1, a1, a3
	; LMULMAX2-RV64-NEXT: add a1, a2, a1			; LMULMAX2-RV64-NEXT: add a1, a2, a1
	; LMULMAX2-RV64-NEXT: srli a2, a1, 4			; LMULMAX2-RV64-NEXT: srli a2, a1, 4
	; LMULMAX2-RV64-NEXT: add a1, a1, a2			; LMULMAX2-RV64-NEXT: add a1, a1, a2
	; LMULMAX2-RV64-NEXT: and a1, a1, a4			; LMULMAX2-RV64-NEXT: and a1, a1, a4
	; LMULMAX2-RV64-NEXT: mul a1, a1, a5			; LMULMAX2-RV64-NEXT: mul a1, a1, a5
	; LMULMAX2-RV64-NEXT: srli a1, a1, 56			; LMULMAX2-RV64-NEXT: srli a1, a1, 56
	; LMULMAX2-RV64-NEXT: addi a1, a1, -48			; LMULMAX2-RV64-NEXT: addiw a1, a1, -48
	; LMULMAX2-RV64-NEXT: sh a1, 48(sp)			; LMULMAX2-RV64-NEXT: sh a1, 48(sp)
	; LMULMAX2-RV64-NEXT: vslidedown.vi v28, v26, 7			; LMULMAX2-RV64-NEXT: vslidedown.vi v28, v26, 7
	; LMULMAX2-RV64-NEXT: vmv.x.s a1, v28			; LMULMAX2-RV64-NEXT: vmv.x.s a1, v28
	; LMULMAX2-RV64-NEXT: and a1, a1, a6			; LMULMAX2-RV64-NEXT: and a1, a1, a6
	; LMULMAX2-RV64-NEXT: srli a2, a1, 1			; LMULMAX2-RV64-NEXT: srli a2, a1, 1
	; LMULMAX2-RV64-NEXT: or a1, a1, a2			; LMULMAX2-RV64-NEXT: or a1, a1, a2
	; LMULMAX2-RV64-NEXT: srli a2, a1, 2			; LMULMAX2-RV64-NEXT: srli a2, a1, 2
	; LMULMAX2-RV64-NEXT: or a1, a1, a2			; LMULMAX2-RV64-NEXT: or a1, a1, a2
	Show All 13 Lines
	; LMULMAX2-RV64-NEXT: srli a1, a1, 2			; LMULMAX2-RV64-NEXT: srli a1, a1, 2
	; LMULMAX2-RV64-NEXT: and a1, a1, a3			; LMULMAX2-RV64-NEXT: and a1, a1, a3
	; LMULMAX2-RV64-NEXT: add a1, a2, a1			; LMULMAX2-RV64-NEXT: add a1, a2, a1
	; LMULMAX2-RV64-NEXT: srli a2, a1, 4			; LMULMAX2-RV64-NEXT: srli a2, a1, 4
	; LMULMAX2-RV64-NEXT: add a1, a1, a2			; LMULMAX2-RV64-NEXT: add a1, a1, a2
	; LMULMAX2-RV64-NEXT: and a1, a1, a4			; LMULMAX2-RV64-NEXT: and a1, a1, a4
	; LMULMAX2-RV64-NEXT: mul a1, a1, a5			; LMULMAX2-RV64-NEXT: mul a1, a1, a5
	; LMULMAX2-RV64-NEXT: srli a1, a1, 56			; LMULMAX2-RV64-NEXT: srli a1, a1, 56
	; LMULMAX2-RV64-NEXT: addi a1, a1, -48			; LMULMAX2-RV64-NEXT: addiw a1, a1, -48
	; LMULMAX2-RV64-NEXT: sh a1, 46(sp)			; LMULMAX2-RV64-NEXT: sh a1, 46(sp)
	; LMULMAX2-RV64-NEXT: vslidedown.vi v28, v26, 6			; LMULMAX2-RV64-NEXT: vslidedown.vi v28, v26, 6
	; LMULMAX2-RV64-NEXT: vmv.x.s a1, v28			; LMULMAX2-RV64-NEXT: vmv.x.s a1, v28
	; LMULMAX2-RV64-NEXT: and a1, a1, a6			; LMULMAX2-RV64-NEXT: and a1, a1, a6
	; LMULMAX2-RV64-NEXT: srli a2, a1, 1			; LMULMAX2-RV64-NEXT: srli a2, a1, 1
	; LMULMAX2-RV64-NEXT: or a1, a1, a2			; LMULMAX2-RV64-NEXT: or a1, a1, a2
	; LMULMAX2-RV64-NEXT: srli a2, a1, 2			; LMULMAX2-RV64-NEXT: srli a2, a1, 2
	; LMULMAX2-RV64-NEXT: or a1, a1, a2			; LMULMAX2-RV64-NEXT: or a1, a1, a2
	Show All 13 Lines
	; LMULMAX2-RV64-NEXT: srli a1, a1, 2			; LMULMAX2-RV64-NEXT: srli a1, a1, 2
	; LMULMAX2-RV64-NEXT: and a1, a1, a3			; LMULMAX2-RV64-NEXT: and a1, a1, a3
	; LMULMAX2-RV64-NEXT: add a1, a2, a1			; LMULMAX2-RV64-NEXT: add a1, a2, a1
	; LMULMAX2-RV64-NEXT: srli a2, a1, 4			; LMULMAX2-RV64-NEXT: srli a2, a1, 4
	; LMULMAX2-RV64-NEXT: add a1, a1, a2			; LMULMAX2-RV64-NEXT: add a1, a1, a2
	; LMULMAX2-RV64-NEXT: and a1, a1, a4			; LMULMAX2-RV64-NEXT: and a1, a1, a4
	; LMULMAX2-RV64-NEXT: mul a1, a1, a5			; LMULMAX2-RV64-NEXT: mul a1, a1, a5
	; LMULMAX2-RV64-NEXT: srli a1, a1, 56			; LMULMAX2-RV64-NEXT: srli a1, a1, 56
	; LMULMAX2-RV64-NEXT: addi a1, a1, -48			; LMULMAX2-RV64-NEXT: addiw a1, a1, -48
	; LMULMAX2-RV64-NEXT: sh a1, 44(sp)			; LMULMAX2-RV64-NEXT: sh a1, 44(sp)
	; LMULMAX2-RV64-NEXT: vslidedown.vi v28, v26, 5			; LMULMAX2-RV64-NEXT: vslidedown.vi v28, v26, 5
	; LMULMAX2-RV64-NEXT: vmv.x.s a1, v28			; LMULMAX2-RV64-NEXT: vmv.x.s a1, v28
	; LMULMAX2-RV64-NEXT: and a1, a1, a6			; LMULMAX2-RV64-NEXT: and a1, a1, a6
	; LMULMAX2-RV64-NEXT: srli a2, a1, 1			; LMULMAX2-RV64-NEXT: srli a2, a1, 1
	; LMULMAX2-RV64-NEXT: or a1, a1, a2			; LMULMAX2-RV64-NEXT: or a1, a1, a2
	; LMULMAX2-RV64-NEXT: srli a2, a1, 2			; LMULMAX2-RV64-NEXT: srli a2, a1, 2
	; LMULMAX2-RV64-NEXT: or a1, a1, a2			; LMULMAX2-RV64-NEXT: or a1, a1, a2
	Show All 13 Lines
	; LMULMAX2-RV64-NEXT: srli a1, a1, 2			; LMULMAX2-RV64-NEXT: srli a1, a1, 2
	; LMULMAX2-RV64-NEXT: and a1, a1, a3			; LMULMAX2-RV64-NEXT: and a1, a1, a3
	; LMULMAX2-RV64-NEXT: add a1, a2, a1			; LMULMAX2-RV64-NEXT: add a1, a2, a1
	; LMULMAX2-RV64-NEXT: srli a2, a1, 4			; LMULMAX2-RV64-NEXT: srli a2, a1, 4
	; LMULMAX2-RV64-NEXT: add a1, a1, a2			; LMULMAX2-RV64-NEXT: add a1, a1, a2
	; LMULMAX2-RV64-NEXT: and a1, a1, a4			; LMULMAX2-RV64-NEXT: and a1, a1, a4
	; LMULMAX2-RV64-NEXT: mul a1, a1, a5			; LMULMAX2-RV64-NEXT: mul a1, a1, a5
	; LMULMAX2-RV64-NEXT: srli a1, a1, 56			; LMULMAX2-RV64-NEXT: srli a1, a1, 56
	; LMULMAX2-RV64-NEXT: addi a1, a1, -48			; LMULMAX2-RV64-NEXT: addiw a1, a1, -48
	; LMULMAX2-RV64-NEXT: sh a1, 42(sp)			; LMULMAX2-RV64-NEXT: sh a1, 42(sp)
	; LMULMAX2-RV64-NEXT: vslidedown.vi v28, v26, 4			; LMULMAX2-RV64-NEXT: vslidedown.vi v28, v26, 4
	; LMULMAX2-RV64-NEXT: vmv.x.s a1, v28			; LMULMAX2-RV64-NEXT: vmv.x.s a1, v28
	; LMULMAX2-RV64-NEXT: and a1, a1, a6			; LMULMAX2-RV64-NEXT: and a1, a1, a6
	; LMULMAX2-RV64-NEXT: srli a2, a1, 1			; LMULMAX2-RV64-NEXT: srli a2, a1, 1
	; LMULMAX2-RV64-NEXT: or a1, a1, a2			; LMULMAX2-RV64-NEXT: or a1, a1, a2
	; LMULMAX2-RV64-NEXT: srli a2, a1, 2			; LMULMAX2-RV64-NEXT: srli a2, a1, 2
	; LMULMAX2-RV64-NEXT: or a1, a1, a2			; LMULMAX2-RV64-NEXT: or a1, a1, a2
	Show All 13 Lines
	; LMULMAX2-RV64-NEXT: srli a1, a1, 2			; LMULMAX2-RV64-NEXT: srli a1, a1, 2
	; LMULMAX2-RV64-NEXT: and a1, a1, a3			; LMULMAX2-RV64-NEXT: and a1, a1, a3
	; LMULMAX2-RV64-NEXT: add a1, a2, a1			; LMULMAX2-RV64-NEXT: add a1, a2, a1
	; LMULMAX2-RV64-NEXT: srli a2, a1, 4			; LMULMAX2-RV64-NEXT: srli a2, a1, 4
	; LMULMAX2-RV64-NEXT: add a1, a1, a2			; LMULMAX2-RV64-NEXT: add a1, a1, a2
	; LMULMAX2-RV64-NEXT: and a1, a1, a4			; LMULMAX2-RV64-NEXT: and a1, a1, a4
	; LMULMAX2-RV64-NEXT: mul a1, a1, a5			; LMULMAX2-RV64-NEXT: mul a1, a1, a5
	; LMULMAX2-RV64-NEXT: srli a1, a1, 56			; LMULMAX2-RV64-NEXT: srli a1, a1, 56
	; LMULMAX2-RV64-NEXT: addi a1, a1, -48			; LMULMAX2-RV64-NEXT: addiw a1, a1, -48
	; LMULMAX2-RV64-NEXT: sh a1, 40(sp)			; LMULMAX2-RV64-NEXT: sh a1, 40(sp)
	; LMULMAX2-RV64-NEXT: vslidedown.vi v28, v26, 3			; LMULMAX2-RV64-NEXT: vslidedown.vi v28, v26, 3
	; LMULMAX2-RV64-NEXT: vmv.x.s a1, v28			; LMULMAX2-RV64-NEXT: vmv.x.s a1, v28
	; LMULMAX2-RV64-NEXT: and a1, a1, a6			; LMULMAX2-RV64-NEXT: and a1, a1, a6
	; LMULMAX2-RV64-NEXT: srli a2, a1, 1			; LMULMAX2-RV64-NEXT: srli a2, a1, 1
	; LMULMAX2-RV64-NEXT: or a1, a1, a2			; LMULMAX2-RV64-NEXT: or a1, a1, a2
	; LMULMAX2-RV64-NEXT: srli a2, a1, 2			; LMULMAX2-RV64-NEXT: srli a2, a1, 2
	; LMULMAX2-RV64-NEXT: or a1, a1, a2			; LMULMAX2-RV64-NEXT: or a1, a1, a2
	Show All 13 Lines
	; LMULMAX2-RV64-NEXT: srli a1, a1, 2			; LMULMAX2-RV64-NEXT: srli a1, a1, 2
	; LMULMAX2-RV64-NEXT: and a1, a1, a3			; LMULMAX2-RV64-NEXT: and a1, a1, a3
	; LMULMAX2-RV64-NEXT: add a1, a2, a1			; LMULMAX2-RV64-NEXT: add a1, a2, a1
	; LMULMAX2-RV64-NEXT: srli a2, a1, 4			; LMULMAX2-RV64-NEXT: srli a2, a1, 4
	; LMULMAX2-RV64-NEXT: add a1, a1, a2			; LMULMAX2-RV64-NEXT: add a1, a1, a2
	; LMULMAX2-RV64-NEXT: and a1, a1, a4			; LMULMAX2-RV64-NEXT: and a1, a1, a4
	; LMULMAX2-RV64-NEXT: mul a1, a1, a5			; LMULMAX2-RV64-NEXT: mul a1, a1, a5
	; LMULMAX2-RV64-NEXT: srli a1, a1, 56			; LMULMAX2-RV64-NEXT: srli a1, a1, 56
	; LMULMAX2-RV64-NEXT: addi a1, a1, -48			; LMULMAX2-RV64-NEXT: addiw a1, a1, -48
	; LMULMAX2-RV64-NEXT: sh a1, 38(sp)			; LMULMAX2-RV64-NEXT: sh a1, 38(sp)
	; LMULMAX2-RV64-NEXT: vslidedown.vi v28, v26, 2			; LMULMAX2-RV64-NEXT: vslidedown.vi v28, v26, 2
	; LMULMAX2-RV64-NEXT: vmv.x.s a1, v28			; LMULMAX2-RV64-NEXT: vmv.x.s a1, v28
	; LMULMAX2-RV64-NEXT: and a1, a1, a6			; LMULMAX2-RV64-NEXT: and a1, a1, a6
	; LMULMAX2-RV64-NEXT: srli a2, a1, 1			; LMULMAX2-RV64-NEXT: srli a2, a1, 1
	; LMULMAX2-RV64-NEXT: or a1, a1, a2			; LMULMAX2-RV64-NEXT: or a1, a1, a2
	; LMULMAX2-RV64-NEXT: srli a2, a1, 2			; LMULMAX2-RV64-NEXT: srli a2, a1, 2
	; LMULMAX2-RV64-NEXT: or a1, a1, a2			; LMULMAX2-RV64-NEXT: or a1, a1, a2
	Show All 13 Lines
	; LMULMAX2-RV64-NEXT: srli a1, a1, 2			; LMULMAX2-RV64-NEXT: srli a1, a1, 2
	; LMULMAX2-RV64-NEXT: and a1, a1, a3			; LMULMAX2-RV64-NEXT: and a1, a1, a3
	; LMULMAX2-RV64-NEXT: add a1, a2, a1			; LMULMAX2-RV64-NEXT: add a1, a2, a1
	; LMULMAX2-RV64-NEXT: srli a2, a1, 4			; LMULMAX2-RV64-NEXT: srli a2, a1, 4
	; LMULMAX2-RV64-NEXT: add a1, a1, a2			; LMULMAX2-RV64-NEXT: add a1, a1, a2
	; LMULMAX2-RV64-NEXT: and a1, a1, a4			; LMULMAX2-RV64-NEXT: and a1, a1, a4
	; LMULMAX2-RV64-NEXT: mul a1, a1, a5			; LMULMAX2-RV64-NEXT: mul a1, a1, a5
	; LMULMAX2-RV64-NEXT: srli a1, a1, 56			; LMULMAX2-RV64-NEXT: srli a1, a1, 56
	; LMULMAX2-RV64-NEXT: addi a1, a1, -48			; LMULMAX2-RV64-NEXT: addiw a1, a1, -48
	; LMULMAX2-RV64-NEXT: sh a1, 36(sp)			; LMULMAX2-RV64-NEXT: sh a1, 36(sp)
	; LMULMAX2-RV64-NEXT: vslidedown.vi v26, v26, 1			; LMULMAX2-RV64-NEXT: vslidedown.vi v26, v26, 1
	; LMULMAX2-RV64-NEXT: vmv.x.s a1, v26			; LMULMAX2-RV64-NEXT: vmv.x.s a1, v26
	; LMULMAX2-RV64-NEXT: and a1, a1, a6			; LMULMAX2-RV64-NEXT: and a1, a1, a6
	; LMULMAX2-RV64-NEXT: srli a2, a1, 1			; LMULMAX2-RV64-NEXT: srli a2, a1, 1
	; LMULMAX2-RV64-NEXT: or a1, a1, a2			; LMULMAX2-RV64-NEXT: or a1, a1, a2
	; LMULMAX2-RV64-NEXT: srli a2, a1, 2			; LMULMAX2-RV64-NEXT: srli a2, a1, 2
	; LMULMAX2-RV64-NEXT: or a1, a1, a2			; LMULMAX2-RV64-NEXT: or a1, a1, a2
	Show All 13 Lines
	; LMULMAX2-RV64-NEXT: srli a1, a1, 2			; LMULMAX2-RV64-NEXT: srli a1, a1, 2
	; LMULMAX2-RV64-NEXT: and a1, a1, a3			; LMULMAX2-RV64-NEXT: and a1, a1, a3
	; LMULMAX2-RV64-NEXT: add a1, a2, a1			; LMULMAX2-RV64-NEXT: add a1, a2, a1
	; LMULMAX2-RV64-NEXT: srli a2, a1, 4			; LMULMAX2-RV64-NEXT: srli a2, a1, 4
	; LMULMAX2-RV64-NEXT: add a1, a1, a2			; LMULMAX2-RV64-NEXT: add a1, a1, a2
	; LMULMAX2-RV64-NEXT: and a1, a1, a4			; LMULMAX2-RV64-NEXT: and a1, a1, a4
	; LMULMAX2-RV64-NEXT: mul a1, a1, a5			; LMULMAX2-RV64-NEXT: mul a1, a1, a5
	; LMULMAX2-RV64-NEXT: srli a1, a1, 56			; LMULMAX2-RV64-NEXT: srli a1, a1, 56
	; LMULMAX2-RV64-NEXT: addi a1, a1, -48			; LMULMAX2-RV64-NEXT: addiw a1, a1, -48
	; LMULMAX2-RV64-NEXT: sh a1, 34(sp)			; LMULMAX2-RV64-NEXT: sh a1, 34(sp)
	; LMULMAX2-RV64-NEXT: vsetivli zero, 16, e16, m2, ta, mu			; LMULMAX2-RV64-NEXT: vsetivli zero, 16, e16, m2, ta, mu
	; LMULMAX2-RV64-NEXT: addi a1, sp, 32			; LMULMAX2-RV64-NEXT: addi a1, sp, 32
	; LMULMAX2-RV64-NEXT: vle16.v v26, (a1)			; LMULMAX2-RV64-NEXT: vle16.v v26, (a1)
	; LMULMAX2-RV64-NEXT: vse16.v v26, (a0)			; LMULMAX2-RV64-NEXT: vse16.v v26, (a0)
	; LMULMAX2-RV64-NEXT: addi sp, s0, -96			; LMULMAX2-RV64-NEXT: addi sp, s0, -96
	; LMULMAX2-RV64-NEXT: ld s0, 80(sp) # 8-byte Folded Reload			; LMULMAX2-RV64-NEXT: ld s0, 80(sp) # 8-byte Folded Reload
	; LMULMAX2-RV64-NEXT: ld ra, 88(sp) # 8-byte Folded Reload			; LMULMAX2-RV64-NEXT: ld ra, 88(sp) # 8-byte Folded Reload
	▲ Show 20 Lines • Show All 537 Lines • ▼ Show 20 Lines
	; LMULMAX1-RV64-NEXT: lui a1, 4112			; LMULMAX1-RV64-NEXT: lui a1, 4112
	; LMULMAX1-RV64-NEXT: addiw a1, a1, 257			; LMULMAX1-RV64-NEXT: addiw a1, a1, 257
	; LMULMAX1-RV64-NEXT: slli a1, a1, 16			; LMULMAX1-RV64-NEXT: slli a1, a1, 16
	; LMULMAX1-RV64-NEXT: addi a1, a1, 257			; LMULMAX1-RV64-NEXT: addi a1, a1, 257
	; LMULMAX1-RV64-NEXT: slli a1, a1, 16			; LMULMAX1-RV64-NEXT: slli a1, a1, 16
	; LMULMAX1-RV64-NEXT: addi a1, a1, 257			; LMULMAX1-RV64-NEXT: addi a1, a1, 257
	; LMULMAX1-RV64-NEXT: mul a2, a2, a1			; LMULMAX1-RV64-NEXT: mul a2, a2, a1
	; LMULMAX1-RV64-NEXT: srli a2, a2, 56			; LMULMAX1-RV64-NEXT: srli a2, a2, 56
	; LMULMAX1-RV64-NEXT: addi a2, a2, -48			; LMULMAX1-RV64-NEXT: addiw a2, a2, -48
	; LMULMAX1-RV64-NEXT: sh a2, 32(sp)			; LMULMAX1-RV64-NEXT: sh a2, 32(sp)
	; LMULMAX1-RV64-NEXT: vsetivli zero, 1, e16, m1, ta, mu			; LMULMAX1-RV64-NEXT: vsetivli zero, 1, e16, m1, ta, mu
	; LMULMAX1-RV64-NEXT: vslidedown.vi v27, v26, 7			; LMULMAX1-RV64-NEXT: vslidedown.vi v27, v26, 7
	; LMULMAX1-RV64-NEXT: vmv.x.s a2, v27			; LMULMAX1-RV64-NEXT: vmv.x.s a2, v27
	; LMULMAX1-RV64-NEXT: and a2, a2, a7			; LMULMAX1-RV64-NEXT: and a2, a2, a7
	; LMULMAX1-RV64-NEXT: srli a3, a2, 1			; LMULMAX1-RV64-NEXT: srli a3, a2, 1
	; LMULMAX1-RV64-NEXT: or a2, a2, a3			; LMULMAX1-RV64-NEXT: or a2, a2, a3
	; LMULMAX1-RV64-NEXT: srli a3, a2, 2			; LMULMAX1-RV64-NEXT: srli a3, a2, 2
	Show All 14 Lines
	; LMULMAX1-RV64-NEXT: srli a2, a2, 2			; LMULMAX1-RV64-NEXT: srli a2, a2, 2
	; LMULMAX1-RV64-NEXT: and a2, a2, a4			; LMULMAX1-RV64-NEXT: and a2, a2, a4
	; LMULMAX1-RV64-NEXT: add a2, a3, a2			; LMULMAX1-RV64-NEXT: add a2, a3, a2
	; LMULMAX1-RV64-NEXT: srli a3, a2, 4			; LMULMAX1-RV64-NEXT: srli a3, a2, 4
	; LMULMAX1-RV64-NEXT: add a2, a2, a3			; LMULMAX1-RV64-NEXT: add a2, a2, a3
	; LMULMAX1-RV64-NEXT: and a2, a2, a5			; LMULMAX1-RV64-NEXT: and a2, a2, a5
	; LMULMAX1-RV64-NEXT: mul a2, a2, a1			; LMULMAX1-RV64-NEXT: mul a2, a2, a1
	; LMULMAX1-RV64-NEXT: srli a2, a2, 56			; LMULMAX1-RV64-NEXT: srli a2, a2, 56
	; LMULMAX1-RV64-NEXT: addi a2, a2, -48			; LMULMAX1-RV64-NEXT: addiw a2, a2, -48
	; LMULMAX1-RV64-NEXT: sh a2, 46(sp)			; LMULMAX1-RV64-NEXT: sh a2, 46(sp)
	; LMULMAX1-RV64-NEXT: vslidedown.vi v27, v26, 6			; LMULMAX1-RV64-NEXT: vslidedown.vi v27, v26, 6
	; LMULMAX1-RV64-NEXT: vmv.x.s a2, v27			; LMULMAX1-RV64-NEXT: vmv.x.s a2, v27
	; LMULMAX1-RV64-NEXT: and a2, a2, a7			; LMULMAX1-RV64-NEXT: and a2, a2, a7
	; LMULMAX1-RV64-NEXT: srli a3, a2, 1			; LMULMAX1-RV64-NEXT: srli a3, a2, 1
	; LMULMAX1-RV64-NEXT: or a2, a2, a3			; LMULMAX1-RV64-NEXT: or a2, a2, a3
	; LMULMAX1-RV64-NEXT: srli a3, a2, 2			; LMULMAX1-RV64-NEXT: srli a3, a2, 2
	; LMULMAX1-RV64-NEXT: or a2, a2, a3			; LMULMAX1-RV64-NEXT: or a2, a2, a3
	Show All 13 Lines
	; LMULMAX1-RV64-NEXT: srli a2, a2, 2			; LMULMAX1-RV64-NEXT: srli a2, a2, 2
	; LMULMAX1-RV64-NEXT: and a2, a2, a4			; LMULMAX1-RV64-NEXT: and a2, a2, a4
	; LMULMAX1-RV64-NEXT: add a2, a3, a2			; LMULMAX1-RV64-NEXT: add a2, a3, a2
	; LMULMAX1-RV64-NEXT: srli a3, a2, 4			; LMULMAX1-RV64-NEXT: srli a3, a2, 4
	; LMULMAX1-RV64-NEXT: add a2, a2, a3			; LMULMAX1-RV64-NEXT: add a2, a2, a3
	; LMULMAX1-RV64-NEXT: and a2, a2, a5			; LMULMAX1-RV64-NEXT: and a2, a2, a5
	; LMULMAX1-RV64-NEXT: mul a2, a2, a1			; LMULMAX1-RV64-NEXT: mul a2, a2, a1
	; LMULMAX1-RV64-NEXT: srli a2, a2, 56			; LMULMAX1-RV64-NEXT: srli a2, a2, 56
	; LMULMAX1-RV64-NEXT: addi a2, a2, -48			; LMULMAX1-RV64-NEXT: addiw a2, a2, -48
	; LMULMAX1-RV64-NEXT: sh a2, 44(sp)			; LMULMAX1-RV64-NEXT: sh a2, 44(sp)
	; LMULMAX1-RV64-NEXT: vslidedown.vi v27, v26, 5			; LMULMAX1-RV64-NEXT: vslidedown.vi v27, v26, 5
	; LMULMAX1-RV64-NEXT: vmv.x.s a2, v27			; LMULMAX1-RV64-NEXT: vmv.x.s a2, v27
	; LMULMAX1-RV64-NEXT: and a2, a2, a7			; LMULMAX1-RV64-NEXT: and a2, a2, a7
	; LMULMAX1-RV64-NEXT: srli a3, a2, 1			; LMULMAX1-RV64-NEXT: srli a3, a2, 1
	; LMULMAX1-RV64-NEXT: or a2, a2, a3			; LMULMAX1-RV64-NEXT: or a2, a2, a3
	; LMULMAX1-RV64-NEXT: srli a3, a2, 2			; LMULMAX1-RV64-NEXT: srli a3, a2, 2
	; LMULMAX1-RV64-NEXT: or a2, a2, a3			; LMULMAX1-RV64-NEXT: or a2, a2, a3
	Show All 13 Lines
	; LMULMAX1-RV64-NEXT: srli a2, a2, 2			; LMULMAX1-RV64-NEXT: srli a2, a2, 2
	; LMULMAX1-RV64-NEXT: and a2, a2, a4			; LMULMAX1-RV64-NEXT: and a2, a2, a4
	; LMULMAX1-RV64-NEXT: add a2, a3, a2			; LMULMAX1-RV64-NEXT: add a2, a3, a2
	; LMULMAX1-RV64-NEXT: srli a3, a2, 4			; LMULMAX1-RV64-NEXT: srli a3, a2, 4
	; LMULMAX1-RV64-NEXT: add a2, a2, a3			; LMULMAX1-RV64-NEXT: add a2, a2, a3
	; LMULMAX1-RV64-NEXT: and a2, a2, a5			; LMULMAX1-RV64-NEXT: and a2, a2, a5
	; LMULMAX1-RV64-NEXT: mul a2, a2, a1			; LMULMAX1-RV64-NEXT: mul a2, a2, a1
	; LMULMAX1-RV64-NEXT: srli a2, a2, 56			; LMULMAX1-RV64-NEXT: srli a2, a2, 56
	; LMULMAX1-RV64-NEXT: addi a2, a2, -48			; LMULMAX1-RV64-NEXT: addiw a2, a2, -48
	; LMULMAX1-RV64-NEXT: sh a2, 42(sp)			; LMULMAX1-RV64-NEXT: sh a2, 42(sp)
	; LMULMAX1-RV64-NEXT: vslidedown.vi v27, v26, 4			; LMULMAX1-RV64-NEXT: vslidedown.vi v27, v26, 4
	; LMULMAX1-RV64-NEXT: vmv.x.s a2, v27			; LMULMAX1-RV64-NEXT: vmv.x.s a2, v27
	; LMULMAX1-RV64-NEXT: and a2, a2, a7			; LMULMAX1-RV64-NEXT: and a2, a2, a7
	; LMULMAX1-RV64-NEXT: srli a3, a2, 1			; LMULMAX1-RV64-NEXT: srli a3, a2, 1
	; LMULMAX1-RV64-NEXT: or a2, a2, a3			; LMULMAX1-RV64-NEXT: or a2, a2, a3
	; LMULMAX1-RV64-NEXT: srli a3, a2, 2			; LMULMAX1-RV64-NEXT: srli a3, a2, 2
	; LMULMAX1-RV64-NEXT: or a2, a2, a3			; LMULMAX1-RV64-NEXT: or a2, a2, a3
	Show All 13 Lines
	; LMULMAX1-RV64-NEXT: srli a2, a2, 2			; LMULMAX1-RV64-NEXT: srli a2, a2, 2
	; LMULMAX1-RV64-NEXT: and a2, a2, a4			; LMULMAX1-RV64-NEXT: and a2, a2, a4
	; LMULMAX1-RV64-NEXT: add a2, a3, a2			; LMULMAX1-RV64-NEXT: add a2, a3, a2
	; LMULMAX1-RV64-NEXT: srli a3, a2, 4			; LMULMAX1-RV64-NEXT: srli a3, a2, 4
	; LMULMAX1-RV64-NEXT: add a2, a2, a3			; LMULMAX1-RV64-NEXT: add a2, a2, a3
	; LMULMAX1-RV64-NEXT: and a2, a2, a5			; LMULMAX1-RV64-NEXT: and a2, a2, a5
	; LMULMAX1-RV64-NEXT: mul a2, a2, a1			; LMULMAX1-RV64-NEXT: mul a2, a2, a1
	; LMULMAX1-RV64-NEXT: srli a2, a2, 56			; LMULMAX1-RV64-NEXT: srli a2, a2, 56
	; LMULMAX1-RV64-NEXT: addi a2, a2, -48			; LMULMAX1-RV64-NEXT: addiw a2, a2, -48
	; LMULMAX1-RV64-NEXT: sh a2, 40(sp)			; LMULMAX1-RV64-NEXT: sh a2, 40(sp)
	; LMULMAX1-RV64-NEXT: vslidedown.vi v27, v26, 3			; LMULMAX1-RV64-NEXT: vslidedown.vi v27, v26, 3
	; LMULMAX1-RV64-NEXT: vmv.x.s a2, v27			; LMULMAX1-RV64-NEXT: vmv.x.s a2, v27
	; LMULMAX1-RV64-NEXT: and a2, a2, a7			; LMULMAX1-RV64-NEXT: and a2, a2, a7
	; LMULMAX1-RV64-NEXT: srli a3, a2, 1			; LMULMAX1-RV64-NEXT: srli a3, a2, 1
	; LMULMAX1-RV64-NEXT: or a2, a2, a3			; LMULMAX1-RV64-NEXT: or a2, a2, a3
	; LMULMAX1-RV64-NEXT: srli a3, a2, 2			; LMULMAX1-RV64-NEXT: srli a3, a2, 2
	; LMULMAX1-RV64-NEXT: or a2, a2, a3			; LMULMAX1-RV64-NEXT: or a2, a2, a3
	Show All 13 Lines
	; LMULMAX1-RV64-NEXT: srli a2, a2, 2			; LMULMAX1-RV64-NEXT: srli a2, a2, 2
	; LMULMAX1-RV64-NEXT: and a2, a2, a4			; LMULMAX1-RV64-NEXT: and a2, a2, a4
	; LMULMAX1-RV64-NEXT: add a2, a3, a2			; LMULMAX1-RV64-NEXT: add a2, a3, a2
	; LMULMAX1-RV64-NEXT: srli a3, a2, 4			; LMULMAX1-RV64-NEXT: srli a3, a2, 4
	; LMULMAX1-RV64-NEXT: add a2, a2, a3			; LMULMAX1-RV64-NEXT: add a2, a2, a3
	; LMULMAX1-RV64-NEXT: and a2, a2, a5			; LMULMAX1-RV64-NEXT: and a2, a2, a5
	; LMULMAX1-RV64-NEXT: mul a2, a2, a1			; LMULMAX1-RV64-NEXT: mul a2, a2, a1
	; LMULMAX1-RV64-NEXT: srli a2, a2, 56			; LMULMAX1-RV64-NEXT: srli a2, a2, 56
	; LMULMAX1-RV64-NEXT: addi a2, a2, -48			; LMULMAX1-RV64-NEXT: addiw a2, a2, -48
	; LMULMAX1-RV64-NEXT: sh a2, 38(sp)			; LMULMAX1-RV64-NEXT: sh a2, 38(sp)
	; LMULMAX1-RV64-NEXT: vslidedown.vi v27, v26, 2			; LMULMAX1-RV64-NEXT: vslidedown.vi v27, v26, 2
	; LMULMAX1-RV64-NEXT: vmv.x.s a2, v27			; LMULMAX1-RV64-NEXT: vmv.x.s a2, v27
	; LMULMAX1-RV64-NEXT: and a2, a2, a7			; LMULMAX1-RV64-NEXT: and a2, a2, a7
	; LMULMAX1-RV64-NEXT: srli a3, a2, 1			; LMULMAX1-RV64-NEXT: srli a3, a2, 1
	; LMULMAX1-RV64-NEXT: or a2, a2, a3			; LMULMAX1-RV64-NEXT: or a2, a2, a3
	; LMULMAX1-RV64-NEXT: srli a3, a2, 2			; LMULMAX1-RV64-NEXT: srli a3, a2, 2
	; LMULMAX1-RV64-NEXT: or a2, a2, a3			; LMULMAX1-RV64-NEXT: or a2, a2, a3
	Show All 13 Lines
	; LMULMAX1-RV64-NEXT: srli a2, a2, 2			; LMULMAX1-RV64-NEXT: srli a2, a2, 2
	; LMULMAX1-RV64-NEXT: and a2, a2, a4			; LMULMAX1-RV64-NEXT: and a2, a2, a4
	; LMULMAX1-RV64-NEXT: add a2, a3, a2			; LMULMAX1-RV64-NEXT: add a2, a3, a2
	; LMULMAX1-RV64-NEXT: srli a3, a2, 4			; LMULMAX1-RV64-NEXT: srli a3, a2, 4
	; LMULMAX1-RV64-NEXT: add a2, a2, a3			; LMULMAX1-RV64-NEXT: add a2, a2, a3
	; LMULMAX1-RV64-NEXT: and a2, a2, a5			; LMULMAX1-RV64-NEXT: and a2, a2, a5
	; LMULMAX1-RV64-NEXT: mul a2, a2, a1			; LMULMAX1-RV64-NEXT: mul a2, a2, a1
	; LMULMAX1-RV64-NEXT: srli a2, a2, 56			; LMULMAX1-RV64-NEXT: srli a2, a2, 56
	; LMULMAX1-RV64-NEXT: addi a2, a2, -48			; LMULMAX1-RV64-NEXT: addiw a2, a2, -48
	; LMULMAX1-RV64-NEXT: sh a2, 36(sp)			; LMULMAX1-RV64-NEXT: sh a2, 36(sp)
	; LMULMAX1-RV64-NEXT: vslidedown.vi v26, v26, 1			; LMULMAX1-RV64-NEXT: vslidedown.vi v26, v26, 1
	; LMULMAX1-RV64-NEXT: vmv.x.s a2, v26			; LMULMAX1-RV64-NEXT: vmv.x.s a2, v26
	; LMULMAX1-RV64-NEXT: and a2, a2, a7			; LMULMAX1-RV64-NEXT: and a2, a2, a7
	; LMULMAX1-RV64-NEXT: srli a3, a2, 1			; LMULMAX1-RV64-NEXT: srli a3, a2, 1
	; LMULMAX1-RV64-NEXT: or a2, a2, a3			; LMULMAX1-RV64-NEXT: or a2, a2, a3
	; LMULMAX1-RV64-NEXT: srli a3, a2, 2			; LMULMAX1-RV64-NEXT: srli a3, a2, 2
	; LMULMAX1-RV64-NEXT: or a2, a2, a3			; LMULMAX1-RV64-NEXT: or a2, a2, a3
	Show All 13 Lines
	; LMULMAX1-RV64-NEXT: srli a2, a2, 2			; LMULMAX1-RV64-NEXT: srli a2, a2, 2
	; LMULMAX1-RV64-NEXT: and a2, a2, a4			; LMULMAX1-RV64-NEXT: and a2, a2, a4
	; LMULMAX1-RV64-NEXT: add a2, a3, a2			; LMULMAX1-RV64-NEXT: add a2, a3, a2
	; LMULMAX1-RV64-NEXT: srli a3, a2, 4			; LMULMAX1-RV64-NEXT: srli a3, a2, 4
	; LMULMAX1-RV64-NEXT: add a2, a2, a3			; LMULMAX1-RV64-NEXT: add a2, a2, a3
	; LMULMAX1-RV64-NEXT: and a2, a2, a5			; LMULMAX1-RV64-NEXT: and a2, a2, a5
	; LMULMAX1-RV64-NEXT: mul a2, a2, a1			; LMULMAX1-RV64-NEXT: mul a2, a2, a1
	; LMULMAX1-RV64-NEXT: srli a2, a2, 56			; LMULMAX1-RV64-NEXT: srli a2, a2, 56
	; LMULMAX1-RV64-NEXT: addi a2, a2, -48			; LMULMAX1-RV64-NEXT: addiw a2, a2, -48
	; LMULMAX1-RV64-NEXT: sh a2, 34(sp)			; LMULMAX1-RV64-NEXT: sh a2, 34(sp)
	; LMULMAX1-RV64-NEXT: vmv.x.s a2, v25			; LMULMAX1-RV64-NEXT: vmv.x.s a2, v25
	; LMULMAX1-RV64-NEXT: and a2, a2, a7			; LMULMAX1-RV64-NEXT: and a2, a2, a7
	; LMULMAX1-RV64-NEXT: srli a3, a2, 1			; LMULMAX1-RV64-NEXT: srli a3, a2, 1
	; LMULMAX1-RV64-NEXT: or a2, a2, a3			; LMULMAX1-RV64-NEXT: or a2, a2, a3
	; LMULMAX1-RV64-NEXT: srli a3, a2, 2			; LMULMAX1-RV64-NEXT: srli a3, a2, 2
	; LMULMAX1-RV64-NEXT: or a2, a2, a3			; LMULMAX1-RV64-NEXT: or a2, a2, a3
	; LMULMAX1-RV64-NEXT: srli a3, a2, 4			; LMULMAX1-RV64-NEXT: srli a3, a2, 4
	Show All 12 Lines
	; LMULMAX1-RV64-NEXT: srli a2, a2, 2			; LMULMAX1-RV64-NEXT: srli a2, a2, 2
	; LMULMAX1-RV64-NEXT: and a2, a2, a4			; LMULMAX1-RV64-NEXT: and a2, a2, a4
	; LMULMAX1-RV64-NEXT: add a2, a3, a2			; LMULMAX1-RV64-NEXT: add a2, a3, a2
	; LMULMAX1-RV64-NEXT: srli a3, a2, 4			; LMULMAX1-RV64-NEXT: srli a3, a2, 4
	; LMULMAX1-RV64-NEXT: add a2, a2, a3			; LMULMAX1-RV64-NEXT: add a2, a2, a3
	; LMULMAX1-RV64-NEXT: and a2, a2, a5			; LMULMAX1-RV64-NEXT: and a2, a2, a5
	; LMULMAX1-RV64-NEXT: mul a2, a2, a1			; LMULMAX1-RV64-NEXT: mul a2, a2, a1
	; LMULMAX1-RV64-NEXT: srli a2, a2, 56			; LMULMAX1-RV64-NEXT: srli a2, a2, 56
	; LMULMAX1-RV64-NEXT: addi a2, a2, -48			; LMULMAX1-RV64-NEXT: addiw a2, a2, -48
	; LMULMAX1-RV64-NEXT: sh a2, 16(sp)			; LMULMAX1-RV64-NEXT: sh a2, 16(sp)
	; LMULMAX1-RV64-NEXT: vslidedown.vi v26, v25, 7			; LMULMAX1-RV64-NEXT: vslidedown.vi v26, v25, 7
	; LMULMAX1-RV64-NEXT: vmv.x.s a2, v26			; LMULMAX1-RV64-NEXT: vmv.x.s a2, v26
	; LMULMAX1-RV64-NEXT: and a2, a2, a7			; LMULMAX1-RV64-NEXT: and a2, a2, a7
	; LMULMAX1-RV64-NEXT: srli a3, a2, 1			; LMULMAX1-RV64-NEXT: srli a3, a2, 1
	; LMULMAX1-RV64-NEXT: or a2, a2, a3			; LMULMAX1-RV64-NEXT: or a2, a2, a3
	; LMULMAX1-RV64-NEXT: srli a3, a2, 2			; LMULMAX1-RV64-NEXT: srli a3, a2, 2
	; LMULMAX1-RV64-NEXT: or a2, a2, a3			; LMULMAX1-RV64-NEXT: or a2, a2, a3
	Show All 13 Lines
	; LMULMAX1-RV64-NEXT: srli a2, a2, 2			; LMULMAX1-RV64-NEXT: srli a2, a2, 2
	; LMULMAX1-RV64-NEXT: and a2, a2, a4			; LMULMAX1-RV64-NEXT: and a2, a2, a4
	; LMULMAX1-RV64-NEXT: add a2, a3, a2			; LMULMAX1-RV64-NEXT: add a2, a3, a2
	; LMULMAX1-RV64-NEXT: srli a3, a2, 4			; LMULMAX1-RV64-NEXT: srli a3, a2, 4
	; LMULMAX1-RV64-NEXT: add a2, a2, a3			; LMULMAX1-RV64-NEXT: add a2, a2, a3
	; LMULMAX1-RV64-NEXT: and a2, a2, a5			; LMULMAX1-RV64-NEXT: and a2, a2, a5
	; LMULMAX1-RV64-NEXT: mul a2, a2, a1			; LMULMAX1-RV64-NEXT: mul a2, a2, a1
	; LMULMAX1-RV64-NEXT: srli a2, a2, 56			; LMULMAX1-RV64-NEXT: srli a2, a2, 56
	; LMULMAX1-RV64-NEXT: addi a2, a2, -48			; LMULMAX1-RV64-NEXT: addiw a2, a2, -48
	; LMULMAX1-RV64-NEXT: sh a2, 30(sp)			; LMULMAX1-RV64-NEXT: sh a2, 30(sp)
	; LMULMAX1-RV64-NEXT: vslidedown.vi v26, v25, 6			; LMULMAX1-RV64-NEXT: vslidedown.vi v26, v25, 6
	; LMULMAX1-RV64-NEXT: vmv.x.s a2, v26			; LMULMAX1-RV64-NEXT: vmv.x.s a2, v26
	; LMULMAX1-RV64-NEXT: and a2, a2, a7			; LMULMAX1-RV64-NEXT: and a2, a2, a7
	; LMULMAX1-RV64-NEXT: srli a3, a2, 1			; LMULMAX1-RV64-NEXT: srli a3, a2, 1
	; LMULMAX1-RV64-NEXT: or a2, a2, a3			; LMULMAX1-RV64-NEXT: or a2, a2, a3
	; LMULMAX1-RV64-NEXT: srli a3, a2, 2			; LMULMAX1-RV64-NEXT: srli a3, a2, 2
	; LMULMAX1-RV64-NEXT: or a2, a2, a3			; LMULMAX1-RV64-NEXT: or a2, a2, a3
	Show All 13 Lines
	; LMULMAX1-RV64-NEXT: srli a2, a2, 2			; LMULMAX1-RV64-NEXT: srli a2, a2, 2
	; LMULMAX1-RV64-NEXT: and a2, a2, a4			; LMULMAX1-RV64-NEXT: and a2, a2, a4
	; LMULMAX1-RV64-NEXT: add a2, a3, a2			; LMULMAX1-RV64-NEXT: add a2, a3, a2
	; LMULMAX1-RV64-NEXT: srli a3, a2, 4			; LMULMAX1-RV64-NEXT: srli a3, a2, 4
	; LMULMAX1-RV64-NEXT: add a2, a2, a3			; LMULMAX1-RV64-NEXT: add a2, a2, a3
	; LMULMAX1-RV64-NEXT: and a2, a2, a5			; LMULMAX1-RV64-NEXT: and a2, a2, a5
	; LMULMAX1-RV64-NEXT: mul a2, a2, a1			; LMULMAX1-RV64-NEXT: mul a2, a2, a1
	; LMULMAX1-RV64-NEXT: srli a2, a2, 56			; LMULMAX1-RV64-NEXT: srli a2, a2, 56
	; LMULMAX1-RV64-NEXT: addi a2, a2, -48			; LMULMAX1-RV64-NEXT: addiw a2, a2, -48
	; LMULMAX1-RV64-NEXT: sh a2, 28(sp)			; LMULMAX1-RV64-NEXT: sh a2, 28(sp)
	; LMULMAX1-RV64-NEXT: vslidedown.vi v26, v25, 5			; LMULMAX1-RV64-NEXT: vslidedown.vi v26, v25, 5
	; LMULMAX1-RV64-NEXT: vmv.x.s a2, v26			; LMULMAX1-RV64-NEXT: vmv.x.s a2, v26
	; LMULMAX1-RV64-NEXT: and a2, a2, a7			; LMULMAX1-RV64-NEXT: and a2, a2, a7
	; LMULMAX1-RV64-NEXT: srli a3, a2, 1			; LMULMAX1-RV64-NEXT: srli a3, a2, 1
	; LMULMAX1-RV64-NEXT: or a2, a2, a3			; LMULMAX1-RV64-NEXT: or a2, a2, a3
	; LMULMAX1-RV64-NEXT: srli a3, a2, 2			; LMULMAX1-RV64-NEXT: srli a3, a2, 2
	; LMULMAX1-RV64-NEXT: or a2, a2, a3			; LMULMAX1-RV64-NEXT: or a2, a2, a3
	Show All 13 Lines
	; LMULMAX1-RV64-NEXT: srli a2, a2, 2			; LMULMAX1-RV64-NEXT: srli a2, a2, 2
	; LMULMAX1-RV64-NEXT: and a2, a2, a4			; LMULMAX1-RV64-NEXT: and a2, a2, a4
	; LMULMAX1-RV64-NEXT: add a2, a3, a2			; LMULMAX1-RV64-NEXT: add a2, a3, a2
	; LMULMAX1-RV64-NEXT: srli a3, a2, 4			; LMULMAX1-RV64-NEXT: srli a3, a2, 4
	; LMULMAX1-RV64-NEXT: add a2, a2, a3			; LMULMAX1-RV64-NEXT: add a2, a2, a3
	; LMULMAX1-RV64-NEXT: and a2, a2, a5			; LMULMAX1-RV64-NEXT: and a2, a2, a5
	; LMULMAX1-RV64-NEXT: mul a2, a2, a1			; LMULMAX1-RV64-NEXT: mul a2, a2, a1
	; LMULMAX1-RV64-NEXT: srli a2, a2, 56			; LMULMAX1-RV64-NEXT: srli a2, a2, 56
	; LMULMAX1-RV64-NEXT: addi a2, a2, -48			; LMULMAX1-RV64-NEXT: addiw a2, a2, -48
	; LMULMAX1-RV64-NEXT: sh a2, 26(sp)			; LMULMAX1-RV64-NEXT: sh a2, 26(sp)
	; LMULMAX1-RV64-NEXT: vslidedown.vi v26, v25, 4			; LMULMAX1-RV64-NEXT: vslidedown.vi v26, v25, 4
	; LMULMAX1-RV64-NEXT: vmv.x.s a2, v26			; LMULMAX1-RV64-NEXT: vmv.x.s a2, v26
	; LMULMAX1-RV64-NEXT: and a2, a2, a7			; LMULMAX1-RV64-NEXT: and a2, a2, a7
	; LMULMAX1-RV64-NEXT: srli a3, a2, 1			; LMULMAX1-RV64-NEXT: srli a3, a2, 1
	; LMULMAX1-RV64-NEXT: or a2, a2, a3			; LMULMAX1-RV64-NEXT: or a2, a2, a3
	; LMULMAX1-RV64-NEXT: srli a3, a2, 2			; LMULMAX1-RV64-NEXT: srli a3, a2, 2
	; LMULMAX1-RV64-NEXT: or a2, a2, a3			; LMULMAX1-RV64-NEXT: or a2, a2, a3
	Show All 13 Lines
	; LMULMAX1-RV64-NEXT: srli a2, a2, 2			; LMULMAX1-RV64-NEXT: srli a2, a2, 2
	; LMULMAX1-RV64-NEXT: and a2, a2, a4			; LMULMAX1-RV64-NEXT: and a2, a2, a4
	; LMULMAX1-RV64-NEXT: add a2, a3, a2			; LMULMAX1-RV64-NEXT: add a2, a3, a2
	; LMULMAX1-RV64-NEXT: srli a3, a2, 4			; LMULMAX1-RV64-NEXT: srli a3, a2, 4
	; LMULMAX1-RV64-NEXT: add a2, a2, a3			; LMULMAX1-RV64-NEXT: add a2, a2, a3
	; LMULMAX1-RV64-NEXT: and a2, a2, a5			; LMULMAX1-RV64-NEXT: and a2, a2, a5
	; LMULMAX1-RV64-NEXT: mul a2, a2, a1			; LMULMAX1-RV64-NEXT: mul a2, a2, a1
	; LMULMAX1-RV64-NEXT: srli a2, a2, 56			; LMULMAX1-RV64-NEXT: srli a2, a2, 56
	; LMULMAX1-RV64-NEXT: addi a2, a2, -48			; LMULMAX1-RV64-NEXT: addiw a2, a2, -48
	; LMULMAX1-RV64-NEXT: sh a2, 24(sp)			; LMULMAX1-RV64-NEXT: sh a2, 24(sp)
	; LMULMAX1-RV64-NEXT: vslidedown.vi v26, v25, 3			; LMULMAX1-RV64-NEXT: vslidedown.vi v26, v25, 3
	; LMULMAX1-RV64-NEXT: vmv.x.s a2, v26			; LMULMAX1-RV64-NEXT: vmv.x.s a2, v26
	; LMULMAX1-RV64-NEXT: and a2, a2, a7			; LMULMAX1-RV64-NEXT: and a2, a2, a7
	; LMULMAX1-RV64-NEXT: srli a3, a2, 1			; LMULMAX1-RV64-NEXT: srli a3, a2, 1
	; LMULMAX1-RV64-NEXT: or a2, a2, a3			; LMULMAX1-RV64-NEXT: or a2, a2, a3
	; LMULMAX1-RV64-NEXT: srli a3, a2, 2			; LMULMAX1-RV64-NEXT: srli a3, a2, 2
	; LMULMAX1-RV64-NEXT: or a2, a2, a3			; LMULMAX1-RV64-NEXT: or a2, a2, a3
	Show All 13 Lines
	; LMULMAX1-RV64-NEXT: srli a2, a2, 2			; LMULMAX1-RV64-NEXT: srli a2, a2, 2
	; LMULMAX1-RV64-NEXT: and a2, a2, a4			; LMULMAX1-RV64-NEXT: and a2, a2, a4
	; LMULMAX1-RV64-NEXT: add a2, a3, a2			; LMULMAX1-RV64-NEXT: add a2, a3, a2
	; LMULMAX1-RV64-NEXT: srli a3, a2, 4			; LMULMAX1-RV64-NEXT: srli a3, a2, 4
	; LMULMAX1-RV64-NEXT: add a2, a2, a3			; LMULMAX1-RV64-NEXT: add a2, a2, a3
	; LMULMAX1-RV64-NEXT: and a2, a2, a5			; LMULMAX1-RV64-NEXT: and a2, a2, a5
	; LMULMAX1-RV64-NEXT: mul a2, a2, a1			; LMULMAX1-RV64-NEXT: mul a2, a2, a1
	; LMULMAX1-RV64-NEXT: srli a2, a2, 56			; LMULMAX1-RV64-NEXT: srli a2, a2, 56
	; LMULMAX1-RV64-NEXT: addi a2, a2, -48			; LMULMAX1-RV64-NEXT: addiw a2, a2, -48
	; LMULMAX1-RV64-NEXT: sh a2, 22(sp)			; LMULMAX1-RV64-NEXT: sh a2, 22(sp)
	; LMULMAX1-RV64-NEXT: vslidedown.vi v26, v25, 2			; LMULMAX1-RV64-NEXT: vslidedown.vi v26, v25, 2
	; LMULMAX1-RV64-NEXT: vmv.x.s a2, v26			; LMULMAX1-RV64-NEXT: vmv.x.s a2, v26
	; LMULMAX1-RV64-NEXT: and a2, a2, a7			; LMULMAX1-RV64-NEXT: and a2, a2, a7
	; LMULMAX1-RV64-NEXT: srli a3, a2, 1			; LMULMAX1-RV64-NEXT: srli a3, a2, 1
	; LMULMAX1-RV64-NEXT: or a2, a2, a3			; LMULMAX1-RV64-NEXT: or a2, a2, a3
	; LMULMAX1-RV64-NEXT: srli a3, a2, 2			; LMULMAX1-RV64-NEXT: srli a3, a2, 2
	; LMULMAX1-RV64-NEXT: or a2, a2, a3			; LMULMAX1-RV64-NEXT: or a2, a2, a3
	Show All 13 Lines
	; LMULMAX1-RV64-NEXT: srli a2, a2, 2			; LMULMAX1-RV64-NEXT: srli a2, a2, 2
	; LMULMAX1-RV64-NEXT: and a2, a2, a4			; LMULMAX1-RV64-NEXT: and a2, a2, a4
	; LMULMAX1-RV64-NEXT: add a2, a3, a2			; LMULMAX1-RV64-NEXT: add a2, a3, a2
	; LMULMAX1-RV64-NEXT: srli a3, a2, 4			; LMULMAX1-RV64-NEXT: srli a3, a2, 4
	; LMULMAX1-RV64-NEXT: add a2, a2, a3			; LMULMAX1-RV64-NEXT: add a2, a2, a3
	; LMULMAX1-RV64-NEXT: and a2, a2, a5			; LMULMAX1-RV64-NEXT: and a2, a2, a5
	; LMULMAX1-RV64-NEXT: mul a2, a2, a1			; LMULMAX1-RV64-NEXT: mul a2, a2, a1
	; LMULMAX1-RV64-NEXT: srli a2, a2, 56			; LMULMAX1-RV64-NEXT: srli a2, a2, 56
	; LMULMAX1-RV64-NEXT: addi a2, a2, -48			; LMULMAX1-RV64-NEXT: addiw a2, a2, -48
	; LMULMAX1-RV64-NEXT: sh a2, 20(sp)			; LMULMAX1-RV64-NEXT: sh a2, 20(sp)
	; LMULMAX1-RV64-NEXT: vslidedown.vi v25, v25, 1			; LMULMAX1-RV64-NEXT: vslidedown.vi v25, v25, 1
	; LMULMAX1-RV64-NEXT: vmv.x.s a2, v25			; LMULMAX1-RV64-NEXT: vmv.x.s a2, v25
	; LMULMAX1-RV64-NEXT: and a2, a2, a7			; LMULMAX1-RV64-NEXT: and a2, a2, a7
	; LMULMAX1-RV64-NEXT: srli a3, a2, 1			; LMULMAX1-RV64-NEXT: srli a3, a2, 1
	; LMULMAX1-RV64-NEXT: or a2, a2, a3			; LMULMAX1-RV64-NEXT: or a2, a2, a3
	; LMULMAX1-RV64-NEXT: srli a3, a2, 2			; LMULMAX1-RV64-NEXT: srli a3, a2, 2
	; LMULMAX1-RV64-NEXT: or a2, a2, a3			; LMULMAX1-RV64-NEXT: or a2, a2, a3
	Show All 13 Lines
	; LMULMAX1-RV64-NEXT: srli a2, a2, 2			; LMULMAX1-RV64-NEXT: srli a2, a2, 2
	; LMULMAX1-RV64-NEXT: and a2, a2, a4			; LMULMAX1-RV64-NEXT: and a2, a2, a4
	; LMULMAX1-RV64-NEXT: add a2, a3, a2			; LMULMAX1-RV64-NEXT: add a2, a3, a2
	; LMULMAX1-RV64-NEXT: srli a3, a2, 4			; LMULMAX1-RV64-NEXT: srli a3, a2, 4
	; LMULMAX1-RV64-NEXT: add a2, a2, a3			; LMULMAX1-RV64-NEXT: add a2, a2, a3
	; LMULMAX1-RV64-NEXT: and a2, a2, a5			; LMULMAX1-RV64-NEXT: and a2, a2, a5
	; LMULMAX1-RV64-NEXT: mul a1, a2, a1			; LMULMAX1-RV64-NEXT: mul a1, a2, a1
	; LMULMAX1-RV64-NEXT: srli a1, a1, 56			; LMULMAX1-RV64-NEXT: srli a1, a1, 56
	; LMULMAX1-RV64-NEXT: addi a1, a1, -48			; LMULMAX1-RV64-NEXT: addiw a1, a1, -48
	; LMULMAX1-RV64-NEXT: sh a1, 18(sp)			; LMULMAX1-RV64-NEXT: sh a1, 18(sp)
	; LMULMAX1-RV64-NEXT: vsetivli zero, 8, e16, m1, ta, mu			; LMULMAX1-RV64-NEXT: vsetivli zero, 8, e16, m1, ta, mu
	; LMULMAX1-RV64-NEXT: addi a1, sp, 16			; LMULMAX1-RV64-NEXT: addi a1, sp, 16
	; LMULMAX1-RV64-NEXT: vle16.v v25, (a1)			; LMULMAX1-RV64-NEXT: vle16.v v25, (a1)
	; LMULMAX1-RV64-NEXT: addi a1, sp, 32			; LMULMAX1-RV64-NEXT: addi a1, sp, 32
	; LMULMAX1-RV64-NEXT: vle16.v v26, (a1)			; LMULMAX1-RV64-NEXT: vle16.v v26, (a1)
	; LMULMAX1-RV64-NEXT: vse16.v v25, (a0)			; LMULMAX1-RV64-NEXT: vse16.v v25, (a0)
	; LMULMAX1-RV64-NEXT: vse16.v v26, (a6)			; LMULMAX1-RV64-NEXT: vse16.v v26, (a6)
	▲ Show 20 Lines • Show All 313 Lines • ▼ Show 20 Lines
	; LMULMAX2-RV64-NEXT: lui a4, 4112			; LMULMAX2-RV64-NEXT: lui a4, 4112
	; LMULMAX2-RV64-NEXT: addiw a4, a4, 257			; LMULMAX2-RV64-NEXT: addiw a4, a4, 257
	; LMULMAX2-RV64-NEXT: slli a4, a4, 16			; LMULMAX2-RV64-NEXT: slli a4, a4, 16
	; LMULMAX2-RV64-NEXT: addi a4, a4, 257			; LMULMAX2-RV64-NEXT: addi a4, a4, 257
	; LMULMAX2-RV64-NEXT: slli a4, a4, 16			; LMULMAX2-RV64-NEXT: slli a4, a4, 16
	; LMULMAX2-RV64-NEXT: addi a4, a4, 257			; LMULMAX2-RV64-NEXT: addi a4, a4, 257
	; LMULMAX2-RV64-NEXT: mul a5, a5, a4			; LMULMAX2-RV64-NEXT: mul a5, a5, a4
	; LMULMAX2-RV64-NEXT: srli a5, a5, 56			; LMULMAX2-RV64-NEXT: srli a5, a5, 56
	; LMULMAX2-RV64-NEXT: addi a5, a5, -32			; LMULMAX2-RV64-NEXT: addiw a5, a5, -32
	; LMULMAX2-RV64-NEXT: sw a5, 32(sp)			; LMULMAX2-RV64-NEXT: sw a5, 32(sp)
	; LMULMAX2-RV64-NEXT: vsetivli zero, 1, e32, m2, ta, mu			; LMULMAX2-RV64-NEXT: vsetivli zero, 1, e32, m2, ta, mu
	; LMULMAX2-RV64-NEXT: vslidedown.vi v28, v26, 7			; LMULMAX2-RV64-NEXT: vslidedown.vi v28, v26, 7
	; LMULMAX2-RV64-NEXT: vmv.x.s a5, v28			; LMULMAX2-RV64-NEXT: vmv.x.s a5, v28
	; LMULMAX2-RV64-NEXT: srliw a1, a5, 1			; LMULMAX2-RV64-NEXT: srliw a1, a5, 1
	; LMULMAX2-RV64-NEXT: slli a5, a5, 32			; LMULMAX2-RV64-NEXT: slli a5, a5, 32
	; LMULMAX2-RV64-NEXT: srli a5, a5, 32			; LMULMAX2-RV64-NEXT: srli a5, a5, 32
	; LMULMAX2-RV64-NEXT: or a1, a5, a1			; LMULMAX2-RV64-NEXT: or a1, a5, a1
	Show All 15 Lines
	; LMULMAX2-RV64-NEXT: srli a1, a1, 2			; LMULMAX2-RV64-NEXT: srli a1, a1, 2
	; LMULMAX2-RV64-NEXT: and a1, a1, a2			; LMULMAX2-RV64-NEXT: and a1, a1, a2
	; LMULMAX2-RV64-NEXT: add a1, a5, a1			; LMULMAX2-RV64-NEXT: add a1, a5, a1
	; LMULMAX2-RV64-NEXT: srli a5, a1, 4			; LMULMAX2-RV64-NEXT: srli a5, a1, 4
	; LMULMAX2-RV64-NEXT: add a1, a1, a5			; LMULMAX2-RV64-NEXT: add a1, a1, a5
	; LMULMAX2-RV64-NEXT: and a1, a1, a3			; LMULMAX2-RV64-NEXT: and a1, a1, a3
	; LMULMAX2-RV64-NEXT: mul a1, a1, a4			; LMULMAX2-RV64-NEXT: mul a1, a1, a4
	; LMULMAX2-RV64-NEXT: srli a1, a1, 56			; LMULMAX2-RV64-NEXT: srli a1, a1, 56
	; LMULMAX2-RV64-NEXT: addi a1, a1, -32			; LMULMAX2-RV64-NEXT: addiw a1, a1, -32
	; LMULMAX2-RV64-NEXT: sw a1, 60(sp)			; LMULMAX2-RV64-NEXT: sw a1, 60(sp)
	; LMULMAX2-RV64-NEXT: vslidedown.vi v28, v26, 6			; LMULMAX2-RV64-NEXT: vslidedown.vi v28, v26, 6
	; LMULMAX2-RV64-NEXT: vmv.x.s a1, v28			; LMULMAX2-RV64-NEXT: vmv.x.s a1, v28
	; LMULMAX2-RV64-NEXT: srliw a5, a1, 1			; LMULMAX2-RV64-NEXT: srliw a5, a1, 1
	; LMULMAX2-RV64-NEXT: slli a1, a1, 32			; LMULMAX2-RV64-NEXT: slli a1, a1, 32
	; LMULMAX2-RV64-NEXT: srli a1, a1, 32			; LMULMAX2-RV64-NEXT: srli a1, a1, 32
	; LMULMAX2-RV64-NEXT: or a1, a1, a5			; LMULMAX2-RV64-NEXT: or a1, a1, a5
	; LMULMAX2-RV64-NEXT: srli a5, a1, 2			; LMULMAX2-RV64-NEXT: srli a5, a1, 2
	Show All 14 Lines
	; LMULMAX2-RV64-NEXT: srli a1, a1, 2			; LMULMAX2-RV64-NEXT: srli a1, a1, 2
	; LMULMAX2-RV64-NEXT: and a1, a1, a2			; LMULMAX2-RV64-NEXT: and a1, a1, a2
	; LMULMAX2-RV64-NEXT: add a1, a5, a1			; LMULMAX2-RV64-NEXT: add a1, a5, a1
	; LMULMAX2-RV64-NEXT: srli a5, a1, 4			; LMULMAX2-RV64-NEXT: srli a5, a1, 4
	; LMULMAX2-RV64-NEXT: add a1, a1, a5			; LMULMAX2-RV64-NEXT: add a1, a1, a5
	; LMULMAX2-RV64-NEXT: and a1, a1, a3			; LMULMAX2-RV64-NEXT: and a1, a1, a3
	; LMULMAX2-RV64-NEXT: mul a1, a1, a4			; LMULMAX2-RV64-NEXT: mul a1, a1, a4
	; LMULMAX2-RV64-NEXT: srli a1, a1, 56			; LMULMAX2-RV64-NEXT: srli a1, a1, 56
	; LMULMAX2-RV64-NEXT: addi a1, a1, -32			; LMULMAX2-RV64-NEXT: addiw a1, a1, -32
	; LMULMAX2-RV64-NEXT: sw a1, 56(sp)			; LMULMAX2-RV64-NEXT: sw a1, 56(sp)
	; LMULMAX2-RV64-NEXT: vslidedown.vi v28, v26, 5			; LMULMAX2-RV64-NEXT: vslidedown.vi v28, v26, 5
	; LMULMAX2-RV64-NEXT: vmv.x.s a1, v28			; LMULMAX2-RV64-NEXT: vmv.x.s a1, v28
	; LMULMAX2-RV64-NEXT: srliw a5, a1, 1			; LMULMAX2-RV64-NEXT: srliw a5, a1, 1
	; LMULMAX2-RV64-NEXT: slli a1, a1, 32			; LMULMAX2-RV64-NEXT: slli a1, a1, 32
	; LMULMAX2-RV64-NEXT: srli a1, a1, 32			; LMULMAX2-RV64-NEXT: srli a1, a1, 32
	; LMULMAX2-RV64-NEXT: or a1, a1, a5			; LMULMAX2-RV64-NEXT: or a1, a1, a5
	; LMULMAX2-RV64-NEXT: srli a5, a1, 2			; LMULMAX2-RV64-NEXT: srli a5, a1, 2
	Show All 14 Lines
	; LMULMAX2-RV64-NEXT: srli a1, a1, 2			; LMULMAX2-RV64-NEXT: srli a1, a1, 2
	; LMULMAX2-RV64-NEXT: and a1, a1, a2			; LMULMAX2-RV64-NEXT: and a1, a1, a2
	; LMULMAX2-RV64-NEXT: add a1, a5, a1			; LMULMAX2-RV64-NEXT: add a1, a5, a1
	; LMULMAX2-RV64-NEXT: srli a5, a1, 4			; LMULMAX2-RV64-NEXT: srli a5, a1, 4
	; LMULMAX2-RV64-NEXT: add a1, a1, a5			; LMULMAX2-RV64-NEXT: add a1, a1, a5
	; LMULMAX2-RV64-NEXT: and a1, a1, a3			; LMULMAX2-RV64-NEXT: and a1, a1, a3
	; LMULMAX2-RV64-NEXT: mul a1, a1, a4			; LMULMAX2-RV64-NEXT: mul a1, a1, a4
	; LMULMAX2-RV64-NEXT: srli a1, a1, 56			; LMULMAX2-RV64-NEXT: srli a1, a1, 56
	; LMULMAX2-RV64-NEXT: addi a1, a1, -32			; LMULMAX2-RV64-NEXT: addiw a1, a1, -32
	; LMULMAX2-RV64-NEXT: sw a1, 52(sp)			; LMULMAX2-RV64-NEXT: sw a1, 52(sp)
	; LMULMAX2-RV64-NEXT: vslidedown.vi v28, v26, 4			; LMULMAX2-RV64-NEXT: vslidedown.vi v28, v26, 4
	; LMULMAX2-RV64-NEXT: vmv.x.s a1, v28			; LMULMAX2-RV64-NEXT: vmv.x.s a1, v28
	; LMULMAX2-RV64-NEXT: srliw a5, a1, 1			; LMULMAX2-RV64-NEXT: srliw a5, a1, 1
	; LMULMAX2-RV64-NEXT: slli a1, a1, 32			; LMULMAX2-RV64-NEXT: slli a1, a1, 32
	; LMULMAX2-RV64-NEXT: srli a1, a1, 32			; LMULMAX2-RV64-NEXT: srli a1, a1, 32
	; LMULMAX2-RV64-NEXT: or a1, a1, a5			; LMULMAX2-RV64-NEXT: or a1, a1, a5
	; LMULMAX2-RV64-NEXT: srli a5, a1, 2			; LMULMAX2-RV64-NEXT: srli a5, a1, 2
	Show All 14 Lines
	; LMULMAX2-RV64-NEXT: srli a1, a1, 2			; LMULMAX2-RV64-NEXT: srli a1, a1, 2
	; LMULMAX2-RV64-NEXT: and a1, a1, a2			; LMULMAX2-RV64-NEXT: and a1, a1, a2
	; LMULMAX2-RV64-NEXT: add a1, a5, a1			; LMULMAX2-RV64-NEXT: add a1, a5, a1
	; LMULMAX2-RV64-NEXT: srli a5, a1, 4			; LMULMAX2-RV64-NEXT: srli a5, a1, 4
	; LMULMAX2-RV64-NEXT: add a1, a1, a5			; LMULMAX2-RV64-NEXT: add a1, a1, a5
	; LMULMAX2-RV64-NEXT: and a1, a1, a3			; LMULMAX2-RV64-NEXT: and a1, a1, a3
	; LMULMAX2-RV64-NEXT: mul a1, a1, a4			; LMULMAX2-RV64-NEXT: mul a1, a1, a4
	; LMULMAX2-RV64-NEXT: srli a1, a1, 56			; LMULMAX2-RV64-NEXT: srli a1, a1, 56
	; LMULMAX2-RV64-NEXT: addi a1, a1, -32			; LMULMAX2-RV64-NEXT: addiw a1, a1, -32
	; LMULMAX2-RV64-NEXT: sw a1, 48(sp)			; LMULMAX2-RV64-NEXT: sw a1, 48(sp)
	; LMULMAX2-RV64-NEXT: vslidedown.vi v28, v26, 3			; LMULMAX2-RV64-NEXT: vslidedown.vi v28, v26, 3
	; LMULMAX2-RV64-NEXT: vmv.x.s a1, v28			; LMULMAX2-RV64-NEXT: vmv.x.s a1, v28
	; LMULMAX2-RV64-NEXT: srliw a5, a1, 1			; LMULMAX2-RV64-NEXT: srliw a5, a1, 1
	; LMULMAX2-RV64-NEXT: slli a1, a1, 32			; LMULMAX2-RV64-NEXT: slli a1, a1, 32
	; LMULMAX2-RV64-NEXT: srli a1, a1, 32			; LMULMAX2-RV64-NEXT: srli a1, a1, 32
	; LMULMAX2-RV64-NEXT: or a1, a1, a5			; LMULMAX2-RV64-NEXT: or a1, a1, a5
	; LMULMAX2-RV64-NEXT: srli a5, a1, 2			; LMULMAX2-RV64-NEXT: srli a5, a1, 2
	Show All 14 Lines
	; LMULMAX2-RV64-NEXT: srli a1, a1, 2			; LMULMAX2-RV64-NEXT: srli a1, a1, 2
	; LMULMAX2-RV64-NEXT: and a1, a1, a2			; LMULMAX2-RV64-NEXT: and a1, a1, a2
	; LMULMAX2-RV64-NEXT: add a1, a5, a1			; LMULMAX2-RV64-NEXT: add a1, a5, a1
	; LMULMAX2-RV64-NEXT: srli a5, a1, 4			; LMULMAX2-RV64-NEXT: srli a5, a1, 4
	; LMULMAX2-RV64-NEXT: add a1, a1, a5			; LMULMAX2-RV64-NEXT: add a1, a1, a5
	; LMULMAX2-RV64-NEXT: and a1, a1, a3			; LMULMAX2-RV64-NEXT: and a1, a1, a3
	; LMULMAX2-RV64-NEXT: mul a1, a1, a4			; LMULMAX2-RV64-NEXT: mul a1, a1, a4
	; LMULMAX2-RV64-NEXT: srli a1, a1, 56			; LMULMAX2-RV64-NEXT: srli a1, a1, 56
	; LMULMAX2-RV64-NEXT: addi a1, a1, -32			; LMULMAX2-RV64-NEXT: addiw a1, a1, -32
	; LMULMAX2-RV64-NEXT: sw a1, 44(sp)			; LMULMAX2-RV64-NEXT: sw a1, 44(sp)
	; LMULMAX2-RV64-NEXT: vslidedown.vi v28, v26, 2			; LMULMAX2-RV64-NEXT: vslidedown.vi v28, v26, 2
	; LMULMAX2-RV64-NEXT: vmv.x.s a1, v28			; LMULMAX2-RV64-NEXT: vmv.x.s a1, v28
	; LMULMAX2-RV64-NEXT: srliw a5, a1, 1			; LMULMAX2-RV64-NEXT: srliw a5, a1, 1
	; LMULMAX2-RV64-NEXT: slli a1, a1, 32			; LMULMAX2-RV64-NEXT: slli a1, a1, 32
	; LMULMAX2-RV64-NEXT: srli a1, a1, 32			; LMULMAX2-RV64-NEXT: srli a1, a1, 32
	; LMULMAX2-RV64-NEXT: or a1, a1, a5			; LMULMAX2-RV64-NEXT: or a1, a1, a5
	; LMULMAX2-RV64-NEXT: srli a5, a1, 2			; LMULMAX2-RV64-NEXT: srli a5, a1, 2
	Show All 14 Lines
	; LMULMAX2-RV64-NEXT: srli a1, a1, 2			; LMULMAX2-RV64-NEXT: srli a1, a1, 2
	; LMULMAX2-RV64-NEXT: and a1, a1, a2			; LMULMAX2-RV64-NEXT: and a1, a1, a2
	; LMULMAX2-RV64-NEXT: add a1, a5, a1			; LMULMAX2-RV64-NEXT: add a1, a5, a1
	; LMULMAX2-RV64-NEXT: srli a5, a1, 4			; LMULMAX2-RV64-NEXT: srli a5, a1, 4
	; LMULMAX2-RV64-NEXT: add a1, a1, a5			; LMULMAX2-RV64-NEXT: add a1, a1, a5
	; LMULMAX2-RV64-NEXT: and a1, a1, a3			; LMULMAX2-RV64-NEXT: and a1, a1, a3
	; LMULMAX2-RV64-NEXT: mul a1, a1, a4			; LMULMAX2-RV64-NEXT: mul a1, a1, a4
	; LMULMAX2-RV64-NEXT: srli a1, a1, 56			; LMULMAX2-RV64-NEXT: srli a1, a1, 56
	; LMULMAX2-RV64-NEXT: addi a1, a1, -32			; LMULMAX2-RV64-NEXT: addiw a1, a1, -32
	; LMULMAX2-RV64-NEXT: sw a1, 40(sp)			; LMULMAX2-RV64-NEXT: sw a1, 40(sp)
	; LMULMAX2-RV64-NEXT: vslidedown.vi v26, v26, 1			; LMULMAX2-RV64-NEXT: vslidedown.vi v26, v26, 1
	; LMULMAX2-RV64-NEXT: vmv.x.s a1, v26			; LMULMAX2-RV64-NEXT: vmv.x.s a1, v26
	; LMULMAX2-RV64-NEXT: srliw a5, a1, 1			; LMULMAX2-RV64-NEXT: srliw a5, a1, 1
	; LMULMAX2-RV64-NEXT: slli a1, a1, 32			; LMULMAX2-RV64-NEXT: slli a1, a1, 32
	; LMULMAX2-RV64-NEXT: srli a1, a1, 32			; LMULMAX2-RV64-NEXT: srli a1, a1, 32
	; LMULMAX2-RV64-NEXT: or a1, a1, a5			; LMULMAX2-RV64-NEXT: or a1, a1, a5
	; LMULMAX2-RV64-NEXT: srli a5, a1, 2			; LMULMAX2-RV64-NEXT: srli a5, a1, 2
	Show All 14 Lines
	; LMULMAX2-RV64-NEXT: srli a1, a1, 2			; LMULMAX2-RV64-NEXT: srli a1, a1, 2
	; LMULMAX2-RV64-NEXT: and a1, a1, a2			; LMULMAX2-RV64-NEXT: and a1, a1, a2
	; LMULMAX2-RV64-NEXT: add a1, a5, a1			; LMULMAX2-RV64-NEXT: add a1, a5, a1
	; LMULMAX2-RV64-NEXT: srli a2, a1, 4			; LMULMAX2-RV64-NEXT: srli a2, a1, 4
	; LMULMAX2-RV64-NEXT: add a1, a1, a2			; LMULMAX2-RV64-NEXT: add a1, a1, a2
	; LMULMAX2-RV64-NEXT: and a1, a1, a3			; LMULMAX2-RV64-NEXT: and a1, a1, a3
	; LMULMAX2-RV64-NEXT: mul a1, a1, a4			; LMULMAX2-RV64-NEXT: mul a1, a1, a4
	; LMULMAX2-RV64-NEXT: srli a1, a1, 56			; LMULMAX2-RV64-NEXT: srli a1, a1, 56
	; LMULMAX2-RV64-NEXT: addi a1, a1, -32			; LMULMAX2-RV64-NEXT: addiw a1, a1, -32
	; LMULMAX2-RV64-NEXT: sw a1, 36(sp)			; LMULMAX2-RV64-NEXT: sw a1, 36(sp)
	; LMULMAX2-RV64-NEXT: vsetivli zero, 8, e32, m2, ta, mu			; LMULMAX2-RV64-NEXT: vsetivli zero, 8, e32, m2, ta, mu
	; LMULMAX2-RV64-NEXT: addi a1, sp, 32			; LMULMAX2-RV64-NEXT: addi a1, sp, 32
	; LMULMAX2-RV64-NEXT: vle32.v v26, (a1)			; LMULMAX2-RV64-NEXT: vle32.v v26, (a1)
	; LMULMAX2-RV64-NEXT: vse32.v v26, (a0)			; LMULMAX2-RV64-NEXT: vse32.v v26, (a0)
	; LMULMAX2-RV64-NEXT: addi sp, s0, -96			; LMULMAX2-RV64-NEXT: addi sp, s0, -96
	; LMULMAX2-RV64-NEXT: ld s0, 80(sp) # 8-byte Folded Reload			; LMULMAX2-RV64-NEXT: ld s0, 80(sp) # 8-byte Folded Reload
	; LMULMAX2-RV64-NEXT: ld ra, 88(sp) # 8-byte Folded Reload			; LMULMAX2-RV64-NEXT: ld ra, 88(sp) # 8-byte Folded Reload
	▲ Show 20 Lines • Show All 294 Lines • ▼ Show 20 Lines
	; LMULMAX1-RV64-NEXT: lui a5, 4112			; LMULMAX1-RV64-NEXT: lui a5, 4112
	; LMULMAX1-RV64-NEXT: addiw a5, a5, 257			; LMULMAX1-RV64-NEXT: addiw a5, a5, 257
	; LMULMAX1-RV64-NEXT: slli a5, a5, 16			; LMULMAX1-RV64-NEXT: slli a5, a5, 16
	; LMULMAX1-RV64-NEXT: addi a5, a5, 257			; LMULMAX1-RV64-NEXT: addi a5, a5, 257
	; LMULMAX1-RV64-NEXT: slli a5, a5, 16			; LMULMAX1-RV64-NEXT: slli a5, a5, 16
	; LMULMAX1-RV64-NEXT: addi a5, a5, 257			; LMULMAX1-RV64-NEXT: addi a5, a5, 257
	; LMULMAX1-RV64-NEXT: mul a1, a1, a5			; LMULMAX1-RV64-NEXT: mul a1, a1, a5
	; LMULMAX1-RV64-NEXT: srli a1, a1, 56			; LMULMAX1-RV64-NEXT: srli a1, a1, 56
	; LMULMAX1-RV64-NEXT: addi a1, a1, -32			; LMULMAX1-RV64-NEXT: addiw a1, a1, -32
	; LMULMAX1-RV64-NEXT: sw a1, 32(sp)			; LMULMAX1-RV64-NEXT: sw a1, 32(sp)
	; LMULMAX1-RV64-NEXT: vsetivli zero, 1, e32, m1, ta, mu			; LMULMAX1-RV64-NEXT: vsetivli zero, 1, e32, m1, ta, mu
	; LMULMAX1-RV64-NEXT: vslidedown.vi v27, v26, 3			; LMULMAX1-RV64-NEXT: vslidedown.vi v27, v26, 3
	; LMULMAX1-RV64-NEXT: vmv.x.s a1, v27			; LMULMAX1-RV64-NEXT: vmv.x.s a1, v27
	; LMULMAX1-RV64-NEXT: srliw a2, a1, 1			; LMULMAX1-RV64-NEXT: srliw a2, a1, 1
	; LMULMAX1-RV64-NEXT: slli a1, a1, 32			; LMULMAX1-RV64-NEXT: slli a1, a1, 32
	; LMULMAX1-RV64-NEXT: srli a1, a1, 32			; LMULMAX1-RV64-NEXT: srli a1, a1, 32
	; LMULMAX1-RV64-NEXT: or a1, a1, a2			; LMULMAX1-RV64-NEXT: or a1, a1, a2
	Show All 15 Lines
	; LMULMAX1-RV64-NEXT: srli a1, a1, 2			; LMULMAX1-RV64-NEXT: srli a1, a1, 2
	; LMULMAX1-RV64-NEXT: and a1, a1, a3			; LMULMAX1-RV64-NEXT: and a1, a1, a3
	; LMULMAX1-RV64-NEXT: add a1, a2, a1			; LMULMAX1-RV64-NEXT: add a1, a2, a1
	; LMULMAX1-RV64-NEXT: srli a2, a1, 4			; LMULMAX1-RV64-NEXT: srli a2, a1, 4
	; LMULMAX1-RV64-NEXT: add a1, a1, a2			; LMULMAX1-RV64-NEXT: add a1, a1, a2
	; LMULMAX1-RV64-NEXT: and a1, a1, a4			; LMULMAX1-RV64-NEXT: and a1, a1, a4
	; LMULMAX1-RV64-NEXT: mul a1, a1, a5			; LMULMAX1-RV64-NEXT: mul a1, a1, a5
	; LMULMAX1-RV64-NEXT: srli a1, a1, 56			; LMULMAX1-RV64-NEXT: srli a1, a1, 56
	; LMULMAX1-RV64-NEXT: addi a1, a1, -32			; LMULMAX1-RV64-NEXT: addiw a1, a1, -32
	; LMULMAX1-RV64-NEXT: sw a1, 44(sp)			; LMULMAX1-RV64-NEXT: sw a1, 44(sp)
	; LMULMAX1-RV64-NEXT: vslidedown.vi v27, v26, 2			; LMULMAX1-RV64-NEXT: vslidedown.vi v27, v26, 2
	; LMULMAX1-RV64-NEXT: vmv.x.s a1, v27			; LMULMAX1-RV64-NEXT: vmv.x.s a1, v27
	; LMULMAX1-RV64-NEXT: srliw a2, a1, 1			; LMULMAX1-RV64-NEXT: srliw a2, a1, 1
	; LMULMAX1-RV64-NEXT: slli a1, a1, 32			; LMULMAX1-RV64-NEXT: slli a1, a1, 32
	; LMULMAX1-RV64-NEXT: srli a1, a1, 32			; LMULMAX1-RV64-NEXT: srli a1, a1, 32
	; LMULMAX1-RV64-NEXT: or a1, a1, a2			; LMULMAX1-RV64-NEXT: or a1, a1, a2
	; LMULMAX1-RV64-NEXT: srli a2, a1, 2			; LMULMAX1-RV64-NEXT: srli a2, a1, 2
	Show All 14 Lines
	; LMULMAX1-RV64-NEXT: srli a1, a1, 2			; LMULMAX1-RV64-NEXT: srli a1, a1, 2
	; LMULMAX1-RV64-NEXT: and a1, a1, a3			; LMULMAX1-RV64-NEXT: and a1, a1, a3
	; LMULMAX1-RV64-NEXT: add a1, a2, a1			; LMULMAX1-RV64-NEXT: add a1, a2, a1
	; LMULMAX1-RV64-NEXT: srli a2, a1, 4			; LMULMAX1-RV64-NEXT: srli a2, a1, 4
	; LMULMAX1-RV64-NEXT: add a1, a1, a2			; LMULMAX1-RV64-NEXT: add a1, a1, a2
	; LMULMAX1-RV64-NEXT: and a1, a1, a4			; LMULMAX1-RV64-NEXT: and a1, a1, a4
	; LMULMAX1-RV64-NEXT: mul a1, a1, a5			; LMULMAX1-RV64-NEXT: mul a1, a1, a5
	; LMULMAX1-RV64-NEXT: srli a1, a1, 56			; LMULMAX1-RV64-NEXT: srli a1, a1, 56
	; LMULMAX1-RV64-NEXT: addi a1, a1, -32			; LMULMAX1-RV64-NEXT: addiw a1, a1, -32
	; LMULMAX1-RV64-NEXT: sw a1, 40(sp)			; LMULMAX1-RV64-NEXT: sw a1, 40(sp)
	; LMULMAX1-RV64-NEXT: vslidedown.vi v26, v26, 1			; LMULMAX1-RV64-NEXT: vslidedown.vi v26, v26, 1
	; LMULMAX1-RV64-NEXT: vmv.x.s a1, v26			; LMULMAX1-RV64-NEXT: vmv.x.s a1, v26
	; LMULMAX1-RV64-NEXT: srliw a2, a1, 1			; LMULMAX1-RV64-NEXT: srliw a2, a1, 1
	; LMULMAX1-RV64-NEXT: slli a1, a1, 32			; LMULMAX1-RV64-NEXT: slli a1, a1, 32
	; LMULMAX1-RV64-NEXT: srli a1, a1, 32			; LMULMAX1-RV64-NEXT: srli a1, a1, 32
	; LMULMAX1-RV64-NEXT: or a1, a1, a2			; LMULMAX1-RV64-NEXT: or a1, a1, a2
	; LMULMAX1-RV64-NEXT: srli a2, a1, 2			; LMULMAX1-RV64-NEXT: srli a2, a1, 2
	Show All 14 Lines
	; LMULMAX1-RV64-NEXT: srli a1, a1, 2			; LMULMAX1-RV64-NEXT: srli a1, a1, 2
	; LMULMAX1-RV64-NEXT: and a1, a1, a3			; LMULMAX1-RV64-NEXT: and a1, a1, a3
	; LMULMAX1-RV64-NEXT: add a1, a2, a1			; LMULMAX1-RV64-NEXT: add a1, a2, a1
	; LMULMAX1-RV64-NEXT: srli a2, a1, 4			; LMULMAX1-RV64-NEXT: srli a2, a1, 4
	; LMULMAX1-RV64-NEXT: add a1, a1, a2			; LMULMAX1-RV64-NEXT: add a1, a1, a2
	; LMULMAX1-RV64-NEXT: and a1, a1, a4			; LMULMAX1-RV64-NEXT: and a1, a1, a4
	; LMULMAX1-RV64-NEXT: mul a1, a1, a5			; LMULMAX1-RV64-NEXT: mul a1, a1, a5
	; LMULMAX1-RV64-NEXT: srli a1, a1, 56			; LMULMAX1-RV64-NEXT: srli a1, a1, 56
	; LMULMAX1-RV64-NEXT: addi a1, a1, -32			; LMULMAX1-RV64-NEXT: addiw a1, a1, -32
	; LMULMAX1-RV64-NEXT: sw a1, 36(sp)			; LMULMAX1-RV64-NEXT: sw a1, 36(sp)
	; LMULMAX1-RV64-NEXT: vmv.x.s a1, v25			; LMULMAX1-RV64-NEXT: vmv.x.s a1, v25
	; LMULMAX1-RV64-NEXT: srliw a2, a1, 1			; LMULMAX1-RV64-NEXT: srliw a2, a1, 1
	; LMULMAX1-RV64-NEXT: slli a1, a1, 32			; LMULMAX1-RV64-NEXT: slli a1, a1, 32
	; LMULMAX1-RV64-NEXT: srli a1, a1, 32			; LMULMAX1-RV64-NEXT: srli a1, a1, 32
	; LMULMAX1-RV64-NEXT: or a1, a1, a2			; LMULMAX1-RV64-NEXT: or a1, a1, a2
	; LMULMAX1-RV64-NEXT: srli a2, a1, 2			; LMULMAX1-RV64-NEXT: srli a2, a1, 2
	; LMULMAX1-RV64-NEXT: or a1, a1, a2			; LMULMAX1-RV64-NEXT: or a1, a1, a2
	Show All 13 Lines
	; LMULMAX1-RV64-NEXT: srli a1, a1, 2			; LMULMAX1-RV64-NEXT: srli a1, a1, 2
	; LMULMAX1-RV64-NEXT: and a1, a1, a3			; LMULMAX1-RV64-NEXT: and a1, a1, a3
	; LMULMAX1-RV64-NEXT: add a1, a2, a1			; LMULMAX1-RV64-NEXT: add a1, a2, a1
	; LMULMAX1-RV64-NEXT: srli a2, a1, 4			; LMULMAX1-RV64-NEXT: srli a2, a1, 4
	; LMULMAX1-RV64-NEXT: add a1, a1, a2			; LMULMAX1-RV64-NEXT: add a1, a1, a2
	; LMULMAX1-RV64-NEXT: and a1, a1, a4			; LMULMAX1-RV64-NEXT: and a1, a1, a4
	; LMULMAX1-RV64-NEXT: mul a1, a1, a5			; LMULMAX1-RV64-NEXT: mul a1, a1, a5
	; LMULMAX1-RV64-NEXT: srli a1, a1, 56			; LMULMAX1-RV64-NEXT: srli a1, a1, 56
	; LMULMAX1-RV64-NEXT: addi a1, a1, -32			; LMULMAX1-RV64-NEXT: addiw a1, a1, -32
	; LMULMAX1-RV64-NEXT: sw a1, 16(sp)			; LMULMAX1-RV64-NEXT: sw a1, 16(sp)
	; LMULMAX1-RV64-NEXT: vslidedown.vi v26, v25, 3			; LMULMAX1-RV64-NEXT: vslidedown.vi v26, v25, 3
	; LMULMAX1-RV64-NEXT: vmv.x.s a1, v26			; LMULMAX1-RV64-NEXT: vmv.x.s a1, v26
	; LMULMAX1-RV64-NEXT: srliw a2, a1, 1			; LMULMAX1-RV64-NEXT: srliw a2, a1, 1
	; LMULMAX1-RV64-NEXT: slli a1, a1, 32			; LMULMAX1-RV64-NEXT: slli a1, a1, 32
	; LMULMAX1-RV64-NEXT: srli a1, a1, 32			; LMULMAX1-RV64-NEXT: srli a1, a1, 32
	; LMULMAX1-RV64-NEXT: or a1, a1, a2			; LMULMAX1-RV64-NEXT: or a1, a1, a2
	; LMULMAX1-RV64-NEXT: srli a2, a1, 2			; LMULMAX1-RV64-NEXT: srli a2, a1, 2
	Show All 14 Lines
	; LMULMAX1-RV64-NEXT: srli a1, a1, 2			; LMULMAX1-RV64-NEXT: srli a1, a1, 2
	; LMULMAX1-RV64-NEXT: and a1, a1, a3			; LMULMAX1-RV64-NEXT: and a1, a1, a3
	; LMULMAX1-RV64-NEXT: add a1, a2, a1			; LMULMAX1-RV64-NEXT: add a1, a2, a1
	; LMULMAX1-RV64-NEXT: srli a2, a1, 4			; LMULMAX1-RV64-NEXT: srli a2, a1, 4
	; LMULMAX1-RV64-NEXT: add a1, a1, a2			; LMULMAX1-RV64-NEXT: add a1, a1, a2
	; LMULMAX1-RV64-NEXT: and a1, a1, a4			; LMULMAX1-RV64-NEXT: and a1, a1, a4
	; LMULMAX1-RV64-NEXT: mul a1, a1, a5			; LMULMAX1-RV64-NEXT: mul a1, a1, a5
	; LMULMAX1-RV64-NEXT: srli a1, a1, 56			; LMULMAX1-RV64-NEXT: srli a1, a1, 56
	; LMULMAX1-RV64-NEXT: addi a1, a1, -32			; LMULMAX1-RV64-NEXT: addiw a1, a1, -32
	; LMULMAX1-RV64-NEXT: sw a1, 28(sp)			; LMULMAX1-RV64-NEXT: sw a1, 28(sp)
	; LMULMAX1-RV64-NEXT: vslidedown.vi v26, v25, 2			; LMULMAX1-RV64-NEXT: vslidedown.vi v26, v25, 2
	; LMULMAX1-RV64-NEXT: vmv.x.s a1, v26			; LMULMAX1-RV64-NEXT: vmv.x.s a1, v26
	; LMULMAX1-RV64-NEXT: srliw a2, a1, 1			; LMULMAX1-RV64-NEXT: srliw a2, a1, 1
	; LMULMAX1-RV64-NEXT: slli a1, a1, 32			; LMULMAX1-RV64-NEXT: slli a1, a1, 32
	; LMULMAX1-RV64-NEXT: srli a1, a1, 32			; LMULMAX1-RV64-NEXT: srli a1, a1, 32
	; LMULMAX1-RV64-NEXT: or a1, a1, a2			; LMULMAX1-RV64-NEXT: or a1, a1, a2
	; LMULMAX1-RV64-NEXT: srli a2, a1, 2			; LMULMAX1-RV64-NEXT: srli a2, a1, 2
	Show All 14 Lines
	; LMULMAX1-RV64-NEXT: srli a1, a1, 2			; LMULMAX1-RV64-NEXT: srli a1, a1, 2
	; LMULMAX1-RV64-NEXT: and a1, a1, a3			; LMULMAX1-RV64-NEXT: and a1, a1, a3
	; LMULMAX1-RV64-NEXT: add a1, a2, a1			; LMULMAX1-RV64-NEXT: add a1, a2, a1
	; LMULMAX1-RV64-NEXT: srli a2, a1, 4			; LMULMAX1-RV64-NEXT: srli a2, a1, 4
	; LMULMAX1-RV64-NEXT: add a1, a1, a2			; LMULMAX1-RV64-NEXT: add a1, a1, a2
	; LMULMAX1-RV64-NEXT: and a1, a1, a4			; LMULMAX1-RV64-NEXT: and a1, a1, a4
	; LMULMAX1-RV64-NEXT: mul a1, a1, a5			; LMULMAX1-RV64-NEXT: mul a1, a1, a5
	; LMULMAX1-RV64-NEXT: srli a1, a1, 56			; LMULMAX1-RV64-NEXT: srli a1, a1, 56
	; LMULMAX1-RV64-NEXT: addi a1, a1, -32			; LMULMAX1-RV64-NEXT: addiw a1, a1, -32
	; LMULMAX1-RV64-NEXT: sw a1, 24(sp)			; LMULMAX1-RV64-NEXT: sw a1, 24(sp)
	; LMULMAX1-RV64-NEXT: vslidedown.vi v25, v25, 1			; LMULMAX1-RV64-NEXT: vslidedown.vi v25, v25, 1
	; LMULMAX1-RV64-NEXT: vmv.x.s a1, v25			; LMULMAX1-RV64-NEXT: vmv.x.s a1, v25
	; LMULMAX1-RV64-NEXT: srliw a2, a1, 1			; LMULMAX1-RV64-NEXT: srliw a2, a1, 1
	; LMULMAX1-RV64-NEXT: slli a1, a1, 32			; LMULMAX1-RV64-NEXT: slli a1, a1, 32
	; LMULMAX1-RV64-NEXT: srli a1, a1, 32			; LMULMAX1-RV64-NEXT: srli a1, a1, 32
	; LMULMAX1-RV64-NEXT: or a1, a1, a2			; LMULMAX1-RV64-NEXT: or a1, a1, a2
	; LMULMAX1-RV64-NEXT: srli a2, a1, 2			; LMULMAX1-RV64-NEXT: srli a2, a1, 2
	Show All 14 Lines
	; LMULMAX1-RV64-NEXT: srli a1, a1, 2			; LMULMAX1-RV64-NEXT: srli a1, a1, 2
	; LMULMAX1-RV64-NEXT: and a1, a1, a3			; LMULMAX1-RV64-NEXT: and a1, a1, a3
	; LMULMAX1-RV64-NEXT: add a1, a2, a1			; LMULMAX1-RV64-NEXT: add a1, a2, a1
	; LMULMAX1-RV64-NEXT: srli a2, a1, 4			; LMULMAX1-RV64-NEXT: srli a2, a1, 4
	; LMULMAX1-RV64-NEXT: add a1, a1, a2			; LMULMAX1-RV64-NEXT: add a1, a1, a2
	; LMULMAX1-RV64-NEXT: and a1, a1, a4			; LMULMAX1-RV64-NEXT: and a1, a1, a4
	; LMULMAX1-RV64-NEXT: mul a1, a1, a5			; LMULMAX1-RV64-NEXT: mul a1, a1, a5
	; LMULMAX1-RV64-NEXT: srli a1, a1, 56			; LMULMAX1-RV64-NEXT: srli a1, a1, 56
	; LMULMAX1-RV64-NEXT: addi a1, a1, -32			; LMULMAX1-RV64-NEXT: addiw a1, a1, -32
	; LMULMAX1-RV64-NEXT: sw a1, 20(sp)			; LMULMAX1-RV64-NEXT: sw a1, 20(sp)
	; LMULMAX1-RV64-NEXT: vsetivli zero, 4, e32, m1, ta, mu			; LMULMAX1-RV64-NEXT: vsetivli zero, 4, e32, m1, ta, mu
	; LMULMAX1-RV64-NEXT: addi a1, sp, 16			; LMULMAX1-RV64-NEXT: addi a1, sp, 16
	; LMULMAX1-RV64-NEXT: vle32.v v25, (a1)			; LMULMAX1-RV64-NEXT: vle32.v v25, (a1)
	; LMULMAX1-RV64-NEXT: addi a1, sp, 32			; LMULMAX1-RV64-NEXT: addi a1, sp, 32
	; LMULMAX1-RV64-NEXT: vle32.v v26, (a1)			; LMULMAX1-RV64-NEXT: vle32.v v26, (a1)
	; LMULMAX1-RV64-NEXT: vse32.v v25, (a0)			; LMULMAX1-RV64-NEXT: vse32.v v25, (a0)
	; LMULMAX1-RV64-NEXT: vse32.v v26, (a6)			; LMULMAX1-RV64-NEXT: vse32.v v26, (a6)
	▲ Show 20 Lines • Show All 863 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/sadd_sat_plus.ll

	Show First 20 Lines • Show All 225 Lines • ▼ Show 20 Lines
	; RV32I-NEXT: .LBB2_4:			; RV32I-NEXT: .LBB2_4:
	; RV32I-NEXT: lui a0, 1048568			; RV32I-NEXT: lui a0, 1048568
	; RV32I-NEXT: ret			; RV32I-NEXT: ret
	;			;
	; RV64I-LABEL: func16:			; RV64I-LABEL: func16:
	; RV64I: # %bb.0:			; RV64I: # %bb.0:
	; RV64I-NEXT: slli a0, a0, 48			; RV64I-NEXT: slli a0, a0, 48
	; RV64I-NEXT: srai a0, a0, 48			; RV64I-NEXT: srai a0, a0, 48
	; RV64I-NEXT: mul a1, a1, a2			; RV64I-NEXT: mulw a1, a1, a2
	; RV64I-NEXT: slli a1, a1, 48			; RV64I-NEXT: slli a1, a1, 48
	; RV64I-NEXT: srai a1, a1, 48			; RV64I-NEXT: srai a1, a1, 48
	; RV64I-NEXT: add a0, a0, a1			; RV64I-NEXT: add a0, a0, a1
	; RV64I-NEXT: lui a1, 8			; RV64I-NEXT: lui a1, 8
	; RV64I-NEXT: addiw a1, a1, -1			; RV64I-NEXT: addiw a1, a1, -1
	; RV64I-NEXT: bge a0, a1, .LBB2_3			; RV64I-NEXT: bge a0, a1, .LBB2_3
	; RV64I-NEXT: # %bb.1:			; RV64I-NEXT: # %bb.1:
	; RV64I-NEXT: lui a1, 1048568			; RV64I-NEXT: lui a1, 1048568
	▲ Show 20 Lines • Show All 61 Lines • ▼ Show 20 Lines
	; RV32I-NEXT: .LBB3_4:			; RV32I-NEXT: .LBB3_4:
	; RV32I-NEXT: addi a0, zero, -128			; RV32I-NEXT: addi a0, zero, -128
	; RV32I-NEXT: ret			; RV32I-NEXT: ret
	;			;
	; RV64I-LABEL: func8:			; RV64I-LABEL: func8:
	; RV64I: # %bb.0:			; RV64I: # %bb.0:
	; RV64I-NEXT: slli a0, a0, 56			; RV64I-NEXT: slli a0, a0, 56
	; RV64I-NEXT: srai a0, a0, 56			; RV64I-NEXT: srai a0, a0, 56
	; RV64I-NEXT: mul a1, a1, a2			; RV64I-NEXT: mulw a1, a1, a2
	; RV64I-NEXT: slli a1, a1, 56			; RV64I-NEXT: slli a1, a1, 56
	; RV64I-NEXT: srai a1, a1, 56			; RV64I-NEXT: srai a1, a1, 56
	; RV64I-NEXT: add a0, a0, a1			; RV64I-NEXT: add a0, a0, a1
	; RV64I-NEXT: addi a1, zero, 127			; RV64I-NEXT: addi a1, zero, 127
	; RV64I-NEXT: bge a0, a1, .LBB3_3			; RV64I-NEXT: bge a0, a1, .LBB3_3
	; RV64I-NEXT: # %bb.1:			; RV64I-NEXT: # %bb.1:
	; RV64I-NEXT: addi a1, zero, -128			; RV64I-NEXT: addi a1, zero, -128
	; RV64I-NEXT: bge a1, a0, .LBB3_4			; RV64I-NEXT: bge a1, a0, .LBB3_4
	▲ Show 20 Lines • Show All 58 Lines • ▼ Show 20 Lines
	; RV32I-NEXT: .LBB4_4:			; RV32I-NEXT: .LBB4_4:
	; RV32I-NEXT: addi a0, zero, -8			; RV32I-NEXT: addi a0, zero, -8
	; RV32I-NEXT: ret			; RV32I-NEXT: ret
	;			;
	; RV64I-LABEL: func4:			; RV64I-LABEL: func4:
	; RV64I: # %bb.0:			; RV64I: # %bb.0:
	; RV64I-NEXT: slli a0, a0, 60			; RV64I-NEXT: slli a0, a0, 60
	; RV64I-NEXT: srai a0, a0, 60			; RV64I-NEXT: srai a0, a0, 60
	; RV64I-NEXT: mul a1, a1, a2			; RV64I-NEXT: mulw a1, a1, a2
	; RV64I-NEXT: slli a1, a1, 60			; RV64I-NEXT: slli a1, a1, 60
	; RV64I-NEXT: srai a1, a1, 60			; RV64I-NEXT: srai a1, a1, 60
	; RV64I-NEXT: add a0, a0, a1			; RV64I-NEXT: add a0, a0, a1
	; RV64I-NEXT: addi a1, zero, 7			; RV64I-NEXT: addi a1, zero, 7
	; RV64I-NEXT: bge a0, a1, .LBB4_3			; RV64I-NEXT: bge a0, a1, .LBB4_3
	; RV64I-NEXT: # %bb.1:			; RV64I-NEXT: # %bb.1:
	; RV64I-NEXT: addi a1, zero, -8			; RV64I-NEXT: addi a1, zero, -8
	; RV64I-NEXT: bge a1, a0, .LBB4_4			; RV64I-NEXT: bge a1, a0, .LBB4_4
	Show All 20 Lines
	; RV32IZbb-NEXT: addi a1, zero, -8			; RV32IZbb-NEXT: addi a1, zero, -8
	; RV32IZbb-NEXT: max a0, a0, a1			; RV32IZbb-NEXT: max a0, a0, a1
	; RV32IZbb-NEXT: ret			; RV32IZbb-NEXT: ret
	;			;
	; RV64IZbb-LABEL: func4:			; RV64IZbb-LABEL: func4:
	; RV64IZbb: # %bb.0:			; RV64IZbb: # %bb.0:
	; RV64IZbb-NEXT: slli a0, a0, 60			; RV64IZbb-NEXT: slli a0, a0, 60
	; RV64IZbb-NEXT: srai a0, a0, 60			; RV64IZbb-NEXT: srai a0, a0, 60
	; RV64IZbb-NEXT: mul a1, a1, a2			; RV64IZbb-NEXT: mulw a1, a1, a2
	; RV64IZbb-NEXT: slli a1, a1, 60			; RV64IZbb-NEXT: slli a1, a1, 60
	; RV64IZbb-NEXT: srai a1, a1, 60			; RV64IZbb-NEXT: srai a1, a1, 60
	; RV64IZbb-NEXT: add a0, a0, a1			; RV64IZbb-NEXT: add a0, a0, a1
	; RV64IZbb-NEXT: addi a1, zero, 7			; RV64IZbb-NEXT: addi a1, zero, 7
	; RV64IZbb-NEXT: min a0, a0, a1			; RV64IZbb-NEXT: min a0, a0, a1
	; RV64IZbb-NEXT: addi a1, zero, -8			; RV64IZbb-NEXT: addi a1, zero, -8
	; RV64IZbb-NEXT: max a0, a0, a1			; RV64IZbb-NEXT: max a0, a0, a1
	; RV64IZbb-NEXT: ret			; RV64IZbb-NEXT: ret
	%a = mul i4 %y, %z			%a = mul i4 %y, %z
	%tmp = call i4 @llvm.sadd.sat.i4(i4 %x, i4 %a)			%tmp = call i4 @llvm.sadd.sat.i4(i4 %x, i4 %a)
	ret i4 %tmp			ret i4 %tmp
	}			}

llvm/test/CodeGen/RISCV/shadowcallstack.ll

	Show First 20 Lines • Show All 115 Lines • ▼ Show 20 Lines
	; RV64-NEXT: .cfi_offset s3, -32			; RV64-NEXT: .cfi_offset s3, -32
	; RV64-NEXT: call bar@plt			; RV64-NEXT: call bar@plt
	; RV64-NEXT: mv s3, a0			; RV64-NEXT: mv s3, a0
	; RV64-NEXT: call bar@plt			; RV64-NEXT: call bar@plt
	; RV64-NEXT: mv s1, a0			; RV64-NEXT: mv s1, a0
	; RV64-NEXT: call bar@plt			; RV64-NEXT: call bar@plt
	; RV64-NEXT: mv s0, a0			; RV64-NEXT: mv s0, a0
	; RV64-NEXT: call bar@plt			; RV64-NEXT: call bar@plt
	; RV64-NEXT: add a1, s3, s1			; RV64-NEXT: addw a1, s3, s1
	; RV64-NEXT: add a0, s0, a0			; RV64-NEXT: addw a0, s0, a0
	; RV64-NEXT: addw a0, a1, a0			; RV64-NEXT: addw a0, a1, a0
	; RV64-NEXT: ld s3, 0(sp) # 8-byte Folded Reload			; RV64-NEXT: ld s3, 0(sp) # 8-byte Folded Reload
	; RV64-NEXT: ld s1, 8(sp) # 8-byte Folded Reload			; RV64-NEXT: ld s1, 8(sp) # 8-byte Folded Reload
	; RV64-NEXT: ld s0, 16(sp) # 8-byte Folded Reload			; RV64-NEXT: ld s0, 16(sp) # 8-byte Folded Reload
	; RV64-NEXT: ld ra, 24(sp) # 8-byte Folded Reload			; RV64-NEXT: ld ra, 24(sp) # 8-byte Folded Reload
	; RV64-NEXT: addi sp, sp, 32			; RV64-NEXT: addi sp, sp, 32
	; RV64-NEXT: ld ra, -8(s2)			; RV64-NEXT: ld ra, -8(s2)
	; RV64-NEXT: addi s2, s2, -8			; RV64-NEXT: addi s2, s2, -8
	▲ Show 20 Lines • Show All 41 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/shift-masked-shamt.ll

	Show First 20 Lines • Show All 106 Lines • ▼ Show 20 Lines
	; RV32I-LABEL: sll_redundant_mask_zeros:			; RV32I-LABEL: sll_redundant_mask_zeros:
	; RV32I: # %bb.0:			; RV32I: # %bb.0:
	; RV32I-NEXT: slli a1, a1, 1			; RV32I-NEXT: slli a1, a1, 1
	; RV32I-NEXT: sll a0, a0, a1			; RV32I-NEXT: sll a0, a0, a1
	; RV32I-NEXT: ret			; RV32I-NEXT: ret
	;			;
	; RV64I-LABEL: sll_redundant_mask_zeros:			; RV64I-LABEL: sll_redundant_mask_zeros:
	; RV64I: # %bb.0:			; RV64I: # %bb.0:
	; RV64I-NEXT: slli a1, a1, 1			; RV64I-NEXT: slliw a1, a1, 1
	; RV64I-NEXT: sllw a0, a0, a1			; RV64I-NEXT: sllw a0, a0, a1
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	%1 = shl i32 %b, 1			%1 = shl i32 %b, 1
	%2 = and i32 %1, 30			%2 = and i32 %1, 30
	%3 = shl i32 %a, %2			%3 = shl i32 %a, %2
	ret i32 %3			ret i32 %3
	}			}

	define i32 @srl_redundant_mask_zeros(i32 %a, i32 %b) nounwind {			define i32 @srl_redundant_mask_zeros(i32 %a, i32 %b) nounwind {
	; RV32I-LABEL: srl_redundant_mask_zeros:			; RV32I-LABEL: srl_redundant_mask_zeros:
	; RV32I: # %bb.0:			; RV32I: # %bb.0:
	; RV32I-NEXT: slli a1, a1, 2			; RV32I-NEXT: slli a1, a1, 2
	; RV32I-NEXT: srl a0, a0, a1			; RV32I-NEXT: srl a0, a0, a1
	; RV32I-NEXT: ret			; RV32I-NEXT: ret
	;			;
	; RV64I-LABEL: srl_redundant_mask_zeros:			; RV64I-LABEL: srl_redundant_mask_zeros:
	; RV64I: # %bb.0:			; RV64I: # %bb.0:
	; RV64I-NEXT: slli a1, a1, 2			; RV64I-NEXT: slliw a1, a1, 2
	; RV64I-NEXT: srlw a0, a0, a1			; RV64I-NEXT: srlw a0, a0, a1
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	%1 = shl i32 %b, 2			%1 = shl i32 %b, 2
	%2 = and i32 %1, 28			%2 = and i32 %1, 28
	%3 = lshr i32 %a, %2			%3 = lshr i32 %a, %2
	ret i32 %3			ret i32 %3
	}			}

	define i32 @sra_redundant_mask_zeros(i32 %a, i32 %b) nounwind {			define i32 @sra_redundant_mask_zeros(i32 %a, i32 %b) nounwind {
	; RV32I-LABEL: sra_redundant_mask_zeros:			; RV32I-LABEL: sra_redundant_mask_zeros:
	; RV32I: # %bb.0:			; RV32I: # %bb.0:
	; RV32I-NEXT: slli a1, a1, 3			; RV32I-NEXT: slli a1, a1, 3
	; RV32I-NEXT: sra a0, a0, a1			; RV32I-NEXT: sra a0, a0, a1
	; RV32I-NEXT: ret			; RV32I-NEXT: ret
	;			;
	; RV64I-LABEL: sra_redundant_mask_zeros:			; RV64I-LABEL: sra_redundant_mask_zeros:
	; RV64I: # %bb.0:			; RV64I: # %bb.0:
	; RV64I-NEXT: slli a1, a1, 3			; RV64I-NEXT: slliw a1, a1, 3
	; RV64I-NEXT: sraw a0, a0, a1			; RV64I-NEXT: sraw a0, a0, a1
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	%1 = shl i32 %b, 3			%1 = shl i32 %b, 3
	%2 = and i32 %1, 24			%2 = and i32 %1, 24
	%3 = ashr i32 %a, %2			%3 = ashr i32 %a, %2
	ret i32 %3			ret i32 %3
	}			}

	▲ Show 20 Lines • Show All 95 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/srem-lkk.ll

	Show First 20 Lines • Show All 48 Lines • ▼ Show 20 Lines
	; RV64IM-NEXT: sext.w a1, a0			; RV64IM-NEXT: sext.w a1, a0
	; RV64IM-NEXT: lui a2, 706409			; RV64IM-NEXT: lui a2, 706409
	; RV64IM-NEXT: addiw a2, a2, 389			; RV64IM-NEXT: addiw a2, a2, 389
	; RV64IM-NEXT: mul a1, a1, a2			; RV64IM-NEXT: mul a1, a1, a2
	; RV64IM-NEXT: srli a1, a1, 32			; RV64IM-NEXT: srli a1, a1, 32
	; RV64IM-NEXT: addw a1, a1, a0			; RV64IM-NEXT: addw a1, a1, a0
	; RV64IM-NEXT: srliw a2, a1, 31			; RV64IM-NEXT: srliw a2, a1, 31
	; RV64IM-NEXT: srli a1, a1, 6			; RV64IM-NEXT: srli a1, a1, 6
	; RV64IM-NEXT: add a1, a1, a2			; RV64IM-NEXT: addw a1, a1, a2
	; RV64IM-NEXT: addi a2, zero, 95			; RV64IM-NEXT: addi a2, zero, 95
	; RV64IM-NEXT: mul a1, a1, a2			; RV64IM-NEXT: mulw a1, a1, a2
	; RV64IM-NEXT: subw a0, a0, a1			; RV64IM-NEXT: subw a0, a0, a1
	; RV64IM-NEXT: ret			; RV64IM-NEXT: ret
	%1 = srem i32 %x, 95			%1 = srem i32 %x, 95
	ret i32 %1			ret i32 %1
	}			}


	define i32 @fold_srem_positive_even(i32 %x) nounwind {			define i32 @fold_srem_positive_even(i32 %x) nounwind {
	Show All 34 Lines
	; RV64IM-LABEL: fold_srem_positive_even:			; RV64IM-LABEL: fold_srem_positive_even:
	; RV64IM: # %bb.0:			; RV64IM: # %bb.0:
	; RV64IM-NEXT: sext.w a1, a0			; RV64IM-NEXT: sext.w a1, a0
	; RV64IM-NEXT: lui a2, 253241			; RV64IM-NEXT: lui a2, 253241
	; RV64IM-NEXT: addiw a2, a2, -15			; RV64IM-NEXT: addiw a2, a2, -15
	; RV64IM-NEXT: mul a1, a1, a2			; RV64IM-NEXT: mul a1, a1, a2
	; RV64IM-NEXT: srli a2, a1, 63			; RV64IM-NEXT: srli a2, a1, 63
	; RV64IM-NEXT: srai a1, a1, 40			; RV64IM-NEXT: srai a1, a1, 40
	; RV64IM-NEXT: add a1, a1, a2			; RV64IM-NEXT: addw a1, a1, a2
	; RV64IM-NEXT: addi a2, zero, 1060			; RV64IM-NEXT: addi a2, zero, 1060
	; RV64IM-NEXT: mul a1, a1, a2			; RV64IM-NEXT: mulw a1, a1, a2
	; RV64IM-NEXT: subw a0, a0, a1			; RV64IM-NEXT: subw a0, a0, a1
	; RV64IM-NEXT: ret			; RV64IM-NEXT: ret
	%1 = srem i32 %x, 1060			%1 = srem i32 %x, 1060
	ret i32 %1			ret i32 %1
	}			}


	define i32 @fold_srem_negative_odd(i32 %x) nounwind {			define i32 @fold_srem_negative_odd(i32 %x) nounwind {
	Show All 34 Lines
	; RV64IM-LABEL: fold_srem_negative_odd:			; RV64IM-LABEL: fold_srem_negative_odd:
	; RV64IM: # %bb.0:			; RV64IM: # %bb.0:
	; RV64IM-NEXT: sext.w a1, a0			; RV64IM-NEXT: sext.w a1, a0
	; RV64IM-NEXT: lui a2, 677296			; RV64IM-NEXT: lui a2, 677296
	; RV64IM-NEXT: addiw a2, a2, -91			; RV64IM-NEXT: addiw a2, a2, -91
	; RV64IM-NEXT: mul a1, a1, a2			; RV64IM-NEXT: mul a1, a1, a2
	; RV64IM-NEXT: srli a2, a1, 63			; RV64IM-NEXT: srli a2, a1, 63
	; RV64IM-NEXT: srai a1, a1, 40			; RV64IM-NEXT: srai a1, a1, 40
	; RV64IM-NEXT: add a1, a1, a2			; RV64IM-NEXT: addw a1, a1, a2
	; RV64IM-NEXT: addi a2, zero, -723			; RV64IM-NEXT: addi a2, zero, -723
	; RV64IM-NEXT: mul a1, a1, a2			; RV64IM-NEXT: mulw a1, a1, a2
	; RV64IM-NEXT: subw a0, a0, a1			; RV64IM-NEXT: subw a0, a0, a1
	; RV64IM-NEXT: ret			; RV64IM-NEXT: ret
	%1 = srem i32 %x, -723			%1 = srem i32 %x, -723
	ret i32 %1			ret i32 %1
	}			}


	define i32 @fold_srem_negative_even(i32 %x) nounwind {			define i32 @fold_srem_negative_even(i32 %x) nounwind {
	Show All 37 Lines
	; RV64IM-LABEL: fold_srem_negative_even:			; RV64IM-LABEL: fold_srem_negative_even:
	; RV64IM: # %bb.0:			; RV64IM: # %bb.0:
	; RV64IM-NEXT: sext.w a1, a0			; RV64IM-NEXT: sext.w a1, a0
	; RV64IM-NEXT: lui a2, 1036895			; RV64IM-NEXT: lui a2, 1036895
	; RV64IM-NEXT: addiw a2, a2, 999			; RV64IM-NEXT: addiw a2, a2, 999
	; RV64IM-NEXT: mul a1, a1, a2			; RV64IM-NEXT: mul a1, a1, a2
	; RV64IM-NEXT: srli a2, a1, 63			; RV64IM-NEXT: srli a2, a1, 63
	; RV64IM-NEXT: srai a1, a1, 40			; RV64IM-NEXT: srai a1, a1, 40
	; RV64IM-NEXT: add a1, a1, a2			; RV64IM-NEXT: addw a1, a1, a2
	; RV64IM-NEXT: lui a2, 1048570			; RV64IM-NEXT: lui a2, 1048570
	; RV64IM-NEXT: addiw a2, a2, 1595			; RV64IM-NEXT: addiw a2, a2, 1595
	; RV64IM-NEXT: mul a1, a1, a2			; RV64IM-NEXT: mulw a1, a1, a2
	; RV64IM-NEXT: subw a0, a0, a1			; RV64IM-NEXT: subw a0, a0, a1
	; RV64IM-NEXT: ret			; RV64IM-NEXT: ret
	%1 = srem i32 %x, -22981			%1 = srem i32 %x, -22981
	ret i32 %1			ret i32 %1
	}			}


	; Don't fold if we can combine srem with sdiv.			; Don't fold if we can combine srem with sdiv.
	▲ Show 20 Lines • Show All 56 Lines • ▼ Show 20 Lines
	;			;
	; RV64IM-LABEL: combine_srem_sdiv:			; RV64IM-LABEL: combine_srem_sdiv:
	; RV64IM: # %bb.0:			; RV64IM: # %bb.0:
	; RV64IM-NEXT: sext.w a1, a0			; RV64IM-NEXT: sext.w a1, a0
	; RV64IM-NEXT: lui a2, 706409			; RV64IM-NEXT: lui a2, 706409
	; RV64IM-NEXT: addiw a2, a2, 389			; RV64IM-NEXT: addiw a2, a2, 389
	; RV64IM-NEXT: mul a1, a1, a2			; RV64IM-NEXT: mul a1, a1, a2
	; RV64IM-NEXT: srli a1, a1, 32			; RV64IM-NEXT: srli a1, a1, 32
	; RV64IM-NEXT: addw a2, a1, a0			; RV64IM-NEXT: addw a1, a1, a0
	; RV64IM-NEXT: srliw a2, a2, 31			; RV64IM-NEXT: srliw a2, a1, 31
	; RV64IM-NEXT: add a1, a1, a0
	; RV64IM-NEXT: sraiw a1, a1, 6			; RV64IM-NEXT: sraiw a1, a1, 6
	; RV64IM-NEXT: add a1, a1, a2			; RV64IM-NEXT: addw a1, a1, a2
	; RV64IM-NEXT: addi a2, zero, 95			; RV64IM-NEXT: addi a2, zero, 95
	; RV64IM-NEXT: mul a2, a1, a2			; RV64IM-NEXT: mulw a2, a1, a2
	; RV64IM-NEXT: sub a0, a0, a2			; RV64IM-NEXT: subw a0, a0, a2
	; RV64IM-NEXT: addw a0, a0, a1			; RV64IM-NEXT: addw a0, a0, a1
	; RV64IM-NEXT: ret			; RV64IM-NEXT: ret
	%1 = srem i32 %x, 95			%1 = srem i32 %x, 95
	%2 = sdiv i32 %x, 95			%2 = sdiv i32 %x, 95
	%3 = add i32 %1, %2			%3 = add i32 %1, %2
	ret i32 %3			ret i32 %3
	}			}

	▲ Show 20 Lines • Show All 151 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/srem-seteq-illegal-types.ll

	Show First 20 Lines • Show All 456 Lines • ▼ Show 20 Lines
	; RV64-NEXT: snez a2, a2			; RV64-NEXT: snez a2, a2
	; RV64-NEXT: neg a0, a0			; RV64-NEXT: neg a0, a0
	; RV64-NEXT: neg a2, a2			; RV64-NEXT: neg a2, a2
	; RV64-NEXT: neg a3, a1			; RV64-NEXT: neg a3, a1
	; RV64-NEXT: slli a4, s5, 32			; RV64-NEXT: slli a4, s5, 32
	; RV64-NEXT: and a3, a3, a4			; RV64-NEXT: and a3, a3, a4
	; RV64-NEXT: srli a3, a3, 32			; RV64-NEXT: srli a3, a3, 32
	; RV64-NEXT: sb a3, 12(s0)			; RV64-NEXT: sb a3, 12(s0)
	; RV64-NEXT: slli a1, a1, 2			; RV64-NEXT: slliw a1, a1, 2
	; RV64-NEXT: srli a3, s4, 31			; RV64-NEXT: srli a3, s4, 31
	; RV64-NEXT: and a2, a2, a3			; RV64-NEXT: and a2, a2, a3
	; RV64-NEXT: srli a4, a2, 31			; RV64-NEXT: srli a4, a2, 31
	; RV64-NEXT: sub a1, a4, a1			; RV64-NEXT: subw a1, a4, a1
	; RV64-NEXT: sw a1, 8(s0)			; RV64-NEXT: sw a1, 8(s0)
	; RV64-NEXT: and a0, a0, a3			; RV64-NEXT: and a0, a0, a3
	; RV64-NEXT: slli a1, a2, 33			; RV64-NEXT: slli a1, a2, 33
	; RV64-NEXT: or a0, a0, a1			; RV64-NEXT: or a0, a0, a1
	; RV64-NEXT: sd a0, 0(s0)			; RV64-NEXT: sd a0, 0(s0)
	; RV64-NEXT: ld s5, 8(sp) # 8-byte Folded Reload			; RV64-NEXT: ld s5, 8(sp) # 8-byte Folded Reload
	; RV64-NEXT: ld s4, 16(sp) # 8-byte Folded Reload			; RV64-NEXT: ld s4, 16(sp) # 8-byte Folded Reload
	; RV64-NEXT: ld s3, 24(sp) # 8-byte Folded Reload			; RV64-NEXT: ld s3, 24(sp) # 8-byte Folded Reload
	▲ Show 20 Lines • Show All 166 Lines • ▼ Show 20 Lines
	; RV64M-NEXT: neg a1, a1			; RV64M-NEXT: neg a1, a1
	; RV64M-NEXT: neg a4, a2			; RV64M-NEXT: neg a4, a2
	; RV64M-NEXT: neg a3, a3			; RV64M-NEXT: neg a3, a3
	; RV64M-NEXT: addi a5, zero, 7			; RV64M-NEXT: addi a5, zero, 7
	; RV64M-NEXT: slli a5, a5, 32			; RV64M-NEXT: slli a5, a5, 32
	; RV64M-NEXT: and a4, a4, a5			; RV64M-NEXT: and a4, a4, a5
	; RV64M-NEXT: srli a4, a4, 32			; RV64M-NEXT: srli a4, a4, 32
	; RV64M-NEXT: sb a4, 12(a0)			; RV64M-NEXT: sb a4, 12(a0)
	; RV64M-NEXT: slli a2, a2, 2			; RV64M-NEXT: slliw a2, a2, 2
	; RV64M-NEXT: srli a4, a6, 31			; RV64M-NEXT: srli a4, a6, 31
	; RV64M-NEXT: and a1, a1, a4			; RV64M-NEXT: and a1, a1, a4
	; RV64M-NEXT: srli a5, a1, 31			; RV64M-NEXT: srli a5, a1, 31
	; RV64M-NEXT: sub a2, a5, a2			; RV64M-NEXT: subw a2, a5, a2
	; RV64M-NEXT: sw a2, 8(a0)			; RV64M-NEXT: sw a2, 8(a0)
	; RV64M-NEXT: slli a1, a1, 33			; RV64M-NEXT: slli a1, a1, 33
	; RV64M-NEXT: and a2, a3, a4			; RV64M-NEXT: and a2, a3, a4
	; RV64M-NEXT: or a1, a2, a1			; RV64M-NEXT: or a1, a2, a1
	; RV64M-NEXT: sd a1, 0(a0)			; RV64M-NEXT: sd a1, 0(a0)
	; RV64M-NEXT: ret			; RV64M-NEXT: ret
	;			;
	; RV32MV-LABEL: test_srem_vec:			; RV32MV-LABEL: test_srem_vec:
	▲ Show 20 Lines • Show All 217 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/srem-vector-lkk.ll

	Show First 20 Lines • Show All 159 Lines • ▼ Show 20 Lines
	; RV64IM-NEXT: slli a5, a5, 12			; RV64IM-NEXT: slli a5, a5, 12
	; RV64IM-NEXT: addi a5, a5, -905			; RV64IM-NEXT: addi a5, a5, -905
	; RV64IM-NEXT: slli a5, a5, 12			; RV64IM-NEXT: slli a5, a5, 12
	; RV64IM-NEXT: addi a5, a5, -1767			; RV64IM-NEXT: addi a5, a5, -1767
	; RV64IM-NEXT: mulh a5, a1, a5			; RV64IM-NEXT: mulh a5, a1, a5
	; RV64IM-NEXT: add a5, a5, a1			; RV64IM-NEXT: add a5, a5, a1
	; RV64IM-NEXT: srli a2, a5, 63			; RV64IM-NEXT: srli a2, a5, 63
	; RV64IM-NEXT: srli a5, a5, 6			; RV64IM-NEXT: srli a5, a5, 6
	; RV64IM-NEXT: add a2, a5, a2			; RV64IM-NEXT: addw a2, a5, a2
	; RV64IM-NEXT: addi a5, zero, 95			; RV64IM-NEXT: addi a5, zero, 95
	; RV64IM-NEXT: mul a2, a2, a5			; RV64IM-NEXT: mulw a2, a2, a5
	; RV64IM-NEXT: sub a1, a1, a2			; RV64IM-NEXT: subw a1, a1, a2
	; RV64IM-NEXT: lui a2, 777976			; RV64IM-NEXT: lui a2, 777976
	; RV64IM-NEXT: addiw a2, a2, -1057			; RV64IM-NEXT: addiw a2, a2, -1057
	; RV64IM-NEXT: slli a2, a2, 15			; RV64IM-NEXT: slli a2, a2, 15
	; RV64IM-NEXT: addi a2, a2, -1057			; RV64IM-NEXT: addi a2, a2, -1057
	; RV64IM-NEXT: slli a2, a2, 14			; RV64IM-NEXT: slli a2, a2, 14
	; RV64IM-NEXT: addi a2, a2, -529			; RV64IM-NEXT: addi a2, a2, -529
	; RV64IM-NEXT: srli a2, a2, 1			; RV64IM-NEXT: srli a2, a2, 1
	; RV64IM-NEXT: mulh a2, a4, a2			; RV64IM-NEXT: mulh a2, a4, a2
	; RV64IM-NEXT: sub a2, a2, a4			; RV64IM-NEXT: sub a2, a2, a4
	; RV64IM-NEXT: srli a5, a2, 63			; RV64IM-NEXT: srli a5, a2, 63
	; RV64IM-NEXT: srli a2, a2, 6			; RV64IM-NEXT: srli a2, a2, 6
	; RV64IM-NEXT: add a2, a2, a5			; RV64IM-NEXT: addw a2, a2, a5
	; RV64IM-NEXT: addi a5, zero, -124			; RV64IM-NEXT: addi a5, zero, -124
	; RV64IM-NEXT: mul a2, a2, a5			; RV64IM-NEXT: mulw a2, a2, a5
	; RV64IM-NEXT: sub a2, a4, a2			; RV64IM-NEXT: subw a2, a4, a2
	; RV64IM-NEXT: lui a4, 2675			; RV64IM-NEXT: lui a4, 2675
	; RV64IM-NEXT: addiw a4, a4, -251			; RV64IM-NEXT: addiw a4, a4, -251
	; RV64IM-NEXT: slli a4, a4, 13			; RV64IM-NEXT: slli a4, a4, 13
	; RV64IM-NEXT: addi a4, a4, 1839			; RV64IM-NEXT: addi a4, a4, 1839
	; RV64IM-NEXT: slli a4, a4, 13			; RV64IM-NEXT: slli a4, a4, 13
	; RV64IM-NEXT: addi a4, a4, 167			; RV64IM-NEXT: addi a4, a4, 167
	; RV64IM-NEXT: slli a4, a4, 13			; RV64IM-NEXT: slli a4, a4, 13
	; RV64IM-NEXT: addi a4, a4, 1505			; RV64IM-NEXT: addi a4, a4, 1505
	; RV64IM-NEXT: mulh a4, a3, a4			; RV64IM-NEXT: mulh a4, a3, a4
	; RV64IM-NEXT: srli a5, a4, 63			; RV64IM-NEXT: srli a5, a4, 63
	; RV64IM-NEXT: srli a4, a4, 5			; RV64IM-NEXT: srli a4, a4, 5
	; RV64IM-NEXT: add a4, a4, a5			; RV64IM-NEXT: addw a4, a4, a5
	; RV64IM-NEXT: addi a5, zero, 98			; RV64IM-NEXT: addi a5, zero, 98
	; RV64IM-NEXT: mul a4, a4, a5			; RV64IM-NEXT: mulw a4, a4, a5
	; RV64IM-NEXT: sub a3, a3, a4			; RV64IM-NEXT: subw a3, a3, a4
	; RV64IM-NEXT: lui a4, 1040212			; RV64IM-NEXT: lui a4, 1040212
	; RV64IM-NEXT: addiw a4, a4, 1977			; RV64IM-NEXT: addiw a4, a4, 1977
	; RV64IM-NEXT: slli a4, a4, 12			; RV64IM-NEXT: slli a4, a4, 12
	; RV64IM-NEXT: addi a4, a4, -1907			; RV64IM-NEXT: addi a4, a4, -1907
	; RV64IM-NEXT: slli a4, a4, 12			; RV64IM-NEXT: slli a4, a4, 12
	; RV64IM-NEXT: addi a4, a4, -453			; RV64IM-NEXT: addi a4, a4, -453
	; RV64IM-NEXT: slli a4, a4, 12			; RV64IM-NEXT: slli a4, a4, 12
	; RV64IM-NEXT: addi a4, a4, -1213			; RV64IM-NEXT: addi a4, a4, -1213
	; RV64IM-NEXT: mulh a4, a6, a4			; RV64IM-NEXT: mulh a4, a6, a4
	; RV64IM-NEXT: srli a5, a4, 63			; RV64IM-NEXT: srli a5, a4, 63
	; RV64IM-NEXT: srli a4, a4, 7			; RV64IM-NEXT: srli a4, a4, 7
	; RV64IM-NEXT: add a4, a4, a5			; RV64IM-NEXT: addw a4, a4, a5
	; RV64IM-NEXT: addi a5, zero, -1003			; RV64IM-NEXT: addi a5, zero, -1003
	; RV64IM-NEXT: mul a4, a4, a5			; RV64IM-NEXT: mulw a4, a4, a5
	; RV64IM-NEXT: sub a4, a6, a4			; RV64IM-NEXT: subw a4, a6, a4
	; RV64IM-NEXT: sh a4, 6(a0)			; RV64IM-NEXT: sh a4, 6(a0)
	; RV64IM-NEXT: sh a3, 4(a0)			; RV64IM-NEXT: sh a3, 4(a0)
	; RV64IM-NEXT: sh a2, 2(a0)			; RV64IM-NEXT: sh a2, 2(a0)
	; RV64IM-NEXT: sh a1, 0(a0)			; RV64IM-NEXT: sh a1, 0(a0)
	; RV64IM-NEXT: ret			; RV64IM-NEXT: ret
	%1 = srem <4 x i16> %x, <i16 95, i16 -124, i16 98, i16 -1003>			%1 = srem <4 x i16> %x, <i16 95, i16 -124, i16 98, i16 -1003>
	ret <4 x i16> %1			ret <4 x i16> %1
	}			}
	▲ Show 20 Lines • Show All 143 Lines • ▼ Show 20 Lines
	; RV64IM-NEXT: slli a5, a5, 12			; RV64IM-NEXT: slli a5, a5, 12
	; RV64IM-NEXT: addi a5, a5, -905			; RV64IM-NEXT: addi a5, a5, -905
	; RV64IM-NEXT: slli a5, a5, 12			; RV64IM-NEXT: slli a5, a5, 12
	; RV64IM-NEXT: addi a5, a5, -1767			; RV64IM-NEXT: addi a5, a5, -1767
	; RV64IM-NEXT: mulh a2, a1, a5			; RV64IM-NEXT: mulh a2, a1, a5
	; RV64IM-NEXT: add a2, a2, a1			; RV64IM-NEXT: add a2, a2, a1
	; RV64IM-NEXT: srli a3, a2, 63			; RV64IM-NEXT: srli a3, a2, 63
	; RV64IM-NEXT: srli a2, a2, 6			; RV64IM-NEXT: srli a2, a2, 6
	; RV64IM-NEXT: add a2, a2, a3			; RV64IM-NEXT: addw a2, a2, a3
	; RV64IM-NEXT: addi a3, zero, 95			; RV64IM-NEXT: addi a3, zero, 95
	; RV64IM-NEXT: mul a2, a2, a3			; RV64IM-NEXT: mulw a2, a2, a3
	; RV64IM-NEXT: sub t0, a1, a2			; RV64IM-NEXT: subw t0, a1, a2
	; RV64IM-NEXT: mulh a2, a4, a5			; RV64IM-NEXT: mulh a2, a4, a5
	; RV64IM-NEXT: add a2, a2, a4			; RV64IM-NEXT: add a2, a2, a4
	; RV64IM-NEXT: srli a1, a2, 63			; RV64IM-NEXT: srli a1, a2, 63
	; RV64IM-NEXT: srli a2, a2, 6			; RV64IM-NEXT: srli a2, a2, 6
	; RV64IM-NEXT: add a1, a2, a1			; RV64IM-NEXT: addw a1, a2, a1
	; RV64IM-NEXT: mul a1, a1, a3			; RV64IM-NEXT: mulw a1, a1, a3
	; RV64IM-NEXT: sub a1, a4, a1			; RV64IM-NEXT: subw a1, a4, a1
	; RV64IM-NEXT: mulh a2, a7, a5			; RV64IM-NEXT: mulh a2, a7, a5
	; RV64IM-NEXT: add a2, a2, a7			; RV64IM-NEXT: add a2, a2, a7
	; RV64IM-NEXT: srli a4, a2, 63			; RV64IM-NEXT: srli a4, a2, 63
	; RV64IM-NEXT: srli a2, a2, 6			; RV64IM-NEXT: srli a2, a2, 6
	; RV64IM-NEXT: add a2, a2, a4			; RV64IM-NEXT: addw a2, a2, a4
	; RV64IM-NEXT: mul a2, a2, a3			; RV64IM-NEXT: mulw a2, a2, a3
	; RV64IM-NEXT: sub a2, a7, a2			; RV64IM-NEXT: subw a2, a7, a2
	; RV64IM-NEXT: mulh a4, a6, a5			; RV64IM-NEXT: mulh a4, a6, a5
	; RV64IM-NEXT: add a4, a4, a6			; RV64IM-NEXT: add a4, a4, a6
	; RV64IM-NEXT: srli a5, a4, 63			; RV64IM-NEXT: srli a5, a4, 63
	; RV64IM-NEXT: srli a4, a4, 6			; RV64IM-NEXT: srli a4, a4, 6
	; RV64IM-NEXT: add a4, a4, a5			; RV64IM-NEXT: addw a4, a4, a5
	; RV64IM-NEXT: mul a3, a4, a3			; RV64IM-NEXT: mulw a3, a4, a3
	; RV64IM-NEXT: sub a3, a6, a3			; RV64IM-NEXT: subw a3, a6, a3
	; RV64IM-NEXT: sh a3, 6(a0)			; RV64IM-NEXT: sh a3, 6(a0)
	; RV64IM-NEXT: sh a2, 4(a0)			; RV64IM-NEXT: sh a2, 4(a0)
	; RV64IM-NEXT: sh a1, 2(a0)			; RV64IM-NEXT: sh a1, 2(a0)
	; RV64IM-NEXT: sh t0, 0(a0)			; RV64IM-NEXT: sh t0, 0(a0)
	; RV64IM-NEXT: ret			; RV64IM-NEXT: ret
	%1 = srem <4 x i16> %x, <i16 95, i16 95, i16 95, i16 95>			%1 = srem <4 x i16> %x, <i16 95, i16 95, i16 95, i16 95>
	ret <4 x i16> %1			ret <4 x i16> %1
	}			}
	▲ Show 20 Lines • Show All 165 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: mv s4, a0			; RV64I-NEXT: mv s4, a0
	; RV64I-NEXT: addi a1, zero, 95			; RV64I-NEXT: addi a1, zero, 95
	; RV64I-NEXT: mv a0, s3			; RV64I-NEXT: mv a0, s3
	; RV64I-NEXT: call __divdi3@plt			; RV64I-NEXT: call __divdi3@plt
	; RV64I-NEXT: mv s1, a0			; RV64I-NEXT: mv s1, a0
	; RV64I-NEXT: addi a1, zero, 95			; RV64I-NEXT: addi a1, zero, 95
	; RV64I-NEXT: mv a0, s2			; RV64I-NEXT: mv a0, s2
	; RV64I-NEXT: call __divdi3@plt			; RV64I-NEXT: call __divdi3@plt
	; RV64I-NEXT: add a0, s8, a0			; RV64I-NEXT: addw a0, s8, a0
	; RV64I-NEXT: add a1, s7, s1			; RV64I-NEXT: addw a1, s7, s1
	; RV64I-NEXT: add a2, s6, s4			; RV64I-NEXT: addw a2, s6, s4
	; RV64I-NEXT: add a3, s5, s9			; RV64I-NEXT: addw a3, s5, s9
	; RV64I-NEXT: sh a3, 6(s0)			; RV64I-NEXT: sh a3, 6(s0)
	; RV64I-NEXT: sh a2, 4(s0)			; RV64I-NEXT: sh a2, 4(s0)
	; RV64I-NEXT: sh a1, 2(s0)			; RV64I-NEXT: sh a1, 2(s0)
	; RV64I-NEXT: sh a0, 0(s0)			; RV64I-NEXT: sh a0, 0(s0)
	; RV64I-NEXT: ld s9, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld s9, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: ld s8, 16(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld s8, 16(sp) # 8-byte Folded Reload
	; RV64I-NEXT: ld s7, 24(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld s7, 24(sp) # 8-byte Folded Reload
	; RV64I-NEXT: ld s6, 32(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld s6, 32(sp) # 8-byte Folded Reload
	Show All 20 Lines
	; RV64IM-NEXT: slli a5, a5, 12			; RV64IM-NEXT: slli a5, a5, 12
	; RV64IM-NEXT: addi a5, a5, -905			; RV64IM-NEXT: addi a5, a5, -905
	; RV64IM-NEXT: slli a5, a5, 12			; RV64IM-NEXT: slli a5, a5, 12
	; RV64IM-NEXT: addi a5, a5, -1767			; RV64IM-NEXT: addi a5, a5, -1767
	; RV64IM-NEXT: mulh a2, a1, a5			; RV64IM-NEXT: mulh a2, a1, a5
	; RV64IM-NEXT: add a2, a2, a1			; RV64IM-NEXT: add a2, a2, a1
	; RV64IM-NEXT: srli a3, a2, 63			; RV64IM-NEXT: srli a3, a2, 63
	; RV64IM-NEXT: srai a2, a2, 6			; RV64IM-NEXT: srai a2, a2, 6
	; RV64IM-NEXT: add t3, a2, a3			; RV64IM-NEXT: addw t3, a2, a3
	; RV64IM-NEXT: addi t0, zero, 95			; RV64IM-NEXT: addi t0, zero, 95
	; RV64IM-NEXT: mul a3, t3, t0			; RV64IM-NEXT: mulw a3, t3, t0
	; RV64IM-NEXT: sub t1, a1, a3			; RV64IM-NEXT: subw t1, a1, a3
	; RV64IM-NEXT: mulh a3, a4, a5			; RV64IM-NEXT: mulh a3, a4, a5
	; RV64IM-NEXT: add a3, a3, a4			; RV64IM-NEXT: add a3, a3, a4
	; RV64IM-NEXT: srli a1, a3, 63			; RV64IM-NEXT: srli a1, a3, 63
	; RV64IM-NEXT: srai a3, a3, 6			; RV64IM-NEXT: srai a3, a3, 6
	; RV64IM-NEXT: add a1, a3, a1			; RV64IM-NEXT: addw a1, a3, a1
	; RV64IM-NEXT: mul a3, a1, t0			; RV64IM-NEXT: mulw a3, a1, t0
	; RV64IM-NEXT: sub t2, a4, a3			; RV64IM-NEXT: subw t2, a4, a3
	; RV64IM-NEXT: mulh a4, a7, a5			; RV64IM-NEXT: mulh a4, a7, a5
	; RV64IM-NEXT: add a4, a4, a7			; RV64IM-NEXT: add a4, a4, a7
	; RV64IM-NEXT: srli a3, a4, 63			; RV64IM-NEXT: srli a3, a4, 63
	; RV64IM-NEXT: srai a4, a4, 6			; RV64IM-NEXT: srai a4, a4, 6
	; RV64IM-NEXT: add a3, a4, a3			; RV64IM-NEXT: addw a3, a4, a3
	; RV64IM-NEXT: mul a4, a3, t0			; RV64IM-NEXT: mulw a4, a3, t0
	; RV64IM-NEXT: sub a4, a7, a4			; RV64IM-NEXT: subw a4, a7, a4
	; RV64IM-NEXT: mulh a5, a6, a5			; RV64IM-NEXT: mulh a5, a6, a5
	; RV64IM-NEXT: add a5, a5, a6			; RV64IM-NEXT: add a5, a5, a6
	; RV64IM-NEXT: srli a2, a5, 63			; RV64IM-NEXT: srli a2, a5, 63
	; RV64IM-NEXT: srai a5, a5, 6			; RV64IM-NEXT: srai a5, a5, 6
	; RV64IM-NEXT: add a2, a5, a2			; RV64IM-NEXT: addw a2, a5, a2
	; RV64IM-NEXT: mul a5, a2, t0			; RV64IM-NEXT: mulw a5, a2, t0
	; RV64IM-NEXT: sub a5, a6, a5			; RV64IM-NEXT: subw a5, a6, a5
	; RV64IM-NEXT: add a2, a5, a2			; RV64IM-NEXT: addw a2, a5, a2
	; RV64IM-NEXT: add a3, a4, a3			; RV64IM-NEXT: addw a3, a4, a3
	; RV64IM-NEXT: add a1, t2, a1			; RV64IM-NEXT: addw a1, t2, a1
	; RV64IM-NEXT: add a4, t1, t3			; RV64IM-NEXT: addw a4, t1, t3
	; RV64IM-NEXT: sh a4, 6(a0)			; RV64IM-NEXT: sh a4, 6(a0)
	; RV64IM-NEXT: sh a1, 4(a0)			; RV64IM-NEXT: sh a1, 4(a0)
	; RV64IM-NEXT: sh a3, 2(a0)			; RV64IM-NEXT: sh a3, 2(a0)
	; RV64IM-NEXT: sh a2, 0(a0)			; RV64IM-NEXT: sh a2, 0(a0)
	; RV64IM-NEXT: ret			; RV64IM-NEXT: ret
	%1 = srem <4 x i16> %x, <i16 95, i16 95, i16 95, i16 95>			%1 = srem <4 x i16> %x, <i16 95, i16 95, i16 95, i16 95>
	%2 = sdiv <4 x i16> %x, <i16 95, i16 95, i16 95, i16 95>			%2 = sdiv <4 x i16> %x, <i16 95, i16 95, i16 95, i16 95>
	%3 = add <4 x i16> %1, %2			%3 = add <4 x i16> %1, %2
	▲ Show 20 Lines • Show All 86 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: mv s0, a0			; RV64I-NEXT: mv s0, a0
	; RV64I-NEXT: lh a2, 0(a1)			; RV64I-NEXT: lh a2, 0(a1)
	; RV64I-NEXT: lh a0, 24(a1)			; RV64I-NEXT: lh a0, 24(a1)
	; RV64I-NEXT: lh a3, 16(a1)			; RV64I-NEXT: lh a3, 16(a1)
	; RV64I-NEXT: lh a1, 8(a1)			; RV64I-NEXT: lh a1, 8(a1)
	; RV64I-NEXT: srli a4, a2, 58			; RV64I-NEXT: srli a4, a2, 58
	; RV64I-NEXT: add a4, a2, a4			; RV64I-NEXT: add a4, a2, a4
	; RV64I-NEXT: andi a4, a4, -64			; RV64I-NEXT: andi a4, a4, -64
	; RV64I-NEXT: sub s2, a2, a4			; RV64I-NEXT: subw s2, a2, a4
	; RV64I-NEXT: srli a2, a1, 59			; RV64I-NEXT: srli a2, a1, 59
	; RV64I-NEXT: add a2, a1, a2			; RV64I-NEXT: add a2, a1, a2
	; RV64I-NEXT: andi a2, a2, -32			; RV64I-NEXT: andi a2, a2, -32
	; RV64I-NEXT: sub s3, a1, a2			; RV64I-NEXT: subw s3, a1, a2
	; RV64I-NEXT: srli a1, a3, 61			; RV64I-NEXT: srli a1, a3, 61
	; RV64I-NEXT: add a1, a3, a1			; RV64I-NEXT: add a1, a3, a1
	; RV64I-NEXT: andi a1, a1, -8			; RV64I-NEXT: andi a1, a1, -8
	; RV64I-NEXT: sub s1, a3, a1			; RV64I-NEXT: subw s1, a3, a1
	; RV64I-NEXT: addi a1, zero, 95			; RV64I-NEXT: addi a1, zero, 95
	; RV64I-NEXT: call __moddi3@plt			; RV64I-NEXT: call __moddi3@plt
	; RV64I-NEXT: sh a0, 6(s0)			; RV64I-NEXT: sh a0, 6(s0)
	; RV64I-NEXT: sh s1, 4(s0)			; RV64I-NEXT: sh s1, 4(s0)
	; RV64I-NEXT: sh s3, 2(s0)			; RV64I-NEXT: sh s3, 2(s0)
	; RV64I-NEXT: sh s2, 0(s0)			; RV64I-NEXT: sh s2, 0(s0)
	; RV64I-NEXT: ld s3, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld s3, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: ld s2, 16(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld s2, 16(sp) # 8-byte Folded Reload
	Show All 16 Lines
	; RV64IM-NEXT: slli a5, a5, 12			; RV64IM-NEXT: slli a5, a5, 12
	; RV64IM-NEXT: addi a5, a5, -905			; RV64IM-NEXT: addi a5, a5, -905
	; RV64IM-NEXT: slli a5, a5, 12			; RV64IM-NEXT: slli a5, a5, 12
	; RV64IM-NEXT: addi a5, a5, -1767			; RV64IM-NEXT: addi a5, a5, -1767
	; RV64IM-NEXT: mulh a5, a1, a5			; RV64IM-NEXT: mulh a5, a1, a5
	; RV64IM-NEXT: add a5, a5, a1			; RV64IM-NEXT: add a5, a5, a1
	; RV64IM-NEXT: srli a2, a5, 63			; RV64IM-NEXT: srli a2, a5, 63
	; RV64IM-NEXT: srli a5, a5, 6			; RV64IM-NEXT: srli a5, a5, 6
	; RV64IM-NEXT: add a2, a5, a2			; RV64IM-NEXT: addw a2, a5, a2
	; RV64IM-NEXT: addi a5, zero, 95			; RV64IM-NEXT: addi a5, zero, 95
	; RV64IM-NEXT: mul a2, a2, a5			; RV64IM-NEXT: mulw a2, a2, a5
	; RV64IM-NEXT: sub a1, a1, a2			; RV64IM-NEXT: subw a1, a1, a2
	; RV64IM-NEXT: srli a2, a4, 58			; RV64IM-NEXT: srli a2, a4, 58
	; RV64IM-NEXT: add a2, a4, a2			; RV64IM-NEXT: add a2, a4, a2
	; RV64IM-NEXT: andi a2, a2, -64			; RV64IM-NEXT: andi a2, a2, -64
	; RV64IM-NEXT: sub a2, a4, a2			; RV64IM-NEXT: subw a2, a4, a2
	; RV64IM-NEXT: srli a4, a3, 59			; RV64IM-NEXT: srli a4, a3, 59
	; RV64IM-NEXT: add a4, a3, a4			; RV64IM-NEXT: add a4, a3, a4
	; RV64IM-NEXT: andi a4, a4, -32			; RV64IM-NEXT: andi a4, a4, -32
	; RV64IM-NEXT: sub a3, a3, a4			; RV64IM-NEXT: subw a3, a3, a4
	; RV64IM-NEXT: srli a4, a6, 61			; RV64IM-NEXT: srli a4, a6, 61
	; RV64IM-NEXT: add a4, a6, a4			; RV64IM-NEXT: add a4, a6, a4
	; RV64IM-NEXT: andi a4, a4, -8			; RV64IM-NEXT: andi a4, a4, -8
	; RV64IM-NEXT: sub a4, a6, a4			; RV64IM-NEXT: subw a4, a6, a4
	; RV64IM-NEXT: sh a4, 4(a0)			; RV64IM-NEXT: sh a4, 4(a0)
	; RV64IM-NEXT: sh a3, 2(a0)			; RV64IM-NEXT: sh a3, 2(a0)
	; RV64IM-NEXT: sh a2, 0(a0)			; RV64IM-NEXT: sh a2, 0(a0)
	; RV64IM-NEXT: sh a1, 6(a0)			; RV64IM-NEXT: sh a1, 6(a0)
	; RV64IM-NEXT: ret			; RV64IM-NEXT: ret
	%1 = srem <4 x i16> %x, <i16 64, i16 32, i16 8, i16 95>			%1 = srem <4 x i16> %x, <i16 64, i16 32, i16 8, i16 95>
	ret <4 x i16> %1			ret <4 x i16> %1
	}			}
	▲ Show 20 Lines • Show All 125 Lines • ▼ Show 20 Lines
	; RV64IM-NEXT: slli a4, a4, 12			; RV64IM-NEXT: slli a4, a4, 12
	; RV64IM-NEXT: addi a4, a4, -1959			; RV64IM-NEXT: addi a4, a4, -1959
	; RV64IM-NEXT: slli a4, a4, 13			; RV64IM-NEXT: slli a4, a4, 13
	; RV64IM-NEXT: addi a4, a4, 357			; RV64IM-NEXT: addi a4, a4, 357
	; RV64IM-NEXT: mulh a4, a1, a4			; RV64IM-NEXT: mulh a4, a1, a4
	; RV64IM-NEXT: add a4, a4, a1			; RV64IM-NEXT: add a4, a4, a1
	; RV64IM-NEXT: srli a5, a4, 63			; RV64IM-NEXT: srli a5, a4, 63
	; RV64IM-NEXT: srli a4, a4, 4			; RV64IM-NEXT: srli a4, a4, 4
	; RV64IM-NEXT: add a4, a4, a5			; RV64IM-NEXT: addw a4, a4, a5
	; RV64IM-NEXT: addi a5, zero, 23			; RV64IM-NEXT: addi a5, zero, 23
	; RV64IM-NEXT: mul a4, a4, a5			; RV64IM-NEXT: mulw a4, a4, a5
	; RV64IM-NEXT: sub a1, a1, a4			; RV64IM-NEXT: subw a1, a1, a4
	; RV64IM-NEXT: lui a4, 6413			; RV64IM-NEXT: lui a4, 6413
	; RV64IM-NEXT: addiw a4, a4, 1265			; RV64IM-NEXT: addiw a4, a4, 1265
	; RV64IM-NEXT: slli a4, a4, 13			; RV64IM-NEXT: slli a4, a4, 13
	; RV64IM-NEXT: addi a4, a4, 1027			; RV64IM-NEXT: addi a4, a4, 1027
	; RV64IM-NEXT: slli a4, a4, 13			; RV64IM-NEXT: slli a4, a4, 13
	; RV64IM-NEXT: addi a4, a4, 1077			; RV64IM-NEXT: addi a4, a4, 1077
	; RV64IM-NEXT: slli a4, a4, 12			; RV64IM-NEXT: slli a4, a4, 12
	; RV64IM-NEXT: addi a4, a4, 965			; RV64IM-NEXT: addi a4, a4, 965
	; RV64IM-NEXT: mulh a4, a3, a4			; RV64IM-NEXT: mulh a4, a3, a4
	; RV64IM-NEXT: srli a5, a4, 63			; RV64IM-NEXT: srli a5, a4, 63
	; RV64IM-NEXT: srli a4, a4, 8			; RV64IM-NEXT: srli a4, a4, 8
	; RV64IM-NEXT: add a4, a4, a5			; RV64IM-NEXT: addw a4, a4, a5
	; RV64IM-NEXT: addi a5, zero, 654			; RV64IM-NEXT: addi a5, zero, 654
	; RV64IM-NEXT: mul a4, a4, a5			; RV64IM-NEXT: mulw a4, a4, a5
	; RV64IM-NEXT: sub a3, a3, a4			; RV64IM-NEXT: subw a3, a3, a4
	; RV64IM-NEXT: lui a4, 12375			; RV64IM-NEXT: lui a4, 12375
	; RV64IM-NEXT: addiw a4, a4, -575			; RV64IM-NEXT: addiw a4, a4, -575
	; RV64IM-NEXT: slli a4, a4, 12			; RV64IM-NEXT: slli a4, a4, 12
	; RV64IM-NEXT: addi a4, a4, 883			; RV64IM-NEXT: addi a4, a4, 883
	; RV64IM-NEXT: slli a4, a4, 13			; RV64IM-NEXT: slli a4, a4, 13
	; RV64IM-NEXT: addi a4, a4, -431			; RV64IM-NEXT: addi a4, a4, -431
	; RV64IM-NEXT: slli a4, a4, 12			; RV64IM-NEXT: slli a4, a4, 12
	; RV64IM-NEXT: addi a4, a4, 1959			; RV64IM-NEXT: addi a4, a4, 1959
	; RV64IM-NEXT: mulh a4, a2, a4			; RV64IM-NEXT: mulh a4, a2, a4
	; RV64IM-NEXT: srli a5, a4, 63			; RV64IM-NEXT: srli a5, a4, 63
	; RV64IM-NEXT: srli a4, a4, 11			; RV64IM-NEXT: srli a4, a4, 11
	; RV64IM-NEXT: add a4, a4, a5			; RV64IM-NEXT: addw a4, a4, a5
	; RV64IM-NEXT: lui a5, 1			; RV64IM-NEXT: lui a5, 1
	; RV64IM-NEXT: addiw a5, a5, 1327			; RV64IM-NEXT: addiw a5, a5, 1327
	; RV64IM-NEXT: mul a4, a4, a5			; RV64IM-NEXT: mulw a4, a4, a5
	; RV64IM-NEXT: sub a2, a2, a4			; RV64IM-NEXT: subw a2, a2, a4
	; RV64IM-NEXT: sh zero, 0(a0)			; RV64IM-NEXT: sh zero, 0(a0)
	; RV64IM-NEXT: sh a2, 6(a0)			; RV64IM-NEXT: sh a2, 6(a0)
	; RV64IM-NEXT: sh a3, 2(a0)			; RV64IM-NEXT: sh a3, 2(a0)
	; RV64IM-NEXT: sh a1, 4(a0)			; RV64IM-NEXT: sh a1, 4(a0)
	; RV64IM-NEXT: ret			; RV64IM-NEXT: ret
	%1 = srem <4 x i16> %x, <i16 1, i16 654, i16 23, i16 5423>			%1 = srem <4 x i16> %x, <i16 1, i16 654, i16 23, i16 5423>
	ret <4 x i16> %1			ret <4 x i16> %1
	}			}
	▲ Show 20 Lines • Show All 83 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: lh a2, 8(a1)			; RV64I-NEXT: lh a2, 8(a1)
	; RV64I-NEXT: mv s0, a0			; RV64I-NEXT: mv s0, a0
	; RV64I-NEXT: lh s2, 24(a1)			; RV64I-NEXT: lh s2, 24(a1)
	; RV64I-NEXT: lh a0, 16(a1)			; RV64I-NEXT: lh a0, 16(a1)
	; RV64I-NEXT: srli a1, a2, 49			; RV64I-NEXT: srli a1, a2, 49
	; RV64I-NEXT: add a1, a2, a1			; RV64I-NEXT: add a1, a2, a1
	; RV64I-NEXT: lui a3, 8			; RV64I-NEXT: lui a3, 8
	; RV64I-NEXT: and a1, a1, a3			; RV64I-NEXT: and a1, a1, a3
	; RV64I-NEXT: sub s3, a2, a1			; RV64I-NEXT: subw s3, a2, a1
	; RV64I-NEXT: addi a1, zero, 23			; RV64I-NEXT: addi a1, zero, 23
	; RV64I-NEXT: call __moddi3@plt			; RV64I-NEXT: call __moddi3@plt
	; RV64I-NEXT: mv s1, a0			; RV64I-NEXT: mv s1, a0
	; RV64I-NEXT: lui a0, 1			; RV64I-NEXT: lui a0, 1
	; RV64I-NEXT: addiw a1, a0, 1327			; RV64I-NEXT: addiw a1, a0, 1327
	; RV64I-NEXT: mv a0, s2			; RV64I-NEXT: mv a0, s2
	; RV64I-NEXT: call __moddi3@plt			; RV64I-NEXT: call __moddi3@plt
	; RV64I-NEXT: sh zero, 0(s0)			; RV64I-NEXT: sh zero, 0(s0)
	Show All 20 Lines
	; RV64IM-NEXT: slli a4, a4, 12			; RV64IM-NEXT: slli a4, a4, 12
	; RV64IM-NEXT: addi a4, a4, -1959			; RV64IM-NEXT: addi a4, a4, -1959
	; RV64IM-NEXT: slli a4, a4, 13			; RV64IM-NEXT: slli a4, a4, 13
	; RV64IM-NEXT: addi a4, a4, 357			; RV64IM-NEXT: addi a4, a4, 357
	; RV64IM-NEXT: mulh a4, a1, a4			; RV64IM-NEXT: mulh a4, a1, a4
	; RV64IM-NEXT: add a4, a4, a1			; RV64IM-NEXT: add a4, a4, a1
	; RV64IM-NEXT: srli a5, a4, 63			; RV64IM-NEXT: srli a5, a4, 63
	; RV64IM-NEXT: srli a4, a4, 4			; RV64IM-NEXT: srli a4, a4, 4
	; RV64IM-NEXT: add a4, a4, a5			; RV64IM-NEXT: addw a4, a4, a5
	; RV64IM-NEXT: addi a5, zero, 23			; RV64IM-NEXT: addi a5, zero, 23
	; RV64IM-NEXT: mul a4, a4, a5			; RV64IM-NEXT: mulw a4, a4, a5
	; RV64IM-NEXT: sub a1, a1, a4			; RV64IM-NEXT: subw a1, a1, a4
	; RV64IM-NEXT: lui a4, 12375			; RV64IM-NEXT: lui a4, 12375
	; RV64IM-NEXT: addiw a4, a4, -575			; RV64IM-NEXT: addiw a4, a4, -575
	; RV64IM-NEXT: slli a4, a4, 12			; RV64IM-NEXT: slli a4, a4, 12
	; RV64IM-NEXT: addi a4, a4, 883			; RV64IM-NEXT: addi a4, a4, 883
	; RV64IM-NEXT: slli a4, a4, 13			; RV64IM-NEXT: slli a4, a4, 13
	; RV64IM-NEXT: addi a4, a4, -431			; RV64IM-NEXT: addi a4, a4, -431
	; RV64IM-NEXT: slli a4, a4, 12			; RV64IM-NEXT: slli a4, a4, 12
	; RV64IM-NEXT: addi a4, a4, 1959			; RV64IM-NEXT: addi a4, a4, 1959
	; RV64IM-NEXT: mulh a4, a3, a4			; RV64IM-NEXT: mulh a4, a3, a4
	; RV64IM-NEXT: srli a5, a4, 63			; RV64IM-NEXT: srli a5, a4, 63
	; RV64IM-NEXT: srli a4, a4, 11			; RV64IM-NEXT: srli a4, a4, 11
	; RV64IM-NEXT: add a4, a4, a5			; RV64IM-NEXT: addw a4, a4, a5
	; RV64IM-NEXT: lui a5, 1			; RV64IM-NEXT: lui a5, 1
	; RV64IM-NEXT: addiw a5, a5, 1327			; RV64IM-NEXT: addiw a5, a5, 1327
	; RV64IM-NEXT: mul a4, a4, a5			; RV64IM-NEXT: mulw a4, a4, a5
	; RV64IM-NEXT: sub a3, a3, a4			; RV64IM-NEXT: subw a3, a3, a4
	; RV64IM-NEXT: srli a4, a2, 49			; RV64IM-NEXT: srli a4, a2, 49
	; RV64IM-NEXT: add a4, a2, a4			; RV64IM-NEXT: add a4, a2, a4
	; RV64IM-NEXT: lui a5, 8			; RV64IM-NEXT: lui a5, 8
	; RV64IM-NEXT: and a4, a4, a5			; RV64IM-NEXT: and a4, a4, a5
	; RV64IM-NEXT: sub a2, a2, a4			; RV64IM-NEXT: subw a2, a2, a4
	; RV64IM-NEXT: sh zero, 0(a0)			; RV64IM-NEXT: sh zero, 0(a0)
	; RV64IM-NEXT: sh a2, 2(a0)			; RV64IM-NEXT: sh a2, 2(a0)
	; RV64IM-NEXT: sh a3, 6(a0)			; RV64IM-NEXT: sh a3, 6(a0)
	; RV64IM-NEXT: sh a1, 4(a0)			; RV64IM-NEXT: sh a1, 4(a0)
	; RV64IM-NEXT: ret			; RV64IM-NEXT: ret
	%1 = srem <4 x i16> %x, <i16 1, i16 32768, i16 23, i16 5423>			%1 = srem <4 x i16> %x, <i16 1, i16 32768, i16 23, i16 5423>
	ret <4 x i16> %1			ret <4 x i16> %1
	}			}
	▲ Show 20 Lines • Show All 241 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/ssub_sat_plus.ll

	Show First 20 Lines • Show All 224 Lines • ▼ Show 20 Lines
	; RV32I-NEXT: .LBB2_4:			; RV32I-NEXT: .LBB2_4:
	; RV32I-NEXT: lui a0, 1048568			; RV32I-NEXT: lui a0, 1048568
	; RV32I-NEXT: ret			; RV32I-NEXT: ret
	;			;
	; RV64I-LABEL: func16:			; RV64I-LABEL: func16:
	; RV64I: # %bb.0:			; RV64I: # %bb.0:
	; RV64I-NEXT: slli a0, a0, 48			; RV64I-NEXT: slli a0, a0, 48
	; RV64I-NEXT: srai a0, a0, 48			; RV64I-NEXT: srai a0, a0, 48
	; RV64I-NEXT: mul a1, a1, a2			; RV64I-NEXT: mulw a1, a1, a2
	; RV64I-NEXT: slli a1, a1, 48			; RV64I-NEXT: slli a1, a1, 48
	; RV64I-NEXT: srai a1, a1, 48			; RV64I-NEXT: srai a1, a1, 48
	; RV64I-NEXT: sub a0, a0, a1			; RV64I-NEXT: sub a0, a0, a1
	; RV64I-NEXT: lui a1, 8			; RV64I-NEXT: lui a1, 8
	; RV64I-NEXT: addiw a1, a1, -1			; RV64I-NEXT: addiw a1, a1, -1
	; RV64I-NEXT: bge a0, a1, .LBB2_3			; RV64I-NEXT: bge a0, a1, .LBB2_3
	; RV64I-NEXT: # %bb.1:			; RV64I-NEXT: # %bb.1:
	; RV64I-NEXT: lui a1, 1048568			; RV64I-NEXT: lui a1, 1048568
	▲ Show 20 Lines • Show All 61 Lines • ▼ Show 20 Lines
	; RV32I-NEXT: .LBB3_4:			; RV32I-NEXT: .LBB3_4:
	; RV32I-NEXT: addi a0, zero, -128			; RV32I-NEXT: addi a0, zero, -128
	; RV32I-NEXT: ret			; RV32I-NEXT: ret
	;			;
	; RV64I-LABEL: func8:			; RV64I-LABEL: func8:
	; RV64I: # %bb.0:			; RV64I: # %bb.0:
	; RV64I-NEXT: slli a0, a0, 56			; RV64I-NEXT: slli a0, a0, 56
	; RV64I-NEXT: srai a0, a0, 56			; RV64I-NEXT: srai a0, a0, 56
	; RV64I-NEXT: mul a1, a1, a2			; RV64I-NEXT: mulw a1, a1, a2
	; RV64I-NEXT: slli a1, a1, 56			; RV64I-NEXT: slli a1, a1, 56
	; RV64I-NEXT: srai a1, a1, 56			; RV64I-NEXT: srai a1, a1, 56
	; RV64I-NEXT: sub a0, a0, a1			; RV64I-NEXT: sub a0, a0, a1
	; RV64I-NEXT: addi a1, zero, 127			; RV64I-NEXT: addi a1, zero, 127
	; RV64I-NEXT: bge a0, a1, .LBB3_3			; RV64I-NEXT: bge a0, a1, .LBB3_3
	; RV64I-NEXT: # %bb.1:			; RV64I-NEXT: # %bb.1:
	; RV64I-NEXT: addi a1, zero, -128			; RV64I-NEXT: addi a1, zero, -128
	; RV64I-NEXT: bge a1, a0, .LBB3_4			; RV64I-NEXT: bge a1, a0, .LBB3_4
	▲ Show 20 Lines • Show All 58 Lines • ▼ Show 20 Lines
	; RV32I-NEXT: .LBB4_4:			; RV32I-NEXT: .LBB4_4:
	; RV32I-NEXT: addi a0, zero, -8			; RV32I-NEXT: addi a0, zero, -8
	; RV32I-NEXT: ret			; RV32I-NEXT: ret
	;			;
	; RV64I-LABEL: func4:			; RV64I-LABEL: func4:
	; RV64I: # %bb.0:			; RV64I: # %bb.0:
	; RV64I-NEXT: slli a0, a0, 60			; RV64I-NEXT: slli a0, a0, 60
	; RV64I-NEXT: srai a0, a0, 60			; RV64I-NEXT: srai a0, a0, 60
	; RV64I-NEXT: mul a1, a1, a2			; RV64I-NEXT: mulw a1, a1, a2
	; RV64I-NEXT: slli a1, a1, 60			; RV64I-NEXT: slli a1, a1, 60
	; RV64I-NEXT: srai a1, a1, 60			; RV64I-NEXT: srai a1, a1, 60
	; RV64I-NEXT: sub a0, a0, a1			; RV64I-NEXT: sub a0, a0, a1
	; RV64I-NEXT: addi a1, zero, 7			; RV64I-NEXT: addi a1, zero, 7
	; RV64I-NEXT: bge a0, a1, .LBB4_3			; RV64I-NEXT: bge a0, a1, .LBB4_3
	; RV64I-NEXT: # %bb.1:			; RV64I-NEXT: # %bb.1:
	; RV64I-NEXT: addi a1, zero, -8			; RV64I-NEXT: addi a1, zero, -8
	; RV64I-NEXT: bge a1, a0, .LBB4_4			; RV64I-NEXT: bge a1, a0, .LBB4_4
	Show All 20 Lines
	; RV32IZbb-NEXT: addi a1, zero, -8			; RV32IZbb-NEXT: addi a1, zero, -8
	; RV32IZbb-NEXT: max a0, a0, a1			; RV32IZbb-NEXT: max a0, a0, a1
	; RV32IZbb-NEXT: ret			; RV32IZbb-NEXT: ret
	;			;
	; RV64IZbb-LABEL: func4:			; RV64IZbb-LABEL: func4:
	; RV64IZbb: # %bb.0:			; RV64IZbb: # %bb.0:
	; RV64IZbb-NEXT: slli a0, a0, 60			; RV64IZbb-NEXT: slli a0, a0, 60
	; RV64IZbb-NEXT: srai a0, a0, 60			; RV64IZbb-NEXT: srai a0, a0, 60
	; RV64IZbb-NEXT: mul a1, a1, a2			; RV64IZbb-NEXT: mulw a1, a1, a2
	; RV64IZbb-NEXT: slli a1, a1, 60			; RV64IZbb-NEXT: slli a1, a1, 60
	; RV64IZbb-NEXT: srai a1, a1, 60			; RV64IZbb-NEXT: srai a1, a1, 60
	; RV64IZbb-NEXT: sub a0, a0, a1			; RV64IZbb-NEXT: sub a0, a0, a1
	; RV64IZbb-NEXT: addi a1, zero, 7			; RV64IZbb-NEXT: addi a1, zero, 7
	; RV64IZbb-NEXT: min a0, a0, a1			; RV64IZbb-NEXT: min a0, a0, a1
	; RV64IZbb-NEXT: addi a1, zero, -8			; RV64IZbb-NEXT: addi a1, zero, -8
	; RV64IZbb-NEXT: max a0, a0, a1			; RV64IZbb-NEXT: max a0, a0, a1
	; RV64IZbb-NEXT: ret			; RV64IZbb-NEXT: ret
	%a = mul i4 %y, %z			%a = mul i4 %y, %z
	%tmp = call i4 @llvm.ssub.sat.i4(i4 %x, i4 %a)			%tmp = call i4 @llvm.ssub.sat.i4(i4 %x, i4 %a)
	ret i4 %tmp			ret i4 %tmp
	}			}

llvm/test/CodeGen/RISCV/uadd_sat_plus.ll

	Show All 19 Lines
	; RV32I-NEXT: bltu a1, a3, .LBB0_2			; RV32I-NEXT: bltu a1, a3, .LBB0_2
	; RV32I-NEXT: # %bb.1:			; RV32I-NEXT: # %bb.1:
	; RV32I-NEXT: mv a0, a1			; RV32I-NEXT: mv a0, a1
	; RV32I-NEXT: .LBB0_2:			; RV32I-NEXT: .LBB0_2:
	; RV32I-NEXT: ret			; RV32I-NEXT: ret
	;			;
	; RV64I-LABEL: func32:			; RV64I-LABEL: func32:
	; RV64I: # %bb.0:			; RV64I: # %bb.0:
	; RV64I-NEXT: mul a1, a1, a2			; RV64I-NEXT: mulw a1, a1, a2
	; RV64I-NEXT: addw a1, a0, a1			; RV64I-NEXT: addw a1, a0, a1
	; RV64I-NEXT: sext.w a2, a0			; RV64I-NEXT: sext.w a2, a0
	; RV64I-NEXT: addi a0, zero, -1			; RV64I-NEXT: addi a0, zero, -1
	; RV64I-NEXT: bltu a1, a2, .LBB0_2			; RV64I-NEXT: bltu a1, a2, .LBB0_2
	; RV64I-NEXT: # %bb.1:			; RV64I-NEXT: # %bb.1:
	; RV64I-NEXT: mv a0, a1			; RV64I-NEXT: mv a0, a1
	; RV64I-NEXT: .LBB0_2:			; RV64I-NEXT: .LBB0_2:
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	▲ Show 20 Lines • Show All 239 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/urem-lkk.ll

	Show First 20 Lines • Show All 47 Lines • ▼ Show 20 Lines
	; RV64IM-LABEL: fold_urem_positive_odd:			; RV64IM-LABEL: fold_urem_positive_odd:
	; RV64IM: # %bb.0:			; RV64IM: # %bb.0:
	; RV64IM-NEXT: slli a1, a0, 32			; RV64IM-NEXT: slli a1, a0, 32
	; RV64IM-NEXT: srli a1, a1, 32			; RV64IM-NEXT: srli a1, a1, 32
	; RV64IM-NEXT: lui a2, 364242			; RV64IM-NEXT: lui a2, 364242
	; RV64IM-NEXT: addiw a2, a2, 777			; RV64IM-NEXT: addiw a2, a2, 777
	; RV64IM-NEXT: mul a1, a1, a2			; RV64IM-NEXT: mul a1, a1, a2
	; RV64IM-NEXT: srli a1, a1, 32			; RV64IM-NEXT: srli a1, a1, 32
	; RV64IM-NEXT: sub a2, a0, a1			; RV64IM-NEXT: subw a2, a0, a1
	; RV64IM-NEXT: srliw a2, a2, 1			; RV64IM-NEXT: srliw a2, a2, 1
	; RV64IM-NEXT: add a1, a2, a1			; RV64IM-NEXT: add a1, a2, a1
	; RV64IM-NEXT: srli a1, a1, 6			; RV64IM-NEXT: srli a1, a1, 6
	; RV64IM-NEXT: addi a2, zero, 95			; RV64IM-NEXT: addi a2, zero, 95
	; RV64IM-NEXT: mul a1, a1, a2			; RV64IM-NEXT: mulw a1, a1, a2
	; RV64IM-NEXT: subw a0, a0, a1			; RV64IM-NEXT: subw a0, a0, a1
	; RV64IM-NEXT: ret			; RV64IM-NEXT: ret
	%1 = urem i32 %x, 95			%1 = urem i32 %x, 95
	ret i32 %1			ret i32 %1
	}			}


	define i32 @fold_urem_positive_even(i32 %x) nounwind {			define i32 @fold_urem_positive_even(i32 %x) nounwind {
	Show All 35 Lines
	; RV64IM-NEXT: slli a1, a0, 32			; RV64IM-NEXT: slli a1, a0, 32
	; RV64IM-NEXT: srli a1, a1, 32			; RV64IM-NEXT: srli a1, a1, 32
	; RV64IM-NEXT: lui a2, 253241			; RV64IM-NEXT: lui a2, 253241
	; RV64IM-NEXT: slli a2, a2, 2			; RV64IM-NEXT: slli a2, a2, 2
	; RV64IM-NEXT: addi a2, a2, -61			; RV64IM-NEXT: addi a2, a2, -61
	; RV64IM-NEXT: mul a1, a1, a2			; RV64IM-NEXT: mul a1, a1, a2
	; RV64IM-NEXT: srli a1, a1, 42			; RV64IM-NEXT: srli a1, a1, 42
	; RV64IM-NEXT: addi a2, zero, 1060			; RV64IM-NEXT: addi a2, zero, 1060
	; RV64IM-NEXT: mul a1, a1, a2			; RV64IM-NEXT: mulw a1, a1, a2
	; RV64IM-NEXT: subw a0, a0, a1			; RV64IM-NEXT: subw a0, a0, a1
	; RV64IM-NEXT: ret			; RV64IM-NEXT: ret
	%1 = urem i32 %x, 1060			%1 = urem i32 %x, 1060
	ret i32 %1			ret i32 %1
	}			}


	; Don't fold if we can combine urem with udiv.			; Don't fold if we can combine urem with udiv.
	▲ Show 20 Lines • Show All 58 Lines • ▼ Show 20 Lines
	; RV64IM-LABEL: combine_urem_udiv:			; RV64IM-LABEL: combine_urem_udiv:
	; RV64IM: # %bb.0:			; RV64IM: # %bb.0:
	; RV64IM-NEXT: slli a1, a0, 32			; RV64IM-NEXT: slli a1, a0, 32
	; RV64IM-NEXT: srli a1, a1, 32			; RV64IM-NEXT: srli a1, a1, 32
	; RV64IM-NEXT: lui a2, 364242			; RV64IM-NEXT: lui a2, 364242
	; RV64IM-NEXT: addiw a2, a2, 777			; RV64IM-NEXT: addiw a2, a2, 777
	; RV64IM-NEXT: mul a1, a1, a2			; RV64IM-NEXT: mul a1, a1, a2
	; RV64IM-NEXT: srli a1, a1, 32			; RV64IM-NEXT: srli a1, a1, 32
	; RV64IM-NEXT: sub a2, a0, a1			; RV64IM-NEXT: subw a2, a0, a1
	; RV64IM-NEXT: srliw a2, a2, 1			; RV64IM-NEXT: srliw a2, a2, 1
	; RV64IM-NEXT: add a1, a2, a1			; RV64IM-NEXT: add a1, a2, a1
	; RV64IM-NEXT: srli a1, a1, 6			; RV64IM-NEXT: srli a1, a1, 6
	; RV64IM-NEXT: addi a2, zero, 95			; RV64IM-NEXT: addi a2, zero, 95
	; RV64IM-NEXT: mul a2, a1, a2			; RV64IM-NEXT: mulw a2, a1, a2
	; RV64IM-NEXT: sub a0, a0, a2			; RV64IM-NEXT: subw a0, a0, a2
	; RV64IM-NEXT: addw a0, a0, a1			; RV64IM-NEXT: addw a0, a0, a1
	; RV64IM-NEXT: ret			; RV64IM-NEXT: ret
	%1 = urem i32 %x, 95			%1 = urem i32 %x, 95
	%2 = udiv i32 %x, 95			%2 = udiv i32 %x, 95
	%3 = add i32 %1, %2			%3 = add i32 %1, %2
	ret i32 %3			ret i32 %3
	}			}

	▲ Show 20 Lines • Show All 83 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/urem-vector-lkk.ll

	Show First 20 Lines • Show All 156 Lines • ▼ Show 20 Lines
	; RV64IM-NEXT: slli a5, a5, 12			; RV64IM-NEXT: slli a5, a5, 12
	; RV64IM-NEXT: addi a5, a5, 561			; RV64IM-NEXT: addi a5, a5, 561
	; RV64IM-NEXT: mulhu a5, a1, a5			; RV64IM-NEXT: mulhu a5, a1, a5
	; RV64IM-NEXT: sub a2, a1, a5			; RV64IM-NEXT: sub a2, a1, a5
	; RV64IM-NEXT: srli a2, a2, 1			; RV64IM-NEXT: srli a2, a2, 1
	; RV64IM-NEXT: add a2, a2, a5			; RV64IM-NEXT: add a2, a2, a5
	; RV64IM-NEXT: srli a2, a2, 6			; RV64IM-NEXT: srli a2, a2, 6
	; RV64IM-NEXT: addi a5, zero, 95			; RV64IM-NEXT: addi a5, zero, 95
	; RV64IM-NEXT: mul a2, a2, a5			; RV64IM-NEXT: mulw a2, a2, a5
	; RV64IM-NEXT: sub a1, a1, a2			; RV64IM-NEXT: subw a1, a1, a2
	; RV64IM-NEXT: srli a2, a4, 2			; RV64IM-NEXT: srli a2, a4, 2
	; RV64IM-NEXT: lui a5, 264			; RV64IM-NEXT: lui a5, 264
	; RV64IM-NEXT: addiw a5, a5, 1057			; RV64IM-NEXT: addiw a5, a5, 1057
	; RV64IM-NEXT: slli a5, a5, 15			; RV64IM-NEXT: slli a5, a5, 15
	; RV64IM-NEXT: addi a5, a5, 1057			; RV64IM-NEXT: addi a5, a5, 1057
	; RV64IM-NEXT: slli a5, a5, 15			; RV64IM-NEXT: slli a5, a5, 15
	; RV64IM-NEXT: addi a5, a5, 1057			; RV64IM-NEXT: addi a5, a5, 1057
	; RV64IM-NEXT: slli a5, a5, 12			; RV64IM-NEXT: slli a5, a5, 12
	; RV64IM-NEXT: addi a5, a5, 133			; RV64IM-NEXT: addi a5, a5, 133
	; RV64IM-NEXT: mulhu a2, a2, a5			; RV64IM-NEXT: mulhu a2, a2, a5
	; RV64IM-NEXT: srli a2, a2, 3			; RV64IM-NEXT: srli a2, a2, 3
	; RV64IM-NEXT: addi a5, zero, 124			; RV64IM-NEXT: addi a5, zero, 124
	; RV64IM-NEXT: mul a2, a2, a5			; RV64IM-NEXT: mulw a2, a2, a5
	; RV64IM-NEXT: sub a2, a4, a2			; RV64IM-NEXT: subw a2, a4, a2
	; RV64IM-NEXT: srli a4, a3, 1			; RV64IM-NEXT: srli a4, a3, 1
	; RV64IM-NEXT: lui a5, 2675			; RV64IM-NEXT: lui a5, 2675
	; RV64IM-NEXT: addiw a5, a5, -251			; RV64IM-NEXT: addiw a5, a5, -251
	; RV64IM-NEXT: slli a5, a5, 13			; RV64IM-NEXT: slli a5, a5, 13
	; RV64IM-NEXT: addi a5, a5, 1839			; RV64IM-NEXT: addi a5, a5, 1839
	; RV64IM-NEXT: slli a5, a5, 13			; RV64IM-NEXT: slli a5, a5, 13
	; RV64IM-NEXT: addi a5, a5, 167			; RV64IM-NEXT: addi a5, a5, 167
	; RV64IM-NEXT: slli a5, a5, 13			; RV64IM-NEXT: slli a5, a5, 13
	; RV64IM-NEXT: addi a5, a5, 1505			; RV64IM-NEXT: addi a5, a5, 1505
	; RV64IM-NEXT: mulhu a4, a4, a5			; RV64IM-NEXT: mulhu a4, a4, a5
	; RV64IM-NEXT: srli a4, a4, 4			; RV64IM-NEXT: srli a4, a4, 4
	; RV64IM-NEXT: addi a5, zero, 98			; RV64IM-NEXT: addi a5, zero, 98
	; RV64IM-NEXT: mul a4, a4, a5			; RV64IM-NEXT: mulw a4, a4, a5
	; RV64IM-NEXT: sub a3, a3, a4			; RV64IM-NEXT: subw a3, a3, a4
	; RV64IM-NEXT: lui a4, 8364			; RV64IM-NEXT: lui a4, 8364
	; RV64IM-NEXT: addiw a4, a4, -1977			; RV64IM-NEXT: addiw a4, a4, -1977
	; RV64IM-NEXT: slli a4, a4, 12			; RV64IM-NEXT: slli a4, a4, 12
	; RV64IM-NEXT: addi a4, a4, 1907			; RV64IM-NEXT: addi a4, a4, 1907
	; RV64IM-NEXT: slli a4, a4, 12			; RV64IM-NEXT: slli a4, a4, 12
	; RV64IM-NEXT: addi a4, a4, 453			; RV64IM-NEXT: addi a4, a4, 453
	; RV64IM-NEXT: slli a4, a4, 12			; RV64IM-NEXT: slli a4, a4, 12
	; RV64IM-NEXT: addi a4, a4, 1213			; RV64IM-NEXT: addi a4, a4, 1213
	; RV64IM-NEXT: mulhu a4, a6, a4			; RV64IM-NEXT: mulhu a4, a6, a4
	; RV64IM-NEXT: srli a4, a4, 7			; RV64IM-NEXT: srli a4, a4, 7
	; RV64IM-NEXT: addi a5, zero, 1003			; RV64IM-NEXT: addi a5, zero, 1003
	; RV64IM-NEXT: mul a4, a4, a5			; RV64IM-NEXT: mulw a4, a4, a5
	; RV64IM-NEXT: sub a4, a6, a4			; RV64IM-NEXT: subw a4, a6, a4
	; RV64IM-NEXT: sh a4, 6(a0)			; RV64IM-NEXT: sh a4, 6(a0)
	; RV64IM-NEXT: sh a3, 4(a0)			; RV64IM-NEXT: sh a3, 4(a0)
	; RV64IM-NEXT: sh a2, 2(a0)			; RV64IM-NEXT: sh a2, 2(a0)
	; RV64IM-NEXT: sh a1, 0(a0)			; RV64IM-NEXT: sh a1, 0(a0)
	; RV64IM-NEXT: ret			; RV64IM-NEXT: ret
	%1 = urem <4 x i16> %x, <i16 95, i16 124, i16 98, i16 1003>			%1 = urem <4 x i16> %x, <i16 95, i16 124, i16 98, i16 1003>
	ret <4 x i16> %1			ret <4 x i16> %1
	}			}
	▲ Show 20 Lines • Show All 145 Lines • ▼ Show 20 Lines
	; RV64IM-NEXT: slli a5, a5, 12			; RV64IM-NEXT: slli a5, a5, 12
	; RV64IM-NEXT: addi a5, a5, 561			; RV64IM-NEXT: addi a5, a5, 561
	; RV64IM-NEXT: mulhu a2, a1, a5			; RV64IM-NEXT: mulhu a2, a1, a5
	; RV64IM-NEXT: sub a3, a1, a2			; RV64IM-NEXT: sub a3, a1, a2
	; RV64IM-NEXT: srli a3, a3, 1			; RV64IM-NEXT: srli a3, a3, 1
	; RV64IM-NEXT: add a2, a3, a2			; RV64IM-NEXT: add a2, a3, a2
	; RV64IM-NEXT: srli a2, a2, 6			; RV64IM-NEXT: srli a2, a2, 6
	; RV64IM-NEXT: addi a3, zero, 95			; RV64IM-NEXT: addi a3, zero, 95
	; RV64IM-NEXT: mul a2, a2, a3			; RV64IM-NEXT: mulw a2, a2, a3
	; RV64IM-NEXT: sub t0, a1, a2			; RV64IM-NEXT: subw t0, a1, a2
	; RV64IM-NEXT: mulhu a2, a4, a5			; RV64IM-NEXT: mulhu a2, a4, a5
	; RV64IM-NEXT: sub a1, a4, a2			; RV64IM-NEXT: sub a1, a4, a2
	; RV64IM-NEXT: srli a1, a1, 1			; RV64IM-NEXT: srli a1, a1, 1
	; RV64IM-NEXT: add a1, a1, a2			; RV64IM-NEXT: add a1, a1, a2
	; RV64IM-NEXT: srli a1, a1, 6			; RV64IM-NEXT: srli a1, a1, 6
	; RV64IM-NEXT: mul a1, a1, a3			; RV64IM-NEXT: mulw a1, a1, a3
	; RV64IM-NEXT: sub a1, a4, a1			; RV64IM-NEXT: subw a1, a4, a1
	; RV64IM-NEXT: mulhu a2, a7, a5			; RV64IM-NEXT: mulhu a2, a7, a5
	; RV64IM-NEXT: sub a4, a7, a2			; RV64IM-NEXT: sub a4, a7, a2
	; RV64IM-NEXT: srli a4, a4, 1			; RV64IM-NEXT: srli a4, a4, 1
	; RV64IM-NEXT: add a2, a4, a2			; RV64IM-NEXT: add a2, a4, a2
	; RV64IM-NEXT: srli a2, a2, 6			; RV64IM-NEXT: srli a2, a2, 6
	; RV64IM-NEXT: mul a2, a2, a3			; RV64IM-NEXT: mulw a2, a2, a3
	; RV64IM-NEXT: sub a2, a7, a2			; RV64IM-NEXT: subw a2, a7, a2
	; RV64IM-NEXT: mulhu a4, a6, a5			; RV64IM-NEXT: mulhu a4, a6, a5
	; RV64IM-NEXT: sub a5, a6, a4			; RV64IM-NEXT: sub a5, a6, a4
	; RV64IM-NEXT: srli a5, a5, 1			; RV64IM-NEXT: srli a5, a5, 1
	; RV64IM-NEXT: add a4, a5, a4			; RV64IM-NEXT: add a4, a5, a4
	; RV64IM-NEXT: srli a4, a4, 6			; RV64IM-NEXT: srli a4, a4, 6
	; RV64IM-NEXT: mul a3, a4, a3			; RV64IM-NEXT: mulw a3, a4, a3
	; RV64IM-NEXT: sub a3, a6, a3			; RV64IM-NEXT: subw a3, a6, a3
	; RV64IM-NEXT: sh a3, 6(a0)			; RV64IM-NEXT: sh a3, 6(a0)
	; RV64IM-NEXT: sh a2, 4(a0)			; RV64IM-NEXT: sh a2, 4(a0)
	; RV64IM-NEXT: sh a1, 2(a0)			; RV64IM-NEXT: sh a1, 2(a0)
	; RV64IM-NEXT: sh t0, 0(a0)			; RV64IM-NEXT: sh t0, 0(a0)
	; RV64IM-NEXT: ret			; RV64IM-NEXT: ret
	%1 = urem <4 x i16> %x, <i16 95, i16 95, i16 95, i16 95>			%1 = urem <4 x i16> %x, <i16 95, i16 95, i16 95, i16 95>
	ret <4 x i16> %1			ret <4 x i16> %1
	}			}
	▲ Show 20 Lines • Show All 165 Lines • ▼ Show 20 Lines
	; RV64I-NEXT: mv s4, a0			; RV64I-NEXT: mv s4, a0
	; RV64I-NEXT: addi a1, zero, 95			; RV64I-NEXT: addi a1, zero, 95
	; RV64I-NEXT: mv a0, s3			; RV64I-NEXT: mv a0, s3
	; RV64I-NEXT: call __udivdi3@plt			; RV64I-NEXT: call __udivdi3@plt
	; RV64I-NEXT: mv s1, a0			; RV64I-NEXT: mv s1, a0
	; RV64I-NEXT: addi a1, zero, 95			; RV64I-NEXT: addi a1, zero, 95
	; RV64I-NEXT: mv a0, s2			; RV64I-NEXT: mv a0, s2
	; RV64I-NEXT: call __udivdi3@plt			; RV64I-NEXT: call __udivdi3@plt
	; RV64I-NEXT: add a0, s8, a0			; RV64I-NEXT: addw a0, s8, a0
	; RV64I-NEXT: add a1, s7, s1			; RV64I-NEXT: addw a1, s7, s1
	; RV64I-NEXT: add a2, s6, s4			; RV64I-NEXT: addw a2, s6, s4
	; RV64I-NEXT: add a3, s5, s9			; RV64I-NEXT: addw a3, s5, s9
	; RV64I-NEXT: sh a3, 6(s0)			; RV64I-NEXT: sh a3, 6(s0)
	; RV64I-NEXT: sh a2, 4(s0)			; RV64I-NEXT: sh a2, 4(s0)
	; RV64I-NEXT: sh a1, 2(s0)			; RV64I-NEXT: sh a1, 2(s0)
	; RV64I-NEXT: sh a0, 0(s0)			; RV64I-NEXT: sh a0, 0(s0)
	; RV64I-NEXT: ld s9, 8(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld s9, 8(sp) # 8-byte Folded Reload
	; RV64I-NEXT: ld s8, 16(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld s8, 16(sp) # 8-byte Folded Reload
	; RV64I-NEXT: ld s7, 24(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld s7, 24(sp) # 8-byte Folded Reload
	; RV64I-NEXT: ld s6, 32(sp) # 8-byte Folded Reload			; RV64I-NEXT: ld s6, 32(sp) # 8-byte Folded Reload
	Show All 22 Lines
	; RV64IM-NEXT: slli a5, a5, 12			; RV64IM-NEXT: slli a5, a5, 12
	; RV64IM-NEXT: addi a5, a5, 561			; RV64IM-NEXT: addi a5, a5, 561
	; RV64IM-NEXT: mulhu a2, a1, a5			; RV64IM-NEXT: mulhu a2, a1, a5
	; RV64IM-NEXT: sub a3, a1, a2			; RV64IM-NEXT: sub a3, a1, a2
	; RV64IM-NEXT: srli a3, a3, 1			; RV64IM-NEXT: srli a3, a3, 1
	; RV64IM-NEXT: add a2, a3, a2			; RV64IM-NEXT: add a2, a3, a2
	; RV64IM-NEXT: srli t3, a2, 6			; RV64IM-NEXT: srli t3, a2, 6
	; RV64IM-NEXT: addi t0, zero, 95			; RV64IM-NEXT: addi t0, zero, 95
	; RV64IM-NEXT: mul a3, t3, t0			; RV64IM-NEXT: mulw a3, t3, t0
	; RV64IM-NEXT: sub t1, a1, a3			; RV64IM-NEXT: subw t1, a1, a3
	; RV64IM-NEXT: mulhu a3, a4, a5			; RV64IM-NEXT: mulhu a3, a4, a5
	; RV64IM-NEXT: sub a1, a4, a3			; RV64IM-NEXT: sub a1, a4, a3
	; RV64IM-NEXT: srli a1, a1, 1			; RV64IM-NEXT: srli a1, a1, 1
	; RV64IM-NEXT: add a1, a1, a3			; RV64IM-NEXT: add a1, a1, a3
	; RV64IM-NEXT: srli a1, a1, 6			; RV64IM-NEXT: srli a1, a1, 6
	; RV64IM-NEXT: mul a3, a1, t0			; RV64IM-NEXT: mulw a3, a1, t0
	; RV64IM-NEXT: sub t2, a4, a3			; RV64IM-NEXT: subw t2, a4, a3
	; RV64IM-NEXT: mulhu a4, a7, a5			; RV64IM-NEXT: mulhu a4, a7, a5
	; RV64IM-NEXT: sub a3, a7, a4			; RV64IM-NEXT: sub a3, a7, a4
	; RV64IM-NEXT: srli a3, a3, 1			; RV64IM-NEXT: srli a3, a3, 1
	; RV64IM-NEXT: add a3, a3, a4			; RV64IM-NEXT: add a3, a3, a4
	; RV64IM-NEXT: srli a3, a3, 6			; RV64IM-NEXT: srli a3, a3, 6
	; RV64IM-NEXT: mul a4, a3, t0			; RV64IM-NEXT: mulw a4, a3, t0
	; RV64IM-NEXT: sub a4, a7, a4			; RV64IM-NEXT: subw a4, a7, a4
	; RV64IM-NEXT: mulhu a5, a6, a5			; RV64IM-NEXT: mulhu a5, a6, a5
	; RV64IM-NEXT: sub a2, a6, a5			; RV64IM-NEXT: sub a2, a6, a5
	; RV64IM-NEXT: srli a2, a2, 1			; RV64IM-NEXT: srli a2, a2, 1
	; RV64IM-NEXT: add a2, a2, a5			; RV64IM-NEXT: add a2, a2, a5
	; RV64IM-NEXT: srli a2, a2, 6			; RV64IM-NEXT: srli a2, a2, 6
	; RV64IM-NEXT: mul a5, a2, t0			; RV64IM-NEXT: mulw a5, a2, t0
	; RV64IM-NEXT: sub a5, a6, a5			; RV64IM-NEXT: subw a5, a6, a5
	; RV64IM-NEXT: add a2, a5, a2			; RV64IM-NEXT: addw a2, a5, a2
	; RV64IM-NEXT: add a3, a4, a3			; RV64IM-NEXT: addw a3, a4, a3
	; RV64IM-NEXT: add a1, t2, a1			; RV64IM-NEXT: addw a1, t2, a1
	; RV64IM-NEXT: add a4, t1, t3			; RV64IM-NEXT: addw a4, t1, t3
	; RV64IM-NEXT: sh a4, 6(a0)			; RV64IM-NEXT: sh a4, 6(a0)
	; RV64IM-NEXT: sh a1, 4(a0)			; RV64IM-NEXT: sh a1, 4(a0)
	; RV64IM-NEXT: sh a3, 2(a0)			; RV64IM-NEXT: sh a3, 2(a0)
	; RV64IM-NEXT: sh a2, 0(a0)			; RV64IM-NEXT: sh a2, 0(a0)
	; RV64IM-NEXT: ret			; RV64IM-NEXT: ret
	%1 = urem <4 x i16> %x, <i16 95, i16 95, i16 95, i16 95>			%1 = urem <4 x i16> %x, <i16 95, i16 95, i16 95, i16 95>
	%2 = udiv <4 x i16> %x, <i16 95, i16 95, i16 95, i16 95>			%2 = udiv <4 x i16> %x, <i16 95, i16 95, i16 95, i16 95>
	%3 = add <4 x i16> %1, %2			%3 = add <4 x i16> %1, %2
	▲ Show 20 Lines • Show All 104 Lines • ▼ Show 20 Lines
	; RV64IM-NEXT: slli a5, a5, 12			; RV64IM-NEXT: slli a5, a5, 12
	; RV64IM-NEXT: addi a5, a5, 561			; RV64IM-NEXT: addi a5, a5, 561
	; RV64IM-NEXT: mulhu a5, a1, a5			; RV64IM-NEXT: mulhu a5, a1, a5
	; RV64IM-NEXT: sub a2, a1, a5			; RV64IM-NEXT: sub a2, a1, a5
	; RV64IM-NEXT: srli a2, a2, 1			; RV64IM-NEXT: srli a2, a2, 1
	; RV64IM-NEXT: add a2, a2, a5			; RV64IM-NEXT: add a2, a2, a5
	; RV64IM-NEXT: srli a2, a2, 6			; RV64IM-NEXT: srli a2, a2, 6
	; RV64IM-NEXT: addi a5, zero, 95			; RV64IM-NEXT: addi a5, zero, 95
	; RV64IM-NEXT: mul a2, a2, a5			; RV64IM-NEXT: mulw a2, a2, a5
	; RV64IM-NEXT: sub a1, a1, a2			; RV64IM-NEXT: subw a1, a1, a2
	; RV64IM-NEXT: andi a2, a4, 63			; RV64IM-NEXT: andi a2, a4, 63
	; RV64IM-NEXT: andi a3, a3, 31			; RV64IM-NEXT: andi a3, a3, 31
	; RV64IM-NEXT: andi a4, a6, 7			; RV64IM-NEXT: andi a4, a6, 7
	; RV64IM-NEXT: sh a4, 4(a0)			; RV64IM-NEXT: sh a4, 4(a0)
	; RV64IM-NEXT: sh a3, 2(a0)			; RV64IM-NEXT: sh a3, 2(a0)
	; RV64IM-NEXT: sh a2, 0(a0)			; RV64IM-NEXT: sh a2, 0(a0)
	; RV64IM-NEXT: sh a1, 6(a0)			; RV64IM-NEXT: sh a1, 6(a0)
	; RV64IM-NEXT: ret			; RV64IM-NEXT: ret
	▲ Show 20 Lines • Show All 123 Lines • ▼ Show 20 Lines
	; RV64IM-NEXT: slli a4, a4, 14			; RV64IM-NEXT: slli a4, a4, 14
	; RV64IM-NEXT: addi a4, a4, 713			; RV64IM-NEXT: addi a4, a4, 713
	; RV64IM-NEXT: mulhu a4, a1, a4			; RV64IM-NEXT: mulhu a4, a1, a4
	; RV64IM-NEXT: sub a5, a1, a4			; RV64IM-NEXT: sub a5, a1, a4
	; RV64IM-NEXT: srli a5, a5, 1			; RV64IM-NEXT: srli a5, a5, 1
	; RV64IM-NEXT: add a4, a5, a4			; RV64IM-NEXT: add a4, a5, a4
	; RV64IM-NEXT: srli a4, a4, 4			; RV64IM-NEXT: srli a4, a4, 4
	; RV64IM-NEXT: addi a5, zero, 23			; RV64IM-NEXT: addi a5, zero, 23
	; RV64IM-NEXT: mul a4, a4, a5			; RV64IM-NEXT: mulw a4, a4, a5
	; RV64IM-NEXT: sub a1, a1, a4			; RV64IM-NEXT: subw a1, a1, a4
	; RV64IM-NEXT: srli a4, a3, 1			; RV64IM-NEXT: srli a4, a3, 1
	; RV64IM-NEXT: lui a5, 6413			; RV64IM-NEXT: lui a5, 6413
	; RV64IM-NEXT: addiw a5, a5, 1265			; RV64IM-NEXT: addiw a5, a5, 1265
	; RV64IM-NEXT: slli a5, a5, 13			; RV64IM-NEXT: slli a5, a5, 13
	; RV64IM-NEXT: addi a5, a5, 1027			; RV64IM-NEXT: addi a5, a5, 1027
	; RV64IM-NEXT: slli a5, a5, 13			; RV64IM-NEXT: slli a5, a5, 13
	; RV64IM-NEXT: addi a5, a5, 1077			; RV64IM-NEXT: addi a5, a5, 1077
	; RV64IM-NEXT: slli a5, a5, 12			; RV64IM-NEXT: slli a5, a5, 12
	; RV64IM-NEXT: addi a5, a5, 965			; RV64IM-NEXT: addi a5, a5, 965
	; RV64IM-NEXT: mulhu a4, a4, a5			; RV64IM-NEXT: mulhu a4, a4, a5
	; RV64IM-NEXT: srli a4, a4, 7			; RV64IM-NEXT: srli a4, a4, 7
	; RV64IM-NEXT: addi a5, zero, 654			; RV64IM-NEXT: addi a5, zero, 654
	; RV64IM-NEXT: mul a4, a4, a5			; RV64IM-NEXT: mulw a4, a4, a5
	; RV64IM-NEXT: sub a3, a3, a4			; RV64IM-NEXT: subw a3, a3, a4
	; RV64IM-NEXT: lui a4, 1044567			; RV64IM-NEXT: lui a4, 1044567
	; RV64IM-NEXT: addiw a4, a4, -575			; RV64IM-NEXT: addiw a4, a4, -575
	; RV64IM-NEXT: slli a4, a4, 12			; RV64IM-NEXT: slli a4, a4, 12
	; RV64IM-NEXT: addi a4, a4, 883			; RV64IM-NEXT: addi a4, a4, 883
	; RV64IM-NEXT: slli a4, a4, 14			; RV64IM-NEXT: slli a4, a4, 14
	; RV64IM-NEXT: addi a4, a4, -861			; RV64IM-NEXT: addi a4, a4, -861
	; RV64IM-NEXT: slli a4, a4, 12			; RV64IM-NEXT: slli a4, a4, 12
	; RV64IM-NEXT: addi a4, a4, -179			; RV64IM-NEXT: addi a4, a4, -179
	; RV64IM-NEXT: mulhu a4, a2, a4			; RV64IM-NEXT: mulhu a4, a2, a4
	; RV64IM-NEXT: srli a4, a4, 12			; RV64IM-NEXT: srli a4, a4, 12
	; RV64IM-NEXT: lui a5, 1			; RV64IM-NEXT: lui a5, 1
	; RV64IM-NEXT: addiw a5, a5, 1327			; RV64IM-NEXT: addiw a5, a5, 1327
	; RV64IM-NEXT: mul a4, a4, a5			; RV64IM-NEXT: mulw a4, a4, a5
	; RV64IM-NEXT: sub a2, a2, a4			; RV64IM-NEXT: subw a2, a2, a4
	; RV64IM-NEXT: sh zero, 0(a0)			; RV64IM-NEXT: sh zero, 0(a0)
	; RV64IM-NEXT: sh a2, 6(a0)			; RV64IM-NEXT: sh a2, 6(a0)
	; RV64IM-NEXT: sh a3, 2(a0)			; RV64IM-NEXT: sh a3, 2(a0)
	; RV64IM-NEXT: sh a1, 4(a0)			; RV64IM-NEXT: sh a1, 4(a0)
	; RV64IM-NEXT: ret			; RV64IM-NEXT: ret
	%1 = urem <4 x i16> %x, <i16 1, i16 654, i16 23, i16 5423>			%1 = urem <4 x i16> %x, <i16 1, i16 654, i16 23, i16 5423>
	ret <4 x i16> %1			ret <4 x i16> %1
	}			}
	▲ Show 20 Lines • Show All 247 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/usub_sat_plus.ll

	Show All 19 Lines
	; RV32I-NEXT: bltu a3, a1, .LBB0_2			; RV32I-NEXT: bltu a3, a1, .LBB0_2
	; RV32I-NEXT: # %bb.1:			; RV32I-NEXT: # %bb.1:
	; RV32I-NEXT: mv a0, a1			; RV32I-NEXT: mv a0, a1
	; RV32I-NEXT: .LBB0_2:			; RV32I-NEXT: .LBB0_2:
	; RV32I-NEXT: ret			; RV32I-NEXT: ret
	;			;
	; RV64I-LABEL: func32:			; RV64I-LABEL: func32:
	; RV64I: # %bb.0:			; RV64I: # %bb.0:
	; RV64I-NEXT: mul a1, a1, a2			; RV64I-NEXT: mulw a1, a1, a2
	; RV64I-NEXT: subw a1, a0, a1			; RV64I-NEXT: subw a1, a0, a1
	; RV64I-NEXT: sext.w a2, a0			; RV64I-NEXT: sext.w a2, a0
	; RV64I-NEXT: mv a0, zero			; RV64I-NEXT: mv a0, zero
	; RV64I-NEXT: bltu a2, a1, .LBB0_2			; RV64I-NEXT: bltu a2, a1, .LBB0_2
	; RV64I-NEXT: # %bb.1:			; RV64I-NEXT: # %bb.1:
	; RV64I-NEXT: mv a0, a1			; RV64I-NEXT: mv a0, a1
	; RV64I-NEXT: .LBB0_2:			; RV64I-NEXT: .LBB0_2:
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	▲ Show 20 Lines • Show All 236 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/vararg.ll

	Show First 20 Lines • Show All 1,308 Lines • ▼ Show 20 Lines
	; LP64-LP64F-LP64D-FPELIM-NEXT: addi a2, a0, 8			; LP64-LP64F-LP64D-FPELIM-NEXT: addi a2, a0, 8
	; LP64-LP64F-LP64D-FPELIM-NEXT: sd a2, 8(sp)			; LP64-LP64F-LP64D-FPELIM-NEXT: sd a2, 8(sp)
	; LP64-LP64F-LP64D-FPELIM-NEXT: ld a2, 0(a0)			; LP64-LP64F-LP64D-FPELIM-NEXT: ld a2, 0(a0)
	; LP64-LP64F-LP64D-FPELIM-NEXT: addi a0, a0, 11			; LP64-LP64F-LP64D-FPELIM-NEXT: addi a0, a0, 11
	; LP64-LP64F-LP64D-FPELIM-NEXT: andi a0, a0, -4			; LP64-LP64F-LP64D-FPELIM-NEXT: andi a0, a0, -4
	; LP64-LP64F-LP64D-FPELIM-NEXT: addi a3, a0, 8			; LP64-LP64F-LP64D-FPELIM-NEXT: addi a3, a0, 8
	; LP64-LP64F-LP64D-FPELIM-NEXT: sd a3, 8(sp)			; LP64-LP64F-LP64D-FPELIM-NEXT: sd a3, 8(sp)
	; LP64-LP64F-LP64D-FPELIM-NEXT: ld a0, 0(a0)			; LP64-LP64F-LP64D-FPELIM-NEXT: ld a0, 0(a0)
	; LP64-LP64F-LP64D-FPELIM-NEXT: add a1, a1, s0			; LP64-LP64F-LP64D-FPELIM-NEXT: addw a1, a1, s0
	; LP64-LP64F-LP64D-FPELIM-NEXT: add a1, a1, a2			; LP64-LP64F-LP64D-FPELIM-NEXT: addw a1, a1, a2
	; LP64-LP64F-LP64D-FPELIM-NEXT: addw a0, a1, a0			; LP64-LP64F-LP64D-FPELIM-NEXT: addw a0, a1, a0
	; LP64-LP64F-LP64D-FPELIM-NEXT: ld s0, 16(sp) # 8-byte Folded Reload			; LP64-LP64F-LP64D-FPELIM-NEXT: ld s0, 16(sp) # 8-byte Folded Reload
	; LP64-LP64F-LP64D-FPELIM-NEXT: ld ra, 24(sp) # 8-byte Folded Reload			; LP64-LP64F-LP64D-FPELIM-NEXT: ld ra, 24(sp) # 8-byte Folded Reload
	; LP64-LP64F-LP64D-FPELIM-NEXT: addi sp, sp, 96			; LP64-LP64F-LP64D-FPELIM-NEXT: addi sp, sp, 96
	; LP64-LP64F-LP64D-FPELIM-NEXT: ret			; LP64-LP64F-LP64D-FPELIM-NEXT: ret
	;			;
	; LP64-LP64F-LP64D-WITHFP-LABEL: va4_va_copy:			; LP64-LP64F-LP64D-WITHFP-LABEL: va4_va_copy:
	; LP64-LP64F-LP64D-WITHFP: # %bb.0:			; LP64-LP64F-LP64D-WITHFP: # %bb.0:
	Show All 25 Lines
	; LP64-LP64F-LP64D-WITHFP-NEXT: addi a2, a0, 8			; LP64-LP64F-LP64D-WITHFP-NEXT: addi a2, a0, 8
	; LP64-LP64F-LP64D-WITHFP-NEXT: sd a2, -32(s0)			; LP64-LP64F-LP64D-WITHFP-NEXT: sd a2, -32(s0)
	; LP64-LP64F-LP64D-WITHFP-NEXT: ld a2, 0(a0)			; LP64-LP64F-LP64D-WITHFP-NEXT: ld a2, 0(a0)
	; LP64-LP64F-LP64D-WITHFP-NEXT: addi a0, a0, 11			; LP64-LP64F-LP64D-WITHFP-NEXT: addi a0, a0, 11
	; LP64-LP64F-LP64D-WITHFP-NEXT: andi a0, a0, -4			; LP64-LP64F-LP64D-WITHFP-NEXT: andi a0, a0, -4
	; LP64-LP64F-LP64D-WITHFP-NEXT: addi a3, a0, 8			; LP64-LP64F-LP64D-WITHFP-NEXT: addi a3, a0, 8
	; LP64-LP64F-LP64D-WITHFP-NEXT: sd a3, -32(s0)			; LP64-LP64F-LP64D-WITHFP-NEXT: sd a3, -32(s0)
	; LP64-LP64F-LP64D-WITHFP-NEXT: ld a0, 0(a0)			; LP64-LP64F-LP64D-WITHFP-NEXT: ld a0, 0(a0)
	; LP64-LP64F-LP64D-WITHFP-NEXT: add a1, a1, s1			; LP64-LP64F-LP64D-WITHFP-NEXT: addw a1, a1, s1
	; LP64-LP64F-LP64D-WITHFP-NEXT: add a1, a1, a2			; LP64-LP64F-LP64D-WITHFP-NEXT: addw a1, a1, a2
	; LP64-LP64F-LP64D-WITHFP-NEXT: addw a0, a1, a0			; LP64-LP64F-LP64D-WITHFP-NEXT: addw a0, a1, a0
	; LP64-LP64F-LP64D-WITHFP-NEXT: ld s1, 24(sp) # 8-byte Folded Reload			; LP64-LP64F-LP64D-WITHFP-NEXT: ld s1, 24(sp) # 8-byte Folded Reload
	; LP64-LP64F-LP64D-WITHFP-NEXT: ld s0, 32(sp) # 8-byte Folded Reload			; LP64-LP64F-LP64D-WITHFP-NEXT: ld s0, 32(sp) # 8-byte Folded Reload
	; LP64-LP64F-LP64D-WITHFP-NEXT: ld ra, 40(sp) # 8-byte Folded Reload			; LP64-LP64F-LP64D-WITHFP-NEXT: ld ra, 40(sp) # 8-byte Folded Reload
	; LP64-LP64F-LP64D-WITHFP-NEXT: addi sp, sp, 112			; LP64-LP64F-LP64D-WITHFP-NEXT: addi sp, sp, 112
	; LP64-LP64F-LP64D-WITHFP-NEXT: ret			; LP64-LP64F-LP64D-WITHFP-NEXT: ret
	%vargs = alloca i8*, align 4			%vargs = alloca i8*, align 4
	%wargs = alloca i8*, align 4			%wargs = alloca i8*, align 4
	▲ Show 20 Lines • Show All 582 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/xaluo.ll

	Show First 20 Lines • Show All 352 Lines • ▼ Show 20 Lines
	; RV32: # %bb.0: # %entry			; RV32: # %bb.0: # %entry
	; RV32-NEXT: add a1, a0, a1			; RV32-NEXT: add a1, a0, a1
	; RV32-NEXT: sltu a0, a1, a0			; RV32-NEXT: sltu a0, a1, a0
	; RV32-NEXT: sw a1, 0(a2)			; RV32-NEXT: sw a1, 0(a2)
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: uaddo.i32:			; RV64-LABEL: uaddo.i32:
	; RV64: # %bb.0: # %entry			; RV64: # %bb.0: # %entry
	; RV64-NEXT: addw a3, a0, a1			; RV64-NEXT: addw a1, a0, a1
	; RV64-NEXT: sext.w a4, a0			; RV64-NEXT: sext.w a0, a0
	; RV64-NEXT: sltu a3, a3, a4			; RV64-NEXT: sltu a0, a1, a0
	; RV64-NEXT: add a0, a0, a1			; RV64-NEXT: sw a1, 0(a2)
	; RV64-NEXT: sw a0, 0(a2)
	; RV64-NEXT: mv a0, a3
	; RV64-NEXT: ret			; RV64-NEXT: ret
	;			;
	; RV32ZBA-LABEL: uaddo.i32:			; RV32ZBA-LABEL: uaddo.i32:
	; RV32ZBA: # %bb.0: # %entry			; RV32ZBA: # %bb.0: # %entry
	; RV32ZBA-NEXT: add a1, a0, a1			; RV32ZBA-NEXT: add a1, a0, a1
	; RV32ZBA-NEXT: sltu a0, a1, a0			; RV32ZBA-NEXT: sltu a0, a1, a0
	; RV32ZBA-NEXT: sw a1, 0(a2)			; RV32ZBA-NEXT: sw a1, 0(a2)
	; RV32ZBA-NEXT: ret			; RV32ZBA-NEXT: ret
	;			;
	; RV64ZBA-LABEL: uaddo.i32:			; RV64ZBA-LABEL: uaddo.i32:
	; RV64ZBA: # %bb.0: # %entry			; RV64ZBA: # %bb.0: # %entry
	; RV64ZBA-NEXT: addw a3, a0, a1			; RV64ZBA-NEXT: addw a1, a0, a1
	; RV64ZBA-NEXT: sext.w a4, a0			; RV64ZBA-NEXT: sext.w a0, a0
	; RV64ZBA-NEXT: sltu a3, a3, a4			; RV64ZBA-NEXT: sltu a0, a1, a0
	; RV64ZBA-NEXT: add a0, a0, a1			; RV64ZBA-NEXT: sw a1, 0(a2)
	; RV64ZBA-NEXT: sw a0, 0(a2)
	; RV64ZBA-NEXT: mv a0, a3
	; RV64ZBA-NEXT: ret			; RV64ZBA-NEXT: ret
	entry:			entry:
	%t = call {i32, i1} @llvm.uadd.with.overflow.i32(i32 %v1, i32 %v2)			%t = call {i32, i1} @llvm.uadd.with.overflow.i32(i32 %v1, i32 %v2)
	%val = extractvalue {i32, i1} %t, 0			%val = extractvalue {i32, i1} %t, 0
	%obit = extractvalue {i32, i1} %t, 1			%obit = extractvalue {i32, i1} %t, 1
	store i32 %val, i32* %res			store i32 %val, i32* %res
	ret i1 %obit			ret i1 %obit
	}			}

	define zeroext i1 @uaddo.i32.constant(i32 %v1, i32* %res) {			define zeroext i1 @uaddo.i32.constant(i32 %v1, i32* %res) {
	; RV32-LABEL: uaddo.i32.constant:			; RV32-LABEL: uaddo.i32.constant:
	; RV32: # %bb.0: # %entry			; RV32: # %bb.0: # %entry
	; RV32-NEXT: addi a2, a0, -2			; RV32-NEXT: addi a2, a0, -2
	; RV32-NEXT: sltu a0, a2, a0			; RV32-NEXT: sltu a0, a2, a0
	; RV32-NEXT: sw a2, 0(a1)			; RV32-NEXT: sw a2, 0(a1)
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: uaddo.i32.constant:			; RV64-LABEL: uaddo.i32.constant:
	; RV64: # %bb.0: # %entry			; RV64: # %bb.0: # %entry
	; RV64-NEXT: sext.w a2, a0			; RV64-NEXT: sext.w a2, a0
	; RV64-NEXT: addiw a3, a0, -2			; RV64-NEXT: addiw a3, a0, -2
	; RV64-NEXT: sltu a2, a3, a2			; RV64-NEXT: sltu a0, a3, a2
	; RV64-NEXT: addi a0, a0, -2			; RV64-NEXT: sw a3, 0(a1)
	; RV64-NEXT: sw a0, 0(a1)
	; RV64-NEXT: mv a0, a2
	; RV64-NEXT: ret			; RV64-NEXT: ret
	;			;
	; RV32ZBA-LABEL: uaddo.i32.constant:			; RV32ZBA-LABEL: uaddo.i32.constant:
	; RV32ZBA: # %bb.0: # %entry			; RV32ZBA: # %bb.0: # %entry
	; RV32ZBA-NEXT: addi a2, a0, -2			; RV32ZBA-NEXT: addi a2, a0, -2
	; RV32ZBA-NEXT: sltu a0, a2, a0			; RV32ZBA-NEXT: sltu a0, a2, a0
	; RV32ZBA-NEXT: sw a2, 0(a1)			; RV32ZBA-NEXT: sw a2, 0(a1)
	; RV32ZBA-NEXT: ret			; RV32ZBA-NEXT: ret
	;			;
	; RV64ZBA-LABEL: uaddo.i32.constant:			; RV64ZBA-LABEL: uaddo.i32.constant:
	; RV64ZBA: # %bb.0: # %entry			; RV64ZBA: # %bb.0: # %entry
	; RV64ZBA-NEXT: sext.w a2, a0			; RV64ZBA-NEXT: sext.w a2, a0
	; RV64ZBA-NEXT: addiw a3, a0, -2			; RV64ZBA-NEXT: addiw a3, a0, -2
	; RV64ZBA-NEXT: sltu a2, a3, a2			; RV64ZBA-NEXT: sltu a0, a3, a2
	; RV64ZBA-NEXT: addi a0, a0, -2			; RV64ZBA-NEXT: sw a3, 0(a1)
	; RV64ZBA-NEXT: sw a0, 0(a1)
	; RV64ZBA-NEXT: mv a0, a2
	; RV64ZBA-NEXT: ret			; RV64ZBA-NEXT: ret
	entry:			entry:
	%t = call {i32, i1} @llvm.uadd.with.overflow.i32(i32 %v1, i32 -2)			%t = call {i32, i1} @llvm.uadd.with.overflow.i32(i32 %v1, i32 -2)
	%val = extractvalue {i32, i1} %t, 0			%val = extractvalue {i32, i1} %t, 0
	%obit = extractvalue {i32, i1} %t, 1			%obit = extractvalue {i32, i1} %t, 1
	store i32 %val, i32* %res			store i32 %val, i32* %res
	ret i1 %obit			ret i1 %obit
	}			}
	▲ Show 20 Lines • Show All 199 Lines • ▼ Show 20 Lines
	; RV32: # %bb.0: # %entry			; RV32: # %bb.0: # %entry
	; RV32-NEXT: sub a1, a0, a1			; RV32-NEXT: sub a1, a0, a1
	; RV32-NEXT: sltu a0, a0, a1			; RV32-NEXT: sltu a0, a0, a1
	; RV32-NEXT: sw a1, 0(a2)			; RV32-NEXT: sw a1, 0(a2)
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: usubo.i32:			; RV64-LABEL: usubo.i32:
	; RV64: # %bb.0: # %entry			; RV64: # %bb.0: # %entry
	; RV64-NEXT: subw a3, a0, a1			; RV64-NEXT: subw a1, a0, a1
	; RV64-NEXT: sext.w a4, a0			; RV64-NEXT: sext.w a0, a0
	; RV64-NEXT: sltu a3, a4, a3			; RV64-NEXT: sltu a0, a0, a1
	; RV64-NEXT: sub a0, a0, a1			; RV64-NEXT: sw a1, 0(a2)
	; RV64-NEXT: sw a0, 0(a2)
	; RV64-NEXT: mv a0, a3
	; RV64-NEXT: ret			; RV64-NEXT: ret
	;			;
	; RV32ZBA-LABEL: usubo.i32:			; RV32ZBA-LABEL: usubo.i32:
	; RV32ZBA: # %bb.0: # %entry			; RV32ZBA: # %bb.0: # %entry
	; RV32ZBA-NEXT: sub a1, a0, a1			; RV32ZBA-NEXT: sub a1, a0, a1
	; RV32ZBA-NEXT: sltu a0, a0, a1			; RV32ZBA-NEXT: sltu a0, a0, a1
	; RV32ZBA-NEXT: sw a1, 0(a2)			; RV32ZBA-NEXT: sw a1, 0(a2)
	; RV32ZBA-NEXT: ret			; RV32ZBA-NEXT: ret
	;			;
	; RV64ZBA-LABEL: usubo.i32:			; RV64ZBA-LABEL: usubo.i32:
	; RV64ZBA: # %bb.0: # %entry			; RV64ZBA: # %bb.0: # %entry
	; RV64ZBA-NEXT: subw a3, a0, a1			; RV64ZBA-NEXT: subw a1, a0, a1
	; RV64ZBA-NEXT: sext.w a4, a0			; RV64ZBA-NEXT: sext.w a0, a0
	; RV64ZBA-NEXT: sltu a3, a4, a3			; RV64ZBA-NEXT: sltu a0, a0, a1
	; RV64ZBA-NEXT: sub a0, a0, a1			; RV64ZBA-NEXT: sw a1, 0(a2)
	; RV64ZBA-NEXT: sw a0, 0(a2)
	; RV64ZBA-NEXT: mv a0, a3
	; RV64ZBA-NEXT: ret			; RV64ZBA-NEXT: ret
	entry:			entry:
	%t = call {i32, i1} @llvm.usub.with.overflow.i32(i32 %v1, i32 %v2)			%t = call {i32, i1} @llvm.usub.with.overflow.i32(i32 %v1, i32 %v2)
	%val = extractvalue {i32, i1} %t, 0			%val = extractvalue {i32, i1} %t, 0
	%obit = extractvalue {i32, i1} %t, 1			%obit = extractvalue {i32, i1} %t, 1
	store i32 %val, i32* %res			store i32 %val, i32* %res
	ret i1 %obit			ret i1 %obit
	}			}

	define zeroext i1 @usubo.i32.constant.rhs(i32 %v1, i32* %res) {			define zeroext i1 @usubo.i32.constant.rhs(i32 %v1, i32* %res) {
	; RV32-LABEL: usubo.i32.constant.rhs:			; RV32-LABEL: usubo.i32.constant.rhs:
	; RV32: # %bb.0: # %entry			; RV32: # %bb.0: # %entry
	; RV32-NEXT: addi a2, a0, 2			; RV32-NEXT: addi a2, a0, 2
	; RV32-NEXT: sltu a0, a0, a2			; RV32-NEXT: sltu a0, a0, a2
	; RV32-NEXT: sw a2, 0(a1)			; RV32-NEXT: sw a2, 0(a1)
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: usubo.i32.constant.rhs:			; RV64-LABEL: usubo.i32.constant.rhs:
	; RV64: # %bb.0: # %entry			; RV64: # %bb.0: # %entry
	; RV64-NEXT: addiw a2, a0, 2			; RV64-NEXT: addiw a2, a0, 2
	; RV64-NEXT: sext.w a3, a0			; RV64-NEXT: sext.w a0, a0
	; RV64-NEXT: sltu a2, a3, a2			; RV64-NEXT: sltu a0, a0, a2
	; RV64-NEXT: addi a0, a0, 2			; RV64-NEXT: sw a2, 0(a1)
	; RV64-NEXT: sw a0, 0(a1)
	; RV64-NEXT: mv a0, a2
	; RV64-NEXT: ret			; RV64-NEXT: ret
	;			;
	; RV32ZBA-LABEL: usubo.i32.constant.rhs:			; RV32ZBA-LABEL: usubo.i32.constant.rhs:
	; RV32ZBA: # %bb.0: # %entry			; RV32ZBA: # %bb.0: # %entry
	; RV32ZBA-NEXT: addi a2, a0, 2			; RV32ZBA-NEXT: addi a2, a0, 2
	; RV32ZBA-NEXT: sltu a0, a0, a2			; RV32ZBA-NEXT: sltu a0, a0, a2
	; RV32ZBA-NEXT: sw a2, 0(a1)			; RV32ZBA-NEXT: sw a2, 0(a1)
	; RV32ZBA-NEXT: ret			; RV32ZBA-NEXT: ret
	;			;
	; RV64ZBA-LABEL: usubo.i32.constant.rhs:			; RV64ZBA-LABEL: usubo.i32.constant.rhs:
	; RV64ZBA: # %bb.0: # %entry			; RV64ZBA: # %bb.0: # %entry
	; RV64ZBA-NEXT: addiw a2, a0, 2			; RV64ZBA-NEXT: addiw a2, a0, 2
	; RV64ZBA-NEXT: sext.w a3, a0			; RV64ZBA-NEXT: sext.w a0, a0
	; RV64ZBA-NEXT: sltu a2, a3, a2			; RV64ZBA-NEXT: sltu a0, a0, a2
	; RV64ZBA-NEXT: addi a0, a0, 2			; RV64ZBA-NEXT: sw a2, 0(a1)
	; RV64ZBA-NEXT: sw a0, 0(a1)
	; RV64ZBA-NEXT: mv a0, a2
	; RV64ZBA-NEXT: ret			; RV64ZBA-NEXT: ret
	entry:			entry:
	%t = call {i32, i1} @llvm.usub.with.overflow.i32(i32 %v1, i32 -2)			%t = call {i32, i1} @llvm.usub.with.overflow.i32(i32 %v1, i32 -2)
	%val = extractvalue {i32, i1} %t, 0			%val = extractvalue {i32, i1} %t, 0
	%obit = extractvalue {i32, i1} %t, 1			%obit = extractvalue {i32, i1} %t, 1
	store i32 %val, i32* %res			store i32 %val, i32* %res
	ret i1 %obit			ret i1 %obit
	}			}

	define zeroext i1 @usubo.i32.constant.lhs(i32 %v1, i32* %res) {			define zeroext i1 @usubo.i32.constant.lhs(i32 %v1, i32* %res) {
	; RV32-LABEL: usubo.i32.constant.lhs:			; RV32-LABEL: usubo.i32.constant.lhs:
	; RV32: # %bb.0: # %entry			; RV32: # %bb.0: # %entry
	; RV32-NEXT: addi a2, zero, -2			; RV32-NEXT: addi a2, zero, -2
	; RV32-NEXT: sub a2, a2, a0			; RV32-NEXT: sub a2, a2, a0
	; RV32-NEXT: addi a0, a2, 1			; RV32-NEXT: addi a0, a2, 1
	; RV32-NEXT: seqz a0, a0			; RV32-NEXT: seqz a0, a0
	; RV32-NEXT: sw a2, 0(a1)			; RV32-NEXT: sw a2, 0(a1)
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: usubo.i32.constant.lhs:			; RV64-LABEL: usubo.i32.constant.lhs:
	; RV64: # %bb.0: # %entry			; RV64: # %bb.0: # %entry
	; RV64-NEXT: addi a3, zero, -2			; RV64-NEXT: addi a2, zero, -2
	; RV64-NEXT: subw a2, a3, a0			; RV64-NEXT: subw a2, a2, a0
	; RV64-NEXT: addi a2, a2, 1			; RV64-NEXT: addi a0, a2, 1
	; RV64-NEXT: seqz a2, a2			; RV64-NEXT: seqz a0, a0
	; RV64-NEXT: sub a0, a3, a0			; RV64-NEXT: sw a2, 0(a1)
	; RV64-NEXT: sw a0, 0(a1)
	; RV64-NEXT: mv a0, a2
	; RV64-NEXT: ret			; RV64-NEXT: ret
	;			;
	; RV32ZBA-LABEL: usubo.i32.constant.lhs:			; RV32ZBA-LABEL: usubo.i32.constant.lhs:
	; RV32ZBA: # %bb.0: # %entry			; RV32ZBA: # %bb.0: # %entry
	; RV32ZBA-NEXT: addi a2, zero, -2			; RV32ZBA-NEXT: addi a2, zero, -2
	; RV32ZBA-NEXT: sub a2, a2, a0			; RV32ZBA-NEXT: sub a2, a2, a0
	; RV32ZBA-NEXT: addi a0, a2, 1			; RV32ZBA-NEXT: addi a0, a2, 1
	; RV32ZBA-NEXT: seqz a0, a0			; RV32ZBA-NEXT: seqz a0, a0
	; RV32ZBA-NEXT: sw a2, 0(a1)			; RV32ZBA-NEXT: sw a2, 0(a1)
	; RV32ZBA-NEXT: ret			; RV32ZBA-NEXT: ret
	;			;
	; RV64ZBA-LABEL: usubo.i32.constant.lhs:			; RV64ZBA-LABEL: usubo.i32.constant.lhs:
	; RV64ZBA: # %bb.0: # %entry			; RV64ZBA: # %bb.0: # %entry
	; RV64ZBA-NEXT: addi a3, zero, -2			; RV64ZBA-NEXT: addi a2, zero, -2
	; RV64ZBA-NEXT: subw a2, a3, a0			; RV64ZBA-NEXT: subw a2, a2, a0
	; RV64ZBA-NEXT: addi a2, a2, 1			; RV64ZBA-NEXT: addi a0, a2, 1
	; RV64ZBA-NEXT: seqz a2, a2			; RV64ZBA-NEXT: seqz a0, a0
	; RV64ZBA-NEXT: sub a0, a3, a0			; RV64ZBA-NEXT: sw a2, 0(a1)
	; RV64ZBA-NEXT: sw a0, 0(a1)
	; RV64ZBA-NEXT: mv a0, a2
	; RV64ZBA-NEXT: ret			; RV64ZBA-NEXT: ret
	entry:			entry:
	%t = call {i32, i1} @llvm.usub.with.overflow.i32(i32 -2, i32 %v1)			%t = call {i32, i1} @llvm.usub.with.overflow.i32(i32 -2, i32 %v1)
	%val = extractvalue {i32, i1} %t, 0			%val = extractvalue {i32, i1} %t, 0
	%obit = extractvalue {i32, i1} %t, 1			%obit = extractvalue {i32, i1} %t, 1
	store i32 %val, i32* %res			store i32 %val, i32* %res
	ret i1 %obit			ret i1 %obit
	}			}
	▲ Show 20 Lines • Show All 2,898 Lines • Show Last 20 Lines

This is an archive of the discontinued LLVM Phabricator instance.

[RISCV] Teach isel to select ADDW/SUBW/MULW/SLLIW when only the lower 32-bits are used.ClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 367245

llvm/lib/Target/RISCV/RISCVISelDAGToDAG.h

llvm/lib/Target/RISCV/RISCVISelDAGToDAG.cpp

llvm/lib/Target/RISCV/RISCVInstrInfo.td

llvm/lib/Target/RISCV/RISCVInstrInfoM.td

llvm/test/CodeGen/RISCV/add-before-shl.ll

llvm/test/CodeGen/RISCV/add-imm.ll

llvm/test/CodeGen/RISCV/addimm-mulimm.ll

llvm/test/CodeGen/RISCV/atomic-cmpxchg.ll

llvm/test/CodeGen/RISCV/atomic-rmw.ll

llvm/test/CodeGen/RISCV/atomic-signext.ll

llvm/test/CodeGen/RISCV/calling-conv-lp64-lp64f-lp64d-common.ll

llvm/test/CodeGen/RISCV/div.ll

llvm/test/CodeGen/RISCV/mul.ll

llvm/test/CodeGen/RISCV/rv64i-demanded-bits.ll

llvm/test/CodeGen/RISCV/rv64i-exhaustive-w-insts.ll

llvm/test/CodeGen/RISCV/rv64i-w-insts-legalization.ll

llvm/test/CodeGen/RISCV/rv64m-exhaustive-w-insts.ll

llvm/test/CodeGen/RISCV/rv64zbb-zbp.ll

llvm/test/CodeGen/RISCV/rv64zbb.ll

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-ctlz.ll

llvm/test/CodeGen/RISCV/sadd_sat_plus.ll

llvm/test/CodeGen/RISCV/shadowcallstack.ll

llvm/test/CodeGen/RISCV/shift-masked-shamt.ll

llvm/test/CodeGen/RISCV/srem-lkk.ll

llvm/test/CodeGen/RISCV/srem-seteq-illegal-types.ll

llvm/test/CodeGen/RISCV/srem-vector-lkk.ll

llvm/test/CodeGen/RISCV/ssub_sat_plus.ll

llvm/test/CodeGen/RISCV/uadd_sat_plus.ll

llvm/test/CodeGen/RISCV/urem-lkk.ll

llvm/test/CodeGen/RISCV/urem-vector-lkk.ll

llvm/test/CodeGen/RISCV/usub_sat_plus.ll

llvm/test/CodeGen/RISCV/vararg.ll

llvm/test/CodeGen/RISCV/xaluo.ll

[RISCV] Teach isel to select ADDW/SUBW/MULW/SLLIW when only the lower 32-bits are used.
ClosedPublic