This is an archive of the discontinued LLVM Phabricator instance.

Paths

Table of Contentst

-
llvm/
-
include/llvm/CodeGen/
-
llvm/
-
CodeGen/
-
TargetLowering.h
-
lib/CodeGen/SelectionDAG/
-
CodeGen/
-
SelectionDAG/
-
DAGCombiner.cpp
5/5
TargetLowering.cpp
-
test/CodeGen/
-
CodeGen/
-
AArch64/
-
srem-seteq.ll
-
srem-vector-lkk.ll
1/2
urem-seteq-nonzero.ll
-
urem-seteq.ll
-
urem-vector-lkk.ll
-
AMDGPU/
-
amdgpu-codegenprepare-idiv.ll
-
udiv64.ll
-
urem64.ll
-
BPF/
-
32-bit-subreg-alu.ll
-
sdiv_error.ll
-
PowerPC/
-
loop-instr-form-prepare.ll
-
srem-lkk.ll
-
srem-vector-lkk.ll
-
urem-lkk.ll
-
urem-vector-lkk.ll
-
RISCV/
-
div.ll
-
srem-lkk.ll
-
srem-vector-lkk.ll
-
urem-lkk.ll
-
urem-vector-lkk.ll
-
SPARC/
-
rem.ll
-
X86/
-
divide-by-constant.ll
-
divmod128.ll
2/2
i128-sdiv.ll
-
i128-udiv.ll
-
pr44812.ll
-
rotate-extract-vector.ll
-
rotate-extract.ll
-
srem-vector-lkk.ll
-
urem-seteq-nonzero.ll
-
urem-vector-lkk.ll
-
vector-idiv-sdiv-128.ll
-
vector-idiv-sdiv-256.ll
-
vector-idiv-sdiv-512.ll
-
vector-idiv-udiv-128.ll
-
vector-idiv-udiv-256.ll
-
vector-idiv-udiv-512.ll
-
vector-idiv-v2i32.ll
2
vshli-simplify-demanded-bits.ll

Differential D87976

Support the division-by-constant strength reduction for more integer types
Needs ReviewPublic

Authored by nagisa on Sep 19 2020, 3:05 PM.

Download Raw Diff

Details

Reviewers

RKSimon
craig.topper
nikic
efriedma
nhaehnle

Summary

The division-by-constant strength reduction into multiply-shift sequence of instructions can be
applied on ~all target at any integer width to gain significant throughput boost for the operation,
at a (fairly significant) cost of code size.

LLVM already has this optimisation, but it would only fire on integers
with bit-widths supported natively. For example on x86_64 divisions up to 64-bits would trigger the
optimisation and on i686 64-bit integers would no longer be strength-reduced anymore.

This commit adjusts the lowering code to apply this strength-reduction even on integer bit-widths
not natively supported by the target. Ideally this would've been implemented via fallback lowerings
for the ISD::MULHU and ISD::MULHS – not all of the backends support them – but I found that to
require significant refactors and it still failed to work on some backends such as the ARM or the
RISCV (without m instructions) regardless.

However, the targets will universally support ISD::MUL of any bit-width so we just take the upper
half of the regular MUL result. This will likely be sub-optimal in a sense that some of the
instructions may not do anything useful, but even with those instructions present the resulting
lowering should be significantly better compared to conventional software division implementations.

Depends on D88785

Diff Detail

Repository: rG LLVM Github Monorepo

Event Timeline

nagisa created this revision.Sep 19 2020, 3:05 PM

Herald added a project: Restricted Project. · View Herald TranscriptSep 19 2020, 3:05 PM

Herald added subscribers: llvm-commits, luismarques, s.egerton and 5 others. · View Herald Transcript

Still working on adding the tests, but I believe this is “done” otherwise.

nagisa edited the summary of this revision. (Show Details)Sep 19 2020, 3:08 PM

nagisa edited the summary of this revision. (Show Details)

Harbormaster completed remote builds in B72292: Diff 292990.Sep 19 2020, 3:39 PM

Update the pre-existing tests

Herald added subscribers: kerbowa, apazos, sameer.abuasal and 20 others. · View Herald TranscriptSep 20 2020, 1:52 PM

Harbormaster completed remote builds in B72317: Diff 293031.Sep 20 2020, 2:20 PM

Allow non-legal shift types too

nagisa published this revision for review.Sep 26 2020, 5:43 PM

nagisa added reviewers: eli.friedman, RKSimon, craig.topper, nikic.

Herald added a subscriber: MaskRay. · View Herald TranscriptSep 26 2020, 5:43 PM

Don't do any of this after legalization has already happend

Harbormaster completed remote builds in B73075: Diff 294528.Sep 26 2020, 6:26 PM

Harbormaster completed remote builds in B73076: Diff 294529.Sep 26 2020, 6:57 PM

craig.topper added inline comments.Sep 26 2020, 8:57 PM

llvm/lib/CodeGen/SelectionDAG/TargetLowering.cpp
4977	IsAfterLegalization refers to LegalOperations not LegalTypes.
4980–4981	I believe IsAfterLegalization refers to LegalOperations rather than LegalTypes. But if we get here after type legalization then the VT must be Legal or it wouldn't have been seen by DAGCombiner to call this so we might just be able to remove this whole check.
5049	This needs to be a check for LegalTypes not LegalOperations.
llvm/test/CodeGen/X86/vshli-simplify-demanded-bits.ll
11–25	Why did the amount of code increase here? This is a legal type so why was it affected?

craig.topper added inline comments.Sep 26 2020, 8:59 PM

llvm/test/CodeGen/X86/vshli-simplify-demanded-bits.ll
11–25	Oh I misread the arguments. One is a legal type but the other isn't.

nikic edited reviewers, added: efriedma; removed: eli.friedman.Sep 27 2020, 1:08 AM

nagisa added inline comments.Sep 27 2020, 5:04 AM

llvm/lib/CodeGen/SelectionDAG/TargetLowering.cpp
4977	Any suggestions on how to best approach obtaining the information? Should I just pass in another boolean as an argument from `DAGCombiner`?
4980–4981	Yeah, I had this removed entirely in an earlier revision and it worked just fine, I had this added back motivating to myself that there might be some weird corner-case that I'm not aware of where “just do it” approach wouldn't be correct.

RKSimon mentioned this in rGd9499c88d19b: [X86] Regenerate i128 sdiv tests and add i686 coverage..Sep 27 2020, 8:07 AM

Adding @nhaehnle who tried something similar at D24822

I'm skeptical this is a good idea when the division is wider than the widest legal mulhi. You end up generating either a ton of inline code, or a libcall; the result might not be faster than the original divide libcall.

The improvements along the lines of llvm/test/CodeGen/AArch64/srem-seteq.ll are obviously profitable.

Also, I think I remember some discussion that the compiler-rt implementations of division on x86 have performance issues.

In D87976#2297076, @efriedma wrote:

I'm skeptical this is a good idea when the division is wider than the widest legal mulhi. You end up generating either a ton of inline code, or a libcall; the result might not be faster than the original divide libcall.

LLVM (with this change) is definitely going to generate a ton of inline code. For instance a single function containing sdiv i1024 generates a whooping 2238 lines of x86_64 assembly. However, it does manage to generate any assembly at all. LLVM could not do it before because there are no libcalls it knows about >128bit. So that's already somewhat of an improvement. This is also not an unique problem. Legalization of other super wide operations, even for things as simple as add or even various shifts, expand to large amounts of code too.

You are also right that with this change LLVM may generate multiplication libcalls (such as when dividing i128 integers). Multiplications are comparatively easy to implement efficiently in software, where they become a tree of smaller multiplications, added together. And so, generation of multiplication libcalls is perhaps even desirable, as it reduces the amount of code generated inline somewhat! You can’t do anything alike for division.

Ultimately however, i64 and i128 operations are all that matter. So as a quick comparison I could produce in the short amount of time I had for this comment:

	div RThroughput	This expansion RThroughput
i686 core2: `i64 / 42`	18-37[^2]	13.8[^1]
i686 core2: `i128 / 42`	libcall (?)	61.0[^1]
x86_64 znver2: `i128 / 42`	13-44[^3]	8.0[^4]

[^1]: Calculated by llvm-mca -mcpu=core2 -mtriple=i686
[^2]: Taken from Agner's instruction tables for “Intel Core 2 (Merom, 65nm)”.
[^3]: Taken from Agner's instruction tables for “AMD Zen 2” (used zen instead of skylake, because zen's native instruction throughput is better).
[^4]: Calculated by llvm-mca -mcpu=znver2 -mtriple=x86_64

In either of these two instances the strength-reduced operation has a better throughput than the best case of a native (although most likely micro-coded) division instruction. I strongly doubt a software implementation of division could do at all better than such a native instruction. Although I could see scales tipping for targets where there are no native multiplication instructions.

Finally, isIntDivCheap exists and should allow targets to prevent this optimisation where it makes sense for them?

For these computations I used the following snippet of code (and equivalent with s/i128/i64/ for i686):

define dso_local i128 @foo(i128 %x) local_unnamed_addr #0 {
entry:
  %d = udiv i128 %x, 42
  ret i128 %d
}

In D87976#2297078, @efriedma wrote:

Also, I think I remember some discussion that the compiler-rt implementations of division on x86 have performance issues.

We recently got heavily optimised software division implementations in Rust's compiler-builtins. I could compare against those as well, but many of them are very architecture specific, and I don’t have good means for cycle-accurate measurements outside of x86_64.

please can you rebase?

Gate lowering on whether we're after type lowering & rebase

Herald added subscribers: ecnelises, jfb. · View Herald TranscriptSep 28 2020, 4:15 AM

RKSimon added inline comments.Sep 28 2020, 4:17 AM

llvm/test/CodeGen/X86/i128-sdiv.ll
3	Can you add this coverage back?

redo formatting

restore i128-sdiv RUN lines

nagisa marked 4 inline comments as done.Sep 28 2020, 4:22 AM

nagisa added inline comments.

llvm/test/CodeGen/X86/i128-sdiv.ll
3	Huh, not sure how it got removed.

Restore i128-sdiv further

Harbormaster completed remote builds in B73140: Diff 294647.Sep 28 2020, 4:30 AM

Harbormaster completed remote builds in B73142: Diff 294649.Sep 28 2020, 4:35 AM

Harbormaster completed remote builds in B73143: Diff 294650.

Harbormaster completed remote builds in B73144: Diff 294651.Sep 28 2020, 4:39 AM

In either of these two instances the strength-reduced operation has a better throughput than the best case of a native (although most likely micro-coded) division instruction. I strongly doubt a software implementation of division could do at all better than such a native instruction. Although I could see scales tipping for targets where there are no native multiplication instructions.

There are 2 issues here that x86 in particular avoids:

Some targets don't really have a multiplier, like certain RISC-V variants. Or some targets have a multiply instruction that's hard to use here, like Cortex-M0.
The libcall is doing a ton of extra work to produce the result of an NxN->N multiply. We don't have the libcall variant we want here.

However, it does manage to generate any assembly at all. LLVM could not do it before because there are no libcalls it knows about >128bit. So that's already somewhat of an improvement.

If we really cared about this, we could emit a general-purpose implementation inline. We don't do this because that isn't what anyone wants anyway.

llvm/test/CodeGen/AArch64/urem-seteq-nonzero.ll
207	Any idea what's going on here?

nagisa added inline comments.Oct 3 2020, 9:49 AM

llvm/test/CodeGen/AArch64/urem-seteq-nonzero.ll
207	Good catch. With the old code the `urem` gets promoted to i32 first, which AFAICT then allows some other validity check pass in the `SimplifySetCC` (which doesn't otherwise work for i16/i8), and thus apply (seteq/ne (urem N, D), 0) -> (setule/ugt (rotr (mul N, P), K), Q) anyway. With the adjusted `BuildUDIV` the multiply-shift reduction manages to get applied before `urem i16` gets promoted to `urem i32`.

Herald added a subscriber: pengfei. · View Herald TranscriptOct 3 2020, 9:49 AM

nagisa mentioned this in D88785: Support {S,U}REMEqFold before legalization.Oct 3 2020, 11:33 AM

Rebase on top of D88785

nagisa edited the summary of this revision. (Show Details)Oct 4 2020, 6:34 AM

nagisa added a parent revision: D88785: Support {S,U}REMEqFold before legalization.

Harbormaster completed remote builds in B73916: Diff 296046.Oct 4 2020, 6:50 AM

Pass around DAGCombinerInfo instead of booleans

Harbormaster completed remote builds in B73917: Diff 296047.Oct 4 2020, 7:25 AM

nagisa mentioned this in rG777a58e05b22: Support {S,U}REMEqFold before legalization.Mar 31 2021, 3:36 PM

Revision Contents

Path

Size

llvm/

include/

llvm/

CodeGen/

TargetLowering.h

537 lines

lib/

CodeGen/

SelectionDAG/

DAGCombiner.cpp

4 lines

TargetLowering.cpp

909 lines

test/

CodeGen/

AArch64/

srem-seteq.ll

9 lines

srem-vector-lkk.ll

387 lines

urem-seteq-nonzero.ll

30 lines

urem-seteq.ll

15 lines

urem-vector-lkk.ll

315 lines

AMDGPU/

amdgpu-codegenprepare-idiv.ll

892 lines

udiv64.ll

242 lines

urem64.ll

129 lines

BPF/

32-bit-subreg-alu.ll

5 lines

sdiv_error.ll

4 lines

PowerPC/

loop-instr-form-prepare.ll

48 lines

101 lines

2218 lines

97 lines

1804 lines

RISCV/

226 lines

371 lines

2576 lines

278 lines

1865 lines

SPARC/

rem.ll

32 lines

X86/

divide-by-constant.ll

205 lines

335 lines

237 lines

227 lines

22 lines

rotate-extract-vector.ll

244 lines

rotate-extract.ll

28 lines

srem-vector-lkk.ll

744 lines

urem-seteq-nonzero.ll

54 lines

urem-vector-lkk.ll

518 lines

vector-idiv-sdiv-128.ll

272 lines

vector-idiv-sdiv-256.ll

292 lines

vector-idiv-sdiv-512.ll

181 lines

vector-idiv-udiv-128.ll

216 lines

vector-idiv-udiv-256.ll

252 lines

vector-idiv-udiv-512.ll

242 lines

vector-idiv-v2i32.ll

262 lines

vshli-simplify-demanded-bits.ll

44 lines

Diff 294647

llvm/include/llvm/CodeGen/TargetLowering.h

Show First 20 Lines • Show All 87 Lines • ▼ Show 20 Lines
class TargetMachine;		class TargetMachine;
class TargetRegisterClass;		class TargetRegisterClass;
class TargetRegisterInfo;		class TargetRegisterInfo;
class TargetTransformInfo;		class TargetTransformInfo;
class Value;		class Value;

namespace Sched {		namespace Sched {

enum Preference {		enum Preference {
None, // No preference		None, // No preference
Source, // Follow source order.		Source, // Follow source order.
RegPressure, // Scheduling for lowest register pressure.		RegPressure, // Scheduling for lowest register pressure.
Hybrid, // Scheduling for both latency and register pressure.		Hybrid, // Scheduling for both latency and register pressure.
ILP, // Scheduling for ILP in low register pressure mode.		ILP, // Scheduling for ILP in low register pressure mode.
VLIW // Scheduling for VLIW targets.		VLIW // Scheduling for VLIW targets.
};		};

} // end namespace Sched		} // end namespace Sched

// MemOp models a memory operation, either memset or memcpy/memmove.		// MemOp models a memory operation, either memset or memcpy/memmove.
struct MemOp {		struct MemOp {
private:		private:
// Shared		// Shared
uint64_t Size;		uint64_t Size;
▲ Show 20 Lines • Show All 73 Lines • ▼ Show 20 Lines

/// This base class for TargetLowering contains the SelectionDAG-independent		/// This base class for TargetLowering contains the SelectionDAG-independent
/// parts that can be used from the rest of CodeGen.		/// parts that can be used from the rest of CodeGen.
class TargetLoweringBase {		class TargetLoweringBase {
public:		public:
/// This enum indicates whether operations are valid for a target, and if not,		/// This enum indicates whether operations are valid for a target, and if not,
/// what action should be used to make them valid.		/// what action should be used to make them valid.
enum LegalizeAction : uint8_t {		enum LegalizeAction : uint8_t {
Legal, // The target natively supports this operation.		Legal, // The target natively supports this operation.
Promote, // This operation should be executed in a larger type.		Promote, // This operation should be executed in a larger type.
Expand, // Try to expand this to other ops, otherwise use a libcall.		Expand, // Try to expand this to other ops, otherwise use a libcall.
LibCall, // Don't try to expand this to other ops, always use a libcall.		LibCall, // Don't try to expand this to other ops, always use a libcall.
Custom // Use the LowerOperation hook to implement custom lowering.		Custom // Use the LowerOperation hook to implement custom lowering.
};		};

/// This enum indicates whether a types are legal for a target, and if not,		/// This enum indicates whether a types are legal for a target, and if not,
/// what action should be used to make them valid.		/// what action should be used to make them valid.
enum LegalizeTypeAction : uint8_t {		enum LegalizeTypeAction : uint8_t {
TypeLegal, // The target natively supports this type.		TypeLegal, // The target natively supports this type.
TypePromoteInteger, // Replace this integer with a larger one.		TypePromoteInteger, // Replace this integer with a larger one.
TypeExpandInteger, // Split this integer into two of half the size.		TypeExpandInteger, // Split this integer into two of half the size.
TypeSoftenFloat, // Convert this float to a same size integer type.		TypeSoftenFloat, // Convert this float to a same size integer type.
TypeExpandFloat, // Split this float into two of half the size.		TypeExpandFloat, // Split this float into two of half the size.
TypeScalarizeVector, // Replace this one-element vector with its element.		TypeScalarizeVector, // Replace this one-element vector with its element.
TypeSplitVector, // Split this vector into two of half the size.		TypeSplitVector, // Split this vector into two of half the size.
TypeWidenVector, // This vector should be widened into a larger vector.		TypeWidenVector, // This vector should be widened into a larger vector.
TypePromoteFloat, // Replace this float with a larger one.		TypePromoteFloat, // Replace this float with a larger one.
TypeSoftPromoteHalf, // Soften half to i16 and use float to do arithmetic.		TypeSoftPromoteHalf, // Soften half to i16 and use float to do arithmetic.
TypeScalarizeScalableVector, // This action is explicitly left unimplemented.		TypeScalarizeScalableVector, // This action is explicitly left
// While it is theoretically possible to		// unimplemented. While it is theoretically
// legalize operations on scalable types with a		// possible to legalize operations on scalable
// loop that handles the vscale * #lanes of the		// types with a loop that handles the vscale *
// vector, this is non-trivial at SelectionDAG		// #lanes of the vector, this is non-trivial at
// level and these types are better to be		// SelectionDAG level and these types are
// widened or promoted.		// better to be widened or promoted.
};		};

/// LegalizeKind holds the legalization kind that needs to happen to EVT		/// LegalizeKind holds the legalization kind that needs to happen to EVT
/// in order to type-legalize it.		/// in order to type-legalize it.
using LegalizeKind = std::pair<LegalizeTypeAction, EVT>;		using LegalizeKind = std::pair<LegalizeTypeAction, EVT>;

/// Enum that describes how the target represents true/false values.		/// Enum that describes how the target represents true/false values.
enum BooleanContent {		enum BooleanContent {
UndefinedBooleanContent, // Only bit 0 counts, the rest can hold garbage.		UndefinedBooleanContent, // Only bit 0 counts, the rest can hold garbage.
ZeroOrOneBooleanContent, // All bits zero except for bit 0.		ZeroOrOneBooleanContent, // All bits zero except for bit 0.
ZeroOrNegativeOneBooleanContent // All bits equal to bit 0.		ZeroOrNegativeOneBooleanContent // All bits equal to bit 0.
};		};

/// Enum that describes what type of support for selects the target has.		/// Enum that describes what type of support for selects the target has.
enum SelectSupportKind {		enum SelectSupportKind {
ScalarValSelect, // The target supports scalar selects (ex: cmov).		ScalarValSelect, // The target supports scalar selects (ex: cmov).
ScalarCondVectorVal, // The target supports selects with a scalar condition		ScalarCondVectorVal, // The target supports selects with a scalar condition
// and vector values (ex: cmov).		// and vector values (ex: cmov).
VectorMaskSelect // The target supports vector selects with a vector		VectorMaskSelect // The target supports vector selects with a vector
// mask (ex: x86 blends).		// mask (ex: x86 blends).
};		};

/// Enum that specifies what an atomic load/AtomicRMWInst is expanded		/// Enum that specifies what an atomic load/AtomicRMWInst is expanded
/// to, if at all. Exists because different targets have different levels of		/// to, if at all. Exists because different targets have different levels of
/// support for these atomic instructions, and also have different options		/// support for these atomic instructions, and also have different options
/// w.r.t. what they should expand to.		/// w.r.t. what they should expand to.
enum class AtomicExpansionKind {		enum class AtomicExpansionKind {
None, // Don't expand the instruction.		None, // Don't expand the instruction.
Show All 9 Lines	public:
enum class MulExpansionKind {		enum class MulExpansionKind {
Always, // Always expand the instruction.		Always, // Always expand the instruction.
OnlyLegalOrCustom, // Only expand when the resulting instructions are legal		OnlyLegalOrCustom, // Only expand when the resulting instructions are legal
// or custom.		// or custom.
};		};

/// Enum that specifies when a float negation is beneficial.		/// Enum that specifies when a float negation is beneficial.
enum class NegatibleCost {		enum class NegatibleCost {
Cheaper = 0, // Negated expression is cheaper.		Cheaper = 0, // Negated expression is cheaper.
Neutral = 1, // Negated expression has the same cost.		Neutral = 1, // Negated expression has the same cost.
Expensive = 2 // Negated expression is more expensive.		Expensive = 2 // Negated expression is more expensive.
};		};

class ArgListEntry {		class ArgListEntry {
public:		public:
Value *Val = nullptr;		Value *Val = nullptr;
SDValue Node = SDValue();		SDValue Node = SDValue();
Type *Ty = nullptr;		Type *Ty = nullptr;
bool IsSExt : 1;		bool IsSExt : 1;
▲ Show 20 Lines • Show All 42 Lines • ▼ Show 20 Lines	public:
}		}

explicit TargetLoweringBase(const TargetMachine &TM);		explicit TargetLoweringBase(const TargetMachine &TM);
TargetLoweringBase(const TargetLoweringBase &) = delete;		TargetLoweringBase(const TargetLoweringBase &) = delete;
TargetLoweringBase &operator=(const TargetLoweringBase &) = delete;		TargetLoweringBase &operator=(const TargetLoweringBase &) = delete;
virtual ~TargetLoweringBase() = default;		virtual ~TargetLoweringBase() = default;

/// Return true if the target support strict float operation		/// Return true if the target support strict float operation
bool isStrictFPEnabled() const {		bool isStrictFPEnabled() const { return IsStrictFPEnabled; }
return IsStrictFPEnabled;
}

protected:		protected:
/// Initialize all of the actions to default values.		/// Initialize all of the actions to default values.
void initActions();		void initActions();

public:		public:
const TargetMachine &getTargetMachine() const { return TM; }		const TargetMachine &getTargetMachine() const { return TM; }

▲ Show 20 Lines • Show All 50 Lines • ▼ Show 20 Lines	public:
/// ISD::INSERT_SUBVECTOR, and ISD::EXTRACT_SUBVECTOR		/// ISD::INSERT_SUBVECTOR, and ISD::EXTRACT_SUBVECTOR
virtual MVT getVectorIdxTy(const DataLayout &DL) const {		virtual MVT getVectorIdxTy(const DataLayout &DL) const {
return getPointerTy(DL);		return getPointerTy(DL);
}		}

/// This callback is used to inspect load/store instructions and add		/// This callback is used to inspect load/store instructions and add
/// target-specific MachineMemOperand flags to them. The default		/// target-specific MachineMemOperand flags to them. The default
/// implementation does nothing.		/// implementation does nothing.
virtual MachineMemOperand::Flags getTargetMMOFlags(const Instruction &I) const {		virtual MachineMemOperand::Flags
		getTargetMMOFlags(const Instruction &I) const {
return MachineMemOperand::MONone;		return MachineMemOperand::MONone;
}		}

MachineMemOperand::Flags getLoadMemOperandFlags(const LoadInst &LI,		MachineMemOperand::Flags getLoadMemOperandFlags(const LoadInst &LI,
const DataLayout &DL) const;		const DataLayout &DL) const;
MachineMemOperand::Flags getStoreMemOperandFlags(const StoreInst &SI,		MachineMemOperand::Flags getStoreMemOperandFlags(const StoreInst &SI,
const DataLayout &DL) const;		const DataLayout &DL) const;
MachineMemOperand::Flags getAtomicMemOperandFlags(const Instruction &AI,		MachineMemOperand::Flags getAtomicMemOperandFlags(const Instruction &AI,
const DataLayout &DL) const;		const DataLayout &DL) const;

virtual bool isSelectSupported(SelectSupportKind /kind/) const {		virtual bool isSelectSupported(SelectSupportKind /kind/) const {
return true;		return true;
}		}

/// Return true if it is profitable to convert a select of FP constants into		/// Return true if it is profitable to convert a select of FP constants into
/// a constant pool load whose address depends on the select condition. The		/// a constant pool load whose address depends on the select condition. The
/// parameter may be used to differentiate a select with FP compare from		/// parameter may be used to differentiate a select with FP compare from
/// integer compare.		/// integer compare.
virtual bool reduceSelectOfFPConstantLoads(EVT CmpOpVT) const {		virtual bool reduceSelectOfFPConstantLoads(EVT CmpOpVT) const { return true; }
return true;
}

/// Return true if multiple condition registers are available.		/// Return true if multiple condition registers are available.
bool hasMultipleConditionRegisters() const {		bool hasMultipleConditionRegisters() const {
return HasMultipleConditionRegisters;		return HasMultipleConditionRegisters;
}		}

/// Return true if the target has BitExtract instructions.		/// Return true if the target has BitExtract instructions.
bool hasExtractBitsInsn() const { return HasExtractBitsInsn; }		bool hasExtractBitsInsn() const { return HasExtractBitsInsn; }
Show All 34 Lines	public:

/// Return true if integer divide is usually cheaper than a sequence of		/// Return true if integer divide is usually cheaper than a sequence of
/// several shifts, adds, and multiplies for this target.		/// several shifts, adds, and multiplies for this target.
/// The definition of "cheaper" may depend on whether we're optimizing		/// The definition of "cheaper" may depend on whether we're optimizing
/// for speed or for size.		/// for speed or for size.
virtual bool isIntDivCheap(EVT VT, AttributeList Attr) const { return false; }		virtual bool isIntDivCheap(EVT VT, AttributeList Attr) const { return false; }

/// Return true if the target can handle a standalone remainder operation.		/// Return true if the target can handle a standalone remainder operation.
virtual bool hasStandaloneRem(EVT VT) const {		virtual bool hasStandaloneRem(EVT VT) const { return true; }
return true;
}

/// Return true if SQRT(X) shouldn't be replaced with X*RSQRT(X).		/// Return true if SQRT(X) shouldn't be replaced with X*RSQRT(X).
virtual bool isFsqrtCheap(SDValue X, SelectionDAG &DAG) const {		virtual bool isFsqrtCheap(SDValue X, SelectionDAG &DAG) const {
// Default behavior is to replace SQRT(X) with X*RSQRT(X).		// Default behavior is to replace SQRT(X) with X*RSQRT(X).
return false;		return false;
}		}

/// Reciprocal estimate status values used by the functions below.		/// Reciprocal estimate status values used by the functions below.
enum ReciprocalEstimate : int {		enum ReciprocalEstimate : int { Unspecified = -1, Disabled = 0, Enabled = 1 };
Unspecified = -1,
Disabled = 0,
Enabled = 1
};

/// Return a ReciprocalEstimate enum value for a square root of the given type		/// Return a ReciprocalEstimate enum value for a square root of the given type
/// based on the function's attributes. If the operation is not overridden by		/// based on the function's attributes. If the operation is not overridden by
/// the function's attributes, "Unspecified" is returned and target defaults		/// the function's attributes, "Unspecified" is returned and target defaults
/// are expected to be used for instruction selection.		/// are expected to be used for instruction selection.
int getRecipEstimateSqrtEnabled(EVT VT, MachineFunction &MF) const;		int getRecipEstimateSqrtEnabled(EVT VT, MachineFunction &MF) const;

/// Return a ReciprocalEstimate enum value for a division of the given type		/// Return a ReciprocalEstimate enum value for a division of the given type
▲ Show 20 Lines • Show All 60 Lines • ▼ Show 20 Lines	virtual bool isLoadBitCastBeneficial(EVT LoadVT, EVT BitcastVT,
// Don't bother doing this if it's just going to be promoted again later, as		// Don't bother doing this if it's just going to be promoted again later, as
// doing so might interfere with other combines.		// doing so might interfere with other combines.
if (getOperationAction(ISD::LOAD, LoadMVT) == Promote &&		if (getOperationAction(ISD::LOAD, LoadMVT) == Promote &&
getTypeToPromoteTo(ISD::LOAD, LoadMVT) == BitcastVT.getSimpleVT())		getTypeToPromoteTo(ISD::LOAD, LoadMVT) == BitcastVT.getSimpleVT())
return false;		return false;

bool Fast = false;		bool Fast = false;
return allowsMemoryAccess(*DAG.getContext(), DAG.getDataLayout(), BitcastVT,		return allowsMemoryAccess(*DAG.getContext(), DAG.getDataLayout(), BitcastVT,
MMO, &Fast) && Fast;		MMO, &Fast) &&
		Fast;
}		}

/// Return true if the following transform is beneficial:		/// Return true if the following transform is beneficial:
/// (store (y (conv x)), y)) -> (store x, (x))		/// (store (y (conv x)), y)) -> (store x, (x))
virtual bool isStoreBitCastBeneficial(EVT StoreVT, EVT BitcastVT,		virtual bool isStoreBitCastBeneficial(EVT StoreVT, EVT BitcastVT,
const SelectionDAG &DAG,		const SelectionDAG &DAG,
const MachineMemOperand &MMO) const {		const MachineMemOperand &MMO) const {
// Default to the same logic as loads.		// Default to the same logic as loads.
return isLoadBitCastBeneficial(StoreVT, BitcastVT, DAG, MMO);		return isLoadBitCastBeneficial(StoreVT, BitcastVT, DAG, MMO);
}		}

/// Return true if it is expected to be cheaper to do a store of a non-zero		/// Return true if it is expected to be cheaper to do a store of a non-zero
/// vector constant with the given size and type for the address space than to		/// vector constant with the given size and type for the address space than to
/// store the individual scalar element constants.		/// store the individual scalar element constants.
virtual bool storeOfVectorConstantIsCheap(EVT MemVT,		virtual bool storeOfVectorConstantIsCheap(EVT MemVT, unsigned NumElem,
unsigned NumElem,
unsigned AddrSpace) const {		unsigned AddrSpace) const {
return false;		return false;
}		}

/// Allow store merging for the specified type after legalization in addition		/// Allow store merging for the specified type after legalization in addition
/// to before legalization. This may transform stores that do not exist		/// to before legalization. This may transform stores that do not exist
/// earlier (for example, stores created from intrinsics).		/// earlier (for example, stores created from intrinsics).
virtual bool mergeStoresAfterLegalization(EVT MemVT) const {		virtual bool mergeStoresAfterLegalization(EVT MemVT) const { return true; }
return true;
}

/// Returns if it's reasonable to merge stores to MemVT size.		/// Returns if it's reasonable to merge stores to MemVT size.
virtual bool canMergeStoresTo(unsigned AS, EVT MemVT,		virtual bool canMergeStoresTo(unsigned AS, EVT MemVT,
const SelectionDAG &DAG) const {		const SelectionDAG &DAG) const {
return true;		return true;
}		}

/// Return true if it is cheap to speculate a call to intrinsic cttz.		/// Return true if it is cheap to speculate a call to intrinsic cttz.
virtual bool isCheapToSpeculateCttz() const {		virtual bool isCheapToSpeculateCttz() const { return false; }
return false;
}

/// Return true if it is cheap to speculate a call to intrinsic ctlz.		/// Return true if it is cheap to speculate a call to intrinsic ctlz.
virtual bool isCheapToSpeculateCtlz() const {		virtual bool isCheapToSpeculateCtlz() const { return false; }
return false;
}

/// Return true if ctlz instruction is fast.		/// Return true if ctlz instruction is fast.
virtual bool isCtlzFast() const {		virtual bool isCtlzFast() const { return false; }
return false;
}

/// Return true if instruction generated for equality comparison is folded		/// Return true if instruction generated for equality comparison is folded
/// with instruction generated for signed comparison.		/// with instruction generated for signed comparison.
virtual bool isEqualityCmpFoldedWithSignedCmp() const { return true; }		virtual bool isEqualityCmpFoldedWithSignedCmp() const { return true; }

/// Return true if it is safe to transform an integer-domain bitwise operation		/// Return true if it is safe to transform an integer-domain bitwise operation
/// into the equivalent floating-point operation. This should be set to true		/// into the equivalent floating-point operation. This should be set to true
/// if the target has IEEE-754-compliant fabs/fneg operations for the input		/// if the target has IEEE-754-compliant fabs/fneg operations for the input
/// type.		/// type.
virtual bool hasBitPreservingFPLogic(EVT VT) const {		virtual bool hasBitPreservingFPLogic(EVT VT) const { return false; }
return false;
}

/// Return true if it is cheaper to split the store of a merged int val		/// Return true if it is cheaper to split the store of a merged int val
/// from a pair of smaller values into multiple stores.		/// from a pair of smaller values into multiple stores.
virtual bool isMultiStoresCheaperThanBitsMerge(EVT LTy, EVT HTy) const {		virtual bool isMultiStoresCheaperThanBitsMerge(EVT LTy, EVT HTy) const {
return false;		return false;
}		}

/// Return if the target supports combining a		/// Return if the target supports combining a
Show All 10 Lines	virtual bool isMaskAndCmp0FoldingBeneficial(const Instruction &AndI) const {
return false;		return false;
}		}

/// Use bitwise logic to make pairs of compares more efficient. For example:		/// Use bitwise logic to make pairs of compares more efficient. For example:
/// and (seteq A, B), (seteq C, D) --> seteq (or (xor A, B), (xor C, D)), 0		/// and (seteq A, B), (seteq C, D) --> seteq (or (xor A, B), (xor C, D)), 0
/// This should be true when it takes more than one instruction to lower		/// This should be true when it takes more than one instruction to lower
/// setcc (cmp+set on x86 scalar), when bitwise ops are faster than logic on		/// setcc (cmp+set on x86 scalar), when bitwise ops are faster than logic on
/// condition bits (crand on PowerPC), and/or when reducing cmp+br is a win.		/// condition bits (crand on PowerPC), and/or when reducing cmp+br is a win.
virtual bool convertSetCCLogicToBitwiseLogic(EVT VT) const {		virtual bool convertSetCCLogicToBitwiseLogic(EVT VT) const { return false; }
return false;
}

/// Return the preferred operand type if the target has a quick way to compare		/// Return the preferred operand type if the target has a quick way to compare
/// integer values of the given size. Assume that any legal integer type can		/// integer values of the given size. Assume that any legal integer type can
/// be compared efficiently. Targets may override this to allow illegal wide		/// be compared efficiently. Targets may override this to allow illegal wide
/// types to return a vector type if there is support to compare that type.		/// types to return a vector type if there is support to compare that type.
virtual MVT hasFastEqualityCompare(unsigned NumBits) const {		virtual MVT hasFastEqualityCompare(unsigned NumBits) const {
MVT VT = MVT::getIntegerVT(NumBits);		MVT VT = MVT::getIntegerVT(NumBits);
return isTypeLegal(VT) ? VT : MVT::INVALID_SIMPLE_VALUE_TYPE;		return isTypeLegal(VT) ? VT : MVT::INVALID_SIMPLE_VALUE_TYPE;
}		}

/// Return true if the target should transform:		/// Return true if the target should transform:
/// (X & Y) == Y ---> (~X & Y) == 0		/// (X & Y) == Y ---> (~X & Y) == 0
/// (X & Y) != Y ---> (~X & Y) != 0		/// (X & Y) != Y ---> (~X & Y) != 0
///		///
/// This may be profitable if the target has a bitwise and-not operation that		/// This may be profitable if the target has a bitwise and-not operation that
/// sets comparison flags. A target may want to limit the transformation based		/// sets comparison flags. A target may want to limit the transformation based
/// on the type of Y or if Y is a constant.		/// on the type of Y or if Y is a constant.
///		///
/// Note that the transform will not occur if Y is known to be a power-of-2		/// Note that the transform will not occur if Y is known to be a power-of-2
/// because a mask and compare of a single bit can be handled by inverting the		/// because a mask and compare of a single bit can be handled by inverting the
/// predicate, for example:		/// predicate, for example:
/// (X & 8) == 8 ---> (X & 8) != 0		/// (X & 8) == 8 ---> (X & 8) != 0
virtual bool hasAndNotCompare(SDValue Y) const {		virtual bool hasAndNotCompare(SDValue Y) const { return false; }
return false;
}

/// Return true if the target has a bitwise and-not operation:		/// Return true if the target has a bitwise and-not operation:
/// X = ~A & B		/// X = ~A & B
/// This can be used to simplify select or other instructions.		/// This can be used to simplify select or other instructions.
virtual bool hasAndNot(SDValue X) const {		virtual bool hasAndNot(SDValue X) const {
// If the target has the more complex version of this operation, assume that		// If the target has the more complex version of this operation, assume that
// it has this operation too.		// it has this operation too.
return hasAndNotCompare(X);		return hasAndNotCompare(X);
▲ Show 20 Lines • Show All 89 Lines • ▼ Show 20 Lines	public:
/// \p Cost[out] gives the cost of that transformation when this is true.		/// \p Cost[out] gives the cost of that transformation when this is true.
virtual bool canCombineStoreAndExtract(Type VectorTy, Value Idx,		virtual bool canCombineStoreAndExtract(Type VectorTy, Value Idx,
unsigned &Cost) const {		unsigned &Cost) const {
return false;		return false;
}		}

/// Return true if inserting a scalar into a variable element of an undef		/// Return true if inserting a scalar into a variable element of an undef
/// vector is more efficiently handled by splatting the scalar instead.		/// vector is more efficiently handled by splatting the scalar instead.
virtual bool shouldSplatInsEltVarIndex(EVT) const {		virtual bool shouldSplatInsEltVarIndex(EVT) const { return false; }
return false;
}

/// Return true if target always beneficiates from combining into FMA for a		/// Return true if target always beneficiates from combining into FMA for a
/// given value type. This must typically return false on targets where FMA		/// given value type. This must typically return false on targets where FMA
/// takes more cycles to execute than FADD.		/// takes more cycles to execute than FADD.
virtual bool enableAggressiveFMAFusion(EVT VT) const {		virtual bool enableAggressiveFMAFusion(EVT VT) const { return false; }
return false;
}

/// Return the ValueType of the result of SETCC operations.		/// Return the ValueType of the result of SETCC operations.
virtual EVT getSetCCResultType(const DataLayout &DL, LLVMContext &Context,		virtual EVT getSetCCResultType(const DataLayout &DL, LLVMContext &Context,
EVT VT) const;		EVT VT) const;

/// Return the ValueType for comparison libcalls. Comparions libcalls include		/// Return the ValueType for comparison libcalls. Comparions libcalls include
/// floating point comparion calls, and Ordered/Unordered check calls on		/// floating point comparion calls, and Ordered/Unordered check calls on
/// floating point numbers.		/// floating point numbers.
virtual		virtual MVT::SimpleValueType getCmpLibcallReturnType() const;
MVT::SimpleValueType getCmpLibcallReturnType() const;

/// For targets without i1 registers, this gives the nature of the high-bits		/// For targets without i1 registers, this gives the nature of the high-bits
/// of boolean values held in types wider than i1.		/// of boolean values held in types wider than i1.
///		///
/// "Boolean values" are special true/false values produced by nodes like		/// "Boolean values" are special true/false values produced by nodes like
/// SETCC and consumed (as the condition) by nodes like SELECT and BRCOND.		/// SETCC and consumed (as the condition) by nodes like SELECT and BRCOND.
/// Not to be confused with general values promoted from i1. Some cpus		/// Not to be confused with general values promoted from i1. Some cpus
/// distinguish between vectors of boolean and scalars; the isVec parameter		/// distinguish between vectors of boolean and scalars; the isVec parameter
Show All 22 Lines	public:
/// for different nodes. This function returns the preference (or none) for		/// for different nodes. This function returns the preference (or none) for
/// the given node.		/// the given node.
virtual Sched::Preference getSchedulingPreference(SDNode *) const {		virtual Sched::Preference getSchedulingPreference(SDNode *) const {
return Sched::None;		return Sched::None;
}		}

/// Return the register class that should be used for the specified value		/// Return the register class that should be used for the specified value
/// type.		/// type.
virtual const TargetRegisterClass *getRegClassFor(MVT VT, bool isDivergent = false) const {		virtual const TargetRegisterClass *
		getRegClassFor(MVT VT, bool isDivergent = false) const {
		Lint: Pre-merge checks Inline Actions clang-tidy: warning: invalid case style for parameter 'isDivergent' [readability-identifier-naming] not useful Lint: Pre-merge checks: clang-tidy: warning: invalid case style for parameter 'isDivergent' [readability-identifier…
(void)isDivergent;		(void)isDivergent;
const TargetRegisterClass *RC = RegClassForVT[VT.SimpleTy];		const TargetRegisterClass *RC = RegClassForVT[VT.SimpleTy];
assert(RC && "This value type is not natively supported!");		assert(RC && "This value type is not natively supported!");
return RC;		return RC;
}		}

/// Allows target to decide about the register class of the		/// Allows target to decide about the register class of the
/// specific value that is live outside the defining block.		/// specific value that is live outside the defining block.
▲ Show 20 Lines • Show All 120 Lines • ▼ Show 20 Lines	public:
virtual unsigned getVectorTypeBreakdownForCallingConv(		virtual unsigned getVectorTypeBreakdownForCallingConv(
LLVMContext &Context, CallingConv::ID CC, EVT VT, EVT &IntermediateVT,		LLVMContext &Context, CallingConv::ID CC, EVT VT, EVT &IntermediateVT,
unsigned &NumIntermediates, MVT &RegisterVT) const {		unsigned &NumIntermediates, MVT &RegisterVT) const {
return getVectorTypeBreakdown(Context, VT, IntermediateVT, NumIntermediates,		return getVectorTypeBreakdown(Context, VT, IntermediateVT, NumIntermediates,
RegisterVT);		RegisterVT);
}		}

struct IntrinsicInfo {		struct IntrinsicInfo {
unsigned opc = 0; // target opcode		unsigned opc = 0; // target opcode
		Lint: Pre-merge checks Inline Actions clang-tidy: warning: invalid case style for member 'opc' [readability-identifier-naming] not useful Lint: Pre-merge checks: clang-tidy: warning: invalid case style for member 'opc' [readability-identifier-naming]…
EVT memVT; // memory VT		EVT memVT; // memory VT
		Lint: Pre-merge checks Inline Actions clang-tidy: warning: invalid case style for member 'memVT' [readability-identifier-naming] not useful Lint: Pre-merge checks: clang-tidy: warning: invalid case style for member 'memVT' [readability-identifier-naming]…

// value representing memory location		// value representing memory location
PointerUnion<const Value , const PseudoSourceValue > ptrVal;		PointerUnion<const Value , const PseudoSourceValue > ptrVal;

int offset = 0; // offset off of ptrVal		int offset = 0; // offset off of ptrVal
		Lint: Pre-merge checks Inline Actions clang-tidy: warning: invalid case style for member 'offset' [readability-identifier-naming] not useful Lint: Pre-merge checks: clang-tidy: warning: invalid case style for member 'offset' [readability-identifier-naming]…
uint64_t size = 0; // the size of the memory location		uint64_t size = 0; // the size of the memory location
		Lint: Pre-merge checks Inline Actions clang-tidy: warning: invalid case style for member 'size' [readability-identifier-naming] not useful Lint: Pre-merge checks: clang-tidy: warning: invalid case style for member 'size' [readability-identifier-naming]…
// (taken from memVT if zero)		// (taken from memVT if zero)
MaybeAlign align = Align(1); // alignment		MaybeAlign align = Align(1); // alignment
		Lint: Pre-merge checks Inline Actions clang-tidy: warning: invalid case style for member 'align' [readability-identifier-naming] not useful Lint: Pre-merge checks: clang-tidy: warning: invalid case style for member 'align' [readability-identifier-naming]…

MachineMemOperand::Flags flags = MachineMemOperand::MONone;		MachineMemOperand::Flags flags = MachineMemOperand::MONone;
IntrinsicInfo() = default;		IntrinsicInfo() = default;
};		};

/// Given an intrinsic, checks if on the target the intrinsic will need to map		/// Given an intrinsic, checks if on the target the intrinsic will need to map
/// to a MemIntrinsicNode (touches memory). If this is the case, it returns		/// to a MemIntrinsicNode (touches memory). If this is the case, it returns
/// true and store the intrinsic information into the IntrinsicInfo that was		/// true and store the intrinsic information into the IntrinsicInfo that was
Show All 33 Lines	virtual bool isVectorClearMaskLegal(ArrayRef<int> /Mask/,
EVT /VT/) const {		EVT /VT/) const {
return false;		return false;
}		}

/// Return how this operation should be treated: either it is legal, needs to		/// Return how this operation should be treated: either it is legal, needs to
/// be promoted to a larger size, needs to be expanded to some other code		/// be promoted to a larger size, needs to be expanded to some other code
/// sequence, or the target has a custom expander for it.		/// sequence, or the target has a custom expander for it.
LegalizeAction getOperationAction(unsigned Op, EVT VT) const {		LegalizeAction getOperationAction(unsigned Op, EVT VT) const {
if (VT.isExtended()) return Expand;		if (VT.isExtended())
		return Expand;
// If a target-specific SDNode requires legalization, require the target		// If a target-specific SDNode requires legalization, require the target
// to provide custom legalization for it.		// to provide custom legalization for it.
if (Op >= array_lengthof(OpActions[0])) return Custom;		if (Op >= array_lengthof(OpActions[0]))
		return Custom;
return OpActions[(unsigned)VT.getSimpleVT().SimpleTy][Op];		return OpActions[(unsigned)VT.getSimpleVT().SimpleTy][Op];
}		}

/// Custom method defined by each target to indicate if an operation which		/// Custom method defined by each target to indicate if an operation which
/// may require a scale is supported natively by the target.		/// may require a scale is supported natively by the target.
/// If not, the operation is illegal.		/// If not, the operation is illegal.
virtual bool isSupportedFixedPointOperation(unsigned Op, EVT VT,		virtual bool isSupportedFixedPointOperation(unsigned Op, EVT VT,
unsigned Scale) const {		unsigned Scale) const {
Show All 31 Lines	LegalizeAction getFixedPointOperationAction(unsigned Op, EVT VT,
return Supported ? Action : Expand;		return Supported ? Action : Expand;
}		}

// If Op is a strict floating-point operation, return the result		// If Op is a strict floating-point operation, return the result
// of getOperationAction for the equivalent non-strict operation.		// of getOperationAction for the equivalent non-strict operation.
LegalizeAction getStrictFPOperationAction(unsigned Op, EVT VT) const {		LegalizeAction getStrictFPOperationAction(unsigned Op, EVT VT) const {
unsigned EqOpc;		unsigned EqOpc;
switch (Op) {		switch (Op) {
default: llvm_unreachable("Unexpected FP pseudo-opcode");		default:
		llvm_unreachable("Unexpected FP pseudo-opcode");
#define DAG_INSTRUCTION(NAME, NARG, ROUND_MODE, INTRINSIC, DAGN) \		#define DAG_INSTRUCTION(NAME, NARG, ROUND_MODE, INTRINSIC, DAGN) \
case ISD::STRICT_##DAGN: EqOpc = ISD::DAGN; break;		case ISD::STRICT_##DAGN: \
		EqOpc = ISD::DAGN; \
		break;
#define CMP_INSTRUCTION(NAME, NARG, ROUND_MODE, INTRINSIC, DAGN) \		#define CMP_INSTRUCTION(NAME, NARG, ROUND_MODE, INTRINSIC, DAGN) \
case ISD::STRICT_##DAGN: EqOpc = ISD::SETCC; break;		case ISD::STRICT_##DAGN: \
		EqOpc = ISD::SETCC; \
		break;
#include "llvm/IR/ConstrainedOps.def"		#include "llvm/IR/ConstrainedOps.def"
}		}

return getOperationAction(EqOpc, VT);		return getOperationAction(EqOpc, VT);
}		}

/// Return true if the specified operation is legal on this target or can be		/// Return true if the specified operation is legal on this target or can be
/// made legal with custom lowering. This is used to help guide high-level		/// made legal with custom lowering. This is used to help guide high-level
/// lowering decisions. LegalOnly is an optional convenience for code paths		/// lowering decisions. LegalOnly is an optional convenience for code paths
/// traversed pre and post legalisation.		/// traversed pre and post legalisation.
bool isOperationLegalOrCustom(unsigned Op, EVT VT,		bool isOperationLegalOrCustom(unsigned Op, EVT VT,
bool LegalOnly = false) const {		bool LegalOnly = false) const {
if (LegalOnly)		if (LegalOnly)
return isOperationLegal(Op, VT);		return isOperationLegal(Op, VT);

return (VT == MVT::Other \|\| isTypeLegal(VT)) &&		return (VT == MVT::Other \|\| isTypeLegal(VT)) &&
(getOperationAction(Op, VT) == Legal \|\|		(getOperationAction(Op, VT) == Legal \|\|
getOperationAction(Op, VT) == Custom);		getOperationAction(Op, VT) == Custom);
}		}

/// Return true if the specified operation is legal on this target or can be		/// Return true if the specified operation is legal on this target or can be
/// made legal using promotion. This is used to help guide high-level lowering		/// made legal using promotion. This is used to help guide high-level lowering
/// decisions. LegalOnly is an optional convenience for code paths traversed		/// decisions. LegalOnly is an optional convenience for code paths traversed
/// pre and post legalisation.		/// pre and post legalisation.
bool isOperationLegalOrPromote(unsigned Op, EVT VT,		bool isOperationLegalOrPromote(unsigned Op, EVT VT,
bool LegalOnly = false) const {		bool LegalOnly = false) const {
if (LegalOnly)		if (LegalOnly)
return isOperationLegal(Op, VT);		return isOperationLegal(Op, VT);

return (VT == MVT::Other \|\| isTypeLegal(VT)) &&		return (VT == MVT::Other \|\| isTypeLegal(VT)) &&
(getOperationAction(Op, VT) == Legal \|\|		(getOperationAction(Op, VT) == Legal \|\|
getOperationAction(Op, VT) == Promote);		getOperationAction(Op, VT) == Promote);
}		}

/// Return true if the specified operation is legal on this target or can be		/// Return true if the specified operation is legal on this target or can be
/// made legal with custom lowering or using promotion. This is used to help		/// made legal with custom lowering or using promotion. This is used to help
/// guide high-level lowering decisions. LegalOnly is an optional convenience		/// guide high-level lowering decisions. LegalOnly is an optional convenience
/// for code paths traversed pre and post legalisation.		/// for code paths traversed pre and post legalisation.
bool isOperationLegalOrCustomOrPromote(unsigned Op, EVT VT,		bool isOperationLegalOrCustomOrPromote(unsigned Op, EVT VT,
bool LegalOnly = false) const {		bool LegalOnly = false) const {
if (LegalOnly)		if (LegalOnly)
return isOperationLegal(Op, VT);		return isOperationLegal(Op, VT);

return (VT == MVT::Other \|\| isTypeLegal(VT)) &&		return (VT == MVT::Other \|\| isTypeLegal(VT)) &&
(getOperationAction(Op, VT) == Legal \|\|		(getOperationAction(Op, VT) == Legal \|\|
getOperationAction(Op, VT) == Custom \|\|		getOperationAction(Op, VT) == Custom \|\|
getOperationAction(Op, VT) == Promote);		getOperationAction(Op, VT) == Promote);
}		}

/// Return true if the operation uses custom lowering, regardless of whether		/// Return true if the operation uses custom lowering, regardless of whether
/// the type is legal or not.		/// the type is legal or not.
bool isOperationCustom(unsigned Op, EVT VT) const {		bool isOperationCustom(unsigned Op, EVT VT) const {
return getOperationAction(Op, VT) == Custom;		return getOperationAction(Op, VT) == Custom;
}		}

▲ Show 20 Lines • Show All 61 Lines • ▼ Show 20 Lines	return (VT == MVT::Other \|\| isTypeLegal(VT)) &&
getOperationAction(Op, VT) == Legal;		getOperationAction(Op, VT) == Legal;
}		}

/// Return how this load with extension should be treated: either it is legal,		/// Return how this load with extension should be treated: either it is legal,
/// needs to be promoted to a larger size, needs to be expanded to some other		/// needs to be promoted to a larger size, needs to be expanded to some other
/// code sequence, or the target has a custom expander for it.		/// code sequence, or the target has a custom expander for it.
LegalizeAction getLoadExtAction(unsigned ExtType, EVT ValVT,		LegalizeAction getLoadExtAction(unsigned ExtType, EVT ValVT,
EVT MemVT) const {		EVT MemVT) const {
if (ValVT.isExtended() \|\| MemVT.isExtended()) return Expand;		if (ValVT.isExtended() \|\| MemVT.isExtended())
		return Expand;
unsigned ValI = (unsigned) ValVT.getSimpleVT().SimpleTy;		unsigned ValI = (unsigned)ValVT.getSimpleVT().SimpleTy;
unsigned MemI = (unsigned) MemVT.getSimpleVT().SimpleTy;		unsigned MemI = (unsigned)MemVT.getSimpleVT().SimpleTy;
assert(ExtType < ISD::LAST_LOADEXT_TYPE && ValI < MVT::LAST_VALUETYPE &&		assert(ExtType < ISD::LAST_LOADEXT_TYPE && ValI < MVT::LAST_VALUETYPE &&
MemI < MVT::LAST_VALUETYPE && "Table isn't big enough!");		MemI < MVT::LAST_VALUETYPE && "Table isn't big enough!");
unsigned Shift = 4 * ExtType;		unsigned Shift = 4 * ExtType;
return (LegalizeAction)((LoadExtActions[ValI][MemI] >> Shift) & 0xf);		return (LegalizeAction)((LoadExtActions[ValI][MemI] >> Shift) & 0xf);
}		}

/// Return true if the specified load with extension is legal on this target.		/// Return true if the specified load with extension is legal on this target.
bool isLoadExtLegal(unsigned ExtType, EVT ValVT, EVT MemVT) const {		bool isLoadExtLegal(unsigned ExtType, EVT ValVT, EVT MemVT) const {
return getLoadExtAction(ExtType, ValVT, MemVT) == Legal;		return getLoadExtAction(ExtType, ValVT, MemVT) == Legal;
}		}

/// Return true if the specified load with extension is legal or custom		/// Return true if the specified load with extension is legal or custom
/// on this target.		/// on this target.
bool isLoadExtLegalOrCustom(unsigned ExtType, EVT ValVT, EVT MemVT) const {		bool isLoadExtLegalOrCustom(unsigned ExtType, EVT ValVT, EVT MemVT) const {
return getLoadExtAction(ExtType, ValVT, MemVT) == Legal \|\|		return getLoadExtAction(ExtType, ValVT, MemVT) == Legal \|\|
getLoadExtAction(ExtType, ValVT, MemVT) == Custom;		getLoadExtAction(ExtType, ValVT, MemVT) == Custom;
}		}

/// Return how this store with truncation should be treated: either it is		/// Return how this store with truncation should be treated: either it is
/// legal, needs to be promoted to a larger size, needs to be expanded to some		/// legal, needs to be promoted to a larger size, needs to be expanded to some
/// other code sequence, or the target has a custom expander for it.		/// other code sequence, or the target has a custom expander for it.
LegalizeAction getTruncStoreAction(EVT ValVT, EVT MemVT) const {		LegalizeAction getTruncStoreAction(EVT ValVT, EVT MemVT) const {
if (ValVT.isExtended() \|\| MemVT.isExtended()) return Expand;		if (ValVT.isExtended() \|\| MemVT.isExtended())
		return Expand;
unsigned ValI = (unsigned) ValVT.getSimpleVT().SimpleTy;		unsigned ValI = (unsigned)ValVT.getSimpleVT().SimpleTy;
unsigned MemI = (unsigned) MemVT.getSimpleVT().SimpleTy;		unsigned MemI = (unsigned)MemVT.getSimpleVT().SimpleTy;
assert(ValI < MVT::LAST_VALUETYPE && MemI < MVT::LAST_VALUETYPE &&		assert(ValI < MVT::LAST_VALUETYPE && MemI < MVT::LAST_VALUETYPE &&
"Table isn't big enough!");		"Table isn't big enough!");
return TruncStoreActions[ValI][MemI];		return TruncStoreActions[ValI][MemI];
}		}

/// Return true if the specified store with truncation is legal on this		/// Return true if the specified store with truncation is legal on this
/// target.		/// target.
bool isTruncStoreLegal(EVT ValVT, EVT MemVT) const {		bool isTruncStoreLegal(EVT ValVT, EVT MemVT) const {
return isTypeLegal(ValVT) && getTruncStoreAction(ValVT, MemVT) == Legal;		return isTypeLegal(ValVT) && getTruncStoreAction(ValVT, MemVT) == Legal;
}		}

/// Return true if the specified store with truncation has solution on this		/// Return true if the specified store with truncation has solution on this
/// target.		/// target.
bool isTruncStoreLegalOrCustom(EVT ValVT, EVT MemVT) const {		bool isTruncStoreLegalOrCustom(EVT ValVT, EVT MemVT) const {
return isTypeLegal(ValVT) &&		return isTypeLegal(ValVT) && (getTruncStoreAction(ValVT, MemVT) == Legal \|\|
(getTruncStoreAction(ValVT, MemVT) == Legal \|\|
getTruncStoreAction(ValVT, MemVT) == Custom);		getTruncStoreAction(ValVT, MemVT) == Custom);
}		}

/// Return how the indexed load should be treated: either it is legal, needs		/// Return how the indexed load should be treated: either it is legal, needs
/// to be promoted to a larger size, needs to be expanded to some other code		/// to be promoted to a larger size, needs to be expanded to some other code
/// sequence, or the target has a custom expander for it.		/// sequence, or the target has a custom expander for it.
LegalizeAction getIndexedLoadAction(unsigned IdxMode, MVT VT) const {		LegalizeAction getIndexedLoadAction(unsigned IdxMode, MVT VT) const {
return getIndexedModeAction(IdxMode, VT, IMAB_Load);		return getIndexedModeAction(IdxMode, VT, IMAB_Load);
}		}

/// Return true if the specified indexed load is legal on this target.		/// Return true if the specified indexed load is legal on this target.
bool isIndexedLoadLegal(unsigned IdxMode, EVT VT) const {		bool isIndexedLoadLegal(unsigned IdxMode, EVT VT) const {
return VT.isSimple() &&		return VT.isSimple() &&
(getIndexedLoadAction(IdxMode, VT.getSimpleVT()) == Legal \|\|		(getIndexedLoadAction(IdxMode, VT.getSimpleVT()) == Legal \|\|
getIndexedLoadAction(IdxMode, VT.getSimpleVT()) == Custom);		getIndexedLoadAction(IdxMode, VT.getSimpleVT()) == Custom);
}		}

/// Return how the indexed store should be treated: either it is legal, needs		/// Return how the indexed store should be treated: either it is legal, needs
/// to be promoted to a larger size, needs to be expanded to some other code		/// to be promoted to a larger size, needs to be expanded to some other code
/// sequence, or the target has a custom expander for it.		/// sequence, or the target has a custom expander for it.
LegalizeAction getIndexedStoreAction(unsigned IdxMode, MVT VT) const {		LegalizeAction getIndexedStoreAction(unsigned IdxMode, MVT VT) const {
return getIndexedModeAction(IdxMode, VT, IMAB_Store);		return getIndexedModeAction(IdxMode, VT, IMAB_Store);
}		}

/// Return true if the specified indexed load is legal on this target.		/// Return true if the specified indexed load is legal on this target.
bool isIndexedStoreLegal(unsigned IdxMode, EVT VT) const {		bool isIndexedStoreLegal(unsigned IdxMode, EVT VT) const {
return VT.isSimple() &&		return VT.isSimple() &&
(getIndexedStoreAction(IdxMode, VT.getSimpleVT()) == Legal \|\|		(getIndexedStoreAction(IdxMode, VT.getSimpleVT()) == Legal \|\|
getIndexedStoreAction(IdxMode, VT.getSimpleVT()) == Custom);		getIndexedStoreAction(IdxMode, VT.getSimpleVT()) == Custom);
}		}

/// Return how the indexed load should be treated: either it is legal, needs		/// Return how the indexed load should be treated: either it is legal, needs
/// to be promoted to a larger size, needs to be expanded to some other code		/// to be promoted to a larger size, needs to be expanded to some other code
/// sequence, or the target has a custom expander for it.		/// sequence, or the target has a custom expander for it.
LegalizeAction getIndexedMaskedLoadAction(unsigned IdxMode, MVT VT) const {		LegalizeAction getIndexedMaskedLoadAction(unsigned IdxMode, MVT VT) const {
return getIndexedModeAction(IdxMode, VT, IMAB_MaskedLoad);		return getIndexedModeAction(IdxMode, VT, IMAB_MaskedLoad);
}		}
Show All 17 Lines	bool isIndexedMaskedStoreLegal(unsigned IdxMode, EVT VT) const {
return VT.isSimple() &&		return VT.isSimple() &&
(getIndexedMaskedStoreAction(IdxMode, VT.getSimpleVT()) == Legal \|\|		(getIndexedMaskedStoreAction(IdxMode, VT.getSimpleVT()) == Legal \|\|
getIndexedMaskedStoreAction(IdxMode, VT.getSimpleVT()) == Custom);		getIndexedMaskedStoreAction(IdxMode, VT.getSimpleVT()) == Custom);
}		}

/// Return how the condition code should be treated: either it is legal, needs		/// Return how the condition code should be treated: either it is legal, needs
/// to be expanded to some other code sequence, or the target has a custom		/// to be expanded to some other code sequence, or the target has a custom
/// expander for it.		/// expander for it.
LegalizeAction		LegalizeAction getCondCodeAction(ISD::CondCode CC, MVT VT) const {
getCondCodeAction(ISD::CondCode CC, MVT VT) const {
assert((unsigned)CC < array_lengthof(CondCodeActions) &&		assert((unsigned)CC < array_lengthof(CondCodeActions) &&
((unsigned)VT.SimpleTy >> 3) < array_lengthof(CondCodeActions[0]) &&		((unsigned)VT.SimpleTy >> 3) < array_lengthof(CondCodeActions[0]) &&
"Table isn't big enough!");		"Table isn't big enough!");
// See setCondCodeAction for how this is encoded.		// See setCondCodeAction for how this is encoded.
uint32_t Shift = 4 * (VT.SimpleTy & 0x7);		uint32_t Shift = 4 * (VT.SimpleTy & 0x7);
uint32_t Value = CondCodeActions[CC][VT.SimpleTy >> 3];		uint32_t Value = CondCodeActions[CC][VT.SimpleTy >> 3];
LegalizeAction Action = (LegalizeAction) ((Value >> Shift) & 0xF);		LegalizeAction Action = (LegalizeAction)((Value >> Shift) & 0xF);
assert(Action != Promote && "Can't promote condition code!");		assert(Action != Promote && "Can't promote condition code!");
return Action;		return Action;
}		}

/// Return true if the specified condition code is legal on this target.		/// Return true if the specified condition code is legal on this target.
bool isCondCodeLegal(ISD::CondCode CC, MVT VT) const {		bool isCondCodeLegal(ISD::CondCode CC, MVT VT) const {
return getCondCodeAction(CC, VT) == Legal;		return getCondCodeAction(CC, VT) == Legal;
}		}
Show All 9 Lines	#include "llvm/IR/ConstrainedOps.def"
/// ValueType to promote to.		/// ValueType to promote to.
MVT getTypeToPromoteTo(unsigned Op, MVT VT) const {		MVT getTypeToPromoteTo(unsigned Op, MVT VT) const {
assert(getOperationAction(Op, VT) == Promote &&		assert(getOperationAction(Op, VT) == Promote &&
"This operation isn't promoted!");		"This operation isn't promoted!");

// See if this has an explicit type specified.		// See if this has an explicit type specified.
std::map<std::pair<unsigned, MVT::SimpleValueType>,		std::map<std::pair<unsigned, MVT::SimpleValueType>,
MVT::SimpleValueType>::const_iterator PTTI =		MVT::SimpleValueType>::const_iterator PTTI =
PromoteToType.find(std::make_pair(Op, VT.SimpleTy));		PromoteToType.find(std::make_pair(Op, VT.SimpleTy));
if (PTTI != PromoteToType.end()) return PTTI->second;		if (PTTI != PromoteToType.end())
		return PTTI->second;

assert((VT.isInteger() \|\| VT.isFloatingPoint()) &&		assert((VT.isInteger() \|\| VT.isFloatingPoint()) &&
"Cannot autopromote this type, add it with AddPromotedToType.");		"Cannot autopromote this type, add it with AddPromotedToType.");

MVT NVT = VT;		MVT NVT = VT;
do {		do {
NVT = (MVT::SimpleValueType)(NVT.SimpleTy+1);		NVT = (MVT::SimpleValueType)(NVT.SimpleTy + 1);
assert(NVT.isInteger() == VT.isInteger() && NVT != MVT::isVoid &&		assert(NVT.isInteger() == VT.isInteger() && NVT != MVT::isVoid &&
"Didn't find type to promote to!");		"Didn't find type to promote to!");
} while (!isTypeLegal(NVT) \|\|		} while (!isTypeLegal(NVT) \|\| getOperationAction(Op, NVT) == Promote);
getOperationAction(Op, NVT) == Promote);
return NVT;		return NVT;
}		}

/// Return the EVT corresponding to this LLVM type. This is fixed by the LLVM		/// Return the EVT corresponding to this LLVM type. This is fixed by the LLVM
/// operations except for the pointer size. If AllowUnknown is true, this		/// operations except for the pointer size. If AllowUnknown is true, this
/// will return MVT::Other for types with no EVT counterpart (e.g. structs),		/// will return MVT::Other for types with no EVT counterpart (e.g. structs),
/// otherwise it will assert.		/// otherwise it will assert.
EVT getValueType(const DataLayout &DL, Type *Ty,		EVT getValueType(const DataLayout &DL, Type *Ty,
Show All 29 Lines	else if (VectorType *VTy = dyn_cast<VectorType>(Ty)) {
}		}
return EVT::getVectorVT(Ty->getContext(), EVT::getEVT(Elm, false),		return EVT::getVectorVT(Ty->getContext(), EVT::getEVT(Elm, false),
VTy->getElementCount());		VTy->getElementCount());
}		}

return getValueType(DL, Ty, AllowUnknown);		return getValueType(DL, Ty, AllowUnknown);
}		}


/// Return the MVT corresponding to this LLVM type. See getValueType.		/// Return the MVT corresponding to this LLVM type. See getValueType.
MVT getSimpleValueType(const DataLayout &DL, Type *Ty,		MVT getSimpleValueType(const DataLayout &DL, Type *Ty,
bool AllowUnknown = false) const {		bool AllowUnknown = false) const {
return getValueType(DL, Ty, AllowUnknown).getSimpleVT();		return getValueType(DL, Ty, AllowUnknown).getSimpleVT();
}		}

/// Return the desired alignment for ByVal or InAlloca aggregate function		/// Return the desired alignment for ByVal or InAlloca aggregate function
/// arguments in the caller parameter area. This is the actual alignment, not		/// arguments in the caller parameter area. This is the actual alignment, not
/// its logarithm.		/// its logarithm.
virtual unsigned getByValTypeAlignment(Type *Ty, const DataLayout &DL) const;		virtual unsigned getByValTypeAlignment(Type *Ty, const DataLayout &DL) const;

/// Return the type of registers that this ValueType will eventually require.		/// Return the type of registers that this ValueType will eventually require.
MVT getRegisterType(MVT VT) const {		MVT getRegisterType(MVT VT) const {
assert((unsigned)VT.SimpleTy < array_lengthof(RegisterTypeForVT));		assert((unsigned)VT.SimpleTy < array_lengthof(RegisterTypeForVT));
return RegisterTypeForVT[VT.SimpleTy];		return RegisterTypeForVT[VT.SimpleTy];
}		}

/// Return the type of registers that this ValueType will eventually require.		/// Return the type of registers that this ValueType will eventually require.
MVT getRegisterType(LLVMContext &Context, EVT VT) const {		MVT getRegisterType(LLVMContext &Context, EVT VT) const {
if (VT.isSimple()) {		if (VT.isSimple()) {
assert((unsigned)VT.getSimpleVT().SimpleTy <		assert((unsigned)VT.getSimpleVT().SimpleTy <
array_lengthof(RegisterTypeForVT));		array_lengthof(RegisterTypeForVT));
return RegisterTypeForVT[VT.getSimpleVT().SimpleTy];		return RegisterTypeForVT[VT.getSimpleVT().SimpleTy];
}		}
if (VT.isVector()) {		if (VT.isVector()) {
EVT VT1;		EVT VT1;
MVT RegisterVT;		MVT RegisterVT;
unsigned NumIntermediates;		unsigned NumIntermediates;
(void)getVectorTypeBreakdown(Context, VT, VT1,		(void)getVectorTypeBreakdown(Context, VT, VT1, NumIntermediates,
NumIntermediates, RegisterVT);		RegisterVT);
return RegisterVT;		return RegisterVT;
}		}
if (VT.isInteger()) {		if (VT.isInteger()) {
return getRegisterType(Context, getTypeToTransformTo(Context, VT));		return getRegisterType(Context, getTypeToTransformTo(Context, VT));
}		}
llvm_unreachable("Unsupported extended type!");		llvm_unreachable("Unsupported extended type!");
}		}

/// Return the number of registers that this ValueType will eventually		/// Return the number of registers that this ValueType will eventually
/// require.		/// require.
///		///
/// This is one for any types promoted to live in larger registers, but may be		/// This is one for any types promoted to live in larger registers, but may be
/// more than one for types (like i64) that are split into pieces. For types		/// more than one for types (like i64) that are split into pieces. For types
/// like i140, which are first promoted then expanded, it is the number of		/// like i140, which are first promoted then expanded, it is the number of
/// registers needed to hold all the bits of the original type. For an i140		/// registers needed to hold all the bits of the original type. For an i140
/// on a 32 bit machine this means 5 registers.		/// on a 32 bit machine this means 5 registers.
unsigned getNumRegisters(LLVMContext &Context, EVT VT) const {		unsigned getNumRegisters(LLVMContext &Context, EVT VT) const {
if (VT.isSimple()) {		if (VT.isSimple()) {
assert((unsigned)VT.getSimpleVT().SimpleTy <		assert((unsigned)VT.getSimpleVT().SimpleTy <
array_lengthof(NumRegistersForVT));		array_lengthof(NumRegistersForVT));
return NumRegistersForVT[VT.getSimpleVT().SimpleTy];		return NumRegistersForVT[VT.getSimpleVT().SimpleTy];
}		}
if (VT.isVector()) {		if (VT.isVector()) {
EVT VT1;		EVT VT1;
MVT VT2;		MVT VT2;
unsigned NumIntermediates;		unsigned NumIntermediates;
return getVectorTypeBreakdown(Context, VT, VT1, NumIntermediates, VT2);		return getVectorTypeBreakdown(Context, VT, VT1, NumIntermediates, VT2);
}		}
▲ Show 20 Lines • Show All 52 Lines • ▼ Show 20 Lines	#include "llvm/IR/ConstrainedOps.def"
bool hasBigEndianPartOrdering(EVT VT, const DataLayout &DL) const {		bool hasBigEndianPartOrdering(EVT VT, const DataLayout &DL) const {
return DL.isBigEndian() \|\| VT == MVT::ppcf128;		return DL.isBigEndian() \|\| VT == MVT::ppcf128;
}		}

/// If true, the target has custom DAG combine transformations that it can		/// If true, the target has custom DAG combine transformations that it can
/// perform for the specified node.		/// perform for the specified node.
bool hasTargetDAGCombine(ISD::NodeType NT) const {		bool hasTargetDAGCombine(ISD::NodeType NT) const {
assert(unsigned(NT >> 3) < array_lengthof(TargetDAGCombineArray));		assert(unsigned(NT >> 3) < array_lengthof(TargetDAGCombineArray));
return TargetDAGCombineArray[NT >> 3] & (1 << (NT&7));		return TargetDAGCombineArray[NT >> 3] & (1 << (NT & 7));
}		}

unsigned getGatherAllAliasesMaxDepth() const {		unsigned getGatherAllAliasesMaxDepth() const {
return GatherAllAliasesMaxDepth;		return GatherAllAliasesMaxDepth;
}		}

/// Returns the size of the platform's va_list object.		/// Returns the size of the platform's va_list object.
virtual unsigned getVaListSizeInBits(const DataLayout &DL) const {		virtual unsigned getVaListSizeInBits(const DataLayout &DL) const {
▲ Show 20 Lines • Show All 189 Lines • ▼ Show 20 Lines	#include "llvm/IR/ConstrainedOps.def"

/// Return the preferred loop alignment.		/// Return the preferred loop alignment.
virtual Align getPrefLoopAlignment(MachineLoop *ML = nullptr) const {		virtual Align getPrefLoopAlignment(MachineLoop *ML = nullptr) const {
return PrefLoopAlignment;		return PrefLoopAlignment;
}		}

/// Should loops be aligned even when the function is marked OptSize (but not		/// Should loops be aligned even when the function is marked OptSize (but not
/// MinSize).		/// MinSize).
virtual bool alignLoopsWithOptSize() const {		virtual bool alignLoopsWithOptSize() const { return false; }
return false;
}

/// If the target has a standard location for the stack protector guard,		/// If the target has a standard location for the stack protector guard,
/// returns the address of that location. Otherwise, returns nullptr.		/// returns the address of that location. Otherwise, returns nullptr.
/// DEPRECATED: please override useLoadStackGuardNode and customize		/// DEPRECATED: please override useLoadStackGuardNode and customize
/// LOAD_STACK_GUARD, or customize \@llvm.stackguard().		/// LOAD_STACK_GUARD, or customize \@llvm.stackguard().
virtual Value *getIRStackGuard(IRBuilder<> &IRB) const;		virtual Value *getIRStackGuard(IRBuilder<> &IRB) const;

/// Inserts necessary declarations for SSP (stack protection) purpose.		/// Inserts necessary declarations for SSP (stack protection) purpose.
▲ Show 20 Lines • Show All 195 Lines • ▼ Show 20 Lines	public:
}		}

/// Returns true if arguments should be sign-extended in lib calls.		/// Returns true if arguments should be sign-extended in lib calls.
virtual bool shouldSignExtendTypeInLibCall(EVT Type, bool IsSigned) const {		virtual bool shouldSignExtendTypeInLibCall(EVT Type, bool IsSigned) const {
return IsSigned;		return IsSigned;
}		}

/// Returns true if arguments should be extended in lib calls.		/// Returns true if arguments should be extended in lib calls.
virtual bool shouldExtendTypeInLibCall(EVT Type) const {		virtual bool shouldExtendTypeInLibCall(EVT Type) const { return true; }
return true;
}

/// Returns how the given (atomic) load should be expanded by the		/// Returns how the given (atomic) load should be expanded by the
/// IR-level AtomicExpand pass.		/// IR-level AtomicExpand pass.
virtual AtomicExpansionKind shouldExpandAtomicLoadInIR(LoadInst *LI) const {		virtual AtomicExpansionKind shouldExpandAtomicLoadInIR(LoadInst *LI) const {
return AtomicExpansionKind::None;		return AtomicExpansionKind::None;
}		}

/// Returns how the given atomic cmpxchg should be expanded by the IR-level		/// Returns how the given atomic cmpxchg should be expanded by the IR-level
/// AtomicExpand pass.		/// AtomicExpand pass.
virtual AtomicExpansionKind		virtual AtomicExpansionKind
shouldExpandAtomicCmpXchgInIR(AtomicCmpXchgInst *AI) const {		shouldExpandAtomicCmpXchgInIR(AtomicCmpXchgInst *AI) const {
return AtomicExpansionKind::None;		return AtomicExpansionKind::None;
}		}

/// Returns how the IR-level AtomicExpand pass should expand the given		/// Returns how the IR-level AtomicExpand pass should expand the given
/// AtomicRMW, if at all. Default is to never expand.		/// AtomicRMW, if at all. Default is to never expand.
virtual AtomicExpansionKind shouldExpandAtomicRMWInIR(AtomicRMWInst *RMW) const {		virtual AtomicExpansionKind
return RMW->isFloatingPointOperation() ?		shouldExpandAtomicRMWInIR(AtomicRMWInst *RMW) const {
AtomicExpansionKind::CmpXChg : AtomicExpansionKind::None;		return RMW->isFloatingPointOperation() ? AtomicExpansionKind::CmpXChg
		: AtomicExpansionKind::None;
}		}

/// On some platforms, an AtomicRMW that never actually modifies the value		/// On some platforms, an AtomicRMW that never actually modifies the value
/// (such as fetch_add of 0) can be turned into a fence followed by an		/// (such as fetch_add of 0) can be turned into a fence followed by an
/// atomic load. This may sound useless, but it makes it possible for the		/// atomic load. This may sound useless, but it makes it possible for the
/// processor to keep the cacheline shared, dramatically improving		/// processor to keep the cacheline shared, dramatically improving
/// performance. And such idempotent RMWs are useful for implementing some		/// performance. And such idempotent RMWs are useful for implementing some
/// kinds of locks, see for example (justification + benchmarks):		/// kinds of locks, see for example (justification + benchmarks):
Show All 37 Lines	virtual bool shouldNormalizeToSelectSequence(LLVMContext &Context,
// If a target has multiple condition registers, then it likely has logical		// If a target has multiple condition registers, then it likely has logical
// operations on those registers.		// operations on those registers.
if (hasMultipleConditionRegisters())		if (hasMultipleConditionRegisters())
return false;		return false;
// Only do the transform if the value won't be split into multiple		// Only do the transform if the value won't be split into multiple
// registers.		// registers.
LegalizeTypeAction Action = getTypeAction(Context, VT);		LegalizeTypeAction Action = getTypeAction(Context, VT);
return Action != TypeExpandInteger && Action != TypeExpandFloat &&		return Action != TypeExpandInteger && Action != TypeExpandFloat &&
Action != TypeSplitVector;		Action != TypeSplitVector;
}		}

virtual bool isProfitableToCombineMinNumMaxNum(EVT VT) const { return true; }		virtual bool isProfitableToCombineMinNumMaxNum(EVT VT) const { return true; }

/// Return true if a select of constants (select Cond, C1, C2) should be		/// Return true if a select of constants (select Cond, C1, C2) should be
/// transformed into simple math ops with the condition value. For example:		/// transformed into simple math ops with the condition value. For example:
/// select Cond, C1, C1-1 --> add (zext Cond), C1-1		/// select Cond, C1, C1-1 --> add (zext Cond), C1-1
virtual bool convertSelectOfConstantsToMath(EVT VT) const {		virtual bool convertSelectOfConstantsToMath(EVT VT) const { return false; }
return false;
}

/// Return true if it is profitable to transform an integer		/// Return true if it is profitable to transform an integer
/// multiplication-by-constant into simpler operations like shifts and adds.		/// multiplication-by-constant into simpler operations like shifts and adds.
/// This may be true if the target does not directly support the		/// This may be true if the target does not directly support the
/// multiplication operation for the specified type or the sequence of simpler		/// multiplication operation for the specified type or the sequence of simpler
/// ops is faster than the multiply.		/// ops is faster than the multiply.
virtual bool decomposeMulByConstant(LLVMContext &Context,		virtual bool decomposeMulByConstant(LLVMContext &Context, EVT VT,
EVT VT, SDValue C) const {		SDValue C) const {
return false;		return false;
}		}

/// Return true if it is more correct/profitable to use strict FP_TO_INT		/// Return true if it is more correct/profitable to use strict FP_TO_INT
/// conversion operations - canonicalizing the FP source value instead of		/// conversion operations - canonicalizing the FP source value instead of
/// converting all cases and then selecting based on value.		/// converting all cases and then selecting based on value.
/// This may be true if the target throws exceptions for out of bounds		/// This may be true if the target throws exceptions for out of bounds
/// conversions or has fast FP CMOV.		/// conversions or has fast FP CMOV.
▲ Show 20 Lines • Show All 87 Lines • ▼ Show 20 Lines	protected:

/// Once all of the register classes are added, this allows us to compute		/// Once all of the register classes are added, this allows us to compute
/// derived properties we expose.		/// derived properties we expose.
void computeRegisterProperties(const TargetRegisterInfo *TRI);		void computeRegisterProperties(const TargetRegisterInfo *TRI);

/// Indicate that the specified operation does not work with the specified		/// Indicate that the specified operation does not work with the specified
/// type and indicate what to do about it. Note that VT may refer to either		/// type and indicate what to do about it. Note that VT may refer to either
/// the type of a result or that of an operand of Op.		/// the type of a result or that of an operand of Op.
void setOperationAction(unsigned Op, MVT VT,		void setOperationAction(unsigned Op, MVT VT, LegalizeAction Action) {
LegalizeAction Action) {
assert(Op < array_lengthof(OpActions[0]) && "Table isn't big enough!");		assert(Op < array_lengthof(OpActions[0]) && "Table isn't big enough!");
OpActions[(unsigned)VT.SimpleTy][Op] = Action;		OpActions[(unsigned)VT.SimpleTy][Op] = Action;
}		}

/// Indicate that the specified load with extension does not work with the		/// Indicate that the specified load with extension does not work with the
/// specified type and indicate what to do about it.		/// specified type and indicate what to do about it.
void setLoadExtAction(unsigned ExtType, MVT ValVT, MVT MemVT,		void setLoadExtAction(unsigned ExtType, MVT ValVT, MVT MemVT,
LegalizeAction Action) {		LegalizeAction Action) {
assert(ExtType < ISD::LAST_LOADEXT_TYPE && ValVT.isValid() &&		assert(ExtType < ISD::LAST_LOADEXT_TYPE && ValVT.isValid() &&
MemVT.isValid() && "Table isn't big enough!");		MemVT.isValid() && "Table isn't big enough!");
assert((unsigned)Action < 0x10 && "too many bits for bitfield array");		assert((unsigned)Action < 0x10 && "too many bits for bitfield array");
unsigned Shift = 4 * ExtType;		unsigned Shift = 4 * ExtType;
LoadExtActions[ValVT.SimpleTy][MemVT.SimpleTy] &= ~((uint16_t)0xF << Shift);		LoadExtActions[ValVT.SimpleTy][MemVT.SimpleTy] &= ~((uint16_t)0xF << Shift);
LoadExtActions[ValVT.SimpleTy][MemVT.SimpleTy] \|= (uint16_t)Action << Shift;		LoadExtActions[ValVT.SimpleTy][MemVT.SimpleTy] \|= (uint16_t)Action << Shift;
}		}

/// Indicate that the specified truncating store does not work with the		/// Indicate that the specified truncating store does not work with the
/// specified type and indicate what to do about it.		/// specified type and indicate what to do about it.
void setTruncStoreAction(MVT ValVT, MVT MemVT,		void setTruncStoreAction(MVT ValVT, MVT MemVT, LegalizeAction Action) {
LegalizeAction Action) {
assert(ValVT.isValid() && MemVT.isValid() && "Table isn't big enough!");		assert(ValVT.isValid() && MemVT.isValid() && "Table isn't big enough!");
TruncStoreActions[(unsigned)ValVT.SimpleTy][MemVT.SimpleTy] = Action;		TruncStoreActions[(unsigned)ValVT.SimpleTy][MemVT.SimpleTy] = Action;
}		}

/// Indicate that the specified indexed load does or does not work with the		/// Indicate that the specified indexed load does or does not work with the
/// specified type and indicate what to do abort it.		/// specified type and indicate what to do abort it.
///		///
/// NOTE: All indexed mode loads are initialized to Expand in		/// NOTE: All indexed mode loads are initialized to Expand in
Show All 28 Lines	protected:
/// TargetLowering.cpp		/// TargetLowering.cpp
void setIndexedMaskedStoreAction(unsigned IdxMode, MVT VT,		void setIndexedMaskedStoreAction(unsigned IdxMode, MVT VT,
LegalizeAction Action) {		LegalizeAction Action) {
setIndexedModeAction(IdxMode, VT, IMAB_MaskedStore, Action);		setIndexedModeAction(IdxMode, VT, IMAB_MaskedStore, Action);
}		}

/// Indicate that the specified condition code is or isn't supported on the		/// Indicate that the specified condition code is or isn't supported on the
/// target and indicate what to do about it.		/// target and indicate what to do about it.
void setCondCodeAction(ISD::CondCode CC, MVT VT,		void setCondCodeAction(ISD::CondCode CC, MVT VT, LegalizeAction Action) {
LegalizeAction Action) {
assert(VT.isValid() && (unsigned)CC < array_lengthof(CondCodeActions) &&		assert(VT.isValid() && (unsigned)CC < array_lengthof(CondCodeActions) &&
"Table isn't big enough!");		"Table isn't big enough!");
assert((unsigned)Action < 0x10 && "too many bits for bitfield array");		assert((unsigned)Action < 0x10 && "too many bits for bitfield array");
/// The lower 3 bits of the SimpleTy index into Nth 4bit set from the 32-bit		/// The lower 3 bits of the SimpleTy index into Nth 4bit set from the 32-bit
/// value and the upper 29 bits index into the second dimension of the array		/// value and the upper 29 bits index into the second dimension of the array
/// to select what 32-bit value to use.		/// to select what 32-bit value to use.
uint32_t Shift = 4 * (VT.SimpleTy & 0x7);		uint32_t Shift = 4 * (VT.SimpleTy & 0x7);
CondCodeActions[CC][VT.SimpleTy >> 3] &= ~((uint32_t)0xF << Shift);		CondCodeActions[CC][VT.SimpleTy >> 3] &= ~((uint32_t)0xF << Shift);
Show All 15 Lines	void setOperationPromotedToType(unsigned Opc, MVT OrigVT, MVT DestVT) {
AddPromotedToType(Opc, OrigVT, DestVT);		AddPromotedToType(Opc, OrigVT, DestVT);
}		}

/// Targets should invoke this method for each target independent node that		/// Targets should invoke this method for each target independent node that
/// they want to provide a custom DAG combiner for by implementing the		/// they want to provide a custom DAG combiner for by implementing the
/// PerformDAGCombine virtual method.		/// PerformDAGCombine virtual method.
void setTargetDAGCombine(ISD::NodeType NT) {		void setTargetDAGCombine(ISD::NodeType NT) {
assert(unsigned(NT >> 3) < array_lengthof(TargetDAGCombineArray));		assert(unsigned(NT >> 3) < array_lengthof(TargetDAGCombineArray));
TargetDAGCombineArray[NT >> 3] \|= 1 << (NT&7);		TargetDAGCombineArray[NT >> 3] \|= 1 << (NT & 7);
}		}

/// Set the target's minimum function alignment.		/// Set the target's minimum function alignment.
void setMinFunctionAlignment(Align Alignment) {		void setMinFunctionAlignment(Align Alignment) {
MinFunctionAlignment = Alignment;		MinFunctionAlignment = Alignment;
}		}

/// Set the target's preferred function alignment. This should be set if		/// Set the target's preferred function alignment. This should be set if
Show All 36 Lines	public:
//		//

/// CodeGenPrepare sinks address calculations into the same BB as Load/Store		/// CodeGenPrepare sinks address calculations into the same BB as Load/Store
/// instructions reading the address. This allows as much computation as		/// instructions reading the address. This allows as much computation as
/// possible to be done in the address mode for that operand. This hook lets		/// possible to be done in the address mode for that operand. This hook lets
/// targets also pass back when this should be done on intrinsics which		/// targets also pass back when this should be done on intrinsics which
/// load/store.		/// load/store.
virtual bool getAddrModeArguments(IntrinsicInst * /I/,		virtual bool getAddrModeArguments(IntrinsicInst * /I/,
SmallVectorImpl<Value> &/Ops*/,		SmallVectorImpl<Value > & /Ops*/,
Type &/AccessTy*/) const {		Type & /AccessTy*/) const {
return false;		return false;
}		}

/// This represents an addressing mode of:		/// This represents an addressing mode of:
/// BaseGV + BaseOffs + BaseReg + Scale*ScaleReg		/// BaseGV + BaseOffs + BaseReg + Scale*ScaleReg
/// If BaseGV is null, there is no BaseGV.		/// If BaseGV is null, there is no BaseGV.
/// If BaseOffs is zero, there is no base offset.		/// If BaseOffs is zero, there is no base offset.
/// If HasBaseReg is false, there is no base register.		/// If HasBaseReg is false, there is no base register.
/// If Scale is zero, there is no ScaleReg. Scale of 1 indicates a reg with		/// If Scale is zero, there is no ScaleReg. Scale of 1 indicates a reg with
/// no scale.		/// no scale.
struct AddrMode {		struct AddrMode {
GlobalValue *BaseGV = nullptr;		GlobalValue *BaseGV = nullptr;
int64_t BaseOffs = 0;		int64_t BaseOffs = 0;
bool HasBaseReg = false;		bool HasBaseReg = false;
int64_t Scale = 0;		int64_t Scale = 0;
AddrMode() = default;		AddrMode() = default;
};		};

/// Return true if the addressing mode represented by AM is legal for this		/// Return true if the addressing mode represented by AM is legal for this
/// target, for a load/store of the specified type.		/// target, for a load/store of the specified type.
///		///
/// The type may be VoidTy, in which case only return true if the addressing		/// The type may be VoidTy, in which case only return true if the addressing
/// mode is legal for a load/store of any legal type. TODO: Handle		/// mode is legal for a load/store of any legal type. TODO: Handle
Show All 19 Lines	virtual int getScalingFactorCost(const DataLayout &DL, const AddrMode &AM,
if (isLegalAddressingMode(DL, AM, Ty, AS))		if (isLegalAddressingMode(DL, AM, Ty, AS))
return 0;		return 0;
return -1;		return -1;
}		}

/// Return true if the specified immediate is legal icmp immediate, that is		/// Return true if the specified immediate is legal icmp immediate, that is
/// the target has icmp instructions which can compare a register against the		/// the target has icmp instructions which can compare a register against the
/// immediate without having to materialize the immediate into a register.		/// immediate without having to materialize the immediate into a register.
virtual bool isLegalICmpImmediate(int64_t) const {		virtual bool isLegalICmpImmediate(int64_t) const { return true; }
return true;
}

/// Return true if the specified immediate is legal add immediate, that is the		/// Return true if the specified immediate is legal add immediate, that is the
/// target has add instructions which can add a register with the immediate		/// target has add instructions which can add a register with the immediate
/// without having to materialize the immediate into a register.		/// without having to materialize the immediate into a register.
virtual bool isLegalAddImmediate(int64_t) const {		virtual bool isLegalAddImmediate(int64_t) const { return true; }
return true;
}

/// Return true if the specified immediate is legal for the value input of a		/// Return true if the specified immediate is legal for the value input of a
/// store instruction.		/// store instruction.
virtual bool isLegalStoreImmediate(int64_t Value) const {		virtual bool isLegalStoreImmediate(int64_t Value) const {
// Default implementation assumes that at least 0 works since it is likely		// Default implementation assumes that at least 0 works since it is likely
// that a zero register exists or a zero immediate is allowed.		// that a zero register exists or a zero immediate is allowed.
return Value == 0;		return Value == 0;
}		}

/// Return true if it's significantly cheaper to shift a vector by a uniform		/// Return true if it's significantly cheaper to shift a vector by a uniform
/// scalar than by an amount which will vary across each lane. On x86 before		/// scalar than by an amount which will vary across each lane. On x86 before
/// AVX2 for example, there is a "psllw" instruction for the former case, but		/// AVX2 for example, there is a "psllw" instruction for the former case, but
/// no simple instruction for a general "a << b" operation on vectors.		/// no simple instruction for a general "a << b" operation on vectors.
/// This should also apply to lowering for vector funnel shifts (rotates).		/// This should also apply to lowering for vector funnel shifts (rotates).
virtual bool isVectorShiftByScalarCheap(Type *Ty) const {		virtual bool isVectorShiftByScalarCheap(Type *Ty) const { return false; }
return false;
}

/// Given a shuffle vector SVI representing a vector splat, return a new		/// Given a shuffle vector SVI representing a vector splat, return a new
/// scalar type of size equal to SVI's scalar type if the new type is more		/// scalar type of size equal to SVI's scalar type if the new type is more
/// profitable. Returns nullptr otherwise. For example under MVE float splats		/// profitable. Returns nullptr otherwise. For example under MVE float splats
/// are converted to integer to prevent the need to move from SPR to GPR		/// are converted to integer to prevent the need to move from SPR to GPR
/// registers.		/// registers.
virtual Type* shouldConvertSplatType(ShuffleVectorInst* SVI) const {		virtual Type shouldConvertSplatType(ShuffleVectorInst SVI) const {
return nullptr;		return nullptr;
}		}

/// Given a set in interconnected phis of type 'From' that are loaded/stored		/// Given a set in interconnected phis of type 'From' that are loaded/stored
/// or bitcast to type 'To', return true if the set should be converted to		/// or bitcast to type 'To', return true if the set should be converted to
/// 'To'.		/// 'To'.
virtual bool shouldConvertPhiType(Type From, Type To) const {		virtual bool shouldConvertPhiType(Type From, Type To) const {
return (From->isIntegerTy() \|\| From->isFloatingPointTy()) &&		return (From->isIntegerTy() \|\| From->isFloatingPointTy()) &&
Show All 27 Lines	virtual bool isCommutativeBinOp(unsigned Opcode) const {
case ISD::UADDSAT:		case ISD::UADDSAT:
case ISD::FMINNUM:		case ISD::FMINNUM:
case ISD::FMAXNUM:		case ISD::FMAXNUM:
case ISD::FMINNUM_IEEE:		case ISD::FMINNUM_IEEE:
case ISD::FMAXNUM_IEEE:		case ISD::FMAXNUM_IEEE:
case ISD::FMINIMUM:		case ISD::FMINIMUM:
case ISD::FMAXIMUM:		case ISD::FMAXIMUM:
return true;		return true;
default: return false;		default:
		return false;
}		}
}		}

/// Return true if the node is a math/logic binary operator.		/// Return true if the node is a math/logic binary operator.
virtual bool isBinOp(unsigned Opcode) const {		virtual bool isBinOp(unsigned Opcode) const {
// A commutative binop must be a binop.		// A commutative binop must be a binop.
if (isCommutativeBinOp(Opcode))		if (isCommutativeBinOp(Opcode))
return true;		return true;
Show All 15 Lines	default:
return false;		return false;
}		}
}		}

/// Return true if it's free to truncate a value of type FromTy to type		/// Return true if it's free to truncate a value of type FromTy to type
/// ToTy. e.g. On x86 it's free to truncate a i32 value in register EAX to i16		/// ToTy. e.g. On x86 it's free to truncate a i32 value in register EAX to i16
/// by referencing its sub-register AX.		/// by referencing its sub-register AX.
/// Targets must return false when FromTy <= ToTy.		/// Targets must return false when FromTy <= ToTy.
virtual bool isTruncateFree(Type FromTy, Type ToTy) const {		virtual bool isTruncateFree(Type FromTy, Type ToTy) const { return false; }
return false;
}

/// Return true if a truncation from FromTy to ToTy is permitted when deciding		/// Return true if a truncation from FromTy to ToTy is permitted when deciding
/// whether a call is in tail position. Typically this means that both results		/// whether a call is in tail position. Typically this means that both results
/// would be assigned to the same register or stack slot, but it could mean		/// would be assigned to the same register or stack slot, but it could mean
/// the target performs adequate checks of its own before proceeding with the		/// the target performs adequate checks of its own before proceeding with the
/// tail call. Targets must return false when FromTy <= ToTy.		/// tail call. Targets must return false when FromTy <= ToTy.
virtual bool allowTruncateForTailCall(Type FromTy, Type ToTy) const {		virtual bool allowTruncateForTailCall(Type FromTy, Type ToTy) const {
return false;		return false;
}		}

virtual bool isTruncateFree(EVT FromVT, EVT ToVT) const {		virtual bool isTruncateFree(EVT FromVT, EVT ToVT) const { return false; }
return false;
}

virtual bool isProfitableToHoist(Instruction *I) const { return true; }		virtual bool isProfitableToHoist(Instruction *I) const { return true; }

/// Return true if the extension represented by \p I is free.		/// Return true if the extension represented by \p I is free.
/// Unlikely the is[Z\|FP]ExtFree family which is based on types,		/// Unlikely the is[Z\|FP]ExtFree family which is based on types,
/// this method can use the context provided by \p I to decide		/// this method can use the context provided by \p I to decide
/// whether or not \p I is free.		/// whether or not \p I is free.
/// This method extends the behavior of the is[Z\|FP]ExtFree family.		/// This method extends the behavior of the is[Z\|FP]ExtFree family.
▲ Show 20 Lines • Show All 54 Lines • ▼ Show 20 Lines	public:
///		///
/// The function should return true when it is likely that the truncate can		/// The function should return true when it is likely that the truncate can
/// be freely folded with an instruction defining a value of FromTy. If		/// be freely folded with an instruction defining a value of FromTy. If
/// the defining instruction is unknown (because you're looking at a		/// the defining instruction is unknown (because you're looking at a
/// function argument, PHI, etc.) then the target may require an		/// function argument, PHI, etc.) then the target may require an
/// explicit truncate, which is not necessarily free, but this function		/// explicit truncate, which is not necessarily free, but this function
/// does not deal with those cases.		/// does not deal with those cases.
/// Targets must return false when FromTy >= ToTy.		/// Targets must return false when FromTy >= ToTy.
virtual bool isZExtFree(Type FromTy, Type ToTy) const {		virtual bool isZExtFree(Type FromTy, Type ToTy) const { return false; }
return false;
}

virtual bool isZExtFree(EVT FromTy, EVT ToTy) const {		virtual bool isZExtFree(EVT FromTy, EVT ToTy) const { return false; }
return false;
}

/// Return true if sign-extension from FromTy to ToTy is cheaper than		/// Return true if sign-extension from FromTy to ToTy is cheaper than
/// zero-extension.		/// zero-extension.
virtual bool isSExtCheaperThanZExt(EVT FromTy, EVT ToTy) const {		virtual bool isSExtCheaperThanZExt(EVT FromTy, EVT ToTy) const {
return false;		return false;
}		}

/// Return true if sinking I's operands to the same basic block as I is		/// Return true if sinking I's operands to the same basic block as I is
▲ Show 20 Lines • Show All 159 Lines • ▼ Show 20 Lines	public:
/// the first element, and only the target knows which lowering is cheap.		/// the first element, and only the target knows which lowering is cheap.
virtual bool isExtractSubvectorCheap(EVT ResVT, EVT SrcVT,		virtual bool isExtractSubvectorCheap(EVT ResVT, EVT SrcVT,
unsigned Index) const {		unsigned Index) const {
return false;		return false;
}		}

/// Try to convert an extract element of a vector binary operation into an		/// Try to convert an extract element of a vector binary operation into an
/// extract element followed by a scalar operation.		/// extract element followed by a scalar operation.
virtual bool shouldScalarizeBinop(SDValue VecOp) const {		virtual bool shouldScalarizeBinop(SDValue VecOp) const { return false; }
return false;
}

/// Return true if extraction of a scalar element from the given vector type		/// Return true if extraction of a scalar element from the given vector type
/// at the given index is cheap. For example, if scalar operations occur on		/// at the given index is cheap. For example, if scalar operations occur on
/// the same register file as vector operations, then an extract element may		/// the same register file as vector operations, then an extract element may
/// be a sub-register rename rather than an actual instruction.		/// be a sub-register rename rather than an actual instruction.
virtual bool isExtractVecEltCheap(EVT VT, unsigned Index) const {		virtual bool isExtractVecEltCheap(EVT VT, unsigned Index) const {
return false;		return false;
}		}
▲ Show 20 Lines • Show All 77 Lines • ▼ Show 20 Lines	public:
/// the set of reserved registers.		/// the set of reserved registers.
/// The default implementation just freezes the set of reserved registers.		/// The default implementation just freezes the set of reserved registers.
virtual void finalizeLowering(MachineFunction &MF) const;		virtual void finalizeLowering(MachineFunction &MF) const;

//===----------------------------------------------------------------------===//		//===----------------------------------------------------------------------===//
// GlobalISel Hooks		// GlobalISel Hooks
//===----------------------------------------------------------------------===//		//===----------------------------------------------------------------------===//
/// Check whether or not \p MI needs to be moved close to its uses.		/// Check whether or not \p MI needs to be moved close to its uses.
virtual bool shouldLocalize(const MachineInstr &MI, const TargetTransformInfo *TTI) const;		virtual bool shouldLocalize(const MachineInstr &MI,
		const TargetTransformInfo *TTI) const;

private:		private:
const TargetMachine &TM;		const TargetMachine &TM;

/// Tells the code generator that the target has multiple (allocatable)		/// Tells the code generator that the target has multiple (allocatable)
/// condition registers that can be used to store the results of comparisons		/// condition registers that can be used to store the results of comparisons
/// for use by selects and conditional branches. With multiple condition		/// for use by selects and conditional branches. With multiple condition
/// registers, the code generator will not aggressively sink comparisons into		/// registers, the code generator will not aggressively sink comparisons into
/// the blocks of their users.		/// the blocks of their users.
bool HasMultipleConditionRegisters;		bool HasMultipleConditionRegisters;

/// Tells the code generator that the target has BitExtract instructions.		/// Tells the code generator that the target has BitExtract instructions.
/// The code generator will aggressively sink "shift"s into the blocks of		/// The code generator will aggressively sink "shift"s into the blocks of
/// their users if the users will generate "and" instructions which can be		/// their users if the users will generate "and" instructions which can be
/// combined with "shift" to BitExtract instructions.		/// combined with "shift" to BitExtract instructions.
bool HasExtractBitsInsn;		bool HasExtractBitsInsn;

/// Tells the code generator to bypass slow divide or remainder		/// Tells the code generator to bypass slow divide or remainder
/// instructions. For example, BypassSlowDivWidths[32,8] tells the code		/// instructions. For example, BypassSlowDivWidths[32,8] tells the code
/// generator to bypass 32-bit integer div/rem with an 8-bit unsigned integer		/// generator to bypass 32-bit integer div/rem with an 8-bit unsigned integer
/// div/rem when the operands are positive and less than 256.		/// div/rem when the operands are positive and less than 256.
DenseMap <unsigned int, unsigned int> BypassSlowDivWidths;		DenseMap<unsigned int, unsigned int> BypassSlowDivWidths;

/// Tells the code generator that it shouldn't generate extra flow control		/// Tells the code generator that it shouldn't generate extra flow control
/// instructions and should attempt to combine flow control instructions via		/// instructions and should attempt to combine flow control instructions via
/// predication.		/// predication.
bool JumpIsExpensive;		bool JumpIsExpensive;

/// Information about the contents of the high-bits in boolean values held in		/// Information about the contents of the high-bits in boolean values held in
/// a type wider than i1. See getBooleanContents.		/// a type wider than i1. See getBooleanContents.
▲ Show 20 Lines • Show All 103 Lines • ▼ Show 20 Lines

private:		private:
LegalizeKind getTypeConversion(LLVMContext &Context, EVT VT) const;		LegalizeKind getTypeConversion(LLVMContext &Context, EVT VT) const;

/// Targets can specify ISD nodes that they would like PerformDAGCombine		/// Targets can specify ISD nodes that they would like PerformDAGCombine
/// callbacks for by calling setTargetDAGCombine(), which sets a bit in this		/// callbacks for by calling setTargetDAGCombine(), which sets a bit in this
/// array.		/// array.
unsigned char		unsigned char
TargetDAGCombineArray[(ISD::BUILTIN_OP_END+CHAR_BIT-1)/CHAR_BIT];		TargetDAGCombineArray[(ISD::BUILTIN_OP_END + CHAR_BIT - 1) / CHAR_BIT];

/// For operations that must be promoted to a specific type, this holds the		/// For operations that must be promoted to a specific type, this holds the
/// destination type. This map should be sparse, so don't hold it as an		/// destination type. This map should be sparse, so don't hold it as an
/// array.		/// array.
///		///
/// Targets add entries to this map with AddPromotedToType(..), clients access		/// Targets add entries to this map with AddPromotedToType(..), clients access
/// this with getTypeToPromoteTo(..).		/// this with getTypeToPromoteTo(..).
std::map<std::pair<unsigned, MVT::SimpleValueType>, MVT::SimpleValueType>		std::map<std::pair<unsigned, MVT::SimpleValueType>, MVT::SimpleValueType>
PromoteToType;		PromoteToType;

/// Stores the name each libcall.		/// Stores the name each libcall.
const char *LibcallRoutineNames[RTLIB::UNKNOWN_LIBCALL + 1];		const char *LibcallRoutineNames[RTLIB::UNKNOWN_LIBCALL + 1];

/// The ISD::CondCode that should be used to test the result of each of the		/// The ISD::CondCode that should be used to test the result of each of the
/// comparison libcall against zero.		/// comparison libcall against zero.
ISD::CondCode CmpLibcallCCs[RTLIB::UNKNOWN_LIBCALL];		ISD::CondCode CmpLibcallCCs[RTLIB::UNKNOWN_LIBCALL];

▲ Show 20 Lines • Show All 153 Lines • ▼ Show 20 Lines	public:
bool isPositionIndependent() const;		bool isPositionIndependent() const;

virtual bool isSDNodeSourceOfDivergence(const SDNode *N,		virtual bool isSDNodeSourceOfDivergence(const SDNode *N,
FunctionLoweringInfo *FLI,		FunctionLoweringInfo *FLI,
LegacyDivergenceAnalysis *DA) const {		LegacyDivergenceAnalysis *DA) const {
return false;		return false;
}		}

virtual bool isSDNodeAlwaysUniform(const SDNode * N) const {		virtual bool isSDNodeAlwaysUniform(const SDNode *N) const { return false; }
return false;
}

/// Returns true by value, base pointer and offset pointer and addressing mode		/// Returns true by value, base pointer and offset pointer and addressing mode
/// by reference if the node's address can be legally represented as		/// by reference if the node's address can be legally represented as
/// pre-indexed load / store address.		/// pre-indexed load / store address.
virtual bool getPreIndexedAddressParts(SDNode * /N/, SDValue &/Base/,		virtual bool getPreIndexedAddressParts(SDNode * /N/, SDValue & /Base/,
SDValue &/Offset/,		SDValue & /Offset/,
ISD::MemIndexedMode &/AM/,		ISD::MemIndexedMode & /AM/,
SelectionDAG &/DAG/) const {		SelectionDAG & /DAG/) const {
return false;		return false;
}		}

/// Returns true by value, base pointer and offset pointer and addressing mode		/// Returns true by value, base pointer and offset pointer and addressing mode
/// by reference if this node can be combined with a load / store to form a		/// by reference if this node can be combined with a load / store to form a
/// post-indexed load / store.		/// post-indexed load / store.
virtual bool getPostIndexedAddressParts(SDNode * /N/, SDNode * /Op/,		virtual bool getPostIndexedAddressParts(SDNode * /N/, SDNode * /Op/,
SDValue &/Base/,		SDValue & /Base/,
SDValue &/Offset/,		SDValue & /Offset/,
ISD::MemIndexedMode &/AM/,		ISD::MemIndexedMode & /AM/,
SelectionDAG &/DAG/) const {		SelectionDAG & /DAG/) const {
return false;		return false;
}		}

/// Returns true if the specified base+offset is a legal indexed addressing		/// Returns true if the specified base+offset is a legal indexed addressing
/// mode for this target. \p MI is the load or store instruction that is being		/// mode for this target. \p MI is the load or store instruction that is being
/// considered for transformation.		/// considered for transformation.
virtual bool isIndexingLegal(MachineInstr &MI, Register Base, Register Offset,		virtual bool isIndexingLegal(MachineInstr &MI, Register Base, Register Offset,
bool IsPre, MachineRegisterInfo &MRI) const {		bool IsPre, MachineRegisterInfo &MRI) const {
return false;		return false;
}		}

/// Return the entry encoding for a jump table in the current function. The		/// Return the entry encoding for a jump table in the current function. The
/// returned value is a member of the MachineJumpTableInfo::JTEntryKind enum.		/// returned value is a member of the MachineJumpTableInfo::JTEntryKind enum.
virtual unsigned getJumpTableEncoding() const;		virtual unsigned getJumpTableEncoding() const;

virtual const MCExpr *		virtual const MCExpr *
LowerCustomJumpTableEntry(const MachineJumpTableInfo * /MJTI/,		LowerCustomJumpTableEntry(const MachineJumpTableInfo * /MJTI/,
const MachineBasicBlock * /MBB/, unsigned /uid/,		const MachineBasicBlock * /MBB/, unsigned /uid/,
MCContext &/Ctx/) const {		MCContext & /Ctx/) const {
llvm_unreachable("Need to implement this hook if target has custom JTIs");		llvm_unreachable("Need to implement this hook if target has custom JTIs");
}		}

/// Returns relocation base for the given PIC jumptable.		/// Returns relocation base for the given PIC jumptable.
virtual SDValue getPICJumpTableRelocBase(SDValue Table,		virtual SDValue getPICJumpTableRelocBase(SDValue Table,
SelectionDAG &DAG) const;		SelectionDAG &DAG) const;

/// This returns the relocation base for the given PIC jumptable, the same as		/// This returns the relocation base for the given PIC jumptable, the same as
/// getPICJumpTableRelocBase, but as an MCExpr.		/// getPICJumpTableRelocBase, but as an MCExpr.
virtual const MCExpr *		virtual const MCExpr getPICJumpTableRelocBaseExpr(const MachineFunction MF,
getPICJumpTableRelocBaseExpr(const MachineFunction *MF,		unsigned JTI,
unsigned JTI, MCContext &Ctx) const;		MCContext &Ctx) const;

/// Return true if folding a constant offset with the given GlobalAddress is		/// Return true if folding a constant offset with the given GlobalAddress is
/// legal. It is frequently not legal in PIC relocation models.		/// legal. It is frequently not legal in PIC relocation models.
virtual bool isOffsetFoldingLegal(const GlobalAddressSDNode *GA) const;		virtual bool isOffsetFoldingLegal(const GlobalAddressSDNode *GA) const;

bool isInTailCallPosition(SelectionDAG &DAG, SDNode *Node,		bool isInTailCallPosition(SelectionDAG &DAG, SDNode *Node,
SDValue &Chain) const;		SDValue &Chain) const;

Show All 15 Lines	std::pair<SDValue, SDValue> makeLibCall(SelectionDAG &DAG, RTLIB::Libcall LC,
MakeLibCallOptions CallOptions,		MakeLibCallOptions CallOptions,
const SDLoc &dl,		const SDLoc &dl,
SDValue Chain = SDValue()) const;		SDValue Chain = SDValue()) const;

/// Check whether parameters to a call that are passed in callee saved		/// Check whether parameters to a call that are passed in callee saved
/// registers are the same as from the calling function. This needs to be		/// registers are the same as from the calling function. This needs to be
/// checked for tail call eligibility.		/// checked for tail call eligibility.
bool parametersInCSRMatch(const MachineRegisterInfo &MRI,		bool parametersInCSRMatch(const MachineRegisterInfo &MRI,
const uint32_t *CallerPreservedMask,		const uint32_t *CallerPreservedMask,
const SmallVectorImpl<CCValAssign> &ArgLocs,		const SmallVectorImpl<CCValAssign> &ArgLocs,
const SmallVectorImpl<SDValue> &OutVals) const;		const SmallVectorImpl<SDValue> &OutVals) const;

//===--------------------------------------------------------------------===//		//===--------------------------------------------------------------------===//
// TargetLowering Optimization Methods		// TargetLowering Optimization Methods
//		//

/// A convenience struct that encapsulates a DAG, and two SDValues for		/// A convenience struct that encapsulates a DAG, and two SDValues for
/// returning information from TargetLowering to its clients that want to		/// returning information from TargetLowering to its clients that want to
/// combine.		/// combine.
struct TargetLoweringOpt {		struct TargetLoweringOpt {
SelectionDAG &DAG;		SelectionDAG &DAG;
bool LegalTys;		bool LegalTys;
bool LegalOps;		bool LegalOps;
SDValue Old;		SDValue Old;
SDValue New;		SDValue New;

explicit TargetLoweringOpt(SelectionDAG &InDAG,		explicit TargetLoweringOpt(SelectionDAG &InDAG, bool LT, bool LO)
bool LT, bool LO) :		: DAG(InDAG), LegalTys(LT), LegalOps(LO) {}
DAG(InDAG), LegalTys(LT), LegalOps(LO) {}

bool LegalTypes() const { return LegalTys; }		bool LegalTypes() const { return LegalTys; }
bool LegalOperations() const { return LegalOps; }		bool LegalOperations() const { return LegalOps; }

bool CombineTo(SDValue O, SDValue N) {		bool CombineTo(SDValue O, SDValue N) {
Old = O;		Old = O;
New = N;		New = N;
return true;		return true;
}		}
};		};

/// Determines the optimal series of memory ops to replace the memset / memcpy.		/// Determines the optimal series of memory ops to replace the memset /
/// Return true if the number of memory ops is below the threshold (Limit).		/// memcpy. Return true if the number of memory ops is below the threshold
/// It returns the types of the sequence of memory ops to perform		/// (Limit). It returns the types of the sequence of memory ops to perform
/// memset / memcpy by reference.		/// memset / memcpy by reference.
bool findOptimalMemOpLowering(std::vector<EVT> &MemOps, unsigned Limit,		bool findOptimalMemOpLowering(std::vector<EVT> &MemOps, unsigned Limit,
const MemOp &Op, unsigned DstAS, unsigned SrcAS,		const MemOp &Op, unsigned DstAS, unsigned SrcAS,
const AttributeList &FuncAttributes) const;		const AttributeList &FuncAttributes) const;

/// Check to see if the specified operand of the specified instruction is a		/// Check to see if the specified operand of the specified instruction is a
/// constant integer. If so, check to see if there are any bits set in the		/// constant integer. If so, check to see if there are any bits set in the
/// constant that are not demanded. If so, shrink the constant and return		/// constant that are not demanded. If so, shrink the constant and return
▲ Show 20 Lines • Show All 97 Lines • ▼ Show 20 Lines	public:
bool SimplifyDemandedVectorElts(SDValue Op, const APInt &DemandedElts,		bool SimplifyDemandedVectorElts(SDValue Op, const APInt &DemandedElts,
APInt &KnownUndef, APInt &KnownZero,		APInt &KnownUndef, APInt &KnownZero,
DAGCombinerInfo &DCI) const;		DAGCombinerInfo &DCI) const;

/// Determine which of the bits specified in Mask are known to be either zero		/// Determine which of the bits specified in Mask are known to be either zero
/// or one and return them in the KnownZero/KnownOne bitsets. The DemandedElts		/// or one and return them in the KnownZero/KnownOne bitsets. The DemandedElts
/// argument allows us to only collect the known bits that are shared by the		/// argument allows us to only collect the known bits that are shared by the
/// requested vector elements.		/// requested vector elements.
virtual void computeKnownBitsForTargetNode(const SDValue Op,		virtual void computeKnownBitsForTargetNode(const SDValue Op, KnownBits &Known,
KnownBits &Known,
const APInt &DemandedElts,		const APInt &DemandedElts,
const SelectionDAG &DAG,		const SelectionDAG &DAG,
unsigned Depth = 0) const;		unsigned Depth = 0) const;

/// Determine which of the bits specified in Mask are known to be either zero		/// Determine which of the bits specified in Mask are known to be either zero
/// or one and return them in the KnownZero/KnownOne bitsets. The DemandedElts		/// or one and return them in the KnownZero/KnownOne bitsets. The DemandedElts
/// argument allows us to only collect the known bits that are shared by the		/// argument allows us to only collect the known bits that are shared by the
/// requested vector elements. This is for GISel.		/// requested vector elements. This is for GISel.
Show All 10 Lines	public:
virtual Align computeKnownAlignForTargetInstr(GISelKnownBits &Analysis,		virtual Align computeKnownAlignForTargetInstr(GISelKnownBits &Analysis,
Register R,		Register R,
const MachineRegisterInfo &MRI,		const MachineRegisterInfo &MRI,
unsigned Depth = 0) const;		unsigned Depth = 0) const;

/// Determine which of the bits of FrameIndex \p FIOp are known to be 0.		/// Determine which of the bits of FrameIndex \p FIOp are known to be 0.
/// Default implementation computes low bits based on alignment		/// Default implementation computes low bits based on alignment
/// information. This should preserve known bits passed into it.		/// information. This should preserve known bits passed into it.
virtual void computeKnownBitsForFrameIndex(int FIOp,		virtual void computeKnownBitsForFrameIndex(int FIOp, KnownBits &Known,
KnownBits &Known,
const MachineFunction &MF) const;		const MachineFunction &MF) const;

/// This method can be implemented by targets that want to expose additional		/// This method can be implemented by targets that want to expose additional
/// information about sign bits to the DAG Combiner. The DemandedElts		/// information about sign bits to the DAG Combiner. The DemandedElts
/// argument allows us to only collect the minimum sign bits that are shared		/// argument allows us to only collect the minimum sign bits that are shared
/// by the requested vector elements.		/// by the requested vector elements.
virtual unsigned ComputeNumSignBitsForTargetNode(SDValue Op,		virtual unsigned ComputeNumSignBitsForTargetNode(SDValue Op,
const APInt &DemandedElts,		const APInt &DemandedElts,
const SelectionDAG &DAG,		const SelectionDAG &DAG,
unsigned Depth = 0) const;		unsigned Depth = 0) const;

/// This method can be implemented by targets that want to expose additional		/// This method can be implemented by targets that want to expose additional
/// information about sign bits to GlobalISel combiners. The DemandedElts		/// information about sign bits to GlobalISel combiners. The DemandedElts
/// argument allows us to only collect the minimum sign bits that are shared		/// argument allows us to only collect the minimum sign bits that are shared
/// by the requested vector elements.		/// by the requested vector elements.
virtual unsigned computeNumSignBitsForTargetInstr(GISelKnownBits &Analysis,		virtual unsigned computeNumSignBitsForTargetInstr(
Register R,		GISelKnownBits &Analysis, Register R, const APInt &DemandedElts,
const APInt &DemandedElts,		const MachineRegisterInfo &MRI, unsigned Depth = 0) const;
const MachineRegisterInfo &MRI,
unsigned Depth = 0) const;

/// Attempt to simplify any target nodes based on the demanded vector		/// Attempt to simplify any target nodes based on the demanded vector
/// elements, returning true on success. Otherwise, analyze the expression and		/// elements, returning true on success. Otherwise, analyze the expression and
/// return a mask of KnownUndef and KnownZero elements for the expression		/// return a mask of KnownUndef and KnownZero elements for the expression
/// (used to simplify the caller). The KnownUndef/Zero elements may only be		/// (used to simplify the caller). The KnownUndef/Zero elements may only be
/// accurate for those bits in the DemandedMask.		/// accurate for those bits in the DemandedMask.
virtual bool SimplifyDemandedVectorEltsForTargetNode(		virtual bool SimplifyDemandedVectorEltsForTargetNode(
SDValue Op, const APInt &DemandedElts, APInt &KnownUndef,		SDValue Op, const APInt &DemandedElts, APInt &KnownUndef,
APInt &KnownZero, TargetLoweringOpt &TLO, unsigned Depth = 0) const;		APInt &KnownZero, TargetLoweringOpt &TLO, unsigned Depth = 0) const;

/// Attempt to simplify any target nodes based on the demanded bits/elts,		/// Attempt to simplify any target nodes based on the demanded bits/elts,
/// returning true on success. Otherwise, analyze the		/// returning true on success. Otherwise, analyze the
/// expression and return a mask of KnownOne and KnownZero bits for the		/// expression and return a mask of KnownOne and KnownZero bits for the
/// expression (used to simplify the caller). The KnownZero/One bits may only		/// expression (used to simplify the caller). The KnownZero/One bits may only
/// be accurate for those bits in the Demanded masks.		/// be accurate for those bits in the Demanded masks.
virtual bool SimplifyDemandedBitsForTargetNode(SDValue Op,		virtual bool SimplifyDemandedBitsForTargetNode(
		Lint: Pre-merge checks Inline Actions clang-tidy: warning: invalid case style for function 'SimplifyDemandedBitsForTargetNode' [readability-identifier-naming] not useful Lint: Pre-merge checks: clang-tidy: warning: invalid case style for function 'SimplifyDemandedBitsForTargetNode'…
const APInt &DemandedBits,		SDValue Op, const APInt &DemandedBits, const APInt &DemandedElts,
const APInt &DemandedElts,		KnownBits &Known, TargetLoweringOpt &TLO, unsigned Depth = 0) const;
KnownBits &Known,
TargetLoweringOpt &TLO,
unsigned Depth = 0) const;

/// More limited version of SimplifyDemandedBits that can be used to "look		/// More limited version of SimplifyDemandedBits that can be used to "look
/// through" ops that don't contribute to the DemandedBits/DemandedElts -		/// through" ops that don't contribute to the DemandedBits/DemandedElts -
/// bitwise ops etc.		/// bitwise ops etc.
virtual SDValue SimplifyMultipleUseDemandedBitsForTargetNode(		virtual SDValue SimplifyMultipleUseDemandedBitsForTargetNode(
SDValue Op, const APInt &DemandedBits, const APInt &DemandedElts,		SDValue Op, const APInt &DemandedBits, const APInt &DemandedElts,
SelectionDAG &DAG, unsigned Depth) const;		SelectionDAG &DAG, unsigned Depth) const;

/// Tries to build a legal vector shuffle using the provided parameters		/// Tries to build a legal vector shuffle using the provided parameters
/// or equivalent variations. The Mask argument maybe be modified as the		/// or equivalent variations. The Mask argument maybe be modified as the
/// function tries different variations.		/// function tries different variations.
/// Returns an empty SDValue if the operation fails.		/// Returns an empty SDValue if the operation fails.
SDValue buildLegalVectorShuffle(EVT VT, const SDLoc &DL, SDValue N0,		SDValue buildLegalVectorShuffle(EVT VT, const SDLoc &DL, SDValue N0,
SDValue N1, MutableArrayRef<int> Mask,		SDValue N1, MutableArrayRef<int> Mask,
SelectionDAG &DAG) const;		SelectionDAG &DAG) const;

/// This method returns the constant pool value that will be loaded by LD.		/// This method returns the constant pool value that will be loaded by LD.
/// NOTE: You must check for implicit extensions of the constant by LD.		/// NOTE: You must check for implicit extensions of the constant by LD.
virtual const Constant getTargetConstantFromLoad(LoadSDNode LD) const;		virtual const Constant getTargetConstantFromLoad(LoadSDNode LD) const;

/// If \p SNaN is false, \returns true if \p Op is known to never be any		/// If \p SNaN is false, \returns true if \p Op is known to never be any
/// NaN. If \p sNaN is true, returns if \p Op is known to never be a signaling		/// NaN. If \p sNaN is true, returns if \p Op is known to never be a signaling
/// NaN.		/// NaN.
virtual bool isKnownNeverNaNForTargetNode(SDValue Op,		virtual bool isKnownNeverNaNForTargetNode(SDValue Op, const SelectionDAG &DAG,
const SelectionDAG &DAG,
bool SNaN = false,		bool SNaN = false,
unsigned Depth = 0) const;		unsigned Depth = 0) const;
struct DAGCombinerInfo {		struct DAGCombinerInfo {
void *DC; // The DAG Combiner object.		void *DC; // The DAG Combiner object.
CombineLevel Level;		CombineLevel Level;
bool CalledByLegalizer;		bool CalledByLegalizer;

public:		public:
SelectionDAG &DAG;		SelectionDAG &DAG;

DAGCombinerInfo(SelectionDAG &dag, CombineLevel level, bool cl, void *dc)		DAGCombinerInfo(SelectionDAG &dag, CombineLevel level, bool cl, void *dc)
		Lint: Pre-merge checks Inline Actions clang-tidy: warning: invalid case style for parameter 'dag' [readability-identifier-naming] not useful clang-tidy: warning: invalid case style for parameter 'level' [readability-identifier-naming] not useful clang-tidy: warning: invalid case style for parameter 'cl' [readability-identifier-naming] not useful clang-tidy: warning: invalid case style for parameter 'dc' [readability-identifier-naming] not useful Lint: Pre-merge checks: clang-tidy: warning: invalid case style for parameter 'dag' [readability-identifier-naming]…
: DC(dc), Level(level), CalledByLegalizer(cl), DAG(dag) {}		: DC(dc), Level(level), CalledByLegalizer(cl), DAG(dag) {}

bool isBeforeLegalize() const { return Level == BeforeLegalizeTypes; }		bool isBeforeLegalize() const { return Level == BeforeLegalizeTypes; }
bool isBeforeLegalizeOps() const { return Level < AfterLegalizeVectorOps; }		bool isBeforeLegalizeOps() const { return Level < AfterLegalizeVectorOps; }
bool isAfterLegalizeDAG() const { return Level >= AfterLegalizeDAG; }		bool isAfterLegalizeDAG() const { return Level >= AfterLegalizeDAG; }
CombineLevel getDAGCombineLevel() { return Level; }		CombineLevel getDAGCombineLevel() { return Level; }
bool isCalledByLegalizer() const { return CalledByLegalizer; }		bool isCalledByLegalizer() const { return CalledByLegalizer; }

void AddToWorklist(SDNode *N);		void AddToWorklist(SDNode *N);
Show All 23 Lines	SDValue SimplifySetCC(EVT VT, SDValue N0, SDValue N1, ISD::CondCode Cond,
bool foldBooleans, DAGCombinerInfo &DCI,		bool foldBooleans, DAGCombinerInfo &DCI,
const SDLoc &dl) const;		const SDLoc &dl) const;

// For targets which wrap address, unwrap for analysis.		// For targets which wrap address, unwrap for analysis.
virtual SDValue unwrapAddress(SDValue N) const { return N; }		virtual SDValue unwrapAddress(SDValue N) const { return N; }

/// Returns true (and the GlobalValue and the offset) if the node is a		/// Returns true (and the GlobalValue and the offset) if the node is a
/// GlobalAddress + offset.		/// GlobalAddress + offset.
virtual bool		virtual bool isGAPlusOffset(SDNode N, const GlobalValue &GA,
isGAPlusOffset(SDNode N, const GlobalValue &GA, int64_t &Offset) const;		int64_t &Offset) const;

/// This method will be invoked for all target nodes and for any		/// This method will be invoked for all target nodes and for any
/// target-independent nodes that the target has registered with invoke it		/// target-independent nodes that the target has registered with invoke it
/// for.		/// for.
///		///
/// The semantics are as follows:		/// The semantics are as follows:
/// Return Value:		/// Return Value:
/// SDValue.Val == 0 - No change was made		/// SDValue.Val == 0 - No change was made
Show All 33 Lines	public:
virtual bool isDesirableToTransformToIntegerOp(unsigned /Opc/,		virtual bool isDesirableToTransformToIntegerOp(unsigned /Opc/,
EVT /VT/) const {		EVT /VT/) const {
return false;		return false;
}		}

/// This method query the target whether it is beneficial for dag combiner to		/// This method query the target whether it is beneficial for dag combiner to
/// promote the specified node. If true, it should return the desired		/// promote the specified node. If true, it should return the desired
/// promotion type by reference.		/// promotion type by reference.
virtual bool IsDesirableToPromoteOp(SDValue /Op/, EVT &/PVT/) const {		virtual bool IsDesirableToPromoteOp(SDValue /Op/, EVT & /PVT/) const {
		Lint: Pre-merge checks Inline Actions clang-tidy: warning: invalid case style for function 'IsDesirableToPromoteOp' [readability-identifier-naming] not useful Lint: Pre-merge checks: clang-tidy: warning: invalid case style for function 'IsDesirableToPromoteOp' [readability…
return false;		return false;
}		}

/// Return true if the target supports swifterror attribute. It optimizes		/// Return true if the target supports swifterror attribute. It optimizes
/// loads and stores to reading and writing a specific register.		/// loads and stores to reading and writing a specific register.
virtual bool supportSwiftError() const {		virtual bool supportSwiftError() const { return false; }
return false;
}

/// Return true if the target supports that a subset of CSRs for the given		/// Return true if the target supports that a subset of CSRs for the given
/// machine function is handled explicitly via copies.		/// machine function is handled explicitly via copies.
virtual bool supportSplitCSR(MachineFunction *MF) const {		virtual bool supportSplitCSR(MachineFunction *MF) const { return false; }
return false;
}

/// Perform necessary initialization to handle a subset of CSRs explicitly		/// Perform necessary initialization to handle a subset of CSRs explicitly
/// via copies. This function is called at the beginning of instruction		/// via copies. This function is called at the beginning of instruction
/// selection.		/// selection.
virtual void initializeSplitCSR(MachineBasicBlock *Entry) const {		virtual void initializeSplitCSR(MachineBasicBlock *Entry) const {
llvm_unreachable("Not Implemented");		llvm_unreachable("Not Implemented");
}		}

▲ Show 20 Lines • Show All 75 Lines • ▼ Show 20 Lines	public:

/// This structure contains all information that is necessary for lowering		/// This structure contains all information that is necessary for lowering
/// calls. It is passed to TLI::LowerCallTo when the SelectionDAG builder		/// calls. It is passed to TLI::LowerCallTo when the SelectionDAG builder
/// needs to lower a call, and targets will see this struct in their LowerCall		/// needs to lower a call, and targets will see this struct in their LowerCall
/// implementation.		/// implementation.
struct CallLoweringInfo {		struct CallLoweringInfo {
SDValue Chain;		SDValue Chain;
Type *RetTy = nullptr;		Type *RetTy = nullptr;
bool RetSExt : 1;		bool RetSExt : 1;
bool RetZExt : 1;		bool RetZExt : 1;
bool IsVarArg : 1;		bool IsVarArg : 1;
bool IsInReg : 1;		bool IsInReg : 1;
bool DoesNotReturn : 1;		bool DoesNotReturn : 1;
bool IsReturnValueUsed : 1;		bool IsReturnValueUsed : 1;
bool IsConvergent : 1;		bool IsConvergent : 1;
bool IsPatchPoint : 1;		bool IsPatchPoint : 1;
bool IsPreallocated : 1;		bool IsPreallocated : 1;
bool NoMerge : 1;		bool NoMerge : 1;

// IsTailCall should be modified by implementations of		// IsTailCall should be modified by implementations of
// TargetLowering::LowerCall that perform tail call conversions.		// TargetLowering::LowerCall that perform tail call conversions.
bool IsTailCall = false;		bool IsTailCall = false;

// Is Call lowering done post SelectionDAG type legalization.		// Is Call lowering done post SelectionDAG type legalization.
bool IsPostTypeLegalization = false;		bool IsPostTypeLegalization = false;

unsigned NumFixedArgs = -1;		unsigned NumFixedArgs = -1;
CallingConv::ID CallConv = CallingConv::C;		CallingConv::ID CallConv = CallingConv::C;
SDValue Callee;		SDValue Callee;
ArgListTy Args;		ArgListTy Args;
SelectionDAG &DAG;		SelectionDAG &DAG;
SDLoc DL;		SDLoc DL;
const CallBase *CB = nullptr;		const CallBase *CB = nullptr;
SmallVector<ISD::OutputArg, 32> Outs;		SmallVector<ISD::OutputArg, 32> Outs;
SmallVector<SDValue, 32> OutVals;		SmallVector<SDValue, 32> OutVals;
SmallVector<ISD::InputArg, 32> Ins;		SmallVector<ISD::InputArg, 32> Ins;
SmallVector<SDValue, 4> InVals;		SmallVector<SDValue, 4> InVals;

CallLoweringInfo(SelectionDAG &DAG)		CallLoweringInfo(SelectionDAG &DAG)
: RetSExt(false), RetZExt(false), IsVarArg(false), IsInReg(false),		: RetSExt(false), RetZExt(false), IsVarArg(false), IsInReg(false),
DoesNotReturn(false), IsReturnValueUsed(true), IsConvergent(false),		DoesNotReturn(false), IsReturnValueUsed(true), IsConvergent(false),
IsPatchPoint(false), IsPreallocated(false), NoMerge(false),		IsPatchPoint(false), IsPreallocated(false), NoMerge(false), DAG(DAG) {
DAG(DAG) {}		}

CallLoweringInfo &setDebugLoc(const SDLoc &dl) {		CallLoweringInfo &setDebugLoc(const SDLoc &dl) {
DL = dl;		DL = dl;
return *this;		return *this;
}		}

CallLoweringInfo &setChain(SDValue InChain) {		CallLoweringInfo &setChain(SDValue InChain) {
Chain = InChain;		Chain = InChain;
Show All 33 Lines	CallLoweringInfo &setCallee(Type ResultType, FunctionType FTy,
DoesNotReturn =		DoesNotReturn =
Call.doesNotReturn() \|\|		Call.doesNotReturn() \|\|
(!isa<InvokeInst>(Call) && isa<UnreachableInst>(Call.getNextNode()));		(!isa<InvokeInst>(Call) && isa<UnreachableInst>(Call.getNextNode()));
IsVarArg = FTy->isVarArg();		IsVarArg = FTy->isVarArg();
IsReturnValueUsed = !Call.use_empty();		IsReturnValueUsed = !Call.use_empty();
RetSExt = Call.hasRetAttr(Attribute::SExt);		RetSExt = Call.hasRetAttr(Attribute::SExt);
RetZExt = Call.hasRetAttr(Attribute::ZExt);		RetZExt = Call.hasRetAttr(Attribute::ZExt);
NoMerge = Call.hasFnAttr(Attribute::NoMerge);		NoMerge = Call.hasFnAttr(Attribute::NoMerge);

Callee = Target;		Callee = Target;

CallConv = Call.getCallingConv();		CallConv = Call.getCallingConv();
NumFixedArgs = FTy->getNumParams();		NumFixedArgs = FTy->getNumParams();
Args = std::move(ArgsList);		Args = std::move(ArgsList);

CB = &Call;		CB = &Call;

▲ Show 20 Lines • Show All 45 Lines • ▼ Show 20 Lines	CallLoweringInfo &setIsPatchPoint(bool Value = true) {
return *this;		return *this;
}		}

CallLoweringInfo &setIsPreallocated(bool Value = true) {		CallLoweringInfo &setIsPreallocated(bool Value = true) {
IsPreallocated = Value;		IsPreallocated = Value;
return *this;		return *this;
}		}

CallLoweringInfo &setIsPostTypeLegalization(bool Value=true) {		CallLoweringInfo &setIsPostTypeLegalization(bool Value = true) {
IsPostTypeLegalization = Value;		IsPostTypeLegalization = Value;
return *this;		return *this;
}		}

ArgListTy &getArgs() {		ArgListTy &getArgs() { return Args; }
return Args;
}
};		};

/// This structure is used to pass arguments to makeLibCall function.		/// This structure is used to pass arguments to makeLibCall function.
struct MakeLibCallOptions {		struct MakeLibCallOptions {
// By passing type list before soften to makeLibCall, the target hook		// By passing type list before soften to makeLibCall, the target hook
// shouldExtendTypeInLibCall can get the original type before soften.		// shouldExtendTypeInLibCall can get the original type before soften.
ArrayRef<EVT> OpsVTBeforeSoften;		ArrayRef<EVT> OpsVTBeforeSoften;
EVT RetVTBeforeSoften;		EVT RetVTBeforeSoften;
▲ Show 20 Lines • Show All 42 Lines • ▼ Show 20 Lines	public:
/// outgoing token chain. It calls LowerCall to do the actual lowering.		/// outgoing token chain. It calls LowerCall to do the actual lowering.
std::pair<SDValue, SDValue> LowerCallTo(CallLoweringInfo &CLI) const;		std::pair<SDValue, SDValue> LowerCallTo(CallLoweringInfo &CLI) const;

/// This hook must be implemented to lower calls into the specified		/// This hook must be implemented to lower calls into the specified
/// DAG. The outgoing arguments to the call are described by the Outs array,		/// DAG. The outgoing arguments to the call are described by the Outs array,
/// and the values to be returned by the call are described by the Ins		/// and the values to be returned by the call are described by the Ins
/// array. The implementation should fill in the InVals array with legal-type		/// array. The implementation should fill in the InVals array with legal-type
/// return values from the call, and return the resulting token chain value.		/// return values from the call, and return the resulting token chain value.
virtual SDValue		virtual SDValue LowerCall(CallLoweringInfo & /CLI/,
		Lint: Pre-merge checks Inline Actions clang-tidy: warning: invalid case style for function 'LowerCall' [readability-identifier-naming] not useful Lint: Pre-merge checks: clang-tidy: warning: invalid case style for function 'LowerCall' [readability-identifier…
LowerCall(CallLoweringInfo &/CLI/,
SmallVectorImpl<SDValue> &/InVals/) const {		SmallVectorImpl<SDValue> & /InVals/) const {
llvm_unreachable("Not Implemented");		llvm_unreachable("Not Implemented");
}		}

/// Target-specific cleanup for formal ByVal parameters.		/// Target-specific cleanup for formal ByVal parameters.
virtual void HandleByVal(CCState *, unsigned &, Align) const {}		virtual void HandleByVal(CCState *, unsigned &, Align) const {}

/// This hook should be implemented to check whether the return values		/// This hook should be implemented to check whether the return values
/// described by the Outs array can fit into the return registers. If false		/// described by the Outs array can fit into the return registers. If false
/// is returned, an sret-demotion is performed.		/// is returned, an sret-demotion is performed.
virtual bool CanLowerReturn(CallingConv::ID /CallConv/,		virtual bool CanLowerReturn(CallingConv::ID /CallConv/,
MachineFunction &/MF/, bool /isVarArg/,		MachineFunction & /MF/, bool /isVarArg/,
const SmallVectorImpl<ISD::OutputArg> &/Outs/,		const SmallVectorImpl<ISD::OutputArg> & /Outs/,
LLVMContext &/Context/) const		LLVMContext & /Context/) const {
{
// Return true by default to get preexisting behavior.		// Return true by default to get preexisting behavior.
return true;		return true;
}		}

/// This hook must be implemented to lower outgoing return values, described		/// This hook must be implemented to lower outgoing return values, described
/// by the Outs array, into the specified DAG. The implementation should		/// by the Outs array, into the specified DAG. The implementation should
/// return the resulting token chain value.		/// return the resulting token chain value.
virtual SDValue LowerReturn(SDValue /Chain/, CallingConv::ID /CallConv/,		virtual SDValue LowerReturn(SDValue /Chain/, CallingConv::ID /CallConv/,
bool /isVarArg/,		bool /isVarArg/,
const SmallVectorImpl<ISD::OutputArg> & /Outs/,		const SmallVectorImpl<ISD::OutputArg> & /Outs/,
const SmallVectorImpl<SDValue> & /OutVals/,		const SmallVectorImpl<SDValue> & /OutVals/,
const SDLoc & /dl/,		const SDLoc & /dl/,
SelectionDAG & /DAG/) const {		SelectionDAG & /DAG/) const {
llvm_unreachable("Not Implemented");		llvm_unreachable("Not Implemented");
}		}

/// Return true if result of the specified node is used by a return node		/// Return true if result of the specified node is used by a return node
/// only. It also compute and return the input chain for the tail call.		/// only. It also compute and return the input chain for the tail call.
///		///
/// This is used to determine whether it is possible to codegen a libcall as		/// This is used to determine whether it is possible to codegen a libcall as
/// tail call at legalization time.		/// tail call at legalization time.
virtual bool isUsedByReturnOnly(SDNode , SDValue &/Chain*/) const {		virtual bool isUsedByReturnOnly(SDNode , SDValue & /Chain*/) const {
return false;		return false;
}		}

/// Return true if the target may be able emit the call instruction as a tail		/// Return true if the target may be able emit the call instruction as a tail
/// call. This is used by optimization passes to determine if it's profitable		/// call. This is used by optimization passes to determine if it's profitable
/// to duplicate return instructions to enable tailcall optimization.		/// to duplicate return instructions to enable tailcall optimization.
virtual bool mayBeEmittedAsTailCall(const CallInst *) const {		virtual bool mayBeEmittedAsTailCall(const CallInst *) const { return false; }
return false;
}

/// Return the builtin name for the __builtin___clear_cache intrinsic		/// Return the builtin name for the __builtin___clear_cache intrinsic
/// Default is to invoke the clear cache library call		/// Default is to invoke the clear cache library call
virtual const char * getClearCacheBuiltinName() const {		virtual const char *getClearCacheBuiltinName() const {
return "__clear_cache";		return "__clear_cache";
}		}

/// Return the register ID of the name passed in. Used by named register		/// Return the register ID of the name passed in. Used by named register
/// global variables extension. There is no target-independent behaviour		/// global variables extension. There is no target-independent behaviour
/// so the default action is to bail.		/// so the default action is to bail.
virtual Register getRegisterByName(const char* RegName, LLT Ty,		virtual Register getRegisterByName(const char *RegName, LLT Ty,
const MachineFunction &MF) const {		const MachineFunction &MF) const {
report_fatal_error("Named registers not implemented for this target");		report_fatal_error("Named registers not implemented for this target");
}		}

/// Return the type that should be used to zero or sign extend a		/// Return the type that should be used to zero or sign extend a
/// zeroext/signext integer return value. FIXME: Some C calling conventions		/// zeroext/signext integer return value. FIXME: Some C calling conventions
/// require the return type to be promoted, but this is not true all the time,		/// require the return type to be promoted, but this is not true all the time,
/// e.g. i1/i8/i16 on x86/x86_64. It is also not necessary for non-C calling		/// e.g. i1/i8/i16 on x86/x86_64. It is also not necessary for non-C calling
/// conventions. The frontend should handle this and include all of the		/// conventions. The frontend should handle this and include all of the
/// necessary information.		/// necessary information.
virtual EVT getTypeForExtReturn(LLVMContext &Context, EVT VT,		virtual EVT getTypeForExtReturn(LLVMContext &Context, EVT VT,
ISD::NodeType /ExtendKind/) const {		ISD::NodeType /ExtendKind/) const {
EVT MinVT = getRegisterType(Context, MVT::i32);		EVT MinVT = getRegisterType(Context, MVT::i32);
return VT.bitsLT(MinVT) ? MinVT : VT;		return VT.bitsLT(MinVT) ? MinVT : VT;
}		}

/// For some targets, an LLVM struct type must be broken down into multiple		/// For some targets, an LLVM struct type must be broken down into multiple
/// simple types, but the calling convention specifies that the entire struct		/// simple types, but the calling convention specifies that the entire struct
/// must be passed in a block of consecutive registers.		/// must be passed in a block of consecutive registers.
virtual bool		virtual bool
▲ Show 20 Lines • Show All 42 Lines • ▼ Show 20 Lines	public:
/// LoadSDNode (as opposed to an AtomicSDNode)? NOTE: The intention is to		/// LoadSDNode (as opposed to an AtomicSDNode)? NOTE: The intention is to
/// eventually migrate all targets to the using LoadSDNodes, but porting is		/// eventually migrate all targets to the using LoadSDNodes, but porting is
/// being done target at a time.		/// being done target at a time.
virtual bool lowerAtomicLoadAsLoadSDNode(const LoadInst &LI) const {		virtual bool lowerAtomicLoadAsLoadSDNode(const LoadInst &LI) const {
assert(LI.isAtomic() && "violated precondition");		assert(LI.isAtomic() && "violated precondition");
return false;		return false;
}		}


/// This callback is invoked by the type legalizer to legalize nodes with an		/// This callback is invoked by the type legalizer to legalize nodes with an
/// illegal operand type but legal result types. It replaces the		/// illegal operand type but legal result types. It replaces the
/// LowerOperation callback in the type Legalizer. The reason we can not do		/// LowerOperation callback in the type Legalizer. The reason we can not do
/// away with LowerOperation entirely is that LegalizeDAG isn't yet ready to		/// away with LowerOperation entirely is that LegalizeDAG isn't yet ready to
/// use this callback.		/// use this callback.
///		///
/// TODO: Consider merging with ReplaceNodeResults.		/// TODO: Consider merging with ReplaceNodeResults.
///		///
Show All 18 Lines	public:
/// result type. The target places new result values for the node in Results		/// result type. The target places new result values for the node in Results
/// (their number and types must exactly match those of the original return		/// (their number and types must exactly match those of the original return
/// values of the node), or leaves Results empty, which indicates that the		/// values of the node), or leaves Results empty, which indicates that the
/// node is not to be custom lowered after all.		/// node is not to be custom lowered after all.
///		///
/// If the target has no operations that require custom lowering, it need not		/// If the target has no operations that require custom lowering, it need not
/// implement this. The default implementation aborts.		/// implement this. The default implementation aborts.
virtual void ReplaceNodeResults(SDNode * /N/,		virtual void ReplaceNodeResults(SDNode * /N/,
SmallVectorImpl<SDValue> &/Results/,		SmallVectorImpl<SDValue> & /Results/,
SelectionDAG &/DAG/) const {		SelectionDAG & /DAG/) const {
llvm_unreachable("ReplaceNodeResults not implemented for this target!");		llvm_unreachable("ReplaceNodeResults not implemented for this target!");
}		}

/// This method returns the name of a target specific DAG node.		/// This method returns the name of a target specific DAG node.
virtual const char *getTargetNodeName(unsigned Opcode) const;		virtual const char *getTargetNodeName(unsigned Opcode) const;

/// This method returns a target specific FastISel object, or null if the		/// This method returns a target specific FastISel object, or null if the
/// target does not support "fast" ISel.		/// target does not support "fast" ISel.
virtual FastISel *createFastISel(FunctionLoweringInfo &,		virtual FastISel *createFastISel(FunctionLoweringInfo &,
const TargetLibraryInfo *) const {		const TargetLibraryInfo *) const {
return nullptr;		return nullptr;
}		}

bool verifyReturnAddressArgumentIsConstant(SDValue Op,		bool verifyReturnAddressArgumentIsConstant(SDValue Op,
SelectionDAG &DAG) const;		SelectionDAG &DAG) const;

//===--------------------------------------------------------------------===//		//===--------------------------------------------------------------------===//
// Inline Asm Support hooks		// Inline Asm Support hooks
//		//

/// This hook allows the target to expand an inline asm call to be explicit		/// This hook allows the target to expand an inline asm call to be explicit
/// llvm code if it wants to. This is useful for turning simple inline asms		/// llvm code if it wants to. This is useful for turning simple inline asms
/// into LLVM intrinsics, which gives the compiler more information about the		/// into LLVM intrinsics, which gives the compiler more information about the
/// behavior of the code.		/// behavior of the code.
virtual bool ExpandInlineAsm(CallInst *) const {		virtual bool ExpandInlineAsm(CallInst *) const { return false; }
		Lint: Pre-merge checks Inline Actions clang-tidy: warning: invalid case style for function 'ExpandInlineAsm' [readability-identifier-naming] not useful Lint: Pre-merge checks: clang-tidy: warning: invalid case style for function 'ExpandInlineAsm' [readability-identifier…
return false;
}

enum ConstraintType {		enum ConstraintType {
C_Register, // Constraint represents specific register(s).		C_Register, // Constraint represents specific register(s).
C_RegisterClass, // Constraint represents any of register(s) in class.		C_RegisterClass, // Constraint represents any of register(s) in class.
C_Memory, // Memory constraint.		C_Memory, // Memory constraint.
C_Immediate, // Requires an immediate.		C_Immediate, // Requires an immediate.
C_Other, // Something else.		C_Other, // Something else.
C_Unknown // Unsupported constraint.		C_Unknown // Unsupported constraint.
};		};

enum ConstraintWeight {		enum ConstraintWeight {
// Generic weights.		// Generic weights.
CW_Invalid = -1, // No match.		CW_Invalid = -1, // No match.
CW_Okay = 0, // Acceptable.		CW_Okay = 0, // Acceptable.
CW_Good = 1, // Good weight.		CW_Good = 1, // Good weight.
CW_Better = 2, // Better weight.		CW_Better = 2, // Better weight.
CW_Best = 3, // Best weight.		CW_Best = 3, // Best weight.

// Well-known weights.		// Well-known weights.
CW_SpecificReg = CW_Okay, // Specific register operands.		CW_SpecificReg = CW_Okay, // Specific register operands.
CW_Register = CW_Good, // Register operands.		CW_Register = CW_Good, // Register operands.
CW_Memory = CW_Better, // Memory operands.		CW_Memory = CW_Better, // Memory operands.
CW_Constant = CW_Best, // Constant operand.		CW_Constant = CW_Best, // Constant operand.
CW_Default = CW_Okay // Default or don't know type.		CW_Default = CW_Okay // Default or don't know type.
};		};

/// This contains information for each constraint that we are lowering.		/// This contains information for each constraint that we are lowering.
struct AsmOperandInfo : public InlineAsm::ConstraintInfo {		struct AsmOperandInfo : public InlineAsm::ConstraintInfo {
/// This contains the actual string for the code, like "m". TargetLowering		/// This contains the actual string for the code, like "m". TargetLowering
/// picks the 'best' code from ConstraintInfo::Codes that most closely		/// picks the 'best' code from ConstraintInfo::Codes that most closely
/// matches the operand.		/// matches the operand.
std::string ConstraintCode;		std::string ConstraintCode;
Show All 30 Lines	public:
/// operand values. If this returns an empty vector, and if the constraint		/// operand values. If this returns an empty vector, and if the constraint
/// string itself isn't empty, there was an error parsing.		/// string itself isn't empty, there was an error parsing.
virtual AsmOperandInfoVector ParseConstraints(const DataLayout &DL,		virtual AsmOperandInfoVector ParseConstraints(const DataLayout &DL,
const TargetRegisterInfo *TRI,		const TargetRegisterInfo *TRI,
const CallBase &Call) const;		const CallBase &Call) const;

/// Examine constraint type and operand type and determine a weight value.		/// Examine constraint type and operand type and determine a weight value.
/// The operand object must already have been set up with the operand type.		/// The operand object must already have been set up with the operand type.
virtual ConstraintWeight getMultipleConstraintMatchWeight(		virtual ConstraintWeight
AsmOperandInfo &info, int maIndex) const;		getMultipleConstraintMatchWeight(AsmOperandInfo &info, int maIndex) const;
		Lint: Pre-merge checks Inline Actions clang-tidy: warning: invalid case style for parameter 'info' [readability-identifier-naming] not useful clang-tidy: warning: invalid case style for parameter 'maIndex' [readability-identifier-naming] not useful Lint: Pre-merge checks: clang-tidy: warning: invalid case style for parameter 'info' [readability-identifier-naming]…

/// Examine constraint string and operand type and determine a weight value.		/// Examine constraint string and operand type and determine a weight value.
/// The operand object must already have been set up with the operand type.		/// The operand object must already have been set up with the operand type.
virtual ConstraintWeight getSingleConstraintMatchWeight(		virtual ConstraintWeight
AsmOperandInfo &info, const char *constraint) const;		getSingleConstraintMatchWeight(AsmOperandInfo &info,
		Lint: Pre-merge checks Inline Actions clang-tidy: warning: invalid case style for parameter 'info' [readability-identifier-naming] not useful Lint: Pre-merge checks: clang-tidy: warning: invalid case style for parameter 'info' [readability-identifier-naming]…
		const char *constraint) const;
		Lint: Pre-merge checks Inline Actions clang-tidy: warning: invalid case style for parameter 'constraint' [readability-identifier-naming] not useful Lint: Pre-merge checks: clang-tidy: warning: invalid case style for parameter 'constraint' [readability-identifier…

/// Determines the constraint code and constraint type to use for the specific		/// Determines the constraint code and constraint type to use for the specific
/// AsmOperandInfo, setting OpInfo.ConstraintCode and OpInfo.ConstraintType.		/// AsmOperandInfo, setting OpInfo.ConstraintCode and OpInfo.ConstraintType.
/// If the actual operand being passed in is available, it can be passed in as		/// If the actual operand being passed in is available, it can be passed in as
/// Op, otherwise an empty SDValue can be passed.		/// Op, otherwise an empty SDValue can be passed.
virtual void ComputeConstraintToUse(AsmOperandInfo &OpInfo,		virtual void ComputeConstraintToUse(AsmOperandInfo &OpInfo, SDValue Op,
		Lint: Pre-merge checks Inline Actions clang-tidy: warning: invalid case style for function 'ComputeConstraintToUse' [readability-identifier-naming] not useful Lint: Pre-merge checks: clang-tidy: warning: invalid case style for function 'ComputeConstraintToUse' [readability…
SDValue Op,
SelectionDAG *DAG = nullptr) const;		SelectionDAG *DAG = nullptr) const;

/// Given a constraint, return the type of constraint it is for this target.		/// Given a constraint, return the type of constraint it is for this target.
virtual ConstraintType getConstraintType(StringRef Constraint) const;		virtual ConstraintType getConstraintType(StringRef Constraint) const;

/// Given a physical register constraint (e.g. {edx}), return the register		/// Given a physical register constraint (e.g. {edx}), return the register
/// number and the register class for the register.		/// number and the register class for the register.
///		///
Show All 28 Lines
virtual SDValue LowerAsmOutputForConstraint(SDValue &Chain, SDValue &Flag,		virtual SDValue LowerAsmOutputForConstraint(SDValue &Chain, SDValue &Flag,
const SDLoc &DL,		const SDLoc &DL,
const AsmOperandInfo &OpInfo,		const AsmOperandInfo &OpInfo,
SelectionDAG &DAG) const;		SelectionDAG &DAG) const;

//===--------------------------------------------------------------------===//		//===--------------------------------------------------------------------===//
// Div utility functions		// Div utility functions
//		//
SDValue BuildSDIV(SDNode *N, SelectionDAG &DAG, bool IsAfterLegalization,		SDValue BuildSDIV(SDNode *N, SelectionDAG &DAG, bool IsAfterOpLegalization,
		Lint: Pre-merge checks Inline Actions clang-tidy: warning: invalid case style for function 'BuildSDIV' [readability-identifier-naming] not useful Lint: Pre-merge checks: clang-tidy: warning: invalid case style for function 'BuildSDIV' [readability-identifier…
		bool IsAfterTyLegalization,
SmallVectorImpl<SDNode *> &Created) const;		SmallVectorImpl<SDNode *> &Created) const;
SDValue BuildUDIV(SDNode *N, SelectionDAG &DAG, bool IsAfterLegalization,		SDValue BuildUDIV(SDNode *N, SelectionDAG &DAG, bool IsAfterOpLegalization,
		Lint: Pre-merge checks Inline Actions clang-tidy: warning: invalid case style for function 'BuildUDIV' [readability-identifier-naming] not useful Lint: Pre-merge checks: clang-tidy: warning: invalid case style for function 'BuildUDIV' [readability-identifier…
		bool IsAfterTyLegalization,
SmallVectorImpl<SDNode *> &Created) const;		SmallVectorImpl<SDNode *> &Created) const;

/// Targets may override this function to provide custom SDIV lowering for		/// Targets may override this function to provide custom SDIV lowering for
/// power-of-2 denominators. If the target returns an empty SDValue, LLVM		/// power-of-2 denominators. If the target returns an empty SDValue, LLVM
/// assumes SDIV is expensive and replaces it with a series of other integer		/// assumes SDIV is expensive and replaces it with a series of other integer
/// operations.		/// operations.
virtual SDValue BuildSDIVPow2(SDNode *N, const APInt &Divisor,		virtual SDValue BuildSDIVPow2(SDNode *N, const APInt &Divisor,
SelectionDAG &DAG,		SelectionDAG &DAG,
SmallVectorImpl<SDNode *> &Created) const;		SmallVectorImpl<SDNode *> &Created) const;

/// Indicate whether this target prefers to combine FDIVs with the same		/// Indicate whether this target prefers to combine FDIVs with the same
/// divisor. If the transform should never be done, return zero. If the		/// divisor. If the transform should never be done, return zero. If the
/// transform should be done, return the minimum number of divisor uses		/// transform should be done, return the minimum number of divisor uses
/// that must exist.		/// that must exist.
virtual unsigned combineRepeatedFPDivisors() const {		virtual unsigned combineRepeatedFPDivisors() const { return 0; }
return 0;
}

/// Hooks for building estimates in place of slower divisions and square		/// Hooks for building estimates in place of slower divisions and square
/// roots.		/// roots.

/// Return either a square root or its reciprocal estimate value for the input		/// Return either a square root or its reciprocal estimate value for the input
/// operand.		/// operand.
/// \p Enabled is a ReciprocalEstimate enum with value either 'Unspecified' or		/// \p Enabled is a ReciprocalEstimate enum with value either 'Unspecified' or
/// 'Enabled' as set by a potential default override attribute.		/// 'Enabled' as set by a potential default override attribute.
▲ Show 20 Lines • Show All 178 Lines • ▼ Show 20 Lines
/// Method for building the DAG expansion of ISD::[U\|S]MULFIX[SAT]. This		/// Method for building the DAG expansion of ISD::[U\|S]MULFIX[SAT]. This
/// method accepts integers as its arguments.		/// method accepts integers as its arguments.
SDValue expandFixedPointMul(SDNode *Node, SelectionDAG &DAG) const;		SDValue expandFixedPointMul(SDNode *Node, SelectionDAG &DAG) const;

/// Method for building the DAG expansion of ISD::[US]DIVFIX[SAT]. This		/// Method for building the DAG expansion of ISD::[US]DIVFIX[SAT]. This
/// method accepts integers as its arguments.		/// method accepts integers as its arguments.
/// Note: This method may fail if the division could not be performed		/// Note: This method may fail if the division could not be performed
/// within the type. Clients must retry with a wider type if this happens.		/// within the type. Clients must retry with a wider type if this happens.
SDValue expandFixedPointDiv(unsigned Opcode, const SDLoc &dl,		SDValue expandFixedPointDiv(unsigned Opcode, const SDLoc &dl, SDValue LHS,
		Lint: Pre-merge checks Inline Actions clang-tidy: warning: invalid case style for parameter 'dl' [readability-identifier-naming] not useful Lint: Pre-merge checks: clang-tidy: warning: invalid case style for parameter 'dl' [readability-identifier-naming]…
SDValue LHS, SDValue RHS,		SDValue RHS, unsigned Scale,
unsigned Scale, SelectionDAG &DAG) const;		SelectionDAG &DAG) const;

/// Method for building the DAG expansion of ISD::U(ADD\|SUB)O. Expansion		/// Method for building the DAG expansion of ISD::U(ADD\|SUB)O. Expansion
/// always suceeds and populates the Result and Overflow arguments.		/// always suceeds and populates the Result and Overflow arguments.
void expandUADDSUBO(SDNode *Node, SDValue &Result, SDValue &Overflow,		void expandUADDSUBO(SDNode *Node, SDValue &Result, SDValue &Overflow,
SelectionDAG &DAG) const;		SelectionDAG &DAG) const;

/// Method for building the DAG expansion of ISD::S(ADD\|SUB)O. Expansion		/// Method for building the DAG expansion of ISD::S(ADD\|SUB)O. Expansion
/// always suceeds and populates the Result and Overflow arguments.		/// always suceeds and populates the Result and Overflow arguments.
Show All 32 Lines
/// the 'hasPostISelHook' flag. These instructions must be adjusted after		/// the 'hasPostISelHook' flag. These instructions must be adjusted after
/// instruction selection by target hooks. e.g. To fill in optional defs for		/// instruction selection by target hooks. e.g. To fill in optional defs for
/// ARM 's' setting instructions.		/// ARM 's' setting instructions.
virtual void AdjustInstrPostInstrSelection(MachineInstr &MI,		virtual void AdjustInstrPostInstrSelection(MachineInstr &MI,
SDNode *Node) const;		SDNode *Node) const;

/// If this function returns true, SelectionDAGBuilder emits a		/// If this function returns true, SelectionDAGBuilder emits a
/// LOAD_STACK_GUARD node when it is lowering Intrinsic::stackprotector.		/// LOAD_STACK_GUARD node when it is lowering Intrinsic::stackprotector.
virtual bool useLoadStackGuardNode() const {		virtual bool useLoadStackGuardNode() const { return false; }
return false;
}

virtual SDValue emitStackGuardXorFP(SelectionDAG &DAG, SDValue Val,		virtual SDValue emitStackGuardXorFP(SelectionDAG &DAG, SDValue Val,
const SDLoc &DL) const {		const SDLoc &DL) const {
llvm_unreachable("not implemented for this target");		llvm_unreachable("not implemented for this target");
}		}

/// Lower TLS global address SDNode for target independent emulated TLS model.		/// Lower TLS global address SDNode for target independent emulated TLS model.
virtual SDValue LowerToTLSEmulatedModel(const GlobalAddressSDNode *GA,		virtual SDValue LowerToTLSEmulatedModel(const GlobalAddressSDNode *GA,
SelectionDAG &DAG) const;		SelectionDAG &DAG) const;

/// Expands target specific indirect branch for the case of JumpTable		/// Expands target specific indirect branch for the case of JumpTable
/// expanasion.		/// expanasion.
virtual SDValue expandIndirectJTBranch(const SDLoc& dl, SDValue Value, SDValue Addr,		virtual SDValue expandIndirectJTBranch(const SDLoc &dl, SDValue Value,
		Lint: Pre-merge checks Inline Actions clang-tidy: warning: invalid case style for parameter 'dl' [readability-identifier-naming] not useful Lint: Pre-merge checks: clang-tidy: warning: invalid case style for parameter 'dl' [readability-identifier-naming]…
		SDValue Addr,
SelectionDAG &DAG) const {		SelectionDAG &DAG) const {
return DAG.getNode(ISD::BRIND, dl, MVT::Other, Value, Addr);		return DAG.getNode(ISD::BRIND, dl, MVT::Other, Value, Addr);
}		}

// seteq(x, 0) -> truncate(srl(ctlz(zext(x)), log2(#bits)))		// seteq(x, 0) -> truncate(srl(ctlz(zext(x)), log2(#bits)))
// If we're comparing for equality to zero and isCtlzFast is true, expose the		// If we're comparing for equality to zero and isCtlzFast is true, expose the
// fact that this can be implemented as a ctlz/srl pair, so that the dag		// fact that this can be implemented as a ctlz/srl pair, so that the dag
// combiner can fold the new nodes.		// combiner can fold the new nodes.
▲ Show 20 Lines • Show All 45 Lines • Show Last 20 Lines

llvm/lib/CodeGen/SelectionDAG/DAGCombiner.cpp

This file is larger than 256 KB, so syntax highlighting is disabled by default.

	Show First 20 Lines • Show All 21,615 Lines • ▼ Show 20 Lines
	/// Ref: "Hacker's Delight" or "The PowerPC Compiler Writer's Guide".			/// Ref: "Hacker's Delight" or "The PowerPC Compiler Writer's Guide".
	SDValue DAGCombiner::BuildSDIV(SDNode *N) {			SDValue DAGCombiner::BuildSDIV(SDNode *N) {
	// when optimising for minimum size, we don't want to expand a div to a mul			// when optimising for minimum size, we don't want to expand a div to a mul
	// and a shift.			// and a shift.
	if (DAG.getMachineFunction().getFunction().hasMinSize())			if (DAG.getMachineFunction().getFunction().hasMinSize())
	return SDValue();			return SDValue();

	SmallVector<SDNode *, 8> Built;			SmallVector<SDNode *, 8> Built;
	if (SDValue S = TLI.BuildSDIV(N, DAG, LegalOperations, Built)) {			if (SDValue S = TLI.BuildSDIV(N, DAG, LegalOperations, LegalTypes, Built)) {
	for (SDNode *N : Built)			for (SDNode *N : Built)
	AddToWorklist(N);			AddToWorklist(N);
	return S;			return S;
	}			}

	return SDValue();			return SDValue();
	}			}

	Show All 24 Lines
	/// Ref: "Hacker's Delight" or "The PowerPC Compiler Writer's Guide".			/// Ref: "Hacker's Delight" or "The PowerPC Compiler Writer's Guide".
	SDValue DAGCombiner::BuildUDIV(SDNode *N) {			SDValue DAGCombiner::BuildUDIV(SDNode *N) {
	// when optimising for minimum size, we don't want to expand a div to a mul			// when optimising for minimum size, we don't want to expand a div to a mul
	// and a shift.			// and a shift.
	if (DAG.getMachineFunction().getFunction().hasMinSize())			if (DAG.getMachineFunction().getFunction().hasMinSize())
	return SDValue();			return SDValue();

	SmallVector<SDNode *, 8> Built;			SmallVector<SDNode *, 8> Built;
	if (SDValue S = TLI.BuildUDIV(N, DAG, LegalOperations, Built)) {			if (SDValue S = TLI.BuildUDIV(N, DAG, LegalOperations, LegalTypes, Built)) {
	for (SDNode *N : Built)			for (SDNode *N : Built)
	AddToWorklist(N);			AddToWorklist(N);
	return S;			return S;
	}			}

	return SDValue();			return SDValue();
	}			}

	▲ Show 20 Lines • Show All 662 Lines • Show Last 20 Lines

llvm/lib/CodeGen/SelectionDAG/TargetLowering.cpp

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 69 Lines • ▼ Show 20 Lines	bool TargetLowering::isInTailCallPosition(SelectionDAG &DAG, SDNode *Node,
if (CallerAttrs.hasAttribute(AttributeList::ReturnIndex, Attribute::ZExt) \|\|		if (CallerAttrs.hasAttribute(AttributeList::ReturnIndex, Attribute::ZExt) \|\|
CallerAttrs.hasAttribute(AttributeList::ReturnIndex, Attribute::SExt))		CallerAttrs.hasAttribute(AttributeList::ReturnIndex, Attribute::SExt))
return false;		return false;

// Check if the only use is a function return node.		// Check if the only use is a function return node.
return isUsedByReturnOnly(Node, Chain);		return isUsedByReturnOnly(Node, Chain);
}		}

bool TargetLowering::parametersInCSRMatch(const MachineRegisterInfo &MRI,		bool TargetLowering::parametersInCSRMatch(
const uint32_t *CallerPreservedMask,		const MachineRegisterInfo &MRI, const uint32_t *CallerPreservedMask,
const SmallVectorImpl<CCValAssign> &ArgLocs,		const SmallVectorImpl<CCValAssign> &ArgLocs,
const SmallVectorImpl<SDValue> &OutVals) const {		const SmallVectorImpl<SDValue> &OutVals) const {
for (unsigned I = 0, E = ArgLocs.size(); I != E; ++I) {		for (unsigned I = 0, E = ArgLocs.size(); I != E; ++I) {
const CCValAssign &ArgLoc = ArgLocs[I];		const CCValAssign &ArgLoc = ArgLocs[I];
if (!ArgLoc.isRegLoc())		if (!ArgLoc.isRegLoc())
continue;		continue;
MCRegister Reg = ArgLoc.getLocReg();		MCRegister Reg = ArgLoc.getLocReg();
// Only look at callee saved registers.		// Only look at callee saved registers.
Show All 33 Lines	if (IsByVal)
ByValType = Call->getParamByValType(ArgIdx);		ByValType = Call->getParamByValType(ArgIdx);
PreallocatedType = nullptr;		PreallocatedType = nullptr;
if (IsPreallocated)		if (IsPreallocated)
PreallocatedType = Call->getParamPreallocatedType(ArgIdx);		PreallocatedType = Call->getParamPreallocatedType(ArgIdx);
}		}

/// Generate a libcall taking the given operands as arguments and returning a		/// Generate a libcall taking the given operands as arguments and returning a
/// result of type RetVT.		/// result of type RetVT.
std::pair<SDValue, SDValue>		std::pair<SDValue, SDValue> TargetLowering::makeLibCall(
TargetLowering::makeLibCall(SelectionDAG &DAG, RTLIB::Libcall LC, EVT RetVT,		SelectionDAG &DAG, RTLIB::Libcall LC, EVT RetVT, ArrayRef<SDValue> Ops,
ArrayRef<SDValue> Ops,		MakeLibCallOptions CallOptions, const SDLoc &dl, SDValue InChain) const {
		Lint: Pre-merge checks Inline Actions clang-tidy: warning: invalid case style for parameter 'dl' [readability-identifier-naming] not useful Lint: Pre-merge checks: clang-tidy: warning: invalid case style for parameter 'dl' [readability-identifier-naming]…
MakeLibCallOptions CallOptions,
const SDLoc &dl,
SDValue InChain) const {
if (!InChain)		if (!InChain)
InChain = DAG.getEntryNode();		InChain = DAG.getEntryNode();

TargetLowering::ArgListTy Args;		TargetLowering::ArgListTy Args;
Args.reserve(Ops.size());		Args.reserve(Ops.size());

TargetLowering::ArgListEntry Entry;		TargetLowering::ArgListEntry Entry;
for (unsigned i = 0; i < Ops.size(); ++i) {		for (unsigned i = 0; i < Ops.size(); ++i) {
SDValue NewOp = Ops[i];		SDValue NewOp = Ops[i];
Entry.Node = NewOp;		Entry.Node = NewOp;
Entry.Ty = Entry.Node.getValueType().getTypeForEVT(*DAG.getContext());		Entry.Ty = Entry.Node.getValueType().getTypeForEVT(*DAG.getContext());
Entry.IsSExt = shouldSignExtendTypeInLibCall(NewOp.getValueType(),		Entry.IsSExt =
CallOptions.IsSExt);		shouldSignExtendTypeInLibCall(NewOp.getValueType(), CallOptions.IsSExt);
Entry.IsZExt = !Entry.IsSExt;		Entry.IsZExt = !Entry.IsSExt;

if (CallOptions.IsSoften &&		if (CallOptions.IsSoften &&
!shouldExtendTypeInLibCall(CallOptions.OpsVTBeforeSoften[i])) {		!shouldExtendTypeInLibCall(CallOptions.OpsVTBeforeSoften[i])) {
Entry.IsSExt = Entry.IsZExt = false;		Entry.IsSExt = Entry.IsZExt = false;
}		}
Args.push_back(Entry);		Args.push_back(Entry);
}		}
▲ Show 20 Lines • Show All 113 Lines • ▼ Show 20 Lines	bool TargetLowering::findOptimalMemOpLowering(

return true;		return true;
}		}

/// Soften the operands of a comparison. This code is shared among BR_CC,		/// Soften the operands of a comparison. This code is shared among BR_CC,
/// SELECT_CC, and SETCC handlers.		/// SELECT_CC, and SETCC handlers.
void TargetLowering::softenSetCCOperands(SelectionDAG &DAG, EVT VT,		void TargetLowering::softenSetCCOperands(SelectionDAG &DAG, EVT VT,
SDValue &NewLHS, SDValue &NewRHS,		SDValue &NewLHS, SDValue &NewRHS,
ISD::CondCode &CCCode,		ISD::CondCode &CCCode, const SDLoc &dl,
		Lint: Pre-merge checks Inline Actions clang-tidy: warning: invalid case style for parameter 'dl' [readability-identifier-naming] not useful Lint: Pre-merge checks: clang-tidy: warning: invalid case style for parameter 'dl' [readability-identifier-naming]…
const SDLoc &dl, const SDValue OldLHS,		const SDValue OldLHS,
const SDValue OldRHS) const {		const SDValue OldRHS) const {
SDValue Chain;		SDValue Chain;
return softenSetCCOperands(DAG, VT, NewLHS, NewRHS, CCCode, dl, OldLHS,		return softenSetCCOperands(DAG, VT, NewLHS, NewRHS, CCCode, dl, OldLHS,
OldRHS, Chain);		OldRHS, Chain);
}		}

void TargetLowering::softenSetCCOperands(SelectionDAG &DAG, EVT VT,		void TargetLowering::softenSetCCOperands(SelectionDAG &DAG, EVT VT,
SDValue &NewLHS, SDValue &NewRHS,		SDValue &NewLHS, SDValue &NewRHS,
ISD::CondCode &CCCode,		ISD::CondCode &CCCode, const SDLoc &dl,
		Lint: Pre-merge checks Inline Actions clang-tidy: warning: invalid case style for parameter 'dl' [readability-identifier-naming] not useful Lint: Pre-merge checks: clang-tidy: warning: invalid case style for parameter 'dl' [readability-identifier-naming]…
const SDLoc &dl, const SDValue OldLHS,		const SDValue OldLHS,
const SDValue OldRHS,		const SDValue OldRHS, SDValue &Chain,
SDValue &Chain,
bool IsSignaling) const {		bool IsSignaling) const {
// FIXME: Currently we cannot really respect all IEEE predicates due to libgcc		// FIXME: Currently we cannot really respect all IEEE predicates due to libgcc
// not supporting it. We can update this code when libgcc provides such		// not supporting it. We can update this code when libgcc provides such
// functions.		// functions.

assert((VT == MVT::f32 \|\| VT == MVT::f64 \|\| VT == MVT::f128 \|\| VT == MVT::ppcf128)		assert((VT == MVT::f32 \|\| VT == MVT::f64 \|\| VT == MVT::f128 \|\|
&& "Unsupported setcc type!");		VT == MVT::ppcf128) &&
		"Unsupported setcc type!");

// Expand into one or more soft-fp libcall(s).		// Expand into one or more soft-fp libcall(s).
RTLIB::Libcall LC1 = RTLIB::UNKNOWN_LIBCALL, LC2 = RTLIB::UNKNOWN_LIBCALL;		RTLIB::Libcall LC1 = RTLIB::UNKNOWN_LIBCALL, LC2 = RTLIB::UNKNOWN_LIBCALL;
bool ShouldInvertCC = false;		bool ShouldInvertCC = false;
switch (CCCode) {		switch (CCCode) {
case ISD::SETEQ:		case ISD::SETEQ:
case ISD::SETOEQ:		case ISD::SETOEQ:
LC1 = (VT == MVT::f32) ? RTLIB::OEQ_F32 :		LC1 = (VT == MVT::f32)
(VT == MVT::f64) ? RTLIB::OEQ_F64 :		? RTLIB::OEQ_F32
(VT == MVT::f128) ? RTLIB::OEQ_F128 : RTLIB::OEQ_PPCF128;		: (VT == MVT::f64)
		? RTLIB::OEQ_F64
		: (VT == MVT::f128) ? RTLIB::OEQ_F128 : RTLIB::OEQ_PPCF128;
break;		break;
case ISD::SETNE:		case ISD::SETNE:
case ISD::SETUNE:		case ISD::SETUNE:
LC1 = (VT == MVT::f32) ? RTLIB::UNE_F32 :		LC1 = (VT == MVT::f32)
(VT == MVT::f64) ? RTLIB::UNE_F64 :		? RTLIB::UNE_F32
(VT == MVT::f128) ? RTLIB::UNE_F128 : RTLIB::UNE_PPCF128;		: (VT == MVT::f64)
		? RTLIB::UNE_F64
		: (VT == MVT::f128) ? RTLIB::UNE_F128 : RTLIB::UNE_PPCF128;
break;		break;
case ISD::SETGE:		case ISD::SETGE:
case ISD::SETOGE:		case ISD::SETOGE:
LC1 = (VT == MVT::f32) ? RTLIB::OGE_F32 :		LC1 = (VT == MVT::f32)
(VT == MVT::f64) ? RTLIB::OGE_F64 :		? RTLIB::OGE_F32
(VT == MVT::f128) ? RTLIB::OGE_F128 : RTLIB::OGE_PPCF128;		: (VT == MVT::f64)
		? RTLIB::OGE_F64
		: (VT == MVT::f128) ? RTLIB::OGE_F128 : RTLIB::OGE_PPCF128;
break;		break;
case ISD::SETLT:		case ISD::SETLT:
case ISD::SETOLT:		case ISD::SETOLT:
LC1 = (VT == MVT::f32) ? RTLIB::OLT_F32 :		LC1 = (VT == MVT::f32)
(VT == MVT::f64) ? RTLIB::OLT_F64 :		? RTLIB::OLT_F32
(VT == MVT::f128) ? RTLIB::OLT_F128 : RTLIB::OLT_PPCF128;		: (VT == MVT::f64)
		? RTLIB::OLT_F64
		: (VT == MVT::f128) ? RTLIB::OLT_F128 : RTLIB::OLT_PPCF128;
break;		break;
case ISD::SETLE:		case ISD::SETLE:
case ISD::SETOLE:		case ISD::SETOLE:
LC1 = (VT == MVT::f32) ? RTLIB::OLE_F32 :		LC1 = (VT == MVT::f32)
(VT == MVT::f64) ? RTLIB::OLE_F64 :		? RTLIB::OLE_F32
(VT == MVT::f128) ? RTLIB::OLE_F128 : RTLIB::OLE_PPCF128;		: (VT == MVT::f64)
		? RTLIB::OLE_F64
		: (VT == MVT::f128) ? RTLIB::OLE_F128 : RTLIB::OLE_PPCF128;
break;		break;
case ISD::SETGT:		case ISD::SETGT:
case ISD::SETOGT:		case ISD::SETOGT:
LC1 = (VT == MVT::f32) ? RTLIB::OGT_F32 :		LC1 = (VT == MVT::f32)
(VT == MVT::f64) ? RTLIB::OGT_F64 :		? RTLIB::OGT_F32
(VT == MVT::f128) ? RTLIB::OGT_F128 : RTLIB::OGT_PPCF128;		: (VT == MVT::f64)
		? RTLIB::OGT_F64
		: (VT == MVT::f128) ? RTLIB::OGT_F128 : RTLIB::OGT_PPCF128;
break;		break;
case ISD::SETO:		case ISD::SETO:
ShouldInvertCC = true;		ShouldInvertCC = true;
LLVM_FALLTHROUGH;		LLVM_FALLTHROUGH;
case ISD::SETUO:		case ISD::SETUO:
LC1 = (VT == MVT::f32) ? RTLIB::UO_F32 :		LC1 = (VT == MVT::f32)
(VT == MVT::f64) ? RTLIB::UO_F64 :		? RTLIB::UO_F32
(VT == MVT::f128) ? RTLIB::UO_F128 : RTLIB::UO_PPCF128;		: (VT == MVT::f64)
		? RTLIB::UO_F64
		: (VT == MVT::f128) ? RTLIB::UO_F128 : RTLIB::UO_PPCF128;
break;		break;
case ISD::SETONE:		case ISD::SETONE:
// SETONE = O && UNE		// SETONE = O && UNE
ShouldInvertCC = true;		ShouldInvertCC = true;
LLVM_FALLTHROUGH;		LLVM_FALLTHROUGH;
case ISD::SETUEQ:		case ISD::SETUEQ:
LC1 = (VT == MVT::f32) ? RTLIB::UO_F32 :		LC1 = (VT == MVT::f32)
(VT == MVT::f64) ? RTLIB::UO_F64 :		? RTLIB::UO_F32
(VT == MVT::f128) ? RTLIB::UO_F128 : RTLIB::UO_PPCF128;		: (VT == MVT::f64)
LC2 = (VT == MVT::f32) ? RTLIB::OEQ_F32 :		? RTLIB::UO_F64
(VT == MVT::f64) ? RTLIB::OEQ_F64 :		: (VT == MVT::f128) ? RTLIB::UO_F128 : RTLIB::UO_PPCF128;
(VT == MVT::f128) ? RTLIB::OEQ_F128 : RTLIB::OEQ_PPCF128;		LC2 = (VT == MVT::f32)
		? RTLIB::OEQ_F32
		: (VT == MVT::f64)
		? RTLIB::OEQ_F64
		: (VT == MVT::f128) ? RTLIB::OEQ_F128 : RTLIB::OEQ_PPCF128;
break;		break;
default:		default:
// Invert CC for unordered comparisons		// Invert CC for unordered comparisons
ShouldInvertCC = true;		ShouldInvertCC = true;
switch (CCCode) {		switch (CCCode) {
case ISD::SETULT:		case ISD::SETULT:
LC1 = (VT == MVT::f32) ? RTLIB::OGE_F32 :		LC1 = (VT == MVT::f32)
(VT == MVT::f64) ? RTLIB::OGE_F64 :		? RTLIB::OGE_F32
(VT == MVT::f128) ? RTLIB::OGE_F128 : RTLIB::OGE_PPCF128;		: (VT == MVT::f64) ? RTLIB::OGE_F64
		: (VT == MVT::f128) ? RTLIB::OGE_F128
		: RTLIB::OGE_PPCF128;
break;		break;
case ISD::SETULE:		case ISD::SETULE:
LC1 = (VT == MVT::f32) ? RTLIB::OGT_F32 :		LC1 = (VT == MVT::f32)
(VT == MVT::f64) ? RTLIB::OGT_F64 :		? RTLIB::OGT_F32
(VT == MVT::f128) ? RTLIB::OGT_F128 : RTLIB::OGT_PPCF128;		: (VT == MVT::f64) ? RTLIB::OGT_F64
		: (VT == MVT::f128) ? RTLIB::OGT_F128
		: RTLIB::OGT_PPCF128;
break;		break;
case ISD::SETUGT:		case ISD::SETUGT:
LC1 = (VT == MVT::f32) ? RTLIB::OLE_F32 :		LC1 = (VT == MVT::f32)
(VT == MVT::f64) ? RTLIB::OLE_F64 :		? RTLIB::OLE_F32
(VT == MVT::f128) ? RTLIB::OLE_F128 : RTLIB::OLE_PPCF128;		: (VT == MVT::f64) ? RTLIB::OLE_F64
		: (VT == MVT::f128) ? RTLIB::OLE_F128
		: RTLIB::OLE_PPCF128;
break;		break;
case ISD::SETUGE:		case ISD::SETUGE:
LC1 = (VT == MVT::f32) ? RTLIB::OLT_F32 :		LC1 = (VT == MVT::f32)
(VT == MVT::f64) ? RTLIB::OLT_F64 :		? RTLIB::OLT_F32
(VT == MVT::f128) ? RTLIB::OLT_F128 : RTLIB::OLT_PPCF128;		: (VT == MVT::f64) ? RTLIB::OLT_F64
		: (VT == MVT::f128) ? RTLIB::OLT_F128
		: RTLIB::OLT_PPCF128;
break;		break;
default: llvm_unreachable("Do not know how to soften this setcc!");		default:
		llvm_unreachable("Do not know how to soften this setcc!");
}		}
}		}

// Use the target specific return value for comparions lib calls.		// Use the target specific return value for comparions lib calls.
EVT RetVT = getCmpLibcallReturnType();		EVT RetVT = getCmpLibcallReturnType();
SDValue Ops[2] = {NewLHS, NewRHS};		SDValue Ops[2] = {NewLHS, NewRHS};
TargetLowering::MakeLibCallOptions CallOptions;		TargetLowering::MakeLibCallOptions CallOptions;
EVT OpsVT[2] = { OldLHS.getValueType(),		EVT OpsVT[2] = {OldLHS.getValueType(), OldRHS.getValueType()};
OldRHS.getValueType() };
CallOptions.setTypeListBeforeSoften(OpsVT, RetVT, true);		CallOptions.setTypeListBeforeSoften(OpsVT, RetVT, true);
auto Call = makeLibCall(DAG, LC1, RetVT, Ops, CallOptions, dl, Chain);		auto Call = makeLibCall(DAG, LC1, RetVT, Ops, CallOptions, dl, Chain);
NewLHS = Call.first;		NewLHS = Call.first;
NewRHS = DAG.getConstant(0, dl, RetVT);		NewRHS = DAG.getConstant(0, dl, RetVT);

CCCode = getCmpLibcallCC(LC1);		CCCode = getCmpLibcallCC(LC1);
if (ShouldInvertCC) {		if (ShouldInvertCC) {
assert(RetVT.isInteger());		assert(RetVT.isInteger());
▲ Show 20 Lines • Show All 45 Lines • ▼ Show 20 Lines	if ((JTEncoding == MachineJumpTableInfo::EK_GPRel64BlockAddress) \|\|
(JTEncoding == MachineJumpTableInfo::EK_GPRel32BlockAddress))		(JTEncoding == MachineJumpTableInfo::EK_GPRel32BlockAddress))
return DAG.getGLOBAL_OFFSET_TABLE(getPointerTy(DAG.getDataLayout()));		return DAG.getGLOBAL_OFFSET_TABLE(getPointerTy(DAG.getDataLayout()));

return Table;		return Table;
}		}

/// This returns the relocation base for the given PIC jumptable, the same as		/// This returns the relocation base for the given PIC jumptable, the same as
/// getPICJumpTableRelocBase, but as an MCExpr.		/// getPICJumpTableRelocBase, but as an MCExpr.
const MCExpr *		const MCExpr *TargetLowering::getPICJumpTableRelocBaseExpr(
TargetLowering::getPICJumpTableRelocBaseExpr(const MachineFunction *MF,		const MachineFunction *MF, unsigned JTI, MCContext &Ctx) const {
unsigned JTI,MCContext &Ctx) const{
// The normal PIC reloc base is the label at the start of the jump table.		// The normal PIC reloc base is the label at the start of the jump table.
return MCSymbolRefExpr::create(MF->getJTISymbol(JTI, Ctx), Ctx);		return MCSymbolRefExpr::create(MF->getJTISymbol(JTI, Ctx), Ctx);
}		}

bool		bool TargetLowering::isOffsetFoldingLegal(const GlobalAddressSDNode *GA) const {
TargetLowering::isOffsetFoldingLegal(const GlobalAddressSDNode *GA) const {
const TargetMachine &TM = getTargetMachine();		const TargetMachine &TM = getTargetMachine();
const GlobalValue *GV = GA->getGlobal();		const GlobalValue *GV = GA->getGlobal();

// If the address is not even local to this DSO we will have to load it from		// If the address is not even local to this DSO we will have to load it from
// a got and then add the offset.		// a got and then add the offset.
if (!TM.shouldAssumeDSOLocal(*GV->getParent(), GV))		if (!TM.shouldAssumeDSOLocal(*GV->getParent(), GV))
return false;		return false;

▲ Show 20 Lines • Show All 854 Lines • ▼ Show 20 Lines	if (ShrinkDemandedOp(Op, BitWidth, DemandedBits, TLO))
return true;		return true;

// If all of the unknown bits are known to be zero on one side or the other		// If all of the unknown bits are known to be zero on one side or the other
// turn this into an inclusive or.		// turn this into an inclusive or.
// e.g. (A & C1)^(B & C2) -> (A & C1)\|(B & C2) iff C1&C2 == 0		// e.g. (A & C1)^(B & C2) -> (A & C1)\|(B & C2) iff C1&C2 == 0
if (DemandedBits.isSubsetOf(Known.Zero \| Known2.Zero))		if (DemandedBits.isSubsetOf(Known.Zero \| Known2.Zero))
return TLO.CombineTo(Op, TLO.DAG.getNode(ISD::OR, dl, VT, Op0, Op1));		return TLO.CombineTo(Op, TLO.DAG.getNode(ISD::OR, dl, VT, Op0, Op1));

ConstantSDNode* C = isConstOrConstSplat(Op1, DemandedElts);		ConstantSDNode *C = isConstOrConstSplat(Op1, DemandedElts);
if (C) {		if (C) {
// If one side is a constant, and all of the set bits in the constant are		// If one side is a constant, and all of the set bits in the constant are
// also known set on the other side, turn this into an AND, as we know		// also known set on the other side, turn this into an AND, as we know
// the bits will be cleared.		// the bits will be cleared.
// e.g. (X \| C1) ^ C2 --> (X \| C1) & ~C2 iff (C1&C2) == C2		// e.g. (X \| C1) ^ C2 --> (X \| C1) & ~C2 iff (C1&C2) == C2
// NB: it is okay if more bits are known than are requested		// NB: it is okay if more bits are known than are requested
if (C->getAPIntValue() == Known2.One) {		if (C->getAPIntValue() == Known2.One) {
SDValue ANDC =		SDValue ANDC =
TLO.DAG.getConstant(~C->getAPIntValue() & DemandedBits, dl, VT);		TLO.DAG.getConstant(~C->getAPIntValue() & DemandedBits, dl, VT);
return TLO.CombineTo(Op, TLO.DAG.getNode(ISD::AND, dl, VT, Op0, ANDC));		return TLO.CombineTo(Op, TLO.DAG.getNode(ISD::AND, dl, VT, Op0, ANDC));
}		}

// If the RHS is a constant, see if we can change it. Don't alter a -1		// If the RHS is a constant, see if we can change it. Don't alter a -1
// constant because that's a 'not' op, and that is better for combining		// constant because that's a 'not' op, and that is better for combining
// and codegen.		// and codegen.
if (!C->isAllOnesValue() &&		if (!C->isAllOnesValue() && DemandedBits.isSubsetOf(C->getAPIntValue())) {
DemandedBits.isSubsetOf(C->getAPIntValue())) {
// We're flipping all demanded bits. Flip the undemanded bits too.		// We're flipping all demanded bits. Flip the undemanded bits too.
SDValue New = TLO.DAG.getNOT(dl, Op0, VT);		SDValue New = TLO.DAG.getNOT(dl, Op0, VT);
return TLO.CombineTo(Op, New);		return TLO.CombineTo(Op, New);
}		}
}		}

// If we can't turn this into a 'not', try to shrink the constant.		// If we can't turn this into a 'not', try to shrink the constant.
if (!C \|\| !C->isAllOnesValue())		if (!C \|\| !C->isAllOnesValue())
▲ Show 20 Lines • Show All 340 Lines • ▼ Show 20 Lines	if (ConstantSDNode *SA = isConstOrConstSplat(Op2, DemandedElts)) {
Known.Zero.lshrInPlace(IsFSHL ? (BitWidth - Amt) : Amt);		Known.Zero.lshrInPlace(IsFSHL ? (BitWidth - Amt) : Amt);
Known.One \|= Known2.One;		Known.One \|= Known2.One;
Known.Zero \|= Known2.Zero;		Known.Zero \|= Known2.Zero;
}		}

// For pow-2 bitwidths we only demand the bottom modulo amt bits.		// For pow-2 bitwidths we only demand the bottom modulo amt bits.
if (isPowerOf2_32(BitWidth)) {		if (isPowerOf2_32(BitWidth)) {
APInt DemandedAmtBits(Op2.getScalarValueSizeInBits(), BitWidth - 1);		APInt DemandedAmtBits(Op2.getScalarValueSizeInBits(), BitWidth - 1);
if (SimplifyDemandedBits(Op2, DemandedAmtBits, DemandedElts,		if (SimplifyDemandedBits(Op2, DemandedAmtBits, DemandedElts, Known2, TLO,
Known2, TLO, Depth + 1))		Depth + 1))
return true;		return true;
}		}
break;		break;
}		}
case ISD::ROTL:		case ISD::ROTL:
case ISD::ROTR: {		case ISD::ROTR: {
SDValue Op0 = Op.getOperand(0);		SDValue Op0 = Op.getOperand(0);
SDValue Op1 = Op.getOperand(1);		SDValue Op1 = Op.getOperand(1);
Show All 31 Lines	case ISD::BSWAP: {
Known.Zero = Known2.Zero.byteSwap();		Known.Zero = Known2.Zero.byteSwap();
break;		break;
}		}
case ISD::CTPOP: {		case ISD::CTPOP: {
// If only 1 bit is demanded, replace with PARITY as long as we're before		// If only 1 bit is demanded, replace with PARITY as long as we're before
// op legalization.		// op legalization.
// FIXME: Limit to scalars for now.		// FIXME: Limit to scalars for now.
if (DemandedBits.isOneValue() && !TLO.LegalOps && !VT.isVector())		if (DemandedBits.isOneValue() && !TLO.LegalOps && !VT.isVector())
return TLO.CombineTo(Op, TLO.DAG.getNode(ISD::PARITY, dl, VT,		return TLO.CombineTo(
Op.getOperand(0)));		Op, TLO.DAG.getNode(ISD::PARITY, dl, VT, Op.getOperand(0)));

Known = TLO.DAG.computeKnownBits(Op, DemandedElts, Depth);		Known = TLO.DAG.computeKnownBits(Op, DemandedElts, Depth);
break;		break;
}		}
case ISD::SIGN_EXTEND_INREG: {		case ISD::SIGN_EXTEND_INREG: {
SDValue Op0 = Op.getOperand(0);		SDValue Op0 = Op.getOperand(0);
EVT ExVT = cast<VTSDNode>(Op.getOperand(1))->getVT();		EVT ExVT = cast<VTSDNode>(Op.getOperand(1))->getVT();
unsigned ExVTBits = ExVT.getScalarSizeInBits();		unsigned ExVTBits = ExVT.getScalarSizeInBits();
▲ Show 20 Lines • Show All 935 Lines • ▼ Show 20 Lines	for (unsigned i = 0; i != NumElts; ++i) {
}		}
IdentityLHS &= (M < 0) \|\| (M == (int)i);		IdentityLHS &= (M < 0) \|\| (M == (int)i);
IdentityRHS &= (M < 0) \|\| ((M - NumElts) == i);		IdentityRHS &= (M < 0) \|\| ((M - NumElts) == i);
}		}

// Update legal shuffle masks based on demanded elements if it won't reduce		// Update legal shuffle masks based on demanded elements if it won't reduce
// to Identity which can cause premature removal of the shuffle mask.		// to Identity which can cause premature removal of the shuffle mask.
if (Updated && !IdentityLHS && !IdentityRHS && !TLO.LegalOps) {		if (Updated && !IdentityLHS && !IdentityRHS && !TLO.LegalOps) {
SDValue LegalShuffle =		SDValue LegalShuffle = buildLegalVectorShuffle(
buildLegalVectorShuffle(VT, DL, Op.getOperand(0), Op.getOperand(1),		VT, DL, Op.getOperand(0), Op.getOperand(1), NewMask, TLO.DAG);
NewMask, TLO.DAG);
if (LegalShuffle)		if (LegalShuffle)
return TLO.CombineTo(Op, LegalShuffle);		return TLO.CombineTo(Op, LegalShuffle);
}		}

// Propagate undef/zero elements from LHS/RHS.		// Propagate undef/zero elements from LHS/RHS.
for (unsigned i = 0; i != NumElts; ++i) {		for (unsigned i = 0; i != NumElts; ++i) {
int M = ShuffleMask[i];		int M = ShuffleMask[i];
if (M < 0) {		if (M < 0) {
▲ Show 20 Lines • Show All 187 Lines • ▼ Show 20 Lines
void TargetLowering::computeKnownBitsForTargetInstr(		void TargetLowering::computeKnownBitsForTargetInstr(
GISelKnownBits &Analysis, Register R, KnownBits &Known,		GISelKnownBits &Analysis, Register R, KnownBits &Known,
const APInt &DemandedElts, const MachineRegisterInfo &MRI,		const APInt &DemandedElts, const MachineRegisterInfo &MRI,
unsigned Depth) const {		unsigned Depth) const {
Known.resetAll();		Known.resetAll();
}		}

void TargetLowering::computeKnownBitsForFrameIndex(		void TargetLowering::computeKnownBitsForFrameIndex(
const int FrameIdx, KnownBits &Known, const MachineFunction &MF) const {		const int FrameIdx, KnownBits &Known, const MachineFunction &MF) const {
// The low bits are known zero if the pointer is aligned.		// The low bits are known zero if the pointer is aligned.
Known.Zero.setLowBits(Log2(MF.getFrameInfo().getObjectAlign(FrameIdx)));		Known.Zero.setLowBits(Log2(MF.getFrameInfo().getObjectAlign(FrameIdx)));
}		}

Align TargetLowering::computeKnownAlignForTargetInstr(		Align TargetLowering::computeKnownAlignForTargetInstr(
GISelKnownBits &Analysis, Register R, const MachineRegisterInfo &MRI,		GISelKnownBits &Analysis, Register R, const MachineRegisterInfo &MRI,
unsigned Depth) const {		unsigned Depth) const {
return Align(1);		return Align(1);
}		}

/// This method can be implemented by targets that want to expose additional		/// This method can be implemented by targets that want to expose additional
/// information about sign bits to the DAG Combiner.		/// information about sign bits to the DAG Combiner.
unsigned TargetLowering::ComputeNumSignBitsForTargetNode(SDValue Op,		unsigned TargetLowering::ComputeNumSignBitsForTargetNode(SDValue Op,
const APInt &,		const APInt &,
const SelectionDAG &,		const SelectionDAG &,
unsigned Depth) const {		unsigned Depth) const {
assert((Op.getOpcode() >= ISD::BUILTIN_OP_END \|\|		assert((Op.getOpcode() >= ISD::BUILTIN_OP_END \|\|
Op.getOpcode() == ISD::INTRINSIC_WO_CHAIN \|\|		Op.getOpcode() == ISD::INTRINSIC_WO_CHAIN \|\|
Op.getOpcode() == ISD::INTRINSIC_W_CHAIN \|\|		Op.getOpcode() == ISD::INTRINSIC_W_CHAIN \|\|
Op.getOpcode() == ISD::INTRINSIC_VOID) &&		Op.getOpcode() == ISD::INTRINSIC_VOID) &&
"Should use ComputeNumSignBits if you don't know whether Op"		"Should use ComputeNumSignBits if you don't know whether Op"
" is a target node!");		" is a target node!");
return 1;		return 1;
}		}

unsigned TargetLowering::computeNumSignBitsForTargetInstr(		unsigned TargetLowering::computeNumSignBitsForTargetInstr(
GISelKnownBits &Analysis, Register R, const APInt &DemandedElts,		GISelKnownBits &Analysis, Register R, const APInt &DemandedElts,
const MachineRegisterInfo &MRI, unsigned Depth) const {		const MachineRegisterInfo &MRI, unsigned Depth) const {
return 1;		return 1;
}		}

bool TargetLowering::SimplifyDemandedVectorEltsForTargetNode(		bool TargetLowering::SimplifyDemandedVectorEltsForTargetNode(
SDValue Op, const APInt &DemandedElts, APInt &KnownUndef, APInt &KnownZero,		SDValue Op, const APInt &DemandedElts, APInt &KnownUndef, APInt &KnownZero,
TargetLoweringOpt &TLO, unsigned Depth) const {		TargetLoweringOpt &TLO, unsigned Depth) const {
assert((Op.getOpcode() >= ISD::BUILTIN_OP_END \|\|		assert((Op.getOpcode() >= ISD::BUILTIN_OP_END \|\|
Op.getOpcode() == ISD::INTRINSIC_WO_CHAIN \|\|		Op.getOpcode() == ISD::INTRINSIC_WO_CHAIN \|\|
Show All 25 Lines	assert(
Op.getOpcode() == ISD::INTRINSIC_WO_CHAIN \|\|		Op.getOpcode() == ISD::INTRINSIC_WO_CHAIN \|\|
Op.getOpcode() == ISD::INTRINSIC_W_CHAIN \|\|		Op.getOpcode() == ISD::INTRINSIC_W_CHAIN \|\|
Op.getOpcode() == ISD::INTRINSIC_VOID) &&		Op.getOpcode() == ISD::INTRINSIC_VOID) &&
"Should use SimplifyMultipleUseDemandedBits if you don't know whether Op"		"Should use SimplifyMultipleUseDemandedBits if you don't know whether Op"
" is a target node!");		" is a target node!");
return SDValue();		return SDValue();
}		}

SDValue		SDValue TargetLowering::buildLegalVectorShuffle(EVT VT, const SDLoc &DL,
TargetLowering::buildLegalVectorShuffle(EVT VT, const SDLoc &DL, SDValue N0,		SDValue N0, SDValue N1,
SDValue N1, MutableArrayRef<int> Mask,		MutableArrayRef<int> Mask,
SelectionDAG &DAG) const {		SelectionDAG &DAG) const {
bool LegalMask = isShuffleMaskLegal(Mask, VT);		bool LegalMask = isShuffleMaskLegal(Mask, VT);
if (!LegalMask) {		if (!LegalMask) {
std::swap(N0, N1);		std::swap(N0, N1);
ShuffleVectorSDNode::commuteMask(Mask);		ShuffleVectorSDNode::commuteMask(Mask);
LegalMask = isShuffleMaskLegal(Mask, VT);		LegalMask = isShuffleMaskLegal(Mask, VT);
}		}

if (!LegalMask)		if (!LegalMask)
return SDValue();		return SDValue();

return DAG.getVectorShuffle(VT, DL, N0, N1, Mask);		return DAG.getVectorShuffle(VT, DL, N0, N1, Mask);
}		}

const Constant TargetLowering::getTargetConstantFromLoad(LoadSDNode) const {		const Constant TargetLowering::getTargetConstantFromLoad(LoadSDNode ) const {
return nullptr;		return nullptr;
}		}

bool TargetLowering::isKnownNeverNaNForTargetNode(SDValue Op,		bool TargetLowering::isKnownNeverNaNForTargetNode(SDValue Op,
const SelectionDAG &DAG,		const SelectionDAG &DAG,
bool SNaN,		bool SNaN,
unsigned Depth) const {		unsigned Depth) const {
assert((Op.getOpcode() >= ISD::BUILTIN_OP_END \|\|		assert((Op.getOpcode() >= ISD::BUILTIN_OP_END \|\|
▲ Show 20 Lines • Show All 343 Lines • ▼ Show 20 Lines	SDValue TargetLowering::foldSetCCWithBinOp(EVT VT, SDValue N0, SDValue N1,
if (BOpcode == ISD::ADD \|\| BOpcode == ISD::XOR)		if (BOpcode == ISD::ADD \|\| BOpcode == ISD::XOR)
return DAG.getSetCC(DL, VT, X, DAG.getConstant(0, DL, OpVT), Cond);		return DAG.getSetCC(DL, VT, X, DAG.getConstant(0, DL, OpVT), Cond);

// The shift would not be valid if the operands are boolean (i1).		// The shift would not be valid if the operands are boolean (i1).
if (!N0.hasOneUse() \|\| OpVT.getScalarSizeInBits() == 1)		if (!N0.hasOneUse() \|\| OpVT.getScalarSizeInBits() == 1)
return SDValue();		return SDValue();

// (X - Y) == Y --> X == Y << 1		// (X - Y) == Y --> X == Y << 1
EVT ShiftVT = getShiftAmountTy(OpVT, DAG.getDataLayout(),		EVT ShiftVT =
!DCI.isBeforeLegalize());		getShiftAmountTy(OpVT, DAG.getDataLayout(), !DCI.isBeforeLegalize());
SDValue One = DAG.getConstant(1, DL, ShiftVT);		SDValue One = DAG.getConstant(1, DL, ShiftVT);
SDValue YShl1 = DAG.getNode(ISD::SHL, DL, N1.getValueType(), Y, One);		SDValue YShl1 = DAG.getNode(ISD::SHL, DL, N1.getValueType(), Y, One);
if (!DCI.isCalledByLegalizer())		if (!DCI.isCalledByLegalizer())
DCI.AddToWorklist(YShl1.getNode());		DCI.AddToWorklist(YShl1.getNode());
return DAG.getSetCC(DL, VT, X, YShl1, Cond);		return DAG.getSetCC(DL, VT, X, YShl1, Cond);
}		}

/// Try to simplify a setcc built with the specified operands and cc. If it is		/// Try to simplify a setcc built with the specified operands and cc. If it is
Show All 20 Lines	SDValue TargetLowering::SimplifySetCC(EVT VT, SDValue N0, SDValue N1,

// If we have a subtract with the same 2 non-constant operands as this setcc		// If we have a subtract with the same 2 non-constant operands as this setcc
// -- but in reverse order -- then try to commute the operands of this setcc		// -- but in reverse order -- then try to commute the operands of this setcc
// to match. A matching pair of setcc (cmp) and sub may be combined into 1		// to match. A matching pair of setcc (cmp) and sub may be combined into 1
// instruction on some targets.		// instruction on some targets.
if (!isConstOrConstSplat(N0) && !isConstOrConstSplat(N1) &&		if (!isConstOrConstSplat(N0) && !isConstOrConstSplat(N1) &&
(DCI.isBeforeLegalizeOps() \|\|		(DCI.isBeforeLegalizeOps() \|\|
isCondCodeLegal(SwappedCC, N0.getSimpleValueType())) &&		isCondCodeLegal(SwappedCC, N0.getSimpleValueType())) &&
DAG.getNodeIfExists(ISD::SUB, DAG.getVTList(OpVT), { N1, N0 } ) &&		DAG.getNodeIfExists(ISD::SUB, DAG.getVTList(OpVT), {N1, N0}) &&
!DAG.getNodeIfExists(ISD::SUB, DAG.getVTList(OpVT), { N0, N1 } ))		!DAG.getNodeIfExists(ISD::SUB, DAG.getVTList(OpVT), {N0, N1}))
return DAG.getSetCC(dl, VT, N1, N0, SwappedCC);		return DAG.getSetCC(dl, VT, N1, N0, SwappedCC);

if (auto *N1C = dyn_cast<ConstantSDNode>(N1.getNode())) {		if (auto *N1C = dyn_cast<ConstantSDNode>(N1.getNode())) {
const APInt &C1 = N1C->getAPIntValue();		const APInt &C1 = N1C->getAPIntValue();

// If the LHS is '(srl (ctlz x), 5)', the RHS is 0/1, and this is an		// If the LHS is '(srl (ctlz x), 5)', the RHS is 0/1, and this is an
// equality comparison, then we're just comparing whether X itself is		// equality comparison, then we're just comparing whether X itself is
// zero.		// zero.
if (N0.getOpcode() == ISD::SRL && (C1.isNullValue() \|\| C1.isOneValue()) &&		if (N0.getOpcode() == ISD::SRL && (C1.isNullValue() \|\| C1.isOneValue()) &&
N0.getOperand(0).getOpcode() == ISD::CTLZ &&		N0.getOperand(0).getOpcode() == ISD::CTLZ &&
N0.getOperand(1).getOpcode() == ISD::Constant) {		N0.getOperand(1).getOpcode() == ISD::Constant) {
const APInt &ShAmt = N0.getConstantOperandAPInt(1);		const APInt &ShAmt = N0.getConstantOperandAPInt(1);
if ((Cond == ISD::SETEQ \|\| Cond == ISD::SETNE) &&		if ((Cond == ISD::SETEQ \|\| Cond == ISD::SETNE) &&
ShAmt == Log2_32(N0.getValueSizeInBits())) {		ShAmt == Log2_32(N0.getValueSizeInBits())) {
if ((C1 == 0) == (Cond == ISD::SETEQ)) {		if ((C1 == 0) == (Cond == ISD::SETEQ)) {
// (srl (ctlz x), 5) == 0 -> X != 0		// (srl (ctlz x), 5) == 0 -> X != 0
// (srl (ctlz x), 5) != 1 -> X != 0		// (srl (ctlz x), 5) != 1 -> X != 0
Cond = ISD::SETNE;		Cond = ISD::SETNE;
} else {		} else {
// (srl (ctlz x), 5) != 0 -> X == 0		// (srl (ctlz x), 5) != 0 -> X == 0
// (srl (ctlz x), 5) == 1 -> X == 0		// (srl (ctlz x), 5) == 1 -> X == 0
Cond = ISD::SETEQ;		Cond = ISD::SETEQ;
}		}
SDValue Zero = DAG.getConstant(0, dl, N0.getValueType());		SDValue Zero = DAG.getConstant(0, dl, N0.getValueType());
return DAG.getSetCC(dl, VT, N0.getOperand(0).getOperand(0),		return DAG.getSetCC(dl, VT, N0.getOperand(0).getOperand(0), Zero, Cond);
Zero, Cond);
}		}
}		}

SDValue CTPOP = N0;		SDValue CTPOP = N0;
// Look through truncs that don't change the value of a ctpop.		// Look through truncs that don't change the value of a ctpop.
if (N0.hasOneUse() && N0.getOpcode() == ISD::TRUNCATE)		if (N0.hasOneUse() && N0.getOpcode() == ISD::TRUNCATE)
CTPOP = N0.getOperand(0);		CTPOP = N0.getOperand(0);

if (CTPOP.hasOneUse() && CTPOP.getOpcode() == ISD::CTPOP &&		if (CTPOP.hasOneUse() && CTPOP.getOpcode() == ISD::CTPOP &&
(N0 == CTPOP \|\|		(N0 == CTPOP \|\|
N0.getValueSizeInBits() > Log2_32_Ceil(CTPOP.getValueSizeInBits()))) {		N0.getValueSizeInBits() > Log2_32_Ceil(CTPOP.getValueSizeInBits()))) {
EVT CTVT = CTPOP.getValueType();		EVT CTVT = CTPOP.getValueType();
SDValue CTOp = CTPOP.getOperand(0);		SDValue CTOp = CTPOP.getOperand(0);

// (ctpop x) u< 2 -> (x & x-1) == 0		// (ctpop x) u< 2 -> (x & x-1) == 0
// (ctpop x) u> 1 -> (x & x-1) != 0		// (ctpop x) u> 1 -> (x & x-1) != 0
if ((Cond == ISD::SETULT && C1 == 2) \|\| (Cond == ISD::SETUGT && C1 == 1)){		if ((Cond == ISD::SETULT && C1 == 2) \|\|
		(Cond == ISD::SETUGT && C1 == 1)) {
SDValue NegOne = DAG.getAllOnesConstant(dl, CTVT);		SDValue NegOne = DAG.getAllOnesConstant(dl, CTVT);
SDValue Add = DAG.getNode(ISD::ADD, dl, CTVT, CTOp, NegOne);		SDValue Add = DAG.getNode(ISD::ADD, dl, CTVT, CTOp, NegOne);
SDValue And = DAG.getNode(ISD::AND, dl, CTVT, CTOp, Add);		SDValue And = DAG.getNode(ISD::AND, dl, CTVT, CTOp, Add);
ISD::CondCode CC = Cond == ISD::SETULT ? ISD::SETEQ : ISD::SETNE;		ISD::CondCode CC = Cond == ISD::SETULT ? ISD::SETEQ : ISD::SETNE;
return DAG.getSetCC(dl, VT, And, DAG.getConstant(0, dl, CTVT), CC);		return DAG.getSetCC(dl, VT, And, DAG.getConstant(0, dl, CTVT), CC);
}		}

// If ctpop is not supported, expand a power-of-2 comparison based on it.		// If ctpop is not supported, expand a power-of-2 comparison based on it.
Show All 11 Lines	if (CTPOP.hasOneUse() && CTPOP.getOpcode() == ISD::CTPOP &&
SDValue RHS = DAG.getSetCC(dl, VT, And, Zero, Cond);		SDValue RHS = DAG.getSetCC(dl, VT, And, Zero, Cond);
unsigned LogicOpcode = Cond == ISD::SETEQ ? ISD::AND : ISD::OR;		unsigned LogicOpcode = Cond == ISD::SETEQ ? ISD::AND : ISD::OR;
return DAG.getNode(LogicOpcode, dl, VT, LHS, RHS);		return DAG.getNode(LogicOpcode, dl, VT, LHS, RHS);
}		}
}		}

// (zext x) == C --> x == (trunc C)		// (zext x) == C --> x == (trunc C)
// (sext x) == C --> x == (trunc C)		// (sext x) == C --> x == (trunc C)
if ((Cond == ISD::SETEQ \|\| Cond == ISD::SETNE) &&		if ((Cond == ISD::SETEQ \|\| Cond == ISD::SETNE) && DCI.isBeforeLegalize() &&
DCI.isBeforeLegalize() && N0->hasOneUse()) {		N0->hasOneUse()) {
unsigned MinBits = N0.getValueSizeInBits();		unsigned MinBits = N0.getValueSizeInBits();
SDValue PreExt;		SDValue PreExt;
bool Signed = false;		bool Signed = false;
if (N0->getOpcode() == ISD::ZERO_EXTEND) {		if (N0->getOpcode() == ISD::ZERO_EXTEND) {
// ZExt		// ZExt
MinBits = N0->getOperand(0).getValueSizeInBits();		MinBits = N0->getOperand(0).getValueSizeInBits();
PreExt = N0->getOperand(0);		PreExt = N0->getOperand(0);
} else if (N0->getOpcode() == ISD::AND) {		} else if (N0->getOpcode() == ISD::AND) {
// DAGCombine turns costly ZExts into ANDs		// DAGCombine turns costly ZExts into ANDs
if (auto *C = dyn_cast<ConstantSDNode>(N0->getOperand(1)))		if (auto *C = dyn_cast<ConstantSDNode>(N0->getOperand(1)))
if ((C->getAPIntValue()+1).isPowerOf2()) {		if ((C->getAPIntValue() + 1).isPowerOf2()) {
MinBits = C->getAPIntValue().countTrailingOnes();		MinBits = C->getAPIntValue().countTrailingOnes();
PreExt = N0->getOperand(0);		PreExt = N0->getOperand(0);
}		}
} else if (N0->getOpcode() == ISD::SIGN_EXTEND) {		} else if (N0->getOpcode() == ISD::SIGN_EXTEND) {
// SExt		// SExt
MinBits = N0->getOperand(0).getValueSizeInBits();		MinBits = N0->getOperand(0).getValueSizeInBits();
PreExt = N0->getOperand(0);		PreExt = N0->getOperand(0);
Signed = true;		Signed = true;
} else if (auto *LN0 = dyn_cast<LoadSDNode>(N0)) {		} else if (auto *LN0 = dyn_cast<LoadSDNode>(N0)) {
// ZEXTLOAD / SEXTLOAD		// ZEXTLOAD / SEXTLOAD
if (LN0->getExtensionType() == ISD::ZEXTLOAD) {		if (LN0->getExtensionType() == ISD::ZEXTLOAD) {
MinBits = LN0->getMemoryVT().getSizeInBits();		MinBits = LN0->getMemoryVT().getSizeInBits();
PreExt = N0;		PreExt = N0;
} else if (LN0->getExtensionType() == ISD::SEXTLOAD) {		} else if (LN0->getExtensionType() == ISD::SEXTLOAD) {
Signed = true;		Signed = true;
MinBits = LN0->getMemoryVT().getSizeInBits();		MinBits = LN0->getMemoryVT().getSizeInBits();
PreExt = N0;		PreExt = N0;
}		}
}		}

// Figure out how many bits we need to preserve this constant.		// Figure out how many bits we need to preserve this constant.
unsigned ReqdBits = Signed ?		unsigned ReqdBits = Signed ? C1.getBitWidth() - C1.getNumSignBits() + 1
C1.getBitWidth() - C1.getNumSignBits() + 1 :		: C1.getActiveBits();
C1.getActiveBits();

// Make sure we're not losing bits from the constant.		// Make sure we're not losing bits from the constant.
if (MinBits > 0 &&		if (MinBits > 0 && MinBits < C1.getBitWidth() && MinBits >= ReqdBits) {
MinBits < C1.getBitWidth() &&
MinBits >= ReqdBits) {
EVT MinVT = EVT::getIntegerVT(*DAG.getContext(), MinBits);		EVT MinVT = EVT::getIntegerVT(*DAG.getContext(), MinBits);
if (isTypeDesirableForOp(ISD::SETCC, MinVT)) {		if (isTypeDesirableForOp(ISD::SETCC, MinVT)) {
// Will get folded away.		// Will get folded away.
SDValue Trunc = DAG.getNode(ISD::TRUNCATE, dl, MinVT, PreExt);		SDValue Trunc = DAG.getNode(ISD::TRUNCATE, dl, MinVT, PreExt);
if (MinBits == 1 && C1 == 1)		if (MinBits == 1 && C1 == 1)
// Invert the condition.		// Invert the condition.
return DAG.getSetCC(dl, VT, Trunc, DAG.getConstant(0, dl, MVT::i1),		return DAG.getSetCC(dl, VT, Trunc, DAG.getConstant(0, dl, MVT::i1),
Cond == ISD::SETEQ ? ISD::SETNE : ISD::SETEQ);		Cond == ISD::SETEQ ? ISD::SETNE : ISD::SETEQ);
Show All 23 Lines	if ((Cond == ISD::SETEQ \|\| Cond == ISD::SETNE) && DCI.isBeforeLegalize() &&

if (!Inverse)		if (!Inverse)
return TopSetCC;		return TopSetCC;

ISD::CondCode InvCond = ISD::getSetCCInverse(		ISD::CondCode InvCond = ISD::getSetCCInverse(
cast<CondCodeSDNode>(TopSetCC.getOperand(2))->get(),		cast<CondCodeSDNode>(TopSetCC.getOperand(2))->get(),
TopSetCC.getOperand(0).getValueType());		TopSetCC.getOperand(0).getValueType());
return DAG.getSetCC(dl, VT, TopSetCC.getOperand(0),		return DAG.getSetCC(dl, VT, TopSetCC.getOperand(0),
TopSetCC.getOperand(1),		TopSetCC.getOperand(1), InvCond);
InvCond);
}		}
}		}
}		}

// If the LHS is '(and load, const)', the RHS is 0, the test is for		// If the LHS is '(and load, const)', the RHS is 0, the test is for
// equality or unsigned, and all 1 bits of the const are in the same		// equality or unsigned, and all 1 bits of the const are in the same
// partial word, see if we can shorten the load.		// partial word, see if we can shorten the load.
if (DCI.isBeforeLegalize() &&		if (DCI.isBeforeLegalize() && !ISD::isSignedIntSetCC(Cond) &&
!ISD::isSignedIntSetCC(Cond) &&		N0.getOpcode() == ISD::AND && C1 == 0 && N0.getNode()->hasOneUse() &&
N0.getOpcode() == ISD::AND && C1 == 0 &&
N0.getNode()->hasOneUse() &&
isa<LoadSDNode>(N0.getOperand(0)) &&		isa<LoadSDNode>(N0.getOperand(0)) &&
N0.getOperand(0).getNode()->hasOneUse() &&		N0.getOperand(0).getNode()->hasOneUse() &&
isa<ConstantSDNode>(N0.getOperand(1))) {		isa<ConstantSDNode>(N0.getOperand(1))) {
LoadSDNode *Lod = cast<LoadSDNode>(N0.getOperand(0));		LoadSDNode *Lod = cast<LoadSDNode>(N0.getOperand(0));
APInt bestMask;		APInt bestMask;
unsigned bestWidth = 0, bestOffset = 0;		unsigned bestWidth = 0, bestOffset = 0;
if (Lod->isSimple() && Lod->isUnindexed()) {		if (Lod->isSimple() && Lod->isUnindexed()) {
unsigned origWidth = N0.getValueSizeInBits();		unsigned origWidth = N0.getValueSizeInBits();
unsigned maskWidth = origWidth;		unsigned maskWidth = origWidth;
// We can narrow (e.g.) 16-bit extending loads on 32-bit target to		// We can narrow (e.g.) 16-bit extending loads on 32-bit target to
// 8 bits, but have to be careful...		// 8 bits, but have to be careful...
if (Lod->getExtensionType() != ISD::NON_EXTLOAD)		if (Lod->getExtensionType() != ISD::NON_EXTLOAD)
origWidth = Lod->getMemoryVT().getSizeInBits();		origWidth = Lod->getMemoryVT().getSizeInBits();
const APInt &Mask = N0.getConstantOperandAPInt(1);		const APInt &Mask = N0.getConstantOperandAPInt(1);
for (unsigned width = origWidth / 2; width>=8; width /= 2) {		for (unsigned width = origWidth / 2; width >= 8; width /= 2) {
		Lint: Pre-merge checks Inline Actions clang-tidy: warning: invalid case style for variable 'width' [readability-identifier-naming] not useful Lint: Pre-merge checks: clang-tidy: warning: invalid case style for variable 'width' [readability-identifier-naming]…
APInt newMask = APInt::getLowBitsSet(maskWidth, width);		APInt newMask = APInt::getLowBitsSet(maskWidth, width);
for (unsigned offset=0; offset<origWidth/width; offset++) {		for (unsigned offset = 0; offset < origWidth / width; offset++) {
		Lint: Pre-merge checks Inline Actions clang-tidy: warning: invalid case style for variable 'offset' [readability-identifier-naming] not useful Lint: Pre-merge checks: clang-tidy: warning: invalid case style for variable 'offset' [readability-identifier-naming]…
if (Mask.isSubsetOf(newMask)) {		if (Mask.isSubsetOf(newMask)) {
if (Layout.isLittleEndian())		if (Layout.isLittleEndian())
bestOffset = (uint64_t)offset * (width/8);		bestOffset = (uint64_t)offset * (width / 8);
else		else
bestOffset = (origWidth/width - offset - 1) * (width/8);		bestOffset = (origWidth / width - offset - 1) * (width / 8);
bestMask = Mask.lshr(offset * (width/8) * 8);		bestMask = Mask.lshr(offset * (width / 8) * 8);
bestWidth = width;		bestWidth = width;
break;		break;
}		}
newMask <<= width;		newMask <<= width;
}		}
}		}
}		}
if (bestWidth) {		if (bestWidth) {
EVT newVT = EVT::getIntegerVT(*DAG.getContext(), bestWidth);		EVT newVT = EVT::getIntegerVT(*DAG.getContext(), bestWidth);
if (newVT.isRound() &&		if (newVT.isRound() &&
shouldReduceLoadWidth(Lod, ISD::NON_EXTLOAD, newVT)) {		shouldReduceLoadWidth(Lod, ISD::NON_EXTLOAD, newVT)) {
SDValue Ptr = Lod->getBasePtr();		SDValue Ptr = Lod->getBasePtr();
if (bestOffset != 0)		if (bestOffset != 0)
Ptr =		Ptr =
DAG.getMemBasePlusOffset(Ptr, TypeSize::Fixed(bestOffset), dl);		DAG.getMemBasePlusOffset(Ptr, TypeSize::Fixed(bestOffset), dl);
SDValue NewLoad =		SDValue NewLoad =
DAG.getLoad(newVT, dl, Lod->getChain(), Ptr,		DAG.getLoad(newVT, dl, Lod->getChain(), Ptr,
Lod->getPointerInfo().getWithOffset(bestOffset),		Lod->getPointerInfo().getWithOffset(bestOffset),
Lod->getOriginalAlign());		Lod->getOriginalAlign());
return DAG.getSetCC(dl, VT,		return DAG.getSetCC(
DAG.getNode(ISD::AND, dl, newVT, NewLoad,		dl, VT,
DAG.getConstant(bestMask.trunc(bestWidth),		DAG.getNode(
dl, newVT)),		ISD::AND, dl, newVT, NewLoad,
		DAG.getConstant(bestMask.trunc(bestWidth), dl, newVT)),
DAG.getConstant(0LL, dl, newVT), Cond);		DAG.getConstant(0LL, dl, newVT), Cond);
}		}
}		}
}		}

// If the LHS is a ZERO_EXTEND, perform the comparison on the input.		// If the LHS is a ZERO_EXTEND, perform the comparison on the input.
if (N0.getOpcode() == ISD::ZERO_EXTEND) {		if (N0.getOpcode() == ISD::ZERO_EXTEND) {
unsigned InSize = N0.getOperand(0).getValueSizeInBits();		unsigned InSize = N0.getOperand(0).getValueSizeInBits();

Show All 33 Lines	if (N0.getOpcode() == ISD::ZERO_EXTEND) {
case ISD::SETULE: {		case ISD::SETULE: {
EVT newVT = N0.getOperand(0).getValueType();		EVT newVT = N0.getOperand(0).getValueType();
if (DCI.isBeforeLegalizeOps() \|\|		if (DCI.isBeforeLegalizeOps() \|\|
(isOperationLegal(ISD::SETCC, newVT) &&		(isOperationLegal(ISD::SETCC, newVT) &&
isCondCodeLegal(Cond, newVT.getSimpleVT()))) {		isCondCodeLegal(Cond, newVT.getSimpleVT()))) {
EVT NewSetCCVT = getSetCCResultType(Layout, *DAG.getContext(), newVT);		EVT NewSetCCVT = getSetCCResultType(Layout, *DAG.getContext(), newVT);
SDValue NewConst = DAG.getConstant(C1.trunc(InSize), dl, newVT);		SDValue NewConst = DAG.getConstant(C1.trunc(InSize), dl, newVT);

SDValue NewSetCC = DAG.getSetCC(dl, NewSetCCVT, N0.getOperand(0),		SDValue NewSetCC =
NewConst, Cond);		DAG.getSetCC(dl, NewSetCCVT, N0.getOperand(0), NewConst, Cond);
return DAG.getBoolExtOrTrunc(NewSetCC, dl, VT, N0.getValueType());		return DAG.getBoolExtOrTrunc(NewSetCC, dl, VT, N0.getValueType());
}		}
break;		break;
}		}
default:		default:
break; // todo, be more careful with signed comparisons		break; // todo, be more careful with signed comparisons
}		}
} else if (N0.getOpcode() == ISD::SIGN_EXTEND_INREG &&		} else if (N0.getOpcode() == ISD::SIGN_EXTEND_INREG &&
Show All 15 Lines	if (N0.getOpcode() == ISD::ZERO_EXTEND) {
} else {		} else {
APInt Imm = APInt::getLowBitsSet(ExtDstTyBits, ExtSrcTyBits);		APInt Imm = APInt::getLowBitsSet(ExtDstTyBits, ExtSrcTyBits);
ZextOp = DAG.getNode(ISD::AND, dl, Op0Ty, N0.getOperand(0),		ZextOp = DAG.getNode(ISD::AND, dl, Op0Ty, N0.getOperand(0),
DAG.getConstant(Imm, dl, Op0Ty));		DAG.getConstant(Imm, dl, Op0Ty));
}		}
if (!DCI.isCalledByLegalizer())		if (!DCI.isCalledByLegalizer())
DCI.AddToWorklist(ZextOp.getNode());		DCI.AddToWorklist(ZextOp.getNode());
// Otherwise, make this a use of a zext.		// Otherwise, make this a use of a zext.
return DAG.getSetCC(dl, VT, ZextOp,		return DAG.getSetCC(
DAG.getConstant(C1 & APInt::getLowBitsSet(		dl, VT, ZextOp,
ExtDstTyBits,		DAG.getConstant(C1 & APInt::getLowBitsSet(ExtDstTyBits, ExtSrcTyBits),
ExtSrcTyBits),
dl, ExtDstTy),		dl, ExtDstTy),
Cond);		Cond);
} else if ((N1C->isNullValue() \|\| N1C->isOne()) &&		} else if ((N1C->isNullValue() \|\| N1C->isOne()) &&
(Cond == ISD::SETEQ \|\| Cond == ISD::SETNE)) {		(Cond == ISD::SETEQ \|\| Cond == ISD::SETNE)) {
// SETCC (SETCC), [0\|1], [EQ\|NE] -> SETCC		// SETCC (SETCC), [0\|1], [EQ\|NE] -> SETCC
if (N0.getOpcode() == ISD::SETCC &&		if (N0.getOpcode() == ISD::SETCC && isTypeLegal(VT) &&
isTypeLegal(VT) && VT.bitsLE(N0.getValueType()) &&		VT.bitsLE(N0.getValueType()) &&
(N0.getValueType() == MVT::i1 \|\|		(N0.getValueType() == MVT::i1 \|\|
getBooleanContents(N0.getOperand(0).getValueType()) ==		getBooleanContents(N0.getOperand(0).getValueType()) ==
ZeroOrOneBooleanContent)) {		ZeroOrOneBooleanContent)) {
bool TrueWhenTrue = (Cond == ISD::SETEQ) ^ (!N1C->isOne());		bool TrueWhenTrue = (Cond == ISD::SETEQ) ^ (!N1C->isOne());
if (TrueWhenTrue)		if (TrueWhenTrue)
return DAG.getNode(ISD::TRUNCATE, dl, VT, N0);		return DAG.getNode(ISD::TRUNCATE, dl, VT, N0);
// Invert the condition.		// Invert the condition.
ISD::CondCode CC = cast<CondCodeSDNode>(N0.getOperand(2))->get();		ISD::CondCode CC = cast<CondCodeSDNode>(N0.getOperand(2))->get();
CC = ISD::getSetCCInverse(CC, N0.getOperand(0).getValueType());		CC = ISD::getSetCCInverse(CC, N0.getOperand(0).getValueType());
if (DCI.isBeforeLegalizeOps() \|\|		if (DCI.isBeforeLegalizeOps() \|\|
isCondCodeLegal(CC, N0.getOperand(0).getSimpleValueType()))		isCondCodeLegal(CC, N0.getOperand(0).getSimpleValueType()))
return DAG.getSetCC(dl, VT, N0.getOperand(0), N0.getOperand(1), CC);		return DAG.getSetCC(dl, VT, N0.getOperand(0), N0.getOperand(1), CC);
}		}

if ((N0.getOpcode() == ISD::XOR \|\|		if ((N0.getOpcode() == ISD::XOR \|\|
(N0.getOpcode() == ISD::AND &&		(N0.getOpcode() == ISD::AND &&
N0.getOperand(0).getOpcode() == ISD::XOR &&		N0.getOperand(0).getOpcode() == ISD::XOR &&
N0.getOperand(1) == N0.getOperand(0).getOperand(1))) &&		N0.getOperand(1) == N0.getOperand(0).getOperand(1))) &&
isa<ConstantSDNode>(N0.getOperand(1)) &&		isa<ConstantSDNode>(N0.getOperand(1)) &&
cast<ConstantSDNode>(N0.getOperand(1))->isOne()) {		cast<ConstantSDNode>(N0.getOperand(1))->isOne()) {
// If this is (X^1) == 0/1, swap the RHS and eliminate the xor. We		// If this is (X^1) == 0/1, swap the RHS and eliminate the xor. We
// can only do this if the top bits are known zero.		// can only do this if the top bits are known zero.
unsigned BitWidth = N0.getValueSizeInBits();		unsigned BitWidth = N0.getValueSizeInBits();
if (DAG.MaskedValueIsZero(N0,		if (DAG.MaskedValueIsZero(
APInt::getHighBitsSet(BitWidth,		N0, APInt::getHighBitsSet(BitWidth, BitWidth - 1))) {
BitWidth-1))) {
// Okay, get the un-inverted input value.		// Okay, get the un-inverted input value.
SDValue Val;		SDValue Val;
if (N0.getOpcode() == ISD::XOR) {		if (N0.getOpcode() == ISD::XOR) {
Val = N0.getOperand(0);		Val = N0.getOperand(0);
} else {		} else {
assert(N0.getOpcode() == ISD::AND &&		assert(N0.getOpcode() == ISD::AND &&
N0.getOperand(0).getOpcode() == ISD::XOR);		N0.getOperand(0).getOpcode() == ISD::XOR);
// ((X^1)&1)^1 -> X & 1		// ((X^1)&1)^1 -> X & 1
Val = DAG.getNode(ISD::AND, dl, N0.getValueType(),		Val = DAG.getNode(ISD::AND, dl, N0.getValueType(),
N0.getOperand(0).getOperand(0),		N0.getOperand(0).getOperand(0), N0.getOperand(1));
N0.getOperand(1));
}		}

return DAG.getSetCC(dl, VT, Val, N1,		return DAG.getSetCC(dl, VT, Val, N1,
Cond == ISD::SETEQ ? ISD::SETNE : ISD::SETEQ);		Cond == ISD::SETEQ ? ISD::SETNE : ISD::SETEQ);
}		}
} else if (N1C->isOne()) {		} else if (N1C->isOne()) {
SDValue Op0 = N0;		SDValue Op0 = N0;
if (Op0.getOpcode() == ISD::TRUNCATE)		if (Op0.getOpcode() == ISD::TRUNCATE)
Op0 = Op0.getOperand(0);		Op0 = Op0.getOperand(0);

if ((Op0.getOpcode() == ISD::XOR) &&		if ((Op0.getOpcode() == ISD::XOR) &&
Op0.getOperand(0).getOpcode() == ISD::SETCC &&		Op0.getOperand(0).getOpcode() == ISD::SETCC &&
Op0.getOperand(1).getOpcode() == ISD::SETCC) {		Op0.getOperand(1).getOpcode() == ISD::SETCC) {
SDValue XorLHS = Op0.getOperand(0);		SDValue XorLHS = Op0.getOperand(0);
SDValue XorRHS = Op0.getOperand(1);		SDValue XorRHS = Op0.getOperand(1);
// Ensure that the input setccs return an i1 type or 0/1 value.		// Ensure that the input setccs return an i1 type or 0/1 value.
if (Op0.getValueType() == MVT::i1 \|\|		if (Op0.getValueType() == MVT::i1 \|\|
(getBooleanContents(XorLHS.getOperand(0).getValueType()) ==		(getBooleanContents(XorLHS.getOperand(0).getValueType()) ==
ZeroOrOneBooleanContent &&		ZeroOrOneBooleanContent &&
getBooleanContents(XorRHS.getOperand(0).getValueType()) ==		getBooleanContents(XorRHS.getOperand(0).getValueType()) ==
ZeroOrOneBooleanContent)) {		ZeroOrOneBooleanContent)) {
// (xor (setcc), (setcc)) == / != 1 -> (setcc) != / == (setcc)		// (xor (setcc), (setcc)) == / != 1 -> (setcc) != / == (setcc)
Cond = (Cond == ISD::SETEQ) ? ISD::SETNE : ISD::SETEQ;		Cond = (Cond == ISD::SETEQ) ? ISD::SETNE : ISD::SETEQ;
return DAG.getSetCC(dl, VT, XorLHS, XorRHS, Cond);		return DAG.getSetCC(dl, VT, XorLHS, XorRHS, Cond);
}		}
}		}
if (Op0.getOpcode() == ISD::AND &&		if (Op0.getOpcode() == ISD::AND &&
isa<ConstantSDNode>(Op0.getOperand(1)) &&		isa<ConstantSDNode>(Op0.getOperand(1)) &&
cast<ConstantSDNode>(Op0.getOperand(1))->isOne()) {		cast<ConstantSDNode>(Op0.getOperand(1))->isOne()) {
// If this is (X&1) == / != 1, normalize it to (X&1) != / == 0.		// If this is (X&1) == / != 1, normalize it to (X&1) != / == 0.
if (Op0.getValueType().bitsGT(VT))		if (Op0.getValueType().bitsGT(VT))
Op0 = DAG.getNode(ISD::AND, dl, VT,		Op0 = DAG.getNode(
		ISD::AND, dl, VT,
DAG.getNode(ISD::TRUNCATE, dl, VT, Op0.getOperand(0)),		DAG.getNode(ISD::TRUNCATE, dl, VT, Op0.getOperand(0)),
DAG.getConstant(1, dl, VT));		DAG.getConstant(1, dl, VT));
else if (Op0.getValueType().bitsLT(VT))		else if (Op0.getValueType().bitsLT(VT))
Op0 = DAG.getNode(ISD::AND, dl, VT,		Op0 = DAG.getNode(
		ISD::AND, dl, VT,
DAG.getNode(ISD::ANY_EXTEND, dl, VT, Op0.getOperand(0)),		DAG.getNode(ISD::ANY_EXTEND, dl, VT, Op0.getOperand(0)),
DAG.getConstant(1, dl, VT));		DAG.getConstant(1, dl, VT));

return DAG.getSetCC(dl, VT, Op0,		return DAG.getSetCC(dl, VT, Op0,
DAG.getConstant(0, dl, Op0.getValueType()),		DAG.getConstant(0, dl, Op0.getValueType()),
Cond == ISD::SETEQ ? ISD::SETNE : ISD::SETEQ);		Cond == ISD::SETEQ ? ISD::SETNE : ISD::SETEQ);
}		}
if (Op0.getOpcode() == ISD::AssertZext &&		if (Op0.getOpcode() == ISD::AssertZext &&
cast<VTSDNode>(Op0.getOperand(1))->getVT() == MVT::i1)		cast<VTSDNode>(Op0.getOperand(1))->getVT() == MVT::i1)
return DAG.getSetCC(dl, VT, Op0,		return DAG.getSetCC(dl, VT, Op0,
▲ Show 20 Lines • Show All 44 Lines • ▼ Show 20 Lines	if (Cond == ISD::SETGE \|\| Cond == ISD::SETUGE) {
// X >= C0 --> X > (C0 - 1)		// X >= C0 --> X > (C0 - 1)
APInt C = C1 - 1;		APInt C = C1 - 1;
ISD::CondCode NewCC = (Cond == ISD::SETGE) ? ISD::SETGT : ISD::SETUGT;		ISD::CondCode NewCC = (Cond == ISD::SETGE) ? ISD::SETGT : ISD::SETUGT;
if ((DCI.isBeforeLegalizeOps() \|\|		if ((DCI.isBeforeLegalizeOps() \|\|
isCondCodeLegal(NewCC, VT.getSimpleVT())) &&		isCondCodeLegal(NewCC, VT.getSimpleVT())) &&
(!N1C->isOpaque() \|\| (C.getBitWidth() <= 64 &&		(!N1C->isOpaque() \|\| (C.getBitWidth() <= 64 &&
isLegalICmpImmediate(C.getSExtValue())))) {		isLegalICmpImmediate(C.getSExtValue())))) {
return DAG.getSetCC(dl, VT, N0,		return DAG.getSetCC(dl, VT, N0,
DAG.getConstant(C, dl, N1.getValueType()),		DAG.getConstant(C, dl, N1.getValueType()), NewCC);
NewCC);
}		}
}		}
}		}

if (Cond == ISD::SETLE \|\| Cond == ISD::SETULE) {		if (Cond == ISD::SETLE \|\| Cond == ISD::SETULE) {
// X <= MAX --> true		// X <= MAX --> true
if (C1 == MaxVal)		if (C1 == MaxVal)
return DAG.getBoolConstant(true, dl, VT, OpVT);		return DAG.getBoolConstant(true, dl, VT, OpVT);

// X <= C0 --> X < (C0 + 1)		// X <= C0 --> X < (C0 + 1)
if (!VT.isVector()) { // TODO: Support this for vectors.		if (!VT.isVector()) { // TODO: Support this for vectors.
APInt C = C1 + 1;		APInt C = C1 + 1;
ISD::CondCode NewCC = (Cond == ISD::SETLE) ? ISD::SETLT : ISD::SETULT;		ISD::CondCode NewCC = (Cond == ISD::SETLE) ? ISD::SETLT : ISD::SETULT;
if ((DCI.isBeforeLegalizeOps() \|\|		if ((DCI.isBeforeLegalizeOps() \|\|
isCondCodeLegal(NewCC, VT.getSimpleVT())) &&		isCondCodeLegal(NewCC, VT.getSimpleVT())) &&
(!N1C->isOpaque() \|\| (C.getBitWidth() <= 64 &&		(!N1C->isOpaque() \|\| (C.getBitWidth() <= 64 &&
isLegalICmpImmediate(C.getSExtValue())))) {		isLegalICmpImmediate(C.getSExtValue())))) {
return DAG.getSetCC(dl, VT, N0,		return DAG.getSetCC(dl, VT, N0,
DAG.getConstant(C, dl, N1.getValueType()),		DAG.getConstant(C, dl, N1.getValueType()), NewCC);
NewCC);
}		}
}		}
}		}

if (Cond == ISD::SETLT \|\| Cond == ISD::SETULT) {		if (Cond == ISD::SETLT \|\| Cond == ISD::SETULT) {
if (C1 == MinVal)		if (C1 == MinVal)
return DAG.getBoolConstant(false, dl, VT, OpVT); // X < MIN --> false		return DAG.getBoolConstant(false, dl, VT, OpVT); // X < MIN --> false

// TODO: Support this for vectors after legalize ops.		// TODO: Support this for vectors after legalize ops.
if (!VT.isVector() \|\| DCI.isBeforeLegalizeOps()) {		if (!VT.isVector() \|\| DCI.isBeforeLegalizeOps()) {
// Canonicalize setlt X, Max --> setne X, Max		// Canonicalize setlt X, Max --> setne X, Max
if (C1 == MaxVal)		if (C1 == MaxVal)
return DAG.getSetCC(dl, VT, N0, N1, ISD::SETNE);		return DAG.getSetCC(dl, VT, N0, N1, ISD::SETNE);

// If we have setult X, 1, turn it into seteq X, 0		// If we have setult X, 1, turn it into seteq X, 0
if (C1 == MinVal+1)		if (C1 == MinVal + 1)
return DAG.getSetCC(dl, VT, N0,		return DAG.getSetCC(dl, VT, N0,
DAG.getConstant(MinVal, dl, N0.getValueType()),		DAG.getConstant(MinVal, dl, N0.getValueType()),
ISD::SETEQ);		ISD::SETEQ);
}		}
}		}

if (Cond == ISD::SETGT \|\| Cond == ISD::SETUGT) {		if (Cond == ISD::SETGT \|\| Cond == ISD::SETUGT) {
if (C1 == MaxVal)		if (C1 == MaxVal)
return DAG.getBoolConstant(false, dl, VT, OpVT); // X > MAX --> false		return DAG.getBoolConstant(false, dl, VT, OpVT); // X > MAX --> false

// TODO: Support this for vectors after legalize ops.		// TODO: Support this for vectors after legalize ops.
if (!VT.isVector() \|\| DCI.isBeforeLegalizeOps()) {		if (!VT.isVector() \|\| DCI.isBeforeLegalizeOps()) {
// Canonicalize setgt X, Min --> setne X, Min		// Canonicalize setgt X, Min --> setne X, Min
if (C1 == MinVal)		if (C1 == MinVal)
return DAG.getSetCC(dl, VT, N0, N1, ISD::SETNE);		return DAG.getSetCC(dl, VT, N0, N1, ISD::SETNE);

// If we have setugt X, Max-1, turn it into seteq X, Max		// If we have setugt X, Max-1, turn it into seteq X, Max
if (C1 == MaxVal-1)		if (C1 == MaxVal - 1)
return DAG.getSetCC(dl, VT, N0,		return DAG.getSetCC(dl, VT, N0,
DAG.getConstant(MaxVal, dl, N0.getValueType()),		DAG.getConstant(MaxVal, dl, N0.getValueType()),
ISD::SETEQ);		ISD::SETEQ);
}		}
}		}

if (Cond == ISD::SETEQ \|\| Cond == ISD::SETNE) {		if (Cond == ISD::SETEQ \|\| Cond == ISD::SETNE) {
// (X & (C l>>/<< Y)) ==/!= 0 --> ((X <</l>> Y) & C) ==/!= 0		// (X & (C l>>/<< Y)) ==/!= 0 --> ((X <</l>> Y) & C) ==/!= 0
if (C1.isNullValue())		if (C1.isNullValue())
if (SDValue CC = optimizeSetCCByHoistingAndByConstFromLogicalShift(		if (SDValue CC = optimizeSetCCByHoistingAndByConstFromLogicalShift(
VT, N0, N1, Cond, DCI, dl))		VT, N0, N1, Cond, DCI, dl))
return CC;		return CC;
}		}

// If we have "setcc X, C0", check to see if we can shrink the immediate		// If we have "setcc X, C0", check to see if we can shrink the immediate
// by changing cc.		// by changing cc.
// TODO: Support this for vectors after legalize ops.		// TODO: Support this for vectors after legalize ops.
if (!VT.isVector() \|\| DCI.isBeforeLegalizeOps()) {		if (!VT.isVector() \|\| DCI.isBeforeLegalizeOps()) {
// SETUGT X, SINTMAX -> SETLT X, 0		// SETUGT X, SINTMAX -> SETLT X, 0
// SETUGE X, SINTMIN -> SETLT X, 0		// SETUGE X, SINTMIN -> SETLT X, 0
if ((Cond == ISD::SETUGT && C1.isMaxSignedValue()) \|\|		if ((Cond == ISD::SETUGT && C1.isMaxSignedValue()) \|\|
(Cond == ISD::SETUGE && C1.isMinSignedValue()))		(Cond == ISD::SETUGE && C1.isMinSignedValue()))
return DAG.getSetCC(dl, VT, N0,		return DAG.getSetCC(
DAG.getConstant(0, dl, N1.getValueType()),		dl, VT, N0, DAG.getConstant(0, dl, N1.getValueType()), ISD::SETLT);
ISD::SETLT);

// SETULT X, SINTMIN -> SETGT X, -1		// SETULT X, SINTMIN -> SETGT X, -1
// SETULE X, SINTMAX -> SETGT X, -1		// SETULE X, SINTMAX -> SETGT X, -1
if ((Cond == ISD::SETULT && C1.isMinSignedValue()) \|\|		if ((Cond == ISD::SETULT && C1.isMinSignedValue()) \|\|
(Cond == ISD::SETULE && C1.isMaxSignedValue()))		(Cond == ISD::SETULE && C1.isMaxSignedValue()))
return DAG.getSetCC(dl, VT, N0,		return DAG.getSetCC(dl, VT, N0,
DAG.getAllOnesConstant(dl, N1.getValueType()),		DAG.getAllOnesConstant(dl, N1.getValueType()),
ISD::SETGT);		ISD::SETGT);
Show All 9 Lines	if (auto *N1C = dyn_cast<ConstantSDNode>(N1.getNode())) {

// Fold bit comparisons when we can.		// Fold bit comparisons when we can.
if ((Cond == ISD::SETEQ \|\| Cond == ISD::SETNE) &&		if ((Cond == ISD::SETEQ \|\| Cond == ISD::SETNE) &&
(VT == ShValTy \|\| (isTypeLegal(VT) && VT.bitsLE(ShValTy))) &&		(VT == ShValTy \|\| (isTypeLegal(VT) && VT.bitsLE(ShValTy))) &&
N0.getOpcode() == ISD::AND) {		N0.getOpcode() == ISD::AND) {
if (auto *AndRHS = dyn_cast<ConstantSDNode>(N0.getOperand(1))) {		if (auto *AndRHS = dyn_cast<ConstantSDNode>(N0.getOperand(1))) {
EVT ShiftTy =		EVT ShiftTy =
getShiftAmountTy(ShValTy, Layout, !DCI.isBeforeLegalize());		getShiftAmountTy(ShValTy, Layout, !DCI.isBeforeLegalize());
if (Cond == ISD::SETNE && C1 == 0) {// (X & 8) != 0 --> (X & 8) >> 3		if (Cond == ISD::SETNE && C1 == 0) { // (X & 8) != 0 --> (X & 8) >> 3
// Perform the xform if the AND RHS is a single bit.		// Perform the xform if the AND RHS is a single bit.
unsigned ShCt = AndRHS->getAPIntValue().logBase2();		unsigned ShCt = AndRHS->getAPIntValue().logBase2();
if (AndRHS->getAPIntValue().isPowerOf2() &&		if (AndRHS->getAPIntValue().isPowerOf2() &&
!TLI.shouldAvoidTransformToShift(ShValTy, ShCt)) {		!TLI.shouldAvoidTransformToShift(ShValTy, ShCt)) {
return DAG.getNode(ISD::TRUNCATE, dl, VT,		return DAG.getNode(ISD::TRUNCATE, dl, VT,
DAG.getNode(ISD::SRL, dl, ShValTy, N0,		DAG.getNode(ISD::SRL, dl, ShValTy, N0,
DAG.getConstant(ShCt, dl, ShiftTy)));		DAG.getConstant(ShCt, dl, ShiftTy)));
}		}
Show All 18 Lines	if (C1.getMinSignedBits() <= 64 &&
if ((Cond == ISD::SETEQ \|\| Cond == ISD::SETNE) &&		if ((Cond == ISD::SETEQ \|\| Cond == ISD::SETNE) &&
N0.getOpcode() == ISD::AND && N0.hasOneUse()) {		N0.getOpcode() == ISD::AND && N0.hasOneUse()) {
if (auto *AndRHS = dyn_cast<ConstantSDNode>(N0.getOperand(1))) {		if (auto *AndRHS = dyn_cast<ConstantSDNode>(N0.getOperand(1))) {
const APInt &AndRHSC = AndRHS->getAPIntValue();		const APInt &AndRHSC = AndRHS->getAPIntValue();
if ((-AndRHSC).isPowerOf2() && (AndRHSC & C1) == C1) {		if ((-AndRHSC).isPowerOf2() && (AndRHSC & C1) == C1) {
unsigned ShiftBits = AndRHSC.countTrailingZeros();		unsigned ShiftBits = AndRHSC.countTrailingZeros();
if (!TLI.shouldAvoidTransformToShift(ShValTy, ShiftBits)) {		if (!TLI.shouldAvoidTransformToShift(ShValTy, ShiftBits)) {
SDValue Shift =		SDValue Shift =
DAG.getNode(ISD::SRL, dl, ShValTy, N0.getOperand(0),		DAG.getNode(ISD::SRL, dl, ShValTy, N0.getOperand(0),
DAG.getConstant(ShiftBits, dl, ShiftTy));		DAG.getConstant(ShiftBits, dl, ShiftTy));
SDValue CmpRHS = DAG.getConstant(C1.lshr(ShiftBits), dl, ShValTy);		SDValue CmpRHS = DAG.getConstant(C1.lshr(ShiftBits), dl, ShValTy);
return DAG.getSetCC(dl, VT, Shift, CmpRHS, Cond);		return DAG.getSetCC(dl, VT, Shift, CmpRHS, Cond);
}		}
}		}
}		}
} else if (Cond == ISD::SETULT \|\| Cond == ISD::SETUGE \|\|		} else if (Cond == ISD::SETULT \|\| Cond == ISD::SETUGE \|\|
Cond == ISD::SETULE \|\| Cond == ISD::SETUGT) {		Cond == ISD::SETULE \|\| Cond == ISD::SETUGT) {
bool AdjOne = (Cond == ISD::SETULE \|\| Cond == ISD::SETUGT);		bool AdjOne = (Cond == ISD::SETULE \|\| Cond == ISD::SETUGT);
▲ Show 20 Lines • Show All 50 Lines • ▼ Show 20 Lines	if (!isa<ConstantFPSDNode>(N0) && isa<ConstantFPSDNode>(N1)) {
if (!isCondCodeLegal(Cond, N0.getSimpleValueType())) {		if (!isCondCodeLegal(Cond, N0.getSimpleValueType())) {
// If the comparison was an awkward floating-point == or != and one of		// If the comparison was an awkward floating-point == or != and one of
// the comparison operands is infinity or negative infinity, convert the		// the comparison operands is infinity or negative infinity, convert the
// condition to a less-awkward <= or >=.		// condition to a less-awkward <= or >=.
if (CFP->getValueAPF().isInfinity()) {		if (CFP->getValueAPF().isInfinity()) {
bool IsNegInf = CFP->getValueAPF().isNegative();		bool IsNegInf = CFP->getValueAPF().isNegative();
ISD::CondCode NewCond = ISD::SETCC_INVALID;		ISD::CondCode NewCond = ISD::SETCC_INVALID;
switch (Cond) {		switch (Cond) {
case ISD::SETOEQ: NewCond = IsNegInf ? ISD::SETOLE : ISD::SETOGE; break;		case ISD::SETOEQ:
case ISD::SETUEQ: NewCond = IsNegInf ? ISD::SETULE : ISD::SETUGE; break;		NewCond = IsNegInf ? ISD::SETOLE : ISD::SETOGE;
case ISD::SETUNE: NewCond = IsNegInf ? ISD::SETUGT : ISD::SETULT; break;		break;
case ISD::SETONE: NewCond = IsNegInf ? ISD::SETOGT : ISD::SETOLT; break;		case ISD::SETUEQ:
default: break;		NewCond = IsNegInf ? ISD::SETULE : ISD::SETUGE;
		break;
		case ISD::SETUNE:
		NewCond = IsNegInf ? ISD::SETUGT : ISD::SETULT;
		break;
		case ISD::SETONE:
		NewCond = IsNegInf ? ISD::SETOGT : ISD::SETOLT;
		break;
		default:
		break;
}		}
if (NewCond != ISD::SETCC_INVALID &&		if (NewCond != ISD::SETCC_INVALID &&
isCondCodeLegal(NewCond, N0.getSimpleValueType()))		isCondCodeLegal(NewCond, N0.getSimpleValueType()))
return DAG.getSetCC(dl, VT, N0, N1, NewCond);		return DAG.getSetCC(dl, VT, N0, N1, NewCond);
}		}
}		}
}		}

if (N0 == N1) {		if (N0 == N1) {
// The sext(setcc()) => setcc() optimization relies on the appropriate		// The sext(setcc()) => setcc() optimization relies on the appropriate
// constant being emitted.		// constant being emitted.
assert(!N0.getValueType().isInteger() &&		assert(!N0.getValueType().isInteger() &&
"Integer types should be handled by FoldSetCC");		"Integer types should be handled by FoldSetCC");

bool EqTrue = ISD::isTrueWhenEqual(Cond);		bool EqTrue = ISD::isTrueWhenEqual(Cond);
unsigned UOF = ISD::getUnorderedFlavor(Cond);		unsigned UOF = ISD::getUnorderedFlavor(Cond);
if (UOF == 2) // FP operators that are undefined on NaNs.		if (UOF == 2) // FP operators that are undefined on NaNs.
return DAG.getBoolConstant(EqTrue, dl, VT, OpVT);		return DAG.getBoolConstant(EqTrue, dl, VT, OpVT);
if (UOF == unsigned(EqTrue))		if (UOF == unsigned(EqTrue))
return DAG.getBoolConstant(EqTrue, dl, VT, OpVT);		return DAG.getBoolConstant(EqTrue, dl, VT, OpVT);
// Otherwise, we can't fold it. However, we can simplify it to SETUO/SETO		// Otherwise, we can't fold it. However, we can simplify it to SETUO/SETO
// if it is not already.		// if it is not already.
ISD::CondCode NewCond = UOF == 0 ? ISD::SETO : ISD::SETUO;		ISD::CondCode NewCond = UOF == 0 ? ISD::SETO : ISD::SETUO;
if (NewCond != Cond &&		if (NewCond != Cond && (DCI.isBeforeLegalizeOps() \|\|
(DCI.isBeforeLegalizeOps() \|\|
isCondCodeLegal(NewCond, N0.getSimpleValueType())))		isCondCodeLegal(NewCond, N0.getSimpleValueType())))
return DAG.getSetCC(dl, VT, N0, N1, NewCond);		return DAG.getSetCC(dl, VT, N0, N1, NewCond);
}		}

if ((Cond == ISD::SETEQ \|\| Cond == ISD::SETNE) &&		if ((Cond == ISD::SETEQ \|\| Cond == ISD::SETNE) &&
N0.getValueType().isInteger()) {		N0.getValueType().isInteger()) {
if (N0.getOpcode() == ISD::ADD \|\| N0.getOpcode() == ISD::SUB \|\|		if (N0.getOpcode() == ISD::ADD \|\| N0.getOpcode() == ISD::SUB \|\|
N0.getOpcode() == ISD::XOR) {		N0.getOpcode() == ISD::XOR) {
Show All 17 Lines	if (N0.getOpcode() == ISD::ADD \|\| N0.getOpcode() == ISD::SUB \|\|
// If RHS is a legal immediate value for a compare instruction, we need		// If RHS is a legal immediate value for a compare instruction, we need
// to be careful about increasing register pressure needlessly.		// to be careful about increasing register pressure needlessly.
bool LegalRHSImm = false;		bool LegalRHSImm = false;

if (auto *RHSC = dyn_cast<ConstantSDNode>(N1)) {		if (auto *RHSC = dyn_cast<ConstantSDNode>(N1)) {
if (auto *LHSR = dyn_cast<ConstantSDNode>(N0.getOperand(1))) {		if (auto *LHSR = dyn_cast<ConstantSDNode>(N0.getOperand(1))) {
// Turn (X+C1) == C2 --> X == C2-C1		// Turn (X+C1) == C2 --> X == C2-C1
if (N0.getOpcode() == ISD::ADD && N0.getNode()->hasOneUse()) {		if (N0.getOpcode() == ISD::ADD && N0.getNode()->hasOneUse()) {
return DAG.getSetCC(dl, VT, N0.getOperand(0),		return DAG.getSetCC(
DAG.getConstant(RHSC->getAPIntValue()-		dl, VT, N0.getOperand(0),
LHSR->getAPIntValue(),		DAG.getConstant(RHSC->getAPIntValue() - LHSR->getAPIntValue(),
dl, N0.getValueType()), Cond);		dl, N0.getValueType()),
		Cond);
}		}

// Turn (X^C1) == C2 into X == C1^C2 iff X&~C1 = 0.		// Turn (X^C1) == C2 into X == C1^C2 iff X&~C1 = 0.
if (N0.getOpcode() == ISD::XOR)		if (N0.getOpcode() == ISD::XOR)
// If we know that all of the inverted bits are zero, don't bother		// If we know that all of the inverted bits are zero, don't bother
// performing the inversion.		// performing the inversion.
if (DAG.MaskedValueIsZero(N0.getOperand(0), ~LHSR->getAPIntValue()))		if (DAG.MaskedValueIsZero(N0.getOperand(0), ~LHSR->getAPIntValue()))
return		return DAG.getSetCC(
DAG.getSetCC(dl, VT, N0.getOperand(0),		dl, VT, N0.getOperand(0),
DAG.getConstant(LHSR->getAPIntValue() ^		DAG.getConstant(LHSR->getAPIntValue() ^ RHSC->getAPIntValue(),
RHSC->getAPIntValue(),
dl, N0.getValueType()),		dl, N0.getValueType()),
Cond);		Cond);
}		}

// Turn (C1-X) == C2 --> X == C1-C2		// Turn (C1-X) == C2 --> X == C1-C2
if (auto *SUBC = dyn_cast<ConstantSDNode>(N0.getOperand(0))) {		if (auto *SUBC = dyn_cast<ConstantSDNode>(N0.getOperand(0))) {
if (N0.getOpcode() == ISD::SUB && N0.getNode()->hasOneUse()) {		if (N0.getOpcode() == ISD::SUB && N0.getNode()->hasOneUse()) {
return		return DAG.getSetCC(
DAG.getSetCC(dl, VT, N0.getOperand(1),		dl, VT, N0.getOperand(1),
DAG.getConstant(SUBC->getAPIntValue() -		DAG.getConstant(SUBC->getAPIntValue() - RHSC->getAPIntValue(),
RHSC->getAPIntValue(),
dl, N0.getValueType()),		dl, N0.getValueType()),
Cond);		Cond);
}		}
}		}

// Could RHSC fold directly into a compare?		// Could RHSC fold directly into a compare?
if (RHSC->getValueType(0).getSizeInBits() <= 64)		if (RHSC->getValueType(0).getSizeInBits() <= 64)
LegalRHSImm = isLegalICmpImmediate(RHSC->getSExtValue());		LegalRHSImm = isLegalICmpImmediate(RHSC->getSExtValue());
}		}

Show All 32 Lines	if (!isIntDivCheap(VT, Attr) && !Attr.hasFnAttribute(Attribute::MinSize)) {
}		}
}		}
}		}

// Fold away ALL boolean setcc's.		// Fold away ALL boolean setcc's.
if (N0.getValueType().getScalarType() == MVT::i1 && foldBooleans) {		if (N0.getValueType().getScalarType() == MVT::i1 && foldBooleans) {
SDValue Temp;		SDValue Temp;
switch (Cond) {		switch (Cond) {
default: llvm_unreachable("Unknown integer setcc!");		default:
		llvm_unreachable("Unknown integer setcc!");
case ISD::SETEQ: // X == Y -> ~(X^Y)		case ISD::SETEQ: // X == Y -> ~(X^Y)
Temp = DAG.getNode(ISD::XOR, dl, OpVT, N0, N1);		Temp = DAG.getNode(ISD::XOR, dl, OpVT, N0, N1);
N0 = DAG.getNOT(dl, Temp, OpVT);		N0 = DAG.getNOT(dl, Temp, OpVT);
if (!DCI.isCalledByLegalizer())		if (!DCI.isCalledByLegalizer())
DCI.AddToWorklist(Temp.getNode());		DCI.AddToWorklist(Temp.getNode());
break;		break;
case ISD::SETNE: // X != Y --> (X^Y)		case ISD::SETNE: // X != Y --> (X^Y)
N0 = DAG.getNode(ISD::XOR, dl, OpVT, N0, N1);		N0 = DAG.getNode(ISD::XOR, dl, OpVT, N0, N1);
break;		break;
case ISD::SETGT: // X >s Y --> X == 0 & Y == 1 --> ~X & Y		case ISD::SETGT: // X >s Y --> X == 0 & Y == 1 --> ~X & Y
case ISD::SETULT: // X <u Y --> X == 0 & Y == 1 --> ~X & Y		case ISD::SETULT: // X <u Y --> X == 0 & Y == 1 --> ~X & Y
Temp = DAG.getNOT(dl, N0, OpVT);		Temp = DAG.getNOT(dl, N0, OpVT);
N0 = DAG.getNode(ISD::AND, dl, OpVT, N1, Temp);		N0 = DAG.getNode(ISD::AND, dl, OpVT, N1, Temp);
if (!DCI.isCalledByLegalizer())		if (!DCI.isCalledByLegalizer())
DCI.AddToWorklist(Temp.getNode());		DCI.AddToWorklist(Temp.getNode());
▲ Show 20 Lines • Show All 75 Lines • ▼ Show 20 Lines
//===----------------------------------------------------------------------===//		//===----------------------------------------------------------------------===//

TargetLowering::ConstraintType		TargetLowering::ConstraintType
TargetLowering::getConstraintType(StringRef Constraint) const {		TargetLowering::getConstraintType(StringRef Constraint) const {
unsigned S = Constraint.size();		unsigned S = Constraint.size();

if (S == 1) {		if (S == 1) {
switch (Constraint[0]) {		switch (Constraint[0]) {
default: break;		default:
		break;
case 'r':		case 'r':
return C_RegisterClass;		return C_RegisterClass;
case 'm': // memory		case 'm': // memory
case 'o': // offsetable		case 'o': // offsetable
case 'V': // not offsetable		case 'V': // not offsetable
return C_Memory;		return C_Memory;
case 'n': // Simple Integer		case 'n': // Simple Integer
case 'E': // Floating Point Constant		case 'E': // Floating Point Constant
▲ Show 20 Lines • Show All 44 Lines • ▼ Show 20 Lines

/// Lower the specified operand into the Ops vector.		/// Lower the specified operand into the Ops vector.
/// If it is invalid, don't add anything to Ops.		/// If it is invalid, don't add anything to Ops.
void TargetLowering::LowerAsmOperandForConstraint(SDValue Op,		void TargetLowering::LowerAsmOperandForConstraint(SDValue Op,
std::string &Constraint,		std::string &Constraint,
std::vector<SDValue> &Ops,		std::vector<SDValue> &Ops,
SelectionDAG &DAG) const {		SelectionDAG &DAG) const {

if (Constraint.length() > 1) return;		if (Constraint.length() > 1)
		return;

char ConstraintLetter = Constraint[0];		char ConstraintLetter = Constraint[0];
switch (ConstraintLetter) {		switch (ConstraintLetter) {
default: break;		default:
		break;
case 'X': // Allows any operand; labels (basic block) use this.		case 'X': // Allows any operand; labels (basic block) use this.
if (Op.getOpcode() == ISD::BasicBlock \|\|		if (Op.getOpcode() == ISD::BasicBlock \|\|
Op.getOpcode() == ISD::TargetBlockAddress) {		Op.getOpcode() == ISD::TargetBlockAddress) {
Ops.push_back(Op);		Ops.push_back(Op);
return;		return;
}		}
LLVM_FALLTHROUGH;		LLVM_FALLTHROUGH;
case 'i': // Simple Integer or Relocatable Constant		case 'i': // Simple Integer or Relocatable Constant
case 'n': // Simple Integer		case 'n': // Simple Integer
case 's': { // Relocatable Constant		case 's': { // Relocatable Constant

GlobalAddressSDNode *GA;		GlobalAddressSDNode *GA;
ConstantSDNode *C;		ConstantSDNode *C;
BlockAddressSDNode *BA;		BlockAddressSDNode *BA;
uint64_t Offset = 0;		uint64_t Offset = 0;

// Match (GA) or (C) or (GA+C) or (GA-C) or ((GA+C)+C) or (((GA+C)+C)+C),		// Match (GA) or (C) or (GA+C) or (GA-C) or ((GA+C)+C) or (((GA+C)+C)+C),
// etc., since getelementpointer is variadic. We can't use		// etc., since getelementpointer is variadic. We can't use
// SelectionDAG::FoldSymbolOffset because it expects the GA to be accessible		// SelectionDAG::FoldSymbolOffset because it expects the GA to be accessible
// while in this case the GA may be furthest from the root node which is		// while in this case the GA may be furthest from the root node which is
// likely an ISD::ADD.		// likely an ISD::ADD.
while (1) {		while (1) {
if ((GA = dyn_cast<GlobalAddressSDNode>(Op)) && ConstraintLetter != 'n') {		if ((GA = dyn_cast<GlobalAddressSDNode>(Op)) && ConstraintLetter != 'n') {
Ops.push_back(DAG.getTargetGlobalAddress(GA->getGlobal(), SDLoc(Op),		Ops.push_back(DAG.getTargetGlobalAddress(GA->getGlobal(), SDLoc(Op),
GA->getValueType(0),		GA->getValueType(0),
Offset + GA->getOffset()));		Offset + GA->getOffset()));
return;		return;
} else if ((C = dyn_cast<ConstantSDNode>(Op)) &&		} else if ((C = dyn_cast<ConstantSDNode>(Op)) &&
ConstraintLetter != 's') {		ConstraintLetter != 's') {
// gcc prints these as sign extended. Sign extend value to 64 bits		// gcc prints these as sign extended. Sign extend value to 64 bits
// now; without this it would get ZExt'd later in		// now; without this it would get ZExt'd later in
// ScheduleDAGSDNodes::EmitNode, which is very generic.		// ScheduleDAGSDNodes::EmitNode, which is very generic.
bool IsBool = C->getConstantIntValue()->getBitWidth() == 1;		bool IsBool = C->getConstantIntValue()->getBitWidth() == 1;
BooleanContent BCont = getBooleanContents(MVT::i64);		BooleanContent BCont = getBooleanContents(MVT::i64);
ISD::NodeType ExtOpc = IsBool ? getExtendForContent(BCont)		ISD::NodeType ExtOpc =
: ISD::SIGN_EXTEND;		IsBool ? getExtendForContent(BCont) : ISD::SIGN_EXTEND;
int64_t ExtVal = ExtOpc == ISD::ZERO_EXTEND ? C->getZExtValue()		int64_t ExtVal =
: C->getSExtValue();		ExtOpc == ISD::ZERO_EXTEND ? C->getZExtValue() : C->getSExtValue();
Ops.push_back(DAG.getTargetConstant(Offset + ExtVal,		Ops.push_back(
SDLoc(C), MVT::i64));		DAG.getTargetConstant(Offset + ExtVal, SDLoc(C), MVT::i64));
return;		return;
} else if ((BA = dyn_cast<BlockAddressSDNode>(Op)) &&		} else if ((BA = dyn_cast<BlockAddressSDNode>(Op)) &&
ConstraintLetter != 'n') {		ConstraintLetter != 'n') {
Ops.push_back(DAG.getTargetBlockAddress(		Ops.push_back(DAG.getTargetBlockAddress(
BA->getBlockAddress(), BA->getValueType(0),		BA->getBlockAddress(), BA->getValueType(0),
Offset + BA->getOffset(), BA->getTargetFlags()));		Offset + BA->getOffset(), BA->getTargetFlags()));
return;		return;
} else {		} else {
Show All 34 Lines	TargetLowering::getRegForInlineAsmConstraint(const TargetRegisterInfo *RI,

// Figure out which register class contains this reg.		// Figure out which register class contains this reg.
for (const TargetRegisterClass *RC : RI->regclasses()) {		for (const TargetRegisterClass *RC : RI->regclasses()) {
// If none of the value types for this register class are valid, we		// If none of the value types for this register class are valid, we
// can't use it. For example, 64-bit reg classes on 32-bit targets.		// can't use it. For example, 64-bit reg classes on 32-bit targets.
if (!isLegalRC(RI, RC))		if (!isLegalRC(RI, RC))
continue;		continue;

for (TargetRegisterClass::iterator I = RC->begin(), E = RC->end();		for (TargetRegisterClass::iterator I = RC->begin(), E = RC->end(); I != E;
I != E; ++I) {		++I) {
if (RegName.equals_lower(RI->getRegAsmName(*I))) {		if (RegName.equals_lower(RI->getRegAsmName(*I))) {
std::pair<unsigned, const TargetRegisterClass *> S =		std::pair<unsigned, const TargetRegisterClass *> S =
std::make_pair(*I, RC);		std::make_pair(*I, RC);

// If this register class has the requested value type, return it,		// If this register class has the requested value type, return it,
// otherwise keep searching and return the first class found		// otherwise keep searching and return the first class found
// if no other is found which explicitly has the requested type.		// if no other is found which explicitly has the requested type.
if (RI->isTypeLegalForClass(*RC, VT))		if (RI->isTypeLegalForClass(*RC, VT))
▲ Show 20 Lines • Show All 96 Lines • ▼ Show 20 Lines	if (OpInfo.CallOperandVal) {
if (STy->getNumElements() == 1)		if (STy->getNumElements() == 1)
OpTy = STy->getElementType(0);		OpTy = STy->getElementType(0);

// If OpTy is not a single value, it may be a struct/union that we		// If OpTy is not a single value, it may be a struct/union that we
// can tile with integers.		// can tile with integers.
if (!OpTy->isSingleValueType() && OpTy->isSized()) {		if (!OpTy->isSingleValueType() && OpTy->isSized()) {
unsigned BitSize = DL.getTypeSizeInBits(OpTy);		unsigned BitSize = DL.getTypeSizeInBits(OpTy);
switch (BitSize) {		switch (BitSize) {
default: break;		default:
		break;
case 1:		case 1:
case 8:		case 8:
case 16:		case 16:
case 32:		case 32:
case 64:		case 64:
case 128:		case 128:
OpInfo.ConstraintVT =		OpInfo.ConstraintVT =
MVT::getVT(IntegerType::get(OpTy->getContext(), BitSize), true);		MVT::getVT(IntegerType::get(OpTy->getContext(), BitSize), true);
▲ Show 20 Lines • Show All 116 Lines • ▼ Show 20 Lines	static unsigned getConstraintGenerality(TargetLowering::ConstraintType CT) {
}		}
llvm_unreachable("Invalid constraint type");		llvm_unreachable("Invalid constraint type");
}		}

/// Examine constraint type and operand type and determine a weight value.		/// Examine constraint type and operand type and determine a weight value.
/// This object must already have been set up with the operand type		/// This object must already have been set up with the operand type
/// and the current alternative constraint selected.		/// and the current alternative constraint selected.
TargetLowering::ConstraintWeight		TargetLowering::ConstraintWeight
TargetLowering::getMultipleConstraintMatchWeight(		TargetLowering::getMultipleConstraintMatchWeight(AsmOperandInfo &info,
		Lint: Pre-merge checks Inline Actions clang-tidy: warning: invalid case style for parameter 'info' [readability-identifier-naming] not useful Lint: Pre-merge checks: clang-tidy: warning: invalid case style for parameter 'info' [readability-identifier-naming]…
AsmOperandInfo &info, int maIndex) const {		int maIndex) const {
		Lint: Pre-merge checks Inline Actions clang-tidy: warning: invalid case style for parameter 'maIndex' [readability-identifier-naming] not useful Lint: Pre-merge checks: clang-tidy: warning: invalid case style for parameter 'maIndex' [readability-identifier-naming]…
InlineAsm::ConstraintCodeVector *rCodes;		InlineAsm::ConstraintCodeVector *rCodes;
if (maIndex >= (int)info.multipleAlternatives.size())		if (maIndex >= (int)info.multipleAlternatives.size())
rCodes = &info.Codes;		rCodes = &info.Codes;
else		else
rCodes = &info.multipleAlternatives[maIndex].Codes;		rCodes = &info.multipleAlternatives[maIndex].Codes;
ConstraintWeight BestWeight = CW_Invalid;		ConstraintWeight BestWeight = CW_Invalid;

// Loop over the options, keeping track of the most general one.		// Loop over the options, keeping track of the most general one.
for (unsigned i = 0, e = rCodes->size(); i != e; ++i) {		for (unsigned i = 0, e = rCodes->size(); i != e; ++i) {
ConstraintWeight weight =		ConstraintWeight weight =
getSingleConstraintMatchWeight(info, (*rCodes)[i].c_str());		getSingleConstraintMatchWeight(info, (*rCodes)[i].c_str());
if (weight > BestWeight)		if (weight > BestWeight)
BestWeight = weight;		BestWeight = weight;
}		}

return BestWeight;		return BestWeight;
}		}

/// Examine constraint type and operand type and determine a weight value.		/// Examine constraint type and operand type and determine a weight value.
/// This object must already have been set up with the operand type		/// This object must already have been set up with the operand type
/// and the current alternative constraint selected.		/// and the current alternative constraint selected.
TargetLowering::ConstraintWeight		TargetLowering::ConstraintWeight
TargetLowering::getSingleConstraintMatchWeight(		TargetLowering::getSingleConstraintMatchWeight(AsmOperandInfo &info,
		Lint: Pre-merge checks Inline Actions clang-tidy: warning: invalid case style for parameter 'info' [readability-identifier-naming] not useful Lint: Pre-merge checks: clang-tidy: warning: invalid case style for parameter 'info' [readability-identifier-naming]…
AsmOperandInfo &info, const char *constraint) const {		const char *constraint) const {
		Lint: Pre-merge checks Inline Actions clang-tidy: warning: invalid case style for parameter 'constraint' [readability-identifier-naming] not useful Lint: Pre-merge checks: clang-tidy: warning: invalid case style for parameter 'constraint' [readability-identifier…
ConstraintWeight weight = CW_Invalid;		ConstraintWeight weight = CW_Invalid;
Value *CallOperandVal = info.CallOperandVal;		Value *CallOperandVal = info.CallOperandVal;
// If we don't have a value, we can't do a match,		// If we don't have a value, we can't do a match,
// but allow it at the lowest weight.		// but allow it at the lowest weight.
if (!CallOperandVal)		if (!CallOperandVal)
return CW_Default;		return CW_Default;
// Look at the constraint type.		// Look at the constraint type.
switch (*constraint) {		switch (*constraint) {
case 'i': // immediate integer.		case 'i': // immediate integer.
case 'n': // immediate integer with a known value.		case 'n': // immediate integer with a known value.
if (isa<ConstantInt>(CallOperandVal))		if (isa<ConstantInt>(CallOperandVal))
weight = CW_Constant;		weight = CW_Constant;
break;		break;
case 's': // non-explicit intregal immediate.		case 's': // non-explicit intregal immediate.
if (isa<GlobalValue>(CallOperandVal))		if (isa<GlobalValue>(CallOperandVal))
weight = CW_Constant;		weight = CW_Constant;
break;		break;
case 'E': // immediate float if host format.		case 'E': // immediate float if host format.
case 'F': // immediate float.		case 'F': // immediate float.
if (isa<ConstantFP>(CallOperandVal))		if (isa<ConstantFP>(CallOperandVal))
weight = CW_Constant;		weight = CW_Constant;
break;		break;
case '<': // memory operand with autodecrement.		case '<': // memory operand with autodecrement.
case '>': // memory operand with autoincrement.		case '>': // memory operand with autoincrement.
case 'm': // memory operand.		case 'm': // memory operand.
case 'o': // offsettable memory operand		case 'o': // offsettable memory operand
case 'V': // non-offsettable memory operand		case 'V': // non-offsettable memory operand
weight = CW_Memory;		weight = CW_Memory;
break;		break;
case 'r': // general register.		case 'r': // general register.
case 'g': // general register, memory operand or immediate integer.		case 'g': // general register, memory operand or immediate integer.
// note: Clang converts "g" to "imr".		// note: Clang converts "g" to "imr".
if (CallOperandVal->getType()->isIntegerTy())		if (CallOperandVal->getType()->isIntegerTy())
weight = CW_Register;		weight = CW_Register;
break;		break;
case 'X': // any operand.		case 'X': // any operand.
default:		default:
weight = CW_Default;		weight = CW_Default;
break;		break;
}		}
return weight;		return weight;
}		}

/// If there are multiple different constraints that we could pick for this		/// If there are multiple different constraints that we could pick for this
Show All 12 Lines
///		///
/// 1) If there is an 'other' constraint, and if the operand is valid for		/// 1) If there is an 'other' constraint, and if the operand is valid for
/// that constraint, use it. This makes us take advantage of 'i'		/// that constraint, use it. This makes us take advantage of 'i'
/// constraints when available.		/// constraints when available.
/// 2) Otherwise, pick the most general constraint present. This prefers		/// 2) Otherwise, pick the most general constraint present. This prefers
/// 'm' over 'r', for example.		/// 'm' over 'r', for example.
///		///
static void ChooseConstraint(TargetLowering::AsmOperandInfo &OpInfo,		static void ChooseConstraint(TargetLowering::AsmOperandInfo &OpInfo,
const TargetLowering &TLI,		const TargetLowering &TLI, SDValue Op,
SDValue Op, SelectionDAG *DAG) {		SelectionDAG *DAG) {
assert(OpInfo.Codes.size() > 1 && "Doesn't have multiple constraint options");		assert(OpInfo.Codes.size() > 1 && "Doesn't have multiple constraint options");
unsigned BestIdx = 0;		unsigned BestIdx = 0;
TargetLowering::ConstraintType BestType = TargetLowering::C_Unknown;		TargetLowering::ConstraintType BestType = TargetLowering::C_Unknown;
int BestGenerality = -1;		int BestGenerality = -1;

// Loop over the options, keeping track of the most general one.		// Loop over the options, keeping track of the most general one.
for (unsigned i = 0, e = OpInfo.Codes.size(); i != e; ++i) {		for (unsigned i = 0, e = OpInfo.Codes.size(); i != e; ++i) {
TargetLowering::ConstraintType CType =		TargetLowering::ConstraintType CType =
TLI.getConstraintType(OpInfo.Codes[i]);		TLI.getConstraintType(OpInfo.Codes[i]);

// Indirect 'other' or 'immediate' constraints are not allowed.		// Indirect 'other' or 'immediate' constraints are not allowed.
if (OpInfo.isIndirect && !(CType == TargetLowering::C_Memory \|\|		if (OpInfo.isIndirect && !(CType == TargetLowering::C_Memory \|\|
CType == TargetLowering::C_Register \|\|		CType == TargetLowering::C_Register \|\|
CType == TargetLowering::C_RegisterClass))		CType == TargetLowering::C_RegisterClass))
continue;		continue;

// If this is an 'other' or 'immediate' constraint, see if the operand is		// If this is an 'other' or 'immediate' constraint, see if the operand is
// valid for it. For example, on X86 we might have an 'rI' constraint. If		// valid for it. For example, on X86 we might have an 'rI' constraint. If
// the operand is an integer in the range [0..31] we want to use I (saving a		// the operand is an integer in the range [0..31] we want to use I (saving a
// load of a register), otherwise we must use 'r'.		// load of a register), otherwise we must use 'r'.
if ((CType == TargetLowering::C_Other \|\|		if ((CType == TargetLowering::C_Other \|\|
CType == TargetLowering::C_Immediate) && Op.getNode()) {		CType == TargetLowering::C_Immediate) &&
		Op.getNode()) {
assert(OpInfo.Codes[i].size() == 1 &&		assert(OpInfo.Codes[i].size() == 1 &&
"Unhandled multi-letter 'other' constraint");		"Unhandled multi-letter 'other' constraint");
std::vector<SDValue> ResultOps;		std::vector<SDValue> ResultOps;
TLI.LowerAsmOperandForConstraint(Op, OpInfo.Codes[i],		TLI.LowerAsmOperandForConstraint(Op, OpInfo.Codes[i], ResultOps, *DAG);
ResultOps, *DAG);
if (!ResultOps.empty()) {		if (!ResultOps.empty()) {
BestType = CType;		BestType = CType;
BestIdx = i;		BestIdx = i;
break;		break;
}		}
}		}

// Things with matching constraints can only be registers, per gcc		// Things with matching constraints can only be registers, per gcc
Show All 11 Lines	static void ChooseConstraint(TargetLowering::AsmOperandInfo &OpInfo,
}		}

OpInfo.ConstraintCode = OpInfo.Codes[BestIdx];		OpInfo.ConstraintCode = OpInfo.Codes[BestIdx];
OpInfo.ConstraintType = BestType;		OpInfo.ConstraintType = BestType;
}		}

/// Determines the constraint code and constraint type to use for the specific		/// Determines the constraint code and constraint type to use for the specific
/// AsmOperandInfo, setting OpInfo.ConstraintCode and OpInfo.ConstraintType.		/// AsmOperandInfo, setting OpInfo.ConstraintCode and OpInfo.ConstraintType.
void TargetLowering::ComputeConstraintToUse(AsmOperandInfo &OpInfo,		void TargetLowering::ComputeConstraintToUse(AsmOperandInfo &OpInfo, SDValue Op,
		Lint: Pre-merge checks Inline Actions clang-tidy: warning: invalid case style for function 'ComputeConstraintToUse' [readability-identifier-naming] not useful Lint: Pre-merge checks: clang-tidy: warning: invalid case style for function 'ComputeConstraintToUse' [readability…
SDValue Op,
SelectionDAG *DAG) const {		SelectionDAG *DAG) const {
assert(!OpInfo.Codes.empty() && "Must have at least one constraint");		assert(!OpInfo.Codes.empty() && "Must have at least one constraint");

// Single-letter constraints ('r') are very common.		// Single-letter constraints ('r') are very common.
if (OpInfo.Codes.size() == 1) {		if (OpInfo.Codes.size() == 1) {
OpInfo.ConstraintCode = OpInfo.Codes[0];		OpInfo.ConstraintCode = OpInfo.Codes[0];
OpInfo.ConstraintType = getConstraintType(OpInfo.ConstraintCode);		OpInfo.ConstraintType = getConstraintType(OpInfo.ConstraintCode);
} else {		} else {
▲ Show 20 Lines • Show All 79 Lines • ▼ Show 20 Lines	if (UseSRA) {
Flags.setExact(true);		Flags.setExact(true);
Res = DAG.getNode(ISD::SRA, dl, VT, Res, Shift, Flags);		Res = DAG.getNode(ISD::SRA, dl, VT, Res, Shift, Flags);
Created.push_back(Res.getNode());		Created.push_back(Res.getNode());
}		}

return DAG.getNode(ISD::MUL, dl, VT, Res, Factor);		return DAG.getNode(ISD::MUL, dl, VT, Res, Factor);
}		}

SDValue TargetLowering::BuildSDIVPow2(SDNode *N, const APInt &Divisor,		SDValue
		TargetLowering::BuildSDIVPow2(SDNode *N, const APInt &Divisor,
		Lint: Pre-merge checks Inline Actions clang-tidy: warning: invalid case style for function 'BuildSDIVPow2' [readability-identifier-naming] not useful Lint: Pre-merge checks: clang-tidy: warning: invalid case style for function 'BuildSDIVPow2' [readability-identifier…
SelectionDAG &DAG,		SelectionDAG &DAG,
SmallVectorImpl<SDNode *> &Created) const {		SmallVectorImpl<SDNode *> &Created) const {
AttributeList Attr = DAG.getMachineFunction().getFunction().getAttributes();		AttributeList Attr = DAG.getMachineFunction().getFunction().getAttributes();
const TargetLowering &TLI = DAG.getTargetLoweringInfo();		const TargetLowering &TLI = DAG.getTargetLoweringInfo();
if (TLI.isIntDivCheap(N->getValueType(0), Attr))		if (TLI.isIntDivCheap(N->getValueType(0), Attr))
return SDValue(N, 0); // Lower SDIV as SDIV		return SDValue(N, 0); // Lower SDIV as SDIV
return SDValue();		return SDValue();
}		}

/// Given an ISD::SDIV node expressing a divide by constant,		/// Given an ISD::SDIV node expressing a divide by constant,
/// return a DAG expression to select that will generate the same value by		/// return a DAG expression to select that will generate the same value by
/// multiplying by a magic number.		/// multiplying by a magic number.
/// Ref: "Hacker's Delight" or "The PowerPC Compiler Writer's Guide".		/// Ref: "Hacker's Delight" or "The PowerPC Compiler Writer's Guide".
SDValue TargetLowering::BuildSDIV(SDNode *N, SelectionDAG &DAG,		SDValue TargetLowering::BuildSDIV(SDNode *N, SelectionDAG &DAG,
bool IsAfterLegalization,		bool IsAfterOpLegalization,
		bool IsAfterTyLegalization,
SmallVectorImpl<SDNode *> &Created) const {		SmallVectorImpl<SDNode *> &Created) const {
SDLoc dl(N);		SDLoc dl(N);
EVT VT = N->getValueType(0);		EVT VT = N->getValueType(0);
EVT SVT = VT.getScalarType();		EVT SVT = VT.getScalarType();
EVT ShVT = getShiftAmountTy(VT, DAG.getDataLayout());		EVT ShVT = getShiftAmountTy(VT, DAG.getDataLayout(), IsAfterTyLegalization);
		craig.topperUnsubmitted Done Reply Inline Actions IsAfterLegalization refers to LegalOperations not LegalTypes. craig.topper: IsAfterLegalization refers to LegalOperations not LegalTypes.
		nagisaAuthorUnsubmitted Done Reply Inline Actions Any suggestions on how to best approach obtaining the information? Should I just pass in another boolean as an argument from `DAGCombiner`? nagisa: Any suggestions on how to best approach obtaining the information? Should I just pass in…
EVT ShSVT = ShVT.getScalarType();		EVT ShSVT = ShVT.getScalarType();
unsigned EltBits = VT.getScalarSizeInBits();		unsigned EltBits = VT.getScalarSizeInBits();

// Check to see if we can do this.
// FIXME: We should be more aggressive here.
if (!isTypeLegal(VT))
return SDValue();

// If the sdiv has an 'exact' bit we can use a simpler lowering.		// If the sdiv has an 'exact' bit we can use a simpler lowering.
		craig.topperUnsubmitted Done Reply Inline Actions I believe IsAfterLegalization refers to LegalOperations rather than LegalTypes. But if we get here after type legalization then the VT must be Legal or it wouldn't have been seen by DAGCombiner to call this so we might just be able to remove this whole check. craig.topper: I believe IsAfterLegalization refers to LegalOperations rather than LegalTypes. But if we get…
		nagisaAuthorUnsubmitted Done Reply Inline Actions Yeah, I had this removed entirely in an earlier revision and it worked just fine, I had this added back motivating to myself that there might be some weird corner-case that I'm not aware of where “just do it” approach wouldn't be correct. nagisa: Yeah, I had this removed entirely in an earlier revision and it worked just fine, I had this…
if (N->getFlags().hasExact())		if (N->getFlags().hasExact())
return BuildExactSDIV(*this, N, dl, DAG, Created);		return BuildExactSDIV(*this, N, dl, DAG, Created);

SmallVector<SDValue, 16> MagicFactors, Factors, Shifts, ShiftMasks;		SmallVector<SDValue, 16> MagicFactors, Factors, Shifts, ShiftMasks;

auto BuildSDIVPattern = [&](ConstantSDNode *C) {		auto BuildSDIVPattern = [&](ConstantSDNode *C) {
if (C->isNullValue())		if (C->isNullValue())
return false;		return false;
Show All 40 Lines	SDValue TargetLowering::BuildSDIV(SDNode *N, SelectionDAG &DAG,
} else {		} else {
MagicFactor = MagicFactors[0];		MagicFactor = MagicFactors[0];
Factor = Factors[0];		Factor = Factors[0];
Shift = Shifts[0];		Shift = Shifts[0];
ShiftMask = ShiftMasks[0];		ShiftMask = ShiftMasks[0];
}		}

// Multiply the numerator (operand 0) by the magic value.		// Multiply the numerator (operand 0) by the magic value.
// FIXME: We should support doing a MUL in a wider type.
SDValue Q;		SDValue Q;
if (IsAfterLegalization ? isOperationLegal(ISD::MULHS, VT)		if (IsAfterOpLegalization ? isOperationLegal(ISD::MULHS, VT)
: isOperationLegalOrCustom(ISD::MULHS, VT))		: isOperationLegalOrCustom(ISD::MULHS, VT))
Q = DAG.getNode(ISD::MULHS, dl, VT, N0, MagicFactor);		Q = DAG.getNode(ISD::MULHS, dl, VT, N0, MagicFactor);
else if (IsAfterLegalization ? isOperationLegal(ISD::SMUL_LOHI, VT)		else if (IsAfterOpLegalization
		? isOperationLegal(ISD::SMUL_LOHI, VT)
: isOperationLegalOrCustom(ISD::SMUL_LOHI, VT)) {		: isOperationLegalOrCustom(ISD::SMUL_LOHI, VT)) {
SDValue LoHi =		SDValue LoHi =
DAG.getNode(ISD::SMUL_LOHI, dl, DAG.getVTList(VT, VT), N0, MagicFactor);		DAG.getNode(ISD::SMUL_LOHI, dl, DAG.getVTList(VT, VT), N0, MagicFactor);
Q = SDValue(LoHi.getNode(), 1);		Q = SDValue(LoHi.getNode(), 1);
} else		} else {
return SDValue(); // No mulhs or equivalent.		if (IsAfterTyLegalization)
		craig.topperUnsubmitted Done Reply Inline Actions This needs to be a check for LegalTypes not LegalOperations. craig.topper: This needs to be a check for LegalTypes not LegalOperations.
		return SDValue();
		// No MULHU or UMUL_LOHI. Multiply in a wider integer and take the upper
		// part. Even if targets do not support the other two instructions well,
		// they are pretty good at supporting plain `MUL` at any width.
		EVT WideVT = EVT::getIntegerVT(DAG.getContext(), EltBits 2);
		if (VT.isVector())
		WideVT = EVT::getVectorVT(*DAG.getContext(), WideVT,
		VT.getVectorNumElements());
		SDValue DoubleMul = DAG.getNode(
		ISD::MUL, dl, WideVT, DAG.getNode(ISD::SIGN_EXTEND, dl, WideVT, N0),
		DAG.getNode(ISD::SIGN_EXTEND, dl, WideVT, MagicFactor));
		SDValue Upper = DAG.getNode(ISD::SRL, dl, WideVT, DoubleMul,
		DAG.getConstant(EltBits, dl, WideVT));
		SDValue Hi = DAG.getNode(ISD::TRUNCATE, dl, VT, Upper);
		Q = Hi;
		}
Created.push_back(Q.getNode());		Created.push_back(Q.getNode());

// (Optionally) Add/subtract the numerator using Factor.		// (Optionally) Add/subtract the numerator using Factor.
Factor = DAG.getNode(ISD::MUL, dl, VT, N0, Factor);		Factor = DAG.getNode(ISD::MUL, dl, VT, N0, Factor);
Created.push_back(Factor.getNode());		Created.push_back(Factor.getNode());
Q = DAG.getNode(ISD::ADD, dl, VT, Q, Factor);		Q = DAG.getNode(ISD::ADD, dl, VT, Q, Factor);
Created.push_back(Q.getNode());		Created.push_back(Q.getNode());

Show All 10 Lines	SDValue TargetLowering::BuildSDIV(SDNode *N, SelectionDAG &DAG,
return DAG.getNode(ISD::ADD, dl, VT, Q, T);		return DAG.getNode(ISD::ADD, dl, VT, Q, T);
}		}

/// Given an ISD::UDIV node expressing a divide by constant,		/// Given an ISD::UDIV node expressing a divide by constant,
/// return a DAG expression to select that will generate the same value by		/// return a DAG expression to select that will generate the same value by
/// multiplying by a magic number.		/// multiplying by a magic number.
/// Ref: "Hacker's Delight" or "The PowerPC Compiler Writer's Guide".		/// Ref: "Hacker's Delight" or "The PowerPC Compiler Writer's Guide".
SDValue TargetLowering::BuildUDIV(SDNode *N, SelectionDAG &DAG,		SDValue TargetLowering::BuildUDIV(SDNode *N, SelectionDAG &DAG,
bool IsAfterLegalization,		bool IsAfterOpLegalization,
		bool IsAfterTyLegalization,
SmallVectorImpl<SDNode *> &Created) const {		SmallVectorImpl<SDNode *> &Created) const {
SDLoc dl(N);		SDLoc dl(N);
EVT VT = N->getValueType(0);		EVT VT = N->getValueType(0);
EVT SVT = VT.getScalarType();		EVT SVT = VT.getScalarType();
EVT ShVT = getShiftAmountTy(VT, DAG.getDataLayout());		EVT ShVT = getShiftAmountTy(VT, DAG.getDataLayout(), IsAfterTyLegalization);
EVT ShSVT = ShVT.getScalarType();		EVT ShSVT = ShVT.getScalarType();
unsigned EltBits = VT.getScalarSizeInBits();		unsigned EltBits = VT.getScalarSizeInBits();

// Check to see if we can do this.
// FIXME: We should be more aggressive here.
if (!isTypeLegal(VT))
return SDValue();

bool UseNPQ = false;		bool UseNPQ = false;
SmallVector<SDValue, 16> PreShifts, PostShifts, MagicFactors, NPQFactors;		SmallVector<SDValue, 16> PreShifts, PostShifts, MagicFactors, NPQFactors;

auto BuildUDIVPattern = [&](ConstantSDNode *C) {		auto BuildUDIVPattern = [&](ConstantSDNode *C) {
if (C->isNullValue())		if (C->isNullValue())
return false;		return false;
// FIXME: We should use a narrower constant when the upper		// FIXME: We should use a narrower constant when the upper
// bits are known to be zero.		// bits are known to be zero.
▲ Show 20 Lines • Show All 52 Lines • ▼ Show 20 Lines	if (VT.isVector()) {
MagicFactor = MagicFactors[0];		MagicFactor = MagicFactors[0];
PostShift = PostShifts[0];		PostShift = PostShifts[0];
}		}

SDValue Q = N0;		SDValue Q = N0;
Q = DAG.getNode(ISD::SRL, dl, VT, Q, PreShift);		Q = DAG.getNode(ISD::SRL, dl, VT, Q, PreShift);
Created.push_back(Q.getNode());		Created.push_back(Q.getNode());

// FIXME: We should support doing a MUL in a wider type.
auto GetMULHU = [&](SDValue X, SDValue Y) {		auto GetMULHU = [&](SDValue X, SDValue Y) {
if (IsAfterLegalization ? isOperationLegal(ISD::MULHU, VT)		if (IsAfterOpLegalization ? isOperationLegal(ISD::MULHU, VT)
: isOperationLegalOrCustom(ISD::MULHU, VT))		: isOperationLegalOrCustom(ISD::MULHU, VT))
return DAG.getNode(ISD::MULHU, dl, VT, X, Y);		return DAG.getNode(ISD::MULHU, dl, VT, X, Y);
if (IsAfterLegalization ? isOperationLegal(ISD::UMUL_LOHI, VT)		if (IsAfterOpLegalization ? isOperationLegal(ISD::UMUL_LOHI, VT)
: isOperationLegalOrCustom(ISD::UMUL_LOHI, VT)) {		: isOperationLegalOrCustom(ISD::UMUL_LOHI, VT)) {
SDValue LoHi =		SDValue LoHi =
DAG.getNode(ISD::UMUL_LOHI, dl, DAG.getVTList(VT, VT), X, Y);		DAG.getNode(ISD::UMUL_LOHI, dl, DAG.getVTList(VT, VT), X, Y);
return SDValue(LoHi.getNode(), 1);		return SDValue(LoHi.getNode(), 1);
}		}
return SDValue(); // No mulhu or equivalent		if (IsAfterTyLegalization)
		return SDValue();
		// No MULHU or UMUL_LOHI. Multiply in a wider integer and take the upper
		// part. Even if targets do not support the other two instructions well,
		// they are pretty good at supporting plain `MUL` at any width.
		EVT WideVT = EVT::getIntegerVT(DAG.getContext(), EltBits 2);
		if (VT.isVector())
		WideVT = EVT::getVectorVT(*DAG.getContext(), WideVT,
		VT.getVectorNumElements());
		SDValue DoubleMul = DAG.getNode(
		ISD::MUL, dl, WideVT, DAG.getNode(ISD::ZERO_EXTEND, dl, WideVT, X),
		DAG.getNode(ISD::ZERO_EXTEND, dl, WideVT, Y));
		SDValue Upper = DAG.getNode(ISD::SRL, dl, WideVT, DoubleMul,
		DAG.getConstant(EltBits, dl, WideVT));
		SDValue Hi = DAG.getNode(ISD::TRUNCATE, dl, VT, Upper);
		return Hi;
};		};

// Multiply the numerator (operand 0) by the magic value.		// Multiply the numerator (operand 0) by the magic value.
Q = GetMULHU(Q, MagicFactor);		Q = GetMULHU(Q, MagicFactor);
if (!Q)		if (!Q)
return SDValue();		return SDValue();

Created.push_back(Q.getNode());		Created.push_back(Q.getNode());
▲ Show 20 Lines • Show All 543 Lines • ▼ Show 20 Lines	TargetLowering::prepareSREMEqFold(EVT SETCCVT, SDValue REMNode,
// from 'Fold', else pick from 'MaskedIsZero'. Since 'DivisorIsIntMin' is		// from 'Fold', else pick from 'MaskedIsZero'. Since 'DivisorIsIntMin' is
// constant-folded, select can get lowered to a shuffle with constant mask.		// constant-folded, select can get lowered to a shuffle with constant mask.
SDValue Blended =		SDValue Blended =
DAG.getNode(ISD::VSELECT, DL, VT, DivisorIsIntMin, MaskedIsZero, Fold);		DAG.getNode(ISD::VSELECT, DL, VT, DivisorIsIntMin, MaskedIsZero, Fold);

return Blended;		return Blended;
}		}

bool TargetLowering::		bool TargetLowering::verifyReturnAddressArgumentIsConstant(
verifyReturnAddressArgumentIsConstant(SDValue Op, SelectionDAG &DAG) const {		SDValue Op, SelectionDAG &DAG) const {
if (!isa<ConstantSDNode>(Op.getOperand(0))) {		if (!isa<ConstantSDNode>(Op.getOperand(0))) {
DAG.getContext()->emitError("argument to '__builtin_return_address' must "		DAG.getContext()->emitError("argument to '__builtin_return_address' must "
"be a constant integer");		"be a constant integer");
return true;		return true;
}		}

return false;		return false;
}		}
▲ Show 20 Lines • Show All 661 Lines • ▼ Show 20 Lines	SDValue Ret = DAG.getNode(ISD::SUB, dl, DstVT,
DAG.getNode(ISD::XOR, dl, DstVT, R, Sign), Sign);		DAG.getNode(ISD::XOR, dl, DstVT, R, Sign), Sign);

Result = DAG.getSelectCC(dl, Exponent, DAG.getConstant(0, dl, IntVT),		Result = DAG.getSelectCC(dl, Exponent, DAG.getConstant(0, dl, IntVT),
DAG.getConstant(0, dl, DstVT), Ret, ISD::SETLT);		DAG.getConstant(0, dl, DstVT), Ret, ISD::SETLT);
return true;		return true;
}		}

bool TargetLowering::expandFP_TO_UINT(SDNode *Node, SDValue &Result,		bool TargetLowering::expandFP_TO_UINT(SDNode *Node, SDValue &Result,
SDValue &Chain,		SDValue &Chain, SelectionDAG &DAG) const {
SelectionDAG &DAG) const {
SDLoc dl(SDValue(Node, 0));		SDLoc dl(SDValue(Node, 0));
unsigned OpNo = Node->isStrictFPOpcode() ? 1 : 0;		unsigned OpNo = Node->isStrictFPOpcode() ? 1 : 0;
SDValue Src = Node->getOperand(OpNo);		SDValue Src = Node->getOperand(OpNo);

EVT SrcVT = Src.getValueType();		EVT SrcVT = Src.getValueType();
EVT DstVT = Node->getValueType(0);		EVT DstVT = Node->getValueType(0);
EVT SetCCVT =		EVT SetCCVT =
getSetCCResultType(DAG.getDataLayout(), *DAG.getContext(), SrcVT);		getSetCCResultType(DAG.getDataLayout(), *DAG.getContext(), SrcVT);
EVT DstSetCCVT =		EVT DstSetCCVT =
getSetCCResultType(DAG.getDataLayout(), *DAG.getContext(), DstVT);		getSetCCResultType(DAG.getDataLayout(), *DAG.getContext(), DstVT);

// Only expand vector types if we have the appropriate vector bit operations.		// Only expand vector types if we have the appropriate vector bit operations.
unsigned SIntOpcode = Node->isStrictFPOpcode() ? ISD::STRICT_FP_TO_SINT :		unsigned SIntOpcode =
ISD::FP_TO_SINT;		Node->isStrictFPOpcode() ? ISD::STRICT_FP_TO_SINT : ISD::FP_TO_SINT;
if (DstVT.isVector() && (!isOperationLegalOrCustom(SIntOpcode, DstVT) \|\|		if (DstVT.isVector() && (!isOperationLegalOrCustom(SIntOpcode, DstVT) \|\|
!isOperationLegalOrCustomOrPromote(ISD::XOR, SrcVT)))		!isOperationLegalOrCustomOrPromote(ISD::XOR, SrcVT)))
return false;		return false;

// If the maximum float value is smaller then the signed integer range,		// If the maximum float value is smaller then the signed integer range,
// the destination signmask can't be represented by the float, so we can		// the destination signmask can't be represented by the float, so we can
// just use FP_TO_SINT directly.		// just use FP_TO_SINT directly.
const fltSemantics &APFSem = DAG.EVTToAPFloatSemantics(SrcVT);		const fltSemantics &APFSem = DAG.EVTToAPFloatSemantics(SrcVT);
APFloat APF(APFSem, APInt::getNullValue(SrcVT.getScalarSizeInBits()));		APFloat APF(APFSem, APInt::getNullValue(SrcVT.getScalarSizeInBits()));
APInt SignMask = APInt::getSignMask(DstVT.getScalarSizeInBits());		APInt SignMask = APInt::getSignMask(DstVT.getScalarSizeInBits());
if (APFloat::opOverflow &		if (APFloat::opOverflow &
APF.convertFromAPInt(SignMask, false, APFloat::rmNearestTiesToEven)) {		APF.convertFromAPInt(SignMask, false, APFloat::rmNearestTiesToEven)) {
if (Node->isStrictFPOpcode()) {		if (Node->isStrictFPOpcode()) {
Result = DAG.getNode(ISD::STRICT_FP_TO_SINT, dl, { DstVT, MVT::Other },		Result = DAG.getNode(ISD::STRICT_FP_TO_SINT, dl, {DstVT, MVT::Other},
{ Node->getOperand(0), Src });		{Node->getOperand(0), Src});
Chain = Result.getValue(1);		Chain = Result.getValue(1);
} else		} else
Result = DAG.getNode(ISD::FP_TO_SINT, dl, DstVT, Src);		Result = DAG.getNode(ISD::FP_TO_SINT, dl, DstVT, Src);
return true;		return true;
}		}

SDValue Cst = DAG.getConstantFP(APF, dl, SrcVT);		SDValue Cst = DAG.getConstantFP(APF, dl, SrcVT);
SDValue Sel;		SDValue Sel;
Show All 13 Lines	if (Strict) {
// Expand based on maximum range of FP_TO_SINT, if the value exceeds the		// Expand based on maximum range of FP_TO_SINT, if the value exceeds the
// signmask then offset (the result of which should be fully representable).		// signmask then offset (the result of which should be fully representable).
// Sel = Src < 0x8000000000000000		// Sel = Src < 0x8000000000000000
// FltOfs = select Sel, 0, 0x8000000000000000		// FltOfs = select Sel, 0, 0x8000000000000000
// IntOfs = select Sel, 0, 0x8000000000000000		// IntOfs = select Sel, 0, 0x8000000000000000
// Result = fp_to_sint(Src - FltOfs) ^ IntOfs		// Result = fp_to_sint(Src - FltOfs) ^ IntOfs

// TODO: Should any fast-math-flags be set for the FSUB?		// TODO: Should any fast-math-flags be set for the FSUB?
SDValue FltOfs = DAG.getSelect(dl, SrcVT, Sel,		SDValue FltOfs =
DAG.getConstantFP(0.0, dl, SrcVT), Cst);		DAG.getSelect(dl, SrcVT, Sel, DAG.getConstantFP(0.0, dl, SrcVT), Cst);
Sel = DAG.getBoolExtOrTrunc(Sel, dl, DstSetCCVT, DstVT);		Sel = DAG.getBoolExtOrTrunc(Sel, dl, DstSetCCVT, DstVT);
SDValue IntOfs = DAG.getSelect(dl, DstVT, Sel,		SDValue IntOfs =
DAG.getConstant(0, dl, DstVT),		DAG.getSelect(dl, DstVT, Sel, DAG.getConstant(0, dl, DstVT),
DAG.getConstant(SignMask, dl, DstVT));		DAG.getConstant(SignMask, dl, DstVT));
SDValue SInt;		SDValue SInt;
if (Node->isStrictFPOpcode()) {		if (Node->isStrictFPOpcode()) {
SDValue Val = DAG.getNode(ISD::STRICT_FSUB, dl, { SrcVT, MVT::Other },		SDValue Val = DAG.getNode(ISD::STRICT_FSUB, dl, {SrcVT, MVT::Other},
{ Chain, Src, FltOfs });		{Chain, Src, FltOfs});
SInt = DAG.getNode(ISD::STRICT_FP_TO_SINT, dl, { DstVT, MVT::Other },		SInt = DAG.getNode(ISD::STRICT_FP_TO_SINT, dl, {DstVT, MVT::Other},
{ Val.getValue(1), Val });		{Val.getValue(1), Val});
Chain = SInt.getValue(1);		Chain = SInt.getValue(1);
} else {		} else {
SDValue Val = DAG.getNode(ISD::FSUB, dl, SrcVT, Src, FltOfs);		SDValue Val = DAG.getNode(ISD::FSUB, dl, SrcVT, Src, FltOfs);
SInt = DAG.getNode(ISD::FP_TO_SINT, dl, DstVT, Val);		SInt = DAG.getNode(ISD::FP_TO_SINT, dl, DstVT, Val);
}		}
Result = DAG.getNode(ISD::XOR, dl, DstVT, SInt, IntOfs);		Result = DAG.getNode(ISD::XOR, dl, DstVT, SInt, IntOfs);
} else {		} else {
// Expand based on maximum range of FP_TO_SINT:		// Expand based on maximum range of FP_TO_SINT:
Show All 9 Lines	False = DAG.getNode(ISD::XOR, dl, DstVT, False,
DAG.getConstant(SignMask, dl, DstVT));		DAG.getConstant(SignMask, dl, DstVT));
Sel = DAG.getBoolExtOrTrunc(Sel, dl, DstSetCCVT, DstVT);		Sel = DAG.getBoolExtOrTrunc(Sel, dl, DstSetCCVT, DstVT);
Result = DAG.getSelect(dl, DstVT, Sel, True, False);		Result = DAG.getSelect(dl, DstVT, Sel, True, False);
}		}
return true;		return true;
}		}

bool TargetLowering::expandUINT_TO_FP(SDNode *Node, SDValue &Result,		bool TargetLowering::expandUINT_TO_FP(SDNode *Node, SDValue &Result,
SDValue &Chain,		SDValue &Chain, SelectionDAG &DAG) const {
SelectionDAG &DAG) const {
unsigned OpNo = Node->isStrictFPOpcode() ? 1 : 0;		unsigned OpNo = Node->isStrictFPOpcode() ? 1 : 0;
SDValue Src = Node->getOperand(OpNo);		SDValue Src = Node->getOperand(OpNo);
EVT SrcVT = Src.getValueType();		EVT SrcVT = Src.getValueType();
EVT DstVT = Node->getValueType(0);		EVT DstVT = Node->getValueType(0);

if (SrcVT.getScalarType() != MVT::i64 \|\| DstVT.getScalarType() != MVT::f64)		if (SrcVT.getScalarType() != MVT::i64 \|\| DstVT.getScalarType() != MVT::f64)
return false;		return false;

// Only expand vector types if we have the appropriate vector bit operations.		// Only expand vector types if we have the appropriate vector bit operations.
if (SrcVT.isVector() && (!isOperationLegalOrCustom(ISD::SRL, SrcVT) \|\|		if (SrcVT.isVector() && (!isOperationLegalOrCustom(ISD::SRL, SrcVT) \|\|
!isOperationLegalOrCustom(ISD::FADD, DstVT) \|\|		!isOperationLegalOrCustom(ISD::FADD, DstVT) \|\|
!isOperationLegalOrCustom(ISD::FSUB, DstVT) \|\|		!isOperationLegalOrCustom(ISD::FSUB, DstVT) \|\|
!isOperationLegalOrCustomOrPromote(ISD::OR, SrcVT) \|\|		!isOperationLegalOrCustomOrPromote(ISD::OR, SrcVT) \|\|
!isOperationLegalOrCustomOrPromote(ISD::AND, SrcVT)))		!isOperationLegalOrCustomOrPromote(ISD::AND, SrcVT)))
return false;		return false;

SDLoc dl(SDValue(Node, 0));		SDLoc dl(SDValue(Node, 0));
EVT ShiftVT = getShiftAmountTy(SrcVT, DAG.getDataLayout());		EVT ShiftVT = getShiftAmountTy(SrcVT, DAG.getDataLayout());

// Implementation of unsigned i64 to f64 following the algorithm in		// Implementation of unsigned i64 to f64 following the algorithm in
// __floatundidf in compiler_rt. This implementation has the advantage		// __floatundidf in compiler_rt. This implementation has the advantage
// of performing rounding correctly, both in the default rounding mode		// of performing rounding correctly, both in the default rounding mode
// and in all alternate rounding modes.		// and in all alternate rounding modes.
SDValue TwoP52 = DAG.getConstant(UINT64_C(0x4330000000000000), dl, SrcVT);		SDValue TwoP52 = DAG.getConstant(UINT64_C(0x4330000000000000), dl, SrcVT);
SDValue TwoP84PlusTwoP52 = DAG.getConstantFP(		SDValue TwoP84PlusTwoP52 =
BitsToDouble(UINT64_C(0x4530000000100000)), dl, DstVT);		DAG.getConstantFP(BitsToDouble(UINT64_C(0x4530000000100000)), dl, DstVT);
SDValue TwoP84 = DAG.getConstant(UINT64_C(0x4530000000000000), dl, SrcVT);		SDValue TwoP84 = DAG.getConstant(UINT64_C(0x4530000000000000), dl, SrcVT);
SDValue LoMask = DAG.getConstant(UINT64_C(0x00000000FFFFFFFF), dl, SrcVT);		SDValue LoMask = DAG.getConstant(UINT64_C(0x00000000FFFFFFFF), dl, SrcVT);
SDValue HiShift = DAG.getConstant(32, dl, ShiftVT);		SDValue HiShift = DAG.getConstant(32, dl, ShiftVT);

SDValue Lo = DAG.getNode(ISD::AND, dl, SrcVT, Src, LoMask);		SDValue Lo = DAG.getNode(ISD::AND, dl, SrcVT, Src, LoMask);
SDValue Hi = DAG.getNode(ISD::SRL, dl, SrcVT, Src, HiShift);		SDValue Hi = DAG.getNode(ISD::SRL, dl, SrcVT, Src, HiShift);
SDValue LoOr = DAG.getNode(ISD::OR, dl, SrcVT, Lo, TwoP52);		SDValue LoOr = DAG.getNode(ISD::OR, dl, SrcVT, Lo, TwoP52);
SDValue HiOr = DAG.getNode(ISD::OR, dl, SrcVT, Hi, TwoP84);		SDValue HiOr = DAG.getNode(ISD::OR, dl, SrcVT, Hi, TwoP84);
SDValue LoFlt = DAG.getBitcast(DstVT, LoOr);		SDValue LoFlt = DAG.getBitcast(DstVT, LoOr);
SDValue HiFlt = DAG.getBitcast(DstVT, HiOr);		SDValue HiFlt = DAG.getBitcast(DstVT, HiOr);
if (Node->isStrictFPOpcode()) {		if (Node->isStrictFPOpcode()) {
SDValue HiSub =		SDValue HiSub = DAG.getNode(ISD::STRICT_FSUB, dl, {DstVT, MVT::Other},
DAG.getNode(ISD::STRICT_FSUB, dl, {DstVT, MVT::Other},
{Node->getOperand(0), HiFlt, TwoP84PlusTwoP52});		{Node->getOperand(0), HiFlt, TwoP84PlusTwoP52});
Result = DAG.getNode(ISD::STRICT_FADD, dl, {DstVT, MVT::Other},		Result = DAG.getNode(ISD::STRICT_FADD, dl, {DstVT, MVT::Other},
{HiSub.getValue(1), LoFlt, HiSub});		{HiSub.getValue(1), LoFlt, HiSub});
Chain = Result.getValue(1);		Chain = Result.getValue(1);
} else {		} else {
SDValue HiSub =		SDValue HiSub = DAG.getNode(ISD::FSUB, dl, DstVT, HiFlt, TwoP84PlusTwoP52);
DAG.getNode(ISD::FSUB, dl, DstVT, HiFlt, TwoP84PlusTwoP52);
Result = DAG.getNode(ISD::FADD, dl, DstVT, LoFlt, HiSub);		Result = DAG.getNode(ISD::FADD, dl, DstVT, LoFlt, HiSub);
}		}
return true;		return true;
}		}

SDValue TargetLowering::expandFMINNUM_FMAXNUM(SDNode *Node,		SDValue TargetLowering::expandFMINNUM_FMAXNUM(SDNode *Node,
SelectionDAG &DAG) const {		SelectionDAG &DAG) const {
SDLoc dl(Node);		SDLoc dl(Node);
unsigned NewOp = Node->getOpcode() == ISD::FMINNUM ?		unsigned NewOp =
ISD::FMINNUM_IEEE : ISD::FMAXNUM_IEEE;		Node->getOpcode() == ISD::FMINNUM ? ISD::FMINNUM_IEEE : ISD::FMAXNUM_IEEE;
EVT VT = Node->getValueType(0);		EVT VT = Node->getValueType(0);
if (isOperationLegalOrCustom(NewOp, VT)) {		if (isOperationLegalOrCustom(NewOp, VT)) {
SDValue Quiet0 = Node->getOperand(0);		SDValue Quiet0 = Node->getOperand(0);
SDValue Quiet1 = Node->getOperand(1);		SDValue Quiet1 = Node->getOperand(1);

if (!Node->getFlags().hasNoNaNs()) {		if (!Node->getFlags().hasNoNaNs()) {
// Insert canonicalizes if it's possible we need to quiet to get correct		// Insert canonicalizes if it's possible we need to quiet to get correct
// sNaN behavior.		// sNaN behavior.
if (!DAG.isKnownNeverSNaN(Quiet0)) {		if (!DAG.isKnownNeverSNaN(Quiet0)) {
Quiet0 = DAG.getNode(ISD::FCANONICALIZE, dl, VT, Quiet0,		Quiet0 =
Node->getFlags());		DAG.getNode(ISD::FCANONICALIZE, dl, VT, Quiet0, Node->getFlags());
}		}
if (!DAG.isKnownNeverSNaN(Quiet1)) {		if (!DAG.isKnownNeverSNaN(Quiet1)) {
Quiet1 = DAG.getNode(ISD::FCANONICALIZE, dl, VT, Quiet1,		Quiet1 =
Node->getFlags());		DAG.getNode(ISD::FCANONICALIZE, dl, VT, Quiet1, Node->getFlags());
}		}
}		}

return DAG.getNode(NewOp, dl, VT, Quiet0, Quiet1, Node->getFlags());		return DAG.getNode(NewOp, dl, VT, Quiet0, Quiet1, Node->getFlags());
}		}

// If the target has FMINIMUM/FMAXIMUM but not FMINNUM/FMAXNUM use that		// If the target has FMINIMUM/FMAXIMUM but not FMINNUM/FMAXNUM use that
// instead if there are no NaNs.		// instead if there are no NaNs.
▲ Show 20 Lines • Show All 214 Lines • ▼ Show 20 Lines	SDValue Shift =
DAG.getNode(ISD::SRA, dl, VT, Op,		DAG.getNode(ISD::SRA, dl, VT, Op,
DAG.getConstant(VT.getScalarSizeInBits() - 1, dl, ShVT));		DAG.getConstant(VT.getScalarSizeInBits() - 1, dl, ShVT));
SDValue Add = DAG.getNode(ISD::ADD, dl, VT, Op, Shift);		SDValue Add = DAG.getNode(ISD::ADD, dl, VT, Op, Shift);
Result = DAG.getNode(ISD::XOR, dl, VT, Add, Shift);		Result = DAG.getNode(ISD::XOR, dl, VT, Add, Shift);
return true;		return true;
}		}

std::pair<SDValue, SDValue>		std::pair<SDValue, SDValue>
TargetLowering::scalarizeVectorLoad(LoadSDNode *LD,		TargetLowering::scalarizeVectorLoad(LoadSDNode *LD, SelectionDAG &DAG) const {
SelectionDAG &DAG) const {
SDLoc SL(LD);		SDLoc SL(LD);
SDValue Chain = LD->getChain();		SDValue Chain = LD->getChain();
SDValue BasePTR = LD->getBasePtr();		SDValue BasePTR = LD->getBasePtr();
EVT SrcVT = LD->getMemoryVT();		EVT SrcVT = LD->getMemoryVT();
EVT DstVT = LD->getValueType(0);		EVT DstVT = LD->getValueType(0);
ISD::LoadExtType ExtType = LD->getExtensionType();		ISD::LoadExtType ExtType = LD->getExtensionType();

if (SrcVT.isScalableVector())		if (SrcVT.isScalableVector())
▲ Show 20 Lines • Show All 163 Lines • ▼ Show 20 Lines	TargetLowering::expandUnalignedLoad(LoadSDNode *LD, SelectionDAG &DAG) const {
EVT VT = LD->getValueType(0);		EVT VT = LD->getValueType(0);
EVT LoadedVT = LD->getMemoryVT();		EVT LoadedVT = LD->getMemoryVT();
SDLoc dl(LD);		SDLoc dl(LD);
auto &MF = DAG.getMachineFunction();		auto &MF = DAG.getMachineFunction();

if (VT.isFloatingPoint() \|\| VT.isVector()) {		if (VT.isFloatingPoint() \|\| VT.isVector()) {
EVT intVT = EVT::getIntegerVT(*DAG.getContext(), LoadedVT.getSizeInBits());		EVT intVT = EVT::getIntegerVT(*DAG.getContext(), LoadedVT.getSizeInBits());
if (isTypeLegal(intVT) && isTypeLegal(LoadedVT)) {		if (isTypeLegal(intVT) && isTypeLegal(LoadedVT)) {
if (!isOperationLegalOrCustom(ISD::LOAD, intVT) &&		if (!isOperationLegalOrCustom(ISD::LOAD, intVT) && LoadedVT.isVector()) {
LoadedVT.isVector()) {
// Scalarize the load and let the individual components be handled.		// Scalarize the load and let the individual components be handled.
return scalarizeVectorLoad(LD, DAG);		return scalarizeVectorLoad(LD, DAG);
}		}

// Expand to a (misaligned) integer load of the same size,		// Expand to a (misaligned) integer load of the same size,
// then bitconvert to floating point or vector.		// then bitconvert to floating point or vector.
SDValue newLoad = DAG.getLoad(intVT, dl, Chain, Ptr,		SDValue newLoad = DAG.getLoad(intVT, dl, Chain, Ptr, LD->getMemOperand());
		Lint: Pre-merge checks Inline Actions clang-tidy: warning: invalid case style for variable 'newLoad' [readability-identifier-naming] not useful Lint: Pre-merge checks: clang-tidy: warning: invalid case style for variable 'newLoad' [readability-identifier-naming]…
LD->getMemOperand());
SDValue Result = DAG.getNode(ISD::BITCAST, dl, LoadedVT, newLoad);		SDValue Result = DAG.getNode(ISD::BITCAST, dl, LoadedVT, newLoad);
if (LoadedVT != VT)		if (LoadedVT != VT)
Result = DAG.getNode(VT.isFloatingPoint() ? ISD::FP_EXTEND :		Result =
ISD::ANY_EXTEND, dl, VT, Result);		DAG.getNode(VT.isFloatingPoint() ? ISD::FP_EXTEND : ISD::ANY_EXTEND,
		dl, VT, Result);

return std::make_pair(Result, newLoad.getValue(1));		return std::make_pair(Result, newLoad.getValue(1));
}		}

// Copy the value to a (aligned) stack slot using (unaligned) integer		// Copy the value to a (aligned) stack slot using (unaligned) integer
// loads and stores, then do a (aligned) load from the stack slot.		// loads and stores, then do a (aligned) load from the stack slot.
MVT RegVT = getRegisterType(*DAG.getContext(), intVT);		MVT RegVT = getRegisterType(*DAG.getContext(), intVT);
unsigned LoadedBytes = LoadedVT.getStoreSize();		unsigned LoadedBytes = LoadedVT.getStoreSize();
Show All 27 Lines	for (unsigned i = 1; i < NumRegs; i++) {
// Increment the pointers.		// Increment the pointers.
Offset += RegBytes;		Offset += RegBytes;

Ptr = DAG.getObjectPtrOffset(dl, Ptr, PtrIncrement);		Ptr = DAG.getObjectPtrOffset(dl, Ptr, PtrIncrement);
StackPtr = DAG.getObjectPtrOffset(dl, StackPtr, StackPtrIncrement);		StackPtr = DAG.getObjectPtrOffset(dl, StackPtr, StackPtrIncrement);
}		}

// The last copy may be partial. Do an extending load.		// The last copy may be partial. Do an extending load.
EVT MemVT = EVT::getIntegerVT(*DAG.getContext(),		EVT MemVT =
8 * (LoadedBytes - Offset));		EVT::getIntegerVT(DAG.getContext(), 8 (LoadedBytes - Offset));
SDValue Load =		SDValue Load =
DAG.getExtLoad(ISD::EXTLOAD, dl, RegVT, Chain, Ptr,		DAG.getExtLoad(ISD::EXTLOAD, dl, RegVT, Chain, Ptr,
LD->getPointerInfo().getWithOffset(Offset), MemVT,		LD->getPointerInfo().getWithOffset(Offset), MemVT,
LD->getOriginalAlign(), LD->getMemOperand()->getFlags(),		LD->getOriginalAlign(), LD->getMemOperand()->getFlags(),
LD->getAAInfo());		LD->getAAInfo());
// Follow the load with a store to the stack slot. Remember the store.		// Follow the load with a store to the stack slot. Remember the store.
// On big-endian machines this requires a truncating store to ensure		// On big-endian machines this requires a truncating store to ensure
// that the bits end up in the right place.		// that the bits end up in the right place.
Show All 15 Lines	TargetLowering::expandUnalignedLoad(LoadSDNode *LD, SelectionDAG &DAG) const {

assert(LoadedVT.isInteger() && !LoadedVT.isVector() &&		assert(LoadedVT.isInteger() && !LoadedVT.isVector() &&
"Unaligned load of unsupported type.");		"Unaligned load of unsupported type.");

// Compute the new VT that is half the size of the old one. This is an		// Compute the new VT that is half the size of the old one. This is an
// integer MVT.		// integer MVT.
unsigned NumBits = LoadedVT.getSizeInBits();		unsigned NumBits = LoadedVT.getSizeInBits();
EVT NewLoadedVT;		EVT NewLoadedVT;
NewLoadedVT = EVT::getIntegerVT(*DAG.getContext(), NumBits/2);		NewLoadedVT = EVT::getIntegerVT(*DAG.getContext(), NumBits / 2);
NumBits >>= 1;		NumBits >>= 1;

Align Alignment = LD->getOriginalAlign();		Align Alignment = LD->getOriginalAlign();
unsigned IncrementSize = NumBits / 8;		unsigned IncrementSize = NumBits / 8;
ISD::LoadExtType HiExtType = LD->getExtensionType();		ISD::LoadExtType HiExtType = LD->getExtensionType();

// If the original load is NON_EXTLOAD, the hi part load must be ZEXTLOAD.		// If the original load is NON_EXTLOAD, the hi part load must be ZEXTLOAD.
if (HiExtType == ISD::NON_EXTLOAD)		if (HiExtType == ISD::NON_EXTLOAD)
Show All 19 Lines	if (DAG.getDataLayout().isLittleEndian()) {
Ptr = DAG.getObjectPtrOffset(dl, Ptr, TypeSize::Fixed(IncrementSize));		Ptr = DAG.getObjectPtrOffset(dl, Ptr, TypeSize::Fixed(IncrementSize));
Lo = DAG.getExtLoad(ISD::ZEXTLOAD, dl, VT, Chain, Ptr,		Lo = DAG.getExtLoad(ISD::ZEXTLOAD, dl, VT, Chain, Ptr,
LD->getPointerInfo().getWithOffset(IncrementSize),		LD->getPointerInfo().getWithOffset(IncrementSize),
NewLoadedVT, Alignment, LD->getMemOperand()->getFlags(),		NewLoadedVT, Alignment, LD->getMemOperand()->getFlags(),
LD->getAAInfo());		LD->getAAInfo());
}		}

// aggregate the two parts		// aggregate the two parts
SDValue ShiftAmount =		SDValue ShiftAmount = DAG.getConstant(
DAG.getConstant(NumBits, dl, getShiftAmountTy(Hi.getValueType(),		NumBits, dl, getShiftAmountTy(Hi.getValueType(), DAG.getDataLayout()));
DAG.getDataLayout()));
SDValue Result = DAG.getNode(ISD::SHL, dl, VT, Hi, ShiftAmount);		SDValue Result = DAG.getNode(ISD::SHL, dl, VT, Hi, ShiftAmount);
Result = DAG.getNode(ISD::OR, dl, VT, Result, Lo);		Result = DAG.getNode(ISD::OR, dl, VT, Result, Lo);

SDValue TF = DAG.getNode(ISD::TokenFactor, dl, MVT::Other, Lo.getValue(1),		SDValue TF = DAG.getNode(ISD::TokenFactor, dl, MVT::Other, Lo.getValue(1),
Hi.getValue(1));		Hi.getValue(1));

return std::make_pair(Result, TF);		return std::make_pair(Result, TF);
}		}

SDValue TargetLowering::expandUnalignedStore(StoreSDNode *ST,		SDValue TargetLowering::expandUnalignedStore(StoreSDNode *ST,
SelectionDAG &DAG) const {		SelectionDAG &DAG) const {
assert(ST->getAddressingMode() == ISD::UNINDEXED &&		assert(ST->getAddressingMode() == ISD::UNINDEXED &&
"unaligned indexed stores not implemented!");		"unaligned indexed stores not implemented!");
▲ Show 20 Lines • Show All 113 Lines • ▼ Show 20 Lines	Store2 = DAG.getTruncStore(
ST->getPointerInfo().getWithOffset(IncrementSize), NewStoredVT, Alignment,		ST->getPointerInfo().getWithOffset(IncrementSize), NewStoredVT, Alignment,
ST->getMemOperand()->getFlags(), ST->getAAInfo());		ST->getMemOperand()->getFlags(), ST->getAAInfo());

SDValue Result =		SDValue Result =
DAG.getNode(ISD::TokenFactor, dl, MVT::Other, Store1, Store2);		DAG.getNode(ISD::TokenFactor, dl, MVT::Other, Store1, Store2);
return Result;		return Result;
}		}

SDValue		SDValue TargetLowering::IncrementMemoryAddress(SDValue Addr, SDValue Mask,
		Lint: Pre-merge checks Inline Actions clang-tidy: warning: invalid case style for function 'IncrementMemoryAddress' [readability-identifier-naming] not useful Lint: Pre-merge checks: clang-tidy: warning: invalid case style for function 'IncrementMemoryAddress' [readability…
TargetLowering::IncrementMemoryAddress(SDValue Addr, SDValue Mask,
const SDLoc &DL, EVT DataVT,		const SDLoc &DL, EVT DataVT,
SelectionDAG &DAG,		SelectionDAG &DAG,
bool IsCompressedMemory) const {		bool IsCompressedMemory) const {
SDValue Increment;		SDValue Increment;
EVT AddrVT = Addr.getValueType();		EVT AddrVT = Addr.getValueType();
EVT MaskVT = Mask.getValueType();		EVT MaskVT = Mask.getValueType();
assert(DataVT.getVectorElementCount() == MaskVT.getVectorElementCount() &&		assert(DataVT.getVectorElementCount() == MaskVT.getVectorElementCount() &&
"Incompatible types of Data and Mask");		"Incompatible types of Data and Mask");
if (IsCompressedMemory) {		if (IsCompressedMemory) {
if (DataVT.isScalableVector())		if (DataVT.isScalableVector())
report_fatal_error(		report_fatal_error(
"Cannot currently handle compressed memory with scalable vectors");		"Cannot currently handle compressed memory with scalable vectors");
// Incrementing the pointer according to number of '1's in the mask.		// Incrementing the pointer according to number of '1's in the mask.
EVT MaskIntVT = EVT::getIntegerVT(*DAG.getContext(), MaskVT.getSizeInBits());		EVT MaskIntVT =
		EVT::getIntegerVT(*DAG.getContext(), MaskVT.getSizeInBits());
SDValue MaskInIntReg = DAG.getBitcast(MaskIntVT, Mask);		SDValue MaskInIntReg = DAG.getBitcast(MaskIntVT, Mask);
if (MaskIntVT.getSizeInBits() < 32) {		if (MaskIntVT.getSizeInBits() < 32) {
MaskInIntReg = DAG.getNode(ISD::ZERO_EXTEND, DL, MVT::i32, MaskInIntReg);		MaskInIntReg = DAG.getNode(ISD::ZERO_EXTEND, DL, MVT::i32, MaskInIntReg);
MaskIntVT = MVT::i32;		MaskIntVT = MVT::i32;
}		}

// Count '1's with POPCNT.		// Count '1's with POPCNT.
Increment = DAG.getNode(ISD::CTPOP, DL, MaskIntVT, MaskInIntReg);		Increment = DAG.getNode(ISD::CTPOP, DL, MaskIntVT, MaskInIntReg);
Increment = DAG.getZExtOrTrunc(Increment, DL, AddrVT);		Increment = DAG.getZExtOrTrunc(Increment, DL, AddrVT);
// Scale is an element size in bytes.		// Scale is an element size in bytes.
SDValue Scale = DAG.getConstant(DataVT.getScalarSizeInBits() / 8, DL,		SDValue Scale =
AddrVT);		DAG.getConstant(DataVT.getScalarSizeInBits() / 8, DL, AddrVT);
Increment = DAG.getNode(ISD::MUL, DL, AddrVT, Increment, Scale);		Increment = DAG.getNode(ISD::MUL, DL, AddrVT, Increment, Scale);
} else if (DataVT.isScalableVector()) {		} else if (DataVT.isScalableVector()) {
Increment = DAG.getVScale(DL, AddrVT,		Increment = DAG.getVScale(DL, AddrVT,
APInt(AddrVT.getSizeInBits().getFixedSize(),		APInt(AddrVT.getSizeInBits().getFixedSize(),
DataVT.getStoreSize().getKnownMinSize()));		DataVT.getStoreSize().getKnownMinSize()));
} else		} else
Increment = DAG.getConstant(DataVT.getStoreSize(), DL, AddrVT);		Increment = DAG.getConstant(DataVT.getStoreSize(), DL, AddrVT);

return DAG.getNode(ISD::ADD, DL, AddrVT, Addr, Increment);		return DAG.getNode(ISD::ADD, DL, AddrVT, Addr, Increment);
}		}

static SDValue clampDynamicVectorIndex(SelectionDAG &DAG,		static SDValue clampDynamicVectorIndex(SelectionDAG &DAG, SDValue Idx,
SDValue Idx,		EVT VecVT, const SDLoc &dl) {
		Lint: Pre-merge checks Inline Actions clang-tidy: warning: invalid case style for parameter 'dl' [readability-identifier-naming] not useful Lint: Pre-merge checks: clang-tidy: warning: invalid case style for parameter 'dl' [readability-identifier-naming]…
EVT VecVT,
const SDLoc &dl) {
if (!VecVT.isScalableVector() && isa<ConstantSDNode>(Idx))		if (!VecVT.isScalableVector() && isa<ConstantSDNode>(Idx))
return Idx;		return Idx;

EVT IdxVT = Idx.getValueType();		EVT IdxVT = Idx.getValueType();
unsigned NElts = VecVT.getVectorMinNumElements();		unsigned NElts = VecVT.getVectorMinNumElements();
if (VecVT.isScalableVector()) {		if (VecVT.isScalableVector()) {
SDValue VS = DAG.getVScale(dl, IdxVT,		SDValue VS = DAG.getVScale(
APInt(IdxVT.getSizeInBits().getFixedSize(),		dl, IdxVT, APInt(IdxVT.getSizeInBits().getFixedSize(), NElts));
NElts));		SDValue Sub =
SDValue Sub = DAG.getNode(ISD::SUB, dl, IdxVT, VS,		DAG.getNode(ISD::SUB, dl, IdxVT, VS, DAG.getConstant(1, dl, IdxVT));
DAG.getConstant(1, dl, IdxVT));

return DAG.getNode(ISD::UMIN, dl, IdxVT, Idx, Sub);		return DAG.getNode(ISD::UMIN, dl, IdxVT, Idx, Sub);
} else {		} else {
if (isPowerOf2_32(NElts)) {		if (isPowerOf2_32(NElts)) {
APInt Imm = APInt::getLowBitsSet(IdxVT.getSizeInBits(),		APInt Imm = APInt::getLowBitsSet(IdxVT.getSizeInBits(), Log2_32(NElts));
Log2_32(NElts));
return DAG.getNode(ISD::AND, dl, IdxVT, Idx,		return DAG.getNode(ISD::AND, dl, IdxVT, Idx,
DAG.getConstant(Imm, dl, IdxVT));		DAG.getConstant(Imm, dl, IdxVT));
}		}
}		}

return DAG.getNode(ISD::UMIN, dl, IdxVT, Idx,		return DAG.getNode(ISD::UMIN, dl, IdxVT, Idx,
DAG.getConstant(NElts - 1, dl, IdxVT));		DAG.getConstant(NElts - 1, dl, IdxVT));
}		}

SDValue TargetLowering::getVectorElementPointer(SelectionDAG &DAG,		SDValue TargetLowering::getVectorElementPointer(SelectionDAG &DAG,
SDValue VecPtr, EVT VecVT,		SDValue VecPtr, EVT VecVT,
SDValue Index) const {		SDValue Index) const {
SDLoc dl(Index);		SDLoc dl(Index);
// Make sure the index type is big enough to compute in.		// Make sure the index type is big enough to compute in.
Index = DAG.getZExtOrTrunc(Index, dl, VecPtr.getValueType());		Index = DAG.getZExtOrTrunc(Index, dl, VecPtr.getValueType());

EVT EltVT = VecVT.getVectorElementType();		EVT EltVT = VecVT.getVectorElementType();

// Calculate the element offset and add it to the pointer.		// Calculate the element offset and add it to the pointer.
unsigned EltSize = EltVT.getSizeInBits().getFixedSize() / 8; // FIXME: should be ABI size.		unsigned EltSize =
		EltVT.getSizeInBits().getFixedSize() / 8; // FIXME: should be ABI size.
assert(EltSize * 8 == EltVT.getSizeInBits().getFixedSize() &&		assert(EltSize * 8 == EltVT.getSizeInBits().getFixedSize() &&
"Converting bits to bytes lost precision");		"Converting bits to bytes lost precision");

Index = clampDynamicVectorIndex(DAG, Index, VecVT, dl);		Index = clampDynamicVectorIndex(DAG, Index, VecVT, dl);

EVT IdxVT = Index.getValueType();		EVT IdxVT = Index.getValueType();

Index = DAG.getNode(ISD::MUL, dl, IdxVT, Index,		Index = DAG.getNode(ISD::MUL, dl, IdxVT, Index,
Show All 11 Lines	SDValue TargetLowering::LowerToTLSEmulatedModel(const GlobalAddressSDNode *GA,
// __emutls_get_address( address of global variable named "__emutls_v.xyz" )		// __emutls_get_address( address of global variable named "__emutls_v.xyz" )
EVT PtrVT = getPointerTy(DAG.getDataLayout());		EVT PtrVT = getPointerTy(DAG.getDataLayout());
PointerType VoidPtrType = Type::getInt8PtrTy(DAG.getContext());		PointerType VoidPtrType = Type::getInt8PtrTy(DAG.getContext());
SDLoc dl(GA);		SDLoc dl(GA);

ArgListTy Args;		ArgListTy Args;
ArgListEntry Entry;		ArgListEntry Entry;
std::string NameString = ("__emutls_v." + GA->getGlobal()->getName()).str();		std::string NameString = ("__emutls_v." + GA->getGlobal()->getName()).str();
Module VariableModule = const_cast<Module>(GA->getGlobal()->getParent());		Module VariableModule = const_cast<Module >(GA->getGlobal()->getParent());
StringRef EmuTlsVarName(NameString);		StringRef EmuTlsVarName(NameString);
GlobalVariable *EmuTlsVar = VariableModule->getNamedGlobal(EmuTlsVarName);		GlobalVariable *EmuTlsVar = VariableModule->getNamedGlobal(EmuTlsVarName);
assert(EmuTlsVar && "Cannot find EmuTlsVar ");		assert(EmuTlsVar && "Cannot find EmuTlsVar ");
Entry.Node = DAG.getGlobalAddress(EmuTlsVar, dl, PtrVT);		Entry.Node = DAG.getGlobalAddress(EmuTlsVar, dl, PtrVT);
Entry.Ty = VoidPtrType;		Entry.Ty = VoidPtrType;
Args.push_back(Entry);		Args.push_back(Entry);

SDValue EmuTlsGetAddr = DAG.getExternalSymbol("__emutls_get_address", PtrVT);		SDValue EmuTlsGetAddr = DAG.getExternalSymbol("__emutls_get_address", PtrVT);
▲ Show 20 Lines • Show All 83 Lines • ▼ Show 20 Lines	SDValue TargetLowering::expandAddSubSat(SDNode *Node, SelectionDAG &DAG) const {

// FIXME: Should really try to split the vector in case it's legal on a		// FIXME: Should really try to split the vector in case it's legal on a
// subvector.		// subvector.
if (VT.isVector() && !isOperationLegalOrCustom(ISD::VSELECT, VT))		if (VT.isVector() && !isOperationLegalOrCustom(ISD::VSELECT, VT))
return DAG.UnrollVectorOp(Node);		return DAG.UnrollVectorOp(Node);

unsigned BitWidth = LHS.getScalarValueSizeInBits();		unsigned BitWidth = LHS.getScalarValueSizeInBits();
EVT BoolVT = getSetCCResultType(DAG.getDataLayout(), *DAG.getContext(), VT);		EVT BoolVT = getSetCCResultType(DAG.getDataLayout(), *DAG.getContext(), VT);
SDValue Result = DAG.getNode(OverflowOp, dl, DAG.getVTList(VT, BoolVT),		SDValue Result =
LHS, RHS);		DAG.getNode(OverflowOp, dl, DAG.getVTList(VT, BoolVT), LHS, RHS);
SDValue SumDiff = Result.getValue(0);		SDValue SumDiff = Result.getValue(0);
SDValue Overflow = Result.getValue(1);		SDValue Overflow = Result.getValue(1);
SDValue Zero = DAG.getConstant(0, dl, VT);		SDValue Zero = DAG.getConstant(0, dl, VT);
SDValue AllOnes = DAG.getAllOnesConstant(dl, VT);		SDValue AllOnes = DAG.getAllOnesConstant(dl, VT);

if (Opcode == ISD::UADDSAT) {		if (Opcode == ISD::UADDSAT) {
if (getBooleanContents(VT) == ZeroOrNegativeOneBooleanContent) {		if (getBooleanContents(VT) == ZeroOrNegativeOneBooleanContent) {
// (LHS + RHS) \| OverflowMask		// (LHS + RHS) \| OverflowMask
Show All 29 Lines	SDValue TargetLowering::expandShlSat(SDNode *Node, SelectionDAG &DAG) const {
bool IsSigned = Opcode == ISD::SSHLSAT;		bool IsSigned = Opcode == ISD::SSHLSAT;
SDValue LHS = Node->getOperand(0);		SDValue LHS = Node->getOperand(0);
SDValue RHS = Node->getOperand(1);		SDValue RHS = Node->getOperand(1);
EVT VT = LHS.getValueType();		EVT VT = LHS.getValueType();
SDLoc dl(Node);		SDLoc dl(Node);

assert((Node->getOpcode() == ISD::SSHLSAT \|\|		assert((Node->getOpcode() == ISD::SSHLSAT \|\|
Node->getOpcode() == ISD::USHLSAT) &&		Node->getOpcode() == ISD::USHLSAT) &&
"Expected a SHLSAT opcode");		"Expected a SHLSAT opcode");
assert(VT == RHS.getValueType() && "Expected operands to be the same type");		assert(VT == RHS.getValueType() && "Expected operands to be the same type");
assert(VT.isInteger() && "Expected operands to be integers");		assert(VT.isInteger() && "Expected operands to be integers");

// If LHS != (LHS << RHS) >> RHS, we have overflow and must saturate.		// If LHS != (LHS << RHS) >> RHS, we have overflow and must saturate.

unsigned BW = VT.getScalarSizeInBits();		unsigned BW = VT.getScalarSizeInBits();
SDValue Result = DAG.getNode(ISD::SHL, dl, VT, LHS, RHS);		SDValue Result = DAG.getNode(ISD::SHL, dl, VT, LHS, RHS);
SDValue Orig =		SDValue Orig =
DAG.getNode(IsSigned ? ISD::SRA : ISD::SRL, dl, VT, Result, RHS);		DAG.getNode(IsSigned ? ISD::SRA : ISD::SRL, dl, VT, Result, RHS);

SDValue SatVal;		SDValue SatVal;
if (IsSigned) {		if (IsSigned) {
SDValue SatMin = DAG.getConstant(APInt::getSignedMinValue(BW), dl, VT);		SDValue SatMin = DAG.getConstant(APInt::getSignedMinValue(BW), dl, VT);
SDValue SatMax = DAG.getConstant(APInt::getSignedMaxValue(BW), dl, VT);		SDValue SatMax = DAG.getConstant(APInt::getSignedMaxValue(BW), dl, VT);
SatVal = DAG.getSelectCC(dl, LHS, DAG.getConstant(0, dl, VT),		SatVal = DAG.getSelectCC(dl, LHS, DAG.getConstant(0, dl, VT), SatMin,
SatMin, SatMax, ISD::SETLT);		SatMax, ISD::SETLT);
} else {		} else {
SatVal = DAG.getConstant(APInt::getMaxValue(BW), dl, VT);		SatVal = DAG.getConstant(APInt::getMaxValue(BW), dl, VT);
}		}
Result = DAG.getSelectCC(dl, LHS, Orig, SatVal, Result, ISD::SETNE);		Result = DAG.getSelectCC(dl, LHS, Orig, SatVal, Result, ISD::SETNE);

return Result;		return Result;
}		}

SDValue		SDValue TargetLowering::expandFixedPointMul(SDNode *Node,
TargetLowering::expandFixedPointMul(SDNode *Node, SelectionDAG &DAG) const {		SelectionDAG &DAG) const {
assert((Node->getOpcode() == ISD::SMULFIX \|\|		assert((Node->getOpcode() == ISD::SMULFIX \|\|
Node->getOpcode() == ISD::UMULFIX \|\|		Node->getOpcode() == ISD::UMULFIX \|\|
Node->getOpcode() == ISD::SMULFIXSAT \|\|		Node->getOpcode() == ISD::SMULFIXSAT \|\|
Node->getOpcode() == ISD::UMULFIXSAT) &&		Node->getOpcode() == ISD::UMULFIXSAT) &&
"Expected a fixed point multiplication opcode");		"Expected a fixed point multiplication opcode");

SDLoc dl(Node);		SDLoc dl(Node);
SDValue LHS = Node->getOperand(0);		SDValue LHS = Node->getOperand(0);
▲ Show 20 Lines • Show All 78 Lines • ▼ Show 20 Lines	SDValue TargetLowering::expandFixedPointMul(SDNode *Node,

if (!Signed) {		if (!Signed) {
// Unsigned overflow happened if the upper (VTSize - Scale) bits (of the		// Unsigned overflow happened if the upper (VTSize - Scale) bits (of the
// widened multiplication) aren't all zeroes.		// widened multiplication) aren't all zeroes.

// Saturate to max if ((Hi >> Scale) != 0),		// Saturate to max if ((Hi >> Scale) != 0),
// which is the same as if (Hi > ((1 << Scale) - 1))		// which is the same as if (Hi > ((1 << Scale) - 1))
APInt MaxVal = APInt::getMaxValue(VTSize);		APInt MaxVal = APInt::getMaxValue(VTSize);
SDValue LowMask = DAG.getConstant(APInt::getLowBitsSet(VTSize, Scale),		SDValue LowMask =
dl, VT);		DAG.getConstant(APInt::getLowBitsSet(VTSize, Scale), dl, VT);
Result = DAG.getSelectCC(dl, Hi, LowMask,		Result = DAG.getSelectCC(dl, Hi, LowMask, DAG.getConstant(MaxVal, dl, VT),
DAG.getConstant(MaxVal, dl, VT), Result,		Result, ISD::SETUGT);
ISD::SETUGT);

return Result;		return Result;
}		}

// Signed overflow happened if the upper (VTSize - Scale + 1) bits (of the		// Signed overflow happened if the upper (VTSize - Scale + 1) bits (of the
// widened multiplication) aren't all ones or all zeroes.		// widened multiplication) aren't all ones or all zeroes.

SDValue SatMin = DAG.getConstant(APInt::getSignedMinValue(VTSize), dl, VT);		SDValue SatMin = DAG.getConstant(APInt::getSignedMinValue(VTSize), dl, VT);
SDValue SatMax = DAG.getConstant(APInt::getSignedMaxValue(VTSize), dl, VT);		SDValue SatMax = DAG.getConstant(APInt::getSignedMaxValue(VTSize), dl, VT);

if (Scale == 0) {		if (Scale == 0) {
SDValue Sign = DAG.getNode(ISD::SRA, dl, VT, Lo,		SDValue Sign = DAG.getNode(ISD::SRA, dl, VT, Lo,
DAG.getConstant(VTSize - 1, dl, ShiftTy));		DAG.getConstant(VTSize - 1, dl, ShiftTy));
SDValue Overflow = DAG.getSetCC(dl, BoolVT, Hi, Sign, ISD::SETNE);		SDValue Overflow = DAG.getSetCC(dl, BoolVT, Hi, Sign, ISD::SETNE);
// Saturated to SatMin if wide product is negative, and SatMax if wide		// Saturated to SatMin if wide product is negative, and SatMax if wide
// product is positive ...		// product is positive ...
SDValue Zero = DAG.getConstant(0, dl, VT);		SDValue Zero = DAG.getConstant(0, dl, VT);
SDValue ResultIfOverflow = DAG.getSelectCC(dl, Hi, Zero, SatMin, SatMax,		SDValue ResultIfOverflow =
ISD::SETLT);		DAG.getSelectCC(dl, Hi, Zero, SatMin, SatMax, ISD::SETLT);
// ... but only if we overflowed.		// ... but only if we overflowed.
return DAG.getSelect(dl, VT, Overflow, ResultIfOverflow, Result);		return DAG.getSelect(dl, VT, Overflow, ResultIfOverflow, Result);
}		}

// We handled Scale==0 above so all the bits to examine is in Hi.		// We handled Scale==0 above so all the bits to examine is in Hi.

// Saturate to max if ((Hi >> (Scale - 1)) > 0),		// Saturate to max if ((Hi >> (Scale - 1)) > 0),
// which is the same as if (Hi > (1 << (Scale - 1)) - 1)		// which is the same as if (Hi > (1 << (Scale - 1)) - 1)
SDValue LowMask = DAG.getConstant(APInt::getLowBitsSet(VTSize, Scale - 1),		SDValue LowMask =
dl, VT);		DAG.getConstant(APInt::getLowBitsSet(VTSize, Scale - 1), dl, VT);
Result = DAG.getSelectCC(dl, Hi, LowMask, SatMax, Result, ISD::SETGT);		Result = DAG.getSelectCC(dl, Hi, LowMask, SatMax, Result, ISD::SETGT);
// Saturate to min if (Hi >> (Scale - 1)) < -1),		// Saturate to min if (Hi >> (Scale - 1)) < -1),
// which is the same as if (HI < (-1 << (Scale - 1))		// which is the same as if (HI < (-1 << (Scale - 1))
SDValue HighMask =		SDValue HighMask = DAG.getConstant(
DAG.getConstant(APInt::getHighBitsSet(VTSize, VTSize - Scale + 1),		APInt::getHighBitsSet(VTSize, VTSize - Scale + 1), dl, VT);
dl, VT);
Result = DAG.getSelectCC(dl, Hi, HighMask, SatMin, Result, ISD::SETLT);		Result = DAG.getSelectCC(dl, Hi, HighMask, SatMin, Result, ISD::SETLT);
return Result;		return Result;
}		}

SDValue		SDValue TargetLowering::expandFixedPointDiv(unsigned Opcode, const SDLoc &dl,
		Lint: Pre-merge checks Inline Actions clang-tidy: warning: invalid case style for parameter 'dl' [readability-identifier-naming] not useful Lint: Pre-merge checks: clang-tidy: warning: invalid case style for parameter 'dl' [readability-identifier-naming]…
TargetLowering::expandFixedPointDiv(unsigned Opcode, const SDLoc &dl,
SDValue LHS, SDValue RHS,		SDValue LHS, SDValue RHS,
unsigned Scale, SelectionDAG &DAG) const {		unsigned Scale,
		SelectionDAG &DAG) const {
assert((Opcode == ISD::SDIVFIX \|\| Opcode == ISD::SDIVFIXSAT \|\|		assert((Opcode == ISD::SDIVFIX \|\| Opcode == ISD::SDIVFIXSAT \|\|
Opcode == ISD::UDIVFIX \|\| Opcode == ISD::UDIVFIXSAT) &&		Opcode == ISD::UDIVFIX \|\| Opcode == ISD::UDIVFIXSAT) &&
"Expected a fixed point division opcode");		"Expected a fixed point division opcode");

EVT VT = LHS.getValueType();		EVT VT = LHS.getValueType();
bool Signed = Opcode == ISD::SDIVFIX \|\| Opcode == ISD::SDIVFIXSAT;		bool Signed = Opcode == ISD::SDIVFIX \|\| Opcode == ISD::SDIVFIXSAT;
bool Saturating = Opcode == ISD::SDIVFIXSAT \|\| Opcode == ISD::UDIVFIXSAT;		bool Saturating = Opcode == ISD::SDIVFIXSAT \|\| Opcode == ISD::UDIVFIXSAT;
EVT BoolVT = getSetCCResultType(DAG.getDataLayout(), *DAG.getContext(), VT);		EVT BoolVT = getSetCCResultType(DAG.getDataLayout(), *DAG.getContext(), VT);
Show All 37 Lines	SDValue TargetLowering::expandFixedPointDiv(unsigned Opcode, const SDLoc &dl,
if (Signed) {		if (Signed) {
// For signed operations, if the resulting quotient is negative and the		// For signed operations, if the resulting quotient is negative and the
// remainder is nonzero, subtract 1 from the quotient to round towards		// remainder is nonzero, subtract 1 from the quotient to round towards
// negative infinity.		// negative infinity.
SDValue Rem;		SDValue Rem;
// FIXME: Ideally we would always produce an SDIVREM here, but if the		// FIXME: Ideally we would always produce an SDIVREM here, but if the
// type isn't legal, SDIVREM cannot be expanded. There is no reason why		// type isn't legal, SDIVREM cannot be expanded. There is no reason why
// we couldn't just form a libcall, but the type legalizer doesn't do it.		// we couldn't just form a libcall, but the type legalizer doesn't do it.
if (isTypeLegal(VT) &&		if (isTypeLegal(VT) && isOperationLegalOrCustom(ISD::SDIVREM, VT)) {
isOperationLegalOrCustom(ISD::SDIVREM, VT)) {		Quot = DAG.getNode(ISD::SDIVREM, dl, DAG.getVTList(VT, VT), LHS, RHS);
Quot = DAG.getNode(ISD::SDIVREM, dl,
DAG.getVTList(VT, VT),
LHS, RHS);
Rem = Quot.getValue(1);		Rem = Quot.getValue(1);
Quot = Quot.getValue(0);		Quot = Quot.getValue(0);
} else {		} else {
Quot = DAG.getNode(ISD::SDIV, dl, VT,		Quot = DAG.getNode(ISD::SDIV, dl, VT, LHS, RHS);
LHS, RHS);		Rem = DAG.getNode(ISD::SREM, dl, VT, LHS, RHS);
Rem = DAG.getNode(ISD::SREM, dl, VT,
LHS, RHS);
}		}
SDValue Zero = DAG.getConstant(0, dl, VT);		SDValue Zero = DAG.getConstant(0, dl, VT);
SDValue RemNonZero = DAG.getSetCC(dl, BoolVT, Rem, Zero, ISD::SETNE);		SDValue RemNonZero = DAG.getSetCC(dl, BoolVT, Rem, Zero, ISD::SETNE);
SDValue LHSNeg = DAG.getSetCC(dl, BoolVT, LHS, Zero, ISD::SETLT);		SDValue LHSNeg = DAG.getSetCC(dl, BoolVT, LHS, Zero, ISD::SETLT);
SDValue RHSNeg = DAG.getSetCC(dl, BoolVT, RHS, Zero, ISD::SETLT);		SDValue RHSNeg = DAG.getSetCC(dl, BoolVT, RHS, Zero, ISD::SETLT);
SDValue QuotNeg = DAG.getNode(ISD::XOR, dl, BoolVT, LHSNeg, RHSNeg);		SDValue QuotNeg = DAG.getNode(ISD::XOR, dl, BoolVT, LHSNeg, RHSNeg);
SDValue Sub1 = DAG.getNode(ISD::SUB, dl, VT, Quot,		SDValue Sub1 =
DAG.getConstant(1, dl, VT));		DAG.getNode(ISD::SUB, dl, VT, Quot, DAG.getConstant(1, dl, VT));
Quot = DAG.getSelect(dl, VT,		Quot = DAG.getSelect(dl, VT,
DAG.getNode(ISD::AND, dl, BoolVT, RemNonZero, QuotNeg),		DAG.getNode(ISD::AND, dl, BoolVT, RemNonZero, QuotNeg),
Sub1, Quot);		Sub1, Quot);
} else		} else
Quot = DAG.getNode(ISD::UDIV, dl, VT,		Quot = DAG.getNode(ISD::UDIV, dl, VT, LHS, RHS);
LHS, RHS);

return Quot;		return Quot;
}		}

void TargetLowering::expandUADDSUBO(		void TargetLowering::expandUADDSUBO(SDNode *Node, SDValue &Result,
SDNode *Node, SDValue &Result, SDValue &Overflow, SelectionDAG &DAG) const {		SDValue &Overflow,
		SelectionDAG &DAG) const {
SDLoc dl(Node);		SDLoc dl(Node);
SDValue LHS = Node->getOperand(0);		SDValue LHS = Node->getOperand(0);
SDValue RHS = Node->getOperand(1);		SDValue RHS = Node->getOperand(1);
bool IsAdd = Node->getOpcode() == ISD::UADDO;		bool IsAdd = Node->getOpcode() == ISD::UADDO;

// If ADD/SUBCARRY is legal, use that instead.		// If ADD/SUBCARRY is legal, use that instead.
unsigned OpcCarry = IsAdd ? ISD::ADDCARRY : ISD::SUBCARRY;		unsigned OpcCarry = IsAdd ? ISD::ADDCARRY : ISD::SUBCARRY;
if (isOperationLegalOrCustom(OpcCarry, Node->getValueType(0))) {		if (isOperationLegalOrCustom(OpcCarry, Node->getValueType(0))) {
SDValue CarryIn = DAG.getConstant(0, dl, Node->getValueType(1));		SDValue CarryIn = DAG.getConstant(0, dl, Node->getValueType(1));
SDValue NodeCarry = DAG.getNode(OpcCarry, dl, Node->getVTList(),		SDValue NodeCarry =
{ LHS, RHS, CarryIn });		DAG.getNode(OpcCarry, dl, Node->getVTList(), {LHS, RHS, CarryIn});
Result = SDValue(NodeCarry.getNode(), 0);		Result = SDValue(NodeCarry.getNode(), 0);
Overflow = SDValue(NodeCarry.getNode(), 1);		Overflow = SDValue(NodeCarry.getNode(), 1);
return;		return;
}		}

Result = DAG.getNode(IsAdd ? ISD::ADD : ISD::SUB, dl,		Result = DAG.getNode(IsAdd ? ISD::ADD : ISD::SUB, dl, LHS.getValueType(), LHS,
LHS.getValueType(), LHS, RHS);		RHS);

EVT ResultType = Node->getValueType(1);		EVT ResultType = Node->getValueType(1);
EVT SetCCType = getSetCCResultType(		EVT SetCCType = getSetCCResultType(DAG.getDataLayout(), *DAG.getContext(),
DAG.getDataLayout(), *DAG.getContext(), Node->getValueType(0));		Node->getValueType(0));
ISD::CondCode CC = IsAdd ? ISD::SETULT : ISD::SETUGT;		ISD::CondCode CC = IsAdd ? ISD::SETULT : ISD::SETUGT;
SDValue SetCC = DAG.getSetCC(dl, SetCCType, Result, LHS, CC);		SDValue SetCC = DAG.getSetCC(dl, SetCCType, Result, LHS, CC);
Overflow = DAG.getBoolExtOrTrunc(SetCC, dl, ResultType, ResultType);		Overflow = DAG.getBoolExtOrTrunc(SetCC, dl, ResultType, ResultType);
}		}

void TargetLowering::expandSADDSUBO(		void TargetLowering::expandSADDSUBO(SDNode *Node, SDValue &Result,
SDNode *Node, SDValue &Result, SDValue &Overflow, SelectionDAG &DAG) const {		SDValue &Overflow,
		SelectionDAG &DAG) const {
SDLoc dl(Node);		SDLoc dl(Node);
SDValue LHS = Node->getOperand(0);		SDValue LHS = Node->getOperand(0);
SDValue RHS = Node->getOperand(1);		SDValue RHS = Node->getOperand(1);
bool IsAdd = Node->getOpcode() == ISD::SADDO;		bool IsAdd = Node->getOpcode() == ISD::SADDO;

Result = DAG.getNode(IsAdd ? ISD::ADD : ISD::SUB, dl,		Result = DAG.getNode(IsAdd ? ISD::ADD : ISD::SUB, dl, LHS.getValueType(), LHS,
LHS.getValueType(), LHS, RHS);		RHS);

EVT ResultType = Node->getValueType(1);		EVT ResultType = Node->getValueType(1);
EVT OType = getSetCCResultType(		EVT OType = getSetCCResultType(DAG.getDataLayout(), *DAG.getContext(),
DAG.getDataLayout(), *DAG.getContext(), Node->getValueType(0));		Node->getValueType(0));

// If SADDSAT/SSUBSAT is legal, compare results to detect overflow.		// If SADDSAT/SSUBSAT is legal, compare results to detect overflow.
unsigned OpcSat = IsAdd ? ISD::SADDSAT : ISD::SSUBSAT;		unsigned OpcSat = IsAdd ? ISD::SADDSAT : ISD::SSUBSAT;
if (isOperationLegalOrCustom(OpcSat, LHS.getValueType())) {		if (isOperationLegalOrCustom(OpcSat, LHS.getValueType())) {
SDValue Sat = DAG.getNode(OpcSat, dl, LHS.getValueType(), LHS, RHS);		SDValue Sat = DAG.getNode(OpcSat, dl, LHS.getValueType(), LHS, RHS);
SDValue SetCC = DAG.getSetCC(dl, OType, Result, Sat, ISD::SETNE);		SDValue SetCC = DAG.getSetCC(dl, OType, Result, Sat, ISD::SETNE);
Overflow = DAG.getBoolExtOrTrunc(SetCC, dl, ResultType, ResultType);		Overflow = DAG.getBoolExtOrTrunc(SetCC, dl, ResultType, ResultType);
return;		return;
Show All 31 Lines	if (ConstantSDNode *RHSC = isConstOrConstSplat(RHS)) {
// mulo(X, 1 << S) -> { X << S, (X << S) >> S != X }		// mulo(X, 1 << S) -> { X << S, (X << S) >> S != X }
if (C.isPowerOf2()) {		if (C.isPowerOf2()) {
// smulo(x, signed_min) is same as umulo(x, signed_min).		// smulo(x, signed_min) is same as umulo(x, signed_min).
bool UseArithShift = isSigned && !C.isMinSignedValue();		bool UseArithShift = isSigned && !C.isMinSignedValue();
EVT ShiftAmtTy = getShiftAmountTy(VT, DAG.getDataLayout());		EVT ShiftAmtTy = getShiftAmountTy(VT, DAG.getDataLayout());
SDValue ShiftAmt = DAG.getConstant(C.logBase2(), dl, ShiftAmtTy);		SDValue ShiftAmt = DAG.getConstant(C.logBase2(), dl, ShiftAmtTy);
Result = DAG.getNode(ISD::SHL, dl, VT, LHS, ShiftAmt);		Result = DAG.getNode(ISD::SHL, dl, VT, LHS, ShiftAmt);
Overflow = DAG.getSetCC(dl, SetCCVT,		Overflow = DAG.getSetCC(dl, SetCCVT,
DAG.getNode(UseArithShift ? ISD::SRA : ISD::SRL,		DAG.getNode(UseArithShift ? ISD::SRA : ISD::SRL,
dl, VT, Result, ShiftAmt),		dl, VT, Result, ShiftAmt),
LHS, ISD::SETNE);		LHS, ISD::SETNE);
return true;		return true;
}		}
}		}

EVT WideVT = EVT::getIntegerVT(DAG.getContext(), VT.getScalarSizeInBits() 2);		EVT WideVT =
		EVT::getIntegerVT(DAG.getContext(), VT.getScalarSizeInBits() 2);
if (VT.isVector())		if (VT.isVector())
WideVT = EVT::getVectorVT(*DAG.getContext(), WideVT,		WideVT =
VT.getVectorNumElements());		EVT::getVectorVT(*DAG.getContext(), WideVT, VT.getVectorNumElements());

SDValue BottomHalf;		SDValue BottomHalf;
SDValue TopHalf;		SDValue TopHalf;
static const unsigned Ops[2][3] =		static const unsigned Ops[2][3] = {
{ { ISD::MULHU, ISD::UMUL_LOHI, ISD::ZERO_EXTEND },		{ISD::MULHU, ISD::UMUL_LOHI, ISD::ZERO_EXTEND},
{ ISD::MULHS, ISD::SMUL_LOHI, ISD::SIGN_EXTEND }};		{ISD::MULHS, ISD::SMUL_LOHI, ISD::SIGN_EXTEND}};
if (isOperationLegalOrCustom(Ops[isSigned][0], VT)) {		if (isOperationLegalOrCustom(Ops[isSigned][0], VT)) {
BottomHalf = DAG.getNode(ISD::MUL, dl, VT, LHS, RHS);		BottomHalf = DAG.getNode(ISD::MUL, dl, VT, LHS, RHS);
TopHalf = DAG.getNode(Ops[isSigned][0], dl, VT, LHS, RHS);		TopHalf = DAG.getNode(Ops[isSigned][0], dl, VT, LHS, RHS);
} else if (isOperationLegalOrCustom(Ops[isSigned][1], VT)) {		} else if (isOperationLegalOrCustom(Ops[isSigned][1], VT)) {
BottomHalf = DAG.getNode(Ops[isSigned][1], dl, DAG.getVTList(VT, VT), LHS,		BottomHalf =
RHS);		DAG.getNode(Ops[isSigned][1], dl, DAG.getVTList(VT, VT), LHS, RHS);
TopHalf = BottomHalf.getValue(1);		TopHalf = BottomHalf.getValue(1);
} else if (isTypeLegal(WideVT)) {		} else if (isTypeLegal(WideVT)) {
LHS = DAG.getNode(Ops[isSigned][2], dl, WideVT, LHS);		LHS = DAG.getNode(Ops[isSigned][2], dl, WideVT, LHS);
RHS = DAG.getNode(Ops[isSigned][2], dl, WideVT, RHS);		RHS = DAG.getNode(Ops[isSigned][2], dl, WideVT, RHS);
SDValue Mul = DAG.getNode(ISD::MUL, dl, WideVT, LHS, RHS);		SDValue Mul = DAG.getNode(ISD::MUL, dl, WideVT, LHS, RHS);
BottomHalf = DAG.getNode(ISD::TRUNCATE, dl, VT, Mul);		BottomHalf = DAG.getNode(ISD::TRUNCATE, dl, VT, Mul);
SDValue ShiftAmt = DAG.getConstant(VT.getScalarSizeInBits(), dl,		SDValue ShiftAmt =
		DAG.getConstant(VT.getScalarSizeInBits(), dl,
getShiftAmountTy(WideVT, DAG.getDataLayout()));		getShiftAmountTy(WideVT, DAG.getDataLayout()));
TopHalf = DAG.getNode(ISD::TRUNCATE, dl, VT,		TopHalf = DAG.getNode(ISD::TRUNCATE, dl, VT,
DAG.getNode(ISD::SRL, dl, WideVT, Mul, ShiftAmt));		DAG.getNode(ISD::SRL, dl, WideVT, Mul, ShiftAmt));
} else {		} else {
if (VT.isVector())		if (VT.isVector())
return false;		return false;

// We can fall back to a libcall with an illegal type for the MUL if we		// We can fall back to a libcall with an illegal type for the MUL if we
// have a libcall big enough.		// have a libcall big enough.
Show All 11 Lines	if (isOperationLegalOrCustom(Ops[isSigned][0], VT)) {
assert(LC != RTLIB::UNKNOWN_LIBCALL && "Cannot expand this operation!");		assert(LC != RTLIB::UNKNOWN_LIBCALL && "Cannot expand this operation!");

SDValue HiLHS;		SDValue HiLHS;
SDValue HiRHS;		SDValue HiRHS;
if (isSigned) {		if (isSigned) {
// The high part is obtained by SRA'ing all but one of the bits of low		// The high part is obtained by SRA'ing all but one of the bits of low
// part.		// part.
unsigned LoSize = VT.getSizeInBits();		unsigned LoSize = VT.getSizeInBits();
HiLHS =		HiLHS = DAG.getNode(
DAG.getNode(ISD::SRA, dl, VT, LHS,		ISD::SRA, dl, VT, LHS,
DAG.getConstant(LoSize - 1, dl,		DAG.getConstant(LoSize - 1, dl, getPointerTy(DAG.getDataLayout())));
getPointerTy(DAG.getDataLayout())));		HiRHS = DAG.getNode(
HiRHS =		ISD::SRA, dl, VT, RHS,
DAG.getNode(ISD::SRA, dl, VT, RHS,		DAG.getConstant(LoSize - 1, dl, getPointerTy(DAG.getDataLayout())));
DAG.getConstant(LoSize - 1, dl,
getPointerTy(DAG.getDataLayout())));
} else {		} else {
HiLHS = DAG.getConstant(0, dl, VT);		HiLHS = DAG.getConstant(0, dl, VT);
HiRHS = DAG.getConstant(0, dl, VT);		HiRHS = DAG.getConstant(0, dl, VT);
}		}

// Here we're passing the 2 arguments explicitly as 4 arguments that are		// Here we're passing the 2 arguments explicitly as 4 arguments that are
// pre-lowered to the correct types. This all depends upon WideVT not		// pre-lowered to the correct types. This all depends upon WideVT not
// being a legal type for the architecture and thus has to be split to		// being a legal type for the architecture and thus has to be split to
// two arguments.		// two arguments.
SDValue Ret;		SDValue Ret;
TargetLowering::MakeLibCallOptions CallOptions;		TargetLowering::MakeLibCallOptions CallOptions;
CallOptions.setSExt(isSigned);		CallOptions.setSExt(isSigned);
CallOptions.setIsPostTypeLegalization(true);		CallOptions.setIsPostTypeLegalization(true);
if (shouldSplitFunctionArgumentsAsLittleEndian(DAG.getDataLayout())) {		if (shouldSplitFunctionArgumentsAsLittleEndian(DAG.getDataLayout())) {
// Halves of WideVT are packed into registers in different order		// Halves of WideVT are packed into registers in different order
// depending on platform endianness. This is usually handled by		// depending on platform endianness. This is usually handled by
// the C calling convention, but we can't defer to it in		// the C calling convention, but we can't defer to it in
// the legalizer.		// the legalizer.
SDValue Args[] = { LHS, HiLHS, RHS, HiRHS };		SDValue Args[] = {LHS, HiLHS, RHS, HiRHS};
Ret = makeLibCall(DAG, LC, WideVT, Args, CallOptions, dl).first;		Ret = makeLibCall(DAG, LC, WideVT, Args, CallOptions, dl).first;
} else {		} else {
SDValue Args[] = { HiLHS, LHS, HiRHS, RHS };		SDValue Args[] = {HiLHS, LHS, HiRHS, RHS};
Ret = makeLibCall(DAG, LC, WideVT, Args, CallOptions, dl).first;		Ret = makeLibCall(DAG, LC, WideVT, Args, CallOptions, dl).first;
}		}
assert(Ret.getOpcode() == ISD::MERGE_VALUES &&		assert(Ret.getOpcode() == ISD::MERGE_VALUES &&
"Ret value is a collection of constituent nodes holding result.");		"Ret value is a collection of constituent nodes holding result.");
if (DAG.getDataLayout().isLittleEndian()) {		if (DAG.getDataLayout().isLittleEndian()) {
// Same as above.		// Same as above.
BottomHalf = Ret.getOperand(0);		BottomHalf = Ret.getOperand(0);
TopHalf = Ret.getOperand(1);		TopHalf = Ret.getOperand(1);
} else {		} else {
BottomHalf = Ret.getOperand(1);		BottomHalf = Ret.getOperand(1);
TopHalf = Ret.getOperand(0);		TopHalf = Ret.getOperand(0);
}		}
}		}

Result = BottomHalf;		Result = BottomHalf;
if (isSigned) {		if (isSigned) {
SDValue ShiftAmt = DAG.getConstant(		SDValue ShiftAmt = DAG.getConstant(
VT.getScalarSizeInBits() - 1, dl,		VT.getScalarSizeInBits() - 1, dl,
getShiftAmountTy(BottomHalf.getValueType(), DAG.getDataLayout()));		getShiftAmountTy(BottomHalf.getValueType(), DAG.getDataLayout()));
SDValue Sign = DAG.getNode(ISD::SRA, dl, VT, BottomHalf, ShiftAmt);		SDValue Sign = DAG.getNode(ISD::SRA, dl, VT, BottomHalf, ShiftAmt);
Overflow = DAG.getSetCC(dl, SetCCVT, TopHalf, Sign, ISD::SETNE);		Overflow = DAG.getSetCC(dl, SetCCVT, TopHalf, Sign, ISD::SETNE);
} else {		} else {
Overflow = DAG.getSetCC(dl, SetCCVT, TopHalf,		Overflow = DAG.getSetCC(dl, SetCCVT, TopHalf, DAG.getConstant(0, dl, VT),
DAG.getConstant(0, dl, VT), ISD::SETNE);		ISD::SETNE);
}		}

// Truncate the result if SetCC returns a larger type than needed.		// Truncate the result if SetCC returns a larger type than needed.
EVT RType = Node->getValueType(1);		EVT RType = Node->getValueType(1);
if (RType.getSizeInBits() < Overflow.getValueSizeInBits())		if (RType.getSizeInBits() < Overflow.getValueSizeInBits())
Overflow = DAG.getNode(ISD::TRUNCATE, dl, RType, Overflow);		Overflow = DAG.getNode(ISD::TRUNCATE, dl, RType, Overflow);

assert(RType.getSizeInBits() == Overflow.getValueSizeInBits() &&		assert(RType.getSizeInBits() == Overflow.getValueSizeInBits() &&
"Unexpected result type for S/UMULO legalization");		"Unexpected result type for S/UMULO legalization");
return true;		return true;
}		}

SDValue TargetLowering::expandVecReduce(SDNode *Node, SelectionDAG &DAG) const {		SDValue TargetLowering::expandVecReduce(SDNode *Node, SelectionDAG &DAG) const {
SDLoc dl(Node);		SDLoc dl(Node);
unsigned BaseOpcode = 0;		unsigned BaseOpcode = 0;
switch (Node->getOpcode()) {		switch (Node->getOpcode()) {
default: llvm_unreachable("Expected VECREDUCE opcode");		default:
case ISD::VECREDUCE_FADD: BaseOpcode = ISD::FADD; break;		llvm_unreachable("Expected VECREDUCE opcode");
case ISD::VECREDUCE_FMUL: BaseOpcode = ISD::FMUL; break;		case ISD::VECREDUCE_FADD:
case ISD::VECREDUCE_ADD: BaseOpcode = ISD::ADD; break;		BaseOpcode = ISD::FADD;
case ISD::VECREDUCE_MUL: BaseOpcode = ISD::MUL; break;		break;
case ISD::VECREDUCE_AND: BaseOpcode = ISD::AND; break;		case ISD::VECREDUCE_FMUL:
case ISD::VECREDUCE_OR: BaseOpcode = ISD::OR; break;		BaseOpcode = ISD::FMUL;
case ISD::VECREDUCE_XOR: BaseOpcode = ISD::XOR; break;		break;
case ISD::VECREDUCE_SMAX: BaseOpcode = ISD::SMAX; break;		case ISD::VECREDUCE_ADD:
case ISD::VECREDUCE_SMIN: BaseOpcode = ISD::SMIN; break;		BaseOpcode = ISD::ADD;
case ISD::VECREDUCE_UMAX: BaseOpcode = ISD::UMAX; break;		break;
case ISD::VECREDUCE_UMIN: BaseOpcode = ISD::UMIN; break;		case ISD::VECREDUCE_MUL:
case ISD::VECREDUCE_FMAX: BaseOpcode = ISD::FMAXNUM; break;		BaseOpcode = ISD::MUL;
case ISD::VECREDUCE_FMIN: BaseOpcode = ISD::FMINNUM; break;		break;
		case ISD::VECREDUCE_AND:
		BaseOpcode = ISD::AND;
		break;
		case ISD::VECREDUCE_OR:
		BaseOpcode = ISD::OR;
		break;
		case ISD::VECREDUCE_XOR:
		BaseOpcode = ISD::XOR;
		break;
		case ISD::VECREDUCE_SMAX:
		BaseOpcode = ISD::SMAX;
		break;
		case ISD::VECREDUCE_SMIN:
		BaseOpcode = ISD::SMIN;
		break;
		case ISD::VECREDUCE_UMAX:
		BaseOpcode = ISD::UMAX;
		break;
		case ISD::VECREDUCE_UMIN:
		BaseOpcode = ISD::UMIN;
		break;
		case ISD::VECREDUCE_FMAX:
		BaseOpcode = ISD::FMAXNUM;
		break;
		case ISD::VECREDUCE_FMIN:
		BaseOpcode = ISD::FMINNUM;
		break;
}		}

SDValue Op = Node->getOperand(0);		SDValue Op = Node->getOperand(0);
EVT VT = Op.getValueType();		EVT VT = Op.getValueType();

// Try to use a shuffle reduction for power of two vectors.		// Try to use a shuffle reduction for power of two vectors.
if (VT.isPow2VectorType()) {		if (VT.isPow2VectorType()) {
while (VT.getVectorNumElements() > 1) {		while (VT.getVectorNumElements() > 1) {
▲ Show 20 Lines • Show All 49 Lines • Show Last 20 Lines

llvm/test/CodeGen/AArch64/srem-seteq.ll

	Show First 20 Lines • Show All 77 Lines • ▼ Show 20 Lines

	;------------------------------------------------------------------------------;			;------------------------------------------------------------------------------;
	; Even divisors			; Even divisors
	;------------------------------------------------------------------------------;			;------------------------------------------------------------------------------;

	define i16 @test_srem_even(i16 %X) nounwind {			define i16 @test_srem_even(i16 %X) nounwind {
	; CHECK-LABEL: test_srem_even:			; CHECK-LABEL: test_srem_even:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: mov w9, #9363
	; CHECK-NEXT: sxth w8, w0			; CHECK-NEXT: sxth w8, w0
	; CHECK-NEXT: movk w9, #37449, lsl #16			; CHECK-NEXT: mov w9, #18725
	; CHECK-NEXT: smull x9, w8, w9			; CHECK-NEXT: mul w8, w8, w9
	; CHECK-NEXT: lsr x9, x9, #32			; CHECK-NEXT: asr w9, w8, #18
	; CHECK-NEXT: add w8, w9, w8
	; CHECK-NEXT: asr w9, w8, #3
	; CHECK-NEXT: add w8, w9, w8, lsr #31			; CHECK-NEXT: add w8, w9, w8, lsr #31
	; CHECK-NEXT: mov w9, #14			; CHECK-NEXT: mov w9, #14
	; CHECK-NEXT: msub w8, w8, w9, w0			; CHECK-NEXT: msub w8, w8, w9, w0
	; CHECK-NEXT: tst w8, #0xffff			; CHECK-NEXT: tst w8, #0xffff
	; CHECK-NEXT: cset w0, ne			; CHECK-NEXT: cset w0, ne
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%srem = srem i16 %X, 14			%srem = srem i16 %X, 14
	%cmp = icmp ne i16 %srem, 0			%cmp = icmp ne i16 %srem, 0
	▲ Show 20 Lines • Show All 186 Lines • Show Last 20 Lines

llvm/test/CodeGen/AArch64/srem-vector-lkk.ll

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: llc -mtriple=aarch64-unknown-linux-gnu < %s \| FileCheck %s			; RUN: llc -mtriple=aarch64-unknown-linux-gnu < %s \| FileCheck %s

	define <4 x i16> @fold_srem_vec_1(<4 x i16> %x) {			define <4 x i16> @fold_srem_vec_1(<4 x i16> %x) {
	; CHECK-LABEL: fold_srem_vec_1:			; CHECK-LABEL: fold_srem_vec_1:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: mov w9, #63421			; CHECK-NEXT: adrp x8, .LCPI0_0
	; CHECK-NEXT: mov w12, #33437			; CHECK-NEXT: ldr d1, [x8, :lo12:.LCPI0_0]
	; CHECK-NEXT: // kill: def $d0 killed $d0 def $q0			; CHECK-NEXT: adrp x8, .LCPI0_1
	; CHECK-NEXT: smov w8, v0.h[1]			; CHECK-NEXT: ldr d2, [x8, :lo12:.LCPI0_1]
	; CHECK-NEXT: movk w9, #31710, lsl #16			; CHECK-NEXT: adrp x8, .LCPI0_2
	; CHECK-NEXT: smov w11, v0.h[2]			; CHECK-NEXT: ldr d3, [x8, :lo12:.LCPI0_2]
	; CHECK-NEXT: movk w12, #21399, lsl #16			; CHECK-NEXT: adrp x8, .LCPI0_3
	; CHECK-NEXT: smull x12, w11, w12			; CHECK-NEXT: smull v2.4s, v0.4h, v2.4h
	; CHECK-NEXT: smull x9, w8, w9			; CHECK-NEXT: shrn v2.4h, v2.4s, #16
	; CHECK-NEXT: lsr x13, x12, #63			; CHECK-NEXT: mla v2.4h, v0.4h, v1.4h
	; CHECK-NEXT: asr x12, x12, #37			; CHECK-NEXT: ldr d1, [x8, :lo12:.LCPI0_3]
	; CHECK-NEXT: lsr x9, x9, #32			; CHECK-NEXT: neg v3.4h, v3.4h
	; CHECK-NEXT: add w12, w12, w13			; CHECK-NEXT: sshl v2.4h, v2.4h, v3.4h
	; CHECK-NEXT: mov w13, #98			; CHECK-NEXT: usra v2.4h, v2.4h, #15
	; CHECK-NEXT: sub w9, w9, w8			; CHECK-NEXT: mls v0.4h, v2.4h, v1.4h
	; CHECK-NEXT: msub w11, w12, w13, w11
	; CHECK-NEXT: asr w13, w9, #6
	; CHECK-NEXT: add w9, w13, w9, lsr #31
	; CHECK-NEXT: mov w13, #37253
	; CHECK-NEXT: mov w10, #-124
	; CHECK-NEXT: smov w12, v0.h[0]
	; CHECK-NEXT: movk w13, #44150, lsl #16
	; CHECK-NEXT: msub w8, w9, w10, w8
	; CHECK-NEXT: smull x10, w12, w13
	; CHECK-NEXT: lsr x10, x10, #32
	; CHECK-NEXT: add w10, w10, w12
	; CHECK-NEXT: asr w13, w10, #6
	; CHECK-NEXT: mov w9, #95
	; CHECK-NEXT: add w10, w13, w10, lsr #31
	; CHECK-NEXT: msub w9, w10, w9, w12
	; CHECK-NEXT: mov w10, #63249
	; CHECK-NEXT: smov w13, v0.h[3]
	; CHECK-NEXT: movk w10, #48808, lsl #16
	; CHECK-NEXT: smull x10, w13, w10
	; CHECK-NEXT: lsr x12, x10, #63
	; CHECK-NEXT: asr x10, x10, #40
	; CHECK-NEXT: fmov s0, w9
	; CHECK-NEXT: add w10, w10, w12
	; CHECK-NEXT: mov v0.h[1], w8
	; CHECK-NEXT: mov w8, #-1003
	; CHECK-NEXT: mov v0.h[2], w11
	; CHECK-NEXT: msub w8, w10, w8, w13
	; CHECK-NEXT: mov v0.h[3], w8
	; CHECK-NEXT: // kill: def $d0 killed $d0 killed $q0
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%1 = srem <4 x i16> %x, <i16 95, i16 -124, i16 98, i16 -1003>			%1 = srem <4 x i16> %x, <i16 95, i16 -124, i16 98, i16 -1003>
	ret <4 x i16> %1			ret <4 x i16> %1
	}			}

	define <4 x i16> @fold_srem_vec_2(<4 x i16> %x) {			define <4 x i16> @fold_srem_vec_2(<4 x i16> %x) {
	; CHECK-LABEL: fold_srem_vec_2:			; CHECK-LABEL: fold_srem_vec_2:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: mov w9, #37253			; CHECK-NEXT: mov w8, #44151
	; CHECK-NEXT: // kill: def $d0 killed $d0 def $q0			; CHECK-NEXT: dup v1.4h, w8
	; CHECK-NEXT: smov w8, v0.h[1]			; CHECK-NEXT: smull v1.4s, v0.4h, v1.4h
	; CHECK-NEXT: movk w9, #44150, lsl #16			; CHECK-NEXT: shrn v1.4h, v1.4s, #16
	; CHECK-NEXT: smov w10, v0.h[0]			; CHECK-NEXT: add v1.4h, v1.4h, v0.4h
	; CHECK-NEXT: smull x13, w8, w9			; CHECK-NEXT: sshr v1.4h, v1.4h, #6
	; CHECK-NEXT: smov w11, v0.h[2]			; CHECK-NEXT: usra v1.4h, v1.4h, #15
	; CHECK-NEXT: smull x14, w10, w9			; CHECK-NEXT: movi v2.4h, #95
	; CHECK-NEXT: lsr x13, x13, #32			; CHECK-NEXT: mls v0.4h, v1.4h, v2.4h
	; CHECK-NEXT: smov w12, v0.h[3]
	; CHECK-NEXT: smull x15, w11, w9
	; CHECK-NEXT: lsr x14, x14, #32
	; CHECK-NEXT: add w13, w13, w8
	; CHECK-NEXT: smull x9, w12, w9
	; CHECK-NEXT: lsr x15, x15, #32
	; CHECK-NEXT: add w14, w14, w10
	; CHECK-NEXT: asr w16, w13, #6
	; CHECK-NEXT: lsr x9, x9, #32
	; CHECK-NEXT: add w15, w15, w11
	; CHECK-NEXT: add w13, w16, w13, lsr #31
	; CHECK-NEXT: asr w16, w14, #6
	; CHECK-NEXT: add w9, w9, w12
	; CHECK-NEXT: add w14, w16, w14, lsr #31
	; CHECK-NEXT: asr w16, w15, #6
	; CHECK-NEXT: add w15, w16, w15, lsr #31
	; CHECK-NEXT: asr w16, w9, #6
	; CHECK-NEXT: add w9, w16, w9, lsr #31
	; CHECK-NEXT: mov w16, #95
	; CHECK-NEXT: msub w10, w14, w16, w10
	; CHECK-NEXT: msub w8, w13, w16, w8
	; CHECK-NEXT: fmov s0, w10
	; CHECK-NEXT: msub w11, w15, w16, w11
	; CHECK-NEXT: mov v0.h[1], w8
	; CHECK-NEXT: mov v0.h[2], w11
	; CHECK-NEXT: msub w8, w9, w16, w12
	; CHECK-NEXT: mov v0.h[3], w8
	; CHECK-NEXT: // kill: def $d0 killed $d0 killed $q0
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%1 = srem <4 x i16> %x, <i16 95, i16 95, i16 95, i16 95>			%1 = srem <4 x i16> %x, <i16 95, i16 95, i16 95, i16 95>
	ret <4 x i16> %1			ret <4 x i16> %1
	}			}


	; Don't fold if we can combine srem with sdiv.			; Don't fold if we can combine srem with sdiv.
	define <4 x i16> @combine_srem_sdiv(<4 x i16> %x) {			define <4 x i16> @combine_srem_sdiv(<4 x i16> %x) {
	; CHECK-LABEL: combine_srem_sdiv:			; CHECK-LABEL: combine_srem_sdiv:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: mov w8, #37253			; CHECK-NEXT: mov w8, #44151
	; CHECK-NEXT: // kill: def $d0 killed $d0 def $q0			; CHECK-NEXT: dup v2.4h, w8
	; CHECK-NEXT: movk w8, #44150, lsl #16			; CHECK-NEXT: smull v2.4s, v0.4h, v2.4h
	; CHECK-NEXT: smov w9, v0.h[1]			; CHECK-NEXT: shrn v2.4h, v2.4s, #16
	; CHECK-NEXT: smov w10, v0.h[0]			; CHECK-NEXT: add v2.4h, v2.4h, v0.4h
	; CHECK-NEXT: smull x13, w9, w8			; CHECK-NEXT: sshr v2.4h, v2.4h, #6
	; CHECK-NEXT: smov w11, v0.h[2]			; CHECK-NEXT: movi v1.4h, #95
	; CHECK-NEXT: smull x14, w10, w8			; CHECK-NEXT: usra v2.4h, v2.4h, #15
	; CHECK-NEXT: lsr x13, x13, #32			; CHECK-NEXT: mls v0.4h, v2.4h, v1.4h
	; CHECK-NEXT: smov w12, v0.h[3]			; CHECK-NEXT: add v0.4h, v0.4h, v2.4h
	; CHECK-NEXT: smull x15, w11, w8
	; CHECK-NEXT: lsr x14, x14, #32
	; CHECK-NEXT: add w13, w13, w9
	; CHECK-NEXT: smull x8, w12, w8
	; CHECK-NEXT: lsr x15, x15, #32
	; CHECK-NEXT: add w14, w14, w10
	; CHECK-NEXT: asr w16, w13, #6
	; CHECK-NEXT: lsr x8, x8, #32
	; CHECK-NEXT: add w15, w15, w11
	; CHECK-NEXT: add w13, w16, w13, lsr #31
	; CHECK-NEXT: asr w16, w14, #6
	; CHECK-NEXT: add w8, w8, w12
	; CHECK-NEXT: add w14, w16, w14, lsr #31
	; CHECK-NEXT: asr w16, w15, #6
	; CHECK-NEXT: add w15, w16, w15, lsr #31
	; CHECK-NEXT: asr w16, w8, #6
	; CHECK-NEXT: add w8, w16, w8, lsr #31
	; CHECK-NEXT: mov w16, #95
	; CHECK-NEXT: msub w10, w14, w16, w10
	; CHECK-NEXT: msub w9, w13, w16, w9
	; CHECK-NEXT: fmov s0, w14
	; CHECK-NEXT: fmov s1, w10
	; CHECK-NEXT: msub w11, w15, w16, w11
	; CHECK-NEXT: mov v0.h[1], w13
	; CHECK-NEXT: mov v1.h[1], w9
	; CHECK-NEXT: msub w12, w8, w16, w12
	; CHECK-NEXT: mov v0.h[2], w15
	; CHECK-NEXT: mov v1.h[2], w11
	; CHECK-NEXT: mov v1.h[3], w12
	; CHECK-NEXT: mov v0.h[3], w8
	; CHECK-NEXT: add v0.4h, v1.4h, v0.4h
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%1 = srem <4 x i16> %x, <i16 95, i16 95, i16 95, i16 95>			%1 = srem <4 x i16> %x, <i16 95, i16 95, i16 95, i16 95>
	%2 = sdiv <4 x i16> %x, <i16 95, i16 95, i16 95, i16 95>			%2 = sdiv <4 x i16> %x, <i16 95, i16 95, i16 95, i16 95>
	%3 = add <4 x i16> %1, %2			%3 = add <4 x i16> %1, %2
	ret <4 x i16> %3			ret <4 x i16> %3
	}			}

	; Don't fold for divisors that are a power of two.			; Don't fold for divisors that are a power of two.
	define <4 x i16> @dont_fold_srem_power_of_two(<4 x i16> %x) {			define <4 x i16> @dont_fold_srem_power_of_two(<4 x i16> %x) {
	; CHECK-LABEL: dont_fold_srem_power_of_two:			; CHECK-LABEL: dont_fold_srem_power_of_two:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: // kill: def $d0 killed $d0 def $q0			; CHECK-NEXT: adrp x8, .LCPI3_0
	; CHECK-NEXT: smov w8, v0.h[1]			; CHECK-NEXT: ldr d1, [x8, :lo12:.LCPI3_0]
	; CHECK-NEXT: add w12, w8, #31 // =31			; CHECK-NEXT: adrp x9, .LCPI3_1
	; CHECK-NEXT: cmp w8, #0 // =0			; CHECK-NEXT: ldr d2, [x9, :lo12:.LCPI3_1]
	; CHECK-NEXT: mov w11, #37253			; CHECK-NEXT: adrp x8, .LCPI3_2
	; CHECK-NEXT: csel w12, w12, w8, lt			; CHECK-NEXT: smull v1.4s, v0.4h, v1.4h
	; CHECK-NEXT: smov w9, v0.h[0]			; CHECK-NEXT: ldr d3, [x8, :lo12:.LCPI3_2]
	; CHECK-NEXT: smov w10, v0.h[3]			; CHECK-NEXT: shrn v1.4h, v1.4s, #16
	; CHECK-NEXT: movk w11, #44150, lsl #16			; CHECK-NEXT: add v1.4h, v1.4h, v0.4h
	; CHECK-NEXT: and w12, w12, #0xffffffe0			; CHECK-NEXT: neg v2.4h, v2.4h
	; CHECK-NEXT: sub w8, w8, w12			; CHECK-NEXT: sshl v1.4h, v1.4h, v2.4h
	; CHECK-NEXT: add w12, w9, #63 // =63			; CHECK-NEXT: usra v1.4h, v1.4h, #15
	; CHECK-NEXT: smull x11, w10, w11			; CHECK-NEXT: mls v0.4h, v1.4h, v3.4h
	; CHECK-NEXT: cmp w9, #0 // =0
	; CHECK-NEXT: lsr x11, x11, #32
	; CHECK-NEXT: csel w12, w12, w9, lt
	; CHECK-NEXT: add w11, w11, w10
	; CHECK-NEXT: and w12, w12, #0xffffffc0
	; CHECK-NEXT: sub w9, w9, w12
	; CHECK-NEXT: asr w12, w11, #6
	; CHECK-NEXT: add w11, w12, w11, lsr #31
	; CHECK-NEXT: smov w12, v0.h[2]
	; CHECK-NEXT: fmov s0, w9
	; CHECK-NEXT: add w9, w12, #7 // =7
	; CHECK-NEXT: cmp w12, #0 // =0
	; CHECK-NEXT: csel w9, w9, w12, lt
	; CHECK-NEXT: and w9, w9, #0xfffffff8
	; CHECK-NEXT: sub w9, w12, w9
	; CHECK-NEXT: mov v0.h[1], w8
	; CHECK-NEXT: mov w8, #95
	; CHECK-NEXT: mov v0.h[2], w9
	; CHECK-NEXT: msub w8, w11, w8, w10
	; CHECK-NEXT: mov v0.h[3], w8
	; CHECK-NEXT: // kill: def $d0 killed $d0 killed $q0
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%1 = srem <4 x i16> %x, <i16 64, i16 32, i16 8, i16 95>			%1 = srem <4 x i16> %x, <i16 64, i16 32, i16 8, i16 95>
	ret <4 x i16> %1			ret <4 x i16> %1
	}			}

	; Don't fold if the divisor is one.			; Don't fold if the divisor is one.
	define <4 x i16> @dont_fold_srem_one(<4 x i16> %x) {			define <4 x i16> @dont_fold_srem_one(<4 x i16> %x) {
	; CHECK-LABEL: dont_fold_srem_one:			; CHECK-LABEL: dont_fold_srem_one:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: mov w9, #17097			; CHECK-NEXT: adrp x8, .LCPI4_0
	; CHECK-NEXT: // kill: def $d0 killed $d0 def $q0			; CHECK-NEXT: ldr d2, [x8, :lo12:.LCPI4_0]
	; CHECK-NEXT: smov w8, v0.h[2]			; CHECK-NEXT: adrp x8, .LCPI4_1
	; CHECK-NEXT: movk w9, #45590, lsl #16			; CHECK-NEXT: ldr d3, [x8, :lo12:.LCPI4_1]
	; CHECK-NEXT: smull x9, w8, w9			; CHECK-NEXT: movi d1, #0x00ffff0000ffff
	; CHECK-NEXT: lsr x9, x9, #32			; CHECK-NEXT: smull v2.4s, v0.4h, v2.4h
	; CHECK-NEXT: add w9, w9, w8			; CHECK-NEXT: and v1.8b, v0.8b, v1.8b
	; CHECK-NEXT: asr w12, w9, #4			; CHECK-NEXT: shrn v2.4h, v2.4s, #16
	; CHECK-NEXT: add w9, w12, w9, lsr #31			; CHECK-NEXT: adrp x8, .LCPI4_2
	; CHECK-NEXT: mov w12, #30865			; CHECK-NEXT: neg v3.4h, v3.4h
	; CHECK-NEXT: mov w10, #23			; CHECK-NEXT: add v1.4h, v2.4h, v1.4h
	; CHECK-NEXT: smov w11, v0.h[1]			; CHECK-NEXT: ldr d4, [x8, :lo12:.LCPI4_2]
	; CHECK-NEXT: movk w12, #51306, lsl #16			; CHECK-NEXT: sshl v1.4h, v1.4h, v3.4h
	; CHECK-NEXT: msub w8, w9, w10, w8			; CHECK-NEXT: ushr v2.4h, v1.4h, #15
	; CHECK-NEXT: smull x10, w11, w12			; CHECK-NEXT: movi d3, #0xffffffffffff0000
	; CHECK-NEXT: lsr x10, x10, #32			; CHECK-NEXT: and v2.8b, v2.8b, v3.8b
	; CHECK-NEXT: add w10, w10, w11			; CHECK-NEXT: add v1.4h, v1.4h, v2.4h
	; CHECK-NEXT: asr w12, w10, #9			; CHECK-NEXT: mls v0.4h, v1.4h, v4.4h
	; CHECK-NEXT: mov w9, #654
	; CHECK-NEXT: add w10, w12, w10, lsr #31
	; CHECK-NEXT: msub w9, w10, w9, w11
	; CHECK-NEXT: mov w10, #47143
	; CHECK-NEXT: smov w12, v0.h[3]
	; CHECK-NEXT: movk w10, #24749, lsl #16
	; CHECK-NEXT: smull x10, w12, w10
	; CHECK-NEXT: lsr x11, x10, #63
	; CHECK-NEXT: asr x10, x10, #43
	; CHECK-NEXT: movi d0, #0000000000000000
	; CHECK-NEXT: add w10, w10, w11
	; CHECK-NEXT: mov v0.h[1], w9
	; CHECK-NEXT: mov w9, #5423
	; CHECK-NEXT: mov v0.h[2], w8
	; CHECK-NEXT: msub w8, w10, w9, w12
	; CHECK-NEXT: mov v0.h[3], w8
	; CHECK-NEXT: // kill: def $d0 killed $d0 killed $q0
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%1 = srem <4 x i16> %x, <i16 1, i16 654, i16 23, i16 5423>			%1 = srem <4 x i16> %x, <i16 1, i16 654, i16 23, i16 5423>
	ret <4 x i16> %1			ret <4 x i16> %1
	}			}

	; Don't fold if the divisor is 2^15.			; Don't fold if the divisor is 2^15.
	define <4 x i16> @dont_fold_srem_i16_smax(<4 x i16> %x) {			define <4 x i16> @dont_fold_srem_i16_smax(<4 x i16> %x) {
	; CHECK-LABEL: dont_fold_srem_i16_smax:			; CHECK-LABEL: dont_fold_srem_i16_smax:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: mov w10, #17097			; CHECK-NEXT: adrp x8, .LCPI5_0
	; CHECK-NEXT: // kill: def $d0 killed $d0 def $q0			; CHECK-NEXT: ldr d1, [x8, :lo12:.LCPI5_0]
	; CHECK-NEXT: smov w9, v0.h[2]			; CHECK-NEXT: adrp x8, .LCPI5_1
	; CHECK-NEXT: movk w10, #45590, lsl #16			; CHECK-NEXT: ldr d2, [x8, :lo12:.LCPI5_1]
	; CHECK-NEXT: smull x10, w9, w10			; CHECK-NEXT: adrp x8, .LCPI5_2
	; CHECK-NEXT: lsr x10, x10, #32			; CHECK-NEXT: ldr d3, [x8, :lo12:.LCPI5_2]
	; CHECK-NEXT: add w10, w10, w9			; CHECK-NEXT: adrp x8, .LCPI5_3
	; CHECK-NEXT: asr w12, w10, #4			; CHECK-NEXT: smull v2.4s, v0.4h, v2.4h
	; CHECK-NEXT: mov w11, #23			; CHECK-NEXT: shrn v2.4h, v2.4s, #16
	; CHECK-NEXT: add w10, w12, w10, lsr #31			; CHECK-NEXT: neg v3.4h, v3.4h
	; CHECK-NEXT: msub w9, w10, w11, w9			; CHECK-NEXT: mla v2.4h, v0.4h, v1.4h
	; CHECK-NEXT: mov w10, #47143			; CHECK-NEXT: ldr d4, [x8, :lo12:.LCPI5_3]
	; CHECK-NEXT: smov w12, v0.h[3]			; CHECK-NEXT: sshl v1.4h, v2.4h, v3.4h
	; CHECK-NEXT: movk w10, #24749, lsl #16			; CHECK-NEXT: ushr v2.4h, v1.4h, #15
	; CHECK-NEXT: smull x10, w12, w10			; CHECK-NEXT: movi d3, #0xffffffffffff0000
	; CHECK-NEXT: lsr x11, x10, #63			; CHECK-NEXT: and v2.8b, v2.8b, v3.8b
	; CHECK-NEXT: asr x10, x10, #43			; CHECK-NEXT: add v1.4h, v1.4h, v2.4h
	; CHECK-NEXT: smov w8, v0.h[1]			; CHECK-NEXT: mls v0.4h, v1.4h, v4.4h
	; CHECK-NEXT: add w10, w10, w11
	; CHECK-NEXT: mov w11, #32767
	; CHECK-NEXT: add w11, w8, w11
	; CHECK-NEXT: cmp w8, #0 // =0
	; CHECK-NEXT: csel w11, w11, w8, lt
	; CHECK-NEXT: and w11, w11, #0xffff8000
	; CHECK-NEXT: sub w8, w8, w11
	; CHECK-NEXT: movi d0, #0000000000000000
	; CHECK-NEXT: mov v0.h[1], w8
	; CHECK-NEXT: mov w8, #5423
	; CHECK-NEXT: mov v0.h[2], w9
	; CHECK-NEXT: msub w8, w10, w8, w12
	; CHECK-NEXT: mov v0.h[3], w8
	; CHECK-NEXT: // kill: def $d0 killed $d0 killed $q0
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%1 = srem <4 x i16> %x, <i16 1, i16 32768, i16 23, i16 5423>			%1 = srem <4 x i16> %x, <i16 1, i16 32768, i16 23, i16 5423>
	ret <4 x i16> %1			ret <4 x i16> %1
	}			}

	; Don't fold i64 srem.			; Don't fold i64 srem.
	define <4 x i64> @dont_fold_srem_i64(<4 x i64> %x) {			define <4 x i64> @dont_fold_srem_i64(<4 x i64> %x) {
	; CHECK-LABEL: dont_fold_srem_i64:			; CHECK-LABEL: dont_fold_srem_i64:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
				; CHECK-NEXT: mov x9, #21445
				; CHECK-NEXT: movk x9, #1603, lsl #16
				; CHECK-NEXT: movk x9, #15432, lsl #32
				; CHECK-NEXT: mov x8, v0.d[1]
				; CHECK-NEXT: movk x9, #25653, lsl #48
				; CHECK-NEXT: smulh x8, x8, x9
	; CHECK-NEXT: mov x9, #6055			; CHECK-NEXT: mov x9, #6055
	; CHECK-NEXT: movk x9, #58853, lsl #16			; CHECK-NEXT: movk x9, #58853, lsl #16
	; CHECK-NEXT: movk x9, #47142, lsl #32			; CHECK-NEXT: movk x9, #47142, lsl #32
	; CHECK-NEXT: mov x8, v1.d[1]			; CHECK-NEXT: mov x11, v1.d[1]
	; CHECK-NEXT: movk x9, #24749, lsl #48			; CHECK-NEXT: movk x9, #24749, lsl #48
	; CHECK-NEXT: smulh x9, x8, x9			; CHECK-NEXT: smulh x9, x11, x9
	; CHECK-NEXT: asr x12, x9, #11			; CHECK-NEXT: mov x11, #8549
				; CHECK-NEXT: movk x11, #22795, lsl #16
				; CHECK-NEXT: adrp x10, .LCPI6_0
				; CHECK-NEXT: movk x11, #17096, lsl #32
				; CHECK-NEXT: ldr q2, [x10, :lo12:.LCPI6_0]
				; CHECK-NEXT: fmov x10, d1
				; CHECK-NEXT: movk x11, #45590, lsl #48
				; CHECK-NEXT: smulh x10, x10, x11
				; CHECK-NEXT: adrp x11, .LCPI6_3
				; CHECK-NEXT: ldr q3, [x11, :lo12:.LCPI6_3]
				; CHECK-NEXT: movi v4.2d, #0000000000000000
				; CHECK-NEXT: fmov d5, x8
				; CHECK-NEXT: mov v4.d[1], v5.d[0]
				; CHECK-NEXT: fmov d5, x9
				; CHECK-NEXT: fmov d6, x10
				; CHECK-NEXT: mov v6.d[1], v5.d[0]
				; CHECK-NEXT: and v5.16b, v1.16b, v2.16b
				; CHECK-NEXT: add v5.2d, v6.2d, v5.2d
				; CHECK-NEXT: neg v3.2d, v3.2d
				; CHECK-NEXT: adrp x8, .LCPI6_1
				; CHECK-NEXT: sshl v3.2d, v5.2d, v3.2d
				; CHECK-NEXT: usra v3.2d, v5.2d, #63
				; CHECK-NEXT: ldr q5, [x8, :lo12:.LCPI6_1]
				; CHECK-NEXT: adrp x9, .LCPI6_2
				; CHECK-NEXT: mov x8, v3.d[1]
				; CHECK-NEXT: fmov x10, d3
				; CHECK-NEXT: ldr q3, [x9, :lo12:.LCPI6_2]
				; CHECK-NEXT: and v2.16b, v0.16b, v2.16b
				; CHECK-NEXT: neg v5.2d, v5.2d
				; CHECK-NEXT: add v2.2d, v4.2d, v2.2d
				; CHECK-NEXT: sshl v4.2d, v2.2d, v5.2d
				; CHECK-NEXT: ushr v2.2d, v2.2d, #63
				; CHECK-NEXT: mov w9, #23
				; CHECK-NEXT: and v2.16b, v2.16b, v3.16b
				; CHECK-NEXT: mul x9, x10, x9
	; CHECK-NEXT: mov w10, #5423			; CHECK-NEXT: mov w10, #5423
	; CHECK-NEXT: add x9, x12, x9, lsr #63			; CHECK-NEXT: add v2.2d, v4.2d, v2.2d
	; CHECK-NEXT: msub x8, x9, x10, x8			; CHECK-NEXT: mul x8, x8, x10
	; CHECK-NEXT: mov x9, #21445
	; CHECK-NEXT: movk x9, #1603, lsl #16
	; CHECK-NEXT: movk x9, #15432, lsl #32
	; CHECK-NEXT: mov x12, v0.d[1]
	; CHECK-NEXT: movk x9, #25653, lsl #48
	; CHECK-NEXT: smulh x9, x12, x9
	; CHECK-NEXT: asr x10, x9, #8
	; CHECK-NEXT: add x9, x10, x9, lsr #63
	; CHECK-NEXT: mov w10, #654			; CHECK-NEXT: mov w10, #654
	; CHECK-NEXT: msub x9, x9, x10, x12			; CHECK-NEXT: fmov d3, x9
	; CHECK-NEXT: mov x10, #8549			; CHECK-NEXT: mov x9, v2.d[1]
	; CHECK-NEXT: movk x10, #22795, lsl #16			; CHECK-NEXT: mul x9, x9, x10
	; CHECK-NEXT: movk x10, #17096, lsl #32			; CHECK-NEXT: mov v3.d[1], x8
	; CHECK-NEXT: fmov x11, d1			; CHECK-NEXT: mov v2.d[1], x9
	; CHECK-NEXT: movk x10, #45590, lsl #48			; CHECK-NEXT: sub v0.2d, v0.2d, v2.2d
	; CHECK-NEXT: smulh x10, x11, x10			; CHECK-NEXT: sub v1.2d, v1.2d, v3.2d
	; CHECK-NEXT: add x10, x10, x11
	; CHECK-NEXT: asr x12, x10, #4
	; CHECK-NEXT: add x10, x12, x10, lsr #63
	; CHECK-NEXT: mov w12, #23
	; CHECK-NEXT: msub x10, x10, x12, x11
	; CHECK-NEXT: movi v0.2d, #0000000000000000
	; CHECK-NEXT: fmov d1, x10
	; CHECK-NEXT: mov v1.d[1], x8
	; CHECK-NEXT: mov v0.d[1], x9
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%1 = srem <4 x i64> %x, <i64 1, i64 654, i64 23, i64 5423>			%1 = srem <4 x i64> %x, <i64 1, i64 654, i64 23, i64 5423>
	ret <4 x i64> %1			ret <4 x i64> %1
	}			}

llvm/test/CodeGen/AArch64/urem-seteq-nonzero.ll

	Show First 20 Lines • Show All 189 Lines • ▼ Show 20 Lines
	}			}

	;-------------------------------------------------------------------------------			;-------------------------------------------------------------------------------
	; Other widths.			; Other widths.

	define i1 @t16_3_2(i16 %X) nounwind {			define i1 @t16_3_2(i16 %X) nounwind {
	; CHECK-LABEL: t16_3_2:			; CHECK-LABEL: t16_3_2:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: mov w9, #43691
	; CHECK-NEXT: and w8, w0, #0xffff			; CHECK-NEXT: and w8, w0, #0xffff
	; CHECK-NEXT: movk w9, #43690, lsl #16			; CHECK-NEXT: mov w9, #43691
	; CHECK-NEXT: mov w10, #-1431655766			; CHECK-NEXT: mul w8, w8, w9
	; CHECK-NEXT: madd w8, w8, w9, w10			; CHECK-NEXT: lsr w8, w8, #17
	; CHECK-NEXT: mov w9, #1431655765			; CHECK-NEXT: add w8, w8, w8, lsl #1
	; CHECK-NEXT: cmp w8, w9			; CHECK-NEXT: sub w8, w0, w8
	; CHECK-NEXT: cset w0, lo			; CHECK-NEXT: and w8, w8, #0xffff
				; CHECK-NEXT: cmp w8, #2 // =2
				; CHECK-NEXT: cset w0, eq
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
				efriedmaUnsubmitted Not Done Reply Inline Actions Any idea what's going on here? efriedma: Any idea what's going on here?
				nagisaAuthorUnsubmitted Done Reply Inline Actions Good catch. With the old code the `urem` gets promoted to i32 first, which AFAICT then allows some other validity check pass in the `SimplifySetCC` (which doesn't otherwise work for i16/i8), and thus apply (seteq/ne (urem N, D), 0) -> (setule/ugt (rotr (mul N, P), K), Q) anyway. With the adjusted `BuildUDIV` the multiply-shift reduction manages to get applied before `urem i16` gets promoted to `urem i32`. nagisa: Good catch. With the old code the `urem` gets promoted to i32 first, which AFAICT then allows…
	%urem = urem i16 %X, 3			%urem = urem i16 %X, 3
	%cmp = icmp eq i16 %urem, 2			%cmp = icmp eq i16 %urem, 2
	ret i1 %cmp			ret i1 %cmp
	}			}

	define i1 @t8_3_2(i8 %X) nounwind {			define i1 @t8_3_2(i8 %X) nounwind {
	; CHECK-LABEL: t8_3_2:			; CHECK-LABEL: t8_3_2:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: mov w9, #43691
	; CHECK-NEXT: and w8, w0, #0xff			; CHECK-NEXT: and w8, w0, #0xff
	; CHECK-NEXT: movk w9, #43690, lsl #16			; CHECK-NEXT: mov w9, #171
	; CHECK-NEXT: mov w10, #-1431655766			; CHECK-NEXT: mul w8, w8, w9
	; CHECK-NEXT: madd w8, w8, w9, w10			; CHECK-NEXT: lsr w8, w8, #9
	; CHECK-NEXT: mov w9, #1431655765			; CHECK-NEXT: add w8, w8, w8, lsl #1
	; CHECK-NEXT: cmp w8, w9			; CHECK-NEXT: sub w8, w0, w8
	; CHECK-NEXT: cset w0, lo			; CHECK-NEXT: and w8, w8, #0xff
				; CHECK-NEXT: cmp w8, #2 // =2
				; CHECK-NEXT: cset w0, eq
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%urem = urem i8 %X, 3			%urem = urem i8 %X, 3
	%cmp = icmp eq i8 %urem, 2			%cmp = icmp eq i8 %urem, 2
	ret i1 %cmp			ret i1 %cmp
	}			}

	define i1 @t64_3_2(i64 %X) nounwind {			define i1 @t64_3_2(i64 %X) nounwind {
	; CHECK-LABEL: t64_3_2:			; CHECK-LABEL: t64_3_2:
	Show All 13 Lines

llvm/test/CodeGen/AArch64/urem-seteq.ll

	Show First 20 Lines • Show All 72 Lines • ▼ Show 20 Lines

	;------------------------------------------------------------------------------;			;------------------------------------------------------------------------------;
	; Even divisors			; Even divisors
	;------------------------------------------------------------------------------;			;------------------------------------------------------------------------------;

	define i16 @test_urem_even(i16 %X) nounwind {			define i16 @test_urem_even(i16 %X) nounwind {
	; CHECK-LABEL: test_urem_even:			; CHECK-LABEL: test_urem_even:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: mov w9, #28087			; CHECK-NEXT: ubfx w8, w0, #1, #15
	; CHECK-NEXT: and w8, w0, #0xffff			; CHECK-NEXT: mov w9, #18725
	; CHECK-NEXT: movk w9, #46811, lsl #16
	; CHECK-NEXT: mul w8, w8, w9			; CHECK-NEXT: mul w8, w8, w9
	; CHECK-NEXT: mov w9, #9362			; CHECK-NEXT: lsr w8, w8, #17
	; CHECK-NEXT: ror w8, w8, #1			; CHECK-NEXT: mov w9, #14
	; CHECK-NEXT: movk w9, #4681, lsl #16			; CHECK-NEXT: msub w8, w8, w9, w0
	; CHECK-NEXT: cmp w8, w9			; CHECK-NEXT: tst w8, #0xffff
	; CHECK-NEXT: cset w0, hi			; CHECK-NEXT: cset w0, ne
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%urem = urem i16 %X, 14			%urem = urem i16 %X, 14
	%cmp = icmp ne i16 %urem, 0			%cmp = icmp ne i16 %urem, 0
	%ret = zext i1 %cmp to i16			%ret = zext i1 %cmp to i16
	ret i16 %ret			ret i16 %ret
	}			}

	define i32 @test_urem_even_100(i32 %X) nounwind {			define i32 @test_urem_even_100(i32 %X) nounwind {
	▲ Show 20 Lines • Show All 157 Lines • Show Last 20 Lines

llvm/test/CodeGen/AArch64/urem-vector-lkk.ll

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: llc -mtriple=aarch64-unknown-linux-gnu < %s \| FileCheck %s			; RUN: llc -mtriple=aarch64-unknown-linux-gnu < %s \| FileCheck %s

	define <4 x i16> @fold_urem_vec_1(<4 x i16> %x) {			define <4 x i16> @fold_urem_vec_1(<4 x i16> %x) {
	; CHECK-LABEL: fold_urem_vec_1:			; CHECK-LABEL: fold_urem_vec_1:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: mov w11, #33437			; CHECK-NEXT: adrp x8, .LCPI0_0
	; CHECK-NEXT: // kill: def $d0 killed $d0 def $q0			; CHECK-NEXT: ldr d1, [x8, :lo12:.LCPI0_0]
	; CHECK-NEXT: umov w10, v0.h[2]			; CHECK-NEXT: adrp x8, .LCPI0_1
	; CHECK-NEXT: movk w11, #21399, lsl #16			; CHECK-NEXT: ldr d2, [x8, :lo12:.LCPI0_1]
	; CHECK-NEXT: umull x11, w10, w11			; CHECK-NEXT: adrp x8, .LCPI0_2
	; CHECK-NEXT: umov w8, v0.h[1]			; CHECK-NEXT: neg v1.4h, v1.4h
	; CHECK-NEXT: mov w9, #16913			; CHECK-NEXT: ldr d3, [x8, :lo12:.LCPI0_2]
	; CHECK-NEXT: mov w12, #98			; CHECK-NEXT: ushl v1.4h, v0.4h, v1.4h
	; CHECK-NEXT: lsr x11, x11, #37			; CHECK-NEXT: adrp x8, .LCPI0_3
	; CHECK-NEXT: movk w9, #8456, lsl #16			; CHECK-NEXT: umull v1.4s, v1.4h, v2.4h
	; CHECK-NEXT: msub w10, w11, w12, w10			; CHECK-NEXT: ldr d4, [x8, :lo12:.LCPI0_3]
	; CHECK-NEXT: ubfx w12, w8, #2, #14			; CHECK-NEXT: shrn v1.4h, v1.4s, #16
	; CHECK-NEXT: umull x9, w12, w9			; CHECK-NEXT: adrp x8, .LCPI0_4
	; CHECK-NEXT: mov w11, #124			; CHECK-NEXT: sub v2.4h, v0.4h, v1.4h
	; CHECK-NEXT: lsr x9, x9, #34			; CHECK-NEXT: umull v2.4s, v2.4h, v3.4h
	; CHECK-NEXT: msub w8, w9, w11, w8			; CHECK-NEXT: ldr d3, [x8, :lo12:.LCPI0_4]
	; CHECK-NEXT: mov w9, #8969			; CHECK-NEXT: shrn v2.4h, v2.4s, #16
	; CHECK-NEXT: umov w12, v0.h[0]			; CHECK-NEXT: add v1.4h, v2.4h, v1.4h
	; CHECK-NEXT: movk w9, #22765, lsl #16			; CHECK-NEXT: neg v2.4h, v4.4h
	; CHECK-NEXT: umull x9, w12, w9			; CHECK-NEXT: ushl v1.4h, v1.4h, v2.4h
	; CHECK-NEXT: lsr x9, x9, #32			; CHECK-NEXT: mls v0.4h, v1.4h, v3.4h
	; CHECK-NEXT: sub w11, w12, w9
	; CHECK-NEXT: add w9, w9, w11, lsr #1
	; CHECK-NEXT: mov w11, #95
	; CHECK-NEXT: lsr w9, w9, #6
	; CHECK-NEXT: msub w9, w9, w11, w12
	; CHECK-NEXT: umov w11, v0.h[3]
	; CHECK-NEXT: fmov s0, w9
	; CHECK-NEXT: mov w9, #2287
	; CHECK-NEXT: movk w9, #16727, lsl #16
	; CHECK-NEXT: umull x9, w11, w9
	; CHECK-NEXT: mov v0.h[1], w8
	; CHECK-NEXT: mov w8, #1003
	; CHECK-NEXT: lsr x9, x9, #40
	; CHECK-NEXT: mov v0.h[2], w10
	; CHECK-NEXT: msub w8, w9, w8, w11
	; CHECK-NEXT: mov v0.h[3], w8
	; CHECK-NEXT: // kill: def $d0 killed $d0 killed $q0
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%1 = urem <4 x i16> %x, <i16 95, i16 124, i16 98, i16 1003>			%1 = urem <4 x i16> %x, <i16 95, i16 124, i16 98, i16 1003>
	ret <4 x i16> %1			ret <4 x i16> %1
	}			}

	define <4 x i16> @fold_urem_vec_2(<4 x i16> %x) {			define <4 x i16> @fold_urem_vec_2(<4 x i16> %x) {
	; CHECK-LABEL: fold_urem_vec_2:			; CHECK-LABEL: fold_urem_vec_2:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: mov w9, #8969			; CHECK-NEXT: mov w8, #44151
	; CHECK-NEXT: // kill: def $d0 killed $d0 def $q0			; CHECK-NEXT: dup v1.4h, w8
	; CHECK-NEXT: umov w8, v0.h[1]			; CHECK-NEXT: umull v1.4s, v0.4h, v1.4h
	; CHECK-NEXT: movk w9, #22765, lsl #16			; CHECK-NEXT: ushr v1.4s, v1.4s, #22
	; CHECK-NEXT: umov w10, v0.h[0]			; CHECK-NEXT: xtn v1.4h, v1.4s
	; CHECK-NEXT: umull x13, w8, w9			; CHECK-NEXT: movi v2.4h, #95
	; CHECK-NEXT: umov w11, v0.h[2]			; CHECK-NEXT: mls v0.4h, v1.4h, v2.4h
	; CHECK-NEXT: umull x14, w10, w9
	; CHECK-NEXT: lsr x13, x13, #32
	; CHECK-NEXT: umov w12, v0.h[3]
	; CHECK-NEXT: umull x15, w11, w9
	; CHECK-NEXT: lsr x14, x14, #32
	; CHECK-NEXT: sub w16, w8, w13
	; CHECK-NEXT: umull x9, w12, w9
	; CHECK-NEXT: lsr x15, x15, #32
	; CHECK-NEXT: add w13, w13, w16, lsr #1
	; CHECK-NEXT: sub w16, w10, w14
	; CHECK-NEXT: lsr x9, x9, #32
	; CHECK-NEXT: add w14, w14, w16, lsr #1
	; CHECK-NEXT: sub w16, w11, w15
	; CHECK-NEXT: add w15, w15, w16, lsr #1
	; CHECK-NEXT: sub w16, w12, w9
	; CHECK-NEXT: add w9, w9, w16, lsr #1
	; CHECK-NEXT: mov w16, #95
	; CHECK-NEXT: lsr w13, w13, #6
	; CHECK-NEXT: msub w8, w13, w16, w8
	; CHECK-NEXT: lsr w13, w14, #6
	; CHECK-NEXT: msub w10, w13, w16, w10
	; CHECK-NEXT: lsr w13, w15, #6
	; CHECK-NEXT: fmov s0, w10
	; CHECK-NEXT: msub w11, w13, w16, w11
	; CHECK-NEXT: lsr w9, w9, #6
	; CHECK-NEXT: mov v0.h[1], w8
	; CHECK-NEXT: mov v0.h[2], w11
	; CHECK-NEXT: msub w8, w9, w16, w12
	; CHECK-NEXT: mov v0.h[3], w8
	; CHECK-NEXT: // kill: def $d0 killed $d0 killed $q0
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%1 = urem <4 x i16> %x, <i16 95, i16 95, i16 95, i16 95>			%1 = urem <4 x i16> %x, <i16 95, i16 95, i16 95, i16 95>
	ret <4 x i16> %1			ret <4 x i16> %1
	}			}


	; Don't fold if we can combine urem with udiv.			; Don't fold if we can combine urem with udiv.
	define <4 x i16> @combine_urem_udiv(<4 x i16> %x) {			define <4 x i16> @combine_urem_udiv(<4 x i16> %x) {
	; CHECK-LABEL: combine_urem_udiv:			; CHECK-LABEL: combine_urem_udiv:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: mov w8, #8969			; CHECK-NEXT: mov w8, #44151
	; CHECK-NEXT: // kill: def $d0 killed $d0 def $q0			; CHECK-NEXT: dup v2.4h, w8
	; CHECK-NEXT: movk w8, #22765, lsl #16			; CHECK-NEXT: umull v2.4s, v0.4h, v2.4h
	; CHECK-NEXT: umov w9, v0.h[1]			; CHECK-NEXT: ushr v2.4s, v2.4s, #22
	; CHECK-NEXT: umov w10, v0.h[0]			; CHECK-NEXT: movi v1.4h, #95
	; CHECK-NEXT: umull x13, w9, w8			; CHECK-NEXT: xtn v2.4h, v2.4s
	; CHECK-NEXT: umov w11, v0.h[2]			; CHECK-NEXT: mls v0.4h, v2.4h, v1.4h
	; CHECK-NEXT: umull x14, w10, w8			; CHECK-NEXT: add v0.4h, v0.4h, v2.4h
	; CHECK-NEXT: lsr x13, x13, #32
	; CHECK-NEXT: umov w12, v0.h[3]
	; CHECK-NEXT: umull x15, w11, w8
	; CHECK-NEXT: lsr x14, x14, #32
	; CHECK-NEXT: sub w16, w9, w13
	; CHECK-NEXT: umull x8, w12, w8
	; CHECK-NEXT: lsr x15, x15, #32
	; CHECK-NEXT: add w13, w13, w16, lsr #1
	; CHECK-NEXT: sub w16, w10, w14
	; CHECK-NEXT: lsr x8, x8, #32
	; CHECK-NEXT: add w14, w14, w16, lsr #1
	; CHECK-NEXT: sub w16, w11, w15
	; CHECK-NEXT: add w15, w15, w16, lsr #1
	; CHECK-NEXT: sub w16, w12, w8
	; CHECK-NEXT: add w8, w8, w16, lsr #1
	; CHECK-NEXT: mov w16, #95
	; CHECK-NEXT: lsr w14, w14, #6
	; CHECK-NEXT: lsr w13, w13, #6
	; CHECK-NEXT: msub w10, w14, w16, w10
	; CHECK-NEXT: lsr w15, w15, #6
	; CHECK-NEXT: msub w9, w13, w16, w9
	; CHECK-NEXT: fmov s0, w14
	; CHECK-NEXT: fmov s1, w10
	; CHECK-NEXT: lsr w8, w8, #6
	; CHECK-NEXT: msub w11, w15, w16, w11
	; CHECK-NEXT: mov v0.h[1], w13
	; CHECK-NEXT: mov v1.h[1], w9
	; CHECK-NEXT: msub w12, w8, w16, w12
	; CHECK-NEXT: mov v0.h[2], w15
	; CHECK-NEXT: mov v1.h[2], w11
	; CHECK-NEXT: mov v1.h[3], w12
	; CHECK-NEXT: mov v0.h[3], w8
	; CHECK-NEXT: add v0.4h, v1.4h, v0.4h
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%1 = urem <4 x i16> %x, <i16 95, i16 95, i16 95, i16 95>			%1 = urem <4 x i16> %x, <i16 95, i16 95, i16 95, i16 95>
	%2 = udiv <4 x i16> %x, <i16 95, i16 95, i16 95, i16 95>			%2 = udiv <4 x i16> %x, <i16 95, i16 95, i16 95, i16 95>
	%3 = add <4 x i16> %1, %2			%3 = add <4 x i16> %1, %2
	ret <4 x i16> %3			ret <4 x i16> %3
	}			}


	; Don't fold for divisors that are a power of two.			; Don't fold for divisors that are a power of two.
	define <4 x i16> @dont_fold_urem_power_of_two(<4 x i16> %x) {			define <4 x i16> @dont_fold_urem_power_of_two(<4 x i16> %x) {
	; CHECK-LABEL: dont_fold_urem_power_of_two:			; CHECK-LABEL: dont_fold_urem_power_of_two:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: mov w9, #8969			; CHECK-NEXT: adrp x8, .LCPI3_0
	; CHECK-NEXT: // kill: def $d0 killed $d0 def $q0			; CHECK-NEXT: adrp x9, .LCPI3_1
	; CHECK-NEXT: umov w8, v0.h[3]			; CHECK-NEXT: ldr d1, [x8, :lo12:.LCPI3_0]
	; CHECK-NEXT: movk w9, #22765, lsl #16			; CHECK-NEXT: ldr d2, [x9, :lo12:.LCPI3_1]
	; CHECK-NEXT: umull x9, w8, w9			; CHECK-NEXT: adrp x8, .LCPI3_2
	; CHECK-NEXT: lsr x9, x9, #32			; CHECK-NEXT: ldr d3, [x8, :lo12:.LCPI3_2]
	; CHECK-NEXT: sub w10, w8, w9			; CHECK-NEXT: umull v1.4s, v0.4h, v1.4h
	; CHECK-NEXT: add w9, w9, w10, lsr #1			; CHECK-NEXT: shrn v1.4h, v1.4s, #16
	; CHECK-NEXT: mov w10, #95			; CHECK-NEXT: neg v2.4h, v2.4h
	; CHECK-NEXT: lsr w9, w9, #6			; CHECK-NEXT: ushl v1.4h, v1.4h, v2.4h
	; CHECK-NEXT: msub w8, w9, w10, w8			; CHECK-NEXT: mls v0.4h, v1.4h, v3.4h
	; CHECK-NEXT: umov w9, v0.h[0]
	; CHECK-NEXT: and w9, w9, #0x3f
	; CHECK-NEXT: umov w10, v0.h[1]
	; CHECK-NEXT: fmov s1, w9
	; CHECK-NEXT: umov w9, v0.h[2]
	; CHECK-NEXT: and w10, w10, #0x1f
	; CHECK-NEXT: and w9, w9, #0x7
	; CHECK-NEXT: mov v1.h[1], w10
	; CHECK-NEXT: mov v1.h[2], w9
	; CHECK-NEXT: mov v1.h[3], w8
	; CHECK-NEXT: mov v0.16b, v1.16b
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%1 = urem <4 x i16> %x, <i16 64, i16 32, i16 8, i16 95>			%1 = urem <4 x i16> %x, <i16 64, i16 32, i16 8, i16 95>
	ret <4 x i16> %1			ret <4 x i16> %1
	}			}

	; Don't fold if the divisor is one.			; Don't fold if the divisor is one.
	define <4 x i16> @dont_fold_srem_one(<4 x i16> %x) {			define <4 x i16> @dont_fold_srem_one(<4 x i16> %x) {
	; CHECK-LABEL: dont_fold_srem_one:			; CHECK-LABEL: dont_fold_srem_one:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: mov w9, #17097			; CHECK-NEXT: adrp x8, .LCPI4_0
	; CHECK-NEXT: // kill: def $d0 killed $d0 def $q0			; CHECK-NEXT: ldr d1, [x8, :lo12:.LCPI4_0]
	; CHECK-NEXT: umov w8, v0.h[2]			; CHECK-NEXT: adrp x8, .LCPI4_1
	; CHECK-NEXT: movk w9, #45590, lsl #16			; CHECK-NEXT: ldr d2, [x8, :lo12:.LCPI4_1]
	; CHECK-NEXT: umull x9, w8, w9			; CHECK-NEXT: adrp x8, .LCPI4_2
	; CHECK-NEXT: mov w10, #23			; CHECK-NEXT: umull v1.4s, v0.4h, v1.4h
	; CHECK-NEXT: lsr x9, x9, #36			; CHECK-NEXT: shrn v1.4h, v1.4s, #16
	; CHECK-NEXT: umov w11, v0.h[1]			; CHECK-NEXT: sub v3.4h, v0.4h, v1.4h
	; CHECK-NEXT: msub w8, w9, w10, w8			; CHECK-NEXT: umull v2.4s, v3.4h, v2.4h
	; CHECK-NEXT: mov w9, #30865			; CHECK-NEXT: ldr d3, [x8, :lo12:.LCPI4_2]
	; CHECK-NEXT: movk w9, #51306, lsl #16			; CHECK-NEXT: shrn v2.4h, v2.4s, #16
	; CHECK-NEXT: ubfx w10, w11, #1, #15			; CHECK-NEXT: add v1.4h, v2.4h, v1.4h
	; CHECK-NEXT: umull x9, w10, w9			; CHECK-NEXT: adrp x8, .LCPI4_3
	; CHECK-NEXT: mov w10, #654			; CHECK-NEXT: neg v3.4h, v3.4h
	; CHECK-NEXT: lsr x9, x9, #40			; CHECK-NEXT: movi d2, #0xffffffffffff0000
	; CHECK-NEXT: msub w9, w9, w10, w11			; CHECK-NEXT: ushl v1.4h, v1.4h, v3.4h
	; CHECK-NEXT: mov w11, #47143			; CHECK-NEXT: ldr d3, [x8, :lo12:.LCPI4_3]
	; CHECK-NEXT: umov w10, v0.h[3]			; CHECK-NEXT: and v1.8b, v1.8b, v2.8b
	; CHECK-NEXT: movk w11, #24749, lsl #16			; CHECK-NEXT: movi d2, #0x0000000000ffff
	; CHECK-NEXT: movi d1, #0000000000000000			; CHECK-NEXT: and v2.8b, v0.8b, v2.8b
	; CHECK-NEXT: umull x11, w10, w11			; CHECK-NEXT: orr v1.8b, v2.8b, v1.8b
	; CHECK-NEXT: mov v1.h[1], w9			; CHECK-NEXT: mls v0.4h, v1.4h, v3.4h
	; CHECK-NEXT: mov w9, #5423
	; CHECK-NEXT: lsr x11, x11, #43
	; CHECK-NEXT: mov v1.h[2], w8
	; CHECK-NEXT: msub w8, w11, w9, w10
	; CHECK-NEXT: mov v1.h[3], w8
	; CHECK-NEXT: mov v0.16b, v1.16b
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%1 = urem <4 x i16> %x, <i16 1, i16 654, i16 23, i16 5423>			%1 = urem <4 x i16> %x, <i16 1, i16 654, i16 23, i16 5423>
	ret <4 x i16> %1			ret <4 x i16> %1
	}			}

	; Don't fold if the divisor is 2^16.			; Don't fold if the divisor is 2^16.
	define <4 x i16> @dont_fold_urem_i16_smax(<4 x i16> %x) {			define <4 x i16> @dont_fold_urem_i16_smax(<4 x i16> %x) {
	; CHECK-LABEL: dont_fold_urem_i16_smax:			; CHECK-LABEL: dont_fold_urem_i16_smax:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%1 = urem <4 x i16> %x, <i16 1, i16 65536, i16 23, i16 5423>			%1 = urem <4 x i16> %x, <i16 1, i16 65536, i16 23, i16 5423>
	ret <4 x i16> %1			ret <4 x i16> %1
	}			}

	; Don't fold i64 urem.			; Don't fold i64 urem.
	define <4 x i64> @dont_fold_urem_i64(<4 x i64> %x) {			define <4 x i64> @dont_fold_urem_i64(<4 x i64> %x) {
	; CHECK-LABEL: dont_fold_urem_i64:			; CHECK-LABEL: dont_fold_urem_i64:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: mov x10, #12109			; CHECK-NEXT: mov x9, #12109
	; CHECK-NEXT: movk x10, #52170, lsl #16			; CHECK-NEXT: movk x9, #52170, lsl #16
	; CHECK-NEXT: movk x10, #28749, lsl #32			; CHECK-NEXT: movk x9, #28749, lsl #32
	; CHECK-NEXT: mov x8, v1.d[1]			; CHECK-NEXT: mov x8, v1.d[1]
	; CHECK-NEXT: movk x10, #49499, lsl #48			; CHECK-NEXT: movk x9, #49499, lsl #48
	; CHECK-NEXT: umulh x10, x8, x10			; CHECK-NEXT: umulh x8, x8, x9
	; CHECK-NEXT: mov w11, #5423			; CHECK-NEXT: mov x9, #17097
	; CHECK-NEXT: lsr x10, x10, #12			; CHECK-NEXT: movk x9, #45590, lsl #16
	; CHECK-NEXT: msub x8, x10, x11, x8			; CHECK-NEXT: movk x9, #34192, lsl #32
				; CHECK-NEXT: fmov x10, d1
				; CHECK-NEXT: movk x9, #25644, lsl #48
				; CHECK-NEXT: ushr v3.2d, v0.2d, #1
				; CHECK-NEXT: umulh x9, x10, x9
	; CHECK-NEXT: mov x10, #21445			; CHECK-NEXT: mov x10, #21445
				; CHECK-NEXT: fmov d4, x8
				; CHECK-NEXT: mov x8, v3.d[1]
				; CHECK-NEXT: fmov d3, x9
	; CHECK-NEXT: movk x10, #1603, lsl #16			; CHECK-NEXT: movk x10, #1603, lsl #16
	; CHECK-NEXT: mov x12, v0.d[1]			; CHECK-NEXT: mov v3.d[1], v4.d[0]
	; CHECK-NEXT: movk x10, #15432, lsl #32			; CHECK-NEXT: movk x10, #15432, lsl #32
				; CHECK-NEXT: sub v4.2d, v1.2d, v3.2d
	; CHECK-NEXT: movk x10, #25653, lsl #48			; CHECK-NEXT: movk x10, #25653, lsl #48
	; CHECK-NEXT: lsr x11, x12, #1			; CHECK-NEXT: fmov x9, d4
	; CHECK-NEXT: umulh x10, x11, x10			; CHECK-NEXT: umulh x8, x8, x10
	; CHECK-NEXT: mov w11, #654			; CHECK-NEXT: lsr x9, x9, #1
	; CHECK-NEXT: lsr x10, x10, #7			; CHECK-NEXT: fmov d2, xzr
	; CHECK-NEXT: msub x10, x10, x11, x12			; CHECK-NEXT: adrp x10, .LCPI6_0
	; CHECK-NEXT: mov x11, #17097			; CHECK-NEXT: fmov d4, x8
	; CHECK-NEXT: movk x11, #45590, lsl #16			; CHECK-NEXT: fmov d5, x9
	; CHECK-NEXT: movk x11, #34192, lsl #32			; CHECK-NEXT: mov v5.d[1], v2.d[0]
	; CHECK-NEXT: fmov x9, d1			; CHECK-NEXT: mov v2.d[1], v4.d[0]
	; CHECK-NEXT: movk x11, #25644, lsl #48			; CHECK-NEXT: ldr q4, [x10, :lo12:.LCPI6_0]
	; CHECK-NEXT: umulh x11, x9, x11			; CHECK-NEXT: add v3.2d, v5.2d, v3.2d
	; CHECK-NEXT: sub x12, x9, x11			; CHECK-NEXT: adrp x8, .LCPI6_1
	; CHECK-NEXT: add x11, x11, x12, lsr #1			; CHECK-NEXT: adrp x9, .LCPI6_2
	; CHECK-NEXT: mov w12, #23			; CHECK-NEXT: neg v4.2d, v4.2d
	; CHECK-NEXT: lsr x11, x11, #4			; CHECK-NEXT: ushl v3.2d, v3.2d, v4.2d
	; CHECK-NEXT: msub x9, x11, x12, x9			; CHECK-NEXT: ldr q4, [x8, :lo12:.LCPI6_1]
	; CHECK-NEXT: movi v0.2d, #0000000000000000			; CHECK-NEXT: mov x8, v3.d[1]
	; CHECK-NEXT: fmov d1, x9			; CHECK-NEXT: fmov x10, d3
	; CHECK-NEXT: mov v1.d[1], x8			; CHECK-NEXT: ldr q3, [x9, :lo12:.LCPI6_2]
	; CHECK-NEXT: mov v0.d[1], x10			; CHECK-NEXT: neg v4.2d, v4.2d
				; CHECK-NEXT: mov w9, #23
				; CHECK-NEXT: ushl v2.2d, v2.2d, v4.2d
				; CHECK-NEXT: mul x9, x10, x9
				; CHECK-NEXT: mov w10, #5423
				; CHECK-NEXT: bit v2.16b, v0.16b, v3.16b
				; CHECK-NEXT: mul x8, x8, x10
				; CHECK-NEXT: mov w10, #654
				; CHECK-NEXT: fmov d3, x9
				; CHECK-NEXT: mov x9, v2.d[1]
				; CHECK-NEXT: mul x9, x9, x10
				; CHECK-NEXT: mov v3.d[1], x8
				; CHECK-NEXT: mov v2.d[1], x9
				; CHECK-NEXT: sub v1.2d, v1.2d, v3.2d
				; CHECK-NEXT: sub v0.2d, v0.2d, v2.2d
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%1 = urem <4 x i64> %x, <i64 1, i64 654, i64 23, i64 5423>			%1 = urem <4 x i64> %x, <i64 1, i64 654, i64 23, i64 5423>
	ret <4 x i64> %1			ret <4 x i64> %1
	}			}

llvm/test/CodeGen/AMDGPU/amdgpu-codegenprepare-idiv.ll

This file is larger than 256 KB, so syntax highlighting is disabled by default.

	; NOTE: Assertions have been autogenerated by utils/update_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py UTC_ARGS: --force-update
	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: opt -S -mtriple=amdgcn-- -mcpu=tahiti -amdgpu-codegenprepare -amdgpu-bypass-slow-div=0 %s \| FileCheck %s			; RUN: opt -S -mtriple=amdgcn-- -mcpu=tahiti -amdgpu-codegenprepare -amdgpu-bypass-slow-div=0 %s \| FileCheck %s
	; RUN: llc -mtriple=amdgcn-- -mcpu=tahiti -amdgpu-bypass-slow-div=0 < %s \| FileCheck -check-prefix=GCN %s			; RUN: llc -mtriple=amdgcn-- -mcpu=tahiti -amdgpu-bypass-slow-div=0 < %s \| FileCheck -check-prefix=GCN %s

	define amdgpu_kernel void @udiv_i32(i32 addrspace(1)* %out, i32 %x, i32 %y) {			define amdgpu_kernel void @udiv_i32(i32 addrspace(1)* %out, i32 %x, i32 %y) {
	; CHECK-LABEL: @udiv_i32(			; CHECK-LABEL: @udiv_i32(
	; CHECK-NEXT: [[TMP1:%.]] = uitofp i32 [[Y:%.]] to float			; CHECK-NEXT: [[TMP1:%.]] = uitofp i32 [[Y:%.]] to float
	; CHECK-NEXT: [[TMP2:%.*]] = call fast float @llvm.amdgcn.rcp.f32(float [[TMP1]])			; CHECK-NEXT: [[TMP2:%.*]] = call fast float @llvm.amdgcn.rcp.f32(float [[TMP1]])
	; CHECK-NEXT: [[TMP3:%.*]] = fmul fast float [[TMP2]], 0x41EFFFFFC0000000			; CHECK-NEXT: [[TMP3:%.*]] = fmul fast float [[TMP2]], 0x41EFFFFFC0000000
	▲ Show 20 Lines • Show All 4,910 Lines • ▼ Show 20 Lines
	define amdgpu_kernel void @udiv_i64_oddk_denom(i64 addrspace(1)* %out, i64 %x) {			define amdgpu_kernel void @udiv_i64_oddk_denom(i64 addrspace(1)* %out, i64 %x) {
	; CHECK-LABEL: @udiv_i64_oddk_denom(			; CHECK-LABEL: @udiv_i64_oddk_denom(
	; CHECK-NEXT: [[R:%.]] = udiv i64 [[X:%.]], 1235195949943			; CHECK-NEXT: [[R:%.]] = udiv i64 [[X:%.]], 1235195949943
	; CHECK-NEXT: store i64 [[R]], i64 addrspace(1)* [[OUT:%.*]], align 4			; CHECK-NEXT: store i64 [[R]], i64 addrspace(1)* [[OUT:%.*]], align 4
	; CHECK-NEXT: ret void			; CHECK-NEXT: ret void
	;			;
	; GCN-LABEL: udiv_i64_oddk_denom:			; GCN-LABEL: udiv_i64_oddk_denom:
	; GCN: ; %bb.0:			; GCN: ; %bb.0:
	; GCN-NEXT: v_mov_b32_e32 v0, 0x4f176a73
	; GCN-NEXT: v_mov_b32_e32 v1, 0x4f800000
	; GCN-NEXT: v_madmk_f32 v0, v1, 0x438f8000, v0
	; GCN-NEXT: v_rcp_f32_e32 v0, v0
	; GCN-NEXT: s_movk_i32 s2, 0xfee0
	; GCN-NEXT: s_mov_b32 s3, 0x68958c89
	; GCN-NEXT: v_mov_b32_e32 v8, 0
	; GCN-NEXT: v_mul_f32_e32 v0, 0x5f7ffffc, v0
	; GCN-NEXT: v_mul_f32_e32 v1, 0x2f800000, v0
	; GCN-NEXT: v_trunc_f32_e32 v1, v1
	; GCN-NEXT: v_mac_f32_e32 v0, 0xcf800000, v1
	; GCN-NEXT: v_cvt_u32_f32_e32 v0, v0
	; GCN-NEXT: v_cvt_u32_f32_e32 v1, v1
	; GCN-NEXT: v_mov_b32_e32 v7, 0
	; GCN-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x9			; GCN-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x9
	; GCN-NEXT: v_mul_lo_u32 v2, v0, s2			; GCN-NEXT: s_mov_b32 s8, 0x38f83e5
	; GCN-NEXT: v_mul_hi_u32 v3, v0, s3			; GCN-NEXT: v_mov_b32_e32 v0, s8
	; GCN-NEXT: v_mul_lo_u32 v4, v1, s3			; GCN-NEXT: s_mov_b32 s3, 0xf000
	; GCN-NEXT: s_mov_b32 s11, 0xf000			; GCN-NEXT: s_mov_b32 s2, -1
	; GCN-NEXT: s_waitcnt lgkmcnt(0)			; GCN-NEXT: s_waitcnt lgkmcnt(0)
	; GCN-NEXT: s_mov_b32 s8, s4			; GCN-NEXT: s_mov_b32 s1, s5
	; GCN-NEXT: v_add_i32_e32 v2, vcc, v3, v2			; GCN-NEXT: s_mov_b32 s5, 0x64c139ef
	; GCN-NEXT: v_mul_lo_u32 v3, v0, s3			; GCN-NEXT: v_mov_b32_e32 v1, s5
	; GCN-NEXT: v_add_i32_e32 v2, vcc, v4, v2
	; GCN-NEXT: v_mul_lo_u32 v5, v0, v2
	; GCN-NEXT: v_mul_hi_u32 v4, v0, v2
	; GCN-NEXT: v_mul_hi_u32 v6, v0, v3
	; GCN-NEXT: v_mul_hi_u32 v9, v1, v2
	; GCN-NEXT: v_mul_lo_u32 v2, v1, v2
	; GCN-NEXT: s_movk_i32 s4, 0x11e
	; GCN-NEXT: v_add_i32_e32 v5, vcc, v6, v5
	; GCN-NEXT: v_mul_lo_u32 v6, v1, v3
	; GCN-NEXT: v_mul_hi_u32 v3, v1, v3
	; GCN-NEXT: v_addc_u32_e32 v4, vcc, v8, v4, vcc
	; GCN-NEXT: s_mov_b32 s10, -1
	; GCN-NEXT: v_add_i32_e32 v5, vcc, v6, v5
	; GCN-NEXT: v_addc_u32_e32 v3, vcc, v4, v3, vcc
	; GCN-NEXT: v_addc_u32_e32 v4, vcc, v9, v7, vcc
	; GCN-NEXT: v_add_i32_e32 v2, vcc, v3, v2
	; GCN-NEXT: v_add_i32_e64 v0, s[0:1], v0, v2
	; GCN-NEXT: v_addc_u32_e32 v3, vcc, v8, v4, vcc
	; GCN-NEXT: v_mul_lo_u32 v4, v0, s2
	; GCN-NEXT: v_mul_hi_u32 v5, v0, s3
	; GCN-NEXT: v_addc_u32_e64 v2, vcc, v1, v3, s[0:1]
	; GCN-NEXT: v_mul_lo_u32 v6, v2, s3
	; GCN-NEXT: s_mov_b32 s2, 0x976a7377
	; GCN-NEXT: v_add_i32_e32 v4, vcc, v5, v4
	; GCN-NEXT: v_mul_lo_u32 v5, v0, s3
	; GCN-NEXT: v_add_i32_e32 v4, vcc, v4, v6
	; GCN-NEXT: v_mul_lo_u32 v6, v0, v4
	; GCN-NEXT: v_mul_hi_u32 v10, v0, v4
	; GCN-NEXT: v_mul_hi_u32 v9, v0, v5
	; GCN-NEXT: v_mul_hi_u32 v11, v2, v4
	; GCN-NEXT: s_movk_i32 s3, 0x11f
	; GCN-NEXT: s_mov_b32 s9, s5
	; GCN-NEXT: v_add_i32_e32 v6, vcc, v9, v6
	; GCN-NEXT: v_addc_u32_e32 v9, vcc, v8, v10, vcc
	; GCN-NEXT: v_mul_lo_u32 v10, v2, v5
	; GCN-NEXT: v_mul_hi_u32 v5, v2, v5
	; GCN-NEXT: v_mul_lo_u32 v2, v2, v4
	; GCN-NEXT: v_add_i32_e32 v6, vcc, v6, v10
	; GCN-NEXT: v_addc_u32_e32 v5, vcc, v9, v5, vcc
	; GCN-NEXT: v_addc_u32_e32 v4, vcc, v11, v7, vcc
	; GCN-NEXT: v_add_i32_e32 v2, vcc, v5, v2
	; GCN-NEXT: v_addc_u32_e32 v4, vcc, v8, v4, vcc
	; GCN-NEXT: v_add_i32_e32 v1, vcc, v1, v3
	; GCN-NEXT: v_addc_u32_e64 v1, vcc, v1, v4, s[0:1]
	; GCN-NEXT: v_add_i32_e32 v0, vcc, v0, v2
	; GCN-NEXT: v_addc_u32_e32 v1, vcc, 0, v1, vcc
	; GCN-NEXT: v_mul_lo_u32 v2, s6, v1
	; GCN-NEXT: v_mul_hi_u32 v3, s6, v0
	; GCN-NEXT: v_mul_hi_u32 v4, s6, v1			; GCN-NEXT: v_mul_hi_u32 v4, s6, v1
	; GCN-NEXT: v_mul_hi_u32 v5, s7, v1			; GCN-NEXT: v_mul_hi_u32 v3, s7, v1
	; GCN-NEXT: v_mul_lo_u32 v1, s7, v1			; GCN-NEXT: v_mul_hi_u32 v2, s6, v0
				; GCN-NEXT: s_mul_i32 s5, s7, s5
				; GCN-NEXT: v_add_i32_e32 v4, vcc, s5, v4
				; GCN-NEXT: s_mov_b32 s0, s4
				; GCN-NEXT: s_mul_i32 s4, s6, s8
				; GCN-NEXT: v_addc_u32_e32 v3, vcc, 0, v3, vcc
				; GCN-NEXT: v_add_i32_e32 v4, vcc, s4, v4
				; GCN-NEXT: v_addc_u32_e32 v2, vcc, 0, v2, vcc
	; GCN-NEXT: v_add_i32_e32 v2, vcc, v3, v2			; GCN-NEXT: v_add_i32_e32 v2, vcc, v3, v2
	; GCN-NEXT: v_addc_u32_e32 v3, vcc, v8, v4, vcc
	; GCN-NEXT: v_mul_lo_u32 v4, s7, v0
	; GCN-NEXT: v_mul_hi_u32 v0, s7, v0			; GCN-NEXT: v_mul_hi_u32 v0, s7, v0
	; GCN-NEXT: v_add_i32_e32 v2, vcc, v4, v2			; GCN-NEXT: v_addc_u32_e64 v3, s[4:5], 0, 0, vcc
	; GCN-NEXT: v_addc_u32_e32 v0, vcc, v3, v0, vcc			; GCN-NEXT: s_mul_i32 s4, s7, s8
	; GCN-NEXT: v_addc_u32_e32 v2, vcc, v5, v7, vcc			; GCN-NEXT: v_add_i32_e32 v2, vcc, s4, v2
	; GCN-NEXT: v_add_i32_e32 v0, vcc, v0, v1			; GCN-NEXT: v_addc_u32_e32 v0, vcc, v0, v3, vcc
	; GCN-NEXT: v_addc_u32_e32 v1, vcc, v8, v2, vcc			; GCN-NEXT: v_mov_b32_e32 v1, 0
	; GCN-NEXT: v_mul_lo_u32 v2, v0, s3			; GCN-NEXT: v_lshrrev_b32_e32 v0, 2, v0
	; GCN-NEXT: v_mul_hi_u32 v3, v0, s2			; GCN-NEXT: buffer_store_dwordx2 v[0:1], off, s[0:3], 0
	; GCN-NEXT: v_mul_lo_u32 v4, v1, s2
	; GCN-NEXT: v_mov_b32_e32 v5, s3
	; GCN-NEXT: v_add_i32_e32 v2, vcc, v3, v2
	; GCN-NEXT: v_mul_lo_u32 v3, v0, s2
	; GCN-NEXT: v_add_i32_e32 v2, vcc, v2, v4
	; GCN-NEXT: v_sub_i32_e32 v4, vcc, s7, v2
	; GCN-NEXT: v_sub_i32_e32 v3, vcc, s6, v3
	; GCN-NEXT: v_subb_u32_e64 v4, s[0:1], v4, v5, vcc
	; GCN-NEXT: v_subrev_i32_e64 v5, s[0:1], s2, v3
	; GCN-NEXT: v_subbrev_u32_e64 v4, s[0:1], 0, v4, s[0:1]
	; GCN-NEXT: v_cmp_lt_u32_e64 s[0:1], s4, v4
	; GCN-NEXT: s_mov_b32 s2, 0x976a7376
	; GCN-NEXT: v_cndmask_b32_e64 v6, 0, -1, s[0:1]
	; GCN-NEXT: v_cmp_lt_u32_e64 s[0:1], s2, v5
	; GCN-NEXT: v_cndmask_b32_e64 v5, 0, -1, s[0:1]
	; GCN-NEXT: v_cmp_eq_u32_e64 s[0:1], s3, v4
	; GCN-NEXT: v_cndmask_b32_e64 v4, v6, v5, s[0:1]
	; GCN-NEXT: v_add_i32_e64 v5, s[0:1], 2, v0
	; GCN-NEXT: v_addc_u32_e64 v6, s[0:1], 0, v1, s[0:1]
	; GCN-NEXT: v_add_i32_e64 v7, s[0:1], 1, v0
	; GCN-NEXT: v_addc_u32_e64 v8, s[0:1], 0, v1, s[0:1]
	; GCN-NEXT: v_cmp_ne_u32_e64 s[0:1], 0, v4
	; GCN-NEXT: v_cndmask_b32_e64 v4, v8, v6, s[0:1]
	; GCN-NEXT: v_mov_b32_e32 v6, s7
	; GCN-NEXT: v_subb_u32_e32 v2, vcc, v6, v2, vcc
	; GCN-NEXT: v_cmp_lt_u32_e32 vcc, s4, v2
	; GCN-NEXT: v_cndmask_b32_e64 v6, 0, -1, vcc
	; GCN-NEXT: v_cmp_lt_u32_e32 vcc, s2, v3
	; GCN-NEXT: v_cndmask_b32_e64 v3, 0, -1, vcc
	; GCN-NEXT: v_cmp_eq_u32_e32 vcc, s3, v2
	; GCN-NEXT: v_cndmask_b32_e32 v2, v6, v3, vcc
	; GCN-NEXT: v_cmp_ne_u32_e32 vcc, 0, v2
	; GCN-NEXT: v_cndmask_b32_e64 v2, v7, v5, s[0:1]
	; GCN-NEXT: v_cndmask_b32_e32 v1, v1, v4, vcc
	; GCN-NEXT: v_cndmask_b32_e32 v0, v0, v2, vcc
	; GCN-NEXT: buffer_store_dwordx2 v[0:1], off, s[8:11], 0
	; GCN-NEXT: s_endpgm			; GCN-NEXT: s_endpgm
	%r = udiv i64 %x, 1235195949943			%r = udiv i64 %x, 1235195949943
	store i64 %r, i64 addrspace(1)* %out			store i64 %r, i64 addrspace(1)* %out
	ret void			ret void
	}			}

	define amdgpu_kernel void @udiv_i64_pow2k_denom(i64 addrspace(1)* %out, i64 %x) {			define amdgpu_kernel void @udiv_i64_pow2k_denom(i64 addrspace(1)* %out, i64 %x) {
	; CHECK-LABEL: @udiv_i64_pow2k_denom(			; CHECK-LABEL: @udiv_i64_pow2k_denom(
	▲ Show 20 Lines • Show All 86 Lines • ▼ Show 20 Lines
	; CHECK-NEXT: [[TMP4:%.*]] = extractelement <2 x i64> [[X]], i64 1			; CHECK-NEXT: [[TMP4:%.*]] = extractelement <2 x i64> [[X]], i64 1
	; CHECK-NEXT: [[TMP5:%.*]] = udiv i64 [[TMP4]], 4095			; CHECK-NEXT: [[TMP5:%.*]] = udiv i64 [[TMP4]], 4095
	; CHECK-NEXT: [[TMP6:%.*]] = insertelement <2 x i64> [[TMP3]], i64 [[TMP5]], i64 1			; CHECK-NEXT: [[TMP6:%.*]] = insertelement <2 x i64> [[TMP3]], i64 [[TMP5]], i64 1
	; CHECK-NEXT: store <2 x i64> [[TMP6]], <2 x i64> addrspace(1)* [[OUT:%.*]], align 16			; CHECK-NEXT: store <2 x i64> [[TMP6]], <2 x i64> addrspace(1)* [[OUT:%.*]], align 16
	; CHECK-NEXT: ret void			; CHECK-NEXT: ret void
	;			;
	; GCN-LABEL: udiv_v2i64_mixed_pow2k_denom:			; GCN-LABEL: udiv_v2i64_mixed_pow2k_denom:
	; GCN: ; %bb.0:			; GCN: ; %bb.0:
	; GCN-NEXT: v_mov_b32_e32 v0, 0x4f800000
	; GCN-NEXT: v_madak_f32 v0, 0, v0, 0x457ff000
	; GCN-NEXT: v_rcp_f32_e32 v0, v0
	; GCN-NEXT: s_movk_i32 s6, 0xf001
	; GCN-NEXT: v_mov_b32_e32 v7, 0
	; GCN-NEXT: v_mov_b32_e32 v2, 0
	; GCN-NEXT: v_mul_f32_e32 v0, 0x5f7ffffc, v0
	; GCN-NEXT: v_mul_f32_e32 v1, 0x2f800000, v0
	; GCN-NEXT: v_trunc_f32_e32 v1, v1
	; GCN-NEXT: v_mac_f32_e32 v0, 0xcf800000, v1
	; GCN-NEXT: v_cvt_u32_f32_e32 v0, v0
	; GCN-NEXT: v_cvt_u32_f32_e32 v1, v1
	; GCN-NEXT: s_load_dwordx2 s[4:5], s[0:1], 0x9			; GCN-NEXT: s_load_dwordx2 s[4:5], s[0:1], 0x9
	; GCN-NEXT: s_load_dwordx4 s[8:11], s[0:1], 0xd			; GCN-NEXT: s_load_dwordx4 s[0:3], s[0:1], 0xd
	; GCN-NEXT: s_movk_i32 s0, 0xfff			; GCN-NEXT: s_mov_b32 s9, 0x10010011
	; GCN-NEXT: v_mul_hi_u32 v3, v0, s6			; GCN-NEXT: v_mov_b32_e32 v2, s9
	; GCN-NEXT: v_mul_lo_u32 v5, v1, s6			; GCN-NEXT: s_mov_b32 s10, 0x100100
	; GCN-NEXT: v_mul_lo_u32 v4, v0, s6			; GCN-NEXT: v_mov_b32_e32 v0, s10
	; GCN-NEXT: s_mov_b32 s7, 0xf000			; GCN-NEXT: s_waitcnt lgkmcnt(0)
	; GCN-NEXT: v_subrev_i32_e32 v3, vcc, v0, v3			; GCN-NEXT: v_mul_hi_u32 v3, s2, v2
	; GCN-NEXT: v_add_i32_e32 v3, vcc, v5, v3			; GCN-NEXT: v_mul_hi_u32 v2, s3, v2
	; GCN-NEXT: v_mul_hi_u32 v6, v0, v4			; GCN-NEXT: v_mul_hi_u32 v1, s2, v0
	; GCN-NEXT: v_mul_lo_u32 v5, v0, v3			; GCN-NEXT: s_mul_i32 s9, s3, s9
	; GCN-NEXT: v_mul_hi_u32 v8, v0, v3			; GCN-NEXT: v_add_i32_e32 v3, vcc, s9, v3
	; GCN-NEXT: v_mul_hi_u32 v9, v1, v3			; GCN-NEXT: s_mul_i32 s8, s2, s10
	; GCN-NEXT: v_mul_lo_u32 v3, v1, v3			; GCN-NEXT: v_addc_u32_e32 v2, vcc, 0, v2, vcc
	; GCN-NEXT: v_add_i32_e32 v5, vcc, v6, v5			; GCN-NEXT: v_add_i32_e32 v3, vcc, s8, v3
	; GCN-NEXT: v_addc_u32_e32 v6, vcc, v7, v8, vcc
	; GCN-NEXT: v_mul_lo_u32 v8, v1, v4
	; GCN-NEXT: v_mul_hi_u32 v4, v1, v4
	; GCN-NEXT: v_add_i32_e32 v5, vcc, v8, v5
	; GCN-NEXT: v_addc_u32_e32 v4, vcc, v6, v4, vcc
	; GCN-NEXT: v_addc_u32_e32 v5, vcc, v9, v2, vcc
	; GCN-NEXT: v_add_i32_e32 v3, vcc, v4, v3
	; GCN-NEXT: v_add_i32_e64 v0, s[2:3], v0, v3
	; GCN-NEXT: v_addc_u32_e32 v4, vcc, v7, v5, vcc
	; GCN-NEXT: v_mul_hi_u32 v5, v0, s6
	; GCN-NEXT: v_addc_u32_e64 v3, vcc, v1, v4, s[2:3]
	; GCN-NEXT: v_mul_lo_u32 v6, v3, s6
	; GCN-NEXT: v_mul_lo_u32 v8, v0, s6
	; GCN-NEXT: v_subrev_i32_e32 v5, vcc, v0, v5
	; GCN-NEXT: s_mov_b32 s6, -1
	; GCN-NEXT: v_add_i32_e32 v5, vcc, v5, v6
	; GCN-NEXT: v_mul_lo_u32 v6, v0, v5
	; GCN-NEXT: v_mul_hi_u32 v9, v0, v8
	; GCN-NEXT: v_mul_hi_u32 v10, v0, v5
	; GCN-NEXT: v_mul_hi_u32 v11, v3, v5
	; GCN-NEXT: v_add_i32_e32 v6, vcc, v9, v6
	; GCN-NEXT: v_addc_u32_e32 v9, vcc, v7, v10, vcc
	; GCN-NEXT: v_mul_lo_u32 v10, v3, v8
	; GCN-NEXT: v_mul_hi_u32 v8, v3, v8
	; GCN-NEXT: v_mul_lo_u32 v3, v3, v5
	; GCN-NEXT: v_add_i32_e32 v6, vcc, v6, v10
	; GCN-NEXT: v_addc_u32_e32 v6, vcc, v9, v8, vcc
	; GCN-NEXT: v_addc_u32_e32 v5, vcc, v11, v2, vcc
	; GCN-NEXT: v_add_i32_e32 v3, vcc, v6, v3
	; GCN-NEXT: v_addc_u32_e32 v5, vcc, v7, v5, vcc
	; GCN-NEXT: v_add_i32_e32 v1, vcc, v1, v4
	; GCN-NEXT: v_addc_u32_e64 v1, vcc, v1, v5, s[2:3]
	; GCN-NEXT: v_add_i32_e32 v0, vcc, v0, v3
	; GCN-NEXT: v_addc_u32_e32 v1, vcc, 0, v1, vcc			; GCN-NEXT: v_addc_u32_e32 v1, vcc, 0, v1, vcc
	; GCN-NEXT: s_waitcnt lgkmcnt(0)			; GCN-NEXT: v_add_i32_e32 v1, vcc, v2, v1
	; GCN-NEXT: v_mul_lo_u32 v3, s10, v1			; GCN-NEXT: v_mul_hi_u32 v0, s3, v0
	; GCN-NEXT: v_mul_hi_u32 v4, s10, v0			; GCN-NEXT: v_addc_u32_e64 v2, s[8:9], 0, 0, vcc
	; GCN-NEXT: v_mul_hi_u32 v5, s10, v1			; GCN-NEXT: s_mul_i32 s8, s3, s10
	; GCN-NEXT: v_mul_hi_u32 v6, s11, v1			; GCN-NEXT: v_add_i32_e32 v3, vcc, s8, v1
	; GCN-NEXT: v_mul_lo_u32 v1, s11, v1			; GCN-NEXT: v_addc_u32_e32 v2, vcc, v0, v2, vcc
	; GCN-NEXT: v_add_i32_e32 v3, vcc, v4, v3
	; GCN-NEXT: v_addc_u32_e32 v4, vcc, v7, v5, vcc
	; GCN-NEXT: v_mul_lo_u32 v5, s11, v0
	; GCN-NEXT: v_mul_hi_u32 v0, s11, v0
	; GCN-NEXT: s_lshr_b64 s[2:3], s[8:9], 12
	; GCN-NEXT: v_add_i32_e32 v3, vcc, v5, v3
	; GCN-NEXT: v_addc_u32_e32 v0, vcc, v4, v0, vcc
	; GCN-NEXT: v_addc_u32_e32 v2, vcc, v6, v2, vcc
	; GCN-NEXT: v_add_i32_e32 v0, vcc, v0, v1
	; GCN-NEXT: v_addc_u32_e32 v1, vcc, v7, v2, vcc
	; GCN-NEXT: v_mul_lo_u32 v2, v1, s0
	; GCN-NEXT: v_mul_hi_u32 v3, v0, s0
	; GCN-NEXT: v_mul_lo_u32 v4, v0, s0
	; GCN-NEXT: v_add_i32_e32 v2, vcc, v3, v2
	; GCN-NEXT: v_mov_b32_e32 v3, s11
	; GCN-NEXT: v_sub_i32_e32 v4, vcc, s10, v4
	; GCN-NEXT: v_subb_u32_e32 v2, vcc, v3, v2, vcc
	; GCN-NEXT: v_subrev_i32_e32 v3, vcc, s0, v4
	; GCN-NEXT: v_subbrev_u32_e32 v5, vcc, 0, v2, vcc
	; GCN-NEXT: s_movk_i32 s0, 0xffe
	; GCN-NEXT: v_cmp_lt_u32_e32 vcc, s0, v3
	; GCN-NEXT: v_cndmask_b32_e64 v3, 0, -1, vcc
	; GCN-NEXT: v_cmp_eq_u32_e32 vcc, 0, v5
	; GCN-NEXT: v_cndmask_b32_e32 v3, -1, v3, vcc
	; GCN-NEXT: v_add_i32_e32 v5, vcc, 2, v0
	; GCN-NEXT: v_addc_u32_e32 v6, vcc, 0, v1, vcc
	; GCN-NEXT: v_add_i32_e32 v7, vcc, 1, v0
	; GCN-NEXT: v_cmp_lt_u32_e64 s[0:1], s0, v4
	; GCN-NEXT: v_addc_u32_e32 v8, vcc, 0, v1, vcc
	; GCN-NEXT: v_cndmask_b32_e64 v4, 0, -1, s[0:1]
	; GCN-NEXT: v_cmp_eq_u32_e64 s[0:1], 0, v2
	; GCN-NEXT: v_cmp_ne_u32_e32 vcc, 0, v3
	; GCN-NEXT: v_cndmask_b32_e64 v2, -1, v4, s[0:1]
	; GCN-NEXT: v_cndmask_b32_e32 v3, v8, v6, vcc
	; GCN-NEXT: v_cmp_ne_u32_e64 s[0:1], 0, v2
	; GCN-NEXT: v_cndmask_b32_e64 v3, v1, v3, s[0:1]
	; GCN-NEXT: v_cndmask_b32_e32 v1, v7, v5, vcc
	; GCN-NEXT: v_cndmask_b32_e64 v2, v0, v1, s[0:1]
	; GCN-NEXT: v_mov_b32_e32 v0, s2
	; GCN-NEXT: v_mov_b32_e32 v1, s3			; GCN-NEXT: v_mov_b32_e32 v1, s3
				; GCN-NEXT: v_sub_i32_e32 v0, vcc, s2, v3
				; GCN-NEXT: v_subb_u32_e32 v1, vcc, v1, v2, vcc
				; GCN-NEXT: v_lshr_b64 v[0:1], v[0:1], 1
				; GCN-NEXT: s_lshr_b64 s[0:1], s[0:1], 12
				; GCN-NEXT: v_add_i32_e32 v0, vcc, v0, v3
				; GCN-NEXT: v_addc_u32_e32 v1, vcc, v1, v2, vcc
				; GCN-NEXT: v_lshr_b64 v[2:3], v[0:1], 11
				; GCN-NEXT: s_mov_b32 s7, 0xf000
				; GCN-NEXT: s_mov_b32 s6, -1
				; GCN-NEXT: v_mov_b32_e32 v0, s0
				; GCN-NEXT: v_mov_b32_e32 v1, s1
	; GCN-NEXT: buffer_store_dwordx4 v[0:3], off, s[4:7], 0			; GCN-NEXT: buffer_store_dwordx4 v[0:3], off, s[4:7], 0
	; GCN-NEXT: s_endpgm			; GCN-NEXT: s_endpgm
	%r = udiv <2 x i64> %x, <i64 4096, i64 4095>			%r = udiv <2 x i64> %x, <i64 4096, i64 4095>
	store <2 x i64> %r, <2 x i64> addrspace(1)* %out			store <2 x i64> %r, <2 x i64> addrspace(1)* %out
	ret void			ret void
	}			}

	define amdgpu_kernel void @udiv_v2i64_pow2_shl_denom(<2 x i64> addrspace(1)* %out, <2 x i64> %x, <2 x i64> %y) {			define amdgpu_kernel void @udiv_v2i64_pow2_shl_denom(<2 x i64> addrspace(1)* %out, <2 x i64> %x, <2 x i64> %y) {
	Show All 37 Lines
	define amdgpu_kernel void @urem_i64_oddk_denom(i64 addrspace(1)* %out, i64 %x) {			define amdgpu_kernel void @urem_i64_oddk_denom(i64 addrspace(1)* %out, i64 %x) {
	; CHECK-LABEL: @urem_i64_oddk_denom(			; CHECK-LABEL: @urem_i64_oddk_denom(
	; CHECK-NEXT: [[R:%.]] = urem i64 [[X:%.]], 1235195393993			; CHECK-NEXT: [[R:%.]] = urem i64 [[X:%.]], 1235195393993
	; CHECK-NEXT: store i64 [[R]], i64 addrspace(1)* [[OUT:%.*]], align 4			; CHECK-NEXT: store i64 [[R]], i64 addrspace(1)* [[OUT:%.*]], align 4
	; CHECK-NEXT: ret void			; CHECK-NEXT: ret void
	;			;
	; GCN-LABEL: urem_i64_oddk_denom:			; GCN-LABEL: urem_i64_oddk_denom:
	; GCN: ; %bb.0:			; GCN: ; %bb.0:
	; GCN-NEXT: v_mov_b32_e32 v0, 0x4f1761f8
	; GCN-NEXT: v_mov_b32_e32 v1, 0x4f800000
	; GCN-NEXT: v_madmk_f32 v0, v1, 0x438f8000, v0
	; GCN-NEXT: v_rcp_f32_e32 v0, v0
	; GCN-NEXT: s_movk_i32 s2, 0xfee0
	; GCN-NEXT: s_mov_b32 s3, 0x689e0837
	; GCN-NEXT: v_mov_b32_e32 v8, 0
	; GCN-NEXT: v_mul_f32_e32 v0, 0x5f7ffffc, v0
	; GCN-NEXT: v_mul_f32_e32 v1, 0x2f800000, v0
	; GCN-NEXT: v_trunc_f32_e32 v1, v1
	; GCN-NEXT: v_mac_f32_e32 v0, 0xcf800000, v1
	; GCN-NEXT: v_cvt_u32_f32_e32 v0, v0
	; GCN-NEXT: v_cvt_u32_f32_e32 v1, v1
	; GCN-NEXT: v_mov_b32_e32 v7, 0
	; GCN-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x9			; GCN-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x9
	; GCN-NEXT: v_mul_lo_u32 v2, v0, s2			; GCN-NEXT: s_mov_b32 s10, 0xe3e10011
	; GCN-NEXT: v_mul_hi_u32 v3, v0, s3			; GCN-NEXT: v_mov_b32_e32 v0, s10
	; GCN-NEXT: v_mul_lo_u32 v4, v1, s3			; GCN-NEXT: s_mov_b32 s3, 0xf000
	; GCN-NEXT: s_movk_i32 s12, 0x11f			; GCN-NEXT: s_mov_b32 s2, -1
	; GCN-NEXT: s_mov_b32 s13, 0x9761f7c9
	; GCN-NEXT: v_add_i32_e32 v2, vcc, v3, v2
	; GCN-NEXT: v_mul_lo_u32 v3, v0, s3
	; GCN-NEXT: v_add_i32_e32 v2, vcc, v4, v2
	; GCN-NEXT: v_mul_lo_u32 v5, v0, v2
	; GCN-NEXT: v_mul_hi_u32 v4, v0, v2
	; GCN-NEXT: v_mul_hi_u32 v6, v0, v3
	; GCN-NEXT: v_mul_hi_u32 v9, v1, v2
	; GCN-NEXT: v_mul_lo_u32 v2, v1, v2
	; GCN-NEXT: s_waitcnt lgkmcnt(0)			; GCN-NEXT: s_waitcnt lgkmcnt(0)
	; GCN-NEXT: s_mov_b32 s9, s5			; GCN-NEXT: s_mov_b32 s0, s4
	; GCN-NEXT: v_add_i32_e32 v5, vcc, v6, v5			; GCN-NEXT: s_mov_b32 s4, 0xf6841139
	; GCN-NEXT: v_mul_lo_u32 v6, v1, v3			; GCN-NEXT: v_mov_b32_e32 v2, s4
	; GCN-NEXT: v_mul_hi_u32 v3, v1, v3			; GCN-NEXT: v_mul_hi_u32 v3, s6, v2
	; GCN-NEXT: v_addc_u32_e32 v4, vcc, v8, v4, vcc			; GCN-NEXT: v_mul_hi_u32 v2, s7, v2
	; GCN-NEXT: s_movk_i32 s5, 0x11e			; GCN-NEXT: v_mul_hi_u32 v1, s6, v0
	; GCN-NEXT: v_add_i32_e32 v5, vcc, v6, v5			; GCN-NEXT: s_mul_i32 s4, s7, s4
	; GCN-NEXT: v_addc_u32_e32 v3, vcc, v4, v3, vcc			; GCN-NEXT: v_add_i32_e32 v3, vcc, s4, v3
	; GCN-NEXT: v_addc_u32_e32 v4, vcc, v9, v7, vcc			; GCN-NEXT: s_mul_i32 s1, s6, s10
	; GCN-NEXT: v_add_i32_e32 v2, vcc, v3, v2			; GCN-NEXT: v_addc_u32_e32 v2, vcc, 0, v2, vcc
	; GCN-NEXT: v_add_i32_e64 v0, s[0:1], v0, v2			; GCN-NEXT: v_add_i32_e32 v3, vcc, s1, v3
	; GCN-NEXT: v_addc_u32_e32 v3, vcc, v8, v4, vcc
	; GCN-NEXT: v_mul_lo_u32 v4, v0, s2
	; GCN-NEXT: v_mul_hi_u32 v5, v0, s3
	; GCN-NEXT: v_addc_u32_e64 v2, vcc, v1, v3, s[0:1]
	; GCN-NEXT: v_mul_lo_u32 v6, v2, s3
	; GCN-NEXT: s_mov_b32 s8, s4
	; GCN-NEXT: v_add_i32_e32 v4, vcc, v5, v4
	; GCN-NEXT: v_mul_lo_u32 v5, v0, s3
	; GCN-NEXT: v_add_i32_e32 v4, vcc, v4, v6
	; GCN-NEXT: v_mul_lo_u32 v6, v0, v4
	; GCN-NEXT: v_mul_hi_u32 v10, v0, v4
	; GCN-NEXT: v_mul_hi_u32 v9, v0, v5
	; GCN-NEXT: v_mul_hi_u32 v11, v2, v4
	; GCN-NEXT: s_mov_b32 s4, 0x9761f7c8
	; GCN-NEXT: s_mov_b32 s11, 0xf000
	; GCN-NEXT: v_add_i32_e32 v6, vcc, v9, v6
	; GCN-NEXT: v_addc_u32_e32 v9, vcc, v8, v10, vcc
	; GCN-NEXT: v_mul_lo_u32 v10, v2, v5
	; GCN-NEXT: v_mul_hi_u32 v5, v2, v5
	; GCN-NEXT: v_mul_lo_u32 v2, v2, v4
	; GCN-NEXT: s_mov_b32 s10, -1
	; GCN-NEXT: v_add_i32_e32 v6, vcc, v6, v10
	; GCN-NEXT: v_addc_u32_e32 v5, vcc, v9, v5, vcc
	; GCN-NEXT: v_addc_u32_e32 v4, vcc, v11, v7, vcc
	; GCN-NEXT: v_add_i32_e32 v2, vcc, v5, v2
	; GCN-NEXT: v_addc_u32_e32 v4, vcc, v8, v4, vcc
	; GCN-NEXT: v_add_i32_e32 v1, vcc, v1, v3
	; GCN-NEXT: v_addc_u32_e64 v1, vcc, v1, v4, s[0:1]
	; GCN-NEXT: v_add_i32_e32 v0, vcc, v0, v2
	; GCN-NEXT: v_addc_u32_e32 v1, vcc, 0, v1, vcc
	; GCN-NEXT: v_mul_lo_u32 v2, s6, v1
	; GCN-NEXT: v_mul_hi_u32 v3, s6, v0
	; GCN-NEXT: v_mul_hi_u32 v4, s6, v1
	; GCN-NEXT: v_mul_hi_u32 v5, s7, v1
	; GCN-NEXT: v_mul_lo_u32 v1, s7, v1
	; GCN-NEXT: v_add_i32_e32 v2, vcc, v3, v2
	; GCN-NEXT: v_addc_u32_e32 v3, vcc, v8, v4, vcc
	; GCN-NEXT: v_mul_lo_u32 v4, s7, v0
	; GCN-NEXT: v_mul_hi_u32 v0, s7, v0			; GCN-NEXT: v_mul_hi_u32 v0, s7, v0
	; GCN-NEXT: v_add_i32_e32 v2, vcc, v4, v2			; GCN-NEXT: v_addc_u32_e32 v1, vcc, 0, v1, vcc
	; GCN-NEXT: v_addc_u32_e32 v0, vcc, v3, v0, vcc
	; GCN-NEXT: v_addc_u32_e32 v2, vcc, v5, v7, vcc
	; GCN-NEXT: v_add_i32_e32 v0, vcc, v0, v1
	; GCN-NEXT: v_addc_u32_e32 v1, vcc, v8, v2, vcc
	; GCN-NEXT: v_mul_lo_u32 v2, v0, s12
	; GCN-NEXT: v_mul_hi_u32 v3, v0, s13
	; GCN-NEXT: v_mul_lo_u32 v1, v1, s13
	; GCN-NEXT: v_mul_lo_u32 v0, v0, s13
	; GCN-NEXT: v_add_i32_e32 v2, vcc, v3, v2
	; GCN-NEXT: v_add_i32_e32 v1, vcc, v2, v1			; GCN-NEXT: v_add_i32_e32 v1, vcc, v2, v1
	; GCN-NEXT: v_sub_i32_e32 v2, vcc, s7, v1			; GCN-NEXT: s_mul_i32 s1, s7, s10
	; GCN-NEXT: v_mov_b32_e32 v3, s12			; GCN-NEXT: v_addc_u32_e64 v2, s[8:9], 0, 0, vcc
	; GCN-NEXT: v_sub_i32_e32 v0, vcc, s6, v0			; GCN-NEXT: v_add_i32_e32 v1, vcc, s1, v1
	; GCN-NEXT: v_subb_u32_e64 v2, s[0:1], v2, v3, vcc			; GCN-NEXT: v_addc_u32_e32 v0, vcc, v0, v2, vcc
	; GCN-NEXT: v_subrev_i32_e64 v4, s[0:1], s13, v0			; GCN-NEXT: v_lshrrev_b32_e32 v0, 8, v0
	; GCN-NEXT: v_subbrev_u32_e64 v5, s[2:3], 0, v2, s[0:1]			; GCN-NEXT: s_mov_b32 s4, 0x9761f7c9
	; GCN-NEXT: v_cmp_lt_u32_e64 s[2:3], s5, v5			; GCN-NEXT: v_mul_hi_u32 v1, v0, s4
	; GCN-NEXT: v_subb_u32_e64 v2, s[0:1], v2, v3, s[0:1]			; GCN-NEXT: v_mul_lo_u32 v2, v0, s4
	; GCN-NEXT: v_cndmask_b32_e64 v6, 0, -1, s[2:3]			; GCN-NEXT: s_mov_b32 s1, s5
	; GCN-NEXT: v_cmp_lt_u32_e64 s[2:3], s4, v4			; GCN-NEXT: s_movk_i32 s5, 0x11f
	; GCN-NEXT: v_subrev_i32_e64 v3, s[0:1], s13, v4			; GCN-NEXT: v_mad_u32_u24 v1, v0, s5, v1
	; GCN-NEXT: v_cndmask_b32_e64 v7, 0, -1, s[2:3]			; GCN-NEXT: v_mov_b32_e32 v3, s7
	; GCN-NEXT: v_cmp_eq_u32_e64 s[2:3], s12, v5			; GCN-NEXT: v_sub_i32_e32 v0, vcc, s6, v2
	; GCN-NEXT: v_cndmask_b32_e64 v6, v6, v7, s[2:3]			; GCN-NEXT: v_subb_u32_e32 v1, vcc, v3, v1, vcc
	; GCN-NEXT: v_subbrev_u32_e64 v2, s[0:1], 0, v2, s[0:1]			; GCN-NEXT: buffer_store_dwordx2 v[0:1], off, s[0:3], 0
	; GCN-NEXT: v_cmp_ne_u32_e64 s[0:1], 0, v6
	; GCN-NEXT: v_cndmask_b32_e64 v2, v5, v2, s[0:1]
	; GCN-NEXT: v_mov_b32_e32 v5, s7
	; GCN-NEXT: v_subb_u32_e32 v1, vcc, v5, v1, vcc
	; GCN-NEXT: v_cmp_lt_u32_e32 vcc, s5, v1
	; GCN-NEXT: v_cndmask_b32_e64 v5, 0, -1, vcc
	; GCN-NEXT: v_cmp_lt_u32_e32 vcc, s4, v0
	; GCN-NEXT: v_cndmask_b32_e64 v6, 0, -1, vcc
	; GCN-NEXT: v_cmp_eq_u32_e32 vcc, s12, v1
	; GCN-NEXT: v_cndmask_b32_e32 v5, v5, v6, vcc
	; GCN-NEXT: v_cmp_ne_u32_e32 vcc, 0, v5
	; GCN-NEXT: v_cndmask_b32_e32 v1, v1, v2, vcc
	; GCN-NEXT: v_cndmask_b32_e64 v2, v4, v3, s[0:1]
	; GCN-NEXT: v_cndmask_b32_e32 v0, v0, v2, vcc
	; GCN-NEXT: buffer_store_dwordx2 v[0:1], off, s[8:11], 0
	; GCN-NEXT: s_endpgm			; GCN-NEXT: s_endpgm
	%r = urem i64 %x, 1235195393993			%r = urem i64 %x, 1235195393993
	store i64 %r, i64 addrspace(1)* %out			store i64 %r, i64 addrspace(1)* %out
	ret void			ret void
	}			}

	define amdgpu_kernel void @urem_i64_pow2k_denom(i64 addrspace(1)* %out, i64 %x) {			define amdgpu_kernel void @urem_i64_pow2k_denom(i64 addrspace(1)* %out, i64 %x) {
	; CHECK-LABEL: @urem_i64_pow2k_denom(			; CHECK-LABEL: @urem_i64_pow2k_denom(
	▲ Show 20 Lines • Show All 130 Lines • ▼ Show 20 Lines
	define amdgpu_kernel void @sdiv_i64_oddk_denom(i64 addrspace(1)* %out, i64 %x) {			define amdgpu_kernel void @sdiv_i64_oddk_denom(i64 addrspace(1)* %out, i64 %x) {
	; CHECK-LABEL: @sdiv_i64_oddk_denom(			; CHECK-LABEL: @sdiv_i64_oddk_denom(
	; CHECK-NEXT: [[R:%.]] = sdiv i64 [[X:%.]], 1235195			; CHECK-NEXT: [[R:%.]] = sdiv i64 [[X:%.]], 1235195
	; CHECK-NEXT: store i64 [[R]], i64 addrspace(1)* [[OUT:%.*]], align 4			; CHECK-NEXT: store i64 [[R]], i64 addrspace(1)* [[OUT:%.*]], align 4
	; CHECK-NEXT: ret void			; CHECK-NEXT: ret void
	;			;
	; GCN-LABEL: sdiv_i64_oddk_denom:			; GCN-LABEL: sdiv_i64_oddk_denom:
	; GCN: ; %bb.0:			; GCN: ; %bb.0:
	; GCN-NEXT: v_mov_b32_e32 v0, 0x4f800000			; GCN-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x9
	; GCN-NEXT: v_madak_f32 v0, 0, v0, 0x4996c7d8			; GCN-NEXT: s_mov_b32 s9, 0xfd81e19
	; GCN-NEXT: v_rcp_f32_e32 v0, v0			; GCN-NEXT: v_mov_b32_e32 v2, s9
	; GCN-NEXT: s_mov_b32 s2, 0xffed2705			; GCN-NEXT: s_mov_b32 s8, 0x6ca94220
	; GCN-NEXT: v_mov_b32_e32 v8, 0			; GCN-NEXT: v_mov_b32_e32 v0, s8
	; GCN-NEXT: v_mov_b32_e32 v7, 0
	; GCN-NEXT: v_mul_f32_e32 v0, 0x5f7ffffc, v0
	; GCN-NEXT: v_mul_f32_e32 v1, 0x2f800000, v0
	; GCN-NEXT: v_trunc_f32_e32 v1, v1
	; GCN-NEXT: v_mac_f32_e32 v0, 0xcf800000, v1
	; GCN-NEXT: v_cvt_u32_f32_e32 v0, v0
	; GCN-NEXT: v_cvt_u32_f32_e32 v1, v1
	; GCN-NEXT: s_load_dwordx4 s[8:11], s[0:1], 0x9
	; GCN-NEXT: s_mov_b32 s7, 0xf000
	; GCN-NEXT: v_mul_hi_u32 v3, s2, v0
	; GCN-NEXT: v_mul_lo_u32 v2, v1, s2
	; GCN-NEXT: v_mul_lo_u32 v4, v0, s2
	; GCN-NEXT: s_mov_b32 s6, -1
	; GCN-NEXT: s_waitcnt lgkmcnt(0)			; GCN-NEXT: s_waitcnt lgkmcnt(0)
	; GCN-NEXT: s_mov_b32 s4, s8			; GCN-NEXT: v_mul_hi_u32 v3, s6, v2
	; GCN-NEXT: v_add_i32_e32 v2, vcc, v3, v2			; GCN-NEXT: v_mul_hi_u32 v4, s7, v2
	; GCN-NEXT: v_subrev_i32_e32 v2, vcc, v0, v2			; GCN-NEXT: s_mov_b32 s1, s5
	; GCN-NEXT: v_mul_lo_u32 v5, v0, v2			; GCN-NEXT: v_mul_hi_u32 v1, s6, v0
	; GCN-NEXT: v_mul_hi_u32 v6, v0, v4			; GCN-NEXT: s_mul_i32 s5, s7, s9
	; GCN-NEXT: v_mul_hi_u32 v3, v0, v2			; GCN-NEXT: v_add_i32_e32 v3, vcc, s5, v3
	; GCN-NEXT: v_mul_hi_u32 v9, v1, v2			; GCN-NEXT: s_mov_b32 s0, s4
	; GCN-NEXT: v_mul_lo_u32 v2, v1, v2			; GCN-NEXT: s_mul_i32 s4, s6, s8
	; GCN-NEXT: v_add_i32_e32 v5, vcc, v6, v5			; GCN-NEXT: v_addc_u32_e32 v4, vcc, 0, v4, vcc
	; GCN-NEXT: v_mul_lo_u32 v6, v1, v4			; GCN-NEXT: v_add_i32_e32 v3, vcc, s4, v3
	; GCN-NEXT: v_mul_hi_u32 v4, v1, v4
	; GCN-NEXT: v_addc_u32_e32 v3, vcc, v8, v3, vcc
	; GCN-NEXT: s_mov_b32 s5, s9
	; GCN-NEXT: v_add_i32_e32 v5, vcc, v6, v5
	; GCN-NEXT: v_addc_u32_e32 v3, vcc, v3, v4, vcc
	; GCN-NEXT: v_addc_u32_e32 v4, vcc, v9, v7, vcc
	; GCN-NEXT: v_add_i32_e32 v2, vcc, v3, v2
	; GCN-NEXT: v_add_i32_e64 v0, s[0:1], v0, v2
	; GCN-NEXT: v_addc_u32_e32 v3, vcc, v8, v4, vcc
	; GCN-NEXT: v_addc_u32_e64 v2, vcc, v1, v3, s[0:1]
	; GCN-NEXT: v_mul_lo_u32 v4, v2, s2
	; GCN-NEXT: v_mul_hi_u32 v5, s2, v0
	; GCN-NEXT: v_add_i32_e32 v4, vcc, v5, v4
	; GCN-NEXT: v_mul_lo_u32 v5, v0, s2
	; GCN-NEXT: v_subrev_i32_e32 v4, vcc, v0, v4
	; GCN-NEXT: v_mul_lo_u32 v10, v0, v4
	; GCN-NEXT: v_mul_hi_u32 v12, v0, v4
	; GCN-NEXT: v_mul_hi_u32 v11, v0, v5
	; GCN-NEXT: v_mul_hi_u32 v9, v2, v5
	; GCN-NEXT: v_mul_lo_u32 v5, v2, v5
	; GCN-NEXT: v_mul_hi_u32 v6, v2, v4
	; GCN-NEXT: v_add_i32_e32 v10, vcc, v11, v10
	; GCN-NEXT: v_addc_u32_e32 v11, vcc, v8, v12, vcc
	; GCN-NEXT: v_mul_lo_u32 v2, v2, v4
	; GCN-NEXT: v_add_i32_e32 v5, vcc, v10, v5
	; GCN-NEXT: v_addc_u32_e32 v5, vcc, v11, v9, vcc
	; GCN-NEXT: v_addc_u32_e32 v4, vcc, v6, v7, vcc
	; GCN-NEXT: v_add_i32_e32 v2, vcc, v5, v2
	; GCN-NEXT: v_addc_u32_e32 v4, vcc, v8, v4, vcc
	; GCN-NEXT: v_add_i32_e32 v1, vcc, v1, v3
	; GCN-NEXT: s_ashr_i32 s2, s11, 31
	; GCN-NEXT: v_addc_u32_e64 v1, vcc, v1, v4, s[0:1]
	; GCN-NEXT: s_add_u32 s0, s10, s2
	; GCN-NEXT: v_add_i32_e32 v0, vcc, v0, v2
	; GCN-NEXT: s_mov_b32 s3, s2
	; GCN-NEXT: s_addc_u32 s1, s11, s2
	; GCN-NEXT: s_xor_b64 s[0:1], s[0:1], s[2:3]
	; GCN-NEXT: v_addc_u32_e32 v1, vcc, 0, v1, vcc			; GCN-NEXT: v_addc_u32_e32 v1, vcc, 0, v1, vcc
	; GCN-NEXT: v_mul_lo_u32 v2, s0, v1			; GCN-NEXT: v_add_i32_e32 v1, vcc, v4, v1
	; GCN-NEXT: v_mul_hi_u32 v3, s0, v0			; GCN-NEXT: v_addc_u32_e64 v3, s[4:5], 0, 0, vcc
	; GCN-NEXT: v_mul_hi_u32 v4, s0, v1			; GCN-NEXT: s_ashr_i32 s5, s7, 31
	; GCN-NEXT: v_mul_hi_u32 v5, s1, v1			; GCN-NEXT: v_mul_hi_u32 v0, s7, v0
	; GCN-NEXT: v_mul_lo_u32 v1, s1, v1			; GCN-NEXT: v_mul_hi_u32 v2, s5, v2
	; GCN-NEXT: v_add_i32_e32 v2, vcc, v3, v2			; GCN-NEXT: s_mul_i32 s4, s7, s8
	; GCN-NEXT: v_addc_u32_e32 v3, vcc, v8, v4, vcc			; GCN-NEXT: v_add_i32_e32 v1, vcc, s4, v1
	; GCN-NEXT: v_mul_lo_u32 v4, s1, v0			; GCN-NEXT: s_mul_i32 s4, s5, s8
	; GCN-NEXT: v_mul_hi_u32 v0, s1, v0			; GCN-NEXT: v_addc_u32_e32 v3, vcc, v0, v3, vcc
	; GCN-NEXT: s_mov_b32 s3, 0x12d8fb			; GCN-NEXT: v_add_i32_e32 v0, vcc, s4, v2
	; GCN-NEXT: v_add_i32_e32 v2, vcc, v4, v2			; GCN-NEXT: s_mul_i32 s5, s5, s9
	; GCN-NEXT: v_addc_u32_e32 v0, vcc, v3, v0, vcc			; GCN-NEXT: v_add_i32_e32 v2, vcc, s5, v0
	; GCN-NEXT: v_addc_u32_e32 v2, vcc, v5, v7, vcc			; GCN-NEXT: v_add_i32_e32 v0, vcc, s5, v1
	; GCN-NEXT: v_add_i32_e32 v0, vcc, v0, v1			; GCN-NEXT: v_addc_u32_e32 v1, vcc, v3, v2, vcc
	; GCN-NEXT: v_addc_u32_e32 v1, vcc, v8, v2, vcc			; GCN-NEXT: v_ashr_i64 v[2:3], v[0:1], 19
	; GCN-NEXT: v_mul_lo_u32 v2, v1, s3			; GCN-NEXT: v_lshrrev_b32_e32 v0, 31, v1
	; GCN-NEXT: v_mul_hi_u32 v3, s3, v0			; GCN-NEXT: v_add_i32_e32 v0, vcc, v2, v0
	; GCN-NEXT: v_mul_lo_u32 v4, v0, s3			; GCN-NEXT: s_mov_b32 s3, 0xf000
	; GCN-NEXT: v_add_i32_e32 v2, vcc, v3, v2			; GCN-NEXT: s_mov_b32 s2, -1
	; GCN-NEXT: v_sub_i32_e32 v4, vcc, s0, v4			; GCN-NEXT: v_addc_u32_e32 v1, vcc, 0, v3, vcc
	; GCN-NEXT: v_mov_b32_e32 v3, s1			; GCN-NEXT: buffer_store_dwordx2 v[0:1], off, s[0:3], 0
	; GCN-NEXT: v_subb_u32_e32 v2, vcc, v3, v2, vcc
	; GCN-NEXT: v_subrev_i32_e32 v3, vcc, s3, v4
	; GCN-NEXT: v_subbrev_u32_e32 v5, vcc, 0, v2, vcc
	; GCN-NEXT: s_mov_b32 s0, 0x12d8fa
	; GCN-NEXT: v_cmp_lt_u32_e32 vcc, s0, v3
	; GCN-NEXT: v_cndmask_b32_e64 v3, 0, -1, vcc
	; GCN-NEXT: v_cmp_eq_u32_e32 vcc, 0, v5
	; GCN-NEXT: v_cndmask_b32_e32 v3, -1, v3, vcc
	; GCN-NEXT: v_add_i32_e32 v5, vcc, 2, v0
	; GCN-NEXT: v_addc_u32_e32 v6, vcc, 0, v1, vcc
	; GCN-NEXT: v_add_i32_e32 v7, vcc, 1, v0
	; GCN-NEXT: v_cmp_lt_u32_e64 s[0:1], s0, v4
	; GCN-NEXT: v_addc_u32_e32 v8, vcc, 0, v1, vcc
	; GCN-NEXT: v_cndmask_b32_e64 v4, 0, -1, s[0:1]
	; GCN-NEXT: v_cmp_eq_u32_e64 s[0:1], 0, v2
	; GCN-NEXT: v_cmp_ne_u32_e32 vcc, 0, v3
	; GCN-NEXT: v_cndmask_b32_e64 v2, -1, v4, s[0:1]
	; GCN-NEXT: v_cmp_ne_u32_e64 s[0:1], 0, v2
	; GCN-NEXT: v_cndmask_b32_e32 v2, v7, v5, vcc
	; GCN-NEXT: v_cndmask_b32_e64 v0, v0, v2, s[0:1]
	; GCN-NEXT: v_cndmask_b32_e32 v3, v8, v6, vcc
	; GCN-NEXT: v_cndmask_b32_e64 v1, v1, v3, s[0:1]
	; GCN-NEXT: v_xor_b32_e32 v0, s2, v0
	; GCN-NEXT: v_xor_b32_e32 v1, s2, v1
	; GCN-NEXT: v_mov_b32_e32 v2, s2
	; GCN-NEXT: v_subrev_i32_e32 v0, vcc, s2, v0
	; GCN-NEXT: v_subb_u32_e32 v1, vcc, v1, v2, vcc
	; GCN-NEXT: buffer_store_dwordx2 v[0:1], off, s[4:7], 0
	; GCN-NEXT: s_endpgm			; GCN-NEXT: s_endpgm
	%r = sdiv i64 %x, 1235195			%r = sdiv i64 %x, 1235195
	store i64 %r, i64 addrspace(1)* %out			store i64 %r, i64 addrspace(1)* %out
	ret void			ret void
	}			}

	define amdgpu_kernel void @sdiv_i64_pow2k_denom(i64 addrspace(1)* %out, i64 %x) {			define amdgpu_kernel void @sdiv_i64_pow2k_denom(i64 addrspace(1)* %out, i64 %x) {
	; CHECK-LABEL: @sdiv_i64_pow2k_denom(			; CHECK-LABEL: @sdiv_i64_pow2k_denom(
	▲ Show 20 Lines • Show All 223 Lines • ▼ Show 20 Lines
	; CHECK-NEXT: [[TMP4:%.*]] = extractelement <2 x i64> [[X]], i64 1			; CHECK-NEXT: [[TMP4:%.*]] = extractelement <2 x i64> [[X]], i64 1
	; CHECK-NEXT: [[TMP5:%.*]] = sdiv i64 [[TMP4]], 4095			; CHECK-NEXT: [[TMP5:%.*]] = sdiv i64 [[TMP4]], 4095
	; CHECK-NEXT: [[TMP6:%.*]] = insertelement <2 x i64> [[TMP3]], i64 [[TMP5]], i64 1			; CHECK-NEXT: [[TMP6:%.*]] = insertelement <2 x i64> [[TMP3]], i64 [[TMP5]], i64 1
	; CHECK-NEXT: store <2 x i64> [[TMP6]], <2 x i64> addrspace(1)* [[OUT:%.*]], align 16			; CHECK-NEXT: store <2 x i64> [[TMP6]], <2 x i64> addrspace(1)* [[OUT:%.*]], align 16
	; CHECK-NEXT: ret void			; CHECK-NEXT: ret void
	;			;
	; GCN-LABEL: ssdiv_v2i64_mixed_pow2k_denom:			; GCN-LABEL: ssdiv_v2i64_mixed_pow2k_denom:
	; GCN: ; %bb.0:			; GCN: ; %bb.0:
	; GCN-NEXT: v_mov_b32_e32 v0, 0x457ff000
	; GCN-NEXT: v_mov_b32_e32 v1, 0x4f800000
	; GCN-NEXT: v_mac_f32_e32 v0, 0, v1
	; GCN-NEXT: v_rcp_f32_e32 v0, v0
	; GCN-NEXT: s_movk_i32 s6, 0xf001
	; GCN-NEXT: s_load_dwordx2 s[4:5], s[0:1], 0x9			; GCN-NEXT: s_load_dwordx2 s[4:5], s[0:1], 0x9
	; GCN-NEXT: s_load_dwordx4 s[8:11], s[0:1], 0xd			; GCN-NEXT: s_load_dwordx4 s[0:3], s[0:1], 0xd
	; GCN-NEXT: s_mov_b32 s7, 0xf000			; GCN-NEXT: s_mov_b32 s10, 0x8008009
	; GCN-NEXT: v_mul_f32_e32 v0, 0x5f7ffffc, v0			; GCN-NEXT: v_mov_b32_e32 v2, s10
	; GCN-NEXT: v_mul_f32_e32 v1, 0x2f800000, v0			; GCN-NEXT: s_mov_b32 s8, 0x80080080
	; GCN-NEXT: v_trunc_f32_e32 v1, v1			; GCN-NEXT: v_mov_b32_e32 v0, s8
	; GCN-NEXT: v_mac_f32_e32 v0, 0xcf800000, v1
	; GCN-NEXT: v_cvt_u32_f32_e32 v0, v0
	; GCN-NEXT: v_cvt_u32_f32_e32 v1, v1
	; GCN-NEXT: s_waitcnt lgkmcnt(0)			; GCN-NEXT: s_waitcnt lgkmcnt(0)
	; GCN-NEXT: s_ashr_i32 s0, s9, 31			; GCN-NEXT: v_mul_hi_u32 v4, s2, v2
	; GCN-NEXT: s_lshr_b32 s0, s0, 20			; GCN-NEXT: v_mul_hi_u32 v3, s3, v2
	; GCN-NEXT: v_mul_hi_u32 v2, s6, v0			; GCN-NEXT: s_ashr_i32 s9, s1, 31
	; GCN-NEXT: v_mul_lo_u32 v3, v1, s6			; GCN-NEXT: v_mul_hi_u32 v1, s2, v0
	; GCN-NEXT: s_add_u32 s2, s8, s0			; GCN-NEXT: s_mul_i32 s11, s3, s10
	; GCN-NEXT: s_addc_u32 s3, s9, 0			; GCN-NEXT: s_lshr_b32 s9, s9, 20
	; GCN-NEXT: s_ashr_i32 s8, s11, 31			; GCN-NEXT: v_mov_b32_e32 v5, 0
	; GCN-NEXT: v_add_i32_e32 v2, vcc, v2, v3			; GCN-NEXT: v_add_i32_e32 v4, vcc, s11, v4
	; GCN-NEXT: v_mul_lo_u32 v3, v0, s6			; GCN-NEXT: s_add_u32 s0, s0, s9
	; GCN-NEXT: v_subrev_i32_e32 v2, vcc, v0, v2			; GCN-NEXT: s_mul_i32 s9, s2, s8
	; GCN-NEXT: v_mul_lo_u32 v4, v0, v2			; GCN-NEXT: v_addc_u32_e32 v3, vcc, v3, v5, vcc
	; GCN-NEXT: v_mul_hi_u32 v6, v0, v2			; GCN-NEXT: s_addc_u32 s1, s1, 0
	; GCN-NEXT: v_mul_hi_u32 v5, v0, v3			; GCN-NEXT: v_add_i32_e32 v4, vcc, s9, v4
	; GCN-NEXT: v_mul_hi_u32 v7, v1, v2			; GCN-NEXT: s_ashr_i32 s11, s3, 31
	; GCN-NEXT: v_mul_lo_u32 v2, v1, v2			; GCN-NEXT: v_addc_u32_e32 v1, vcc, v1, v5, vcc
	; GCN-NEXT: s_ashr_i64 s[2:3], s[2:3], 12			; GCN-NEXT: v_mul_hi_u32 v0, s3, v0
	; GCN-NEXT: v_add_i32_e32 v4, vcc, v5, v4			; GCN-NEXT: v_mul_hi_u32 v2, s11, v2
	; GCN-NEXT: v_addc_u32_e32 v5, vcc, 0, v6, vcc			; GCN-NEXT: v_add_i32_e32 v1, vcc, v3, v1
	; GCN-NEXT: v_mul_lo_u32 v6, v1, v3			; GCN-NEXT: s_mul_i32 s9, s3, s8
	; GCN-NEXT: v_mul_hi_u32 v3, v1, v3			; GCN-NEXT: v_addc_u32_e32 v3, vcc, v5, v5, vcc
	; GCN-NEXT: s_mov_b32 s9, s8			; GCN-NEXT: v_add_i32_e32 v1, vcc, s9, v1
	; GCN-NEXT: v_add_i32_e32 v4, vcc, v6, v4			; GCN-NEXT: s_mul_i32 s8, s11, s8
	; GCN-NEXT: v_addc_u32_e32 v3, vcc, v5, v3, vcc			; GCN-NEXT: v_addc_u32_e32 v0, vcc, v0, v3, vcc
	; GCN-NEXT: v_mov_b32_e32 v4, 0			; GCN-NEXT: v_add_i32_e32 v2, vcc, s8, v2
	; GCN-NEXT: v_addc_u32_e32 v5, vcc, v7, v4, vcc			; GCN-NEXT: s_mul_i32 s8, s11, s10
	; GCN-NEXT: v_add_i32_e32 v2, vcc, v3, v2			; GCN-NEXT: v_add_i32_e32 v2, vcc, s8, v2
	; GCN-NEXT: v_mov_b32_e32 v6, 0			; GCN-NEXT: v_mov_b32_e32 v3, s8
	; GCN-NEXT: v_add_i32_e64 v0, s[0:1], v0, v2			; GCN-NEXT: v_mov_b32_e32 v4, s3
	; GCN-NEXT: v_addc_u32_e32 v3, vcc, v6, v5, vcc			; GCN-NEXT: v_subrev_i32_e32 v3, vcc, s2, v3
	; GCN-NEXT: v_addc_u32_e64 v2, vcc, v1, v3, s[0:1]			; GCN-NEXT: v_subb_u32_e32 v2, vcc, v2, v4, vcc
	; GCN-NEXT: v_mul_lo_u32 v5, v2, s6
	; GCN-NEXT: v_mul_hi_u32 v7, s6, v0
	; GCN-NEXT: v_add_i32_e32 v5, vcc, v7, v5
	; GCN-NEXT: v_mul_lo_u32 v7, v0, s6
	; GCN-NEXT: v_subrev_i32_e32 v5, vcc, v0, v5
	; GCN-NEXT: v_mul_lo_u32 v10, v0, v5
	; GCN-NEXT: v_mul_hi_u32 v12, v0, v5
	; GCN-NEXT: v_mul_hi_u32 v11, v0, v7
	; GCN-NEXT: v_mul_hi_u32 v9, v2, v7
	; GCN-NEXT: v_mul_lo_u32 v7, v2, v7
	; GCN-NEXT: v_mul_hi_u32 v8, v2, v5
	; GCN-NEXT: v_add_i32_e32 v10, vcc, v11, v10
	; GCN-NEXT: v_addc_u32_e32 v11, vcc, 0, v12, vcc
	; GCN-NEXT: v_mul_lo_u32 v2, v2, v5
	; GCN-NEXT: v_add_i32_e32 v7, vcc, v10, v7
	; GCN-NEXT: v_addc_u32_e32 v7, vcc, v11, v9, vcc
	; GCN-NEXT: v_addc_u32_e32 v5, vcc, v8, v4, vcc
	; GCN-NEXT: v_add_i32_e32 v2, vcc, v7, v2
	; GCN-NEXT: v_addc_u32_e32 v5, vcc, v6, v5, vcc
	; GCN-NEXT: v_add_i32_e32 v1, vcc, v1, v3			; GCN-NEXT: v_add_i32_e32 v1, vcc, v1, v3
	; GCN-NEXT: v_addc_u32_e64 v1, vcc, v1, v5, s[0:1]			; GCN-NEXT: v_addc_u32_e32 v2, vcc, v0, v2, vcc
	; GCN-NEXT: s_add_u32 s0, s10, s8			; GCN-NEXT: v_mov_b32_e32 v3, s3
	; GCN-NEXT: s_addc_u32 s1, s11, s8			; GCN-NEXT: v_add_i32_e32 v0, vcc, s2, v1
	; GCN-NEXT: v_add_i32_e32 v0, vcc, v0, v2			; GCN-NEXT: v_addc_u32_e32 v1, vcc, v2, v3, vcc
	; GCN-NEXT: s_xor_b64 s[0:1], s[0:1], s[8:9]			; GCN-NEXT: v_ashr_i64 v[2:3], v[0:1], 11
	; GCN-NEXT: v_addc_u32_e32 v1, vcc, 0, v1, vcc			; GCN-NEXT: v_lshrrev_b32_e32 v0, 31, v1
	; GCN-NEXT: v_mul_lo_u32 v2, s0, v1			; GCN-NEXT: v_add_i32_e32 v2, vcc, v2, v0
	; GCN-NEXT: v_mul_hi_u32 v3, s0, v0			; GCN-NEXT: s_ashr_i64 s[0:1], s[0:1], 12
	; GCN-NEXT: v_mul_hi_u32 v5, s0, v1			; GCN-NEXT: s_mov_b32 s7, 0xf000
	; GCN-NEXT: v_mul_hi_u32 v7, s1, v1
	; GCN-NEXT: v_mul_lo_u32 v1, s1, v1
	; GCN-NEXT: v_add_i32_e32 v2, vcc, v3, v2
	; GCN-NEXT: v_addc_u32_e32 v3, vcc, 0, v5, vcc
	; GCN-NEXT: v_mul_lo_u32 v5, s1, v0
	; GCN-NEXT: v_mul_hi_u32 v0, s1, v0
	; GCN-NEXT: s_movk_i32 s9, 0xfff
	; GCN-NEXT: s_mov_b32 s6, -1			; GCN-NEXT: s_mov_b32 s6, -1
	; GCN-NEXT: v_add_i32_e32 v2, vcc, v5, v2			; GCN-NEXT: v_addc_u32_e32 v3, vcc, v3, v5, vcc
	; GCN-NEXT: v_addc_u32_e32 v0, vcc, v3, v0, vcc			; GCN-NEXT: v_mov_b32_e32 v0, s0
	; GCN-NEXT: v_addc_u32_e32 v2, vcc, v7, v4, vcc			; GCN-NEXT: v_mov_b32_e32 v1, s1
	; GCN-NEXT: v_add_i32_e32 v0, vcc, v0, v1
	; GCN-NEXT: v_addc_u32_e32 v1, vcc, v6, v2, vcc
	; GCN-NEXT: v_mul_lo_u32 v2, v1, s9
	; GCN-NEXT: v_mul_hi_u32 v3, s9, v0
	; GCN-NEXT: v_mul_lo_u32 v4, v0, s9
	; GCN-NEXT: v_add_i32_e32 v2, vcc, v3, v2
	; GCN-NEXT: v_sub_i32_e32 v4, vcc, s0, v4
	; GCN-NEXT: v_mov_b32_e32 v3, s1
	; GCN-NEXT: v_subb_u32_e32 v2, vcc, v3, v2, vcc
	; GCN-NEXT: v_subrev_i32_e32 v3, vcc, s9, v4
	; GCN-NEXT: v_subbrev_u32_e32 v5, vcc, 0, v2, vcc
	; GCN-NEXT: s_movk_i32 s0, 0xffe
	; GCN-NEXT: v_cmp_lt_u32_e32 vcc, s0, v3
	; GCN-NEXT: v_cndmask_b32_e64 v3, 0, -1, vcc
	; GCN-NEXT: v_cmp_eq_u32_e32 vcc, 0, v5
	; GCN-NEXT: v_cndmask_b32_e32 v3, -1, v3, vcc
	; GCN-NEXT: v_add_i32_e32 v5, vcc, 2, v0
	; GCN-NEXT: v_addc_u32_e32 v6, vcc, 0, v1, vcc
	; GCN-NEXT: v_add_i32_e32 v7, vcc, 1, v0
	; GCN-NEXT: v_cmp_lt_u32_e64 s[0:1], s0, v4
	; GCN-NEXT: v_addc_u32_e32 v8, vcc, 0, v1, vcc
	; GCN-NEXT: v_cndmask_b32_e64 v4, 0, -1, s[0:1]
	; GCN-NEXT: v_cmp_eq_u32_e64 s[0:1], 0, v2
	; GCN-NEXT: v_cmp_ne_u32_e32 vcc, 0, v3
	; GCN-NEXT: v_cndmask_b32_e64 v2, -1, v4, s[0:1]
	; GCN-NEXT: v_cmp_ne_u32_e64 s[0:1], 0, v2
	; GCN-NEXT: v_cndmask_b32_e32 v2, v7, v5, vcc
	; GCN-NEXT: v_cndmask_b32_e64 v0, v0, v2, s[0:1]
	; GCN-NEXT: v_cndmask_b32_e32 v3, v8, v6, vcc
	; GCN-NEXT: v_cndmask_b32_e64 v1, v1, v3, s[0:1]
	; GCN-NEXT: v_xor_b32_e32 v0, s8, v0
	; GCN-NEXT: v_subrev_i32_e32 v2, vcc, s8, v0
	; GCN-NEXT: v_xor_b32_e32 v1, s8, v1
	; GCN-NEXT: v_mov_b32_e32 v3, s8
	; GCN-NEXT: v_subb_u32_e32 v3, vcc, v1, v3, vcc
	; GCN-NEXT: v_mov_b32_e32 v0, s2
	; GCN-NEXT: v_mov_b32_e32 v1, s3
	; GCN-NEXT: buffer_store_dwordx4 v[0:3], off, s[4:7], 0			; GCN-NEXT: buffer_store_dwordx4 v[0:3], off, s[4:7], 0
	; GCN-NEXT: s_endpgm			; GCN-NEXT: s_endpgm
	%r = sdiv <2 x i64> %x, <i64 4096, i64 4095>			%r = sdiv <2 x i64> %x, <i64 4096, i64 4095>
	store <2 x i64> %r, <2 x i64> addrspace(1)* %out			store <2 x i64> %r, <2 x i64> addrspace(1)* %out
	ret void			ret void
	}			}

	define amdgpu_kernel void @sdiv_v2i64_pow2_shl_denom(<2 x i64> addrspace(1)* %out, <2 x i64> %x, <2 x i64> %y) {			define amdgpu_kernel void @sdiv_v2i64_pow2_shl_denom(<2 x i64> addrspace(1)* %out, <2 x i64> %x, <2 x i64> %y) {
	▲ Show 20 Lines • Show All 288 Lines • ▼ Show 20 Lines
	define amdgpu_kernel void @srem_i64_oddk_denom(i64 addrspace(1)* %out, i64 %x) {			define amdgpu_kernel void @srem_i64_oddk_denom(i64 addrspace(1)* %out, i64 %x) {
	; CHECK-LABEL: @srem_i64_oddk_denom(			; CHECK-LABEL: @srem_i64_oddk_denom(
	; CHECK-NEXT: [[R:%.]] = srem i64 [[X:%.]], 1235195			; CHECK-NEXT: [[R:%.]] = srem i64 [[X:%.]], 1235195
	; CHECK-NEXT: store i64 [[R]], i64 addrspace(1)* [[OUT:%.*]], align 4			; CHECK-NEXT: store i64 [[R]], i64 addrspace(1)* [[OUT:%.*]], align 4
	; CHECK-NEXT: ret void			; CHECK-NEXT: ret void
	;			;
	; GCN-LABEL: srem_i64_oddk_denom:			; GCN-LABEL: srem_i64_oddk_denom:
	; GCN: ; %bb.0:			; GCN: ; %bb.0:
	; GCN-NEXT: v_mov_b32_e32 v0, 0x4f800000			; GCN-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x9
	; GCN-NEXT: v_madak_f32 v0, 0, v0, 0x4996c7d8			; GCN-NEXT: s_mov_b32 s9, 0xfd81e19
	; GCN-NEXT: v_rcp_f32_e32 v0, v0			; GCN-NEXT: v_mov_b32_e32 v2, s9
	; GCN-NEXT: s_mov_b32 s2, 0xffed2705			; GCN-NEXT: s_mov_b32 s8, 0x6ca94220
	; GCN-NEXT: v_mov_b32_e32 v8, 0			; GCN-NEXT: v_mov_b32_e32 v0, s8
	; GCN-NEXT: v_mov_b32_e32 v7, 0			; GCN-NEXT: s_waitcnt lgkmcnt(0)
	; GCN-NEXT: v_mul_f32_e32 v0, 0x5f7ffffc, v0			; GCN-NEXT: v_mul_hi_u32 v3, s6, v2
	; GCN-NEXT: v_mul_f32_e32 v1, 0x2f800000, v0			; GCN-NEXT: v_mul_hi_u32 v4, s7, v2
	; GCN-NEXT: v_trunc_f32_e32 v1, v1			; GCN-NEXT: v_mul_hi_u32 v1, s6, v0
	; GCN-NEXT: v_mac_f32_e32 v0, 0xcf800000, v1			; GCN-NEXT: s_mul_i32 s1, s7, s9
	; GCN-NEXT: v_cvt_u32_f32_e32 v0, v0			; GCN-NEXT: v_add_i32_e32 v3, vcc, s1, v3
	; GCN-NEXT: v_cvt_u32_f32_e32 v1, v1			; GCN-NEXT: s_mul_i32 s0, s6, s8
	; GCN-NEXT: s_load_dwordx4 s[8:11], s[0:1], 0x9			; GCN-NEXT: v_addc_u32_e32 v4, vcc, 0, v4, vcc
	; GCN-NEXT: s_mov_b32 s7, 0xf000			; GCN-NEXT: v_add_i32_e32 v3, vcc, s0, v3
	; GCN-NEXT: v_mul_hi_u32 v3, s2, v0
	; GCN-NEXT: v_mul_lo_u32 v2, v1, s2
	; GCN-NEXT: v_mul_lo_u32 v4, v0, s2
	; GCN-NEXT: s_mov_b32 s6, -1
	; GCN-NEXT: s_waitcnt lgkmcnt(0)
	; GCN-NEXT: s_mov_b32 s4, s8
	; GCN-NEXT: v_add_i32_e32 v2, vcc, v3, v2
	; GCN-NEXT: v_subrev_i32_e32 v2, vcc, v0, v2
	; GCN-NEXT: v_mul_lo_u32 v5, v0, v2
	; GCN-NEXT: v_mul_hi_u32 v6, v0, v4
	; GCN-NEXT: v_mul_hi_u32 v3, v0, v2
	; GCN-NEXT: v_mul_hi_u32 v9, v1, v2
	; GCN-NEXT: v_mul_lo_u32 v2, v1, v2
	; GCN-NEXT: v_add_i32_e32 v5, vcc, v6, v5
	; GCN-NEXT: v_mul_lo_u32 v6, v1, v4
	; GCN-NEXT: v_mul_hi_u32 v4, v1, v4
	; GCN-NEXT: v_addc_u32_e32 v3, vcc, v8, v3, vcc
	; GCN-NEXT: s_mov_b32 s5, s9
	; GCN-NEXT: v_add_i32_e32 v5, vcc, v6, v5
	; GCN-NEXT: v_addc_u32_e32 v3, vcc, v3, v4, vcc
	; GCN-NEXT: v_addc_u32_e32 v4, vcc, v9, v7, vcc
	; GCN-NEXT: v_add_i32_e32 v2, vcc, v3, v2
	; GCN-NEXT: v_add_i32_e64 v0, s[0:1], v0, v2
	; GCN-NEXT: v_addc_u32_e32 v3, vcc, v8, v4, vcc
	; GCN-NEXT: v_addc_u32_e64 v2, vcc, v1, v3, s[0:1]
	; GCN-NEXT: v_mul_lo_u32 v4, v2, s2
	; GCN-NEXT: v_mul_hi_u32 v5, s2, v0
	; GCN-NEXT: v_add_i32_e32 v4, vcc, v5, v4
	; GCN-NEXT: v_mul_lo_u32 v5, v0, s2
	; GCN-NEXT: v_subrev_i32_e32 v4, vcc, v0, v4
	; GCN-NEXT: v_mul_lo_u32 v10, v0, v4
	; GCN-NEXT: v_mul_hi_u32 v12, v0, v4
	; GCN-NEXT: v_mul_hi_u32 v11, v0, v5
	; GCN-NEXT: v_mul_hi_u32 v9, v2, v5
	; GCN-NEXT: v_mul_lo_u32 v5, v2, v5
	; GCN-NEXT: v_mul_hi_u32 v6, v2, v4
	; GCN-NEXT: v_add_i32_e32 v10, vcc, v11, v10
	; GCN-NEXT: v_addc_u32_e32 v11, vcc, v8, v12, vcc
	; GCN-NEXT: v_mul_lo_u32 v2, v2, v4
	; GCN-NEXT: v_add_i32_e32 v5, vcc, v10, v5
	; GCN-NEXT: v_addc_u32_e32 v5, vcc, v11, v9, vcc
	; GCN-NEXT: v_addc_u32_e32 v4, vcc, v6, v7, vcc
	; GCN-NEXT: v_add_i32_e32 v2, vcc, v5, v2
	; GCN-NEXT: v_addc_u32_e32 v4, vcc, v8, v4, vcc
	; GCN-NEXT: v_add_i32_e32 v1, vcc, v1, v3
	; GCN-NEXT: s_ashr_i32 s2, s11, 31
	; GCN-NEXT: v_addc_u32_e64 v1, vcc, v1, v4, s[0:1]
	; GCN-NEXT: s_add_u32 s0, s10, s2
	; GCN-NEXT: v_add_i32_e32 v0, vcc, v0, v2
	; GCN-NEXT: s_mov_b32 s3, s2
	; GCN-NEXT: s_addc_u32 s1, s11, s2
	; GCN-NEXT: s_xor_b64 s[0:1], s[0:1], s[2:3]
	; GCN-NEXT: v_addc_u32_e32 v1, vcc, 0, v1, vcc			; GCN-NEXT: v_addc_u32_e32 v1, vcc, 0, v1, vcc
	; GCN-NEXT: v_mul_lo_u32 v2, s0, v1			; GCN-NEXT: v_add_i32_e32 v1, vcc, v4, v1
	; GCN-NEXT: v_mul_hi_u32 v3, s0, v0			; GCN-NEXT: v_addc_u32_e64 v3, s[0:1], 0, 0, vcc
	; GCN-NEXT: v_mul_hi_u32 v4, s0, v1			; GCN-NEXT: s_ashr_i32 s1, s7, 31
	; GCN-NEXT: v_mul_hi_u32 v5, s1, v1			; GCN-NEXT: v_mul_hi_u32 v0, s7, v0
	; GCN-NEXT: v_mul_lo_u32 v1, s1, v1			; GCN-NEXT: v_mul_hi_u32 v2, s1, v2
	; GCN-NEXT: v_add_i32_e32 v2, vcc, v3, v2			; GCN-NEXT: s_mul_i32 s0, s7, s8
	; GCN-NEXT: v_addc_u32_e32 v3, vcc, v8, v4, vcc			; GCN-NEXT: v_add_i32_e32 v1, vcc, s0, v1
	; GCN-NEXT: v_mul_lo_u32 v4, s1, v0			; GCN-NEXT: s_mul_i32 s0, s1, s8
	; GCN-NEXT: v_mul_hi_u32 v0, s1, v0			; GCN-NEXT: v_addc_u32_e32 v3, vcc, v0, v3, vcc
	; GCN-NEXT: s_mov_b32 s3, 0x12d8fb			; GCN-NEXT: v_add_i32_e32 v0, vcc, s0, v2
	; GCN-NEXT: v_add_i32_e32 v2, vcc, v4, v2			; GCN-NEXT: s_mul_i32 s1, s1, s9
	; GCN-NEXT: v_addc_u32_e32 v0, vcc, v3, v0, vcc			; GCN-NEXT: v_add_i32_e32 v2, vcc, s1, v0
	; GCN-NEXT: v_addc_u32_e32 v2, vcc, v5, v7, vcc			; GCN-NEXT: v_add_i32_e32 v0, vcc, s1, v1
	; GCN-NEXT: v_add_i32_e32 v0, vcc, v0, v1			; GCN-NEXT: v_addc_u32_e32 v1, vcc, v3, v2, vcc
	; GCN-NEXT: v_addc_u32_e32 v1, vcc, v8, v2, vcc			; GCN-NEXT: v_ashr_i64 v[2:3], v[0:1], 19
	; GCN-NEXT: v_mul_hi_u32 v2, s3, v0			; GCN-NEXT: v_lshrrev_b32_e32 v0, 31, v1
	; GCN-NEXT: v_mul_lo_u32 v1, v1, s3			; GCN-NEXT: v_add_i32_e32 v0, vcc, v2, v0
	; GCN-NEXT: v_mul_lo_u32 v0, v0, s3			; GCN-NEXT: s_mov_b32 s8, 0x12d8fb
	; GCN-NEXT: v_add_i32_e32 v1, vcc, v2, v1			; GCN-NEXT: v_mul_hi_u32 v2, v0, s8
	; GCN-NEXT: v_sub_i32_e32 v0, vcc, s0, v0			; GCN-NEXT: v_mul_lo_u32 v0, v0, s8
	; GCN-NEXT: v_mov_b32_e32 v2, s1			; GCN-NEXT: v_addc_u32_e32 v1, vcc, 0, v3, vcc
				; GCN-NEXT: s_mov_b32 s3, 0xf000
				; GCN-NEXT: v_mad_i32_i24 v1, v1, s8, v2
				; GCN-NEXT: v_mov_b32_e32 v2, s7
				; GCN-NEXT: v_sub_i32_e32 v0, vcc, s6, v0
				; GCN-NEXT: s_mov_b32 s2, -1
				; GCN-NEXT: s_mov_b32 s0, s4
				; GCN-NEXT: s_mov_b32 s1, s5
	; GCN-NEXT: v_subb_u32_e32 v1, vcc, v2, v1, vcc			; GCN-NEXT: v_subb_u32_e32 v1, vcc, v2, v1, vcc
	; GCN-NEXT: v_subrev_i32_e32 v2, vcc, s3, v0			; GCN-NEXT: buffer_store_dwordx2 v[0:1], off, s[0:3], 0
	; GCN-NEXT: v_subbrev_u32_e32 v3, vcc, 0, v1, vcc
	; GCN-NEXT: v_subrev_i32_e32 v4, vcc, s3, v2
	; GCN-NEXT: v_subbrev_u32_e32 v5, vcc, 0, v3, vcc
	; GCN-NEXT: s_mov_b32 s0, 0x12d8fa
	; GCN-NEXT: v_cmp_lt_u32_e32 vcc, s0, v2
	; GCN-NEXT: v_cndmask_b32_e64 v6, 0, -1, vcc
	; GCN-NEXT: v_cmp_eq_u32_e32 vcc, 0, v3
	; GCN-NEXT: v_cndmask_b32_e32 v6, -1, v6, vcc
	; GCN-NEXT: v_cmp_ne_u32_e32 vcc, 0, v6
	; GCN-NEXT: v_cmp_lt_u32_e64 s[0:1], s0, v0
	; GCN-NEXT: v_cndmask_b32_e32 v3, v3, v5, vcc
	; GCN-NEXT: v_cndmask_b32_e64 v5, 0, -1, s[0:1]
	; GCN-NEXT: v_cmp_eq_u32_e64 s[0:1], 0, v1
	; GCN-NEXT: v_cndmask_b32_e64 v5, -1, v5, s[0:1]
	; GCN-NEXT: v_cmp_ne_u32_e64 s[0:1], 0, v5
	; GCN-NEXT: v_cndmask_b32_e32 v2, v2, v4, vcc
	; GCN-NEXT: v_cndmask_b32_e64 v0, v0, v2, s[0:1]
	; GCN-NEXT: v_cndmask_b32_e64 v1, v1, v3, s[0:1]
	; GCN-NEXT: v_xor_b32_e32 v0, s2, v0
	; GCN-NEXT: v_xor_b32_e32 v1, s2, v1
	; GCN-NEXT: v_mov_b32_e32 v2, s2
	; GCN-NEXT: v_subrev_i32_e32 v0, vcc, s2, v0
	; GCN-NEXT: v_subb_u32_e32 v1, vcc, v1, v2, vcc
	; GCN-NEXT: buffer_store_dwordx2 v[0:1], off, s[4:7], 0
	; GCN-NEXT: s_endpgm			; GCN-NEXT: s_endpgm
	%r = srem i64 %x, 1235195			%r = srem i64 %x, 1235195
	store i64 %r, i64 addrspace(1)* %out			store i64 %r, i64 addrspace(1)* %out
	ret void			ret void
	}			}

	define amdgpu_kernel void @srem_i64_pow2k_denom(i64 addrspace(1)* %out, i64 %x) {			define amdgpu_kernel void @srem_i64_pow2k_denom(i64 addrspace(1)* %out, i64 %x) {
	; CHECK-LABEL: @srem_i64_pow2k_denom(			; CHECK-LABEL: @srem_i64_pow2k_denom(
	▲ Show 20 Lines • Show All 507 Lines • Show Last 20 Lines

llvm/test/CodeGen/AMDGPU/udiv64.ll

Show First 20 Lines • Show All 1,418 Lines • ▼ Show 20 Lines
; GCN-IR-NEXT: s_setpc_b64 s[30:31]		; GCN-IR-NEXT: s_setpc_b64 s[30:31]
%result = udiv i64 %x, 32768		%result = udiv i64 %x, 32768
ret i64 %result		ret i64 %result
}		}

define amdgpu_kernel void @s_test_udiv_k_den_i64(i64 addrspace(1)* %out, i64 %x) {		define amdgpu_kernel void @s_test_udiv_k_den_i64(i64 addrspace(1)* %out, i64 %x) {
; GCN-LABEL: s_test_udiv_k_den_i64:		; GCN-LABEL: s_test_udiv_k_den_i64:
; GCN: ; %bb.0:		; GCN: ; %bb.0:
; GCN-NEXT: v_mov_b32_e32 v0, 0x4f800000		; GCN-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x9
; GCN-NEXT: v_madak_f32 v0, 0, v0, 0x41c00000		; GCN-NEXT: s_mov_b32 s10, 0xaaaaaaaa
; GCN-NEXT: v_rcp_f32_e32 v0, v0		; GCN-NEXT: v_mov_b32_e32 v0, s10
; GCN-NEXT: s_movk_i32 s2, 0xffe8		; GCN-NEXT: s_mov_b32 s3, 0xf000
; GCN-NEXT: v_mov_b32_e32 v8, 0		; GCN-NEXT: s_mov_b32 s2, -1
; GCN-NEXT: v_mov_b32_e32 v7, 0
; GCN-NEXT: v_mul_f32_e32 v0, 0x5f7ffffc, v0
; GCN-NEXT: v_mul_f32_e32 v1, 0x2f800000, v0
; GCN-NEXT: v_trunc_f32_e32 v1, v1
; GCN-NEXT: v_mac_f32_e32 v0, 0xcf800000, v1
; GCN-NEXT: v_cvt_u32_f32_e32 v0, v0
; GCN-NEXT: v_cvt_u32_f32_e32 v1, v1
; GCN-NEXT: s_load_dwordx4 s[8:11], s[0:1], 0x9
; GCN-NEXT: s_mov_b32 s7, 0xf000
; GCN-NEXT: v_mul_hi_u32 v2, v0, s2
; GCN-NEXT: v_mul_lo_u32 v3, v1, s2
; GCN-NEXT: v_mul_lo_u32 v4, v0, s2
; GCN-NEXT: s_mov_b32 s6, -1
; GCN-NEXT: v_subrev_i32_e32 v2, vcc, v0, v2
; GCN-NEXT: v_add_i32_e32 v2, vcc, v3, v2
; GCN-NEXT: v_mul_lo_u32 v5, v0, v2
; GCN-NEXT: v_mul_hi_u32 v6, v0, v4
; GCN-NEXT: v_mul_hi_u32 v3, v0, v2
; GCN-NEXT: v_mul_hi_u32 v9, v1, v2
; GCN-NEXT: v_mul_lo_u32 v2, v1, v2
; GCN-NEXT: v_add_i32_e32 v5, vcc, v6, v5
; GCN-NEXT: v_mul_lo_u32 v6, v1, v4
; GCN-NEXT: v_mul_hi_u32 v4, v1, v4
; GCN-NEXT: v_addc_u32_e32 v3, vcc, v8, v3, vcc
; GCN-NEXT: s_waitcnt lgkmcnt(0)		; GCN-NEXT: s_waitcnt lgkmcnt(0)
; GCN-NEXT: s_mov_b32 s4, s8		; GCN-NEXT: s_mov_b32 s0, s4
; GCN-NEXT: v_add_i32_e32 v5, vcc, v6, v5		; GCN-NEXT: s_mov_b32 s4, 0xaaaaaaab
; GCN-NEXT: v_addc_u32_e32 v3, vcc, v3, v4, vcc		; GCN-NEXT: v_mov_b32_e32 v2, s4
; GCN-NEXT: v_addc_u32_e32 v4, vcc, v9, v7, vcc		; GCN-NEXT: v_mul_hi_u32 v3, s6, v2
; GCN-NEXT: v_add_i32_e32 v2, vcc, v3, v2		; GCN-NEXT: v_mul_hi_u32 v2, s7, v2
; GCN-NEXT: v_add_i32_e64 v0, s[0:1], v0, v2		; GCN-NEXT: s_mul_i32 s4, s7, s4
; GCN-NEXT: v_addc_u32_e32 v3, vcc, v8, v4, vcc		; GCN-NEXT: v_mul_hi_u32 v1, s6, v0
; GCN-NEXT: v_mul_hi_u32 v4, v0, s2		; GCN-NEXT: v_add_i32_e32 v3, vcc, s4, v3
; GCN-NEXT: v_addc_u32_e64 v2, vcc, v1, v3, s[0:1]		; GCN-NEXT: s_mul_i32 s1, s6, s10
; GCN-NEXT: v_mul_lo_u32 v5, v2, s2		; GCN-NEXT: v_addc_u32_e32 v2, vcc, 0, v2, vcc
; GCN-NEXT: v_mul_lo_u32 v6, v0, s2		; GCN-NEXT: v_add_i32_e32 v3, vcc, s1, v3
; GCN-NEXT: v_subrev_i32_e32 v4, vcc, v0, v4		; GCN-NEXT: v_mul_hi_u32 v3, s7, v0
; GCN-NEXT: s_mov_b32 s5, s9
; GCN-NEXT: v_add_i32_e32 v4, vcc, v4, v5
; GCN-NEXT: v_mul_lo_u32 v5, v0, v4
; GCN-NEXT: v_mul_hi_u32 v9, v0, v6
; GCN-NEXT: v_mul_hi_u32 v10, v0, v4
; GCN-NEXT: v_mul_hi_u32 v11, v2, v4
; GCN-NEXT: v_add_i32_e32 v5, vcc, v9, v5
; GCN-NEXT: v_addc_u32_e32 v9, vcc, v8, v10, vcc
; GCN-NEXT: v_mul_lo_u32 v10, v2, v6
; GCN-NEXT: v_mul_hi_u32 v6, v2, v6
; GCN-NEXT: v_mul_lo_u32 v2, v2, v4
; GCN-NEXT: v_add_i32_e32 v5, vcc, v5, v10
; GCN-NEXT: v_addc_u32_e32 v5, vcc, v9, v6, vcc
; GCN-NEXT: v_addc_u32_e32 v4, vcc, v11, v7, vcc
; GCN-NEXT: v_add_i32_e32 v2, vcc, v5, v2
; GCN-NEXT: v_addc_u32_e32 v4, vcc, v8, v4, vcc
; GCN-NEXT: v_add_i32_e32 v1, vcc, v1, v3
; GCN-NEXT: v_addc_u32_e64 v1, vcc, v1, v4, s[0:1]
; GCN-NEXT: v_add_i32_e32 v0, vcc, v0, v2
; GCN-NEXT: v_addc_u32_e32 v1, vcc, 0, v1, vcc		; GCN-NEXT: v_addc_u32_e32 v1, vcc, 0, v1, vcc
; GCN-NEXT: v_mul_lo_u32 v2, s10, v1		; GCN-NEXT: v_add_i32_e32 v1, vcc, v2, v1
; GCN-NEXT: v_mul_hi_u32 v3, s10, v0		; GCN-NEXT: s_mul_i32 s1, s7, s10
; GCN-NEXT: v_mul_hi_u32 v4, s10, v1		; GCN-NEXT: v_addc_u32_e64 v2, s[8:9], 0, 0, vcc
; GCN-NEXT: v_mul_hi_u32 v5, s11, v1		; GCN-NEXT: v_add_i32_e32 v0, vcc, s1, v1
; GCN-NEXT: v_mul_lo_u32 v1, s11, v1		; GCN-NEXT: v_addc_u32_e32 v1, vcc, v3, v2, vcc
; GCN-NEXT: v_add_i32_e32 v2, vcc, v3, v2		; GCN-NEXT: v_lshr_b64 v[0:1], v[0:1], 4
; GCN-NEXT: v_addc_u32_e32 v3, vcc, v8, v4, vcc		; GCN-NEXT: s_mov_b32 s1, s5
; GCN-NEXT: v_mul_lo_u32 v4, s11, v0		; GCN-NEXT: buffer_store_dwordx2 v[0:1], off, s[0:3], 0
; GCN-NEXT: v_mul_hi_u32 v0, s11, v0
; GCN-NEXT: v_add_i32_e32 v2, vcc, v4, v2
; GCN-NEXT: v_addc_u32_e32 v0, vcc, v3, v0, vcc
; GCN-NEXT: v_addc_u32_e32 v2, vcc, v5, v7, vcc
; GCN-NEXT: v_add_i32_e32 v0, vcc, v0, v1
; GCN-NEXT: v_addc_u32_e32 v1, vcc, v8, v2, vcc
; GCN-NEXT: v_mul_lo_u32 v2, v1, 24
; GCN-NEXT: v_mul_hi_u32 v3, v0, 24
; GCN-NEXT: v_mul_lo_u32 v4, v0, 24
; GCN-NEXT: v_add_i32_e32 v2, vcc, v3, v2
; GCN-NEXT: v_sub_i32_e32 v4, vcc, s10, v4
; GCN-NEXT: v_mov_b32_e32 v3, s11
; GCN-NEXT: v_subb_u32_e32 v2, vcc, v3, v2, vcc
; GCN-NEXT: v_subrev_i32_e32 v3, vcc, 24, v4
; GCN-NEXT: v_subbrev_u32_e32 v5, vcc, 0, v2, vcc
; GCN-NEXT: v_cmp_lt_u32_e32 vcc, 23, v3
; GCN-NEXT: v_cndmask_b32_e64 v3, 0, -1, vcc
; GCN-NEXT: v_cmp_eq_u32_e32 vcc, 0, v5
; GCN-NEXT: v_cndmask_b32_e32 v3, -1, v3, vcc
; GCN-NEXT: v_add_i32_e32 v5, vcc, 2, v0
; GCN-NEXT: v_addc_u32_e32 v6, vcc, 0, v1, vcc
; GCN-NEXT: v_add_i32_e32 v7, vcc, 1, v0
; GCN-NEXT: v_cmp_lt_u32_e64 s[0:1], 23, v4
; GCN-NEXT: v_addc_u32_e32 v8, vcc, 0, v1, vcc
; GCN-NEXT: v_cndmask_b32_e64 v4, 0, -1, s[0:1]
; GCN-NEXT: v_cmp_eq_u32_e64 s[0:1], 0, v2
; GCN-NEXT: v_cmp_ne_u32_e32 vcc, 0, v3
; GCN-NEXT: v_cndmask_b32_e64 v2, -1, v4, s[0:1]
; GCN-NEXT: v_cmp_ne_u32_e64 s[0:1], 0, v2
; GCN-NEXT: v_cndmask_b32_e32 v3, v8, v6, vcc
; GCN-NEXT: v_cndmask_b32_e32 v2, v7, v5, vcc
; GCN-NEXT: v_cndmask_b32_e64 v1, v1, v3, s[0:1]
; GCN-NEXT: v_cndmask_b32_e64 v0, v0, v2, s[0:1]
; GCN-NEXT: buffer_store_dwordx2 v[0:1], off, s[4:7], 0
; GCN-NEXT: s_endpgm		; GCN-NEXT: s_endpgm
;		;
; GCN-IR-LABEL: s_test_udiv_k_den_i64:		; GCN-IR-LABEL: s_test_udiv_k_den_i64:
; GCN-IR: ; %bb.0: ; %_udiv-special-cases		; GCN-IR: ; %bb.0: ; %_udiv-special-cases
; GCN-IR-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x9		; GCN-IR-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x9
; GCN-IR-NEXT: s_waitcnt lgkmcnt(0)		; GCN-IR-NEXT: s_waitcnt lgkmcnt(0)
; GCN-IR-NEXT: s_flbit_i32_b32 s2, s6		; GCN-IR-NEXT: s_flbit_i32_b32 s2, s6
; GCN-IR-NEXT: s_flbit_i32_b32 s3, s7		; GCN-IR-NEXT: s_flbit_i32_b32 s3, s7
▲ Show 20 Lines • Show All 74 Lines • ▼ Show 20 Lines	; GCN-IR-NEXT: s_endpgm
store i64 %result, i64 addrspace(1)* %out		store i64 %result, i64 addrspace(1)* %out
ret void		ret void
}		}

define i64 @v_test_udiv_k_den_i64(i64 %x) {		define i64 @v_test_udiv_k_den_i64(i64 %x) {
; GCN-LABEL: v_test_udiv_k_den_i64:		; GCN-LABEL: v_test_udiv_k_den_i64:
; GCN: ; %bb.0:		; GCN: ; %bb.0:
; GCN-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)		; GCN-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
; GCN-NEXT: v_mov_b32_e32 v2, 0x4f800000		; GCN-NEXT: s_mov_b32 s4, 0xaaaaaaab
; GCN-NEXT: v_madak_f32 v2, 0, v2, 0x41c00000		; GCN-NEXT: v_mul_lo_u32 v3, v1, s4
; GCN-NEXT: v_rcp_f32_e32 v2, v2		; GCN-NEXT: v_mul_hi_u32 v4, v0, s4
; GCN-NEXT: s_movk_i32 s6, 0xffe8		; GCN-NEXT: s_mov_b32 s6, 0xaaaaaaaa
; GCN-NEXT: v_mov_b32_e32 v10, 0		; GCN-NEXT: v_mul_hi_u32 v5, v1, s4
; GCN-NEXT: v_mov_b32_e32 v9, 0		; GCN-NEXT: v_mul_hi_u32 v2, v0, s6
; GCN-NEXT: v_mul_f32_e32 v2, 0x5f7ffffc, v2		; GCN-NEXT: v_mul_lo_u32 v0, v0, s6
; GCN-NEXT: v_mul_f32_e32 v3, 0x2f800000, v2		; GCN-NEXT: v_add_i32_e32 v3, vcc, v3, v4
; GCN-NEXT: v_trunc_f32_e32 v3, v3		; GCN-NEXT: v_addc_u32_e32 v4, vcc, 0, v5, vcc
; GCN-NEXT: v_mac_f32_e32 v2, 0xcf800000, v3		; GCN-NEXT: v_add_i32_e32 v0, vcc, v0, v3
; GCN-NEXT: v_cvt_u32_f32_e32 v2, v2		; GCN-NEXT: v_addc_u32_e32 v0, vcc, 0, v2, vcc
; GCN-NEXT: v_cvt_u32_f32_e32 v3, v3		; GCN-NEXT: v_mul_lo_u32 v2, v1, s6
; GCN-NEXT: v_mul_hi_u32 v4, v2, s6		; GCN-NEXT: v_mul_hi_u32 v1, v1, s6
; GCN-NEXT: v_mul_lo_u32 v5, v3, s6		; GCN-NEXT: v_add_i32_e32 v0, vcc, v4, v0
; GCN-NEXT: v_mul_lo_u32 v6, v2, s6		; GCN-NEXT: v_addc_u32_e64 v3, s[4:5], 0, 0, vcc
; GCN-NEXT: v_subrev_i32_e32 v4, vcc, v2, v4		; GCN-NEXT: v_add_i32_e32 v0, vcc, v2, v0
; GCN-NEXT: v_add_i32_e32 v4, vcc, v5, v4		; GCN-NEXT: v_addc_u32_e32 v1, vcc, v1, v3, vcc
; GCN-NEXT: v_mul_lo_u32 v7, v2, v4		; GCN-NEXT: v_alignbit_b32 v0, v1, v0, 4
; GCN-NEXT: v_mul_hi_u32 v8, v2, v6		; GCN-NEXT: v_lshrrev_b32_e32 v1, 4, v1
; GCN-NEXT: v_mul_hi_u32 v5, v2, v4
; GCN-NEXT: v_mul_hi_u32 v11, v3, v4
; GCN-NEXT: v_mul_lo_u32 v4, v3, v4
; GCN-NEXT: v_add_i32_e32 v7, vcc, v8, v7
; GCN-NEXT: v_mul_lo_u32 v8, v3, v6
; GCN-NEXT: v_mul_hi_u32 v6, v3, v6
; GCN-NEXT: v_addc_u32_e32 v5, vcc, v10, v5, vcc
; GCN-NEXT: v_add_i32_e32 v7, vcc, v8, v7
; GCN-NEXT: v_addc_u32_e32 v5, vcc, v5, v6, vcc
; GCN-NEXT: v_addc_u32_e32 v6, vcc, v11, v9, vcc
; GCN-NEXT: v_add_i32_e32 v4, vcc, v5, v4
; GCN-NEXT: v_add_i32_e64 v2, s[4:5], v2, v4
; GCN-NEXT: v_addc_u32_e32 v5, vcc, v10, v6, vcc
; GCN-NEXT: v_mul_hi_u32 v6, v2, s6
; GCN-NEXT: v_addc_u32_e64 v4, vcc, v3, v5, s[4:5]
; GCN-NEXT: v_mul_lo_u32 v7, v4, s6
; GCN-NEXT: v_mul_lo_u32 v8, v2, s6
; GCN-NEXT: v_subrev_i32_e32 v6, vcc, v2, v6
; GCN-NEXT: v_add_i32_e32 v6, vcc, v6, v7
; GCN-NEXT: v_mul_lo_u32 v7, v2, v6
; GCN-NEXT: v_mul_hi_u32 v11, v2, v8
; GCN-NEXT: v_mul_hi_u32 v12, v2, v6
; GCN-NEXT: v_mul_hi_u32 v13, v4, v6
; GCN-NEXT: v_add_i32_e32 v7, vcc, v11, v7
; GCN-NEXT: v_addc_u32_e32 v11, vcc, v10, v12, vcc
; GCN-NEXT: v_mul_lo_u32 v12, v4, v8
; GCN-NEXT: v_mul_hi_u32 v8, v4, v8
; GCN-NEXT: v_mul_lo_u32 v4, v4, v6
; GCN-NEXT: v_add_i32_e32 v7, vcc, v7, v12
; GCN-NEXT: v_addc_u32_e32 v7, vcc, v11, v8, vcc
; GCN-NEXT: v_addc_u32_e32 v6, vcc, v13, v9, vcc
; GCN-NEXT: v_add_i32_e32 v4, vcc, v7, v4
; GCN-NEXT: v_addc_u32_e32 v6, vcc, v10, v6, vcc
; GCN-NEXT: v_add_i32_e32 v3, vcc, v3, v5
; GCN-NEXT: v_addc_u32_e64 v3, vcc, v3, v6, s[4:5]
; GCN-NEXT: v_add_i32_e32 v2, vcc, v2, v4
; GCN-NEXT: v_addc_u32_e32 v3, vcc, 0, v3, vcc
; GCN-NEXT: v_mul_lo_u32 v4, v0, v3
; GCN-NEXT: v_mul_hi_u32 v5, v0, v2
; GCN-NEXT: v_mul_hi_u32 v6, v0, v3
; GCN-NEXT: v_mul_hi_u32 v7, v1, v3
; GCN-NEXT: v_mul_lo_u32 v3, v1, v3
; GCN-NEXT: v_add_i32_e32 v4, vcc, v5, v4
; GCN-NEXT: v_addc_u32_e32 v5, vcc, v10, v6, vcc
; GCN-NEXT: v_mul_lo_u32 v6, v1, v2
; GCN-NEXT: v_mul_hi_u32 v2, v1, v2
; GCN-NEXT: v_add_i32_e32 v4, vcc, v4, v6
; GCN-NEXT: v_addc_u32_e32 v2, vcc, v5, v2, vcc
; GCN-NEXT: v_addc_u32_e32 v4, vcc, v7, v9, vcc
; GCN-NEXT: v_add_i32_e32 v2, vcc, v2, v3
; GCN-NEXT: v_addc_u32_e32 v3, vcc, v10, v4, vcc
; GCN-NEXT: v_mul_lo_u32 v4, v3, 24
; GCN-NEXT: v_mul_hi_u32 v5, v2, 24
; GCN-NEXT: v_mul_lo_u32 v6, v2, 24
; GCN-NEXT: v_add_i32_e32 v4, vcc, v5, v4
; GCN-NEXT: v_sub_i32_e32 v0, vcc, v0, v6
; GCN-NEXT: v_subb_u32_e32 v1, vcc, v1, v4, vcc
; GCN-NEXT: v_subrev_i32_e32 v4, vcc, 24, v0
; GCN-NEXT: v_subbrev_u32_e32 v5, vcc, 0, v1, vcc
; GCN-NEXT: v_cmp_lt_u32_e32 vcc, 23, v4
; GCN-NEXT: v_cndmask_b32_e64 v4, 0, -1, vcc
; GCN-NEXT: v_cmp_eq_u32_e32 vcc, 0, v5
; GCN-NEXT: v_cndmask_b32_e32 v4, -1, v4, vcc
; GCN-NEXT: v_add_i32_e32 v5, vcc, 2, v2
; GCN-NEXT: v_addc_u32_e32 v6, vcc, 0, v3, vcc
; GCN-NEXT: v_add_i32_e32 v7, vcc, 1, v2
; GCN-NEXT: v_cmp_lt_u32_e64 s[4:5], 23, v0
; GCN-NEXT: v_addc_u32_e32 v8, vcc, 0, v3, vcc
; GCN-NEXT: v_cndmask_b32_e64 v0, 0, -1, s[4:5]
; GCN-NEXT: v_cmp_eq_u32_e64 s[4:5], 0, v1
; GCN-NEXT: v_cmp_ne_u32_e32 vcc, 0, v4
; GCN-NEXT: v_cndmask_b32_e64 v0, -1, v0, s[4:5]
; GCN-NEXT: v_cndmask_b32_e32 v4, v7, v5, vcc
; GCN-NEXT: v_cmp_ne_u32_e64 s[4:5], 0, v0
; GCN-NEXT: v_cndmask_b32_e32 v1, v8, v6, vcc
; GCN-NEXT: v_cndmask_b32_e64 v0, v2, v4, s[4:5]
; GCN-NEXT: v_cndmask_b32_e64 v1, v3, v1, s[4:5]
; GCN-NEXT: s_setpc_b64 s[30:31]		; GCN-NEXT: s_setpc_b64 s[30:31]
;		;
; GCN-IR-LABEL: v_test_udiv_k_den_i64:		; GCN-IR-LABEL: v_test_udiv_k_den_i64:
; GCN-IR: ; %bb.0: ; %_udiv-special-cases		; GCN-IR: ; %bb.0: ; %_udiv-special-cases
; GCN-IR-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)		; GCN-IR-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
; GCN-IR-NEXT: v_ffbh_u32_e32 v2, v0		; GCN-IR-NEXT: v_ffbh_u32_e32 v2, v0
; GCN-IR-NEXT: v_add_i32_e64 v2, s[4:5], 32, v2		; GCN-IR-NEXT: v_add_i32_e64 v2, s[4:5], 32, v2
; GCN-IR-NEXT: v_ffbh_u32_e32 v3, v1		; GCN-IR-NEXT: v_ffbh_u32_e32 v3, v1
▲ Show 20 Lines • Show All 277 Lines • Show Last 20 Lines

llvm/test/CodeGen/AMDGPU/urem64.ll

Show First 20 Lines • Show All 952 Lines • ▼ Show 20 Lines	; GCN-IR-NEXT: s_endpgm
%result = urem i64 24, %x		%result = urem i64 24, %x
store i64 %result, i64 addrspace(1)* %out		store i64 %result, i64 addrspace(1)* %out
ret void		ret void
}		}

define amdgpu_kernel void @s_test_urem_k_den_i64(i64 addrspace(1)* %out, i64 %x) {		define amdgpu_kernel void @s_test_urem_k_den_i64(i64 addrspace(1)* %out, i64 %x) {
; GCN-LABEL: s_test_urem_k_den_i64:		; GCN-LABEL: s_test_urem_k_den_i64:
; GCN: ; %bb.0:		; GCN: ; %bb.0:
; GCN-NEXT: v_mov_b32_e32 v0, 0x4f800000
; GCN-NEXT: v_madak_f32 v0, 0, v0, 0x41c00000
; GCN-NEXT: v_rcp_f32_e32 v0, v0
; GCN-NEXT: s_movk_i32 s2, 0xffe8
; GCN-NEXT: v_mov_b32_e32 v8, 0
; GCN-NEXT: v_mov_b32_e32 v7, 0
; GCN-NEXT: v_mul_f32_e32 v0, 0x5f7ffffc, v0
; GCN-NEXT: v_mul_f32_e32 v1, 0x2f800000, v0
; GCN-NEXT: v_trunc_f32_e32 v1, v1
; GCN-NEXT: v_mac_f32_e32 v0, 0xcf800000, v1
; GCN-NEXT: v_cvt_u32_f32_e32 v0, v0
; GCN-NEXT: v_cvt_u32_f32_e32 v1, v1
; GCN-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x9		; GCN-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x9
; GCN-NEXT: s_mov_b32 s11, 0xf000		; GCN-NEXT: s_mov_b32 s10, 0xaaaaaaaa
; GCN-NEXT: v_mul_hi_u32 v2, v0, s2		; GCN-NEXT: v_mov_b32_e32 v0, s10
; GCN-NEXT: v_mul_lo_u32 v3, v1, s2		; GCN-NEXT: s_mov_b32 s3, 0xf000
; GCN-NEXT: v_mul_lo_u32 v4, v0, s2		; GCN-NEXT: s_mov_b32 s2, -1
; GCN-NEXT: s_mov_b32 s10, -1
; GCN-NEXT: v_subrev_i32_e32 v2, vcc, v0, v2
; GCN-NEXT: v_add_i32_e32 v2, vcc, v3, v2
; GCN-NEXT: v_mul_lo_u32 v5, v0, v2
; GCN-NEXT: v_mul_hi_u32 v6, v0, v4
; GCN-NEXT: v_mul_hi_u32 v3, v0, v2
; GCN-NEXT: v_mul_hi_u32 v9, v1, v2
; GCN-NEXT: v_mul_lo_u32 v2, v1, v2
; GCN-NEXT: v_add_i32_e32 v5, vcc, v6, v5
; GCN-NEXT: v_mul_lo_u32 v6, v1, v4
; GCN-NEXT: v_mul_hi_u32 v4, v1, v4
; GCN-NEXT: v_addc_u32_e32 v3, vcc, v8, v3, vcc
; GCN-NEXT: s_waitcnt lgkmcnt(0)		; GCN-NEXT: s_waitcnt lgkmcnt(0)
; GCN-NEXT: s_mov_b32 s8, s4		; GCN-NEXT: s_mov_b32 s0, s4
; GCN-NEXT: v_add_i32_e32 v5, vcc, v6, v5		; GCN-NEXT: s_mov_b32 s4, 0xaaaaaaab
; GCN-NEXT: v_addc_u32_e32 v3, vcc, v3, v4, vcc		; GCN-NEXT: v_mov_b32_e32 v2, s4
; GCN-NEXT: v_addc_u32_e32 v4, vcc, v9, v7, vcc		; GCN-NEXT: v_mul_hi_u32 v3, s6, v2
; GCN-NEXT: v_add_i32_e32 v2, vcc, v3, v2		; GCN-NEXT: v_mul_hi_u32 v2, s7, v2
; GCN-NEXT: v_add_i32_e64 v0, s[0:1], v0, v2		; GCN-NEXT: v_mul_hi_u32 v1, s6, v0
; GCN-NEXT: v_addc_u32_e32 v3, vcc, v8, v4, vcc		; GCN-NEXT: s_mul_i32 s4, s7, s4
; GCN-NEXT: v_mul_hi_u32 v4, v0, s2		; GCN-NEXT: v_add_i32_e32 v3, vcc, s4, v3
; GCN-NEXT: v_addc_u32_e64 v2, vcc, v1, v3, s[0:1]		; GCN-NEXT: s_mul_i32 s1, s6, s10
; GCN-NEXT: v_mul_lo_u32 v5, v2, s2		; GCN-NEXT: v_addc_u32_e32 v2, vcc, 0, v2, vcc
; GCN-NEXT: v_mul_lo_u32 v6, v0, s2		; GCN-NEXT: v_add_i32_e32 v3, vcc, s1, v3
; GCN-NEXT: v_subrev_i32_e32 v4, vcc, v0, v4
; GCN-NEXT: s_mov_b32 s9, s5
; GCN-NEXT: v_add_i32_e32 v4, vcc, v4, v5
; GCN-NEXT: v_mul_lo_u32 v5, v0, v4
; GCN-NEXT: v_mul_hi_u32 v9, v0, v6
; GCN-NEXT: v_mul_hi_u32 v10, v0, v4
; GCN-NEXT: v_mul_hi_u32 v11, v2, v4
; GCN-NEXT: v_add_i32_e32 v5, vcc, v9, v5
; GCN-NEXT: v_addc_u32_e32 v9, vcc, v8, v10, vcc
; GCN-NEXT: v_mul_lo_u32 v10, v2, v6
; GCN-NEXT: v_mul_hi_u32 v6, v2, v6
; GCN-NEXT: v_mul_lo_u32 v2, v2, v4
; GCN-NEXT: v_add_i32_e32 v5, vcc, v5, v10
; GCN-NEXT: v_addc_u32_e32 v5, vcc, v9, v6, vcc
; GCN-NEXT: v_addc_u32_e32 v4, vcc, v11, v7, vcc
; GCN-NEXT: v_add_i32_e32 v2, vcc, v5, v2
; GCN-NEXT: v_addc_u32_e32 v4, vcc, v8, v4, vcc
; GCN-NEXT: v_add_i32_e32 v1, vcc, v1, v3
; GCN-NEXT: v_addc_u32_e64 v1, vcc, v1, v4, s[0:1]
; GCN-NEXT: v_add_i32_e32 v0, vcc, v0, v2
; GCN-NEXT: v_addc_u32_e32 v1, vcc, 0, v1, vcc
; GCN-NEXT: v_mul_lo_u32 v2, s6, v1
; GCN-NEXT: v_mul_hi_u32 v3, s6, v0
; GCN-NEXT: v_mul_hi_u32 v4, s6, v1
; GCN-NEXT: v_mul_hi_u32 v5, s7, v1
; GCN-NEXT: v_mul_lo_u32 v1, s7, v1
; GCN-NEXT: v_add_i32_e32 v2, vcc, v3, v2
; GCN-NEXT: v_addc_u32_e32 v3, vcc, v8, v4, vcc
; GCN-NEXT: v_mul_lo_u32 v4, s7, v0
; GCN-NEXT: v_mul_hi_u32 v0, s7, v0		; GCN-NEXT: v_mul_hi_u32 v0, s7, v0
; GCN-NEXT: v_add_i32_e32 v2, vcc, v4, v2		; GCN-NEXT: v_addc_u32_e32 v1, vcc, 0, v1, vcc
; GCN-NEXT: v_addc_u32_e32 v0, vcc, v3, v0, vcc
; GCN-NEXT: v_addc_u32_e32 v2, vcc, v5, v7, vcc
; GCN-NEXT: v_add_i32_e32 v0, vcc, v0, v1
; GCN-NEXT: v_addc_u32_e32 v1, vcc, v8, v2, vcc
; GCN-NEXT: v_mul_hi_u32 v2, v0, 24
; GCN-NEXT: v_mul_lo_u32 v1, v1, 24
; GCN-NEXT: v_mul_lo_u32 v0, v0, 24
; GCN-NEXT: v_add_i32_e32 v1, vcc, v2, v1		; GCN-NEXT: v_add_i32_e32 v1, vcc, v2, v1
; GCN-NEXT: v_sub_i32_e32 v0, vcc, s6, v0		; GCN-NEXT: s_mul_i32 s1, s7, s10
; GCN-NEXT: v_mov_b32_e32 v2, s7		; GCN-NEXT: v_addc_u32_e64 v2, s[8:9], 0, 0, vcc
; GCN-NEXT: v_subb_u32_e32 v1, vcc, v2, v1, vcc		; GCN-NEXT: v_add_i32_e32 v1, vcc, s1, v1
; GCN-NEXT: v_subrev_i32_e32 v2, vcc, 24, v0		; GCN-NEXT: v_addc_u32_e32 v0, vcc, v0, v2, vcc
; GCN-NEXT: v_subbrev_u32_e32 v3, vcc, 0, v1, vcc		; GCN-NEXT: v_alignbit_b32 v1, v0, v1, 4
; GCN-NEXT: v_subrev_i32_e32 v4, vcc, 24, v2		; GCN-NEXT: v_lshrrev_b32_e32 v0, 4, v0
; GCN-NEXT: v_subbrev_u32_e32 v5, vcc, 0, v3, vcc		; GCN-NEXT: v_mul_hi_u32 v2, v1, 24
; GCN-NEXT: v_cmp_lt_u32_e32 vcc, 23, v2		; GCN-NEXT: v_mul_lo_u32 v0, v0, 24
; GCN-NEXT: v_cndmask_b32_e64 v6, 0, -1, vcc		; GCN-NEXT: v_mul_lo_u32 v1, v1, 24
; GCN-NEXT: v_cmp_eq_u32_e32 vcc, 0, v3		; GCN-NEXT: v_mov_b32_e32 v3, s7
; GCN-NEXT: v_cndmask_b32_e32 v6, -1, v6, vcc		; GCN-NEXT: s_mov_b32 s1, s5
; GCN-NEXT: v_cmp_ne_u32_e32 vcc, 0, v6		; GCN-NEXT: v_add_i32_e32 v2, vcc, v2, v0
; GCN-NEXT: v_cmp_lt_u32_e64 s[0:1], 23, v0		; GCN-NEXT: v_sub_i32_e32 v0, vcc, s6, v1
; GCN-NEXT: v_cndmask_b32_e32 v3, v3, v5, vcc		; GCN-NEXT: v_subb_u32_e32 v1, vcc, v3, v2, vcc
; GCN-NEXT: v_cndmask_b32_e64 v5, 0, -1, s[0:1]		; GCN-NEXT: buffer_store_dwordx2 v[0:1], off, s[0:3], 0
; GCN-NEXT: v_cmp_eq_u32_e64 s[0:1], 0, v1
; GCN-NEXT: v_cndmask_b32_e64 v5, -1, v5, s[0:1]
; GCN-NEXT: v_cmp_ne_u32_e64 s[0:1], 0, v5
; GCN-NEXT: v_cndmask_b32_e32 v2, v2, v4, vcc
; GCN-NEXT: v_cndmask_b32_e64 v1, v1, v3, s[0:1]
; GCN-NEXT: v_cndmask_b32_e64 v0, v0, v2, s[0:1]
; GCN-NEXT: buffer_store_dwordx2 v[0:1], off, s[8:11], 0
; GCN-NEXT: s_endpgm		; GCN-NEXT: s_endpgm
;		;
; GCN-IR-LABEL: s_test_urem_k_den_i64:		; GCN-IR-LABEL: s_test_urem_k_den_i64:
; GCN-IR: ; %bb.0: ; %_udiv-special-cases		; GCN-IR: ; %bb.0: ; %_udiv-special-cases
; GCN-IR-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x9		; GCN-IR-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x9
; GCN-IR-NEXT: s_waitcnt lgkmcnt(0)		; GCN-IR-NEXT: s_waitcnt lgkmcnt(0)
; GCN-IR-NEXT: s_flbit_i32_b32 s2, s6		; GCN-IR-NEXT: s_flbit_i32_b32 s2, s6
; GCN-IR-NEXT: s_flbit_i32_b32 s3, s7		; GCN-IR-NEXT: s_flbit_i32_b32 s3, s7
▲ Show 20 Lines • Show All 602 Lines • Show Last 20 Lines

llvm/test/CodeGen/BPF/32-bit-subreg-alu.ll

	Show First 20 Lines • Show All 184 Lines • ▼ Show 20 Lines
	; CHECK: w{{[0-9]+}} /= w{{[0-9]+}}			; CHECK: w{{[0-9]+}} /= w{{[0-9]+}}
	ret i32 %div			ret i32 %div
	}			}

	; Function Attrs: norecurse nounwind readnone			; Function Attrs: norecurse nounwind readnone
	define dso_local i32 @div_i(i32 %a) local_unnamed_addr #0 {			define dso_local i32 @div_i(i32 %a) local_unnamed_addr #0 {
	entry:			entry:
	%div = udiv i32 %a, 15			%div = udiv i32 %a, 15
	; CHECK: w{{[0-9]+}} /= 15			; CHECK: [[REG1:r[0-9]+]] = w{{[0-9]+}}
				; CHECK: [[REG2:r[0-9]+]] = 2290649225 ll
				; CHECK: [[REG1]] *= [[REG2]]
				; CHECK: [[REG1]] >>= 35
	ret i32 %div			ret i32 %div
	}			}

	; Function Attrs: norecurse nounwind readnone			; Function Attrs: norecurse nounwind readnone
	define dso_local i32 @or(i32 %a, i32 %b) local_unnamed_addr #0 {			define dso_local i32 @or(i32 %a, i32 %b) local_unnamed_addr #0 {
	entry:			entry:
	%or = or i32 %b, %a			%or = or i32 %b, %a
	; CHECK: w{{[0-9]+}} \|= w{{[0-9]+}}			; CHECK: w{{[0-9]+}} \|= w{{[0-9]+}}
	▲ Show 20 Lines • Show All 98 Lines • Show Last 20 Lines

llvm/test/CodeGen/BPF/sdiv_error.ll

	; RUN: not --crash llc -march=bpf < %s 2> %t1			; RUN: not --crash llc -march=bpf < %s 2> %t1
	; RUN: FileCheck %s < %t1			; RUN: FileCheck %s < %t1
	; CHECK: Unsupport signed division			; CHECK: Unsupport signed division

	; Function Attrs: norecurse nounwind readnone			; Function Attrs: norecurse nounwind readnone
	define i32 @test(i32 %len) #0 {			define i32 @test(i32 %len, i32 %rhs) #0 {
	%1 = srem i32 %len, 15			%1 = srem i32 %len, %rhs
	ret i32 %1			ret i32 %1
	}			}

llvm/test/CodeGen/PowerPC/loop-instr-form-prepare.ll

	Show First 20 Lines • Show All 611 Lines • ▼ Show 20 Lines
	;}			;}

	@arr = external local_unnamed_addr global i8*, align 8			@arr = external local_unnamed_addr global i8*, align 8

	define i64 @test_ds_cross_basic_blocks(i8* %0, i32 signext %1) {			define i64 @test_ds_cross_basic_blocks(i8* %0, i32 signext %1) {
	; CHECK-LABEL: test_ds_cross_basic_blocks:			; CHECK-LABEL: test_ds_cross_basic_blocks:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: cmplwi r4, 0			; CHECK-NEXT: cmplwi r4, 0
	; CHECK-NEXT: std r26, -48(r1) # 8-byte Folded Spill
	; CHECK-NEXT: std r27, -40(r1) # 8-byte Folded Spill			; CHECK-NEXT: std r27, -40(r1) # 8-byte Folded Spill
	; CHECK-NEXT: std r28, -32(r1) # 8-byte Folded Spill			; CHECK-NEXT: std r28, -32(r1) # 8-byte Folded Spill
	; CHECK-NEXT: std r29, -24(r1) # 8-byte Folded Spill			; CHECK-NEXT: std r29, -24(r1) # 8-byte Folded Spill
	; CHECK-NEXT: std r30, -16(r1) # 8-byte Folded Spill			; CHECK-NEXT: std r30, -16(r1) # 8-byte Folded Spill
	; CHECK-NEXT: beq cr0, .LBB6_8			; CHECK-NEXT: beq cr0, .LBB6_8
	; CHECK-NEXT: # %bb.1:			; CHECK-NEXT: # %bb.1:
	; CHECK-NEXT: cmpldi r4, 1			; CHECK-NEXT: cmpldi r4, 1
	; CHECK-NEXT: li r7, 1			; CHECK-NEXT: li r7, 1
	; CHECK-NEXT: addi r6, r3, 4009			; CHECK-NEXT: addi r6, r3, 4009
	; CHECK-NEXT: addis r5, r2, .LC0@toc@ha			; CHECK-NEXT: addis r5, r2, .LC0@toc@ha
	; CHECK-NEXT: ld r5, .LC0@toc@l(r5)			; CHECK-NEXT: ld r5, .LC0@toc@l(r5)
	; CHECK-NEXT: iselgt r8, r4, r7			; CHECK-NEXT: iselgt r4, r4, r7
	; CHECK-NEXT: lis r4, -21846
	; CHECK-NEXT: li r3, 0			; CHECK-NEXT: li r3, 0
	; CHECK-NEXT: li r9, -7			; CHECK-NEXT: li r8, -7
	; CHECK-NEXT: li r10, -6			; CHECK-NEXT: li r9, -6
				; CHECK-NEXT: li r10, 1
	; CHECK-NEXT: li r11, 1			; CHECK-NEXT: li r11, 1
	; CHECK-NEXT: li r12, 1			; CHECK-NEXT: li r12, 1
	; CHECK-NEXT: li r30, 1			; CHECK-NEXT: li r30, 1
	; CHECK-NEXT: ld r5, 0(r5)			; CHECK-NEXT: ld r5, 0(r5)
	; CHECK-NEXT: mtctr r8			; CHECK-NEXT: mtctr r4
	; CHECK-NEXT: li r8, -9			; CHECK-NEXT: li r4, -9
	; CHECK-NEXT: addi r5, r5, -1			; CHECK-NEXT: addi r5, r5, -1
	; CHECK-NEXT: ori r4, r4, 43691
	; CHECK-NEXT: li r29, 1			; CHECK-NEXT: li r29, 1
	; CHECK-NEXT: li r28, 1
	; CHECK-NEXT: b .LBB6_4			; CHECK-NEXT: b .LBB6_4
	; CHECK-NEXT: .p2align 4			; CHECK-NEXT: .p2align 4
	; CHECK-NEXT: .LBB6_2:			; CHECK-NEXT: .LBB6_2:
	; CHECK-NEXT: ldx r0, r6, r8			; CHECK-NEXT: ldx r0, r6, r4
	; CHECK-NEXT: add r28, r0, r28
	; CHECK-NEXT: ld r0, -8(r6)
	; CHECK-NEXT: add r29, r0, r29			; CHECK-NEXT: add r29, r0, r29
				; CHECK-NEXT: ld r0, -8(r6)
				; CHECK-NEXT: add r30, r0, r30
	; CHECK-NEXT: .LBB6_3:			; CHECK-NEXT: .LBB6_3:
	; CHECK-NEXT: addi r6, r6, 1			; CHECK-NEXT: addi r6, r6, 1
	; CHECK-NEXT: mulld r0, r29, r28			; CHECK-NEXT: mulld r0, r30, r29
	; CHECK-NEXT: mulld r0, r0, r30
	; CHECK-NEXT: mulld r0, r0, r12			; CHECK-NEXT: mulld r0, r0, r12
	; CHECK-NEXT: mulld r0, r0, r11			; CHECK-NEXT: mulld r0, r0, r11
				; CHECK-NEXT: mulld r0, r0, r10
	; CHECK-NEXT: maddld r3, r0, r7, r3			; CHECK-NEXT: maddld r3, r0, r7, r3
	; CHECK-NEXT: bdz .LBB6_9			; CHECK-NEXT: bdz .LBB6_9
	; CHECK-NEXT: .LBB6_4:			; CHECK-NEXT: .LBB6_4:
	; CHECK-NEXT: lbzu r0, 1(r5)			; CHECK-NEXT: lbzu r0, 1(r5)
	; CHECK-NEXT: mulhwu r27, r0, r4			; CHECK-NEXT: mulli r28, r0, 171
	; CHECK-NEXT: rlwinm r26, r27, 0, 0, 30			; CHECK-NEXT: rlwinm r27, r28, 24, 8, 30
	; CHECK-NEXT: srwi r27, r27, 1			; CHECK-NEXT: srwi r28, r28, 9
	; CHECK-NEXT: add r27, r27, r26			; CHECK-NEXT: add r28, r28, r27
	; CHECK-NEXT: sub r0, r0, r27			; CHECK-NEXT: sub r0, r0, r28
				; CHECK-NEXT: clrlwi r0, r0, 24
	; CHECK-NEXT: cmplwi r0, 1			; CHECK-NEXT: cmplwi r0, 1
	; CHECK-NEXT: beq cr0, .LBB6_2			; CHECK-NEXT: beq cr0, .LBB6_2
	; CHECK-NEXT: # %bb.5:			; CHECK-NEXT: # %bb.5:
	; CHECK-NEXT: clrlwi r0, r0, 24
	; CHECK-NEXT: cmplwi r0, 2			; CHECK-NEXT: cmplwi r0, 2
	; CHECK-NEXT: bne cr0, .LBB6_7			; CHECK-NEXT: bne cr0, .LBB6_7
	; CHECK-NEXT: # %bb.6:			; CHECK-NEXT: # %bb.6:
	; CHECK-NEXT: ldx r0, r6, r9			; CHECK-NEXT: ldx r0, r6, r8
	; CHECK-NEXT: add r30, r0, r30
	; CHECK-NEXT: ld r0, -4(r6)
	; CHECK-NEXT: add r12, r0, r12			; CHECK-NEXT: add r12, r0, r12
				; CHECK-NEXT: ld r0, -4(r6)
				; CHECK-NEXT: add r11, r0, r11
	; CHECK-NEXT: b .LBB6_3			; CHECK-NEXT: b .LBB6_3
	; CHECK-NEXT: .p2align 4			; CHECK-NEXT: .p2align 4
	; CHECK-NEXT: .LBB6_7:			; CHECK-NEXT: .LBB6_7:
	; CHECK-NEXT: ldx r0, r6, r10			; CHECK-NEXT: ldx r0, r6, r9
	; CHECK-NEXT: add r11, r0, r11			; CHECK-NEXT: add r10, r0, r10
	; CHECK-NEXT: ld r0, 0(r6)			; CHECK-NEXT: ld r0, 0(r6)
	; CHECK-NEXT: add r7, r0, r7			; CHECK-NEXT: add r7, r0, r7
	; CHECK-NEXT: b .LBB6_3			; CHECK-NEXT: b .LBB6_3
	; CHECK-NEXT: .LBB6_8:			; CHECK-NEXT: .LBB6_8:
	; CHECK-NEXT: li r3, 0			; CHECK-NEXT: li r3, 0
	; CHECK-NEXT: .LBB6_9:			; CHECK-NEXT: .LBB6_9:
	; CHECK-NEXT: ld r30, -16(r1) # 8-byte Folded Reload			; CHECK-NEXT: ld r30, -16(r1) # 8-byte Folded Reload
	; CHECK-NEXT: ld r29, -24(r1) # 8-byte Folded Reload			; CHECK-NEXT: ld r29, -24(r1) # 8-byte Folded Reload
	; CHECK-NEXT: ld r28, -32(r1) # 8-byte Folded Reload			; CHECK-NEXT: ld r28, -32(r1) # 8-byte Folded Reload
	; CHECK-NEXT: ld r27, -40(r1) # 8-byte Folded Reload			; CHECK-NEXT: ld r27, -40(r1) # 8-byte Folded Reload
	; CHECK-NEXT: ld r26, -48(r1) # 8-byte Folded Reload
	; CHECK-NEXT: blr			; CHECK-NEXT: blr
	%3 = sext i32 %1 to i64			%3 = sext i32 %1 to i64
	%4 = icmp eq i32 %1, 0			%4 = icmp eq i32 %1, 0
	br i1 %4, label %66, label %5			br i1 %4, label %66, label %5

	5: ; preds = %2			5: ; preds = %2
	%6 = load i8, i8* @arr, align 8			%6 = load i8, i8* @arr, align 8
	br label %7			br label %7
	▲ Show 20 Lines • Show All 326 Lines • Show Last 20 Lines

llvm/test/CodeGen/PowerPC/srem-lkk.ll

	Show First 20 Lines • Show All 124 Lines • ▼ Show 20 Lines
	; CHECK-NEXT: add 3, 3, 4			; CHECK-NEXT: add 3, 3, 4
	; CHECK-NEXT: blr			; CHECK-NEXT: blr
	%1 = srem i32 %x, 2147483648			%1 = srem i32 %x, 2147483648
	ret i32 %1			ret i32 %1
	}			}

	; Don't fold i64 srem			; Don't fold i64 srem
	define i64 @dont_fold_srem_i64(i64 %x) {			define i64 @dont_fold_srem_i64(i64 %x) {
	; CHECK-LABEL: dont_fold_srem_i64:			; CHECK64-LABEL: dont_fold_srem_i64:
	; CHECK: # %bb.0:			; CHECK64: # %bb.0:
	; CHECK-NEXT: mflr 0			; CHECK64-NEXT: mflr 0
	; CHECK-NEXT: stw 0, 4(1)			; CHECK64-NEXT: stw 0, 4(1)
	; CHECK-NEXT: stwu 1, -16(1)			; CHECK64-NEXT: stwu 1, -32(1)
	; CHECK-NEXT: .cfi_def_cfa_offset 16			; CHECK64-NEXT: .cfi_def_cfa_offset 32
	; CHECK-NEXT: .cfi_offset lr, 4			; CHECK64-NEXT: .cfi_offset lr, 4
	; CHECK-NEXT: li 5, 0			; CHECK64-NEXT: .cfi_offset r29, -12
	; CHECK-NEXT: li 6, 98			; CHECK64-NEXT: .cfi_offset r30, -8
	; CHECK-NEXT: bl __moddi3			; CHECK64-NEXT: stw 29, 20(1) # 4-byte Folded Spill
	; CHECK-NEXT: lwz 0, 20(1)			; CHECK64-NEXT: mr 29, 3
	; CHECK-NEXT: addi 1, 1, 16			; CHECK64-NEXT: srawi 3, 3, 31
	; CHECK-NEXT: mtlr 0			; CHECK64-NEXT: lis 5, -17388
	; CHECK-NEXT: blr			; CHECK64-NEXT: li 7, 0
				; CHECK64-NEXT: stw 30, 24(1) # 4-byte Folded Spill
				; CHECK64-NEXT: mr 30, 4
				; CHECK64-NEXT: lis 4, 21399
				; CHECK64-NEXT: ori 9, 4, 33436
				; CHECK64-NEXT: ori 10, 5, 58849
				; CHECK64-NEXT: mr 4, 3
				; CHECK64-NEXT: mr 5, 29
				; CHECK64-NEXT: mr 6, 30
				; CHECK64-NEXT: li 8, 0
				; CHECK64-NEXT: bl __multi3
				; CHECK64-NEXT: rotlwi 4, 4, 27
				; CHECK64-NEXT: srwi 6, 3, 31
				; CHECK64-NEXT: rlwimi 4, 3, 27, 0, 4
				; CHECK64-NEXT: srawi 3, 3, 5
				; CHECK64-NEXT: addc 4, 4, 6
				; CHECK64-NEXT: li 5, 98
				; CHECK64-NEXT: addze 3, 3
				; CHECK64-NEXT: mulhwu 5, 4, 5
				; CHECK64-NEXT: mulli 4, 4, 98
				; CHECK64-NEXT: mulli 3, 3, 98
				; CHECK64-NEXT: add 3, 5, 3
				; CHECK64-NEXT: subc 4, 30, 4
				; CHECK64-NEXT: lwz 30, 24(1) # 4-byte Folded Reload
				; CHECK64-NEXT: subfe 3, 3, 29
				; CHECK64-NEXT: lwz 29, 20(1) # 4-byte Folded Reload
				; CHECK64-NEXT: lwz 0, 36(1)
				; CHECK64-NEXT: addi 1, 1, 32
				; CHECK64-NEXT: mtlr 0
				; CHECK64-NEXT: blr
				;
				; CHECK32-LABEL: dont_fold_srem_i64:
				; CHECK32: # %bb.0:
				; CHECK32-NEXT: mflr 0
				; CHECK32-NEXT: stw 0, 4(1)
				; CHECK32-NEXT: stwu 1, -32(1)
				; CHECK32-NEXT: .cfi_def_cfa_offset 32
				; CHECK32-NEXT: .cfi_offset lr, 4
				; CHECK32-NEXT: .cfi_offset r29, -12
				; CHECK32-NEXT: .cfi_offset r30, -8
				; CHECK32-NEXT: stw 29, 20(1) # 4-byte Folded Spill
				; CHECK32-NEXT: mr 29, 3
				; CHECK32-NEXT: stw 30, 24(1) # 4-byte Folded Spill
				; CHECK32-NEXT: mr 30, 4
				; CHECK32-NEXT: srawi 3, 3, 31
				; CHECK32-NEXT: lis 4, 21399
				; CHECK32-NEXT: lis 5, -17388
				; CHECK32-NEXT: ori 9, 4, 33436
				; CHECK32-NEXT: ori 10, 5, 58849
				; CHECK32-NEXT: mr 5, 29
				; CHECK32-NEXT: mr 6, 30
				; CHECK32-NEXT: mr 4, 3
				; CHECK32-NEXT: li 7, 0
				; CHECK32-NEXT: li 8, 0
				; CHECK32-NEXT: bl __multi3
				; CHECK32-NEXT: rotlwi 4, 4, 27
				; CHECK32-NEXT: srwi 6, 3, 31
				; CHECK32-NEXT: rlwimi 4, 3, 27, 0, 4
				; CHECK32-NEXT: srawi 3, 3, 5
				; CHECK32-NEXT: addc 4, 4, 6
				; CHECK32-NEXT: li 5, 98
				; CHECK32-NEXT: addze 3, 3
				; CHECK32-NEXT: mulhwu 5, 4, 5
				; CHECK32-NEXT: mulli 4, 4, 98
				; CHECK32-NEXT: subc 4, 30, 4
				; CHECK32-NEXT: lwz 30, 24(1) # 4-byte Folded Reload
				; CHECK32-NEXT: mulli 3, 3, 98
				; CHECK32-NEXT: add 3, 5, 3
				; CHECK32-NEXT: subfe 3, 3, 29
				; CHECK32-NEXT: lwz 29, 20(1) # 4-byte Folded Reload
				; CHECK32-NEXT: lwz 0, 36(1)
				; CHECK32-NEXT: addi 1, 1, 32
				; CHECK32-NEXT: mtlr 0
				; CHECK32-NEXT: blr
	%1 = srem i64 %x, 98			%1 = srem i64 %x, 98
	ret i64 %1			ret i64 %1
	}			}

llvm/test/CodeGen/PowerPC/srem-vector-lkk.ll

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: llc -mcpu=pwr9 -verify-machineinstrs -ppc-vsr-nums-as-vr -ppc-asm-full-reg-names \			; RUN: llc -mcpu=pwr9 -verify-machineinstrs -ppc-vsr-nums-as-vr -ppc-asm-full-reg-names \
	; RUN: -mtriple=powerpc64le-unknown-linux-gnu < %s \| FileCheck %s --check-prefixes=CHECK,P9LE			; RUN: -mtriple=powerpc64le-unknown-linux-gnu < %s \| FileCheck %s --check-prefixes=CHECK,P9LE
	; RUN: llc -mcpu=pwr9 -verify-machineinstrs -ppc-vsr-nums-as-vr -ppc-asm-full-reg-names \			; RUN: llc -mcpu=pwr9 -verify-machineinstrs -ppc-vsr-nums-as-vr -ppc-asm-full-reg-names \
	; RUN: -mtriple=powerpc64-unknown-linux-gnu < %s \| FileCheck %s --check-prefixes=CHECK,P9BE			; RUN: -mtriple=powerpc64-unknown-linux-gnu < %s \| FileCheck %s --check-prefixes=CHECK,P9BE
	; RUN: llc -mcpu=pwr8 -verify-machineinstrs -ppc-vsr-nums-as-vr -ppc-asm-full-reg-names \			; RUN: llc -mcpu=pwr8 -verify-machineinstrs -ppc-vsr-nums-as-vr -ppc-asm-full-reg-names \
	; RUN: -mtriple=powerpc64le-unknown-linux-gnu < %s \| FileCheck %s --check-prefixes=CHECK,P8LE			; RUN: -mtriple=powerpc64le-unknown-linux-gnu < %s \| FileCheck %s --check-prefixes=CHECK,P8LE
	; RUN: llc -mcpu=pwr8 -verify-machineinstrs -ppc-vsr-nums-as-vr -ppc-asm-full-reg-names \			; RUN: llc -mcpu=pwr8 -verify-machineinstrs -ppc-vsr-nums-as-vr -ppc-asm-full-reg-names \
	; RUN: -mtriple=powerpc64-unknown-linux-gnu < %s \| FileCheck %s --check-prefixes=CHECK,P8BE			; RUN: -mtriple=powerpc64-unknown-linux-gnu < %s \| FileCheck %s --check-prefixes=CHECK,P8BE

	define <4 x i16> @fold_srem_vec_1(<4 x i16> %x) {			define <4 x i16> @fold_srem_vec_1(<4 x i16> %x) {
	; P9LE-LABEL: fold_srem_vec_1:			; P9LE-LABEL: fold_srem_vec_1:
	; P9LE: # %bb.0:			; P9LE: # %bb.0:
	; P9LE-NEXT: li r3, 0			; P9LE-NEXT: addis r3, r2, .LCPI0_0@toc@ha
	; P9LE-NEXT: lis r4, -21386			; P9LE-NEXT: vmrglh v4, v2, v2
	; P9LE-NEXT: vextuhrx r3, r3, v2			; P9LE-NEXT: vxor v5, v5, v5
	; P9LE-NEXT: ori r4, r4, 37253			; P9LE-NEXT: addi r3, r3, .LCPI0_0@toc@l
	; P9LE-NEXT: extsh r3, r3			; P9LE-NEXT: vextsh2w v4, v4
	; P9LE-NEXT: mulhw r4, r3, r4			; P9LE-NEXT: lxvx v3, 0, r3
	; P9LE-NEXT: add r4, r4, r3			; P9LE-NEXT: addis r3, r2, .LCPI0_1@toc@ha
	; P9LE-NEXT: srwi r5, r4, 31			; P9LE-NEXT: addi r3, r3, .LCPI0_1@toc@l
	; P9LE-NEXT: srawi r4, r4, 6			; P9LE-NEXT: vmuluwm v3, v4, v3
	; P9LE-NEXT: add r4, r4, r5			; P9LE-NEXT: vspltisw v4, 8
	; P9LE-NEXT: mulli r4, r4, 95			; P9LE-NEXT: vadduwm v4, v4, v4
	; P9LE-NEXT: sub r3, r3, r4			; P9LE-NEXT: vsrw v3, v3, v4
	; P9LE-NEXT: lis r4, 31710			; P9LE-NEXT: lxvx v4, 0, r3
	; P9LE-NEXT: mtvsrd v3, r3			; P9LE-NEXT: addis r3, r2, .LCPI0_2@toc@ha
	; P9LE-NEXT: li r3, 2			; P9LE-NEXT: vpkuwum v3, v3, v3
	; P9LE-NEXT: ori r4, r4, 63421			; P9LE-NEXT: addi r3, r3, .LCPI0_2@toc@l
	; P9LE-NEXT: vextuhrx r3, r3, v2			; P9LE-NEXT: vmladduhm v3, v2, v4, v3
	; P9LE-NEXT: extsh r3, r3			; P9LE-NEXT: lxvx v4, 0, r3
	; P9LE-NEXT: mulhw r4, r3, r4			; P9LE-NEXT: addis r3, r2, .LCPI0_3@toc@ha
	; P9LE-NEXT: sub r4, r4, r3			; P9LE-NEXT: addi r3, r3, .LCPI0_3@toc@l
	; P9LE-NEXT: srwi r5, r4, 31			; P9LE-NEXT: vsrah v3, v3, v4
	; P9LE-NEXT: srawi r4, r4, 6			; P9LE-NEXT: vspltish v4, 15
	; P9LE-NEXT: add r4, r4, r5			; P9LE-NEXT: vsrh v4, v3, v4
	; P9LE-NEXT: mulli r4, r4, -124			; P9LE-NEXT: vadduhm v3, v3, v4
	; P9LE-NEXT: sub r3, r3, r4			; P9LE-NEXT: lxvx v4, 0, r3
	; P9LE-NEXT: lis r4, 21399			; P9LE-NEXT: vmladduhm v3, v3, v4, v5
	; P9LE-NEXT: mtvsrd v4, r3			; P9LE-NEXT: vsubuhm v2, v2, v3
	; P9LE-NEXT: li r3, 4
	; P9LE-NEXT: ori r4, r4, 33437
	; P9LE-NEXT: vextuhrx r3, r3, v2
	; P9LE-NEXT: vmrghh v3, v4, v3
	; P9LE-NEXT: extsh r3, r3
	; P9LE-NEXT: mulhw r4, r3, r4
	; P9LE-NEXT: srwi r5, r4, 31
	; P9LE-NEXT: srawi r4, r4, 5
	; P9LE-NEXT: add r4, r4, r5
	; P9LE-NEXT: mulli r4, r4, 98
	; P9LE-NEXT: sub r3, r3, r4
	; P9LE-NEXT: lis r4, -16728
	; P9LE-NEXT: mtvsrd v4, r3
	; P9LE-NEXT: li r3, 6
	; P9LE-NEXT: ori r4, r4, 63249
	; P9LE-NEXT: vextuhrx r3, r3, v2
	; P9LE-NEXT: extsh r3, r3
	; P9LE-NEXT: mulhw r4, r3, r4
	; P9LE-NEXT: srwi r5, r4, 31
	; P9LE-NEXT: srawi r4, r4, 8
	; P9LE-NEXT: add r4, r4, r5
	; P9LE-NEXT: mulli r4, r4, -1003
	; P9LE-NEXT: sub r3, r3, r4
	; P9LE-NEXT: mtvsrd v2, r3
	; P9LE-NEXT: vmrghh v2, v2, v4
	; P9LE-NEXT: vmrglw v2, v2, v3
	; P9LE-NEXT: blr			; P9LE-NEXT: blr
	;			;
	; P9BE-LABEL: fold_srem_vec_1:			; P9BE-LABEL: fold_srem_vec_1:
	; P9BE: # %bb.0:			; P9BE: # %bb.0:
	; P9BE-NEXT: li r3, 2			; P9BE-NEXT: addis r3, r2, .LCPI0_0@toc@ha
	; P9BE-NEXT: lis r4, 31710			; P9BE-NEXT: vmrghh v4, v2, v2
	; P9BE-NEXT: vextuhlx r3, r3, v2			; P9BE-NEXT: vxor v5, v5, v5
	; P9BE-NEXT: ori r4, r4, 63421			; P9BE-NEXT: addi r3, r3, .LCPI0_0@toc@l
	; P9BE-NEXT: extsh r3, r3			; P9BE-NEXT: vextsh2w v4, v4
	; P9BE-NEXT: mulhw r4, r3, r4			; P9BE-NEXT: lxvx v3, 0, r3
	; P9BE-NEXT: sub r4, r4, r3			; P9BE-NEXT: addis r3, r2, .LCPI0_1@toc@ha
	; P9BE-NEXT: srwi r5, r4, 31			; P9BE-NEXT: addi r3, r3, .LCPI0_1@toc@l
	; P9BE-NEXT: srawi r4, r4, 6			; P9BE-NEXT: vmuluwm v3, v4, v3
	; P9BE-NEXT: add r4, r4, r5			; P9BE-NEXT: vspltisw v4, 8
	; P9BE-NEXT: mulli r4, r4, -124			; P9BE-NEXT: vadduwm v4, v4, v4
	; P9BE-NEXT: sub r3, r3, r4			; P9BE-NEXT: vsrw v3, v3, v4
	; P9BE-NEXT: lis r4, -21386			; P9BE-NEXT: lxvx v4, 0, r3
	; P9BE-NEXT: sldi r3, r3, 48			; P9BE-NEXT: addis r3, r2, .LCPI0_2@toc@ha
	; P9BE-NEXT: ori r4, r4, 37253			; P9BE-NEXT: vpkuwum v3, v3, v3
	; P9BE-NEXT: mtvsrd v3, r3			; P9BE-NEXT: addi r3, r3, .LCPI0_2@toc@l
	; P9BE-NEXT: li r3, 0			; P9BE-NEXT: vmladduhm v3, v2, v4, v3
	; P9BE-NEXT: vextuhlx r3, r3, v2			; P9BE-NEXT: lxvx v4, 0, r3
	; P9BE-NEXT: extsh r3, r3			; P9BE-NEXT: addis r3, r2, .LCPI0_3@toc@ha
	; P9BE-NEXT: mulhw r4, r3, r4			; P9BE-NEXT: addi r3, r3, .LCPI0_3@toc@l
	; P9BE-NEXT: add r4, r4, r3			; P9BE-NEXT: vsrah v3, v3, v4
	; P9BE-NEXT: srwi r5, r4, 31			; P9BE-NEXT: vspltish v4, 15
	; P9BE-NEXT: srawi r4, r4, 6			; P9BE-NEXT: vsrh v4, v3, v4
	; P9BE-NEXT: add r4, r4, r5			; P9BE-NEXT: vadduhm v3, v3, v4
	; P9BE-NEXT: mulli r4, r4, 95			; P9BE-NEXT: lxvx v4, 0, r3
	; P9BE-NEXT: sub r3, r3, r4			; P9BE-NEXT: vmladduhm v3, v3, v4, v5
	; P9BE-NEXT: lis r4, -16728			; P9BE-NEXT: vsubuhm v2, v2, v3
	; P9BE-NEXT: sldi r3, r3, 48
	; P9BE-NEXT: ori r4, r4, 63249
	; P9BE-NEXT: mtvsrd v4, r3
	; P9BE-NEXT: li r3, 6
	; P9BE-NEXT: vextuhlx r3, r3, v2
	; P9BE-NEXT: vmrghh v3, v4, v3
	; P9BE-NEXT: extsh r3, r3
	; P9BE-NEXT: mulhw r4, r3, r4
	; P9BE-NEXT: srwi r5, r4, 31
	; P9BE-NEXT: srawi r4, r4, 8
	; P9BE-NEXT: add r4, r4, r5
	; P9BE-NEXT: mulli r4, r4, -1003
	; P9BE-NEXT: sub r3, r3, r4
	; P9BE-NEXT: lis r4, 21399
	; P9BE-NEXT: sldi r3, r3, 48
	; P9BE-NEXT: ori r4, r4, 33437
	; P9BE-NEXT: mtvsrd v4, r3
	; P9BE-NEXT: li r3, 4
	; P9BE-NEXT: vextuhlx r3, r3, v2
	; P9BE-NEXT: extsh r3, r3
	; P9BE-NEXT: mulhw r4, r3, r4
	; P9BE-NEXT: srwi r5, r4, 31
	; P9BE-NEXT: srawi r4, r4, 5
	; P9BE-NEXT: add r4, r4, r5
	; P9BE-NEXT: mulli r4, r4, 98
	; P9BE-NEXT: sub r3, r3, r4
	; P9BE-NEXT: sldi r3, r3, 48
	; P9BE-NEXT: mtvsrd v2, r3
	; P9BE-NEXT: vmrghh v2, v2, v4
	; P9BE-NEXT: vmrghw v2, v3, v2
	; P9BE-NEXT: blr			; P9BE-NEXT: blr
	;			;
	; P8LE-LABEL: fold_srem_vec_1:			; P8LE-LABEL: fold_srem_vec_1:
	; P8LE: # %bb.0:			; P8LE: # %bb.0:
	; P8LE-NEXT: xxswapd vs0, v2			; P8LE-NEXT: vmrglh v3, v2, v2
	; P8LE-NEXT: lis r3, 21399			; P8LE-NEXT: vspltisw v4, 8
	; P8LE-NEXT: lis r8, -16728			; P8LE-NEXT: addis r3, r2, .LCPI0_0@toc@ha
	; P8LE-NEXT: lis r9, -21386			; P8LE-NEXT: addi r3, r3, .LCPI0_0@toc@l
	; P8LE-NEXT: lis r10, 31710			; P8LE-NEXT: lvx v5, 0, r3
	; P8LE-NEXT: ori r3, r3, 33437			; P8LE-NEXT: addis r3, r2, .LCPI0_1@toc@ha
	; P8LE-NEXT: ori r8, r8, 63249			; P8LE-NEXT: vadduwm v4, v4, v4
	; P8LE-NEXT: ori r9, r9, 37253			; P8LE-NEXT: addi r3, r3, .LCPI0_1@toc@l
	; P8LE-NEXT: ori r10, r10, 63421			; P8LE-NEXT: vslw v3, v3, v4
	; P8LE-NEXT: mffprd r4, f0			; P8LE-NEXT: vsraw v3, v3, v4
	; P8LE-NEXT: rldicl r5, r4, 32, 48			; P8LE-NEXT: vmuluwm v3, v3, v5
	; P8LE-NEXT: rldicl r6, r4, 16, 48			; P8LE-NEXT: vxor v5, v5, v5
	; P8LE-NEXT: clrldi r7, r4, 48			; P8LE-NEXT: vsrw v3, v3, v4
	; P8LE-NEXT: extsh r5, r5			; P8LE-NEXT: lvx v4, 0, r3
	; P8LE-NEXT: extsh r6, r6			; P8LE-NEXT: addis r3, r2, .LCPI0_2@toc@ha
	; P8LE-NEXT: rldicl r4, r4, 48, 48			; P8LE-NEXT: addi r3, r3, .LCPI0_2@toc@l
	; P8LE-NEXT: extsh r7, r7			; P8LE-NEXT: vpkuwum v3, v3, v3
	; P8LE-NEXT: mulhw r3, r5, r3			; P8LE-NEXT: vmladduhm v3, v2, v4, v3
	; P8LE-NEXT: extsh r4, r4			; P8LE-NEXT: lvx v4, 0, r3
	; P8LE-NEXT: mulhw r8, r6, r8			; P8LE-NEXT: addis r3, r2, .LCPI0_3@toc@ha
	; P8LE-NEXT: mulhw r9, r7, r9			; P8LE-NEXT: addi r3, r3, .LCPI0_3@toc@l
	; P8LE-NEXT: mulhw r10, r4, r10			; P8LE-NEXT: vsrah v3, v3, v4
	; P8LE-NEXT: srwi r11, r3, 31			; P8LE-NEXT: vspltish v4, 15
	; P8LE-NEXT: srawi r3, r3, 5			; P8LE-NEXT: vsrh v4, v3, v4
	; P8LE-NEXT: add r3, r3, r11			; P8LE-NEXT: vadduhm v3, v3, v4
	; P8LE-NEXT: srwi r11, r8, 31			; P8LE-NEXT: lvx v4, 0, r3
	; P8LE-NEXT: add r9, r9, r7			; P8LE-NEXT: vmladduhm v3, v3, v4, v5
	; P8LE-NEXT: srawi r8, r8, 8			; P8LE-NEXT: vsubuhm v2, v2, v3
	; P8LE-NEXT: sub r10, r10, r4
	; P8LE-NEXT: add r8, r8, r11
	; P8LE-NEXT: srwi r11, r9, 31
	; P8LE-NEXT: srawi r9, r9, 6
	; P8LE-NEXT: mulli r3, r3, 98
	; P8LE-NEXT: add r9, r9, r11
	; P8LE-NEXT: srwi r11, r10, 31
	; P8LE-NEXT: srawi r10, r10, 6
	; P8LE-NEXT: mulli r8, r8, -1003
	; P8LE-NEXT: add r10, r10, r11
	; P8LE-NEXT: mulli r9, r9, 95
	; P8LE-NEXT: mulli r10, r10, -124
	; P8LE-NEXT: sub r3, r5, r3
	; P8LE-NEXT: mtvsrd v2, r3
	; P8LE-NEXT: sub r5, r6, r8
	; P8LE-NEXT: sub r3, r7, r9
	; P8LE-NEXT: mtvsrd v3, r5
	; P8LE-NEXT: sub r4, r4, r10
	; P8LE-NEXT: mtvsrd v4, r3
	; P8LE-NEXT: mtvsrd v5, r4
	; P8LE-NEXT: vmrghh v2, v3, v2
	; P8LE-NEXT: vmrghh v3, v5, v4
	; P8LE-NEXT: vmrglw v2, v2, v3
	; P8LE-NEXT: blr			; P8LE-NEXT: blr
	;			;
	; P8BE-LABEL: fold_srem_vec_1:			; P8BE-LABEL: fold_srem_vec_1:
	; P8BE: # %bb.0:			; P8BE: # %bb.0:
	; P8BE-NEXT: mfvsrd r4, v2			; P8BE-NEXT: vmrghh v3, v2, v2
	; P8BE-NEXT: lis r3, -16728			; P8BE-NEXT: vspltisw v4, 8
	; P8BE-NEXT: lis r8, 21399			; P8BE-NEXT: addis r3, r2, .LCPI0_0@toc@ha
	; P8BE-NEXT: lis r9, 31710			; P8BE-NEXT: addi r3, r3, .LCPI0_0@toc@l
	; P8BE-NEXT: lis r10, -21386			; P8BE-NEXT: lxvw4x v5, 0, r3
	; P8BE-NEXT: ori r3, r3, 63249			; P8BE-NEXT: addis r3, r2, .LCPI0_1@toc@ha
	; P8BE-NEXT: ori r8, r8, 33437			; P8BE-NEXT: vadduwm v4, v4, v4
	; P8BE-NEXT: ori r9, r9, 63421			; P8BE-NEXT: addi r3, r3, .LCPI0_1@toc@l
	; P8BE-NEXT: ori r10, r10, 37253			; P8BE-NEXT: vslw v3, v3, v4
	; P8BE-NEXT: clrldi r5, r4, 48			; P8BE-NEXT: vsraw v3, v3, v4
	; P8BE-NEXT: rldicl r6, r4, 48, 48			; P8BE-NEXT: vmuluwm v3, v3, v5
	; P8BE-NEXT: rldicl r7, r4, 32, 48			; P8BE-NEXT: vxor v5, v5, v5
	; P8BE-NEXT: extsh r5, r5			; P8BE-NEXT: vsrw v3, v3, v4
	; P8BE-NEXT: extsh r6, r6			; P8BE-NEXT: lxvw4x v4, 0, r3
	; P8BE-NEXT: rldicl r4, r4, 16, 48			; P8BE-NEXT: addis r3, r2, .LCPI0_2@toc@ha
	; P8BE-NEXT: extsh r7, r7			; P8BE-NEXT: addi r3, r3, .LCPI0_2@toc@l
	; P8BE-NEXT: mulhw r3, r5, r3			; P8BE-NEXT: vpkuwum v3, v3, v3
	; P8BE-NEXT: extsh r4, r4			; P8BE-NEXT: vmladduhm v3, v2, v4, v3
	; P8BE-NEXT: mulhw r8, r6, r8			; P8BE-NEXT: lxvw4x v4, 0, r3
	; P8BE-NEXT: mulhw r9, r7, r9			; P8BE-NEXT: addis r3, r2, .LCPI0_3@toc@ha
	; P8BE-NEXT: mulhw r10, r4, r10			; P8BE-NEXT: addi r3, r3, .LCPI0_3@toc@l
	; P8BE-NEXT: srwi r11, r3, 31			; P8BE-NEXT: lxvw4x v0, 0, r3
	; P8BE-NEXT: srawi r3, r3, 8			; P8BE-NEXT: vsrah v3, v3, v4
	; P8BE-NEXT: add r3, r3, r11			; P8BE-NEXT: vspltish v4, 15
	; P8BE-NEXT: srwi r11, r8, 31			; P8BE-NEXT: vsrh v4, v3, v4
	; P8BE-NEXT: sub r9, r9, r7			; P8BE-NEXT: vadduhm v3, v3, v4
	; P8BE-NEXT: srawi r8, r8, 5			; P8BE-NEXT: vmladduhm v3, v3, v0, v5
	; P8BE-NEXT: add r10, r10, r4			; P8BE-NEXT: vsubuhm v2, v2, v3
	; P8BE-NEXT: add r8, r8, r11
	; P8BE-NEXT: srwi r11, r9, 31
	; P8BE-NEXT: srawi r9, r9, 6
	; P8BE-NEXT: mulli r3, r3, -1003
	; P8BE-NEXT: add r9, r9, r11
	; P8BE-NEXT: srwi r11, r10, 31
	; P8BE-NEXT: srawi r10, r10, 6
	; P8BE-NEXT: mulli r8, r8, 98
	; P8BE-NEXT: add r10, r10, r11
	; P8BE-NEXT: mulli r9, r9, -124
	; P8BE-NEXT: mulli r10, r10, 95
	; P8BE-NEXT: sub r3, r5, r3
	; P8BE-NEXT: sldi r3, r3, 48
	; P8BE-NEXT: sub r5, r6, r8
	; P8BE-NEXT: mtvsrd v2, r3
	; P8BE-NEXT: sub r6, r7, r9
	; P8BE-NEXT: sldi r3, r5, 48
	; P8BE-NEXT: sub r4, r4, r10
	; P8BE-NEXT: mtvsrd v3, r3
	; P8BE-NEXT: sldi r3, r6, 48
	; P8BE-NEXT: sldi r4, r4, 48
	; P8BE-NEXT: mtvsrd v4, r3
	; P8BE-NEXT: mtvsrd v5, r4
	; P8BE-NEXT: vmrghh v2, v3, v2
	; P8BE-NEXT: vmrghh v3, v5, v4
	; P8BE-NEXT: vmrghw v2, v3, v2
	; P8BE-NEXT: blr			; P8BE-NEXT: blr
	%1 = srem <4 x i16> %x, <i16 95, i16 -124, i16 98, i16 -1003>			%1 = srem <4 x i16> %x, <i16 95, i16 -124, i16 98, i16 -1003>
	ret <4 x i16> %1			ret <4 x i16> %1
	}			}

	define <4 x i16> @fold_srem_vec_2(<4 x i16> %x) {			define <4 x i16> @fold_srem_vec_2(<4 x i16> %x) {
	; P9LE-LABEL: fold_srem_vec_2:			; P9LE-LABEL: fold_srem_vec_2:
	; P9LE: # %bb.0:			; P9LE: # %bb.0:
	; P9LE-NEXT: li r3, 0			; P9LE-NEXT: addis r3, r2, .LCPI1_0@toc@ha
	; P9LE-NEXT: lis r4, -21386			; P9LE-NEXT: vmrglh v4, v2, v2
	; P9LE-NEXT: vextuhrx r3, r3, v2			; P9LE-NEXT: vxor v5, v5, v5
	; P9LE-NEXT: ori r4, r4, 37253			; P9LE-NEXT: addi r3, r3, .LCPI1_0@toc@l
	; P9LE-NEXT: extsh r3, r3			; P9LE-NEXT: vextsh2w v4, v4
	; P9LE-NEXT: mulhw r5, r3, r4			; P9LE-NEXT: lxvx v3, 0, r3
	; P9LE-NEXT: add r5, r5, r3			; P9LE-NEXT: addis r3, r2, .LCPI1_1@toc@ha
	; P9LE-NEXT: srwi r6, r5, 31			; P9LE-NEXT: addi r3, r3, .LCPI1_1@toc@l
	; P9LE-NEXT: srawi r5, r5, 6			; P9LE-NEXT: vmuluwm v3, v4, v3
	; P9LE-NEXT: add r5, r5, r6			; P9LE-NEXT: vspltisw v4, 8
	; P9LE-NEXT: mulli r5, r5, 95			; P9LE-NEXT: vadduwm v4, v4, v4
	; P9LE-NEXT: sub r3, r3, r5			; P9LE-NEXT: vsrw v3, v3, v4
	; P9LE-NEXT: mtvsrd v3, r3			; P9LE-NEXT: vspltish v4, 6
	; P9LE-NEXT: li r3, 2			; P9LE-NEXT: vpkuwum v3, v3, v3
	; P9LE-NEXT: vextuhrx r3, r3, v2			; P9LE-NEXT: vadduhm v3, v3, v2
	; P9LE-NEXT: extsh r3, r3			; P9LE-NEXT: vsrah v3, v3, v4
	; P9LE-NEXT: mulhw r5, r3, r4			; P9LE-NEXT: vspltish v4, 15
	; P9LE-NEXT: add r5, r5, r3			; P9LE-NEXT: vsrh v4, v3, v4
	; P9LE-NEXT: srwi r6, r5, 31			; P9LE-NEXT: vadduhm v3, v3, v4
	; P9LE-NEXT: srawi r5, r5, 6			; P9LE-NEXT: lxvx v4, 0, r3
	; P9LE-NEXT: add r5, r5, r6			; P9LE-NEXT: vmladduhm v3, v3, v4, v5
	; P9LE-NEXT: mulli r5, r5, 95			; P9LE-NEXT: vsubuhm v2, v2, v3
	; P9LE-NEXT: sub r3, r3, r5
	; P9LE-NEXT: mtvsrd v4, r3
	; P9LE-NEXT: li r3, 4
	; P9LE-NEXT: vextuhrx r3, r3, v2
	; P9LE-NEXT: vmrghh v3, v4, v3
	; P9LE-NEXT: extsh r3, r3
	; P9LE-NEXT: mulhw r5, r3, r4
	; P9LE-NEXT: add r5, r5, r3
	; P9LE-NEXT: srwi r6, r5, 31
	; P9LE-NEXT: srawi r5, r5, 6
	; P9LE-NEXT: add r5, r5, r6
	; P9LE-NEXT: mulli r5, r5, 95
	; P9LE-NEXT: sub r3, r3, r5
	; P9LE-NEXT: mtvsrd v4, r3
	; P9LE-NEXT: li r3, 6
	; P9LE-NEXT: vextuhrx r3, r3, v2
	; P9LE-NEXT: extsh r3, r3
	; P9LE-NEXT: mulhw r4, r3, r4
	; P9LE-NEXT: add r4, r4, r3
	; P9LE-NEXT: srwi r5, r4, 31
	; P9LE-NEXT: srawi r4, r4, 6
	; P9LE-NEXT: add r4, r4, r5
	; P9LE-NEXT: mulli r4, r4, 95
	; P9LE-NEXT: sub r3, r3, r4
	; P9LE-NEXT: mtvsrd v2, r3
	; P9LE-NEXT: vmrghh v2, v2, v4
	; P9LE-NEXT: vmrglw v2, v2, v3
	; P9LE-NEXT: blr			; P9LE-NEXT: blr
	;			;
	; P9BE-LABEL: fold_srem_vec_2:			; P9BE-LABEL: fold_srem_vec_2:
	; P9BE: # %bb.0:			; P9BE: # %bb.0:
	; P9BE-NEXT: li r3, 6			; P9BE-NEXT: addis r3, r2, .LCPI1_0@toc@ha
	; P9BE-NEXT: lis r4, -21386			; P9BE-NEXT: vmrghh v4, v2, v2
	; P9BE-NEXT: vextuhlx r3, r3, v2			; P9BE-NEXT: vxor v5, v5, v5
	; P9BE-NEXT: ori r4, r4, 37253			; P9BE-NEXT: addi r3, r3, .LCPI1_0@toc@l
	; P9BE-NEXT: extsh r3, r3			; P9BE-NEXT: vextsh2w v4, v4
	; P9BE-NEXT: mulhw r5, r3, r4			; P9BE-NEXT: lxvx v3, 0, r3
	; P9BE-NEXT: add r5, r5, r3			; P9BE-NEXT: addis r3, r2, .LCPI1_1@toc@ha
	; P9BE-NEXT: srwi r6, r5, 31			; P9BE-NEXT: addi r3, r3, .LCPI1_1@toc@l
	; P9BE-NEXT: srawi r5, r5, 6			; P9BE-NEXT: vmuluwm v3, v4, v3
	; P9BE-NEXT: add r5, r5, r6			; P9BE-NEXT: vspltisw v4, 8
	; P9BE-NEXT: mulli r5, r5, 95			; P9BE-NEXT: vadduwm v4, v4, v4
	; P9BE-NEXT: sub r3, r3, r5			; P9BE-NEXT: vsrw v3, v3, v4
	; P9BE-NEXT: sldi r3, r3, 48			; P9BE-NEXT: vspltish v4, 6
	; P9BE-NEXT: mtvsrd v3, r3			; P9BE-NEXT: vpkuwum v3, v3, v3
	; P9BE-NEXT: li r3, 4			; P9BE-NEXT: vadduhm v3, v3, v2
	; P9BE-NEXT: vextuhlx r3, r3, v2			; P9BE-NEXT: vsrah v3, v3, v4
	; P9BE-NEXT: extsh r3, r3			; P9BE-NEXT: vspltish v4, 15
	; P9BE-NEXT: mulhw r5, r3, r4			; P9BE-NEXT: vsrh v4, v3, v4
	; P9BE-NEXT: add r5, r5, r3			; P9BE-NEXT: vadduhm v3, v3, v4
	; P9BE-NEXT: srwi r6, r5, 31			; P9BE-NEXT: lxvx v4, 0, r3
	; P9BE-NEXT: srawi r5, r5, 6			; P9BE-NEXT: vmladduhm v3, v3, v4, v5
	; P9BE-NEXT: add r5, r5, r6			; P9BE-NEXT: vsubuhm v2, v2, v3
	; P9BE-NEXT: mulli r5, r5, 95
	; P9BE-NEXT: sub r3, r3, r5
	; P9BE-NEXT: sldi r3, r3, 48
	; P9BE-NEXT: mtvsrd v4, r3
	; P9BE-NEXT: li r3, 2
	; P9BE-NEXT: vextuhlx r3, r3, v2
	; P9BE-NEXT: vmrghh v3, v4, v3
	; P9BE-NEXT: extsh r3, r3
	; P9BE-NEXT: mulhw r5, r3, r4
	; P9BE-NEXT: add r5, r5, r3
	; P9BE-NEXT: srwi r6, r5, 31
	; P9BE-NEXT: srawi r5, r5, 6
	; P9BE-NEXT: add r5, r5, r6
	; P9BE-NEXT: mulli r5, r5, 95
	; P9BE-NEXT: sub r3, r3, r5
	; P9BE-NEXT: sldi r3, r3, 48
	; P9BE-NEXT: mtvsrd v4, r3
	; P9BE-NEXT: li r3, 0
	; P9BE-NEXT: vextuhlx r3, r3, v2
	; P9BE-NEXT: extsh r3, r3
	; P9BE-NEXT: mulhw r4, r3, r4
	; P9BE-NEXT: add r4, r4, r3
	; P9BE-NEXT: srwi r5, r4, 31
	; P9BE-NEXT: srawi r4, r4, 6
	; P9BE-NEXT: add r4, r4, r5
	; P9BE-NEXT: mulli r4, r4, 95
	; P9BE-NEXT: sub r3, r3, r4
	; P9BE-NEXT: sldi r3, r3, 48
	; P9BE-NEXT: mtvsrd v2, r3
	; P9BE-NEXT: vmrghh v2, v2, v4
	; P9BE-NEXT: vmrghw v2, v2, v3
	; P9BE-NEXT: blr			; P9BE-NEXT: blr
	;			;
	; P8LE-LABEL: fold_srem_vec_2:			; P8LE-LABEL: fold_srem_vec_2:
	; P8LE: # %bb.0:			; P8LE: # %bb.0:
	; P8LE-NEXT: xxswapd vs0, v2			; P8LE-NEXT: vmrglh v3, v2, v2
	; P8LE-NEXT: lis r3, -21386			; P8LE-NEXT: vspltisw v4, 8
	; P8LE-NEXT: ori r3, r3, 37253			; P8LE-NEXT: addis r3, r2, .LCPI1_0@toc@ha
	; P8LE-NEXT: mffprd r4, f0			; P8LE-NEXT: addi r3, r3, .LCPI1_0@toc@l
	; P8LE-NEXT: clrldi r5, r4, 48			; P8LE-NEXT: lvx v5, 0, r3
	; P8LE-NEXT: rldicl r6, r4, 48, 48			; P8LE-NEXT: addis r3, r2, .LCPI1_1@toc@ha
	; P8LE-NEXT: extsh r5, r5			; P8LE-NEXT: vadduwm v4, v4, v4
	; P8LE-NEXT: rldicl r7, r4, 32, 48			; P8LE-NEXT: addi r3, r3, .LCPI1_1@toc@l
	; P8LE-NEXT: extsh r6, r6			; P8LE-NEXT: vslw v3, v3, v4
	; P8LE-NEXT: mulhw r8, r5, r3			; P8LE-NEXT: vsraw v3, v3, v4
	; P8LE-NEXT: rldicl r4, r4, 16, 48			; P8LE-NEXT: vmuluwm v3, v3, v5
	; P8LE-NEXT: extsh r7, r7			; P8LE-NEXT: vxor v5, v5, v5
	; P8LE-NEXT: mulhw r9, r6, r3			; P8LE-NEXT: vsrw v3, v3, v4
	; P8LE-NEXT: extsh r4, r4			; P8LE-NEXT: vspltish v4, 6
	; P8LE-NEXT: mulhw r10, r7, r3			; P8LE-NEXT: vpkuwum v3, v3, v3
	; P8LE-NEXT: mulhw r3, r4, r3			; P8LE-NEXT: vadduhm v3, v3, v2
	; P8LE-NEXT: add r8, r8, r5			; P8LE-NEXT: vsrah v3, v3, v4
	; P8LE-NEXT: add r9, r9, r6			; P8LE-NEXT: vspltish v4, 15
	; P8LE-NEXT: srwi r11, r8, 31			; P8LE-NEXT: vsrh v4, v3, v4
	; P8LE-NEXT: srawi r8, r8, 6			; P8LE-NEXT: vadduhm v3, v3, v4
	; P8LE-NEXT: add r10, r10, r7			; P8LE-NEXT: lvx v4, 0, r3
	; P8LE-NEXT: add r3, r3, r4			; P8LE-NEXT: vmladduhm v3, v3, v4, v5
	; P8LE-NEXT: add r8, r8, r11			; P8LE-NEXT: vsubuhm v2, v2, v3
	; P8LE-NEXT: srwi r11, r9, 31
	; P8LE-NEXT: srawi r9, r9, 6
	; P8LE-NEXT: mulli r8, r8, 95
	; P8LE-NEXT: add r9, r9, r11
	; P8LE-NEXT: srwi r11, r10, 31
	; P8LE-NEXT: srawi r10, r10, 6
	; P8LE-NEXT: mulli r9, r9, 95
	; P8LE-NEXT: add r10, r10, r11
	; P8LE-NEXT: srwi r11, r3, 31
	; P8LE-NEXT: srawi r3, r3, 6
	; P8LE-NEXT: mulli r10, r10, 95
	; P8LE-NEXT: sub r5, r5, r8
	; P8LE-NEXT: add r3, r3, r11
	; P8LE-NEXT: mtvsrd v2, r5
	; P8LE-NEXT: mulli r3, r3, 95
	; P8LE-NEXT: sub r6, r6, r9
	; P8LE-NEXT: mtvsrd v3, r6
	; P8LE-NEXT: sub r5, r7, r10
	; P8LE-NEXT: mtvsrd v4, r5
	; P8LE-NEXT: sub r3, r4, r3
	; P8LE-NEXT: vmrghh v2, v3, v2
	; P8LE-NEXT: mtvsrd v5, r3
	; P8LE-NEXT: vmrghh v3, v5, v4
	; P8LE-NEXT: vmrglw v2, v3, v2
	; P8LE-NEXT: blr			; P8LE-NEXT: blr
	;			;
	; P8BE-LABEL: fold_srem_vec_2:			; P8BE-LABEL: fold_srem_vec_2:
	; P8BE: # %bb.0:			; P8BE: # %bb.0:
	; P8BE-NEXT: mfvsrd r4, v2			; P8BE-NEXT: vmrghh v3, v2, v2
	; P8BE-NEXT: lis r3, -21386			; P8BE-NEXT: vspltisw v4, 8
	; P8BE-NEXT: ori r3, r3, 37253			; P8BE-NEXT: addis r3, r2, .LCPI1_0@toc@ha
	; P8BE-NEXT: clrldi r5, r4, 48			; P8BE-NEXT: addi r3, r3, .LCPI1_0@toc@l
	; P8BE-NEXT: rldicl r6, r4, 48, 48			; P8BE-NEXT: lxvw4x v5, 0, r3
	; P8BE-NEXT: extsh r5, r5			; P8BE-NEXT: addis r3, r2, .LCPI1_1@toc@ha
	; P8BE-NEXT: rldicl r7, r4, 32, 48			; P8BE-NEXT: vadduwm v4, v4, v4
	; P8BE-NEXT: extsh r6, r6			; P8BE-NEXT: addi r3, r3, .LCPI1_1@toc@l
	; P8BE-NEXT: mulhw r8, r5, r3			; P8BE-NEXT: lxvw4x v0, 0, r3
	; P8BE-NEXT: rldicl r4, r4, 16, 48			; P8BE-NEXT: vslw v3, v3, v4
	; P8BE-NEXT: extsh r7, r7			; P8BE-NEXT: vsraw v3, v3, v4
	; P8BE-NEXT: mulhw r9, r6, r3			; P8BE-NEXT: vmuluwm v3, v3, v5
	; P8BE-NEXT: extsh r4, r4			; P8BE-NEXT: vxor v5, v5, v5
	; P8BE-NEXT: mulhw r10, r7, r3			; P8BE-NEXT: vsrw v3, v3, v4
	; P8BE-NEXT: mulhw r3, r4, r3			; P8BE-NEXT: vspltish v4, 6
	; P8BE-NEXT: add r8, r8, r5			; P8BE-NEXT: vpkuwum v3, v3, v3
	; P8BE-NEXT: add r9, r9, r6			; P8BE-NEXT: vadduhm v3, v3, v2
	; P8BE-NEXT: srwi r11, r8, 31			; P8BE-NEXT: vsrah v3, v3, v4
	; P8BE-NEXT: srawi r8, r8, 6			; P8BE-NEXT: vspltish v4, 15
	; P8BE-NEXT: add r10, r10, r7			; P8BE-NEXT: vsrh v4, v3, v4
	; P8BE-NEXT: add r3, r3, r4			; P8BE-NEXT: vadduhm v3, v3, v4
	; P8BE-NEXT: add r8, r8, r11			; P8BE-NEXT: vmladduhm v3, v3, v0, v5
	; P8BE-NEXT: srwi r11, r9, 31			; P8BE-NEXT: vsubuhm v2, v2, v3
	; P8BE-NEXT: srawi r9, r9, 6
	; P8BE-NEXT: mulli r8, r8, 95
	; P8BE-NEXT: add r9, r9, r11
	; P8BE-NEXT: srwi r11, r10, 31
	; P8BE-NEXT: srawi r10, r10, 6
	; P8BE-NEXT: mulli r9, r9, 95
	; P8BE-NEXT: add r10, r10, r11
	; P8BE-NEXT: srwi r11, r3, 31
	; P8BE-NEXT: srawi r3, r3, 6
	; P8BE-NEXT: mulli r10, r10, 95
	; P8BE-NEXT: sub r5, r5, r8
	; P8BE-NEXT: add r3, r3, r11
	; P8BE-NEXT: sldi r5, r5, 48
	; P8BE-NEXT: mulli r3, r3, 95
	; P8BE-NEXT: sub r6, r6, r9
	; P8BE-NEXT: mtvsrd v2, r5
	; P8BE-NEXT: sldi r6, r6, 48
	; P8BE-NEXT: sub r7, r7, r10
	; P8BE-NEXT: mtvsrd v3, r6
	; P8BE-NEXT: sub r3, r4, r3
	; P8BE-NEXT: sldi r4, r7, 48
	; P8BE-NEXT: vmrghh v2, v3, v2
	; P8BE-NEXT: sldi r3, r3, 48
	; P8BE-NEXT: mtvsrd v4, r4
	; P8BE-NEXT: mtvsrd v5, r3
	; P8BE-NEXT: vmrghh v3, v5, v4
	; P8BE-NEXT: vmrghw v2, v3, v2
	; P8BE-NEXT: blr			; P8BE-NEXT: blr
	%1 = srem <4 x i16> %x, <i16 95, i16 95, i16 95, i16 95>			%1 = srem <4 x i16> %x, <i16 95, i16 95, i16 95, i16 95>
	ret <4 x i16> %1			ret <4 x i16> %1
	}			}


	; Don't fold if we can combine srem with sdiv.			; Don't fold if we can combine srem with sdiv.
	define <4 x i16> @combine_srem_sdiv(<4 x i16> %x) {			define <4 x i16> @combine_srem_sdiv(<4 x i16> %x) {
	; P9LE-LABEL: combine_srem_sdiv:			; P9LE-LABEL: combine_srem_sdiv:
	; P9LE: # %bb.0:			; P9LE: # %bb.0:
	; P9LE-NEXT: li r3, 0			; P9LE-NEXT: addis r3, r2, .LCPI2_1@toc@ha
	; P9LE-NEXT: lis r4, -21386			; P9LE-NEXT: vmrglh v4, v2, v2
	; P9LE-NEXT: vextuhrx r3, r3, v2			; P9LE-NEXT: addi r3, r3, .LCPI2_1@toc@l
	; P9LE-NEXT: ori r4, r4, 37253			; P9LE-NEXT: vextsh2w v4, v4
	; P9LE-NEXT: extsh r3, r3			; P9LE-NEXT: lxvx v3, 0, r3
	; P9LE-NEXT: mulhw r5, r3, r4			; P9LE-NEXT: addis r3, r2, .LCPI2_0@toc@ha
	; P9LE-NEXT: add r5, r5, r3			; P9LE-NEXT: addi r3, r3, .LCPI2_0@toc@l
	; P9LE-NEXT: srwi r6, r5, 31			; P9LE-NEXT: lxvx v5, 0, r3
	; P9LE-NEXT: srawi r5, r5, 6			; P9LE-NEXT: vmuluwm v3, v4, v3
	; P9LE-NEXT: add r5, r5, r6			; P9LE-NEXT: vspltisw v4, 8
	; P9LE-NEXT: mulli r6, r5, 95			; P9LE-NEXT: vadduwm v4, v4, v4
	; P9LE-NEXT: sub r3, r3, r6			; P9LE-NEXT: vsrw v3, v3, v4
	; P9LE-NEXT: mtvsrd v3, r3			; P9LE-NEXT: vspltish v4, 6
	; P9LE-NEXT: li r3, 2			; P9LE-NEXT: vpkuwum v3, v3, v3
	; P9LE-NEXT: vextuhrx r3, r3, v2			; P9LE-NEXT: vadduhm v3, v3, v2
	; P9LE-NEXT: extsh r6, r3			; P9LE-NEXT: vsrah v3, v3, v4
	; P9LE-NEXT: mulhw r7, r6, r4			; P9LE-NEXT: vspltish v4, 15
	; P9LE-NEXT: add r6, r7, r6			; P9LE-NEXT: vsrh v4, v3, v4
	; P9LE-NEXT: srwi r7, r6, 31			; P9LE-NEXT: vadduhm v3, v3, v4
	; P9LE-NEXT: srawi r6, r6, 6			; P9LE-NEXT: vxor v4, v4, v4
	; P9LE-NEXT: add r6, r6, r7			; P9LE-NEXT: vmladduhm v4, v3, v5, v4
	; P9LE-NEXT: mulli r7, r6, 95			; P9LE-NEXT: vsubuhm v2, v2, v4
	; P9LE-NEXT: sub r3, r3, r7
	; P9LE-NEXT: mtvsrd v4, r3
	; P9LE-NEXT: li r3, 4
	; P9LE-NEXT: vextuhrx r3, r3, v2
	; P9LE-NEXT: vmrghh v3, v4, v3
	; P9LE-NEXT: extsh r7, r3
	; P9LE-NEXT: mulhw r8, r7, r4
	; P9LE-NEXT: add r7, r8, r7
	; P9LE-NEXT: srwi r8, r7, 31
	; P9LE-NEXT: srawi r7, r7, 6
	; P9LE-NEXT: add r7, r7, r8
	; P9LE-NEXT: mulli r8, r7, 95
	; P9LE-NEXT: sub r3, r3, r8
	; P9LE-NEXT: mtvsrd v4, r3
	; P9LE-NEXT: li r3, 6
	; P9LE-NEXT: vextuhrx r3, r3, v2
	; P9LE-NEXT: extsh r8, r3
	; P9LE-NEXT: mulhw r4, r8, r4
	; P9LE-NEXT: add r4, r4, r8
	; P9LE-NEXT: srwi r8, r4, 31
	; P9LE-NEXT: srawi r4, r4, 6
	; P9LE-NEXT: add r4, r4, r8
	; P9LE-NEXT: mulli r8, r4, 95
	; P9LE-NEXT: mtvsrd v5, r4
	; P9LE-NEXT: sub r3, r3, r8
	; P9LE-NEXT: mtvsrd v2, r3
	; P9LE-NEXT: vmrghh v2, v2, v4
	; P9LE-NEXT: mtvsrd v4, r6
	; P9LE-NEXT: vmrglw v2, v2, v3
	; P9LE-NEXT: mtvsrd v3, r5
	; P9LE-NEXT: vmrghh v3, v4, v3
	; P9LE-NEXT: mtvsrd v4, r7
	; P9LE-NEXT: vmrghh v4, v5, v4
	; P9LE-NEXT: vmrglw v3, v4, v3
	; P9LE-NEXT: vadduhm v2, v2, v3			; P9LE-NEXT: vadduhm v2, v2, v3
	; P9LE-NEXT: blr			; P9LE-NEXT: blr
	;			;
	; P9BE-LABEL: combine_srem_sdiv:			; P9BE-LABEL: combine_srem_sdiv:
	; P9BE: # %bb.0:			; P9BE: # %bb.0:
	; P9BE-NEXT: li r3, 6			; P9BE-NEXT: addis r3, r2, .LCPI2_1@toc@ha
	; P9BE-NEXT: lis r5, -21386			; P9BE-NEXT: vmrghh v4, v2, v2
	; P9BE-NEXT: vextuhlx r3, r3, v2			; P9BE-NEXT: addi r3, r3, .LCPI2_1@toc@l
	; P9BE-NEXT: ori r5, r5, 37253			; P9BE-NEXT: vextsh2w v4, v4
	; P9BE-NEXT: extsh r4, r3			; P9BE-NEXT: lxvx v3, 0, r3
	; P9BE-NEXT: mulhw r6, r4, r5			; P9BE-NEXT: addis r3, r2, .LCPI2_0@toc@ha
	; P9BE-NEXT: add r4, r6, r4			; P9BE-NEXT: addi r3, r3, .LCPI2_0@toc@l
	; P9BE-NEXT: srwi r6, r4, 31			; P9BE-NEXT: lxvx v5, 0, r3
	; P9BE-NEXT: srawi r4, r4, 6			; P9BE-NEXT: vmuluwm v3, v4, v3
	; P9BE-NEXT: add r4, r4, r6			; P9BE-NEXT: vspltisw v4, 8
	; P9BE-NEXT: mulli r6, r4, 95			; P9BE-NEXT: vadduwm v4, v4, v4
	; P9BE-NEXT: sub r3, r3, r6			; P9BE-NEXT: vsrw v3, v3, v4
	; P9BE-NEXT: sldi r3, r3, 48			; P9BE-NEXT: vspltish v4, 6
	; P9BE-NEXT: mtvsrd v3, r3			; P9BE-NEXT: vpkuwum v3, v3, v3
	; P9BE-NEXT: li r3, 4			; P9BE-NEXT: vadduhm v3, v3, v2
	; P9BE-NEXT: vextuhlx r3, r3, v2			; P9BE-NEXT: vsrah v3, v3, v4
	; P9BE-NEXT: extsh r6, r3			; P9BE-NEXT: vspltish v4, 15
	; P9BE-NEXT: mulhw r7, r6, r5			; P9BE-NEXT: vsrh v4, v3, v4
	; P9BE-NEXT: add r6, r7, r6			; P9BE-NEXT: vadduhm v3, v3, v4
	; P9BE-NEXT: srwi r7, r6, 31			; P9BE-NEXT: vxor v4, v4, v4
	; P9BE-NEXT: srawi r6, r6, 6			; P9BE-NEXT: vmladduhm v4, v3, v5, v4
	; P9BE-NEXT: add r6, r6, r7			; P9BE-NEXT: vsubuhm v2, v2, v4
	; P9BE-NEXT: mulli r7, r6, 95
	; P9BE-NEXT: sub r3, r3, r7
	; P9BE-NEXT: sldi r3, r3, 48
	; P9BE-NEXT: mtvsrd v4, r3
	; P9BE-NEXT: li r3, 2
	; P9BE-NEXT: vextuhlx r3, r3, v2
	; P9BE-NEXT: vmrghh v3, v4, v3
	; P9BE-NEXT: extsh r7, r3
	; P9BE-NEXT: mulhw r8, r7, r5
	; P9BE-NEXT: add r7, r8, r7
	; P9BE-NEXT: srwi r8, r7, 31
	; P9BE-NEXT: srawi r7, r7, 6
	; P9BE-NEXT: add r7, r7, r8
	; P9BE-NEXT: mulli r8, r7, 95
	; P9BE-NEXT: sub r3, r3, r8
	; P9BE-NEXT: sldi r3, r3, 48
	; P9BE-NEXT: mtvsrd v4, r3
	; P9BE-NEXT: li r3, 0
	; P9BE-NEXT: vextuhlx r3, r3, v2
	; P9BE-NEXT: extsh r3, r3
	; P9BE-NEXT: mulhw r5, r3, r5
	; P9BE-NEXT: add r5, r5, r3
	; P9BE-NEXT: srwi r8, r5, 31
	; P9BE-NEXT: srawi r5, r5, 6
	; P9BE-NEXT: add r5, r5, r8
	; P9BE-NEXT: mulli r8, r5, 95
	; P9BE-NEXT: sub r3, r3, r8
	; P9BE-NEXT: sldi r3, r3, 48
	; P9BE-NEXT: mtvsrd v2, r3
	; P9BE-NEXT: sldi r3, r4, 48
	; P9BE-NEXT: vmrghh v2, v2, v4
	; P9BE-NEXT: vmrghw v2, v2, v3
	; P9BE-NEXT: mtvsrd v3, r3
	; P9BE-NEXT: sldi r3, r6, 48
	; P9BE-NEXT: mtvsrd v4, r3
	; P9BE-NEXT: sldi r3, r7, 48
	; P9BE-NEXT: vmrghh v3, v4, v3
	; P9BE-NEXT: mtvsrd v4, r3
	; P9BE-NEXT: sldi r3, r5, 48
	; P9BE-NEXT: mtvsrd v5, r3
	; P9BE-NEXT: vmrghh v4, v5, v4
	; P9BE-NEXT: vmrghw v3, v4, v3
	; P9BE-NEXT: vadduhm v2, v2, v3			; P9BE-NEXT: vadduhm v2, v2, v3
	; P9BE-NEXT: blr			; P9BE-NEXT: blr
	;			;
	; P8LE-LABEL: combine_srem_sdiv:			; P8LE-LABEL: combine_srem_sdiv:
	; P8LE: # %bb.0:			; P8LE: # %bb.0:
	; P8LE-NEXT: xxswapd vs0, v2			; P8LE-NEXT: vmrglh v3, v2, v2
	; P8LE-NEXT: lis r3, -21386			; P8LE-NEXT: vspltisw v4, 8
	; P8LE-NEXT: ori r3, r3, 37253			; P8LE-NEXT: addis r3, r2, .LCPI2_1@toc@ha
	; P8LE-NEXT: mffprd r4, f0			; P8LE-NEXT: addi r3, r3, .LCPI2_1@toc@l
	; P8LE-NEXT: clrldi r5, r4, 48			; P8LE-NEXT: lvx v5, 0, r3
	; P8LE-NEXT: rldicl r6, r4, 48, 48			; P8LE-NEXT: addis r3, r2, .LCPI2_0@toc@ha
	; P8LE-NEXT: rldicl r7, r4, 32, 48			; P8LE-NEXT: vadduwm v4, v4, v4
	; P8LE-NEXT: extsh r5, r5			; P8LE-NEXT: addi r3, r3, .LCPI2_0@toc@l
	; P8LE-NEXT: extsh r8, r6			; P8LE-NEXT: lvx v0, 0, r3
	; P8LE-NEXT: extsh r9, r7			; P8LE-NEXT: vslw v3, v3, v4
	; P8LE-NEXT: mulhw r10, r5, r3			; P8LE-NEXT: vsraw v3, v3, v4
	; P8LE-NEXT: mulhw r11, r8, r3			; P8LE-NEXT: vmuluwm v3, v3, v5
	; P8LE-NEXT: rldicl r4, r4, 16, 48			; P8LE-NEXT: vxor v5, v5, v5
	; P8LE-NEXT: mulhw r12, r9, r3			; P8LE-NEXT: vsrw v3, v3, v4
	; P8LE-NEXT: extsh r0, r4			; P8LE-NEXT: vspltish v4, 6
	; P8LE-NEXT: mulhw r3, r0, r3			; P8LE-NEXT: vpkuwum v3, v3, v3
	; P8LE-NEXT: add r10, r10, r5			; P8LE-NEXT: vadduhm v3, v3, v2
	; P8LE-NEXT: add r8, r11, r8			; P8LE-NEXT: vsrah v3, v3, v4
	; P8LE-NEXT: srwi r11, r10, 31			; P8LE-NEXT: vspltish v4, 15
	; P8LE-NEXT: add r9, r12, r9			; P8LE-NEXT: vsrh v4, v3, v4
	; P8LE-NEXT: srawi r10, r10, 6			; P8LE-NEXT: vadduhm v3, v3, v4
	; P8LE-NEXT: srawi r12, r8, 6			; P8LE-NEXT: vmladduhm v4, v3, v0, v5
	; P8LE-NEXT: srwi r8, r8, 31			; P8LE-NEXT: vsubuhm v2, v2, v4
	; P8LE-NEXT: add r10, r10, r11			; P8LE-NEXT: vadduhm v2, v2, v3
	; P8LE-NEXT: add r3, r3, r0
	; P8LE-NEXT: srawi r11, r9, 6
	; P8LE-NEXT: srwi r9, r9, 31
	; P8LE-NEXT: add r8, r12, r8
	; P8LE-NEXT: mtvsrd v2, r10
	; P8LE-NEXT: mulli r12, r10, 95
	; P8LE-NEXT: add r9, r11, r9
	; P8LE-NEXT: srwi r11, r3, 31
	; P8LE-NEXT: mtvsrd v3, r8
	; P8LE-NEXT: srawi r3, r3, 6
	; P8LE-NEXT: mulli r10, r8, 95
	; P8LE-NEXT: mtvsrd v4, r9
	; P8LE-NEXT: add r3, r3, r11
	; P8LE-NEXT: mulli r8, r9, 95
	; P8LE-NEXT: vmrghh v2, v3, v2
	; P8LE-NEXT: mulli r9, r3, 95
	; P8LE-NEXT: sub r5, r5, r12
	; P8LE-NEXT: sub r6, r6, r10
	; P8LE-NEXT: mtvsrd v3, r5
	; P8LE-NEXT: mtvsrd v5, r6
	; P8LE-NEXT: sub r5, r7, r8
	; P8LE-NEXT: sub r4, r4, r9
	; P8LE-NEXT: mtvsrd v0, r5
	; P8LE-NEXT: mtvsrd v1, r4
	; P8LE-NEXT: vmrghh v3, v5, v3
	; P8LE-NEXT: mtvsrd v5, r3
	; P8LE-NEXT: vmrghh v0, v1, v0
	; P8LE-NEXT: vmrghh v4, v5, v4
	; P8LE-NEXT: vmrglw v3, v0, v3
	; P8LE-NEXT: vmrglw v2, v4, v2
	; P8LE-NEXT: vadduhm v2, v3, v2
	; P8LE-NEXT: blr			; P8LE-NEXT: blr
	;			;
	; P8BE-LABEL: combine_srem_sdiv:			; P8BE-LABEL: combine_srem_sdiv:
	; P8BE: # %bb.0:			; P8BE: # %bb.0:
	; P8BE-NEXT: mfvsrd r5, v2			; P8BE-NEXT: vmrghh v3, v2, v2
	; P8BE-NEXT: lis r4, -21386			; P8BE-NEXT: vspltisw v4, 8
	; P8BE-NEXT: ori r4, r4, 37253			; P8BE-NEXT: addis r3, r2, .LCPI2_1@toc@ha
	; P8BE-NEXT: clrldi r3, r5, 48			; P8BE-NEXT: addi r3, r3, .LCPI2_1@toc@l
	; P8BE-NEXT: rldicl r6, r5, 48, 48			; P8BE-NEXT: lxvw4x v5, 0, r3
	; P8BE-NEXT: extsh r8, r3			; P8BE-NEXT: addis r3, r2, .LCPI2_0@toc@ha
	; P8BE-NEXT: rldicl r7, r5, 32, 48			; P8BE-NEXT: vadduwm v4, v4, v4
	; P8BE-NEXT: extsh r9, r6			; P8BE-NEXT: addi r3, r3, .LCPI2_0@toc@l
	; P8BE-NEXT: rldicl r5, r5, 16, 48			; P8BE-NEXT: lxvw4x v0, 0, r3
	; P8BE-NEXT: mulhw r11, r8, r4			; P8BE-NEXT: vslw v3, v3, v4
	; P8BE-NEXT: extsh r10, r7			; P8BE-NEXT: vsraw v3, v3, v4
	; P8BE-NEXT: extsh r5, r5			; P8BE-NEXT: vmuluwm v3, v3, v5
	; P8BE-NEXT: mulhw r12, r9, r4			; P8BE-NEXT: vxor v5, v5, v5
	; P8BE-NEXT: mulhw r0, r10, r4			; P8BE-NEXT: vsrw v3, v3, v4
	; P8BE-NEXT: mulhw r4, r5, r4			; P8BE-NEXT: vspltish v4, 6
	; P8BE-NEXT: add r8, r11, r8			; P8BE-NEXT: vpkuwum v3, v3, v3
	; P8BE-NEXT: add r9, r12, r9			; P8BE-NEXT: vadduhm v3, v3, v2
	; P8BE-NEXT: srawi r11, r8, 6			; P8BE-NEXT: vsrah v3, v3, v4
	; P8BE-NEXT: srwi r8, r8, 31			; P8BE-NEXT: vspltish v4, 15
	; P8BE-NEXT: add r10, r0, r10			; P8BE-NEXT: vsrh v4, v3, v4
	; P8BE-NEXT: add r4, r4, r5			; P8BE-NEXT: vadduhm v3, v3, v4
	; P8BE-NEXT: add r8, r11, r8			; P8BE-NEXT: vmladduhm v4, v3, v0, v5
	; P8BE-NEXT: srawi r12, r9, 6			; P8BE-NEXT: vsubuhm v2, v2, v4
	; P8BE-NEXT: srwi r9, r9, 31			; P8BE-NEXT: vadduhm v2, v2, v3
	; P8BE-NEXT: srawi r0, r10, 6
	; P8BE-NEXT: srawi r11, r4, 6
	; P8BE-NEXT: srwi r10, r10, 31
	; P8BE-NEXT: add r9, r12, r9
	; P8BE-NEXT: srwi r4, r4, 31
	; P8BE-NEXT: mulli r12, r8, 95
	; P8BE-NEXT: add r10, r0, r10
	; P8BE-NEXT: add r4, r11, r4
	; P8BE-NEXT: mulli r0, r9, 95
	; P8BE-NEXT: sldi r9, r9, 48
	; P8BE-NEXT: sldi r8, r8, 48
	; P8BE-NEXT: mtvsrd v3, r9
	; P8BE-NEXT: mulli r9, r4, 95
	; P8BE-NEXT: mtvsrd v2, r8
	; P8BE-NEXT: mulli r8, r10, 95
	; P8BE-NEXT: sldi r10, r10, 48
	; P8BE-NEXT: sub r3, r3, r12
	; P8BE-NEXT: mtvsrd v4, r10
	; P8BE-NEXT: sub r6, r6, r0
	; P8BE-NEXT: sldi r3, r3, 48
	; P8BE-NEXT: vmrghh v2, v3, v2
	; P8BE-NEXT: sldi r6, r6, 48
	; P8BE-NEXT: mtvsrd v3, r3
	; P8BE-NEXT: sub r3, r5, r9
	; P8BE-NEXT: sub r7, r7, r8
	; P8BE-NEXT: mtvsrd v5, r6
	; P8BE-NEXT: sldi r3, r3, 48
	; P8BE-NEXT: sldi r5, r7, 48
	; P8BE-NEXT: mtvsrd v1, r3
	; P8BE-NEXT: sldi r3, r4, 48
	; P8BE-NEXT: mtvsrd v0, r5
	; P8BE-NEXT: vmrghh v3, v5, v3
	; P8BE-NEXT: mtvsrd v5, r3
	; P8BE-NEXT: vmrghh v0, v1, v0
	; P8BE-NEXT: vmrghh v4, v5, v4
	; P8BE-NEXT: vmrghw v3, v0, v3
	; P8BE-NEXT: vmrghw v2, v4, v2
	; P8BE-NEXT: vadduhm v2, v3, v2
	; P8BE-NEXT: blr			; P8BE-NEXT: blr
	%1 = srem <4 x i16> %x, <i16 95, i16 95, i16 95, i16 95>			%1 = srem <4 x i16> %x, <i16 95, i16 95, i16 95, i16 95>
	%2 = sdiv <4 x i16> %x, <i16 95, i16 95, i16 95, i16 95>			%2 = sdiv <4 x i16> %x, <i16 95, i16 95, i16 95, i16 95>
	%3 = add <4 x i16> %1, %2			%3 = add <4 x i16> %1, %2
	ret <4 x i16> %3			ret <4 x i16> %3
	}			}

	; Don't fold for divisors that are a power of two.			; Don't fold for divisors that are a power of two.
	define <4 x i16> @dont_fold_srem_power_of_two(<4 x i16> %x) {			define <4 x i16> @dont_fold_srem_power_of_two(<4 x i16> %x) {
	; P9LE-LABEL: dont_fold_srem_power_of_two:			; P9LE-LABEL: dont_fold_srem_power_of_two:
	; P9LE: # %bb.0:			; P9LE: # %bb.0:
	; P9LE-NEXT: li r3, 0			; P9LE-NEXT: addis r3, r2, .LCPI3_0@toc@ha
	; P9LE-NEXT: vextuhrx r3, r3, v2			; P9LE-NEXT: vmrglh v3, v2, v2
	; P9LE-NEXT: extsh r3, r3			; P9LE-NEXT: vxor v5, v5, v5
	; P9LE-NEXT: srawi r4, r3, 6			; P9LE-NEXT: addi r3, r3, .LCPI3_0@toc@l
	; P9LE-NEXT: addze r4, r4			; P9LE-NEXT: vextsh2w v3, v3
	; P9LE-NEXT: slwi r4, r4, 6			; P9LE-NEXT: lxvx v4, 0, r3
	; P9LE-NEXT: sub r3, r3, r4			; P9LE-NEXT: addis r3, r2, .LCPI3_1@toc@ha
	; P9LE-NEXT: mtvsrd v3, r3			; P9LE-NEXT: addi r3, r3, .LCPI3_1@toc@l
	; P9LE-NEXT: li r3, 2			; P9LE-NEXT: vmuluwm v3, v3, v4
	; P9LE-NEXT: vextuhrx r3, r3, v2			; P9LE-NEXT: vspltisw v4, 8
	; P9LE-NEXT: extsh r3, r3			; P9LE-NEXT: vadduwm v4, v4, v4
	; P9LE-NEXT: srawi r4, r3, 5			; P9LE-NEXT: vsrw v3, v3, v4
	; P9LE-NEXT: addze r4, r4			; P9LE-NEXT: lxvx v4, 0, r3
	; P9LE-NEXT: slwi r4, r4, 5			; P9LE-NEXT: addis r3, r2, .LCPI3_2@toc@ha
	; P9LE-NEXT: sub r3, r3, r4			; P9LE-NEXT: vpkuwum v3, v3, v3
	; P9LE-NEXT: lis r4, -21386			; P9LE-NEXT: addi r3, r3, .LCPI3_2@toc@l
	; P9LE-NEXT: mtvsrd v4, r3			; P9LE-NEXT: vadduhm v3, v3, v2
	; P9LE-NEXT: li r3, 6			; P9LE-NEXT: vsrah v3, v3, v4
	; P9LE-NEXT: ori r4, r4, 37253			; P9LE-NEXT: vspltish v4, 15
	; P9LE-NEXT: vextuhrx r3, r3, v2			; P9LE-NEXT: vsrh v4, v3, v4
	; P9LE-NEXT: vmrghh v3, v4, v3			; P9LE-NEXT: vadduhm v3, v3, v4
	; P9LE-NEXT: extsh r3, r3			; P9LE-NEXT: lxvx v4, 0, r3
	; P9LE-NEXT: mulhw r4, r3, r4			; P9LE-NEXT: vmladduhm v3, v3, v4, v5
	; P9LE-NEXT: add r4, r4, r3			; P9LE-NEXT: vsubuhm v2, v2, v3
	; P9LE-NEXT: srwi r5, r4, 31
	; P9LE-NEXT: srawi r4, r4, 6
	; P9LE-NEXT: add r4, r4, r5
	; P9LE-NEXT: mulli r4, r4, 95
	; P9LE-NEXT: sub r3, r3, r4
	; P9LE-NEXT: mtvsrd v4, r3
	; P9LE-NEXT: li r3, 4
	; P9LE-NEXT: vextuhrx r3, r3, v2
	; P9LE-NEXT: extsh r3, r3
	; P9LE-NEXT: srawi r4, r3, 3
	; P9LE-NEXT: addze r4, r4
	; P9LE-NEXT: slwi r4, r4, 3
	; P9LE-NEXT: sub r3, r3, r4
	; P9LE-NEXT: mtvsrd v2, r3
	; P9LE-NEXT: vmrghh v2, v4, v2
	; P9LE-NEXT: vmrglw v2, v2, v3
	; P9LE-NEXT: blr			; P9LE-NEXT: blr
	;			;
	; P9BE-LABEL: dont_fold_srem_power_of_two:			; P9BE-LABEL: dont_fold_srem_power_of_two:
	; P9BE: # %bb.0:			; P9BE: # %bb.0:
	; P9BE-NEXT: li r3, 2			; P9BE-NEXT: addis r3, r2, .LCPI3_0@toc@ha
	; P9BE-NEXT: vextuhlx r3, r3, v2			; P9BE-NEXT: vmrghh v3, v2, v2
	; P9BE-NEXT: extsh r3, r3			; P9BE-NEXT: vxor v5, v5, v5
	; P9BE-NEXT: srawi r4, r3, 5			; P9BE-NEXT: addi r3, r3, .LCPI3_0@toc@l
	; P9BE-NEXT: addze r4, r4			; P9BE-NEXT: vextsh2w v3, v3
	; P9BE-NEXT: slwi r4, r4, 5			; P9BE-NEXT: lxvx v4, 0, r3
	; P9BE-NEXT: sub r3, r3, r4			; P9BE-NEXT: addis r3, r2, .LCPI3_1@toc@ha
	; P9BE-NEXT: sldi r3, r3, 48			; P9BE-NEXT: addi r3, r3, .LCPI3_1@toc@l
	; P9BE-NEXT: mtvsrd v3, r3			; P9BE-NEXT: vmuluwm v3, v3, v4
	; P9BE-NEXT: li r3, 0			; P9BE-NEXT: vspltisw v4, 8
	; P9BE-NEXT: vextuhlx r3, r3, v2			; P9BE-NEXT: vadduwm v4, v4, v4
	; P9BE-NEXT: extsh r3, r3			; P9BE-NEXT: vsrw v3, v3, v4
	; P9BE-NEXT: srawi r4, r3, 6			; P9BE-NEXT: lxvx v4, 0, r3
	; P9BE-NEXT: addze r4, r4			; P9BE-NEXT: addis r3, r2, .LCPI3_2@toc@ha
	; P9BE-NEXT: slwi r4, r4, 6			; P9BE-NEXT: vpkuwum v3, v3, v3
	; P9BE-NEXT: sub r3, r3, r4			; P9BE-NEXT: addi r3, r3, .LCPI3_2@toc@l
	; P9BE-NEXT: lis r4, -21386			; P9BE-NEXT: vadduhm v3, v3, v2
	; P9BE-NEXT: sldi r3, r3, 48			; P9BE-NEXT: vsrah v3, v3, v4
	; P9BE-NEXT: ori r4, r4, 37253			; P9BE-NEXT: vspltish v4, 15
	; P9BE-NEXT: mtvsrd v4, r3			; P9BE-NEXT: vsrh v4, v3, v4
	; P9BE-NEXT: li r3, 6			; P9BE-NEXT: vadduhm v3, v3, v4
	; P9BE-NEXT: vextuhlx r3, r3, v2			; P9BE-NEXT: lxvx v4, 0, r3
	; P9BE-NEXT: vmrghh v3, v4, v3			; P9BE-NEXT: vmladduhm v3, v3, v4, v5
	; P9BE-NEXT: extsh r3, r3			; P9BE-NEXT: vsubuhm v2, v2, v3
	; P9BE-NEXT: mulhw r4, r3, r4
	; P9BE-NEXT: add r4, r4, r3
	; P9BE-NEXT: srwi r5, r4, 31
	; P9BE-NEXT: srawi r4, r4, 6
	; P9BE-NEXT: add r4, r4, r5
	; P9BE-NEXT: mulli r4, r4, 95
	; P9BE-NEXT: sub r3, r3, r4
	; P9BE-NEXT: sldi r3, r3, 48
	; P9BE-NEXT: mtvsrd v4, r3
	; P9BE-NEXT: li r3, 4
	; P9BE-NEXT: vextuhlx r3, r3, v2
	; P9BE-NEXT: extsh r3, r3
	; P9BE-NEXT: srawi r4, r3, 3
	; P9BE-NEXT: addze r4, r4
	; P9BE-NEXT: slwi r4, r4, 3
	; P9BE-NEXT: sub r3, r3, r4
	; P9BE-NEXT: sldi r3, r3, 48
	; P9BE-NEXT: mtvsrd v2, r3
	; P9BE-NEXT: vmrghh v2, v2, v4
	; P9BE-NEXT: vmrghw v2, v3, v2
	; P9BE-NEXT: blr			; P9BE-NEXT: blr
	;			;
	; P8LE-LABEL: dont_fold_srem_power_of_two:			; P8LE-LABEL: dont_fold_srem_power_of_two:
	; P8LE: # %bb.0:			; P8LE: # %bb.0:
	; P8LE-NEXT: xxswapd vs0, v2			; P8LE-NEXT: vmrglh v3, v2, v2
	; P8LE-NEXT: lis r3, -21386			; P8LE-NEXT: vspltisw v4, 8
	; P8LE-NEXT: ori r3, r3, 37253			; P8LE-NEXT: addis r3, r2, .LCPI3_0@toc@ha
	; P8LE-NEXT: mffprd r4, f0			; P8LE-NEXT: addi r3, r3, .LCPI3_0@toc@l
	; P8LE-NEXT: rldicl r5, r4, 16, 48			; P8LE-NEXT: lvx v5, 0, r3
	; P8LE-NEXT: clrldi r6, r4, 48			; P8LE-NEXT: addis r3, r2, .LCPI3_1@toc@ha
	; P8LE-NEXT: extsh r5, r5			; P8LE-NEXT: vadduwm v4, v4, v4
	; P8LE-NEXT: extsh r6, r6			; P8LE-NEXT: addi r3, r3, .LCPI3_1@toc@l
	; P8LE-NEXT: mulhw r3, r5, r3			; P8LE-NEXT: vslw v3, v3, v4
	; P8LE-NEXT: rldicl r7, r4, 48, 48			; P8LE-NEXT: vsraw v3, v3, v4
	; P8LE-NEXT: srawi r8, r6, 6			; P8LE-NEXT: vmuluwm v3, v3, v5
	; P8LE-NEXT: extsh r7, r7			; P8LE-NEXT: vxor v5, v5, v5
	; P8LE-NEXT: addze r8, r8			; P8LE-NEXT: vsrw v3, v3, v4
	; P8LE-NEXT: rldicl r4, r4, 32, 48			; P8LE-NEXT: lvx v4, 0, r3
	; P8LE-NEXT: srawi r9, r7, 5			; P8LE-NEXT: addis r3, r2, .LCPI3_2@toc@ha
	; P8LE-NEXT: extsh r4, r4			; P8LE-NEXT: addi r3, r3, .LCPI3_2@toc@l
	; P8LE-NEXT: slwi r8, r8, 6			; P8LE-NEXT: vpkuwum v3, v3, v3
	; P8LE-NEXT: add r3, r3, r5			; P8LE-NEXT: vadduhm v3, v3, v2
	; P8LE-NEXT: addze r9, r9			; P8LE-NEXT: vsrah v3, v3, v4
	; P8LE-NEXT: sub r6, r6, r8			; P8LE-NEXT: vspltish v4, 15
	; P8LE-NEXT: srwi r10, r3, 31			; P8LE-NEXT: vsrh v4, v3, v4
	; P8LE-NEXT: srawi r3, r3, 6			; P8LE-NEXT: vadduhm v3, v3, v4
	; P8LE-NEXT: slwi r8, r9, 5			; P8LE-NEXT: lvx v4, 0, r3
	; P8LE-NEXT: mtvsrd v2, r6			; P8LE-NEXT: vmladduhm v3, v3, v4, v5
	; P8LE-NEXT: add r3, r3, r10			; P8LE-NEXT: vsubuhm v2, v2, v3
	; P8LE-NEXT: srawi r9, r4, 3
	; P8LE-NEXT: sub r6, r7, r8
	; P8LE-NEXT: mulli r3, r3, 95
	; P8LE-NEXT: addze r7, r9
	; P8LE-NEXT: mtvsrd v3, r6
	; P8LE-NEXT: vmrghh v2, v3, v2
	; P8LE-NEXT: sub r3, r5, r3
	; P8LE-NEXT: slwi r5, r7, 3
	; P8LE-NEXT: sub r4, r4, r5
	; P8LE-NEXT: mtvsrd v4, r3
	; P8LE-NEXT: mtvsrd v5, r4
	; P8LE-NEXT: vmrghh v3, v4, v5
	; P8LE-NEXT: vmrglw v2, v3, v2
	; P8LE-NEXT: blr			; P8LE-NEXT: blr
	;			;
	; P8BE-LABEL: dont_fold_srem_power_of_two:			; P8BE-LABEL: dont_fold_srem_power_of_two:
	; P8BE: # %bb.0:			; P8BE: # %bb.0:
	; P8BE-NEXT: mfvsrd r4, v2			; P8BE-NEXT: vmrghh v3, v2, v2
	; P8BE-NEXT: lis r3, -21386			; P8BE-NEXT: vspltisw v4, 8
	; P8BE-NEXT: ori r3, r3, 37253			; P8BE-NEXT: addis r3, r2, .LCPI3_0@toc@ha
	; P8BE-NEXT: clrldi r5, r4, 48			; P8BE-NEXT: addi r3, r3, .LCPI3_0@toc@l
	; P8BE-NEXT: rldicl r6, r4, 32, 48			; P8BE-NEXT: lxvw4x v5, 0, r3
	; P8BE-NEXT: extsh r5, r5			; P8BE-NEXT: addis r3, r2, .LCPI3_1@toc@ha
	; P8BE-NEXT: extsh r6, r6			; P8BE-NEXT: vadduwm v4, v4, v4
	; P8BE-NEXT: mulhw r3, r5, r3			; P8BE-NEXT: addi r3, r3, .LCPI3_1@toc@l
	; P8BE-NEXT: rldicl r7, r4, 16, 48			; P8BE-NEXT: vslw v3, v3, v4
	; P8BE-NEXT: srawi r8, r6, 5			; P8BE-NEXT: vsraw v3, v3, v4
	; P8BE-NEXT: extsh r7, r7			; P8BE-NEXT: vmuluwm v3, v3, v5
	; P8BE-NEXT: addze r8, r8			; P8BE-NEXT: vxor v5, v5, v5
	; P8BE-NEXT: rldicl r4, r4, 48, 48			; P8BE-NEXT: vsrw v3, v3, v4
	; P8BE-NEXT: srawi r9, r7, 6			; P8BE-NEXT: lxvw4x v4, 0, r3
	; P8BE-NEXT: extsh r4, r4			; P8BE-NEXT: addis r3, r2, .LCPI3_2@toc@ha
	; P8BE-NEXT: slwi r8, r8, 5			; P8BE-NEXT: addi r3, r3, .LCPI3_2@toc@l
	; P8BE-NEXT: add r3, r3, r5			; P8BE-NEXT: lxvw4x v0, 0, r3
	; P8BE-NEXT: addze r9, r9			; P8BE-NEXT: vpkuwum v3, v3, v3
	; P8BE-NEXT: sub r6, r6, r8			; P8BE-NEXT: vadduhm v3, v3, v2
	; P8BE-NEXT: srwi r10, r3, 31			; P8BE-NEXT: vsrah v3, v3, v4
	; P8BE-NEXT: srawi r3, r3, 6			; P8BE-NEXT: vspltish v4, 15
	; P8BE-NEXT: slwi r8, r9, 6			; P8BE-NEXT: vsrh v4, v3, v4
	; P8BE-NEXT: add r3, r3, r10			; P8BE-NEXT: vadduhm v3, v3, v4
	; P8BE-NEXT: srawi r9, r4, 3			; P8BE-NEXT: vmladduhm v3, v3, v0, v5
	; P8BE-NEXT: sub r7, r7, r8			; P8BE-NEXT: vsubuhm v2, v2, v3
	; P8BE-NEXT: mulli r3, r3, 95
	; P8BE-NEXT: sldi r6, r6, 48
	; P8BE-NEXT: addze r8, r9
	; P8BE-NEXT: mtvsrd v2, r6
	; P8BE-NEXT: slwi r6, r8, 3
	; P8BE-NEXT: sub r4, r4, r6
	; P8BE-NEXT: sldi r4, r4, 48
	; P8BE-NEXT: sub r3, r5, r3
	; P8BE-NEXT: sldi r5, r7, 48
	; P8BE-NEXT: mtvsrd v5, r4
	; P8BE-NEXT: sldi r3, r3, 48
	; P8BE-NEXT: mtvsrd v3, r5
	; P8BE-NEXT: mtvsrd v4, r3
	; P8BE-NEXT: vmrghh v2, v3, v2
	; P8BE-NEXT: vmrghh v3, v5, v4
	; P8BE-NEXT: vmrghw v2, v2, v3
	; P8BE-NEXT: blr			; P8BE-NEXT: blr
	%1 = srem <4 x i16> %x, <i16 64, i16 32, i16 8, i16 95>			%1 = srem <4 x i16> %x, <i16 64, i16 32, i16 8, i16 95>
	ret <4 x i16> %1			ret <4 x i16> %1
	}			}

	; Don't fold if the divisor is one.			; Don't fold if the divisor is one.
	define <4 x i16> @dont_fold_srem_one(<4 x i16> %x) {			define <4 x i16> @dont_fold_srem_one(<4 x i16> %x) {
	; P9LE-LABEL: dont_fold_srem_one:			; P9LE-LABEL: dont_fold_srem_one:
	; P9LE: # %bb.0:			; P9LE: # %bb.0:
	; P9LE-NEXT: li r3, 2			; P9LE-NEXT: addis r3, r2, .LCPI4_0@toc@ha
	; P9LE-NEXT: lis r4, -14230			; P9LE-NEXT: vmrglh v5, v2, v2
	; P9LE-NEXT: vextuhrx r3, r3, v2			; P9LE-NEXT: vspltisw v3, -16
	; P9LE-NEXT: ori r4, r4, 30865			; P9LE-NEXT: addi r3, r3, .LCPI4_0@toc@l
	; P9LE-NEXT: extsh r3, r3			; P9LE-NEXT: vextsh2w v5, v5
	; P9LE-NEXT: mulhw r4, r3, r4			; P9LE-NEXT: vsrw v3, v3, v3
	; P9LE-NEXT: add r4, r4, r3			; P9LE-NEXT: lxvx v4, 0, r3
	; P9LE-NEXT: srwi r5, r4, 31			; P9LE-NEXT: addis r3, r2, .LCPI4_1@toc@ha
	; P9LE-NEXT: srawi r4, r4, 9			; P9LE-NEXT: xxland v3, v2, v3
	; P9LE-NEXT: add r4, r4, r5			; P9LE-NEXT: addi r3, r3, .LCPI4_1@toc@l
	; P9LE-NEXT: mulli r4, r4, 654			; P9LE-NEXT: vmuluwm v4, v5, v4
	; P9LE-NEXT: sub r3, r3, r4			; P9LE-NEXT: vspltisw v5, 8
	; P9LE-NEXT: lis r4, -19946			; P9LE-NEXT: vadduwm v5, v5, v5
	; P9LE-NEXT: mtvsrd v3, r3			; P9LE-NEXT: vsrw v4, v4, v5
	; P9LE-NEXT: li r3, 0			; P9LE-NEXT: vxor v5, v5, v5
	; P9LE-NEXT: ori r4, r4, 17097			; P9LE-NEXT: vpkuwum v4, v4, v4
	; P9LE-NEXT: mtvsrd v4, r3			; P9LE-NEXT: vadduhm v3, v4, v3
	; P9LE-NEXT: li r3, 4			; P9LE-NEXT: lxvx v4, 0, r3
	; P9LE-NEXT: vextuhrx r3, r3, v2			; P9LE-NEXT: addis r3, r2, .LCPI4_2@toc@ha
	; P9LE-NEXT: vmrghh v3, v3, v4			; P9LE-NEXT: addi r3, r3, .LCPI4_2@toc@l
	; P9LE-NEXT: extsh r3, r3			; P9LE-NEXT: lxvx vs0, 0, r3
	; P9LE-NEXT: mulhw r4, r3, r4			; P9LE-NEXT: addis r3, r2, .LCPI4_3@toc@ha
	; P9LE-NEXT: add r4, r4, r3			; P9LE-NEXT: addi r3, r3, .LCPI4_3@toc@l
	; P9LE-NEXT: srwi r5, r4, 31			; P9LE-NEXT: vsrah v3, v3, v4
	; P9LE-NEXT: srawi r4, r4, 4			; P9LE-NEXT: vspltish v4, 15
	; P9LE-NEXT: add r4, r4, r5			; P9LE-NEXT: vsrh v4, v3, v4
	; P9LE-NEXT: mulli r4, r4, 23			; P9LE-NEXT: xxland v4, v4, vs0
	; P9LE-NEXT: sub r3, r3, r4			; P9LE-NEXT: vadduhm v3, v3, v4
	; P9LE-NEXT: lis r4, 24749			; P9LE-NEXT: lxvx v4, 0, r3
	; P9LE-NEXT: mtvsrd v4, r3			; P9LE-NEXT: vmladduhm v3, v3, v4, v5
	; P9LE-NEXT: li r3, 6			; P9LE-NEXT: vsubuhm v2, v2, v3
	; P9LE-NEXT: ori r4, r4, 47143
	; P9LE-NEXT: vextuhrx r3, r3, v2
	; P9LE-NEXT: extsh r3, r3
	; P9LE-NEXT: mulhw r4, r3, r4
	; P9LE-NEXT: srwi r5, r4, 31
	; P9LE-NEXT: srawi r4, r4, 11
	; P9LE-NEXT: add r4, r4, r5
	; P9LE-NEXT: mulli r4, r4, 5423
	; P9LE-NEXT: sub r3, r3, r4
	; P9LE-NEXT: mtvsrd v2, r3
	; P9LE-NEXT: vmrghh v2, v2, v4
	; P9LE-NEXT: vmrglw v2, v2, v3
	; P9LE-NEXT: blr			; P9LE-NEXT: blr
	;			;
	; P9BE-LABEL: dont_fold_srem_one:			; P9BE-LABEL: dont_fold_srem_one:
	; P9BE: # %bb.0:			; P9BE: # %bb.0:
	; P9BE-NEXT: li r3, 4			; P9BE-NEXT: addis r3, r2, .LCPI4_0@toc@ha
	; P9BE-NEXT: lis r4, -19946			; P9BE-NEXT: vmrghh v5, v2, v2
	; P9BE-NEXT: vextuhlx r3, r3, v2			; P9BE-NEXT: addi r3, r3, .LCPI4_0@toc@l
	; P9BE-NEXT: ori r4, r4, 17097			; P9BE-NEXT: vextsh2w v5, v5
	; P9BE-NEXT: extsh r3, r3			; P9BE-NEXT: lxvx vs0, 0, r3
	; P9BE-NEXT: mulhw r4, r3, r4			; P9BE-NEXT: addis r3, r2, .LCPI4_1@toc@ha
	; P9BE-NEXT: add r4, r4, r3			; P9BE-NEXT: addi r3, r3, .LCPI4_1@toc@l
	; P9BE-NEXT: srwi r5, r4, 31			; P9BE-NEXT: lxvx v4, 0, r3
	; P9BE-NEXT: srawi r4, r4, 4			; P9BE-NEXT: addis r3, r2, .LCPI4_2@toc@ha
	; P9BE-NEXT: add r4, r4, r5			; P9BE-NEXT: xxland v3, v2, vs0
	; P9BE-NEXT: mulli r4, r4, 23			; P9BE-NEXT: addi r3, r3, .LCPI4_2@toc@l
	; P9BE-NEXT: sub r3, r3, r4			; P9BE-NEXT: vmuluwm v4, v5, v4
	; P9BE-NEXT: lis r4, 24749			; P9BE-NEXT: vspltisw v5, 8
	; P9BE-NEXT: sldi r3, r3, 48			; P9BE-NEXT: vadduwm v5, v5, v5
	; P9BE-NEXT: ori r4, r4, 47143			; P9BE-NEXT: vsrw v4, v4, v5
	; P9BE-NEXT: mtvsrd v3, r3			; P9BE-NEXT: vxor v5, v5, v5
	; P9BE-NEXT: li r3, 6			; P9BE-NEXT: vpkuwum v4, v4, v4
	; P9BE-NEXT: vextuhlx r3, r3, v2			; P9BE-NEXT: vadduhm v3, v4, v3
	; P9BE-NEXT: extsh r3, r3			; P9BE-NEXT: lxvx v4, 0, r3
	; P9BE-NEXT: mulhw r4, r3, r4			; P9BE-NEXT: addis r3, r2, .LCPI4_3@toc@ha
	; P9BE-NEXT: srwi r5, r4, 31			; P9BE-NEXT: addi r3, r3, .LCPI4_3@toc@l
	; P9BE-NEXT: srawi r4, r4, 11			; P9BE-NEXT: lxvx vs0, 0, r3
	; P9BE-NEXT: add r4, r4, r5			; P9BE-NEXT: addis r3, r2, .LCPI4_4@toc@ha
	; P9BE-NEXT: mulli r4, r4, 5423			; P9BE-NEXT: addi r3, r3, .LCPI4_4@toc@l
	; P9BE-NEXT: sub r3, r3, r4			; P9BE-NEXT: vsrah v3, v3, v4
	; P9BE-NEXT: lis r4, -14230			; P9BE-NEXT: vspltish v4, 15
	; P9BE-NEXT: sldi r3, r3, 48			; P9BE-NEXT: vsrh v4, v3, v4
	; P9BE-NEXT: ori r4, r4, 30865			; P9BE-NEXT: xxland v4, v4, vs0
	; P9BE-NEXT: mtvsrd v4, r3			; P9BE-NEXT: vadduhm v3, v3, v4
	; P9BE-NEXT: li r3, 2			; P9BE-NEXT: lxvx v4, 0, r3
	; P9BE-NEXT: vextuhlx r3, r3, v2			; P9BE-NEXT: vmladduhm v3, v3, v4, v5
	; P9BE-NEXT: vmrghh v3, v3, v4			; P9BE-NEXT: vsubuhm v2, v2, v3
	; P9BE-NEXT: extsh r3, r3
	; P9BE-NEXT: mulhw r4, r3, r4
	; P9BE-NEXT: add r4, r4, r3
	; P9BE-NEXT: srwi r5, r4, 31
	; P9BE-NEXT: srawi r4, r4, 9
	; P9BE-NEXT: add r4, r4, r5
	; P9BE-NEXT: mulli r4, r4, 654
	; P9BE-NEXT: sub r3, r3, r4
	; P9BE-NEXT: sldi r3, r3, 48
	; P9BE-NEXT: mtvsrd v2, r3
	; P9BE-NEXT: li r3, 0
	; P9BE-NEXT: sldi r3, r3, 48
	; P9BE-NEXT: mtvsrd v4, r3
	; P9BE-NEXT: vmrghh v2, v4, v2
	; P9BE-NEXT: vmrghw v2, v2, v3
	; P9BE-NEXT: blr			; P9BE-NEXT: blr
	;			;
	; P8LE-LABEL: dont_fold_srem_one:			; P8LE-LABEL: dont_fold_srem_one:
	; P8LE: # %bb.0:			; P8LE: # %bb.0:
	; P8LE-NEXT: xxswapd vs0, v2			; P8LE-NEXT: vmrglh v3, v2, v2
	; P8LE-NEXT: lis r5, 24749			; P8LE-NEXT: vspltisw v4, 8
	; P8LE-NEXT: lis r6, -19946			; P8LE-NEXT: addis r3, r2, .LCPI4_0@toc@ha
	; P8LE-NEXT: lis r8, -14230			; P8LE-NEXT: addi r3, r3, .LCPI4_0@toc@l
	; P8LE-NEXT: ori r5, r5, 47143			; P8LE-NEXT: vxor v0, v0, v0
	; P8LE-NEXT: ori r6, r6, 17097			; P8LE-NEXT: lvx v5, 0, r3
	; P8LE-NEXT: ori r8, r8, 30865			; P8LE-NEXT: addis r3, r2, .LCPI4_1@toc@ha
	; P8LE-NEXT: mffprd r3, f0			; P8LE-NEXT: vadduwm v4, v4, v4
	; P8LE-NEXT: rldicl r4, r3, 16, 48			; P8LE-NEXT: addi r3, r3, .LCPI4_1@toc@l
	; P8LE-NEXT: rldicl r7, r3, 32, 48			; P8LE-NEXT: vslw v3, v3, v4
	; P8LE-NEXT: rldicl r3, r3, 48, 48			; P8LE-NEXT: vsraw v3, v3, v4
	; P8LE-NEXT: extsh r4, r4			; P8LE-NEXT: vmuluwm v3, v3, v5
	; P8LE-NEXT: extsh r7, r7			; P8LE-NEXT: vsrw v3, v3, v4
	; P8LE-NEXT: extsh r3, r3			; P8LE-NEXT: vspltisw v4, -16
	; P8LE-NEXT: mulhw r5, r4, r5			; P8LE-NEXT: vsrw v4, v4, v4
	; P8LE-NEXT: mulhw r6, r7, r6			; P8LE-NEXT: vpkuwum v3, v3, v3
	; P8LE-NEXT: mulhw r8, r3, r8			; P8LE-NEXT: xxland v4, v2, v4
	; P8LE-NEXT: srwi r9, r5, 31			; P8LE-NEXT: vadduhm v3, v3, v4
	; P8LE-NEXT: srawi r5, r5, 11			; P8LE-NEXT: lvx v4, 0, r3
	; P8LE-NEXT: add r6, r6, r7			; P8LE-NEXT: addis r3, r2, .LCPI4_2@toc@ha
	; P8LE-NEXT: add r8, r8, r3			; P8LE-NEXT: addi r3, r3, .LCPI4_2@toc@l
	; P8LE-NEXT: add r5, r5, r9			; P8LE-NEXT: vsrah v3, v3, v4
	; P8LE-NEXT: srwi r9, r6, 31			; P8LE-NEXT: vspltish v4, 15
	; P8LE-NEXT: srawi r6, r6, 4			; P8LE-NEXT: lvx v5, 0, r3
	; P8LE-NEXT: add r6, r6, r9			; P8LE-NEXT: addis r3, r2, .LCPI4_3@toc@ha
	; P8LE-NEXT: srwi r9, r8, 31			; P8LE-NEXT: addi r3, r3, .LCPI4_3@toc@l
	; P8LE-NEXT: srawi r8, r8, 9			; P8LE-NEXT: vsrh v4, v3, v4
	; P8LE-NEXT: mulli r5, r5, 5423			; P8LE-NEXT: xxland v4, v4, v5
	; P8LE-NEXT: add r8, r8, r9			; P8LE-NEXT: vadduhm v3, v3, v4
	; P8LE-NEXT: mulli r6, r6, 23			; P8LE-NEXT: lvx v4, 0, r3
	; P8LE-NEXT: li r9, 0			; P8LE-NEXT: vmladduhm v3, v3, v4, v0
	; P8LE-NEXT: mulli r8, r8, 654			; P8LE-NEXT: vsubuhm v2, v2, v3
	; P8LE-NEXT: mtvsrd v2, r9
	; P8LE-NEXT: sub r4, r4, r5
	; P8LE-NEXT: sub r5, r7, r6
	; P8LE-NEXT: mtvsrd v3, r4
	; P8LE-NEXT: sub r3, r3, r8
	; P8LE-NEXT: mtvsrd v4, r5
	; P8LE-NEXT: mtvsrd v5, r3
	; P8LE-NEXT: vmrghh v3, v3, v4
	; P8LE-NEXT: vmrghh v2, v5, v2
	; P8LE-NEXT: vmrglw v2, v3, v2
	; P8LE-NEXT: blr			; P8LE-NEXT: blr
	;			;
	; P8BE-LABEL: dont_fold_srem_one:			; P8BE-LABEL: dont_fold_srem_one:
	; P8BE: # %bb.0:			; P8BE: # %bb.0:
	; P8BE-NEXT: mfvsrd r3, v2			; P8BE-NEXT: vmrghh v3, v2, v2
	; P8BE-NEXT: lis r5, 24749			; P8BE-NEXT: vspltisw v4, 8
	; P8BE-NEXT: lis r6, -19946			; P8BE-NEXT: addis r3, r2, .LCPI4_1@toc@ha
	; P8BE-NEXT: lis r8, -14230			; P8BE-NEXT: addi r3, r3, .LCPI4_1@toc@l
	; P8BE-NEXT: ori r5, r5, 47143			; P8BE-NEXT: lxvw4x v5, 0, r3
	; P8BE-NEXT: ori r6, r6, 17097			; P8BE-NEXT: addis r3, r2, .LCPI4_0@toc@ha
	; P8BE-NEXT: ori r8, r8, 30865			; P8BE-NEXT: vadduwm v4, v4, v4
	; P8BE-NEXT: clrldi r4, r3, 48			; P8BE-NEXT: addi r3, r3, .LCPI4_0@toc@l
	; P8BE-NEXT: rldicl r7, r3, 48, 48			; P8BE-NEXT: lxvw4x vs0, 0, r3
	; P8BE-NEXT: rldicl r3, r3, 32, 48			; P8BE-NEXT: addis r3, r2, .LCPI4_2@toc@ha
	; P8BE-NEXT: extsh r4, r4			; P8BE-NEXT: addi r3, r3, .LCPI4_2@toc@l
	; P8BE-NEXT: extsh r7, r7			; P8BE-NEXT: vslw v3, v3, v4
	; P8BE-NEXT: extsh r3, r3			; P8BE-NEXT: vsraw v3, v3, v4
	; P8BE-NEXT: mulhw r5, r4, r5			; P8BE-NEXT: vmuluwm v3, v3, v5
	; P8BE-NEXT: mulhw r6, r7, r6			; P8BE-NEXT: lxvw4x v5, 0, r3
	; P8BE-NEXT: mulhw r8, r3, r8			; P8BE-NEXT: addis r3, r2, .LCPI4_3@toc@ha
	; P8BE-NEXT: srwi r9, r5, 31			; P8BE-NEXT: addi r3, r3, .LCPI4_3@toc@l
	; P8BE-NEXT: srawi r5, r5, 11			; P8BE-NEXT: vsrw v3, v3, v4
	; P8BE-NEXT: add r6, r6, r7			; P8BE-NEXT: xxland v4, v2, vs0
	; P8BE-NEXT: add r8, r8, r3			; P8BE-NEXT: lxvw4x vs0, 0, r3
	; P8BE-NEXT: add r5, r5, r9			; P8BE-NEXT: addis r3, r2, .LCPI4_4@toc@ha
	; P8BE-NEXT: srwi r9, r6, 31			; P8BE-NEXT: addi r3, r3, .LCPI4_4@toc@l
	; P8BE-NEXT: srawi r6, r6, 4			; P8BE-NEXT: lxvw4x v0, 0, r3
	; P8BE-NEXT: add r6, r6, r9			; P8BE-NEXT: vpkuwum v3, v3, v3
	; P8BE-NEXT: srwi r9, r8, 31			; P8BE-NEXT: vadduhm v3, v3, v4
	; P8BE-NEXT: srawi r8, r8, 9			; P8BE-NEXT: vspltish v4, 15
	; P8BE-NEXT: mulli r5, r5, 5423			; P8BE-NEXT: vsrah v3, v3, v5
	; P8BE-NEXT: add r8, r8, r9			; P8BE-NEXT: vxor v5, v5, v5
	; P8BE-NEXT: mulli r6, r6, 23			; P8BE-NEXT: vsrh v4, v3, v4
	; P8BE-NEXT: li r9, 0			; P8BE-NEXT: xxland v4, v4, vs0
	; P8BE-NEXT: mulli r8, r8, 654			; P8BE-NEXT: vadduhm v3, v3, v4
	; P8BE-NEXT: sub r4, r4, r5			; P8BE-NEXT: vmladduhm v3, v3, v0, v5
	; P8BE-NEXT: sldi r5, r9, 48			; P8BE-NEXT: vsubuhm v2, v2, v3
	; P8BE-NEXT: mtvsrd v2, r5
	; P8BE-NEXT: sub r5, r7, r6
	; P8BE-NEXT: sldi r4, r4, 48
	; P8BE-NEXT: sub r3, r3, r8
	; P8BE-NEXT: mtvsrd v3, r4
	; P8BE-NEXT: sldi r4, r5, 48
	; P8BE-NEXT: sldi r3, r3, 48
	; P8BE-NEXT: mtvsrd v4, r4
	; P8BE-NEXT: mtvsrd v5, r3
	; P8BE-NEXT: vmrghh v3, v4, v3
	; P8BE-NEXT: vmrghh v2, v2, v5
	; P8BE-NEXT: vmrghw v2, v2, v3
	; P8BE-NEXT: blr			; P8BE-NEXT: blr
	%1 = srem <4 x i16> %x, <i16 1, i16 654, i16 23, i16 5423>			%1 = srem <4 x i16> %x, <i16 1, i16 654, i16 23, i16 5423>
	ret <4 x i16> %1			ret <4 x i16> %1
	}			}

	; Don't fold if the divisor is 2^15.			; Don't fold if the divisor is 2^15.
	define <4 x i16> @dont_fold_urem_i16_smax(<4 x i16> %x) {			define <4 x i16> @dont_fold_urem_i16_smax(<4 x i16> %x) {
	; P9LE-LABEL: dont_fold_urem_i16_smax:			; P9LE-LABEL: dont_fold_urem_i16_smax:
	; P9LE: # %bb.0:			; P9LE: # %bb.0:
	; P9LE-NEXT: li r3, 4			; P9LE-NEXT: addis r3, r2, .LCPI5_0@toc@ha
	; P9LE-NEXT: lis r4, -19946			; P9LE-NEXT: vmrglh v3, v2, v2
	; P9LE-NEXT: vextuhrx r3, r3, v2			; P9LE-NEXT: vxor v5, v5, v5
	; P9LE-NEXT: ori r4, r4, 17097			; P9LE-NEXT: addi r3, r3, .LCPI5_0@toc@l
	; P9LE-NEXT: extsh r3, r3			; P9LE-NEXT: vextsh2w v3, v3
	; P9LE-NEXT: mulhw r4, r3, r4			; P9LE-NEXT: lxvx v4, 0, r3
	; P9LE-NEXT: add r4, r4, r3			; P9LE-NEXT: addis r3, r2, .LCPI5_1@toc@ha
	; P9LE-NEXT: srwi r5, r4, 31			; P9LE-NEXT: addi r3, r3, .LCPI5_1@toc@l
	; P9LE-NEXT: srawi r4, r4, 4			; P9LE-NEXT: vmuluwm v3, v3, v4
	; P9LE-NEXT: add r4, r4, r5			; P9LE-NEXT: vspltisw v4, 8
	; P9LE-NEXT: mulli r4, r4, 23			; P9LE-NEXT: vadduwm v4, v4, v4
	; P9LE-NEXT: sub r3, r3, r4			; P9LE-NEXT: vsrw v3, v3, v4
	; P9LE-NEXT: lis r4, 24749			; P9LE-NEXT: lxvx v4, 0, r3
	; P9LE-NEXT: mtvsrd v3, r3			; P9LE-NEXT: addis r3, r2, .LCPI5_2@toc@ha
	; P9LE-NEXT: li r3, 6			; P9LE-NEXT: vpkuwum v3, v3, v3
	; P9LE-NEXT: ori r4, r4, 47143			; P9LE-NEXT: addi r3, r3, .LCPI5_2@toc@l
	; P9LE-NEXT: vextuhrx r3, r3, v2			; P9LE-NEXT: vmladduhm v3, v2, v4, v3
	; P9LE-NEXT: extsh r3, r3			; P9LE-NEXT: lxvx v4, 0, r3
	; P9LE-NEXT: mulhw r4, r3, r4			; P9LE-NEXT: addis r3, r2, .LCPI5_3@toc@ha
	; P9LE-NEXT: srwi r5, r4, 31			; P9LE-NEXT: addi r3, r3, .LCPI5_3@toc@l
	; P9LE-NEXT: srawi r4, r4, 11			; P9LE-NEXT: lxvx vs0, 0, r3
	; P9LE-NEXT: add r4, r4, r5			; P9LE-NEXT: addis r3, r2, .LCPI5_4@toc@ha
	; P9LE-NEXT: mulli r4, r4, 5423			; P9LE-NEXT: addi r3, r3, .LCPI5_4@toc@l
	; P9LE-NEXT: sub r3, r3, r4			; P9LE-NEXT: vsrah v3, v3, v4
	; P9LE-NEXT: mtvsrd v4, r3			; P9LE-NEXT: vspltish v4, 15
	; P9LE-NEXT: li r3, 2			; P9LE-NEXT: vsrh v4, v3, v4
	; P9LE-NEXT: vextuhrx r3, r3, v2			; P9LE-NEXT: xxland v4, v4, vs0
	; P9LE-NEXT: vmrghh v3, v4, v3			; P9LE-NEXT: vadduhm v3, v3, v4
	; P9LE-NEXT: extsh r3, r3			; P9LE-NEXT: lxvx v4, 0, r3
	; P9LE-NEXT: srawi r4, r3, 15			; P9LE-NEXT: vmladduhm v3, v3, v4, v5
	; P9LE-NEXT: addze r4, r4			; P9LE-NEXT: vsubuhm v2, v2, v3
	; P9LE-NEXT: slwi r4, r4, 15
	; P9LE-NEXT: sub r3, r3, r4
	; P9LE-NEXT: mtvsrd v2, r3
	; P9LE-NEXT: li r3, 0
	; P9LE-NEXT: mtvsrd v4, r3
	; P9LE-NEXT: vmrghh v2, v2, v4
	; P9LE-NEXT: vmrglw v2, v3, v2
	; P9LE-NEXT: blr			; P9LE-NEXT: blr
	;			;
	; P9BE-LABEL: dont_fold_urem_i16_smax:			; P9BE-LABEL: dont_fold_urem_i16_smax:
	; P9BE: # %bb.0:			; P9BE: # %bb.0:
	; P9BE-NEXT: li r3, 4			; P9BE-NEXT: addis r3, r2, .LCPI5_0@toc@ha
	; P9BE-NEXT: lis r4, -19946			; P9BE-NEXT: vmrghh v3, v2, v2
	; P9BE-NEXT: vextuhlx r3, r3, v2			; P9BE-NEXT: vxor v5, v5, v5
	; P9BE-NEXT: ori r4, r4, 17097			; P9BE-NEXT: addi r3, r3, .LCPI5_0@toc@l
	; P9BE-NEXT: extsh r3, r3			; P9BE-NEXT: vextsh2w v3, v3
	; P9BE-NEXT: mulhw r4, r3, r4			; P9BE-NEXT: lxvx v4, 0, r3
	; P9BE-NEXT: add r4, r4, r3			; P9BE-NEXT: addis r3, r2, .LCPI5_1@toc@ha
	; P9BE-NEXT: srwi r5, r4, 31			; P9BE-NEXT: addi r3, r3, .LCPI5_1@toc@l
	; P9BE-NEXT: srawi r4, r4, 4			; P9BE-NEXT: vmuluwm v3, v3, v4
	; P9BE-NEXT: add r4, r4, r5			; P9BE-NEXT: vspltisw v4, 8
	; P9BE-NEXT: mulli r4, r4, 23			; P9BE-NEXT: vadduwm v4, v4, v4
	; P9BE-NEXT: sub r3, r3, r4			; P9BE-NEXT: vsrw v3, v3, v4
	; P9BE-NEXT: lis r4, 24749			; P9BE-NEXT: lxvx v4, 0, r3
	; P9BE-NEXT: sldi r3, r3, 48			; P9BE-NEXT: addis r3, r2, .LCPI5_2@toc@ha
	; P9BE-NEXT: ori r4, r4, 47143			; P9BE-NEXT: vpkuwum v3, v3, v3
	; P9BE-NEXT: mtvsrd v3, r3			; P9BE-NEXT: addi r3, r3, .LCPI5_2@toc@l
	; P9BE-NEXT: li r3, 6			; P9BE-NEXT: vmladduhm v3, v2, v4, v3
	; P9BE-NEXT: vextuhlx r3, r3, v2			; P9BE-NEXT: lxvx v4, 0, r3
	; P9BE-NEXT: extsh r3, r3			; P9BE-NEXT: addis r3, r2, .LCPI5_3@toc@ha
	; P9BE-NEXT: mulhw r4, r3, r4			; P9BE-NEXT: addi r3, r3, .LCPI5_3@toc@l
	; P9BE-NEXT: srwi r5, r4, 31			; P9BE-NEXT: lxvx vs0, 0, r3
	; P9BE-NEXT: srawi r4, r4, 11			; P9BE-NEXT: addis r3, r2, .LCPI5_4@toc@ha
	; P9BE-NEXT: add r4, r4, r5			; P9BE-NEXT: addi r3, r3, .LCPI5_4@toc@l
	; P9BE-NEXT: mulli r4, r4, 5423			; P9BE-NEXT: vsrah v3, v3, v4
	; P9BE-NEXT: sub r3, r3, r4			; P9BE-NEXT: vspltish v4, 15
	; P9BE-NEXT: sldi r3, r3, 48			; P9BE-NEXT: vsrh v4, v3, v4
	; P9BE-NEXT: mtvsrd v4, r3			; P9BE-NEXT: xxland v4, v4, vs0
	; P9BE-NEXT: li r3, 2			; P9BE-NEXT: vadduhm v3, v3, v4
	; P9BE-NEXT: vextuhlx r3, r3, v2			; P9BE-NEXT: lxvx v4, 0, r3
	; P9BE-NEXT: vmrghh v3, v3, v4			; P9BE-NEXT: vmladduhm v3, v3, v4, v5
	; P9BE-NEXT: extsh r3, r3			; P9BE-NEXT: vsubuhm v2, v2, v3
	; P9BE-NEXT: srawi r4, r3, 15
	; P9BE-NEXT: addze r4, r4
	; P9BE-NEXT: slwi r4, r4, 15
	; P9BE-NEXT: sub r3, r3, r4
	; P9BE-NEXT: sldi r3, r3, 48
	; P9BE-NEXT: mtvsrd v2, r3
	; P9BE-NEXT: li r3, 0
	; P9BE-NEXT: sldi r3, r3, 48
	; P9BE-NEXT: mtvsrd v4, r3
	; P9BE-NEXT: vmrghh v2, v4, v2
	; P9BE-NEXT: vmrghw v2, v2, v3
	; P9BE-NEXT: blr			; P9BE-NEXT: blr
	;			;
	; P8LE-LABEL: dont_fold_urem_i16_smax:			; P8LE-LABEL: dont_fold_urem_i16_smax:
	; P8LE: # %bb.0:			; P8LE: # %bb.0:
	; P8LE-NEXT: xxswapd vs0, v2			; P8LE-NEXT: vmrglh v3, v2, v2
	; P8LE-NEXT: lis r4, 24749			; P8LE-NEXT: vspltisw v4, 8
	; P8LE-NEXT: lis r5, -19946			; P8LE-NEXT: addis r3, r2, .LCPI5_0@toc@ha
	; P8LE-NEXT: ori r4, r4, 47143			; P8LE-NEXT: addi r3, r3, .LCPI5_0@toc@l
	; P8LE-NEXT: ori r5, r5, 17097			; P8LE-NEXT: vxor v0, v0, v0
	; P8LE-NEXT: mffprd r3, f0			; P8LE-NEXT: lvx v5, 0, r3
	; P8LE-NEXT: rldicl r6, r3, 16, 48			; P8LE-NEXT: addis r3, r2, .LCPI5_1@toc@ha
	; P8LE-NEXT: rldicl r7, r3, 32, 48			; P8LE-NEXT: vadduwm v4, v4, v4
	; P8LE-NEXT: extsh r6, r6			; P8LE-NEXT: addi r3, r3, .LCPI5_1@toc@l
	; P8LE-NEXT: extsh r7, r7			; P8LE-NEXT: vslw v3, v3, v4
	; P8LE-NEXT: mulhw r4, r6, r4			; P8LE-NEXT: vsraw v3, v3, v4
	; P8LE-NEXT: mulhw r5, r7, r5			; P8LE-NEXT: vmuluwm v3, v3, v5
	; P8LE-NEXT: rldicl r3, r3, 48, 48			; P8LE-NEXT: vsrw v3, v3, v4
	; P8LE-NEXT: extsh r3, r3			; P8LE-NEXT: lvx v4, 0, r3
	; P8LE-NEXT: srwi r8, r4, 31			; P8LE-NEXT: addis r3, r2, .LCPI5_2@toc@ha
	; P8LE-NEXT: srawi r4, r4, 11			; P8LE-NEXT: addi r3, r3, .LCPI5_2@toc@l
	; P8LE-NEXT: add r5, r5, r7			; P8LE-NEXT: vpkuwum v3, v3, v3
	; P8LE-NEXT: add r4, r4, r8			; P8LE-NEXT: vmladduhm v3, v2, v4, v3
	; P8LE-NEXT: srwi r8, r5, 31			; P8LE-NEXT: lvx v4, 0, r3
	; P8LE-NEXT: srawi r5, r5, 4			; P8LE-NEXT: addis r3, r2, .LCPI5_3@toc@ha
	; P8LE-NEXT: mulli r4, r4, 5423			; P8LE-NEXT: addi r3, r3, .LCPI5_3@toc@l
	; P8LE-NEXT: add r5, r5, r8			; P8LE-NEXT: lvx v5, 0, r3
	; P8LE-NEXT: srawi r9, r3, 15			; P8LE-NEXT: addis r3, r2, .LCPI5_4@toc@ha
	; P8LE-NEXT: li r8, 0			; P8LE-NEXT: addi r3, r3, .LCPI5_4@toc@l
	; P8LE-NEXT: mulli r5, r5, 23			; P8LE-NEXT: vsrah v3, v3, v4
	; P8LE-NEXT: mtvsrd v2, r8			; P8LE-NEXT: vspltish v4, 15
	; P8LE-NEXT: sub r4, r6, r4			; P8LE-NEXT: vsrh v4, v3, v4
	; P8LE-NEXT: addze r6, r9			; P8LE-NEXT: xxland v4, v4, v5
	; P8LE-NEXT: slwi r6, r6, 15			; P8LE-NEXT: vadduhm v3, v3, v4
	; P8LE-NEXT: mtvsrd v3, r4			; P8LE-NEXT: lvx v4, 0, r3
	; P8LE-NEXT: sub r5, r7, r5			; P8LE-NEXT: vmladduhm v3, v3, v4, v0
	; P8LE-NEXT: sub r3, r3, r6			; P8LE-NEXT: vsubuhm v2, v2, v3
	; P8LE-NEXT: mtvsrd v4, r5
	; P8LE-NEXT: mtvsrd v5, r3
	; P8LE-NEXT: vmrghh v3, v3, v4
	; P8LE-NEXT: vmrghh v2, v5, v2
	; P8LE-NEXT: vmrglw v2, v3, v2
	; P8LE-NEXT: blr			; P8LE-NEXT: blr
	;			;
	; P8BE-LABEL: dont_fold_urem_i16_smax:			; P8BE-LABEL: dont_fold_urem_i16_smax:
	; P8BE: # %bb.0:			; P8BE: # %bb.0:
	; P8BE-NEXT: mfvsrd r3, v2			; P8BE-NEXT: vmrghh v3, v2, v2
	; P8BE-NEXT: lis r4, 24749			; P8BE-NEXT: vspltisw v4, 8
	; P8BE-NEXT: lis r5, -19946			; P8BE-NEXT: addis r3, r2, .LCPI5_0@toc@ha
	; P8BE-NEXT: ori r4, r4, 47143			; P8BE-NEXT: addi r3, r3, .LCPI5_0@toc@l
	; P8BE-NEXT: ori r5, r5, 17097			; P8BE-NEXT: lxvw4x v5, 0, r3
	; P8BE-NEXT: clrldi r6, r3, 48			; P8BE-NEXT: addis r3, r2, .LCPI5_1@toc@ha
	; P8BE-NEXT: rldicl r7, r3, 48, 48			; P8BE-NEXT: vadduwm v4, v4, v4
	; P8BE-NEXT: extsh r6, r6			; P8BE-NEXT: addi r3, r3, .LCPI5_1@toc@l
	; P8BE-NEXT: extsh r7, r7			; P8BE-NEXT: vslw v3, v3, v4
	; P8BE-NEXT: mulhw r4, r6, r4			; P8BE-NEXT: vsraw v3, v3, v4
	; P8BE-NEXT: mulhw r5, r7, r5			; P8BE-NEXT: vmuluwm v3, v3, v5
	; P8BE-NEXT: rldicl r3, r3, 32, 48			; P8BE-NEXT: vxor v5, v5, v5
	; P8BE-NEXT: extsh r3, r3			; P8BE-NEXT: vsrw v3, v3, v4
	; P8BE-NEXT: srwi r8, r4, 31			; P8BE-NEXT: lxvw4x v4, 0, r3
	; P8BE-NEXT: srawi r4, r4, 11			; P8BE-NEXT: addis r3, r2, .LCPI5_2@toc@ha
	; P8BE-NEXT: add r5, r5, r7			; P8BE-NEXT: addi r3, r3, .LCPI5_2@toc@l
	; P8BE-NEXT: add r4, r4, r8			; P8BE-NEXT: vpkuwum v3, v3, v3
	; P8BE-NEXT: srwi r8, r5, 31			; P8BE-NEXT: vmladduhm v3, v2, v4, v3
	; P8BE-NEXT: srawi r5, r5, 4			; P8BE-NEXT: lxvw4x v4, 0, r3
	; P8BE-NEXT: mulli r4, r4, 5423			; P8BE-NEXT: addis r3, r2, .LCPI5_3@toc@ha
	; P8BE-NEXT: add r5, r5, r8			; P8BE-NEXT: addi r3, r3, .LCPI5_3@toc@l
	; P8BE-NEXT: li r8, 0			; P8BE-NEXT: lxvw4x vs0, 0, r3
	; P8BE-NEXT: mulli r5, r5, 23			; P8BE-NEXT: addis r3, r2, .LCPI5_4@toc@ha
	; P8BE-NEXT: srawi r9, r3, 15			; P8BE-NEXT: addi r3, r3, .LCPI5_4@toc@l
	; P8BE-NEXT: sub r4, r6, r4			; P8BE-NEXT: lxvw4x v0, 0, r3
	; P8BE-NEXT: sldi r6, r8, 48			; P8BE-NEXT: vsrah v3, v3, v4
	; P8BE-NEXT: addze r8, r9			; P8BE-NEXT: vspltish v4, 15
	; P8BE-NEXT: mtvsrd v2, r6			; P8BE-NEXT: vsrh v4, v3, v4
	; P8BE-NEXT: slwi r6, r8, 15			; P8BE-NEXT: xxland v4, v4, vs0
	; P8BE-NEXT: sldi r4, r4, 48			; P8BE-NEXT: vadduhm v3, v3, v4
	; P8BE-NEXT: sub r5, r7, r5			; P8BE-NEXT: vmladduhm v3, v3, v0, v5
	; P8BE-NEXT: sub r3, r3, r6			; P8BE-NEXT: vsubuhm v2, v2, v3
	; P8BE-NEXT: mtvsrd v3, r4
	; P8BE-NEXT: sldi r4, r5, 48
	; P8BE-NEXT: sldi r3, r3, 48
	; P8BE-NEXT: mtvsrd v4, r4
	; P8BE-NEXT: mtvsrd v5, r3
	; P8BE-NEXT: vmrghh v3, v4, v3
	; P8BE-NEXT: vmrghh v2, v2, v5
	; P8BE-NEXT: vmrghw v2, v2, v3
	; P8BE-NEXT: blr			; P8BE-NEXT: blr
	%1 = srem <4 x i16> %x, <i16 1, i16 32768, i16 23, i16 5423>			%1 = srem <4 x i16> %x, <i16 1, i16 32768, i16 23, i16 5423>
	ret <4 x i16> %1			ret <4 x i16> %1
	}			}

	; Don't fold i64 srem.			; Don't fold i64 srem.
	define <4 x i64> @dont_fold_srem_i64(<4 x i64> %x) {			define <4 x i64> @dont_fold_srem_i64(<4 x i64> %x) {
	; P9LE-LABEL: dont_fold_srem_i64:			; P9LE-LABEL: dont_fold_srem_i64:
	; P9LE: # %bb.0:			; P9LE: # %bb.0:
	; P9LE-NEXT: lis r4, 24749			; P9LE-NEXT: lis r3, 24749
	; P9LE-NEXT: mfvsrd r3, v3			; P9LE-NEXT: mfvsrd r4, v3
	; P9LE-NEXT: ori r4, r4, 47142			; P9LE-NEXT: ori r3, r3, 47142
	; P9LE-NEXT: sldi r4, r4, 32			; P9LE-NEXT: sradi r5, r4, 63
	; P9LE-NEXT: oris r4, r4, 58853			; P9LE-NEXT: sldi r3, r3, 32
	; P9LE-NEXT: ori r4, r4, 6055			; P9LE-NEXT: oris r3, r3, 58853
	; P9LE-NEXT: mulhd r4, r3, r4			; P9LE-NEXT: ori r3, r3, 6055
	; P9LE-NEXT: rldicl r5, r4, 1, 63			; P9LE-NEXT: mulhdu r6, r4, r3
	; P9LE-NEXT: sradi r4, r4, 11			; P9LE-NEXT: maddld r5, r5, r3, r6
	; P9LE-NEXT: add r4, r4, r5			; P9LE-NEXT: lis r6, -19946
	; P9LE-NEXT: lis r5, -19946			; P9LE-NEXT: mulld r3, r4, r3
	; P9LE-NEXT: mulli r4, r4, 5423
	; P9LE-NEXT: ori r5, r5, 17096
	; P9LE-NEXT: sldi r5, r5, 32
	; P9LE-NEXT: oris r5, r5, 22795
	; P9LE-NEXT: sub r3, r3, r4
	; P9LE-NEXT: mfvsrld r4, v3			; P9LE-NEXT: mfvsrld r4, v3
				; P9LE-NEXT: ori r6, r6, 17096
				; P9LE-NEXT: sldi r6, r6, 32
				; P9LE-NEXT: mtvsrdd v4, r5, r3
				; P9LE-NEXT: sradi r3, r4, 63
				; P9LE-NEXT: oris r5, r6, 22795
	; P9LE-NEXT: ori r5, r5, 8549			; P9LE-NEXT: ori r5, r5, 8549
	; P9LE-NEXT: mulhd r5, r4, r5			; P9LE-NEXT: mulhdu r6, r4, r5
	; P9LE-NEXT: add r5, r5, r4			; P9LE-NEXT: sub r6, r6, r4
	; P9LE-NEXT: rldicl r6, r5, 1, 63			; P9LE-NEXT: mulld r4, r4, r5
	; P9LE-NEXT: sradi r5, r5, 4			; P9LE-NEXT: maddld r3, r3, r5, r6
	; P9LE-NEXT: add r5, r5, r6			; P9LE-NEXT: lis r6, 25653
	; P9LE-NEXT: mulli r5, r5, 23			; P9LE-NEXT: mfvsrd r5, v2
	; P9LE-NEXT: sub r4, r4, r5			; P9LE-NEXT: ori r6, r6, 15432
	; P9LE-NEXT: mtvsrdd v3, r3, r4			; P9LE-NEXT: sldi r6, r6, 32
	; P9LE-NEXT: lis r4, 25653			; P9LE-NEXT: mtvsrdd v5, r3, r4
	; P9LE-NEXT: mfvsrd r3, v2			; P9LE-NEXT: addis r3, r2, .LCPI6_0@toc@ha
	; P9LE-NEXT: ori r4, r4, 15432			; P9LE-NEXT: addis r4, r2, .LCPI6_1@toc@ha
	; P9LE-NEXT: sldi r4, r4, 32			; P9LE-NEXT: oris r6, r6, 1603
	; P9LE-NEXT: oris r4, r4, 1603			; P9LE-NEXT: addi r3, r3, .LCPI6_0@toc@l
	; P9LE-NEXT: ori r4, r4, 21445			; P9LE-NEXT: addi r4, r4, .LCPI6_1@toc@l
	; P9LE-NEXT: mulhd r4, r3, r4			; P9LE-NEXT: ori r6, r6, 21445
	; P9LE-NEXT: rldicl r5, r4, 1, 63			; P9LE-NEXT: lxvx v0, 0, r3
	; P9LE-NEXT: sradi r4, r4, 8			; P9LE-NEXT: lxvx vs0, 0, r4
	; P9LE-NEXT: add r4, r4, r5			; P9LE-NEXT: addis r3, r2, .LCPI6_2@toc@ha
				; P9LE-NEXT: addis r4, r2, .LCPI6_3@toc@ha
				; P9LE-NEXT: addi r3, r3, .LCPI6_2@toc@l
				; P9LE-NEXT: addi r4, r4, .LCPI6_3@toc@l
				; P9LE-NEXT: lxvx v6, 0, r4
				; P9LE-NEXT: vspltb v1, v0, 15
				; P9LE-NEXT: vsro v4, v4, v0
				; P9LE-NEXT: vsro v5, v5, v0
				; P9LE-NEXT: vsr v4, v4, v1
				; P9LE-NEXT: vsr v5, v5, v1
				; P9LE-NEXT: xxmrgld v4, v4, v5
				; P9LE-NEXT: xxland v5, v3, vs0
				; P9LE-NEXT: vaddudm v4, v4, v5
				; P9LE-NEXT: lxvx v5, 0, r3
				; P9LE-NEXT: vsrad v6, v4, v6
				; P9LE-NEXT: vsrd v4, v4, v5
				; P9LE-NEXT: vaddudm v4, v6, v4
				; P9LE-NEXT: xxlxor v6, v6, v6
				; P9LE-NEXT: mfvsrld r3, v4
				; P9LE-NEXT: mfvsrd r4, v4
				; P9LE-NEXT: mulli r4, r4, 5423
				; P9LE-NEXT: mulli r3, r3, 23
				; P9LE-NEXT: mtvsrdd v4, r4, r3
				; P9LE-NEXT: mulhdu r3, r5, r6
				; P9LE-NEXT: sradi r4, r5, 63
				; P9LE-NEXT: vsubudm v3, v3, v4
				; P9LE-NEXT: maddld r3, r4, r6, r3
				; P9LE-NEXT: mulld r4, r5, r6
				; P9LE-NEXT: mtvsrdd v4, r3, r4
				; P9LE-NEXT: addis r3, r2, .LCPI6_4@toc@ha
				; P9LE-NEXT: vsro v4, v4, v0
				; P9LE-NEXT: vsro v0, v6, v0
				; P9LE-NEXT: addi r3, r3, .LCPI6_4@toc@l
				; P9LE-NEXT: vsr v4, v4, v1
				; P9LE-NEXT: vsr v0, v0, v1
				; P9LE-NEXT: xxmrgld v4, v4, v0
				; P9LE-NEXT: xxland v0, v2, vs0
				; P9LE-NEXT: vaddudm v4, v4, v0
				; P9LE-NEXT: lxvx v0, 0, r3
				; P9LE-NEXT: addis r3, r2, .LCPI6_5@toc@ha
				; P9LE-NEXT: addi r3, r3, .LCPI6_5@toc@l
				; P9LE-NEXT: lxvx vs0, 0, r3
				; P9LE-NEXT: vsrad v0, v4, v0
				; P9LE-NEXT: vsrd v4, v4, v5
				; P9LE-NEXT: xxland v4, v4, vs0
				; P9LE-NEXT: vaddudm v4, v0, v4
				; P9LE-NEXT: mfvsrd r4, v4
				; P9LE-NEXT: mfvsrld r3, v4
	; P9LE-NEXT: mulli r4, r4, 654			; P9LE-NEXT: mulli r4, r4, 654
	; P9LE-NEXT: sub r3, r3, r4			; P9LE-NEXT: mtvsrdd v4, r4, r3
	; P9LE-NEXT: li r4, 0			; P9LE-NEXT: vsubudm v2, v2, v4
	; P9LE-NEXT: mtvsrdd v2, r3, r4
	; P9LE-NEXT: blr			; P9LE-NEXT: blr
	;			;
	; P9BE-LABEL: dont_fold_srem_i64:			; P9BE-LABEL: dont_fold_srem_i64:
	; P9BE: # %bb.0:			; P9BE: # %bb.0:
	; P9BE-NEXT: lis r4, 24749			; P9BE-NEXT: lis r3, 24749
	; P9BE-NEXT: mfvsrld r3, v3			; P9BE-NEXT: mfvsrld r4, v3
	; P9BE-NEXT: ori r4, r4, 47142			; P9BE-NEXT: ori r3, r3, 47142
	; P9BE-NEXT: sldi r4, r4, 32			; P9BE-NEXT: sradi r5, r4, 63
	; P9BE-NEXT: oris r4, r4, 58853			; P9BE-NEXT: sldi r3, r3, 32
	; P9BE-NEXT: ori r4, r4, 6055			; P9BE-NEXT: oris r3, r3, 58853
	; P9BE-NEXT: mulhd r4, r3, r4			; P9BE-NEXT: ori r3, r3, 6055
	; P9BE-NEXT: rldicl r5, r4, 1, 63			; P9BE-NEXT: mulhdu r6, r4, r3
	; P9BE-NEXT: sradi r4, r4, 11			; P9BE-NEXT: maddld r5, r5, r3, r6
	; P9BE-NEXT: add r4, r4, r5			; P9BE-NEXT: lis r6, -19946
	; P9BE-NEXT: lis r5, -19946			; P9BE-NEXT: mulld r3, r4, r3
	; P9BE-NEXT: ori r5, r5, 17096
	; P9BE-NEXT: mulli r4, r4, 5423
	; P9BE-NEXT: sldi r5, r5, 32
	; P9BE-NEXT: oris r5, r5, 22795
	; P9BE-NEXT: sub r3, r3, r4
	; P9BE-NEXT: mfvsrd r4, v3			; P9BE-NEXT: mfvsrd r4, v3
				; P9BE-NEXT: ori r6, r6, 17096
				; P9BE-NEXT: sldi r6, r6, 32
				; P9BE-NEXT: mtvsrdd v4, r5, r3
				; P9BE-NEXT: sradi r3, r4, 63
				; P9BE-NEXT: oris r5, r6, 22795
	; P9BE-NEXT: ori r5, r5, 8549			; P9BE-NEXT: ori r5, r5, 8549
	; P9BE-NEXT: mulhd r5, r4, r5			; P9BE-NEXT: mulhdu r6, r4, r5
	; P9BE-NEXT: add r5, r5, r4			; P9BE-NEXT: sub r6, r6, r4
	; P9BE-NEXT: rldicl r6, r5, 1, 63			; P9BE-NEXT: mulld r4, r4, r5
	; P9BE-NEXT: sradi r5, r5, 4			; P9BE-NEXT: maddld r3, r3, r5, r6
	; P9BE-NEXT: add r5, r5, r6			; P9BE-NEXT: lis r6, 25653
	; P9BE-NEXT: mulli r5, r5, 23			; P9BE-NEXT: mfvsrld r5, v2
	; P9BE-NEXT: sub r4, r4, r5			; P9BE-NEXT: ori r6, r6, 15432
	; P9BE-NEXT: mtvsrdd v3, r4, r3			; P9BE-NEXT: sldi r6, r6, 32
	; P9BE-NEXT: lis r4, 25653			; P9BE-NEXT: mtvsrdd v5, r3, r4
	; P9BE-NEXT: mfvsrld r3, v2			; P9BE-NEXT: addis r3, r2, .LCPI6_0@toc@ha
	; P9BE-NEXT: ori r4, r4, 15432			; P9BE-NEXT: addis r4, r2, .LCPI6_1@toc@ha
	; P9BE-NEXT: sldi r4, r4, 32			; P9BE-NEXT: oris r6, r6, 1603
	; P9BE-NEXT: oris r4, r4, 1603			; P9BE-NEXT: addi r3, r3, .LCPI6_0@toc@l
	; P9BE-NEXT: ori r4, r4, 21445			; P9BE-NEXT: addi r4, r4, .LCPI6_1@toc@l
	; P9BE-NEXT: mulhd r4, r3, r4			; P9BE-NEXT: ori r6, r6, 21445
	; P9BE-NEXT: rldicl r5, r4, 1, 63			; P9BE-NEXT: lxvx v0, 0, r3
	; P9BE-NEXT: sradi r4, r4, 8			; P9BE-NEXT: lxvx vs0, 0, r4
	; P9BE-NEXT: add r4, r4, r5			; P9BE-NEXT: addis r3, r2, .LCPI6_2@toc@ha
	; P9BE-NEXT: mulli r4, r4, 654			; P9BE-NEXT: addis r4, r2, .LCPI6_3@toc@ha
	; P9BE-NEXT: sub r3, r3, r4			; P9BE-NEXT: addi r3, r3, .LCPI6_2@toc@l
	; P9BE-NEXT: mtvsrdd v2, 0, r3			; P9BE-NEXT: addi r4, r4, .LCPI6_3@toc@l
				; P9BE-NEXT: lxvx v6, 0, r4
				; P9BE-NEXT: vspltb v1, v0, 15
				; P9BE-NEXT: vsro v4, v4, v0
				; P9BE-NEXT: vsro v5, v5, v0
				; P9BE-NEXT: vsr v4, v4, v1
				; P9BE-NEXT: vsr v5, v5, v1
				; P9BE-NEXT: xxmrgld v4, v5, v4
				; P9BE-NEXT: xxland v5, v3, vs0
				; P9BE-NEXT: vaddudm v4, v4, v5
				; P9BE-NEXT: lxvx v5, 0, r3
				; P9BE-NEXT: vsrad v6, v4, v6
				; P9BE-NEXT: vsrd v4, v4, v5
				; P9BE-NEXT: vaddudm v4, v6, v4
				; P9BE-NEXT: xxlxor v6, v6, v6
				; P9BE-NEXT: mfvsrld r3, v4
				; P9BE-NEXT: mfvsrd r4, v4
				; P9BE-NEXT: mulli r4, r4, 23
				; P9BE-NEXT: mulli r3, r3, 5423
				; P9BE-NEXT: mtvsrdd v4, r4, r3
				; P9BE-NEXT: mulhdu r3, r5, r6
				; P9BE-NEXT: sradi r4, r5, 63
				; P9BE-NEXT: vsubudm v3, v3, v4
				; P9BE-NEXT: maddld r3, r4, r6, r3
				; P9BE-NEXT: mulld r4, r5, r6
				; P9BE-NEXT: mtvsrdd v4, r3, r4
				; P9BE-NEXT: addis r3, r2, .LCPI6_4@toc@ha
				; P9BE-NEXT: vsro v4, v4, v0
				; P9BE-NEXT: vsro v0, v6, v0
				; P9BE-NEXT: addi r3, r3, .LCPI6_4@toc@l
				; P9BE-NEXT: vsr v4, v4, v1
				; P9BE-NEXT: vsr v0, v0, v1
				; P9BE-NEXT: xxmrgld v4, v0, v4
				; P9BE-NEXT: xxland v0, v2, vs0
				; P9BE-NEXT: vaddudm v4, v4, v0
				; P9BE-NEXT: lxvx v0, 0, r3
				; P9BE-NEXT: addis r3, r2, .LCPI6_5@toc@ha
				; P9BE-NEXT: addi r3, r3, .LCPI6_5@toc@l
				; P9BE-NEXT: lxvx vs0, 0, r3
				; P9BE-NEXT: vsrad v0, v4, v0
				; P9BE-NEXT: vsrd v4, v4, v5
				; P9BE-NEXT: xxland v4, v4, vs0
				; P9BE-NEXT: vaddudm v4, v0, v4
				; P9BE-NEXT: mfvsrld r3, v4
				; P9BE-NEXT: mfvsrd r4, v4
				; P9BE-NEXT: mulli r3, r3, 654
				; P9BE-NEXT: mtvsrdd v4, r4, r3
				; P9BE-NEXT: vsubudm v2, v2, v4
	; P9BE-NEXT: blr			; P9BE-NEXT: blr
	;			;
	; P8LE-LABEL: dont_fold_srem_i64:			; P8LE-LABEL: dont_fold_srem_i64:
	; P8LE: # %bb.0:			; P8LE: # %bb.0:
	; P8LE-NEXT: lis r3, 24749			; P8LE-NEXT: lis r3, 24749
	; P8LE-NEXT: lis r4, -19946			; P8LE-NEXT: lis r4, -19946
	; P8LE-NEXT: lis r5, 25653			; P8LE-NEXT: lis r5, 25653
	; P8LE-NEXT: xxswapd vs0, v3			; P8LE-NEXT: xxswapd vs0, v3
	; P8LE-NEXT: mfvsrd r6, v3			; P8LE-NEXT: mfvsrd r6, v3
	; P8LE-NEXT: ori r3, r3, 47142			; P8LE-NEXT: ori r3, r3, 47142
	; P8LE-NEXT: ori r4, r4, 17096			; P8LE-NEXT: ori r4, r4, 17096
	; P8LE-NEXT: ori r5, r5, 15432			; P8LE-NEXT: ori r5, r5, 15432
	; P8LE-NEXT: mfvsrd r7, v2			; P8LE-NEXT: mfvsrd r7, v2
	; P8LE-NEXT: sldi r3, r3, 32			; P8LE-NEXT: sldi r3, r3, 32
	; P8LE-NEXT: sldi r4, r4, 32			; P8LE-NEXT: sldi r4, r4, 32
	; P8LE-NEXT: sldi r5, r5, 32			; P8LE-NEXT: sldi r5, r5, 32
	; P8LE-NEXT: oris r3, r3, 58853			; P8LE-NEXT: oris r3, r3, 58853
	; P8LE-NEXT: oris r4, r4, 22795			; P8LE-NEXT: oris r4, r4, 22795
	; P8LE-NEXT: mffprd r8, f0			; P8LE-NEXT: mffprd r10, f0
				; P8LE-NEXT: sradi r8, r6, 63
	; P8LE-NEXT: oris r5, r5, 1603			; P8LE-NEXT: oris r5, r5, 1603
	; P8LE-NEXT: ori r3, r3, 6055			; P8LE-NEXT: ori r3, r3, 6055
	; P8LE-NEXT: ori r4, r4, 8549			; P8LE-NEXT: ori r4, r4, 8549
				; P8LE-NEXT: sradi r9, r7, 63
	; P8LE-NEXT: ori r5, r5, 21445			; P8LE-NEXT: ori r5, r5, 21445
	; P8LE-NEXT: mulhd r3, r6, r3			; P8LE-NEXT: mulld r8, r8, r3
	; P8LE-NEXT: mulhd r5, r7, r5			; P8LE-NEXT: mulhdu r3, r6, r3
	; P8LE-NEXT: mulhd r4, r8, r4			; P8LE-NEXT: mulld r6, r9, r5
	; P8LE-NEXT: rldicl r9, r3, 1, 63			; P8LE-NEXT: sradi r9, r10, 63
	; P8LE-NEXT: sradi r3, r3, 11			; P8LE-NEXT: mulhdu r11, r10, r4
	; P8LE-NEXT: add r3, r3, r9			; P8LE-NEXT: mulhdu r5, r7, r5
	; P8LE-NEXT: rldicl r9, r5, 1, 63			; P8LE-NEXT: addis r7, r2, .LCPI6_0@toc@ha
	; P8LE-NEXT: add r4, r4, r8			; P8LE-NEXT: mulld r4, r9, r4
	; P8LE-NEXT: sradi r5, r5, 8			; P8LE-NEXT: addi r7, r7, .LCPI6_0@toc@l
				; P8LE-NEXT: lxvd2x vs0, 0, r7
				; P8LE-NEXT: add r3, r3, r8
				; P8LE-NEXT: li r7, 0
				; P8LE-NEXT: mtfprd f2, r3
				; P8LE-NEXT: sub r3, r11, r10
				; P8LE-NEXT: add r5, r5, r6
				; P8LE-NEXT: mtfprd f1, r7
				; P8LE-NEXT: addis r6, r2, .LCPI6_3@toc@ha
				; P8LE-NEXT: add r3, r3, r4
				; P8LE-NEXT: addis r4, r2, .LCPI6_1@toc@ha
				; P8LE-NEXT: xxswapd v4, vs0
				; P8LE-NEXT: mtfprd f0, r5
				; P8LE-NEXT: addi r6, r6, .LCPI6_3@toc@l
				; P8LE-NEXT: mtfprd f4, r3
				; P8LE-NEXT: addis r3, r2, .LCPI6_2@toc@ha
				; P8LE-NEXT: addi r4, r4, .LCPI6_1@toc@l
				; P8LE-NEXT: lxvd2x vs3, 0, r6
				; P8LE-NEXT: addi r3, r3, .LCPI6_2@toc@l
				; P8LE-NEXT: xxmrghd v5, vs0, vs1
				; P8LE-NEXT: lxvd2x vs0, 0, r4
				; P8LE-NEXT: addis r4, r2, .LCPI6_4@toc@ha
				; P8LE-NEXT: xxmrghd v0, vs2, vs4
				; P8LE-NEXT: lxvd2x vs1, 0, r3
				; P8LE-NEXT: xxland v1, v2, v4
				; P8LE-NEXT: addi r4, r4, .LCPI6_4@toc@l
				; P8LE-NEXT: xxland v4, v3, v4
				; P8LE-NEXT: xxswapd v6, vs3
				; P8LE-NEXT: lxvd2x vs2, 0, r4
				; P8LE-NEXT: vaddudm v5, v5, v1
				; P8LE-NEXT: xxswapd v1, vs0
				; P8LE-NEXT: vaddudm v4, v0, v4
				; P8LE-NEXT: xxswapd v0, vs1
				; P8LE-NEXT: vsrad v6, v5, v6
				; P8LE-NEXT: xxswapd v7, vs2
				; P8LE-NEXT: vsrd v5, v5, v1
				; P8LE-NEXT: vsrd v1, v4, v1
				; P8LE-NEXT: vsrad v4, v4, v0
				; P8LE-NEXT: xxland v5, v5, v7
				; P8LE-NEXT: vaddudm v4, v4, v1
				; P8LE-NEXT: vaddudm v5, v6, v5
				; P8LE-NEXT: xxswapd vs0, v4
				; P8LE-NEXT: mfvsrd r3, v4
				; P8LE-NEXT: mfvsrd r5, v5
				; P8LE-NEXT: xxswapd vs1, v5
	; P8LE-NEXT: mulli r3, r3, 5423			; P8LE-NEXT: mulli r3, r3, 5423
	; P8LE-NEXT: add r5, r5, r9			; P8LE-NEXT: mffprd r4, f0
	; P8LE-NEXT: rldicl r9, r4, 1, 63
	; P8LE-NEXT: sradi r4, r4, 4
	; P8LE-NEXT: mulli r5, r5, 654			; P8LE-NEXT: mulli r5, r5, 654
	; P8LE-NEXT: add r4, r4, r9			; P8LE-NEXT: mffprd r6, f1
	; P8LE-NEXT: mulli r4, r4, 23			; P8LE-NEXT: mulli r4, r4, 23
	; P8LE-NEXT: sub r3, r6, r3			; P8LE-NEXT: mtfprd f0, r6
	; P8LE-NEXT: mtfprd f0, r3			; P8LE-NEXT: mtfprd f1, r3
	; P8LE-NEXT: sub r5, r7, r5			; P8LE-NEXT: mtfprd f3, r5
	; P8LE-NEXT: mtfprd f1, r5			; P8LE-NEXT: mtfprd f2, r4
	; P8LE-NEXT: sub r3, r8, r4			; P8LE-NEXT: xxmrghd v5, vs3, vs0
	; P8LE-NEXT: li r4, 0			; P8LE-NEXT: xxmrghd v4, vs1, vs2
	; P8LE-NEXT: mtfprd f2, r3			; P8LE-NEXT: vsubudm v2, v2, v5
	; P8LE-NEXT: mtfprd f3, r4			; P8LE-NEXT: vsubudm v3, v3, v4
	; P8LE-NEXT: xxmrghd v3, vs0, vs2
	; P8LE-NEXT: xxmrghd v2, vs1, vs3
	; P8LE-NEXT: blr			; P8LE-NEXT: blr
	;			;
	; P8BE-LABEL: dont_fold_srem_i64:			; P8BE-LABEL: dont_fold_srem_i64:
	; P8BE: # %bb.0:			; P8BE: # %bb.0:
	; P8BE-NEXT: lis r4, -19946			; P8BE-NEXT: lis r4, -19946
	; P8BE-NEXT: lis r3, 24749			; P8BE-NEXT: lis r3, 24749
	; P8BE-NEXT: xxswapd vs0, v3			; P8BE-NEXT: xxswapd vs0, v3
				; P8BE-NEXT: mfvsrd r6, v3
	; P8BE-NEXT: lis r5, 25653			; P8BE-NEXT: lis r5, 25653
	; P8BE-NEXT: xxswapd vs1, v2
	; P8BE-NEXT: ori r4, r4, 17096			; P8BE-NEXT: ori r4, r4, 17096
	; P8BE-NEXT: ori r3, r3, 47142			; P8BE-NEXT: ori r3, r3, 47142
				; P8BE-NEXT: xxswapd vs1, v2
	; P8BE-NEXT: ori r5, r5, 15432			; P8BE-NEXT: ori r5, r5, 15432
	; P8BE-NEXT: mfvsrd r6, v3
	; P8BE-NEXT: sldi r4, r4, 32			; P8BE-NEXT: sldi r4, r4, 32
	; P8BE-NEXT: sldi r3, r3, 32			; P8BE-NEXT: sldi r3, r3, 32
	; P8BE-NEXT: oris r4, r4, 22795			; P8BE-NEXT: oris r4, r4, 22795
	; P8BE-NEXT: sldi r5, r5, 32
	; P8BE-NEXT: oris r3, r3, 58853			; P8BE-NEXT: oris r3, r3, 58853
	; P8BE-NEXT: mffprd r7, f0			; P8BE-NEXT: mffprd r8, f0
				; P8BE-NEXT: sradi r7, r6, 63
	; P8BE-NEXT: ori r4, r4, 8549			; P8BE-NEXT: ori r4, r4, 8549
	; P8BE-NEXT: ori r3, r3, 6055			; P8BE-NEXT: ori r3, r3, 6055
				; P8BE-NEXT: mffprd r9, f1
				; P8BE-NEXT: sldi r5, r5, 32
				; P8BE-NEXT: mulld r7, r7, r4
				; P8BE-NEXT: mulhdu r4, r6, r4
	; P8BE-NEXT: oris r5, r5, 1603			; P8BE-NEXT: oris r5, r5, 1603
	; P8BE-NEXT: mffprd r8, f1			; P8BE-NEXT: mulhdu r10, r8, r3
	; P8BE-NEXT: mulhd r4, r6, r4			; P8BE-NEXT: sradi r8, r8, 63
	; P8BE-NEXT: mulhd r3, r7, r3
	; P8BE-NEXT: ori r5, r5, 21445			; P8BE-NEXT: ori r5, r5, 21445
	; P8BE-NEXT: mulhd r5, r8, r5			; P8BE-NEXT: mulld r3, r8, r3
	; P8BE-NEXT: add r4, r4, r6			; P8BE-NEXT: sradi r8, r9, 63
	; P8BE-NEXT: rldicl r9, r3, 1, 63			; P8BE-NEXT: mulhdu r9, r9, r5
	; P8BE-NEXT: sradi r3, r3, 11			; P8BE-NEXT: mulld r5, r8, r5
	; P8BE-NEXT: rldicl r10, r4, 1, 63			; P8BE-NEXT: sub r4, r4, r6
	; P8BE-NEXT: sradi r4, r4, 4			; P8BE-NEXT: li r6, 0
	; P8BE-NEXT: add r3, r3, r9			; P8BE-NEXT: mtfprd f0, r6
	; P8BE-NEXT: rldicl r9, r5, 1, 63			; P8BE-NEXT: add r4, r4, r7
	; P8BE-NEXT: add r4, r4, r10			; P8BE-NEXT: addis r6, r2, .LCPI6_0@toc@ha
	; P8BE-NEXT: sradi r5, r5, 8			; P8BE-NEXT: mtfprd f1, r4
	; P8BE-NEXT: mulli r3, r3, 5423			; P8BE-NEXT: addi r4, r6, .LCPI6_0@toc@l
	; P8BE-NEXT: add r5, r5, r9			; P8BE-NEXT: add r3, r10, r3
	; P8BE-NEXT: mulli r4, r4, 23			; P8BE-NEXT: lxvw4x vs2, 0, r4
	; P8BE-NEXT: mulli r5, r5, 654			; P8BE-NEXT: add r4, r9, r5
	; P8BE-NEXT: sub r3, r7, r3			; P8BE-NEXT: mtfprd f3, r3
	; P8BE-NEXT: sub r4, r6, r4			; P8BE-NEXT: addis r3, r2, .LCPI6_2@toc@ha
				; P8BE-NEXT: addis r5, r2, .LCPI6_3@toc@ha
				; P8BE-NEXT: mtfprd f4, r4
				; P8BE-NEXT: addis r4, r2, .LCPI6_1@toc@ha
				; P8BE-NEXT: addi r3, r3, .LCPI6_2@toc@l
				; P8BE-NEXT: xxmrghd v4, vs1, vs3
				; P8BE-NEXT: addi r4, r4, .LCPI6_1@toc@l
				; P8BE-NEXT: lxvd2x v1, 0, r3
				; P8BE-NEXT: addi r3, r5, .LCPI6_3@toc@l
				; P8BE-NEXT: xxmrghd v0, vs0, vs4
				; P8BE-NEXT: xxland v5, v3, vs2
				; P8BE-NEXT: xxland v6, v2, vs2
				; P8BE-NEXT: vaddudm v4, v4, v5
				; P8BE-NEXT: lxvd2x v5, 0, r4
				; P8BE-NEXT: vaddudm v0, v0, v6
				; P8BE-NEXT: lxvd2x v6, 0, r3
				; P8BE-NEXT: addis r3, r2, .LCPI6_4@toc@ha
				; P8BE-NEXT: addi r3, r3, .LCPI6_4@toc@l
				; P8BE-NEXT: vsrad v1, v4, v1
				; P8BE-NEXT: lxvw4x vs0, 0, r3
				; P8BE-NEXT: vsrd v4, v4, v5
				; P8BE-NEXT: vsrd v5, v0, v5
				; P8BE-NEXT: vsrad v6, v0, v6
				; P8BE-NEXT: xxland v5, v5, vs0
				; P8BE-NEXT: vaddudm v4, v1, v4
				; P8BE-NEXT: vaddudm v5, v6, v5
				; P8BE-NEXT: mfvsrd r3, v4
				; P8BE-NEXT: xxswapd vs0, v4
				; P8BE-NEXT: xxswapd vs1, v5
				; P8BE-NEXT: mulli r3, r3, 23
				; P8BE-NEXT: mffprd r4, f0
				; P8BE-NEXT: mffprd r5, f1
				; P8BE-NEXT: mulli r4, r4, 5423
	; P8BE-NEXT: mtfprd f0, r3			; P8BE-NEXT: mtfprd f0, r3
	; P8BE-NEXT: sub r3, r8, r5			; P8BE-NEXT: mulli r3, r5, 654
				; P8BE-NEXT: mfvsrd r5, v5
	; P8BE-NEXT: mtfprd f1, r4			; P8BE-NEXT: mtfprd f1, r4
	; P8BE-NEXT: li r4, 0			; P8BE-NEXT: mtfprd f2, r5
	; P8BE-NEXT: mtfprd f2, r3			; P8BE-NEXT: mtfprd f3, r3
	; P8BE-NEXT: mtfprd f3, r4			; P8BE-NEXT: xxmrghd v4, vs0, vs1
	; P8BE-NEXT: xxmrghd v3, vs1, vs0			; P8BE-NEXT: xxmrghd v5, vs2, vs3
	; P8BE-NEXT: xxmrghd v2, vs3, vs2			; P8BE-NEXT: vsubudm v3, v3, v4
				; P8BE-NEXT: vsubudm v2, v2, v5
	; P8BE-NEXT: blr			; P8BE-NEXT: blr
	%1 = srem <4 x i64> %x, <i64 1, i64 654, i64 23, i64 5423>			%1 = srem <4 x i64> %x, <i64 1, i64 654, i64 23, i64 5423>
	ret <4 x i64> %1			ret <4 x i64> %1
	}			}

llvm/test/CodeGen/PowerPC/urem-lkk.ll

	Show First 20 Lines • Show All 81 Lines • ▼ Show 20 Lines
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: blr			; CHECK-NEXT: blr
	%1 = urem i32 %x, 4294967296			%1 = urem i32 %x, 4294967296
	ret i32 %1			ret i32 %1
	}			}

	; Don't fold i64 urem			; Don't fold i64 urem
	define i64 @dont_fold_urem_i64(i64 %x) {			define i64 @dont_fold_urem_i64(i64 %x) {
	; CHECK-LABEL: dont_fold_urem_i64:			; CHECK64-LABEL: dont_fold_urem_i64:
	; CHECK: # %bb.0:			; CHECK64: # %bb.0:
	; CHECK-NEXT: mflr 0			; CHECK64-NEXT: mflr 0
	; CHECK-NEXT: stw 0, 4(1)			; CHECK64-NEXT: stw 0, 4(1)
	; CHECK-NEXT: stwu 1, -16(1)			; CHECK64-NEXT: stwu 1, -32(1)
	; CHECK-NEXT: .cfi_def_cfa_offset 16			; CHECK64-NEXT: .cfi_def_cfa_offset 32
	; CHECK-NEXT: .cfi_offset lr, 4			; CHECK64-NEXT: .cfi_offset lr, 4
	; CHECK-NEXT: li 5, 0			; CHECK64-NEXT: .cfi_offset r29, -12
	; CHECK-NEXT: li 6, 98			; CHECK64-NEXT: .cfi_offset r30, -8
	; CHECK-NEXT: bl __umoddi3			; CHECK64-NEXT: rotlwi 6, 4, 31
	; CHECK-NEXT: lwz 0, 20(1)			; CHECK64-NEXT: stw 29, 20(1) # 4-byte Folded Spill
	; CHECK-NEXT: addi 1, 1, 16			; CHECK64-NEXT: mr 29, 3
	; CHECK-NEXT: mtlr 0			; CHECK64-NEXT: rlwimi 6, 3, 31, 0, 0
	; CHECK-NEXT: blr			; CHECK64-NEXT: srwi 5, 3, 1
				; CHECK64-NEXT: stw 30, 24(1) # 4-byte Folded Spill
				; CHECK64-NEXT: mr 30, 4
				; CHECK64-NEXT: lis 3, 21399
				; CHECK64-NEXT: lis 4, -17388
				; CHECK64-NEXT: ori 9, 3, 33436
				; CHECK64-NEXT: ori 10, 4, 58849
				; CHECK64-NEXT: li 3, 0
				; CHECK64-NEXT: li 4, 0
				; CHECK64-NEXT: li 7, 0
				; CHECK64-NEXT: li 8, 0
				; CHECK64-NEXT: bl __multi3
				; CHECK64-NEXT: rotlwi 4, 4, 28
				; CHECK64-NEXT: li 5, 98
				; CHECK64-NEXT: rlwimi 4, 3, 28, 0, 3
				; CHECK64-NEXT: srwi 3, 3, 4
				; CHECK64-NEXT: mulhwu 5, 4, 5
				; CHECK64-NEXT: mulli 3, 3, 98
				; CHECK64-NEXT: mulli 4, 4, 98
				; CHECK64-NEXT: add 3, 5, 3
				; CHECK64-NEXT: subc 4, 30, 4
				; CHECK64-NEXT: lwz 30, 24(1) # 4-byte Folded Reload
				; CHECK64-NEXT: subfe 3, 3, 29
				; CHECK64-NEXT: lwz 29, 20(1) # 4-byte Folded Reload
				; CHECK64-NEXT: lwz 0, 36(1)
				; CHECK64-NEXT: addi 1, 1, 32
				; CHECK64-NEXT: mtlr 0
				; CHECK64-NEXT: blr
				;
				; CHECK32-LABEL: dont_fold_urem_i64:
				; CHECK32: # %bb.0:
				; CHECK32-NEXT: mflr 0
				; CHECK32-NEXT: stw 0, 4(1)
				; CHECK32-NEXT: stwu 1, -32(1)
				; CHECK32-NEXT: .cfi_def_cfa_offset 32
				; CHECK32-NEXT: .cfi_offset lr, 4
				; CHECK32-NEXT: .cfi_offset r29, -12
				; CHECK32-NEXT: .cfi_offset r30, -8
				; CHECK32-NEXT: rotlwi 6, 4, 31
				; CHECK32-NEXT: stw 29, 20(1) # 4-byte Folded Spill
				; CHECK32-NEXT: mr 29, 3
				; CHECK32-NEXT: stw 30, 24(1) # 4-byte Folded Spill
				; CHECK32-NEXT: mr 30, 4
				; CHECK32-NEXT: rlwimi 6, 3, 31, 0, 0
				; CHECK32-NEXT: srwi 5, 3, 1
				; CHECK32-NEXT: lis 3, 21399
				; CHECK32-NEXT: lis 4, -17388
				; CHECK32-NEXT: ori 9, 3, 33436
				; CHECK32-NEXT: ori 10, 4, 58849
				; CHECK32-NEXT: li 3, 0
				; CHECK32-NEXT: li 4, 0
				; CHECK32-NEXT: li 7, 0
				; CHECK32-NEXT: li 8, 0
				; CHECK32-NEXT: bl __multi3
				; CHECK32-NEXT: rotlwi 4, 4, 28
				; CHECK32-NEXT: li 5, 98
				; CHECK32-NEXT: rlwimi 4, 3, 28, 0, 3
				; CHECK32-NEXT: srwi 3, 3, 4
				; CHECK32-NEXT: mulhwu 5, 4, 5
				; CHECK32-NEXT: mulli 3, 3, 98
				; CHECK32-NEXT: add 3, 5, 3
				; CHECK32-NEXT: mulli 4, 4, 98
				; CHECK32-NEXT: subc 4, 30, 4
				; CHECK32-NEXT: subfe 3, 3, 29
				; CHECK32-NEXT: lwz 30, 24(1) # 4-byte Folded Reload
				; CHECK32-NEXT: lwz 29, 20(1) # 4-byte Folded Reload
				; CHECK32-NEXT: lwz 0, 36(1)
				; CHECK32-NEXT: addi 1, 1, 32
				; CHECK32-NEXT: mtlr 0
				; CHECK32-NEXT: blr
	%1 = urem i64 %x, 98			%1 = urem i64 %x, 98
	ret i64 %1			ret i64 %1
	}			}

llvm/test/CodeGen/PowerPC/urem-vector-lkk.ll

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: llc -mcpu=pwr9 -verify-machineinstrs -ppc-vsr-nums-as-vr -ppc-asm-full-reg-names \			; RUN: llc -mcpu=pwr9 -verify-machineinstrs -ppc-vsr-nums-as-vr -ppc-asm-full-reg-names \
	; RUN: -mtriple=powerpc64le-unknown-linux-gnu < %s \| FileCheck %s --check-prefixes=CHECK,P9LE			; RUN: -mtriple=powerpc64le-unknown-linux-gnu < %s \| FileCheck %s --check-prefixes=CHECK,P9LE
	; RUN: llc -mcpu=pwr9 -verify-machineinstrs -ppc-vsr-nums-as-vr -ppc-asm-full-reg-names \			; RUN: llc -mcpu=pwr9 -verify-machineinstrs -ppc-vsr-nums-as-vr -ppc-asm-full-reg-names \
	; RUN: -mtriple=powerpc64-unknown-linux-gnu < %s \| FileCheck %s --check-prefixes=CHECK,P9BE			; RUN: -mtriple=powerpc64-unknown-linux-gnu < %s \| FileCheck %s --check-prefixes=CHECK,P9BE
	; RUN: llc -mcpu=pwr8 -verify-machineinstrs -ppc-vsr-nums-as-vr -ppc-asm-full-reg-names \			; RUN: llc -mcpu=pwr8 -verify-machineinstrs -ppc-vsr-nums-as-vr -ppc-asm-full-reg-names \
	; RUN: -mtriple=powerpc64le-unknown-linux-gnu < %s \| FileCheck %s --check-prefixes=CHECK,P8LE			; RUN: -mtriple=powerpc64le-unknown-linux-gnu < %s \| FileCheck %s --check-prefixes=CHECK,P8LE
	; RUN: llc -mcpu=pwr8 -verify-machineinstrs -ppc-vsr-nums-as-vr -ppc-asm-full-reg-names \			; RUN: llc -mcpu=pwr8 -verify-machineinstrs -ppc-vsr-nums-as-vr -ppc-asm-full-reg-names \
	; RUN: -mtriple=powerpc64-unknown-linux-gnu < %s \| FileCheck %s --check-prefixes=CHECK,P8BE			; RUN: -mtriple=powerpc64-unknown-linux-gnu < %s \| FileCheck %s --check-prefixes=CHECK,P8BE

	define <4 x i16> @fold_urem_vec_1(<4 x i16> %x) {			define <4 x i16> @fold_urem_vec_1(<4 x i16> %x) {
	; P9LE-LABEL: fold_urem_vec_1:			; P9LE-LABEL: fold_urem_vec_1:
	; P9LE: # %bb.0:			; P9LE: # %bb.0:
	; P9LE-NEXT: li r3, 4			; P9LE-NEXT: addis r3, r2, .LCPI0_0@toc@ha
	; P9LE-NEXT: lis r4, 21399			; P9LE-NEXT: xxlxor v4, v4, v4
	; P9LE-NEXT: lis r5, 8456			; P9LE-NEXT: addi r3, r3, .LCPI0_0@toc@l
	; P9LE-NEXT: vextuhrx r3, r3, v2			; P9LE-NEXT: lxvx v3, 0, r3
	; P9LE-NEXT: ori r4, r4, 33437			; P9LE-NEXT: addis r3, r2, .LCPI0_1@toc@ha
	; P9LE-NEXT: ori r5, r5, 16913			; P9LE-NEXT: addi r3, r3, .LCPI0_1@toc@l
	; P9LE-NEXT: clrlwi r3, r3, 16			; P9LE-NEXT: lxvx v5, 0, r3
	; P9LE-NEXT: mulhwu r4, r3, r4			; P9LE-NEXT: addis r3, r2, .LCPI0_2@toc@ha
	; P9LE-NEXT: srwi r4, r4, 5			; P9LE-NEXT: vsrh v3, v2, v3
	; P9LE-NEXT: mulli r4, r4, 98			; P9LE-NEXT: addi r3, r3, .LCPI0_2@toc@l
	; P9LE-NEXT: sub r3, r3, r4			; P9LE-NEXT: vmrglh v3, v4, v3
	; P9LE-NEXT: lis r4, 16727			; P9LE-NEXT: vmuluwm v3, v3, v5
	; P9LE-NEXT: mtvsrd v3, r3			; P9LE-NEXT: vspltisw v5, 8
	; P9LE-NEXT: li r3, 6			; P9LE-NEXT: vadduwm v5, v5, v5
	; P9LE-NEXT: ori r4, r4, 2287			; P9LE-NEXT: vsrw v3, v3, v5
	; P9LE-NEXT: vextuhrx r3, r3, v2			; P9LE-NEXT: vpkuwum v0, v3, v3
	; P9LE-NEXT: clrlwi r3, r3, 16			; P9LE-NEXT: vsubuhm v0, v2, v0
	; P9LE-NEXT: mulhwu r4, r3, r4			; P9LE-NEXT: vmrglh v4, v4, v0
	; P9LE-NEXT: srwi r4, r4, 8			; P9LE-NEXT: lxvx v0, 0, r3
	; P9LE-NEXT: mulli r4, r4, 1003			; P9LE-NEXT: addis r3, r2, .LCPI0_3@toc@ha
	; P9LE-NEXT: sub r3, r3, r4			; P9LE-NEXT: addi r3, r3, .LCPI0_3@toc@l
	; P9LE-NEXT: mtvsrd v4, r3			; P9LE-NEXT: vmuluwm v4, v4, v0
	; P9LE-NEXT: li r3, 2			; P9LE-NEXT: vsrw v4, v4, v5
	; P9LE-NEXT: vextuhrx r3, r3, v2			; P9LE-NEXT: vxor v5, v5, v5
	; P9LE-NEXT: vmrghh v3, v4, v3			; P9LE-NEXT: vadduhm v3, v4, v3
	; P9LE-NEXT: clrlwi r4, r3, 16			; P9LE-NEXT: lxvx v4, 0, r3
	; P9LE-NEXT: rlwinm r3, r3, 30, 18, 31			; P9LE-NEXT: addis r3, r2, .LCPI0_4@toc@ha
	; P9LE-NEXT: mulhwu r3, r3, r5			; P9LE-NEXT: vpkuwum v3, v3, v3
	; P9LE-NEXT: srwi r3, r3, 2			; P9LE-NEXT: addi r3, r3, .LCPI0_4@toc@l
	; P9LE-NEXT: mulli r3, r3, 124			; P9LE-NEXT: vsrh v3, v3, v4
	; P9LE-NEXT: sub r3, r4, r3			; P9LE-NEXT: lxvx v4, 0, r3
	; P9LE-NEXT: lis r4, 22765			; P9LE-NEXT: vmladduhm v3, v3, v4, v5
	; P9LE-NEXT: mtvsrd v4, r3			; P9LE-NEXT: vsubuhm v2, v2, v3
	; P9LE-NEXT: li r3, 0
	; P9LE-NEXT: ori r4, r4, 8969
	; P9LE-NEXT: vextuhrx r3, r3, v2
	; P9LE-NEXT: clrlwi r3, r3, 16
	; P9LE-NEXT: mulhwu r4, r3, r4
	; P9LE-NEXT: sub r5, r3, r4
	; P9LE-NEXT: srwi r5, r5, 1
	; P9LE-NEXT: add r4, r5, r4
	; P9LE-NEXT: srwi r4, r4, 6
	; P9LE-NEXT: mulli r4, r4, 95
	; P9LE-NEXT: sub r3, r3, r4
	; P9LE-NEXT: mtvsrd v2, r3
	; P9LE-NEXT: vmrghh v2, v4, v2
	; P9LE-NEXT: vmrglw v2, v3, v2
	; P9LE-NEXT: blr			; P9LE-NEXT: blr
	;			;
	; P9BE-LABEL: fold_urem_vec_1:			; P9BE-LABEL: fold_urem_vec_1:
	; P9BE: # %bb.0:			; P9BE: # %bb.0:
	; P9BE-NEXT: li r3, 6			; P9BE-NEXT: addis r3, r2, .LCPI0_0@toc@ha
	; P9BE-NEXT: lis r4, 16727			; P9BE-NEXT: xxlxor v5, v5, v5
	; P9BE-NEXT: lis r5, 8456			; P9BE-NEXT: addi r3, r3, .LCPI0_0@toc@l
	; P9BE-NEXT: vextuhlx r3, r3, v2			; P9BE-NEXT: lxvx v3, 0, r3
	; P9BE-NEXT: ori r4, r4, 2287			; P9BE-NEXT: addis r3, r2, .LCPI0_1@toc@ha
	; P9BE-NEXT: ori r5, r5, 16913			; P9BE-NEXT: addi r3, r3, .LCPI0_1@toc@l
	; P9BE-NEXT: clrlwi r3, r3, 16			; P9BE-NEXT: lxvx v4, 0, r3
	; P9BE-NEXT: mulhwu r4, r3, r4			; P9BE-NEXT: addis r3, r2, .LCPI0_2@toc@ha
	; P9BE-NEXT: srwi r4, r4, 8			; P9BE-NEXT: vsrh v3, v2, v3
	; P9BE-NEXT: mulli r4, r4, 1003			; P9BE-NEXT: addi r3, r3, .LCPI0_2@toc@l
	; P9BE-NEXT: sub r3, r3, r4			; P9BE-NEXT: lxvx v0, 0, r3
	; P9BE-NEXT: lis r4, 21399			; P9BE-NEXT: addis r3, r2, .LCPI0_3@toc@ha
	; P9BE-NEXT: sldi r3, r3, 48			; P9BE-NEXT: vperm v3, v5, v3, v4
	; P9BE-NEXT: ori r4, r4, 33437			; P9BE-NEXT: addi r3, r3, .LCPI0_3@toc@l
	; P9BE-NEXT: mtvsrd v3, r3			; P9BE-NEXT: vmuluwm v3, v3, v0
	; P9BE-NEXT: li r3, 4			; P9BE-NEXT: vspltisw v0, 8
	; P9BE-NEXT: vextuhlx r3, r3, v2			; P9BE-NEXT: vadduwm v0, v0, v0
	; P9BE-NEXT: clrlwi r3, r3, 16			; P9BE-NEXT: vsrw v3, v3, v0
	; P9BE-NEXT: mulhwu r4, r3, r4			; P9BE-NEXT: vpkuwum v1, v3, v3
	; P9BE-NEXT: srwi r4, r4, 5			; P9BE-NEXT: vsubuhm v1, v2, v1
	; P9BE-NEXT: mulli r4, r4, 98			; P9BE-NEXT: vperm v4, v5, v1, v4
	; P9BE-NEXT: sub r3, r3, r4			; P9BE-NEXT: lxvx v5, 0, r3
	; P9BE-NEXT: sldi r3, r3, 48			; P9BE-NEXT: addis r3, r2, .LCPI0_4@toc@ha
	; P9BE-NEXT: mtvsrd v4, r3			; P9BE-NEXT: addi r3, r3, .LCPI0_4@toc@l
	; P9BE-NEXT: li r3, 2			; P9BE-NEXT: vmuluwm v4, v4, v5
	; P9BE-NEXT: vextuhlx r3, r3, v2			; P9BE-NEXT: vxor v5, v5, v5
	; P9BE-NEXT: vmrghh v3, v4, v3			; P9BE-NEXT: vsrw v4, v4, v0
	; P9BE-NEXT: clrlwi r4, r3, 16			; P9BE-NEXT: vadduhm v3, v4, v3
	; P9BE-NEXT: rlwinm r3, r3, 30, 18, 31			; P9BE-NEXT: lxvx v4, 0, r3
	; P9BE-NEXT: mulhwu r3, r3, r5			; P9BE-NEXT: addis r3, r2, .LCPI0_5@toc@ha
	; P9BE-NEXT: srwi r3, r3, 2			; P9BE-NEXT: vpkuwum v3, v3, v3
	; P9BE-NEXT: mulli r3, r3, 124			; P9BE-NEXT: addi r3, r3, .LCPI0_5@toc@l
	; P9BE-NEXT: sub r3, r4, r3			; P9BE-NEXT: vsrh v3, v3, v4
	; P9BE-NEXT: lis r4, 22765			; P9BE-NEXT: lxvx v4, 0, r3
	; P9BE-NEXT: sldi r3, r3, 48			; P9BE-NEXT: vmladduhm v3, v3, v4, v5
	; P9BE-NEXT: ori r4, r4, 8969			; P9BE-NEXT: vsubuhm v2, v2, v3
	; P9BE-NEXT: mtvsrd v4, r3
	; P9BE-NEXT: li r3, 0
	; P9BE-NEXT: vextuhlx r3, r3, v2
	; P9BE-NEXT: clrlwi r3, r3, 16
	; P9BE-NEXT: mulhwu r4, r3, r4
	; P9BE-NEXT: sub r5, r3, r4
	; P9BE-NEXT: srwi r5, r5, 1
	; P9BE-NEXT: add r4, r5, r4
	; P9BE-NEXT: srwi r4, r4, 6
	; P9BE-NEXT: mulli r4, r4, 95
	; P9BE-NEXT: sub r3, r3, r4
	; P9BE-NEXT: sldi r3, r3, 48
	; P9BE-NEXT: mtvsrd v2, r3
	; P9BE-NEXT: vmrghh v2, v2, v4
	; P9BE-NEXT: vmrghw v2, v2, v3
	; P9BE-NEXT: blr			; P9BE-NEXT: blr
	;			;
	; P8LE-LABEL: fold_urem_vec_1:			; P8LE-LABEL: fold_urem_vec_1:
	; P8LE: # %bb.0:			; P8LE: # %bb.0:
	; P8LE-NEXT: xxswapd vs0, v2			; P8LE-NEXT: addis r3, r2, .LCPI0_0@toc@ha
	; P8LE-NEXT: lis r3, 22765			; P8LE-NEXT: xxlxor v4, v4, v4
	; P8LE-NEXT: lis r7, 21399			; P8LE-NEXT: vspltisw v5, 8
	; P8LE-NEXT: lis r9, 16727			; P8LE-NEXT: addi r3, r3, .LCPI0_0@toc@l
	; P8LE-NEXT: lis r10, 8456			; P8LE-NEXT: lvx v3, 0, r3
	; P8LE-NEXT: ori r3, r3, 8969			; P8LE-NEXT: addis r3, r2, .LCPI0_1@toc@ha
	; P8LE-NEXT: ori r7, r7, 33437			; P8LE-NEXT: addi r3, r3, .LCPI0_1@toc@l
	; P8LE-NEXT: ori r9, r9, 2287			; P8LE-NEXT: vadduwm v5, v5, v5
	; P8LE-NEXT: ori r10, r10, 16913			; P8LE-NEXT: vsrh v3, v2, v3
	; P8LE-NEXT: mffprd r4, f0			; P8LE-NEXT: lvx v0, 0, r3
	; P8LE-NEXT: clrldi r6, r4, 48			; P8LE-NEXT: addis r3, r2, .LCPI0_2@toc@ha
	; P8LE-NEXT: rldicl r5, r4, 32, 48			; P8LE-NEXT: addi r3, r3, .LCPI0_2@toc@l
	; P8LE-NEXT: clrlwi r6, r6, 16			; P8LE-NEXT: vmrglh v3, v4, v3
	; P8LE-NEXT: rldicl r8, r4, 16, 48			; P8LE-NEXT: vmuluwm v3, v3, v0
	; P8LE-NEXT: clrlwi r5, r5, 16			; P8LE-NEXT: vsrw v3, v3, v5
	; P8LE-NEXT: mulhwu r3, r6, r3			; P8LE-NEXT: vpkuwum v0, v3, v3
	; P8LE-NEXT: rldicl r4, r4, 48, 48			; P8LE-NEXT: vsubuhm v0, v2, v0
	; P8LE-NEXT: clrlwi r8, r8, 16			; P8LE-NEXT: vmrglh v4, v4, v0
	; P8LE-NEXT: rlwinm r11, r4, 30, 18, 31			; P8LE-NEXT: lvx v0, 0, r3
	; P8LE-NEXT: mulhwu r7, r5, r7			; P8LE-NEXT: addis r3, r2, .LCPI0_3@toc@ha
	; P8LE-NEXT: clrlwi r4, r4, 16			; P8LE-NEXT: addi r3, r3, .LCPI0_3@toc@l
	; P8LE-NEXT: mulhwu r9, r8, r9			; P8LE-NEXT: vmuluwm v4, v4, v0
	; P8LE-NEXT: mulhwu r10, r11, r10			; P8LE-NEXT: vsrw v4, v4, v5
	; P8LE-NEXT: sub r11, r6, r3			; P8LE-NEXT: vadduhm v3, v4, v3
	; P8LE-NEXT: srwi r11, r11, 1			; P8LE-NEXT: lvx v4, 0, r3
	; P8LE-NEXT: srwi r7, r7, 5			; P8LE-NEXT: addis r3, r2, .LCPI0_4@toc@ha
	; P8LE-NEXT: add r3, r11, r3			; P8LE-NEXT: addi r3, r3, .LCPI0_4@toc@l
	; P8LE-NEXT: srwi r9, r9, 8			; P8LE-NEXT: vpkuwum v3, v3, v3
	; P8LE-NEXT: srwi r10, r10, 2			; P8LE-NEXT: lvx v5, 0, r3
	; P8LE-NEXT: srwi r3, r3, 6			; P8LE-NEXT: vsrh v3, v3, v4
	; P8LE-NEXT: mulli r7, r7, 98			; P8LE-NEXT: vxor v4, v4, v4
	; P8LE-NEXT: mulli r9, r9, 1003			; P8LE-NEXT: vmladduhm v3, v3, v5, v4
	; P8LE-NEXT: mulli r3, r3, 95			; P8LE-NEXT: vsubuhm v2, v2, v3
	; P8LE-NEXT: mulli r10, r10, 124
	; P8LE-NEXT: sub r5, r5, r7
	; P8LE-NEXT: sub r7, r8, r9
	; P8LE-NEXT: sub r3, r6, r3
	; P8LE-NEXT: mtvsrd v2, r5
	; P8LE-NEXT: sub r4, r4, r10
	; P8LE-NEXT: mtvsrd v3, r7
	; P8LE-NEXT: mtvsrd v4, r3
	; P8LE-NEXT: mtvsrd v5, r4
	; P8LE-NEXT: vmrghh v2, v3, v2
	; P8LE-NEXT: vmrghh v3, v5, v4
	; P8LE-NEXT: vmrglw v2, v2, v3
	; P8LE-NEXT: blr			; P8LE-NEXT: blr
	;			;
	; P8BE-LABEL: fold_urem_vec_1:			; P8BE-LABEL: fold_urem_vec_1:
	; P8BE: # %bb.0:			; P8BE: # %bb.0:
	; P8BE-NEXT: mfvsrd r4, v2			; P8BE-NEXT: addis r3, r2, .LCPI0_0@toc@ha
	; P8BE-NEXT: lis r3, 22765			; P8BE-NEXT: xxlxor v5, v5, v5
	; P8BE-NEXT: lis r7, 16727			; P8BE-NEXT: vspltisw v0, 8
	; P8BE-NEXT: lis r9, 21399			; P8BE-NEXT: addi r3, r3, .LCPI0_0@toc@l
	; P8BE-NEXT: lis r10, 8456			; P8BE-NEXT: lxvw4x v3, 0, r3
	; P8BE-NEXT: ori r3, r3, 8969			; P8BE-NEXT: addis r3, r2, .LCPI0_1@toc@ha
	; P8BE-NEXT: ori r7, r7, 2287			; P8BE-NEXT: addi r3, r3, .LCPI0_1@toc@l
	; P8BE-NEXT: ori r9, r9, 33437			; P8BE-NEXT: vadduwm v0, v0, v0
	; P8BE-NEXT: ori r10, r10, 16913			; P8BE-NEXT: lxvw4x v4, 0, r3
	; P8BE-NEXT: rldicl r6, r4, 16, 48			; P8BE-NEXT: addis r3, r2, .LCPI0_2@toc@ha
	; P8BE-NEXT: clrldi r5, r4, 48			; P8BE-NEXT: vsrh v3, v2, v3
	; P8BE-NEXT: clrlwi r6, r6, 16			; P8BE-NEXT: addi r3, r3, .LCPI0_2@toc@l
	; P8BE-NEXT: rldicl r8, r4, 48, 48			; P8BE-NEXT: lxvw4x v1, 0, r3
	; P8BE-NEXT: clrlwi r5, r5, 16			; P8BE-NEXT: addis r3, r2, .LCPI0_3@toc@ha
	; P8BE-NEXT: mulhwu r3, r6, r3			; P8BE-NEXT: addi r3, r3, .LCPI0_3@toc@l
	; P8BE-NEXT: rldicl r4, r4, 32, 48			; P8BE-NEXT: vperm v3, v5, v3, v4
	; P8BE-NEXT: clrlwi r8, r8, 16			; P8BE-NEXT: vmuluwm v3, v3, v1
	; P8BE-NEXT: mulhwu r7, r5, r7			; P8BE-NEXT: vsrw v3, v3, v0
	; P8BE-NEXT: rlwinm r11, r4, 30, 18, 31			; P8BE-NEXT: vpkuwum v1, v3, v3
	; P8BE-NEXT: clrlwi r4, r4, 16			; P8BE-NEXT: vsubuhm v1, v2, v1
	; P8BE-NEXT: mulhwu r9, r8, r9			; P8BE-NEXT: vperm v4, v5, v1, v4
	; P8BE-NEXT: mulhwu r10, r11, r10			; P8BE-NEXT: lxvw4x v5, 0, r3
	; P8BE-NEXT: sub r11, r6, r3			; P8BE-NEXT: addis r3, r2, .LCPI0_4@toc@ha
	; P8BE-NEXT: srwi r11, r11, 1			; P8BE-NEXT: addi r3, r3, .LCPI0_4@toc@l
	; P8BE-NEXT: srwi r7, r7, 8			; P8BE-NEXT: vmuluwm v4, v4, v5
	; P8BE-NEXT: add r3, r11, r3			; P8BE-NEXT: vsrw v4, v4, v0
	; P8BE-NEXT: srwi r9, r9, 5			; P8BE-NEXT: vadduhm v3, v4, v3
	; P8BE-NEXT: srwi r10, r10, 2			; P8BE-NEXT: lxvw4x v4, 0, r3
	; P8BE-NEXT: mulli r7, r7, 1003			; P8BE-NEXT: addis r3, r2, .LCPI0_5@toc@ha
	; P8BE-NEXT: srwi r3, r3, 6			; P8BE-NEXT: addi r3, r3, .LCPI0_5@toc@l
	; P8BE-NEXT: mulli r9, r9, 98			; P8BE-NEXT: vpkuwum v3, v3, v3
	; P8BE-NEXT: mulli r3, r3, 95			; P8BE-NEXT: lxvw4x v5, 0, r3
	; P8BE-NEXT: mulli r10, r10, 124			; P8BE-NEXT: vsrh v3, v3, v4
	; P8BE-NEXT: sub r5, r5, r7			; P8BE-NEXT: vxor v4, v4, v4
	; P8BE-NEXT: sub r7, r8, r9			; P8BE-NEXT: vmladduhm v3, v3, v5, v4
	; P8BE-NEXT: sldi r5, r5, 48			; P8BE-NEXT: vsubuhm v2, v2, v3
	; P8BE-NEXT: sub r3, r6, r3
	; P8BE-NEXT: sub r4, r4, r10
	; P8BE-NEXT: mtvsrd v2, r5
	; P8BE-NEXT: sldi r5, r7, 48
	; P8BE-NEXT: sldi r3, r3, 48
	; P8BE-NEXT: sldi r4, r4, 48
	; P8BE-NEXT: mtvsrd v3, r5
	; P8BE-NEXT: mtvsrd v4, r3
	; P8BE-NEXT: mtvsrd v5, r4
	; P8BE-NEXT: vmrghh v2, v3, v2
	; P8BE-NEXT: vmrghh v3, v4, v5
	; P8BE-NEXT: vmrghw v2, v3, v2
	; P8BE-NEXT: blr			; P8BE-NEXT: blr
	%1 = urem <4 x i16> %x, <i16 95, i16 124, i16 98, i16 1003>			%1 = urem <4 x i16> %x, <i16 95, i16 124, i16 98, i16 1003>
	ret <4 x i16> %1			ret <4 x i16> %1
	}			}

	define <4 x i16> @fold_urem_vec_2(<4 x i16> %x) {			define <4 x i16> @fold_urem_vec_2(<4 x i16> %x) {
	; P9LE-LABEL: fold_urem_vec_2:			; P9LE-LABEL: fold_urem_vec_2:
	; P9LE: # %bb.0:			; P9LE: # %bb.0:
	; P9LE-NEXT: li r3, 0			; P9LE-NEXT: addis r3, r2, .LCPI1_0@toc@ha
	; P9LE-NEXT: lis r4, 22765			; P9LE-NEXT: xxlxor v3, v3, v3
	; P9LE-NEXT: vextuhrx r3, r3, v2			; P9LE-NEXT: vxor v5, v5, v5
	; P9LE-NEXT: ori r4, r4, 8969			; P9LE-NEXT: vmrglh v3, v3, v2
	; P9LE-NEXT: clrlwi r3, r3, 16			; P9LE-NEXT: addi r3, r3, .LCPI1_0@toc@l
	; P9LE-NEXT: mulhwu r5, r3, r4			; P9LE-NEXT: lxvx v4, 0, r3
	; P9LE-NEXT: sub r6, r3, r5			; P9LE-NEXT: addis r3, r2, .LCPI1_1@toc@ha
	; P9LE-NEXT: srwi r6, r6, 1			; P9LE-NEXT: addi r3, r3, .LCPI1_1@toc@l
	; P9LE-NEXT: add r5, r6, r5			; P9LE-NEXT: vmuluwm v3, v3, v4
	; P9LE-NEXT: srwi r5, r5, 6			; P9LE-NEXT: vspltisw v4, 11
	; P9LE-NEXT: mulli r5, r5, 95			; P9LE-NEXT: vadduwm v4, v4, v4
	; P9LE-NEXT: sub r3, r3, r5			; P9LE-NEXT: vsrw v3, v3, v4
	; P9LE-NEXT: mtvsrd v3, r3			; P9LE-NEXT: lxvx v4, 0, r3
	; P9LE-NEXT: li r3, 2			; P9LE-NEXT: vpkuwum v3, v3, v3
	; P9LE-NEXT: vextuhrx r3, r3, v2			; P9LE-NEXT: vmladduhm v3, v3, v4, v5
	; P9LE-NEXT: clrlwi r3, r3, 16			; P9LE-NEXT: vsubuhm v2, v2, v3
	; P9LE-NEXT: mulhwu r5, r3, r4
	; P9LE-NEXT: sub r6, r3, r5
	; P9LE-NEXT: srwi r6, r6, 1
	; P9LE-NEXT: add r5, r6, r5
	; P9LE-NEXT: srwi r5, r5, 6
	; P9LE-NEXT: mulli r5, r5, 95
	; P9LE-NEXT: sub r3, r3, r5
	; P9LE-NEXT: mtvsrd v4, r3
	; P9LE-NEXT: li r3, 4
	; P9LE-NEXT: vextuhrx r3, r3, v2
	; P9LE-NEXT: vmrghh v3, v4, v3
	; P9LE-NEXT: clrlwi r3, r3, 16
	; P9LE-NEXT: mulhwu r5, r3, r4
	; P9LE-NEXT: sub r6, r3, r5
	; P9LE-NEXT: srwi r6, r6, 1
	; P9LE-NEXT: add r5, r6, r5
	; P9LE-NEXT: srwi r5, r5, 6
	; P9LE-NEXT: mulli r5, r5, 95
	; P9LE-NEXT: sub r3, r3, r5
	; P9LE-NEXT: mtvsrd v4, r3
	; P9LE-NEXT: li r3, 6
	; P9LE-NEXT: vextuhrx r3, r3, v2
	; P9LE-NEXT: clrlwi r3, r3, 16
	; P9LE-NEXT: mulhwu r4, r3, r4
	; P9LE-NEXT: sub r5, r3, r4
	; P9LE-NEXT: srwi r5, r5, 1
	; P9LE-NEXT: add r4, r5, r4
	; P9LE-NEXT: srwi r4, r4, 6
	; P9LE-NEXT: mulli r4, r4, 95
	; P9LE-NEXT: sub r3, r3, r4
	; P9LE-NEXT: mtvsrd v2, r3
	; P9LE-NEXT: vmrghh v2, v2, v4
	; P9LE-NEXT: vmrglw v2, v2, v3
	; P9LE-NEXT: blr			; P9LE-NEXT: blr
	;			;
	; P9BE-LABEL: fold_urem_vec_2:			; P9BE-LABEL: fold_urem_vec_2:
	; P9BE: # %bb.0:			; P9BE: # %bb.0:
	; P9BE-NEXT: li r3, 6			; P9BE-NEXT: addis r3, r2, .LCPI1_0@toc@ha
	; P9BE-NEXT: lis r4, 22765			; P9BE-NEXT: xxlxor v4, v4, v4
	; P9BE-NEXT: vextuhlx r3, r3, v2			; P9BE-NEXT: vxor v5, v5, v5
	; P9BE-NEXT: ori r4, r4, 8969			; P9BE-NEXT: addi r3, r3, .LCPI1_0@toc@l
	; P9BE-NEXT: clrlwi r3, r3, 16			; P9BE-NEXT: lxvx v3, 0, r3
	; P9BE-NEXT: mulhwu r5, r3, r4			; P9BE-NEXT: addis r3, r2, .LCPI1_1@toc@ha
	; P9BE-NEXT: sub r6, r3, r5			; P9BE-NEXT: addi r3, r3, .LCPI1_1@toc@l
	; P9BE-NEXT: srwi r6, r6, 1			; P9BE-NEXT: vperm v3, v4, v2, v3
	; P9BE-NEXT: add r5, r6, r5			; P9BE-NEXT: lxvx v4, 0, r3
	; P9BE-NEXT: srwi r5, r5, 6			; P9BE-NEXT: addis r3, r2, .LCPI1_2@toc@ha
	; P9BE-NEXT: mulli r5, r5, 95			; P9BE-NEXT: addi r3, r3, .LCPI1_2@toc@l
	; P9BE-NEXT: sub r3, r3, r5			; P9BE-NEXT: vmuluwm v3, v3, v4
	; P9BE-NEXT: sldi r3, r3, 48			; P9BE-NEXT: vspltisw v4, 11
	; P9BE-NEXT: mtvsrd v3, r3			; P9BE-NEXT: vadduwm v4, v4, v4
	; P9BE-NEXT: li r3, 4			; P9BE-NEXT: vsrw v3, v3, v4
	; P9BE-NEXT: vextuhlx r3, r3, v2			; P9BE-NEXT: lxvx v4, 0, r3
	; P9BE-NEXT: clrlwi r3, r3, 16			; P9BE-NEXT: vpkuwum v3, v3, v3
	; P9BE-NEXT: mulhwu r5, r3, r4			; P9BE-NEXT: vmladduhm v3, v3, v4, v5
	; P9BE-NEXT: sub r6, r3, r5			; P9BE-NEXT: vsubuhm v2, v2, v3
	; P9BE-NEXT: srwi r6, r6, 1
	; P9BE-NEXT: add r5, r6, r5
	; P9BE-NEXT: srwi r5, r5, 6
	; P9BE-NEXT: mulli r5, r5, 95
	; P9BE-NEXT: sub r3, r3, r5
	; P9BE-NEXT: sldi r3, r3, 48
	; P9BE-NEXT: mtvsrd v4, r3
	; P9BE-NEXT: li r3, 2
	; P9BE-NEXT: vextuhlx r3, r3, v2
	; P9BE-NEXT: vmrghh v3, v4, v3
	; P9BE-NEXT: clrlwi r3, r3, 16
	; P9BE-NEXT: mulhwu r5, r3, r4
	; P9BE-NEXT: sub r6, r3, r5
	; P9BE-NEXT: srwi r6, r6, 1
	; P9BE-NEXT: add r5, r6, r5
	; P9BE-NEXT: srwi r5, r5, 6
	; P9BE-NEXT: mulli r5, r5, 95
	; P9BE-NEXT: sub r3, r3, r5
	; P9BE-NEXT: sldi r3, r3, 48
	; P9BE-NEXT: mtvsrd v4, r3
	; P9BE-NEXT: li r3, 0
	; P9BE-NEXT: vextuhlx r3, r3, v2
	; P9BE-NEXT: clrlwi r3, r3, 16
	; P9BE-NEXT: mulhwu r4, r3, r4
	; P9BE-NEXT: sub r5, r3, r4
	; P9BE-NEXT: srwi r5, r5, 1
	; P9BE-NEXT: add r4, r5, r4
	; P9BE-NEXT: srwi r4, r4, 6
	; P9BE-NEXT: mulli r4, r4, 95
	; P9BE-NEXT: sub r3, r3, r4
	; P9BE-NEXT: sldi r3, r3, 48
	; P9BE-NEXT: mtvsrd v2, r3
	; P9BE-NEXT: vmrghh v2, v2, v4
	; P9BE-NEXT: vmrghw v2, v2, v3
	; P9BE-NEXT: blr			; P9BE-NEXT: blr
	;			;
	; P8LE-LABEL: fold_urem_vec_2:			; P8LE-LABEL: fold_urem_vec_2:
	; P8LE: # %bb.0:			; P8LE: # %bb.0:
	; P8LE-NEXT: xxswapd vs0, v2			; P8LE-NEXT: xxlxor v3, v3, v3
	; P8LE-NEXT: lis r3, 22765			; P8LE-NEXT: addis r3, r2, .LCPI1_0@toc@ha
	; P8LE-NEXT: ori r3, r3, 8969			; P8LE-NEXT: vspltisw v4, 11
	; P8LE-NEXT: mffprd r4, f0			; P8LE-NEXT: addi r3, r3, .LCPI1_0@toc@l
	; P8LE-NEXT: clrldi r5, r4, 48			; P8LE-NEXT: vmrglh v3, v3, v2
	; P8LE-NEXT: rldicl r6, r4, 48, 48			; P8LE-NEXT: lvx v5, 0, r3
	; P8LE-NEXT: clrlwi r5, r5, 16			; P8LE-NEXT: addis r3, r2, .LCPI1_1@toc@ha
	; P8LE-NEXT: rldicl r7, r4, 32, 48			; P8LE-NEXT: vadduwm v4, v4, v4
	; P8LE-NEXT: clrlwi r6, r6, 16			; P8LE-NEXT: addi r3, r3, .LCPI1_1@toc@l
	; P8LE-NEXT: mulhwu r8, r5, r3			; P8LE-NEXT: vmuluwm v3, v3, v5
	; P8LE-NEXT: rldicl r4, r4, 16, 48			; P8LE-NEXT: lvx v5, 0, r3
	; P8LE-NEXT: clrlwi r7, r7, 16			; P8LE-NEXT: vsrw v3, v3, v4
	; P8LE-NEXT: mulhwu r9, r6, r3			; P8LE-NEXT: vxor v4, v4, v4
	; P8LE-NEXT: clrlwi r4, r4, 16			; P8LE-NEXT: vpkuwum v3, v3, v3
	; P8LE-NEXT: mulhwu r10, r7, r3			; P8LE-NEXT: vmladduhm v3, v3, v5, v4
	; P8LE-NEXT: mulhwu r3, r4, r3			; P8LE-NEXT: vsubuhm v2, v2, v3
	; P8LE-NEXT: sub r11, r5, r8
	; P8LE-NEXT: sub r12, r6, r9
	; P8LE-NEXT: srwi r11, r11, 1
	; P8LE-NEXT: add r8, r11, r8
	; P8LE-NEXT: sub r11, r7, r10
	; P8LE-NEXT: srwi r12, r12, 1
	; P8LE-NEXT: add r9, r12, r9
	; P8LE-NEXT: sub r12, r4, r3
	; P8LE-NEXT: srwi r11, r11, 1
	; P8LE-NEXT: srwi r8, r8, 6
	; P8LE-NEXT: add r10, r11, r10
	; P8LE-NEXT: srwi r11, r12, 1
	; P8LE-NEXT: srwi r9, r9, 6
	; P8LE-NEXT: add r3, r11, r3
	; P8LE-NEXT: mulli r8, r8, 95
	; P8LE-NEXT: srwi r10, r10, 6
	; P8LE-NEXT: srwi r3, r3, 6
	; P8LE-NEXT: mulli r9, r9, 95
	; P8LE-NEXT: mulli r10, r10, 95
	; P8LE-NEXT: mulli r3, r3, 95
	; P8LE-NEXT: sub r5, r5, r8
	; P8LE-NEXT: sub r6, r6, r9
	; P8LE-NEXT: mtvsrd v2, r5
	; P8LE-NEXT: sub r5, r7, r10
	; P8LE-NEXT: sub r3, r4, r3
	; P8LE-NEXT: mtvsrd v3, r6
	; P8LE-NEXT: mtvsrd v4, r5
	; P8LE-NEXT: mtvsrd v5, r3
	; P8LE-NEXT: vmrghh v2, v3, v2
	; P8LE-NEXT: vmrghh v3, v5, v4
	; P8LE-NEXT: vmrglw v2, v3, v2
	; P8LE-NEXT: blr			; P8LE-NEXT: blr
	;			;
	; P8BE-LABEL: fold_urem_vec_2:			; P8BE-LABEL: fold_urem_vec_2:
	; P8BE: # %bb.0:			; P8BE: # %bb.0:
	; P8BE-NEXT: mfvsrd r4, v2			; P8BE-NEXT: addis r3, r2, .LCPI1_0@toc@ha
	; P8BE-NEXT: lis r3, 22765			; P8BE-NEXT: xxlxor v4, v4, v4
	; P8BE-NEXT: ori r3, r3, 8969			; P8BE-NEXT: addi r3, r3, .LCPI1_0@toc@l
	; P8BE-NEXT: clrldi r5, r4, 48			; P8BE-NEXT: lxvw4x v3, 0, r3
	; P8BE-NEXT: rldicl r6, r4, 48, 48			; P8BE-NEXT: addis r3, r2, .LCPI1_1@toc@ha
	; P8BE-NEXT: clrlwi r5, r5, 16			; P8BE-NEXT: addi r3, r3, .LCPI1_1@toc@l
	; P8BE-NEXT: rldicl r7, r4, 32, 48			; P8BE-NEXT: lxvw4x v5, 0, r3
	; P8BE-NEXT: clrlwi r6, r6, 16			; P8BE-NEXT: addis r3, r2, .LCPI1_2@toc@ha
	; P8BE-NEXT: mulhwu r8, r5, r3			; P8BE-NEXT: vperm v3, v4, v2, v3
	; P8BE-NEXT: rldicl r4, r4, 16, 48			; P8BE-NEXT: vspltisw v4, 11
	; P8BE-NEXT: clrlwi r7, r7, 16			; P8BE-NEXT: addi r3, r3, .LCPI1_2@toc@l
	; P8BE-NEXT: mulhwu r9, r6, r3			; P8BE-NEXT: vadduwm v4, v4, v4
	; P8BE-NEXT: clrlwi r4, r4, 16			; P8BE-NEXT: vmuluwm v3, v3, v5
	; P8BE-NEXT: mulhwu r10, r7, r3			; P8BE-NEXT: lxvw4x v5, 0, r3
	; P8BE-NEXT: mulhwu r3, r4, r3			; P8BE-NEXT: vsrw v3, v3, v4
	; P8BE-NEXT: sub r11, r5, r8			; P8BE-NEXT: vxor v4, v4, v4
	; P8BE-NEXT: sub r12, r6, r9			; P8BE-NEXT: vpkuwum v3, v3, v3
	; P8BE-NEXT: srwi r11, r11, 1			; P8BE-NEXT: vmladduhm v3, v3, v5, v4
	; P8BE-NEXT: add r8, r11, r8			; P8BE-NEXT: vsubuhm v2, v2, v3
	; P8BE-NEXT: sub r11, r7, r10
	; P8BE-NEXT: srwi r12, r12, 1
	; P8BE-NEXT: add r9, r12, r9
	; P8BE-NEXT: sub r12, r4, r3
	; P8BE-NEXT: srwi r11, r11, 1
	; P8BE-NEXT: srwi r8, r8, 6
	; P8BE-NEXT: add r10, r11, r10
	; P8BE-NEXT: srwi r11, r12, 1
	; P8BE-NEXT: srwi r9, r9, 6
	; P8BE-NEXT: add r3, r11, r3
	; P8BE-NEXT: srwi r10, r10, 6
	; P8BE-NEXT: srwi r3, r3, 6
	; P8BE-NEXT: mulli r8, r8, 95
	; P8BE-NEXT: mulli r9, r9, 95
	; P8BE-NEXT: mulli r10, r10, 95
	; P8BE-NEXT: mulli r3, r3, 95
	; P8BE-NEXT: sub r5, r5, r8
	; P8BE-NEXT: sub r6, r6, r9
	; P8BE-NEXT: sub r7, r7, r10
	; P8BE-NEXT: sub r3, r4, r3
	; P8BE-NEXT: sldi r5, r5, 48
	; P8BE-NEXT: sldi r6, r6, 48
	; P8BE-NEXT: sldi r4, r7, 48
	; P8BE-NEXT: mtvsrd v2, r5
	; P8BE-NEXT: sldi r3, r3, 48
	; P8BE-NEXT: mtvsrd v3, r6
	; P8BE-NEXT: mtvsrd v4, r4
	; P8BE-NEXT: mtvsrd v5, r3
	; P8BE-NEXT: vmrghh v2, v3, v2
	; P8BE-NEXT: vmrghh v3, v5, v4
	; P8BE-NEXT: vmrghw v2, v3, v2
	; P8BE-NEXT: blr			; P8BE-NEXT: blr
	%1 = urem <4 x i16> %x, <i16 95, i16 95, i16 95, i16 95>			%1 = urem <4 x i16> %x, <i16 95, i16 95, i16 95, i16 95>
	ret <4 x i16> %1			ret <4 x i16> %1
	}			}


	; Don't fold if we can combine urem with udiv.			; Don't fold if we can combine urem with udiv.
	define <4 x i16> @combine_urem_udiv(<4 x i16> %x) {			define <4 x i16> @combine_urem_udiv(<4 x i16> %x) {
	; P9LE-LABEL: combine_urem_udiv:			; P9LE-LABEL: combine_urem_udiv:
	; P9LE: # %bb.0:			; P9LE: # %bb.0:
	; P9LE-NEXT: li r3, 0			; P9LE-NEXT: addis r3, r2, .LCPI2_1@toc@ha
	; P9LE-NEXT: lis r4, 22765			; P9LE-NEXT: xxlxor v4, v4, v4
	; P9LE-NEXT: vextuhrx r3, r3, v2			; P9LE-NEXT: vspltisw v5, 11
	; P9LE-NEXT: ori r4, r4, 8969			; P9LE-NEXT: addi r3, r3, .LCPI2_1@toc@l
	; P9LE-NEXT: clrlwi r3, r3, 16			; P9LE-NEXT: vmrglh v4, v4, v2
	; P9LE-NEXT: mulhwu r5, r3, r4			; P9LE-NEXT: vadduwm v5, v5, v5
	; P9LE-NEXT: sub r6, r3, r5			; P9LE-NEXT: lxvx v3, 0, r3
	; P9LE-NEXT: srwi r6, r6, 1			; P9LE-NEXT: addis r3, r2, .LCPI2_0@toc@ha
	; P9LE-NEXT: add r5, r6, r5			; P9LE-NEXT: addi r3, r3, .LCPI2_0@toc@l
	; P9LE-NEXT: srwi r5, r5, 6			; P9LE-NEXT: vmuluwm v3, v4, v3
	; P9LE-NEXT: mulli r6, r5, 95			; P9LE-NEXT: lxvx v4, 0, r3
	; P9LE-NEXT: sub r3, r3, r6			; P9LE-NEXT: vsrw v3, v3, v5
	; P9LE-NEXT: mtvsrd v3, r3			; P9LE-NEXT: vxor v5, v5, v5
	; P9LE-NEXT: li r3, 2			; P9LE-NEXT: vpkuwum v3, v3, v3
	; P9LE-NEXT: vextuhrx r3, r3, v2			; P9LE-NEXT: vmladduhm v4, v3, v4, v5
	; P9LE-NEXT: clrlwi r6, r3, 16			; P9LE-NEXT: vsubuhm v2, v2, v4
	; P9LE-NEXT: mulhwu r7, r6, r4
	; P9LE-NEXT: sub r6, r6, r7
	; P9LE-NEXT: srwi r6, r6, 1
	; P9LE-NEXT: add r6, r6, r7
	; P9LE-NEXT: srwi r6, r6, 6
	; P9LE-NEXT: mulli r7, r6, 95
	; P9LE-NEXT: sub r3, r3, r7
	; P9LE-NEXT: mtvsrd v4, r3
	; P9LE-NEXT: li r3, 4
	; P9LE-NEXT: vextuhrx r3, r3, v2
	; P9LE-NEXT: vmrghh v3, v4, v3
	; P9LE-NEXT: clrlwi r7, r3, 16
	; P9LE-NEXT: mulhwu r8, r7, r4
	; P9LE-NEXT: sub r7, r7, r8
	; P9LE-NEXT: srwi r7, r7, 1
	; P9LE-NEXT: add r7, r7, r8
	; P9LE-NEXT: srwi r7, r7, 6
	; P9LE-NEXT: mulli r8, r7, 95
	; P9LE-NEXT: sub r3, r3, r8
	; P9LE-NEXT: mtvsrd v4, r3
	; P9LE-NEXT: li r3, 6
	; P9LE-NEXT: vextuhrx r3, r3, v2
	; P9LE-NEXT: clrlwi r8, r3, 16
	; P9LE-NEXT: mulhwu r4, r8, r4
	; P9LE-NEXT: sub r8, r8, r4
	; P9LE-NEXT: srwi r8, r8, 1
	; P9LE-NEXT: add r4, r8, r4
	; P9LE-NEXT: srwi r4, r4, 6
	; P9LE-NEXT: mulli r8, r4, 95
	; P9LE-NEXT: mtvsrd v5, r4
	; P9LE-NEXT: sub r3, r3, r8
	; P9LE-NEXT: mtvsrd v2, r3
	; P9LE-NEXT: vmrghh v2, v2, v4
	; P9LE-NEXT: mtvsrd v4, r6
	; P9LE-NEXT: vmrglw v2, v2, v3
	; P9LE-NEXT: mtvsrd v3, r5
	; P9LE-NEXT: vmrghh v3, v4, v3
	; P9LE-NEXT: mtvsrd v4, r7
	; P9LE-NEXT: vmrghh v4, v5, v4
	; P9LE-NEXT: vmrglw v3, v4, v3
	; P9LE-NEXT: vadduhm v2, v2, v3			; P9LE-NEXT: vadduhm v2, v2, v3
	; P9LE-NEXT: blr			; P9LE-NEXT: blr
	;			;
	; P9BE-LABEL: combine_urem_udiv:			; P9BE-LABEL: combine_urem_udiv:
	; P9BE: # %bb.0:			; P9BE: # %bb.0:
	; P9BE-NEXT: li r3, 6			; P9BE-NEXT: addis r3, r2, .LCPI2_1@toc@ha
	; P9BE-NEXT: lis r5, 22765			; P9BE-NEXT: xxlxor v4, v4, v4
	; P9BE-NEXT: vextuhlx r3, r3, v2			; P9BE-NEXT: vspltisw v5, 11
	; P9BE-NEXT: ori r5, r5, 8969			; P9BE-NEXT: addi r3, r3, .LCPI2_1@toc@l
	; P9BE-NEXT: clrlwi r4, r3, 16			; P9BE-NEXT: vadduwm v5, v5, v5
	; P9BE-NEXT: mulhwu r6, r4, r5			; P9BE-NEXT: lxvx v3, 0, r3
	; P9BE-NEXT: sub r4, r4, r6			; P9BE-NEXT: addis r3, r2, .LCPI2_2@toc@ha
	; P9BE-NEXT: srwi r4, r4, 1			; P9BE-NEXT: addi r3, r3, .LCPI2_2@toc@l
	; P9BE-NEXT: add r4, r4, r6			; P9BE-NEXT: vperm v3, v4, v2, v3
	; P9BE-NEXT: srwi r4, r4, 6			; P9BE-NEXT: lxvx v4, 0, r3
	; P9BE-NEXT: mulli r6, r4, 95			; P9BE-NEXT: addis r3, r2, .LCPI2_0@toc@ha
	; P9BE-NEXT: sub r3, r3, r6			; P9BE-NEXT: addi r3, r3, .LCPI2_0@toc@l
	; P9BE-NEXT: sldi r3, r3, 48			; P9BE-NEXT: vmuluwm v3, v3, v4
	; P9BE-NEXT: mtvsrd v3, r3			; P9BE-NEXT: lxvx v4, 0, r3
	; P9BE-NEXT: li r3, 4			; P9BE-NEXT: vsrw v3, v3, v5
	; P9BE-NEXT: vextuhlx r3, r3, v2			; P9BE-NEXT: vxor v5, v5, v5
	; P9BE-NEXT: clrlwi r6, r3, 16			; P9BE-NEXT: vpkuwum v3, v3, v3
	; P9BE-NEXT: mulhwu r7, r6, r5			; P9BE-NEXT: vmladduhm v4, v3, v4, v5
	; P9BE-NEXT: sub r6, r6, r7			; P9BE-NEXT: vsubuhm v2, v2, v4
	; P9BE-NEXT: srwi r6, r6, 1
	; P9BE-NEXT: add r6, r6, r7
	; P9BE-NEXT: srwi r6, r6, 6
	; P9BE-NEXT: mulli r7, r6, 95
	; P9BE-NEXT: sub r3, r3, r7
	; P9BE-NEXT: sldi r3, r3, 48
	; P9BE-NEXT: mtvsrd v4, r3
	; P9BE-NEXT: li r3, 2
	; P9BE-NEXT: vextuhlx r3, r3, v2
	; P9BE-NEXT: vmrghh v3, v4, v3
	; P9BE-NEXT: clrlwi r7, r3, 16
	; P9BE-NEXT: mulhwu r8, r7, r5
	; P9BE-NEXT: sub r7, r7, r8
	; P9BE-NEXT: srwi r7, r7, 1
	; P9BE-NEXT: add r7, r7, r8
	; P9BE-NEXT: srwi r7, r7, 6
	; P9BE-NEXT: mulli r8, r7, 95
	; P9BE-NEXT: sub r3, r3, r8
	; P9BE-NEXT: sldi r3, r3, 48
	; P9BE-NEXT: mtvsrd v4, r3
	; P9BE-NEXT: li r3, 0
	; P9BE-NEXT: vextuhlx r3, r3, v2
	; P9BE-NEXT: clrlwi r3, r3, 16
	; P9BE-NEXT: mulhwu r5, r3, r5
	; P9BE-NEXT: sub r8, r3, r5
	; P9BE-NEXT: srwi r8, r8, 1
	; P9BE-NEXT: add r5, r8, r5
	; P9BE-NEXT: srwi r5, r5, 6
	; P9BE-NEXT: mulli r8, r5, 95
	; P9BE-NEXT: sub r3, r3, r8
	; P9BE-NEXT: sldi r3, r3, 48
	; P9BE-NEXT: mtvsrd v2, r3
	; P9BE-NEXT: sldi r3, r4, 48
	; P9BE-NEXT: vmrghh v2, v2, v4
	; P9BE-NEXT: vmrghw v2, v2, v3
	; P9BE-NEXT: mtvsrd v3, r3
	; P9BE-NEXT: sldi r3, r6, 48
	; P9BE-NEXT: mtvsrd v4, r3
	; P9BE-NEXT: sldi r3, r7, 48
	; P9BE-NEXT: vmrghh v3, v4, v3
	; P9BE-NEXT: mtvsrd v4, r3
	; P9BE-NEXT: sldi r3, r5, 48
	; P9BE-NEXT: mtvsrd v5, r3
	; P9BE-NEXT: vmrghh v4, v5, v4
	; P9BE-NEXT: vmrghw v3, v4, v3
	; P9BE-NEXT: vadduhm v2, v2, v3			; P9BE-NEXT: vadduhm v2, v2, v3
	; P9BE-NEXT: blr			; P9BE-NEXT: blr
	;			;
	; P8LE-LABEL: combine_urem_udiv:			; P8LE-LABEL: combine_urem_udiv:
	; P8LE: # %bb.0:			; P8LE: # %bb.0:
	; P8LE-NEXT: xxswapd vs0, v2			; P8LE-NEXT: xxlxor v3, v3, v3
	; P8LE-NEXT: lis r3, 22765			; P8LE-NEXT: addis r3, r2, .LCPI2_1@toc@ha
	; P8LE-NEXT: std r30, -16(r1) # 8-byte Folded Spill			; P8LE-NEXT: vspltisw v4, 11
	; P8LE-NEXT: ori r3, r3, 8969			; P8LE-NEXT: addi r3, r3, .LCPI2_1@toc@l
	; P8LE-NEXT: mffprd r4, f0			; P8LE-NEXT: vmrglh v3, v3, v2
	; P8LE-NEXT: clrldi r5, r4, 48			; P8LE-NEXT: lvx v5, 0, r3
	; P8LE-NEXT: rldicl r6, r4, 48, 48			; P8LE-NEXT: addis r3, r2, .LCPI2_0@toc@ha
	; P8LE-NEXT: clrlwi r5, r5, 16			; P8LE-NEXT: vadduwm v4, v4, v4
	; P8LE-NEXT: clrlwi r8, r6, 16			; P8LE-NEXT: addi r3, r3, .LCPI2_0@toc@l
	; P8LE-NEXT: rldicl r7, r4, 32, 48			; P8LE-NEXT: vmuluwm v3, v3, v5
	; P8LE-NEXT: rldicl r4, r4, 16, 48			; P8LE-NEXT: lvx v5, 0, r3
	; P8LE-NEXT: mulhwu r9, r5, r3			; P8LE-NEXT: vsrw v3, v3, v4
	; P8LE-NEXT: mulhwu r11, r8, r3			; P8LE-NEXT: vxor v4, v4, v4
	; P8LE-NEXT: clrlwi r10, r7, 16			; P8LE-NEXT: vpkuwum v3, v3, v3
	; P8LE-NEXT: clrlwi r12, r4, 16			; P8LE-NEXT: vmladduhm v4, v3, v5, v4
	; P8LE-NEXT: mulhwu r0, r10, r3			; P8LE-NEXT: vsubuhm v2, v2, v4
	; P8LE-NEXT: mulhwu r3, r12, r3			; P8LE-NEXT: vadduhm v2, v2, v3
	; P8LE-NEXT: sub r30, r5, r9
	; P8LE-NEXT: sub r8, r8, r11
	; P8LE-NEXT: srwi r30, r30, 1
	; P8LE-NEXT: srwi r8, r8, 1
	; P8LE-NEXT: sub r10, r10, r0
	; P8LE-NEXT: add r9, r30, r9
	; P8LE-NEXT: add r8, r8, r11
	; P8LE-NEXT: sub r11, r12, r3
	; P8LE-NEXT: srwi r10, r10, 1
	; P8LE-NEXT: ld r30, -16(r1) # 8-byte Folded Reload
	; P8LE-NEXT: srwi r9, r9, 6
	; P8LE-NEXT: srwi r11, r11, 1
	; P8LE-NEXT: srwi r8, r8, 6
	; P8LE-NEXT: add r10, r10, r0
	; P8LE-NEXT: mulli r12, r9, 95
	; P8LE-NEXT: add r3, r11, r3
	; P8LE-NEXT: mtvsrd v2, r9
	; P8LE-NEXT: srwi r10, r10, 6
	; P8LE-NEXT: mulli r9, r8, 95
	; P8LE-NEXT: srwi r3, r3, 6
	; P8LE-NEXT: mtvsrd v3, r8
	; P8LE-NEXT: mulli r8, r10, 95
	; P8LE-NEXT: mtvsrd v4, r10
	; P8LE-NEXT: mulli r10, r3, 95
	; P8LE-NEXT: vmrghh v2, v3, v2
	; P8LE-NEXT: sub r5, r5, r12
	; P8LE-NEXT: sub r6, r6, r9
	; P8LE-NEXT: mtvsrd v3, r5
	; P8LE-NEXT: mtvsrd v5, r6
	; P8LE-NEXT: sub r5, r7, r8
	; P8LE-NEXT: sub r4, r4, r10
	; P8LE-NEXT: mtvsrd v0, r5
	; P8LE-NEXT: mtvsrd v1, r4
	; P8LE-NEXT: vmrghh v3, v5, v3
	; P8LE-NEXT: mtvsrd v5, r3
	; P8LE-NEXT: vmrghh v0, v1, v0
	; P8LE-NEXT: vmrghh v4, v5, v4
	; P8LE-NEXT: vmrglw v3, v0, v3
	; P8LE-NEXT: vmrglw v2, v4, v2
	; P8LE-NEXT: vadduhm v2, v3, v2
	; P8LE-NEXT: blr			; P8LE-NEXT: blr
	;			;
	; P8BE-LABEL: combine_urem_udiv:			; P8BE-LABEL: combine_urem_udiv:
	; P8BE: # %bb.0:			; P8BE: # %bb.0:
	; P8BE-NEXT: mfvsrd r5, v2			; P8BE-NEXT: addis r3, r2, .LCPI2_1@toc@ha
	; P8BE-NEXT: lis r4, 22765			; P8BE-NEXT: xxlxor v4, v4, v4
	; P8BE-NEXT: ori r4, r4, 8969			; P8BE-NEXT: addi r3, r3, .LCPI2_1@toc@l
	; P8BE-NEXT: clrldi r3, r5, 48			; P8BE-NEXT: lxvw4x v3, 0, r3
	; P8BE-NEXT: rldicl r6, r5, 48, 48			; P8BE-NEXT: addis r3, r2, .LCPI2_2@toc@ha
	; P8BE-NEXT: clrlwi r8, r3, 16			; P8BE-NEXT: addi r3, r3, .LCPI2_2@toc@l
	; P8BE-NEXT: rldicl r7, r5, 32, 48			; P8BE-NEXT: lxvw4x v5, 0, r3
	; P8BE-NEXT: clrlwi r9, r6, 16			; P8BE-NEXT: addis r3, r2, .LCPI2_0@toc@ha
	; P8BE-NEXT: rldicl r5, r5, 16, 48			; P8BE-NEXT: vperm v3, v4, v2, v3
	; P8BE-NEXT: mulhwu r10, r8, r4			; P8BE-NEXT: vspltisw v4, 11
	; P8BE-NEXT: clrlwi r11, r7, 16			; P8BE-NEXT: addi r3, r3, .LCPI2_0@toc@l
	; P8BE-NEXT: mulhwu r12, r9, r4			; P8BE-NEXT: vadduwm v4, v4, v4
	; P8BE-NEXT: clrlwi r5, r5, 16			; P8BE-NEXT: vmuluwm v3, v3, v5
	; P8BE-NEXT: mulhwu r0, r11, r4			; P8BE-NEXT: lxvw4x v5, 0, r3
	; P8BE-NEXT: mulhwu r4, r5, r4			; P8BE-NEXT: vsrw v3, v3, v4
	; P8BE-NEXT: sub r8, r8, r10			; P8BE-NEXT: vxor v4, v4, v4
	; P8BE-NEXT: sub r9, r9, r12			; P8BE-NEXT: vpkuwum v3, v3, v3
	; P8BE-NEXT: srwi r8, r8, 1			; P8BE-NEXT: vmladduhm v4, v3, v5, v4
	; P8BE-NEXT: add r8, r8, r10			; P8BE-NEXT: vsubuhm v2, v2, v4
	; P8BE-NEXT: sub r10, r11, r0			; P8BE-NEXT: vadduhm v2, v2, v3
	; P8BE-NEXT: srwi r9, r9, 1
	; P8BE-NEXT: sub r11, r5, r4
	; P8BE-NEXT: add r9, r9, r12
	; P8BE-NEXT: srwi r8, r8, 6
	; P8BE-NEXT: srwi r11, r11, 1
	; P8BE-NEXT: srwi r10, r10, 1
	; P8BE-NEXT: srwi r9, r9, 6
	; P8BE-NEXT: mulli r12, r8, 95
	; P8BE-NEXT: add r4, r11, r4
	; P8BE-NEXT: add r10, r10, r0
	; P8BE-NEXT: mulli r11, r9, 95
	; P8BE-NEXT: srwi r4, r4, 6
	; P8BE-NEXT: srwi r10, r10, 6
	; P8BE-NEXT: sldi r9, r9, 48
	; P8BE-NEXT: sldi r8, r8, 48
	; P8BE-NEXT: mtvsrd v3, r9
	; P8BE-NEXT: mulli r9, r4, 95
	; P8BE-NEXT: mtvsrd v2, r8
	; P8BE-NEXT: mulli r8, r10, 95
	; P8BE-NEXT: sub r3, r3, r12
	; P8BE-NEXT: sub r6, r6, r11
	; P8BE-NEXT: sldi r3, r3, 48
	; P8BE-NEXT: vmrghh v2, v3, v2
	; P8BE-NEXT: sldi r6, r6, 48
	; P8BE-NEXT: sldi r10, r10, 48
	; P8BE-NEXT: mtvsrd v3, r3
	; P8BE-NEXT: sub r3, r5, r9
	; P8BE-NEXT: sub r7, r7, r8
	; P8BE-NEXT: mtvsrd v5, r6
	; P8BE-NEXT: sldi r3, r3, 48
	; P8BE-NEXT: sldi r5, r7, 48
	; P8BE-NEXT: mtvsrd v1, r3
	; P8BE-NEXT: sldi r3, r4, 48
	; P8BE-NEXT: mtvsrd v4, r10
	; P8BE-NEXT: mtvsrd v0, r5
	; P8BE-NEXT: vmrghh v3, v5, v3
	; P8BE-NEXT: mtvsrd v5, r3
	; P8BE-NEXT: vmrghh v0, v1, v0
	; P8BE-NEXT: vmrghh v4, v5, v4
	; P8BE-NEXT: vmrghw v3, v0, v3
	; P8BE-NEXT: vmrghw v2, v4, v2
	; P8BE-NEXT: vadduhm v2, v3, v2
	; P8BE-NEXT: blr			; P8BE-NEXT: blr
	%1 = urem <4 x i16> %x, <i16 95, i16 95, i16 95, i16 95>			%1 = urem <4 x i16> %x, <i16 95, i16 95, i16 95, i16 95>
	%2 = udiv <4 x i16> %x, <i16 95, i16 95, i16 95, i16 95>			%2 = udiv <4 x i16> %x, <i16 95, i16 95, i16 95, i16 95>
	%3 = add <4 x i16> %1, %2			%3 = add <4 x i16> %1, %2
	ret <4 x i16> %3			ret <4 x i16> %3
	}			}

	; Don't fold for divisors that are a power of two.			; Don't fold for divisors that are a power of two.
	define <4 x i16> @dont_fold_urem_power_of_two(<4 x i16> %x) {			define <4 x i16> @dont_fold_urem_power_of_two(<4 x i16> %x) {
	; P9LE-LABEL: dont_fold_urem_power_of_two:			; P9LE-LABEL: dont_fold_urem_power_of_two:
	; P9LE: # %bb.0:			; P9LE: # %bb.0:
	; P9LE-NEXT: li r3, 0			; P9LE-NEXT: addis r3, r2, .LCPI3_0@toc@ha
	; P9LE-NEXT: lis r4, 22765			; P9LE-NEXT: xxlxor v3, v3, v3
	; P9LE-NEXT: vextuhrx r3, r3, v2			; P9LE-NEXT: vxor v5, v5, v5
	; P9LE-NEXT: ori r4, r4, 8969			; P9LE-NEXT: vmrglh v3, v3, v2
	; P9LE-NEXT: clrlwi r3, r3, 26			; P9LE-NEXT: addi r3, r3, .LCPI3_0@toc@l
	; P9LE-NEXT: mtvsrd v3, r3			; P9LE-NEXT: lxvx v4, 0, r3
	; P9LE-NEXT: li r3, 2			; P9LE-NEXT: addis r3, r2, .LCPI3_1@toc@ha
	; P9LE-NEXT: vextuhrx r3, r3, v2			; P9LE-NEXT: addi r3, r3, .LCPI3_1@toc@l
	; P9LE-NEXT: clrlwi r3, r3, 27			; P9LE-NEXT: vmuluwm v3, v3, v4
	; P9LE-NEXT: mtvsrd v4, r3			; P9LE-NEXT: vspltisw v4, 8
	; P9LE-NEXT: li r3, 6			; P9LE-NEXT: vadduwm v4, v4, v4
	; P9LE-NEXT: vextuhrx r3, r3, v2			; P9LE-NEXT: vsrw v3, v3, v4
	; P9LE-NEXT: vmrghh v3, v4, v3			; P9LE-NEXT: lxvx v4, 0, r3
	; P9LE-NEXT: clrlwi r3, r3, 16			; P9LE-NEXT: addis r3, r2, .LCPI3_2@toc@ha
	; P9LE-NEXT: mulhwu r4, r3, r4			; P9LE-NEXT: vpkuwum v3, v3, v3
	; P9LE-NEXT: sub r5, r3, r4			; P9LE-NEXT: addi r3, r3, .LCPI3_2@toc@l
	; P9LE-NEXT: srwi r5, r5, 1			; P9LE-NEXT: vsrh v3, v3, v4
	; P9LE-NEXT: add r4, r5, r4			; P9LE-NEXT: lxvx v4, 0, r3
	; P9LE-NEXT: srwi r4, r4, 6			; P9LE-NEXT: vmladduhm v3, v3, v4, v5
	; P9LE-NEXT: mulli r4, r4, 95			; P9LE-NEXT: vsubuhm v2, v2, v3
	; P9LE-NEXT: sub r3, r3, r4
	; P9LE-NEXT: mtvsrd v4, r3
	; P9LE-NEXT: li r3, 4
	; P9LE-NEXT: vextuhrx r3, r3, v2
	; P9LE-NEXT: clrlwi r3, r3, 29
	; P9LE-NEXT: mtvsrd v2, r3
	; P9LE-NEXT: vmrghh v2, v4, v2
	; P9LE-NEXT: vmrglw v2, v2, v3
	; P9LE-NEXT: blr			; P9LE-NEXT: blr
	;			;
	; P9BE-LABEL: dont_fold_urem_power_of_two:			; P9BE-LABEL: dont_fold_urem_power_of_two:
	; P9BE: # %bb.0:			; P9BE: # %bb.0:
	; P9BE-NEXT: li r3, 2			; P9BE-NEXT: addis r3, r2, .LCPI3_0@toc@ha
	; P9BE-NEXT: lis r4, 22765			; P9BE-NEXT: xxlxor v4, v4, v4
	; P9BE-NEXT: vextuhlx r3, r3, v2			; P9BE-NEXT: vxor v5, v5, v5
	; P9BE-NEXT: ori r4, r4, 8969			; P9BE-NEXT: addi r3, r3, .LCPI3_0@toc@l
	; P9BE-NEXT: clrlwi r3, r3, 27			; P9BE-NEXT: lxvx v3, 0, r3
	; P9BE-NEXT: sldi r3, r3, 48			; P9BE-NEXT: addis r3, r2, .LCPI3_1@toc@ha
	; P9BE-NEXT: mtvsrd v3, r3			; P9BE-NEXT: addi r3, r3, .LCPI3_1@toc@l
	; P9BE-NEXT: li r3, 0			; P9BE-NEXT: vperm v3, v4, v2, v3
	; P9BE-NEXT: vextuhlx r3, r3, v2			; P9BE-NEXT: lxvx v4, 0, r3
	; P9BE-NEXT: clrlwi r3, r3, 26			; P9BE-NEXT: addis r3, r2, .LCPI3_2@toc@ha
	; P9BE-NEXT: sldi r3, r3, 48			; P9BE-NEXT: addi r3, r3, .LCPI3_2@toc@l
	; P9BE-NEXT: mtvsrd v4, r3			; P9BE-NEXT: vmuluwm v3, v3, v4
	; P9BE-NEXT: li r3, 6			; P9BE-NEXT: vspltisw v4, 8
	; P9BE-NEXT: vextuhlx r3, r3, v2			; P9BE-NEXT: vadduwm v4, v4, v4
	; P9BE-NEXT: vmrghh v3, v4, v3			; P9BE-NEXT: vsrw v3, v3, v4
	; P9BE-NEXT: clrlwi r3, r3, 16			; P9BE-NEXT: lxvx v4, 0, r3
	; P9BE-NEXT: mulhwu r4, r3, r4			; P9BE-NEXT: addis r3, r2, .LCPI3_3@toc@ha
	; P9BE-NEXT: sub r5, r3, r4			; P9BE-NEXT: vpkuwum v3, v3, v3
	; P9BE-NEXT: srwi r5, r5, 1			; P9BE-NEXT: addi r3, r3, .LCPI3_3@toc@l
	; P9BE-NEXT: add r4, r5, r4			; P9BE-NEXT: vsrh v3, v3, v4
	; P9BE-NEXT: srwi r4, r4, 6			; P9BE-NEXT: lxvx v4, 0, r3
	; P9BE-NEXT: mulli r4, r4, 95			; P9BE-NEXT: vmladduhm v3, v3, v4, v5
	; P9BE-NEXT: sub r3, r3, r4			; P9BE-NEXT: vsubuhm v2, v2, v3
	; P9BE-NEXT: sldi r3, r3, 48
	; P9BE-NEXT: mtvsrd v4, r3
	; P9BE-NEXT: li r3, 4
	; P9BE-NEXT: vextuhlx r3, r3, v2
	; P9BE-NEXT: clrlwi r3, r3, 29
	; P9BE-NEXT: sldi r3, r3, 48
	; P9BE-NEXT: mtvsrd v2, r3
	; P9BE-NEXT: vmrghh v2, v2, v4
	; P9BE-NEXT: vmrghw v2, v3, v2
	; P9BE-NEXT: blr			; P9BE-NEXT: blr
	;			;
	; P8LE-LABEL: dont_fold_urem_power_of_two:			; P8LE-LABEL: dont_fold_urem_power_of_two:
	; P8LE: # %bb.0:			; P8LE: # %bb.0:
	; P8LE-NEXT: xxswapd vs0, v2			; P8LE-NEXT: xxlxor v3, v3, v3
	; P8LE-NEXT: lis r3, 22765			; P8LE-NEXT: addis r3, r2, .LCPI3_0@toc@ha
	; P8LE-NEXT: ori r3, r3, 8969			; P8LE-NEXT: vspltisw v4, 8
	; P8LE-NEXT: mffprd r4, f0			; P8LE-NEXT: addi r3, r3, .LCPI3_0@toc@l
	; P8LE-NEXT: rldicl r5, r4, 16, 48			; P8LE-NEXT: vmrglh v3, v3, v2
	; P8LE-NEXT: rldicl r7, r4, 48, 48			; P8LE-NEXT: lvx v5, 0, r3
	; P8LE-NEXT: clrlwi r5, r5, 16			; P8LE-NEXT: addis r3, r2, .LCPI3_1@toc@ha
	; P8LE-NEXT: mulhwu r3, r5, r3			; P8LE-NEXT: vadduwm v4, v4, v4
	; P8LE-NEXT: sub r6, r5, r3			; P8LE-NEXT: addi r3, r3, .LCPI3_1@toc@l
	; P8LE-NEXT: srwi r6, r6, 1			; P8LE-NEXT: vmuluwm v3, v3, v5
	; P8LE-NEXT: add r3, r6, r3			; P8LE-NEXT: vsrw v3, v3, v4
	; P8LE-NEXT: clrldi r6, r4, 48			; P8LE-NEXT: lvx v4, 0, r3
	; P8LE-NEXT: srwi r3, r3, 6			; P8LE-NEXT: addis r3, r2, .LCPI3_2@toc@ha
	; P8LE-NEXT: clrlwi r6, r6, 26			; P8LE-NEXT: addi r3, r3, .LCPI3_2@toc@l
	; P8LE-NEXT: mulli r3, r3, 95			; P8LE-NEXT: lvx v5, 0, r3
	; P8LE-NEXT: rldicl r4, r4, 32, 48			; P8LE-NEXT: vpkuwum v3, v3, v3
	; P8LE-NEXT: mtvsrd v2, r6			; P8LE-NEXT: vsrh v3, v3, v4
	; P8LE-NEXT: clrlwi r6, r7, 27			; P8LE-NEXT: vxor v4, v4, v4
	; P8LE-NEXT: clrlwi r4, r4, 29			; P8LE-NEXT: vmladduhm v3, v3, v5, v4
	; P8LE-NEXT: mtvsrd v3, r6			; P8LE-NEXT: vsubuhm v2, v2, v3
	; P8LE-NEXT: mtvsrd v5, r4
	; P8LE-NEXT: vmrghh v2, v3, v2
	; P8LE-NEXT: sub r3, r5, r3
	; P8LE-NEXT: mtvsrd v4, r3
	; P8LE-NEXT: vmrghh v3, v4, v5
	; P8LE-NEXT: vmrglw v2, v3, v2
	; P8LE-NEXT: blr			; P8LE-NEXT: blr
	;			;
	; P8BE-LABEL: dont_fold_urem_power_of_two:			; P8BE-LABEL: dont_fold_urem_power_of_two:
	; P8BE: # %bb.0:			; P8BE: # %bb.0:
	; P8BE-NEXT: mfvsrd r4, v2			; P8BE-NEXT: addis r3, r2, .LCPI3_0@toc@ha
	; P8BE-NEXT: lis r3, 22765			; P8BE-NEXT: xxlxor v4, v4, v4
	; P8BE-NEXT: ori r3, r3, 8969			; P8BE-NEXT: addi r3, r3, .LCPI3_0@toc@l
	; P8BE-NEXT: clrldi r5, r4, 48			; P8BE-NEXT: lxvw4x v3, 0, r3
	; P8BE-NEXT: rldicl r7, r4, 16, 48			; P8BE-NEXT: addis r3, r2, .LCPI3_1@toc@ha
	; P8BE-NEXT: clrlwi r5, r5, 16			; P8BE-NEXT: addi r3, r3, .LCPI3_1@toc@l
	; P8BE-NEXT: clrlwi r7, r7, 26			; P8BE-NEXT: lxvw4x v5, 0, r3
	; P8BE-NEXT: mulhwu r3, r5, r3			; P8BE-NEXT: addis r3, r2, .LCPI3_2@toc@ha
	; P8BE-NEXT: sub r6, r5, r3			; P8BE-NEXT: vperm v3, v4, v2, v3
	; P8BE-NEXT: srwi r6, r6, 1			; P8BE-NEXT: vspltisw v4, 8
	; P8BE-NEXT: add r3, r6, r3			; P8BE-NEXT: addi r3, r3, .LCPI3_2@toc@l
	; P8BE-NEXT: rldicl r6, r4, 32, 48			; P8BE-NEXT: vadduwm v4, v4, v4
	; P8BE-NEXT: srwi r3, r3, 6			; P8BE-NEXT: vmuluwm v3, v3, v5
	; P8BE-NEXT: rldicl r4, r4, 48, 48			; P8BE-NEXT: vsrw v3, v3, v4
	; P8BE-NEXT: clrlwi r6, r6, 27			; P8BE-NEXT: lxvw4x v4, 0, r3
	; P8BE-NEXT: mulli r3, r3, 95			; P8BE-NEXT: addis r3, r2, .LCPI3_3@toc@ha
	; P8BE-NEXT: sldi r6, r6, 48			; P8BE-NEXT: addi r3, r3, .LCPI3_3@toc@l
	; P8BE-NEXT: clrlwi r4, r4, 29			; P8BE-NEXT: lxvw4x v5, 0, r3
	; P8BE-NEXT: mtvsrd v2, r6			; P8BE-NEXT: vpkuwum v3, v3, v3
	; P8BE-NEXT: sldi r6, r7, 48			; P8BE-NEXT: vsrh v3, v3, v4
	; P8BE-NEXT: sldi r4, r4, 48			; P8BE-NEXT: vxor v4, v4, v4
	; P8BE-NEXT: mtvsrd v3, r6			; P8BE-NEXT: vmladduhm v3, v3, v5, v4
	; P8BE-NEXT: mtvsrd v5, r4			; P8BE-NEXT: vsubuhm v2, v2, v3
	; P8BE-NEXT: sub r3, r5, r3
	; P8BE-NEXT: vmrghh v2, v3, v2
	; P8BE-NEXT: sldi r3, r3, 48
	; P8BE-NEXT: mtvsrd v4, r3
	; P8BE-NEXT: vmrghh v3, v5, v4
	; P8BE-NEXT: vmrghw v2, v2, v3
	; P8BE-NEXT: blr			; P8BE-NEXT: blr
	%1 = urem <4 x i16> %x, <i16 64, i16 32, i16 8, i16 95>			%1 = urem <4 x i16> %x, <i16 64, i16 32, i16 8, i16 95>
	ret <4 x i16> %1			ret <4 x i16> %1
	}			}

	; Don't fold if the divisor is one.			; Don't fold if the divisor is one.
	define <4 x i16> @dont_fold_urem_one(<4 x i16> %x) {			define <4 x i16> @dont_fold_urem_one(<4 x i16> %x) {
	; P9LE-LABEL: dont_fold_urem_one:			; P9LE-LABEL: dont_fold_urem_one:
	; P9LE: # %bb.0:			; P9LE: # %bb.0:
	; P9LE-NEXT: li r3, 4			; P9LE-NEXT: addis r3, r2, .LCPI4_0@toc@ha
	; P9LE-NEXT: lis r4, -19946			; P9LE-NEXT: xxlxor v3, v3, v3
	; P9LE-NEXT: lis r5, -14230			; P9LE-NEXT: addi r3, r3, .LCPI4_0@toc@l
	; P9LE-NEXT: vextuhrx r3, r3, v2			; P9LE-NEXT: vmrglh v4, v3, v2
	; P9LE-NEXT: ori r4, r4, 17097			; P9LE-NEXT: lxvx v5, 0, r3
	; P9LE-NEXT: ori r5, r5, 30865			; P9LE-NEXT: addis r3, r2, .LCPI4_1@toc@ha
	; P9LE-NEXT: clrlwi r3, r3, 16			; P9LE-NEXT: addi r3, r3, .LCPI4_1@toc@l
	; P9LE-NEXT: mulhwu r4, r3, r4			; P9LE-NEXT: vmuluwm v4, v4, v5
	; P9LE-NEXT: srwi r4, r4, 4			; P9LE-NEXT: vspltisw v5, 8
	; P9LE-NEXT: mulli r4, r4, 23			; P9LE-NEXT: vadduwm v5, v5, v5
	; P9LE-NEXT: sub r3, r3, r4			; P9LE-NEXT: vsrw v4, v4, v5
	; P9LE-NEXT: lis r4, 24749			; P9LE-NEXT: vpkuwum v0, v4, v4
	; P9LE-NEXT: mtvsrd v3, r3			; P9LE-NEXT: vsubuhm v0, v2, v0
	; P9LE-NEXT: li r3, 6			; P9LE-NEXT: vmrglh v3, v3, v0
	; P9LE-NEXT: ori r4, r4, 47143			; P9LE-NEXT: lxvx v0, 0, r3
	; P9LE-NEXT: vextuhrx r3, r3, v2			; P9LE-NEXT: addis r3, r2, .LCPI4_2@toc@ha
	; P9LE-NEXT: clrlwi r3, r3, 16			; P9LE-NEXT: addi r3, r3, .LCPI4_2@toc@l
	; P9LE-NEXT: mulhwu r4, r3, r4			; P9LE-NEXT: vmuluwm v3, v3, v0
	; P9LE-NEXT: srwi r4, r4, 11			; P9LE-NEXT: vsrw v3, v3, v5
	; P9LE-NEXT: mulli r4, r4, 5423			; P9LE-NEXT: vxor v5, v5, v5
	; P9LE-NEXT: sub r3, r3, r4			; P9LE-NEXT: vadduhm v3, v3, v4
	; P9LE-NEXT: mtvsrd v4, r3			; P9LE-NEXT: lxvx v4, 0, r3
	; P9LE-NEXT: li r3, 2			; P9LE-NEXT: addis r3, r2, .LCPI4_3@toc@ha
	; P9LE-NEXT: vextuhrx r3, r3, v2			; P9LE-NEXT: addi r3, r3, .LCPI4_3@toc@l
	; P9LE-NEXT: vmrghh v3, v4, v3			; P9LE-NEXT: vpkuwum v3, v3, v3
	; P9LE-NEXT: clrlwi r4, r3, 16			; P9LE-NEXT: lxvx vs0, 0, r3
	; P9LE-NEXT: rlwinm r3, r3, 31, 17, 31			; P9LE-NEXT: addis r3, r2, .LCPI4_4@toc@ha
	; P9LE-NEXT: mulhwu r3, r3, r5			; P9LE-NEXT: vsrh v3, v3, v4
	; P9LE-NEXT: srwi r3, r3, 8			; P9LE-NEXT: addi r3, r3, .LCPI4_4@toc@l
	; P9LE-NEXT: mulli r3, r3, 654			; P9LE-NEXT: lxvx v4, 0, r3
	; P9LE-NEXT: sub r3, r4, r3			; P9LE-NEXT: xxsel v3, v3, v2, vs0
	; P9LE-NEXT: mtvsrd v2, r3			; P9LE-NEXT: vmladduhm v3, v3, v4, v5
	; P9LE-NEXT: li r3, 0			; P9LE-NEXT: vsubuhm v2, v2, v3
	; P9LE-NEXT: mtvsrd v4, r3
	; P9LE-NEXT: vmrghh v2, v2, v4
	; P9LE-NEXT: vmrglw v2, v3, v2
	; P9LE-NEXT: blr			; P9LE-NEXT: blr
	;			;
	; P9BE-LABEL: dont_fold_urem_one:			; P9BE-LABEL: dont_fold_urem_one:
	; P9BE: # %bb.0:			; P9BE: # %bb.0:
	; P9BE-NEXT: li r3, 6			; P9BE-NEXT: addis r3, r2, .LCPI4_0@toc@ha
	; P9BE-NEXT: lis r4, 24749			; P9BE-NEXT: xxlxor v4, v4, v4
	; P9BE-NEXT: lis r5, -14230			; P9BE-NEXT: addi r3, r3, .LCPI4_0@toc@l
	; P9BE-NEXT: vextuhlx r3, r3, v2			; P9BE-NEXT: lxvx v3, 0, r3
	; P9BE-NEXT: ori r4, r4, 47143			; P9BE-NEXT: addis r3, r2, .LCPI4_1@toc@ha
	; P9BE-NEXT: ori r5, r5, 30865			; P9BE-NEXT: addi r3, r3, .LCPI4_1@toc@l
	; P9BE-NEXT: clrlwi r3, r3, 16			; P9BE-NEXT: lxvx v0, 0, r3
	; P9BE-NEXT: mulhwu r4, r3, r4			; P9BE-NEXT: addis r3, r2, .LCPI4_2@toc@ha
	; P9BE-NEXT: srwi r4, r4, 11			; P9BE-NEXT: vperm v5, v4, v2, v3
	; P9BE-NEXT: mulli r4, r4, 5423			; P9BE-NEXT: addi r3, r3, .LCPI4_2@toc@l
	; P9BE-NEXT: sub r3, r3, r4			; P9BE-NEXT: vmuluwm v5, v5, v0
	; P9BE-NEXT: lis r4, -19946			; P9BE-NEXT: vspltisw v0, 8
	; P9BE-NEXT: sldi r3, r3, 48			; P9BE-NEXT: vadduwm v0, v0, v0
	; P9BE-NEXT: ori r4, r4, 17097			; P9BE-NEXT: vsrw v5, v5, v0
	; P9BE-NEXT: mtvsrd v3, r3			; P9BE-NEXT: vpkuwum v1, v5, v5
	; P9BE-NEXT: li r3, 4			; P9BE-NEXT: vsubuhm v1, v2, v1
	; P9BE-NEXT: vextuhlx r3, r3, v2			; P9BE-NEXT: vperm v3, v4, v1, v3
	; P9BE-NEXT: clrlwi r3, r3, 16			; P9BE-NEXT: lxvx v4, 0, r3
	; P9BE-NEXT: mulhwu r4, r3, r4			; P9BE-NEXT: addis r3, r2, .LCPI4_3@toc@ha
	; P9BE-NEXT: srwi r4, r4, 4			; P9BE-NEXT: addi r3, r3, .LCPI4_3@toc@l
	; P9BE-NEXT: mulli r4, r4, 23			; P9BE-NEXT: vmuluwm v3, v3, v4
	; P9BE-NEXT: sub r3, r3, r4			; P9BE-NEXT: lxvx v4, 0, r3
	; P9BE-NEXT: sldi r3, r3, 48			; P9BE-NEXT: addis r3, r2, .LCPI4_4@toc@ha
	; P9BE-NEXT: mtvsrd v4, r3			; P9BE-NEXT: addi r3, r3, .LCPI4_4@toc@l
	; P9BE-NEXT: li r3, 2			; P9BE-NEXT: lxvx vs0, 0, r3
	; P9BE-NEXT: vextuhlx r3, r3, v2			; P9BE-NEXT: addis r3, r2, .LCPI4_5@toc@ha
	; P9BE-NEXT: vmrghh v3, v4, v3			; P9BE-NEXT: addi r3, r3, .LCPI4_5@toc@l
	; P9BE-NEXT: clrlwi r4, r3, 16			; P9BE-NEXT: vsrw v3, v3, v0
	; P9BE-NEXT: rlwinm r3, r3, 31, 17, 31			; P9BE-NEXT: vadduhm v3, v3, v5
	; P9BE-NEXT: mulhwu r3, r3, r5			; P9BE-NEXT: vxor v5, v5, v5
	; P9BE-NEXT: srwi r3, r3, 8			; P9BE-NEXT: vpkuwum v3, v3, v3
	; P9BE-NEXT: mulli r3, r3, 654			; P9BE-NEXT: vsrh v3, v3, v4
	; P9BE-NEXT: sub r3, r4, r3			; P9BE-NEXT: lxvx v4, 0, r3
	; P9BE-NEXT: sldi r3, r3, 48			; P9BE-NEXT: xxsel v3, v3, v2, vs0
	; P9BE-NEXT: mtvsrd v2, r3			; P9BE-NEXT: vmladduhm v3, v3, v4, v5
	; P9BE-NEXT: li r3, 0			; P9BE-NEXT: vsubuhm v2, v2, v3
	; P9BE-NEXT: sldi r3, r3, 48
	; P9BE-NEXT: mtvsrd v4, r3
	; P9BE-NEXT: vmrghh v2, v4, v2
	; P9BE-NEXT: vmrghw v2, v2, v3
	; P9BE-NEXT: blr			; P9BE-NEXT: blr
	;			;
	; P8LE-LABEL: dont_fold_urem_one:			; P8LE-LABEL: dont_fold_urem_one:
	; P8LE: # %bb.0:			; P8LE: # %bb.0:
	; P8LE-NEXT: xxswapd vs0, v2			; P8LE-NEXT: xxlxor v3, v3, v3
	; P8LE-NEXT: lis r3, -14230			; P8LE-NEXT: addis r3, r2, .LCPI4_0@toc@ha
	; P8LE-NEXT: lis r7, -19946			; P8LE-NEXT: vspltisw v5, 8
	; P8LE-NEXT: lis r9, 24749			; P8LE-NEXT: addi r3, r3, .LCPI4_0@toc@l
	; P8LE-NEXT: ori r3, r3, 30865			; P8LE-NEXT: vmrglh v4, v3, v2
	; P8LE-NEXT: ori r7, r7, 17097			; P8LE-NEXT: lvx v0, 0, r3
	; P8LE-NEXT: mffprd r4, f0			; P8LE-NEXT: addis r3, r2, .LCPI4_1@toc@ha
	; P8LE-NEXT: rldicl r5, r4, 48, 48			; P8LE-NEXT: vadduwm v5, v5, v5
	; P8LE-NEXT: rldicl r6, r4, 32, 48			; P8LE-NEXT: addi r3, r3, .LCPI4_1@toc@l
	; P8LE-NEXT: rldicl r4, r4, 16, 48			; P8LE-NEXT: vmuluwm v4, v4, v0
	; P8LE-NEXT: rlwinm r8, r5, 31, 17, 31			; P8LE-NEXT: vsrw v4, v4, v5
	; P8LE-NEXT: clrlwi r6, r6, 16			; P8LE-NEXT: vpkuwum v0, v4, v4
	; P8LE-NEXT: clrlwi r5, r5, 16			; P8LE-NEXT: vsubuhm v0, v2, v0
	; P8LE-NEXT: mulhwu r3, r8, r3			; P8LE-NEXT: vmrglh v3, v3, v0
	; P8LE-NEXT: ori r8, r9, 47143			; P8LE-NEXT: lvx v0, 0, r3
	; P8LE-NEXT: clrlwi r4, r4, 16			; P8LE-NEXT: addis r3, r2, .LCPI4_2@toc@ha
	; P8LE-NEXT: li r9, 0			; P8LE-NEXT: addi r3, r3, .LCPI4_2@toc@l
	; P8LE-NEXT: mulhwu r7, r6, r7			; P8LE-NEXT: vmuluwm v3, v3, v0
	; P8LE-NEXT: mulhwu r8, r4, r8			; P8LE-NEXT: vsrw v3, v3, v5
	; P8LE-NEXT: mtvsrd v2, r9			; P8LE-NEXT: vxor v5, v5, v5
	; P8LE-NEXT: srwi r3, r3, 8			; P8LE-NEXT: vadduhm v3, v3, v4
	; P8LE-NEXT: srwi r7, r7, 4			; P8LE-NEXT: lvx v4, 0, r3
	; P8LE-NEXT: mulli r3, r3, 654			; P8LE-NEXT: addis r3, r2, .LCPI4_3@toc@ha
	; P8LE-NEXT: srwi r8, r8, 11			; P8LE-NEXT: addi r3, r3, .LCPI4_3@toc@l
	; P8LE-NEXT: mulli r7, r7, 23			; P8LE-NEXT: vpkuwum v3, v3, v3
	; P8LE-NEXT: mulli r8, r8, 5423			; P8LE-NEXT: vsrh v3, v3, v4
	; P8LE-NEXT: sub r3, r5, r3			; P8LE-NEXT: lvx v4, 0, r3
	; P8LE-NEXT: sub r5, r6, r7			; P8LE-NEXT: addis r3, r2, .LCPI4_4@toc@ha
	; P8LE-NEXT: mtvsrd v3, r3			; P8LE-NEXT: addi r3, r3, .LCPI4_4@toc@l
	; P8LE-NEXT: sub r3, r4, r8			; P8LE-NEXT: xxsel v3, v3, v2, v4
	; P8LE-NEXT: mtvsrd v4, r5			; P8LE-NEXT: lvx v4, 0, r3
	; P8LE-NEXT: mtvsrd v5, r3			; P8LE-NEXT: vmladduhm v3, v3, v4, v5
	; P8LE-NEXT: vmrghh v2, v3, v2			; P8LE-NEXT: vsubuhm v2, v2, v3
	; P8LE-NEXT: vmrghh v3, v5, v4
	; P8LE-NEXT: vmrglw v2, v3, v2
	; P8LE-NEXT: blr			; P8LE-NEXT: blr
	;			;
	; P8BE-LABEL: dont_fold_urem_one:			; P8BE-LABEL: dont_fold_urem_one:
	; P8BE: # %bb.0:			; P8BE: # %bb.0:
	; P8BE-NEXT: mfvsrd r4, v2			; P8BE-NEXT: addis r3, r2, .LCPI4_0@toc@ha
	; P8BE-NEXT: lis r3, 24749			; P8BE-NEXT: xxlxor v4, v4, v4
	; P8BE-NEXT: lis r7, -19946			; P8BE-NEXT: vspltisw v1, 8
	; P8BE-NEXT: lis r8, -14230			; P8BE-NEXT: addi r3, r3, .LCPI4_0@toc@l
	; P8BE-NEXT: ori r3, r3, 47143			; P8BE-NEXT: lxvw4x v3, 0, r3
	; P8BE-NEXT: ori r7, r7, 17097			; P8BE-NEXT: addis r3, r2, .LCPI4_1@toc@ha
	; P8BE-NEXT: ori r8, r8, 30865			; P8BE-NEXT: addi r3, r3, .LCPI4_1@toc@l
	; P8BE-NEXT: clrldi r5, r4, 48			; P8BE-NEXT: lxvw4x v0, 0, r3
	; P8BE-NEXT: rldicl r6, r4, 48, 48			; P8BE-NEXT: addis r3, r2, .LCPI4_2@toc@ha
	; P8BE-NEXT: rldicl r4, r4, 32, 48			; P8BE-NEXT: vperm v5, v4, v2, v3
	; P8BE-NEXT: clrlwi r5, r5, 16			; P8BE-NEXT: addi r3, r3, .LCPI4_2@toc@l
	; P8BE-NEXT: clrlwi r6, r6, 16			; P8BE-NEXT: vmuluwm v5, v5, v0
	; P8BE-NEXT: mulhwu r3, r5, r3			; P8BE-NEXT: vadduwm v0, v1, v1
	; P8BE-NEXT: rlwinm r9, r4, 31, 17, 31			; P8BE-NEXT: vsrw v5, v5, v0
	; P8BE-NEXT: clrlwi r4, r4, 16			; P8BE-NEXT: vpkuwum v1, v5, v5
	; P8BE-NEXT: mulhwu r7, r6, r7			; P8BE-NEXT: vsubuhm v1, v2, v1
	; P8BE-NEXT: mulhwu r8, r9, r8			; P8BE-NEXT: vperm v3, v4, v1, v3
	; P8BE-NEXT: li r9, 0			; P8BE-NEXT: lxvw4x v4, 0, r3
	; P8BE-NEXT: srwi r3, r3, 11			; P8BE-NEXT: addis r3, r2, .LCPI4_3@toc@ha
	; P8BE-NEXT: srwi r7, r7, 4			; P8BE-NEXT: addi r3, r3, .LCPI4_3@toc@l
	; P8BE-NEXT: mulli r3, r3, 5423			; P8BE-NEXT: vmuluwm v3, v3, v4
	; P8BE-NEXT: srwi r8, r8, 8			; P8BE-NEXT: lxvw4x v4, 0, r3
	; P8BE-NEXT: mulli r7, r7, 23			; P8BE-NEXT: addis r3, r2, .LCPI4_4@toc@ha
	; P8BE-NEXT: mulli r8, r8, 654			; P8BE-NEXT: addi r3, r3, .LCPI4_4@toc@l
	; P8BE-NEXT: sub r3, r5, r3			; P8BE-NEXT: vsrw v3, v3, v0
	; P8BE-NEXT: sldi r5, r9, 48			; P8BE-NEXT: lxvw4x vs0, 0, r3
	; P8BE-NEXT: mtvsrd v2, r5			; P8BE-NEXT: addis r3, r2, .LCPI4_5@toc@ha
	; P8BE-NEXT: sub r5, r6, r7			; P8BE-NEXT: addi r3, r3, .LCPI4_5@toc@l
	; P8BE-NEXT: sldi r3, r3, 48			; P8BE-NEXT: vadduhm v3, v3, v5
	; P8BE-NEXT: sub r4, r4, r8			; P8BE-NEXT: lxvw4x v5, 0, r3
	; P8BE-NEXT: sldi r5, r5, 48			; P8BE-NEXT: vpkuwum v3, v3, v3
	; P8BE-NEXT: mtvsrd v3, r3			; P8BE-NEXT: vsrh v3, v3, v4
	; P8BE-NEXT: sldi r3, r4, 48			; P8BE-NEXT: vxor v4, v4, v4
	; P8BE-NEXT: mtvsrd v4, r5			; P8BE-NEXT: xxsel v3, v3, v2, vs0
	; P8BE-NEXT: mtvsrd v5, r3			; P8BE-NEXT: vmladduhm v3, v3, v5, v4
	; P8BE-NEXT: vmrghh v3, v4, v3			; P8BE-NEXT: vsubuhm v2, v2, v3
	; P8BE-NEXT: vmrghh v2, v2, v5
	; P8BE-NEXT: vmrghw v2, v2, v3
	; P8BE-NEXT: blr			; P8BE-NEXT: blr
	%1 = urem <4 x i16> %x, <i16 1, i16 654, i16 23, i16 5423>			%1 = urem <4 x i16> %x, <i16 1, i16 654, i16 23, i16 5423>
	ret <4 x i16> %1			ret <4 x i16> %1
	}			}

	; Don't fold if the divisor is 2^16.			; Don't fold if the divisor is 2^16.
	define <4 x i16> @dont_fold_urem_i16_smax(<4 x i16> %x) {			define <4 x i16> @dont_fold_urem_i16_smax(<4 x i16> %x) {
	; CHECK-LABEL: dont_fold_urem_i16_smax:			; CHECK-LABEL: dont_fold_urem_i16_smax:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: blr			; CHECK-NEXT: blr
	%1 = urem <4 x i16> %x, <i16 1, i16 65536, i16 23, i16 5423>			%1 = urem <4 x i16> %x, <i16 1, i16 65536, i16 23, i16 5423>
	ret <4 x i16> %1			ret <4 x i16> %1
	}			}

	; Don't fold i64 urem.			; Don't fold i64 urem.
	define <4 x i64> @dont_fold_urem_i64(<4 x i64> %x) {			define <4 x i64> @dont_fold_urem_i64(<4 x i64> %x) {
	; P9LE-LABEL: dont_fold_urem_i64:			; P9LE-LABEL: dont_fold_urem_i64:
	; P9LE: # %bb.0:			; P9LE: # %bb.0:
	; P9LE-NEXT: lis r4, 25644			; P9LE-NEXT: lis r3, 25644
	; P9LE-NEXT: mfvsrld r3, v3			; P9LE-NEXT: mfvsrld r4, v3
	; P9LE-NEXT: ori r4, r4, 34192			; P9LE-NEXT: xxlxor v5, v5, v5
				; P9LE-NEXT: ori r3, r3, 34192
				; P9LE-NEXT: sldi r3, r3, 32
				; P9LE-NEXT: oris r3, r3, 45590
				; P9LE-NEXT: ori r3, r3, 17097
				; P9LE-NEXT: mulld r5, r4, r3
				; P9LE-NEXT: mulhdu r3, r4, r3
				; P9LE-NEXT: addis r4, r2, .LCPI6_0@toc@ha
				; P9LE-NEXT: addi r4, r4, .LCPI6_0@toc@l
				; P9LE-NEXT: lxvx v0, 0, r4
				; P9LE-NEXT: mtvsrdd v4, r3, r5
				; P9LE-NEXT: lis r3, -16037
				; P9LE-NEXT: mfvsrd r5, v3
				; P9LE-NEXT: ori r3, r3, 28749
				; P9LE-NEXT: sldi r3, r3, 32
				; P9LE-NEXT: vspltb v1, v0, 15
				; P9LE-NEXT: vsro v4, v4, v0
				; P9LE-NEXT: vsro v5, v5, v0
				; P9LE-NEXT: oris r3, r3, 52170
				; P9LE-NEXT: vsr v4, v4, v1
				; P9LE-NEXT: vsr v5, v5, v1
				; P9LE-NEXT: ori r3, r3, 12109
				; P9LE-NEXT: mulld r4, r5, r3
				; P9LE-NEXT: mulhdu r3, r5, r3
				; P9LE-NEXT: mtvsrdd v6, r3, r4
				; P9LE-NEXT: vsro v6, v6, v0
				; P9LE-NEXT: vsr v6, v6, v1
				; P9LE-NEXT: xxmrgld v6, v6, v4
				; P9LE-NEXT: vsubudm v4, v3, v4
				; P9LE-NEXT: mfvsrld r3, v4
				; P9LE-NEXT: sldi r4, r3, 63
				; P9LE-NEXT: rldicl r3, r3, 63, 1
				; P9LE-NEXT: mtvsrdd v4, r3, r4
				; P9LE-NEXT: addis r3, r2, .LCPI6_1@toc@ha
				; P9LE-NEXT: vsro v4, v4, v0
				; P9LE-NEXT: addi r3, r3, .LCPI6_1@toc@l
				; P9LE-NEXT: vsr v4, v4, v1
				; P9LE-NEXT: xxmrgld v4, v5, v4
				; P9LE-NEXT: vaddudm v4, v4, v6
				; P9LE-NEXT: lxvx v6, 0, r3
				; P9LE-NEXT: vsrd v4, v4, v6
				; P9LE-NEXT: mfvsrld r3, v4
				; P9LE-NEXT: mfvsrd r4, v4
				; P9LE-NEXT: mulli r4, r4, 5423
				; P9LE-NEXT: mulli r3, r3, 23
				; P9LE-NEXT: mtvsrdd v4, r4, r3
				; P9LE-NEXT: addis r3, r2, .LCPI6_2@toc@ha
				; P9LE-NEXT: lis r4, 25653
				; P9LE-NEXT: addi r3, r3, .LCPI6_2@toc@l
				; P9LE-NEXT: vsubudm v3, v3, v4
				; P9LE-NEXT: ori r4, r4, 15432
				; P9LE-NEXT: lxvx v4, 0, r3
	; P9LE-NEXT: sldi r4, r4, 32			; P9LE-NEXT: sldi r4, r4, 32
	; P9LE-NEXT: oris r4, r4, 45590			; P9LE-NEXT: oris r4, r4, 1603
	; P9LE-NEXT: ori r4, r4, 17097			; P9LE-NEXT: ori r4, r4, 21445
	; P9LE-NEXT: mulhdu r4, r3, r4			; P9LE-NEXT: vsrd v4, v2, v4
	; P9LE-NEXT: sub r5, r3, r4			; P9LE-NEXT: mfvsrd r3, v4
	; P9LE-NEXT: rldicl r5, r5, 63, 1			; P9LE-NEXT: mulld r5, r3, r4
	; P9LE-NEXT: add r4, r5, r4			; P9LE-NEXT: mulhdu r3, r3, r4
	; P9LE-NEXT: lis r5, -16037			; P9LE-NEXT: mtvsrdd v4, r3, r5
	; P9LE-NEXT: rldicl r4, r4, 60, 4			; P9LE-NEXT: addis r3, r2, .LCPI6_3@toc@ha
	; P9LE-NEXT: ori r5, r5, 28749			; P9LE-NEXT: vsro v4, v4, v0
	; P9LE-NEXT: mulli r4, r4, 23			; P9LE-NEXT: addi r3, r3, .LCPI6_3@toc@l
	; P9LE-NEXT: sldi r5, r5, 32			; P9LE-NEXT: vsr v4, v4, v1
	; P9LE-NEXT: oris r5, r5, 52170			; P9LE-NEXT: xxmrgld v4, v4, v5
	; P9LE-NEXT: ori r5, r5, 12109			; P9LE-NEXT: xxspltd v5, v5, 1
	; P9LE-NEXT: sub r3, r3, r4			; P9LE-NEXT: xxlor v4, v5, v4
	; P9LE-NEXT: mfvsrd r4, v3			; P9LE-NEXT: lxvx v5, 0, r3
	; P9LE-NEXT: mulhdu r5, r4, r5			; P9LE-NEXT: addis r3, r2, .LCPI6_4@toc@ha
	; P9LE-NEXT: rldicl r5, r5, 52, 12			; P9LE-NEXT: addi r3, r3, .LCPI6_4@toc@l
	; P9LE-NEXT: mulli r5, r5, 5423			; P9LE-NEXT: vsrd v4, v4, v5
	; P9LE-NEXT: sub r4, r4, r5			; P9LE-NEXT: lxvx v5, 0, r3
	; P9LE-NEXT: lis r5, 25653			; P9LE-NEXT: xxsel vs0, v4, v2, v5
	; P9LE-NEXT: ori r5, r5, 15432			; P9LE-NEXT: mffprd r4, f0
	; P9LE-NEXT: mtvsrdd v3, r4, r3			; P9LE-NEXT: mfvsrld r3, vs0
	; P9LE-NEXT: mfvsrd r3, v2
	; P9LE-NEXT: sldi r5, r5, 32
	; P9LE-NEXT: rldicl r4, r3, 63, 1
	; P9LE-NEXT: oris r5, r5, 1603
	; P9LE-NEXT: ori r5, r5, 21445
	; P9LE-NEXT: mulhdu r4, r4, r5
	; P9LE-NEXT: rldicl r4, r4, 57, 7
	; P9LE-NEXT: mulli r4, r4, 654			; P9LE-NEXT: mulli r4, r4, 654
	; P9LE-NEXT: sub r3, r3, r4			; P9LE-NEXT: mtvsrdd v4, r4, r3
	; P9LE-NEXT: li r4, 0			; P9LE-NEXT: vsubudm v2, v2, v4
	; P9LE-NEXT: mtvsrdd v2, r3, r4
	; P9LE-NEXT: blr			; P9LE-NEXT: blr
	;			;
	; P9BE-LABEL: dont_fold_urem_i64:			; P9BE-LABEL: dont_fold_urem_i64:
	; P9BE: # %bb.0:			; P9BE: # %bb.0:
				; P9BE-NEXT: lis r3, -16037
				; P9BE-NEXT: mfvsrld r4, v3
				; P9BE-NEXT: xxlxor v5, v5, v5
				; P9BE-NEXT: ori r3, r3, 28749
				; P9BE-NEXT: sldi r3, r3, 32
				; P9BE-NEXT: oris r3, r3, 52170
				; P9BE-NEXT: ori r3, r3, 12109
				; P9BE-NEXT: mulld r5, r4, r3
				; P9BE-NEXT: mulhdu r3, r4, r3
	; P9BE-NEXT: lis r4, 25644			; P9BE-NEXT: lis r4, 25644
	; P9BE-NEXT: mfvsrd r3, v3
	; P9BE-NEXT: ori r4, r4, 34192			; P9BE-NEXT: ori r4, r4, 34192
	; P9BE-NEXT: sldi r4, r4, 32			; P9BE-NEXT: sldi r4, r4, 32
				; P9BE-NEXT: mtvsrdd v4, r3, r5
				; P9BE-NEXT: mfvsrd r3, v3
	; P9BE-NEXT: oris r4, r4, 45590			; P9BE-NEXT: oris r4, r4, 45590
	; P9BE-NEXT: ori r4, r4, 17097			; P9BE-NEXT: ori r4, r4, 17097
	; P9BE-NEXT: mulhdu r4, r3, r4			; P9BE-NEXT: mulld r5, r3, r4
	; P9BE-NEXT: sub r5, r3, r4			; P9BE-NEXT: mulhdu r3, r3, r4
	; P9BE-NEXT: rldicl r5, r5, 63, 1			; P9BE-NEXT: addis r4, r2, .LCPI6_0@toc@ha
	; P9BE-NEXT: add r4, r5, r4			; P9BE-NEXT: addi r4, r4, .LCPI6_0@toc@l
	; P9BE-NEXT: lis r5, -16037			; P9BE-NEXT: lxvx v0, 0, r4
	; P9BE-NEXT: rldicl r4, r4, 60, 4			; P9BE-NEXT: vspltb v1, v0, 15
	; P9BE-NEXT: ori r5, r5, 28749			; P9BE-NEXT: mtvsrdd v6, r3, r5
				; P9BE-NEXT: vsro v4, v4, v0
				; P9BE-NEXT: vsro v6, v6, v0
				; P9BE-NEXT: vsro v5, v5, v0
				; P9BE-NEXT: vsr v4, v4, v1
				; P9BE-NEXT: vsr v6, v6, v1
				; P9BE-NEXT: vsr v5, v5, v1
				; P9BE-NEXT: xxmrgld v4, v6, v4
				; P9BE-NEXT: vsubudm v6, v3, v4
				; P9BE-NEXT: mfvsrd r3, v6
				; P9BE-NEXT: sldi r4, r3, 63
				; P9BE-NEXT: rldicl r3, r3, 63, 1
				; P9BE-NEXT: mtvsrdd v6, r3, r4
				; P9BE-NEXT: addis r3, r2, .LCPI6_1@toc@ha
				; P9BE-NEXT: vsro v6, v6, v0
				; P9BE-NEXT: addi r3, r3, .LCPI6_1@toc@l
				; P9BE-NEXT: vsr v6, v6, v1
				; P9BE-NEXT: xxmrgld v6, v6, v5
				; P9BE-NEXT: vaddudm v4, v6, v4
				; P9BE-NEXT: lxvx v6, 0, r3
				; P9BE-NEXT: vsrd v4, v4, v6
				; P9BE-NEXT: mfvsrld r3, v4
				; P9BE-NEXT: mfvsrd r4, v4
	; P9BE-NEXT: mulli r4, r4, 23			; P9BE-NEXT: mulli r4, r4, 23
	; P9BE-NEXT: sldi r5, r5, 32			; P9BE-NEXT: mulli r3, r3, 5423
	; P9BE-NEXT: oris r5, r5, 52170			; P9BE-NEXT: mtvsrdd v4, r4, r3
	; P9BE-NEXT: ori r5, r5, 12109			; P9BE-NEXT: addis r3, r2, .LCPI6_2@toc@ha
	; P9BE-NEXT: sub r3, r3, r4			; P9BE-NEXT: lis r4, 25653
	; P9BE-NEXT: mfvsrld r4, v3			; P9BE-NEXT: addi r3, r3, .LCPI6_2@toc@l
	; P9BE-NEXT: mulhdu r5, r4, r5			; P9BE-NEXT: vsubudm v3, v3, v4
	; P9BE-NEXT: rldicl r5, r5, 52, 12			; P9BE-NEXT: ori r4, r4, 15432
	; P9BE-NEXT: mulli r5, r5, 5423			; P9BE-NEXT: lxvx v4, 0, r3
	; P9BE-NEXT: sub r4, r4, r5			; P9BE-NEXT: sldi r4, r4, 32
	; P9BE-NEXT: lis r5, 25653			; P9BE-NEXT: oris r4, r4, 1603
	; P9BE-NEXT: ori r5, r5, 15432			; P9BE-NEXT: ori r4, r4, 21445
	; P9BE-NEXT: mtvsrdd v3, r3, r4			; P9BE-NEXT: vsrd v4, v2, v4
	; P9BE-NEXT: mfvsrld r3, v2			; P9BE-NEXT: mfvsrld r3, v4
	; P9BE-NEXT: sldi r5, r5, 32			; P9BE-NEXT: mulld r5, r3, r4
	; P9BE-NEXT: rldicl r4, r3, 63, 1			; P9BE-NEXT: mulhdu r3, r3, r4
	; P9BE-NEXT: oris r5, r5, 1603			; P9BE-NEXT: mtvsrdd v4, r3, r5
	; P9BE-NEXT: ori r5, r5, 21445			; P9BE-NEXT: addis r3, r2, .LCPI6_3@toc@ha
	; P9BE-NEXT: mulhdu r4, r4, r5			; P9BE-NEXT: vsro v4, v4, v0
	; P9BE-NEXT: rldicl r4, r4, 57, 7			; P9BE-NEXT: addi r3, r3, .LCPI6_3@toc@l
	; P9BE-NEXT: mulli r4, r4, 654			; P9BE-NEXT: vsr v4, v4, v1
	; P9BE-NEXT: sub r3, r3, r4			; P9BE-NEXT: xxmrgld v4, v5, v4
	; P9BE-NEXT: mtvsrdd v2, 0, r3			; P9BE-NEXT: xxspltd v5, v5, 1
				; P9BE-NEXT: xxlor v4, v5, v4
				; P9BE-NEXT: lxvx v5, 0, r3
				; P9BE-NEXT: addis r3, r2, .LCPI6_4@toc@ha
				; P9BE-NEXT: addi r3, r3, .LCPI6_4@toc@l
				; P9BE-NEXT: vsrd v4, v4, v5
				; P9BE-NEXT: lxvx v5, 0, r3
				; P9BE-NEXT: xxsel vs0, v4, v2, v5
				; P9BE-NEXT: mfvsrld r3, vs0
				; P9BE-NEXT: mffprd r4, f0
				; P9BE-NEXT: mulli r3, r3, 654
				; P9BE-NEXT: mtvsrdd v4, r4, r3
				; P9BE-NEXT: vsubudm v2, v2, v4
	; P9BE-NEXT: blr			; P9BE-NEXT: blr
	;			;
	; P8LE-LABEL: dont_fold_urem_i64:			; P8LE-LABEL: dont_fold_urem_i64:
	; P8LE: # %bb.0:			; P8LE: # %bb.0:
	; P8LE-NEXT: lis r3, 25644			; P8LE-NEXT: lis r3, 25644
	; P8LE-NEXT: xxswapd vs0, v3			; P8LE-NEXT: xxswapd vs0, v3
	; P8LE-NEXT: lis r4, -16037			; P8LE-NEXT: addis r4, r2, .LCPI6_1@toc@ha
	; P8LE-NEXT: lis r5, 25653			; P8LE-NEXT: xxlxor vs2, vs2, vs2
	; P8LE-NEXT: mfvsrd r6, v2
	; P8LE-NEXT: ori r3, r3, 34192			; P8LE-NEXT: ori r3, r3, 34192
	; P8LE-NEXT: ori r4, r4, 28749			; P8LE-NEXT: addi r4, r4, .LCPI6_1@toc@l
	; P8LE-NEXT: ori r5, r5, 15432
	; P8LE-NEXT: mfvsrd r8, v3
	; P8LE-NEXT: sldi r3, r3, 32			; P8LE-NEXT: sldi r3, r3, 32
	; P8LE-NEXT: sldi r4, r4, 32
	; P8LE-NEXT: oris r3, r3, 45590			; P8LE-NEXT: oris r3, r3, 45590
	; P8LE-NEXT: mffprd r7, f0			; P8LE-NEXT: mffprd r5, f0
	; P8LE-NEXT: sldi r5, r5, 32			; P8LE-NEXT: lxvd2x vs0, 0, r4
	; P8LE-NEXT: oris r4, r4, 52170			; P8LE-NEXT: li r4, 0
	; P8LE-NEXT: ori r3, r3, 17097			; P8LE-NEXT: ori r3, r3, 17097
	; P8LE-NEXT: oris r5, r5, 1603			; P8LE-NEXT: mtfprd f1, r4
	; P8LE-NEXT: ori r4, r4, 12109			; P8LE-NEXT: lis r4, -16037
	; P8LE-NEXT: mulhdu r3, r7, r3			; P8LE-NEXT: mulhdu r3, r5, r3
	; P8LE-NEXT: rldicl r9, r6, 63, 1			; P8LE-NEXT: mfvsrd r5, v3
	; P8LE-NEXT: ori r5, r5, 21445			; P8LE-NEXT: xxswapd v4, vs0
	; P8LE-NEXT: mulhdu r4, r8, r4			; P8LE-NEXT: mtfprd f0, r3
	; P8LE-NEXT: mulhdu r5, r9, r5			; P8LE-NEXT: ori r3, r4, 28749
	; P8LE-NEXT: sub r9, r7, r3			; P8LE-NEXT: lis r4, 25653
	; P8LE-NEXT: rldicl r9, r9, 63, 1			; P8LE-NEXT: sldi r3, r3, 32
	; P8LE-NEXT: rldicl r4, r4, 52, 12			; P8LE-NEXT: vsrd v4, v2, v4
	; P8LE-NEXT: add r3, r9, r3			; P8LE-NEXT: ori r4, r4, 15432
	; P8LE-NEXT: rldicl r5, r5, 57, 7			; P8LE-NEXT: xxmrghd v5, vs1, vs0
	; P8LE-NEXT: mulli r4, r4, 5423			; P8LE-NEXT: oris r3, r3, 52170
	; P8LE-NEXT: rldicl r3, r3, 60, 4			; P8LE-NEXT: sldi r4, r4, 32
	; P8LE-NEXT: mulli r5, r5, 654			; P8LE-NEXT: ori r3, r3, 12109
	; P8LE-NEXT: mulli r3, r3, 23			; P8LE-NEXT: mfvsrd r6, v4
	; P8LE-NEXT: sub r4, r8, r4			; P8LE-NEXT: oris r4, r4, 1603
	; P8LE-NEXT: sub r5, r6, r5			; P8LE-NEXT: mulhdu r3, r5, r3
				; P8LE-NEXT: ori r4, r4, 21445
				; P8LE-NEXT: addis r5, r2, .LCPI6_2@toc@ha
				; P8LE-NEXT: vsubudm v4, v3, v5
				; P8LE-NEXT: mulhdu r4, r6, r4
				; P8LE-NEXT: addi r5, r5, .LCPI6_2@toc@l
				; P8LE-NEXT: xxswapd vs0, v4
				; P8LE-NEXT: mtfprd f1, r3
				; P8LE-NEXT: mffprd r3, f0
				; P8LE-NEXT: xxspltd v4, vs1, 0
				; P8LE-NEXT: lxvd2x vs1, 0, r5
				; P8LE-NEXT: addis r5, r2, .LCPI6_3@toc@ha
	; P8LE-NEXT: mtfprd f0, r4			; P8LE-NEXT: mtfprd f0, r4
	; P8LE-NEXT: sub r3, r7, r3			; P8LE-NEXT: addis r4, r2, .LCPI6_0@toc@ha
	; P8LE-NEXT: li r4, 0			; P8LE-NEXT: rldicl r3, r3, 63, 1
	; P8LE-NEXT: mtfprd f1, r5			; P8LE-NEXT: addi r4, r4, .LCPI6_0@toc@l
	; P8LE-NEXT: mtfprd f2, r3			; P8LE-NEXT: mtfprd f3, r3
	; P8LE-NEXT: mtfprd f3, r4			; P8LE-NEXT: xxspltd v0, vs0, 0
	; P8LE-NEXT: xxmrghd v3, vs0, vs2			; P8LE-NEXT: lxvd2x vs0, 0, r4
	; P8LE-NEXT: xxmrghd v2, vs1, vs3			; P8LE-NEXT: addi r3, r5, .LCPI6_3@toc@l
				; P8LE-NEXT: xxmrgld v4, v4, v5
				; P8LE-NEXT: lxvd2x vs4, 0, r3
				; P8LE-NEXT: xxswapd v1, vs1
				; P8LE-NEXT: xxpermdi v5, vs2, vs3, 2
				; P8LE-NEXT: xxmrgld v0, v0, vs2
				; P8LE-NEXT: xxswapd v6, vs0
				; P8LE-NEXT: vaddudm v4, v5, v4
				; P8LE-NEXT: xxswapd v5, vs4
				; P8LE-NEXT: vsrd v0, v0, v1
				; P8LE-NEXT: vsrd v4, v4, v6
				; P8LE-NEXT: xxsel vs0, v0, v2, v5
				; P8LE-NEXT: xxswapd vs1, v4
				; P8LE-NEXT: mfvsrd r3, v4
				; P8LE-NEXT: mffprd r5, f0
				; P8LE-NEXT: xxswapd vs2, vs0
				; P8LE-NEXT: mulli r3, r3, 5423
				; P8LE-NEXT: mffprd r4, f1
				; P8LE-NEXT: mulli r5, r5, 654
				; P8LE-NEXT: mulli r4, r4, 23
				; P8LE-NEXT: mffprd r6, f2
				; P8LE-NEXT: mtfprd f1, r3
				; P8LE-NEXT: mtfprd f0, r6
				; P8LE-NEXT: mtfprd f3, r5
				; P8LE-NEXT: mtfprd f2, r4
				; P8LE-NEXT: xxmrghd v5, vs3, vs0
				; P8LE-NEXT: xxmrghd v4, vs1, vs2
				; P8LE-NEXT: vsubudm v2, v2, v5
				; P8LE-NEXT: vsubudm v3, v3, v4
	; P8LE-NEXT: blr			; P8LE-NEXT: blr
	;			;
	; P8BE-LABEL: dont_fold_urem_i64:			; P8BE-LABEL: dont_fold_urem_i64:
	; P8BE: # %bb.0:			; P8BE: # %bb.0:
	; P8BE-NEXT: lis r3, 25644			; P8BE-NEXT: lis r3, 25644
	; P8BE-NEXT: lis r4, -16037			; P8BE-NEXT: lis r4, -16037
	; P8BE-NEXT: xxswapd vs0, v3			; P8BE-NEXT: xxswapd vs0, v3
	; P8BE-NEXT: xxswapd vs1, v2			; P8BE-NEXT: addis r5, r2, .LCPI6_1@toc@ha
	; P8BE-NEXT: lis r5, 25653			; P8BE-NEXT: mfvsrd r6, v3
	; P8BE-NEXT: ori r3, r3, 34192			; P8BE-NEXT: ori r3, r3, 34192
	; P8BE-NEXT: ori r4, r4, 28749			; P8BE-NEXT: ori r4, r4, 28749
	; P8BE-NEXT: mfvsrd r6, v3			; P8BE-NEXT: addi r5, r5, .LCPI6_1@toc@l
	; P8BE-NEXT: ori r5, r5, 15432
	; P8BE-NEXT: sldi r3, r3, 32			; P8BE-NEXT: sldi r3, r3, 32
	; P8BE-NEXT: sldi r4, r4, 32			; P8BE-NEXT: sldi r4, r4, 32
				; P8BE-NEXT: lxvd2x v4, 0, r5
	; P8BE-NEXT: oris r3, r3, 45590			; P8BE-NEXT: oris r3, r3, 45590
	; P8BE-NEXT: sldi r5, r5, 32
	; P8BE-NEXT: mffprd r7, f0
	; P8BE-NEXT: oris r4, r4, 52170			; P8BE-NEXT: oris r4, r4, 52170
				; P8BE-NEXT: mffprd r7, f0
	; P8BE-NEXT: ori r3, r3, 17097			; P8BE-NEXT: ori r3, r3, 17097
	; P8BE-NEXT: mffprd r8, f1
	; P8BE-NEXT: oris r5, r5, 1603
	; P8BE-NEXT: ori r4, r4, 12109			; P8BE-NEXT: ori r4, r4, 12109
	; P8BE-NEXT: mulhdu r3, r6, r3			; P8BE-NEXT: mulhdu r3, r6, r3
	; P8BE-NEXT: ori r5, r5, 21445
	; P8BE-NEXT: mulhdu r4, r7, r4			; P8BE-NEXT: mulhdu r4, r7, r4
	; P8BE-NEXT: rldicl r9, r8, 63, 1			; P8BE-NEXT: vsrd v4, v2, v4
	; P8BE-NEXT: mulhdu r5, r9, r5			; P8BE-NEXT: xxswapd vs1, v4
	; P8BE-NEXT: sub r9, r6, r3			; P8BE-NEXT: mtfprd f0, r3
	; P8BE-NEXT: rldicl r9, r9, 63, 1			; P8BE-NEXT: lis r3, 25653
	; P8BE-NEXT: rldicl r4, r4, 52, 12			; P8BE-NEXT: mtfprd f2, r4
	; P8BE-NEXT: add r3, r9, r3			; P8BE-NEXT: ori r3, r3, 15432
	; P8BE-NEXT: mulli r4, r4, 5423			; P8BE-NEXT: sldi r3, r3, 32
	; P8BE-NEXT: rldicl r5, r5, 57, 7			; P8BE-NEXT: mffprd r4, f1
	; P8BE-NEXT: rldicl r3, r3, 60, 4			; P8BE-NEXT: xxmrghd v4, vs0, vs2
	; P8BE-NEXT: mulli r5, r5, 654			; P8BE-NEXT: oris r3, r3, 1603
				; P8BE-NEXT: ori r3, r3, 21445
				; P8BE-NEXT: mulhdu r3, r4, r3
				; P8BE-NEXT: vsubudm v5, v3, v4
				; P8BE-NEXT: mfvsrd r4, v5
				; P8BE-NEXT: mtfprd f0, r3
				; P8BE-NEXT: rldicl r3, r4, 63, 1
				; P8BE-NEXT: addis r4, r2, .LCPI6_3@toc@ha
				; P8BE-NEXT: mtfprd f1, r3
				; P8BE-NEXT: xxspltd v5, vs0, 0
				; P8BE-NEXT: addis r3, r2, .LCPI6_2@toc@ha
				; P8BE-NEXT: addi r4, r4, .LCPI6_3@toc@l
				; P8BE-NEXT: xxlxor vs0, vs0, vs0
				; P8BE-NEXT: addi r3, r3, .LCPI6_2@toc@l
				; P8BE-NEXT: lxvd2x v6, 0, r4
				; P8BE-NEXT: xxspltd v0, vs1, 0
				; P8BE-NEXT: lxvd2x v1, 0, r3
				; P8BE-NEXT: addis r3, r2, .LCPI6_0@toc@ha
				; P8BE-NEXT: xxmrgld v5, vs0, v5
				; P8BE-NEXT: addi r3, r3, .LCPI6_0@toc@l
				; P8BE-NEXT: xxmrgld v0, v0, vs0
				; P8BE-NEXT: vsrd v5, v5, v1
				; P8BE-NEXT: lxvd2x v1, 0, r3
				; P8BE-NEXT: vaddudm v4, v0, v4
				; P8BE-NEXT: xxsel vs0, v5, v2, v6
				; P8BE-NEXT: vsrd v4, v4, v1
				; P8BE-NEXT: xxswapd vs2, vs0
				; P8BE-NEXT: mffprd r6, f0
				; P8BE-NEXT: xxswapd vs1, v4
				; P8BE-NEXT: mfvsrd r3, v4
				; P8BE-NEXT: mtfprd f0, r6
				; P8BE-NEXT: mffprd r5, f2
	; P8BE-NEXT: mulli r3, r3, 23			; P8BE-NEXT: mulli r3, r3, 23
	; P8BE-NEXT: sub r4, r7, r4			; P8BE-NEXT: mffprd r4, f1
	; P8BE-NEXT: mtfprd f0, r4			; P8BE-NEXT: mulli r5, r5, 654
	; P8BE-NEXT: sub r4, r8, r5			; P8BE-NEXT: mulli r4, r4, 5423
	; P8BE-NEXT: sub r3, r6, r3			; P8BE-NEXT: mtfprd f1, r3
	; P8BE-NEXT: mtfprd f1, r4			; P8BE-NEXT: mtfprd f3, r5
	; P8BE-NEXT: li r4, 0			; P8BE-NEXT: mtfprd f2, r4
	; P8BE-NEXT: mtfprd f2, r3			; P8BE-NEXT: xxmrghd v5, vs0, vs3
	; P8BE-NEXT: mtfprd f3, r4			; P8BE-NEXT: xxmrghd v4, vs1, vs2
	; P8BE-NEXT: xxmrghd v3, vs2, vs0			; P8BE-NEXT: vsubudm v2, v2, v5
	; P8BE-NEXT: xxmrghd v2, vs3, vs1			; P8BE-NEXT: vsubudm v3, v3, v4
	; P8BE-NEXT: blr			; P8BE-NEXT: blr
	%1 = urem <4 x i64> %x, <i64 1, i64 654, i64 23, i64 5423>			%1 = urem <4 x i64> %x, <i64 1, i64 654, i64 23, i64 5423>
	ret <4 x i64> %1			ret <4 x i64> %1
	}			}

llvm/test/CodeGen/RISCV/div.ll

Show First 20 Lines • Show All 43 Lines • ▼ Show 20 Lines	; RV64IM-NEXT: ret
ret i32 %1		ret i32 %1
}		}

define i32 @udiv_constant(i32 %a) nounwind {		define i32 @udiv_constant(i32 %a) nounwind {
; RV32I-LABEL: udiv_constant:		; RV32I-LABEL: udiv_constant:
; RV32I: # %bb.0:		; RV32I: # %bb.0:
; RV32I-NEXT: addi sp, sp, -16		; RV32I-NEXT: addi sp, sp, -16
; RV32I-NEXT: sw ra, 12(sp)		; RV32I-NEXT: sw ra, 12(sp)
; RV32I-NEXT: addi a1, zero, 5		; RV32I-NEXT: lui a1, 838861
; RV32I-NEXT: call __udivsi3		; RV32I-NEXT: addi a2, a1, -819
		; RV32I-NEXT: mv a1, zero
		; RV32I-NEXT: mv a3, zero
		; RV32I-NEXT: call __muldi3
		; RV32I-NEXT: srli a0, a1, 2
; RV32I-NEXT: lw ra, 12(sp)		; RV32I-NEXT: lw ra, 12(sp)
; RV32I-NEXT: addi sp, sp, 16		; RV32I-NEXT: addi sp, sp, 16
; RV32I-NEXT: ret		; RV32I-NEXT: ret
;		;
; RV32IM-LABEL: udiv_constant:		; RV32IM-LABEL: udiv_constant:
; RV32IM: # %bb.0:		; RV32IM: # %bb.0:
; RV32IM-NEXT: lui a1, 838861		; RV32IM-NEXT: lui a1, 838861
; RV32IM-NEXT: addi a1, a1, -819		; RV32IM-NEXT: addi a1, a1, -819
; RV32IM-NEXT: mulhu a0, a0, a1		; RV32IM-NEXT: mulhu a0, a0, a1
; RV32IM-NEXT: srli a0, a0, 2		; RV32IM-NEXT: srli a0, a0, 2
; RV32IM-NEXT: ret		; RV32IM-NEXT: ret
;		;
; RV64I-LABEL: udiv_constant:		; RV64I-LABEL: udiv_constant:
; RV64I: # %bb.0:		; RV64I: # %bb.0:
; RV64I-NEXT: addi sp, sp, -16		; RV64I-NEXT: addi sp, sp, -16
; RV64I-NEXT: sd ra, 8(sp)		; RV64I-NEXT: sd ra, 8(sp)
; RV64I-NEXT: slli a0, a0, 32		; RV64I-NEXT: slli a0, a0, 32
; RV64I-NEXT: srli a0, a0, 32		; RV64I-NEXT: srli a0, a0, 32
; RV64I-NEXT: addi a1, zero, 5		; RV64I-NEXT: lui a1, 205
; RV64I-NEXT: call __udivdi3		; RV64I-NEXT: addiw a1, a1, -819
		; RV64I-NEXT: slli a1, a1, 12
		; RV64I-NEXT: addi a1, a1, -819
		; RV64I-NEXT: call __muldi3
		; RV64I-NEXT: srli a0, a0, 34
; RV64I-NEXT: ld ra, 8(sp)		; RV64I-NEXT: ld ra, 8(sp)
; RV64I-NEXT: addi sp, sp, 16		; RV64I-NEXT: addi sp, sp, 16
; RV64I-NEXT: ret		; RV64I-NEXT: ret
;		;
; RV64IM-LABEL: udiv_constant:		; RV64IM-LABEL: udiv_constant:
; RV64IM: # %bb.0:		; RV64IM: # %bb.0:
; RV64IM-NEXT: slli a0, a0, 32		; RV64IM-NEXT: slli a0, a0, 32
; RV64IM-NEXT: srli a0, a0, 32		; RV64IM-NEXT: srli a0, a0, 32
; RV64IM-NEXT: lui a1, 1035469		; RV64IM-NEXT: lui a1, 205
; RV64IM-NEXT: addiw a1, a1, -819		; RV64IM-NEXT: addiw a1, a1, -819
; RV64IM-NEXT: slli a1, a1, 12		; RV64IM-NEXT: slli a1, a1, 12
; RV64IM-NEXT: addi a1, a1, -819		; RV64IM-NEXT: addi a1, a1, -819
; RV64IM-NEXT: slli a1, a1, 12		; RV64IM-NEXT: mul a0, a0, a1
; RV64IM-NEXT: addi a1, a1, -819		; RV64IM-NEXT: srli a0, a0, 34
; RV64IM-NEXT: slli a1, a1, 12
; RV64IM-NEXT: addi a1, a1, -819
; RV64IM-NEXT: mulhu a0, a0, a1
; RV64IM-NEXT: srli a0, a0, 2
; RV64IM-NEXT: ret		; RV64IM-NEXT: ret
%1 = udiv i32 %a, 5		%1 = udiv i32 %a, 5
ret i32 %1		ret i32 %1
}		}

define i32 @udiv_pow2(i32 %a) nounwind {		define i32 @udiv_pow2(i32 %a) nounwind {
; RV32I-LABEL: udiv_pow2:		; RV32I-LABEL: udiv_pow2:
; RV32I: # %bb.0:		; RV32I: # %bb.0:
▲ Show 20 Lines • Show All 52 Lines • ▼ Show 20 Lines
; RV64IM-NEXT: ret		; RV64IM-NEXT: ret
%1 = udiv i64 %a, %b		%1 = udiv i64 %a, %b
ret i64 %1		ret i64 %1
}		}

define i64 @udiv64_constant(i64 %a) nounwind {		define i64 @udiv64_constant(i64 %a) nounwind {
; RV32I-LABEL: udiv64_constant:		; RV32I-LABEL: udiv64_constant:
; RV32I: # %bb.0:		; RV32I: # %bb.0:
; RV32I-NEXT: addi sp, sp, -16		; RV32I-NEXT: addi sp, sp, -64
; RV32I-NEXT: sw ra, 12(sp)		; RV32I-NEXT: sw ra, 60(sp)
; RV32I-NEXT: addi a2, zero, 5		; RV32I-NEXT: sw zero, 20(sp)
; RV32I-NEXT: mv a3, zero		; RV32I-NEXT: sw zero, 16(sp)
; RV32I-NEXT: call __udivdi3		; RV32I-NEXT: sw zero, 36(sp)
; RV32I-NEXT: lw ra, 12(sp)		; RV32I-NEXT: sw zero, 32(sp)
; RV32I-NEXT: addi sp, sp, 16		; RV32I-NEXT: sw a1, 28(sp)
		; RV32I-NEXT: sw a0, 24(sp)
		; RV32I-NEXT: lui a0, 838861
		; RV32I-NEXT: addi a1, a0, -820
		; RV32I-NEXT: sw a1, 12(sp)
		; RV32I-NEXT: addi a3, a0, -819
		; RV32I-NEXT: addi a0, sp, 40
		; RV32I-NEXT: addi a1, sp, 24
		; RV32I-NEXT: addi a2, sp, 8
		; RV32I-NEXT: sw a3, 8(sp)
		; RV32I-NEXT: call __multi3
		; RV32I-NEXT: lw a1, 52(sp)
		; RV32I-NEXT: lw a0, 48(sp)
		; RV32I-NEXT: slli a2, a1, 30
		; RV32I-NEXT: srli a0, a0, 2
		; RV32I-NEXT: or a0, a0, a2
		; RV32I-NEXT: srli a1, a1, 2
		; RV32I-NEXT: lw ra, 60(sp)
		; RV32I-NEXT: addi sp, sp, 64
; RV32I-NEXT: ret		; RV32I-NEXT: ret
;		;
; RV32IM-LABEL: udiv64_constant:		; RV32IM-LABEL: udiv64_constant:
; RV32IM: # %bb.0:		; RV32IM: # %bb.0:
; RV32IM-NEXT: addi sp, sp, -16		; RV32IM-NEXT: addi sp, sp, -64
; RV32IM-NEXT: sw ra, 12(sp)		; RV32IM-NEXT: sw ra, 60(sp)
; RV32IM-NEXT: addi a2, zero, 5		; RV32IM-NEXT: sw zero, 20(sp)
; RV32IM-NEXT: mv a3, zero		; RV32IM-NEXT: sw zero, 16(sp)
; RV32IM-NEXT: call __udivdi3		; RV32IM-NEXT: sw zero, 36(sp)
; RV32IM-NEXT: lw ra, 12(sp)		; RV32IM-NEXT: sw zero, 32(sp)
; RV32IM-NEXT: addi sp, sp, 16		; RV32IM-NEXT: sw a1, 28(sp)
		; RV32IM-NEXT: sw a0, 24(sp)
		; RV32IM-NEXT: lui a0, 838861
		; RV32IM-NEXT: addi a1, a0, -820
		; RV32IM-NEXT: sw a1, 12(sp)
		; RV32IM-NEXT: addi a3, a0, -819
		; RV32IM-NEXT: addi a0, sp, 40
		; RV32IM-NEXT: addi a1, sp, 24
		; RV32IM-NEXT: addi a2, sp, 8
		; RV32IM-NEXT: sw a3, 8(sp)
		; RV32IM-NEXT: call __multi3
		; RV32IM-NEXT: lw a1, 52(sp)
		; RV32IM-NEXT: lw a0, 48(sp)
		; RV32IM-NEXT: slli a2, a1, 30
		; RV32IM-NEXT: srli a0, a0, 2
		; RV32IM-NEXT: or a0, a0, a2
		; RV32IM-NEXT: srli a1, a1, 2
		; RV32IM-NEXT: lw ra, 60(sp)
		; RV32IM-NEXT: addi sp, sp, 64
; RV32IM-NEXT: ret		; RV32IM-NEXT: ret
;		;
; RV64I-LABEL: udiv64_constant:		; RV64I-LABEL: udiv64_constant:
; RV64I: # %bb.0:		; RV64I: # %bb.0:
; RV64I-NEXT: addi sp, sp, -16		; RV64I-NEXT: addi sp, sp, -16
; RV64I-NEXT: sd ra, 8(sp)		; RV64I-NEXT: sd ra, 8(sp)
; RV64I-NEXT: addi a1, zero, 5		; RV64I-NEXT: lui a1, 1035469
; RV64I-NEXT: call __udivdi3		; RV64I-NEXT: addiw a1, a1, -819
		; RV64I-NEXT: slli a1, a1, 12
		; RV64I-NEXT: addi a1, a1, -819
		; RV64I-NEXT: slli a1, a1, 12
		; RV64I-NEXT: addi a1, a1, -819
		; RV64I-NEXT: slli a1, a1, 12
		; RV64I-NEXT: addi a2, a1, -819
		; RV64I-NEXT: mv a1, zero
		; RV64I-NEXT: mv a3, zero
		; RV64I-NEXT: call __multi3
		; RV64I-NEXT: srli a0, a1, 2
; RV64I-NEXT: ld ra, 8(sp)		; RV64I-NEXT: ld ra, 8(sp)
; RV64I-NEXT: addi sp, sp, 16		; RV64I-NEXT: addi sp, sp, 16
; RV64I-NEXT: ret		; RV64I-NEXT: ret
;		;
; RV64IM-LABEL: udiv64_constant:		; RV64IM-LABEL: udiv64_constant:
; RV64IM: # %bb.0:		; RV64IM: # %bb.0:
; RV64IM-NEXT: lui a1, 1035469		; RV64IM-NEXT: lui a1, 1035469
; RV64IM-NEXT: addiw a1, a1, -819		; RV64IM-NEXT: addiw a1, a1, -819
▲ Show 20 Lines • Show All 44 Lines • ▼ Show 20 Lines	; RV64IM-NEXT: ret
ret i32 %1		ret i32 %1
}		}

define i32 @sdiv_constant(i32 %a) nounwind {		define i32 @sdiv_constant(i32 %a) nounwind {
; RV32I-LABEL: sdiv_constant:		; RV32I-LABEL: sdiv_constant:
; RV32I: # %bb.0:		; RV32I: # %bb.0:
; RV32I-NEXT: addi sp, sp, -16		; RV32I-NEXT: addi sp, sp, -16
; RV32I-NEXT: sw ra, 12(sp)		; RV32I-NEXT: sw ra, 12(sp)
; RV32I-NEXT: addi a1, zero, 5		; RV32I-NEXT: srai a1, a0, 31
; RV32I-NEXT: call __divsi3		; RV32I-NEXT: lui a2, 419430
		; RV32I-NEXT: addi a2, a2, 1639
		; RV32I-NEXT: mv a3, zero
		; RV32I-NEXT: call __muldi3
		; RV32I-NEXT: srli a0, a1, 31
		; RV32I-NEXT: srai a1, a1, 1
		; RV32I-NEXT: add a0, a1, a0
; RV32I-NEXT: lw ra, 12(sp)		; RV32I-NEXT: lw ra, 12(sp)
; RV32I-NEXT: addi sp, sp, 16		; RV32I-NEXT: addi sp, sp, 16
; RV32I-NEXT: ret		; RV32I-NEXT: ret
;		;
; RV32IM-LABEL: sdiv_constant:		; RV32IM-LABEL: sdiv_constant:
; RV32IM: # %bb.0:		; RV32IM: # %bb.0:
; RV32IM-NEXT: lui a1, 419430		; RV32IM-NEXT: lui a1, 419430
; RV32IM-NEXT: addi a1, a1, 1639		; RV32IM-NEXT: addi a1, a1, 1639
; RV32IM-NEXT: mulh a0, a0, a1		; RV32IM-NEXT: mulh a0, a0, a1
; RV32IM-NEXT: srli a1, a0, 31		; RV32IM-NEXT: srli a1, a0, 31
; RV32IM-NEXT: srai a0, a0, 1		; RV32IM-NEXT: srai a0, a0, 1
; RV32IM-NEXT: add a0, a0, a1		; RV32IM-NEXT: add a0, a0, a1
; RV32IM-NEXT: ret		; RV32IM-NEXT: ret
;		;
; RV64I-LABEL: sdiv_constant:		; RV64I-LABEL: sdiv_constant:
; RV64I: # %bb.0:		; RV64I: # %bb.0:
; RV64I-NEXT: addi sp, sp, -16		; RV64I-NEXT: addi sp, sp, -16
; RV64I-NEXT: sd ra, 8(sp)		; RV64I-NEXT: sd ra, 8(sp)
; RV64I-NEXT: sext.w a0, a0		; RV64I-NEXT: sext.w a0, a0
; RV64I-NEXT: addi a1, zero, 5		; RV64I-NEXT: lui a1, 419430
; RV64I-NEXT: call __divdi3		; RV64I-NEXT: addiw a1, a1, 1639
		; RV64I-NEXT: call __muldi3
		; RV64I-NEXT: srli a1, a0, 63
		; RV64I-NEXT: srai a0, a0, 33
		; RV64I-NEXT: add a0, a0, a1
; RV64I-NEXT: ld ra, 8(sp)		; RV64I-NEXT: ld ra, 8(sp)
; RV64I-NEXT: addi sp, sp, 16		; RV64I-NEXT: addi sp, sp, 16
; RV64I-NEXT: ret		; RV64I-NEXT: ret
;		;
; RV64IM-LABEL: sdiv_constant:		; RV64IM-LABEL: sdiv_constant:
; RV64IM: # %bb.0:		; RV64IM: # %bb.0:
; RV64IM-NEXT: sext.w a0, a0		; RV64IM-NEXT: sext.w a0, a0
; RV64IM-NEXT: lui a1, 13107		; RV64IM-NEXT: lui a1, 419430
; RV64IM-NEXT: addiw a1, a1, 819		; RV64IM-NEXT: addiw a1, a1, 1639
; RV64IM-NEXT: slli a1, a1, 12		; RV64IM-NEXT: mul a0, a0, a1
; RV64IM-NEXT: addi a1, a1, 819
; RV64IM-NEXT: slli a1, a1, 12
; RV64IM-NEXT: addi a1, a1, 819
; RV64IM-NEXT: slli a1, a1, 13
; RV64IM-NEXT: addi a1, a1, 1639
; RV64IM-NEXT: mulh a0, a0, a1
; RV64IM-NEXT: srli a1, a0, 63		; RV64IM-NEXT: srli a1, a0, 63
; RV64IM-NEXT: srai a0, a0, 1		; RV64IM-NEXT: srai a0, a0, 33
; RV64IM-NEXT: add a0, a0, a1		; RV64IM-NEXT: add a0, a0, a1
; RV64IM-NEXT: ret		; RV64IM-NEXT: ret
%1 = sdiv i32 %a, 5		%1 = sdiv i32 %a, 5
ret i32 %1		ret i32 %1
}		}

define i32 @sdiv_pow2(i32 %a) nounwind {		define i32 @sdiv_pow2(i32 %a) nounwind {
; RV32I-LABEL: sdiv_pow2:		; RV32I-LABEL: sdiv_pow2:
▲ Show 20 Lines • Show All 67 Lines • ▼ Show 20 Lines
; RV64IM-NEXT: ret		; RV64IM-NEXT: ret
%1 = sdiv i64 %a, %b		%1 = sdiv i64 %a, %b
ret i64 %1		ret i64 %1
}		}

define i64 @sdiv64_constant(i64 %a) nounwind {		define i64 @sdiv64_constant(i64 %a) nounwind {
; RV32I-LABEL: sdiv64_constant:		; RV32I-LABEL: sdiv64_constant:
; RV32I: # %bb.0:		; RV32I: # %bb.0:
; RV32I-NEXT: addi sp, sp, -16		; RV32I-NEXT: addi sp, sp, -64
; RV32I-NEXT: sw ra, 12(sp)		; RV32I-NEXT: sw ra, 60(sp)
; RV32I-NEXT: addi a2, zero, 5		; RV32I-NEXT: sw zero, 20(sp)
; RV32I-NEXT: mv a3, zero		; RV32I-NEXT: sw zero, 16(sp)
; RV32I-NEXT: call __divdi3		; RV32I-NEXT: sw a1, 28(sp)
; RV32I-NEXT: lw ra, 12(sp)		; RV32I-NEXT: sw a0, 24(sp)
; RV32I-NEXT: addi sp, sp, 16		; RV32I-NEXT: lui a0, 419430
		; RV32I-NEXT: addi a2, a0, 1638
		; RV32I-NEXT: sw a2, 12(sp)
		; RV32I-NEXT: addi a0, a0, 1639
		; RV32I-NEXT: sw a0, 8(sp)
		; RV32I-NEXT: srai a3, a1, 31
		; RV32I-NEXT: sw a3, 36(sp)
		; RV32I-NEXT: addi a0, sp, 40
		; RV32I-NEXT: addi a1, sp, 24
		; RV32I-NEXT: addi a2, sp, 8
		; RV32I-NEXT: sw a3, 32(sp)
		; RV32I-NEXT: call __multi3
		; RV32I-NEXT: lw a1, 52(sp)
		; RV32I-NEXT: lw a0, 48(sp)
		; RV32I-NEXT: slli a2, a1, 31
		; RV32I-NEXT: srli a0, a0, 1
		; RV32I-NEXT: or a2, a0, a2
		; RV32I-NEXT: srli a0, a1, 31
		; RV32I-NEXT: add a0, a2, a0
		; RV32I-NEXT: sltu a2, a0, a2
		; RV32I-NEXT: srai a1, a1, 1
		; RV32I-NEXT: add a1, a1, a2
		; RV32I-NEXT: lw ra, 60(sp)
		; RV32I-NEXT: addi sp, sp, 64
; RV32I-NEXT: ret		; RV32I-NEXT: ret
;		;
; RV32IM-LABEL: sdiv64_constant:		; RV32IM-LABEL: sdiv64_constant:
; RV32IM: # %bb.0:		; RV32IM: # %bb.0:
; RV32IM-NEXT: addi sp, sp, -16		; RV32IM-NEXT: addi sp, sp, -64
; RV32IM-NEXT: sw ra, 12(sp)		; RV32IM-NEXT: sw ra, 60(sp)
; RV32IM-NEXT: addi a2, zero, 5		; RV32IM-NEXT: sw zero, 20(sp)
; RV32IM-NEXT: mv a3, zero		; RV32IM-NEXT: sw zero, 16(sp)
; RV32IM-NEXT: call __divdi3		; RV32IM-NEXT: sw a1, 28(sp)
; RV32IM-NEXT: lw ra, 12(sp)		; RV32IM-NEXT: sw a0, 24(sp)
; RV32IM-NEXT: addi sp, sp, 16		; RV32IM-NEXT: lui a0, 419430
		; RV32IM-NEXT: addi a2, a0, 1638
		; RV32IM-NEXT: sw a2, 12(sp)
		; RV32IM-NEXT: addi a0, a0, 1639
		; RV32IM-NEXT: sw a0, 8(sp)
		; RV32IM-NEXT: srai a3, a1, 31
		; RV32IM-NEXT: sw a3, 36(sp)
		; RV32IM-NEXT: addi a0, sp, 40
		; RV32IM-NEXT: addi a1, sp, 24
		; RV32IM-NEXT: addi a2, sp, 8
		; RV32IM-NEXT: sw a3, 32(sp)
		; RV32IM-NEXT: call __multi3
		; RV32IM-NEXT: lw a1, 52(sp)
		; RV32IM-NEXT: lw a0, 48(sp)
		; RV32IM-NEXT: slli a2, a1, 31
		; RV32IM-NEXT: srli a0, a0, 1
		; RV32IM-NEXT: or a2, a0, a2
		; RV32IM-NEXT: srli a0, a1, 31
		; RV32IM-NEXT: add a0, a2, a0
		; RV32IM-NEXT: sltu a2, a0, a2
		; RV32IM-NEXT: srai a1, a1, 1
		; RV32IM-NEXT: add a1, a1, a2
		; RV32IM-NEXT: lw ra, 60(sp)
		; RV32IM-NEXT: addi sp, sp, 64
; RV32IM-NEXT: ret		; RV32IM-NEXT: ret
;		;
; RV64I-LABEL: sdiv64_constant:		; RV64I-LABEL: sdiv64_constant:
; RV64I: # %bb.0:		; RV64I: # %bb.0:
; RV64I-NEXT: addi sp, sp, -16		; RV64I-NEXT: addi sp, sp, -16
; RV64I-NEXT: sd ra, 8(sp)		; RV64I-NEXT: sd ra, 8(sp)
; RV64I-NEXT: addi a1, zero, 5		; RV64I-NEXT: srai a1, a0, 63
; RV64I-NEXT: call __divdi3		; RV64I-NEXT: lui a2, 13107
		; RV64I-NEXT: addiw a2, a2, 819
		; RV64I-NEXT: slli a2, a2, 12
		; RV64I-NEXT: addi a2, a2, 819
		; RV64I-NEXT: slli a2, a2, 12
		; RV64I-NEXT: addi a2, a2, 819
		; RV64I-NEXT: slli a2, a2, 13
		; RV64I-NEXT: addi a2, a2, 1639
		; RV64I-NEXT: mv a3, zero
		; RV64I-NEXT: call __multi3
		; RV64I-NEXT: srli a0, a1, 63
		; RV64I-NEXT: srai a1, a1, 1
		; RV64I-NEXT: add a0, a1, a0
; RV64I-NEXT: ld ra, 8(sp)		; RV64I-NEXT: ld ra, 8(sp)
; RV64I-NEXT: addi sp, sp, 16		; RV64I-NEXT: addi sp, sp, 16
; RV64I-NEXT: ret		; RV64I-NEXT: ret
;		;
; RV64IM-LABEL: sdiv64_constant:		; RV64IM-LABEL: sdiv64_constant:
; RV64IM: # %bb.0:		; RV64IM: # %bb.0:
; RV64IM-NEXT: lui a1, 13107		; RV64IM-NEXT: lui a1, 13107
; RV64IM-NEXT: addiw a1, a1, 819		; RV64IM-NEXT: addiw a1, a1, 819
▲ Show 20 Lines • Show All 65 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/srem-lkk.ll

; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py		; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
; RUN: llc -mtriple=riscv32 -verify-machineinstrs < %s \		; RUN: llc -mtriple=riscv32 -verify-machineinstrs < %s \
; RUN: \| FileCheck -check-prefixes=CHECK,RV32I %s		; RUN: \| FileCheck -check-prefixes=CHECK,RV32I %s
; RUN: llc -mtriple=riscv32 -mattr=+m -verify-machineinstrs < %s \		; RUN: llc -mtriple=riscv32 -mattr=+m -verify-machineinstrs < %s \
; RUN: \| FileCheck -check-prefixes=CHECK,RV32IM %s		; RUN: \| FileCheck -check-prefixes=CHECK,RV32IM %s
; RUN: llc -mtriple=riscv64 -verify-machineinstrs < %s \		; RUN: llc -mtriple=riscv64 -verify-machineinstrs < %s \
; RUN: \| FileCheck -check-prefixes=CHECK,RV64I %s		; RUN: \| FileCheck -check-prefixes=CHECK,RV64I %s
; RUN: llc -mtriple=riscv64 -mattr=+m -verify-machineinstrs < %s \		; RUN: llc -mtriple=riscv64 -mattr=+m -verify-machineinstrs < %s \
; RUN: \| FileCheck -check-prefixes=CHECK,RV64IM %s		; RUN: \| FileCheck -check-prefixes=CHECK,RV64IM %s

define i32 @fold_srem_positive_odd(i32 %x) nounwind {		define i32 @fold_srem_positive_odd(i32 %x) nounwind {
; RV32I-LABEL: fold_srem_positive_odd:		; RV32I-LABEL: fold_srem_positive_odd:
; RV32I: # %bb.0:		; RV32I: # %bb.0:
; RV32I-NEXT: addi sp, sp, -16		; RV32I-NEXT: addi sp, sp, -16
; RV32I-NEXT: sw ra, 12(sp)		; RV32I-NEXT: sw ra, 12(sp)
		; RV32I-NEXT: sw s0, 8(sp)
		; RV32I-NEXT: mv s0, a0
		; RV32I-NEXT: srai a1, a0, 31
		; RV32I-NEXT: lui a0, 706409
		; RV32I-NEXT: addi a2, a0, 389
		; RV32I-NEXT: addi a3, zero, -1
		; RV32I-NEXT: mv a0, s0
		; RV32I-NEXT: call __muldi3
		; RV32I-NEXT: add a0, a1, s0
		; RV32I-NEXT: srli a1, a0, 31
		; RV32I-NEXT: srai a0, a0, 6
		; RV32I-NEXT: add a0, a0, a1
; RV32I-NEXT: addi a1, zero, 95		; RV32I-NEXT: addi a1, zero, 95
; RV32I-NEXT: call __modsi3		; RV32I-NEXT: call __mulsi3
		; RV32I-NEXT: sub a0, s0, a0
		; RV32I-NEXT: lw s0, 8(sp)
; RV32I-NEXT: lw ra, 12(sp)		; RV32I-NEXT: lw ra, 12(sp)
; RV32I-NEXT: addi sp, sp, 16		; RV32I-NEXT: addi sp, sp, 16
; RV32I-NEXT: ret		; RV32I-NEXT: ret
;		;
; RV32IM-LABEL: fold_srem_positive_odd:		; RV32IM-LABEL: fold_srem_positive_odd:
; RV32IM: # %bb.0:		; RV32IM: # %bb.0:
; RV32IM-NEXT: lui a1, 706409		; RV32IM-NEXT: lui a1, 706409
; RV32IM-NEXT: addi a1, a1, 389		; RV32IM-NEXT: addi a1, a1, 389
; RV32IM-NEXT: mulh a1, a0, a1		; RV32IM-NEXT: mulh a1, a0, a1
; RV32IM-NEXT: add a1, a1, a0		; RV32IM-NEXT: add a1, a1, a0
; RV32IM-NEXT: srli a2, a1, 31		; RV32IM-NEXT: srli a2, a1, 31
; RV32IM-NEXT: srai a1, a1, 6		; RV32IM-NEXT: srai a1, a1, 6
; RV32IM-NEXT: add a1, a1, a2		; RV32IM-NEXT: add a1, a1, a2
; RV32IM-NEXT: addi a2, zero, 95		; RV32IM-NEXT: addi a2, zero, 95
; RV32IM-NEXT: mul a1, a1, a2		; RV32IM-NEXT: mul a1, a1, a2
; RV32IM-NEXT: sub a0, a0, a1		; RV32IM-NEXT: sub a0, a0, a1
; RV32IM-NEXT: ret		; RV32IM-NEXT: ret
;		;
; RV64I-LABEL: fold_srem_positive_odd:		; RV64I-LABEL: fold_srem_positive_odd:
; RV64I: # %bb.0:		; RV64I: # %bb.0:
; RV64I-NEXT: addi sp, sp, -16		; RV64I-NEXT: addi sp, sp, -16
; RV64I-NEXT: sd ra, 8(sp)		; RV64I-NEXT: sd ra, 8(sp)
		; RV64I-NEXT: sd s0, 0(sp)
		; RV64I-NEXT: mv s0, a0
; RV64I-NEXT: sext.w a0, a0		; RV64I-NEXT: sext.w a0, a0
		; RV64I-NEXT: lui a1, 706409
		; RV64I-NEXT: addiw a1, a1, 389
		; RV64I-NEXT: call __muldi3
		; RV64I-NEXT: srli a0, a0, 32
		; RV64I-NEXT: addw a0, a0, s0
		; RV64I-NEXT: srliw a1, a0, 31
		; RV64I-NEXT: srli a0, a0, 6
		; RV64I-NEXT: add a0, a0, a1
; RV64I-NEXT: addi a1, zero, 95		; RV64I-NEXT: addi a1, zero, 95
; RV64I-NEXT: call __moddi3		; RV64I-NEXT: call __muldi3
		; RV64I-NEXT: subw a0, s0, a0
		; RV64I-NEXT: ld s0, 0(sp)
; RV64I-NEXT: ld ra, 8(sp)		; RV64I-NEXT: ld ra, 8(sp)
; RV64I-NEXT: addi sp, sp, 16		; RV64I-NEXT: addi sp, sp, 16
; RV64I-NEXT: ret		; RV64I-NEXT: ret
;		;
; RV64IM-LABEL: fold_srem_positive_odd:		; RV64IM-LABEL: fold_srem_positive_odd:
; RV64IM: # %bb.0:		; RV64IM: # %bb.0:
; RV64IM-NEXT: sext.w a0, a0		; RV64IM-NEXT: sext.w a1, a0
; RV64IM-NEXT: lui a1, 1045903		; RV64IM-NEXT: lui a2, 706409
; RV64IM-NEXT: addiw a1, a1, -733		; RV64IM-NEXT: addiw a2, a2, 389
; RV64IM-NEXT: slli a1, a1, 15		; RV64IM-NEXT: mul a1, a1, a2
; RV64IM-NEXT: addi a1, a1, 1035		; RV64IM-NEXT: srli a1, a1, 32
; RV64IM-NEXT: slli a1, a1, 12		; RV64IM-NEXT: addw a1, a1, a0
; RV64IM-NEXT: addi a1, a1, -905		; RV64IM-NEXT: srliw a2, a1, 31
; RV64IM-NEXT: slli a1, a1, 12		; RV64IM-NEXT: srli a1, a1, 6
; RV64IM-NEXT: addi a1, a1, -1767
; RV64IM-NEXT: mulh a1, a0, a1
; RV64IM-NEXT: add a1, a1, a0
; RV64IM-NEXT: srli a2, a1, 63
; RV64IM-NEXT: srai a1, a1, 6
; RV64IM-NEXT: add a1, a1, a2		; RV64IM-NEXT: add a1, a1, a2
; RV64IM-NEXT: addi a2, zero, 95		; RV64IM-NEXT: addi a2, zero, 95
; RV64IM-NEXT: mul a1, a1, a2		; RV64IM-NEXT: mul a1, a1, a2
; RV64IM-NEXT: sub a0, a0, a1		; RV64IM-NEXT: subw a0, a0, a1
; RV64IM-NEXT: ret		; RV64IM-NEXT: ret
%1 = srem i32 %x, 95		%1 = srem i32 %x, 95
ret i32 %1		ret i32 %1
}		}


define i32 @fold_srem_positive_even(i32 %x) nounwind {		define i32 @fold_srem_positive_even(i32 %x) nounwind {
; RV32I-LABEL: fold_srem_positive_even:		; RV32I-LABEL: fold_srem_positive_even:
; RV32I: # %bb.0:		; RV32I: # %bb.0:
; RV32I-NEXT: addi sp, sp, -16		; RV32I-NEXT: addi sp, sp, -16
; RV32I-NEXT: sw ra, 12(sp)		; RV32I-NEXT: sw ra, 12(sp)
		; RV32I-NEXT: sw s0, 8(sp)
		; RV32I-NEXT: mv s0, a0
		; RV32I-NEXT: srai a1, a0, 31
		; RV32I-NEXT: lui a0, 253241
		; RV32I-NEXT: addi a2, a0, -15
		; RV32I-NEXT: mv a0, s0
		; RV32I-NEXT: mv a3, zero
		; RV32I-NEXT: call __muldi3
		; RV32I-NEXT: srli a0, a1, 31
		; RV32I-NEXT: srai a1, a1, 8
		; RV32I-NEXT: add a0, a1, a0
; RV32I-NEXT: addi a1, zero, 1060		; RV32I-NEXT: addi a1, zero, 1060
; RV32I-NEXT: call __modsi3		; RV32I-NEXT: call __mulsi3
		; RV32I-NEXT: sub a0, s0, a0
		; RV32I-NEXT: lw s0, 8(sp)
; RV32I-NEXT: lw ra, 12(sp)		; RV32I-NEXT: lw ra, 12(sp)
; RV32I-NEXT: addi sp, sp, 16		; RV32I-NEXT: addi sp, sp, 16
; RV32I-NEXT: ret		; RV32I-NEXT: ret
;		;
; RV32IM-LABEL: fold_srem_positive_even:		; RV32IM-LABEL: fold_srem_positive_even:
; RV32IM: # %bb.0:		; RV32IM: # %bb.0:
; RV32IM-NEXT: lui a1, 253241		; RV32IM-NEXT: lui a1, 253241
; RV32IM-NEXT: addi a1, a1, -15		; RV32IM-NEXT: addi a1, a1, -15
; RV32IM-NEXT: mulh a1, a0, a1		; RV32IM-NEXT: mulh a1, a0, a1
; RV32IM-NEXT: srli a2, a1, 31		; RV32IM-NEXT: srli a2, a1, 31
; RV32IM-NEXT: srai a1, a1, 8		; RV32IM-NEXT: srai a1, a1, 8
; RV32IM-NEXT: add a1, a1, a2		; RV32IM-NEXT: add a1, a1, a2
; RV32IM-NEXT: addi a2, zero, 1060		; RV32IM-NEXT: addi a2, zero, 1060
; RV32IM-NEXT: mul a1, a1, a2		; RV32IM-NEXT: mul a1, a1, a2
; RV32IM-NEXT: sub a0, a0, a1		; RV32IM-NEXT: sub a0, a0, a1
; RV32IM-NEXT: ret		; RV32IM-NEXT: ret
;		;
; RV64I-LABEL: fold_srem_positive_even:		; RV64I-LABEL: fold_srem_positive_even:
; RV64I: # %bb.0:		; RV64I: # %bb.0:
; RV64I-NEXT: addi sp, sp, -16		; RV64I-NEXT: addi sp, sp, -16
; RV64I-NEXT: sd ra, 8(sp)		; RV64I-NEXT: sd ra, 8(sp)
		; RV64I-NEXT: sd s0, 0(sp)
		; RV64I-NEXT: mv s0, a0
; RV64I-NEXT: sext.w a0, a0		; RV64I-NEXT: sext.w a0, a0
		; RV64I-NEXT: lui a1, 253241
		; RV64I-NEXT: addiw a1, a1, -15
		; RV64I-NEXT: call __muldi3
		; RV64I-NEXT: srli a1, a0, 63
		; RV64I-NEXT: srai a0, a0, 40
		; RV64I-NEXT: add a0, a0, a1
; RV64I-NEXT: addi a1, zero, 1060		; RV64I-NEXT: addi a1, zero, 1060
; RV64I-NEXT: call __moddi3		; RV64I-NEXT: call __muldi3
		; RV64I-NEXT: subw a0, s0, a0
		; RV64I-NEXT: ld s0, 0(sp)
; RV64I-NEXT: ld ra, 8(sp)		; RV64I-NEXT: ld ra, 8(sp)
; RV64I-NEXT: addi sp, sp, 16		; RV64I-NEXT: addi sp, sp, 16
; RV64I-NEXT: ret		; RV64I-NEXT: ret
;		;
; RV64IM-LABEL: fold_srem_positive_even:		; RV64IM-LABEL: fold_srem_positive_even:
; RV64IM: # %bb.0:		; RV64IM: # %bb.0:
; RV64IM-NEXT: sext.w a0, a0		; RV64IM-NEXT: sext.w a1, a0
; RV64IM-NEXT: lui a1, 506482		; RV64IM-NEXT: lui a2, 253241
; RV64IM-NEXT: addiw a1, a1, -31		; RV64IM-NEXT: addiw a2, a2, -15
; RV64IM-NEXT: slli a1, a1, 13		; RV64IM-NEXT: mul a1, a1, a2
; RV64IM-NEXT: addi a1, a1, 711
; RV64IM-NEXT: slli a1, a1, 19
; RV64IM-NEXT: addi a1, a1, 1979
; RV64IM-NEXT: mulh a1, a0, a1
; RV64IM-NEXT: srli a2, a1, 63		; RV64IM-NEXT: srli a2, a1, 63
; RV64IM-NEXT: srai a1, a1, 9		; RV64IM-NEXT: srai a1, a1, 40
; RV64IM-NEXT: add a1, a1, a2		; RV64IM-NEXT: add a1, a1, a2
; RV64IM-NEXT: addi a2, zero, 1060		; RV64IM-NEXT: addi a2, zero, 1060
; RV64IM-NEXT: mul a1, a1, a2		; RV64IM-NEXT: mul a1, a1, a2
; RV64IM-NEXT: sub a0, a0, a1		; RV64IM-NEXT: subw a0, a0, a1
; RV64IM-NEXT: ret		; RV64IM-NEXT: ret
%1 = srem i32 %x, 1060		%1 = srem i32 %x, 1060
ret i32 %1		ret i32 %1
}		}


define i32 @fold_srem_negative_odd(i32 %x) nounwind {		define i32 @fold_srem_negative_odd(i32 %x) nounwind {
; RV32I-LABEL: fold_srem_negative_odd:		; RV32I-LABEL: fold_srem_negative_odd:
; RV32I: # %bb.0:		; RV32I: # %bb.0:
; RV32I-NEXT: addi sp, sp, -16		; RV32I-NEXT: addi sp, sp, -16
; RV32I-NEXT: sw ra, 12(sp)		; RV32I-NEXT: sw ra, 12(sp)
		; RV32I-NEXT: sw s0, 8(sp)
		; RV32I-NEXT: mv s0, a0
		; RV32I-NEXT: srai a1, a0, 31
		; RV32I-NEXT: lui a0, 677296
		; RV32I-NEXT: addi a2, a0, -91
		; RV32I-NEXT: addi a3, zero, -1
		; RV32I-NEXT: mv a0, s0
		; RV32I-NEXT: call __muldi3
		; RV32I-NEXT: srli a0, a1, 31
		; RV32I-NEXT: srai a1, a1, 8
		; RV32I-NEXT: add a0, a1, a0
; RV32I-NEXT: addi a1, zero, -723		; RV32I-NEXT: addi a1, zero, -723
; RV32I-NEXT: call __modsi3		; RV32I-NEXT: call __mulsi3
		; RV32I-NEXT: sub a0, s0, a0
		; RV32I-NEXT: lw s0, 8(sp)
; RV32I-NEXT: lw ra, 12(sp)		; RV32I-NEXT: lw ra, 12(sp)
; RV32I-NEXT: addi sp, sp, 16		; RV32I-NEXT: addi sp, sp, 16
; RV32I-NEXT: ret		; RV32I-NEXT: ret
;		;
; RV32IM-LABEL: fold_srem_negative_odd:		; RV32IM-LABEL: fold_srem_negative_odd:
; RV32IM: # %bb.0:		; RV32IM: # %bb.0:
; RV32IM-NEXT: lui a1, 677296		; RV32IM-NEXT: lui a1, 677296
; RV32IM-NEXT: addi a1, a1, -91		; RV32IM-NEXT: addi a1, a1, -91
; RV32IM-NEXT: mulh a1, a0, a1		; RV32IM-NEXT: mulh a1, a0, a1
; RV32IM-NEXT: srli a2, a1, 31		; RV32IM-NEXT: srli a2, a1, 31
; RV32IM-NEXT: srai a1, a1, 8		; RV32IM-NEXT: srai a1, a1, 8
; RV32IM-NEXT: add a1, a1, a2		; RV32IM-NEXT: add a1, a1, a2
; RV32IM-NEXT: addi a2, zero, -723		; RV32IM-NEXT: addi a2, zero, -723
; RV32IM-NEXT: mul a1, a1, a2		; RV32IM-NEXT: mul a1, a1, a2
; RV32IM-NEXT: sub a0, a0, a1		; RV32IM-NEXT: sub a0, a0, a1
; RV32IM-NEXT: ret		; RV32IM-NEXT: ret
;		;
; RV64I-LABEL: fold_srem_negative_odd:		; RV64I-LABEL: fold_srem_negative_odd:
; RV64I: # %bb.0:		; RV64I: # %bb.0:
; RV64I-NEXT: addi sp, sp, -16		; RV64I-NEXT: addi sp, sp, -16
; RV64I-NEXT: sd ra, 8(sp)		; RV64I-NEXT: sd ra, 8(sp)
		; RV64I-NEXT: sd s0, 0(sp)
		; RV64I-NEXT: mv s0, a0
; RV64I-NEXT: sext.w a0, a0		; RV64I-NEXT: sext.w a0, a0
		; RV64I-NEXT: lui a1, 677296
		; RV64I-NEXT: addiw a1, a1, -91
		; RV64I-NEXT: call __muldi3
		; RV64I-NEXT: srli a1, a0, 63
		; RV64I-NEXT: srai a0, a0, 40
		; RV64I-NEXT: add a0, a0, a1
; RV64I-NEXT: addi a1, zero, -723		; RV64I-NEXT: addi a1, zero, -723
; RV64I-NEXT: call __moddi3		; RV64I-NEXT: call __muldi3
		; RV64I-NEXT: subw a0, s0, a0
		; RV64I-NEXT: ld s0, 0(sp)
; RV64I-NEXT: ld ra, 8(sp)		; RV64I-NEXT: ld ra, 8(sp)
; RV64I-NEXT: addi sp, sp, 16		; RV64I-NEXT: addi sp, sp, 16
; RV64I-NEXT: ret		; RV64I-NEXT: ret
;		;
; RV64IM-LABEL: fold_srem_negative_odd:		; RV64IM-LABEL: fold_srem_negative_odd:
; RV64IM: # %bb.0:		; RV64IM: # %bb.0:
; RV64IM-NEXT: sext.w a0, a0		; RV64IM-NEXT: sext.w a1, a0
; RV64IM-NEXT: lui a1, 4781		; RV64IM-NEXT: lui a2, 677296
; RV64IM-NEXT: addiw a1, a1, 2045		; RV64IM-NEXT: addiw a2, a2, -91
; RV64IM-NEXT: slli a1, a1, 13		; RV64IM-NEXT: mul a1, a1, a2
; RV64IM-NEXT: addi a1, a1, 1371
; RV64IM-NEXT: slli a1, a1, 13
; RV64IM-NEXT: addi a1, a1, -11
; RV64IM-NEXT: slli a1, a1, 12
; RV64IM-NEXT: addi a1, a1, -1355
; RV64IM-NEXT: mulh a1, a0, a1
; RV64IM-NEXT: sub a1, a1, a0
; RV64IM-NEXT: srli a2, a1, 63		; RV64IM-NEXT: srli a2, a1, 63
; RV64IM-NEXT: srai a1, a1, 9		; RV64IM-NEXT: srai a1, a1, 40
; RV64IM-NEXT: add a1, a1, a2		; RV64IM-NEXT: add a1, a1, a2
; RV64IM-NEXT: addi a2, zero, -723		; RV64IM-NEXT: addi a2, zero, -723
; RV64IM-NEXT: mul a1, a1, a2		; RV64IM-NEXT: mul a1, a1, a2
; RV64IM-NEXT: sub a0, a0, a1		; RV64IM-NEXT: subw a0, a0, a1
; RV64IM-NEXT: ret		; RV64IM-NEXT: ret
%1 = srem i32 %x, -723		%1 = srem i32 %x, -723
ret i32 %1		ret i32 %1
}		}


define i32 @fold_srem_negative_even(i32 %x) nounwind {		define i32 @fold_srem_negative_even(i32 %x) nounwind {
; RV32I-LABEL: fold_srem_negative_even:		; RV32I-LABEL: fold_srem_negative_even:
; RV32I: # %bb.0:		; RV32I: # %bb.0:
; RV32I-NEXT: addi sp, sp, -16		; RV32I-NEXT: addi sp, sp, -16
; RV32I-NEXT: sw ra, 12(sp)		; RV32I-NEXT: sw ra, 12(sp)
		; RV32I-NEXT: sw s0, 8(sp)
		; RV32I-NEXT: mv s0, a0
		; RV32I-NEXT: srai a1, a0, 31
		; RV32I-NEXT: lui a0, 1036895
		; RV32I-NEXT: addi a2, a0, 999
		; RV32I-NEXT: addi a3, zero, -1
		; RV32I-NEXT: mv a0, s0
		; RV32I-NEXT: call __muldi3
		; RV32I-NEXT: srli a0, a1, 31
		; RV32I-NEXT: srai a1, a1, 8
		; RV32I-NEXT: add a0, a1, a0
; RV32I-NEXT: lui a1, 1048570		; RV32I-NEXT: lui a1, 1048570
; RV32I-NEXT: addi a1, a1, 1595		; RV32I-NEXT: addi a1, a1, 1595
; RV32I-NEXT: call __modsi3		; RV32I-NEXT: call __mulsi3
		; RV32I-NEXT: sub a0, s0, a0
		; RV32I-NEXT: lw s0, 8(sp)
; RV32I-NEXT: lw ra, 12(sp)		; RV32I-NEXT: lw ra, 12(sp)
; RV32I-NEXT: addi sp, sp, 16		; RV32I-NEXT: addi sp, sp, 16
; RV32I-NEXT: ret		; RV32I-NEXT: ret
;		;
; RV32IM-LABEL: fold_srem_negative_even:		; RV32IM-LABEL: fold_srem_negative_even:
; RV32IM: # %bb.0:		; RV32IM: # %bb.0:
; RV32IM-NEXT: lui a1, 1036895		; RV32IM-NEXT: lui a1, 1036895
; RV32IM-NEXT: addi a1, a1, 999		; RV32IM-NEXT: addi a1, a1, 999
; RV32IM-NEXT: mulh a1, a0, a1		; RV32IM-NEXT: mulh a1, a0, a1
; RV32IM-NEXT: srli a2, a1, 31		; RV32IM-NEXT: srli a2, a1, 31
; RV32IM-NEXT: srai a1, a1, 8		; RV32IM-NEXT: srai a1, a1, 8
; RV32IM-NEXT: add a1, a1, a2		; RV32IM-NEXT: add a1, a1, a2
; RV32IM-NEXT: lui a2, 1048570		; RV32IM-NEXT: lui a2, 1048570
; RV32IM-NEXT: addi a2, a2, 1595		; RV32IM-NEXT: addi a2, a2, 1595
; RV32IM-NEXT: mul a1, a1, a2		; RV32IM-NEXT: mul a1, a1, a2
; RV32IM-NEXT: sub a0, a0, a1		; RV32IM-NEXT: sub a0, a0, a1
; RV32IM-NEXT: ret		; RV32IM-NEXT: ret
;		;
; RV64I-LABEL: fold_srem_negative_even:		; RV64I-LABEL: fold_srem_negative_even:
; RV64I: # %bb.0:		; RV64I: # %bb.0:
; RV64I-NEXT: addi sp, sp, -16		; RV64I-NEXT: addi sp, sp, -16
; RV64I-NEXT: sd ra, 8(sp)		; RV64I-NEXT: sd ra, 8(sp)
		; RV64I-NEXT: sd s0, 0(sp)
		; RV64I-NEXT: mv s0, a0
; RV64I-NEXT: sext.w a0, a0		; RV64I-NEXT: sext.w a0, a0
		; RV64I-NEXT: lui a1, 1036895
		; RV64I-NEXT: addiw a1, a1, 999
		; RV64I-NEXT: call __muldi3
		; RV64I-NEXT: srli a1, a0, 63
		; RV64I-NEXT: srai a0, a0, 40
		; RV64I-NEXT: add a0, a0, a1
; RV64I-NEXT: lui a1, 1048570		; RV64I-NEXT: lui a1, 1048570
; RV64I-NEXT: addiw a1, a1, 1595		; RV64I-NEXT: addiw a1, a1, 1595
; RV64I-NEXT: call __moddi3		; RV64I-NEXT: call __muldi3
		; RV64I-NEXT: subw a0, s0, a0
		; RV64I-NEXT: ld s0, 0(sp)
; RV64I-NEXT: ld ra, 8(sp)		; RV64I-NEXT: ld ra, 8(sp)
; RV64I-NEXT: addi sp, sp, 16		; RV64I-NEXT: addi sp, sp, 16
; RV64I-NEXT: ret		; RV64I-NEXT: ret
;		;
; RV64IM-LABEL: fold_srem_negative_even:		; RV64IM-LABEL: fold_srem_negative_even:
; RV64IM: # %bb.0:		; RV64IM: # %bb.0:
; RV64IM-NEXT: sext.w a0, a0		; RV64IM-NEXT: sext.w a1, a0
; RV64IM-NEXT: lui a1, 1036895		; RV64IM-NEXT: lui a2, 1036895
; RV64IM-NEXT: addiw a1, a1, 999		; RV64IM-NEXT: addiw a2, a2, 999
; RV64IM-NEXT: slli a1, a1, 12		; RV64IM-NEXT: mul a1, a1, a2
; RV64IM-NEXT: addi a1, a1, 11
; RV64IM-NEXT: slli a1, a1, 12
; RV64IM-NEXT: addi a1, a1, -523
; RV64IM-NEXT: slli a1, a1, 12
; RV64IM-NEXT: addi a1, a1, -481
; RV64IM-NEXT: mulh a1, a0, a1
; RV64IM-NEXT: srli a2, a1, 63		; RV64IM-NEXT: srli a2, a1, 63
; RV64IM-NEXT: srai a1, a1, 12		; RV64IM-NEXT: srai a1, a1, 40
; RV64IM-NEXT: add a1, a1, a2		; RV64IM-NEXT: add a1, a1, a2
; RV64IM-NEXT: lui a2, 1048570		; RV64IM-NEXT: lui a2, 1048570
; RV64IM-NEXT: addiw a2, a2, 1595		; RV64IM-NEXT: addiw a2, a2, 1595
; RV64IM-NEXT: mul a1, a1, a2		; RV64IM-NEXT: mul a1, a1, a2
; RV64IM-NEXT: sub a0, a0, a1		; RV64IM-NEXT: subw a0, a0, a1
; RV64IM-NEXT: ret		; RV64IM-NEXT: ret
%1 = srem i32 %x, -22981		%1 = srem i32 %x, -22981
ret i32 %1		ret i32 %1
}		}


; Don't fold if we can combine srem with sdiv.		; Don't fold if we can combine srem with sdiv.
define i32 @combine_srem_sdiv(i32 %x) nounwind {		define i32 @combine_srem_sdiv(i32 %x) nounwind {
; RV32I-LABEL: combine_srem_sdiv:		; RV32I-LABEL: combine_srem_sdiv:
; RV32I: # %bb.0:		; RV32I: # %bb.0:
; RV32I-NEXT: addi sp, sp, -16		; RV32I-NEXT: addi sp, sp, -16
; RV32I-NEXT: sw ra, 12(sp)		; RV32I-NEXT: sw ra, 12(sp)
; RV32I-NEXT: sw s0, 8(sp)		; RV32I-NEXT: sw s0, 8(sp)
; RV32I-NEXT: sw s1, 4(sp)		; RV32I-NEXT: sw s1, 4(sp)
; RV32I-NEXT: mv s0, a0		; RV32I-NEXT: mv s0, a0
; RV32I-NEXT: addi a1, zero, 95		; RV32I-NEXT: srai a1, a0, 31
; RV32I-NEXT: call __modsi3		; RV32I-NEXT: lui a0, 706409
; RV32I-NEXT: mv s1, a0		; RV32I-NEXT: addi a2, a0, 389
; RV32I-NEXT: addi a1, zero, 95		; RV32I-NEXT: addi a3, zero, -1
; RV32I-NEXT: mv a0, s0		; RV32I-NEXT: mv a0, s0
; RV32I-NEXT: call __divsi3		; RV32I-NEXT: call __muldi3
; RV32I-NEXT: add a0, s1, a0		; RV32I-NEXT: add a0, a1, s0
		; RV32I-NEXT: srli a1, a0, 31
		; RV32I-NEXT: srai a0, a0, 6
		; RV32I-NEXT: add s1, a0, a1
		; RV32I-NEXT: addi a1, zero, 95
		; RV32I-NEXT: mv a0, s1
		; RV32I-NEXT: call __mulsi3
		; RV32I-NEXT: sub a0, s0, a0
		; RV32I-NEXT: add a0, a0, s1
; RV32I-NEXT: lw s1, 4(sp)		; RV32I-NEXT: lw s1, 4(sp)
; RV32I-NEXT: lw s0, 8(sp)		; RV32I-NEXT: lw s0, 8(sp)
; RV32I-NEXT: lw ra, 12(sp)		; RV32I-NEXT: lw ra, 12(sp)
; RV32I-NEXT: addi sp, sp, 16		; RV32I-NEXT: addi sp, sp, 16
; RV32I-NEXT: ret		; RV32I-NEXT: ret
;		;
; RV32IM-LABEL: combine_srem_sdiv:		; RV32IM-LABEL: combine_srem_sdiv:
; RV32IM: # %bb.0:		; RV32IM: # %bb.0:
Show All 11 Lines
; RV32IM-NEXT: ret		; RV32IM-NEXT: ret
;		;
; RV64I-LABEL: combine_srem_sdiv:		; RV64I-LABEL: combine_srem_sdiv:
; RV64I: # %bb.0:		; RV64I: # %bb.0:
; RV64I-NEXT: addi sp, sp, -32		; RV64I-NEXT: addi sp, sp, -32
; RV64I-NEXT: sd ra, 24(sp)		; RV64I-NEXT: sd ra, 24(sp)
; RV64I-NEXT: sd s0, 16(sp)		; RV64I-NEXT: sd s0, 16(sp)
; RV64I-NEXT: sd s1, 8(sp)		; RV64I-NEXT: sd s1, 8(sp)
; RV64I-NEXT: sext.w s0, a0		; RV64I-NEXT: mv s0, a0
; RV64I-NEXT: addi a1, zero, 95		; RV64I-NEXT: sext.w a0, a0
; RV64I-NEXT: mv a0, s0		; RV64I-NEXT: lui a1, 706409
; RV64I-NEXT: call __moddi3		; RV64I-NEXT: addiw a1, a1, 389
; RV64I-NEXT: mv s1, a0		; RV64I-NEXT: call __muldi3
		; RV64I-NEXT: srli a0, a0, 32
		; RV64I-NEXT: addw a1, a0, s0
		; RV64I-NEXT: srliw a1, a1, 31
		; RV64I-NEXT: add a0, a0, s0
		; RV64I-NEXT: sraiw a0, a0, 6
		; RV64I-NEXT: add s1, a0, a1
; RV64I-NEXT: addi a1, zero, 95		; RV64I-NEXT: addi a1, zero, 95
; RV64I-NEXT: mv a0, s0		; RV64I-NEXT: mv a0, s1
; RV64I-NEXT: call __divdi3		; RV64I-NEXT: call __muldi3
; RV64I-NEXT: addw a0, s1, a0		; RV64I-NEXT: sub a0, s0, a0
		; RV64I-NEXT: addw a0, a0, s1
; RV64I-NEXT: ld s1, 8(sp)		; RV64I-NEXT: ld s1, 8(sp)
; RV64I-NEXT: ld s0, 16(sp)		; RV64I-NEXT: ld s0, 16(sp)
; RV64I-NEXT: ld ra, 24(sp)		; RV64I-NEXT: ld ra, 24(sp)
; RV64I-NEXT: addi sp, sp, 32		; RV64I-NEXT: addi sp, sp, 32
; RV64I-NEXT: ret		; RV64I-NEXT: ret
;		;
; RV64IM-LABEL: combine_srem_sdiv:		; RV64IM-LABEL: combine_srem_sdiv:
; RV64IM: # %bb.0:		; RV64IM: # %bb.0:
; RV64IM-NEXT: sext.w a1, a0		; RV64IM-NEXT: sext.w a1, a0
; RV64IM-NEXT: lui a2, 1045903		; RV64IM-NEXT: lui a2, 706409
; RV64IM-NEXT: addiw a2, a2, -733		; RV64IM-NEXT: addiw a2, a2, 389
; RV64IM-NEXT: slli a2, a2, 15		; RV64IM-NEXT: mul a1, a1, a2
; RV64IM-NEXT: addi a2, a2, 1035		; RV64IM-NEXT: srli a1, a1, 32
; RV64IM-NEXT: slli a2, a2, 12		; RV64IM-NEXT: addw a2, a1, a0
; RV64IM-NEXT: addi a2, a2, -905		; RV64IM-NEXT: srliw a2, a2, 31
; RV64IM-NEXT: slli a2, a2, 12		; RV64IM-NEXT: add a1, a1, a0
; RV64IM-NEXT: addi a2, a2, -1767		; RV64IM-NEXT: sraiw a1, a1, 6
; RV64IM-NEXT: mulh a2, a1, a2
; RV64IM-NEXT: add a1, a2, a1
; RV64IM-NEXT: srli a2, a1, 63
; RV64IM-NEXT: srai a1, a1, 6
; RV64IM-NEXT: add a1, a1, a2		; RV64IM-NEXT: add a1, a1, a2
; RV64IM-NEXT: addi a2, zero, 95		; RV64IM-NEXT: addi a2, zero, 95
; RV64IM-NEXT: mul a2, a1, a2		; RV64IM-NEXT: mul a2, a1, a2
; RV64IM-NEXT: sub a0, a0, a2		; RV64IM-NEXT: sub a0, a0, a2
; RV64IM-NEXT: addw a0, a0, a1		; RV64IM-NEXT: addw a0, a0, a1
; RV64IM-NEXT: ret		; RV64IM-NEXT: ret
%1 = srem i32 %x, 95		%1 = srem i32 %x, 95
%2 = sdiv i32 %x, 95		%2 = sdiv i32 %x, 95
▲ Show 20 Lines • Show All 112 Lines • ▼ Show 20 Lines	; RV64IM-NEXT: ret
%1 = srem i32 %x, 2147483648		%1 = srem i32 %x, 2147483648
ret i32 %1		ret i32 %1
}		}

; Don't fold i64 srem		; Don't fold i64 srem
define i64 @dont_fold_srem_i64(i64 %x) nounwind {		define i64 @dont_fold_srem_i64(i64 %x) nounwind {
; RV32I-LABEL: dont_fold_srem_i64:		; RV32I-LABEL: dont_fold_srem_i64:
; RV32I: # %bb.0:		; RV32I: # %bb.0:
; RV32I-NEXT: addi sp, sp, -16		; RV32I-NEXT: addi sp, sp, -64
; RV32I-NEXT: sw ra, 12(sp)		; RV32I-NEXT: sw ra, 60(sp)
		; RV32I-NEXT: sw s0, 56(sp)
		; RV32I-NEXT: sw s1, 52(sp)
		; RV32I-NEXT: mv s0, a1
		; RV32I-NEXT: mv s1, a0
		; RV32I-NEXT: sw zero, 12(sp)
		; RV32I-NEXT: sw zero, 8(sp)
		; RV32I-NEXT: sw a1, 20(sp)
		; RV32I-NEXT: sw a0, 16(sp)
		; RV32I-NEXT: lui a0, 342392
		; RV32I-NEXT: addi a0, a0, 668
		; RV32I-NEXT: sw a0, 4(sp)
		; RV32I-NEXT: lui a0, 770382
		; RV32I-NEXT: addi a0, a0, 1505
		; RV32I-NEXT: sw a0, 0(sp)
		; RV32I-NEXT: srai a3, a1, 31
		; RV32I-NEXT: sw a3, 28(sp)
		; RV32I-NEXT: addi a0, sp, 32
		; RV32I-NEXT: addi a1, sp, 16
		; RV32I-NEXT: mv a2, sp
		; RV32I-NEXT: sw a3, 24(sp)
		; RV32I-NEXT: call __multi3
		; RV32I-NEXT: lw a1, 44(sp)
		; RV32I-NEXT: lw a0, 40(sp)
		; RV32I-NEXT: slli a2, a1, 27
		; RV32I-NEXT: srli a0, a0, 5
		; RV32I-NEXT: or a2, a0, a2
		; RV32I-NEXT: srli a0, a1, 31
		; RV32I-NEXT: add a0, a2, a0
		; RV32I-NEXT: sltu a2, a0, a2
		; RV32I-NEXT: srai a1, a1, 5
		; RV32I-NEXT: add a1, a1, a2
; RV32I-NEXT: addi a2, zero, 98		; RV32I-NEXT: addi a2, zero, 98
; RV32I-NEXT: mv a3, zero		; RV32I-NEXT: mv a3, zero
; RV32I-NEXT: call __moddi3		; RV32I-NEXT: call __muldi3
; RV32I-NEXT: lw ra, 12(sp)		; RV32I-NEXT: sltu a2, s1, a0
; RV32I-NEXT: addi sp, sp, 16		; RV32I-NEXT: sub a1, s0, a1
		; RV32I-NEXT: sub a1, a1, a2
		; RV32I-NEXT: sub a0, s1, a0
		; RV32I-NEXT: lw s1, 52(sp)
		; RV32I-NEXT: lw s0, 56(sp)
		; RV32I-NEXT: lw ra, 60(sp)
		; RV32I-NEXT: addi sp, sp, 64
; RV32I-NEXT: ret		; RV32I-NEXT: ret
;		;
; RV32IM-LABEL: dont_fold_srem_i64:		; RV32IM-LABEL: dont_fold_srem_i64:
; RV32IM: # %bb.0:		; RV32IM: # %bb.0:
; RV32IM-NEXT: addi sp, sp, -16		; RV32IM-NEXT: addi sp, sp, -64
; RV32IM-NEXT: sw ra, 12(sp)		; RV32IM-NEXT: sw ra, 60(sp)
; RV32IM-NEXT: addi a2, zero, 98		; RV32IM-NEXT: sw s0, 56(sp)
; RV32IM-NEXT: mv a3, zero		; RV32IM-NEXT: sw s1, 52(sp)
; RV32IM-NEXT: call __moddi3		; RV32IM-NEXT: mv s0, a1
; RV32IM-NEXT: lw ra, 12(sp)		; RV32IM-NEXT: mv s1, a0
; RV32IM-NEXT: addi sp, sp, 16		; RV32IM-NEXT: sw zero, 12(sp)
		; RV32IM-NEXT: sw zero, 8(sp)
		; RV32IM-NEXT: sw a1, 20(sp)
		; RV32IM-NEXT: sw a0, 16(sp)
		; RV32IM-NEXT: lui a0, 342392
		; RV32IM-NEXT: addi a0, a0, 668
		; RV32IM-NEXT: sw a0, 4(sp)
		; RV32IM-NEXT: lui a0, 770382
		; RV32IM-NEXT: addi a0, a0, 1505
		; RV32IM-NEXT: sw a0, 0(sp)
		; RV32IM-NEXT: srai a3, a1, 31
		; RV32IM-NEXT: sw a3, 28(sp)
		; RV32IM-NEXT: addi a0, sp, 32
		; RV32IM-NEXT: addi a1, sp, 16
		; RV32IM-NEXT: mv a2, sp
		; RV32IM-NEXT: sw a3, 24(sp)
		; RV32IM-NEXT: call __multi3
		; RV32IM-NEXT: lw a0, 44(sp)
		; RV32IM-NEXT: lw a1, 40(sp)
		; RV32IM-NEXT: slli a2, a0, 27
		; RV32IM-NEXT: srli a1, a1, 5
		; RV32IM-NEXT: or a1, a1, a2
		; RV32IM-NEXT: srli a2, a0, 31
		; RV32IM-NEXT: add a2, a1, a2
		; RV32IM-NEXT: sltu a1, a2, a1
		; RV32IM-NEXT: srai a0, a0, 5
		; RV32IM-NEXT: add a0, a0, a1
		; RV32IM-NEXT: addi a1, zero, 98
		; RV32IM-NEXT: mul a0, a0, a1
		; RV32IM-NEXT: mulhu a3, a2, a1
		; RV32IM-NEXT: add a0, a3, a0
		; RV32IM-NEXT: sub a0, s0, a0
		; RV32IM-NEXT: mul a2, a2, a1
		; RV32IM-NEXT: sltu a1, s1, a2
		; RV32IM-NEXT: sub a1, a0, a1
		; RV32IM-NEXT: sub a0, s1, a2
		; RV32IM-NEXT: lw s1, 52(sp)
		; RV32IM-NEXT: lw s0, 56(sp)
		; RV32IM-NEXT: lw ra, 60(sp)
		; RV32IM-NEXT: addi sp, sp, 64
; RV32IM-NEXT: ret		; RV32IM-NEXT: ret
;		;
; RV64I-LABEL: dont_fold_srem_i64:		; RV64I-LABEL: dont_fold_srem_i64:
; RV64I: # %bb.0:		; RV64I: # %bb.0:
; RV64I-NEXT: addi sp, sp, -16		; RV64I-NEXT: addi sp, sp, -16
; RV64I-NEXT: sd ra, 8(sp)		; RV64I-NEXT: sd ra, 8(sp)
		; RV64I-NEXT: sd s0, 0(sp)
		; RV64I-NEXT: mv s0, a0
		; RV64I-NEXT: srai a1, a0, 63
		; RV64I-NEXT: lui a0, 2675
		; RV64I-NEXT: addiw a0, a0, -251
		; RV64I-NEXT: slli a0, a0, 13
		; RV64I-NEXT: addi a0, a0, 1839
		; RV64I-NEXT: slli a0, a0, 13
		; RV64I-NEXT: addi a0, a0, 167
		; RV64I-NEXT: slli a0, a0, 13
		; RV64I-NEXT: addi a2, a0, 1505
		; RV64I-NEXT: mv a0, s0
		; RV64I-NEXT: mv a3, zero
		; RV64I-NEXT: call __multi3
		; RV64I-NEXT: srli a0, a1, 63
		; RV64I-NEXT: srai a1, a1, 5
		; RV64I-NEXT: add a0, a1, a0
; RV64I-NEXT: addi a1, zero, 98		; RV64I-NEXT: addi a1, zero, 98
; RV64I-NEXT: call __moddi3		; RV64I-NEXT: call __muldi3
		; RV64I-NEXT: sub a0, s0, a0
		; RV64I-NEXT: ld s0, 0(sp)
; RV64I-NEXT: ld ra, 8(sp)		; RV64I-NEXT: ld ra, 8(sp)
; RV64I-NEXT: addi sp, sp, 16		; RV64I-NEXT: addi sp, sp, 16
; RV64I-NEXT: ret		; RV64I-NEXT: ret
;		;
; RV64IM-LABEL: dont_fold_srem_i64:		; RV64IM-LABEL: dont_fold_srem_i64:
; RV64IM: # %bb.0:		; RV64IM: # %bb.0:
; RV64IM-NEXT: lui a1, 2675		; RV64IM-NEXT: lui a1, 2675
; RV64IM-NEXT: addiw a1, a1, -251		; RV64IM-NEXT: addiw a1, a1, -251
Show All 17 Lines

llvm/test/CodeGen/RISCV/srem-vector-lkk.ll

	Show All 13 Lines
	; RV32I-NEXT: addi sp, sp, -32			; RV32I-NEXT: addi sp, sp, -32
	; RV32I-NEXT: sw ra, 28(sp)			; RV32I-NEXT: sw ra, 28(sp)
	; RV32I-NEXT: sw s0, 24(sp)			; RV32I-NEXT: sw s0, 24(sp)
	; RV32I-NEXT: sw s1, 20(sp)			; RV32I-NEXT: sw s1, 20(sp)
	; RV32I-NEXT: sw s2, 16(sp)			; RV32I-NEXT: sw s2, 16(sp)
	; RV32I-NEXT: sw s3, 12(sp)			; RV32I-NEXT: sw s3, 12(sp)
	; RV32I-NEXT: sw s4, 8(sp)			; RV32I-NEXT: sw s4, 8(sp)
	; RV32I-NEXT: sw s5, 4(sp)			; RV32I-NEXT: sw s5, 4(sp)
	; RV32I-NEXT: lh s2, 12(a1)			; RV32I-NEXT: mv s1, a1
	; RV32I-NEXT: lh s3, 8(a1)			; RV32I-NEXT: mv s2, a0
	; RV32I-NEXT: lh s0, 4(a1)			; RV32I-NEXT: lh s0, 0(a1)
	; RV32I-NEXT: lh a2, 0(a1)			; RV32I-NEXT: lui a0, 1048571
	; RV32I-NEXT: mv s1, a0			; RV32I-NEXT: addi a1, a0, -905
				; RV32I-NEXT: mv a0, s0
				; RV32I-NEXT: call __mulsi3
				; RV32I-NEXT: srli a0, a0, 16
				; RV32I-NEXT: add a0, a0, s0
				; RV32I-NEXT: slli a0, a0, 16
				; RV32I-NEXT: srai a0, a0, 22
				; RV32I-NEXT: srli a1, a0, 15
				; RV32I-NEXT: andi a1, a1, 1
				; RV32I-NEXT: add a0, a0, a1
	; RV32I-NEXT: addi a1, zero, 95			; RV32I-NEXT: addi a1, zero, 95
	; RV32I-NEXT: mv a0, a2			; RV32I-NEXT: call __mulsi3
	; RV32I-NEXT: call __modsi3			; RV32I-NEXT: sub s3, s0, a0
	; RV32I-NEXT: mv s4, a0			; RV32I-NEXT: lh s0, 12(s1)
				; RV32I-NEXT: lui a0, 8
				; RV32I-NEXT: addi a1, a0, -687
				; RV32I-NEXT: mv a0, s0
				; RV32I-NEXT: call __mulsi3
				; RV32I-NEXT: srli a0, a0, 16
				; RV32I-NEXT: sub a0, a0, s0
				; RV32I-NEXT: slli a0, a0, 16
				; RV32I-NEXT: srai a0, a0, 25
				; RV32I-NEXT: srli a1, a0, 15
				; RV32I-NEXT: andi a1, a1, 1
				; RV32I-NEXT: add a0, a0, a1
				; RV32I-NEXT: addi a1, zero, -1003
				; RV32I-NEXT: call __mulsi3
				; RV32I-NEXT: sub s4, s0, a0
				; RV32I-NEXT: lh s0, 4(s1)
				; RV32I-NEXT: lui a0, 1048572
				; RV32I-NEXT: addi a1, a0, -529
				; RV32I-NEXT: mv a0, s0
				; RV32I-NEXT: call __mulsi3
				; RV32I-NEXT: srai a0, a0, 21
				; RV32I-NEXT: srli a1, a0, 15
				; RV32I-NEXT: andi a1, a1, 1
				; RV32I-NEXT: add a0, a0, a1
	; RV32I-NEXT: addi a1, zero, -124			; RV32I-NEXT: addi a1, zero, -124
				; RV32I-NEXT: call __mulsi3
				; RV32I-NEXT: sub s5, s0, a0
				; RV32I-NEXT: lh s0, 8(s1)
				; RV32I-NEXT: lui a0, 1
				; RV32I-NEXT: addi a1, a0, -1421
	; RV32I-NEXT: mv a0, s0			; RV32I-NEXT: mv a0, s0
	; RV32I-NEXT: call __modsi3			; RV32I-NEXT: call __mulsi3
	; RV32I-NEXT: mv s5, a0			; RV32I-NEXT: srai a0, a0, 18
				; RV32I-NEXT: srli a1, a0, 15
				; RV32I-NEXT: andi a1, a1, 1
				; RV32I-NEXT: add a0, a0, a1
	; RV32I-NEXT: addi a1, zero, 98			; RV32I-NEXT: addi a1, zero, 98
	; RV32I-NEXT: mv a0, s3			; RV32I-NEXT: call __mulsi3
	; RV32I-NEXT: call __modsi3			; RV32I-NEXT: sub a0, s0, a0
	; RV32I-NEXT: mv s0, a0			; RV32I-NEXT: sh a0, 4(s2)
	; RV32I-NEXT: addi a1, zero, -1003			; RV32I-NEXT: sh s5, 2(s2)
	; RV32I-NEXT: mv a0, s2			; RV32I-NEXT: sh s4, 6(s2)
	; RV32I-NEXT: call __modsi3			; RV32I-NEXT: sh s3, 0(s2)
	; RV32I-NEXT: sh a0, 6(s1)
	; RV32I-NEXT: sh s0, 4(s1)
	; RV32I-NEXT: sh s5, 2(s1)
	; RV32I-NEXT: sh s4, 0(s1)
	; RV32I-NEXT: lw s5, 4(sp)			; RV32I-NEXT: lw s5, 4(sp)
	; RV32I-NEXT: lw s4, 8(sp)			; RV32I-NEXT: lw s4, 8(sp)
	; RV32I-NEXT: lw s3, 12(sp)			; RV32I-NEXT: lw s3, 12(sp)
	; RV32I-NEXT: lw s2, 16(sp)			; RV32I-NEXT: lw s2, 16(sp)
	; RV32I-NEXT: lw s1, 20(sp)			; RV32I-NEXT: lw s1, 20(sp)
	; RV32I-NEXT: lw s0, 24(sp)			; RV32I-NEXT: lw s0, 24(sp)
	; RV32I-NEXT: lw ra, 28(sp)			; RV32I-NEXT: lw ra, 28(sp)
	; RV32I-NEXT: addi sp, sp, 32			; RV32I-NEXT: addi sp, sp, 32
	; RV32I-NEXT: ret			; RV32I-NEXT: ret
	;			;
	; RV32IM-LABEL: fold_srem_vec_1:			; RV32IM-LABEL: fold_srem_vec_1:
	; RV32IM: # %bb.0:			; RV32IM: # %bb.0:
	; RV32IM-NEXT: lh a6, 12(a1)			; RV32IM-NEXT: lh a2, 0(a1)
	; RV32IM-NEXT: lh a3, 8(a1)			; RV32IM-NEXT: lui a3, 1048571
	; RV32IM-NEXT: lh a4, 0(a1)			; RV32IM-NEXT: addi a3, a3, -905
	; RV32IM-NEXT: lh a1, 4(a1)			; RV32IM-NEXT: mul a3, a2, a3
	; RV32IM-NEXT: lui a5, 706409			; RV32IM-NEXT: srli a3, a3, 16
	; RV32IM-NEXT: addi a5, a5, 389			; RV32IM-NEXT: add a3, a3, a2
	; RV32IM-NEXT: mulh a5, a4, a5			; RV32IM-NEXT: slli a3, a3, 16
	; RV32IM-NEXT: add a5, a5, a4			; RV32IM-NEXT: srai a3, a3, 22
	; RV32IM-NEXT: srli a2, a5, 31			; RV32IM-NEXT: srli a4, a3, 15
	; RV32IM-NEXT: srli a5, a5, 6			; RV32IM-NEXT: andi a4, a4, 1
	; RV32IM-NEXT: add a2, a5, a2			; RV32IM-NEXT: add a3, a3, a4
	; RV32IM-NEXT: addi a5, zero, 95			; RV32IM-NEXT: addi a4, zero, 95
	; RV32IM-NEXT: mul a2, a2, a5			; RV32IM-NEXT: mul a3, a3, a4
	; RV32IM-NEXT: sub a2, a4, a2			; RV32IM-NEXT: lh a4, 12(a1)
	; RV32IM-NEXT: lui a4, 507375			; RV32IM-NEXT: sub a6, a2, a3
	; RV32IM-NEXT: addi a4, a4, 1981			; RV32IM-NEXT: lui a3, 8
	; RV32IM-NEXT: mulh a4, a1, a4			; RV32IM-NEXT: addi a3, a3, -687
	; RV32IM-NEXT: sub a4, a4, a1			; RV32IM-NEXT: mul a3, a4, a3
	; RV32IM-NEXT: srli a5, a4, 31			; RV32IM-NEXT: srli a3, a3, 16
	; RV32IM-NEXT: srli a4, a4, 6
	; RV32IM-NEXT: add a4, a4, a5
	; RV32IM-NEXT: addi a5, zero, -124
	; RV32IM-NEXT: mul a4, a4, a5
	; RV32IM-NEXT: sub a1, a1, a4
	; RV32IM-NEXT: lui a4, 342392
	; RV32IM-NEXT: addi a4, a4, 669
	; RV32IM-NEXT: mulh a4, a3, a4
	; RV32IM-NEXT: srli a5, a4, 31
	; RV32IM-NEXT: srli a4, a4, 5
	; RV32IM-NEXT: add a4, a4, a5
	; RV32IM-NEXT: addi a5, zero, 98
	; RV32IM-NEXT: mul a4, a4, a5
	; RV32IM-NEXT: sub a3, a3, a4			; RV32IM-NEXT: sub a3, a3, a4
	; RV32IM-NEXT: lui a4, 780943			; RV32IM-NEXT: slli a3, a3, 16
	; RV32IM-NEXT: addi a4, a4, 1809			; RV32IM-NEXT: srai a3, a3, 25
	; RV32IM-NEXT: mulh a4, a6, a4			; RV32IM-NEXT: srli a5, a3, 15
	; RV32IM-NEXT: srli a5, a4, 31			; RV32IM-NEXT: andi a5, a5, 1
	; RV32IM-NEXT: srli a4, a4, 8			; RV32IM-NEXT: add a3, a3, a5
	; RV32IM-NEXT: add a4, a4, a5
	; RV32IM-NEXT: addi a5, zero, -1003			; RV32IM-NEXT: addi a5, zero, -1003
				; RV32IM-NEXT: mul a3, a3, a5
				; RV32IM-NEXT: lh a5, 4(a1)
				; RV32IM-NEXT: sub a3, a4, a3
				; RV32IM-NEXT: lui a4, 1048572
				; RV32IM-NEXT: addi a4, a4, -529
				; RV32IM-NEXT: mul a4, a5, a4
				; RV32IM-NEXT: srai a4, a4, 21
				; RV32IM-NEXT: srli a2, a4, 15
				; RV32IM-NEXT: andi a2, a2, 1
				; RV32IM-NEXT: add a2, a4, a2
				; RV32IM-NEXT: addi a4, zero, -124
				; RV32IM-NEXT: mul a2, a2, a4
				; RV32IM-NEXT: lh a1, 8(a1)
				; RV32IM-NEXT: sub a2, a5, a2
				; RV32IM-NEXT: lui a4, 1
				; RV32IM-NEXT: addi a4, a4, -1421
				; RV32IM-NEXT: mul a4, a1, a4
				; RV32IM-NEXT: srai a4, a4, 18
				; RV32IM-NEXT: srli a5, a4, 15
				; RV32IM-NEXT: andi a5, a5, 1
				; RV32IM-NEXT: add a4, a4, a5
				; RV32IM-NEXT: addi a5, zero, 98
	; RV32IM-NEXT: mul a4, a4, a5			; RV32IM-NEXT: mul a4, a4, a5
	; RV32IM-NEXT: sub a4, a6, a4			; RV32IM-NEXT: sub a1, a1, a4
	; RV32IM-NEXT: sh a4, 6(a0)			; RV32IM-NEXT: sh a1, 4(a0)
	; RV32IM-NEXT: sh a3, 4(a0)			; RV32IM-NEXT: sh a2, 2(a0)
	; RV32IM-NEXT: sh a1, 2(a0)			; RV32IM-NEXT: sh a3, 6(a0)
	; RV32IM-NEXT: sh a2, 0(a0)			; RV32IM-NEXT: sh a6, 0(a0)
	; RV32IM-NEXT: ret			; RV32IM-NEXT: ret
	;			;
	; RV64I-LABEL: fold_srem_vec_1:			; RV64I-LABEL: fold_srem_vec_1:
	; RV64I: # %bb.0:			; RV64I: # %bb.0:
	; RV64I-NEXT: addi sp, sp, -64			; RV64I-NEXT: addi sp, sp, -64
	; RV64I-NEXT: sd ra, 56(sp)			; RV64I-NEXT: sd ra, 56(sp)
	; RV64I-NEXT: sd s0, 48(sp)			; RV64I-NEXT: sd s0, 48(sp)
	; RV64I-NEXT: sd s1, 40(sp)			; RV64I-NEXT: sd s1, 40(sp)
	; RV64I-NEXT: sd s2, 32(sp)			; RV64I-NEXT: sd s2, 32(sp)
	; RV64I-NEXT: sd s3, 24(sp)			; RV64I-NEXT: sd s3, 24(sp)
	; RV64I-NEXT: sd s4, 16(sp)			; RV64I-NEXT: sd s4, 16(sp)
	; RV64I-NEXT: sd s5, 8(sp)			; RV64I-NEXT: sd s5, 8(sp)
	; RV64I-NEXT: lh s2, 24(a1)			; RV64I-NEXT: mv s1, a1
	; RV64I-NEXT: lh s3, 16(a1)			; RV64I-NEXT: mv s2, a0
	; RV64I-NEXT: lh s0, 8(a1)			; RV64I-NEXT: lh s0, 0(a1)
	; RV64I-NEXT: lh a2, 0(a1)			; RV64I-NEXT: lui a0, 1048571
	; RV64I-NEXT: mv s1, a0			; RV64I-NEXT: addiw a1, a0, -905
				; RV64I-NEXT: mv a0, s0
				; RV64I-NEXT: call __muldi3
				; RV64I-NEXT: srli a0, a0, 16
				; RV64I-NEXT: add a0, a0, s0
				; RV64I-NEXT: slli a0, a0, 48
				; RV64I-NEXT: srai a0, a0, 54
				; RV64I-NEXT: srli a1, a0, 15
				; RV64I-NEXT: andi a1, a1, 1
				; RV64I-NEXT: add a0, a0, a1
	; RV64I-NEXT: addi a1, zero, 95			; RV64I-NEXT: addi a1, zero, 95
	; RV64I-NEXT: mv a0, a2			; RV64I-NEXT: call __muldi3
	; RV64I-NEXT: call __moddi3			; RV64I-NEXT: sub s3, s0, a0
	; RV64I-NEXT: mv s4, a0			; RV64I-NEXT: lh s0, 24(s1)
				; RV64I-NEXT: lui a0, 8
				; RV64I-NEXT: addiw a1, a0, -687
				; RV64I-NEXT: mv a0, s0
				; RV64I-NEXT: call __muldi3
				; RV64I-NEXT: srli a0, a0, 16
				; RV64I-NEXT: sub a0, a0, s0
				; RV64I-NEXT: slli a0, a0, 48
				; RV64I-NEXT: srai a0, a0, 57
				; RV64I-NEXT: srli a1, a0, 15
				; RV64I-NEXT: andi a1, a1, 1
				; RV64I-NEXT: add a0, a0, a1
				; RV64I-NEXT: addi a1, zero, -1003
				; RV64I-NEXT: call __muldi3
				; RV64I-NEXT: sub s4, s0, a0
				; RV64I-NEXT: lh s0, 8(s1)
				; RV64I-NEXT: lui a0, 1048572
				; RV64I-NEXT: addiw a1, a0, -529
				; RV64I-NEXT: mv a0, s0
				; RV64I-NEXT: call __muldi3
				; RV64I-NEXT: srai a0, a0, 21
				; RV64I-NEXT: srli a1, a0, 15
				; RV64I-NEXT: andi a1, a1, 1
				; RV64I-NEXT: add a0, a0, a1
	; RV64I-NEXT: addi a1, zero, -124			; RV64I-NEXT: addi a1, zero, -124
				; RV64I-NEXT: call __muldi3
				; RV64I-NEXT: sub s5, s0, a0
				; RV64I-NEXT: lh s0, 16(s1)
				; RV64I-NEXT: lui a0, 1
				; RV64I-NEXT: addiw a1, a0, -1421
	; RV64I-NEXT: mv a0, s0			; RV64I-NEXT: mv a0, s0
	; RV64I-NEXT: call __moddi3			; RV64I-NEXT: call __muldi3
	; RV64I-NEXT: mv s5, a0			; RV64I-NEXT: srai a0, a0, 18
				; RV64I-NEXT: srli a1, a0, 15
				; RV64I-NEXT: andi a1, a1, 1
				; RV64I-NEXT: add a0, a0, a1
	; RV64I-NEXT: addi a1, zero, 98			; RV64I-NEXT: addi a1, zero, 98
	; RV64I-NEXT: mv a0, s3			; RV64I-NEXT: call __muldi3
	; RV64I-NEXT: call __moddi3			; RV64I-NEXT: sub a0, s0, a0
	; RV64I-NEXT: mv s0, a0			; RV64I-NEXT: sh a0, 4(s2)
	; RV64I-NEXT: addi a1, zero, -1003			; RV64I-NEXT: sh s5, 2(s2)
	; RV64I-NEXT: mv a0, s2			; RV64I-NEXT: sh s4, 6(s2)
	; RV64I-NEXT: call __moddi3			; RV64I-NEXT: sh s3, 0(s2)
	; RV64I-NEXT: sh a0, 6(s1)
	; RV64I-NEXT: sh s0, 4(s1)
	; RV64I-NEXT: sh s5, 2(s1)
	; RV64I-NEXT: sh s4, 0(s1)
	; RV64I-NEXT: ld s5, 8(sp)			; RV64I-NEXT: ld s5, 8(sp)
	; RV64I-NEXT: ld s4, 16(sp)			; RV64I-NEXT: ld s4, 16(sp)
	; RV64I-NEXT: ld s3, 24(sp)			; RV64I-NEXT: ld s3, 24(sp)
	; RV64I-NEXT: ld s2, 32(sp)			; RV64I-NEXT: ld s2, 32(sp)
	; RV64I-NEXT: ld s1, 40(sp)			; RV64I-NEXT: ld s1, 40(sp)
	; RV64I-NEXT: ld s0, 48(sp)			; RV64I-NEXT: ld s0, 48(sp)
	; RV64I-NEXT: ld ra, 56(sp)			; RV64I-NEXT: ld ra, 56(sp)
	; RV64I-NEXT: addi sp, sp, 64			; RV64I-NEXT: addi sp, sp, 64
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IM-LABEL: fold_srem_vec_1:			; RV64IM-LABEL: fold_srem_vec_1:
	; RV64IM: # %bb.0:			; RV64IM: # %bb.0:
	; RV64IM-NEXT: lh a6, 24(a1)			; RV64IM-NEXT: lh a2, 0(a1)
	; RV64IM-NEXT: lh a3, 16(a1)			; RV64IM-NEXT: lui a3, 1048571
	; RV64IM-NEXT: lh a4, 8(a1)			; RV64IM-NEXT: addiw a3, a3, -905
	; RV64IM-NEXT: lh a1, 0(a1)			; RV64IM-NEXT: mul a3, a2, a3
	; RV64IM-NEXT: lui a5, 1045903			; RV64IM-NEXT: srli a3, a3, 16
	; RV64IM-NEXT: addiw a5, a5, -733			; RV64IM-NEXT: add a3, a3, a2
	; RV64IM-NEXT: slli a5, a5, 15			; RV64IM-NEXT: slli a3, a3, 48
	; RV64IM-NEXT: addi a5, a5, 1035			; RV64IM-NEXT: srai a3, a3, 54
	; RV64IM-NEXT: slli a5, a5, 12			; RV64IM-NEXT: srli a4, a3, 15
	; RV64IM-NEXT: addi a5, a5, -905			; RV64IM-NEXT: andi a4, a4, 1
	; RV64IM-NEXT: slli a5, a5, 12			; RV64IM-NEXT: add a3, a3, a4
	; RV64IM-NEXT: addi a5, a5, -1767			; RV64IM-NEXT: addi a4, zero, 95
	; RV64IM-NEXT: mulh a5, a1, a5			; RV64IM-NEXT: mul a3, a3, a4
	; RV64IM-NEXT: add a5, a5, a1			; RV64IM-NEXT: lh a4, 24(a1)
	; RV64IM-NEXT: srli a2, a5, 63			; RV64IM-NEXT: sub a6, a2, a3
	; RV64IM-NEXT: srli a5, a5, 6			; RV64IM-NEXT: lui a3, 8
	; RV64IM-NEXT: add a2, a5, a2			; RV64IM-NEXT: addiw a3, a3, -687
	; RV64IM-NEXT: addi a5, zero, 95			; RV64IM-NEXT: mul a3, a4, a3
	; RV64IM-NEXT: mul a2, a2, a5			; RV64IM-NEXT: srli a3, a3, 16
	; RV64IM-NEXT: sub a1, a1, a2
	; RV64IM-NEXT: lui a2, 248
	; RV64IM-NEXT: addiw a2, a2, -1057
	; RV64IM-NEXT: slli a2, a2, 15
	; RV64IM-NEXT: addi a2, a2, -1057
	; RV64IM-NEXT: slli a2, a2, 15
	; RV64IM-NEXT: addi a2, a2, -1057
	; RV64IM-NEXT: slli a2, a2, 13
	; RV64IM-NEXT: addi a2, a2, -265
	; RV64IM-NEXT: mulh a2, a4, a2
	; RV64IM-NEXT: sub a2, a2, a4
	; RV64IM-NEXT: srli a5, a2, 63
	; RV64IM-NEXT: srli a2, a2, 6
	; RV64IM-NEXT: add a2, a2, a5
	; RV64IM-NEXT: addi a5, zero, -124
	; RV64IM-NEXT: mul a2, a2, a5
	; RV64IM-NEXT: sub a2, a4, a2
	; RV64IM-NEXT: lui a4, 2675
	; RV64IM-NEXT: addiw a4, a4, -251
	; RV64IM-NEXT: slli a4, a4, 13
	; RV64IM-NEXT: addi a4, a4, 1839
	; RV64IM-NEXT: slli a4, a4, 13
	; RV64IM-NEXT: addi a4, a4, 167
	; RV64IM-NEXT: slli a4, a4, 13
	; RV64IM-NEXT: addi a4, a4, 1505
	; RV64IM-NEXT: mulh a4, a3, a4
	; RV64IM-NEXT: srli a5, a4, 63
	; RV64IM-NEXT: srli a4, a4, 5
	; RV64IM-NEXT: add a4, a4, a5
	; RV64IM-NEXT: addi a5, zero, 98
	; RV64IM-NEXT: mul a4, a4, a5
	; RV64IM-NEXT: sub a3, a3, a4			; RV64IM-NEXT: sub a3, a3, a4
	; RV64IM-NEXT: lui a4, 1040212			; RV64IM-NEXT: slli a3, a3, 48
	; RV64IM-NEXT: addiw a4, a4, 1977			; RV64IM-NEXT: srai a3, a3, 57
	; RV64IM-NEXT: slli a4, a4, 12			; RV64IM-NEXT: srli a5, a3, 15
	; RV64IM-NEXT: addi a4, a4, -1907			; RV64IM-NEXT: andi a5, a5, 1
	; RV64IM-NEXT: slli a4, a4, 12			; RV64IM-NEXT: add a3, a3, a5
	; RV64IM-NEXT: addi a4, a4, -453
	; RV64IM-NEXT: slli a4, a4, 12
	; RV64IM-NEXT: addi a4, a4, -1213
	; RV64IM-NEXT: mulh a4, a6, a4
	; RV64IM-NEXT: srli a5, a4, 63
	; RV64IM-NEXT: srli a4, a4, 7
	; RV64IM-NEXT: add a4, a4, a5
	; RV64IM-NEXT: addi a5, zero, -1003			; RV64IM-NEXT: addi a5, zero, -1003
				; RV64IM-NEXT: mul a3, a3, a5
				; RV64IM-NEXT: lh a5, 8(a1)
				; RV64IM-NEXT: sub a3, a4, a3
				; RV64IM-NEXT: lui a4, 1048572
				; RV64IM-NEXT: addiw a4, a4, -529
				; RV64IM-NEXT: mul a4, a5, a4
				; RV64IM-NEXT: srai a4, a4, 21
				; RV64IM-NEXT: srli a2, a4, 15
				; RV64IM-NEXT: andi a2, a2, 1
				; RV64IM-NEXT: add a2, a4, a2
				; RV64IM-NEXT: addi a4, zero, -124
				; RV64IM-NEXT: mul a2, a2, a4
				; RV64IM-NEXT: lh a1, 16(a1)
				; RV64IM-NEXT: sub a2, a5, a2
				; RV64IM-NEXT: lui a4, 1
				; RV64IM-NEXT: addiw a4, a4, -1421
				; RV64IM-NEXT: mul a4, a1, a4
				; RV64IM-NEXT: srai a4, a4, 18
				; RV64IM-NEXT: srli a5, a4, 15
				; RV64IM-NEXT: andi a5, a5, 1
				; RV64IM-NEXT: add a4, a4, a5
				; RV64IM-NEXT: addi a5, zero, 98
	; RV64IM-NEXT: mul a4, a4, a5			; RV64IM-NEXT: mul a4, a4, a5
	; RV64IM-NEXT: sub a4, a6, a4			; RV64IM-NEXT: sub a1, a1, a4
	; RV64IM-NEXT: sh a4, 6(a0)			; RV64IM-NEXT: sh a1, 4(a0)
	; RV64IM-NEXT: sh a3, 4(a0)
	; RV64IM-NEXT: sh a2, 2(a0)			; RV64IM-NEXT: sh a2, 2(a0)
	; RV64IM-NEXT: sh a1, 0(a0)			; RV64IM-NEXT: sh a3, 6(a0)
				; RV64IM-NEXT: sh a6, 0(a0)
	; RV64IM-NEXT: ret			; RV64IM-NEXT: ret
	%1 = srem <4 x i16> %x, <i16 95, i16 -124, i16 98, i16 -1003>			%1 = srem <4 x i16> %x, <i16 95, i16 -124, i16 98, i16 -1003>
	ret <4 x i16> %1			ret <4 x i16> %1
	}			}

	define <4 x i16> @fold_srem_vec_2(<4 x i16> %x) nounwind {			define <4 x i16> @fold_srem_vec_2(<4 x i16> %x) nounwind {
	; RV32I-LABEL: fold_srem_vec_2:			; RV32I-LABEL: fold_srem_vec_2:
	; RV32I: # %bb.0:			; RV32I: # %bb.0:
	; RV32I-NEXT: addi sp, sp, -32			; RV32I-NEXT: addi sp, sp, -32
	; RV32I-NEXT: sw ra, 28(sp)			; RV32I-NEXT: sw ra, 28(sp)
	; RV32I-NEXT: sw s0, 24(sp)			; RV32I-NEXT: sw s0, 24(sp)
	; RV32I-NEXT: sw s1, 20(sp)			; RV32I-NEXT: sw s1, 20(sp)
	; RV32I-NEXT: sw s2, 16(sp)			; RV32I-NEXT: sw s2, 16(sp)
	; RV32I-NEXT: sw s3, 12(sp)			; RV32I-NEXT: sw s3, 12(sp)
	; RV32I-NEXT: sw s4, 8(sp)			; RV32I-NEXT: sw s4, 8(sp)
	; RV32I-NEXT: sw s5, 4(sp)			; RV32I-NEXT: sw s5, 4(sp)
	; RV32I-NEXT: lh s2, 12(a1)			; RV32I-NEXT: sw s6, 0(sp)
	; RV32I-NEXT: lh s3, 8(a1)			; RV32I-NEXT: mv s3, a1
	; RV32I-NEXT: lh s0, 4(a1)			; RV32I-NEXT: mv s2, a0
	; RV32I-NEXT: lh a2, 0(a1)			; RV32I-NEXT: lh s1, 0(a1)
	; RV32I-NEXT: mv s1, a0			; RV32I-NEXT: lui a0, 1048571
				; RV32I-NEXT: addi s0, a0, -905
				; RV32I-NEXT: mv a0, s1
				; RV32I-NEXT: mv a1, s0
				; RV32I-NEXT: call __mulsi3
				; RV32I-NEXT: srli a0, a0, 16
				; RV32I-NEXT: add a0, a0, s1
				; RV32I-NEXT: slli a0, a0, 16
				; RV32I-NEXT: srai a0, a0, 22
				; RV32I-NEXT: srli a1, a0, 15
				; RV32I-NEXT: andi a1, a1, 1
				; RV32I-NEXT: add a0, a0, a1
	; RV32I-NEXT: addi a1, zero, 95			; RV32I-NEXT: addi a1, zero, 95
	; RV32I-NEXT: mv a0, a2			; RV32I-NEXT: call __mulsi3
	; RV32I-NEXT: call __modsi3			; RV32I-NEXT: sub s4, s1, a0
	; RV32I-NEXT: mv s4, a0			; RV32I-NEXT: lh s1, 4(s3)
				; RV32I-NEXT: mv a0, s1
				; RV32I-NEXT: mv a1, s0
				; RV32I-NEXT: call __mulsi3
				; RV32I-NEXT: srli a0, a0, 16
				; RV32I-NEXT: add a0, a0, s1
				; RV32I-NEXT: slli a0, a0, 16
				; RV32I-NEXT: srai a0, a0, 22
				; RV32I-NEXT: srli a1, a0, 15
				; RV32I-NEXT: andi a1, a1, 1
				; RV32I-NEXT: add a0, a0, a1
	; RV32I-NEXT: addi a1, zero, 95			; RV32I-NEXT: addi a1, zero, 95
	; RV32I-NEXT: mv a0, s0			; RV32I-NEXT: call __mulsi3
	; RV32I-NEXT: call __modsi3			; RV32I-NEXT: sub s5, s1, a0
	; RV32I-NEXT: mv s5, a0			; RV32I-NEXT: lh s1, 8(s3)
				; RV32I-NEXT: mv a0, s1
				; RV32I-NEXT: mv a1, s0
				; RV32I-NEXT: call __mulsi3
				; RV32I-NEXT: srli a0, a0, 16
				; RV32I-NEXT: add a0, a0, s1
				; RV32I-NEXT: slli a0, a0, 16
				; RV32I-NEXT: srai a0, a0, 22
				; RV32I-NEXT: srli a1, a0, 15
				; RV32I-NEXT: andi a1, a1, 1
				; RV32I-NEXT: add a0, a0, a1
	; RV32I-NEXT: addi a1, zero, 95			; RV32I-NEXT: addi a1, zero, 95
	; RV32I-NEXT: mv a0, s3			; RV32I-NEXT: call __mulsi3
	; RV32I-NEXT: call __modsi3			; RV32I-NEXT: sub s6, s1, a0
	; RV32I-NEXT: mv s0, a0			; RV32I-NEXT: lh s1, 12(s3)
				; RV32I-NEXT: mv a0, s1
				; RV32I-NEXT: mv a1, s0
				; RV32I-NEXT: call __mulsi3
				; RV32I-NEXT: srli a0, a0, 16
				; RV32I-NEXT: add a0, a0, s1
				; RV32I-NEXT: slli a0, a0, 16
				; RV32I-NEXT: srai a0, a0, 22
				; RV32I-NEXT: srli a1, a0, 15
				; RV32I-NEXT: andi a1, a1, 1
				; RV32I-NEXT: add a0, a0, a1
	; RV32I-NEXT: addi a1, zero, 95			; RV32I-NEXT: addi a1, zero, 95
	; RV32I-NEXT: mv a0, s2			; RV32I-NEXT: call __mulsi3
	; RV32I-NEXT: call __modsi3			; RV32I-NEXT: sub a0, s1, a0
	; RV32I-NEXT: sh a0, 6(s1)			; RV32I-NEXT: sh a0, 6(s2)
	; RV32I-NEXT: sh s0, 4(s1)			; RV32I-NEXT: sh s6, 4(s2)
	; RV32I-NEXT: sh s5, 2(s1)			; RV32I-NEXT: sh s5, 2(s2)
	; RV32I-NEXT: sh s4, 0(s1)			; RV32I-NEXT: sh s4, 0(s2)
				; RV32I-NEXT: lw s6, 0(sp)
	; RV32I-NEXT: lw s5, 4(sp)			; RV32I-NEXT: lw s5, 4(sp)
	; RV32I-NEXT: lw s4, 8(sp)			; RV32I-NEXT: lw s4, 8(sp)
	; RV32I-NEXT: lw s3, 12(sp)			; RV32I-NEXT: lw s3, 12(sp)
	; RV32I-NEXT: lw s2, 16(sp)			; RV32I-NEXT: lw s2, 16(sp)
	; RV32I-NEXT: lw s1, 20(sp)			; RV32I-NEXT: lw s1, 20(sp)
	; RV32I-NEXT: lw s0, 24(sp)			; RV32I-NEXT: lw s0, 24(sp)
	; RV32I-NEXT: lw ra, 28(sp)			; RV32I-NEXT: lw ra, 28(sp)
	; RV32I-NEXT: addi sp, sp, 32			; RV32I-NEXT: addi sp, sp, 32
	; RV32I-NEXT: ret			; RV32I-NEXT: ret
	;			;
	; RV32IM-LABEL: fold_srem_vec_2:			; RV32IM-LABEL: fold_srem_vec_2:
	; RV32IM: # %bb.0:			; RV32IM: # %bb.0:
	; RV32IM-NEXT: lh a6, 12(a1)			; RV32IM-NEXT: lh a2, 0(a1)
	; RV32IM-NEXT: lh a3, 8(a1)			; RV32IM-NEXT: lui a3, 1048571
	; RV32IM-NEXT: lh a4, 0(a1)			; RV32IM-NEXT: addi a3, a3, -905
	; RV32IM-NEXT: lh a1, 4(a1)			; RV32IM-NEXT: mul a4, a2, a3
	; RV32IM-NEXT: lui a5, 706409			; RV32IM-NEXT: srli a4, a4, 16
	; RV32IM-NEXT: addi a5, a5, 389			; RV32IM-NEXT: add a4, a4, a2
	; RV32IM-NEXT: mulh a2, a4, a5			; RV32IM-NEXT: slli a4, a4, 16
	; RV32IM-NEXT: add a2, a2, a4			; RV32IM-NEXT: srai a4, a4, 22
	; RV32IM-NEXT: srli a7, a2, 31			; RV32IM-NEXT: srli a5, a4, 15
	; RV32IM-NEXT: srli a2, a2, 6			; RV32IM-NEXT: andi a5, a5, 1
	; RV32IM-NEXT: add a2, a2, a7			; RV32IM-NEXT: add a4, a4, a5
	; RV32IM-NEXT: addi a7, zero, 95			; RV32IM-NEXT: lh a5, 4(a1)
	; RV32IM-NEXT: mul a2, a2, a7			; RV32IM-NEXT: addi a6, zero, 95
	; RV32IM-NEXT: sub t0, a4, a2			; RV32IM-NEXT: mul a4, a4, a6
	; RV32IM-NEXT: mulh a4, a1, a5			; RV32IM-NEXT: sub a7, a2, a4
	; RV32IM-NEXT: add a4, a4, a1			; RV32IM-NEXT: mul a4, a5, a3
	; RV32IM-NEXT: srli a2, a4, 31			; RV32IM-NEXT: srli a4, a4, 16
	; RV32IM-NEXT: srli a4, a4, 6			; RV32IM-NEXT: add a4, a4, a5
	; RV32IM-NEXT: add a2, a4, a2			; RV32IM-NEXT: slli a4, a4, 16
	; RV32IM-NEXT: mul a2, a2, a7			; RV32IM-NEXT: srai a4, a4, 22
	; RV32IM-NEXT: sub a1, a1, a2			; RV32IM-NEXT: srli a2, a4, 15
	; RV32IM-NEXT: mulh a2, a3, a5			; RV32IM-NEXT: andi t0, a2, 1
	; RV32IM-NEXT: add a2, a2, a3			; RV32IM-NEXT: lh a2, 8(a1)
	; RV32IM-NEXT: srli a4, a2, 31			; RV32IM-NEXT: add a4, a4, t0
	; RV32IM-NEXT: srli a2, a2, 6			; RV32IM-NEXT: mul a4, a4, a6
	; RV32IM-NEXT: add a2, a2, a4			; RV32IM-NEXT: sub t0, a5, a4
	; RV32IM-NEXT: mul a2, a2, a7			; RV32IM-NEXT: mul a5, a2, a3
	; RV32IM-NEXT: sub a2, a3, a2			; RV32IM-NEXT: srli a5, a5, 16
	; RV32IM-NEXT: mulh a3, a6, a5			; RV32IM-NEXT: add a5, a5, a2
	; RV32IM-NEXT: add a3, a3, a6			; RV32IM-NEXT: slli a5, a5, 16
	; RV32IM-NEXT: srli a4, a3, 31			; RV32IM-NEXT: srai a5, a5, 22
	; RV32IM-NEXT: srli a3, a3, 6			; RV32IM-NEXT: srli a4, a5, 15
				; RV32IM-NEXT: andi a4, a4, 1
				; RV32IM-NEXT: lh a1, 12(a1)
				; RV32IM-NEXT: add a4, a5, a4
				; RV32IM-NEXT: mul a4, a4, a6
				; RV32IM-NEXT: sub a2, a2, a4
				; RV32IM-NEXT: mul a3, a1, a3
				; RV32IM-NEXT: srli a3, a3, 16
				; RV32IM-NEXT: add a3, a3, a1
				; RV32IM-NEXT: slli a3, a3, 16
				; RV32IM-NEXT: srai a3, a3, 22
				; RV32IM-NEXT: srli a4, a3, 15
				; RV32IM-NEXT: andi a4, a4, 1
	; RV32IM-NEXT: add a3, a3, a4			; RV32IM-NEXT: add a3, a3, a4
	; RV32IM-NEXT: mul a3, a3, a7			; RV32IM-NEXT: mul a3, a3, a6
	; RV32IM-NEXT: sub a3, a6, a3			; RV32IM-NEXT: sub a1, a1, a3
	; RV32IM-NEXT: sh a3, 6(a0)			; RV32IM-NEXT: sh a1, 6(a0)
	; RV32IM-NEXT: sh a2, 4(a0)			; RV32IM-NEXT: sh a2, 4(a0)
	; RV32IM-NEXT: sh a1, 2(a0)			; RV32IM-NEXT: sh t0, 2(a0)
	; RV32IM-NEXT: sh t0, 0(a0)			; RV32IM-NEXT: sh a7, 0(a0)
	; RV32IM-NEXT: ret			; RV32IM-NEXT: ret
	;			;
	; RV64I-LABEL: fold_srem_vec_2:			; RV64I-LABEL: fold_srem_vec_2:
	; RV64I: # %bb.0:			; RV64I: # %bb.0:
	; RV64I-NEXT: addi sp, sp, -64			; RV64I-NEXT: addi sp, sp, -64
	; RV64I-NEXT: sd ra, 56(sp)			; RV64I-NEXT: sd ra, 56(sp)
	; RV64I-NEXT: sd s0, 48(sp)			; RV64I-NEXT: sd s0, 48(sp)
	; RV64I-NEXT: sd s1, 40(sp)			; RV64I-NEXT: sd s1, 40(sp)
	; RV64I-NEXT: sd s2, 32(sp)			; RV64I-NEXT: sd s2, 32(sp)
	; RV64I-NEXT: sd s3, 24(sp)			; RV64I-NEXT: sd s3, 24(sp)
	; RV64I-NEXT: sd s4, 16(sp)			; RV64I-NEXT: sd s4, 16(sp)
	; RV64I-NEXT: sd s5, 8(sp)			; RV64I-NEXT: sd s5, 8(sp)
	; RV64I-NEXT: lh s2, 24(a1)			; RV64I-NEXT: sd s6, 0(sp)
	; RV64I-NEXT: lh s3, 16(a1)			; RV64I-NEXT: mv s3, a1
	; RV64I-NEXT: lh s0, 8(a1)			; RV64I-NEXT: mv s2, a0
	; RV64I-NEXT: lh a2, 0(a1)			; RV64I-NEXT: lh s1, 0(a1)
	; RV64I-NEXT: mv s1, a0			; RV64I-NEXT: lui a0, 1048571
				; RV64I-NEXT: addiw s0, a0, -905
				; RV64I-NEXT: mv a0, s1
				; RV64I-NEXT: mv a1, s0
				; RV64I-NEXT: call __muldi3
				; RV64I-NEXT: srli a0, a0, 16
				; RV64I-NEXT: add a0, a0, s1
				; RV64I-NEXT: slli a0, a0, 48
				; RV64I-NEXT: srai a0, a0, 54
				; RV64I-NEXT: srli a1, a0, 15
				; RV64I-NEXT: andi a1, a1, 1
				; RV64I-NEXT: add a0, a0, a1
	; RV64I-NEXT: addi a1, zero, 95			; RV64I-NEXT: addi a1, zero, 95
	; RV64I-NEXT: mv a0, a2			; RV64I-NEXT: call __muldi3
	; RV64I-NEXT: call __moddi3			; RV64I-NEXT: sub s4, s1, a0
	; RV64I-NEXT: mv s4, a0			; RV64I-NEXT: lh s1, 8(s3)
				; RV64I-NEXT: mv a0, s1
				; RV64I-NEXT: mv a1, s0
				; RV64I-NEXT: call __muldi3
				; RV64I-NEXT: srli a0, a0, 16
				; RV64I-NEXT: add a0, a0, s1
				; RV64I-NEXT: slli a0, a0, 48
				; RV64I-NEXT: srai a0, a0, 54
				; RV64I-NEXT: srli a1, a0, 15
				; RV64I-NEXT: andi a1, a1, 1
				; RV64I-NEXT: add a0, a0, a1
	; RV64I-NEXT: addi a1, zero, 95			; RV64I-NEXT: addi a1, zero, 95
	; RV64I-NEXT: mv a0, s0			; RV64I-NEXT: call __muldi3
	; RV64I-NEXT: call __moddi3			; RV64I-NEXT: sub s5, s1, a0
	; RV64I-NEXT: mv s5, a0			; RV64I-NEXT: lh s1, 16(s3)
				; RV64I-NEXT: mv a0, s1
				; RV64I-NEXT: mv a1, s0
				; RV64I-NEXT: call __muldi3
				; RV64I-NEXT: srli a0, a0, 16
				; RV64I-NEXT: add a0, a0, s1
				; RV64I-NEXT: slli a0, a0, 48
				; RV64I-NEXT: srai a0, a0, 54
				; RV64I-NEXT: srli a1, a0, 15
				; RV64I-NEXT: andi a1, a1, 1
				; RV64I-NEXT: add a0, a0, a1
	; RV64I-NEXT: addi a1, zero, 95			; RV64I-NEXT: addi a1, zero, 95
	; RV64I-NEXT: mv a0, s3			; RV64I-NEXT: call __muldi3
	; RV64I-NEXT: call __moddi3			; RV64I-NEXT: sub s6, s1, a0
	; RV64I-NEXT: mv s0, a0			; RV64I-NEXT: lh s1, 24(s3)
				; RV64I-NEXT: mv a0, s1
				; RV64I-NEXT: mv a1, s0
				; RV64I-NEXT: call __muldi3
				; RV64I-NEXT: srli a0, a0, 16
				; RV64I-NEXT: add a0, a0, s1
				; RV64I-NEXT: slli a0, a0, 48
				; RV64I-NEXT: srai a0, a0, 54
				; RV64I-NEXT: srli a1, a0, 15
				; RV64I-NEXT: andi a1, a1, 1
				; RV64I-NEXT: add a0, a0, a1
	; RV64I-NEXT: addi a1, zero, 95			; RV64I-NEXT: addi a1, zero, 95
	; RV64I-NEXT: mv a0, s2			; RV64I-NEXT: call __muldi3
	; RV64I-NEXT: call __moddi3			; RV64I-NEXT: sub a0, s1, a0
	; RV64I-NEXT: sh a0, 6(s1)			; RV64I-NEXT: sh a0, 6(s2)
	; RV64I-NEXT: sh s0, 4(s1)			; RV64I-NEXT: sh s6, 4(s2)
	; RV64I-NEXT: sh s5, 2(s1)			; RV64I-NEXT: sh s5, 2(s2)
	; RV64I-NEXT: sh s4, 0(s1)			; RV64I-NEXT: sh s4, 0(s2)
				; RV64I-NEXT: ld s6, 0(sp)
	; RV64I-NEXT: ld s5, 8(sp)			; RV64I-NEXT: ld s5, 8(sp)
	; RV64I-NEXT: ld s4, 16(sp)			; RV64I-NEXT: ld s4, 16(sp)
	; RV64I-NEXT: ld s3, 24(sp)			; RV64I-NEXT: ld s3, 24(sp)
	; RV64I-NEXT: ld s2, 32(sp)			; RV64I-NEXT: ld s2, 32(sp)
	; RV64I-NEXT: ld s1, 40(sp)			; RV64I-NEXT: ld s1, 40(sp)
	; RV64I-NEXT: ld s0, 48(sp)			; RV64I-NEXT: ld s0, 48(sp)
	; RV64I-NEXT: ld ra, 56(sp)			; RV64I-NEXT: ld ra, 56(sp)
	; RV64I-NEXT: addi sp, sp, 64			; RV64I-NEXT: addi sp, sp, 64
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IM-LABEL: fold_srem_vec_2:			; RV64IM-LABEL: fold_srem_vec_2:
	; RV64IM: # %bb.0:			; RV64IM: # %bb.0:
	; RV64IM-NEXT: lh a6, 24(a1)			; RV64IM-NEXT: lh a2, 0(a1)
	; RV64IM-NEXT: lh a7, 16(a1)			; RV64IM-NEXT: lui a3, 1048571
	; RV64IM-NEXT: lh a4, 8(a1)			; RV64IM-NEXT: addiw a3, a3, -905
	; RV64IM-NEXT: lh a1, 0(a1)			; RV64IM-NEXT: mul a4, a2, a3
	; RV64IM-NEXT: lui a5, 1045903			; RV64IM-NEXT: srli a4, a4, 16
	; RV64IM-NEXT: addiw a5, a5, -733			; RV64IM-NEXT: add a4, a4, a2
	; RV64IM-NEXT: slli a5, a5, 15			; RV64IM-NEXT: slli a4, a4, 48
	; RV64IM-NEXT: addi a5, a5, 1035			; RV64IM-NEXT: srai a4, a4, 54
	; RV64IM-NEXT: slli a5, a5, 12			; RV64IM-NEXT: srli a5, a4, 15
	; RV64IM-NEXT: addi a5, a5, -905			; RV64IM-NEXT: andi a5, a5, 1
	; RV64IM-NEXT: slli a5, a5, 12
	; RV64IM-NEXT: addi a5, a5, -1767
	; RV64IM-NEXT: mulh a2, a1, a5
	; RV64IM-NEXT: add a2, a2, a1
	; RV64IM-NEXT: srli a3, a2, 63
	; RV64IM-NEXT: srli a2, a2, 6
	; RV64IM-NEXT: add a2, a2, a3
	; RV64IM-NEXT: addi a3, zero, 95
	; RV64IM-NEXT: mul a2, a2, a3
	; RV64IM-NEXT: sub t0, a1, a2
	; RV64IM-NEXT: mulh a2, a4, a5
	; RV64IM-NEXT: add a2, a2, a4
	; RV64IM-NEXT: srli a1, a2, 63
	; RV64IM-NEXT: srli a2, a2, 6
	; RV64IM-NEXT: add a1, a2, a1
	; RV64IM-NEXT: mul a1, a1, a3
	; RV64IM-NEXT: sub a1, a4, a1
	; RV64IM-NEXT: mulh a2, a7, a5
	; RV64IM-NEXT: add a2, a2, a7
	; RV64IM-NEXT: srli a4, a2, 63
	; RV64IM-NEXT: srli a2, a2, 6
	; RV64IM-NEXT: add a2, a2, a4
	; RV64IM-NEXT: mul a2, a2, a3
	; RV64IM-NEXT: sub a2, a7, a2
	; RV64IM-NEXT: mulh a4, a6, a5
	; RV64IM-NEXT: add a4, a4, a6
	; RV64IM-NEXT: srli a5, a4, 63
	; RV64IM-NEXT: srli a4, a4, 6
	; RV64IM-NEXT: add a4, a4, a5			; RV64IM-NEXT: add a4, a4, a5
	; RV64IM-NEXT: mul a3, a4, a3			; RV64IM-NEXT: lh a5, 8(a1)
	; RV64IM-NEXT: sub a3, a6, a3			; RV64IM-NEXT: addi a6, zero, 95
	; RV64IM-NEXT: sh a3, 6(a0)			; RV64IM-NEXT: mul a4, a4, a6
				; RV64IM-NEXT: sub a7, a2, a4
				; RV64IM-NEXT: mul a4, a5, a3
				; RV64IM-NEXT: srli a4, a4, 16
				; RV64IM-NEXT: add a4, a4, a5
				; RV64IM-NEXT: slli a4, a4, 48
				; RV64IM-NEXT: srai a4, a4, 54
				; RV64IM-NEXT: srli a2, a4, 15
				; RV64IM-NEXT: andi t0, a2, 1
				; RV64IM-NEXT: lh a2, 16(a1)
				; RV64IM-NEXT: add a4, a4, t0
				; RV64IM-NEXT: mul a4, a4, a6
				; RV64IM-NEXT: sub t0, a5, a4
				; RV64IM-NEXT: mul a5, a2, a3
				; RV64IM-NEXT: srli a5, a5, 16
				; RV64IM-NEXT: add a5, a5, a2
				; RV64IM-NEXT: slli a5, a5, 48
				; RV64IM-NEXT: srai a5, a5, 54
				; RV64IM-NEXT: srli a4, a5, 15
				; RV64IM-NEXT: andi a4, a4, 1
				; RV64IM-NEXT: lh a1, 24(a1)
				; RV64IM-NEXT: add a4, a5, a4
				; RV64IM-NEXT: mul a4, a4, a6
				; RV64IM-NEXT: sub a2, a2, a4
				; RV64IM-NEXT: mul a3, a1, a3
				; RV64IM-NEXT: srli a3, a3, 16
				; RV64IM-NEXT: add a3, a3, a1
				; RV64IM-NEXT: slli a3, a3, 48
				; RV64IM-NEXT: srai a3, a3, 54
				; RV64IM-NEXT: srli a4, a3, 15
				; RV64IM-NEXT: andi a4, a4, 1
				; RV64IM-NEXT: add a3, a3, a4
				; RV64IM-NEXT: mul a3, a3, a6
				; RV64IM-NEXT: sub a1, a1, a3
				; RV64IM-NEXT: sh a1, 6(a0)
	; RV64IM-NEXT: sh a2, 4(a0)			; RV64IM-NEXT: sh a2, 4(a0)
	; RV64IM-NEXT: sh a1, 2(a0)			; RV64IM-NEXT: sh t0, 2(a0)
	; RV64IM-NEXT: sh t0, 0(a0)			; RV64IM-NEXT: sh a7, 0(a0)
	; RV64IM-NEXT: ret			; RV64IM-NEXT: ret
	%1 = srem <4 x i16> %x, <i16 95, i16 95, i16 95, i16 95>			%1 = srem <4 x i16> %x, <i16 95, i16 95, i16 95, i16 95>
	ret <4 x i16> %1			ret <4 x i16> %1
	}			}


	; Don't fold if we can combine srem with sdiv.			; Don't fold if we can combine srem with sdiv.
	define <4 x i16> @combine_srem_sdiv(<4 x i16> %x) nounwind {			define <4 x i16> @combine_srem_sdiv(<4 x i16> %x) nounwind {
	; RV32I-LABEL: combine_srem_sdiv:			; RV32I-LABEL: combine_srem_sdiv:
	; RV32I: # %bb.0:			; RV32I: # %bb.0:
	; RV32I-NEXT: addi sp, sp, -48			; RV32I-NEXT: addi sp, sp, -48
	; RV32I-NEXT: sw ra, 44(sp)			; RV32I-NEXT: sw ra, 44(sp)
	; RV32I-NEXT: sw s0, 40(sp)			; RV32I-NEXT: sw s0, 40(sp)
	; RV32I-NEXT: sw s1, 36(sp)			; RV32I-NEXT: sw s1, 36(sp)
	; RV32I-NEXT: sw s2, 32(sp)			; RV32I-NEXT: sw s2, 32(sp)
	; RV32I-NEXT: sw s3, 28(sp)			; RV32I-NEXT: sw s3, 28(sp)
	; RV32I-NEXT: sw s4, 24(sp)			; RV32I-NEXT: sw s4, 24(sp)
	; RV32I-NEXT: sw s5, 20(sp)			; RV32I-NEXT: sw s5, 20(sp)
	; RV32I-NEXT: sw s6, 16(sp)			; RV32I-NEXT: sw s6, 16(sp)
	; RV32I-NEXT: sw s7, 12(sp)			; RV32I-NEXT: sw s7, 12(sp)
	; RV32I-NEXT: sw s8, 8(sp)			; RV32I-NEXT: sw s8, 8(sp)
	; RV32I-NEXT: sw s9, 4(sp)			; RV32I-NEXT: sw s9, 4(sp)
	; RV32I-NEXT: lh s2, 0(a1)			; RV32I-NEXT: mv s4, a1
	; RV32I-NEXT: lh s3, 4(a1)			; RV32I-NEXT: mv s3, a0
	; RV32I-NEXT: lh s4, 8(a1)
	; RV32I-NEXT: lh s1, 12(a1)			; RV32I-NEXT: lh s1, 12(a1)
	; RV32I-NEXT: mv s0, a0			; RV32I-NEXT: lui a0, 1048571
	; RV32I-NEXT: addi a1, zero, 95			; RV32I-NEXT: addi s0, a0, -905
	; RV32I-NEXT: mv a0, s1			; RV32I-NEXT: mv a0, s1
	; RV32I-NEXT: call __modsi3			; RV32I-NEXT: mv a1, s0
	; RV32I-NEXT: mv s5, a0			; RV32I-NEXT: call __mulsi3
	; RV32I-NEXT: addi a1, zero, 95			; RV32I-NEXT: srli a0, a0, 16
	; RV32I-NEXT: mv a0, s4			; RV32I-NEXT: add a0, a0, s1
	; RV32I-NEXT: call __modsi3			; RV32I-NEXT: slli a0, a0, 16
	; RV32I-NEXT: mv s6, a0			; RV32I-NEXT: srai a0, a0, 22
	; RV32I-NEXT: addi a1, zero, 95			; RV32I-NEXT: srli a1, a0, 15
	; RV32I-NEXT: mv a0, s3			; RV32I-NEXT: andi a1, a1, 1
	; RV32I-NEXT: call __modsi3			; RV32I-NEXT: add s2, a0, a1
	; RV32I-NEXT: mv s7, a0
	; RV32I-NEXT: addi a1, zero, 95			; RV32I-NEXT: addi a1, zero, 95
	; RV32I-NEXT: mv a0, s2			; RV32I-NEXT: mv a0, s2
	; RV32I-NEXT: call __modsi3			; RV32I-NEXT: call __mulsi3
	; RV32I-NEXT: mv s8, a0			; RV32I-NEXT: sub s7, s1, a0
	; RV32I-NEXT: addi a1, zero, 95			; RV32I-NEXT: lh s1, 8(s4)
	; RV32I-NEXT: mv a0, s1			; RV32I-NEXT: mv a0, s1
	; RV32I-NEXT: call __divsi3			; RV32I-NEXT: mv a1, s0
	; RV32I-NEXT: mv s9, a0			; RV32I-NEXT: call __mulsi3
				; RV32I-NEXT: srli a0, a0, 16
				; RV32I-NEXT: add a0, a0, s1
				; RV32I-NEXT: slli a0, a0, 16
				; RV32I-NEXT: srai a0, a0, 22
				; RV32I-NEXT: srli a1, a0, 15
				; RV32I-NEXT: andi a1, a1, 1
				; RV32I-NEXT: add s5, a0, a1
	; RV32I-NEXT: addi a1, zero, 95			; RV32I-NEXT: addi a1, zero, 95
	; RV32I-NEXT: mv a0, s4			; RV32I-NEXT: mv a0, s5
	; RV32I-NEXT: call __divsi3			; RV32I-NEXT: call __mulsi3
	; RV32I-NEXT: mv s4, a0			; RV32I-NEXT: sub s8, s1, a0
				; RV32I-NEXT: lh s1, 4(s4)
				; RV32I-NEXT: mv a0, s1
				; RV32I-NEXT: mv a1, s0
				; RV32I-NEXT: call __mulsi3
				; RV32I-NEXT: srli a0, a0, 16
				; RV32I-NEXT: add a0, a0, s1
				; RV32I-NEXT: slli a0, a0, 16
				; RV32I-NEXT: srai a0, a0, 22
				; RV32I-NEXT: srli a1, a0, 15
				; RV32I-NEXT: andi a1, a1, 1
				; RV32I-NEXT: add s6, a0, a1
	; RV32I-NEXT: addi a1, zero, 95			; RV32I-NEXT: addi a1, zero, 95
	; RV32I-NEXT: mv a0, s3			; RV32I-NEXT: mv a0, s6
	; RV32I-NEXT: call __divsi3			; RV32I-NEXT: call __mulsi3
	; RV32I-NEXT: mv s1, a0			; RV32I-NEXT: sub s9, s1, a0
				; RV32I-NEXT: lh s1, 0(s4)
				; RV32I-NEXT: mv a0, s1
				; RV32I-NEXT: mv a1, s0
				; RV32I-NEXT: call __mulsi3
				; RV32I-NEXT: srli a0, a0, 16
				; RV32I-NEXT: add a0, a0, s1
				; RV32I-NEXT: slli a0, a0, 16
				; RV32I-NEXT: srai a0, a0, 22
				; RV32I-NEXT: srli a1, a0, 15
				; RV32I-NEXT: andi a1, a1, 1
				; RV32I-NEXT: add s0, a0, a1
	; RV32I-NEXT: addi a1, zero, 95			; RV32I-NEXT: addi a1, zero, 95
	; RV32I-NEXT: mv a0, s2			; RV32I-NEXT: mv a0, s0
	; RV32I-NEXT: call __divsi3			; RV32I-NEXT: call __mulsi3
	; RV32I-NEXT: add a0, s8, a0			; RV32I-NEXT: sub a0, s1, a0
	; RV32I-NEXT: add a1, s7, s1			; RV32I-NEXT: add a0, a0, s0
	; RV32I-NEXT: add a2, s6, s4			; RV32I-NEXT: add a1, s9, s6
	; RV32I-NEXT: add a3, s5, s9			; RV32I-NEXT: add a2, s8, s5
	; RV32I-NEXT: sh a3, 6(s0)			; RV32I-NEXT: add a3, s7, s2
	; RV32I-NEXT: sh a2, 4(s0)			; RV32I-NEXT: sh a3, 6(s3)
	; RV32I-NEXT: sh a1, 2(s0)			; RV32I-NEXT: sh a2, 4(s3)
	; RV32I-NEXT: sh a0, 0(s0)			; RV32I-NEXT: sh a1, 2(s3)
				; RV32I-NEXT: sh a0, 0(s3)
	; RV32I-NEXT: lw s9, 4(sp)			; RV32I-NEXT: lw s9, 4(sp)
	; RV32I-NEXT: lw s8, 8(sp)			; RV32I-NEXT: lw s8, 8(sp)
	; RV32I-NEXT: lw s7, 12(sp)			; RV32I-NEXT: lw s7, 12(sp)
	; RV32I-NEXT: lw s6, 16(sp)			; RV32I-NEXT: lw s6, 16(sp)
	; RV32I-NEXT: lw s5, 20(sp)			; RV32I-NEXT: lw s5, 20(sp)
	; RV32I-NEXT: lw s4, 24(sp)			; RV32I-NEXT: lw s4, 24(sp)
	; RV32I-NEXT: lw s3, 28(sp)			; RV32I-NEXT: lw s3, 28(sp)
	; RV32I-NEXT: lw s2, 32(sp)			; RV32I-NEXT: lw s2, 32(sp)
	; RV32I-NEXT: lw s1, 36(sp)			; RV32I-NEXT: lw s1, 36(sp)
	; RV32I-NEXT: lw s0, 40(sp)			; RV32I-NEXT: lw s0, 40(sp)
	; RV32I-NEXT: lw ra, 44(sp)			; RV32I-NEXT: lw ra, 44(sp)
	; RV32I-NEXT: addi sp, sp, 48			; RV32I-NEXT: addi sp, sp, 48
	; RV32I-NEXT: ret			; RV32I-NEXT: ret
	;			;
	; RV32IM-LABEL: combine_srem_sdiv:			; RV32IM-LABEL: combine_srem_sdiv:
	; RV32IM: # %bb.0:			; RV32IM: # %bb.0:
	; RV32IM-NEXT: lh a6, 0(a1)			; RV32IM-NEXT: lh a2, 12(a1)
	; RV32IM-NEXT: lh a3, 4(a1)			; RV32IM-NEXT: lui a3, 1048571
	; RV32IM-NEXT: lh a4, 12(a1)			; RV32IM-NEXT: addi a3, a3, -905
	; RV32IM-NEXT: lh a1, 8(a1)			; RV32IM-NEXT: mul a4, a2, a3
	; RV32IM-NEXT: lui a5, 706409			; RV32IM-NEXT: srli a4, a4, 16
	; RV32IM-NEXT: addi a5, a5, 389			; RV32IM-NEXT: add a4, a4, a2
	; RV32IM-NEXT: mulh a2, a4, a5			; RV32IM-NEXT: slli a4, a4, 16
	; RV32IM-NEXT: add a2, a2, a4			; RV32IM-NEXT: srai a4, a4, 22
	; RV32IM-NEXT: srli a7, a2, 31			; RV32IM-NEXT: srli a5, a4, 15
	; RV32IM-NEXT: srai a2, a2, 6			; RV32IM-NEXT: andi a5, a5, 1
	; RV32IM-NEXT: add t0, a2, a7			; RV32IM-NEXT: add a7, a4, a5
	; RV32IM-NEXT: addi a7, zero, 95			; RV32IM-NEXT: lh a5, 8(a1)
	; RV32IM-NEXT: mul a2, t0, a7			; RV32IM-NEXT: addi a6, zero, 95
	; RV32IM-NEXT: sub t1, a4, a2			; RV32IM-NEXT: mul a4, a7, a6
	; RV32IM-NEXT: mulh a4, a1, a5			; RV32IM-NEXT: sub t0, a2, a4
	; RV32IM-NEXT: add a4, a4, a1			; RV32IM-NEXT: mul a4, a5, a3
	; RV32IM-NEXT: srli a2, a4, 31			; RV32IM-NEXT: srli a4, a4, 16
	; RV32IM-NEXT: srai a4, a4, 6
	; RV32IM-NEXT: add a2, a4, a2
	; RV32IM-NEXT: mul a4, a2, a7
	; RV32IM-NEXT: sub t2, a1, a4
	; RV32IM-NEXT: mulh a4, a3, a5
	; RV32IM-NEXT: add a4, a4, a3
	; RV32IM-NEXT: srli a1, a4, 31
	; RV32IM-NEXT: srai a4, a4, 6
	; RV32IM-NEXT: add a1, a4, a1
	; RV32IM-NEXT: mul a4, a1, a7
	; RV32IM-NEXT: sub a3, a3, a4
	; RV32IM-NEXT: mulh a4, a6, a5
	; RV32IM-NEXT: add a4, a4, a6
	; RV32IM-NEXT: srli a5, a4, 31
	; RV32IM-NEXT: srai a4, a4, 6
	; RV32IM-NEXT: add a4, a4, a5			; RV32IM-NEXT: add a4, a4, a5
	; RV32IM-NEXT: mul a5, a4, a7			; RV32IM-NEXT: slli a4, a4, 16
	; RV32IM-NEXT: sub a5, a6, a5			; RV32IM-NEXT: srai a4, a4, 22
				; RV32IM-NEXT: srli a2, a4, 15
				; RV32IM-NEXT: andi t1, a2, 1
				; RV32IM-NEXT: lh a2, 4(a1)
				; RV32IM-NEXT: add t1, a4, t1
				; RV32IM-NEXT: mul a4, t1, a6
				; RV32IM-NEXT: sub t2, a5, a4
				; RV32IM-NEXT: mul a5, a2, a3
				; RV32IM-NEXT: srli a5, a5, 16
				; RV32IM-NEXT: add a5, a5, a2
				; RV32IM-NEXT: slli a5, a5, 16
				; RV32IM-NEXT: srai a5, a5, 22
				; RV32IM-NEXT: srli a4, a5, 15
				; RV32IM-NEXT: andi a4, a4, 1
				; RV32IM-NEXT: lh a1, 0(a1)
	; RV32IM-NEXT: add a4, a5, a4			; RV32IM-NEXT: add a4, a5, a4
	; RV32IM-NEXT: add a1, a3, a1			; RV32IM-NEXT: mul a5, a4, a6
	; RV32IM-NEXT: add a2, t2, a2			; RV32IM-NEXT: sub a2, a2, a5
	; RV32IM-NEXT: add a3, t1, t0			; RV32IM-NEXT: mul a3, a1, a3
	; RV32IM-NEXT: sh a3, 6(a0)			; RV32IM-NEXT: srli a3, a3, 16
	; RV32IM-NEXT: sh a2, 4(a0)			; RV32IM-NEXT: add a3, a3, a1
	; RV32IM-NEXT: sh a1, 2(a0)			; RV32IM-NEXT: slli a3, a3, 16
	; RV32IM-NEXT: sh a4, 0(a0)			; RV32IM-NEXT: srai a3, a3, 22
				; RV32IM-NEXT: srli a5, a3, 15
				; RV32IM-NEXT: andi a5, a5, 1
				; RV32IM-NEXT: add a3, a3, a5
				; RV32IM-NEXT: mul a5, a3, a6
				; RV32IM-NEXT: sub a1, a1, a5
				; RV32IM-NEXT: add a1, a1, a3
				; RV32IM-NEXT: add a2, a2, a4
				; RV32IM-NEXT: add a3, t2, t1
				; RV32IM-NEXT: add a4, t0, a7
				; RV32IM-NEXT: sh a4, 6(a0)
				; RV32IM-NEXT: sh a3, 4(a0)
				; RV32IM-NEXT: sh a2, 2(a0)
				; RV32IM-NEXT: sh a1, 0(a0)
	; RV32IM-NEXT: ret			; RV32IM-NEXT: ret
	;			;
	; RV64I-LABEL: combine_srem_sdiv:			; RV64I-LABEL: combine_srem_sdiv:
	; RV64I: # %bb.0:			; RV64I: # %bb.0:
	; RV64I-NEXT: addi sp, sp, -96			; RV64I-NEXT: addi sp, sp, -96
	; RV64I-NEXT: sd ra, 88(sp)			; RV64I-NEXT: sd ra, 88(sp)
	; RV64I-NEXT: sd s0, 80(sp)			; RV64I-NEXT: sd s0, 80(sp)
	; RV64I-NEXT: sd s1, 72(sp)			; RV64I-NEXT: sd s1, 72(sp)
	; RV64I-NEXT: sd s2, 64(sp)			; RV64I-NEXT: sd s2, 64(sp)
	; RV64I-NEXT: sd s3, 56(sp)			; RV64I-NEXT: sd s3, 56(sp)
	; RV64I-NEXT: sd s4, 48(sp)			; RV64I-NEXT: sd s4, 48(sp)
	; RV64I-NEXT: sd s5, 40(sp)			; RV64I-NEXT: sd s5, 40(sp)
	; RV64I-NEXT: sd s6, 32(sp)			; RV64I-NEXT: sd s6, 32(sp)
	; RV64I-NEXT: sd s7, 24(sp)			; RV64I-NEXT: sd s7, 24(sp)
	; RV64I-NEXT: sd s8, 16(sp)			; RV64I-NEXT: sd s8, 16(sp)
	; RV64I-NEXT: sd s9, 8(sp)			; RV64I-NEXT: sd s9, 8(sp)
	; RV64I-NEXT: lh s2, 0(a1)			; RV64I-NEXT: mv s4, a1
	; RV64I-NEXT: lh s3, 8(a1)			; RV64I-NEXT: mv s3, a0
	; RV64I-NEXT: lh s4, 16(a1)
	; RV64I-NEXT: lh s1, 24(a1)			; RV64I-NEXT: lh s1, 24(a1)
	; RV64I-NEXT: mv s0, a0			; RV64I-NEXT: lui a0, 1048571
	; RV64I-NEXT: addi a1, zero, 95			; RV64I-NEXT: addiw s0, a0, -905
	; RV64I-NEXT: mv a0, s1			; RV64I-NEXT: mv a0, s1
	; RV64I-NEXT: call __moddi3			; RV64I-NEXT: mv a1, s0
	; RV64I-NEXT: mv s5, a0			; RV64I-NEXT: call __muldi3
	; RV64I-NEXT: addi a1, zero, 95			; RV64I-NEXT: srli a0, a0, 16
	; RV64I-NEXT: mv a0, s4			; RV64I-NEXT: add a0, a0, s1
	; RV64I-NEXT: call __moddi3			; RV64I-NEXT: slli a0, a0, 48
	; RV64I-NEXT: mv s6, a0			; RV64I-NEXT: srai a0, a0, 54
	; RV64I-NEXT: addi a1, zero, 95			; RV64I-NEXT: srli a1, a0, 15
	; RV64I-NEXT: mv a0, s3			; RV64I-NEXT: andi a1, a1, 1
	; RV64I-NEXT: call __moddi3			; RV64I-NEXT: add s2, a0, a1
	; RV64I-NEXT: mv s7, a0
	; RV64I-NEXT: addi a1, zero, 95			; RV64I-NEXT: addi a1, zero, 95
	; RV64I-NEXT: mv a0, s2			; RV64I-NEXT: mv a0, s2
	; RV64I-NEXT: call __moddi3			; RV64I-NEXT: call __muldi3
	; RV64I-NEXT: mv s8, a0			; RV64I-NEXT: sub s7, s1, a0
	; RV64I-NEXT: addi a1, zero, 95			; RV64I-NEXT: lh s1, 16(s4)
	; RV64I-NEXT: mv a0, s1			; RV64I-NEXT: mv a0, s1
	; RV64I-NEXT: call __divdi3			; RV64I-NEXT: mv a1, s0
	; RV64I-NEXT: mv s9, a0			; RV64I-NEXT: call __muldi3
				; RV64I-NEXT: srli a0, a0, 16
				; RV64I-NEXT: add a0, a0, s1
				; RV64I-NEXT: slli a0, a0, 48
				; RV64I-NEXT: srai a0, a0, 54
				; RV64I-NEXT: srli a1, a0, 15
				; RV64I-NEXT: andi a1, a1, 1
				; RV64I-NEXT: add s5, a0, a1
	; RV64I-NEXT: addi a1, zero, 95			; RV64I-NEXT: addi a1, zero, 95
	; RV64I-NEXT: mv a0, s4			; RV64I-NEXT: mv a0, s5
	; RV64I-NEXT: call __divdi3			; RV64I-NEXT: call __muldi3
	; RV64I-NEXT: mv s4, a0			; RV64I-NEXT: sub s8, s1, a0
				; RV64I-NEXT: lh s1, 8(s4)
				; RV64I-NEXT: mv a0, s1
				; RV64I-NEXT: mv a1, s0
				; RV64I-NEXT: call __muldi3
				; RV64I-NEXT: srli a0, a0, 16
				; RV64I-NEXT: add a0, a0, s1
				; RV64I-NEXT: slli a0, a0, 48
				; RV64I-NEXT: srai a0, a0, 54
				; RV64I-NEXT: srli a1, a0, 15
				; RV64I-NEXT: andi a1, a1, 1
				; RV64I-NEXT: add s6, a0, a1
	; RV64I-NEXT: addi a1, zero, 95			; RV64I-NEXT: addi a1, zero, 95
	; RV64I-NEXT: mv a0, s3			; RV64I-NEXT: mv a0, s6
	; RV64I-NEXT: call __divdi3			; RV64I-NEXT: call __muldi3
	; RV64I-NEXT: mv s1, a0			; RV64I-NEXT: sub s9, s1, a0
				; RV64I-NEXT: lh s1, 0(s4)
				; RV64I-NEXT: mv a0, s1
				; RV64I-NEXT: mv a1, s0
				; RV64I-NEXT: call __muldi3
				; RV64I-NEXT: srli a0, a0, 16
				; RV64I-NEXT: add a0, a0, s1
				; RV64I-NEXT: slli a0, a0, 48
				; RV64I-NEXT: srai a0, a0, 54
				; RV64I-NEXT: srli a1, a0, 15
				; RV64I-NEXT: andi a1, a1, 1
				; RV64I-NEXT: add s0, a0, a1
	; RV64I-NEXT: addi a1, zero, 95			; RV64I-NEXT: addi a1, zero, 95
	; RV64I-NEXT: mv a0, s2			; RV64I-NEXT: mv a0, s0
	; RV64I-NEXT: call __divdi3			; RV64I-NEXT: call __muldi3
	; RV64I-NEXT: add a0, s8, a0			; RV64I-NEXT: sub a0, s1, a0
	; RV64I-NEXT: add a1, s7, s1			; RV64I-NEXT: add a0, a0, s0
	; RV64I-NEXT: add a2, s6, s4			; RV64I-NEXT: add a1, s9, s6
	; RV64I-NEXT: add a3, s5, s9			; RV64I-NEXT: add a2, s8, s5
	; RV64I-NEXT: sh a3, 6(s0)			; RV64I-NEXT: add a3, s7, s2
	; RV64I-NEXT: sh a2, 4(s0)			; RV64I-NEXT: sh a3, 6(s3)
	; RV64I-NEXT: sh a1, 2(s0)			; RV64I-NEXT: sh a2, 4(s3)
	; RV64I-NEXT: sh a0, 0(s0)			; RV64I-NEXT: sh a1, 2(s3)
				; RV64I-NEXT: sh a0, 0(s3)
	; RV64I-NEXT: ld s9, 8(sp)			; RV64I-NEXT: ld s9, 8(sp)
	; RV64I-NEXT: ld s8, 16(sp)			; RV64I-NEXT: ld s8, 16(sp)
	; RV64I-NEXT: ld s7, 24(sp)			; RV64I-NEXT: ld s7, 24(sp)
	; RV64I-NEXT: ld s6, 32(sp)			; RV64I-NEXT: ld s6, 32(sp)
	; RV64I-NEXT: ld s5, 40(sp)			; RV64I-NEXT: ld s5, 40(sp)
	; RV64I-NEXT: ld s4, 48(sp)			; RV64I-NEXT: ld s4, 48(sp)
	; RV64I-NEXT: ld s3, 56(sp)			; RV64I-NEXT: ld s3, 56(sp)
	; RV64I-NEXT: ld s2, 64(sp)			; RV64I-NEXT: ld s2, 64(sp)
	; RV64I-NEXT: ld s1, 72(sp)			; RV64I-NEXT: ld s1, 72(sp)
	; RV64I-NEXT: ld s0, 80(sp)			; RV64I-NEXT: ld s0, 80(sp)
	; RV64I-NEXT: ld ra, 88(sp)			; RV64I-NEXT: ld ra, 88(sp)
	; RV64I-NEXT: addi sp, sp, 96			; RV64I-NEXT: addi sp, sp, 96
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IM-LABEL: combine_srem_sdiv:			; RV64IM-LABEL: combine_srem_sdiv:
	; RV64IM: # %bb.0:			; RV64IM: # %bb.0:
	; RV64IM-NEXT: lh a6, 0(a1)			; RV64IM-NEXT: lh a2, 24(a1)
	; RV64IM-NEXT: lh a7, 8(a1)			; RV64IM-NEXT: lui a3, 1048571
	; RV64IM-NEXT: lh a4, 16(a1)			; RV64IM-NEXT: addiw a3, a3, -905
	; RV64IM-NEXT: lh a1, 24(a1)			; RV64IM-NEXT: mul a4, a2, a3
	; RV64IM-NEXT: lui a5, 1045903			; RV64IM-NEXT: srli a4, a4, 16
	; RV64IM-NEXT: addiw a5, a5, -733			; RV64IM-NEXT: add a4, a4, a2
	; RV64IM-NEXT: slli a5, a5, 15			; RV64IM-NEXT: slli a4, a4, 48
	; RV64IM-NEXT: addi a5, a5, 1035			; RV64IM-NEXT: srai a4, a4, 54
	; RV64IM-NEXT: slli a5, a5, 12			; RV64IM-NEXT: srli a5, a4, 15
	; RV64IM-NEXT: addi a5, a5, -905			; RV64IM-NEXT: andi a5, a5, 1
	; RV64IM-NEXT: slli a5, a5, 12			; RV64IM-NEXT: add a7, a4, a5
	; RV64IM-NEXT: addi a5, a5, -1767			; RV64IM-NEXT: lh a5, 16(a1)
	; RV64IM-NEXT: mulh a2, a1, a5			; RV64IM-NEXT: addi a6, zero, 95
	; RV64IM-NEXT: add a2, a2, a1			; RV64IM-NEXT: mul a4, a7, a6
	; RV64IM-NEXT: srli a3, a2, 63			; RV64IM-NEXT: sub t0, a2, a4
	; RV64IM-NEXT: srai a2, a2, 6			; RV64IM-NEXT: mul a4, a5, a3
	; RV64IM-NEXT: add t3, a2, a3			; RV64IM-NEXT: srli a4, a4, 16
	; RV64IM-NEXT: addi t0, zero, 95			; RV64IM-NEXT: add a4, a4, a5
	; RV64IM-NEXT: mul a3, t3, t0			; RV64IM-NEXT: slli a4, a4, 48
	; RV64IM-NEXT: sub t1, a1, a3			; RV64IM-NEXT: srai a4, a4, 54
	; RV64IM-NEXT: mulh a3, a4, a5			; RV64IM-NEXT: srli a2, a4, 15
	; RV64IM-NEXT: add a3, a3, a4			; RV64IM-NEXT: andi t1, a2, 1
	; RV64IM-NEXT: srli a1, a3, 63			; RV64IM-NEXT: lh a2, 8(a1)
	; RV64IM-NEXT: srai a3, a3, 6			; RV64IM-NEXT: add t1, a4, t1
	; RV64IM-NEXT: add a1, a3, a1			; RV64IM-NEXT: mul a4, t1, a6
	; RV64IM-NEXT: mul a3, a1, t0			; RV64IM-NEXT: sub t2, a5, a4
	; RV64IM-NEXT: sub t2, a4, a3			; RV64IM-NEXT: mul a5, a2, a3
	; RV64IM-NEXT: mulh a4, a7, a5			; RV64IM-NEXT: srli a5, a5, 16
	; RV64IM-NEXT: add a4, a4, a7			; RV64IM-NEXT: add a5, a5, a2
	; RV64IM-NEXT: srli a3, a4, 63			; RV64IM-NEXT: slli a5, a5, 48
	; RV64IM-NEXT: srai a4, a4, 6			; RV64IM-NEXT: srai a5, a5, 54
	; RV64IM-NEXT: add a3, a4, a3			; RV64IM-NEXT: srli a4, a5, 15
	; RV64IM-NEXT: mul a4, a3, t0			; RV64IM-NEXT: andi a4, a4, 1
	; RV64IM-NEXT: sub a4, a7, a4			; RV64IM-NEXT: lh a1, 0(a1)
	; RV64IM-NEXT: mulh a5, a6, a5			; RV64IM-NEXT: add a4, a5, a4
	; RV64IM-NEXT: add a5, a5, a6			; RV64IM-NEXT: mul a5, a4, a6
	; RV64IM-NEXT: srli a2, a5, 63			; RV64IM-NEXT: sub a2, a2, a5
	; RV64IM-NEXT: srai a5, a5, 6			; RV64IM-NEXT: mul a3, a1, a3
	; RV64IM-NEXT: add a2, a5, a2			; RV64IM-NEXT: srli a3, a3, 16
	; RV64IM-NEXT: mul a5, a2, t0			; RV64IM-NEXT: add a3, a3, a1
	; RV64IM-NEXT: sub a5, a6, a5			; RV64IM-NEXT: slli a3, a3, 48
	; RV64IM-NEXT: add a2, a5, a2			; RV64IM-NEXT: srai a3, a3, 54
	; RV64IM-NEXT: add a3, a4, a3			; RV64IM-NEXT: srli a5, a3, 15
	; RV64IM-NEXT: add a1, t2, a1			; RV64IM-NEXT: andi a5, a5, 1
	; RV64IM-NEXT: add a4, t1, t3			; RV64IM-NEXT: add a3, a3, a5
				; RV64IM-NEXT: mul a5, a3, a6
				; RV64IM-NEXT: sub a1, a1, a5
				; RV64IM-NEXT: add a1, a1, a3
				; RV64IM-NEXT: add a2, a2, a4
				; RV64IM-NEXT: add a3, t2, t1
				; RV64IM-NEXT: add a4, t0, a7
	; RV64IM-NEXT: sh a4, 6(a0)			; RV64IM-NEXT: sh a4, 6(a0)
	; RV64IM-NEXT: sh a1, 4(a0)			; RV64IM-NEXT: sh a3, 4(a0)
	; RV64IM-NEXT: sh a3, 2(a0)			; RV64IM-NEXT: sh a2, 2(a0)
	; RV64IM-NEXT: sh a2, 0(a0)			; RV64IM-NEXT: sh a1, 0(a0)
	; RV64IM-NEXT: ret			; RV64IM-NEXT: ret
	%1 = srem <4 x i16> %x, <i16 95, i16 95, i16 95, i16 95>			%1 = srem <4 x i16> %x, <i16 95, i16 95, i16 95, i16 95>
	%2 = sdiv <4 x i16> %x, <i16 95, i16 95, i16 95, i16 95>			%2 = sdiv <4 x i16> %x, <i16 95, i16 95, i16 95, i16 95>
	%3 = add <4 x i16> %1, %2			%3 = add <4 x i16> %1, %2
	ret <4 x i16> %3			ret <4 x i16> %3
	}			}

	; Don't fold for divisors that are a power of two.			; Don't fold for divisors that are a power of two.
	define <4 x i16> @dont_fold_srem_power_of_two(<4 x i16> %x) nounwind {			define <4 x i16> @dont_fold_srem_power_of_two(<4 x i16> %x) nounwind {
	; RV32I-LABEL: dont_fold_srem_power_of_two:			; RV32I-LABEL: dont_fold_srem_power_of_two:
	; RV32I: # %bb.0:			; RV32I: # %bb.0:
	; RV32I-NEXT: addi sp, sp, -32			; RV32I-NEXT: addi sp, sp, -32
	; RV32I-NEXT: sw ra, 28(sp)			; RV32I-NEXT: sw ra, 28(sp)
	; RV32I-NEXT: sw s0, 24(sp)			; RV32I-NEXT: sw s0, 24(sp)
	; RV32I-NEXT: sw s1, 20(sp)			; RV32I-NEXT: sw s1, 20(sp)
	; RV32I-NEXT: sw s2, 16(sp)			; RV32I-NEXT: sw s2, 16(sp)
	; RV32I-NEXT: sw s3, 12(sp)			; RV32I-NEXT: sw s3, 12(sp)
	; RV32I-NEXT: mv s0, a0			; RV32I-NEXT: sw s4, 8(sp)
	; RV32I-NEXT: lh a2, 0(a1)			; RV32I-NEXT: lh a2, 0(a1)
	; RV32I-NEXT: lh a0, 12(a1)			; RV32I-NEXT: mv s0, a0
				; RV32I-NEXT: slli a0, a2, 15
				; RV32I-NEXT: sub a0, a2, a0
				; RV32I-NEXT: srli a0, a0, 16
				; RV32I-NEXT: add a0, a0, a2
				; RV32I-NEXT: slli a0, a0, 16
				; RV32I-NEXT: srai a0, a0, 21
				; RV32I-NEXT: srli a3, a0, 15
				; RV32I-NEXT: andi a3, a3, 1
				; RV32I-NEXT: lh a4, 4(a1)
				; RV32I-NEXT: add a0, a0, a3
				; RV32I-NEXT: slli a0, a0, 6
				; RV32I-NEXT: sub s2, a2, a0
				; RV32I-NEXT: slli a0, a4, 15
				; RV32I-NEXT: sub a0, a4, a0
				; RV32I-NEXT: srli a0, a0, 16
				; RV32I-NEXT: add a0, a0, a4
				; RV32I-NEXT: slli a0, a0, 16
				; RV32I-NEXT: srai a0, a0, 20
				; RV32I-NEXT: srli a2, a0, 15
				; RV32I-NEXT: andi a2, a2, 1
	; RV32I-NEXT: lh a3, 8(a1)			; RV32I-NEXT: lh a3, 8(a1)
	; RV32I-NEXT: lh a1, 4(a1)			; RV32I-NEXT: add a0, a0, a2
	; RV32I-NEXT: srli a4, a2, 26			; RV32I-NEXT: slli a0, a0, 5
	; RV32I-NEXT: add a4, a2, a4			; RV32I-NEXT: sub s3, a4, a0
	; RV32I-NEXT: lui a6, 16			; RV32I-NEXT: slli a0, a3, 15
	; RV32I-NEXT: addi a5, a6, -64			; RV32I-NEXT: sub a0, a3, a0
	; RV32I-NEXT: and a4, a4, a5			; RV32I-NEXT: srli a0, a0, 16
	; RV32I-NEXT: sub s2, a2, a4			; RV32I-NEXT: add a0, a0, a3
	; RV32I-NEXT: srli a2, a1, 27			; RV32I-NEXT: slli a0, a0, 16
	; RV32I-NEXT: add a2, a1, a2			; RV32I-NEXT: srai a0, a0, 18
	; RV32I-NEXT: addi a4, a6, -32			; RV32I-NEXT: srli a2, a0, 15
	; RV32I-NEXT: and a2, a2, a4			; RV32I-NEXT: andi a2, a2, 1
	; RV32I-NEXT: sub s3, a1, a2			; RV32I-NEXT: add a0, a0, a2
	; RV32I-NEXT: srli a1, a3, 29			; RV32I-NEXT: slli a0, a0, 3
	; RV32I-NEXT: add a1, a3, a1			; RV32I-NEXT: sub s4, a3, a0
	; RV32I-NEXT: addi a2, a6, -8			; RV32I-NEXT: lh s1, 12(a1)
	; RV32I-NEXT: and a1, a1, a2			; RV32I-NEXT: lui a0, 1048571
	; RV32I-NEXT: sub s1, a3, a1			; RV32I-NEXT: addi a1, a0, -905
				; RV32I-NEXT: mv a0, s1
				; RV32I-NEXT: call __mulsi3
				; RV32I-NEXT: srli a0, a0, 16
				; RV32I-NEXT: add a0, a0, s1
				; RV32I-NEXT: slli a0, a0, 16
				; RV32I-NEXT: srai a0, a0, 22
				; RV32I-NEXT: srli a1, a0, 15
				; RV32I-NEXT: andi a1, a1, 1
				; RV32I-NEXT: add a0, a0, a1
	; RV32I-NEXT: addi a1, zero, 95			; RV32I-NEXT: addi a1, zero, 95
	; RV32I-NEXT: call __modsi3			; RV32I-NEXT: call __mulsi3
				; RV32I-NEXT: sub a0, s1, a0
	; RV32I-NEXT: sh a0, 6(s0)			; RV32I-NEXT: sh a0, 6(s0)
	; RV32I-NEXT: sh s1, 4(s0)			; RV32I-NEXT: sh s4, 4(s0)
	; RV32I-NEXT: sh s3, 2(s0)			; RV32I-NEXT: sh s3, 2(s0)
	; RV32I-NEXT: sh s2, 0(s0)			; RV32I-NEXT: sh s2, 0(s0)
				; RV32I-NEXT: lw s4, 8(sp)
	; RV32I-NEXT: lw s3, 12(sp)			; RV32I-NEXT: lw s3, 12(sp)
	; RV32I-NEXT: lw s2, 16(sp)			; RV32I-NEXT: lw s2, 16(sp)
	; RV32I-NEXT: lw s1, 20(sp)			; RV32I-NEXT: lw s1, 20(sp)
	; RV32I-NEXT: lw s0, 24(sp)			; RV32I-NEXT: lw s0, 24(sp)
	; RV32I-NEXT: lw ra, 28(sp)			; RV32I-NEXT: lw ra, 28(sp)
	; RV32I-NEXT: addi sp, sp, 32			; RV32I-NEXT: addi sp, sp, 32
	; RV32I-NEXT: ret			; RV32I-NEXT: ret
	;			;
	; RV32IM-LABEL: dont_fold_srem_power_of_two:			; RV32IM-LABEL: dont_fold_srem_power_of_two:
	; RV32IM: # %bb.0:			; RV32IM: # %bb.0:
	; RV32IM-NEXT: lh a6, 8(a1)			; RV32IM-NEXT: lh a2, 0(a1)
	; RV32IM-NEXT: lh a3, 4(a1)			; RV32IM-NEXT: lui a3, 1048568
	; RV32IM-NEXT: lh a4, 12(a1)			; RV32IM-NEXT: addi a3, a3, 1
	; RV32IM-NEXT: lh a1, 0(a1)			; RV32IM-NEXT: mul a4, a2, a3
	; RV32IM-NEXT: lui a5, 706409			; RV32IM-NEXT: srli a4, a4, 16
	; RV32IM-NEXT: addi a5, a5, 389			; RV32IM-NEXT: add a4, a4, a2
	; RV32IM-NEXT: mulh a5, a4, a5			; RV32IM-NEXT: slli a4, a4, 16
	; RV32IM-NEXT: add a5, a5, a4			; RV32IM-NEXT: srai a4, a4, 21
	; RV32IM-NEXT: srli a2, a5, 31			; RV32IM-NEXT: srli a5, a4, 15
	; RV32IM-NEXT: srli a5, a5, 6			; RV32IM-NEXT: andi a6, a5, 1
	; RV32IM-NEXT: add a2, a5, a2			; RV32IM-NEXT: lh a5, 4(a1)
				; RV32IM-NEXT: add a4, a4, a6
				; RV32IM-NEXT: slli a4, a4, 6
				; RV32IM-NEXT: sub a6, a2, a4
				; RV32IM-NEXT: mul a4, a5, a3
				; RV32IM-NEXT: srli a4, a4, 16
				; RV32IM-NEXT: add a4, a4, a5
				; RV32IM-NEXT: slli a4, a4, 16
				; RV32IM-NEXT: srai a4, a4, 20
				; RV32IM-NEXT: srli a2, a4, 15
				; RV32IM-NEXT: andi a7, a2, 1
				; RV32IM-NEXT: lh a2, 8(a1)
				; RV32IM-NEXT: add a4, a4, a7
				; RV32IM-NEXT: slli a4, a4, 5
				; RV32IM-NEXT: sub a4, a5, a4
				; RV32IM-NEXT: mul a3, a2, a3
				; RV32IM-NEXT: srli a3, a3, 16
				; RV32IM-NEXT: add a3, a3, a2
				; RV32IM-NEXT: slli a3, a3, 16
				; RV32IM-NEXT: srai a3, a3, 18
				; RV32IM-NEXT: srli a5, a3, 15
				; RV32IM-NEXT: andi a5, a5, 1
				; RV32IM-NEXT: add a3, a3, a5
				; RV32IM-NEXT: slli a3, a3, 3
				; RV32IM-NEXT: lh a1, 12(a1)
				; RV32IM-NEXT: sub a2, a2, a3
				; RV32IM-NEXT: lui a3, 1048571
				; RV32IM-NEXT: addi a3, a3, -905
				; RV32IM-NEXT: mul a3, a1, a3
				; RV32IM-NEXT: srli a3, a3, 16
				; RV32IM-NEXT: add a3, a3, a1
				; RV32IM-NEXT: slli a3, a3, 16
				; RV32IM-NEXT: srai a3, a3, 22
				; RV32IM-NEXT: srli a5, a3, 15
				; RV32IM-NEXT: andi a5, a5, 1
				; RV32IM-NEXT: add a3, a3, a5
	; RV32IM-NEXT: addi a5, zero, 95			; RV32IM-NEXT: addi a5, zero, 95
	; RV32IM-NEXT: mul a2, a2, a5			; RV32IM-NEXT: mul a3, a3, a5
	; RV32IM-NEXT: sub a7, a4, a2			; RV32IM-NEXT: sub a1, a1, a3
	; RV32IM-NEXT: srli a4, a1, 26			; RV32IM-NEXT: sh a1, 6(a0)
	; RV32IM-NEXT: add a4, a1, a4			; RV32IM-NEXT: sh a2, 4(a0)
	; RV32IM-NEXT: lui a5, 16			; RV32IM-NEXT: sh a4, 2(a0)
	; RV32IM-NEXT: addi a2, a5, -64			; RV32IM-NEXT: sh a6, 0(a0)
	; RV32IM-NEXT: and a2, a4, a2
	; RV32IM-NEXT: sub a1, a1, a2
	; RV32IM-NEXT: srli a2, a3, 27
	; RV32IM-NEXT: add a2, a3, a2
	; RV32IM-NEXT: addi a4, a5, -32
	; RV32IM-NEXT: and a2, a2, a4
	; RV32IM-NEXT: sub a2, a3, a2
	; RV32IM-NEXT: srli a3, a6, 29
	; RV32IM-NEXT: add a3, a6, a3
	; RV32IM-NEXT: addi a4, a5, -8
	; RV32IM-NEXT: and a3, a3, a4
	; RV32IM-NEXT: sub a3, a6, a3
	; RV32IM-NEXT: sh a3, 4(a0)
	; RV32IM-NEXT: sh a2, 2(a0)
	; RV32IM-NEXT: sh a1, 0(a0)
	; RV32IM-NEXT: sh a7, 6(a0)
	; RV32IM-NEXT: ret			; RV32IM-NEXT: ret
	;			;
	; RV64I-LABEL: dont_fold_srem_power_of_two:			; RV64I-LABEL: dont_fold_srem_power_of_two:
	; RV64I: # %bb.0:			; RV64I: # %bb.0:
	; RV64I-NEXT: addi sp, sp, -48			; RV64I-NEXT: addi sp, sp, -48
	; RV64I-NEXT: sd ra, 40(sp)			; RV64I-NEXT: sd ra, 40(sp)
	; RV64I-NEXT: sd s0, 32(sp)			; RV64I-NEXT: sd s0, 32(sp)
	; RV64I-NEXT: sd s1, 24(sp)			; RV64I-NEXT: sd s1, 24(sp)
	; RV64I-NEXT: sd s2, 16(sp)			; RV64I-NEXT: sd s2, 16(sp)
	; RV64I-NEXT: sd s3, 8(sp)			; RV64I-NEXT: sd s3, 8(sp)
	; RV64I-NEXT: mv s0, a0			; RV64I-NEXT: sd s4, 0(sp)
	; RV64I-NEXT: lh a2, 0(a1)			; RV64I-NEXT: lh a2, 0(a1)
	; RV64I-NEXT: lh a0, 24(a1)			; RV64I-NEXT: mv s0, a0
				; RV64I-NEXT: slli a0, a2, 15
				; RV64I-NEXT: sub a0, a2, a0
				; RV64I-NEXT: srli a0, a0, 16
				; RV64I-NEXT: add a0, a0, a2
				; RV64I-NEXT: slli a0, a0, 48
				; RV64I-NEXT: srai a0, a0, 53
				; RV64I-NEXT: srli a3, a0, 15
				; RV64I-NEXT: andi a3, a3, 1
				; RV64I-NEXT: lh a4, 8(a1)
				; RV64I-NEXT: add a0, a0, a3
				; RV64I-NEXT: slli a0, a0, 6
				; RV64I-NEXT: sub s2, a2, a0
				; RV64I-NEXT: slli a0, a4, 15
				; RV64I-NEXT: sub a0, a4, a0
				; RV64I-NEXT: srli a0, a0, 16
				; RV64I-NEXT: add a0, a0, a4
				; RV64I-NEXT: slli a0, a0, 48
				; RV64I-NEXT: srai a0, a0, 52
				; RV64I-NEXT: srli a2, a0, 15
				; RV64I-NEXT: andi a2, a2, 1
	; RV64I-NEXT: lh a3, 16(a1)			; RV64I-NEXT: lh a3, 16(a1)
	; RV64I-NEXT: lh a1, 8(a1)			; RV64I-NEXT: add a0, a0, a2
	; RV64I-NEXT: srli a4, a2, 58			; RV64I-NEXT: slli a0, a0, 5
	; RV64I-NEXT: add a4, a2, a4			; RV64I-NEXT: sub s3, a4, a0
	; RV64I-NEXT: lui a6, 16			; RV64I-NEXT: slli a0, a3, 15
	; RV64I-NEXT: addiw a5, a6, -64			; RV64I-NEXT: sub a0, a3, a0
	; RV64I-NEXT: and a4, a4, a5			; RV64I-NEXT: srli a0, a0, 16
	; RV64I-NEXT: sub s2, a2, a4			; RV64I-NEXT: add a0, a0, a3
	; RV64I-NEXT: srli a2, a1, 59			; RV64I-NEXT: slli a0, a0, 48
	; RV64I-NEXT: add a2, a1, a2			; RV64I-NEXT: srai a0, a0, 50
	; RV64I-NEXT: addiw a4, a6, -32			; RV64I-NEXT: srli a2, a0, 15
	; RV64I-NEXT: and a2, a2, a4			; RV64I-NEXT: andi a2, a2, 1
	; RV64I-NEXT: sub s3, a1, a2			; RV64I-NEXT: add a0, a0, a2
	; RV64I-NEXT: srli a1, a3, 61			; RV64I-NEXT: slli a0, a0, 3
	; RV64I-NEXT: add a1, a3, a1			; RV64I-NEXT: sub s4, a3, a0
	; RV64I-NEXT: addiw a2, a6, -8			; RV64I-NEXT: lh s1, 24(a1)
	; RV64I-NEXT: and a1, a1, a2			; RV64I-NEXT: lui a0, 1048571
	; RV64I-NEXT: sub s1, a3, a1			; RV64I-NEXT: addiw a1, a0, -905
				; RV64I-NEXT: mv a0, s1
				; RV64I-NEXT: call __muldi3
				; RV64I-NEXT: srli a0, a0, 16
				; RV64I-NEXT: add a0, a0, s1
				; RV64I-NEXT: slli a0, a0, 48
				; RV64I-NEXT: srai a0, a0, 54
				; RV64I-NEXT: srli a1, a0, 15
				; RV64I-NEXT: andi a1, a1, 1
				; RV64I-NEXT: add a0, a0, a1
	; RV64I-NEXT: addi a1, zero, 95			; RV64I-NEXT: addi a1, zero, 95
	; RV64I-NEXT: call __moddi3			; RV64I-NEXT: call __muldi3
				; RV64I-NEXT: sub a0, s1, a0
	; RV64I-NEXT: sh a0, 6(s0)			; RV64I-NEXT: sh a0, 6(s0)
	; RV64I-NEXT: sh s1, 4(s0)			; RV64I-NEXT: sh s4, 4(s0)
	; RV64I-NEXT: sh s3, 2(s0)			; RV64I-NEXT: sh s3, 2(s0)
	; RV64I-NEXT: sh s2, 0(s0)			; RV64I-NEXT: sh s2, 0(s0)
				; RV64I-NEXT: ld s4, 0(sp)
	; RV64I-NEXT: ld s3, 8(sp)			; RV64I-NEXT: ld s3, 8(sp)
	; RV64I-NEXT: ld s2, 16(sp)			; RV64I-NEXT: ld s2, 16(sp)
	; RV64I-NEXT: ld s1, 24(sp)			; RV64I-NEXT: ld s1, 24(sp)
	; RV64I-NEXT: ld s0, 32(sp)			; RV64I-NEXT: ld s0, 32(sp)
	; RV64I-NEXT: ld ra, 40(sp)			; RV64I-NEXT: ld ra, 40(sp)
	; RV64I-NEXT: addi sp, sp, 48			; RV64I-NEXT: addi sp, sp, 48
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IM-LABEL: dont_fold_srem_power_of_two:			; RV64IM-LABEL: dont_fold_srem_power_of_two:
	; RV64IM: # %bb.0:			; RV64IM: # %bb.0:
	; RV64IM-NEXT: lh a6, 16(a1)			; RV64IM-NEXT: lh a2, 0(a1)
	; RV64IM-NEXT: lh a3, 8(a1)			; RV64IM-NEXT: slli a3, a2, 15
	; RV64IM-NEXT: lh a4, 0(a1)			; RV64IM-NEXT: sub a3, a2, a3
				; RV64IM-NEXT: srli a3, a3, 16
				; RV64IM-NEXT: add a3, a3, a2
				; RV64IM-NEXT: slli a3, a3, 48
				; RV64IM-NEXT: srai a3, a3, 53
				; RV64IM-NEXT: srli a4, a3, 15
				; RV64IM-NEXT: andi a4, a4, 1
				; RV64IM-NEXT: lh a5, 8(a1)
				; RV64IM-NEXT: add a3, a3, a4
				; RV64IM-NEXT: slli a3, a3, 6
				; RV64IM-NEXT: sub a6, a2, a3
				; RV64IM-NEXT: slli a3, a5, 15
				; RV64IM-NEXT: sub a3, a5, a3
				; RV64IM-NEXT: srli a3, a3, 16
				; RV64IM-NEXT: add a3, a3, a5
				; RV64IM-NEXT: slli a3, a3, 48
				; RV64IM-NEXT: srai a3, a3, 52
				; RV64IM-NEXT: srli a4, a3, 15
				; RV64IM-NEXT: andi a4, a4, 1
				; RV64IM-NEXT: lh a2, 16(a1)
				; RV64IM-NEXT: add a3, a3, a4
				; RV64IM-NEXT: slli a3, a3, 5
				; RV64IM-NEXT: sub a3, a5, a3
				; RV64IM-NEXT: slli a4, a2, 15
				; RV64IM-NEXT: sub a4, a2, a4
				; RV64IM-NEXT: srli a4, a4, 16
				; RV64IM-NEXT: add a4, a4, a2
				; RV64IM-NEXT: slli a4, a4, 48
				; RV64IM-NEXT: srai a4, a4, 50
				; RV64IM-NEXT: srli a5, a4, 15
				; RV64IM-NEXT: andi a5, a5, 1
				; RV64IM-NEXT: add a4, a4, a5
				; RV64IM-NEXT: slli a4, a4, 3
	; RV64IM-NEXT: lh a1, 24(a1)			; RV64IM-NEXT: lh a1, 24(a1)
	; RV64IM-NEXT: lui a5, 1045903			; RV64IM-NEXT: sub a2, a2, a4
	; RV64IM-NEXT: addiw a5, a5, -733			; RV64IM-NEXT: lui a4, 1048571
	; RV64IM-NEXT: slli a5, a5, 15			; RV64IM-NEXT: addiw a4, a4, -905
	; RV64IM-NEXT: addi a5, a5, 1035			; RV64IM-NEXT: mul a4, a1, a4
	; RV64IM-NEXT: slli a5, a5, 12			; RV64IM-NEXT: srli a4, a4, 16
	; RV64IM-NEXT: addi a5, a5, -905			; RV64IM-NEXT: add a4, a4, a1
	; RV64IM-NEXT: slli a5, a5, 12			; RV64IM-NEXT: slli a4, a4, 48
	; RV64IM-NEXT: addi a5, a5, -1767			; RV64IM-NEXT: srai a4, a4, 54
	; RV64IM-NEXT: mulh a5, a1, a5			; RV64IM-NEXT: srli a5, a4, 15
	; RV64IM-NEXT: add a5, a5, a1			; RV64IM-NEXT: andi a5, a5, 1
	; RV64IM-NEXT: srli a2, a5, 63			; RV64IM-NEXT: add a4, a4, a5
	; RV64IM-NEXT: srli a5, a5, 6
	; RV64IM-NEXT: add a2, a5, a2
	; RV64IM-NEXT: addi a5, zero, 95			; RV64IM-NEXT: addi a5, zero, 95
	; RV64IM-NEXT: mul a2, a2, a5			; RV64IM-NEXT: mul a4, a4, a5
	; RV64IM-NEXT: sub a7, a1, a2			; RV64IM-NEXT: sub a1, a1, a4
	; RV64IM-NEXT: srli a2, a4, 58			; RV64IM-NEXT: sh a1, 6(a0)
	; RV64IM-NEXT: add a2, a4, a2			; RV64IM-NEXT: sh a2, 4(a0)
	; RV64IM-NEXT: lui a5, 16			; RV64IM-NEXT: sh a3, 2(a0)
	; RV64IM-NEXT: addiw a1, a5, -64			; RV64IM-NEXT: sh a6, 0(a0)
	; RV64IM-NEXT: and a1, a2, a1
	; RV64IM-NEXT: sub a1, a4, a1
	; RV64IM-NEXT: srli a2, a3, 59
	; RV64IM-NEXT: add a2, a3, a2
	; RV64IM-NEXT: addiw a4, a5, -32
	; RV64IM-NEXT: and a2, a2, a4
	; RV64IM-NEXT: sub a2, a3, a2
	; RV64IM-NEXT: srli a3, a6, 61
	; RV64IM-NEXT: add a3, a6, a3
	; RV64IM-NEXT: addiw a4, a5, -8
	; RV64IM-NEXT: and a3, a3, a4
	; RV64IM-NEXT: sub a3, a6, a3
	; RV64IM-NEXT: sh a3, 4(a0)
	; RV64IM-NEXT: sh a2, 2(a0)
	; RV64IM-NEXT: sh a1, 0(a0)
	; RV64IM-NEXT: sh a7, 6(a0)
	; RV64IM-NEXT: ret			; RV64IM-NEXT: ret
	%1 = srem <4 x i16> %x, <i16 64, i16 32, i16 8, i16 95>			%1 = srem <4 x i16> %x, <i16 64, i16 32, i16 8, i16 95>
	ret <4 x i16> %1			ret <4 x i16> %1
	}			}

	; Don't fold if the divisor is one.			; Don't fold if the divisor is one.
	define <4 x i16> @dont_fold_srem_one(<4 x i16> %x) nounwind {			define <4 x i16> @dont_fold_srem_one(<4 x i16> %x) nounwind {
	; RV32I-LABEL: dont_fold_srem_one:			; RV32I-LABEL: dont_fold_srem_one:
	; RV32I: # %bb.0:			; RV32I: # %bb.0:
	; RV32I-NEXT: addi sp, sp, -32			; RV32I-NEXT: addi sp, sp, -32
	; RV32I-NEXT: sw ra, 28(sp)			; RV32I-NEXT: sw ra, 28(sp)
	; RV32I-NEXT: sw s0, 24(sp)			; RV32I-NEXT: sw s0, 24(sp)
	; RV32I-NEXT: sw s1, 20(sp)			; RV32I-NEXT: sw s1, 20(sp)
	; RV32I-NEXT: sw s2, 16(sp)			; RV32I-NEXT: sw s2, 16(sp)
	; RV32I-NEXT: sw s3, 12(sp)			; RV32I-NEXT: sw s3, 12(sp)
	; RV32I-NEXT: lh s2, 12(a1)			; RV32I-NEXT: sw s4, 8(sp)
	; RV32I-NEXT: lh s1, 8(a1)			; RV32I-NEXT: sw s5, 4(sp)
	; RV32I-NEXT: lh a2, 4(a1)			; RV32I-NEXT: mv s1, a1
	; RV32I-NEXT: mv s0, a0			; RV32I-NEXT: mv s2, a0
	; RV32I-NEXT: addi a1, zero, 654			; RV32I-NEXT: lh s0, 8(a1)
	; RV32I-NEXT: mv a0, a2			; RV32I-NEXT: lui a0, 1048571
	; RV32I-NEXT: call __modsi3			; RV32I-NEXT: addi a1, a0, 535
	; RV32I-NEXT: mv s3, a0			; RV32I-NEXT: mv a0, s0
				; RV32I-NEXT: call __mulsi3
				; RV32I-NEXT: srli a0, a0, 16
				; RV32I-NEXT: add a0, a0, s0
				; RV32I-NEXT: slli a0, a0, 16
				; RV32I-NEXT: srai a0, a0, 20
				; RV32I-NEXT: srli a1, a0, 15
				; RV32I-NEXT: andi a1, a1, 1
				; RV32I-NEXT: add a0, a0, a1
	; RV32I-NEXT: addi a1, zero, 23			; RV32I-NEXT: addi a1, zero, 23
	; RV32I-NEXT: mv a0, s1			; RV32I-NEXT: call __mulsi3
	; RV32I-NEXT: call __modsi3			; RV32I-NEXT: sub s3, s0, a0
	; RV32I-NEXT: mv s1, a0			; RV32I-NEXT: lh s0, 4(s1)
	; RV32I-NEXT: lui a0, 1			; RV32I-NEXT: lui s4, 3
	; RV32I-NEXT: addi a1, a0, 1327			; RV32I-NEXT: addi a1, s4, 539
	; RV32I-NEXT: mv a0, s2			; RV32I-NEXT: mv a0, s0
	; RV32I-NEXT: call __modsi3			; RV32I-NEXT: call __mulsi3
	; RV32I-NEXT: sh zero, 0(s0)			; RV32I-NEXT: srai a0, a0, 23
	; RV32I-NEXT: sh a0, 6(s0)			; RV32I-NEXT: srli a1, a0, 15
	; RV32I-NEXT: sh s1, 4(s0)			; RV32I-NEXT: andi a1, a1, 1
	; RV32I-NEXT: sh s3, 2(s0)			; RV32I-NEXT: add a0, a0, a1
				; RV32I-NEXT: addi a1, zero, 654
				; RV32I-NEXT: call __mulsi3
				; RV32I-NEXT: sub s5, s0, a0
				; RV32I-NEXT: lh s0, 12(s1)
				; RV32I-NEXT: addi a1, s4, 87
				; RV32I-NEXT: mv a0, s0
				; RV32I-NEXT: call __mulsi3
				; RV32I-NEXT: srai a0, a0, 26
				; RV32I-NEXT: srli a1, a0, 15
				; RV32I-NEXT: andi a1, a1, 1
				; RV32I-NEXT: add a0, a0, a1
				; RV32I-NEXT: lui a1, 1
				; RV32I-NEXT: addi a1, a1, 1327
				; RV32I-NEXT: call __mulsi3
				; RV32I-NEXT: sub a0, s0, a0
				; RV32I-NEXT: sh zero, 0(s2)
				; RV32I-NEXT: sh a0, 6(s2)
				; RV32I-NEXT: sh s5, 2(s2)
				; RV32I-NEXT: sh s3, 4(s2)
				; RV32I-NEXT: lw s5, 4(sp)
				; RV32I-NEXT: lw s4, 8(sp)
	; RV32I-NEXT: lw s3, 12(sp)			; RV32I-NEXT: lw s3, 12(sp)
	; RV32I-NEXT: lw s2, 16(sp)			; RV32I-NEXT: lw s2, 16(sp)
	; RV32I-NEXT: lw s1, 20(sp)			; RV32I-NEXT: lw s1, 20(sp)
	; RV32I-NEXT: lw s0, 24(sp)			; RV32I-NEXT: lw s0, 24(sp)
	; RV32I-NEXT: lw ra, 28(sp)			; RV32I-NEXT: lw ra, 28(sp)
	; RV32I-NEXT: addi sp, sp, 32			; RV32I-NEXT: addi sp, sp, 32
	; RV32I-NEXT: ret			; RV32I-NEXT: ret
	;			;
	; RV32IM-LABEL: dont_fold_srem_one:			; RV32IM-LABEL: dont_fold_srem_one:
	; RV32IM: # %bb.0:			; RV32IM: # %bb.0:
	; RV32IM-NEXT: lh a2, 12(a1)			; RV32IM-NEXT: lh a2, 8(a1)
	; RV32IM-NEXT: lh a3, 4(a1)			; RV32IM-NEXT: lui a3, 1048571
	; RV32IM-NEXT: lh a1, 8(a1)			; RV32IM-NEXT: addi a3, a3, 535
	; RV32IM-NEXT: lui a4, 820904			; RV32IM-NEXT: mul a3, a2, a3
	; RV32IM-NEXT: addi a4, a4, -1903			; RV32IM-NEXT: srli a3, a3, 16
	; RV32IM-NEXT: mulh a4, a3, a4			; RV32IM-NEXT: add a3, a3, a2
	; RV32IM-NEXT: add a4, a4, a3			; RV32IM-NEXT: slli a3, a3, 16
	; RV32IM-NEXT: srli a5, a4, 31			; RV32IM-NEXT: srai a3, a3, 20
	; RV32IM-NEXT: srli a4, a4, 9			; RV32IM-NEXT: srli a4, a3, 15
	; RV32IM-NEXT: add a4, a4, a5			; RV32IM-NEXT: andi a4, a4, 1
				; RV32IM-NEXT: add a3, a3, a4
				; RV32IM-NEXT: addi a4, zero, 23
				; RV32IM-NEXT: mul a3, a3, a4
				; RV32IM-NEXT: lh a4, 4(a1)
				; RV32IM-NEXT: sub a6, a2, a3
				; RV32IM-NEXT: lui a3, 3
				; RV32IM-NEXT: addi a5, a3, 539
				; RV32IM-NEXT: mul a5, a4, a5
				; RV32IM-NEXT: srai a5, a5, 23
				; RV32IM-NEXT: srli a2, a5, 15
				; RV32IM-NEXT: andi a2, a2, 1
				; RV32IM-NEXT: add a2, a5, a2
	; RV32IM-NEXT: addi a5, zero, 654			; RV32IM-NEXT: addi a5, zero, 654
	; RV32IM-NEXT: mul a4, a4, a5			; RV32IM-NEXT: lh a1, 12(a1)
	; RV32IM-NEXT: sub a3, a3, a4			; RV32IM-NEXT: mul a2, a2, a5
	; RV32IM-NEXT: lui a4, 729444			; RV32IM-NEXT: sub a2, a4, a2
	; RV32IM-NEXT: addi a4, a4, 713			; RV32IM-NEXT: addi a3, a3, 87
	; RV32IM-NEXT: mulh a4, a1, a4			; RV32IM-NEXT: mul a3, a1, a3
	; RV32IM-NEXT: add a4, a4, a1			; RV32IM-NEXT: srai a3, a3, 26
	; RV32IM-NEXT: srli a5, a4, 31			; RV32IM-NEXT: srli a4, a3, 15
	; RV32IM-NEXT: srli a4, a4, 4			; RV32IM-NEXT: andi a4, a4, 1
	; RV32IM-NEXT: add a4, a4, a5			; RV32IM-NEXT: add a3, a3, a4
	; RV32IM-NEXT: addi a5, zero, 23			; RV32IM-NEXT: lui a4, 1
	; RV32IM-NEXT: mul a4, a4, a5			; RV32IM-NEXT: addi a4, a4, 1327
	; RV32IM-NEXT: sub a1, a1, a4			; RV32IM-NEXT: mul a3, a3, a4
	; RV32IM-NEXT: lui a4, 395996			; RV32IM-NEXT: sub a1, a1, a3
	; RV32IM-NEXT: addi a4, a4, -2009
	; RV32IM-NEXT: mulh a4, a2, a4
	; RV32IM-NEXT: srli a5, a4, 31
	; RV32IM-NEXT: srli a4, a4, 11
	; RV32IM-NEXT: add a4, a4, a5
	; RV32IM-NEXT: lui a5, 1
	; RV32IM-NEXT: addi a5, a5, 1327
	; RV32IM-NEXT: mul a4, a4, a5
	; RV32IM-NEXT: sub a2, a2, a4
	; RV32IM-NEXT: sh zero, 0(a0)			; RV32IM-NEXT: sh zero, 0(a0)
	; RV32IM-NEXT: sh a2, 6(a0)			; RV32IM-NEXT: sh a1, 6(a0)
	; RV32IM-NEXT: sh a1, 4(a0)			; RV32IM-NEXT: sh a2, 2(a0)
	; RV32IM-NEXT: sh a3, 2(a0)			; RV32IM-NEXT: sh a6, 4(a0)
	; RV32IM-NEXT: ret			; RV32IM-NEXT: ret
	;			;
	; RV64I-LABEL: dont_fold_srem_one:			; RV64I-LABEL: dont_fold_srem_one:
	; RV64I: # %bb.0:			; RV64I: # %bb.0:
	; RV64I-NEXT: addi sp, sp, -48			; RV64I-NEXT: addi sp, sp, -64
	; RV64I-NEXT: sd ra, 40(sp)			; RV64I-NEXT: sd ra, 56(sp)
	; RV64I-NEXT: sd s0, 32(sp)			; RV64I-NEXT: sd s0, 48(sp)
	; RV64I-NEXT: sd s1, 24(sp)			; RV64I-NEXT: sd s1, 40(sp)
	; RV64I-NEXT: sd s2, 16(sp)			; RV64I-NEXT: sd s2, 32(sp)
	; RV64I-NEXT: sd s3, 8(sp)			; RV64I-NEXT: sd s3, 24(sp)
	; RV64I-NEXT: lh s2, 24(a1)			; RV64I-NEXT: sd s4, 16(sp)
	; RV64I-NEXT: lh s1, 16(a1)			; RV64I-NEXT: sd s5, 8(sp)
	; RV64I-NEXT: lh a2, 8(a1)			; RV64I-NEXT: mv s1, a1
	; RV64I-NEXT: mv s0, a0			; RV64I-NEXT: mv s2, a0
	; RV64I-NEXT: addi a1, zero, 654			; RV64I-NEXT: lh s0, 16(a1)
	; RV64I-NEXT: mv a0, a2			; RV64I-NEXT: lui a0, 1048571
	; RV64I-NEXT: call __moddi3			; RV64I-NEXT: addiw a1, a0, 535
	; RV64I-NEXT: mv s3, a0			; RV64I-NEXT: mv a0, s0
				; RV64I-NEXT: call __muldi3
				; RV64I-NEXT: srli a0, a0, 16
				; RV64I-NEXT: add a0, a0, s0
				; RV64I-NEXT: slli a0, a0, 48
				; RV64I-NEXT: srai a0, a0, 52
				; RV64I-NEXT: srli a1, a0, 15
				; RV64I-NEXT: andi a1, a1, 1
				; RV64I-NEXT: add a0, a0, a1
	; RV64I-NEXT: addi a1, zero, 23			; RV64I-NEXT: addi a1, zero, 23
	; RV64I-NEXT: mv a0, s1			; RV64I-NEXT: call __muldi3
	; RV64I-NEXT: call __moddi3			; RV64I-NEXT: sub s3, s0, a0
	; RV64I-NEXT: mv s1, a0			; RV64I-NEXT: lh s0, 8(s1)
	; RV64I-NEXT: lui a0, 1			; RV64I-NEXT: lui s4, 3
	; RV64I-NEXT: addiw a1, a0, 1327			; RV64I-NEXT: addiw a1, s4, 539
	; RV64I-NEXT: mv a0, s2			; RV64I-NEXT: mv a0, s0
	; RV64I-NEXT: call __moddi3			; RV64I-NEXT: call __muldi3
	; RV64I-NEXT: sh zero, 0(s0)			; RV64I-NEXT: srai a0, a0, 23
	; RV64I-NEXT: sh a0, 6(s0)			; RV64I-NEXT: srli a1, a0, 15
	; RV64I-NEXT: sh s1, 4(s0)			; RV64I-NEXT: andi a1, a1, 1
	; RV64I-NEXT: sh s3, 2(s0)			; RV64I-NEXT: add a0, a0, a1
	; RV64I-NEXT: ld s3, 8(sp)			; RV64I-NEXT: addi a1, zero, 654
	; RV64I-NEXT: ld s2, 16(sp)			; RV64I-NEXT: call __muldi3
	; RV64I-NEXT: ld s1, 24(sp)			; RV64I-NEXT: sub s5, s0, a0
	; RV64I-NEXT: ld s0, 32(sp)			; RV64I-NEXT: lh s0, 24(s1)
	; RV64I-NEXT: ld ra, 40(sp)			; RV64I-NEXT: addiw a1, s4, 87
	; RV64I-NEXT: addi sp, sp, 48			; RV64I-NEXT: mv a0, s0
				; RV64I-NEXT: call __muldi3
				; RV64I-NEXT: srai a0, a0, 26
				; RV64I-NEXT: srli a1, a0, 15
				; RV64I-NEXT: andi a1, a1, 1
				; RV64I-NEXT: add a0, a0, a1
				; RV64I-NEXT: lui a1, 1
				; RV64I-NEXT: addiw a1, a1, 1327
				; RV64I-NEXT: call __muldi3
				; RV64I-NEXT: sub a0, s0, a0
				; RV64I-NEXT: sh zero, 0(s2)
				; RV64I-NEXT: sh a0, 6(s2)
				; RV64I-NEXT: sh s5, 2(s2)
				; RV64I-NEXT: sh s3, 4(s2)
				; RV64I-NEXT: ld s5, 8(sp)
				; RV64I-NEXT: ld s4, 16(sp)
				; RV64I-NEXT: ld s3, 24(sp)
				; RV64I-NEXT: ld s2, 32(sp)
				; RV64I-NEXT: ld s1, 40(sp)
				; RV64I-NEXT: ld s0, 48(sp)
				; RV64I-NEXT: ld ra, 56(sp)
				; RV64I-NEXT: addi sp, sp, 64
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IM-LABEL: dont_fold_srem_one:			; RV64IM-LABEL: dont_fold_srem_one:
	; RV64IM: # %bb.0:			; RV64IM: # %bb.0:
	; RV64IM-NEXT: lh a2, 24(a1)			; RV64IM-NEXT: lh a2, 16(a1)
	; RV64IM-NEXT: lh a3, 8(a1)			; RV64IM-NEXT: lui a3, 1048571
	; RV64IM-NEXT: lh a1, 16(a1)			; RV64IM-NEXT: addiw a3, a3, 535
	; RV64IM-NEXT: lui a4, 1043590			; RV64IM-NEXT: mul a3, a2, a3
	; RV64IM-NEXT: addiw a4, a4, -1781			; RV64IM-NEXT: srli a3, a3, 16
	; RV64IM-NEXT: slli a4, a4, 13			; RV64IM-NEXT: add a3, a3, a2
	; RV64IM-NEXT: addi a4, a4, 1069			; RV64IM-NEXT: slli a3, a3, 48
	; RV64IM-NEXT: slli a4, a4, 12			; RV64IM-NEXT: srai a3, a3, 52
	; RV64IM-NEXT: addi a4, a4, -1959			; RV64IM-NEXT: srli a4, a3, 15
	; RV64IM-NEXT: slli a4, a4, 13			; RV64IM-NEXT: andi a4, a4, 1
	; RV64IM-NEXT: addi a4, a4, 357			; RV64IM-NEXT: add a3, a3, a4
	; RV64IM-NEXT: mulh a4, a1, a4			; RV64IM-NEXT: addi a4, zero, 23
	; RV64IM-NEXT: add a4, a4, a1			; RV64IM-NEXT: mul a3, a3, a4
	; RV64IM-NEXT: srli a5, a4, 63			; RV64IM-NEXT: lh a4, 8(a1)
	; RV64IM-NEXT: srli a4, a4, 4			; RV64IM-NEXT: sub a6, a2, a3
	; RV64IM-NEXT: add a4, a4, a5			; RV64IM-NEXT: lui a3, 3
	; RV64IM-NEXT: addi a5, zero, 23			; RV64IM-NEXT: addiw a5, a3, 539
	; RV64IM-NEXT: mul a4, a4, a5			; RV64IM-NEXT: mul a5, a4, a5
	; RV64IM-NEXT: sub a1, a1, a4			; RV64IM-NEXT: srai a5, a5, 23
	; RV64IM-NEXT: lui a4, 6413			; RV64IM-NEXT: srli a2, a5, 15
	; RV64IM-NEXT: addiw a4, a4, 1265			; RV64IM-NEXT: andi a2, a2, 1
	; RV64IM-NEXT: slli a4, a4, 13			; RV64IM-NEXT: add a2, a5, a2
	; RV64IM-NEXT: addi a4, a4, 1027
	; RV64IM-NEXT: slli a4, a4, 13
	; RV64IM-NEXT: addi a4, a4, 1077
	; RV64IM-NEXT: slli a4, a4, 12
	; RV64IM-NEXT: addi a4, a4, 965
	; RV64IM-NEXT: mulh a4, a3, a4
	; RV64IM-NEXT: srli a5, a4, 63
	; RV64IM-NEXT: srli a4, a4, 8
	; RV64IM-NEXT: add a4, a4, a5
	; RV64IM-NEXT: addi a5, zero, 654			; RV64IM-NEXT: addi a5, zero, 654
	; RV64IM-NEXT: mul a4, a4, a5			; RV64IM-NEXT: lh a1, 24(a1)
	; RV64IM-NEXT: sub a3, a3, a4			; RV64IM-NEXT: mul a2, a2, a5
	; RV64IM-NEXT: lui a4, 12375			; RV64IM-NEXT: sub a2, a4, a2
	; RV64IM-NEXT: addiw a4, a4, -575			; RV64IM-NEXT: addiw a3, a3, 87
	; RV64IM-NEXT: slli a4, a4, 12			; RV64IM-NEXT: mul a3, a1, a3
	; RV64IM-NEXT: addi a4, a4, 883			; RV64IM-NEXT: srai a3, a3, 26
	; RV64IM-NEXT: slli a4, a4, 13			; RV64IM-NEXT: srli a4, a3, 15
	; RV64IM-NEXT: addi a4, a4, -431			; RV64IM-NEXT: andi a4, a4, 1
	; RV64IM-NEXT: slli a4, a4, 12			; RV64IM-NEXT: add a3, a3, a4
	; RV64IM-NEXT: addi a4, a4, 1959			; RV64IM-NEXT: lui a4, 1
	; RV64IM-NEXT: mulh a4, a2, a4			; RV64IM-NEXT: addiw a4, a4, 1327
	; RV64IM-NEXT: srli a5, a4, 63			; RV64IM-NEXT: mul a3, a3, a4
	; RV64IM-NEXT: srli a4, a4, 11			; RV64IM-NEXT: sub a1, a1, a3
	; RV64IM-NEXT: add a4, a4, a5
	; RV64IM-NEXT: lui a5, 1
	; RV64IM-NEXT: addiw a5, a5, 1327
	; RV64IM-NEXT: mul a4, a4, a5
	; RV64IM-NEXT: sub a2, a2, a4
	; RV64IM-NEXT: sh zero, 0(a0)			; RV64IM-NEXT: sh zero, 0(a0)
	; RV64IM-NEXT: sh a2, 6(a0)			; RV64IM-NEXT: sh a1, 6(a0)
	; RV64IM-NEXT: sh a3, 2(a0)			; RV64IM-NEXT: sh a2, 2(a0)
	; RV64IM-NEXT: sh a1, 4(a0)			; RV64IM-NEXT: sh a6, 4(a0)
	; RV64IM-NEXT: ret			; RV64IM-NEXT: ret
	%1 = srem <4 x i16> %x, <i16 1, i16 654, i16 23, i16 5423>			%1 = srem <4 x i16> %x, <i16 1, i16 654, i16 23, i16 5423>
	ret <4 x i16> %1			ret <4 x i16> %1
	}			}

	; Don't fold if the divisor is 2^15.			; Don't fold if the divisor is 2^15.
	define <4 x i16> @dont_fold_urem_i16_smax(<4 x i16> %x) nounwind {			define <4 x i16> @dont_fold_urem_i16_smax(<4 x i16> %x) nounwind {
	; RV32I-LABEL: dont_fold_urem_i16_smax:			; RV32I-LABEL: dont_fold_urem_i16_smax:
	; RV32I: # %bb.0:			; RV32I: # %bb.0:
	; RV32I-NEXT: addi sp, sp, -32			; RV32I-NEXT: addi sp, sp, -32
	; RV32I-NEXT: sw ra, 28(sp)			; RV32I-NEXT: sw ra, 28(sp)
	; RV32I-NEXT: sw s0, 24(sp)			; RV32I-NEXT: sw s0, 24(sp)
	; RV32I-NEXT: sw s1, 20(sp)			; RV32I-NEXT: sw s1, 20(sp)
	; RV32I-NEXT: sw s2, 16(sp)			; RV32I-NEXT: sw s2, 16(sp)
	; RV32I-NEXT: sw s3, 12(sp)			; RV32I-NEXT: sw s3, 12(sp)
	; RV32I-NEXT: lh a2, 4(a1)			; RV32I-NEXT: mv s0, a1
	; RV32I-NEXT: mv s0, a0			; RV32I-NEXT: lh a1, 4(a1)
	; RV32I-NEXT: lh s2, 12(a1)			; RV32I-NEXT: mv s2, a0
	; RV32I-NEXT: lh a0, 8(a1)			; RV32I-NEXT: slli a0, a1, 15
	; RV32I-NEXT: srli a1, a2, 17			; RV32I-NEXT: sub a0, a0, a1
	; RV32I-NEXT: add a1, a2, a1			; RV32I-NEXT: srli a0, a0, 16
	; RV32I-NEXT: lui a3, 8			; RV32I-NEXT: sub a0, a0, a1
	; RV32I-NEXT: and a1, a1, a3			; RV32I-NEXT: slli a0, a0, 16
	; RV32I-NEXT: sub s3, a2, a1			; RV32I-NEXT: srai a0, a0, 30
				; RV32I-NEXT: srli a2, a0, 15
				; RV32I-NEXT: add a0, a0, a2
				; RV32I-NEXT: slli a0, a0, 15
				; RV32I-NEXT: add s3, a1, a0
				; RV32I-NEXT: lh s1, 8(s0)
				; RV32I-NEXT: lui a0, 1048571
				; RV32I-NEXT: addi a1, a0, 535
				; RV32I-NEXT: mv a0, s1
				; RV32I-NEXT: call __mulsi3
				; RV32I-NEXT: srli a0, a0, 16
				; RV32I-NEXT: add a0, a0, s1
				; RV32I-NEXT: slli a0, a0, 16
				; RV32I-NEXT: srai a0, a0, 20
				; RV32I-NEXT: srli a1, a0, 15
				; RV32I-NEXT: andi a1, a1, 1
				; RV32I-NEXT: add a0, a0, a1
	; RV32I-NEXT: addi a1, zero, 23			; RV32I-NEXT: addi a1, zero, 23
	; RV32I-NEXT: call __modsi3			; RV32I-NEXT: call __mulsi3
	; RV32I-NEXT: mv s1, a0			; RV32I-NEXT: sub s1, s1, a0
	; RV32I-NEXT: lui a0, 1			; RV32I-NEXT: lh s0, 12(s0)
	; RV32I-NEXT: addi a1, a0, 1327			; RV32I-NEXT: lui a0, 3
	; RV32I-NEXT: mv a0, s2			; RV32I-NEXT: addi a1, a0, 87
	; RV32I-NEXT: call __modsi3			; RV32I-NEXT: mv a0, s0
	; RV32I-NEXT: sh zero, 0(s0)			; RV32I-NEXT: call __mulsi3
	; RV32I-NEXT: sh a0, 6(s0)			; RV32I-NEXT: srai a0, a0, 26
	; RV32I-NEXT: sh s1, 4(s0)			; RV32I-NEXT: srli a1, a0, 15
	; RV32I-NEXT: sh s3, 2(s0)			; RV32I-NEXT: andi a1, a1, 1
				; RV32I-NEXT: add a0, a0, a1
				; RV32I-NEXT: lui a1, 1
				; RV32I-NEXT: addi a1, a1, 1327
				; RV32I-NEXT: call __mulsi3
				; RV32I-NEXT: sub a0, s0, a0
				; RV32I-NEXT: sh zero, 0(s2)
				; RV32I-NEXT: sh a0, 6(s2)
				; RV32I-NEXT: sh s1, 4(s2)
				; RV32I-NEXT: sh s3, 2(s2)
	; RV32I-NEXT: lw s3, 12(sp)			; RV32I-NEXT: lw s3, 12(sp)
	; RV32I-NEXT: lw s2, 16(sp)			; RV32I-NEXT: lw s2, 16(sp)
	; RV32I-NEXT: lw s1, 20(sp)			; RV32I-NEXT: lw s1, 20(sp)
	; RV32I-NEXT: lw s0, 24(sp)			; RV32I-NEXT: lw s0, 24(sp)
	; RV32I-NEXT: lw ra, 28(sp)			; RV32I-NEXT: lw ra, 28(sp)
	; RV32I-NEXT: addi sp, sp, 32			; RV32I-NEXT: addi sp, sp, 32
	; RV32I-NEXT: ret			; RV32I-NEXT: ret
	;			;
	; RV32IM-LABEL: dont_fold_urem_i16_smax:			; RV32IM-LABEL: dont_fold_urem_i16_smax:
	; RV32IM: # %bb.0:			; RV32IM: # %bb.0:
	; RV32IM-NEXT: lh a2, 4(a1)			; RV32IM-NEXT: lh a2, 8(a1)
	; RV32IM-NEXT: lh a3, 8(a1)			; RV32IM-NEXT: lui a3, 1048571
	; RV32IM-NEXT: lh a1, 12(a1)			; RV32IM-NEXT: addi a3, a3, 535
	; RV32IM-NEXT: lui a4, 729444			; RV32IM-NEXT: mul a3, a2, a3
	; RV32IM-NEXT: addi a4, a4, 713			; RV32IM-NEXT: srli a3, a3, 16
	; RV32IM-NEXT: mulh a4, a3, a4			; RV32IM-NEXT: add a3, a3, a2
	; RV32IM-NEXT: add a4, a4, a3			; RV32IM-NEXT: slli a3, a3, 16
	; RV32IM-NEXT: srli a5, a4, 31			; RV32IM-NEXT: srai a3, a3, 20
	; RV32IM-NEXT: srli a4, a4, 4			; RV32IM-NEXT: srli a4, a3, 15
	; RV32IM-NEXT: add a4, a4, a5			; RV32IM-NEXT: andi a4, a4, 1
	; RV32IM-NEXT: addi a5, zero, 23			; RV32IM-NEXT: add a3, a3, a4
	; RV32IM-NEXT: mul a4, a4, a5			; RV32IM-NEXT: addi a4, zero, 23
				; RV32IM-NEXT: mul a3, a3, a4
				; RV32IM-NEXT: lh a4, 4(a1)
				; RV32IM-NEXT: sub a2, a2, a3
				; RV32IM-NEXT: lui a3, 8
				; RV32IM-NEXT: addi a3, a3, -1
				; RV32IM-NEXT: mul a3, a4, a3
				; RV32IM-NEXT: srli a3, a3, 16
	; RV32IM-NEXT: sub a3, a3, a4			; RV32IM-NEXT: sub a3, a3, a4
	; RV32IM-NEXT: lui a4, 395996			; RV32IM-NEXT: slli a3, a3, 16
	; RV32IM-NEXT: addi a4, a4, -2009			; RV32IM-NEXT: srai a3, a3, 30
	; RV32IM-NEXT: mulh a4, a1, a4			; RV32IM-NEXT: srli a5, a3, 15
	; RV32IM-NEXT: srli a5, a4, 31			; RV32IM-NEXT: add a3, a3, a5
	; RV32IM-NEXT: srli a4, a4, 11			; RV32IM-NEXT: slli a3, a3, 15
				; RV32IM-NEXT: lh a1, 12(a1)
				; RV32IM-NEXT: add a3, a4, a3
				; RV32IM-NEXT: lui a4, 3
				; RV32IM-NEXT: addi a4, a4, 87
				; RV32IM-NEXT: mul a4, a1, a4
				; RV32IM-NEXT: srai a4, a4, 26
				; RV32IM-NEXT: srli a5, a4, 15
				; RV32IM-NEXT: andi a5, a5, 1
	; RV32IM-NEXT: add a4, a4, a5			; RV32IM-NEXT: add a4, a4, a5
	; RV32IM-NEXT: lui a5, 1			; RV32IM-NEXT: lui a5, 1
	; RV32IM-NEXT: addi a5, a5, 1327			; RV32IM-NEXT: addi a5, a5, 1327
	; RV32IM-NEXT: mul a4, a4, a5			; RV32IM-NEXT: mul a4, a4, a5
	; RV32IM-NEXT: sub a1, a1, a4			; RV32IM-NEXT: sub a1, a1, a4
	; RV32IM-NEXT: srli a4, a2, 17
	; RV32IM-NEXT: add a4, a2, a4
	; RV32IM-NEXT: lui a5, 8
	; RV32IM-NEXT: and a4, a4, a5
	; RV32IM-NEXT: sub a2, a2, a4
	; RV32IM-NEXT: sh zero, 0(a0)			; RV32IM-NEXT: sh zero, 0(a0)
	; RV32IM-NEXT: sh a2, 2(a0)
	; RV32IM-NEXT: sh a1, 6(a0)			; RV32IM-NEXT: sh a1, 6(a0)
	; RV32IM-NEXT: sh a3, 4(a0)			; RV32IM-NEXT: sh a3, 2(a0)
				; RV32IM-NEXT: sh a2, 4(a0)
	; RV32IM-NEXT: ret			; RV32IM-NEXT: ret
	;			;
	; RV64I-LABEL: dont_fold_urem_i16_smax:			; RV64I-LABEL: dont_fold_urem_i16_smax:
	; RV64I: # %bb.0:			; RV64I: # %bb.0:
	; RV64I-NEXT: addi sp, sp, -48			; RV64I-NEXT: addi sp, sp, -48
	; RV64I-NEXT: sd ra, 40(sp)			; RV64I-NEXT: sd ra, 40(sp)
	; RV64I-NEXT: sd s0, 32(sp)			; RV64I-NEXT: sd s0, 32(sp)
	; RV64I-NEXT: sd s1, 24(sp)			; RV64I-NEXT: sd s1, 24(sp)
	; RV64I-NEXT: sd s2, 16(sp)			; RV64I-NEXT: sd s2, 16(sp)
	; RV64I-NEXT: sd s3, 8(sp)			; RV64I-NEXT: sd s3, 8(sp)
	; RV64I-NEXT: lh a2, 8(a1)			; RV64I-NEXT: mv s0, a1
	; RV64I-NEXT: mv s0, a0			; RV64I-NEXT: lh a1, 8(a1)
	; RV64I-NEXT: lh s2, 24(a1)			; RV64I-NEXT: mv s2, a0
	; RV64I-NEXT: lh a0, 16(a1)			; RV64I-NEXT: slli a0, a1, 15
	; RV64I-NEXT: srli a1, a2, 49			; RV64I-NEXT: sub a0, a0, a1
	; RV64I-NEXT: add a1, a2, a1			; RV64I-NEXT: srli a0, a0, 16
	; RV64I-NEXT: lui a3, 8			; RV64I-NEXT: sub a0, a0, a1
	; RV64I-NEXT: and a1, a1, a3			; RV64I-NEXT: slli a0, a0, 48
	; RV64I-NEXT: sub s3, a2, a1			; RV64I-NEXT: srai a0, a0, 62
				; RV64I-NEXT: srli a2, a0, 15
				; RV64I-NEXT: add a0, a0, a2
				; RV64I-NEXT: slli a0, a0, 15
				; RV64I-NEXT: add s3, a1, a0
				; RV64I-NEXT: lh s1, 16(s0)
				; RV64I-NEXT: lui a0, 1048571
				; RV64I-NEXT: addiw a1, a0, 535
				; RV64I-NEXT: mv a0, s1
				; RV64I-NEXT: call __muldi3
				; RV64I-NEXT: srli a0, a0, 16
				; RV64I-NEXT: add a0, a0, s1
				; RV64I-NEXT: slli a0, a0, 48
				; RV64I-NEXT: srai a0, a0, 52
				; RV64I-NEXT: srli a1, a0, 15
				; RV64I-NEXT: andi a1, a1, 1
				; RV64I-NEXT: add a0, a0, a1
	; RV64I-NEXT: addi a1, zero, 23			; RV64I-NEXT: addi a1, zero, 23
	; RV64I-NEXT: call __moddi3			; RV64I-NEXT: call __muldi3
	; RV64I-NEXT: mv s1, a0			; RV64I-NEXT: sub s1, s1, a0
	; RV64I-NEXT: lui a0, 1			; RV64I-NEXT: lh s0, 24(s0)
	; RV64I-NEXT: addiw a1, a0, 1327			; RV64I-NEXT: lui a0, 3
	; RV64I-NEXT: mv a0, s2			; RV64I-NEXT: addiw a1, a0, 87
	; RV64I-NEXT: call __moddi3			; RV64I-NEXT: mv a0, s0
	; RV64I-NEXT: sh zero, 0(s0)			; RV64I-NEXT: call __muldi3
	; RV64I-NEXT: sh a0, 6(s0)			; RV64I-NEXT: srai a0, a0, 26
	; RV64I-NEXT: sh s1, 4(s0)			; RV64I-NEXT: srli a1, a0, 15
	; RV64I-NEXT: sh s3, 2(s0)			; RV64I-NEXT: andi a1, a1, 1
				; RV64I-NEXT: add a0, a0, a1
				; RV64I-NEXT: lui a1, 1
				; RV64I-NEXT: addiw a1, a1, 1327
				; RV64I-NEXT: call __muldi3
				; RV64I-NEXT: sub a0, s0, a0
				; RV64I-NEXT: sh zero, 0(s2)
				; RV64I-NEXT: sh a0, 6(s2)
				; RV64I-NEXT: sh s1, 4(s2)
				; RV64I-NEXT: sh s3, 2(s2)
	; RV64I-NEXT: ld s3, 8(sp)			; RV64I-NEXT: ld s3, 8(sp)
	; RV64I-NEXT: ld s2, 16(sp)			; RV64I-NEXT: ld s2, 16(sp)
	; RV64I-NEXT: ld s1, 24(sp)			; RV64I-NEXT: ld s1, 24(sp)
	; RV64I-NEXT: ld s0, 32(sp)			; RV64I-NEXT: ld s0, 32(sp)
	; RV64I-NEXT: ld ra, 40(sp)			; RV64I-NEXT: ld ra, 40(sp)
	; RV64I-NEXT: addi sp, sp, 48			; RV64I-NEXT: addi sp, sp, 48
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IM-LABEL: dont_fold_urem_i16_smax:			; RV64IM-LABEL: dont_fold_urem_i16_smax:
	; RV64IM: # %bb.0:			; RV64IM: # %bb.0:
	; RV64IM-NEXT: lh a2, 8(a1)			; RV64IM-NEXT: lh a2, 8(a1)
	; RV64IM-NEXT: lh a3, 24(a1)			; RV64IM-NEXT: slli a3, a2, 15
	; RV64IM-NEXT: lh a1, 16(a1)			; RV64IM-NEXT: sub a3, a3, a2
	; RV64IM-NEXT: lui a4, 1043590			; RV64IM-NEXT: srli a3, a3, 16
	; RV64IM-NEXT: addiw a4, a4, -1781			; RV64IM-NEXT: sub a3, a3, a2
	; RV64IM-NEXT: slli a4, a4, 13			; RV64IM-NEXT: slli a3, a3, 48
	; RV64IM-NEXT: addi a4, a4, 1069			; RV64IM-NEXT: srai a3, a3, 62
	; RV64IM-NEXT: slli a4, a4, 12			; RV64IM-NEXT: srli a4, a3, 15
	; RV64IM-NEXT: addi a4, a4, -1959			; RV64IM-NEXT: add a3, a3, a4
	; RV64IM-NEXT: slli a4, a4, 13			; RV64IM-NEXT: slli a3, a3, 15
	; RV64IM-NEXT: addi a4, a4, 357			; RV64IM-NEXT: lh a4, 16(a1)
	; RV64IM-NEXT: mulh a4, a1, a4			; RV64IM-NEXT: add a2, a2, a3
	; RV64IM-NEXT: add a4, a4, a1			; RV64IM-NEXT: lui a3, 1048571
	; RV64IM-NEXT: srli a5, a4, 63			; RV64IM-NEXT: addiw a3, a3, 535
	; RV64IM-NEXT: srli a4, a4, 4			; RV64IM-NEXT: mul a3, a4, a3
	; RV64IM-NEXT: add a4, a4, a5			; RV64IM-NEXT: srli a3, a3, 16
				; RV64IM-NEXT: add a3, a3, a4
				; RV64IM-NEXT: slli a3, a3, 48
				; RV64IM-NEXT: srai a3, a3, 52
				; RV64IM-NEXT: srli a5, a3, 15
				; RV64IM-NEXT: andi a5, a5, 1
				; RV64IM-NEXT: add a3, a3, a5
	; RV64IM-NEXT: addi a5, zero, 23			; RV64IM-NEXT: addi a5, zero, 23
	; RV64IM-NEXT: mul a4, a4, a5			; RV64IM-NEXT: mul a3, a3, a5
	; RV64IM-NEXT: sub a1, a1, a4			; RV64IM-NEXT: lh a1, 24(a1)
	; RV64IM-NEXT: lui a4, 12375			; RV64IM-NEXT: sub a3, a4, a3
	; RV64IM-NEXT: addiw a4, a4, -575			; RV64IM-NEXT: lui a4, 3
	; RV64IM-NEXT: slli a4, a4, 12			; RV64IM-NEXT: addiw a4, a4, 87
	; RV64IM-NEXT: addi a4, a4, 883			; RV64IM-NEXT: mul a4, a1, a4
	; RV64IM-NEXT: slli a4, a4, 13			; RV64IM-NEXT: srai a4, a4, 26
	; RV64IM-NEXT: addi a4, a4, -431			; RV64IM-NEXT: srli a5, a4, 15
	; RV64IM-NEXT: slli a4, a4, 12			; RV64IM-NEXT: andi a5, a5, 1
	; RV64IM-NEXT: addi a4, a4, 1959
	; RV64IM-NEXT: mulh a4, a3, a4
	; RV64IM-NEXT: srli a5, a4, 63
	; RV64IM-NEXT: srli a4, a4, 11
	; RV64IM-NEXT: add a4, a4, a5			; RV64IM-NEXT: add a4, a4, a5
	; RV64IM-NEXT: lui a5, 1			; RV64IM-NEXT: lui a5, 1
	; RV64IM-NEXT: addiw a5, a5, 1327			; RV64IM-NEXT: addiw a5, a5, 1327
	; RV64IM-NEXT: mul a4, a4, a5			; RV64IM-NEXT: mul a4, a4, a5
	; RV64IM-NEXT: sub a3, a3, a4			; RV64IM-NEXT: sub a1, a1, a4
	; RV64IM-NEXT: srli a4, a2, 49
	; RV64IM-NEXT: add a4, a2, a4
	; RV64IM-NEXT: lui a5, 8
	; RV64IM-NEXT: and a4, a4, a5
	; RV64IM-NEXT: sub a2, a2, a4
	; RV64IM-NEXT: sh zero, 0(a0)			; RV64IM-NEXT: sh zero, 0(a0)
				; RV64IM-NEXT: sh a1, 6(a0)
				; RV64IM-NEXT: sh a3, 4(a0)
	; RV64IM-NEXT: sh a2, 2(a0)			; RV64IM-NEXT: sh a2, 2(a0)
	; RV64IM-NEXT: sh a3, 6(a0)
	; RV64IM-NEXT: sh a1, 4(a0)
	; RV64IM-NEXT: ret			; RV64IM-NEXT: ret
	%1 = srem <4 x i16> %x, <i16 1, i16 32768, i16 23, i16 5423>			%1 = srem <4 x i16> %x, <i16 1, i16 32768, i16 23, i16 5423>
	ret <4 x i16> %1			ret <4 x i16> %1
	}			}

	; Don't fold i64 srem.			; Don't fold i64 srem.
	define <4 x i64> @dont_fold_srem_i64(<4 x i64> %x) nounwind {			define <4 x i64> @dont_fold_srem_i64(<4 x i64> %x) nounwind {
	; RV32I-LABEL: dont_fold_srem_i64:			; RV32I-LABEL: dont_fold_srem_i64:
	; RV32I: # %bb.0:			; RV32I: # %bb.0:
	; RV32I-NEXT: addi sp, sp, -48			; RV32I-NEXT: addi sp, sp, -240
	; RV32I-NEXT: sw ra, 44(sp)			; RV32I-NEXT: sw ra, 236(sp)
	; RV32I-NEXT: sw s0, 40(sp)			; RV32I-NEXT: sw s0, 232(sp)
	; RV32I-NEXT: sw s1, 36(sp)			; RV32I-NEXT: sw s1, 228(sp)
	; RV32I-NEXT: sw s2, 32(sp)			; RV32I-NEXT: sw s2, 224(sp)
	; RV32I-NEXT: sw s3, 28(sp)			; RV32I-NEXT: sw s3, 220(sp)
	; RV32I-NEXT: sw s4, 24(sp)			; RV32I-NEXT: sw s4, 216(sp)
	; RV32I-NEXT: sw s5, 20(sp)			; RV32I-NEXT: sw s5, 212(sp)
	; RV32I-NEXT: sw s6, 16(sp)			; RV32I-NEXT: sw s6, 208(sp)
	; RV32I-NEXT: sw s7, 12(sp)			; RV32I-NEXT: sw s7, 204(sp)
	; RV32I-NEXT: sw s8, 8(sp)			; RV32I-NEXT: sw s8, 200(sp)
	; RV32I-NEXT: sw s9, 4(sp)			; RV32I-NEXT: sw s9, 196(sp)
	; RV32I-NEXT: lw s2, 24(a1)			; RV32I-NEXT: sw s10, 192(sp)
	; RV32I-NEXT: lw s3, 28(a1)			; RV32I-NEXT: lw s3, 0(a1)
	; RV32I-NEXT: lw s4, 16(a1)			; RV32I-NEXT: lw s5, 4(a1)
	; RV32I-NEXT: lw s5, 20(a1)			; RV32I-NEXT: lw s4, 24(a1)
				; RV32I-NEXT: lw s7, 28(a1)
	; RV32I-NEXT: lw s6, 8(a1)			; RV32I-NEXT: lw s6, 8(a1)
	; RV32I-NEXT: lw s1, 12(a1)			; RV32I-NEXT: lw s8, 12(a1)
	; RV32I-NEXT: lw a3, 0(a1)			; RV32I-NEXT: lw s2, 16(a1)
	; RV32I-NEXT: lw a1, 4(a1)			; RV32I-NEXT: lw s1, 20(a1)
	; RV32I-NEXT: mv s0, a0			; RV32I-NEXT: mv s0, a0
	; RV32I-NEXT: addi a2, zero, 1			; RV32I-NEXT: addi a0, zero, -1
	; RV32I-NEXT: mv a0, a3			; RV32I-NEXT: sw a0, 108(sp)
				; RV32I-NEXT: sw a0, 104(sp)
				; RV32I-NEXT: lui a0, 729444
				; RV32I-NEXT: addi a0, a0, 712
				; RV32I-NEXT: sw a0, 100(sp)
				; RV32I-NEXT: lui a0, 364722
				; RV32I-NEXT: addi a0, a0, 357
				; RV32I-NEXT: sw a0, 96(sp)
				; RV32I-NEXT: sw s1, 116(sp)
				; RV32I-NEXT: sw s2, 112(sp)
				; RV32I-NEXT: srai a3, s1, 31
				; RV32I-NEXT: sw a3, 124(sp)
				; RV32I-NEXT: addi a0, sp, 128
				; RV32I-NEXT: addi a1, sp, 112
				; RV32I-NEXT: addi a2, sp, 96
				; RV32I-NEXT: sw a3, 120(sp)
				; RV32I-NEXT: call __multi3
				; RV32I-NEXT: sw zero, 60(sp)
				; RV32I-NEXT: sw zero, 56(sp)
				; RV32I-NEXT: lui a0, 410452
				; RV32I-NEXT: addi a0, a0, -952
				; RV32I-NEXT: sw a0, 52(sp)
				; RV32I-NEXT: lui a0, 25653
				; RV32I-NEXT: addi a0, a0, 965
				; RV32I-NEXT: sw a0, 48(sp)
				; RV32I-NEXT: sw s8, 68(sp)
				; RV32I-NEXT: sw s6, 64(sp)
				; RV32I-NEXT: srai a3, s8, 31
				; RV32I-NEXT: sw a3, 76(sp)
				; RV32I-NEXT: addi a0, sp, 80
				; RV32I-NEXT: addi a1, sp, 64
				; RV32I-NEXT: addi a2, sp, 48
				; RV32I-NEXT: sw a3, 72(sp)
				; RV32I-NEXT: call __multi3
				; RV32I-NEXT: sw zero, 156(sp)
				; RV32I-NEXT: sw zero, 152(sp)
				; RV32I-NEXT: lui a0, 395996
				; RV32I-NEXT: addi a0, a0, -2010
				; RV32I-NEXT: sw a0, 148(sp)
				; RV32I-NEXT: lui a0, 941649
				; RV32I-NEXT: addi a0, a0, 1959
				; RV32I-NEXT: sw a0, 144(sp)
				; RV32I-NEXT: sw s7, 164(sp)
				; RV32I-NEXT: sw s4, 160(sp)
				; RV32I-NEXT: srai a3, s7, 31
				; RV32I-NEXT: sw a3, 172(sp)
				; RV32I-NEXT: addi a0, sp, 176
				; RV32I-NEXT: addi a1, sp, 160
				; RV32I-NEXT: addi a2, sp, 144
				; RV32I-NEXT: sw a3, 168(sp)
				; RV32I-NEXT: call __multi3
				; RV32I-NEXT: sw zero, 12(sp)
				; RV32I-NEXT: sw zero, 8(sp)
				; RV32I-NEXT: sw zero, 4(sp)
				; RV32I-NEXT: sw zero, 0(sp)
				; RV32I-NEXT: sw s5, 20(sp)
				; RV32I-NEXT: sw s3, 16(sp)
				; RV32I-NEXT: srai a3, s5, 31
				; RV32I-NEXT: sw a3, 28(sp)
				; RV32I-NEXT: addi a0, sp, 32
				; RV32I-NEXT: addi a1, sp, 16
				; RV32I-NEXT: mv a2, sp
				; RV32I-NEXT: sw a3, 24(sp)
				; RV32I-NEXT: call __multi3
				; RV32I-NEXT: lw a0, 140(sp)
				; RV32I-NEXT: lw a1, 136(sp)
				; RV32I-NEXT: add a0, a0, s1
				; RV32I-NEXT: add a2, a1, s2
				; RV32I-NEXT: sltu a1, a2, a1
				; RV32I-NEXT: add a1, a0, a1
				; RV32I-NEXT: slli a0, a1, 28
				; RV32I-NEXT: srli a2, a2, 4
				; RV32I-NEXT: or a2, a2, a0
				; RV32I-NEXT: srli a0, a1, 31
				; RV32I-NEXT: add a0, a2, a0
				; RV32I-NEXT: sltu a2, a0, a2
				; RV32I-NEXT: srai a1, a1, 4
				; RV32I-NEXT: add a1, a1, a2
				; RV32I-NEXT: addi a2, zero, 23
	; RV32I-NEXT: mv a3, zero			; RV32I-NEXT: mv a3, zero
	; RV32I-NEXT: call __moddi3			; RV32I-NEXT: call __muldi3
	; RV32I-NEXT: mv s7, a0			; RV32I-NEXT: sltu a2, s2, a0
	; RV32I-NEXT: mv s8, a1			; RV32I-NEXT: sub a1, s1, a1
				; RV32I-NEXT: lw a3, 92(sp)
				; RV32I-NEXT: lw a4, 88(sp)
				; RV32I-NEXT: sub s9, a1, a2
				; RV32I-NEXT: sub s10, s2, a0
				; RV32I-NEXT: slli a0, a3, 24
				; RV32I-NEXT: srli a1, a4, 8
				; RV32I-NEXT: or a1, a1, a0
				; RV32I-NEXT: srli a0, a3, 31
				; RV32I-NEXT: add a0, a1, a0
				; RV32I-NEXT: sltu a1, a0, a1
				; RV32I-NEXT: srai a2, a3, 8
				; RV32I-NEXT: add a1, a2, a1
	; RV32I-NEXT: addi a2, zero, 654			; RV32I-NEXT: addi a2, zero, 654
	; RV32I-NEXT: mv a0, s6
	; RV32I-NEXT: mv a1, s1
	; RV32I-NEXT: mv a3, zero			; RV32I-NEXT: mv a3, zero
	; RV32I-NEXT: call __moddi3			; RV32I-NEXT: call __muldi3
	; RV32I-NEXT: mv s6, a0			; RV32I-NEXT: mv s2, a0
	; RV32I-NEXT: mv s9, a1			; RV32I-NEXT: sub a0, s8, a1
	; RV32I-NEXT: addi a2, zero, 23			; RV32I-NEXT: lw a1, 188(sp)
	; RV32I-NEXT: mv a0, s4			; RV32I-NEXT: lw a2, 184(sp)
	; RV32I-NEXT: mv a1, s5			; RV32I-NEXT: sltu a3, s6, s2
				; RV32I-NEXT: sub s8, a0, a3
				; RV32I-NEXT: slli a0, a1, 21
				; RV32I-NEXT: srli a2, a2, 11
				; RV32I-NEXT: or a2, a2, a0
				; RV32I-NEXT: srli a0, a1, 31
				; RV32I-NEXT: add a0, a2, a0
				; RV32I-NEXT: sltu a2, a0, a2
				; RV32I-NEXT: srai a1, a1, 11
				; RV32I-NEXT: add a1, a1, a2
				; RV32I-NEXT: lui a2, 1
				; RV32I-NEXT: addi a2, a2, 1327
	; RV32I-NEXT: mv a3, zero			; RV32I-NEXT: mv a3, zero
	; RV32I-NEXT: call __moddi3			; RV32I-NEXT: call __muldi3
	; RV32I-NEXT: mv s4, a0			; RV32I-NEXT: mv s1, a0
	; RV32I-NEXT: mv s1, a1			; RV32I-NEXT: sltu a0, s4, a0
	; RV32I-NEXT: lui a0, 1			; RV32I-NEXT: lw a2, 44(sp)
	; RV32I-NEXT: addi a2, a0, 1327			; RV32I-NEXT: lw a3, 40(sp)
	; RV32I-NEXT: mv a0, s2			; RV32I-NEXT: sub a1, s7, a1
	; RV32I-NEXT: mv a1, s3			; RV32I-NEXT: sub s7, a1, a0
				; RV32I-NEXT: add a1, a2, s5
				; RV32I-NEXT: add a0, a3, s3
				; RV32I-NEXT: sltu a2, a0, a3
				; RV32I-NEXT: add a1, a1, a2
				; RV32I-NEXT: addi a2, zero, 1
	; RV32I-NEXT: mv a3, zero			; RV32I-NEXT: mv a3, zero
	; RV32I-NEXT: call __moddi3			; RV32I-NEXT: call __muldi3
	; RV32I-NEXT: sw a1, 28(s0)			; RV32I-NEXT: sltu a2, s3, a0
	; RV32I-NEXT: sw a0, 24(s0)			; RV32I-NEXT: sub a1, s5, a1
	; RV32I-NEXT: sw s1, 20(s0)			; RV32I-NEXT: sub a1, a1, a2
	; RV32I-NEXT: sw s4, 16(s0)			; RV32I-NEXT: sub a2, s6, s2
	; RV32I-NEXT: sw s9, 12(s0)			; RV32I-NEXT: sub a3, s4, s1
	; RV32I-NEXT: sw s6, 8(s0)			; RV32I-NEXT: sub a0, s3, a0
	; RV32I-NEXT: sw s8, 4(s0)			; RV32I-NEXT: sw a0, 0(s0)
	; RV32I-NEXT: sw s7, 0(s0)			; RV32I-NEXT: sw a1, 4(s0)
	; RV32I-NEXT: lw s9, 4(sp)			; RV32I-NEXT: sw a3, 24(s0)
	; RV32I-NEXT: lw s8, 8(sp)			; RV32I-NEXT: sw a2, 8(s0)
	; RV32I-NEXT: lw s7, 12(sp)			; RV32I-NEXT: sw s7, 28(s0)
	; RV32I-NEXT: lw s6, 16(sp)			; RV32I-NEXT: sw s8, 12(s0)
	; RV32I-NEXT: lw s5, 20(sp)			; RV32I-NEXT: sw s10, 16(s0)
	; RV32I-NEXT: lw s4, 24(sp)			; RV32I-NEXT: sw s9, 20(s0)
	; RV32I-NEXT: lw s3, 28(sp)			; RV32I-NEXT: lw s10, 192(sp)
	; RV32I-NEXT: lw s2, 32(sp)			; RV32I-NEXT: lw s9, 196(sp)
	; RV32I-NEXT: lw s1, 36(sp)			; RV32I-NEXT: lw s8, 200(sp)
	; RV32I-NEXT: lw s0, 40(sp)			; RV32I-NEXT: lw s7, 204(sp)
	; RV32I-NEXT: lw ra, 44(sp)			; RV32I-NEXT: lw s6, 208(sp)
	; RV32I-NEXT: addi sp, sp, 48			; RV32I-NEXT: lw s5, 212(sp)
				; RV32I-NEXT: lw s4, 216(sp)
				; RV32I-NEXT: lw s3, 220(sp)
				; RV32I-NEXT: lw s2, 224(sp)
				; RV32I-NEXT: lw s1, 228(sp)
				; RV32I-NEXT: lw s0, 232(sp)
				; RV32I-NEXT: lw ra, 236(sp)
				; RV32I-NEXT: addi sp, sp, 240
	; RV32I-NEXT: ret			; RV32I-NEXT: ret
	;			;
	; RV32IM-LABEL: dont_fold_srem_i64:			; RV32IM-LABEL: dont_fold_srem_i64:
	; RV32IM: # %bb.0:			; RV32IM: # %bb.0:
	; RV32IM-NEXT: addi sp, sp, -48			; RV32IM-NEXT: addi sp, sp, -240
	; RV32IM-NEXT: sw ra, 44(sp)			; RV32IM-NEXT: sw ra, 236(sp)
	; RV32IM-NEXT: sw s0, 40(sp)			; RV32IM-NEXT: sw s0, 232(sp)
	; RV32IM-NEXT: sw s1, 36(sp)			; RV32IM-NEXT: sw s1, 228(sp)
	; RV32IM-NEXT: sw s2, 32(sp)			; RV32IM-NEXT: sw s2, 224(sp)
	; RV32IM-NEXT: sw s3, 28(sp)			; RV32IM-NEXT: sw s3, 220(sp)
	; RV32IM-NEXT: sw s4, 24(sp)			; RV32IM-NEXT: sw s4, 216(sp)
	; RV32IM-NEXT: sw s5, 20(sp)			; RV32IM-NEXT: sw s5, 212(sp)
	; RV32IM-NEXT: sw s6, 16(sp)			; RV32IM-NEXT: sw s6, 208(sp)
	; RV32IM-NEXT: sw s7, 12(sp)			; RV32IM-NEXT: sw s7, 204(sp)
	; RV32IM-NEXT: sw s8, 8(sp)			; RV32IM-NEXT: sw s8, 200(sp)
	; RV32IM-NEXT: sw s9, 4(sp)			; RV32IM-NEXT: lw s3, 0(a1)
				; RV32IM-NEXT: lw s7, 4(a1)
	; RV32IM-NEXT: lw s2, 24(a1)			; RV32IM-NEXT: lw s2, 24(a1)
	; RV32IM-NEXT: lw s3, 28(a1)			; RV32IM-NEXT: lw s5, 28(a1)
	; RV32IM-NEXT: lw s4, 16(a1)			; RV32IM-NEXT: lw s4, 8(a1)
	; RV32IM-NEXT: lw s5, 20(a1)			; RV32IM-NEXT: lw s6, 12(a1)
	; RV32IM-NEXT: lw s6, 8(a1)			; RV32IM-NEXT: lw s8, 16(a1)
	; RV32IM-NEXT: lw s1, 12(a1)			; RV32IM-NEXT: lw s1, 20(a1)
	; RV32IM-NEXT: lw a3, 0(a1)
	; RV32IM-NEXT: lw a1, 4(a1)
	; RV32IM-NEXT: mv s0, a0			; RV32IM-NEXT: mv s0, a0
	; RV32IM-NEXT: addi a2, zero, 1			; RV32IM-NEXT: addi a0, zero, -1
	; RV32IM-NEXT: mv a0, a3			; RV32IM-NEXT: sw a0, 116(sp)
	; RV32IM-NEXT: mv a3, zero			; RV32IM-NEXT: sw a0, 112(sp)
	; RV32IM-NEXT: call __moddi3			; RV32IM-NEXT: lui a0, 729444
	; RV32IM-NEXT: mv s7, a0			; RV32IM-NEXT: addi a0, a0, 712
	; RV32IM-NEXT: mv s8, a1			; RV32IM-NEXT: sw a0, 108(sp)
	; RV32IM-NEXT: addi a2, zero, 654			; RV32IM-NEXT: lui a0, 364722
	; RV32IM-NEXT: mv a0, s6			; RV32IM-NEXT: addi a0, a0, 357
	; RV32IM-NEXT: mv a1, s1			; RV32IM-NEXT: sw a0, 104(sp)
	; RV32IM-NEXT: mv a3, zero			; RV32IM-NEXT: sw s1, 124(sp)
	; RV32IM-NEXT: call __moddi3			; RV32IM-NEXT: sw s8, 120(sp)
	; RV32IM-NEXT: mv s6, a0			; RV32IM-NEXT: srai a3, s1, 31
	; RV32IM-NEXT: mv s9, a1			; RV32IM-NEXT: sw a3, 132(sp)
	; RV32IM-NEXT: addi a2, zero, 23			; RV32IM-NEXT: addi a0, sp, 136
	; RV32IM-NEXT: mv a0, s4			; RV32IM-NEXT: addi a1, sp, 120
	; RV32IM-NEXT: mv a1, s5			; RV32IM-NEXT: addi a2, sp, 104
	; RV32IM-NEXT: mv a3, zero			; RV32IM-NEXT: sw a3, 128(sp)
	; RV32IM-NEXT: call __moddi3			; RV32IM-NEXT: call __multi3
	; RV32IM-NEXT: mv s4, a0			; RV32IM-NEXT: sw zero, 68(sp)
	; RV32IM-NEXT: mv s1, a1			; RV32IM-NEXT: sw zero, 64(sp)
	; RV32IM-NEXT: lui a0, 1			; RV32IM-NEXT: lui a0, 410452
	; RV32IM-NEXT: addi a2, a0, 1327			; RV32IM-NEXT: addi a0, a0, -952
	; RV32IM-NEXT: mv a0, s2			; RV32IM-NEXT: sw a0, 60(sp)
	; RV32IM-NEXT: mv a1, s3			; RV32IM-NEXT: lui a0, 25653
	; RV32IM-NEXT: mv a3, zero			; RV32IM-NEXT: addi a0, a0, 965
	; RV32IM-NEXT: call __moddi3			; RV32IM-NEXT: sw a0, 56(sp)
	; RV32IM-NEXT: sw a1, 28(s0)			; RV32IM-NEXT: sw s6, 76(sp)
	; RV32IM-NEXT: sw a0, 24(s0)			; RV32IM-NEXT: sw s4, 72(sp)
	; RV32IM-NEXT: sw s1, 20(s0)			; RV32IM-NEXT: srai a3, s6, 31
	; RV32IM-NEXT: sw s4, 16(s0)			; RV32IM-NEXT: sw a3, 84(sp)
	; RV32IM-NEXT: sw s9, 12(s0)			; RV32IM-NEXT: addi a0, sp, 88
	; RV32IM-NEXT: sw s6, 8(s0)			; RV32IM-NEXT: addi a1, sp, 72
	; RV32IM-NEXT: sw s8, 4(s0)			; RV32IM-NEXT: addi a2, sp, 56
	; RV32IM-NEXT: sw s7, 0(s0)			; RV32IM-NEXT: sw a3, 80(sp)
	; RV32IM-NEXT: lw s9, 4(sp)			; RV32IM-NEXT: call __multi3
	; RV32IM-NEXT: lw s8, 8(sp)			; RV32IM-NEXT: sw zero, 164(sp)
	; RV32IM-NEXT: lw s7, 12(sp)			; RV32IM-NEXT: sw zero, 160(sp)
	; RV32IM-NEXT: lw s6, 16(sp)			; RV32IM-NEXT: lui a0, 395996
	; RV32IM-NEXT: lw s5, 20(sp)			; RV32IM-NEXT: addi a0, a0, -2010
	; RV32IM-NEXT: lw s4, 24(sp)			; RV32IM-NEXT: sw a0, 156(sp)
	; RV32IM-NEXT: lw s3, 28(sp)			; RV32IM-NEXT: lui a0, 941649
	; RV32IM-NEXT: lw s2, 32(sp)			; RV32IM-NEXT: addi a0, a0, 1959
	; RV32IM-NEXT: lw s1, 36(sp)			; RV32IM-NEXT: sw a0, 152(sp)
	; RV32IM-NEXT: lw s0, 40(sp)			; RV32IM-NEXT: sw s5, 172(sp)
	; RV32IM-NEXT: lw ra, 44(sp)			; RV32IM-NEXT: sw s2, 168(sp)
	; RV32IM-NEXT: addi sp, sp, 48			; RV32IM-NEXT: srai a3, s5, 31
				; RV32IM-NEXT: sw a3, 180(sp)
				; RV32IM-NEXT: addi a0, sp, 184
				; RV32IM-NEXT: addi a1, sp, 168
				; RV32IM-NEXT: addi a2, sp, 152
				; RV32IM-NEXT: sw a3, 176(sp)
				; RV32IM-NEXT: call __multi3
				; RV32IM-NEXT: sw zero, 20(sp)
				; RV32IM-NEXT: sw zero, 16(sp)
				; RV32IM-NEXT: sw zero, 12(sp)
				; RV32IM-NEXT: sw zero, 8(sp)
				; RV32IM-NEXT: sw s7, 28(sp)
				; RV32IM-NEXT: sw s3, 24(sp)
				; RV32IM-NEXT: srai a3, s7, 31
				; RV32IM-NEXT: sw a3, 36(sp)
				; RV32IM-NEXT: addi a0, sp, 40
				; RV32IM-NEXT: addi a1, sp, 24
				; RV32IM-NEXT: addi a2, sp, 8
				; RV32IM-NEXT: sw a3, 32(sp)
				; RV32IM-NEXT: call __multi3
				; RV32IM-NEXT: lw a0, 148(sp)
				; RV32IM-NEXT: lw a1, 144(sp)
				; RV32IM-NEXT: add a0, a0, s1
				; RV32IM-NEXT: add a2, a1, s8
				; RV32IM-NEXT: sltu a1, a2, a1
				; RV32IM-NEXT: add a0, a0, a1
				; RV32IM-NEXT: slli a1, a0, 28
				; RV32IM-NEXT: srli a2, a2, 4
				; RV32IM-NEXT: or a1, a2, a1
				; RV32IM-NEXT: srli a2, a0, 31
				; RV32IM-NEXT: add a2, a1, a2
				; RV32IM-NEXT: addi a3, zero, 23
				; RV32IM-NEXT: mulhu a4, a2, a3
				; RV32IM-NEXT: sltu a1, a2, a1
				; RV32IM-NEXT: srai a0, a0, 4
				; RV32IM-NEXT: add a0, a0, a1
				; RV32IM-NEXT: mul a0, a0, a3
				; RV32IM-NEXT: add a0, a4, a0
				; RV32IM-NEXT: sub a0, s1, a0
				; RV32IM-NEXT: mul a1, a2, a3
				; RV32IM-NEXT: sltu a2, s8, a1
				; RV32IM-NEXT: lw a3, 100(sp)
				; RV32IM-NEXT: lw a4, 96(sp)
				; RV32IM-NEXT: sub a6, a0, a2
				; RV32IM-NEXT: sub a7, s8, a1
				; RV32IM-NEXT: slli a2, a3, 24
				; RV32IM-NEXT: srli a4, a4, 8
				; RV32IM-NEXT: or a2, a4, a2
				; RV32IM-NEXT: srli a4, a3, 31
				; RV32IM-NEXT: add a4, a2, a4
				; RV32IM-NEXT: sltu a2, a4, a2
				; RV32IM-NEXT: srai a3, a3, 8
				; RV32IM-NEXT: add a2, a3, a2
				; RV32IM-NEXT: addi a3, zero, 654
				; RV32IM-NEXT: mul a2, a2, a3
				; RV32IM-NEXT: mulhu a5, a4, a3
				; RV32IM-NEXT: add a2, a5, a2
				; RV32IM-NEXT: sub a2, s6, a2
				; RV32IM-NEXT: mul a3, a4, a3
				; RV32IM-NEXT: lw a4, 196(sp)
				; RV32IM-NEXT: lw a5, 192(sp)
				; RV32IM-NEXT: sltu s1, s4, a3
				; RV32IM-NEXT: sub a2, a2, s1
				; RV32IM-NEXT: slli s1, a4, 21
				; RV32IM-NEXT: srli a5, a5, 11
				; RV32IM-NEXT: or a5, a5, s1
				; RV32IM-NEXT: srli s1, a4, 31
				; RV32IM-NEXT: add s1, a5, s1
				; RV32IM-NEXT: sltu a5, s1, a5
				; RV32IM-NEXT: srai a4, a4, 11
				; RV32IM-NEXT: add a4, a4, a5
				; RV32IM-NEXT: lui a5, 1
				; RV32IM-NEXT: addi a5, a5, 1327
				; RV32IM-NEXT: mul a4, a4, a5
				; RV32IM-NEXT: mulhu a0, s1, a5
				; RV32IM-NEXT: add a0, a0, a4
				; RV32IM-NEXT: sub a0, s5, a0
				; RV32IM-NEXT: mul a4, s1, a5
				; RV32IM-NEXT: lw a5, 52(sp)
				; RV32IM-NEXT: lw s1, 48(sp)
				; RV32IM-NEXT: sltu a1, s2, a4
				; RV32IM-NEXT: sub a0, a0, a1
				; RV32IM-NEXT: add a1, a5, s7
				; RV32IM-NEXT: add a5, s1, s3
				; RV32IM-NEXT: sltu s1, a5, s1
				; RV32IM-NEXT: add a1, a1, s1
				; RV32IM-NEXT: sub a1, s7, a1
				; RV32IM-NEXT: sltu s1, s3, a5
				; RV32IM-NEXT: sub a1, a1, s1
				; RV32IM-NEXT: sub a3, s4, a3
				; RV32IM-NEXT: sub a4, s2, a4
				; RV32IM-NEXT: sub a5, s3, a5
				; RV32IM-NEXT: sw a5, 0(s0)
				; RV32IM-NEXT: sw a4, 24(s0)
				; RV32IM-NEXT: sw a3, 8(s0)
				; RV32IM-NEXT: sw a1, 4(s0)
				; RV32IM-NEXT: sw a7, 16(s0)
				; RV32IM-NEXT: sw a0, 28(s0)
				; RV32IM-NEXT: sw a2, 12(s0)
				; RV32IM-NEXT: sw a6, 20(s0)
				; RV32IM-NEXT: lw s8, 200(sp)
				; RV32IM-NEXT: lw s7, 204(sp)
				; RV32IM-NEXT: lw s6, 208(sp)
				; RV32IM-NEXT: lw s5, 212(sp)
				; RV32IM-NEXT: lw s4, 216(sp)
				; RV32IM-NEXT: lw s3, 220(sp)
				; RV32IM-NEXT: lw s2, 224(sp)
				; RV32IM-NEXT: lw s1, 228(sp)
				; RV32IM-NEXT: lw s0, 232(sp)
				; RV32IM-NEXT: lw ra, 236(sp)
				; RV32IM-NEXT: addi sp, sp, 240
	; RV32IM-NEXT: ret			; RV32IM-NEXT: ret
	;			;
	; RV64I-LABEL: dont_fold_srem_i64:			; RV64I-LABEL: dont_fold_srem_i64:
	; RV64I: # %bb.0:			; RV64I: # %bb.0:
	; RV64I-NEXT: addi sp, sp, -48			; RV64I-NEXT: addi sp, sp, -64
	; RV64I-NEXT: sd ra, 40(sp)			; RV64I-NEXT: sd ra, 56(sp)
	; RV64I-NEXT: sd s0, 32(sp)			; RV64I-NEXT: sd s0, 48(sp)
	; RV64I-NEXT: sd s1, 24(sp)			; RV64I-NEXT: sd s1, 40(sp)
	; RV64I-NEXT: sd s2, 16(sp)			; RV64I-NEXT: sd s2, 32(sp)
	; RV64I-NEXT: sd s3, 8(sp)			; RV64I-NEXT: sd s3, 24(sp)
				; RV64I-NEXT: sd s4, 16(sp)
				; RV64I-NEXT: sd s5, 8(sp)
				; RV64I-NEXT: ld s4, 0(a1)
	; RV64I-NEXT: ld s2, 24(a1)			; RV64I-NEXT: ld s2, 24(a1)
				; RV64I-NEXT: ld s0, 8(a1)
	; RV64I-NEXT: ld s1, 16(a1)			; RV64I-NEXT: ld s1, 16(a1)
	; RV64I-NEXT: ld a2, 8(a1)
	; RV64I-NEXT: mv s0, a0
	; RV64I-NEXT: addi a1, zero, 654
	; RV64I-NEXT: mv a0, a2
	; RV64I-NEXT: call __moddi3
	; RV64I-NEXT: mv s3, a0			; RV64I-NEXT: mv s3, a0
	; RV64I-NEXT: addi a1, zero, 23			; RV64I-NEXT: srai a1, s1, 63
				; RV64I-NEXT: lui a0, 1043590
				; RV64I-NEXT: addiw a0, a0, -1781
				; RV64I-NEXT: slli a0, a0, 13
				; RV64I-NEXT: addi a0, a0, 1069
				; RV64I-NEXT: slli a0, a0, 12
				; RV64I-NEXT: addi a0, a0, -1959
				; RV64I-NEXT: slli a0, a0, 13
				; RV64I-NEXT: addi a2, a0, 357
				; RV64I-NEXT: addi a3, zero, -1
	; RV64I-NEXT: mv a0, s1			; RV64I-NEXT: mv a0, s1
	; RV64I-NEXT: call __moddi3			; RV64I-NEXT: call __multi3
	; RV64I-NEXT: mv s1, a0			; RV64I-NEXT: add a0, a1, s1
	; RV64I-NEXT: lui a0, 1			; RV64I-NEXT: srli a1, a0, 63
	; RV64I-NEXT: addiw a1, a0, 1327			; RV64I-NEXT: srai a0, a0, 4
				; RV64I-NEXT: add a0, a0, a1
				; RV64I-NEXT: addi a1, zero, 23
				; RV64I-NEXT: call __muldi3
				; RV64I-NEXT: sub s5, s1, a0
				; RV64I-NEXT: srai a1, s0, 63
				; RV64I-NEXT: lui a0, 6413
				; RV64I-NEXT: addiw a0, a0, 1265
				; RV64I-NEXT: slli a0, a0, 13
				; RV64I-NEXT: addi a0, a0, 1027
				; RV64I-NEXT: slli a0, a0, 13
				; RV64I-NEXT: addi a0, a0, 1077
				; RV64I-NEXT: slli a0, a0, 12
				; RV64I-NEXT: addi a2, a0, 965
				; RV64I-NEXT: mv a0, s0
				; RV64I-NEXT: mv a3, zero
				; RV64I-NEXT: call __multi3
				; RV64I-NEXT: srli a0, a1, 63
				; RV64I-NEXT: srai a1, a1, 8
				; RV64I-NEXT: add a0, a1, a0
				; RV64I-NEXT: addi a1, zero, 654
				; RV64I-NEXT: call __muldi3
				; RV64I-NEXT: sub s0, s0, a0
				; RV64I-NEXT: srai a1, s2, 63
				; RV64I-NEXT: lui a0, 12375
				; RV64I-NEXT: addiw a0, a0, -575
				; RV64I-NEXT: slli a0, a0, 12
				; RV64I-NEXT: addi a0, a0, 883
				; RV64I-NEXT: slli a0, a0, 13
				; RV64I-NEXT: addi a0, a0, -431
				; RV64I-NEXT: slli a0, a0, 12
				; RV64I-NEXT: addi a2, a0, 1959
	; RV64I-NEXT: mv a0, s2			; RV64I-NEXT: mv a0, s2
	; RV64I-NEXT: call __moddi3			; RV64I-NEXT: mv a3, zero
	; RV64I-NEXT: sd zero, 0(s0)			; RV64I-NEXT: call __multi3
	; RV64I-NEXT: sd a0, 24(s0)			; RV64I-NEXT: srli a0, a1, 63
	; RV64I-NEXT: sd s1, 16(s0)			; RV64I-NEXT: srai a1, a1, 11
	; RV64I-NEXT: sd s3, 8(s0)			; RV64I-NEXT: add a0, a1, a0
	; RV64I-NEXT: ld s3, 8(sp)			; RV64I-NEXT: lui a1, 1
	; RV64I-NEXT: ld s2, 16(sp)			; RV64I-NEXT: addiw a1, a1, 1327
	; RV64I-NEXT: ld s1, 24(sp)			; RV64I-NEXT: call __muldi3
	; RV64I-NEXT: ld s0, 32(sp)			; RV64I-NEXT: sub s1, s2, a0
	; RV64I-NEXT: ld ra, 40(sp)			; RV64I-NEXT: srai a1, s4, 63
	; RV64I-NEXT: addi sp, sp, 48			; RV64I-NEXT: mv a0, s4
				; RV64I-NEXT: mv a2, zero
				; RV64I-NEXT: mv a3, zero
				; RV64I-NEXT: call __multi3
				; RV64I-NEXT: add a0, a1, s4
				; RV64I-NEXT: sub a0, s4, a0
				; RV64I-NEXT: sd a0, 0(s3)
				; RV64I-NEXT: sd s1, 24(s3)
				; RV64I-NEXT: sd s0, 8(s3)
				; RV64I-NEXT: sd s5, 16(s3)
				; RV64I-NEXT: ld s5, 8(sp)
				; RV64I-NEXT: ld s4, 16(sp)
				; RV64I-NEXT: ld s3, 24(sp)
				; RV64I-NEXT: ld s2, 32(sp)
				; RV64I-NEXT: ld s1, 40(sp)
				; RV64I-NEXT: ld s0, 48(sp)
				; RV64I-NEXT: ld ra, 56(sp)
				; RV64I-NEXT: addi sp, sp, 64
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IM-LABEL: dont_fold_srem_i64:			; RV64IM-LABEL: dont_fold_srem_i64:
	; RV64IM: # %bb.0:			; RV64IM: # %bb.0:
	; RV64IM-NEXT: ld a2, 24(a1)			; RV64IM-NEXT: ld a2, 24(a1)
	; RV64IM-NEXT: ld a3, 8(a1)			; RV64IM-NEXT: ld a3, 8(a1)
	; RV64IM-NEXT: ld a1, 16(a1)			; RV64IM-NEXT: ld a1, 16(a1)
	; RV64IM-NEXT: lui a4, 1043590			; RV64IM-NEXT: lui a4, 1043590
	▲ Show 20 Lines • Show All 54 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/urem-lkk.ll

; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py		; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
; RUN: llc -mtriple=riscv32 -verify-machineinstrs < %s \		; RUN: llc -mtriple=riscv32 -verify-machineinstrs < %s \
; RUN: \| FileCheck -check-prefixes=CHECK,RV32I %s		; RUN: \| FileCheck -check-prefixes=CHECK,RV32I %s
; RUN: llc -mtriple=riscv32 -mattr=+m -verify-machineinstrs < %s \		; RUN: llc -mtriple=riscv32 -mattr=+m -verify-machineinstrs < %s \
; RUN: \| FileCheck -check-prefixes=CHECK,RV32IM %s		; RUN: \| FileCheck -check-prefixes=CHECK,RV32IM %s
; RUN: llc -mtriple=riscv64 -verify-machineinstrs < %s \		; RUN: llc -mtriple=riscv64 -verify-machineinstrs < %s \
; RUN: \| FileCheck -check-prefixes=CHECK,RV64I %s		; RUN: \| FileCheck -check-prefixes=CHECK,RV64I %s
; RUN: llc -mtriple=riscv64 -mattr=+m -verify-machineinstrs < %s \		; RUN: llc -mtriple=riscv64 -mattr=+m -verify-machineinstrs < %s \
; RUN: \| FileCheck -check-prefixes=CHECK,RV64IM %s		; RUN: \| FileCheck -check-prefixes=CHECK,RV64IM %s

define i32 @fold_urem_positive_odd(i32 %x) nounwind {		define i32 @fold_urem_positive_odd(i32 %x) nounwind {
; RV32I-LABEL: fold_urem_positive_odd:		; RV32I-LABEL: fold_urem_positive_odd:
; RV32I: # %bb.0:		; RV32I: # %bb.0:
; RV32I-NEXT: addi sp, sp, -16		; RV32I-NEXT: addi sp, sp, -16
; RV32I-NEXT: sw ra, 12(sp)		; RV32I-NEXT: sw ra, 12(sp)
		; RV32I-NEXT: sw s0, 8(sp)
		; RV32I-NEXT: mv s0, a0
		; RV32I-NEXT: lui a0, 364242
		; RV32I-NEXT: addi a2, a0, 777
		; RV32I-NEXT: mv a0, s0
		; RV32I-NEXT: mv a1, zero
		; RV32I-NEXT: mv a3, zero
		; RV32I-NEXT: call __muldi3
		; RV32I-NEXT: sub a0, s0, a1
		; RV32I-NEXT: srli a0, a0, 1
		; RV32I-NEXT: add a0, a0, a1
		; RV32I-NEXT: srli a0, a0, 6
; RV32I-NEXT: addi a1, zero, 95		; RV32I-NEXT: addi a1, zero, 95
; RV32I-NEXT: call __umodsi3		; RV32I-NEXT: call __mulsi3
		; RV32I-NEXT: sub a0, s0, a0
		; RV32I-NEXT: lw s0, 8(sp)
; RV32I-NEXT: lw ra, 12(sp)		; RV32I-NEXT: lw ra, 12(sp)
; RV32I-NEXT: addi sp, sp, 16		; RV32I-NEXT: addi sp, sp, 16
; RV32I-NEXT: ret		; RV32I-NEXT: ret
;		;
; RV32IM-LABEL: fold_urem_positive_odd:		; RV32IM-LABEL: fold_urem_positive_odd:
; RV32IM: # %bb.0:		; RV32IM: # %bb.0:
; RV32IM-NEXT: lui a1, 364242		; RV32IM-NEXT: lui a1, 364242
; RV32IM-NEXT: addi a1, a1, 777		; RV32IM-NEXT: addi a1, a1, 777
; RV32IM-NEXT: mulhu a1, a0, a1		; RV32IM-NEXT: mulhu a1, a0, a1
; RV32IM-NEXT: sub a2, a0, a1		; RV32IM-NEXT: sub a2, a0, a1
; RV32IM-NEXT: srli a2, a2, 1		; RV32IM-NEXT: srli a2, a2, 1
; RV32IM-NEXT: add a1, a2, a1		; RV32IM-NEXT: add a1, a2, a1
; RV32IM-NEXT: srli a1, a1, 6		; RV32IM-NEXT: srli a1, a1, 6
; RV32IM-NEXT: addi a2, zero, 95		; RV32IM-NEXT: addi a2, zero, 95
; RV32IM-NEXT: mul a1, a1, a2		; RV32IM-NEXT: mul a1, a1, a2
; RV32IM-NEXT: sub a0, a0, a1		; RV32IM-NEXT: sub a0, a0, a1
; RV32IM-NEXT: ret		; RV32IM-NEXT: ret
;		;
; RV64I-LABEL: fold_urem_positive_odd:		; RV64I-LABEL: fold_urem_positive_odd:
; RV64I: # %bb.0:		; RV64I: # %bb.0:
; RV64I-NEXT: addi sp, sp, -16		; RV64I-NEXT: addi sp, sp, -16
; RV64I-NEXT: sd ra, 8(sp)		; RV64I-NEXT: sd ra, 8(sp)
		; RV64I-NEXT: sd s0, 0(sp)
		; RV64I-NEXT: mv s0, a0
; RV64I-NEXT: slli a0, a0, 32		; RV64I-NEXT: slli a0, a0, 32
; RV64I-NEXT: srli a0, a0, 32		; RV64I-NEXT: srli a0, a0, 32
		; RV64I-NEXT: lui a1, 364242
		; RV64I-NEXT: addiw a1, a1, 777
		; RV64I-NEXT: call __muldi3
		; RV64I-NEXT: srli a0, a0, 32
		; RV64I-NEXT: sub a1, s0, a0
		; RV64I-NEXT: srliw a1, a1, 1
		; RV64I-NEXT: add a0, a1, a0
		; RV64I-NEXT: srli a0, a0, 6
; RV64I-NEXT: addi a1, zero, 95		; RV64I-NEXT: addi a1, zero, 95
; RV64I-NEXT: call __umoddi3		; RV64I-NEXT: call __muldi3
		; RV64I-NEXT: subw a0, s0, a0
		; RV64I-NEXT: ld s0, 0(sp)
; RV64I-NEXT: ld ra, 8(sp)		; RV64I-NEXT: ld ra, 8(sp)
; RV64I-NEXT: addi sp, sp, 16		; RV64I-NEXT: addi sp, sp, 16
; RV64I-NEXT: ret		; RV64I-NEXT: ret
;		;
; RV64IM-LABEL: fold_urem_positive_odd:		; RV64IM-LABEL: fold_urem_positive_odd:
; RV64IM: # %bb.0:		; RV64IM: # %bb.0:
; RV64IM-NEXT: slli a0, a0, 32		; RV64IM-NEXT: slli a1, a0, 32
; RV64IM-NEXT: srli a0, a0, 32		; RV64IM-NEXT: srli a1, a1, 32
; RV64IM-NEXT: lui a1, 1423		; RV64IM-NEXT: lui a2, 364242
; RV64IM-NEXT: addiw a1, a1, -733		; RV64IM-NEXT: addiw a2, a2, 777
; RV64IM-NEXT: slli a1, a1, 15		; RV64IM-NEXT: mul a1, a1, a2
; RV64IM-NEXT: addi a1, a1, 1035		; RV64IM-NEXT: srli a1, a1, 32
; RV64IM-NEXT: slli a1, a1, 13
; RV64IM-NEXT: addi a1, a1, -1811
; RV64IM-NEXT: slli a1, a1, 12
; RV64IM-NEXT: addi a1, a1, 561
; RV64IM-NEXT: mulhu a1, a0, a1
; RV64IM-NEXT: sub a2, a0, a1		; RV64IM-NEXT: sub a2, a0, a1
; RV64IM-NEXT: srli a2, a2, 1		; RV64IM-NEXT: srliw a2, a2, 1
; RV64IM-NEXT: add a1, a2, a1		; RV64IM-NEXT: add a1, a2, a1
; RV64IM-NEXT: srli a1, a1, 6		; RV64IM-NEXT: srli a1, a1, 6
; RV64IM-NEXT: addi a2, zero, 95		; RV64IM-NEXT: addi a2, zero, 95
; RV64IM-NEXT: mul a1, a1, a2		; RV64IM-NEXT: mul a1, a1, a2
; RV64IM-NEXT: sub a0, a0, a1		; RV64IM-NEXT: subw a0, a0, a1
; RV64IM-NEXT: ret		; RV64IM-NEXT: ret
%1 = urem i32 %x, 95		%1 = urem i32 %x, 95
ret i32 %1		ret i32 %1
}		}


define i32 @fold_urem_positive_even(i32 %x) nounwind {		define i32 @fold_urem_positive_even(i32 %x) nounwind {
; RV32I-LABEL: fold_urem_positive_even:		; RV32I-LABEL: fold_urem_positive_even:
; RV32I: # %bb.0:		; RV32I: # %bb.0:
; RV32I-NEXT: addi sp, sp, -16		; RV32I-NEXT: addi sp, sp, -16
; RV32I-NEXT: sw ra, 12(sp)		; RV32I-NEXT: sw ra, 12(sp)
		; RV32I-NEXT: sw s0, 8(sp)
		; RV32I-NEXT: mv s0, a0
		; RV32I-NEXT: lui a0, 1012964
		; RV32I-NEXT: addi a2, a0, -61
		; RV32I-NEXT: mv a0, s0
		; RV32I-NEXT: mv a1, zero
		; RV32I-NEXT: mv a3, zero
		; RV32I-NEXT: call __muldi3
		; RV32I-NEXT: srli a0, a1, 10
; RV32I-NEXT: addi a1, zero, 1060		; RV32I-NEXT: addi a1, zero, 1060
; RV32I-NEXT: call __umodsi3		; RV32I-NEXT: call __mulsi3
		; RV32I-NEXT: sub a0, s0, a0
		; RV32I-NEXT: lw s0, 8(sp)
; RV32I-NEXT: lw ra, 12(sp)		; RV32I-NEXT: lw ra, 12(sp)
; RV32I-NEXT: addi sp, sp, 16		; RV32I-NEXT: addi sp, sp, 16
; RV32I-NEXT: ret		; RV32I-NEXT: ret
;		;
; RV32IM-LABEL: fold_urem_positive_even:		; RV32IM-LABEL: fold_urem_positive_even:
; RV32IM: # %bb.0:		; RV32IM: # %bb.0:
; RV32IM-NEXT: lui a1, 1012964		; RV32IM-NEXT: lui a1, 1012964
; RV32IM-NEXT: addi a1, a1, -61		; RV32IM-NEXT: addi a1, a1, -61
; RV32IM-NEXT: mulhu a1, a0, a1		; RV32IM-NEXT: mulhu a1, a0, a1
; RV32IM-NEXT: srli a1, a1, 10		; RV32IM-NEXT: srli a1, a1, 10
; RV32IM-NEXT: addi a2, zero, 1060		; RV32IM-NEXT: addi a2, zero, 1060
; RV32IM-NEXT: mul a1, a1, a2		; RV32IM-NEXT: mul a1, a1, a2
; RV32IM-NEXT: sub a0, a0, a1		; RV32IM-NEXT: sub a0, a0, a1
; RV32IM-NEXT: ret		; RV32IM-NEXT: ret
;		;
; RV64I-LABEL: fold_urem_positive_even:		; RV64I-LABEL: fold_urem_positive_even:
; RV64I: # %bb.0:		; RV64I: # %bb.0:
; RV64I-NEXT: addi sp, sp, -16		; RV64I-NEXT: addi sp, sp, -16
; RV64I-NEXT: sd ra, 8(sp)		; RV64I-NEXT: sd ra, 8(sp)
		; RV64I-NEXT: sd s0, 0(sp)
		; RV64I-NEXT: mv s0, a0
; RV64I-NEXT: slli a0, a0, 32		; RV64I-NEXT: slli a0, a0, 32
; RV64I-NEXT: srli a0, a0, 32		; RV64I-NEXT: srli a0, a0, 32
		; RV64I-NEXT: lui a1, 62
		; RV64I-NEXT: addiw a1, a1, -711
		; RV64I-NEXT: slli a1, a1, 14
		; RV64I-NEXT: addi a1, a1, -61
		; RV64I-NEXT: call __muldi3
		; RV64I-NEXT: srli a0, a0, 42
; RV64I-NEXT: addi a1, zero, 1060		; RV64I-NEXT: addi a1, zero, 1060
; RV64I-NEXT: call __umoddi3		; RV64I-NEXT: call __muldi3
		; RV64I-NEXT: subw a0, s0, a0
		; RV64I-NEXT: ld s0, 0(sp)
; RV64I-NEXT: ld ra, 8(sp)		; RV64I-NEXT: ld ra, 8(sp)
; RV64I-NEXT: addi sp, sp, 16		; RV64I-NEXT: addi sp, sp, 16
; RV64I-NEXT: ret		; RV64I-NEXT: ret
;		;
; RV64IM-LABEL: fold_urem_positive_even:		; RV64IM-LABEL: fold_urem_positive_even:
; RV64IM: # %bb.0:		; RV64IM: # %bb.0:
; RV64IM-NEXT: slli a0, a0, 32		; RV64IM-NEXT: slli a1, a0, 32
; RV64IM-NEXT: srli a0, a0, 32		; RV64IM-NEXT: srli a1, a1, 32
; RV64IM-NEXT: lui a1, 1048020		; RV64IM-NEXT: lui a2, 62
; RV64IM-NEXT: addiw a1, a1, -1793		; RV64IM-NEXT: addiw a2, a2, -711
; RV64IM-NEXT: slli a1, a1, 12		; RV64IM-NEXT: slli a2, a2, 14
; RV64IM-NEXT: addi a1, a1, 139		; RV64IM-NEXT: addi a2, a2, -61
; RV64IM-NEXT: slli a1, a1, 14		; RV64IM-NEXT: mul a1, a1, a2
; RV64IM-NEXT: addi a1, a1, 1793		; RV64IM-NEXT: srli a1, a1, 42
; RV64IM-NEXT: slli a1, a1, 12
; RV64IM-NEXT: addi a1, a1, -139
; RV64IM-NEXT: mulhu a1, a0, a1
; RV64IM-NEXT: srli a1, a1, 10
; RV64IM-NEXT: addi a2, zero, 1060		; RV64IM-NEXT: addi a2, zero, 1060
; RV64IM-NEXT: mul a1, a1, a2		; RV64IM-NEXT: mul a1, a1, a2
; RV64IM-NEXT: sub a0, a0, a1		; RV64IM-NEXT: subw a0, a0, a1
; RV64IM-NEXT: ret		; RV64IM-NEXT: ret
%1 = urem i32 %x, 1060		%1 = urem i32 %x, 1060
ret i32 %1		ret i32 %1
}		}


; Don't fold if we can combine urem with udiv.		; Don't fold if we can combine urem with udiv.
define i32 @combine_urem_udiv(i32 %x) nounwind {		define i32 @combine_urem_udiv(i32 %x) nounwind {
; RV32I-LABEL: combine_urem_udiv:		; RV32I-LABEL: combine_urem_udiv:
; RV32I: # %bb.0:		; RV32I: # %bb.0:
; RV32I-NEXT: addi sp, sp, -16		; RV32I-NEXT: addi sp, sp, -16
; RV32I-NEXT: sw ra, 12(sp)		; RV32I-NEXT: sw ra, 12(sp)
; RV32I-NEXT: sw s0, 8(sp)		; RV32I-NEXT: sw s0, 8(sp)
; RV32I-NEXT: sw s1, 4(sp)		; RV32I-NEXT: sw s1, 4(sp)
; RV32I-NEXT: mv s0, a0		; RV32I-NEXT: mv s0, a0
; RV32I-NEXT: addi a1, zero, 95		; RV32I-NEXT: lui a0, 364242
; RV32I-NEXT: call __umodsi3		; RV32I-NEXT: addi a2, a0, 777
; RV32I-NEXT: mv s1, a0
; RV32I-NEXT: addi a1, zero, 95
; RV32I-NEXT: mv a0, s0		; RV32I-NEXT: mv a0, s0
; RV32I-NEXT: call __udivsi3		; RV32I-NEXT: mv a1, zero
; RV32I-NEXT: add a0, s1, a0		; RV32I-NEXT: mv a3, zero
		; RV32I-NEXT: call __muldi3
		; RV32I-NEXT: sub a0, s0, a1
		; RV32I-NEXT: srli a0, a0, 1
		; RV32I-NEXT: add a0, a0, a1
		; RV32I-NEXT: srli s1, a0, 6
		; RV32I-NEXT: addi a1, zero, 95
		; RV32I-NEXT: mv a0, s1
		; RV32I-NEXT: call __mulsi3
		; RV32I-NEXT: sub a0, s0, a0
		; RV32I-NEXT: add a0, a0, s1
; RV32I-NEXT: lw s1, 4(sp)		; RV32I-NEXT: lw s1, 4(sp)
; RV32I-NEXT: lw s0, 8(sp)		; RV32I-NEXT: lw s0, 8(sp)
; RV32I-NEXT: lw ra, 12(sp)		; RV32I-NEXT: lw ra, 12(sp)
; RV32I-NEXT: addi sp, sp, 16		; RV32I-NEXT: addi sp, sp, 16
; RV32I-NEXT: ret		; RV32I-NEXT: ret
;		;
; RV32IM-LABEL: combine_urem_udiv:		; RV32IM-LABEL: combine_urem_udiv:
; RV32IM: # %bb.0:		; RV32IM: # %bb.0:
Show All 11 Lines
; RV32IM-NEXT: ret		; RV32IM-NEXT: ret
;		;
; RV64I-LABEL: combine_urem_udiv:		; RV64I-LABEL: combine_urem_udiv:
; RV64I: # %bb.0:		; RV64I: # %bb.0:
; RV64I-NEXT: addi sp, sp, -32		; RV64I-NEXT: addi sp, sp, -32
; RV64I-NEXT: sd ra, 24(sp)		; RV64I-NEXT: sd ra, 24(sp)
; RV64I-NEXT: sd s0, 16(sp)		; RV64I-NEXT: sd s0, 16(sp)
; RV64I-NEXT: sd s1, 8(sp)		; RV64I-NEXT: sd s1, 8(sp)
		; RV64I-NEXT: mv s0, a0
; RV64I-NEXT: slli a0, a0, 32		; RV64I-NEXT: slli a0, a0, 32
; RV64I-NEXT: srli s0, a0, 32		; RV64I-NEXT: srli a0, a0, 32
; RV64I-NEXT: addi a1, zero, 95		; RV64I-NEXT: lui a1, 364242
; RV64I-NEXT: mv a0, s0		; RV64I-NEXT: addiw a1, a1, 777
; RV64I-NEXT: call __umoddi3		; RV64I-NEXT: call __muldi3
; RV64I-NEXT: mv s1, a0		; RV64I-NEXT: srli a0, a0, 32
		; RV64I-NEXT: sub a1, s0, a0
		; RV64I-NEXT: srliw a1, a1, 1
		; RV64I-NEXT: add a0, a1, a0
		; RV64I-NEXT: srli s1, a0, 6
; RV64I-NEXT: addi a1, zero, 95		; RV64I-NEXT: addi a1, zero, 95
; RV64I-NEXT: mv a0, s0		; RV64I-NEXT: mv a0, s1
; RV64I-NEXT: call __udivdi3		; RV64I-NEXT: call __muldi3
; RV64I-NEXT: add a0, s1, a0		; RV64I-NEXT: sub a0, s0, a0
		; RV64I-NEXT: addw a0, a0, s1
; RV64I-NEXT: ld s1, 8(sp)		; RV64I-NEXT: ld s1, 8(sp)
; RV64I-NEXT: ld s0, 16(sp)		; RV64I-NEXT: ld s0, 16(sp)
; RV64I-NEXT: ld ra, 24(sp)		; RV64I-NEXT: ld ra, 24(sp)
; RV64I-NEXT: addi sp, sp, 32		; RV64I-NEXT: addi sp, sp, 32
; RV64I-NEXT: ret		; RV64I-NEXT: ret
;		;
; RV64IM-LABEL: combine_urem_udiv:		; RV64IM-LABEL: combine_urem_udiv:
; RV64IM: # %bb.0:		; RV64IM: # %bb.0:
; RV64IM-NEXT: slli a0, a0, 32		; RV64IM-NEXT: slli a1, a0, 32
; RV64IM-NEXT: srli a0, a0, 32		; RV64IM-NEXT: srli a1, a1, 32
; RV64IM-NEXT: lui a1, 1423		; RV64IM-NEXT: lui a2, 364242
; RV64IM-NEXT: addiw a1, a1, -733		; RV64IM-NEXT: addiw a2, a2, 777
; RV64IM-NEXT: slli a1, a1, 15		; RV64IM-NEXT: mul a1, a1, a2
; RV64IM-NEXT: addi a1, a1, 1035		; RV64IM-NEXT: srli a1, a1, 32
; RV64IM-NEXT: slli a1, a1, 13
; RV64IM-NEXT: addi a1, a1, -1811
; RV64IM-NEXT: slli a1, a1, 12
; RV64IM-NEXT: addi a1, a1, 561
; RV64IM-NEXT: mulhu a1, a0, a1
; RV64IM-NEXT: sub a2, a0, a1		; RV64IM-NEXT: sub a2, a0, a1
; RV64IM-NEXT: srli a2, a2, 1		; RV64IM-NEXT: srliw a2, a2, 1
; RV64IM-NEXT: add a1, a2, a1		; RV64IM-NEXT: add a1, a2, a1
; RV64IM-NEXT: srli a1, a1, 6		; RV64IM-NEXT: srli a1, a1, 6
; RV64IM-NEXT: addi a2, zero, 95		; RV64IM-NEXT: addi a2, zero, 95
; RV64IM-NEXT: mul a2, a1, a2		; RV64IM-NEXT: mul a2, a1, a2
; RV64IM-NEXT: sub a0, a0, a2		; RV64IM-NEXT: sub a0, a0, a2
; RV64IM-NEXT: add a0, a0, a1		; RV64IM-NEXT: addw a0, a0, a1
; RV64IM-NEXT: ret		; RV64IM-NEXT: ret
%1 = urem i32 %x, 95		%1 = urem i32 %x, 95
%2 = udiv i32 %x, 95		%2 = udiv i32 %x, 95
%3 = add i32 %1, %2		%3 = add i32 %1, %2
ret i32 %3		ret i32 %3
}		}

; Don't fold for divisors that are a power of two.		; Don't fold for divisors that are a power of two.
Show All 24 Lines	; CHECK-NEXT: ret
%1 = urem i32 %x, 4294967296		%1 = urem i32 %x, 4294967296
ret i32 %1		ret i32 %1
}		}

; Don't fold i64 urem		; Don't fold i64 urem
define i64 @dont_fold_urem_i64(i64 %x) nounwind {		define i64 @dont_fold_urem_i64(i64 %x) nounwind {
; RV32I-LABEL: dont_fold_urem_i64:		; RV32I-LABEL: dont_fold_urem_i64:
; RV32I: # %bb.0:		; RV32I: # %bb.0:
; RV32I-NEXT: addi sp, sp, -16		; RV32I-NEXT: addi sp, sp, -64
; RV32I-NEXT: sw ra, 12(sp)		; RV32I-NEXT: sw ra, 60(sp)
		; RV32I-NEXT: sw s0, 56(sp)
		; RV32I-NEXT: sw s1, 52(sp)
		; RV32I-NEXT: mv s0, a1
		; RV32I-NEXT: mv s1, a0
		; RV32I-NEXT: sw zero, 12(sp)
		; RV32I-NEXT: sw zero, 8(sp)
		; RV32I-NEXT: sw zero, 28(sp)
		; RV32I-NEXT: sw zero, 24(sp)
		; RV32I-NEXT: lui a0, 342392
		; RV32I-NEXT: addi a0, a0, 668
		; RV32I-NEXT: sw a0, 4(sp)
		; RV32I-NEXT: lui a0, 770382
		; RV32I-NEXT: addi a0, a0, 1505
		; RV32I-NEXT: sw a0, 0(sp)
		; RV32I-NEXT: srli a0, a1, 1
		; RV32I-NEXT: sw a0, 20(sp)
		; RV32I-NEXT: slli a0, a1, 31
		; RV32I-NEXT: srli a1, s1, 1
		; RV32I-NEXT: or a3, a1, a0
		; RV32I-NEXT: addi a0, sp, 32
		; RV32I-NEXT: addi a1, sp, 16
		; RV32I-NEXT: mv a2, sp
		; RV32I-NEXT: sw a3, 16(sp)
		; RV32I-NEXT: call __multi3
		; RV32I-NEXT: lw a1, 44(sp)
		; RV32I-NEXT: lw a0, 40(sp)
		; RV32I-NEXT: slli a2, a1, 28
		; RV32I-NEXT: srli a0, a0, 4
		; RV32I-NEXT: or a0, a0, a2
		; RV32I-NEXT: srli a1, a1, 4
; RV32I-NEXT: addi a2, zero, 98		; RV32I-NEXT: addi a2, zero, 98
; RV32I-NEXT: mv a3, zero		; RV32I-NEXT: mv a3, zero
; RV32I-NEXT: call __umoddi3		; RV32I-NEXT: call __muldi3
; RV32I-NEXT: lw ra, 12(sp)		; RV32I-NEXT: sltu a2, s1, a0
; RV32I-NEXT: addi sp, sp, 16		; RV32I-NEXT: sub a1, s0, a1
		; RV32I-NEXT: sub a1, a1, a2
		; RV32I-NEXT: sub a0, s1, a0
		; RV32I-NEXT: lw s1, 52(sp)
		; RV32I-NEXT: lw s0, 56(sp)
		; RV32I-NEXT: lw ra, 60(sp)
		; RV32I-NEXT: addi sp, sp, 64
; RV32I-NEXT: ret		; RV32I-NEXT: ret
;		;
; RV32IM-LABEL: dont_fold_urem_i64:		; RV32IM-LABEL: dont_fold_urem_i64:
; RV32IM: # %bb.0:		; RV32IM: # %bb.0:
; RV32IM-NEXT: addi sp, sp, -16		; RV32IM-NEXT: addi sp, sp, -64
; RV32IM-NEXT: sw ra, 12(sp)		; RV32IM-NEXT: sw ra, 60(sp)
; RV32IM-NEXT: addi a2, zero, 98		; RV32IM-NEXT: sw s0, 56(sp)
; RV32IM-NEXT: mv a3, zero		; RV32IM-NEXT: sw s1, 52(sp)
; RV32IM-NEXT: call __umoddi3		; RV32IM-NEXT: mv s0, a1
; RV32IM-NEXT: lw ra, 12(sp)		; RV32IM-NEXT: mv s1, a0
; RV32IM-NEXT: addi sp, sp, 16		; RV32IM-NEXT: sw zero, 12(sp)
		; RV32IM-NEXT: sw zero, 8(sp)
		; RV32IM-NEXT: sw zero, 28(sp)
		; RV32IM-NEXT: sw zero, 24(sp)
		; RV32IM-NEXT: lui a0, 342392
		; RV32IM-NEXT: addi a0, a0, 668
		; RV32IM-NEXT: sw a0, 4(sp)
		; RV32IM-NEXT: lui a0, 770382
		; RV32IM-NEXT: addi a0, a0, 1505
		; RV32IM-NEXT: sw a0, 0(sp)
		; RV32IM-NEXT: srli a0, a1, 1
		; RV32IM-NEXT: sw a0, 20(sp)
		; RV32IM-NEXT: slli a0, a1, 31
		; RV32IM-NEXT: srli a1, s1, 1
		; RV32IM-NEXT: or a3, a1, a0
		; RV32IM-NEXT: addi a0, sp, 32
		; RV32IM-NEXT: addi a1, sp, 16
		; RV32IM-NEXT: mv a2, sp
		; RV32IM-NEXT: sw a3, 16(sp)
		; RV32IM-NEXT: call __multi3
		; RV32IM-NEXT: lw a0, 44(sp)
		; RV32IM-NEXT: srli a1, a0, 4
		; RV32IM-NEXT: lw a2, 40(sp)
		; RV32IM-NEXT: addi a3, zero, 98
		; RV32IM-NEXT: mul a1, a1, a3
		; RV32IM-NEXT: slli a0, a0, 28
		; RV32IM-NEXT: srli a2, a2, 4
		; RV32IM-NEXT: or a0, a2, a0
		; RV32IM-NEXT: mulhu a2, a0, a3
		; RV32IM-NEXT: add a1, a2, a1
		; RV32IM-NEXT: sub a1, s0, a1
		; RV32IM-NEXT: mul a0, a0, a3
		; RV32IM-NEXT: sltu a2, s1, a0
		; RV32IM-NEXT: sub a1, a1, a2
		; RV32IM-NEXT: sub a0, s1, a0
		; RV32IM-NEXT: lw s1, 52(sp)
		; RV32IM-NEXT: lw s0, 56(sp)
		; RV32IM-NEXT: lw ra, 60(sp)
		; RV32IM-NEXT: addi sp, sp, 64
; RV32IM-NEXT: ret		; RV32IM-NEXT: ret
;		;
; RV64I-LABEL: dont_fold_urem_i64:		; RV64I-LABEL: dont_fold_urem_i64:
; RV64I: # %bb.0:		; RV64I: # %bb.0:
; RV64I-NEXT: addi sp, sp, -16		; RV64I-NEXT: addi sp, sp, -16
; RV64I-NEXT: sd ra, 8(sp)		; RV64I-NEXT: sd ra, 8(sp)
		; RV64I-NEXT: sd s0, 0(sp)
		; RV64I-NEXT: mv s0, a0
		; RV64I-NEXT: srli a0, a0, 1
		; RV64I-NEXT: lui a1, 2675
		; RV64I-NEXT: addiw a1, a1, -251
		; RV64I-NEXT: slli a1, a1, 13
		; RV64I-NEXT: addi a1, a1, 1839
		; RV64I-NEXT: slli a1, a1, 13
		; RV64I-NEXT: addi a1, a1, 167
		; RV64I-NEXT: slli a1, a1, 13
		; RV64I-NEXT: addi a2, a1, 1505
		; RV64I-NEXT: mv a1, zero
		; RV64I-NEXT: mv a3, zero
		; RV64I-NEXT: call __multi3
		; RV64I-NEXT: srli a0, a1, 4
; RV64I-NEXT: addi a1, zero, 98		; RV64I-NEXT: addi a1, zero, 98
; RV64I-NEXT: call __umoddi3		; RV64I-NEXT: call __muldi3
		; RV64I-NEXT: sub a0, s0, a0
		; RV64I-NEXT: ld s0, 0(sp)
; RV64I-NEXT: ld ra, 8(sp)		; RV64I-NEXT: ld ra, 8(sp)
; RV64I-NEXT: addi sp, sp, 16		; RV64I-NEXT: addi sp, sp, 16
; RV64I-NEXT: ret		; RV64I-NEXT: ret
;		;
; RV64IM-LABEL: dont_fold_urem_i64:		; RV64IM-LABEL: dont_fold_urem_i64:
; RV64IM: # %bb.0:		; RV64IM: # %bb.0:
; RV64IM-NEXT: srli a1, a0, 1		; RV64IM-NEXT: srli a1, a0, 1
; RV64IM-NEXT: lui a2, 2675		; RV64IM-NEXT: lui a2, 2675
Show All 16 Lines

llvm/test/CodeGen/RISCV/urem-vector-lkk.ll

	Show All 14 Lines
	; RV32I-NEXT: addi sp, sp, -32			; RV32I-NEXT: addi sp, sp, -32
	; RV32I-NEXT: sw ra, 28(sp)			; RV32I-NEXT: sw ra, 28(sp)
	; RV32I-NEXT: sw s0, 24(sp)			; RV32I-NEXT: sw s0, 24(sp)
	; RV32I-NEXT: sw s1, 20(sp)			; RV32I-NEXT: sw s1, 20(sp)
	; RV32I-NEXT: sw s2, 16(sp)			; RV32I-NEXT: sw s2, 16(sp)
	; RV32I-NEXT: sw s3, 12(sp)			; RV32I-NEXT: sw s3, 12(sp)
	; RV32I-NEXT: sw s4, 8(sp)			; RV32I-NEXT: sw s4, 8(sp)
	; RV32I-NEXT: sw s5, 4(sp)			; RV32I-NEXT: sw s5, 4(sp)
	; RV32I-NEXT: lhu s2, 12(a1)			; RV32I-NEXT: lhu s2, 0(a1)
	; RV32I-NEXT: lhu s3, 8(a1)			; RV32I-NEXT: lhu s3, 8(a1)
	; RV32I-NEXT: lhu s0, 4(a1)			; RV32I-NEXT: lhu s4, 4(a1)
	; RV32I-NEXT: lhu a2, 0(a1)			; RV32I-NEXT: lhu s1, 12(a1)
	; RV32I-NEXT: mv s1, a0
	; RV32I-NEXT: addi a1, zero, 95
	; RV32I-NEXT: mv a0, a2
	; RV32I-NEXT: call __umodsi3
	; RV32I-NEXT: mv s4, a0
	; RV32I-NEXT: addi a1, zero, 124
	; RV32I-NEXT: mv a0, s0
	; RV32I-NEXT: call __umodsi3
	; RV32I-NEXT: mv s5, a0
	; RV32I-NEXT: addi a1, zero, 98
	; RV32I-NEXT: mv a0, s3
	; RV32I-NEXT: call __umodsi3
	; RV32I-NEXT: mv s0, a0			; RV32I-NEXT: mv s0, a0
				; RV32I-NEXT: addi a1, zero, 1373
				; RV32I-NEXT: mv a0, s1
				; RV32I-NEXT: call __mulsi3
				; RV32I-NEXT: srli a0, a0, 16
				; RV32I-NEXT: sub a1, s1, a0
				; RV32I-NEXT: lui a2, 16
				; RV32I-NEXT: addi a3, a2, -2
				; RV32I-NEXT: and a1, a1, a3
				; RV32I-NEXT: srli a1, a1, 1
				; RV32I-NEXT: add a0, a1, a0
				; RV32I-NEXT: addi a1, a2, -512
				; RV32I-NEXT: and a0, a0, a1
				; RV32I-NEXT: srli a0, a0, 9
	; RV32I-NEXT: addi a1, zero, 1003			; RV32I-NEXT: addi a1, zero, 1003
				; RV32I-NEXT: call __mulsi3
				; RV32I-NEXT: sub s5, s1, a0
				; RV32I-NEXT: srli a0, s4, 2
				; RV32I-NEXT: lui a1, 4
				; RV32I-NEXT: addi a1, a1, 529
				; RV32I-NEXT: call __mulsi3
				; RV32I-NEXT: srli a0, a0, 19
				; RV32I-NEXT: addi a1, zero, 124
				; RV32I-NEXT: call __mulsi3
				; RV32I-NEXT: sub s4, s4, a0
				; RV32I-NEXT: srli a0, s3, 1
				; RV32I-NEXT: lui a1, 1
				; RV32I-NEXT: addi a1, a1, -1421
				; RV32I-NEXT: call __mulsi3
				; RV32I-NEXT: srli a0, a0, 17
				; RV32I-NEXT: addi a1, zero, 98
				; RV32I-NEXT: call __mulsi3
				; RV32I-NEXT: sub s1, s3, a0
				; RV32I-NEXT: lui a0, 11
				; RV32I-NEXT: addi a1, a0, -905
	; RV32I-NEXT: mv a0, s2			; RV32I-NEXT: mv a0, s2
	; RV32I-NEXT: call __umodsi3			; RV32I-NEXT: call __mulsi3
	; RV32I-NEXT: sh a0, 6(s1)			; RV32I-NEXT: srli a0, a0, 22
	; RV32I-NEXT: sh s0, 4(s1)			; RV32I-NEXT: addi a1, zero, 95
	; RV32I-NEXT: sh s5, 2(s1)			; RV32I-NEXT: call __mulsi3
	; RV32I-NEXT: sh s4, 0(s1)			; RV32I-NEXT: sub a0, s2, a0
				; RV32I-NEXT: sh a0, 0(s0)
				; RV32I-NEXT: sh s1, 4(s0)
				; RV32I-NEXT: sh s4, 2(s0)
				; RV32I-NEXT: sh s5, 6(s0)
	; RV32I-NEXT: lw s5, 4(sp)			; RV32I-NEXT: lw s5, 4(sp)
	; RV32I-NEXT: lw s4, 8(sp)			; RV32I-NEXT: lw s4, 8(sp)
	; RV32I-NEXT: lw s3, 12(sp)			; RV32I-NEXT: lw s3, 12(sp)
	; RV32I-NEXT: lw s2, 16(sp)			; RV32I-NEXT: lw s2, 16(sp)
	; RV32I-NEXT: lw s1, 20(sp)			; RV32I-NEXT: lw s1, 20(sp)
	; RV32I-NEXT: lw s0, 24(sp)			; RV32I-NEXT: lw s0, 24(sp)
	; RV32I-NEXT: lw ra, 28(sp)			; RV32I-NEXT: lw ra, 28(sp)
	; RV32I-NEXT: addi sp, sp, 32			; RV32I-NEXT: addi sp, sp, 32
	; RV32I-NEXT: ret			; RV32I-NEXT: ret
	;			;
	; RV32IM-LABEL: fold_urem_vec_1:			; RV32IM-LABEL: fold_urem_vec_1:
	; RV32IM: # %bb.0:			; RV32IM: # %bb.0:
	; RV32IM-NEXT: lhu a6, 12(a1)			; RV32IM-NEXT: lhu a6, 0(a1)
	; RV32IM-NEXT: lhu a3, 8(a1)			; RV32IM-NEXT: lhu a3, 12(a1)
	; RV32IM-NEXT: lhu a4, 0(a1)			; RV32IM-NEXT: lhu a7, 8(a1)
	; RV32IM-NEXT: lhu a1, 4(a1)			; RV32IM-NEXT: lhu a1, 4(a1)
	; RV32IM-NEXT: lui a5, 364242			; RV32IM-NEXT: addi a5, zero, 1373
	; RV32IM-NEXT: addi a5, a5, 777			; RV32IM-NEXT: mul a5, a3, a5
	; RV32IM-NEXT: mulhu a5, a4, a5			; RV32IM-NEXT: srli a5, a5, 16
	; RV32IM-NEXT: sub a2, a4, a5			; RV32IM-NEXT: sub a2, a3, a5
				; RV32IM-NEXT: lui a4, 16
				; RV32IM-NEXT: addi a4, a4, -2
				; RV32IM-NEXT: and a2, a2, a4
	; RV32IM-NEXT: srli a2, a2, 1			; RV32IM-NEXT: srli a2, a2, 1
	; RV32IM-NEXT: add a2, a2, a5			; RV32IM-NEXT: add a2, a2, a5
	; RV32IM-NEXT: srli a2, a2, 6			; RV32IM-NEXT: srli a2, a2, 9
				; RV32IM-NEXT: addi a4, zero, 1003
				; RV32IM-NEXT: mul a2, a2, a4
				; RV32IM-NEXT: sub a2, a3, a2
				; RV32IM-NEXT: srli a3, a1, 2
				; RV32IM-NEXT: lui a4, 4
				; RV32IM-NEXT: addi a4, a4, 529
				; RV32IM-NEXT: mul a3, a3, a4
				; RV32IM-NEXT: srli a3, a3, 19
				; RV32IM-NEXT: addi a4, zero, 124
				; RV32IM-NEXT: mul a3, a3, a4
				; RV32IM-NEXT: sub a1, a1, a3
				; RV32IM-NEXT: srli a3, a7, 1
				; RV32IM-NEXT: lui a4, 1
				; RV32IM-NEXT: addi a4, a4, -1421
				; RV32IM-NEXT: mul a3, a3, a4
				; RV32IM-NEXT: srli a3, a3, 17
				; RV32IM-NEXT: addi a4, zero, 98
				; RV32IM-NEXT: mul a3, a3, a4
				; RV32IM-NEXT: sub a3, a7, a3
				; RV32IM-NEXT: lui a4, 11
				; RV32IM-NEXT: addi a4, a4, -905
				; RV32IM-NEXT: mul a4, a6, a4
				; RV32IM-NEXT: srli a4, a4, 22
	; RV32IM-NEXT: addi a5, zero, 95			; RV32IM-NEXT: addi a5, zero, 95
	; RV32IM-NEXT: mul a2, a2, a5
	; RV32IM-NEXT: sub a2, a4, a2
	; RV32IM-NEXT: srli a4, a1, 2
	; RV32IM-NEXT: lui a5, 135300
	; RV32IM-NEXT: addi a5, a5, 529
	; RV32IM-NEXT: mulhu a4, a4, a5
	; RV32IM-NEXT: srli a4, a4, 2
	; RV32IM-NEXT: addi a5, zero, 124
	; RV32IM-NEXT: mul a4, a4, a5
	; RV32IM-NEXT: sub a1, a1, a4
	; RV32IM-NEXT: lui a4, 342392
	; RV32IM-NEXT: addi a4, a4, 669
	; RV32IM-NEXT: mulhu a4, a3, a4
	; RV32IM-NEXT: srli a4, a4, 5
	; RV32IM-NEXT: addi a5, zero, 98
	; RV32IM-NEXT: mul a4, a4, a5
	; RV32IM-NEXT: sub a3, a3, a4
	; RV32IM-NEXT: lui a4, 267633
	; RV32IM-NEXT: addi a4, a4, -1809
	; RV32IM-NEXT: mulhu a4, a6, a4
	; RV32IM-NEXT: srli a4, a4, 8
	; RV32IM-NEXT: addi a5, zero, 1003
	; RV32IM-NEXT: mul a4, a4, a5			; RV32IM-NEXT: mul a4, a4, a5
	; RV32IM-NEXT: sub a4, a6, a4			; RV32IM-NEXT: sub a4, a6, a4
	; RV32IM-NEXT: sh a4, 6(a0)			; RV32IM-NEXT: sh a4, 0(a0)
	; RV32IM-NEXT: sh a3, 4(a0)			; RV32IM-NEXT: sh a3, 4(a0)
	; RV32IM-NEXT: sh a1, 2(a0)			; RV32IM-NEXT: sh a1, 2(a0)
	; RV32IM-NEXT: sh a2, 0(a0)			; RV32IM-NEXT: sh a2, 6(a0)
	; RV32IM-NEXT: ret			; RV32IM-NEXT: ret
	;			;
	; RV64I-LABEL: fold_urem_vec_1:			; RV64I-LABEL: fold_urem_vec_1:
	; RV64I: # %bb.0:			; RV64I: # %bb.0:
	; RV64I-NEXT: addi sp, sp, -64			; RV64I-NEXT: addi sp, sp, -64
	; RV64I-NEXT: sd ra, 56(sp)			; RV64I-NEXT: sd ra, 56(sp)
	; RV64I-NEXT: sd s0, 48(sp)			; RV64I-NEXT: sd s0, 48(sp)
	; RV64I-NEXT: sd s1, 40(sp)			; RV64I-NEXT: sd s1, 40(sp)
	; RV64I-NEXT: sd s2, 32(sp)			; RV64I-NEXT: sd s2, 32(sp)
	; RV64I-NEXT: sd s3, 24(sp)			; RV64I-NEXT: sd s3, 24(sp)
	; RV64I-NEXT: sd s4, 16(sp)			; RV64I-NEXT: sd s4, 16(sp)
	; RV64I-NEXT: sd s5, 8(sp)			; RV64I-NEXT: sd s5, 8(sp)
	; RV64I-NEXT: lhu s2, 24(a1)			; RV64I-NEXT: lhu s2, 0(a1)
	; RV64I-NEXT: lhu s3, 16(a1)			; RV64I-NEXT: lhu s3, 16(a1)
	; RV64I-NEXT: lhu s0, 8(a1)			; RV64I-NEXT: lhu s4, 8(a1)
	; RV64I-NEXT: lhu a2, 0(a1)			; RV64I-NEXT: lhu s1, 24(a1)
	; RV64I-NEXT: mv s1, a0
	; RV64I-NEXT: addi a1, zero, 95
	; RV64I-NEXT: mv a0, a2
	; RV64I-NEXT: call __umoddi3
	; RV64I-NEXT: mv s4, a0
	; RV64I-NEXT: addi a1, zero, 124
	; RV64I-NEXT: mv a0, s0
	; RV64I-NEXT: call __umoddi3
	; RV64I-NEXT: mv s5, a0
	; RV64I-NEXT: addi a1, zero, 98
	; RV64I-NEXT: mv a0, s3
	; RV64I-NEXT: call __umoddi3
	; RV64I-NEXT: mv s0, a0			; RV64I-NEXT: mv s0, a0
				; RV64I-NEXT: addi a1, zero, 1373
				; RV64I-NEXT: mv a0, s1
				; RV64I-NEXT: call __muldi3
				; RV64I-NEXT: srli a0, a0, 16
				; RV64I-NEXT: sub a1, s1, a0
				; RV64I-NEXT: lui a2, 16
				; RV64I-NEXT: addiw a3, a2, -2
				; RV64I-NEXT: and a1, a1, a3
				; RV64I-NEXT: srli a1, a1, 1
				; RV64I-NEXT: add a0, a1, a0
				; RV64I-NEXT: addiw a1, a2, -512
				; RV64I-NEXT: and a0, a0, a1
				; RV64I-NEXT: srli a0, a0, 9
	; RV64I-NEXT: addi a1, zero, 1003			; RV64I-NEXT: addi a1, zero, 1003
				; RV64I-NEXT: call __muldi3
				; RV64I-NEXT: sub s5, s1, a0
				; RV64I-NEXT: srli a0, s4, 2
				; RV64I-NEXT: lui a1, 4
				; RV64I-NEXT: addiw a1, a1, 529
				; RV64I-NEXT: call __muldi3
				; RV64I-NEXT: srli a0, a0, 19
				; RV64I-NEXT: addi a1, zero, 124
				; RV64I-NEXT: call __muldi3
				; RV64I-NEXT: sub s4, s4, a0
				; RV64I-NEXT: srli a0, s3, 1
				; RV64I-NEXT: lui a1, 1
				; RV64I-NEXT: addiw a1, a1, -1421
				; RV64I-NEXT: call __muldi3
				; RV64I-NEXT: srli a0, a0, 17
				; RV64I-NEXT: addi a1, zero, 98
				; RV64I-NEXT: call __muldi3
				; RV64I-NEXT: sub s1, s3, a0
				; RV64I-NEXT: lui a0, 11
				; RV64I-NEXT: addiw a1, a0, -905
	; RV64I-NEXT: mv a0, s2			; RV64I-NEXT: mv a0, s2
	; RV64I-NEXT: call __umoddi3			; RV64I-NEXT: call __muldi3
	; RV64I-NEXT: sh a0, 6(s1)			; RV64I-NEXT: srli a0, a0, 22
	; RV64I-NEXT: sh s0, 4(s1)			; RV64I-NEXT: addi a1, zero, 95
	; RV64I-NEXT: sh s5, 2(s1)			; RV64I-NEXT: call __muldi3
	; RV64I-NEXT: sh s4, 0(s1)			; RV64I-NEXT: sub a0, s2, a0
				; RV64I-NEXT: sh a0, 0(s0)
				; RV64I-NEXT: sh s1, 4(s0)
				; RV64I-NEXT: sh s4, 2(s0)
				; RV64I-NEXT: sh s5, 6(s0)
	; RV64I-NEXT: ld s5, 8(sp)			; RV64I-NEXT: ld s5, 8(sp)
	; RV64I-NEXT: ld s4, 16(sp)			; RV64I-NEXT: ld s4, 16(sp)
	; RV64I-NEXT: ld s3, 24(sp)			; RV64I-NEXT: ld s3, 24(sp)
	; RV64I-NEXT: ld s2, 32(sp)			; RV64I-NEXT: ld s2, 32(sp)
	; RV64I-NEXT: ld s1, 40(sp)			; RV64I-NEXT: ld s1, 40(sp)
	; RV64I-NEXT: ld s0, 48(sp)			; RV64I-NEXT: ld s0, 48(sp)
	; RV64I-NEXT: ld ra, 56(sp)			; RV64I-NEXT: ld ra, 56(sp)
	; RV64I-NEXT: addi sp, sp, 64			; RV64I-NEXT: addi sp, sp, 64
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IM-LABEL: fold_urem_vec_1:			; RV64IM-LABEL: fold_urem_vec_1:
	; RV64IM: # %bb.0:			; RV64IM: # %bb.0:
	; RV64IM-NEXT: lhu a6, 24(a1)			; RV64IM-NEXT: lhu a6, 0(a1)
	; RV64IM-NEXT: lhu a3, 16(a1)			; RV64IM-NEXT: lhu a3, 24(a1)
	; RV64IM-NEXT: lhu a4, 8(a1)			; RV64IM-NEXT: lhu a7, 16(a1)
	; RV64IM-NEXT: lhu a1, 0(a1)			; RV64IM-NEXT: lhu a1, 8(a1)
	; RV64IM-NEXT: lui a5, 1423			; RV64IM-NEXT: addi a5, zero, 1373
	; RV64IM-NEXT: addiw a5, a5, -733			; RV64IM-NEXT: mul a5, a3, a5
	; RV64IM-NEXT: slli a5, a5, 15			; RV64IM-NEXT: srli a5, a5, 16
	; RV64IM-NEXT: addi a5, a5, 1035			; RV64IM-NEXT: sub a2, a3, a5
	; RV64IM-NEXT: slli a5, a5, 13			; RV64IM-NEXT: lui a4, 16
	; RV64IM-NEXT: addi a5, a5, -1811			; RV64IM-NEXT: addiw a4, a4, -2
	; RV64IM-NEXT: slli a5, a5, 12			; RV64IM-NEXT: and a2, a2, a4
	; RV64IM-NEXT: addi a5, a5, 561
	; RV64IM-NEXT: mulhu a5, a1, a5
	; RV64IM-NEXT: sub a2, a1, a5
	; RV64IM-NEXT: srli a2, a2, 1			; RV64IM-NEXT: srli a2, a2, 1
	; RV64IM-NEXT: add a2, a2, a5			; RV64IM-NEXT: add a2, a2, a5
	; RV64IM-NEXT: srli a2, a2, 6			; RV64IM-NEXT: srli a2, a2, 9
				; RV64IM-NEXT: addi a4, zero, 1003
				; RV64IM-NEXT: mul a2, a2, a4
				; RV64IM-NEXT: sub a2, a3, a2
				; RV64IM-NEXT: srli a3, a1, 2
				; RV64IM-NEXT: lui a4, 4
				; RV64IM-NEXT: addiw a4, a4, 529
				; RV64IM-NEXT: mul a3, a3, a4
				; RV64IM-NEXT: srli a3, a3, 19
				; RV64IM-NEXT: addi a4, zero, 124
				; RV64IM-NEXT: mul a3, a3, a4
				; RV64IM-NEXT: sub a1, a1, a3
				; RV64IM-NEXT: srli a3, a7, 1
				; RV64IM-NEXT: lui a4, 1
				; RV64IM-NEXT: addiw a4, a4, -1421
				; RV64IM-NEXT: mul a3, a3, a4
				; RV64IM-NEXT: srli a3, a3, 17
				; RV64IM-NEXT: addi a4, zero, 98
				; RV64IM-NEXT: mul a3, a3, a4
				; RV64IM-NEXT: sub a3, a7, a3
				; RV64IM-NEXT: lui a4, 11
				; RV64IM-NEXT: addiw a4, a4, -905
				; RV64IM-NEXT: mul a4, a6, a4
				; RV64IM-NEXT: srli a4, a4, 22
	; RV64IM-NEXT: addi a5, zero, 95			; RV64IM-NEXT: addi a5, zero, 95
	; RV64IM-NEXT: mul a2, a2, a5
	; RV64IM-NEXT: sub a1, a1, a2
	; RV64IM-NEXT: srli a2, a4, 2
	; RV64IM-NEXT: lui a5, 264
	; RV64IM-NEXT: addiw a5, a5, 1057
	; RV64IM-NEXT: slli a5, a5, 15
	; RV64IM-NEXT: addi a5, a5, 1057
	; RV64IM-NEXT: slli a5, a5, 15
	; RV64IM-NEXT: addi a5, a5, 1057
	; RV64IM-NEXT: slli a5, a5, 12
	; RV64IM-NEXT: addi a5, a5, 133
	; RV64IM-NEXT: mulhu a2, a2, a5
	; RV64IM-NEXT: srli a2, a2, 3
	; RV64IM-NEXT: addi a5, zero, 124
	; RV64IM-NEXT: mul a2, a2, a5
	; RV64IM-NEXT: sub a2, a4, a2
	; RV64IM-NEXT: srli a4, a3, 1
	; RV64IM-NEXT: lui a5, 2675
	; RV64IM-NEXT: addiw a5, a5, -251
	; RV64IM-NEXT: slli a5, a5, 13
	; RV64IM-NEXT: addi a5, a5, 1839
	; RV64IM-NEXT: slli a5, a5, 13
	; RV64IM-NEXT: addi a5, a5, 167
	; RV64IM-NEXT: slli a5, a5, 13
	; RV64IM-NEXT: addi a5, a5, 1505
	; RV64IM-NEXT: mulhu a4, a4, a5
	; RV64IM-NEXT: srli a4, a4, 4
	; RV64IM-NEXT: addi a5, zero, 98
	; RV64IM-NEXT: mul a4, a4, a5
	; RV64IM-NEXT: sub a3, a3, a4
	; RV64IM-NEXT: lui a4, 8364
	; RV64IM-NEXT: addiw a4, a4, -1977
	; RV64IM-NEXT: slli a4, a4, 12
	; RV64IM-NEXT: addi a4, a4, 1907
	; RV64IM-NEXT: slli a4, a4, 12
	; RV64IM-NEXT: addi a4, a4, 453
	; RV64IM-NEXT: slli a4, a4, 12
	; RV64IM-NEXT: addi a4, a4, 1213
	; RV64IM-NEXT: mulhu a4, a6, a4
	; RV64IM-NEXT: srli a4, a4, 7
	; RV64IM-NEXT: addi a5, zero, 1003
	; RV64IM-NEXT: mul a4, a4, a5			; RV64IM-NEXT: mul a4, a4, a5
	; RV64IM-NEXT: sub a4, a6, a4			; RV64IM-NEXT: sub a4, a6, a4
	; RV64IM-NEXT: sh a4, 6(a0)			; RV64IM-NEXT: sh a4, 0(a0)
	; RV64IM-NEXT: sh a3, 4(a0)			; RV64IM-NEXT: sh a3, 4(a0)
	; RV64IM-NEXT: sh a2, 2(a0)			; RV64IM-NEXT: sh a1, 2(a0)
	; RV64IM-NEXT: sh a1, 0(a0)			; RV64IM-NEXT: sh a2, 6(a0)
	; RV64IM-NEXT: ret			; RV64IM-NEXT: ret
	%1 = urem <4 x i16> %x, <i16 95, i16 124, i16 98, i16 1003>			%1 = urem <4 x i16> %x, <i16 95, i16 124, i16 98, i16 1003>
	ret <4 x i16> %1			ret <4 x i16> %1
	}			}

	define <4 x i16> @fold_urem_vec_2(<4 x i16> %x) nounwind {			define <4 x i16> @fold_urem_vec_2(<4 x i16> %x) nounwind {
	; RV32I-LABEL: fold_urem_vec_2:			; RV32I-LABEL: fold_urem_vec_2:
	; RV32I: # %bb.0:			; RV32I: # %bb.0:
	; RV32I-NEXT: addi sp, sp, -32			; RV32I-NEXT: addi sp, sp, -32
	; RV32I-NEXT: sw ra, 28(sp)			; RV32I-NEXT: sw ra, 28(sp)
	; RV32I-NEXT: sw s0, 24(sp)			; RV32I-NEXT: sw s0, 24(sp)
	; RV32I-NEXT: sw s1, 20(sp)			; RV32I-NEXT: sw s1, 20(sp)
	; RV32I-NEXT: sw s2, 16(sp)			; RV32I-NEXT: sw s2, 16(sp)
	; RV32I-NEXT: sw s3, 12(sp)			; RV32I-NEXT: sw s3, 12(sp)
	; RV32I-NEXT: sw s4, 8(sp)			; RV32I-NEXT: sw s4, 8(sp)
	; RV32I-NEXT: sw s5, 4(sp)			; RV32I-NEXT: sw s5, 4(sp)
				; RV32I-NEXT: sw s6, 0(sp)
	; RV32I-NEXT: lhu s2, 12(a1)			; RV32I-NEXT: lhu s2, 12(a1)
	; RV32I-NEXT: lhu s3, 8(a1)			; RV32I-NEXT: lhu s3, 8(a1)
	; RV32I-NEXT: lhu s0, 4(a1)			; RV32I-NEXT: lhu s4, 4(a1)
	; RV32I-NEXT: lhu a2, 0(a1)			; RV32I-NEXT: lhu s1, 0(a1)
	; RV32I-NEXT: mv s1, a0
	; RV32I-NEXT: addi a1, zero, 95
	; RV32I-NEXT: mv a0, a2
	; RV32I-NEXT: call __umodsi3
	; RV32I-NEXT: mv s4, a0
	; RV32I-NEXT: addi a1, zero, 95
	; RV32I-NEXT: mv a0, s0
	; RV32I-NEXT: call __umodsi3
	; RV32I-NEXT: mv s5, a0			; RV32I-NEXT: mv s5, a0
				; RV32I-NEXT: lui a0, 11
				; RV32I-NEXT: addi s0, a0, -905
				; RV32I-NEXT: mv a0, s1
				; RV32I-NEXT: mv a1, s0
				; RV32I-NEXT: call __mulsi3
				; RV32I-NEXT: srli a0, a0, 22
	; RV32I-NEXT: addi a1, zero, 95			; RV32I-NEXT: addi a1, zero, 95
				; RV32I-NEXT: call __mulsi3
				; RV32I-NEXT: sub s6, s1, a0
				; RV32I-NEXT: mv a0, s4
				; RV32I-NEXT: mv a1, s0
				; RV32I-NEXT: call __mulsi3
				; RV32I-NEXT: srli a0, a0, 22
				; RV32I-NEXT: addi a1, zero, 95
				; RV32I-NEXT: call __mulsi3
				; RV32I-NEXT: sub s4, s4, a0
	; RV32I-NEXT: mv a0, s3			; RV32I-NEXT: mv a0, s3
	; RV32I-NEXT: call __umodsi3			; RV32I-NEXT: mv a1, s0
	; RV32I-NEXT: mv s0, a0			; RV32I-NEXT: call __mulsi3
				; RV32I-NEXT: srli a0, a0, 22
	; RV32I-NEXT: addi a1, zero, 95			; RV32I-NEXT: addi a1, zero, 95
				; RV32I-NEXT: call __mulsi3
				; RV32I-NEXT: sub s1, s3, a0
	; RV32I-NEXT: mv a0, s2			; RV32I-NEXT: mv a0, s2
	; RV32I-NEXT: call __umodsi3			; RV32I-NEXT: mv a1, s0
	; RV32I-NEXT: sh a0, 6(s1)			; RV32I-NEXT: call __mulsi3
	; RV32I-NEXT: sh s0, 4(s1)			; RV32I-NEXT: srli a0, a0, 22
	; RV32I-NEXT: sh s5, 2(s1)			; RV32I-NEXT: addi a1, zero, 95
	; RV32I-NEXT: sh s4, 0(s1)			; RV32I-NEXT: call __mulsi3
				; RV32I-NEXT: sub a0, s2, a0
				; RV32I-NEXT: sh a0, 6(s5)
				; RV32I-NEXT: sh s1, 4(s5)
				; RV32I-NEXT: sh s4, 2(s5)
				; RV32I-NEXT: sh s6, 0(s5)
				; RV32I-NEXT: lw s6, 0(sp)
	; RV32I-NEXT: lw s5, 4(sp)			; RV32I-NEXT: lw s5, 4(sp)
	; RV32I-NEXT: lw s4, 8(sp)			; RV32I-NEXT: lw s4, 8(sp)
	; RV32I-NEXT: lw s3, 12(sp)			; RV32I-NEXT: lw s3, 12(sp)
	; RV32I-NEXT: lw s2, 16(sp)			; RV32I-NEXT: lw s2, 16(sp)
	; RV32I-NEXT: lw s1, 20(sp)			; RV32I-NEXT: lw s1, 20(sp)
	; RV32I-NEXT: lw s0, 24(sp)			; RV32I-NEXT: lw s0, 24(sp)
	; RV32I-NEXT: lw ra, 28(sp)			; RV32I-NEXT: lw ra, 28(sp)
	; RV32I-NEXT: addi sp, sp, 32			; RV32I-NEXT: addi sp, sp, 32
	; RV32I-NEXT: ret			; RV32I-NEXT: ret
	;			;
	; RV32IM-LABEL: fold_urem_vec_2:			; RV32IM-LABEL: fold_urem_vec_2:
	; RV32IM: # %bb.0:			; RV32IM: # %bb.0:
	; RV32IM-NEXT: lhu a6, 12(a1)			; RV32IM-NEXT: lhu a6, 12(a1)
	; RV32IM-NEXT: lhu a7, 8(a1)			; RV32IM-NEXT: lhu a3, 8(a1)
	; RV32IM-NEXT: lhu a4, 0(a1)			; RV32IM-NEXT: lhu a4, 0(a1)
	; RV32IM-NEXT: lhu a1, 4(a1)			; RV32IM-NEXT: lhu a1, 4(a1)
	; RV32IM-NEXT: lui a5, 364242			; RV32IM-NEXT: lui a5, 11
	; RV32IM-NEXT: addi a5, a5, 777			; RV32IM-NEXT: addi a5, a5, -905
	; RV32IM-NEXT: mulhu a2, a4, a5			; RV32IM-NEXT: mul a2, a4, a5
	; RV32IM-NEXT: sub a3, a4, a2			; RV32IM-NEXT: srli a2, a2, 22
	; RV32IM-NEXT: srli a3, a3, 1			; RV32IM-NEXT: addi a7, zero, 95
	; RV32IM-NEXT: add a2, a3, a2			; RV32IM-NEXT: mul a2, a2, a7
	; RV32IM-NEXT: srli a2, a2, 6			; RV32IM-NEXT: sub a2, a4, a2
	; RV32IM-NEXT: addi a3, zero, 95			; RV32IM-NEXT: mul a4, a1, a5
	; RV32IM-NEXT: mul a2, a2, a3			; RV32IM-NEXT: srli a4, a4, 22
	; RV32IM-NEXT: sub t0, a4, a2			; RV32IM-NEXT: mul a4, a4, a7
	; RV32IM-NEXT: mulhu a4, a1, a5			; RV32IM-NEXT: sub a1, a1, a4
	; RV32IM-NEXT: sub a2, a1, a4			; RV32IM-NEXT: mul a4, a3, a5
	; RV32IM-NEXT: srli a2, a2, 1			; RV32IM-NEXT: srli a4, a4, 22
	; RV32IM-NEXT: add a2, a2, a4			; RV32IM-NEXT: mul a4, a4, a7
	; RV32IM-NEXT: srli a2, a2, 6			; RV32IM-NEXT: sub a3, a3, a4
	; RV32IM-NEXT: mul a2, a2, a3			; RV32IM-NEXT: mul a4, a6, a5
	; RV32IM-NEXT: sub a1, a1, a2			; RV32IM-NEXT: srli a4, a4, 22
	; RV32IM-NEXT: mulhu a2, a7, a5			; RV32IM-NEXT: mul a4, a4, a7
	; RV32IM-NEXT: sub a4, a7, a2			; RV32IM-NEXT: sub a4, a6, a4
	; RV32IM-NEXT: srli a4, a4, 1			; RV32IM-NEXT: sh a4, 6(a0)
	; RV32IM-NEXT: add a2, a4, a2			; RV32IM-NEXT: sh a3, 4(a0)
	; RV32IM-NEXT: srli a2, a2, 6
	; RV32IM-NEXT: mul a2, a2, a3
	; RV32IM-NEXT: sub a2, a7, a2
	; RV32IM-NEXT: mulhu a4, a6, a5
	; RV32IM-NEXT: sub a5, a6, a4
	; RV32IM-NEXT: srli a5, a5, 1
	; RV32IM-NEXT: add a4, a5, a4
	; RV32IM-NEXT: srli a4, a4, 6
	; RV32IM-NEXT: mul a3, a4, a3
	; RV32IM-NEXT: sub a3, a6, a3
	; RV32IM-NEXT: sh a3, 6(a0)
	; RV32IM-NEXT: sh a2, 4(a0)
	; RV32IM-NEXT: sh a1, 2(a0)			; RV32IM-NEXT: sh a1, 2(a0)
	; RV32IM-NEXT: sh t0, 0(a0)			; RV32IM-NEXT: sh a2, 0(a0)
	; RV32IM-NEXT: ret			; RV32IM-NEXT: ret
	;			;
	; RV64I-LABEL: fold_urem_vec_2:			; RV64I-LABEL: fold_urem_vec_2:
	; RV64I: # %bb.0:			; RV64I: # %bb.0:
	; RV64I-NEXT: addi sp, sp, -64			; RV64I-NEXT: addi sp, sp, -64
	; RV64I-NEXT: sd ra, 56(sp)			; RV64I-NEXT: sd ra, 56(sp)
	; RV64I-NEXT: sd s0, 48(sp)			; RV64I-NEXT: sd s0, 48(sp)
	; RV64I-NEXT: sd s1, 40(sp)			; RV64I-NEXT: sd s1, 40(sp)
	; RV64I-NEXT: sd s2, 32(sp)			; RV64I-NEXT: sd s2, 32(sp)
	; RV64I-NEXT: sd s3, 24(sp)			; RV64I-NEXT: sd s3, 24(sp)
	; RV64I-NEXT: sd s4, 16(sp)			; RV64I-NEXT: sd s4, 16(sp)
	; RV64I-NEXT: sd s5, 8(sp)			; RV64I-NEXT: sd s5, 8(sp)
				; RV64I-NEXT: sd s6, 0(sp)
	; RV64I-NEXT: lhu s2, 24(a1)			; RV64I-NEXT: lhu s2, 24(a1)
	; RV64I-NEXT: lhu s3, 16(a1)			; RV64I-NEXT: lhu s3, 16(a1)
	; RV64I-NEXT: lhu s0, 8(a1)			; RV64I-NEXT: lhu s4, 8(a1)
	; RV64I-NEXT: lhu a2, 0(a1)			; RV64I-NEXT: lhu s1, 0(a1)
	; RV64I-NEXT: mv s1, a0
	; RV64I-NEXT: addi a1, zero, 95
	; RV64I-NEXT: mv a0, a2
	; RV64I-NEXT: call __umoddi3
	; RV64I-NEXT: mv s4, a0
	; RV64I-NEXT: addi a1, zero, 95
	; RV64I-NEXT: mv a0, s0
	; RV64I-NEXT: call __umoddi3
	; RV64I-NEXT: mv s5, a0			; RV64I-NEXT: mv s5, a0
				; RV64I-NEXT: lui a0, 11
				; RV64I-NEXT: addiw s0, a0, -905
				; RV64I-NEXT: mv a0, s1
				; RV64I-NEXT: mv a1, s0
				; RV64I-NEXT: call __muldi3
				; RV64I-NEXT: srli a0, a0, 22
				; RV64I-NEXT: addi a1, zero, 95
				; RV64I-NEXT: call __muldi3
				; RV64I-NEXT: sub s6, s1, a0
				; RV64I-NEXT: mv a0, s4
				; RV64I-NEXT: mv a1, s0
				; RV64I-NEXT: call __muldi3
				; RV64I-NEXT: srli a0, a0, 22
	; RV64I-NEXT: addi a1, zero, 95			; RV64I-NEXT: addi a1, zero, 95
				; RV64I-NEXT: call __muldi3
				; RV64I-NEXT: sub s4, s4, a0
	; RV64I-NEXT: mv a0, s3			; RV64I-NEXT: mv a0, s3
	; RV64I-NEXT: call __umoddi3			; RV64I-NEXT: mv a1, s0
	; RV64I-NEXT: mv s0, a0			; RV64I-NEXT: call __muldi3
				; RV64I-NEXT: srli a0, a0, 22
	; RV64I-NEXT: addi a1, zero, 95			; RV64I-NEXT: addi a1, zero, 95
				; RV64I-NEXT: call __muldi3
				; RV64I-NEXT: sub s1, s3, a0
	; RV64I-NEXT: mv a0, s2			; RV64I-NEXT: mv a0, s2
	; RV64I-NEXT: call __umoddi3			; RV64I-NEXT: mv a1, s0
	; RV64I-NEXT: sh a0, 6(s1)			; RV64I-NEXT: call __muldi3
	; RV64I-NEXT: sh s0, 4(s1)			; RV64I-NEXT: srli a0, a0, 22
	; RV64I-NEXT: sh s5, 2(s1)			; RV64I-NEXT: addi a1, zero, 95
	; RV64I-NEXT: sh s4, 0(s1)			; RV64I-NEXT: call __muldi3
				; RV64I-NEXT: sub a0, s2, a0
				; RV64I-NEXT: sh a0, 6(s5)
				; RV64I-NEXT: sh s1, 4(s5)
				; RV64I-NEXT: sh s4, 2(s5)
				; RV64I-NEXT: sh s6, 0(s5)
				; RV64I-NEXT: ld s6, 0(sp)
	; RV64I-NEXT: ld s5, 8(sp)			; RV64I-NEXT: ld s5, 8(sp)
	; RV64I-NEXT: ld s4, 16(sp)			; RV64I-NEXT: ld s4, 16(sp)
	; RV64I-NEXT: ld s3, 24(sp)			; RV64I-NEXT: ld s3, 24(sp)
	; RV64I-NEXT: ld s2, 32(sp)			; RV64I-NEXT: ld s2, 32(sp)
	; RV64I-NEXT: ld s1, 40(sp)			; RV64I-NEXT: ld s1, 40(sp)
	; RV64I-NEXT: ld s0, 48(sp)			; RV64I-NEXT: ld s0, 48(sp)
	; RV64I-NEXT: ld ra, 56(sp)			; RV64I-NEXT: ld ra, 56(sp)
	; RV64I-NEXT: addi sp, sp, 64			; RV64I-NEXT: addi sp, sp, 64
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IM-LABEL: fold_urem_vec_2:			; RV64IM-LABEL: fold_urem_vec_2:
	; RV64IM: # %bb.0:			; RV64IM: # %bb.0:
	; RV64IM-NEXT: lhu a6, 24(a1)			; RV64IM-NEXT: lhu a6, 24(a1)
	; RV64IM-NEXT: lhu a7, 16(a1)			; RV64IM-NEXT: lhu a3, 16(a1)
	; RV64IM-NEXT: lhu a4, 8(a1)			; RV64IM-NEXT: lhu a4, 0(a1)
	; RV64IM-NEXT: lhu a1, 0(a1)			; RV64IM-NEXT: lhu a1, 8(a1)
	; RV64IM-NEXT: lui a5, 1423			; RV64IM-NEXT: lui a5, 11
	; RV64IM-NEXT: addiw a5, a5, -733			; RV64IM-NEXT: addiw a5, a5, -905
	; RV64IM-NEXT: slli a5, a5, 15			; RV64IM-NEXT: mul a2, a4, a5
	; RV64IM-NEXT: addi a5, a5, 1035			; RV64IM-NEXT: srli a2, a2, 22
	; RV64IM-NEXT: slli a5, a5, 13			; RV64IM-NEXT: addi a7, zero, 95
	; RV64IM-NEXT: addi a5, a5, -1811			; RV64IM-NEXT: mul a2, a2, a7
	; RV64IM-NEXT: slli a5, a5, 12			; RV64IM-NEXT: sub a2, a4, a2
	; RV64IM-NEXT: addi a5, a5, 561			; RV64IM-NEXT: mul a4, a1, a5
	; RV64IM-NEXT: mulhu a2, a1, a5			; RV64IM-NEXT: srli a4, a4, 22
	; RV64IM-NEXT: sub a3, a1, a2			; RV64IM-NEXT: mul a4, a4, a7
	; RV64IM-NEXT: srli a3, a3, 1			; RV64IM-NEXT: sub a1, a1, a4
	; RV64IM-NEXT: add a2, a3, a2			; RV64IM-NEXT: mul a4, a3, a5
	; RV64IM-NEXT: srli a2, a2, 6			; RV64IM-NEXT: srli a4, a4, 22
	; RV64IM-NEXT: addi a3, zero, 95			; RV64IM-NEXT: mul a4, a4, a7
	; RV64IM-NEXT: mul a2, a2, a3			; RV64IM-NEXT: sub a3, a3, a4
	; RV64IM-NEXT: sub t0, a1, a2			; RV64IM-NEXT: mul a4, a6, a5
	; RV64IM-NEXT: mulhu a2, a4, a5			; RV64IM-NEXT: srli a4, a4, 22
	; RV64IM-NEXT: sub a1, a4, a2			; RV64IM-NEXT: mul a4, a4, a7
	; RV64IM-NEXT: srli a1, a1, 1			; RV64IM-NEXT: sub a4, a6, a4
	; RV64IM-NEXT: add a1, a1, a2			; RV64IM-NEXT: sh a4, 6(a0)
	; RV64IM-NEXT: srli a1, a1, 6			; RV64IM-NEXT: sh a3, 4(a0)
	; RV64IM-NEXT: mul a1, a1, a3
	; RV64IM-NEXT: sub a1, a4, a1
	; RV64IM-NEXT: mulhu a2, a7, a5
	; RV64IM-NEXT: sub a4, a7, a2
	; RV64IM-NEXT: srli a4, a4, 1
	; RV64IM-NEXT: add a2, a4, a2
	; RV64IM-NEXT: srli a2, a2, 6
	; RV64IM-NEXT: mul a2, a2, a3
	; RV64IM-NEXT: sub a2, a7, a2
	; RV64IM-NEXT: mulhu a4, a6, a5
	; RV64IM-NEXT: sub a5, a6, a4
	; RV64IM-NEXT: srli a5, a5, 1
	; RV64IM-NEXT: add a4, a5, a4
	; RV64IM-NEXT: srli a4, a4, 6
	; RV64IM-NEXT: mul a3, a4, a3
	; RV64IM-NEXT: sub a3, a6, a3
	; RV64IM-NEXT: sh a3, 6(a0)
	; RV64IM-NEXT: sh a2, 4(a0)
	; RV64IM-NEXT: sh a1, 2(a0)			; RV64IM-NEXT: sh a1, 2(a0)
	; RV64IM-NEXT: sh t0, 0(a0)			; RV64IM-NEXT: sh a2, 0(a0)
	; RV64IM-NEXT: ret			; RV64IM-NEXT: ret
	%1 = urem <4 x i16> %x, <i16 95, i16 95, i16 95, i16 95>			%1 = urem <4 x i16> %x, <i16 95, i16 95, i16 95, i16 95>
	ret <4 x i16> %1			ret <4 x i16> %1
	}			}


	; Don't fold if we can combine urem with udiv.			; Don't fold if we can combine urem with udiv.
	define <4 x i16> @combine_urem_udiv(<4 x i16> %x) nounwind {			define <4 x i16> @combine_urem_udiv(<4 x i16> %x) nounwind {
	; RV32I-LABEL: combine_urem_udiv:			; RV32I-LABEL: combine_urem_udiv:
	; RV32I: # %bb.0:			; RV32I: # %bb.0:
	; RV32I-NEXT: addi sp, sp, -48			; RV32I-NEXT: addi sp, sp, -48
	; RV32I-NEXT: sw ra, 44(sp)			; RV32I-NEXT: sw ra, 44(sp)
	; RV32I-NEXT: sw s0, 40(sp)			; RV32I-NEXT: sw s0, 40(sp)
	; RV32I-NEXT: sw s1, 36(sp)			; RV32I-NEXT: sw s1, 36(sp)
	; RV32I-NEXT: sw s2, 32(sp)			; RV32I-NEXT: sw s2, 32(sp)
	; RV32I-NEXT: sw s3, 28(sp)			; RV32I-NEXT: sw s3, 28(sp)
	; RV32I-NEXT: sw s4, 24(sp)			; RV32I-NEXT: sw s4, 24(sp)
	; RV32I-NEXT: sw s5, 20(sp)			; RV32I-NEXT: sw s5, 20(sp)
	; RV32I-NEXT: sw s6, 16(sp)			; RV32I-NEXT: sw s6, 16(sp)
	; RV32I-NEXT: sw s7, 12(sp)			; RV32I-NEXT: sw s7, 12(sp)
	; RV32I-NEXT: sw s8, 8(sp)			; RV32I-NEXT: sw s8, 8(sp)
	; RV32I-NEXT: sw s9, 4(sp)
	; RV32I-NEXT: lhu s2, 0(a1)			; RV32I-NEXT: lhu s2, 0(a1)
	; RV32I-NEXT: lhu s3, 4(a1)			; RV32I-NEXT: lhu s3, 4(a1)
	; RV32I-NEXT: lhu s4, 8(a1)			; RV32I-NEXT: lhu s4, 8(a1)
	; RV32I-NEXT: lhu s1, 12(a1)			; RV32I-NEXT: lhu s1, 12(a1)
	; RV32I-NEXT: mv s0, a0
	; RV32I-NEXT: addi a1, zero, 95
	; RV32I-NEXT: mv a0, s1
	; RV32I-NEXT: call __umodsi3
	; RV32I-NEXT: mv s5, a0			; RV32I-NEXT: mv s5, a0
	; RV32I-NEXT: addi a1, zero, 95			; RV32I-NEXT: lui a0, 11
	; RV32I-NEXT: mv a0, s4			; RV32I-NEXT: addi s0, a0, -905
	; RV32I-NEXT: call __umodsi3
	; RV32I-NEXT: mv s6, a0
	; RV32I-NEXT: addi a1, zero, 95
	; RV32I-NEXT: mv a0, s3
	; RV32I-NEXT: call __umodsi3
	; RV32I-NEXT: mv s7, a0
	; RV32I-NEXT: addi a1, zero, 95
	; RV32I-NEXT: mv a0, s2
	; RV32I-NEXT: call __umodsi3
	; RV32I-NEXT: mv s8, a0
	; RV32I-NEXT: addi a1, zero, 95
	; RV32I-NEXT: mv a0, s1			; RV32I-NEXT: mv a0, s1
	; RV32I-NEXT: call __udivsi3			; RV32I-NEXT: mv a1, s0
	; RV32I-NEXT: mv s9, a0			; RV32I-NEXT: call __mulsi3
				; RV32I-NEXT: srli s6, a0, 22
	; RV32I-NEXT: addi a1, zero, 95			; RV32I-NEXT: addi a1, zero, 95
				; RV32I-NEXT: mv a0, s6
				; RV32I-NEXT: call __mulsi3
				; RV32I-NEXT: sub s8, s1, a0
	; RV32I-NEXT: mv a0, s4			; RV32I-NEXT: mv a0, s4
	; RV32I-NEXT: call __udivsi3			; RV32I-NEXT: mv a1, s0
	; RV32I-NEXT: mv s4, a0			; RV32I-NEXT: call __mulsi3
				; RV32I-NEXT: srli s7, a0, 22
	; RV32I-NEXT: addi a1, zero, 95			; RV32I-NEXT: addi a1, zero, 95
				; RV32I-NEXT: mv a0, s7
				; RV32I-NEXT: call __mulsi3
				; RV32I-NEXT: sub s4, s4, a0
	; RV32I-NEXT: mv a0, s3			; RV32I-NEXT: mv a0, s3
	; RV32I-NEXT: call __udivsi3			; RV32I-NEXT: mv a1, s0
	; RV32I-NEXT: mv s1, a0			; RV32I-NEXT: call __mulsi3
				; RV32I-NEXT: srli s1, a0, 22
	; RV32I-NEXT: addi a1, zero, 95			; RV32I-NEXT: addi a1, zero, 95
				; RV32I-NEXT: mv a0, s1
				; RV32I-NEXT: call __mulsi3
				; RV32I-NEXT: sub s3, s3, a0
	; RV32I-NEXT: mv a0, s2			; RV32I-NEXT: mv a0, s2
	; RV32I-NEXT: call __udivsi3			; RV32I-NEXT: mv a1, s0
	; RV32I-NEXT: add a0, s8, a0			; RV32I-NEXT: call __mulsi3
	; RV32I-NEXT: add a1, s7, s1			; RV32I-NEXT: srli s0, a0, 22
	; RV32I-NEXT: add a2, s6, s4			; RV32I-NEXT: addi a1, zero, 95
	; RV32I-NEXT: add a3, s5, s9			; RV32I-NEXT: mv a0, s0
	; RV32I-NEXT: sh a3, 6(s0)			; RV32I-NEXT: call __mulsi3
	; RV32I-NEXT: sh a2, 4(s0)			; RV32I-NEXT: sub a0, s2, a0
	; RV32I-NEXT: sh a1, 2(s0)			; RV32I-NEXT: add a0, a0, s0
	; RV32I-NEXT: sh a0, 0(s0)			; RV32I-NEXT: add a1, s3, s1
	; RV32I-NEXT: lw s9, 4(sp)			; RV32I-NEXT: add a2, s4, s7
				; RV32I-NEXT: add a3, s8, s6
				; RV32I-NEXT: sh a3, 6(s5)
				; RV32I-NEXT: sh a2, 4(s5)
				; RV32I-NEXT: sh a1, 2(s5)
				; RV32I-NEXT: sh a0, 0(s5)
	; RV32I-NEXT: lw s8, 8(sp)			; RV32I-NEXT: lw s8, 8(sp)
	; RV32I-NEXT: lw s7, 12(sp)			; RV32I-NEXT: lw s7, 12(sp)
	; RV32I-NEXT: lw s6, 16(sp)			; RV32I-NEXT: lw s6, 16(sp)
	; RV32I-NEXT: lw s5, 20(sp)			; RV32I-NEXT: lw s5, 20(sp)
	; RV32I-NEXT: lw s4, 24(sp)			; RV32I-NEXT: lw s4, 24(sp)
	; RV32I-NEXT: lw s3, 28(sp)			; RV32I-NEXT: lw s3, 28(sp)
	; RV32I-NEXT: lw s2, 32(sp)			; RV32I-NEXT: lw s2, 32(sp)
	; RV32I-NEXT: lw s1, 36(sp)			; RV32I-NEXT: lw s1, 36(sp)
	; RV32I-NEXT: lw s0, 40(sp)			; RV32I-NEXT: lw s0, 40(sp)
	; RV32I-NEXT: lw ra, 44(sp)			; RV32I-NEXT: lw ra, 44(sp)
	; RV32I-NEXT: addi sp, sp, 48			; RV32I-NEXT: addi sp, sp, 48
	; RV32I-NEXT: ret			; RV32I-NEXT: ret
	;			;
	; RV32IM-LABEL: combine_urem_udiv:			; RV32IM-LABEL: combine_urem_udiv:
	; RV32IM: # %bb.0:			; RV32IM: # %bb.0:
	; RV32IM-NEXT: lhu a6, 0(a1)			; RV32IM-NEXT: lhu a6, 0(a1)
	; RV32IM-NEXT: lhu a7, 4(a1)			; RV32IM-NEXT: lhu a3, 4(a1)
	; RV32IM-NEXT: lhu a4, 12(a1)			; RV32IM-NEXT: lhu a4, 12(a1)
	; RV32IM-NEXT: lhu a1, 8(a1)			; RV32IM-NEXT: lhu a1, 8(a1)
	; RV32IM-NEXT: lui a5, 364242			; RV32IM-NEXT: lui a5, 11
	; RV32IM-NEXT: addi a5, a5, 777			; RV32IM-NEXT: addi a5, a5, -905
	; RV32IM-NEXT: mulhu a2, a4, a5			; RV32IM-NEXT: mul a2, a4, a5
	; RV32IM-NEXT: sub a3, a4, a2			; RV32IM-NEXT: srli t0, a2, 22
	; RV32IM-NEXT: srli a3, a3, 1			; RV32IM-NEXT: addi a7, zero, 95
	; RV32IM-NEXT: add a2, a3, a2			; RV32IM-NEXT: mul a2, t0, a7
	; RV32IM-NEXT: srli t3, a2, 6			; RV32IM-NEXT: sub t1, a4, a2
	; RV32IM-NEXT: addi t0, zero, 95			; RV32IM-NEXT: mul a4, a1, a5
	; RV32IM-NEXT: mul a3, t3, t0			; RV32IM-NEXT: srli a4, a4, 22
	; RV32IM-NEXT: sub t1, a4, a3			; RV32IM-NEXT: mul a2, a4, a7
	; RV32IM-NEXT: mulhu a4, a1, a5			; RV32IM-NEXT: sub t2, a1, a2
	; RV32IM-NEXT: sub a3, a1, a4			; RV32IM-NEXT: mul a2, a3, a5
	; RV32IM-NEXT: srli a3, a3, 1			; RV32IM-NEXT: srli a2, a2, 22
	; RV32IM-NEXT: add a3, a3, a4			; RV32IM-NEXT: mul a1, a2, a7
	; RV32IM-NEXT: srli a3, a3, 6			; RV32IM-NEXT: sub a1, a3, a1
	; RV32IM-NEXT: mul a4, a3, t0			; RV32IM-NEXT: mul a3, a6, a5
	; RV32IM-NEXT: sub t2, a1, a4			; RV32IM-NEXT: srli a3, a3, 22
	; RV32IM-NEXT: mulhu a4, a7, a5			; RV32IM-NEXT: mul a5, a3, a7
	; RV32IM-NEXT: sub a1, a7, a4
	; RV32IM-NEXT: srli a1, a1, 1
	; RV32IM-NEXT: add a1, a1, a4
	; RV32IM-NEXT: srli a1, a1, 6
	; RV32IM-NEXT: mul a4, a1, t0
	; RV32IM-NEXT: sub a4, a7, a4
	; RV32IM-NEXT: mulhu a5, a6, a5
	; RV32IM-NEXT: sub a2, a6, a5
	; RV32IM-NEXT: srli a2, a2, 1
	; RV32IM-NEXT: add a2, a2, a5
	; RV32IM-NEXT: srli a2, a2, 6
	; RV32IM-NEXT: mul a5, a2, t0
	; RV32IM-NEXT: sub a5, a6, a5			; RV32IM-NEXT: sub a5, a6, a5
	; RV32IM-NEXT: add a2, a5, a2			; RV32IM-NEXT: add a3, a5, a3
	; RV32IM-NEXT: add a1, a4, a1			; RV32IM-NEXT: add a1, a1, a2
	; RV32IM-NEXT: add a3, t2, a3			; RV32IM-NEXT: add a2, t2, a4
	; RV32IM-NEXT: add a4, t1, t3			; RV32IM-NEXT: add a4, t1, t0
	; RV32IM-NEXT: sh a4, 6(a0)			; RV32IM-NEXT: sh a4, 6(a0)
	; RV32IM-NEXT: sh a3, 4(a0)			; RV32IM-NEXT: sh a2, 4(a0)
	; RV32IM-NEXT: sh a1, 2(a0)			; RV32IM-NEXT: sh a1, 2(a0)
	; RV32IM-NEXT: sh a2, 0(a0)			; RV32IM-NEXT: sh a3, 0(a0)
	; RV32IM-NEXT: ret			; RV32IM-NEXT: ret
	;			;
	; RV64I-LABEL: combine_urem_udiv:			; RV64I-LABEL: combine_urem_udiv:
	; RV64I: # %bb.0:			; RV64I: # %bb.0:
	; RV64I-NEXT: addi sp, sp, -96			; RV64I-NEXT: addi sp, sp, -80
	; RV64I-NEXT: sd ra, 88(sp)			; RV64I-NEXT: sd ra, 72(sp)
	; RV64I-NEXT: sd s0, 80(sp)			; RV64I-NEXT: sd s0, 64(sp)
	; RV64I-NEXT: sd s1, 72(sp)			; RV64I-NEXT: sd s1, 56(sp)
	; RV64I-NEXT: sd s2, 64(sp)			; RV64I-NEXT: sd s2, 48(sp)
	; RV64I-NEXT: sd s3, 56(sp)			; RV64I-NEXT: sd s3, 40(sp)
	; RV64I-NEXT: sd s4, 48(sp)			; RV64I-NEXT: sd s4, 32(sp)
	; RV64I-NEXT: sd s5, 40(sp)			; RV64I-NEXT: sd s5, 24(sp)
	; RV64I-NEXT: sd s6, 32(sp)			; RV64I-NEXT: sd s6, 16(sp)
	; RV64I-NEXT: sd s7, 24(sp)			; RV64I-NEXT: sd s7, 8(sp)
	; RV64I-NEXT: sd s8, 16(sp)			; RV64I-NEXT: sd s8, 0(sp)
	; RV64I-NEXT: sd s9, 8(sp)
	; RV64I-NEXT: lhu s2, 0(a1)			; RV64I-NEXT: lhu s2, 0(a1)
	; RV64I-NEXT: lhu s3, 8(a1)			; RV64I-NEXT: lhu s3, 8(a1)
	; RV64I-NEXT: lhu s4, 16(a1)			; RV64I-NEXT: lhu s4, 16(a1)
	; RV64I-NEXT: lhu s1, 24(a1)			; RV64I-NEXT: lhu s1, 24(a1)
	; RV64I-NEXT: mv s0, a0
	; RV64I-NEXT: addi a1, zero, 95
	; RV64I-NEXT: mv a0, s1
	; RV64I-NEXT: call __umoddi3
	; RV64I-NEXT: mv s5, a0			; RV64I-NEXT: mv s5, a0
	; RV64I-NEXT: addi a1, zero, 95			; RV64I-NEXT: lui a0, 11
	; RV64I-NEXT: mv a0, s4			; RV64I-NEXT: addiw s0, a0, -905
	; RV64I-NEXT: call __umoddi3
	; RV64I-NEXT: mv s6, a0
	; RV64I-NEXT: addi a1, zero, 95
	; RV64I-NEXT: mv a0, s3
	; RV64I-NEXT: call __umoddi3
	; RV64I-NEXT: mv s7, a0
	; RV64I-NEXT: addi a1, zero, 95
	; RV64I-NEXT: mv a0, s2
	; RV64I-NEXT: call __umoddi3
	; RV64I-NEXT: mv s8, a0
	; RV64I-NEXT: addi a1, zero, 95
	; RV64I-NEXT: mv a0, s1			; RV64I-NEXT: mv a0, s1
	; RV64I-NEXT: call __udivdi3			; RV64I-NEXT: mv a1, s0
	; RV64I-NEXT: mv s9, a0			; RV64I-NEXT: call __muldi3
				; RV64I-NEXT: srli s6, a0, 22
	; RV64I-NEXT: addi a1, zero, 95			; RV64I-NEXT: addi a1, zero, 95
				; RV64I-NEXT: mv a0, s6
				; RV64I-NEXT: call __muldi3
				; RV64I-NEXT: sub s8, s1, a0
	; RV64I-NEXT: mv a0, s4			; RV64I-NEXT: mv a0, s4
	; RV64I-NEXT: call __udivdi3			; RV64I-NEXT: mv a1, s0
	; RV64I-NEXT: mv s4, a0			; RV64I-NEXT: call __muldi3
				; RV64I-NEXT: srli s7, a0, 22
	; RV64I-NEXT: addi a1, zero, 95			; RV64I-NEXT: addi a1, zero, 95
				; RV64I-NEXT: mv a0, s7
				; RV64I-NEXT: call __muldi3
				; RV64I-NEXT: sub s4, s4, a0
	; RV64I-NEXT: mv a0, s3			; RV64I-NEXT: mv a0, s3
	; RV64I-NEXT: call __udivdi3			; RV64I-NEXT: mv a1, s0
	; RV64I-NEXT: mv s1, a0			; RV64I-NEXT: call __muldi3
				; RV64I-NEXT: srli s1, a0, 22
	; RV64I-NEXT: addi a1, zero, 95			; RV64I-NEXT: addi a1, zero, 95
				; RV64I-NEXT: mv a0, s1
				; RV64I-NEXT: call __muldi3
				; RV64I-NEXT: sub s3, s3, a0
	; RV64I-NEXT: mv a0, s2			; RV64I-NEXT: mv a0, s2
	; RV64I-NEXT: call __udivdi3			; RV64I-NEXT: mv a1, s0
	; RV64I-NEXT: add a0, s8, a0			; RV64I-NEXT: call __muldi3
	; RV64I-NEXT: add a1, s7, s1			; RV64I-NEXT: srli s0, a0, 22
	; RV64I-NEXT: add a2, s6, s4			; RV64I-NEXT: addi a1, zero, 95
	; RV64I-NEXT: add a3, s5, s9			; RV64I-NEXT: mv a0, s0
	; RV64I-NEXT: sh a3, 6(s0)			; RV64I-NEXT: call __muldi3
	; RV64I-NEXT: sh a2, 4(s0)			; RV64I-NEXT: sub a0, s2, a0
	; RV64I-NEXT: sh a1, 2(s0)			; RV64I-NEXT: add a0, a0, s0
	; RV64I-NEXT: sh a0, 0(s0)			; RV64I-NEXT: add a1, s3, s1
	; RV64I-NEXT: ld s9, 8(sp)			; RV64I-NEXT: add a2, s4, s7
	; RV64I-NEXT: ld s8, 16(sp)			; RV64I-NEXT: add a3, s8, s6
	; RV64I-NEXT: ld s7, 24(sp)			; RV64I-NEXT: sh a3, 6(s5)
	; RV64I-NEXT: ld s6, 32(sp)			; RV64I-NEXT: sh a2, 4(s5)
	; RV64I-NEXT: ld s5, 40(sp)			; RV64I-NEXT: sh a1, 2(s5)
	; RV64I-NEXT: ld s4, 48(sp)			; RV64I-NEXT: sh a0, 0(s5)
	; RV64I-NEXT: ld s3, 56(sp)			; RV64I-NEXT: ld s8, 0(sp)
	; RV64I-NEXT: ld s2, 64(sp)			; RV64I-NEXT: ld s7, 8(sp)
	; RV64I-NEXT: ld s1, 72(sp)			; RV64I-NEXT: ld s6, 16(sp)
	; RV64I-NEXT: ld s0, 80(sp)			; RV64I-NEXT: ld s5, 24(sp)
	; RV64I-NEXT: ld ra, 88(sp)			; RV64I-NEXT: ld s4, 32(sp)
	; RV64I-NEXT: addi sp, sp, 96			; RV64I-NEXT: ld s3, 40(sp)
				; RV64I-NEXT: ld s2, 48(sp)
				; RV64I-NEXT: ld s1, 56(sp)
				; RV64I-NEXT: ld s0, 64(sp)
				; RV64I-NEXT: ld ra, 72(sp)
				; RV64I-NEXT: addi sp, sp, 80
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IM-LABEL: combine_urem_udiv:			; RV64IM-LABEL: combine_urem_udiv:
	; RV64IM: # %bb.0:			; RV64IM: # %bb.0:
	; RV64IM-NEXT: lhu a6, 0(a1)			; RV64IM-NEXT: lhu a6, 0(a1)
	; RV64IM-NEXT: lhu a7, 8(a1)			; RV64IM-NEXT: lhu a3, 8(a1)
	; RV64IM-NEXT: lhu a4, 16(a1)			; RV64IM-NEXT: lhu a4, 24(a1)
	; RV64IM-NEXT: lhu a1, 24(a1)			; RV64IM-NEXT: lhu a1, 16(a1)
	; RV64IM-NEXT: lui a5, 1423			; RV64IM-NEXT: lui a5, 11
	; RV64IM-NEXT: addiw a5, a5, -733			; RV64IM-NEXT: addiw a5, a5, -905
	; RV64IM-NEXT: slli a5, a5, 15			; RV64IM-NEXT: mul a2, a4, a5
	; RV64IM-NEXT: addi a5, a5, 1035			; RV64IM-NEXT: srli t0, a2, 22
	; RV64IM-NEXT: slli a5, a5, 13			; RV64IM-NEXT: addi a7, zero, 95
	; RV64IM-NEXT: addi a5, a5, -1811			; RV64IM-NEXT: mul a2, t0, a7
	; RV64IM-NEXT: slli a5, a5, 12			; RV64IM-NEXT: sub t1, a4, a2
	; RV64IM-NEXT: addi a5, a5, 561			; RV64IM-NEXT: mul a4, a1, a5
	; RV64IM-NEXT: mulhu a2, a1, a5			; RV64IM-NEXT: srli a4, a4, 22
	; RV64IM-NEXT: sub a3, a1, a2			; RV64IM-NEXT: mul a2, a4, a7
	; RV64IM-NEXT: srli a3, a3, 1			; RV64IM-NEXT: sub t2, a1, a2
	; RV64IM-NEXT: add a2, a3, a2			; RV64IM-NEXT: mul a2, a3, a5
	; RV64IM-NEXT: srli t3, a2, 6			; RV64IM-NEXT: srli a2, a2, 22
	; RV64IM-NEXT: addi t0, zero, 95			; RV64IM-NEXT: mul a1, a2, a7
	; RV64IM-NEXT: mul a3, t3, t0			; RV64IM-NEXT: sub a1, a3, a1
	; RV64IM-NEXT: sub t1, a1, a3			; RV64IM-NEXT: mul a3, a6, a5
	; RV64IM-NEXT: mulhu a3, a4, a5			; RV64IM-NEXT: srli a3, a3, 22
	; RV64IM-NEXT: sub a1, a4, a3			; RV64IM-NEXT: mul a5, a3, a7
	; RV64IM-NEXT: srli a1, a1, 1
	; RV64IM-NEXT: add a1, a1, a3
	; RV64IM-NEXT: srli a1, a1, 6
	; RV64IM-NEXT: mul a3, a1, t0
	; RV64IM-NEXT: sub t2, a4, a3
	; RV64IM-NEXT: mulhu a4, a7, a5
	; RV64IM-NEXT: sub a3, a7, a4
	; RV64IM-NEXT: srli a3, a3, 1
	; RV64IM-NEXT: add a3, a3, a4
	; RV64IM-NEXT: srli a3, a3, 6
	; RV64IM-NEXT: mul a4, a3, t0
	; RV64IM-NEXT: sub a4, a7, a4
	; RV64IM-NEXT: mulhu a5, a6, a5
	; RV64IM-NEXT: sub a2, a6, a5
	; RV64IM-NEXT: srli a2, a2, 1
	; RV64IM-NEXT: add a2, a2, a5
	; RV64IM-NEXT: srli a2, a2, 6
	; RV64IM-NEXT: mul a5, a2, t0
	; RV64IM-NEXT: sub a5, a6, a5			; RV64IM-NEXT: sub a5, a6, a5
	; RV64IM-NEXT: add a2, a5, a2			; RV64IM-NEXT: add a3, a5, a3
	; RV64IM-NEXT: add a3, a4, a3			; RV64IM-NEXT: add a1, a1, a2
	; RV64IM-NEXT: add a1, t2, a1			; RV64IM-NEXT: add a2, t2, a4
	; RV64IM-NEXT: add a4, t1, t3			; RV64IM-NEXT: add a4, t1, t0
	; RV64IM-NEXT: sh a4, 6(a0)			; RV64IM-NEXT: sh a4, 6(a0)
	; RV64IM-NEXT: sh a1, 4(a0)			; RV64IM-NEXT: sh a2, 4(a0)
	; RV64IM-NEXT: sh a3, 2(a0)			; RV64IM-NEXT: sh a1, 2(a0)
	; RV64IM-NEXT: sh a2, 0(a0)			; RV64IM-NEXT: sh a3, 0(a0)
	; RV64IM-NEXT: ret			; RV64IM-NEXT: ret
	%1 = urem <4 x i16> %x, <i16 95, i16 95, i16 95, i16 95>			%1 = urem <4 x i16> %x, <i16 95, i16 95, i16 95, i16 95>
	%2 = udiv <4 x i16> %x, <i16 95, i16 95, i16 95, i16 95>			%2 = udiv <4 x i16> %x, <i16 95, i16 95, i16 95, i16 95>
	%3 = add <4 x i16> %1, %2			%3 = add <4 x i16> %1, %2
	ret <4 x i16> %3			ret <4 x i16> %3
	}			}

	; Don't fold for divisors that are a power of two.			; Don't fold for divisors that are a power of two.
	define <4 x i16> @dont_fold_urem_power_of_two(<4 x i16> %x) nounwind {			define <4 x i16> @dont_fold_urem_power_of_two(<4 x i16> %x) nounwind {
	; RV32I-LABEL: dont_fold_urem_power_of_two:			; RV32I-LABEL: dont_fold_urem_power_of_two:
	; RV32I: # %bb.0:			; RV32I: # %bb.0:
	; RV32I-NEXT: addi sp, sp, -32			; RV32I-NEXT: addi sp, sp, -32
	; RV32I-NEXT: sw ra, 28(sp)			; RV32I-NEXT: sw ra, 28(sp)
	; RV32I-NEXT: sw s0, 24(sp)			; RV32I-NEXT: sw s0, 24(sp)
	; RV32I-NEXT: sw s1, 20(sp)			; RV32I-NEXT: sw s1, 20(sp)
	; RV32I-NEXT: sw s2, 16(sp)			; RV32I-NEXT: sw s2, 16(sp)
	; RV32I-NEXT: sw s3, 12(sp)			; RV32I-NEXT: sw s3, 12(sp)
				; RV32I-NEXT: sw s4, 8(sp)
	; RV32I-NEXT: lhu s2, 8(a1)			; RV32I-NEXT: lhu s2, 8(a1)
	; RV32I-NEXT: lhu s3, 4(a1)			; RV32I-NEXT: lhu s3, 4(a1)
	; RV32I-NEXT: lhu s1, 0(a1)			; RV32I-NEXT: lhu s4, 0(a1)
	; RV32I-NEXT: lhu a2, 12(a1)			; RV32I-NEXT: lhu s0, 12(a1)
	; RV32I-NEXT: mv s0, a0			; RV32I-NEXT: mv s1, a0
				; RV32I-NEXT: lui a0, 11
				; RV32I-NEXT: addi a1, a0, -905
				; RV32I-NEXT: mv a0, s0
				; RV32I-NEXT: call __mulsi3
				; RV32I-NEXT: srli a0, a0, 22
	; RV32I-NEXT: addi a1, zero, 95			; RV32I-NEXT: addi a1, zero, 95
	; RV32I-NEXT: mv a0, a2			; RV32I-NEXT: call __mulsi3
	; RV32I-NEXT: call __umodsi3			; RV32I-NEXT: sub a0, s0, a0
	; RV32I-NEXT: andi a1, s1, 63			; RV32I-NEXT: andi a1, s4, 63
	; RV32I-NEXT: andi a2, s3, 31			; RV32I-NEXT: andi a2, s3, 31
	; RV32I-NEXT: andi a3, s2, 7			; RV32I-NEXT: andi a3, s2, 7
	; RV32I-NEXT: sh a0, 6(s0)			; RV32I-NEXT: sh a3, 4(s1)
	; RV32I-NEXT: sh a3, 4(s0)			; RV32I-NEXT: sh a2, 2(s1)
	; RV32I-NEXT: sh a2, 2(s0)			; RV32I-NEXT: sh a1, 0(s1)
	; RV32I-NEXT: sh a1, 0(s0)			; RV32I-NEXT: sh a0, 6(s1)
				; RV32I-NEXT: lw s4, 8(sp)
	; RV32I-NEXT: lw s3, 12(sp)			; RV32I-NEXT: lw s3, 12(sp)
	; RV32I-NEXT: lw s2, 16(sp)			; RV32I-NEXT: lw s2, 16(sp)
	; RV32I-NEXT: lw s1, 20(sp)			; RV32I-NEXT: lw s1, 20(sp)
	; RV32I-NEXT: lw s0, 24(sp)			; RV32I-NEXT: lw s0, 24(sp)
	; RV32I-NEXT: lw ra, 28(sp)			; RV32I-NEXT: lw ra, 28(sp)
	; RV32I-NEXT: addi sp, sp, 32			; RV32I-NEXT: addi sp, sp, 32
	; RV32I-NEXT: ret			; RV32I-NEXT: ret
	;			;
	; RV32IM-LABEL: dont_fold_urem_power_of_two:			; RV32IM-LABEL: dont_fold_urem_power_of_two:
	; RV32IM: # %bb.0:			; RV32IM: # %bb.0:
	; RV32IM-NEXT: lhu a6, 8(a1)			; RV32IM-NEXT: lhu a6, 8(a1)
	; RV32IM-NEXT: lhu a3, 4(a1)			; RV32IM-NEXT: lhu a3, 4(a1)
	; RV32IM-NEXT: lhu a4, 12(a1)			; RV32IM-NEXT: lhu a4, 12(a1)
	; RV32IM-NEXT: lhu a1, 0(a1)			; RV32IM-NEXT: lhu a1, 0(a1)
	; RV32IM-NEXT: lui a5, 364242			; RV32IM-NEXT: lui a5, 11
	; RV32IM-NEXT: addi a5, a5, 777			; RV32IM-NEXT: addi a5, a5, -905
	; RV32IM-NEXT: mulhu a5, a4, a5			; RV32IM-NEXT: mul a5, a4, a5
	; RV32IM-NEXT: sub a2, a4, a5			; RV32IM-NEXT: srli a5, a5, 22
	; RV32IM-NEXT: srli a2, a2, 1			; RV32IM-NEXT: addi a2, zero, 95
	; RV32IM-NEXT: add a2, a2, a5			; RV32IM-NEXT: mul a2, a5, a2
	; RV32IM-NEXT: srli a2, a2, 6
	; RV32IM-NEXT: addi a5, zero, 95
	; RV32IM-NEXT: mul a2, a2, a5
	; RV32IM-NEXT: sub a2, a4, a2			; RV32IM-NEXT: sub a2, a4, a2
	; RV32IM-NEXT: andi a1, a1, 63			; RV32IM-NEXT: andi a1, a1, 63
	; RV32IM-NEXT: andi a3, a3, 31			; RV32IM-NEXT: andi a3, a3, 31
	; RV32IM-NEXT: andi a4, a6, 7			; RV32IM-NEXT: andi a4, a6, 7
	; RV32IM-NEXT: sh a4, 4(a0)			; RV32IM-NEXT: sh a4, 4(a0)
	; RV32IM-NEXT: sh a3, 2(a0)			; RV32IM-NEXT: sh a3, 2(a0)
	; RV32IM-NEXT: sh a1, 0(a0)			; RV32IM-NEXT: sh a1, 0(a0)
	; RV32IM-NEXT: sh a2, 6(a0)			; RV32IM-NEXT: sh a2, 6(a0)
	; RV32IM-NEXT: ret			; RV32IM-NEXT: ret
	;			;
	; RV64I-LABEL: dont_fold_urem_power_of_two:			; RV64I-LABEL: dont_fold_urem_power_of_two:
	; RV64I: # %bb.0:			; RV64I: # %bb.0:
	; RV64I-NEXT: addi sp, sp, -48			; RV64I-NEXT: addi sp, sp, -48
	; RV64I-NEXT: sd ra, 40(sp)			; RV64I-NEXT: sd ra, 40(sp)
	; RV64I-NEXT: sd s0, 32(sp)			; RV64I-NEXT: sd s0, 32(sp)
	; RV64I-NEXT: sd s1, 24(sp)			; RV64I-NEXT: sd s1, 24(sp)
	; RV64I-NEXT: sd s2, 16(sp)			; RV64I-NEXT: sd s2, 16(sp)
	; RV64I-NEXT: sd s3, 8(sp)			; RV64I-NEXT: sd s3, 8(sp)
				; RV64I-NEXT: sd s4, 0(sp)
	; RV64I-NEXT: lhu s2, 16(a1)			; RV64I-NEXT: lhu s2, 16(a1)
	; RV64I-NEXT: lhu s3, 8(a1)			; RV64I-NEXT: lhu s3, 8(a1)
	; RV64I-NEXT: lhu s1, 0(a1)			; RV64I-NEXT: lhu s4, 0(a1)
	; RV64I-NEXT: lhu a2, 24(a1)			; RV64I-NEXT: lhu s0, 24(a1)
	; RV64I-NEXT: mv s0, a0			; RV64I-NEXT: mv s1, a0
				; RV64I-NEXT: lui a0, 11
				; RV64I-NEXT: addiw a1, a0, -905
				; RV64I-NEXT: mv a0, s0
				; RV64I-NEXT: call __muldi3
				; RV64I-NEXT: srli a0, a0, 22
	; RV64I-NEXT: addi a1, zero, 95			; RV64I-NEXT: addi a1, zero, 95
	; RV64I-NEXT: mv a0, a2			; RV64I-NEXT: call __muldi3
	; RV64I-NEXT: call __umoddi3			; RV64I-NEXT: sub a0, s0, a0
	; RV64I-NEXT: andi a1, s1, 63			; RV64I-NEXT: andi a1, s4, 63
	; RV64I-NEXT: andi a2, s3, 31			; RV64I-NEXT: andi a2, s3, 31
	; RV64I-NEXT: andi a3, s2, 7			; RV64I-NEXT: andi a3, s2, 7
	; RV64I-NEXT: sh a0, 6(s0)			; RV64I-NEXT: sh a3, 4(s1)
	; RV64I-NEXT: sh a3, 4(s0)			; RV64I-NEXT: sh a2, 2(s1)
	; RV64I-NEXT: sh a2, 2(s0)			; RV64I-NEXT: sh a1, 0(s1)
	; RV64I-NEXT: sh a1, 0(s0)			; RV64I-NEXT: sh a0, 6(s1)
				; RV64I-NEXT: ld s4, 0(sp)
	; RV64I-NEXT: ld s3, 8(sp)			; RV64I-NEXT: ld s3, 8(sp)
	; RV64I-NEXT: ld s2, 16(sp)			; RV64I-NEXT: ld s2, 16(sp)
	; RV64I-NEXT: ld s1, 24(sp)			; RV64I-NEXT: ld s1, 24(sp)
	; RV64I-NEXT: ld s0, 32(sp)			; RV64I-NEXT: ld s0, 32(sp)
	; RV64I-NEXT: ld ra, 40(sp)			; RV64I-NEXT: ld ra, 40(sp)
	; RV64I-NEXT: addi sp, sp, 48			; RV64I-NEXT: addi sp, sp, 48
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IM-LABEL: dont_fold_urem_power_of_two:			; RV64IM-LABEL: dont_fold_urem_power_of_two:
	; RV64IM: # %bb.0:			; RV64IM: # %bb.0:
	; RV64IM-NEXT: lhu a6, 16(a1)			; RV64IM-NEXT: lhu a6, 16(a1)
	; RV64IM-NEXT: lhu a3, 8(a1)			; RV64IM-NEXT: lhu a3, 8(a1)
	; RV64IM-NEXT: lhu a4, 0(a1)			; RV64IM-NEXT: lhu a4, 24(a1)
	; RV64IM-NEXT: lhu a1, 24(a1)			; RV64IM-NEXT: lhu a1, 0(a1)
	; RV64IM-NEXT: lui a5, 1423			; RV64IM-NEXT: lui a5, 11
	; RV64IM-NEXT: addiw a5, a5, -733			; RV64IM-NEXT: addiw a5, a5, -905
	; RV64IM-NEXT: slli a5, a5, 15			; RV64IM-NEXT: mul a5, a4, a5
	; RV64IM-NEXT: addi a5, a5, 1035			; RV64IM-NEXT: srli a5, a5, 22
	; RV64IM-NEXT: slli a5, a5, 13			; RV64IM-NEXT: addi a2, zero, 95
	; RV64IM-NEXT: addi a5, a5, -1811			; RV64IM-NEXT: mul a2, a5, a2
	; RV64IM-NEXT: slli a5, a5, 12			; RV64IM-NEXT: sub a2, a4, a2
	; RV64IM-NEXT: addi a5, a5, 561			; RV64IM-NEXT: andi a1, a1, 63
	; RV64IM-NEXT: mulhu a5, a1, a5
	; RV64IM-NEXT: sub a2, a1, a5
	; RV64IM-NEXT: srli a2, a2, 1
	; RV64IM-NEXT: add a2, a2, a5
	; RV64IM-NEXT: srli a2, a2, 6
	; RV64IM-NEXT: addi a5, zero, 95
	; RV64IM-NEXT: mul a2, a2, a5
	; RV64IM-NEXT: sub a1, a1, a2
	; RV64IM-NEXT: andi a2, a4, 63
	; RV64IM-NEXT: andi a3, a3, 31			; RV64IM-NEXT: andi a3, a3, 31
	; RV64IM-NEXT: andi a4, a6, 7			; RV64IM-NEXT: andi a4, a6, 7
	; RV64IM-NEXT: sh a4, 4(a0)			; RV64IM-NEXT: sh a4, 4(a0)
	; RV64IM-NEXT: sh a3, 2(a0)			; RV64IM-NEXT: sh a3, 2(a0)
	; RV64IM-NEXT: sh a2, 0(a0)			; RV64IM-NEXT: sh a1, 0(a0)
	; RV64IM-NEXT: sh a1, 6(a0)			; RV64IM-NEXT: sh a2, 6(a0)
	; RV64IM-NEXT: ret			; RV64IM-NEXT: ret
	%1 = urem <4 x i16> %x, <i16 64, i16 32, i16 8, i16 95>			%1 = urem <4 x i16> %x, <i16 64, i16 32, i16 8, i16 95>
	ret <4 x i16> %1			ret <4 x i16> %1
	}			}

	; Don't fold if the divisor is one.			; Don't fold if the divisor is one.
	define <4 x i16> @dont_fold_urem_one(<4 x i16> %x) nounwind {			define <4 x i16> @dont_fold_urem_one(<4 x i16> %x) nounwind {
	; RV32I-LABEL: dont_fold_urem_one:			; RV32I-LABEL: dont_fold_urem_one:
	; RV32I: # %bb.0:			; RV32I: # %bb.0:
	; RV32I-NEXT: addi sp, sp, -32			; RV32I-NEXT: addi sp, sp, -32
	; RV32I-NEXT: sw ra, 28(sp)			; RV32I-NEXT: sw ra, 28(sp)
	; RV32I-NEXT: sw s0, 24(sp)			; RV32I-NEXT: sw s0, 24(sp)
	; RV32I-NEXT: sw s1, 20(sp)			; RV32I-NEXT: sw s1, 20(sp)
	; RV32I-NEXT: sw s2, 16(sp)			; RV32I-NEXT: sw s2, 16(sp)
	; RV32I-NEXT: sw s3, 12(sp)			; RV32I-NEXT: sw s3, 12(sp)
				; RV32I-NEXT: sw s4, 8(sp)
	; RV32I-NEXT: lhu s2, 12(a1)			; RV32I-NEXT: lhu s2, 12(a1)
				; RV32I-NEXT: lhu s3, 4(a1)
	; RV32I-NEXT: lhu s1, 8(a1)			; RV32I-NEXT: lhu s1, 8(a1)
	; RV32I-NEXT: lhu a2, 4(a1)
	; RV32I-NEXT: mv s0, a0			; RV32I-NEXT: mv s0, a0
	; RV32I-NEXT: addi a1, zero, 654			; RV32I-NEXT: lui a0, 6
	; RV32I-NEXT: mv a0, a2			; RV32I-NEXT: addi a1, a0, 1069
	; RV32I-NEXT: call __umodsi3
	; RV32I-NEXT: mv s3, a0
	; RV32I-NEXT: addi a1, zero, 23
	; RV32I-NEXT: mv a0, s1			; RV32I-NEXT: mv a0, s1
	; RV32I-NEXT: call __umodsi3			; RV32I-NEXT: call __mulsi3
	; RV32I-NEXT: mv s1, a0			; RV32I-NEXT: srli a0, a0, 16
	; RV32I-NEXT: lui a0, 1			; RV32I-NEXT: sub a1, s1, a0
	; RV32I-NEXT: addi a1, a0, 1327			; RV32I-NEXT: lui a2, 16
				; RV32I-NEXT: addi a3, a2, -2
				; RV32I-NEXT: and a1, a1, a3
				; RV32I-NEXT: srli a1, a1, 1
				; RV32I-NEXT: add a0, a1, a0
				; RV32I-NEXT: addi a1, a2, -16
				; RV32I-NEXT: and a0, a0, a1
				; RV32I-NEXT: srli a0, a0, 4
				; RV32I-NEXT: addi a1, zero, 23
				; RV32I-NEXT: call __mulsi3
				; RV32I-NEXT: sub s4, s1, a0
				; RV32I-NEXT: lui a0, 13
				; RV32I-NEXT: addi a1, a0, -1941
				; RV32I-NEXT: mv a0, s3
				; RV32I-NEXT: call __mulsi3
				; RV32I-NEXT: srli a0, a0, 25
				; RV32I-NEXT: addi a1, zero, 654
				; RV32I-NEXT: call __mulsi3
				; RV32I-NEXT: sub s1, s3, a0
				; RV32I-NEXT: lui a0, 3
				; RV32I-NEXT: addi a1, a0, 87
	; RV32I-NEXT: mv a0, s2			; RV32I-NEXT: mv a0, s2
	; RV32I-NEXT: call __umodsi3			; RV32I-NEXT: call __mulsi3
				; RV32I-NEXT: srli a0, a0, 26
				; RV32I-NEXT: lui a1, 1
				; RV32I-NEXT: addi a1, a1, 1327
				; RV32I-NEXT: call __mulsi3
				; RV32I-NEXT: sub a0, s2, a0
	; RV32I-NEXT: sh zero, 0(s0)			; RV32I-NEXT: sh zero, 0(s0)
	; RV32I-NEXT: sh a0, 6(s0)			; RV32I-NEXT: sh a0, 6(s0)
	; RV32I-NEXT: sh s1, 4(s0)			; RV32I-NEXT: sh s1, 2(s0)
	; RV32I-NEXT: sh s3, 2(s0)			; RV32I-NEXT: sh s4, 4(s0)
				; RV32I-NEXT: lw s4, 8(sp)
	; RV32I-NEXT: lw s3, 12(sp)			; RV32I-NEXT: lw s3, 12(sp)
	; RV32I-NEXT: lw s2, 16(sp)			; RV32I-NEXT: lw s2, 16(sp)
	; RV32I-NEXT: lw s1, 20(sp)			; RV32I-NEXT: lw s1, 20(sp)
	; RV32I-NEXT: lw s0, 24(sp)			; RV32I-NEXT: lw s0, 24(sp)
	; RV32I-NEXT: lw ra, 28(sp)			; RV32I-NEXT: lw ra, 28(sp)
	; RV32I-NEXT: addi sp, sp, 32			; RV32I-NEXT: addi sp, sp, 32
	; RV32I-NEXT: ret			; RV32I-NEXT: ret
	;			;
	; RV32IM-LABEL: dont_fold_urem_one:			; RV32IM-LABEL: dont_fold_urem_one:
	; RV32IM: # %bb.0:			; RV32IM: # %bb.0:
	; RV32IM-NEXT: lhu a2, 4(a1)			; RV32IM-NEXT: lhu a6, 12(a1)
	; RV32IM-NEXT: lhu a3, 12(a1)			; RV32IM-NEXT: lhu a3, 8(a1)
	; RV32IM-NEXT: lhu a1, 8(a1)			; RV32IM-NEXT: lhu a1, 4(a1)
	; RV32IM-NEXT: srli a4, a2, 1			; RV32IM-NEXT: lui a4, 6
	; RV32IM-NEXT: lui a5, 820904			; RV32IM-NEXT: addi a4, a4, 1069
	; RV32IM-NEXT: addi a5, a5, -1903			; RV32IM-NEXT: mul a4, a3, a4
	; RV32IM-NEXT: mulhu a4, a4, a5			; RV32IM-NEXT: srli a4, a4, 16
	; RV32IM-NEXT: srli a4, a4, 8			; RV32IM-NEXT: sub a5, a3, a4
	; RV32IM-NEXT: addi a5, zero, 654			; RV32IM-NEXT: lui a2, 16
	; RV32IM-NEXT: mul a4, a4, a5			; RV32IM-NEXT: addi a2, a2, -2
	; RV32IM-NEXT: sub a2, a2, a4			; RV32IM-NEXT: and a2, a5, a2
	; RV32IM-NEXT: lui a4, 729444			; RV32IM-NEXT: srli a2, a2, 1
	; RV32IM-NEXT: addi a4, a4, 713			; RV32IM-NEXT: add a2, a2, a4
	; RV32IM-NEXT: mulhu a4, a1, a4			; RV32IM-NEXT: srli a2, a2, 4
	; RV32IM-NEXT: srli a4, a4, 4			; RV32IM-NEXT: addi a4, zero, 23
	; RV32IM-NEXT: addi a5, zero, 23			; RV32IM-NEXT: mul a2, a2, a4
	; RV32IM-NEXT: mul a4, a4, a5			; RV32IM-NEXT: sub a2, a3, a2
	; RV32IM-NEXT: sub a1, a1, a4			; RV32IM-NEXT: lui a3, 13
	; RV32IM-NEXT: lui a4, 395996			; RV32IM-NEXT: addi a3, a3, -1941
	; RV32IM-NEXT: addi a4, a4, -2009			; RV32IM-NEXT: mul a3, a1, a3
	; RV32IM-NEXT: mulhu a4, a3, a4			; RV32IM-NEXT: srli a3, a3, 25
	; RV32IM-NEXT: srli a4, a4, 11			; RV32IM-NEXT: addi a4, zero, 654
	; RV32IM-NEXT: lui a5, 1			; RV32IM-NEXT: mul a3, a3, a4
	; RV32IM-NEXT: addi a5, a5, 1327			; RV32IM-NEXT: sub a1, a1, a3
	; RV32IM-NEXT: mul a4, a4, a5			; RV32IM-NEXT: lui a3, 3
	; RV32IM-NEXT: sub a3, a3, a4			; RV32IM-NEXT: addi a3, a3, 87
				; RV32IM-NEXT: mul a3, a6, a3
				; RV32IM-NEXT: srli a3, a3, 26
				; RV32IM-NEXT: lui a4, 1
				; RV32IM-NEXT: addi a4, a4, 1327
				; RV32IM-NEXT: mul a3, a3, a4
				; RV32IM-NEXT: sub a3, a6, a3
	; RV32IM-NEXT: sh zero, 0(a0)			; RV32IM-NEXT: sh zero, 0(a0)
	; RV32IM-NEXT: sh a3, 6(a0)			; RV32IM-NEXT: sh a3, 6(a0)
	; RV32IM-NEXT: sh a1, 4(a0)			; RV32IM-NEXT: sh a1, 2(a0)
	; RV32IM-NEXT: sh a2, 2(a0)			; RV32IM-NEXT: sh a2, 4(a0)
	; RV32IM-NEXT: ret			; RV32IM-NEXT: ret
	;			;
	; RV64I-LABEL: dont_fold_urem_one:			; RV64I-LABEL: dont_fold_urem_one:
	; RV64I: # %bb.0:			; RV64I: # %bb.0:
	; RV64I-NEXT: addi sp, sp, -48			; RV64I-NEXT: addi sp, sp, -48
	; RV64I-NEXT: sd ra, 40(sp)			; RV64I-NEXT: sd ra, 40(sp)
	; RV64I-NEXT: sd s0, 32(sp)			; RV64I-NEXT: sd s0, 32(sp)
	; RV64I-NEXT: sd s1, 24(sp)			; RV64I-NEXT: sd s1, 24(sp)
	; RV64I-NEXT: sd s2, 16(sp)			; RV64I-NEXT: sd s2, 16(sp)
	; RV64I-NEXT: sd s3, 8(sp)			; RV64I-NEXT: sd s3, 8(sp)
				; RV64I-NEXT: sd s4, 0(sp)
	; RV64I-NEXT: lhu s2, 24(a1)			; RV64I-NEXT: lhu s2, 24(a1)
				; RV64I-NEXT: lhu s3, 8(a1)
	; RV64I-NEXT: lhu s1, 16(a1)			; RV64I-NEXT: lhu s1, 16(a1)
	; RV64I-NEXT: lhu a2, 8(a1)
	; RV64I-NEXT: mv s0, a0			; RV64I-NEXT: mv s0, a0
	; RV64I-NEXT: addi a1, zero, 654			; RV64I-NEXT: lui a0, 6
	; RV64I-NEXT: mv a0, a2			; RV64I-NEXT: addiw a1, a0, 1069
	; RV64I-NEXT: call __umoddi3
	; RV64I-NEXT: mv s3, a0
	; RV64I-NEXT: addi a1, zero, 23
	; RV64I-NEXT: mv a0, s1			; RV64I-NEXT: mv a0, s1
	; RV64I-NEXT: call __umoddi3			; RV64I-NEXT: call __muldi3
	; RV64I-NEXT: mv s1, a0			; RV64I-NEXT: srli a0, a0, 16
	; RV64I-NEXT: lui a0, 1			; RV64I-NEXT: sub a1, s1, a0
	; RV64I-NEXT: addiw a1, a0, 1327			; RV64I-NEXT: lui a2, 16
				; RV64I-NEXT: addiw a3, a2, -2
				; RV64I-NEXT: and a1, a1, a3
				; RV64I-NEXT: srli a1, a1, 1
				; RV64I-NEXT: add a0, a1, a0
				; RV64I-NEXT: addiw a1, a2, -16
				; RV64I-NEXT: and a0, a0, a1
				; RV64I-NEXT: srli a0, a0, 4
				; RV64I-NEXT: addi a1, zero, 23
				; RV64I-NEXT: call __muldi3
				; RV64I-NEXT: sub s4, s1, a0
				; RV64I-NEXT: lui a0, 13
				; RV64I-NEXT: addiw a1, a0, -1941
				; RV64I-NEXT: mv a0, s3
				; RV64I-NEXT: call __muldi3
				; RV64I-NEXT: srli a0, a0, 25
				; RV64I-NEXT: addi a1, zero, 654
				; RV64I-NEXT: call __muldi3
				; RV64I-NEXT: sub s1, s3, a0
				; RV64I-NEXT: lui a0, 3
				; RV64I-NEXT: addiw a1, a0, 87
	; RV64I-NEXT: mv a0, s2			; RV64I-NEXT: mv a0, s2
	; RV64I-NEXT: call __umoddi3			; RV64I-NEXT: call __muldi3
				; RV64I-NEXT: srli a0, a0, 26
				; RV64I-NEXT: lui a1, 1
				; RV64I-NEXT: addiw a1, a1, 1327
				; RV64I-NEXT: call __muldi3
				; RV64I-NEXT: sub a0, s2, a0
	; RV64I-NEXT: sh zero, 0(s0)			; RV64I-NEXT: sh zero, 0(s0)
	; RV64I-NEXT: sh a0, 6(s0)			; RV64I-NEXT: sh a0, 6(s0)
	; RV64I-NEXT: sh s1, 4(s0)			; RV64I-NEXT: sh s1, 2(s0)
	; RV64I-NEXT: sh s3, 2(s0)			; RV64I-NEXT: sh s4, 4(s0)
				; RV64I-NEXT: ld s4, 0(sp)
	; RV64I-NEXT: ld s3, 8(sp)			; RV64I-NEXT: ld s3, 8(sp)
	; RV64I-NEXT: ld s2, 16(sp)			; RV64I-NEXT: ld s2, 16(sp)
	; RV64I-NEXT: ld s1, 24(sp)			; RV64I-NEXT: ld s1, 24(sp)
	; RV64I-NEXT: ld s0, 32(sp)			; RV64I-NEXT: ld s0, 32(sp)
	; RV64I-NEXT: ld ra, 40(sp)			; RV64I-NEXT: ld ra, 40(sp)
	; RV64I-NEXT: addi sp, sp, 48			; RV64I-NEXT: addi sp, sp, 48
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IM-LABEL: dont_fold_urem_one:			; RV64IM-LABEL: dont_fold_urem_one:
	; RV64IM: # %bb.0:			; RV64IM: # %bb.0:
	; RV64IM-NEXT: lhu a2, 24(a1)			; RV64IM-NEXT: lhu a6, 24(a1)
	; RV64IM-NEXT: lhu a3, 8(a1)			; RV64IM-NEXT: lhu a3, 16(a1)
	; RV64IM-NEXT: lhu a1, 16(a1)			; RV64IM-NEXT: lhu a1, 8(a1)
	; RV64IM-NEXT: lui a4, 3206			; RV64IM-NEXT: lui a4, 6
	; RV64IM-NEXT: addiw a4, a4, -1781			; RV64IM-NEXT: addiw a4, a4, 1069
	; RV64IM-NEXT: slli a4, a4, 13			; RV64IM-NEXT: mul a4, a3, a4
	; RV64IM-NEXT: addi a4, a4, 1069			; RV64IM-NEXT: srli a4, a4, 16
	; RV64IM-NEXT: slli a4, a4, 12			; RV64IM-NEXT: sub a5, a3, a4
	; RV64IM-NEXT: addi a4, a4, -1959			; RV64IM-NEXT: lui a2, 16
	; RV64IM-NEXT: slli a4, a4, 14			; RV64IM-NEXT: addiw a2, a2, -2
	; RV64IM-NEXT: addi a4, a4, 713			; RV64IM-NEXT: and a2, a5, a2
	; RV64IM-NEXT: mulhu a4, a1, a4			; RV64IM-NEXT: srli a2, a2, 1
	; RV64IM-NEXT: sub a5, a1, a4			; RV64IM-NEXT: add a2, a2, a4
	; RV64IM-NEXT: srli a5, a5, 1			; RV64IM-NEXT: srli a2, a2, 4
	; RV64IM-NEXT: add a4, a5, a4			; RV64IM-NEXT: addi a4, zero, 23
	; RV64IM-NEXT: srli a4, a4, 4			; RV64IM-NEXT: mul a2, a2, a4
	; RV64IM-NEXT: addi a5, zero, 23			; RV64IM-NEXT: sub a2, a3, a2
	; RV64IM-NEXT: mul a4, a4, a5			; RV64IM-NEXT: lui a3, 13
	; RV64IM-NEXT: sub a1, a1, a4			; RV64IM-NEXT: addiw a3, a3, -1941
	; RV64IM-NEXT: srli a4, a3, 1			; RV64IM-NEXT: mul a3, a1, a3
	; RV64IM-NEXT: lui a5, 6413			; RV64IM-NEXT: srli a3, a3, 25
	; RV64IM-NEXT: addiw a5, a5, 1265			; RV64IM-NEXT: addi a4, zero, 654
	; RV64IM-NEXT: slli a5, a5, 13			; RV64IM-NEXT: mul a3, a3, a4
	; RV64IM-NEXT: addi a5, a5, 1027			; RV64IM-NEXT: sub a1, a1, a3
	; RV64IM-NEXT: slli a5, a5, 13			; RV64IM-NEXT: lui a3, 3
	; RV64IM-NEXT: addi a5, a5, 1077			; RV64IM-NEXT: addiw a3, a3, 87
	; RV64IM-NEXT: slli a5, a5, 12			; RV64IM-NEXT: mul a3, a6, a3
	; RV64IM-NEXT: addi a5, a5, 965			; RV64IM-NEXT: srli a3, a3, 26
	; RV64IM-NEXT: mulhu a4, a4, a5			; RV64IM-NEXT: lui a4, 1
	; RV64IM-NEXT: srli a4, a4, 7			; RV64IM-NEXT: addiw a4, a4, 1327
	; RV64IM-NEXT: addi a5, zero, 654			; RV64IM-NEXT: mul a3, a3, a4
	; RV64IM-NEXT: mul a4, a4, a5			; RV64IM-NEXT: sub a3, a6, a3
	; RV64IM-NEXT: sub a3, a3, a4
	; RV64IM-NEXT: lui a4, 1044567
	; RV64IM-NEXT: addiw a4, a4, -575
	; RV64IM-NEXT: slli a4, a4, 12
	; RV64IM-NEXT: addi a4, a4, 883
	; RV64IM-NEXT: slli a4, a4, 14
	; RV64IM-NEXT: addi a4, a4, -861
	; RV64IM-NEXT: slli a4, a4, 12
	; RV64IM-NEXT: addi a4, a4, -179
	; RV64IM-NEXT: mulhu a4, a2, a4
	; RV64IM-NEXT: srli a4, a4, 12
	; RV64IM-NEXT: lui a5, 1
	; RV64IM-NEXT: addiw a5, a5, 1327
	; RV64IM-NEXT: mul a4, a4, a5
	; RV64IM-NEXT: sub a2, a2, a4
	; RV64IM-NEXT: sh zero, 0(a0)			; RV64IM-NEXT: sh zero, 0(a0)
	; RV64IM-NEXT: sh a2, 6(a0)			; RV64IM-NEXT: sh a3, 6(a0)
	; RV64IM-NEXT: sh a3, 2(a0)			; RV64IM-NEXT: sh a1, 2(a0)
	; RV64IM-NEXT: sh a1, 4(a0)			; RV64IM-NEXT: sh a2, 4(a0)
	; RV64IM-NEXT: ret			; RV64IM-NEXT: ret
	%1 = urem <4 x i16> %x, <i16 1, i16 654, i16 23, i16 5423>			%1 = urem <4 x i16> %x, <i16 1, i16 654, i16 23, i16 5423>
	ret <4 x i16> %1			ret <4 x i16> %1
	}			}

	; Don't fold if the divisor is 2^16.			; Don't fold if the divisor is 2^16.
	define <4 x i16> @dont_fold_urem_i16_smax(<4 x i16> %x) nounwind {			define <4 x i16> @dont_fold_urem_i16_smax(<4 x i16> %x) nounwind {
	; CHECK-LABEL: dont_fold_urem_i16_smax:			; CHECK-LABEL: dont_fold_urem_i16_smax:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%1 = urem <4 x i16> %x, <i16 1, i16 65536, i16 23, i16 5423>			%1 = urem <4 x i16> %x, <i16 1, i16 65536, i16 23, i16 5423>
	ret <4 x i16> %1			ret <4 x i16> %1
	}			}

	; Don't fold i64 urem.			; Don't fold i64 urem.
	define <4 x i64> @dont_fold_urem_i64(<4 x i64> %x) nounwind {			define <4 x i64> @dont_fold_urem_i64(<4 x i64> %x) nounwind {
	; RV32I-LABEL: dont_fold_urem_i64:			; RV32I-LABEL: dont_fold_urem_i64:
	; RV32I: # %bb.0:			; RV32I: # %bb.0:
	; RV32I-NEXT: addi sp, sp, -48			; RV32I-NEXT: addi sp, sp, -464
	; RV32I-NEXT: sw ra, 44(sp)			; RV32I-NEXT: sw ra, 460(sp)
	; RV32I-NEXT: sw s0, 40(sp)			; RV32I-NEXT: sw s0, 456(sp)
	; RV32I-NEXT: sw s1, 36(sp)			; RV32I-NEXT: sw s1, 452(sp)
	; RV32I-NEXT: sw s2, 32(sp)			; RV32I-NEXT: sw s2, 448(sp)
	; RV32I-NEXT: sw s3, 28(sp)			; RV32I-NEXT: sw s3, 444(sp)
	; RV32I-NEXT: sw s4, 24(sp)			; RV32I-NEXT: sw s4, 440(sp)
	; RV32I-NEXT: sw s5, 20(sp)			; RV32I-NEXT: sw s5, 436(sp)
	; RV32I-NEXT: sw s6, 16(sp)			; RV32I-NEXT: sw s6, 432(sp)
	; RV32I-NEXT: sw s7, 12(sp)			; RV32I-NEXT: sw s7, 428(sp)
	; RV32I-NEXT: sw s8, 8(sp)			; RV32I-NEXT: sw s8, 424(sp)
	; RV32I-NEXT: sw s9, 4(sp)			; RV32I-NEXT: sw s9, 420(sp)
	; RV32I-NEXT: lw s2, 24(a1)			; RV32I-NEXT: sw s10, 416(sp)
	; RV32I-NEXT: lw s3, 28(a1)			; RV32I-NEXT: sw s11, 412(sp)
	; RV32I-NEXT: lw s4, 16(a1)			; RV32I-NEXT: lw a2, 0(a1)
	; RV32I-NEXT: lw s5, 20(a1)			; RV32I-NEXT: sw a2, 20(sp)
	; RV32I-NEXT: lw s6, 8(a1)			; RV32I-NEXT: lw a2, 4(a1)
	; RV32I-NEXT: lw s1, 12(a1)			; RV32I-NEXT: sw a2, 16(sp)
	; RV32I-NEXT: lw a3, 0(a1)			; RV32I-NEXT: lw s6, 24(a1)
	; RV32I-NEXT: lw a1, 4(a1)			; RV32I-NEXT: lw s0, 28(a1)
	; RV32I-NEXT: mv s0, a0			; RV32I-NEXT: lw s7, 16(a1)
	; RV32I-NEXT: addi a2, zero, 1			; RV32I-NEXT: lw s1, 20(a1)
	; RV32I-NEXT: mv a0, a3			; RV32I-NEXT: lw s8, 8(a1)
	; RV32I-NEXT: mv a3, zero			; RV32I-NEXT: lw s10, 12(a1)
	; RV32I-NEXT: call __umoddi3			; RV32I-NEXT: mv s5, a0
	; RV32I-NEXT: mv s7, a0			; RV32I-NEXT: sw zero, 180(sp)
	; RV32I-NEXT: mv s8, a1			; RV32I-NEXT: sw zero, 176(sp)
				; RV32I-NEXT: sw zero, 196(sp)
				; RV32I-NEXT: sw zero, 192(sp)
				; RV32I-NEXT: lui a0, 410452
				; RV32I-NEXT: addi a0, a0, -952
				; RV32I-NEXT: sw a0, 172(sp)
				; RV32I-NEXT: lui a0, 25653
				; RV32I-NEXT: addi a0, a0, 965
				; RV32I-NEXT: sw a0, 168(sp)
				; RV32I-NEXT: srli a0, s10, 1
				; RV32I-NEXT: sw a0, 188(sp)
				; RV32I-NEXT: slli a0, s10, 31
				; RV32I-NEXT: srli a1, s8, 1
				; RV32I-NEXT: or a3, a1, a0
				; RV32I-NEXT: addi a0, sp, 200
				; RV32I-NEXT: addi a1, sp, 184
				; RV32I-NEXT: addi a2, sp, 168
				; RV32I-NEXT: sw a3, 184(sp)
				; RV32I-NEXT: call __multi3
				; RV32I-NEXT: sw zero, 276(sp)
				; RV32I-NEXT: sw zero, 272(sp)
				; RV32I-NEXT: sw zero, 292(sp)
				; RV32I-NEXT: sw zero, 288(sp)
				; RV32I-NEXT: lui a0, 410312
				; RV32I-NEXT: addi a0, a0, 1424
				; RV32I-NEXT: sw a0, 268(sp)
				; RV32I-NEXT: lui a0, 729444
				; RV32I-NEXT: addi a0, a0, 713
				; RV32I-NEXT: sw a0, 264(sp)
				; RV32I-NEXT: sw s1, 284(sp)
				; RV32I-NEXT: mv s3, s1
				; RV32I-NEXT: sw s1, 8(sp)
				; RV32I-NEXT: addi a0, sp, 296
				; RV32I-NEXT: addi a1, sp, 280
				; RV32I-NEXT: addi a2, sp, 264
				; RV32I-NEXT: sw s7, 280(sp)
				; RV32I-NEXT: call __multi3
				; RV32I-NEXT: sw zero, 372(sp)
				; RV32I-NEXT: sw zero, 368(sp)
				; RV32I-NEXT: sw zero, 388(sp)
				; RV32I-NEXT: sw zero, 384(sp)
				; RV32I-NEXT: lui a0, 791991
				; RV32I-NEXT: addi a0, a0, 77
				; RV32I-NEXT: sw a0, 364(sp)
				; RV32I-NEXT: lui a0, 834723
				; RV32I-NEXT: addi a0, a0, -179
				; RV32I-NEXT: sw a0, 360(sp)
				; RV32I-NEXT: sw s0, 380(sp)
				; RV32I-NEXT: mv s4, s0
				; RV32I-NEXT: sw s0, 12(sp)
				; RV32I-NEXT: addi a0, sp, 392
				; RV32I-NEXT: addi a1, sp, 376
				; RV32I-NEXT: addi a2, sp, 360
				; RV32I-NEXT: sw s6, 376(sp)
				; RV32I-NEXT: call __multi3
				; RV32I-NEXT: sw zero, 132(sp)
				; RV32I-NEXT: sw zero, 128(sp)
				; RV32I-NEXT: sw zero, 124(sp)
				; RV32I-NEXT: sw zero, 120(sp)
				; RV32I-NEXT: sw zero, 148(sp)
				; RV32I-NEXT: sw zero, 144(sp)
				; RV32I-NEXT: lw s0, 208(sp)
				; RV32I-NEXT: sub a0, s8, s0
				; RV32I-NEXT: sw a0, 136(sp)
				; RV32I-NEXT: lw s1, 212(sp)
				; RV32I-NEXT: sltu a0, s8, s0
				; RV32I-NEXT: sub a1, s10, s1
				; RV32I-NEXT: sub a3, a1, a0
				; RV32I-NEXT: addi a0, sp, 152
				; RV32I-NEXT: addi a1, sp, 136
				; RV32I-NEXT: addi a2, sp, 120
				; RV32I-NEXT: sw a3, 140(sp)
				; RV32I-NEXT: call __multi3
				; RV32I-NEXT: sw zero, 228(sp)
				; RV32I-NEXT: sw zero, 224(sp)
				; RV32I-NEXT: lui a0, 524288
				; RV32I-NEXT: sw a0, 220(sp)
				; RV32I-NEXT: sw zero, 216(sp)
				; RV32I-NEXT: sw zero, 244(sp)
				; RV32I-NEXT: sw zero, 240(sp)
				; RV32I-NEXT: lw s2, 304(sp)
				; RV32I-NEXT: sub a0, s7, s2
				; RV32I-NEXT: sw a0, 232(sp)
				; RV32I-NEXT: lw s9, 308(sp)
				; RV32I-NEXT: sltu a0, s7, s2
				; RV32I-NEXT: sub a1, s3, s9
				; RV32I-NEXT: sub a3, a1, a0
				; RV32I-NEXT: addi a0, sp, 248
				; RV32I-NEXT: addi a1, sp, 232
				; RV32I-NEXT: addi a2, sp, 216
				; RV32I-NEXT: sw a3, 236(sp)
				; RV32I-NEXT: call __multi3
				; RV32I-NEXT: sw zero, 324(sp)
				; RV32I-NEXT: sw zero, 320(sp)
				; RV32I-NEXT: sw zero, 316(sp)
				; RV32I-NEXT: sw zero, 312(sp)
				; RV32I-NEXT: sw zero, 340(sp)
				; RV32I-NEXT: sw zero, 336(sp)
				; RV32I-NEXT: lw s3, 400(sp)
				; RV32I-NEXT: sub a0, s6, s3
				; RV32I-NEXT: sw a0, 328(sp)
				; RV32I-NEXT: lw s11, 404(sp)
				; RV32I-NEXT: sltu a0, s6, s3
				; RV32I-NEXT: sub a1, s4, s11
				; RV32I-NEXT: sub a3, a1, a0
				; RV32I-NEXT: addi a0, sp, 344
				; RV32I-NEXT: addi a1, sp, 328
				; RV32I-NEXT: addi a2, sp, 312
				; RV32I-NEXT: sw a3, 332(sp)
				; RV32I-NEXT: call __multi3
				; RV32I-NEXT: lw a0, 164(sp)
				; RV32I-NEXT: lw a1, 160(sp)
				; RV32I-NEXT: add a0, a0, s1
				; RV32I-NEXT: add a2, a1, s0
				; RV32I-NEXT: sltu a1, a2, a1
				; RV32I-NEXT: add a1, a0, a1
				; RV32I-NEXT: slli a0, a1, 25
				; RV32I-NEXT: srli a2, a2, 7
				; RV32I-NEXT: or a0, a2, a0
				; RV32I-NEXT: srli a1, a1, 7
	; RV32I-NEXT: addi a2, zero, 654			; RV32I-NEXT: addi a2, zero, 654
	; RV32I-NEXT: mv a0, s6
	; RV32I-NEXT: mv a1, s1
	; RV32I-NEXT: mv a3, zero			; RV32I-NEXT: mv a3, zero
	; RV32I-NEXT: call __umoddi3			; RV32I-NEXT: call __muldi3
	; RV32I-NEXT: mv s6, a0			; RV32I-NEXT: mv s4, a0
	; RV32I-NEXT: mv s9, a1			; RV32I-NEXT: sub a0, s10, a1
				; RV32I-NEXT: lw a1, 260(sp)
				; RV32I-NEXT: lw a2, 256(sp)
				; RV32I-NEXT: sltu a3, s8, s4
				; RV32I-NEXT: sub s10, a0, a3
				; RV32I-NEXT: add a0, a1, s9
				; RV32I-NEXT: add a1, a2, s2
				; RV32I-NEXT: sltu a2, a1, a2
				; RV32I-NEXT: add a2, a0, a2
				; RV32I-NEXT: slli a0, a2, 28
				; RV32I-NEXT: srli a1, a1, 4
				; RV32I-NEXT: or a0, a1, a0
				; RV32I-NEXT: srli a1, a2, 4
	; RV32I-NEXT: addi a2, zero, 23			; RV32I-NEXT: addi a2, zero, 23
	; RV32I-NEXT: mv a0, s4
	; RV32I-NEXT: mv a1, s5
	; RV32I-NEXT: mv a3, zero			; RV32I-NEXT: mv a3, zero
	; RV32I-NEXT: call __umoddi3			; RV32I-NEXT: call __muldi3
	; RV32I-NEXT: mv s4, a0			; RV32I-NEXT: mv s9, a0
	; RV32I-NEXT: mv s1, a1			; RV32I-NEXT: lw a0, 8(sp)
	; RV32I-NEXT: lui a0, 1			; RV32I-NEXT: sub a0, a0, a1
	; RV32I-NEXT: addi a2, a0, 1327			; RV32I-NEXT: lw a1, 356(sp)
	; RV32I-NEXT: mv a0, s2			; RV32I-NEXT: lw a2, 352(sp)
	; RV32I-NEXT: mv a1, s3			; RV32I-NEXT: sltu a3, s7, s9
				; RV32I-NEXT: sub s2, a0, a3
				; RV32I-NEXT: add a0, a1, s11
				; RV32I-NEXT: add a1, a2, s3
				; RV32I-NEXT: sltu a2, a1, a2
				; RV32I-NEXT: add a2, a0, a2
				; RV32I-NEXT: slli a0, a2, 20
				; RV32I-NEXT: srli a1, a1, 12
				; RV32I-NEXT: or a0, a1, a0
				; RV32I-NEXT: srli a1, a2, 12
				; RV32I-NEXT: lui a2, 1
				; RV32I-NEXT: addi a2, a2, 1327
	; RV32I-NEXT: mv a3, zero			; RV32I-NEXT: mv a3, zero
	; RV32I-NEXT: call __umoddi3			; RV32I-NEXT: call __muldi3
	; RV32I-NEXT: sw a1, 28(s0)			; RV32I-NEXT: mv s11, a0
	; RV32I-NEXT: sw a0, 24(s0)			; RV32I-NEXT: sltu a0, s6, a0
	; RV32I-NEXT: sw s1, 20(s0)			; RV32I-NEXT: lw a2, 12(sp)
	; RV32I-NEXT: sw s4, 16(s0)			; RV32I-NEXT: sub a1, a2, a1
	; RV32I-NEXT: sw s9, 12(s0)			; RV32I-NEXT: sub s3, a1, a0
	; RV32I-NEXT: sw s6, 8(s0)			; RV32I-NEXT: addi a2, zero, 1
	; RV32I-NEXT: sw s8, 4(s0)			; RV32I-NEXT: lw s1, 20(sp)
	; RV32I-NEXT: sw s7, 0(s0)			; RV32I-NEXT: mv a0, s1
	; RV32I-NEXT: lw s9, 4(sp)			; RV32I-NEXT: lw s0, 16(sp)
	; RV32I-NEXT: lw s8, 8(sp)			; RV32I-NEXT: mv a1, s0
	; RV32I-NEXT: lw s7, 12(sp)			; RV32I-NEXT: mv a3, zero
	; RV32I-NEXT: lw s6, 16(sp)			; RV32I-NEXT: call __muldi3
	; RV32I-NEXT: lw s5, 20(sp)			; RV32I-NEXT: sltu a2, s1, a0
	; RV32I-NEXT: lw s4, 24(sp)			; RV32I-NEXT: sub a1, s0, a1
	; RV32I-NEXT: lw s3, 28(sp)			; RV32I-NEXT: sub a1, a1, a2
	; RV32I-NEXT: lw s2, 32(sp)			; RV32I-NEXT: sub a2, s8, s4
	; RV32I-NEXT: lw s1, 36(sp)			; RV32I-NEXT: sub a3, s7, s9
	; RV32I-NEXT: lw s0, 40(sp)			; RV32I-NEXT: sub a4, s6, s11
	; RV32I-NEXT: lw ra, 44(sp)			; RV32I-NEXT: sub a0, s1, a0
	; RV32I-NEXT: addi sp, sp, 48			; RV32I-NEXT: sw a0, 0(s5)
				; RV32I-NEXT: sw a1, 4(s5)
				; RV32I-NEXT: sw a4, 24(s5)
				; RV32I-NEXT: sw a3, 16(s5)
				; RV32I-NEXT: sw s3, 28(s5)
				; RV32I-NEXT: sw s2, 20(s5)
				; RV32I-NEXT: sw a2, 8(s5)
				; RV32I-NEXT: sw s10, 12(s5)
				; RV32I-NEXT: lw s11, 412(sp)
				; RV32I-NEXT: lw s10, 416(sp)
				; RV32I-NEXT: lw s9, 420(sp)
				; RV32I-NEXT: lw s8, 424(sp)
				; RV32I-NEXT: lw s7, 428(sp)
				; RV32I-NEXT: lw s6, 432(sp)
				; RV32I-NEXT: lw s5, 436(sp)
				; RV32I-NEXT: lw s4, 440(sp)
				; RV32I-NEXT: lw s3, 444(sp)
				; RV32I-NEXT: lw s2, 448(sp)
				; RV32I-NEXT: lw s1, 452(sp)
				; RV32I-NEXT: lw s0, 456(sp)
				; RV32I-NEXT: lw ra, 460(sp)
				; RV32I-NEXT: addi sp, sp, 464
	; RV32I-NEXT: ret			; RV32I-NEXT: ret
	;			;
	; RV32IM-LABEL: dont_fold_urem_i64:			; RV32IM-LABEL: dont_fold_urem_i64:
	; RV32IM: # %bb.0:			; RV32IM: # %bb.0:
	; RV32IM-NEXT: addi sp, sp, -48			; RV32IM-NEXT: addi sp, sp, -448
	; RV32IM-NEXT: sw ra, 44(sp)			; RV32IM-NEXT: sw ra, 444(sp)
	; RV32IM-NEXT: sw s0, 40(sp)			; RV32IM-NEXT: sw s0, 440(sp)
	; RV32IM-NEXT: sw s1, 36(sp)			; RV32IM-NEXT: sw s1, 436(sp)
	; RV32IM-NEXT: sw s2, 32(sp)			; RV32IM-NEXT: sw s2, 432(sp)
	; RV32IM-NEXT: sw s3, 28(sp)			; RV32IM-NEXT: sw s3, 428(sp)
	; RV32IM-NEXT: sw s4, 24(sp)			; RV32IM-NEXT: sw s4, 424(sp)
	; RV32IM-NEXT: sw s5, 20(sp)			; RV32IM-NEXT: sw s5, 420(sp)
	; RV32IM-NEXT: sw s6, 16(sp)			; RV32IM-NEXT: sw s6, 416(sp)
	; RV32IM-NEXT: sw s7, 12(sp)			; RV32IM-NEXT: sw s7, 412(sp)
	; RV32IM-NEXT: sw s8, 8(sp)			; RV32IM-NEXT: sw s8, 408(sp)
	; RV32IM-NEXT: sw s9, 4(sp)			; RV32IM-NEXT: sw s9, 404(sp)
				; RV32IM-NEXT: sw s10, 400(sp)
				; RV32IM-NEXT: sw s11, 396(sp)
	; RV32IM-NEXT: lw s2, 24(a1)			; RV32IM-NEXT: lw s2, 24(a1)
	; RV32IM-NEXT: lw s3, 28(a1)			; RV32IM-NEXT: lw s5, 28(a1)
	; RV32IM-NEXT: lw s4, 16(a1)			; RV32IM-NEXT: lw s3, 16(a1)
	; RV32IM-NEXT: lw s5, 20(a1)			; RV32IM-NEXT: lw s1, 20(a1)
	; RV32IM-NEXT: lw s6, 8(a1)			; RV32IM-NEXT: lw s6, 8(a1)
	; RV32IM-NEXT: lw s1, 12(a1)			; RV32IM-NEXT: lw s7, 12(a1)
	; RV32IM-NEXT: lw a3, 0(a1)			; RV32IM-NEXT: mv s9, a0
	; RV32IM-NEXT: lw a1, 4(a1)			; RV32IM-NEXT: sw zero, 164(sp)
	; RV32IM-NEXT: mv s0, a0			; RV32IM-NEXT: sw zero, 160(sp)
	; RV32IM-NEXT: addi a2, zero, 1			; RV32IM-NEXT: sw zero, 180(sp)
	; RV32IM-NEXT: mv a0, a3			; RV32IM-NEXT: sw zero, 176(sp)
	; RV32IM-NEXT: mv a3, zero			; RV32IM-NEXT: lui a0, 410452
	; RV32IM-NEXT: call __umoddi3			; RV32IM-NEXT: addi a0, a0, -952
	; RV32IM-NEXT: mv s7, a0			; RV32IM-NEXT: sw a0, 156(sp)
	; RV32IM-NEXT: mv s8, a1			; RV32IM-NEXT: lui a0, 25653
	; RV32IM-NEXT: addi a2, zero, 654			; RV32IM-NEXT: addi a0, a0, 965
	; RV32IM-NEXT: mv a0, s6			; RV32IM-NEXT: sw a0, 152(sp)
	; RV32IM-NEXT: mv a1, s1			; RV32IM-NEXT: srli a0, s7, 1
	; RV32IM-NEXT: mv a3, zero			; RV32IM-NEXT: sw a0, 172(sp)
	; RV32IM-NEXT: call __umoddi3			; RV32IM-NEXT: slli a0, s7, 31
	; RV32IM-NEXT: mv s6, a0			; RV32IM-NEXT: srli a1, s6, 1
	; RV32IM-NEXT: mv s9, a1			; RV32IM-NEXT: or a3, a1, a0
	; RV32IM-NEXT: addi a2, zero, 23			; RV32IM-NEXT: addi a0, sp, 184
	; RV32IM-NEXT: mv a0, s4			; RV32IM-NEXT: addi a1, sp, 168
	; RV32IM-NEXT: mv a1, s5			; RV32IM-NEXT: addi a2, sp, 152
	; RV32IM-NEXT: mv a3, zero			; RV32IM-NEXT: sw a3, 168(sp)
	; RV32IM-NEXT: call __umoddi3			; RV32IM-NEXT: call __multi3
	; RV32IM-NEXT: mv s4, a0			; RV32IM-NEXT: sw zero, 260(sp)
	; RV32IM-NEXT: mv s1, a1			; RV32IM-NEXT: sw zero, 256(sp)
	; RV32IM-NEXT: lui a0, 1			; RV32IM-NEXT: sw zero, 276(sp)
	; RV32IM-NEXT: addi a2, a0, 1327			; RV32IM-NEXT: sw zero, 272(sp)
	; RV32IM-NEXT: mv a0, s2			; RV32IM-NEXT: lui a0, 410312
	; RV32IM-NEXT: mv a1, s3			; RV32IM-NEXT: addi a0, a0, 1424
	; RV32IM-NEXT: mv a3, zero			; RV32IM-NEXT: sw a0, 252(sp)
	; RV32IM-NEXT: call __umoddi3			; RV32IM-NEXT: lui a0, 729444
	; RV32IM-NEXT: sw a1, 28(s0)			; RV32IM-NEXT: addi a0, a0, 713
	; RV32IM-NEXT: sw a0, 24(s0)			; RV32IM-NEXT: sw a0, 248(sp)
	; RV32IM-NEXT: sw s1, 20(s0)			; RV32IM-NEXT: sw s1, 268(sp)
	; RV32IM-NEXT: sw s4, 16(s0)			; RV32IM-NEXT: sw s1, 4(sp)
	; RV32IM-NEXT: sw s9, 12(s0)			; RV32IM-NEXT: addi a0, sp, 280
	; RV32IM-NEXT: sw s6, 8(s0)			; RV32IM-NEXT: addi a1, sp, 264
	; RV32IM-NEXT: sw s8, 4(s0)			; RV32IM-NEXT: addi a2, sp, 248
	; RV32IM-NEXT: sw s7, 0(s0)			; RV32IM-NEXT: sw s3, 264(sp)
	; RV32IM-NEXT: lw s9, 4(sp)			; RV32IM-NEXT: call __multi3
	; RV32IM-NEXT: lw s8, 8(sp)			; RV32IM-NEXT: sw zero, 356(sp)
	; RV32IM-NEXT: lw s7, 12(sp)			; RV32IM-NEXT: sw zero, 352(sp)
	; RV32IM-NEXT: lw s6, 16(sp)			; RV32IM-NEXT: sw zero, 372(sp)
	; RV32IM-NEXT: lw s5, 20(sp)			; RV32IM-NEXT: sw zero, 368(sp)
	; RV32IM-NEXT: lw s4, 24(sp)			; RV32IM-NEXT: lui a0, 791991
	; RV32IM-NEXT: lw s3, 28(sp)			; RV32IM-NEXT: addi a0, a0, 77
	; RV32IM-NEXT: lw s2, 32(sp)			; RV32IM-NEXT: sw a0, 348(sp)
	; RV32IM-NEXT: lw s1, 36(sp)			; RV32IM-NEXT: lui a0, 834723
	; RV32IM-NEXT: lw s0, 40(sp)			; RV32IM-NEXT: addi a0, a0, -179
	; RV32IM-NEXT: lw ra, 44(sp)			; RV32IM-NEXT: sw a0, 344(sp)
	; RV32IM-NEXT: addi sp, sp, 48			; RV32IM-NEXT: sw s5, 364(sp)
				; RV32IM-NEXT: addi a0, sp, 376
				; RV32IM-NEXT: addi a1, sp, 360
				; RV32IM-NEXT: addi a2, sp, 344
				; RV32IM-NEXT: sw s2, 360(sp)
				; RV32IM-NEXT: call __multi3
				; RV32IM-NEXT: sw zero, 116(sp)
				; RV32IM-NEXT: sw zero, 112(sp)
				; RV32IM-NEXT: sw zero, 108(sp)
				; RV32IM-NEXT: sw zero, 104(sp)
				; RV32IM-NEXT: sw zero, 132(sp)
				; RV32IM-NEXT: sw zero, 128(sp)
				; RV32IM-NEXT: lw s11, 192(sp)
				; RV32IM-NEXT: sub a0, s6, s11
				; RV32IM-NEXT: sw a0, 120(sp)
				; RV32IM-NEXT: lw s8, 196(sp)
				; RV32IM-NEXT: sltu a0, s6, s11
				; RV32IM-NEXT: sub a1, s7, s8
				; RV32IM-NEXT: sub a3, a1, a0
				; RV32IM-NEXT: addi a0, sp, 136
				; RV32IM-NEXT: addi a1, sp, 120
				; RV32IM-NEXT: addi a2, sp, 104
				; RV32IM-NEXT: sw a3, 124(sp)
				; RV32IM-NEXT: call __multi3
				; RV32IM-NEXT: sw zero, 212(sp)
				; RV32IM-NEXT: sw zero, 208(sp)
				; RV32IM-NEXT: lui a0, 524288
				; RV32IM-NEXT: sw a0, 204(sp)
				; RV32IM-NEXT: sw zero, 200(sp)
				; RV32IM-NEXT: sw zero, 228(sp)
				; RV32IM-NEXT: sw zero, 224(sp)
				; RV32IM-NEXT: lw s0, 288(sp)
				; RV32IM-NEXT: sub a0, s3, s0
				; RV32IM-NEXT: sw a0, 216(sp)
				; RV32IM-NEXT: lw s10, 292(sp)
				; RV32IM-NEXT: sltu a0, s3, s0
				; RV32IM-NEXT: sub a1, s1, s10
				; RV32IM-NEXT: sub a3, a1, a0
				; RV32IM-NEXT: addi a0, sp, 232
				; RV32IM-NEXT: addi a1, sp, 216
				; RV32IM-NEXT: addi a2, sp, 200
				; RV32IM-NEXT: sw a3, 220(sp)
				; RV32IM-NEXT: call __multi3
				; RV32IM-NEXT: sw zero, 308(sp)
				; RV32IM-NEXT: sw zero, 304(sp)
				; RV32IM-NEXT: sw zero, 300(sp)
				; RV32IM-NEXT: sw zero, 296(sp)
				; RV32IM-NEXT: sw zero, 324(sp)
				; RV32IM-NEXT: sw zero, 320(sp)
				; RV32IM-NEXT: lw s1, 384(sp)
				; RV32IM-NEXT: sub a0, s2, s1
				; RV32IM-NEXT: sw a0, 312(sp)
				; RV32IM-NEXT: lw s4, 388(sp)
				; RV32IM-NEXT: sltu a0, s2, s1
				; RV32IM-NEXT: sub a1, s5, s4
				; RV32IM-NEXT: sub a3, a1, a0
				; RV32IM-NEXT: addi a0, sp, 328
				; RV32IM-NEXT: addi a1, sp, 312
				; RV32IM-NEXT: addi a2, sp, 296
				; RV32IM-NEXT: sw a3, 316(sp)
				; RV32IM-NEXT: call __multi3
				; RV32IM-NEXT: lw a0, 148(sp)
				; RV32IM-NEXT: lw a1, 144(sp)
				; RV32IM-NEXT: add a0, a0, s8
				; RV32IM-NEXT: add a2, a1, s11
				; RV32IM-NEXT: sltu a1, a2, a1
				; RV32IM-NEXT: add a0, a0, a1
				; RV32IM-NEXT: srli a1, a0, 7
				; RV32IM-NEXT: addi a3, zero, 654
				; RV32IM-NEXT: mul a1, a1, a3
				; RV32IM-NEXT: slli a0, a0, 25
				; RV32IM-NEXT: srli a2, a2, 7
				; RV32IM-NEXT: or a0, a2, a0
				; RV32IM-NEXT: mulhu a2, a0, a3
				; RV32IM-NEXT: add a1, a2, a1
				; RV32IM-NEXT: sub a1, s7, a1
				; RV32IM-NEXT: mul a0, a0, a3
				; RV32IM-NEXT: lw a2, 244(sp)
				; RV32IM-NEXT: lw a3, 240(sp)
				; RV32IM-NEXT: sltu a4, s6, a0
				; RV32IM-NEXT: sub a1, a1, a4
				; RV32IM-NEXT: add a2, a2, s10
				; RV32IM-NEXT: add a4, a3, s0
				; RV32IM-NEXT: sltu a3, a4, a3
				; RV32IM-NEXT: add a2, a2, a3
				; RV32IM-NEXT: srli a3, a2, 4
				; RV32IM-NEXT: addi a5, zero, 23
				; RV32IM-NEXT: mul a3, a3, a5
				; RV32IM-NEXT: slli a2, a2, 28
				; RV32IM-NEXT: srli a4, a4, 4
				; RV32IM-NEXT: or a2, a4, a2
				; RV32IM-NEXT: mulhu a4, a2, a5
				; RV32IM-NEXT: add a3, a4, a3
				; RV32IM-NEXT: lw a4, 4(sp)
				; RV32IM-NEXT: sub a3, a4, a3
				; RV32IM-NEXT: mul a2, a2, a5
				; RV32IM-NEXT: lw a4, 340(sp)
				; RV32IM-NEXT: lw a5, 336(sp)
				; RV32IM-NEXT: sltu s0, s3, a2
				; RV32IM-NEXT: sub a3, a3, s0
				; RV32IM-NEXT: add a4, a4, s4
				; RV32IM-NEXT: add s1, a5, s1
				; RV32IM-NEXT: sltu a5, s1, a5
				; RV32IM-NEXT: add a4, a4, a5
				; RV32IM-NEXT: srli a5, a4, 12
				; RV32IM-NEXT: lui s0, 1
				; RV32IM-NEXT: addi s0, s0, 1327
				; RV32IM-NEXT: mul a5, a5, s0
				; RV32IM-NEXT: slli a4, a4, 20
				; RV32IM-NEXT: srli s1, s1, 12
				; RV32IM-NEXT: or a4, s1, a4
				; RV32IM-NEXT: mulhu s1, a4, s0
				; RV32IM-NEXT: add a5, s1, a5
				; RV32IM-NEXT: sub a5, s5, a5
				; RV32IM-NEXT: mul a4, a4, s0
				; RV32IM-NEXT: sltu s1, s2, a4
				; RV32IM-NEXT: sub a5, a5, s1
				; RV32IM-NEXT: sub a0, s6, a0
				; RV32IM-NEXT: sub a2, s3, a2
				; RV32IM-NEXT: sub a4, s2, a4
				; RV32IM-NEXT: sw zero, 4(s9)
				; RV32IM-NEXT: sw zero, 0(s9)
				; RV32IM-NEXT: sw a4, 24(s9)
				; RV32IM-NEXT: sw a2, 16(s9)
				; RV32IM-NEXT: sw a5, 28(s9)
				; RV32IM-NEXT: sw a3, 20(s9)
				; RV32IM-NEXT: sw a0, 8(s9)
				; RV32IM-NEXT: sw a1, 12(s9)
				; RV32IM-NEXT: lw s11, 396(sp)
				; RV32IM-NEXT: lw s10, 400(sp)
				; RV32IM-NEXT: lw s9, 404(sp)
				; RV32IM-NEXT: lw s8, 408(sp)
				; RV32IM-NEXT: lw s7, 412(sp)
				; RV32IM-NEXT: lw s6, 416(sp)
				; RV32IM-NEXT: lw s5, 420(sp)
				; RV32IM-NEXT: lw s4, 424(sp)
				; RV32IM-NEXT: lw s3, 428(sp)
				; RV32IM-NEXT: lw s2, 432(sp)
				; RV32IM-NEXT: lw s1, 436(sp)
				; RV32IM-NEXT: lw s0, 440(sp)
				; RV32IM-NEXT: lw ra, 444(sp)
				; RV32IM-NEXT: addi sp, sp, 448
	; RV32IM-NEXT: ret			; RV32IM-NEXT: ret
	;			;
	; RV64I-LABEL: dont_fold_urem_i64:			; RV64I-LABEL: dont_fold_urem_i64:
	; RV64I: # %bb.0:			; RV64I: # %bb.0:
	; RV64I-NEXT: addi sp, sp, -48			; RV64I-NEXT: addi sp, sp, -64
	; RV64I-NEXT: sd ra, 40(sp)			; RV64I-NEXT: sd ra, 56(sp)
	; RV64I-NEXT: sd s0, 32(sp)			; RV64I-NEXT: sd s0, 48(sp)
	; RV64I-NEXT: sd s1, 24(sp)			; RV64I-NEXT: sd s1, 40(sp)
	; RV64I-NEXT: sd s2, 16(sp)			; RV64I-NEXT: sd s2, 32(sp)
	; RV64I-NEXT: sd s3, 8(sp)			; RV64I-NEXT: sd s3, 24(sp)
				; RV64I-NEXT: sd s4, 16(sp)
				; RV64I-NEXT: sd s5, 8(sp)
	; RV64I-NEXT: ld s2, 24(a1)			; RV64I-NEXT: ld s2, 24(a1)
	; RV64I-NEXT: ld s1, 16(a1)			; RV64I-NEXT: ld s5, 16(a1)
	; RV64I-NEXT: ld a2, 8(a1)			; RV64I-NEXT: ld s1, 8(a1)
	; RV64I-NEXT: mv s0, a0
	; RV64I-NEXT: addi a1, zero, 654
	; RV64I-NEXT: mv a0, a2
	; RV64I-NEXT: call __umoddi3
	; RV64I-NEXT: mv s3, a0			; RV64I-NEXT: mv s3, a0
				; RV64I-NEXT: srli a0, s1, 1
				; RV64I-NEXT: lui a1, 6413
				; RV64I-NEXT: addiw a1, a1, 1265
				; RV64I-NEXT: slli a1, a1, 13
				; RV64I-NEXT: addi a1, a1, 1027
				; RV64I-NEXT: slli a1, a1, 13
				; RV64I-NEXT: addi a1, a1, 1077
				; RV64I-NEXT: slli a1, a1, 12
				; RV64I-NEXT: addi a2, a1, 965
				; RV64I-NEXT: mv a1, zero
				; RV64I-NEXT: mv a3, zero
				; RV64I-NEXT: call __multi3
				; RV64I-NEXT: mv s0, a1
				; RV64I-NEXT: sub a0, s1, a1
				; RV64I-NEXT: mv a1, zero
				; RV64I-NEXT: mv a2, zero
				; RV64I-NEXT: mv a3, zero
				; RV64I-NEXT: call __multi3
				; RV64I-NEXT: add a0, a1, s0
				; RV64I-NEXT: srli a0, a0, 7
				; RV64I-NEXT: addi a1, zero, 654
				; RV64I-NEXT: call __muldi3
				; RV64I-NEXT: sub s4, s1, a0
				; RV64I-NEXT: lui a0, 3206
				; RV64I-NEXT: addiw a0, a0, -1781
				; RV64I-NEXT: slli a0, a0, 13
				; RV64I-NEXT: addi a0, a0, 1069
				; RV64I-NEXT: slli a0, a0, 12
				; RV64I-NEXT: addi a0, a0, -1959
				; RV64I-NEXT: slli a0, a0, 14
				; RV64I-NEXT: addi a2, a0, 713
				; RV64I-NEXT: mv a0, s5
				; RV64I-NEXT: mv a1, zero
				; RV64I-NEXT: mv a3, zero
				; RV64I-NEXT: call __multi3
				; RV64I-NEXT: mv s0, a1
				; RV64I-NEXT: sub a0, s5, a1
				; RV64I-NEXT: addi a1, zero, -1
				; RV64I-NEXT: slli a2, a1, 63
				; RV64I-NEXT: mv a1, zero
				; RV64I-NEXT: mv a3, zero
				; RV64I-NEXT: call __multi3
				; RV64I-NEXT: add a0, a1, s0
				; RV64I-NEXT: srli a0, a0, 4
	; RV64I-NEXT: addi a1, zero, 23			; RV64I-NEXT: addi a1, zero, 23
	; RV64I-NEXT: mv a0, s1			; RV64I-NEXT: call __muldi3
	; RV64I-NEXT: call __umoddi3			; RV64I-NEXT: sub s1, s5, a0
	; RV64I-NEXT: mv s1, a0			; RV64I-NEXT: lui a0, 1044567
	; RV64I-NEXT: lui a0, 1			; RV64I-NEXT: addiw a0, a0, -575
	; RV64I-NEXT: addiw a1, a0, 1327			; RV64I-NEXT: slli a0, a0, 12
				; RV64I-NEXT: addi a0, a0, 883
				; RV64I-NEXT: slli a0, a0, 14
				; RV64I-NEXT: addi a0, a0, -861
				; RV64I-NEXT: slli a0, a0, 12
				; RV64I-NEXT: addi a2, a0, -179
	; RV64I-NEXT: mv a0, s2			; RV64I-NEXT: mv a0, s2
	; RV64I-NEXT: call __umoddi3			; RV64I-NEXT: mv a1, zero
	; RV64I-NEXT: sd zero, 0(s0)			; RV64I-NEXT: mv a3, zero
	; RV64I-NEXT: sd a0, 24(s0)			; RV64I-NEXT: call __multi3
	; RV64I-NEXT: sd s1, 16(s0)			; RV64I-NEXT: mv s0, a1
	; RV64I-NEXT: sd s3, 8(s0)			; RV64I-NEXT: sub a0, s2, a1
	; RV64I-NEXT: ld s3, 8(sp)			; RV64I-NEXT: mv a1, zero
	; RV64I-NEXT: ld s2, 16(sp)			; RV64I-NEXT: mv a2, zero
	; RV64I-NEXT: ld s1, 24(sp)			; RV64I-NEXT: mv a3, zero
	; RV64I-NEXT: ld s0, 32(sp)			; RV64I-NEXT: call __multi3
	; RV64I-NEXT: ld ra, 40(sp)			; RV64I-NEXT: add a0, a1, s0
	; RV64I-NEXT: addi sp, sp, 48			; RV64I-NEXT: srli a0, a0, 12
				; RV64I-NEXT: lui a1, 1
				; RV64I-NEXT: addiw a1, a1, 1327
				; RV64I-NEXT: call __muldi3
				; RV64I-NEXT: sub a0, s2, a0
				; RV64I-NEXT: sd zero, 0(s3)
				; RV64I-NEXT: sd a0, 24(s3)
				; RV64I-NEXT: sd s1, 16(s3)
				; RV64I-NEXT: sd s4, 8(s3)
				; RV64I-NEXT: ld s5, 8(sp)
				; RV64I-NEXT: ld s4, 16(sp)
				; RV64I-NEXT: ld s3, 24(sp)
				; RV64I-NEXT: ld s2, 32(sp)
				; RV64I-NEXT: ld s1, 40(sp)
				; RV64I-NEXT: ld s0, 48(sp)
				; RV64I-NEXT: ld ra, 56(sp)
				; RV64I-NEXT: addi sp, sp, 64
	; RV64I-NEXT: ret			; RV64I-NEXT: ret
	;			;
	; RV64IM-LABEL: dont_fold_urem_i64:			; RV64IM-LABEL: dont_fold_urem_i64:
	; RV64IM: # %bb.0:			; RV64IM: # %bb.0:
	; RV64IM-NEXT: ld a2, 24(a1)			; RV64IM-NEXT: ld a2, 24(a1)
	; RV64IM-NEXT: ld a3, 8(a1)			; RV64IM-NEXT: ld a3, 8(a1)
	; RV64IM-NEXT: ld a1, 16(a1)			; RV64IM-NEXT: ld a1, 16(a1)
	; RV64IM-NEXT: lui a4, 3206			; RV64IM-NEXT: lui a4, 3206
	▲ Show 20 Lines • Show All 51 Lines • Show Last 20 Lines

llvm/test/CodeGen/SPARC/rem.ll

Show All 24 Lines	; CHECK-NEXT: sub %o0, %o1, %o0
ret i64 %tmp1		ret i64 %tmp1
}		}

; PR18150		; PR18150
define i64 @test3(i64 %b) {		define i64 @test3(i64 %b) {
; CHECK-LABEL: test3:		; CHECK-LABEL: test3:
; CHECK: .cfi_startproc		; CHECK: .cfi_startproc
; CHECK-NEXT: ! %bb.0: ! %entry		; CHECK-NEXT: ! %bb.0: ! %entry
; CHECK-NEXT: sethi 2545, %o1		; CHECK-NEXT: save %sp, -176, %sp
; CHECK-NEXT: or %o1, 379, %o1		; CHECK-NEXT: .cfi_def_cfa_register %fp
; CHECK-NEXT: mulx %o0, %o1, %o0		; CHECK-NEXT: .cfi_window_save
; CHECK-NEXT: udivx %o0, 1021, %o1		; CHECK-NEXT: .cfi_register %o7, %i7
; CHECK-NEXT: mulx %o1, 1021, %o1		; CHECK-NEXT: sethi 2545, %i1
; CHECK-NEXT: retl		; CHECK-NEXT: or %i1, 379, %i1
; CHECK-NEXT: sub %o0, %o1, %o0		; CHECK-NEXT: mulx %i0, %i1, %i0
		; CHECK-NEXT: sethi 1331003, %i1
		; CHECK-NEXT: or %i1, 435, %i1
		; CHECK-NEXT: sethi 12324, %i2
		; CHECK-NEXT: or %i2, 108, %i2
		; CHECK-NEXT: sllx %i2, 32, %i2
		; CHECK-NEXT: or %i2, %i1, %o3
		; CHECK-NEXT: mov 0, %o0
		; CHECK-NEXT: mov %i0, %o1
		; CHECK-NEXT: call __multi3
		; CHECK-NEXT: mov %o0, %o2
		; CHECK-NEXT: sub %i0, %o0, %i1
		; CHECK-NEXT: srlx %i1, 1, %i1
		; CHECK-NEXT: add %i1, %o0, %i1
		; CHECK-NEXT: srlx %i1, 9, %i1
		; CHECK-NEXT: mulx %i1, 1021, %i1
		; CHECK-NEXT: sub %i0, %i1, %i0
		; CHECK-NEXT: ret
		; CHECK-NEXT: restore
entry:		entry:
%mul = mul i64 %b, 2606459		%mul = mul i64 %b, 2606459
%rem = urem i64 %mul, 1021		%rem = urem i64 %mul, 1021
ret i64 %rem		ret i64 %rem
}		}

llvm/test/CodeGen/X86/divide-by-constant.ll

	Show First 20 Lines • Show All 288 Lines • ▼ Show 20 Lines
	entry:			entry:
	%div = udiv i32 %x, 33			%div = udiv i32 %x, 33
	ret i32 %div			ret i32 %div
	}			}

	define i64 @PR23590(i64 %x) nounwind {			define i64 @PR23590(i64 %x) nounwind {
	; X32-LABEL: PR23590:			; X32-LABEL: PR23590:
	; X32: # %bb.0: # %entry			; X32: # %bb.0: # %entry
	; X32-NEXT: subl $12, %esp			; X32-NEXT: pushl %ebp
	; X32-NEXT: pushl $0			; X32-NEXT: pushl %ebx
	; X32-NEXT: pushl $12345 # imm = 0x3039			; X32-NEXT: pushl %edi
	; X32-NEXT: pushl {{[0-9]+}}(%esp)			; X32-NEXT: pushl %esi
	; X32-NEXT: pushl {{[0-9]+}}(%esp)			; X32-NEXT: movl {{[0-9]+}}(%esp), %esi
	; X32-NEXT: calll __umoddi3			; X32-NEXT: movl {{[0-9]+}}(%esp), %ecx
	; X32-NEXT: addl $16, %esp			; X32-NEXT: movl $417841695, %ebx # imm = 0x18E7C21F
	; X32-NEXT: pushl $0			; X32-NEXT: movl %esi, %eax
	; X32-NEXT: pushl $7			; X32-NEXT: mull %ebx
	; X32-NEXT: pushl %edx			; X32-NEXT: movl %edx, %edi
	; X32-NEXT: pushl %eax			; X32-NEXT: movl %ecx, %eax
	; X32-NEXT: calll __udivdi3			; X32-NEXT: mull %ebx
	; X32-NEXT: addl $28, %esp			; X32-NEXT: movl %edx, %ebx
				; X32-NEXT: movl %eax, %ebp
				; X32-NEXT: addl %edi, %ebp
				; X32-NEXT: adcl $0, %ebx
				; X32-NEXT: movl $1425045447, %edx # imm = 0x54F077C7
				; X32-NEXT: movl %esi, %eax
				; X32-NEXT: mull %edx
				; X32-NEXT: movl %edx, %edi
				; X32-NEXT: addl %ebp, %eax
				; X32-NEXT: adcl %ebx, %edi
				; X32-NEXT: setb %al
				; X32-NEXT: movzbl %al, %ebp
				; X32-NEXT: movl %ecx, %eax
				; X32-NEXT: movl $1425045447, %edx # imm = 0x54F077C7
				; X32-NEXT: mull %edx
				; X32-NEXT: movl %edx, %ebx
				; X32-NEXT: addl %edi, %eax
				; X32-NEXT: adcl %ebp, %ebx
				; X32-NEXT: shrdl $12, %ebx, %eax
				; X32-NEXT: movl $12345, %edx # imm = 0x3039
				; X32-NEXT: mull %edx
				; X32-NEXT: shrl $12, %ebx
				; X32-NEXT: imull $12345, %ebx, %edi # imm = 0x3039
				; X32-NEXT: addl %edx, %edi
				; X32-NEXT: subl %eax, %esi
				; X32-NEXT: sbbl %edi, %ecx
				; X32-NEXT: movl $-1840700269, %ebp # imm = 0x92492493
				; X32-NEXT: movl %ecx, %eax
				; X32-NEXT: mull %ebp
				; X32-NEXT: movl %edx, %edi
				; X32-NEXT: movl %eax, %ebx
				; X32-NEXT: movl %esi, %eax
				; X32-NEXT: mull %ebp
				; X32-NEXT: movl %edx, %ebp
				; X32-NEXT: addl %ebx, %ebp
				; X32-NEXT: adcl $0, %edi
				; X32-NEXT: movl $613566756, %edx # imm = 0x24924924
				; X32-NEXT: movl %esi, %eax
				; X32-NEXT: mull %edx
				; X32-NEXT: movl %edx, %ebx
				; X32-NEXT: addl %ebp, %eax
				; X32-NEXT: adcl %edi, %ebx
				; X32-NEXT: setb %al
				; X32-NEXT: movzbl %al, %edi
				; X32-NEXT: movl %ecx, %eax
				; X32-NEXT: movl $613566756, %edx # imm = 0x24924924
				; X32-NEXT: mull %edx
				; X32-NEXT: addl %ebx, %eax
				; X32-NEXT: adcl %edi, %edx
				; X32-NEXT: subl %eax, %esi
				; X32-NEXT: sbbl %edx, %ecx
				; X32-NEXT: movl %ecx, %edi
				; X32-NEXT: shrl %edi
				; X32-NEXT: shldl $31, %esi, %ecx
				; X32-NEXT: addl %eax, %ecx
				; X32-NEXT: adcl %edx, %edi
				; X32-NEXT: shrdl $2, %edi, %ecx
				; X32-NEXT: shrl $2, %edi
				; X32-NEXT: movl %ecx, %eax
				; X32-NEXT: movl %edi, %edx
				; X32-NEXT: popl %esi
				; X32-NEXT: popl %edi
				; X32-NEXT: popl %ebx
				; X32-NEXT: popl %ebp
	; X32-NEXT: retl			; X32-NEXT: retl
	;			;
	; X64-FAST-LABEL: PR23590:			; X64-FAST-LABEL: PR23590:
	; X64-FAST: # %bb.0: # %entry			; X64-FAST: # %bb.0: # %entry
	; X64-FAST-NEXT: movabsq $6120523590596543007, %rcx # imm = 0x54F077C718E7C21F			; X64-FAST-NEXT: movabsq $6120523590596543007, %rcx # imm = 0x54F077C718E7C21F
	; X64-FAST-NEXT: movq %rdi, %rax			; X64-FAST-NEXT: movq %rdi, %rax
	; X64-FAST-NEXT: mulq %rcx			; X64-FAST-NEXT: mulq %rcx
	; X64-FAST-NEXT: shrq $12, %rdx			; X64-FAST-NEXT: shrq $12, %rdx
	Show All 32 Lines

	define { i64, i32 } @PR38622(i64) nounwind {			define { i64, i32 } @PR38622(i64) nounwind {
	; X32-LABEL: PR38622:			; X32-LABEL: PR38622:
	; X32: # %bb.0:			; X32: # %bb.0:
	; X32-NEXT: pushl %ebp			; X32-NEXT: pushl %ebp
	; X32-NEXT: pushl %ebx			; X32-NEXT: pushl %ebx
	; X32-NEXT: pushl %edi			; X32-NEXT: pushl %edi
	; X32-NEXT: pushl %esi			; X32-NEXT: pushl %esi
	; X32-NEXT: subl $12, %esp			; X32-NEXT: pushl %eax
	; X32-NEXT: movl {{[0-9]+}}(%esp), %ebx			; X32-NEXT: movl {{[0-9]+}}(%esp), %ecx
	; X32-NEXT: movl {{[0-9]+}}(%esp), %ebp			; X32-NEXT: movl {{[0-9]+}}(%esp), %esi
	; X32-NEXT: pushl $0			; X32-NEXT: movl %esi, %edi
	; X32-NEXT: pushl $-294967296 # imm = 0xEE6B2800			; X32-NEXT: shldl $21, %ecx, %edi
	; X32-NEXT: pushl %ebp			; X32-NEXT: movl $-400107883, %ebx # imm = 0xE826D695
	; X32-NEXT: pushl %ebx			; X32-NEXT: movl %edi, %eax
	; X32-NEXT: calll __udivdi3			; X32-NEXT: mull %ebx
	; X32-NEXT: addl $16, %esp			; X32-NEXT: movl %edx, (%esp) # 4-byte Spill
	; X32-NEXT: movl %eax, %esi			; X32-NEXT: shrl $11, %esi
				; X32-NEXT: movl %esi, %eax
				; X32-NEXT: mull %ebx
				; X32-NEXT: movl %edx, %ebp
				; X32-NEXT: movl %eax, %ebx
				; X32-NEXT: addl (%esp), %ebx # 4-byte Folded Reload
				; X32-NEXT: adcl $0, %ebp
				; X32-NEXT: movl $1125899, %edx # imm = 0x112E0B
				; X32-NEXT: movl %edi, %eax
				; X32-NEXT: mull %edx
	; X32-NEXT: movl %edx, %edi			; X32-NEXT: movl %edx, %edi
	; X32-NEXT: pushl $0			; X32-NEXT: addl %ebx, %eax
	; X32-NEXT: pushl $-294967296 # imm = 0xEE6B2800			; X32-NEXT: adcl %ebp, %edi
	; X32-NEXT: pushl %ebp			; X32-NEXT: setb %al
	; X32-NEXT: pushl %ebx			; X32-NEXT: movzbl %al, %ebx
	; X32-NEXT: calll __umoddi3
	; X32-NEXT: addl $16, %esp
	; X32-NEXT: movl %eax, %ecx
	; X32-NEXT: movl %esi, %eax			; X32-NEXT: movl %esi, %eax
	; X32-NEXT: movl %edi, %edx			; X32-NEXT: movl $1125899, %edx # imm = 0x112E0B
	; X32-NEXT: addl $12, %esp			; X32-NEXT: mull %edx
				; X32-NEXT: addl %edi, %eax
				; X32-NEXT: adcl %ebx, %edx
				; X32-NEXT: shrdl $9, %edx, %eax
				; X32-NEXT: imull $-294967296, %eax, %esi # imm = 0xEE6B2800
				; X32-NEXT: subl %esi, %ecx
				; X32-NEXT: shrl $9, %edx
				; X32-NEXT: addl $4, %esp
	; X32-NEXT: popl %esi			; X32-NEXT: popl %esi
	; X32-NEXT: popl %edi			; X32-NEXT: popl %edi
	; X32-NEXT: popl %ebx			; X32-NEXT: popl %ebx
	; X32-NEXT: popl %ebp			; X32-NEXT: popl %ebp
	; X32-NEXT: retl			; X32-NEXT: retl
	;			;
	; X64-LABEL: PR38622:			; X64-LABEL: PR38622:
	; X64: # %bb.0:			; X64: # %bb.0:
	Show All 17 Lines

	define { i64, i32 } @PR38622_signed(i64) nounwind {			define { i64, i32 } @PR38622_signed(i64) nounwind {
	; X32-LABEL: PR38622_signed:			; X32-LABEL: PR38622_signed:
	; X32: # %bb.0:			; X32: # %bb.0:
	; X32-NEXT: pushl %ebp			; X32-NEXT: pushl %ebp
	; X32-NEXT: pushl %ebx			; X32-NEXT: pushl %ebx
	; X32-NEXT: pushl %edi			; X32-NEXT: pushl %edi
	; X32-NEXT: pushl %esi			; X32-NEXT: pushl %esi
	; X32-NEXT: subl $12, %esp			; X32-NEXT: pushl %eax
	; X32-NEXT: movl {{[0-9]+}}(%esp), %ebx			; X32-NEXT: movl {{[0-9]+}}(%esp), %ecx
	; X32-NEXT: movl {{[0-9]+}}(%esp), %ebp			; X32-NEXT: movl {{[0-9]+}}(%esp), %ebp
	; X32-NEXT: pushl $0			; X32-NEXT: movl %ebp, %esi
	; X32-NEXT: pushl $-294967296 # imm = 0xEE6B2800			; X32-NEXT: sarl $31, %esi
	; X32-NEXT: pushl %ebp			; X32-NEXT: movl $651596979, %edi # imm = 0x26D694B3
	; X32-NEXT: pushl %ebx			; X32-NEXT: movl %ecx, %eax
	; X32-NEXT: calll __divdi3			; X32-NEXT: mull %edi
	; X32-NEXT: addl $16, %esp			; X32-NEXT: movl %edx, %ebx
	; X32-NEXT: movl %eax, %esi			; X32-NEXT: movl %ebp, %eax
				; X32-NEXT: mull %edi
				; X32-NEXT: movl %edx, %ebp
				; X32-NEXT: movl %eax, %edi
				; X32-NEXT: addl %ebx, %edi
				; X32-NEXT: adcl $0, %ebp
				; X32-NEXT: movl $288230376, %edx # imm = 0x112E0BE8
				; X32-NEXT: movl %ecx, %eax
				; X32-NEXT: mull %edx
				; X32-NEXT: movl %edx, %ebx
				; X32-NEXT: addl %edi, %eax
				; X32-NEXT: adcl %ebp, %ebx
				; X32-NEXT: setb %al
				; X32-NEXT: movzbl %al, %eax
				; X32-NEXT: movl %eax, (%esp) # 4-byte Spill
				; X32-NEXT: movl {{[0-9]+}}(%esp), %eax
				; X32-NEXT: movl $288230376, %edx # imm = 0x112E0BE8
				; X32-NEXT: mull %edx
	; X32-NEXT: movl %edx, %edi			; X32-NEXT: movl %edx, %edi
	; X32-NEXT: pushl $0			; X32-NEXT: movl %eax, %ebp
	; X32-NEXT: pushl $-294967296 # imm = 0xEE6B2800			; X32-NEXT: addl %ebx, %ebp
	; X32-NEXT: pushl %ebp			; X32-NEXT: adcl (%esp), %edi # 4-byte Folded Reload
	; X32-NEXT: pushl %ebx
	; X32-NEXT: calll __moddi3
	; X32-NEXT: addl $16, %esp
	; X32-NEXT: movl %eax, %ecx
	; X32-NEXT: movl %esi, %eax			; X32-NEXT: movl %esi, %eax
	; X32-NEXT: movl %edi, %edx			; X32-NEXT: movl $651596979, %edx # imm = 0x26D694B3
	; X32-NEXT: addl $12, %esp			; X32-NEXT: mull %edx
				; X32-NEXT: imull $288230376, %esi, %ebx # imm = 0x112E0BE8
				; X32-NEXT: addl %edx, %ebx
				; X32-NEXT: imull $651596979, %esi, %esi # imm = 0x26D694B3
				; X32-NEXT: addl %ebx, %esi
				; X32-NEXT: addl %ebp, %eax
				; X32-NEXT: adcl %edi, %esi
				; X32-NEXT: movl %esi, %edx
				; X32-NEXT: sarl $28, %edx
				; X32-NEXT: shrdl $28, %esi, %eax
				; X32-NEXT: shrl $31, %esi
				; X32-NEXT: addl %eax, %esi
				; X32-NEXT: adcl $0, %edx
				; X32-NEXT: imull $-294967296, %esi, %eax # imm = 0xEE6B2800
				; X32-NEXT: subl %eax, %ecx
				; X32-NEXT: movl %esi, %eax
				; X32-NEXT: addl $4, %esp
	; X32-NEXT: popl %esi			; X32-NEXT: popl %esi
	; X32-NEXT: popl %edi			; X32-NEXT: popl %edi
	; X32-NEXT: popl %ebx			; X32-NEXT: popl %ebx
	; X32-NEXT: popl %ebp			; X32-NEXT: popl %ebp
	; X32-NEXT: retl			; X32-NEXT: retl
	;			;
	; X64-LABEL: PR38622_signed:			; X64-LABEL: PR38622_signed:
	; X64: # %bb.0:			; X64: # %bb.0:
	Show All 19 Lines

llvm/test/CodeGen/X86/divmod128.ll

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: llc < %s -mtriple=x86_64-linux \| FileCheck %s -check-prefix=X86-64			; RUN: llc < %s -mtriple=x86_64-linux \| FileCheck %s -check-prefix=X86-64
	; RUN: llc < %s -mtriple=x86_64-cygwin \| FileCheck %s -check-prefix=WIN64			; RUN: llc < %s -mtriple=x86_64-cygwin \| FileCheck %s -check-prefix=WIN64
	; RUN: llc < %s -mtriple=x86_64-win32 \| FileCheck %s -check-prefix=WIN64			; RUN: llc < %s -mtriple=x86_64-win32 \| FileCheck %s -check-prefix=WIN64
	; RUN: llc < %s -mtriple=x86_64-mingw32 \| FileCheck %s -check-prefix=WIN64			; RUN: llc < %s -mtriple=x86_64-mingw32 \| FileCheck %s -check-prefix=WIN64

	define i64 @mod128(i128 %x) nounwind {			define i64 @mod128(i128 %x) nounwind {
	; X86-64-LABEL: mod128:			; X86-64-LABEL: mod128:
	; X86-64: # %bb.0:			; X86-64: # %bb.0:
	; X86-64-NEXT: pushq %rax			; X86-64-NEXT: pushq %rbx
	; X86-64-NEXT: movl $3, %edx			; X86-64-NEXT: movq %rdi, %r9
	; X86-64-NEXT: xorl %ecx, %ecx			; X86-64-NEXT: movabsq $6148914691236517206, %r10 # imm = 0x5555555555555556
	; X86-64-NEXT: callq __modti3			; X86-64-NEXT: movq %rdi, %rax
	; X86-64-NEXT: popq %rcx			; X86-64-NEXT: mulq %r10
				; X86-64-NEXT: movq %rdx, %r8
				; X86-64-NEXT: movq %rsi, %rax
				; X86-64-NEXT: mulq %r10
				; X86-64-NEXT: movq %rdx, %r11
				; X86-64-NEXT: movq %rax, %rdi
				; X86-64-NEXT: addq %r8, %rdi
				; X86-64-NEXT: adcq $0, %r11
				; X86-64-NEXT: movabsq $6148914691236517205, %rcx # imm = 0x5555555555555555
				; X86-64-NEXT: movq %r9, %rax
				; X86-64-NEXT: mulq %rcx
				; X86-64-NEXT: movq %rdx, %r8
				; X86-64-NEXT: addq %rdi, %rax
				; X86-64-NEXT: adcq %r11, %r8
				; X86-64-NEXT: setb %al
				; X86-64-NEXT: movzbl %al, %ebx
				; X86-64-NEXT: movq %rsi, %rax
				; X86-64-NEXT: mulq %rcx
				; X86-64-NEXT: movq %rdx, %r11
				; X86-64-NEXT: movq %rax, %rdi
				; X86-64-NEXT: addq %r8, %rdi
				; X86-64-NEXT: adcq %rbx, %r11
				; X86-64-NEXT: sarq $63, %rsi
				; X86-64-NEXT: imulq %rsi, %rcx
				; X86-64-NEXT: movq %rsi, %rax
				; X86-64-NEXT: mulq %r10
				; X86-64-NEXT: addq %rcx, %rdx
				; X86-64-NEXT: imulq %r10, %rsi
				; X86-64-NEXT: addq %rdx, %rsi
				; X86-64-NEXT: addq %rdi, %rax
				; X86-64-NEXT: adcq %r11, %rsi
				; X86-64-NEXT: shrq $63, %rsi
				; X86-64-NEXT: addq %rax, %rsi
				; X86-64-NEXT: leaq (%rsi,%rsi,2), %rax
				; X86-64-NEXT: subq %rax, %r9
				; X86-64-NEXT: movq %r9, %rax
				; X86-64-NEXT: popq %rbx
	; X86-64-NEXT: retq			; X86-64-NEXT: retq
	;			;
	; WIN64-LABEL: mod128:			; WIN64-LABEL: mod128:
	; WIN64: # %bb.0:			; WIN64: # %bb.0:
	; WIN64-NEXT: subq $72, %rsp			; WIN64-NEXT: pushq %rsi
	; WIN64-NEXT: movq %rdx, {{[0-9]+}}(%rsp)			; WIN64-NEXT: pushq %rdi
	; WIN64-NEXT: movq %rcx, {{[0-9]+}}(%rsp)			; WIN64-NEXT: pushq %rbx
	; WIN64-NEXT: movq $3, {{[0-9]+}}(%rsp)			; WIN64-NEXT: movq %rdx, %r8
	; WIN64-NEXT: movq $0, {{[0-9]+}}(%rsp)			; WIN64-NEXT: movq %rcx, %r10
	; WIN64-NEXT: leaq {{[0-9]+}}(%rsp), %rcx			; WIN64-NEXT: movabsq $6148914691236517206, %rsi # imm = 0x5555555555555556
	; WIN64-NEXT: leaq {{[0-9]+}}(%rsp), %rdx			; WIN64-NEXT: movq %rcx, %rax
	; WIN64-NEXT: callq __modti3			; WIN64-NEXT: mulq %rsi
	; WIN64-NEXT: movq %xmm0, %rax			; WIN64-NEXT: movq %rdx, %r9
	; WIN64-NEXT: addq $72, %rsp			; WIN64-NEXT: movq %r8, %rax
				; WIN64-NEXT: mulq %rsi
				; WIN64-NEXT: movq %rdx, %r11
				; WIN64-NEXT: movq %rax, %rcx
				; WIN64-NEXT: addq %r9, %rcx
				; WIN64-NEXT: adcq $0, %r11
				; WIN64-NEXT: movabsq $6148914691236517205, %rdi # imm = 0x5555555555555555
				; WIN64-NEXT: movq %r10, %rax
				; WIN64-NEXT: mulq %rdi
				; WIN64-NEXT: movq %rdx, %r9
				; WIN64-NEXT: addq %rcx, %rax
				; WIN64-NEXT: adcq %r11, %r9
				; WIN64-NEXT: setb %al
				; WIN64-NEXT: movzbl %al, %ebx
				; WIN64-NEXT: movq %r8, %rax
				; WIN64-NEXT: mulq %rdi
				; WIN64-NEXT: movq %rdx, %r11
				; WIN64-NEXT: movq %rax, %rcx
				; WIN64-NEXT: addq %r9, %rcx
				; WIN64-NEXT: adcq %rbx, %r11
				; WIN64-NEXT: sarq $63, %r8
				; WIN64-NEXT: imulq %r8, %rdi
				; WIN64-NEXT: movq %r8, %rax
				; WIN64-NEXT: mulq %rsi
				; WIN64-NEXT: addq %rdi, %rdx
				; WIN64-NEXT: imulq %rsi, %r8
				; WIN64-NEXT: addq %rdx, %r8
				; WIN64-NEXT: addq %rcx, %rax
				; WIN64-NEXT: adcq %r11, %r8
				; WIN64-NEXT: shrq $63, %r8
				; WIN64-NEXT: addq %rax, %r8
				; WIN64-NEXT: leaq (%r8,%r8,2), %rax
				; WIN64-NEXT: subq %rax, %r10
				; WIN64-NEXT: movq %r10, %rax
				; WIN64-NEXT: popq %rbx
				; WIN64-NEXT: popq %rdi
				; WIN64-NEXT: popq %rsi
	; WIN64-NEXT: retq			; WIN64-NEXT: retq


	%1 = srem i128 %x, 3			%1 = srem i128 %x, 3
	%2 = trunc i128 %1 to i64			%2 = trunc i128 %1 to i64
	ret i64 %2			ret i64 %2
	}			}

	define i64 @div128(i128 %x) nounwind {			define i64 @div128(i128 %x) nounwind {
	; X86-64-LABEL: div128:			; X86-64-LABEL: div128:
	; X86-64: # %bb.0:			; X86-64: # %bb.0:
	; X86-64-NEXT: pushq %rax			; X86-64-NEXT: movq %rdi, %r9
	; X86-64-NEXT: movl $3, %edx			; X86-64-NEXT: movabsq $6148914691236517206, %r10 # imm = 0x5555555555555556
	; X86-64-NEXT: xorl %ecx, %ecx			; X86-64-NEXT: movq %rdi, %rax
	; X86-64-NEXT: callq __divti3			; X86-64-NEXT: mulq %r10
	; X86-64-NEXT: popq %rcx			; X86-64-NEXT: movq %rdx, %r8
				; X86-64-NEXT: movq %rsi, %rax
				; X86-64-NEXT: mulq %r10
				; X86-64-NEXT: movq %rdx, %r11
				; X86-64-NEXT: movq %rax, %rdi
				; X86-64-NEXT: addq %r8, %rdi
				; X86-64-NEXT: adcq $0, %r11
				; X86-64-NEXT: movabsq $6148914691236517205, %rcx # imm = 0x5555555555555555
				; X86-64-NEXT: movq %r9, %rax
				; X86-64-NEXT: mulq %rcx
				; X86-64-NEXT: movq %rdx, %r8
				; X86-64-NEXT: addq %rdi, %rax
				; X86-64-NEXT: adcq %r11, %r8
				; X86-64-NEXT: setb %al
				; X86-64-NEXT: movzbl %al, %r11d
				; X86-64-NEXT: movq %rsi, %rax
				; X86-64-NEXT: mulq %rcx
				; X86-64-NEXT: movq %rdx, %r9
				; X86-64-NEXT: movq %rax, %rdi
				; X86-64-NEXT: addq %r8, %rdi
				; X86-64-NEXT: adcq %r11, %r9
				; X86-64-NEXT: sarq $63, %rsi
				; X86-64-NEXT: imulq %rsi, %rcx
				; X86-64-NEXT: movq %rsi, %rax
				; X86-64-NEXT: mulq %r10
				; X86-64-NEXT: addq %rcx, %rdx
				; X86-64-NEXT: imulq %r10, %rsi
				; X86-64-NEXT: addq %rdx, %rsi
				; X86-64-NEXT: addq %rdi, %rax
				; X86-64-NEXT: adcq %r9, %rsi
				; X86-64-NEXT: shrq $63, %rsi
				; X86-64-NEXT: addq %rsi, %rax
	; X86-64-NEXT: retq			; X86-64-NEXT: retq
	;			;
	; WIN64-LABEL: div128:			; WIN64-LABEL: div128:
	; WIN64: # %bb.0:			; WIN64: # %bb.0:
	; WIN64-NEXT: subq $72, %rsp			; WIN64-NEXT: pushq %rsi
	; WIN64-NEXT: movq %rdx, {{[0-9]+}}(%rsp)			; WIN64-NEXT: pushq %rdi
	; WIN64-NEXT: movq %rcx, {{[0-9]+}}(%rsp)			; WIN64-NEXT: pushq %rbx
	; WIN64-NEXT: movq $3, {{[0-9]+}}(%rsp)			; WIN64-NEXT: movq %rdx, %r8
	; WIN64-NEXT: movq $0, {{[0-9]+}}(%rsp)			; WIN64-NEXT: movq %rcx, %r10
	; WIN64-NEXT: leaq {{[0-9]+}}(%rsp), %rcx			; WIN64-NEXT: movabsq $6148914691236517206, %rbx # imm = 0x5555555555555556
	; WIN64-NEXT: leaq {{[0-9]+}}(%rsp), %rdx			; WIN64-NEXT: movq %rcx, %rax
	; WIN64-NEXT: callq __divti3			; WIN64-NEXT: mulq %rbx
	; WIN64-NEXT: movq %xmm0, %rax			; WIN64-NEXT: movq %rdx, %r9
	; WIN64-NEXT: addq $72, %rsp			; WIN64-NEXT: movq %r8, %rax
				; WIN64-NEXT: mulq %rbx
				; WIN64-NEXT: movq %rdx, %r11
				; WIN64-NEXT: movq %rax, %rcx
				; WIN64-NEXT: addq %r9, %rcx
				; WIN64-NEXT: adcq $0, %r11
				; WIN64-NEXT: movabsq $6148914691236517205, %rdi # imm = 0x5555555555555555
				; WIN64-NEXT: movq %r10, %rax
				; WIN64-NEXT: mulq %rdi
				; WIN64-NEXT: movq %rdx, %r9
				; WIN64-NEXT: addq %rcx, %rax
				; WIN64-NEXT: adcq %r11, %r9
				; WIN64-NEXT: setb %al
				; WIN64-NEXT: movzbl %al, %esi
				; WIN64-NEXT: movq %r8, %rax
				; WIN64-NEXT: mulq %rdi
				; WIN64-NEXT: movq %rdx, %r10
				; WIN64-NEXT: movq %rax, %rcx
				; WIN64-NEXT: addq %r9, %rcx
				; WIN64-NEXT: adcq %rsi, %r10
				; WIN64-NEXT: sarq $63, %r8
				; WIN64-NEXT: imulq %r8, %rdi
				; WIN64-NEXT: movq %r8, %rax
				; WIN64-NEXT: mulq %rbx
				; WIN64-NEXT: addq %rdi, %rdx
				; WIN64-NEXT: imulq %rbx, %r8
				; WIN64-NEXT: addq %rdx, %r8
				; WIN64-NEXT: addq %rcx, %rax
				; WIN64-NEXT: adcq %r10, %r8
				; WIN64-NEXT: shrq $63, %r8
				; WIN64-NEXT: addq %r8, %rax
				; WIN64-NEXT: popq %rbx
				; WIN64-NEXT: popq %rdi
				; WIN64-NEXT: popq %rsi
	; WIN64-NEXT: retq			; WIN64-NEXT: retq


	%1 = sdiv i128 %x, 3			%1 = sdiv i128 %x, 3
	%2 = trunc i128 %1 to i64			%2 = trunc i128 %1 to i64
	ret i64 %2			ret i64 %2
	}			}

	define i64 @umod128(i128 %x) nounwind {			define i64 @umod128(i128 %x) nounwind {
	; X86-64-LABEL: umod128:			; X86-64-LABEL: umod128:
	; X86-64: # %bb.0:			; X86-64: # %bb.0:
	; X86-64-NEXT: pushq %rax			; X86-64-NEXT: movq %rsi, %r8
	; X86-64-NEXT: movl $3, %edx			; X86-64-NEXT: movq %rdi, %r10
	; X86-64-NEXT: xorl %ecx, %ecx			; X86-64-NEXT: movabsq $-6148914691236517205, %rcx # imm = 0xAAAAAAAAAAAAAAAB
	; X86-64-NEXT: callq __umodti3			; X86-64-NEXT: movq %rdi, %rax
	; X86-64-NEXT: popq %rcx			; X86-64-NEXT: mulq %rcx
				; X86-64-NEXT: movq %rdx, %r9
				; X86-64-NEXT: movq %rsi, %rax
				; X86-64-NEXT: mulq %rcx
				; X86-64-NEXT: movq %rdx, %rsi
				; X86-64-NEXT: movq %rax, %rcx
				; X86-64-NEXT: addq %r9, %rcx
				; X86-64-NEXT: adcq $0, %rsi
				; X86-64-NEXT: movabsq $-6148914691236517206, %r9 # imm = 0xAAAAAAAAAAAAAAAA
				; X86-64-NEXT: movq %rdi, %rax
				; X86-64-NEXT: mulq %r9
				; X86-64-NEXT: movq %rdx, %rdi
				; X86-64-NEXT: addq %rcx, %rax
				; X86-64-NEXT: adcq %rsi, %rdi
				; X86-64-NEXT: setb %al
				; X86-64-NEXT: movzbl %al, %ecx
				; X86-64-NEXT: movq %r8, %rax
				; X86-64-NEXT: mulq %r9
				; X86-64-NEXT: addq %rdi, %rax
				; X86-64-NEXT: adcq %rcx, %rdx
				; X86-64-NEXT: shldq $63, %rax, %rdx
				; X86-64-NEXT: leaq (%rdx,%rdx,2), %rax
				; X86-64-NEXT: subq %rax, %r10
				; X86-64-NEXT: movq %r10, %rax
	; X86-64-NEXT: retq			; X86-64-NEXT: retq
	;			;
	; WIN64-LABEL: umod128:			; WIN64-LABEL: umod128:
	; WIN64: # %bb.0:			; WIN64: # %bb.0:
	; WIN64-NEXT: subq $72, %rsp			; WIN64-NEXT: pushq %rsi
	; WIN64-NEXT: movq %rdx, {{[0-9]+}}(%rsp)			; WIN64-NEXT: movq %rdx, %r8
	; WIN64-NEXT: movq %rcx, {{[0-9]+}}(%rsp)			; WIN64-NEXT: movq %rcx, %r10
	; WIN64-NEXT: movq $3, {{[0-9]+}}(%rsp)			; WIN64-NEXT: movabsq $-6148914691236517205, %rcx # imm = 0xAAAAAAAAAAAAAAAB
	; WIN64-NEXT: movq $0, {{[0-9]+}}(%rsp)			; WIN64-NEXT: movq %r10, %rax
	; WIN64-NEXT: leaq {{[0-9]+}}(%rsp), %rcx			; WIN64-NEXT: mulq %rcx
	; WIN64-NEXT: leaq {{[0-9]+}}(%rsp), %rdx			; WIN64-NEXT: movq %rdx, %r9
	; WIN64-NEXT: callq __umodti3			; WIN64-NEXT: movq %r8, %rax
	; WIN64-NEXT: movq %xmm0, %rax			; WIN64-NEXT: mulq %rcx
	; WIN64-NEXT: addq $72, %rsp			; WIN64-NEXT: movq %rdx, %r11
				; WIN64-NEXT: movq %rax, %rcx
				; WIN64-NEXT: addq %r9, %rcx
				; WIN64-NEXT: adcq $0, %r11
				; WIN64-NEXT: movabsq $-6148914691236517206, %rsi # imm = 0xAAAAAAAAAAAAAAAA
				; WIN64-NEXT: movq %r10, %rax
				; WIN64-NEXT: mulq %rsi
				; WIN64-NEXT: movq %rdx, %r9
				; WIN64-NEXT: addq %rcx, %rax
				; WIN64-NEXT: adcq %r11, %r9
				; WIN64-NEXT: setb %al
				; WIN64-NEXT: movzbl %al, %ecx
				; WIN64-NEXT: movq %r8, %rax
				; WIN64-NEXT: mulq %rsi
				; WIN64-NEXT: addq %r9, %rax
				; WIN64-NEXT: adcq %rcx, %rdx
				; WIN64-NEXT: shldq $63, %rax, %rdx
				; WIN64-NEXT: leaq (%rdx,%rdx,2), %rax
				; WIN64-NEXT: subq %rax, %r10
				; WIN64-NEXT: movq %r10, %rax
				; WIN64-NEXT: popq %rsi
	; WIN64-NEXT: retq			; WIN64-NEXT: retq


	%1 = urem i128 %x, 3			%1 = urem i128 %x, 3
	%2 = trunc i128 %1 to i64			%2 = trunc i128 %1 to i64
	ret i64 %2			ret i64 %2
	}			}

	define i64 @udiv128(i128 %x) nounwind {			define i64 @udiv128(i128 %x) nounwind {
	; X86-64-LABEL: udiv128:			; X86-64-LABEL: udiv128:
	; X86-64: # %bb.0:			; X86-64: # %bb.0:
	; X86-64-NEXT: pushq %rax			; X86-64-NEXT: movq %rsi, %r8
	; X86-64-NEXT: movl $3, %edx			; X86-64-NEXT: movabsq $-6148914691236517205, %rcx # imm = 0xAAAAAAAAAAAAAAAB
	; X86-64-NEXT: xorl %ecx, %ecx			; X86-64-NEXT: movq %rdi, %rax
	; X86-64-NEXT: callq __udivti3			; X86-64-NEXT: mulq %rcx
	; X86-64-NEXT: popq %rcx			; X86-64-NEXT: movq %rdx, %r9
				; X86-64-NEXT: movq %rsi, %rax
				; X86-64-NEXT: mulq %rcx
				; X86-64-NEXT: movq %rdx, %rsi
				; X86-64-NEXT: movq %rax, %rcx
				; X86-64-NEXT: addq %r9, %rcx
				; X86-64-NEXT: adcq $0, %rsi
				; X86-64-NEXT: movabsq $-6148914691236517206, %r9 # imm = 0xAAAAAAAAAAAAAAAA
				; X86-64-NEXT: movq %rdi, %rax
				; X86-64-NEXT: mulq %r9
				; X86-64-NEXT: movq %rdx, %rdi
				; X86-64-NEXT: addq %rcx, %rax
				; X86-64-NEXT: adcq %rsi, %rdi
				; X86-64-NEXT: setb %al
				; X86-64-NEXT: movzbl %al, %ecx
				; X86-64-NEXT: movq %r8, %rax
				; X86-64-NEXT: mulq %r9
				; X86-64-NEXT: addq %rdi, %rax
				; X86-64-NEXT: adcq %rdx, %rcx
				; X86-64-NEXT: shrdq $1, %rcx, %rax
	; X86-64-NEXT: retq			; X86-64-NEXT: retq
	;			;
	; WIN64-LABEL: udiv128:			; WIN64-LABEL: udiv128:
	; WIN64: # %bb.0:			; WIN64: # %bb.0:
	; WIN64-NEXT: subq $72, %rsp			; WIN64-NEXT: pushq %rsi
	; WIN64-NEXT: movq %rdx, {{[0-9]+}}(%rsp)			; WIN64-NEXT: movq %rdx, %r8
	; WIN64-NEXT: movq %rcx, {{[0-9]+}}(%rsp)			; WIN64-NEXT: movq %rcx, %r10
	; WIN64-NEXT: movq $3, {{[0-9]+}}(%rsp)			; WIN64-NEXT: movabsq $-6148914691236517205, %rcx # imm = 0xAAAAAAAAAAAAAAAB
	; WIN64-NEXT: movq $0, {{[0-9]+}}(%rsp)			; WIN64-NEXT: movq %r10, %rax
	; WIN64-NEXT: leaq {{[0-9]+}}(%rsp), %rcx			; WIN64-NEXT: mulq %rcx
	; WIN64-NEXT: leaq {{[0-9]+}}(%rsp), %rdx			; WIN64-NEXT: movq %rdx, %r9
	; WIN64-NEXT: callq __udivti3			; WIN64-NEXT: movq %r8, %rax
	; WIN64-NEXT: movq %xmm0, %rax			; WIN64-NEXT: mulq %rcx
	; WIN64-NEXT: addq $72, %rsp			; WIN64-NEXT: movq %rdx, %r11
				; WIN64-NEXT: movq %rax, %rcx
				; WIN64-NEXT: addq %r9, %rcx
				; WIN64-NEXT: adcq $0, %r11
				; WIN64-NEXT: movabsq $-6148914691236517206, %rsi # imm = 0xAAAAAAAAAAAAAAAA
				; WIN64-NEXT: movq %r10, %rax
				; WIN64-NEXT: mulq %rsi
				; WIN64-NEXT: movq %rdx, %r9
				; WIN64-NEXT: addq %rcx, %rax
				; WIN64-NEXT: adcq %r11, %r9
				; WIN64-NEXT: setb %al
				; WIN64-NEXT: movzbl %al, %ecx
				; WIN64-NEXT: movq %r8, %rax
				; WIN64-NEXT: mulq %rsi
				; WIN64-NEXT: addq %r9, %rax
				; WIN64-NEXT: adcq %rdx, %rcx
				; WIN64-NEXT: shrdq $1, %rcx, %rax
				; WIN64-NEXT: popq %rsi
	; WIN64-NEXT: retq			; WIN64-NEXT: retq


	%1 = udiv i128 %x, 3			%1 = udiv i128 %x, 3
	%2 = trunc i128 %1 to i64			%2 = trunc i128 %1 to i64
	ret i64 %2			ret i64 %2
	}			}

llvm/test/CodeGen/X86/i128-sdiv.ll

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: llc < %s -mtriple=i686-- \| FileCheck %s --check-prefixes=CHECK,X86			; RUN: llc < %s -mtriple=x86_64-- \| FileCheck %s
	; RUN: llc < %s -mtriple=x86_64-- \| FileCheck %s --check-prefixes=CHECK,X64
	RKSimonUnsubmitted Done Reply Inline Actions Can you add this coverage back? RKSimon: Can you add this coverage back?
	nagisaAuthorUnsubmitted Done Reply Inline Actions Huh, not sure how it got removed. nagisa: Huh, not sure how it got removed.

	; Make sure none of these crash, and that the power-of-two transformations			; Make sure none of these crash, and that the power-of-two transformations
	; trigger correctly.			; trigger correctly.

	define i128 @test1(i128 %x) nounwind {			define i128 @test1(i128 %x) {
	; X86-LABEL: test1:			; CHECK-LABEL: test1:
	; X86: # %bb.0:			; CHECK: # %bb.0:
	; X86-NEXT: pushl %edi			; CHECK-NEXT: movq %rsi, %rax
	; X86-NEXT: pushl %esi			; CHECK-NEXT: sarq $63, %rax
	; X86-NEXT: movl {{[0-9]+}}(%esp), %eax			; CHECK-NEXT: movq %rax, %rdx
	; X86-NEXT: movl {{[0-9]+}}(%esp), %ecx			; CHECK-NEXT: shrq $62, %rdx
	; X86-NEXT: movl %ecx, %edx			; CHECK-NEXT: addq %rdi, %rax
	; X86-NEXT: sarl $31, %edx			; CHECK-NEXT: adcq %rsi, %rdx
	; X86-NEXT: movl %edx, %esi			; CHECK-NEXT: movq %rdx, %rax
	; X86-NEXT: shrl $30, %esi			; CHECK-NEXT: sarq $2, %rax
	; X86-NEXT: movl {{[0-9]+}}(%esp), %edi			; CHECK-NEXT: sarq $63, %rdx
	; X86-NEXT: addl %edx, %edi			; CHECK-NEXT: retq
	; X86-NEXT: adcl {{[0-9]+}}(%esp), %edx
	; X86-NEXT: adcl {{[0-9]+}}(%esp), %esi
	; X86-NEXT: adcl $0, %ecx
	; X86-NEXT: shrdl $2, %ecx, %esi
	; X86-NEXT: movl %ecx, %edx
	; X86-NEXT: sarl $2, %edx
	; X86-NEXT: sarl $31, %ecx
	; X86-NEXT: movl %ecx, 12(%eax)
	; X86-NEXT: movl %ecx, 8(%eax)
	; X86-NEXT: movl %edx, 4(%eax)
	; X86-NEXT: movl %esi, (%eax)
	; X86-NEXT: popl %esi
	; X86-NEXT: popl %edi
	; X86-NEXT: retl $4
	;
	; X64-LABEL: test1:
	; X64: # %bb.0:
	; X64-NEXT: movq %rsi, %rax
	; X64-NEXT: sarq $63, %rax
	; X64-NEXT: movq %rax, %rdx
	; X64-NEXT: shrq $62, %rdx
	; X64-NEXT: addq %rdi, %rax
	; X64-NEXT: adcq %rsi, %rdx
	; X64-NEXT: movq %rdx, %rax
	; X64-NEXT: sarq $2, %rax
	; X64-NEXT: sarq $63, %rdx
	; X64-NEXT: retq
	%tmp = sdiv i128 %x, 73786976294838206464			%tmp = sdiv i128 %x, 73786976294838206464
	ret i128 %tmp			ret i128 %tmp
	}			}

	define i128 @test2(i128 %x) nounwind {			define i128 @test2(i128 %x) {
	; X86-LABEL: test2:			; CHECK-LABEL: test2:
	; X86: # %bb.0:			; CHECK: # %bb.0:
	; X86-NEXT: pushl %ebx			; CHECK-NEXT: movq %rsi, %rcx
	; X86-NEXT: pushl %edi			; CHECK-NEXT: sarq $63, %rcx
	; X86-NEXT: pushl %esi			; CHECK-NEXT: movq %rcx, %rax
	; X86-NEXT: movl {{[0-9]+}}(%esp), %eax			; CHECK-NEXT: shrq $62, %rax
	; X86-NEXT: movl {{[0-9]+}}(%esp), %ecx			; CHECK-NEXT: addq %rdi, %rcx
	; X86-NEXT: movl %ecx, %edx			; CHECK-NEXT: adcq %rsi, %rax
	; X86-NEXT: sarl $31, %edx			; CHECK-NEXT: movq %rax, %rcx
	; X86-NEXT: movl %edx, %esi			; CHECK-NEXT: sarq $63, %rcx
	; X86-NEXT: shrl $30, %esi			; CHECK-NEXT: sarq $2, %rax
	; X86-NEXT: movl {{[0-9]+}}(%esp), %edi			; CHECK-NEXT: xorl %edx, %edx
	; X86-NEXT: addl %edx, %edi			; CHECK-NEXT: negq %rax
	; X86-NEXT: adcl {{[0-9]+}}(%esp), %edx			; CHECK-NEXT: sbbq %rcx, %rdx
	; X86-NEXT: adcl {{[0-9]+}}(%esp), %esi			; CHECK-NEXT: retq
	; X86-NEXT: adcl $0, %ecx
	; X86-NEXT: shrdl $2, %ecx, %esi
	; X86-NEXT: movl %ecx, %edx
	; X86-NEXT: sarl $31, %edx
	; X86-NEXT: sarl $2, %ecx
	; X86-NEXT: xorl %edi, %edi
	; X86-NEXT: negl %esi
	; X86-NEXT: movl $0, %ebx
	; X86-NEXT: sbbl %ecx, %ebx
	; X86-NEXT: movl $0, %ecx
	; X86-NEXT: sbbl %edx, %ecx
	; X86-NEXT: sbbl %edx, %edi
	; X86-NEXT: movl %esi, (%eax)
	; X86-NEXT: movl %ebx, 4(%eax)
	; X86-NEXT: movl %ecx, 8(%eax)
	; X86-NEXT: movl %edi, 12(%eax)
	; X86-NEXT: popl %esi
	; X86-NEXT: popl %edi
	; X86-NEXT: popl %ebx
	; X86-NEXT: retl $4
	;
	; X64-LABEL: test2:
	; X64: # %bb.0:
	; X64-NEXT: movq %rsi, %rcx
	; X64-NEXT: sarq $63, %rcx
	; X64-NEXT: movq %rcx, %rax
	; X64-NEXT: shrq $62, %rax
	; X64-NEXT: addq %rdi, %rcx
	; X64-NEXT: adcq %rsi, %rax
	; X64-NEXT: movq %rax, %rcx
	; X64-NEXT: sarq $63, %rcx
	; X64-NEXT: sarq $2, %rax
	; X64-NEXT: xorl %edx, %edx
	; X64-NEXT: negq %rax
	; X64-NEXT: sbbq %rcx, %rdx
	; X64-NEXT: retq
	%tmp = sdiv i128 %x, -73786976294838206464			%tmp = sdiv i128 %x, -73786976294838206464
	ret i128 %tmp			ret i128 %tmp
	}			}

	define i128 @test3(i128 %x) nounwind {			define i128 @test3(i128 %x) {
	; X86-LABEL: test3:			; CHECK-LABEL: test3:
	; X86: # %bb.0:			; CHECK: # %bb.0:
	; X86-NEXT: pushl %ebp			; CHECK-NEXT: pushq %r14
	; X86-NEXT: movl %esp, %ebp			; CHECK-NEXT: .cfi_def_cfa_offset 16
	; X86-NEXT: pushl %edi			; CHECK-NEXT: pushq %rbx
	; X86-NEXT: pushl %esi			; CHECK-NEXT: .cfi_def_cfa_offset 24
	; X86-NEXT: andl $-8, %esp			; CHECK-NEXT: .cfi_offset %rbx, -24
	; X86-NEXT: subl $16, %esp			; CHECK-NEXT: .cfi_offset %r14, -16
	; X86-NEXT: movl 8(%ebp), %esi			; CHECK-NEXT: movq %rsi, %r10
	; X86-NEXT: movl %esp, %eax			; CHECK-NEXT: movq %rdi, %r9
	; X86-NEXT: pushl $-1			; CHECK-NEXT: movabsq $6917529027641081855, %r14 # imm = 0x5FFFFFFFFFFFFFFF
	; X86-NEXT: pushl $-5			; CHECK-NEXT: movq %rdi, %rax
	; X86-NEXT: pushl $-1			; CHECK-NEXT: mulq %r14
	; X86-NEXT: pushl $-3			; CHECK-NEXT: movq %rdx, %r8
	; X86-NEXT: pushl 24(%ebp)			; CHECK-NEXT: movq %rsi, %rax
	; X86-NEXT: pushl 20(%ebp)			; CHECK-NEXT: mulq %r14
	; X86-NEXT: pushl 16(%ebp)			; CHECK-NEXT: movq %rdx, %rcx
	; X86-NEXT: pushl 12(%ebp)			; CHECK-NEXT: movq %rax, %rdi
	; X86-NEXT: pushl %eax			; CHECK-NEXT: addq %r8, %rdi
	; X86-NEXT: calll __divti3			; CHECK-NEXT: adcq $0, %rcx
	; X86-NEXT: addl $32, %esp			; CHECK-NEXT: movabsq $-9223372036854775808, %rbx # imm = 0x8000000000000000
	; X86-NEXT: movl (%esp), %eax			; CHECK-NEXT: movq %r9, %rax
	; X86-NEXT: movl {{[0-9]+}}(%esp), %ecx			; CHECK-NEXT: mulq %rbx
	; X86-NEXT: movl {{[0-9]+}}(%esp), %edx			; CHECK-NEXT: movq %rdx, %rsi
	; X86-NEXT: movl {{[0-9]+}}(%esp), %edi			; CHECK-NEXT: addq %rdi, %rax
	; X86-NEXT: movl %edi, 12(%esi)			; CHECK-NEXT: adcq %rcx, %rsi
	; X86-NEXT: movl %edx, 8(%esi)			; CHECK-NEXT: setb %al
	; X86-NEXT: movl %ecx, 4(%esi)			; CHECK-NEXT: movzbl %al, %ecx
	; X86-NEXT: movl %eax, (%esi)			; CHECK-NEXT: movq %r10, %rax
	; X86-NEXT: movl %esi, %eax			; CHECK-NEXT: mulq %rbx
	; X86-NEXT: leal -8(%ebp), %esp			; CHECK-NEXT: movq %rdx, %r11
	; X86-NEXT: popl %esi			; CHECK-NEXT: movq %rax, %rdi
	; X86-NEXT: popl %edi			; CHECK-NEXT: addq %rsi, %rdi
	; X86-NEXT: popl %ebp			; CHECK-NEXT: adcq %rcx, %r11
	; X86-NEXT: retl $4			; CHECK-NEXT: andq %r10, %rbx
	;			; CHECK-NEXT: movq %r10, %rsi
	; X64-LABEL: test3:			; CHECK-NEXT: sarq $63, %rsi
	; X64: # %bb.0:			; CHECK-NEXT: movq %rsi, %rax
	; X64-NEXT: pushq %rax			; CHECK-NEXT: mulq %r14
	; X64-NEXT: movq $-3, %rdx			; CHECK-NEXT: movq %rax, %r8
	; X64-NEXT: movq $-5, %rcx			; CHECK-NEXT: addq %rbx, %rdx
	; X64-NEXT: callq __divti3			; CHECK-NEXT: imulq %r14, %rsi
	; X64-NEXT: popq %rcx			; CHECK-NEXT: addq %rdx, %rsi
	; X64-NEXT: retq			; CHECK-NEXT: movq $-1, %rcx
				; CHECK-NEXT: movq %r9, %rax
				; CHECK-NEXT: mulq %rcx
				; CHECK-NEXT: movq %rdx, %rcx
				; CHECK-NEXT: subq %r9, %rcx
				; CHECK-NEXT: subq %r10, %rcx
				; CHECK-NEXT: addq %r8, %rax
				; CHECK-NEXT: adcq %rsi, %rcx
				; CHECK-NEXT: addq %rdi, %rax
				; CHECK-NEXT: adcq %r11, %rcx
				; CHECK-NEXT: movq %rcx, %rdx
				; CHECK-NEXT: sarq $63, %rdx
				; CHECK-NEXT: movq %rcx, %rax
				; CHECK-NEXT: shrq $63, %rax
				; CHECK-NEXT: sarq %rcx
				; CHECK-NEXT: addq %rax, %rcx
				; CHECK-NEXT: adcq $0, %rdx
				; CHECK-NEXT: movq %rcx, %rax
				; CHECK-NEXT: popq %rbx
				; CHECK-NEXT: .cfi_def_cfa_offset 16
				; CHECK-NEXT: popq %r14
				; CHECK-NEXT: .cfi_def_cfa_offset 8
				; CHECK-NEXT: retq
	%tmp = sdiv i128 %x, -73786976294838206467			%tmp = sdiv i128 %x, -73786976294838206467
	ret i128 %tmp			ret i128 %tmp
	}			}

llvm/test/CodeGen/X86/i128-udiv.ll

Show All 27 Lines	; X64-NEXT: retq
%tmp = udiv i128 %x, 73786976294838206464		%tmp = udiv i128 %x, 73786976294838206464
ret i128 %tmp		ret i128 %tmp
}		}

define i128 @test2(i128 %x) nounwind {		define i128 @test2(i128 %x) nounwind {
; X86-LABEL: test2:		; X86-LABEL: test2:
; X86: # %bb.0:		; X86: # %bb.0:
; X86-NEXT: pushl %ebp		; X86-NEXT: pushl %ebp
; X86-NEXT: movl %esp, %ebp		; X86-NEXT: pushl %ebx
; X86-NEXT: pushl %edi		; X86-NEXT: pushl %edi
; X86-NEXT: pushl %esi		; X86-NEXT: pushl %esi
; X86-NEXT: andl $-8, %esp
; X86-NEXT: subl $16, %esp
; X86-NEXT: movl 8(%ebp), %esi
; X86-NEXT: movl %esp, %eax
; X86-NEXT: pushl $-1
; X86-NEXT: pushl $-4
; X86-NEXT: pushl $0
; X86-NEXT: pushl $0
; X86-NEXT: pushl 24(%ebp)
; X86-NEXT: pushl 20(%ebp)
; X86-NEXT: pushl 16(%ebp)
; X86-NEXT: pushl 12(%ebp)
; X86-NEXT: pushl %eax		; X86-NEXT: pushl %eax
; X86-NEXT: calll __udivti3
; X86-NEXT: addl $32, %esp
; X86-NEXT: movl (%esp), %eax
; X86-NEXT: movl {{[0-9]+}}(%esp), %ecx		; X86-NEXT: movl {{[0-9]+}}(%esp), %ecx
; X86-NEXT: movl {{[0-9]+}}(%esp), %edx		; X86-NEXT: movl {{[0-9]+}}(%esp), %esi
; X86-NEXT: movl {{[0-9]+}}(%esp), %edi		; X86-NEXT: shrdl $2, %esi, %ecx
; X86-NEXT: movl %edi, 12(%esi)		; X86-NEXT: movl $4, %edi
; X86-NEXT: movl %edx, 8(%esi)		; X86-NEXT: movl %ecx, %eax
; X86-NEXT: movl %ecx, 4(%esi)		; X86-NEXT: mull %edi
; X86-NEXT: movl %eax, (%esi)		; X86-NEXT: movl %eax, (%esp) # 4-byte Spill
		; X86-NEXT: movl %edx, %ebx
		; X86-NEXT: shrl $2, %esi
		; X86-NEXT: movl %esi, %eax
		; X86-NEXT: mull %edi
		; X86-NEXT: movl %edx, %ebp
		; X86-NEXT: movl %eax, %edi
		; X86-NEXT: addl %ebx, %edi
		; X86-NEXT: adcl $0, %ebp
		; X86-NEXT: movl $17, %ebx
		; X86-NEXT: movl %ecx, %eax
		; X86-NEXT: mull %ebx
		; X86-NEXT: movl %edx, %ecx
; X86-NEXT: movl %esi, %eax		; X86-NEXT: movl %esi, %eax
; X86-NEXT: leal -8(%ebp), %esp		; X86-NEXT: mull %ebx
		; X86-NEXT: addl %ecx, %eax
		; X86-NEXT: adcl (%esp), %edx # 4-byte Folded Reload
		; X86-NEXT: adcl $0, %edi
		; X86-NEXT: movl {{[0-9]+}}(%esp), %eax
		; X86-NEXT: adcl $0, %ebp
		; X86-NEXT: movl %ebp, (%eax)
		; X86-NEXT: setb %cl
		; X86-NEXT: movzbl %cl, %ecx
		; X86-NEXT: movl %ecx, 4(%eax)
		; X86-NEXT: movl $0, 12(%eax)
		; X86-NEXT: movl $0, 8(%eax)
		; X86-NEXT: addl $4, %esp
; X86-NEXT: popl %esi		; X86-NEXT: popl %esi
; X86-NEXT: popl %edi		; X86-NEXT: popl %edi
		; X86-NEXT: popl %ebx
; X86-NEXT: popl %ebp		; X86-NEXT: popl %ebp
; X86-NEXT: retl $4		; X86-NEXT: retl $4
;		;
; X64-LABEL: test2:		; X64-LABEL: test2:
; X64: # %bb.0:		; X64: # %bb.0:
; X64-NEXT: pushq %rax		; X64-NEXT: shrq $2, %rsi
; X64-NEXT: xorl %edx, %edx		; X64-NEXT: movl $17, %ecx
; X64-NEXT: movq $-4, %rcx		; X64-NEXT: movq %rsi, %rax
; X64-NEXT: callq __udivti3		; X64-NEXT: mulq %rcx
; X64-NEXT: popq %rcx		; X64-NEXT: movq %rdx, %r8
		; X64-NEXT: xorl %eax, %eax
		; X64-NEXT: mulq %rcx
		; X64-NEXT: movq %rdx, %rdi
		; X64-NEXT: movq %rax, %rcx
		; X64-NEXT: addq %r8, %rcx
		; X64-NEXT: adcq $0, %rdi
		; X64-NEXT: movl $4, %r8d
		; X64-NEXT: movq %rsi, %rax
		; X64-NEXT: mulq %r8
		; X64-NEXT: movq %rdx, %rsi
		; X64-NEXT: addq %rcx, %rax
		; X64-NEXT: adcq %rdi, %rsi
		; X64-NEXT: setb %al
		; X64-NEXT: movzbl %al, %ecx
		; X64-NEXT: xorl %eax, %eax
		; X64-NEXT: mulq %r8
		; X64-NEXT: addq %rsi, %rax
		; X64-NEXT: adcq %rcx, %rdx
; X64-NEXT: retq		; X64-NEXT: retq
%tmp = udiv i128 %x, -73786976294838206464		%tmp = udiv i128 %x, -73786976294838206464
ret i128 %tmp		ret i128 %tmp
}		}

define i128 @test3(i128 %x) nounwind {		define i128 @test3(i128 %x) nounwind {
; X86-LABEL: test3:		; X86-LABEL: test3:
; X86: # %bb.0:		; X86: # %bb.0:
; X86-NEXT: pushl %ebp		; X86-NEXT: pushl %ebp
; X86-NEXT: movl %esp, %ebp		; X86-NEXT: pushl %ebx
; X86-NEXT: pushl %edi		; X86-NEXT: pushl %edi
; X86-NEXT: pushl %esi		; X86-NEXT: pushl %esi
; X86-NEXT: andl $-8, %esp		; X86-NEXT: subl $24, %esp
; X86-NEXT: subl $16, %esp
; X86-NEXT: movl 8(%ebp), %esi
; X86-NEXT: movl %esp, %eax
; X86-NEXT: pushl $-1
; X86-NEXT: pushl $-5
; X86-NEXT: pushl $-1
; X86-NEXT: pushl $-3
; X86-NEXT: pushl 24(%ebp)
; X86-NEXT: pushl 20(%ebp)
; X86-NEXT: pushl 16(%ebp)
; X86-NEXT: pushl 12(%ebp)
; X86-NEXT: pushl %eax
; X86-NEXT: calll __udivti3
; X86-NEXT: addl $32, %esp
; X86-NEXT: movl (%esp), %eax
; X86-NEXT: movl {{[0-9]+}}(%esp), %ecx		; X86-NEXT: movl {{[0-9]+}}(%esp), %ecx
; X86-NEXT: movl {{[0-9]+}}(%esp), %edx		; X86-NEXT: movl {{[0-9]+}}(%esp), %esi
; X86-NEXT: movl {{[0-9]+}}(%esp), %edi		; X86-NEXT: movl $1073741824, %ebx # imm = 0x40000000
; X86-NEXT: movl %edi, 12(%esi)		; X86-NEXT: movl %esi, %eax
; X86-NEXT: movl %edx, 8(%esi)		; X86-NEXT: mull %ebx
; X86-NEXT: movl %ecx, 4(%esi)		; X86-NEXT: movl %edx, {{[-0-9]+}}(%e{{[sb]}}p) # 4-byte Spill
; X86-NEXT: movl %eax, (%esi)		; X86-NEXT: movl %eax, %edi
		; X86-NEXT: movl %ecx, %eax
		; X86-NEXT: mull %ebx
		; X86-NEXT: movl $1073741824, %ebx # imm = 0x40000000
		; X86-NEXT: movl %eax, %ecx
		; X86-NEXT: addl %esi, %ecx
		; X86-NEXT: adcl %edx, %edi
		; X86-NEXT: setb {{[-0-9]+}}(%e{{[sb]}}p) # 1-byte Folded Spill
		; X86-NEXT: addl %esi, %eax
		; X86-NEXT: movl %eax, {{[-0-9]+}}(%e{{[sb]}}p) # 4-byte Spill
		; X86-NEXT: adcl $0, %edx
		; X86-NEXT: setb {{[-0-9]+}}(%e{{[sb]}}p) # 1-byte Folded Spill
		; X86-NEXT: movl {{[0-9]+}}(%esp), %eax
		; X86-NEXT: mull %ebx
		; X86-NEXT: movl %eax, %ecx
		; X86-NEXT: movl %edx, %ebp
		; X86-NEXT: movl {{[0-9]+}}(%esp), %esi
		; X86-NEXT: movl %eax, %edx
		; X86-NEXT: addl %esi, %edx
		; X86-NEXT: movl %ebp, %eax
		; X86-NEXT: adcl $0, %eax
		; X86-NEXT: setb %bl
		; X86-NEXT: movl %esi, %eax
		; X86-NEXT: movl $1073741824, %edx # imm = 0x40000000
		; X86-NEXT: mull %edx
		; X86-NEXT: addl %esi, %ecx
		; X86-NEXT: movl %ecx, {{[-0-9]+}}(%e{{[sb]}}p) # 4-byte Spill
		; X86-NEXT: adcl %ebp, %eax
		; X86-NEXT: movl %eax, {{[-0-9]+}}(%e{{[sb]}}p) # 4-byte Spill
		; X86-NEXT: movzbl %bl, %ecx
		; X86-NEXT: adcl %edx, %ecx
		; X86-NEXT: movl $5, %ebp
		; X86-NEXT: movl {{[0-9]+}}(%esp), %eax
		; X86-NEXT: mull %ebp
		; X86-NEXT: movl %edx, %ebx
		; X86-NEXT: movl %eax, {{[-0-9]+}}(%e{{[sb]}}p) # 4-byte Spill
; X86-NEXT: movl %esi, %eax		; X86-NEXT: movl %esi, %eax
; X86-NEXT: leal -8(%ebp), %esp		; X86-NEXT: mull %ebp
		; X86-NEXT: movl %edx, %ebp
		; X86-NEXT: movl %eax, %esi
		; X86-NEXT: addl %ebx, %esi
		; X86-NEXT: adcl $0, %ebp
		; X86-NEXT: movl {{[0-9]+}}(%esp), %eax
		; X86-NEXT: movl $5, %edx
		; X86-NEXT: mull %edx
		; X86-NEXT: movl %edx, %ebx
		; X86-NEXT: movl {{[0-9]+}}(%esp), %eax
		; X86-NEXT: movl $5, %edx
		; X86-NEXT: mull %edx
		; X86-NEXT: addl %ebx, %eax
		; X86-NEXT: adcl {{[-0-9]+}}(%e{{[sb]}}p), %edx # 4-byte Folded Reload
		; X86-NEXT: adcl $0, %esi
		; X86-NEXT: setb %al
		; X86-NEXT: movl %ebp, %ebx
		; X86-NEXT: adcl $0, %ebx
		; X86-NEXT: addl {{[0-9]+}}(%esp), %edx
		; X86-NEXT: adcl {{[-0-9]+}}(%e{{[sb]}}p), %esi # 4-byte Folded Reload
		; X86-NEXT: setb %dl
		; X86-NEXT: adcl %edi, %ebx
		; X86-NEXT: addb $255, {{[-0-9]+}}(%e{{[sb]}}p) # 1-byte Folded Spill
		; X86-NEXT: movzbl {{[-0-9]+}}(%e{{[sb]}}p), %esi # 1-byte Folded Reload
		; X86-NEXT: adcl {{[-0-9]+}}(%e{{[sb]}}p), %esi # 4-byte Folded Reload
		; X86-NEXT: addb $255, %dl
		; X86-NEXT: adcl $0, %edi
		; X86-NEXT: adcl $0, %esi
		; X86-NEXT: addb $255, %al
		; X86-NEXT: adcl %ebp, %edi
		; X86-NEXT: adcl $0, %esi
		; X86-NEXT: setb %al
		; X86-NEXT: addl {{[0-9]+}}(%esp), %ebx
		; X86-NEXT: adcl {{[-0-9]+}}(%e{{[sb]}}p), %esi # 4-byte Folded Reload
		; X86-NEXT: movzbl %al, %eax
		; X86-NEXT: adcl {{[-0-9]+}}(%e{{[sb]}}p), %eax # 4-byte Folded Reload
		; X86-NEXT: movl {{[0-9]+}}(%esp), %eax
		; X86-NEXT: adcl $0, %ecx
		; X86-NEXT: shrl $30, %ecx
		; X86-NEXT: movl %ecx, (%eax)
		; X86-NEXT: movl $0, 12(%eax)
		; X86-NEXT: movl $0, 8(%eax)
		; X86-NEXT: movl $0, 4(%eax)
		; X86-NEXT: addl $24, %esp
; X86-NEXT: popl %esi		; X86-NEXT: popl %esi
; X86-NEXT: popl %edi		; X86-NEXT: popl %edi
		; X86-NEXT: popl %ebx
; X86-NEXT: popl %ebp		; X86-NEXT: popl %ebp
; X86-NEXT: retl $4		; X86-NEXT: retl $4
;		;
; X64-LABEL: test3:		; X64-LABEL: test3:
; X64: # %bb.0:		; X64: # %bb.0:
; X64-NEXT: pushq %rax		; X64-NEXT: movq %rsi, %r8
; X64-NEXT: movq $-3, %rdx		; X64-NEXT: movl $5, %ecx
; X64-NEXT: movq $-5, %rcx		; X64-NEXT: movq %rdi, %rax
; X64-NEXT: callq __udivti3		; X64-NEXT: mulq %rcx
; X64-NEXT: popq %rcx		; X64-NEXT: movq %rdx, %r9
		; X64-NEXT: movq %rsi, %rax
		; X64-NEXT: mulq %rcx
		; X64-NEXT: movq %rdx, %rsi
		; X64-NEXT: movq %rax, %rcx
		; X64-NEXT: addq %r9, %rcx
		; X64-NEXT: adcq $0, %rsi
		; X64-NEXT: movabsq $4611686018427387905, %r9 # imm = 0x4000000000000001
		; X64-NEXT: movq %rdi, %rax
		; X64-NEXT: mulq %r9
		; X64-NEXT: movq %rdx, %rdi
		; X64-NEXT: addq %rcx, %rax
		; X64-NEXT: adcq %rsi, %rdi
		; X64-NEXT: setb %al
		; X64-NEXT: movzbl %al, %ecx
		; X64-NEXT: movq %r8, %rax
		; X64-NEXT: mulq %r9
		; X64-NEXT: addq %rdi, %rax
		; X64-NEXT: adcq %rdx, %rcx
		; X64-NEXT: shrq $62, %rcx
		; X64-NEXT: movq %rcx, %rax
		; X64-NEXT: xorl %edx, %edx
; X64-NEXT: retq		; X64-NEXT: retq
%tmp = udiv i128 %x, -73786976294838206467		%tmp = udiv i128 %x, -73786976294838206467
ret i128 %tmp		ret i128 %tmp
}		}

llvm/test/CodeGen/X86/pr44812.ll

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: llc < %s -mtriple=i386-unknown-linux-gnu -mattr=cmov \| FileCheck %s			; RUN: llc < %s -mtriple=i386-unknown-linux-gnu -mattr=cmov \| FileCheck %s

	define <2 x i32> @foo(<2 x i32> %tmp) {			define <2 x i32> @foo(<2 x i32> %tmp) {
	; CHECK-LABEL: foo:			; CHECK-LABEL: foo:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: movl {{[0-9]+}}(%esp), %eax			; CHECK-NEXT: pushl %esi
	; CHECK-NEXT: leal 7(%eax), %ecx			; CHECK-NEXT: .cfi_def_cfa_offset 8
	; CHECK-NEXT: testl %eax, %eax			; CHECK-NEXT: .cfi_offset %esi, -8
	; CHECK-NEXT: cmovnsl %eax, %ecx			; CHECK-NEXT: movl {{[0-9]+}}(%esp), %ecx
	; CHECK-NEXT: sarl $3, %ecx			; CHECK-NEXT: movl $-2147483647, %edx # imm = 0x80000001
				; CHECK-NEXT: movl %ecx, %eax
				; CHECK-NEXT: imull %edx
				; CHECK-NEXT: movl %edx, %esi
				; CHECK-NEXT: addl %ecx, %esi
				; CHECK-NEXT: movl %esi, %eax
				; CHECK-NEXT: shrl $31, %eax
				; CHECK-NEXT: sarl $2, %esi
				; CHECK-NEXT: addl %eax, %esi
	; CHECK-NEXT: movl $1717986919, %eax # imm = 0x66666667			; CHECK-NEXT: movl $1717986919, %eax # imm = 0x66666667
	; CHECK-NEXT: imull {{[0-9]+}}(%esp)			; CHECK-NEXT: imull {{[0-9]+}}(%esp)
	; CHECK-NEXT: movl %edx, %eax			; CHECK-NEXT: movl %edx, %eax
	; CHECK-NEXT: shrl $31, %eax			; CHECK-NEXT: shrl $31, %eax
	; CHECK-NEXT: sarl $2, %edx			; CHECK-NEXT: sarl $2, %edx
	; CHECK-NEXT: addl %edx, %eax			; CHECK-NEXT: addl %edx, %eax
	; CHECK-NEXT: movl %ecx, %edx			; CHECK-NEXT: movl %esi, %edx
				; CHECK-NEXT: popl %esi
				; CHECK-NEXT: .cfi_def_cfa_offset 4
	; CHECK-NEXT: retl			; CHECK-NEXT: retl
	entry:			entry:
	%tmp1 = sdiv <2 x i32> %tmp, <i32 10, i32 8>			%tmp1 = sdiv <2 x i32> %tmp, <i32 10, i32 8>
	ret <2 x i32> %tmp1			ret <2 x i32> %tmp1
	}			}

llvm/test/CodeGen/X86/rotate-extract-vector.ll

Show First 20 Lines • Show All 50 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret{{[l\|q]}}
%rhs_shift = lshr <8 x i32> %rhs_mul, <i32 26, i32 26, i32 26, i32 26, i32 26, i32 26, i32 26, i32 26>		%rhs_shift = lshr <8 x i32> %rhs_mul, <i32 26, i32 26, i32 26, i32 26, i32 26, i32 26, i32 26, i32 26>
%out = or <8 x i32> %lhs_mul, %rhs_shift		%out = or <8 x i32> %lhs_mul, %rhs_shift
ret <8 x i32> %out		ret <8 x i32> %out
}		}

define <2 x i64> @vrolq_extract_udiv(<2 x i64> %i) nounwind {		define <2 x i64> @vrolq_extract_udiv(<2 x i64> %i) nounwind {
; X86-LABEL: vrolq_extract_udiv:		; X86-LABEL: vrolq_extract_udiv:
; X86: # %bb.0:		; X86: # %bb.0:
; X86-NEXT: subl $44, %esp		; X86-NEXT: pushl %ebp
; X86-NEXT: vmovups %xmm0, {{[-0-9]+}}(%e{{[sb]}}p) # 16-byte Spill		; X86-NEXT: pushl %ebx
; X86-NEXT: vextractps $1, %xmm0, {{[0-9]+}}(%esp)		; X86-NEXT: pushl %edi
; X86-NEXT: vmovss %xmm0, (%esp)		; X86-NEXT: pushl %esi
; X86-NEXT: movl $0, {{[0-9]+}}(%esp)		; X86-NEXT: vmovd %xmm0, %ecx
; X86-NEXT: movl $3, {{[0-9]+}}(%esp)		; X86-NEXT: movl $-1431655765, %ebx # imm = 0xAAAAAAAB
; X86-NEXT: calll __udivdi3		; X86-NEXT: movl %ecx, %eax
; X86-NEXT: vmovups {{[-0-9]+}}(%e{{[sb]}}p), %xmm0 # 16-byte Reload		; X86-NEXT: mull %ebx
; X86-NEXT: vextractps $3, %xmm0, {{[0-9]+}}(%esp)		; X86-NEXT: movl %edx, %esi
; X86-NEXT: vextractps $2, %xmm0, (%esp)		; X86-NEXT: vpextrd $1, %xmm0, %edi
; X86-NEXT: movl $0, {{[0-9]+}}(%esp)		; X86-NEXT: movl %edi, %eax
; X86-NEXT: movl $3, {{[0-9]+}}(%esp)		; X86-NEXT: mull %ebx
; X86-NEXT: vmovd %eax, %xmm0		; X86-NEXT: movl %edx, %ebx
; X86-NEXT: vpinsrd $1, %edx, %xmm0, %xmm0		; X86-NEXT: movl %eax, %ebp
; X86-NEXT: vmovdqu %xmm0, {{[-0-9]+}}(%e{{[sb]}}p) # 16-byte Spill		; X86-NEXT: addl %esi, %ebp
; X86-NEXT: calll __udivdi3		; X86-NEXT: adcl $0, %ebx
; X86-NEXT: vmovdqu {{[-0-9]+}}(%e{{[sb]}}p), %xmm0 # 16-byte Reload		; X86-NEXT: movl $-1431655766, %edx # imm = 0xAAAAAAAA
; X86-NEXT: vpinsrd $2, %eax, %xmm0, %xmm0		; X86-NEXT: movl %ecx, %eax
		; X86-NEXT: mull %edx
		; X86-NEXT: movl %edx, %ecx
		; X86-NEXT: addl %ebp, %eax
		; X86-NEXT: adcl %ebx, %ecx
		; X86-NEXT: setb %al
		; X86-NEXT: movzbl %al, %esi
		; X86-NEXT: movl %edi, %eax
		; X86-NEXT: movl $-1431655766, %edx # imm = 0xAAAAAAAA
		; X86-NEXT: mull %edx
		; X86-NEXT: addl %ecx, %eax
		; X86-NEXT: adcl %esi, %edx
		; X86-NEXT: movl %edx, %ecx
		; X86-NEXT: shrl %ecx
		; X86-NEXT: shldl $31, %eax, %edx
		; X86-NEXT: vmovd %edx, %xmm1
		; X86-NEXT: vpinsrd $1, %ecx, %xmm1, %xmm1
		; X86-NEXT: vpextrd $2, %xmm0, %ecx
		; X86-NEXT: movl %ecx, %eax
		; X86-NEXT: movl $-1431655765, %ebx # imm = 0xAAAAAAAB
		; X86-NEXT: mull %ebx
		; X86-NEXT: movl %edx, %esi
		; X86-NEXT: vpextrd $3, %xmm0, %edi
		; X86-NEXT: movl %edi, %eax
		; X86-NEXT: mull %ebx
		; X86-NEXT: movl %edx, %ebx
		; X86-NEXT: movl %eax, %ebp
		; X86-NEXT: addl %esi, %ebp
		; X86-NEXT: adcl $0, %ebx
		; X86-NEXT: movl %ecx, %eax
		; X86-NEXT: movl $-1431655766, %ecx # imm = 0xAAAAAAAA
		; X86-NEXT: mull %ecx
		; X86-NEXT: movl %edx, %ecx
		; X86-NEXT: addl %ebp, %eax
		; X86-NEXT: adcl %ebx, %ecx
		; X86-NEXT: setb %al
		; X86-NEXT: movzbl %al, %esi
		; X86-NEXT: movl %edi, %eax
		; X86-NEXT: movl $-1431655766, %edx # imm = 0xAAAAAAAA
		; X86-NEXT: mull %edx
		; X86-NEXT: addl %ecx, %eax
		; X86-NEXT: adcl %esi, %edx
		; X86-NEXT: shrdl $1, %edx, %eax
		; X86-NEXT: vpinsrd $2, %eax, %xmm1, %xmm0
		; X86-NEXT: shrl %edx
; X86-NEXT: vpinsrd $3, %edx, %xmm0, %xmm0		; X86-NEXT: vpinsrd $3, %edx, %xmm0, %xmm0
; X86-NEXT: vprolq $57, %zmm0, %zmm0		; X86-NEXT: vprolq $57, %zmm0, %zmm0
; X86-NEXT: # kill: def $xmm0 killed $xmm0 killed $zmm0		; X86-NEXT: # kill: def $xmm0 killed $xmm0 killed $zmm0
; X86-NEXT: addl $44, %esp		; X86-NEXT: popl %esi
		; X86-NEXT: popl %edi
		; X86-NEXT: popl %ebx
		; X86-NEXT: popl %ebp
; X86-NEXT: vzeroupper		; X86-NEXT: vzeroupper
; X86-NEXT: retl		; X86-NEXT: retl
;		;
; X64-LABEL: vrolq_extract_udiv:		; X64-LABEL: vrolq_extract_udiv:
; X64: # %bb.0:		; X64: # %bb.0:
; X64-NEXT: vpextrq $1, %xmm0, %rax		; X64-NEXT: vpextrq $1, %xmm0, %rax
; X64-NEXT: movabsq $-6148914691236517205, %rcx # imm = 0xAAAAAAAAAAAAAAAB		; X64-NEXT: movabsq $-6148914691236517205, %rcx # imm = 0xAAAAAAAAAAAAAAAB
; X64-NEXT: mulq %rcx		; X64-NEXT: mulq %rcx
▲ Show 20 Lines • Show All 113 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret{{[l\|q]}}
%out = or <8 x i32> %lhs_mul, %rhs_shift		%out = or <8 x i32> %lhs_mul, %rhs_shift
ret <8 x i32> %out		ret <8 x i32> %out
}		}

; Can't evenly factor 256 from 770		; Can't evenly factor 256 from 770
define <2 x i64> @no_extract_udiv(<2 x i64> %i) nounwind {		define <2 x i64> @no_extract_udiv(<2 x i64> %i) nounwind {
; X86-LABEL: no_extract_udiv:		; X86-LABEL: no_extract_udiv:
; X86: # %bb.0:		; X86: # %bb.0:
; X86-NEXT: subl $60, %esp		; X86-NEXT: pushl %ebp
; X86-NEXT: vmovups %xmm0, {{[-0-9]+}}(%e{{[sb]}}p) # 16-byte Spill		; X86-NEXT: pushl %ebx
; X86-NEXT: vextractps $1, %xmm0, {{[0-9]+}}(%esp)		; X86-NEXT: pushl %edi
; X86-NEXT: vmovss %xmm0, (%esp)		; X86-NEXT: pushl %esi
; X86-NEXT: movl $0, {{[0-9]+}}(%esp)		; X86-NEXT: subl $20, %esp
; X86-NEXT: movl $3, {{[0-9]+}}(%esp)		; X86-NEXT: vpextrd $2, %xmm0, %ecx
; X86-NEXT: calll __udivdi3		; X86-NEXT: movl $-1431655765, %ebx # imm = 0xAAAAAAAB
; X86-NEXT: vmovups {{[-0-9]+}}(%e{{[sb]}}p), %xmm0 # 16-byte Reload		; X86-NEXT: movl %ecx, %eax
; X86-NEXT: vextractps $3, %xmm0, {{[0-9]+}}(%esp)		; X86-NEXT: movl %ecx, {{[-0-9]+}}(%e{{[sb]}}p) # 4-byte Spill
; X86-NEXT: vextractps $2, %xmm0, (%esp)		; X86-NEXT: mull %ebx
; X86-NEXT: movl $0, {{[0-9]+}}(%esp)		; X86-NEXT: movl %edx, %edi
; X86-NEXT: movl $3, {{[0-9]+}}(%esp)		; X86-NEXT: vpextrd $3, %xmm0, %eax
; X86-NEXT: vmovd %eax, %xmm0		; X86-NEXT: movl %eax, %esi
; X86-NEXT: vmovdqu %xmm0, {{[-0-9]+}}(%e{{[sb]}}p) # 16-byte Spill		; X86-NEXT: movl %eax, (%esp) # 4-byte Spill
; X86-NEXT: calll __udivdi3		; X86-NEXT: mull %ebx
; X86-NEXT: vmovdqu {{[-0-9]+}}(%e{{[sb]}}p), %xmm0 # 16-byte Reload		; X86-NEXT: movl %edx, %ebx
; X86-NEXT: vpinsrd $2, %eax, %xmm0, %xmm0		; X86-NEXT: movl %eax, %ebp
; X86-NEXT: vmovdqu %xmm0, {{[-0-9]+}}(%e{{[sb]}}p) # 16-byte Spill		; X86-NEXT: addl %edi, %ebp
; X86-NEXT: vmovups {{[-0-9]+}}(%e{{[sb]}}p), %xmm0 # 16-byte Reload		; X86-NEXT: adcl $0, %ebx
; X86-NEXT: vextractps $1, %xmm0, {{[0-9]+}}(%esp)		; X86-NEXT: movl $-1431655766, %edx # imm = 0xAAAAAAAA
; X86-NEXT: vmovss %xmm0, (%esp)		; X86-NEXT: movl %ecx, %eax
; X86-NEXT: movl $0, {{[0-9]+}}(%esp)		; X86-NEXT: mull %edx
; X86-NEXT: movl $770, {{[0-9]+}}(%esp) # imm = 0x302		; X86-NEXT: addl %ebp, %eax
; X86-NEXT: calll __udivdi3		; X86-NEXT: adcl %ebx, %edx
; X86-NEXT: vmovups {{[-0-9]+}}(%e{{[sb]}}p), %xmm0 # 16-byte Reload		; X86-NEXT: imull $-1431655766, %esi, %eax # imm = 0xAAAAAAAA
; X86-NEXT: vextractps $3, %xmm0, {{[0-9]+}}(%esp)		; X86-NEXT: addl %edx, %eax
; X86-NEXT: vextractps $2, %xmm0, (%esp)		; X86-NEXT: movl %eax, {{[-0-9]+}}(%e{{[sb]}}p) # 4-byte Spill
; X86-NEXT: movl $0, {{[0-9]+}}(%esp)		; X86-NEXT: vmovd %xmm0, %ebx
; X86-NEXT: movl $770, {{[0-9]+}}(%esp) # imm = 0x302		; X86-NEXT: movl %ebx, %eax
; X86-NEXT: vmovd %eax, %xmm0		; X86-NEXT: movl $-1431655765, %ecx # imm = 0xAAAAAAAB
; X86-NEXT: vpinsrd $1, %edx, %xmm0, %xmm0		; X86-NEXT: mull %ecx
; X86-NEXT: vmovdqu %xmm0, {{[-0-9]+}}(%e{{[sb]}}p) # 16-byte Spill		; X86-NEXT: movl %edx, %esi
; X86-NEXT: calll __udivdi3		; X86-NEXT: vpextrd $1, %xmm0, %edi
; X86-NEXT: vmovdqu {{[-0-9]+}}(%e{{[sb]}}p), %xmm0 # 16-byte Reload		; X86-NEXT: movl %edi, %eax
; X86-NEXT: vpinsrd $2, %eax, %xmm0, %xmm0		; X86-NEXT: mull %ecx
; X86-NEXT: vpinsrd $3, %edx, %xmm0, %xmm0		; X86-NEXT: movl %edx, %ecx
; X86-NEXT: vmovdqu {{[-0-9]+}}(%e{{[sb]}}p), %xmm1 # 16-byte Reload		; X86-NEXT: movl %eax, %ebp
; X86-NEXT: vpsllq $56, %xmm1, %xmm1		; X86-NEXT: addl %esi, %ebp
; X86-NEXT: vpor %xmm0, %xmm1, %xmm0		; X86-NEXT: adcl $0, %ecx
; X86-NEXT: addl $60, %esp		; X86-NEXT: movl %ebx, %eax
		; X86-NEXT: movl $-1431655766, %edx # imm = 0xAAAAAAAA
		; X86-NEXT: mull %edx
		; X86-NEXT: addl %ebp, %eax
		; X86-NEXT: adcl %ecx, %edx
		; X86-NEXT: imull $-1431655766, %edi, %eax # imm = 0xAAAAAAAA
		; X86-NEXT: addl %edx, %eax
		; X86-NEXT: movl %eax, {{[-0-9]+}}(%e{{[sb]}}p) # 4-byte Spill
		; X86-NEXT: movl $-602410997, %esi # imm = 0xDC17F00B
		; X86-NEXT: movl %ebx, %eax
		; X86-NEXT: mull %esi
		; X86-NEXT: movl %edx, %ecx
		; X86-NEXT: movl %edi, %eax
		; X86-NEXT: mull %esi
		; X86-NEXT: movl %edx, %esi
		; X86-NEXT: movl %eax, %ebp
		; X86-NEXT: addl %ecx, %ebp
		; X86-NEXT: adcl $0, %esi
		; X86-NEXT: movl $-1439092939, %ecx # imm = 0xAA392F35
		; X86-NEXT: movl %ebx, %eax
		; X86-NEXT: mull %ecx
		; X86-NEXT: movl %edx, %ecx
		; X86-NEXT: addl %ebp, %eax
		; X86-NEXT: adcl %esi, %ecx
		; X86-NEXT: setb %bl
		; X86-NEXT: movl %edi, %eax
		; X86-NEXT: movl $-1439092939, %edx # imm = 0xAA392F35
		; X86-NEXT: mull %edx
		; X86-NEXT: movl %edx, %esi
		; X86-NEXT: addl %ecx, %eax
		; X86-NEXT: movzbl %bl, %ecx
		; X86-NEXT: adcl %ecx, %esi
		; X86-NEXT: movl %esi, %ebp
		; X86-NEXT: shldl $23, %eax, %esi
		; X86-NEXT: shrl $9, %ebp
		; X86-NEXT: movl {{[-0-9]+}}(%e{{[sb]}}p), %ecx # 4-byte Reload
		; X86-NEXT: movl %ecx, %eax
		; X86-NEXT: movl $-602410997, %edi # imm = 0xDC17F00B
		; X86-NEXT: mull %edi
		; X86-NEXT: movl %edx, {{[-0-9]+}}(%e{{[sb]}}p) # 4-byte Spill
		; X86-NEXT: movl (%esp), %eax # 4-byte Reload
		; X86-NEXT: mull %edi
		; X86-NEXT: movl %edx, %edi
		; X86-NEXT: movl %eax, %ebx
		; X86-NEXT: addl {{[-0-9]+}}(%e{{[sb]}}p), %ebx # 4-byte Folded Reload
		; X86-NEXT: adcl $0, %edi
		; X86-NEXT: movl %ecx, %eax
		; X86-NEXT: movl $-1439092939, %ecx # imm = 0xAA392F35
		; X86-NEXT: mull %ecx
		; X86-NEXT: movl %edx, %ecx
		; X86-NEXT: addl %ebx, %eax
		; X86-NEXT: vmovd {{[-0-9]+}}(%e{{[sb]}}p), %xmm0 # 4-byte Folded Reload
		; X86-NEXT: # xmm0 = mem[0],zero,zero,zero
		; X86-NEXT: vpinsrd $2, {{[-0-9]+}}(%e{{[sb]}}p), %xmm0, %xmm0 # 4-byte Folded Reload
		; X86-NEXT: vmovd %esi, %xmm1
		; X86-NEXT: vpinsrd $1, %ebp, %xmm1, %xmm1
		; X86-NEXT: adcl %edi, %ecx
		; X86-NEXT: setb %bl
		; X86-NEXT: movl (%esp), %eax # 4-byte Reload
		; X86-NEXT: movl $-1439092939, %edx # imm = 0xAA392F35
		; X86-NEXT: mull %edx
		; X86-NEXT: addl %ecx, %eax
		; X86-NEXT: movzbl %bl, %ecx
		; X86-NEXT: adcl %ecx, %edx
		; X86-NEXT: shrdl $9, %edx, %eax
		; X86-NEXT: vpinsrd $2, %eax, %xmm1, %xmm1
		; X86-NEXT: shrl $9, %edx
		; X86-NEXT: vpinsrd $3, %edx, %xmm1, %xmm1
		; X86-NEXT: vpsllq $55, %xmm0, %xmm0
		; X86-NEXT: vpand {{\.LCPI.*}}, %xmm0, %xmm0
		; X86-NEXT: vpor %xmm1, %xmm0, %xmm0
		; X86-NEXT: addl $20, %esp
		; X86-NEXT: popl %esi
		; X86-NEXT: popl %edi
		; X86-NEXT: popl %ebx
		; X86-NEXT: popl %ebp
; X86-NEXT: retl		; X86-NEXT: retl
;		;
; X64-LABEL: no_extract_udiv:		; X64-LABEL: no_extract_udiv:
; X64: # %bb.0:		; X64: # %bb.0:
; X64-NEXT: vpextrq $1, %xmm0, %rcx		; X64-NEXT: vpextrq $1, %xmm0, %rcx
; X64-NEXT: movabsq $-6148914691236517205, %rdi # imm = 0xAAAAAAAAAAAAAAAB		; X64-NEXT: movabsq $-6148914691236517205, %rdi # imm = 0xAAAAAAAAAAAAAAAB
; X64-NEXT: movq %rcx, %rax		; X64-NEXT: movq %rcx, %rax
; X64-NEXT: mulq %rdi		; X64-NEXT: mulq %rdi
; X64-NEXT: vmovq %rdx, %xmm1		; X64-NEXT: vmovq %rdx, %xmm1
; X64-NEXT: vmovq %xmm0, %rsi		; X64-NEXT: vmovq %xmm0, %rsi
; X64-NEXT: movq %rsi, %rax		; X64-NEXT: movq %rsi, %rax
; X64-NEXT: mulq %rdi		; X64-NEXT: mulq %rdi
; X64-NEXT: vmovq %rdx, %xmm0		; X64-NEXT: vmovq %rdx, %xmm0
; X64-NEXT: vpunpcklqdq {{.*#+}} xmm0 = xmm0[0],xmm1[0]		; X64-NEXT: vpunpcklqdq {{.*#+}} xmm0 = xmm0[0],xmm1[0]
; X64-NEXT: vpsrlq $1, %xmm0, %xmm0		; X64-NEXT: vpsllq $55, %xmm0, %xmm0
		; X64-NEXT: vpand {{.*}}(%rip), %xmm0, %xmm0
; X64-NEXT: movabsq $-6180857105216966645, %rdi # imm = 0xAA392F35DC17F00B		; X64-NEXT: movabsq $-6180857105216966645, %rdi # imm = 0xAA392F35DC17F00B
; X64-NEXT: movq %rcx, %rax		; X64-NEXT: movq %rcx, %rax
; X64-NEXT: mulq %rdi		; X64-NEXT: mulq %rdi
; X64-NEXT: vmovq %rdx, %xmm1		; X64-NEXT: vmovq %rdx, %xmm1
; X64-NEXT: movq %rsi, %rax		; X64-NEXT: movq %rsi, %rax
; X64-NEXT: mulq %rdi		; X64-NEXT: mulq %rdi
; X64-NEXT: vmovq %rdx, %xmm2		; X64-NEXT: vmovq %rdx, %xmm2
; X64-NEXT: vpunpcklqdq {{.*#+}} xmm1 = xmm2[0],xmm1[0]		; X64-NEXT: vpunpcklqdq {{.*#+}} xmm1 = xmm2[0],xmm1[0]
; X64-NEXT: vpsrlq $9, %xmm1, %xmm1		; X64-NEXT: vpsrlq $9, %xmm1, %xmm1
; X64-NEXT: vpsllq $56, %xmm0, %xmm0
; X64-NEXT: vpor %xmm1, %xmm0, %xmm0		; X64-NEXT: vpor %xmm1, %xmm0, %xmm0
; X64-NEXT: retq		; X64-NEXT: retq
%lhs_div = udiv <2 x i64> %i, <i64 3, i64 3>		%lhs_div = udiv <2 x i64> %i, <i64 3, i64 3>
%rhs_div = udiv <2 x i64> %i, <i64 770, i64 770>		%rhs_div = udiv <2 x i64> %i, <i64 770, i64 770>
%lhs_shift = shl <2 x i64> %lhs_div, <i64 56, i64 56>		%lhs_shift = shl <2 x i64> %lhs_div, <i64 56, i64 56>
%out = or <2 x i64> %lhs_shift, %rhs_div		%out = or <2 x i64> %lhs_shift, %rhs_div
ret <2 x i64> %out		ret <2 x i64> %out
}		}
▲ Show 20 Lines • Show All 42 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/rotate-extract.ll

	Show First 20 Lines • Show All 226 Lines • ▼ Show 20 Lines
	}			}

	; Can't evenly factor 16 from 49			; Can't evenly factor 16 from 49
	define i8 @no_extract_udiv(i8 %i) nounwind {			define i8 @no_extract_udiv(i8 %i) nounwind {
	; X86-LABEL: no_extract_udiv:			; X86-LABEL: no_extract_udiv:
	; X86: # %bb.0:			; X86: # %bb.0:
	; X86-NEXT: movzbl {{[0-9]+}}(%esp), %eax			; X86-NEXT: movzbl {{[0-9]+}}(%esp), %eax
	; X86-NEXT: imull $171, %eax, %ecx			; X86-NEXT: imull $171, %eax, %ecx
				; X86-NEXT: shlb $3, %ch
				; X86-NEXT: andb $-16, %ch
	; X86-NEXT: imull $79, %eax, %edx			; X86-NEXT: imull $79, %eax, %edx
	; X86-NEXT: subb %dh, %al			; X86-NEXT: subb %dh, %al
	; X86-NEXT: shrb %al			; X86-NEXT: shrb %al
	; X86-NEXT: addb %dh, %al			; X86-NEXT: addb %dh, %al
	; X86-NEXT: shrb $5, %al			; X86-NEXT: shrb $5, %al
	; X86-NEXT: shlb $3, %ch			; X86-NEXT: orb %ch, %al
	; X86-NEXT: orb %al, %ch			; X86-NEXT: # kill: def $al killed $al killed $eax
	; X86-NEXT: andb $-9, %ch
	; X86-NEXT: movb %ch, %al
	; X86-NEXT: retl			; X86-NEXT: retl
	;			;
	; X64-LABEL: no_extract_udiv:			; X64-LABEL: no_extract_udiv:
	; X64: # %bb.0:			; X64: # %bb.0:
	; X64-NEXT: movzbl %dil, %ecx			; X64-NEXT: movzbl %dil, %eax
	; X64-NEXT: imull $171, %ecx, %eax			; X64-NEXT: imull $171, %eax, %ecx
	; X64-NEXT: shrl $8, %eax			; X64-NEXT: shrl $8, %ecx
	; X64-NEXT: imull $79, %ecx, %edx			; X64-NEXT: shlb $3, %cl
				; X64-NEXT: andb $-16, %cl
				; X64-NEXT: imull $79, %eax, %edx
	; X64-NEXT: shrl $8, %edx			; X64-NEXT: shrl $8, %edx
	; X64-NEXT: subb %dl, %cl			; X64-NEXT: subb %dl, %al
	; X64-NEXT: shrb %cl			; X64-NEXT: shrb %al
	; X64-NEXT: addb %dl, %cl			; X64-NEXT: addb %dl, %al
	; X64-NEXT: shrb $5, %cl			; X64-NEXT: shrb $5, %al
	; X64-NEXT: shlb $3, %al
	; X64-NEXT: orb %cl, %al			; X64-NEXT: orb %cl, %al
	; X64-NEXT: andb $-9, %al
	; X64-NEXT: # kill: def $al killed $al killed $eax			; X64-NEXT: # kill: def $al killed $al killed $eax
	; X64-NEXT: retq			; X64-NEXT: retq
	%lhs_div = udiv i8 %i, 3			%lhs_div = udiv i8 %i, 3
	%rhs_div = udiv i8 %i, 49			%rhs_div = udiv i8 %i, 49
	%lhs_shift = shl i8 %lhs_div,4			%lhs_shift = shl i8 %lhs_div,4
	%out = or i8 %lhs_shift, %rhs_div			%out = or i8 %lhs_shift, %rhs_div
	ret i8 %out			ret i8 %out
	}			}
	▲ Show 20 Lines • Show All 59 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/srem-vector-lkk.ll

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+sse4.1 \| FileCheck %s --check-prefix=CHECK --check-prefix=SSE			; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+sse4.1 \| FileCheck %s --check-prefix=CHECK --check-prefix=SSE
	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx \| FileCheck %s --check-prefix=CHECK --check-prefix=AVX --check-prefix=AVX1			; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx \| FileCheck %s --check-prefix=CHECK --check-prefix=AVX --check-prefix=AVX1
	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx2 \| FileCheck %s --check-prefix=CHECK --check-prefix=AVX --check-prefix=AVX2			; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx2 \| FileCheck %s --check-prefix=CHECK --check-prefix=AVX --check-prefix=AVX2

	define <4 x i16> @fold_srem_vec_1(<4 x i16> %x) {			define <4 x i16> @fold_srem_vec_1(<4 x i16> %x) {
	; SSE-LABEL: fold_srem_vec_1:			; SSE-LABEL: fold_srem_vec_1:
	; SSE: # %bb.0:			; SSE: # %bb.0:
	; SSE-NEXT: pextrw $3, %xmm0, %eax			; SSE-NEXT: pmovsxwd %xmm0, %xmm1
	; SSE-NEXT: movswl %ax, %ecx			; SSE-NEXT: pmulld {{.*}}(%rip), %xmm1
	; SSE-NEXT: imull $32081, %ecx, %ecx # imm = 0x7D51			; SSE-NEXT: psrld $16, %xmm1
	; SSE-NEXT: shrl $16, %ecx			; SSE-NEXT: packusdw %xmm1, %xmm1
	; SSE-NEXT: subl %eax, %ecx			; SSE-NEXT: movdqa {{.*#+}} xmm2 = <1,0,0,65535,u,u,u,u>
	; SSE-NEXT: movzwl %cx, %ecx			; SSE-NEXT: pmullw %xmm0, %xmm2
	; SSE-NEXT: movswl %cx, %edx			; SSE-NEXT: paddw %xmm1, %xmm2
	; SSE-NEXT: shrl $15, %ecx			; SSE-NEXT: movdqa %xmm2, %xmm1
	; SSE-NEXT: sarl $9, %edx			; SSE-NEXT: psrlw $15, %xmm1
	; SSE-NEXT: addl %ecx, %edx			; SSE-NEXT: pmulhw {{.*}}(%rip), %xmm2
	; SSE-NEXT: imull $-1003, %edx, %ecx # imm = 0xFC15			; SSE-NEXT: paddw %xmm1, %xmm2
	; SSE-NEXT: subl %ecx, %eax			; SSE-NEXT: pmullw {{.*}}(%rip), %xmm2
	; SSE-NEXT: movd %xmm0, %ecx			; SSE-NEXT: psubw %xmm2, %xmm0
	; SSE-NEXT: movswl %cx, %edx
	; SSE-NEXT: imull $-21385, %edx, %edx # imm = 0xAC77
	; SSE-NEXT: shrl $16, %edx
	; SSE-NEXT: addl %ecx, %edx
	; SSE-NEXT: movzwl %dx, %edx
	; SSE-NEXT: movswl %dx, %esi
	; SSE-NEXT: shrl $15, %edx
	; SSE-NEXT: sarl $6, %esi
	; SSE-NEXT: addl %edx, %esi
	; SSE-NEXT: imull $95, %esi, %edx
	; SSE-NEXT: subl %edx, %ecx
	; SSE-NEXT: movd %ecx, %xmm1
	; SSE-NEXT: pextrw $1, %xmm0, %ecx
	; SSE-NEXT: movswl %cx, %edx
	; SSE-NEXT: imull $-16913, %edx, %edx # imm = 0xBDEF
	; SSE-NEXT: movl %edx, %esi
	; SSE-NEXT: shrl $31, %esi
	; SSE-NEXT: sarl $21, %edx
	; SSE-NEXT: addl %esi, %edx
	; SSE-NEXT: imull $-124, %edx, %edx
	; SSE-NEXT: subl %edx, %ecx
	; SSE-NEXT: pinsrw $1, %ecx, %xmm1
	; SSE-NEXT: pextrw $2, %xmm0, %ecx
	; SSE-NEXT: movswl %cx, %edx
	; SSE-NEXT: imull $2675, %edx, %edx # imm = 0xA73
	; SSE-NEXT: movl %edx, %esi
	; SSE-NEXT: shrl $31, %esi
	; SSE-NEXT: sarl $18, %edx
	; SSE-NEXT: addl %esi, %edx
	; SSE-NEXT: imull $98, %edx, %edx
	; SSE-NEXT: subl %edx, %ecx
	; SSE-NEXT: pinsrw $2, %ecx, %xmm1
	; SSE-NEXT: pinsrw $3, %eax, %xmm1
	; SSE-NEXT: movdqa %xmm1, %xmm0
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; AVX-LABEL: fold_srem_vec_1:			; AVX-LABEL: fold_srem_vec_1:
	; AVX: # %bb.0:			; AVX: # %bb.0:
	; AVX-NEXT: vpextrw $3, %xmm0, %eax			; AVX-NEXT: vpmovsxwd %xmm0, %xmm1
	; AVX-NEXT: movswl %ax, %ecx			; AVX-NEXT: vpmulld {{.*}}(%rip), %xmm1, %xmm1
	; AVX-NEXT: imull $32081, %ecx, %ecx # imm = 0x7D51			; AVX-NEXT: vpsrld $16, %xmm1, %xmm1
	; AVX-NEXT: shrl $16, %ecx			; AVX-NEXT: vpackusdw %xmm1, %xmm1, %xmm1
	; AVX-NEXT: subl %eax, %ecx			; AVX-NEXT: vpmullw {{.*}}(%rip), %xmm0, %xmm2
	; AVX-NEXT: movzwl %cx, %ecx			; AVX-NEXT: vpaddw %xmm2, %xmm1, %xmm1
	; AVX-NEXT: movswl %cx, %edx			; AVX-NEXT: vpsrlw $15, %xmm1, %xmm2
	; AVX-NEXT: shrl $15, %ecx			; AVX-NEXT: vpmulhw {{.*}}(%rip), %xmm1, %xmm1
	; AVX-NEXT: sarl $9, %edx			; AVX-NEXT: vpaddw %xmm2, %xmm1, %xmm1
	; AVX-NEXT: addl %ecx, %edx			; AVX-NEXT: vpmullw {{.*}}(%rip), %xmm1, %xmm1
	; AVX-NEXT: imull $-1003, %edx, %ecx # imm = 0xFC15			; AVX-NEXT: vpsubw %xmm1, %xmm0, %xmm0
	; AVX-NEXT: subl %ecx, %eax
	; AVX-NEXT: vmovd %xmm0, %ecx
	; AVX-NEXT: movswl %cx, %edx
	; AVX-NEXT: imull $-21385, %edx, %edx # imm = 0xAC77
	; AVX-NEXT: shrl $16, %edx
	; AVX-NEXT: addl %ecx, %edx
	; AVX-NEXT: movzwl %dx, %edx
	; AVX-NEXT: movswl %dx, %esi
	; AVX-NEXT: shrl $15, %edx
	; AVX-NEXT: sarl $6, %esi
	; AVX-NEXT: addl %edx, %esi
	; AVX-NEXT: imull $95, %esi, %edx
	; AVX-NEXT: subl %edx, %ecx
	; AVX-NEXT: vmovd %ecx, %xmm1
	; AVX-NEXT: vpextrw $1, %xmm0, %ecx
	; AVX-NEXT: movswl %cx, %edx
	; AVX-NEXT: imull $-16913, %edx, %edx # imm = 0xBDEF
	; AVX-NEXT: movl %edx, %esi
	; AVX-NEXT: shrl $31, %esi
	; AVX-NEXT: sarl $21, %edx
	; AVX-NEXT: addl %esi, %edx
	; AVX-NEXT: imull $-124, %edx, %edx
	; AVX-NEXT: subl %edx, %ecx
	; AVX-NEXT: vpinsrw $1, %ecx, %xmm1, %xmm1
	; AVX-NEXT: vpextrw $2, %xmm0, %ecx
	; AVX-NEXT: movswl %cx, %edx
	; AVX-NEXT: imull $2675, %edx, %edx # imm = 0xA73
	; AVX-NEXT: movl %edx, %esi
	; AVX-NEXT: shrl $31, %esi
	; AVX-NEXT: sarl $18, %edx
	; AVX-NEXT: addl %esi, %edx
	; AVX-NEXT: imull $98, %edx, %edx
	; AVX-NEXT: subl %edx, %ecx
	; AVX-NEXT: vpinsrw $2, %ecx, %xmm1, %xmm0
	; AVX-NEXT: vpinsrw $3, %eax, %xmm0, %xmm0
	; AVX-NEXT: retq			; AVX-NEXT: retq
	%1 = srem <4 x i16> %x, <i16 95, i16 -124, i16 98, i16 -1003>			%1 = srem <4 x i16> %x, <i16 95, i16 -124, i16 98, i16 -1003>
	ret <4 x i16> %1			ret <4 x i16> %1
	}			}

	define <4 x i16> @fold_srem_vec_2(<4 x i16> %x) {			define <4 x i16> @fold_srem_vec_2(<4 x i16> %x) {
	; SSE-LABEL: fold_srem_vec_2:			; SSE-LABEL: fold_srem_vec_2:
	; SSE: # %bb.0:			; SSE: # %bb.0:
	; SSE-NEXT: movdqa {{.*#+}} xmm1 = [44151,44151,44151,44151,44151,44151,44151,44151]			; SSE-NEXT: pmovsxwd %xmm0, %xmm1
	; SSE-NEXT: pmulhw %xmm0, %xmm1			; SSE-NEXT: pmulld {{.*}}(%rip), %xmm1
				; SSE-NEXT: psrld $16, %xmm1
				; SSE-NEXT: packusdw %xmm1, %xmm1
	; SSE-NEXT: paddw %xmm0, %xmm1			; SSE-NEXT: paddw %xmm0, %xmm1
	; SSE-NEXT: movdqa %xmm1, %xmm2			; SSE-NEXT: movdqa %xmm1, %xmm2
	; SSE-NEXT: psrlw $15, %xmm2			; SSE-NEXT: psrlw $15, %xmm2
	; SSE-NEXT: psraw $6, %xmm1			; SSE-NEXT: psraw $6, %xmm1
	; SSE-NEXT: paddw %xmm2, %xmm1			; SSE-NEXT: paddw %xmm2, %xmm1
	; SSE-NEXT: pmullw {{.*}}(%rip), %xmm1			; SSE-NEXT: pmullw {{.*}}(%rip), %xmm1
	; SSE-NEXT: psubw %xmm1, %xmm0			; SSE-NEXT: psubw %xmm1, %xmm0
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; AVX-LABEL: fold_srem_vec_2:			; AVX1-LABEL: fold_srem_vec_2:
	; AVX: # %bb.0:			; AVX1: # %bb.0:
	; AVX-NEXT: vpmulhw {{.*}}(%rip), %xmm0, %xmm1			; AVX1-NEXT: vpmovsxwd %xmm0, %xmm1
	; AVX-NEXT: vpaddw %xmm0, %xmm1, %xmm1			; AVX1-NEXT: vpmulld {{.*}}(%rip), %xmm1, %xmm1
	; AVX-NEXT: vpsrlw $15, %xmm1, %xmm2			; AVX1-NEXT: vpsrld $16, %xmm1, %xmm1
	; AVX-NEXT: vpsraw $6, %xmm1, %xmm1			; AVX1-NEXT: vpackusdw %xmm1, %xmm1, %xmm1
	; AVX-NEXT: vpaddw %xmm2, %xmm1, %xmm1			; AVX1-NEXT: vpaddw %xmm0, %xmm1, %xmm1
	; AVX-NEXT: vpmullw {{.*}}(%rip), %xmm1, %xmm1			; AVX1-NEXT: vpsrlw $15, %xmm1, %xmm2
	; AVX-NEXT: vpsubw %xmm1, %xmm0, %xmm0			; AVX1-NEXT: vpsraw $6, %xmm1, %xmm1
	; AVX-NEXT: retq			; AVX1-NEXT: vpaddw %xmm2, %xmm1, %xmm1
				; AVX1-NEXT: vpmullw {{.*}}(%rip), %xmm1, %xmm1
				; AVX1-NEXT: vpsubw %xmm1, %xmm0, %xmm0
				; AVX1-NEXT: retq
				;
				; AVX2-LABEL: fold_srem_vec_2:
				; AVX2: # %bb.0:
				; AVX2-NEXT: vpmovsxwd %xmm0, %xmm1
				; AVX2-NEXT: vpbroadcastd {{.*#+}} xmm2 = [4294945911,4294945911,4294945911,4294945911]
				; AVX2-NEXT: vpmulld %xmm2, %xmm1, %xmm1
				; AVX2-NEXT: vpsrld $16, %xmm1, %xmm1
				; AVX2-NEXT: vpackusdw %xmm1, %xmm1, %xmm1
				; AVX2-NEXT: vpaddw %xmm0, %xmm1, %xmm1
				; AVX2-NEXT: vpsrlw $15, %xmm1, %xmm2
				; AVX2-NEXT: vpsraw $6, %xmm1, %xmm1
				; AVX2-NEXT: vpaddw %xmm2, %xmm1, %xmm1
				; AVX2-NEXT: vpmullw {{.*}}(%rip), %xmm1, %xmm1
				; AVX2-NEXT: vpsubw %xmm1, %xmm0, %xmm0
				; AVX2-NEXT: retq
	%1 = srem <4 x i16> %x, <i16 95, i16 95, i16 95, i16 95>			%1 = srem <4 x i16> %x, <i16 95, i16 95, i16 95, i16 95>
	ret <4 x i16> %1			ret <4 x i16> %1
	}			}


	; Don't fold if we can combine srem with sdiv.			; Don't fold if we can combine srem with sdiv.
	define <4 x i16> @combine_srem_sdiv(<4 x i16> %x) {			define <4 x i16> @combine_srem_sdiv(<4 x i16> %x) {
	; SSE-LABEL: combine_srem_sdiv:			; SSE-LABEL: combine_srem_sdiv:
	; SSE: # %bb.0:			; SSE: # %bb.0:
	; SSE-NEXT: movdqa {{.*#+}} xmm1 = [44151,44151,44151,44151,44151,44151,44151,44151]			; SSE-NEXT: pmovsxwd %xmm0, %xmm1
	; SSE-NEXT: pmulhw %xmm0, %xmm1			; SSE-NEXT: pmulld {{.*}}(%rip), %xmm1
				; SSE-NEXT: psrld $16, %xmm1
				; SSE-NEXT: packusdw %xmm1, %xmm1
	; SSE-NEXT: paddw %xmm0, %xmm1			; SSE-NEXT: paddw %xmm0, %xmm1
	; SSE-NEXT: movdqa %xmm1, %xmm2			; SSE-NEXT: movdqa %xmm1, %xmm2
	; SSE-NEXT: psrlw $15, %xmm2			; SSE-NEXT: psrlw $15, %xmm2
	; SSE-NEXT: psraw $6, %xmm1			; SSE-NEXT: psraw $6, %xmm1
	; SSE-NEXT: paddw %xmm2, %xmm1			; SSE-NEXT: paddw %xmm2, %xmm1
	; SSE-NEXT: movdqa {{.*#+}} xmm2 = [95,95,95,95,95,95,95,95]			; SSE-NEXT: movdqa {{.*#+}} xmm2 = <95,95,95,95,u,u,u,u>
	; SSE-NEXT: pmullw %xmm1, %xmm2			; SSE-NEXT: pmullw %xmm1, %xmm2
	; SSE-NEXT: psubw %xmm2, %xmm0			; SSE-NEXT: psubw %xmm2, %xmm0
	; SSE-NEXT: paddw %xmm1, %xmm0			; SSE-NEXT: paddw %xmm1, %xmm0
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; AVX-LABEL: combine_srem_sdiv:			; AVX1-LABEL: combine_srem_sdiv:
	; AVX: # %bb.0:			; AVX1: # %bb.0:
	; AVX-NEXT: vpmulhw {{.*}}(%rip), %xmm0, %xmm1			; AVX1-NEXT: vpmovsxwd %xmm0, %xmm1
	; AVX-NEXT: vpaddw %xmm0, %xmm1, %xmm1			; AVX1-NEXT: vpmulld {{.*}}(%rip), %xmm1, %xmm1
	; AVX-NEXT: vpsrlw $15, %xmm1, %xmm2			; AVX1-NEXT: vpsrld $16, %xmm1, %xmm1
	; AVX-NEXT: vpsraw $6, %xmm1, %xmm1			; AVX1-NEXT: vpackusdw %xmm1, %xmm1, %xmm1
	; AVX-NEXT: vpaddw %xmm2, %xmm1, %xmm1			; AVX1-NEXT: vpaddw %xmm0, %xmm1, %xmm1
	; AVX-NEXT: vpmullw {{.*}}(%rip), %xmm1, %xmm2			; AVX1-NEXT: vpsrlw $15, %xmm1, %xmm2
	; AVX-NEXT: vpsubw %xmm2, %xmm0, %xmm0			; AVX1-NEXT: vpsraw $6, %xmm1, %xmm1
	; AVX-NEXT: vpaddw %xmm1, %xmm0, %xmm0			; AVX1-NEXT: vpaddw %xmm2, %xmm1, %xmm1
	; AVX-NEXT: retq			; AVX1-NEXT: vpmullw {{.*}}(%rip), %xmm1, %xmm2
				; AVX1-NEXT: vpsubw %xmm2, %xmm0, %xmm0
				; AVX1-NEXT: vpaddw %xmm1, %xmm0, %xmm0
				; AVX1-NEXT: retq
				;
				; AVX2-LABEL: combine_srem_sdiv:
				; AVX2: # %bb.0:
				; AVX2-NEXT: vpmovsxwd %xmm0, %xmm1
				; AVX2-NEXT: vpbroadcastd {{.*#+}} xmm2 = [4294945911,4294945911,4294945911,4294945911]
				; AVX2-NEXT: vpmulld %xmm2, %xmm1, %xmm1
				; AVX2-NEXT: vpsrld $16, %xmm1, %xmm1
				; AVX2-NEXT: vpackusdw %xmm1, %xmm1, %xmm1
				; AVX2-NEXT: vpaddw %xmm0, %xmm1, %xmm1
				; AVX2-NEXT: vpsrlw $15, %xmm1, %xmm2
				; AVX2-NEXT: vpsraw $6, %xmm1, %xmm1
				; AVX2-NEXT: vpaddw %xmm2, %xmm1, %xmm1
				; AVX2-NEXT: vpmullw {{.*}}(%rip), %xmm1, %xmm2
				; AVX2-NEXT: vpsubw %xmm2, %xmm0, %xmm0
				; AVX2-NEXT: vpaddw %xmm1, %xmm0, %xmm0
				; AVX2-NEXT: retq
	%1 = srem <4 x i16> %x, <i16 95, i16 95, i16 95, i16 95>			%1 = srem <4 x i16> %x, <i16 95, i16 95, i16 95, i16 95>
	%2 = sdiv <4 x i16> %x, <i16 95, i16 95, i16 95, i16 95>			%2 = sdiv <4 x i16> %x, <i16 95, i16 95, i16 95, i16 95>
	%3 = add <4 x i16> %1, %2			%3 = add <4 x i16> %1, %2
	ret <4 x i16> %3			ret <4 x i16> %3
	}			}

	; Don't fold for divisors that are a power of two.			; Don't fold for divisors that are a power of two.
	define <4 x i16> @dont_fold_srem_power_of_two(<4 x i16> %x) {			define <4 x i16> @dont_fold_srem_power_of_two(<4 x i16> %x) {
	; SSE-LABEL: dont_fold_srem_power_of_two:			; SSE-LABEL: dont_fold_srem_power_of_two:
	; SSE: # %bb.0:			; SSE: # %bb.0:
	; SSE-NEXT: pextrw $1, %xmm0, %eax			; SSE-NEXT: pmovsxwd %xmm0, %xmm1
	; SSE-NEXT: leal 31(%rax), %ecx			; SSE-NEXT: pmulld {{.*}}(%rip), %xmm1
	; SSE-NEXT: testw %ax, %ax			; SSE-NEXT: psrld $16, %xmm1
	; SSE-NEXT: cmovnsl %eax, %ecx			; SSE-NEXT: packusdw %xmm1, %xmm1
	; SSE-NEXT: andl $-32, %ecx			; SSE-NEXT: paddw %xmm0, %xmm1
	; SSE-NEXT: subl %ecx, %eax			; SSE-NEXT: movdqa %xmm1, %xmm2
	; SSE-NEXT: movd %xmm0, %ecx			; SSE-NEXT: psrlw $15, %xmm2
	; SSE-NEXT: leal 63(%rcx), %edx			; SSE-NEXT: pmulhw {{.*}}(%rip), %xmm1
	; SSE-NEXT: testw %cx, %cx			; SSE-NEXT: paddw %xmm2, %xmm1
	; SSE-NEXT: cmovnsl %ecx, %edx			; SSE-NEXT: pmullw {{.*}}(%rip), %xmm1
	; SSE-NEXT: andl $-64, %edx			; SSE-NEXT: psubw %xmm1, %xmm0
	; SSE-NEXT: subl %edx, %ecx
	; SSE-NEXT: movd %ecx, %xmm1
	; SSE-NEXT: pinsrw $1, %eax, %xmm1
	; SSE-NEXT: pextrw $2, %xmm0, %eax
	; SSE-NEXT: leal 7(%rax), %ecx
	; SSE-NEXT: testw %ax, %ax
	; SSE-NEXT: cmovnsl %eax, %ecx
	; SSE-NEXT: andl $-8, %ecx
	; SSE-NEXT: subl %ecx, %eax
	; SSE-NEXT: pinsrw $2, %eax, %xmm1
	; SSE-NEXT: pextrw $3, %xmm0, %eax
	; SSE-NEXT: movswl %ax, %ecx
	; SSE-NEXT: imull $-21385, %ecx, %ecx # imm = 0xAC77
	; SSE-NEXT: shrl $16, %ecx
	; SSE-NEXT: addl %eax, %ecx
	; SSE-NEXT: movzwl %cx, %ecx
	; SSE-NEXT: movswl %cx, %edx
	; SSE-NEXT: shrl $15, %ecx
	; SSE-NEXT: sarl $6, %edx
	; SSE-NEXT: addl %ecx, %edx
	; SSE-NEXT: imull $95, %edx, %ecx
	; SSE-NEXT: subl %ecx, %eax
	; SSE-NEXT: pinsrw $3, %eax, %xmm1
	; SSE-NEXT: movdqa %xmm1, %xmm0
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; AVX-LABEL: dont_fold_srem_power_of_two:			; AVX-LABEL: dont_fold_srem_power_of_two:
	; AVX: # %bb.0:			; AVX: # %bb.0:
	; AVX-NEXT: vpextrw $1, %xmm0, %eax			; AVX-NEXT: vpmovsxwd %xmm0, %xmm1
	; AVX-NEXT: leal 31(%rax), %ecx			; AVX-NEXT: vpmulld {{.*}}(%rip), %xmm1, %xmm1
	; AVX-NEXT: testw %ax, %ax			; AVX-NEXT: vpsrld $16, %xmm1, %xmm1
	; AVX-NEXT: cmovnsl %eax, %ecx			; AVX-NEXT: vpackusdw %xmm1, %xmm1, %xmm1
	; AVX-NEXT: andl $-32, %ecx			; AVX-NEXT: vpaddw %xmm0, %xmm1, %xmm1
	; AVX-NEXT: subl %ecx, %eax			; AVX-NEXT: vpsrlw $15, %xmm1, %xmm2
	; AVX-NEXT: vmovd %xmm0, %ecx			; AVX-NEXT: vpmulhw {{.*}}(%rip), %xmm1, %xmm1
	; AVX-NEXT: leal 63(%rcx), %edx			; AVX-NEXT: vpaddw %xmm2, %xmm1, %xmm1
	; AVX-NEXT: testw %cx, %cx			; AVX-NEXT: vpmullw {{.*}}(%rip), %xmm1, %xmm1
	; AVX-NEXT: cmovnsl %ecx, %edx			; AVX-NEXT: vpsubw %xmm1, %xmm0, %xmm0
	; AVX-NEXT: andl $-64, %edx
	; AVX-NEXT: subl %edx, %ecx
	; AVX-NEXT: vmovd %ecx, %xmm1
	; AVX-NEXT: vpinsrw $1, %eax, %xmm1, %xmm1
	; AVX-NEXT: vpextrw $2, %xmm0, %eax
	; AVX-NEXT: leal 7(%rax), %ecx
	; AVX-NEXT: testw %ax, %ax
	; AVX-NEXT: cmovnsl %eax, %ecx
	; AVX-NEXT: andl $-8, %ecx
	; AVX-NEXT: subl %ecx, %eax
	; AVX-NEXT: vpinsrw $2, %eax, %xmm1, %xmm1
	; AVX-NEXT: vpextrw $3, %xmm0, %eax
	; AVX-NEXT: movswl %ax, %ecx
	; AVX-NEXT: imull $-21385, %ecx, %ecx # imm = 0xAC77
	; AVX-NEXT: shrl $16, %ecx
	; AVX-NEXT: addl %eax, %ecx
	; AVX-NEXT: movzwl %cx, %ecx
	; AVX-NEXT: movswl %cx, %edx
	; AVX-NEXT: shrl $15, %ecx
	; AVX-NEXT: sarl $6, %edx
	; AVX-NEXT: addl %ecx, %edx
	; AVX-NEXT: imull $95, %edx, %ecx
	; AVX-NEXT: subl %ecx, %eax
	; AVX-NEXT: vpinsrw $3, %eax, %xmm1, %xmm0
	; AVX-NEXT: retq			; AVX-NEXT: retq
	%1 = srem <4 x i16> %x, <i16 64, i16 32, i16 8, i16 95>			%1 = srem <4 x i16> %x, <i16 64, i16 32, i16 8, i16 95>
	ret <4 x i16> %1			ret <4 x i16> %1
	}			}

	; Don't fold if the divisor is one.			; Don't fold if the divisor is one.
	define <4 x i16> @dont_fold_srem_one(<4 x i16> %x) {			define <4 x i16> @dont_fold_srem_one(<4 x i16> %x) {
	; SSE-LABEL: dont_fold_srem_one:			; SSE-LABEL: dont_fold_srem_one:
	; SSE: # %bb.0:			; SSE: # %bb.0:
	; SSE-NEXT: pextrw $2, %xmm0, %eax
	; SSE-NEXT: movswl %ax, %ecx
	; SSE-NEXT: imull $-19945, %ecx, %ecx # imm = 0xB217
	; SSE-NEXT: shrl $16, %ecx
	; SSE-NEXT: addl %eax, %ecx
	; SSE-NEXT: movzwl %cx, %ecx
	; SSE-NEXT: movswl %cx, %edx
	; SSE-NEXT: shrl $15, %ecx
	; SSE-NEXT: sarl $4, %edx
	; SSE-NEXT: addl %ecx, %edx
	; SSE-NEXT: leal (%rdx,%rdx,2), %ecx
	; SSE-NEXT: shll $3, %ecx
	; SSE-NEXT: subl %ecx, %edx
	; SSE-NEXT: addl %eax, %edx
	; SSE-NEXT: pextrw $1, %xmm0, %eax
	; SSE-NEXT: movswl %ax, %ecx
	; SSE-NEXT: imull $12827, %ecx, %ecx # imm = 0x321B
	; SSE-NEXT: movl %ecx, %esi
	; SSE-NEXT: shrl $31, %esi
	; SSE-NEXT: sarl $23, %ecx
	; SSE-NEXT: addl %esi, %ecx
	; SSE-NEXT: imull $654, %ecx, %ecx # imm = 0x28E
	; SSE-NEXT: subl %ecx, %eax
	; SSE-NEXT: pxor %xmm1, %xmm1			; SSE-NEXT: pxor %xmm1, %xmm1
	; SSE-NEXT: pinsrw $1, %eax, %xmm1			; SSE-NEXT: pxor %xmm2, %xmm2
	; SSE-NEXT: pinsrw $2, %edx, %xmm1			; SSE-NEXT: pblendw {{.*#+}} xmm2 = xmm0[0],xmm2[1],xmm0[2],xmm2[3,4,5,6,7]
	; SSE-NEXT: pextrw $3, %xmm0, %eax			; SSE-NEXT: pmovsxwd %xmm0, %xmm3
	; SSE-NEXT: movswl %ax, %ecx			; SSE-NEXT: pmulld {{.*}}(%rip), %xmm3
	; SSE-NEXT: imull $12375, %ecx, %ecx # imm = 0x3057			; SSE-NEXT: psrld $16, %xmm3
	; SSE-NEXT: movl %ecx, %edx			; SSE-NEXT: packusdw %xmm3, %xmm3
	; SSE-NEXT: shrl $31, %edx			; SSE-NEXT: paddw %xmm2, %xmm3
	; SSE-NEXT: sarl $26, %ecx			; SSE-NEXT: movdqa {{.*#+}} xmm2 = <u,512,4096,64,u,u,u,u>
	; SSE-NEXT: addl %edx, %ecx			; SSE-NEXT: pmulhw %xmm3, %xmm2
	; SSE-NEXT: imull $5423, %ecx, %ecx # imm = 0x152F			; SSE-NEXT: pblendw {{.*#+}} xmm2 = xmm3[0],xmm2[1,2,3,4,5,6,7]
	; SSE-NEXT: subl %ecx, %eax			; SSE-NEXT: psrlw $15, %xmm3
	; SSE-NEXT: pinsrw $3, %eax, %xmm1			; SSE-NEXT: pblendw {{.*#+}} xmm3 = xmm1[0],xmm3[1,2,3],xmm1[4,5,6,7]
	; SSE-NEXT: movdqa %xmm1, %xmm0			; SSE-NEXT: paddw %xmm2, %xmm3
				; SSE-NEXT: pmullw {{.*}}(%rip), %xmm3
				; SSE-NEXT: psubw %xmm3, %xmm0
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; AVX-LABEL: dont_fold_srem_one:			; AVX-LABEL: dont_fold_srem_one:
	; AVX: # %bb.0:			; AVX: # %bb.0:
	; AVX-NEXT: vpextrw $2, %xmm0, %eax
	; AVX-NEXT: movswl %ax, %ecx
	; AVX-NEXT: imull $-19945, %ecx, %ecx # imm = 0xB217
	; AVX-NEXT: shrl $16, %ecx
	; AVX-NEXT: addl %eax, %ecx
	; AVX-NEXT: movzwl %cx, %ecx
	; AVX-NEXT: movswl %cx, %edx
	; AVX-NEXT: shrl $15, %ecx
	; AVX-NEXT: sarl $4, %edx
	; AVX-NEXT: addl %ecx, %edx
	; AVX-NEXT: leal (%rdx,%rdx,2), %ecx
	; AVX-NEXT: shll $3, %ecx
	; AVX-NEXT: subl %ecx, %edx
	; AVX-NEXT: addl %eax, %edx
	; AVX-NEXT: vpextrw $1, %xmm0, %eax
	; AVX-NEXT: movswl %ax, %ecx
	; AVX-NEXT: imull $12827, %ecx, %ecx # imm = 0x321B
	; AVX-NEXT: movl %ecx, %esi
	; AVX-NEXT: shrl $31, %esi
	; AVX-NEXT: sarl $23, %ecx
	; AVX-NEXT: addl %esi, %ecx
	; AVX-NEXT: imull $654, %ecx, %ecx # imm = 0x28E
	; AVX-NEXT: subl %ecx, %eax
	; AVX-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX-NEXT: vpinsrw $1, %eax, %xmm1, %xmm1			; AVX-NEXT: vpblendw {{.*#+}} xmm2 = xmm0[0],xmm1[1],xmm0[2],xmm1[3,4,5,6,7]
	; AVX-NEXT: vpinsrw $2, %edx, %xmm1, %xmm1			; AVX-NEXT: vpmovsxwd %xmm0, %xmm3
	; AVX-NEXT: vpextrw $3, %xmm0, %eax			; AVX-NEXT: vpmulld {{.*}}(%rip), %xmm3, %xmm3
	; AVX-NEXT: movswl %ax, %ecx			; AVX-NEXT: vpsrld $16, %xmm3, %xmm3
	; AVX-NEXT: imull $12375, %ecx, %ecx # imm = 0x3057			; AVX-NEXT: vpackusdw %xmm3, %xmm3, %xmm3
	; AVX-NEXT: movl %ecx, %edx			; AVX-NEXT: vpaddw %xmm2, %xmm3, %xmm2
	; AVX-NEXT: shrl $31, %edx			; AVX-NEXT: vpmulhw {{.*}}(%rip), %xmm2, %xmm3
	; AVX-NEXT: sarl $26, %ecx			; AVX-NEXT: vpblendw {{.*#+}} xmm3 = xmm2[0],xmm3[1,2,3,4,5,6,7]
	; AVX-NEXT: addl %edx, %ecx			; AVX-NEXT: vpsrlw $15, %xmm2, %xmm2
	; AVX-NEXT: imull $5423, %ecx, %ecx # imm = 0x152F			; AVX-NEXT: vpblendw {{.*#+}} xmm1 = xmm1[0],xmm2[1,2,3],xmm1[4,5,6,7]
	; AVX-NEXT: subl %ecx, %eax			; AVX-NEXT: vpaddw %xmm1, %xmm3, %xmm1
	; AVX-NEXT: vpinsrw $3, %eax, %xmm1, %xmm0			; AVX-NEXT: vpmullw {{.*}}(%rip), %xmm1, %xmm1
				; AVX-NEXT: vpsubw %xmm1, %xmm0, %xmm0
	; AVX-NEXT: retq			; AVX-NEXT: retq
	%1 = srem <4 x i16> %x, <i16 1, i16 654, i16 23, i16 5423>			%1 = srem <4 x i16> %x, <i16 1, i16 654, i16 23, i16 5423>
	ret <4 x i16> %1			ret <4 x i16> %1
	}			}

	; Don't fold if the divisor is 2^15.			; Don't fold if the divisor is 2^15.
	define <4 x i16> @dont_fold_urem_i16_smax(<4 x i16> %x) {			define <4 x i16> @dont_fold_urem_i16_smax(<4 x i16> %x) {
	; SSE-LABEL: dont_fold_urem_i16_smax:			; SSE-LABEL: dont_fold_urem_i16_smax:
	; SSE: # %bb.0:			; SSE: # %bb.0:
	; SSE-NEXT: pextrw $2, %xmm0, %eax			; SSE-NEXT: pmovsxwd %xmm0, %xmm1
	; SSE-NEXT: movswl %ax, %ecx			; SSE-NEXT: pmulld {{.*}}(%rip), %xmm1
	; SSE-NEXT: imull $-19945, %ecx, %ecx # imm = 0xB217			; SSE-NEXT: psrld $16, %xmm1
	; SSE-NEXT: shrl $16, %ecx			; SSE-NEXT: packusdw %xmm1, %xmm1
	; SSE-NEXT: addl %eax, %ecx			; SSE-NEXT: movdqa {{.*#+}} xmm2 = <1,65535,1,0,u,u,u,u>
	; SSE-NEXT: movzwl %cx, %ecx			; SSE-NEXT: pmullw %xmm0, %xmm2
	; SSE-NEXT: movswl %cx, %edx			; SSE-NEXT: paddw %xmm1, %xmm2
	; SSE-NEXT: shrl $15, %ecx			; SSE-NEXT: movdqa {{.*#+}} xmm1 = <u,4,4096,64,u,u,u,u>
	; SSE-NEXT: sarl $4, %edx			; SSE-NEXT: pmulhw %xmm2, %xmm1
	; SSE-NEXT: addl %ecx, %edx			; SSE-NEXT: pblendw {{.*#+}} xmm1 = xmm2[0],xmm1[1,2,3,4,5,6,7]
	; SSE-NEXT: leal (%rdx,%rdx,2), %ecx			; SSE-NEXT: psrlw $15, %xmm2
	; SSE-NEXT: shll $3, %ecx			; SSE-NEXT: pxor %xmm3, %xmm3
	; SSE-NEXT: subl %ecx, %edx			; SSE-NEXT: pblendw {{.*#+}} xmm3 = xmm3[0],xmm2[1,2,3],xmm3[4,5,6,7]
	; SSE-NEXT: addl %eax, %edx			; SSE-NEXT: paddw %xmm1, %xmm3
	; SSE-NEXT: pextrw $1, %xmm0, %eax			; SSE-NEXT: pmullw {{.*}}(%rip), %xmm3
	; SSE-NEXT: leal 32767(%rax), %ecx			; SSE-NEXT: psubw %xmm3, %xmm0
	; SSE-NEXT: testw %ax, %ax
	; SSE-NEXT: cmovnsl %eax, %ecx
	; SSE-NEXT: andl $-32768, %ecx # imm = 0x8000
	; SSE-NEXT: addl %eax, %ecx
	; SSE-NEXT: pxor %xmm1, %xmm1
	; SSE-NEXT: pinsrw $1, %ecx, %xmm1
	; SSE-NEXT: pinsrw $2, %edx, %xmm1
	; SSE-NEXT: pextrw $3, %xmm0, %eax
	; SSE-NEXT: movswl %ax, %ecx
	; SSE-NEXT: imull $12375, %ecx, %ecx # imm = 0x3057
	; SSE-NEXT: movl %ecx, %edx
	; SSE-NEXT: shrl $31, %edx
	; SSE-NEXT: sarl $26, %ecx
	; SSE-NEXT: addl %edx, %ecx
	; SSE-NEXT: imull $5423, %ecx, %ecx # imm = 0x152F
	; SSE-NEXT: subl %ecx, %eax
	; SSE-NEXT: pinsrw $3, %eax, %xmm1
	; SSE-NEXT: movdqa %xmm1, %xmm0
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; AVX-LABEL: dont_fold_urem_i16_smax:			; AVX-LABEL: dont_fold_urem_i16_smax:
	; AVX: # %bb.0:			; AVX: # %bb.0:
	; AVX-NEXT: vpextrw $2, %xmm0, %eax			; AVX-NEXT: vpmovsxwd %xmm0, %xmm1
	; AVX-NEXT: movswl %ax, %ecx			; AVX-NEXT: vpmulld {{.*}}(%rip), %xmm1, %xmm1
	; AVX-NEXT: imull $-19945, %ecx, %ecx # imm = 0xB217			; AVX-NEXT: vpsrld $16, %xmm1, %xmm1
	; AVX-NEXT: shrl $16, %ecx			; AVX-NEXT: vpackusdw %xmm1, %xmm1, %xmm1
	; AVX-NEXT: addl %eax, %ecx			; AVX-NEXT: vpmullw {{.*}}(%rip), %xmm0, %xmm2
	; AVX-NEXT: movzwl %cx, %ecx			; AVX-NEXT: vpaddw %xmm2, %xmm1, %xmm1
	; AVX-NEXT: movswl %cx, %edx			; AVX-NEXT: vpmulhw {{.*}}(%rip), %xmm1, %xmm2
	; AVX-NEXT: shrl $15, %ecx			; AVX-NEXT: vpblendw {{.*#+}} xmm2 = xmm1[0],xmm2[1,2,3,4,5,6,7]
	; AVX-NEXT: sarl $4, %edx			; AVX-NEXT: vpsrlw $15, %xmm1, %xmm1
	; AVX-NEXT: addl %ecx, %edx			; AVX-NEXT: vpxor %xmm3, %xmm3, %xmm3
	; AVX-NEXT: leal (%rdx,%rdx,2), %ecx			; AVX-NEXT: vpblendw {{.*#+}} xmm1 = xmm3[0],xmm1[1,2,3],xmm3[4,5,6,7]
	; AVX-NEXT: shll $3, %ecx			; AVX-NEXT: vpaddw %xmm1, %xmm2, %xmm1
	; AVX-NEXT: subl %ecx, %edx			; AVX-NEXT: vpmullw {{.*}}(%rip), %xmm1, %xmm1
	; AVX-NEXT: addl %eax, %edx			; AVX-NEXT: vpsubw %xmm1, %xmm0, %xmm0
	; AVX-NEXT: vpextrw $1, %xmm0, %eax
	; AVX-NEXT: leal 32767(%rax), %ecx
	; AVX-NEXT: testw %ax, %ax
	; AVX-NEXT: cmovnsl %eax, %ecx
	; AVX-NEXT: andl $-32768, %ecx # imm = 0x8000
	; AVX-NEXT: addl %eax, %ecx
	; AVX-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX-NEXT: vpinsrw $1, %ecx, %xmm1, %xmm1
	; AVX-NEXT: vpinsrw $2, %edx, %xmm1, %xmm1
	; AVX-NEXT: vpextrw $3, %xmm0, %eax
	; AVX-NEXT: movswl %ax, %ecx
	; AVX-NEXT: imull $12375, %ecx, %ecx # imm = 0x3057
	; AVX-NEXT: movl %ecx, %edx
	; AVX-NEXT: shrl $31, %edx
	; AVX-NEXT: sarl $26, %ecx
	; AVX-NEXT: addl %edx, %ecx
	; AVX-NEXT: imull $5423, %ecx, %ecx # imm = 0x152F
	; AVX-NEXT: subl %ecx, %eax
	; AVX-NEXT: vpinsrw $3, %eax, %xmm1, %xmm0
	; AVX-NEXT: retq			; AVX-NEXT: retq
	%1 = srem <4 x i16> %x, <i16 1, i16 32768, i16 23, i16 5423>			%1 = srem <4 x i16> %x, <i16 1, i16 32768, i16 23, i16 5423>
	ret <4 x i16> %1			ret <4 x i16> %1
	}			}

	; Don't fold i64 srem.			; Don't fold i64 srem.
	define <4 x i64> @dont_fold_srem_i64(<4 x i64> %x) {			define <4 x i64> @dont_fold_srem_i64(<4 x i64> %x) {
	; SSE-LABEL: dont_fold_srem_i64:			; SSE-LABEL: dont_fold_srem_i64:
	; SSE: # %bb.0:			; SSE: # %bb.0:
	; SSE-NEXT: movdqa %xmm1, %xmm2			; SSE-NEXT: pextrq $1, %xmm1, %rax
	; SSE-NEXT: movq %xmm1, %rcx			; SSE-NEXT: movabsq $6966426675817289639, %rcx # imm = 0x60ADB826E5E517A7
	; SSE-NEXT: movabsq $-5614226457215950491, %rdx # imm = 0xB21642C8590B2165			; SSE-NEXT: imulq %rcx
	; SSE-NEXT: movq %rcx, %rax			; SSE-NEXT: movq %rdx, %xmm2
	; SSE-NEXT: imulq %rdx			; SSE-NEXT: movq %xmm1, %rax
	; SSE-NEXT: addq %rcx, %rdx			; SSE-NEXT: movabsq $-5614226457215950491, %rcx # imm = 0xB21642C8590B2165
	; SSE-NEXT: movq %rdx, %rax			; SSE-NEXT: imulq %rcx
	; SSE-NEXT: shrq $63, %rax			; SSE-NEXT: movq %rdx, %xmm3
	; SSE-NEXT: sarq $4, %rdx			; SSE-NEXT: punpcklqdq {{.*#+}} xmm3 = xmm3[0],xmm2[0]
	; SSE-NEXT: addq %rax, %rdx			; SSE-NEXT: movq {{.*#+}} xmm2 = xmm1[0],zero
	; SSE-NEXT: leaq (%rdx,%rdx,2), %rax			; SSE-NEXT: paddq %xmm3, %xmm2
	; SSE-NEXT: shlq $3, %rax			; SSE-NEXT: movdqa %xmm2, %xmm3
	; SSE-NEXT: subq %rax, %rdx			; SSE-NEXT: psrlq $11, %xmm3
	; SSE-NEXT: addq %rcx, %rdx			; SSE-NEXT: movdqa %xmm2, %xmm4
	; SSE-NEXT: movq %rdx, %xmm1			; SSE-NEXT: psrlq $4, %xmm4
	; SSE-NEXT: pextrq $1, %xmm2, %rcx			; SSE-NEXT: pblendw {{.*#+}} xmm4 = xmm4[0,1,2,3],xmm3[4,5,6,7]
	; SSE-NEXT: movabsq $6966426675817289639, %rdx # imm = 0x60ADB826E5E517A7			; SSE-NEXT: movdqa {{.*#+}} xmm3 = [576460752303423488,4503599627370496]
	; SSE-NEXT: movq %rcx, %rax			; SSE-NEXT: pxor %xmm3, %xmm4
	; SSE-NEXT: imulq %rdx			; SSE-NEXT: psrlq $63, %xmm2
	; SSE-NEXT: movq %rdx, %rax			; SSE-NEXT: paddq %xmm4, %xmm2
	; SSE-NEXT: shrq $63, %rax			; SSE-NEXT: psubq %xmm3, %xmm2
	; SSE-NEXT: sarq $11, %rdx			; SSE-NEXT: movdqa {{.*#+}} xmm3 = [23,5423]
	; SSE-NEXT: addq %rax, %rdx			; SSE-NEXT: movdqa %xmm2, %xmm4
	; SSE-NEXT: imulq $5423, %rdx, %rax # imm = 0x152F			; SSE-NEXT: pmuludq %xmm3, %xmm4
	; SSE-NEXT: subq %rax, %rcx			; SSE-NEXT: psrlq $32, %xmm2
	; SSE-NEXT: movq %rcx, %xmm2			; SSE-NEXT: pmuludq %xmm3, %xmm2
	; SSE-NEXT: punpcklqdq {{.*#+}} xmm1 = xmm1[0],xmm2[0]			; SSE-NEXT: psllq $32, %xmm2
	; SSE-NEXT: pextrq $1, %xmm0, %rcx			; SSE-NEXT: paddq %xmm4, %xmm2
	; SSE-NEXT: movabsq $7220743857598845893, %rdx # imm = 0x64353C48064353C5			; SSE-NEXT: psubq %xmm2, %xmm1
	; SSE-NEXT: movq %rcx, %rax			; SSE-NEXT: pextrq $1, %xmm0, %rax
	; SSE-NEXT: imulq %rdx			; SSE-NEXT: movabsq $7220743857598845893, %rcx # imm = 0x64353C48064353C5
	; SSE-NEXT: movq %rdx, %rax			; SSE-NEXT: imulq %rcx
	; SSE-NEXT: shrq $63, %rax			; SSE-NEXT: movq %rdx, %xmm2
	; SSE-NEXT: sarq $8, %rdx			; SSE-NEXT: pslldq {{.*#+}} xmm2 = zero,zero,zero,zero,zero,zero,zero,zero,xmm2[0,1,2,3,4,5,6,7]
	; SSE-NEXT: addq %rax, %rdx			; SSE-NEXT: movq {{.*#+}} xmm3 = xmm0[0],zero
	; SSE-NEXT: imulq $654, %rdx, %rax # imm = 0x28E			; SSE-NEXT: paddq %xmm2, %xmm3
	; SSE-NEXT: subq %rax, %rcx			; SSE-NEXT: movdqa %xmm3, %xmm2
	; SSE-NEXT: movq %rcx, %xmm0			; SSE-NEXT: psrlq $8, %xmm2
	; SSE-NEXT: pslldq {{.*#+}} xmm0 = zero,zero,zero,zero,zero,zero,zero,zero,xmm0[0,1,2,3,4,5,6,7]			; SSE-NEXT: pblendw {{.*#+}} xmm2 = xmm3[0,1,2,3],xmm2[4,5,6,7]
				; SSE-NEXT: movdqa {{.*#+}} xmm4 = [9223372036854775808,36028797018963968]
				; SSE-NEXT: pxor %xmm4, %xmm2
				; SSE-NEXT: psrlq $63, %xmm3
				; SSE-NEXT: pxor %xmm5, %xmm5
				; SSE-NEXT: pblendw {{.*#+}} xmm5 = xmm5[0,1,2,3],xmm3[4,5,6,7]
				; SSE-NEXT: paddq %xmm2, %xmm5
				; SSE-NEXT: psubq %xmm4, %xmm5
				; SSE-NEXT: movdqa {{.*#+}} xmm2 = [1,654]
				; SSE-NEXT: movdqa %xmm5, %xmm3
				; SSE-NEXT: pmuludq %xmm2, %xmm3
				; SSE-NEXT: psrlq $32, %xmm5
				; SSE-NEXT: pmuludq %xmm2, %xmm5
				; SSE-NEXT: psllq $32, %xmm5
				; SSE-NEXT: paddq %xmm3, %xmm5
				; SSE-NEXT: psubq %xmm5, %xmm0
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; AVX1-LABEL: dont_fold_srem_i64:			; AVX1-LABEL: dont_fold_srem_i64:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1
	; AVX1-NEXT: vmovq %xmm1, %rcx			; AVX1-NEXT: vpextrq $1, %xmm1, %rax
	; AVX1-NEXT: movabsq $-5614226457215950491, %rdx # imm = 0xB21642C8590B2165			; AVX1-NEXT: movabsq $6966426675817289639, %rcx # imm = 0x60ADB826E5E517A7
	; AVX1-NEXT: movq %rcx, %rax			; AVX1-NEXT: imulq %rcx
	; AVX1-NEXT: imulq %rdx			; AVX1-NEXT: vmovq %rdx, %xmm2
	; AVX1-NEXT: addq %rcx, %rdx			; AVX1-NEXT: vmovq %xmm1, %rax
	; AVX1-NEXT: movq %rdx, %rax			; AVX1-NEXT: movabsq $-5614226457215950491, %rcx # imm = 0xB21642C8590B2165
	; AVX1-NEXT: shrq $63, %rax			; AVX1-NEXT: imulq %rcx
	; AVX1-NEXT: sarq $4, %rdx			; AVX1-NEXT: vmovq %rdx, %xmm3
	; AVX1-NEXT: addq %rax, %rdx			; AVX1-NEXT: vpunpcklqdq {{.*#+}} xmm2 = xmm3[0],xmm2[0]
	; AVX1-NEXT: leaq (%rdx,%rdx,2), %rax			; AVX1-NEXT: vpxor %xmm3, %xmm3, %xmm3
	; AVX1-NEXT: shlq $3, %rax			; AVX1-NEXT: vblendps {{.*#+}} ymm3 = ymm0[0,1],ymm3[2,3],ymm0[4,5],ymm3[6,7]
	; AVX1-NEXT: subq %rax, %rdx			; AVX1-NEXT: vextractf128 $1, %ymm3, %xmm4
	; AVX1-NEXT: addq %rcx, %rdx			; AVX1-NEXT: vpaddq %xmm4, %xmm2, %xmm2
				; AVX1-NEXT: vpsrlq $11, %xmm2, %xmm4
				; AVX1-NEXT: vpsrlq $4, %xmm2, %xmm5
				; AVX1-NEXT: vpblendw {{.*#+}} xmm4 = xmm5[0,1,2,3],xmm4[4,5,6,7]
				; AVX1-NEXT: vmovdqa {{.*#+}} xmm5 = [576460752303423488,4503599627370496]
				; AVX1-NEXT: vpxor %xmm5, %xmm4, %xmm4
				; AVX1-NEXT: vpsrlq $63, %xmm2, %xmm2
				; AVX1-NEXT: vpaddq %xmm2, %xmm4, %xmm2
				; AVX1-NEXT: vpsubq %xmm5, %xmm2, %xmm2
				; AVX1-NEXT: vmovdqa {{.*#+}} xmm4 = [23,5423]
				; AVX1-NEXT: vpmuludq %xmm4, %xmm2, %xmm5
				; AVX1-NEXT: vpsrlq $32, %xmm2, %xmm2
				; AVX1-NEXT: vpmuludq %xmm4, %xmm2, %xmm2
				; AVX1-NEXT: vpsllq $32, %xmm2, %xmm2
				; AVX1-NEXT: vpaddq %xmm2, %xmm5, %xmm2
				; AVX1-NEXT: vpsubq %xmm2, %xmm1, %xmm1
				; AVX1-NEXT: vpextrq $1, %xmm0, %rax
				; AVX1-NEXT: movabsq $7220743857598845893, %rcx # imm = 0x64353C48064353C5
				; AVX1-NEXT: imulq %rcx
	; AVX1-NEXT: vmovq %rdx, %xmm2			; AVX1-NEXT: vmovq %rdx, %xmm2
	; AVX1-NEXT: vpextrq $1, %xmm1, %rcx			; AVX1-NEXT: vpslldq {{.*#+}} xmm2 = zero,zero,zero,zero,zero,zero,zero,zero,xmm2[0,1,2,3,4,5,6,7]
	; AVX1-NEXT: movabsq $6966426675817289639, %rdx # imm = 0x60ADB826E5E517A7			; AVX1-NEXT: vpaddq %xmm3, %xmm2, %xmm2
	; AVX1-NEXT: movq %rcx, %rax			; AVX1-NEXT: vpsrlq $8, %xmm2, %xmm3
	; AVX1-NEXT: imulq %rdx			; AVX1-NEXT: vpblendw {{.*#+}} xmm3 = xmm2[0,1,2,3],xmm3[4,5,6,7]
	; AVX1-NEXT: movq %rdx, %rax			; AVX1-NEXT: vmovdqa {{.*#+}} xmm4 = [9223372036854775808,36028797018963968]
	; AVX1-NEXT: shrq $63, %rax			; AVX1-NEXT: vpxor %xmm4, %xmm3, %xmm3
	; AVX1-NEXT: sarq $11, %rdx			; AVX1-NEXT: vpsrlq $63, %xmm2, %xmm2
	; AVX1-NEXT: addq %rax, %rdx			; AVX1-NEXT: vpxor %xmm5, %xmm5, %xmm5
	; AVX1-NEXT: imulq $5423, %rdx, %rax # imm = 0x152F			; AVX1-NEXT: vpblendw {{.*#+}} xmm2 = xmm5[0,1,2,3],xmm2[4,5,6,7]
	; AVX1-NEXT: subq %rax, %rcx			; AVX1-NEXT: vpaddq %xmm2, %xmm3, %xmm2
	; AVX1-NEXT: vmovq %rcx, %xmm1			; AVX1-NEXT: vpsubq %xmm4, %xmm2, %xmm2
	; AVX1-NEXT: vpunpcklqdq {{.*#+}} xmm1 = xmm2[0],xmm1[0]			; AVX1-NEXT: vmovdqa {{.*#+}} xmm3 = [1,654]
	; AVX1-NEXT: vpextrq $1, %xmm0, %rcx			; AVX1-NEXT: vpmuludq %xmm3, %xmm2, %xmm4
	; AVX1-NEXT: movabsq $7220743857598845893, %rdx # imm = 0x64353C48064353C5			; AVX1-NEXT: vpsrlq $32, %xmm2, %xmm2
	; AVX1-NEXT: movq %rcx, %rax			; AVX1-NEXT: vpmuludq %xmm3, %xmm2, %xmm2
	; AVX1-NEXT: imulq %rdx			; AVX1-NEXT: vpsllq $32, %xmm2, %xmm2
	; AVX1-NEXT: movq %rdx, %rax			; AVX1-NEXT: vpaddq %xmm2, %xmm4, %xmm2
	; AVX1-NEXT: shrq $63, %rax			; AVX1-NEXT: vpsubq %xmm2, %xmm0, %xmm0
	; AVX1-NEXT: sarq $8, %rdx
	; AVX1-NEXT: addq %rax, %rdx
	; AVX1-NEXT: imulq $654, %rdx, %rax # imm = 0x28E
	; AVX1-NEXT: subq %rax, %rcx
	; AVX1-NEXT: vmovq %rcx, %xmm0
	; AVX1-NEXT: vpslldq {{.*#+}} xmm0 = zero,zero,zero,zero,zero,zero,zero,zero,xmm0[0,1,2,3,4,5,6,7]
	; AVX1-NEXT: vinsertf128 $1, %xmm1, %ymm0, %ymm0			; AVX1-NEXT: vinsertf128 $1, %xmm1, %ymm0, %ymm0
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: dont_fold_srem_i64:			; AVX2-LABEL: dont_fold_srem_i64:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1
	; AVX2-NEXT: vmovq %xmm1, %rcx			; AVX2-NEXT: vpextrq $1, %xmm1, %rax
	; AVX2-NEXT: movabsq $-5614226457215950491, %rdx # imm = 0xB21642C8590B2165			; AVX2-NEXT: movabsq $6966426675817289639, %rcx # imm = 0x60ADB826E5E517A7
	; AVX2-NEXT: movq %rcx, %rax			; AVX2-NEXT: imulq %rcx
	; AVX2-NEXT: imulq %rdx			; AVX2-NEXT: vmovq %rdx, %xmm2
	; AVX2-NEXT: addq %rcx, %rdx			; AVX2-NEXT: vmovq %xmm1, %rax
	; AVX2-NEXT: movq %rdx, %rax			; AVX2-NEXT: movabsq $-5614226457215950491, %rcx # imm = 0xB21642C8590B2165
	; AVX2-NEXT: shrq $63, %rax			; AVX2-NEXT: imulq %rcx
	; AVX2-NEXT: sarq $4, %rdx			; AVX2-NEXT: vmovq %rdx, %xmm1
	; AVX2-NEXT: addq %rax, %rdx			; AVX2-NEXT: vpunpcklqdq {{.*#+}} xmm1 = xmm1[0],xmm2[0]
	; AVX2-NEXT: leaq (%rdx,%rdx,2), %rax			; AVX2-NEXT: vpextrq $1, %xmm0, %rax
	; AVX2-NEXT: shlq $3, %rax			; AVX2-NEXT: movabsq $7220743857598845893, %rcx # imm = 0x64353C48064353C5
	; AVX2-NEXT: subq %rax, %rdx			; AVX2-NEXT: imulq %rcx
	; AVX2-NEXT: addq %rcx, %rdx
	; AVX2-NEXT: vmovq %rdx, %xmm2			; AVX2-NEXT: vmovq %rdx, %xmm2
	; AVX2-NEXT: vpextrq $1, %xmm1, %rcx			; AVX2-NEXT: vpslldq {{.*#+}} xmm2 = zero,zero,zero,zero,zero,zero,zero,zero,xmm2[0,1,2,3,4,5,6,7]
	; AVX2-NEXT: movabsq $6966426675817289639, %rdx # imm = 0x60ADB826E5E517A7			; AVX2-NEXT: vinserti128 $1, %xmm1, %ymm2, %ymm1
	; AVX2-NEXT: movq %rcx, %rax			; AVX2-NEXT: vpxor %xmm2, %xmm2, %xmm2
	; AVX2-NEXT: imulq %rdx			; AVX2-NEXT: vpblendd {{.*#+}} ymm3 = ymm0[0,1],ymm2[2,3],ymm0[4,5],ymm2[6,7]
	; AVX2-NEXT: movq %rdx, %rax			; AVX2-NEXT: vpaddq %ymm3, %ymm1, %ymm1
	; AVX2-NEXT: shrq $63, %rax			; AVX2-NEXT: vpsrlq $63, %ymm1, %ymm3
	; AVX2-NEXT: sarq $11, %rdx			; AVX2-NEXT: vpblendd {{.*#+}} ymm2 = ymm2[0,1],ymm3[2,3,4,5,6,7]
	; AVX2-NEXT: addq %rax, %rdx			; AVX2-NEXT: vpsrlvq {{.*}}(%rip), %ymm1, %ymm1
	; AVX2-NEXT: imulq $5423, %rdx, %rax # imm = 0x152F			; AVX2-NEXT: vmovdqa {{.*#+}} ymm3 = [9223372036854775808,36028797018963968,576460752303423488,4503599627370496]
	; AVX2-NEXT: subq %rax, %rcx			; AVX2-NEXT: vpxor %ymm3, %ymm1, %ymm1
	; AVX2-NEXT: vmovq %rcx, %xmm1			; AVX2-NEXT: vpaddq %ymm2, %ymm1, %ymm1
	; AVX2-NEXT: vpunpcklqdq {{.*#+}} xmm1 = xmm2[0],xmm1[0]			; AVX2-NEXT: vpsubq %ymm3, %ymm1, %ymm1
	; AVX2-NEXT: vpextrq $1, %xmm0, %rcx			; AVX2-NEXT: vmovdqa {{.*#+}} ymm2 = [1,654,23,5423]
	; AVX2-NEXT: movabsq $7220743857598845893, %rdx # imm = 0x64353C48064353C5			; AVX2-NEXT: vpmuludq %ymm2, %ymm1, %ymm3
	; AVX2-NEXT: movq %rcx, %rax			; AVX2-NEXT: vpsrlq $32, %ymm1, %ymm1
	; AVX2-NEXT: imulq %rdx			; AVX2-NEXT: vpmuludq %ymm2, %ymm1, %ymm1
	; AVX2-NEXT: movq %rdx, %rax			; AVX2-NEXT: vpsllq $32, %ymm1, %ymm1
	; AVX2-NEXT: shrq $63, %rax			; AVX2-NEXT: vpaddq %ymm1, %ymm3, %ymm1
	; AVX2-NEXT: sarq $8, %rdx			; AVX2-NEXT: vpsubq %ymm1, %ymm0, %ymm0
	; AVX2-NEXT: addq %rax, %rdx
	; AVX2-NEXT: imulq $654, %rdx, %rax # imm = 0x28E
	; AVX2-NEXT: subq %rax, %rcx
	; AVX2-NEXT: vmovq %rcx, %xmm0
	; AVX2-NEXT: vpslldq {{.*#+}} xmm0 = zero,zero,zero,zero,zero,zero,zero,zero,xmm0[0,1,2,3,4,5,6,7]
	; AVX2-NEXT: vinserti128 $1, %xmm1, %ymm0, %ymm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	%1 = srem <4 x i64> %x, <i64 1, i64 654, i64 23, i64 5423>			%1 = srem <4 x i64> %x, <i64 1, i64 654, i64 23, i64 5423>
	ret <4 x i64> %1			ret <4 x i64> %1
	}			}

llvm/test/CodeGen/X86/urem-seteq-nonzero.ll

Show First 20 Lines • Show All 289 Lines • ▼ Show 20 Lines	; X64-NEXT: retq
%urem = urem i8 %X, 3		%urem = urem i8 %X, 3
%cmp = icmp eq i8 %urem, 2		%cmp = icmp eq i8 %urem, 2
ret i1 %cmp		ret i1 %cmp
}		}

define i1 @t64_3_2(i64 %X) nounwind {		define i1 @t64_3_2(i64 %X) nounwind {
; X86-LABEL: t64_3_2:		; X86-LABEL: t64_3_2:
; X86: # %bb.0:		; X86: # %bb.0:
; X86-NEXT: subl $12, %esp		; X86-NEXT: pushl %ebp
; X86-NEXT: pushl $0		; X86-NEXT: pushl %ebx
; X86-NEXT: pushl $3		; X86-NEXT: pushl %edi
; X86-NEXT: pushl {{[0-9]+}}(%esp)		; X86-NEXT: pushl %esi
; X86-NEXT: pushl {{[0-9]+}}(%esp)		; X86-NEXT: movl {{[0-9]+}}(%esp), %ecx
; X86-NEXT: calll __umoddi3		; X86-NEXT: movl {{[0-9]+}}(%esp), %esi
; X86-NEXT: addl $16, %esp		; X86-NEXT: movl $-1431655765, %ebx # imm = 0xAAAAAAAB
; X86-NEXT: xorl $2, %eax		; X86-NEXT: movl %ecx, %eax
; X86-NEXT: orl %edx, %eax		; X86-NEXT: mull %ebx
		; X86-NEXT: movl %edx, %edi
		; X86-NEXT: movl %esi, %eax
		; X86-NEXT: mull %ebx
		; X86-NEXT: movl %edx, %ebx
		; X86-NEXT: movl %eax, %ebp
		; X86-NEXT: addl %edi, %ebp
		; X86-NEXT: adcl $0, %ebx
		; X86-NEXT: movl $-1431655766, %edx # imm = 0xAAAAAAAA
		; X86-NEXT: movl %ecx, %eax
		; X86-NEXT: mull %edx
		; X86-NEXT: movl %edx, %edi
		; X86-NEXT: addl %ebp, %eax
		; X86-NEXT: adcl %ebx, %edi
		; X86-NEXT: setb %al
		; X86-NEXT: movzbl %al, %ebp
		; X86-NEXT: movl %esi, %eax
		; X86-NEXT: movl $-1431655766, %edx # imm = 0xAAAAAAAA
		; X86-NEXT: mull %edx
		; X86-NEXT: movl %edx, %ebx
		; X86-NEXT: addl %edi, %eax
		; X86-NEXT: adcl %ebp, %ebx
		; X86-NEXT: shrdl $1, %ebx, %eax
		; X86-NEXT: movl $3, %edx
		; X86-NEXT: mull %edx
		; X86-NEXT: shrl %ebx
		; X86-NEXT: leal (%ebx,%ebx,2), %edi
		; X86-NEXT: addl %edx, %edi
		; X86-NEXT: subl %eax, %ecx
		; X86-NEXT: sbbl %edi, %esi
		; X86-NEXT: xorl $2, %ecx
		; X86-NEXT: orl %esi, %ecx
; X86-NEXT: sete %al		; X86-NEXT: sete %al
; X86-NEXT: addl $12, %esp		; X86-NEXT: popl %esi
		; X86-NEXT: popl %edi
		; X86-NEXT: popl %ebx
		; X86-NEXT: popl %ebp
; X86-NEXT: retl		; X86-NEXT: retl
;		;
; X64-LABEL: t64_3_2:		; X64-LABEL: t64_3_2:
; X64: # %bb.0:		; X64: # %bb.0:
; X64-NEXT: movabsq $-6148914691236517205, %rax # imm = 0xAAAAAAAAAAAAAAAB		; X64-NEXT: movabsq $-6148914691236517205, %rax # imm = 0xAAAAAAAAAAAAAAAB
; X64-NEXT: imulq %rdi, %rax		; X64-NEXT: imulq %rdi, %rax
; X64-NEXT: movabsq $-6148914691236517206, %rcx # imm = 0xAAAAAAAAAAAAAAAA		; X64-NEXT: movabsq $-6148914691236517206, %rcx # imm = 0xAAAAAAAAAAAAAAAA
; X64-NEXT: addq %rax, %rcx		; X64-NEXT: addq %rax, %rcx
; X64-NEXT: movabsq $6148914691236517205, %rax # imm = 0x5555555555555555		; X64-NEXT: movabsq $6148914691236517205, %rax # imm = 0x5555555555555555
; X64-NEXT: cmpq %rax, %rcx		; X64-NEXT: cmpq %rax, %rcx
; X64-NEXT: setb %al		; X64-NEXT: setb %al
; X64-NEXT: retq		; X64-NEXT: retq
%urem = urem i64 %X, 3		%urem = urem i64 %X, 3
%cmp = icmp eq i64 %urem, 2		%cmp = icmp eq i64 %urem, 2
ret i1 %cmp		ret i1 %cmp
}		}

llvm/test/CodeGen/X86/urem-vector-lkk.ll

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+sse4.1 \| FileCheck %s --check-prefix=CHECK --check-prefix=SSE			; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+sse4.1 \| FileCheck %s --check-prefix=CHECK --check-prefix=SSE
	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx \| FileCheck %s --check-prefix=CHECK --check-prefix=AVX --check-prefix=AVX1			; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx \| FileCheck %s --check-prefix=CHECK --check-prefix=AVX --check-prefix=AVX1
	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx2 \| FileCheck %s --check-prefix=CHECK --check-prefix=AVX --check-prefix=AVX2			; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx2 \| FileCheck %s --check-prefix=CHECK --check-prefix=AVX --check-prefix=AVX2

	define <4 x i16> @fold_urem_vec_1(<4 x i16> %x) {			define <4 x i16> @fold_urem_vec_1(<4 x i16> %x) {
	; SSE-LABEL: fold_urem_vec_1:			; SSE-LABEL: fold_urem_vec_1:
	; SSE: # %bb.0:			; SSE: # %bb.0:
	; SSE-NEXT: pextrw $1, %xmm0, %eax			; SSE-NEXT: movdqa {{.*#+}} xmm1 = <u,16384,32768,u,u,u,u,u>
	; SSE-NEXT: movl %eax, %ecx			; SSE-NEXT: pmulhuw %xmm0, %xmm1
	; SSE-NEXT: shrl $2, %ecx			; SSE-NEXT: pblendw {{.*#+}} xmm1 = xmm0[0],xmm1[1,2],xmm0[3],xmm1[4,5,6,7]
	; SSE-NEXT: imull $16913, %ecx, %ecx # imm = 0x4211			; SSE-NEXT: pmovzxwd {{.*#+}} xmm1 = xmm1[0],zero,xmm1[1],zero,xmm1[2],zero,xmm1[3],zero
	; SSE-NEXT: shrl $19, %ecx			; SSE-NEXT: pmulld {{.*}}(%rip), %xmm1
	; SSE-NEXT: imull $124, %ecx, %ecx			; SSE-NEXT: psrld $16, %xmm1
	; SSE-NEXT: subl %ecx, %eax			; SSE-NEXT: packusdw %xmm1, %xmm1
	; SSE-NEXT: movd %xmm0, %ecx			; SSE-NEXT: movdqa %xmm0, %xmm2
	; SSE-NEXT: movzwl %cx, %edx			; SSE-NEXT: psubw %xmm1, %xmm2
	; SSE-NEXT: imull $44151, %edx, %edx # imm = 0xAC77			; SSE-NEXT: pmovzxwd {{.*#+}} xmm2 = xmm2[0],zero,xmm2[1],zero,xmm2[2],zero,xmm2[3],zero
	; SSE-NEXT: shrl $22, %edx			; SSE-NEXT: pmulld {{.*}}(%rip), %xmm2
	; SSE-NEXT: imull $95, %edx, %edx			; SSE-NEXT: psrld $16, %xmm2
	; SSE-NEXT: subl %edx, %ecx			; SSE-NEXT: packusdw %xmm2, %xmm2
	; SSE-NEXT: movd %ecx, %xmm1			; SSE-NEXT: paddw %xmm1, %xmm2
	; SSE-NEXT: pinsrw $1, %eax, %xmm1			; SSE-NEXT: pmulhuw {{.*}}(%rip), %xmm2
	; SSE-NEXT: pextrw $2, %xmm0, %eax			; SSE-NEXT: pmullw {{.*}}(%rip), %xmm2
	; SSE-NEXT: movl %eax, %ecx			; SSE-NEXT: psubw %xmm2, %xmm0
	; SSE-NEXT: shrl %ecx
	; SSE-NEXT: imull $2675, %ecx, %ecx # imm = 0xA73
	; SSE-NEXT: shrl $17, %ecx
	; SSE-NEXT: imull $98, %ecx, %ecx
	; SSE-NEXT: subl %ecx, %eax
	; SSE-NEXT: pinsrw $2, %eax, %xmm1
	; SSE-NEXT: pextrw $3, %xmm0, %eax
	; SSE-NEXT: imull $1373, %eax, %ecx # imm = 0x55D
	; SSE-NEXT: shrl $16, %ecx
	; SSE-NEXT: movl %eax, %edx
	; SSE-NEXT: subl %ecx, %edx
	; SSE-NEXT: movzwl %dx, %edx
	; SSE-NEXT: shrl %edx
	; SSE-NEXT: addl %ecx, %edx
	; SSE-NEXT: shrl $9, %edx
	; SSE-NEXT: imull $1003, %edx, %ecx # imm = 0x3EB
	; SSE-NEXT: subl %ecx, %eax
	; SSE-NEXT: pinsrw $3, %eax, %xmm1
	; SSE-NEXT: movdqa %xmm1, %xmm0
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; AVX-LABEL: fold_urem_vec_1:			; AVX-LABEL: fold_urem_vec_1:
	; AVX: # %bb.0:			; AVX: # %bb.0:
	; AVX-NEXT: vpextrw $1, %xmm0, %eax			; AVX-NEXT: vpmulhuw {{.*}}(%rip), %xmm0, %xmm1
	; AVX-NEXT: movl %eax, %ecx			; AVX-NEXT: vpblendw {{.*#+}} xmm1 = xmm0[0],xmm1[1,2],xmm0[3],xmm1[4,5,6,7]
	; AVX-NEXT: shrl $2, %ecx			; AVX-NEXT: vpmovzxwd {{.*#+}} xmm1 = xmm1[0],zero,xmm1[1],zero,xmm1[2],zero,xmm1[3],zero
	; AVX-NEXT: imull $16913, %ecx, %ecx # imm = 0x4211			; AVX-NEXT: vpmulld {{.*}}(%rip), %xmm1, %xmm1
	; AVX-NEXT: shrl $19, %ecx			; AVX-NEXT: vpsrld $16, %xmm1, %xmm1
	; AVX-NEXT: imull $124, %ecx, %ecx			; AVX-NEXT: vpackusdw %xmm1, %xmm1, %xmm1
	; AVX-NEXT: subl %ecx, %eax			; AVX-NEXT: vpsubw %xmm1, %xmm0, %xmm2
	; AVX-NEXT: vmovd %xmm0, %ecx			; AVX-NEXT: vpmovzxwd {{.*#+}} xmm2 = xmm2[0],zero,xmm2[1],zero,xmm2[2],zero,xmm2[3],zero
	; AVX-NEXT: movzwl %cx, %edx			; AVX-NEXT: vpmulld {{.*}}(%rip), %xmm2, %xmm2
	; AVX-NEXT: imull $44151, %edx, %edx # imm = 0xAC77			; AVX-NEXT: vpsrld $16, %xmm2, %xmm2
	; AVX-NEXT: shrl $22, %edx			; AVX-NEXT: vpackusdw %xmm2, %xmm2, %xmm2
	; AVX-NEXT: imull $95, %edx, %edx			; AVX-NEXT: vpaddw %xmm1, %xmm2, %xmm1
	; AVX-NEXT: subl %edx, %ecx			; AVX-NEXT: vpmulhuw {{.*}}(%rip), %xmm1, %xmm1
	; AVX-NEXT: vmovd %ecx, %xmm1			; AVX-NEXT: vpmullw {{.*}}(%rip), %xmm1, %xmm1
	; AVX-NEXT: vpinsrw $1, %eax, %xmm1, %xmm1			; AVX-NEXT: vpsubw %xmm1, %xmm0, %xmm0
	; AVX-NEXT: vpextrw $2, %xmm0, %eax
	; AVX-NEXT: movl %eax, %ecx
	; AVX-NEXT: shrl %ecx
	; AVX-NEXT: imull $2675, %ecx, %ecx # imm = 0xA73
	; AVX-NEXT: shrl $17, %ecx
	; AVX-NEXT: imull $98, %ecx, %ecx
	; AVX-NEXT: subl %ecx, %eax
	; AVX-NEXT: vpinsrw $2, %eax, %xmm1, %xmm1
	; AVX-NEXT: vpextrw $3, %xmm0, %eax
	; AVX-NEXT: imull $1373, %eax, %ecx # imm = 0x55D
	; AVX-NEXT: shrl $16, %ecx
	; AVX-NEXT: movl %eax, %edx
	; AVX-NEXT: subl %ecx, %edx
	; AVX-NEXT: movzwl %dx, %edx
	; AVX-NEXT: shrl %edx
	; AVX-NEXT: addl %ecx, %edx
	; AVX-NEXT: shrl $9, %edx
	; AVX-NEXT: imull $1003, %edx, %ecx # imm = 0x3EB
	; AVX-NEXT: subl %ecx, %eax
	; AVX-NEXT: vpinsrw $3, %eax, %xmm1, %xmm0
	; AVX-NEXT: retq			; AVX-NEXT: retq
	%1 = urem <4 x i16> %x, <i16 95, i16 124, i16 98, i16 1003>			%1 = urem <4 x i16> %x, <i16 95, i16 124, i16 98, i16 1003>
	ret <4 x i16> %1			ret <4 x i16> %1
	}			}

	define <4 x i16> @fold_urem_vec_2(<4 x i16> %x) {			define <4 x i16> @fold_urem_vec_2(<4 x i16> %x) {
	; SSE-LABEL: fold_urem_vec_2:			; SSE-LABEL: fold_urem_vec_2:
	; SSE: # %bb.0:			; SSE: # %bb.0:
	; SSE-NEXT: movdqa {{.*#+}} xmm1 = [44151,44151,44151,44151,44151,44151,44151,44151]			; SSE-NEXT: pmovzxwd {{.*#+}} xmm1 = xmm0[0],zero,xmm0[1],zero,xmm0[2],zero,xmm0[3],zero
	; SSE-NEXT: pmulhuw %xmm0, %xmm1			; SSE-NEXT: pmulld {{.*}}(%rip), %xmm1
	; SSE-NEXT: psrlw $6, %xmm1			; SSE-NEXT: psrld $22, %xmm1
				; SSE-NEXT: packusdw %xmm1, %xmm1
	; SSE-NEXT: pmullw {{.*}}(%rip), %xmm1			; SSE-NEXT: pmullw {{.*}}(%rip), %xmm1
	; SSE-NEXT: psubw %xmm1, %xmm0			; SSE-NEXT: psubw %xmm1, %xmm0
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; AVX-LABEL: fold_urem_vec_2:			; AVX1-LABEL: fold_urem_vec_2:
	; AVX: # %bb.0:			; AVX1: # %bb.0:
	; AVX-NEXT: vpmulhuw {{.*}}(%rip), %xmm0, %xmm1			; AVX1-NEXT: vpmovzxwd {{.*#+}} xmm1 = xmm0[0],zero,xmm0[1],zero,xmm0[2],zero,xmm0[3],zero
	; AVX-NEXT: vpsrlw $6, %xmm1, %xmm1			; AVX1-NEXT: vpmulld {{.*}}(%rip), %xmm1, %xmm1
	; AVX-NEXT: vpmullw {{.*}}(%rip), %xmm1, %xmm1			; AVX1-NEXT: vpsrld $22, %xmm1, %xmm1
	; AVX-NEXT: vpsubw %xmm1, %xmm0, %xmm0			; AVX1-NEXT: vpackusdw %xmm1, %xmm1, %xmm1
	; AVX-NEXT: retq			; AVX1-NEXT: vpmullw {{.*}}(%rip), %xmm1, %xmm1
				; AVX1-NEXT: vpsubw %xmm1, %xmm0, %xmm0
				; AVX1-NEXT: retq
				;
				; AVX2-LABEL: fold_urem_vec_2:
				; AVX2: # %bb.0:
				; AVX2-NEXT: vpmovzxwd {{.*#+}} xmm1 = xmm0[0],zero,xmm0[1],zero,xmm0[2],zero,xmm0[3],zero
				; AVX2-NEXT: vpbroadcastd {{.*#+}} xmm2 = [44151,44151,44151,44151]
				; AVX2-NEXT: vpmulld %xmm2, %xmm1, %xmm1
				; AVX2-NEXT: vpsrld $22, %xmm1, %xmm1
				; AVX2-NEXT: vpackusdw %xmm1, %xmm1, %xmm1
				; AVX2-NEXT: vpmullw {{.*}}(%rip), %xmm1, %xmm1
				; AVX2-NEXT: vpsubw %xmm1, %xmm0, %xmm0
				; AVX2-NEXT: retq
	%1 = urem <4 x i16> %x, <i16 95, i16 95, i16 95, i16 95>			%1 = urem <4 x i16> %x, <i16 95, i16 95, i16 95, i16 95>
	ret <4 x i16> %1			ret <4 x i16> %1
	}			}


	; Don't fold if we can combine urem with udiv.			; Don't fold if we can combine urem with udiv.
	define <4 x i16> @combine_urem_udiv(<4 x i16> %x) {			define <4 x i16> @combine_urem_udiv(<4 x i16> %x) {
	; SSE-LABEL: combine_urem_udiv:			; SSE-LABEL: combine_urem_udiv:
	; SSE: # %bb.0:			; SSE: # %bb.0:
	; SSE-NEXT: movdqa {{.*#+}} xmm1 = [44151,44151,44151,44151,44151,44151,44151,44151]			; SSE-NEXT: pmovzxwd {{.*#+}} xmm1 = xmm0[0],zero,xmm0[1],zero,xmm0[2],zero,xmm0[3],zero
	; SSE-NEXT: pmulhuw %xmm0, %xmm1			; SSE-NEXT: pmulld {{.*}}(%rip), %xmm1
	; SSE-NEXT: psrlw $6, %xmm1			; SSE-NEXT: psrld $22, %xmm1
	; SSE-NEXT: movdqa {{.*#+}} xmm2 = [95,95,95,95,95,95,95,95]			; SSE-NEXT: packusdw %xmm1, %xmm1
				; SSE-NEXT: movdqa {{.*#+}} xmm2 = <95,95,95,95,u,u,u,u>
	; SSE-NEXT: pmullw %xmm1, %xmm2			; SSE-NEXT: pmullw %xmm1, %xmm2
	; SSE-NEXT: psubw %xmm2, %xmm0			; SSE-NEXT: psubw %xmm2, %xmm0
	; SSE-NEXT: paddw %xmm1, %xmm0			; SSE-NEXT: paddw %xmm1, %xmm0
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; AVX-LABEL: combine_urem_udiv:			; AVX1-LABEL: combine_urem_udiv:
	; AVX: # %bb.0:			; AVX1: # %bb.0:
	; AVX-NEXT: vpmulhuw {{.*}}(%rip), %xmm0, %xmm1			; AVX1-NEXT: vpmovzxwd {{.*#+}} xmm1 = xmm0[0],zero,xmm0[1],zero,xmm0[2],zero,xmm0[3],zero
	; AVX-NEXT: vpsrlw $6, %xmm1, %xmm1			; AVX1-NEXT: vpmulld {{.*}}(%rip), %xmm1, %xmm1
	; AVX-NEXT: vpmullw {{.*}}(%rip), %xmm1, %xmm2			; AVX1-NEXT: vpsrld $22, %xmm1, %xmm1
	; AVX-NEXT: vpsubw %xmm2, %xmm0, %xmm0			; AVX1-NEXT: vpackusdw %xmm1, %xmm1, %xmm1
	; AVX-NEXT: vpaddw %xmm1, %xmm0, %xmm0			; AVX1-NEXT: vpmullw {{.*}}(%rip), %xmm1, %xmm2
	; AVX-NEXT: retq			; AVX1-NEXT: vpsubw %xmm2, %xmm0, %xmm0
				; AVX1-NEXT: vpaddw %xmm1, %xmm0, %xmm0
				; AVX1-NEXT: retq
				;
				; AVX2-LABEL: combine_urem_udiv:
				; AVX2: # %bb.0:
				; AVX2-NEXT: vpmovzxwd {{.*#+}} xmm1 = xmm0[0],zero,xmm0[1],zero,xmm0[2],zero,xmm0[3],zero
				; AVX2-NEXT: vpbroadcastd {{.*#+}} xmm2 = [44151,44151,44151,44151]
				; AVX2-NEXT: vpmulld %xmm2, %xmm1, %xmm1
				; AVX2-NEXT: vpsrld $22, %xmm1, %xmm1
				; AVX2-NEXT: vpackusdw %xmm1, %xmm1, %xmm1
				; AVX2-NEXT: vpmullw {{.*}}(%rip), %xmm1, %xmm2
				; AVX2-NEXT: vpsubw %xmm2, %xmm0, %xmm0
				; AVX2-NEXT: vpaddw %xmm1, %xmm0, %xmm0
				; AVX2-NEXT: retq
	%1 = urem <4 x i16> %x, <i16 95, i16 95, i16 95, i16 95>			%1 = urem <4 x i16> %x, <i16 95, i16 95, i16 95, i16 95>
	%2 = udiv <4 x i16> %x, <i16 95, i16 95, i16 95, i16 95>			%2 = udiv <4 x i16> %x, <i16 95, i16 95, i16 95, i16 95>
	%3 = add <4 x i16> %1, %2			%3 = add <4 x i16> %1, %2
	ret <4 x i16> %3			ret <4 x i16> %3
	}			}

	; Don't fold for divisors that are a power of two.			; Don't fold for divisors that are a power of two.
	define <4 x i16> @dont_fold_urem_power_of_two(<4 x i16> %x) {			define <4 x i16> @dont_fold_urem_power_of_two(<4 x i16> %x) {
	; SSE-LABEL: dont_fold_urem_power_of_two:			; SSE-LABEL: dont_fold_urem_power_of_two:
	; SSE: # %bb.0:			; SSE: # %bb.0:
	; SSE-NEXT: pextrw $3, %xmm0, %eax			; SSE-NEXT: pmovzxwd {{.*#+}} xmm1 = xmm0[0],zero,xmm0[1],zero,xmm0[2],zero,xmm0[3],zero
	; SSE-NEXT: imull $44151, %eax, %ecx # imm = 0xAC77			; SSE-NEXT: pmulld {{.*}}(%rip), %xmm1
	; SSE-NEXT: shrl $22, %ecx			; SSE-NEXT: psrld $16, %xmm1
	; SSE-NEXT: imull $95, %ecx, %ecx			; SSE-NEXT: packusdw %xmm1, %xmm1
	; SSE-NEXT: subl %ecx, %eax			; SSE-NEXT: movdqa %xmm1, %xmm2
	; SSE-NEXT: pextrw $1, %xmm0, %ecx			; SSE-NEXT: psrlw $6, %xmm2
	; SSE-NEXT: andl $31, %ecx			; SSE-NEXT: pblendw {{.*#+}} xmm2 = xmm1[0,1,2],xmm2[3],xmm1[4,5,6,7]
	; SSE-NEXT: movd %xmm0, %edx			; SSE-NEXT: pmullw {{.*}}(%rip), %xmm2
	; SSE-NEXT: andl $63, %edx			; SSE-NEXT: psubw %xmm2, %xmm0
	; SSE-NEXT: movd %edx, %xmm1
	; SSE-NEXT: pinsrw $1, %ecx, %xmm1
	; SSE-NEXT: pextrw $2, %xmm0, %ecx
	; SSE-NEXT: andl $7, %ecx
	; SSE-NEXT: pinsrw $2, %ecx, %xmm1
	; SSE-NEXT: pinsrw $3, %eax, %xmm1
	; SSE-NEXT: movdqa %xmm1, %xmm0
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; AVX-LABEL: dont_fold_urem_power_of_two:			; AVX-LABEL: dont_fold_urem_power_of_two:
	; AVX: # %bb.0:			; AVX: # %bb.0:
	; AVX-NEXT: vpextrw $3, %xmm0, %eax			; AVX-NEXT: vpmovzxwd {{.*#+}} xmm1 = xmm0[0],zero,xmm0[1],zero,xmm0[2],zero,xmm0[3],zero
	; AVX-NEXT: imull $44151, %eax, %ecx # imm = 0xAC77			; AVX-NEXT: vpmulld {{.*}}(%rip), %xmm1, %xmm1
	; AVX-NEXT: shrl $22, %ecx			; AVX-NEXT: vpsrld $16, %xmm1, %xmm1
	; AVX-NEXT: imull $95, %ecx, %ecx			; AVX-NEXT: vpackusdw %xmm1, %xmm1, %xmm1
	; AVX-NEXT: subl %ecx, %eax			; AVX-NEXT: vpsrlw $6, %xmm1, %xmm2
	; AVX-NEXT: vpextrw $1, %xmm0, %ecx			; AVX-NEXT: vpblendw {{.*#+}} xmm1 = xmm1[0,1,2],xmm2[3],xmm1[4,5,6,7]
	; AVX-NEXT: andl $31, %ecx			; AVX-NEXT: vpmullw {{.*}}(%rip), %xmm1, %xmm1
	; AVX-NEXT: vmovd %xmm0, %edx			; AVX-NEXT: vpsubw %xmm1, %xmm0, %xmm0
	; AVX-NEXT: andl $63, %edx
	; AVX-NEXT: vmovd %edx, %xmm1
	; AVX-NEXT: vpinsrw $1, %ecx, %xmm1, %xmm1
	; AVX-NEXT: vpextrw $2, %xmm0, %ecx
	; AVX-NEXT: andl $7, %ecx
	; AVX-NEXT: vpinsrw $2, %ecx, %xmm1, %xmm0
	; AVX-NEXT: vpinsrw $3, %eax, %xmm0, %xmm0
	; AVX-NEXT: retq			; AVX-NEXT: retq
	%1 = urem <4 x i16> %x, <i16 64, i16 32, i16 8, i16 95>			%1 = urem <4 x i16> %x, <i16 64, i16 32, i16 8, i16 95>
	ret <4 x i16> %1			ret <4 x i16> %1
	}			}

	; Don't fold if the divisor is one.			; Don't fold if the divisor is one.
	define <4 x i16> @dont_fold_urem_one(<4 x i16> %x) {			define <4 x i16> @dont_fold_urem_one(<4 x i16> %x) {
	; SSE-LABEL: dont_fold_urem_one:			; SSE-LABEL: dont_fold_urem_one:
	; SSE: # %bb.0:			; SSE: # %bb.0:
	; SSE-NEXT: pextrw $2, %xmm0, %eax			; SSE-NEXT: pmovzxwd {{.*#+}} xmm1 = xmm0[0],zero,xmm0[1],zero,xmm0[2],zero,xmm0[3],zero
	; SSE-NEXT: imull $25645, %eax, %ecx # imm = 0x642D			; SSE-NEXT: pmulld {{.*}}(%rip), %xmm1
	; SSE-NEXT: shrl $16, %ecx			; SSE-NEXT: psrld $16, %xmm1
	; SSE-NEXT: movl %eax, %edx			; SSE-NEXT: packusdw %xmm1, %xmm1
	; SSE-NEXT: subl %ecx, %edx			; SSE-NEXT: movdqa %xmm0, %xmm2
	; SSE-NEXT: movzwl %dx, %edx			; SSE-NEXT: psubw %xmm1, %xmm2
	; SSE-NEXT: shrl %edx			; SSE-NEXT: pmovzxwd {{.*#+}} xmm2 = xmm2[0],zero,xmm2[1],zero,xmm2[2],zero,xmm2[3],zero
	; SSE-NEXT: addl %ecx, %edx			; SSE-NEXT: pmulld {{.*}}(%rip), %xmm2
	; SSE-NEXT: shrl $4, %edx			; SSE-NEXT: psrld $16, %xmm2
	; SSE-NEXT: leal (%rdx,%rdx,2), %ecx			; SSE-NEXT: packusdw %xmm2, %xmm2
	; SSE-NEXT: shll $3, %ecx			; SSE-NEXT: paddw %xmm1, %xmm2
	; SSE-NEXT: subl %ecx, %edx			; SSE-NEXT: pmulhuw {{.*}}(%rip), %xmm2
	; SSE-NEXT: addl %eax, %edx			; SSE-NEXT: pblendw {{.*#+}} xmm2 = xmm0[0],xmm2[1,2,3,4,5,6,7]
	; SSE-NEXT: pextrw $1, %xmm0, %eax			; SSE-NEXT: pmullw {{.*}}(%rip), %xmm2
	; SSE-NEXT: imull $51307, %eax, %ecx # imm = 0xC86B			; SSE-NEXT: psubw %xmm2, %xmm0
	; SSE-NEXT: shrl $25, %ecx
	; SSE-NEXT: imull $654, %ecx, %ecx # imm = 0x28E
	; SSE-NEXT: subl %ecx, %eax
	; SSE-NEXT: pxor %xmm1, %xmm1
	; SSE-NEXT: pinsrw $1, %eax, %xmm1
	; SSE-NEXT: pinsrw $2, %edx, %xmm1
	; SSE-NEXT: pextrw $3, %xmm0, %eax
	; SSE-NEXT: imull $12375, %eax, %ecx # imm = 0x3057
	; SSE-NEXT: shrl $26, %ecx
	; SSE-NEXT: imull $5423, %ecx, %ecx # imm = 0x152F
	; SSE-NEXT: subl %ecx, %eax
	; SSE-NEXT: pinsrw $3, %eax, %xmm1
	; SSE-NEXT: movdqa %xmm1, %xmm0
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; AVX-LABEL: dont_fold_urem_one:			; AVX-LABEL: dont_fold_urem_one:
	; AVX: # %bb.0:			; AVX: # %bb.0:
	; AVX-NEXT: vpextrw $2, %xmm0, %eax			; AVX-NEXT: vpmovzxwd {{.*#+}} xmm1 = xmm0[0],zero,xmm0[1],zero,xmm0[2],zero,xmm0[3],zero
	; AVX-NEXT: imull $25645, %eax, %ecx # imm = 0x642D			; AVX-NEXT: vpmulld {{.*}}(%rip), %xmm1, %xmm1
	; AVX-NEXT: shrl $16, %ecx			; AVX-NEXT: vpsrld $16, %xmm1, %xmm1
	; AVX-NEXT: movl %eax, %edx			; AVX-NEXT: vpackusdw %xmm1, %xmm1, %xmm1
	; AVX-NEXT: subl %ecx, %edx			; AVX-NEXT: vpsubw %xmm1, %xmm0, %xmm2
	; AVX-NEXT: movzwl %dx, %edx			; AVX-NEXT: vpmovzxwd {{.*#+}} xmm2 = xmm2[0],zero,xmm2[1],zero,xmm2[2],zero,xmm2[3],zero
	; AVX-NEXT: shrl %edx			; AVX-NEXT: vpmulld {{.*}}(%rip), %xmm2, %xmm2
	; AVX-NEXT: addl %ecx, %edx			; AVX-NEXT: vpsrld $16, %xmm2, %xmm2
	; AVX-NEXT: shrl $4, %edx			; AVX-NEXT: vpackusdw %xmm2, %xmm2, %xmm2
	; AVX-NEXT: leal (%rdx,%rdx,2), %ecx			; AVX-NEXT: vpaddw %xmm1, %xmm2, %xmm1
	; AVX-NEXT: shll $3, %ecx			; AVX-NEXT: vpmulhuw {{.*}}(%rip), %xmm1, %xmm1
	; AVX-NEXT: subl %ecx, %edx			; AVX-NEXT: vpblendw {{.*#+}} xmm1 = xmm0[0],xmm1[1,2,3,4,5,6,7]
	; AVX-NEXT: addl %eax, %edx			; AVX-NEXT: vpmullw {{.*}}(%rip), %xmm1, %xmm1
	; AVX-NEXT: vpextrw $1, %xmm0, %eax			; AVX-NEXT: vpsubw %xmm1, %xmm0, %xmm0
	; AVX-NEXT: imull $51307, %eax, %ecx # imm = 0xC86B
	; AVX-NEXT: shrl $25, %ecx
	; AVX-NEXT: imull $654, %ecx, %ecx # imm = 0x28E
	; AVX-NEXT: subl %ecx, %eax
	; AVX-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX-NEXT: vpinsrw $1, %eax, %xmm1, %xmm1
	; AVX-NEXT: vpinsrw $2, %edx, %xmm1, %xmm1
	; AVX-NEXT: vpextrw $3, %xmm0, %eax
	; AVX-NEXT: imull $12375, %eax, %ecx # imm = 0x3057
	; AVX-NEXT: shrl $26, %ecx
	; AVX-NEXT: imull $5423, %ecx, %ecx # imm = 0x152F
	; AVX-NEXT: subl %ecx, %eax
	; AVX-NEXT: vpinsrw $3, %eax, %xmm1, %xmm0
	; AVX-NEXT: retq			; AVX-NEXT: retq
	%1 = urem <4 x i16> %x, <i16 1, i16 654, i16 23, i16 5423>			%1 = urem <4 x i16> %x, <i16 1, i16 654, i16 23, i16 5423>
	ret <4 x i16> %1			ret <4 x i16> %1
	}			}

	; Don't fold if the divisor is 2^16.			; Don't fold if the divisor is 2^16.
	define <4 x i16> @dont_fold_urem_i16_smax(<4 x i16> %x) {			define <4 x i16> @dont_fold_urem_i16_smax(<4 x i16> %x) {
	; CHECK-LABEL: dont_fold_urem_i16_smax:			; CHECK-LABEL: dont_fold_urem_i16_smax:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: retq			; CHECK-NEXT: retq
	%1 = urem <4 x i16> %x, <i16 1, i16 65536, i16 23, i16 5423>			%1 = urem <4 x i16> %x, <i16 1, i16 65536, i16 23, i16 5423>
	ret <4 x i16> %1			ret <4 x i16> %1
	}			}

	; Don't fold i64 urem.			; Don't fold i64 urem.
	define <4 x i64> @dont_fold_urem_i64(<4 x i64> %x) {			define <4 x i64> @dont_fold_urem_i64(<4 x i64> %x) {
	; SSE-LABEL: dont_fold_urem_i64:			; SSE-LABEL: dont_fold_urem_i64:
	; SSE: # %bb.0:			; SSE: # %bb.0:
	; SSE-NEXT: movq %xmm1, %rcx			; SSE-NEXT: pextrq $1, %xmm1, %rax
	; SSE-NEXT: movabsq $7218291159277650633, %rdx # imm = 0x642C8590B21642C9			; SSE-NEXT: movabsq $-4513890722074972339, %rcx # imm = 0xC15B704DCBCA2F4D
	; SSE-NEXT: movq %rcx, %rax			; SSE-NEXT: mulq %rcx
	; SSE-NEXT: mulq %rdx			; SSE-NEXT: movq %rdx, %xmm2
	; SSE-NEXT: movq %rcx, %rax			; SSE-NEXT: movq %xmm1, %rax
	; SSE-NEXT: subq %rdx, %rax			; SSE-NEXT: movabsq $7218291159277650633, %rcx # imm = 0x642C8590B21642C9
				; SSE-NEXT: mulq %rcx
				; SSE-NEXT: movq %rdx, %xmm3
				; SSE-NEXT: movdqa %xmm1, %xmm4
				; SSE-NEXT: psubq %xmm3, %xmm4
				; SSE-NEXT: punpcklqdq {{.*#+}} xmm3 = xmm3[0],xmm2[0]
				; SSE-NEXT: movq %xmm4, %rax
	; SSE-NEXT: shrq %rax			; SSE-NEXT: shrq %rax
	; SSE-NEXT: addq %rdx, %rax
	; SSE-NEXT: shrq $4, %rax
	; SSE-NEXT: leaq (%rax,%rax,2), %rdx
	; SSE-NEXT: shlq $3, %rdx
	; SSE-NEXT: subq %rdx, %rax
	; SSE-NEXT: addq %rcx, %rax
	; SSE-NEXT: movq %rax, %xmm2			; SSE-NEXT: movq %rax, %xmm2
	; SSE-NEXT: pextrq $1, %xmm1, %rcx			; SSE-NEXT: paddq %xmm3, %xmm2
	; SSE-NEXT: movabsq $-4513890722074972339, %rdx # imm = 0xC15B704DCBCA2F4D			; SSE-NEXT: movdqa %xmm2, %xmm3
	; SSE-NEXT: movq %rcx, %rax			; SSE-NEXT: psrlq $12, %xmm3
	; SSE-NEXT: mulq %rdx			; SSE-NEXT: psrlq $4, %xmm2
	; SSE-NEXT: shrq $12, %rdx			; SSE-NEXT: pblendw {{.*#+}} xmm2 = xmm2[0,1,2,3],xmm3[4,5,6,7]
	; SSE-NEXT: imulq $5423, %rdx, %rax # imm = 0x152F			; SSE-NEXT: movdqa {{.*#+}} xmm3 = [23,5423]
	; SSE-NEXT: subq %rax, %rcx			; SSE-NEXT: movdqa %xmm2, %xmm4
	; SSE-NEXT: movq %rcx, %xmm1			; SSE-NEXT: pmuludq %xmm3, %xmm4
	; SSE-NEXT: punpcklqdq {{.*#+}} xmm2 = xmm2[0],xmm1[0]			; SSE-NEXT: psrlq $32, %xmm2
	; SSE-NEXT: pextrq $1, %xmm0, %rcx			; SSE-NEXT: pmuludq %xmm3, %xmm2
	; SSE-NEXT: movq %rcx, %rax			; SSE-NEXT: psllq $32, %xmm2
				; SSE-NEXT: paddq %xmm4, %xmm2
				; SSE-NEXT: psubq %xmm2, %xmm1
				; SSE-NEXT: pextrq $1, %xmm0, %rax
	; SSE-NEXT: shrq %rax			; SSE-NEXT: shrq %rax
	; SSE-NEXT: movabsq $7220743857598845893, %rdx # imm = 0x64353C48064353C5			; SSE-NEXT: movabsq $7220743857598845893, %rcx # imm = 0x64353C48064353C5
	; SSE-NEXT: mulq %rdx			; SSE-NEXT: mulq %rcx
	; SSE-NEXT: shrq $7, %rdx			; SSE-NEXT: movq %rdx, %xmm2
	; SSE-NEXT: imulq $654, %rdx, %rax # imm = 0x28E			; SSE-NEXT: pshufd {{.*#+}} xmm2 = xmm2[0,1,0,1]
	; SSE-NEXT: subq %rax, %rcx			; SSE-NEXT: psrlq $7, %xmm2
	; SSE-NEXT: movq %rcx, %xmm0			; SSE-NEXT: pblendw {{.*#+}} xmm2 = xmm0[0,1,2,3],xmm2[4,5,6,7]
	; SSE-NEXT: pslldq {{.*#+}} xmm0 = zero,zero,zero,zero,zero,zero,zero,zero,xmm0[0,1,2,3,4,5,6,7]			; SSE-NEXT: movdqa {{.*#+}} xmm3 = [1,654]
	; SSE-NEXT: movdqa %xmm2, %xmm1			; SSE-NEXT: movdqa %xmm2, %xmm4
				; SSE-NEXT: pmuludq %xmm3, %xmm4
				; SSE-NEXT: psrlq $32, %xmm2
				; SSE-NEXT: pmuludq %xmm3, %xmm2
				; SSE-NEXT: psllq $32, %xmm2
				; SSE-NEXT: paddq %xmm4, %xmm2
				; SSE-NEXT: psubq %xmm2, %xmm0
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; AVX1-LABEL: dont_fold_urem_i64:			; AVX1-LABEL: dont_fold_urem_i64:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1
	; AVX1-NEXT: vmovq %xmm1, %rcx			; AVX1-NEXT: vpextrq $1, %xmm1, %rax
	; AVX1-NEXT: movabsq $7218291159277650633, %rdx # imm = 0x642C8590B21642C9			; AVX1-NEXT: movabsq $-4513890722074972339, %rcx # imm = 0xC15B704DCBCA2F4D
	; AVX1-NEXT: movq %rcx, %rax			; AVX1-NEXT: mulq %rcx
	; AVX1-NEXT: mulq %rdx			; AVX1-NEXT: vmovq %rdx, %xmm2
	; AVX1-NEXT: movq %rcx, %rax			; AVX1-NEXT: vmovq %xmm1, %rax
	; AVX1-NEXT: subq %rdx, %rax			; AVX1-NEXT: movabsq $7218291159277650633, %rcx # imm = 0x642C8590B21642C9
	; AVX1-NEXT: shrq %rax			; AVX1-NEXT: mulq %rcx
	; AVX1-NEXT: addq %rdx, %rax			; AVX1-NEXT: vmovq %rdx, %xmm3
	; AVX1-NEXT: shrq $4, %rax			; AVX1-NEXT: vpunpcklqdq {{.*#+}} xmm2 = xmm3[0],xmm2[0]
	; AVX1-NEXT: leaq (%rax,%rax,2), %rdx			; AVX1-NEXT: vpsubq %xmm3, %xmm1, %xmm3
	; AVX1-NEXT: shlq $3, %rdx			; AVX1-NEXT: vmovq %xmm3, %rax
	; AVX1-NEXT: subq %rdx, %rax
	; AVX1-NEXT: addq %rcx, %rax
	; AVX1-NEXT: vmovq %rax, %xmm2
	; AVX1-NEXT: vpextrq $1, %xmm1, %rcx
	; AVX1-NEXT: movabsq $-4513890722074972339, %rdx # imm = 0xC15B704DCBCA2F4D
	; AVX1-NEXT: movq %rcx, %rax
	; AVX1-NEXT: mulq %rdx
	; AVX1-NEXT: shrq $12, %rdx
	; AVX1-NEXT: imulq $5423, %rdx, %rax # imm = 0x152F
	; AVX1-NEXT: subq %rax, %rcx
	; AVX1-NEXT: vmovq %rcx, %xmm1
	; AVX1-NEXT: vpunpcklqdq {{.*#+}} xmm1 = xmm2[0],xmm1[0]
	; AVX1-NEXT: vpextrq $1, %xmm0, %rcx
	; AVX1-NEXT: movq %rcx, %rax
	; AVX1-NEXT: shrq %rax			; AVX1-NEXT: shrq %rax
	; AVX1-NEXT: movabsq $7220743857598845893, %rdx # imm = 0x64353C48064353C5			; AVX1-NEXT: vmovq %rax, %xmm3
	; AVX1-NEXT: mulq %rdx			; AVX1-NEXT: vpaddq %xmm2, %xmm3, %xmm2
	; AVX1-NEXT: shrq $7, %rdx			; AVX1-NEXT: vpsrlq $12, %xmm2, %xmm3
	; AVX1-NEXT: imulq $654, %rdx, %rax # imm = 0x28E			; AVX1-NEXT: vpsrlq $4, %xmm2, %xmm2
	; AVX1-NEXT: subq %rax, %rcx			; AVX1-NEXT: vpblendw {{.*#+}} xmm2 = xmm2[0,1,2,3],xmm3[4,5,6,7]
	; AVX1-NEXT: vmovq %rcx, %xmm0			; AVX1-NEXT: vpsrlq $1, %xmm0, %xmm3
	; AVX1-NEXT: vpslldq {{.*#+}} xmm0 = zero,zero,zero,zero,zero,zero,zero,zero,xmm0[0,1,2,3,4,5,6,7]			; AVX1-NEXT: vpextrq $1, %xmm3, %rax
				; AVX1-NEXT: movabsq $7220743857598845893, %rcx # imm = 0x64353C48064353C5
				; AVX1-NEXT: mulq %rcx
				; AVX1-NEXT: vmovq %rdx, %xmm3
				; AVX1-NEXT: vpshufd {{.*#+}} xmm3 = xmm3[0,1,0,1]
				; AVX1-NEXT: vpsrlq $7, %xmm3, %xmm3
				; AVX1-NEXT: vinsertf128 $1, %xmm2, %ymm3, %ymm2
				; AVX1-NEXT: vblendps {{.*#+}} ymm2 = ymm0[0,1],ymm2[2,3,4,5,6,7]
				; AVX1-NEXT: vextractf128 $1, %ymm2, %xmm3
				; AVX1-NEXT: vmovdqa {{.*#+}} xmm4 = [23,5423]
				; AVX1-NEXT: vpmuludq %xmm4, %xmm3, %xmm5
				; AVX1-NEXT: vpsrlq $32, %xmm3, %xmm3
				; AVX1-NEXT: vpmuludq %xmm4, %xmm3, %xmm3
				; AVX1-NEXT: vpsllq $32, %xmm3, %xmm3
				; AVX1-NEXT: vpaddq %xmm3, %xmm5, %xmm3
				; AVX1-NEXT: vpsubq %xmm3, %xmm1, %xmm1
				; AVX1-NEXT: vmovdqa {{.*#+}} xmm3 = [1,654]
				; AVX1-NEXT: vpmuludq %xmm3, %xmm2, %xmm4
				; AVX1-NEXT: vpsrlq $32, %xmm2, %xmm2
				; AVX1-NEXT: vpmuludq %xmm3, %xmm2, %xmm2
				; AVX1-NEXT: vpsllq $32, %xmm2, %xmm2
				; AVX1-NEXT: vpaddq %xmm2, %xmm4, %xmm2
				; AVX1-NEXT: vpsubq %xmm2, %xmm0, %xmm0
	; AVX1-NEXT: vinsertf128 $1, %xmm1, %ymm0, %ymm0			; AVX1-NEXT: vinsertf128 $1, %xmm1, %ymm0, %ymm0
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: dont_fold_urem_i64:			; AVX2-LABEL: dont_fold_urem_i64:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX2-NEXT: vpsrlvq {{.*}}(%rip), %ymm0, %ymm1
	; AVX2-NEXT: vmovq %xmm1, %rcx			; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm2
	; AVX2-NEXT: movabsq $7218291159277650633, %rdx # imm = 0x642C8590B21642C9			; AVX2-NEXT: vpextrq $1, %xmm2, %rax
	; AVX2-NEXT: movq %rcx, %rax			; AVX2-NEXT: movabsq $-4513890722074972339, %rcx # imm = 0xC15B704DCBCA2F4D
	; AVX2-NEXT: mulq %rdx			; AVX2-NEXT: mulq %rcx
	; AVX2-NEXT: movq %rcx, %rax			; AVX2-NEXT: vmovq %rdx, %xmm3
	; AVX2-NEXT: subq %rdx, %rax			; AVX2-NEXT: vmovq %xmm2, %rax
				; AVX2-NEXT: movabsq $7218291159277650633, %rcx # imm = 0x642C8590B21642C9
				; AVX2-NEXT: mulq %rcx
				; AVX2-NEXT: vmovq %rdx, %xmm2
				; AVX2-NEXT: vpunpcklqdq {{.*#+}} xmm3 = xmm2[0],xmm3[0]
				; AVX2-NEXT: vpextrq $1, %xmm1, %rax
				; AVX2-NEXT: movabsq $7220743857598845893, %rcx # imm = 0x64353C48064353C5
				; AVX2-NEXT: mulq %rcx
				; AVX2-NEXT: vmovq %rdx, %xmm1
				; AVX2-NEXT: vpbroadcastq %xmm1, %xmm1
				; AVX2-NEXT: vinserti128 $1, %xmm3, %ymm1, %ymm1
				; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm3
				; AVX2-NEXT: vpsubq %xmm2, %xmm3, %xmm2
				; AVX2-NEXT: vmovq %xmm2, %rax
	; AVX2-NEXT: shrq %rax			; AVX2-NEXT: shrq %rax
	; AVX2-NEXT: addq %rdx, %rax
	; AVX2-NEXT: shrq $4, %rax
	; AVX2-NEXT: leaq (%rax,%rax,2), %rdx
	; AVX2-NEXT: shlq $3, %rdx
	; AVX2-NEXT: subq %rdx, %rax
	; AVX2-NEXT: addq %rcx, %rax
	; AVX2-NEXT: vmovq %rax, %xmm2			; AVX2-NEXT: vmovq %rax, %xmm2
	; AVX2-NEXT: vpextrq $1, %xmm1, %rcx			; AVX2-NEXT: vpxor %xmm3, %xmm3, %xmm3
	; AVX2-NEXT: movabsq $-4513890722074972339, %rdx # imm = 0xC15B704DCBCA2F4D			; AVX2-NEXT: vinserti128 $1, %xmm2, %ymm3, %ymm2
	; AVX2-NEXT: movq %rcx, %rax			; AVX2-NEXT: vpaddq %ymm1, %ymm2, %ymm1
	; AVX2-NEXT: mulq %rdx			; AVX2-NEXT: vpsrlvq {{.*}}(%rip), %ymm1, %ymm1
	; AVX2-NEXT: shrq $12, %rdx			; AVX2-NEXT: vpblendd {{.*#+}} ymm1 = ymm0[0,1],ymm1[2,3,4,5,6,7]
	; AVX2-NEXT: imulq $5423, %rdx, %rax # imm = 0x152F			; AVX2-NEXT: vmovdqa {{.*#+}} ymm2 = [1,654,23,5423]
	; AVX2-NEXT: subq %rax, %rcx			; AVX2-NEXT: vpmuludq %ymm2, %ymm1, %ymm3
	; AVX2-NEXT: vmovq %rcx, %xmm1			; AVX2-NEXT: vpsrlq $32, %ymm1, %ymm1
	; AVX2-NEXT: vpunpcklqdq {{.*#+}} xmm1 = xmm2[0],xmm1[0]			; AVX2-NEXT: vpmuludq %ymm2, %ymm1, %ymm1
	; AVX2-NEXT: vpextrq $1, %xmm0, %rcx			; AVX2-NEXT: vpsllq $32, %ymm1, %ymm1
	; AVX2-NEXT: movq %rcx, %rax			; AVX2-NEXT: vpaddq %ymm1, %ymm3, %ymm1
	; AVX2-NEXT: shrq %rax			; AVX2-NEXT: vpsubq %ymm1, %ymm0, %ymm0
	; AVX2-NEXT: movabsq $7220743857598845893, %rdx # imm = 0x64353C48064353C5
	; AVX2-NEXT: mulq %rdx
	; AVX2-NEXT: shrq $7, %rdx
	; AVX2-NEXT: imulq $654, %rdx, %rax # imm = 0x28E
	; AVX2-NEXT: subq %rax, %rcx
	; AVX2-NEXT: vmovq %rcx, %xmm0
	; AVX2-NEXT: vpslldq {{.*#+}} xmm0 = zero,zero,zero,zero,zero,zero,zero,zero,xmm0[0,1,2,3,4,5,6,7]
	; AVX2-NEXT: vinserti128 $1, %xmm1, %ymm0, %ymm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	%1 = urem <4 x i64> %x, <i64 1, i64 654, i64 23, i64 5423>			%1 = urem <4 x i64> %x, <i64 1, i64 654, i64 23, i64 5423>
	ret <4 x i64> %1			ret <4 x i64> %1
	}			}
	No newline at end of file

llvm/test/CodeGen/X86/vector-idiv-sdiv-128.ll

	Show All 9 Lines
	;			;

	define <2 x i64> @test_div7_2i64(<2 x i64> %a) nounwind {			define <2 x i64> @test_div7_2i64(<2 x i64> %a) nounwind {
	; SSE2-LABEL: test_div7_2i64:			; SSE2-LABEL: test_div7_2i64:
	; SSE2: # %bb.0:			; SSE2: # %bb.0:
	; SSE2-NEXT: movq %xmm0, %rax			; SSE2-NEXT: movq %xmm0, %rax
	; SSE2-NEXT: movabsq $5270498306774157605, %rcx # imm = 0x4924924924924925			; SSE2-NEXT: movabsq $5270498306774157605, %rcx # imm = 0x4924924924924925
	; SSE2-NEXT: imulq %rcx			; SSE2-NEXT: imulq %rcx
	; SSE2-NEXT: movq %rdx, %rax
	; SSE2-NEXT: shrq $63, %rax
	; SSE2-NEXT: sarq %rdx
	; SSE2-NEXT: addq %rax, %rdx
	; SSE2-NEXT: movq %rdx, %xmm1			; SSE2-NEXT: movq %rdx, %xmm1
	; SSE2-NEXT: pshufd {{.*#+}} xmm0 = xmm0[2,3,2,3]			; SSE2-NEXT: pshufd {{.*#+}} xmm0 = xmm0[2,3,2,3]
	; SSE2-NEXT: movq %xmm0, %rax			; SSE2-NEXT: movq %xmm0, %rax
	; SSE2-NEXT: imulq %rcx			; SSE2-NEXT: imulq %rcx
	; SSE2-NEXT: movq %rdx, %rax
	; SSE2-NEXT: shrq $63, %rax
	; SSE2-NEXT: sarq %rdx
	; SSE2-NEXT: addq %rax, %rdx
	; SSE2-NEXT: movq %rdx, %xmm0			; SSE2-NEXT: movq %rdx, %xmm0
	; SSE2-NEXT: punpcklqdq {{.*#+}} xmm1 = xmm1[0],xmm0[0]			; SSE2-NEXT: punpcklqdq {{.*#+}} xmm1 = xmm1[0],xmm0[0]
	; SSE2-NEXT: movdqa %xmm1, %xmm0			; SSE2-NEXT: movdqa %xmm1, %xmm0
				; SSE2-NEXT: psrad $1, %xmm0
				; SSE2-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,3,2,3]
				; SSE2-NEXT: movdqa %xmm1, %xmm2
				; SSE2-NEXT: psrlq $1, %xmm2
				; SSE2-NEXT: pshufd {{.*#+}} xmm2 = xmm2[0,2,2,3]
				; SSE2-NEXT: punpckldq {{.*#+}} xmm2 = xmm2[0],xmm0[0],xmm2[1],xmm0[1]
				; SSE2-NEXT: psrlq $63, %xmm1
				; SSE2-NEXT: paddq %xmm2, %xmm1
				; SSE2-NEXT: movdqa %xmm1, %xmm0
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE41-LABEL: test_div7_2i64:			; SSE41-LABEL: test_div7_2i64:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: pextrq $1, %xmm0, %rax			; SSE41-NEXT: pextrq $1, %xmm0, %rax
	; SSE41-NEXT: movabsq $5270498306774157605, %rcx # imm = 0x4924924924924925			; SSE41-NEXT: movabsq $5270498306774157605, %rcx # imm = 0x4924924924924925
	; SSE41-NEXT: imulq %rcx			; SSE41-NEXT: imulq %rcx
	; SSE41-NEXT: movq %rdx, %rax
	; SSE41-NEXT: shrq $63, %rax
	; SSE41-NEXT: sarq %rdx
	; SSE41-NEXT: addq %rax, %rdx
	; SSE41-NEXT: movq %rdx, %xmm1			; SSE41-NEXT: movq %rdx, %xmm1
	; SSE41-NEXT: movq %xmm0, %rax			; SSE41-NEXT: movq %xmm0, %rax
	; SSE41-NEXT: imulq %rcx			; SSE41-NEXT: imulq %rcx
	; SSE41-NEXT: movq %rdx, %rax
	; SSE41-NEXT: shrq $63, %rax
	; SSE41-NEXT: sarq %rdx
	; SSE41-NEXT: addq %rax, %rdx
	; SSE41-NEXT: movq %rdx, %xmm0			; SSE41-NEXT: movq %rdx, %xmm0
	; SSE41-NEXT: punpcklqdq {{.*#+}} xmm0 = xmm0[0],xmm1[0]			; SSE41-NEXT: punpcklqdq {{.*#+}} xmm0 = xmm0[0],xmm1[0]
				; SSE41-NEXT: movdqa %xmm0, %xmm1
				; SSE41-NEXT: psrad $1, %xmm1
				; SSE41-NEXT: movdqa %xmm0, %xmm2
				; SSE41-NEXT: psrlq $1, %xmm2
				; SSE41-NEXT: pblendw {{.*#+}} xmm2 = xmm2[0,1],xmm1[2,3],xmm2[4,5],xmm1[6,7]
				; SSE41-NEXT: psrlq $63, %xmm0
				; SSE41-NEXT: paddq %xmm2, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX-LABEL: test_div7_2i64:			; AVX1-LABEL: test_div7_2i64:
	; AVX: # %bb.0:			; AVX1: # %bb.0:
	; AVX-NEXT: vpextrq $1, %xmm0, %rax			; AVX1-NEXT: vpextrq $1, %xmm0, %rax
	; AVX-NEXT: movabsq $5270498306774157605, %rcx # imm = 0x4924924924924925			; AVX1-NEXT: movabsq $5270498306774157605, %rcx # imm = 0x4924924924924925
	; AVX-NEXT: imulq %rcx			; AVX1-NEXT: imulq %rcx
	; AVX-NEXT: movq %rdx, %rax			; AVX1-NEXT: vmovq %rdx, %xmm1
	; AVX-NEXT: shrq $63, %rax			; AVX1-NEXT: vmovq %xmm0, %rax
	; AVX-NEXT: sarq %rdx			; AVX1-NEXT: imulq %rcx
	; AVX-NEXT: addq %rax, %rdx			; AVX1-NEXT: vmovq %rdx, %xmm0
	; AVX-NEXT: vmovq %rdx, %xmm1			; AVX1-NEXT: vpunpcklqdq {{.*#+}} xmm0 = xmm0[0],xmm1[0]
	; AVX-NEXT: vmovq %xmm0, %rax			; AVX1-NEXT: vpsrad $1, %xmm0, %xmm1
	; AVX-NEXT: imulq %rcx			; AVX1-NEXT: vpsrlq $1, %xmm0, %xmm2
	; AVX-NEXT: movq %rdx, %rax			; AVX1-NEXT: vpblendw {{.*#+}} xmm1 = xmm2[0,1],xmm1[2,3],xmm2[4,5],xmm1[6,7]
	; AVX-NEXT: shrq $63, %rax			; AVX1-NEXT: vpsrlq $63, %xmm0, %xmm0
	; AVX-NEXT: sarq %rdx			; AVX1-NEXT: vpaddq %xmm0, %xmm1, %xmm0
	; AVX-NEXT: addq %rax, %rdx			; AVX1-NEXT: retq
	; AVX-NEXT: vmovq %rdx, %xmm0			;
	; AVX-NEXT: vpunpcklqdq {{.*#+}} xmm0 = xmm0[0],xmm1[0]			; AVX2NOBW-LABEL: test_div7_2i64:
	; AVX-NEXT: retq			; AVX2NOBW: # %bb.0:
				; AVX2NOBW-NEXT: vpextrq $1, %xmm0, %rax
				; AVX2NOBW-NEXT: movabsq $5270498306774157605, %rcx # imm = 0x4924924924924925
				; AVX2NOBW-NEXT: imulq %rcx
				; AVX2NOBW-NEXT: vmovq %rdx, %xmm1
				; AVX2NOBW-NEXT: vmovq %xmm0, %rax
				; AVX2NOBW-NEXT: imulq %rcx
				; AVX2NOBW-NEXT: vmovq %rdx, %xmm0
				; AVX2NOBW-NEXT: vpunpcklqdq {{.*#+}} xmm0 = xmm0[0],xmm1[0]
				; AVX2NOBW-NEXT: vpsrad $1, %xmm0, %xmm1
				; AVX2NOBW-NEXT: vpsrlq $1, %xmm0, %xmm2
				; AVX2NOBW-NEXT: vpblendd {{.*#+}} xmm1 = xmm2[0],xmm1[1],xmm2[2],xmm1[3]
				; AVX2NOBW-NEXT: vpsrlq $63, %xmm0, %xmm0
				; AVX2NOBW-NEXT: vpaddq %xmm0, %xmm1, %xmm0
				; AVX2NOBW-NEXT: retq
				;
				; AVX512BW-LABEL: test_div7_2i64:
				; AVX512BW: # %bb.0:
				; AVX512BW-NEXT: vpextrq $1, %xmm0, %rax
				; AVX512BW-NEXT: movabsq $5270498306774157605, %rcx # imm = 0x4924924924924925
				; AVX512BW-NEXT: imulq %rcx
				; AVX512BW-NEXT: vmovq %rdx, %xmm1
				; AVX512BW-NEXT: vmovq %xmm0, %rax
				; AVX512BW-NEXT: imulq %rcx
				; AVX512BW-NEXT: vmovq %rdx, %xmm0
				; AVX512BW-NEXT: vpunpcklqdq {{.*#+}} xmm0 = xmm0[0],xmm1[0]
				; AVX512BW-NEXT: vpsrlq $63, %xmm0, %xmm1
				; AVX512BW-NEXT: vpsraq $1, %zmm0, %zmm0
				; AVX512BW-NEXT: vpaddq %xmm1, %xmm0, %xmm0
				; AVX512BW-NEXT: vzeroupper
				; AVX512BW-NEXT: retq
	%res = sdiv <2 x i64> %a, <i64 7, i64 7>			%res = sdiv <2 x i64> %a, <i64 7, i64 7>
	ret <2 x i64> %res			ret <2 x i64> %res
	}			}

	define <4 x i32> @test_div7_4i32(<4 x i32> %a) nounwind {			define <4 x i32> @test_div7_4i32(<4 x i32> %a) nounwind {
	; SSE2-LABEL: test_div7_4i32:			; SSE2-LABEL: test_div7_4i32:
	; SSE2: # %bb.0:			; SSE2: # %bb.0:
	; SSE2-NEXT: movdqa {{.*#+}} xmm2 = [2454267027,2454267027,2454267027,2454267027]			; SSE2-NEXT: movdqa {{.*#+}} xmm2 = [2454267027,2454267027,2454267027,2454267027]
	▲ Show 20 Lines • Show All 328 Lines • ▼ Show 20 Lines

	;			;
	; srem by 7			; srem by 7
	;			;

	define <2 x i64> @test_rem7_2i64(<2 x i64> %a) nounwind {			define <2 x i64> @test_rem7_2i64(<2 x i64> %a) nounwind {
	; SSE2-LABEL: test_rem7_2i64:			; SSE2-LABEL: test_rem7_2i64:
	; SSE2: # %bb.0:			; SSE2: # %bb.0:
	; SSE2-NEXT: movq %xmm0, %rcx			; SSE2-NEXT: movq %xmm0, %rax
	; SSE2-NEXT: movabsq $5270498306774157605, %rsi # imm = 0x4924924924924925			; SSE2-NEXT: movabsq $5270498306774157605, %rcx # imm = 0x4924924924924925
	; SSE2-NEXT: movq %rcx, %rax			; SSE2-NEXT: imulq %rcx
	; SSE2-NEXT: imulq %rsi
	; SSE2-NEXT: movq %rdx, %rax
	; SSE2-NEXT: shrq $63, %rax
	; SSE2-NEXT: sarq %rdx
	; SSE2-NEXT: addq %rax, %rdx
	; SSE2-NEXT: leaq (,%rdx,8), %rax
	; SSE2-NEXT: subq %rax, %rdx
	; SSE2-NEXT: addq %rcx, %rdx
	; SSE2-NEXT: movq %rdx, %xmm1			; SSE2-NEXT: movq %rdx, %xmm1
	; SSE2-NEXT: pshufd {{.*#+}} xmm0 = xmm0[2,3,2,3]			; SSE2-NEXT: pshufd {{.*#+}} xmm2 = xmm0[2,3,2,3]
	; SSE2-NEXT: movq %xmm0, %rcx			; SSE2-NEXT: movq %xmm2, %rax
	; SSE2-NEXT: movq %rcx, %rax			; SSE2-NEXT: imulq %rcx
	; SSE2-NEXT: imulq %rsi			; SSE2-NEXT: movq %rdx, %xmm2
	; SSE2-NEXT: movq %rdx, %rax			; SSE2-NEXT: punpcklqdq {{.*#+}} xmm1 = xmm1[0],xmm2[0]
	; SSE2-NEXT: shrq $63, %rax			; SSE2-NEXT: movdqa %xmm1, %xmm2
	; SSE2-NEXT: sarq %rdx			; SSE2-NEXT: psrad $1, %xmm2
	; SSE2-NEXT: addq %rax, %rdx			; SSE2-NEXT: pshufd {{.*#+}} xmm2 = xmm2[1,3,2,3]
	; SSE2-NEXT: leaq (,%rdx,8), %rax			; SSE2-NEXT: movdqa %xmm1, %xmm3
	; SSE2-NEXT: subq %rax, %rdx			; SSE2-NEXT: psrlq $1, %xmm3
	; SSE2-NEXT: addq %rcx, %rdx			; SSE2-NEXT: pshufd {{.*#+}} xmm3 = xmm3[0,2,2,3]
	; SSE2-NEXT: movq %rdx, %xmm0			; SSE2-NEXT: punpckldq {{.*#+}} xmm3 = xmm3[0],xmm2[0],xmm3[1],xmm2[1]
	; SSE2-NEXT: punpcklqdq {{.*#+}} xmm1 = xmm1[0],xmm0[0]			; SSE2-NEXT: psrlq $63, %xmm1
	; SSE2-NEXT: movdqa %xmm1, %xmm0			; SSE2-NEXT: paddq %xmm3, %xmm1
				; SSE2-NEXT: movdqa %xmm1, %xmm2
				; SSE2-NEXT: psllq $3, %xmm2
				; SSE2-NEXT: psubq %xmm2, %xmm1
				; SSE2-NEXT: paddq %xmm1, %xmm0
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE41-LABEL: test_rem7_2i64:			; SSE41-LABEL: test_rem7_2i64:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: pextrq $1, %xmm0, %rcx			; SSE41-NEXT: pextrq $1, %xmm0, %rax
	; SSE41-NEXT: movabsq $5270498306774157605, %rsi # imm = 0x4924924924924925			; SSE41-NEXT: movabsq $5270498306774157605, %rcx # imm = 0x4924924924924925
	; SSE41-NEXT: movq %rcx, %rax			; SSE41-NEXT: imulq %rcx
	; SSE41-NEXT: imulq %rsi
	; SSE41-NEXT: movq %rdx, %rax
	; SSE41-NEXT: shrq $63, %rax
	; SSE41-NEXT: sarq %rdx
	; SSE41-NEXT: addq %rax, %rdx
	; SSE41-NEXT: leaq (,%rdx,8), %rax
	; SSE41-NEXT: subq %rax, %rdx
	; SSE41-NEXT: addq %rcx, %rdx
	; SSE41-NEXT: movq %rdx, %xmm1			; SSE41-NEXT: movq %rdx, %xmm1
	; SSE41-NEXT: movq %xmm0, %rcx			; SSE41-NEXT: movq %xmm0, %rax
	; SSE41-NEXT: movq %rcx, %rax			; SSE41-NEXT: imulq %rcx
	; SSE41-NEXT: imulq %rsi			; SSE41-NEXT: movq %rdx, %xmm2
	; SSE41-NEXT: movq %rdx, %rax			; SSE41-NEXT: punpcklqdq {{.*#+}} xmm2 = xmm2[0],xmm1[0]
	; SSE41-NEXT: shrq $63, %rax			; SSE41-NEXT: movdqa %xmm2, %xmm1
	; SSE41-NEXT: sarq %rdx			; SSE41-NEXT: psrad $1, %xmm1
	; SSE41-NEXT: addq %rax, %rdx			; SSE41-NEXT: movdqa %xmm2, %xmm3
	; SSE41-NEXT: leaq (,%rdx,8), %rax			; SSE41-NEXT: psrlq $1, %xmm3
	; SSE41-NEXT: subq %rax, %rdx			; SSE41-NEXT: pblendw {{.*#+}} xmm3 = xmm3[0,1],xmm1[2,3],xmm3[4,5],xmm1[6,7]
	; SSE41-NEXT: addq %rcx, %rdx			; SSE41-NEXT: psrlq $63, %xmm2
	; SSE41-NEXT: movq %rdx, %xmm0			; SSE41-NEXT: paddq %xmm3, %xmm2
	; SSE41-NEXT: punpcklqdq {{.*#+}} xmm0 = xmm0[0],xmm1[0]			; SSE41-NEXT: movdqa %xmm2, %xmm1
				; SSE41-NEXT: psllq $3, %xmm1
				; SSE41-NEXT: psubq %xmm1, %xmm2
				; SSE41-NEXT: paddq %xmm2, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX-LABEL: test_rem7_2i64:			; AVX1-LABEL: test_rem7_2i64:
	; AVX: # %bb.0:			; AVX1: # %bb.0:
	; AVX-NEXT: vpextrq $1, %xmm0, %rcx			; AVX1-NEXT: vpextrq $1, %xmm0, %rax
	; AVX-NEXT: movabsq $5270498306774157605, %rsi # imm = 0x4924924924924925			; AVX1-NEXT: movabsq $5270498306774157605, %rcx # imm = 0x4924924924924925
	; AVX-NEXT: movq %rcx, %rax			; AVX1-NEXT: imulq %rcx
	; AVX-NEXT: imulq %rsi			; AVX1-NEXT: vmovq %rdx, %xmm1
	; AVX-NEXT: movq %rdx, %rax			; AVX1-NEXT: vmovq %xmm0, %rax
	; AVX-NEXT: shrq $63, %rax			; AVX1-NEXT: imulq %rcx
	; AVX-NEXT: sarq %rdx			; AVX1-NEXT: vmovq %rdx, %xmm2
	; AVX-NEXT: addq %rax, %rdx			; AVX1-NEXT: vpunpcklqdq {{.*#+}} xmm1 = xmm2[0],xmm1[0]
	; AVX-NEXT: leaq (,%rdx,8), %rax			; AVX1-NEXT: vpsrad $1, %xmm1, %xmm2
	; AVX-NEXT: subq %rax, %rdx			; AVX1-NEXT: vpsrlq $1, %xmm1, %xmm3
	; AVX-NEXT: addq %rcx, %rdx			; AVX1-NEXT: vpblendw {{.*#+}} xmm2 = xmm3[0,1],xmm2[2,3],xmm3[4,5],xmm2[6,7]
	; AVX-NEXT: vmovq %rdx, %xmm1			; AVX1-NEXT: vpsrlq $63, %xmm1, %xmm1
	; AVX-NEXT: vmovq %xmm0, %rcx			; AVX1-NEXT: vpaddq %xmm1, %xmm2, %xmm1
	; AVX-NEXT: movq %rcx, %rax			; AVX1-NEXT: vpsllq $3, %xmm1, %xmm2
	; AVX-NEXT: imulq %rsi			; AVX1-NEXT: vpsubq %xmm2, %xmm1, %xmm1
	; AVX-NEXT: movq %rdx, %rax			; AVX1-NEXT: vpaddq %xmm1, %xmm0, %xmm0
	; AVX-NEXT: shrq $63, %rax			; AVX1-NEXT: retq
	; AVX-NEXT: sarq %rdx			;
	; AVX-NEXT: addq %rax, %rdx			; AVX2NOBW-LABEL: test_rem7_2i64:
	; AVX-NEXT: leaq (,%rdx,8), %rax			; AVX2NOBW: # %bb.0:
	; AVX-NEXT: subq %rax, %rdx			; AVX2NOBW-NEXT: vpextrq $1, %xmm0, %rax
	; AVX-NEXT: addq %rcx, %rdx			; AVX2NOBW-NEXT: movabsq $5270498306774157605, %rcx # imm = 0x4924924924924925
	; AVX-NEXT: vmovq %rdx, %xmm0			; AVX2NOBW-NEXT: imulq %rcx
	; AVX-NEXT: vpunpcklqdq {{.*#+}} xmm0 = xmm0[0],xmm1[0]			; AVX2NOBW-NEXT: vmovq %rdx, %xmm1
	; AVX-NEXT: retq			; AVX2NOBW-NEXT: vmovq %xmm0, %rax
				; AVX2NOBW-NEXT: imulq %rcx
				; AVX2NOBW-NEXT: vmovq %rdx, %xmm2
				; AVX2NOBW-NEXT: vpunpcklqdq {{.*#+}} xmm1 = xmm2[0],xmm1[0]
				; AVX2NOBW-NEXT: vpsrad $1, %xmm1, %xmm2
				; AVX2NOBW-NEXT: vpsrlq $1, %xmm1, %xmm3
				; AVX2NOBW-NEXT: vpblendd {{.*#+}} xmm2 = xmm3[0],xmm2[1],xmm3[2],xmm2[3]
				; AVX2NOBW-NEXT: vpsrlq $63, %xmm1, %xmm1
				; AVX2NOBW-NEXT: vpaddq %xmm1, %xmm2, %xmm1
				; AVX2NOBW-NEXT: vpsllq $3, %xmm1, %xmm2
				; AVX2NOBW-NEXT: vpsubq %xmm2, %xmm1, %xmm1
				; AVX2NOBW-NEXT: vpaddq %xmm1, %xmm0, %xmm0
				; AVX2NOBW-NEXT: retq
				;
				; AVX512BW-LABEL: test_rem7_2i64:
				; AVX512BW: # %bb.0:
				; AVX512BW-NEXT: vpextrq $1, %xmm0, %rax
				; AVX512BW-NEXT: movabsq $5270498306774157605, %rcx # imm = 0x4924924924924925
				; AVX512BW-NEXT: imulq %rcx
				; AVX512BW-NEXT: vmovq %rdx, %xmm1
				; AVX512BW-NEXT: vmovq %xmm0, %rax
				; AVX512BW-NEXT: imulq %rcx
				; AVX512BW-NEXT: vmovq %rdx, %xmm2
				; AVX512BW-NEXT: vpunpcklqdq {{.*#+}} xmm1 = xmm2[0],xmm1[0]
				; AVX512BW-NEXT: vpsrlq $63, %xmm1, %xmm2
				; AVX512BW-NEXT: vpsraq $1, %zmm1, %zmm1
				; AVX512BW-NEXT: vpaddq %xmm2, %xmm1, %xmm1
				; AVX512BW-NEXT: vpsllq $3, %xmm1, %xmm2
				; AVX512BW-NEXT: vpsubq %xmm2, %xmm1, %xmm1
				; AVX512BW-NEXT: vpaddq %xmm1, %xmm0, %xmm0
				; AVX512BW-NEXT: vzeroupper
				; AVX512BW-NEXT: retq
	%res = srem <2 x i64> %a, <i64 7, i64 7>			%res = srem <2 x i64> %a, <i64 7, i64 7>
	ret <2 x i64> %res			ret <2 x i64> %res
	}			}

	define <4 x i32> @test_rem7_4i32(<4 x i32> %a) nounwind {			define <4 x i32> @test_rem7_4i32(<4 x i32> %a) nounwind {
	; SSE2-LABEL: test_rem7_4i32:			; SSE2-LABEL: test_rem7_4i32:
	; SSE2: # %bb.0:			; SSE2: # %bb.0:
	; SSE2-NEXT: movdqa {{.*#+}} xmm1 = [2454267027,2454267027,2454267027,2454267027]			; SSE2-NEXT: movdqa {{.*#+}} xmm1 = [2454267027,2454267027,2454267027,2454267027]
	▲ Show 20 Lines • Show All 693 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/vector-idiv-sdiv-256.ll

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx \| FileCheck %s --check-prefix=AVX1			; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx \| FileCheck %s --check-prefix=AVX1
	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx2 \| FileCheck %s --check-prefix=AVX2 --check-prefix=AVX2NOBW			; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx2 \| FileCheck %s --check-prefix=AVX2 --check-prefix=AVX2NOBW
	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx512bw \| FileCheck %s --check-prefix=AVX2 --check-prefix=AVX512BW			; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx512bw \| FileCheck %s --check-prefix=AVX2 --check-prefix=AVX512BW

	;			;
	; sdiv by 7			; sdiv by 7
	;			;

	define <4 x i64> @test_div7_4i64(<4 x i64> %a) nounwind {			define <4 x i64> @test_div7_4i64(<4 x i64> %a) nounwind {
	; AVX1-LABEL: test_div7_4i64:			; AVX1-LABEL: test_div7_4i64:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1
	; AVX1-NEXT: vpextrq $1, %xmm1, %rax			; AVX1-NEXT: vpextrq $1, %xmm1, %rax
	; AVX1-NEXT: movabsq $5270498306774157605, %rcx # imm = 0x4924924924924925			; AVX1-NEXT: movabsq $5270498306774157605, %rcx # imm = 0x4924924924924925
	; AVX1-NEXT: imulq %rcx			; AVX1-NEXT: imulq %rcx
	; AVX1-NEXT: movq %rdx, %rax
	; AVX1-NEXT: shrq $63, %rax
	; AVX1-NEXT: sarq %rdx
	; AVX1-NEXT: addq %rax, %rdx
	; AVX1-NEXT: vmovq %rdx, %xmm2			; AVX1-NEXT: vmovq %rdx, %xmm2
	; AVX1-NEXT: vmovq %xmm1, %rax			; AVX1-NEXT: vmovq %xmm1, %rax
	; AVX1-NEXT: imulq %rcx			; AVX1-NEXT: imulq %rcx
	; AVX1-NEXT: movq %rdx, %rax
	; AVX1-NEXT: shrq $63, %rax
	; AVX1-NEXT: sarq %rdx
	; AVX1-NEXT: addq %rax, %rdx
	; AVX1-NEXT: vmovq %rdx, %xmm1			; AVX1-NEXT: vmovq %rdx, %xmm1
	; AVX1-NEXT: vpunpcklqdq {{.*#+}} xmm1 = xmm1[0],xmm2[0]			; AVX1-NEXT: vpunpcklqdq {{.*#+}} xmm1 = xmm1[0],xmm2[0]
				; AVX1-NEXT: vpsrad $1, %xmm1, %xmm2
				; AVX1-NEXT: vpsrlq $1, %xmm1, %xmm3
				; AVX1-NEXT: vpblendw {{.*#+}} xmm2 = xmm3[0,1],xmm2[2,3],xmm3[4,5],xmm2[6,7]
				; AVX1-NEXT: vpsrlq $63, %xmm1, %xmm1
				; AVX1-NEXT: vpaddq %xmm1, %xmm2, %xmm1
	; AVX1-NEXT: vpextrq $1, %xmm0, %rax			; AVX1-NEXT: vpextrq $1, %xmm0, %rax
	; AVX1-NEXT: imulq %rcx			; AVX1-NEXT: imulq %rcx
	; AVX1-NEXT: movq %rdx, %rax
	; AVX1-NEXT: shrq $63, %rax
	; AVX1-NEXT: sarq %rdx
	; AVX1-NEXT: addq %rax, %rdx
	; AVX1-NEXT: vmovq %rdx, %xmm2			; AVX1-NEXT: vmovq %rdx, %xmm2
	; AVX1-NEXT: vmovq %xmm0, %rax			; AVX1-NEXT: vmovq %xmm0, %rax
	; AVX1-NEXT: imulq %rcx			; AVX1-NEXT: imulq %rcx
	; AVX1-NEXT: movq %rdx, %rax
	; AVX1-NEXT: shrq $63, %rax
	; AVX1-NEXT: sarq %rdx
	; AVX1-NEXT: addq %rax, %rdx
	; AVX1-NEXT: vmovq %rdx, %xmm0			; AVX1-NEXT: vmovq %rdx, %xmm0
	; AVX1-NEXT: vpunpcklqdq {{.*#+}} xmm0 = xmm0[0],xmm2[0]			; AVX1-NEXT: vpunpcklqdq {{.*#+}} xmm0 = xmm0[0],xmm2[0]
				; AVX1-NEXT: vpsrad $1, %xmm0, %xmm2
				; AVX1-NEXT: vpsrlq $1, %xmm0, %xmm3
				; AVX1-NEXT: vpblendw {{.*#+}} xmm2 = xmm3[0,1],xmm2[2,3],xmm3[4,5],xmm2[6,7]
				; AVX1-NEXT: vpsrlq $63, %xmm0, %xmm0
				; AVX1-NEXT: vpaddq %xmm0, %xmm2, %xmm0
	; AVX1-NEXT: vinsertf128 $1, %xmm1, %ymm0, %ymm0			; AVX1-NEXT: vinsertf128 $1, %xmm1, %ymm0, %ymm0
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: test_div7_4i64:			; AVX2NOBW-LABEL: test_div7_4i64:
	; AVX2: # %bb.0:			; AVX2NOBW: # %bb.0:
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX2NOBW-NEXT: vextracti128 $1, %ymm0, %xmm1
	; AVX2-NEXT: vpextrq $1, %xmm1, %rax			; AVX2NOBW-NEXT: vpextrq $1, %xmm1, %rax
	; AVX2-NEXT: movabsq $5270498306774157605, %rcx # imm = 0x4924924924924925			; AVX2NOBW-NEXT: movabsq $5270498306774157605, %rcx # imm = 0x4924924924924925
	; AVX2-NEXT: imulq %rcx			; AVX2NOBW-NEXT: imulq %rcx
	; AVX2-NEXT: movq %rdx, %rax			; AVX2NOBW-NEXT: vmovq %rdx, %xmm2
	; AVX2-NEXT: shrq $63, %rax			; AVX2NOBW-NEXT: vmovq %xmm1, %rax
	; AVX2-NEXT: sarq %rdx			; AVX2NOBW-NEXT: imulq %rcx
	; AVX2-NEXT: addq %rax, %rdx			; AVX2NOBW-NEXT: vmovq %rdx, %xmm1
	; AVX2-NEXT: vmovq %rdx, %xmm2			; AVX2NOBW-NEXT: vpunpcklqdq {{.*#+}} xmm1 = xmm1[0],xmm2[0]
	; AVX2-NEXT: vmovq %xmm1, %rax			; AVX2NOBW-NEXT: vpextrq $1, %xmm0, %rax
	; AVX2-NEXT: imulq %rcx			; AVX2NOBW-NEXT: imulq %rcx
	; AVX2-NEXT: movq %rdx, %rax			; AVX2NOBW-NEXT: vmovq %rdx, %xmm2
	; AVX2-NEXT: shrq $63, %rax			; AVX2NOBW-NEXT: vmovq %xmm0, %rax
	; AVX2-NEXT: sarq %rdx			; AVX2NOBW-NEXT: imulq %rcx
	; AVX2-NEXT: addq %rax, %rdx			; AVX2NOBW-NEXT: vmovq %rdx, %xmm0
	; AVX2-NEXT: vmovq %rdx, %xmm1			; AVX2NOBW-NEXT: vpunpcklqdq {{.*#+}} xmm0 = xmm0[0],xmm2[0]
	; AVX2-NEXT: vpunpcklqdq {{.*#+}} xmm1 = xmm1[0],xmm2[0]			; AVX2NOBW-NEXT: vinserti128 $1, %xmm1, %ymm0, %ymm0
	; AVX2-NEXT: vpextrq $1, %xmm0, %rax			; AVX2NOBW-NEXT: vpsrad $1, %ymm0, %ymm1
	; AVX2-NEXT: imulq %rcx			; AVX2NOBW-NEXT: vpsrlq $1, %ymm0, %ymm2
	; AVX2-NEXT: movq %rdx, %rax			; AVX2NOBW-NEXT: vpblendd {{.*#+}} ymm1 = ymm2[0],ymm1[1],ymm2[2],ymm1[3],ymm2[4],ymm1[5],ymm2[6],ymm1[7]
	; AVX2-NEXT: shrq $63, %rax			; AVX2NOBW-NEXT: vpsrlq $63, %ymm0, %ymm0
	; AVX2-NEXT: sarq %rdx			; AVX2NOBW-NEXT: vpaddq %ymm0, %ymm1, %ymm0
	; AVX2-NEXT: addq %rax, %rdx			; AVX2NOBW-NEXT: retq
	; AVX2-NEXT: vmovq %rdx, %xmm2			;
	; AVX2-NEXT: vmovq %xmm0, %rax			; AVX512BW-LABEL: test_div7_4i64:
	; AVX2-NEXT: imulq %rcx			; AVX512BW: # %bb.0:
	; AVX2-NEXT: movq %rdx, %rax			; AVX512BW-NEXT: vextracti128 $1, %ymm0, %xmm1
	; AVX2-NEXT: shrq $63, %rax			; AVX512BW-NEXT: vpextrq $1, %xmm1, %rax
	; AVX2-NEXT: sarq %rdx			; AVX512BW-NEXT: movabsq $5270498306774157605, %rcx # imm = 0x4924924924924925
	; AVX2-NEXT: addq %rax, %rdx			; AVX512BW-NEXT: imulq %rcx
	; AVX2-NEXT: vmovq %rdx, %xmm0			; AVX512BW-NEXT: vmovq %rdx, %xmm2
	; AVX2-NEXT: vpunpcklqdq {{.*#+}} xmm0 = xmm0[0],xmm2[0]			; AVX512BW-NEXT: vmovq %xmm1, %rax
	; AVX2-NEXT: vinserti128 $1, %xmm1, %ymm0, %ymm0			; AVX512BW-NEXT: imulq %rcx
	; AVX2-NEXT: retq			; AVX512BW-NEXT: vmovq %rdx, %xmm1
				; AVX512BW-NEXT: vpunpcklqdq {{.*#+}} xmm1 = xmm1[0],xmm2[0]
				; AVX512BW-NEXT: vpextrq $1, %xmm0, %rax
				; AVX512BW-NEXT: imulq %rcx
				; AVX512BW-NEXT: vmovq %rdx, %xmm2
				; AVX512BW-NEXT: vmovq %xmm0, %rax
				; AVX512BW-NEXT: imulq %rcx
				; AVX512BW-NEXT: vmovq %rdx, %xmm0
				; AVX512BW-NEXT: vpunpcklqdq {{.*#+}} xmm0 = xmm0[0],xmm2[0]
				; AVX512BW-NEXT: vinserti128 $1, %xmm1, %ymm0, %ymm0
				; AVX512BW-NEXT: vpsrlq $63, %ymm0, %ymm1
				; AVX512BW-NEXT: vpsraq $1, %zmm0, %zmm0
				; AVX512BW-NEXT: vpaddq %ymm1, %ymm0, %ymm0
				; AVX512BW-NEXT: retq
	%res = sdiv <4 x i64> %a, <i64 7, i64 7, i64 7, i64 7>			%res = sdiv <4 x i64> %a, <i64 7, i64 7, i64 7, i64 7>
	ret <4 x i64> %res			ret <4 x i64> %res
	}			}

	define <8 x i32> @test_div7_8i32(<8 x i32> %a) nounwind {			define <8 x i32> @test_div7_8i32(<8 x i32> %a) nounwind {
	; AVX1-LABEL: test_div7_8i32:			; AVX1-LABEL: test_div7_8i32:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1
	▲ Show 20 Lines • Show All 254 Lines • ▼ Show 20 Lines
	;			;
	; srem by 7			; srem by 7
	;			;

	define <4 x i64> @test_rem7_4i64(<4 x i64> %a) nounwind {			define <4 x i64> @test_rem7_4i64(<4 x i64> %a) nounwind {
	; AVX1-LABEL: test_rem7_4i64:			; AVX1-LABEL: test_rem7_4i64:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1
	; AVX1-NEXT: vpextrq $1, %xmm1, %rcx			; AVX1-NEXT: vpextrq $1, %xmm1, %rax
	; AVX1-NEXT: movabsq $5270498306774157605, %rsi # imm = 0x4924924924924925			; AVX1-NEXT: movabsq $5270498306774157605, %rcx # imm = 0x4924924924924925
	; AVX1-NEXT: movq %rcx, %rax			; AVX1-NEXT: imulq %rcx
	; AVX1-NEXT: imulq %rsi
	; AVX1-NEXT: movq %rdx, %rax
	; AVX1-NEXT: shrq $63, %rax
	; AVX1-NEXT: sarq %rdx
	; AVX1-NEXT: addq %rax, %rdx
	; AVX1-NEXT: leaq (,%rdx,8), %rax
	; AVX1-NEXT: subq %rax, %rdx
	; AVX1-NEXT: addq %rcx, %rdx
	; AVX1-NEXT: vmovq %rdx, %xmm2			; AVX1-NEXT: vmovq %rdx, %xmm2
	; AVX1-NEXT: vmovq %xmm1, %rcx			; AVX1-NEXT: vmovq %xmm1, %rax
	; AVX1-NEXT: movq %rcx, %rax			; AVX1-NEXT: imulq %rcx
	; AVX1-NEXT: imulq %rsi			; AVX1-NEXT: vmovq %rdx, %xmm3
	; AVX1-NEXT: movq %rdx, %rax			; AVX1-NEXT: vpunpcklqdq {{.*#+}} xmm2 = xmm3[0],xmm2[0]
	; AVX1-NEXT: shrq $63, %rax			; AVX1-NEXT: vpsrad $1, %xmm2, %xmm3
	; AVX1-NEXT: sarq %rdx			; AVX1-NEXT: vpsrlq $1, %xmm2, %xmm4
	; AVX1-NEXT: addq %rax, %rdx			; AVX1-NEXT: vpblendw {{.*#+}} xmm3 = xmm4[0,1],xmm3[2,3],xmm4[4,5],xmm3[6,7]
	; AVX1-NEXT: leaq (,%rdx,8), %rax			; AVX1-NEXT: vpsrlq $63, %xmm2, %xmm2
	; AVX1-NEXT: subq %rax, %rdx			; AVX1-NEXT: vpaddq %xmm2, %xmm3, %xmm2
	; AVX1-NEXT: addq %rcx, %rdx			; AVX1-NEXT: vpsllq $3, %xmm2, %xmm3
	; AVX1-NEXT: vmovq %rdx, %xmm1			; AVX1-NEXT: vpsubq %xmm3, %xmm2, %xmm2
	; AVX1-NEXT: vpunpcklqdq {{.*#+}} xmm1 = xmm1[0],xmm2[0]			; AVX1-NEXT: vpaddq %xmm2, %xmm1, %xmm1
	; AVX1-NEXT: vpextrq $1, %xmm0, %rcx			; AVX1-NEXT: vpextrq $1, %xmm0, %rax
	; AVX1-NEXT: movq %rcx, %rax			; AVX1-NEXT: imulq %rcx
	; AVX1-NEXT: imulq %rsi
	; AVX1-NEXT: movq %rdx, %rax
	; AVX1-NEXT: shrq $63, %rax
	; AVX1-NEXT: sarq %rdx
	; AVX1-NEXT: addq %rax, %rdx
	; AVX1-NEXT: leaq (,%rdx,8), %rax
	; AVX1-NEXT: subq %rax, %rdx
	; AVX1-NEXT: addq %rcx, %rdx
	; AVX1-NEXT: vmovq %rdx, %xmm2			; AVX1-NEXT: vmovq %rdx, %xmm2
	; AVX1-NEXT: vmovq %xmm0, %rcx			; AVX1-NEXT: vmovq %xmm0, %rax
	; AVX1-NEXT: movq %rcx, %rax			; AVX1-NEXT: imulq %rcx
	; AVX1-NEXT: imulq %rsi			; AVX1-NEXT: vmovq %rdx, %xmm3
	; AVX1-NEXT: movq %rdx, %rax			; AVX1-NEXT: vpunpcklqdq {{.*#+}} xmm2 = xmm3[0],xmm2[0]
	; AVX1-NEXT: shrq $63, %rax			; AVX1-NEXT: vpsrad $1, %xmm2, %xmm3
	; AVX1-NEXT: sarq %rdx			; AVX1-NEXT: vpsrlq $1, %xmm2, %xmm4
	; AVX1-NEXT: addq %rax, %rdx			; AVX1-NEXT: vpblendw {{.*#+}} xmm3 = xmm4[0,1],xmm3[2,3],xmm4[4,5],xmm3[6,7]
	; AVX1-NEXT: leaq (,%rdx,8), %rax			; AVX1-NEXT: vpsrlq $63, %xmm2, %xmm2
	; AVX1-NEXT: subq %rax, %rdx			; AVX1-NEXT: vpaddq %xmm2, %xmm3, %xmm2
	; AVX1-NEXT: addq %rcx, %rdx			; AVX1-NEXT: vpsllq $3, %xmm2, %xmm3
	; AVX1-NEXT: vmovq %rdx, %xmm0			; AVX1-NEXT: vpsubq %xmm3, %xmm2, %xmm2
	; AVX1-NEXT: vpunpcklqdq {{.*#+}} xmm0 = xmm0[0],xmm2[0]			; AVX1-NEXT: vpaddq %xmm2, %xmm0, %xmm0
	; AVX1-NEXT: vinsertf128 $1, %xmm1, %ymm0, %ymm0			; AVX1-NEXT: vinsertf128 $1, %xmm1, %ymm0, %ymm0
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: test_rem7_4i64:			; AVX2NOBW-LABEL: test_rem7_4i64:
	; AVX2: # %bb.0:			; AVX2NOBW: # %bb.0:
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX2NOBW-NEXT: vextracti128 $1, %ymm0, %xmm1
	; AVX2-NEXT: vpextrq $1, %xmm1, %rcx			; AVX2NOBW-NEXT: vpextrq $1, %xmm1, %rax
	; AVX2-NEXT: movabsq $5270498306774157605, %rsi # imm = 0x4924924924924925			; AVX2NOBW-NEXT: movabsq $5270498306774157605, %rcx # imm = 0x4924924924924925
	; AVX2-NEXT: movq %rcx, %rax			; AVX2NOBW-NEXT: imulq %rcx
	; AVX2-NEXT: imulq %rsi			; AVX2NOBW-NEXT: vmovq %rdx, %xmm2
	; AVX2-NEXT: movq %rdx, %rax			; AVX2NOBW-NEXT: vmovq %xmm1, %rax
	; AVX2-NEXT: shrq $63, %rax			; AVX2NOBW-NEXT: imulq %rcx
	; AVX2-NEXT: sarq %rdx			; AVX2NOBW-NEXT: vmovq %rdx, %xmm1
	; AVX2-NEXT: addq %rax, %rdx			; AVX2NOBW-NEXT: vpunpcklqdq {{.*#+}} xmm1 = xmm1[0],xmm2[0]
	; AVX2-NEXT: leaq (,%rdx,8), %rax			; AVX2NOBW-NEXT: vpextrq $1, %xmm0, %rax
	; AVX2-NEXT: subq %rax, %rdx			; AVX2NOBW-NEXT: imulq %rcx
	; AVX2-NEXT: addq %rcx, %rdx			; AVX2NOBW-NEXT: vmovq %rdx, %xmm2
	; AVX2-NEXT: vmovq %rdx, %xmm2			; AVX2NOBW-NEXT: vmovq %xmm0, %rax
	; AVX2-NEXT: vmovq %xmm1, %rcx			; AVX2NOBW-NEXT: imulq %rcx
	; AVX2-NEXT: movq %rcx, %rax			; AVX2NOBW-NEXT: vmovq %rdx, %xmm3
	; AVX2-NEXT: imulq %rsi			; AVX2NOBW-NEXT: vpunpcklqdq {{.*#+}} xmm2 = xmm3[0],xmm2[0]
	; AVX2-NEXT: movq %rdx, %rax			; AVX2NOBW-NEXT: vinserti128 $1, %xmm1, %ymm2, %ymm1
	; AVX2-NEXT: shrq $63, %rax			; AVX2NOBW-NEXT: vpsrad $1, %ymm1, %ymm2
	; AVX2-NEXT: sarq %rdx			; AVX2NOBW-NEXT: vpsrlq $1, %ymm1, %ymm3
	; AVX2-NEXT: addq %rax, %rdx			; AVX2NOBW-NEXT: vpblendd {{.*#+}} ymm2 = ymm3[0],ymm2[1],ymm3[2],ymm2[3],ymm3[4],ymm2[5],ymm3[6],ymm2[7]
	; AVX2-NEXT: leaq (,%rdx,8), %rax			; AVX2NOBW-NEXT: vpsrlq $63, %ymm1, %ymm1
	; AVX2-NEXT: subq %rax, %rdx			; AVX2NOBW-NEXT: vpaddq %ymm1, %ymm2, %ymm1
	; AVX2-NEXT: addq %rcx, %rdx			; AVX2NOBW-NEXT: vpsllq $3, %ymm1, %ymm2
	; AVX2-NEXT: vmovq %rdx, %xmm1			; AVX2NOBW-NEXT: vpsubq %ymm2, %ymm1, %ymm1
	; AVX2-NEXT: vpunpcklqdq {{.*#+}} xmm1 = xmm1[0],xmm2[0]			; AVX2NOBW-NEXT: vpaddq %ymm1, %ymm0, %ymm0
	; AVX2-NEXT: vpextrq $1, %xmm0, %rcx			; AVX2NOBW-NEXT: retq
	; AVX2-NEXT: movq %rcx, %rax			;
	; AVX2-NEXT: imulq %rsi			; AVX512BW-LABEL: test_rem7_4i64:
	; AVX2-NEXT: movq %rdx, %rax			; AVX512BW: # %bb.0:
	; AVX2-NEXT: shrq $63, %rax			; AVX512BW-NEXT: vextracti128 $1, %ymm0, %xmm1
	; AVX2-NEXT: sarq %rdx			; AVX512BW-NEXT: vpextrq $1, %xmm1, %rax
	; AVX2-NEXT: addq %rax, %rdx			; AVX512BW-NEXT: movabsq $5270498306774157605, %rcx # imm = 0x4924924924924925
	; AVX2-NEXT: leaq (,%rdx,8), %rax			; AVX512BW-NEXT: imulq %rcx
	; AVX2-NEXT: subq %rax, %rdx			; AVX512BW-NEXT: vmovq %rdx, %xmm2
	; AVX2-NEXT: addq %rcx, %rdx			; AVX512BW-NEXT: vmovq %xmm1, %rax
	; AVX2-NEXT: vmovq %rdx, %xmm2			; AVX512BW-NEXT: imulq %rcx
	; AVX2-NEXT: vmovq %xmm0, %rcx			; AVX512BW-NEXT: vmovq %rdx, %xmm1
	; AVX2-NEXT: movq %rcx, %rax			; AVX512BW-NEXT: vpunpcklqdq {{.*#+}} xmm1 = xmm1[0],xmm2[0]
	; AVX2-NEXT: imulq %rsi			; AVX512BW-NEXT: vpextrq $1, %xmm0, %rax
	; AVX2-NEXT: movq %rdx, %rax			; AVX512BW-NEXT: imulq %rcx
	; AVX2-NEXT: shrq $63, %rax			; AVX512BW-NEXT: vmovq %rdx, %xmm2
	; AVX2-NEXT: sarq %rdx			; AVX512BW-NEXT: vmovq %xmm0, %rax
	; AVX2-NEXT: addq %rax, %rdx			; AVX512BW-NEXT: imulq %rcx
	; AVX2-NEXT: leaq (,%rdx,8), %rax			; AVX512BW-NEXT: vmovq %rdx, %xmm3
	; AVX2-NEXT: subq %rax, %rdx			; AVX512BW-NEXT: vpunpcklqdq {{.*#+}} xmm2 = xmm3[0],xmm2[0]
	; AVX2-NEXT: addq %rcx, %rdx			; AVX512BW-NEXT: vinserti128 $1, %xmm1, %ymm2, %ymm1
	; AVX2-NEXT: vmovq %rdx, %xmm0			; AVX512BW-NEXT: vpsrlq $63, %ymm1, %ymm2
	; AVX2-NEXT: vpunpcklqdq {{.*#+}} xmm0 = xmm0[0],xmm2[0]			; AVX512BW-NEXT: vpsraq $1, %zmm1, %zmm1
	; AVX2-NEXT: vinserti128 $1, %xmm1, %ymm0, %ymm0			; AVX512BW-NEXT: vpaddq %ymm2, %ymm1, %ymm1
	; AVX2-NEXT: retq			; AVX512BW-NEXT: vpsllq $3, %ymm1, %ymm2
				; AVX512BW-NEXT: vpsubq %ymm2, %ymm1, %ymm1
				; AVX512BW-NEXT: vpaddq %ymm1, %ymm0, %ymm0
				; AVX512BW-NEXT: retq
	%res = srem <4 x i64> %a, <i64 7, i64 7, i64 7, i64 7>			%res = srem <4 x i64> %a, <i64 7, i64 7, i64 7, i64 7>
	ret <4 x i64> %res			ret <4 x i64> %res
	}			}

	define <8 x i32> @test_rem7_8i32(<8 x i32> %a) nounwind {			define <8 x i32> @test_rem7_8i32(<8 x i32> %a) nounwind {
	; AVX1-LABEL: test_rem7_8i32:			; AVX1-LABEL: test_rem7_8i32:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1
	▲ Show 20 Lines • Show All 317 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/vector-idiv-sdiv-512.ll

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx512f \| FileCheck %s --check-prefix=AVX --check-prefix=AVX512 --check-prefix=AVX512F			; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx512f \| FileCheck %s --check-prefix=AVX --check-prefix=AVX512 --check-prefix=AVX512F
	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx512bw \| FileCheck %s --check-prefix=AVX --check-prefix=AVX512 --check-prefix=AVX512BW			; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx512bw \| FileCheck %s --check-prefix=AVX --check-prefix=AVX512 --check-prefix=AVX512BW

	;			;
	; sdiv by 7			; sdiv by 7
	;			;

	define <8 x i64> @test_div7_8i64(<8 x i64> %a) nounwind {			define <8 x i64> @test_div7_8i64(<8 x i64> %a) nounwind {
	; AVX-LABEL: test_div7_8i64:			; AVX-LABEL: test_div7_8i64:
	; AVX: # %bb.0:			; AVX: # %bb.0:
	; AVX-NEXT: vextracti32x4 $3, %zmm0, %xmm1			; AVX-NEXT: vextracti64x4 $1, %zmm0, %ymm1
	; AVX-NEXT: vpextrq $1, %xmm1, %rax			; AVX-NEXT: vextracti128 $1, %ymm1, %xmm2
	; AVX-NEXT: movabsq $5270498306774157605, %rcx # imm = 0x4924924924924925
	; AVX-NEXT: imulq %rcx
	; AVX-NEXT: movq %rdx, %rax
	; AVX-NEXT: shrq $63, %rax
	; AVX-NEXT: sarq %rdx
	; AVX-NEXT: addq %rax, %rdx
	; AVX-NEXT: vmovq %rdx, %xmm2
	; AVX-NEXT: vmovq %xmm1, %rax
	; AVX-NEXT: imulq %rcx
	; AVX-NEXT: movq %rdx, %rax
	; AVX-NEXT: shrq $63, %rax
	; AVX-NEXT: sarq %rdx
	; AVX-NEXT: addq %rax, %rdx
	; AVX-NEXT: vmovq %rdx, %xmm1
	; AVX-NEXT: vpunpcklqdq {{.*#+}} xmm1 = xmm1[0],xmm2[0]
	; AVX-NEXT: vextracti32x4 $2, %zmm0, %xmm2
	; AVX-NEXT: vpextrq $1, %xmm2, %rax			; AVX-NEXT: vpextrq $1, %xmm2, %rax
				; AVX-NEXT: movabsq $5270498306774157605, %rcx # imm = 0x4924924924924925
	; AVX-NEXT: imulq %rcx			; AVX-NEXT: imulq %rcx
	; AVX-NEXT: movq %rdx, %rax
	; AVX-NEXT: shrq $63, %rax
	; AVX-NEXT: sarq %rdx
	; AVX-NEXT: addq %rax, %rdx
	; AVX-NEXT: vmovq %rdx, %xmm3			; AVX-NEXT: vmovq %rdx, %xmm3
	; AVX-NEXT: vmovq %xmm2, %rax			; AVX-NEXT: vmovq %xmm2, %rax
	; AVX-NEXT: imulq %rcx			; AVX-NEXT: imulq %rcx
	; AVX-NEXT: movq %rdx, %rax
	; AVX-NEXT: shrq $63, %rax
	; AVX-NEXT: sarq %rdx
	; AVX-NEXT: addq %rax, %rdx
	; AVX-NEXT: vmovq %rdx, %xmm2			; AVX-NEXT: vmovq %rdx, %xmm2
	; AVX-NEXT: vpunpcklqdq {{.*#+}} xmm2 = xmm2[0],xmm3[0]			; AVX-NEXT: vpunpcklqdq {{.*#+}} xmm2 = xmm2[0],xmm3[0]
	; AVX-NEXT: vinserti128 $1, %xmm1, %ymm2, %ymm1			; AVX-NEXT: vpextrq $1, %xmm1, %rax
				; AVX-NEXT: imulq %rcx
				; AVX-NEXT: vmovq %rdx, %xmm3
				; AVX-NEXT: vmovq %xmm1, %rax
				; AVX-NEXT: imulq %rcx
				; AVX-NEXT: vmovq %rdx, %xmm1
				; AVX-NEXT: vpunpcklqdq {{.*#+}} xmm1 = xmm1[0],xmm3[0]
				; AVX-NEXT: vinserti128 $1, %xmm2, %ymm1, %ymm1
	; AVX-NEXT: vextracti128 $1, %ymm0, %xmm2			; AVX-NEXT: vextracti128 $1, %ymm0, %xmm2
	; AVX-NEXT: vpextrq $1, %xmm2, %rax			; AVX-NEXT: vpextrq $1, %xmm2, %rax
	; AVX-NEXT: imulq %rcx			; AVX-NEXT: imulq %rcx
	; AVX-NEXT: movq %rdx, %rax
	; AVX-NEXT: shrq $63, %rax
	; AVX-NEXT: sarq %rdx
	; AVX-NEXT: addq %rax, %rdx
	; AVX-NEXT: vmovq %rdx, %xmm3			; AVX-NEXT: vmovq %rdx, %xmm3
	; AVX-NEXT: vmovq %xmm2, %rax			; AVX-NEXT: vmovq %xmm2, %rax
	; AVX-NEXT: imulq %rcx			; AVX-NEXT: imulq %rcx
	; AVX-NEXT: movq %rdx, %rax
	; AVX-NEXT: shrq $63, %rax
	; AVX-NEXT: sarq %rdx
	; AVX-NEXT: addq %rax, %rdx
	; AVX-NEXT: vmovq %rdx, %xmm2			; AVX-NEXT: vmovq %rdx, %xmm2
	; AVX-NEXT: vpunpcklqdq {{.*#+}} xmm2 = xmm2[0],xmm3[0]			; AVX-NEXT: vpunpcklqdq {{.*#+}} xmm2 = xmm2[0],xmm3[0]
	; AVX-NEXT: vpextrq $1, %xmm0, %rax			; AVX-NEXT: vpextrq $1, %xmm0, %rax
	; AVX-NEXT: imulq %rcx			; AVX-NEXT: imulq %rcx
	; AVX-NEXT: movq %rdx, %rax
	; AVX-NEXT: shrq $63, %rax
	; AVX-NEXT: sarq %rdx
	; AVX-NEXT: addq %rax, %rdx
	; AVX-NEXT: vmovq %rdx, %xmm3			; AVX-NEXT: vmovq %rdx, %xmm3
	; AVX-NEXT: vmovq %xmm0, %rax			; AVX-NEXT: vmovq %xmm0, %rax
	; AVX-NEXT: imulq %rcx			; AVX-NEXT: imulq %rcx
	; AVX-NEXT: movq %rdx, %rax
	; AVX-NEXT: shrq $63, %rax
	; AVX-NEXT: sarq %rdx
	; AVX-NEXT: addq %rax, %rdx
	; AVX-NEXT: vmovq %rdx, %xmm0			; AVX-NEXT: vmovq %rdx, %xmm0
	; AVX-NEXT: vpunpcklqdq {{.*#+}} xmm0 = xmm0[0],xmm3[0]			; AVX-NEXT: vpunpcklqdq {{.*#+}} xmm0 = xmm0[0],xmm3[0]
	; AVX-NEXT: vinserti128 $1, %xmm2, %ymm0, %ymm0			; AVX-NEXT: vinserti128 $1, %xmm2, %ymm0, %ymm0
	; AVX-NEXT: vinserti64x4 $1, %ymm1, %zmm0, %zmm0			; AVX-NEXT: vinserti64x4 $1, %ymm1, %zmm0, %zmm0
				; AVX-NEXT: vpsrlq $63, %zmm0, %zmm1
				; AVX-NEXT: vpsraq $1, %zmm0, %zmm0
				; AVX-NEXT: vpaddq %zmm1, %zmm0, %zmm0
	; AVX-NEXT: retq			; AVX-NEXT: retq
	%res = sdiv <8 x i64> %a, <i64 7, i64 7, i64 7, i64 7, i64 7, i64 7, i64 7, i64 7>			%res = sdiv <8 x i64> %a, <i64 7, i64 7, i64 7, i64 7, i64 7, i64 7, i64 7, i64 7>
	ret <8 x i64> %res			ret <8 x i64> %res
	}			}

	define <16 x i32> @test_div7_16i32(<16 x i32> %a) nounwind {			define <16 x i32> @test_div7_16i32(<16 x i32> %a) nounwind {
	; AVX-LABEL: test_div7_16i32:			; AVX-LABEL: test_div7_16i32:
	; AVX: # %bb.0:			; AVX: # %bb.0:
	▲ Show 20 Lines • Show All 199 Lines • ▼ Show 20 Lines

	;			;
	; srem by 7			; srem by 7
	;			;

	define <8 x i64> @test_rem7_8i64(<8 x i64> %a) nounwind {			define <8 x i64> @test_rem7_8i64(<8 x i64> %a) nounwind {
	; AVX-LABEL: test_rem7_8i64:			; AVX-LABEL: test_rem7_8i64:
	; AVX: # %bb.0:			; AVX: # %bb.0:
	; AVX-NEXT: vextracti32x4 $3, %zmm0, %xmm1			; AVX-NEXT: vextracti64x4 $1, %zmm0, %ymm1
	; AVX-NEXT: vpextrq $1, %xmm1, %rcx			; AVX-NEXT: vextracti128 $1, %ymm1, %xmm2
	; AVX-NEXT: movabsq $5270498306774157605, %rsi # imm = 0x4924924924924925			; AVX-NEXT: vpextrq $1, %xmm2, %rax
	; AVX-NEXT: movq %rcx, %rax			; AVX-NEXT: movabsq $5270498306774157605, %rcx # imm = 0x4924924924924925
	; AVX-NEXT: imulq %rsi			; AVX-NEXT: imulq %rcx
	; AVX-NEXT: movq %rdx, %rax
	; AVX-NEXT: shrq $63, %rax
	; AVX-NEXT: sarq %rdx
	; AVX-NEXT: addq %rax, %rdx
	; AVX-NEXT: leaq (,%rdx,8), %rax
	; AVX-NEXT: subq %rax, %rdx
	; AVX-NEXT: addq %rcx, %rdx
	; AVX-NEXT: vmovq %rdx, %xmm2
	; AVX-NEXT: vmovq %xmm1, %rcx
	; AVX-NEXT: movq %rcx, %rax
	; AVX-NEXT: imulq %rsi
	; AVX-NEXT: movq %rdx, %rax
	; AVX-NEXT: shrq $63, %rax
	; AVX-NEXT: sarq %rdx
	; AVX-NEXT: addq %rax, %rdx
	; AVX-NEXT: leaq (,%rdx,8), %rax
	; AVX-NEXT: subq %rax, %rdx
	; AVX-NEXT: addq %rcx, %rdx
	; AVX-NEXT: vmovq %rdx, %xmm1
	; AVX-NEXT: vpunpcklqdq {{.*#+}} xmm1 = xmm1[0],xmm2[0]
	; AVX-NEXT: vextracti32x4 $2, %zmm0, %xmm2
	; AVX-NEXT: vpextrq $1, %xmm2, %rcx
	; AVX-NEXT: movq %rcx, %rax
	; AVX-NEXT: imulq %rsi
	; AVX-NEXT: movq %rdx, %rax
	; AVX-NEXT: shrq $63, %rax
	; AVX-NEXT: sarq %rdx
	; AVX-NEXT: addq %rax, %rdx
	; AVX-NEXT: leaq (,%rdx,8), %rax
	; AVX-NEXT: subq %rax, %rdx
	; AVX-NEXT: addq %rcx, %rdx
	; AVX-NEXT: vmovq %rdx, %xmm3			; AVX-NEXT: vmovq %rdx, %xmm3
	; AVX-NEXT: vmovq %xmm2, %rcx			; AVX-NEXT: vmovq %xmm2, %rax
	; AVX-NEXT: movq %rcx, %rax			; AVX-NEXT: imulq %rcx
	; AVX-NEXT: imulq %rsi
	; AVX-NEXT: movq %rdx, %rax
	; AVX-NEXT: shrq $63, %rax
	; AVX-NEXT: sarq %rdx
	; AVX-NEXT: addq %rax, %rdx
	; AVX-NEXT: leaq (,%rdx,8), %rax
	; AVX-NEXT: subq %rax, %rdx
	; AVX-NEXT: addq %rcx, %rdx
	; AVX-NEXT: vmovq %rdx, %xmm2			; AVX-NEXT: vmovq %rdx, %xmm2
	; AVX-NEXT: vpunpcklqdq {{.*#+}} xmm2 = xmm2[0],xmm3[0]			; AVX-NEXT: vpunpcklqdq {{.*#+}} xmm2 = xmm2[0],xmm3[0]
	; AVX-NEXT: vinserti128 $1, %xmm1, %ymm2, %ymm1			; AVX-NEXT: vpextrq $1, %xmm1, %rax
				; AVX-NEXT: imulq %rcx
				; AVX-NEXT: vmovq %rdx, %xmm3
				; AVX-NEXT: vmovq %xmm1, %rax
				; AVX-NEXT: imulq %rcx
				; AVX-NEXT: vmovq %rdx, %xmm1
				; AVX-NEXT: vpunpcklqdq {{.*#+}} xmm1 = xmm1[0],xmm3[0]
				; AVX-NEXT: vinserti128 $1, %xmm2, %ymm1, %ymm1
	; AVX-NEXT: vextracti128 $1, %ymm0, %xmm2			; AVX-NEXT: vextracti128 $1, %ymm0, %xmm2
	; AVX-NEXT: vpextrq $1, %xmm2, %rcx			; AVX-NEXT: vpextrq $1, %xmm2, %rax
	; AVX-NEXT: movq %rcx, %rax			; AVX-NEXT: imulq %rcx
	; AVX-NEXT: imulq %rsi
	; AVX-NEXT: movq %rdx, %rax
	; AVX-NEXT: shrq $63, %rax
	; AVX-NEXT: sarq %rdx
	; AVX-NEXT: addq %rax, %rdx
	; AVX-NEXT: leaq (,%rdx,8), %rax
	; AVX-NEXT: subq %rax, %rdx
	; AVX-NEXT: addq %rcx, %rdx
	; AVX-NEXT: vmovq %rdx, %xmm3			; AVX-NEXT: vmovq %rdx, %xmm3
	; AVX-NEXT: vmovq %xmm2, %rcx			; AVX-NEXT: vmovq %xmm2, %rax
	; AVX-NEXT: movq %rcx, %rax			; AVX-NEXT: imulq %rcx
	; AVX-NEXT: imulq %rsi
	; AVX-NEXT: movq %rdx, %rax
	; AVX-NEXT: shrq $63, %rax
	; AVX-NEXT: sarq %rdx
	; AVX-NEXT: addq %rax, %rdx
	; AVX-NEXT: leaq (,%rdx,8), %rax
	; AVX-NEXT: subq %rax, %rdx
	; AVX-NEXT: addq %rcx, %rdx
	; AVX-NEXT: vmovq %rdx, %xmm2			; AVX-NEXT: vmovq %rdx, %xmm2
	; AVX-NEXT: vpunpcklqdq {{.*#+}} xmm2 = xmm2[0],xmm3[0]			; AVX-NEXT: vpunpcklqdq {{.*#+}} xmm2 = xmm2[0],xmm3[0]
	; AVX-NEXT: vpextrq $1, %xmm0, %rcx			; AVX-NEXT: vpextrq $1, %xmm0, %rax
	; AVX-NEXT: movq %rcx, %rax			; AVX-NEXT: imulq %rcx
	; AVX-NEXT: imulq %rsi
	; AVX-NEXT: movq %rdx, %rax
	; AVX-NEXT: shrq $63, %rax
	; AVX-NEXT: sarq %rdx
	; AVX-NEXT: addq %rax, %rdx
	; AVX-NEXT: leaq (,%rdx,8), %rax
	; AVX-NEXT: subq %rax, %rdx
	; AVX-NEXT: addq %rcx, %rdx
	; AVX-NEXT: vmovq %rdx, %xmm3			; AVX-NEXT: vmovq %rdx, %xmm3
	; AVX-NEXT: vmovq %xmm0, %rcx			; AVX-NEXT: vmovq %xmm0, %rax
	; AVX-NEXT: movq %rcx, %rax			; AVX-NEXT: imulq %rcx
	; AVX-NEXT: imulq %rsi			; AVX-NEXT: vmovq %rdx, %xmm4
	; AVX-NEXT: movq %rdx, %rax			; AVX-NEXT: vpunpcklqdq {{.*#+}} xmm3 = xmm4[0],xmm3[0]
	; AVX-NEXT: shrq $63, %rax			; AVX-NEXT: vinserti128 $1, %xmm2, %ymm3, %ymm2
	; AVX-NEXT: sarq %rdx			; AVX-NEXT: vinserti64x4 $1, %ymm1, %zmm2, %zmm1
	; AVX-NEXT: addq %rax, %rdx			; AVX-NEXT: vpsrlq $63, %zmm1, %zmm2
	; AVX-NEXT: leaq (,%rdx,8), %rax			; AVX-NEXT: vpsraq $1, %zmm1, %zmm1
	; AVX-NEXT: subq %rax, %rdx			; AVX-NEXT: vpaddq %zmm2, %zmm1, %zmm1
	; AVX-NEXT: addq %rcx, %rdx			; AVX-NEXT: vpsllq $3, %zmm1, %zmm2
	; AVX-NEXT: vmovq %rdx, %xmm0			; AVX-NEXT: vpsubq %zmm2, %zmm1, %zmm1
	; AVX-NEXT: vpunpcklqdq {{.*#+}} xmm0 = xmm0[0],xmm3[0]			; AVX-NEXT: vpaddq %zmm1, %zmm0, %zmm0
	; AVX-NEXT: vinserti128 $1, %xmm2, %ymm0, %ymm0
	; AVX-NEXT: vinserti64x4 $1, %ymm1, %zmm0, %zmm0
	; AVX-NEXT: retq			; AVX-NEXT: retq
	%res = srem <8 x i64> %a, <i64 7, i64 7, i64 7, i64 7, i64 7, i64 7, i64 7, i64 7>			%res = srem <8 x i64> %a, <i64 7, i64 7, i64 7, i64 7, i64 7, i64 7, i64 7, i64 7>
	ret <8 x i64> %res			ret <8 x i64> %res
	}			}

	define <16 x i32> @test_rem7_16i32(<16 x i32> %a) nounwind {			define <16 x i32> @test_rem7_16i32(<16 x i32> %a) nounwind {
	; AVX-LABEL: test_rem7_16i32:			; AVX-LABEL: test_rem7_16i32:
	; AVX: # %bb.0:			; AVX: # %bb.0:
	▲ Show 20 Lines • Show All 248 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/vector-idiv-udiv-128.ll

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+sse2 \| FileCheck %s --check-prefix=SSE --check-prefix=SSE2			; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+sse2 \| FileCheck %s --check-prefix=SSE --check-prefix=SSE2
	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+sse4.1 \| FileCheck %s --check-prefix=SSE --check-prefix=SSE41			; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+sse4.1 \| FileCheck %s --check-prefix=SSE --check-prefix=SSE41
	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx \| FileCheck %s --check-prefix=AVX --check-prefix=AVX1			; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx \| FileCheck %s --check-prefix=AVX --check-prefix=AVX1
	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx2 \| FileCheck %s --check-prefix=AVX --check-prefix=AVX2 --check-prefix=AVX2NOBW			; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx2 \| FileCheck %s --check-prefix=AVX --check-prefix=AVX2 --check-prefix=AVX2NOBW
	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx512bw \| FileCheck %s --check-prefix=AVX --check-prefix=AVX2 --check-prefix=AVX512BW			; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx512bw \| FileCheck %s --check-prefix=AVX --check-prefix=AVX2 --check-prefix=AVX512BW

	;			;
	; udiv by 7			; udiv by 7
	;			;

	define <2 x i64> @test_div7_2i64(<2 x i64> %a) nounwind {			define <2 x i64> @test_div7_2i64(<2 x i64> %a) nounwind {
	; SSE2-LABEL: test_div7_2i64:			; SSE2-LABEL: test_div7_2i64:
	; SSE2: # %bb.0:			; SSE2: # %bb.0:
	; SSE2-NEXT: movq %xmm0, %rcx			; SSE2-NEXT: movq %xmm0, %rax
	; SSE2-NEXT: movabsq $2635249153387078803, %rsi # imm = 0x2492492492492493			; SSE2-NEXT: movabsq $2635249153387078803, %rcx # imm = 0x2492492492492493
	; SSE2-NEXT: movq %rcx, %rax			; SSE2-NEXT: mulq %rcx
	; SSE2-NEXT: mulq %rsi			; SSE2-NEXT: movq %rdx, %xmm1
	; SSE2-NEXT: subq %rdx, %rcx			; SSE2-NEXT: pshufd {{.*#+}} xmm2 = xmm0[2,3,2,3]
	; SSE2-NEXT: shrq %rcx			; SSE2-NEXT: movq %xmm2, %rax
	; SSE2-NEXT: addq %rdx, %rcx			; SSE2-NEXT: mulq %rcx
	; SSE2-NEXT: movq %rcx, %xmm1			; SSE2-NEXT: movq %rdx, %xmm2
	; SSE2-NEXT: pshufd {{.*#+}} xmm0 = xmm0[2,3,2,3]			; SSE2-NEXT: punpcklqdq {{.*#+}} xmm1 = xmm1[0],xmm2[0]
	; SSE2-NEXT: movq %xmm0, %rcx			; SSE2-NEXT: psubq %xmm1, %xmm0
	; SSE2-NEXT: movq %rcx, %rax			; SSE2-NEXT: psrlq $1, %xmm0
	; SSE2-NEXT: mulq %rsi			; SSE2-NEXT: paddq %xmm1, %xmm0
	; SSE2-NEXT: subq %rdx, %rcx			; SSE2-NEXT: psrlq $2, %xmm0
	; SSE2-NEXT: shrq %rcx
	; SSE2-NEXT: addq %rdx, %rcx
	; SSE2-NEXT: movq %rcx, %xmm0
	; SSE2-NEXT: punpcklqdq {{.*#+}} xmm1 = xmm1[0],xmm0[0]
	; SSE2-NEXT: psrlq $2, %xmm1
	; SSE2-NEXT: movdqa %xmm1, %xmm0
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE41-LABEL: test_div7_2i64:			; SSE41-LABEL: test_div7_2i64:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: pextrq $1, %xmm0, %rcx			; SSE41-NEXT: pextrq $1, %xmm0, %rax
	; SSE41-NEXT: movabsq $2635249153387078803, %rsi # imm = 0x2492492492492493			; SSE41-NEXT: movabsq $2635249153387078803, %rcx # imm = 0x2492492492492493
	; SSE41-NEXT: movq %rcx, %rax			; SSE41-NEXT: mulq %rcx
	; SSE41-NEXT: mulq %rsi			; SSE41-NEXT: movq %rdx, %xmm1
	; SSE41-NEXT: subq %rdx, %rcx			; SSE41-NEXT: movq %xmm0, %rax
	; SSE41-NEXT: shrq %rcx			; SSE41-NEXT: mulq %rcx
	; SSE41-NEXT: addq %rdx, %rcx			; SSE41-NEXT: movq %rdx, %xmm2
	; SSE41-NEXT: movq %rcx, %xmm1			; SSE41-NEXT: punpcklqdq {{.*#+}} xmm2 = xmm2[0],xmm1[0]
	; SSE41-NEXT: movq %xmm0, %rcx			; SSE41-NEXT: psubq %xmm2, %xmm0
	; SSE41-NEXT: movq %rcx, %rax			; SSE41-NEXT: psrlq $1, %xmm0
	; SSE41-NEXT: mulq %rsi			; SSE41-NEXT: paddq %xmm2, %xmm0
	; SSE41-NEXT: subq %rdx, %rcx
	; SSE41-NEXT: shrq %rcx
	; SSE41-NEXT: addq %rdx, %rcx
	; SSE41-NEXT: movq %rcx, %xmm0
	; SSE41-NEXT: punpcklqdq {{.*#+}} xmm0 = xmm0[0],xmm1[0]
	; SSE41-NEXT: psrlq $2, %xmm0			; SSE41-NEXT: psrlq $2, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX-LABEL: test_div7_2i64:			; AVX-LABEL: test_div7_2i64:
	; AVX: # %bb.0:			; AVX: # %bb.0:
	; AVX-NEXT: vpextrq $1, %xmm0, %rcx			; AVX-NEXT: vpextrq $1, %xmm0, %rax
	; AVX-NEXT: movabsq $2635249153387078803, %rsi # imm = 0x2492492492492493			; AVX-NEXT: movabsq $2635249153387078803, %rcx # imm = 0x2492492492492493
	; AVX-NEXT: movq %rcx, %rax			; AVX-NEXT: mulq %rcx
	; AVX-NEXT: mulq %rsi			; AVX-NEXT: vmovq %rdx, %xmm1
	; AVX-NEXT: subq %rdx, %rcx			; AVX-NEXT: vmovq %xmm0, %rax
	; AVX-NEXT: shrq %rcx			; AVX-NEXT: mulq %rcx
	; AVX-NEXT: addq %rdx, %rcx			; AVX-NEXT: vmovq %rdx, %xmm2
	; AVX-NEXT: vmovq %rcx, %xmm1			; AVX-NEXT: vpunpcklqdq {{.*#+}} xmm1 = xmm2[0],xmm1[0]
	; AVX-NEXT: vmovq %xmm0, %rcx			; AVX-NEXT: vpsubq %xmm1, %xmm0, %xmm0
	; AVX-NEXT: movq %rcx, %rax			; AVX-NEXT: vpsrlq $1, %xmm0, %xmm0
	; AVX-NEXT: mulq %rsi			; AVX-NEXT: vpaddq %xmm1, %xmm0, %xmm0
	; AVX-NEXT: subq %rdx, %rcx
	; AVX-NEXT: shrq %rcx
	; AVX-NEXT: addq %rdx, %rcx
	; AVX-NEXT: vmovq %rcx, %xmm0
	; AVX-NEXT: vpunpcklqdq {{.*#+}} xmm0 = xmm0[0],xmm1[0]
	; AVX-NEXT: vpsrlq $2, %xmm0, %xmm0			; AVX-NEXT: vpsrlq $2, %xmm0, %xmm0
	; AVX-NEXT: retq			; AVX-NEXT: retq
	%res = udiv <2 x i64> %a, <i64 7, i64 7>			%res = udiv <2 x i64> %a, <i64 7, i64 7>
	ret <2 x i64> %res			ret <2 x i64> %res
	}			}

	define <4 x i32> @test_div7_4i32(<4 x i32> %a) nounwind {			define <4 x i32> @test_div7_4i32(<4 x i32> %a) nounwind {
	; SSE2-LABEL: test_div7_4i32:			; SSE2-LABEL: test_div7_4i32:
	▲ Show 20 Lines • Show All 342 Lines • ▼ Show 20 Lines

	;			;
	; urem by 7			; urem by 7
	;			;

	define <2 x i64> @test_rem7_2i64(<2 x i64> %a) nounwind {			define <2 x i64> @test_rem7_2i64(<2 x i64> %a) nounwind {
	; SSE2-LABEL: test_rem7_2i64:			; SSE2-LABEL: test_rem7_2i64:
	; SSE2: # %bb.0:			; SSE2: # %bb.0:
	; SSE2-NEXT: movq %xmm0, %rcx			; SSE2-NEXT: movq %xmm0, %rax
	; SSE2-NEXT: movabsq $2635249153387078803, %rsi # imm = 0x2492492492492493			; SSE2-NEXT: movabsq $2635249153387078803, %rcx # imm = 0x2492492492492493
	; SSE2-NEXT: movq %rcx, %rax			; SSE2-NEXT: mulq %rcx
	; SSE2-NEXT: mulq %rsi			; SSE2-NEXT: movq %rdx, %xmm2
	; SSE2-NEXT: movq %rcx, %rax			; SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm0[2,3,2,3]
	; SSE2-NEXT: subq %rdx, %rax			; SSE2-NEXT: movq %xmm1, %rax
	; SSE2-NEXT: shrq %rax			; SSE2-NEXT: mulq %rcx
	; SSE2-NEXT: addq %rdx, %rax			; SSE2-NEXT: movq %rdx, %xmm1
	; SSE2-NEXT: shrq $2, %rax			; SSE2-NEXT: punpcklqdq {{.*#+}} xmm2 = xmm2[0],xmm1[0]
	; SSE2-NEXT: leaq (,%rax,8), %rdx			; SSE2-NEXT: movdqa %xmm0, %xmm1
	; SSE2-NEXT: subq %rdx, %rax			; SSE2-NEXT: psubq %xmm2, %xmm1
	; SSE2-NEXT: addq %rcx, %rax			; SSE2-NEXT: psrlq $1, %xmm1
	; SSE2-NEXT: movq %rax, %xmm1			; SSE2-NEXT: paddq %xmm2, %xmm1
	; SSE2-NEXT: pshufd {{.*#+}} xmm0 = xmm0[2,3,2,3]			; SSE2-NEXT: psrlq $2, %xmm1
	; SSE2-NEXT: movq %xmm0, %rcx			; SSE2-NEXT: movdqa %xmm1, %xmm2
	; SSE2-NEXT: movq %rcx, %rax			; SSE2-NEXT: psllq $3, %xmm2
	; SSE2-NEXT: mulq %rsi			; SSE2-NEXT: psubq %xmm2, %xmm1
	; SSE2-NEXT: movq %rcx, %rax			; SSE2-NEXT: paddq %xmm0, %xmm1
	; SSE2-NEXT: subq %rdx, %rax
	; SSE2-NEXT: shrq %rax
	; SSE2-NEXT: addq %rdx, %rax
	; SSE2-NEXT: shrq $2, %rax
	; SSE2-NEXT: leaq (,%rax,8), %rdx
	; SSE2-NEXT: subq %rdx, %rax
	; SSE2-NEXT: addq %rcx, %rax
	; SSE2-NEXT: movq %rax, %xmm0
	; SSE2-NEXT: punpcklqdq {{.*#+}} xmm1 = xmm1[0],xmm0[0]
	; SSE2-NEXT: movdqa %xmm1, %xmm0			; SSE2-NEXT: movdqa %xmm1, %xmm0
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE41-LABEL: test_rem7_2i64:			; SSE41-LABEL: test_rem7_2i64:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: pextrq $1, %xmm0, %rcx			; SSE41-NEXT: pextrq $1, %xmm0, %rax
	; SSE41-NEXT: movabsq $2635249153387078803, %rsi # imm = 0x2492492492492493			; SSE41-NEXT: movabsq $2635249153387078803, %rcx # imm = 0x2492492492492493
	; SSE41-NEXT: movq %rcx, %rax			; SSE41-NEXT: mulq %rcx
	; SSE41-NEXT: mulq %rsi			; SSE41-NEXT: movq %rdx, %xmm1
	; SSE41-NEXT: movq %rcx, %rax			; SSE41-NEXT: movq %xmm0, %rax
	; SSE41-NEXT: subq %rdx, %rax			; SSE41-NEXT: mulq %rcx
	; SSE41-NEXT: shrq %rax			; SSE41-NEXT: movq %rdx, %xmm2
	; SSE41-NEXT: addq %rdx, %rax			; SSE41-NEXT: punpcklqdq {{.*#+}} xmm2 = xmm2[0],xmm1[0]
	; SSE41-NEXT: shrq $2, %rax			; SSE41-NEXT: movdqa %xmm0, %xmm1
	; SSE41-NEXT: leaq (,%rax,8), %rdx			; SSE41-NEXT: psubq %xmm2, %xmm1
	; SSE41-NEXT: subq %rdx, %rax			; SSE41-NEXT: psrlq $1, %xmm1
	; SSE41-NEXT: addq %rcx, %rax			; SSE41-NEXT: paddq %xmm2, %xmm1
	; SSE41-NEXT: movq %rax, %xmm1			; SSE41-NEXT: psrlq $2, %xmm1
	; SSE41-NEXT: movq %xmm0, %rcx			; SSE41-NEXT: movdqa %xmm1, %xmm2
	; SSE41-NEXT: movq %rcx, %rax			; SSE41-NEXT: psllq $3, %xmm2
	; SSE41-NEXT: mulq %rsi			; SSE41-NEXT: psubq %xmm2, %xmm1
	; SSE41-NEXT: movq %rcx, %rax			; SSE41-NEXT: paddq %xmm0, %xmm1
	; SSE41-NEXT: subq %rdx, %rax			; SSE41-NEXT: movdqa %xmm1, %xmm0
	; SSE41-NEXT: shrq %rax
	; SSE41-NEXT: addq %rdx, %rax
	; SSE41-NEXT: shrq $2, %rax
	; SSE41-NEXT: leaq (,%rax,8), %rdx
	; SSE41-NEXT: subq %rdx, %rax
	; SSE41-NEXT: addq %rcx, %rax
	; SSE41-NEXT: movq %rax, %xmm0
	; SSE41-NEXT: punpcklqdq {{.*#+}} xmm0 = xmm0[0],xmm1[0]
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX-LABEL: test_rem7_2i64:			; AVX-LABEL: test_rem7_2i64:
	; AVX: # %bb.0:			; AVX: # %bb.0:
	; AVX-NEXT: vpextrq $1, %xmm0, %rcx			; AVX-NEXT: vpextrq $1, %xmm0, %rax
	; AVX-NEXT: movabsq $2635249153387078803, %rsi # imm = 0x2492492492492493			; AVX-NEXT: movabsq $2635249153387078803, %rcx # imm = 0x2492492492492493
	; AVX-NEXT: movq %rcx, %rax			; AVX-NEXT: mulq %rcx
	; AVX-NEXT: mulq %rsi			; AVX-NEXT: vmovq %rdx, %xmm1
	; AVX-NEXT: movq %rcx, %rax			; AVX-NEXT: vmovq %xmm0, %rax
	; AVX-NEXT: subq %rdx, %rax			; AVX-NEXT: mulq %rcx
	; AVX-NEXT: shrq %rax			; AVX-NEXT: vmovq %rdx, %xmm2
	; AVX-NEXT: addq %rdx, %rax			; AVX-NEXT: vpunpcklqdq {{.*#+}} xmm1 = xmm2[0],xmm1[0]
	; AVX-NEXT: shrq $2, %rax			; AVX-NEXT: vpsubq %xmm1, %xmm0, %xmm2
	; AVX-NEXT: leaq (,%rax,8), %rdx			; AVX-NEXT: vpsrlq $1, %xmm2, %xmm2
	; AVX-NEXT: subq %rdx, %rax			; AVX-NEXT: vpaddq %xmm1, %xmm2, %xmm1
	; AVX-NEXT: addq %rcx, %rax			; AVX-NEXT: vpsrlq $2, %xmm1, %xmm1
	; AVX-NEXT: vmovq %rax, %xmm1			; AVX-NEXT: vpsllq $3, %xmm1, %xmm2
	; AVX-NEXT: vmovq %xmm0, %rcx			; AVX-NEXT: vpsubq %xmm2, %xmm1, %xmm1
	; AVX-NEXT: movq %rcx, %rax			; AVX-NEXT: vpaddq %xmm1, %xmm0, %xmm0
	; AVX-NEXT: mulq %rsi
	; AVX-NEXT: movq %rcx, %rax
	; AVX-NEXT: subq %rdx, %rax
	; AVX-NEXT: shrq %rax
	; AVX-NEXT: addq %rdx, %rax
	; AVX-NEXT: shrq $2, %rax
	; AVX-NEXT: leaq (,%rax,8), %rdx
	; AVX-NEXT: subq %rdx, %rax
	; AVX-NEXT: addq %rcx, %rax
	; AVX-NEXT: vmovq %rax, %xmm0
	; AVX-NEXT: vpunpcklqdq {{.*#+}} xmm0 = xmm0[0],xmm1[0]
	; AVX-NEXT: retq			; AVX-NEXT: retq
	%res = urem <2 x i64> %a, <i64 7, i64 7>			%res = urem <2 x i64> %a, <i64 7, i64 7>
	ret <2 x i64> %res			ret <2 x i64> %res
	}			}

	define <4 x i32> @test_rem7_4i32(<4 x i32> %a) nounwind {			define <4 x i32> @test_rem7_4i32(<4 x i32> %a) nounwind {
	; SSE2-LABEL: test_rem7_4i32:			; SSE2-LABEL: test_rem7_4i32:
	; SSE2: # %bb.0:			; SSE2: # %bb.0:
	▲ Show 20 Lines • Show All 410 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/vector-idiv-udiv-256.ll

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx \| FileCheck %s --check-prefix=AVX1			; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx \| FileCheck %s --check-prefix=AVX1
	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx2 \| FileCheck %s --check-prefix=AVX2 --check-prefix=AVX2NOBW			; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx2 \| FileCheck %s --check-prefix=AVX2 --check-prefix=AVX2NOBW
	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx512bw \| FileCheck %s --check-prefix=AVX2 --check-prefix=AVX512BW			; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx512bw \| FileCheck %s --check-prefix=AVX2 --check-prefix=AVX512BW

	;			;
	; udiv by 7			; udiv by 7
	;			;

	define <4 x i64> @test_div7_4i64(<4 x i64> %a) nounwind {			define <4 x i64> @test_div7_4i64(<4 x i64> %a) nounwind {
	; AVX1-LABEL: test_div7_4i64:			; AVX1-LABEL: test_div7_4i64:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vpextrq $1, %xmm0, %rcx			; AVX1-NEXT: vpextrq $1, %xmm0, %rax
	; AVX1-NEXT: movabsq $2635249153387078803, %rsi # imm = 0x2492492492492493			; AVX1-NEXT: movabsq $2635249153387078803, %rcx # imm = 0x2492492492492493
	; AVX1-NEXT: movq %rcx, %rax			; AVX1-NEXT: mulq %rcx
	; AVX1-NEXT: mulq %rsi			; AVX1-NEXT: vmovq %rdx, %xmm1
	; AVX1-NEXT: subq %rdx, %rcx			; AVX1-NEXT: vmovq %xmm0, %rax
	; AVX1-NEXT: shrq %rcx			; AVX1-NEXT: mulq %rcx
	; AVX1-NEXT: addq %rdx, %rcx			; AVX1-NEXT: vmovq %rdx, %xmm2
	; AVX1-NEXT: vmovq %rcx, %xmm1
	; AVX1-NEXT: vmovq %xmm0, %rcx
	; AVX1-NEXT: movq %rcx, %rax
	; AVX1-NEXT: mulq %rsi
	; AVX1-NEXT: subq %rdx, %rcx
	; AVX1-NEXT: shrq %rcx
	; AVX1-NEXT: addq %rdx, %rcx
	; AVX1-NEXT: vmovq %rcx, %xmm2
	; AVX1-NEXT: vpunpcklqdq {{.*#+}} xmm1 = xmm2[0],xmm1[0]			; AVX1-NEXT: vpunpcklqdq {{.*#+}} xmm1 = xmm2[0],xmm1[0]
				; AVX1-NEXT: vpsubq %xmm1, %xmm0, %xmm2
				; AVX1-NEXT: vpsrlq $1, %xmm2, %xmm2
				; AVX1-NEXT: vpaddq %xmm1, %xmm2, %xmm1
	; AVX1-NEXT: vpsrlq $2, %xmm1, %xmm1			; AVX1-NEXT: vpsrlq $2, %xmm1, %xmm1
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm0			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm0
	; AVX1-NEXT: vpextrq $1, %xmm0, %rcx			; AVX1-NEXT: vpextrq $1, %xmm0, %rax
	; AVX1-NEXT: movq %rcx, %rax			; AVX1-NEXT: mulq %rcx
	; AVX1-NEXT: mulq %rsi			; AVX1-NEXT: vmovq %rdx, %xmm2
	; AVX1-NEXT: subq %rdx, %rcx			; AVX1-NEXT: vmovq %xmm0, %rax
	; AVX1-NEXT: shrq %rcx			; AVX1-NEXT: mulq %rcx
	; AVX1-NEXT: addq %rdx, %rcx			; AVX1-NEXT: vmovq %rdx, %xmm3
	; AVX1-NEXT: vmovq %rcx, %xmm2			; AVX1-NEXT: vpunpcklqdq {{.*#+}} xmm2 = xmm3[0],xmm2[0]
	; AVX1-NEXT: vmovq %xmm0, %rcx			; AVX1-NEXT: vpsubq %xmm2, %xmm0, %xmm0
	; AVX1-NEXT: movq %rcx, %rax			; AVX1-NEXT: vpsrlq $1, %xmm0, %xmm0
	; AVX1-NEXT: mulq %rsi			; AVX1-NEXT: vpaddq %xmm2, %xmm0, %xmm0
	; AVX1-NEXT: subq %rdx, %rcx
	; AVX1-NEXT: shrq %rcx
	; AVX1-NEXT: addq %rdx, %rcx
	; AVX1-NEXT: vmovq %rcx, %xmm0
	; AVX1-NEXT: vpunpcklqdq {{.*#+}} xmm0 = xmm0[0],xmm2[0]
	; AVX1-NEXT: vpsrlq $2, %xmm0, %xmm0			; AVX1-NEXT: vpsrlq $2, %xmm0, %xmm0
	; AVX1-NEXT: vinsertf128 $1, %xmm0, %ymm1, %ymm0			; AVX1-NEXT: vinsertf128 $1, %xmm0, %ymm1, %ymm0
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: test_div7_4i64:			; AVX2-LABEL: test_div7_4i64:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1
	; AVX2-NEXT: vpextrq $1, %xmm1, %rcx			; AVX2-NEXT: vpextrq $1, %xmm1, %rax
	; AVX2-NEXT: movabsq $2635249153387078803, %rsi # imm = 0x2492492492492493			; AVX2-NEXT: movabsq $2635249153387078803, %rcx # imm = 0x2492492492492493
	; AVX2-NEXT: movq %rcx, %rax			; AVX2-NEXT: mulq %rcx
	; AVX2-NEXT: mulq %rsi			; AVX2-NEXT: vmovq %rdx, %xmm2
	; AVX2-NEXT: subq %rdx, %rcx			; AVX2-NEXT: vmovq %xmm1, %rax
	; AVX2-NEXT: shrq %rcx			; AVX2-NEXT: mulq %rcx
	; AVX2-NEXT: addq %rdx, %rcx			; AVX2-NEXT: vmovq %rdx, %xmm1
	; AVX2-NEXT: vmovq %rcx, %xmm2
	; AVX2-NEXT: vmovq %xmm1, %rcx
	; AVX2-NEXT: movq %rcx, %rax
	; AVX2-NEXT: mulq %rsi
	; AVX2-NEXT: subq %rdx, %rcx
	; AVX2-NEXT: shrq %rcx
	; AVX2-NEXT: addq %rdx, %rcx
	; AVX2-NEXT: vmovq %rcx, %xmm1
	; AVX2-NEXT: vpunpcklqdq {{.*#+}} xmm1 = xmm1[0],xmm2[0]			; AVX2-NEXT: vpunpcklqdq {{.*#+}} xmm1 = xmm1[0],xmm2[0]
	; AVX2-NEXT: vpextrq $1, %xmm0, %rcx			; AVX2-NEXT: vpextrq $1, %xmm0, %rax
	; AVX2-NEXT: movq %rcx, %rax			; AVX2-NEXT: mulq %rcx
	; AVX2-NEXT: mulq %rsi			; AVX2-NEXT: vmovq %rdx, %xmm2
	; AVX2-NEXT: subq %rdx, %rcx			; AVX2-NEXT: vmovq %xmm0, %rax
	; AVX2-NEXT: shrq %rcx			; AVX2-NEXT: mulq %rcx
	; AVX2-NEXT: addq %rdx, %rcx			; AVX2-NEXT: vmovq %rdx, %xmm3
	; AVX2-NEXT: vmovq %rcx, %xmm2			; AVX2-NEXT: vpunpcklqdq {{.*#+}} xmm2 = xmm3[0],xmm2[0]
	; AVX2-NEXT: vmovq %xmm0, %rcx			; AVX2-NEXT: vinserti128 $1, %xmm1, %ymm2, %ymm1
	; AVX2-NEXT: movq %rcx, %rax			; AVX2-NEXT: vpsubq %ymm1, %ymm0, %ymm0
	; AVX2-NEXT: mulq %rsi			; AVX2-NEXT: vpsrlq $1, %ymm0, %ymm0
	; AVX2-NEXT: subq %rdx, %rcx			; AVX2-NEXT: vpaddq %ymm1, %ymm0, %ymm0
	; AVX2-NEXT: shrq %rcx
	; AVX2-NEXT: addq %rdx, %rcx
	; AVX2-NEXT: vmovq %rcx, %xmm0
	; AVX2-NEXT: vpunpcklqdq {{.*#+}} xmm0 = xmm0[0],xmm2[0]
	; AVX2-NEXT: vinserti128 $1, %xmm1, %ymm0, %ymm0
	; AVX2-NEXT: vpsrlq $2, %ymm0, %ymm0			; AVX2-NEXT: vpsrlq $2, %ymm0, %ymm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	%res = udiv <4 x i64> %a, <i64 7, i64 7, i64 7, i64 7>			%res = udiv <4 x i64> %a, <i64 7, i64 7, i64 7, i64 7>
	ret <4 x i64> %res			ret <4 x i64> %res
	}			}

	define <8 x i32> @test_div7_8i32(<8 x i32> %a) nounwind {			define <8 x i32> @test_div7_8i32(<8 x i32> %a) nounwind {
	; AVX1-LABEL: test_div7_8i32:			; AVX1-LABEL: test_div7_8i32:
	▲ Show 20 Lines • Show All 272 Lines • ▼ Show 20 Lines
	;			;
	; urem by 7			; urem by 7
	;			;

	define <4 x i64> @test_rem7_4i64(<4 x i64> %a) nounwind {			define <4 x i64> @test_rem7_4i64(<4 x i64> %a) nounwind {
	; AVX1-LABEL: test_rem7_4i64:			; AVX1-LABEL: test_rem7_4i64:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1
	; AVX1-NEXT: vpextrq $1, %xmm1, %rcx			; AVX1-NEXT: vpextrq $1, %xmm1, %rax
	; AVX1-NEXT: movabsq $2635249153387078803, %rsi # imm = 0x2492492492492493			; AVX1-NEXT: movabsq $2635249153387078803, %rcx # imm = 0x2492492492492493
	; AVX1-NEXT: movq %rcx, %rax			; AVX1-NEXT: mulq %rcx
	; AVX1-NEXT: mulq %rsi			; AVX1-NEXT: vmovq %rdx, %xmm2
	; AVX1-NEXT: movq %rcx, %rax			; AVX1-NEXT: vmovq %xmm1, %rax
	; AVX1-NEXT: subq %rdx, %rax			; AVX1-NEXT: mulq %rcx
	; AVX1-NEXT: shrq %rax			; AVX1-NEXT: vmovq %rdx, %xmm3
	; AVX1-NEXT: addq %rdx, %rax			; AVX1-NEXT: vpunpcklqdq {{.*#+}} xmm2 = xmm3[0],xmm2[0]
	; AVX1-NEXT: shrq $2, %rax			; AVX1-NEXT: vpsubq %xmm2, %xmm1, %xmm3
	; AVX1-NEXT: leaq (,%rax,8), %rdx			; AVX1-NEXT: vpsrlq $1, %xmm3, %xmm3
	; AVX1-NEXT: subq %rdx, %rax			; AVX1-NEXT: vpaddq %xmm2, %xmm3, %xmm2
	; AVX1-NEXT: addq %rcx, %rax			; AVX1-NEXT: vpsrlq $2, %xmm2, %xmm2
	; AVX1-NEXT: vmovq %rax, %xmm2			; AVX1-NEXT: vpsllq $3, %xmm2, %xmm3
	; AVX1-NEXT: vmovq %xmm1, %rcx			; AVX1-NEXT: vpsubq %xmm3, %xmm2, %xmm2
	; AVX1-NEXT: movq %rcx, %rax			; AVX1-NEXT: vpaddq %xmm2, %xmm1, %xmm1
	; AVX1-NEXT: mulq %rsi			; AVX1-NEXT: vpextrq $1, %xmm0, %rax
	; AVX1-NEXT: movq %rcx, %rax			; AVX1-NEXT: mulq %rcx
	; AVX1-NEXT: subq %rdx, %rax			; AVX1-NEXT: vmovq %rdx, %xmm2
	; AVX1-NEXT: shrq %rax			; AVX1-NEXT: vmovq %xmm0, %rax
	; AVX1-NEXT: addq %rdx, %rax			; AVX1-NEXT: mulq %rcx
	; AVX1-NEXT: shrq $2, %rax			; AVX1-NEXT: vmovq %rdx, %xmm3
	; AVX1-NEXT: leaq (,%rax,8), %rdx			; AVX1-NEXT: vpunpcklqdq {{.*#+}} xmm2 = xmm3[0],xmm2[0]
	; AVX1-NEXT: subq %rdx, %rax			; AVX1-NEXT: vpsubq %xmm2, %xmm0, %xmm3
	; AVX1-NEXT: addq %rcx, %rax			; AVX1-NEXT: vpsrlq $1, %xmm3, %xmm3
	; AVX1-NEXT: vmovq %rax, %xmm1			; AVX1-NEXT: vpaddq %xmm2, %xmm3, %xmm2
	; AVX1-NEXT: vpunpcklqdq {{.*#+}} xmm1 = xmm1[0],xmm2[0]			; AVX1-NEXT: vpsrlq $2, %xmm2, %xmm2
	; AVX1-NEXT: vpextrq $1, %xmm0, %rcx			; AVX1-NEXT: vpsllq $3, %xmm2, %xmm3
	; AVX1-NEXT: movq %rcx, %rax			; AVX1-NEXT: vpsubq %xmm3, %xmm2, %xmm2
	; AVX1-NEXT: mulq %rsi			; AVX1-NEXT: vpaddq %xmm2, %xmm0, %xmm0
	; AVX1-NEXT: movq %rcx, %rax
	; AVX1-NEXT: subq %rdx, %rax
	; AVX1-NEXT: shrq %rax
	; AVX1-NEXT: addq %rdx, %rax
	; AVX1-NEXT: shrq $2, %rax
	; AVX1-NEXT: leaq (,%rax,8), %rdx
	; AVX1-NEXT: subq %rdx, %rax
	; AVX1-NEXT: addq %rcx, %rax
	; AVX1-NEXT: vmovq %rax, %xmm2
	; AVX1-NEXT: vmovq %xmm0, %rcx
	; AVX1-NEXT: movq %rcx, %rax
	; AVX1-NEXT: mulq %rsi
	; AVX1-NEXT: movq %rcx, %rax
	; AVX1-NEXT: subq %rdx, %rax
	; AVX1-NEXT: shrq %rax
	; AVX1-NEXT: addq %rdx, %rax
	; AVX1-NEXT: shrq $2, %rax
	; AVX1-NEXT: leaq (,%rax,8), %rdx
	; AVX1-NEXT: subq %rdx, %rax
	; AVX1-NEXT: addq %rcx, %rax
	; AVX1-NEXT: vmovq %rax, %xmm0
	; AVX1-NEXT: vpunpcklqdq {{.*#+}} xmm0 = xmm0[0],xmm2[0]
	; AVX1-NEXT: vinsertf128 $1, %xmm1, %ymm0, %ymm0			; AVX1-NEXT: vinsertf128 $1, %xmm1, %ymm0, %ymm0
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: test_rem7_4i64:			; AVX2-LABEL: test_rem7_4i64:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1
	; AVX2-NEXT: vpextrq $1, %xmm1, %rcx			; AVX2-NEXT: vpextrq $1, %xmm1, %rax
	; AVX2-NEXT: movabsq $2635249153387078803, %rsi # imm = 0x2492492492492493			; AVX2-NEXT: movabsq $2635249153387078803, %rcx # imm = 0x2492492492492493
	; AVX2-NEXT: movq %rcx, %rax			; AVX2-NEXT: mulq %rcx
	; AVX2-NEXT: mulq %rsi			; AVX2-NEXT: vmovq %rdx, %xmm2
	; AVX2-NEXT: movq %rcx, %rax			; AVX2-NEXT: vmovq %xmm1, %rax
	; AVX2-NEXT: subq %rdx, %rax			; AVX2-NEXT: mulq %rcx
	; AVX2-NEXT: shrq %rax			; AVX2-NEXT: vmovq %rdx, %xmm1
	; AVX2-NEXT: addq %rdx, %rax
	; AVX2-NEXT: shrq $2, %rax
	; AVX2-NEXT: leaq (,%rax,8), %rdx
	; AVX2-NEXT: subq %rdx, %rax
	; AVX2-NEXT: addq %rcx, %rax
	; AVX2-NEXT: vmovq %rax, %xmm2
	; AVX2-NEXT: vmovq %xmm1, %rcx
	; AVX2-NEXT: movq %rcx, %rax
	; AVX2-NEXT: mulq %rsi
	; AVX2-NEXT: movq %rcx, %rax
	; AVX2-NEXT: subq %rdx, %rax
	; AVX2-NEXT: shrq %rax
	; AVX2-NEXT: addq %rdx, %rax
	; AVX2-NEXT: shrq $2, %rax
	; AVX2-NEXT: leaq (,%rax,8), %rdx
	; AVX2-NEXT: subq %rdx, %rax
	; AVX2-NEXT: addq %rcx, %rax
	; AVX2-NEXT: vmovq %rax, %xmm1
	; AVX2-NEXT: vpunpcklqdq {{.*#+}} xmm1 = xmm1[0],xmm2[0]			; AVX2-NEXT: vpunpcklqdq {{.*#+}} xmm1 = xmm1[0],xmm2[0]
	; AVX2-NEXT: vpextrq $1, %xmm0, %rcx			; AVX2-NEXT: vpextrq $1, %xmm0, %rax
	; AVX2-NEXT: movq %rcx, %rax			; AVX2-NEXT: mulq %rcx
	; AVX2-NEXT: mulq %rsi			; AVX2-NEXT: vmovq %rdx, %xmm2
	; AVX2-NEXT: movq %rcx, %rax			; AVX2-NEXT: vmovq %xmm0, %rax
	; AVX2-NEXT: subq %rdx, %rax			; AVX2-NEXT: mulq %rcx
	; AVX2-NEXT: shrq %rax			; AVX2-NEXT: vmovq %rdx, %xmm3
	; AVX2-NEXT: addq %rdx, %rax			; AVX2-NEXT: vpunpcklqdq {{.*#+}} xmm2 = xmm3[0],xmm2[0]
	; AVX2-NEXT: shrq $2, %rax			; AVX2-NEXT: vinserti128 $1, %xmm1, %ymm2, %ymm1
	; AVX2-NEXT: leaq (,%rax,8), %rdx			; AVX2-NEXT: vpsubq %ymm1, %ymm0, %ymm2
	; AVX2-NEXT: subq %rdx, %rax			; AVX2-NEXT: vpsrlq $1, %ymm2, %ymm2
	; AVX2-NEXT: addq %rcx, %rax			; AVX2-NEXT: vpaddq %ymm1, %ymm2, %ymm1
	; AVX2-NEXT: vmovq %rax, %xmm2			; AVX2-NEXT: vpsrlq $2, %ymm1, %ymm1
	; AVX2-NEXT: vmovq %xmm0, %rcx			; AVX2-NEXT: vpsllq $3, %ymm1, %ymm2
	; AVX2-NEXT: movq %rcx, %rax			; AVX2-NEXT: vpsubq %ymm2, %ymm1, %ymm1
	; AVX2-NEXT: mulq %rsi			; AVX2-NEXT: vpaddq %ymm1, %ymm0, %ymm0
	; AVX2-NEXT: movq %rcx, %rax
	; AVX2-NEXT: subq %rdx, %rax
	; AVX2-NEXT: shrq %rax
	; AVX2-NEXT: addq %rdx, %rax
	; AVX2-NEXT: shrq $2, %rax
	; AVX2-NEXT: leaq (,%rax,8), %rdx
	; AVX2-NEXT: subq %rdx, %rax
	; AVX2-NEXT: addq %rcx, %rax
	; AVX2-NEXT: vmovq %rax, %xmm0
	; AVX2-NEXT: vpunpcklqdq {{.*#+}} xmm0 = xmm0[0],xmm2[0]
	; AVX2-NEXT: vinserti128 $1, %xmm1, %ymm0, %ymm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	%res = urem <4 x i64> %a, <i64 7, i64 7, i64 7, i64 7>			%res = urem <4 x i64> %a, <i64 7, i64 7, i64 7, i64 7>
	ret <4 x i64> %res			ret <4 x i64> %res
	}			}

	define <8 x i32> @test_rem7_8i32(<8 x i32> %a) nounwind {			define <8 x i32> @test_rem7_8i32(<8 x i32> %a) nounwind {
	; AVX1-LABEL: test_rem7_8i32:			; AVX1-LABEL: test_rem7_8i32:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	▲ Show 20 Lines • Show All 323 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/vector-idiv-udiv-512.ll

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx512f \| FileCheck %s --check-prefix=AVX --check-prefix=AVX512 --check-prefix=AVX512F			; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx512f \| FileCheck %s --check-prefix=AVX --check-prefix=AVX512 --check-prefix=AVX512F
	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx512bw \| FileCheck %s --check-prefix=AVX --check-prefix=AVX512 --check-prefix=AVX512BW			; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx512bw \| FileCheck %s --check-prefix=AVX --check-prefix=AVX512 --check-prefix=AVX512BW

	;			;
	; udiv by 7			; udiv by 7
	;			;

	define <8 x i64> @test_div7_8i64(<8 x i64> %a) nounwind {			define <8 x i64> @test_div7_8i64(<8 x i64> %a) nounwind {
	; AVX-LABEL: test_div7_8i64:			; AVX-LABEL: test_div7_8i64:
	; AVX: # %bb.0:			; AVX: # %bb.0:
	; AVX-NEXT: vextracti32x4 $3, %zmm0, %xmm1			; AVX-NEXT: vextracti64x4 $1, %zmm0, %ymm1
	; AVX-NEXT: vpextrq $1, %xmm1, %rcx			; AVX-NEXT: vextracti128 $1, %ymm1, %xmm2
	; AVX-NEXT: movabsq $2635249153387078803, %rsi # imm = 0x2492492492492493			; AVX-NEXT: vpextrq $1, %xmm2, %rax
	; AVX-NEXT: movq %rcx, %rax			; AVX-NEXT: movabsq $2635249153387078803, %rcx # imm = 0x2492492492492493
	; AVX-NEXT: mulq %rsi			; AVX-NEXT: mulq %rcx
	; AVX-NEXT: subq %rdx, %rcx			; AVX-NEXT: vmovq %rdx, %xmm3
	; AVX-NEXT: shrq %rcx			; AVX-NEXT: vmovq %xmm2, %rax
	; AVX-NEXT: addq %rdx, %rcx			; AVX-NEXT: mulq %rcx
	; AVX-NEXT: vmovq %rcx, %xmm2			; AVX-NEXT: vmovq %rdx, %xmm2
	; AVX-NEXT: vmovq %xmm1, %rcx
	; AVX-NEXT: movq %rcx, %rax
	; AVX-NEXT: mulq %rsi
	; AVX-NEXT: subq %rdx, %rcx
	; AVX-NEXT: shrq %rcx
	; AVX-NEXT: addq %rdx, %rcx
	; AVX-NEXT: vmovq %rcx, %xmm1
	; AVX-NEXT: vpunpcklqdq {{.*#+}} xmm1 = xmm1[0],xmm2[0]
	; AVX-NEXT: vextracti32x4 $2, %zmm0, %xmm2
	; AVX-NEXT: vpextrq $1, %xmm2, %rcx
	; AVX-NEXT: movq %rcx, %rax
	; AVX-NEXT: mulq %rsi
	; AVX-NEXT: subq %rdx, %rcx
	; AVX-NEXT: shrq %rcx
	; AVX-NEXT: addq %rdx, %rcx
	; AVX-NEXT: vmovq %rcx, %xmm3
	; AVX-NEXT: vmovq %xmm2, %rcx
	; AVX-NEXT: movq %rcx, %rax
	; AVX-NEXT: mulq %rsi
	; AVX-NEXT: subq %rdx, %rcx
	; AVX-NEXT: shrq %rcx
	; AVX-NEXT: addq %rdx, %rcx
	; AVX-NEXT: vmovq %rcx, %xmm2
	; AVX-NEXT: vpunpcklqdq {{.*#+}} xmm2 = xmm2[0],xmm3[0]			; AVX-NEXT: vpunpcklqdq {{.*#+}} xmm2 = xmm2[0],xmm3[0]
	; AVX-NEXT: vinserti128 $1, %xmm1, %ymm2, %ymm1			; AVX-NEXT: vpextrq $1, %xmm1, %rax
				; AVX-NEXT: mulq %rcx
				; AVX-NEXT: vmovq %rdx, %xmm3
				; AVX-NEXT: vmovq %xmm1, %rax
				; AVX-NEXT: mulq %rcx
				; AVX-NEXT: vmovq %rdx, %xmm1
				; AVX-NEXT: vpunpcklqdq {{.*#+}} xmm1 = xmm1[0],xmm3[0]
				; AVX-NEXT: vinserti128 $1, %xmm2, %ymm1, %ymm1
	; AVX-NEXT: vextracti128 $1, %ymm0, %xmm2			; AVX-NEXT: vextracti128 $1, %ymm0, %xmm2
	; AVX-NEXT: vpextrq $1, %xmm2, %rcx			; AVX-NEXT: vpextrq $1, %xmm2, %rax
	; AVX-NEXT: movq %rcx, %rax			; AVX-NEXT: mulq %rcx
	; AVX-NEXT: mulq %rsi			; AVX-NEXT: vmovq %rdx, %xmm3
	; AVX-NEXT: subq %rdx, %rcx			; AVX-NEXT: vmovq %xmm2, %rax
	; AVX-NEXT: shrq %rcx			; AVX-NEXT: mulq %rcx
	; AVX-NEXT: addq %rdx, %rcx			; AVX-NEXT: vmovq %rdx, %xmm2
	; AVX-NEXT: vmovq %rcx, %xmm3
	; AVX-NEXT: vmovq %xmm2, %rcx
	; AVX-NEXT: movq %rcx, %rax
	; AVX-NEXT: mulq %rsi
	; AVX-NEXT: subq %rdx, %rcx
	; AVX-NEXT: shrq %rcx
	; AVX-NEXT: addq %rdx, %rcx
	; AVX-NEXT: vmovq %rcx, %xmm2
	; AVX-NEXT: vpunpcklqdq {{.*#+}} xmm2 = xmm2[0],xmm3[0]			; AVX-NEXT: vpunpcklqdq {{.*#+}} xmm2 = xmm2[0],xmm3[0]
	; AVX-NEXT: vpextrq $1, %xmm0, %rcx			; AVX-NEXT: vpextrq $1, %xmm0, %rax
	; AVX-NEXT: movq %rcx, %rax			; AVX-NEXT: mulq %rcx
	; AVX-NEXT: mulq %rsi			; AVX-NEXT: vmovq %rdx, %xmm3
	; AVX-NEXT: subq %rdx, %rcx			; AVX-NEXT: vmovq %xmm0, %rax
	; AVX-NEXT: shrq %rcx			; AVX-NEXT: mulq %rcx
	; AVX-NEXT: addq %rdx, %rcx			; AVX-NEXT: vmovq %rdx, %xmm4
	; AVX-NEXT: vmovq %rcx, %xmm3			; AVX-NEXT: vpunpcklqdq {{.*#+}} xmm3 = xmm4[0],xmm3[0]
	; AVX-NEXT: vmovq %xmm0, %rcx			; AVX-NEXT: vinserti128 $1, %xmm2, %ymm3, %ymm2
	; AVX-NEXT: movq %rcx, %rax			; AVX-NEXT: vinserti64x4 $1, %ymm1, %zmm2, %zmm1
	; AVX-NEXT: mulq %rsi			; AVX-NEXT: vpsubq %zmm1, %zmm0, %zmm0
	; AVX-NEXT: subq %rdx, %rcx			; AVX-NEXT: vpsrlq $1, %zmm0, %zmm0
	; AVX-NEXT: shrq %rcx			; AVX-NEXT: vpaddq %zmm1, %zmm0, %zmm0
	; AVX-NEXT: addq %rdx, %rcx
	; AVX-NEXT: vmovq %rcx, %xmm0
	; AVX-NEXT: vpunpcklqdq {{.*#+}} xmm0 = xmm0[0],xmm3[0]
	; AVX-NEXT: vinserti128 $1, %xmm2, %ymm0, %ymm0
	; AVX-NEXT: vinserti64x4 $1, %ymm1, %zmm0, %zmm0
	; AVX-NEXT: vpsrlq $2, %zmm0, %zmm0			; AVX-NEXT: vpsrlq $2, %zmm0, %zmm0
	; AVX-NEXT: retq			; AVX-NEXT: retq
	%res = udiv <8 x i64> %a, <i64 7, i64 7, i64 7, i64 7, i64 7, i64 7, i64 7, i64 7>			%res = udiv <8 x i64> %a, <i64 7, i64 7, i64 7, i64 7, i64 7, i64 7, i64 7, i64 7>
	ret <8 x i64> %res			ret <8 x i64> %res
	}			}

	define <16 x i32> @test_div7_16i32(<16 x i32> %a) nounwind {			define <16 x i32> @test_div7_16i32(<16 x i32> %a) nounwind {
	; AVX-LABEL: test_div7_16i32:			; AVX-LABEL: test_div7_16i32:
	▲ Show 20 Lines • Show All 203 Lines • ▼ Show 20 Lines

	;			;
	; urem by 7			; urem by 7
	;			;

	define <8 x i64> @test_rem7_8i64(<8 x i64> %a) nounwind {			define <8 x i64> @test_rem7_8i64(<8 x i64> %a) nounwind {
	; AVX-LABEL: test_rem7_8i64:			; AVX-LABEL: test_rem7_8i64:
	; AVX: # %bb.0:			; AVX: # %bb.0:
	; AVX-NEXT: vextracti32x4 $3, %zmm0, %xmm1			; AVX-NEXT: vextracti64x4 $1, %zmm0, %ymm1
	; AVX-NEXT: vpextrq $1, %xmm1, %rcx			; AVX-NEXT: vextracti128 $1, %ymm1, %xmm2
	; AVX-NEXT: movabsq $2635249153387078803, %rsi # imm = 0x2492492492492493			; AVX-NEXT: vpextrq $1, %xmm2, %rax
	; AVX-NEXT: movq %rcx, %rax			; AVX-NEXT: movabsq $2635249153387078803, %rcx # imm = 0x2492492492492493
	; AVX-NEXT: mulq %rsi			; AVX-NEXT: mulq %rcx
	; AVX-NEXT: movq %rcx, %rax			; AVX-NEXT: vmovq %rdx, %xmm3
	; AVX-NEXT: subq %rdx, %rax			; AVX-NEXT: vmovq %xmm2, %rax
	; AVX-NEXT: shrq %rax			; AVX-NEXT: mulq %rcx
	; AVX-NEXT: addq %rdx, %rax			; AVX-NEXT: vmovq %rdx, %xmm2
	; AVX-NEXT: shrq $2, %rax
	; AVX-NEXT: leaq (,%rax,8), %rdx
	; AVX-NEXT: subq %rdx, %rax
	; AVX-NEXT: addq %rcx, %rax
	; AVX-NEXT: vmovq %rax, %xmm2
	; AVX-NEXT: vmovq %xmm1, %rcx
	; AVX-NEXT: movq %rcx, %rax
	; AVX-NEXT: mulq %rsi
	; AVX-NEXT: movq %rcx, %rax
	; AVX-NEXT: subq %rdx, %rax
	; AVX-NEXT: shrq %rax
	; AVX-NEXT: addq %rdx, %rax
	; AVX-NEXT: shrq $2, %rax
	; AVX-NEXT: leaq (,%rax,8), %rdx
	; AVX-NEXT: subq %rdx, %rax
	; AVX-NEXT: addq %rcx, %rax
	; AVX-NEXT: vmovq %rax, %xmm1
	; AVX-NEXT: vpunpcklqdq {{.*#+}} xmm1 = xmm1[0],xmm2[0]
	; AVX-NEXT: vextracti32x4 $2, %zmm0, %xmm2
	; AVX-NEXT: vpextrq $1, %xmm2, %rcx
	; AVX-NEXT: movq %rcx, %rax
	; AVX-NEXT: mulq %rsi
	; AVX-NEXT: movq %rcx, %rax
	; AVX-NEXT: subq %rdx, %rax
	; AVX-NEXT: shrq %rax
	; AVX-NEXT: addq %rdx, %rax
	; AVX-NEXT: shrq $2, %rax
	; AVX-NEXT: leaq (,%rax,8), %rdx
	; AVX-NEXT: subq %rdx, %rax
	; AVX-NEXT: addq %rcx, %rax
	; AVX-NEXT: vmovq %rax, %xmm3
	; AVX-NEXT: vmovq %xmm2, %rcx
	; AVX-NEXT: movq %rcx, %rax
	; AVX-NEXT: mulq %rsi
	; AVX-NEXT: movq %rcx, %rax
	; AVX-NEXT: subq %rdx, %rax
	; AVX-NEXT: shrq %rax
	; AVX-NEXT: addq %rdx, %rax
	; AVX-NEXT: shrq $2, %rax
	; AVX-NEXT: leaq (,%rax,8), %rdx
	; AVX-NEXT: subq %rdx, %rax
	; AVX-NEXT: addq %rcx, %rax
	; AVX-NEXT: vmovq %rax, %xmm2
	; AVX-NEXT: vpunpcklqdq {{.*#+}} xmm2 = xmm2[0],xmm3[0]			; AVX-NEXT: vpunpcklqdq {{.*#+}} xmm2 = xmm2[0],xmm3[0]
	; AVX-NEXT: vinserti128 $1, %xmm1, %ymm2, %ymm1			; AVX-NEXT: vpextrq $1, %xmm1, %rax
				; AVX-NEXT: mulq %rcx
				; AVX-NEXT: vmovq %rdx, %xmm3
				; AVX-NEXT: vmovq %xmm1, %rax
				; AVX-NEXT: mulq %rcx
				; AVX-NEXT: vmovq %rdx, %xmm1
				; AVX-NEXT: vpunpcklqdq {{.*#+}} xmm1 = xmm1[0],xmm3[0]
				; AVX-NEXT: vinserti128 $1, %xmm2, %ymm1, %ymm1
	; AVX-NEXT: vextracti128 $1, %ymm0, %xmm2			; AVX-NEXT: vextracti128 $1, %ymm0, %xmm2
	; AVX-NEXT: vpextrq $1, %xmm2, %rcx			; AVX-NEXT: vpextrq $1, %xmm2, %rax
	; AVX-NEXT: movq %rcx, %rax			; AVX-NEXT: mulq %rcx
	; AVX-NEXT: mulq %rsi			; AVX-NEXT: vmovq %rdx, %xmm3
	; AVX-NEXT: movq %rcx, %rax			; AVX-NEXT: vmovq %xmm2, %rax
	; AVX-NEXT: subq %rdx, %rax			; AVX-NEXT: mulq %rcx
	; AVX-NEXT: shrq %rax			; AVX-NEXT: vmovq %rdx, %xmm2
	; AVX-NEXT: addq %rdx, %rax
	; AVX-NEXT: shrq $2, %rax
	; AVX-NEXT: leaq (,%rax,8), %rdx
	; AVX-NEXT: subq %rdx, %rax
	; AVX-NEXT: addq %rcx, %rax
	; AVX-NEXT: vmovq %rax, %xmm3
	; AVX-NEXT: vmovq %xmm2, %rcx
	; AVX-NEXT: movq %rcx, %rax
	; AVX-NEXT: mulq %rsi
	; AVX-NEXT: movq %rcx, %rax
	; AVX-NEXT: subq %rdx, %rax
	; AVX-NEXT: shrq %rax
	; AVX-NEXT: addq %rdx, %rax
	; AVX-NEXT: shrq $2, %rax
	; AVX-NEXT: leaq (,%rax,8), %rdx
	; AVX-NEXT: subq %rdx, %rax
	; AVX-NEXT: addq %rcx, %rax
	; AVX-NEXT: vmovq %rax, %xmm2
	; AVX-NEXT: vpunpcklqdq {{.*#+}} xmm2 = xmm2[0],xmm3[0]			; AVX-NEXT: vpunpcklqdq {{.*#+}} xmm2 = xmm2[0],xmm3[0]
	; AVX-NEXT: vpextrq $1, %xmm0, %rcx			; AVX-NEXT: vpextrq $1, %xmm0, %rax
	; AVX-NEXT: movq %rcx, %rax			; AVX-NEXT: mulq %rcx
	; AVX-NEXT: mulq %rsi			; AVX-NEXT: vmovq %rdx, %xmm3
	; AVX-NEXT: movq %rcx, %rax			; AVX-NEXT: vmovq %xmm0, %rax
	; AVX-NEXT: subq %rdx, %rax			; AVX-NEXT: mulq %rcx
	; AVX-NEXT: shrq %rax			; AVX-NEXT: vmovq %rdx, %xmm4
	; AVX-NEXT: addq %rdx, %rax			; AVX-NEXT: vpunpcklqdq {{.*#+}} xmm3 = xmm4[0],xmm3[0]
	; AVX-NEXT: shrq $2, %rax			; AVX-NEXT: vinserti128 $1, %xmm2, %ymm3, %ymm2
	; AVX-NEXT: leaq (,%rax,8), %rdx			; AVX-NEXT: vinserti64x4 $1, %ymm1, %zmm2, %zmm1
	; AVX-NEXT: subq %rdx, %rax			; AVX-NEXT: vpsubq %zmm1, %zmm0, %zmm2
	; AVX-NEXT: addq %rcx, %rax			; AVX-NEXT: vpsrlq $1, %zmm2, %zmm2
	; AVX-NEXT: vmovq %rax, %xmm3			; AVX-NEXT: vpaddq %zmm1, %zmm2, %zmm1
	; AVX-NEXT: vmovq %xmm0, %rcx			; AVX-NEXT: vpsrlq $2, %zmm1, %zmm1
	; AVX-NEXT: movq %rcx, %rax			; AVX-NEXT: vpsllq $3, %zmm1, %zmm2
	; AVX-NEXT: mulq %rsi			; AVX-NEXT: vpsubq %zmm2, %zmm1, %zmm1
	; AVX-NEXT: movq %rcx, %rax			; AVX-NEXT: vpaddq %zmm1, %zmm0, %zmm0
	; AVX-NEXT: subq %rdx, %rax
	; AVX-NEXT: shrq %rax
	; AVX-NEXT: addq %rdx, %rax
	; AVX-NEXT: shrq $2, %rax
	; AVX-NEXT: leaq (,%rax,8), %rdx
	; AVX-NEXT: subq %rdx, %rax
	; AVX-NEXT: addq %rcx, %rax
	; AVX-NEXT: vmovq %rax, %xmm0
	; AVX-NEXT: vpunpcklqdq {{.*#+}} xmm0 = xmm0[0],xmm3[0]
	; AVX-NEXT: vinserti128 $1, %xmm2, %ymm0, %ymm0
	; AVX-NEXT: vinserti64x4 $1, %ymm1, %zmm0, %zmm0
	; AVX-NEXT: retq			; AVX-NEXT: retq
	%res = urem <8 x i64> %a, <i64 7, i64 7, i64 7, i64 7, i64 7, i64 7, i64 7, i64 7>			%res = urem <8 x i64> %a, <i64 7, i64 7, i64 7, i64 7, i64 7, i64 7, i64 7, i64 7>
	ret <8 x i64> %res			ret <8 x i64> %res
	}			}

	define <16 x i32> @test_rem7_16i32(<16 x i32> %a) nounwind {			define <16 x i32> @test_rem7_16i32(<16 x i32> %a) nounwind {
	; AVX-LABEL: test_rem7_16i32:			; AVX-LABEL: test_rem7_16i32:
	; AVX: # %bb.0:			; AVX: # %bb.0:
	▲ Show 20 Lines • Show All 244 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/vector-idiv-v2i32.ll

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+sse2 \| FileCheck %s --check-prefix=X64			; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+sse2 \| FileCheck %s --check-prefix=X64
	; RUN: llc < %s -mtriple=i386-unknown-unknown -mattr=+sse2 \| FileCheck %s --check-prefix=X86			; RUN: llc < %s -mtriple=i386-unknown-unknown -mattr=+sse2 \| FileCheck %s --check-prefix=X86

	define void @test_udiv7_v2i32(<2 x i32>* %x, <2 x i32>* %y) nounwind {			define void @test_udiv7_v2i32(<2 x i32>* %x, <2 x i32>* %y) nounwind {
	; X64-LABEL: test_udiv7_v2i32:			; X64-LABEL: test_udiv7_v2i32:
	; X64: # %bb.0:			; X64: # %bb.0:
	; X64-NEXT: movq {{.*#+}} xmm0 = mem[0],zero			; X64-NEXT: movq {{.*#+}} xmm0 = mem[0],zero
	; X64-NEXT: movdqa {{.*#+}} xmm1 = [613566757,613566757,613566757,613566757]			; X64-NEXT: pshufd {{.*#+}} xmm1 = xmm0[0,1,1,3]
	; X64-NEXT: movdqa %xmm0, %xmm2			; X64-NEXT: pmuludq {{.*}}(%rip), %xmm1
	; X64-NEXT: pmuludq %xmm1, %xmm2			; X64-NEXT: pshufd {{.*#+}} xmm2 = xmm1[1,3,2,3]
	; X64-NEXT: pshufd {{.*#+}} xmm2 = xmm2[1,3,2,3]
	; X64-NEXT: pshufd {{.*#+}} xmm3 = xmm0[1,1,3,3]
	; X64-NEXT: pmuludq %xmm1, %xmm3
	; X64-NEXT: pshufd {{.*#+}} xmm1 = xmm3[1,3,2,3]
	; X64-NEXT: punpckldq {{.*#+}} xmm2 = xmm2[0],xmm1[0],xmm2[1],xmm1[1]
	; X64-NEXT: psubd %xmm2, %xmm0			; X64-NEXT: psubd %xmm2, %xmm0
	; X64-NEXT: psrld $1, %xmm0			; X64-NEXT: pxor %xmm2, %xmm2
	; X64-NEXT: paddd %xmm2, %xmm0			; X64-NEXT: punpckldq {{.*#+}} xmm0 = xmm0[0],xmm2[0],xmm0[1],xmm2[1]
				; X64-NEXT: psrlq $1, %xmm0
				; X64-NEXT: psrlq $32, %xmm1
				; X64-NEXT: paddd %xmm0, %xmm1
				; X64-NEXT: pshufd {{.*#+}} xmm0 = xmm1[0,2,2,3]
	; X64-NEXT: psrld $2, %xmm0			; X64-NEXT: psrld $2, %xmm0
	; X64-NEXT: movq %xmm0, (%rsi)			; X64-NEXT: movq %xmm0, (%rsi)
	; X64-NEXT: retq			; X64-NEXT: retq
	;			;
	; X86-LABEL: test_udiv7_v2i32:			; X86-LABEL: test_udiv7_v2i32:
	; X86: # %bb.0:			; X86: # %bb.0:
	; X86-NEXT: movl {{[0-9]+}}(%esp), %eax			; X86-NEXT: movl {{[0-9]+}}(%esp), %eax
	; X86-NEXT: movl {{[0-9]+}}(%esp), %ecx			; X86-NEXT: movl {{[0-9]+}}(%esp), %ecx
	; X86-NEXT: movq {{.*#+}} xmm0 = mem[0],zero			; X86-NEXT: movq {{.*#+}} xmm0 = mem[0],zero
	; X86-NEXT: movdqa {{.*#+}} xmm1 = [613566757,613566757,613566757,613566757]			; X86-NEXT: movdqa %xmm0, %xmm1
	; X86-NEXT: movdqa %xmm0, %xmm2			; X86-NEXT: punpckldq {{.*#+}} xmm1 = xmm1[0,0,1,1]
	; X86-NEXT: pmuludq %xmm1, %xmm2			; X86-NEXT: pmuludq {{\.LCPI.*}}, %xmm1
	; X86-NEXT: pshufd {{.*#+}} xmm2 = xmm2[1,3,2,3]			; X86-NEXT: pshufd {{.*#+}} xmm2 = xmm1[1,3,2,3]
	; X86-NEXT: movdqa %xmm0, %xmm3			; X86-NEXT: psrlq $32, %xmm1
	; X86-NEXT: shufps {{.*#+}} xmm3 = xmm3[1,1,1,1]
	; X86-NEXT: pmuludq %xmm1, %xmm3
	; X86-NEXT: pshufd {{.*#+}} xmm1 = xmm3[1,3,2,3]
	; X86-NEXT: punpckldq {{.*#+}} xmm2 = xmm2[0],xmm1[0],xmm2[1],xmm1[1]
	; X86-NEXT: psubd %xmm2, %xmm0			; X86-NEXT: psubd %xmm2, %xmm0
	; X86-NEXT: psrld $1, %xmm0			; X86-NEXT: pxor %xmm2, %xmm2
	; X86-NEXT: paddd %xmm2, %xmm0			; X86-NEXT: punpckldq {{.*#+}} xmm0 = xmm0[0],xmm2[0],xmm0[1],xmm2[1]
				; X86-NEXT: psllq $31, %xmm0
				; X86-NEXT: psrlq $32, %xmm0
				; X86-NEXT: paddd %xmm1, %xmm0
				; X86-NEXT: pshufd {{.*#+}} xmm0 = xmm0[0,2,2,3]
	; X86-NEXT: psrld $2, %xmm0			; X86-NEXT: psrld $2, %xmm0
	; X86-NEXT: movq %xmm0, (%eax)			; X86-NEXT: movq %xmm0, (%eax)
	; X86-NEXT: retl			; X86-NEXT: retl
	%a = load <2 x i32>, <2 x i32>* %x			%a = load <2 x i32>, <2 x i32>* %x
	%b = udiv <2 x i32> %a, <i32 7, i32 7>			%b = udiv <2 x i32> %a, <i32 7, i32 7>
	store <2 x i32> %b, <2 x i32>* %y			store <2 x i32> %b, <2 x i32>* %y
	ret void			ret void
	}			}

	define void @test_urem7_v2i32(<2 x i32>* %x, <2 x i32>* %y) nounwind {			define void @test_urem7_v2i32(<2 x i32>* %x, <2 x i32>* %y) nounwind {
	; X64-LABEL: test_urem7_v2i32:			; X64-LABEL: test_urem7_v2i32:
	; X64: # %bb.0:			; X64: # %bb.0:
	; X64-NEXT: movq {{.*#+}} xmm0 = mem[0],zero			; X64-NEXT: movq {{.*#+}} xmm0 = mem[0],zero
	; X64-NEXT: movdqa {{.*#+}} xmm1 = [613566757,613566757,613566757,613566757]			; X64-NEXT: pshufd {{.*#+}} xmm1 = xmm0[0,1,1,3]
	; X64-NEXT: movdqa %xmm0, %xmm2			; X64-NEXT: pmuludq {{.*}}(%rip), %xmm1
	; X64-NEXT: pmuludq %xmm1, %xmm2			; X64-NEXT: pshufd {{.*#+}} xmm2 = xmm1[1,3,2,3]
	; X64-NEXT: pshufd {{.*#+}} xmm2 = xmm2[1,3,2,3]			; X64-NEXT: movdqa %xmm0, %xmm3
	; X64-NEXT: pshufd {{.*#+}} xmm3 = xmm0[1,1,3,3]			; X64-NEXT: psubd %xmm2, %xmm3
	; X64-NEXT: pmuludq %xmm1, %xmm3			; X64-NEXT: pxor %xmm2, %xmm2
	; X64-NEXT: pshufd {{.*#+}} xmm1 = xmm3[1,3,2,3]			; X64-NEXT: punpckldq {{.*#+}} xmm3 = xmm3[0],xmm2[0],xmm3[1],xmm2[1]
	; X64-NEXT: punpckldq {{.*#+}} xmm2 = xmm2[0],xmm1[0],xmm2[1],xmm1[1]			; X64-NEXT: psrlq $1, %xmm3
	; X64-NEXT: movdqa %xmm0, %xmm1			; X64-NEXT: psrlq $32, %xmm1
	; X64-NEXT: psubd %xmm2, %xmm1			; X64-NEXT: paddd %xmm3, %xmm1
	; X64-NEXT: psrld $1, %xmm1			; X64-NEXT: pshufd {{.*#+}} xmm1 = xmm1[0,2,2,3]
	; X64-NEXT: paddd %xmm2, %xmm1
	; X64-NEXT: psrld $2, %xmm1			; X64-NEXT: psrld $2, %xmm1
	; X64-NEXT: movdqa %xmm1, %xmm2			; X64-NEXT: movdqa %xmm1, %xmm2
	; X64-NEXT: pslld $3, %xmm2			; X64-NEXT: pslld $3, %xmm2
	; X64-NEXT: psubd %xmm2, %xmm1			; X64-NEXT: psubd %xmm2, %xmm1
	; X64-NEXT: paddd %xmm0, %xmm1			; X64-NEXT: paddd %xmm0, %xmm1
	; X64-NEXT: movq %xmm1, (%rsi)			; X64-NEXT: movq %xmm1, (%rsi)
	; X64-NEXT: retq			; X64-NEXT: retq
	;			;
	; X86-LABEL: test_urem7_v2i32:			; X86-LABEL: test_urem7_v2i32:
	; X86: # %bb.0:			; X86: # %bb.0:
	; X86-NEXT: movl {{[0-9]+}}(%esp), %eax			; X86-NEXT: movl {{[0-9]+}}(%esp), %eax
	; X86-NEXT: movl {{[0-9]+}}(%esp), %ecx			; X86-NEXT: movl {{[0-9]+}}(%esp), %ecx
	; X86-NEXT: movq {{.*#+}} xmm0 = mem[0],zero			; X86-NEXT: movq {{.*#+}} xmm0 = mem[0],zero
	; X86-NEXT: movdqa {{.*#+}} xmm1 = [613566757,613566757,613566757,613566757]
	; X86-NEXT: movdqa %xmm0, %xmm2
	; X86-NEXT: pmuludq %xmm1, %xmm2
	; X86-NEXT: pshufd {{.*#+}} xmm2 = xmm2[1,3,2,3]
	; X86-NEXT: movdqa %xmm0, %xmm3
	; X86-NEXT: shufps {{.*#+}} xmm3 = xmm3[1,1,1,1]
	; X86-NEXT: pmuludq %xmm1, %xmm3
	; X86-NEXT: pshufd {{.*#+}} xmm1 = xmm3[1,3,2,3]
	; X86-NEXT: punpckldq {{.*#+}} xmm2 = xmm2[0],xmm1[0],xmm2[1],xmm1[1]
	; X86-NEXT: movdqa %xmm0, %xmm1			; X86-NEXT: movdqa %xmm0, %xmm1
	; X86-NEXT: psubd %xmm2, %xmm1			; X86-NEXT: punpckldq {{.*#+}} xmm1 = xmm1[0,0,1,1]
	; X86-NEXT: psrld $1, %xmm1			; X86-NEXT: pmuludq {{\.LCPI.*}}, %xmm1
	; X86-NEXT: paddd %xmm2, %xmm1			; X86-NEXT: pshufd {{.*#+}} xmm2 = xmm1[1,3,2,3]
				; X86-NEXT: psrlq $32, %xmm1
				; X86-NEXT: movdqa %xmm0, %xmm3
				; X86-NEXT: psubd %xmm2, %xmm3
				; X86-NEXT: pxor %xmm2, %xmm2
				; X86-NEXT: punpckldq {{.*#+}} xmm3 = xmm3[0],xmm2[0],xmm3[1],xmm2[1]
				; X86-NEXT: psllq $31, %xmm3
				; X86-NEXT: psrlq $32, %xmm3
				; X86-NEXT: paddd %xmm1, %xmm3
				; X86-NEXT: pshufd {{.*#+}} xmm1 = xmm3[0,2,2,3]
	; X86-NEXT: psrld $2, %xmm1			; X86-NEXT: psrld $2, %xmm1
	; X86-NEXT: movdqa %xmm1, %xmm2			; X86-NEXT: movdqa %xmm1, %xmm2
	; X86-NEXT: pslld $3, %xmm2			; X86-NEXT: pslld $3, %xmm2
	; X86-NEXT: psubd %xmm2, %xmm1			; X86-NEXT: psubd %xmm2, %xmm1
	; X86-NEXT: paddd %xmm0, %xmm1			; X86-NEXT: paddd %xmm0, %xmm1
	; X86-NEXT: movq %xmm1, (%eax)			; X86-NEXT: movq %xmm1, (%eax)
	; X86-NEXT: retl			; X86-NEXT: retl
	%a = load <2 x i32>, <2 x i32>* %x			%a = load <2 x i32>, <2 x i32>* %x
	%b = urem <2 x i32> %a, <i32 7, i32 7>			%b = urem <2 x i32> %a, <i32 7, i32 7>
	store <2 x i32> %b, <2 x i32>* %y			store <2 x i32> %b, <2 x i32>* %y
	ret void			ret void
	}			}

	define void @test_sdiv7_v2i32(<2 x i32>* %x, <2 x i32>* %y) nounwind {			define void @test_sdiv7_v2i32(<2 x i32>* %x, <2 x i32>* %y) nounwind {
	; X64-LABEL: test_sdiv7_v2i32:			; X64-LABEL: test_sdiv7_v2i32:
	; X64: # %bb.0:			; X64: # %bb.0:
	; X64-NEXT: movq {{.*#+}} xmm0 = mem[0],zero			; X64-NEXT: movq {{.*#+}} xmm0 = mem[0],zero
	; X64-NEXT: movdqa {{.*#+}} xmm1 = [2454267027,2454267027,2454267027,2454267027]			; X64-NEXT: pxor %xmm1, %xmm1
	; X64-NEXT: movdqa %xmm0, %xmm2			; X64-NEXT: pcmpgtd %xmm0, %xmm1
	; X64-NEXT: pmuludq %xmm1, %xmm2			; X64-NEXT: pshufd {{.*#+}} xmm2 = xmm1[0,1,1,3]
	; X64-NEXT: pshufd {{.*#+}} xmm2 = xmm2[1,3,2,3]			; X64-NEXT: movdqa {{.*#+}} xmm3 = [18446744071868851347,18446744071868851347]
	; X64-NEXT: pshufd {{.*#+}} xmm3 = xmm0[1,1,3,3]			; X64-NEXT: pmuludq %xmm3, %xmm2
	; X64-NEXT: pmuludq %xmm1, %xmm3			; X64-NEXT: movdqa %xmm0, %xmm4
	; X64-NEXT: pshufd {{.*#+}} xmm3 = xmm3[1,3,2,3]			; X64-NEXT: punpckldq {{.*#+}} xmm4 = xmm4[0],xmm1[0],xmm4[1],xmm1[1]
	; X64-NEXT: punpckldq {{.*#+}} xmm2 = xmm2[0],xmm3[0],xmm2[1],xmm3[1]			; X64-NEXT: movdqa {{.*#+}} xmm1 = [4294967295,4294967295]
	; X64-NEXT: pxor %xmm3, %xmm3			; X64-NEXT: pmuludq %xmm4, %xmm1
	; X64-NEXT: pcmpgtd %xmm0, %xmm3			; X64-NEXT: paddq %xmm2, %xmm1
	; X64-NEXT: pand %xmm1, %xmm3			; X64-NEXT: psllq $32, %xmm1
	; X64-NEXT: paddd %xmm0, %xmm3			; X64-NEXT: pmuludq %xmm3, %xmm4
	; X64-NEXT: psubd %xmm3, %xmm2			; X64-NEXT: paddq %xmm1, %xmm4
	; X64-NEXT: paddd %xmm0, %xmm2			; X64-NEXT: psrlq $32, %xmm4
	; X64-NEXT: movdqa %xmm2, %xmm0			; X64-NEXT: pshufd {{.*#+}} xmm1 = xmm4[0,2,2,3]
				; X64-NEXT: paddd %xmm0, %xmm1
				; X64-NEXT: movdqa %xmm1, %xmm0
	; X64-NEXT: psrld $31, %xmm0			; X64-NEXT: psrld $31, %xmm0
	; X64-NEXT: psrad $2, %xmm2			; X64-NEXT: psrad $2, %xmm1
	; X64-NEXT: paddd %xmm0, %xmm2			; X64-NEXT: paddd %xmm0, %xmm1
	; X64-NEXT: movq %xmm2, (%rsi)			; X64-NEXT: movq %xmm1, (%rsi)
	; X64-NEXT: retq			; X64-NEXT: retq
	;			;
	; X86-LABEL: test_sdiv7_v2i32:			; X86-LABEL: test_sdiv7_v2i32:
	; X86: # %bb.0:			; X86: # %bb.0:
	; X86-NEXT: movl {{[0-9]+}}(%esp), %eax			; X86-NEXT: movl {{[0-9]+}}(%esp), %eax
	; X86-NEXT: movl {{[0-9]+}}(%esp), %ecx			; X86-NEXT: movl {{[0-9]+}}(%esp), %ecx
	; X86-NEXT: movq {{.*#+}} xmm0 = mem[0],zero			; X86-NEXT: movq {{.*#+}} xmm0 = mem[0],zero
	; X86-NEXT: movdqa {{.*#+}} xmm1 = [2454267027,2454267027,2454267027,2454267027]			; X86-NEXT: pxor %xmm1, %xmm1
	; X86-NEXT: movdqa %xmm0, %xmm2			; X86-NEXT: pcmpgtd %xmm0, %xmm1
	; X86-NEXT: pmuludq %xmm1, %xmm2			; X86-NEXT: pshufd {{.*#+}} xmm2 = xmm1[0,1,1,3]
	; X86-NEXT: pshufd {{.*#+}} xmm2 = xmm2[1,3,2,3]			; X86-NEXT: movdqa {{.*#+}} xmm3 = [2454267027,4294967295,2454267027,4294967295]
	; X86-NEXT: movdqa %xmm0, %xmm3			; X86-NEXT: pmuludq %xmm3, %xmm2
	; X86-NEXT: shufps {{.*#+}} xmm3 = xmm3[1,1,1,1]			; X86-NEXT: movdqa %xmm0, %xmm4
	; X86-NEXT: pmuludq %xmm1, %xmm3			; X86-NEXT: punpckldq {{.*#+}} xmm4 = xmm4[0],xmm1[0],xmm4[1],xmm1[1]
	; X86-NEXT: pshufd {{.*#+}} xmm3 = xmm3[1,3,2,3]			; X86-NEXT: pcmpeqd %xmm1, %xmm1
	; X86-NEXT: punpckldq {{.*#+}} xmm2 = xmm2[0],xmm3[0],xmm2[1],xmm3[1]			; X86-NEXT: pmuludq %xmm4, %xmm1
	; X86-NEXT: pxor %xmm3, %xmm3			; X86-NEXT: paddq %xmm2, %xmm1
	; X86-NEXT: pcmpgtd %xmm0, %xmm3			; X86-NEXT: psllq $32, %xmm1
	; X86-NEXT: pand %xmm1, %xmm3			; X86-NEXT: pmuludq %xmm3, %xmm4
	; X86-NEXT: paddd %xmm0, %xmm3			; X86-NEXT: paddq %xmm1, %xmm4
	; X86-NEXT: psubd %xmm3, %xmm2			; X86-NEXT: psrlq $32, %xmm4
	; X86-NEXT: paddd %xmm0, %xmm2			; X86-NEXT: pshufd {{.*#+}} xmm1 = xmm4[0,2,2,3]
	; X86-NEXT: movdqa %xmm2, %xmm0			; X86-NEXT: paddd %xmm0, %xmm1
				; X86-NEXT: movdqa %xmm1, %xmm0
	; X86-NEXT: psrld $31, %xmm0			; X86-NEXT: psrld $31, %xmm0
	; X86-NEXT: psrad $2, %xmm2			; X86-NEXT: psrad $2, %xmm1
	; X86-NEXT: paddd %xmm0, %xmm2			; X86-NEXT: paddd %xmm0, %xmm1
	; X86-NEXT: movq %xmm2, (%eax)			; X86-NEXT: movq %xmm1, (%eax)
	; X86-NEXT: retl			; X86-NEXT: retl
	%a = load <2 x i32>, <2 x i32>* %x			%a = load <2 x i32>, <2 x i32>* %x
	%b = sdiv <2 x i32> %a, <i32 7, i32 7>			%b = sdiv <2 x i32> %a, <i32 7, i32 7>
	store <2 x i32> %b, <2 x i32>* %y			store <2 x i32> %b, <2 x i32>* %y
	ret void			ret void
	}			}

	define void @test_srem7_v2i32(<2 x i32>* %x, <2 x i32>* %y) nounwind {			define void @test_srem7_v2i32(<2 x i32>* %x, <2 x i32>* %y) nounwind {
	; X64-LABEL: test_srem7_v2i32:			; X64-LABEL: test_srem7_v2i32:
	; X64: # %bb.0:			; X64: # %bb.0:
	; X64-NEXT: movq {{.*#+}} xmm0 = mem[0],zero			; X64-NEXT: movq {{.*#+}} xmm0 = mem[0],zero
	; X64-NEXT: movdqa {{.*#+}} xmm1 = [2454267027,2454267027,2454267027,2454267027]			; X64-NEXT: pxor %xmm1, %xmm1
	; X64-NEXT: movdqa %xmm0, %xmm2			; X64-NEXT: pcmpgtd %xmm0, %xmm1
	; X64-NEXT: pmuludq %xmm1, %xmm2			; X64-NEXT: pshufd {{.*#+}} xmm2 = xmm1[0,1,1,3]
	; X64-NEXT: pshufd {{.*#+}} xmm2 = xmm2[1,3,2,3]			; X64-NEXT: movdqa {{.*#+}} xmm3 = [18446744071868851347,18446744071868851347]
	; X64-NEXT: pshufd {{.*#+}} xmm3 = xmm0[1,1,3,3]			; X64-NEXT: pmuludq %xmm3, %xmm2
	; X64-NEXT: pmuludq %xmm1, %xmm3			; X64-NEXT: movdqa %xmm0, %xmm4
	; X64-NEXT: pshufd {{.*#+}} xmm3 = xmm3[1,3,2,3]			; X64-NEXT: punpckldq {{.*#+}} xmm4 = xmm4[0],xmm1[0],xmm4[1],xmm1[1]
	; X64-NEXT: punpckldq {{.*#+}} xmm2 = xmm2[0],xmm3[0],xmm2[1],xmm3[1]			; X64-NEXT: movdqa {{.*#+}} xmm1 = [4294967295,4294967295]
	; X64-NEXT: pxor %xmm3, %xmm3			; X64-NEXT: pmuludq %xmm4, %xmm1
	; X64-NEXT: pcmpgtd %xmm0, %xmm3			; X64-NEXT: paddq %xmm2, %xmm1
	; X64-NEXT: pand %xmm1, %xmm3			; X64-NEXT: psllq $32, %xmm1
	; X64-NEXT: paddd %xmm0, %xmm3			; X64-NEXT: pmuludq %xmm3, %xmm4
	; X64-NEXT: psubd %xmm3, %xmm2			; X64-NEXT: paddq %xmm1, %xmm4
	; X64-NEXT: paddd %xmm0, %xmm2			; X64-NEXT: psrlq $32, %xmm4
	; X64-NEXT: movdqa %xmm2, %xmm1			; X64-NEXT: pshufd {{.*#+}} xmm1 = xmm4[0,2,2,3]
	; X64-NEXT: psrld $31, %xmm1			; X64-NEXT: paddd %xmm0, %xmm1
	; X64-NEXT: psrad $2, %xmm2			; X64-NEXT: movdqa %xmm1, %xmm2
	; X64-NEXT: paddd %xmm1, %xmm2			; X64-NEXT: psrld $31, %xmm2
	; X64-NEXT: movdqa %xmm2, %xmm1			; X64-NEXT: psrad $2, %xmm1
	; X64-NEXT: pslld $3, %xmm1			; X64-NEXT: paddd %xmm2, %xmm1
	; X64-NEXT: psubd %xmm1, %xmm2			; X64-NEXT: movdqa %xmm1, %xmm2
	; X64-NEXT: paddd %xmm0, %xmm2			; X64-NEXT: pslld $3, %xmm2
	; X64-NEXT: movq %xmm2, (%rsi)			; X64-NEXT: psubd %xmm2, %xmm1
				; X64-NEXT: paddd %xmm0, %xmm1
				; X64-NEXT: movq %xmm1, (%rsi)
	; X64-NEXT: retq			; X64-NEXT: retq
	;			;
	; X86-LABEL: test_srem7_v2i32:			; X86-LABEL: test_srem7_v2i32:
	; X86: # %bb.0:			; X86: # %bb.0:
	; X86-NEXT: movl {{[0-9]+}}(%esp), %eax			; X86-NEXT: movl {{[0-9]+}}(%esp), %eax
	; X86-NEXT: movl {{[0-9]+}}(%esp), %ecx			; X86-NEXT: movl {{[0-9]+}}(%esp), %ecx
	; X86-NEXT: movq {{.*#+}} xmm0 = mem[0],zero			; X86-NEXT: movq {{.*#+}} xmm0 = mem[0],zero
	; X86-NEXT: movdqa {{.*#+}} xmm1 = [2454267027,2454267027,2454267027,2454267027]			; X86-NEXT: pxor %xmm1, %xmm1
	; X86-NEXT: movdqa %xmm0, %xmm2			; X86-NEXT: pcmpgtd %xmm0, %xmm1
	; X86-NEXT: pmuludq %xmm1, %xmm2			; X86-NEXT: pshufd {{.*#+}} xmm2 = xmm1[0,1,1,3]
	; X86-NEXT: pshufd {{.*#+}} xmm2 = xmm2[1,3,2,3]			; X86-NEXT: movdqa {{.*#+}} xmm3 = [2454267027,4294967295,2454267027,4294967295]
	; X86-NEXT: movdqa %xmm0, %xmm3			; X86-NEXT: pmuludq %xmm3, %xmm2
	; X86-NEXT: shufps {{.*#+}} xmm3 = xmm3[1,1,1,1]			; X86-NEXT: movdqa %xmm0, %xmm4
	; X86-NEXT: pmuludq %xmm1, %xmm3			; X86-NEXT: punpckldq {{.*#+}} xmm4 = xmm4[0],xmm1[0],xmm4[1],xmm1[1]
	; X86-NEXT: pshufd {{.*#+}} xmm3 = xmm3[1,3,2,3]			; X86-NEXT: pcmpeqd %xmm1, %xmm1
	; X86-NEXT: punpckldq {{.*#+}} xmm2 = xmm2[0],xmm3[0],xmm2[1],xmm3[1]			; X86-NEXT: pmuludq %xmm4, %xmm1
	; X86-NEXT: pxor %xmm3, %xmm3			; X86-NEXT: paddq %xmm2, %xmm1
	; X86-NEXT: pcmpgtd %xmm0, %xmm3			; X86-NEXT: psllq $32, %xmm1
	; X86-NEXT: pand %xmm1, %xmm3			; X86-NEXT: pmuludq %xmm3, %xmm4
	; X86-NEXT: paddd %xmm0, %xmm3			; X86-NEXT: paddq %xmm1, %xmm4
	; X86-NEXT: psubd %xmm3, %xmm2			; X86-NEXT: psrlq $32, %xmm4
	; X86-NEXT: paddd %xmm0, %xmm2			; X86-NEXT: pshufd {{.*#+}} xmm1 = xmm4[0,2,2,3]
	; X86-NEXT: movdqa %xmm2, %xmm1			; X86-NEXT: paddd %xmm0, %xmm1
	; X86-NEXT: psrld $31, %xmm1			; X86-NEXT: movdqa %xmm1, %xmm2
	; X86-NEXT: psrad $2, %xmm2			; X86-NEXT: psrld $31, %xmm2
	; X86-NEXT: paddd %xmm1, %xmm2			; X86-NEXT: psrad $2, %xmm1
	; X86-NEXT: movdqa %xmm2, %xmm1			; X86-NEXT: paddd %xmm2, %xmm1
	; X86-NEXT: pslld $3, %xmm1			; X86-NEXT: movdqa %xmm1, %xmm2
	; X86-NEXT: psubd %xmm1, %xmm2			; X86-NEXT: pslld $3, %xmm2
	; X86-NEXT: paddd %xmm0, %xmm2			; X86-NEXT: psubd %xmm2, %xmm1
	; X86-NEXT: movq %xmm2, (%eax)			; X86-NEXT: paddd %xmm0, %xmm1
				; X86-NEXT: movq %xmm1, (%eax)
	; X86-NEXT: retl			; X86-NEXT: retl
	%a = load <2 x i32>, <2 x i32>* %x			%a = load <2 x i32>, <2 x i32>* %x
	%b = srem <2 x i32> %a, <i32 7, i32 7>			%b = srem <2 x i32> %a, <i32 7, i32 7>
	store <2 x i32> %b, <2 x i32>* %y			store <2 x i32> %b, <2 x i32>* %y
	ret void			ret void
	}			}

	define void @test_udiv_pow2_v2i32(<2 x i32>* %x, <2 x i32>* %y) nounwind {			define void @test_udiv_pow2_v2i32(<2 x i32>* %x, <2 x i32>* %y) nounwind {
	▲ Show 20 Lines • Show All 310 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/vshli-simplify-demanded-bits.ll

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: llc -mtriple=x86_64-unknown-linux-gnu < %s \| FileCheck %s			; RUN: llc -mtriple=x86_64-unknown-linux-gnu < %s \| FileCheck %s

	; A combine forming X86ISD::VSHLI was missing a test and not using			; A combine forming X86ISD::VSHLI was missing a test and not using
	; TargetConstant for the RHS operand.			; TargetConstant for the RHS operand.
	; https://bugs.chromium.org/p/chromium/issues/detail?id=1005750			; https://bugs.chromium.org/p/chromium/issues/detail?id=1005750

	define <8 x i8> @vshli_target_constant(<8 x i16> %arg, <8 x i32> %arg1) {			define <8 x i8> @vshli_target_constant(<8 x i16> %arg, <8 x i32> %arg1) {
	; CHECK-LABEL: vshli_target_constant:			; CHECK-LABEL: vshli_target_constant:
	; CHECK: # %bb.0: # %bb			; CHECK: # %bb.0: # %bb
	; CHECK-NEXT: movdqa {{.*#+}} xmm0 = [2863311531,2863311531,2863311531,2863311531]			; CHECK-NEXT: pshufd {{.*#+}} xmm3 = xmm1[2,3,3,3]
	; CHECK-NEXT: pshufd {{.*#+}} xmm3 = xmm1[1,1,3,3]			; CHECK-NEXT: movdqa {{.*#+}} xmm4 = [2863311531,2863311531]
	; CHECK-NEXT: pmuludq %xmm0, %xmm1			; CHECK-NEXT: pmuludq %xmm4, %xmm3
	; CHECK-NEXT: pshufd {{.*#+}} xmm4 = xmm1[1,3,2,3]			; CHECK-NEXT: psrlq $33, %xmm3
	; CHECK-NEXT: pmuludq %xmm0, %xmm3			; CHECK-NEXT: pshufd {{.*#+}} xmm0 = xmm1[0,1,1,3]
	; CHECK-NEXT: pshufd {{.*#+}} xmm1 = xmm3[1,3,2,3]			; CHECK-NEXT: pmuludq %xmm4, %xmm0
	; CHECK-NEXT: punpckldq {{.*#+}} xmm4 = xmm4[0],xmm1[0],xmm4[1],xmm1[1]			; CHECK-NEXT: psrlq $33, %xmm0
	; CHECK-NEXT: pshufd {{.*#+}} xmm1 = xmm2[1,1,3,3]			; CHECK-NEXT: shufps {{.*#+}} xmm0 = xmm0[0,2],xmm3[0,2]
	; CHECK-NEXT: pmuludq %xmm0, %xmm2			; CHECK-NEXT: pshufd {{.*#+}} xmm1 = xmm2[2,3,3,3]
	; CHECK-NEXT: pshufd {{.*#+}} xmm2 = xmm2[1,3,2,3]			; CHECK-NEXT: pmuludq %xmm4, %xmm1
	; CHECK-NEXT: pmuludq %xmm0, %xmm1			; CHECK-NEXT: psrlq $33, %xmm1
	; CHECK-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,3,2,3]			; CHECK-NEXT: pshufd {{.*#+}} xmm2 = xmm2[0,1,1,3]
	; CHECK-NEXT: punpckldq {{.*#+}} xmm2 = xmm2[0],xmm0[0],xmm2[1],xmm0[1]			; CHECK-NEXT: pmuludq %xmm4, %xmm2
				; CHECK-NEXT: psrlq $33, %xmm2
				; CHECK-NEXT: shufps {{.*#+}} xmm2 = xmm2[0,2],xmm1[0,2]
				craig.topperUnsubmitted Not Done Reply Inline Actions Why did the amount of code increase here? This is a legal type so why was it affected? craig.topper: Why did the amount of code increase here? This is a legal type so why was it affected?
				craig.topperUnsubmitted Not Done Reply Inline Actions Oh I misread the arguments. One is a legal type but the other isn't. craig.topper: Oh I misread the arguments. One is a legal type but the other isn't.
	; CHECK-NEXT: movq {{.*#+}} xmm1 = mem[0],zero			; CHECK-NEXT: movq {{.*#+}} xmm1 = mem[0],zero
	; CHECK-NEXT: pslld $15, %xmm2			; CHECK-NEXT: pslld $16, %xmm2
	; CHECK-NEXT: psrad $16, %xmm2			; CHECK-NEXT: psrad $16, %xmm2
	; CHECK-NEXT: pslld $15, %xmm4			; CHECK-NEXT: pslld $16, %xmm0
	; CHECK-NEXT: psrad $16, %xmm4			; CHECK-NEXT: psrad $16, %xmm0
	; CHECK-NEXT: packssdw %xmm2, %xmm4			; CHECK-NEXT: packssdw %xmm2, %xmm0
	; CHECK-NEXT: pand {{.*}}(%rip), %xmm4			; CHECK-NEXT: pand {{.*}}(%rip), %xmm0
	; CHECK-NEXT: pxor %xmm0, %xmm0			; CHECK-NEXT: pxor %xmm2, %xmm2
	; CHECK-NEXT: punpcklbw {{.*#+}} xmm1 = xmm1[0],xmm0[0],xmm1[1],xmm0[1],xmm1[2],xmm0[2],xmm1[3],xmm0[3],xmm1[4],xmm0[4],xmm1[5],xmm0[5],xmm1[6],xmm0[6],xmm1[7],xmm0[7]			; CHECK-NEXT: punpcklbw {{.*#+}} xmm1 = xmm1[0],xmm2[0],xmm1[1],xmm2[1],xmm1[2],xmm2[2],xmm1[3],xmm2[3],xmm1[4],xmm2[4],xmm1[5],xmm2[5],xmm1[6],xmm2[6],xmm1[7],xmm2[7]
	; CHECK-NEXT: pmullw %xmm4, %xmm1			; CHECK-NEXT: pmullw %xmm0, %xmm1
	; CHECK-NEXT: movdqa %xmm1, %xmm0			; CHECK-NEXT: movdqa %xmm1, %xmm0
	; CHECK-NEXT: punpcklwd {{.*#+}} xmm0 = xmm0[0,0,1,1,2,2,3,3]			; CHECK-NEXT: punpcklwd {{.*#+}} xmm0 = xmm0[0,0,1,1,2,2,3,3]
	; CHECK-NEXT: punpckhwd {{.*#+}} xmm1 = xmm1[4,4,5,5,6,6,7,7]			; CHECK-NEXT: punpckhwd {{.*#+}} xmm1 = xmm1[4,4,5,5,6,6,7,7]
	; CHECK-NEXT: movdqa {{.*#+}} xmm2 = [128,128,128,128]			; CHECK-NEXT: movdqa {{.*#+}} xmm2 = [128,128,128,128]
	; CHECK-NEXT: paddd %xmm2, %xmm1			; CHECK-NEXT: paddd %xmm2, %xmm1
	; CHECK-NEXT: paddd %xmm2, %xmm0			; CHECK-NEXT: paddd %xmm2, %xmm0
	; CHECK-NEXT: psrld $8, %xmm0			; CHECK-NEXT: psrld $8, %xmm0
	; CHECK-NEXT: psrld $8, %xmm1			; CHECK-NEXT: psrld $8, %xmm1
	Show All 17 Lines

This is an archive of the discontinued LLVM Phabricator instance.

Support the division-by-constant strength reduction for more integer typesNeeds ReviewPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 294647

llvm/include/llvm/CodeGen/TargetLowering.h

llvm/lib/CodeGen/SelectionDAG/DAGCombiner.cpp

llvm/lib/CodeGen/SelectionDAG/TargetLowering.cpp

llvm/test/CodeGen/AArch64/srem-seteq.ll

llvm/test/CodeGen/AArch64/srem-vector-lkk.ll

llvm/test/CodeGen/AArch64/urem-seteq-nonzero.ll

llvm/test/CodeGen/AArch64/urem-seteq.ll

llvm/test/CodeGen/AArch64/urem-vector-lkk.ll

llvm/test/CodeGen/AMDGPU/amdgpu-codegenprepare-idiv.ll

llvm/test/CodeGen/AMDGPU/udiv64.ll

llvm/test/CodeGen/AMDGPU/urem64.ll

llvm/test/CodeGen/BPF/32-bit-subreg-alu.ll

llvm/test/CodeGen/BPF/sdiv_error.ll

llvm/test/CodeGen/PowerPC/loop-instr-form-prepare.ll

llvm/test/CodeGen/PowerPC/srem-lkk.ll

llvm/test/CodeGen/PowerPC/srem-vector-lkk.ll

llvm/test/CodeGen/PowerPC/urem-lkk.ll

llvm/test/CodeGen/PowerPC/urem-vector-lkk.ll

llvm/test/CodeGen/RISCV/div.ll

llvm/test/CodeGen/RISCV/srem-lkk.ll

llvm/test/CodeGen/RISCV/srem-vector-lkk.ll

llvm/test/CodeGen/RISCV/urem-lkk.ll

llvm/test/CodeGen/RISCV/urem-vector-lkk.ll

llvm/test/CodeGen/SPARC/rem.ll

llvm/test/CodeGen/X86/divide-by-constant.ll

llvm/test/CodeGen/X86/divmod128.ll

llvm/test/CodeGen/X86/i128-sdiv.ll

llvm/test/CodeGen/X86/i128-udiv.ll

llvm/test/CodeGen/X86/pr44812.ll

llvm/test/CodeGen/X86/rotate-extract-vector.ll

llvm/test/CodeGen/X86/rotate-extract.ll

llvm/test/CodeGen/X86/srem-vector-lkk.ll

llvm/test/CodeGen/X86/urem-seteq-nonzero.ll

llvm/test/CodeGen/X86/urem-vector-lkk.ll

llvm/test/CodeGen/X86/vector-idiv-sdiv-128.ll

llvm/test/CodeGen/X86/vector-idiv-sdiv-256.ll

llvm/test/CodeGen/X86/vector-idiv-sdiv-512.ll

llvm/test/CodeGen/X86/vector-idiv-udiv-128.ll

llvm/test/CodeGen/X86/vector-idiv-udiv-256.ll

llvm/test/CodeGen/X86/vector-idiv-udiv-512.ll

llvm/test/CodeGen/X86/vector-idiv-v2i32.ll

llvm/test/CodeGen/X86/vshli-simplify-demanded-bits.ll

Support the division-by-constant strength reduction for more integer types
Needs ReviewPublic