This is an archive of the discontinued LLVM Phabricator instance.

I'm not sure how much I love the predicate matching in the scheduler, as opposed to just matching instructions opcodes. There are quite a few instructions which narrow or enlarge vectorsm where register types are misleading.

Can you at least move the code so it doesn't look like this is bolted onto the end of the existing schedule :)
The SchedWriteRes should live near the other SchedWriteRes, and only the instruction definitions should be with the other instructions, etc.

llvm/lib/Target/AArch64/AArch64SchedA55.td
415	"01" in the dual issue tables means it must be the first item (slot 0). "10" would be EndGroup, and is mostly limited to certains branches and rets.
529	Does this add a lot? It's not really how COPYs work.
llvm/test/tools/llvm-mca/AArch64/Cortex/A55-neon-instructions.s
2507	What is the reasoning for the integer multiplies going down the FPMAC pipeline?

kpdev42 added inline comments.Feb 7 2022, 10:36 PM

llvm/lib/Target/AArch64/AArch64SchedA55.td
529	According to our experiments FPU copy (fmov) has latency of 1 cycle and throughput of 2 or 1 (Q-form). According to model integer ALU copy has 3 cycle latency. What would be correct model for COPY in your opinion?
llvm/test/tools/llvm-mca/AArch64/Cortex/A55-neon-instructions.s
2507	I guess mla/mls (ASIMD multiply/accumulate) utilize NEON pipeline. For some reason 2 NEON pipelines of Cortex-A55 are modelled with 5 pipelines (2 x FPALU, 2 x FPMAC, 1 x FPDIV). What you think would be correct resource assignment for mla/mls?

Addressed review comments

Harbormaster completed remote builds in B148169: Diff 406708.Feb 8 2022, 12:12 AM

dmgreen added inline comments.Feb 10 2022, 2:15 AM

llvm/lib/Target/AArch64/AArch64SchedA55.td
529	Yep - the vector mov latency and throughput sound good to me. The issue is that a COPY is that post-ra scheduling they won't exist, they will already have been turned into either movs or removed because they were not needed. And pre-RA it is difficult to know if they will be deleted later, if they are just no-op copys. The assumption in a lot of places will be that they will be removed, so adding any scheduling info to them about resources can be incorrect. Cross register bank copies can be more important, and won't be removed as easily. Those are the ones that transfer between gpr and fpr.
llvm/test/tools/llvm-mca/AArch64/Cortex/A55-neon-instructions.s
2507	I'm not entirely sure either way, to be honest. A lot of this has been around from long ago. From what I can tell, the FPMAC is for floating point operations that are expected to take a long time (the ones that finish out of order in the optimization guide). There are 2 because of the way it splits 128bit operations into 2 64bit operations, and so that models the dual-issue. I'm not sure what FPDIV is. It models the hazards in fsqrt/fdiv maybe? So I don't think that the integer mla's need to go onto the same FPMAC pipeline. They can go onto into FPALU I think (or maybe it doesn't matter which they go down, but FPALU sounds more correct to me).

Addressed review comments

Harbormaster completed remote builds in B148981: Diff 407874.Feb 11 2022, 7:56 AM

Thanks. LGTM

This revision is now accepted and ready to land.Feb 14 2022, 1:06 AM

This revision was landed with ongoing or failed builds.Feb 17 2022, 2:43 AM

Closed by commit rG37fa99eda0f5: [SchedModels][CortexA55] Add ASIMD integer instructions (authored by kpdev42). · Explain Why

This revision was automatically updated to reflect the committed changes.

kpdev42 added a commit: rG37fa99eda0f5: [SchedModels][CortexA55] Add ASIMD integer instructions.

Hello.

I'm getting a few reports of this making performance worse, especially on Cortex-A510 cpu's. I think that adding the forwarding paths present on A55, but not available in A510 are causing more hazards and the performance to drop significantly in places, because they are compiled for cpu=generic. The A510 generally has higher throughput, but also higher latencies in places.

We may need to back out some of these changes, even if it makes the A55 model less precise. At least in the short term. We might need to take the route of not hurting other cpus, providing it doesn't help the A55 performance much.

dmgreen mentioned this in rG61b616755ace: Partially revert "[SchedModels][CortexA55] Add ASIMD integer instructions".Feb 28 2022, 2:59 AM

I have partially reverted this in 61b616755aced8ed7afc48ffd152f02194b9d201. I was trying not to undo the whole thing, but just removed the forwarding paths and some other parts that were making performance worse around the "L" instructions. The rest was honestly making some performance worse too, but some stuff was better and the parts removed seemed to be causing much of the change. We probably need to be more careful going forward that we benchmark on more cpu's, not just the Cortex-A55. The schedule is used by any -mcpu=generic compile, so even if it's a less accurate model of the A55, we may need to strike more of a balance between different cpus until we have a better option.

Revision Contents

Path

Size

llvm/

lib/

Target/

AArch64/

AArch64SchedA55.td

134 lines

test/

Analysis/

CostModel/

AArch64/

vector-select.ll

2 lines

CodeGen/

AArch64/

GlobalISel/

combine-udiv.ll

176 lines

aarch64-dup-ext.ll

4 lines

active_lane_mask.ll

26 lines

addsub-constant-folding.ll

4 lines

arm64-AdvSIMD-Scalar.ll

8 lines

arm64-fcopysign.ll

8 lines

arm64-sli-sri-opt.ll

4 lines

arm64-subvector-extend.ll

224 lines

arm64-vhadd.ll

8 lines

cmp-select-sign.ll

18 lines

dag-numsignbits.ll

6 lines

div-rem-pair-recomposition-signed.ll

6 lines

div-rem-pair-recomposition-unsigned.ll

6 lines

12 lines

12 lines

4 lines

52 lines

16 lines

4 lines

insert-subvector-res-legalization.ll

24 lines

lowerMUL-newload.ll

8 lines

minmax-of-minmax.ll

64 lines

minmax.ll

8 lines

overeager_mla_fusing.ll

2 lines

ragreedy-local-interval-cost.ll

4 lines

sadd_sat_vec.ll

28 lines

sat-add.ll

8 lines

selectcc-to-shiftand.ll

4 lines

signbit-shift.ll

8 lines

sink-addsub-of-const.ll

48 lines

sinksplat.ll

4 lines

sitofp-fixed-legal.ll

6 lines

srem-seteq-illegal-types.ll

62 lines

srem-seteq-vec-nonsplat.ll

176 lines

srem-seteq-vec-splat.ll

66 lines

ssub_sat_vec.ll

28 lines

sve-fixed-length-int-div.ll

16 lines

sve-fixed-length-int-mulh.ll

8 lines

sve-fixed-length-int-rem.ll

16 lines

sve-fixed-length-masked-scatter.ll

21 lines

sve-vscale-attr.ll

8 lines

uadd_sat_vec.ll

24 lines

urem-seteq-illegal-types.ll

20 lines

urem-seteq-vec-nonsplat.ll

204 lines

urem-seteq-vec-nonzero.ll

18 lines

urem-seteq-vec-splat.ll

58 lines

urem-seteq-vec-tautological.ll

6 lines

24 lines

4 lines

74 lines

118 lines

162 lines

vecreduce-and-legalization.ll

6 lines

vecreduce-fmax-legalization.ll

6 lines

vecreduce-fmin-legalization.ll

6 lines

vector-fcopysign.ll

74 lines

vselect-constants.ll

30 lines

tools/

llvm-mca/

AArch64/

Cortex/

A55-neon-instructions.s

950 lines

Diff 409560

llvm/lib/Target/AArch64/AArch64SchedA55.td

Show First 20 Lines • Show All 143 Lines • ▼ Show 20 Lines
// FP ALU		// FP ALU
// As WriteF result is produced in F5 and it can be mostly forwarded		// As WriteF result is produced in F5 and it can be mostly forwarded
// to consumer at F1, the effectively latency is set as 4.		// to consumer at F1, the effectively latency is set as 4.
def : WriteRes<WriteF, [CortexA55UnitFPALU]> { let Latency = 4; }		def : WriteRes<WriteF, [CortexA55UnitFPALU]> { let Latency = 4; }
def : WriteRes<WriteFCmp, [CortexA55UnitFPALU]> { let Latency = 3; }		def : WriteRes<WriteFCmp, [CortexA55UnitFPALU]> { let Latency = 3; }
def : WriteRes<WriteFCvt, [CortexA55UnitFPALU]> { let Latency = 4; }		def : WriteRes<WriteFCvt, [CortexA55UnitFPALU]> { let Latency = 4; }
def : WriteRes<WriteFCopy, [CortexA55UnitFPALU]> { let Latency = 3; }		def : WriteRes<WriteFCopy, [CortexA55UnitFPALU]> { let Latency = 3; }
def : WriteRes<WriteFImm, [CortexA55UnitFPALU]> { let Latency = 3; }		def : WriteRes<WriteFImm, [CortexA55UnitFPALU]> { let Latency = 3; }
def : WriteRes<WriteVd, [CortexA55UnitFPALU]> { let Latency = 4; }
def : WriteRes<WriteVq, [CortexA55UnitFPALU,CortexA55UnitFPALU]> { let Latency = 4; let BeginGroup = 1; }		// NEON
		class CortexA55WriteVd<int n, ProcResourceKind res> : SchedWriteRes<[res]> {
		let Latency = n;
		}
		class CortexA55WriteVq<int n, ProcResourceKind res> : SchedWriteRes<[res, res]> {
		let Latency = n;
		let BeginGroup = 1;
		}
		class CortexA55WriteVqL<int n, ProcResourceKind res> : SchedWriteRes<[res, res, res, res]> {
		let Latency = n;
		let BeginGroup = 1;
		}
		def CortexA55WriteDotScVq_4 : CortexA55WriteVq<4, CortexA55UnitFPALU>;
		def CortexA55WriteDotVq_4 : CortexA55WriteVq<4, CortexA55UnitFPALU>;
		def CortexA55WriteDotVd_4 : CortexA55WriteVd<4, CortexA55UnitFPALU>;
		def CortexA55WriteMlaLVq_4 : CortexA55WriteVq<4, CortexA55UnitFPALU>;
		def CortexA55WriteMlaIxVq_4 : CortexA55WriteVq<4, CortexA55UnitFPALU>;
		def CortexA55WriteMlaVq_4 : CortexA55WriteVq<4, CortexA55UnitFPALU>;
		def CortexA55WriteMlaVd_4 : CortexA55WriteVd<4, CortexA55UnitFPALU>;
		def CortexA55WriteAluVq_4 : CortexA55WriteVq<4, CortexA55UnitFPALU>;
		def CortexA55WriteAluVd_3 : CortexA55WriteVd<3, CortexA55UnitFPALU>;
		def CortexA55WriteAluVq_3 : CortexA55WriteVq<3, CortexA55UnitFPALU>;
		def CortexA55WriteAluVd_2 : CortexA55WriteVd<2, CortexA55UnitFPALU>;
		def CortexA55WriteAluVq_2 : CortexA55WriteVq<2, CortexA55UnitFPALU>;
		def CortexA55WriteAluVd_1 : CortexA55WriteVd<1, CortexA55UnitFPALU>;
		def CortexA55WriteAluVq_1 : CortexA55WriteVq<1, CortexA55UnitFPALU>;
		def CortexA55WriteAluVqL_4 : CortexA55WriteVqL<4, CortexA55UnitFPALU>;
		def : SchedAlias<WriteVd, CortexA55WriteVd<4, CortexA55UnitFPALU>>;
		def : SchedAlias<WriteVq, CortexA55WriteVq<4, CortexA55UnitFPALU>>;

// FP ALU specific new schedwrite definitions		// FP ALU specific new schedwrite definitions
def CortexA55WriteFPALU_F2 : SchedWriteRes<[CortexA55UnitFPALU]> { let Latency = 2;}		def CortexA55WriteFPALU_F2 : SchedWriteRes<[CortexA55UnitFPALU]> { let Latency = 2;}
def CortexA55WriteFPALU_F3 : SchedWriteRes<[CortexA55UnitFPALU]> { let Latency = 3;}		def CortexA55WriteFPALU_F3 : SchedWriteRes<[CortexA55UnitFPALU]> { let Latency = 3;}
def CortexA55WriteFPALU_F4 : SchedWriteRes<[CortexA55UnitFPALU]> { let Latency = 4;}		def CortexA55WriteFPALU_F4 : SchedWriteRes<[CortexA55UnitFPALU]> { let Latency = 4;}
def CortexA55WriteFPALU_F5 : SchedWriteRes<[CortexA55UnitFPALU]> { let Latency = 5;}		def CortexA55WriteFPALU_F5 : SchedWriteRes<[CortexA55UnitFPALU]> { let Latency = 5;}

// FP Mul, Div, Sqrt. Div/Sqrt are not pipelined		// FP Mul, Div, Sqrt. Div/Sqrt are not pipelined
▲ Show 20 Lines • Show All 62 Lines • ▼ Show 20 Lines	def : ReadAdvance<ReadIMA, 2, [WriteImm,WriteI,
WriteIM32,WriteIM64]>;		WriteIM32,WriteIM64]>;

// Div		// Div
def : ReadAdvance<ReadID, 1, [WriteImm,WriteI,		def : ReadAdvance<ReadID, 1, [WriteImm,WriteI,
WriteISReg, WriteIEReg,WriteIS,		WriteISReg, WriteIEReg,WriteIS,
WriteID32,WriteID64,		WriteID32,WriteID64,
WriteIM32,WriteIM64]>;		WriteIM32,WriteIM64]>;

		// NEON ALU/MAC forwarding paths
		def CortexA55ReadMla : SchedReadAdvance<3, [CortexA55WriteMlaVd_4, CortexA55WriteMlaVq_4]>;
		def CortexA55ReadMlaIx : SchedReadAdvance<3, [CortexA55WriteMlaIxVq_4]>;
		def CortexA55ReadMlaL : SchedReadAdvance<3, [CortexA55WriteMlaLVq_4]>;
		def CortexA55ReadDot : SchedReadAdvance<3, [CortexA55WriteDotVd_4, CortexA55WriteDotVq_4]>;
		def CortexA55ReadDotSc : SchedReadAdvance<3, [CortexA55WriteDotScVq_4]>;

//===----------------------------------------------------------------------===//		//===----------------------------------------------------------------------===//
// Subtarget-specific InstRWs.		// Subtarget-specific InstRWs.

//---		//---
// Miscellaneous		// Miscellaneous
//---		//---
def : InstRW<[CortexA55WriteVLD1SI,CortexA55WriteLDP1], (instregex "LDPS?Wi")>;		def : InstRW<[CortexA55WriteVLD1SI,CortexA55WriteLDP1], (instregex "LDPS?Wi")>;
def : InstRW<[CortexA55WriteVLD1,CortexA55WriteLDP1], (instregex "LDPSi")>;		def : InstRW<[CortexA55WriteVLD1,CortexA55WriteLDP1], (instregex "LDPSi")>;
▲ Show 20 Lines • Show All 113 Lines • ▼ Show 20 Lines
def : InstRW<[CortexA55WriteFDivDP], (instrs FDIVDrr)>;		def : InstRW<[CortexA55WriteFDivDP], (instrs FDIVDrr)>;
def : InstRW<[CortexA55WriteFDivHP], (instregex "^FDIVv.*16$")>;		def : InstRW<[CortexA55WriteFDivHP], (instregex "^FDIVv.*16$")>;
def : InstRW<[CortexA55WriteFDivSP], (instregex "^FDIVv.*32$")>;		def : InstRW<[CortexA55WriteFDivSP], (instregex "^FDIVv.*32$")>;
def : InstRW<[CortexA55WriteFDivDP], (instregex "^FDIVv.*64$")>;		def : InstRW<[CortexA55WriteFDivDP], (instregex "^FDIVv.*64$")>;
def : InstRW<[CortexA55WriteFSqrtHP], (instregex "^.SQRT.16$")>;		def : InstRW<[CortexA55WriteFSqrtHP], (instregex "^.SQRT.16$")>;
def : InstRW<[CortexA55WriteFSqrtSP], (instregex "^.SQRT.32$")>;		def : InstRW<[CortexA55WriteFSqrtSP], (instregex "^.SQRT.32$")>;
def : InstRW<[CortexA55WriteFSqrtDP], (instregex "^.SQRT.64$")>;		def : InstRW<[CortexA55WriteFSqrtDP], (instregex "^.SQRT.64$")>;

		// 4.15. Advanced SIMD integer instructions
		// ASIMD absolute diff
		def : InstRW<[CortexA55WriteAluVd_3], (instregex "[SU]ABDv(2i32\|4i16\|8i8)")>;
		def : InstRW<[CortexA55WriteAluVq_3], (instregex "[SU]ABDv(16i8\|4i32\|8i16)")>;
		// ASIMD absolute diff accum
		def : InstRW<[CortexA55WriteAluVqL_4], (instregex "[SU]ABAL?v")>;
		// ASIMD absolute diff long
		def : InstRW<[CortexA55WriteAluVq_3], (instregex "[SU]ABDLv")>;
		// ASIMD arith #1
		def : InstRW<[CortexA55WriteAluVd_2], (instregex "(ADD\|SUB\|NEG)v(1i64\|2i32\|4i16\|8i8)",
		"[SU]R?HADDv(2i32\|4i16\|8i8)", "[SU]HSUBv(2i32\|4i16\|8i8)")>;
		def : InstRW<[CortexA55WriteAluVq_2], (instregex "(ADD\|SUB\|NEG)v(2i64\|4i32\|8i16\|16i8)",
		"[SU]R?HADDv(8i16\|4i32\|16i8)", "[SU]HSUBv(8i16\|4i32\|16i8)")>;
		// ASIMD arith #2
		def : InstRW<[CortexA55WriteAluVd_3], (instregex "ABSv(1i64\|2i32\|4i16\|8i8)$",
		"[SU]ADDLPv(2i32_v1i64\|4i16_v2i32\|8i8_v4i16)$",
		"([SU]QADD\|[SU]QSUB\|SQNEG\|SUQADD\|USQADD)v(1i16\|1i32\|1i64\|1i8\|2i32\|4i16\|8i8)$",
		"ADDPv(2i32\|4i16\|8i8)$")>;
		def : InstRW<[CortexA55WriteAluVq_3], (instregex "ABSv(2i64\|4i32\|8i16\|16i8)$",
		"[SU]ADDLPv(16i8_v8i16\|4i32_v2i64\|8i16_v4i32)$",
		dmgreenUnsubmitted Not Done Reply Inline Actions "01" in the dual issue tables means it must be the first item (slot 0). "10" would be EndGroup, and is mostly limited to certains branches and rets. dmgreen: "01" in the dual issue tables means it must be the first item (slot 0). "10" would be EndGroup…
		"([SU]QADD\|[SU]QSUB\|SQNEG\|SUQADD\|USQADD)v(16i8\|2i64\|4i32\|8i16)$",
		"ADDPv(16i8\|2i64\|4i32\|8i16)$")>;
		// ASIMD arith #3
		def : InstRW<[CortexA55WriteAluVq_3], (instregex "SADDLv", "UADDLv", "SADDWv",
		"UADDWv", "SSUBLv", "USUBLv", "SSUBWv", "USUBWv", "ADDHNv", "SUBHNv")>;
		// ASIMD arith #5
		def : InstRW<[CortexA55WriteAluVqL_4], (instregex "RADDHNv", "RSUBHNv")>;
		// ASIMD arith, reduce
		def : InstRW<[CortexA55WriteAluVq_3], (instregex "ADDVv", "SADDLVv", "UADDLVv")>;
		// ASIMD compare #1
		def : InstRW<[CortexA55WriteAluVd_2], (instregex "CM(EQ\|GE\|GT\|HI\|HS\|LE\|LT)v(1i64\|2i32\|4i16\|8i8)")>;
		def : InstRW<[CortexA55WriteAluVq_2], (instregex "CM(EQ\|GE\|GT\|HI\|HS\|LE\|LT)v(2i64\|4i32\|8i16\|16i8)")>;
		// ASIMD compare #2
		def : InstRW<[CortexA55WriteAluVd_3], (instregex "CMTSTv(1i64\|2i32\|4i16\|8i8)")>;
		def : InstRW<[CortexA55WriteAluVq_3], (instregex "CMTSTv(2i64\|4i32\|8i16\|16i8)")>;
		// ASIMD logical $1
		def : InstRW<[CortexA55WriteAluVd_1], (instregex "(AND\|EOR\|NOT\|ORN)v8i8",
		"(ORR\|BIC)v(2i32\|4i16\|8i8)$", "MVNIv(2i\|2s\|4i16)")>;
		def : InstRW<[CortexA55WriteAluVq_1], (instregex "(AND\|EOR\|NOT\|ORN)v16i8",
		"(ORR\|BIC)v(16i8\|4i32\|8i16)$", "MVNIv(4i32\|4s\|8i16)")>;
		// ASIMD max/min, basic
		def : InstRW<[CortexA55WriteAluVd_2], (instregex "[SU](MIN\|MAX)P?v(2i32\|4i16\|8i8)")>;
		def : InstRW<[CortexA55WriteAluVq_2], (instregex "[SU](MIN\|MAX)P?v(16i8\|4i132\|8i16)")>;
		// SIMD max/min, reduce
		def : InstRW<[CortexA55WriteAluVq_4], (instregex "[SU](MAX\|MIN)Vv")>;
		// ASIMD multiply, by element
		def : InstRW<[CortexA55WriteAluVq_4], (instregex "MULv(2i32\|4i16\|4i32\|8i16)_indexed$",
		"SQR?DMULHv(1i16\|1i32\|2i32\|4i16\|4i32\|8i16)_indexed$")>;
		// ASIMD multiply
		def : InstRW<[CortexA55WriteAluVd_3], (instrs PMULv8i8)>;
		def : InstRW<[CortexA55WriteAluVq_3], (instrs PMULv16i8)>;
		// ASIMD multiply accumulate
		def : InstRW<[CortexA55WriteMlaVd_4, CortexA55ReadMla], (instregex "ML[AS]v(2i32\|4i16\|8i8)$")>;
		def : InstRW<[CortexA55WriteMlaVq_4, CortexA55ReadMla], (instregex "ML[AS]v(16i8\|4i32\|8i16)$")>;
		def : InstRW<[CortexA55WriteMlaIxVq_4, CortexA55ReadMlaIx], (instregex "ML[AS]v(2i32\|4i16\|4i32\|8i16)_indexed$")>;
		// ASIMD multiply accumulate half
		def : InstRW<[CortexA55WriteAluVq_4], (instregex "SQRDML[AS]H[vi]")>;
		// ASIMD multiply accumulate long
		def : InstRW<[CortexA55WriteMlaLVq_4, CortexA55ReadMlaL], (instregex "[SU]ML[AS]Lv")>;
		// ASIMD multiply accumulate long #2
		def : InstRW<[CortexA55WriteAluVq_4], (instregex "SQDML[AS]L[iv]")>;
		// ASIMD dot product
		def : InstRW<[CortexA55WriteDotVd_4, CortexA55ReadDot], (instregex "[SU]DOTv8i8")>;
		def : InstRW<[CortexA55WriteDotVq_4, CortexA55ReadDot], (instregex "[SU]DOTv16i8")>;
		// ASIMD dot product, by scalar
		def : InstRW<[CortexA55WriteDotScVq_4, CortexA55ReadDotSc], (instregex "[SU]DOTlanev")>;
		// ASIMD multiply long
		def : InstRW<[CortexA55WriteAluVq_4], (instregex "[SU]MULLv", "SQDMULL[iv]")>;
		// ASIMD polynomial (8x8) multiply long
		def : InstRW<[CortexA55WriteAluVq_3], (instrs PMULLv8i8, PMULLv16i8)>;
		// ASIMD pairwise add and accumulate
		def : InstRW<[CortexA55WriteAluVqL_4], (instregex "[SU]ADALPv")>;
		// ASIMD shift accumulate
		def : InstRW<[CortexA55WriteAluVd_3], (instregex "[SU]SRA(d\|v2i32\|v4i16\|v8i8)")>;
		def : InstRW<[CortexA55WriteAluVq_3], (instregex "[SU]SRAv(16i8\|2i64\|4i32\|8i16)")>;
		// ASIMD shift accumulate #2
		def : InstRW<[CortexA55WriteAluVqL_4], (instregex "[SU]RSRA[vd]")>;
		// ASIMD shift by immed
		def : InstRW<[CortexA55WriteAluVd_2], (instregex "SHLd$", "SHLv",
		"SLId$", "SRId$", "[SU]SHR[vd]", "SHRNv")>;
		// ASIMD shift by immed
		// SXTL and UXTL are aliases for SHLL
		def : InstRW<[CortexA55WriteAluVq_2], (instregex "[US]?SHLLv")>;
		// ASIMD shift by immed #2
		def : InstRW<[CortexA55WriteAluVd_3], (instregex "[SU]RSHR(d\|v2i32\|v4i16\|v8i8)",
		"RSHRNv(2i32\|4i16\|8i8)")>;
		def : InstRW<[CortexA55WriteAluVq_3], (instregex "[SU]RSHRv(16i8\|2i64\|4i32\|8i16)",
		"RSHRNv(16i8\|4i32\|8i16)")>;
		// ASIMD shift by register
		def : InstRW<[CortexA55WriteAluVd_2], (instregex "[SU]SHLv(1i64\|2i32\|4i16\|8i8)")>;
		def : InstRW<[CortexA55WriteAluVq_2], (instregex "[SU]SHLv(2i64\|4i32\|8i16\|16i8)")>;
		// ASIMD shift by register #2
		def : InstRW<[CortexA55WriteAluVd_3], (instregex "[SU]RSHLv(1i64\|2i32\|4i16\|8i8)")>;
		def : InstRW<[CortexA55WriteAluVq_3], (instregex "[SU]RSHLv(2i64\|4i32\|8i16\|16i8)")>;

}		}
		dmgreenUnsubmitted Not Done Reply Inline Actions Does this add a lot? It's not really how COPYs work. dmgreen: Does this add a lot? It's not really how COPYs work.
		kpdev42AuthorUnsubmitted Done Reply Inline Actions According to our experiments FPU copy (fmov) has latency of 1 cycle and throughput of 2 or 1 (Q-form). According to model integer ALU copy has 3 cycle latency. What would be correct model for COPY in your opinion? kpdev42: According to our experiments FPU copy (fmov) has latency of 1 cycle and throughput of 2 or 1 (Q…
		dmgreenUnsubmitted Not Done Reply Inline Actions Yep - the vector mov latency and throughput sound good to me. The issue is that a COPY is that post-ra scheduling they won't exist, they will already have been turned into either movs or removed because they were not needed. And pre-RA it is difficult to know if they will be deleted later, if they are just no-op copys. The assumption in a lot of places will be that they will be removed, so adding any scheduling info to them about resources can be incorrect. Cross register bank copies can be more important, and won't be removed as easily. Those are the ones that transfer between gpr and fpr. dmgreen: Yep - the vector mov latency and throughput sound good to me. The issue is that a COPY is that…

llvm/test/Analysis/CostModel/AArch64/vector-select.ll

	Show First 20 Lines • Show All 115 Lines • ▼ Show 20 Lines

	; COST-LABEL: v3i64_select_sle			; COST-LABEL: v3i64_select_sle
	; COST-NEXT: Cost Model: Found an estimated cost of 2 for instruction: %cmp.1 = icmp sle <3 x i64> %a, %b			; COST-NEXT: Cost Model: Found an estimated cost of 2 for instruction: %cmp.1 = icmp sle <3 x i64> %a, %b
	; COST-NEXT: Cost Model: Found an estimated cost of 2 for instruction: %s.1 = select <3 x i1> %cmp.1, <3 x i64> %a, <3 x i64> %c			; COST-NEXT: Cost Model: Found an estimated cost of 2 for instruction: %s.1 = select <3 x i1> %cmp.1, <3 x i64> %a, <3 x i64> %c

	; CODE-LABEL: v3i64_select_sle			; CODE-LABEL: v3i64_select_sle
	; CODE: bb.0			; CODE: bb.0
	; CODE: mov			; CODE: mov
	; CODE: ldr
	; CODE: mov			; CODE: mov
	; CODE: mov			; CODE: mov
	; CODE: cmge			; CODE: cmge
	; CODE: cmge			; CODE: cmge
				; CODE: ldr
	; CODE: bif			; CODE: bif
	; CODE: bif			; CODE: bif
	; CODE: ext			; CODE: ext
	; CODE: ret			; CODE: ret

	define <3 x i64> @v3i64_select_sle(<3 x i64> %a, <3 x i64> %b, <3 x i64> %c) {			define <3 x i64> @v3i64_select_sle(<3 x i64> %a, <3 x i64> %b, <3 x i64> %c) {
	%cmp.1 = icmp sle <3 x i64> %a, %b			%cmp.1 = icmp sle <3 x i64> %a, %b
	%s.1 = select <3 x i1> %cmp.1, <3 x i64> %a, <3 x i64> %c			%s.1 = select <3 x i1> %cmp.1, <3 x i64> %a, <3 x i64> %c
	▲ Show 20 Lines • Show All 670 Lines • Show Last 20 Lines

llvm/test/CodeGen/AArch64/GlobalISel/combine-udiv.ll

Show All 29 Lines	; GISEL-NEXT: ret
%1 = udiv <8 x i16> %x, <i16 23, i16 23, i16 23, i16 23, i16 23, i16 23, i16 23, i16 23>		%1 = udiv <8 x i16> %x, <i16 23, i16 23, i16 23, i16 23, i16 23, i16 23, i16 23, i16 23>
ret <8 x i16> %1		ret <8 x i16> %1
}		}

define <8 x i16> @combine_vec_udiv_nonuniform(<8 x i16> %x) {		define <8 x i16> @combine_vec_udiv_nonuniform(<8 x i16> %x) {
; SDAG-LABEL: combine_vec_udiv_nonuniform:		; SDAG-LABEL: combine_vec_udiv_nonuniform:
; SDAG: // %bb.0:		; SDAG: // %bb.0:
; SDAG-NEXT: adrp x8, .LCPI1_0		; SDAG-NEXT: adrp x8, .LCPI1_0
		; SDAG-NEXT: adrp x9, .LCPI1_1
; SDAG-NEXT: ldr q1, [x8, :lo12:.LCPI1_0]		; SDAG-NEXT: ldr q1, [x8, :lo12:.LCPI1_0]
; SDAG-NEXT: adrp x8, .LCPI1_1
; SDAG-NEXT: ushl v1.8h, v0.8h, v1.8h
; SDAG-NEXT: ldr q2, [x8, :lo12:.LCPI1_1]
; SDAG-NEXT: adrp x8, .LCPI1_2		; SDAG-NEXT: adrp x8, .LCPI1_2
		; SDAG-NEXT: ldr q2, [x9, :lo12:.LCPI1_1]
		; SDAG-NEXT: ushl v1.8h, v0.8h, v1.8h
; SDAG-NEXT: umull2 v3.4s, v1.8h, v2.8h		; SDAG-NEXT: umull2 v3.4s, v1.8h, v2.8h
; SDAG-NEXT: umull v1.4s, v1.4h, v2.4h		; SDAG-NEXT: umull v1.4s, v1.4h, v2.4h
; SDAG-NEXT: ldr q2, [x8, :lo12:.LCPI1_2]		; SDAG-NEXT: ldr q2, [x8, :lo12:.LCPI1_2]
; SDAG-NEXT: adrp x8, .LCPI1_3		; SDAG-NEXT: adrp x8, .LCPI1_3
; SDAG-NEXT: uzp2 v1.8h, v1.8h, v3.8h		; SDAG-NEXT: uzp2 v1.8h, v1.8h, v3.8h
; SDAG-NEXT: sub v0.8h, v0.8h, v1.8h		; SDAG-NEXT: sub v0.8h, v0.8h, v1.8h
; SDAG-NEXT: umull2 v3.4s, v0.8h, v2.8h		; SDAG-NEXT: umull2 v3.4s, v0.8h, v2.8h
; SDAG-NEXT: umull v0.4s, v0.4h, v2.4h		; SDAG-NEXT: umull v0.4s, v0.4h, v2.4h
		; SDAG-NEXT: ldr q2, [x8, :lo12:.LCPI1_3]
; SDAG-NEXT: uzp2 v0.8h, v0.8h, v3.8h		; SDAG-NEXT: uzp2 v0.8h, v0.8h, v3.8h
; SDAG-NEXT: add v0.8h, v0.8h, v1.8h		; SDAG-NEXT: add v0.8h, v0.8h, v1.8h
; SDAG-NEXT: ldr q1, [x8, :lo12:.LCPI1_3]		; SDAG-NEXT: ushl v0.8h, v0.8h, v2.8h
; SDAG-NEXT: ushl v0.8h, v0.8h, v1.8h
; SDAG-NEXT: ret		; SDAG-NEXT: ret
;		;
; GISEL-LABEL: combine_vec_udiv_nonuniform:		; GISEL-LABEL: combine_vec_udiv_nonuniform:
; GISEL: // %bb.0:		; GISEL: // %bb.0:
; GISEL-NEXT: adrp x8, .LCPI1_4		; GISEL-NEXT: adrp x8, .LCPI1_4
; GISEL-NEXT: adrp x10, .LCPI1_0		; GISEL-NEXT: adrp x9, .LCPI1_0
; GISEL-NEXT: adrp x9, .LCPI1_1
; GISEL-NEXT: ldr q1, [x8, :lo12:.LCPI1_4]		; GISEL-NEXT: ldr q1, [x8, :lo12:.LCPI1_4]
; GISEL-NEXT: adrp x8, .LCPI1_3		; GISEL-NEXT: adrp x8, .LCPI1_3
; GISEL-NEXT: ldr q5, [x10, :lo12:.LCPI1_0]		; GISEL-NEXT: ldr q5, [x9, :lo12:.LCPI1_0]
; GISEL-NEXT: ldr q6, [x9, :lo12:.LCPI1_1]
; GISEL-NEXT: neg v1.8h, v1.8h		; GISEL-NEXT: neg v1.8h, v1.8h
; GISEL-NEXT: ldr q2, [x8, :lo12:.LCPI1_3]		; GISEL-NEXT: ldr q2, [x8, :lo12:.LCPI1_3]
; GISEL-NEXT: adrp x8, .LCPI1_2		; GISEL-NEXT: adrp x8, .LCPI1_2
; GISEL-NEXT: ushl v1.8h, v0.8h, v1.8h		; GISEL-NEXT: ushl v1.8h, v0.8h, v1.8h
; GISEL-NEXT: umull2 v3.4s, v1.8h, v2.8h		; GISEL-NEXT: umull2 v3.4s, v1.8h, v2.8h
; GISEL-NEXT: umull v1.4s, v1.4h, v2.4h		; GISEL-NEXT: umull v1.4s, v1.4h, v2.4h
; GISEL-NEXT: uzp2 v1.8h, v1.8h, v3.8h		; GISEL-NEXT: ldr q2, [x8, :lo12:.LCPI1_2]
; GISEL-NEXT: ldr q3, [x8, :lo12:.LCPI1_2]
; GISEL-NEXT: adrp x8, .LCPI1_5		; GISEL-NEXT: adrp x8, .LCPI1_5
; GISEL-NEXT: sub v2.8h, v0.8h, v1.8h		; GISEL-NEXT: uzp2 v1.8h, v1.8h, v3.8h
; GISEL-NEXT: umull2 v4.4s, v2.8h, v3.8h		; GISEL-NEXT: sub v3.8h, v0.8h, v1.8h
; GISEL-NEXT: umull v2.4s, v2.4h, v3.4h		; GISEL-NEXT: umull2 v4.4s, v3.8h, v2.8h
		; GISEL-NEXT: umull v2.4s, v3.4h, v2.4h
; GISEL-NEXT: ldr q3, [x8, :lo12:.LCPI1_5]		; GISEL-NEXT: ldr q3, [x8, :lo12:.LCPI1_5]
		; GISEL-NEXT: adrp x8, .LCPI1_1
; GISEL-NEXT: cmeq v3.8h, v3.8h, v5.8h		; GISEL-NEXT: cmeq v3.8h, v3.8h, v5.8h
; GISEL-NEXT: uzp2 v2.8h, v2.8h, v4.8h		; GISEL-NEXT: uzp2 v2.8h, v2.8h, v4.8h
; GISEL-NEXT: neg v4.8h, v6.8h		; GISEL-NEXT: ldr q4, [x8, :lo12:.LCPI1_1]
		; GISEL-NEXT: shl v3.8h, v3.8h, #15
; GISEL-NEXT: add v1.8h, v2.8h, v1.8h		; GISEL-NEXT: add v1.8h, v2.8h, v1.8h
; GISEL-NEXT: shl v2.8h, v3.8h, #15		; GISEL-NEXT: neg v2.8h, v4.8h
; GISEL-NEXT: ushl v1.8h, v1.8h, v4.8h		; GISEL-NEXT: ushl v1.8h, v1.8h, v2.8h
; GISEL-NEXT: sshr v2.8h, v2.8h, #15		; GISEL-NEXT: sshr v2.8h, v3.8h, #15
; GISEL-NEXT: bif v0.16b, v1.16b, v2.16b		; GISEL-NEXT: bif v0.16b, v1.16b, v2.16b
; GISEL-NEXT: ret		; GISEL-NEXT: ret
%1 = udiv <8 x i16> %x, <i16 23, i16 34, i16 -23, i16 56, i16 128, i16 -1, i16 -256, i16 -32768>		%1 = udiv <8 x i16> %x, <i16 23, i16 34, i16 -23, i16 56, i16 128, i16 -1, i16 -256, i16 -32768>
ret <8 x i16> %1		ret <8 x i16> %1
}		}

define <8 x i16> @combine_vec_udiv_nonuniform2(<8 x i16> %x) {		define <8 x i16> @combine_vec_udiv_nonuniform2(<8 x i16> %x) {
; SDAG-LABEL: combine_vec_udiv_nonuniform2:		; SDAG-LABEL: combine_vec_udiv_nonuniform2:
; SDAG: // %bb.0:		; SDAG: // %bb.0:
; SDAG-NEXT: adrp x8, .LCPI2_0		; SDAG-NEXT: adrp x8, .LCPI2_0
		; SDAG-NEXT: adrp x9, .LCPI2_1
; SDAG-NEXT: ldr q1, [x8, :lo12:.LCPI2_0]		; SDAG-NEXT: ldr q1, [x8, :lo12:.LCPI2_0]
; SDAG-NEXT: adrp x8, .LCPI2_1
; SDAG-NEXT: ushl v0.8h, v0.8h, v1.8h
; SDAG-NEXT: ldr q1, [x8, :lo12:.LCPI2_1]
; SDAG-NEXT: adrp x8, .LCPI2_2		; SDAG-NEXT: adrp x8, .LCPI2_2
; SDAG-NEXT: umull2 v2.4s, v0.8h, v1.8h		; SDAG-NEXT: ldr q2, [x9, :lo12:.LCPI2_1]
; SDAG-NEXT: umull v0.4s, v0.4h, v1.4h		; SDAG-NEXT: ushl v0.8h, v0.8h, v1.8h
		; SDAG-NEXT: umull2 v1.4s, v0.8h, v2.8h
		; SDAG-NEXT: umull v0.4s, v0.4h, v2.4h
		; SDAG-NEXT: uzp2 v0.8h, v0.8h, v1.8h
; SDAG-NEXT: ldr q1, [x8, :lo12:.LCPI2_2]		; SDAG-NEXT: ldr q1, [x8, :lo12:.LCPI2_2]
; SDAG-NEXT: uzp2 v0.8h, v0.8h, v2.8h
; SDAG-NEXT: ushl v0.8h, v0.8h, v1.8h		; SDAG-NEXT: ushl v0.8h, v0.8h, v1.8h
; SDAG-NEXT: ret		; SDAG-NEXT: ret
;		;
; GISEL-LABEL: combine_vec_udiv_nonuniform2:		; GISEL-LABEL: combine_vec_udiv_nonuniform2:
; GISEL: // %bb.0:		; GISEL: // %bb.0:
; GISEL-NEXT: adrp x8, .LCPI2_3		; GISEL-NEXT: adrp x8, .LCPI2_3
; GISEL-NEXT: adrp x9, .LCPI2_4		; GISEL-NEXT: adrp x9, .LCPI2_4
; GISEL-NEXT: adrp x10, .LCPI2_0		; GISEL-NEXT: adrp x10, .LCPI2_0
; GISEL-NEXT: ldr q1, [x8, :lo12:.LCPI2_3]		; GISEL-NEXT: ldr q1, [x8, :lo12:.LCPI2_3]
; GISEL-NEXT: adrp x8, .LCPI2_2		; GISEL-NEXT: adrp x8, .LCPI2_2
; GISEL-NEXT: ldr q3, [x9, :lo12:.LCPI2_4]
; GISEL-NEXT: ldr q4, [x10, :lo12:.LCPI2_0]		; GISEL-NEXT: ldr q4, [x10, :lo12:.LCPI2_0]
; GISEL-NEXT: neg v1.8h, v1.8h		; GISEL-NEXT: neg v1.8h, v1.8h
; GISEL-NEXT: ldr q2, [x8, :lo12:.LCPI2_2]		; GISEL-NEXT: ldr q2, [x8, :lo12:.LCPI2_2]
; GISEL-NEXT: adrp x8, .LCPI2_1		; GISEL-NEXT: adrp x8, .LCPI2_1
; GISEL-NEXT: cmeq v3.8h, v3.8h, v4.8h
; GISEL-NEXT: ushl v1.8h, v0.8h, v1.8h		; GISEL-NEXT: ushl v1.8h, v0.8h, v1.8h
; GISEL-NEXT: shl v3.8h, v3.8h, #15		; GISEL-NEXT: umull2 v3.4s, v1.8h, v2.8h
; GISEL-NEXT: umull2 v5.4s, v1.8h, v2.8h		; GISEL-NEXT: ldr q5, [x8, :lo12:.LCPI2_1]
; GISEL-NEXT: umull v1.4s, v1.4h, v2.4h		; GISEL-NEXT: umull v1.4s, v1.4h, v2.4h
; GISEL-NEXT: ldr q2, [x8, :lo12:.LCPI2_1]		; GISEL-NEXT: ldr q2, [x9, :lo12:.LCPI2_4]
; GISEL-NEXT: neg v2.8h, v2.8h		; GISEL-NEXT: cmeq v2.8h, v2.8h, v4.8h
; GISEL-NEXT: uzp2 v1.8h, v1.8h, v5.8h		; GISEL-NEXT: uzp2 v1.8h, v1.8h, v3.8h
; GISEL-NEXT: ushl v1.8h, v1.8h, v2.8h		; GISEL-NEXT: neg v3.8h, v5.8h
; GISEL-NEXT: sshr v2.8h, v3.8h, #15		; GISEL-NEXT: shl v2.8h, v2.8h, #15
		; GISEL-NEXT: ushl v1.8h, v1.8h, v3.8h
		; GISEL-NEXT: sshr v2.8h, v2.8h, #15
; GISEL-NEXT: bif v0.16b, v1.16b, v2.16b		; GISEL-NEXT: bif v0.16b, v1.16b, v2.16b
; GISEL-NEXT: ret		; GISEL-NEXT: ret
%1 = udiv <8 x i16> %x, <i16 -34, i16 35, i16 36, i16 -37, i16 38, i16 -39, i16 40, i16 -41>		%1 = udiv <8 x i16> %x, <i16 -34, i16 35, i16 36, i16 -37, i16 38, i16 -39, i16 40, i16 -41>
ret <8 x i16> %1		ret <8 x i16> %1
}		}

define <8 x i16> @combine_vec_udiv_nonuniform3(<8 x i16> %x) {		define <8 x i16> @combine_vec_udiv_nonuniform3(<8 x i16> %x) {
; SDAG-LABEL: combine_vec_udiv_nonuniform3:		; SDAG-LABEL: combine_vec_udiv_nonuniform3:
; SDAG: // %bb.0:		; SDAG: // %bb.0:
; SDAG-NEXT: adrp x8, .LCPI3_0		; SDAG-NEXT: adrp x8, .LCPI3_0
; SDAG-NEXT: ldr q1, [x8, :lo12:.LCPI3_0]		; SDAG-NEXT: ldr q1, [x8, :lo12:.LCPI3_0]
; SDAG-NEXT: adrp x8, .LCPI3_1		; SDAG-NEXT: adrp x8, .LCPI3_1
; SDAG-NEXT: umull2 v2.4s, v0.8h, v1.8h		; SDAG-NEXT: umull2 v2.4s, v0.8h, v1.8h
; SDAG-NEXT: umull v1.4s, v0.4h, v1.4h		; SDAG-NEXT: umull v1.4s, v0.4h, v1.4h
; SDAG-NEXT: uzp2 v1.8h, v1.8h, v2.8h		; SDAG-NEXT: uzp2 v1.8h, v1.8h, v2.8h
; SDAG-NEXT: sub v0.8h, v0.8h, v1.8h		; SDAG-NEXT: sub v0.8h, v0.8h, v1.8h
; SDAG-NEXT: usra v1.8h, v0.8h, #1		; SDAG-NEXT: usra v1.8h, v0.8h, #1
; SDAG-NEXT: ldr q0, [x8, :lo12:.LCPI3_1]		; SDAG-NEXT: ldr q0, [x8, :lo12:.LCPI3_1]
; SDAG-NEXT: ushl v0.8h, v1.8h, v0.8h		; SDAG-NEXT: ushl v0.8h, v1.8h, v0.8h
; SDAG-NEXT: ret		; SDAG-NEXT: ret
;		;
; GISEL-LABEL: combine_vec_udiv_nonuniform3:		; GISEL-LABEL: combine_vec_udiv_nonuniform3:
; GISEL: // %bb.0:		; GISEL: // %bb.0:
; GISEL-NEXT: adrp x8, .LCPI3_2		; GISEL-NEXT: adrp x8, .LCPI3_2
; GISEL-NEXT: adrp x10, .LCPI3_0		; GISEL-NEXT: adrp x9, .LCPI3_0
; GISEL-NEXT: adrp x9, .LCPI3_1
; GISEL-NEXT: ldr q1, [x8, :lo12:.LCPI3_2]		; GISEL-NEXT: ldr q1, [x8, :lo12:.LCPI3_2]
; GISEL-NEXT: adrp x8, .LCPI3_3		; GISEL-NEXT: adrp x8, .LCPI3_3
; GISEL-NEXT: ldr q3, [x10, :lo12:.LCPI3_0]		; GISEL-NEXT: ldr q3, [x9, :lo12:.LCPI3_0]
; GISEL-NEXT: ldr q4, [x9, :lo12:.LCPI3_1]
; GISEL-NEXT: umull2 v2.4s, v0.8h, v1.8h		; GISEL-NEXT: umull2 v2.4s, v0.8h, v1.8h
; GISEL-NEXT: umull v1.4s, v0.4h, v1.4h		; GISEL-NEXT: umull v1.4s, v0.4h, v1.4h
; GISEL-NEXT: uzp2 v1.8h, v1.8h, v2.8h		; GISEL-NEXT: uzp2 v1.8h, v1.8h, v2.8h
; GISEL-NEXT: ldr q2, [x8, :lo12:.LCPI3_3]		; GISEL-NEXT: ldr q2, [x8, :lo12:.LCPI3_3]
		; GISEL-NEXT: adrp x8, .LCPI3_1
; GISEL-NEXT: cmeq v2.8h, v2.8h, v3.8h		; GISEL-NEXT: cmeq v2.8h, v2.8h, v3.8h
; GISEL-NEXT: sub v5.8h, v0.8h, v1.8h		; GISEL-NEXT: sub v4.8h, v0.8h, v1.8h
; GISEL-NEXT: neg v3.8h, v4.8h		; GISEL-NEXT: ldr q3, [x8, :lo12:.LCPI3_1]
; GISEL-NEXT: shl v2.8h, v2.8h, #15		; GISEL-NEXT: shl v2.8h, v2.8h, #15
; GISEL-NEXT: usra v1.8h, v5.8h, #1		; GISEL-NEXT: usra v1.8h, v4.8h, #1
		; GISEL-NEXT: neg v3.8h, v3.8h
; GISEL-NEXT: sshr v2.8h, v2.8h, #15		; GISEL-NEXT: sshr v2.8h, v2.8h, #15
; GISEL-NEXT: ushl v1.8h, v1.8h, v3.8h		; GISEL-NEXT: ushl v1.8h, v1.8h, v3.8h
; GISEL-NEXT: bif v0.16b, v1.16b, v2.16b		; GISEL-NEXT: bif v0.16b, v1.16b, v2.16b
; GISEL-NEXT: ret		; GISEL-NEXT: ret
%1 = udiv <8 x i16> %x, <i16 7, i16 23, i16 25, i16 27, i16 31, i16 47, i16 63, i16 127>		%1 = udiv <8 x i16> %x, <i16 7, i16 23, i16 25, i16 27, i16 31, i16 47, i16 63, i16 127>
ret <8 x i16> %1		ret <8 x i16> %1
}		}

define <16 x i8> @combine_vec_udiv_nonuniform4(<16 x i8> %x) {		define <16 x i8> @combine_vec_udiv_nonuniform4(<16 x i8> %x) {
; SDAG-LABEL: combine_vec_udiv_nonuniform4:		; SDAG-LABEL: combine_vec_udiv_nonuniform4:
; SDAG: // %bb.0:		; SDAG: // %bb.0:
; SDAG-NEXT: adrp x8, .LCPI4_0		; SDAG-NEXT: adrp x8, .LCPI4_0
; SDAG-NEXT: adrp x9, .LCPI4_3		; SDAG-NEXT: adrp x9, .LCPI4_2
; SDAG-NEXT: ldr q1, [x8, :lo12:.LCPI4_0]		; SDAG-NEXT: ldr q1, [x8, :lo12:.LCPI4_0]
; SDAG-NEXT: adrp x8, .LCPI4_1		; SDAG-NEXT: adrp x8, .LCPI4_1
; SDAG-NEXT: ldr q3, [x9, :lo12:.LCPI4_3]		; SDAG-NEXT: ldr q3, [x9, :lo12:.LCPI4_2]
; SDAG-NEXT: umull2 v2.8h, v0.16b, v1.16b		; SDAG-NEXT: umull2 v2.8h, v0.16b, v1.16b
; SDAG-NEXT: umull v1.8h, v0.8b, v1.8b		; SDAG-NEXT: umull v1.8h, v0.8b, v1.8b
; SDAG-NEXT: and v0.16b, v0.16b, v3.16b
; SDAG-NEXT: uzp2 v1.16b, v1.16b, v2.16b		; SDAG-NEXT: uzp2 v1.16b, v1.16b, v2.16b
; SDAG-NEXT: ldr q2, [x8, :lo12:.LCPI4_1]		; SDAG-NEXT: ldr q2, [x8, :lo12:.LCPI4_1]
; SDAG-NEXT: adrp x8, .LCPI4_2		; SDAG-NEXT: adrp x8, .LCPI4_3
; SDAG-NEXT: ushl v1.16b, v1.16b, v2.16b		; SDAG-NEXT: ushl v1.16b, v1.16b, v2.16b
; SDAG-NEXT: ldr q2, [x8, :lo12:.LCPI4_2]		; SDAG-NEXT: ldr q2, [x8, :lo12:.LCPI4_3]
; SDAG-NEXT: and v1.16b, v1.16b, v2.16b		; SDAG-NEXT: and v1.16b, v1.16b, v3.16b
		; SDAG-NEXT: and v0.16b, v0.16b, v2.16b
; SDAG-NEXT: orr v0.16b, v0.16b, v1.16b		; SDAG-NEXT: orr v0.16b, v0.16b, v1.16b
; SDAG-NEXT: ret		; SDAG-NEXT: ret
;		;
; GISEL-LABEL: combine_vec_udiv_nonuniform4:		; GISEL-LABEL: combine_vec_udiv_nonuniform4:
; GISEL: // %bb.0:		; GISEL: // %bb.0:
		; GISEL-NEXT: adrp x8, .LCPI4_2
		; GISEL-NEXT: adrp x9, .LCPI4_0
		; GISEL-NEXT: ldr q1, [x8, :lo12:.LCPI4_2]
; GISEL-NEXT: adrp x8, .LCPI4_3		; GISEL-NEXT: adrp x8, .LCPI4_3
; GISEL-NEXT: adrp x9, .LCPI4_2		; GISEL-NEXT: ldr q4, [x9, :lo12:.LCPI4_0]
; GISEL-NEXT: adrp x10, .LCPI4_1		; GISEL-NEXT: umull2 v2.8h, v0.16b, v1.16b
; GISEL-NEXT: ldr q1, [x8, :lo12:.LCPI4_3]		; GISEL-NEXT: ldr q3, [x8, :lo12:.LCPI4_3]
; GISEL-NEXT: adrp x8, .LCPI4_0		; GISEL-NEXT: umull v1.8h, v0.8b, v1.8b
; GISEL-NEXT: ldr q2, [x9, :lo12:.LCPI4_2]		; GISEL-NEXT: adrp x8, .LCPI4_1
; GISEL-NEXT: ldr q3, [x10, :lo12:.LCPI4_1]		; GISEL-NEXT: cmeq v3.16b, v3.16b, v4.16b
; GISEL-NEXT: ldr q4, [x8, :lo12:.LCPI4_0]		; GISEL-NEXT: uzp2 v1.16b, v1.16b, v2.16b
; GISEL-NEXT: umull2 v5.8h, v0.16b, v2.16b		; GISEL-NEXT: ldr q2, [x8, :lo12:.LCPI4_1]
; GISEL-NEXT: umull v2.8h, v0.8b, v2.8b		; GISEL-NEXT: shl v3.16b, v3.16b, #7
; GISEL-NEXT: cmeq v1.16b, v1.16b, v4.16b		; GISEL-NEXT: neg v2.16b, v2.16b
; GISEL-NEXT: neg v3.16b, v3.16b		; GISEL-NEXT: ushl v1.16b, v1.16b, v2.16b
; GISEL-NEXT: uzp2 v2.16b, v2.16b, v5.16b		; GISEL-NEXT: sshr v2.16b, v3.16b, #7
; GISEL-NEXT: shl v1.16b, v1.16b, #7		; GISEL-NEXT: bif v0.16b, v1.16b, v2.16b
; GISEL-NEXT: ushl v2.16b, v2.16b, v3.16b
; GISEL-NEXT: sshr v1.16b, v1.16b, #7
; GISEL-NEXT: bif v0.16b, v2.16b, v1.16b
; GISEL-NEXT: ret		; GISEL-NEXT: ret
%div = udiv <16 x i8> %x, <i8 -64, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1>		%div = udiv <16 x i8> %x, <i8 -64, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1>
ret <16 x i8> %div		ret <16 x i8> %div
}		}

define <8 x i16> @pr38477(<8 x i16> %a0) {		define <8 x i16> @pr38477(<8 x i16> %a0) {
; SDAG-LABEL: pr38477:		; SDAG-LABEL: pr38477:
; SDAG: // %bb.0:		; SDAG: // %bb.0:
; SDAG-NEXT: adrp x8, .LCPI5_0		; SDAG-NEXT: adrp x8, .LCPI5_0
; SDAG-NEXT: adrp x9, .LCPI5_4		; SDAG-NEXT: adrp x9, .LCPI5_3
; SDAG-NEXT: ldr q1, [x8, :lo12:.LCPI5_0]		; SDAG-NEXT: ldr q1, [x8, :lo12:.LCPI5_0]
; SDAG-NEXT: adrp x8, .LCPI5_1		; SDAG-NEXT: adrp x8, .LCPI5_1
; SDAG-NEXT: umull2 v2.4s, v0.8h, v1.8h		; SDAG-NEXT: umull2 v2.4s, v0.8h, v1.8h
; SDAG-NEXT: ldr q3, [x8, :lo12:.LCPI5_1]
; SDAG-NEXT: umull v1.4s, v0.4h, v1.4h		; SDAG-NEXT: umull v1.4s, v0.4h, v1.4h
; SDAG-NEXT: adrp x8, .LCPI5_2
; SDAG-NEXT: uzp2 v1.8h, v1.8h, v2.8h		; SDAG-NEXT: uzp2 v1.8h, v1.8h, v2.8h
; SDAG-NEXT: sub v2.8h, v0.8h, v1.8h		; SDAG-NEXT: ldr q2, [x8, :lo12:.LCPI5_1]
; SDAG-NEXT: umull2 v4.4s, v2.8h, v3.8h		; SDAG-NEXT: adrp x8, .LCPI5_2
; SDAG-NEXT: umull v2.4s, v2.4h, v3.4h		; SDAG-NEXT: sub v3.8h, v0.8h, v1.8h
; SDAG-NEXT: ldr q3, [x9, :lo12:.LCPI5_4]		; SDAG-NEXT: umull2 v4.4s, v3.8h, v2.8h
; SDAG-NEXT: and v0.16b, v0.16b, v3.16b		; SDAG-NEXT: umull v2.4s, v3.4h, v2.4h
		; SDAG-NEXT: ldr q3, [x8, :lo12:.LCPI5_2]
		; SDAG-NEXT: adrp x8, .LCPI5_4
; SDAG-NEXT: uzp2 v2.8h, v2.8h, v4.8h		; SDAG-NEXT: uzp2 v2.8h, v2.8h, v4.8h
		; SDAG-NEXT: ldr q4, [x9, :lo12:.LCPI5_3]
; SDAG-NEXT: add v1.8h, v2.8h, v1.8h		; SDAG-NEXT: add v1.8h, v2.8h, v1.8h
; SDAG-NEXT: ldr q2, [x8, :lo12:.LCPI5_2]		; SDAG-NEXT: ldr q2, [x8, :lo12:.LCPI5_4]
; SDAG-NEXT: adrp x8, .LCPI5_3		; SDAG-NEXT: ushl v1.8h, v1.8h, v3.8h
; SDAG-NEXT: ushl v1.8h, v1.8h, v2.8h		; SDAG-NEXT: and v0.16b, v0.16b, v2.16b
; SDAG-NEXT: ldr q2, [x8, :lo12:.LCPI5_3]		; SDAG-NEXT: and v1.16b, v1.16b, v4.16b
; SDAG-NEXT: and v1.16b, v1.16b, v2.16b
; SDAG-NEXT: orr v0.16b, v0.16b, v1.16b		; SDAG-NEXT: orr v0.16b, v0.16b, v1.16b
; SDAG-NEXT: ret		; SDAG-NEXT: ret
;		;
; GISEL-LABEL: pr38477:		; GISEL-LABEL: pr38477:
; GISEL: // %bb.0:		; GISEL: // %bb.0:
; GISEL-NEXT: adrp x8, .LCPI5_3		; GISEL-NEXT: adrp x8, .LCPI5_3
; GISEL-NEXT: adrp x10, .LCPI5_0		; GISEL-NEXT: adrp x9, .LCPI5_0
; GISEL-NEXT: adrp x9, .LCPI5_1
; GISEL-NEXT: ldr q1, [x8, :lo12:.LCPI5_3]		; GISEL-NEXT: ldr q1, [x8, :lo12:.LCPI5_3]
; GISEL-NEXT: adrp x8, .LCPI5_2		; GISEL-NEXT: adrp x8, .LCPI5_2
; GISEL-NEXT: ldr q5, [x10, :lo12:.LCPI5_0]		; GISEL-NEXT: ldr q5, [x9, :lo12:.LCPI5_0]
; GISEL-NEXT: ldr q6, [x9, :lo12:.LCPI5_1]
; GISEL-NEXT: umull2 v2.4s, v0.8h, v1.8h		; GISEL-NEXT: umull2 v2.4s, v0.8h, v1.8h
; GISEL-NEXT: ldr q3, [x8, :lo12:.LCPI5_2]
; GISEL-NEXT: umull v1.4s, v0.4h, v1.4h		; GISEL-NEXT: umull v1.4s, v0.4h, v1.4h
; GISEL-NEXT: adrp x8, .LCPI5_4
; GISEL-NEXT: uzp2 v1.8h, v1.8h, v2.8h		; GISEL-NEXT: uzp2 v1.8h, v1.8h, v2.8h
; GISEL-NEXT: sub v2.8h, v0.8h, v1.8h		; GISEL-NEXT: ldr q2, [x8, :lo12:.LCPI5_2]
; GISEL-NEXT: umull2 v4.4s, v2.8h, v3.8h		; GISEL-NEXT: adrp x8, .LCPI5_4
; GISEL-NEXT: umull v2.4s, v2.4h, v3.4h		; GISEL-NEXT: sub v3.8h, v0.8h, v1.8h
		; GISEL-NEXT: umull2 v4.4s, v3.8h, v2.8h
		; GISEL-NEXT: umull v2.4s, v3.4h, v2.4h
; GISEL-NEXT: ldr q3, [x8, :lo12:.LCPI5_4]		; GISEL-NEXT: ldr q3, [x8, :lo12:.LCPI5_4]
		; GISEL-NEXT: adrp x8, .LCPI5_1
; GISEL-NEXT: cmeq v3.8h, v3.8h, v5.8h		; GISEL-NEXT: cmeq v3.8h, v3.8h, v5.8h
; GISEL-NEXT: uzp2 v2.8h, v2.8h, v4.8h		; GISEL-NEXT: uzp2 v2.8h, v2.8h, v4.8h
; GISEL-NEXT: neg v4.8h, v6.8h		; GISEL-NEXT: ldr q4, [x8, :lo12:.LCPI5_1]
		; GISEL-NEXT: shl v3.8h, v3.8h, #15
; GISEL-NEXT: add v1.8h, v2.8h, v1.8h		; GISEL-NEXT: add v1.8h, v2.8h, v1.8h
; GISEL-NEXT: shl v2.8h, v3.8h, #15		; GISEL-NEXT: neg v2.8h, v4.8h
; GISEL-NEXT: ushl v1.8h, v1.8h, v4.8h		; GISEL-NEXT: ushl v1.8h, v1.8h, v2.8h
; GISEL-NEXT: sshr v2.8h, v2.8h, #15		; GISEL-NEXT: sshr v2.8h, v3.8h, #15
; GISEL-NEXT: bif v0.16b, v1.16b, v2.16b		; GISEL-NEXT: bif v0.16b, v1.16b, v2.16b
; GISEL-NEXT: ret		; GISEL-NEXT: ret
%1 = udiv <8 x i16> %a0, <i16 1, i16 119, i16 73, i16 -111, i16 -3, i16 118, i16 32, i16 31>		%1 = udiv <8 x i16> %a0, <i16 1, i16 119, i16 73, i16 -111, i16 -3, i16 118, i16 32, i16 31>
ret <8 x i16> %1		ret <8 x i16> %1
}		}

llvm/test/CodeGen/AArch64/aarch64-dup-ext.ll

Show First 20 Lines • Show All 92 Lines • ▼ Show 20 Lines	entry:
ret <2 x i64> %out		ret <2 x i64> %out
}		}

; Unsupported combines		; Unsupported combines

define <2 x i16> @dupsext_v2i8_v2i16(i8 %src, <2 x i8> %b) {		define <2 x i16> @dupsext_v2i8_v2i16(i8 %src, <2 x i8> %b) {
; CHECK-LABEL: dupsext_v2i8_v2i16:		; CHECK-LABEL: dupsext_v2i8_v2i16:
; CHECK: // %bb.0: // %entry		; CHECK: // %bb.0: // %entry
; CHECK-NEXT: shl v0.2s, v0.2s, #24
; CHECK-NEXT: sxtb w8, w0		; CHECK-NEXT: sxtb w8, w0
; CHECK-NEXT: dup v1.2s, w8		; CHECK-NEXT: shl v0.2s, v0.2s, #24
; CHECK-NEXT: sshr v0.2s, v0.2s, #24		; CHECK-NEXT: sshr v0.2s, v0.2s, #24
		; CHECK-NEXT: dup v1.2s, w8
; CHECK-NEXT: mul v0.2s, v1.2s, v0.2s		; CHECK-NEXT: mul v0.2s, v1.2s, v0.2s
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%in = sext i8 %src to i16		%in = sext i8 %src to i16
%ext.b = sext <2 x i8> %b to <2 x i16>		%ext.b = sext <2 x i8> %b to <2 x i16>
%broadcast.splatinsert = insertelement <2 x i16> undef, i16 %in, i16 0		%broadcast.splatinsert = insertelement <2 x i16> undef, i16 %in, i16 0
%broadcast.splat = shufflevector <2 x i16> %broadcast.splatinsert, <2 x i16> undef, <2 x i32> zeroinitializer		%broadcast.splat = shufflevector <2 x i16> %broadcast.splatinsert, <2 x i16> undef, <2 x i32> zeroinitializer
%out = mul nsw <2 x i16> %broadcast.splat, %ext.b		%out = mul nsw <2 x i16> %broadcast.splat, %ext.b
▲ Show 20 Lines • Show All 73 Lines • Show Last 20 Lines

llvm/test/CodeGen/AArch64/active_lane_mask.ll

Show First 20 Lines • Show All 422 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
ret <16 x i1> %active.lane.mask		ret <16 x i1> %active.lane.mask
}		}

define <8 x i1> @lane_mask_v8i1_i8(i8 %index, i8 %TC) {		define <8 x i1> @lane_mask_v8i1_i8(i8 %index, i8 %TC) {
; CHECK-LABEL: lane_mask_v8i1_i8:		; CHECK-LABEL: lane_mask_v8i1_i8:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: adrp x8, .LCPI24_0		; CHECK-NEXT: adrp x8, .LCPI24_0
; CHECK-NEXT: dup v0.8b, w0		; CHECK-NEXT: dup v0.8b, w0
		; CHECK-NEXT: dup v2.8b, w1
; CHECK-NEXT: ldr d1, [x8, :lo12:.LCPI24_0]		; CHECK-NEXT: ldr d1, [x8, :lo12:.LCPI24_0]
; CHECK-NEXT: uqadd v0.8b, v0.8b, v1.8b		; CHECK-NEXT: uqadd v0.8b, v0.8b, v1.8b
; CHECK-NEXT: dup v1.8b, w1		; CHECK-NEXT: cmhi v0.8b, v2.8b, v0.8b
; CHECK-NEXT: cmhi v0.8b, v1.8b, v0.8b
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%active.lane.mask = call <8 x i1> @llvm.get.active.lane.mask.v8i1.i8(i8 %index, i8 %TC)		%active.lane.mask = call <8 x i1> @llvm.get.active.lane.mask.v8i1.i8(i8 %index, i8 %TC)
ret <8 x i1> %active.lane.mask		ret <8 x i1> %active.lane.mask
}		}

define <4 x i1> @lane_mask_v4i1_i8(i8 %index, i8 %TC) {		define <4 x i1> @lane_mask_v4i1_i8(i8 %index, i8 %TC) {
; CHECK-LABEL: lane_mask_v4i1_i8:		; CHECK-LABEL: lane_mask_v4i1_i8:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: dup v0.4h, w0
; CHECK-NEXT: adrp x8, .LCPI25_0		; CHECK-NEXT: adrp x8, .LCPI25_0
; CHECK-NEXT: dup v2.4h, w1		; CHECK-NEXT: dup v0.4h, w0
		; CHECK-NEXT: movi d2, #0xff00ff00ff00ff
		; CHECK-NEXT: dup v3.4h, w1
; CHECK-NEXT: ldr d1, [x8, :lo12:.LCPI25_0]		; CHECK-NEXT: ldr d1, [x8, :lo12:.LCPI25_0]
; CHECK-NEXT: bic v0.4h, #255, lsl #8		; CHECK-NEXT: bic v0.4h, #255, lsl #8
; CHECK-NEXT: bic v2.4h, #255, lsl #8		; CHECK-NEXT: bic v3.4h, #255, lsl #8
; CHECK-NEXT: add v0.4h, v0.4h, v1.4h		; CHECK-NEXT: add v0.4h, v0.4h, v1.4h
; CHECK-NEXT: movi d1, #0xff00ff00ff00ff		; CHECK-NEXT: umin v0.4h, v0.4h, v2.4h
; CHECK-NEXT: umin v0.4h, v0.4h, v1.4h		; CHECK-NEXT: cmhi v0.4h, v3.4h, v0.4h
; CHECK-NEXT: cmhi v0.4h, v2.4h, v0.4h
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%active.lane.mask = call <4 x i1> @llvm.get.active.lane.mask.v4i1.i8(i8 %index, i8 %TC)		%active.lane.mask = call <4 x i1> @llvm.get.active.lane.mask.v4i1.i8(i8 %index, i8 %TC)
ret <4 x i1> %active.lane.mask		ret <4 x i1> %active.lane.mask
}		}

define <2 x i1> @lane_mask_v2i1_i8(i8 %index, i8 %TC) {		define <2 x i1> @lane_mask_v2i1_i8(i8 %index, i8 %TC) {
; CHECK-LABEL: lane_mask_v2i1_i8:		; CHECK-LABEL: lane_mask_v2i1_i8:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
		; CHECK-NEXT: adrp x8, .LCPI26_0
; CHECK-NEXT: movi d0, #0x0000ff000000ff		; CHECK-NEXT: movi d0, #0x0000ff000000ff
; CHECK-NEXT: dup v1.2s, w0		; CHECK-NEXT: dup v1.2s, w0
; CHECK-NEXT: adrp x8, .LCPI26_0
; CHECK-NEXT: dup v3.2s, w1		; CHECK-NEXT: dup v3.2s, w1
; CHECK-NEXT: and v1.8b, v1.8b, v0.8b
; CHECK-NEXT: ldr d2, [x8, :lo12:.LCPI26_0]		; CHECK-NEXT: ldr d2, [x8, :lo12:.LCPI26_0]
		; CHECK-NEXT: and v1.8b, v1.8b, v0.8b
; CHECK-NEXT: add v1.2s, v1.2s, v2.2s		; CHECK-NEXT: add v1.2s, v1.2s, v2.2s
; CHECK-NEXT: and v2.8b, v3.8b, v0.8b		; CHECK-NEXT: umin v1.2s, v1.2s, v0.2s
; CHECK-NEXT: umin v0.2s, v1.2s, v0.2s		; CHECK-NEXT: and v0.8b, v3.8b, v0.8b
; CHECK-NEXT: cmhi v0.2s, v2.2s, v0.2s		; CHECK-NEXT: cmhi v0.2s, v0.2s, v1.2s
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%active.lane.mask = call <2 x i1> @llvm.get.active.lane.mask.v2i1.i8(i8 %index, i8 %TC)		%active.lane.mask = call <2 x i1> @llvm.get.active.lane.mask.v2i1.i8(i8 %index, i8 %TC)
ret <2 x i1> %active.lane.mask		ret <2 x i1> %active.lane.mask
}		}


declare <vscale x 32 x i1> @llvm.get.active.lane.mask.nxv32i1.i32(i32, i32)		declare <vscale x 32 x i1> @llvm.get.active.lane.mask.nxv32i1.i32(i32, i32)
declare <vscale x 16 x i1> @llvm.get.active.lane.mask.nxv16i1.i32(i32, i32)		declare <vscale x 16 x i1> @llvm.get.active.lane.mask.nxv16i1.i32(i32, i32)
Show All 31 Lines

llvm/test/CodeGen/AArch64/addsub-constant-folding.ll

	Show First 20 Lines • Show All 207 Lines • ▼ Show 20 Lines
	; CHECK-NEXT: sub sp, sp, #32			; CHECK-NEXT: sub sp, sp, #32
	; CHECK-NEXT: str x30, [sp, #16] // 8-byte Folded Spill			; CHECK-NEXT: str x30, [sp, #16] // 8-byte Folded Spill
	; CHECK-NEXT: .cfi_def_cfa_offset 32			; CHECK-NEXT: .cfi_def_cfa_offset 32
	; CHECK-NEXT: .cfi_offset w30, -16			; CHECK-NEXT: .cfi_offset w30, -16
	; CHECK-NEXT: movi v1.4s, #8			; CHECK-NEXT: movi v1.4s, #8
	; CHECK-NEXT: str q0, [sp] // 16-byte Folded Spill			; CHECK-NEXT: str q0, [sp] // 16-byte Folded Spill
	; CHECK-NEXT: add v0.4s, v0.4s, v1.4s			; CHECK-NEXT: add v0.4s, v0.4s, v1.4s
	; CHECK-NEXT: bl vec_use			; CHECK-NEXT: bl vec_use
	; CHECK-NEXT: mvni v0.4s, #5
	; CHECK-NEXT: ldr q1, [sp] // 16-byte Folded Reload			; CHECK-NEXT: ldr q1, [sp] // 16-byte Folded Reload
	; CHECK-NEXT: ldr x30, [sp, #16] // 8-byte Folded Reload			; CHECK-NEXT: ldr x30, [sp, #16] // 8-byte Folded Reload
				; CHECK-NEXT: mvni v0.4s, #5
	; CHECK-NEXT: sub v0.4s, v0.4s, v1.4s			; CHECK-NEXT: sub v0.4s, v0.4s, v1.4s
	; CHECK-NEXT: add sp, sp, #32			; CHECK-NEXT: add sp, sp, #32
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%t0 = add <4 x i32> %arg, <i32 8, i32 8, i32 8, i32 8>			%t0 = add <4 x i32> %arg, <i32 8, i32 8, i32 8, i32 8>
	call void @vec_use(<4 x i32> %t0)			call void @vec_use(<4 x i32> %t0)
	%t1 = sub <4 x i32> <i32 2, i32 2, i32 2, i32 2>, %t0			%t1 = sub <4 x i32> <i32 2, i32 2, i32 2, i32 2>, %t0
	ret <4 x i32> %t1			ret <4 x i32> %t1
	}			}
	▲ Show 20 Lines • Show All 58 Lines • ▼ Show 20 Lines
	; CHECK-NEXT: sub sp, sp, #32			; CHECK-NEXT: sub sp, sp, #32
	; CHECK-NEXT: str x30, [sp, #16] // 8-byte Folded Spill			; CHECK-NEXT: str x30, [sp, #16] // 8-byte Folded Spill
	; CHECK-NEXT: .cfi_def_cfa_offset 32			; CHECK-NEXT: .cfi_def_cfa_offset 32
	; CHECK-NEXT: .cfi_offset w30, -16			; CHECK-NEXT: .cfi_offset w30, -16
	; CHECK-NEXT: movi v1.4s, #8			; CHECK-NEXT: movi v1.4s, #8
	; CHECK-NEXT: str q0, [sp] // 16-byte Folded Spill			; CHECK-NEXT: str q0, [sp] // 16-byte Folded Spill
	; CHECK-NEXT: sub v0.4s, v0.4s, v1.4s			; CHECK-NEXT: sub v0.4s, v0.4s, v1.4s
	; CHECK-NEXT: bl vec_use			; CHECK-NEXT: bl vec_use
	; CHECK-NEXT: mvni v0.4s, #5
	; CHECK-NEXT: ldr q1, [sp] // 16-byte Folded Reload			; CHECK-NEXT: ldr q1, [sp] // 16-byte Folded Reload
	; CHECK-NEXT: ldr x30, [sp, #16] // 8-byte Folded Reload			; CHECK-NEXT: ldr x30, [sp, #16] // 8-byte Folded Reload
				; CHECK-NEXT: mvni v0.4s, #5
	; CHECK-NEXT: add v0.4s, v1.4s, v0.4s			; CHECK-NEXT: add v0.4s, v1.4s, v0.4s
	; CHECK-NEXT: add sp, sp, #32			; CHECK-NEXT: add sp, sp, #32
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%t0 = sub <4 x i32> %arg, <i32 8, i32 8, i32 8, i32 8>			%t0 = sub <4 x i32> %arg, <i32 8, i32 8, i32 8, i32 8>
	call void @vec_use(<4 x i32> %t0)			call void @vec_use(<4 x i32> %t0)
	%t1 = add <4 x i32> %t0, <i32 2, i32 2, i32 2, i32 2>			%t1 = add <4 x i32> %t0, <i32 2, i32 2, i32 2, i32 2>
	ret <4 x i32> %t1			ret <4 x i32> %t1
	}			}
	▲ Show 20 Lines • Show All 407 Lines • Show Last 20 Lines

llvm/test/CodeGen/AArch64/arm64-AdvSIMD-Scalar.ll

Show First 20 Lines • Show All 62 Lines • ▼ Show 20 Lines	; GENERIC-NEXT: ret
%retval = bitcast i64 %add.i to double		%retval = bitcast i64 %add.i to double
ret double %retval		ret double %retval
}		}

; sub MI doesn't access dsub register.		; sub MI doesn't access dsub register.
define double @add_sub_su64(<2 x i64> %a, <2 x i64> %b) nounwind readnone {		define double @add_sub_su64(<2 x i64> %a, <2 x i64> %b) nounwind readnone {
; CHECK-LABEL: add_sub_su64:		; CHECK-LABEL: add_sub_su64:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
		; CHECK-NEXT: fmov d2, xzr
; CHECK-NEXT: add d0, d1, d0		; CHECK-NEXT: add d0, d1, d0
; CHECK-NEXT: fmov d1, xzr		; CHECK-NEXT: sub d0, d2, d0
; CHECK-NEXT: sub d0, d1, d0
; CHECK-NEXT: ret		; CHECK-NEXT: ret
;		;
; GENERIC-LABEL: add_sub_su64:		; GENERIC-LABEL: add_sub_su64:
; GENERIC: // %bb.0:		; GENERIC: // %bb.0:
		; GENERIC-NEXT: fmov d2, xzr
; GENERIC-NEXT: add d0, d1, d0		; GENERIC-NEXT: add d0, d1, d0
; GENERIC-NEXT: fmov d1, xzr		; GENERIC-NEXT: sub d0, d2, d0
; GENERIC-NEXT: sub d0, d1, d0
; GENERIC-NEXT: ret		; GENERIC-NEXT: ret
%vecext = extractelement <2 x i64> %a, i32 0		%vecext = extractelement <2 x i64> %a, i32 0
%vecext1 = extractelement <2 x i64> %b, i32 0		%vecext1 = extractelement <2 x i64> %b, i32 0
%add.i = add i64 %vecext1, %vecext		%add.i = add i64 %vecext1, %vecext
%sub.i = sub i64 0, %add.i		%sub.i = sub i64 0, %add.i
%retval = bitcast i64 %sub.i to double		%retval = bitcast i64 %sub.i to double
ret double %retval		ret double %retval
}		}
▲ Show 20 Lines • Show All 50 Lines • Show Last 20 Lines

llvm/test/CodeGen/AArch64/arm64-fcopysign.ll

; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py		; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
; RUN: llc < %s -mtriple=aarch64-apple-darwin \| FileCheck %s		; RUN: llc < %s -mtriple=aarch64-apple-darwin \| FileCheck %s

; rdar://9332258		; rdar://9332258

define float @test1(float %x, float %y) nounwind {		define float @test1(float %x, float %y) nounwind {
; CHECK-LABEL: test1:		; CHECK-LABEL: test1:
; CHECK: ; %bb.0: ; %entry		; CHECK: ; %bb.0: ; %entry
; CHECK-NEXT: mvni.4s v2, #128, lsl #24
; CHECK-NEXT: ; kill: def $s0 killed $s0 def $q0		; CHECK-NEXT: ; kill: def $s0 killed $s0 def $q0
		; CHECK-NEXT: mvni.4s v2, #128, lsl #24
; CHECK-NEXT: ; kill: def $s1 killed $s1 def $q1		; CHECK-NEXT: ; kill: def $s1 killed $s1 def $q1
; CHECK-NEXT: bif.16b v0, v1, v2		; CHECK-NEXT: bif.16b v0, v1, v2
; CHECK-NEXT: ; kill: def $s0 killed $s0 killed $q0		; CHECK-NEXT: ; kill: def $s0 killed $s0 killed $q0
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%0 = tail call float @copysignf(float %x, float %y) nounwind readnone		%0 = tail call float @copysignf(float %x, float %y) nounwind readnone
ret float %0		ret float %0
}		}
Show All 31 Lines	; CHECK-NEXT: ret
ret double %tmp		ret double %tmp
}		}

define float @test4() nounwind {		define float @test4() nounwind {
; CHECK-LABEL: test4:		; CHECK-LABEL: test4:
; CHECK: ; %bb.0: ; %entry		; CHECK: ; %bb.0: ; %entry
; CHECK-NEXT: stp x29, x30, [sp, #-16]! ; 16-byte Folded Spill		; CHECK-NEXT: stp x29, x30, [sp, #-16]! ; 16-byte Folded Spill
; CHECK-NEXT: bl _bar		; CHECK-NEXT: bl _bar
; CHECK-NEXT: mvni.4s v1, #128, lsl #24
; CHECK-NEXT: fcvt s0, d0		; CHECK-NEXT: fcvt s0, d0
; CHECK-NEXT: fmov s2, #0.50000000		; CHECK-NEXT: fmov s1, #0.50000000
; CHECK-NEXT: bsl.16b v1, v2, v0		; CHECK-NEXT: mvni.4s v2, #128, lsl #24
		; CHECK-NEXT: bif.16b v1, v0, v2
; CHECK-NEXT: fadd s0, s0, s1		; CHECK-NEXT: fadd s0, s0, s1
; CHECK-NEXT: ldp x29, x30, [sp], #16 ; 16-byte Folded Reload		; CHECK-NEXT: ldp x29, x30, [sp], #16 ; 16-byte Folded Reload
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%0 = tail call double (...) @bar() nounwind		%0 = tail call double (...) @bar() nounwind
%1 = fptrunc double %0 to float		%1 = fptrunc double %0 to float
%2 = tail call float @copysignf(float 5.000000e-01, float %1) nounwind readnone		%2 = tail call float @copysignf(float 5.000000e-01, float %1) nounwind readnone
%3 = fadd float %1, %2		%3 = fadd float %1, %2
ret float %3		ret float %3
}		}

declare double @bar(...)		declare double @bar(...)
declare double @copysign(double, double) nounwind readnone		declare double @copysign(double, double) nounwind readnone
declare float @copysignf(float, float) nounwind readnone		declare float @copysignf(float, float) nounwind readnone

llvm/test/CodeGen/AArch64/arm64-sli-sri-opt.ll

Show First 20 Lines • Show All 368 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
store <2 x i64> %result, <2 x i64>* %dest, align 16		store <2 x i64> %result, <2 x i64>* %dest, align 16
ret void		ret void
}		}

define void @testLeftBad2x64(<2 x i64> %src1, <2 x i64> %src2, <2 x i64>* %dest) nounwind {		define void @testLeftBad2x64(<2 x i64> %src1, <2 x i64> %src2, <2 x i64>* %dest) nounwind {
; CHECK-LABEL: testLeftBad2x64:		; CHECK-LABEL: testLeftBad2x64:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: mov x8, #10		; CHECK-NEXT: mov x8, #10
; CHECK-NEXT: movk x8, #1, lsl #48
; CHECK-NEXT: shl.2d v1, v1, #48		; CHECK-NEXT: shl.2d v1, v1, #48
		; CHECK-NEXT: movk x8, #1, lsl #48
; CHECK-NEXT: dup.2d v2, x8		; CHECK-NEXT: dup.2d v2, x8
; CHECK-NEXT: and.16b v0, v0, v2		; CHECK-NEXT: and.16b v0, v0, v2
; CHECK-NEXT: orr.16b v0, v0, v1		; CHECK-NEXT: orr.16b v0, v0, v1
; CHECK-NEXT: str q0, [x0]		; CHECK-NEXT: str q0, [x0]
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%and.i = and <2 x i64> %src1, <i64 281474976710666, i64 281474976710666>		%and.i = and <2 x i64> %src1, <i64 281474976710666, i64 281474976710666>
%vshl_n = shl <2 x i64> %src2, <i64 48, i64 48>		%vshl_n = shl <2 x i64> %src2, <i64 48, i64 48>
%result = or <2 x i64> %and.i, %vshl_n		%result = or <2 x i64> %and.i, %vshl_n
Show All 13 Lines	; CHECK-NEXT: ret
store <2 x i64> %result, <2 x i64>* %dest, align 16		store <2 x i64> %result, <2 x i64>* %dest, align 16
ret void		ret void
}		}

define void @testRightBad2x64(<2 x i64> %src1, <2 x i64> %src2, <2 x i64>* %dest) nounwind {		define void @testRightBad2x64(<2 x i64> %src1, <2 x i64> %src2, <2 x i64>* %dest) nounwind {
; CHECK-LABEL: testRightBad2x64:		; CHECK-LABEL: testRightBad2x64:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: mov x8, #10		; CHECK-NEXT: mov x8, #10
; CHECK-NEXT: movk x8, #1, lsl #48
; CHECK-NEXT: ushr.2d v1, v1, #48		; CHECK-NEXT: ushr.2d v1, v1, #48
		; CHECK-NEXT: movk x8, #1, lsl #48
; CHECK-NEXT: dup.2d v2, x8		; CHECK-NEXT: dup.2d v2, x8
; CHECK-NEXT: and.16b v0, v0, v2		; CHECK-NEXT: and.16b v0, v0, v2
; CHECK-NEXT: orr.16b v0, v0, v1		; CHECK-NEXT: orr.16b v0, v0, v1
; CHECK-NEXT: str q0, [x0]		; CHECK-NEXT: str q0, [x0]
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%and.i = and <2 x i64> %src1, <i64 281474976710666, i64 281474976710666>		%and.i = and <2 x i64> %src1, <i64 281474976710666, i64 281474976710666>
%vshl_n = lshr <2 x i64> %src2, <i64 48, i64 48>		%vshl_n = lshr <2 x i64> %src2, <i64 48, i64 48>
%result = or <2 x i64> %and.i, %vshl_n		%result = or <2 x i64> %and.i, %vshl_n
Show All 33 Lines

llvm/test/CodeGen/AArch64/arm64-subvector-extend.ll

Show First 20 Lines • Show All 171 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%r = zext <4 x i8> %v0 to <4 x i64>		%r = zext <4 x i8> %v0 to <4 x i64>
ret <4 x i64> %r		ret <4 x i64> %r
}		}

define <4 x i64> @sext_v4i8_to_v4i64(<4 x i8> %v0) nounwind {		define <4 x i64> @sext_v4i8_to_v4i64(<4 x i8> %v0) nounwind {
; CHECK-LABEL: sext_v4i8_to_v4i64:		; CHECK-LABEL: sext_v4i8_to_v4i64:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: ushll.4s v0, v0, #0		; CHECK-NEXT: ushll.4s v0, v0, #0
; CHECK-NEXT: ushll2.2d v1, v0, #0		; CHECK-NEXT: ushll.2d v1, v0, #0
; CHECK-NEXT: ushll.2d v0, v0, #0		; CHECK-NEXT: ushll2.2d v0, v0, #0
; CHECK-NEXT: shl.2d v1, v1, #56		; CHECK-NEXT: shl.2d v2, v1, #56
; CHECK-NEXT: shl.2d v0, v0, #56		; CHECK-NEXT: shl.2d v0, v0, #56
; CHECK-NEXT: sshr.2d v1, v1, #56		; CHECK-NEXT: sshr.2d v1, v0, #56
; CHECK-NEXT: sshr.2d v0, v0, #56		; CHECK-NEXT: sshr.2d v0, v2, #56
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%r = sext <4 x i8> %v0 to <4 x i64>		%r = sext <4 x i8> %v0 to <4 x i64>
ret <4 x i64> %r		ret <4 x i64> %r
}		}

define <8 x i64> @zext_v8i8_to_v8i64(<8 x i8> %v0) nounwind {		define <8 x i64> @zext_v8i8_to_v8i64(<8 x i8> %v0) nounwind {
; CHECK-LABEL: zext_v8i8_to_v8i64:		; CHECK-LABEL: zext_v8i8_to_v8i64:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: ushll.8h v0, v0, #0		; CHECK-NEXT: ushll.8h v0, v0, #0
; CHECK-NEXT: ushll.4s v2, v0, #0		; CHECK-NEXT: ushll2.4s v2, v0, #0
; CHECK-NEXT: ushll2.4s v4, v0, #0		; CHECK-NEXT: ushll.4s v0, v0, #0
; CHECK-NEXT: ushll2.2d v1, v2, #0		; CHECK-NEXT: ushll2.2d v3, v2, #0
; CHECK-NEXT: ushll.2d v0, v2, #0		; CHECK-NEXT: ushll2.2d v1, v0, #0
; CHECK-NEXT: ushll2.2d v3, v4, #0		; CHECK-NEXT: ushll.2d v0, v0, #0
; CHECK-NEXT: ushll.2d v2, v4, #0		; CHECK-NEXT: ushll.2d v2, v2, #0
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%r = zext <8 x i8> %v0 to <8 x i64>		%r = zext <8 x i8> %v0 to <8 x i64>
ret <8 x i64> %r		ret <8 x i64> %r
}		}

define <8 x i64> @sext_v8i8_to_v8i64(<8 x i8> %v0) nounwind {		define <8 x i64> @sext_v8i8_to_v8i64(<8 x i8> %v0) nounwind {
; CHECK-LABEL: sext_v8i8_to_v8i64:		; CHECK-LABEL: sext_v8i8_to_v8i64:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: sshll.8h v0, v0, #0		; CHECK-NEXT: sshll.8h v0, v0, #0
; CHECK-NEXT: sshll.4s v2, v0, #0		; CHECK-NEXT: sshll2.4s v2, v0, #0
; CHECK-NEXT: sshll2.4s v4, v0, #0		; CHECK-NEXT: sshll.4s v0, v0, #0
; CHECK-NEXT: sshll2.2d v1, v2, #0		; CHECK-NEXT: sshll2.2d v3, v2, #0
; CHECK-NEXT: sshll.2d v0, v2, #0		; CHECK-NEXT: sshll2.2d v1, v0, #0
; CHECK-NEXT: sshll2.2d v3, v4, #0		; CHECK-NEXT: sshll.2d v0, v0, #0
; CHECK-NEXT: sshll.2d v2, v4, #0		; CHECK-NEXT: sshll.2d v2, v2, #0
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%r = sext <8 x i8> %v0 to <8 x i64>		%r = sext <8 x i8> %v0 to <8 x i64>
ret <8 x i64> %r		ret <8 x i64> %r
}		}

; Extends of vectors of i1.		; Extends of vectors of i1.

define <32 x i8> @zext_v32i1(<32 x i1> %arg) {		define <32 x i8> @zext_v32i1(<32 x i1> %arg) {
▲ Show 20 Lines • Show All 267 Lines • ▼ Show 20 Lines
define <64 x i8> @sext_v64i1(<64 x i1> %arg) {		define <64 x i8> @sext_v64i1(<64 x i1> %arg) {
; CHECK-LABEL: sext_v64i1:		; CHECK-LABEL: sext_v64i1:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: ldr w8, [sp, #320]		; CHECK-NEXT: ldr w8, [sp, #320]
; CHECK-NEXT: fmov s3, w0		; CHECK-NEXT: fmov s3, w0
; CHECK-NEXT: ldr w9, [sp, #64]		; CHECK-NEXT: ldr w9, [sp, #64]
; CHECK-NEXT: ldr w10, [sp, #192]		; CHECK-NEXT: ldr w10, [sp, #192]
; CHECK-NEXT: fmov s0, w8		; CHECK-NEXT: fmov s0, w8
; CHECK-NEXT: ldr w8, [sp, #72]		; CHECK-NEXT: ldr w8, [sp, #328]
; CHECK-NEXT: fmov s2, w9		; CHECK-NEXT: fmov s1, w9
; CHECK-NEXT: ldr w9, [sp, #200]		; CHECK-NEXT: ldr w9, [sp, #72]
; CHECK-NEXT: fmov s1, w10		; CHECK-NEXT: fmov s2, w10
; CHECK-NEXT: ldr w10, [sp, #328]		; CHECK-NEXT: ldr w10, [sp, #80]
		; CHECK-NEXT: mov.b v0[1], w8
		; CHECK-NEXT: ldr w8, [sp, #200]
		; CHECK-NEXT: mov.b v1[1], w9
		; CHECK-NEXT: ldr w9, [sp, #336]
; CHECK-NEXT: mov.b v3[1], w1		; CHECK-NEXT: mov.b v3[1], w1
; CHECK-NEXT: ldr w11, [sp, #344]		; CHECK-NEXT: ldr w11, [sp, #88]
; CHECK-NEXT: mov.b v2[1], w8		; CHECK-NEXT: mov.b v2[1], w8
; CHECK-NEXT: ldr w8, [sp, #336]		; CHECK-NEXT: ldr w8, [sp, #344]
; CHECK-NEXT: mov.b v1[1], w9		; CHECK-NEXT: mov.b v0[2], w9
; CHECK-NEXT: ldr w9, [sp, #80]		; CHECK-NEXT: ldr w9, [sp, #208]
; CHECK-NEXT: mov.b v0[1], w10		; CHECK-NEXT: mov.b v1[2], w10
; CHECK-NEXT: ldr w10, [sp, #208]		; CHECK-NEXT: ldr w10, [sp, #352]
; CHECK-NEXT: mov.b v3[2], w2		; CHECK-NEXT: mov.b v3[2], w2
; CHECK-NEXT: ldr w12, [sp, #360]		; CHECK-NEXT: ldr w12, [sp, #96]
; CHECK-NEXT: mov.b v2[2], w9		; CHECK-NEXT: mov.b v2[2], w9
; CHECK-NEXT: ldr w9, [sp, #352]		; CHECK-NEXT: ldr w9, [sp, #360]
; CHECK-NEXT: mov.b v1[2], w10		; CHECK-NEXT: mov.b v0[3], w8
; CHECK-NEXT: ldr w10, [sp, #88]
; CHECK-NEXT: mov.b v0[2], w8
; CHECK-NEXT: ldr w8, [sp, #216]		; CHECK-NEXT: ldr w8, [sp, #216]
		; CHECK-NEXT: mov.b v1[3], w11
		; CHECK-NEXT: ldr w13, [sp, #104]
; CHECK-NEXT: mov.b v3[3], w3		; CHECK-NEXT: mov.b v3[3], w3
; CHECK-NEXT: ldr w13, [sp, #376]		; CHECK-NEXT: ldr w11, [sp, #368]
; CHECK-NEXT: mov.b v2[3], w10		; CHECK-NEXT: mov.b v2[3], w8
; CHECK-NEXT: ldr w10, [sp, #368]		; CHECK-NEXT: ldr w14, [sp, #112]
; CHECK-NEXT: mov.b v1[3], w8		; CHECK-NEXT: mov.b v0[4], w10
; CHECK-NEXT: ldr w8, [sp, #96]		; CHECK-NEXT: ldr w10, [sp, #224]
; CHECK-NEXT: mov.b v0[3], w11		; CHECK-NEXT: mov.b v1[4], w12
; CHECK-NEXT: ldr w11, [sp, #224]		; CHECK-NEXT: ldr w8, [sp, #376]
; CHECK-NEXT: mov.b v3[4], w4		; CHECK-NEXT: mov.b v3[4], w4
; CHECK-NEXT: ldr w14, [sp, #392]		; CHECK-NEXT: ldr w15, [sp, #120]
; CHECK-NEXT: mov.b v2[4], w8		; CHECK-NEXT: mov.b v2[4], w10
; CHECK-NEXT: ldr w8, [sp, #384]		; CHECK-NEXT: ldr w12, [sp, #384]
; CHECK-NEXT: mov.b v1[4], w11		; CHECK-NEXT: mov.b v0[5], w9
; CHECK-NEXT: ldr w11, [sp, #104]
; CHECK-NEXT: mov.b v0[4], w9
; CHECK-NEXT: ldr w9, [sp, #232]		; CHECK-NEXT: ldr w9, [sp, #232]
		; CHECK-NEXT: mov.b v1[5], w13
		; CHECK-NEXT: ldr w16, [sp, #128]
; CHECK-NEXT: mov.b v3[5], w5		; CHECK-NEXT: mov.b v3[5], w5
; CHECK-NEXT: ldr w15, [sp, #408]		; CHECK-NEXT: ldr w10, [sp, #392]
; CHECK-NEXT: mov.b v2[5], w11		; CHECK-NEXT: mov.b v2[5], w9
; CHECK-NEXT: ldr w11, [sp, #400]		; CHECK-NEXT: ldr w13, [sp, #400]
; CHECK-NEXT: mov.b v1[5], w9		; CHECK-NEXT: mov.b v0[6], w11
; CHECK-NEXT: ldr w9, [sp, #112]		; CHECK-NEXT: ldr w11, [sp, #240]
; CHECK-NEXT: mov.b v0[5], w12		; CHECK-NEXT: mov.b v1[6], w14
; CHECK-NEXT: ldr w12, [sp, #240]		; CHECK-NEXT: ldr w9, [sp, #408]
; CHECK-NEXT: mov.b v3[6], w6		; CHECK-NEXT: mov.b v3[6], w6
; CHECK-NEXT: ldr w16, [sp, #424]		; CHECK-NEXT: ldr w14, [sp, #416]
; CHECK-NEXT: mov.b v2[6], w9		; CHECK-NEXT: mov.b v2[6], w11
; CHECK-NEXT: ldr w9, [sp, #416]		; CHECK-NEXT: ldr w11, [sp, #424]
; CHECK-NEXT: mov.b v1[6], w12		; CHECK-NEXT: mov.b v0[7], w8
; CHECK-NEXT: ldr w12, [sp, #120]		; CHECK-NEXT: ldr w8, [sp, #248]
; CHECK-NEXT: mov.b v0[6], w10		; CHECK-NEXT: mov.b v1[7], w15
; CHECK-NEXT: ldr w10, [sp, #248]		; CHECK-NEXT: ldr w15, [sp, #432]
; CHECK-NEXT: mov.b v3[7], w7		; CHECK-NEXT: mov.b v3[7], w7
; CHECK-NEXT: mov.b v2[7], w12		; CHECK-NEXT: mov.b v2[7], w8
; CHECK-NEXT: ldr w12, [sp]		; CHECK-NEXT: ldr w8, [sp]
; CHECK-NEXT: mov.b v1[7], w10		; CHECK-NEXT: mov.b v0[8], w12
; CHECK-NEXT: ldr w10, [sp, #128]		; CHECK-NEXT: ldr w12, [sp, #256]
; CHECK-NEXT: mov.b v0[7], w13		; CHECK-NEXT: mov.b v1[8], w16
; CHECK-NEXT: ldr w13, [sp, #256]		; CHECK-NEXT: ldr w16, [sp, #440]
; CHECK-NEXT: mov.b v3[8], w12		; CHECK-NEXT: mov.b v3[8], w8
; CHECK-NEXT: ldr w12, [sp, #432]		; CHECK-NEXT: ldr w8, [sp, #136]
; CHECK-NEXT: mov.b v2[8], w10		; CHECK-NEXT: mov.b v2[8], w12
; CHECK-NEXT: ldr w10, [sp, #8]		; CHECK-NEXT: ldr w12, [sp, #8]
; CHECK-NEXT: mov.b v1[8], w13		; CHECK-NEXT: mov.b v0[9], w10
; CHECK-NEXT: ldr w13, [sp, #136]		; CHECK-NEXT: ldr w10, [sp, #264]
; CHECK-NEXT: mov.b v0[8], w8
; CHECK-NEXT: ldr w8, [sp, #264]
; CHECK-NEXT: mov.b v3[9], w10
; CHECK-NEXT: ldr w10, [sp, #440]
; CHECK-NEXT: mov.b v2[9], w13
; CHECK-NEXT: ldr w13, [sp, #16]
; CHECK-NEXT: mov.b v1[9], w8		; CHECK-NEXT: mov.b v1[9], w8
; CHECK-NEXT: ldr w8, [sp, #144]		; CHECK-NEXT: ldr w8, [sp, #272]
; CHECK-NEXT: mov.b v0[9], w14		; CHECK-NEXT: mov.b v3[9], w12
; CHECK-NEXT: ldr w14, [sp, #272]		; CHECK-NEXT: ldr w12, [sp, #144]
; CHECK-NEXT: mov.b v3[10], w13		; CHECK-NEXT: mov.b v2[9], w10
		; CHECK-NEXT: ldr w10, [sp, #16]
		; CHECK-NEXT: mov.b v0[10], w13
; CHECK-NEXT: ldr w13, [sp, #280]		; CHECK-NEXT: ldr w13, [sp, #280]
		; CHECK-NEXT: mov.b v1[10], w12
		; CHECK-NEXT: ldr w12, [sp, #152]
		; CHECK-NEXT: mov.b v3[10], w10
		; CHECK-NEXT: ldr w10, [sp, #160]
; CHECK-NEXT: mov.b v2[10], w8		; CHECK-NEXT: mov.b v2[10], w8
; CHECK-NEXT: ldr w8, [sp, #24]		; CHECK-NEXT: ldr w8, [sp, #24]
; CHECK-NEXT: mov.b v1[10], w14		; CHECK-NEXT: mov.b v0[11], w9
; CHECK-NEXT: ldr w14, [sp, #152]		; CHECK-NEXT: ldr w9, [sp, #288]
; CHECK-NEXT: mov.b v0[10], w11		; CHECK-NEXT: mov.b v1[11], w12
; CHECK-NEXT: ldr w11, [sp, #288]		; CHECK-NEXT: ldr w12, [sp, #296]
; CHECK-NEXT: mov.b v3[11], w8		; CHECK-NEXT: mov.b v3[11], w8
; CHECK-NEXT: ldr w8, [sp, #32]		; CHECK-NEXT: ldr w8, [sp, #32]
; CHECK-NEXT: mov.b v2[11], w14		; CHECK-NEXT: mov.b v2[11], w13
; CHECK-NEXT: ldr w14, [sp, #296]		; CHECK-NEXT: mov.b v0[12], w14
; CHECK-NEXT: mov.b v1[11], w13		; CHECK-NEXT: mov.b v1[12], w10
; CHECK-NEXT: ldr w13, [sp, #160]		; CHECK-NEXT: ldr w10, [sp, #168]
; CHECK-NEXT: mov.b v0[11], w15
; CHECK-NEXT: mov.b v3[12], w8		; CHECK-NEXT: mov.b v3[12], w8
; CHECK-NEXT: ldr w8, [sp, #40]		; CHECK-NEXT: ldr w8, [sp, #40]
; CHECK-NEXT: mov.b v2[12], w13		; CHECK-NEXT: mov.b v2[12], w9
; CHECK-NEXT: ldr w13, [sp, #312]
; CHECK-NEXT: mov.b v1[12], w11
; CHECK-NEXT: ldr w11, [sp, #168]
; CHECK-NEXT: mov.b v0[12], w9
; CHECK-NEXT: ldr w9, [sp, #304]		; CHECK-NEXT: ldr w9, [sp, #304]
		; CHECK-NEXT: mov.b v0[13], w11
		; CHECK-NEXT: ldr w11, [sp, #312]
		; CHECK-NEXT: mov.b v1[13], w10
		; CHECK-NEXT: ldr w10, [sp, #176]
; CHECK-NEXT: mov.b v3[13], w8		; CHECK-NEXT: mov.b v3[13], w8
; CHECK-NEXT: ldr w8, [sp, #48]		; CHECK-NEXT: ldr w8, [sp, #48]
; CHECK-NEXT: mov.b v2[13], w11		; CHECK-NEXT: mov.b v2[13], w12
; CHECK-NEXT: ldr w11, [sp, #176]		; CHECK-NEXT: mov.b v0[14], w15
; CHECK-NEXT: mov.b v1[13], w14		; CHECK-NEXT: mov.b v1[14], w10
; CHECK-NEXT: mov.b v0[13], w16		; CHECK-NEXT: ldr w10, [sp, #184]
; CHECK-NEXT: mov.b v3[14], w8		; CHECK-NEXT: mov.b v3[14], w8
; CHECK-NEXT: ldr w8, [sp, #56]		; CHECK-NEXT: ldr w8, [sp, #56]
; CHECK-NEXT: mov.b v2[14], w11		; CHECK-NEXT: mov.b v2[14], w9
; CHECK-NEXT: mov.b v1[14], w9		; CHECK-NEXT: mov.b v0[15], w16
; CHECK-NEXT: ldr w9, [sp, #184]		; CHECK-NEXT: mov.b v1[15], w10
; CHECK-NEXT: mov.b v0[14], w12
; CHECK-NEXT: mov.b v3[15], w8		; CHECK-NEXT: mov.b v3[15], w8
; CHECK-NEXT: mov.b v2[15], w9		; CHECK-NEXT: mov.b v2[15], w11
; CHECK-NEXT: mov.b v1[15], w13		; CHECK-NEXT: shl.16b v4, v0, #7
; CHECK-NEXT: mov.b v0[15], w10		; CHECK-NEXT: shl.16b v1, v1, #7
; CHECK-NEXT: shl.16b v3, v3, #7		; CHECK-NEXT: shl.16b v3, v3, #7
; CHECK-NEXT: shl.16b v2, v2, #7		; CHECK-NEXT: shl.16b v2, v2, #7
; CHECK-NEXT: shl.16b v4, v1, #7
; CHECK-NEXT: shl.16b v5, v0, #7
; CHECK-NEXT: cmlt.16b v0, v3, #0		; CHECK-NEXT: cmlt.16b v0, v3, #0
; CHECK-NEXT: cmlt.16b v1, v2, #0		; CHECK-NEXT: cmlt.16b v1, v1, #0
; CHECK-NEXT: cmlt.16b v2, v4, #0		; CHECK-NEXT: cmlt.16b v2, v2, #0
; CHECK-NEXT: cmlt.16b v3, v5, #0		; CHECK-NEXT: cmlt.16b v3, v4, #0
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%res = sext <64 x i1> %arg to <64 x i8>		%res = sext <64 x i1> %arg to <64 x i8>
ret <64 x i8> %res		ret <64 x i8> %res
}		}

define <1 x i128> @sext_v1x64(<1 x i64> %arg) {		define <1 x i128> @sext_v1x64(<1 x i64> %arg) {
; X0 & X1 are the real return registers, SDAG messes with v0 too for unknown reasons.		; X0 & X1 are the real return registers, SDAG messes with v0 too for unknown reasons.
; CHECKDAG-LABEL: sext_v1x64:		; CHECKDAG-LABEL: sext_v1x64:
Show All 17 Lines

llvm/test/CodeGen/AArch64/arm64-vhadd.ll

Show First 20 Lines • Show All 781 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%add = add <4 x i64> %zextsrc1, %zextsrc2		%add = add <4 x i64> %zextsrc1, %zextsrc2
%resulti32 = ashr <4 x i64> %add, <i64 1, i64 1, i64 1, i64 1>		%resulti32 = ashr <4 x i64> %add, <i64 1, i64 1, i64 1, i64 1>
ret <4 x i64> %resulti32		ret <4 x i64> %resulti32
}		}

define <4 x i64> @hadd32_sext_lsr(<4 x i32> %src1, <4 x i32> %src2) nounwind {		define <4 x i64> @hadd32_sext_lsr(<4 x i32> %src1, <4 x i32> %src2) nounwind {
; CHECK-LABEL: hadd32_sext_lsr:		; CHECK-LABEL: hadd32_sext_lsr:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: saddl2.2d v2, v0, v1		; CHECK-NEXT: saddl.2d v2, v0, v1
; CHECK-NEXT: saddl.2d v0, v0, v1		; CHECK-NEXT: saddl2.2d v0, v0, v1
; CHECK-NEXT: ushr.2d v1, v2, #1		; CHECK-NEXT: ushr.2d v1, v0, #1
; CHECK-NEXT: ushr.2d v0, v0, #1		; CHECK-NEXT: ushr.2d v0, v2, #1
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%zextsrc1 = sext <4 x i32> %src1 to <4 x i64>		%zextsrc1 = sext <4 x i32> %src1 to <4 x i64>
%zextsrc2 = sext <4 x i32> %src2 to <4 x i64>		%zextsrc2 = sext <4 x i32> %src2 to <4 x i64>
%add = add <4 x i64> %zextsrc1, %zextsrc2		%add = add <4 x i64> %zextsrc1, %zextsrc2
%resulti32 = lshr <4 x i64> %add, <i64 1, i64 1, i64 1, i64 1>		%resulti32 = lshr <4 x i64> %add, <i64 1, i64 1, i64 1, i64 1>
ret <4 x i64> %resulti32		ret <4 x i64> %resulti32
}		}

▲ Show 20 Lines • Show All 420 Lines • Show Last 20 Lines

llvm/test/CodeGen/AArch64/cmp-select-sign.ll

	Show First 20 Lines • Show All 172 Lines • ▼ Show 20 Lines
	; CHECK-LABEL: sign_4xi32_multi_use:			; CHECK-LABEL: sign_4xi32_multi_use:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: sub sp, sp, #32			; CHECK-NEXT: sub sp, sp, #32
	; CHECK-NEXT: str x30, [sp, #16] // 8-byte Folded Spill			; CHECK-NEXT: str x30, [sp, #16] // 8-byte Folded Spill
	; CHECK-NEXT: .cfi_def_cfa_offset 32			; CHECK-NEXT: .cfi_def_cfa_offset 32
	; CHECK-NEXT: .cfi_offset w30, -16			; CHECK-NEXT: .cfi_offset w30, -16
	; CHECK-NEXT: movi v1.2d, #0xffffffffffffffff			; CHECK-NEXT: movi v1.2d, #0xffffffffffffffff
	; CHECK-NEXT: cmlt v2.4s, v0.4s, #0			; CHECK-NEXT: cmlt v2.4s, v0.4s, #0
	; CHECK-NEXT: cmgt v0.4s, v0.4s, v1.4s
	; CHECK-NEXT: orr v2.4s, #1			; CHECK-NEXT: orr v2.4s, #1
	; CHECK-NEXT: xtn v0.4h, v0.4s			; CHECK-NEXT: cmgt v1.4s, v0.4s, v1.4s
	; CHECK-NEXT: str q2, [sp] // 16-byte Folded Spill			; CHECK-NEXT: str q2, [sp] // 16-byte Folded Spill
				; CHECK-NEXT: xtn v0.4h, v1.4s
	; CHECK-NEXT: bl use_4xi1			; CHECK-NEXT: bl use_4xi1
	; CHECK-NEXT: ldr q0, [sp] // 16-byte Folded Reload			; CHECK-NEXT: ldr q0, [sp] // 16-byte Folded Reload
	; CHECK-NEXT: ldr x30, [sp, #16] // 8-byte Folded Reload			; CHECK-NEXT: ldr x30, [sp, #16] // 8-byte Folded Reload
	; CHECK-NEXT: add sp, sp, #32			; CHECK-NEXT: add sp, sp, #32
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%c = icmp sgt <4 x i32> %a, <i32 -1, i32 -1, i32 -1, i32 -1>			%c = icmp sgt <4 x i32> %a, <i32 -1, i32 -1, i32 -1, i32 -1>
	%res = select <4 x i1> %c, <4 x i32> <i32 1, i32 1, i32 1, i32 1>, <4 x i32> <i32 -1, i32 -1, i32 -1, i32 -1>			%res = select <4 x i1> %c, <4 x i32> <i32 1, i32 1, i32 1, i32 1>, <4 x i32> <i32 -1, i32 -1, i32 -1, i32 -1>
	call void @use_4xi1(<4 x i1> %c)			call void @use_4xi1(<4 x i1> %c)
	ret <4 x i32> %res			ret <4 x i32> %res
	}			}

	; Second icmp operand breaks sign pattern.			; Second icmp operand breaks sign pattern.
	define <4 x i32> @not_sign_4xi32(<4 x i32> %a) {			define <4 x i32> @not_sign_4xi32(<4 x i32> %a) {
	; CHECK-LABEL: not_sign_4xi32:			; CHECK-LABEL: not_sign_4xi32:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: adrp x8, .LCPI16_0			; CHECK-NEXT: adrp x8, .LCPI16_0
	; CHECK-NEXT: movi v1.4s, #1			; CHECK-NEXT: movi v2.4s, #1
	; CHECK-NEXT: ldr q2, [x8, :lo12:.LCPI16_0]			; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI16_0]
	; CHECK-NEXT: cmgt v0.4s, v0.4s, v2.4s			; CHECK-NEXT: cmgt v0.4s, v0.4s, v1.4s
	; CHECK-NEXT: and v1.16b, v0.16b, v1.16b			; CHECK-NEXT: and v1.16b, v0.16b, v2.16b
	; CHECK-NEXT: orn v0.16b, v1.16b, v0.16b			; CHECK-NEXT: orn v0.16b, v1.16b, v0.16b
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%c = icmp sgt <4 x i32> %a, <i32 1, i32 -1, i32 -1, i32 -1>			%c = icmp sgt <4 x i32> %a, <i32 1, i32 -1, i32 -1, i32 -1>
	%res = select <4 x i1> %c, <4 x i32> <i32 1, i32 1, i32 1, i32 1>, <4 x i32> <i32 -1, i32 -1, i32 -1, i32 -1>			%res = select <4 x i1> %c, <4 x i32> <i32 1, i32 1, i32 1, i32 1>, <4 x i32> <i32 -1, i32 -1, i32 -1, i32 -1>
	ret <4 x i32> %res			ret <4 x i32> %res
	}			}

	; First select operand breaks sign pattern.			; First select operand breaks sign pattern.
	Show All 11 Lines
	}			}

	; Second select operand breaks sign pattern.			; Second select operand breaks sign pattern.
	define <4 x i32> @not_sign_4xi32_3(<4 x i32> %a) {			define <4 x i32> @not_sign_4xi32_3(<4 x i32> %a) {
	; CHECK-LABEL: not_sign_4xi32_3:			; CHECK-LABEL: not_sign_4xi32_3:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: movi v1.2d, #0xffffffffffffffff			; CHECK-NEXT: movi v1.2d, #0xffffffffffffffff
	; CHECK-NEXT: adrp x8, .LCPI18_0			; CHECK-NEXT: adrp x8, .LCPI18_0
	; CHECK-NEXT: ldr q2, [x8, :lo12:.LCPI18_0]			; CHECK-NEXT: movi v2.4s, #1
				; CHECK-NEXT: ldr q3, [x8, :lo12:.LCPI18_0]
	; CHECK-NEXT: cmgt v0.4s, v0.4s, v1.4s			; CHECK-NEXT: cmgt v0.4s, v0.4s, v1.4s
	; CHECK-NEXT: movi v1.4s, #1			; CHECK-NEXT: bsl v0.16b, v2.16b, v3.16b
	; CHECK-NEXT: bsl v0.16b, v1.16b, v2.16b
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%c = icmp sgt <4 x i32> %a, <i32 -1, i32 -1, i32 -1, i32 -1>			%c = icmp sgt <4 x i32> %a, <i32 -1, i32 -1, i32 -1, i32 -1>
	%res = select <4 x i1> %c, <4 x i32> <i32 1, i32 1, i32 1, i32 1>, <4 x i32> <i32 -1, i32 -1, i32 -1, i32 1>			%res = select <4 x i1> %c, <4 x i32> <i32 1, i32 1, i32 1, i32 1>, <4 x i32> <i32 -1, i32 -1, i32 -1, i32 1>
	ret <4 x i32> %res			ret <4 x i32> %res
	}			}

	; i65 is not legal.			; i65 is not legal.
	define <4 x i65> @sign_4xi65(<4 x i65> %a) {			define <4 x i65> @sign_4xi65(<4 x i65> %a) {
	Show All 24 Lines

llvm/test/CodeGen/AArch64/dag-numsignbits.ll

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: llc < %s -mtriple=aarch64-unknown \| FileCheck %s			; RUN: llc < %s -mtriple=aarch64-unknown \| FileCheck %s

	; PR32273			; PR32273

	define void @signbits_vXi1(<4 x i16> %a1) {			define void @signbits_vXi1(<4 x i16> %a1) {
	; CHECK-LABEL: signbits_vXi1:			; CHECK-LABEL: signbits_vXi1:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: adrp x8, .LCPI0_0			; CHECK-NEXT: adrp x8, .LCPI0_0
	; CHECK-NEXT: // kill: def $d0 killed $d0 def $q0			; CHECK-NEXT: // kill: def $d0 killed $d0 def $q0
	; CHECK-NEXT: mov w1, wzr			; CHECK-NEXT: movi v2.4h, #1
	; CHECK-NEXT: dup v0.4h, v0.h[0]			; CHECK-NEXT: dup v0.4h, v0.h[0]
				; CHECK-NEXT: mov w1, wzr
	; CHECK-NEXT: mov w2, wzr			; CHECK-NEXT: mov w2, wzr
	; CHECK-NEXT: ldr d1, [x8, :lo12:.LCPI0_0]			; CHECK-NEXT: ldr d1, [x8, :lo12:.LCPI0_0]
	; CHECK-NEXT: adrp x8, .LCPI0_1			; CHECK-NEXT: adrp x8, .LCPI0_1
	; CHECK-NEXT: add v0.4h, v0.4h, v1.4h			; CHECK-NEXT: add v0.4h, v0.4h, v1.4h
	; CHECK-NEXT: movi v1.4h, #1
	; CHECK-NEXT: cmgt v0.4h, v1.4h, v0.4h
	; CHECK-NEXT: ldr d1, [x8, :lo12:.LCPI0_1]			; CHECK-NEXT: ldr d1, [x8, :lo12:.LCPI0_1]
				; CHECK-NEXT: cmgt v0.4h, v2.4h, v0.4h
	; CHECK-NEXT: and v0.8b, v0.8b, v1.8b			; CHECK-NEXT: and v0.8b, v0.8b, v1.8b
	; CHECK-NEXT: shl v0.4h, v0.4h, #15			; CHECK-NEXT: shl v0.4h, v0.4h, #15
	; CHECK-NEXT: cmlt v0.4h, v0.4h, #0			; CHECK-NEXT: cmlt v0.4h, v0.4h, #0
	; CHECK-NEXT: umov w0, v0.h[0]			; CHECK-NEXT: umov w0, v0.h[0]
	; CHECK-NEXT: umov w3, v0.h[3]			; CHECK-NEXT: umov w3, v0.h[3]
	; CHECK-NEXT: b foo			; CHECK-NEXT: b foo
	%tmp3 = shufflevector <4 x i16> %a1, <4 x i16> undef, <4 x i32> zeroinitializer			%tmp3 = shufflevector <4 x i16> %a1, <4 x i16> undef, <4 x i32> zeroinitializer
	%tmp5 = add <4 x i16> %tmp3, <i16 18249, i16 6701, i16 -18744, i16 -25086>			%tmp5 = add <4 x i16> %tmp3, <i16 18249, i16 6701, i16 -18744, i16 -25086>
	Show All 16 Lines

llvm/test/CodeGen/AArch64/div-rem-pair-recomposition-signed.ll

	Show First 20 Lines • Show All 222 Lines • ▼ Show 20 Lines
	; ALL: // %bb.0:			; ALL: // %bb.0:
	; ALL-NEXT: fmov x8, d1			; ALL-NEXT: fmov x8, d1
	; ALL-NEXT: fmov x9, d0			; ALL-NEXT: fmov x9, d0
	; ALL-NEXT: mov x10, v1.d[1]			; ALL-NEXT: mov x10, v1.d[1]
	; ALL-NEXT: mov x11, v0.d[1]			; ALL-NEXT: mov x11, v0.d[1]
	; ALL-NEXT: sdiv x9, x9, x8			; ALL-NEXT: sdiv x9, x9, x8
	; ALL-NEXT: mul x8, x9, x8			; ALL-NEXT: mul x8, x9, x8
	; ALL-NEXT: sdiv x11, x11, x10			; ALL-NEXT: sdiv x11, x11, x10
				; ALL-NEXT: fmov d2, x9
	; ALL-NEXT: fmov d1, x8			; ALL-NEXT: fmov d1, x8
	; ALL-NEXT: mul x10, x11, x10			; ALL-NEXT: mul x10, x11, x10
				; ALL-NEXT: mov v2.d[1], x11
	; ALL-NEXT: mov v1.d[1], x10			; ALL-NEXT: mov v1.d[1], x10
				; ALL-NEXT: str q2, [x0]
	; ALL-NEXT: sub v0.2d, v0.2d, v1.2d			; ALL-NEXT: sub v0.2d, v0.2d, v1.2d
	; ALL-NEXT: fmov d1, x9
	; ALL-NEXT: mov v1.d[1], x11
	; ALL-NEXT: str q1, [x0]
	; ALL-NEXT: ret			; ALL-NEXT: ret
	%div = sdiv <2 x i64> %x, %y			%div = sdiv <2 x i64> %x, %y
	store <2 x i64> %div, <2 x i64>* %divdst, align 16			store <2 x i64> %div, <2 x i64>* %divdst, align 16
	%t1 = mul <2 x i64> %div, %y			%t1 = mul <2 x i64> %div, %y
	%t2 = sub <2 x i64> %x, %t1			%t2 = sub <2 x i64> %x, %t1
	ret <2 x i64> %t2			ret <2 x i64> %t2
	}			}

	▲ Show 20 Lines • Show All 74 Lines • Show Last 20 Lines

llvm/test/CodeGen/AArch64/div-rem-pair-recomposition-unsigned.ll

	Show First 20 Lines • Show All 222 Lines • ▼ Show 20 Lines
	; ALL: // %bb.0:			; ALL: // %bb.0:
	; ALL-NEXT: fmov x8, d1			; ALL-NEXT: fmov x8, d1
	; ALL-NEXT: fmov x9, d0			; ALL-NEXT: fmov x9, d0
	; ALL-NEXT: mov x10, v1.d[1]			; ALL-NEXT: mov x10, v1.d[1]
	; ALL-NEXT: mov x11, v0.d[1]			; ALL-NEXT: mov x11, v0.d[1]
	; ALL-NEXT: udiv x9, x9, x8			; ALL-NEXT: udiv x9, x9, x8
	; ALL-NEXT: mul x8, x9, x8			; ALL-NEXT: mul x8, x9, x8
	; ALL-NEXT: udiv x11, x11, x10			; ALL-NEXT: udiv x11, x11, x10
				; ALL-NEXT: fmov d2, x9
	; ALL-NEXT: fmov d1, x8			; ALL-NEXT: fmov d1, x8
	; ALL-NEXT: mul x10, x11, x10			; ALL-NEXT: mul x10, x11, x10
				; ALL-NEXT: mov v2.d[1], x11
	; ALL-NEXT: mov v1.d[1], x10			; ALL-NEXT: mov v1.d[1], x10
				; ALL-NEXT: str q2, [x0]
	; ALL-NEXT: sub v0.2d, v0.2d, v1.2d			; ALL-NEXT: sub v0.2d, v0.2d, v1.2d
	; ALL-NEXT: fmov d1, x9
	; ALL-NEXT: mov v1.d[1], x11
	; ALL-NEXT: str q1, [x0]
	; ALL-NEXT: ret			; ALL-NEXT: ret
	%div = udiv <2 x i64> %x, %y			%div = udiv <2 x i64> %x, %y
	store <2 x i64> %div, <2 x i64>* %divdst, align 16			store <2 x i64> %div, <2 x i64>* %divdst, align 16
	%t1 = mul <2 x i64> %div, %y			%t1 = mul <2 x i64> %div, %y
	%t2 = sub <2 x i64> %x, %t1			%t2 = sub <2 x i64> %x, %t1
	ret <2 x i64> %t2			ret <2 x i64> %t2
	}			}

	▲ Show 20 Lines • Show All 74 Lines • Show Last 20 Lines

llvm/test/CodeGen/AArch64/expand-vector-rot.ll

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: llc < %s -mtriple=aarch64-linux-android \| FileCheck %s			; RUN: llc < %s -mtriple=aarch64-linux-android \| FileCheck %s

	declare <2 x i16> @llvm.fshl.v2i16(<2 x i16>, <2 x i16>, <2 x i16>)			declare <2 x i16> @llvm.fshl.v2i16(<2 x i16>, <2 x i16>, <2 x i16>)

	define <2 x i16> @rotlv2_16(<2 x i16> %vec2_16, <2 x i16> %shift) {			define <2 x i16> @rotlv2_16(<2 x i16> %vec2_16, <2 x i16> %shift) {
	; CHECK-LABEL: rotlv2_16:			; CHECK-LABEL: rotlv2_16:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: movi v2.2s, #15			; CHECK-NEXT: movi v2.2s, #15
	; CHECK-NEXT: neg v3.2s, v1.2s			; CHECK-NEXT: movi d3, #0x00ffff0000ffff
	; CHECK-NEXT: movi d4, #0x00ffff0000ffff			; CHECK-NEXT: neg v4.2s, v1.2s
	; CHECK-NEXT: and v3.8b, v3.8b, v2.8b			; CHECK-NEXT: and v4.8b, v4.8b, v2.8b
				; CHECK-NEXT: and v3.8b, v0.8b, v3.8b
				; CHECK-NEXT: neg v4.2s, v4.2s
	; CHECK-NEXT: and v1.8b, v1.8b, v2.8b			; CHECK-NEXT: and v1.8b, v1.8b, v2.8b
	; CHECK-NEXT: and v4.8b, v0.8b, v4.8b
	; CHECK-NEXT: neg v3.2s, v3.2s
	; CHECK-NEXT: ushl v0.2s, v0.2s, v1.2s			; CHECK-NEXT: ushl v0.2s, v0.2s, v1.2s
	; CHECK-NEXT: ushl v2.2s, v4.2s, v3.2s			; CHECK-NEXT: ushl v2.2s, v3.2s, v4.2s
	; CHECK-NEXT: orr v0.8b, v0.8b, v2.8b			; CHECK-NEXT: orr v0.8b, v0.8b, v2.8b
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%1 = call <2 x i16> @llvm.fshl.v2i16(<2 x i16> %vec2_16, <2 x i16> %vec2_16, <2 x i16> %shift)			%1 = call <2 x i16> @llvm.fshl.v2i16(<2 x i16> %vec2_16, <2 x i16> %vec2_16, <2 x i16> %shift)
	ret <2 x i16> %1			ret <2 x i16> %1
	}			}

llvm/test/CodeGen/AArch64/f16-instructions.ll

	Show First 20 Lines • Show All 1,095 Lines • ▼ Show 20 Lines
	; CHECK-FP16-NEXT: ret			; CHECK-FP16-NEXT: ret

	define half @test_maxnum(half %a, half %b) #0 {			define half @test_maxnum(half %a, half %b) #0 {
	%r = call half @llvm.maxnum.f16(half %a, half %b)			%r = call half @llvm.maxnum.f16(half %a, half %b)
	ret half %r			ret half %r
	}			}

	; CHECK-CVT-LABEL: test_copysign:			; CHECK-CVT-LABEL: test_copysign:
	; CHECK-CVT-NEXT: mvni.4s v2, #128, lsl #24
	; CHECK-CVT-NEXT: fcvt s1, h1			; CHECK-CVT-NEXT: fcvt s1, h1
	; CHECK-CVT-NEXT: fcvt s0, h0			; CHECK-CVT-NEXT: fcvt s0, h0
				; CHECK-CVT-NEXT: mvni.4s v2, #128, lsl #24
	; CHECK-CVT-NEXT: bif.16b v0, v1, v2			; CHECK-CVT-NEXT: bif.16b v0, v1, v2
	; CHECK-CVT-NEXT: fcvt h0, s0			; CHECK-CVT-NEXT: fcvt h0, s0
	; CHECK-CVT-NEXT: ret			; CHECK-CVT-NEXT: ret

	; CHECK-FP16-LABEL: test_copysign:			; CHECK-FP16-LABEL: test_copysign:
	; CHECK-FP16-NEXT: mvni.8h v2, #128, lsl #8			; CHECK-FP16-NEXT: mvni.8h v2, #128, lsl #8
	; CHECK-FP16-NEXT: bif.16b v0, v1, v2			; CHECK-FP16-NEXT: bif.16b v0, v1, v2
	; CHECK-FP16-NEXT: ret			; CHECK-FP16-NEXT: ret

	define half @test_copysign(half %a, half %b) #0 {			define half @test_copysign(half %a, half %b) #0 {
	%r = call half @llvm.copysign.f16(half %a, half %b)			%r = call half @llvm.copysign.f16(half %a, half %b)
	ret half %r			ret half %r
	}			}

	; CHECK-CVT-LABEL: test_copysign_f32:			; CHECK-CVT-LABEL: test_copysign_f32:
	; CHECK-CVT-NEXT: mvni.4s v2, #128, lsl #24
	; CHECK-CVT-NEXT: fcvt s0, h0			; CHECK-CVT-NEXT: fcvt s0, h0
				; CHECK-CVT-NEXT: mvni.4s v2, #128, lsl #24
	; CHECK-CVT-NEXT: bif.16b v0, v1, v2			; CHECK-CVT-NEXT: bif.16b v0, v1, v2
	; CHECK-CVT-NEXT: fcvt h0, s0			; CHECK-CVT-NEXT: fcvt h0, s0
	; CHECK-CVT-NEXT: ret			; CHECK-CVT-NEXT: ret

	; CHECK-FP16-LABEL: test_copysign_f32:			; CHECK-FP16-LABEL: test_copysign_f32:
	; CHECK-FP16-NEXT: mvni.8h v2, #128, lsl #8
	; CHECK-FP16-NEXT: fcvt h1, s1			; CHECK-FP16-NEXT: fcvt h1, s1
				; CHECK-FP16-NEXT: mvni.8h v2, #128, lsl #8
	; CHECK-FP16-NEXT: bif.16b v0, v1, v2			; CHECK-FP16-NEXT: bif.16b v0, v1, v2
	; CHECK-FP16-NEXT: ret			; CHECK-FP16-NEXT: ret

	define half @test_copysign_f32(half %a, float %b) #0 {			define half @test_copysign_f32(half %a, float %b) #0 {
	%tb = fptrunc float %b to half			%tb = fptrunc float %b to half
	%r = call half @llvm.copysign.f16(half %a, half %tb)			%r = call half @llvm.copysign.f16(half %a, half %tb)
	ret half %r			ret half %r
	}			}

	; CHECK-CVT-LABEL: test_copysign_f64:			; CHECK-CVT-LABEL: test_copysign_f64:
	; CHECK-CVT-NEXT: mvni.4s v2, #128, lsl #24
	; CHECK-CVT-NEXT: fcvt s1, d1			; CHECK-CVT-NEXT: fcvt s1, d1
	; CHECK-CVT-NEXT: fcvt s0, h0			; CHECK-CVT-NEXT: fcvt s0, h0
				; CHECK-CVT-NEXT: mvni.4s v2, #128, lsl #24
	; CHECK-CVT-NEXT: bif.16b v0, v1, v2			; CHECK-CVT-NEXT: bif.16b v0, v1, v2
	; CHECK-CVT-NEXT: fcvt h0, s0			; CHECK-CVT-NEXT: fcvt h0, s0
	; CHECK-CVT-NEXT: ret			; CHECK-CVT-NEXT: ret

	; CHECK-FP16-LABEL: test_copysign_f64:			; CHECK-FP16-LABEL: test_copysign_f64:
	; CHECK-FP16-NEXT: mvni.8h v2, #128, lsl #8
	; CHECK-FP16-NEXT: fcvt h1, d1			; CHECK-FP16-NEXT: fcvt h1, d1
				; CHECK-FP16-NEXT: mvni.8h v2, #128, lsl #8
	; CHECK-FP16-NEXT: bif.16b v0, v1, v2			; CHECK-FP16-NEXT: bif.16b v0, v1, v2
	; CHECK-FP16-NEXT: ret			; CHECK-FP16-NEXT: ret

	define half @test_copysign_f64(half %a, double %b) #0 {			define half @test_copysign_f64(half %a, double %b) #0 {
	%tb = fptrunc double %b to half			%tb = fptrunc double %b to half
	%r = call half @llvm.copysign.f16(half %a, half %tb)			%r = call half @llvm.copysign.f16(half %a, half %tb)
	ret half %r			ret half %r
	}			}

	; Check that the FP promotion will use a truncating FP_ROUND, so we can fold			; Check that the FP promotion will use a truncating FP_ROUND, so we can fold
	; away the (fpext (fp_round <result>)) here.			; away the (fpext (fp_round <result>)) here.

	; CHECK-CVT-LABEL: test_copysign_extended:			; CHECK-CVT-LABEL: test_copysign_extended:
	; CHECK-CVT-NEXT: mvni.4s v2, #128, lsl #24
	; CHECK-CVT-NEXT: fcvt s1, h1			; CHECK-CVT-NEXT: fcvt s1, h1
	; CHECK-CVT-NEXT: fcvt s0, h0			; CHECK-CVT-NEXT: fcvt s0, h0
				; CHECK-CVT-NEXT: mvni.4s v2, #128, lsl #24
	; CHECK-CVT-NEXT: bif.16b v0, v1, v2			; CHECK-CVT-NEXT: bif.16b v0, v1, v2
	; CHECK-CVT-NEXT: ret			; CHECK-CVT-NEXT: ret

	; CHECK-FP16-LABEL: test_copysign_extended:			; CHECK-FP16-LABEL: test_copysign_extended:
	; CHECK-FP16-NEXT: mvni.8h v2, #128, lsl #8			; CHECK-FP16-NEXT: mvni.8h v2, #128, lsl #8
	; CHECK-FP16-NEXT: bif.16b v0, v1, v2			; CHECK-FP16-NEXT: bif.16b v0, v1, v2
	; CHECK-FP16-NEXT: fcvt s0, h0			; CHECK-FP16-NEXT: fcvt s0, h0
	; CHECK-FP16-NEXT: ret			; CHECK-FP16-NEXT: ret
	▲ Show 20 Lines • Show All 207 Lines • Show Last 20 Lines

llvm/test/CodeGen/AArch64/fcopysign.ll

Show First 20 Lines • Show All 89 Lines • ▼ Show 20 Lines	entry:
%conv = fpext float %v1 to fp128		%conv = fpext float %v1 to fp128
%call = tail call fp128 @llvm.copysign.f128(fp128 %v0, fp128 %conv)		%call = tail call fp128 @llvm.copysign.f128(fp128 %v0, fp128 %conv)
ret fp128 %call		ret fp128 %call
}		}

define float @copysign32(float %a, float %b) {		define float @copysign32(float %a, float %b) {
; CHECK-LABEL: copysign32:		; CHECK-LABEL: copysign32:
; CHECK: // %bb.0: // %entry		; CHECK: // %bb.0: // %entry
; CHECK-NEXT: mvni v2.4s, #128, lsl #24
; CHECK-NEXT: // kill: def $s0 killed $s0 def $q0		; CHECK-NEXT: // kill: def $s0 killed $s0 def $q0
		; CHECK-NEXT: mvni v2.4s, #128, lsl #24
; CHECK-NEXT: // kill: def $s1 killed $s1 def $q1		; CHECK-NEXT: // kill: def $s1 killed $s1 def $q1
; CHECK-NEXT: bif v0.16b, v1.16b, v2.16b		; CHECK-NEXT: bif v0.16b, v1.16b, v2.16b
; CHECK-NEXT: // kill: def $s0 killed $s0 killed $q0		; CHECK-NEXT: // kill: def $s0 killed $s0 killed $q0
; CHECK-NEXT: ret		; CHECK-NEXT: ret
;		;
; CHECK-NONEON-LABEL: copysign32:		; CHECK-NONEON-LABEL: copysign32:
; CHECK-NONEON: // %bb.0: // %entry		; CHECK-NONEON: // %bb.0: // %entry
; CHECK-NONEON-NEXT: fabs s0, s0		; CHECK-NONEON-NEXT: fabs s0, s0
Show All 29 Lines
entry:		entry:
%c = call double @llvm.copysign.f64(double %a, double %b)		%c = call double @llvm.copysign.f64(double %a, double %b)
ret double %c		ret double %c
}		}

define half @copysign16(half %a, half %b) {		define half @copysign16(half %a, half %b) {
; CHECK-LABEL: copysign16:		; CHECK-LABEL: copysign16:
; CHECK: // %bb.0: // %entry		; CHECK: // %bb.0: // %entry
; CHECK-NEXT: mvni v2.4s, #128, lsl #24
; CHECK-NEXT: fcvt s1, h1		; CHECK-NEXT: fcvt s1, h1
; CHECK-NEXT: fcvt s0, h0		; CHECK-NEXT: fcvt s0, h0
		; CHECK-NEXT: mvni v2.4s, #128, lsl #24
; CHECK-NEXT: bif v0.16b, v1.16b, v2.16b		; CHECK-NEXT: bif v0.16b, v1.16b, v2.16b
; CHECK-NEXT: fcvt h0, s0		; CHECK-NEXT: fcvt h0, s0
; CHECK-NEXT: ret		; CHECK-NEXT: ret
;		;
; CHECK-NONEON-LABEL: copysign16:		; CHECK-NONEON-LABEL: copysign16:
; CHECK-NONEON: // %bb.0: // %entry		; CHECK-NONEON: // %bb.0: // %entry
; CHECK-NONEON-NEXT: sub sp, sp, #16		; CHECK-NONEON-NEXT: sub sp, sp, #16
; CHECK-NONEON-NEXT: .cfi_def_cfa_offset 16		; CHECK-NONEON-NEXT: .cfi_def_cfa_offset 16
Show All 14 Lines

llvm/test/CodeGen/AArch64/fptosi-sat-vector.ll

	Show First 20 Lines • Show All 289 Lines • ▼ Show 20 Lines
	; CHECK-NEXT: stp x22, x21, [sp, #80] // 16-byte Folded Spill			; CHECK-NEXT: stp x22, x21, [sp, #80] // 16-byte Folded Spill
	; CHECK-NEXT: stp x20, x19, [sp, #96] // 16-byte Folded Spill			; CHECK-NEXT: stp x20, x19, [sp, #96] // 16-byte Folded Spill
	; CHECK-NEXT: .cfi_def_cfa_offset 112			; CHECK-NEXT: .cfi_def_cfa_offset 112
	; CHECK-NEXT: .cfi_offset w19, -8			; CHECK-NEXT: .cfi_offset w19, -8
	; CHECK-NEXT: .cfi_offset w20, -16			; CHECK-NEXT: .cfi_offset w20, -16
	; CHECK-NEXT: .cfi_offset w21, -24			; CHECK-NEXT: .cfi_offset w21, -24
	; CHECK-NEXT: .cfi_offset w22, -32			; CHECK-NEXT: .cfi_offset w22, -32
	; CHECK-NEXT: .cfi_offset w30, -48			; CHECK-NEXT: .cfi_offset w30, -48
	; CHECK-NEXT: mov v2.16b, v1.16b
	; CHECK-NEXT: adrp x8, .LCPI15_0			; CHECK-NEXT: adrp x8, .LCPI15_0
	; CHECK-NEXT: stp q1, q0, [sp, #32] // 32-byte Folded Spill			; CHECK-NEXT: stp q1, q0, [sp, #32] // 32-byte Folded Spill
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI15_0]			; CHECK-NEXT: mov v2.16b, v1.16b
	; CHECK-NEXT: mov v0.16b, v2.16b			; CHECK-NEXT: mov v0.16b, v2.16b
				; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI15_0]
	; CHECK-NEXT: str q1, [sp, #16] // 16-byte Folded Spill			; CHECK-NEXT: str q1, [sp, #16] // 16-byte Folded Spill
	; CHECK-NEXT: bl __getf2			; CHECK-NEXT: bl __getf2
	; CHECK-NEXT: ldr q0, [sp, #32] // 16-byte Folded Reload			; CHECK-NEXT: ldr q0, [sp, #32] // 16-byte Folded Reload
	; CHECK-NEXT: mov w19, w0			; CHECK-NEXT: mov w19, w0
	; CHECK-NEXT: bl __fixtfsi			; CHECK-NEXT: bl __fixtfsi
	; CHECK-NEXT: adrp x8, .LCPI15_1			; CHECK-NEXT: adrp x8, .LCPI15_1
	; CHECK-NEXT: ldr q0, [sp, #32] // 16-byte Folded Reload			; CHECK-NEXT: ldr q0, [sp, #32] // 16-byte Folded Reload
	; CHECK-NEXT: cmp w19, #0			; CHECK-NEXT: cmp w19, #0
	▲ Show 20 Lines • Show All 48 Lines • ▼ Show 20 Lines
	; CHECK-NEXT: stp x22, x21, [sp, #96] // 16-byte Folded Spill			; CHECK-NEXT: stp x22, x21, [sp, #96] // 16-byte Folded Spill
	; CHECK-NEXT: stp x20, x19, [sp, #112] // 16-byte Folded Spill			; CHECK-NEXT: stp x20, x19, [sp, #112] // 16-byte Folded Spill
	; CHECK-NEXT: .cfi_def_cfa_offset 128			; CHECK-NEXT: .cfi_def_cfa_offset 128
	; CHECK-NEXT: .cfi_offset w19, -8			; CHECK-NEXT: .cfi_offset w19, -8
	; CHECK-NEXT: .cfi_offset w20, -16			; CHECK-NEXT: .cfi_offset w20, -16
	; CHECK-NEXT: .cfi_offset w21, -24			; CHECK-NEXT: .cfi_offset w21, -24
	; CHECK-NEXT: .cfi_offset w22, -32			; CHECK-NEXT: .cfi_offset w22, -32
	; CHECK-NEXT: .cfi_offset w30, -48			; CHECK-NEXT: .cfi_offset w30, -48
	; CHECK-NEXT: stp q0, q2, [sp, #48] // 32-byte Folded Spill
	; CHECK-NEXT: adrp x8, .LCPI16_0			; CHECK-NEXT: adrp x8, .LCPI16_0
				; CHECK-NEXT: stp q0, q2, [sp, #48] // 32-byte Folded Spill
	; CHECK-NEXT: mov v2.16b, v1.16b			; CHECK-NEXT: mov v2.16b, v1.16b
	; CHECK-NEXT: str q1, [sp, #32] // 16-byte Folded Spill			; CHECK-NEXT: str q1, [sp, #32] // 16-byte Folded Spill
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI16_0]
	; CHECK-NEXT: mov v0.16b, v2.16b			; CHECK-NEXT: mov v0.16b, v2.16b
				; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI16_0]
	; CHECK-NEXT: str q1, [sp, #16] // 16-byte Folded Spill			; CHECK-NEXT: str q1, [sp, #16] // 16-byte Folded Spill
	; CHECK-NEXT: bl __getf2			; CHECK-NEXT: bl __getf2
	; CHECK-NEXT: ldr q0, [sp, #32] // 16-byte Folded Reload			; CHECK-NEXT: ldr q0, [sp, #32] // 16-byte Folded Reload
	; CHECK-NEXT: mov w19, w0			; CHECK-NEXT: mov w19, w0
	; CHECK-NEXT: bl __fixtfsi			; CHECK-NEXT: bl __fixtfsi
	; CHECK-NEXT: adrp x8, .LCPI16_1			; CHECK-NEXT: adrp x8, .LCPI16_1
	; CHECK-NEXT: ldr q0, [sp, #32] // 16-byte Folded Reload			; CHECK-NEXT: ldr q0, [sp, #32] // 16-byte Folded Reload
	; CHECK-NEXT: cmp w19, #0			; CHECK-NEXT: cmp w19, #0
	▲ Show 20 Lines • Show All 68 Lines • ▼ Show 20 Lines
	; CHECK-NEXT: stp x22, x21, [sp, #112] // 16-byte Folded Spill			; CHECK-NEXT: stp x22, x21, [sp, #112] // 16-byte Folded Spill
	; CHECK-NEXT: stp x20, x19, [sp, #128] // 16-byte Folded Spill			; CHECK-NEXT: stp x20, x19, [sp, #128] // 16-byte Folded Spill
	; CHECK-NEXT: .cfi_def_cfa_offset 144			; CHECK-NEXT: .cfi_def_cfa_offset 144
	; CHECK-NEXT: .cfi_offset w19, -8			; CHECK-NEXT: .cfi_offset w19, -8
	; CHECK-NEXT: .cfi_offset w20, -16			; CHECK-NEXT: .cfi_offset w20, -16
	; CHECK-NEXT: .cfi_offset w21, -24			; CHECK-NEXT: .cfi_offset w21, -24
	; CHECK-NEXT: .cfi_offset w22, -32			; CHECK-NEXT: .cfi_offset w22, -32
	; CHECK-NEXT: .cfi_offset w30, -48			; CHECK-NEXT: .cfi_offset w30, -48
	; CHECK-NEXT: stp q2, q3, [sp, #64] // 32-byte Folded Spill
	; CHECK-NEXT: adrp x8, .LCPI17_0			; CHECK-NEXT: adrp x8, .LCPI17_0
				; CHECK-NEXT: stp q2, q3, [sp, #64] // 32-byte Folded Spill
	; CHECK-NEXT: mov v2.16b, v1.16b			; CHECK-NEXT: mov v2.16b, v1.16b
	; CHECK-NEXT: str q0, [sp, #48] // 16-byte Folded Spill
	; CHECK-NEXT: str q1, [sp] // 16-byte Folded Spill			; CHECK-NEXT: str q1, [sp] // 16-byte Folded Spill
				; CHECK-NEXT: str q0, [sp, #48] // 16-byte Folded Spill
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI17_0]			; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI17_0]
	; CHECK-NEXT: mov v0.16b, v2.16b			; CHECK-NEXT: mov v0.16b, v2.16b
	; CHECK-NEXT: str q1, [sp, #32] // 16-byte Folded Spill			; CHECK-NEXT: str q1, [sp, #32] // 16-byte Folded Spill
	; CHECK-NEXT: bl __getf2			; CHECK-NEXT: bl __getf2
	; CHECK-NEXT: ldr q0, [sp] // 16-byte Folded Reload			; CHECK-NEXT: ldr q0, [sp] // 16-byte Folded Reload
	; CHECK-NEXT: mov w19, w0			; CHECK-NEXT: mov w19, w0
	; CHECK-NEXT: bl __fixtfsi			; CHECK-NEXT: bl __fixtfsi
	; CHECK-NEXT: adrp x8, .LCPI17_1			; CHECK-NEXT: adrp x8, .LCPI17_1
	▲ Show 20 Lines • Show All 222 Lines • ▼ Show 20 Lines
	declare <2 x i100> @llvm.fptosi.sat.v2f32.v2i100(<2 x float>)			declare <2 x i100> @llvm.fptosi.sat.v2f32.v2i100(<2 x float>)
	declare <2 x i128> @llvm.fptosi.sat.v2f32.v2i128(<2 x float>)			declare <2 x i128> @llvm.fptosi.sat.v2f32.v2i128(<2 x float>)

	define <2 x i1> @test_signed_v2f32_v2i1(<2 x float> %f) {			define <2 x i1> @test_signed_v2f32_v2i1(<2 x float> %f) {
	; CHECK-LABEL: test_signed_v2f32_v2i1:			; CHECK-LABEL: test_signed_v2f32_v2i1:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: movi v1.2d, #0000000000000000			; CHECK-NEXT: movi v1.2d, #0000000000000000
	; CHECK-NEXT: fcvtzs v0.2s, v0.2s			; CHECK-NEXT: fcvtzs v0.2s, v0.2s
				; CHECK-NEXT: movi v2.2d, #0xffffffffffffffff
	; CHECK-NEXT: smin v0.2s, v0.2s, v1.2s			; CHECK-NEXT: smin v0.2s, v0.2s, v1.2s
	; CHECK-NEXT: movi v1.2d, #0xffffffffffffffff			; CHECK-NEXT: smax v0.2s, v0.2s, v2.2s
	; CHECK-NEXT: smax v0.2s, v0.2s, v1.2s
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%x = call <2 x i1> @llvm.fptosi.sat.v2f32.v2i1(<2 x float> %f)			%x = call <2 x i1> @llvm.fptosi.sat.v2f32.v2i1(<2 x float> %f)
	ret <2 x i1> %x			ret <2 x i1> %x
	}			}

	define <2 x i8> @test_signed_v2f32_v2i8(<2 x float> %f) {			define <2 x i8> @test_signed_v2f32_v2i8(<2 x float> %f) {
	; CHECK-LABEL: test_signed_v2f32_v2i8:			; CHECK-LABEL: test_signed_v2f32_v2i8:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	▲ Show 20 Lines • Show All 912 Lines • ▼ Show 20 Lines
	; CHECK-CVT-NEXT: smax v0.4s, v0.4s, v1.4s			; CHECK-CVT-NEXT: smax v0.4s, v0.4s, v1.4s
	; CHECK-CVT-NEXT: xtn v0.4h, v0.4s			; CHECK-CVT-NEXT: xtn v0.4h, v0.4s
	; CHECK-CVT-NEXT: ret			; CHECK-CVT-NEXT: ret
	;			;
	; CHECK-FP16-LABEL: test_signed_v4f16_v4i1:			; CHECK-FP16-LABEL: test_signed_v4f16_v4i1:
	; CHECK-FP16: // %bb.0:			; CHECK-FP16: // %bb.0:
	; CHECK-FP16-NEXT: movi v1.2d, #0000000000000000			; CHECK-FP16-NEXT: movi v1.2d, #0000000000000000
	; CHECK-FP16-NEXT: fcvtzs v0.4h, v0.4h			; CHECK-FP16-NEXT: fcvtzs v0.4h, v0.4h
				; CHECK-FP16-NEXT: movi v2.2d, #0xffffffffffffffff
	; CHECK-FP16-NEXT: smin v0.4h, v0.4h, v1.4h			; CHECK-FP16-NEXT: smin v0.4h, v0.4h, v1.4h
	; CHECK-FP16-NEXT: movi v1.2d, #0xffffffffffffffff			; CHECK-FP16-NEXT: smax v0.4h, v0.4h, v2.4h
	; CHECK-FP16-NEXT: smax v0.4h, v0.4h, v1.4h
	; CHECK-FP16-NEXT: ret			; CHECK-FP16-NEXT: ret
	%x = call <4 x i1> @llvm.fptosi.sat.v4f16.v4i1(<4 x half> %f)			%x = call <4 x i1> @llvm.fptosi.sat.v4f16.v4i1(<4 x half> %f)
	ret <4 x i1> %x			ret <4 x i1> %x
	}			}

	define <4 x i8> @test_signed_v4f16_v4i8(<4 x half> %f) {			define <4 x i8> @test_signed_v4f16_v4i8(<4 x half> %f) {
	; CHECK-CVT-LABEL: test_signed_v4f16_v4i8:			; CHECK-CVT-LABEL: test_signed_v4f16_v4i8:
	; CHECK-CVT: // %bb.0:			; CHECK-CVT: // %bb.0:
	Show All 27 Lines
	; CHECK-CVT-NEXT: smin v0.4s, v0.4s, v1.4s			; CHECK-CVT-NEXT: smin v0.4s, v0.4s, v1.4s
	; CHECK-CVT-NEXT: mvni v1.4s, #15, msl #8			; CHECK-CVT-NEXT: mvni v1.4s, #15, msl #8
	; CHECK-CVT-NEXT: smax v0.4s, v0.4s, v1.4s			; CHECK-CVT-NEXT: smax v0.4s, v0.4s, v1.4s
	; CHECK-CVT-NEXT: xtn v0.4h, v0.4s			; CHECK-CVT-NEXT: xtn v0.4h, v0.4s
	; CHECK-CVT-NEXT: ret			; CHECK-CVT-NEXT: ret
	;			;
	; CHECK-FP16-LABEL: test_signed_v4f16_v4i13:			; CHECK-FP16-LABEL: test_signed_v4f16_v4i13:
	; CHECK-FP16: // %bb.0:			; CHECK-FP16: // %bb.0:
	; CHECK-FP16-NEXT: mvni v1.4h, #240, lsl #8
	; CHECK-FP16-NEXT: fcvtzs v0.4h, v0.4h			; CHECK-FP16-NEXT: fcvtzs v0.4h, v0.4h
	; CHECK-FP16-NEXT: smin v0.4h, v0.4h, v1.4h
	; CHECK-FP16-NEXT: movi v1.4h, #240, lsl #8			; CHECK-FP16-NEXT: movi v1.4h, #240, lsl #8
				; CHECK-FP16-NEXT: mvni v2.4h, #240, lsl #8
				; CHECK-FP16-NEXT: smin v0.4h, v0.4h, v2.4h
	; CHECK-FP16-NEXT: smax v0.4h, v0.4h, v1.4h			; CHECK-FP16-NEXT: smax v0.4h, v0.4h, v1.4h
	; CHECK-FP16-NEXT: ret			; CHECK-FP16-NEXT: ret
	%x = call <4 x i13> @llvm.fptosi.sat.v4f16.v4i13(<4 x half> %f)			%x = call <4 x i13> @llvm.fptosi.sat.v4f16.v4i13(<4 x half> %f)
	ret <4 x i13> %x			ret <4 x i13> %x
	}			}

	define <4 x i16> @test_signed_v4f16_v4i16(<4 x half> %f) {			define <4 x i16> @test_signed_v4f16_v4i16(<4 x half> %f) {
	; CHECK-CVT-LABEL: test_signed_v4f16_v4i16:			; CHECK-CVT-LABEL: test_signed_v4f16_v4i16:
	▲ Show 20 Lines • Show All 435 Lines • ▼ Show 20 Lines
	; CHECK-CVT-NEXT: uzp1 v0.8h, v1.8h, v2.8h			; CHECK-CVT-NEXT: uzp1 v0.8h, v1.8h, v2.8h
	; CHECK-CVT-NEXT: xtn v0.8b, v0.8h			; CHECK-CVT-NEXT: xtn v0.8b, v0.8h
	; CHECK-CVT-NEXT: ret			; CHECK-CVT-NEXT: ret
	;			;
	; CHECK-FP16-LABEL: test_signed_v8f16_v8i1:			; CHECK-FP16-LABEL: test_signed_v8f16_v8i1:
	; CHECK-FP16: // %bb.0:			; CHECK-FP16: // %bb.0:
	; CHECK-FP16-NEXT: movi v1.2d, #0000000000000000			; CHECK-FP16-NEXT: movi v1.2d, #0000000000000000
	; CHECK-FP16-NEXT: fcvtzs v0.8h, v0.8h			; CHECK-FP16-NEXT: fcvtzs v0.8h, v0.8h
				; CHECK-FP16-NEXT: movi v2.2d, #0xffffffffffffffff
	; CHECK-FP16-NEXT: smin v0.8h, v0.8h, v1.8h			; CHECK-FP16-NEXT: smin v0.8h, v0.8h, v1.8h
	; CHECK-FP16-NEXT: movi v1.2d, #0xffffffffffffffff			; CHECK-FP16-NEXT: smax v0.8h, v0.8h, v2.8h
	; CHECK-FP16-NEXT: smax v0.8h, v0.8h, v1.8h
	; CHECK-FP16-NEXT: xtn v0.8b, v0.8h			; CHECK-FP16-NEXT: xtn v0.8b, v0.8h
	; CHECK-FP16-NEXT: ret			; CHECK-FP16-NEXT: ret
	%x = call <8 x i1> @llvm.fptosi.sat.v8f16.v8i1(<8 x half> %f)			%x = call <8 x i1> @llvm.fptosi.sat.v8f16.v8i1(<8 x half> %f)
	ret <8 x i1> %x			ret <8 x i1> %x
	}			}

	define <8 x i8> @test_signed_v8f16_v8i8(<8 x half> %f) {			define <8 x i8> @test_signed_v8f16_v8i8(<8 x half> %f) {
	; CHECK-CVT-LABEL: test_signed_v8f16_v8i8:			; CHECK-CVT-LABEL: test_signed_v8f16_v8i8:
	▲ Show 20 Lines • Show All 130 Lines • ▼ Show 20 Lines
	; CHECK-CVT-NEXT: csel w8, w8, w10, gt			; CHECK-CVT-NEXT: csel w8, w8, w10, gt
	; CHECK-CVT-NEXT: mov v2.s[3], w13			; CHECK-CVT-NEXT: mov v2.s[3], w13
	; CHECK-CVT-NEXT: mov v1.s[3], w8			; CHECK-CVT-NEXT: mov v1.s[3], w8
	; CHECK-CVT-NEXT: uzp1 v0.8h, v1.8h, v2.8h			; CHECK-CVT-NEXT: uzp1 v0.8h, v1.8h, v2.8h
	; CHECK-CVT-NEXT: ret			; CHECK-CVT-NEXT: ret
	;			;
	; CHECK-FP16-LABEL: test_signed_v8f16_v8i13:			; CHECK-FP16-LABEL: test_signed_v8f16_v8i13:
	; CHECK-FP16: // %bb.0:			; CHECK-FP16: // %bb.0:
	; CHECK-FP16-NEXT: mvni v1.8h, #240, lsl #8
	; CHECK-FP16-NEXT: fcvtzs v0.8h, v0.8h			; CHECK-FP16-NEXT: fcvtzs v0.8h, v0.8h
	; CHECK-FP16-NEXT: smin v0.8h, v0.8h, v1.8h
	; CHECK-FP16-NEXT: movi v1.8h, #240, lsl #8			; CHECK-FP16-NEXT: movi v1.8h, #240, lsl #8
				; CHECK-FP16-NEXT: mvni v2.8h, #240, lsl #8
				; CHECK-FP16-NEXT: smin v0.8h, v0.8h, v2.8h
	; CHECK-FP16-NEXT: smax v0.8h, v0.8h, v1.8h			; CHECK-FP16-NEXT: smax v0.8h, v0.8h, v1.8h
	; CHECK-FP16-NEXT: ret			; CHECK-FP16-NEXT: ret
	%x = call <8 x i13> @llvm.fptosi.sat.v8f16.v8i13(<8 x half> %f)			%x = call <8 x i13> @llvm.fptosi.sat.v8f16.v8i13(<8 x half> %f)
	ret <8 x i13> %x			ret <8 x i13> %x
	}			}

	define <8 x i16> @test_signed_v8f16_v8i16(<8 x half> %f) {			define <8 x i16> @test_signed_v8f16_v8i16(<8 x half> %f) {
	; CHECK-CVT-LABEL: test_signed_v8f16_v8i16:			; CHECK-CVT-LABEL: test_signed_v8f16_v8i16:
	▲ Show 20 Lines • Show All 68 Lines • ▼ Show 20 Lines
	}			}

	define <8 x i19> @test_signed_v8f16_v8i19(<8 x half> %f) {			define <8 x i19> @test_signed_v8f16_v8i19(<8 x half> %f) {
	; CHECK-LABEL: test_signed_v8f16_v8i19:			; CHECK-LABEL: test_signed_v8f16_v8i19:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: fcvtl v2.4s, v0.4h			; CHECK-NEXT: fcvtl v2.4s, v0.4h
	; CHECK-NEXT: fcvtl2 v0.4s, v0.8h			; CHECK-NEXT: fcvtl2 v0.4s, v0.8h
	; CHECK-NEXT: movi v1.4s, #3, msl #16			; CHECK-NEXT: movi v1.4s, #3, msl #16
	; CHECK-NEXT: mvni v3.4s, #3, msl #16
	; CHECK-NEXT: fcvtzs v2.4s, v2.4s			; CHECK-NEXT: fcvtzs v2.4s, v2.4s
	; CHECK-NEXT: fcvtzs v0.4s, v0.4s			; CHECK-NEXT: fcvtzs v0.4s, v0.4s
	; CHECK-NEXT: smin v2.4s, v2.4s, v1.4s			; CHECK-NEXT: smin v2.4s, v2.4s, v1.4s
	; CHECK-NEXT: smin v0.4s, v0.4s, v1.4s			; CHECK-NEXT: smin v0.4s, v0.4s, v1.4s
	; CHECK-NEXT: smax v1.4s, v2.4s, v3.4s			; CHECK-NEXT: mvni v1.4s, #3, msl #16
	; CHECK-NEXT: smax v0.4s, v0.4s, v3.4s			; CHECK-NEXT: smax v2.4s, v2.4s, v1.4s
	; CHECK-NEXT: mov w1, v1.s[1]			; CHECK-NEXT: smax v0.4s, v0.4s, v1.4s
	; CHECK-NEXT: mov w2, v1.s[2]			; CHECK-NEXT: mov w1, v2.s[1]
				; CHECK-NEXT: mov w2, v2.s[2]
	; CHECK-NEXT: mov w5, v0.s[1]			; CHECK-NEXT: mov w5, v0.s[1]
	; CHECK-NEXT: mov w3, v1.s[3]			; CHECK-NEXT: mov w3, v2.s[3]
	; CHECK-NEXT: mov w6, v0.s[2]			; CHECK-NEXT: mov w6, v0.s[2]
	; CHECK-NEXT: mov w7, v0.s[3]			; CHECK-NEXT: mov w7, v0.s[3]
	; CHECK-NEXT: fmov w4, s0			; CHECK-NEXT: fmov w4, s0
	; CHECK-NEXT: fmov w0, s1			; CHECK-NEXT: fmov w0, s2
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%x = call <8 x i19> @llvm.fptosi.sat.v8f16.v8i19(<8 x half> %f)			%x = call <8 x i19> @llvm.fptosi.sat.v8f16.v8i19(<8 x half> %f)
	ret <8 x i19> %x			ret <8 x i19> %x
	}			}

	define <8 x i32> @test_signed_v8f16_v8i32_duplicate(<8 x half> %f) {			define <8 x i32> @test_signed_v8f16_v8i32_duplicate(<8 x half> %f) {
	; CHECK-LABEL: test_signed_v8f16_v8i32_duplicate:			; CHECK-LABEL: test_signed_v8f16_v8i32_duplicate:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	▲ Show 20 Lines • Show All 598 Lines • ▼ Show 20 Lines
	declare <16 x i16> @llvm.fptosi.sat.v16f64.v16i16(<16 x double> %f)			declare <16 x i16> @llvm.fptosi.sat.v16f64.v16i16(<16 x double> %f)

	define <8 x i8> @test_signed_v8f32_v8i8(<8 x float> %f) {			define <8 x i8> @test_signed_v8f32_v8i8(<8 x float> %f) {
	; CHECK-LABEL: test_signed_v8f32_v8i8:			; CHECK-LABEL: test_signed_v8f32_v8i8:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: movi v2.4s, #127			; CHECK-NEXT: movi v2.4s, #127
	; CHECK-NEXT: fcvtzs v1.4s, v1.4s			; CHECK-NEXT: fcvtzs v1.4s, v1.4s
	; CHECK-NEXT: fcvtzs v0.4s, v0.4s			; CHECK-NEXT: fcvtzs v0.4s, v0.4s
	; CHECK-NEXT: mvni v3.4s, #127
	; CHECK-NEXT: smin v1.4s, v1.4s, v2.4s			; CHECK-NEXT: smin v1.4s, v1.4s, v2.4s
	; CHECK-NEXT: smin v0.4s, v0.4s, v2.4s			; CHECK-NEXT: smin v0.4s, v0.4s, v2.4s
	; CHECK-NEXT: smax v1.4s, v1.4s, v3.4s			; CHECK-NEXT: mvni v2.4s, #127
	; CHECK-NEXT: smax v0.4s, v0.4s, v3.4s			; CHECK-NEXT: smax v1.4s, v1.4s, v2.4s
				; CHECK-NEXT: smax v0.4s, v0.4s, v2.4s
	; CHECK-NEXT: xtn v1.4h, v1.4s			; CHECK-NEXT: xtn v1.4h, v1.4s
	; CHECK-NEXT: xtn v0.4h, v0.4s			; CHECK-NEXT: xtn v0.4h, v0.4s
	; CHECK-NEXT: uzp1 v0.8b, v0.8b, v1.8b			; CHECK-NEXT: uzp1 v0.8b, v0.8b, v1.8b
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%x = call <8 x i8> @llvm.fptosi.sat.v8f32.v8i8(<8 x float> %f)			%x = call <8 x i8> @llvm.fptosi.sat.v8f32.v8i8(<8 x float> %f)
	ret <8 x i8> %x			ret <8 x i8> %x
	}			}

	▲ Show 20 Lines • Show All 789 Lines • Show Last 20 Lines

llvm/test/CodeGen/AArch64/fptoui-sat-vector.ll

	Show First 20 Lines • Show All 279 Lines • ▼ Show 20 Lines
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: sub sp, sp, #96			; CHECK-NEXT: sub sp, sp, #96
	; CHECK-NEXT: str x30, [sp, #64] // 8-byte Folded Spill			; CHECK-NEXT: str x30, [sp, #64] // 8-byte Folded Spill
	; CHECK-NEXT: stp x20, x19, [sp, #80] // 16-byte Folded Spill			; CHECK-NEXT: stp x20, x19, [sp, #80] // 16-byte Folded Spill
	; CHECK-NEXT: .cfi_def_cfa_offset 96			; CHECK-NEXT: .cfi_def_cfa_offset 96
	; CHECK-NEXT: .cfi_offset w19, -8			; CHECK-NEXT: .cfi_offset w19, -8
	; CHECK-NEXT: .cfi_offset w20, -16			; CHECK-NEXT: .cfi_offset w20, -16
	; CHECK-NEXT: .cfi_offset w30, -32			; CHECK-NEXT: .cfi_offset w30, -32
	; CHECK-NEXT: mov v2.16b, v1.16b
	; CHECK-NEXT: adrp x8, .LCPI15_0			; CHECK-NEXT: adrp x8, .LCPI15_0
	; CHECK-NEXT: stp q1, q0, [sp, #32] // 32-byte Folded Spill			; CHECK-NEXT: stp q1, q0, [sp, #32] // 32-byte Folded Spill
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI15_0]			; CHECK-NEXT: mov v2.16b, v1.16b
	; CHECK-NEXT: mov v0.16b, v2.16b			; CHECK-NEXT: mov v0.16b, v2.16b
				; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI15_0]
	; CHECK-NEXT: str q1, [sp, #16] // 16-byte Folded Spill			; CHECK-NEXT: str q1, [sp, #16] // 16-byte Folded Spill
	; CHECK-NEXT: bl __getf2			; CHECK-NEXT: bl __getf2
	; CHECK-NEXT: ldr q0, [sp, #32] // 16-byte Folded Reload			; CHECK-NEXT: ldr q0, [sp, #32] // 16-byte Folded Reload
	; CHECK-NEXT: mov w19, w0			; CHECK-NEXT: mov w19, w0
	; CHECK-NEXT: bl __fixunstfsi			; CHECK-NEXT: bl __fixunstfsi
	; CHECK-NEXT: adrp x8, .LCPI15_1			; CHECK-NEXT: adrp x8, .LCPI15_1
	; CHECK-NEXT: ldr q0, [sp, #32] // 16-byte Folded Reload			; CHECK-NEXT: ldr q0, [sp, #32] // 16-byte Folded Reload
	; CHECK-NEXT: cmp w19, #0			; CHECK-NEXT: cmp w19, #0
	Show All 32 Lines
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: sub sp, sp, #112			; CHECK-NEXT: sub sp, sp, #112
	; CHECK-NEXT: str x30, [sp, #80] // 8-byte Folded Spill			; CHECK-NEXT: str x30, [sp, #80] // 8-byte Folded Spill
	; CHECK-NEXT: stp x20, x19, [sp, #96] // 16-byte Folded Spill			; CHECK-NEXT: stp x20, x19, [sp, #96] // 16-byte Folded Spill
	; CHECK-NEXT: .cfi_def_cfa_offset 112			; CHECK-NEXT: .cfi_def_cfa_offset 112
	; CHECK-NEXT: .cfi_offset w19, -8			; CHECK-NEXT: .cfi_offset w19, -8
	; CHECK-NEXT: .cfi_offset w20, -16			; CHECK-NEXT: .cfi_offset w20, -16
	; CHECK-NEXT: .cfi_offset w30, -32			; CHECK-NEXT: .cfi_offset w30, -32
	; CHECK-NEXT: stp q0, q2, [sp, #48] // 32-byte Folded Spill
	; CHECK-NEXT: adrp x8, .LCPI16_0			; CHECK-NEXT: adrp x8, .LCPI16_0
				; CHECK-NEXT: stp q0, q2, [sp, #48] // 32-byte Folded Spill
	; CHECK-NEXT: mov v2.16b, v1.16b			; CHECK-NEXT: mov v2.16b, v1.16b
	; CHECK-NEXT: str q1, [sp] // 16-byte Folded Spill			; CHECK-NEXT: str q1, [sp] // 16-byte Folded Spill
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI16_0]
	; CHECK-NEXT: mov v0.16b, v2.16b			; CHECK-NEXT: mov v0.16b, v2.16b
				; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI16_0]
	; CHECK-NEXT: str q1, [sp, #32] // 16-byte Folded Spill			; CHECK-NEXT: str q1, [sp, #32] // 16-byte Folded Spill
	; CHECK-NEXT: bl __getf2			; CHECK-NEXT: bl __getf2
	; CHECK-NEXT: ldr q0, [sp] // 16-byte Folded Reload			; CHECK-NEXT: ldr q0, [sp] // 16-byte Folded Reload
	; CHECK-NEXT: mov w19, w0			; CHECK-NEXT: mov w19, w0
	; CHECK-NEXT: bl __fixunstfsi			; CHECK-NEXT: bl __fixunstfsi
	; CHECK-NEXT: adrp x8, .LCPI16_1			; CHECK-NEXT: adrp x8, .LCPI16_1
	; CHECK-NEXT: ldr q0, [sp] // 16-byte Folded Reload			; CHECK-NEXT: ldr q0, [sp] // 16-byte Folded Reload
	; CHECK-NEXT: cmp w19, #0			; CHECK-NEXT: cmp w19, #0
	▲ Show 20 Lines • Show All 46 Lines • ▼ Show 20 Lines
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: sub sp, sp, #128			; CHECK-NEXT: sub sp, sp, #128
	; CHECK-NEXT: str x30, [sp, #96] // 8-byte Folded Spill			; CHECK-NEXT: str x30, [sp, #96] // 8-byte Folded Spill
	; CHECK-NEXT: stp x20, x19, [sp, #112] // 16-byte Folded Spill			; CHECK-NEXT: stp x20, x19, [sp, #112] // 16-byte Folded Spill
	; CHECK-NEXT: .cfi_def_cfa_offset 128			; CHECK-NEXT: .cfi_def_cfa_offset 128
	; CHECK-NEXT: .cfi_offset w19, -8			; CHECK-NEXT: .cfi_offset w19, -8
	; CHECK-NEXT: .cfi_offset w20, -16			; CHECK-NEXT: .cfi_offset w20, -16
	; CHECK-NEXT: .cfi_offset w30, -32			; CHECK-NEXT: .cfi_offset w30, -32
	; CHECK-NEXT: stp q0, q2, [sp, #16] // 32-byte Folded Spill
	; CHECK-NEXT: adrp x8, .LCPI17_0			; CHECK-NEXT: adrp x8, .LCPI17_0
				; CHECK-NEXT: stp q0, q2, [sp, #16] // 32-byte Folded Spill
	; CHECK-NEXT: mov v2.16b, v1.16b			; CHECK-NEXT: mov v2.16b, v1.16b
	; CHECK-NEXT: str q1, [sp] // 16-byte Folded Spill			; CHECK-NEXT: str q1, [sp] // 16-byte Folded Spill
				; CHECK-NEXT: mov v0.16b, v2.16b
	; CHECK-NEXT: str q3, [sp, #80] // 16-byte Folded Spill			; CHECK-NEXT: str q3, [sp, #80] // 16-byte Folded Spill
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI17_0]			; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI17_0]
	; CHECK-NEXT: mov v0.16b, v2.16b
	; CHECK-NEXT: str q1, [sp, #64] // 16-byte Folded Spill			; CHECK-NEXT: str q1, [sp, #64] // 16-byte Folded Spill
	; CHECK-NEXT: bl __getf2			; CHECK-NEXT: bl __getf2
	; CHECK-NEXT: ldr q0, [sp] // 16-byte Folded Reload			; CHECK-NEXT: ldr q0, [sp] // 16-byte Folded Reload
	; CHECK-NEXT: mov w19, w0			; CHECK-NEXT: mov w19, w0
	; CHECK-NEXT: bl __fixunstfsi			; CHECK-NEXT: bl __fixunstfsi
	; CHECK-NEXT: adrp x8, .LCPI17_1			; CHECK-NEXT: adrp x8, .LCPI17_1
	; CHECK-NEXT: ldr q0, [sp] // 16-byte Folded Reload			; CHECK-NEXT: ldr q0, [sp] // 16-byte Folded Reload
	; CHECK-NEXT: cmp w19, #0			; CHECK-NEXT: cmp w19, #0
	▲ Show 20 Lines • Show All 995 Lines • ▼ Show 20 Lines
	; CHECK-CVT-NEXT: movi v1.4s, #31, msl #8			; CHECK-CVT-NEXT: movi v1.4s, #31, msl #8
	; CHECK-CVT-NEXT: fcvtzu v0.4s, v0.4s			; CHECK-CVT-NEXT: fcvtzu v0.4s, v0.4s
	; CHECK-CVT-NEXT: umin v0.4s, v0.4s, v1.4s			; CHECK-CVT-NEXT: umin v0.4s, v0.4s, v1.4s
	; CHECK-CVT-NEXT: xtn v0.4h, v0.4s			; CHECK-CVT-NEXT: xtn v0.4h, v0.4s
	; CHECK-CVT-NEXT: ret			; CHECK-CVT-NEXT: ret
	;			;
	; CHECK-FP16-LABEL: test_unsigned_v4f16_v4i13:			; CHECK-FP16-LABEL: test_unsigned_v4f16_v4i13:
	; CHECK-FP16: // %bb.0:			; CHECK-FP16: // %bb.0:
	; CHECK-FP16-NEXT: mvni v1.4h, #224, lsl #8
	; CHECK-FP16-NEXT: fcvtzu v0.4h, v0.4h			; CHECK-FP16-NEXT: fcvtzu v0.4h, v0.4h
				; CHECK-FP16-NEXT: mvni v1.4h, #224, lsl #8
	; CHECK-FP16-NEXT: umin v0.4h, v0.4h, v1.4h			; CHECK-FP16-NEXT: umin v0.4h, v0.4h, v1.4h
	; CHECK-FP16-NEXT: ret			; CHECK-FP16-NEXT: ret
	%x = call <4 x i13> @llvm.fptoui.sat.v4f16.v4i13(<4 x half> %f)			%x = call <4 x i13> @llvm.fptoui.sat.v4f16.v4i13(<4 x half> %f)
	ret <4 x i13> %x			ret <4 x i13> %x
	}			}

	define <4 x i16> @test_unsigned_v4f16_v4i16(<4 x half> %f) {			define <4 x i16> @test_unsigned_v4f16_v4i16(<4 x half> %f) {
	; CHECK-CVT-LABEL: test_unsigned_v4f16_v4i16:			; CHECK-CVT-LABEL: test_unsigned_v4f16_v4i16:
	▲ Show 20 Lines • Show All 468 Lines • ▼ Show 20 Lines
	; CHECK-CVT-NEXT: mov v3.s[2], w9			; CHECK-CVT-NEXT: mov v3.s[2], w9
	; CHECK-CVT-NEXT: mov v2.s[3], w13			; CHECK-CVT-NEXT: mov v2.s[3], w13
	; CHECK-CVT-NEXT: mov v3.s[3], w8			; CHECK-CVT-NEXT: mov v3.s[3], w8
	; CHECK-CVT-NEXT: uzp1 v0.8h, v3.8h, v2.8h			; CHECK-CVT-NEXT: uzp1 v0.8h, v3.8h, v2.8h
	; CHECK-CVT-NEXT: ret			; CHECK-CVT-NEXT: ret
	;			;
	; CHECK-FP16-LABEL: test_unsigned_v8f16_v8i13:			; CHECK-FP16-LABEL: test_unsigned_v8f16_v8i13:
	; CHECK-FP16: // %bb.0:			; CHECK-FP16: // %bb.0:
	; CHECK-FP16-NEXT: mvni v1.8h, #224, lsl #8
	; CHECK-FP16-NEXT: fcvtzu v0.8h, v0.8h			; CHECK-FP16-NEXT: fcvtzu v0.8h, v0.8h
				; CHECK-FP16-NEXT: mvni v1.8h, #224, lsl #8
	; CHECK-FP16-NEXT: umin v0.8h, v0.8h, v1.8h			; CHECK-FP16-NEXT: umin v0.8h, v0.8h, v1.8h
	; CHECK-FP16-NEXT: ret			; CHECK-FP16-NEXT: ret
	%x = call <8 x i13> @llvm.fptoui.sat.v8f16.v8i13(<8 x half> %f)			%x = call <8 x i13> @llvm.fptoui.sat.v8f16.v8i13(<8 x half> %f)
	ret <8 x i13> %x			ret <8 x i13> %x
	}			}

	define <8 x i16> @test_unsigned_v8f16_v8i16(<8 x half> %f) {			define <8 x i16> @test_unsigned_v8f16_v8i16(<8 x half> %f) {
	; CHECK-CVT-LABEL: test_unsigned_v8f16_v8i16:			; CHECK-CVT-LABEL: test_unsigned_v8f16_v8i16:
	▲ Show 20 Lines • Show All 1,216 Lines • Show Last 20 Lines

llvm/test/CodeGen/AArch64/funnel-shift-rot.ll

	Show First 20 Lines • Show All 75 Lines • ▼ Show 20 Lines

	define <4 x i32> @rotl_v4i32(<4 x i32> %x, <4 x i32> %z) {			define <4 x i32> @rotl_v4i32(<4 x i32> %x, <4 x i32> %z) {
	; CHECK-LABEL: rotl_v4i32:			; CHECK-LABEL: rotl_v4i32:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: movi v2.4s, #31			; CHECK-NEXT: movi v2.4s, #31
	; CHECK-NEXT: neg v3.4s, v1.4s			; CHECK-NEXT: neg v3.4s, v1.4s
	; CHECK-NEXT: and v1.16b, v1.16b, v2.16b			; CHECK-NEXT: and v1.16b, v1.16b, v2.16b
	; CHECK-NEXT: and v2.16b, v3.16b, v2.16b			; CHECK-NEXT: and v2.16b, v3.16b, v2.16b
	; CHECK-NEXT: ushl v1.4s, v0.4s, v1.4s
	; CHECK-NEXT: neg v2.4s, v2.4s			; CHECK-NEXT: neg v2.4s, v2.4s
				; CHECK-NEXT: ushl v1.4s, v0.4s, v1.4s
	; CHECK-NEXT: ushl v0.4s, v0.4s, v2.4s			; CHECK-NEXT: ushl v0.4s, v0.4s, v2.4s
	; CHECK-NEXT: orr v0.16b, v1.16b, v0.16b			; CHECK-NEXT: orr v0.16b, v1.16b, v0.16b
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%f = call <4 x i32> @llvm.fshl.v4i32(<4 x i32> %x, <4 x i32> %x, <4 x i32> %z)			%f = call <4 x i32> @llvm.fshl.v4i32(<4 x i32> %x, <4 x i32> %x, <4 x i32> %z)
	ret <4 x i32> %f			ret <4 x i32> %f
	}			}

	; Vector rotate by constant splat amount.			; Vector rotate by constant splat amount.
	▲ Show 20 Lines • Show All 71 Lines • ▼ Show 20 Lines
	; Vector rotate.			; Vector rotate.

	define <4 x i32> @rotr_v4i32(<4 x i32> %x, <4 x i32> %z) {			define <4 x i32> @rotr_v4i32(<4 x i32> %x, <4 x i32> %z) {
	; CHECK-LABEL: rotr_v4i32:			; CHECK-LABEL: rotr_v4i32:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: movi v2.4s, #31			; CHECK-NEXT: movi v2.4s, #31
	; CHECK-NEXT: neg v3.4s, v1.4s			; CHECK-NEXT: neg v3.4s, v1.4s
	; CHECK-NEXT: and v1.16b, v1.16b, v2.16b			; CHECK-NEXT: and v1.16b, v1.16b, v2.16b
	; CHECK-NEXT: and v2.16b, v3.16b, v2.16b
	; CHECK-NEXT: neg v1.4s, v1.4s			; CHECK-NEXT: neg v1.4s, v1.4s
				; CHECK-NEXT: and v2.16b, v3.16b, v2.16b
	; CHECK-NEXT: ushl v2.4s, v0.4s, v2.4s			; CHECK-NEXT: ushl v2.4s, v0.4s, v2.4s
	; CHECK-NEXT: ushl v0.4s, v0.4s, v1.4s			; CHECK-NEXT: ushl v0.4s, v0.4s, v1.4s
	; CHECK-NEXT: orr v0.16b, v0.16b, v2.16b			; CHECK-NEXT: orr v0.16b, v0.16b, v2.16b
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%f = call <4 x i32> @llvm.fshr.v4i32(<4 x i32> %x, <4 x i32> %x, <4 x i32> %z)			%f = call <4 x i32> @llvm.fshr.v4i32(<4 x i32> %x, <4 x i32> %x, <4 x i32> %z)
	ret <4 x i32> %f			ret <4 x i32> %f
	}			}

	▲ Show 20 Lines • Show All 45 Lines • Show Last 20 Lines

llvm/test/CodeGen/AArch64/insert-subvector-res-legalization.ll

Show First 20 Lines • Show All 86 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
ret <vscale x 8 x i8> %ins		ret <vscale x 8 x i8> %ins
}		}

define <vscale x 8 x i8> @vec_scalable_subvec_fixed_idx_nonzero_i8(<vscale x 8 x i8>* %a, <8 x i8>* %b) #0 {		define <vscale x 8 x i8> @vec_scalable_subvec_fixed_idx_nonzero_i8(<vscale x 8 x i8>* %a, <8 x i8>* %b) #0 {
; CHECK-LABEL: vec_scalable_subvec_fixed_idx_nonzero_i8:		; CHECK-LABEL: vec_scalable_subvec_fixed_idx_nonzero_i8:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: str x29, [sp, #-16]! // 8-byte Folded Spill		; CHECK-NEXT: str x29, [sp, #-16]! // 8-byte Folded Spill
; CHECK-NEXT: addvl sp, sp, #-1		; CHECK-NEXT: addvl sp, sp, #-1
; CHECK-NEXT: ptrue p0.h
; CHECK-NEXT: cnth x8		; CHECK-NEXT: cnth x8
; CHECK-NEXT: ld1b { z0.h }, p0/z, [x0]		; CHECK-NEXT: ptrue p0.h
; CHECK-NEXT: ldr d1, [x1]
; CHECK-NEXT: sub x8, x8, #8		; CHECK-NEXT: sub x8, x8, #8
; CHECK-NEXT: mov w9, #8		; CHECK-NEXT: mov w9, #8
; CHECK-NEXT: cmp x8, #8		; CHECK-NEXT: cmp x8, #8
		; CHECK-NEXT: ld1b { z0.h }, p0/z, [x0]
		; CHECK-NEXT: ldr d1, [x1]
; CHECK-NEXT: csel x8, x8, x9, lo		; CHECK-NEXT: csel x8, x8, x9, lo
; CHECK-NEXT: ushll v1.8h, v1.8b, #0
; CHECK-NEXT: lsl x8, x8, #1		; CHECK-NEXT: lsl x8, x8, #1
; CHECK-NEXT: mov x9, sp		; CHECK-NEXT: mov x9, sp
		; CHECK-NEXT: ushll v1.8h, v1.8b, #0
; CHECK-NEXT: st1h { z0.h }, p0, [sp]		; CHECK-NEXT: st1h { z0.h }, p0, [sp]
; CHECK-NEXT: str q1, [x9, x8]		; CHECK-NEXT: str q1, [x9, x8]
; CHECK-NEXT: ld1h { z0.h }, p0/z, [sp]		; CHECK-NEXT: ld1h { z0.h }, p0/z, [sp]
; CHECK-NEXT: addvl sp, sp, #1		; CHECK-NEXT: addvl sp, sp, #1
; CHECK-NEXT: ldr x29, [sp], #16 // 8-byte Folded Reload		; CHECK-NEXT: ldr x29, [sp], #16 // 8-byte Folded Reload
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%vec = load <vscale x 8 x i8>, <vscale x 8 x i8>* %a		%vec = load <vscale x 8 x i8>, <vscale x 8 x i8>* %a
%subvec = load <8 x i8>, <8 x i8>* %b		%subvec = load <8 x i8>, <8 x i8>* %b
Show All 17 Lines	; CHECK-NEXT: ret
ret <vscale x 4 x i16> %ins		ret <vscale x 4 x i16> %ins
}		}

define <vscale x 4 x i16> @vec_scalable_subvec_fixed_idx_nonzero_i16(<vscale x 4 x i16>* %a, <4 x i16>* %b) #0 {		define <vscale x 4 x i16> @vec_scalable_subvec_fixed_idx_nonzero_i16(<vscale x 4 x i16>* %a, <4 x i16>* %b) #0 {
; CHECK-LABEL: vec_scalable_subvec_fixed_idx_nonzero_i16:		; CHECK-LABEL: vec_scalable_subvec_fixed_idx_nonzero_i16:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: str x29, [sp, #-16]! // 8-byte Folded Spill		; CHECK-NEXT: str x29, [sp, #-16]! // 8-byte Folded Spill
; CHECK-NEXT: addvl sp, sp, #-1		; CHECK-NEXT: addvl sp, sp, #-1
; CHECK-NEXT: ptrue p0.s
; CHECK-NEXT: cntw x8		; CHECK-NEXT: cntw x8
; CHECK-NEXT: ld1h { z0.s }, p0/z, [x0]		; CHECK-NEXT: ptrue p0.s
; CHECK-NEXT: ldr d1, [x1]
; CHECK-NEXT: sub x8, x8, #4		; CHECK-NEXT: sub x8, x8, #4
; CHECK-NEXT: mov w9, #4		; CHECK-NEXT: mov w9, #4
; CHECK-NEXT: cmp x8, #4		; CHECK-NEXT: cmp x8, #4
		; CHECK-NEXT: ld1h { z0.s }, p0/z, [x0]
		; CHECK-NEXT: ldr d1, [x1]
; CHECK-NEXT: csel x8, x8, x9, lo		; CHECK-NEXT: csel x8, x8, x9, lo
; CHECK-NEXT: ushll v1.4s, v1.4h, #0
; CHECK-NEXT: lsl x8, x8, #2		; CHECK-NEXT: lsl x8, x8, #2
; CHECK-NEXT: mov x9, sp		; CHECK-NEXT: mov x9, sp
		; CHECK-NEXT: ushll v1.4s, v1.4h, #0
; CHECK-NEXT: st1w { z0.s }, p0, [sp]		; CHECK-NEXT: st1w { z0.s }, p0, [sp]
; CHECK-NEXT: str q1, [x9, x8]		; CHECK-NEXT: str q1, [x9, x8]
; CHECK-NEXT: ld1w { z0.s }, p0/z, [sp]		; CHECK-NEXT: ld1w { z0.s }, p0/z, [sp]
; CHECK-NEXT: addvl sp, sp, #1		; CHECK-NEXT: addvl sp, sp, #1
; CHECK-NEXT: ldr x29, [sp], #16 // 8-byte Folded Reload		; CHECK-NEXT: ldr x29, [sp], #16 // 8-byte Folded Reload
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%vec = load <vscale x 4 x i16>, <vscale x 4 x i16>* %a		%vec = load <vscale x 4 x i16>, <vscale x 4 x i16>* %a
%subvec = load <4 x i16>, <4 x i16>* %b		%subvec = load <4 x i16>, <4 x i16>* %b
Show All 17 Lines	; CHECK-NEXT: ret
ret <vscale x 2 x i32> %ins		ret <vscale x 2 x i32> %ins
}		}

define <vscale x 2 x i32> @vec_scalable_subvec_fixed_idx_nonzero_i32(<vscale x 2 x i32>* %a, <2 x i32>* %b) #0 {		define <vscale x 2 x i32> @vec_scalable_subvec_fixed_idx_nonzero_i32(<vscale x 2 x i32>* %a, <2 x i32>* %b) #0 {
; CHECK-LABEL: vec_scalable_subvec_fixed_idx_nonzero_i32:		; CHECK-LABEL: vec_scalable_subvec_fixed_idx_nonzero_i32:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: str x29, [sp, #-16]! // 8-byte Folded Spill		; CHECK-NEXT: str x29, [sp, #-16]! // 8-byte Folded Spill
; CHECK-NEXT: addvl sp, sp, #-1		; CHECK-NEXT: addvl sp, sp, #-1
; CHECK-NEXT: ptrue p0.d
; CHECK-NEXT: cntd x8		; CHECK-NEXT: cntd x8
; CHECK-NEXT: ld1w { z0.d }, p0/z, [x0]		; CHECK-NEXT: ptrue p0.d
; CHECK-NEXT: ldr d1, [x1]
; CHECK-NEXT: sub x8, x8, #2		; CHECK-NEXT: sub x8, x8, #2
; CHECK-NEXT: mov w9, #2		; CHECK-NEXT: mov w9, #2
; CHECK-NEXT: cmp x8, #2		; CHECK-NEXT: cmp x8, #2
		; CHECK-NEXT: ld1w { z0.d }, p0/z, [x0]
		; CHECK-NEXT: ldr d1, [x1]
; CHECK-NEXT: csel x8, x8, x9, lo		; CHECK-NEXT: csel x8, x8, x9, lo
; CHECK-NEXT: ushll v1.2d, v1.2s, #0
; CHECK-NEXT: lsl x8, x8, #3		; CHECK-NEXT: lsl x8, x8, #3
; CHECK-NEXT: mov x9, sp		; CHECK-NEXT: mov x9, sp
		; CHECK-NEXT: ushll v1.2d, v1.2s, #0
; CHECK-NEXT: st1d { z0.d }, p0, [sp]		; CHECK-NEXT: st1d { z0.d }, p0, [sp]
; CHECK-NEXT: str q1, [x9, x8]		; CHECK-NEXT: str q1, [x9, x8]
; CHECK-NEXT: ld1d { z0.d }, p0/z, [sp]		; CHECK-NEXT: ld1d { z0.d }, p0/z, [sp]
; CHECK-NEXT: addvl sp, sp, #1		; CHECK-NEXT: addvl sp, sp, #1
; CHECK-NEXT: ldr x29, [sp], #16 // 8-byte Folded Reload		; CHECK-NEXT: ldr x29, [sp], #16 // 8-byte Folded Reload
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%vec = load <vscale x 2 x i32>, <vscale x 2 x i32>* %a		%vec = load <vscale x 2 x i32>, <vscale x 2 x i32>* %a
%subvec = load <2 x i32>, <2 x i32>* %b		%subvec = load <2 x i32>, <2 x i32>* %b
▲ Show 20 Lines • Show All 44 Lines • Show Last 20 Lines

llvm/test/CodeGen/AArch64/lowerMUL-newload.ll

Show All 16 Lines	entry:
%v5 = trunc <4 x i32> %v4 to <4 x i16>		%v5 = trunc <4 x i32> %v4 to <4 x i16>
ret <4 x i16> %v5		ret <4 x i16> %v5
}		}

define <4 x i32> @mlai16_and(<4 x i16> %vec0, <4 x i16> %vec1, <4 x i16> %vec2) {		define <4 x i32> @mlai16_and(<4 x i16> %vec0, <4 x i16> %vec1, <4 x i16> %vec2) {
; CHECK-LABEL: mlai16_and:		; CHECK-LABEL: mlai16_and:
; CHECK: // %bb.0: // %entry		; CHECK: // %bb.0: // %entry
; CHECK-NEXT: smull v0.4s, v1.4h, v0.4h		; CHECK-NEXT: smull v0.4s, v1.4h, v0.4h
; CHECK-NEXT: movi v3.2d, #0x00ffff0000ffff		; CHECK-NEXT: movi v1.2d, #0x00ffff0000ffff
; CHECK-NEXT: uaddw v0.4s, v0.4s, v2.4h		; CHECK-NEXT: uaddw v0.4s, v0.4s, v2.4h
; CHECK-NEXT: and v0.16b, v0.16b, v3.16b		; CHECK-NEXT: and v0.16b, v0.16b, v1.16b
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%v0 = sext <4 x i16> %vec0 to <4 x i32>		%v0 = sext <4 x i16> %vec0 to <4 x i32>
%v1 = sext <4 x i16> %vec1 to <4 x i32>		%v1 = sext <4 x i16> %vec1 to <4 x i32>
%v2 = sext <4 x i16> %vec2 to <4 x i32>		%v2 = sext <4 x i16> %vec2 to <4 x i32>
%v3 = mul <4 x i32> %v1, %v0		%v3 = mul <4 x i32> %v1, %v0
%v4 = add <4 x i32> %v3, %v2		%v4 = add <4 x i32> %v3, %v2
%v5 = and <4 x i32> %v4, <i32 65535, i32 65535, i32 65535, i32 65535>		%v5 = and <4 x i32> %v4, <i32 65535, i32 65535, i32 65535, i32 65535>
▲ Show 20 Lines • Show All 117 Lines • ▼ Show 20 Lines	entry:
%v5 = trunc <2 x i64> %v4 to <2 x i32>		%v5 = trunc <2 x i64> %v4 to <2 x i32>
ret <2 x i32> %v5		ret <2 x i32> %v5
}		}

define <2 x i64> @mlai32_and(<2 x i32> %vec0, <2 x i32> %vec1, <2 x i32> %vec2) {		define <2 x i64> @mlai32_and(<2 x i32> %vec0, <2 x i32> %vec1, <2 x i32> %vec2) {
; CHECK-LABEL: mlai32_and:		; CHECK-LABEL: mlai32_and:
; CHECK: // %bb.0: // %entry		; CHECK: // %bb.0: // %entry
; CHECK-NEXT: smull v0.2d, v1.2s, v0.2s		; CHECK-NEXT: smull v0.2d, v1.2s, v0.2s
; CHECK-NEXT: movi v3.2d, #0x000000ffffffff		; CHECK-NEXT: movi v1.2d, #0x000000ffffffff
; CHECK-NEXT: uaddw v0.2d, v0.2d, v2.2s		; CHECK-NEXT: uaddw v0.2d, v0.2d, v2.2s
; CHECK-NEXT: and v0.16b, v0.16b, v3.16b		; CHECK-NEXT: and v0.16b, v0.16b, v1.16b
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%v0 = sext <2 x i32> %vec0 to <2 x i64>		%v0 = sext <2 x i32> %vec0 to <2 x i64>
%v1 = sext <2 x i32> %vec1 to <2 x i64>		%v1 = sext <2 x i32> %vec1 to <2 x i64>
%v2 = sext <2 x i32> %vec2 to <2 x i64>		%v2 = sext <2 x i32> %vec2 to <2 x i64>
%v3 = mul <2 x i64> %v1, %v0		%v3 = mul <2 x i64> %v1, %v0
%v4 = add <2 x i64> %v3, %v2		%v4 = add <2 x i64> %v3, %v2
%v5 = and <2 x i64> %v4, <i64 4294967295, i64 4294967295>		%v5 = and <2 x i64> %v4, <i64 4294967295, i64 4294967295>
▲ Show 20 Lines • Show All 243 Lines • Show Last 20 Lines

llvm/test/CodeGen/AArch64/minmax-of-minmax.ll

Show First 20 Lines • Show All 1,073 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%r = select <4 x i1> %cmp_ac, <4 x i32> %min_ab, <4 x i32> %min_cb		%r = select <4 x i1> %cmp_ac, <4 x i32> %min_ab, <4 x i32> %min_cb
ret <4 x i32> %r		ret <4 x i32> %r
}		}

define <4 x i32> @notted_smin_bc_ab(<4 x i32> %x, <4 x i32> %y, <4 x i32> %z) {		define <4 x i32> @notted_smin_bc_ab(<4 x i32> %x, <4 x i32> %y, <4 x i32> %z) {
; CHECK-LABEL: notted_smin_bc_ab:		; CHECK-LABEL: notted_smin_bc_ab:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: mvn v1.16b, v1.16b		; CHECK-NEXT: mvn v1.16b, v1.16b
; CHECK-NEXT: mvn v2.16b, v2.16b
; CHECK-NEXT: mvn v0.16b, v0.16b		; CHECK-NEXT: mvn v0.16b, v0.16b
		; CHECK-NEXT: mvn v2.16b, v2.16b
; CHECK-NEXT: smin v2.4s, v1.4s, v2.4s		; CHECK-NEXT: smin v2.4s, v1.4s, v2.4s
; CHECK-NEXT: smin v0.4s, v0.4s, v1.4s		; CHECK-NEXT: smin v0.4s, v0.4s, v1.4s
; CHECK-NEXT: smin v0.4s, v2.4s, v0.4s		; CHECK-NEXT: smin v0.4s, v2.4s, v0.4s
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = xor <4 x i32> %x, <i32 -1, i32 -1, i32 -1, i32 -1>		%a = xor <4 x i32> %x, <i32 -1, i32 -1, i32 -1, i32 -1>
%b = xor <4 x i32> %y, <i32 -1, i32 -1, i32 -1, i32 -1>		%b = xor <4 x i32> %y, <i32 -1, i32 -1, i32 -1, i32 -1>
%c = xor <4 x i32> %z, <i32 -1, i32 -1, i32 -1, i32 -1>		%c = xor <4 x i32> %z, <i32 -1, i32 -1, i32 -1, i32 -1>
%cmp_bc = icmp slt <4 x i32> %b, %c		%cmp_bc = icmp slt <4 x i32> %b, %c
%min_bc = select <4 x i1> %cmp_bc, <4 x i32> %b, <4 x i32> %c		%min_bc = select <4 x i1> %cmp_bc, <4 x i32> %b, <4 x i32> %c
%cmp_ab = icmp slt <4 x i32> %a, %b		%cmp_ab = icmp slt <4 x i32> %a, %b
%min_ab = select <4 x i1> %cmp_ab, <4 x i32> %a, <4 x i32> %b		%min_ab = select <4 x i1> %cmp_ab, <4 x i32> %a, <4 x i32> %b
%cmp_ca = icmp slt <4 x i32> %x, %z		%cmp_ca = icmp slt <4 x i32> %x, %z
%r = select <4 x i1> %cmp_ca, <4 x i32> %min_bc, <4 x i32> %min_ab		%r = select <4 x i1> %cmp_ca, <4 x i32> %min_bc, <4 x i32> %min_ab
ret <4 x i32> %r		ret <4 x i32> %r
}		}

define <4 x i32> @notted_smin_bc_ba(<4 x i32> %x, <4 x i32> %y, <4 x i32> %z) {		define <4 x i32> @notted_smin_bc_ba(<4 x i32> %x, <4 x i32> %y, <4 x i32> %z) {
; CHECK-LABEL: notted_smin_bc_ba:		; CHECK-LABEL: notted_smin_bc_ba:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: mvn v1.16b, v1.16b		; CHECK-NEXT: mvn v1.16b, v1.16b
; CHECK-NEXT: mvn v2.16b, v2.16b
; CHECK-NEXT: mvn v0.16b, v0.16b		; CHECK-NEXT: mvn v0.16b, v0.16b
		; CHECK-NEXT: mvn v2.16b, v2.16b
; CHECK-NEXT: smin v2.4s, v1.4s, v2.4s		; CHECK-NEXT: smin v2.4s, v1.4s, v2.4s
; CHECK-NEXT: smin v0.4s, v1.4s, v0.4s		; CHECK-NEXT: smin v0.4s, v1.4s, v0.4s
; CHECK-NEXT: smin v0.4s, v2.4s, v0.4s		; CHECK-NEXT: smin v0.4s, v2.4s, v0.4s
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = xor <4 x i32> %x, <i32 -1, i32 -1, i32 -1, i32 -1>		%a = xor <4 x i32> %x, <i32 -1, i32 -1, i32 -1, i32 -1>
%b = xor <4 x i32> %y, <i32 -1, i32 -1, i32 -1, i32 -1>		%b = xor <4 x i32> %y, <i32 -1, i32 -1, i32 -1, i32 -1>
%c = xor <4 x i32> %z, <i32 -1, i32 -1, i32 -1, i32 -1>		%c = xor <4 x i32> %z, <i32 -1, i32 -1, i32 -1, i32 -1>
%cmp_bc = icmp slt <4 x i32> %b, %c		%cmp_bc = icmp slt <4 x i32> %b, %c
▲ Show 20 Lines • Show All 48 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%r = select <4 x i1> %cmp_ac, <4 x i32> %min_ab, <4 x i32> %min_cb		%r = select <4 x i1> %cmp_ac, <4 x i32> %min_ab, <4 x i32> %min_cb
ret <4 x i32> %r		ret <4 x i32> %r
}		}

define <4 x i32> @notted_smin_bc_ab_swap_pred(<4 x i32> %x, <4 x i32> %y, <4 x i32> %z) {		define <4 x i32> @notted_smin_bc_ab_swap_pred(<4 x i32> %x, <4 x i32> %y, <4 x i32> %z) {
; CHECK-LABEL: notted_smin_bc_ab_swap_pred:		; CHECK-LABEL: notted_smin_bc_ab_swap_pred:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: mvn v1.16b, v1.16b		; CHECK-NEXT: mvn v1.16b, v1.16b
; CHECK-NEXT: mvn v2.16b, v2.16b
; CHECK-NEXT: mvn v0.16b, v0.16b		; CHECK-NEXT: mvn v0.16b, v0.16b
		; CHECK-NEXT: mvn v2.16b, v2.16b
; CHECK-NEXT: smin v2.4s, v1.4s, v2.4s		; CHECK-NEXT: smin v2.4s, v1.4s, v2.4s
; CHECK-NEXT: smin v0.4s, v0.4s, v1.4s		; CHECK-NEXT: smin v0.4s, v0.4s, v1.4s
; CHECK-NEXT: smin v0.4s, v2.4s, v0.4s		; CHECK-NEXT: smin v0.4s, v2.4s, v0.4s
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = xor <4 x i32> %x, <i32 -1, i32 -1, i32 -1, i32 -1>		%a = xor <4 x i32> %x, <i32 -1, i32 -1, i32 -1, i32 -1>
%b = xor <4 x i32> %y, <i32 -1, i32 -1, i32 -1, i32 -1>		%b = xor <4 x i32> %y, <i32 -1, i32 -1, i32 -1, i32 -1>
%c = xor <4 x i32> %z, <i32 -1, i32 -1, i32 -1, i32 -1>		%c = xor <4 x i32> %z, <i32 -1, i32 -1, i32 -1, i32 -1>
%cmp_bc = icmp slt <4 x i32> %b, %c		%cmp_bc = icmp slt <4 x i32> %b, %c
%min_bc = select <4 x i1> %cmp_bc, <4 x i32> %b, <4 x i32> %c		%min_bc = select <4 x i1> %cmp_bc, <4 x i32> %b, <4 x i32> %c
%cmp_ab = icmp slt <4 x i32> %a, %b		%cmp_ab = icmp slt <4 x i32> %a, %b
%min_ab = select <4 x i1> %cmp_ab, <4 x i32> %a, <4 x i32> %b		%min_ab = select <4 x i1> %cmp_ab, <4 x i32> %a, <4 x i32> %b
%cmp_ca = icmp sgt <4 x i32> %z, %x		%cmp_ca = icmp sgt <4 x i32> %z, %x
%r = select <4 x i1> %cmp_ca, <4 x i32> %min_bc, <4 x i32> %min_ab		%r = select <4 x i1> %cmp_ca, <4 x i32> %min_bc, <4 x i32> %min_ab
ret <4 x i32> %r		ret <4 x i32> %r
}		}

define <4 x i32> @notted_smin_bc_ba_swap_pred(<4 x i32> %x, <4 x i32> %y, <4 x i32> %z) {		define <4 x i32> @notted_smin_bc_ba_swap_pred(<4 x i32> %x, <4 x i32> %y, <4 x i32> %z) {
; CHECK-LABEL: notted_smin_bc_ba_swap_pred:		; CHECK-LABEL: notted_smin_bc_ba_swap_pred:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: mvn v1.16b, v1.16b		; CHECK-NEXT: mvn v1.16b, v1.16b
; CHECK-NEXT: mvn v2.16b, v2.16b
; CHECK-NEXT: mvn v0.16b, v0.16b		; CHECK-NEXT: mvn v0.16b, v0.16b
		; CHECK-NEXT: mvn v2.16b, v2.16b
; CHECK-NEXT: smin v2.4s, v1.4s, v2.4s		; CHECK-NEXT: smin v2.4s, v1.4s, v2.4s
; CHECK-NEXT: smin v0.4s, v1.4s, v0.4s		; CHECK-NEXT: smin v0.4s, v1.4s, v0.4s
; CHECK-NEXT: smin v0.4s, v2.4s, v0.4s		; CHECK-NEXT: smin v0.4s, v2.4s, v0.4s
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = xor <4 x i32> %x, <i32 -1, i32 -1, i32 -1, i32 -1>		%a = xor <4 x i32> %x, <i32 -1, i32 -1, i32 -1, i32 -1>
%b = xor <4 x i32> %y, <i32 -1, i32 -1, i32 -1, i32 -1>		%b = xor <4 x i32> %y, <i32 -1, i32 -1, i32 -1, i32 -1>
%c = xor <4 x i32> %z, <i32 -1, i32 -1, i32 -1, i32 -1>		%c = xor <4 x i32> %z, <i32 -1, i32 -1, i32 -1, i32 -1>
%cmp_bc = icmp slt <4 x i32> %b, %c		%cmp_bc = icmp slt <4 x i32> %b, %c
▲ Show 20 Lines • Show All 48 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%r = select <4 x i1> %cmp_ac, <4 x i32> %min_ab, <4 x i32> %min_cb		%r = select <4 x i1> %cmp_ac, <4 x i32> %min_ab, <4 x i32> %min_cb
ret <4 x i32> %r		ret <4 x i32> %r
}		}

define <4 x i32> @notted_smin_bc_ab_eq_pred(<4 x i32> %x, <4 x i32> %y, <4 x i32> %z) {		define <4 x i32> @notted_smin_bc_ab_eq_pred(<4 x i32> %x, <4 x i32> %y, <4 x i32> %z) {
; CHECK-LABEL: notted_smin_bc_ab_eq_pred:		; CHECK-LABEL: notted_smin_bc_ab_eq_pred:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: mvn v1.16b, v1.16b		; CHECK-NEXT: mvn v1.16b, v1.16b
; CHECK-NEXT: mvn v2.16b, v2.16b
; CHECK-NEXT: mvn v0.16b, v0.16b		; CHECK-NEXT: mvn v0.16b, v0.16b
		; CHECK-NEXT: mvn v2.16b, v2.16b
; CHECK-NEXT: smin v2.4s, v1.4s, v2.4s		; CHECK-NEXT: smin v2.4s, v1.4s, v2.4s
; CHECK-NEXT: smin v0.4s, v0.4s, v1.4s		; CHECK-NEXT: smin v0.4s, v0.4s, v1.4s
; CHECK-NEXT: smin v0.4s, v2.4s, v0.4s		; CHECK-NEXT: smin v0.4s, v2.4s, v0.4s
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = xor <4 x i32> %x, <i32 -1, i32 -1, i32 -1, i32 -1>		%a = xor <4 x i32> %x, <i32 -1, i32 -1, i32 -1, i32 -1>
%b = xor <4 x i32> %y, <i32 -1, i32 -1, i32 -1, i32 -1>		%b = xor <4 x i32> %y, <i32 -1, i32 -1, i32 -1, i32 -1>
%c = xor <4 x i32> %z, <i32 -1, i32 -1, i32 -1, i32 -1>		%c = xor <4 x i32> %z, <i32 -1, i32 -1, i32 -1, i32 -1>
%cmp_bc = icmp slt <4 x i32> %b, %c		%cmp_bc = icmp slt <4 x i32> %b, %c
%min_bc = select <4 x i1> %cmp_bc, <4 x i32> %b, <4 x i32> %c		%min_bc = select <4 x i1> %cmp_bc, <4 x i32> %b, <4 x i32> %c
%cmp_ab = icmp slt <4 x i32> %a, %b		%cmp_ab = icmp slt <4 x i32> %a, %b
%min_ab = select <4 x i1> %cmp_ab, <4 x i32> %a, <4 x i32> %b		%min_ab = select <4 x i1> %cmp_ab, <4 x i32> %a, <4 x i32> %b
%cmp_ca = icmp sle <4 x i32> %x, %z		%cmp_ca = icmp sle <4 x i32> %x, %z
%r = select <4 x i1> %cmp_ca, <4 x i32> %min_bc, <4 x i32> %min_ab		%r = select <4 x i1> %cmp_ca, <4 x i32> %min_bc, <4 x i32> %min_ab
ret <4 x i32> %r		ret <4 x i32> %r
}		}

define <4 x i32> @notted_smin_bc_ba_eq_pred(<4 x i32> %x, <4 x i32> %y, <4 x i32> %z) {		define <4 x i32> @notted_smin_bc_ba_eq_pred(<4 x i32> %x, <4 x i32> %y, <4 x i32> %z) {
; CHECK-LABEL: notted_smin_bc_ba_eq_pred:		; CHECK-LABEL: notted_smin_bc_ba_eq_pred:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: mvn v1.16b, v1.16b		; CHECK-NEXT: mvn v1.16b, v1.16b
; CHECK-NEXT: mvn v2.16b, v2.16b
; CHECK-NEXT: mvn v0.16b, v0.16b		; CHECK-NEXT: mvn v0.16b, v0.16b
		; CHECK-NEXT: mvn v2.16b, v2.16b
; CHECK-NEXT: smin v2.4s, v1.4s, v2.4s		; CHECK-NEXT: smin v2.4s, v1.4s, v2.4s
; CHECK-NEXT: smin v0.4s, v1.4s, v0.4s		; CHECK-NEXT: smin v0.4s, v1.4s, v0.4s
; CHECK-NEXT: smin v0.4s, v2.4s, v0.4s		; CHECK-NEXT: smin v0.4s, v2.4s, v0.4s
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = xor <4 x i32> %x, <i32 -1, i32 -1, i32 -1, i32 -1>		%a = xor <4 x i32> %x, <i32 -1, i32 -1, i32 -1, i32 -1>
%b = xor <4 x i32> %y, <i32 -1, i32 -1, i32 -1, i32 -1>		%b = xor <4 x i32> %y, <i32 -1, i32 -1, i32 -1, i32 -1>
%c = xor <4 x i32> %z, <i32 -1, i32 -1, i32 -1, i32 -1>		%c = xor <4 x i32> %z, <i32 -1, i32 -1, i32 -1, i32 -1>
%cmp_bc = icmp slt <4 x i32> %b, %c		%cmp_bc = icmp slt <4 x i32> %b, %c
▲ Show 20 Lines • Show All 48 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%r = select <4 x i1> %cmp_ac, <4 x i32> %min_ab, <4 x i32> %min_cb		%r = select <4 x i1> %cmp_ac, <4 x i32> %min_ab, <4 x i32> %min_cb
ret <4 x i32> %r		ret <4 x i32> %r
}		}

define <4 x i32> @notted_smin_bc_ab_eq_swap_pred(<4 x i32> %x, <4 x i32> %y, <4 x i32> %z) {		define <4 x i32> @notted_smin_bc_ab_eq_swap_pred(<4 x i32> %x, <4 x i32> %y, <4 x i32> %z) {
; CHECK-LABEL: notted_smin_bc_ab_eq_swap_pred:		; CHECK-LABEL: notted_smin_bc_ab_eq_swap_pred:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: mvn v1.16b, v1.16b		; CHECK-NEXT: mvn v1.16b, v1.16b
; CHECK-NEXT: mvn v2.16b, v2.16b
; CHECK-NEXT: mvn v0.16b, v0.16b		; CHECK-NEXT: mvn v0.16b, v0.16b
		; CHECK-NEXT: mvn v2.16b, v2.16b
; CHECK-NEXT: smin v2.4s, v1.4s, v2.4s		; CHECK-NEXT: smin v2.4s, v1.4s, v2.4s
; CHECK-NEXT: smin v0.4s, v0.4s, v1.4s		; CHECK-NEXT: smin v0.4s, v0.4s, v1.4s
; CHECK-NEXT: smin v0.4s, v2.4s, v0.4s		; CHECK-NEXT: smin v0.4s, v2.4s, v0.4s
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = xor <4 x i32> %x, <i32 -1, i32 -1, i32 -1, i32 -1>		%a = xor <4 x i32> %x, <i32 -1, i32 -1, i32 -1, i32 -1>
%b = xor <4 x i32> %y, <i32 -1, i32 -1, i32 -1, i32 -1>		%b = xor <4 x i32> %y, <i32 -1, i32 -1, i32 -1, i32 -1>
%c = xor <4 x i32> %z, <i32 -1, i32 -1, i32 -1, i32 -1>		%c = xor <4 x i32> %z, <i32 -1, i32 -1, i32 -1, i32 -1>
%cmp_bc = icmp slt <4 x i32> %b, %c		%cmp_bc = icmp slt <4 x i32> %b, %c
%min_bc = select <4 x i1> %cmp_bc, <4 x i32> %b, <4 x i32> %c		%min_bc = select <4 x i1> %cmp_bc, <4 x i32> %b, <4 x i32> %c
%cmp_ab = icmp slt <4 x i32> %a, %b		%cmp_ab = icmp slt <4 x i32> %a, %b
%min_ab = select <4 x i1> %cmp_ab, <4 x i32> %a, <4 x i32> %b		%min_ab = select <4 x i1> %cmp_ab, <4 x i32> %a, <4 x i32> %b
%cmp_ca = icmp sge <4 x i32> %z, %x		%cmp_ca = icmp sge <4 x i32> %z, %x
%r = select <4 x i1> %cmp_ca, <4 x i32> %min_bc, <4 x i32> %min_ab		%r = select <4 x i1> %cmp_ca, <4 x i32> %min_bc, <4 x i32> %min_ab
ret <4 x i32> %r		ret <4 x i32> %r
}		}

define <4 x i32> @notted_smin_bc_ba_eq_swap_pred(<4 x i32> %x, <4 x i32> %y, <4 x i32> %z) {		define <4 x i32> @notted_smin_bc_ba_eq_swap_pred(<4 x i32> %x, <4 x i32> %y, <4 x i32> %z) {
; CHECK-LABEL: notted_smin_bc_ba_eq_swap_pred:		; CHECK-LABEL: notted_smin_bc_ba_eq_swap_pred:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: mvn v1.16b, v1.16b		; CHECK-NEXT: mvn v1.16b, v1.16b
; CHECK-NEXT: mvn v2.16b, v2.16b
; CHECK-NEXT: mvn v0.16b, v0.16b		; CHECK-NEXT: mvn v0.16b, v0.16b
		; CHECK-NEXT: mvn v2.16b, v2.16b
; CHECK-NEXT: smin v2.4s, v1.4s, v2.4s		; CHECK-NEXT: smin v2.4s, v1.4s, v2.4s
; CHECK-NEXT: smin v0.4s, v1.4s, v0.4s		; CHECK-NEXT: smin v0.4s, v1.4s, v0.4s
; CHECK-NEXT: smin v0.4s, v2.4s, v0.4s		; CHECK-NEXT: smin v0.4s, v2.4s, v0.4s
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = xor <4 x i32> %x, <i32 -1, i32 -1, i32 -1, i32 -1>		%a = xor <4 x i32> %x, <i32 -1, i32 -1, i32 -1, i32 -1>
%b = xor <4 x i32> %y, <i32 -1, i32 -1, i32 -1, i32 -1>		%b = xor <4 x i32> %y, <i32 -1, i32 -1, i32 -1, i32 -1>
%c = xor <4 x i32> %z, <i32 -1, i32 -1, i32 -1, i32 -1>		%c = xor <4 x i32> %z, <i32 -1, i32 -1, i32 -1, i32 -1>
%cmp_bc = icmp slt <4 x i32> %b, %c		%cmp_bc = icmp slt <4 x i32> %b, %c
▲ Show 20 Lines • Show All 48 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%r = select <4 x i1> %cmp_ac, <4 x i32> %min_ab, <4 x i32> %min_cb		%r = select <4 x i1> %cmp_ac, <4 x i32> %min_ab, <4 x i32> %min_cb
ret <4 x i32> %r		ret <4 x i32> %r
}		}

define <4 x i32> @notted_smax_bc_ab(<4 x i32> %x, <4 x i32> %y, <4 x i32> %z) {		define <4 x i32> @notted_smax_bc_ab(<4 x i32> %x, <4 x i32> %y, <4 x i32> %z) {
; CHECK-LABEL: notted_smax_bc_ab:		; CHECK-LABEL: notted_smax_bc_ab:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: mvn v1.16b, v1.16b		; CHECK-NEXT: mvn v1.16b, v1.16b
; CHECK-NEXT: mvn v2.16b, v2.16b
; CHECK-NEXT: mvn v0.16b, v0.16b		; CHECK-NEXT: mvn v0.16b, v0.16b
		; CHECK-NEXT: mvn v2.16b, v2.16b
; CHECK-NEXT: smax v2.4s, v1.4s, v2.4s		; CHECK-NEXT: smax v2.4s, v1.4s, v2.4s
; CHECK-NEXT: smax v0.4s, v0.4s, v1.4s		; CHECK-NEXT: smax v0.4s, v0.4s, v1.4s
; CHECK-NEXT: smax v0.4s, v2.4s, v0.4s		; CHECK-NEXT: smax v0.4s, v2.4s, v0.4s
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = xor <4 x i32> %x, <i32 -1, i32 -1, i32 -1, i32 -1>		%a = xor <4 x i32> %x, <i32 -1, i32 -1, i32 -1, i32 -1>
%b = xor <4 x i32> %y, <i32 -1, i32 -1, i32 -1, i32 -1>		%b = xor <4 x i32> %y, <i32 -1, i32 -1, i32 -1, i32 -1>
%c = xor <4 x i32> %z, <i32 -1, i32 -1, i32 -1, i32 -1>		%c = xor <4 x i32> %z, <i32 -1, i32 -1, i32 -1, i32 -1>
%cmp_bc = icmp sgt <4 x i32> %b, %c		%cmp_bc = icmp sgt <4 x i32> %b, %c
%min_bc = select <4 x i1> %cmp_bc, <4 x i32> %b, <4 x i32> %c		%min_bc = select <4 x i1> %cmp_bc, <4 x i32> %b, <4 x i32> %c
%cmp_ab = icmp sgt <4 x i32> %a, %b		%cmp_ab = icmp sgt <4 x i32> %a, %b
%min_ab = select <4 x i1> %cmp_ab, <4 x i32> %a, <4 x i32> %b		%min_ab = select <4 x i1> %cmp_ab, <4 x i32> %a, <4 x i32> %b
%cmp_ca = icmp sgt <4 x i32> %x, %z		%cmp_ca = icmp sgt <4 x i32> %x, %z
%r = select <4 x i1> %cmp_ca, <4 x i32> %min_bc, <4 x i32> %min_ab		%r = select <4 x i1> %cmp_ca, <4 x i32> %min_bc, <4 x i32> %min_ab
ret <4 x i32> %r		ret <4 x i32> %r
}		}

define <4 x i32> @notted_smax_bc_ba(<4 x i32> %x, <4 x i32> %y, <4 x i32> %z) {		define <4 x i32> @notted_smax_bc_ba(<4 x i32> %x, <4 x i32> %y, <4 x i32> %z) {
; CHECK-LABEL: notted_smax_bc_ba:		; CHECK-LABEL: notted_smax_bc_ba:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: mvn v1.16b, v1.16b		; CHECK-NEXT: mvn v1.16b, v1.16b
; CHECK-NEXT: mvn v2.16b, v2.16b
; CHECK-NEXT: mvn v0.16b, v0.16b		; CHECK-NEXT: mvn v0.16b, v0.16b
		; CHECK-NEXT: mvn v2.16b, v2.16b
; CHECK-NEXT: smax v2.4s, v1.4s, v2.4s		; CHECK-NEXT: smax v2.4s, v1.4s, v2.4s
; CHECK-NEXT: smax v0.4s, v1.4s, v0.4s		; CHECK-NEXT: smax v0.4s, v1.4s, v0.4s
; CHECK-NEXT: smax v0.4s, v2.4s, v0.4s		; CHECK-NEXT: smax v0.4s, v2.4s, v0.4s
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = xor <4 x i32> %x, <i32 -1, i32 -1, i32 -1, i32 -1>		%a = xor <4 x i32> %x, <i32 -1, i32 -1, i32 -1, i32 -1>
%b = xor <4 x i32> %y, <i32 -1, i32 -1, i32 -1, i32 -1>		%b = xor <4 x i32> %y, <i32 -1, i32 -1, i32 -1, i32 -1>
%c = xor <4 x i32> %z, <i32 -1, i32 -1, i32 -1, i32 -1>		%c = xor <4 x i32> %z, <i32 -1, i32 -1, i32 -1, i32 -1>
%cmp_bc = icmp sgt <4 x i32> %b, %c		%cmp_bc = icmp sgt <4 x i32> %b, %c
▲ Show 20 Lines • Show All 48 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%r = select <4 x i1> %cmp_ac, <4 x i32> %min_ab, <4 x i32> %min_cb		%r = select <4 x i1> %cmp_ac, <4 x i32> %min_ab, <4 x i32> %min_cb
ret <4 x i32> %r		ret <4 x i32> %r
}		}

define <4 x i32> @notted_smax_bc_ab_swap_pred(<4 x i32> %x, <4 x i32> %y, <4 x i32> %z) {		define <4 x i32> @notted_smax_bc_ab_swap_pred(<4 x i32> %x, <4 x i32> %y, <4 x i32> %z) {
; CHECK-LABEL: notted_smax_bc_ab_swap_pred:		; CHECK-LABEL: notted_smax_bc_ab_swap_pred:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: mvn v1.16b, v1.16b		; CHECK-NEXT: mvn v1.16b, v1.16b
; CHECK-NEXT: mvn v2.16b, v2.16b
; CHECK-NEXT: mvn v0.16b, v0.16b		; CHECK-NEXT: mvn v0.16b, v0.16b
		; CHECK-NEXT: mvn v2.16b, v2.16b
; CHECK-NEXT: smax v2.4s, v1.4s, v2.4s		; CHECK-NEXT: smax v2.4s, v1.4s, v2.4s
; CHECK-NEXT: smax v0.4s, v0.4s, v1.4s		; CHECK-NEXT: smax v0.4s, v0.4s, v1.4s
; CHECK-NEXT: smax v0.4s, v2.4s, v0.4s		; CHECK-NEXT: smax v0.4s, v2.4s, v0.4s
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = xor <4 x i32> %x, <i32 -1, i32 -1, i32 -1, i32 -1>		%a = xor <4 x i32> %x, <i32 -1, i32 -1, i32 -1, i32 -1>
%b = xor <4 x i32> %y, <i32 -1, i32 -1, i32 -1, i32 -1>		%b = xor <4 x i32> %y, <i32 -1, i32 -1, i32 -1, i32 -1>
%c = xor <4 x i32> %z, <i32 -1, i32 -1, i32 -1, i32 -1>		%c = xor <4 x i32> %z, <i32 -1, i32 -1, i32 -1, i32 -1>
%cmp_bc = icmp sgt <4 x i32> %b, %c		%cmp_bc = icmp sgt <4 x i32> %b, %c
%min_bc = select <4 x i1> %cmp_bc, <4 x i32> %b, <4 x i32> %c		%min_bc = select <4 x i1> %cmp_bc, <4 x i32> %b, <4 x i32> %c
%cmp_ab = icmp sgt <4 x i32> %a, %b		%cmp_ab = icmp sgt <4 x i32> %a, %b
%min_ab = select <4 x i1> %cmp_ab, <4 x i32> %a, <4 x i32> %b		%min_ab = select <4 x i1> %cmp_ab, <4 x i32> %a, <4 x i32> %b
%cmp_ca = icmp slt <4 x i32> %z, %x		%cmp_ca = icmp slt <4 x i32> %z, %x
%r = select <4 x i1> %cmp_ca, <4 x i32> %min_bc, <4 x i32> %min_ab		%r = select <4 x i1> %cmp_ca, <4 x i32> %min_bc, <4 x i32> %min_ab
ret <4 x i32> %r		ret <4 x i32> %r
}		}

define <4 x i32> @notted_smax_bc_ba_swap_pred(<4 x i32> %x, <4 x i32> %y, <4 x i32> %z) {		define <4 x i32> @notted_smax_bc_ba_swap_pred(<4 x i32> %x, <4 x i32> %y, <4 x i32> %z) {
; CHECK-LABEL: notted_smax_bc_ba_swap_pred:		; CHECK-LABEL: notted_smax_bc_ba_swap_pred:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: mvn v1.16b, v1.16b		; CHECK-NEXT: mvn v1.16b, v1.16b
; CHECK-NEXT: mvn v2.16b, v2.16b
; CHECK-NEXT: mvn v0.16b, v0.16b		; CHECK-NEXT: mvn v0.16b, v0.16b
		; CHECK-NEXT: mvn v2.16b, v2.16b
; CHECK-NEXT: smax v2.4s, v1.4s, v2.4s		; CHECK-NEXT: smax v2.4s, v1.4s, v2.4s
; CHECK-NEXT: smax v0.4s, v1.4s, v0.4s		; CHECK-NEXT: smax v0.4s, v1.4s, v0.4s
; CHECK-NEXT: smax v0.4s, v2.4s, v0.4s		; CHECK-NEXT: smax v0.4s, v2.4s, v0.4s
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = xor <4 x i32> %x, <i32 -1, i32 -1, i32 -1, i32 -1>		%a = xor <4 x i32> %x, <i32 -1, i32 -1, i32 -1, i32 -1>
%b = xor <4 x i32> %y, <i32 -1, i32 -1, i32 -1, i32 -1>		%b = xor <4 x i32> %y, <i32 -1, i32 -1, i32 -1, i32 -1>
%c = xor <4 x i32> %z, <i32 -1, i32 -1, i32 -1, i32 -1>		%c = xor <4 x i32> %z, <i32 -1, i32 -1, i32 -1, i32 -1>
%cmp_bc = icmp sgt <4 x i32> %b, %c		%cmp_bc = icmp sgt <4 x i32> %b, %c
▲ Show 20 Lines • Show All 48 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%r = select <4 x i1> %cmp_ac, <4 x i32> %min_ab, <4 x i32> %min_cb		%r = select <4 x i1> %cmp_ac, <4 x i32> %min_ab, <4 x i32> %min_cb
ret <4 x i32> %r		ret <4 x i32> %r
}		}

define <4 x i32> @notted_smax_bc_ab_eq_pred(<4 x i32> %x, <4 x i32> %y, <4 x i32> %z) {		define <4 x i32> @notted_smax_bc_ab_eq_pred(<4 x i32> %x, <4 x i32> %y, <4 x i32> %z) {
; CHECK-LABEL: notted_smax_bc_ab_eq_pred:		; CHECK-LABEL: notted_smax_bc_ab_eq_pred:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: mvn v1.16b, v1.16b		; CHECK-NEXT: mvn v1.16b, v1.16b
; CHECK-NEXT: mvn v2.16b, v2.16b
; CHECK-NEXT: mvn v0.16b, v0.16b		; CHECK-NEXT: mvn v0.16b, v0.16b
		; CHECK-NEXT: mvn v2.16b, v2.16b
; CHECK-NEXT: smax v2.4s, v1.4s, v2.4s		; CHECK-NEXT: smax v2.4s, v1.4s, v2.4s
; CHECK-NEXT: smax v0.4s, v0.4s, v1.4s		; CHECK-NEXT: smax v0.4s, v0.4s, v1.4s
; CHECK-NEXT: smax v0.4s, v2.4s, v0.4s		; CHECK-NEXT: smax v0.4s, v2.4s, v0.4s
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = xor <4 x i32> %x, <i32 -1, i32 -1, i32 -1, i32 -1>		%a = xor <4 x i32> %x, <i32 -1, i32 -1, i32 -1, i32 -1>
%b = xor <4 x i32> %y, <i32 -1, i32 -1, i32 -1, i32 -1>		%b = xor <4 x i32> %y, <i32 -1, i32 -1, i32 -1, i32 -1>
%c = xor <4 x i32> %z, <i32 -1, i32 -1, i32 -1, i32 -1>		%c = xor <4 x i32> %z, <i32 -1, i32 -1, i32 -1, i32 -1>
%cmp_bc = icmp sgt <4 x i32> %b, %c		%cmp_bc = icmp sgt <4 x i32> %b, %c
%min_bc = select <4 x i1> %cmp_bc, <4 x i32> %b, <4 x i32> %c		%min_bc = select <4 x i1> %cmp_bc, <4 x i32> %b, <4 x i32> %c
%cmp_ab = icmp sgt <4 x i32> %a, %b		%cmp_ab = icmp sgt <4 x i32> %a, %b
%min_ab = select <4 x i1> %cmp_ab, <4 x i32> %a, <4 x i32> %b		%min_ab = select <4 x i1> %cmp_ab, <4 x i32> %a, <4 x i32> %b
%cmp_ca = icmp sge <4 x i32> %x, %z		%cmp_ca = icmp sge <4 x i32> %x, %z
%r = select <4 x i1> %cmp_ca, <4 x i32> %min_bc, <4 x i32> %min_ab		%r = select <4 x i1> %cmp_ca, <4 x i32> %min_bc, <4 x i32> %min_ab
ret <4 x i32> %r		ret <4 x i32> %r
}		}

define <4 x i32> @notted_smax_bc_ba_eq_pred(<4 x i32> %x, <4 x i32> %y, <4 x i32> %z) {		define <4 x i32> @notted_smax_bc_ba_eq_pred(<4 x i32> %x, <4 x i32> %y, <4 x i32> %z) {
; CHECK-LABEL: notted_smax_bc_ba_eq_pred:		; CHECK-LABEL: notted_smax_bc_ba_eq_pred:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: mvn v1.16b, v1.16b		; CHECK-NEXT: mvn v1.16b, v1.16b
; CHECK-NEXT: mvn v2.16b, v2.16b
; CHECK-NEXT: mvn v0.16b, v0.16b		; CHECK-NEXT: mvn v0.16b, v0.16b
		; CHECK-NEXT: mvn v2.16b, v2.16b
; CHECK-NEXT: smax v2.4s, v1.4s, v2.4s		; CHECK-NEXT: smax v2.4s, v1.4s, v2.4s
; CHECK-NEXT: smax v0.4s, v1.4s, v0.4s		; CHECK-NEXT: smax v0.4s, v1.4s, v0.4s
; CHECK-NEXT: smax v0.4s, v2.4s, v0.4s		; CHECK-NEXT: smax v0.4s, v2.4s, v0.4s
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = xor <4 x i32> %x, <i32 -1, i32 -1, i32 -1, i32 -1>		%a = xor <4 x i32> %x, <i32 -1, i32 -1, i32 -1, i32 -1>
%b = xor <4 x i32> %y, <i32 -1, i32 -1, i32 -1, i32 -1>		%b = xor <4 x i32> %y, <i32 -1, i32 -1, i32 -1, i32 -1>
%c = xor <4 x i32> %z, <i32 -1, i32 -1, i32 -1, i32 -1>		%c = xor <4 x i32> %z, <i32 -1, i32 -1, i32 -1, i32 -1>
%cmp_bc = icmp sgt <4 x i32> %b, %c		%cmp_bc = icmp sgt <4 x i32> %b, %c
▲ Show 20 Lines • Show All 48 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%r = select <4 x i1> %cmp_ac, <4 x i32> %min_ab, <4 x i32> %min_cb		%r = select <4 x i1> %cmp_ac, <4 x i32> %min_ab, <4 x i32> %min_cb
ret <4 x i32> %r		ret <4 x i32> %r
}		}

define <4 x i32> @notted_smax_bc_ab_eq_swap_pred(<4 x i32> %x, <4 x i32> %y, <4 x i32> %z) {		define <4 x i32> @notted_smax_bc_ab_eq_swap_pred(<4 x i32> %x, <4 x i32> %y, <4 x i32> %z) {
; CHECK-LABEL: notted_smax_bc_ab_eq_swap_pred:		; CHECK-LABEL: notted_smax_bc_ab_eq_swap_pred:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: mvn v1.16b, v1.16b		; CHECK-NEXT: mvn v1.16b, v1.16b
; CHECK-NEXT: mvn v2.16b, v2.16b
; CHECK-NEXT: mvn v0.16b, v0.16b		; CHECK-NEXT: mvn v0.16b, v0.16b
		; CHECK-NEXT: mvn v2.16b, v2.16b
; CHECK-NEXT: smax v2.4s, v1.4s, v2.4s		; CHECK-NEXT: smax v2.4s, v1.4s, v2.4s
; CHECK-NEXT: smax v0.4s, v0.4s, v1.4s		; CHECK-NEXT: smax v0.4s, v0.4s, v1.4s
; CHECK-NEXT: smax v0.4s, v2.4s, v0.4s		; CHECK-NEXT: smax v0.4s, v2.4s, v0.4s
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = xor <4 x i32> %x, <i32 -1, i32 -1, i32 -1, i32 -1>		%a = xor <4 x i32> %x, <i32 -1, i32 -1, i32 -1, i32 -1>
%b = xor <4 x i32> %y, <i32 -1, i32 -1, i32 -1, i32 -1>		%b = xor <4 x i32> %y, <i32 -1, i32 -1, i32 -1, i32 -1>
%c = xor <4 x i32> %z, <i32 -1, i32 -1, i32 -1, i32 -1>		%c = xor <4 x i32> %z, <i32 -1, i32 -1, i32 -1, i32 -1>
%cmp_bc = icmp sgt <4 x i32> %b, %c		%cmp_bc = icmp sgt <4 x i32> %b, %c
%min_bc = select <4 x i1> %cmp_bc, <4 x i32> %b, <4 x i32> %c		%min_bc = select <4 x i1> %cmp_bc, <4 x i32> %b, <4 x i32> %c
%cmp_ab = icmp sgt <4 x i32> %a, %b		%cmp_ab = icmp sgt <4 x i32> %a, %b
%min_ab = select <4 x i1> %cmp_ab, <4 x i32> %a, <4 x i32> %b		%min_ab = select <4 x i1> %cmp_ab, <4 x i32> %a, <4 x i32> %b
%cmp_ca = icmp sle <4 x i32> %z, %x		%cmp_ca = icmp sle <4 x i32> %z, %x
%r = select <4 x i1> %cmp_ca, <4 x i32> %min_bc, <4 x i32> %min_ab		%r = select <4 x i1> %cmp_ca, <4 x i32> %min_bc, <4 x i32> %min_ab
ret <4 x i32> %r		ret <4 x i32> %r
}		}

define <4 x i32> @notted_smax_bc_ba_eq_swap_pred(<4 x i32> %x, <4 x i32> %y, <4 x i32> %z) {		define <4 x i32> @notted_smax_bc_ba_eq_swap_pred(<4 x i32> %x, <4 x i32> %y, <4 x i32> %z) {
; CHECK-LABEL: notted_smax_bc_ba_eq_swap_pred:		; CHECK-LABEL: notted_smax_bc_ba_eq_swap_pred:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: mvn v1.16b, v1.16b		; CHECK-NEXT: mvn v1.16b, v1.16b
; CHECK-NEXT: mvn v2.16b, v2.16b
; CHECK-NEXT: mvn v0.16b, v0.16b		; CHECK-NEXT: mvn v0.16b, v0.16b
		; CHECK-NEXT: mvn v2.16b, v2.16b
; CHECK-NEXT: smax v2.4s, v1.4s, v2.4s		; CHECK-NEXT: smax v2.4s, v1.4s, v2.4s
; CHECK-NEXT: smax v0.4s, v1.4s, v0.4s		; CHECK-NEXT: smax v0.4s, v1.4s, v0.4s
; CHECK-NEXT: smax v0.4s, v2.4s, v0.4s		; CHECK-NEXT: smax v0.4s, v2.4s, v0.4s
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = xor <4 x i32> %x, <i32 -1, i32 -1, i32 -1, i32 -1>		%a = xor <4 x i32> %x, <i32 -1, i32 -1, i32 -1, i32 -1>
%b = xor <4 x i32> %y, <i32 -1, i32 -1, i32 -1, i32 -1>		%b = xor <4 x i32> %y, <i32 -1, i32 -1, i32 -1, i32 -1>
%c = xor <4 x i32> %z, <i32 -1, i32 -1, i32 -1, i32 -1>		%c = xor <4 x i32> %z, <i32 -1, i32 -1, i32 -1, i32 -1>
%cmp_bc = icmp sgt <4 x i32> %b, %c		%cmp_bc = icmp sgt <4 x i32> %b, %c
▲ Show 20 Lines • Show All 48 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%r = select <4 x i1> %cmp_ac, <4 x i32> %min_ab, <4 x i32> %min_cb		%r = select <4 x i1> %cmp_ac, <4 x i32> %min_ab, <4 x i32> %min_cb
ret <4 x i32> %r		ret <4 x i32> %r
}		}

define <4 x i32> @notted_umin_bc_ab(<4 x i32> %x, <4 x i32> %y, <4 x i32> %z) {		define <4 x i32> @notted_umin_bc_ab(<4 x i32> %x, <4 x i32> %y, <4 x i32> %z) {
; CHECK-LABEL: notted_umin_bc_ab:		; CHECK-LABEL: notted_umin_bc_ab:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: mvn v1.16b, v1.16b		; CHECK-NEXT: mvn v1.16b, v1.16b
; CHECK-NEXT: mvn v2.16b, v2.16b
; CHECK-NEXT: mvn v0.16b, v0.16b		; CHECK-NEXT: mvn v0.16b, v0.16b
		; CHECK-NEXT: mvn v2.16b, v2.16b
; CHECK-NEXT: umin v2.4s, v1.4s, v2.4s		; CHECK-NEXT: umin v2.4s, v1.4s, v2.4s
; CHECK-NEXT: umin v0.4s, v0.4s, v1.4s		; CHECK-NEXT: umin v0.4s, v0.4s, v1.4s
; CHECK-NEXT: umin v0.4s, v2.4s, v0.4s		; CHECK-NEXT: umin v0.4s, v2.4s, v0.4s
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = xor <4 x i32> %x, <i32 -1, i32 -1, i32 -1, i32 -1>		%a = xor <4 x i32> %x, <i32 -1, i32 -1, i32 -1, i32 -1>
%b = xor <4 x i32> %y, <i32 -1, i32 -1, i32 -1, i32 -1>		%b = xor <4 x i32> %y, <i32 -1, i32 -1, i32 -1, i32 -1>
%c = xor <4 x i32> %z, <i32 -1, i32 -1, i32 -1, i32 -1>		%c = xor <4 x i32> %z, <i32 -1, i32 -1, i32 -1, i32 -1>
%cmp_bc = icmp ult <4 x i32> %b, %c		%cmp_bc = icmp ult <4 x i32> %b, %c
%min_bc = select <4 x i1> %cmp_bc, <4 x i32> %b, <4 x i32> %c		%min_bc = select <4 x i1> %cmp_bc, <4 x i32> %b, <4 x i32> %c
%cmp_ab = icmp ult <4 x i32> %a, %b		%cmp_ab = icmp ult <4 x i32> %a, %b
%min_ab = select <4 x i1> %cmp_ab, <4 x i32> %a, <4 x i32> %b		%min_ab = select <4 x i1> %cmp_ab, <4 x i32> %a, <4 x i32> %b
%cmp_ca = icmp ult <4 x i32> %x, %z		%cmp_ca = icmp ult <4 x i32> %x, %z
%r = select <4 x i1> %cmp_ca, <4 x i32> %min_bc, <4 x i32> %min_ab		%r = select <4 x i1> %cmp_ca, <4 x i32> %min_bc, <4 x i32> %min_ab
ret <4 x i32> %r		ret <4 x i32> %r
}		}

define <4 x i32> @notted_umin_bc_ba(<4 x i32> %x, <4 x i32> %y, <4 x i32> %z) {		define <4 x i32> @notted_umin_bc_ba(<4 x i32> %x, <4 x i32> %y, <4 x i32> %z) {
; CHECK-LABEL: notted_umin_bc_ba:		; CHECK-LABEL: notted_umin_bc_ba:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: mvn v1.16b, v1.16b		; CHECK-NEXT: mvn v1.16b, v1.16b
; CHECK-NEXT: mvn v2.16b, v2.16b
; CHECK-NEXT: mvn v0.16b, v0.16b		; CHECK-NEXT: mvn v0.16b, v0.16b
		; CHECK-NEXT: mvn v2.16b, v2.16b
; CHECK-NEXT: umin v2.4s, v1.4s, v2.4s		; CHECK-NEXT: umin v2.4s, v1.4s, v2.4s
; CHECK-NEXT: umin v0.4s, v1.4s, v0.4s		; CHECK-NEXT: umin v0.4s, v1.4s, v0.4s
; CHECK-NEXT: umin v0.4s, v2.4s, v0.4s		; CHECK-NEXT: umin v0.4s, v2.4s, v0.4s
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = xor <4 x i32> %x, <i32 -1, i32 -1, i32 -1, i32 -1>		%a = xor <4 x i32> %x, <i32 -1, i32 -1, i32 -1, i32 -1>
%b = xor <4 x i32> %y, <i32 -1, i32 -1, i32 -1, i32 -1>		%b = xor <4 x i32> %y, <i32 -1, i32 -1, i32 -1, i32 -1>
%c = xor <4 x i32> %z, <i32 -1, i32 -1, i32 -1, i32 -1>		%c = xor <4 x i32> %z, <i32 -1, i32 -1, i32 -1, i32 -1>
%cmp_bc = icmp ult <4 x i32> %b, %c		%cmp_bc = icmp ult <4 x i32> %b, %c
▲ Show 20 Lines • Show All 48 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%r = select <4 x i1> %cmp_ac, <4 x i32> %min_ab, <4 x i32> %min_cb		%r = select <4 x i1> %cmp_ac, <4 x i32> %min_ab, <4 x i32> %min_cb
ret <4 x i32> %r		ret <4 x i32> %r
}		}

define <4 x i32> @notted_umin_bc_ab_swap_pred(<4 x i32> %x, <4 x i32> %y, <4 x i32> %z) {		define <4 x i32> @notted_umin_bc_ab_swap_pred(<4 x i32> %x, <4 x i32> %y, <4 x i32> %z) {
; CHECK-LABEL: notted_umin_bc_ab_swap_pred:		; CHECK-LABEL: notted_umin_bc_ab_swap_pred:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: mvn v1.16b, v1.16b		; CHECK-NEXT: mvn v1.16b, v1.16b
; CHECK-NEXT: mvn v2.16b, v2.16b
; CHECK-NEXT: mvn v0.16b, v0.16b		; CHECK-NEXT: mvn v0.16b, v0.16b
		; CHECK-NEXT: mvn v2.16b, v2.16b
; CHECK-NEXT: umin v2.4s, v1.4s, v2.4s		; CHECK-NEXT: umin v2.4s, v1.4s, v2.4s
; CHECK-NEXT: umin v0.4s, v0.4s, v1.4s		; CHECK-NEXT: umin v0.4s, v0.4s, v1.4s
; CHECK-NEXT: umin v0.4s, v2.4s, v0.4s		; CHECK-NEXT: umin v0.4s, v2.4s, v0.4s
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = xor <4 x i32> %x, <i32 -1, i32 -1, i32 -1, i32 -1>		%a = xor <4 x i32> %x, <i32 -1, i32 -1, i32 -1, i32 -1>
%b = xor <4 x i32> %y, <i32 -1, i32 -1, i32 -1, i32 -1>		%b = xor <4 x i32> %y, <i32 -1, i32 -1, i32 -1, i32 -1>
%c = xor <4 x i32> %z, <i32 -1, i32 -1, i32 -1, i32 -1>		%c = xor <4 x i32> %z, <i32 -1, i32 -1, i32 -1, i32 -1>
%cmp_bc = icmp ult <4 x i32> %b, %c		%cmp_bc = icmp ult <4 x i32> %b, %c
%min_bc = select <4 x i1> %cmp_bc, <4 x i32> %b, <4 x i32> %c		%min_bc = select <4 x i1> %cmp_bc, <4 x i32> %b, <4 x i32> %c
%cmp_ab = icmp ult <4 x i32> %a, %b		%cmp_ab = icmp ult <4 x i32> %a, %b
%min_ab = select <4 x i1> %cmp_ab, <4 x i32> %a, <4 x i32> %b		%min_ab = select <4 x i1> %cmp_ab, <4 x i32> %a, <4 x i32> %b
%cmp_ca = icmp ugt <4 x i32> %z, %x		%cmp_ca = icmp ugt <4 x i32> %z, %x
%r = select <4 x i1> %cmp_ca, <4 x i32> %min_bc, <4 x i32> %min_ab		%r = select <4 x i1> %cmp_ca, <4 x i32> %min_bc, <4 x i32> %min_ab
ret <4 x i32> %r		ret <4 x i32> %r
}		}

define <4 x i32> @notted_umin_bc_ba_swap_pred(<4 x i32> %x, <4 x i32> %y, <4 x i32> %z) {		define <4 x i32> @notted_umin_bc_ba_swap_pred(<4 x i32> %x, <4 x i32> %y, <4 x i32> %z) {
; CHECK-LABEL: notted_umin_bc_ba_swap_pred:		; CHECK-LABEL: notted_umin_bc_ba_swap_pred:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: mvn v1.16b, v1.16b		; CHECK-NEXT: mvn v1.16b, v1.16b
; CHECK-NEXT: mvn v2.16b, v2.16b
; CHECK-NEXT: mvn v0.16b, v0.16b		; CHECK-NEXT: mvn v0.16b, v0.16b
		; CHECK-NEXT: mvn v2.16b, v2.16b
; CHECK-NEXT: umin v2.4s, v1.4s, v2.4s		; CHECK-NEXT: umin v2.4s, v1.4s, v2.4s
; CHECK-NEXT: umin v0.4s, v1.4s, v0.4s		; CHECK-NEXT: umin v0.4s, v1.4s, v0.4s
; CHECK-NEXT: umin v0.4s, v2.4s, v0.4s		; CHECK-NEXT: umin v0.4s, v2.4s, v0.4s
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = xor <4 x i32> %x, <i32 -1, i32 -1, i32 -1, i32 -1>		%a = xor <4 x i32> %x, <i32 -1, i32 -1, i32 -1, i32 -1>
%b = xor <4 x i32> %y, <i32 -1, i32 -1, i32 -1, i32 -1>		%b = xor <4 x i32> %y, <i32 -1, i32 -1, i32 -1, i32 -1>
%c = xor <4 x i32> %z, <i32 -1, i32 -1, i32 -1, i32 -1>		%c = xor <4 x i32> %z, <i32 -1, i32 -1, i32 -1, i32 -1>
%cmp_bc = icmp ult <4 x i32> %b, %c		%cmp_bc = icmp ult <4 x i32> %b, %c
▲ Show 20 Lines • Show All 48 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%r = select <4 x i1> %cmp_ac, <4 x i32> %min_ab, <4 x i32> %min_cb		%r = select <4 x i1> %cmp_ac, <4 x i32> %min_ab, <4 x i32> %min_cb
ret <4 x i32> %r		ret <4 x i32> %r
}		}

define <4 x i32> @notted_umin_bc_ab_eq_pred(<4 x i32> %x, <4 x i32> %y, <4 x i32> %z) {		define <4 x i32> @notted_umin_bc_ab_eq_pred(<4 x i32> %x, <4 x i32> %y, <4 x i32> %z) {
; CHECK-LABEL: notted_umin_bc_ab_eq_pred:		; CHECK-LABEL: notted_umin_bc_ab_eq_pred:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: mvn v1.16b, v1.16b		; CHECK-NEXT: mvn v1.16b, v1.16b
; CHECK-NEXT: mvn v2.16b, v2.16b
; CHECK-NEXT: mvn v0.16b, v0.16b		; CHECK-NEXT: mvn v0.16b, v0.16b
		; CHECK-NEXT: mvn v2.16b, v2.16b
; CHECK-NEXT: umin v2.4s, v1.4s, v2.4s		; CHECK-NEXT: umin v2.4s, v1.4s, v2.4s
; CHECK-NEXT: umin v0.4s, v0.4s, v1.4s		; CHECK-NEXT: umin v0.4s, v0.4s, v1.4s
; CHECK-NEXT: umin v0.4s, v2.4s, v0.4s		; CHECK-NEXT: umin v0.4s, v2.4s, v0.4s
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = xor <4 x i32> %x, <i32 -1, i32 -1, i32 -1, i32 -1>		%a = xor <4 x i32> %x, <i32 -1, i32 -1, i32 -1, i32 -1>
%b = xor <4 x i32> %y, <i32 -1, i32 -1, i32 -1, i32 -1>		%b = xor <4 x i32> %y, <i32 -1, i32 -1, i32 -1, i32 -1>
%c = xor <4 x i32> %z, <i32 -1, i32 -1, i32 -1, i32 -1>		%c = xor <4 x i32> %z, <i32 -1, i32 -1, i32 -1, i32 -1>
%cmp_bc = icmp ult <4 x i32> %b, %c		%cmp_bc = icmp ult <4 x i32> %b, %c
%min_bc = select <4 x i1> %cmp_bc, <4 x i32> %b, <4 x i32> %c		%min_bc = select <4 x i1> %cmp_bc, <4 x i32> %b, <4 x i32> %c
%cmp_ab = icmp ult <4 x i32> %a, %b		%cmp_ab = icmp ult <4 x i32> %a, %b
%min_ab = select <4 x i1> %cmp_ab, <4 x i32> %a, <4 x i32> %b		%min_ab = select <4 x i1> %cmp_ab, <4 x i32> %a, <4 x i32> %b
%cmp_ca = icmp ule <4 x i32> %x, %z		%cmp_ca = icmp ule <4 x i32> %x, %z
%r = select <4 x i1> %cmp_ca, <4 x i32> %min_bc, <4 x i32> %min_ab		%r = select <4 x i1> %cmp_ca, <4 x i32> %min_bc, <4 x i32> %min_ab
ret <4 x i32> %r		ret <4 x i32> %r
}		}

define <4 x i32> @notted_umin_bc_ba_eq_pred(<4 x i32> %x, <4 x i32> %y, <4 x i32> %z) {		define <4 x i32> @notted_umin_bc_ba_eq_pred(<4 x i32> %x, <4 x i32> %y, <4 x i32> %z) {
; CHECK-LABEL: notted_umin_bc_ba_eq_pred:		; CHECK-LABEL: notted_umin_bc_ba_eq_pred:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: mvn v1.16b, v1.16b		; CHECK-NEXT: mvn v1.16b, v1.16b
; CHECK-NEXT: mvn v2.16b, v2.16b
; CHECK-NEXT: mvn v0.16b, v0.16b		; CHECK-NEXT: mvn v0.16b, v0.16b
		; CHECK-NEXT: mvn v2.16b, v2.16b
; CHECK-NEXT: umin v2.4s, v1.4s, v2.4s		; CHECK-NEXT: umin v2.4s, v1.4s, v2.4s
; CHECK-NEXT: umin v0.4s, v1.4s, v0.4s		; CHECK-NEXT: umin v0.4s, v1.4s, v0.4s
; CHECK-NEXT: umin v0.4s, v2.4s, v0.4s		; CHECK-NEXT: umin v0.4s, v2.4s, v0.4s
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = xor <4 x i32> %x, <i32 -1, i32 -1, i32 -1, i32 -1>		%a = xor <4 x i32> %x, <i32 -1, i32 -1, i32 -1, i32 -1>
%b = xor <4 x i32> %y, <i32 -1, i32 -1, i32 -1, i32 -1>		%b = xor <4 x i32> %y, <i32 -1, i32 -1, i32 -1, i32 -1>
%c = xor <4 x i32> %z, <i32 -1, i32 -1, i32 -1, i32 -1>		%c = xor <4 x i32> %z, <i32 -1, i32 -1, i32 -1, i32 -1>
%cmp_bc = icmp ult <4 x i32> %b, %c		%cmp_bc = icmp ult <4 x i32> %b, %c
▲ Show 20 Lines • Show All 48 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%r = select <4 x i1> %cmp_ac, <4 x i32> %min_ab, <4 x i32> %min_cb		%r = select <4 x i1> %cmp_ac, <4 x i32> %min_ab, <4 x i32> %min_cb
ret <4 x i32> %r		ret <4 x i32> %r
}		}

define <4 x i32> @notted_umin_bc_ab_eq_swap_pred(<4 x i32> %x, <4 x i32> %y, <4 x i32> %z) {		define <4 x i32> @notted_umin_bc_ab_eq_swap_pred(<4 x i32> %x, <4 x i32> %y, <4 x i32> %z) {
; CHECK-LABEL: notted_umin_bc_ab_eq_swap_pred:		; CHECK-LABEL: notted_umin_bc_ab_eq_swap_pred:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: mvn v1.16b, v1.16b		; CHECK-NEXT: mvn v1.16b, v1.16b
; CHECK-NEXT: mvn v2.16b, v2.16b
; CHECK-NEXT: mvn v0.16b, v0.16b		; CHECK-NEXT: mvn v0.16b, v0.16b
		; CHECK-NEXT: mvn v2.16b, v2.16b
; CHECK-NEXT: umin v2.4s, v1.4s, v2.4s		; CHECK-NEXT: umin v2.4s, v1.4s, v2.4s
; CHECK-NEXT: umin v0.4s, v0.4s, v1.4s		; CHECK-NEXT: umin v0.4s, v0.4s, v1.4s
; CHECK-NEXT: umin v0.4s, v2.4s, v0.4s		; CHECK-NEXT: umin v0.4s, v2.4s, v0.4s
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = xor <4 x i32> %x, <i32 -1, i32 -1, i32 -1, i32 -1>		%a = xor <4 x i32> %x, <i32 -1, i32 -1, i32 -1, i32 -1>
%b = xor <4 x i32> %y, <i32 -1, i32 -1, i32 -1, i32 -1>		%b = xor <4 x i32> %y, <i32 -1, i32 -1, i32 -1, i32 -1>
%c = xor <4 x i32> %z, <i32 -1, i32 -1, i32 -1, i32 -1>		%c = xor <4 x i32> %z, <i32 -1, i32 -1, i32 -1, i32 -1>
%cmp_bc = icmp ult <4 x i32> %b, %c		%cmp_bc = icmp ult <4 x i32> %b, %c
%min_bc = select <4 x i1> %cmp_bc, <4 x i32> %b, <4 x i32> %c		%min_bc = select <4 x i1> %cmp_bc, <4 x i32> %b, <4 x i32> %c
%cmp_ab = icmp ult <4 x i32> %a, %b		%cmp_ab = icmp ult <4 x i32> %a, %b
%min_ab = select <4 x i1> %cmp_ab, <4 x i32> %a, <4 x i32> %b		%min_ab = select <4 x i1> %cmp_ab, <4 x i32> %a, <4 x i32> %b
%cmp_ca = icmp uge <4 x i32> %z, %x		%cmp_ca = icmp uge <4 x i32> %z, %x
%r = select <4 x i1> %cmp_ca, <4 x i32> %min_bc, <4 x i32> %min_ab		%r = select <4 x i1> %cmp_ca, <4 x i32> %min_bc, <4 x i32> %min_ab
ret <4 x i32> %r		ret <4 x i32> %r
}		}

define <4 x i32> @notted_umin_bc_ba_eq_swap_pred(<4 x i32> %x, <4 x i32> %y, <4 x i32> %z) {		define <4 x i32> @notted_umin_bc_ba_eq_swap_pred(<4 x i32> %x, <4 x i32> %y, <4 x i32> %z) {
; CHECK-LABEL: notted_umin_bc_ba_eq_swap_pred:		; CHECK-LABEL: notted_umin_bc_ba_eq_swap_pred:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: mvn v1.16b, v1.16b		; CHECK-NEXT: mvn v1.16b, v1.16b
; CHECK-NEXT: mvn v2.16b, v2.16b
; CHECK-NEXT: mvn v0.16b, v0.16b		; CHECK-NEXT: mvn v0.16b, v0.16b
		; CHECK-NEXT: mvn v2.16b, v2.16b
; CHECK-NEXT: umin v2.4s, v1.4s, v2.4s		; CHECK-NEXT: umin v2.4s, v1.4s, v2.4s
; CHECK-NEXT: umin v0.4s, v1.4s, v0.4s		; CHECK-NEXT: umin v0.4s, v1.4s, v0.4s
; CHECK-NEXT: umin v0.4s, v2.4s, v0.4s		; CHECK-NEXT: umin v0.4s, v2.4s, v0.4s
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = xor <4 x i32> %x, <i32 -1, i32 -1, i32 -1, i32 -1>		%a = xor <4 x i32> %x, <i32 -1, i32 -1, i32 -1, i32 -1>
%b = xor <4 x i32> %y, <i32 -1, i32 -1, i32 -1, i32 -1>		%b = xor <4 x i32> %y, <i32 -1, i32 -1, i32 -1, i32 -1>
%c = xor <4 x i32> %z, <i32 -1, i32 -1, i32 -1, i32 -1>		%c = xor <4 x i32> %z, <i32 -1, i32 -1, i32 -1, i32 -1>
%cmp_bc = icmp ult <4 x i32> %b, %c		%cmp_bc = icmp ult <4 x i32> %b, %c
▲ Show 20 Lines • Show All 48 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%r = select <4 x i1> %cmp_ac, <4 x i32> %min_ab, <4 x i32> %min_cb		%r = select <4 x i1> %cmp_ac, <4 x i32> %min_ab, <4 x i32> %min_cb
ret <4 x i32> %r		ret <4 x i32> %r
}		}

define <4 x i32> @notted_umax_bc_ab(<4 x i32> %x, <4 x i32> %y, <4 x i32> %z) {		define <4 x i32> @notted_umax_bc_ab(<4 x i32> %x, <4 x i32> %y, <4 x i32> %z) {
; CHECK-LABEL: notted_umax_bc_ab:		; CHECK-LABEL: notted_umax_bc_ab:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: mvn v1.16b, v1.16b		; CHECK-NEXT: mvn v1.16b, v1.16b
; CHECK-NEXT: mvn v2.16b, v2.16b
; CHECK-NEXT: mvn v0.16b, v0.16b		; CHECK-NEXT: mvn v0.16b, v0.16b
		; CHECK-NEXT: mvn v2.16b, v2.16b
; CHECK-NEXT: umax v2.4s, v1.4s, v2.4s		; CHECK-NEXT: umax v2.4s, v1.4s, v2.4s
; CHECK-NEXT: umax v0.4s, v0.4s, v1.4s		; CHECK-NEXT: umax v0.4s, v0.4s, v1.4s
; CHECK-NEXT: umax v0.4s, v2.4s, v0.4s		; CHECK-NEXT: umax v0.4s, v2.4s, v0.4s
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = xor <4 x i32> %x, <i32 -1, i32 -1, i32 -1, i32 -1>		%a = xor <4 x i32> %x, <i32 -1, i32 -1, i32 -1, i32 -1>
%b = xor <4 x i32> %y, <i32 -1, i32 -1, i32 -1, i32 -1>		%b = xor <4 x i32> %y, <i32 -1, i32 -1, i32 -1, i32 -1>
%c = xor <4 x i32> %z, <i32 -1, i32 -1, i32 -1, i32 -1>		%c = xor <4 x i32> %z, <i32 -1, i32 -1, i32 -1, i32 -1>
%cmp_bc = icmp ugt <4 x i32> %b, %c		%cmp_bc = icmp ugt <4 x i32> %b, %c
%min_bc = select <4 x i1> %cmp_bc, <4 x i32> %b, <4 x i32> %c		%min_bc = select <4 x i1> %cmp_bc, <4 x i32> %b, <4 x i32> %c
%cmp_ab = icmp ugt <4 x i32> %a, %b		%cmp_ab = icmp ugt <4 x i32> %a, %b
%min_ab = select <4 x i1> %cmp_ab, <4 x i32> %a, <4 x i32> %b		%min_ab = select <4 x i1> %cmp_ab, <4 x i32> %a, <4 x i32> %b
%cmp_ca = icmp ugt <4 x i32> %x, %z		%cmp_ca = icmp ugt <4 x i32> %x, %z
%r = select <4 x i1> %cmp_ca, <4 x i32> %min_bc, <4 x i32> %min_ab		%r = select <4 x i1> %cmp_ca, <4 x i32> %min_bc, <4 x i32> %min_ab
ret <4 x i32> %r		ret <4 x i32> %r
}		}

define <4 x i32> @notted_umax_bc_ba(<4 x i32> %x, <4 x i32> %y, <4 x i32> %z) {		define <4 x i32> @notted_umax_bc_ba(<4 x i32> %x, <4 x i32> %y, <4 x i32> %z) {
; CHECK-LABEL: notted_umax_bc_ba:		; CHECK-LABEL: notted_umax_bc_ba:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: mvn v1.16b, v1.16b		; CHECK-NEXT: mvn v1.16b, v1.16b
; CHECK-NEXT: mvn v2.16b, v2.16b
; CHECK-NEXT: mvn v0.16b, v0.16b		; CHECK-NEXT: mvn v0.16b, v0.16b
		; CHECK-NEXT: mvn v2.16b, v2.16b
; CHECK-NEXT: umax v2.4s, v1.4s, v2.4s		; CHECK-NEXT: umax v2.4s, v1.4s, v2.4s
; CHECK-NEXT: umax v0.4s, v1.4s, v0.4s		; CHECK-NEXT: umax v0.4s, v1.4s, v0.4s
; CHECK-NEXT: umax v0.4s, v2.4s, v0.4s		; CHECK-NEXT: umax v0.4s, v2.4s, v0.4s
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = xor <4 x i32> %x, <i32 -1, i32 -1, i32 -1, i32 -1>		%a = xor <4 x i32> %x, <i32 -1, i32 -1, i32 -1, i32 -1>
%b = xor <4 x i32> %y, <i32 -1, i32 -1, i32 -1, i32 -1>		%b = xor <4 x i32> %y, <i32 -1, i32 -1, i32 -1, i32 -1>
%c = xor <4 x i32> %z, <i32 -1, i32 -1, i32 -1, i32 -1>		%c = xor <4 x i32> %z, <i32 -1, i32 -1, i32 -1, i32 -1>
%cmp_bc = icmp ugt <4 x i32> %b, %c		%cmp_bc = icmp ugt <4 x i32> %b, %c
▲ Show 20 Lines • Show All 48 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%r = select <4 x i1> %cmp_ac, <4 x i32> %min_ab, <4 x i32> %min_cb		%r = select <4 x i1> %cmp_ac, <4 x i32> %min_ab, <4 x i32> %min_cb
ret <4 x i32> %r		ret <4 x i32> %r
}		}

define <4 x i32> @notted_umax_bc_ab_swap_pred(<4 x i32> %x, <4 x i32> %y, <4 x i32> %z) {		define <4 x i32> @notted_umax_bc_ab_swap_pred(<4 x i32> %x, <4 x i32> %y, <4 x i32> %z) {
; CHECK-LABEL: notted_umax_bc_ab_swap_pred:		; CHECK-LABEL: notted_umax_bc_ab_swap_pred:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: mvn v1.16b, v1.16b		; CHECK-NEXT: mvn v1.16b, v1.16b
; CHECK-NEXT: mvn v2.16b, v2.16b
; CHECK-NEXT: mvn v0.16b, v0.16b		; CHECK-NEXT: mvn v0.16b, v0.16b
		; CHECK-NEXT: mvn v2.16b, v2.16b
; CHECK-NEXT: umax v2.4s, v1.4s, v2.4s		; CHECK-NEXT: umax v2.4s, v1.4s, v2.4s
; CHECK-NEXT: umax v0.4s, v0.4s, v1.4s		; CHECK-NEXT: umax v0.4s, v0.4s, v1.4s
; CHECK-NEXT: umax v0.4s, v2.4s, v0.4s		; CHECK-NEXT: umax v0.4s, v2.4s, v0.4s
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = xor <4 x i32> %x, <i32 -1, i32 -1, i32 -1, i32 -1>		%a = xor <4 x i32> %x, <i32 -1, i32 -1, i32 -1, i32 -1>
%b = xor <4 x i32> %y, <i32 -1, i32 -1, i32 -1, i32 -1>		%b = xor <4 x i32> %y, <i32 -1, i32 -1, i32 -1, i32 -1>
%c = xor <4 x i32> %z, <i32 -1, i32 -1, i32 -1, i32 -1>		%c = xor <4 x i32> %z, <i32 -1, i32 -1, i32 -1, i32 -1>
%cmp_bc = icmp ugt <4 x i32> %b, %c		%cmp_bc = icmp ugt <4 x i32> %b, %c
%min_bc = select <4 x i1> %cmp_bc, <4 x i32> %b, <4 x i32> %c		%min_bc = select <4 x i1> %cmp_bc, <4 x i32> %b, <4 x i32> %c
%cmp_ab = icmp ugt <4 x i32> %a, %b		%cmp_ab = icmp ugt <4 x i32> %a, %b
%min_ab = select <4 x i1> %cmp_ab, <4 x i32> %a, <4 x i32> %b		%min_ab = select <4 x i1> %cmp_ab, <4 x i32> %a, <4 x i32> %b
%cmp_ca = icmp ult <4 x i32> %z, %x		%cmp_ca = icmp ult <4 x i32> %z, %x
%r = select <4 x i1> %cmp_ca, <4 x i32> %min_bc, <4 x i32> %min_ab		%r = select <4 x i1> %cmp_ca, <4 x i32> %min_bc, <4 x i32> %min_ab
ret <4 x i32> %r		ret <4 x i32> %r
}		}

define <4 x i32> @notted_umax_bc_ba_swap_pred(<4 x i32> %x, <4 x i32> %y, <4 x i32> %z) {		define <4 x i32> @notted_umax_bc_ba_swap_pred(<4 x i32> %x, <4 x i32> %y, <4 x i32> %z) {
; CHECK-LABEL: notted_umax_bc_ba_swap_pred:		; CHECK-LABEL: notted_umax_bc_ba_swap_pred:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: mvn v1.16b, v1.16b		; CHECK-NEXT: mvn v1.16b, v1.16b
; CHECK-NEXT: mvn v2.16b, v2.16b
; CHECK-NEXT: mvn v0.16b, v0.16b		; CHECK-NEXT: mvn v0.16b, v0.16b
		; CHECK-NEXT: mvn v2.16b, v2.16b
; CHECK-NEXT: umax v2.4s, v1.4s, v2.4s		; CHECK-NEXT: umax v2.4s, v1.4s, v2.4s
; CHECK-NEXT: umax v0.4s, v1.4s, v0.4s		; CHECK-NEXT: umax v0.4s, v1.4s, v0.4s
; CHECK-NEXT: umax v0.4s, v2.4s, v0.4s		; CHECK-NEXT: umax v0.4s, v2.4s, v0.4s
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = xor <4 x i32> %x, <i32 -1, i32 -1, i32 -1, i32 -1>		%a = xor <4 x i32> %x, <i32 -1, i32 -1, i32 -1, i32 -1>
%b = xor <4 x i32> %y, <i32 -1, i32 -1, i32 -1, i32 -1>		%b = xor <4 x i32> %y, <i32 -1, i32 -1, i32 -1, i32 -1>
%c = xor <4 x i32> %z, <i32 -1, i32 -1, i32 -1, i32 -1>		%c = xor <4 x i32> %z, <i32 -1, i32 -1, i32 -1, i32 -1>
%cmp_bc = icmp ugt <4 x i32> %b, %c		%cmp_bc = icmp ugt <4 x i32> %b, %c
▲ Show 20 Lines • Show All 48 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%r = select <4 x i1> %cmp_ac, <4 x i32> %min_ab, <4 x i32> %min_cb		%r = select <4 x i1> %cmp_ac, <4 x i32> %min_ab, <4 x i32> %min_cb
ret <4 x i32> %r		ret <4 x i32> %r
}		}

define <4 x i32> @notted_umax_bc_ab_eq_pred(<4 x i32> %x, <4 x i32> %y, <4 x i32> %z) {		define <4 x i32> @notted_umax_bc_ab_eq_pred(<4 x i32> %x, <4 x i32> %y, <4 x i32> %z) {
; CHECK-LABEL: notted_umax_bc_ab_eq_pred:		; CHECK-LABEL: notted_umax_bc_ab_eq_pred:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: mvn v1.16b, v1.16b		; CHECK-NEXT: mvn v1.16b, v1.16b
; CHECK-NEXT: mvn v2.16b, v2.16b
; CHECK-NEXT: mvn v0.16b, v0.16b		; CHECK-NEXT: mvn v0.16b, v0.16b
		; CHECK-NEXT: mvn v2.16b, v2.16b
; CHECK-NEXT: umax v2.4s, v1.4s, v2.4s		; CHECK-NEXT: umax v2.4s, v1.4s, v2.4s
; CHECK-NEXT: umax v0.4s, v0.4s, v1.4s		; CHECK-NEXT: umax v0.4s, v0.4s, v1.4s
; CHECK-NEXT: umax v0.4s, v2.4s, v0.4s		; CHECK-NEXT: umax v0.4s, v2.4s, v0.4s
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = xor <4 x i32> %x, <i32 -1, i32 -1, i32 -1, i32 -1>		%a = xor <4 x i32> %x, <i32 -1, i32 -1, i32 -1, i32 -1>
%b = xor <4 x i32> %y, <i32 -1, i32 -1, i32 -1, i32 -1>		%b = xor <4 x i32> %y, <i32 -1, i32 -1, i32 -1, i32 -1>
%c = xor <4 x i32> %z, <i32 -1, i32 -1, i32 -1, i32 -1>		%c = xor <4 x i32> %z, <i32 -1, i32 -1, i32 -1, i32 -1>
%cmp_bc = icmp ugt <4 x i32> %b, %c		%cmp_bc = icmp ugt <4 x i32> %b, %c
%min_bc = select <4 x i1> %cmp_bc, <4 x i32> %b, <4 x i32> %c		%min_bc = select <4 x i1> %cmp_bc, <4 x i32> %b, <4 x i32> %c
%cmp_ab = icmp ugt <4 x i32> %a, %b		%cmp_ab = icmp ugt <4 x i32> %a, %b
%min_ab = select <4 x i1> %cmp_ab, <4 x i32> %a, <4 x i32> %b		%min_ab = select <4 x i1> %cmp_ab, <4 x i32> %a, <4 x i32> %b
%cmp_ca = icmp uge <4 x i32> %x, %z		%cmp_ca = icmp uge <4 x i32> %x, %z
%r = select <4 x i1> %cmp_ca, <4 x i32> %min_bc, <4 x i32> %min_ab		%r = select <4 x i1> %cmp_ca, <4 x i32> %min_bc, <4 x i32> %min_ab
ret <4 x i32> %r		ret <4 x i32> %r
}		}

define <4 x i32> @notted_umax_bc_ba_eq_pred(<4 x i32> %x, <4 x i32> %y, <4 x i32> %z) {		define <4 x i32> @notted_umax_bc_ba_eq_pred(<4 x i32> %x, <4 x i32> %y, <4 x i32> %z) {
; CHECK-LABEL: notted_umax_bc_ba_eq_pred:		; CHECK-LABEL: notted_umax_bc_ba_eq_pred:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: mvn v1.16b, v1.16b		; CHECK-NEXT: mvn v1.16b, v1.16b
; CHECK-NEXT: mvn v2.16b, v2.16b
; CHECK-NEXT: mvn v0.16b, v0.16b		; CHECK-NEXT: mvn v0.16b, v0.16b
		; CHECK-NEXT: mvn v2.16b, v2.16b
; CHECK-NEXT: umax v2.4s, v1.4s, v2.4s		; CHECK-NEXT: umax v2.4s, v1.4s, v2.4s
; CHECK-NEXT: umax v0.4s, v1.4s, v0.4s		; CHECK-NEXT: umax v0.4s, v1.4s, v0.4s
; CHECK-NEXT: umax v0.4s, v2.4s, v0.4s		; CHECK-NEXT: umax v0.4s, v2.4s, v0.4s
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = xor <4 x i32> %x, <i32 -1, i32 -1, i32 -1, i32 -1>		%a = xor <4 x i32> %x, <i32 -1, i32 -1, i32 -1, i32 -1>
%b = xor <4 x i32> %y, <i32 -1, i32 -1, i32 -1, i32 -1>		%b = xor <4 x i32> %y, <i32 -1, i32 -1, i32 -1, i32 -1>
%c = xor <4 x i32> %z, <i32 -1, i32 -1, i32 -1, i32 -1>		%c = xor <4 x i32> %z, <i32 -1, i32 -1, i32 -1, i32 -1>
%cmp_bc = icmp ugt <4 x i32> %b, %c		%cmp_bc = icmp ugt <4 x i32> %b, %c
▲ Show 20 Lines • Show All 48 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%r = select <4 x i1> %cmp_ac, <4 x i32> %min_ab, <4 x i32> %min_cb		%r = select <4 x i1> %cmp_ac, <4 x i32> %min_ab, <4 x i32> %min_cb
ret <4 x i32> %r		ret <4 x i32> %r
}		}

define <4 x i32> @notted_umax_bc_ab_eq_swap_pred(<4 x i32> %x, <4 x i32> %y, <4 x i32> %z) {		define <4 x i32> @notted_umax_bc_ab_eq_swap_pred(<4 x i32> %x, <4 x i32> %y, <4 x i32> %z) {
; CHECK-LABEL: notted_umax_bc_ab_eq_swap_pred:		; CHECK-LABEL: notted_umax_bc_ab_eq_swap_pred:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: mvn v1.16b, v1.16b		; CHECK-NEXT: mvn v1.16b, v1.16b
; CHECK-NEXT: mvn v2.16b, v2.16b
; CHECK-NEXT: mvn v0.16b, v0.16b		; CHECK-NEXT: mvn v0.16b, v0.16b
		; CHECK-NEXT: mvn v2.16b, v2.16b
; CHECK-NEXT: umax v2.4s, v1.4s, v2.4s		; CHECK-NEXT: umax v2.4s, v1.4s, v2.4s
; CHECK-NEXT: umax v0.4s, v0.4s, v1.4s		; CHECK-NEXT: umax v0.4s, v0.4s, v1.4s
; CHECK-NEXT: umax v0.4s, v2.4s, v0.4s		; CHECK-NEXT: umax v0.4s, v2.4s, v0.4s
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = xor <4 x i32> %x, <i32 -1, i32 -1, i32 -1, i32 -1>		%a = xor <4 x i32> %x, <i32 -1, i32 -1, i32 -1, i32 -1>
%b = xor <4 x i32> %y, <i32 -1, i32 -1, i32 -1, i32 -1>		%b = xor <4 x i32> %y, <i32 -1, i32 -1, i32 -1, i32 -1>
%c = xor <4 x i32> %z, <i32 -1, i32 -1, i32 -1, i32 -1>		%c = xor <4 x i32> %z, <i32 -1, i32 -1, i32 -1, i32 -1>
%cmp_bc = icmp ugt <4 x i32> %b, %c		%cmp_bc = icmp ugt <4 x i32> %b, %c
%min_bc = select <4 x i1> %cmp_bc, <4 x i32> %b, <4 x i32> %c		%min_bc = select <4 x i1> %cmp_bc, <4 x i32> %b, <4 x i32> %c
%cmp_ab = icmp ugt <4 x i32> %a, %b		%cmp_ab = icmp ugt <4 x i32> %a, %b
%min_ab = select <4 x i1> %cmp_ab, <4 x i32> %a, <4 x i32> %b		%min_ab = select <4 x i1> %cmp_ab, <4 x i32> %a, <4 x i32> %b
%cmp_ca = icmp ule <4 x i32> %z, %x		%cmp_ca = icmp ule <4 x i32> %z, %x
%r = select <4 x i1> %cmp_ca, <4 x i32> %min_bc, <4 x i32> %min_ab		%r = select <4 x i1> %cmp_ca, <4 x i32> %min_bc, <4 x i32> %min_ab
ret <4 x i32> %r		ret <4 x i32> %r
}		}

define <4 x i32> @notted_umax_bc_ba_eq_swap_pred(<4 x i32> %x, <4 x i32> %y, <4 x i32> %z) {		define <4 x i32> @notted_umax_bc_ba_eq_swap_pred(<4 x i32> %x, <4 x i32> %y, <4 x i32> %z) {
; CHECK-LABEL: notted_umax_bc_ba_eq_swap_pred:		; CHECK-LABEL: notted_umax_bc_ba_eq_swap_pred:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: mvn v1.16b, v1.16b		; CHECK-NEXT: mvn v1.16b, v1.16b
; CHECK-NEXT: mvn v2.16b, v2.16b
; CHECK-NEXT: mvn v0.16b, v0.16b		; CHECK-NEXT: mvn v0.16b, v0.16b
		; CHECK-NEXT: mvn v2.16b, v2.16b
; CHECK-NEXT: umax v2.4s, v1.4s, v2.4s		; CHECK-NEXT: umax v2.4s, v1.4s, v2.4s
; CHECK-NEXT: umax v0.4s, v1.4s, v0.4s		; CHECK-NEXT: umax v0.4s, v1.4s, v0.4s
; CHECK-NEXT: umax v0.4s, v2.4s, v0.4s		; CHECK-NEXT: umax v0.4s, v2.4s, v0.4s
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = xor <4 x i32> %x, <i32 -1, i32 -1, i32 -1, i32 -1>		%a = xor <4 x i32> %x, <i32 -1, i32 -1, i32 -1, i32 -1>
%b = xor <4 x i32> %y, <i32 -1, i32 -1, i32 -1, i32 -1>		%b = xor <4 x i32> %y, <i32 -1, i32 -1, i32 -1, i32 -1>
%c = xor <4 x i32> %z, <i32 -1, i32 -1, i32 -1, i32 -1>		%c = xor <4 x i32> %z, <i32 -1, i32 -1, i32 -1, i32 -1>
%cmp_bc = icmp ugt <4 x i32> %b, %c		%cmp_bc = icmp ugt <4 x i32> %b, %c
%min_bc = select <4 x i1> %cmp_bc, <4 x i32> %b, <4 x i32> %c		%min_bc = select <4 x i1> %cmp_bc, <4 x i32> %b, <4 x i32> %c
%cmp_ba = icmp ugt <4 x i32> %b, %a		%cmp_ba = icmp ugt <4 x i32> %b, %a
%min_ba = select <4 x i1> %cmp_ba, <4 x i32> %b, <4 x i32> %a		%min_ba = select <4 x i1> %cmp_ba, <4 x i32> %b, <4 x i32> %a
%cmp_ca = icmp ule <4 x i32> %z, %x		%cmp_ca = icmp ule <4 x i32> %z, %x
%r = select <4 x i1> %cmp_ca, <4 x i32> %min_bc, <4 x i32> %min_ba		%r = select <4 x i1> %cmp_ca, <4 x i32> %min_bc, <4 x i32> %min_ba
ret <4 x i32> %r		ret <4 x i32> %r
}		}

llvm/test/CodeGen/AArch64/minmax.ll

Show First 20 Lines • Show All 116 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%t2 = select <16 x i1> %t1, <16 x i32> %a, <16 x i32> %b		%t2 = select <16 x i1> %t1, <16 x i32> %a, <16 x i32> %b
ret <16 x i32> %t2		ret <16 x i32> %t2
}		}

; The icmp is used by two instructions, so don't produce a umin node.		; The icmp is used by two instructions, so don't produce a umin node.
define <16 x i8> @t12(<16 x i8> %a, <16 x i8> %b) {		define <16 x i8> @t12(<16 x i8> %a, <16 x i8> %b) {
; CHECK-LABEL: t12:		; CHECK-LABEL: t12:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: movi v2.16b, #1		; CHECK-NEXT: cmhi v2.16b, v1.16b, v0.16b
; CHECK-NEXT: cmhi v3.16b, v1.16b, v0.16b		; CHECK-NEXT: movi v3.16b, #1
; CHECK-NEXT: bif v0.16b, v1.16b, v3.16b		; CHECK-NEXT: bif v0.16b, v1.16b, v2.16b
; CHECK-NEXT: and v1.16b, v3.16b, v2.16b		; CHECK-NEXT: and v1.16b, v2.16b, v3.16b
; CHECK-NEXT: add v0.16b, v1.16b, v0.16b		; CHECK-NEXT: add v0.16b, v1.16b, v0.16b
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%t1 = icmp ugt <16 x i8> %b, %a		%t1 = icmp ugt <16 x i8> %b, %a
%t2 = select <16 x i1> %t1, <16 x i8> %a, <16 x i8> %b		%t2 = select <16 x i1> %t1, <16 x i8> %a, <16 x i8> %b
%t3 = zext <16 x i1> %t1 to <16 x i8>		%t3 = zext <16 x i1> %t1 to <16 x i8>
%t4 = add <16 x i8> %t3, %t2		%t4 = add <16 x i8> %t3, %t2
ret <16 x i8> %t4		ret <16 x i8> %t4
}		}
Show All 35 Lines

llvm/test/CodeGen/AArch64/overeager_mla_fusing.ll

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: llc %s --mtriple aarch64 -verify-machineinstrs -o - \| FileCheck %s			; RUN: llc %s --mtriple aarch64 -verify-machineinstrs -o - \| FileCheck %s

	define dso_local void @jsimd_idct_ifast_neon_intrinsic(i8* nocapture readonly %dct_table, i16* nocapture readonly %coef_block, i8** nocapture readonly %output_buf, i32 %output_col) local_unnamed_addr #0 {			define dso_local void @jsimd_idct_ifast_neon_intrinsic(i8* nocapture readonly %dct_table, i16* nocapture readonly %coef_block, i8** nocapture readonly %output_buf, i32 %output_col) local_unnamed_addr #0 {
	; CHECK-LABEL: jsimd_idct_ifast_neon_intrinsic:			; CHECK-LABEL: jsimd_idct_ifast_neon_intrinsic:
	; CHECK: // %bb.0: // %entry			; CHECK: // %bb.0: // %entry
	; CHECK-NEXT: ldr q0, [x1, #32]			; CHECK-NEXT: ldr q0, [x1, #32]
	; CHECK-NEXT: mov w8, w3			; CHECK-NEXT: mov w8, w3
	; CHECK-NEXT: ldr q1, [x1, #96]			; CHECK-NEXT: ldr q1, [x1, #96]
	; CHECK-NEXT: ldr q2, [x0, #32]			; CHECK-NEXT: ldr q2, [x0, #32]
	; CHECK-NEXT: ldr q3, [x0, #96]			; CHECK-NEXT: ldr q3, [x0, #96]
	; CHECK-NEXT: ldr x9, [x2, #48]			; CHECK-NEXT: ldr x9, [x2, #48]
	; CHECK-NEXT: mul v0.8h, v2.8h, v0.8h			; CHECK-NEXT: mul v0.8h, v2.8h, v0.8h
	; CHECK-NEXT: mul v1.8h, v3.8h, v1.8h			; CHECK-NEXT: mul v1.8h, v3.8h, v1.8h
	; CHECK-NEXT: add v2.8h, v0.8h, v1.8h			; CHECK-NEXT: add v2.8h, v0.8h, v1.8h
	; CHECK-NEXT: sub v0.8h, v0.8h, v1.8h
	; CHECK-NEXT: str q2, [x9, x8]			; CHECK-NEXT: str q2, [x9, x8]
	; CHECK-NEXT: ldr x9, [x2, #56]			; CHECK-NEXT: ldr x9, [x2, #56]
				; CHECK-NEXT: sub v0.8h, v0.8h, v1.8h
	; CHECK-NEXT: str q0, [x9, x8]			; CHECK-NEXT: str q0, [x9, x8]
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	entry:			entry:
	%add.ptr5 = getelementptr inbounds i16, i16* %coef_block, i64 16			%add.ptr5 = getelementptr inbounds i16, i16* %coef_block, i64 16
	%0 = bitcast i16* %add.ptr5 to <8 x i16>*			%0 = bitcast i16* %add.ptr5 to <8 x i16>*
	%1 = load <8 x i16>, <8 x i16>* %0, align 16			%1 = load <8 x i16>, <8 x i16>* %0, align 16

	%add.ptr17 = getelementptr inbounds i16, i16* %coef_block, i64 48			%add.ptr17 = getelementptr inbounds i16, i16* %coef_block, i64 48
	Show All 33 Lines

llvm/test/CodeGen/AArch64/ragreedy-local-interval-cost.ll

	Show First 20 Lines • Show All 113 Lines • ▼ Show 20 Lines
	; CHECK-NEXT: add v28.2d, v28.2d, v0.2d			; CHECK-NEXT: add v28.2d, v28.2d, v0.2d
	; CHECK-NEXT: ldr q0, [sp, #16] // 16-byte Folded Reload			; CHECK-NEXT: ldr q0, [sp, #16] // 16-byte Folded Reload
	; CHECK-NEXT: add v13.2d, v13.2d, v14.2d			; CHECK-NEXT: add v13.2d, v13.2d, v14.2d
	; CHECK-NEXT: mov v1.d[1], x12			; CHECK-NEXT: mov v1.d[1], x12
	; CHECK-NEXT: mul x12, x17, x2			; CHECK-NEXT: mul x12, x17, x2
	; CHECK-NEXT: add v0.2d, v0.2d, v15.2d			; CHECK-NEXT: add v0.2d, v0.2d, v15.2d
	; CHECK-NEXT: add v11.2d, v11.2d, v14.2d			; CHECK-NEXT: add v11.2d, v11.2d, v14.2d
	; CHECK-NEXT: fmov d14, x3			; CHECK-NEXT: fmov d14, x3
	; CHECK-NEXT: add v9.2d, v9.2d, v1.2d
	; CHECK-NEXT: str q0, [sp, #16] // 16-byte Folded Spill			; CHECK-NEXT: str q0, [sp, #16] // 16-byte Folded Spill
	; CHECK-NEXT: fmov d0, x13			; CHECK-NEXT: fmov d0, x13
				; CHECK-NEXT: add v9.2d, v9.2d, v1.2d
	; CHECK-NEXT: mov v14.d[1], x15			; CHECK-NEXT: mov v14.d[1], x15
	; CHECK-NEXT: add v31.2d, v31.2d, v1.2d
	; CHECK-NEXT: mov v0.d[1], x12			; CHECK-NEXT: mov v0.d[1], x12
				; CHECK-NEXT: add v31.2d, v31.2d, v1.2d
	; CHECK-NEXT: add v26.2d, v26.2d, v1.2d			; CHECK-NEXT: add v26.2d, v26.2d, v1.2d
	; CHECK-NEXT: add v23.2d, v23.2d, v1.2d			; CHECK-NEXT: add v23.2d, v23.2d, v1.2d
	; CHECK-NEXT: add v21.2d, v21.2d, v1.2d			; CHECK-NEXT: add v21.2d, v21.2d, v1.2d
	; CHECK-NEXT: add v19.2d, v19.2d, v1.2d			; CHECK-NEXT: add v19.2d, v19.2d, v1.2d
	; CHECK-NEXT: add v17.2d, v17.2d, v1.2d			; CHECK-NEXT: add v17.2d, v17.2d, v1.2d
	; CHECK-NEXT: add v7.2d, v7.2d, v1.2d			; CHECK-NEXT: add v7.2d, v7.2d, v1.2d
	; CHECK-NEXT: add v5.2d, v5.2d, v1.2d			; CHECK-NEXT: add v5.2d, v5.2d, v1.2d
	; CHECK-NEXT: add v3.2d, v3.2d, v1.2d			; CHECK-NEXT: add v3.2d, v3.2d, v1.2d
	▲ Show 20 Lines • Show All 207 Lines • Show Last 20 Lines

llvm/test/CodeGen/AArch64/sadd_sat_vec.ll

Show First 20 Lines • Show All 91 Lines • ▼ Show 20 Lines
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%z = call <32 x i16> @llvm.sadd.sat.v32i16(<32 x i16> %x, <32 x i16> %y)		%z = call <32 x i16> @llvm.sadd.sat.v32i16(<32 x i16> %x, <32 x i16> %y)
ret <32 x i16> %z		ret <32 x i16> %z
}		}

define void @v8i8(<8 x i8>* %px, <8 x i8>* %py, <8 x i8>* %pz) nounwind {		define void @v8i8(<8 x i8>* %px, <8 x i8>* %py, <8 x i8>* %pz) nounwind {
; CHECK-LABEL: v8i8:		; CHECK-LABEL: v8i8:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: ldr d0, [x0]		; CHECK-NEXT: ldr d0, [x1]
; CHECK-NEXT: ldr d1, [x1]		; CHECK-NEXT: ldr d1, [x0]
; CHECK-NEXT: sqadd v0.8b, v0.8b, v1.8b		; CHECK-NEXT: sqadd v0.8b, v1.8b, v0.8b
; CHECK-NEXT: str d0, [x2]		; CHECK-NEXT: str d0, [x2]
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%x = load <8 x i8>, <8 x i8>* %px		%x = load <8 x i8>, <8 x i8>* %px
%y = load <8 x i8>, <8 x i8>* %py		%y = load <8 x i8>, <8 x i8>* %py
%z = call <8 x i8> @llvm.sadd.sat.v8i8(<8 x i8> %x, <8 x i8> %y)		%z = call <8 x i8> @llvm.sadd.sat.v8i8(<8 x i8> %x, <8 x i8> %y)
store <8 x i8> %z, <8 x i8>* %pz		store <8 x i8> %z, <8 x i8>* %pz
ret void		ret void
}		}
▲ Show 20 Lines • Show All 42 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%z = call <2 x i8> @llvm.sadd.sat.v2i8(<2 x i8> %x, <2 x i8> %y)		%z = call <2 x i8> @llvm.sadd.sat.v2i8(<2 x i8> %x, <2 x i8> %y)
store <2 x i8> %z, <2 x i8>* %pz		store <2 x i8> %z, <2 x i8>* %pz
ret void		ret void
}		}

define void @v4i16(<4 x i16>* %px, <4 x i16>* %py, <4 x i16>* %pz) nounwind {		define void @v4i16(<4 x i16>* %px, <4 x i16>* %py, <4 x i16>* %pz) nounwind {
; CHECK-LABEL: v4i16:		; CHECK-LABEL: v4i16:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: ldr d0, [x0]		; CHECK-NEXT: ldr d0, [x1]
; CHECK-NEXT: ldr d1, [x1]		; CHECK-NEXT: ldr d1, [x0]
; CHECK-NEXT: sqadd v0.4h, v0.4h, v1.4h		; CHECK-NEXT: sqadd v0.4h, v1.4h, v0.4h
; CHECK-NEXT: str d0, [x2]		; CHECK-NEXT: str d0, [x2]
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%x = load <4 x i16>, <4 x i16>* %px		%x = load <4 x i16>, <4 x i16>* %px
%y = load <4 x i16>, <4 x i16>* %py		%y = load <4 x i16>, <4 x i16>* %py
%z = call <4 x i16> @llvm.sadd.sat.v4i16(<4 x i16> %x, <4 x i16> %y)		%z = call <4 x i16> @llvm.sadd.sat.v4i16(<4 x i16> %x, <4 x i16> %y)
store <4 x i16> %z, <4 x i16>* %pz		store <4 x i16> %z, <4 x i16>* %pz
ret void		ret void
}		}
▲ Show 20 Lines • Show All 47 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%z = call <12 x i16> @llvm.sadd.sat.v12i16(<12 x i16> %x, <12 x i16> %y)		%z = call <12 x i16> @llvm.sadd.sat.v12i16(<12 x i16> %x, <12 x i16> %y)
store <12 x i16> %z, <12 x i16>* %pz		store <12 x i16> %z, <12 x i16>* %pz
ret void		ret void
}		}

define void @v1i8(<1 x i8>* %px, <1 x i8>* %py, <1 x i8>* %pz) nounwind {		define void @v1i8(<1 x i8>* %px, <1 x i8>* %py, <1 x i8>* %pz) nounwind {
; CHECK-LABEL: v1i8:		; CHECK-LABEL: v1i8:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: ldr b0, [x0]		; CHECK-NEXT: ldr b0, [x1]
; CHECK-NEXT: ldr b1, [x1]		; CHECK-NEXT: ldr b1, [x0]
; CHECK-NEXT: sqadd v0.8b, v0.8b, v1.8b		; CHECK-NEXT: sqadd v0.8b, v1.8b, v0.8b
; CHECK-NEXT: st1 { v0.b }[0], [x2]		; CHECK-NEXT: st1 { v0.b }[0], [x2]
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%x = load <1 x i8>, <1 x i8>* %px		%x = load <1 x i8>, <1 x i8>* %px
%y = load <1 x i8>, <1 x i8>* %py		%y = load <1 x i8>, <1 x i8>* %py
%z = call <1 x i8> @llvm.sadd.sat.v1i8(<1 x i8> %x, <1 x i8> %y)		%z = call <1 x i8> @llvm.sadd.sat.v1i8(<1 x i8> %x, <1 x i8> %y)
store <1 x i8> %z, <1 x i8>* %pz		store <1 x i8> %z, <1 x i8>* %pz
ret void		ret void
}		}

define void @v1i16(<1 x i16>* %px, <1 x i16>* %py, <1 x i16>* %pz) nounwind {		define void @v1i16(<1 x i16>* %px, <1 x i16>* %py, <1 x i16>* %pz) nounwind {
; CHECK-LABEL: v1i16:		; CHECK-LABEL: v1i16:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: ldr h0, [x0]		; CHECK-NEXT: ldr h0, [x1]
; CHECK-NEXT: ldr h1, [x1]		; CHECK-NEXT: ldr h1, [x0]
; CHECK-NEXT: sqadd v0.4h, v0.4h, v1.4h		; CHECK-NEXT: sqadd v0.4h, v1.4h, v0.4h
; CHECK-NEXT: str h0, [x2]		; CHECK-NEXT: str h0, [x2]
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%x = load <1 x i16>, <1 x i16>* %px		%x = load <1 x i16>, <1 x i16>* %px
%y = load <1 x i16>, <1 x i16>* %py		%y = load <1 x i16>, <1 x i16>* %py
%z = call <1 x i16> @llvm.sadd.sat.v1i16(<1 x i16> %x, <1 x i16> %y)		%z = call <1 x i16> @llvm.sadd.sat.v1i16(<1 x i16> %x, <1 x i16> %y)
store <1 x i16> %z, <1 x i16>* %pz		store <1 x i16> %z, <1 x i16>* %pz
ret void		ret void
}		}

define <16 x i4> @v16i4(<16 x i4> %x, <16 x i4> %y) nounwind {		define <16 x i4> @v16i4(<16 x i4> %x, <16 x i4> %y) nounwind {
; CHECK-LABEL: v16i4:		; CHECK-LABEL: v16i4:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: shl v1.16b, v1.16b, #4
; CHECK-NEXT: shl v0.16b, v0.16b, #4		; CHECK-NEXT: shl v0.16b, v0.16b, #4
; CHECK-NEXT: sshr v1.16b, v1.16b, #4		; CHECK-NEXT: shl v1.16b, v1.16b, #4
; CHECK-NEXT: sshr v0.16b, v0.16b, #4		; CHECK-NEXT: sshr v0.16b, v0.16b, #4
		; CHECK-NEXT: sshr v1.16b, v1.16b, #4
; CHECK-NEXT: shl v1.16b, v1.16b, #4		; CHECK-NEXT: shl v1.16b, v1.16b, #4
; CHECK-NEXT: shl v0.16b, v0.16b, #4		; CHECK-NEXT: shl v0.16b, v0.16b, #4
; CHECK-NEXT: sqadd v0.16b, v0.16b, v1.16b		; CHECK-NEXT: sqadd v0.16b, v0.16b, v1.16b
; CHECK-NEXT: sshr v0.16b, v0.16b, #4		; CHECK-NEXT: sshr v0.16b, v0.16b, #4
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%z = call <16 x i4> @llvm.sadd.sat.v16i4(<16 x i4> %x, <16 x i4> %y)		%z = call <16 x i4> @llvm.sadd.sat.v16i4(<16 x i4> %x, <16 x i4> %y)
ret <16 x i4> %z		ret <16 x i4> %z
}		}
▲ Show 20 Lines • Show All 109 Lines • Show Last 20 Lines

llvm/test/CodeGen/AArch64/sat-add.ll

Show First 20 Lines • Show All 340 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%r = select i1 %c, i64 -1, i64 %a		%r = select i1 %c, i64 -1, i64 %a
ret i64 %r		ret i64 %r
}		}

define <16 x i8> @unsigned_sat_constant_v16i8_using_min(<16 x i8> %x) {		define <16 x i8> @unsigned_sat_constant_v16i8_using_min(<16 x i8> %x) {
; CHECK-LABEL: unsigned_sat_constant_v16i8_using_min:		; CHECK-LABEL: unsigned_sat_constant_v16i8_using_min:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: movi v1.16b, #213		; CHECK-NEXT: movi v1.16b, #213
		; CHECK-NEXT: movi v2.16b, #42
; CHECK-NEXT: umin v0.16b, v0.16b, v1.16b		; CHECK-NEXT: umin v0.16b, v0.16b, v1.16b
; CHECK-NEXT: movi v1.16b, #42		; CHECK-NEXT: add v0.16b, v0.16b, v2.16b
; CHECK-NEXT: add v0.16b, v0.16b, v1.16b
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%c = icmp ult <16 x i8> %x, <i8 -43, i8 -43, i8 -43, i8 -43, i8 -43, i8 -43, i8 -43, i8 -43, i8 -43, i8 -43, i8 -43, i8 -43, i8 -43, i8 -43, i8 -43, i8 -43>		%c = icmp ult <16 x i8> %x, <i8 -43, i8 -43, i8 -43, i8 -43, i8 -43, i8 -43, i8 -43, i8 -43, i8 -43, i8 -43, i8 -43, i8 -43, i8 -43, i8 -43, i8 -43, i8 -43>
%s = select <16 x i1> %c, <16 x i8> %x, <16 x i8> <i8 -43, i8 -43, i8 -43, i8 -43, i8 -43, i8 -43, i8 -43, i8 -43, i8 -43, i8 -43, i8 -43, i8 -43, i8 -43, i8 -43, i8 -43, i8 -43>		%s = select <16 x i1> %c, <16 x i8> %x, <16 x i8> <i8 -43, i8 -43, i8 -43, i8 -43, i8 -43, i8 -43, i8 -43, i8 -43, i8 -43, i8 -43, i8 -43, i8 -43, i8 -43, i8 -43, i8 -43, i8 -43>
%r = add <16 x i8> %s, <i8 42, i8 42, i8 42, i8 42, i8 42, i8 42, i8 42, i8 42, i8 42, i8 42, i8 42, i8 42, i8 42, i8 42, i8 42, i8 42>		%r = add <16 x i8> %s, <i8 42, i8 42, i8 42, i8 42, i8 42, i8 42, i8 42, i8 42, i8 42, i8 42, i8 42, i8 42, i8 42, i8 42, i8 42, i8 42>
ret <16 x i8> %r		ret <16 x i8> %r
}		}

define <16 x i8> @unsigned_sat_constant_v16i8_using_cmp_sum(<16 x i8> %x) {		define <16 x i8> @unsigned_sat_constant_v16i8_using_cmp_sum(<16 x i8> %x) {
Show All 18 Lines	; CHECK-NEXT: ret
%c = icmp ugt <16 x i8> %x, <i8 -43, i8 -43, i8 -43, i8 -43, i8 -43, i8 -43, i8 -43, i8 -43, i8 -43, i8 -43, i8 -43, i8 -43, i8 -43, i8 -43, i8 -43, i8 -43>		%c = icmp ugt <16 x i8> %x, <i8 -43, i8 -43, i8 -43, i8 -43, i8 -43, i8 -43, i8 -43, i8 -43, i8 -43, i8 -43, i8 -43, i8 -43, i8 -43, i8 -43, i8 -43, i8 -43>
%r = select <16 x i1> %c, <16 x i8> <i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1>, <16 x i8> %a		%r = select <16 x i1> %c, <16 x i8> <i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1>, <16 x i8> %a
ret <16 x i8> %r		ret <16 x i8> %r
}		}

define <8 x i16> @unsigned_sat_constant_v8i16_using_min(<8 x i16> %x) {		define <8 x i16> @unsigned_sat_constant_v8i16_using_min(<8 x i16> %x) {
; CHECK-LABEL: unsigned_sat_constant_v8i16_using_min:		; CHECK-LABEL: unsigned_sat_constant_v8i16_using_min:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: mvni v1.8h, #42
; CHECK-NEXT: umin v0.8h, v0.8h, v1.8h
; CHECK-NEXT: movi v1.8h, #42		; CHECK-NEXT: movi v1.8h, #42
		; CHECK-NEXT: mvni v2.8h, #42
		; CHECK-NEXT: umin v0.8h, v0.8h, v2.8h
; CHECK-NEXT: add v0.8h, v0.8h, v1.8h		; CHECK-NEXT: add v0.8h, v0.8h, v1.8h
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%c = icmp ult <8 x i16> %x, <i16 -43, i16 -43, i16 -43, i16 -43, i16 -43, i16 -43, i16 -43, i16 -43>		%c = icmp ult <8 x i16> %x, <i16 -43, i16 -43, i16 -43, i16 -43, i16 -43, i16 -43, i16 -43, i16 -43>
%s = select <8 x i1> %c, <8 x i16> %x, <8 x i16> <i16 -43, i16 -43, i16 -43, i16 -43, i16 -43, i16 -43, i16 -43, i16 -43>		%s = select <8 x i1> %c, <8 x i16> %x, <8 x i16> <i16 -43, i16 -43, i16 -43, i16 -43, i16 -43, i16 -43, i16 -43, i16 -43>
%r = add <8 x i16> %s, <i16 42, i16 42, i16 42, i16 42, i16 42, i16 42, i16 42, i16 42>		%r = add <8 x i16> %s, <i16 42, i16 42, i16 42, i16 42, i16 42, i16 42, i16 42, i16 42>
ret <8 x i16> %r		ret <8 x i16> %r
}		}

▲ Show 20 Lines • Show All 266 Lines • Show Last 20 Lines

llvm/test/CodeGen/AArch64/selectcc-to-shiftand.ll

Show First 20 Lines • Show All 159 Lines • ▼ Show 20 Lines
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%shl = select i1 %t, i64 65536, i64 0		%shl = select i1 %t, i64 65536, i64 0
ret i64 %shl		ret i64 %shl
}		}

define <16 x i8> @sel_shift_bool_v16i8(<16 x i1> %t) {		define <16 x i8> @sel_shift_bool_v16i8(<16 x i1> %t) {
; CHECK-LABEL: sel_shift_bool_v16i8:		; CHECK-LABEL: sel_shift_bool_v16i8:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: shl v0.16b, v0.16b, #7
; CHECK-NEXT: movi v1.16b, #128		; CHECK-NEXT: movi v1.16b, #128
		; CHECK-NEXT: shl v0.16b, v0.16b, #7
; CHECK-NEXT: cmlt v0.16b, v0.16b, #0		; CHECK-NEXT: cmlt v0.16b, v0.16b, #0
; CHECK-NEXT: and v0.16b, v0.16b, v1.16b		; CHECK-NEXT: and v0.16b, v0.16b, v1.16b
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%shl = select <16 x i1> %t, <16 x i8> <i8 128, i8 128, i8 128, i8 128, i8 128, i8 128, i8 128, i8 128, i8 128, i8 128, i8 128, i8 128, i8 128, i8 128, i8 128, i8 128>, <16 x i8> zeroinitializer		%shl = select <16 x i1> %t, <16 x i8> <i8 128, i8 128, i8 128, i8 128, i8 128, i8 128, i8 128, i8 128, i8 128, i8 128, i8 128, i8 128, i8 128, i8 128, i8 128, i8 128>, <16 x i8> zeroinitializer
ret <16 x i8> %shl		ret <16 x i8> %shl
}		}

define <8 x i16> @sel_shift_bool_v8i16(<8 x i1> %t) {		define <8 x i16> @sel_shift_bool_v8i16(<8 x i1> %t) {
Show All 22 Lines	; CHECK-NEXT: ret
ret <4 x i32> %shl		ret <4 x i32> %shl
}		}

define <2 x i64> @sel_shift_bool_v2i64(<2 x i1> %t) {		define <2 x i64> @sel_shift_bool_v2i64(<2 x i1> %t) {
; CHECK-LABEL: sel_shift_bool_v2i64:		; CHECK-LABEL: sel_shift_bool_v2i64:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: ushll v0.2d, v0.2s, #0		; CHECK-NEXT: ushll v0.2d, v0.2s, #0
; CHECK-NEXT: mov w8, #65536		; CHECK-NEXT: mov w8, #65536
; CHECK-NEXT: dup v1.2d, x8
; CHECK-NEXT: shl v0.2d, v0.2d, #63		; CHECK-NEXT: shl v0.2d, v0.2d, #63
		; CHECK-NEXT: dup v1.2d, x8
; CHECK-NEXT: cmlt v0.2d, v0.2d, #0		; CHECK-NEXT: cmlt v0.2d, v0.2d, #0
; CHECK-NEXT: and v0.16b, v0.16b, v1.16b		; CHECK-NEXT: and v0.16b, v0.16b, v1.16b
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%shl = select <2 x i1> %t, <2 x i64> <i64 65536, i64 65536>, <2 x i64> zeroinitializer		%shl = select <2 x i1> %t, <2 x i64> <i64 65536, i64 65536>, <2 x i64> zeroinitializer
ret <2 x i64> %shl		ret <2 x i64> %shl
}		}

llvm/test/CodeGen/AArch64/signbit-shift.ll

Show All 24 Lines	; CHECK-NEXT: ret
%r = add i32 %e, 41		%r = add i32 %e, 41
ret i32 %r		ret i32 %r
}		}

define <4 x i32> @add_zext_ifpos_vec_splat(<4 x i32> %x) {		define <4 x i32> @add_zext_ifpos_vec_splat(<4 x i32> %x) {
; CHECK-LABEL: add_zext_ifpos_vec_splat:		; CHECK-LABEL: add_zext_ifpos_vec_splat:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: movi v1.2d, #0xffffffffffffffff		; CHECK-NEXT: movi v1.2d, #0xffffffffffffffff
		; CHECK-NEXT: movi v2.4s, #41
; CHECK-NEXT: cmgt v0.4s, v0.4s, v1.4s		; CHECK-NEXT: cmgt v0.4s, v0.4s, v1.4s
; CHECK-NEXT: movi v1.4s, #41		; CHECK-NEXT: sub v0.4s, v2.4s, v0.4s
; CHECK-NEXT: sub v0.4s, v1.4s, v0.4s
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%c = icmp sgt <4 x i32> %x, <i32 -1, i32 -1, i32 -1, i32 -1>		%c = icmp sgt <4 x i32> %x, <i32 -1, i32 -1, i32 -1, i32 -1>
%e = zext <4 x i1> %c to <4 x i32>		%e = zext <4 x i1> %c to <4 x i32>
%r = add <4 x i32> %e, <i32 41, i32 41, i32 41, i32 41>		%r = add <4 x i32> %e, <i32 41, i32 41, i32 41, i32 41>
ret <4 x i32> %r		ret <4 x i32> %r
}		}

define i32 @sel_ifpos_tval_bigger(i32 %x) {		define i32 @sel_ifpos_tval_bigger(i32 %x) {
Show All 30 Lines	; CHECK-NEXT: ret
%r = add i32 %e, 42		%r = add i32 %e, 42
ret i32 %r		ret i32 %r
}		}

define <4 x i32> @add_sext_ifpos_vec_splat(<4 x i32> %x) {		define <4 x i32> @add_sext_ifpos_vec_splat(<4 x i32> %x) {
; CHECK-LABEL: add_sext_ifpos_vec_splat:		; CHECK-LABEL: add_sext_ifpos_vec_splat:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: movi v1.2d, #0xffffffffffffffff		; CHECK-NEXT: movi v1.2d, #0xffffffffffffffff
		; CHECK-NEXT: movi v2.4s, #42
; CHECK-NEXT: cmgt v0.4s, v0.4s, v1.4s		; CHECK-NEXT: cmgt v0.4s, v0.4s, v1.4s
; CHECK-NEXT: movi v1.4s, #42		; CHECK-NEXT: add v0.4s, v0.4s, v2.4s
; CHECK-NEXT: add v0.4s, v0.4s, v1.4s
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%c = icmp sgt <4 x i32> %x, <i32 -1, i32 -1, i32 -1, i32 -1>		%c = icmp sgt <4 x i32> %x, <i32 -1, i32 -1, i32 -1, i32 -1>
%e = sext <4 x i1> %c to <4 x i32>		%e = sext <4 x i1> %c to <4 x i32>
%r = add <4 x i32> %e, <i32 42, i32 42, i32 42, i32 42>		%r = add <4 x i32> %e, <i32 42, i32 42, i32 42, i32 42>
ret <4 x i32> %r		ret <4 x i32> %r
}		}

define i32 @sel_ifpos_fval_bigger(i32 %x) {		define i32 @sel_ifpos_fval_bigger(i32 %x) {
▲ Show 20 Lines • Show All 176 Lines • Show Last 20 Lines

llvm/test/CodeGen/AArch64/sink-addsub-of-const.ll

	Show First 20 Lines • Show All 154 Lines • ▼ Show 20 Lines
	; add (add %x, C), %y			; add (add %x, C), %y
	; Outer 'add' is commutative - 2 variants.			; Outer 'add' is commutative - 2 variants.

	define <4 x i32> @vec_sink_add_of_const_to_add0(<4 x i32> %a, <4 x i32> %b) {			define <4 x i32> @vec_sink_add_of_const_to_add0(<4 x i32> %a, <4 x i32> %b) {
	; CHECK-LABEL: vec_sink_add_of_const_to_add0:			; CHECK-LABEL: vec_sink_add_of_const_to_add0:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: adrp x8, .LCPI12_0			; CHECK-NEXT: adrp x8, .LCPI12_0
	; CHECK-NEXT: add v0.4s, v0.4s, v1.4s			; CHECK-NEXT: add v0.4s, v0.4s, v1.4s
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI12_0]			; CHECK-NEXT: ldr q2, [x8, :lo12:.LCPI12_0]
	; CHECK-NEXT: add v0.4s, v0.4s, v1.4s			; CHECK-NEXT: add v0.4s, v0.4s, v2.4s
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%t0 = add <4 x i32> %a, <i32 42, i32 24, i32 undef, i32 46> ; constant always on RHS			%t0 = add <4 x i32> %a, <i32 42, i32 24, i32 undef, i32 46> ; constant always on RHS
	%r = add <4 x i32> %t0, %b			%r = add <4 x i32> %t0, %b
	ret <4 x i32> %r			ret <4 x i32> %r
	}			}
	define <4 x i32> @vec_sink_add_of_const_to_add1(<4 x i32> %a, <4 x i32> %b) {			define <4 x i32> @vec_sink_add_of_const_to_add1(<4 x i32> %a, <4 x i32> %b) {
	; CHECK-LABEL: vec_sink_add_of_const_to_add1:			; CHECK-LABEL: vec_sink_add_of_const_to_add1:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: adrp x8, .LCPI13_0			; CHECK-NEXT: adrp x8, .LCPI13_0
	; CHECK-NEXT: add v0.4s, v0.4s, v1.4s			; CHECK-NEXT: add v0.4s, v0.4s, v1.4s
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI13_0]			; CHECK-NEXT: ldr q2, [x8, :lo12:.LCPI13_0]
	; CHECK-NEXT: add v0.4s, v0.4s, v1.4s			; CHECK-NEXT: add v0.4s, v0.4s, v2.4s
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%t0 = add <4 x i32> %a, <i32 42, i32 24, i32 undef, i32 46> ; constant always on RHS			%t0 = add <4 x i32> %a, <i32 42, i32 24, i32 undef, i32 46> ; constant always on RHS
	%r = add <4 x i32> %b, %t0			%r = add <4 x i32> %b, %t0
	ret <4 x i32> %r			ret <4 x i32> %r
	}			}

	; add (sub %x, C), %y			; add (sub %x, C), %y
	; Outer 'add' is commutative - 2 variants.			; Outer 'add' is commutative - 2 variants.

	define <4 x i32> @vec_sink_sub_of_const_to_add0(<4 x i32> %a, <4 x i32> %b) {			define <4 x i32> @vec_sink_sub_of_const_to_add0(<4 x i32> %a, <4 x i32> %b) {
	; CHECK-LABEL: vec_sink_sub_of_const_to_add0:			; CHECK-LABEL: vec_sink_sub_of_const_to_add0:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: adrp x8, .LCPI14_0			; CHECK-NEXT: adrp x8, .LCPI14_0
	; CHECK-NEXT: add v0.4s, v0.4s, v1.4s			; CHECK-NEXT: add v0.4s, v0.4s, v1.4s
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI14_0]			; CHECK-NEXT: ldr q2, [x8, :lo12:.LCPI14_0]
	; CHECK-NEXT: sub v0.4s, v0.4s, v1.4s			; CHECK-NEXT: sub v0.4s, v0.4s, v2.4s
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%t0 = sub <4 x i32> %a, <i32 42, i32 24, i32 undef, i32 46>			%t0 = sub <4 x i32> %a, <i32 42, i32 24, i32 undef, i32 46>
	%r = add <4 x i32> %t0, %b			%r = add <4 x i32> %t0, %b
	ret <4 x i32> %r			ret <4 x i32> %r
	}			}
	define <4 x i32> @vec_sink_sub_of_const_to_add1(<4 x i32> %a, <4 x i32> %b) {			define <4 x i32> @vec_sink_sub_of_const_to_add1(<4 x i32> %a, <4 x i32> %b) {
	; CHECK-LABEL: vec_sink_sub_of_const_to_add1:			; CHECK-LABEL: vec_sink_sub_of_const_to_add1:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: adrp x8, .LCPI15_0			; CHECK-NEXT: adrp x8, .LCPI15_0
	; CHECK-NEXT: add v0.4s, v0.4s, v1.4s			; CHECK-NEXT: add v0.4s, v0.4s, v1.4s
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI15_0]			; CHECK-NEXT: ldr q2, [x8, :lo12:.LCPI15_0]
	; CHECK-NEXT: sub v0.4s, v0.4s, v1.4s			; CHECK-NEXT: sub v0.4s, v0.4s, v2.4s
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%t0 = sub <4 x i32> %a, <i32 42, i32 24, i32 undef, i32 46>			%t0 = sub <4 x i32> %a, <i32 42, i32 24, i32 undef, i32 46>
	%r = add <4 x i32> %b, %t0			%r = add <4 x i32> %b, %t0
	ret <4 x i32> %r			ret <4 x i32> %r
	}			}

	; add (sub C, %x), %y			; add (sub C, %x), %y
	; Outer 'add' is commutative - 2 variants.			; Outer 'add' is commutative - 2 variants.

	define <4 x i32> @vec_sink_sub_from_const_to_add0(<4 x i32> %a, <4 x i32> %b) {			define <4 x i32> @vec_sink_sub_from_const_to_add0(<4 x i32> %a, <4 x i32> %b) {
	; CHECK-LABEL: vec_sink_sub_from_const_to_add0:			; CHECK-LABEL: vec_sink_sub_from_const_to_add0:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: adrp x8, .LCPI16_0			; CHECK-NEXT: adrp x8, .LCPI16_0
	; CHECK-NEXT: sub v0.4s, v1.4s, v0.4s			; CHECK-NEXT: sub v0.4s, v1.4s, v0.4s
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI16_0]			; CHECK-NEXT: ldr q2, [x8, :lo12:.LCPI16_0]
	; CHECK-NEXT: add v0.4s, v0.4s, v1.4s			; CHECK-NEXT: add v0.4s, v0.4s, v2.4s
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%t0 = sub <4 x i32> <i32 42, i32 24, i32 undef, i32 46>, %a			%t0 = sub <4 x i32> <i32 42, i32 24, i32 undef, i32 46>, %a
	%r = add <4 x i32> %t0, %b			%r = add <4 x i32> %t0, %b
	ret <4 x i32> %r			ret <4 x i32> %r
	}			}
	define <4 x i32> @vec_sink_sub_from_const_to_add1(<4 x i32> %a, <4 x i32> %b) {			define <4 x i32> @vec_sink_sub_from_const_to_add1(<4 x i32> %a, <4 x i32> %b) {
	; CHECK-LABEL: vec_sink_sub_from_const_to_add1:			; CHECK-LABEL: vec_sink_sub_from_const_to_add1:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: adrp x8, .LCPI17_0			; CHECK-NEXT: adrp x8, .LCPI17_0
	; CHECK-NEXT: sub v0.4s, v1.4s, v0.4s			; CHECK-NEXT: sub v0.4s, v1.4s, v0.4s
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI17_0]			; CHECK-NEXT: ldr q2, [x8, :lo12:.LCPI17_0]
	; CHECK-NEXT: add v0.4s, v0.4s, v1.4s			; CHECK-NEXT: add v0.4s, v0.4s, v2.4s
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%t0 = sub <4 x i32> <i32 42, i32 24, i32 undef, i32 46>, %a			%t0 = sub <4 x i32> <i32 42, i32 24, i32 undef, i32 46>, %a
	%r = add <4 x i32> %b, %t0			%r = add <4 x i32> %b, %t0
	ret <4 x i32> %r			ret <4 x i32> %r
	}			}

	; sub (add %x, C), %y			; sub (add %x, C), %y
	; sub %y, (add %x, C)			; sub %y, (add %x, C)

	define <4 x i32> @vec_sink_add_of_const_to_sub(<4 x i32> %a, <4 x i32> %b) {			define <4 x i32> @vec_sink_add_of_const_to_sub(<4 x i32> %a, <4 x i32> %b) {
	; CHECK-LABEL: vec_sink_add_of_const_to_sub:			; CHECK-LABEL: vec_sink_add_of_const_to_sub:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: adrp x8, .LCPI18_0			; CHECK-NEXT: adrp x8, .LCPI18_0
	; CHECK-NEXT: sub v0.4s, v0.4s, v1.4s			; CHECK-NEXT: sub v0.4s, v0.4s, v1.4s
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI18_0]			; CHECK-NEXT: ldr q2, [x8, :lo12:.LCPI18_0]
	; CHECK-NEXT: add v0.4s, v0.4s, v1.4s			; CHECK-NEXT: add v0.4s, v0.4s, v2.4s
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%t0 = add <4 x i32> %a, <i32 42, i32 24, i32 undef, i32 46> ; constant always on RHS			%t0 = add <4 x i32> %a, <i32 42, i32 24, i32 undef, i32 46> ; constant always on RHS
	%r = sub <4 x i32> %t0, %b			%r = sub <4 x i32> %t0, %b
	ret <4 x i32> %r			ret <4 x i32> %r
	}			}
	define <4 x i32> @vec_sink_add_of_const_to_sub2(<4 x i32> %a, <4 x i32> %b) {			define <4 x i32> @vec_sink_add_of_const_to_sub2(<4 x i32> %a, <4 x i32> %b) {
	; CHECK-LABEL: vec_sink_add_of_const_to_sub2:			; CHECK-LABEL: vec_sink_add_of_const_to_sub2:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: adrp x8, .LCPI19_0			; CHECK-NEXT: adrp x8, .LCPI19_0
	; CHECK-NEXT: sub v0.4s, v1.4s, v0.4s			; CHECK-NEXT: sub v0.4s, v1.4s, v0.4s
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI19_0]			; CHECK-NEXT: ldr q2, [x8, :lo12:.LCPI19_0]
	; CHECK-NEXT: sub v0.4s, v0.4s, v1.4s			; CHECK-NEXT: sub v0.4s, v0.4s, v2.4s
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%t0 = add <4 x i32> %a, <i32 42, i32 24, i32 undef, i32 46> ; constant always on RHS			%t0 = add <4 x i32> %a, <i32 42, i32 24, i32 undef, i32 46> ; constant always on RHS
	%r = sub <4 x i32> %b, %t0			%r = sub <4 x i32> %b, %t0
	ret <4 x i32> %r			ret <4 x i32> %r
	}			}

	; sub (sub %x, C), %y			; sub (sub %x, C), %y
	; sub %y, (sub %x, C)			; sub %y, (sub %x, C)

	define <4 x i32> @vec_sink_sub_of_const_to_sub(<4 x i32> %a, <4 x i32> %b) {			define <4 x i32> @vec_sink_sub_of_const_to_sub(<4 x i32> %a, <4 x i32> %b) {
	; CHECK-LABEL: vec_sink_sub_of_const_to_sub:			; CHECK-LABEL: vec_sink_sub_of_const_to_sub:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: adrp x8, .LCPI20_0			; CHECK-NEXT: adrp x8, .LCPI20_0
	; CHECK-NEXT: sub v0.4s, v0.4s, v1.4s			; CHECK-NEXT: sub v0.4s, v0.4s, v1.4s
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI20_0]			; CHECK-NEXT: ldr q2, [x8, :lo12:.LCPI20_0]
	; CHECK-NEXT: sub v0.4s, v0.4s, v1.4s			; CHECK-NEXT: sub v0.4s, v0.4s, v2.4s
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%t0 = sub <4 x i32> %a, <i32 42, i32 24, i32 undef, i32 46>			%t0 = sub <4 x i32> %a, <i32 42, i32 24, i32 undef, i32 46>
	%r = sub <4 x i32> %t0, %b			%r = sub <4 x i32> %t0, %b
	ret <4 x i32> %r			ret <4 x i32> %r
	}			}
	define <4 x i32> @vec_sink_sub_of_const_to_sub2(<4 x i32> %a, <4 x i32> %b) {			define <4 x i32> @vec_sink_sub_of_const_to_sub2(<4 x i32> %a, <4 x i32> %b) {
	; CHECK-LABEL: vec_sink_sub_of_const_to_sub2:			; CHECK-LABEL: vec_sink_sub_of_const_to_sub2:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: adrp x8, .LCPI21_0			; CHECK-NEXT: adrp x8, .LCPI21_0
	; CHECK-NEXT: sub v0.4s, v1.4s, v0.4s			; CHECK-NEXT: sub v0.4s, v1.4s, v0.4s
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI21_0]			; CHECK-NEXT: ldr q2, [x8, :lo12:.LCPI21_0]
	; CHECK-NEXT: add v0.4s, v0.4s, v1.4s			; CHECK-NEXT: add v0.4s, v0.4s, v2.4s
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%t0 = sub <4 x i32> %a, <i32 42, i32 24, i32 undef, i32 46>			%t0 = sub <4 x i32> %a, <i32 42, i32 24, i32 undef, i32 46>
	%r = sub <4 x i32> %b, %t0			%r = sub <4 x i32> %b, %t0
	ret <4 x i32> %r			ret <4 x i32> %r
	}			}

	; sub (sub C, %x), %y			; sub (sub C, %x), %y
	; sub %y, (sub C, %x)			; sub %y, (sub C, %x)

	define <4 x i32> @vec_sink_sub_from_const_to_sub(<4 x i32> %a, <4 x i32> %b) {			define <4 x i32> @vec_sink_sub_from_const_to_sub(<4 x i32> %a, <4 x i32> %b) {
	; CHECK-LABEL: vec_sink_sub_from_const_to_sub:			; CHECK-LABEL: vec_sink_sub_from_const_to_sub:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: adrp x8, .LCPI22_0			; CHECK-NEXT: adrp x8, .LCPI22_0
	; CHECK-NEXT: add v0.4s, v0.4s, v1.4s			; CHECK-NEXT: add v0.4s, v0.4s, v1.4s
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI22_0]			; CHECK-NEXT: ldr q2, [x8, :lo12:.LCPI22_0]
	; CHECK-NEXT: sub v0.4s, v1.4s, v0.4s			; CHECK-NEXT: sub v0.4s, v2.4s, v0.4s
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%t0 = sub <4 x i32> <i32 42, i32 24, i32 undef, i32 46>, %a			%t0 = sub <4 x i32> <i32 42, i32 24, i32 undef, i32 46>, %a
	%r = sub <4 x i32> %t0, %b			%r = sub <4 x i32> %t0, %b
	ret <4 x i32> %r			ret <4 x i32> %r
	}			}
	define <4 x i32> @vec_sink_sub_from_const_to_sub2(<4 x i32> %a, <4 x i32> %b) {			define <4 x i32> @vec_sink_sub_from_const_to_sub2(<4 x i32> %a, <4 x i32> %b) {
	; CHECK-LABEL: vec_sink_sub_from_const_to_sub2:			; CHECK-LABEL: vec_sink_sub_from_const_to_sub2:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: adrp x8, .LCPI23_0			; CHECK-NEXT: adrp x8, .LCPI23_0
	; CHECK-NEXT: add v0.4s, v0.4s, v1.4s			; CHECK-NEXT: add v0.4s, v0.4s, v1.4s
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI23_0]			; CHECK-NEXT: ldr q2, [x8, :lo12:.LCPI23_0]
	; CHECK-NEXT: sub v0.4s, v0.4s, v1.4s			; CHECK-NEXT: sub v0.4s, v0.4s, v2.4s
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%t0 = sub <4 x i32> <i32 42, i32 24, i32 undef, i32 46>, %a			%t0 = sub <4 x i32> <i32 42, i32 24, i32 undef, i32 46>, %a
	%r = sub <4 x i32> %b, %t0			%r = sub <4 x i32> %b, %t0
	ret <4 x i32> %r			ret <4 x i32> %r
	}			}

llvm/test/CodeGen/AArch64/sinksplat.ll

	Show First 20 Lines • Show All 299 Lines • ▼ Show 20 Lines
	; CHECK-LABEL: fma:			; CHECK-LABEL: fma:
	; CHECK: // %bb.0: // %entry			; CHECK: // %bb.0: // %entry
	; CHECK-NEXT: mov v1.16b, v0.16b			; CHECK-NEXT: mov v1.16b, v0.16b
	; CHECK-NEXT: mov w8, #1			; CHECK-NEXT: mov w8, #1
	; CHECK-NEXT: movi v0.2d, #0000000000000000			; CHECK-NEXT: movi v0.2d, #0000000000000000
	; CHECK-NEXT: dup v1.4s, v1.s[3]			; CHECK-NEXT: dup v1.4s, v1.s[3]
	; CHECK-NEXT: .LBB9_1: // %l1			; CHECK-NEXT: .LBB9_1: // %l1
	; CHECK-NEXT: // =>This Inner Loop Header: Depth=1			; CHECK-NEXT: // =>This Inner Loop Header: Depth=1
	; CHECK-NEXT: mov v2.16b, v0.16b
	; CHECK-NEXT: ldr q3, [x0]			; CHECK-NEXT: ldr q3, [x0]
	; CHECK-NEXT: mov v0.16b, v1.16b
	; CHECK-NEXT: subs w8, w8, #1			; CHECK-NEXT: subs w8, w8, #1
				; CHECK-NEXT: mov v2.16b, v0.16b
				; CHECK-NEXT: mov v0.16b, v1.16b
	; CHECK-NEXT: fmla v0.4s, v2.4s, v3.4s			; CHECK-NEXT: fmla v0.4s, v2.4s, v3.4s
	; CHECK-NEXT: b.eq .LBB9_1			; CHECK-NEXT: b.eq .LBB9_1
	; CHECK-NEXT: // %bb.2: // %l2			; CHECK-NEXT: // %bb.2: // %l2
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	entry:			entry:
	%a = shufflevector <4 x float> %x, <4 x float> undef, <4 x i32> <i32 3, i32 3, i32 3, i32 3>			%a = shufflevector <4 x float> %x, <4 x float> undef, <4 x i32> <i32 3, i32 3, i32 3, i32 3>
	br label %l1			br label %l1

	▲ Show 20 Lines • Show All 56 Lines • Show Last 20 Lines

llvm/test/CodeGen/AArch64/sitofp-fixed-legal.ll

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: llc -mtriple=aarch64-apple-ios %s -o - \| FileCheck %s			; RUN: llc -mtriple=aarch64-apple-ios %s -o - \| FileCheck %s

	define <16 x double> @test_sitofp_fixed(<16 x i32> %in) {			define <16 x double> @test_sitofp_fixed(<16 x i32> %in) {
	; CHECK-LABEL: test_sitofp_fixed:			; CHECK-LABEL: test_sitofp_fixed:
	; CHECK: ; %bb.0:			; CHECK: ; %bb.0:
	; CHECK-NEXT: sshll2.2d v4, v2, #0			; CHECK-NEXT: sshll2.2d v4, v2, #0
	; CHECK-NEXT: sshll.2d v16, v1, #0
	; CHECK-NEXT: sshll2.2d v5, v0, #0			; CHECK-NEXT: sshll2.2d v5, v0, #0
	; CHECK-NEXT: sshll2.2d v6, v1, #0			; CHECK-NEXT: sshll2.2d v6, v1, #0
	; CHECK-NEXT: sshll2.2d v7, v3, #0			; CHECK-NEXT: sshll2.2d v7, v3, #0
	; CHECK-NEXT: sshll.2d v0, v0, #0			; CHECK-NEXT: sshll.2d v0, v0, #0
				; CHECK-NEXT: sshll.2d v16, v1, #0
	; CHECK-NEXT: sshll.2d v17, v2, #0			; CHECK-NEXT: sshll.2d v17, v2, #0
	; CHECK-NEXT: sshll.2d v18, v3, #0			; CHECK-NEXT: sshll.2d v18, v3, #0
	; CHECK-NEXT: scvtf.2d v1, v5, #6			; CHECK-NEXT: scvtf.2d v1, v5, #6
				; CHECK-NEXT: scvtf.2d v0, v0, #6
	; CHECK-NEXT: scvtf.2d v3, v6, #6			; CHECK-NEXT: scvtf.2d v3, v6, #6
	; CHECK-NEXT: scvtf.2d v2, v16, #6			; CHECK-NEXT: scvtf.2d v2, v16, #6
	; CHECK-NEXT: scvtf.2d v5, v4, #6			; CHECK-NEXT: scvtf.2d v5, v4, #6
	; CHECK-NEXT: scvtf.2d v0, v0, #6
	; CHECK-NEXT: scvtf.2d v7, v7, #6
	; CHECK-NEXT: scvtf.2d v4, v17, #6			; CHECK-NEXT: scvtf.2d v4, v17, #6
				; CHECK-NEXT: scvtf.2d v7, v7, #6
	; CHECK-NEXT: scvtf.2d v6, v18, #6			; CHECK-NEXT: scvtf.2d v6, v18, #6
	; CHECK-NEXT: ret			; CHECK-NEXT: ret

	%flt = sitofp <16 x i32> %in to <16 x double>			%flt = sitofp <16 x i32> %in to <16 x double>
	%res = fdiv <16 x double> %flt, <double 64.0, double 64.0, double 64.0, double 64.0, double 64.0, double 64.0, double 64.0, double 64.0, double 64.0, double 64.0, double 64.0, double 64.0, double 64.0, double 64.0, double 64.0, double 64.0>			%res = fdiv <16 x double> %flt, <double 64.0, double 64.0, double 64.0, double 64.0, double 64.0, double 64.0, double 64.0, double 64.0, double 64.0, double 64.0, double 64.0, double 64.0, double 64.0, double 64.0, double 64.0, double 64.0>
	ret <16 x double> %res			ret <16 x double> %res
	}			}

	Show All 13 Lines

llvm/test/CodeGen/AArch64/srem-seteq-illegal-types.ll

Show First 20 Lines • Show All 53 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%srem = srem i6 %X, 4		%srem = srem i6 %X, 4
%cmp = icmp ne i6 %srem, 0		%cmp = icmp ne i6 %srem, 0
ret i1 %cmp		ret i1 %cmp
}		}

define <3 x i1> @test_srem_vec(<3 x i33> %X) nounwind {		define <3 x i1> @test_srem_vec(<3 x i33> %X) nounwind {
; CHECK-LABEL: test_srem_vec:		; CHECK-LABEL: test_srem_vec:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: mov x11, #7282		; CHECK-NEXT: mov x8, #7282
; CHECK-NEXT: sbfx x10, x0, #0, #33		; CHECK-NEXT: sbfx x9, x0, #0, #33
		; CHECK-NEXT: movk x8, #29127, lsl #16
		; CHECK-NEXT: mov x11, #7281
		; CHECK-NEXT: movk x8, #50972, lsl #32
; CHECK-NEXT: movk x11, #29127, lsl #16		; CHECK-NEXT: movk x11, #29127, lsl #16
; CHECK-NEXT: mov x9, #7281		; CHECK-NEXT: movk x8, #7281, lsl #48
; CHECK-NEXT: movk x11, #50972, lsl #32		; CHECK-NEXT: movk x11, #50972, lsl #32
; CHECK-NEXT: movk x9, #29127, lsl #16		; CHECK-NEXT: sbfx x12, x1, #0, #33
		; CHECK-NEXT: sbfx x10, x2, #0, #33
		; CHECK-NEXT: smulh x13, x9, x8
; CHECK-NEXT: movk x11, #7281, lsl #48		; CHECK-NEXT: movk x11, #7281, lsl #48
; CHECK-NEXT: movk x9, #50972, lsl #32		; CHECK-NEXT: smulh x8, x12, x8
; CHECK-NEXT: sbfx x13, x1, #0, #33		; CHECK-NEXT: smulh x11, x10, x11
; CHECK-NEXT: sbfx x8, x2, #0, #33		; CHECK-NEXT: add x13, x13, x13, lsr #63
; CHECK-NEXT: smulh x12, x10, x11		; CHECK-NEXT: sub x11, x11, x10
; CHECK-NEXT: movk x9, #7281, lsl #48		; CHECK-NEXT: add x8, x8, x8, lsr #63
; CHECK-NEXT: smulh x11, x13, x11		; CHECK-NEXT: add x13, x13, x13, lsl #3
; CHECK-NEXT: smulh x9, x8, x9		; CHECK-NEXT: asr x14, x11, #3
; CHECK-NEXT: add x12, x12, x12, lsr #63		; CHECK-NEXT: sub x9, x9, x13
; CHECK-NEXT: sub x9, x9, x8		; CHECK-NEXT: add x11, x14, x11, lsr #63
; CHECK-NEXT: add x11, x11, x11, lsr #63		; CHECK-NEXT: add x8, x8, x8, lsl #3
; CHECK-NEXT: add x12, x12, x12, lsl #3		; CHECK-NEXT: sub x8, x12, x8
; CHECK-NEXT: asr x14, x9, #3
; CHECK-NEXT: sub x10, x10, x12
; CHECK-NEXT: add x9, x14, x9, lsr #63
; CHECK-NEXT: add x11, x11, x11, lsl #3		; CHECK-NEXT: add x11, x11, x11, lsl #3
; CHECK-NEXT: sub x11, x13, x11		; CHECK-NEXT: fmov d0, x9
; CHECK-NEXT: add x9, x9, x9, lsl #3		; CHECK-NEXT: add x10, x10, x11
; CHECK-NEXT: fmov d0, x10
; CHECK-NEXT: add x8, x8, x9
; CHECK-NEXT: mov x9, #8589934591		; CHECK-NEXT: mov x9, #8589934591
; CHECK-NEXT: mov v0.d[1], x11		; CHECK-NEXT: adrp x11, .LCPI3_0
; CHECK-NEXT: fmov d1, x8		; CHECK-NEXT: adrp x12, .LCPI3_1
		; CHECK-NEXT: mov v0.d[1], x8
		; CHECK-NEXT: fmov d1, x10
; CHECK-NEXT: dup v2.2d, x9		; CHECK-NEXT: dup v2.2d, x9
; CHECK-NEXT: adrp x8, .LCPI3_0		; CHECK-NEXT: ldr q3, [x11, :lo12:.LCPI3_0]
; CHECK-NEXT: adrp x9, .LCPI3_1		; CHECK-NEXT: ldr q4, [x12, :lo12:.LCPI3_1]
; CHECK-NEXT: and v1.16b, v1.16b, v2.16b		; CHECK-NEXT: and v1.16b, v1.16b, v2.16b
; CHECK-NEXT: and v0.16b, v0.16b, v2.16b		; CHECK-NEXT: and v0.16b, v0.16b, v2.16b
; CHECK-NEXT: ldr q2, [x8, :lo12:.LCPI3_0]		; CHECK-NEXT: cmeq v0.2d, v0.2d, v3.2d
; CHECK-NEXT: ldr q3, [x9, :lo12:.LCPI3_1]		; CHECK-NEXT: cmeq v1.2d, v1.2d, v4.2d
; CHECK-NEXT: cmeq v0.2d, v0.2d, v2.2d
; CHECK-NEXT: cmeq v1.2d, v1.2d, v3.2d
; CHECK-NEXT: mvn v0.16b, v0.16b		; CHECK-NEXT: mvn v0.16b, v0.16b
; CHECK-NEXT: mvn v1.16b, v1.16b
; CHECK-NEXT: xtn v0.2s, v0.2d		; CHECK-NEXT: xtn v0.2s, v0.2d
		; CHECK-NEXT: mvn v1.16b, v1.16b
; CHECK-NEXT: xtn v1.2s, v1.2d		; CHECK-NEXT: xtn v1.2s, v1.2d
; CHECK-NEXT: mov w1, v0.s[1]		; CHECK-NEXT: mov w1, v0.s[1]
; CHECK-NEXT: fmov w0, s0		; CHECK-NEXT: fmov w0, s0
; CHECK-NEXT: fmov w2, s1		; CHECK-NEXT: fmov w2, s1
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%srem = srem <3 x i33> %X, <i33 9, i33 9, i33 -9>		%srem = srem <3 x i33> %X, <i33 9, i33 9, i33 -9>
%cmp = icmp ne <3 x i33> %srem, <i33 3, i33 -3, i33 3>		%cmp = icmp ne <3 x i33> %srem, <i33 3, i33 -3, i33 3>
ret <3 x i1> %cmp		ret <3 x i1> %cmp
}		}

llvm/test/CodeGen/AArch64/srem-seteq-vec-nonsplat.ll

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: llc -mtriple=aarch64-unknown-linux-gnu < %s \| FileCheck %s			; RUN: llc -mtriple=aarch64-unknown-linux-gnu < %s \| FileCheck %s

	; Odd+Even divisors			; Odd+Even divisors
	define <4 x i32> @test_srem_odd_even(<4 x i32> %X) nounwind {			define <4 x i32> @test_srem_odd_even(<4 x i32> %X) nounwind {
	; CHECK-LABEL: test_srem_odd_even:			; CHECK-LABEL: test_srem_odd_even:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: adrp x8, .LCPI0_0			; CHECK-NEXT: adrp x8, .LCPI0_0
	; CHECK-NEXT: adrp x9, .LCPI0_1			; CHECK-NEXT: adrp x9, .LCPI0_1
				; CHECK-NEXT: movi v3.4s, #1
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI0_0]			; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI0_0]
	; CHECK-NEXT: adrp x8, .LCPI0_2			; CHECK-NEXT: adrp x8, .LCPI0_2
	; CHECK-NEXT: ldr q2, [x9, :lo12:.LCPI0_1]			; CHECK-NEXT: ldr q2, [x9, :lo12:.LCPI0_1]
	; CHECK-NEXT: adrp x9, .LCPI0_3			; CHECK-NEXT: adrp x9, .LCPI0_3
	; CHECK-NEXT: mla v2.4s, v0.4s, v1.4s			; CHECK-NEXT: mla v2.4s, v0.4s, v1.4s
	; CHECK-NEXT: ldr q0, [x8, :lo12:.LCPI0_2]			; CHECK-NEXT: ldr q0, [x8, :lo12:.LCPI0_2]
	; CHECK-NEXT: ldr q1, [x9, :lo12:.LCPI0_3]			; CHECK-NEXT: ldr q1, [x9, :lo12:.LCPI0_3]
	; CHECK-NEXT: adrp x8, .LCPI0_4			; CHECK-NEXT: adrp x8, .LCPI0_4
	; CHECK-NEXT: ushl v0.4s, v2.4s, v0.4s			; CHECK-NEXT: ushl v0.4s, v2.4s, v0.4s
	; CHECK-NEXT: ushl v1.4s, v2.4s, v1.4s			; CHECK-NEXT: ushl v1.4s, v2.4s, v1.4s
				; CHECK-NEXT: ldr q2, [x8, :lo12:.LCPI0_4]
	; CHECK-NEXT: orr v0.16b, v1.16b, v0.16b			; CHECK-NEXT: orr v0.16b, v1.16b, v0.16b
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI0_4]			; CHECK-NEXT: cmhs v0.4s, v2.4s, v0.4s
	; CHECK-NEXT: cmhs v0.4s, v1.4s, v0.4s			; CHECK-NEXT: and v0.16b, v0.16b, v3.16b
	; CHECK-NEXT: movi v1.4s, #1
	; CHECK-NEXT: and v0.16b, v0.16b, v1.16b
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%srem = srem <4 x i32> %X, <i32 5, i32 14, i32 25, i32 100>			%srem = srem <4 x i32> %X, <i32 5, i32 14, i32 25, i32 100>
	%cmp = icmp eq <4 x i32> %srem, <i32 0, i32 0, i32 0, i32 0>			%cmp = icmp eq <4 x i32> %srem, <i32 0, i32 0, i32 0, i32 0>
	%ret = zext <4 x i1> %cmp to <4 x i32>			%ret = zext <4 x i1> %cmp to <4 x i32>
	ret <4 x i32> %ret			ret <4 x i32> %ret
	}			}

	;==============================================================================;			;==============================================================================;

	; One all-ones divisor in odd divisor			; One all-ones divisor in odd divisor
	define <4 x i32> @test_srem_odd_allones_eq(<4 x i32> %X) nounwind {			define <4 x i32> @test_srem_odd_allones_eq(<4 x i32> %X) nounwind {
	; CHECK-LABEL: test_srem_odd_allones_eq:			; CHECK-LABEL: test_srem_odd_allones_eq:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: mov w8, #52429			; CHECK-NEXT: mov w8, #52429
	; CHECK-NEXT: mov w9, #39321			; CHECK-NEXT: mov w9, #39321
	; CHECK-NEXT: movk w8, #52428, lsl #16			; CHECK-NEXT: movk w8, #52428, lsl #16
	; CHECK-NEXT: movk w9, #6553, lsl #16			; CHECK-NEXT: movk w9, #6553, lsl #16
	; CHECK-NEXT: adrp x10, .LCPI1_0
	; CHECK-NEXT: dup v1.4s, w8			; CHECK-NEXT: dup v1.4s, w8
	; CHECK-NEXT: dup v2.4s, w9			; CHECK-NEXT: dup v2.4s, w9
				; CHECK-NEXT: adrp x8, .LCPI1_0
	; CHECK-NEXT: mla v2.4s, v0.4s, v1.4s			; CHECK-NEXT: mla v2.4s, v0.4s, v1.4s
	; CHECK-NEXT: ldr q0, [x10, :lo12:.LCPI1_0]
	; CHECK-NEXT: movi v1.4s, #1			; CHECK-NEXT: movi v1.4s, #1
				; CHECK-NEXT: ldr q0, [x8, :lo12:.LCPI1_0]
	; CHECK-NEXT: cmhs v0.4s, v0.4s, v2.4s			; CHECK-NEXT: cmhs v0.4s, v0.4s, v2.4s
	; CHECK-NEXT: and v0.16b, v0.16b, v1.16b			; CHECK-NEXT: and v0.16b, v0.16b, v1.16b
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%srem = srem <4 x i32> %X, <i32 5, i32 5, i32 4294967295, i32 5>			%srem = srem <4 x i32> %X, <i32 5, i32 5, i32 4294967295, i32 5>
	%cmp = icmp eq <4 x i32> %srem, <i32 0, i32 0, i32 0, i32 0>			%cmp = icmp eq <4 x i32> %srem, <i32 0, i32 0, i32 0, i32 0>
	%ret = zext <4 x i1> %cmp to <4 x i32>			%ret = zext <4 x i1> %cmp to <4 x i32>
	ret <4 x i32> %ret			ret <4 x i32> %ret
	}			}
	define <4 x i32> @test_srem_odd_allones_ne(<4 x i32> %X) nounwind {			define <4 x i32> @test_srem_odd_allones_ne(<4 x i32> %X) nounwind {
	; CHECK-LABEL: test_srem_odd_allones_ne:			; CHECK-LABEL: test_srem_odd_allones_ne:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: mov w8, #52429			; CHECK-NEXT: mov w8, #52429
	; CHECK-NEXT: mov w9, #39321			; CHECK-NEXT: mov w9, #39321
	; CHECK-NEXT: movk w8, #52428, lsl #16			; CHECK-NEXT: movk w8, #52428, lsl #16
	; CHECK-NEXT: movk w9, #6553, lsl #16			; CHECK-NEXT: movk w9, #6553, lsl #16
	; CHECK-NEXT: adrp x10, .LCPI2_0
	; CHECK-NEXT: dup v1.4s, w8			; CHECK-NEXT: dup v1.4s, w8
	; CHECK-NEXT: dup v2.4s, w9			; CHECK-NEXT: dup v2.4s, w9
				; CHECK-NEXT: adrp x8, .LCPI2_0
	; CHECK-NEXT: mla v2.4s, v0.4s, v1.4s			; CHECK-NEXT: mla v2.4s, v0.4s, v1.4s
	; CHECK-NEXT: ldr q0, [x10, :lo12:.LCPI2_0]
	; CHECK-NEXT: movi v1.4s, #1			; CHECK-NEXT: movi v1.4s, #1
				; CHECK-NEXT: ldr q0, [x8, :lo12:.LCPI2_0]
	; CHECK-NEXT: cmhi v0.4s, v2.4s, v0.4s			; CHECK-NEXT: cmhi v0.4s, v2.4s, v0.4s
	; CHECK-NEXT: and v0.16b, v0.16b, v1.16b			; CHECK-NEXT: and v0.16b, v0.16b, v1.16b
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%srem = srem <4 x i32> %X, <i32 5, i32 5, i32 4294967295, i32 5>			%srem = srem <4 x i32> %X, <i32 5, i32 5, i32 4294967295, i32 5>
	%cmp = icmp ne <4 x i32> %srem, <i32 0, i32 0, i32 0, i32 0>			%cmp = icmp ne <4 x i32> %srem, <i32 0, i32 0, i32 0, i32 0>
	%ret = zext <4 x i1> %cmp to <4 x i32>			%ret = zext <4 x i1> %cmp to <4 x i32>
	ret <4 x i32> %ret			ret <4 x i32> %ret
	}			}

	; One all-ones divisor in even divisor			; One all-ones divisor in even divisor
	define <4 x i32> @test_srem_even_allones_eq(<4 x i32> %X) nounwind {			define <4 x i32> @test_srem_even_allones_eq(<4 x i32> %X) nounwind {
	; CHECK-LABEL: test_srem_even_allones_eq:			; CHECK-LABEL: test_srem_even_allones_eq:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: mov w8, #28087			; CHECK-NEXT: mov w8, #28087
	; CHECK-NEXT: mov w9, #9362			; CHECK-NEXT: mov w9, #9362
	; CHECK-NEXT: movk w8, #46811, lsl #16			; CHECK-NEXT: movk w8, #46811, lsl #16
	; CHECK-NEXT: movk w9, #4681, lsl #16			; CHECK-NEXT: movk w9, #4681, lsl #16
				; CHECK-NEXT: movi v3.4s, #1
	; CHECK-NEXT: dup v1.4s, w8			; CHECK-NEXT: dup v1.4s, w8
	; CHECK-NEXT: dup v2.4s, w9			; CHECK-NEXT: dup v2.4s, w9
	; CHECK-NEXT: adrp x8, .LCPI3_0			; CHECK-NEXT: adrp x8, .LCPI3_0
	; CHECK-NEXT: mla v2.4s, v0.4s, v1.4s			; CHECK-NEXT: mla v2.4s, v0.4s, v1.4s
	; CHECK-NEXT: shl v0.4s, v2.4s, #31			; CHECK-NEXT: shl v0.4s, v2.4s, #31
	; CHECK-NEXT: ushr v1.4s, v2.4s, #1			; CHECK-NEXT: ushr v1.4s, v2.4s, #1
				; CHECK-NEXT: ldr q2, [x8, :lo12:.LCPI3_0]
	; CHECK-NEXT: orr v0.16b, v1.16b, v0.16b			; CHECK-NEXT: orr v0.16b, v1.16b, v0.16b
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI3_0]			; CHECK-NEXT: cmhs v0.4s, v2.4s, v0.4s
	; CHECK-NEXT: cmhs v0.4s, v1.4s, v0.4s			; CHECK-NEXT: and v0.16b, v0.16b, v3.16b
	; CHECK-NEXT: movi v1.4s, #1
	; CHECK-NEXT: and v0.16b, v0.16b, v1.16b
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%srem = srem <4 x i32> %X, <i32 14, i32 14, i32 4294967295, i32 14>			%srem = srem <4 x i32> %X, <i32 14, i32 14, i32 4294967295, i32 14>
	%cmp = icmp eq <4 x i32> %srem, <i32 0, i32 0, i32 0, i32 0>			%cmp = icmp eq <4 x i32> %srem, <i32 0, i32 0, i32 0, i32 0>
	%ret = zext <4 x i1> %cmp to <4 x i32>			%ret = zext <4 x i1> %cmp to <4 x i32>
	ret <4 x i32> %ret			ret <4 x i32> %ret
	}			}
	define <4 x i32> @test_srem_even_allones_ne(<4 x i32> %X) nounwind {			define <4 x i32> @test_srem_even_allones_ne(<4 x i32> %X) nounwind {
	; CHECK-LABEL: test_srem_even_allones_ne:			; CHECK-LABEL: test_srem_even_allones_ne:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: mov w8, #28087			; CHECK-NEXT: mov w8, #28087
	; CHECK-NEXT: mov w9, #9362			; CHECK-NEXT: mov w9, #9362
	; CHECK-NEXT: movk w8, #46811, lsl #16			; CHECK-NEXT: movk w8, #46811, lsl #16
	; CHECK-NEXT: movk w9, #4681, lsl #16			; CHECK-NEXT: movk w9, #4681, lsl #16
				; CHECK-NEXT: movi v3.4s, #1
	; CHECK-NEXT: dup v1.4s, w8			; CHECK-NEXT: dup v1.4s, w8
	; CHECK-NEXT: dup v2.4s, w9			; CHECK-NEXT: dup v2.4s, w9
	; CHECK-NEXT: adrp x8, .LCPI4_0			; CHECK-NEXT: adrp x8, .LCPI4_0
	; CHECK-NEXT: mla v2.4s, v0.4s, v1.4s			; CHECK-NEXT: mla v2.4s, v0.4s, v1.4s
	; CHECK-NEXT: shl v0.4s, v2.4s, #31			; CHECK-NEXT: shl v0.4s, v2.4s, #31
	; CHECK-NEXT: ushr v1.4s, v2.4s, #1			; CHECK-NEXT: ushr v1.4s, v2.4s, #1
				; CHECK-NEXT: ldr q2, [x8, :lo12:.LCPI4_0]
	; CHECK-NEXT: orr v0.16b, v1.16b, v0.16b			; CHECK-NEXT: orr v0.16b, v1.16b, v0.16b
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI4_0]			; CHECK-NEXT: cmhi v0.4s, v0.4s, v2.4s
	; CHECK-NEXT: cmhi v0.4s, v0.4s, v1.4s			; CHECK-NEXT: and v0.16b, v0.16b, v3.16b
	; CHECK-NEXT: movi v1.4s, #1
	; CHECK-NEXT: and v0.16b, v0.16b, v1.16b
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%srem = srem <4 x i32> %X, <i32 14, i32 14, i32 4294967295, i32 14>			%srem = srem <4 x i32> %X, <i32 14, i32 14, i32 4294967295, i32 14>
	%cmp = icmp ne <4 x i32> %srem, <i32 0, i32 0, i32 0, i32 0>			%cmp = icmp ne <4 x i32> %srem, <i32 0, i32 0, i32 0, i32 0>
	%ret = zext <4 x i1> %cmp to <4 x i32>			%ret = zext <4 x i1> %cmp to <4 x i32>
	ret <4 x i32> %ret			ret <4 x i32> %ret
	}			}

	; One all-ones divisor in odd+even divisor			; One all-ones divisor in odd+even divisor
	define <4 x i32> @test_srem_odd_even_allones_eq(<4 x i32> %X) nounwind {			define <4 x i32> @test_srem_odd_even_allones_eq(<4 x i32> %X) nounwind {
	; CHECK-LABEL: test_srem_odd_even_allones_eq:			; CHECK-LABEL: test_srem_odd_even_allones_eq:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: adrp x8, .LCPI5_0			; CHECK-NEXT: adrp x8, .LCPI5_0
	; CHECK-NEXT: adrp x9, .LCPI5_1			; CHECK-NEXT: adrp x9, .LCPI5_1
				; CHECK-NEXT: movi v3.4s, #1
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI5_0]			; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI5_0]
	; CHECK-NEXT: adrp x8, .LCPI5_2			; CHECK-NEXT: adrp x8, .LCPI5_2
	; CHECK-NEXT: ldr q2, [x9, :lo12:.LCPI5_1]			; CHECK-NEXT: ldr q2, [x9, :lo12:.LCPI5_1]
	; CHECK-NEXT: adrp x9, .LCPI5_3			; CHECK-NEXT: adrp x9, .LCPI5_3
	; CHECK-NEXT: mla v2.4s, v0.4s, v1.4s			; CHECK-NEXT: mla v2.4s, v0.4s, v1.4s
	; CHECK-NEXT: ldr q0, [x8, :lo12:.LCPI5_2]			; CHECK-NEXT: ldr q0, [x8, :lo12:.LCPI5_2]
	; CHECK-NEXT: ldr q1, [x9, :lo12:.LCPI5_3]			; CHECK-NEXT: ldr q1, [x9, :lo12:.LCPI5_3]
	; CHECK-NEXT: adrp x8, .LCPI5_4			; CHECK-NEXT: adrp x8, .LCPI5_4
	; CHECK-NEXT: ushl v0.4s, v2.4s, v0.4s			; CHECK-NEXT: ushl v0.4s, v2.4s, v0.4s
	; CHECK-NEXT: ushl v1.4s, v2.4s, v1.4s			; CHECK-NEXT: ushl v1.4s, v2.4s, v1.4s
				; CHECK-NEXT: ldr q2, [x8, :lo12:.LCPI5_4]
	; CHECK-NEXT: orr v0.16b, v1.16b, v0.16b			; CHECK-NEXT: orr v0.16b, v1.16b, v0.16b
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI5_4]			; CHECK-NEXT: cmhs v0.4s, v2.4s, v0.4s
	; CHECK-NEXT: cmhs v0.4s, v1.4s, v0.4s			; CHECK-NEXT: and v0.16b, v0.16b, v3.16b
	; CHECK-NEXT: movi v1.4s, #1
	; CHECK-NEXT: and v0.16b, v0.16b, v1.16b
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%srem = srem <4 x i32> %X, <i32 5, i32 14, i32 4294967295, i32 100>			%srem = srem <4 x i32> %X, <i32 5, i32 14, i32 4294967295, i32 100>
	%cmp = icmp eq <4 x i32> %srem, <i32 0, i32 0, i32 0, i32 0>			%cmp = icmp eq <4 x i32> %srem, <i32 0, i32 0, i32 0, i32 0>
	%ret = zext <4 x i1> %cmp to <4 x i32>			%ret = zext <4 x i1> %cmp to <4 x i32>
	ret <4 x i32> %ret			ret <4 x i32> %ret
	}			}
	define <4 x i32> @test_srem_odd_even_allones_ne(<4 x i32> %X) nounwind {			define <4 x i32> @test_srem_odd_even_allones_ne(<4 x i32> %X) nounwind {
	; CHECK-LABEL: test_srem_odd_even_allones_ne:			; CHECK-LABEL: test_srem_odd_even_allones_ne:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: adrp x8, .LCPI6_0			; CHECK-NEXT: adrp x8, .LCPI6_0
	; CHECK-NEXT: adrp x9, .LCPI6_1			; CHECK-NEXT: adrp x9, .LCPI6_1
				; CHECK-NEXT: movi v3.4s, #1
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI6_0]			; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI6_0]
	; CHECK-NEXT: adrp x8, .LCPI6_2			; CHECK-NEXT: adrp x8, .LCPI6_2
	; CHECK-NEXT: ldr q2, [x9, :lo12:.LCPI6_1]			; CHECK-NEXT: ldr q2, [x9, :lo12:.LCPI6_1]
	; CHECK-NEXT: adrp x9, .LCPI6_3			; CHECK-NEXT: adrp x9, .LCPI6_3
	; CHECK-NEXT: mla v2.4s, v0.4s, v1.4s			; CHECK-NEXT: mla v2.4s, v0.4s, v1.4s
	; CHECK-NEXT: ldr q0, [x8, :lo12:.LCPI6_2]			; CHECK-NEXT: ldr q0, [x8, :lo12:.LCPI6_2]
	; CHECK-NEXT: ldr q1, [x9, :lo12:.LCPI6_3]			; CHECK-NEXT: ldr q1, [x9, :lo12:.LCPI6_3]
	; CHECK-NEXT: adrp x8, .LCPI6_4			; CHECK-NEXT: adrp x8, .LCPI6_4
	; CHECK-NEXT: ushl v0.4s, v2.4s, v0.4s			; CHECK-NEXT: ushl v0.4s, v2.4s, v0.4s
	; CHECK-NEXT: ushl v1.4s, v2.4s, v1.4s			; CHECK-NEXT: ushl v1.4s, v2.4s, v1.4s
				; CHECK-NEXT: ldr q2, [x8, :lo12:.LCPI6_4]
	; CHECK-NEXT: orr v0.16b, v1.16b, v0.16b			; CHECK-NEXT: orr v0.16b, v1.16b, v0.16b
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI6_4]			; CHECK-NEXT: cmhi v0.4s, v0.4s, v2.4s
	; CHECK-NEXT: cmhi v0.4s, v0.4s, v1.4s			; CHECK-NEXT: and v0.16b, v0.16b, v3.16b
	; CHECK-NEXT: movi v1.4s, #1
	; CHECK-NEXT: and v0.16b, v0.16b, v1.16b
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%srem = srem <4 x i32> %X, <i32 5, i32 14, i32 4294967295, i32 100>			%srem = srem <4 x i32> %X, <i32 5, i32 14, i32 4294967295, i32 100>
	%cmp = icmp ne <4 x i32> %srem, <i32 0, i32 0, i32 0, i32 0>			%cmp = icmp ne <4 x i32> %srem, <i32 0, i32 0, i32 0, i32 0>
	%ret = zext <4 x i1> %cmp to <4 x i32>			%ret = zext <4 x i1> %cmp to <4 x i32>
	ret <4 x i32> %ret			ret <4 x i32> %ret
	}			}

	;------------------------------------------------------------------------------;			;------------------------------------------------------------------------------;

	; One power-of-two divisor in odd divisor			; One power-of-two divisor in odd divisor
	define <4 x i32> @test_srem_odd_poweroftwo(<4 x i32> %X) nounwind {			define <4 x i32> @test_srem_odd_poweroftwo(<4 x i32> %X) nounwind {
	; CHECK-LABEL: test_srem_odd_poweroftwo:			; CHECK-LABEL: test_srem_odd_poweroftwo:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: adrp x8, .LCPI7_0			; CHECK-NEXT: adrp x8, .LCPI7_0
	; CHECK-NEXT: adrp x9, .LCPI7_1			; CHECK-NEXT: adrp x9, .LCPI7_1
				; CHECK-NEXT: movi v3.4s, #1
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI7_0]			; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI7_0]
	; CHECK-NEXT: adrp x8, .LCPI7_2			; CHECK-NEXT: adrp x8, .LCPI7_2
	; CHECK-NEXT: ldr q2, [x9, :lo12:.LCPI7_1]			; CHECK-NEXT: ldr q2, [x9, :lo12:.LCPI7_1]
	; CHECK-NEXT: adrp x9, .LCPI7_3			; CHECK-NEXT: adrp x9, .LCPI7_3
	; CHECK-NEXT: mla v2.4s, v0.4s, v1.4s			; CHECK-NEXT: mla v2.4s, v0.4s, v1.4s
	; CHECK-NEXT: ldr q0, [x8, :lo12:.LCPI7_2]			; CHECK-NEXT: ldr q0, [x8, :lo12:.LCPI7_2]
	; CHECK-NEXT: ldr q1, [x9, :lo12:.LCPI7_3]			; CHECK-NEXT: ldr q1, [x9, :lo12:.LCPI7_3]
	; CHECK-NEXT: adrp x8, .LCPI7_4			; CHECK-NEXT: adrp x8, .LCPI7_4
	; CHECK-NEXT: ushl v0.4s, v2.4s, v0.4s			; CHECK-NEXT: ushl v0.4s, v2.4s, v0.4s
	; CHECK-NEXT: ushl v1.4s, v2.4s, v1.4s			; CHECK-NEXT: ushl v1.4s, v2.4s, v1.4s
				; CHECK-NEXT: ldr q2, [x8, :lo12:.LCPI7_4]
	; CHECK-NEXT: orr v0.16b, v1.16b, v0.16b			; CHECK-NEXT: orr v0.16b, v1.16b, v0.16b
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI7_4]			; CHECK-NEXT: cmhs v0.4s, v2.4s, v0.4s
	; CHECK-NEXT: cmhs v0.4s, v1.4s, v0.4s			; CHECK-NEXT: and v0.16b, v0.16b, v3.16b
	; CHECK-NEXT: movi v1.4s, #1
	; CHECK-NEXT: and v0.16b, v0.16b, v1.16b
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%srem = srem <4 x i32> %X, <i32 5, i32 5, i32 16, i32 5>			%srem = srem <4 x i32> %X, <i32 5, i32 5, i32 16, i32 5>
	%cmp = icmp eq <4 x i32> %srem, <i32 0, i32 0, i32 0, i32 0>			%cmp = icmp eq <4 x i32> %srem, <i32 0, i32 0, i32 0, i32 0>
	%ret = zext <4 x i1> %cmp to <4 x i32>			%ret = zext <4 x i1> %cmp to <4 x i32>
	ret <4 x i32> %ret			ret <4 x i32> %ret
	}			}

	; One power-of-two divisor in even divisor			; One power-of-two divisor in even divisor
	define <4 x i32> @test_srem_even_poweroftwo(<4 x i32> %X) nounwind {			define <4 x i32> @test_srem_even_poweroftwo(<4 x i32> %X) nounwind {
	; CHECK-LABEL: test_srem_even_poweroftwo:			; CHECK-LABEL: test_srem_even_poweroftwo:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: adrp x8, .LCPI8_0			; CHECK-NEXT: adrp x8, .LCPI8_0
	; CHECK-NEXT: adrp x9, .LCPI8_1			; CHECK-NEXT: adrp x9, .LCPI8_1
				; CHECK-NEXT: movi v3.4s, #1
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI8_0]			; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI8_0]
	; CHECK-NEXT: adrp x8, .LCPI8_2			; CHECK-NEXT: adrp x8, .LCPI8_2
	; CHECK-NEXT: ldr q2, [x9, :lo12:.LCPI8_1]			; CHECK-NEXT: ldr q2, [x9, :lo12:.LCPI8_1]
	; CHECK-NEXT: adrp x9, .LCPI8_3			; CHECK-NEXT: adrp x9, .LCPI8_3
	; CHECK-NEXT: mla v2.4s, v0.4s, v1.4s			; CHECK-NEXT: mla v2.4s, v0.4s, v1.4s
	; CHECK-NEXT: ldr q0, [x8, :lo12:.LCPI8_2]			; CHECK-NEXT: ldr q0, [x8, :lo12:.LCPI8_2]
	; CHECK-NEXT: ldr q1, [x9, :lo12:.LCPI8_3]			; CHECK-NEXT: ldr q1, [x9, :lo12:.LCPI8_3]
	; CHECK-NEXT: adrp x8, .LCPI8_4			; CHECK-NEXT: adrp x8, .LCPI8_4
	; CHECK-NEXT: ushl v0.4s, v2.4s, v0.4s			; CHECK-NEXT: ushl v0.4s, v2.4s, v0.4s
	; CHECK-NEXT: ushl v1.4s, v2.4s, v1.4s			; CHECK-NEXT: ushl v1.4s, v2.4s, v1.4s
				; CHECK-NEXT: ldr q2, [x8, :lo12:.LCPI8_4]
	; CHECK-NEXT: orr v0.16b, v1.16b, v0.16b			; CHECK-NEXT: orr v0.16b, v1.16b, v0.16b
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI8_4]			; CHECK-NEXT: cmhs v0.4s, v2.4s, v0.4s
	; CHECK-NEXT: cmhs v0.4s, v1.4s, v0.4s			; CHECK-NEXT: and v0.16b, v0.16b, v3.16b
	; CHECK-NEXT: movi v1.4s, #1
	; CHECK-NEXT: and v0.16b, v0.16b, v1.16b
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%srem = srem <4 x i32> %X, <i32 14, i32 14, i32 16, i32 14>			%srem = srem <4 x i32> %X, <i32 14, i32 14, i32 16, i32 14>
	%cmp = icmp eq <4 x i32> %srem, <i32 0, i32 0, i32 0, i32 0>			%cmp = icmp eq <4 x i32> %srem, <i32 0, i32 0, i32 0, i32 0>
	%ret = zext <4 x i1> %cmp to <4 x i32>			%ret = zext <4 x i1> %cmp to <4 x i32>
	ret <4 x i32> %ret			ret <4 x i32> %ret
	}			}

	; One power-of-two divisor in odd+even divisor			; One power-of-two divisor in odd+even divisor
	define <4 x i32> @test_srem_odd_even_poweroftwo(<4 x i32> %X) nounwind {			define <4 x i32> @test_srem_odd_even_poweroftwo(<4 x i32> %X) nounwind {
	; CHECK-LABEL: test_srem_odd_even_poweroftwo:			; CHECK-LABEL: test_srem_odd_even_poweroftwo:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: adrp x8, .LCPI9_0			; CHECK-NEXT: adrp x8, .LCPI9_0
	; CHECK-NEXT: adrp x9, .LCPI9_1			; CHECK-NEXT: adrp x9, .LCPI9_1
				; CHECK-NEXT: movi v3.4s, #1
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI9_0]			; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI9_0]
	; CHECK-NEXT: adrp x8, .LCPI9_2			; CHECK-NEXT: adrp x8, .LCPI9_2
	; CHECK-NEXT: ldr q2, [x9, :lo12:.LCPI9_1]			; CHECK-NEXT: ldr q2, [x9, :lo12:.LCPI9_1]
	; CHECK-NEXT: adrp x9, .LCPI9_3			; CHECK-NEXT: adrp x9, .LCPI9_3
	; CHECK-NEXT: mla v2.4s, v0.4s, v1.4s			; CHECK-NEXT: mla v2.4s, v0.4s, v1.4s
	; CHECK-NEXT: ldr q0, [x8, :lo12:.LCPI9_2]			; CHECK-NEXT: ldr q0, [x8, :lo12:.LCPI9_2]
	; CHECK-NEXT: ldr q1, [x9, :lo12:.LCPI9_3]			; CHECK-NEXT: ldr q1, [x9, :lo12:.LCPI9_3]
	; CHECK-NEXT: adrp x8, .LCPI9_4			; CHECK-NEXT: adrp x8, .LCPI9_4
	; CHECK-NEXT: ushl v0.4s, v2.4s, v0.4s			; CHECK-NEXT: ushl v0.4s, v2.4s, v0.4s
	; CHECK-NEXT: ushl v1.4s, v2.4s, v1.4s			; CHECK-NEXT: ushl v1.4s, v2.4s, v1.4s
				; CHECK-NEXT: ldr q2, [x8, :lo12:.LCPI9_4]
	; CHECK-NEXT: orr v0.16b, v1.16b, v0.16b			; CHECK-NEXT: orr v0.16b, v1.16b, v0.16b
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI9_4]			; CHECK-NEXT: cmhs v0.4s, v2.4s, v0.4s
	; CHECK-NEXT: cmhs v0.4s, v1.4s, v0.4s			; CHECK-NEXT: and v0.16b, v0.16b, v3.16b
	; CHECK-NEXT: movi v1.4s, #1
	; CHECK-NEXT: and v0.16b, v0.16b, v1.16b
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%srem = srem <4 x i32> %X, <i32 5, i32 14, i32 16, i32 100>			%srem = srem <4 x i32> %X, <i32 5, i32 14, i32 16, i32 100>
	%cmp = icmp eq <4 x i32> %srem, <i32 0, i32 0, i32 0, i32 0>			%cmp = icmp eq <4 x i32> %srem, <i32 0, i32 0, i32 0, i32 0>
	%ret = zext <4 x i1> %cmp to <4 x i32>			%ret = zext <4 x i1> %cmp to <4 x i32>
	ret <4 x i32> %ret			ret <4 x i32> %ret
	}			}

	;------------------------------------------------------------------------------;			;------------------------------------------------------------------------------;

	; One one divisor in odd divisor			; One one divisor in odd divisor
	define <4 x i32> @test_srem_odd_one(<4 x i32> %X) nounwind {			define <4 x i32> @test_srem_odd_one(<4 x i32> %X) nounwind {
	; CHECK-LABEL: test_srem_odd_one:			; CHECK-LABEL: test_srem_odd_one:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: mov w8, #52429			; CHECK-NEXT: mov w8, #52429
	; CHECK-NEXT: mov w9, #39321			; CHECK-NEXT: mov w9, #39321
	; CHECK-NEXT: movk w8, #52428, lsl #16			; CHECK-NEXT: movk w8, #52428, lsl #16
	; CHECK-NEXT: movk w9, #6553, lsl #16			; CHECK-NEXT: movk w9, #6553, lsl #16
	; CHECK-NEXT: adrp x10, .LCPI10_0
	; CHECK-NEXT: dup v1.4s, w8			; CHECK-NEXT: dup v1.4s, w8
	; CHECK-NEXT: dup v2.4s, w9			; CHECK-NEXT: dup v2.4s, w9
				; CHECK-NEXT: adrp x8, .LCPI10_0
	; CHECK-NEXT: mla v2.4s, v0.4s, v1.4s			; CHECK-NEXT: mla v2.4s, v0.4s, v1.4s
	; CHECK-NEXT: ldr q0, [x10, :lo12:.LCPI10_0]
	; CHECK-NEXT: movi v1.4s, #1			; CHECK-NEXT: movi v1.4s, #1
				; CHECK-NEXT: ldr q0, [x8, :lo12:.LCPI10_0]
	; CHECK-NEXT: cmhs v0.4s, v0.4s, v2.4s			; CHECK-NEXT: cmhs v0.4s, v0.4s, v2.4s
	; CHECK-NEXT: and v0.16b, v0.16b, v1.16b			; CHECK-NEXT: and v0.16b, v0.16b, v1.16b
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%srem = srem <4 x i32> %X, <i32 5, i32 5, i32 1, i32 5>			%srem = srem <4 x i32> %X, <i32 5, i32 5, i32 1, i32 5>
	%cmp = icmp eq <4 x i32> %srem, <i32 0, i32 0, i32 0, i32 0>			%cmp = icmp eq <4 x i32> %srem, <i32 0, i32 0, i32 0, i32 0>
	%ret = zext <4 x i1> %cmp to <4 x i32>			%ret = zext <4 x i1> %cmp to <4 x i32>
	ret <4 x i32> %ret			ret <4 x i32> %ret
	}			}

	; One one divisor in even divisor			; One one divisor in even divisor
	define <4 x i32> @test_srem_even_one(<4 x i32> %X) nounwind {			define <4 x i32> @test_srem_even_one(<4 x i32> %X) nounwind {
	; CHECK-LABEL: test_srem_even_one:			; CHECK-LABEL: test_srem_even_one:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: mov w8, #28087			; CHECK-NEXT: mov w8, #28087
	; CHECK-NEXT: mov w9, #9362			; CHECK-NEXT: mov w9, #9362
	; CHECK-NEXT: movk w8, #46811, lsl #16			; CHECK-NEXT: movk w8, #46811, lsl #16
	; CHECK-NEXT: movk w9, #4681, lsl #16			; CHECK-NEXT: movk w9, #4681, lsl #16
				; CHECK-NEXT: movi v3.4s, #1
	; CHECK-NEXT: dup v1.4s, w8			; CHECK-NEXT: dup v1.4s, w8
	; CHECK-NEXT: dup v2.4s, w9			; CHECK-NEXT: dup v2.4s, w9
	; CHECK-NEXT: adrp x8, .LCPI11_0			; CHECK-NEXT: adrp x8, .LCPI11_0
	; CHECK-NEXT: mla v2.4s, v0.4s, v1.4s			; CHECK-NEXT: mla v2.4s, v0.4s, v1.4s
	; CHECK-NEXT: shl v0.4s, v2.4s, #31			; CHECK-NEXT: shl v0.4s, v2.4s, #31
	; CHECK-NEXT: ushr v1.4s, v2.4s, #1			; CHECK-NEXT: ushr v1.4s, v2.4s, #1
				; CHECK-NEXT: ldr q2, [x8, :lo12:.LCPI11_0]
	; CHECK-NEXT: orr v0.16b, v1.16b, v0.16b			; CHECK-NEXT: orr v0.16b, v1.16b, v0.16b
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI11_0]			; CHECK-NEXT: cmhs v0.4s, v2.4s, v0.4s
	; CHECK-NEXT: cmhs v0.4s, v1.4s, v0.4s			; CHECK-NEXT: and v0.16b, v0.16b, v3.16b
	; CHECK-NEXT: movi v1.4s, #1
	; CHECK-NEXT: and v0.16b, v0.16b, v1.16b
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%srem = srem <4 x i32> %X, <i32 14, i32 14, i32 1, i32 14>			%srem = srem <4 x i32> %X, <i32 14, i32 14, i32 1, i32 14>
	%cmp = icmp eq <4 x i32> %srem, <i32 0, i32 0, i32 0, i32 0>			%cmp = icmp eq <4 x i32> %srem, <i32 0, i32 0, i32 0, i32 0>
	%ret = zext <4 x i1> %cmp to <4 x i32>			%ret = zext <4 x i1> %cmp to <4 x i32>
	ret <4 x i32> %ret			ret <4 x i32> %ret
	}			}

	; One one divisor in odd+even divisor			; One one divisor in odd+even divisor
	define <4 x i32> @test_srem_odd_even_one(<4 x i32> %X) nounwind {			define <4 x i32> @test_srem_odd_even_one(<4 x i32> %X) nounwind {
	; CHECK-LABEL: test_srem_odd_even_one:			; CHECK-LABEL: test_srem_odd_even_one:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: adrp x8, .LCPI12_0			; CHECK-NEXT: adrp x8, .LCPI12_0
	; CHECK-NEXT: adrp x9, .LCPI12_1			; CHECK-NEXT: adrp x9, .LCPI12_1
				; CHECK-NEXT: movi v3.4s, #1
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI12_0]			; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI12_0]
	; CHECK-NEXT: adrp x8, .LCPI12_2			; CHECK-NEXT: adrp x8, .LCPI12_2
	; CHECK-NEXT: ldr q2, [x9, :lo12:.LCPI12_1]			; CHECK-NEXT: ldr q2, [x9, :lo12:.LCPI12_1]
	; CHECK-NEXT: adrp x9, .LCPI12_3			; CHECK-NEXT: adrp x9, .LCPI12_3
	; CHECK-NEXT: mla v2.4s, v0.4s, v1.4s			; CHECK-NEXT: mla v2.4s, v0.4s, v1.4s
	; CHECK-NEXT: ldr q0, [x8, :lo12:.LCPI12_2]			; CHECK-NEXT: ldr q0, [x8, :lo12:.LCPI12_2]
	; CHECK-NEXT: ldr q1, [x9, :lo12:.LCPI12_3]			; CHECK-NEXT: ldr q1, [x9, :lo12:.LCPI12_3]
	; CHECK-NEXT: adrp x8, .LCPI12_4			; CHECK-NEXT: adrp x8, .LCPI12_4
	; CHECK-NEXT: ushl v0.4s, v2.4s, v0.4s			; CHECK-NEXT: ushl v0.4s, v2.4s, v0.4s
	; CHECK-NEXT: ushl v1.4s, v2.4s, v1.4s			; CHECK-NEXT: ushl v1.4s, v2.4s, v1.4s
				; CHECK-NEXT: ldr q2, [x8, :lo12:.LCPI12_4]
	; CHECK-NEXT: orr v0.16b, v1.16b, v0.16b			; CHECK-NEXT: orr v0.16b, v1.16b, v0.16b
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI12_4]			; CHECK-NEXT: cmhs v0.4s, v2.4s, v0.4s
	; CHECK-NEXT: cmhs v0.4s, v1.4s, v0.4s			; CHECK-NEXT: and v0.16b, v0.16b, v3.16b
	; CHECK-NEXT: movi v1.4s, #1
	; CHECK-NEXT: and v0.16b, v0.16b, v1.16b
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%srem = srem <4 x i32> %X, <i32 5, i32 14, i32 1, i32 100>			%srem = srem <4 x i32> %X, <i32 5, i32 14, i32 1, i32 100>
	%cmp = icmp eq <4 x i32> %srem, <i32 0, i32 0, i32 0, i32 0>			%cmp = icmp eq <4 x i32> %srem, <i32 0, i32 0, i32 0, i32 0>
	%ret = zext <4 x i1> %cmp to <4 x i32>			%ret = zext <4 x i1> %cmp to <4 x i32>
	ret <4 x i32> %ret			ret <4 x i32> %ret
	}			}

	;------------------------------------------------------------------------------;			;------------------------------------------------------------------------------;
	▲ Show 20 Lines • Show All 88 Lines • ▼ Show 20 Lines
	;==============================================================================;			;==============================================================================;

	; One all-ones divisor and power-of-two divisor divisor in odd divisor			; One all-ones divisor and power-of-two divisor divisor in odd divisor
	define <4 x i32> @test_srem_odd_allones_and_poweroftwo(<4 x i32> %X) nounwind {			define <4 x i32> @test_srem_odd_allones_and_poweroftwo(<4 x i32> %X) nounwind {
	; CHECK-LABEL: test_srem_odd_allones_and_poweroftwo:			; CHECK-LABEL: test_srem_odd_allones_and_poweroftwo:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: adrp x8, .LCPI16_0			; CHECK-NEXT: adrp x8, .LCPI16_0
	; CHECK-NEXT: adrp x9, .LCPI16_1			; CHECK-NEXT: adrp x9, .LCPI16_1
				; CHECK-NEXT: movi v3.4s, #1
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI16_0]			; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI16_0]
	; CHECK-NEXT: adrp x8, .LCPI16_2			; CHECK-NEXT: adrp x8, .LCPI16_2
	; CHECK-NEXT: ldr q2, [x9, :lo12:.LCPI16_1]			; CHECK-NEXT: ldr q2, [x9, :lo12:.LCPI16_1]
	; CHECK-NEXT: adrp x9, .LCPI16_3			; CHECK-NEXT: adrp x9, .LCPI16_3
	; CHECK-NEXT: mla v2.4s, v0.4s, v1.4s			; CHECK-NEXT: mla v2.4s, v0.4s, v1.4s
	; CHECK-NEXT: ldr q0, [x8, :lo12:.LCPI16_2]			; CHECK-NEXT: ldr q0, [x8, :lo12:.LCPI16_2]
	; CHECK-NEXT: ldr q1, [x9, :lo12:.LCPI16_3]			; CHECK-NEXT: ldr q1, [x9, :lo12:.LCPI16_3]
	; CHECK-NEXT: adrp x8, .LCPI16_4			; CHECK-NEXT: adrp x8, .LCPI16_4
	; CHECK-NEXT: ushl v0.4s, v2.4s, v0.4s			; CHECK-NEXT: ushl v0.4s, v2.4s, v0.4s
	; CHECK-NEXT: ushl v1.4s, v2.4s, v1.4s			; CHECK-NEXT: ushl v1.4s, v2.4s, v1.4s
				; CHECK-NEXT: ldr q2, [x8, :lo12:.LCPI16_4]
	; CHECK-NEXT: orr v0.16b, v1.16b, v0.16b			; CHECK-NEXT: orr v0.16b, v1.16b, v0.16b
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI16_4]			; CHECK-NEXT: cmhs v0.4s, v2.4s, v0.4s
	; CHECK-NEXT: cmhs v0.4s, v1.4s, v0.4s			; CHECK-NEXT: and v0.16b, v0.16b, v3.16b
	; CHECK-NEXT: movi v1.4s, #1
	; CHECK-NEXT: and v0.16b, v0.16b, v1.16b
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%srem = srem <4 x i32> %X, <i32 5, i32 4294967295, i32 16, i32 5>			%srem = srem <4 x i32> %X, <i32 5, i32 4294967295, i32 16, i32 5>
	%cmp = icmp eq <4 x i32> %srem, <i32 0, i32 0, i32 0, i32 0>			%cmp = icmp eq <4 x i32> %srem, <i32 0, i32 0, i32 0, i32 0>
	%ret = zext <4 x i1> %cmp to <4 x i32>			%ret = zext <4 x i1> %cmp to <4 x i32>
	ret <4 x i32> %ret			ret <4 x i32> %ret
	}			}

	; One all-ones divisor and power-of-two divisor divisor in even divisor			; One all-ones divisor and power-of-two divisor divisor in even divisor
	define <4 x i32> @test_srem_even_allones_and_poweroftwo(<4 x i32> %X) nounwind {			define <4 x i32> @test_srem_even_allones_and_poweroftwo(<4 x i32> %X) nounwind {
	; CHECK-LABEL: test_srem_even_allones_and_poweroftwo:			; CHECK-LABEL: test_srem_even_allones_and_poweroftwo:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: adrp x8, .LCPI17_0			; CHECK-NEXT: adrp x8, .LCPI17_0
	; CHECK-NEXT: adrp x9, .LCPI17_1			; CHECK-NEXT: adrp x9, .LCPI17_1
				; CHECK-NEXT: movi v3.4s, #1
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI17_0]			; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI17_0]
	; CHECK-NEXT: adrp x8, .LCPI17_2			; CHECK-NEXT: adrp x8, .LCPI17_2
	; CHECK-NEXT: ldr q2, [x9, :lo12:.LCPI17_1]			; CHECK-NEXT: ldr q2, [x9, :lo12:.LCPI17_1]
	; CHECK-NEXT: adrp x9, .LCPI17_3			; CHECK-NEXT: adrp x9, .LCPI17_3
	; CHECK-NEXT: mla v2.4s, v0.4s, v1.4s			; CHECK-NEXT: mla v2.4s, v0.4s, v1.4s
	; CHECK-NEXT: ldr q0, [x8, :lo12:.LCPI17_2]			; CHECK-NEXT: ldr q0, [x8, :lo12:.LCPI17_2]
	; CHECK-NEXT: ldr q1, [x9, :lo12:.LCPI17_3]			; CHECK-NEXT: ldr q1, [x9, :lo12:.LCPI17_3]
	; CHECK-NEXT: adrp x8, .LCPI17_4			; CHECK-NEXT: adrp x8, .LCPI17_4
	; CHECK-NEXT: ushl v0.4s, v2.4s, v0.4s			; CHECK-NEXT: ushl v0.4s, v2.4s, v0.4s
	; CHECK-NEXT: ushl v1.4s, v2.4s, v1.4s			; CHECK-NEXT: ushl v1.4s, v2.4s, v1.4s
				; CHECK-NEXT: ldr q2, [x8, :lo12:.LCPI17_4]
	; CHECK-NEXT: orr v0.16b, v1.16b, v0.16b			; CHECK-NEXT: orr v0.16b, v1.16b, v0.16b
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI17_4]			; CHECK-NEXT: cmhs v0.4s, v2.4s, v0.4s
	; CHECK-NEXT: cmhs v0.4s, v1.4s, v0.4s			; CHECK-NEXT: and v0.16b, v0.16b, v3.16b
	; CHECK-NEXT: movi v1.4s, #1
	; CHECK-NEXT: and v0.16b, v0.16b, v1.16b
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%srem = srem <4 x i32> %X, <i32 14, i32 4294967295, i32 16, i32 14>			%srem = srem <4 x i32> %X, <i32 14, i32 4294967295, i32 16, i32 14>
	%cmp = icmp eq <4 x i32> %srem, <i32 0, i32 0, i32 0, i32 0>			%cmp = icmp eq <4 x i32> %srem, <i32 0, i32 0, i32 0, i32 0>
	%ret = zext <4 x i1> %cmp to <4 x i32>			%ret = zext <4 x i1> %cmp to <4 x i32>
	ret <4 x i32> %ret			ret <4 x i32> %ret
	}			}

	; One all-ones divisor and power-of-two divisor divisor in odd+even divisor			; One all-ones divisor and power-of-two divisor divisor in odd+even divisor
	define <4 x i32> @test_srem_odd_even_allones_and_poweroftwo(<4 x i32> %X) nounwind {			define <4 x i32> @test_srem_odd_even_allones_and_poweroftwo(<4 x i32> %X) nounwind {
	; CHECK-LABEL: test_srem_odd_even_allones_and_poweroftwo:			; CHECK-LABEL: test_srem_odd_even_allones_and_poweroftwo:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: adrp x8, .LCPI18_0			; CHECK-NEXT: adrp x8, .LCPI18_0
	; CHECK-NEXT: adrp x9, .LCPI18_1			; CHECK-NEXT: adrp x9, .LCPI18_1
				; CHECK-NEXT: movi v3.4s, #1
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI18_0]			; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI18_0]
	; CHECK-NEXT: adrp x8, .LCPI18_2			; CHECK-NEXT: adrp x8, .LCPI18_2
	; CHECK-NEXT: ldr q2, [x9, :lo12:.LCPI18_1]			; CHECK-NEXT: ldr q2, [x9, :lo12:.LCPI18_1]
	; CHECK-NEXT: adrp x9, .LCPI18_3			; CHECK-NEXT: adrp x9, .LCPI18_3
	; CHECK-NEXT: mla v2.4s, v0.4s, v1.4s			; CHECK-NEXT: mla v2.4s, v0.4s, v1.4s
	; CHECK-NEXT: ldr q0, [x8, :lo12:.LCPI18_2]			; CHECK-NEXT: ldr q0, [x8, :lo12:.LCPI18_2]
	; CHECK-NEXT: ldr q1, [x9, :lo12:.LCPI18_3]			; CHECK-NEXT: ldr q1, [x9, :lo12:.LCPI18_3]
	; CHECK-NEXT: adrp x8, .LCPI18_4			; CHECK-NEXT: adrp x8, .LCPI18_4
	; CHECK-NEXT: ushl v0.4s, v2.4s, v0.4s			; CHECK-NEXT: ushl v0.4s, v2.4s, v0.4s
	; CHECK-NEXT: ushl v1.4s, v2.4s, v1.4s			; CHECK-NEXT: ushl v1.4s, v2.4s, v1.4s
				; CHECK-NEXT: ldr q2, [x8, :lo12:.LCPI18_4]
	; CHECK-NEXT: orr v0.16b, v1.16b, v0.16b			; CHECK-NEXT: orr v0.16b, v1.16b, v0.16b
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI18_4]			; CHECK-NEXT: cmhs v0.4s, v2.4s, v0.4s
	; CHECK-NEXT: cmhs v0.4s, v1.4s, v0.4s			; CHECK-NEXT: and v0.16b, v0.16b, v3.16b
	; CHECK-NEXT: movi v1.4s, #1
	; CHECK-NEXT: and v0.16b, v0.16b, v1.16b
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%srem = srem <4 x i32> %X, <i32 5, i32 4294967295, i32 16, i32 100>			%srem = srem <4 x i32> %X, <i32 5, i32 4294967295, i32 16, i32 100>
	%cmp = icmp eq <4 x i32> %srem, <i32 0, i32 0, i32 0, i32 0>			%cmp = icmp eq <4 x i32> %srem, <i32 0, i32 0, i32 0, i32 0>
	%ret = zext <4 x i1> %cmp to <4 x i32>			%ret = zext <4 x i1> %cmp to <4 x i32>
	ret <4 x i32> %ret			ret <4 x i32> %ret
	}			}

	;------------------------------------------------------------------------------;			;------------------------------------------------------------------------------;

	; One all-ones divisor and one one divisor in odd divisor			; One all-ones divisor and one one divisor in odd divisor
	define <4 x i32> @test_srem_odd_allones_and_one(<4 x i32> %X) nounwind {			define <4 x i32> @test_srem_odd_allones_and_one(<4 x i32> %X) nounwind {
	; CHECK-LABEL: test_srem_odd_allones_and_one:			; CHECK-LABEL: test_srem_odd_allones_and_one:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: mov w8, #52429			; CHECK-NEXT: mov w8, #52429
	; CHECK-NEXT: mov w9, #39321			; CHECK-NEXT: mov w9, #39321
	; CHECK-NEXT: movk w8, #52428, lsl #16			; CHECK-NEXT: movk w8, #52428, lsl #16
	; CHECK-NEXT: movk w9, #6553, lsl #16			; CHECK-NEXT: movk w9, #6553, lsl #16
	; CHECK-NEXT: adrp x10, .LCPI19_0
	; CHECK-NEXT: dup v1.4s, w8			; CHECK-NEXT: dup v1.4s, w8
	; CHECK-NEXT: dup v2.4s, w9			; CHECK-NEXT: dup v2.4s, w9
				; CHECK-NEXT: adrp x8, .LCPI19_0
	; CHECK-NEXT: mla v2.4s, v0.4s, v1.4s			; CHECK-NEXT: mla v2.4s, v0.4s, v1.4s
	; CHECK-NEXT: ldr q0, [x10, :lo12:.LCPI19_0]
	; CHECK-NEXT: movi v1.4s, #1			; CHECK-NEXT: movi v1.4s, #1
				; CHECK-NEXT: ldr q0, [x8, :lo12:.LCPI19_0]
	; CHECK-NEXT: cmhs v0.4s, v0.4s, v2.4s			; CHECK-NEXT: cmhs v0.4s, v0.4s, v2.4s
	; CHECK-NEXT: and v0.16b, v0.16b, v1.16b			; CHECK-NEXT: and v0.16b, v0.16b, v1.16b
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%srem = srem <4 x i32> %X, <i32 5, i32 4294967295, i32 1, i32 5>			%srem = srem <4 x i32> %X, <i32 5, i32 4294967295, i32 1, i32 5>
	%cmp = icmp eq <4 x i32> %srem, <i32 0, i32 0, i32 0, i32 0>			%cmp = icmp eq <4 x i32> %srem, <i32 0, i32 0, i32 0, i32 0>
	%ret = zext <4 x i1> %cmp to <4 x i32>			%ret = zext <4 x i1> %cmp to <4 x i32>
	ret <4 x i32> %ret			ret <4 x i32> %ret
	}			}

	; One all-ones divisor and one one divisor in even divisor			; One all-ones divisor and one one divisor in even divisor
	define <4 x i32> @test_srem_even_allones_and_one(<4 x i32> %X) nounwind {			define <4 x i32> @test_srem_even_allones_and_one(<4 x i32> %X) nounwind {
	; CHECK-LABEL: test_srem_even_allones_and_one:			; CHECK-LABEL: test_srem_even_allones_and_one:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: mov w8, #28087			; CHECK-NEXT: mov w8, #28087
	; CHECK-NEXT: mov w9, #9362			; CHECK-NEXT: mov w9, #9362
	; CHECK-NEXT: movk w8, #46811, lsl #16			; CHECK-NEXT: movk w8, #46811, lsl #16
	; CHECK-NEXT: movk w9, #4681, lsl #16			; CHECK-NEXT: movk w9, #4681, lsl #16
				; CHECK-NEXT: movi v3.4s, #1
	; CHECK-NEXT: dup v1.4s, w8			; CHECK-NEXT: dup v1.4s, w8
	; CHECK-NEXT: dup v2.4s, w9			; CHECK-NEXT: dup v2.4s, w9
	; CHECK-NEXT: adrp x8, .LCPI20_0			; CHECK-NEXT: adrp x8, .LCPI20_0
	; CHECK-NEXT: mla v2.4s, v0.4s, v1.4s			; CHECK-NEXT: mla v2.4s, v0.4s, v1.4s
	; CHECK-NEXT: shl v0.4s, v2.4s, #31			; CHECK-NEXT: shl v0.4s, v2.4s, #31
	; CHECK-NEXT: ushr v1.4s, v2.4s, #1			; CHECK-NEXT: ushr v1.4s, v2.4s, #1
				; CHECK-NEXT: ldr q2, [x8, :lo12:.LCPI20_0]
	; CHECK-NEXT: orr v0.16b, v1.16b, v0.16b			; CHECK-NEXT: orr v0.16b, v1.16b, v0.16b
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI20_0]			; CHECK-NEXT: cmhs v0.4s, v2.4s, v0.4s
	; CHECK-NEXT: cmhs v0.4s, v1.4s, v0.4s			; CHECK-NEXT: and v0.16b, v0.16b, v3.16b
	; CHECK-NEXT: movi v1.4s, #1
	; CHECK-NEXT: and v0.16b, v0.16b, v1.16b
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%srem = srem <4 x i32> %X, <i32 14, i32 4294967295, i32 1, i32 14>			%srem = srem <4 x i32> %X, <i32 14, i32 4294967295, i32 1, i32 14>
	%cmp = icmp eq <4 x i32> %srem, <i32 0, i32 0, i32 0, i32 0>			%cmp = icmp eq <4 x i32> %srem, <i32 0, i32 0, i32 0, i32 0>
	%ret = zext <4 x i1> %cmp to <4 x i32>			%ret = zext <4 x i1> %cmp to <4 x i32>
	ret <4 x i32> %ret			ret <4 x i32> %ret
	}			}

	; One all-ones divisor and one one divisor in odd+even divisor			; One all-ones divisor and one one divisor in odd+even divisor
	define <4 x i32> @test_srem_odd_even_allones_and_one(<4 x i32> %X) nounwind {			define <4 x i32> @test_srem_odd_even_allones_and_one(<4 x i32> %X) nounwind {
	; CHECK-LABEL: test_srem_odd_even_allones_and_one:			; CHECK-LABEL: test_srem_odd_even_allones_and_one:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: adrp x8, .LCPI21_0			; CHECK-NEXT: adrp x8, .LCPI21_0
	; CHECK-NEXT: adrp x9, .LCPI21_1			; CHECK-NEXT: adrp x9, .LCPI21_1
				; CHECK-NEXT: movi v3.4s, #1
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI21_0]			; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI21_0]
	; CHECK-NEXT: adrp x8, .LCPI21_2			; CHECK-NEXT: adrp x8, .LCPI21_2
	; CHECK-NEXT: ldr q2, [x9, :lo12:.LCPI21_1]			; CHECK-NEXT: ldr q2, [x9, :lo12:.LCPI21_1]
	; CHECK-NEXT: adrp x9, .LCPI21_3			; CHECK-NEXT: adrp x9, .LCPI21_3
	; CHECK-NEXT: mla v2.4s, v0.4s, v1.4s			; CHECK-NEXT: mla v2.4s, v0.4s, v1.4s
	; CHECK-NEXT: ldr q0, [x8, :lo12:.LCPI21_2]			; CHECK-NEXT: ldr q0, [x8, :lo12:.LCPI21_2]
	; CHECK-NEXT: ldr q1, [x9, :lo12:.LCPI21_3]			; CHECK-NEXT: ldr q1, [x9, :lo12:.LCPI21_3]
	; CHECK-NEXT: adrp x8, .LCPI21_4			; CHECK-NEXT: adrp x8, .LCPI21_4
	; CHECK-NEXT: ushl v0.4s, v2.4s, v0.4s			; CHECK-NEXT: ushl v0.4s, v2.4s, v0.4s
	; CHECK-NEXT: ushl v1.4s, v2.4s, v1.4s			; CHECK-NEXT: ushl v1.4s, v2.4s, v1.4s
				; CHECK-NEXT: ldr q2, [x8, :lo12:.LCPI21_4]
	; CHECK-NEXT: orr v0.16b, v1.16b, v0.16b			; CHECK-NEXT: orr v0.16b, v1.16b, v0.16b
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI21_4]			; CHECK-NEXT: cmhs v0.4s, v2.4s, v0.4s
	; CHECK-NEXT: cmhs v0.4s, v1.4s, v0.4s			; CHECK-NEXT: and v0.16b, v0.16b, v3.16b
	; CHECK-NEXT: movi v1.4s, #1
	; CHECK-NEXT: and v0.16b, v0.16b, v1.16b
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%srem = srem <4 x i32> %X, <i32 5, i32 4294967295, i32 1, i32 100>			%srem = srem <4 x i32> %X, <i32 5, i32 4294967295, i32 1, i32 100>
	%cmp = icmp eq <4 x i32> %srem, <i32 0, i32 0, i32 0, i32 0>			%cmp = icmp eq <4 x i32> %srem, <i32 0, i32 0, i32 0, i32 0>
	%ret = zext <4 x i1> %cmp to <4 x i32>			%ret = zext <4 x i1> %cmp to <4 x i32>
	ret <4 x i32> %ret			ret <4 x i32> %ret
	}			}

	;------------------------------------------------------------------------------;			;------------------------------------------------------------------------------;

	; One power-of-two divisor divisor and one divisor in odd divisor			; One power-of-two divisor divisor and one divisor in odd divisor
	define <4 x i32> @test_srem_odd_poweroftwo_and_one(<4 x i32> %X) nounwind {			define <4 x i32> @test_srem_odd_poweroftwo_and_one(<4 x i32> %X) nounwind {
	; CHECK-LABEL: test_srem_odd_poweroftwo_and_one:			; CHECK-LABEL: test_srem_odd_poweroftwo_and_one:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: adrp x8, .LCPI22_0			; CHECK-NEXT: adrp x8, .LCPI22_0
	; CHECK-NEXT: adrp x9, .LCPI22_1			; CHECK-NEXT: adrp x9, .LCPI22_1
				; CHECK-NEXT: movi v3.4s, #1
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI22_0]			; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI22_0]
	; CHECK-NEXT: adrp x8, .LCPI22_2			; CHECK-NEXT: adrp x8, .LCPI22_2
	; CHECK-NEXT: ldr q2, [x9, :lo12:.LCPI22_1]			; CHECK-NEXT: ldr q2, [x9, :lo12:.LCPI22_1]
	; CHECK-NEXT: adrp x9, .LCPI22_3			; CHECK-NEXT: adrp x9, .LCPI22_3
	; CHECK-NEXT: mla v2.4s, v0.4s, v1.4s			; CHECK-NEXT: mla v2.4s, v0.4s, v1.4s
	; CHECK-NEXT: ldr q0, [x8, :lo12:.LCPI22_2]			; CHECK-NEXT: ldr q0, [x8, :lo12:.LCPI22_2]
	; CHECK-NEXT: ldr q1, [x9, :lo12:.LCPI22_3]			; CHECK-NEXT: ldr q1, [x9, :lo12:.LCPI22_3]
	; CHECK-NEXT: adrp x8, .LCPI22_4			; CHECK-NEXT: adrp x8, .LCPI22_4
	; CHECK-NEXT: ushl v0.4s, v2.4s, v0.4s			; CHECK-NEXT: ushl v0.4s, v2.4s, v0.4s
	; CHECK-NEXT: ushl v1.4s, v2.4s, v1.4s			; CHECK-NEXT: ushl v1.4s, v2.4s, v1.4s
				; CHECK-NEXT: ldr q2, [x8, :lo12:.LCPI22_4]
	; CHECK-NEXT: orr v0.16b, v1.16b, v0.16b			; CHECK-NEXT: orr v0.16b, v1.16b, v0.16b
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI22_4]			; CHECK-NEXT: cmhs v0.4s, v2.4s, v0.4s
	; CHECK-NEXT: cmhs v0.4s, v1.4s, v0.4s			; CHECK-NEXT: and v0.16b, v0.16b, v3.16b
	; CHECK-NEXT: movi v1.4s, #1
	; CHECK-NEXT: and v0.16b, v0.16b, v1.16b
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%srem = srem <4 x i32> %X, <i32 5, i32 16, i32 1, i32 5>			%srem = srem <4 x i32> %X, <i32 5, i32 16, i32 1, i32 5>
	%cmp = icmp eq <4 x i32> %srem, <i32 0, i32 0, i32 0, i32 0>			%cmp = icmp eq <4 x i32> %srem, <i32 0, i32 0, i32 0, i32 0>
	%ret = zext <4 x i1> %cmp to <4 x i32>			%ret = zext <4 x i1> %cmp to <4 x i32>
	ret <4 x i32> %ret			ret <4 x i32> %ret
	}			}

	; One power-of-two divisor divisor and one divisor in even divisor			; One power-of-two divisor divisor and one divisor in even divisor
	define <4 x i32> @test_srem_even_poweroftwo_and_one(<4 x i32> %X) nounwind {			define <4 x i32> @test_srem_even_poweroftwo_and_one(<4 x i32> %X) nounwind {
	; CHECK-LABEL: test_srem_even_poweroftwo_and_one:			; CHECK-LABEL: test_srem_even_poweroftwo_and_one:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: adrp x8, .LCPI23_0			; CHECK-NEXT: adrp x8, .LCPI23_0
	; CHECK-NEXT: adrp x9, .LCPI23_1			; CHECK-NEXT: adrp x9, .LCPI23_1
				; CHECK-NEXT: movi v3.4s, #1
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI23_0]			; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI23_0]
	; CHECK-NEXT: adrp x8, .LCPI23_2			; CHECK-NEXT: adrp x8, .LCPI23_2
	; CHECK-NEXT: ldr q2, [x9, :lo12:.LCPI23_1]			; CHECK-NEXT: ldr q2, [x9, :lo12:.LCPI23_1]
	; CHECK-NEXT: adrp x9, .LCPI23_3			; CHECK-NEXT: adrp x9, .LCPI23_3
	; CHECK-NEXT: mla v2.4s, v0.4s, v1.4s			; CHECK-NEXT: mla v2.4s, v0.4s, v1.4s
	; CHECK-NEXT: ldr q0, [x8, :lo12:.LCPI23_2]			; CHECK-NEXT: ldr q0, [x8, :lo12:.LCPI23_2]
	; CHECK-NEXT: ldr q1, [x9, :lo12:.LCPI23_3]			; CHECK-NEXT: ldr q1, [x9, :lo12:.LCPI23_3]
	; CHECK-NEXT: adrp x8, .LCPI23_4			; CHECK-NEXT: adrp x8, .LCPI23_4
	; CHECK-NEXT: ushl v0.4s, v2.4s, v0.4s			; CHECK-NEXT: ushl v0.4s, v2.4s, v0.4s
	; CHECK-NEXT: ushl v1.4s, v2.4s, v1.4s			; CHECK-NEXT: ushl v1.4s, v2.4s, v1.4s
				; CHECK-NEXT: ldr q2, [x8, :lo12:.LCPI23_4]
	; CHECK-NEXT: orr v0.16b, v1.16b, v0.16b			; CHECK-NEXT: orr v0.16b, v1.16b, v0.16b
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI23_4]			; CHECK-NEXT: cmhs v0.4s, v2.4s, v0.4s
	; CHECK-NEXT: cmhs v0.4s, v1.4s, v0.4s			; CHECK-NEXT: and v0.16b, v0.16b, v3.16b
	; CHECK-NEXT: movi v1.4s, #1
	; CHECK-NEXT: and v0.16b, v0.16b, v1.16b
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%srem = srem <4 x i32> %X, <i32 14, i32 16, i32 1, i32 14>			%srem = srem <4 x i32> %X, <i32 14, i32 16, i32 1, i32 14>
	%cmp = icmp eq <4 x i32> %srem, <i32 0, i32 0, i32 0, i32 0>			%cmp = icmp eq <4 x i32> %srem, <i32 0, i32 0, i32 0, i32 0>
	%ret = zext <4 x i1> %cmp to <4 x i32>			%ret = zext <4 x i1> %cmp to <4 x i32>
	ret <4 x i32> %ret			ret <4 x i32> %ret
	}			}

	; One power-of-two divisor divisor and one divisor in odd+even divisor			; One power-of-two divisor divisor and one divisor in odd+even divisor
	define <4 x i32> @test_srem_odd_even_poweroftwo_and_one(<4 x i32> %X) nounwind {			define <4 x i32> @test_srem_odd_even_poweroftwo_and_one(<4 x i32> %X) nounwind {
	; CHECK-LABEL: test_srem_odd_even_poweroftwo_and_one:			; CHECK-LABEL: test_srem_odd_even_poweroftwo_and_one:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: adrp x8, .LCPI24_0			; CHECK-NEXT: adrp x8, .LCPI24_0
	; CHECK-NEXT: adrp x9, .LCPI24_1			; CHECK-NEXT: adrp x9, .LCPI24_1
				; CHECK-NEXT: movi v3.4s, #1
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI24_0]			; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI24_0]
	; CHECK-NEXT: adrp x8, .LCPI24_2			; CHECK-NEXT: adrp x8, .LCPI24_2
	; CHECK-NEXT: ldr q2, [x9, :lo12:.LCPI24_1]			; CHECK-NEXT: ldr q2, [x9, :lo12:.LCPI24_1]
	; CHECK-NEXT: adrp x9, .LCPI24_3			; CHECK-NEXT: adrp x9, .LCPI24_3
	; CHECK-NEXT: mla v2.4s, v0.4s, v1.4s			; CHECK-NEXT: mla v2.4s, v0.4s, v1.4s
	; CHECK-NEXT: ldr q0, [x8, :lo12:.LCPI24_2]			; CHECK-NEXT: ldr q0, [x8, :lo12:.LCPI24_2]
	; CHECK-NEXT: ldr q1, [x9, :lo12:.LCPI24_3]			; CHECK-NEXT: ldr q1, [x9, :lo12:.LCPI24_3]
	; CHECK-NEXT: adrp x8, .LCPI24_4			; CHECK-NEXT: adrp x8, .LCPI24_4
	; CHECK-NEXT: ushl v0.4s, v2.4s, v0.4s			; CHECK-NEXT: ushl v0.4s, v2.4s, v0.4s
	; CHECK-NEXT: ushl v1.4s, v2.4s, v1.4s			; CHECK-NEXT: ushl v1.4s, v2.4s, v1.4s
				; CHECK-NEXT: ldr q2, [x8, :lo12:.LCPI24_4]
	; CHECK-NEXT: orr v0.16b, v1.16b, v0.16b			; CHECK-NEXT: orr v0.16b, v1.16b, v0.16b
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI24_4]			; CHECK-NEXT: cmhs v0.4s, v2.4s, v0.4s
	; CHECK-NEXT: cmhs v0.4s, v1.4s, v0.4s			; CHECK-NEXT: and v0.16b, v0.16b, v3.16b
	; CHECK-NEXT: movi v1.4s, #1
	; CHECK-NEXT: and v0.16b, v0.16b, v1.16b
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%srem = srem <4 x i32> %X, <i32 5, i32 16, i32 1, i32 100>			%srem = srem <4 x i32> %X, <i32 5, i32 16, i32 1, i32 100>
	%cmp = icmp eq <4 x i32> %srem, <i32 0, i32 0, i32 0, i32 0>			%cmp = icmp eq <4 x i32> %srem, <i32 0, i32 0, i32 0, i32 0>
	%ret = zext <4 x i1> %cmp to <4 x i32>			%ret = zext <4 x i1> %cmp to <4 x i32>
	ret <4 x i32> %ret			ret <4 x i32> %ret
	}			}

	;------------------------------------------------------------------------------;			;------------------------------------------------------------------------------;

	define <4 x i32> @test_srem_odd_allones_and_poweroftwo_and_one(<4 x i32> %X) nounwind {			define <4 x i32> @test_srem_odd_allones_and_poweroftwo_and_one(<4 x i32> %X) nounwind {
	; CHECK-LABEL: test_srem_odd_allones_and_poweroftwo_and_one:			; CHECK-LABEL: test_srem_odd_allones_and_poweroftwo_and_one:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: adrp x8, .LCPI25_0			; CHECK-NEXT: adrp x8, .LCPI25_0
	; CHECK-NEXT: adrp x9, .LCPI25_1			; CHECK-NEXT: adrp x9, .LCPI25_1
				; CHECK-NEXT: movi v3.4s, #1
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI25_0]			; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI25_0]
	; CHECK-NEXT: adrp x8, .LCPI25_2			; CHECK-NEXT: adrp x8, .LCPI25_2
	; CHECK-NEXT: ldr q2, [x9, :lo12:.LCPI25_1]			; CHECK-NEXT: ldr q2, [x9, :lo12:.LCPI25_1]
	; CHECK-NEXT: adrp x9, .LCPI25_3			; CHECK-NEXT: adrp x9, .LCPI25_3
	; CHECK-NEXT: mla v2.4s, v0.4s, v1.4s			; CHECK-NEXT: mla v2.4s, v0.4s, v1.4s
	; CHECK-NEXT: ldr q0, [x8, :lo12:.LCPI25_2]			; CHECK-NEXT: ldr q0, [x8, :lo12:.LCPI25_2]
	; CHECK-NEXT: ldr q1, [x9, :lo12:.LCPI25_3]			; CHECK-NEXT: ldr q1, [x9, :lo12:.LCPI25_3]
	; CHECK-NEXT: adrp x8, .LCPI25_4			; CHECK-NEXT: adrp x8, .LCPI25_4
	; CHECK-NEXT: ushl v0.4s, v2.4s, v0.4s			; CHECK-NEXT: ushl v0.4s, v2.4s, v0.4s
	; CHECK-NEXT: ushl v1.4s, v2.4s, v1.4s			; CHECK-NEXT: ushl v1.4s, v2.4s, v1.4s
				; CHECK-NEXT: ldr q2, [x8, :lo12:.LCPI25_4]
	; CHECK-NEXT: orr v0.16b, v1.16b, v0.16b			; CHECK-NEXT: orr v0.16b, v1.16b, v0.16b
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI25_4]			; CHECK-NEXT: cmhs v0.4s, v2.4s, v0.4s
	; CHECK-NEXT: cmhs v0.4s, v1.4s, v0.4s			; CHECK-NEXT: and v0.16b, v0.16b, v3.16b
	; CHECK-NEXT: movi v1.4s, #1
	; CHECK-NEXT: and v0.16b, v0.16b, v1.16b
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%srem = srem <4 x i32> %X, <i32 5, i32 4294967295, i32 16, i32 1>			%srem = srem <4 x i32> %X, <i32 5, i32 4294967295, i32 16, i32 1>
	%cmp = icmp eq <4 x i32> %srem, <i32 0, i32 0, i32 0, i32 0>			%cmp = icmp eq <4 x i32> %srem, <i32 0, i32 0, i32 0, i32 0>
	%ret = zext <4 x i1> %cmp to <4 x i32>			%ret = zext <4 x i1> %cmp to <4 x i32>
	ret <4 x i32> %ret			ret <4 x i32> %ret
	}			}

	define <4 x i32> @test_srem_even_allones_and_poweroftwo_and_one(<4 x i32> %X) nounwind {			define <4 x i32> @test_srem_even_allones_and_poweroftwo_and_one(<4 x i32> %X) nounwind {
	; CHECK-LABEL: test_srem_even_allones_and_poweroftwo_and_one:			; CHECK-LABEL: test_srem_even_allones_and_poweroftwo_and_one:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: adrp x8, .LCPI26_0			; CHECK-NEXT: adrp x8, .LCPI26_0
	; CHECK-NEXT: adrp x9, .LCPI26_1			; CHECK-NEXT: adrp x9, .LCPI26_1
				; CHECK-NEXT: movi v3.4s, #1
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI26_0]			; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI26_0]
	; CHECK-NEXT: adrp x8, .LCPI26_2			; CHECK-NEXT: adrp x8, .LCPI26_2
	; CHECK-NEXT: ldr q2, [x9, :lo12:.LCPI26_1]			; CHECK-NEXT: ldr q2, [x9, :lo12:.LCPI26_1]
	; CHECK-NEXT: adrp x9, .LCPI26_3			; CHECK-NEXT: adrp x9, .LCPI26_3
	; CHECK-NEXT: mla v2.4s, v0.4s, v1.4s			; CHECK-NEXT: mla v2.4s, v0.4s, v1.4s
	; CHECK-NEXT: ldr q0, [x8, :lo12:.LCPI26_2]			; CHECK-NEXT: ldr q0, [x8, :lo12:.LCPI26_2]
	; CHECK-NEXT: ldr q1, [x9, :lo12:.LCPI26_3]			; CHECK-NEXT: ldr q1, [x9, :lo12:.LCPI26_3]
	; CHECK-NEXT: adrp x8, .LCPI26_4			; CHECK-NEXT: adrp x8, .LCPI26_4
	; CHECK-NEXT: ushl v0.4s, v2.4s, v0.4s			; CHECK-NEXT: ushl v0.4s, v2.4s, v0.4s
	; CHECK-NEXT: ushl v1.4s, v2.4s, v1.4s			; CHECK-NEXT: ushl v1.4s, v2.4s, v1.4s
				; CHECK-NEXT: ldr q2, [x8, :lo12:.LCPI26_4]
	; CHECK-NEXT: orr v0.16b, v1.16b, v0.16b			; CHECK-NEXT: orr v0.16b, v1.16b, v0.16b
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI26_4]			; CHECK-NEXT: cmhs v0.4s, v2.4s, v0.4s
	; CHECK-NEXT: cmhs v0.4s, v1.4s, v0.4s			; CHECK-NEXT: and v0.16b, v0.16b, v3.16b
	; CHECK-NEXT: movi v1.4s, #1
	; CHECK-NEXT: and v0.16b, v0.16b, v1.16b
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%srem = srem <4 x i32> %X, <i32 14, i32 4294967295, i32 16, i32 1>			%srem = srem <4 x i32> %X, <i32 14, i32 4294967295, i32 16, i32 1>
	%cmp = icmp eq <4 x i32> %srem, <i32 0, i32 0, i32 0, i32 0>			%cmp = icmp eq <4 x i32> %srem, <i32 0, i32 0, i32 0, i32 0>
	%ret = zext <4 x i1> %cmp to <4 x i32>			%ret = zext <4 x i1> %cmp to <4 x i32>
	ret <4 x i32> %ret			ret <4 x i32> %ret
	}			}

llvm/test/CodeGen/AArch64/srem-seteq-vec-splat.ll

Show All 27 Lines
; Even divisors		; Even divisors
define <4 x i32> @test_srem_even_100(<4 x i32> %X) nounwind {		define <4 x i32> @test_srem_even_100(<4 x i32> %X) nounwind {
; CHECK-LABEL: test_srem_even_100:		; CHECK-LABEL: test_srem_even_100:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: mov w8, #23593		; CHECK-NEXT: mov w8, #23593
; CHECK-NEXT: mov w9, #47184		; CHECK-NEXT: mov w9, #47184
; CHECK-NEXT: movk w8, #49807, lsl #16		; CHECK-NEXT: movk w8, #49807, lsl #16
; CHECK-NEXT: movk w9, #1310, lsl #16		; CHECK-NEXT: movk w9, #1310, lsl #16
		; CHECK-NEXT: movi v3.4s, #1
; CHECK-NEXT: dup v1.4s, w8		; CHECK-NEXT: dup v1.4s, w8
; CHECK-NEXT: dup v2.4s, w9		; CHECK-NEXT: dup v2.4s, w9
; CHECK-NEXT: mov w8, #23592		; CHECK-NEXT: mov w8, #23592
; CHECK-NEXT: mla v2.4s, v0.4s, v1.4s		; CHECK-NEXT: mla v2.4s, v0.4s, v1.4s
; CHECK-NEXT: movk w8, #655, lsl #16		; CHECK-NEXT: movk w8, #655, lsl #16
; CHECK-NEXT: shl v0.4s, v2.4s, #30		; CHECK-NEXT: shl v0.4s, v2.4s, #30
; CHECK-NEXT: ushr v1.4s, v2.4s, #2		; CHECK-NEXT: ushr v1.4s, v2.4s, #2
		; CHECK-NEXT: dup v2.4s, w8
; CHECK-NEXT: orr v0.16b, v1.16b, v0.16b		; CHECK-NEXT: orr v0.16b, v1.16b, v0.16b
; CHECK-NEXT: dup v1.4s, w8		; CHECK-NEXT: cmhs v0.4s, v2.4s, v0.4s
; CHECK-NEXT: cmhs v0.4s, v1.4s, v0.4s		; CHECK-NEXT: and v0.16b, v0.16b, v3.16b
; CHECK-NEXT: movi v1.4s, #1
; CHECK-NEXT: and v0.16b, v0.16b, v1.16b
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%srem = srem <4 x i32> %X, <i32 100, i32 100, i32 100, i32 100>		%srem = srem <4 x i32> %X, <i32 100, i32 100, i32 100, i32 100>
%cmp = icmp eq <4 x i32> %srem, <i32 0, i32 0, i32 0, i32 0>		%cmp = icmp eq <4 x i32> %srem, <i32 0, i32 0, i32 0, i32 0>
%ret = zext <4 x i1> %cmp to <4 x i32>		%ret = zext <4 x i1> %cmp to <4 x i32>
ret <4 x i32> %ret		ret <4 x i32> %ret
}		}

; Negative divisors should be negated, and thus this is still splat vectors.		; Negative divisors should be negated, and thus this is still splat vectors.
Show All 25 Lines
; Even divisors		; Even divisors
define <4 x i32> @test_srem_even_neg100(<4 x i32> %X) nounwind {		define <4 x i32> @test_srem_even_neg100(<4 x i32> %X) nounwind {
; CHECK-LABEL: test_srem_even_neg100:		; CHECK-LABEL: test_srem_even_neg100:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: mov w8, #23593		; CHECK-NEXT: mov w8, #23593
; CHECK-NEXT: mov w9, #47184		; CHECK-NEXT: mov w9, #47184
; CHECK-NEXT: movk w8, #49807, lsl #16		; CHECK-NEXT: movk w8, #49807, lsl #16
; CHECK-NEXT: movk w9, #1310, lsl #16		; CHECK-NEXT: movk w9, #1310, lsl #16
		; CHECK-NEXT: movi v3.4s, #1
; CHECK-NEXT: dup v1.4s, w8		; CHECK-NEXT: dup v1.4s, w8
; CHECK-NEXT: dup v2.4s, w9		; CHECK-NEXT: dup v2.4s, w9
; CHECK-NEXT: mov w8, #23592		; CHECK-NEXT: mov w8, #23592
; CHECK-NEXT: mla v2.4s, v0.4s, v1.4s		; CHECK-NEXT: mla v2.4s, v0.4s, v1.4s
; CHECK-NEXT: movk w8, #655, lsl #16		; CHECK-NEXT: movk w8, #655, lsl #16
; CHECK-NEXT: shl v0.4s, v2.4s, #30		; CHECK-NEXT: shl v0.4s, v2.4s, #30
; CHECK-NEXT: ushr v1.4s, v2.4s, #2		; CHECK-NEXT: ushr v1.4s, v2.4s, #2
		; CHECK-NEXT: dup v2.4s, w8
; CHECK-NEXT: orr v0.16b, v1.16b, v0.16b		; CHECK-NEXT: orr v0.16b, v1.16b, v0.16b
; CHECK-NEXT: dup v1.4s, w8		; CHECK-NEXT: cmhs v0.4s, v2.4s, v0.4s
; CHECK-NEXT: cmhs v0.4s, v1.4s, v0.4s		; CHECK-NEXT: and v0.16b, v0.16b, v3.16b
; CHECK-NEXT: movi v1.4s, #1
; CHECK-NEXT: and v0.16b, v0.16b, v1.16b
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%srem = srem <4 x i32> %X, <i32 -100, i32 100, i32 -100, i32 100>		%srem = srem <4 x i32> %X, <i32 -100, i32 100, i32 -100, i32 100>
%cmp = icmp eq <4 x i32> %srem, <i32 0, i32 0, i32 0, i32 0>		%cmp = icmp eq <4 x i32> %srem, <i32 0, i32 0, i32 0, i32 0>
%ret = zext <4 x i1> %cmp to <4 x i32>		%ret = zext <4 x i1> %cmp to <4 x i32>
ret <4 x i32> %ret		ret <4 x i32> %ret
}		}

;------------------------------------------------------------------------------;		;------------------------------------------------------------------------------;
; Comparison constant has undef elements.		; Comparison constant has undef elements.
;------------------------------------------------------------------------------;		;------------------------------------------------------------------------------;

define <4 x i32> @test_srem_odd_undef1(<4 x i32> %X) nounwind {		define <4 x i32> @test_srem_odd_undef1(<4 x i32> %X) nounwind {
; CHECK-LABEL: test_srem_odd_undef1:		; CHECK-LABEL: test_srem_odd_undef1:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: mov w8, #34079		; CHECK-NEXT: mov w8, #34079
; CHECK-NEXT: movk w8, #20971, lsl #16		; CHECK-NEXT: movk w8, #20971, lsl #16
; CHECK-NEXT: movi v1.4s, #25		; CHECK-NEXT: movi v3.4s, #25
; CHECK-NEXT: dup v2.4s, w8		; CHECK-NEXT: dup v1.4s, w8
; CHECK-NEXT: smull2 v3.2d, v0.4s, v2.4s		; CHECK-NEXT: smull2 v2.2d, v0.4s, v1.4s
; CHECK-NEXT: smull v2.2d, v0.2s, v2.2s		; CHECK-NEXT: smull v1.2d, v0.2s, v1.2s
; CHECK-NEXT: uzp2 v2.4s, v2.4s, v3.4s		; CHECK-NEXT: uzp2 v1.4s, v1.4s, v2.4s
; CHECK-NEXT: sshr v3.4s, v2.4s, #3		; CHECK-NEXT: sshr v2.4s, v1.4s, #3
; CHECK-NEXT: usra v3.4s, v2.4s, #31		; CHECK-NEXT: usra v2.4s, v1.4s, #31
; CHECK-NEXT: mls v0.4s, v3.4s, v1.4s
; CHECK-NEXT: movi v1.4s, #1		; CHECK-NEXT: movi v1.4s, #1
		; CHECK-NEXT: mls v0.4s, v2.4s, v3.4s
; CHECK-NEXT: cmeq v0.4s, v0.4s, #0		; CHECK-NEXT: cmeq v0.4s, v0.4s, #0
; CHECK-NEXT: and v0.16b, v0.16b, v1.16b		; CHECK-NEXT: and v0.16b, v0.16b, v1.16b
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%srem = srem <4 x i32> %X, <i32 25, i32 25, i32 25, i32 25>		%srem = srem <4 x i32> %X, <i32 25, i32 25, i32 25, i32 25>
%cmp = icmp eq <4 x i32> %srem, <i32 0, i32 0, i32 undef, i32 0>		%cmp = icmp eq <4 x i32> %srem, <i32 0, i32 0, i32 undef, i32 0>
%ret = zext <4 x i1> %cmp to <4 x i32>		%ret = zext <4 x i1> %cmp to <4 x i32>
ret <4 x i32> %ret		ret <4 x i32> %ret
}		}

define <4 x i32> @test_srem_even_undef1(<4 x i32> %X) nounwind {		define <4 x i32> @test_srem_even_undef1(<4 x i32> %X) nounwind {
; CHECK-LABEL: test_srem_even_undef1:		; CHECK-LABEL: test_srem_even_undef1:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: mov w8, #34079		; CHECK-NEXT: mov w8, #34079
; CHECK-NEXT: movk w8, #20971, lsl #16		; CHECK-NEXT: movk w8, #20971, lsl #16
; CHECK-NEXT: movi v1.4s, #100		; CHECK-NEXT: movi v3.4s, #100
; CHECK-NEXT: dup v2.4s, w8		; CHECK-NEXT: dup v1.4s, w8
; CHECK-NEXT: smull2 v3.2d, v0.4s, v2.4s		; CHECK-NEXT: smull2 v2.2d, v0.4s, v1.4s
; CHECK-NEXT: smull v2.2d, v0.2s, v2.2s		; CHECK-NEXT: smull v1.2d, v0.2s, v1.2s
; CHECK-NEXT: uzp2 v2.4s, v2.4s, v3.4s		; CHECK-NEXT: uzp2 v1.4s, v1.4s, v2.4s
; CHECK-NEXT: sshr v3.4s, v2.4s, #5		; CHECK-NEXT: sshr v2.4s, v1.4s, #5
; CHECK-NEXT: usra v3.4s, v2.4s, #31		; CHECK-NEXT: usra v2.4s, v1.4s, #31
; CHECK-NEXT: mls v0.4s, v3.4s, v1.4s
; CHECK-NEXT: movi v1.4s, #1		; CHECK-NEXT: movi v1.4s, #1
		; CHECK-NEXT: mls v0.4s, v2.4s, v3.4s
; CHECK-NEXT: cmeq v0.4s, v0.4s, #0		; CHECK-NEXT: cmeq v0.4s, v0.4s, #0
; CHECK-NEXT: and v0.16b, v0.16b, v1.16b		; CHECK-NEXT: and v0.16b, v0.16b, v1.16b
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%srem = srem <4 x i32> %X, <i32 100, i32 100, i32 100, i32 100>		%srem = srem <4 x i32> %X, <i32 100, i32 100, i32 100, i32 100>
%cmp = icmp eq <4 x i32> %srem, <i32 0, i32 0, i32 undef, i32 0>		%cmp = icmp eq <4 x i32> %srem, <i32 0, i32 0, i32 undef, i32 0>
%ret = zext <4 x i1> %cmp to <4 x i32>		%ret = zext <4 x i1> %cmp to <4 x i32>
ret <4 x i32> %ret		ret <4 x i32> %ret
}		}
Show All 22 Lines	; CHECK-NEXT: ret
%ret = zext <4 x i1> %cmp to <4 x i32>		%ret = zext <4 x i1> %cmp to <4 x i32>
ret <4 x i32> %ret		ret <4 x i32> %ret
}		}

; We can lower remainder of division by powers of two much better elsewhere.		; We can lower remainder of division by powers of two much better elsewhere.
define <4 x i32> @test_srem_pow2(<4 x i32> %X) nounwind {		define <4 x i32> @test_srem_pow2(<4 x i32> %X) nounwind {
; CHECK-LABEL: test_srem_pow2:		; CHECK-LABEL: test_srem_pow2:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: cmlt v2.4s, v0.4s, #0		; CHECK-NEXT: cmlt v3.4s, v0.4s, #0
; CHECK-NEXT: mov v3.16b, v0.16b		; CHECK-NEXT: mov v2.16b, v0.16b
		; CHECK-NEXT: usra v2.4s, v3.4s, #28
; CHECK-NEXT: movi v1.4s, #1		; CHECK-NEXT: movi v1.4s, #1
; CHECK-NEXT: usra v3.4s, v2.4s, #28		; CHECK-NEXT: bic v2.4s, #15
; CHECK-NEXT: bic v3.4s, #15		; CHECK-NEXT: sub v0.4s, v0.4s, v2.4s
; CHECK-NEXT: sub v0.4s, v0.4s, v3.4s
; CHECK-NEXT: cmeq v0.4s, v0.4s, #0		; CHECK-NEXT: cmeq v0.4s, v0.4s, #0
; CHECK-NEXT: and v0.16b, v0.16b, v1.16b		; CHECK-NEXT: and v0.16b, v0.16b, v1.16b
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%srem = srem <4 x i32> %X, <i32 16, i32 16, i32 16, i32 16>		%srem = srem <4 x i32> %X, <i32 16, i32 16, i32 16, i32 16>
%cmp = icmp eq <4 x i32> %srem, <i32 0, i32 0, i32 0, i32 0>		%cmp = icmp eq <4 x i32> %srem, <i32 0, i32 0, i32 0, i32 0>
%ret = zext <4 x i1> %cmp to <4 x i32>		%ret = zext <4 x i1> %cmp to <4 x i32>
ret <4 x i32> %ret		ret <4 x i32> %ret
}		}

; We could lower remainder of division by INT_MIN much better elsewhere.		; We could lower remainder of division by INT_MIN much better elsewhere.
define <4 x i32> @test_srem_int_min(<4 x i32> %X) nounwind {		define <4 x i32> @test_srem_int_min(<4 x i32> %X) nounwind {
; CHECK-LABEL: test_srem_int_min:		; CHECK-LABEL: test_srem_int_min:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: cmlt v2.4s, v0.4s, #0		; CHECK-NEXT: cmlt v2.4s, v0.4s, #0
; CHECK-NEXT: mov v3.16b, v0.16b		; CHECK-NEXT: mov v1.16b, v0.16b
; CHECK-NEXT: movi v1.4s, #128, lsl #24		; CHECK-NEXT: movi v3.4s, #128, lsl #24
; CHECK-NEXT: usra v3.4s, v2.4s, #1		; CHECK-NEXT: usra v1.4s, v2.4s, #1
; CHECK-NEXT: and v1.16b, v3.16b, v1.16b		; CHECK-NEXT: and v1.16b, v1.16b, v3.16b
; CHECK-NEXT: sub v0.4s, v0.4s, v1.4s		; CHECK-NEXT: sub v0.4s, v0.4s, v1.4s
; CHECK-NEXT: movi v1.4s, #1		; CHECK-NEXT: movi v1.4s, #1
; CHECK-NEXT: cmeq v0.4s, v0.4s, #0		; CHECK-NEXT: cmeq v0.4s, v0.4s, #0
; CHECK-NEXT: and v0.16b, v0.16b, v1.16b		; CHECK-NEXT: and v0.16b, v0.16b, v1.16b
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%srem = srem <4 x i32> %X, <i32 2147483648, i32 2147483648, i32 2147483648, i32 2147483648>		%srem = srem <4 x i32> %X, <i32 2147483648, i32 2147483648, i32 2147483648, i32 2147483648>
%cmp = icmp eq <4 x i32> %srem, <i32 0, i32 0, i32 0, i32 0>		%cmp = icmp eq <4 x i32> %srem, <i32 0, i32 0, i32 0, i32 0>
%ret = zext <4 x i1> %cmp to <4 x i32>		%ret = zext <4 x i1> %cmp to <4 x i32>
Show All 14 Lines

llvm/test/CodeGen/AArch64/ssub_sat_vec.ll

Show First 20 Lines • Show All 92 Lines • ▼ Show 20 Lines
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%z = call <32 x i16> @llvm.ssub.sat.v32i16(<32 x i16> %x, <32 x i16> %y)		%z = call <32 x i16> @llvm.ssub.sat.v32i16(<32 x i16> %x, <32 x i16> %y)
ret <32 x i16> %z		ret <32 x i16> %z
}		}

define void @v8i8(<8 x i8>* %px, <8 x i8>* %py, <8 x i8>* %pz) nounwind {		define void @v8i8(<8 x i8>* %px, <8 x i8>* %py, <8 x i8>* %pz) nounwind {
; CHECK-LABEL: v8i8:		; CHECK-LABEL: v8i8:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: ldr d0, [x0]		; CHECK-NEXT: ldr d0, [x1]
; CHECK-NEXT: ldr d1, [x1]		; CHECK-NEXT: ldr d1, [x0]
; CHECK-NEXT: sqsub v0.8b, v0.8b, v1.8b		; CHECK-NEXT: sqsub v0.8b, v1.8b, v0.8b
; CHECK-NEXT: str d0, [x2]		; CHECK-NEXT: str d0, [x2]
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%x = load <8 x i8>, <8 x i8>* %px		%x = load <8 x i8>, <8 x i8>* %px
%y = load <8 x i8>, <8 x i8>* %py		%y = load <8 x i8>, <8 x i8>* %py
%z = call <8 x i8> @llvm.ssub.sat.v8i8(<8 x i8> %x, <8 x i8> %y)		%z = call <8 x i8> @llvm.ssub.sat.v8i8(<8 x i8> %x, <8 x i8> %y)
store <8 x i8> %z, <8 x i8>* %pz		store <8 x i8> %z, <8 x i8>* %pz
ret void		ret void
}		}
▲ Show 20 Lines • Show All 42 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%z = call <2 x i8> @llvm.ssub.sat.v2i8(<2 x i8> %x, <2 x i8> %y)		%z = call <2 x i8> @llvm.ssub.sat.v2i8(<2 x i8> %x, <2 x i8> %y)
store <2 x i8> %z, <2 x i8>* %pz		store <2 x i8> %z, <2 x i8>* %pz
ret void		ret void
}		}

define void @v4i16(<4 x i16>* %px, <4 x i16>* %py, <4 x i16>* %pz) nounwind {		define void @v4i16(<4 x i16>* %px, <4 x i16>* %py, <4 x i16>* %pz) nounwind {
; CHECK-LABEL: v4i16:		; CHECK-LABEL: v4i16:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: ldr d0, [x0]		; CHECK-NEXT: ldr d0, [x1]
; CHECK-NEXT: ldr d1, [x1]		; CHECK-NEXT: ldr d1, [x0]
; CHECK-NEXT: sqsub v0.4h, v0.4h, v1.4h		; CHECK-NEXT: sqsub v0.4h, v1.4h, v0.4h
; CHECK-NEXT: str d0, [x2]		; CHECK-NEXT: str d0, [x2]
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%x = load <4 x i16>, <4 x i16>* %px		%x = load <4 x i16>, <4 x i16>* %px
%y = load <4 x i16>, <4 x i16>* %py		%y = load <4 x i16>, <4 x i16>* %py
%z = call <4 x i16> @llvm.ssub.sat.v4i16(<4 x i16> %x, <4 x i16> %y)		%z = call <4 x i16> @llvm.ssub.sat.v4i16(<4 x i16> %x, <4 x i16> %y)
store <4 x i16> %z, <4 x i16>* %pz		store <4 x i16> %z, <4 x i16>* %pz
ret void		ret void
}		}
▲ Show 20 Lines • Show All 47 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%z = call <12 x i16> @llvm.ssub.sat.v12i16(<12 x i16> %x, <12 x i16> %y)		%z = call <12 x i16> @llvm.ssub.sat.v12i16(<12 x i16> %x, <12 x i16> %y)
store <12 x i16> %z, <12 x i16>* %pz		store <12 x i16> %z, <12 x i16>* %pz
ret void		ret void
}		}

define void @v1i8(<1 x i8>* %px, <1 x i8>* %py, <1 x i8>* %pz) nounwind {		define void @v1i8(<1 x i8>* %px, <1 x i8>* %py, <1 x i8>* %pz) nounwind {
; CHECK-LABEL: v1i8:		; CHECK-LABEL: v1i8:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: ldr b0, [x0]		; CHECK-NEXT: ldr b0, [x1]
; CHECK-NEXT: ldr b1, [x1]		; CHECK-NEXT: ldr b1, [x0]
; CHECK-NEXT: sqsub v0.8b, v0.8b, v1.8b		; CHECK-NEXT: sqsub v0.8b, v1.8b, v0.8b
; CHECK-NEXT: st1 { v0.b }[0], [x2]		; CHECK-NEXT: st1 { v0.b }[0], [x2]
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%x = load <1 x i8>, <1 x i8>* %px		%x = load <1 x i8>, <1 x i8>* %px
%y = load <1 x i8>, <1 x i8>* %py		%y = load <1 x i8>, <1 x i8>* %py
%z = call <1 x i8> @llvm.ssub.sat.v1i8(<1 x i8> %x, <1 x i8> %y)		%z = call <1 x i8> @llvm.ssub.sat.v1i8(<1 x i8> %x, <1 x i8> %y)
store <1 x i8> %z, <1 x i8>* %pz		store <1 x i8> %z, <1 x i8>* %pz
ret void		ret void
}		}

define void @v1i16(<1 x i16>* %px, <1 x i16>* %py, <1 x i16>* %pz) nounwind {		define void @v1i16(<1 x i16>* %px, <1 x i16>* %py, <1 x i16>* %pz) nounwind {
; CHECK-LABEL: v1i16:		; CHECK-LABEL: v1i16:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: ldr h0, [x0]		; CHECK-NEXT: ldr h0, [x1]
; CHECK-NEXT: ldr h1, [x1]		; CHECK-NEXT: ldr h1, [x0]
; CHECK-NEXT: sqsub v0.4h, v0.4h, v1.4h		; CHECK-NEXT: sqsub v0.4h, v1.4h, v0.4h
; CHECK-NEXT: str h0, [x2]		; CHECK-NEXT: str h0, [x2]
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%x = load <1 x i16>, <1 x i16>* %px		%x = load <1 x i16>, <1 x i16>* %px
%y = load <1 x i16>, <1 x i16>* %py		%y = load <1 x i16>, <1 x i16>* %py
%z = call <1 x i16> @llvm.ssub.sat.v1i16(<1 x i16> %x, <1 x i16> %y)		%z = call <1 x i16> @llvm.ssub.sat.v1i16(<1 x i16> %x, <1 x i16> %y)
store <1 x i16> %z, <1 x i16>* %pz		store <1 x i16> %z, <1 x i16>* %pz
ret void		ret void
}		}

define <16 x i4> @v16i4(<16 x i4> %x, <16 x i4> %y) nounwind {		define <16 x i4> @v16i4(<16 x i4> %x, <16 x i4> %y) nounwind {
; CHECK-LABEL: v16i4:		; CHECK-LABEL: v16i4:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: shl v1.16b, v1.16b, #4
; CHECK-NEXT: shl v0.16b, v0.16b, #4		; CHECK-NEXT: shl v0.16b, v0.16b, #4
; CHECK-NEXT: sshr v1.16b, v1.16b, #4		; CHECK-NEXT: shl v1.16b, v1.16b, #4
; CHECK-NEXT: sshr v0.16b, v0.16b, #4		; CHECK-NEXT: sshr v0.16b, v0.16b, #4
		; CHECK-NEXT: sshr v1.16b, v1.16b, #4
; CHECK-NEXT: shl v1.16b, v1.16b, #4		; CHECK-NEXT: shl v1.16b, v1.16b, #4
; CHECK-NEXT: shl v0.16b, v0.16b, #4		; CHECK-NEXT: shl v0.16b, v0.16b, #4
; CHECK-NEXT: sqsub v0.16b, v0.16b, v1.16b		; CHECK-NEXT: sqsub v0.16b, v0.16b, v1.16b
; CHECK-NEXT: sshr v0.16b, v0.16b, #4		; CHECK-NEXT: sshr v0.16b, v0.16b, #4
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%z = call <16 x i4> @llvm.ssub.sat.v16i4(<16 x i4> %x, <16 x i4> %y)		%z = call <16 x i4> @llvm.ssub.sat.v16i4(<16 x i4> %x, <16 x i4> %y)
ret <16 x i4> %z		ret <16 x i4> %z
}		}
▲ Show 20 Lines • Show All 111 Lines • Show Last 20 Lines

llvm/test/CodeGen/AArch64/sve-fixed-length-int-div.ll

Show First 20 Lines • Show All 46 Lines • ▼ Show 20 Lines
; CHECK-NEXT: umov [[SCALAR6:w[0-9]+]], [[VEC]].h[6]		; CHECK-NEXT: umov [[SCALAR6:w[0-9]+]], [[VEC]].h[6]
; CHECK-NEXT: mov [[FINAL]].b[6], [[SCALAR6]]		; CHECK-NEXT: mov [[FINAL]].b[6], [[SCALAR6]]
; CHECK-NEXT: umov [[SCALAR7:w[0-9]+]], [[VEC]].h[7]		; CHECK-NEXT: umov [[SCALAR7:w[0-9]+]], [[VEC]].h[7]
; CHECK-NEXT: mov [[FINAL]].b[7], [[SCALAR7]]		; CHECK-NEXT: mov [[FINAL]].b[7], [[SCALAR7]]
; CHECK: ret		; CHECK: ret

; VBITS_EQ_128-LABEL: sdiv_v8i8:		; VBITS_EQ_128-LABEL: sdiv_v8i8:
; VBITS_EQ_128: sshll v1.8h, v1.8b, #0		; VBITS_EQ_128: sshll v1.8h, v1.8b, #0
; VBITS_EQ_128-NEXT: sshll v0.8h, v0.8b, #0
; VBITS_EQ_128-NEXT: ptrue p0.s, vl4		; VBITS_EQ_128-NEXT: ptrue p0.s, vl4
		; VBITS_EQ_128-NEXT: sshll v0.8h, v0.8b, #0
; VBITS_EQ_128-NEXT: sunpkhi z2.s, z1.h		; VBITS_EQ_128-NEXT: sunpkhi z2.s, z1.h
; VBITS_EQ_128-NEXT: sunpkhi z3.s, z0.h
; VBITS_EQ_128-NEXT: sunpklo z1.s, z1.h		; VBITS_EQ_128-NEXT: sunpklo z1.s, z1.h
		; VBITS_EQ_128-NEXT: sunpkhi z3.s, z0.h
; VBITS_EQ_128-NEXT: sunpklo z0.s, z0.h		; VBITS_EQ_128-NEXT: sunpklo z0.s, z0.h
; VBITS_EQ_128-NEXT: sdivr z2.s, p0/m, z2.s, z3.s		; VBITS_EQ_128-NEXT: sdivr z2.s, p0/m, z2.s, z3.s
; VBITS_EQ_128-NEXT: sdiv z0.s, p0/m, z0.s, z1.s		; VBITS_EQ_128-NEXT: sdiv z0.s, p0/m, z0.s, z1.s
; VBITS_EQ_128-NEXT: uzp1 z0.h, z0.h, z2.h		; VBITS_EQ_128-NEXT: uzp1 z0.h, z0.h, z2.h
; VBITS_EQ_128-NEXT: xtn v0.8b, v0.8h		; VBITS_EQ_128-NEXT: xtn v0.8b, v0.8h
; VBITS_EQ_128-NEXT: ret		; VBITS_EQ_128-NEXT: ret

%res = sdiv <8 x i8> %op1, %op2		%res = sdiv <8 x i8> %op1, %op2
▲ Show 20 Lines • Show All 277 Lines • ▼ Show 20 Lines	; CHECK: ret
ret void		ret void
}		}

; Vector vXi16 sdiv are not legal for NEON so use SVE when available.		; Vector vXi16 sdiv are not legal for NEON so use SVE when available.
; FIXME: We should be able to improve the codegen for >= 256 bits here.		; FIXME: We should be able to improve the codegen for >= 256 bits here.
define <4 x i16> @sdiv_v4i16(<4 x i16> %op1, <4 x i16> %op2) #0 {		define <4 x i16> @sdiv_v4i16(<4 x i16> %op1, <4 x i16> %op2) #0 {
; CHECK-LABEL: sdiv_v4i16:		; CHECK-LABEL: sdiv_v4i16:
; CHECK: sshll v1.4s, v1.4h, #0		; CHECK: sshll v1.4s, v1.4h, #0
; CHECK-NEXT: sshll v0.4s, v0.4h, #0
; CHECK-NEXT: ptrue [[PG1:p[0-9]+]].s, vl4		; CHECK-NEXT: ptrue [[PG1:p[0-9]+]].s, vl4
		; CHECK-NEXT: sshll v0.4s, v0.4h, #0
; CHECK-NEXT: sdivr [[DIV1:z[0-9]+]].s, [[PG1]]/m, [[OP2:z[0-9]+]].s, [[OP1:z[0-9]+]].s		; CHECK-NEXT: sdivr [[DIV1:z[0-9]+]].s, [[PG1]]/m, [[OP2:z[0-9]+]].s, [[OP1:z[0-9]+]].s
; CHECK-NEXT: mov w8, v1.s[1]		; CHECK-NEXT: mov w8, v1.s[1]
; CHECK-NEXT: mov w9, v1.s[2]		; CHECK-NEXT: mov w9, v1.s[2]
; CHECK-NEXT: mov v0.16b, v1.16b		; CHECK-NEXT: mov v0.16b, v1.16b
; CHECK-NEXT: mov v0.h[1], w8		; CHECK-NEXT: mov v0.h[1], w8
; CHECK-NEXT: mov w8, v1.s[3]		; CHECK-NEXT: mov w8, v1.s[3]
; CHECK-NEXT: mov v0.h[2], w9		; CHECK-NEXT: mov v0.h[2], w9
; CHECK-NEXT: mov v0.h[3], w8		; CHECK-NEXT: mov v0.h[3], w8
; CHECK: ret		; CHECK: ret

; VBITS_EQ_128-LABEL: sdiv_v4i16:		; VBITS_EQ_128-LABEL: sdiv_v4i16:
; VBITS_EQ_128: sshll v1.4s, v1.4h, #0		; VBITS_EQ_128: sshll v1.4s, v1.4h, #0
; VBITS_EQ_128-NEXT: sshll v0.4s, v0.4h, #0
; VBITS_EQ_128-NEXT: ptrue p0.s, vl4		; VBITS_EQ_128-NEXT: ptrue p0.s, vl4
		; VBITS_EQ_128-NEXT: sshll v0.4s, v0.4h, #0
; VBITS_EQ_128-NEXT: sdiv z0.s, p0/m, z0.s, z1.s		; VBITS_EQ_128-NEXT: sdiv z0.s, p0/m, z0.s, z1.s
; VBITS_EQ_128-NEXT: xtn v0.4h, v0.4s		; VBITS_EQ_128-NEXT: xtn v0.4h, v0.4s
; VBITS_EQ_128-NEXT: ret		; VBITS_EQ_128-NEXT: ret

%res = sdiv <4 x i16> %op1, %op2		%res = sdiv <4 x i16> %op1, %op2
ret <4 x i16> %res		ret <4 x i16> %res
}		}

▲ Show 20 Lines • Show All 362 Lines • ▼ Show 20 Lines
; CHECK-NEXT: umov [[SCALAR6:w[0-9]+]], [[VEC]].h[6]		; CHECK-NEXT: umov [[SCALAR6:w[0-9]+]], [[VEC]].h[6]
; CHECK-NEXT: mov [[FINAL]].b[6], [[SCALAR6]]		; CHECK-NEXT: mov [[FINAL]].b[6], [[SCALAR6]]
; CHECK-NEXT: umov [[SCALAR7:w[0-9]+]], [[VEC]].h[7]		; CHECK-NEXT: umov [[SCALAR7:w[0-9]+]], [[VEC]].h[7]
; CHECK-NEXT: mov [[FINAL]].b[7], [[SCALAR7]]		; CHECK-NEXT: mov [[FINAL]].b[7], [[SCALAR7]]
; CHECK: ret		; CHECK: ret

; VBITS_EQ_128-LABEL: udiv_v8i8:		; VBITS_EQ_128-LABEL: udiv_v8i8:
; VBITS_EQ_128: ushll v1.8h, v1.8b, #0		; VBITS_EQ_128: ushll v1.8h, v1.8b, #0
; VBITS_EQ_128-NEXT: ushll v0.8h, v0.8b, #0
; VBITS_EQ_128-NEXT: ptrue p0.s, vl4		; VBITS_EQ_128-NEXT: ptrue p0.s, vl4
		; VBITS_EQ_128-NEXT: ushll v0.8h, v0.8b, #0
; VBITS_EQ_128-NEXT: uunpkhi z2.s, z1.h		; VBITS_EQ_128-NEXT: uunpkhi z2.s, z1.h
; VBITS_EQ_128-NEXT: uunpkhi z3.s, z0.h
; VBITS_EQ_128-NEXT: uunpklo z1.s, z1.h		; VBITS_EQ_128-NEXT: uunpklo z1.s, z1.h
		; VBITS_EQ_128-NEXT: uunpkhi z3.s, z0.h
; VBITS_EQ_128-NEXT: uunpklo z0.s, z0.h		; VBITS_EQ_128-NEXT: uunpklo z0.s, z0.h
; VBITS_EQ_128-NEXT: udivr z2.s, p0/m, z2.s, z3.s		; VBITS_EQ_128-NEXT: udivr z2.s, p0/m, z2.s, z3.s
; VBITS_EQ_128-NEXT: udiv z0.s, p0/m, z0.s, z1.s		; VBITS_EQ_128-NEXT: udiv z0.s, p0/m, z0.s, z1.s
; VBITS_EQ_128-NEXT: uzp1 z0.h, z0.h, z2.h		; VBITS_EQ_128-NEXT: uzp1 z0.h, z0.h, z2.h
; VBITS_EQ_128-NEXT: xtn v0.8b, v0.8h		; VBITS_EQ_128-NEXT: xtn v0.8b, v0.8h
; VBITS_EQ_128-NEXT: ret		; VBITS_EQ_128-NEXT: ret

%res = udiv <8 x i8> %op1, %op2		%res = udiv <8 x i8> %op1, %op2
▲ Show 20 Lines • Show All 275 Lines • ▼ Show 20 Lines	; CHECK: ret
ret void		ret void
}		}

; Vector vXi16 udiv are not legal for NEON so use SVE when available.		; Vector vXi16 udiv are not legal for NEON so use SVE when available.
; FIXME: We should be able to improve the codegen for >= 256 bits here.		; FIXME: We should be able to improve the codegen for >= 256 bits here.
define <4 x i16> @udiv_v4i16(<4 x i16> %op1, <4 x i16> %op2) #0 {		define <4 x i16> @udiv_v4i16(<4 x i16> %op1, <4 x i16> %op2) #0 {
; CHECK-LABEL: udiv_v4i16:		; CHECK-LABEL: udiv_v4i16:
; CHECK: ushll v1.4s, v1.4h, #0		; CHECK: ushll v1.4s, v1.4h, #0
; CHECK-NEXT: ushll v0.4s, v0.4h, #0
; CHECK-NEXT: ptrue [[PG1:p[0-9]+]].s, vl4		; CHECK-NEXT: ptrue [[PG1:p[0-9]+]].s, vl4
		; CHECK-NEXT: ushll v0.4s, v0.4h, #0
; CHECK-NEXT: udivr [[DIV1:z[0-9]+]].s, [[PG1]]/m, [[OP2:z[0-9]+]].s, [[OP1:z[0-9]+]].s		; CHECK-NEXT: udivr [[DIV1:z[0-9]+]].s, [[PG1]]/m, [[OP2:z[0-9]+]].s, [[OP1:z[0-9]+]].s
; CHECK-NEXT: mov w8, v1.s[1]		; CHECK-NEXT: mov w8, v1.s[1]
; CHECK-NEXT: mov w9, v1.s[2]		; CHECK-NEXT: mov w9, v1.s[2]
; CHECK-NEXT: mov v0.16b, v1.16b		; CHECK-NEXT: mov v0.16b, v1.16b
; CHECK-NEXT: mov v0.h[1], w8		; CHECK-NEXT: mov v0.h[1], w8
; CHECK-NEXT: mov w8, v1.s[3]		; CHECK-NEXT: mov w8, v1.s[3]
; CHECK-NEXT: mov v0.h[2], w9		; CHECK-NEXT: mov v0.h[2], w9
; CHECK-NEXT: mov v0.h[3], w8		; CHECK-NEXT: mov v0.h[3], w8
; CHECK: ret		; CHECK: ret

; VBITS_EQ_128-LABEL: udiv_v4i16:		; VBITS_EQ_128-LABEL: udiv_v4i16:
; VBITS_EQ_128: ushll v1.4s, v1.4h, #0		; VBITS_EQ_128: ushll v1.4s, v1.4h, #0
; VBITS_EQ_128-NEXT: ushll v0.4s, v0.4h, #0
; VBITS_EQ_128-NEXT: ptrue p0.s, vl4		; VBITS_EQ_128-NEXT: ptrue p0.s, vl4
		; VBITS_EQ_128-NEXT: ushll v0.4s, v0.4h, #0
; VBITS_EQ_128-NEXT: udiv z0.s, p0/m, z0.s, z1.s		; VBITS_EQ_128-NEXT: udiv z0.s, p0/m, z0.s, z1.s
; VBITS_EQ_128-NEXT: xtn v0.4h, v0.4s		; VBITS_EQ_128-NEXT: xtn v0.4h, v0.4s
; VBITS_EQ_128-NEXT: ret		; VBITS_EQ_128-NEXT: ret

%res = udiv <4 x i16> %op1, %op2		%res = udiv <4 x i16> %op1, %op2
ret <4 x i16> %res		ret <4 x i16> %res
}		}

▲ Show 20 Lines • Show All 354 Lines • Show Last 20 Lines

llvm/test/CodeGen/AArch64/sve-fixed-length-int-mulh.ll

Show First 20 Lines • Show All 282 Lines • ▼ Show 20 Lines	; VBITS_GE_2048-NEXT: ret
ret void		ret void
}		}

; Vector i64 multiplications are not legal for NEON so use SVE when available.		; Vector i64 multiplications are not legal for NEON so use SVE when available.
define <2 x i32> @smulh_v2i32(<2 x i32> %op1, <2 x i32> %op2) #0 {		define <2 x i32> @smulh_v2i32(<2 x i32> %op1, <2 x i32> %op2) #0 {
; CHECK-LABEL: smulh_v2i32:		; CHECK-LABEL: smulh_v2i32:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: sshll v0.2d, v0.2s, #0		; CHECK-NEXT: sshll v0.2d, v0.2s, #0
; CHECK-NEXT: sshll v1.2d, v1.2s, #0
; CHECK-NEXT: ptrue p0.d, vl2		; CHECK-NEXT: ptrue p0.d, vl2
		; CHECK-NEXT: sshll v1.2d, v1.2s, #0
; CHECK-NEXT: mul z0.d, p0/m, z0.d, z1.d		; CHECK-NEXT: mul z0.d, p0/m, z0.d, z1.d
; CHECK-NEXT: shrn v0.2s, v0.2d, #32		; CHECK-NEXT: shrn v0.2s, v0.2d, #32
; CHECK-NEXT: ret		; CHECK-NEXT: ret

; VBITS_EQ_128-LABEL: smulh_v2i32:		; VBITS_EQ_128-LABEL: smulh_v2i32:
; VBITS_EQ_128: sshll v0.2d, v0.2s, #0		; VBITS_EQ_128: sshll v0.2d, v0.2s, #0
; VBITS_EQ_128-NEXT: sshll v1.2d, v1.2s, #0
; VBITS_EQ_128-NEXT: ptrue p0.d, vl2		; VBITS_EQ_128-NEXT: ptrue p0.d, vl2
		; VBITS_EQ_128-NEXT: sshll v1.2d, v1.2s, #0
; VBITS_EQ_128-NEXT: mul z0.d, p0/m, z0.d, z1.d		; VBITS_EQ_128-NEXT: mul z0.d, p0/m, z0.d, z1.d
; VBITS_EQ_128-NEXT: shrn v0.2s, v0.2d, #32		; VBITS_EQ_128-NEXT: shrn v0.2s, v0.2d, #32
; VBITS_EQ_128-NEXT: ret		; VBITS_EQ_128-NEXT: ret

%1 = sext <2 x i32> %op1 to <2 x i64>		%1 = sext <2 x i32> %op1 to <2 x i64>
%2 = sext <2 x i32> %op2 to <2 x i64>		%2 = sext <2 x i32> %op2 to <2 x i64>
%mul = mul <2 x i64> %1, %2		%mul = mul <2 x i64> %1, %2
%shr = lshr <2 x i64> %mul, <i64 32, i64 32>		%shr = lshr <2 x i64> %mul, <i64 32, i64 32>
▲ Show 20 Lines • Show All 471 Lines • ▼ Show 20 Lines	; VBITS_GE_2048-NEXT: ret
ret void		ret void
}		}

; Vector i64 multiplications are not legal for NEON so use SVE when available.		; Vector i64 multiplications are not legal for NEON so use SVE when available.
define <2 x i32> @umulh_v2i32(<2 x i32> %op1, <2 x i32> %op2) #0 {		define <2 x i32> @umulh_v2i32(<2 x i32> %op1, <2 x i32> %op2) #0 {
; CHECK-LABEL: umulh_v2i32:		; CHECK-LABEL: umulh_v2i32:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: ushll v0.2d, v0.2s, #0		; CHECK-NEXT: ushll v0.2d, v0.2s, #0
; CHECK-NEXT: ushll v1.2d, v1.2s, #0
; CHECK-NEXT: ptrue p0.d, vl2		; CHECK-NEXT: ptrue p0.d, vl2
		; CHECK-NEXT: ushll v1.2d, v1.2s, #0
; CHECK-NEXT: mul z0.d, p0/m, z0.d, z1.d		; CHECK-NEXT: mul z0.d, p0/m, z0.d, z1.d
; CHECK-NEXT: shrn v0.2s, v0.2d, #32		; CHECK-NEXT: shrn v0.2s, v0.2d, #32
; CHECK-NEXT: ret		; CHECK-NEXT: ret

; VBITS_EQ_128-LABEL: umulh_v2i32:		; VBITS_EQ_128-LABEL: umulh_v2i32:
; VBITS_EQ_128: ushll v0.2d, v0.2s, #0		; VBITS_EQ_128: ushll v0.2d, v0.2s, #0
; VBITS_EQ_128-NEXT: ushll v1.2d, v1.2s, #0
; VBITS_EQ_128-NEXT: ptrue p0.d, vl2		; VBITS_EQ_128-NEXT: ptrue p0.d, vl2
		; VBITS_EQ_128-NEXT: ushll v1.2d, v1.2s, #0
; VBITS_EQ_128-NEXT: mul z0.d, p0/m, z0.d, z1.d		; VBITS_EQ_128-NEXT: mul z0.d, p0/m, z0.d, z1.d
; VBITS_EQ_128-NEXT: shrn v0.2s, v0.2d, #32		; VBITS_EQ_128-NEXT: shrn v0.2s, v0.2d, #32
; VBITS_EQ_128-NEXT: ret		; VBITS_EQ_128-NEXT: ret

%1 = zext <2 x i32> %op1 to <2 x i64>		%1 = zext <2 x i32> %op1 to <2 x i64>
%2 = zext <2 x i32> %op2 to <2 x i64>		%2 = zext <2 x i32> %op2 to <2 x i64>
%mul = mul <2 x i64> %1, %2		%mul = mul <2 x i64> %1, %2
%shr = lshr <2 x i64> %mul, <i64 32, i64 32>		%shr = lshr <2 x i64> %mul, <i64 32, i64 32>
▲ Show 20 Lines • Show All 218 Lines • Show Last 20 Lines

llvm/test/CodeGen/AArch64/sve-fixed-length-int-rem.ll

Show First 20 Lines • Show All 47 Lines • ▼ Show 20 Lines
; CHECK-NEXT: mov [[FINAL]].b[6], [[SCALAR7]]		; CHECK-NEXT: mov [[FINAL]].b[6], [[SCALAR7]]
; CHECK-NEXT: umov [[SCALAR8:w[0-9]+]], [[VEC]].h[7]		; CHECK-NEXT: umov [[SCALAR8:w[0-9]+]], [[VEC]].h[7]
; CHECK-NEXT: mov [[FINAL]].b[7], [[SCALAR8]]		; CHECK-NEXT: mov [[FINAL]].b[7], [[SCALAR8]]
; CHECK-NEXT: mls v0.8b, [[FINAL]].8b, v1.8b		; CHECK-NEXT: mls v0.8b, [[FINAL]].8b, v1.8b
; CHECK: ret		; CHECK: ret

; VBITS_EQ_128-LABEL: srem_v8i8:		; VBITS_EQ_128-LABEL: srem_v8i8:
; VBITS_EQ_128: sshll v2.8h, v1.8b, #0		; VBITS_EQ_128: sshll v2.8h, v1.8b, #0
; VBITS_EQ_128-NEXT: sshll v3.8h, v0.8b, #0
; VBITS_EQ_128-NEXT: ptrue p0.s, vl4		; VBITS_EQ_128-NEXT: ptrue p0.s, vl4
		; VBITS_EQ_128-NEXT: sshll v3.8h, v0.8b, #0
; VBITS_EQ_128-NEXT: sunpkhi z4.s, z2.h		; VBITS_EQ_128-NEXT: sunpkhi z4.s, z2.h
; VBITS_EQ_128-NEXT: sunpkhi z5.s, z3.h
; VBITS_EQ_128-NEXT: sunpklo z2.s, z2.h		; VBITS_EQ_128-NEXT: sunpklo z2.s, z2.h
		; VBITS_EQ_128-NEXT: sunpkhi z5.s, z3.h
; VBITS_EQ_128-NEXT: sunpklo z3.s, z3.h		; VBITS_EQ_128-NEXT: sunpklo z3.s, z3.h
; VBITS_EQ_128-NEXT: sdivr z4.s, p0/m, z4.s, z5.s		; VBITS_EQ_128-NEXT: sdivr z4.s, p0/m, z4.s, z5.s
; VBITS_EQ_128-NEXT: sdivr z2.s, p0/m, z2.s, z3.s		; VBITS_EQ_128-NEXT: sdivr z2.s, p0/m, z2.s, z3.s
; VBITS_EQ_128-NEXT: uzp1 z2.h, z2.h, z4.h		; VBITS_EQ_128-NEXT: uzp1 z2.h, z2.h, z4.h
; VBITS_EQ_128-NEXT: xtn v2.8b, v2.8h		; VBITS_EQ_128-NEXT: xtn v2.8b, v2.8h
; VBITS_EQ_128-NEXT: mls v0.8b, v2.8b, v1.8b		; VBITS_EQ_128-NEXT: mls v0.8b, v2.8b, v1.8b
; VBITS_EQ_128-NEXT: ret		; VBITS_EQ_128-NEXT: ret

▲ Show 20 Lines • Show All 290 Lines • ▼ Show 20 Lines	; VBITS_EQ_2048-NEXT: ret
ret void		ret void
}		}

; Vector vXi16 sdiv are not legal for NEON so use SVE when available.		; Vector vXi16 sdiv are not legal for NEON so use SVE when available.
; FIXME: We should be able to improve the codegen for >= 256 bits here.		; FIXME: We should be able to improve the codegen for >= 256 bits here.
define <4 x i16> @srem_v4i16(<4 x i16> %op1, <4 x i16> %op2) #0 {		define <4 x i16> @srem_v4i16(<4 x i16> %op1, <4 x i16> %op2) #0 {
; CHECK-LABEL: srem_v4i16:		; CHECK-LABEL: srem_v4i16:
; CHECK: sshll v2.4s, v1.4h, #0		; CHECK: sshll v2.4s, v1.4h, #0
; CHECK-NEXT: sshll v3.4s, v0.4h, #0
; CHECK-NEXT: ptrue [[PG1:p[0-9]+]].s, vl4		; CHECK-NEXT: ptrue [[PG1:p[0-9]+]].s, vl4
		; CHECK-NEXT: sshll v3.4s, v0.4h, #0
; CHECK-NEXT: sdivr [[DIV1:z[0-9]+]].s, [[PG1]]/m, z2.s, z3.s		; CHECK-NEXT: sdivr [[DIV1:z[0-9]+]].s, [[PG1]]/m, z2.s, z3.s
; CHECK-NEXT: mov [[SCALAR1:w[0-9]+]], [[VEC:v[0-9]+]].s[1]		; CHECK-NEXT: mov [[SCALAR1:w[0-9]+]], [[VEC:v[0-9]+]].s[1]
; CHECK-NEXT: mov [[SCALAR2:w[0-9]+]], [[VEC]].s[2]		; CHECK-NEXT: mov [[SCALAR2:w[0-9]+]], [[VEC]].s[2]
; CHECK-NEXT: mov [[VEC2:v[0-9]+]].16b, [[VEC]].16b		; CHECK-NEXT: mov [[VEC2:v[0-9]+]].16b, [[VEC]].16b
; CHECK-NEXT: mov [[VEC2]].h[1], [[SCALAR1]]		; CHECK-NEXT: mov [[VEC2]].h[1], [[SCALAR1]]
; CHECK-NEXT: mov [[SCALAR3:w[0-9]+]], [[VEC]].s[3]		; CHECK-NEXT: mov [[SCALAR3:w[0-9]+]], [[VEC]].s[3]
; CHECK-NEXT: mov [[VEC2]].h[2], [[SCALAR2]]		; CHECK-NEXT: mov [[VEC2]].h[2], [[SCALAR2]]
; CHECK-NEXT: mov [[VEC2]].h[3], [[SCALAR3]]		; CHECK-NEXT: mov [[VEC2]].h[3], [[SCALAR3]]
; CHECK-NEXT: mls v0.4h, [[VEC2]].4h, v1.4h		; CHECK-NEXT: mls v0.4h, [[VEC2]].4h, v1.4h
; CHECK: ret		; CHECK: ret

; VBITS_EQ_128-LABEL: srem_v4i16:		; VBITS_EQ_128-LABEL: srem_v4i16:
; VBITS_EQ_128: sshll v2.4s, v1.4h, #0		; VBITS_EQ_128: sshll v2.4s, v1.4h, #0
; VBITS_EQ_128-NEXT: sshll v3.4s, v0.4h, #0
; VBITS_EQ_128-NEXT: ptrue p0.s, vl4		; VBITS_EQ_128-NEXT: ptrue p0.s, vl4
		; VBITS_EQ_128-NEXT: sshll v3.4s, v0.4h, #0
; VBITS_EQ_128-NEXT: sdivr z2.s, p0/m, z2.s, z3.s		; VBITS_EQ_128-NEXT: sdivr z2.s, p0/m, z2.s, z3.s
; VBITS_EQ_128-NEXT: xtn v2.4h, v2.4s		; VBITS_EQ_128-NEXT: xtn v2.4h, v2.4s
; VBITS_EQ_128-NEXT: mls v0.4h, v2.4h, v1.4h		; VBITS_EQ_128-NEXT: mls v0.4h, v2.4h, v1.4h
; VBITS_EQ_128-NEXT: ret		; VBITS_EQ_128-NEXT: ret

%res = srem <4 x i16> %op1, %op2		%res = srem <4 x i16> %op1, %op2
ret <4 x i16> %res		ret <4 x i16> %res
}		}
▲ Show 20 Lines • Show All 415 Lines • ▼ Show 20 Lines
; CHECK-NEXT: mov [[FINAL]].b[6], [[SCALAR6]]		; CHECK-NEXT: mov [[FINAL]].b[6], [[SCALAR6]]
; CHECK-NEXT: umov [[SCALAR7:w[0-9]+]], [[VEC]].h[7]		; CHECK-NEXT: umov [[SCALAR7:w[0-9]+]], [[VEC]].h[7]
; CHECK-NEXT: mov [[FINAL]].b[7], [[SCALAR7]]		; CHECK-NEXT: mov [[FINAL]].b[7], [[SCALAR7]]
; CHECK-NEXT: mls v0.8b, [[FINAL]].8b, v1.8b		; CHECK-NEXT: mls v0.8b, [[FINAL]].8b, v1.8b
; CHECK: ret		; CHECK: ret

; VBITS_EQ_128-LABEL: urem_v8i8:		; VBITS_EQ_128-LABEL: urem_v8i8:
; VBITS_EQ_128: ushll v2.8h, v1.8b, #0		; VBITS_EQ_128: ushll v2.8h, v1.8b, #0
; VBITS_EQ_128-NEXT: ushll v3.8h, v0.8b, #0
; VBITS_EQ_128-NEXT: ptrue p0.s, vl4		; VBITS_EQ_128-NEXT: ptrue p0.s, vl4
		; VBITS_EQ_128-NEXT: ushll v3.8h, v0.8b, #0
; VBITS_EQ_128-NEXT: uunpkhi z4.s, z2.h		; VBITS_EQ_128-NEXT: uunpkhi z4.s, z2.h
; VBITS_EQ_128-NEXT: uunpkhi z5.s, z3.h
; VBITS_EQ_128-NEXT: uunpklo z2.s, z2.h		; VBITS_EQ_128-NEXT: uunpklo z2.s, z2.h
		; VBITS_EQ_128-NEXT: uunpkhi z5.s, z3.h
; VBITS_EQ_128-NEXT: uunpklo z3.s, z3.h		; VBITS_EQ_128-NEXT: uunpklo z3.s, z3.h
; VBITS_EQ_128-NEXT: udivr z4.s, p0/m, z4.s, z5.s		; VBITS_EQ_128-NEXT: udivr z4.s, p0/m, z4.s, z5.s
; VBITS_EQ_128-NEXT: udivr z2.s, p0/m, z2.s, z3.s		; VBITS_EQ_128-NEXT: udivr z2.s, p0/m, z2.s, z3.s
; VBITS_EQ_128-NEXT: uzp1 z2.h, z2.h, z4.h		; VBITS_EQ_128-NEXT: uzp1 z2.h, z2.h, z4.h
; VBITS_EQ_128-NEXT: xtn v2.8b, v2.8h		; VBITS_EQ_128-NEXT: xtn v2.8b, v2.8h
; VBITS_EQ_128-NEXT: mls v0.8b, v2.8b, v1.8b		; VBITS_EQ_128-NEXT: mls v0.8b, v2.8b, v1.8b
; VBITS_EQ_128-NEXT: ret		; VBITS_EQ_128-NEXT: ret

▲ Show 20 Lines • Show All 288 Lines • ▼ Show 20 Lines	; VBITS_EQ_2048-NEXT: ret
ret void		ret void
}		}

; Vector vXi16 udiv are not legal for NEON so use SVE when available.		; Vector vXi16 udiv are not legal for NEON so use SVE when available.
; FIXME: We should be able to improve the codegen for >= 256 bits here.		; FIXME: We should be able to improve the codegen for >= 256 bits here.
define <4 x i16> @urem_v4i16(<4 x i16> %op1, <4 x i16> %op2) #0 {		define <4 x i16> @urem_v4i16(<4 x i16> %op1, <4 x i16> %op2) #0 {
; CHECK-LABEL: urem_v4i16:		; CHECK-LABEL: urem_v4i16:
; CHECK: ushll v2.4s, v1.4h, #0		; CHECK: ushll v2.4s, v1.4h, #0
; CHECK-NEXT: ushll v3.4s, v0.4h, #0
; CHECK-NEXT: ptrue [[PG1:p[0-9]+]].s, vl4		; CHECK-NEXT: ptrue [[PG1:p[0-9]+]].s, vl4
		; CHECK-NEXT: ushll v3.4s, v0.4h, #0
; CHECK-NEXT: udivr [[DIV1:z[0-9]+]].s, [[PG1]]/m, z2.s, z3.s		; CHECK-NEXT: udivr [[DIV1:z[0-9]+]].s, [[PG1]]/m, z2.s, z3.s
; CHECK-NEXT: mov [[SCALAR1:w[0-9]+]], [[VEC:v[0-9]+]].s[1]		; CHECK-NEXT: mov [[SCALAR1:w[0-9]+]], [[VEC:v[0-9]+]].s[1]
; CHECK-NEXT: mov [[SCALAR2:w[0-9]+]], [[VEC]].s[2]		; CHECK-NEXT: mov [[SCALAR2:w[0-9]+]], [[VEC]].s[2]
; CHECK-NEXT: mov v3.16b, v2.16b		; CHECK-NEXT: mov v3.16b, v2.16b
; CHECK-NEXT: mov [[VECO:v[0-9]+]].h[1], [[SCALAR1]]		; CHECK-NEXT: mov [[VECO:v[0-9]+]].h[1], [[SCALAR1]]
; CHECK-NEXT: mov [[SCALAR3:w[0-9]+]], [[VEC]].s[3]		; CHECK-NEXT: mov [[SCALAR3:w[0-9]+]], [[VEC]].s[3]
; CHECK-NEXT: mov [[VECO]].h[2], [[SCALAR2]]		; CHECK-NEXT: mov [[VECO]].h[2], [[SCALAR2]]
; CHECK-NEXT: mov [[VECO]].h[3], [[SCALAR3]]		; CHECK-NEXT: mov [[VECO]].h[3], [[SCALAR3]]
; CHECK-NEXT: mls v0.4h, [[VECO]].4h, v1.4h		; CHECK-NEXT: mls v0.4h, [[VECO]].4h, v1.4h
; CHECK: ret		; CHECK: ret

; VBITS_EQ_128-LABEL: urem_v4i16:		; VBITS_EQ_128-LABEL: urem_v4i16:
; VBITS_EQ_128: ushll v2.4s, v1.4h, #0		; VBITS_EQ_128: ushll v2.4s, v1.4h, #0
; VBITS_EQ_128-NEXT: ushll v3.4s, v0.4h, #0
; VBITS_EQ_128-NEXT: ptrue p0.s, vl4		; VBITS_EQ_128-NEXT: ptrue p0.s, vl4
		; VBITS_EQ_128-NEXT: ushll v3.4s, v0.4h, #0
; VBITS_EQ_128-NEXT: udivr z2.s, p0/m, z2.s, z3.s		; VBITS_EQ_128-NEXT: udivr z2.s, p0/m, z2.s, z3.s
; VBITS_EQ_128-NEXT: xtn v2.4h, v2.4s		; VBITS_EQ_128-NEXT: xtn v2.4h, v2.4s
; VBITS_EQ_128-NEXT: mls v0.4h, v2.4h, v1.4h		; VBITS_EQ_128-NEXT: mls v0.4h, v2.4h, v1.4h
; VBITS_EQ_128-NEXT: ret		; VBITS_EQ_128-NEXT: ret

%res = urem <4 x i16> %op1, %op2		%res = urem <4 x i16> %op1, %op2
ret <4 x i16> %res		ret <4 x i16> %res
}		}
▲ Show 20 Lines • Show All 387 Lines • Show Last 20 Lines

llvm/test/CodeGen/AArch64/sve-fixed-length-masked-scatter.ll

		; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py UTC_ARGS: --function masked_scatter_v8i8,masked_scatter_v8i16,masked_scatter_v8i32,masked_scatter_v8i64 --prefix VBITS_EQ_256
; RUN: llc -aarch64-sve-vector-bits-min=128 < %s \| FileCheck %s -check-prefix=NO_SVE		; RUN: llc -aarch64-sve-vector-bits-min=128 < %s \| FileCheck %s -check-prefix=NO_SVE
; RUN: llc -aarch64-sve-vector-bits-min=256 < %s \| FileCheck %s -check-prefixes=CHECK,VBITS_EQ_256		; RUN: llc -aarch64-sve-vector-bits-min=256 < %s \| FileCheck %s -check-prefixes=CHECK,VBITS_EQ_256
; RUN: llc -aarch64-sve-vector-bits-min=384 < %s \| FileCheck %s -check-prefixes=CHECK		; RUN: llc -aarch64-sve-vector-bits-min=384 < %s \| FileCheck %s -check-prefixes=CHECK
; RUN: llc -aarch64-sve-vector-bits-min=512 < %s \| FileCheck %s -check-prefixes=CHECK,VBITS_GE_512		; RUN: llc -aarch64-sve-vector-bits-min=512 < %s \| FileCheck %s -check-prefixes=CHECK,VBITS_GE_512
; RUN: llc -aarch64-sve-vector-bits-min=640 < %s \| FileCheck %s -check-prefixes=CHECK,VBITS_GE_512		; RUN: llc -aarch64-sve-vector-bits-min=640 < %s \| FileCheck %s -check-prefixes=CHECK,VBITS_GE_512
; RUN: llc -aarch64-sve-vector-bits-min=768 < %s \| FileCheck %s -check-prefixes=CHECK,VBITS_GE_512		; RUN: llc -aarch64-sve-vector-bits-min=768 < %s \| FileCheck %s -check-prefixes=CHECK,VBITS_GE_512
; RUN: llc -aarch64-sve-vector-bits-min=896 < %s \| FileCheck %s -check-prefixes=CHECK,VBITS_GE_512		; RUN: llc -aarch64-sve-vector-bits-min=896 < %s \| FileCheck %s -check-prefixes=CHECK,VBITS_GE_512
; RUN: llc -aarch64-sve-vector-bits-min=1024 < %s \| FileCheck %s -check-prefixes=CHECK,VBITS_GE_512,VBITS_GE_1024		; RUN: llc -aarch64-sve-vector-bits-min=1024 < %s \| FileCheck %s -check-prefixes=CHECK,VBITS_GE_512,VBITS_GE_1024
▲ Show 20 Lines • Show All 71 Lines • ▼ Show 20 Lines
; VBITS_EQ_256-NEXT: ld1d { z3.d }, p0/z, [x1, x8, lsl #3]		; VBITS_EQ_256-NEXT: ld1d { z3.d }, p0/z, [x1, x8, lsl #3]
; VBITS_EQ_256-NEXT: ld1d { z4.d }, p0/z, [x1]		; VBITS_EQ_256-NEXT: ld1d { z4.d }, p0/z, [x1]
; VBITS_EQ_256-NEXT: zip1 v2.8b, v1.8b, v0.8b		; VBITS_EQ_256-NEXT: zip1 v2.8b, v1.8b, v0.8b
; VBITS_EQ_256-NEXT: zip2 v1.8b, v1.8b, v0.8b		; VBITS_EQ_256-NEXT: zip2 v1.8b, v1.8b, v0.8b
; VBITS_EQ_256-NEXT: zip2 v0.8b, v0.8b, v0.8b		; VBITS_EQ_256-NEXT: zip2 v0.8b, v0.8b, v0.8b
; VBITS_EQ_256-NEXT: shl v2.4h, v2.4h, #8		; VBITS_EQ_256-NEXT: shl v2.4h, v2.4h, #8
; VBITS_EQ_256-NEXT: shl v1.4h, v1.4h, #8		; VBITS_EQ_256-NEXT: shl v1.4h, v1.4h, #8
; VBITS_EQ_256-NEXT: uunpklo z0.s, z0.h		; VBITS_EQ_256-NEXT: uunpklo z0.s, z0.h
; VBITS_EQ_256-NEXT: uunpklo z0.d, z0.s
; VBITS_EQ_256-NEXT: sshr v2.4h, v2.4h, #8		; VBITS_EQ_256-NEXT: sshr v2.4h, v2.4h, #8
; VBITS_EQ_256-NEXT: sshr v1.4h, v1.4h, #8		; VBITS_EQ_256-NEXT: sshr v1.4h, v1.4h, #8
		; VBITS_EQ_256-NEXT: uunpklo z0.d, z0.s
; VBITS_EQ_256-NEXT: sunpklo z2.s, z2.h		; VBITS_EQ_256-NEXT: sunpklo z2.s, z2.h
; VBITS_EQ_256-NEXT: sunpklo z1.s, z1.h		; VBITS_EQ_256-NEXT: sunpklo z1.s, z1.h
; VBITS_EQ_256-NEXT: sunpklo z2.d, z2.s		; VBITS_EQ_256-NEXT: sunpklo z2.d, z2.s
; VBITS_EQ_256-NEXT: sunpklo z1.d, z1.s		; VBITS_EQ_256-NEXT: sunpklo z1.d, z1.s
; VBITS_EQ_256-NEXT: cmpne p1.d, p0/z, z2.d, #0		; VBITS_EQ_256-NEXT: cmpne p1.d, p0/z, z2.d, #0
; VBITS_EQ_256-NEXT: cmpne p0.d, p0/z, z1.d, #0		; VBITS_EQ_256-NEXT: cmpne p0.d, p0/z, z1.d, #0
; VBITS_EQ_256-NEXT: uunpklo z1.s, z5.h		; VBITS_EQ_256-NEXT: uunpklo z1.s, z5.h
; VBITS_EQ_256-NEXT: uunpklo z1.d, z1.s		; VBITS_EQ_256-NEXT: uunpklo z1.d, z1.s
; VBITS_EQ_256-NEXT: st1b { z1.d }, p1, [z4.d]		; VBITS_EQ_256-NEXT: st1b { z1.d }, p1, [z4.d]
; VBITS_EQ_256-NEXT: st1b { z0.d }, p0, [z3.d]		; VBITS_EQ_256-NEXT: st1b { z0.d }, p0, [z3.d]
; VBITS_EQ_256-NEXT: ret		; VBITS_EQ_256-NEXT: ret
;
; VBITS_GE_512-LABEL: masked_scatter_v8i8:		; VBITS_GE_512-LABEL: masked_scatter_v8i8:
; VBITS_GE_512: // %bb.0:		; VBITS_GE_512: // %bb.0:
; VBITS_GE_512-NEXT: ldr d0, [x0]		; VBITS_GE_512-NEXT: ldr d0, [x0]
; VBITS_GE_512-NEXT: ptrue p0.d, vl8		; VBITS_GE_512-NEXT: ptrue p0.d, vl8
; VBITS_GE_512-NEXT: ld1d { z1.d }, p0/z, [x1]		; VBITS_GE_512-NEXT: ld1d { z1.d }, p0/z, [x1]
; VBITS_GE_512-NEXT: cmeq v2.8b, v0.8b, #0		; VBITS_GE_512-NEXT: cmeq v2.8b, v0.8b, #0
; VBITS_GE_512-NEXT: uunpklo z0.h, z0.b		; VBITS_GE_512-NEXT: uunpklo z0.h, z0.b
; VBITS_GE_512-NEXT: uunpklo z0.s, z0.h		; VBITS_GE_512-NEXT: uunpklo z0.s, z0.h
; VBITS_GE_512-NEXT: uunpklo z0.d, z0.s
; VBITS_GE_512-NEXT: sunpklo z2.h, z2.b		; VBITS_GE_512-NEXT: sunpklo z2.h, z2.b
		; VBITS_GE_512-NEXT: uunpklo z0.d, z0.s
; VBITS_GE_512-NEXT: sunpklo z2.s, z2.h		; VBITS_GE_512-NEXT: sunpklo z2.s, z2.h
; VBITS_GE_512-NEXT: sunpklo z2.d, z2.s		; VBITS_GE_512-NEXT: sunpklo z2.d, z2.s
; VBITS_GE_512-NEXT: cmpne p0.d, p0/z, z2.d, #0		; VBITS_GE_512-NEXT: cmpne p0.d, p0/z, z2.d, #0
; VBITS_GE_512-NEXT: st1b { z0.d }, p0, [z1.d]		; VBITS_GE_512-NEXT: st1b { z0.d }, p0, [z1.d]
; VBITS_GE_512-NEXT: ret		; VBITS_GE_512-NEXT: ret
%vals = load <8 x i8>, <8 x i8>* %a		%vals = load <8 x i8>, <8 x i8>* %a
%ptrs = load <8 x i8>, <8 x i8>* %b		%ptrs = load <8 x i8>, <8 x i8>* %b
%mask = icmp eq <8 x i8> %vals, zeroinitializer		%mask = icmp eq <8 x i8> %vals, zeroinitializer
call void @llvm.masked.scatter.v8i8(<8 x i8> %vals, <8 x i8*> %ptrs, i32 8, <8 x i1> %mask)		call void @llvm.masked.scatter.v8i8(<8 x i8> %vals, <8 x i8*> %ptrs, i32 8, <8 x i1> %mask)
ret void		ret void
}		}

define void @masked_scatter_v16i8(<16 x i8>* %a, <16 x i8> %b) #0 {		define void @masked_scatter_v16i8(<16 x i8>* %a, <16 x i8> %b) #0 {
; VBITS_GE_1024-LABEL: masked_scatter_v16i8:		; VBITS_GE_1024-LABEL: masked_scatter_v16i8:
; VBITS_GE_1024: // %bb.0:		; VBITS_GE_1024: // %bb.0:
; VBITS_GE_1024-NEXT: ldr q0, [x0]		; VBITS_GE_1024-NEXT: ldr q0, [x0]
; VBITS_GE_1024-NEXT: ptrue p0.d, vl16		; VBITS_GE_1024-NEXT: ptrue p0.d, vl16
; VBITS_GE_1024-NEXT: ld1d { z1.d }, p0/z, [x1]		; VBITS_GE_1024-NEXT: ld1d { z1.d }, p0/z, [x1]
; VBITS_GE_1024-NEXT: cmeq v2.16b, v0.16b, #0		; VBITS_GE_1024-NEXT: cmeq v2.16b, v0.16b, #0
; VBITS_GE_1024-NEXT: uunpklo z0.h, z0.b		; VBITS_GE_1024-NEXT: uunpklo z0.h, z0.b
; VBITS_GE_1024-NEXT: uunpklo z0.s, z0.h		; VBITS_GE_1024-NEXT: uunpklo z0.s, z0.h
; VBITS_GE_1024-NEXT: uunpklo z0.d, z0.s
; VBITS_GE_1024-NEXT: sunpklo z2.h, z2.b		; VBITS_GE_1024-NEXT: sunpklo z2.h, z2.b
		; VBITS_GE_1024-NEXT: uunpklo z0.d, z0.s
; VBITS_GE_1024-NEXT: sunpklo z2.s, z2.h		; VBITS_GE_1024-NEXT: sunpklo z2.s, z2.h
; VBITS_GE_1024-NEXT: sunpklo z2.d, z2.s		; VBITS_GE_1024-NEXT: sunpklo z2.d, z2.s
; VBITS_GE_1024-NEXT: cmpne p0.d, p0/z, z2.d, #0		; VBITS_GE_1024-NEXT: cmpne p0.d, p0/z, z2.d, #0
; VBITS_GE_1024-NEXT: st1b { z0.d }, p0, [z1.d]		; VBITS_GE_1024-NEXT: st1b { z0.d }, p0, [z1.d]
; VBITS_GE_1024-NEXT: ret		; VBITS_GE_1024-NEXT: ret
%vals = load <16 x i8>, <16 x i8>* %a		%vals = load <16 x i8>, <16 x i8>* %a
%ptrs = load <16 x i8>, <16 x i8>* %b		%ptrs = load <16 x i8>, <16 x i8>* %b
%mask = icmp eq <16 x i8> %vals, zeroinitializer		%mask = icmp eq <16 x i8> %vals, zeroinitializer
▲ Show 20 Lines • Show All 77 Lines • ▼ Show 20 Lines
; VBITS_EQ_256: // %bb.0:		; VBITS_EQ_256: // %bb.0:
; VBITS_EQ_256-NEXT: ldr q0, [x0]		; VBITS_EQ_256-NEXT: ldr q0, [x0]
; VBITS_EQ_256-NEXT: mov x8, #4		; VBITS_EQ_256-NEXT: mov x8, #4
; VBITS_EQ_256-NEXT: ptrue p0.d, vl4		; VBITS_EQ_256-NEXT: ptrue p0.d, vl4
; VBITS_EQ_256-NEXT: cmeq v1.8h, v0.8h, #0		; VBITS_EQ_256-NEXT: cmeq v1.8h, v0.8h, #0
; VBITS_EQ_256-NEXT: ld1d { z4.d }, p0/z, [x1, x8, lsl #3]		; VBITS_EQ_256-NEXT: ld1d { z4.d }, p0/z, [x1, x8, lsl #3]
; VBITS_EQ_256-NEXT: ext v3.16b, v0.16b, v0.16b, #8		; VBITS_EQ_256-NEXT: ext v3.16b, v0.16b, v0.16b, #8
; VBITS_EQ_256-NEXT: uunpklo z0.s, z0.h		; VBITS_EQ_256-NEXT: uunpklo z0.s, z0.h
; VBITS_EQ_256-NEXT: uunpklo z0.d, z0.s
; VBITS_EQ_256-NEXT: sunpklo z2.s, z1.h		; VBITS_EQ_256-NEXT: sunpklo z2.s, z1.h
		; VBITS_EQ_256-NEXT: uunpklo z0.d, z0.s
; VBITS_EQ_256-NEXT: ext v1.16b, v1.16b, v1.16b, #8		; VBITS_EQ_256-NEXT: ext v1.16b, v1.16b, v1.16b, #8
; VBITS_EQ_256-NEXT: sunpklo z2.d, z2.s		; VBITS_EQ_256-NEXT: sunpklo z2.d, z2.s
; VBITS_EQ_256-NEXT: cmpne p1.d, p0/z, z2.d, #0		; VBITS_EQ_256-NEXT: cmpne p1.d, p0/z, z2.d, #0
; VBITS_EQ_256-NEXT: ld1d { z2.d }, p0/z, [x1]		; VBITS_EQ_256-NEXT: ld1d { z2.d }, p0/z, [x1]
; VBITS_EQ_256-NEXT: uunpklo z3.s, z3.h		; VBITS_EQ_256-NEXT: uunpklo z3.s, z3.h
; VBITS_EQ_256-NEXT: sunpklo z1.s, z1.h		; VBITS_EQ_256-NEXT: sunpklo z1.s, z1.h
; VBITS_EQ_256-NEXT: sunpklo z1.d, z1.s		; VBITS_EQ_256-NEXT: sunpklo z1.d, z1.s
; VBITS_EQ_256-NEXT: st1h { z0.d }, p1, [z2.d]		; VBITS_EQ_256-NEXT: st1h { z0.d }, p1, [z2.d]
; VBITS_EQ_256-NEXT: cmpne p0.d, p0/z, z1.d, #0		; VBITS_EQ_256-NEXT: cmpne p0.d, p0/z, z1.d, #0
; VBITS_EQ_256-NEXT: uunpklo z1.d, z3.s		; VBITS_EQ_256-NEXT: uunpklo z1.d, z3.s
; VBITS_EQ_256-NEXT: st1h { z1.d }, p0, [z4.d]		; VBITS_EQ_256-NEXT: st1h { z1.d }, p0, [z4.d]
; VBITS_EQ_256-NEXT: ret		; VBITS_EQ_256-NEXT: ret
;
; VBITS_GE_512-LABEL: masked_scatter_v8i16:		; VBITS_GE_512-LABEL: masked_scatter_v8i16:
; VBITS_GE_512: // %bb.0:		; VBITS_GE_512: // %bb.0:
; VBITS_GE_512-NEXT: ldr q0, [x0]		; VBITS_GE_512-NEXT: ldr q0, [x0]
; VBITS_GE_512-NEXT: ptrue p0.d, vl8		; VBITS_GE_512-NEXT: ptrue p0.d, vl8
; VBITS_GE_512-NEXT: ld1d { z1.d }, p0/z, [x1]		; VBITS_GE_512-NEXT: ld1d { z1.d }, p0/z, [x1]
; VBITS_GE_512-NEXT: cmeq v2.8h, v0.8h, #0		; VBITS_GE_512-NEXT: cmeq v2.8h, v0.8h, #0
; VBITS_GE_512-NEXT: uunpklo z0.s, z0.h		; VBITS_GE_512-NEXT: uunpklo z0.s, z0.h
; VBITS_GE_512-NEXT: uunpklo z0.d, z0.s		; VBITS_GE_512-NEXT: uunpklo z0.d, z0.s
▲ Show 20 Lines • Show All 112 Lines • ▼ Show 20 Lines
; VBITS_EQ_256-NEXT: uunpklo z1.d, z0.s		; VBITS_EQ_256-NEXT: uunpklo z1.d, z0.s
; VBITS_EQ_256-NEXT: sunpklo z4.d, z4.s		; VBITS_EQ_256-NEXT: sunpklo z4.d, z4.s
; VBITS_EQ_256-NEXT: ext z0.b, z0.b, z0.b, #16		; VBITS_EQ_256-NEXT: ext z0.b, z0.b, z0.b, #16
; VBITS_EQ_256-NEXT: cmpne p1.d, p1/z, z4.d, #0		; VBITS_EQ_256-NEXT: cmpne p1.d, p1/z, z4.d, #0
; VBITS_EQ_256-NEXT: uunpklo z0.d, z0.s		; VBITS_EQ_256-NEXT: uunpklo z0.d, z0.s
; VBITS_EQ_256-NEXT: st1w { z1.d }, p0, [z3.d]		; VBITS_EQ_256-NEXT: st1w { z1.d }, p0, [z3.d]
; VBITS_EQ_256-NEXT: st1w { z0.d }, p1, [z2.d]		; VBITS_EQ_256-NEXT: st1w { z0.d }, p1, [z2.d]
; VBITS_EQ_256-NEXT: ret		; VBITS_EQ_256-NEXT: ret
;
; VBITS_GE_512-LABEL: masked_scatter_v8i32:		; VBITS_GE_512-LABEL: masked_scatter_v8i32:
; VBITS_GE_512: // %bb.0:		; VBITS_GE_512: // %bb.0:
; VBITS_GE_512-NEXT: ptrue p0.s, vl8		; VBITS_GE_512-NEXT: ptrue p0.s, vl8
; VBITS_GE_512-NEXT: ptrue p1.d, vl8		; VBITS_GE_512-NEXT: ptrue p1.d, vl8
; VBITS_GE_512-NEXT: ld1w { z0.s }, p0/z, [x0]		; VBITS_GE_512-NEXT: ld1w { z0.s }, p0/z, [x0]
; VBITS_GE_512-NEXT: ld1d { z1.d }, p1/z, [x1]		; VBITS_GE_512-NEXT: ld1d { z1.d }, p1/z, [x1]
; VBITS_GE_512-NEXT: cmpeq p0.s, p0/z, z0.s, #0		; VBITS_GE_512-NEXT: cmpeq p0.s, p0/z, z0.s, #0
; VBITS_GE_512-NEXT: uunpklo z0.d, z0.s		; VBITS_GE_512-NEXT: uunpklo z0.d, z0.s
▲ Show 20 Lines • Show All 69 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
ret void		ret void
}		}

define void @masked_scatter_v2i64(<2 x i64>* %a, <2 x i64> %b) #0 {		define void @masked_scatter_v2i64(<2 x i64>* %a, <2 x i64> %b) #0 {
; CHECK-LABEL: masked_scatter_v2i64:		; CHECK-LABEL: masked_scatter_v2i64:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: ldr q0, [x0]		; CHECK-NEXT: ldr q0, [x0]
; CHECK-NEXT: ptrue p0.d, vl2		; CHECK-NEXT: ptrue p0.d, vl2
; CHECK-NEXT: ldr q2, [x1]		; CHECK-NEXT: ldr q1, [x1]
; CHECK-NEXT: cmeq v1.2d, v0.2d, #0		; CHECK-NEXT: cmeq v2.2d, v0.2d, #0
; CHECK-NEXT: cmpne p0.d, p0/z, z1.d, #0		; CHECK-NEXT: cmpne p0.d, p0/z, z2.d, #0
; CHECK-NEXT: st1d { z0.d }, p0, [z2.d]		; CHECK-NEXT: st1d { z0.d }, p0, [z1.d]
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%vals = load <2 x i64>, <2 x i64>* %a		%vals = load <2 x i64>, <2 x i64>* %a
%ptrs = load <2 x i64>, <2 x i64>* %b		%ptrs = load <2 x i64>, <2 x i64>* %b
%mask = icmp eq <2 x i64> %vals, zeroinitializer		%mask = icmp eq <2 x i64> %vals, zeroinitializer
call void @llvm.masked.scatter.v2i64(<2 x i64> %vals, <2 x i64*> %ptrs, i32 8, <2 x i1> %mask)		call void @llvm.masked.scatter.v2i64(<2 x i64> %vals, <2 x i64*> %ptrs, i32 8, <2 x i1> %mask)
ret void		ret void
}		}

Show All 23 Lines
; VBITS_EQ_256-NEXT: ld1d { z1.d }, p0/z, [x0]		; VBITS_EQ_256-NEXT: ld1d { z1.d }, p0/z, [x0]
; VBITS_EQ_256-NEXT: ld1d { z2.d }, p0/z, [x1, x8, lsl #3]		; VBITS_EQ_256-NEXT: ld1d { z2.d }, p0/z, [x1, x8, lsl #3]
; VBITS_EQ_256-NEXT: ld1d { z3.d }, p0/z, [x1]		; VBITS_EQ_256-NEXT: ld1d { z3.d }, p0/z, [x1]
; VBITS_EQ_256-NEXT: cmpeq p1.d, p0/z, z0.d, #0		; VBITS_EQ_256-NEXT: cmpeq p1.d, p0/z, z0.d, #0
; VBITS_EQ_256-NEXT: cmpeq p0.d, p0/z, z1.d, #0		; VBITS_EQ_256-NEXT: cmpeq p0.d, p0/z, z1.d, #0
; VBITS_EQ_256-NEXT: st1d { z1.d }, p0, [z3.d]		; VBITS_EQ_256-NEXT: st1d { z1.d }, p0, [z3.d]
; VBITS_EQ_256-NEXT: st1d { z0.d }, p1, [z2.d]		; VBITS_EQ_256-NEXT: st1d { z0.d }, p1, [z2.d]
; VBITS_EQ_256-NEXT: ret		; VBITS_EQ_256-NEXT: ret
;
; VBITS_GE_512-LABEL: masked_scatter_v8i64:		; VBITS_GE_512-LABEL: masked_scatter_v8i64:
; VBITS_GE_512: // %bb.0:		; VBITS_GE_512: // %bb.0:
; VBITS_GE_512-NEXT: ptrue p0.d, vl8		; VBITS_GE_512-NEXT: ptrue p0.d, vl8
; VBITS_GE_512-NEXT: ld1d { z0.d }, p0/z, [x0]		; VBITS_GE_512-NEXT: ld1d { z0.d }, p0/z, [x0]
; VBITS_GE_512-NEXT: ld1d { z1.d }, p0/z, [x1]		; VBITS_GE_512-NEXT: ld1d { z1.d }, p0/z, [x1]
; VBITS_GE_512-NEXT: cmpeq p0.d, p0/z, z0.d, #0		; VBITS_GE_512-NEXT: cmpeq p0.d, p0/z, z0.d, #0
; VBITS_GE_512-NEXT: st1d { z0.d }, p0, [z1.d]		; VBITS_GE_512-NEXT: st1d { z0.d }, p0, [z1.d]
; VBITS_GE_512-NEXT: ret		; VBITS_GE_512-NEXT: ret
▲ Show 20 Lines • Show All 673 Lines • Show Last 20 Lines

llvm/test/CodeGen/AArch64/sve-vscale-attr.ll

	Show All 9 Lines
	; CHECK-NOARG-NEXT: ldp q0, q1, [x0, #32]			; CHECK-NOARG-NEXT: ldp q0, q1, [x0, #32]
	; CHECK-NOARG-NEXT: ldp q4, q5, [x1, #32]			; CHECK-NOARG-NEXT: ldp q4, q5, [x1, #32]
	; CHECK-NOARG-NEXT: add v0.4s, v0.4s, v4.4s			; CHECK-NOARG-NEXT: add v0.4s, v0.4s, v4.4s
	; CHECK-NOARG-NEXT: ldp q2, q3, [x0]			; CHECK-NOARG-NEXT: ldp q2, q3, [x0]
	; CHECK-NOARG-NEXT: add v1.4s, v1.4s, v5.4s			; CHECK-NOARG-NEXT: add v1.4s, v1.4s, v5.4s
	; CHECK-NOARG-NEXT: ldp q6, q4, [x1]			; CHECK-NOARG-NEXT: ldp q6, q4, [x1]
	; CHECK-NOARG-NEXT: stp q0, q1, [x0, #32]			; CHECK-NOARG-NEXT: stp q0, q1, [x0, #32]
	; CHECK-NOARG-NEXT: add v2.4s, v2.4s, v6.4s			; CHECK-NOARG-NEXT: add v2.4s, v2.4s, v6.4s
	; CHECK-NOARG-NEXT: add v3.4s, v3.4s, v4.4s			; CHECK-NOARG-NEXT: add v0.4s, v3.4s, v4.4s
	; CHECK-NOARG-NEXT: stp q2, q3, [x0]			; CHECK-NOARG-NEXT: stp q2, q0, [x0]
	; CHECK-NOARG-NEXT: ret			; CHECK-NOARG-NEXT: ret
	;			;
	; CHECK-ARG-LABEL: func_vscale_none:			; CHECK-ARG-LABEL: func_vscale_none:
	; CHECK-ARG: // %bb.0:			; CHECK-ARG: // %bb.0:
	; CHECK-ARG-NEXT: ptrue p0.s, vl16			; CHECK-ARG-NEXT: ptrue p0.s, vl16
	; CHECK-ARG-NEXT: ld1w { z0.s }, p0/z, [x0]			; CHECK-ARG-NEXT: ld1w { z0.s }, p0/z, [x0]
	; CHECK-ARG-NEXT: ld1w { z1.s }, p0/z, [x1]			; CHECK-ARG-NEXT: ld1w { z1.s }, p0/z, [x1]
	; CHECK-ARG-NEXT: add z0.s, z0.s, z1.s			; CHECK-ARG-NEXT: add z0.s, z0.s, z1.s
	Show All 14 Lines
	; CHECK-NEXT: ldp q0, q1, [x0, #32]			; CHECK-NEXT: ldp q0, q1, [x0, #32]
	; CHECK-NEXT: ldp q4, q5, [x1, #32]			; CHECK-NEXT: ldp q4, q5, [x1, #32]
	; CHECK-NEXT: add v0.4s, v0.4s, v4.4s			; CHECK-NEXT: add v0.4s, v0.4s, v4.4s
	; CHECK-NEXT: ldp q2, q3, [x0]			; CHECK-NEXT: ldp q2, q3, [x0]
	; CHECK-NEXT: add v1.4s, v1.4s, v5.4s			; CHECK-NEXT: add v1.4s, v1.4s, v5.4s
	; CHECK-NEXT: ldp q6, q4, [x1]			; CHECK-NEXT: ldp q6, q4, [x1]
	; CHECK-NEXT: stp q0, q1, [x0, #32]			; CHECK-NEXT: stp q0, q1, [x0, #32]
	; CHECK-NEXT: add v2.4s, v2.4s, v6.4s			; CHECK-NEXT: add v2.4s, v2.4s, v6.4s
	; CHECK-NEXT: add v3.4s, v3.4s, v4.4s			; CHECK-NEXT: add v0.4s, v3.4s, v4.4s
	; CHECK-NEXT: stp q2, q3, [x0]			; CHECK-NEXT: stp q2, q0, [x0]
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%op1 = load <16 x i32>, <16 x i32>* %a			%op1 = load <16 x i32>, <16 x i32>* %a
	%op2 = load <16 x i32>, <16 x i32>* %b			%op2 = load <16 x i32>, <16 x i32>* %b
	%res = add <16 x i32> %op1, %op2			%res = add <16 x i32> %op1, %op2
	store <16 x i32> %res, <16 x i32>* %a			store <16 x i32> %res, <16 x i32>* %a
	ret void			ret void
	}			}

	▲ Show 20 Lines • Show All 83 Lines • Show Last 20 Lines

llvm/test/CodeGen/AArch64/uadd_sat_vec.ll

Show First 20 Lines • Show All 91 Lines • ▼ Show 20 Lines
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%z = call <32 x i16> @llvm.uadd.sat.v32i16(<32 x i16> %x, <32 x i16> %y)		%z = call <32 x i16> @llvm.uadd.sat.v32i16(<32 x i16> %x, <32 x i16> %y)
ret <32 x i16> %z		ret <32 x i16> %z
}		}

define void @v8i8(<8 x i8>* %px, <8 x i8>* %py, <8 x i8>* %pz) nounwind {		define void @v8i8(<8 x i8>* %px, <8 x i8>* %py, <8 x i8>* %pz) nounwind {
; CHECK-LABEL: v8i8:		; CHECK-LABEL: v8i8:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: ldr d0, [x0]		; CHECK-NEXT: ldr d0, [x1]
; CHECK-NEXT: ldr d1, [x1]		; CHECK-NEXT: ldr d1, [x0]
; CHECK-NEXT: uqadd v0.8b, v0.8b, v1.8b		; CHECK-NEXT: uqadd v0.8b, v1.8b, v0.8b
; CHECK-NEXT: str d0, [x2]		; CHECK-NEXT: str d0, [x2]
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%x = load <8 x i8>, <8 x i8>* %px		%x = load <8 x i8>, <8 x i8>* %px
%y = load <8 x i8>, <8 x i8>* %py		%y = load <8 x i8>, <8 x i8>* %py
%z = call <8 x i8> @llvm.uadd.sat.v8i8(<8 x i8> %x, <8 x i8> %y)		%z = call <8 x i8> @llvm.uadd.sat.v8i8(<8 x i8> %x, <8 x i8> %y)
store <8 x i8> %z, <8 x i8>* %pz		store <8 x i8> %z, <8 x i8>* %pz
ret void		ret void
}		}
▲ Show 20 Lines • Show All 42 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%z = call <2 x i8> @llvm.uadd.sat.v2i8(<2 x i8> %x, <2 x i8> %y)		%z = call <2 x i8> @llvm.uadd.sat.v2i8(<2 x i8> %x, <2 x i8> %y)
store <2 x i8> %z, <2 x i8>* %pz		store <2 x i8> %z, <2 x i8>* %pz
ret void		ret void
}		}

define void @v4i16(<4 x i16>* %px, <4 x i16>* %py, <4 x i16>* %pz) nounwind {		define void @v4i16(<4 x i16>* %px, <4 x i16>* %py, <4 x i16>* %pz) nounwind {
; CHECK-LABEL: v4i16:		; CHECK-LABEL: v4i16:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: ldr d0, [x0]		; CHECK-NEXT: ldr d0, [x1]
; CHECK-NEXT: ldr d1, [x1]		; CHECK-NEXT: ldr d1, [x0]
; CHECK-NEXT: uqadd v0.4h, v0.4h, v1.4h		; CHECK-NEXT: uqadd v0.4h, v1.4h, v0.4h
; CHECK-NEXT: str d0, [x2]		; CHECK-NEXT: str d0, [x2]
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%x = load <4 x i16>, <4 x i16>* %px		%x = load <4 x i16>, <4 x i16>* %px
%y = load <4 x i16>, <4 x i16>* %py		%y = load <4 x i16>, <4 x i16>* %py
%z = call <4 x i16> @llvm.uadd.sat.v4i16(<4 x i16> %x, <4 x i16> %y)		%z = call <4 x i16> @llvm.uadd.sat.v4i16(<4 x i16> %x, <4 x i16> %y)
store <4 x i16> %z, <4 x i16>* %pz		store <4 x i16> %z, <4 x i16>* %pz
ret void		ret void
}		}
▲ Show 20 Lines • Show All 48 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%z = call <12 x i16> @llvm.uadd.sat.v12i16(<12 x i16> %x, <12 x i16> %y)		%z = call <12 x i16> @llvm.uadd.sat.v12i16(<12 x i16> %x, <12 x i16> %y)
store <12 x i16> %z, <12 x i16>* %pz		store <12 x i16> %z, <12 x i16>* %pz
ret void		ret void
}		}

define void @v1i8(<1 x i8>* %px, <1 x i8>* %py, <1 x i8>* %pz) nounwind {		define void @v1i8(<1 x i8>* %px, <1 x i8>* %py, <1 x i8>* %pz) nounwind {
; CHECK-LABEL: v1i8:		; CHECK-LABEL: v1i8:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: ldr b0, [x0]		; CHECK-NEXT: ldr b0, [x1]
; CHECK-NEXT: ldr b1, [x1]		; CHECK-NEXT: ldr b1, [x0]
; CHECK-NEXT: uqadd v0.8b, v0.8b, v1.8b		; CHECK-NEXT: uqadd v0.8b, v1.8b, v0.8b
; CHECK-NEXT: st1 { v0.b }[0], [x2]		; CHECK-NEXT: st1 { v0.b }[0], [x2]
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%x = load <1 x i8>, <1 x i8>* %px		%x = load <1 x i8>, <1 x i8>* %px
%y = load <1 x i8>, <1 x i8>* %py		%y = load <1 x i8>, <1 x i8>* %py
%z = call <1 x i8> @llvm.uadd.sat.v1i8(<1 x i8> %x, <1 x i8> %y)		%z = call <1 x i8> @llvm.uadd.sat.v1i8(<1 x i8> %x, <1 x i8> %y)
store <1 x i8> %z, <1 x i8>* %pz		store <1 x i8> %z, <1 x i8>* %pz
ret void		ret void
}		}

define void @v1i16(<1 x i16>* %px, <1 x i16>* %py, <1 x i16>* %pz) nounwind {		define void @v1i16(<1 x i16>* %px, <1 x i16>* %py, <1 x i16>* %pz) nounwind {
; CHECK-LABEL: v1i16:		; CHECK-LABEL: v1i16:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: ldr h0, [x0]		; CHECK-NEXT: ldr h0, [x1]
; CHECK-NEXT: ldr h1, [x1]		; CHECK-NEXT: ldr h1, [x0]
; CHECK-NEXT: uqadd v0.4h, v0.4h, v1.4h		; CHECK-NEXT: uqadd v0.4h, v1.4h, v0.4h
; CHECK-NEXT: str h0, [x2]		; CHECK-NEXT: str h0, [x2]
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%x = load <1 x i16>, <1 x i16>* %px		%x = load <1 x i16>, <1 x i16>* %px
%y = load <1 x i16>, <1 x i16>* %py		%y = load <1 x i16>, <1 x i16>* %py
%z = call <1 x i16> @llvm.uadd.sat.v1i16(<1 x i16> %x, <1 x i16> %y)		%z = call <1 x i16> @llvm.uadd.sat.v1i16(<1 x i16> %x, <1 x i16> %y)
store <1 x i16> %z, <1 x i16>* %pz		store <1 x i16> %z, <1 x i16>* %pz
ret void		ret void
}		}
▲ Show 20 Lines • Show All 124 Lines • Show Last 20 Lines

llvm/test/CodeGen/AArch64/urem-seteq-illegal-types.ll

Show First 20 Lines • Show All 61 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
ret i1 %cmp		ret i1 %cmp
}		}

define <3 x i1> @test_urem_vec(<3 x i11> %X) nounwind {		define <3 x i1> @test_urem_vec(<3 x i11> %X) nounwind {
; CHECK-LABEL: test_urem_vec:		; CHECK-LABEL: test_urem_vec:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: fmov s0, w0		; CHECK-NEXT: fmov s0, w0
; CHECK-NEXT: adrp x8, .LCPI4_0		; CHECK-NEXT: adrp x8, .LCPI4_0
		; CHECK-NEXT: adrp x9, .LCPI4_1
; CHECK-NEXT: mov v0.h[1], w1		; CHECK-NEXT: mov v0.h[1], w1
; CHECK-NEXT: ldr d1, [x8, :lo12:.LCPI4_0]		; CHECK-NEXT: ldr d1, [x8, :lo12:.LCPI4_0]
; CHECK-NEXT: adrp x8, .LCPI4_1		; CHECK-NEXT: ldr d2, [x9, :lo12:.LCPI4_1]
		; CHECK-NEXT: adrp x8, .LCPI4_2
; CHECK-NEXT: mov v0.h[2], w2		; CHECK-NEXT: mov v0.h[2], w2
; CHECK-NEXT: sub v0.4h, v0.4h, v1.4h		; CHECK-NEXT: sub v0.4h, v0.4h, v1.4h
; CHECK-NEXT: ldr d1, [x8, :lo12:.LCPI4_1]
; CHECK-NEXT: adrp x8, .LCPI4_2
; CHECK-NEXT: mul v0.4h, v0.4h, v1.4h
; CHECK-NEXT: movi d1, #0x0000000000ffff		; CHECK-NEXT: movi d1, #0x0000000000ffff
; CHECK-NEXT: ldr d3, [x8, :lo12:.LCPI4_2]		; CHECK-NEXT: mul v0.4h, v0.4h, v2.4h
		; CHECK-NEXT: ldr d2, [x8, :lo12:.LCPI4_2]
; CHECK-NEXT: adrp x8, .LCPI4_3		; CHECK-NEXT: adrp x8, .LCPI4_3
; CHECK-NEXT: shl v2.4h, v0.4h, #1		; CHECK-NEXT: shl v3.4h, v0.4h, #1
; CHECK-NEXT: bic v0.4h, #248, lsl #8		; CHECK-NEXT: bic v0.4h, #248, lsl #8
; CHECK-NEXT: ushl v2.4h, v2.4h, v3.4h
; CHECK-NEXT: ushl v0.4h, v0.4h, v1.4h		; CHECK-NEXT: ushl v0.4h, v0.4h, v1.4h
; CHECK-NEXT: ldr d1, [x8, :lo12:.LCPI4_3]		; CHECK-NEXT: ushl v1.4h, v3.4h, v2.4h
; CHECK-NEXT: orr v0.8b, v0.8b, v2.8b		; CHECK-NEXT: ldr d2, [x8, :lo12:.LCPI4_3]
		; CHECK-NEXT: orr v0.8b, v0.8b, v1.8b
; CHECK-NEXT: bic v0.4h, #248, lsl #8		; CHECK-NEXT: bic v0.4h, #248, lsl #8
; CHECK-NEXT: cmhi v0.4h, v0.4h, v1.4h		; CHECK-NEXT: cmhi v0.4h, v0.4h, v2.4h
; CHECK-NEXT: umov w0, v0.h[0]		; CHECK-NEXT: umov w0, v0.h[0]
; CHECK-NEXT: umov w1, v0.h[1]		; CHECK-NEXT: umov w1, v0.h[1]
; CHECK-NEXT: umov w2, v0.h[2]		; CHECK-NEXT: umov w2, v0.h[2]
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%urem = urem <3 x i11> %X, <i11 6, i11 7, i11 -5>		%urem = urem <3 x i11> %X, <i11 6, i11 7, i11 -5>
%cmp = icmp ne <3 x i11> %urem, <i11 0, i11 1, i11 2>		%cmp = icmp ne <3 x i11> %urem, <i11 0, i11 1, i11 2>
ret <3 x i1> %cmp		ret <3 x i1> %cmp
}		}

llvm/test/CodeGen/AArch64/urem-seteq-vec-nonsplat.ll

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: llc -mtriple=aarch64-unknown-linux-gnu < %s \| FileCheck %s			; RUN: llc -mtriple=aarch64-unknown-linux-gnu < %s \| FileCheck %s

	; Odd+Even divisors			; Odd+Even divisors
	define <4 x i32> @test_urem_odd_even(<4 x i32> %X) nounwind {			define <4 x i32> @test_urem_odd_even(<4 x i32> %X) nounwind {
	; CHECK-LABEL: test_urem_odd_even:			; CHECK-LABEL: test_urem_odd_even:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: adrp x8, .LCPI0_0			; CHECK-NEXT: adrp x8, .LCPI0_0
	; CHECK-NEXT: adrp x9, .LCPI0_2			; CHECK-NEXT: adrp x9, .LCPI0_2
				; CHECK-NEXT: movi v3.4s, #1
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI0_0]			; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI0_0]
	; CHECK-NEXT: adrp x8, .LCPI0_1			; CHECK-NEXT: adrp x8, .LCPI0_1
	; CHECK-NEXT: ldr q2, [x9, :lo12:.LCPI0_2]			; CHECK-NEXT: ldr q2, [x9, :lo12:.LCPI0_2]
	; CHECK-NEXT: mul v0.4s, v0.4s, v1.4s			; CHECK-NEXT: mul v0.4s, v0.4s, v1.4s
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI0_1]			; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI0_1]
	; CHECK-NEXT: adrp x8, .LCPI0_3			; CHECK-NEXT: adrp x8, .LCPI0_3
	; CHECK-NEXT: ushl v1.4s, v0.4s, v1.4s			; CHECK-NEXT: ushl v1.4s, v0.4s, v1.4s
	; CHECK-NEXT: ushl v0.4s, v0.4s, v2.4s			; CHECK-NEXT: ushl v0.4s, v0.4s, v2.4s
				; CHECK-NEXT: ldr q2, [x8, :lo12:.LCPI0_3]
	; CHECK-NEXT: orr v0.16b, v0.16b, v1.16b			; CHECK-NEXT: orr v0.16b, v0.16b, v1.16b
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI0_3]			; CHECK-NEXT: cmhs v0.4s, v2.4s, v0.4s
	; CHECK-NEXT: cmhs v0.4s, v1.4s, v0.4s			; CHECK-NEXT: and v0.16b, v0.16b, v3.16b
	; CHECK-NEXT: movi v1.4s, #1
	; CHECK-NEXT: and v0.16b, v0.16b, v1.16b
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%urem = urem <4 x i32> %X, <i32 5, i32 14, i32 25, i32 100>			%urem = urem <4 x i32> %X, <i32 5, i32 14, i32 25, i32 100>
	%cmp = icmp eq <4 x i32> %urem, <i32 0, i32 0, i32 0, i32 0>			%cmp = icmp eq <4 x i32> %urem, <i32 0, i32 0, i32 0, i32 0>
	%ret = zext <4 x i1> %cmp to <4 x i32>			%ret = zext <4 x i1> %cmp to <4 x i32>
	ret <4 x i32> %ret			ret <4 x i32> %ret
	}			}

	;==============================================================================;			;==============================================================================;

	; One all-ones divisor in odd divisor			; One all-ones divisor in odd divisor
	define <4 x i32> @test_urem_odd_allones_eq(<4 x i32> %X) nounwind {			define <4 x i32> @test_urem_odd_allones_eq(<4 x i32> %X) nounwind {
	; CHECK-LABEL: test_urem_odd_allones_eq:			; CHECK-LABEL: test_urem_odd_allones_eq:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: adrp x8, .LCPI1_0			; CHECK-NEXT: adrp x8, .LCPI1_0
				; CHECK-NEXT: movi v2.4s, #1
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI1_0]			; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI1_0]
	; CHECK-NEXT: adrp x8, .LCPI1_1			; CHECK-NEXT: adrp x8, .LCPI1_1
	; CHECK-NEXT: mul v0.4s, v0.4s, v1.4s			; CHECK-NEXT: mul v0.4s, v0.4s, v1.4s
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI1_1]			; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI1_1]
	; CHECK-NEXT: cmhs v0.4s, v1.4s, v0.4s			; CHECK-NEXT: cmhs v0.4s, v1.4s, v0.4s
	; CHECK-NEXT: movi v1.4s, #1			; CHECK-NEXT: and v0.16b, v0.16b, v2.16b
	; CHECK-NEXT: and v0.16b, v0.16b, v1.16b
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%urem = urem <4 x i32> %X, <i32 5, i32 5, i32 4294967295, i32 5>			%urem = urem <4 x i32> %X, <i32 5, i32 5, i32 4294967295, i32 5>
	%cmp = icmp eq <4 x i32> %urem, <i32 0, i32 0, i32 0, i32 0>			%cmp = icmp eq <4 x i32> %urem, <i32 0, i32 0, i32 0, i32 0>
	%ret = zext <4 x i1> %cmp to <4 x i32>			%ret = zext <4 x i1> %cmp to <4 x i32>
	ret <4 x i32> %ret			ret <4 x i32> %ret
	}			}
	define <4 x i32> @test_urem_odd_allones_ne(<4 x i32> %X) nounwind {			define <4 x i32> @test_urem_odd_allones_ne(<4 x i32> %X) nounwind {
	; CHECK-LABEL: test_urem_odd_allones_ne:			; CHECK-LABEL: test_urem_odd_allones_ne:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: adrp x8, .LCPI2_0			; CHECK-NEXT: adrp x8, .LCPI2_0
				; CHECK-NEXT: movi v2.4s, #1
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI2_0]			; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI2_0]
	; CHECK-NEXT: adrp x8, .LCPI2_1			; CHECK-NEXT: adrp x8, .LCPI2_1
	; CHECK-NEXT: mul v0.4s, v0.4s, v1.4s			; CHECK-NEXT: mul v0.4s, v0.4s, v1.4s
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI2_1]			; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI2_1]
	; CHECK-NEXT: cmhi v0.4s, v0.4s, v1.4s			; CHECK-NEXT: cmhi v0.4s, v0.4s, v1.4s
	; CHECK-NEXT: movi v1.4s, #1			; CHECK-NEXT: and v0.16b, v0.16b, v2.16b
	; CHECK-NEXT: and v0.16b, v0.16b, v1.16b
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%urem = urem <4 x i32> %X, <i32 5, i32 5, i32 4294967295, i32 5>			%urem = urem <4 x i32> %X, <i32 5, i32 5, i32 4294967295, i32 5>
	%cmp = icmp ne <4 x i32> %urem, <i32 0, i32 0, i32 0, i32 0>			%cmp = icmp ne <4 x i32> %urem, <i32 0, i32 0, i32 0, i32 0>
	%ret = zext <4 x i1> %cmp to <4 x i32>			%ret = zext <4 x i1> %cmp to <4 x i32>
	ret <4 x i32> %ret			ret <4 x i32> %ret
	}			}

	; One all-ones divisor in even divisor			; One all-ones divisor in even divisor
	define <4 x i32> @test_urem_even_allones_eq(<4 x i32> %X) nounwind {			define <4 x i32> @test_urem_even_allones_eq(<4 x i32> %X) nounwind {
	; CHECK-LABEL: test_urem_even_allones_eq:			; CHECK-LABEL: test_urem_even_allones_eq:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: adrp x8, .LCPI3_0			; CHECK-NEXT: adrp x8, .LCPI3_0
	; CHECK-NEXT: adrp x9, .LCPI3_2			; CHECK-NEXT: adrp x9, .LCPI3_2
				; CHECK-NEXT: movi v3.4s, #1
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI3_0]			; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI3_0]
	; CHECK-NEXT: adrp x8, .LCPI3_1			; CHECK-NEXT: adrp x8, .LCPI3_1
	; CHECK-NEXT: ldr q2, [x9, :lo12:.LCPI3_2]			; CHECK-NEXT: ldr q2, [x9, :lo12:.LCPI3_2]
	; CHECK-NEXT: mul v0.4s, v0.4s, v1.4s			; CHECK-NEXT: mul v0.4s, v0.4s, v1.4s
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI3_1]			; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI3_1]
	; CHECK-NEXT: adrp x8, .LCPI3_3			; CHECK-NEXT: adrp x8, .LCPI3_3
	; CHECK-NEXT: ushl v1.4s, v0.4s, v1.4s			; CHECK-NEXT: ushl v1.4s, v0.4s, v1.4s
	; CHECK-NEXT: ushl v0.4s, v0.4s, v2.4s			; CHECK-NEXT: ushl v0.4s, v0.4s, v2.4s
				; CHECK-NEXT: ldr q2, [x8, :lo12:.LCPI3_3]
	; CHECK-NEXT: orr v0.16b, v0.16b, v1.16b			; CHECK-NEXT: orr v0.16b, v0.16b, v1.16b
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI3_3]			; CHECK-NEXT: cmhs v0.4s, v2.4s, v0.4s
	; CHECK-NEXT: cmhs v0.4s, v1.4s, v0.4s			; CHECK-NEXT: and v0.16b, v0.16b, v3.16b
	; CHECK-NEXT: movi v1.4s, #1
	; CHECK-NEXT: and v0.16b, v0.16b, v1.16b
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%urem = urem <4 x i32> %X, <i32 14, i32 14, i32 4294967295, i32 14>			%urem = urem <4 x i32> %X, <i32 14, i32 14, i32 4294967295, i32 14>
	%cmp = icmp eq <4 x i32> %urem, <i32 0, i32 0, i32 0, i32 0>			%cmp = icmp eq <4 x i32> %urem, <i32 0, i32 0, i32 0, i32 0>
	%ret = zext <4 x i1> %cmp to <4 x i32>			%ret = zext <4 x i1> %cmp to <4 x i32>
	ret <4 x i32> %ret			ret <4 x i32> %ret
	}			}
	define <4 x i32> @test_urem_even_allones_ne(<4 x i32> %X) nounwind {			define <4 x i32> @test_urem_even_allones_ne(<4 x i32> %X) nounwind {
	; CHECK-LABEL: test_urem_even_allones_ne:			; CHECK-LABEL: test_urem_even_allones_ne:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: adrp x8, .LCPI4_0			; CHECK-NEXT: adrp x8, .LCPI4_0
	; CHECK-NEXT: adrp x9, .LCPI4_2			; CHECK-NEXT: adrp x9, .LCPI4_2
				; CHECK-NEXT: movi v3.4s, #1
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI4_0]			; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI4_0]
	; CHECK-NEXT: adrp x8, .LCPI4_1			; CHECK-NEXT: adrp x8, .LCPI4_1
	; CHECK-NEXT: ldr q2, [x9, :lo12:.LCPI4_2]			; CHECK-NEXT: ldr q2, [x9, :lo12:.LCPI4_2]
	; CHECK-NEXT: mul v0.4s, v0.4s, v1.4s			; CHECK-NEXT: mul v0.4s, v0.4s, v1.4s
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI4_1]			; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI4_1]
	; CHECK-NEXT: adrp x8, .LCPI4_3			; CHECK-NEXT: adrp x8, .LCPI4_3
	; CHECK-NEXT: ushl v1.4s, v0.4s, v1.4s			; CHECK-NEXT: ushl v1.4s, v0.4s, v1.4s
	; CHECK-NEXT: ushl v0.4s, v0.4s, v2.4s			; CHECK-NEXT: ushl v0.4s, v0.4s, v2.4s
				; CHECK-NEXT: ldr q2, [x8, :lo12:.LCPI4_3]
	; CHECK-NEXT: orr v0.16b, v0.16b, v1.16b			; CHECK-NEXT: orr v0.16b, v0.16b, v1.16b
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI4_3]			; CHECK-NEXT: cmhi v0.4s, v0.4s, v2.4s
	; CHECK-NEXT: cmhi v0.4s, v0.4s, v1.4s			; CHECK-NEXT: and v0.16b, v0.16b, v3.16b
	; CHECK-NEXT: movi v1.4s, #1
	; CHECK-NEXT: and v0.16b, v0.16b, v1.16b
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%urem = urem <4 x i32> %X, <i32 14, i32 14, i32 4294967295, i32 14>			%urem = urem <4 x i32> %X, <i32 14, i32 14, i32 4294967295, i32 14>
	%cmp = icmp ne <4 x i32> %urem, <i32 0, i32 0, i32 0, i32 0>			%cmp = icmp ne <4 x i32> %urem, <i32 0, i32 0, i32 0, i32 0>
	%ret = zext <4 x i1> %cmp to <4 x i32>			%ret = zext <4 x i1> %cmp to <4 x i32>
	ret <4 x i32> %ret			ret <4 x i32> %ret
	}			}

	; One all-ones divisor in odd+even divisor			; One all-ones divisor in odd+even divisor
	define <4 x i32> @test_urem_odd_even_allones_eq(<4 x i32> %X) nounwind {			define <4 x i32> @test_urem_odd_even_allones_eq(<4 x i32> %X) nounwind {
	; CHECK-LABEL: test_urem_odd_even_allones_eq:			; CHECK-LABEL: test_urem_odd_even_allones_eq:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: adrp x8, .LCPI5_0			; CHECK-NEXT: adrp x8, .LCPI5_0
	; CHECK-NEXT: adrp x9, .LCPI5_2			; CHECK-NEXT: adrp x9, .LCPI5_2
				; CHECK-NEXT: movi v3.4s, #1
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI5_0]			; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI5_0]
	; CHECK-NEXT: adrp x8, .LCPI5_1			; CHECK-NEXT: adrp x8, .LCPI5_1
	; CHECK-NEXT: ldr q2, [x9, :lo12:.LCPI5_2]			; CHECK-NEXT: ldr q2, [x9, :lo12:.LCPI5_2]
	; CHECK-NEXT: mul v0.4s, v0.4s, v1.4s			; CHECK-NEXT: mul v0.4s, v0.4s, v1.4s
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI5_1]			; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI5_1]
	; CHECK-NEXT: adrp x8, .LCPI5_3			; CHECK-NEXT: adrp x8, .LCPI5_3
	; CHECK-NEXT: ushl v1.4s, v0.4s, v1.4s			; CHECK-NEXT: ushl v1.4s, v0.4s, v1.4s
	; CHECK-NEXT: ushl v0.4s, v0.4s, v2.4s			; CHECK-NEXT: ushl v0.4s, v0.4s, v2.4s
				; CHECK-NEXT: ldr q2, [x8, :lo12:.LCPI5_3]
	; CHECK-NEXT: orr v0.16b, v0.16b, v1.16b			; CHECK-NEXT: orr v0.16b, v0.16b, v1.16b
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI5_3]			; CHECK-NEXT: cmhs v0.4s, v2.4s, v0.4s
	; CHECK-NEXT: cmhs v0.4s, v1.4s, v0.4s			; CHECK-NEXT: and v0.16b, v0.16b, v3.16b
	; CHECK-NEXT: movi v1.4s, #1
	; CHECK-NEXT: and v0.16b, v0.16b, v1.16b
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%urem = urem <4 x i32> %X, <i32 5, i32 14, i32 4294967295, i32 100>			%urem = urem <4 x i32> %X, <i32 5, i32 14, i32 4294967295, i32 100>
	%cmp = icmp eq <4 x i32> %urem, <i32 0, i32 0, i32 0, i32 0>			%cmp = icmp eq <4 x i32> %urem, <i32 0, i32 0, i32 0, i32 0>
	%ret = zext <4 x i1> %cmp to <4 x i32>			%ret = zext <4 x i1> %cmp to <4 x i32>
	ret <4 x i32> %ret			ret <4 x i32> %ret
	}			}
	define <4 x i32> @test_urem_odd_even_allones_ne(<4 x i32> %X) nounwind {			define <4 x i32> @test_urem_odd_even_allones_ne(<4 x i32> %X) nounwind {
	; CHECK-LABEL: test_urem_odd_even_allones_ne:			; CHECK-LABEL: test_urem_odd_even_allones_ne:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: adrp x8, .LCPI6_0			; CHECK-NEXT: adrp x8, .LCPI6_0
	; CHECK-NEXT: adrp x9, .LCPI6_2			; CHECK-NEXT: adrp x9, .LCPI6_2
				; CHECK-NEXT: movi v3.4s, #1
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI6_0]			; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI6_0]
	; CHECK-NEXT: adrp x8, .LCPI6_1			; CHECK-NEXT: adrp x8, .LCPI6_1
	; CHECK-NEXT: ldr q2, [x9, :lo12:.LCPI6_2]			; CHECK-NEXT: ldr q2, [x9, :lo12:.LCPI6_2]
	; CHECK-NEXT: mul v0.4s, v0.4s, v1.4s			; CHECK-NEXT: mul v0.4s, v0.4s, v1.4s
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI6_1]			; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI6_1]
	; CHECK-NEXT: adrp x8, .LCPI6_3			; CHECK-NEXT: adrp x8, .LCPI6_3
	; CHECK-NEXT: ushl v1.4s, v0.4s, v1.4s			; CHECK-NEXT: ushl v1.4s, v0.4s, v1.4s
	; CHECK-NEXT: ushl v0.4s, v0.4s, v2.4s			; CHECK-NEXT: ushl v0.4s, v0.4s, v2.4s
				; CHECK-NEXT: ldr q2, [x8, :lo12:.LCPI6_3]
	; CHECK-NEXT: orr v0.16b, v0.16b, v1.16b			; CHECK-NEXT: orr v0.16b, v0.16b, v1.16b
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI6_3]			; CHECK-NEXT: cmhi v0.4s, v0.4s, v2.4s
	; CHECK-NEXT: cmhi v0.4s, v0.4s, v1.4s			; CHECK-NEXT: and v0.16b, v0.16b, v3.16b
	; CHECK-NEXT: movi v1.4s, #1
	; CHECK-NEXT: and v0.16b, v0.16b, v1.16b
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%urem = urem <4 x i32> %X, <i32 5, i32 14, i32 4294967295, i32 100>			%urem = urem <4 x i32> %X, <i32 5, i32 14, i32 4294967295, i32 100>
	%cmp = icmp ne <4 x i32> %urem, <i32 0, i32 0, i32 0, i32 0>			%cmp = icmp ne <4 x i32> %urem, <i32 0, i32 0, i32 0, i32 0>
	%ret = zext <4 x i1> %cmp to <4 x i32>			%ret = zext <4 x i1> %cmp to <4 x i32>
	ret <4 x i32> %ret			ret <4 x i32> %ret
	}			}

	;------------------------------------------------------------------------------;			;------------------------------------------------------------------------------;

	; One power-of-two divisor in odd divisor			; One power-of-two divisor in odd divisor
	define <4 x i32> @test_urem_odd_poweroftwo(<4 x i32> %X) nounwind {			define <4 x i32> @test_urem_odd_poweroftwo(<4 x i32> %X) nounwind {
	; CHECK-LABEL: test_urem_odd_poweroftwo:			; CHECK-LABEL: test_urem_odd_poweroftwo:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: adrp x8, .LCPI7_0			; CHECK-NEXT: adrp x8, .LCPI7_0
	; CHECK-NEXT: adrp x9, .LCPI7_2			; CHECK-NEXT: adrp x9, .LCPI7_2
				; CHECK-NEXT: movi v3.4s, #1
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI7_0]			; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI7_0]
	; CHECK-NEXT: adrp x8, .LCPI7_1			; CHECK-NEXT: adrp x8, .LCPI7_1
	; CHECK-NEXT: ldr q2, [x9, :lo12:.LCPI7_2]			; CHECK-NEXT: ldr q2, [x9, :lo12:.LCPI7_2]
	; CHECK-NEXT: mul v0.4s, v0.4s, v1.4s			; CHECK-NEXT: mul v0.4s, v0.4s, v1.4s
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI7_1]			; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI7_1]
	; CHECK-NEXT: adrp x8, .LCPI7_3			; CHECK-NEXT: adrp x8, .LCPI7_3
	; CHECK-NEXT: ushl v1.4s, v0.4s, v1.4s			; CHECK-NEXT: ushl v1.4s, v0.4s, v1.4s
	; CHECK-NEXT: ushl v0.4s, v0.4s, v2.4s			; CHECK-NEXT: ushl v0.4s, v0.4s, v2.4s
				; CHECK-NEXT: ldr q2, [x8, :lo12:.LCPI7_3]
	; CHECK-NEXT: orr v0.16b, v0.16b, v1.16b			; CHECK-NEXT: orr v0.16b, v0.16b, v1.16b
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI7_3]			; CHECK-NEXT: cmhs v0.4s, v2.4s, v0.4s
	; CHECK-NEXT: cmhs v0.4s, v1.4s, v0.4s			; CHECK-NEXT: and v0.16b, v0.16b, v3.16b
	; CHECK-NEXT: movi v1.4s, #1
	; CHECK-NEXT: and v0.16b, v0.16b, v1.16b
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%urem = urem <4 x i32> %X, <i32 5, i32 5, i32 16, i32 5>			%urem = urem <4 x i32> %X, <i32 5, i32 5, i32 16, i32 5>
	%cmp = icmp eq <4 x i32> %urem, <i32 0, i32 0, i32 0, i32 0>			%cmp = icmp eq <4 x i32> %urem, <i32 0, i32 0, i32 0, i32 0>
	%ret = zext <4 x i1> %cmp to <4 x i32>			%ret = zext <4 x i1> %cmp to <4 x i32>
	ret <4 x i32> %ret			ret <4 x i32> %ret
	}			}

	; One power-of-two divisor in even divisor			; One power-of-two divisor in even divisor
	define <4 x i32> @test_urem_even_poweroftwo(<4 x i32> %X) nounwind {			define <4 x i32> @test_urem_even_poweroftwo(<4 x i32> %X) nounwind {
	; CHECK-LABEL: test_urem_even_poweroftwo:			; CHECK-LABEL: test_urem_even_poweroftwo:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: adrp x8, .LCPI8_0			; CHECK-NEXT: adrp x8, .LCPI8_0
	; CHECK-NEXT: adrp x9, .LCPI8_2			; CHECK-NEXT: adrp x9, .LCPI8_2
				; CHECK-NEXT: movi v3.4s, #1
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI8_0]			; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI8_0]
	; CHECK-NEXT: adrp x8, .LCPI8_1			; CHECK-NEXT: adrp x8, .LCPI8_1
	; CHECK-NEXT: ldr q2, [x9, :lo12:.LCPI8_2]			; CHECK-NEXT: ldr q2, [x9, :lo12:.LCPI8_2]
	; CHECK-NEXT: mul v0.4s, v0.4s, v1.4s			; CHECK-NEXT: mul v0.4s, v0.4s, v1.4s
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI8_1]			; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI8_1]
	; CHECK-NEXT: adrp x8, .LCPI8_3			; CHECK-NEXT: adrp x8, .LCPI8_3
	; CHECK-NEXT: ushl v1.4s, v0.4s, v1.4s			; CHECK-NEXT: ushl v1.4s, v0.4s, v1.4s
	; CHECK-NEXT: ushl v0.4s, v0.4s, v2.4s			; CHECK-NEXT: ushl v0.4s, v0.4s, v2.4s
				; CHECK-NEXT: ldr q2, [x8, :lo12:.LCPI8_3]
	; CHECK-NEXT: orr v0.16b, v0.16b, v1.16b			; CHECK-NEXT: orr v0.16b, v0.16b, v1.16b
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI8_3]			; CHECK-NEXT: cmhs v0.4s, v2.4s, v0.4s
	; CHECK-NEXT: cmhs v0.4s, v1.4s, v0.4s			; CHECK-NEXT: and v0.16b, v0.16b, v3.16b
	; CHECK-NEXT: movi v1.4s, #1
	; CHECK-NEXT: and v0.16b, v0.16b, v1.16b
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%urem = urem <4 x i32> %X, <i32 14, i32 14, i32 16, i32 14>			%urem = urem <4 x i32> %X, <i32 14, i32 14, i32 16, i32 14>
	%cmp = icmp eq <4 x i32> %urem, <i32 0, i32 0, i32 0, i32 0>			%cmp = icmp eq <4 x i32> %urem, <i32 0, i32 0, i32 0, i32 0>
	%ret = zext <4 x i1> %cmp to <4 x i32>			%ret = zext <4 x i1> %cmp to <4 x i32>
	ret <4 x i32> %ret			ret <4 x i32> %ret
	}			}

	; One power-of-two divisor in odd+even divisor			; One power-of-two divisor in odd+even divisor
	define <4 x i32> @test_urem_odd_even_poweroftwo(<4 x i32> %X) nounwind {			define <4 x i32> @test_urem_odd_even_poweroftwo(<4 x i32> %X) nounwind {
	; CHECK-LABEL: test_urem_odd_even_poweroftwo:			; CHECK-LABEL: test_urem_odd_even_poweroftwo:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: adrp x8, .LCPI9_0			; CHECK-NEXT: adrp x8, .LCPI9_0
	; CHECK-NEXT: adrp x9, .LCPI9_2			; CHECK-NEXT: adrp x9, .LCPI9_2
				; CHECK-NEXT: movi v3.4s, #1
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI9_0]			; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI9_0]
	; CHECK-NEXT: adrp x8, .LCPI9_1			; CHECK-NEXT: adrp x8, .LCPI9_1
	; CHECK-NEXT: ldr q2, [x9, :lo12:.LCPI9_2]			; CHECK-NEXT: ldr q2, [x9, :lo12:.LCPI9_2]
	; CHECK-NEXT: mul v0.4s, v0.4s, v1.4s			; CHECK-NEXT: mul v0.4s, v0.4s, v1.4s
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI9_1]			; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI9_1]
	; CHECK-NEXT: adrp x8, .LCPI9_3			; CHECK-NEXT: adrp x8, .LCPI9_3
	; CHECK-NEXT: ushl v1.4s, v0.4s, v1.4s			; CHECK-NEXT: ushl v1.4s, v0.4s, v1.4s
	; CHECK-NEXT: ushl v0.4s, v0.4s, v2.4s			; CHECK-NEXT: ushl v0.4s, v0.4s, v2.4s
				; CHECK-NEXT: ldr q2, [x8, :lo12:.LCPI9_3]
	; CHECK-NEXT: orr v0.16b, v0.16b, v1.16b			; CHECK-NEXT: orr v0.16b, v0.16b, v1.16b
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI9_3]			; CHECK-NEXT: cmhs v0.4s, v2.4s, v0.4s
	; CHECK-NEXT: cmhs v0.4s, v1.4s, v0.4s			; CHECK-NEXT: and v0.16b, v0.16b, v3.16b
	; CHECK-NEXT: movi v1.4s, #1
	; CHECK-NEXT: and v0.16b, v0.16b, v1.16b
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%urem = urem <4 x i32> %X, <i32 5, i32 14, i32 16, i32 100>			%urem = urem <4 x i32> %X, <i32 5, i32 14, i32 16, i32 100>
	%cmp = icmp eq <4 x i32> %urem, <i32 0, i32 0, i32 0, i32 0>			%cmp = icmp eq <4 x i32> %urem, <i32 0, i32 0, i32 0, i32 0>
	%ret = zext <4 x i1> %cmp to <4 x i32>			%ret = zext <4 x i1> %cmp to <4 x i32>
	ret <4 x i32> %ret			ret <4 x i32> %ret
	}			}

	;------------------------------------------------------------------------------;			;------------------------------------------------------------------------------;

	; One one divisor in odd divisor			; One one divisor in odd divisor
	define <4 x i32> @test_urem_odd_one(<4 x i32> %X) nounwind {			define <4 x i32> @test_urem_odd_one(<4 x i32> %X) nounwind {
	; CHECK-LABEL: test_urem_odd_one:			; CHECK-LABEL: test_urem_odd_one:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: mov w8, #52429			; CHECK-NEXT: mov w8, #52429
	; CHECK-NEXT: adrp x9, .LCPI10_0
	; CHECK-NEXT: movk w8, #52428, lsl #16			; CHECK-NEXT: movk w8, #52428, lsl #16
				; CHECK-NEXT: movi v2.4s, #1
	; CHECK-NEXT: dup v1.4s, w8			; CHECK-NEXT: dup v1.4s, w8
				; CHECK-NEXT: adrp x8, .LCPI10_0
	; CHECK-NEXT: mul v0.4s, v0.4s, v1.4s			; CHECK-NEXT: mul v0.4s, v0.4s, v1.4s
	; CHECK-NEXT: ldr q1, [x9, :lo12:.LCPI10_0]			; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI10_0]
	; CHECK-NEXT: cmhs v0.4s, v1.4s, v0.4s			; CHECK-NEXT: cmhs v0.4s, v1.4s, v0.4s
	; CHECK-NEXT: movi v1.4s, #1			; CHECK-NEXT: and v0.16b, v0.16b, v2.16b
	; CHECK-NEXT: and v0.16b, v0.16b, v1.16b
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%urem = urem <4 x i32> %X, <i32 5, i32 5, i32 1, i32 5>			%urem = urem <4 x i32> %X, <i32 5, i32 5, i32 1, i32 5>
	%cmp = icmp eq <4 x i32> %urem, <i32 0, i32 0, i32 0, i32 0>			%cmp = icmp eq <4 x i32> %urem, <i32 0, i32 0, i32 0, i32 0>
	%ret = zext <4 x i1> %cmp to <4 x i32>			%ret = zext <4 x i1> %cmp to <4 x i32>
	ret <4 x i32> %ret			ret <4 x i32> %ret
	}			}

	; One one divisor in even divisor			; One one divisor in even divisor
	define <4 x i32> @test_urem_even_one(<4 x i32> %X) nounwind {			define <4 x i32> @test_urem_even_one(<4 x i32> %X) nounwind {
	; CHECK-LABEL: test_urem_even_one:			; CHECK-LABEL: test_urem_even_one:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: mov w8, #28087			; CHECK-NEXT: mov w8, #28087
	; CHECK-NEXT: movk w8, #46811, lsl #16			; CHECK-NEXT: movk w8, #46811, lsl #16
				; CHECK-NEXT: movi v3.4s, #1
	; CHECK-NEXT: dup v1.4s, w8			; CHECK-NEXT: dup v1.4s, w8
	; CHECK-NEXT: adrp x8, .LCPI11_0			; CHECK-NEXT: adrp x8, .LCPI11_0
	; CHECK-NEXT: mul v0.4s, v0.4s, v1.4s			; CHECK-NEXT: mul v0.4s, v0.4s, v1.4s
				; CHECK-NEXT: ldr q2, [x8, :lo12:.LCPI11_0]
	; CHECK-NEXT: shl v1.4s, v0.4s, #31			; CHECK-NEXT: shl v1.4s, v0.4s, #31
	; CHECK-NEXT: ushr v0.4s, v0.4s, #1			; CHECK-NEXT: ushr v0.4s, v0.4s, #1
	; CHECK-NEXT: orr v0.16b, v0.16b, v1.16b			; CHECK-NEXT: orr v0.16b, v0.16b, v1.16b
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI11_0]			; CHECK-NEXT: cmhs v0.4s, v2.4s, v0.4s
	; CHECK-NEXT: cmhs v0.4s, v1.4s, v0.4s			; CHECK-NEXT: and v0.16b, v0.16b, v3.16b
	; CHECK-NEXT: movi v1.4s, #1
	; CHECK-NEXT: and v0.16b, v0.16b, v1.16b
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%urem = urem <4 x i32> %X, <i32 14, i32 14, i32 1, i32 14>			%urem = urem <4 x i32> %X, <i32 14, i32 14, i32 1, i32 14>
	%cmp = icmp eq <4 x i32> %urem, <i32 0, i32 0, i32 0, i32 0>			%cmp = icmp eq <4 x i32> %urem, <i32 0, i32 0, i32 0, i32 0>
	%ret = zext <4 x i1> %cmp to <4 x i32>			%ret = zext <4 x i1> %cmp to <4 x i32>
	ret <4 x i32> %ret			ret <4 x i32> %ret
	}			}

	; One one divisor in odd+even divisor			; One one divisor in odd+even divisor
	define <4 x i32> @test_urem_odd_even_one(<4 x i32> %X) nounwind {			define <4 x i32> @test_urem_odd_even_one(<4 x i32> %X) nounwind {
	; CHECK-LABEL: test_urem_odd_even_one:			; CHECK-LABEL: test_urem_odd_even_one:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: adrp x8, .LCPI12_0			; CHECK-NEXT: adrp x8, .LCPI12_0
	; CHECK-NEXT: adrp x9, .LCPI12_2			; CHECK-NEXT: adrp x9, .LCPI12_2
				; CHECK-NEXT: movi v3.4s, #1
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI12_0]			; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI12_0]
	; CHECK-NEXT: adrp x8, .LCPI12_1			; CHECK-NEXT: adrp x8, .LCPI12_1
	; CHECK-NEXT: ldr q2, [x9, :lo12:.LCPI12_2]			; CHECK-NEXT: ldr q2, [x9, :lo12:.LCPI12_2]
	; CHECK-NEXT: mul v0.4s, v0.4s, v1.4s			; CHECK-NEXT: mul v0.4s, v0.4s, v1.4s
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI12_1]			; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI12_1]
	; CHECK-NEXT: adrp x8, .LCPI12_3			; CHECK-NEXT: adrp x8, .LCPI12_3
	; CHECK-NEXT: ushl v1.4s, v0.4s, v1.4s			; CHECK-NEXT: ushl v1.4s, v0.4s, v1.4s
	; CHECK-NEXT: ushl v0.4s, v0.4s, v2.4s			; CHECK-NEXT: ushl v0.4s, v0.4s, v2.4s
				; CHECK-NEXT: ldr q2, [x8, :lo12:.LCPI12_3]
	; CHECK-NEXT: orr v0.16b, v0.16b, v1.16b			; CHECK-NEXT: orr v0.16b, v0.16b, v1.16b
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI12_3]			; CHECK-NEXT: cmhs v0.4s, v2.4s, v0.4s
	; CHECK-NEXT: cmhs v0.4s, v1.4s, v0.4s			; CHECK-NEXT: and v0.16b, v0.16b, v3.16b
	; CHECK-NEXT: movi v1.4s, #1
	; CHECK-NEXT: and v0.16b, v0.16b, v1.16b
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%urem = urem <4 x i32> %X, <i32 5, i32 14, i32 1, i32 100>			%urem = urem <4 x i32> %X, <i32 5, i32 14, i32 1, i32 100>
	%cmp = icmp eq <4 x i32> %urem, <i32 0, i32 0, i32 0, i32 0>			%cmp = icmp eq <4 x i32> %urem, <i32 0, i32 0, i32 0, i32 0>
	%ret = zext <4 x i1> %cmp to <4 x i32>			%ret = zext <4 x i1> %cmp to <4 x i32>
	ret <4 x i32> %ret			ret <4 x i32> %ret
	}			}

	;------------------------------------------------------------------------------;			;------------------------------------------------------------------------------;

	; One INT_MIN divisor in odd divisor			; One INT_MIN divisor in odd divisor
	define <4 x i32> @test_urem_odd_INT_MIN(<4 x i32> %X) nounwind {			define <4 x i32> @test_urem_odd_INT_MIN(<4 x i32> %X) nounwind {
	; CHECK-LABEL: test_urem_odd_INT_MIN:			; CHECK-LABEL: test_urem_odd_INT_MIN:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: adrp x8, .LCPI13_0			; CHECK-NEXT: adrp x8, .LCPI13_0
	; CHECK-NEXT: adrp x9, .LCPI13_2			; CHECK-NEXT: adrp x9, .LCPI13_2
				; CHECK-NEXT: movi v3.4s, #1
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI13_0]			; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI13_0]
	; CHECK-NEXT: adrp x8, .LCPI13_1			; CHECK-NEXT: adrp x8, .LCPI13_1
	; CHECK-NEXT: ldr q2, [x9, :lo12:.LCPI13_2]			; CHECK-NEXT: ldr q2, [x9, :lo12:.LCPI13_2]
	; CHECK-NEXT: mul v0.4s, v0.4s, v1.4s			; CHECK-NEXT: mul v0.4s, v0.4s, v1.4s
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI13_1]			; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI13_1]
	; CHECK-NEXT: adrp x8, .LCPI13_3			; CHECK-NEXT: adrp x8, .LCPI13_3
	; CHECK-NEXT: ushl v1.4s, v0.4s, v1.4s			; CHECK-NEXT: ushl v1.4s, v0.4s, v1.4s
	; CHECK-NEXT: ushl v0.4s, v0.4s, v2.4s			; CHECK-NEXT: ushl v0.4s, v0.4s, v2.4s
				; CHECK-NEXT: ldr q2, [x8, :lo12:.LCPI13_3]
	; CHECK-NEXT: orr v0.16b, v0.16b, v1.16b			; CHECK-NEXT: orr v0.16b, v0.16b, v1.16b
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI13_3]			; CHECK-NEXT: cmhs v0.4s, v2.4s, v0.4s
	; CHECK-NEXT: cmhs v0.4s, v1.4s, v0.4s			; CHECK-NEXT: and v0.16b, v0.16b, v3.16b
	; CHECK-NEXT: movi v1.4s, #1
	; CHECK-NEXT: and v0.16b, v0.16b, v1.16b
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%urem = urem <4 x i32> %X, <i32 5, i32 5, i32 2147483648, i32 5>			%urem = urem <4 x i32> %X, <i32 5, i32 5, i32 2147483648, i32 5>
	%cmp = icmp eq <4 x i32> %urem, <i32 0, i32 0, i32 0, i32 0>			%cmp = icmp eq <4 x i32> %urem, <i32 0, i32 0, i32 0, i32 0>
	%ret = zext <4 x i1> %cmp to <4 x i32>			%ret = zext <4 x i1> %cmp to <4 x i32>
	ret <4 x i32> %ret			ret <4 x i32> %ret
	}			}

	; One INT_MIN divisor in even divisor			; One INT_MIN divisor in even divisor
	define <4 x i32> @test_urem_even_INT_MIN(<4 x i32> %X) nounwind {			define <4 x i32> @test_urem_even_INT_MIN(<4 x i32> %X) nounwind {
	; CHECK-LABEL: test_urem_even_INT_MIN:			; CHECK-LABEL: test_urem_even_INT_MIN:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: adrp x8, .LCPI14_0			; CHECK-NEXT: adrp x8, .LCPI14_0
	; CHECK-NEXT: adrp x9, .LCPI14_2			; CHECK-NEXT: adrp x9, .LCPI14_2
				; CHECK-NEXT: movi v3.4s, #1
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI14_0]			; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI14_0]
	; CHECK-NEXT: adrp x8, .LCPI14_1			; CHECK-NEXT: adrp x8, .LCPI14_1
	; CHECK-NEXT: ldr q2, [x9, :lo12:.LCPI14_2]			; CHECK-NEXT: ldr q2, [x9, :lo12:.LCPI14_2]
	; CHECK-NEXT: mul v0.4s, v0.4s, v1.4s			; CHECK-NEXT: mul v0.4s, v0.4s, v1.4s
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI14_1]			; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI14_1]
	; CHECK-NEXT: adrp x8, .LCPI14_3			; CHECK-NEXT: adrp x8, .LCPI14_3
	; CHECK-NEXT: ushl v1.4s, v0.4s, v1.4s			; CHECK-NEXT: ushl v1.4s, v0.4s, v1.4s
	; CHECK-NEXT: ushl v0.4s, v0.4s, v2.4s			; CHECK-NEXT: ushl v0.4s, v0.4s, v2.4s
				; CHECK-NEXT: ldr q2, [x8, :lo12:.LCPI14_3]
	; CHECK-NEXT: orr v0.16b, v0.16b, v1.16b			; CHECK-NEXT: orr v0.16b, v0.16b, v1.16b
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI14_3]			; CHECK-NEXT: cmhs v0.4s, v2.4s, v0.4s
	; CHECK-NEXT: cmhs v0.4s, v1.4s, v0.4s			; CHECK-NEXT: and v0.16b, v0.16b, v3.16b
	; CHECK-NEXT: movi v1.4s, #1
	; CHECK-NEXT: and v0.16b, v0.16b, v1.16b
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%urem = urem <4 x i32> %X, <i32 14, i32 14, i32 2147483648, i32 14>			%urem = urem <4 x i32> %X, <i32 14, i32 14, i32 2147483648, i32 14>
	%cmp = icmp eq <4 x i32> %urem, <i32 0, i32 0, i32 0, i32 0>			%cmp = icmp eq <4 x i32> %urem, <i32 0, i32 0, i32 0, i32 0>
	%ret = zext <4 x i1> %cmp to <4 x i32>			%ret = zext <4 x i1> %cmp to <4 x i32>
	ret <4 x i32> %ret			ret <4 x i32> %ret
	}			}

	; One INT_MIN divisor in odd+even divisor			; One INT_MIN divisor in odd+even divisor
	define <4 x i32> @test_urem_odd_even_INT_MIN(<4 x i32> %X) nounwind {			define <4 x i32> @test_urem_odd_even_INT_MIN(<4 x i32> %X) nounwind {
	; CHECK-LABEL: test_urem_odd_even_INT_MIN:			; CHECK-LABEL: test_urem_odd_even_INT_MIN:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: adrp x8, .LCPI15_0			; CHECK-NEXT: adrp x8, .LCPI15_0
	; CHECK-NEXT: adrp x9, .LCPI15_2			; CHECK-NEXT: adrp x9, .LCPI15_2
				; CHECK-NEXT: movi v3.4s, #1
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI15_0]			; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI15_0]
	; CHECK-NEXT: adrp x8, .LCPI15_1			; CHECK-NEXT: adrp x8, .LCPI15_1
	; CHECK-NEXT: ldr q2, [x9, :lo12:.LCPI15_2]			; CHECK-NEXT: ldr q2, [x9, :lo12:.LCPI15_2]
	; CHECK-NEXT: mul v0.4s, v0.4s, v1.4s			; CHECK-NEXT: mul v0.4s, v0.4s, v1.4s
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI15_1]			; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI15_1]
	; CHECK-NEXT: adrp x8, .LCPI15_3			; CHECK-NEXT: adrp x8, .LCPI15_3
	; CHECK-NEXT: ushl v1.4s, v0.4s, v1.4s			; CHECK-NEXT: ushl v1.4s, v0.4s, v1.4s
	; CHECK-NEXT: ushl v0.4s, v0.4s, v2.4s			; CHECK-NEXT: ushl v0.4s, v0.4s, v2.4s
				; CHECK-NEXT: ldr q2, [x8, :lo12:.LCPI15_3]
	; CHECK-NEXT: orr v0.16b, v0.16b, v1.16b			; CHECK-NEXT: orr v0.16b, v0.16b, v1.16b
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI15_3]			; CHECK-NEXT: cmhs v0.4s, v2.4s, v0.4s
	; CHECK-NEXT: cmhs v0.4s, v1.4s, v0.4s			; CHECK-NEXT: and v0.16b, v0.16b, v3.16b
	; CHECK-NEXT: movi v1.4s, #1
	; CHECK-NEXT: and v0.16b, v0.16b, v1.16b
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%urem = urem <4 x i32> %X, <i32 5, i32 14, i32 2147483648, i32 100>			%urem = urem <4 x i32> %X, <i32 5, i32 14, i32 2147483648, i32 100>
	%cmp = icmp eq <4 x i32> %urem, <i32 0, i32 0, i32 0, i32 0>			%cmp = icmp eq <4 x i32> %urem, <i32 0, i32 0, i32 0, i32 0>
	%ret = zext <4 x i1> %cmp to <4 x i32>			%ret = zext <4 x i1> %cmp to <4 x i32>
	ret <4 x i32> %ret			ret <4 x i32> %ret
	}			}

	;==============================================================================;			;==============================================================================;

	; One all-ones divisor and power-of-two divisor divisor in odd divisor			; One all-ones divisor and power-of-two divisor divisor in odd divisor
	define <4 x i32> @test_urem_odd_allones_and_poweroftwo(<4 x i32> %X) nounwind {			define <4 x i32> @test_urem_odd_allones_and_poweroftwo(<4 x i32> %X) nounwind {
	; CHECK-LABEL: test_urem_odd_allones_and_poweroftwo:			; CHECK-LABEL: test_urem_odd_allones_and_poweroftwo:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: adrp x8, .LCPI16_0			; CHECK-NEXT: adrp x8, .LCPI16_0
	; CHECK-NEXT: adrp x9, .LCPI16_2			; CHECK-NEXT: adrp x9, .LCPI16_2
				; CHECK-NEXT: movi v3.4s, #1
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI16_0]			; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI16_0]
	; CHECK-NEXT: adrp x8, .LCPI16_1			; CHECK-NEXT: adrp x8, .LCPI16_1
	; CHECK-NEXT: ldr q2, [x9, :lo12:.LCPI16_2]			; CHECK-NEXT: ldr q2, [x9, :lo12:.LCPI16_2]
	; CHECK-NEXT: mul v0.4s, v0.4s, v1.4s			; CHECK-NEXT: mul v0.4s, v0.4s, v1.4s
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI16_1]			; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI16_1]
	; CHECK-NEXT: adrp x8, .LCPI16_3			; CHECK-NEXT: adrp x8, .LCPI16_3
	; CHECK-NEXT: ushl v1.4s, v0.4s, v1.4s			; CHECK-NEXT: ushl v1.4s, v0.4s, v1.4s
	; CHECK-NEXT: ushl v0.4s, v0.4s, v2.4s			; CHECK-NEXT: ushl v0.4s, v0.4s, v2.4s
				; CHECK-NEXT: ldr q2, [x8, :lo12:.LCPI16_3]
	; CHECK-NEXT: orr v0.16b, v0.16b, v1.16b			; CHECK-NEXT: orr v0.16b, v0.16b, v1.16b
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI16_3]			; CHECK-NEXT: cmhs v0.4s, v2.4s, v0.4s
	; CHECK-NEXT: cmhs v0.4s, v1.4s, v0.4s			; CHECK-NEXT: and v0.16b, v0.16b, v3.16b
	; CHECK-NEXT: movi v1.4s, #1
	; CHECK-NEXT: and v0.16b, v0.16b, v1.16b
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%urem = urem <4 x i32> %X, <i32 5, i32 4294967295, i32 16, i32 5>			%urem = urem <4 x i32> %X, <i32 5, i32 4294967295, i32 16, i32 5>
	%cmp = icmp eq <4 x i32> %urem, <i32 0, i32 0, i32 0, i32 0>			%cmp = icmp eq <4 x i32> %urem, <i32 0, i32 0, i32 0, i32 0>
	%ret = zext <4 x i1> %cmp to <4 x i32>			%ret = zext <4 x i1> %cmp to <4 x i32>
	ret <4 x i32> %ret			ret <4 x i32> %ret
	}			}

	; One all-ones divisor and power-of-two divisor divisor in even divisor			; One all-ones divisor and power-of-two divisor divisor in even divisor
	define <4 x i32> @test_urem_even_allones_and_poweroftwo(<4 x i32> %X) nounwind {			define <4 x i32> @test_urem_even_allones_and_poweroftwo(<4 x i32> %X) nounwind {
	; CHECK-LABEL: test_urem_even_allones_and_poweroftwo:			; CHECK-LABEL: test_urem_even_allones_and_poweroftwo:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: adrp x8, .LCPI17_0			; CHECK-NEXT: adrp x8, .LCPI17_0
	; CHECK-NEXT: adrp x9, .LCPI17_2			; CHECK-NEXT: adrp x9, .LCPI17_2
				; CHECK-NEXT: movi v3.4s, #1
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI17_0]			; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI17_0]
	; CHECK-NEXT: adrp x8, .LCPI17_1			; CHECK-NEXT: adrp x8, .LCPI17_1
	; CHECK-NEXT: ldr q2, [x9, :lo12:.LCPI17_2]			; CHECK-NEXT: ldr q2, [x9, :lo12:.LCPI17_2]
	; CHECK-NEXT: mul v0.4s, v0.4s, v1.4s			; CHECK-NEXT: mul v0.4s, v0.4s, v1.4s
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI17_1]			; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI17_1]
	; CHECK-NEXT: adrp x8, .LCPI17_3			; CHECK-NEXT: adrp x8, .LCPI17_3
	; CHECK-NEXT: ushl v1.4s, v0.4s, v1.4s			; CHECK-NEXT: ushl v1.4s, v0.4s, v1.4s
	; CHECK-NEXT: ushl v0.4s, v0.4s, v2.4s			; CHECK-NEXT: ushl v0.4s, v0.4s, v2.4s
				; CHECK-NEXT: ldr q2, [x8, :lo12:.LCPI17_3]
	; CHECK-NEXT: orr v0.16b, v0.16b, v1.16b			; CHECK-NEXT: orr v0.16b, v0.16b, v1.16b
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI17_3]			; CHECK-NEXT: cmhs v0.4s, v2.4s, v0.4s
	; CHECK-NEXT: cmhs v0.4s, v1.4s, v0.4s			; CHECK-NEXT: and v0.16b, v0.16b, v3.16b
	; CHECK-NEXT: movi v1.4s, #1
	; CHECK-NEXT: and v0.16b, v0.16b, v1.16b
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%urem = urem <4 x i32> %X, <i32 14, i32 4294967295, i32 16, i32 14>			%urem = urem <4 x i32> %X, <i32 14, i32 4294967295, i32 16, i32 14>
	%cmp = icmp eq <4 x i32> %urem, <i32 0, i32 0, i32 0, i32 0>			%cmp = icmp eq <4 x i32> %urem, <i32 0, i32 0, i32 0, i32 0>
	%ret = zext <4 x i1> %cmp to <4 x i32>			%ret = zext <4 x i1> %cmp to <4 x i32>
	ret <4 x i32> %ret			ret <4 x i32> %ret
	}			}

	; One all-ones divisor and power-of-two divisor divisor in odd+even divisor			; One all-ones divisor and power-of-two divisor divisor in odd+even divisor
	define <4 x i32> @test_urem_odd_even_allones_and_poweroftwo(<4 x i32> %X) nounwind {			define <4 x i32> @test_urem_odd_even_allones_and_poweroftwo(<4 x i32> %X) nounwind {
	; CHECK-LABEL: test_urem_odd_even_allones_and_poweroftwo:			; CHECK-LABEL: test_urem_odd_even_allones_and_poweroftwo:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: adrp x8, .LCPI18_0			; CHECK-NEXT: adrp x8, .LCPI18_0
	; CHECK-NEXT: adrp x9, .LCPI18_2			; CHECK-NEXT: adrp x9, .LCPI18_2
				; CHECK-NEXT: movi v3.4s, #1
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI18_0]			; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI18_0]
	; CHECK-NEXT: adrp x8, .LCPI18_1			; CHECK-NEXT: adrp x8, .LCPI18_1
	; CHECK-NEXT: ldr q2, [x9, :lo12:.LCPI18_2]			; CHECK-NEXT: ldr q2, [x9, :lo12:.LCPI18_2]
	; CHECK-NEXT: mul v0.4s, v0.4s, v1.4s			; CHECK-NEXT: mul v0.4s, v0.4s, v1.4s
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI18_1]			; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI18_1]
	; CHECK-NEXT: adrp x8, .LCPI18_3			; CHECK-NEXT: adrp x8, .LCPI18_3
	; CHECK-NEXT: ushl v1.4s, v0.4s, v1.4s			; CHECK-NEXT: ushl v1.4s, v0.4s, v1.4s
	; CHECK-NEXT: ushl v0.4s, v0.4s, v2.4s			; CHECK-NEXT: ushl v0.4s, v0.4s, v2.4s
				; CHECK-NEXT: ldr q2, [x8, :lo12:.LCPI18_3]
	; CHECK-NEXT: orr v0.16b, v0.16b, v1.16b			; CHECK-NEXT: orr v0.16b, v0.16b, v1.16b
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI18_3]			; CHECK-NEXT: cmhs v0.4s, v2.4s, v0.4s
	; CHECK-NEXT: cmhs v0.4s, v1.4s, v0.4s			; CHECK-NEXT: and v0.16b, v0.16b, v3.16b
	; CHECK-NEXT: movi v1.4s, #1
	; CHECK-NEXT: and v0.16b, v0.16b, v1.16b
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%urem = urem <4 x i32> %X, <i32 5, i32 4294967295, i32 16, i32 100>			%urem = urem <4 x i32> %X, <i32 5, i32 4294967295, i32 16, i32 100>
	%cmp = icmp eq <4 x i32> %urem, <i32 0, i32 0, i32 0, i32 0>			%cmp = icmp eq <4 x i32> %urem, <i32 0, i32 0, i32 0, i32 0>
	%ret = zext <4 x i1> %cmp to <4 x i32>			%ret = zext <4 x i1> %cmp to <4 x i32>
	ret <4 x i32> %ret			ret <4 x i32> %ret
	}			}

	;------------------------------------------------------------------------------;			;------------------------------------------------------------------------------;

	; One all-ones divisor and one one divisor in odd divisor			; One all-ones divisor and one one divisor in odd divisor
	define <4 x i32> @test_urem_odd_allones_and_one(<4 x i32> %X) nounwind {			define <4 x i32> @test_urem_odd_allones_and_one(<4 x i32> %X) nounwind {
	; CHECK-LABEL: test_urem_odd_allones_and_one:			; CHECK-LABEL: test_urem_odd_allones_and_one:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: adrp x8, .LCPI19_0			; CHECK-NEXT: adrp x8, .LCPI19_0
				; CHECK-NEXT: movi v2.4s, #1
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI19_0]			; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI19_0]
	; CHECK-NEXT: adrp x8, .LCPI19_1			; CHECK-NEXT: adrp x8, .LCPI19_1
	; CHECK-NEXT: mul v0.4s, v0.4s, v1.4s			; CHECK-NEXT: mul v0.4s, v0.4s, v1.4s
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI19_1]			; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI19_1]
	; CHECK-NEXT: cmhs v0.4s, v1.4s, v0.4s			; CHECK-NEXT: cmhs v0.4s, v1.4s, v0.4s
	; CHECK-NEXT: movi v1.4s, #1			; CHECK-NEXT: and v0.16b, v0.16b, v2.16b
	; CHECK-NEXT: and v0.16b, v0.16b, v1.16b
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%urem = urem <4 x i32> %X, <i32 5, i32 4294967295, i32 1, i32 5>			%urem = urem <4 x i32> %X, <i32 5, i32 4294967295, i32 1, i32 5>
	%cmp = icmp eq <4 x i32> %urem, <i32 0, i32 0, i32 0, i32 0>			%cmp = icmp eq <4 x i32> %urem, <i32 0, i32 0, i32 0, i32 0>
	%ret = zext <4 x i1> %cmp to <4 x i32>			%ret = zext <4 x i1> %cmp to <4 x i32>
	ret <4 x i32> %ret			ret <4 x i32> %ret
	}			}

	; One all-ones divisor and one one divisor in even divisor			; One all-ones divisor and one one divisor in even divisor
	define <4 x i32> @test_urem_even_allones_and_one(<4 x i32> %X) nounwind {			define <4 x i32> @test_urem_even_allones_and_one(<4 x i32> %X) nounwind {
	; CHECK-LABEL: test_urem_even_allones_and_one:			; CHECK-LABEL: test_urem_even_allones_and_one:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: adrp x8, .LCPI20_0			; CHECK-NEXT: adrp x8, .LCPI20_0
	; CHECK-NEXT: adrp x9, .LCPI20_2			; CHECK-NEXT: adrp x9, .LCPI20_2
				; CHECK-NEXT: movi v3.4s, #1
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI20_0]			; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI20_0]
	; CHECK-NEXT: adrp x8, .LCPI20_1			; CHECK-NEXT: adrp x8, .LCPI20_1
	; CHECK-NEXT: ldr q2, [x9, :lo12:.LCPI20_2]			; CHECK-NEXT: ldr q2, [x9, :lo12:.LCPI20_2]
	; CHECK-NEXT: mul v0.4s, v0.4s, v1.4s			; CHECK-NEXT: mul v0.4s, v0.4s, v1.4s
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI20_1]			; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI20_1]
	; CHECK-NEXT: adrp x8, .LCPI20_3			; CHECK-NEXT: adrp x8, .LCPI20_3
	; CHECK-NEXT: ushl v1.4s, v0.4s, v1.4s			; CHECK-NEXT: ushl v1.4s, v0.4s, v1.4s
	; CHECK-NEXT: ushl v0.4s, v0.4s, v2.4s			; CHECK-NEXT: ushl v0.4s, v0.4s, v2.4s
				; CHECK-NEXT: ldr q2, [x8, :lo12:.LCPI20_3]
	; CHECK-NEXT: orr v0.16b, v0.16b, v1.16b			; CHECK-NEXT: orr v0.16b, v0.16b, v1.16b
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI20_3]			; CHECK-NEXT: cmhs v0.4s, v2.4s, v0.4s
	; CHECK-NEXT: cmhs v0.4s, v1.4s, v0.4s			; CHECK-NEXT: and v0.16b, v0.16b, v3.16b
	; CHECK-NEXT: movi v1.4s, #1
	; CHECK-NEXT: and v0.16b, v0.16b, v1.16b
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%urem = urem <4 x i32> %X, <i32 14, i32 4294967295, i32 1, i32 14>			%urem = urem <4 x i32> %X, <i32 14, i32 4294967295, i32 1, i32 14>
	%cmp = icmp eq <4 x i32> %urem, <i32 0, i32 0, i32 0, i32 0>			%cmp = icmp eq <4 x i32> %urem, <i32 0, i32 0, i32 0, i32 0>
	%ret = zext <4 x i1> %cmp to <4 x i32>			%ret = zext <4 x i1> %cmp to <4 x i32>
	ret <4 x i32> %ret			ret <4 x i32> %ret
	}			}

	; One all-ones divisor and one one divisor in odd+even divisor			; One all-ones divisor and one one divisor in odd+even divisor
	define <4 x i32> @test_urem_odd_even_allones_and_one(<4 x i32> %X) nounwind {			define <4 x i32> @test_urem_odd_even_allones_and_one(<4 x i32> %X) nounwind {
	; CHECK-LABEL: test_urem_odd_even_allones_and_one:			; CHECK-LABEL: test_urem_odd_even_allones_and_one:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: adrp x8, .LCPI21_0			; CHECK-NEXT: adrp x8, .LCPI21_0
	; CHECK-NEXT: adrp x9, .LCPI21_2			; CHECK-NEXT: adrp x9, .LCPI21_2
				; CHECK-NEXT: movi v3.4s, #1
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI21_0]			; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI21_0]
	; CHECK-NEXT: adrp x8, .LCPI21_1			; CHECK-NEXT: adrp x8, .LCPI21_1
	; CHECK-NEXT: ldr q2, [x9, :lo12:.LCPI21_2]			; CHECK-NEXT: ldr q2, [x9, :lo12:.LCPI21_2]
	; CHECK-NEXT: mul v0.4s, v0.4s, v1.4s			; CHECK-NEXT: mul v0.4s, v0.4s, v1.4s
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI21_1]			; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI21_1]
	; CHECK-NEXT: adrp x8, .LCPI21_3			; CHECK-NEXT: adrp x8, .LCPI21_3
	; CHECK-NEXT: ushl v1.4s, v0.4s, v1.4s			; CHECK-NEXT: ushl v1.4s, v0.4s, v1.4s
	; CHECK-NEXT: ushl v0.4s, v0.4s, v2.4s			; CHECK-NEXT: ushl v0.4s, v0.4s, v2.4s
				; CHECK-NEXT: ldr q2, [x8, :lo12:.LCPI21_3]
	; CHECK-NEXT: orr v0.16b, v0.16b, v1.16b			; CHECK-NEXT: orr v0.16b, v0.16b, v1.16b
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI21_3]			; CHECK-NEXT: cmhs v0.4s, v2.4s, v0.4s
	; CHECK-NEXT: cmhs v0.4s, v1.4s, v0.4s			; CHECK-NEXT: and v0.16b, v0.16b, v3.16b
	; CHECK-NEXT: movi v1.4s, #1
	; CHECK-NEXT: and v0.16b, v0.16b, v1.16b
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%urem = urem <4 x i32> %X, <i32 5, i32 4294967295, i32 1, i32 100>			%urem = urem <4 x i32> %X, <i32 5, i32 4294967295, i32 1, i32 100>
	%cmp = icmp eq <4 x i32> %urem, <i32 0, i32 0, i32 0, i32 0>			%cmp = icmp eq <4 x i32> %urem, <i32 0, i32 0, i32 0, i32 0>
	%ret = zext <4 x i1> %cmp to <4 x i32>			%ret = zext <4 x i1> %cmp to <4 x i32>
	ret <4 x i32> %ret			ret <4 x i32> %ret
	}			}

	;------------------------------------------------------------------------------;			;------------------------------------------------------------------------------;

	; One power-of-two divisor divisor and one divisor in odd divisor			; One power-of-two divisor divisor and one divisor in odd divisor
	define <4 x i32> @test_urem_odd_poweroftwo_and_one(<4 x i32> %X) nounwind {			define <4 x i32> @test_urem_odd_poweroftwo_and_one(<4 x i32> %X) nounwind {
	; CHECK-LABEL: test_urem_odd_poweroftwo_and_one:			; CHECK-LABEL: test_urem_odd_poweroftwo_and_one:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: adrp x8, .LCPI22_0			; CHECK-NEXT: adrp x8, .LCPI22_0
	; CHECK-NEXT: adrp x9, .LCPI22_2			; CHECK-NEXT: adrp x9, .LCPI22_2
				; CHECK-NEXT: movi v3.4s, #1
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI22_0]			; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI22_0]
	; CHECK-NEXT: adrp x8, .LCPI22_1			; CHECK-NEXT: adrp x8, .LCPI22_1
	; CHECK-NEXT: ldr q2, [x9, :lo12:.LCPI22_2]			; CHECK-NEXT: ldr q2, [x9, :lo12:.LCPI22_2]
	; CHECK-NEXT: mul v0.4s, v0.4s, v1.4s			; CHECK-NEXT: mul v0.4s, v0.4s, v1.4s
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI22_1]			; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI22_1]
	; CHECK-NEXT: adrp x8, .LCPI22_3			; CHECK-NEXT: adrp x8, .LCPI22_3
	; CHECK-NEXT: ushl v1.4s, v0.4s, v1.4s			; CHECK-NEXT: ushl v1.4s, v0.4s, v1.4s
	; CHECK-NEXT: ushl v0.4s, v0.4s, v2.4s			; CHECK-NEXT: ushl v0.4s, v0.4s, v2.4s
				; CHECK-NEXT: ldr q2, [x8, :lo12:.LCPI22_3]
	; CHECK-NEXT: orr v0.16b, v0.16b, v1.16b			; CHECK-NEXT: orr v0.16b, v0.16b, v1.16b
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI22_3]			; CHECK-NEXT: cmhs v0.4s, v2.4s, v0.4s
	; CHECK-NEXT: cmhs v0.4s, v1.4s, v0.4s			; CHECK-NEXT: and v0.16b, v0.16b, v3.16b
	; CHECK-NEXT: movi v1.4s, #1
	; CHECK-NEXT: and v0.16b, v0.16b, v1.16b
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%urem = urem <4 x i32> %X, <i32 5, i32 16, i32 1, i32 5>			%urem = urem <4 x i32> %X, <i32 5, i32 16, i32 1, i32 5>
	%cmp = icmp eq <4 x i32> %urem, <i32 0, i32 0, i32 0, i32 0>			%cmp = icmp eq <4 x i32> %urem, <i32 0, i32 0, i32 0, i32 0>
	%ret = zext <4 x i1> %cmp to <4 x i32>			%ret = zext <4 x i1> %cmp to <4 x i32>
	ret <4 x i32> %ret			ret <4 x i32> %ret
	}			}

	; One power-of-two divisor divisor and one divisor in even divisor			; One power-of-two divisor divisor and one divisor in even divisor
	define <4 x i32> @test_urem_even_poweroftwo_and_one(<4 x i32> %X) nounwind {			define <4 x i32> @test_urem_even_poweroftwo_and_one(<4 x i32> %X) nounwind {
	; CHECK-LABEL: test_urem_even_poweroftwo_and_one:			; CHECK-LABEL: test_urem_even_poweroftwo_and_one:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: adrp x8, .LCPI23_0			; CHECK-NEXT: adrp x8, .LCPI23_0
	; CHECK-NEXT: adrp x9, .LCPI23_2			; CHECK-NEXT: adrp x9, .LCPI23_2
				; CHECK-NEXT: movi v3.4s, #1
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI23_0]			; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI23_0]
	; CHECK-NEXT: adrp x8, .LCPI23_1			; CHECK-NEXT: adrp x8, .LCPI23_1
	; CHECK-NEXT: ldr q2, [x9, :lo12:.LCPI23_2]			; CHECK-NEXT: ldr q2, [x9, :lo12:.LCPI23_2]
	; CHECK-NEXT: mul v0.4s, v0.4s, v1.4s			; CHECK-NEXT: mul v0.4s, v0.4s, v1.4s
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI23_1]			; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI23_1]
	; CHECK-NEXT: adrp x8, .LCPI23_3			; CHECK-NEXT: adrp x8, .LCPI23_3
	; CHECK-NEXT: ushl v1.4s, v0.4s, v1.4s			; CHECK-NEXT: ushl v1.4s, v0.4s, v1.4s
	; CHECK-NEXT: ushl v0.4s, v0.4s, v2.4s			; CHECK-NEXT: ushl v0.4s, v0.4s, v2.4s
				; CHECK-NEXT: ldr q2, [x8, :lo12:.LCPI23_3]
	; CHECK-NEXT: orr v0.16b, v0.16b, v1.16b			; CHECK-NEXT: orr v0.16b, v0.16b, v1.16b
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI23_3]			; CHECK-NEXT: cmhs v0.4s, v2.4s, v0.4s
	; CHECK-NEXT: cmhs v0.4s, v1.4s, v0.4s			; CHECK-NEXT: and v0.16b, v0.16b, v3.16b
	; CHECK-NEXT: movi v1.4s, #1
	; CHECK-NEXT: and v0.16b, v0.16b, v1.16b
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%urem = urem <4 x i32> %X, <i32 14, i32 16, i32 1, i32 14>			%urem = urem <4 x i32> %X, <i32 14, i32 16, i32 1, i32 14>
	%cmp = icmp eq <4 x i32> %urem, <i32 0, i32 0, i32 0, i32 0>			%cmp = icmp eq <4 x i32> %urem, <i32 0, i32 0, i32 0, i32 0>
	%ret = zext <4 x i1> %cmp to <4 x i32>			%ret = zext <4 x i1> %cmp to <4 x i32>
	ret <4 x i32> %ret			ret <4 x i32> %ret
	}			}

	; One power-of-two divisor divisor and one divisor in odd+even divisor			; One power-of-two divisor divisor and one divisor in odd+even divisor
	define <4 x i32> @test_urem_odd_even_poweroftwo_and_one(<4 x i32> %X) nounwind {			define <4 x i32> @test_urem_odd_even_poweroftwo_and_one(<4 x i32> %X) nounwind {
	; CHECK-LABEL: test_urem_odd_even_poweroftwo_and_one:			; CHECK-LABEL: test_urem_odd_even_poweroftwo_and_one:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: adrp x8, .LCPI24_0			; CHECK-NEXT: adrp x8, .LCPI24_0
	; CHECK-NEXT: adrp x9, .LCPI24_2			; CHECK-NEXT: adrp x9, .LCPI24_2
				; CHECK-NEXT: movi v3.4s, #1
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI24_0]			; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI24_0]
	; CHECK-NEXT: adrp x8, .LCPI24_1			; CHECK-NEXT: adrp x8, .LCPI24_1
	; CHECK-NEXT: ldr q2, [x9, :lo12:.LCPI24_2]			; CHECK-NEXT: ldr q2, [x9, :lo12:.LCPI24_2]
	; CHECK-NEXT: mul v0.4s, v0.4s, v1.4s			; CHECK-NEXT: mul v0.4s, v0.4s, v1.4s
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI24_1]			; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI24_1]
	; CHECK-NEXT: adrp x8, .LCPI24_3			; CHECK-NEXT: adrp x8, .LCPI24_3
	; CHECK-NEXT: ushl v1.4s, v0.4s, v1.4s			; CHECK-NEXT: ushl v1.4s, v0.4s, v1.4s
	; CHECK-NEXT: ushl v0.4s, v0.4s, v2.4s			; CHECK-NEXT: ushl v0.4s, v0.4s, v2.4s
				; CHECK-NEXT: ldr q2, [x8, :lo12:.LCPI24_3]
	; CHECK-NEXT: orr v0.16b, v0.16b, v1.16b			; CHECK-NEXT: orr v0.16b, v0.16b, v1.16b
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI24_3]			; CHECK-NEXT: cmhs v0.4s, v2.4s, v0.4s
	; CHECK-NEXT: cmhs v0.4s, v1.4s, v0.4s			; CHECK-NEXT: and v0.16b, v0.16b, v3.16b
	; CHECK-NEXT: movi v1.4s, #1
	; CHECK-NEXT: and v0.16b, v0.16b, v1.16b
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%urem = urem <4 x i32> %X, <i32 5, i32 16, i32 1, i32 100>			%urem = urem <4 x i32> %X, <i32 5, i32 16, i32 1, i32 100>
	%cmp = icmp eq <4 x i32> %urem, <i32 0, i32 0, i32 0, i32 0>			%cmp = icmp eq <4 x i32> %urem, <i32 0, i32 0, i32 0, i32 0>
	%ret = zext <4 x i1> %cmp to <4 x i32>			%ret = zext <4 x i1> %cmp to <4 x i32>
	ret <4 x i32> %ret			ret <4 x i32> %ret
	}			}

	;------------------------------------------------------------------------------;			;------------------------------------------------------------------------------;

	define <4 x i32> @test_urem_odd_allones_and_poweroftwo_and_one(<4 x i32> %X) nounwind {			define <4 x i32> @test_urem_odd_allones_and_poweroftwo_and_one(<4 x i32> %X) nounwind {
	; CHECK-LABEL: test_urem_odd_allones_and_poweroftwo_and_one:			; CHECK-LABEL: test_urem_odd_allones_and_poweroftwo_and_one:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: adrp x8, .LCPI25_0			; CHECK-NEXT: adrp x8, .LCPI25_0
	; CHECK-NEXT: adrp x9, .LCPI25_2			; CHECK-NEXT: adrp x9, .LCPI25_2
				; CHECK-NEXT: movi v3.4s, #1
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI25_0]			; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI25_0]
	; CHECK-NEXT: adrp x8, .LCPI25_1			; CHECK-NEXT: adrp x8, .LCPI25_1
	; CHECK-NEXT: ldr q2, [x9, :lo12:.LCPI25_2]			; CHECK-NEXT: ldr q2, [x9, :lo12:.LCPI25_2]
	; CHECK-NEXT: mul v0.4s, v0.4s, v1.4s			; CHECK-NEXT: mul v0.4s, v0.4s, v1.4s
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI25_1]			; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI25_1]
	; CHECK-NEXT: adrp x8, .LCPI25_3			; CHECK-NEXT: adrp x8, .LCPI25_3
	; CHECK-NEXT: ushl v1.4s, v0.4s, v1.4s			; CHECK-NEXT: ushl v1.4s, v0.4s, v1.4s
	; CHECK-NEXT: ushl v0.4s, v0.4s, v2.4s			; CHECK-NEXT: ushl v0.4s, v0.4s, v2.4s
				; CHECK-NEXT: ldr q2, [x8, :lo12:.LCPI25_3]
	; CHECK-NEXT: orr v0.16b, v0.16b, v1.16b			; CHECK-NEXT: orr v0.16b, v0.16b, v1.16b
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI25_3]			; CHECK-NEXT: cmhs v0.4s, v2.4s, v0.4s
	; CHECK-NEXT: cmhs v0.4s, v1.4s, v0.4s			; CHECK-NEXT: and v0.16b, v0.16b, v3.16b
	; CHECK-NEXT: movi v1.4s, #1
	; CHECK-NEXT: and v0.16b, v0.16b, v1.16b
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%urem = urem <4 x i32> %X, <i32 5, i32 4294967295, i32 16, i32 1>			%urem = urem <4 x i32> %X, <i32 5, i32 4294967295, i32 16, i32 1>
	%cmp = icmp eq <4 x i32> %urem, <i32 0, i32 0, i32 0, i32 0>			%cmp = icmp eq <4 x i32> %urem, <i32 0, i32 0, i32 0, i32 0>
	%ret = zext <4 x i1> %cmp to <4 x i32>			%ret = zext <4 x i1> %cmp to <4 x i32>
	ret <4 x i32> %ret			ret <4 x i32> %ret
	}			}

	define <4 x i32> @test_urem_even_allones_and_poweroftwo_and_one(<4 x i32> %X) nounwind {			define <4 x i32> @test_urem_even_allones_and_poweroftwo_and_one(<4 x i32> %X) nounwind {
	; CHECK-LABEL: test_urem_even_allones_and_poweroftwo_and_one:			; CHECK-LABEL: test_urem_even_allones_and_poweroftwo_and_one:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: adrp x8, .LCPI26_0			; CHECK-NEXT: adrp x8, .LCPI26_0
	; CHECK-NEXT: adrp x9, .LCPI26_2			; CHECK-NEXT: adrp x9, .LCPI26_2
				; CHECK-NEXT: movi v3.4s, #1
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI26_0]			; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI26_0]
	; CHECK-NEXT: adrp x8, .LCPI26_1			; CHECK-NEXT: adrp x8, .LCPI26_1
	; CHECK-NEXT: ldr q2, [x9, :lo12:.LCPI26_2]			; CHECK-NEXT: ldr q2, [x9, :lo12:.LCPI26_2]
	; CHECK-NEXT: mul v0.4s, v0.4s, v1.4s			; CHECK-NEXT: mul v0.4s, v0.4s, v1.4s
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI26_1]			; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI26_1]
	; CHECK-NEXT: adrp x8, .LCPI26_3			; CHECK-NEXT: adrp x8, .LCPI26_3
	; CHECK-NEXT: ushl v1.4s, v0.4s, v1.4s			; CHECK-NEXT: ushl v1.4s, v0.4s, v1.4s
	; CHECK-NEXT: ushl v0.4s, v0.4s, v2.4s			; CHECK-NEXT: ushl v0.4s, v0.4s, v2.4s
				; CHECK-NEXT: ldr q2, [x8, :lo12:.LCPI26_3]
	; CHECK-NEXT: orr v0.16b, v0.16b, v1.16b			; CHECK-NEXT: orr v0.16b, v0.16b, v1.16b
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI26_3]			; CHECK-NEXT: cmhs v0.4s, v2.4s, v0.4s
	; CHECK-NEXT: cmhs v0.4s, v1.4s, v0.4s			; CHECK-NEXT: and v0.16b, v0.16b, v3.16b
	; CHECK-NEXT: movi v1.4s, #1
	; CHECK-NEXT: and v0.16b, v0.16b, v1.16b
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%urem = urem <4 x i32> %X, <i32 14, i32 4294967295, i32 16, i32 1>			%urem = urem <4 x i32> %X, <i32 14, i32 4294967295, i32 16, i32 1>
	%cmp = icmp eq <4 x i32> %urem, <i32 0, i32 0, i32 0, i32 0>			%cmp = icmp eq <4 x i32> %urem, <i32 0, i32 0, i32 0, i32 0>
	%ret = zext <4 x i1> %cmp to <4 x i32>			%ret = zext <4 x i1> %cmp to <4 x i32>
	ret <4 x i32> %ret			ret <4 x i32> %ret
	}			}

llvm/test/CodeGen/AArch64/urem-seteq-vec-nonzero.ll

	Show First 20 Lines • Show All 48 Lines • ▼ Show 20 Lines
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI2_0]			; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI2_0]
	; CHECK-NEXT: mov w8, #43691			; CHECK-NEXT: mov w8, #43691
	; CHECK-NEXT: movk w8, #43690, lsl #16			; CHECK-NEXT: movk w8, #43690, lsl #16
	; CHECK-NEXT: sub v0.4s, v0.4s, v1.4s			; CHECK-NEXT: sub v0.4s, v0.4s, v1.4s
	; CHECK-NEXT: dup v1.4s, w8			; CHECK-NEXT: dup v1.4s, w8
	; CHECK-NEXT: mov w8, #43690			; CHECK-NEXT: mov w8, #43690
	; CHECK-NEXT: movk w8, #10922, lsl #16			; CHECK-NEXT: movk w8, #10922, lsl #16
	; CHECK-NEXT: mul v0.4s, v0.4s, v1.4s			; CHECK-NEXT: mul v0.4s, v0.4s, v1.4s
				; CHECK-NEXT: dup v2.4s, w8
	; CHECK-NEXT: shl v1.4s, v0.4s, #31			; CHECK-NEXT: shl v1.4s, v0.4s, #31
	; CHECK-NEXT: ushr v0.4s, v0.4s, #1			; CHECK-NEXT: ushr v0.4s, v0.4s, #1
	; CHECK-NEXT: orr v0.16b, v0.16b, v1.16b			; CHECK-NEXT: orr v0.16b, v0.16b, v1.16b
	; CHECK-NEXT: dup v1.4s, w8			; CHECK-NEXT: cmhs v0.4s, v2.4s, v0.4s
	; CHECK-NEXT: cmhs v0.4s, v1.4s, v0.4s
	; CHECK-NEXT: xtn v0.4h, v0.4s			; CHECK-NEXT: xtn v0.4h, v0.4s
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%urem = urem <4 x i32> %X, <i32 6, i32 6, i32 6, i32 6>			%urem = urem <4 x i32> %X, <i32 6, i32 6, i32 6, i32 6>
	%cmp = icmp eq <4 x i32> %urem, <i32 0, i32 1, i32 2, i32 3>			%cmp = icmp eq <4 x i32> %urem, <i32 0, i32 1, i32 2, i32 3>
	ret <4 x i1> %cmp			ret <4 x i1> %cmp
	}			}

	define <4 x i1> @t32_6_part1(<4 x i32> %X) nounwind {			define <4 x i1> @t32_6_part1(<4 x i32> %X) nounwind {
	; CHECK-LABEL: t32_6_part1:			; CHECK-LABEL: t32_6_part1:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: adrp x8, .LCPI3_0			; CHECK-NEXT: adrp x8, .LCPI3_0
				; CHECK-NEXT: mov w9, #43691
				; CHECK-NEXT: movk w9, #43690, lsl #16
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI3_0]			; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI3_0]
	; CHECK-NEXT: mov w8, #43691
	; CHECK-NEXT: movk w8, #43690, lsl #16
	; CHECK-NEXT: sub v0.4s, v0.4s, v1.4s
	; CHECK-NEXT: dup v1.4s, w8
	; CHECK-NEXT: adrp x8, .LCPI3_1			; CHECK-NEXT: adrp x8, .LCPI3_1
	; CHECK-NEXT: mul v0.4s, v0.4s, v1.4s			; CHECK-NEXT: dup v2.4s, w9
				; CHECK-NEXT: sub v0.4s, v0.4s, v1.4s
				; CHECK-NEXT: mul v0.4s, v0.4s, v2.4s
				; CHECK-NEXT: ldr q2, [x8, :lo12:.LCPI3_1]
	; CHECK-NEXT: shl v1.4s, v0.4s, #31			; CHECK-NEXT: shl v1.4s, v0.4s, #31
	; CHECK-NEXT: ushr v0.4s, v0.4s, #1			; CHECK-NEXT: ushr v0.4s, v0.4s, #1
	; CHECK-NEXT: orr v0.16b, v0.16b, v1.16b			; CHECK-NEXT: orr v0.16b, v0.16b, v1.16b
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI3_1]			; CHECK-NEXT: cmhs v0.4s, v2.4s, v0.4s
	; CHECK-NEXT: cmhs v0.4s, v1.4s, v0.4s
	; CHECK-NEXT: xtn v0.4h, v0.4s			; CHECK-NEXT: xtn v0.4h, v0.4s
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%urem = urem <4 x i32> %X, <i32 6, i32 6, i32 6, i32 6>			%urem = urem <4 x i32> %X, <i32 6, i32 6, i32 6, i32 6>
	%cmp = icmp eq <4 x i32> %urem, <i32 4, i32 5, i32 0, i32 0>			%cmp = icmp eq <4 x i32> %urem, <i32 4, i32 5, i32 0, i32 0>
	ret <4 x i1> %cmp			ret <4 x i1> %cmp
	}			}

	define <4 x i1> @t32_tautological(<4 x i32> %X) nounwind {			define <4 x i1> @t32_tautological(<4 x i32> %X) nounwind {
	Show All 20 Lines

llvm/test/CodeGen/AArch64/urem-seteq-vec-splat.ll

; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py		; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
; RUN: llc -mtriple=aarch64-unknown-linux-gnu < %s \| FileCheck %s		; RUN: llc -mtriple=aarch64-unknown-linux-gnu < %s \| FileCheck %s

; Odd divisor		; Odd divisor
define <4 x i32> @test_urem_odd_25(<4 x i32> %X) nounwind {		define <4 x i32> @test_urem_odd_25(<4 x i32> %X) nounwind {
; CHECK-LABEL: test_urem_odd_25:		; CHECK-LABEL: test_urem_odd_25:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: mov w8, #23593		; CHECK-NEXT: mov w8, #23593
; CHECK-NEXT: movk w8, #49807, lsl #16		; CHECK-NEXT: movk w8, #49807, lsl #16
		; CHECK-NEXT: movi v2.4s, #1
; CHECK-NEXT: dup v1.4s, w8		; CHECK-NEXT: dup v1.4s, w8
; CHECK-NEXT: mov w8, #28835		; CHECK-NEXT: mov w8, #28835
; CHECK-NEXT: movk w8, #2621, lsl #16		; CHECK-NEXT: movk w8, #2621, lsl #16
; CHECK-NEXT: mul v0.4s, v0.4s, v1.4s		; CHECK-NEXT: mul v0.4s, v0.4s, v1.4s
; CHECK-NEXT: dup v1.4s, w8		; CHECK-NEXT: dup v1.4s, w8
; CHECK-NEXT: cmhs v0.4s, v1.4s, v0.4s		; CHECK-NEXT: cmhs v0.4s, v1.4s, v0.4s
; CHECK-NEXT: movi v1.4s, #1		; CHECK-NEXT: and v0.16b, v0.16b, v2.16b
; CHECK-NEXT: and v0.16b, v0.16b, v1.16b
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%urem = urem <4 x i32> %X, <i32 25, i32 25, i32 25, i32 25>		%urem = urem <4 x i32> %X, <i32 25, i32 25, i32 25, i32 25>
%cmp = icmp eq <4 x i32> %urem, <i32 0, i32 0, i32 0, i32 0>		%cmp = icmp eq <4 x i32> %urem, <i32 0, i32 0, i32 0, i32 0>
%ret = zext <4 x i1> %cmp to <4 x i32>		%ret = zext <4 x i1> %cmp to <4 x i32>
ret <4 x i32> %ret		ret <4 x i32> %ret
}		}

; Even divisors		; Even divisors
define <4 x i32> @test_urem_even_100(<4 x i32> %X) nounwind {		define <4 x i32> @test_urem_even_100(<4 x i32> %X) nounwind {
; CHECK-LABEL: test_urem_even_100:		; CHECK-LABEL: test_urem_even_100:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: mov w8, #23593		; CHECK-NEXT: mov w8, #23593
; CHECK-NEXT: movk w8, #49807, lsl #16		; CHECK-NEXT: movk w8, #49807, lsl #16
		; CHECK-NEXT: movi v3.4s, #1
; CHECK-NEXT: dup v1.4s, w8		; CHECK-NEXT: dup v1.4s, w8
; CHECK-NEXT: mov w8, #23592		; CHECK-NEXT: mov w8, #23592
; CHECK-NEXT: movk w8, #655, lsl #16		; CHECK-NEXT: movk w8, #655, lsl #16
; CHECK-NEXT: mul v0.4s, v0.4s, v1.4s		; CHECK-NEXT: mul v0.4s, v0.4s, v1.4s
		; CHECK-NEXT: dup v2.4s, w8
; CHECK-NEXT: shl v1.4s, v0.4s, #30		; CHECK-NEXT: shl v1.4s, v0.4s, #30
; CHECK-NEXT: ushr v0.4s, v0.4s, #2		; CHECK-NEXT: ushr v0.4s, v0.4s, #2
; CHECK-NEXT: orr v0.16b, v0.16b, v1.16b		; CHECK-NEXT: orr v0.16b, v0.16b, v1.16b
; CHECK-NEXT: dup v1.4s, w8		; CHECK-NEXT: cmhs v0.4s, v2.4s, v0.4s
; CHECK-NEXT: cmhs v0.4s, v1.4s, v0.4s		; CHECK-NEXT: and v0.16b, v0.16b, v3.16b
; CHECK-NEXT: movi v1.4s, #1
; CHECK-NEXT: and v0.16b, v0.16b, v1.16b
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%urem = urem <4 x i32> %X, <i32 100, i32 100, i32 100, i32 100>		%urem = urem <4 x i32> %X, <i32 100, i32 100, i32 100, i32 100>
%cmp = icmp eq <4 x i32> %urem, <i32 0, i32 0, i32 0, i32 0>		%cmp = icmp eq <4 x i32> %urem, <i32 0, i32 0, i32 0, i32 0>
%ret = zext <4 x i1> %cmp to <4 x i32>		%ret = zext <4 x i1> %cmp to <4 x i32>
ret <4 x i32> %ret		ret <4 x i32> %ret
}		}

; Negative divisors should be negated, and thus this is still splat vectors.		; Negative divisors should be negated, and thus this is still splat vectors.

; Odd divisor		; Odd divisor
define <4 x i32> @test_urem_odd_neg25(<4 x i32> %X) nounwind {		define <4 x i32> @test_urem_odd_neg25(<4 x i32> %X) nounwind {
; CHECK-LABEL: test_urem_odd_neg25:		; CHECK-LABEL: test_urem_odd_neg25:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: adrp x8, .LCPI2_0		; CHECK-NEXT: adrp x8, .LCPI2_0
		; CHECK-NEXT: movi v2.4s, #1
; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI2_0]		; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI2_0]
; CHECK-NEXT: adrp x8, .LCPI2_1		; CHECK-NEXT: adrp x8, .LCPI2_1
; CHECK-NEXT: mul v0.4s, v0.4s, v1.4s		; CHECK-NEXT: mul v0.4s, v0.4s, v1.4s
; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI2_1]		; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI2_1]
; CHECK-NEXT: cmhs v0.4s, v1.4s, v0.4s		; CHECK-NEXT: cmhs v0.4s, v1.4s, v0.4s
; CHECK-NEXT: movi v1.4s, #1		; CHECK-NEXT: and v0.16b, v0.16b, v2.16b
; CHECK-NEXT: and v0.16b, v0.16b, v1.16b
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%urem = urem <4 x i32> %X, <i32 25, i32 -25, i32 -25, i32 25>		%urem = urem <4 x i32> %X, <i32 25, i32 -25, i32 -25, i32 25>
%cmp = icmp eq <4 x i32> %urem, <i32 0, i32 0, i32 0, i32 0>		%cmp = icmp eq <4 x i32> %urem, <i32 0, i32 0, i32 0, i32 0>
%ret = zext <4 x i1> %cmp to <4 x i32>		%ret = zext <4 x i1> %cmp to <4 x i32>
ret <4 x i32> %ret		ret <4 x i32> %ret
}		}

; Even divisors		; Even divisors
define <4 x i32> @test_urem_even_neg100(<4 x i32> %X) nounwind {		define <4 x i32> @test_urem_even_neg100(<4 x i32> %X) nounwind {
; CHECK-LABEL: test_urem_even_neg100:		; CHECK-LABEL: test_urem_even_neg100:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: adrp x8, .LCPI3_0		; CHECK-NEXT: adrp x8, .LCPI3_0
		; CHECK-NEXT: movi v3.4s, #1
; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI3_0]		; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI3_0]
; CHECK-NEXT: adrp x8, .LCPI3_1		; CHECK-NEXT: adrp x8, .LCPI3_1
; CHECK-NEXT: mul v0.4s, v0.4s, v1.4s		; CHECK-NEXT: mul v0.4s, v0.4s, v1.4s
		; CHECK-NEXT: ldr q2, [x8, :lo12:.LCPI3_1]
; CHECK-NEXT: shl v1.4s, v0.4s, #30		; CHECK-NEXT: shl v1.4s, v0.4s, #30
; CHECK-NEXT: ushr v0.4s, v0.4s, #2		; CHECK-NEXT: ushr v0.4s, v0.4s, #2
; CHECK-NEXT: orr v0.16b, v0.16b, v1.16b		; CHECK-NEXT: orr v0.16b, v0.16b, v1.16b
; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI3_1]		; CHECK-NEXT: cmhs v0.4s, v2.4s, v0.4s
; CHECK-NEXT: cmhs v0.4s, v1.4s, v0.4s		; CHECK-NEXT: and v0.16b, v0.16b, v3.16b
; CHECK-NEXT: movi v1.4s, #1
; CHECK-NEXT: and v0.16b, v0.16b, v1.16b
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%urem = urem <4 x i32> %X, <i32 -100, i32 100, i32 -100, i32 100>		%urem = urem <4 x i32> %X, <i32 -100, i32 100, i32 -100, i32 100>
%cmp = icmp eq <4 x i32> %urem, <i32 0, i32 0, i32 0, i32 0>		%cmp = icmp eq <4 x i32> %urem, <i32 0, i32 0, i32 0, i32 0>
%ret = zext <4 x i1> %cmp to <4 x i32>		%ret = zext <4 x i1> %cmp to <4 x i32>
ret <4 x i32> %ret		ret <4 x i32> %ret
}		}

;------------------------------------------------------------------------------;		;------------------------------------------------------------------------------;
; Comparison constant has undef elements.		; Comparison constant has undef elements.
;------------------------------------------------------------------------------;		;------------------------------------------------------------------------------;

define <4 x i32> @test_urem_odd_undef1(<4 x i32> %X) nounwind {		define <4 x i32> @test_urem_odd_undef1(<4 x i32> %X) nounwind {
; CHECK-LABEL: test_urem_odd_undef1:		; CHECK-LABEL: test_urem_odd_undef1:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: mov w8, #34079		; CHECK-NEXT: mov w8, #34079
; CHECK-NEXT: movk w8, #20971, lsl #16		; CHECK-NEXT: movk w8, #20971, lsl #16
; CHECK-NEXT: movi v1.4s, #25		; CHECK-NEXT: dup v1.4s, w8
; CHECK-NEXT: dup v2.4s, w8		; CHECK-NEXT: umull2 v2.2d, v0.4s, v1.4s
; CHECK-NEXT: umull2 v3.2d, v0.4s, v2.4s		; CHECK-NEXT: umull v1.2d, v0.2s, v1.2s
; CHECK-NEXT: umull v2.2d, v0.2s, v2.2s		; CHECK-NEXT: uzp2 v1.4s, v1.4s, v2.4s
; CHECK-NEXT: uzp2 v2.4s, v2.4s, v3.4s		; CHECK-NEXT: movi v2.4s, #25
; CHECK-NEXT: ushr v2.4s, v2.4s, #3		; CHECK-NEXT: ushr v1.4s, v1.4s, #3
; CHECK-NEXT: mls v0.4s, v2.4s, v1.4s		; CHECK-NEXT: mls v0.4s, v1.4s, v2.4s
; CHECK-NEXT: movi v1.4s, #1		; CHECK-NEXT: movi v1.4s, #1
; CHECK-NEXT: cmeq v0.4s, v0.4s, #0		; CHECK-NEXT: cmeq v0.4s, v0.4s, #0
; CHECK-NEXT: and v0.16b, v0.16b, v1.16b		; CHECK-NEXT: and v0.16b, v0.16b, v1.16b
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%urem = urem <4 x i32> %X, <i32 25, i32 25, i32 25, i32 25>		%urem = urem <4 x i32> %X, <i32 25, i32 25, i32 25, i32 25>
%cmp = icmp eq <4 x i32> %urem, <i32 0, i32 0, i32 undef, i32 0>		%cmp = icmp eq <4 x i32> %urem, <i32 0, i32 0, i32 undef, i32 0>
%ret = zext <4 x i1> %cmp to <4 x i32>		%ret = zext <4 x i1> %cmp to <4 x i32>
ret <4 x i32> %ret		ret <4 x i32> %ret
}		}

define <4 x i32> @test_urem_even_undef1(<4 x i32> %X) nounwind {		define <4 x i32> @test_urem_even_undef1(<4 x i32> %X) nounwind {
; CHECK-LABEL: test_urem_even_undef1:		; CHECK-LABEL: test_urem_even_undef1:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: mov w8, #34079		; CHECK-NEXT: mov w8, #34079
; CHECK-NEXT: movk w8, #20971, lsl #16		; CHECK-NEXT: movk w8, #20971, lsl #16
; CHECK-NEXT: movi v1.4s, #100		; CHECK-NEXT: dup v1.4s, w8
; CHECK-NEXT: dup v2.4s, w8		; CHECK-NEXT: umull2 v2.2d, v0.4s, v1.4s
; CHECK-NEXT: umull2 v3.2d, v0.4s, v2.4s		; CHECK-NEXT: umull v1.2d, v0.2s, v1.2s
; CHECK-NEXT: umull v2.2d, v0.2s, v2.2s		; CHECK-NEXT: uzp2 v1.4s, v1.4s, v2.4s
; CHECK-NEXT: uzp2 v2.4s, v2.4s, v3.4s		; CHECK-NEXT: movi v2.4s, #100
; CHECK-NEXT: ushr v2.4s, v2.4s, #5		; CHECK-NEXT: ushr v1.4s, v1.4s, #5
; CHECK-NEXT: mls v0.4s, v2.4s, v1.4s		; CHECK-NEXT: mls v0.4s, v1.4s, v2.4s
; CHECK-NEXT: movi v1.4s, #1		; CHECK-NEXT: movi v1.4s, #1
; CHECK-NEXT: cmeq v0.4s, v0.4s, #0		; CHECK-NEXT: cmeq v0.4s, v0.4s, #0
; CHECK-NEXT: and v0.16b, v0.16b, v1.16b		; CHECK-NEXT: and v0.16b, v0.16b, v1.16b
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%urem = urem <4 x i32> %X, <i32 100, i32 100, i32 100, i32 100>		%urem = urem <4 x i32> %X, <i32 100, i32 100, i32 100, i32 100>
%cmp = icmp eq <4 x i32> %urem, <i32 0, i32 0, i32 undef, i32 0>		%cmp = icmp eq <4 x i32> %urem, <i32 0, i32 0, i32 undef, i32 0>
%ret = zext <4 x i1> %cmp to <4 x i32>		%ret = zext <4 x i1> %cmp to <4 x i32>
ret <4 x i32> %ret		ret <4 x i32> %ret
Show All 24 Lines	; CHECK-NEXT: ret
ret <4 x i32> %ret		ret <4 x i32> %ret
}		}

; We can lower remainder of division by powers of two much better elsewhere.		; We can lower remainder of division by powers of two much better elsewhere.
define <4 x i32> @test_urem_pow2(<4 x i32> %X) nounwind {		define <4 x i32> @test_urem_pow2(<4 x i32> %X) nounwind {
; CHECK-LABEL: test_urem_pow2:		; CHECK-LABEL: test_urem_pow2:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: movi v1.4s, #15		; CHECK-NEXT: movi v1.4s, #15
		; CHECK-NEXT: movi v2.4s, #1
; CHECK-NEXT: and v0.16b, v0.16b, v1.16b		; CHECK-NEXT: and v0.16b, v0.16b, v1.16b
; CHECK-NEXT: movi v1.4s, #1
; CHECK-NEXT: cmeq v0.4s, v0.4s, #0		; CHECK-NEXT: cmeq v0.4s, v0.4s, #0
; CHECK-NEXT: and v0.16b, v0.16b, v1.16b		; CHECK-NEXT: and v0.16b, v0.16b, v2.16b
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%urem = urem <4 x i32> %X, <i32 16, i32 16, i32 16, i32 16>		%urem = urem <4 x i32> %X, <i32 16, i32 16, i32 16, i32 16>
%cmp = icmp eq <4 x i32> %urem, <i32 0, i32 0, i32 0, i32 0>		%cmp = icmp eq <4 x i32> %urem, <i32 0, i32 0, i32 0, i32 0>
%ret = zext <4 x i1> %cmp to <4 x i32>		%ret = zext <4 x i1> %cmp to <4 x i32>
ret <4 x i32> %ret		ret <4 x i32> %ret
}		}

; We could lower remainder of division by INT_MIN much better elsewhere.		; We could lower remainder of division by INT_MIN much better elsewhere.
define <4 x i32> @test_urem_int_min(<4 x i32> %X) nounwind {		define <4 x i32> @test_urem_int_min(<4 x i32> %X) nounwind {
; CHECK-LABEL: test_urem_int_min:		; CHECK-LABEL: test_urem_int_min:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: bic v0.4s, #128, lsl #24
; CHECK-NEXT: movi v1.4s, #1		; CHECK-NEXT: movi v1.4s, #1
		; CHECK-NEXT: bic v0.4s, #128, lsl #24
; CHECK-NEXT: cmeq v0.4s, v0.4s, #0		; CHECK-NEXT: cmeq v0.4s, v0.4s, #0
; CHECK-NEXT: and v0.16b, v0.16b, v1.16b		; CHECK-NEXT: and v0.16b, v0.16b, v1.16b
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%urem = urem <4 x i32> %X, <i32 2147483648, i32 2147483648, i32 2147483648, i32 2147483648>		%urem = urem <4 x i32> %X, <i32 2147483648, i32 2147483648, i32 2147483648, i32 2147483648>
%cmp = icmp eq <4 x i32> %urem, <i32 0, i32 0, i32 0, i32 0>		%cmp = icmp eq <4 x i32> %urem, <i32 0, i32 0, i32 0, i32 0>
%ret = zext <4 x i1> %cmp to <4 x i32>		%ret = zext <4 x i1> %cmp to <4 x i32>
ret <4 x i32> %ret		ret <4 x i32> %ret
}		}
Show All 15 Lines

llvm/test/CodeGen/AArch64/urem-seteq-vec-tautological.ll

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: llc -mtriple=aarch64-unknown-linux-gnu < %s \| FileCheck %s			; RUN: llc -mtriple=aarch64-unknown-linux-gnu < %s \| FileCheck %s

	define <4 x i1> @t0_all_tautological(<4 x i32> %X) nounwind {			define <4 x i1> @t0_all_tautological(<4 x i32> %X) nounwind {
	; CHECK-LABEL: t0_all_tautological:			; CHECK-LABEL: t0_all_tautological:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: adrp x8, .LCPI0_0			; CHECK-NEXT: adrp x8, .LCPI0_0
				; CHECK-NEXT: adrp x9, .LCPI0_1
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI0_0]			; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI0_0]
	; CHECK-NEXT: adrp x8, .LCPI0_1			; CHECK-NEXT: ldr q2, [x9, :lo12:.LCPI0_1]
	; CHECK-NEXT: and v0.16b, v0.16b, v1.16b			; CHECK-NEXT: and v0.16b, v0.16b, v1.16b
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI0_1]			; CHECK-NEXT: cmeq v0.4s, v0.4s, v2.4s
	; CHECK-NEXT: cmeq v0.4s, v0.4s, v1.4s
	; CHECK-NEXT: xtn v0.4h, v0.4s			; CHECK-NEXT: xtn v0.4h, v0.4s
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%urem = urem <4 x i32> %X, <i32 1, i32 1, i32 2, i32 2>			%urem = urem <4 x i32> %X, <i32 1, i32 1, i32 2, i32 2>
	%cmp = icmp eq <4 x i32> %urem, <i32 0, i32 1, i32 2, i32 3>			%cmp = icmp eq <4 x i32> %urem, <i32 0, i32 1, i32 2, i32 3>
	ret <4 x i1> %cmp			ret <4 x i1> %cmp
	}			}

	define <4 x i1> @t1_all_odd_eq(<4 x i32> %X) nounwind {			define <4 x i1> @t1_all_odd_eq(<4 x i32> %X) nounwind {
	▲ Show 20 Lines • Show All 77 Lines • Show Last 20 Lines

llvm/test/CodeGen/AArch64/usub_sat_vec.ll

Show First 20 Lines • Show All 92 Lines • ▼ Show 20 Lines
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%z = call <32 x i16> @llvm.usub.sat.v32i16(<32 x i16> %x, <32 x i16> %y)		%z = call <32 x i16> @llvm.usub.sat.v32i16(<32 x i16> %x, <32 x i16> %y)
ret <32 x i16> %z		ret <32 x i16> %z
}		}

define void @v8i8(<8 x i8>* %px, <8 x i8>* %py, <8 x i8>* %pz) nounwind {		define void @v8i8(<8 x i8>* %px, <8 x i8>* %py, <8 x i8>* %pz) nounwind {
; CHECK-LABEL: v8i8:		; CHECK-LABEL: v8i8:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: ldr d0, [x0]		; CHECK-NEXT: ldr d0, [x1]
; CHECK-NEXT: ldr d1, [x1]		; CHECK-NEXT: ldr d1, [x0]
; CHECK-NEXT: uqsub v0.8b, v0.8b, v1.8b		; CHECK-NEXT: uqsub v0.8b, v1.8b, v0.8b
; CHECK-NEXT: str d0, [x2]		; CHECK-NEXT: str d0, [x2]
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%x = load <8 x i8>, <8 x i8>* %px		%x = load <8 x i8>, <8 x i8>* %px
%y = load <8 x i8>, <8 x i8>* %py		%y = load <8 x i8>, <8 x i8>* %py
%z = call <8 x i8> @llvm.usub.sat.v8i8(<8 x i8> %x, <8 x i8> %y)		%z = call <8 x i8> @llvm.usub.sat.v8i8(<8 x i8> %x, <8 x i8> %y)
store <8 x i8> %z, <8 x i8>* %pz		store <8 x i8> %z, <8 x i8>* %pz
ret void		ret void
}		}
Show All 38 Lines	; CHECK-NEXT: ret
%z = call <2 x i8> @llvm.usub.sat.v2i8(<2 x i8> %x, <2 x i8> %y)		%z = call <2 x i8> @llvm.usub.sat.v2i8(<2 x i8> %x, <2 x i8> %y)
store <2 x i8> %z, <2 x i8>* %pz		store <2 x i8> %z, <2 x i8>* %pz
ret void		ret void
}		}

define void @v4i16(<4 x i16>* %px, <4 x i16>* %py, <4 x i16>* %pz) nounwind {		define void @v4i16(<4 x i16>* %px, <4 x i16>* %py, <4 x i16>* %pz) nounwind {
; CHECK-LABEL: v4i16:		; CHECK-LABEL: v4i16:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: ldr d0, [x0]		; CHECK-NEXT: ldr d0, [x1]
; CHECK-NEXT: ldr d1, [x1]		; CHECK-NEXT: ldr d1, [x0]
; CHECK-NEXT: uqsub v0.4h, v0.4h, v1.4h		; CHECK-NEXT: uqsub v0.4h, v1.4h, v0.4h
; CHECK-NEXT: str d0, [x2]		; CHECK-NEXT: str d0, [x2]
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%x = load <4 x i16>, <4 x i16>* %px		%x = load <4 x i16>, <4 x i16>* %px
%y = load <4 x i16>, <4 x i16>* %py		%y = load <4 x i16>, <4 x i16>* %py
%z = call <4 x i16> @llvm.usub.sat.v4i16(<4 x i16> %x, <4 x i16> %y)		%z = call <4 x i16> @llvm.usub.sat.v4i16(<4 x i16> %x, <4 x i16> %y)
store <4 x i16> %z, <4 x i16>* %pz		store <4 x i16> %z, <4 x i16>* %pz
ret void		ret void
}		}
▲ Show 20 Lines • Show All 46 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%z = call <12 x i16> @llvm.usub.sat.v12i16(<12 x i16> %x, <12 x i16> %y)		%z = call <12 x i16> @llvm.usub.sat.v12i16(<12 x i16> %x, <12 x i16> %y)
store <12 x i16> %z, <12 x i16>* %pz		store <12 x i16> %z, <12 x i16>* %pz
ret void		ret void
}		}

define void @v1i8(<1 x i8>* %px, <1 x i8>* %py, <1 x i8>* %pz) nounwind {		define void @v1i8(<1 x i8>* %px, <1 x i8>* %py, <1 x i8>* %pz) nounwind {
; CHECK-LABEL: v1i8:		; CHECK-LABEL: v1i8:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: ldr b0, [x0]		; CHECK-NEXT: ldr b0, [x1]
; CHECK-NEXT: ldr b1, [x1]		; CHECK-NEXT: ldr b1, [x0]
; CHECK-NEXT: uqsub v0.8b, v0.8b, v1.8b		; CHECK-NEXT: uqsub v0.8b, v1.8b, v0.8b
; CHECK-NEXT: st1 { v0.b }[0], [x2]		; CHECK-NEXT: st1 { v0.b }[0], [x2]
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%x = load <1 x i8>, <1 x i8>* %px		%x = load <1 x i8>, <1 x i8>* %px
%y = load <1 x i8>, <1 x i8>* %py		%y = load <1 x i8>, <1 x i8>* %py
%z = call <1 x i8> @llvm.usub.sat.v1i8(<1 x i8> %x, <1 x i8> %y)		%z = call <1 x i8> @llvm.usub.sat.v1i8(<1 x i8> %x, <1 x i8> %y)
store <1 x i8> %z, <1 x i8>* %pz		store <1 x i8> %z, <1 x i8>* %pz
ret void		ret void
}		}

define void @v1i16(<1 x i16>* %px, <1 x i16>* %py, <1 x i16>* %pz) nounwind {		define void @v1i16(<1 x i16>* %px, <1 x i16>* %py, <1 x i16>* %pz) nounwind {
; CHECK-LABEL: v1i16:		; CHECK-LABEL: v1i16:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: ldr h0, [x0]		; CHECK-NEXT: ldr h0, [x1]
; CHECK-NEXT: ldr h1, [x1]		; CHECK-NEXT: ldr h1, [x0]
; CHECK-NEXT: uqsub v0.4h, v0.4h, v1.4h		; CHECK-NEXT: uqsub v0.4h, v1.4h, v0.4h
; CHECK-NEXT: str h0, [x2]		; CHECK-NEXT: str h0, [x2]
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%x = load <1 x i16>, <1 x i16>* %px		%x = load <1 x i16>, <1 x i16>* %px
%y = load <1 x i16>, <1 x i16>* %py		%y = load <1 x i16>, <1 x i16>* %py
%z = call <1 x i16> @llvm.usub.sat.v1i16(<1 x i16> %x, <1 x i16> %y)		%z = call <1 x i16> @llvm.usub.sat.v1i16(<1 x i16> %x, <1 x i16> %y)
store <1 x i16> %z, <1 x i16>* %pz		store <1 x i16> %z, <1 x i16>* %pz
ret void		ret void
}		}
▲ Show 20 Lines • Show All 125 Lines • Show Last 20 Lines

llvm/test/CodeGen/AArch64/vec_cttz.ll

	Show First 20 Lines • Show All 79 Lines • ▼ Show 20 Lines
	}			}

	define <8 x i16> @cttz_v8i16(<8 x i16> %a) nounwind {			define <8 x i16> @cttz_v8i16(<8 x i16> %a) nounwind {
	; CHECK-LABEL: cttz_v8i16:			; CHECK-LABEL: cttz_v8i16:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: movi v1.8h, #1			; CHECK-NEXT: movi v1.8h, #1
	; CHECK-NEXT: sub v1.8h, v0.8h, v1.8h			; CHECK-NEXT: sub v1.8h, v0.8h, v1.8h
	; CHECK-NEXT: bic v0.16b, v1.16b, v0.16b			; CHECK-NEXT: bic v0.16b, v1.16b, v0.16b
	; CHECK-NEXT: movi v1.8h, #16
	; CHECK-NEXT: clz v0.8h, v0.8h			; CHECK-NEXT: clz v0.8h, v0.8h
				; CHECK-NEXT: movi v1.8h, #16
	; CHECK-NEXT: sub v0.8h, v1.8h, v0.8h			; CHECK-NEXT: sub v0.8h, v1.8h, v0.8h
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%b = call <8 x i16> @llvm.cttz.v8i16(<8 x i16> %a, i1 true)			%b = call <8 x i16> @llvm.cttz.v8i16(<8 x i16> %a, i1 true)
	ret <8 x i16> %b			ret <8 x i16> %b
	}			}

	define <4 x i32> @cttz_v4i32(<4 x i32> %a) nounwind {			define <4 x i32> @cttz_v4i32(<4 x i32> %a) nounwind {
	; CHECK-LABEL: cttz_v4i32:			; CHECK-LABEL: cttz_v4i32:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: movi v1.4s, #1			; CHECK-NEXT: movi v1.4s, #1
	; CHECK-NEXT: sub v1.4s, v0.4s, v1.4s			; CHECK-NEXT: sub v1.4s, v0.4s, v1.4s
	; CHECK-NEXT: bic v0.16b, v1.16b, v0.16b			; CHECK-NEXT: bic v0.16b, v1.16b, v0.16b
	; CHECK-NEXT: movi v1.4s, #32
	; CHECK-NEXT: clz v0.4s, v0.4s			; CHECK-NEXT: clz v0.4s, v0.4s
				; CHECK-NEXT: movi v1.4s, #32
	; CHECK-NEXT: sub v0.4s, v1.4s, v0.4s			; CHECK-NEXT: sub v0.4s, v1.4s, v0.4s
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%b = call <4 x i32> @llvm.cttz.v4i32(<4 x i32> %a, i1 true)			%b = call <4 x i32> @llvm.cttz.v4i32(<4 x i32> %a, i1 true)
	ret <4 x i32> %b			ret <4 x i32> %b
	}			}

	define <2 x i64> @cttz_v2i64(<2 x i64> %a) nounwind {			define <2 x i64> @cttz_v2i64(<2 x i64> %a) nounwind {
	; CHECK-LABEL: cttz_v2i64:			; CHECK-LABEL: cttz_v2i64:
	Show All 13 Lines

llvm/test/CodeGen/AArch64/vec_uaddo.ll

	Show First 20 Lines • Show All 46 Lines • ▼ Show 20 Lines
	}			}

	define <3 x i32> @uaddo_v3i32(<3 x i32> %a0, <3 x i32> %a1, <3 x i32>* %p2) nounwind {			define <3 x i32> @uaddo_v3i32(<3 x i32> %a0, <3 x i32> %a1, <3 x i32>* %p2) nounwind {
	; CHECK-LABEL: uaddo_v3i32:			; CHECK-LABEL: uaddo_v3i32:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: add v1.4s, v0.4s, v1.4s			; CHECK-NEXT: add v1.4s, v0.4s, v1.4s
	; CHECK-NEXT: add x8, x0, #8			; CHECK-NEXT: add x8, x0, #8
	; CHECK-NEXT: cmhi v0.4s, v0.4s, v1.4s			; CHECK-NEXT: cmhi v0.4s, v0.4s, v1.4s
	; CHECK-NEXT: st1 { v1.s }[2], [x8]
	; CHECK-NEXT: str d1, [x0]			; CHECK-NEXT: str d1, [x0]
				; CHECK-NEXT: st1 { v1.s }[2], [x8]
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%t = call {<3 x i32>, <3 x i1>} @llvm.uadd.with.overflow.v3i32(<3 x i32> %a0, <3 x i32> %a1)			%t = call {<3 x i32>, <3 x i1>} @llvm.uadd.with.overflow.v3i32(<3 x i32> %a0, <3 x i32> %a1)
	%val = extractvalue {<3 x i32>, <3 x i1>} %t, 0			%val = extractvalue {<3 x i32>, <3 x i1>} %t, 0
	%obit = extractvalue {<3 x i32>, <3 x i1>} %t, 1			%obit = extractvalue {<3 x i32>, <3 x i1>} %t, 1
	%res = sext <3 x i1> %obit to <3 x i32>			%res = sext <3 x i1> %obit to <3 x i32>
	store <3 x i32> %val, <3 x i32>* %p2			store <3 x i32> %val, <3 x i32>* %p2
	ret <3 x i32> %res			ret <3 x i32> %res
	}			}
	Show All 14 Lines
	}			}

	define <6 x i32> @uaddo_v6i32(<6 x i32> %a0, <6 x i32> %a1, <6 x i32>* %p2) nounwind {			define <6 x i32> @uaddo_v6i32(<6 x i32> %a0, <6 x i32> %a1, <6 x i32>* %p2) nounwind {
	; CHECK-LABEL: uaddo_v6i32:			; CHECK-LABEL: uaddo_v6i32:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: fmov s0, w6			; CHECK-NEXT: fmov s0, w6
	; CHECK-NEXT: fmov s1, w0			; CHECK-NEXT: fmov s1, w0
	; CHECK-NEXT: mov x8, sp			; CHECK-NEXT: mov x8, sp
	; CHECK-NEXT: add x9, sp, #8
	; CHECK-NEXT: ldr s2, [sp, #16]			; CHECK-NEXT: ldr s2, [sp, #16]
	; CHECK-NEXT: fmov s3, w4			; CHECK-NEXT: add x9, sp, #24
				; CHECK-NEXT: add x10, sp, #8
	; CHECK-NEXT: mov v0.s[1], w7			; CHECK-NEXT: mov v0.s[1], w7
				; CHECK-NEXT: fmov s3, w4
	; CHECK-NEXT: mov v1.s[1], w1			; CHECK-NEXT: mov v1.s[1], w1
				; CHECK-NEXT: ld1 { v2.s }[1], [x9]
	; CHECK-NEXT: mov v3.s[1], w5			; CHECK-NEXT: mov v3.s[1], w5
	; CHECK-NEXT: ld1 { v0.s }[2], [x8]			; CHECK-NEXT: ld1 { v0.s }[2], [x8]
	; CHECK-NEXT: add x8, sp, #24
	; CHECK-NEXT: mov v1.s[2], w2			; CHECK-NEXT: mov v1.s[2], w2
	; CHECK-NEXT: ld1 { v2.s }[1], [x8]
	; CHECK-NEXT: ld1 { v0.s }[3], [x9]
	; CHECK-NEXT: mov v1.s[3], w3
	; CHECK-NEXT: ldr x8, [sp, #32]			; CHECK-NEXT: ldr x8, [sp, #32]
	; CHECK-NEXT: add v2.4s, v3.4s, v2.4s			; CHECK-NEXT: add v2.4s, v3.4s, v2.4s
	; CHECK-NEXT: add v0.4s, v1.4s, v0.4s			; CHECK-NEXT: ld1 { v0.s }[3], [x10]
	; CHECK-NEXT: cmhi v3.4s, v3.4s, v2.4s			; CHECK-NEXT: mov v1.s[3], w3
	; CHECK-NEXT: str d2, [x8, #16]			; CHECK-NEXT: str d2, [x8, #16]
	; CHECK-NEXT: cmhi v1.4s, v1.4s, v0.4s			; CHECK-NEXT: cmhi v3.4s, v3.4s, v2.4s
	; CHECK-NEXT: str q0, [x8]
	; CHECK-NEXT: mov w5, v3.s[1]			; CHECK-NEXT: mov w5, v3.s[1]
	; CHECK-NEXT: fmov w4, s3			; CHECK-NEXT: fmov w4, s3
				; CHECK-NEXT: add v0.4s, v1.4s, v0.4s
				; CHECK-NEXT: cmhi v1.4s, v1.4s, v0.4s
				; CHECK-NEXT: str q0, [x8]
	; CHECK-NEXT: mov w1, v1.s[1]			; CHECK-NEXT: mov w1, v1.s[1]
	; CHECK-NEXT: mov w2, v1.s[2]			; CHECK-NEXT: mov w2, v1.s[2]
	; CHECK-NEXT: mov w3, v1.s[3]			; CHECK-NEXT: mov w3, v1.s[3]
	; CHECK-NEXT: fmov w0, s1			; CHECK-NEXT: fmov w0, s1
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%t = call {<6 x i32>, <6 x i1>} @llvm.uadd.with.overflow.v6i32(<6 x i32> %a0, <6 x i32> %a1)			%t = call {<6 x i32>, <6 x i1>} @llvm.uadd.with.overflow.v6i32(<6 x i32> %a0, <6 x i32> %a1)
	%val = extractvalue {<6 x i32>, <6 x i1>} %t, 0			%val = extractvalue {<6 x i32>, <6 x i1>} %t, 0
	%obit = extractvalue {<6 x i32>, <6 x i1>} %t, 1			%obit = extractvalue {<6 x i32>, <6 x i1>} %t, 1
	Show All 20 Lines
	}			}

	define <16 x i32> @uaddo_v16i8(<16 x i8> %a0, <16 x i8> %a1, <16 x i8>* %p2) nounwind {			define <16 x i32> @uaddo_v16i8(<16 x i8> %a0, <16 x i8> %a1, <16 x i8>* %p2) nounwind {
	; CHECK-LABEL: uaddo_v16i8:			; CHECK-LABEL: uaddo_v16i8:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: add v4.16b, v0.16b, v1.16b			; CHECK-NEXT: add v4.16b, v0.16b, v1.16b
	; CHECK-NEXT: cmhi v0.16b, v0.16b, v4.16b			; CHECK-NEXT: cmhi v0.16b, v0.16b, v4.16b
	; CHECK-NEXT: str q4, [x0]			; CHECK-NEXT: str q4, [x0]
	; CHECK-NEXT: ext v1.16b, v0.16b, v0.16b, #8			; CHECK-NEXT: zip1 v1.8b, v0.8b, v0.8b
	; CHECK-NEXT: zip1 v2.8b, v0.8b, v0.8b			; CHECK-NEXT: zip2 v2.8b, v0.8b, v0.8b
	; CHECK-NEXT: zip2 v0.8b, v0.8b, v0.8b			; CHECK-NEXT: ext v0.16b, v0.16b, v0.16b, #8
				; CHECK-NEXT: ushll v1.4s, v1.4h, #0
	; CHECK-NEXT: ushll v2.4s, v2.4h, #0			; CHECK-NEXT: ushll v2.4s, v2.4h, #0
	; CHECK-NEXT: zip1 v3.8b, v1.8b, v0.8b			; CHECK-NEXT: zip1 v3.8b, v0.8b, v0.8b
	; CHECK-NEXT: zip2 v1.8b, v1.8b, v0.8b			; CHECK-NEXT: zip2 v5.8b, v0.8b, v0.8b
	; CHECK-NEXT: ushll v0.4s, v0.4h, #0			; CHECK-NEXT: shl v1.4s, v1.4s, #31
				; CHECK-NEXT: shl v2.4s, v2.4s, #31
				; CHECK-NEXT: cmlt v0.4s, v1.4s, #0
				; CHECK-NEXT: cmlt v1.4s, v2.4s, #0
				; CHECK-NEXT: ushll v2.4s, v3.4h, #0
				; CHECK-NEXT: ushll v3.4s, v5.4h, #0
	; CHECK-NEXT: shl v2.4s, v2.4s, #31			; CHECK-NEXT: shl v2.4s, v2.4s, #31
	; CHECK-NEXT: ushll v3.4s, v3.4h, #0
	; CHECK-NEXT: ushll v1.4s, v1.4h, #0
	; CHECK-NEXT: shl v5.4s, v0.4s, #31
	; CHECK-NEXT: cmlt v0.4s, v2.4s, #0
	; CHECK-NEXT: shl v3.4s, v3.4s, #31			; CHECK-NEXT: shl v3.4s, v3.4s, #31
	; CHECK-NEXT: shl v6.4s, v1.4s, #31			; CHECK-NEXT: cmlt v2.4s, v2.4s, #0
	; CHECK-NEXT: cmlt v1.4s, v5.4s, #0			; CHECK-NEXT: cmlt v3.4s, v3.4s, #0
	; CHECK-NEXT: cmlt v2.4s, v3.4s, #0
	; CHECK-NEXT: cmlt v3.4s, v6.4s, #0
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%t = call {<16 x i8>, <16 x i1>} @llvm.uadd.with.overflow.v16i8(<16 x i8> %a0, <16 x i8> %a1)			%t = call {<16 x i8>, <16 x i1>} @llvm.uadd.with.overflow.v16i8(<16 x i8> %a0, <16 x i8> %a1)
	%val = extractvalue {<16 x i8>, <16 x i1>} %t, 0			%val = extractvalue {<16 x i8>, <16 x i1>} %t, 0
	%obit = extractvalue {<16 x i8>, <16 x i1>} %t, 1			%obit = extractvalue {<16 x i8>, <16 x i1>} %t, 1
	%res = sext <16 x i1> %obit to <16 x i32>			%res = sext <16 x i1> %obit to <16 x i32>
	store <16 x i8> %val, <16 x i8>* %p2			store <16 x i8> %val, <16 x i8>* %p2
	ret <16 x i32> %res			ret <16 x i32> %res
	}			}
	Show All 39 Lines
	}			}

	define <4 x i32> @uaddo_v4i24(<4 x i24> %a0, <4 x i24> %a1, <4 x i24>* %p2) nounwind {			define <4 x i32> @uaddo_v4i24(<4 x i24> %a0, <4 x i24> %a1, <4 x i24>* %p2) nounwind {
	; CHECK-LABEL: uaddo_v4i24:			; CHECK-LABEL: uaddo_v4i24:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: bic v1.4s, #255, lsl #24			; CHECK-NEXT: bic v1.4s, #255, lsl #24
	; CHECK-NEXT: bic v0.4s, #255, lsl #24			; CHECK-NEXT: bic v0.4s, #255, lsl #24
	; CHECK-NEXT: add v0.4s, v0.4s, v1.4s			; CHECK-NEXT: add v0.4s, v0.4s, v1.4s
	; CHECK-NEXT: mov v1.16b, v0.16b
	; CHECK-NEXT: mov w8, v0.s[3]			; CHECK-NEXT: mov w8, v0.s[3]
	; CHECK-NEXT: mov w9, v0.s[2]			; CHECK-NEXT: mov w9, v0.s[2]
	; CHECK-NEXT: mov w10, v0.s[1]			; CHECK-NEXT: mov w10, v0.s[1]
	; CHECK-NEXT: fmov w11, s0			; CHECK-NEXT: fmov w11, s0
				; CHECK-NEXT: mov v1.16b, v0.16b
	; CHECK-NEXT: bic v1.4s, #255, lsl #24			; CHECK-NEXT: bic v1.4s, #255, lsl #24
	; CHECK-NEXT: sturh w8, [x0, #9]			; CHECK-NEXT: sturh w8, [x0, #9]
	; CHECK-NEXT: lsr w8, w8, #16			; CHECK-NEXT: lsr w8, w8, #16
				; CHECK-NEXT: cmeq v1.4s, v1.4s, v0.4s
	; CHECK-NEXT: strh w9, [x0, #6]			; CHECK-NEXT: strh w9, [x0, #6]
	; CHECK-NEXT: sturh w10, [x0, #3]			; CHECK-NEXT: sturh w10, [x0, #3]
	; CHECK-NEXT: lsr w9, w9, #16			; CHECK-NEXT: lsr w9, w9, #16
	; CHECK-NEXT: strh w11, [x0]			; CHECK-NEXT: lsr w10, w10, #16
	; CHECK-NEXT: cmeq v1.4s, v1.4s, v0.4s
	; CHECK-NEXT: strb w8, [x0, #11]			; CHECK-NEXT: strb w8, [x0, #11]
	; CHECK-NEXT: lsr w8, w10, #16			; CHECK-NEXT: lsr w8, w11, #16
	; CHECK-NEXT: lsr w10, w11, #16			; CHECK-NEXT: strh w11, [x0]
	; CHECK-NEXT: strb w9, [x0, #8]
	; CHECK-NEXT: mvn v0.16b, v1.16b			; CHECK-NEXT: mvn v0.16b, v1.16b
	; CHECK-NEXT: strb w8, [x0, #5]			; CHECK-NEXT: strb w9, [x0, #8]
	; CHECK-NEXT: strb w10, [x0, #2]			; CHECK-NEXT: strb w10, [x0, #5]
				; CHECK-NEXT: strb w8, [x0, #2]
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%t = call {<4 x i24>, <4 x i1>} @llvm.uadd.with.overflow.v4i24(<4 x i24> %a0, <4 x i24> %a1)			%t = call {<4 x i24>, <4 x i1>} @llvm.uadd.with.overflow.v4i24(<4 x i24> %a0, <4 x i24> %a1)
	%val = extractvalue {<4 x i24>, <4 x i1>} %t, 0			%val = extractvalue {<4 x i24>, <4 x i1>} %t, 0
	%obit = extractvalue {<4 x i24>, <4 x i1>} %t, 1			%obit = extractvalue {<4 x i24>, <4 x i1>} %t, 1
	%res = sext <4 x i1> %obit to <4 x i32>			%res = sext <4 x i1> %obit to <4 x i32>
	store <4 x i24> %val, <4 x i24>* %p2			store <4 x i24> %val, <4 x i24>* %p2
	ret <4 x i32> %res			ret <4 x i32> %res
	}			}

	define <4 x i32> @uaddo_v4i1(<4 x i1> %a0, <4 x i1> %a1, <4 x i1>* %p2) nounwind {			define <4 x i32> @uaddo_v4i1(<4 x i1> %a0, <4 x i1> %a1, <4 x i1>* %p2) nounwind {
	; CHECK-LABEL: uaddo_v4i1:			; CHECK-LABEL: uaddo_v4i1:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: movi v2.4h, #1			; CHECK-NEXT: movi v2.4h, #1
	; CHECK-NEXT: and v1.8b, v1.8b, v2.8b			; CHECK-NEXT: and v1.8b, v1.8b, v2.8b
	; CHECK-NEXT: and v0.8b, v0.8b, v2.8b			; CHECK-NEXT: and v0.8b, v0.8b, v2.8b
	; CHECK-NEXT: add v0.4h, v0.4h, v1.4h			; CHECK-NEXT: add v0.4h, v0.4h, v1.4h
	; CHECK-NEXT: and v1.8b, v0.8b, v2.8b
	; CHECK-NEXT: umov w8, v0.h[1]			; CHECK-NEXT: umov w8, v0.h[1]
	; CHECK-NEXT: umov w9, v0.h[2]			; CHECK-NEXT: umov w9, v0.h[2]
	; CHECK-NEXT: umov w10, v0.h[0]			; CHECK-NEXT: umov w10, v0.h[0]
	; CHECK-NEXT: umov w11, v0.h[3]			; CHECK-NEXT: umov w11, v0.h[3]
	; CHECK-NEXT: cmeq v1.4h, v1.4h, v0.4h			; CHECK-NEXT: and v1.8b, v0.8b, v2.8b
				; CHECK-NEXT: cmeq v0.4h, v1.4h, v0.4h
	; CHECK-NEXT: and w8, w8, #0x1			; CHECK-NEXT: and w8, w8, #0x1
	; CHECK-NEXT: and w9, w9, #0x1			; CHECK-NEXT: and w9, w9, #0x1
				; CHECK-NEXT: mvn v0.8b, v0.8b
				; CHECK-NEXT: sshll v0.4s, v0.4h, #0
	; CHECK-NEXT: bfi w10, w8, #1, #1			; CHECK-NEXT: bfi w10, w8, #1, #1
	; CHECK-NEXT: mvn v1.8b, v1.8b
	; CHECK-NEXT: bfi w10, w9, #2, #1			; CHECK-NEXT: bfi w10, w9, #2, #1
	; CHECK-NEXT: bfi w10, w11, #3, #29			; CHECK-NEXT: bfi w10, w11, #3, #29
	; CHECK-NEXT: and w8, w10, #0xf			; CHECK-NEXT: and w8, w10, #0xf
	; CHECK-NEXT: sshll v0.4s, v1.4h, #0
	; CHECK-NEXT: strb w8, [x0]			; CHECK-NEXT: strb w8, [x0]
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%t = call {<4 x i1>, <4 x i1>} @llvm.uadd.with.overflow.v4i1(<4 x i1> %a0, <4 x i1> %a1)			%t = call {<4 x i1>, <4 x i1>} @llvm.uadd.with.overflow.v4i1(<4 x i1> %a0, <4 x i1> %a1)
	%val = extractvalue {<4 x i1>, <4 x i1>} %t, 0			%val = extractvalue {<4 x i1>, <4 x i1>} %t, 0
	%obit = extractvalue {<4 x i1>, <4 x i1>} %t, 1			%obit = extractvalue {<4 x i1>, <4 x i1>} %t, 1
	%res = sext <4 x i1> %obit to <4 x i32>			%res = sext <4 x i1> %obit to <4 x i32>
	store <4 x i1> %val, <4 x i1>* %p2			store <4 x i1> %val, <4 x i1>* %p2
	ret <4 x i32> %res			ret <4 x i32> %res
	Show All 34 Lines

llvm/test/CodeGen/AArch64/vec_umulo.ll

Show All 16 Lines
declare {<2 x i128>, <2 x i1>} @llvm.umul.with.overflow.v2i128(<2 x i128>, <2 x i128>)		declare {<2 x i128>, <2 x i1>} @llvm.umul.with.overflow.v2i128(<2 x i128>, <2 x i128>)

define <1 x i32> @umulo_v1i32(<1 x i32> %a0, <1 x i32> %a1, <1 x i32>* %p2) nounwind {		define <1 x i32> @umulo_v1i32(<1 x i32> %a0, <1 x i32> %a1, <1 x i32>* %p2) nounwind {
; CHECK-LABEL: umulo_v1i32:		; CHECK-LABEL: umulo_v1i32:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: umull v1.2d, v0.2s, v1.2s		; CHECK-NEXT: umull v1.2d, v0.2s, v1.2s
; CHECK-NEXT: shrn v0.2s, v1.2d, #32		; CHECK-NEXT: shrn v0.2s, v1.2d, #32
; CHECK-NEXT: xtn v1.2s, v1.2d		; CHECK-NEXT: xtn v1.2s, v1.2d
; CHECK-NEXT: str s1, [x0]
; CHECK-NEXT: cmtst v0.2s, v0.2s, v0.2s		; CHECK-NEXT: cmtst v0.2s, v0.2s, v0.2s
		; CHECK-NEXT: str s1, [x0]
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%t = call {<1 x i32>, <1 x i1>} @llvm.umul.with.overflow.v1i32(<1 x i32> %a0, <1 x i32> %a1)		%t = call {<1 x i32>, <1 x i1>} @llvm.umul.with.overflow.v1i32(<1 x i32> %a0, <1 x i32> %a1)
%val = extractvalue {<1 x i32>, <1 x i1>} %t, 0		%val = extractvalue {<1 x i32>, <1 x i1>} %t, 0
%obit = extractvalue {<1 x i32>, <1 x i1>} %t, 1		%obit = extractvalue {<1 x i32>, <1 x i1>} %t, 1
%res = sext <1 x i1> %obit to <1 x i32>		%res = sext <1 x i1> %obit to <1 x i32>
store <1 x i32> %val, <1 x i32>* %p2		store <1 x i32> %val, <1 x i32>* %p2
ret <1 x i32> %res		ret <1 x i32> %res
}		}

define <2 x i32> @umulo_v2i32(<2 x i32> %a0, <2 x i32> %a1, <2 x i32>* %p2) nounwind {		define <2 x i32> @umulo_v2i32(<2 x i32> %a0, <2 x i32> %a1, <2 x i32>* %p2) nounwind {
; CHECK-LABEL: umulo_v2i32:		; CHECK-LABEL: umulo_v2i32:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: umull v1.2d, v0.2s, v1.2s		; CHECK-NEXT: umull v1.2d, v0.2s, v1.2s
; CHECK-NEXT: shrn v0.2s, v1.2d, #32		; CHECK-NEXT: shrn v0.2s, v1.2d, #32
; CHECK-NEXT: xtn v1.2s, v1.2d		; CHECK-NEXT: xtn v1.2s, v1.2d
; CHECK-NEXT: str d1, [x0]
; CHECK-NEXT: cmtst v0.2s, v0.2s, v0.2s		; CHECK-NEXT: cmtst v0.2s, v0.2s, v0.2s
		; CHECK-NEXT: str d1, [x0]
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%t = call {<2 x i32>, <2 x i1>} @llvm.umul.with.overflow.v2i32(<2 x i32> %a0, <2 x i32> %a1)		%t = call {<2 x i32>, <2 x i1>} @llvm.umul.with.overflow.v2i32(<2 x i32> %a0, <2 x i32> %a1)
%val = extractvalue {<2 x i32>, <2 x i1>} %t, 0		%val = extractvalue {<2 x i32>, <2 x i1>} %t, 0
%obit = extractvalue {<2 x i32>, <2 x i1>} %t, 1		%obit = extractvalue {<2 x i32>, <2 x i1>} %t, 1
%res = sext <2 x i1> %obit to <2 x i32>		%res = sext <2 x i1> %obit to <2 x i32>
store <2 x i32> %val, <2 x i32>* %p2		store <2 x i32> %val, <2 x i32>* %p2
ret <2 x i32> %res		ret <2 x i32> %res
}		}
Show All 39 Lines
}		}

define <6 x i32> @umulo_v6i32(<6 x i32> %a0, <6 x i32> %a1, <6 x i32>* %p2) nounwind {		define <6 x i32> @umulo_v6i32(<6 x i32> %a0, <6 x i32> %a1, <6 x i32>* %p2) nounwind {
; CHECK-LABEL: umulo_v6i32:		; CHECK-LABEL: umulo_v6i32:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: fmov s0, w6		; CHECK-NEXT: fmov s0, w6
; CHECK-NEXT: fmov s1, w0		; CHECK-NEXT: fmov s1, w0
; CHECK-NEXT: mov x8, sp		; CHECK-NEXT: mov x8, sp
; CHECK-NEXT: add x9, sp, #8
; CHECK-NEXT: ldr s2, [sp, #16]		; CHECK-NEXT: ldr s2, [sp, #16]
; CHECK-NEXT: fmov s3, w4		; CHECK-NEXT: add x9, sp, #24
		; CHECK-NEXT: add x10, sp, #8
; CHECK-NEXT: mov v0.s[1], w7		; CHECK-NEXT: mov v0.s[1], w7
		; CHECK-NEXT: fmov s3, w4
; CHECK-NEXT: mov v1.s[1], w1		; CHECK-NEXT: mov v1.s[1], w1
		; CHECK-NEXT: ld1 { v2.s }[1], [x9]
; CHECK-NEXT: mov v3.s[1], w5		; CHECK-NEXT: mov v3.s[1], w5
; CHECK-NEXT: ld1 { v0.s }[2], [x8]		; CHECK-NEXT: ld1 { v0.s }[2], [x8]
; CHECK-NEXT: add x8, sp, #24
; CHECK-NEXT: mov v1.s[2], w2		; CHECK-NEXT: mov v1.s[2], w2
; CHECK-NEXT: ld1 { v2.s }[1], [x8]
; CHECK-NEXT: ld1 { v0.s }[3], [x9]
; CHECK-NEXT: mov v1.s[3], w3
; CHECK-NEXT: ldr x8, [sp, #32]		; CHECK-NEXT: ldr x8, [sp, #32]
; CHECK-NEXT: umull2 v6.2d, v3.4s, v2.4s		; CHECK-NEXT: umull2 v4.2d, v3.4s, v2.4s
		; CHECK-NEXT: ld1 { v0.s }[3], [x10]
		; CHECK-NEXT: mov v1.s[3], w3
; CHECK-NEXT: umull v7.2d, v3.2s, v2.2s		; CHECK-NEXT: umull v7.2d, v3.2s, v2.2s
; CHECK-NEXT: umull2 v4.2d, v1.4s, v0.4s
; CHECK-NEXT: umull v5.2d, v1.2s, v0.2s
; CHECK-NEXT: mul v2.4s, v3.4s, v2.4s		; CHECK-NEXT: mul v2.4s, v3.4s, v2.4s
; CHECK-NEXT: mul v0.4s, v1.4s, v0.4s		; CHECK-NEXT: umull2 v5.2d, v1.4s, v0.4s
; CHECK-NEXT: uzp2 v4.4s, v5.4s, v4.4s		; CHECK-NEXT: umull v6.2d, v1.2s, v0.2s
; CHECK-NEXT: uzp2 v5.4s, v7.4s, v6.4s		; CHECK-NEXT: uzp2 v4.4s, v7.4s, v4.4s
; CHECK-NEXT: str d2, [x8, #16]		; CHECK-NEXT: str d2, [x8, #16]
; CHECK-NEXT: str q0, [x8]		; CHECK-NEXT: mul v0.4s, v1.4s, v0.4s
		; CHECK-NEXT: uzp2 v5.4s, v6.4s, v5.4s
; CHECK-NEXT: cmtst v4.4s, v4.4s, v4.4s		; CHECK-NEXT: cmtst v4.4s, v4.4s, v4.4s
		; CHECK-NEXT: str q0, [x8]
; CHECK-NEXT: cmtst v3.4s, v5.4s, v5.4s		; CHECK-NEXT: cmtst v3.4s, v5.4s, v5.4s
; CHECK-NEXT: mov w1, v4.s[1]		; CHECK-NEXT: mov w5, v4.s[1]
; CHECK-NEXT: mov w2, v4.s[2]		; CHECK-NEXT: fmov w4, s4
; CHECK-NEXT: mov w3, v4.s[3]		; CHECK-NEXT: mov w1, v3.s[1]
; CHECK-NEXT: mov w5, v3.s[1]		; CHECK-NEXT: mov w2, v3.s[2]
; CHECK-NEXT: fmov w0, s4		; CHECK-NEXT: mov w3, v3.s[3]
; CHECK-NEXT: fmov w4, s3		; CHECK-NEXT: fmov w0, s3
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%t = call {<6 x i32>, <6 x i1>} @llvm.umul.with.overflow.v6i32(<6 x i32> %a0, <6 x i32> %a1)		%t = call {<6 x i32>, <6 x i1>} @llvm.umul.with.overflow.v6i32(<6 x i32> %a0, <6 x i32> %a1)
%val = extractvalue {<6 x i32>, <6 x i1>} %t, 0		%val = extractvalue {<6 x i32>, <6 x i1>} %t, 0
%obit = extractvalue {<6 x i32>, <6 x i1>} %t, 1		%obit = extractvalue {<6 x i32>, <6 x i1>} %t, 1
%res = sext <6 x i1> %obit to <6 x i32>		%res = sext <6 x i1> %obit to <6 x i32>
store <6 x i32> %val, <6 x i32>* %p2		store <6 x i32> %val, <6 x i32>* %p2
ret <6 x i32> %res		ret <6 x i32> %res
}		}
Show All 23 Lines	; CHECK-NEXT: ret
ret <8 x i32> %res		ret <8 x i32> %res
}		}

define <16 x i32> @umulo_v16i8(<16 x i8> %a0, <16 x i8> %a1, <16 x i8>* %p2) nounwind {		define <16 x i32> @umulo_v16i8(<16 x i8> %a0, <16 x i8> %a1, <16 x i8>* %p2) nounwind {
; CHECK-LABEL: umulo_v16i8:		; CHECK-LABEL: umulo_v16i8:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: umull2 v2.8h, v0.16b, v1.16b		; CHECK-NEXT: umull2 v2.8h, v0.16b, v1.16b
; CHECK-NEXT: umull v3.8h, v0.8b, v1.8b		; CHECK-NEXT: umull v3.8h, v0.8b, v1.8b
		; CHECK-NEXT: mul v5.16b, v0.16b, v1.16b
; CHECK-NEXT: uzp2 v2.16b, v3.16b, v2.16b		; CHECK-NEXT: uzp2 v2.16b, v3.16b, v2.16b
		; CHECK-NEXT: str q5, [x0]
; CHECK-NEXT: cmtst v2.16b, v2.16b, v2.16b		; CHECK-NEXT: cmtst v2.16b, v2.16b, v2.16b
; CHECK-NEXT: ext v3.16b, v2.16b, v2.16b, #8		; CHECK-NEXT: zip1 v3.8b, v2.8b, v0.8b
; CHECK-NEXT: zip1 v4.8b, v2.8b, v0.8b		; CHECK-NEXT: zip2 v4.8b, v2.8b, v0.8b
; CHECK-NEXT: zip2 v2.8b, v2.8b, v0.8b		; CHECK-NEXT: ext v0.16b, v2.16b, v2.16b, #8
; CHECK-NEXT: zip1 v5.8b, v3.8b, v0.8b		; CHECK-NEXT: ushll v1.4s, v3.4h, #0
; CHECK-NEXT: zip2 v3.8b, v3.8b, v0.8b		; CHECK-NEXT: ushll v2.4s, v4.4h, #0
; CHECK-NEXT: ushll v4.4s, v4.4h, #0		; CHECK-NEXT: zip1 v3.8b, v0.8b, v0.8b
; CHECK-NEXT: ushll v2.4s, v2.4h, #0		; CHECK-NEXT: zip2 v4.8b, v0.8b, v0.8b
; CHECK-NEXT: ushll v5.4s, v5.4h, #0		; CHECK-NEXT: shl v1.4s, v1.4s, #31
; CHECK-NEXT: ushll v3.4s, v3.4h, #0		; CHECK-NEXT: shl v2.4s, v2.4s, #31
; CHECK-NEXT: shl v4.4s, v4.4s, #31		; CHECK-NEXT: cmlt v0.4s, v1.4s, #0
		; CHECK-NEXT: cmlt v1.4s, v2.4s, #0
		; CHECK-NEXT: ushll v2.4s, v3.4h, #0
		; CHECK-NEXT: ushll v3.4s, v4.4h, #0
; CHECK-NEXT: shl v2.4s, v2.4s, #31		; CHECK-NEXT: shl v2.4s, v2.4s, #31
; CHECK-NEXT: shl v6.4s, v5.4s, #31
; CHECK-NEXT: shl v3.4s, v3.4s, #31		; CHECK-NEXT: shl v3.4s, v3.4s, #31
; CHECK-NEXT: cmlt v4.4s, v4.4s, #0		; CHECK-NEXT: cmlt v2.4s, v2.4s, #0
; CHECK-NEXT: cmlt v5.4s, v2.4s, #0
; CHECK-NEXT: cmlt v2.4s, v6.4s, #0
; CHECK-NEXT: cmlt v3.4s, v3.4s, #0		; CHECK-NEXT: cmlt v3.4s, v3.4s, #0
; CHECK-NEXT: mul v6.16b, v0.16b, v1.16b
; CHECK-NEXT: mov v0.16b, v4.16b
; CHECK-NEXT: mov v1.16b, v5.16b
; CHECK-NEXT: str q6, [x0]
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%t = call {<16 x i8>, <16 x i1>} @llvm.umul.with.overflow.v16i8(<16 x i8> %a0, <16 x i8> %a1)		%t = call {<16 x i8>, <16 x i1>} @llvm.umul.with.overflow.v16i8(<16 x i8> %a0, <16 x i8> %a1)
%val = extractvalue {<16 x i8>, <16 x i1>} %t, 0		%val = extractvalue {<16 x i8>, <16 x i1>} %t, 0
%obit = extractvalue {<16 x i8>, <16 x i1>} %t, 1		%obit = extractvalue {<16 x i8>, <16 x i1>} %t, 1
%res = sext <16 x i1> %obit to <16 x i32>		%res = sext <16 x i1> %obit to <16 x i32>
store <16 x i8> %val, <16 x i8>* %p2		store <16 x i8> %val, <16 x i8>* %p2
ret <16 x i32> %res		ret <16 x i32> %res
}		}
▲ Show 20 Lines • Show All 57 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
ret <2 x i32> %res		ret <2 x i32> %res
}		}

define <4 x i32> @umulo_v4i24(<4 x i24> %a0, <4 x i24> %a1, <4 x i24>* %p2) nounwind {		define <4 x i32> @umulo_v4i24(<4 x i24> %a0, <4 x i24> %a1, <4 x i24>* %p2) nounwind {
; CHECK-LABEL: umulo_v4i24:		; CHECK-LABEL: umulo_v4i24:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: bic v1.4s, #255, lsl #24		; CHECK-NEXT: bic v1.4s, #255, lsl #24
; CHECK-NEXT: bic v0.4s, #255, lsl #24		; CHECK-NEXT: bic v0.4s, #255, lsl #24
; CHECK-NEXT: umull2 v2.2d, v0.4s, v1.4s		; CHECK-NEXT: mul v2.4s, v0.4s, v1.4s
; CHECK-NEXT: umull v3.2d, v0.2s, v1.2s		; CHECK-NEXT: umull2 v3.2d, v0.4s, v1.4s
; CHECK-NEXT: mul v0.4s, v0.4s, v1.4s		; CHECK-NEXT: umull v0.2d, v0.2s, v1.2s
; CHECK-NEXT: uzp2 v1.4s, v3.4s, v2.4s		; CHECK-NEXT: mov w8, v2.s[3]
; CHECK-NEXT: ushr v2.4s, v0.4s, #24		; CHECK-NEXT: mov w10, v2.s[2]
; CHECK-NEXT: mov w8, v0.s[3]		; CHECK-NEXT: mov w11, v2.s[1]
; CHECK-NEXT: mov w9, v0.s[2]		; CHECK-NEXT: ushr v1.4s, v2.4s, #24
; CHECK-NEXT: mov w10, v0.s[1]		; CHECK-NEXT: uzp2 v0.4s, v0.4s, v3.4s
; CHECK-NEXT: cmeq v1.4s, v1.4s, #0		; CHECK-NEXT: fmov w9, s2
; CHECK-NEXT: fmov w11, s0		; CHECK-NEXT: cmtst v1.4s, v1.4s, v1.4s
; CHECK-NEXT: cmtst v2.4s, v2.4s, v2.4s
; CHECK-NEXT: sturh w8, [x0, #9]		; CHECK-NEXT: sturh w8, [x0, #9]
; CHECK-NEXT: lsr w8, w8, #16		; CHECK-NEXT: lsr w8, w8, #16
; CHECK-NEXT: strh w9, [x0, #6]		; CHECK-NEXT: strh w10, [x0, #6]
; CHECK-NEXT: lsr w9, w9, #16		; CHECK-NEXT: lsr w10, w10, #16
; CHECK-NEXT: sturh w10, [x0, #3]		; CHECK-NEXT: cmeq v0.4s, v0.4s, #0
; CHECK-NEXT: orn v0.16b, v2.16b, v1.16b		; CHECK-NEXT: sturh w11, [x0, #3]
		; CHECK-NEXT: lsr w11, w11, #16
; CHECK-NEXT: strb w8, [x0, #11]		; CHECK-NEXT: strb w8, [x0, #11]
; CHECK-NEXT: lsr w8, w10, #16		; CHECK-NEXT: lsr w8, w9, #16
; CHECK-NEXT: lsr w10, w11, #16		; CHECK-NEXT: strh w9, [x0]
; CHECK-NEXT: strh w11, [x0]		; CHECK-NEXT: orn v0.16b, v1.16b, v0.16b
; CHECK-NEXT: strb w9, [x0, #8]		; CHECK-NEXT: strb w10, [x0, #8]
; CHECK-NEXT: strb w8, [x0, #5]		; CHECK-NEXT: strb w11, [x0, #5]
; CHECK-NEXT: strb w10, [x0, #2]		; CHECK-NEXT: strb w8, [x0, #2]
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%t = call {<4 x i24>, <4 x i1>} @llvm.umul.with.overflow.v4i24(<4 x i24> %a0, <4 x i24> %a1)		%t = call {<4 x i24>, <4 x i1>} @llvm.umul.with.overflow.v4i24(<4 x i24> %a0, <4 x i24> %a1)
%val = extractvalue {<4 x i24>, <4 x i1>} %t, 0		%val = extractvalue {<4 x i24>, <4 x i1>} %t, 0
%obit = extractvalue {<4 x i24>, <4 x i1>} %t, 1		%obit = extractvalue {<4 x i24>, <4 x i1>} %t, 1
%res = sext <4 x i1> %obit to <4 x i32>		%res = sext <4 x i1> %obit to <4 x i32>
store <4 x i24> %val, <4 x i24>* %p2		store <4 x i24> %val, <4 x i24>* %p2
ret <4 x i32> %res		ret <4 x i32> %res
}		}
▲ Show 20 Lines • Show All 81 Lines • Show Last 20 Lines

llvm/test/CodeGen/AArch64/vecreduce-add.ll

Show First 20 Lines • Show All 401 Lines • ▼ Show 20 Lines	entry:
ret i8 %z		ret i8 %z
}		}

define i64 @add_v16i8_v16i64_zext(<16 x i8> %x) {		define i64 @add_v16i8_v16i64_zext(<16 x i8> %x) {
; CHECK-LABEL: add_v16i8_v16i64_zext:		; CHECK-LABEL: add_v16i8_v16i64_zext:
; CHECK: // %bb.0: // %entry		; CHECK: // %bb.0: // %entry
; CHECK-NEXT: ushll2 v1.8h, v0.16b, #0		; CHECK-NEXT: ushll2 v1.8h, v0.16b, #0
; CHECK-NEXT: ushll v0.8h, v0.8b, #0		; CHECK-NEXT: ushll v0.8h, v0.8b, #0
; CHECK-NEXT: ushll2 v2.4s, v1.8h, #0		; CHECK-NEXT: ushll v2.4s, v1.4h, #0
; CHECK-NEXT: ushll v1.4s, v1.4h, #0		; CHECK-NEXT: ushll2 v1.4s, v1.8h, #0
; CHECK-NEXT: ushll2 v3.4s, v0.8h, #0		; CHECK-NEXT: ushll2 v3.4s, v0.8h, #0
; CHECK-NEXT: ushll v0.4s, v0.4h, #0		; CHECK-NEXT: ushll v0.4s, v0.4h, #0
; CHECK-NEXT: uaddl2 v4.2d, v3.4s, v2.4s		; CHECK-NEXT: uaddl2 v4.2d, v3.4s, v1.4s
; CHECK-NEXT: uaddl2 v5.2d, v0.4s, v1.4s		; CHECK-NEXT: uaddl2 v5.2d, v0.4s, v2.4s
; CHECK-NEXT: uaddl v2.2d, v3.2s, v2.2s		; CHECK-NEXT: uaddl v1.2d, v3.2s, v1.2s
; CHECK-NEXT: uaddl v0.2d, v0.2s, v1.2s		; CHECK-NEXT: uaddl v0.2d, v0.2s, v2.2s
; CHECK-NEXT: add v1.2d, v5.2d, v4.2d		; CHECK-NEXT: add v2.2d, v5.2d, v4.2d
; CHECK-NEXT: add v0.2d, v0.2d, v2.2d
; CHECK-NEXT: add v0.2d, v0.2d, v1.2d		; CHECK-NEXT: add v0.2d, v0.2d, v1.2d
		; CHECK-NEXT: add v0.2d, v0.2d, v2.2d
; CHECK-NEXT: addp d0, v0.2d		; CHECK-NEXT: addp d0, v0.2d
; CHECK-NEXT: fmov x0, d0		; CHECK-NEXT: fmov x0, d0
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%xx = zext <16 x i8> %x to <16 x i64>		%xx = zext <16 x i8> %x to <16 x i64>
%z = call i64 @llvm.vector.reduce.add.v16i64(<16 x i64> %xx)		%z = call i64 @llvm.vector.reduce.add.v16i64(<16 x i64> %xx)
ret i64 %z		ret i64 %z
}		}

define i64 @add_v16i8_v16i64_sext(<16 x i8> %x) {		define i64 @add_v16i8_v16i64_sext(<16 x i8> %x) {
; CHECK-LABEL: add_v16i8_v16i64_sext:		; CHECK-LABEL: add_v16i8_v16i64_sext:
; CHECK: // %bb.0: // %entry		; CHECK: // %bb.0: // %entry
; CHECK-NEXT: sshll2 v1.8h, v0.16b, #0		; CHECK-NEXT: sshll2 v1.8h, v0.16b, #0
; CHECK-NEXT: sshll v0.8h, v0.8b, #0		; CHECK-NEXT: sshll v0.8h, v0.8b, #0
; CHECK-NEXT: sshll2 v2.4s, v1.8h, #0		; CHECK-NEXT: sshll v2.4s, v1.4h, #0
; CHECK-NEXT: sshll v1.4s, v1.4h, #0		; CHECK-NEXT: sshll2 v1.4s, v1.8h, #0
; CHECK-NEXT: sshll2 v3.4s, v0.8h, #0		; CHECK-NEXT: sshll2 v3.4s, v0.8h, #0
; CHECK-NEXT: sshll v0.4s, v0.4h, #0		; CHECK-NEXT: sshll v0.4s, v0.4h, #0
; CHECK-NEXT: saddl2 v4.2d, v3.4s, v2.4s		; CHECK-NEXT: saddl2 v4.2d, v3.4s, v1.4s
; CHECK-NEXT: saddl2 v5.2d, v0.4s, v1.4s		; CHECK-NEXT: saddl2 v5.2d, v0.4s, v2.4s
; CHECK-NEXT: saddl v2.2d, v3.2s, v2.2s		; CHECK-NEXT: saddl v1.2d, v3.2s, v1.2s
; CHECK-NEXT: saddl v0.2d, v0.2s, v1.2s		; CHECK-NEXT: saddl v0.2d, v0.2s, v2.2s
; CHECK-NEXT: add v1.2d, v5.2d, v4.2d		; CHECK-NEXT: add v2.2d, v5.2d, v4.2d
; CHECK-NEXT: add v0.2d, v0.2d, v2.2d
; CHECK-NEXT: add v0.2d, v0.2d, v1.2d		; CHECK-NEXT: add v0.2d, v0.2d, v1.2d
		; CHECK-NEXT: add v0.2d, v0.2d, v2.2d
; CHECK-NEXT: addp d0, v0.2d		; CHECK-NEXT: addp d0, v0.2d
; CHECK-NEXT: fmov x0, d0		; CHECK-NEXT: fmov x0, d0
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%xx = sext <16 x i8> %x to <16 x i64>		%xx = sext <16 x i8> %x to <16 x i64>
%z = call i64 @llvm.vector.reduce.add.v16i64(<16 x i64> %xx)		%z = call i64 @llvm.vector.reduce.add.v16i64(<16 x i64> %xx)
ret i64 %z		ret i64 %z
}		}
▲ Show 20 Lines • Show All 570 Lines • ▼ Show 20 Lines	entry:
ret i8 %r		ret i8 %r
}		}

define i64 @add_v16i8_v16i64_acc_zext(<16 x i8> %x, i64 %a) {		define i64 @add_v16i8_v16i64_acc_zext(<16 x i8> %x, i64 %a) {
; CHECK-LABEL: add_v16i8_v16i64_acc_zext:		; CHECK-LABEL: add_v16i8_v16i64_acc_zext:
; CHECK: // %bb.0: // %entry		; CHECK: // %bb.0: // %entry
; CHECK-NEXT: ushll2 v1.8h, v0.16b, #0		; CHECK-NEXT: ushll2 v1.8h, v0.16b, #0
; CHECK-NEXT: ushll v0.8h, v0.8b, #0		; CHECK-NEXT: ushll v0.8h, v0.8b, #0
; CHECK-NEXT: ushll2 v2.4s, v1.8h, #0		; CHECK-NEXT: ushll v2.4s, v1.4h, #0
; CHECK-NEXT: ushll v1.4s, v1.4h, #0		; CHECK-NEXT: ushll2 v1.4s, v1.8h, #0
; CHECK-NEXT: ushll2 v3.4s, v0.8h, #0		; CHECK-NEXT: ushll2 v3.4s, v0.8h, #0
; CHECK-NEXT: ushll v0.4s, v0.4h, #0		; CHECK-NEXT: ushll v0.4s, v0.4h, #0
; CHECK-NEXT: uaddl2 v4.2d, v3.4s, v2.4s		; CHECK-NEXT: uaddl2 v4.2d, v3.4s, v1.4s
; CHECK-NEXT: uaddl2 v5.2d, v0.4s, v1.4s		; CHECK-NEXT: uaddl2 v5.2d, v0.4s, v2.4s
; CHECK-NEXT: uaddl v2.2d, v3.2s, v2.2s		; CHECK-NEXT: uaddl v1.2d, v3.2s, v1.2s
; CHECK-NEXT: uaddl v0.2d, v0.2s, v1.2s		; CHECK-NEXT: uaddl v0.2d, v0.2s, v2.2s
; CHECK-NEXT: add v1.2d, v5.2d, v4.2d		; CHECK-NEXT: add v2.2d, v5.2d, v4.2d
; CHECK-NEXT: add v0.2d, v0.2d, v2.2d
; CHECK-NEXT: add v0.2d, v0.2d, v1.2d		; CHECK-NEXT: add v0.2d, v0.2d, v1.2d
		; CHECK-NEXT: add v0.2d, v0.2d, v2.2d
; CHECK-NEXT: addp d0, v0.2d		; CHECK-NEXT: addp d0, v0.2d
; CHECK-NEXT: fmov x8, d0		; CHECK-NEXT: fmov x8, d0
; CHECK-NEXT: add x0, x8, x0		; CHECK-NEXT: add x0, x8, x0
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%xx = zext <16 x i8> %x to <16 x i64>		%xx = zext <16 x i8> %x to <16 x i64>
%z = call i64 @llvm.vector.reduce.add.v16i64(<16 x i64> %xx)		%z = call i64 @llvm.vector.reduce.add.v16i64(<16 x i64> %xx)
%r = add i64 %z, %a		%r = add i64 %z, %a
ret i64 %r		ret i64 %r
}		}

define i64 @add_v16i8_v16i64_acc_sext(<16 x i8> %x, i64 %a) {		define i64 @add_v16i8_v16i64_acc_sext(<16 x i8> %x, i64 %a) {
; CHECK-LABEL: add_v16i8_v16i64_acc_sext:		; CHECK-LABEL: add_v16i8_v16i64_acc_sext:
; CHECK: // %bb.0: // %entry		; CHECK: // %bb.0: // %entry
; CHECK-NEXT: sshll2 v1.8h, v0.16b, #0		; CHECK-NEXT: sshll2 v1.8h, v0.16b, #0
; CHECK-NEXT: sshll v0.8h, v0.8b, #0		; CHECK-NEXT: sshll v0.8h, v0.8b, #0
; CHECK-NEXT: sshll2 v2.4s, v1.8h, #0		; CHECK-NEXT: sshll v2.4s, v1.4h, #0
; CHECK-NEXT: sshll v1.4s, v1.4h, #0		; CHECK-NEXT: sshll2 v1.4s, v1.8h, #0
; CHECK-NEXT: sshll2 v3.4s, v0.8h, #0		; CHECK-NEXT: sshll2 v3.4s, v0.8h, #0
; CHECK-NEXT: sshll v0.4s, v0.4h, #0		; CHECK-NEXT: sshll v0.4s, v0.4h, #0
; CHECK-NEXT: saddl2 v4.2d, v3.4s, v2.4s		; CHECK-NEXT: saddl2 v4.2d, v3.4s, v1.4s
; CHECK-NEXT: saddl2 v5.2d, v0.4s, v1.4s		; CHECK-NEXT: saddl2 v5.2d, v0.4s, v2.4s
; CHECK-NEXT: saddl v2.2d, v3.2s, v2.2s		; CHECK-NEXT: saddl v1.2d, v3.2s, v1.2s
; CHECK-NEXT: saddl v0.2d, v0.2s, v1.2s		; CHECK-NEXT: saddl v0.2d, v0.2s, v2.2s
; CHECK-NEXT: add v1.2d, v5.2d, v4.2d		; CHECK-NEXT: add v2.2d, v5.2d, v4.2d
; CHECK-NEXT: add v0.2d, v0.2d, v2.2d
; CHECK-NEXT: add v0.2d, v0.2d, v1.2d		; CHECK-NEXT: add v0.2d, v0.2d, v1.2d
		; CHECK-NEXT: add v0.2d, v0.2d, v2.2d
; CHECK-NEXT: addp d0, v0.2d		; CHECK-NEXT: addp d0, v0.2d
; CHECK-NEXT: fmov x8, d0		; CHECK-NEXT: fmov x8, d0
; CHECK-NEXT: add x0, x8, x0		; CHECK-NEXT: add x0, x8, x0
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%xx = sext <16 x i8> %x to <16 x i64>		%xx = sext <16 x i8> %x to <16 x i64>
%z = call i64 @llvm.vector.reduce.add.v16i64(<16 x i64> %xx)		%z = call i64 @llvm.vector.reduce.add.v16i64(<16 x i64> %xx)
%r = add i64 %z, %a		%r = add i64 %z, %a
▲ Show 20 Lines • Show All 683 Lines • ▼ Show 20 Lines	entry:
ret i8 %z		ret i8 %z
}		}

define i64 @add_pair_v16i8_v16i64_zext(<16 x i8> %x, <16 x i8> %y) {		define i64 @add_pair_v16i8_v16i64_zext(<16 x i8> %x, <16 x i8> %y) {
; CHECK-LABEL: add_pair_v16i8_v16i64_zext:		; CHECK-LABEL: add_pair_v16i8_v16i64_zext:
; CHECK: // %bb.0: // %entry		; CHECK: // %bb.0: // %entry
; CHECK-NEXT: ushll2 v2.8h, v0.16b, #0		; CHECK-NEXT: ushll2 v2.8h, v0.16b, #0
; CHECK-NEXT: ushll v0.8h, v0.8b, #0		; CHECK-NEXT: ushll v0.8h, v0.8b, #0
; CHECK-NEXT: ushll2 v3.8h, v1.16b, #0		; CHECK-NEXT: ushll v3.4s, v2.4h, #0
		; CHECK-NEXT: ushll2 v2.4s, v2.8h, #0
		; CHECK-NEXT: ushll2 v4.4s, v0.8h, #0
		; CHECK-NEXT: ushll v0.4s, v0.4h, #0
		; CHECK-NEXT: uaddl2 v5.2d, v4.4s, v2.4s
		; CHECK-NEXT: uaddl2 v6.2d, v0.4s, v3.4s
		; CHECK-NEXT: ushll2 v7.8h, v1.16b, #0
; CHECK-NEXT: ushll v1.8h, v1.8b, #0		; CHECK-NEXT: ushll v1.8h, v1.8b, #0
; CHECK-NEXT: ushll2 v4.4s, v2.8h, #0		; CHECK-NEXT: uaddl v2.2d, v4.2s, v2.2s
; CHECK-NEXT: ushll v2.4s, v2.4h, #0		; CHECK-NEXT: add v4.2d, v6.2d, v5.2d
; CHECK-NEXT: ushll2 v5.4s, v0.8h, #0		; CHECK-NEXT: uaddl v0.2d, v0.2s, v3.2s
; CHECK-NEXT: ushll v0.4s, v0.4h, #0		; CHECK-NEXT: ushll v3.4s, v7.4h, #0
; CHECK-NEXT: ushll v6.4s, v3.4h, #0		; CHECK-NEXT: ushll2 v5.4s, v7.8h, #0
; CHECK-NEXT: ushll v7.4s, v1.4h, #0		; CHECK-NEXT: ushll2 v6.4s, v1.8h, #0
; CHECK-NEXT: ushll2 v3.4s, v3.8h, #0		; CHECK-NEXT: ushll v1.4s, v1.4h, #0
; CHECK-NEXT: ushll2 v1.4s, v1.8h, #0		; CHECK-NEXT: uaddl2 v7.2d, v6.4s, v5.4s
; CHECK-NEXT: uaddl2 v16.2d, v5.4s, v4.4s		; CHECK-NEXT: uaddl v5.2d, v6.2s, v5.2s
; CHECK-NEXT: uaddl v4.2d, v5.2s, v4.2s		; CHECK-NEXT: uaddl2 v6.2d, v1.4s, v3.4s
; CHECK-NEXT: uaddl2 v5.2d, v0.4s, v2.4s
; CHECK-NEXT: uaddl v0.2d, v0.2s, v2.2s
; CHECK-NEXT: uaddl2 v2.2d, v1.4s, v3.4s
; CHECK-NEXT: uaddl v1.2d, v1.2s, v3.2s		; CHECK-NEXT: uaddl v1.2d, v1.2s, v3.2s
; CHECK-NEXT: uaddl2 v3.2d, v7.4s, v6.4s		; CHECK-NEXT: add v0.2d, v0.2d, v2.2d
; CHECK-NEXT: uaddl v6.2d, v7.2s, v6.2s		; CHECK-NEXT: add v2.2d, v6.2d, v7.2d
; CHECK-NEXT: add v5.2d, v5.2d, v16.2d		; CHECK-NEXT: add v1.2d, v1.2d, v5.2d
; CHECK-NEXT: add v0.2d, v0.2d, v4.2d		; CHECK-NEXT: add v0.2d, v0.2d, v4.2d
; CHECK-NEXT: add v2.2d, v3.2d, v2.2d
; CHECK-NEXT: add v1.2d, v6.2d, v1.2d
; CHECK-NEXT: add v0.2d, v0.2d, v5.2d
; CHECK-NEXT: add v1.2d, v1.2d, v2.2d		; CHECK-NEXT: add v1.2d, v1.2d, v2.2d
; CHECK-NEXT: add v0.2d, v0.2d, v1.2d		; CHECK-NEXT: add v0.2d, v0.2d, v1.2d
; CHECK-NEXT: addp d0, v0.2d		; CHECK-NEXT: addp d0, v0.2d
; CHECK-NEXT: fmov x0, d0		; CHECK-NEXT: fmov x0, d0
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%xx = zext <16 x i8> %x to <16 x i64>		%xx = zext <16 x i8> %x to <16 x i64>
%z1 = call i64 @llvm.vector.reduce.add.v16i64(<16 x i64> %xx)		%z1 = call i64 @llvm.vector.reduce.add.v16i64(<16 x i64> %xx)
%yy = zext <16 x i8> %y to <16 x i64>		%yy = zext <16 x i8> %y to <16 x i64>
%z2 = call i64 @llvm.vector.reduce.add.v16i64(<16 x i64> %yy)		%z2 = call i64 @llvm.vector.reduce.add.v16i64(<16 x i64> %yy)
%z = add i64 %z1, %z2		%z = add i64 %z1, %z2
ret i64 %z		ret i64 %z
}		}

define i64 @add_pair_v16i8_v16i64_sext(<16 x i8> %x, <16 x i8> %y) {		define i64 @add_pair_v16i8_v16i64_sext(<16 x i8> %x, <16 x i8> %y) {
; CHECK-LABEL: add_pair_v16i8_v16i64_sext:		; CHECK-LABEL: add_pair_v16i8_v16i64_sext:
; CHECK: // %bb.0: // %entry		; CHECK: // %bb.0: // %entry
; CHECK-NEXT: sshll2 v2.8h, v0.16b, #0		; CHECK-NEXT: sshll2 v2.8h, v0.16b, #0
; CHECK-NEXT: sshll v0.8h, v0.8b, #0		; CHECK-NEXT: sshll v0.8h, v0.8b, #0
; CHECK-NEXT: sshll2 v3.8h, v1.16b, #0		; CHECK-NEXT: sshll v3.4s, v2.4h, #0
; CHECK-NEXT: sshll v1.8h, v1.8b, #0		; CHECK-NEXT: sshll2 v2.4s, v2.8h, #0
; CHECK-NEXT: sshll2 v4.4s, v2.8h, #0		; CHECK-NEXT: sshll2 v4.4s, v0.8h, #0
; CHECK-NEXT: sshll v2.4s, v2.4h, #0
; CHECK-NEXT: sshll2 v5.4s, v0.8h, #0
; CHECK-NEXT: sshll v0.4s, v0.4h, #0		; CHECK-NEXT: sshll v0.4s, v0.4h, #0
; CHECK-NEXT: sshll v6.4s, v3.4h, #0		; CHECK-NEXT: saddl2 v5.2d, v4.4s, v2.4s
; CHECK-NEXT: sshll v7.4s, v1.4h, #0		; CHECK-NEXT: saddl2 v6.2d, v0.4s, v3.4s
; CHECK-NEXT: sshll2 v3.4s, v3.8h, #0		; CHECK-NEXT: sshll2 v7.8h, v1.16b, #0
; CHECK-NEXT: sshll2 v1.4s, v1.8h, #0		; CHECK-NEXT: sshll v1.8h, v1.8b, #0
; CHECK-NEXT: saddl2 v16.2d, v5.4s, v4.4s		; CHECK-NEXT: saddl v2.2d, v4.2s, v2.2s
; CHECK-NEXT: saddl v4.2d, v5.2s, v4.2s		; CHECK-NEXT: add v4.2d, v6.2d, v5.2d
; CHECK-NEXT: saddl2 v5.2d, v0.4s, v2.4s		; CHECK-NEXT: saddl v0.2d, v0.2s, v3.2s
; CHECK-NEXT: saddl v0.2d, v0.2s, v2.2s		; CHECK-NEXT: sshll v3.4s, v7.4h, #0
; CHECK-NEXT: saddl2 v2.2d, v1.4s, v3.4s		; CHECK-NEXT: sshll2 v5.4s, v7.8h, #0
		; CHECK-NEXT: sshll2 v6.4s, v1.8h, #0
		; CHECK-NEXT: sshll v1.4s, v1.4h, #0
		; CHECK-NEXT: saddl2 v7.2d, v6.4s, v5.4s
		; CHECK-NEXT: saddl v5.2d, v6.2s, v5.2s
		; CHECK-NEXT: saddl2 v6.2d, v1.4s, v3.4s
; CHECK-NEXT: saddl v1.2d, v1.2s, v3.2s		; CHECK-NEXT: saddl v1.2d, v1.2s, v3.2s
; CHECK-NEXT: saddl2 v3.2d, v7.4s, v6.4s		; CHECK-NEXT: add v0.2d, v0.2d, v2.2d
; CHECK-NEXT: saddl v6.2d, v7.2s, v6.2s		; CHECK-NEXT: add v2.2d, v6.2d, v7.2d
; CHECK-NEXT: add v5.2d, v5.2d, v16.2d		; CHECK-NEXT: add v1.2d, v1.2d, v5.2d
; CHECK-NEXT: add v0.2d, v0.2d, v4.2d		; CHECK-NEXT: add v0.2d, v0.2d, v4.2d
; CHECK-NEXT: add v2.2d, v3.2d, v2.2d
; CHECK-NEXT: add v1.2d, v6.2d, v1.2d
; CHECK-NEXT: add v0.2d, v0.2d, v5.2d
; CHECK-NEXT: add v1.2d, v1.2d, v2.2d		; CHECK-NEXT: add v1.2d, v1.2d, v2.2d
; CHECK-NEXT: add v0.2d, v0.2d, v1.2d		; CHECK-NEXT: add v0.2d, v0.2d, v1.2d
; CHECK-NEXT: addp d0, v0.2d		; CHECK-NEXT: addp d0, v0.2d
; CHECK-NEXT: fmov x0, d0		; CHECK-NEXT: fmov x0, d0
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%xx = sext <16 x i8> %x to <16 x i64>		%xx = sext <16 x i8> %x to <16 x i64>
%z1 = call i64 @llvm.vector.reduce.add.v16i64(<16 x i64> %xx)		%z1 = call i64 @llvm.vector.reduce.add.v16i64(<16 x i64> %xx)
▲ Show 20 Lines • Show All 78 Lines • ▼ Show 20 Lines	entry:
%z2 = call i64 @llvm.vector.reduce.add.v4i64(<4 x i64> %yy)		%z2 = call i64 @llvm.vector.reduce.add.v4i64(<4 x i64> %yy)
%z = add i64 %z1, %z2		%z = add i64 %z1, %z2
ret i64 %z		ret i64 %z
}		}

define i64 @add_pair_v4i8_v4i64_sext(<4 x i8> %x, <4 x i8> %y) {		define i64 @add_pair_v4i8_v4i64_sext(<4 x i8> %x, <4 x i8> %y) {
; CHECK-LABEL: add_pair_v4i8_v4i64_sext:		; CHECK-LABEL: add_pair_v4i8_v4i64_sext:
; CHECK: // %bb.0: // %entry		; CHECK: // %bb.0: // %entry
; CHECK-NEXT: ushll v0.4s, v0.4h, #0
; CHECK-NEXT: ushll v1.4s, v1.4h, #0		; CHECK-NEXT: ushll v1.4s, v1.4h, #0
; CHECK-NEXT: ushll v2.2d, v0.2s, #0		; CHECK-NEXT: ushll v0.4s, v0.4h, #0
; CHECK-NEXT: ushll v3.2d, v1.2s, #0		; CHECK-NEXT: ushll v2.2d, v1.2s, #0
; CHECK-NEXT: ushll2 v0.2d, v0.4s, #0		; CHECK-NEXT: ushll v3.2d, v0.2s, #0
; CHECK-NEXT: ushll2 v1.2d, v1.4s, #0		; CHECK-NEXT: ushll2 v1.2d, v1.4s, #0
; CHECK-NEXT: shl v2.2d, v2.2d, #56		; CHECK-NEXT: ushll2 v0.2d, v0.4s, #0
; CHECK-NEXT: shl v3.2d, v3.2d, #56		; CHECK-NEXT: shl v3.2d, v3.2d, #56
		; CHECK-NEXT: shl v2.2d, v2.2d, #56
; CHECK-NEXT: shl v0.2d, v0.2d, #56		; CHECK-NEXT: shl v0.2d, v0.2d, #56
		; CHECK-NEXT: sshr v3.2d, v3.2d, #56
; CHECK-NEXT: shl v1.2d, v1.2d, #56		; CHECK-NEXT: shl v1.2d, v1.2d, #56
; CHECK-NEXT: sshr v2.2d, v2.2d, #56		; CHECK-NEXT: sshr v2.2d, v2.2d, #56
; CHECK-NEXT: sshr v3.2d, v3.2d, #56		; CHECK-NEXT: ssra v3.2d, v0.2d, #56
; CHECK-NEXT: ssra v2.2d, v0.2d, #56		; CHECK-NEXT: ssra v2.2d, v1.2d, #56
; CHECK-NEXT: ssra v3.2d, v1.2d, #56		; CHECK-NEXT: add v0.2d, v3.2d, v2.2d
; CHECK-NEXT: add v0.2d, v2.2d, v3.2d
; CHECK-NEXT: addp d0, v0.2d		; CHECK-NEXT: addp d0, v0.2d
; CHECK-NEXT: fmov x0, d0		; CHECK-NEXT: fmov x0, d0
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%xx = sext <4 x i8> %x to <4 x i64>		%xx = sext <4 x i8> %x to <4 x i64>
%z1 = call i64 @llvm.vector.reduce.add.v4i64(<4 x i64> %xx)		%z1 = call i64 @llvm.vector.reduce.add.v4i64(<4 x i64> %xx)
%yy = sext <4 x i8> %y to <4 x i64>		%yy = sext <4 x i8> %y to <4 x i64>
%z2 = call i64 @llvm.vector.reduce.add.v4i64(<4 x i64> %yy)		%z2 = call i64 @llvm.vector.reduce.add.v4i64(<4 x i64> %yy)
▲ Show 20 Lines • Show All 68 Lines • Show Last 20 Lines

llvm/test/CodeGen/AArch64/vecreduce-and-legalization.ll

Show First 20 Lines • Show All 90 Lines • ▼ Show 20 Lines
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%b = call i8 @llvm.vector.reduce.and.v3i8(<3 x i8> %a)		%b = call i8 @llvm.vector.reduce.and.v3i8(<3 x i8> %a)
ret i8 %b		ret i8 %b
}		}

define i8 @test_v9i8(<9 x i8> %a) nounwind {		define i8 @test_v9i8(<9 x i8> %a) nounwind {
; CHECK-LABEL: test_v9i8:		; CHECK-LABEL: test_v9i8:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: mov v1.16b, v0.16b
; CHECK-NEXT: mov w8, #-1		; CHECK-NEXT: mov w8, #-1
; CHECK-NEXT: umov w12, v0.b[4]		; CHECK-NEXT: umov w12, v0.b[4]
		; CHECK-NEXT: mov v1.16b, v0.16b
; CHECK-NEXT: mov v1.b[9], w8		; CHECK-NEXT: mov v1.b[9], w8
; CHECK-NEXT: mov v1.b[10], w8		; CHECK-NEXT: mov v1.b[10], w8
; CHECK-NEXT: mov v1.b[11], w8		; CHECK-NEXT: mov v1.b[11], w8
; CHECK-NEXT: mov v1.b[13], w8		; CHECK-NEXT: mov v1.b[13], w8
; CHECK-NEXT: ext v1.16b, v1.16b, v1.16b, #8		; CHECK-NEXT: ext v1.16b, v1.16b, v1.16b, #8
; CHECK-NEXT: and v1.8b, v0.8b, v1.8b		; CHECK-NEXT: and v1.8b, v0.8b, v1.8b
; CHECK-NEXT: umov w8, v1.b[1]		; CHECK-NEXT: umov w8, v1.b[1]
; CHECK-NEXT: umov w9, v1.b[0]		; CHECK-NEXT: umov w9, v1.b[0]
Show All 14 Lines	; CHECK-NEXT: ret
ret i8 %b		ret i8 %b
}		}

define i32 @test_v3i32(<3 x i32> %a) nounwind {		define i32 @test_v3i32(<3 x i32> %a) nounwind {
; CHECK-LABEL: test_v3i32:		; CHECK-LABEL: test_v3i32:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: ext v1.16b, v0.16b, v0.16b, #8		; CHECK-NEXT: ext v1.16b, v0.16b, v0.16b, #8
; CHECK-NEXT: mov w8, v0.s[1]		; CHECK-NEXT: mov w8, v0.s[1]
; CHECK-NEXT: and v1.8b, v0.8b, v1.8b		; CHECK-NEXT: and v0.8b, v0.8b, v1.8b
; CHECK-NEXT: fmov w9, s1		; CHECK-NEXT: fmov w9, s0
; CHECK-NEXT: and w0, w9, w8		; CHECK-NEXT: and w0, w9, w8
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%b = call i32 @llvm.vector.reduce.and.v3i32(<3 x i32> %a)		%b = call i32 @llvm.vector.reduce.and.v3i32(<3 x i32> %a)
ret i32 %b		ret i32 %b
}		}

define i1 @test_v4i1(<4 x i1> %a) nounwind {		define i1 @test_v4i1(<4 x i1> %a) nounwind {
; CHECK-LABEL: test_v4i1:		; CHECK-LABEL: test_v4i1:
▲ Show 20 Lines • Show All 53 Lines • Show Last 20 Lines

llvm/test/CodeGen/AArch64/vecreduce-fmax-legalization.ll

	Show First 20 Lines • Show All 296 Lines • ▼ Show 20 Lines
	; CHECK-FP-NEXT: // kill: def $h3 killed $h3 def $q3			; CHECK-FP-NEXT: // kill: def $h3 killed $h3 def $q3
	; CHECK-FP-NEXT: // kill: def $h4 killed $h4 def $q4			; CHECK-FP-NEXT: // kill: def $h4 killed $h4 def $q4
	; CHECK-FP-NEXT: mov x8, sp			; CHECK-FP-NEXT: mov x8, sp
	; CHECK-FP-NEXT: // kill: def $h5 killed $h5 def $q5			; CHECK-FP-NEXT: // kill: def $h5 killed $h5 def $q5
	; CHECK-FP-NEXT: // kill: def $h6 killed $h6 def $q6			; CHECK-FP-NEXT: // kill: def $h6 killed $h6 def $q6
	; CHECK-FP-NEXT: // kill: def $h7 killed $h7 def $q7			; CHECK-FP-NEXT: // kill: def $h7 killed $h7 def $q7
	; CHECK-FP-NEXT: mov v0.h[1], v1.h[0]			; CHECK-FP-NEXT: mov v0.h[1], v1.h[0]
	; CHECK-FP-NEXT: mvni v1.8h, #4, lsl #8			; CHECK-FP-NEXT: mvni v1.8h, #4, lsl #8
	; CHECK-FP-NEXT: mov v0.h[2], v2.h[0]
	; CHECK-FP-NEXT: ld1 { v1.h }[0], [x8]			; CHECK-FP-NEXT: ld1 { v1.h }[0], [x8]
	; CHECK-FP-NEXT: add x8, sp, #8			; CHECK-FP-NEXT: add x8, sp, #8
	; CHECK-FP-NEXT: mov v0.h[3], v3.h[0]			; CHECK-FP-NEXT: mov v0.h[2], v2.h[0]
	; CHECK-FP-NEXT: ld1 { v1.h }[1], [x8]			; CHECK-FP-NEXT: ld1 { v1.h }[1], [x8]
	; CHECK-FP-NEXT: add x8, sp, #16			; CHECK-FP-NEXT: add x8, sp, #16
	; CHECK-FP-NEXT: mov v0.h[4], v4.h[0]			; CHECK-FP-NEXT: mov v0.h[3], v3.h[0]
	; CHECK-FP-NEXT: ld1 { v1.h }[2], [x8]			; CHECK-FP-NEXT: ld1 { v1.h }[2], [x8]
				; CHECK-FP-NEXT: mov v0.h[4], v4.h[0]
	; CHECK-FP-NEXT: mov v0.h[5], v5.h[0]			; CHECK-FP-NEXT: mov v0.h[5], v5.h[0]
	; CHECK-FP-NEXT: mov v0.h[6], v6.h[0]			; CHECK-FP-NEXT: mov v0.h[6], v6.h[0]
	; CHECK-FP-NEXT: mov v0.h[7], v7.h[0]			; CHECK-FP-NEXT: mov v0.h[7], v7.h[0]
	; CHECK-FP-NEXT: fmaxnm v0.8h, v0.8h, v1.8h			; CHECK-FP-NEXT: fmaxnm v0.8h, v0.8h, v1.8h
	; CHECK-FP-NEXT: fmaxnmv h0, v0.8h			; CHECK-FP-NEXT: fmaxnmv h0, v0.8h
	; CHECK-FP-NEXT: ret			; CHECK-FP-NEXT: ret
	%b = call nnan ninf half @llvm.vector.reduce.fmax.v11f16(<11 x half> %a)			%b = call nnan ninf half @llvm.vector.reduce.fmax.v11f16(<11 x half> %a)
	ret half %b			ret half %b
	▲ Show 20 Lines • Show All 45 Lines • Show Last 20 Lines

llvm/test/CodeGen/AArch64/vecreduce-fmin-legalization.ll

	Show First 20 Lines • Show All 296 Lines • ▼ Show 20 Lines
	; CHECK-FP-NEXT: // kill: def $h3 killed $h3 def $q3			; CHECK-FP-NEXT: // kill: def $h3 killed $h3 def $q3
	; CHECK-FP-NEXT: // kill: def $h4 killed $h4 def $q4			; CHECK-FP-NEXT: // kill: def $h4 killed $h4 def $q4
	; CHECK-FP-NEXT: mov x8, sp			; CHECK-FP-NEXT: mov x8, sp
	; CHECK-FP-NEXT: // kill: def $h5 killed $h5 def $q5			; CHECK-FP-NEXT: // kill: def $h5 killed $h5 def $q5
	; CHECK-FP-NEXT: // kill: def $h6 killed $h6 def $q6			; CHECK-FP-NEXT: // kill: def $h6 killed $h6 def $q6
	; CHECK-FP-NEXT: // kill: def $h7 killed $h7 def $q7			; CHECK-FP-NEXT: // kill: def $h7 killed $h7 def $q7
	; CHECK-FP-NEXT: mov v0.h[1], v1.h[0]			; CHECK-FP-NEXT: mov v0.h[1], v1.h[0]
	; CHECK-FP-NEXT: mvni v1.8h, #132, lsl #8			; CHECK-FP-NEXT: mvni v1.8h, #132, lsl #8
	; CHECK-FP-NEXT: mov v0.h[2], v2.h[0]
	; CHECK-FP-NEXT: ld1 { v1.h }[0], [x8]			; CHECK-FP-NEXT: ld1 { v1.h }[0], [x8]
	; CHECK-FP-NEXT: add x8, sp, #8			; CHECK-FP-NEXT: add x8, sp, #8
	; CHECK-FP-NEXT: mov v0.h[3], v3.h[0]			; CHECK-FP-NEXT: mov v0.h[2], v2.h[0]
	; CHECK-FP-NEXT: ld1 { v1.h }[1], [x8]			; CHECK-FP-NEXT: ld1 { v1.h }[1], [x8]
	; CHECK-FP-NEXT: add x8, sp, #16			; CHECK-FP-NEXT: add x8, sp, #16
	; CHECK-FP-NEXT: mov v0.h[4], v4.h[0]			; CHECK-FP-NEXT: mov v0.h[3], v3.h[0]
	; CHECK-FP-NEXT: ld1 { v1.h }[2], [x8]			; CHECK-FP-NEXT: ld1 { v1.h }[2], [x8]
				; CHECK-FP-NEXT: mov v0.h[4], v4.h[0]
	; CHECK-FP-NEXT: mov v0.h[5], v5.h[0]			; CHECK-FP-NEXT: mov v0.h[5], v5.h[0]
	; CHECK-FP-NEXT: mov v0.h[6], v6.h[0]			; CHECK-FP-NEXT: mov v0.h[6], v6.h[0]
	; CHECK-FP-NEXT: mov v0.h[7], v7.h[0]			; CHECK-FP-NEXT: mov v0.h[7], v7.h[0]
	; CHECK-FP-NEXT: fminnm v0.8h, v0.8h, v1.8h			; CHECK-FP-NEXT: fminnm v0.8h, v0.8h, v1.8h
	; CHECK-FP-NEXT: fminnmv h0, v0.8h			; CHECK-FP-NEXT: fminnmv h0, v0.8h
	; CHECK-FP-NEXT: ret			; CHECK-FP-NEXT: ret
	%b = call nnan ninf half @llvm.vector.reduce.fmin.v11f16(<11 x half> %a)			%b = call nnan ninf half @llvm.vector.reduce.fmin.v11f16(<11 x half> %a)
	ret half %b			ret half %b
	▲ Show 20 Lines • Show All 45 Lines • Show Last 20 Lines

llvm/test/CodeGen/AArch64/vector-fcopysign.ll

Show First 20 Lines • Show All 76 Lines • ▼ Show 20 Lines
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%r = call <2 x float> @llvm.copysign.v2f32(<2 x float> %a, <2 x float> %b)		%r = call <2 x float> @llvm.copysign.v2f32(<2 x float> %a, <2 x float> %b)
ret <2 x float> %r		ret <2 x float> %r
}		}

define <2 x float> @test_copysign_v2f32_v2f64(<2 x float> %a, <2 x double> %b) #0 {		define <2 x float> @test_copysign_v2f32_v2f64(<2 x float> %a, <2 x double> %b) #0 {
; CHECK-LABEL: test_copysign_v2f32_v2f64:		; CHECK-LABEL: test_copysign_v2f32_v2f64:
; CHECK: ; %bb.0:		; CHECK: ; %bb.0:
; CHECK-NEXT: mvni.2s v2, #128, lsl #24
; CHECK-NEXT: fcvtn v1.2s, v1.2d		; CHECK-NEXT: fcvtn v1.2s, v1.2d
		; CHECK-NEXT: mvni.2s v2, #128, lsl #24
; CHECK-NEXT: bif.8b v0, v1, v2		; CHECK-NEXT: bif.8b v0, v1, v2
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%tmp0 = fptrunc <2 x double> %b to <2 x float>		%tmp0 = fptrunc <2 x double> %b to <2 x float>
%r = call <2 x float> @llvm.copysign.v2f32(<2 x float> %a, <2 x float> %tmp0)		%r = call <2 x float> @llvm.copysign.v2f32(<2 x float> %a, <2 x float> %tmp0)
ret <2 x float> %r		ret <2 x float> %r
}		}

declare <2 x float> @llvm.copysign.v2f32(<2 x float> %a, <2 x float> %b) #0		declare <2 x float> @llvm.copysign.v2f32(<2 x float> %a, <2 x float> %b) #0
Show All 10 Lines	; CHECK-NEXT: ret
ret <4 x float> %r		ret <4 x float> %r
}		}

; SplitVecOp #1		; SplitVecOp #1
define <4 x float> @test_copysign_v4f32_v4f64(<4 x float> %a, <4 x double> %b) #0 {		define <4 x float> @test_copysign_v4f32_v4f64(<4 x float> %a, <4 x double> %b) #0 {
; CHECK-LABEL: test_copysign_v4f32_v4f64:		; CHECK-LABEL: test_copysign_v4f32_v4f64:
; CHECK: ; %bb.0:		; CHECK: ; %bb.0:
; CHECK-NEXT: fcvtn v1.2s, v1.2d		; CHECK-NEXT: fcvtn v1.2s, v1.2d
; CHECK-NEXT: mvni.4s v3, #128, lsl #24
; CHECK-NEXT: fcvtn2 v1.4s, v2.2d		; CHECK-NEXT: fcvtn2 v1.4s, v2.2d
; CHECK-NEXT: bif.16b v0, v1, v3		; CHECK-NEXT: mvni.4s v2, #128, lsl #24
		; CHECK-NEXT: bif.16b v0, v1, v2
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%tmp0 = fptrunc <4 x double> %b to <4 x float>		%tmp0 = fptrunc <4 x double> %b to <4 x float>
%r = call <4 x float> @llvm.copysign.v4f32(<4 x float> %a, <4 x float> %tmp0)		%r = call <4 x float> @llvm.copysign.v4f32(<4 x float> %a, <4 x float> %tmp0)
ret <4 x float> %r		ret <4 x float> %r
}		}

declare <4 x float> @llvm.copysign.v4f32(<4 x float> %a, <4 x float> %b) #0		declare <4 x float> @llvm.copysign.v4f32(<4 x float> %a, <4 x float> %b) #0

▲ Show 20 Lines • Show All 62 Lines • ▼ Show 20 Lines

define <4 x half> @test_copysign_v4f16_v4f16(<4 x half> %a, <4 x half> %b) #0 {		define <4 x half> @test_copysign_v4f16_v4f16(<4 x half> %a, <4 x half> %b) #0 {
; NOFP16-LABEL: test_copysign_v4f16_v4f16:		; NOFP16-LABEL: test_copysign_v4f16_v4f16:
; NOFP16: ; %bb.0:		; NOFP16: ; %bb.0:
; NOFP16-NEXT: ; kill: def $d1 killed $d1 def $q1		; NOFP16-NEXT: ; kill: def $d1 killed $d1 def $q1
; NOFP16-NEXT: ; kill: def $d0 killed $d0 def $q0		; NOFP16-NEXT: ; kill: def $d0 killed $d0 def $q0
; NOFP16-NEXT: mov h3, v1[1]		; NOFP16-NEXT: mov h3, v1[1]
; NOFP16-NEXT: mov h4, v0[1]		; NOFP16-NEXT: mov h4, v0[1]
; NOFP16-NEXT: mvni.4s v2, #128, lsl #24
; NOFP16-NEXT: fcvt s5, h1		; NOFP16-NEXT: fcvt s5, h1
; NOFP16-NEXT: fcvt s6, h0		; NOFP16-NEXT: fcvt s6, h0
; NOFP16-NEXT: mov h7, v1[2]		; NOFP16-NEXT: mov h7, v1[2]
; NOFP16-NEXT: mov h16, v0[2]		; NOFP16-NEXT: mov h16, v0[2]
		; NOFP16-NEXT: mvni.4s v2, #128, lsl #24
		; NOFP16-NEXT: mov h1, v1[3]
; NOFP16-NEXT: fcvt s3, h3		; NOFP16-NEXT: fcvt s3, h3
; NOFP16-NEXT: fcvt s4, h4		; NOFP16-NEXT: fcvt s4, h4
; NOFP16-NEXT: mov h1, v1[3]
; NOFP16-NEXT: bit.16b v5, v6, v2		; NOFP16-NEXT: bit.16b v5, v6, v2
; NOFP16-NEXT: fcvt s6, h7		; NOFP16-NEXT: fcvt s6, h7
; NOFP16-NEXT: fcvt s7, h16		; NOFP16-NEXT: fcvt s7, h16
		; NOFP16-NEXT: fcvt s1, h1
; NOFP16-NEXT: bit.16b v3, v4, v2		; NOFP16-NEXT: bit.16b v3, v4, v2
; NOFP16-NEXT: mov h4, v0[3]		; NOFP16-NEXT: mov h4, v0[3]
; NOFP16-NEXT: fcvt h0, s5		; NOFP16-NEXT: fcvt h0, s5
; NOFP16-NEXT: fcvt s1, h1
; NOFP16-NEXT: bit.16b v6, v7, v2		; NOFP16-NEXT: bit.16b v6, v7, v2
; NOFP16-NEXT: fcvt h3, s3		; NOFP16-NEXT: fcvt h3, s3
; NOFP16-NEXT: fcvt s4, h4		; NOFP16-NEXT: fcvt s4, h4
; NOFP16-NEXT: fcvt h5, s6		; NOFP16-NEXT: fcvt h5, s6
; NOFP16-NEXT: mov.h v0[1], v3[0]		; NOFP16-NEXT: mov.h v0[1], v3[0]
; NOFP16-NEXT: bit.16b v1, v4, v2		; NOFP16-NEXT: bit.16b v1, v4, v2
; NOFP16-NEXT: mov.h v0[2], v5[0]		; NOFP16-NEXT: mov.h v0[2], v5[0]
; NOFP16-NEXT: fcvt h1, s1		; NOFP16-NEXT: fcvt h1, s1
Show All 11 Lines
}		}

define <4 x half> @test_copysign_v4f16_v4f32(<4 x half> %a, <4 x float> %b) #0 {		define <4 x half> @test_copysign_v4f16_v4f32(<4 x half> %a, <4 x float> %b) #0 {
; NOFP16-LABEL: test_copysign_v4f16_v4f32:		; NOFP16-LABEL: test_copysign_v4f16_v4f32:
; NOFP16: ; %bb.0:		; NOFP16: ; %bb.0:
; NOFP16-NEXT: fcvtn v1.4h, v1.4s		; NOFP16-NEXT: fcvtn v1.4h, v1.4s
; NOFP16-NEXT: ; kill: def $d0 killed $d0 def $q0		; NOFP16-NEXT: ; kill: def $d0 killed $d0 def $q0
; NOFP16-NEXT: mov h3, v0[1]		; NOFP16-NEXT: mov h3, v0[1]
; NOFP16-NEXT: mvni.4s v2, #128, lsl #24
; NOFP16-NEXT: fcvt s5, h0		; NOFP16-NEXT: fcvt s5, h0
; NOFP16-NEXT: mov h7, v0[2]		; NOFP16-NEXT: mov h7, v0[2]
		; NOFP16-NEXT: mvni.4s v2, #128, lsl #24
; NOFP16-NEXT: mov h4, v1[1]		; NOFP16-NEXT: mov h4, v1[1]
; NOFP16-NEXT: fcvt s6, h1		; NOFP16-NEXT: fcvt s6, h1
; NOFP16-NEXT: mov h16, v1[2]		; NOFP16-NEXT: mov h16, v1[2]
; NOFP16-NEXT: fcvt s3, h3		; NOFP16-NEXT: fcvt s3, h3
; NOFP16-NEXT: mov h1, v1[3]		; NOFP16-NEXT: mov h1, v1[3]
; NOFP16-NEXT: fcvt s4, h4		; NOFP16-NEXT: fcvt s4, h4
; NOFP16-NEXT: bif.16b v5, v6, v2		; NOFP16-NEXT: bif.16b v5, v6, v2
; NOFP16-NEXT: fcvt s6, h7		; NOFP16-NEXT: fcvt s6, h7
Show All 11 Lines
; NOFP16-NEXT: mov.h v0[2], v5[0]		; NOFP16-NEXT: mov.h v0[2], v5[0]
; NOFP16-NEXT: fcvt h1, s1		; NOFP16-NEXT: fcvt h1, s1
; NOFP16-NEXT: mov.h v0[3], v1[0]		; NOFP16-NEXT: mov.h v0[3], v1[0]
; NOFP16-NEXT: ; kill: def $d0 killed $d0 killed $q0		; NOFP16-NEXT: ; kill: def $d0 killed $d0 killed $q0
; NOFP16-NEXT: ret		; NOFP16-NEXT: ret
;		;
; FP16-LABEL: test_copysign_v4f16_v4f32:		; FP16-LABEL: test_copysign_v4f16_v4f32:
; FP16: ; %bb.0:		; FP16: ; %bb.0:
; FP16-NEXT: mvni.4h v2, #128, lsl #8
; FP16-NEXT: fcvtn v1.4h, v1.4s		; FP16-NEXT: fcvtn v1.4h, v1.4s
		; FP16-NEXT: mvni.4h v2, #128, lsl #8
; FP16-NEXT: bif.8b v0, v1, v2		; FP16-NEXT: bif.8b v0, v1, v2
; FP16-NEXT: ret		; FP16-NEXT: ret
%tmp0 = fptrunc <4 x float> %b to <4 x half>		%tmp0 = fptrunc <4 x float> %b to <4 x half>
%r = call <4 x half> @llvm.copysign.v4f16(<4 x half> %a, <4 x half> %tmp0)		%r = call <4 x half> @llvm.copysign.v4f16(<4 x half> %a, <4 x half> %tmp0)
ret <4 x half> %r		ret <4 x half> %r
}		}

define <4 x half> @test_copysign_v4f16_v4f64(<4 x half> %a, <4 x double> %b) #0 {		define <4 x half> @test_copysign_v4f16_v4f64(<4 x half> %a, <4 x double> %b) #0 {
; NOFP16-LABEL: test_copysign_v4f16_v4f64:		; NOFP16-LABEL: test_copysign_v4f16_v4f64:
; NOFP16: ; %bb.0:		; NOFP16: ; %bb.0:
; NOFP16-NEXT: ; kill: def $d0 killed $d0 def $q0		; NOFP16-NEXT: ; kill: def $d0 killed $d0 def $q0
; NOFP16-NEXT: mov d4, v1[1]		; NOFP16-NEXT: mov d4, v1[1]
; NOFP16-NEXT: mov h5, v0[1]		; NOFP16-NEXT: mov h5, v0[1]
; NOFP16-NEXT: mvni.4s v3, #128, lsl #24
; NOFP16-NEXT: fcvt s1, d1		; NOFP16-NEXT: fcvt s1, d1
; NOFP16-NEXT: fcvt s6, h0		; NOFP16-NEXT: fcvt s6, h0
; NOFP16-NEXT: mov h7, v0[2]		; NOFP16-NEXT: mov h7, v0[2]
		; NOFP16-NEXT: mvni.4s v3, #128, lsl #24
; NOFP16-NEXT: fcvt s4, d4		; NOFP16-NEXT: fcvt s4, d4
; NOFP16-NEXT: fcvt s5, h5		; NOFP16-NEXT: fcvt s5, h5
; NOFP16-NEXT: bit.16b v1, v6, v3		; NOFP16-NEXT: bit.16b v1, v6, v3
; NOFP16-NEXT: fcvt s6, d2		; NOFP16-NEXT: fcvt s6, d2
; NOFP16-NEXT: fcvt s7, h7		; NOFP16-NEXT: fcvt s7, h7
; NOFP16-NEXT: bit.16b v4, v5, v3
; NOFP16-NEXT: mov d2, v2[1]		; NOFP16-NEXT: mov d2, v2[1]
		; NOFP16-NEXT: bit.16b v4, v5, v3
; NOFP16-NEXT: mov h5, v0[3]		; NOFP16-NEXT: mov h5, v0[3]
; NOFP16-NEXT: fcvt h0, s1		; NOFP16-NEXT: fcvt h0, s1
; NOFP16-NEXT: bit.16b v6, v7, v3		; NOFP16-NEXT: bit.16b v6, v7, v3
; NOFP16-NEXT: fcvt h1, s4
; NOFP16-NEXT: fcvt s2, d2		; NOFP16-NEXT: fcvt s2, d2
		; NOFP16-NEXT: fcvt h1, s4
; NOFP16-NEXT: fcvt s4, h5		; NOFP16-NEXT: fcvt s4, h5
; NOFP16-NEXT: fcvt h5, s6		; NOFP16-NEXT: fcvt h5, s6
; NOFP16-NEXT: mov.h v0[1], v1[0]		; NOFP16-NEXT: mov.h v0[1], v1[0]
; NOFP16-NEXT: mov.16b v1, v3		; NOFP16-NEXT: mov.16b v1, v3
; NOFP16-NEXT: mov.h v0[2], v5[0]
; NOFP16-NEXT: bsl.16b v1, v4, v2		; NOFP16-NEXT: bsl.16b v1, v4, v2
		; NOFP16-NEXT: mov.h v0[2], v5[0]
; NOFP16-NEXT: fcvt h1, s1		; NOFP16-NEXT: fcvt h1, s1
; NOFP16-NEXT: mov.h v0[3], v1[0]		; NOFP16-NEXT: mov.h v0[3], v1[0]
; NOFP16-NEXT: ; kill: def $d0 killed $d0 killed $q0		; NOFP16-NEXT: ; kill: def $d0 killed $d0 killed $q0
; NOFP16-NEXT: ret		; NOFP16-NEXT: ret
;		;
; FP16-LABEL: test_copysign_v4f16_v4f64:		; FP16-LABEL: test_copysign_v4f16_v4f64:
; FP16: ; %bb.0:		; FP16: ; %bb.0:
; FP16-NEXT: mov d4, v1[1]		; FP16-NEXT: mov d3, v1[1]
; FP16-NEXT: fcvt h1, d1		; FP16-NEXT: fcvt h1, d1
; FP16-NEXT: mvni.4h v3, #128, lsl #8		; FP16-NEXT: fcvt h3, d3
; FP16-NEXT: fcvt h4, d4		; FP16-NEXT: mov.h v1[1], v3[0]
; FP16-NEXT: mov.h v1[1], v4[0]		; FP16-NEXT: fcvt h3, d2
; FP16-NEXT: fcvt h4, d2
; FP16-NEXT: mov d2, v2[1]		; FP16-NEXT: mov d2, v2[1]
; FP16-NEXT: mov.h v1[2], v4[0]		; FP16-NEXT: mov.h v1[2], v3[0]
; FP16-NEXT: fcvt h2, d2		; FP16-NEXT: fcvt h2, d2
; FP16-NEXT: mov.h v1[3], v2[0]		; FP16-NEXT: mov.h v1[3], v2[0]
; FP16-NEXT: bif.8b v0, v1, v3		; FP16-NEXT: mvni.4h v2, #128, lsl #8
		; FP16-NEXT: bif.8b v0, v1, v2
; FP16-NEXT: ret		; FP16-NEXT: ret
%tmp0 = fptrunc <4 x double> %b to <4 x half>		%tmp0 = fptrunc <4 x double> %b to <4 x half>
%r = call <4 x half> @llvm.copysign.v4f16(<4 x half> %a, <4 x half> %tmp0)		%r = call <4 x half> @llvm.copysign.v4f16(<4 x half> %a, <4 x half> %tmp0)
ret <4 x half> %r		ret <4 x half> %r
}		}

declare <4 x half> @llvm.copysign.v4f16(<4 x half> %a, <4 x half> %b) #0		declare <4 x half> @llvm.copysign.v4f16(<4 x half> %a, <4 x half> %b) #0

;============ v8f16		;============ v8f16

define <8 x half> @test_copysign_v8f16_v8f16(<8 x half> %a, <8 x half> %b) #0 {		define <8 x half> @test_copysign_v8f16_v8f16(<8 x half> %a, <8 x half> %b) #0 {
; NOFP16-LABEL: test_copysign_v8f16_v8f16:		; NOFP16-LABEL: test_copysign_v8f16_v8f16:
; NOFP16: ; %bb.0:		; NOFP16: ; %bb.0:
; NOFP16-NEXT: mov h5, v1[1]		; NOFP16-NEXT: mov h5, v1[1]
; NOFP16-NEXT: mov h6, v0[1]		; NOFP16-NEXT: mov h6, v0[1]
; NOFP16-NEXT: mvni.4s v3, #128, lsl #24
; NOFP16-NEXT: fcvt s2, h1		; NOFP16-NEXT: fcvt s2, h1
; NOFP16-NEXT: fcvt s4, h0		; NOFP16-NEXT: fcvt s4, h0
; NOFP16-NEXT: mov h7, v1[2]		; NOFP16-NEXT: mov h7, v1[2]
; NOFP16-NEXT: mov h16, v0[2]		; NOFP16-NEXT: mov h16, v0[2]
		; NOFP16-NEXT: mvni.4s v3, #128, lsl #24
		; NOFP16-NEXT: mov h17, v0[3]
; NOFP16-NEXT: fcvt s5, h5		; NOFP16-NEXT: fcvt s5, h5
; NOFP16-NEXT: fcvt s6, h6		; NOFP16-NEXT: fcvt s6, h6
; NOFP16-NEXT: mov h17, v0[3]
; NOFP16-NEXT: mov h18, v0[5]		; NOFP16-NEXT: mov h18, v0[5]
; NOFP16-NEXT: bit.16b v2, v4, v3		; NOFP16-NEXT: bit.16b v2, v4, v3
; NOFP16-NEXT: mov h4, v1[3]		; NOFP16-NEXT: mov h4, v1[3]
; NOFP16-NEXT: fcvt s7, h7		; NOFP16-NEXT: fcvt s7, h7
; NOFP16-NEXT: fcvt s16, h16		; NOFP16-NEXT: fcvt s16, h16
; NOFP16-NEXT: bit.16b v5, v6, v3
; NOFP16-NEXT: fcvt s17, h17		; NOFP16-NEXT: fcvt s17, h17
		; NOFP16-NEXT: bit.16b v5, v6, v3
; NOFP16-NEXT: mov.16b v6, v3		; NOFP16-NEXT: mov.16b v6, v3
; NOFP16-NEXT: fcvt s4, h4		; NOFP16-NEXT: fcvt s4, h4
; NOFP16-NEXT: fcvt h2, s2
; NOFP16-NEXT: fcvt h5, s5
; NOFP16-NEXT: bsl.16b v6, v16, v7		; NOFP16-NEXT: bsl.16b v6, v16, v7
; NOFP16-NEXT: mov h7, v1[4]		; NOFP16-NEXT: mov h7, v1[4]
; NOFP16-NEXT: mov h16, v0[4]		; NOFP16-NEXT: mov h16, v0[4]
		; NOFP16-NEXT: fcvt h2, s2
		; NOFP16-NEXT: fcvt h5, s5
; NOFP16-NEXT: bit.16b v4, v17, v3		; NOFP16-NEXT: bit.16b v4, v17, v3
; NOFP16-NEXT: mov h17, v1[5]		; NOFP16-NEXT: mov h17, v1[5]
; NOFP16-NEXT: mov.h v2[1], v5[0]
; NOFP16-NEXT: fcvt s7, h7		; NOFP16-NEXT: fcvt s7, h7
; NOFP16-NEXT: fcvt s16, h16		; NOFP16-NEXT: fcvt s16, h16
		; NOFP16-NEXT: mov.h v2[1], v5[0]
; NOFP16-NEXT: fcvt h5, s6		; NOFP16-NEXT: fcvt h5, s6
; NOFP16-NEXT: fcvt s6, h17		; NOFP16-NEXT: fcvt s6, h17
; NOFP16-NEXT: fcvt s17, h18		; NOFP16-NEXT: fcvt s17, h18
; NOFP16-NEXT: fcvt h4, s4		; NOFP16-NEXT: fcvt h4, s4
; NOFP16-NEXT: bit.16b v7, v16, v3		; NOFP16-NEXT: bit.16b v7, v16, v3
; NOFP16-NEXT: mov h16, v0[6]		; NOFP16-NEXT: mov h16, v0[6]
; NOFP16-NEXT: mov.h v2[2], v5[0]		; NOFP16-NEXT: mov.h v2[2], v5[0]
; NOFP16-NEXT: mov h5, v1[6]		; NOFP16-NEXT: mov h5, v1[6]
Show All 27 Lines	; FP16-NEXT: ret
ret <8 x half> %r		ret <8 x half> %r
}		}

define <8 x half> @test_copysign_v8f16_v8f32(<8 x half> %a, <8 x float> %b) #0 {		define <8 x half> @test_copysign_v8f16_v8f32(<8 x half> %a, <8 x float> %b) #0 {
; NOFP16-LABEL: test_copysign_v8f16_v8f32:		; NOFP16-LABEL: test_copysign_v8f16_v8f32:
; NOFP16: ; %bb.0:		; NOFP16: ; %bb.0:
; NOFP16-NEXT: fcvtn v1.4h, v1.4s		; NOFP16-NEXT: fcvtn v1.4h, v1.4s
; NOFP16-NEXT: fcvtn v2.4h, v2.4s		; NOFP16-NEXT: fcvtn v2.4h, v2.4s
; NOFP16-NEXT: mvni.4s v3, #128, lsl #24
; NOFP16-NEXT: mov h4, v0[1]		; NOFP16-NEXT: mov h4, v0[1]
; NOFP16-NEXT: mov h5, v0[4]		; NOFP16-NEXT: mov h5, v0[4]
; NOFP16-NEXT: fcvt s7, h0		; NOFP16-NEXT: fcvt s7, h0
; NOFP16-NEXT: mov h17, v0[2]		; NOFP16-NEXT: mov h17, v0[2]
		; NOFP16-NEXT: mvni.4s v3, #128, lsl #24
; NOFP16-NEXT: mov h6, v1[1]		; NOFP16-NEXT: mov h6, v1[1]
; NOFP16-NEXT: fcvt s16, h1		; NOFP16-NEXT: fcvt s16, h1
; NOFP16-NEXT: fcvt s4, h4		; NOFP16-NEXT: fcvt s4, h4
; NOFP16-NEXT: mov h18, v1[2]		; NOFP16-NEXT: mov h18, v1[2]
; NOFP16-NEXT: fcvt s5, h5		; NOFP16-NEXT: fcvt s5, h5
; NOFP16-NEXT: fcvt s17, h17		; NOFP16-NEXT: fcvt s17, h17
; NOFP16-NEXT: fcvt s6, h6		; NOFP16-NEXT: fcvt s6, h6
; NOFP16-NEXT: bif.16b v7, v16, v3		; NOFP16-NEXT: bif.16b v7, v16, v3
; NOFP16-NEXT: fcvt s16, h2		; NOFP16-NEXT: fcvt s16, h2
; NOFP16-NEXT: fcvt s18, h18		; NOFP16-NEXT: fcvt s18, h18
; NOFP16-NEXT: bif.16b v4, v6, v3		; NOFP16-NEXT: bif.16b v4, v6, v3
; NOFP16-NEXT: mov h6, v0[3]		; NOFP16-NEXT: mov h6, v0[3]
; NOFP16-NEXT: bif.16b v5, v16, v3		; NOFP16-NEXT: bif.16b v5, v16, v3
; NOFP16-NEXT: mov h16, v1[3]		; NOFP16-NEXT: mov h16, v1[3]
; NOFP16-NEXT: fcvt h1, s7		; NOFP16-NEXT: fcvt h1, s7
; NOFP16-NEXT: mov.16b v7, v3		; NOFP16-NEXT: mov.16b v7, v3
; NOFP16-NEXT: fcvt h4, s4		; NOFP16-NEXT: fcvt h4, s4
		; NOFP16-NEXT: bsl.16b v7, v17, v18
; NOFP16-NEXT: fcvt s6, h6		; NOFP16-NEXT: fcvt s6, h6
; NOFP16-NEXT: fcvt s16, h16		; NOFP16-NEXT: fcvt s16, h16
; NOFP16-NEXT: fcvt h5, s5
; NOFP16-NEXT: bsl.16b v7, v17, v18
; NOFP16-NEXT: mov h17, v0[5]		; NOFP16-NEXT: mov h17, v0[5]
; NOFP16-NEXT: mov h18, v2[1]		; NOFP16-NEXT: mov h18, v2[1]
		; NOFP16-NEXT: fcvt h5, s5
; NOFP16-NEXT: mov.h v1[1], v4[0]		; NOFP16-NEXT: mov.h v1[1], v4[0]
; NOFP16-NEXT: bif.16b v6, v16, v3
; NOFP16-NEXT: fcvt h4, s7		; NOFP16-NEXT: fcvt h4, s7
		; NOFP16-NEXT: bif.16b v6, v16, v3
; NOFP16-NEXT: fcvt s7, h17		; NOFP16-NEXT: fcvt s7, h17
; NOFP16-NEXT: fcvt s17, h18		; NOFP16-NEXT: fcvt s17, h18
; NOFP16-NEXT: mov h16, v2[2]
; NOFP16-NEXT: mov h2, v2[3]
; NOFP16-NEXT: fcvt h6, s6
; NOFP16-NEXT: mov.h v1[2], v4[0]		; NOFP16-NEXT: mov.h v1[2], v4[0]
; NOFP16-NEXT: mov h4, v0[6]		; NOFP16-NEXT: mov h4, v0[6]
; NOFP16-NEXT: bif.16b v7, v17, v3		; NOFP16-NEXT: mov h16, v2[2]
; NOFP16-NEXT: fcvt s16, h16		; NOFP16-NEXT: fcvt h6, s6
; NOFP16-NEXT: mov h0, v0[7]		; NOFP16-NEXT: mov h0, v0[7]
; NOFP16-NEXT: fcvt s2, h2		; NOFP16-NEXT: bif.16b v7, v17, v3
		; NOFP16-NEXT: mov h2, v2[3]
; NOFP16-NEXT: fcvt s4, h4		; NOFP16-NEXT: fcvt s4, h4
		; NOFP16-NEXT: fcvt s16, h16
; NOFP16-NEXT: mov.h v1[3], v6[0]		; NOFP16-NEXT: mov.h v1[3], v6[0]
; NOFP16-NEXT: fcvt s0, h0		; NOFP16-NEXT: fcvt s0, h0
		; NOFP16-NEXT: fcvt s2, h2
; NOFP16-NEXT: bif.16b v4, v16, v3		; NOFP16-NEXT: bif.16b v4, v16, v3
; NOFP16-NEXT: mov.h v1[4], v5[0]		; NOFP16-NEXT: mov.h v1[4], v5[0]
; NOFP16-NEXT: fcvt h5, s7		; NOFP16-NEXT: fcvt h5, s7
; NOFP16-NEXT: bif.16b v0, v2, v3		; NOFP16-NEXT: bif.16b v0, v2, v3
; NOFP16-NEXT: fcvt h4, s4		; NOFP16-NEXT: fcvt h4, s4
; NOFP16-NEXT: mov.h v1[5], v5[0]		; NOFP16-NEXT: mov.h v1[5], v5[0]
; NOFP16-NEXT: fcvt h0, s0		; NOFP16-NEXT: fcvt h0, s0
; NOFP16-NEXT: mov.h v1[6], v4[0]		; NOFP16-NEXT: mov.h v1[6], v4[0]
; NOFP16-NEXT: mov.h v1[7], v0[0]		; NOFP16-NEXT: mov.h v1[7], v0[0]
; NOFP16-NEXT: mov.16b v0, v1		; NOFP16-NEXT: mov.16b v0, v1
; NOFP16-NEXT: ret		; NOFP16-NEXT: ret
;		;
; FP16-LABEL: test_copysign_v8f16_v8f32:		; FP16-LABEL: test_copysign_v8f16_v8f32:
; FP16: ; %bb.0:		; FP16: ; %bb.0:
; FP16-NEXT: fcvtn v2.4h, v2.4s		; FP16-NEXT: fcvtn v2.4h, v2.4s
; FP16-NEXT: fcvtn v1.4h, v1.4s		; FP16-NEXT: fcvtn v1.4h, v1.4s
; FP16-NEXT: mvni.8h v3, #128, lsl #8
; FP16-NEXT: mov.d v1[1], v2[0]		; FP16-NEXT: mov.d v1[1], v2[0]
; FP16-NEXT: bif.16b v0, v1, v3		; FP16-NEXT: mvni.8h v2, #128, lsl #8
		; FP16-NEXT: bif.16b v0, v1, v2
; FP16-NEXT: ret		; FP16-NEXT: ret
%tmp0 = fptrunc <8 x float> %b to <8 x half>		%tmp0 = fptrunc <8 x float> %b to <8 x half>
%r = call <8 x half> @llvm.copysign.v8f16(<8 x half> %a, <8 x half> %tmp0)		%r = call <8 x half> @llvm.copysign.v8f16(<8 x half> %a, <8 x half> %tmp0)
ret <8 x half> %r		ret <8 x half> %r
}		}

declare <8 x half> @llvm.copysign.v8f16(<8 x half> %a, <8 x half> %b) #0		declare <8 x half> @llvm.copysign.v8f16(<8 x half> %a, <8 x half> %b) #0

attributes #0 = { nounwind }		attributes #0 = { nounwind }

llvm/test/CodeGen/AArch64/vselect-constants.ll

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: llc < %s -mtriple=aarch64-- \| FileCheck %s			; RUN: llc < %s -mtriple=aarch64-- \| FileCheck %s

	; First, check the generic pattern for any 2 vector constants. Then, check special cases where			; First, check the generic pattern for any 2 vector constants. Then, check special cases where
	; the constants are all off-by-one. Finally, check the extra special cases where the constants			; the constants are all off-by-one. Finally, check the extra special cases where the constants
	; include 0 or -1.			; include 0 or -1.
	; Each minimal select test is repeated with a more typical pattern that includes a compare to			; Each minimal select test is repeated with a more typical pattern that includes a compare to
	; generate the condition value.			; generate the condition value.

	define <4 x i32> @sel_C1_or_C2_vec(<4 x i1> %cond) {			define <4 x i32> @sel_C1_or_C2_vec(<4 x i1> %cond) {
	; CHECK-LABEL: sel_C1_or_C2_vec:			; CHECK-LABEL: sel_C1_or_C2_vec:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: ushll v0.4s, v0.4h, #0
	; CHECK-NEXT: adrp x8, .LCPI0_0			; CHECK-NEXT: adrp x8, .LCPI0_0
	; CHECK-NEXT: adrp x9, .LCPI0_1			; CHECK-NEXT: adrp x9, .LCPI0_1
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI0_0]			; CHECK-NEXT: ushll v0.4s, v0.4h, #0
	; CHECK-NEXT: shl v0.4s, v0.4s, #31			; CHECK-NEXT: shl v0.4s, v0.4s, #31
				; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI0_0]
	; CHECK-NEXT: ldr q2, [x9, :lo12:.LCPI0_1]			; CHECK-NEXT: ldr q2, [x9, :lo12:.LCPI0_1]
	; CHECK-NEXT: cmlt v0.4s, v0.4s, #0			; CHECK-NEXT: cmlt v0.4s, v0.4s, #0
	; CHECK-NEXT: bsl v0.16b, v2.16b, v1.16b			; CHECK-NEXT: bsl v0.16b, v2.16b, v1.16b
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%add = select <4 x i1> %cond, <4 x i32> <i32 3000, i32 1, i32 -1, i32 0>, <4 x i32> <i32 42, i32 0, i32 -2, i32 -1>			%add = select <4 x i1> %cond, <4 x i32> <i32 3000, i32 1, i32 -1, i32 0>, <4 x i32> <i32 42, i32 0, i32 -2, i32 -1>
	ret <4 x i32> %add			ret <4 x i32> %add
	}			}

	define <4 x i32> @cmp_sel_C1_or_C2_vec(<4 x i32> %x, <4 x i32> %y) {			define <4 x i32> @cmp_sel_C1_or_C2_vec(<4 x i32> %x, <4 x i32> %y) {
	; CHECK-LABEL: cmp_sel_C1_or_C2_vec:			; CHECK-LABEL: cmp_sel_C1_or_C2_vec:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: adrp x8, .LCPI1_0			; CHECK-NEXT: adrp x8, .LCPI1_0
	; CHECK-NEXT: adrp x9, .LCPI1_1			; CHECK-NEXT: adrp x9, .LCPI1_1
	; CHECK-NEXT: cmeq v0.4s, v0.4s, v1.4s			; CHECK-NEXT: cmeq v0.4s, v0.4s, v1.4s
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI1_0]			; CHECK-NEXT: ldr q2, [x8, :lo12:.LCPI1_0]
	; CHECK-NEXT: ldr q2, [x9, :lo12:.LCPI1_1]			; CHECK-NEXT: ldr q3, [x9, :lo12:.LCPI1_1]
	; CHECK-NEXT: bsl v0.16b, v2.16b, v1.16b			; CHECK-NEXT: bsl v0.16b, v3.16b, v2.16b
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%cond = icmp eq <4 x i32> %x, %y			%cond = icmp eq <4 x i32> %x, %y
	%add = select <4 x i1> %cond, <4 x i32> <i32 3000, i32 1, i32 -1, i32 0>, <4 x i32> <i32 42, i32 0, i32 -2, i32 -1>			%add = select <4 x i1> %cond, <4 x i32> <i32 3000, i32 1, i32 -1, i32 0>, <4 x i32> <i32 42, i32 0, i32 -2, i32 -1>
	ret <4 x i32> %add			ret <4 x i32> %add
	}			}

	define <4 x i32> @sel_Cplus1_or_C_vec(<4 x i1> %cond) {			define <4 x i32> @sel_Cplus1_or_C_vec(<4 x i1> %cond) {
	; CHECK-LABEL: sel_Cplus1_or_C_vec:			; CHECK-LABEL: sel_Cplus1_or_C_vec:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: ushll v0.4s, v0.4h, #0
	; CHECK-NEXT: adrp x8, .LCPI2_0			; CHECK-NEXT: adrp x8, .LCPI2_0
	; CHECK-NEXT: adrp x9, .LCPI2_1			; CHECK-NEXT: adrp x9, .LCPI2_1
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI2_0]			; CHECK-NEXT: ushll v0.4s, v0.4h, #0
	; CHECK-NEXT: shl v0.4s, v0.4s, #31			; CHECK-NEXT: shl v0.4s, v0.4s, #31
				; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI2_0]
	; CHECK-NEXT: ldr q2, [x9, :lo12:.LCPI2_1]			; CHECK-NEXT: ldr q2, [x9, :lo12:.LCPI2_1]
	; CHECK-NEXT: cmlt v0.4s, v0.4s, #0			; CHECK-NEXT: cmlt v0.4s, v0.4s, #0
	; CHECK-NEXT: bsl v0.16b, v2.16b, v1.16b			; CHECK-NEXT: bsl v0.16b, v2.16b, v1.16b
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%add = select <4 x i1> %cond, <4 x i32> <i32 43, i32 1, i32 -1, i32 0>, <4 x i32> <i32 42, i32 0, i32 -2, i32 -1>			%add = select <4 x i1> %cond, <4 x i32> <i32 43, i32 1, i32 -1, i32 0>, <4 x i32> <i32 42, i32 0, i32 -2, i32 -1>
	ret <4 x i32> %add			ret <4 x i32> %add
	}			}

	define <4 x i32> @cmp_sel_Cplus1_or_C_vec(<4 x i32> %x, <4 x i32> %y) {			define <4 x i32> @cmp_sel_Cplus1_or_C_vec(<4 x i32> %x, <4 x i32> %y) {
	; CHECK-LABEL: cmp_sel_Cplus1_or_C_vec:			; CHECK-LABEL: cmp_sel_Cplus1_or_C_vec:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: adrp x8, .LCPI3_0			; CHECK-NEXT: adrp x8, .LCPI3_0
	; CHECK-NEXT: adrp x9, .LCPI3_1			; CHECK-NEXT: adrp x9, .LCPI3_1
	; CHECK-NEXT: cmeq v0.4s, v0.4s, v1.4s			; CHECK-NEXT: cmeq v0.4s, v0.4s, v1.4s
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI3_0]			; CHECK-NEXT: ldr q2, [x8, :lo12:.LCPI3_0]
	; CHECK-NEXT: ldr q2, [x9, :lo12:.LCPI3_1]			; CHECK-NEXT: ldr q3, [x9, :lo12:.LCPI3_1]
	; CHECK-NEXT: bsl v0.16b, v2.16b, v1.16b			; CHECK-NEXT: bsl v0.16b, v3.16b, v2.16b
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%cond = icmp eq <4 x i32> %x, %y			%cond = icmp eq <4 x i32> %x, %y
	%add = select <4 x i1> %cond, <4 x i32> <i32 43, i32 1, i32 -1, i32 0>, <4 x i32> <i32 42, i32 0, i32 -2, i32 -1>			%add = select <4 x i1> %cond, <4 x i32> <i32 43, i32 1, i32 -1, i32 0>, <4 x i32> <i32 42, i32 0, i32 -2, i32 -1>
	ret <4 x i32> %add			ret <4 x i32> %add
	}			}

	define <4 x i32> @sel_Cminus1_or_C_vec(<4 x i1> %cond) {			define <4 x i32> @sel_Cminus1_or_C_vec(<4 x i1> %cond) {
	; CHECK-LABEL: sel_Cminus1_or_C_vec:			; CHECK-LABEL: sel_Cminus1_or_C_vec:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: ushll v0.4s, v0.4h, #0
	; CHECK-NEXT: adrp x8, .LCPI4_0			; CHECK-NEXT: adrp x8, .LCPI4_0
	; CHECK-NEXT: adrp x9, .LCPI4_1			; CHECK-NEXT: adrp x9, .LCPI4_1
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI4_0]			; CHECK-NEXT: ushll v0.4s, v0.4h, #0
	; CHECK-NEXT: shl v0.4s, v0.4s, #31			; CHECK-NEXT: shl v0.4s, v0.4s, #31
				; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI4_0]
	; CHECK-NEXT: ldr q2, [x9, :lo12:.LCPI4_1]			; CHECK-NEXT: ldr q2, [x9, :lo12:.LCPI4_1]
	; CHECK-NEXT: cmlt v0.4s, v0.4s, #0			; CHECK-NEXT: cmlt v0.4s, v0.4s, #0
	; CHECK-NEXT: bsl v0.16b, v2.16b, v1.16b			; CHECK-NEXT: bsl v0.16b, v2.16b, v1.16b
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%add = select <4 x i1> %cond, <4 x i32> <i32 43, i32 1, i32 -1, i32 0>, <4 x i32> <i32 44, i32 2, i32 0, i32 1>			%add = select <4 x i1> %cond, <4 x i32> <i32 43, i32 1, i32 -1, i32 0>, <4 x i32> <i32 44, i32 2, i32 0, i32 1>
	ret <4 x i32> %add			ret <4 x i32> %add
	}			}

	define <4 x i32> @cmp_sel_Cminus1_or_C_vec(<4 x i32> %x, <4 x i32> %y) {			define <4 x i32> @cmp_sel_Cminus1_or_C_vec(<4 x i32> %x, <4 x i32> %y) {
	; CHECK-LABEL: cmp_sel_Cminus1_or_C_vec:			; CHECK-LABEL: cmp_sel_Cminus1_or_C_vec:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: adrp x8, .LCPI5_0			; CHECK-NEXT: adrp x8, .LCPI5_0
	; CHECK-NEXT: adrp x9, .LCPI5_1			; CHECK-NEXT: adrp x9, .LCPI5_1
	; CHECK-NEXT: cmeq v0.4s, v0.4s, v1.4s			; CHECK-NEXT: cmeq v0.4s, v0.4s, v1.4s
	; CHECK-NEXT: ldr q1, [x8, :lo12:.LCPI5_0]			; CHECK-NEXT: ldr q2, [x8, :lo12:.LCPI5_0]
	; CHECK-NEXT: ldr q2, [x9, :lo12:.LCPI5_1]			; CHECK-NEXT: ldr q3, [x9, :lo12:.LCPI5_1]
	; CHECK-NEXT: bsl v0.16b, v2.16b, v1.16b			; CHECK-NEXT: bsl v0.16b, v3.16b, v2.16b
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%cond = icmp eq <4 x i32> %x, %y			%cond = icmp eq <4 x i32> %x, %y
	%add = select <4 x i1> %cond, <4 x i32> <i32 43, i32 1, i32 -1, i32 0>, <4 x i32> <i32 44, i32 2, i32 0, i32 1>			%add = select <4 x i1> %cond, <4 x i32> <i32 43, i32 1, i32 -1, i32 0>, <4 x i32> <i32 44, i32 2, i32 0, i32 1>
	ret <4 x i32> %add			ret <4 x i32> %add
	}			}

	define <4 x i32> @sel_minus1_or_0_vec(<4 x i1> %cond) {			define <4 x i32> @sel_minus1_or_0_vec(<4 x i1> %cond) {
	; CHECK-LABEL: sel_minus1_or_0_vec:			; CHECK-LABEL: sel_minus1_or_0_vec:
	▲ Show 20 Lines • Show All 279 Lines • Show Last 20 Lines

llvm/test/tools/llvm-mca/AArch64/Cortex/A55-neon-instructions.s

	Show First 20 Lines • Show All 1,064 Lines • ▼ Show 20 Lines
	# CHECK-NEXT: [1]: #uOps			# CHECK-NEXT: [1]: #uOps
	# CHECK-NEXT: [2]: Latency			# CHECK-NEXT: [2]: Latency
	# CHECK-NEXT: [3]: RThroughput			# CHECK-NEXT: [3]: RThroughput
	# CHECK-NEXT: [4]: MayLoad			# CHECK-NEXT: [4]: MayLoad
	# CHECK-NEXT: [5]: MayStore			# CHECK-NEXT: [5]: MayStore
	# CHECK-NEXT: [6]: HasSideEffects (U)			# CHECK-NEXT: [6]: HasSideEffects (U)

	# CHECK: [1] [2] [3] [4] [5] [6] Instructions:			# CHECK: [1] [2] [3] [4] [5] [6] Instructions:
	# CHECK-NEXT: 1 4 0.50 abs d29, d24			# CHECK-NEXT: 1 3 0.50 abs d29, d24
	# CHECK-NEXT: 1 4 1.00 abs v0.16b, v0.16b			# CHECK-NEXT: 1 3 1.00 abs v0.16b, v0.16b
	# CHECK-NEXT: 1 4 1.00 abs v0.2d, v0.2d			# CHECK-NEXT: 1 3 1.00 abs v0.2d, v0.2d
	# CHECK-NEXT: 1 4 0.50 abs v0.2s, v0.2s			# CHECK-NEXT: 1 3 0.50 abs v0.2s, v0.2s
	# CHECK-NEXT: 1 4 0.50 abs v0.4h, v0.4h			# CHECK-NEXT: 1 3 0.50 abs v0.4h, v0.4h
	# CHECK-NEXT: 1 4 1.00 abs v0.4s, v0.4s			# CHECK-NEXT: 1 3 1.00 abs v0.4s, v0.4s
	# CHECK-NEXT: 1 4 0.50 abs v0.8b, v0.8b			# CHECK-NEXT: 1 3 0.50 abs v0.8b, v0.8b
	# CHECK-NEXT: 1 4 1.00 abs v0.8h, v0.8h			# CHECK-NEXT: 1 3 1.00 abs v0.8h, v0.8h
	# CHECK-NEXT: 1 4 0.50 add d17, d31, d29			# CHECK-NEXT: 1 2 0.50 add d17, d31, d29
	# CHECK-NEXT: 1 4 0.50 add v0.8b, v0.8b, v0.8b			# CHECK-NEXT: 1 2 0.50 add v0.8b, v0.8b, v0.8b
	# CHECK-NEXT: 1 4 1.00 addhn v0.2s, v0.2d, v0.2d			# CHECK-NEXT: 1 3 1.00 addhn v0.2s, v0.2d, v0.2d
	# CHECK-NEXT: 1 4 1.00 addhn v0.4h, v0.4s, v0.4s			# CHECK-NEXT: 1 3 1.00 addhn v0.4h, v0.4s, v0.4s
	# CHECK-NEXT: 1 4 1.00 addhn v0.8b, v0.8h, v0.8h			# CHECK-NEXT: 1 3 1.00 addhn v0.8b, v0.8h, v0.8h
	# CHECK-NEXT: 1 4 1.00 addhn2 v0.16b, v0.8h, v0.8h			# CHECK-NEXT: 1 3 1.00 addhn2 v0.16b, v0.8h, v0.8h
	# CHECK-NEXT: 1 4 1.00 addhn2 v0.4s, v0.2d, v0.2d			# CHECK-NEXT: 1 3 1.00 addhn2 v0.4s, v0.2d, v0.2d
	# CHECK-NEXT: 1 4 1.00 addhn2 v0.8h, v0.4s, v0.4s			# CHECK-NEXT: 1 3 1.00 addhn2 v0.8h, v0.4s, v0.4s
	# CHECK-NEXT: 1 4 1.00 addp v0.2d, v0.2d, v0.2d			# CHECK-NEXT: 1 3 1.00 addp v0.2d, v0.2d, v0.2d
	# CHECK-NEXT: 1 4 0.50 addp v0.8b, v0.8b, v0.8b			# CHECK-NEXT: 1 3 0.50 addp v0.8b, v0.8b, v0.8b
	# CHECK-NEXT: 1 4 0.50 and v0.8b, v0.8b, v0.8b			# CHECK-NEXT: 1 1 0.50 and v0.8b, v0.8b, v0.8b
	# CHECK-NEXT: 1 4 0.50 bic v0.4h, #15, lsl #8			# CHECK-NEXT: 1 1 0.50 bic v0.4h, #15, lsl #8
	# CHECK-NEXT: 1 4 0.50 bic v0.8b, v0.8b, v0.8b			# CHECK-NEXT: 1 1 0.50 bic v0.8b, v0.8b, v0.8b
	# CHECK-NEXT: 1 4 1.00 bif v0.16b, v0.16b, v0.16b			# CHECK-NEXT: 1 4 1.00 bif v0.16b, v0.16b, v0.16b
	# CHECK-NEXT: 1 4 1.00 bit v0.16b, v0.16b, v0.16b			# CHECK-NEXT: 1 4 1.00 bit v0.16b, v0.16b, v0.16b
	# CHECK-NEXT: 1 4 0.50 bsl v0.8b, v0.8b, v0.8b			# CHECK-NEXT: 1 4 0.50 bsl v0.8b, v0.8b, v0.8b
	# CHECK-NEXT: 1 4 1.00 cls v0.16b, v0.16b			# CHECK-NEXT: 1 4 1.00 cls v0.16b, v0.16b
	# CHECK-NEXT: 1 4 0.50 cls v0.2s, v0.2s			# CHECK-NEXT: 1 4 0.50 cls v0.2s, v0.2s
	# CHECK-NEXT: 1 4 0.50 cls v0.4h, v0.4h			# CHECK-NEXT: 1 4 0.50 cls v0.4h, v0.4h
	# CHECK-NEXT: 1 4 1.00 cls v0.4s, v0.4s			# CHECK-NEXT: 1 4 1.00 cls v0.4s, v0.4s
	# CHECK-NEXT: 1 4 0.50 cls v0.8b, v0.8b			# CHECK-NEXT: 1 4 0.50 cls v0.8b, v0.8b
	# CHECK-NEXT: 1 4 1.00 cls v0.8h, v0.8h			# CHECK-NEXT: 1 4 1.00 cls v0.8h, v0.8h
	# CHECK-NEXT: 1 4 1.00 clz v0.16b, v0.16b			# CHECK-NEXT: 1 4 1.00 clz v0.16b, v0.16b
	# CHECK-NEXT: 1 4 0.50 clz v0.2s, v0.2s			# CHECK-NEXT: 1 4 0.50 clz v0.2s, v0.2s
	# CHECK-NEXT: 1 4 0.50 clz v0.4h, v0.4h			# CHECK-NEXT: 1 4 0.50 clz v0.4h, v0.4h
	# CHECK-NEXT: 1 4 1.00 clz v0.4s, v0.4s			# CHECK-NEXT: 1 4 1.00 clz v0.4s, v0.4s
	# CHECK-NEXT: 1 4 0.50 clz v0.8b, v0.8b			# CHECK-NEXT: 1 4 0.50 clz v0.8b, v0.8b
	# CHECK-NEXT: 1 4 1.00 clz v0.8h, v0.8h			# CHECK-NEXT: 1 4 1.00 clz v0.8h, v0.8h
	# CHECK-NEXT: 1 4 0.50 cmeq d20, d21, #0			# CHECK-NEXT: 1 2 0.50 cmeq d20, d21, #0
	# CHECK-NEXT: 1 4 0.50 cmeq d20, d21, d22			# CHECK-NEXT: 1 2 0.50 cmeq d20, d21, d22
	# CHECK-NEXT: 1 4 1.00 cmeq v0.16b, v0.16b, #0			# CHECK-NEXT: 1 2 1.00 cmeq v0.16b, v0.16b, #0
	# CHECK-NEXT: 1 4 1.00 cmeq v0.16b, v0.16b, v0.16b			# CHECK-NEXT: 1 2 1.00 cmeq v0.16b, v0.16b, v0.16b
	# CHECK-NEXT: 1 4 0.50 cmge d20, d21, #0			# CHECK-NEXT: 1 2 0.50 cmge d20, d21, #0
	# CHECK-NEXT: 1 4 0.50 cmge d20, d21, d22			# CHECK-NEXT: 1 2 0.50 cmge d20, d21, d22
	# CHECK-NEXT: 1 4 0.50 cmge v0.4h, v0.4h, v0.4h			# CHECK-NEXT: 1 2 0.50 cmge v0.4h, v0.4h, v0.4h
	# CHECK-NEXT: 1 4 0.50 cmge v0.8b, v0.8b, #0			# CHECK-NEXT: 1 2 0.50 cmge v0.8b, v0.8b, #0
	# CHECK-NEXT: 1 4 0.50 cmgt d20, d21, #0			# CHECK-NEXT: 1 2 0.50 cmgt d20, d21, #0
	# CHECK-NEXT: 1 4 0.50 cmgt d20, d21, d22			# CHECK-NEXT: 1 2 0.50 cmgt d20, d21, d22
	# CHECK-NEXT: 1 4 0.50 cmgt v0.2s, v0.2s, #0			# CHECK-NEXT: 1 2 0.50 cmgt v0.2s, v0.2s, #0
	# CHECK-NEXT: 1 4 1.00 cmgt v0.4s, v0.4s, v0.4s			# CHECK-NEXT: 1 2 1.00 cmgt v0.4s, v0.4s, v0.4s
	# CHECK-NEXT: 1 4 0.50 cmhi d20, d21, d22			# CHECK-NEXT: 1 2 0.50 cmhi d20, d21, d22
	# CHECK-NEXT: 1 4 1.00 cmhi v0.8h, v0.8h, v0.8h			# CHECK-NEXT: 1 2 1.00 cmhi v0.8h, v0.8h, v0.8h
	# CHECK-NEXT: 1 4 0.50 cmhs d20, d21, d22			# CHECK-NEXT: 1 2 0.50 cmhs d20, d21, d22
	# CHECK-NEXT: 1 4 0.50 cmhs v0.8b, v0.8b, v0.8b			# CHECK-NEXT: 1 2 0.50 cmhs v0.8b, v0.8b, v0.8b
	# CHECK-NEXT: 1 4 0.50 cmle d20, d21, #0			# CHECK-NEXT: 1 2 0.50 cmle d20, d21, #0
	# CHECK-NEXT: 1 4 1.00 cmle v0.2d, v0.2d, #0			# CHECK-NEXT: 1 2 1.00 cmle v0.2d, v0.2d, #0
	# CHECK-NEXT: 1 4 0.50 cmlt d20, d21, #0			# CHECK-NEXT: 1 2 0.50 cmlt d20, d21, #0
	# CHECK-NEXT: 1 4 1.00 cmlt v0.8h, v0.8h, #0			# CHECK-NEXT: 1 2 1.00 cmlt v0.8h, v0.8h, #0
	# CHECK-NEXT: 1 4 0.50 cmtst d20, d21, d22			# CHECK-NEXT: 1 3 0.50 cmtst d20, d21, d22
	# CHECK-NEXT: 1 4 0.50 cmtst v0.2s, v0.2s, v0.2s			# CHECK-NEXT: 1 3 0.50 cmtst v0.2s, v0.2s, v0.2s
	# CHECK-NEXT: 1 4 1.00 cnt v0.16b, v0.16b			# CHECK-NEXT: 1 4 1.00 cnt v0.16b, v0.16b
	# CHECK-NEXT: 1 4 0.50 cnt v0.8b, v0.8b			# CHECK-NEXT: 1 4 0.50 cnt v0.8b, v0.8b
	# CHECK-NEXT: 1 2 0.50 dup v0.16b, w28			# CHECK-NEXT: 1 2 0.50 dup v0.16b, w28
	# CHECK-NEXT: 1 2 0.50 dup v0.2d, x28			# CHECK-NEXT: 1 2 0.50 dup v0.2d, x28
	# CHECK-NEXT: 1 4 0.50 dup v0.2s, w28			# CHECK-NEXT: 1 4 0.50 dup v0.2s, w28
	# CHECK-NEXT: 1 4 0.50 dup v0.4h, w28			# CHECK-NEXT: 1 4 0.50 dup v0.4h, w28
	# CHECK-NEXT: 1 2 0.50 dup v0.4s, w28			# CHECK-NEXT: 1 2 0.50 dup v0.4s, w28
	# CHECK-NEXT: 1 4 0.50 dup v0.8b, w28			# CHECK-NEXT: 1 4 0.50 dup v0.8b, w28
	# CHECK-NEXT: 1 2 0.50 dup v0.8h, w28			# CHECK-NEXT: 1 2 0.50 dup v0.8h, w28
	# CHECK-NEXT: 1 4 1.00 eor v0.16b, v0.16b, v0.16b			# CHECK-NEXT: 1 1 1.00 eor v0.16b, v0.16b, v0.16b
	# CHECK-NEXT: 1 4 1.00 ext v0.16b, v0.16b, v0.16b, #3			# CHECK-NEXT: 1 4 1.00 ext v0.16b, v0.16b, v0.16b, #3
	# CHECK-NEXT: 1 4 0.50 ext v0.8b, v0.8b, v0.8b, #3			# CHECK-NEXT: 1 4 0.50 ext v0.8b, v0.8b, v0.8b, #3
	# CHECK-NEXT: 1 4 0.50 fabd d29, d24, d20			# CHECK-NEXT: 1 4 0.50 fabd d29, d24, d20
	# CHECK-NEXT: 1 4 0.50 fabd s29, s24, s20			# CHECK-NEXT: 1 4 0.50 fabd s29, s24, s20
	# CHECK-NEXT: 1 4 1.00 fabd v0.4s, v0.4s, v0.4s			# CHECK-NEXT: 1 4 1.00 fabd v0.4s, v0.4s, v0.4s
	# CHECK-NEXT: 1 4 1.00 fabs v0.2d, v0.2d			# CHECK-NEXT: 1 4 1.00 fabs v0.2d, v0.2d
	# CHECK-NEXT: 1 4 0.50 fabs v0.2s, v0.2s			# CHECK-NEXT: 1 4 0.50 fabs v0.2s, v0.2s
	# CHECK-NEXT: 1 4 0.50 fabs v0.4h, v0.4h			# CHECK-NEXT: 1 4 0.50 fabs v0.4h, v0.4h
	▲ Show 20 Lines • Show All 275 Lines • ▼ Show 20 Lines
	# CHECK-NEXT: 1 5 2.00 * ld4r { v0.2s, v1.2s, v2.2s, v3.2s }, [sp]			# CHECK-NEXT: 1 5 2.00 * ld4r { v0.2s, v1.2s, v2.2s, v3.2s }, [sp]
	# CHECK-NEXT: 2 5 2.00 * ld4r { v0.2s, v1.2s, v2.2s, v3.2s }, [sp], x30			# CHECK-NEXT: 2 5 2.00 * ld4r { v0.2s, v1.2s, v2.2s, v3.2s }, [sp], x30
	# CHECK-NEXT: 1 4 0.50 mla v0.8b, v0.8b, v0.8b			# CHECK-NEXT: 1 4 0.50 mla v0.8b, v0.8b, v0.8b
	# CHECK-NEXT: 1 4 0.50 mls v0.4h, v0.4h, v0.4h			# CHECK-NEXT: 1 4 0.50 mls v0.4h, v0.4h, v0.4h
	# CHECK-NEXT: 1 4 0.50 mov b0, v0.b[15]			# CHECK-NEXT: 1 4 0.50 mov b0, v0.b[15]
	# CHECK-NEXT: 1 4 0.50 mov d6, v0.d[1]			# CHECK-NEXT: 1 4 0.50 mov d6, v0.d[1]
	# CHECK-NEXT: 1 4 0.50 mov h2, v0.h[5]			# CHECK-NEXT: 1 4 0.50 mov h2, v0.h[5]
	# CHECK-NEXT: 1 4 0.50 mov s17, v0.s[2]			# CHECK-NEXT: 1 4 0.50 mov s17, v0.s[2]
	# CHECK-NEXT: 1 4 1.00 mov v0.16b, v0.16b			# CHECK-NEXT: 1 1 1.00 mov v0.16b, v0.16b
	# CHECK-NEXT: 1 4 0.50 mov v0.8b, v0.8b			# CHECK-NEXT: 1 1 0.50 mov v0.8b, v0.8b
	# CHECK-NEXT: 1 4 0.50 movi d15, #0xff00ff00ff00ff			# CHECK-NEXT: 1 4 0.50 movi d15, #0xff00ff00ff00ff
	# CHECK-NEXT: 1 4 1.00 movi v0.16b, #31			# CHECK-NEXT: 1 4 1.00 movi v0.16b, #31
	# CHECK-NEXT: 1 4 1.00 movi v0.2d, #0xff0000ff0000ffff			# CHECK-NEXT: 1 4 1.00 movi v0.2d, #0xff0000ff0000ffff
	# CHECK-NEXT: 1 4 0.50 movi v0.2s, #8, msl #8			# CHECK-NEXT: 1 4 0.50 movi v0.2s, #8, msl #8
	# CHECK-NEXT: 1 4 1.00 movi v0.4s, #255, lsl #24			# CHECK-NEXT: 1 4 1.00 movi v0.4s, #255, lsl #24
	# CHECK-NEXT: 1 4 0.50 movi v0.8b, #255			# CHECK-NEXT: 1 4 0.50 movi v0.8b, #255
	# CHECK-NEXT: 1 4 0.50 mul v0.8b, v0.8b, v0.8b			# CHECK-NEXT: 1 4 0.50 mul v0.8b, v0.8b, v0.8b
	# CHECK-NEXT: 1 4 0.50 mvni v0.2s, #0			# CHECK-NEXT: 1 1 0.50 mvni v0.2s, #0
	# CHECK-NEXT: 1 4 1.00 mvni v0.4s, #16, msl #16			# CHECK-NEXT: 1 1 1.00 mvni v0.4s, #16, msl #16
	# CHECK-NEXT: 1 4 0.50 neg d29, d24			# CHECK-NEXT: 1 2 0.50 neg d29, d24
	# CHECK-NEXT: 1 4 1.00 neg v0.16b, v0.16b			# CHECK-NEXT: 1 2 1.00 neg v0.16b, v0.16b
	# CHECK-NEXT: 1 4 1.00 neg v0.2d, v0.2d			# CHECK-NEXT: 1 2 1.00 neg v0.2d, v0.2d
	# CHECK-NEXT: 1 4 0.50 neg v0.2s, v0.2s			# CHECK-NEXT: 1 2 0.50 neg v0.2s, v0.2s
	# CHECK-NEXT: 1 4 0.50 neg v0.4h, v0.4h			# CHECK-NEXT: 1 2 0.50 neg v0.4h, v0.4h
	# CHECK-NEXT: 1 4 1.00 neg v0.4s, v0.4s			# CHECK-NEXT: 1 2 1.00 neg v0.4s, v0.4s
	# CHECK-NEXT: 1 4 0.50 neg v0.8b, v0.8b			# CHECK-NEXT: 1 2 0.50 neg v0.8b, v0.8b
	# CHECK-NEXT: 1 4 1.00 neg v0.8h, v0.8h			# CHECK-NEXT: 1 2 1.00 neg v0.8h, v0.8h
	# CHECK-NEXT: 1 4 1.00 mvn v0.16b, v0.16b			# CHECK-NEXT: 1 1 1.00 mvn v0.16b, v0.16b
	# CHECK-NEXT: 1 4 0.50 mvn v0.8b, v0.8b			# CHECK-NEXT: 1 1 0.50 mvn v0.8b, v0.8b
	# CHECK-NEXT: 1 4 1.00 orn v0.16b, v0.16b, v0.16b			# CHECK-NEXT: 1 1 1.00 orn v0.16b, v0.16b, v0.16b
	# CHECK-NEXT: 1 4 1.00 mov v0.16b, v0.16b			# CHECK-NEXT: 1 1 1.00 mov v0.16b, v0.16b
	# CHECK-NEXT: 1 4 1.00 orr v0.8h, #31			# CHECK-NEXT: 1 1 1.00 orr v0.8h, #31
	# CHECK-NEXT: 1 4 1.00 pmul v0.16b, v0.16b, v0.16b			# CHECK-NEXT: 1 3 1.00 pmul v0.16b, v0.16b, v0.16b
	# CHECK-NEXT: 1 4 0.50 pmul v0.8b, v0.8b, v0.8b			# CHECK-NEXT: 1 3 0.50 pmul v0.8b, v0.8b, v0.8b
	# CHECK-NEXT: 1 4 1.00 pmull v0.8h, v0.8b, v0.8b			# CHECK-NEXT: 1 3 1.00 pmull v0.8h, v0.8b, v0.8b
	# CHECK-NEXT: 1 4 1.00 pmull2 v0.8h, v0.16b, v0.16b			# CHECK-NEXT: 1 3 1.00 pmull2 v0.8h, v0.16b, v0.16b
	# CHECK-NEXT: 1 4 1.00 raddhn v0.2s, v0.2d, v0.2d			# CHECK-NEXT: 1 4 2.00 raddhn v0.2s, v0.2d, v0.2d
	# CHECK-NEXT: 1 4 1.00 raddhn v0.4h, v0.4s, v0.4s			# CHECK-NEXT: 1 4 2.00 raddhn v0.4h, v0.4s, v0.4s
	# CHECK-NEXT: 1 4 1.00 raddhn v0.8b, v0.8h, v0.8h			# CHECK-NEXT: 1 4 2.00 raddhn v0.8b, v0.8h, v0.8h
	# CHECK-NEXT: 1 4 1.00 raddhn2 v0.16b, v0.8h, v0.8h			# CHECK-NEXT: 1 4 2.00 raddhn2 v0.16b, v0.8h, v0.8h
	# CHECK-NEXT: 1 4 1.00 raddhn2 v0.4s, v0.2d, v0.2d			# CHECK-NEXT: 1 4 2.00 raddhn2 v0.4s, v0.2d, v0.2d
	# CHECK-NEXT: 1 4 1.00 raddhn2 v0.8h, v0.4s, v0.4s			# CHECK-NEXT: 1 4 2.00 raddhn2 v0.8h, v0.4s, v0.4s
	# CHECK-NEXT: 1 4 1.00 rbit v0.16b, v0.16b			# CHECK-NEXT: 1 4 1.00 rbit v0.16b, v0.16b
	# CHECK-NEXT: 1 4 0.50 rbit v0.8b, v0.8b			# CHECK-NEXT: 1 4 0.50 rbit v0.8b, v0.8b
	# CHECK-NEXT: 1 4 0.50 rev16 v21.8b, v1.8b			# CHECK-NEXT: 1 4 0.50 rev16 v21.8b, v1.8b
	# CHECK-NEXT: 1 4 1.00 rev16 v30.16b, v31.16b			# CHECK-NEXT: 1 4 1.00 rev16 v30.16b, v31.16b
	# CHECK-NEXT: 1 4 0.50 rev32 v0.4h, v9.4h			# CHECK-NEXT: 1 4 0.50 rev32 v0.4h, v9.4h
	# CHECK-NEXT: 1 4 0.50 rev32 v21.8b, v1.8b			# CHECK-NEXT: 1 4 0.50 rev32 v21.8b, v1.8b
	# CHECK-NEXT: 1 4 1.00 rev32 v30.16b, v31.16b			# CHECK-NEXT: 1 4 1.00 rev32 v30.16b, v31.16b
	# CHECK-NEXT: 1 4 1.00 rev32 v4.8h, v7.8h			# CHECK-NEXT: 1 4 1.00 rev32 v4.8h, v7.8h
	# CHECK-NEXT: 1 4 1.00 rev64 v0.16b, v31.16b			# CHECK-NEXT: 1 4 1.00 rev64 v0.16b, v31.16b
	# CHECK-NEXT: 1 4 0.50 rev64 v1.8b, v9.8b			# CHECK-NEXT: 1 4 0.50 rev64 v1.8b, v9.8b
	# CHECK-NEXT: 1 4 0.50 rev64 v13.4h, v21.4h			# CHECK-NEXT: 1 4 0.50 rev64 v13.4h, v21.4h
	# CHECK-NEXT: 1 4 1.00 rev64 v2.8h, v4.8h			# CHECK-NEXT: 1 4 1.00 rev64 v2.8h, v4.8h
	# CHECK-NEXT: 1 4 0.50 rev64 v4.2s, v0.2s			# CHECK-NEXT: 1 4 0.50 rev64 v4.2s, v0.2s
	# CHECK-NEXT: 1 4 1.00 rev64 v6.4s, v8.4s			# CHECK-NEXT: 1 4 1.00 rev64 v6.4s, v8.4s
	# CHECK-NEXT: 1 4 0.50 rshrn v0.2s, v0.2d, #3			# CHECK-NEXT: 1 3 0.50 rshrn v0.2s, v0.2d, #3
	# CHECK-NEXT: 1 4 0.50 rshrn v0.4h, v0.4s, #3			# CHECK-NEXT: 1 3 0.50 rshrn v0.4h, v0.4s, #3
	# CHECK-NEXT: 1 4 0.50 rshrn v0.8b, v0.8h, #3			# CHECK-NEXT: 1 3 0.50 rshrn v0.8b, v0.8h, #3
	# CHECK-NEXT: 1 4 1.00 rshrn2 v0.16b, v0.8h, #3			# CHECK-NEXT: 1 3 1.00 rshrn2 v0.16b, v0.8h, #3
	# CHECK-NEXT: 1 4 1.00 rshrn2 v0.4s, v0.2d, #3			# CHECK-NEXT: 1 3 1.00 rshrn2 v0.4s, v0.2d, #3
	# CHECK-NEXT: 1 4 1.00 rshrn2 v0.8h, v0.4s, #3			# CHECK-NEXT: 1 3 1.00 rshrn2 v0.8h, v0.4s, #3
	# CHECK-NEXT: 1 4 1.00 rsubhn v0.2s, v0.2d, v0.2d			# CHECK-NEXT: 1 4 2.00 rsubhn v0.2s, v0.2d, v0.2d
	# CHECK-NEXT: 1 4 1.00 rsubhn v0.4h, v0.4s, v0.4s			# CHECK-NEXT: 1 4 2.00 rsubhn v0.4h, v0.4s, v0.4s
	# CHECK-NEXT: 1 4 1.00 rsubhn v0.8b, v0.8h, v0.8h			# CHECK-NEXT: 1 4 2.00 rsubhn v0.8b, v0.8h, v0.8h
	# CHECK-NEXT: 1 4 1.00 rsubhn2 v0.16b, v0.8h, v0.8h			# CHECK-NEXT: 1 4 2.00 rsubhn2 v0.16b, v0.8h, v0.8h
	# CHECK-NEXT: 1 4 1.00 rsubhn2 v0.4s, v0.2d, v0.2d			# CHECK-NEXT: 1 4 2.00 rsubhn2 v0.4s, v0.2d, v0.2d
	# CHECK-NEXT: 1 4 1.00 rsubhn2 v0.8h, v0.4s, v0.4s			# CHECK-NEXT: 1 4 2.00 rsubhn2 v0.8h, v0.4s, v0.4s
	# CHECK-NEXT: 1 4 1.00 saba v0.16b, v0.16b, v0.16b			# CHECK-NEXT: 1 4 2.00 saba v0.16b, v0.16b, v0.16b
	# CHECK-NEXT: 1 4 1.00 sabal v0.2d, v0.2s, v0.2s			# CHECK-NEXT: 1 4 2.00 sabal v0.2d, v0.2s, v0.2s
	# CHECK-NEXT: 1 4 1.00 sabal v0.4s, v0.4h, v0.4h			# CHECK-NEXT: 1 4 2.00 sabal v0.4s, v0.4h, v0.4h
	# CHECK-NEXT: 1 4 1.00 sabal v0.8h, v0.8b, v0.8b			# CHECK-NEXT: 1 4 2.00 sabal v0.8h, v0.8b, v0.8b
	# CHECK-NEXT: 1 4 1.00 sabal2 v0.2d, v0.4s, v0.4s			# CHECK-NEXT: 1 4 2.00 sabal2 v0.2d, v0.4s, v0.4s
	# CHECK-NEXT: 1 4 1.00 sabal2 v0.4s, v0.8h, v0.8h			# CHECK-NEXT: 1 4 2.00 sabal2 v0.4s, v0.8h, v0.8h
	# CHECK-NEXT: 1 4 1.00 sabal2 v0.8h, v0.16b, v0.16b			# CHECK-NEXT: 1 4 2.00 sabal2 v0.8h, v0.16b, v0.16b
	# CHECK-NEXT: 1 4 0.50 sabd v0.4h, v0.4h, v0.4h			# CHECK-NEXT: 1 3 0.50 sabd v0.4h, v0.4h, v0.4h
	# CHECK-NEXT: 1 4 1.00 sabdl v0.2d, v0.2s, v0.2s			# CHECK-NEXT: 1 3 1.00 sabdl v0.2d, v0.2s, v0.2s
	# CHECK-NEXT: 1 4 1.00 sabdl v0.4s, v0.4h, v0.4h			# CHECK-NEXT: 1 3 1.00 sabdl v0.4s, v0.4h, v0.4h
	# CHECK-NEXT: 1 4 1.00 sabdl v0.8h, v0.8b, v0.8b			# CHECK-NEXT: 1 3 1.00 sabdl v0.8h, v0.8b, v0.8b
	# CHECK-NEXT: 1 4 1.00 sabdl2 v0.2d, v0.4s, v0.4s			# CHECK-NEXT: 1 3 1.00 sabdl2 v0.2d, v0.4s, v0.4s
	# CHECK-NEXT: 1 4 1.00 sabdl2 v0.4s, v0.8h, v0.8h			# CHECK-NEXT: 1 3 1.00 sabdl2 v0.4s, v0.8h, v0.8h
	# CHECK-NEXT: 1 4 1.00 sabdl2 v0.8h, v0.16b, v0.16b			# CHECK-NEXT: 1 3 1.00 sabdl2 v0.8h, v0.16b, v0.16b
	# CHECK-NEXT: 1 4 0.50 sadalp v0.1d, v0.2s			# CHECK-NEXT: 1 4 2.00 sadalp v0.1d, v0.2s
	# CHECK-NEXT: 1 4 1.00 sadalp v0.2d, v0.4s			# CHECK-NEXT: 1 4 2.00 sadalp v0.2d, v0.4s
	# CHECK-NEXT: 1 4 0.50 sadalp v0.2s, v0.4h			# CHECK-NEXT: 1 4 2.00 sadalp v0.2s, v0.4h
	# CHECK-NEXT: 1 4 0.50 sadalp v0.4h, v0.8b			# CHECK-NEXT: 1 4 2.00 sadalp v0.4h, v0.8b
	# CHECK-NEXT: 1 4 1.00 sadalp v0.4s, v0.8h			# CHECK-NEXT: 1 4 2.00 sadalp v0.4s, v0.8h
	# CHECK-NEXT: 1 4 1.00 sadalp v0.8h, v0.16b			# CHECK-NEXT: 1 4 2.00 sadalp v0.8h, v0.16b
	# CHECK-NEXT: 1 4 1.00 saddl v0.2d, v0.2s, v0.2s			# CHECK-NEXT: 1 3 1.00 saddl v0.2d, v0.2s, v0.2s
	# CHECK-NEXT: 1 4 1.00 saddl v0.4s, v0.4h, v0.4h			# CHECK-NEXT: 1 3 1.00 saddl v0.4s, v0.4h, v0.4h
	# CHECK-NEXT: 1 4 1.00 saddl v0.8h, v0.8b, v0.8b			# CHECK-NEXT: 1 3 1.00 saddl v0.8h, v0.8b, v0.8b
	# CHECK-NEXT: 1 4 1.00 saddl2 v0.2d, v0.4s, v0.4s			# CHECK-NEXT: 1 3 1.00 saddl2 v0.2d, v0.4s, v0.4s
	# CHECK-NEXT: 1 4 1.00 saddl2 v0.4s, v0.8h, v0.8h			# CHECK-NEXT: 1 3 1.00 saddl2 v0.4s, v0.8h, v0.8h
	# CHECK-NEXT: 1 4 1.00 saddl2 v0.8h, v0.16b, v0.16b			# CHECK-NEXT: 1 3 1.00 saddl2 v0.8h, v0.16b, v0.16b
	# CHECK-NEXT: 1 4 0.50 saddlp v0.1d, v0.2s			# CHECK-NEXT: 1 3 0.50 saddlp v0.1d, v0.2s
	# CHECK-NEXT: 1 4 1.00 saddlp v0.2d, v0.4s			# CHECK-NEXT: 1 3 1.00 saddlp v0.2d, v0.4s
	# CHECK-NEXT: 1 4 0.50 saddlp v0.2s, v0.4h			# CHECK-NEXT: 1 3 0.50 saddlp v0.2s, v0.4h
	# CHECK-NEXT: 1 4 0.50 saddlp v0.4h, v0.8b			# CHECK-NEXT: 1 3 0.50 saddlp v0.4h, v0.8b
	# CHECK-NEXT: 1 4 1.00 saddlp v0.4s, v0.8h			# CHECK-NEXT: 1 3 1.00 saddlp v0.4s, v0.8h
	# CHECK-NEXT: 1 4 1.00 saddlp v0.8h, v0.16b			# CHECK-NEXT: 1 3 1.00 saddlp v0.8h, v0.16b
	# CHECK-NEXT: 1 4 1.00 saddw v0.2d, v0.2d, v0.2s			# CHECK-NEXT: 1 3 1.00 saddw v0.2d, v0.2d, v0.2s
	# CHECK-NEXT: 1 4 1.00 saddw v0.4s, v0.4s, v0.4h			# CHECK-NEXT: 1 3 1.00 saddw v0.4s, v0.4s, v0.4h
	# CHECK-NEXT: 1 4 1.00 saddw v0.8h, v0.8h, v0.8b			# CHECK-NEXT: 1 3 1.00 saddw v0.8h, v0.8h, v0.8b
	# CHECK-NEXT: 1 4 1.00 saddw2 v0.2d, v0.2d, v0.4s			# CHECK-NEXT: 1 3 1.00 saddw2 v0.2d, v0.2d, v0.4s
	# CHECK-NEXT: 1 4 1.00 saddw2 v0.4s, v0.4s, v0.8h			# CHECK-NEXT: 1 3 1.00 saddw2 v0.4s, v0.4s, v0.8h
	# CHECK-NEXT: 1 4 1.00 saddw2 v0.8h, v0.8h, v0.16b			# CHECK-NEXT: 1 3 1.00 saddw2 v0.8h, v0.8h, v0.16b
	# CHECK-NEXT: 1 4 0.50 scvtf d21, d12			# CHECK-NEXT: 1 4 0.50 scvtf d21, d12
	# CHECK-NEXT: 1 4 0.50 scvtf d21, d12, #64			# CHECK-NEXT: 1 4 0.50 scvtf d21, d12, #64
	# CHECK-NEXT: 1 4 0.50 scvtf s22, s13			# CHECK-NEXT: 1 4 0.50 scvtf s22, s13
	# CHECK-NEXT: 1 4 0.50 scvtf s22, s13, #32			# CHECK-NEXT: 1 4 0.50 scvtf s22, s13, #32
	# CHECK-NEXT: 1 4 0.50 scvtf v0.2d, v0.2d			# CHECK-NEXT: 1 4 0.50 scvtf v0.2d, v0.2d
	# CHECK-NEXT: 1 4 0.50 scvtf v0.2d, v0.2d, #3			# CHECK-NEXT: 1 4 0.50 scvtf v0.2d, v0.2d, #3
	# CHECK-NEXT: 1 4 0.50 scvtf v0.2s, v0.2s			# CHECK-NEXT: 1 4 0.50 scvtf v0.2s, v0.2s
	# CHECK-NEXT: 1 4 0.50 scvtf v0.2s, v0.2s, #3			# CHECK-NEXT: 1 4 0.50 scvtf v0.2s, v0.2s, #3
	# CHECK-NEXT: 1 4 0.50 scvtf v0.4h, v0.4h			# CHECK-NEXT: 1 4 0.50 scvtf v0.4h, v0.4h
	# CHECK-NEXT: 1 4 0.50 scvtf v0.4s, v0.4s			# CHECK-NEXT: 1 4 0.50 scvtf v0.4s, v0.4s
	# CHECK-NEXT: 1 4 0.50 scvtf v0.4s, v0.4s, #3			# CHECK-NEXT: 1 4 0.50 scvtf v0.4s, v0.4s, #3
	# CHECK-NEXT: 1 4 0.50 scvtf v0.8h, v0.8h			# CHECK-NEXT: 1 4 0.50 scvtf v0.8h, v0.8h
	# CHECK-NEXT: 1 4 0.50 shadd v0.8b, v0.8b, v0.8b			# CHECK-NEXT: 1 2 0.50 shadd v0.8b, v0.8b, v0.8b
	# CHECK-NEXT: 1 4 0.50 shl d7, d10, #12			# CHECK-NEXT: 1 2 0.50 shl d7, d10, #12
	# CHECK-NEXT: 1 4 1.00 shl v0.16b, v0.16b, #3			# CHECK-NEXT: 1 2 0.50 shl v0.16b, v0.16b, #3
	# CHECK-NEXT: 1 4 1.00 shl v0.2d, v0.2d, #3			# CHECK-NEXT: 1 2 0.50 shl v0.2d, v0.2d, #3
	# CHECK-NEXT: 1 4 0.50 shl v0.4h, v0.4h, #3			# CHECK-NEXT: 1 2 0.50 shl v0.4h, v0.4h, #3
	# CHECK-NEXT: 1 4 1.00 shl v0.4s, v0.4s, #3			# CHECK-NEXT: 1 2 0.50 shl v0.4s, v0.4s, #3
	# CHECK-NEXT: 1 4 1.00 shll v0.2d, v0.2s, #32			# CHECK-NEXT: 1 2 1.00 shll v0.2d, v0.2s, #32
	# CHECK-NEXT: 1 4 1.00 shll v0.4s, v0.4h, #16			# CHECK-NEXT: 1 2 1.00 shll v0.4s, v0.4h, #16
	# CHECK-NEXT: 1 4 1.00 shll v0.8h, v0.8b, #8			# CHECK-NEXT: 1 2 1.00 shll v0.8h, v0.8b, #8
	# CHECK-NEXT: 1 4 1.00 shll v0.2d, v0.2s, #32			# CHECK-NEXT: 1 2 1.00 shll v0.2d, v0.2s, #32
	# CHECK-NEXT: 1 4 1.00 shll v0.4s, v0.4h, #16			# CHECK-NEXT: 1 2 1.00 shll v0.4s, v0.4h, #16
	# CHECK-NEXT: 1 4 1.00 shll v0.8h, v0.8b, #8			# CHECK-NEXT: 1 2 1.00 shll v0.8h, v0.8b, #8
	# CHECK-NEXT: 1 4 1.00 shll2 v0.2d, v0.4s, #32			# CHECK-NEXT: 1 2 1.00 shll2 v0.2d, v0.4s, #32
	# CHECK-NEXT: 1 4 1.00 shll2 v0.4s, v0.8h, #16			# CHECK-NEXT: 1 2 1.00 shll2 v0.4s, v0.8h, #16
	# CHECK-NEXT: 1 4 1.00 shll2 v0.8h, v0.16b, #8			# CHECK-NEXT: 1 2 1.00 shll2 v0.8h, v0.16b, #8
	# CHECK-NEXT: 1 4 1.00 shll2 v0.2d, v0.4s, #32			# CHECK-NEXT: 1 2 1.00 shll2 v0.2d, v0.4s, #32
	# CHECK-NEXT: 1 4 1.00 shll2 v0.4s, v0.8h, #16			# CHECK-NEXT: 1 2 1.00 shll2 v0.4s, v0.8h, #16
	# CHECK-NEXT: 1 4 1.00 shll2 v0.8h, v0.16b, #8			# CHECK-NEXT: 1 2 1.00 shll2 v0.8h, v0.16b, #8
	# CHECK-NEXT: 1 4 0.50 shrn v0.2s, v0.2d, #3			# CHECK-NEXT: 1 2 0.50 shrn v0.2s, v0.2d, #3
	# CHECK-NEXT: 1 4 0.50 shrn v0.4h, v0.4s, #3			# CHECK-NEXT: 1 2 0.50 shrn v0.4h, v0.4s, #3
	# CHECK-NEXT: 1 4 0.50 shrn v0.8b, v0.8h, #3			# CHECK-NEXT: 1 2 0.50 shrn v0.8b, v0.8h, #3
	# CHECK-NEXT: 1 4 1.00 shrn2 v0.16b, v0.8h, #3			# CHECK-NEXT: 1 2 0.50 shrn2 v0.16b, v0.8h, #3
	# CHECK-NEXT: 1 4 1.00 shrn2 v0.4s, v0.2d, #3			# CHECK-NEXT: 1 2 0.50 shrn2 v0.4s, v0.2d, #3
	# CHECK-NEXT: 1 4 1.00 shrn2 v0.8h, v0.4s, #3			# CHECK-NEXT: 1 2 0.50 shrn2 v0.8h, v0.4s, #3
	# CHECK-NEXT: 1 4 0.50 shsub v0.2s, v0.2s, v0.2s			# CHECK-NEXT: 1 2 0.50 shsub v0.2s, v0.2s, v0.2s
	# CHECK-NEXT: 1 4 0.50 shsub v0.4h, v0.4h, v0.4h			# CHECK-NEXT: 1 2 0.50 shsub v0.4h, v0.4h, v0.4h
	# CHECK-NEXT: 1 4 0.50 sli d10, d14, #12			# CHECK-NEXT: 1 2 0.50 sli d10, d14, #12
	# CHECK-NEXT: 1 4 1.00 sli v0.16b, v0.16b, #3			# CHECK-NEXT: 1 4 1.00 sli v0.16b, v0.16b, #3
	# CHECK-NEXT: 1 4 1.00 sli v0.2d, v0.2d, #3			# CHECK-NEXT: 1 4 1.00 sli v0.2d, v0.2d, #3
	# CHECK-NEXT: 1 4 0.50 sli v0.2s, v0.2s, #3			# CHECK-NEXT: 1 4 0.50 sli v0.2s, v0.2s, #3
	# CHECK-NEXT: 1 4 0.50 sli v0.4h, v0.4h, #3			# CHECK-NEXT: 1 4 0.50 sli v0.4h, v0.4h, #3
	# CHECK-NEXT: 1 4 1.00 sli v0.4s, v0.4s, #3			# CHECK-NEXT: 1 4 1.00 sli v0.4s, v0.4s, #3
	# CHECK-NEXT: 1 4 0.50 sli v0.8b, v0.8b, #3			# CHECK-NEXT: 1 4 0.50 sli v0.8b, v0.8b, #3
	# CHECK-NEXT: 1 4 1.00 sli v0.8h, v0.8h, #3			# CHECK-NEXT: 1 4 1.00 sli v0.8h, v0.8h, #3
	# CHECK-NEXT: 1 4 0.50 smax v0.2s, v0.2s, v0.2s			# CHECK-NEXT: 1 2 0.50 smax v0.2s, v0.2s, v0.2s
	# CHECK-NEXT: 1 4 0.50 smax v0.4h, v0.4h, v0.4h			# CHECK-NEXT: 1 2 0.50 smax v0.4h, v0.4h, v0.4h
	# CHECK-NEXT: 1 4 0.50 smax v0.8b, v0.8b, v0.8b			# CHECK-NEXT: 1 2 0.50 smax v0.8b, v0.8b, v0.8b
	# CHECK-NEXT: 1 4 0.50 smaxp v0.2s, v0.2s, v0.2s			# CHECK-NEXT: 1 2 0.50 smaxp v0.2s, v0.2s, v0.2s
	# CHECK-NEXT: 1 4 0.50 smaxp v0.4h, v0.4h, v0.4h			# CHECK-NEXT: 1 2 0.50 smaxp v0.4h, v0.4h, v0.4h
	# CHECK-NEXT: 1 4 0.50 smaxp v0.8b, v0.8b, v0.8b			# CHECK-NEXT: 1 2 0.50 smaxp v0.8b, v0.8b, v0.8b
	# CHECK-NEXT: 1 4 1.00 smin v0.16b, v0.16b, v0.16b			# CHECK-NEXT: 1 2 1.00 smin v0.16b, v0.16b, v0.16b
	# CHECK-NEXT: 1 4 1.00 smin v0.4s, v0.4s, v0.4s			# CHECK-NEXT: 1 4 1.00 smin v0.4s, v0.4s, v0.4s
	# CHECK-NEXT: 1 4 1.00 smin v0.8h, v0.8h, v0.8h			# CHECK-NEXT: 1 2 1.00 smin v0.8h, v0.8h, v0.8h
	# CHECK-NEXT: 1 4 1.00 sminp v0.16b, v0.16b, v0.16b			# CHECK-NEXT: 1 2 1.00 sminp v0.16b, v0.16b, v0.16b
	# CHECK-NEXT: 1 4 1.00 sminp v0.4s, v0.4s, v0.4s			# CHECK-NEXT: 1 4 1.00 sminp v0.4s, v0.4s, v0.4s
	# CHECK-NEXT: 1 4 1.00 sminp v0.8h, v0.8h, v0.8h			# CHECK-NEXT: 1 2 1.00 sminp v0.8h, v0.8h, v0.8h
	# CHECK-NEXT: 1 4 1.00 smlal v0.2d, v0.2s, v0.2s			# CHECK-NEXT: 1 4 1.00 smlal v0.2d, v0.2s, v0.2s
	# CHECK-NEXT: 1 4 1.00 smlal v0.4s, v0.4h, v0.4h			# CHECK-NEXT: 1 4 1.00 smlal v0.4s, v0.4h, v0.4h
	# CHECK-NEXT: 1 4 1.00 smlal v0.8h, v0.8b, v0.8b			# CHECK-NEXT: 1 4 1.00 smlal v0.8h, v0.8b, v0.8b
	# CHECK-NEXT: 1 4 1.00 smlal2 v0.2d, v0.4s, v0.4s			# CHECK-NEXT: 1 4 1.00 smlal2 v0.2d, v0.4s, v0.4s
	# CHECK-NEXT: 1 4 1.00 smlal2 v0.4s, v0.8h, v0.8h			# CHECK-NEXT: 1 4 1.00 smlal2 v0.4s, v0.8h, v0.8h
	# CHECK-NEXT: 1 4 1.00 smlal2 v0.8h, v0.16b, v0.16b			# CHECK-NEXT: 1 4 1.00 smlal2 v0.8h, v0.16b, v0.16b
	# CHECK-NEXT: 1 4 1.00 smlsl v0.2d, v0.2s, v0.2s			# CHECK-NEXT: 1 4 1.00 smlsl v0.2d, v0.2s, v0.2s
	# CHECK-NEXT: 1 4 1.00 smlsl v0.4s, v0.4h, v0.4h			# CHECK-NEXT: 1 4 1.00 smlsl v0.4s, v0.4h, v0.4h
	Show All 13 Lines
	# CHECK-NEXT: 1 4 0.50 sqabs s20, s12			# CHECK-NEXT: 1 4 0.50 sqabs s20, s12
	# CHECK-NEXT: 1 4 1.00 sqabs v0.16b, v0.16b			# CHECK-NEXT: 1 4 1.00 sqabs v0.16b, v0.16b
	# CHECK-NEXT: 1 4 1.00 sqabs v0.2d, v0.2d			# CHECK-NEXT: 1 4 1.00 sqabs v0.2d, v0.2d
	# CHECK-NEXT: 1 4 0.50 sqabs v0.2s, v0.2s			# CHECK-NEXT: 1 4 0.50 sqabs v0.2s, v0.2s
	# CHECK-NEXT: 1 4 0.50 sqabs v0.4h, v0.4h			# CHECK-NEXT: 1 4 0.50 sqabs v0.4h, v0.4h
	# CHECK-NEXT: 1 4 1.00 sqabs v0.4s, v0.4s			# CHECK-NEXT: 1 4 1.00 sqabs v0.4s, v0.4s
	# CHECK-NEXT: 1 4 0.50 sqabs v0.8b, v0.8b			# CHECK-NEXT: 1 4 0.50 sqabs v0.8b, v0.8b
	# CHECK-NEXT: 1 4 1.00 sqabs v0.8h, v0.8h			# CHECK-NEXT: 1 4 1.00 sqabs v0.8h, v0.8h
	# CHECK-NEXT: 1 4 0.50 sqadd b20, b11, b15			# CHECK-NEXT: 1 3 0.50 sqadd b20, b11, b15
	# CHECK-NEXT: 1 4 1.00 sqadd v0.16b, v0.16b, v0.16b			# CHECK-NEXT: 1 3 1.00 sqadd v0.16b, v0.16b, v0.16b
	# CHECK-NEXT: 1 4 0.50 sqadd v0.2s, v0.2s, v0.2s			# CHECK-NEXT: 1 3 0.50 sqadd v0.2s, v0.2s, v0.2s
	# CHECK-NEXT: 1 4 0.50 sqdmlal d19, s24, s12			# CHECK-NEXT: 1 4 1.00 sqdmlal d19, s24, s12
	# CHECK-NEXT: 1 4 0.50 sqdmlal d8, s9, v0.s[1]			# CHECK-NEXT: 1 4 1.00 sqdmlal d8, s9, v0.s[1]
	# CHECK-NEXT: 1 4 0.50 sqdmlal s0, h0, v0.h[3]			# CHECK-NEXT: 1 4 1.00 sqdmlal s0, h0, v0.h[3]
	# CHECK-NEXT: 1 4 0.50 sqdmlal s17, h27, h12			# CHECK-NEXT: 1 4 1.00 sqdmlal s17, h27, h12
	# CHECK-NEXT: 1 4 1.00 sqdmlal v0.2d, v0.2s, v0.2s			# CHECK-NEXT: 1 4 1.00 sqdmlal v0.2d, v0.2s, v0.2s
	# CHECK-NEXT: 1 4 1.00 sqdmlal v0.4s, v0.4h, v0.4h			# CHECK-NEXT: 1 4 1.00 sqdmlal v0.4s, v0.4h, v0.4h
	# CHECK-NEXT: 1 4 1.00 sqdmlal2 v0.2d, v0.4s, v0.4s			# CHECK-NEXT: 1 4 1.00 sqdmlal2 v0.2d, v0.4s, v0.4s
	# CHECK-NEXT: 1 4 1.00 sqdmlal2 v0.4s, v0.8h, v0.8h			# CHECK-NEXT: 1 4 1.00 sqdmlal2 v0.4s, v0.8h, v0.8h
	# CHECK-NEXT: 1 4 0.50 sqdmlsl d12, s23, s13			# CHECK-NEXT: 1 4 1.00 sqdmlsl d12, s23, s13
	# CHECK-NEXT: 1 4 0.50 sqdmlsl d8, s9, v0.s[1]			# CHECK-NEXT: 1 4 1.00 sqdmlsl d8, s9, v0.s[1]
	# CHECK-NEXT: 1 4 0.50 sqdmlsl s0, h0, v0.h[3]			# CHECK-NEXT: 1 4 1.00 sqdmlsl s0, h0, v0.h[3]
	# CHECK-NEXT: 1 4 0.50 sqdmlsl s14, h12, h25			# CHECK-NEXT: 1 4 1.00 sqdmlsl s14, h12, h25
	# CHECK-NEXT: 1 4 1.00 sqdmlsl v0.2d, v0.2s, v0.2s			# CHECK-NEXT: 1 4 1.00 sqdmlsl v0.2d, v0.2s, v0.2s
	# CHECK-NEXT: 1 4 1.00 sqdmlsl v0.4s, v0.4h, v0.4h			# CHECK-NEXT: 1 4 1.00 sqdmlsl v0.4s, v0.4h, v0.4h
	# CHECK-NEXT: 1 4 1.00 sqdmlsl2 v0.2d, v0.4s, v0.4s			# CHECK-NEXT: 1 4 1.00 sqdmlsl2 v0.2d, v0.4s, v0.4s
	# CHECK-NEXT: 1 4 1.00 sqdmlsl2 v0.4s, v0.8h, v0.8h			# CHECK-NEXT: 1 4 1.00 sqdmlsl2 v0.4s, v0.8h, v0.8h
	# CHECK-NEXT: 1 4 0.50 sqdmulh h10, h11, h12			# CHECK-NEXT: 1 4 0.50 sqdmulh h10, h11, h12
	# CHECK-NEXT: 1 4 0.50 sqdmulh h7, h15, v0.h[3]			# CHECK-NEXT: 1 4 1.00 sqdmulh h7, h15, v0.h[3]
	# CHECK-NEXT: 1 4 0.50 sqdmulh s15, s14, v0.s[1]			# CHECK-NEXT: 1 4 1.00 sqdmulh s15, s14, v0.s[1]
	# CHECK-NEXT: 1 4 0.50 sqdmulh s20, s21, s2			# CHECK-NEXT: 1 4 0.50 sqdmulh s20, s21, s2
	# CHECK-NEXT: 1 4 0.50 sqdmulh v0.2s, v0.2s, v0.2s			# CHECK-NEXT: 1 4 0.50 sqdmulh v0.2s, v0.2s, v0.2s
	# CHECK-NEXT: 1 4 1.00 sqdmulh v0.4s, v0.4s, v0.4s			# CHECK-NEXT: 1 4 1.00 sqdmulh v0.4s, v0.4s, v0.4s
	# CHECK-NEXT: 1 4 0.50 sqdmull d1, s1, v0.s[1]			# CHECK-NEXT: 1 4 1.00 sqdmull d1, s1, v0.s[1]
	# CHECK-NEXT: 1 4 0.50 sqdmull d15, s22, s12			# CHECK-NEXT: 1 4 1.00 sqdmull d15, s22, s12
	# CHECK-NEXT: 1 4 0.50 sqdmull s1, h1, v0.h[3]			# CHECK-NEXT: 1 4 1.00 sqdmull s1, h1, v0.h[3]
	# CHECK-NEXT: 1 4 0.50 sqdmull s12, h22, h12			# CHECK-NEXT: 1 4 1.00 sqdmull s12, h22, h12
	# CHECK-NEXT: 1 4 1.00 sqdmull v0.2d, v0.2s, v0.2s			# CHECK-NEXT: 1 4 1.00 sqdmull v0.2d, v0.2s, v0.2s
	# CHECK-NEXT: 1 4 1.00 sqdmull v0.4s, v0.4h, v0.4h			# CHECK-NEXT: 1 4 1.00 sqdmull v0.4s, v0.4h, v0.4h
	# CHECK-NEXT: 1 4 1.00 sqdmull2 v0.2d, v0.4s, v0.4s			# CHECK-NEXT: 1 4 1.00 sqdmull2 v0.2d, v0.4s, v0.4s
	# CHECK-NEXT: 1 4 1.00 sqdmull2 v0.4s, v0.8h, v0.8h			# CHECK-NEXT: 1 4 1.00 sqdmull2 v0.4s, v0.8h, v0.8h
	# CHECK-NEXT: 1 4 0.50 sqneg b19, b14			# CHECK-NEXT: 1 3 0.50 sqneg b19, b14
	# CHECK-NEXT: 1 4 0.50 sqneg d18, d12			# CHECK-NEXT: 1 3 0.50 sqneg d18, d12
	# CHECK-NEXT: 1 4 0.50 sqneg h21, h15			# CHECK-NEXT: 1 3 0.50 sqneg h21, h15
	# CHECK-NEXT: 1 4 0.50 sqneg s20, s12			# CHECK-NEXT: 1 3 0.50 sqneg s20, s12
	# CHECK-NEXT: 1 4 1.00 sqneg v0.16b, v0.16b			# CHECK-NEXT: 1 3 1.00 sqneg v0.16b, v0.16b
	# CHECK-NEXT: 1 4 1.00 sqneg v0.2d, v0.2d			# CHECK-NEXT: 1 3 1.00 sqneg v0.2d, v0.2d
	# CHECK-NEXT: 1 4 0.50 sqneg v0.2s, v0.2s			# CHECK-NEXT: 1 3 0.50 sqneg v0.2s, v0.2s
	# CHECK-NEXT: 1 4 0.50 sqneg v0.4h, v0.4h			# CHECK-NEXT: 1 3 0.50 sqneg v0.4h, v0.4h
	# CHECK-NEXT: 1 4 1.00 sqneg v0.4s, v0.4s			# CHECK-NEXT: 1 3 1.00 sqneg v0.4s, v0.4s
	# CHECK-NEXT: 1 4 0.50 sqneg v0.8b, v0.8b			# CHECK-NEXT: 1 3 0.50 sqneg v0.8b, v0.8b
	# CHECK-NEXT: 1 4 1.00 sqneg v0.8h, v0.8h			# CHECK-NEXT: 1 3 1.00 sqneg v0.8h, v0.8h
	# CHECK-NEXT: 1 4 0.50 sqrdmulh h10, h11, h12			# CHECK-NEXT: 1 4 0.50 sqrdmulh h10, h11, h12
	# CHECK-NEXT: 1 4 0.50 sqrdmulh h7, h15, v0.h[3]			# CHECK-NEXT: 1 4 1.00 sqrdmulh h7, h15, v0.h[3]
	# CHECK-NEXT: 1 4 0.50 sqrdmulh s15, s14, v0.s[1]			# CHECK-NEXT: 1 4 1.00 sqrdmulh s15, s14, v0.s[1]
	# CHECK-NEXT: 1 4 0.50 sqrdmulh s20, s21, s2			# CHECK-NEXT: 1 4 0.50 sqrdmulh s20, s21, s2
	# CHECK-NEXT: 1 4 0.50 sqrdmulh v0.4h, v0.4h, v0.4h			# CHECK-NEXT: 1 4 0.50 sqrdmulh v0.4h, v0.4h, v0.4h
	# CHECK-NEXT: 1 4 1.00 sqrdmulh v0.8h, v0.8h, v0.8h			# CHECK-NEXT: 1 4 1.00 sqrdmulh v0.8h, v0.8h, v0.8h
	# CHECK-NEXT: 1 4 0.50 sqrshl d31, d31, d31			# CHECK-NEXT: 1 4 0.50 sqrshl d31, d31, d31
	# CHECK-NEXT: 1 4 0.50 sqrshl h3, h4, h15			# CHECK-NEXT: 1 4 0.50 sqrshl h3, h4, h15
	# CHECK-NEXT: 1 4 0.50 sqrshl v0.2s, v0.2s, v0.2s			# CHECK-NEXT: 1 4 0.50 sqrshl v0.2s, v0.2s, v0.2s
	# CHECK-NEXT: 1 4 0.50 sqrshl v0.4h, v0.4h, v0.4h			# CHECK-NEXT: 1 4 0.50 sqrshl v0.4h, v0.4h, v0.4h
	# CHECK-NEXT: 1 4 0.50 sqrshl v0.8b, v0.8b, v0.8b			# CHECK-NEXT: 1 4 0.50 sqrshl v0.8b, v0.8b, v0.8b
	▲ Show 20 Lines • Show All 55 Lines • ▼ Show 20 Lines
	# CHECK-NEXT: 1 4 0.50 sqshrun h20, s14, #3			# CHECK-NEXT: 1 4 0.50 sqshrun h20, s14, #3
	# CHECK-NEXT: 1 4 0.50 sqshrun s10, d15, #15			# CHECK-NEXT: 1 4 0.50 sqshrun s10, d15, #15
	# CHECK-NEXT: 1 4 0.50 sqshrun v0.2s, v0.2d, #3			# CHECK-NEXT: 1 4 0.50 sqshrun v0.2s, v0.2d, #3
	# CHECK-NEXT: 1 4 0.50 sqshrun v0.4h, v0.4s, #3			# CHECK-NEXT: 1 4 0.50 sqshrun v0.4h, v0.4s, #3
	# CHECK-NEXT: 1 4 0.50 sqshrun v0.8b, v0.8h, #3			# CHECK-NEXT: 1 4 0.50 sqshrun v0.8b, v0.8h, #3
	# CHECK-NEXT: 1 4 1.00 sqshrun2 v0.16b, v0.8h, #3			# CHECK-NEXT: 1 4 1.00 sqshrun2 v0.16b, v0.8h, #3
	# CHECK-NEXT: 1 4 1.00 sqshrun2 v0.4s, v0.2d, #3			# CHECK-NEXT: 1 4 1.00 sqshrun2 v0.4s, v0.2d, #3
	# CHECK-NEXT: 1 4 1.00 sqshrun2 v0.8h, v0.4s, #3			# CHECK-NEXT: 1 4 1.00 sqshrun2 v0.8h, v0.4s, #3
	# CHECK-NEXT: 1 4 0.50 sqsub s20, s10, s7			# CHECK-NEXT: 1 3 0.50 sqsub s20, s10, s7
	# CHECK-NEXT: 1 4 1.00 sqsub v0.2d, v0.2d, v0.2d			# CHECK-NEXT: 1 3 1.00 sqsub v0.2d, v0.2d, v0.2d
	# CHECK-NEXT: 1 4 1.00 sqsub v0.4s, v0.4s, v0.4s			# CHECK-NEXT: 1 3 1.00 sqsub v0.4s, v0.4s, v0.4s
	# CHECK-NEXT: 1 4 0.50 sqsub v0.8b, v0.8b, v0.8b			# CHECK-NEXT: 1 3 0.50 sqsub v0.8b, v0.8b, v0.8b
	# CHECK-NEXT: 1 4 0.50 sqxtn b18, h18			# CHECK-NEXT: 1 4 0.50 sqxtn b18, h18
	# CHECK-NEXT: 1 4 0.50 sqxtn h20, s17			# CHECK-NEXT: 1 4 0.50 sqxtn h20, s17
	# CHECK-NEXT: 1 4 0.50 sqxtn s19, d14			# CHECK-NEXT: 1 4 0.50 sqxtn s19, d14
	# CHECK-NEXT: 1 4 1.00 sqxtn v0.2s, v0.2d			# CHECK-NEXT: 1 4 1.00 sqxtn v0.2s, v0.2d
	# CHECK-NEXT: 1 4 1.00 sqxtn v0.4h, v0.4s			# CHECK-NEXT: 1 4 1.00 sqxtn v0.4h, v0.4s
	# CHECK-NEXT: 1 4 1.00 sqxtn v0.8b, v0.8h			# CHECK-NEXT: 1 4 1.00 sqxtn v0.8b, v0.8h
	# CHECK-NEXT: 1 4 1.00 sqxtn2 v0.16b, v0.8h			# CHECK-NEXT: 1 4 1.00 sqxtn2 v0.16b, v0.8h
	# CHECK-NEXT: 1 4 1.00 sqxtn2 v0.4s, v0.2d			# CHECK-NEXT: 1 4 1.00 sqxtn2 v0.4s, v0.2d
	# CHECK-NEXT: 1 4 1.00 sqxtn2 v0.8h, v0.4s			# CHECK-NEXT: 1 4 1.00 sqxtn2 v0.8h, v0.4s
	# CHECK-NEXT: 1 4 0.50 sqxtun b19, h14			# CHECK-NEXT: 1 4 0.50 sqxtun b19, h14
	# CHECK-NEXT: 1 4 0.50 sqxtun h21, s15			# CHECK-NEXT: 1 4 0.50 sqxtun h21, s15
	# CHECK-NEXT: 1 4 0.50 sqxtun s20, d12			# CHECK-NEXT: 1 4 0.50 sqxtun s20, d12
	# CHECK-NEXT: 1 4 1.00 sqxtun v0.2s, v0.2d			# CHECK-NEXT: 1 4 1.00 sqxtun v0.2s, v0.2d
	# CHECK-NEXT: 1 4 1.00 sqxtun v0.4h, v0.4s			# CHECK-NEXT: 1 4 1.00 sqxtun v0.4h, v0.4s
	# CHECK-NEXT: 1 4 1.00 sqxtun v0.8b, v0.8h			# CHECK-NEXT: 1 4 1.00 sqxtun v0.8b, v0.8h
	# CHECK-NEXT: 1 4 1.00 sqxtun2 v0.16b, v0.8h			# CHECK-NEXT: 1 4 1.00 sqxtun2 v0.16b, v0.8h
	# CHECK-NEXT: 1 4 1.00 sqxtun2 v0.4s, v0.2d			# CHECK-NEXT: 1 4 1.00 sqxtun2 v0.4s, v0.2d
	# CHECK-NEXT: 1 4 1.00 sqxtun2 v0.8h, v0.4s			# CHECK-NEXT: 1 4 1.00 sqxtun2 v0.8h, v0.4s
	# CHECK-NEXT: 1 4 0.50 srhadd v0.2s, v0.2s, v0.2s			# CHECK-NEXT: 1 2 0.50 srhadd v0.2s, v0.2s, v0.2s
	# CHECK-NEXT: 1 4 0.50 srhadd v0.4h, v0.4h, v0.4h			# CHECK-NEXT: 1 2 0.50 srhadd v0.4h, v0.4h, v0.4h
	# CHECK-NEXT: 1 4 0.50 srhadd v0.8b, v0.8b, v0.8b			# CHECK-NEXT: 1 2 0.50 srhadd v0.8b, v0.8b, v0.8b
	# CHECK-NEXT: 1 4 0.50 sri d10, d12, #14			# CHECK-NEXT: 1 2 0.50 sri d10, d12, #14
	# CHECK-NEXT: 1 4 1.00 sri v0.16b, v0.16b, #3			# CHECK-NEXT: 1 4 1.00 sri v0.16b, v0.16b, #3
	# CHECK-NEXT: 1 4 1.00 sri v0.2d, v0.2d, #3			# CHECK-NEXT: 1 4 1.00 sri v0.2d, v0.2d, #3
	# CHECK-NEXT: 1 4 0.50 sri v0.2s, v0.2s, #3			# CHECK-NEXT: 1 4 0.50 sri v0.2s, v0.2s, #3
	# CHECK-NEXT: 1 4 0.50 sri v0.4h, v0.4h, #3			# CHECK-NEXT: 1 4 0.50 sri v0.4h, v0.4h, #3
	# CHECK-NEXT: 1 4 1.00 sri v0.4s, v0.4s, #3			# CHECK-NEXT: 1 4 1.00 sri v0.4s, v0.4s, #3
	# CHECK-NEXT: 1 4 0.50 sri v0.8b, v0.8b, #3			# CHECK-NEXT: 1 4 0.50 sri v0.8b, v0.8b, #3
	# CHECK-NEXT: 1 4 1.00 sri v0.8h, v0.8h, #3			# CHECK-NEXT: 1 4 1.00 sri v0.8h, v0.8h, #3
	# CHECK-NEXT: 1 4 0.50 srshl d16, d16, d16			# CHECK-NEXT: 1 3 0.50 srshl d16, d16, d16
	# CHECK-NEXT: 1 4 0.50 srshl v0.2s, v0.2s, v0.2s			# CHECK-NEXT: 1 3 0.50 srshl v0.2s, v0.2s, v0.2s
	# CHECK-NEXT: 1 4 0.50 srshl v0.4h, v0.4h, v0.4h			# CHECK-NEXT: 1 3 0.50 srshl v0.4h, v0.4h, v0.4h
	# CHECK-NEXT: 1 4 0.50 srshl v0.8b, v0.8b, v0.8b			# CHECK-NEXT: 1 3 0.50 srshl v0.8b, v0.8b, v0.8b
	# CHECK-NEXT: 1 4 0.50 srshr d19, d18, #7			# CHECK-NEXT: 1 3 0.50 srshr d19, d18, #7
	# CHECK-NEXT: 1 4 1.00 srshr v0.16b, v0.16b, #3			# CHECK-NEXT: 1 3 1.00 srshr v0.16b, v0.16b, #3
	# CHECK-NEXT: 1 4 1.00 srshr v0.2d, v0.2d, #3			# CHECK-NEXT: 1 3 1.00 srshr v0.2d, v0.2d, #3
	# CHECK-NEXT: 1 4 0.50 srshr v0.2s, v0.2s, #3			# CHECK-NEXT: 1 3 0.50 srshr v0.2s, v0.2s, #3
	# CHECK-NEXT: 1 4 0.50 srshr v0.4h, v0.4h, #3			# CHECK-NEXT: 1 3 0.50 srshr v0.4h, v0.4h, #3
	# CHECK-NEXT: 1 4 1.00 srshr v0.4s, v0.4s, #3			# CHECK-NEXT: 1 3 1.00 srshr v0.4s, v0.4s, #3
	# CHECK-NEXT: 1 4 0.50 srshr v0.8b, v0.8b, #3			# CHECK-NEXT: 1 3 0.50 srshr v0.8b, v0.8b, #3
	# CHECK-NEXT: 1 4 1.00 srshr v0.8h, v0.8h, #3			# CHECK-NEXT: 1 3 1.00 srshr v0.8h, v0.8h, #3
	# CHECK-NEXT: 1 4 0.50 srsra d15, d11, #19			# CHECK-NEXT: 1 4 2.00 srsra d15, d11, #19
	# CHECK-NEXT: 1 4 1.00 srsra v0.16b, v0.16b, #3			# CHECK-NEXT: 1 4 2.00 srsra v0.16b, v0.16b, #3
	# CHECK-NEXT: 1 4 1.00 srsra v0.2d, v0.2d, #3			# CHECK-NEXT: 1 4 2.00 srsra v0.2d, v0.2d, #3
	# CHECK-NEXT: 1 4 0.50 srsra v0.2s, v0.2s, #3			# CHECK-NEXT: 1 4 2.00 srsra v0.2s, v0.2s, #3
	# CHECK-NEXT: 1 4 0.50 srsra v0.4h, v0.4h, #3			# CHECK-NEXT: 1 4 2.00 srsra v0.4h, v0.4h, #3
	# CHECK-NEXT: 1 4 1.00 srsra v0.4s, v0.4s, #3			# CHECK-NEXT: 1 4 2.00 srsra v0.4s, v0.4s, #3
	# CHECK-NEXT: 1 4 0.50 srsra v0.8b, v0.8b, #3			# CHECK-NEXT: 1 4 2.00 srsra v0.8b, v0.8b, #3
	# CHECK-NEXT: 1 4 1.00 srsra v0.8h, v0.8h, #3			# CHECK-NEXT: 1 4 2.00 srsra v0.8h, v0.8h, #3
	# CHECK-NEXT: 1 4 0.50 sshl d31, d31, d31			# CHECK-NEXT: 1 2 0.50 sshl d31, d31, d31
	# CHECK-NEXT: 1 4 1.00 sshl v0.2d, v0.2d, v0.2d			# CHECK-NEXT: 1 2 1.00 sshl v0.2d, v0.2d, v0.2d
	# CHECK-NEXT: 1 4 0.50 sshl v0.2s, v0.2s, v0.2s			# CHECK-NEXT: 1 2 0.50 sshl v0.2s, v0.2s, v0.2s
	# CHECK-NEXT: 1 4 0.50 sshl v0.4h, v0.4h, v0.4h			# CHECK-NEXT: 1 2 0.50 sshl v0.4h, v0.4h, v0.4h
	# CHECK-NEXT: 1 4 0.50 sshl v0.8b, v0.8b, v0.8b			# CHECK-NEXT: 1 2 0.50 sshl v0.8b, v0.8b, v0.8b
	# CHECK-NEXT: 1 4 0.50 sshll v0.2d, v0.2s, #3			# CHECK-NEXT: 1 2 1.00 sshll v0.2d, v0.2s, #3
	# CHECK-NEXT: 1 4 1.00 sshll2 v0.4s, v0.8h, #3			# CHECK-NEXT: 1 2 1.00 sshll2 v0.4s, v0.8h, #3
	# CHECK-NEXT: 1 4 0.50 sshr d15, d16, #12			# CHECK-NEXT: 1 2 0.50 sshr d15, d16, #12
	# CHECK-NEXT: 1 4 1.00 sshr v0.16b, v0.16b, #3			# CHECK-NEXT: 1 2 0.50 sshr v0.16b, v0.16b, #3
	# CHECK-NEXT: 1 4 1.00 sshr v0.2d, v0.2d, #3			# CHECK-NEXT: 1 2 0.50 sshr v0.2d, v0.2d, #3
	# CHECK-NEXT: 1 4 0.50 sshr v0.2s, v0.2s, #3			# CHECK-NEXT: 1 2 0.50 sshr v0.2s, v0.2s, #3
	# CHECK-NEXT: 1 4 0.50 sshr v0.4h, v0.4h, #3			# CHECK-NEXT: 1 2 0.50 sshr v0.4h, v0.4h, #3
	# CHECK-NEXT: 1 4 1.00 sshr v0.4s, v0.4s, #3			# CHECK-NEXT: 1 2 0.50 sshr v0.4s, v0.4s, #3
	# CHECK-NEXT: 1 4 0.50 sshr v0.8b, v0.8b, #3			# CHECK-NEXT: 1 2 0.50 sshr v0.8b, v0.8b, #3
	# CHECK-NEXT: 1 4 1.00 sshr v0.8h, v0.8h, #3			# CHECK-NEXT: 1 2 0.50 sshr v0.8h, v0.8h, #3
	# CHECK-NEXT: 1 4 0.50 ssra d18, d12, #21			# CHECK-NEXT: 1 3 0.50 ssra d18, d12, #21
	# CHECK-NEXT: 1 4 1.00 ssra v0.16b, v0.16b, #3			# CHECK-NEXT: 1 3 1.00 ssra v0.16b, v0.16b, #3
	# CHECK-NEXT: 1 4 1.00 ssra v0.2d, v0.2d, #3			# CHECK-NEXT: 1 3 1.00 ssra v0.2d, v0.2d, #3
	# CHECK-NEXT: 1 4 0.50 ssra v0.2s, v0.2s, #3			# CHECK-NEXT: 1 3 0.50 ssra v0.2s, v0.2s, #3
	# CHECK-NEXT: 1 4 0.50 ssra v0.4h, v0.4h, #3			# CHECK-NEXT: 1 3 0.50 ssra v0.4h, v0.4h, #3
	# CHECK-NEXT: 1 4 1.00 ssra v0.4s, v0.4s, #3			# CHECK-NEXT: 1 3 1.00 ssra v0.4s, v0.4s, #3
	# CHECK-NEXT: 1 4 0.50 ssra v0.8b, v0.8b, #3			# CHECK-NEXT: 1 3 0.50 ssra v0.8b, v0.8b, #3
	# CHECK-NEXT: 1 4 1.00 ssra v0.8h, v0.8h, #3			# CHECK-NEXT: 1 3 1.00 ssra v0.8h, v0.8h, #3
	# CHECK-NEXT: 1 4 1.00 ssubl v0.2d, v0.2s, v0.2s			# CHECK-NEXT: 1 3 1.00 ssubl v0.2d, v0.2s, v0.2s
	# CHECK-NEXT: 1 4 1.00 ssubl v0.4s, v0.4h, v0.4h			# CHECK-NEXT: 1 3 1.00 ssubl v0.4s, v0.4h, v0.4h
	# CHECK-NEXT: 1 4 1.00 ssubl v0.8h, v0.8b, v0.8b			# CHECK-NEXT: 1 3 1.00 ssubl v0.8h, v0.8b, v0.8b
	# CHECK-NEXT: 1 4 1.00 ssubl2 v0.2d, v0.4s, v0.4s			# CHECK-NEXT: 1 3 1.00 ssubl2 v0.2d, v0.4s, v0.4s
	# CHECK-NEXT: 1 4 1.00 ssubl2 v0.4s, v0.8h, v0.8h			# CHECK-NEXT: 1 3 1.00 ssubl2 v0.4s, v0.8h, v0.8h
	# CHECK-NEXT: 1 4 1.00 ssubl2 v0.8h, v0.16b, v0.16b			# CHECK-NEXT: 1 3 1.00 ssubl2 v0.8h, v0.16b, v0.16b
	# CHECK-NEXT: 1 4 1.00 ssubw v0.2d, v0.2d, v0.2s			# CHECK-NEXT: 1 3 1.00 ssubw v0.2d, v0.2d, v0.2s
	# CHECK-NEXT: 1 4 1.00 ssubw v0.4s, v0.4s, v0.4h			# CHECK-NEXT: 1 3 1.00 ssubw v0.4s, v0.4s, v0.4h
	# CHECK-NEXT: 1 4 1.00 ssubw v0.8h, v0.8h, v0.8b			# CHECK-NEXT: 1 3 1.00 ssubw v0.8h, v0.8h, v0.8b
	# CHECK-NEXT: 1 4 1.00 ssubw2 v0.2d, v0.2d, v0.4s			# CHECK-NEXT: 1 3 1.00 ssubw2 v0.2d, v0.2d, v0.4s
	# CHECK-NEXT: 1 4 1.00 ssubw2 v0.4s, v0.4s, v0.8h			# CHECK-NEXT: 1 3 1.00 ssubw2 v0.4s, v0.4s, v0.8h
	# CHECK-NEXT: 1 4 1.00 ssubw2 v0.8h, v0.8h, v0.16b			# CHECK-NEXT: 1 3 1.00 ssubw2 v0.8h, v0.8h, v0.16b
	# CHECK-NEXT: 1 4 1.00 * st1 { v0.16b }, [x0]			# CHECK-NEXT: 1 4 1.00 * st1 { v0.16b }, [x0]
	# CHECK-NEXT: 2 5 2.00 * st1 { v0.2d, v1.2d, v2.2d }, [x0], #48			# CHECK-NEXT: 2 5 2.00 * st1 { v0.2d, v1.2d, v2.2d }, [x0], #48
	# CHECK-NEXT: 1 5 4.00 * st1 { v0.2d, v1.2d, v2.2d, v3.2d }, [x0]			# CHECK-NEXT: 1 5 4.00 * st1 { v0.2d, v1.2d, v2.2d, v3.2d }, [x0]
	# CHECK-NEXT: 2 4 1.00 * st1 { v0.4s, v1.4s }, [sp], #32			# CHECK-NEXT: 2 4 1.00 * st1 { v0.4s, v1.4s }, [sp], #32
	# CHECK-NEXT: 1 5 2.00 * st1 { v0.4s, v1.4s, v2.4s }, [sp]			# CHECK-NEXT: 1 5 2.00 * st1 { v0.4s, v1.4s, v2.4s }, [sp]
	# CHECK-NEXT: 2 5 4.00 * st1 { v0.8b, v1.8b, v2.8b, v3.8b }, [x0], x3			# CHECK-NEXT: 2 5 4.00 * st1 { v0.8b, v1.8b, v2.8b, v3.8b }, [x0], x3
	# CHECK-NEXT: 2 4 1.00 * st1 { v0.8h }, [x15], x2			# CHECK-NEXT: 2 4 1.00 * st1 { v0.8h }, [x15], x2
	# CHECK-NEXT: 1 4 1.00 * st1 { v0.8h, v1.8h }, [x15]			# CHECK-NEXT: 1 4 1.00 * st1 { v0.8h, v1.8h }, [x15]
	# CHECK-NEXT: 1 4 1.00 * st1 { v0.d }[1], [x0]			# CHECK-NEXT: 1 4 1.00 * st1 { v0.d }[1], [x0]
	# CHECK-NEXT: 2 4 1.00 * st1 { v0.d }[1], [x0], #8			# CHECK-NEXT: 2 4 1.00 * st1 { v0.d }[1], [x0], #8
	# CHECK-NEXT: 2 5 4.00 * st2 { v0.16b, v1.16b }, [x0], x1			# CHECK-NEXT: 2 5 4.00 * st2 { v0.16b, v1.16b }, [x0], x1
	# CHECK-NEXT: 1 5 2.00 * st2 { v0.8b, v1.8b }, [x0]			# CHECK-NEXT: 1 5 2.00 * st2 { v0.8b, v1.8b }, [x0]
	# CHECK-NEXT: 1 5 2.00 * st2 { v0.s, v1.s }[3], [sp]			# CHECK-NEXT: 1 5 2.00 * st2 { v0.s, v1.s }[3], [sp]
	# CHECK-NEXT: 2 5 2.00 * st2 { v0.s, v1.s }[3], [sp], #8			# CHECK-NEXT: 2 5 2.00 * st2 { v0.s, v1.s }[3], [sp], #8
	# CHECK-NEXT: 1 5 4.00 * st3 { v0.4h, v1.4h, v2.4h }, [x15]			# CHECK-NEXT: 1 5 4.00 * st3 { v0.4h, v1.4h, v2.4h }, [x15]
	# CHECK-NEXT: 2 5 4.00 * st3 { v0.8h, v1.8h, v2.8h }, [x15], x2			# CHECK-NEXT: 2 5 4.00 * st3 { v0.8h, v1.8h, v2.8h }, [x15], x2
	# CHECK-NEXT: 1 5 2.00 * st3 { v0.h, v1.h, v2.h }[7], [x15]			# CHECK-NEXT: 1 5 2.00 * st3 { v0.h, v1.h, v2.h }[7], [x15]
	# CHECK-NEXT: 2 5 2.00 * st3 { v0.h, v1.h, v2.h }[7], [x15], #6			# CHECK-NEXT: 2 5 2.00 * st3 { v0.h, v1.h, v2.h }[7], [x15], #6
	# CHECK-NEXT: 1 5 4.00 * st4 { v0.2s, v1.2s, v2.2s, v3.2s }, [sp]			# CHECK-NEXT: 1 5 4.00 * st4 { v0.2s, v1.2s, v2.2s, v3.2s }, [sp]
	# CHECK-NEXT: 2 5 4.00 * st4 { v0.4s, v1.4s, v2.4s, v3.4s }, [sp], #64			# CHECK-NEXT: 2 5 4.00 * st4 { v0.4s, v1.4s, v2.4s, v3.4s }, [sp], #64
	# CHECK-NEXT: 1 5 2.00 * st4 { v0.b, v1.b, v2.b, v3.b }[9], [x0]			# CHECK-NEXT: 1 5 2.00 * st4 { v0.b, v1.b, v2.b, v3.b }[9], [x0]
	# CHECK-NEXT: 2 5 2.00 * st4 { v0.b, v1.b, v2.b, v3.b }[9], [x0], x5			# CHECK-NEXT: 2 5 2.00 * st4 { v0.b, v1.b, v2.b, v3.b }[9], [x0], x5
	# CHECK-NEXT: 1 4 0.50 sub d15, d5, d16			# CHECK-NEXT: 1 2 0.50 sub d15, d5, d16
	# CHECK-NEXT: 1 4 1.00 sub v0.2d, v0.2d, v0.2d			# CHECK-NEXT: 1 2 1.00 sub v0.2d, v0.2d, v0.2d
	# CHECK-NEXT: 1 4 0.50 suqadd b19, b14			# CHECK-NEXT: 1 3 0.50 suqadd b19, b14
	# CHECK-NEXT: 1 4 0.50 suqadd d18, d22			# CHECK-NEXT: 1 3 0.50 suqadd d18, d22
	# CHECK-NEXT: 1 4 0.50 suqadd h20, h15			# CHECK-NEXT: 1 3 0.50 suqadd h20, h15
	# CHECK-NEXT: 1 4 0.50 suqadd s21, s12			# CHECK-NEXT: 1 3 0.50 suqadd s21, s12
	# CHECK-NEXT: 1 4 1.00 suqadd v0.16b, v0.16b			# CHECK-NEXT: 1 3 1.00 suqadd v0.16b, v0.16b
	# CHECK-NEXT: 1 4 1.00 suqadd v0.2d, v0.2d			# CHECK-NEXT: 1 3 1.00 suqadd v0.2d, v0.2d
	# CHECK-NEXT: 1 4 0.50 suqadd v0.2s, v0.2s			# CHECK-NEXT: 1 3 0.50 suqadd v0.2s, v0.2s
	# CHECK-NEXT: 1 4 0.50 suqadd v0.4h, v0.4h			# CHECK-NEXT: 1 3 0.50 suqadd v0.4h, v0.4h
	# CHECK-NEXT: 1 4 1.00 suqadd v0.4s, v0.4s			# CHECK-NEXT: 1 3 1.00 suqadd v0.4s, v0.4s
	# CHECK-NEXT: 1 4 0.50 suqadd v0.8b, v0.8b			# CHECK-NEXT: 1 3 0.50 suqadd v0.8b, v0.8b
	# CHECK-NEXT: 1 4 1.00 suqadd v0.8h, v0.8h			# CHECK-NEXT: 1 3 1.00 suqadd v0.8h, v0.8h
	# CHECK-NEXT: 1 4 1.00 tbl v0.16b, { v0.16b }, v0.16b			# CHECK-NEXT: 1 4 1.00 tbl v0.16b, { v0.16b }, v0.16b
	# CHECK-NEXT: 1 4 1.00 tbl v0.16b, { v0.16b, v1.16b }, v0.16b			# CHECK-NEXT: 1 4 1.00 tbl v0.16b, { v0.16b, v1.16b }, v0.16b
	# CHECK-NEXT: 1 4 1.00 tbl v0.16b, { v0.16b, v1.16b, v2.16b }, v0.16b			# CHECK-NEXT: 1 4 1.00 tbl v0.16b, { v0.16b, v1.16b, v2.16b }, v0.16b
	# CHECK-NEXT: 1 4 1.00 tbl v0.16b, { v0.16b, v1.16b, v2.16b, v3.16b }, v0.16b			# CHECK-NEXT: 1 4 1.00 tbl v0.16b, { v0.16b, v1.16b, v2.16b, v3.16b }, v0.16b
	# CHECK-NEXT: 1 4 0.50 tbl v0.8b, { v0.16b }, v0.8b			# CHECK-NEXT: 1 4 0.50 tbl v0.8b, { v0.16b }, v0.8b
	# CHECK-NEXT: 1 4 0.50 tbl v0.8b, { v0.16b, v1.16b }, v0.8b			# CHECK-NEXT: 1 4 0.50 tbl v0.8b, { v0.16b, v1.16b }, v0.8b
	# CHECK-NEXT: 1 4 0.50 tbl v0.8b, { v0.16b, v1.16b, v2.16b }, v0.8b			# CHECK-NEXT: 1 4 0.50 tbl v0.8b, { v0.16b, v1.16b, v2.16b }, v0.8b
	# CHECK-NEXT: 1 4 0.50 tbl v0.8b, { v0.16b, v1.16b, v2.16b, v3.16b }, v0.8b			# CHECK-NEXT: 1 4 0.50 tbl v0.8b, { v0.16b, v1.16b, v2.16b, v3.16b }, v0.8b
	Show All 14 Lines
	# CHECK-NEXT: 1 4 1.00 trn1 v0.8h, v0.8h, v0.8h			# CHECK-NEXT: 1 4 1.00 trn1 v0.8h, v0.8h, v0.8h
	# CHECK-NEXT: 1 4 1.00 trn2 v0.16b, v0.16b, v0.16b			# CHECK-NEXT: 1 4 1.00 trn2 v0.16b, v0.16b, v0.16b
	# CHECK-NEXT: 1 4 1.00 trn2 v0.2d, v0.2d, v0.2d			# CHECK-NEXT: 1 4 1.00 trn2 v0.2d, v0.2d, v0.2d
	# CHECK-NEXT: 1 4 0.50 trn2 v0.2s, v0.2s, v0.2s			# CHECK-NEXT: 1 4 0.50 trn2 v0.2s, v0.2s, v0.2s
	# CHECK-NEXT: 1 4 0.50 trn2 v0.4h, v0.4h, v0.4h			# CHECK-NEXT: 1 4 0.50 trn2 v0.4h, v0.4h, v0.4h
	# CHECK-NEXT: 1 4 1.00 trn2 v0.4s, v0.4s, v0.4s			# CHECK-NEXT: 1 4 1.00 trn2 v0.4s, v0.4s, v0.4s
	# CHECK-NEXT: 1 4 0.50 trn2 v0.8b, v0.8b, v0.8b			# CHECK-NEXT: 1 4 0.50 trn2 v0.8b, v0.8b, v0.8b
	# CHECK-NEXT: 1 4 1.00 trn2 v0.8h, v0.8h, v0.8h			# CHECK-NEXT: 1 4 1.00 trn2 v0.8h, v0.8h, v0.8h
	# CHECK-NEXT: 1 4 0.50 uaba v0.8b, v0.8b, v0.8b			# CHECK-NEXT: 1 4 2.00 uaba v0.8b, v0.8b, v0.8b
	# CHECK-NEXT: 1 4 1.00 uabal v0.2d, v0.2s, v0.2s			# CHECK-NEXT: 1 4 2.00 uabal v0.2d, v0.2s, v0.2s
	# CHECK-NEXT: 1 4 1.00 uabal v0.4s, v0.4h, v0.4h			# CHECK-NEXT: 1 4 2.00 uabal v0.4s, v0.4h, v0.4h
	# CHECK-NEXT: 1 4 1.00 uabal v0.8h, v0.8b, v0.8b			# CHECK-NEXT: 1 4 2.00 uabal v0.8h, v0.8b, v0.8b
	# CHECK-NEXT: 1 4 1.00 uabal2 v0.2d, v0.4s, v0.4s			# CHECK-NEXT: 1 4 2.00 uabal2 v0.2d, v0.4s, v0.4s
	# CHECK-NEXT: 1 4 1.00 uabal2 v0.4s, v0.8h, v0.8h			# CHECK-NEXT: 1 4 2.00 uabal2 v0.4s, v0.8h, v0.8h
	# CHECK-NEXT: 1 4 1.00 uabal2 v0.8h, v0.16b, v0.16b			# CHECK-NEXT: 1 4 2.00 uabal2 v0.8h, v0.16b, v0.16b
	# CHECK-NEXT: 1 4 0.50 uabd v0.4h, v0.4h, v0.4h			# CHECK-NEXT: 1 3 0.50 uabd v0.4h, v0.4h, v0.4h
	# CHECK-NEXT: 1 4 1.00 uabdl v0.2d, v0.2s, v0.2s			# CHECK-NEXT: 1 3 1.00 uabdl v0.2d, v0.2s, v0.2s
	# CHECK-NEXT: 1 4 1.00 uabdl v0.4s, v0.4h, v0.4h			# CHECK-NEXT: 1 3 1.00 uabdl v0.4s, v0.4h, v0.4h
	# CHECK-NEXT: 1 4 1.00 uabdl v0.8h, v0.8b, v0.8b			# CHECK-NEXT: 1 3 1.00 uabdl v0.8h, v0.8b, v0.8b
	# CHECK-NEXT: 1 4 1.00 uabdl2 v0.2d, v0.4s, v0.4s			# CHECK-NEXT: 1 3 1.00 uabdl2 v0.2d, v0.4s, v0.4s
	# CHECK-NEXT: 1 4 1.00 uabdl2 v0.4s, v0.8h, v0.8h			# CHECK-NEXT: 1 3 1.00 uabdl2 v0.4s, v0.8h, v0.8h
	# CHECK-NEXT: 1 4 1.00 uabdl2 v0.8h, v0.16b, v0.16b			# CHECK-NEXT: 1 3 1.00 uabdl2 v0.8h, v0.16b, v0.16b
	# CHECK-NEXT: 1 4 0.50 uadalp v0.1d, v0.2s			# CHECK-NEXT: 1 4 2.00 uadalp v0.1d, v0.2s
	# CHECK-NEXT: 1 4 1.00 uadalp v0.2d, v0.4s			# CHECK-NEXT: 1 4 2.00 uadalp v0.2d, v0.4s
	# CHECK-NEXT: 1 4 0.50 uadalp v0.2s, v0.4h			# CHECK-NEXT: 1 4 2.00 uadalp v0.2s, v0.4h
	# CHECK-NEXT: 1 4 0.50 uadalp v0.4h, v0.8b			# CHECK-NEXT: 1 4 2.00 uadalp v0.4h, v0.8b
	# CHECK-NEXT: 1 4 1.00 uadalp v0.4s, v0.8h			# CHECK-NEXT: 1 4 2.00 uadalp v0.4s, v0.8h
	# CHECK-NEXT: 1 4 1.00 uadalp v0.8h, v0.16b			# CHECK-NEXT: 1 4 2.00 uadalp v0.8h, v0.16b
	# CHECK-NEXT: 1 4 1.00 uaddl v0.2d, v0.2s, v0.2s			# CHECK-NEXT: 1 3 1.00 uaddl v0.2d, v0.2s, v0.2s
	# CHECK-NEXT: 1 4 1.00 uaddl v0.4s, v0.4h, v0.4h			# CHECK-NEXT: 1 3 1.00 uaddl v0.4s, v0.4h, v0.4h
	# CHECK-NEXT: 1 4 1.00 uaddl v0.8h, v0.8b, v0.8b			# CHECK-NEXT: 1 3 1.00 uaddl v0.8h, v0.8b, v0.8b
	# CHECK-NEXT: 1 4 1.00 uaddl2 v0.2d, v0.4s, v0.4s			# CHECK-NEXT: 1 3 1.00 uaddl2 v0.2d, v0.4s, v0.4s
	# CHECK-NEXT: 1 4 1.00 uaddl2 v0.4s, v0.8h, v0.8h			# CHECK-NEXT: 1 3 1.00 uaddl2 v0.4s, v0.8h, v0.8h
	# CHECK-NEXT: 1 4 1.00 uaddl2 v0.8h, v0.16b, v0.16b			# CHECK-NEXT: 1 3 1.00 uaddl2 v0.8h, v0.16b, v0.16b
	# CHECK-NEXT: 1 4 0.50 uaddlp v0.1d, v0.2s			# CHECK-NEXT: 1 3 0.50 uaddlp v0.1d, v0.2s
	# CHECK-NEXT: 1 4 1.00 uaddlp v0.2d, v0.4s			# CHECK-NEXT: 1 3 1.00 uaddlp v0.2d, v0.4s
	# CHECK-NEXT: 1 4 0.50 uaddlp v0.2s, v0.4h			# CHECK-NEXT: 1 3 0.50 uaddlp v0.2s, v0.4h
	# CHECK-NEXT: 1 4 0.50 uaddlp v0.4h, v0.8b			# CHECK-NEXT: 1 3 0.50 uaddlp v0.4h, v0.8b
	# CHECK-NEXT: 1 4 1.00 uaddlp v0.4s, v0.8h			# CHECK-NEXT: 1 3 1.00 uaddlp v0.4s, v0.8h
	# CHECK-NEXT: 1 4 1.00 uaddlp v0.8h, v0.16b			# CHECK-NEXT: 1 3 1.00 uaddlp v0.8h, v0.16b
	# CHECK-NEXT: 1 4 1.00 uaddw v0.2d, v0.2d, v0.2s			# CHECK-NEXT: 1 3 1.00 uaddw v0.2d, v0.2d, v0.2s
	# CHECK-NEXT: 1 4 1.00 uaddw v0.4s, v0.4s, v0.4h			# CHECK-NEXT: 1 3 1.00 uaddw v0.4s, v0.4s, v0.4h
	# CHECK-NEXT: 1 4 1.00 uaddw v0.8h, v0.8h, v0.8b			# CHECK-NEXT: 1 3 1.00 uaddw v0.8h, v0.8h, v0.8b
	# CHECK-NEXT: 1 4 1.00 uaddw2 v0.2d, v0.2d, v0.4s			# CHECK-NEXT: 1 3 1.00 uaddw2 v0.2d, v0.2d, v0.4s
	# CHECK-NEXT: 1 4 1.00 uaddw2 v0.4s, v0.4s, v0.8h			# CHECK-NEXT: 1 3 1.00 uaddw2 v0.4s, v0.4s, v0.8h
	# CHECK-NEXT: 1 4 1.00 uaddw2 v0.8h, v0.8h, v0.16b			# CHECK-NEXT: 1 3 1.00 uaddw2 v0.8h, v0.8h, v0.16b
	# CHECK-NEXT: 1 4 0.50 ucvtf d21, d14			# CHECK-NEXT: 1 4 0.50 ucvtf d21, d14
	# CHECK-NEXT: 1 4 0.50 ucvtf d21, d14, #64			# CHECK-NEXT: 1 4 0.50 ucvtf d21, d14, #64
	# CHECK-NEXT: 1 4 0.50 ucvtf s22, s13			# CHECK-NEXT: 1 4 0.50 ucvtf s22, s13
	# CHECK-NEXT: 1 4 0.50 ucvtf s22, s13, #32			# CHECK-NEXT: 1 4 0.50 ucvtf s22, s13, #32
	# CHECK-NEXT: 1 4 0.50 ucvtf v0.2d, v0.2d			# CHECK-NEXT: 1 4 0.50 ucvtf v0.2d, v0.2d
	# CHECK-NEXT: 1 4 0.50 ucvtf v0.2d, v0.2d, #3			# CHECK-NEXT: 1 4 0.50 ucvtf v0.2d, v0.2d, #3
	# CHECK-NEXT: 1 4 0.50 ucvtf v0.2s, v0.2s			# CHECK-NEXT: 1 4 0.50 ucvtf v0.2s, v0.2s
	# CHECK-NEXT: 1 4 0.50 ucvtf v0.2s, v0.2s, #3			# CHECK-NEXT: 1 4 0.50 ucvtf v0.2s, v0.2s, #3
	# CHECK-NEXT: 1 4 0.50 ucvtf v0.4h, v0.4h			# CHECK-NEXT: 1 4 0.50 ucvtf v0.4h, v0.4h
	# CHECK-NEXT: 1 4 0.50 ucvtf v0.4s, v0.4s			# CHECK-NEXT: 1 4 0.50 ucvtf v0.4s, v0.4s
	# CHECK-NEXT: 1 4 0.50 ucvtf v0.4s, v0.4s, #3			# CHECK-NEXT: 1 4 0.50 ucvtf v0.4s, v0.4s, #3
	# CHECK-NEXT: 1 4 0.50 ucvtf v0.8h, v0.8h			# CHECK-NEXT: 1 4 0.50 ucvtf v0.8h, v0.8h
	# CHECK-NEXT: 1 4 1.00 uhadd v0.16b, v0.16b, v0.16b			# CHECK-NEXT: 1 2 1.00 uhadd v0.16b, v0.16b, v0.16b
	# CHECK-NEXT: 1 4 1.00 uhadd v0.8h, v0.8h, v0.8h			# CHECK-NEXT: 1 2 1.00 uhadd v0.8h, v0.8h, v0.8h
	# CHECK-NEXT: 1 4 1.00 uhsub v0.4s, v0.4s, v0.4s			# CHECK-NEXT: 1 2 1.00 uhsub v0.4s, v0.4s, v0.4s
	# CHECK-NEXT: 1 4 1.00 umax v0.16b, v0.16b, v0.16b			# CHECK-NEXT: 1 2 1.00 umax v0.16b, v0.16b, v0.16b
	# CHECK-NEXT: 1 4 1.00 umax v0.4s, v0.4s, v0.4s			# CHECK-NEXT: 1 4 1.00 umax v0.4s, v0.4s, v0.4s
	# CHECK-NEXT: 1 4 1.00 umax v0.8h, v0.8h, v0.8h			# CHECK-NEXT: 1 2 1.00 umax v0.8h, v0.8h, v0.8h
	# CHECK-NEXT: 1 4 1.00 umaxp v0.16b, v0.16b, v0.16b			# CHECK-NEXT: 1 2 1.00 umaxp v0.16b, v0.16b, v0.16b
	# CHECK-NEXT: 1 4 1.00 umaxp v0.4s, v0.4s, v0.4s			# CHECK-NEXT: 1 4 1.00 umaxp v0.4s, v0.4s, v0.4s
	# CHECK-NEXT: 1 4 1.00 umaxp v0.8h, v0.8h, v0.8h			# CHECK-NEXT: 1 2 1.00 umaxp v0.8h, v0.8h, v0.8h
	# CHECK-NEXT: 1 4 0.50 umin v0.2s, v0.2s, v0.2s			# CHECK-NEXT: 1 2 0.50 umin v0.2s, v0.2s, v0.2s
	# CHECK-NEXT: 1 4 0.50 umin v0.4h, v0.4h, v0.4h			# CHECK-NEXT: 1 2 0.50 umin v0.4h, v0.4h, v0.4h
	# CHECK-NEXT: 1 4 0.50 umin v0.8b, v0.8b, v0.8b			# CHECK-NEXT: 1 2 0.50 umin v0.8b, v0.8b, v0.8b
	# CHECK-NEXT: 1 4 0.50 uminp v0.2s, v0.2s, v0.2s			# CHECK-NEXT: 1 2 0.50 uminp v0.2s, v0.2s, v0.2s
	# CHECK-NEXT: 1 4 0.50 uminp v0.4h, v0.4h, v0.4h			# CHECK-NEXT: 1 2 0.50 uminp v0.4h, v0.4h, v0.4h
	# CHECK-NEXT: 1 4 0.50 uminp v0.8b, v0.8b, v0.8b			# CHECK-NEXT: 1 2 0.50 uminp v0.8b, v0.8b, v0.8b
	# CHECK-NEXT: 1 4 1.00 umlal v0.2d, v0.2s, v0.2s			# CHECK-NEXT: 1 4 1.00 umlal v0.2d, v0.2s, v0.2s
	# CHECK-NEXT: 1 4 1.00 umlal v0.4s, v0.4h, v0.4h			# CHECK-NEXT: 1 4 1.00 umlal v0.4s, v0.4h, v0.4h
	# CHECK-NEXT: 1 4 1.00 umlal v0.8h, v0.8b, v0.8b			# CHECK-NEXT: 1 4 1.00 umlal v0.8h, v0.8b, v0.8b
	# CHECK-NEXT: 1 4 1.00 umlal2 v0.2d, v0.4s, v0.4s			# CHECK-NEXT: 1 4 1.00 umlal2 v0.2d, v0.4s, v0.4s
	# CHECK-NEXT: 1 4 1.00 umlal2 v0.4s, v0.8h, v0.8h			# CHECK-NEXT: 1 4 1.00 umlal2 v0.4s, v0.8h, v0.8h
	# CHECK-NEXT: 1 4 1.00 umlal2 v0.8h, v0.16b, v0.16b			# CHECK-NEXT: 1 4 1.00 umlal2 v0.8h, v0.16b, v0.16b
	# CHECK-NEXT: 1 4 1.00 umlsl v0.2d, v0.2s, v0.2s			# CHECK-NEXT: 1 4 1.00 umlsl v0.2d, v0.2s, v0.2s
	# CHECK-NEXT: 1 4 1.00 umlsl v0.4s, v0.4h, v0.4h			# CHECK-NEXT: 1 4 1.00 umlsl v0.4s, v0.4h, v0.4h
	# CHECK-NEXT: 1 4 1.00 umlsl v0.8h, v0.8b, v0.8b			# CHECK-NEXT: 1 4 1.00 umlsl v0.8h, v0.8b, v0.8b
	# CHECK-NEXT: 1 4 1.00 umlsl2 v0.2d, v0.4s, v0.4s			# CHECK-NEXT: 1 4 1.00 umlsl2 v0.2d, v0.4s, v0.4s
	# CHECK-NEXT: 1 4 1.00 umlsl2 v0.4s, v0.8h, v0.8h			# CHECK-NEXT: 1 4 1.00 umlsl2 v0.4s, v0.8h, v0.8h
	# CHECK-NEXT: 1 4 1.00 umlsl2 v0.8h, v0.16b, v0.16b			# CHECK-NEXT: 1 4 1.00 umlsl2 v0.8h, v0.16b, v0.16b
	# CHECK-NEXT: 1 4 1.00 umull v0.2d, v0.2s, v0.2s			# CHECK-NEXT: 1 4 1.00 umull v0.2d, v0.2s, v0.2s
	# CHECK-NEXT: 1 4 1.00 umull v0.4s, v0.4h, v0.4h			# CHECK-NEXT: 1 4 1.00 umull v0.4s, v0.4h, v0.4h
	# CHECK-NEXT: 1 4 1.00 umull v0.8h, v0.8b, v0.8b			# CHECK-NEXT: 1 4 1.00 umull v0.8h, v0.8b, v0.8b
	# CHECK-NEXT: 1 4 1.00 umull2 v0.2d, v0.4s, v0.4s			# CHECK-NEXT: 1 4 1.00 umull2 v0.2d, v0.4s, v0.4s
	# CHECK-NEXT: 1 4 1.00 umull2 v0.4s, v0.8h, v0.8h			# CHECK-NEXT: 1 4 1.00 umull2 v0.4s, v0.8h, v0.8h
	# CHECK-NEXT: 1 4 1.00 umull2 v0.8h, v0.16b, v0.16b			# CHECK-NEXT: 1 4 1.00 umull2 v0.8h, v0.16b, v0.16b
	# CHECK-NEXT: 1 4 0.50 uqadd h0, h1, h5			# CHECK-NEXT: 1 3 0.50 uqadd h0, h1, h5
	# CHECK-NEXT: 1 4 1.00 uqadd v0.8h, v0.8h, v0.8h			# CHECK-NEXT: 1 3 1.00 uqadd v0.8h, v0.8h, v0.8h
	# CHECK-NEXT: 1 4 0.50 uqrshl b11, b20, b30			# CHECK-NEXT: 1 4 0.50 uqrshl b11, b20, b30
	# CHECK-NEXT: 1 4 0.50 uqrshl s23, s20, s16			# CHECK-NEXT: 1 4 0.50 uqrshl s23, s20, s16
	# CHECK-NEXT: 1 4 1.00 uqrshl v0.16b, v0.16b, v0.16b			# CHECK-NEXT: 1 4 1.00 uqrshl v0.16b, v0.16b, v0.16b
	# CHECK-NEXT: 1 4 1.00 uqrshl v0.4s, v0.4s, v0.4s			# CHECK-NEXT: 1 4 1.00 uqrshl v0.4s, v0.4s, v0.4s
	# CHECK-NEXT: 1 4 1.00 uqrshl v0.4s, v0.4s, v0.4s			# CHECK-NEXT: 1 4 1.00 uqrshl v0.4s, v0.4s, v0.4s
	# CHECK-NEXT: 1 4 1.00 uqrshl v0.8h, v0.8h, v0.8h			# CHECK-NEXT: 1 4 1.00 uqrshl v0.8h, v0.8h, v0.8h
	# CHECK-NEXT: 1 4 0.50 uqrshrn b10, h12, #5			# CHECK-NEXT: 1 4 0.50 uqrshrn b10, h12, #5
	# CHECK-NEXT: 1 4 0.50 uqrshrn h12, s10, #14			# CHECK-NEXT: 1 4 0.50 uqrshrn h12, s10, #14
	Show All 25 Lines
	# CHECK-NEXT: 1 4 0.50 uqshrn h10, s14, #5			# CHECK-NEXT: 1 4 0.50 uqshrn h10, s14, #5
	# CHECK-NEXT: 1 4 0.50 uqshrn s10, d12, #13			# CHECK-NEXT: 1 4 0.50 uqshrn s10, d12, #13
	# CHECK-NEXT: 1 4 0.50 uqshrn v0.2s, v0.2d, #3			# CHECK-NEXT: 1 4 0.50 uqshrn v0.2s, v0.2d, #3
	# CHECK-NEXT: 1 4 0.50 uqshrn v0.4h, v0.4s, #3			# CHECK-NEXT: 1 4 0.50 uqshrn v0.4h, v0.4s, #3
	# CHECK-NEXT: 1 4 0.50 uqshrn v0.8b, v0.8h, #3			# CHECK-NEXT: 1 4 0.50 uqshrn v0.8b, v0.8h, #3
	# CHECK-NEXT: 1 4 1.00 uqshrn2 v0.16b, v0.8h, #3			# CHECK-NEXT: 1 4 1.00 uqshrn2 v0.16b, v0.8h, #3
	# CHECK-NEXT: 1 4 1.00 uqshrn2 v0.4s, v0.2d, #3			# CHECK-NEXT: 1 4 1.00 uqshrn2 v0.4s, v0.2d, #3
	# CHECK-NEXT: 1 4 1.00 uqshrn2 v0.8h, v0.4s, #3			# CHECK-NEXT: 1 4 1.00 uqshrn2 v0.8h, v0.4s, #3
	# CHECK-NEXT: 1 4 0.50 uqsub d16, d16, d16			# CHECK-NEXT: 1 3 0.50 uqsub d16, d16, d16
	# CHECK-NEXT: 1 4 0.50 uqsub v0.4h, v0.4h, v0.4h			# CHECK-NEXT: 1 3 0.50 uqsub v0.4h, v0.4h, v0.4h
	# CHECK-NEXT: 1 4 0.50 uqxtn b18, h18			# CHECK-NEXT: 1 4 0.50 uqxtn b18, h18
	# CHECK-NEXT: 1 4 0.50 uqxtn h20, s17			# CHECK-NEXT: 1 4 0.50 uqxtn h20, s17
	# CHECK-NEXT: 1 4 0.50 uqxtn s19, d14			# CHECK-NEXT: 1 4 0.50 uqxtn s19, d14
	# CHECK-NEXT: 1 4 1.00 uqxtn v0.2s, v0.2d			# CHECK-NEXT: 1 4 1.00 uqxtn v0.2s, v0.2d
	# CHECK-NEXT: 1 4 1.00 uqxtn v0.4h, v0.4s			# CHECK-NEXT: 1 4 1.00 uqxtn v0.4h, v0.4s
	# CHECK-NEXT: 1 4 1.00 uqxtn v0.8b, v0.8h			# CHECK-NEXT: 1 4 1.00 uqxtn v0.8b, v0.8h
	# CHECK-NEXT: 1 4 1.00 uqxtn2 v0.16b, v0.8h			# CHECK-NEXT: 1 4 1.00 uqxtn2 v0.16b, v0.8h
	# CHECK-NEXT: 1 4 1.00 uqxtn2 v0.4s, v0.2d			# CHECK-NEXT: 1 4 1.00 uqxtn2 v0.4s, v0.2d
	# CHECK-NEXT: 1 4 1.00 uqxtn2 v0.8h, v0.4s			# CHECK-NEXT: 1 4 1.00 uqxtn2 v0.8h, v0.4s
	# CHECK-NEXT: 1 4 0.50 urecpe v0.2s, v0.2s			# CHECK-NEXT: 1 4 0.50 urecpe v0.2s, v0.2s
	# CHECK-NEXT: 1 4 1.00 urecpe v0.4s, v0.4s			# CHECK-NEXT: 1 4 1.00 urecpe v0.4s, v0.4s
	# CHECK-NEXT: 1 4 1.00 urhadd v0.16b, v0.16b, v0.16b			# CHECK-NEXT: 1 2 1.00 urhadd v0.16b, v0.16b, v0.16b
	# CHECK-NEXT: 1 4 1.00 urhadd v0.4s, v0.4s, v0.4s			# CHECK-NEXT: 1 2 1.00 urhadd v0.4s, v0.4s, v0.4s
	# CHECK-NEXT: 1 4 1.00 urhadd v0.8h, v0.8h, v0.8h			# CHECK-NEXT: 1 2 1.00 urhadd v0.8h, v0.8h, v0.8h
	# CHECK-NEXT: 1 4 0.50 urshl d8, d7, d4			# CHECK-NEXT: 1 3 0.50 urshl d8, d7, d4
	# CHECK-NEXT: 1 4 1.00 urshl v0.16b, v0.16b, v0.16b			# CHECK-NEXT: 1 3 1.00 urshl v0.16b, v0.16b, v0.16b
	# CHECK-NEXT: 1 4 1.00 urshl v0.2d, v0.2d, v0.2d			# CHECK-NEXT: 1 3 1.00 urshl v0.2d, v0.2d, v0.2d
	# CHECK-NEXT: 1 4 1.00 urshl v0.4s, v0.4s, v0.4s			# CHECK-NEXT: 1 3 1.00 urshl v0.4s, v0.4s, v0.4s
	# CHECK-NEXT: 1 4 1.00 urshl v0.8h, v0.8h, v0.8h			# CHECK-NEXT: 1 3 1.00 urshl v0.8h, v0.8h, v0.8h
	# CHECK-NEXT: 1 4 0.50 urshr d20, d23, #31			# CHECK-NEXT: 1 3 0.50 urshr d20, d23, #31
	# CHECK-NEXT: 1 4 1.00 urshr v0.16b, v0.16b, #3			# CHECK-NEXT: 1 3 1.00 urshr v0.16b, v0.16b, #3
	# CHECK-NEXT: 1 4 1.00 urshr v0.2d, v0.2d, #3			# CHECK-NEXT: 1 3 1.00 urshr v0.2d, v0.2d, #3
	# CHECK-NEXT: 1 4 0.50 urshr v0.2s, v0.2s, #3			# CHECK-NEXT: 1 3 0.50 urshr v0.2s, v0.2s, #3
	# CHECK-NEXT: 1 4 0.50 urshr v0.4h, v0.4h, #3			# CHECK-NEXT: 1 3 0.50 urshr v0.4h, v0.4h, #3
	# CHECK-NEXT: 1 4 1.00 urshr v0.4s, v0.4s, #3			# CHECK-NEXT: 1 3 1.00 urshr v0.4s, v0.4s, #3
	# CHECK-NEXT: 1 4 0.50 urshr v0.8b, v0.8b, #3			# CHECK-NEXT: 1 3 0.50 urshr v0.8b, v0.8b, #3
	# CHECK-NEXT: 1 4 1.00 urshr v0.8h, v0.8h, #3			# CHECK-NEXT: 1 3 1.00 urshr v0.8h, v0.8h, #3
	# CHECK-NEXT: 1 12 9.00 ursqrte v0.2s, v0.2s			# CHECK-NEXT: 1 12 9.00 ursqrte v0.2s, v0.2s
	# CHECK-NEXT: 1 12 9.00 ursqrte v0.4s, v0.4s			# CHECK-NEXT: 1 12 9.00 ursqrte v0.4s, v0.4s
	# CHECK-NEXT: 1 4 0.50 ursra d18, d10, #13			# CHECK-NEXT: 1 4 2.00 ursra d18, d10, #13
	# CHECK-NEXT: 1 4 1.00 ursra v0.16b, v0.16b, #3			# CHECK-NEXT: 1 4 2.00 ursra v0.16b, v0.16b, #3
	# CHECK-NEXT: 1 4 1.00 ursra v0.2d, v0.2d, #3			# CHECK-NEXT: 1 4 2.00 ursra v0.2d, v0.2d, #3
	# CHECK-NEXT: 1 4 0.50 ursra v0.2s, v0.2s, #3			# CHECK-NEXT: 1 4 2.00 ursra v0.2s, v0.2s, #3
	# CHECK-NEXT: 1 4 0.50 ursra v0.4h, v0.4h, #3			# CHECK-NEXT: 1 4 2.00 ursra v0.4h, v0.4h, #3
	# CHECK-NEXT: 1 4 1.00 ursra v0.4s, v0.4s, #3			# CHECK-NEXT: 1 4 2.00 ursra v0.4s, v0.4s, #3
	# CHECK-NEXT: 1 4 0.50 ursra v0.8b, v0.8b, #3			# CHECK-NEXT: 1 4 2.00 ursra v0.8b, v0.8b, #3
	# CHECK-NEXT: 1 4 1.00 ursra v0.8h, v0.8h, #3			# CHECK-NEXT: 1 4 2.00 ursra v0.8h, v0.8h, #3
	# CHECK-NEXT: 1 4 0.50 ushl d0, d0, d0			# CHECK-NEXT: 1 2 0.50 ushl d0, d0, d0
	# CHECK-NEXT: 1 4 1.00 ushl v0.16b, v0.16b, v0.16b			# CHECK-NEXT: 1 2 1.00 ushl v0.16b, v0.16b, v0.16b
	# CHECK-NEXT: 1 4 1.00 ushl v0.4s, v0.4s, v0.4s			# CHECK-NEXT: 1 2 1.00 ushl v0.4s, v0.4s, v0.4s
	# CHECK-NEXT: 1 4 1.00 ushl v0.8h, v0.8h, v0.8h			# CHECK-NEXT: 1 2 1.00 ushl v0.8h, v0.8h, v0.8h
	# CHECK-NEXT: 1 4 0.50 ushll v0.4s, v0.4h, #3			# CHECK-NEXT: 1 2 1.00 ushll v0.4s, v0.4h, #3
	# CHECK-NEXT: 1 4 1.00 ushll2 v0.8h, v0.16b, #3			# CHECK-NEXT: 1 2 1.00 ushll2 v0.8h, v0.16b, #3
	# CHECK-NEXT: 1 4 0.50 ushr d10, d17, #18			# CHECK-NEXT: 1 2 0.50 ushr d10, d17, #18
	# CHECK-NEXT: 1 4 1.00 ushr v0.16b, v0.16b, #3			# CHECK-NEXT: 1 2 0.50 ushr v0.16b, v0.16b, #3
	# CHECK-NEXT: 1 4 1.00 ushr v0.2d, v0.2d, #3			# CHECK-NEXT: 1 2 0.50 ushr v0.2d, v0.2d, #3
	# CHECK-NEXT: 1 4 0.50 ushr v0.2s, v0.2s, #3			# CHECK-NEXT: 1 2 0.50 ushr v0.2s, v0.2s, #3
	# CHECK-NEXT: 1 4 0.50 ushr v0.4h, v0.4h, #3			# CHECK-NEXT: 1 2 0.50 ushr v0.4h, v0.4h, #3
	# CHECK-NEXT: 1 4 1.00 ushr v0.4s, v0.4s, #3			# CHECK-NEXT: 1 2 0.50 ushr v0.4s, v0.4s, #3
	# CHECK-NEXT: 1 4 0.50 ushr v0.8b, v0.8b, #3			# CHECK-NEXT: 1 2 0.50 ushr v0.8b, v0.8b, #3
	# CHECK-NEXT: 1 4 1.00 ushr v0.8h, v0.8h, #3			# CHECK-NEXT: 1 2 0.50 ushr v0.8h, v0.8h, #3
	# CHECK-NEXT: 1 4 0.50 usqadd b19, b14			# CHECK-NEXT: 1 3 0.50 usqadd b19, b14
	# CHECK-NEXT: 1 4 0.50 usqadd d18, d22			# CHECK-NEXT: 1 3 0.50 usqadd d18, d22
	# CHECK-NEXT: 1 4 0.50 usqadd h20, h15			# CHECK-NEXT: 1 3 0.50 usqadd h20, h15
	# CHECK-NEXT: 1 4 0.50 usqadd s21, s12			# CHECK-NEXT: 1 3 0.50 usqadd s21, s12
	# CHECK-NEXT: 1 4 1.00 usqadd v0.16b, v0.16b			# CHECK-NEXT: 1 3 1.00 usqadd v0.16b, v0.16b
	# CHECK-NEXT: 1 4 1.00 usqadd v0.2d, v0.2d			# CHECK-NEXT: 1 3 1.00 usqadd v0.2d, v0.2d
	# CHECK-NEXT: 1 4 0.50 usqadd v0.2s, v0.2s			# CHECK-NEXT: 1 3 0.50 usqadd v0.2s, v0.2s
	# CHECK-NEXT: 1 4 0.50 usqadd v0.4h, v0.4h			# CHECK-NEXT: 1 3 0.50 usqadd v0.4h, v0.4h
	# CHECK-NEXT: 1 4 1.00 usqadd v0.4s, v0.4s			# CHECK-NEXT: 1 3 1.00 usqadd v0.4s, v0.4s
	# CHECK-NEXT: 1 4 0.50 usqadd v0.8b, v0.8b			# CHECK-NEXT: 1 3 0.50 usqadd v0.8b, v0.8b
	# CHECK-NEXT: 1 4 1.00 usqadd v0.8h, v0.8h			# CHECK-NEXT: 1 3 1.00 usqadd v0.8h, v0.8h
	# CHECK-NEXT: 1 4 0.50 usra d20, d13, #61			# CHECK-NEXT: 1 3 0.50 usra d20, d13, #61
	# CHECK-NEXT: 1 4 1.00 usra v0.16b, v0.16b, #3			# CHECK-NEXT: 1 3 1.00 usra v0.16b, v0.16b, #3
	# CHECK-NEXT: 1 4 1.00 usra v0.2d, v0.2d, #3			# CHECK-NEXT: 1 3 1.00 usra v0.2d, v0.2d, #3
	# CHECK-NEXT: 1 4 0.50 usra v0.2s, v0.2s, #3			# CHECK-NEXT: 1 3 0.50 usra v0.2s, v0.2s, #3
	# CHECK-NEXT: 1 4 0.50 usra v0.4h, v0.4h, #3			# CHECK-NEXT: 1 3 0.50 usra v0.4h, v0.4h, #3
	# CHECK-NEXT: 1 4 1.00 usra v0.4s, v0.4s, #3			# CHECK-NEXT: 1 3 1.00 usra v0.4s, v0.4s, #3
	# CHECK-NEXT: 1 4 0.50 usra v0.8b, v0.8b, #3			# CHECK-NEXT: 1 3 0.50 usra v0.8b, v0.8b, #3
	# CHECK-NEXT: 1 4 1.00 usra v0.8h, v0.8h, #3			# CHECK-NEXT: 1 3 1.00 usra v0.8h, v0.8h, #3
	# CHECK-NEXT: 1 4 1.00 usubl v0.2d, v0.2s, v0.2s			# CHECK-NEXT: 1 3 1.00 usubl v0.2d, v0.2s, v0.2s
	# CHECK-NEXT: 1 4 1.00 usubl v0.4s, v0.4h, v0.4h			# CHECK-NEXT: 1 3 1.00 usubl v0.4s, v0.4h, v0.4h
	# CHECK-NEXT: 1 4 1.00 usubl v0.8h, v0.8b, v0.8b			# CHECK-NEXT: 1 3 1.00 usubl v0.8h, v0.8b, v0.8b
	# CHECK-NEXT: 1 4 1.00 usubl2 v0.2d, v0.4s, v0.4s			# CHECK-NEXT: 1 3 1.00 usubl2 v0.2d, v0.4s, v0.4s
	# CHECK-NEXT: 1 4 1.00 usubl2 v0.4s, v0.8h, v0.8h			# CHECK-NEXT: 1 3 1.00 usubl2 v0.4s, v0.8h, v0.8h
	# CHECK-NEXT: 1 4 1.00 usubl2 v0.8h, v0.16b, v0.16b			# CHECK-NEXT: 1 3 1.00 usubl2 v0.8h, v0.16b, v0.16b
	# CHECK-NEXT: 1 4 1.00 usubw v0.2d, v0.2d, v0.2s			# CHECK-NEXT: 1 3 1.00 usubw v0.2d, v0.2d, v0.2s
	# CHECK-NEXT: 1 4 1.00 usubw v0.4s, v0.4s, v0.4h			# CHECK-NEXT: 1 3 1.00 usubw v0.4s, v0.4s, v0.4h
	# CHECK-NEXT: 1 4 1.00 usubw v0.8h, v0.8h, v0.8b			# CHECK-NEXT: 1 3 1.00 usubw v0.8h, v0.8h, v0.8b
	# CHECK-NEXT: 1 4 1.00 usubw2 v0.2d, v0.2d, v0.4s			# CHECK-NEXT: 1 3 1.00 usubw2 v0.2d, v0.2d, v0.4s
	# CHECK-NEXT: 1 4 1.00 usubw2 v0.4s, v0.4s, v0.8h			# CHECK-NEXT: 1 3 1.00 usubw2 v0.4s, v0.4s, v0.8h
	# CHECK-NEXT: 1 4 1.00 usubw2 v0.8h, v0.8h, v0.16b			# CHECK-NEXT: 1 3 1.00 usubw2 v0.8h, v0.8h, v0.16b
	# CHECK-NEXT: 1 4 1.00 uzp1 v0.16b, v0.16b, v0.16b			# CHECK-NEXT: 1 4 1.00 uzp1 v0.16b, v0.16b, v0.16b
	# CHECK-NEXT: 1 4 1.00 uzp1 v0.2d, v0.2d, v0.2d			# CHECK-NEXT: 1 4 1.00 uzp1 v0.2d, v0.2d, v0.2d
	# CHECK-NEXT: 1 4 0.50 uzp1 v0.2s, v0.2s, v0.2s			# CHECK-NEXT: 1 4 0.50 uzp1 v0.2s, v0.2s, v0.2s
	# CHECK-NEXT: 1 4 0.50 uzp1 v0.4h, v0.4h, v0.4h			# CHECK-NEXT: 1 4 0.50 uzp1 v0.4h, v0.4h, v0.4h
	# CHECK-NEXT: 1 4 1.00 uzp1 v0.4s, v0.4s, v0.4s			# CHECK-NEXT: 1 4 1.00 uzp1 v0.4s, v0.4s, v0.4s
	# CHECK-NEXT: 1 4 0.50 uzp1 v0.8b, v0.8b, v0.8b			# CHECK-NEXT: 1 4 0.50 uzp1 v0.8b, v0.8b, v0.8b
	# CHECK-NEXT: 1 4 1.00 uzp1 v0.8h, v0.8h, v0.8h			# CHECK-NEXT: 1 4 1.00 uzp1 v0.8h, v0.8h, v0.8h
	# CHECK-NEXT: 1 4 1.00 uzp2 v0.16b, v0.16b, v0.16b			# CHECK-NEXT: 1 4 1.00 uzp2 v0.16b, v0.16b, v0.16b
	Show All 35 Lines
	# CHECK-NEXT: [5.0] - CortexA55UnitFPMAC			# CHECK-NEXT: [5.0] - CortexA55UnitFPMAC
	# CHECK-NEXT: [5.1] - CortexA55UnitFPMAC			# CHECK-NEXT: [5.1] - CortexA55UnitFPMAC
	# CHECK-NEXT: [6] - CortexA55UnitLd			# CHECK-NEXT: [6] - CortexA55UnitLd
	# CHECK-NEXT: [7] - CortexA55UnitMAC			# CHECK-NEXT: [7] - CortexA55UnitMAC
	# CHECK-NEXT: [8] - CortexA55UnitSt			# CHECK-NEXT: [8] - CortexA55UnitSt

	# CHECK: Resource pressure per iteration:			# CHECK: Resource pressure per iteration:
	# CHECK-NEXT: [0.0] [0.1] [1] [2] [3.0] [3.1] [4] [5.0] [5.1] [6] [7] [8]			# CHECK-NEXT: [0.0] [0.1] [1] [2] [3.0] [3.1] [4] [5.0] [5.1] [6] [7] [8]
	# CHECK-NEXT: - - - - 716.50 716.50 197.00 3.00 3.00 107.00 - 52.00			# CHECK-NEXT: - - - - 780.00 780.00 197.00 3.00 3.00 107.00 - 52.00

	# CHECK: Resource pressure by instruction:			# CHECK: Resource pressure by instruction:
	# CHECK-NEXT: [0.0] [0.1] [1] [2] [3.0] [3.1] [4] [5.0] [5.1] [6] [7] [8] Instructions:			# CHECK-NEXT: [0.0] [0.1] [1] [2] [3.0] [3.1] [4] [5.0] [5.1] [6] [7] [8] Instructions:
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - abs d29, d24			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - abs d29, d24
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - abs v0.16b, v0.16b			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - abs v0.16b, v0.16b
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - abs v0.2d, v0.2d			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - abs v0.2d, v0.2d
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - abs v0.2s, v0.2s			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - abs v0.2s, v0.2s
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - abs v0.4h, v0.4h			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - abs v0.4h, v0.4h
	▲ Show 20 Lines • Show All 341 Lines • ▼ Show 20 Lines
	# CHECK-NEXT: - - - - - - - - - 2.00 - - ld4 { v0.d, v1.d, v2.d, v3.d }[1], [x0]			# CHECK-NEXT: - - - - - - - - - 2.00 - - ld4 { v0.d, v1.d, v2.d, v3.d }[1], [x0]
	# CHECK-NEXT: - - - - - - - - - 2.00 - - ld4 { v0.d, v1.d, v2.d, v3.d }[1], [x0], #32			# CHECK-NEXT: - - - - - - - - - 2.00 - - ld4 { v0.d, v1.d, v2.d, v3.d }[1], [x0], #32
	# CHECK-NEXT: - - - - - - - - - 2.00 - - ld4 { v0.h, v1.h, v2.h, v3.h }[7], [x0], x0			# CHECK-NEXT: - - - - - - - - - 2.00 - - ld4 { v0.h, v1.h, v2.h, v3.h }[7], [x0], x0
	# CHECK-NEXT: - - - - - - - - - 2.00 - - ld4r { v0.1d, v1.1d, v2.1d, v3.1d }, [sp]			# CHECK-NEXT: - - - - - - - - - 2.00 - - ld4r { v0.1d, v1.1d, v2.1d, v3.1d }, [sp]
	# CHECK-NEXT: - - - - - - - - - 2.00 - - ld4r { v0.1d, v1.1d, v2.1d, v3.1d }, [sp], x7			# CHECK-NEXT: - - - - - - - - - 2.00 - - ld4r { v0.1d, v1.1d, v2.1d, v3.1d }, [sp], x7
	# CHECK-NEXT: - - - - - - - - - 2.00 - - ld4r { v0.2s, v1.2s, v2.2s, v3.2s }, [sp]			# CHECK-NEXT: - - - - - - - - - 2.00 - - ld4r { v0.2s, v1.2s, v2.2s, v3.2s }, [sp]
	# CHECK-NEXT: - - - - - - - - - 2.00 - - ld4r { v0.2s, v1.2s, v2.2s, v3.2s }, [sp], x30			# CHECK-NEXT: - - - - - - - - - 2.00 - - ld4r { v0.2s, v1.2s, v2.2s, v3.2s }, [sp], x30
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - mla v0.8b, v0.8b, v0.8b			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - mla v0.8b, v0.8b, v0.8b
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - mls v0.4h, v0.4h, v0.4h			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - mls v0.4h, v0.4h, v0.4h
				dmgreenUnsubmitted Not Done Reply Inline Actions What is the reasoning for the integer multiplies going down the FPMAC pipeline? dmgreen: What is the reasoning for the integer multiplies going down the FPMAC pipeline?
				kpdev42AuthorUnsubmitted Done Reply Inline Actions I guess mla/mls (ASIMD multiply/accumulate) utilize NEON pipeline. For some reason 2 NEON pipelines of Cortex-A55 are modelled with 5 pipelines (2 x FPALU, 2 x FPMAC, 1 x FPDIV). What you think would be correct resource assignment for mla/mls? kpdev42: I guess mla/mls (ASIMD multiply/accumulate) utilize NEON pipeline. For some reason 2 NEON…
				dmgreenUnsubmitted Not Done Reply Inline Actions I'm not entirely sure either way, to be honest. A lot of this has been around from long ago. From what I can tell, the FPMAC is for floating point operations that are expected to take a long time (the ones that finish out of order in the optimization guide). There are 2 because of the way it splits 128bit operations into 2 64bit operations, and so that models the dual-issue. I'm not sure what FPDIV is. It models the hazards in fsqrt/fdiv maybe? So I don't think that the integer mla's need to go onto the same FPMAC pipeline. They can go onto into FPALU I think (or maybe it doesn't matter which they go down, but FPALU sounds more correct to me). dmgreen: I'm not entirely sure either way, to be honest. A lot of this has been around from long ago.
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - mov b0, v0.b[15]			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - mov b0, v0.b[15]
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - mov d6, v0.d[1]			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - mov d6, v0.d[1]
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - mov h2, v0.h[5]			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - mov h2, v0.h[5]
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - mov s17, v0.s[2]			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - mov s17, v0.s[2]
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - mov v0.16b, v0.16b			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - mov v0.16b, v0.16b
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - mov v0.8b, v0.8b			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - mov v0.8b, v0.8b
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - movi d15, #0xff00ff00ff00ff			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - movi d15, #0xff00ff00ff00ff
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - movi v0.16b, #31			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - movi v0.16b, #31
	Show All 16 Lines
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - mvn v0.8b, v0.8b			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - mvn v0.8b, v0.8b
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - orn v0.16b, v0.16b, v0.16b			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - orn v0.16b, v0.16b, v0.16b
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - mov v0.16b, v0.16b			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - mov v0.16b, v0.16b
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - orr v0.8h, #31			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - orr v0.8h, #31
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - pmul v0.16b, v0.16b, v0.16b			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - pmul v0.16b, v0.16b, v0.16b
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - pmul v0.8b, v0.8b, v0.8b			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - pmul v0.8b, v0.8b, v0.8b
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - pmull v0.8h, v0.8b, v0.8b			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - pmull v0.8h, v0.8b, v0.8b
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - pmull2 v0.8h, v0.16b, v0.16b			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - pmull2 v0.8h, v0.16b, v0.16b
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - raddhn v0.2s, v0.2d, v0.2d			# CHECK-NEXT: - - - - 2.00 2.00 - - - - - - raddhn v0.2s, v0.2d, v0.2d
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - raddhn v0.4h, v0.4s, v0.4s			# CHECK-NEXT: - - - - 2.00 2.00 - - - - - - raddhn v0.4h, v0.4s, v0.4s
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - raddhn v0.8b, v0.8h, v0.8h			# CHECK-NEXT: - - - - 2.00 2.00 - - - - - - raddhn v0.8b, v0.8h, v0.8h
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - raddhn2 v0.16b, v0.8h, v0.8h			# CHECK-NEXT: - - - - 2.00 2.00 - - - - - - raddhn2 v0.16b, v0.8h, v0.8h
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - raddhn2 v0.4s, v0.2d, v0.2d			# CHECK-NEXT: - - - - 2.00 2.00 - - - - - - raddhn2 v0.4s, v0.2d, v0.2d
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - raddhn2 v0.8h, v0.4s, v0.4s			# CHECK-NEXT: - - - - 2.00 2.00 - - - - - - raddhn2 v0.8h, v0.4s, v0.4s
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - rbit v0.16b, v0.16b			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - rbit v0.16b, v0.16b
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - rbit v0.8b, v0.8b			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - rbit v0.8b, v0.8b
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - rev16 v21.8b, v1.8b			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - rev16 v21.8b, v1.8b
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - rev16 v30.16b, v31.16b			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - rev16 v30.16b, v31.16b
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - rev32 v0.4h, v9.4h			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - rev32 v0.4h, v9.4h
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - rev32 v21.8b, v1.8b			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - rev32 v21.8b, v1.8b
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - rev32 v30.16b, v31.16b			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - rev32 v30.16b, v31.16b
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - rev32 v4.8h, v7.8h			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - rev32 v4.8h, v7.8h
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - rev64 v0.16b, v31.16b			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - rev64 v0.16b, v31.16b
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - rev64 v1.8b, v9.8b			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - rev64 v1.8b, v9.8b
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - rev64 v13.4h, v21.4h			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - rev64 v13.4h, v21.4h
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - rev64 v2.8h, v4.8h			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - rev64 v2.8h, v4.8h
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - rev64 v4.2s, v0.2s			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - rev64 v4.2s, v0.2s
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - rev64 v6.4s, v8.4s			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - rev64 v6.4s, v8.4s
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - rshrn v0.2s, v0.2d, #3			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - rshrn v0.2s, v0.2d, #3
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - rshrn v0.4h, v0.4s, #3			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - rshrn v0.4h, v0.4s, #3
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - rshrn v0.8b, v0.8h, #3			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - rshrn v0.8b, v0.8h, #3
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - rshrn2 v0.16b, v0.8h, #3			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - rshrn2 v0.16b, v0.8h, #3
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - rshrn2 v0.4s, v0.2d, #3			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - rshrn2 v0.4s, v0.2d, #3
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - rshrn2 v0.8h, v0.4s, #3			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - rshrn2 v0.8h, v0.4s, #3
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - rsubhn v0.2s, v0.2d, v0.2d			# CHECK-NEXT: - - - - 2.00 2.00 - - - - - - rsubhn v0.2s, v0.2d, v0.2d
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - rsubhn v0.4h, v0.4s, v0.4s			# CHECK-NEXT: - - - - 2.00 2.00 - - - - - - rsubhn v0.4h, v0.4s, v0.4s
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - rsubhn v0.8b, v0.8h, v0.8h			# CHECK-NEXT: - - - - 2.00 2.00 - - - - - - rsubhn v0.8b, v0.8h, v0.8h
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - rsubhn2 v0.16b, v0.8h, v0.8h			# CHECK-NEXT: - - - - 2.00 2.00 - - - - - - rsubhn2 v0.16b, v0.8h, v0.8h
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - rsubhn2 v0.4s, v0.2d, v0.2d			# CHECK-NEXT: - - - - 2.00 2.00 - - - - - - rsubhn2 v0.4s, v0.2d, v0.2d
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - rsubhn2 v0.8h, v0.4s, v0.4s			# CHECK-NEXT: - - - - 2.00 2.00 - - - - - - rsubhn2 v0.8h, v0.4s, v0.4s
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - saba v0.16b, v0.16b, v0.16b			# CHECK-NEXT: - - - - 2.00 2.00 - - - - - - saba v0.16b, v0.16b, v0.16b
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - sabal v0.2d, v0.2s, v0.2s			# CHECK-NEXT: - - - - 2.00 2.00 - - - - - - sabal v0.2d, v0.2s, v0.2s
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - sabal v0.4s, v0.4h, v0.4h			# CHECK-NEXT: - - - - 2.00 2.00 - - - - - - sabal v0.4s, v0.4h, v0.4h
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - sabal v0.8h, v0.8b, v0.8b			# CHECK-NEXT: - - - - 2.00 2.00 - - - - - - sabal v0.8h, v0.8b, v0.8b
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - sabal2 v0.2d, v0.4s, v0.4s			# CHECK-NEXT: - - - - 2.00 2.00 - - - - - - sabal2 v0.2d, v0.4s, v0.4s
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - sabal2 v0.4s, v0.8h, v0.8h			# CHECK-NEXT: - - - - 2.00 2.00 - - - - - - sabal2 v0.4s, v0.8h, v0.8h
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - sabal2 v0.8h, v0.16b, v0.16b			# CHECK-NEXT: - - - - 2.00 2.00 - - - - - - sabal2 v0.8h, v0.16b, v0.16b
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - sabd v0.4h, v0.4h, v0.4h			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - sabd v0.4h, v0.4h, v0.4h
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - sabdl v0.2d, v0.2s, v0.2s			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - sabdl v0.2d, v0.2s, v0.2s
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - sabdl v0.4s, v0.4h, v0.4h			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - sabdl v0.4s, v0.4h, v0.4h
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - sabdl v0.8h, v0.8b, v0.8b			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - sabdl v0.8h, v0.8b, v0.8b
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - sabdl2 v0.2d, v0.4s, v0.4s			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - sabdl2 v0.2d, v0.4s, v0.4s
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - sabdl2 v0.4s, v0.8h, v0.8h			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - sabdl2 v0.4s, v0.8h, v0.8h
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - sabdl2 v0.8h, v0.16b, v0.16b			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - sabdl2 v0.8h, v0.16b, v0.16b
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - sadalp v0.1d, v0.2s			# CHECK-NEXT: - - - - 2.00 2.00 - - - - - - sadalp v0.1d, v0.2s
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - sadalp v0.2d, v0.4s			# CHECK-NEXT: - - - - 2.00 2.00 - - - - - - sadalp v0.2d, v0.4s
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - sadalp v0.2s, v0.4h			# CHECK-NEXT: - - - - 2.00 2.00 - - - - - - sadalp v0.2s, v0.4h
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - sadalp v0.4h, v0.8b			# CHECK-NEXT: - - - - 2.00 2.00 - - - - - - sadalp v0.4h, v0.8b
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - sadalp v0.4s, v0.8h			# CHECK-NEXT: - - - - 2.00 2.00 - - - - - - sadalp v0.4s, v0.8h
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - sadalp v0.8h, v0.16b			# CHECK-NEXT: - - - - 2.00 2.00 - - - - - - sadalp v0.8h, v0.16b
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - saddl v0.2d, v0.2s, v0.2s			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - saddl v0.2d, v0.2s, v0.2s
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - saddl v0.4s, v0.4h, v0.4h			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - saddl v0.4s, v0.4h, v0.4h
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - saddl v0.8h, v0.8b, v0.8b			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - saddl v0.8h, v0.8b, v0.8b
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - saddl2 v0.2d, v0.4s, v0.4s			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - saddl2 v0.2d, v0.4s, v0.4s
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - saddl2 v0.4s, v0.8h, v0.8h			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - saddl2 v0.4s, v0.8h, v0.8h
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - saddl2 v0.8h, v0.16b, v0.16b			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - saddl2 v0.8h, v0.16b, v0.16b
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - saddlp v0.1d, v0.2s			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - saddlp v0.1d, v0.2s
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - saddlp v0.2d, v0.4s			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - saddlp v0.2d, v0.4s
	Show All 16 Lines
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - scvtf v0.2s, v0.2s			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - scvtf v0.2s, v0.2s
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - scvtf v0.2s, v0.2s, #3			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - scvtf v0.2s, v0.2s, #3
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - scvtf v0.4h, v0.4h			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - scvtf v0.4h, v0.4h
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - scvtf v0.4s, v0.4s			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - scvtf v0.4s, v0.4s
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - scvtf v0.4s, v0.4s, #3			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - scvtf v0.4s, v0.4s, #3
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - scvtf v0.8h, v0.8h			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - scvtf v0.8h, v0.8h
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - shadd v0.8b, v0.8b, v0.8b			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - shadd v0.8b, v0.8b, v0.8b
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - shl d7, d10, #12			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - shl d7, d10, #12
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - shl v0.16b, v0.16b, #3			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - shl v0.16b, v0.16b, #3
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - shl v0.2d, v0.2d, #3			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - shl v0.2d, v0.2d, #3
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - shl v0.4h, v0.4h, #3			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - shl v0.4h, v0.4h, #3
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - shl v0.4s, v0.4s, #3			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - shl v0.4s, v0.4s, #3
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - shll v0.2d, v0.2s, #32			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - shll v0.2d, v0.2s, #32
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - shll v0.4s, v0.4h, #16			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - shll v0.4s, v0.4h, #16
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - shll v0.8h, v0.8b, #8			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - shll v0.8h, v0.8b, #8
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - shll v0.2d, v0.2s, #32			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - shll v0.2d, v0.2s, #32
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - shll v0.4s, v0.4h, #16			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - shll v0.4s, v0.4h, #16
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - shll v0.8h, v0.8b, #8			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - shll v0.8h, v0.8b, #8
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - shll2 v0.2d, v0.4s, #32			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - shll2 v0.2d, v0.4s, #32
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - shll2 v0.4s, v0.8h, #16			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - shll2 v0.4s, v0.8h, #16
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - shll2 v0.8h, v0.16b, #8			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - shll2 v0.8h, v0.16b, #8
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - shll2 v0.2d, v0.4s, #32			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - shll2 v0.2d, v0.4s, #32
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - shll2 v0.4s, v0.8h, #16			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - shll2 v0.4s, v0.8h, #16
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - shll2 v0.8h, v0.16b, #8			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - shll2 v0.8h, v0.16b, #8
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - shrn v0.2s, v0.2d, #3			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - shrn v0.2s, v0.2d, #3
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - shrn v0.4h, v0.4s, #3			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - shrn v0.4h, v0.4s, #3
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - shrn v0.8b, v0.8h, #3			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - shrn v0.8b, v0.8h, #3
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - shrn2 v0.16b, v0.8h, #3			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - shrn2 v0.16b, v0.8h, #3
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - shrn2 v0.4s, v0.2d, #3			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - shrn2 v0.4s, v0.2d, #3
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - shrn2 v0.8h, v0.4s, #3			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - shrn2 v0.8h, v0.4s, #3
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - shsub v0.2s, v0.2s, v0.2s			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - shsub v0.2s, v0.2s, v0.2s
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - shsub v0.4h, v0.4h, v0.4h			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - shsub v0.4h, v0.4h, v0.4h
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - sli d10, d14, #12			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - sli d10, d14, #12
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - sli v0.16b, v0.16b, #3			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - sli v0.16b, v0.16b, #3
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - sli v0.2d, v0.2d, #3			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - sli v0.2d, v0.2d, #3
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - sli v0.2s, v0.2s, #3			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - sli v0.2s, v0.2s, #3
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - sli v0.4h, v0.4h, #3			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - sli v0.4h, v0.4h, #3
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - sli v0.4s, v0.4s, #3			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - sli v0.4s, v0.4s, #3
	Show All 38 Lines
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - sqabs v0.2s, v0.2s			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - sqabs v0.2s, v0.2s
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - sqabs v0.4h, v0.4h			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - sqabs v0.4h, v0.4h
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - sqabs v0.4s, v0.4s			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - sqabs v0.4s, v0.4s
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - sqabs v0.8b, v0.8b			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - sqabs v0.8b, v0.8b
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - sqabs v0.8h, v0.8h			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - sqabs v0.8h, v0.8h
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - sqadd b20, b11, b15			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - sqadd b20, b11, b15
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - sqadd v0.16b, v0.16b, v0.16b			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - sqadd v0.16b, v0.16b, v0.16b
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - sqadd v0.2s, v0.2s, v0.2s			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - sqadd v0.2s, v0.2s, v0.2s
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - sqdmlal d19, s24, s12			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - sqdmlal d19, s24, s12
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - sqdmlal d8, s9, v0.s[1]			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - sqdmlal d8, s9, v0.s[1]
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - sqdmlal s0, h0, v0.h[3]			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - sqdmlal s0, h0, v0.h[3]
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - sqdmlal s17, h27, h12			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - sqdmlal s17, h27, h12
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - sqdmlal v0.2d, v0.2s, v0.2s			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - sqdmlal v0.2d, v0.2s, v0.2s
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - sqdmlal v0.4s, v0.4h, v0.4h			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - sqdmlal v0.4s, v0.4h, v0.4h
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - sqdmlal2 v0.2d, v0.4s, v0.4s			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - sqdmlal2 v0.2d, v0.4s, v0.4s
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - sqdmlal2 v0.4s, v0.8h, v0.8h			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - sqdmlal2 v0.4s, v0.8h, v0.8h
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - sqdmlsl d12, s23, s13			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - sqdmlsl d12, s23, s13
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - sqdmlsl d8, s9, v0.s[1]			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - sqdmlsl d8, s9, v0.s[1]
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - sqdmlsl s0, h0, v0.h[3]			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - sqdmlsl s0, h0, v0.h[3]
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - sqdmlsl s14, h12, h25			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - sqdmlsl s14, h12, h25
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - sqdmlsl v0.2d, v0.2s, v0.2s			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - sqdmlsl v0.2d, v0.2s, v0.2s
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - sqdmlsl v0.4s, v0.4h, v0.4h			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - sqdmlsl v0.4s, v0.4h, v0.4h
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - sqdmlsl2 v0.2d, v0.4s, v0.4s			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - sqdmlsl2 v0.2d, v0.4s, v0.4s
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - sqdmlsl2 v0.4s, v0.8h, v0.8h			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - sqdmlsl2 v0.4s, v0.8h, v0.8h
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - sqdmulh h10, h11, h12			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - sqdmulh h10, h11, h12
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - sqdmulh h7, h15, v0.h[3]			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - sqdmulh h7, h15, v0.h[3]
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - sqdmulh s15, s14, v0.s[1]			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - sqdmulh s15, s14, v0.s[1]
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - sqdmulh s20, s21, s2			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - sqdmulh s20, s21, s2
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - sqdmulh v0.2s, v0.2s, v0.2s			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - sqdmulh v0.2s, v0.2s, v0.2s
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - sqdmulh v0.4s, v0.4s, v0.4s			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - sqdmulh v0.4s, v0.4s, v0.4s
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - sqdmull d1, s1, v0.s[1]			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - sqdmull d1, s1, v0.s[1]
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - sqdmull d15, s22, s12			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - sqdmull d15, s22, s12
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - sqdmull s1, h1, v0.h[3]			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - sqdmull s1, h1, v0.h[3]
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - sqdmull s12, h22, h12			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - sqdmull s12, h22, h12
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - sqdmull v0.2d, v0.2s, v0.2s			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - sqdmull v0.2d, v0.2s, v0.2s
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - sqdmull v0.4s, v0.4h, v0.4h			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - sqdmull v0.4s, v0.4h, v0.4h
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - sqdmull2 v0.2d, v0.4s, v0.4s			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - sqdmull2 v0.2d, v0.4s, v0.4s
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - sqdmull2 v0.4s, v0.8h, v0.8h			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - sqdmull2 v0.4s, v0.8h, v0.8h
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - sqneg b19, b14			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - sqneg b19, b14
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - sqneg d18, d12			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - sqneg d18, d12
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - sqneg h21, h15			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - sqneg h21, h15
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - sqneg s20, s12			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - sqneg s20, s12
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - sqneg v0.16b, v0.16b			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - sqneg v0.16b, v0.16b
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - sqneg v0.2d, v0.2d			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - sqneg v0.2d, v0.2d
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - sqneg v0.2s, v0.2s			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - sqneg v0.2s, v0.2s
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - sqneg v0.4h, v0.4h			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - sqneg v0.4h, v0.4h
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - sqneg v0.4s, v0.4s			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - sqneg v0.4s, v0.4s
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - sqneg v0.8b, v0.8b			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - sqneg v0.8b, v0.8b
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - sqneg v0.8h, v0.8h			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - sqneg v0.8h, v0.8h
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - sqrdmulh h10, h11, h12			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - sqrdmulh h10, h11, h12
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - sqrdmulh h7, h15, v0.h[3]			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - sqrdmulh h7, h15, v0.h[3]
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - sqrdmulh s15, s14, v0.s[1]			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - sqrdmulh s15, s14, v0.s[1]
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - sqrdmulh s20, s21, s2			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - sqrdmulh s20, s21, s2
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - sqrdmulh v0.4h, v0.4h, v0.4h			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - sqrdmulh v0.4h, v0.4h, v0.4h
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - sqrdmulh v0.8h, v0.8h, v0.8h			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - sqrdmulh v0.8h, v0.8h, v0.8h
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - sqrshl d31, d31, d31			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - sqrshl d31, d31, d31
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - sqrshl h3, h4, h15			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - sqrshl h3, h4, h15
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - sqrshl v0.2s, v0.2s, v0.2s			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - sqrshl v0.2s, v0.2s, v0.2s
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - sqrshl v0.4h, v0.4h, v0.4h			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - sqrshl v0.4h, v0.4h, v0.4h
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - sqrshl v0.8b, v0.8b, v0.8b			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - sqrshl v0.8b, v0.8b, v0.8b
	▲ Show 20 Lines • Show All 100 Lines • ▼ Show 20 Lines
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - srshr d19, d18, #7			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - srshr d19, d18, #7
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - srshr v0.16b, v0.16b, #3			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - srshr v0.16b, v0.16b, #3
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - srshr v0.2d, v0.2d, #3			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - srshr v0.2d, v0.2d, #3
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - srshr v0.2s, v0.2s, #3			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - srshr v0.2s, v0.2s, #3
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - srshr v0.4h, v0.4h, #3			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - srshr v0.4h, v0.4h, #3
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - srshr v0.4s, v0.4s, #3			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - srshr v0.4s, v0.4s, #3
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - srshr v0.8b, v0.8b, #3			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - srshr v0.8b, v0.8b, #3
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - srshr v0.8h, v0.8h, #3			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - srshr v0.8h, v0.8h, #3
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - srsra d15, d11, #19			# CHECK-NEXT: - - - - 2.00 2.00 - - - - - - srsra d15, d11, #19
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - srsra v0.16b, v0.16b, #3			# CHECK-NEXT: - - - - 2.00 2.00 - - - - - - srsra v0.16b, v0.16b, #3
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - srsra v0.2d, v0.2d, #3			# CHECK-NEXT: - - - - 2.00 2.00 - - - - - - srsra v0.2d, v0.2d, #3
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - srsra v0.2s, v0.2s, #3			# CHECK-NEXT: - - - - 2.00 2.00 - - - - - - srsra v0.2s, v0.2s, #3
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - srsra v0.4h, v0.4h, #3			# CHECK-NEXT: - - - - 2.00 2.00 - - - - - - srsra v0.4h, v0.4h, #3
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - srsra v0.4s, v0.4s, #3			# CHECK-NEXT: - - - - 2.00 2.00 - - - - - - srsra v0.4s, v0.4s, #3
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - srsra v0.8b, v0.8b, #3			# CHECK-NEXT: - - - - 2.00 2.00 - - - - - - srsra v0.8b, v0.8b, #3
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - srsra v0.8h, v0.8h, #3			# CHECK-NEXT: - - - - 2.00 2.00 - - - - - - srsra v0.8h, v0.8h, #3
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - sshl d31, d31, d31			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - sshl d31, d31, d31
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - sshl v0.2d, v0.2d, v0.2d			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - sshl v0.2d, v0.2d, v0.2d
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - sshl v0.2s, v0.2s, v0.2s			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - sshl v0.2s, v0.2s, v0.2s
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - sshl v0.4h, v0.4h, v0.4h			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - sshl v0.4h, v0.4h, v0.4h
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - sshl v0.8b, v0.8b, v0.8b			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - sshl v0.8b, v0.8b, v0.8b
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - sshll v0.2d, v0.2s, #3			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - sshll v0.2d, v0.2s, #3
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - sshll2 v0.4s, v0.8h, #3			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - sshll2 v0.4s, v0.8h, #3
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - sshr d15, d16, #12			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - sshr d15, d16, #12
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - sshr v0.16b, v0.16b, #3			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - sshr v0.16b, v0.16b, #3
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - sshr v0.2d, v0.2d, #3			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - sshr v0.2d, v0.2d, #3
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - sshr v0.2s, v0.2s, #3			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - sshr v0.2s, v0.2s, #3
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - sshr v0.4h, v0.4h, #3			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - sshr v0.4h, v0.4h, #3
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - sshr v0.4s, v0.4s, #3			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - sshr v0.4s, v0.4s, #3
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - sshr v0.8b, v0.8b, #3			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - sshr v0.8b, v0.8b, #3
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - sshr v0.8h, v0.8h, #3			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - sshr v0.8h, v0.8h, #3
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - ssra d18, d12, #21			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - ssra d18, d12, #21
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - ssra v0.16b, v0.16b, #3			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - ssra v0.16b, v0.16b, #3
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - ssra v0.2d, v0.2d, #3			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - ssra v0.2d, v0.2d, #3
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - ssra v0.2s, v0.2s, #3			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - ssra v0.2s, v0.2s, #3
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - ssra v0.4h, v0.4h, #3			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - ssra v0.4h, v0.4h, #3
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - ssra v0.4s, v0.4s, #3			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - ssra v0.4s, v0.4s, #3
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - ssra v0.8b, v0.8b, #3			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - ssra v0.8b, v0.8b, #3
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - ssra v0.8h, v0.8h, #3			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - ssra v0.8h, v0.8h, #3
	▲ Show 20 Lines • Show All 69 Lines • ▼ Show 20 Lines
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - trn1 v0.8h, v0.8h, v0.8h			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - trn1 v0.8h, v0.8h, v0.8h
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - trn2 v0.16b, v0.16b, v0.16b			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - trn2 v0.16b, v0.16b, v0.16b
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - trn2 v0.2d, v0.2d, v0.2d			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - trn2 v0.2d, v0.2d, v0.2d
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - trn2 v0.2s, v0.2s, v0.2s			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - trn2 v0.2s, v0.2s, v0.2s
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - trn2 v0.4h, v0.4h, v0.4h			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - trn2 v0.4h, v0.4h, v0.4h
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - trn2 v0.4s, v0.4s, v0.4s			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - trn2 v0.4s, v0.4s, v0.4s
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - trn2 v0.8b, v0.8b, v0.8b			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - trn2 v0.8b, v0.8b, v0.8b
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - trn2 v0.8h, v0.8h, v0.8h			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - trn2 v0.8h, v0.8h, v0.8h
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - uaba v0.8b, v0.8b, v0.8b			# CHECK-NEXT: - - - - 2.00 2.00 - - - - - - uaba v0.8b, v0.8b, v0.8b
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - uabal v0.2d, v0.2s, v0.2s			# CHECK-NEXT: - - - - 2.00 2.00 - - - - - - uabal v0.2d, v0.2s, v0.2s
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - uabal v0.4s, v0.4h, v0.4h			# CHECK-NEXT: - - - - 2.00 2.00 - - - - - - uabal v0.4s, v0.4h, v0.4h
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - uabal v0.8h, v0.8b, v0.8b			# CHECK-NEXT: - - - - 2.00 2.00 - - - - - - uabal v0.8h, v0.8b, v0.8b
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - uabal2 v0.2d, v0.4s, v0.4s			# CHECK-NEXT: - - - - 2.00 2.00 - - - - - - uabal2 v0.2d, v0.4s, v0.4s
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - uabal2 v0.4s, v0.8h, v0.8h			# CHECK-NEXT: - - - - 2.00 2.00 - - - - - - uabal2 v0.4s, v0.8h, v0.8h
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - uabal2 v0.8h, v0.16b, v0.16b			# CHECK-NEXT: - - - - 2.00 2.00 - - - - - - uabal2 v0.8h, v0.16b, v0.16b
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - uabd v0.4h, v0.4h, v0.4h			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - uabd v0.4h, v0.4h, v0.4h
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - uabdl v0.2d, v0.2s, v0.2s			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - uabdl v0.2d, v0.2s, v0.2s
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - uabdl v0.4s, v0.4h, v0.4h			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - uabdl v0.4s, v0.4h, v0.4h
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - uabdl v0.8h, v0.8b, v0.8b			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - uabdl v0.8h, v0.8b, v0.8b
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - uabdl2 v0.2d, v0.4s, v0.4s			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - uabdl2 v0.2d, v0.4s, v0.4s
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - uabdl2 v0.4s, v0.8h, v0.8h			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - uabdl2 v0.4s, v0.8h, v0.8h
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - uabdl2 v0.8h, v0.16b, v0.16b			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - uabdl2 v0.8h, v0.16b, v0.16b
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - uadalp v0.1d, v0.2s			# CHECK-NEXT: - - - - 2.00 2.00 - - - - - - uadalp v0.1d, v0.2s
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - uadalp v0.2d, v0.4s			# CHECK-NEXT: - - - - 2.00 2.00 - - - - - - uadalp v0.2d, v0.4s
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - uadalp v0.2s, v0.4h			# CHECK-NEXT: - - - - 2.00 2.00 - - - - - - uadalp v0.2s, v0.4h
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - uadalp v0.4h, v0.8b			# CHECK-NEXT: - - - - 2.00 2.00 - - - - - - uadalp v0.4h, v0.8b
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - uadalp v0.4s, v0.8h			# CHECK-NEXT: - - - - 2.00 2.00 - - - - - - uadalp v0.4s, v0.8h
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - uadalp v0.8h, v0.16b			# CHECK-NEXT: - - - - 2.00 2.00 - - - - - - uadalp v0.8h, v0.16b
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - uaddl v0.2d, v0.2s, v0.2s			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - uaddl v0.2d, v0.2s, v0.2s
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - uaddl v0.4s, v0.4h, v0.4h			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - uaddl v0.4s, v0.4h, v0.4h
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - uaddl v0.8h, v0.8b, v0.8b			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - uaddl v0.8h, v0.8b, v0.8b
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - uaddl2 v0.2d, v0.4s, v0.4s			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - uaddl2 v0.2d, v0.4s, v0.4s
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - uaddl2 v0.4s, v0.8h, v0.8h			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - uaddl2 v0.4s, v0.8h, v0.8h
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - uaddl2 v0.8h, v0.16b, v0.16b			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - uaddl2 v0.8h, v0.16b, v0.16b
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - uaddlp v0.1d, v0.2s			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - uaddlp v0.1d, v0.2s
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - uaddlp v0.2d, v0.4s			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - uaddlp v0.2d, v0.4s
	▲ Show 20 Lines • Show All 121 Lines • ▼ Show 20 Lines
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - urshr v0.2d, v0.2d, #3			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - urshr v0.2d, v0.2d, #3
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - urshr v0.2s, v0.2s, #3			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - urshr v0.2s, v0.2s, #3
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - urshr v0.4h, v0.4h, #3			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - urshr v0.4h, v0.4h, #3
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - urshr v0.4s, v0.4s, #3			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - urshr v0.4s, v0.4s, #3
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - urshr v0.8b, v0.8b, #3			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - urshr v0.8b, v0.8b, #3
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - urshr v0.8h, v0.8h, #3			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - urshr v0.8h, v0.8h, #3
	# CHECK-NEXT: - - - - - - 9.00 - - - - - ursqrte v0.2s, v0.2s			# CHECK-NEXT: - - - - - - 9.00 - - - - - ursqrte v0.2s, v0.2s
	# CHECK-NEXT: - - - - - - 9.00 - - - - - ursqrte v0.4s, v0.4s			# CHECK-NEXT: - - - - - - 9.00 - - - - - ursqrte v0.4s, v0.4s
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - ursra d18, d10, #13			# CHECK-NEXT: - - - - 2.00 2.00 - - - - - - ursra d18, d10, #13
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - ursra v0.16b, v0.16b, #3			# CHECK-NEXT: - - - - 2.00 2.00 - - - - - - ursra v0.16b, v0.16b, #3
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - ursra v0.2d, v0.2d, #3			# CHECK-NEXT: - - - - 2.00 2.00 - - - - - - ursra v0.2d, v0.2d, #3
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - ursra v0.2s, v0.2s, #3			# CHECK-NEXT: - - - - 2.00 2.00 - - - - - - ursra v0.2s, v0.2s, #3
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - ursra v0.4h, v0.4h, #3			# CHECK-NEXT: - - - - 2.00 2.00 - - - - - - ursra v0.4h, v0.4h, #3
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - ursra v0.4s, v0.4s, #3			# CHECK-NEXT: - - - - 2.00 2.00 - - - - - - ursra v0.4s, v0.4s, #3
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - ursra v0.8b, v0.8b, #3			# CHECK-NEXT: - - - - 2.00 2.00 - - - - - - ursra v0.8b, v0.8b, #3
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - ursra v0.8h, v0.8h, #3			# CHECK-NEXT: - - - - 2.00 2.00 - - - - - - ursra v0.8h, v0.8h, #3
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - ushl d0, d0, d0			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - ushl d0, d0, d0
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - ushl v0.16b, v0.16b, v0.16b			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - ushl v0.16b, v0.16b, v0.16b
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - ushl v0.4s, v0.4s, v0.4s			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - ushl v0.4s, v0.4s, v0.4s
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - ushl v0.8h, v0.8h, v0.8h			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - ushl v0.8h, v0.8h, v0.8h
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - ushll v0.4s, v0.4h, #3			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - ushll v0.4s, v0.4h, #3
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - ushll2 v0.8h, v0.16b, #3			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - ushll2 v0.8h, v0.16b, #3
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - ushr d10, d17, #18			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - ushr d10, d17, #18
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - ushr v0.16b, v0.16b, #3			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - ushr v0.16b, v0.16b, #3
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - ushr v0.2d, v0.2d, #3			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - ushr v0.2d, v0.2d, #3
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - ushr v0.2s, v0.2s, #3			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - ushr v0.2s, v0.2s, #3
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - ushr v0.4h, v0.4h, #3			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - ushr v0.4h, v0.4h, #3
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - ushr v0.4s, v0.4s, #3			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - ushr v0.4s, v0.4s, #3
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - ushr v0.8b, v0.8b, #3			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - ushr v0.8b, v0.8b, #3
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - ushr v0.8h, v0.8h, #3			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - ushr v0.8h, v0.8h, #3
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - usqadd b19, b14			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - usqadd b19, b14
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - usqadd d18, d22			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - usqadd d18, d22
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - usqadd h20, h15			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - usqadd h20, h15
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - usqadd s21, s12			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - usqadd s21, s12
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - usqadd v0.16b, v0.16b			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - usqadd v0.16b, v0.16b
	# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - usqadd v0.2d, v0.2d			# CHECK-NEXT: - - - - 1.00 1.00 - - - - - - usqadd v0.2d, v0.2d
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - usqadd v0.2s, v0.2s			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - usqadd v0.2s, v0.2s
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - usqadd v0.4h, v0.4h			# CHECK-NEXT: - - - - 0.50 0.50 - - - - - - usqadd v0.4h, v0.4h
	▲ Show 20 Lines • Show All 57 Lines • Show Last 20 Lines

This is an archive of the discontinued LLVM Phabricator instance.

[SchedModels][CortexA55] Add ASIMD integer instructioinsClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 409560

llvm/lib/Target/AArch64/AArch64SchedA55.td

llvm/test/Analysis/CostModel/AArch64/vector-select.ll

llvm/test/CodeGen/AArch64/GlobalISel/combine-udiv.ll

llvm/test/CodeGen/AArch64/aarch64-dup-ext.ll

llvm/test/CodeGen/AArch64/active_lane_mask.ll

llvm/test/CodeGen/AArch64/addsub-constant-folding.ll

llvm/test/CodeGen/AArch64/arm64-AdvSIMD-Scalar.ll

llvm/test/CodeGen/AArch64/arm64-fcopysign.ll

llvm/test/CodeGen/AArch64/arm64-sli-sri-opt.ll

llvm/test/CodeGen/AArch64/arm64-subvector-extend.ll

llvm/test/CodeGen/AArch64/arm64-vhadd.ll

llvm/test/CodeGen/AArch64/cmp-select-sign.ll

llvm/test/CodeGen/AArch64/dag-numsignbits.ll

llvm/test/CodeGen/AArch64/div-rem-pair-recomposition-signed.ll

llvm/test/CodeGen/AArch64/div-rem-pair-recomposition-unsigned.ll

llvm/test/CodeGen/AArch64/expand-vector-rot.ll

llvm/test/CodeGen/AArch64/f16-instructions.ll

llvm/test/CodeGen/AArch64/fcopysign.ll

llvm/test/CodeGen/AArch64/fptosi-sat-vector.ll

llvm/test/CodeGen/AArch64/fptoui-sat-vector.ll

llvm/test/CodeGen/AArch64/funnel-shift-rot.ll

llvm/test/CodeGen/AArch64/insert-subvector-res-legalization.ll

llvm/test/CodeGen/AArch64/lowerMUL-newload.ll

llvm/test/CodeGen/AArch64/minmax-of-minmax.ll

llvm/test/CodeGen/AArch64/minmax.ll

llvm/test/CodeGen/AArch64/overeager_mla_fusing.ll

llvm/test/CodeGen/AArch64/ragreedy-local-interval-cost.ll

llvm/test/CodeGen/AArch64/sadd_sat_vec.ll

llvm/test/CodeGen/AArch64/sat-add.ll

llvm/test/CodeGen/AArch64/selectcc-to-shiftand.ll

llvm/test/CodeGen/AArch64/signbit-shift.ll

llvm/test/CodeGen/AArch64/sink-addsub-of-const.ll

llvm/test/CodeGen/AArch64/sinksplat.ll

llvm/test/CodeGen/AArch64/sitofp-fixed-legal.ll

llvm/test/CodeGen/AArch64/srem-seteq-illegal-types.ll

llvm/test/CodeGen/AArch64/srem-seteq-vec-nonsplat.ll

llvm/test/CodeGen/AArch64/srem-seteq-vec-splat.ll

llvm/test/CodeGen/AArch64/ssub_sat_vec.ll

llvm/test/CodeGen/AArch64/sve-fixed-length-int-div.ll

llvm/test/CodeGen/AArch64/sve-fixed-length-int-mulh.ll

llvm/test/CodeGen/AArch64/sve-fixed-length-int-rem.ll

llvm/test/CodeGen/AArch64/sve-fixed-length-masked-scatter.ll

llvm/test/CodeGen/AArch64/sve-vscale-attr.ll

llvm/test/CodeGen/AArch64/uadd_sat_vec.ll

llvm/test/CodeGen/AArch64/urem-seteq-illegal-types.ll

llvm/test/CodeGen/AArch64/urem-seteq-vec-nonsplat.ll

llvm/test/CodeGen/AArch64/urem-seteq-vec-nonzero.ll

llvm/test/CodeGen/AArch64/urem-seteq-vec-splat.ll

llvm/test/CodeGen/AArch64/urem-seteq-vec-tautological.ll

llvm/test/CodeGen/AArch64/usub_sat_vec.ll

llvm/test/CodeGen/AArch64/vec_cttz.ll

llvm/test/CodeGen/AArch64/vec_uaddo.ll

llvm/test/CodeGen/AArch64/vec_umulo.ll

llvm/test/CodeGen/AArch64/vecreduce-add.ll

llvm/test/CodeGen/AArch64/vecreduce-and-legalization.ll

llvm/test/CodeGen/AArch64/vecreduce-fmax-legalization.ll

llvm/test/CodeGen/AArch64/vecreduce-fmin-legalization.ll

llvm/test/CodeGen/AArch64/vector-fcopysign.ll

llvm/test/CodeGen/AArch64/vselect-constants.ll

llvm/test/tools/llvm-mca/AArch64/Cortex/A55-neon-instructions.s

[SchedModels][CortexA55] Add ASIMD integer instructioins
ClosedPublic