This is an archive of the discontinued LLVM Phabricator instance.

Paths

Table of Contentst

-
llvm/
-
include/llvm/IR/
-
llvm/
-
IR/
-
IntrinsicsAArch64.td
-
lib/Target/AArch64/
-
Target/
-
AArch64/
-
AArch64ISelLowering.cpp
-
test/CodeGen/AArch64/
-
CodeGen/
-
AArch64/
-
sve-aba.ll
-
sve-intrinsics-int-arith-undef.ll
-
sve-intrinsics-shifts-undef.ll
-
sve2-sra.ll

Differential D141937

[SVE] Add intrinsics for integer binops that explicitly undefine the result for inactive lanes.
ClosedPublic

Authored by paulwalker-arm on Jan 17 2023, 7:45 AM.

Download Raw Diff

Details

Reviewers

efriedma
sdesmalen
kmclaughlin
david-arm

Commits

rGb34de68a1aaa: [SVE] Add intrinsics for integer binops that explicitly undefine the result for…

Summary

The intent is to lower the clang X form SVE builtins to these
intrinsics. The suffix _x is already in use to signify unpredicated
SVE intrinsics hence my choice to use _u to signify those intrinsics
where the result for inactive lanes is undefined.

Diff Detail

Repository: rG LLVM Github Monorepo

Event Timeline

paulwalker-arm created this revision.Jan 17 2023, 7:45 AM

Herald added a reviewer: efriedma. · View Herald TranscriptJan 17 2023, 7:45 AM

Herald added a project: Restricted Project. · View Herald Transcript

Herald added subscribers: ctetreau, psnobl, hiraditya, tschuett. · View Herald Transcript

paulwalker-arm requested review of this revision.Jan 17 2023, 7:45 AM

Herald added a project: Restricted Project. · View Herald TranscriptJan 17 2023, 7:45 AM

Herald added a subscriber: llvm-commits. · View Herald Transcript

paulwalker-arm added a child revision: D141938: [SVE][CodeGen] Relax all true isel requirement for predicated operations that have no side effects..Jan 17 2023, 7:51 AM

This along with D141939 forms my counter proposal to D141240 and represents my preferred option. The only downside that I can see is that some existing instruction combines might need to be updated to also consider these new intrinsics. With that said the combines we typically do are likely not necessary for these intrinsics because we can now do similar transformation during code generation (for example converting add+mul to mla) with those transformations likely to be desirable for auto-vectorised IR anyway. D141938 shows the more immediate benefit of these intrinsics in freeing up isel to allow better code generation.

NOTE: If this proves the winning design then I'm tempted to add instruction simplications to convert calls to the existing intrinsics where the predicate is all active to these new _u forms. Doing this will allow us to remove some duplication when pattern matching and also mean function like convertMergedOpToPredOp become redundant.

Harbormaster completed remote builds in B208246: Diff 489822.Jan 17 2023, 8:40 AM

The dedicated intrinsics seem better than the metadata. The cost of the extra names seems marginal compared to the complexity of ensuring we handle the metadata correctly.

That said, in some of these cases, the intrinsic seems marginally useful. What's the point of inventing llvm.aarch64.sve.add.u if we're going to immediately convert it to an LLVM IR "add"? Why not make clang just emit the "add" directly?

For the original ACLE design I made a mistake by assuming representing all the builtins via merging intrinsics would not affect code quality. So my rational here is not to make the same mistake again and thus at least at the point of IR creation have the IR capture the maximum amount of information. For a more practical reason, please consider:

add_u(pg, A, lsr_m(pg,B,C) => usra(A,B,C)	(Valid)
add(A, lsr_m(pg,B,C) => usra(A,B,C)		(Invalid)

Also, for what it's worth the lowering of add intrinsics to ISD::ADD came at a time when maximising code quality during isel was not possible. I believe D141938 changes that so we may end up reverting some of those transforms. It'll just depends on what common combines we might loose out on. Although, there is an argument that those combines should be replicated for the predicated nodes anyway.

LGTM

That explanation makes sense.

This revision is now accepted and ready to land.Jan 18 2023, 11:15 AM

Matt added a subscriber: Matt.Jan 18 2023, 2:06 PM

This revision was landed with ongoing or failed builds.Jan 22 2023, 4:26 AM

Closed by commit rGb34de68a1aaa: [SVE] Add intrinsics for integer binops that explicitly undefine the result for… (authored by paulwalker-arm). · Explain Why

This revision was automatically updated to reflect the committed changes.

paulwalker-arm added a commit: rGb34de68a1aaa: [SVE] Add intrinsics for integer binops that explicitly undefine the result for….

paulwalker-arm mentioned this in D143765: [SVE] Add intrinsics for floating-point operations that explicitly undefine the result for inactive lanes..Feb 10 2023, 10:18 AM

paulwalker-arm mentioned this in rGcf4df6168838: [SVE] Add intrinsics for floating-point operations that explicitly undefine the….Feb 17 2023, 6:23 AM

Revision Contents

Path

Size

llvm/

include/

llvm/

IR/

IntrinsicsAArch64.td

16 lines

lib/

Target/

AArch64/

AArch64ISelLowering.cpp

48 lines

test/

CodeGen/

AArch64/

sve-aba.ll

90 lines

sve-intrinsics-int-arith-undef.ll

1222 lines

sve-intrinsics-shifts-undef.ll

331 lines

sve2-sra.ll

113 lines

Diff 491146

llvm/include/llvm/IR/IntrinsicsAArch64.td

	Show First 20 Lines • Show All 1,606 Lines • ▼ Show 20 Lines
	def int_aarch64_sve_adrw : AdvSIMD_2VectorArg_Intrinsic;			def int_aarch64_sve_adrw : AdvSIMD_2VectorArg_Intrinsic;
	def int_aarch64_sve_adrd : AdvSIMD_2VectorArg_Intrinsic;			def int_aarch64_sve_adrd : AdvSIMD_2VectorArg_Intrinsic;

	//			//
	// Integer arithmetic			// Integer arithmetic
	//			//

	def int_aarch64_sve_add : AdvSIMD_Pred2VectorArg_Intrinsic;			def int_aarch64_sve_add : AdvSIMD_Pred2VectorArg_Intrinsic;
				def int_aarch64_sve_add_u : AdvSIMD_Pred2VectorArg_Intrinsic;
	def int_aarch64_sve_sub : AdvSIMD_Pred2VectorArg_Intrinsic;			def int_aarch64_sve_sub : AdvSIMD_Pred2VectorArg_Intrinsic;
				def int_aarch64_sve_sub_u : AdvSIMD_Pred2VectorArg_Intrinsic;
	def int_aarch64_sve_subr : AdvSIMD_Pred2VectorArg_Intrinsic;			def int_aarch64_sve_subr : AdvSIMD_Pred2VectorArg_Intrinsic;

	def int_aarch64_sve_pmul : AdvSIMD_2VectorArg_Intrinsic;			def int_aarch64_sve_pmul : AdvSIMD_2VectorArg_Intrinsic;

	def int_aarch64_sve_mul : AdvSIMD_Pred2VectorArg_Intrinsic;			def int_aarch64_sve_mul : AdvSIMD_Pred2VectorArg_Intrinsic;
				def int_aarch64_sve_mul_u : AdvSIMD_Pred2VectorArg_Intrinsic;
	def int_aarch64_sve_mul_lane : AdvSIMD_2VectorArgIndexed_Intrinsic;			def int_aarch64_sve_mul_lane : AdvSIMD_2VectorArgIndexed_Intrinsic;
	def int_aarch64_sve_smulh : AdvSIMD_Pred2VectorArg_Intrinsic;			def int_aarch64_sve_smulh : AdvSIMD_Pred2VectorArg_Intrinsic;
				def int_aarch64_sve_smulh_u : AdvSIMD_Pred2VectorArg_Intrinsic;
	def int_aarch64_sve_umulh : AdvSIMD_Pred2VectorArg_Intrinsic;			def int_aarch64_sve_umulh : AdvSIMD_Pred2VectorArg_Intrinsic;
				def int_aarch64_sve_umulh_u : AdvSIMD_Pred2VectorArg_Intrinsic;

	def int_aarch64_sve_sdiv : AdvSIMD_Pred2VectorArg_Intrinsic;			def int_aarch64_sve_sdiv : AdvSIMD_Pred2VectorArg_Intrinsic;
				def int_aarch64_sve_sdiv_u : AdvSIMD_Pred2VectorArg_Intrinsic;
	def int_aarch64_sve_udiv : AdvSIMD_Pred2VectorArg_Intrinsic;			def int_aarch64_sve_udiv : AdvSIMD_Pred2VectorArg_Intrinsic;
				def int_aarch64_sve_udiv_u : AdvSIMD_Pred2VectorArg_Intrinsic;
	def int_aarch64_sve_sdivr : AdvSIMD_Pred2VectorArg_Intrinsic;			def int_aarch64_sve_sdivr : AdvSIMD_Pred2VectorArg_Intrinsic;
	def int_aarch64_sve_udivr : AdvSIMD_Pred2VectorArg_Intrinsic;			def int_aarch64_sve_udivr : AdvSIMD_Pred2VectorArg_Intrinsic;

	def int_aarch64_sve_smax : AdvSIMD_Pred2VectorArg_Intrinsic;			def int_aarch64_sve_smax : AdvSIMD_Pred2VectorArg_Intrinsic;
				def int_aarch64_sve_smax_u : AdvSIMD_Pred2VectorArg_Intrinsic;
	def int_aarch64_sve_umax : AdvSIMD_Pred2VectorArg_Intrinsic;			def int_aarch64_sve_umax : AdvSIMD_Pred2VectorArg_Intrinsic;
				def int_aarch64_sve_umax_u : AdvSIMD_Pred2VectorArg_Intrinsic;
	def int_aarch64_sve_smin : AdvSIMD_Pred2VectorArg_Intrinsic;			def int_aarch64_sve_smin : AdvSIMD_Pred2VectorArg_Intrinsic;
				def int_aarch64_sve_smin_u : AdvSIMD_Pred2VectorArg_Intrinsic;
	def int_aarch64_sve_umin : AdvSIMD_Pred2VectorArg_Intrinsic;			def int_aarch64_sve_umin : AdvSIMD_Pred2VectorArg_Intrinsic;
				def int_aarch64_sve_umin_u : AdvSIMD_Pred2VectorArg_Intrinsic;
	def int_aarch64_sve_sabd : AdvSIMD_Pred2VectorArg_Intrinsic;			def int_aarch64_sve_sabd : AdvSIMD_Pred2VectorArg_Intrinsic;
				def int_aarch64_sve_sabd_u : AdvSIMD_Pred2VectorArg_Intrinsic;
	def int_aarch64_sve_uabd : AdvSIMD_Pred2VectorArg_Intrinsic;			def int_aarch64_sve_uabd : AdvSIMD_Pred2VectorArg_Intrinsic;
				def int_aarch64_sve_uabd_u : AdvSIMD_Pred2VectorArg_Intrinsic;

	def int_aarch64_sve_mad : AdvSIMD_Pred3VectorArg_Intrinsic;			def int_aarch64_sve_mad : AdvSIMD_Pred3VectorArg_Intrinsic;
	def int_aarch64_sve_msb : AdvSIMD_Pred3VectorArg_Intrinsic;			def int_aarch64_sve_msb : AdvSIMD_Pred3VectorArg_Intrinsic;
	def int_aarch64_sve_mla : AdvSIMD_Pred3VectorArg_Intrinsic;			def int_aarch64_sve_mla : AdvSIMD_Pred3VectorArg_Intrinsic;
	def int_aarch64_sve_mla_lane : AdvSIMD_3VectorArgIndexed_Intrinsic;			def int_aarch64_sve_mla_lane : AdvSIMD_3VectorArgIndexed_Intrinsic;
	def int_aarch64_sve_mls : AdvSIMD_Pred3VectorArg_Intrinsic;			def int_aarch64_sve_mls : AdvSIMD_Pred3VectorArg_Intrinsic;
	def int_aarch64_sve_mls_lane : AdvSIMD_3VectorArgIndexed_Intrinsic;			def int_aarch64_sve_mls_lane : AdvSIMD_3VectorArgIndexed_Intrinsic;

	Show All 21 Lines
	def int_aarch64_sve_sqadd_x : AdvSIMD_2VectorArg_Intrinsic;			def int_aarch64_sve_sqadd_x : AdvSIMD_2VectorArg_Intrinsic;
	def int_aarch64_sve_sqsub_x : AdvSIMD_2VectorArg_Intrinsic;			def int_aarch64_sve_sqsub_x : AdvSIMD_2VectorArg_Intrinsic;
	def int_aarch64_sve_uqadd_x : AdvSIMD_2VectorArg_Intrinsic;			def int_aarch64_sve_uqadd_x : AdvSIMD_2VectorArg_Intrinsic;
	def int_aarch64_sve_uqsub_x : AdvSIMD_2VectorArg_Intrinsic;			def int_aarch64_sve_uqsub_x : AdvSIMD_2VectorArg_Intrinsic;

	// Shifts			// Shifts

	def int_aarch64_sve_asr : AdvSIMD_Pred2VectorArg_Intrinsic;			def int_aarch64_sve_asr : AdvSIMD_Pred2VectorArg_Intrinsic;
				def int_aarch64_sve_asr_u : AdvSIMD_Pred2VectorArg_Intrinsic;
	def int_aarch64_sve_asr_wide : AdvSIMD_SVE_ShiftWide_Intrinsic;			def int_aarch64_sve_asr_wide : AdvSIMD_SVE_ShiftWide_Intrinsic;
	def int_aarch64_sve_asrd : AdvSIMD_SVE_ShiftByImm_Intrinsic;			def int_aarch64_sve_asrd : AdvSIMD_SVE_ShiftByImm_Intrinsic;
	def int_aarch64_sve_insr : AdvSIMD_SVE_INSR_Intrinsic;			def int_aarch64_sve_insr : AdvSIMD_SVE_INSR_Intrinsic;
	def int_aarch64_sve_lsl : AdvSIMD_Pred2VectorArg_Intrinsic;			def int_aarch64_sve_lsl : AdvSIMD_Pred2VectorArg_Intrinsic;
				def int_aarch64_sve_lsl_u : AdvSIMD_Pred2VectorArg_Intrinsic;
	def int_aarch64_sve_lsl_wide : AdvSIMD_SVE_ShiftWide_Intrinsic;			def int_aarch64_sve_lsl_wide : AdvSIMD_SVE_ShiftWide_Intrinsic;
	def int_aarch64_sve_lsr : AdvSIMD_Pred2VectorArg_Intrinsic;			def int_aarch64_sve_lsr : AdvSIMD_Pred2VectorArg_Intrinsic;
				def int_aarch64_sve_lsr_u : AdvSIMD_Pred2VectorArg_Intrinsic;
	def int_aarch64_sve_lsr_wide : AdvSIMD_SVE_ShiftWide_Intrinsic;			def int_aarch64_sve_lsr_wide : AdvSIMD_SVE_ShiftWide_Intrinsic;

	//			//
	// Integer comparisons			// Integer comparisons
	//			//

	def int_aarch64_sve_cmpeq : AdvSIMD_SVE_Compare_Intrinsic;			def int_aarch64_sve_cmpeq : AdvSIMD_SVE_Compare_Intrinsic;
	def int_aarch64_sve_cmpge : AdvSIMD_SVE_Compare_Intrinsic;			def int_aarch64_sve_cmpge : AdvSIMD_SVE_Compare_Intrinsic;
	▲ Show 20 Lines • Show All 1,138 Lines • Show Last 20 Lines

llvm/lib/Target/AArch64/AArch64ISelLowering.cpp

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 18,137 Lines • ▼ Show 20 Lines	case Intrinsic::aarch64_sve_dup:
return LowerSVEIntrinsicDUP(N, DAG);		return LowerSVEIntrinsicDUP(N, DAG);
case Intrinsic::aarch64_sve_dup_x:		case Intrinsic::aarch64_sve_dup_x:
return DAG.getNode(ISD::SPLAT_VECTOR, SDLoc(N), N->getValueType(0),		return DAG.getNode(ISD::SPLAT_VECTOR, SDLoc(N), N->getValueType(0),
N->getOperand(1));		N->getOperand(1));
case Intrinsic::aarch64_sve_ext:		case Intrinsic::aarch64_sve_ext:
return LowerSVEIntrinsicEXT(N, DAG);		return LowerSVEIntrinsicEXT(N, DAG);
case Intrinsic::aarch64_sve_mul:		case Intrinsic::aarch64_sve_mul:
return convertMergedOpToPredOp(N, AArch64ISD::MUL_PRED, DAG);		return convertMergedOpToPredOp(N, AArch64ISD::MUL_PRED, DAG);
		case Intrinsic::aarch64_sve_mul_u:
		return DAG.getNode(AArch64ISD::MUL_PRED, SDLoc(N), N->getValueType(0),
		N->getOperand(1), N->getOperand(2), N->getOperand(3));
case Intrinsic::aarch64_sve_smulh:		case Intrinsic::aarch64_sve_smulh:
return convertMergedOpToPredOp(N, AArch64ISD::MULHS_PRED, DAG);		return convertMergedOpToPredOp(N, AArch64ISD::MULHS_PRED, DAG);
		case Intrinsic::aarch64_sve_smulh_u:
		return DAG.getNode(AArch64ISD::MULHS_PRED, SDLoc(N), N->getValueType(0),
		N->getOperand(1), N->getOperand(2), N->getOperand(3));
case Intrinsic::aarch64_sve_umulh:		case Intrinsic::aarch64_sve_umulh:
return convertMergedOpToPredOp(N, AArch64ISD::MULHU_PRED, DAG);		return convertMergedOpToPredOp(N, AArch64ISD::MULHU_PRED, DAG);
		case Intrinsic::aarch64_sve_umulh_u:
		return DAG.getNode(AArch64ISD::MULHU_PRED, SDLoc(N), N->getValueType(0),
		N->getOperand(1), N->getOperand(2), N->getOperand(3));
case Intrinsic::aarch64_sve_smin:		case Intrinsic::aarch64_sve_smin:
return convertMergedOpToPredOp(N, AArch64ISD::SMIN_PRED, DAG);		return convertMergedOpToPredOp(N, AArch64ISD::SMIN_PRED, DAG);
		case Intrinsic::aarch64_sve_smin_u:
		return DAG.getNode(AArch64ISD::SMIN_PRED, SDLoc(N), N->getValueType(0),
		N->getOperand(1), N->getOperand(2), N->getOperand(3));
case Intrinsic::aarch64_sve_umin:		case Intrinsic::aarch64_sve_umin:
return convertMergedOpToPredOp(N, AArch64ISD::UMIN_PRED, DAG);		return convertMergedOpToPredOp(N, AArch64ISD::UMIN_PRED, DAG);
		case Intrinsic::aarch64_sve_umin_u:
		return DAG.getNode(AArch64ISD::UMIN_PRED, SDLoc(N), N->getValueType(0),
		N->getOperand(1), N->getOperand(2), N->getOperand(3));
case Intrinsic::aarch64_sve_smax:		case Intrinsic::aarch64_sve_smax:
return convertMergedOpToPredOp(N, AArch64ISD::SMAX_PRED, DAG);		return convertMergedOpToPredOp(N, AArch64ISD::SMAX_PRED, DAG);
		case Intrinsic::aarch64_sve_smax_u:
		return DAG.getNode(AArch64ISD::SMAX_PRED, SDLoc(N), N->getValueType(0),
		N->getOperand(1), N->getOperand(2), N->getOperand(3));
case Intrinsic::aarch64_sve_umax:		case Intrinsic::aarch64_sve_umax:
return convertMergedOpToPredOp(N, AArch64ISD::UMAX_PRED, DAG);		return convertMergedOpToPredOp(N, AArch64ISD::UMAX_PRED, DAG);
		case Intrinsic::aarch64_sve_umax_u:
		return DAG.getNode(AArch64ISD::UMAX_PRED, SDLoc(N), N->getValueType(0),
		N->getOperand(1), N->getOperand(2), N->getOperand(3));
case Intrinsic::aarch64_sve_lsl:		case Intrinsic::aarch64_sve_lsl:
return convertMergedOpToPredOp(N, AArch64ISD::SHL_PRED, DAG);		return convertMergedOpToPredOp(N, AArch64ISD::SHL_PRED, DAG);
		case Intrinsic::aarch64_sve_lsl_u:
		return DAG.getNode(AArch64ISD::SHL_PRED, SDLoc(N), N->getValueType(0),
		N->getOperand(1), N->getOperand(2), N->getOperand(3));
case Intrinsic::aarch64_sve_lsr:		case Intrinsic::aarch64_sve_lsr:
return convertMergedOpToPredOp(N, AArch64ISD::SRL_PRED, DAG);		return convertMergedOpToPredOp(N, AArch64ISD::SRL_PRED, DAG);
		case Intrinsic::aarch64_sve_lsr_u:
		return DAG.getNode(AArch64ISD::SRL_PRED, SDLoc(N), N->getValueType(0),
		N->getOperand(1), N->getOperand(2), N->getOperand(3));
case Intrinsic::aarch64_sve_asr:		case Intrinsic::aarch64_sve_asr:
return convertMergedOpToPredOp(N, AArch64ISD::SRA_PRED, DAG);		return convertMergedOpToPredOp(N, AArch64ISD::SRA_PRED, DAG);
		case Intrinsic::aarch64_sve_asr_u:
		return DAG.getNode(AArch64ISD::SRA_PRED, SDLoc(N), N->getValueType(0),
		N->getOperand(1), N->getOperand(2), N->getOperand(3));
case Intrinsic::aarch64_sve_fadd:		case Intrinsic::aarch64_sve_fadd:
return convertMergedOpToPredOp(N, AArch64ISD::FADD_PRED, DAG);		return convertMergedOpToPredOp(N, AArch64ISD::FADD_PRED, DAG);
case Intrinsic::aarch64_sve_fsub:		case Intrinsic::aarch64_sve_fsub:
return convertMergedOpToPredOp(N, AArch64ISD::FSUB_PRED, DAG);		return convertMergedOpToPredOp(N, AArch64ISD::FSUB_PRED, DAG);
case Intrinsic::aarch64_sve_fmul:		case Intrinsic::aarch64_sve_fmul:
return convertMergedOpToPredOp(N, AArch64ISD::FMUL_PRED, DAG);		return convertMergedOpToPredOp(N, AArch64ISD::FMUL_PRED, DAG);
case Intrinsic::aarch64_sve_add:		case Intrinsic::aarch64_sve_add:
return convertMergedOpToPredOp(N, ISD::ADD, DAG, true);		return convertMergedOpToPredOp(N, ISD::ADD, DAG, true);
		case Intrinsic::aarch64_sve_add_u:
		return DAG.getNode(ISD::ADD, SDLoc(N), N->getValueType(0), N->getOperand(2),
		N->getOperand(3));
case Intrinsic::aarch64_sve_sub:		case Intrinsic::aarch64_sve_sub:
return convertMergedOpToPredOp(N, ISD::SUB, DAG, true);		return convertMergedOpToPredOp(N, ISD::SUB, DAG, true);
		case Intrinsic::aarch64_sve_sub_u:
		return DAG.getNode(ISD::SUB, SDLoc(N), N->getValueType(0), N->getOperand(2),
		N->getOperand(3));
case Intrinsic::aarch64_sve_subr:		case Intrinsic::aarch64_sve_subr:
return convertMergedOpToPredOp(N, ISD::SUB, DAG, true, true);		return convertMergedOpToPredOp(N, ISD::SUB, DAG, true, true);
case Intrinsic::aarch64_sve_and:		case Intrinsic::aarch64_sve_and:
return convertMergedOpToPredOp(N, ISD::AND, DAG, true);		return convertMergedOpToPredOp(N, ISD::AND, DAG, true);
case Intrinsic::aarch64_sve_bic:		case Intrinsic::aarch64_sve_bic:
return convertMergedOpToPredOp(N, AArch64ISD::BIC, DAG, true);		return convertMergedOpToPredOp(N, AArch64ISD::BIC, DAG, true);
case Intrinsic::aarch64_sve_eor:		case Intrinsic::aarch64_sve_eor:
return convertMergedOpToPredOp(N, ISD::XOR, DAG, true);		return convertMergedOpToPredOp(N, ISD::XOR, DAG, true);
case Intrinsic::aarch64_sve_orr:		case Intrinsic::aarch64_sve_orr:
return convertMergedOpToPredOp(N, ISD::OR, DAG, true);		return convertMergedOpToPredOp(N, ISD::OR, DAG, true);
case Intrinsic::aarch64_sve_sabd:		case Intrinsic::aarch64_sve_sabd:
return convertMergedOpToPredOp(N, ISD::ABDS, DAG, true);		return convertMergedOpToPredOp(N, ISD::ABDS, DAG, true);
		case Intrinsic::aarch64_sve_sabd_u:
		return DAG.getNode(ISD::ABDS, SDLoc(N), N->getValueType(0),
		N->getOperand(2), N->getOperand(3));
case Intrinsic::aarch64_sve_uabd:		case Intrinsic::aarch64_sve_uabd:
return convertMergedOpToPredOp(N, ISD::ABDU, DAG, true);		return convertMergedOpToPredOp(N, ISD::ABDU, DAG, true);
		case Intrinsic::aarch64_sve_uabd_u:
		return DAG.getNode(ISD::ABDU, SDLoc(N), N->getValueType(0),
		N->getOperand(2), N->getOperand(3));
		case Intrinsic::aarch64_sve_sdiv_u:
		return DAG.getNode(AArch64ISD::SDIV_PRED, SDLoc(N), N->getValueType(0),
		N->getOperand(1), N->getOperand(2), N->getOperand(3));
		case Intrinsic::aarch64_sve_udiv_u:
		return DAG.getNode(AArch64ISD::UDIV_PRED, SDLoc(N), N->getValueType(0),
		N->getOperand(1), N->getOperand(2), N->getOperand(3));
case Intrinsic::aarch64_sve_sqadd:		case Intrinsic::aarch64_sve_sqadd:
return convertMergedOpToPredOp(N, ISD::SADDSAT, DAG, true);		return convertMergedOpToPredOp(N, ISD::SADDSAT, DAG, true);
case Intrinsic::aarch64_sve_sqsub:		case Intrinsic::aarch64_sve_sqsub:
return convertMergedOpToPredOp(N, ISD::SSUBSAT, DAG, true);		return convertMergedOpToPredOp(N, ISD::SSUBSAT, DAG, true);
case Intrinsic::aarch64_sve_uqadd:		case Intrinsic::aarch64_sve_uqadd:
return convertMergedOpToPredOp(N, ISD::UADDSAT, DAG, true);		return convertMergedOpToPredOp(N, ISD::UADDSAT, DAG, true);
case Intrinsic::aarch64_sve_uqsub:		case Intrinsic::aarch64_sve_uqsub:
return convertMergedOpToPredOp(N, ISD::USUBSAT, DAG, true);		return convertMergedOpToPredOp(N, ISD::USUBSAT, DAG, true);
▲ Show 20 Lines • Show All 5,783 Lines • Show Last 20 Lines

llvm/test/CodeGen/AArch64/sve-aba.ll

	Show First 20 Lines • Show All 41 Lines • ▼ Show 20 Lines
	; CHECK-NEXT: saba z0.b, z1.b, z2.b			; CHECK-NEXT: saba z0.b, z1.b, z2.b
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%1 = call <vscale x 16 x i1> @llvm.aarch64.sve.ptrue.nxv16i1(i32 31)			%1 = call <vscale x 16 x i1> @llvm.aarch64.sve.ptrue.nxv16i1(i32 31)
	%2 = call <vscale x 16 x i8> @llvm.aarch64.sve.sabd.nxv16i8(<vscale x 16 x i1> %1, <vscale x 16 x i8> %b, <vscale x 16 x i8> %c)			%2 = call <vscale x 16 x i8> @llvm.aarch64.sve.sabd.nxv16i8(<vscale x 16 x i1> %1, <vscale x 16 x i8> %b, <vscale x 16 x i8> %c)
	%3 = add <vscale x 16 x i8> %2, %a			%3 = add <vscale x 16 x i8> %2, %a
	ret <vscale x 16 x i8> %3			ret <vscale x 16 x i8> %3
	}			}

				define <vscale x 16 x i8> @saba_b_from_sabd_u(<vscale x 16 x i1> %pg, <vscale x 16 x i8> %a, <vscale x 16 x i8> %b, <vscale x 16 x i8> %c) #0 {
				; CHECK-LABEL: saba_b_from_sabd_u:
				; CHECK: // %bb.0:
				; CHECK-NEXT: saba z0.b, z1.b, z2.b
				; CHECK-NEXT: ret
				%1 = call <vscale x 16 x i8> @llvm.aarch64.sve.sabd.u.nxv16i8(<vscale x 16 x i1> %pg, <vscale x 16 x i8> %b, <vscale x 16 x i8> %c)
				%2 = add <vscale x 16 x i8> %1, %a
				ret <vscale x 16 x i8> %2
				}

	define <vscale x 8 x i16> @saba_h(<vscale x 8 x i16> %a, <vscale x 8 x i16> %b, <vscale x 8 x i16> %c) #0 {			define <vscale x 8 x i16> @saba_h(<vscale x 8 x i16> %a, <vscale x 8 x i16> %b, <vscale x 8 x i16> %c) #0 {
	; CHECK-LABEL: saba_h:			; CHECK-LABEL: saba_h:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: saba z0.h, z1.h, z2.h			; CHECK-NEXT: saba z0.h, z1.h, z2.h
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%b.sext = sext <vscale x 8 x i16> %b to <vscale x 8 x i32>			%b.sext = sext <vscale x 8 x i16> %b to <vscale x 8 x i32>
	%c.sext = sext <vscale x 8 x i16> %c to <vscale x 8 x i32>			%c.sext = sext <vscale x 8 x i16> %c to <vscale x 8 x i32>
	%sub = sub <vscale x 8 x i32> %b.sext, %c.sext			%sub = sub <vscale x 8 x i32> %b.sext, %c.sext
	Show All 25 Lines
	; CHECK-NEXT: saba z0.h, z1.h, z2.h			; CHECK-NEXT: saba z0.h, z1.h, z2.h
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%1 = call <vscale x 8 x i1> @llvm.aarch64.sve.ptrue.nxv8i1(i32 31)			%1 = call <vscale x 8 x i1> @llvm.aarch64.sve.ptrue.nxv8i1(i32 31)
	%2 = call <vscale x 8 x i16> @llvm.aarch64.sve.sabd.nxv8i16(<vscale x 8 x i1> %1, <vscale x 8 x i16> %b, <vscale x 8 x i16> %c)			%2 = call <vscale x 8 x i16> @llvm.aarch64.sve.sabd.nxv8i16(<vscale x 8 x i1> %1, <vscale x 8 x i16> %b, <vscale x 8 x i16> %c)
	%3 = add <vscale x 8 x i16> %2, %a			%3 = add <vscale x 8 x i16> %2, %a
	ret <vscale x 8 x i16> %3			ret <vscale x 8 x i16> %3
	}			}

				define <vscale x 8 x i16> @saba_h_from_sabd_u(<vscale x 8 x i1> %pg, <vscale x 8 x i16> %a, <vscale x 8 x i16> %b, <vscale x 8 x i16> %c) #0 {
				; CHECK-LABEL: saba_h_from_sabd_u:
				; CHECK: // %bb.0:
				; CHECK-NEXT: saba z0.h, z1.h, z2.h
				; CHECK-NEXT: ret
				%1 = call <vscale x 8 x i16> @llvm.aarch64.sve.sabd.u.nxv8i16(<vscale x 8 x i1> %pg, <vscale x 8 x i16> %b, <vscale x 8 x i16> %c)
				%2 = add <vscale x 8 x i16> %1, %a
				ret <vscale x 8 x i16> %2
				}

	define <vscale x 4 x i32> @saba_s(<vscale x 4 x i32> %a, <vscale x 4 x i32> %b, <vscale x 4 x i32> %c) #0 {			define <vscale x 4 x i32> @saba_s(<vscale x 4 x i32> %a, <vscale x 4 x i32> %b, <vscale x 4 x i32> %c) #0 {
	; CHECK-LABEL: saba_s:			; CHECK-LABEL: saba_s:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: saba z0.s, z1.s, z2.s			; CHECK-NEXT: saba z0.s, z1.s, z2.s
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%b.sext = sext <vscale x 4 x i32> %b to <vscale x 4 x i64>			%b.sext = sext <vscale x 4 x i32> %b to <vscale x 4 x i64>
	%c.sext = sext <vscale x 4 x i32> %c to <vscale x 4 x i64>			%c.sext = sext <vscale x 4 x i32> %c to <vscale x 4 x i64>
	%sub = sub <vscale x 4 x i64> %b.sext, %c.sext			%sub = sub <vscale x 4 x i64> %b.sext, %c.sext
	Show All 25 Lines
	; CHECK-NEXT: saba z0.s, z1.s, z2.s			; CHECK-NEXT: saba z0.s, z1.s, z2.s
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%1 = call <vscale x 4 x i1> @llvm.aarch64.sve.ptrue.nxv4i1(i32 31)			%1 = call <vscale x 4 x i1> @llvm.aarch64.sve.ptrue.nxv4i1(i32 31)
	%2 = call <vscale x 4 x i32> @llvm.aarch64.sve.sabd.nxv4i32(<vscale x 4 x i1> %1, <vscale x 4 x i32> %b, <vscale x 4 x i32> %c)			%2 = call <vscale x 4 x i32> @llvm.aarch64.sve.sabd.nxv4i32(<vscale x 4 x i1> %1, <vscale x 4 x i32> %b, <vscale x 4 x i32> %c)
	%3 = add <vscale x 4 x i32> %2, %a			%3 = add <vscale x 4 x i32> %2, %a
	ret <vscale x 4 x i32> %3			ret <vscale x 4 x i32> %3
	}			}

				define <vscale x 4 x i32> @saba_s_from_sabd_u(<vscale x 4 x i1> %pg, <vscale x 4 x i32> %a, <vscale x 4 x i32> %b, <vscale x 4 x i32> %c) #0 {
				; CHECK-LABEL: saba_s_from_sabd_u:
				; CHECK: // %bb.0:
				; CHECK-NEXT: saba z0.s, z1.s, z2.s
				; CHECK-NEXT: ret
				%1 = call <vscale x 4 x i32> @llvm.aarch64.sve.sabd.u.nxv4i32(<vscale x 4 x i1> %pg, <vscale x 4 x i32> %b, <vscale x 4 x i32> %c)
				%2 = add <vscale x 4 x i32> %1, %a
				ret <vscale x 4 x i32> %2
				}

	define <vscale x 2 x i64> @saba_d(<vscale x 2 x i64> %a, <vscale x 2 x i64> %b, <vscale x 2 x i64> %c) #0 {			define <vscale x 2 x i64> @saba_d(<vscale x 2 x i64> %a, <vscale x 2 x i64> %b, <vscale x 2 x i64> %c) #0 {
	; CHECK-LABEL: saba_d:			; CHECK-LABEL: saba_d:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: saba z0.d, z1.d, z2.d			; CHECK-NEXT: saba z0.d, z1.d, z2.d
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%b.sext = sext <vscale x 2 x i64> %b to <vscale x 2 x i128>			%b.sext = sext <vscale x 2 x i64> %b to <vscale x 2 x i128>
	%c.sext = sext <vscale x 2 x i64> %c to <vscale x 2 x i128>			%c.sext = sext <vscale x 2 x i64> %c to <vscale x 2 x i128>
	%sub = sub <vscale x 2 x i128> %b.sext, %c.sext			%sub = sub <vscale x 2 x i128> %b.sext, %c.sext
	Show All 25 Lines
	; CHECK-NEXT: saba z0.d, z1.d, z2.d			; CHECK-NEXT: saba z0.d, z1.d, z2.d
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%1 = call <vscale x 2 x i1> @llvm.aarch64.sve.ptrue.nxv2i1(i32 31)			%1 = call <vscale x 2 x i1> @llvm.aarch64.sve.ptrue.nxv2i1(i32 31)
	%2 = call <vscale x 2 x i64> @llvm.aarch64.sve.sabd.nxv2i64(<vscale x 2 x i1> %1, <vscale x 2 x i64> %b, <vscale x 2 x i64> %c)			%2 = call <vscale x 2 x i64> @llvm.aarch64.sve.sabd.nxv2i64(<vscale x 2 x i1> %1, <vscale x 2 x i64> %b, <vscale x 2 x i64> %c)
	%3 = add <vscale x 2 x i64> %2, %a			%3 = add <vscale x 2 x i64> %2, %a
	ret <vscale x 2 x i64> %3			ret <vscale x 2 x i64> %3
	}			}

				define <vscale x 2 x i64> @saba_d_from_sabd_u(<vscale x 2 x i1> %pg, <vscale x 2 x i64> %a, <vscale x 2 x i64> %b, <vscale x 2 x i64> %c) #0 {
				; CHECK-LABEL: saba_d_from_sabd_u:
				; CHECK: // %bb.0:
				; CHECK-NEXT: saba z0.d, z1.d, z2.d
				; CHECK-NEXT: ret
				%1 = call <vscale x 2 x i64> @llvm.aarch64.sve.sabd.u.nxv2i64(<vscale x 2 x i1> %pg, <vscale x 2 x i64> %b, <vscale x 2 x i64> %c)
				%2 = add <vscale x 2 x i64> %1, %a
				ret <vscale x 2 x i64> %2
				}

	;			;
	; UABA			; UABA
	;			;

	define <vscale x 16 x i8> @uaba_b(<vscale x 16 x i8> %a, <vscale x 16 x i8> %b, <vscale x 16 x i8> %c) #0 {			define <vscale x 16 x i8> @uaba_b(<vscale x 16 x i8> %a, <vscale x 16 x i8> %b, <vscale x 16 x i8> %c) #0 {
	; CHECK-LABEL: uaba_b:			; CHECK-LABEL: uaba_b:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: uaba z0.b, z1.b, z2.b			; CHECK-NEXT: uaba z0.b, z1.b, z2.b
	Show All 28 Lines
	; CHECK-NEXT: uaba z0.b, z1.b, z2.b			; CHECK-NEXT: uaba z0.b, z1.b, z2.b
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%1 = call <vscale x 16 x i1> @llvm.aarch64.sve.ptrue.nxv16i1(i32 31)			%1 = call <vscale x 16 x i1> @llvm.aarch64.sve.ptrue.nxv16i1(i32 31)
	%2 = call <vscale x 16 x i8> @llvm.aarch64.sve.uabd.nxv16i8(<vscale x 16 x i1> %1, <vscale x 16 x i8> %b, <vscale x 16 x i8> %c)			%2 = call <vscale x 16 x i8> @llvm.aarch64.sve.uabd.nxv16i8(<vscale x 16 x i1> %1, <vscale x 16 x i8> %b, <vscale x 16 x i8> %c)
	%3 = add <vscale x 16 x i8> %2, %a			%3 = add <vscale x 16 x i8> %2, %a
	ret <vscale x 16 x i8> %3			ret <vscale x 16 x i8> %3
	}			}

				define <vscale x 16 x i8> @uaba_b_from_uabd_u(<vscale x 16 x i1> %pg, <vscale x 16 x i8> %a, <vscale x 16 x i8> %b, <vscale x 16 x i8> %c) #0 {
				; CHECK-LABEL: uaba_b_from_uabd_u:
				; CHECK: // %bb.0:
				; CHECK-NEXT: uaba z0.b, z1.b, z2.b
				; CHECK-NEXT: ret
				%1 = call <vscale x 16 x i8> @llvm.aarch64.sve.uabd.u.nxv16i8(<vscale x 16 x i1> %pg, <vscale x 16 x i8> %b, <vscale x 16 x i8> %c)
				%2 = add <vscale x 16 x i8> %1, %a
				ret <vscale x 16 x i8> %2
				}

	define <vscale x 8 x i16> @uaba_h(<vscale x 8 x i16> %a, <vscale x 8 x i16> %b, <vscale x 8 x i16> %c) #0 {			define <vscale x 8 x i16> @uaba_h(<vscale x 8 x i16> %a, <vscale x 8 x i16> %b, <vscale x 8 x i16> %c) #0 {
	; CHECK-LABEL: uaba_h:			; CHECK-LABEL: uaba_h:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: uaba z0.h, z1.h, z2.h			; CHECK-NEXT: uaba z0.h, z1.h, z2.h
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%b.zext = zext <vscale x 8 x i16> %b to <vscale x 8 x i32>			%b.zext = zext <vscale x 8 x i16> %b to <vscale x 8 x i32>
	%c.zext = zext <vscale x 8 x i16> %c to <vscale x 8 x i32>			%c.zext = zext <vscale x 8 x i16> %c to <vscale x 8 x i32>
	%sub = sub <vscale x 8 x i32> %b.zext, %c.zext			%sub = sub <vscale x 8 x i32> %b.zext, %c.zext
	Show All 24 Lines
	; CHECK-NEXT: uaba z0.h, z1.h, z2.h			; CHECK-NEXT: uaba z0.h, z1.h, z2.h
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%1 = call <vscale x 8 x i1> @llvm.aarch64.sve.ptrue.nxv8i1(i32 31)			%1 = call <vscale x 8 x i1> @llvm.aarch64.sve.ptrue.nxv8i1(i32 31)
	%2 = call <vscale x 8 x i16> @llvm.aarch64.sve.uabd.nxv8i16(<vscale x 8 x i1> %1, <vscale x 8 x i16> %b, <vscale x 8 x i16> %c)			%2 = call <vscale x 8 x i16> @llvm.aarch64.sve.uabd.nxv8i16(<vscale x 8 x i1> %1, <vscale x 8 x i16> %b, <vscale x 8 x i16> %c)
	%3 = add <vscale x 8 x i16> %2, %a			%3 = add <vscale x 8 x i16> %2, %a
	ret <vscale x 8 x i16> %3			ret <vscale x 8 x i16> %3
	}			}

				define <vscale x 8 x i16> @uaba_h_from_uabd_u(<vscale x 8 x i1> %pg, <vscale x 8 x i16> %a, <vscale x 8 x i16> %b, <vscale x 8 x i16> %c) #0 {
				; CHECK-LABEL: uaba_h_from_uabd_u:
				; CHECK: // %bb.0:
				; CHECK-NEXT: uaba z0.h, z1.h, z2.h
				; CHECK-NEXT: ret
				%1 = call <vscale x 8 x i16> @llvm.aarch64.sve.uabd.u.nxv8i16(<vscale x 8 x i1> %pg, <vscale x 8 x i16> %b, <vscale x 8 x i16> %c)
				%2 = add <vscale x 8 x i16> %1, %a
				ret <vscale x 8 x i16> %2
				}

	define <vscale x 4 x i32> @uaba_s(<vscale x 4 x i32> %a, <vscale x 4 x i32> %b, <vscale x 4 x i32> %c) #0 {			define <vscale x 4 x i32> @uaba_s(<vscale x 4 x i32> %a, <vscale x 4 x i32> %b, <vscale x 4 x i32> %c) #0 {
	; CHECK-LABEL: uaba_s:			; CHECK-LABEL: uaba_s:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: uaba z0.s, z1.s, z2.s			; CHECK-NEXT: uaba z0.s, z1.s, z2.s
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%b.zext = zext <vscale x 4 x i32> %b to <vscale x 4 x i64>			%b.zext = zext <vscale x 4 x i32> %b to <vscale x 4 x i64>
	%c.zext = zext <vscale x 4 x i32> %c to <vscale x 4 x i64>			%c.zext = zext <vscale x 4 x i32> %c to <vscale x 4 x i64>
	%sub = sub <vscale x 4 x i64> %b.zext, %c.zext			%sub = sub <vscale x 4 x i64> %b.zext, %c.zext
	Show All 24 Lines
	; CHECK-NEXT: uaba z0.s, z1.s, z2.s			; CHECK-NEXT: uaba z0.s, z1.s, z2.s
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%1 = call <vscale x 4 x i1> @llvm.aarch64.sve.ptrue.nxv4i1(i32 31)			%1 = call <vscale x 4 x i1> @llvm.aarch64.sve.ptrue.nxv4i1(i32 31)
	%2 = call <vscale x 4 x i32> @llvm.aarch64.sve.uabd.nxv4i32(<vscale x 4 x i1> %1, <vscale x 4 x i32> %b, <vscale x 4 x i32> %c)			%2 = call <vscale x 4 x i32> @llvm.aarch64.sve.uabd.nxv4i32(<vscale x 4 x i1> %1, <vscale x 4 x i32> %b, <vscale x 4 x i32> %c)
	%3 = add <vscale x 4 x i32> %2, %a			%3 = add <vscale x 4 x i32> %2, %a
	ret <vscale x 4 x i32> %3			ret <vscale x 4 x i32> %3
	}			}

				define <vscale x 4 x i32> @uaba_s_from_uabd_u(<vscale x 4 x i1> %pg, <vscale x 4 x i32> %a, <vscale x 4 x i32> %b, <vscale x 4 x i32> %c) #0 {
				; CHECK-LABEL: uaba_s_from_uabd_u:
				; CHECK: // %bb.0:
				; CHECK-NEXT: uaba z0.s, z1.s, z2.s
				; CHECK-NEXT: ret
				%1 = call <vscale x 4 x i32> @llvm.aarch64.sve.uabd.u.nxv4i32(<vscale x 4 x i1> %pg, <vscale x 4 x i32> %b, <vscale x 4 x i32> %c)
				%2 = add <vscale x 4 x i32> %1, %a
				ret <vscale x 4 x i32> %2
				}

	define <vscale x 2 x i64> @uaba_d(<vscale x 2 x i64> %a, <vscale x 2 x i64> %b, <vscale x 2 x i64> %c) #0 {			define <vscale x 2 x i64> @uaba_d(<vscale x 2 x i64> %a, <vscale x 2 x i64> %b, <vscale x 2 x i64> %c) #0 {
	; CHECK-LABEL: uaba_d:			; CHECK-LABEL: uaba_d:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: uaba z0.d, z1.d, z2.d			; CHECK-NEXT: uaba z0.d, z1.d, z2.d
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%b.zext = zext <vscale x 2 x i64> %b to <vscale x 2 x i128>			%b.zext = zext <vscale x 2 x i64> %b to <vscale x 2 x i128>
	%c.zext = zext <vscale x 2 x i64> %c to <vscale x 2 x i128>			%c.zext = zext <vscale x 2 x i64> %c to <vscale x 2 x i128>
	%sub = sub <vscale x 2 x i128> %b.zext, %c.zext			%sub = sub <vscale x 2 x i128> %b.zext, %c.zext
	Show All 24 Lines
	; CHECK-NEXT: uaba z0.d, z1.d, z2.d			; CHECK-NEXT: uaba z0.d, z1.d, z2.d
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%1 = call <vscale x 2 x i1> @llvm.aarch64.sve.ptrue.nxv2i1(i32 31)			%1 = call <vscale x 2 x i1> @llvm.aarch64.sve.ptrue.nxv2i1(i32 31)
	%2 = call <vscale x 2 x i64> @llvm.aarch64.sve.uabd.nxv2i64(<vscale x 2 x i1> %1, <vscale x 2 x i64> %b, <vscale x 2 x i64> %c)			%2 = call <vscale x 2 x i64> @llvm.aarch64.sve.uabd.nxv2i64(<vscale x 2 x i1> %1, <vscale x 2 x i64> %b, <vscale x 2 x i64> %c)
	%3 = add <vscale x 2 x i64> %2, %a			%3 = add <vscale x 2 x i64> %2, %a
	ret <vscale x 2 x i64> %3			ret <vscale x 2 x i64> %3
	}			}

				define <vscale x 2 x i64> @uaba_d_from_uabd_u(<vscale x 2 x i1> %pg, <vscale x 2 x i64> %a, <vscale x 2 x i64> %b, <vscale x 2 x i64> %c) #0 {
				; CHECK-LABEL: uaba_d_from_uabd_u:
				; CHECK: // %bb.0:
				; CHECK-NEXT: uaba z0.d, z1.d, z2.d
				; CHECK-NEXT: ret
				%1 = call <vscale x 2 x i64> @llvm.aarch64.sve.uabd.u.nxv2i64(<vscale x 2 x i1> %pg, <vscale x 2 x i64> %b, <vscale x 2 x i64> %c)
				%2 = add <vscale x 2 x i64> %1, %a
				ret <vscale x 2 x i64> %2
				}

	; A variant of uaba_s but with the add operands switched.			; A variant of uaba_s but with the add operands switched.
	define <vscale x 4 x i32> @uaba_s_commutative(<vscale x 4 x i32> %a, <vscale x 4 x i32> %b, <vscale x 4 x i32> %c) #0 {			define <vscale x 4 x i32> @uaba_s_commutative(<vscale x 4 x i32> %a, <vscale x 4 x i32> %b, <vscale x 4 x i32> %c) #0 {
	; CHECK-LABEL: uaba_s_commutative:			; CHECK-LABEL: uaba_s_commutative:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: uaba z0.s, z1.s, z2.s			; CHECK-NEXT: uaba z0.s, z1.s, z2.s
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%b.zext = zext <vscale x 4 x i32> %b to <vscale x 4 x i64>			%b.zext = zext <vscale x 4 x i32> %b to <vscale x 4 x i64>
	%c.zext = zext <vscale x 4 x i32> %c to <vscale x 4 x i64>			%c.zext = zext <vscale x 4 x i32> %c to <vscale x 4 x i64>
	Show All 18 Lines
	declare <vscale x 8 x i1> @llvm.aarch64.sve.ptrue.nxv8i1(i32)			declare <vscale x 8 x i1> @llvm.aarch64.sve.ptrue.nxv8i1(i32)
	declare <vscale x 16 x i1> @llvm.aarch64.sve.ptrue.nxv16i1(i32)			declare <vscale x 16 x i1> @llvm.aarch64.sve.ptrue.nxv16i1(i32)

	declare <vscale x 16 x i8> @llvm.aarch64.sve.sabd.nxv16i8(<vscale x 16 x i1>, <vscale x 16 x i8>, <vscale x 16 x i8>)			declare <vscale x 16 x i8> @llvm.aarch64.sve.sabd.nxv16i8(<vscale x 16 x i1>, <vscale x 16 x i8>, <vscale x 16 x i8>)
	declare <vscale x 8 x i16> @llvm.aarch64.sve.sabd.nxv8i16(<vscale x 8 x i1>, <vscale x 8 x i16>, <vscale x 8 x i16>)			declare <vscale x 8 x i16> @llvm.aarch64.sve.sabd.nxv8i16(<vscale x 8 x i1>, <vscale x 8 x i16>, <vscale x 8 x i16>)
	declare <vscale x 4 x i32> @llvm.aarch64.sve.sabd.nxv4i32(<vscale x 4 x i1>, <vscale x 4 x i32>, <vscale x 4 x i32>)			declare <vscale x 4 x i32> @llvm.aarch64.sve.sabd.nxv4i32(<vscale x 4 x i1>, <vscale x 4 x i32>, <vscale x 4 x i32>)
	declare <vscale x 2 x i64> @llvm.aarch64.sve.sabd.nxv2i64(<vscale x 2 x i1>, <vscale x 2 x i64>, <vscale x 2 x i64>)			declare <vscale x 2 x i64> @llvm.aarch64.sve.sabd.nxv2i64(<vscale x 2 x i1>, <vscale x 2 x i64>, <vscale x 2 x i64>)

				declare <vscale x 16 x i8> @llvm.aarch64.sve.sabd.u.nxv16i8(<vscale x 16 x i1>, <vscale x 16 x i8>, <vscale x 16 x i8>)
				declare <vscale x 8 x i16> @llvm.aarch64.sve.sabd.u.nxv8i16(<vscale x 8 x i1>, <vscale x 8 x i16>, <vscale x 8 x i16>)
				declare <vscale x 4 x i32> @llvm.aarch64.sve.sabd.u.nxv4i32(<vscale x 4 x i1>, <vscale x 4 x i32>, <vscale x 4 x i32>)
				declare <vscale x 2 x i64> @llvm.aarch64.sve.sabd.u.nxv2i64(<vscale x 2 x i1>, <vscale x 2 x i64>, <vscale x 2 x i64>)

	declare <vscale x 16 x i8> @llvm.aarch64.sve.uabd.nxv16i8(<vscale x 16 x i1>, <vscale x 16 x i8>, <vscale x 16 x i8>)			declare <vscale x 16 x i8> @llvm.aarch64.sve.uabd.nxv16i8(<vscale x 16 x i1>, <vscale x 16 x i8>, <vscale x 16 x i8>)
	declare <vscale x 8 x i16> @llvm.aarch64.sve.uabd.nxv8i16(<vscale x 8 x i1>, <vscale x 8 x i16>, <vscale x 8 x i16>)			declare <vscale x 8 x i16> @llvm.aarch64.sve.uabd.nxv8i16(<vscale x 8 x i1>, <vscale x 8 x i16>, <vscale x 8 x i16>)
	declare <vscale x 4 x i32> @llvm.aarch64.sve.uabd.nxv4i32(<vscale x 4 x i1>, <vscale x 4 x i32>, <vscale x 4 x i32>)			declare <vscale x 4 x i32> @llvm.aarch64.sve.uabd.nxv4i32(<vscale x 4 x i1>, <vscale x 4 x i32>, <vscale x 4 x i32>)
	declare <vscale x 2 x i64> @llvm.aarch64.sve.uabd.nxv2i64(<vscale x 2 x i1>, <vscale x 2 x i64>, <vscale x 2 x i64>)			declare <vscale x 2 x i64> @llvm.aarch64.sve.uabd.nxv2i64(<vscale x 2 x i1>, <vscale x 2 x i64>, <vscale x 2 x i64>)

				declare <vscale x 16 x i8> @llvm.aarch64.sve.uabd.u.nxv16i8(<vscale x 16 x i1>, <vscale x 16 x i8>, <vscale x 16 x i8>)
				declare <vscale x 8 x i16> @llvm.aarch64.sve.uabd.u.nxv8i16(<vscale x 8 x i1>, <vscale x 8 x i16>, <vscale x 8 x i16>)
				declare <vscale x 4 x i32> @llvm.aarch64.sve.uabd.u.nxv4i32(<vscale x 4 x i1>, <vscale x 4 x i32>, <vscale x 4 x i32>)
				declare <vscale x 2 x i64> @llvm.aarch64.sve.uabd.u.nxv2i64(<vscale x 2 x i1>, <vscale x 2 x i64>, <vscale x 2 x i64>)

	attributes #0 = { "target-features"="+neon,+sve,+sve2" }			attributes #0 = { "target-features"="+neon,+sve,+sve2" }

llvm/test/CodeGen/AArch64/sve-intrinsics-int-arith-undef.ll

This file was added.

				; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
				; RUN: llc -mattr=+sve < %s \| FileCheck %s
				; RUN: llc -mattr=+sve2 < %s \| FileCheck %s

				target triple = "aarch64-unknown-linux-gnu"

				;
				; ADD
				;

				define <vscale x 16 x i8> @add_i8(<vscale x 16 x i1> %pg, <vscale x 16 x i8> %a, <vscale x 16 x i8> %b) {
				; CHECK-LABEL: add_i8:
				; CHECK: // %bb.0:
				; CHECK-NEXT: add z0.b, z0.b, z1.b
				; CHECK-NEXT: ret
				%out = call <vscale x 16 x i8> @llvm.aarch64.sve.add.u.nxv16i8(<vscale x 16 x i1> %pg,
				<vscale x 16 x i8> %a,
				<vscale x 16 x i8> %b)
				ret <vscale x 16 x i8> %out
				}

				define <vscale x 8 x i16> @add_i16(<vscale x 8 x i1> %pg, <vscale x 8 x i16> %a, <vscale x 8 x i16> %b) {
				; CHECK-LABEL: add_i16:
				; CHECK: // %bb.0:
				; CHECK-NEXT: add z0.h, z0.h, z1.h
				; CHECK-NEXT: ret
				%out = call <vscale x 8 x i16> @llvm.aarch64.sve.add.u.nxv8i16(<vscale x 8 x i1> %pg,
				<vscale x 8 x i16> %a,
				<vscale x 8 x i16> %b)
				ret <vscale x 8 x i16> %out
				}

				define <vscale x 4 x i32> @add_i32(<vscale x 4 x i1> %pg, <vscale x 4 x i32> %a, <vscale x 4 x i32> %b) {
				; CHECK-LABEL: add_i32:
				; CHECK: // %bb.0:
				; CHECK-NEXT: add z0.s, z0.s, z1.s
				; CHECK-NEXT: ret
				%out = call <vscale x 4 x i32> @llvm.aarch64.sve.add.u.nxv4i32(<vscale x 4 x i1> %pg,
				<vscale x 4 x i32> %a,
				<vscale x 4 x i32> %b)
				ret <vscale x 4 x i32> %out
				}

				define <vscale x 2 x i64> @add_i64(<vscale x 2 x i1> %pg, <vscale x 2 x i64> %a, <vscale x 2 x i64> %b) {
				; CHECK-LABEL: add_i64:
				; CHECK: // %bb.0:
				; CHECK-NEXT: add z0.d, z0.d, z1.d
				; CHECK-NEXT: ret
				%out = call <vscale x 2 x i64> @llvm.aarch64.sve.add.u.nxv2i64(<vscale x 2 x i1> %pg,
				<vscale x 2 x i64> %a,
				<vscale x 2 x i64> %b)
				ret <vscale x 2 x i64> %out
				}

				;
				; ADD (immediate)
				;

				define <vscale x 16 x i8> @add_imm_i8(<vscale x 16 x i1> %pg, <vscale x 16 x i8> %a) {
				; CHECK-LABEL: add_imm_i8:
				; CHECK: // %bb.0:
				; CHECK-NEXT: add z0.b, z0.b, #3 // =0x3
				; CHECK-NEXT: ret
				%imm = insertelement <vscale x 16 x i8> undef, i8 3, i32 0
				%imm.splat = shufflevector <vscale x 16 x i8> %imm, <vscale x 16 x i8> undef, <vscale x 16 x i32> zeroinitializer
				%out = call <vscale x 16 x i8> @llvm.aarch64.sve.add.u.nxv16i8(<vscale x 16 x i1> %pg,
				<vscale x 16 x i8> %a,
				<vscale x 16 x i8> %imm.splat)
				ret <vscale x 16 x i8> %out
				}

				define <vscale x 8 x i16> @add_imm_i16(<vscale x 8 x i1> %pg, <vscale x 8 x i16> %a) {
				; CHECK-LABEL: add_imm_i16:
				; CHECK: // %bb.0:
				; CHECK-NEXT: add z0.h, z0.h, #4 // =0x4
				; CHECK-NEXT: ret
				%imm = insertelement <vscale x 8 x i16> undef, i16 4, i32 0
				%imm.splat = shufflevector <vscale x 8 x i16> %imm, <vscale x 8 x i16> undef, <vscale x 8 x i32> zeroinitializer
				%out = call <vscale x 8 x i16> @llvm.aarch64.sve.add.u.nxv8i16(<vscale x 8 x i1> %pg,
				<vscale x 8 x i16> %a,
				<vscale x 8 x i16> %imm.splat)
				ret <vscale x 8 x i16> %out
				}

				define <vscale x 4 x i32> @add_imm_i32(<vscale x 4 x i1> %pg, <vscale x 4 x i32> %a) {
				; CHECK-LABEL: add_imm_i32:
				; CHECK: // %bb.0:
				; CHECK-NEXT: add z0.s, z0.s, #5 // =0x5
				; CHECK-NEXT: ret
				%imm = insertelement <vscale x 4 x i32> undef, i32 5, i32 0
				%imm.splat = shufflevector <vscale x 4 x i32> %imm, <vscale x 4 x i32> undef, <vscale x 4 x i32> zeroinitializer
				%out = call <vscale x 4 x i32> @llvm.aarch64.sve.add.u.nxv4i32(<vscale x 4 x i1> %pg,
				<vscale x 4 x i32> %a,
				<vscale x 4 x i32> %imm.splat)
				ret <vscale x 4 x i32> %out
				}

				define <vscale x 2 x i64> @add_imm_i64(<vscale x 2 x i1> %pg, <vscale x 2 x i64> %a) {
				; CHECK-LABEL: add_imm_i64:
				; CHECK: // %bb.0:
				; CHECK-NEXT: add z0.d, z0.d, #6 // =0x6
				; CHECK-NEXT: ret
				%imm = insertelement <vscale x 2 x i64> undef, i64 6, i32 0
				%imm.splat = shufflevector <vscale x 2 x i64> %imm, <vscale x 2 x i64> undef, <vscale x 2 x i32> zeroinitializer
				%out = call <vscale x 2 x i64> @llvm.aarch64.sve.add.u.nxv2i64(<vscale x 2 x i1> %pg,
				<vscale x 2 x i64> %a,
				<vscale x 2 x i64> %imm.splat)
				ret <vscale x 2 x i64> %out
				}

				;
				; MUL
				;

				define <vscale x 16 x i8> @mul_i8(<vscale x 16 x i1> %pg, <vscale x 16 x i8> %a, <vscale x 16 x i8> %b) {
				; CHECK-LABEL: mul_i8:
				; CHECK: // %bb.0:
				; CHECK-NEXT: mul z0.b, p0/m, z0.b, z1.b
				; CHECK-NEXT: ret
				%out = call <vscale x 16 x i8> @llvm.aarch64.sve.mul.u.nxv16i8(<vscale x 16 x i1> %pg,
				<vscale x 16 x i8> %a,
				<vscale x 16 x i8> %b)
				ret <vscale x 16 x i8> %out
				}

				define <vscale x 8 x i16> @mul_i16(<vscale x 8 x i1> %pg, <vscale x 8 x i16> %a, <vscale x 8 x i16> %b) {
				; CHECK-LABEL: mul_i16:
				; CHECK: // %bb.0:
				; CHECK-NEXT: mul z0.h, p0/m, z0.h, z1.h
				; CHECK-NEXT: ret
				%out = call <vscale x 8 x i16> @llvm.aarch64.sve.mul.u.nxv8i16(<vscale x 8 x i1> %pg,
				<vscale x 8 x i16> %a,
				<vscale x 8 x i16> %b)
				ret <vscale x 8 x i16> %out
				}

				define <vscale x 4 x i32> @mul_i32(<vscale x 4 x i1> %pg, <vscale x 4 x i32> %a, <vscale x 4 x i32> %b) {
				; CHECK-LABEL: mul_i32:
				; CHECK: // %bb.0:
				; CHECK-NEXT: mul z0.s, p0/m, z0.s, z1.s
				; CHECK-NEXT: ret
				%out = call <vscale x 4 x i32> @llvm.aarch64.sve.mul.u.nxv4i32(<vscale x 4 x i1> %pg,
				<vscale x 4 x i32> %a,
				<vscale x 4 x i32> %b)
				ret <vscale x 4 x i32> %out
				}

				define <vscale x 2 x i64> @mul_i64(<vscale x 2 x i1> %pg, <vscale x 2 x i64> %a, <vscale x 2 x i64> %b) {
				; CHECK-LABEL: mul_i64:
				; CHECK: // %bb.0:
				; CHECK-NEXT: mul z0.d, p0/m, z0.d, z1.d
				; CHECK-NEXT: ret
				%out = call <vscale x 2 x i64> @llvm.aarch64.sve.mul.u.nxv2i64(<vscale x 2 x i1> %pg,
				<vscale x 2 x i64> %a,
				<vscale x 2 x i64> %b)
				ret <vscale x 2 x i64> %out
				}

				;
				; MUL (immediate)
				;

				define <vscale x 16 x i8> @mul_imm_i8(<vscale x 16 x i1> %pg, <vscale x 16 x i8> %a) {
				; CHECK-LABEL: mul_imm_i8:
				; CHECK: // %bb.0:
				; CHECK-NEXT: mov z1.b, #3 // =0x3
				; CHECK-NEXT: mul z0.b, p0/m, z0.b, z1.b
				; CHECK-NEXT: ret
				%imm = insertelement <vscale x 16 x i8> undef, i8 3, i32 0
				%imm.splat = shufflevector <vscale x 16 x i8> %imm, <vscale x 16 x i8> undef, <vscale x 16 x i32> zeroinitializer
				%out = call <vscale x 16 x i8> @llvm.aarch64.sve.mul.u.nxv16i8(<vscale x 16 x i1> %pg,
				<vscale x 16 x i8> %a,
				<vscale x 16 x i8> %imm.splat)
				ret <vscale x 16 x i8> %out
				}

				define <vscale x 8 x i16> @mul_imm_i16(<vscale x 8 x i1> %pg, <vscale x 8 x i16> %a) {
				; CHECK-LABEL: mul_imm_i16:
				; CHECK: // %bb.0:
				; CHECK-NEXT: mov z1.h, #4 // =0x4
				; CHECK-NEXT: mul z0.h, p0/m, z0.h, z1.h
				; CHECK-NEXT: ret
				%imm = insertelement <vscale x 8 x i16> undef, i16 4, i32 0
				%imm.splat = shufflevector <vscale x 8 x i16> %imm, <vscale x 8 x i16> undef, <vscale x 8 x i32> zeroinitializer
				%out = call <vscale x 8 x i16> @llvm.aarch64.sve.mul.u.nxv8i16(<vscale x 8 x i1> %pg,
				<vscale x 8 x i16> %a,
				<vscale x 8 x i16> %imm.splat)
				ret <vscale x 8 x i16> %out
				}

				define <vscale x 4 x i32> @mul_imm_i32(<vscale x 4 x i1> %pg, <vscale x 4 x i32> %a) {
				; CHECK-LABEL: mul_imm_i32:
				; CHECK: // %bb.0:
				; CHECK-NEXT: mov z1.s, #5 // =0x5
				; CHECK-NEXT: mul z0.s, p0/m, z0.s, z1.s
				; CHECK-NEXT: ret
				%imm = insertelement <vscale x 4 x i32> undef, i32 5, i32 0
				%imm.splat = shufflevector <vscale x 4 x i32> %imm, <vscale x 4 x i32> undef, <vscale x 4 x i32> zeroinitializer
				%out = call <vscale x 4 x i32> @llvm.aarch64.sve.mul.u.nxv4i32(<vscale x 4 x i1> %pg,
				<vscale x 4 x i32> %a,
				<vscale x 4 x i32> %imm.splat)
				ret <vscale x 4 x i32> %out
				}

				define <vscale x 2 x i64> @mul_imm_i64(<vscale x 2 x i1> %pg, <vscale x 2 x i64> %a) {
				; CHECK-LABEL: mul_imm_i64:
				; CHECK: // %bb.0:
				; CHECK-NEXT: mov z1.d, #6 // =0x6
				; CHECK-NEXT: mul z0.d, p0/m, z0.d, z1.d
				; CHECK-NEXT: ret
				%imm = insertelement <vscale x 2 x i64> undef, i64 6, i32 0
				%imm.splat = shufflevector <vscale x 2 x i64> %imm, <vscale x 2 x i64> undef, <vscale x 2 x i32> zeroinitializer
				%out = call <vscale x 2 x i64> @llvm.aarch64.sve.mul.u.nxv2i64(<vscale x 2 x i1> %pg,
				<vscale x 2 x i64> %a,
				<vscale x 2 x i64> %imm.splat)
				ret <vscale x 2 x i64> %out
				}

				;
				; SABD
				;

				define <vscale x 16 x i8> @sabd_i8(<vscale x 16 x i1> %pg, <vscale x 16 x i8> %a, <vscale x 16 x i8> %b) {
				; CHECK-LABEL: sabd_i8:
				; CHECK: // %bb.0:
				; CHECK-NEXT: ptrue p0.b
				; CHECK-NEXT: sabd z0.b, p0/m, z0.b, z1.b
				; CHECK-NEXT: ret
				%out = call <vscale x 16 x i8> @llvm.aarch64.sve.sabd.u.nxv16i8(<vscale x 16 x i1> %pg,
				<vscale x 16 x i8> %a,
				<vscale x 16 x i8> %b)
				ret <vscale x 16 x i8> %out
				}

				define <vscale x 8 x i16> @sabd_i16(<vscale x 8 x i1> %pg, <vscale x 8 x i16> %a, <vscale x 8 x i16> %b) {
				; CHECK-LABEL: sabd_i16:
				; CHECK: // %bb.0:
				; CHECK-NEXT: ptrue p0.h
				; CHECK-NEXT: sabd z0.h, p0/m, z0.h, z1.h
				; CHECK-NEXT: ret
				%out = call <vscale x 8 x i16> @llvm.aarch64.sve.sabd.u.nxv8i16(<vscale x 8 x i1> %pg,
				<vscale x 8 x i16> %a,
				<vscale x 8 x i16> %b)
				ret <vscale x 8 x i16> %out
				}

				define <vscale x 4 x i32> @sabd_i32(<vscale x 4 x i1> %pg, <vscale x 4 x i32> %a, <vscale x 4 x i32> %b) {
				; CHECK-LABEL: sabd_i32:
				; CHECK: // %bb.0:
				; CHECK-NEXT: ptrue p0.s
				; CHECK-NEXT: sabd z0.s, p0/m, z0.s, z1.s
				; CHECK-NEXT: ret
				%out = call <vscale x 4 x i32> @llvm.aarch64.sve.sabd.u.nxv4i32(<vscale x 4 x i1> %pg,
				<vscale x 4 x i32> %a,
				<vscale x 4 x i32> %b)
				ret <vscale x 4 x i32> %out
				}

				define <vscale x 2 x i64> @sabd_i64(<vscale x 2 x i1> %pg, <vscale x 2 x i64> %a, <vscale x 2 x i64> %b) {
				; CHECK-LABEL: sabd_i64:
				; CHECK: // %bb.0:
				; CHECK-NEXT: ptrue p0.d
				; CHECK-NEXT: sabd z0.d, p0/m, z0.d, z1.d
				; CHECK-NEXT: ret
				%out = call <vscale x 2 x i64> @llvm.aarch64.sve.sabd.u.nxv2i64(<vscale x 2 x i1> %pg,
				<vscale x 2 x i64> %a,
				<vscale x 2 x i64> %b)
				ret <vscale x 2 x i64> %out
				}

				;
				; SDIV
				;

				define <vscale x 4 x i32> @sdiv_i32(<vscale x 4 x i1> %pg, <vscale x 4 x i32> %a, <vscale x 4 x i32> %b) {
				; CHECK-LABEL: sdiv_i32:
				; CHECK: // %bb.0:
				; CHECK-NEXT: sdiv z0.s, p0/m, z0.s, z1.s
				; CHECK-NEXT: ret
				%out = call <vscale x 4 x i32> @llvm.aarch64.sve.sdiv.u.nxv4i32(<vscale x 4 x i1> %pg,
				<vscale x 4 x i32> %a,
				<vscale x 4 x i32> %b)
				ret <vscale x 4 x i32> %out
				}

				define <vscale x 2 x i64> @sdiv_i64(<vscale x 2 x i1> %pg, <vscale x 2 x i64> %a, <vscale x 2 x i64> %b) {
				; CHECK-LABEL: sdiv_i64:
				; CHECK: // %bb.0:
				; CHECK-NEXT: sdiv z0.d, p0/m, z0.d, z1.d
				; CHECK-NEXT: ret
				%out = call <vscale x 2 x i64> @llvm.aarch64.sve.sdiv.u.nxv2i64(<vscale x 2 x i1> %pg,
				<vscale x 2 x i64> %a,
				<vscale x 2 x i64> %b)
				ret <vscale x 2 x i64> %out
				}

				;
				; SDIVR
				;

				define <vscale x 4 x i32> @sdivr_i32(<vscale x 4 x i1> %pg, <vscale x 4 x i32> %a, <vscale x 4 x i32> %b) {
				; CHECK-LABEL: sdivr_i32:
				; CHECK: // %bb.0:
				; CHECK-NEXT: sdivr z0.s, p0/m, z0.s, z1.s
				; CHECK-NEXT: ret
				%out = call <vscale x 4 x i32> @llvm.aarch64.sve.sdiv.u.nxv4i32(<vscale x 4 x i1> %pg,
				<vscale x 4 x i32> %b,
				<vscale x 4 x i32> %a)
				ret <vscale x 4 x i32> %out
				}

				define <vscale x 2 x i64> @sdivr_i64(<vscale x 2 x i1> %pg, <vscale x 2 x i64> %a, <vscale x 2 x i64> %b) {
				; CHECK-LABEL: sdivr_i64:
				; CHECK: // %bb.0:
				; CHECK-NEXT: sdivr z0.d, p0/m, z0.d, z1.d
				; CHECK-NEXT: ret
				%out = call <vscale x 2 x i64> @llvm.aarch64.sve.sdiv.u.nxv2i64(<vscale x 2 x i1> %pg,
				<vscale x 2 x i64> %b,
				<vscale x 2 x i64> %a)
				ret <vscale x 2 x i64> %out
				}

				;
				; SMAX
				;

				define <vscale x 16 x i8> @smax_i8(<vscale x 16 x i1> %pg, <vscale x 16 x i8> %a, <vscale x 16 x i8> %b) {
				; CHECK-LABEL: smax_i8:
				; CHECK: // %bb.0:
				; CHECK-NEXT: smax z0.b, p0/m, z0.b, z1.b
				; CHECK-NEXT: ret
				%out = call <vscale x 16 x i8> @llvm.aarch64.sve.smax.u.nxv16i8(<vscale x 16 x i1> %pg,
				<vscale x 16 x i8> %a,
				<vscale x 16 x i8> %b)
				ret <vscale x 16 x i8> %out
				}

				define <vscale x 8 x i16> @smax_i16(<vscale x 8 x i1> %pg, <vscale x 8 x i16> %a, <vscale x 8 x i16> %b) {
				; CHECK-LABEL: smax_i16:
				; CHECK: // %bb.0:
				; CHECK-NEXT: smax z0.h, p0/m, z0.h, z1.h
				; CHECK-NEXT: ret
				%out = call <vscale x 8 x i16> @llvm.aarch64.sve.smax.u.nxv8i16(<vscale x 8 x i1> %pg,
				<vscale x 8 x i16> %a,
				<vscale x 8 x i16> %b)
				ret <vscale x 8 x i16> %out
				}

				define <vscale x 4 x i32> @smax_i32(<vscale x 4 x i1> %pg, <vscale x 4 x i32> %a, <vscale x 4 x i32> %b) {
				; CHECK-LABEL: smax_i32:
				; CHECK: // %bb.0:
				; CHECK-NEXT: smax z0.s, p0/m, z0.s, z1.s
				; CHECK-NEXT: ret
				%out = call <vscale x 4 x i32> @llvm.aarch64.sve.smax.u.nxv4i32(<vscale x 4 x i1> %pg,
				<vscale x 4 x i32> %a,
				<vscale x 4 x i32> %b)
				ret <vscale x 4 x i32> %out
				}

				define <vscale x 2 x i64> @smax_i64(<vscale x 2 x i1> %pg, <vscale x 2 x i64> %a, <vscale x 2 x i64> %b) {
				; CHECK-LABEL: smax_i64:
				; CHECK: // %bb.0:
				; CHECK-NEXT: smax z0.d, p0/m, z0.d, z1.d
				; CHECK-NEXT: ret
				%out = call <vscale x 2 x i64> @llvm.aarch64.sve.smax.u.nxv2i64(<vscale x 2 x i1> %pg,
				<vscale x 2 x i64> %a,
				<vscale x 2 x i64> %b)
				ret <vscale x 2 x i64> %out
				}

				;
				; SMAX (immediate)
				;

				define <vscale x 16 x i8> @smax_imm_i8(<vscale x 16 x i1> %pg, <vscale x 16 x i8> %a) {
				; CHECK-LABEL: smax_imm_i8:
				; CHECK: // %bb.0:
				; CHECK-NEXT: mov z1.b, #3 // =0x3
				; CHECK-NEXT: smax z0.b, p0/m, z0.b, z1.b
				; CHECK-NEXT: ret
				%imm = insertelement <vscale x 16 x i8> undef, i8 3, i32 0
				%imm.splat = shufflevector <vscale x 16 x i8> %imm, <vscale x 16 x i8> undef, <vscale x 16 x i32> zeroinitializer
				%out = call <vscale x 16 x i8> @llvm.aarch64.sve.smax.u.nxv16i8(<vscale x 16 x i1> %pg,
				<vscale x 16 x i8> %a,
				<vscale x 16 x i8> %imm.splat)
				ret <vscale x 16 x i8> %out
				}

				define <vscale x 8 x i16> @smax_imm_i16(<vscale x 8 x i1> %pg, <vscale x 8 x i16> %a) {
				; CHECK-LABEL: smax_imm_i16:
				; CHECK: // %bb.0:
				; CHECK-NEXT: mov z1.h, #4 // =0x4
				; CHECK-NEXT: smax z0.h, p0/m, z0.h, z1.h
				; CHECK-NEXT: ret
				%imm = insertelement <vscale x 8 x i16> undef, i16 4, i32 0
				%imm.splat = shufflevector <vscale x 8 x i16> %imm, <vscale x 8 x i16> undef, <vscale x 8 x i32> zeroinitializer
				%out = call <vscale x 8 x i16> @llvm.aarch64.sve.smax.u.nxv8i16(<vscale x 8 x i1> %pg,
				<vscale x 8 x i16> %a,
				<vscale x 8 x i16> %imm.splat)
				ret <vscale x 8 x i16> %out
				}

				define <vscale x 4 x i32> @smax_imm_i32(<vscale x 4 x i1> %pg, <vscale x 4 x i32> %a) {
				; CHECK-LABEL: smax_imm_i32:
				; CHECK: // %bb.0:
				; CHECK-NEXT: mov z1.s, #5 // =0x5
				; CHECK-NEXT: smax z0.s, p0/m, z0.s, z1.s
				; CHECK-NEXT: ret
				%imm = insertelement <vscale x 4 x i32> undef, i32 5, i32 0
				%imm.splat = shufflevector <vscale x 4 x i32> %imm, <vscale x 4 x i32> undef, <vscale x 4 x i32> zeroinitializer
				%out = call <vscale x 4 x i32> @llvm.aarch64.sve.smax.u.nxv4i32(<vscale x 4 x i1> %pg,
				<vscale x 4 x i32> %a,
				<vscale x 4 x i32> %imm.splat)
				ret <vscale x 4 x i32> %out
				}

				define <vscale x 2 x i64> @smax_imm_i64(<vscale x 2 x i1> %pg, <vscale x 2 x i64> %a) {
				; CHECK-LABEL: smax_imm_i64:
				; CHECK: // %bb.0:
				; CHECK-NEXT: mov z1.d, #6 // =0x6
				; CHECK-NEXT: smax z0.d, p0/m, z0.d, z1.d
				; CHECK-NEXT: ret
				%imm = insertelement <vscale x 2 x i64> undef, i64 6, i32 0
				%imm.splat = shufflevector <vscale x 2 x i64> %imm, <vscale x 2 x i64> undef, <vscale x 2 x i32> zeroinitializer
				%out = call <vscale x 2 x i64> @llvm.aarch64.sve.smax.u.nxv2i64(<vscale x 2 x i1> %pg,
				<vscale x 2 x i64> %a,
				<vscale x 2 x i64> %imm.splat)
				ret <vscale x 2 x i64> %out
				}

				;
				; SMIN
				;

				define <vscale x 16 x i8> @smin_i8(<vscale x 16 x i1> %pg, <vscale x 16 x i8> %a, <vscale x 16 x i8> %b) {
				; CHECK-LABEL: smin_i8:
				; CHECK: // %bb.0:
				; CHECK-NEXT: smin z0.b, p0/m, z0.b, z1.b
				; CHECK-NEXT: ret
				%out = call <vscale x 16 x i8> @llvm.aarch64.sve.smin.u.nxv16i8(<vscale x 16 x i1> %pg,
				<vscale x 16 x i8> %a,
				<vscale x 16 x i8> %b)
				ret <vscale x 16 x i8> %out
				}

				define <vscale x 8 x i16> @smin_i16(<vscale x 8 x i1> %pg, <vscale x 8 x i16> %a, <vscale x 8 x i16> %b) {
				; CHECK-LABEL: smin_i16:
				; CHECK: // %bb.0:
				; CHECK-NEXT: smin z0.h, p0/m, z0.h, z1.h
				; CHECK-NEXT: ret
				%out = call <vscale x 8 x i16> @llvm.aarch64.sve.smin.u.nxv8i16(<vscale x 8 x i1> %pg,
				<vscale x 8 x i16> %a,
				<vscale x 8 x i16> %b)
				ret <vscale x 8 x i16> %out
				}

				define <vscale x 4 x i32> @smin_i32(<vscale x 4 x i1> %pg, <vscale x 4 x i32> %a, <vscale x 4 x i32> %b) {
				; CHECK-LABEL: smin_i32:
				; CHECK: // %bb.0:
				; CHECK-NEXT: smin z0.s, p0/m, z0.s, z1.s
				; CHECK-NEXT: ret
				%out = call <vscale x 4 x i32> @llvm.aarch64.sve.smin.u.nxv4i32(<vscale x 4 x i1> %pg,
				<vscale x 4 x i32> %a,
				<vscale x 4 x i32> %b)
				ret <vscale x 4 x i32> %out
				}

				define <vscale x 2 x i64> @smin_i64(<vscale x 2 x i1> %pg, <vscale x 2 x i64> %a, <vscale x 2 x i64> %b) {
				; CHECK-LABEL: smin_i64:
				; CHECK: // %bb.0:
				; CHECK-NEXT: smin z0.d, p0/m, z0.d, z1.d
				; CHECK-NEXT: ret
				%out = call <vscale x 2 x i64> @llvm.aarch64.sve.smin.u.nxv2i64(<vscale x 2 x i1> %pg,
				<vscale x 2 x i64> %a,
				<vscale x 2 x i64> %b)
				ret <vscale x 2 x i64> %out
				}

				;
				; SMIN (immediate)
				;

				define <vscale x 16 x i8> @smin_imm_i8(<vscale x 16 x i1> %pg, <vscale x 16 x i8> %a) {
				; CHECK-LABEL: smin_imm_i8:
				; CHECK: // %bb.0:
				; CHECK-NEXT: mov z1.b, #3 // =0x3
				; CHECK-NEXT: smin z0.b, p0/m, z0.b, z1.b
				; CHECK-NEXT: ret
				%imm = insertelement <vscale x 16 x i8> undef, i8 3, i32 0
				%imm.splat = shufflevector <vscale x 16 x i8> %imm, <vscale x 16 x i8> undef, <vscale x 16 x i32> zeroinitializer
				%out = call <vscale x 16 x i8> @llvm.aarch64.sve.smin.u.nxv16i8(<vscale x 16 x i1> %pg,
				<vscale x 16 x i8> %a,
				<vscale x 16 x i8> %imm.splat)
				ret <vscale x 16 x i8> %out
				}

				define <vscale x 8 x i16> @smin_imm_i16(<vscale x 8 x i1> %pg, <vscale x 8 x i16> %a) {
				; CHECK-LABEL: smin_imm_i16:
				; CHECK: // %bb.0:
				; CHECK-NEXT: mov z1.h, #4 // =0x4
				; CHECK-NEXT: smin z0.h, p0/m, z0.h, z1.h
				; CHECK-NEXT: ret
				%imm = insertelement <vscale x 8 x i16> undef, i16 4, i32 0
				%imm.splat = shufflevector <vscale x 8 x i16> %imm, <vscale x 8 x i16> undef, <vscale x 8 x i32> zeroinitializer
				%out = call <vscale x 8 x i16> @llvm.aarch64.sve.smin.u.nxv8i16(<vscale x 8 x i1> %pg,
				<vscale x 8 x i16> %a,
				<vscale x 8 x i16> %imm.splat)
				ret <vscale x 8 x i16> %out
				}

				define <vscale x 4 x i32> @smin_imm_i32(<vscale x 4 x i1> %pg, <vscale x 4 x i32> %a) {
				; CHECK-LABEL: smin_imm_i32:
				; CHECK: // %bb.0:
				; CHECK-NEXT: mov z1.s, #5 // =0x5
				; CHECK-NEXT: smin z0.s, p0/m, z0.s, z1.s
				; CHECK-NEXT: ret
				%imm = insertelement <vscale x 4 x i32> undef, i32 5, i32 0
				%imm.splat = shufflevector <vscale x 4 x i32> %imm, <vscale x 4 x i32> undef, <vscale x 4 x i32> zeroinitializer
				%out = call <vscale x 4 x i32> @llvm.aarch64.sve.smin.u.nxv4i32(<vscale x 4 x i1> %pg,
				<vscale x 4 x i32> %a,
				<vscale x 4 x i32> %imm.splat)
				ret <vscale x 4 x i32> %out
				}

				define <vscale x 2 x i64> @smin_imm_i64(<vscale x 2 x i1> %pg, <vscale x 2 x i64> %a) {
				; CHECK-LABEL: smin_imm_i64:
				; CHECK: // %bb.0:
				; CHECK-NEXT: mov z1.d, #6 // =0x6
				; CHECK-NEXT: smin z0.d, p0/m, z0.d, z1.d
				; CHECK-NEXT: ret
				%imm = insertelement <vscale x 2 x i64> undef, i64 6, i32 0
				%imm.splat = shufflevector <vscale x 2 x i64> %imm, <vscale x 2 x i64> undef, <vscale x 2 x i32> zeroinitializer
				%out = call <vscale x 2 x i64> @llvm.aarch64.sve.smin.u.nxv2i64(<vscale x 2 x i1> %pg,
				<vscale x 2 x i64> %a,
				<vscale x 2 x i64> %imm.splat)
				ret <vscale x 2 x i64> %out
				}

				;
				; SMULH
				;

				define <vscale x 16 x i8> @smulh_i8(<vscale x 16 x i1> %pg, <vscale x 16 x i8> %a, <vscale x 16 x i8> %b) {
				; CHECK-LABEL: smulh_i8:
				; CHECK: // %bb.0:
				; CHECK-NEXT: smulh z0.b, p0/m, z0.b, z1.b
				; CHECK-NEXT: ret
				%out = call <vscale x 16 x i8> @llvm.aarch64.sve.smulh.u.nxv16i8(<vscale x 16 x i1> %pg,
				<vscale x 16 x i8> %a,
				<vscale x 16 x i8> %b)
				ret <vscale x 16 x i8> %out
				}

				define <vscale x 8 x i16> @smulh_i16(<vscale x 8 x i1> %pg, <vscale x 8 x i16> %a, <vscale x 8 x i16> %b) {
				; CHECK-LABEL: smulh_i16:
				; CHECK: // %bb.0:
				; CHECK-NEXT: smulh z0.h, p0/m, z0.h, z1.h
				; CHECK-NEXT: ret
				%out = call <vscale x 8 x i16> @llvm.aarch64.sve.smulh.u.nxv8i16(<vscale x 8 x i1> %pg,
				<vscale x 8 x i16> %a,
				<vscale x 8 x i16> %b)
				ret <vscale x 8 x i16> %out
				}

				define <vscale x 4 x i32> @smulh_i32(<vscale x 4 x i1> %pg, <vscale x 4 x i32> %a, <vscale x 4 x i32> %b) {
				; CHECK-LABEL: smulh_i32:
				; CHECK: // %bb.0:
				; CHECK-NEXT: smulh z0.s, p0/m, z0.s, z1.s
				; CHECK-NEXT: ret
				%out = call <vscale x 4 x i32> @llvm.aarch64.sve.smulh.u.nxv4i32(<vscale x 4 x i1> %pg,
				<vscale x 4 x i32> %a,
				<vscale x 4 x i32> %b)
				ret <vscale x 4 x i32> %out
				}

				define <vscale x 2 x i64> @smulh_i64(<vscale x 2 x i1> %pg, <vscale x 2 x i64> %a, <vscale x 2 x i64> %b) {
				; CHECK-LABEL: smulh_i64:
				; CHECK: // %bb.0:
				; CHECK-NEXT: smulh z0.d, p0/m, z0.d, z1.d
				; CHECK-NEXT: ret
				%out = call <vscale x 2 x i64> @llvm.aarch64.sve.smulh.u.nxv2i64(<vscale x 2 x i1> %pg,
				<vscale x 2 x i64> %a,
				<vscale x 2 x i64> %b)
				ret <vscale x 2 x i64> %out
				}

				;
				; SUB
				;

				define <vscale x 16 x i8> @sub_i8(<vscale x 16 x i1> %pg, <vscale x 16 x i8> %a, <vscale x 16 x i8> %b) {
				; CHECK-LABEL: sub_i8:
				; CHECK: // %bb.0:
				; CHECK-NEXT: sub z0.b, z0.b, z1.b
				; CHECK-NEXT: ret
				%out = call <vscale x 16 x i8> @llvm.aarch64.sve.sub.u.nxv16i8(<vscale x 16 x i1> %pg,
				<vscale x 16 x i8> %a,
				<vscale x 16 x i8> %b)
				ret <vscale x 16 x i8> %out
				}

				define <vscale x 8 x i16> @sub_i16(<vscale x 8 x i1> %pg, <vscale x 8 x i16> %a, <vscale x 8 x i16> %b) {
				; CHECK-LABEL: sub_i16:
				; CHECK: // %bb.0:
				; CHECK-NEXT: sub z0.h, z0.h, z1.h
				; CHECK-NEXT: ret
				%out = call <vscale x 8 x i16> @llvm.aarch64.sve.sub.u.nxv8i16(<vscale x 8 x i1> %pg,
				<vscale x 8 x i16> %a,
				<vscale x 8 x i16> %b)
				ret <vscale x 8 x i16> %out
				}

				define <vscale x 4 x i32> @sub_i32(<vscale x 4 x i1> %pg, <vscale x 4 x i32> %a, <vscale x 4 x i32> %b) {
				; CHECK-LABEL: sub_i32:
				; CHECK: // %bb.0:
				; CHECK-NEXT: sub z0.s, z0.s, z1.s
				; CHECK-NEXT: ret
				%out = call <vscale x 4 x i32> @llvm.aarch64.sve.sub.u.nxv4i32(<vscale x 4 x i1> %pg,
				<vscale x 4 x i32> %a,
				<vscale x 4 x i32> %b)
				ret <vscale x 4 x i32> %out
				}

				define <vscale x 2 x i64> @sub_i64(<vscale x 2 x i1> %pg, <vscale x 2 x i64> %a, <vscale x 2 x i64> %b) {
				; CHECK-LABEL: sub_i64:
				; CHECK: // %bb.0:
				; CHECK-NEXT: sub z0.d, z0.d, z1.d
				; CHECK-NEXT: ret
				%out = call <vscale x 2 x i64> @llvm.aarch64.sve.sub.u.nxv2i64(<vscale x 2 x i1> %pg,
				<vscale x 2 x i64> %a,
				<vscale x 2 x i64> %b)
				ret <vscale x 2 x i64> %out
				}

				;
				; SUB (immediate)
				;

				define <vscale x 16 x i8> @sub_imm_i8(<vscale x 16 x i1> %pg, <vscale x 16 x i8> %a) {
				; CHECK-LABEL: sub_imm_i8:
				; CHECK: // %bb.0:
				; CHECK-NEXT: sub z0.b, z0.b, #3 // =0x3
				; CHECK-NEXT: ret
				%imm = insertelement <vscale x 16 x i8> undef, i8 3, i32 0
				%imm.splat = shufflevector <vscale x 16 x i8> %imm, <vscale x 16 x i8> undef, <vscale x 16 x i32> zeroinitializer
				%out = call <vscale x 16 x i8> @llvm.aarch64.sve.sub.u.nxv16i8(<vscale x 16 x i1> %pg,
				<vscale x 16 x i8> %a,
				<vscale x 16 x i8> %imm.splat)
				ret <vscale x 16 x i8> %out
				}

				define <vscale x 8 x i16> @sub_imm_i16(<vscale x 8 x i1> %pg, <vscale x 8 x i16> %a) {
				; CHECK-LABEL: sub_imm_i16:
				; CHECK: // %bb.0:
				; CHECK-NEXT: sub z0.h, z0.h, #4 // =0x4
				; CHECK-NEXT: ret
				%imm = insertelement <vscale x 8 x i16> undef, i16 4, i32 0
				%imm.splat = shufflevector <vscale x 8 x i16> %imm, <vscale x 8 x i16> undef, <vscale x 8 x i32> zeroinitializer
				%out = call <vscale x 8 x i16> @llvm.aarch64.sve.sub.u.nxv8i16(<vscale x 8 x i1> %pg,
				<vscale x 8 x i16> %a,
				<vscale x 8 x i16> %imm.splat)
				ret <vscale x 8 x i16> %out
				}

				define <vscale x 4 x i32> @sub_imm_i32(<vscale x 4 x i1> %pg, <vscale x 4 x i32> %a) {
				; CHECK-LABEL: sub_imm_i32:
				; CHECK: // %bb.0:
				; CHECK-NEXT: sub z0.s, z0.s, #5 // =0x5
				; CHECK-NEXT: ret
				%imm = insertelement <vscale x 4 x i32> undef, i32 5, i32 0
				%imm.splat = shufflevector <vscale x 4 x i32> %imm, <vscale x 4 x i32> undef, <vscale x 4 x i32> zeroinitializer
				%out = call <vscale x 4 x i32> @llvm.aarch64.sve.sub.u.nxv4i32(<vscale x 4 x i1> %pg,
				<vscale x 4 x i32> %a,
				<vscale x 4 x i32> %imm.splat)
				ret <vscale x 4 x i32> %out
				}

				define <vscale x 2 x i64> @sub_imm_i64(<vscale x 2 x i1> %pg, <vscale x 2 x i64> %a) {
				; CHECK-LABEL: sub_imm_i64:
				; CHECK: // %bb.0:
				; CHECK-NEXT: sub z0.d, z0.d, #6 // =0x6
				; CHECK-NEXT: ret
				%imm = insertelement <vscale x 2 x i64> undef, i64 6, i32 0
				%imm.splat = shufflevector <vscale x 2 x i64> %imm, <vscale x 2 x i64> undef, <vscale x 2 x i32> zeroinitializer
				%out = call <vscale x 2 x i64> @llvm.aarch64.sve.sub.u.nxv2i64(<vscale x 2 x i1> %pg,
				<vscale x 2 x i64> %a,
				<vscale x 2 x i64> %imm.splat)
				ret <vscale x 2 x i64> %out
				}

				;
				; SUBR
				;

				define <vscale x 16 x i8> @subr_i8(<vscale x 16 x i1> %pg, <vscale x 16 x i8> %a, <vscale x 16 x i8> %b) {
				; CHECK-LABEL: subr_i8:
				; CHECK: // %bb.0:
				; CHECK-NEXT: sub z0.b, z1.b, z0.b
				; CHECK-NEXT: ret
				%out = call <vscale x 16 x i8> @llvm.aarch64.sve.sub.u.nxv16i8(<vscale x 16 x i1> %pg,
				<vscale x 16 x i8> %b,
				<vscale x 16 x i8> %a)
				ret <vscale x 16 x i8> %out
				}

				define <vscale x 8 x i16> @subr_i16(<vscale x 8 x i1> %pg, <vscale x 8 x i16> %a, <vscale x 8 x i16> %b) {
				; CHECK-LABEL: subr_i16:
				; CHECK: // %bb.0:
				; CHECK-NEXT: sub z0.h, z1.h, z0.h
				; CHECK-NEXT: ret
				%out = call <vscale x 8 x i16> @llvm.aarch64.sve.sub.u.nxv8i16(<vscale x 8 x i1> %pg,
				<vscale x 8 x i16> %b,
				<vscale x 8 x i16> %a)
				ret <vscale x 8 x i16> %out
				}

				define <vscale x 4 x i32> @subr_i32(<vscale x 4 x i1> %pg, <vscale x 4 x i32> %a, <vscale x 4 x i32> %b) {
				; CHECK-LABEL: subr_i32:
				; CHECK: // %bb.0:
				; CHECK-NEXT: sub z0.s, z1.s, z0.s
				; CHECK-NEXT: ret
				%out = call <vscale x 4 x i32> @llvm.aarch64.sve.sub.u.nxv4i32(<vscale x 4 x i1> %pg,
				<vscale x 4 x i32> %b,
				<vscale x 4 x i32> %a)
				ret <vscale x 4 x i32> %out
				}

				define <vscale x 2 x i64> @subr_i64(<vscale x 2 x i1> %pg, <vscale x 2 x i64> %a, <vscale x 2 x i64> %b) {
				; CHECK-LABEL: subr_i64:
				; CHECK: // %bb.0:
				; CHECK-NEXT: sub z0.d, z1.d, z0.d
				; CHECK-NEXT: ret
				%out = call <vscale x 2 x i64> @llvm.aarch64.sve.sub.u.nxv2i64(<vscale x 2 x i1> %pg,
				<vscale x 2 x i64> %b,
				<vscale x 2 x i64> %a)
				ret <vscale x 2 x i64> %out
				}

				;
				; SUBR (immediate)
				;

				define <vscale x 16 x i8> @subr_imm_i8(<vscale x 16 x i1> %pg, <vscale x 16 x i8> %a) {
				; CHECK-LABEL: subr_imm_i8:
				; CHECK: // %bb.0:
				; CHECK-NEXT: subr z0.b, z0.b, #3 // =0x3
				; CHECK-NEXT: ret
				%imm = insertelement <vscale x 16 x i8> undef, i8 3, i32 0
				%imm.splat = shufflevector <vscale x 16 x i8> %imm, <vscale x 16 x i8> undef, <vscale x 16 x i32> zeroinitializer
				%out = call <vscale x 16 x i8> @llvm.aarch64.sve.sub.u.nxv16i8(<vscale x 16 x i1> %pg,
				<vscale x 16 x i8> %imm.splat,
				<vscale x 16 x i8> %a)
				ret <vscale x 16 x i8> %out
				}

				define <vscale x 8 x i16> @subr_imm_i16(<vscale x 8 x i1> %pg, <vscale x 8 x i16> %a) {
				; CHECK-LABEL: subr_imm_i16:
				; CHECK: // %bb.0:
				; CHECK-NEXT: subr z0.h, z0.h, #4 // =0x4
				; CHECK-NEXT: ret
				%imm = insertelement <vscale x 8 x i16> undef, i16 4, i32 0
				%imm.splat = shufflevector <vscale x 8 x i16> %imm, <vscale x 8 x i16> undef, <vscale x 8 x i32> zeroinitializer
				%out = call <vscale x 8 x i16> @llvm.aarch64.sve.sub.u.nxv8i16(<vscale x 8 x i1> %pg,
				<vscale x 8 x i16> %imm.splat,
				<vscale x 8 x i16> %a)
				ret <vscale x 8 x i16> %out
				}

				define <vscale x 4 x i32> @subr_imm_i32(<vscale x 4 x i1> %pg, <vscale x 4 x i32> %a) {
				; CHECK-LABEL: subr_imm_i32:
				; CHECK: // %bb.0:
				; CHECK-NEXT: subr z0.s, z0.s, #5 // =0x5
				; CHECK-NEXT: ret
				%imm = insertelement <vscale x 4 x i32> undef, i32 5, i32 0
				%imm.splat = shufflevector <vscale x 4 x i32> %imm, <vscale x 4 x i32> undef, <vscale x 4 x i32> zeroinitializer
				%out = call <vscale x 4 x i32> @llvm.aarch64.sve.sub.u.nxv4i32(<vscale x 4 x i1> %pg,
				<vscale x 4 x i32> %imm.splat,
				<vscale x 4 x i32> %a)
				ret <vscale x 4 x i32> %out
				}

				define <vscale x 2 x i64> @subr_imm_i64(<vscale x 2 x i1> %pg, <vscale x 2 x i64> %a) {
				; CHECK-LABEL: subr_imm_i64:
				; CHECK: // %bb.0:
				; CHECK-NEXT: subr z0.d, z0.d, #6 // =0x6
				; CHECK-NEXT: ret
				%imm = insertelement <vscale x 2 x i64> undef, i64 6, i32 0
				%imm.splat = shufflevector <vscale x 2 x i64> %imm, <vscale x 2 x i64> undef, <vscale x 2 x i32> zeroinitializer
				%out = call <vscale x 2 x i64> @llvm.aarch64.sve.sub.u.nxv2i64(<vscale x 2 x i1> %pg,
				<vscale x 2 x i64> %imm.splat,
				<vscale x 2 x i64> %a)
				ret <vscale x 2 x i64> %out
				}

				;
				; UABD
				;

				define <vscale x 16 x i8> @uabd_i8(<vscale x 16 x i1> %pg, <vscale x 16 x i8> %a, <vscale x 16 x i8> %b) {
				; CHECK-LABEL: uabd_i8:
				; CHECK: // %bb.0:
				; CHECK-NEXT: ptrue p0.b
				; CHECK-NEXT: uabd z0.b, p0/m, z0.b, z1.b
				; CHECK-NEXT: ret
				%out = call <vscale x 16 x i8> @llvm.aarch64.sve.uabd.u.nxv16i8(<vscale x 16 x i1> %pg,
				<vscale x 16 x i8> %a,
				<vscale x 16 x i8> %b)
				ret <vscale x 16 x i8> %out
				}

				define <vscale x 8 x i16> @uabd_i16(<vscale x 8 x i1> %pg, <vscale x 8 x i16> %a, <vscale x 8 x i16> %b) {
				; CHECK-LABEL: uabd_i16:
				; CHECK: // %bb.0:
				; CHECK-NEXT: ptrue p0.h
				; CHECK-NEXT: uabd z0.h, p0/m, z0.h, z1.h
				; CHECK-NEXT: ret
				%out = call <vscale x 8 x i16> @llvm.aarch64.sve.uabd.u.nxv8i16(<vscale x 8 x i1> %pg,
				<vscale x 8 x i16> %a,
				<vscale x 8 x i16> %b)
				ret <vscale x 8 x i16> %out
				}

				define <vscale x 4 x i32> @uabd_i32(<vscale x 4 x i1> %pg, <vscale x 4 x i32> %a, <vscale x 4 x i32> %b) {
				; CHECK-LABEL: uabd_i32:
				; CHECK: // %bb.0:
				; CHECK-NEXT: ptrue p0.s
				; CHECK-NEXT: uabd z0.s, p0/m, z0.s, z1.s
				; CHECK-NEXT: ret
				%out = call <vscale x 4 x i32> @llvm.aarch64.sve.uabd.u.nxv4i32(<vscale x 4 x i1> %pg,
				<vscale x 4 x i32> %a,
				<vscale x 4 x i32> %b)
				ret <vscale x 4 x i32> %out
				}

				define <vscale x 2 x i64> @uabd_i64(<vscale x 2 x i1> %pg, <vscale x 2 x i64> %a, <vscale x 2 x i64> %b) {
				; CHECK-LABEL: uabd_i64:
				; CHECK: // %bb.0:
				; CHECK-NEXT: ptrue p0.d
				; CHECK-NEXT: uabd z0.d, p0/m, z0.d, z1.d
				; CHECK-NEXT: ret
				%out = call <vscale x 2 x i64> @llvm.aarch64.sve.uabd.u.nxv2i64(<vscale x 2 x i1> %pg,
				<vscale x 2 x i64> %a,
				<vscale x 2 x i64> %b)
				ret <vscale x 2 x i64> %out
				}

				;
				; UDIV
				;

				define <vscale x 4 x i32> @udiv_i32(<vscale x 4 x i1> %pg, <vscale x 4 x i32> %a, <vscale x 4 x i32> %b) {
				; CHECK-LABEL: udiv_i32:
				; CHECK: // %bb.0:
				; CHECK-NEXT: udiv z0.s, p0/m, z0.s, z1.s
				; CHECK-NEXT: ret
				%out = call <vscale x 4 x i32> @llvm.aarch64.sve.udiv.u.nxv4i32(<vscale x 4 x i1> %pg,
				<vscale x 4 x i32> %a,
				<vscale x 4 x i32> %b)
				ret <vscale x 4 x i32> %out
				}

				define <vscale x 2 x i64> @udiv_i64(<vscale x 2 x i1> %pg, <vscale x 2 x i64> %a, <vscale x 2 x i64> %b) {
				; CHECK-LABEL: udiv_i64:
				; CHECK: // %bb.0:
				; CHECK-NEXT: udiv z0.d, p0/m, z0.d, z1.d
				; CHECK-NEXT: ret
				%out = call <vscale x 2 x i64> @llvm.aarch64.sve.udiv.u.nxv2i64(<vscale x 2 x i1> %pg,
				<vscale x 2 x i64> %a,
				<vscale x 2 x i64> %b)
				ret <vscale x 2 x i64> %out
				}

				;
				; UDIVR
				;

				define <vscale x 4 x i32> @udivr_i32(<vscale x 4 x i1> %pg, <vscale x 4 x i32> %a, <vscale x 4 x i32> %b) {
				; CHECK-LABEL: udivr_i32:
				; CHECK: // %bb.0:
				; CHECK-NEXT: udivr z0.s, p0/m, z0.s, z1.s
				; CHECK-NEXT: ret
				%out = call <vscale x 4 x i32> @llvm.aarch64.sve.udiv.u.nxv4i32(<vscale x 4 x i1> %pg,
				<vscale x 4 x i32> %b,
				<vscale x 4 x i32> %a)
				ret <vscale x 4 x i32> %out
				}

				define <vscale x 2 x i64> @udivr_i64(<vscale x 2 x i1> %pg, <vscale x 2 x i64> %a, <vscale x 2 x i64> %b) {
				; CHECK-LABEL: udivr_i64:
				; CHECK: // %bb.0:
				; CHECK-NEXT: udivr z0.d, p0/m, z0.d, z1.d
				; CHECK-NEXT: ret
				%out = call <vscale x 2 x i64> @llvm.aarch64.sve.udiv.u.nxv2i64(<vscale x 2 x i1> %pg,
				<vscale x 2 x i64> %b,
				<vscale x 2 x i64> %a)
				ret <vscale x 2 x i64> %out
				}

				;
				; UMAX
				;

				define <vscale x 16 x i8> @umax_i8(<vscale x 16 x i1> %pg, <vscale x 16 x i8> %a, <vscale x 16 x i8> %b) {
				; CHECK-LABEL: umax_i8:
				; CHECK: // %bb.0:
				; CHECK-NEXT: umax z0.b, p0/m, z0.b, z1.b
				; CHECK-NEXT: ret
				%out = call <vscale x 16 x i8> @llvm.aarch64.sve.umax.u.nxv16i8(<vscale x 16 x i1> %pg,
				<vscale x 16 x i8> %a,
				<vscale x 16 x i8> %b)
				ret <vscale x 16 x i8> %out
				}

				define <vscale x 8 x i16> @umax_i16(<vscale x 8 x i1> %pg, <vscale x 8 x i16> %a, <vscale x 8 x i16> %b) {
				; CHECK-LABEL: umax_i16:
				; CHECK: // %bb.0:
				; CHECK-NEXT: umax z0.h, p0/m, z0.h, z1.h
				; CHECK-NEXT: ret
				%out = call <vscale x 8 x i16> @llvm.aarch64.sve.umax.u.nxv8i16(<vscale x 8 x i1> %pg,
				<vscale x 8 x i16> %a,
				<vscale x 8 x i16> %b)
				ret <vscale x 8 x i16> %out
				}

				define <vscale x 4 x i32> @umax_i32(<vscale x 4 x i1> %pg, <vscale x 4 x i32> %a, <vscale x 4 x i32> %b) {
				; CHECK-LABEL: umax_i32:
				; CHECK: // %bb.0:
				; CHECK-NEXT: umax z0.s, p0/m, z0.s, z1.s
				; CHECK-NEXT: ret
				%out = call <vscale x 4 x i32> @llvm.aarch64.sve.umax.u.nxv4i32(<vscale x 4 x i1> %pg,
				<vscale x 4 x i32> %a,
				<vscale x 4 x i32> %b)
				ret <vscale x 4 x i32> %out
				}

				define <vscale x 2 x i64> @umax_i64(<vscale x 2 x i1> %pg, <vscale x 2 x i64> %a, <vscale x 2 x i64> %b) {
				; CHECK-LABEL: umax_i64:
				; CHECK: // %bb.0:
				; CHECK-NEXT: umax z0.d, p0/m, z0.d, z1.d
				; CHECK-NEXT: ret
				%out = call <vscale x 2 x i64> @llvm.aarch64.sve.umax.u.nxv2i64(<vscale x 2 x i1> %pg,
				<vscale x 2 x i64> %a,
				<vscale x 2 x i64> %b)
				ret <vscale x 2 x i64> %out
				}

				;
				; UMAX (immediate)
				;

				define <vscale x 16 x i8> @umax_imm_i8(<vscale x 16 x i1> %pg, <vscale x 16 x i8> %a) {
				; CHECK-LABEL: umax_imm_i8:
				; CHECK: // %bb.0:
				; CHECK-NEXT: mov z1.b, #3 // =0x3
				; CHECK-NEXT: umax z0.b, p0/m, z0.b, z1.b
				; CHECK-NEXT: ret
				%imm = insertelement <vscale x 16 x i8> undef, i8 3, i32 0
				%imm.splat = shufflevector <vscale x 16 x i8> %imm, <vscale x 16 x i8> undef, <vscale x 16 x i32> zeroinitializer
				%out = call <vscale x 16 x i8> @llvm.aarch64.sve.umax.u.nxv16i8(<vscale x 16 x i1> %pg,
				<vscale x 16 x i8> %a,
				<vscale x 16 x i8> %imm.splat)
				ret <vscale x 16 x i8> %out
				}

				define <vscale x 8 x i16> @umax_imm_i16(<vscale x 8 x i1> %pg, <vscale x 8 x i16> %a) {
				; CHECK-LABEL: umax_imm_i16:
				; CHECK: // %bb.0:
				; CHECK-NEXT: mov z1.h, #4 // =0x4
				; CHECK-NEXT: umax z0.h, p0/m, z0.h, z1.h
				; CHECK-NEXT: ret
				%imm = insertelement <vscale x 8 x i16> undef, i16 4, i32 0
				%imm.splat = shufflevector <vscale x 8 x i16> %imm, <vscale x 8 x i16> undef, <vscale x 8 x i32> zeroinitializer
				%out = call <vscale x 8 x i16> @llvm.aarch64.sve.umax.u.nxv8i16(<vscale x 8 x i1> %pg,
				<vscale x 8 x i16> %a,
				<vscale x 8 x i16> %imm.splat)
				ret <vscale x 8 x i16> %out
				}

				define <vscale x 4 x i32> @umax_imm_i32(<vscale x 4 x i1> %pg, <vscale x 4 x i32> %a) {
				; CHECK-LABEL: umax_imm_i32:
				; CHECK: // %bb.0:
				; CHECK-NEXT: mov z1.s, #5 // =0x5
				; CHECK-NEXT: umax z0.s, p0/m, z0.s, z1.s
				; CHECK-NEXT: ret
				%imm = insertelement <vscale x 4 x i32> undef, i32 5, i32 0
				%imm.splat = shufflevector <vscale x 4 x i32> %imm, <vscale x 4 x i32> undef, <vscale x 4 x i32> zeroinitializer
				%out = call <vscale x 4 x i32> @llvm.aarch64.sve.umax.u.nxv4i32(<vscale x 4 x i1> %pg,
				<vscale x 4 x i32> %a,
				<vscale x 4 x i32> %imm.splat)
				ret <vscale x 4 x i32> %out
				}

				define <vscale x 2 x i64> @umax_imm_i64(<vscale x 2 x i1> %pg, <vscale x 2 x i64> %a) {
				; CHECK-LABEL: umax_imm_i64:
				; CHECK: // %bb.0:
				; CHECK-NEXT: mov z1.d, #6 // =0x6
				; CHECK-NEXT: umax z0.d, p0/m, z0.d, z1.d
				; CHECK-NEXT: ret
				%imm = insertelement <vscale x 2 x i64> undef, i64 6, i32 0
				%imm.splat = shufflevector <vscale x 2 x i64> %imm, <vscale x 2 x i64> undef, <vscale x 2 x i32> zeroinitializer
				%out = call <vscale x 2 x i64> @llvm.aarch64.sve.umax.u.nxv2i64(<vscale x 2 x i1> %pg,
				<vscale x 2 x i64> %a,
				<vscale x 2 x i64> %imm.splat)
				ret <vscale x 2 x i64> %out
				}

				;
				; UMIN
				;

				define <vscale x 16 x i8> @umin_i8(<vscale x 16 x i1> %pg, <vscale x 16 x i8> %a, <vscale x 16 x i8> %b) {
				; CHECK-LABEL: umin_i8:
				; CHECK: // %bb.0:
				; CHECK-NEXT: umin z0.b, p0/m, z0.b, z1.b
				; CHECK-NEXT: ret
				%out = call <vscale x 16 x i8> @llvm.aarch64.sve.umin.u.nxv16i8(<vscale x 16 x i1> %pg,
				<vscale x 16 x i8> %a,
				<vscale x 16 x i8> %b)
				ret <vscale x 16 x i8> %out
				}

				define <vscale x 8 x i16> @umin_i16(<vscale x 8 x i1> %pg, <vscale x 8 x i16> %a, <vscale x 8 x i16> %b) {
				; CHECK-LABEL: umin_i16:
				; CHECK: // %bb.0:
				; CHECK-NEXT: umin z0.h, p0/m, z0.h, z1.h
				; CHECK-NEXT: ret
				%out = call <vscale x 8 x i16> @llvm.aarch64.sve.umin.u.nxv8i16(<vscale x 8 x i1> %pg,
				<vscale x 8 x i16> %a,
				<vscale x 8 x i16> %b)
				ret <vscale x 8 x i16> %out
				}

				define <vscale x 4 x i32> @umin_i32(<vscale x 4 x i1> %pg, <vscale x 4 x i32> %a, <vscale x 4 x i32> %b) {
				; CHECK-LABEL: umin_i32:
				; CHECK: // %bb.0:
				; CHECK-NEXT: umin z0.s, p0/m, z0.s, z1.s
				; CHECK-NEXT: ret
				%out = call <vscale x 4 x i32> @llvm.aarch64.sve.umin.u.nxv4i32(<vscale x 4 x i1> %pg,
				<vscale x 4 x i32> %a,
				<vscale x 4 x i32> %b)
				ret <vscale x 4 x i32> %out
				}

				define <vscale x 2 x i64> @umin_i64(<vscale x 2 x i1> %pg, <vscale x 2 x i64> %a, <vscale x 2 x i64> %b) {
				; CHECK-LABEL: umin_i64:
				; CHECK: // %bb.0:
				; CHECK-NEXT: umin z0.d, p0/m, z0.d, z1.d
				; CHECK-NEXT: ret
				%out = call <vscale x 2 x i64> @llvm.aarch64.sve.umin.u.nxv2i64(<vscale x 2 x i1> %pg,
				<vscale x 2 x i64> %a,
				<vscale x 2 x i64> %b)
				ret <vscale x 2 x i64> %out
				}

				;
				; UMIN (immediate)
				;

				define <vscale x 16 x i8> @umin_imm_i8(<vscale x 16 x i1> %pg, <vscale x 16 x i8> %a) {
				; CHECK-LABEL: umin_imm_i8:
				; CHECK: // %bb.0:
				; CHECK-NEXT: mov z1.b, #3 // =0x3
				; CHECK-NEXT: umin z0.b, p0/m, z0.b, z1.b
				; CHECK-NEXT: ret
				%imm = insertelement <vscale x 16 x i8> undef, i8 3, i32 0
				%imm.splat = shufflevector <vscale x 16 x i8> %imm, <vscale x 16 x i8> undef, <vscale x 16 x i32> zeroinitializer
				%out = call <vscale x 16 x i8> @llvm.aarch64.sve.umin.u.nxv16i8(<vscale x 16 x i1> %pg,
				<vscale x 16 x i8> %a,
				<vscale x 16 x i8> %imm.splat)
				ret <vscale x 16 x i8> %out
				}

				define <vscale x 8 x i16> @umin_imm_i16(<vscale x 8 x i1> %pg, <vscale x 8 x i16> %a) {
				; CHECK-LABEL: umin_imm_i16:
				; CHECK: // %bb.0:
				; CHECK-NEXT: mov z1.h, #4 // =0x4
				; CHECK-NEXT: umin z0.h, p0/m, z0.h, z1.h
				; CHECK-NEXT: ret
				%imm = insertelement <vscale x 8 x i16> undef, i16 4, i32 0
				%imm.splat = shufflevector <vscale x 8 x i16> %imm, <vscale x 8 x i16> undef, <vscale x 8 x i32> zeroinitializer
				%out = call <vscale x 8 x i16> @llvm.aarch64.sve.umin.u.nxv8i16(<vscale x 8 x i1> %pg,
				<vscale x 8 x i16> %a,
				<vscale x 8 x i16> %imm.splat)
				ret <vscale x 8 x i16> %out
				}

				define <vscale x 4 x i32> @umin_imm_i32(<vscale x 4 x i1> %pg, <vscale x 4 x i32> %a) {
				; CHECK-LABEL: umin_imm_i32:
				; CHECK: // %bb.0:
				; CHECK-NEXT: mov z1.s, #5 // =0x5
				; CHECK-NEXT: umin z0.s, p0/m, z0.s, z1.s
				; CHECK-NEXT: ret
				%imm = insertelement <vscale x 4 x i32> undef, i32 5, i32 0
				%imm.splat = shufflevector <vscale x 4 x i32> %imm, <vscale x 4 x i32> undef, <vscale x 4 x i32> zeroinitializer
				%out = call <vscale x 4 x i32> @llvm.aarch64.sve.umin.u.nxv4i32(<vscale x 4 x i1> %pg,
				<vscale x 4 x i32> %a,
				<vscale x 4 x i32> %imm.splat)
				ret <vscale x 4 x i32> %out
				}

				define <vscale x 2 x i64> @umin_imm_i64(<vscale x 2 x i1> %pg, <vscale x 2 x i64> %a) {
				; CHECK-LABEL: umin_imm_i64:
				; CHECK: // %bb.0:
				; CHECK-NEXT: mov z1.d, #6 // =0x6
				; CHECK-NEXT: umin z0.d, p0/m, z0.d, z1.d
				; CHECK-NEXT: ret
				%imm = insertelement <vscale x 2 x i64> undef, i64 6, i32 0
				%imm.splat = shufflevector <vscale x 2 x i64> %imm, <vscale x 2 x i64> undef, <vscale x 2 x i32> zeroinitializer
				%out = call <vscale x 2 x i64> @llvm.aarch64.sve.umin.u.nxv2i64(<vscale x 2 x i1> %pg,
				<vscale x 2 x i64> %a,
				<vscale x 2 x i64> %imm.splat)
				ret <vscale x 2 x i64> %out
				}

				;
				; UMULH
				;

				define <vscale x 16 x i8> @umulh_i8(<vscale x 16 x i1> %pg, <vscale x 16 x i8> %a, <vscale x 16 x i8> %b) {
				; CHECK-LABEL: umulh_i8:
				; CHECK: // %bb.0:
				; CHECK-NEXT: umulh z0.b, p0/m, z0.b, z1.b
				; CHECK-NEXT: ret
				%out = call <vscale x 16 x i8> @llvm.aarch64.sve.umulh.u.nxv16i8(<vscale x 16 x i1> %pg,
				<vscale x 16 x i8> %a,
				<vscale x 16 x i8> %b)
				ret <vscale x 16 x i8> %out
				}

				define <vscale x 8 x i16> @umulh_i16(<vscale x 8 x i1> %pg, <vscale x 8 x i16> %a, <vscale x 8 x i16> %b) {
				; CHECK-LABEL: umulh_i16:
				; CHECK: // %bb.0:
				; CHECK-NEXT: umulh z0.h, p0/m, z0.h, z1.h
				; CHECK-NEXT: ret
				%out = call <vscale x 8 x i16> @llvm.aarch64.sve.umulh.u.nxv8i16(<vscale x 8 x i1> %pg,
				<vscale x 8 x i16> %a,
				<vscale x 8 x i16> %b)
				ret <vscale x 8 x i16> %out
				}

				define <vscale x 4 x i32> @umulh_i32(<vscale x 4 x i1> %pg, <vscale x 4 x i32> %a, <vscale x 4 x i32> %b) {
				; CHECK-LABEL: umulh_i32:
				; CHECK: // %bb.0:
				; CHECK-NEXT: umulh z0.s, p0/m, z0.s, z1.s
				; CHECK-NEXT: ret
				%out = call <vscale x 4 x i32> @llvm.aarch64.sve.umulh.u.nxv4i32(<vscale x 4 x i1> %pg,
				<vscale x 4 x i32> %a,
				<vscale x 4 x i32> %b)
				ret <vscale x 4 x i32> %out
				}

				define <vscale x 2 x i64> @umulh_i64(<vscale x 2 x i1> %pg, <vscale x 2 x i64> %a, <vscale x 2 x i64> %b) {
				; CHECK-LABEL: umulh_i64:
				; CHECK: // %bb.0:
				; CHECK-NEXT: umulh z0.d, p0/m, z0.d, z1.d
				; CHECK-NEXT: ret
				%out = call <vscale x 2 x i64> @llvm.aarch64.sve.umulh.u.nxv2i64(<vscale x 2 x i1> %pg,
				<vscale x 2 x i64> %a,
				<vscale x 2 x i64> %b)
				ret <vscale x 2 x i64> %out
				}

				declare <vscale x 16 x i8> @llvm.aarch64.sve.add.u.nxv16i8(<vscale x 16 x i1>, <vscale x 16 x i8>, <vscale x 16 x i8>)
				declare <vscale x 8 x i16> @llvm.aarch64.sve.add.u.nxv8i16(<vscale x 8 x i1>, <vscale x 8 x i16>, <vscale x 8 x i16>)
				declare <vscale x 4 x i32> @llvm.aarch64.sve.add.u.nxv4i32(<vscale x 4 x i1>, <vscale x 4 x i32>, <vscale x 4 x i32>)
				declare <vscale x 2 x i64> @llvm.aarch64.sve.add.u.nxv2i64(<vscale x 2 x i1>, <vscale x 2 x i64>, <vscale x 2 x i64>)

				declare <vscale x 16 x i8> @llvm.aarch64.sve.mul.u.nxv16i8(<vscale x 16 x i1>, <vscale x 16 x i8>, <vscale x 16 x i8>)
				declare <vscale x 8 x i16> @llvm.aarch64.sve.mul.u.nxv8i16(<vscale x 8 x i1>, <vscale x 8 x i16>, <vscale x 8 x i16>)
				declare <vscale x 4 x i32> @llvm.aarch64.sve.mul.u.nxv4i32(<vscale x 4 x i1>, <vscale x 4 x i32>, <vscale x 4 x i32>)
				declare <vscale x 2 x i64> @llvm.aarch64.sve.mul.u.nxv2i64(<vscale x 2 x i1>, <vscale x 2 x i64>, <vscale x 2 x i64>)

				declare <vscale x 16 x i8> @llvm.aarch64.sve.sabd.u.nxv16i8(<vscale x 16 x i1>, <vscale x 16 x i8>, <vscale x 16 x i8>)
				declare <vscale x 8 x i16> @llvm.aarch64.sve.sabd.u.nxv8i16(<vscale x 8 x i1>, <vscale x 8 x i16>, <vscale x 8 x i16>)
				declare <vscale x 4 x i32> @llvm.aarch64.sve.sabd.u.nxv4i32(<vscale x 4 x i1>, <vscale x 4 x i32>, <vscale x 4 x i32>)
				declare <vscale x 2 x i64> @llvm.aarch64.sve.sabd.u.nxv2i64(<vscale x 2 x i1>, <vscale x 2 x i64>, <vscale x 2 x i64>)

				declare <vscale x 4 x i32> @llvm.aarch64.sve.sdiv.u.nxv4i32(<vscale x 4 x i1>, <vscale x 4 x i32>, <vscale x 4 x i32>)
				declare <vscale x 2 x i64> @llvm.aarch64.sve.sdiv.u.nxv2i64(<vscale x 2 x i1>, <vscale x 2 x i64>, <vscale x 2 x i64>)

				declare <vscale x 16 x i8> @llvm.aarch64.sve.smax.u.nxv16i8(<vscale x 16 x i1>, <vscale x 16 x i8>, <vscale x 16 x i8>)
				declare <vscale x 8 x i16> @llvm.aarch64.sve.smax.u.nxv8i16(<vscale x 8 x i1>, <vscale x 8 x i16>, <vscale x 8 x i16>)
				declare <vscale x 4 x i32> @llvm.aarch64.sve.smax.u.nxv4i32(<vscale x 4 x i1>, <vscale x 4 x i32>, <vscale x 4 x i32>)
				declare <vscale x 2 x i64> @llvm.aarch64.sve.smax.u.nxv2i64(<vscale x 2 x i1>, <vscale x 2 x i64>, <vscale x 2 x i64>)

				declare <vscale x 16 x i8> @llvm.aarch64.sve.smin.u.nxv16i8(<vscale x 16 x i1>, <vscale x 16 x i8>, <vscale x 16 x i8>)
				declare <vscale x 8 x i16> @llvm.aarch64.sve.smin.u.nxv8i16(<vscale x 8 x i1>, <vscale x 8 x i16>, <vscale x 8 x i16>)
				declare <vscale x 4 x i32> @llvm.aarch64.sve.smin.u.nxv4i32(<vscale x 4 x i1>, <vscale x 4 x i32>, <vscale x 4 x i32>)
				declare <vscale x 2 x i64> @llvm.aarch64.sve.smin.u.nxv2i64(<vscale x 2 x i1>, <vscale x 2 x i64>, <vscale x 2 x i64>)

				declare <vscale x 16 x i8> @llvm.aarch64.sve.smulh.u.nxv16i8(<vscale x 16 x i1>, <vscale x 16 x i8>, <vscale x 16 x i8>)
				declare <vscale x 8 x i16> @llvm.aarch64.sve.smulh.u.nxv8i16(<vscale x 8 x i1>, <vscale x 8 x i16>, <vscale x 8 x i16>)
				declare <vscale x 4 x i32> @llvm.aarch64.sve.smulh.u.nxv4i32(<vscale x 4 x i1>, <vscale x 4 x i32>, <vscale x 4 x i32>)
				declare <vscale x 2 x i64> @llvm.aarch64.sve.smulh.u.nxv2i64(<vscale x 2 x i1>, <vscale x 2 x i64>, <vscale x 2 x i64>)

				declare <vscale x 16 x i8> @llvm.aarch64.sve.sub.u.nxv16i8(<vscale x 16 x i1>, <vscale x 16 x i8>, <vscale x 16 x i8>)
				declare <vscale x 8 x i16> @llvm.aarch64.sve.sub.u.nxv8i16(<vscale x 8 x i1>, <vscale x 8 x i16>, <vscale x 8 x i16>)
				declare <vscale x 4 x i32> @llvm.aarch64.sve.sub.u.nxv4i32(<vscale x 4 x i1>, <vscale x 4 x i32>, <vscale x 4 x i32>)
				declare <vscale x 2 x i64> @llvm.aarch64.sve.sub.u.nxv2i64(<vscale x 2 x i1>, <vscale x 2 x i64>, <vscale x 2 x i64>)

				declare <vscale x 16 x i8> @llvm.aarch64.sve.uabd.u.nxv16i8(<vscale x 16 x i1>, <vscale x 16 x i8>, <vscale x 16 x i8>)
				declare <vscale x 8 x i16> @llvm.aarch64.sve.uabd.u.nxv8i16(<vscale x 8 x i1>, <vscale x 8 x i16>, <vscale x 8 x i16>)
				declare <vscale x 4 x i32> @llvm.aarch64.sve.uabd.u.nxv4i32(<vscale x 4 x i1>, <vscale x 4 x i32>, <vscale x 4 x i32>)
				declare <vscale x 2 x i64> @llvm.aarch64.sve.uabd.u.nxv2i64(<vscale x 2 x i1>, <vscale x 2 x i64>, <vscale x 2 x i64>)

				declare <vscale x 4 x i32> @llvm.aarch64.sve.udiv.u.nxv4i32(<vscale x 4 x i1>, <vscale x 4 x i32>, <vscale x 4 x i32>)
				declare <vscale x 2 x i64> @llvm.aarch64.sve.udiv.u.nxv2i64(<vscale x 2 x i1>, <vscale x 2 x i64>, <vscale x 2 x i64>)

				declare <vscale x 16 x i8> @llvm.aarch64.sve.umax.u.nxv16i8(<vscale x 16 x i1>, <vscale x 16 x i8>, <vscale x 16 x i8>)
				declare <vscale x 8 x i16> @llvm.aarch64.sve.umax.u.nxv8i16(<vscale x 8 x i1>, <vscale x 8 x i16>, <vscale x 8 x i16>)
				declare <vscale x 4 x i32> @llvm.aarch64.sve.umax.u.nxv4i32(<vscale x 4 x i1>, <vscale x 4 x i32>, <vscale x 4 x i32>)
				declare <vscale x 2 x i64> @llvm.aarch64.sve.umax.u.nxv2i64(<vscale x 2 x i1>, <vscale x 2 x i64>, <vscale x 2 x i64>)

				declare <vscale x 16 x i8> @llvm.aarch64.sve.umin.u.nxv16i8(<vscale x 16 x i1>, <vscale x 16 x i8>, <vscale x 16 x i8>)
				declare <vscale x 8 x i16> @llvm.aarch64.sve.umin.u.nxv8i16(<vscale x 8 x i1>, <vscale x 8 x i16>, <vscale x 8 x i16>)
				declare <vscale x 4 x i32> @llvm.aarch64.sve.umin.u.nxv4i32(<vscale x 4 x i1>, <vscale x 4 x i32>, <vscale x 4 x i32>)
				declare <vscale x 2 x i64> @llvm.aarch64.sve.umin.u.nxv2i64(<vscale x 2 x i1>, <vscale x 2 x i64>, <vscale x 2 x i64>)

				declare <vscale x 16 x i8> @llvm.aarch64.sve.umulh.u.nxv16i8(<vscale x 16 x i1>, <vscale x 16 x i8>, <vscale x 16 x i8>)
				declare <vscale x 8 x i16> @llvm.aarch64.sve.umulh.u.nxv8i16(<vscale x 8 x i1>, <vscale x 8 x i16>, <vscale x 8 x i16>)
				declare <vscale x 4 x i32> @llvm.aarch64.sve.umulh.u.nxv4i32(<vscale x 4 x i1>, <vscale x 4 x i32>, <vscale x 4 x i32>)
				declare <vscale x 2 x i64> @llvm.aarch64.sve.umulh.u.nxv2i64(<vscale x 2 x i1>, <vscale x 2 x i64>, <vscale x 2 x i64>)

llvm/test/CodeGen/AArch64/sve-intrinsics-shifts-undef.ll

This file was added.

				; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
				; RUN: llc -mattr=+sve < %s \| FileCheck %s

				target triple = "aarch64-unknown-linux-gnu"

				;
				; ASR
				;

				define <vscale x 16 x i8> @asr_i8(<vscale x 16 x i1> %pg, <vscale x 16 x i8> %a, <vscale x 16 x i8> %b) {
				; CHECK-LABEL: asr_i8:
				; CHECK: // %bb.0:
				; CHECK-NEXT: asr z0.b, p0/m, z0.b, z1.b
				; CHECK-NEXT: ret
				%out = call <vscale x 16 x i8> @llvm.aarch64.sve.asr.u.nxv16i8(<vscale x 16 x i1> %pg,
				<vscale x 16 x i8> %a,
				<vscale x 16 x i8> %b)
				ret <vscale x 16 x i8> %out
				}

				define <vscale x 8 x i16> @asr_i16(<vscale x 8 x i1> %pg, <vscale x 8 x i16> %a, <vscale x 8 x i16> %b) {
				; CHECK-LABEL: asr_i16:
				; CHECK: // %bb.0:
				; CHECK-NEXT: asr z0.h, p0/m, z0.h, z1.h
				; CHECK-NEXT: ret
				%out = call <vscale x 8 x i16> @llvm.aarch64.sve.asr.u.nxv8i16(<vscale x 8 x i1> %pg,
				<vscale x 8 x i16> %a,
				<vscale x 8 x i16> %b)
				ret <vscale x 8 x i16> %out
				}

				define <vscale x 4 x i32> @asr_i32(<vscale x 4 x i1> %pg, <vscale x 4 x i32> %a, <vscale x 4 x i32> %b) {
				; CHECK-LABEL: asr_i32:
				; CHECK: // %bb.0:
				; CHECK-NEXT: asr z0.s, p0/m, z0.s, z1.s
				; CHECK-NEXT: ret
				%out = call <vscale x 4 x i32> @llvm.aarch64.sve.asr.u.nxv4i32(<vscale x 4 x i1> %pg,
				<vscale x 4 x i32> %a,
				<vscale x 4 x i32> %b)
				ret <vscale x 4 x i32> %out
				}

				define <vscale x 2 x i64> @asr_i64(<vscale x 2 x i1> %pg, <vscale x 2 x i64> %a, <vscale x 2 x i64> %b) {
				; CHECK-LABEL: asr_i64:
				; CHECK: // %bb.0:
				; CHECK-NEXT: asr z0.d, p0/m, z0.d, z1.d
				; CHECK-NEXT: ret
				%out = call <vscale x 2 x i64> @llvm.aarch64.sve.asr.u.nxv2i64(<vscale x 2 x i1> %pg,
				<vscale x 2 x i64> %a,
				<vscale x 2 x i64> %b)
				ret <vscale x 2 x i64> %out
				}

				;
				; ASR (immediate)
				;

				define <vscale x 16 x i8> @asr_imm_i8(<vscale x 16 x i1> %pg, <vscale x 16 x i8> %a) {
				; CHECK-LABEL: asr_imm_i8:
				; CHECK: // %bb.0:
				; CHECK-NEXT: asr z0.b, p0/m, z0.b, #3
				; CHECK-NEXT: ret
				%imm = insertelement <vscale x 16 x i8> undef, i8 3, i32 0
				%imm.splat = shufflevector <vscale x 16 x i8> %imm, <vscale x 16 x i8> undef, <vscale x 16 x i32> zeroinitializer
				%out = call <vscale x 16 x i8> @llvm.aarch64.sve.asr.u.nxv16i8(<vscale x 16 x i1> %pg,
				<vscale x 16 x i8> %a,
				<vscale x 16 x i8> %imm.splat)
				ret <vscale x 16 x i8> %out
				}

				define <vscale x 8 x i16> @asr_imm_i16(<vscale x 8 x i1> %pg, <vscale x 8 x i16> %a) {
				; CHECK-LABEL: asr_imm_i16:
				; CHECK: // %bb.0:
				; CHECK-NEXT: asr z0.h, p0/m, z0.h, #4
				; CHECK-NEXT: ret
				%imm = insertelement <vscale x 8 x i16> undef, i16 4, i32 0
				%imm.splat = shufflevector <vscale x 8 x i16> %imm, <vscale x 8 x i16> undef, <vscale x 8 x i32> zeroinitializer
				%out = call <vscale x 8 x i16> @llvm.aarch64.sve.asr.u.nxv8i16(<vscale x 8 x i1> %pg,
				<vscale x 8 x i16> %a,
				<vscale x 8 x i16> %imm.splat)
				ret <vscale x 8 x i16> %out
				}

				define <vscale x 4 x i32> @asr_imm_i32(<vscale x 4 x i1> %pg, <vscale x 4 x i32> %a) {
				; CHECK-LABEL: asr_imm_i32:
				; CHECK: // %bb.0:
				; CHECK-NEXT: asr z0.s, p0/m, z0.s, #5
				; CHECK-NEXT: ret
				%imm = insertelement <vscale x 4 x i32> undef, i32 5, i32 0
				%imm.splat = shufflevector <vscale x 4 x i32> %imm, <vscale x 4 x i32> undef, <vscale x 4 x i32> zeroinitializer
				%out = call <vscale x 4 x i32> @llvm.aarch64.sve.asr.u.nxv4i32(<vscale x 4 x i1> %pg,
				<vscale x 4 x i32> %a,
				<vscale x 4 x i32> %imm.splat)
				ret <vscale x 4 x i32> %out
				}

				define <vscale x 2 x i64> @asr_imm_i64(<vscale x 2 x i1> %pg, <vscale x 2 x i64> %a) {
				; CHECK-LABEL: asr_imm_i64:
				; CHECK: // %bb.0:
				; CHECK-NEXT: asr z0.d, p0/m, z0.d, #6
				; CHECK-NEXT: ret
				%imm = insertelement <vscale x 2 x i64> undef, i64 6, i32 0
				%imm.splat = shufflevector <vscale x 2 x i64> %imm, <vscale x 2 x i64> undef, <vscale x 2 x i32> zeroinitializer
				%out = call <vscale x 2 x i64> @llvm.aarch64.sve.asr.u.nxv2i64(<vscale x 2 x i1> %pg,
				<vscale x 2 x i64> %a,
				<vscale x 2 x i64> %imm.splat)
				ret <vscale x 2 x i64> %out
				}

				;
				; LSL
				;

				define <vscale x 16 x i8> @lsl_i8(<vscale x 16 x i1> %pg, <vscale x 16 x i8> %a, <vscale x 16 x i8> %b) {
				; CHECK-LABEL: lsl_i8:
				; CHECK: // %bb.0:
				; CHECK-NEXT: lsl z0.b, p0/m, z0.b, z1.b
				; CHECK-NEXT: ret
				%out = call <vscale x 16 x i8> @llvm.aarch64.sve.lsl.u.nxv16i8(<vscale x 16 x i1> %pg,
				<vscale x 16 x i8> %a,
				<vscale x 16 x i8> %b)
				ret <vscale x 16 x i8> %out
				}

				define <vscale x 8 x i16> @lsl_i16(<vscale x 8 x i1> %pg, <vscale x 8 x i16> %a, <vscale x 8 x i16> %b) {
				; CHECK-LABEL: lsl_i16:
				; CHECK: // %bb.0:
				; CHECK-NEXT: lsl z0.h, p0/m, z0.h, z1.h
				; CHECK-NEXT: ret
				%out = call <vscale x 8 x i16> @llvm.aarch64.sve.lsl.u.nxv8i16(<vscale x 8 x i1> %pg,
				<vscale x 8 x i16> %a,
				<vscale x 8 x i16> %b)
				ret <vscale x 8 x i16> %out
				}

				define <vscale x 4 x i32> @lsl_i32(<vscale x 4 x i1> %pg, <vscale x 4 x i32> %a, <vscale x 4 x i32> %b) {
				; CHECK-LABEL: lsl_i32:
				; CHECK: // %bb.0:
				; CHECK-NEXT: lsl z0.s, p0/m, z0.s, z1.s
				; CHECK-NEXT: ret
				%out = call <vscale x 4 x i32> @llvm.aarch64.sve.lsl.u.nxv4i32(<vscale x 4 x i1> %pg,
				<vscale x 4 x i32> %a,
				<vscale x 4 x i32> %b)
				ret <vscale x 4 x i32> %out
				}

				define <vscale x 2 x i64> @lsl_i64(<vscale x 2 x i1> %pg, <vscale x 2 x i64> %a, <vscale x 2 x i64> %b) {
				; CHECK-LABEL: lsl_i64:
				; CHECK: // %bb.0:
				; CHECK-NEXT: lsl z0.d, p0/m, z0.d, z1.d
				; CHECK-NEXT: ret
				%out = call <vscale x 2 x i64> @llvm.aarch64.sve.lsl.u.nxv2i64(<vscale x 2 x i1> %pg,
				<vscale x 2 x i64> %a,
				<vscale x 2 x i64> %b)
				ret <vscale x 2 x i64> %out
				}

				;
				; LSL (immediate)
				;

				define <vscale x 16 x i8> @lsl_imm_i8(<vscale x 16 x i1> %pg, <vscale x 16 x i8> %a) {
				; CHECK-LABEL: lsl_imm_i8:
				; CHECK: // %bb.0:
				; CHECK-NEXT: lsl z0.b, p0/m, z0.b, #7
				; CHECK-NEXT: ret
				%imm = insertelement <vscale x 16 x i8> undef, i8 7, i32 0
				%imm.splat = shufflevector <vscale x 16 x i8> %imm, <vscale x 16 x i8> undef, <vscale x 16 x i32> zeroinitializer
				%out = call <vscale x 16 x i8> @llvm.aarch64.sve.lsl.u.nxv16i8(<vscale x 16 x i1> %pg,
				<vscale x 16 x i8> %a,
				<vscale x 16 x i8> %imm.splat)
				ret <vscale x 16 x i8> %out
				}

				define <vscale x 8 x i16> @lsl_imm_i16(<vscale x 8 x i1> %pg, <vscale x 8 x i16> %a) {
				; CHECK-LABEL: lsl_imm_i16:
				; CHECK: // %bb.0:
				; CHECK-NEXT: lsl z0.h, p0/m, z0.h, #8
				; CHECK-NEXT: ret
				%imm = insertelement <vscale x 8 x i16> undef, i16 8, i32 0
				%imm.splat = shufflevector <vscale x 8 x i16> %imm, <vscale x 8 x i16> undef, <vscale x 8 x i32> zeroinitializer
				%out = call <vscale x 8 x i16> @llvm.aarch64.sve.lsl.u.nxv8i16(<vscale x 8 x i1> %pg,
				<vscale x 8 x i16> %a,
				<vscale x 8 x i16> %imm.splat)
				ret <vscale x 8 x i16> %out
				}

				define <vscale x 4 x i32> @lsl_imm_i32(<vscale x 4 x i1> %pg, <vscale x 4 x i32> %a) {
				; CHECK-LABEL: lsl_imm_i32:
				; CHECK: // %bb.0:
				; CHECK-NEXT: lsl z0.s, p0/m, z0.s, #9
				; CHECK-NEXT: ret
				%imm = insertelement <vscale x 4 x i32> undef, i32 9, i32 0
				%imm.splat = shufflevector <vscale x 4 x i32> %imm, <vscale x 4 x i32> undef, <vscale x 4 x i32> zeroinitializer
				%out = call <vscale x 4 x i32> @llvm.aarch64.sve.lsl.u.nxv4i32(<vscale x 4 x i1> %pg,
				<vscale x 4 x i32> %a,
				<vscale x 4 x i32> %imm.splat)
				ret <vscale x 4 x i32> %out
				}

				define <vscale x 2 x i64> @lsl_imm_i64(<vscale x 2 x i1> %pg, <vscale x 2 x i64> %a) {
				; CHECK-LABEL: lsl_imm_i64:
				; CHECK: // %bb.0:
				; CHECK-NEXT: lsl z0.d, p0/m, z0.d, #10
				; CHECK-NEXT: ret
				%imm = insertelement <vscale x 2 x i64> undef, i64 10, i32 0
				%imm.splat = shufflevector <vscale x 2 x i64> %imm, <vscale x 2 x i64> undef, <vscale x 2 x i32> zeroinitializer
				%out = call <vscale x 2 x i64> @llvm.aarch64.sve.lsl.u.nxv2i64(<vscale x 2 x i1> %pg,
				<vscale x 2 x i64> %a,
				<vscale x 2 x i64> %imm.splat)
				ret <vscale x 2 x i64> %out
				}

				;
				; LSR
				;

				define <vscale x 16 x i8> @lsr_i8(<vscale x 16 x i1> %pg, <vscale x 16 x i8> %a, <vscale x 16 x i8> %b) {
				; CHECK-LABEL: lsr_i8:
				; CHECK: // %bb.0:
				; CHECK-NEXT: lsr z0.b, p0/m, z0.b, z1.b
				; CHECK-NEXT: ret
				%out = call <vscale x 16 x i8> @llvm.aarch64.sve.lsr.u.nxv16i8(<vscale x 16 x i1> %pg,
				<vscale x 16 x i8> %a,
				<vscale x 16 x i8> %b)
				ret <vscale x 16 x i8> %out
				}

				define <vscale x 8 x i16> @lsr_i16(<vscale x 8 x i1> %pg, <vscale x 8 x i16> %a, <vscale x 8 x i16> %b) {
				; CHECK-LABEL: lsr_i16:
				; CHECK: // %bb.0:
				; CHECK-NEXT: lsr z0.h, p0/m, z0.h, z1.h
				; CHECK-NEXT: ret
				%out = call <vscale x 8 x i16> @llvm.aarch64.sve.lsr.u.nxv8i16(<vscale x 8 x i1> %pg,
				<vscale x 8 x i16> %a,
				<vscale x 8 x i16> %b)
				ret <vscale x 8 x i16> %out
				}

				define <vscale x 4 x i32> @lsr_i32(<vscale x 4 x i1> %pg, <vscale x 4 x i32> %a, <vscale x 4 x i32> %b) {
				; CHECK-LABEL: lsr_i32:
				; CHECK: // %bb.0:
				; CHECK-NEXT: lsr z0.s, p0/m, z0.s, z1.s
				; CHECK-NEXT: ret
				%out = call <vscale x 4 x i32> @llvm.aarch64.sve.lsr.u.nxv4i32(<vscale x 4 x i1> %pg,
				<vscale x 4 x i32> %a,
				<vscale x 4 x i32> %b)
				ret <vscale x 4 x i32> %out
				}

				define <vscale x 2 x i64> @lsr_i64(<vscale x 2 x i1> %pg, <vscale x 2 x i64> %a, <vscale x 2 x i64> %b) {
				; CHECK-LABEL: lsr_i64:
				; CHECK: // %bb.0:
				; CHECK-NEXT: lsr z0.d, p0/m, z0.d, z1.d
				; CHECK-NEXT: ret
				%out = call <vscale x 2 x i64> @llvm.aarch64.sve.lsr.u.nxv2i64(<vscale x 2 x i1> %pg,
				<vscale x 2 x i64> %a,
				<vscale x 2 x i64> %b)
				ret <vscale x 2 x i64> %out
				}

				;
				; LSR (immediate)
				;

				define <vscale x 16 x i8> @lsr_imm_i8(<vscale x 16 x i1> %pg, <vscale x 16 x i8> %a) {
				; CHECK-LABEL: lsr_imm_i8:
				; CHECK: // %bb.0:
				; CHECK-NEXT: lsr z0.b, p0/m, z0.b, #8
				; CHECK-NEXT: ret
				%imm = insertelement <vscale x 16 x i8> undef, i8 8, i32 0
				%imm.splat = shufflevector <vscale x 16 x i8> %imm, <vscale x 16 x i8> undef, <vscale x 16 x i32> zeroinitializer
				%out = call <vscale x 16 x i8> @llvm.aarch64.sve.lsr.u.nxv16i8(<vscale x 16 x i1> %pg,
				<vscale x 16 x i8> %a,
				<vscale x 16 x i8> %imm.splat)
				ret <vscale x 16 x i8> %out
				}

				define <vscale x 8 x i16> @lsr_imm_i16(<vscale x 8 x i1> %pg, <vscale x 8 x i16> %a) {
				; CHECK-LABEL: lsr_imm_i16:
				; CHECK: // %bb.0:
				; CHECK-NEXT: lsr z0.h, p0/m, z0.h, #12
				; CHECK-NEXT: ret
				%imm = insertelement <vscale x 8 x i16> undef, i16 12, i32 0
				%imm.splat = shufflevector <vscale x 8 x i16> %imm, <vscale x 8 x i16> undef, <vscale x 8 x i32> zeroinitializer
				%out = call <vscale x 8 x i16> @llvm.aarch64.sve.lsr.u.nxv8i16(<vscale x 8 x i1> %pg,
				<vscale x 8 x i16> %a,
				<vscale x 8 x i16> %imm.splat)
				ret <vscale x 8 x i16> %out
				}

				define <vscale x 4 x i32> @lsr_imm_i32(<vscale x 4 x i1> %pg, <vscale x 4 x i32> %a) {
				; CHECK-LABEL: lsr_imm_i32:
				; CHECK: // %bb.0:
				; CHECK-NEXT: lsr z0.s, p0/m, z0.s, #13
				; CHECK-NEXT: ret
				%imm = insertelement <vscale x 4 x i32> undef, i32 13, i32 0
				%imm.splat = shufflevector <vscale x 4 x i32> %imm, <vscale x 4 x i32> undef, <vscale x 4 x i32> zeroinitializer
				%out = call <vscale x 4 x i32> @llvm.aarch64.sve.lsr.u.nxv4i32(<vscale x 4 x i1> %pg,
				<vscale x 4 x i32> %a,
				<vscale x 4 x i32> %imm.splat)
				ret <vscale x 4 x i32> %out
				}

				define <vscale x 2 x i64> @lsr_imm_i64(<vscale x 2 x i1> %pg, <vscale x 2 x i64> %a) {
				; CHECK-LABEL: lsr_imm_i64:
				; CHECK: // %bb.0:
				; CHECK-NEXT: lsr z0.d, p0/m, z0.d, #14
				; CHECK-NEXT: ret
				%imm = insertelement <vscale x 2 x i64> undef, i64 14, i32 0
				%imm.splat = shufflevector <vscale x 2 x i64> %imm, <vscale x 2 x i64> undef, <vscale x 2 x i32> zeroinitializer
				%out = call <vscale x 2 x i64> @llvm.aarch64.sve.lsr.u.nxv2i64(<vscale x 2 x i1> %pg,
				<vscale x 2 x i64> %a,
				<vscale x 2 x i64> %imm.splat)
				ret <vscale x 2 x i64> %out
				}

				declare <vscale x 16 x i8> @llvm.aarch64.sve.asr.u.nxv16i8(<vscale x 16 x i1>, <vscale x 16 x i8>, <vscale x 16 x i8>)
				declare <vscale x 8 x i16> @llvm.aarch64.sve.asr.u.nxv8i16(<vscale x 8 x i1>, <vscale x 8 x i16>, <vscale x 8 x i16>)
				declare <vscale x 4 x i32> @llvm.aarch64.sve.asr.u.nxv4i32(<vscale x 4 x i1>, <vscale x 4 x i32>, <vscale x 4 x i32>)
				declare <vscale x 2 x i64> @llvm.aarch64.sve.asr.u.nxv2i64(<vscale x 2 x i1>, <vscale x 2 x i64>, <vscale x 2 x i64>)

				declare <vscale x 16 x i8> @llvm.aarch64.sve.lsl.u.nxv16i8(<vscale x 16 x i1>, <vscale x 16 x i8>, <vscale x 16 x i8>)
				declare <vscale x 8 x i16> @llvm.aarch64.sve.lsl.u.nxv8i16(<vscale x 8 x i1>, <vscale x 8 x i16>, <vscale x 8 x i16>)
				declare <vscale x 4 x i32> @llvm.aarch64.sve.lsl.u.nxv4i32(<vscale x 4 x i1>, <vscale x 4 x i32>, <vscale x 4 x i32>)
				declare <vscale x 2 x i64> @llvm.aarch64.sve.lsl.u.nxv2i64(<vscale x 2 x i1>, <vscale x 2 x i64>, <vscale x 2 x i64>)

				declare <vscale x 16 x i8> @llvm.aarch64.sve.lsr.u.nxv16i8(<vscale x 16 x i1>, <vscale x 16 x i8>, <vscale x 16 x i8>)
				declare <vscale x 8 x i16> @llvm.aarch64.sve.lsr.u.nxv8i16(<vscale x 8 x i1>, <vscale x 8 x i16>, <vscale x 8 x i16>)
				declare <vscale x 4 x i32> @llvm.aarch64.sve.lsr.u.nxv4i32(<vscale x 4 x i1>, <vscale x 4 x i32>, <vscale x 4 x i32>)
				declare <vscale x 2 x i64> @llvm.aarch64.sve.lsr.u.nxv2i64(<vscale x 2 x i1>, <vscale x 2 x i64>, <vscale x 2 x i64>)

llvm/test/CodeGen/AArch64/sve2-sra.ll

Show First 20 Lines • Show All 99 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%pg = call <vscale x 2 x i1> @llvm.aarch64.sve.ptrue.nxv2i1(i32 31)		%pg = call <vscale x 2 x i1> @llvm.aarch64.sve.ptrue.nxv2i1(i32 31)
%ins = insertelement <vscale x 2 x i64> poison, i64 4, i32 0		%ins = insertelement <vscale x 2 x i64> poison, i64 4, i32 0
%splat = shufflevector <vscale x 2 x i64> %ins, <vscale x 2 x i64> poison, <vscale x 2 x i32> zeroinitializer		%splat = shufflevector <vscale x 2 x i64> %ins, <vscale x 2 x i64> poison, <vscale x 2 x i32> zeroinitializer
%shift = call <vscale x 2 x i64> @llvm.aarch64.sve.lsr.nxv2i64(<vscale x 2 x i1> %pg, <vscale x 2 x i64> %b, <vscale x 2 x i64> %splat)		%shift = call <vscale x 2 x i64> @llvm.aarch64.sve.lsr.nxv2i64(<vscale x 2 x i1> %pg, <vscale x 2 x i64> %b, <vscale x 2 x i64> %splat)
%add = add <vscale x 2 x i64> %a, %shift		%add = add <vscale x 2 x i64> %a, %shift
ret <vscale x 2 x i64> %add		ret <vscale x 2 x i64> %add
}		}

		define <vscale x 16 x i8> @usra_intr_u_i8(<vscale x 16 x i1> %pg, <vscale x 16 x i8> %a, <vscale x 16 x i8> %b) #0 {
		; CHECK-LABEL: usra_intr_u_i8:
		; CHECK: // %bb.0:
		; CHECK-NEXT: lsr z1.b, p0/m, z1.b, #1
		; CHECK-NEXT: add z0.b, z0.b, z1.b
		; CHECK-NEXT: ret
		%ins = insertelement <vscale x 16 x i8> poison, i8 1, i32 0
		%splat = shufflevector <vscale x 16 x i8> %ins, <vscale x 16 x i8> poison, <vscale x 16 x i32> zeroinitializer
		%shift = call <vscale x 16 x i8> @llvm.aarch64.sve.lsr.u.nxv16i8(<vscale x 16 x i1> %pg, <vscale x 16 x i8> %b, <vscale x 16 x i8> %splat)
		%add = add <vscale x 16 x i8> %a, %shift
		ret <vscale x 16 x i8> %add
		}

		define <vscale x 8 x i16> @usra_intr_u_i16(<vscale x 8 x i1> %pg, <vscale x 8 x i16> %a, <vscale x 8 x i16> %b) #0 {
		; CHECK-LABEL: usra_intr_u_i16:
		; CHECK: // %bb.0:
		; CHECK-NEXT: lsr z1.h, p0/m, z1.h, #2
		; CHECK-NEXT: add z0.h, z0.h, z1.h
		; CHECK-NEXT: ret
		%ins = insertelement <vscale x 8 x i16> poison, i16 2, i32 0
		%splat = shufflevector <vscale x 8 x i16> %ins, <vscale x 8 x i16> poison, <vscale x 8 x i32> zeroinitializer
		%shift = call <vscale x 8 x i16> @llvm.aarch64.sve.lsr.u.nxv8i16(<vscale x 8 x i1> %pg, <vscale x 8 x i16> %b, <vscale x 8 x i16> %splat)
		%add = add <vscale x 8 x i16> %a, %shift
		ret <vscale x 8 x i16> %add
		}

		define <vscale x 4 x i32> @usra_intr_u_i32(<vscale x 4 x i1> %pg, <vscale x 4 x i32> %a, <vscale x 4 x i32> %b) #0 {
		; CHECK-LABEL: usra_intr_u_i32:
		; CHECK: // %bb.0:
		; CHECK-NEXT: lsr z1.s, p0/m, z1.s, #3
		; CHECK-NEXT: add z0.s, z0.s, z1.s
		; CHECK-NEXT: ret
		%ins = insertelement <vscale x 4 x i32> poison, i32 3, i32 0
		%splat = shufflevector <vscale x 4 x i32> %ins, <vscale x 4 x i32> poison, <vscale x 4 x i32> zeroinitializer
		%shift = call <vscale x 4 x i32> @llvm.aarch64.sve.lsr.u.nxv4i32(<vscale x 4 x i1> %pg, <vscale x 4 x i32> %b, <vscale x 4 x i32> %splat)
		%add = add <vscale x 4 x i32> %a, %shift
		ret <vscale x 4 x i32> %add
		}

		define <vscale x 2 x i64> @usra_intr_u_i64(<vscale x 2 x i1> %pg, <vscale x 2 x i64> %a, <vscale x 2 x i64> %b) #0 {
		; CHECK-LABEL: usra_intr_u_i64:
		; CHECK: // %bb.0:
		; CHECK-NEXT: lsr z1.d, p0/m, z1.d, #4
		; CHECK-NEXT: add z0.d, z0.d, z1.d
		; CHECK-NEXT: ret
		%ins = insertelement <vscale x 2 x i64> poison, i64 4, i32 0
		%splat = shufflevector <vscale x 2 x i64> %ins, <vscale x 2 x i64> poison, <vscale x 2 x i32> zeroinitializer
		%shift = call <vscale x 2 x i64> @llvm.aarch64.sve.lsr.u.nxv2i64(<vscale x 2 x i1> %pg, <vscale x 2 x i64> %b, <vscale x 2 x i64> %splat)
		%add = add <vscale x 2 x i64> %a, %shift
		ret <vscale x 2 x i64> %add
		}

; SSRA		; SSRA

define <vscale x 16 x i8> @ssra_i8(<vscale x 16 x i8> %a, <vscale x 16 x i8> %b) #0 {		define <vscale x 16 x i8> @ssra_i8(<vscale x 16 x i8> %a, <vscale x 16 x i8> %b) #0 {
; CHECK-LABEL: ssra_i8:		; CHECK-LABEL: ssra_i8:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: ssra z0.b, z1.b, #1		; CHECK-NEXT: ssra z0.b, z1.b, #1
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%ins = insertelement <vscale x 16 x i8> poison, i8 1, i32 0		%ins = insertelement <vscale x 16 x i8> poison, i8 1, i32 0
▲ Show 20 Lines • Show All 86 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%pg = call <vscale x 2 x i1> @llvm.aarch64.sve.ptrue.nxv2i1(i32 31)		%pg = call <vscale x 2 x i1> @llvm.aarch64.sve.ptrue.nxv2i1(i32 31)
%ins = insertelement <vscale x 2 x i64> poison, i64 4, i32 0		%ins = insertelement <vscale x 2 x i64> poison, i64 4, i32 0
%splat = shufflevector <vscale x 2 x i64> %ins, <vscale x 2 x i64> poison, <vscale x 2 x i32> zeroinitializer		%splat = shufflevector <vscale x 2 x i64> %ins, <vscale x 2 x i64> poison, <vscale x 2 x i32> zeroinitializer
%shift = call <vscale x 2 x i64> @llvm.aarch64.sve.asr.nxv2i64(<vscale x 2 x i1> %pg, <vscale x 2 x i64> %b, <vscale x 2 x i64> %splat)		%shift = call <vscale x 2 x i64> @llvm.aarch64.sve.asr.nxv2i64(<vscale x 2 x i1> %pg, <vscale x 2 x i64> %b, <vscale x 2 x i64> %splat)
%add = add <vscale x 2 x i64> %a, %shift		%add = add <vscale x 2 x i64> %a, %shift
ret <vscale x 2 x i64> %add		ret <vscale x 2 x i64> %add
}		}

		define <vscale x 16 x i8> @ssra_intr_u_i8(<vscale x 16 x i1> %pg, <vscale x 16 x i8> %a, <vscale x 16 x i8> %b) #0 {
		; CHECK-LABEL: ssra_intr_u_i8:
		; CHECK: // %bb.0:
		; CHECK-NEXT: asr z1.b, p0/m, z1.b, #1
		; CHECK-NEXT: add z0.b, z0.b, z1.b
		; CHECK-NEXT: ret
		%ins = insertelement <vscale x 16 x i8> poison, i8 1, i32 0
		%splat = shufflevector <vscale x 16 x i8> %ins, <vscale x 16 x i8> poison, <vscale x 16 x i32> zeroinitializer
		%shift = call <vscale x 16 x i8> @llvm.aarch64.sve.asr.u.nxv16i8(<vscale x 16 x i1> %pg, <vscale x 16 x i8> %b, <vscale x 16 x i8> %splat)
		%add = add <vscale x 16 x i8> %a, %shift
		ret <vscale x 16 x i8> %add
		}

		define <vscale x 8 x i16> @ssra_intr_u_i16(<vscale x 8 x i1> %pg, <vscale x 8 x i16> %a, <vscale x 8 x i16> %b) #0 {
		; CHECK-LABEL: ssra_intr_u_i16:
		; CHECK: // %bb.0:
		; CHECK-NEXT: asr z1.h, p0/m, z1.h, #2
		; CHECK-NEXT: add z0.h, z0.h, z1.h
		; CHECK-NEXT: ret
		%ins = insertelement <vscale x 8 x i16> poison, i16 2, i32 0
		%splat = shufflevector <vscale x 8 x i16> %ins, <vscale x 8 x i16> poison, <vscale x 8 x i32> zeroinitializer
		%shift = call <vscale x 8 x i16> @llvm.aarch64.sve.asr.u.nxv8i16(<vscale x 8 x i1> %pg, <vscale x 8 x i16> %b, <vscale x 8 x i16> %splat)
		%add = add <vscale x 8 x i16> %a, %shift
		ret <vscale x 8 x i16> %add
		}

		define <vscale x 4 x i32> @ssra_intr_u_i32(<vscale x 4 x i1> %pg, <vscale x 4 x i32> %a, <vscale x 4 x i32> %b) #0 {
		; CHECK-LABEL: ssra_intr_u_i32:
		; CHECK: // %bb.0:
		; CHECK-NEXT: asr z1.s, p0/m, z1.s, #3
		; CHECK-NEXT: add z0.s, z0.s, z1.s
		; CHECK-NEXT: ret
		%ins = insertelement <vscale x 4 x i32> poison, i32 3, i32 0
		%splat = shufflevector <vscale x 4 x i32> %ins, <vscale x 4 x i32> poison, <vscale x 4 x i32> zeroinitializer
		%shift = call <vscale x 4 x i32> @llvm.aarch64.sve.asr.u.nxv4i32(<vscale x 4 x i1> %pg, <vscale x 4 x i32> %b, <vscale x 4 x i32> %splat)
		%add = add <vscale x 4 x i32> %a, %shift
		ret <vscale x 4 x i32> %add
		}

		define <vscale x 2 x i64> @ssra_intr_u_i64(<vscale x 2 x i1> %pg, <vscale x 2 x i64> %a, <vscale x 2 x i64> %b) #0 {
		; CHECK-LABEL: ssra_intr_u_i64:
		; CHECK: // %bb.0:
		; CHECK-NEXT: asr z1.d, p0/m, z1.d, #4
		; CHECK-NEXT: add z0.d, z0.d, z1.d
		; CHECK-NEXT: ret
		%ins = insertelement <vscale x 2 x i64> poison, i64 4, i32 0
		%splat = shufflevector <vscale x 2 x i64> %ins, <vscale x 2 x i64> poison, <vscale x 2 x i32> zeroinitializer
		%shift = call <vscale x 2 x i64> @llvm.aarch64.sve.asr.u.nxv2i64(<vscale x 2 x i1> %pg, <vscale x 2 x i64> %b, <vscale x 2 x i64> %splat)
		%add = add <vscale x 2 x i64> %a, %shift
		ret <vscale x 2 x i64> %add
		}

declare <vscale x 16 x i1> @llvm.aarch64.sve.ptrue.nxv16i1(i32 immarg)		declare <vscale x 16 x i1> @llvm.aarch64.sve.ptrue.nxv16i1(i32 immarg)
declare <vscale x 8 x i1> @llvm.aarch64.sve.ptrue.nxv8i1(i32 immarg)		declare <vscale x 8 x i1> @llvm.aarch64.sve.ptrue.nxv8i1(i32 immarg)
declare <vscale x 4 x i1> @llvm.aarch64.sve.ptrue.nxv4i1(i32 immarg)		declare <vscale x 4 x i1> @llvm.aarch64.sve.ptrue.nxv4i1(i32 immarg)
declare <vscale x 2 x i1> @llvm.aarch64.sve.ptrue.nxv2i1(i32 immarg)		declare <vscale x 2 x i1> @llvm.aarch64.sve.ptrue.nxv2i1(i32 immarg)

declare <vscale x 16 x i8> @llvm.aarch64.sve.lsr.nxv16i8(<vscale x 16 x i1>, <vscale x 16 x i8>, <vscale x 16 x i8>)		declare <vscale x 16 x i8> @llvm.aarch64.sve.lsr.nxv16i8(<vscale x 16 x i1>, <vscale x 16 x i8>, <vscale x 16 x i8>)
declare <vscale x 8 x i16> @llvm.aarch64.sve.lsr.nxv8i16(<vscale x 8 x i1>, <vscale x 8 x i16>, <vscale x 8 x i16>)		declare <vscale x 8 x i16> @llvm.aarch64.sve.lsr.nxv8i16(<vscale x 8 x i1>, <vscale x 8 x i16>, <vscale x 8 x i16>)
declare <vscale x 4 x i32> @llvm.aarch64.sve.lsr.nxv4i32(<vscale x 4 x i1>, <vscale x 4 x i32>, <vscale x 4 x i32>)		declare <vscale x 4 x i32> @llvm.aarch64.sve.lsr.nxv4i32(<vscale x 4 x i1>, <vscale x 4 x i32>, <vscale x 4 x i32>)
declare <vscale x 2 x i64> @llvm.aarch64.sve.lsr.nxv2i64(<vscale x 2 x i1>, <vscale x 2 x i64>, <vscale x 2 x i64>)		declare <vscale x 2 x i64> @llvm.aarch64.sve.lsr.nxv2i64(<vscale x 2 x i1>, <vscale x 2 x i64>, <vscale x 2 x i64>)

		declare <vscale x 16 x i8> @llvm.aarch64.sve.lsr.u.nxv16i8(<vscale x 16 x i1>, <vscale x 16 x i8>, <vscale x 16 x i8>)
		declare <vscale x 8 x i16> @llvm.aarch64.sve.lsr.u.nxv8i16(<vscale x 8 x i1>, <vscale x 8 x i16>, <vscale x 8 x i16>)
		declare <vscale x 4 x i32> @llvm.aarch64.sve.lsr.u.nxv4i32(<vscale x 4 x i1>, <vscale x 4 x i32>, <vscale x 4 x i32>)
		declare <vscale x 2 x i64> @llvm.aarch64.sve.lsr.u.nxv2i64(<vscale x 2 x i1>, <vscale x 2 x i64>, <vscale x 2 x i64>)

declare <vscale x 16 x i8> @llvm.aarch64.sve.asr.nxv16i8(<vscale x 16 x i1>, <vscale x 16 x i8>, <vscale x 16 x i8>)		declare <vscale x 16 x i8> @llvm.aarch64.sve.asr.nxv16i8(<vscale x 16 x i1>, <vscale x 16 x i8>, <vscale x 16 x i8>)
declare <vscale x 8 x i16> @llvm.aarch64.sve.asr.nxv8i16(<vscale x 8 x i1>, <vscale x 8 x i16>, <vscale x 8 x i16>)		declare <vscale x 8 x i16> @llvm.aarch64.sve.asr.nxv8i16(<vscale x 8 x i1>, <vscale x 8 x i16>, <vscale x 8 x i16>)
declare <vscale x 4 x i32> @llvm.aarch64.sve.asr.nxv4i32(<vscale x 4 x i1>, <vscale x 4 x i32>, <vscale x 4 x i32>)		declare <vscale x 4 x i32> @llvm.aarch64.sve.asr.nxv4i32(<vscale x 4 x i1>, <vscale x 4 x i32>, <vscale x 4 x i32>)
declare <vscale x 2 x i64> @llvm.aarch64.sve.asr.nxv2i64(<vscale x 2 x i1>, <vscale x 2 x i64>, <vscale x 2 x i64>)		declare <vscale x 2 x i64> @llvm.aarch64.sve.asr.nxv2i64(<vscale x 2 x i1>, <vscale x 2 x i64>, <vscale x 2 x i64>)

		declare <vscale x 16 x i8> @llvm.aarch64.sve.asr.u.nxv16i8(<vscale x 16 x i1>, <vscale x 16 x i8>, <vscale x 16 x i8>)
		declare <vscale x 8 x i16> @llvm.aarch64.sve.asr.u.nxv8i16(<vscale x 8 x i1>, <vscale x 8 x i16>, <vscale x 8 x i16>)
		declare <vscale x 4 x i32> @llvm.aarch64.sve.asr.u.nxv4i32(<vscale x 4 x i1>, <vscale x 4 x i32>, <vscale x 4 x i32>)
		declare <vscale x 2 x i64> @llvm.aarch64.sve.asr.u.nxv2i64(<vscale x 2 x i1>, <vscale x 2 x i64>, <vscale x 2 x i64>)

attributes #0 = { "target-features"="+sve,+sve2" }		attributes #0 = { "target-features"="+sve,+sve2" }