This is an archive of the discontinued LLVM Phabricator instance.

Paths

Table of Contentst

-
clang/
-
include/clang/Basic/
-
clang/
-
Basic/
-
arm_sve.td
-
test/CodeGen/aarch64-sve-intrinsics/
-
CodeGen/
-
aarch64-sve-intrinsics/
-
acle_sve_rev.c
-
acle_sve_trn1.c
-
acle_sve_trn2.c
-
acle_sve_uzp1.c
-
acle_sve_uzp2.c
-
acle_sve_zip1.c
-
acle_sve_zip2.c
-
llvm/
-
include/llvm/IR/
-
llvm/
-
IR/
-
IntrinsicsAArch64.td
-
lib/Target/AArch64/
-
Target/
-
AArch64/
-
AArch64SVEInstrInfo.td
1/2
SVEInstrFormats.td
-
test/CodeGen/AArch64/
-
CodeGen/
-
AArch64/
-
sve-intrinsics-perm-select.ll

Differential D142065

[SVE] Fix incorrect lowering of predicate permute builtins.
ClosedPublic

Authored by paulwalker-arm on Jan 18 2023, 4:36 PM.

Download Raw Diff

Details

Reviewers

efriedma
david-arm
CarolineConcatto
peterwaller-arm

Commits

rG26b79ca3fafc: [SVE] Fix incorrect lowering of predicate permute builtins.

Summary

When lowering predicate permute builtins we incorrectly assume only
the typically "active" bits for the specified element type play a
role with all other bits zero'd. This is not the case because all
bits are significant, with the element type specifying how they
are grouped:

b8  - permute using a block size of 1 bit
b16 - permute using a block size of 2 bits
b32 - permute using a block size of 4 bits
b64 - permute using a block size of 8 bits

The affected builtins are svrev, svtrn1, svtrn2, svuzp1, svuzp2,
svzip1 and svzip2.

This patch adds new intrinsics to support these operations and
changes the builtin lowering code to emit them. The b8 case remains
unchanged because for that operation the existing intrinsics work
as required and their support for other predicate types has been
maintained as useful if only as a way to test the correctness of
their matching ISD nodes that code generation relies on.

Diff Detail

Repository: rG LLVM Github Monorepo

Event Timeline

paulwalker-arm created this revision.Jan 18 2023, 4:36 PM

Herald added a reviewer: efriedma. · View Herald TranscriptJan 18 2023, 4:36 PM

Herald added a project: Restricted Project. · View Herald Transcript

Herald added subscribers: psnobl, hiraditya, tschuett. · View Herald Transcript

paulwalker-arm requested review of this revision.Jan 18 2023, 4:36 PM

Herald added projects: Restricted Project, Restricted Project. · View Herald TranscriptJan 18 2023, 4:36 PM

Herald added subscribers: llvm-commits, cfe-commits. · View Herald Transcript

This is bug fix based on something spotted when reviewing D141469.

Harbormaster completed remote builds in B208625: Diff 490332.Jan 18 2023, 5:58 PM

dewen added a subscriber: dewen.Jan 19 2023, 7:31 PM

Matt added a subscriber: Matt.Jan 19 2023, 10:09 PM

peterwaller-arm added inline comments.Jan 24 2023, 7:41 AM

llvm/lib/Target/AArch64/SVEInstrFormats.td
6540	Out of interest, is there a good reason to handle the nxv16 pattern case differently in the `I` multiclass args? Written this way at a glance it looks like it is missing.

paulwalker-arm added inline comments.Jan 24 2023, 4:19 PM

llvm/lib/Target/AArch64/SVEInstrFormats.td
6540	My reasoning was the pattern within the instruction class is mandatory for the correct clang builtin support so I figured that should take priority. That means extra patterns are only required for the unpacked cases, which are optional based on them having value during code generation.

peterwaller-arm accepted this revision.Jan 25 2023, 6:30 AM

This revision is now accepted and ready to land.Jan 25 2023, 6:30 AM

This revision was landed with ongoing or failed builds.Jan 26 2023, 4:22 AM

Closed by commit rG26b79ca3fafc: [SVE] Fix incorrect lowering of predicate permute builtins. (authored by paulwalker-arm). · Explain Why

This revision was automatically updated to reflect the committed changes.

paulwalker-arm added a commit: rG26b79ca3fafc: [SVE] Fix incorrect lowering of predicate permute builtins..

Revision Contents

Path

Size

clang/

include/

clang/

Basic/

arm_sve.td

41 lines

test/

CodeGen/

aarch64-sve-intrinsics/

36 lines

42 lines

42 lines

42 lines

42 lines

42 lines

42 lines

llvm/

include/

llvm/

IR/

IntrinsicsAArch64.td

31 lines

lib/

Target/

AArch64/

AArch64SVEInstrInfo.td

14 lines

SVEInstrFormats.td

52 lines

test/

CodeGen/

AArch64/

sve-intrinsics-perm-select.ll

349 lines

Diff 492387

clang/include/clang/Basic/arm_sve.td

	Show First 20 Lines • Show All 1,243 Lines • ▼ Show 20 Lines
	def SVTRN1_BF16 : SInst<"svtrn1[_{d}]", "ddd", "b", MergeNone, "aarch64_sve_trn1">;			def SVTRN1_BF16 : SInst<"svtrn1[_{d}]", "ddd", "b", MergeNone, "aarch64_sve_trn1">;
	def SVTRN2_BF16 : SInst<"svtrn2[_{d}]", "ddd", "b", MergeNone, "aarch64_sve_trn2">;			def SVTRN2_BF16 : SInst<"svtrn2[_{d}]", "ddd", "b", MergeNone, "aarch64_sve_trn2">;
	def SVUZP1_BF16 : SInst<"svuzp1[_{d}]", "ddd", "b", MergeNone, "aarch64_sve_uzp1">;			def SVUZP1_BF16 : SInst<"svuzp1[_{d}]", "ddd", "b", MergeNone, "aarch64_sve_uzp1">;
	def SVUZP2_BF16 : SInst<"svuzp2[_{d}]", "ddd", "b", MergeNone, "aarch64_sve_uzp2">;			def SVUZP2_BF16 : SInst<"svuzp2[_{d}]", "ddd", "b", MergeNone, "aarch64_sve_uzp2">;
	def SVZIP1_BF16 : SInst<"svzip1[_{d}]", "ddd", "b", MergeNone, "aarch64_sve_zip1">;			def SVZIP1_BF16 : SInst<"svzip1[_{d}]", "ddd", "b", MergeNone, "aarch64_sve_zip1">;
	def SVZIP2_BF16 : SInst<"svzip2[_{d}]", "ddd", "b", MergeNone, "aarch64_sve_zip2">;			def SVZIP2_BF16 : SInst<"svzip2[_{d}]", "ddd", "b", MergeNone, "aarch64_sve_zip2">;
	}			}

	def SVREV_B : SInst<"svrev_{d}", "PP", "PcPsPiPl", MergeNone, "aarch64_sve_rev">;			def SVREV_B8 : SInst<"svrev_b8", "PP", "Pc", MergeNone, "aarch64_sve_rev">;
				def SVREV_B16 : SInst<"svrev_b16", "PP", "Pc", MergeNone, "aarch64_sve_rev_b16", [IsOverloadNone]>;
				def SVREV_B32 : SInst<"svrev_b32", "PP", "Pc", MergeNone, "aarch64_sve_rev_b32", [IsOverloadNone]>;
				def SVREV_B64 : SInst<"svrev_b64", "PP", "Pc", MergeNone, "aarch64_sve_rev_b64", [IsOverloadNone]>;
	def SVSEL_B : SInst<"svsel[_b]", "PPPP", "Pc", MergeNone, "aarch64_sve_sel">;			def SVSEL_B : SInst<"svsel[_b]", "PPPP", "Pc", MergeNone, "aarch64_sve_sel">;
	def SVTRN1_B : SInst<"svtrn1_{d}", "PPP", "PcPsPiPl", MergeNone, "aarch64_sve_trn1">;			def SVTRN1_B8 : SInst<"svtrn1_b8", "PPP", "Pc", MergeNone, "aarch64_sve_trn1">;
	def SVTRN2_B : SInst<"svtrn2_{d}", "PPP", "PcPsPiPl", MergeNone, "aarch64_sve_trn2">;			def SVTRN1_B16 : SInst<"svtrn1_b16", "PPP", "Pc", MergeNone, "aarch64_sve_trn1_b16", [IsOverloadNone]>;
				def SVTRN1_B32 : SInst<"svtrn1_b32", "PPP", "Pc", MergeNone, "aarch64_sve_trn1_b32", [IsOverloadNone]>;
				def SVTRN1_B64 : SInst<"svtrn1_b64", "PPP", "Pc", MergeNone, "aarch64_sve_trn1_b64", [IsOverloadNone]>;
				def SVTRN2_B8 : SInst<"svtrn2_b8", "PPP", "Pc", MergeNone, "aarch64_sve_trn2">;
				def SVTRN2_B16 : SInst<"svtrn2_b16", "PPP", "Pc", MergeNone, "aarch64_sve_trn2_b16", [IsOverloadNone]>;
				def SVTRN2_B32 : SInst<"svtrn2_b32", "PPP", "Pc", MergeNone, "aarch64_sve_trn2_b32", [IsOverloadNone]>;
				def SVTRN2_B64 : SInst<"svtrn2_b64", "PPP", "Pc", MergeNone, "aarch64_sve_trn2_b64", [IsOverloadNone]>;
	def SVPUNPKHI : SInst<"svunpkhi[_b]", "PP", "Pc", MergeNone, "aarch64_sve_punpkhi">;			def SVPUNPKHI : SInst<"svunpkhi[_b]", "PP", "Pc", MergeNone, "aarch64_sve_punpkhi">;
	def SVPUNPKLO : SInst<"svunpklo[_b]", "PP", "Pc", MergeNone, "aarch64_sve_punpklo">;			def SVPUNPKLO : SInst<"svunpklo[_b]", "PP", "Pc", MergeNone, "aarch64_sve_punpklo">;
	def SVUZP1_B : SInst<"svuzp1_{d}", "PPP", "PcPsPiPl", MergeNone, "aarch64_sve_uzp1">;			def SVUZP1_B8 : SInst<"svuzp1_b8", "PPP", "Pc", MergeNone, "aarch64_sve_uzp1">;
	def SVUZP2_B : SInst<"svuzp2_{d}", "PPP", "PcPsPiPl", MergeNone, "aarch64_sve_uzp2">;			def SVUZP1_B16 : SInst<"svuzp1_b16", "PPP", "Pc", MergeNone, "aarch64_sve_uzp1_b16", [IsOverloadNone]>;
	def SVZIP1_B : SInst<"svzip1_{d}", "PPP", "PcPsPiPl", MergeNone, "aarch64_sve_zip1">;			def SVUZP1_B32 : SInst<"svuzp1_b32", "PPP", "Pc", MergeNone, "aarch64_sve_uzp1_b32", [IsOverloadNone]>;
	def SVZIP2_B : SInst<"svzip2_{d}", "PPP", "PcPsPiPl", MergeNone, "aarch64_sve_zip2">;			def SVUZP1_B64 : SInst<"svuzp1_b64", "PPP", "Pc", MergeNone, "aarch64_sve_uzp1_b64", [IsOverloadNone]>;
				def SVUZP2_B8 : SInst<"svuzp2_b8", "PPP", "Pc", MergeNone, "aarch64_sve_uzp2">;
				def SVUZP2_B16 : SInst<"svuzp2_b16", "PPP", "Pc", MergeNone, "aarch64_sve_uzp2_b16", [IsOverloadNone]>;
				def SVUZP2_B32 : SInst<"svuzp2_b32", "PPP", "Pc", MergeNone, "aarch64_sve_uzp2_b32", [IsOverloadNone]>;
				def SVUZP2_B64 : SInst<"svuzp2_b64", "PPP", "Pc", MergeNone, "aarch64_sve_uzp2_b64", [IsOverloadNone]>;
				def SVZIP1_B8 : SInst<"svzip1_b8", "PPP", "Pc", MergeNone, "aarch64_sve_zip1">;
				def SVZIP1_B16 : SInst<"svzip1_b16", "PPP", "Pc", MergeNone, "aarch64_sve_zip1_b16", [IsOverloadNone]>;
				def SVZIP1_B32 : SInst<"svzip1_b32", "PPP", "Pc", MergeNone, "aarch64_sve_zip1_b32", [IsOverloadNone]>;
				def SVZIP1_B64 : SInst<"svzip1_b64", "PPP", "Pc", MergeNone, "aarch64_sve_zip1_b64", [IsOverloadNone]>;
				def SVZIP2_B : SInst<"svzip2_b8", "PPP", "Pc", MergeNone, "aarch64_sve_zip2">;
				def SVZIP2_B16 : SInst<"svzip2_b16", "PPP", "Pc", MergeNone, "aarch64_sve_zip2_b16", [IsOverloadNone]>;
				def SVZIP2_B32 : SInst<"svzip2_b32", "PPP", "Pc", MergeNone, "aarch64_sve_zip2_b32", [IsOverloadNone]>;
				def SVZIP2_B64 : SInst<"svzip2_b64", "PPP", "Pc", MergeNone, "aarch64_sve_zip2_b64", [IsOverloadNone]>;

	////////////////////////////////////////////////////////////////////////////////			////////////////////////////////////////////////////////////////////////////////
	// Predicate creation			// Predicate creation

	def SVPFALSE : SInst<"svpfalse[_b]", "Pv", "", MergeNone, "", [IsOverloadNone]>;			def SVPFALSE : SInst<"svpfalse[_b]", "Pv", "", MergeNone, "", [IsOverloadNone]>;

	def SVPTRUE_PAT : SInst<"svptrue_pat_{d}", "PI", "PcPsPiPl", MergeNone, "aarch64_sve_ptrue">;			def SVPTRUE_PAT : SInst<"svptrue_pat_{d}", "PI", "PcPsPiPl", MergeNone, "aarch64_sve_ptrue">;
	def SVPTRUE : SInst<"svptrue_{d}", "Pv", "PcPsPiPl", MergeNone, "aarch64_sve_ptrue", [IsAppendSVALL]>;			def SVPTRUE : SInst<"svptrue_{d}", "Pv", "PcPsPiPl", MergeNone, "aarch64_sve_ptrue", [IsAppendSVALL]>;
	▲ Show 20 Lines • Show All 814 Lines • Show Last 20 Lines

clang/test/CodeGen/aarch64-sve-intrinsics/acle_sve_rev.c

	Show First 20 Lines • Show All 190 Lines • ▼ Show 20 Lines
	//			//
	svbool_t test_svrev_b8(svbool_t op)			svbool_t test_svrev_b8(svbool_t op)
	{			{
	return svrev_b8(op);			return svrev_b8(op);
	}			}

	// CHECK-LABEL: @test_svrev_b16(			// CHECK-LABEL: @test_svrev_b16(
	// CHECK-NEXT: entry:			// CHECK-NEXT: entry:
	// CHECK-NEXT: [[TMP0:%.]] = tail call <vscale x 8 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv8i1(<vscale x 16 x i1> [[OP:%.]])			// CHECK-NEXT: [[TMP0:%.]] = tail call <vscale x 16 x i1> @llvm.aarch64.sve.rev.b16(<vscale x 16 x i1> [[OP:%.]])
	// CHECK-NEXT: [[TMP1:%.*]] = tail call <vscale x 8 x i1> @llvm.aarch64.sve.rev.nxv8i1(<vscale x 8 x i1> [[TMP0]])			// CHECK-NEXT: ret <vscale x 16 x i1> [[TMP0]]
	// CHECK-NEXT: [[TMP2:%.*]] = tail call <vscale x 16 x i1> @llvm.aarch64.sve.convert.to.svbool.nxv8i1(<vscale x 8 x i1> [[TMP1]])
	// CHECK-NEXT: ret <vscale x 16 x i1> [[TMP2]]
	//			//
	// CPP-CHECK-LABEL: @_Z14test_svrev_b16u10__SVBool_t(			// CPP-CHECK-LABEL: @_Z14test_svrev_b16u10__SVBool_t(
	// CPP-CHECK-NEXT: entry:			// CPP-CHECK-NEXT: entry:
	// CPP-CHECK-NEXT: [[TMP0:%.]] = tail call <vscale x 8 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv8i1(<vscale x 16 x i1> [[OP:%.]])			// CPP-CHECK-NEXT: [[TMP0:%.]] = tail call <vscale x 16 x i1> @llvm.aarch64.sve.rev.b16(<vscale x 16 x i1> [[OP:%.]])
	// CPP-CHECK-NEXT: [[TMP1:%.*]] = tail call <vscale x 8 x i1> @llvm.aarch64.sve.rev.nxv8i1(<vscale x 8 x i1> [[TMP0]])			// CPP-CHECK-NEXT: ret <vscale x 16 x i1> [[TMP0]]
	// CPP-CHECK-NEXT: [[TMP2:%.*]] = tail call <vscale x 16 x i1> @llvm.aarch64.sve.convert.to.svbool.nxv8i1(<vscale x 8 x i1> [[TMP1]])
	// CPP-CHECK-NEXT: ret <vscale x 16 x i1> [[TMP2]]
	//			//
	svbool_t test_svrev_b16(svbool_t op)			svbool_t test_svrev_b16(svbool_t op)
	{			{
	return svrev_b16(op);			return svrev_b16(op);
	}			}

	// CHECK-LABEL: @test_svrev_b32(			// CHECK-LABEL: @test_svrev_b32(
	// CHECK-NEXT: entry:			// CHECK-NEXT: entry:
	// CHECK-NEXT: [[TMP0:%.]] = tail call <vscale x 4 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv4i1(<vscale x 16 x i1> [[OP:%.]])			// CHECK-NEXT: [[TMP0:%.]] = tail call <vscale x 16 x i1> @llvm.aarch64.sve.rev.b32(<vscale x 16 x i1> [[OP:%.]])
	// CHECK-NEXT: [[TMP1:%.*]] = tail call <vscale x 4 x i1> @llvm.aarch64.sve.rev.nxv4i1(<vscale x 4 x i1> [[TMP0]])			// CHECK-NEXT: ret <vscale x 16 x i1> [[TMP0]]
	// CHECK-NEXT: [[TMP2:%.*]] = tail call <vscale x 16 x i1> @llvm.aarch64.sve.convert.to.svbool.nxv4i1(<vscale x 4 x i1> [[TMP1]])
	// CHECK-NEXT: ret <vscale x 16 x i1> [[TMP2]]
	//			//
	// CPP-CHECK-LABEL: @_Z14test_svrev_b32u10__SVBool_t(			// CPP-CHECK-LABEL: @_Z14test_svrev_b32u10__SVBool_t(
	// CPP-CHECK-NEXT: entry:			// CPP-CHECK-NEXT: entry:
	// CPP-CHECK-NEXT: [[TMP0:%.]] = tail call <vscale x 4 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv4i1(<vscale x 16 x i1> [[OP:%.]])			// CPP-CHECK-NEXT: [[TMP0:%.]] = tail call <vscale x 16 x i1> @llvm.aarch64.sve.rev.b32(<vscale x 16 x i1> [[OP:%.]])
	// CPP-CHECK-NEXT: [[TMP1:%.*]] = tail call <vscale x 4 x i1> @llvm.aarch64.sve.rev.nxv4i1(<vscale x 4 x i1> [[TMP0]])			// CPP-CHECK-NEXT: ret <vscale x 16 x i1> [[TMP0]]
	// CPP-CHECK-NEXT: [[TMP2:%.*]] = tail call <vscale x 16 x i1> @llvm.aarch64.sve.convert.to.svbool.nxv4i1(<vscale x 4 x i1> [[TMP1]])
	// CPP-CHECK-NEXT: ret <vscale x 16 x i1> [[TMP2]]
	//			//
	svbool_t test_svrev_b32(svbool_t op)			svbool_t test_svrev_b32(svbool_t op)
	{			{
	return svrev_b32(op);			return svrev_b32(op);
	}			}

	// CHECK-LABEL: @test_svrev_b64(			// CHECK-LABEL: @test_svrev_b64(
	// CHECK-NEXT: entry:			// CHECK-NEXT: entry:
	// CHECK-NEXT: [[TMP0:%.]] = tail call <vscale x 2 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv2i1(<vscale x 16 x i1> [[OP:%.]])			// CHECK-NEXT: [[TMP0:%.]] = tail call <vscale x 16 x i1> @llvm.aarch64.sve.rev.b64(<vscale x 16 x i1> [[OP:%.]])
	// CHECK-NEXT: [[TMP1:%.*]] = tail call <vscale x 2 x i1> @llvm.aarch64.sve.rev.nxv2i1(<vscale x 2 x i1> [[TMP0]])			// CHECK-NEXT: ret <vscale x 16 x i1> [[TMP0]]
	// CHECK-NEXT: [[TMP2:%.*]] = tail call <vscale x 16 x i1> @llvm.aarch64.sve.convert.to.svbool.nxv2i1(<vscale x 2 x i1> [[TMP1]])
	// CHECK-NEXT: ret <vscale x 16 x i1> [[TMP2]]
	//			//
	// CPP-CHECK-LABEL: @_Z14test_svrev_b64u10__SVBool_t(			// CPP-CHECK-LABEL: @_Z14test_svrev_b64u10__SVBool_t(
	// CPP-CHECK-NEXT: entry:			// CPP-CHECK-NEXT: entry:
	// CPP-CHECK-NEXT: [[TMP0:%.]] = tail call <vscale x 2 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv2i1(<vscale x 16 x i1> [[OP:%.]])			// CPP-CHECK-NEXT: [[TMP0:%.]] = tail call <vscale x 16 x i1> @llvm.aarch64.sve.rev.b64(<vscale x 16 x i1> [[OP:%.]])
	// CPP-CHECK-NEXT: [[TMP1:%.*]] = tail call <vscale x 2 x i1> @llvm.aarch64.sve.rev.nxv2i1(<vscale x 2 x i1> [[TMP0]])			// CPP-CHECK-NEXT: ret <vscale x 16 x i1> [[TMP0]]
	// CPP-CHECK-NEXT: [[TMP2:%.*]] = tail call <vscale x 16 x i1> @llvm.aarch64.sve.convert.to.svbool.nxv2i1(<vscale x 2 x i1> [[TMP1]])
	// CPP-CHECK-NEXT: ret <vscale x 16 x i1> [[TMP2]]
	//			//
	svbool_t test_svrev_b64(svbool_t op)			svbool_t test_svrev_b64(svbool_t op)
	{			{
	return svrev_b64(op);			return svrev_b64(op);
	}			}

clang/test/CodeGen/aarch64-sve-intrinsics/acle_sve_trn1.c

	Show First 20 Lines • Show All 190 Lines • ▼ Show 20 Lines
	//			//
	svbool_t test_svtrn1_b8(svbool_t op1, svbool_t op2)			svbool_t test_svtrn1_b8(svbool_t op1, svbool_t op2)
	{			{
	return svtrn1_b8(op1, op2);			return svtrn1_b8(op1, op2);
	}			}

	// CHECK-LABEL: @test_svtrn1_b16(			// CHECK-LABEL: @test_svtrn1_b16(
	// CHECK-NEXT: entry:			// CHECK-NEXT: entry:
	// CHECK-NEXT: [[TMP0:%.]] = tail call <vscale x 8 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv8i1(<vscale x 16 x i1> [[OP1:%.]])			// CHECK-NEXT: [[TMP0:%.]] = tail call <vscale x 16 x i1> @llvm.aarch64.sve.trn1.b16(<vscale x 16 x i1> [[OP1:%.]], <vscale x 16 x i1> [[OP2:%.*]])
	// CHECK-NEXT: [[TMP1:%.]] = tail call <vscale x 8 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv8i1(<vscale x 16 x i1> [[OP2:%.]])			// CHECK-NEXT: ret <vscale x 16 x i1> [[TMP0]]
	// CHECK-NEXT: [[TMP2:%.*]] = tail call <vscale x 8 x i1> @llvm.aarch64.sve.trn1.nxv8i1(<vscale x 8 x i1> [[TMP0]], <vscale x 8 x i1> [[TMP1]])
	// CHECK-NEXT: [[TMP3:%.*]] = tail call <vscale x 16 x i1> @llvm.aarch64.sve.convert.to.svbool.nxv8i1(<vscale x 8 x i1> [[TMP2]])
	// CHECK-NEXT: ret <vscale x 16 x i1> [[TMP3]]
	//			//
	// CPP-CHECK-LABEL: @_Z15test_svtrn1_b16u10__SVBool_tu10__SVBool_t(			// CPP-CHECK-LABEL: @_Z15test_svtrn1_b16u10__SVBool_tu10__SVBool_t(
	// CPP-CHECK-NEXT: entry:			// CPP-CHECK-NEXT: entry:
	// CPP-CHECK-NEXT: [[TMP0:%.]] = tail call <vscale x 8 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv8i1(<vscale x 16 x i1> [[OP1:%.]])			// CPP-CHECK-NEXT: [[TMP0:%.]] = tail call <vscale x 16 x i1> @llvm.aarch64.sve.trn1.b16(<vscale x 16 x i1> [[OP1:%.]], <vscale x 16 x i1> [[OP2:%.*]])
	// CPP-CHECK-NEXT: [[TMP1:%.]] = tail call <vscale x 8 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv8i1(<vscale x 16 x i1> [[OP2:%.]])			// CPP-CHECK-NEXT: ret <vscale x 16 x i1> [[TMP0]]
	// CPP-CHECK-NEXT: [[TMP2:%.*]] = tail call <vscale x 8 x i1> @llvm.aarch64.sve.trn1.nxv8i1(<vscale x 8 x i1> [[TMP0]], <vscale x 8 x i1> [[TMP1]])
	// CPP-CHECK-NEXT: [[TMP3:%.*]] = tail call <vscale x 16 x i1> @llvm.aarch64.sve.convert.to.svbool.nxv8i1(<vscale x 8 x i1> [[TMP2]])
	// CPP-CHECK-NEXT: ret <vscale x 16 x i1> [[TMP3]]
	//			//
	svbool_t test_svtrn1_b16(svbool_t op1, svbool_t op2)			svbool_t test_svtrn1_b16(svbool_t op1, svbool_t op2)
	{			{
	return svtrn1_b16(op1, op2);			return svtrn1_b16(op1, op2);
	}			}

	// CHECK-LABEL: @test_svtrn1_b32(			// CHECK-LABEL: @test_svtrn1_b32(
	// CHECK-NEXT: entry:			// CHECK-NEXT: entry:
	// CHECK-NEXT: [[TMP0:%.]] = tail call <vscale x 4 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv4i1(<vscale x 16 x i1> [[OP1:%.]])			// CHECK-NEXT: [[TMP0:%.]] = tail call <vscale x 16 x i1> @llvm.aarch64.sve.trn1.b32(<vscale x 16 x i1> [[OP1:%.]], <vscale x 16 x i1> [[OP2:%.*]])
	// CHECK-NEXT: [[TMP1:%.]] = tail call <vscale x 4 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv4i1(<vscale x 16 x i1> [[OP2:%.]])			// CHECK-NEXT: ret <vscale x 16 x i1> [[TMP0]]
	// CHECK-NEXT: [[TMP2:%.*]] = tail call <vscale x 4 x i1> @llvm.aarch64.sve.trn1.nxv4i1(<vscale x 4 x i1> [[TMP0]], <vscale x 4 x i1> [[TMP1]])
	// CHECK-NEXT: [[TMP3:%.*]] = tail call <vscale x 16 x i1> @llvm.aarch64.sve.convert.to.svbool.nxv4i1(<vscale x 4 x i1> [[TMP2]])
	// CHECK-NEXT: ret <vscale x 16 x i1> [[TMP3]]
	//			//
	// CPP-CHECK-LABEL: @_Z15test_svtrn1_b32u10__SVBool_tu10__SVBool_t(			// CPP-CHECK-LABEL: @_Z15test_svtrn1_b32u10__SVBool_tu10__SVBool_t(
	// CPP-CHECK-NEXT: entry:			// CPP-CHECK-NEXT: entry:
	// CPP-CHECK-NEXT: [[TMP0:%.]] = tail call <vscale x 4 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv4i1(<vscale x 16 x i1> [[OP1:%.]])			// CPP-CHECK-NEXT: [[TMP0:%.]] = tail call <vscale x 16 x i1> @llvm.aarch64.sve.trn1.b32(<vscale x 16 x i1> [[OP1:%.]], <vscale x 16 x i1> [[OP2:%.*]])
	// CPP-CHECK-NEXT: [[TMP1:%.]] = tail call <vscale x 4 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv4i1(<vscale x 16 x i1> [[OP2:%.]])			// CPP-CHECK-NEXT: ret <vscale x 16 x i1> [[TMP0]]
	// CPP-CHECK-NEXT: [[TMP2:%.*]] = tail call <vscale x 4 x i1> @llvm.aarch64.sve.trn1.nxv4i1(<vscale x 4 x i1> [[TMP0]], <vscale x 4 x i1> [[TMP1]])
	// CPP-CHECK-NEXT: [[TMP3:%.*]] = tail call <vscale x 16 x i1> @llvm.aarch64.sve.convert.to.svbool.nxv4i1(<vscale x 4 x i1> [[TMP2]])
	// CPP-CHECK-NEXT: ret <vscale x 16 x i1> [[TMP3]]
	//			//
	svbool_t test_svtrn1_b32(svbool_t op1, svbool_t op2)			svbool_t test_svtrn1_b32(svbool_t op1, svbool_t op2)
	{			{
	return svtrn1_b32(op1, op2);			return svtrn1_b32(op1, op2);
	}			}

	// CHECK-LABEL: @test_svtrn1_b64(			// CHECK-LABEL: @test_svtrn1_b64(
	// CHECK-NEXT: entry:			// CHECK-NEXT: entry:
	// CHECK-NEXT: [[TMP0:%.]] = tail call <vscale x 2 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv2i1(<vscale x 16 x i1> [[OP1:%.]])			// CHECK-NEXT: [[TMP0:%.]] = tail call <vscale x 16 x i1> @llvm.aarch64.sve.trn1.b64(<vscale x 16 x i1> [[OP1:%.]], <vscale x 16 x i1> [[OP2:%.*]])
	// CHECK-NEXT: [[TMP1:%.]] = tail call <vscale x 2 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv2i1(<vscale x 16 x i1> [[OP2:%.]])			// CHECK-NEXT: ret <vscale x 16 x i1> [[TMP0]]
	// CHECK-NEXT: [[TMP2:%.*]] = tail call <vscale x 2 x i1> @llvm.aarch64.sve.trn1.nxv2i1(<vscale x 2 x i1> [[TMP0]], <vscale x 2 x i1> [[TMP1]])
	// CHECK-NEXT: [[TMP3:%.*]] = tail call <vscale x 16 x i1> @llvm.aarch64.sve.convert.to.svbool.nxv2i1(<vscale x 2 x i1> [[TMP2]])
	// CHECK-NEXT: ret <vscale x 16 x i1> [[TMP3]]
	//			//
	// CPP-CHECK-LABEL: @_Z15test_svtrn1_b64u10__SVBool_tu10__SVBool_t(			// CPP-CHECK-LABEL: @_Z15test_svtrn1_b64u10__SVBool_tu10__SVBool_t(
	// CPP-CHECK-NEXT: entry:			// CPP-CHECK-NEXT: entry:
	// CPP-CHECK-NEXT: [[TMP0:%.]] = tail call <vscale x 2 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv2i1(<vscale x 16 x i1> [[OP1:%.]])			// CPP-CHECK-NEXT: [[TMP0:%.]] = tail call <vscale x 16 x i1> @llvm.aarch64.sve.trn1.b64(<vscale x 16 x i1> [[OP1:%.]], <vscale x 16 x i1> [[OP2:%.*]])
	// CPP-CHECK-NEXT: [[TMP1:%.]] = tail call <vscale x 2 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv2i1(<vscale x 16 x i1> [[OP2:%.]])			// CPP-CHECK-NEXT: ret <vscale x 16 x i1> [[TMP0]]
	// CPP-CHECK-NEXT: [[TMP2:%.*]] = tail call <vscale x 2 x i1> @llvm.aarch64.sve.trn1.nxv2i1(<vscale x 2 x i1> [[TMP0]], <vscale x 2 x i1> [[TMP1]])
	// CPP-CHECK-NEXT: [[TMP3:%.*]] = tail call <vscale x 16 x i1> @llvm.aarch64.sve.convert.to.svbool.nxv2i1(<vscale x 2 x i1> [[TMP2]])
	// CPP-CHECK-NEXT: ret <vscale x 16 x i1> [[TMP3]]
	//			//
	svbool_t test_svtrn1_b64(svbool_t op1, svbool_t op2)			svbool_t test_svtrn1_b64(svbool_t op1, svbool_t op2)
	{			{
	return svtrn1_b64(op1, op2);			return svtrn1_b64(op1, op2);
	}			}

clang/test/CodeGen/aarch64-sve-intrinsics/acle_sve_trn2.c

	Show First 20 Lines • Show All 190 Lines • ▼ Show 20 Lines
	//			//
	svbool_t test_svtrn2_b8(svbool_t op1, svbool_t op2)			svbool_t test_svtrn2_b8(svbool_t op1, svbool_t op2)
	{			{
	return svtrn2_b8(op1, op2);			return svtrn2_b8(op1, op2);
	}			}

	// CHECK-LABEL: @test_svtrn2_b16(			// CHECK-LABEL: @test_svtrn2_b16(
	// CHECK-NEXT: entry:			// CHECK-NEXT: entry:
	// CHECK-NEXT: [[TMP0:%.]] = tail call <vscale x 8 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv8i1(<vscale x 16 x i1> [[OP1:%.]])			// CHECK-NEXT: [[TMP0:%.]] = tail call <vscale x 16 x i1> @llvm.aarch64.sve.trn2.b16(<vscale x 16 x i1> [[OP1:%.]], <vscale x 16 x i1> [[OP2:%.*]])
	// CHECK-NEXT: [[TMP1:%.]] = tail call <vscale x 8 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv8i1(<vscale x 16 x i1> [[OP2:%.]])			// CHECK-NEXT: ret <vscale x 16 x i1> [[TMP0]]
	// CHECK-NEXT: [[TMP2:%.*]] = tail call <vscale x 8 x i1> @llvm.aarch64.sve.trn2.nxv8i1(<vscale x 8 x i1> [[TMP0]], <vscale x 8 x i1> [[TMP1]])
	// CHECK-NEXT: [[TMP3:%.*]] = tail call <vscale x 16 x i1> @llvm.aarch64.sve.convert.to.svbool.nxv8i1(<vscale x 8 x i1> [[TMP2]])
	// CHECK-NEXT: ret <vscale x 16 x i1> [[TMP3]]
	//			//
	// CPP-CHECK-LABEL: @_Z15test_svtrn2_b16u10__SVBool_tu10__SVBool_t(			// CPP-CHECK-LABEL: @_Z15test_svtrn2_b16u10__SVBool_tu10__SVBool_t(
	// CPP-CHECK-NEXT: entry:			// CPP-CHECK-NEXT: entry:
	// CPP-CHECK-NEXT: [[TMP0:%.]] = tail call <vscale x 8 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv8i1(<vscale x 16 x i1> [[OP1:%.]])			// CPP-CHECK-NEXT: [[TMP0:%.]] = tail call <vscale x 16 x i1> @llvm.aarch64.sve.trn2.b16(<vscale x 16 x i1> [[OP1:%.]], <vscale x 16 x i1> [[OP2:%.*]])
	// CPP-CHECK-NEXT: [[TMP1:%.]] = tail call <vscale x 8 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv8i1(<vscale x 16 x i1> [[OP2:%.]])			// CPP-CHECK-NEXT: ret <vscale x 16 x i1> [[TMP0]]
	// CPP-CHECK-NEXT: [[TMP2:%.*]] = tail call <vscale x 8 x i1> @llvm.aarch64.sve.trn2.nxv8i1(<vscale x 8 x i1> [[TMP0]], <vscale x 8 x i1> [[TMP1]])
	// CPP-CHECK-NEXT: [[TMP3:%.*]] = tail call <vscale x 16 x i1> @llvm.aarch64.sve.convert.to.svbool.nxv8i1(<vscale x 8 x i1> [[TMP2]])
	// CPP-CHECK-NEXT: ret <vscale x 16 x i1> [[TMP3]]
	//			//
	svbool_t test_svtrn2_b16(svbool_t op1, svbool_t op2)			svbool_t test_svtrn2_b16(svbool_t op1, svbool_t op2)
	{			{
	return svtrn2_b16(op1, op2);			return svtrn2_b16(op1, op2);
	}			}

	// CHECK-LABEL: @test_svtrn2_b32(			// CHECK-LABEL: @test_svtrn2_b32(
	// CHECK-NEXT: entry:			// CHECK-NEXT: entry:
	// CHECK-NEXT: [[TMP0:%.]] = tail call <vscale x 4 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv4i1(<vscale x 16 x i1> [[OP1:%.]])			// CHECK-NEXT: [[TMP0:%.]] = tail call <vscale x 16 x i1> @llvm.aarch64.sve.trn2.b32(<vscale x 16 x i1> [[OP1:%.]], <vscale x 16 x i1> [[OP2:%.*]])
	// CHECK-NEXT: [[TMP1:%.]] = tail call <vscale x 4 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv4i1(<vscale x 16 x i1> [[OP2:%.]])			// CHECK-NEXT: ret <vscale x 16 x i1> [[TMP0]]
	// CHECK-NEXT: [[TMP2:%.*]] = tail call <vscale x 4 x i1> @llvm.aarch64.sve.trn2.nxv4i1(<vscale x 4 x i1> [[TMP0]], <vscale x 4 x i1> [[TMP1]])
	// CHECK-NEXT: [[TMP3:%.*]] = tail call <vscale x 16 x i1> @llvm.aarch64.sve.convert.to.svbool.nxv4i1(<vscale x 4 x i1> [[TMP2]])
	// CHECK-NEXT: ret <vscale x 16 x i1> [[TMP3]]
	//			//
	// CPP-CHECK-LABEL: @_Z15test_svtrn2_b32u10__SVBool_tu10__SVBool_t(			// CPP-CHECK-LABEL: @_Z15test_svtrn2_b32u10__SVBool_tu10__SVBool_t(
	// CPP-CHECK-NEXT: entry:			// CPP-CHECK-NEXT: entry:
	// CPP-CHECK-NEXT: [[TMP0:%.]] = tail call <vscale x 4 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv4i1(<vscale x 16 x i1> [[OP1:%.]])			// CPP-CHECK-NEXT: [[TMP0:%.]] = tail call <vscale x 16 x i1> @llvm.aarch64.sve.trn2.b32(<vscale x 16 x i1> [[OP1:%.]], <vscale x 16 x i1> [[OP2:%.*]])
	// CPP-CHECK-NEXT: [[TMP1:%.]] = tail call <vscale x 4 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv4i1(<vscale x 16 x i1> [[OP2:%.]])			// CPP-CHECK-NEXT: ret <vscale x 16 x i1> [[TMP0]]
	// CPP-CHECK-NEXT: [[TMP2:%.*]] = tail call <vscale x 4 x i1> @llvm.aarch64.sve.trn2.nxv4i1(<vscale x 4 x i1> [[TMP0]], <vscale x 4 x i1> [[TMP1]])
	// CPP-CHECK-NEXT: [[TMP3:%.*]] = tail call <vscale x 16 x i1> @llvm.aarch64.sve.convert.to.svbool.nxv4i1(<vscale x 4 x i1> [[TMP2]])
	// CPP-CHECK-NEXT: ret <vscale x 16 x i1> [[TMP3]]
	//			//
	svbool_t test_svtrn2_b32(svbool_t op1, svbool_t op2)			svbool_t test_svtrn2_b32(svbool_t op1, svbool_t op2)
	{			{
	return svtrn2_b32(op1, op2);			return svtrn2_b32(op1, op2);
	}			}

	// CHECK-LABEL: @test_svtrn2_b64(			// CHECK-LABEL: @test_svtrn2_b64(
	// CHECK-NEXT: entry:			// CHECK-NEXT: entry:
	// CHECK-NEXT: [[TMP0:%.]] = tail call <vscale x 2 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv2i1(<vscale x 16 x i1> [[OP1:%.]])			// CHECK-NEXT: [[TMP0:%.]] = tail call <vscale x 16 x i1> @llvm.aarch64.sve.trn2.b64(<vscale x 16 x i1> [[OP1:%.]], <vscale x 16 x i1> [[OP2:%.*]])
	// CHECK-NEXT: [[TMP1:%.]] = tail call <vscale x 2 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv2i1(<vscale x 16 x i1> [[OP2:%.]])			// CHECK-NEXT: ret <vscale x 16 x i1> [[TMP0]]
	// CHECK-NEXT: [[TMP2:%.*]] = tail call <vscale x 2 x i1> @llvm.aarch64.sve.trn2.nxv2i1(<vscale x 2 x i1> [[TMP0]], <vscale x 2 x i1> [[TMP1]])
	// CHECK-NEXT: [[TMP3:%.*]] = tail call <vscale x 16 x i1> @llvm.aarch64.sve.convert.to.svbool.nxv2i1(<vscale x 2 x i1> [[TMP2]])
	// CHECK-NEXT: ret <vscale x 16 x i1> [[TMP3]]
	//			//
	// CPP-CHECK-LABEL: @_Z15test_svtrn2_b64u10__SVBool_tu10__SVBool_t(			// CPP-CHECK-LABEL: @_Z15test_svtrn2_b64u10__SVBool_tu10__SVBool_t(
	// CPP-CHECK-NEXT: entry:			// CPP-CHECK-NEXT: entry:
	// CPP-CHECK-NEXT: [[TMP0:%.]] = tail call <vscale x 2 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv2i1(<vscale x 16 x i1> [[OP1:%.]])			// CPP-CHECK-NEXT: [[TMP0:%.]] = tail call <vscale x 16 x i1> @llvm.aarch64.sve.trn2.b64(<vscale x 16 x i1> [[OP1:%.]], <vscale x 16 x i1> [[OP2:%.*]])
	// CPP-CHECK-NEXT: [[TMP1:%.]] = tail call <vscale x 2 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv2i1(<vscale x 16 x i1> [[OP2:%.]])			// CPP-CHECK-NEXT: ret <vscale x 16 x i1> [[TMP0]]
	// CPP-CHECK-NEXT: [[TMP2:%.*]] = tail call <vscale x 2 x i1> @llvm.aarch64.sve.trn2.nxv2i1(<vscale x 2 x i1> [[TMP0]], <vscale x 2 x i1> [[TMP1]])
	// CPP-CHECK-NEXT: [[TMP3:%.*]] = tail call <vscale x 16 x i1> @llvm.aarch64.sve.convert.to.svbool.nxv2i1(<vscale x 2 x i1> [[TMP2]])
	// CPP-CHECK-NEXT: ret <vscale x 16 x i1> [[TMP3]]
	//			//
	svbool_t test_svtrn2_b64(svbool_t op1, svbool_t op2)			svbool_t test_svtrn2_b64(svbool_t op1, svbool_t op2)
	{			{
	return svtrn2_b64(op1, op2);			return svtrn2_b64(op1, op2);
	}			}

clang/test/CodeGen/aarch64-sve-intrinsics/acle_sve_uzp1.c

	Show First 20 Lines • Show All 190 Lines • ▼ Show 20 Lines
	//			//
	svbool_t test_svuzp1_b8(svbool_t op1, svbool_t op2)			svbool_t test_svuzp1_b8(svbool_t op1, svbool_t op2)
	{			{
	return svuzp1_b8(op1, op2);			return svuzp1_b8(op1, op2);
	}			}

	// CHECK-LABEL: @test_svuzp1_b16(			// CHECK-LABEL: @test_svuzp1_b16(
	// CHECK-NEXT: entry:			// CHECK-NEXT: entry:
	// CHECK-NEXT: [[TMP0:%.]] = tail call <vscale x 8 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv8i1(<vscale x 16 x i1> [[OP1:%.]])			// CHECK-NEXT: [[TMP0:%.]] = tail call <vscale x 16 x i1> @llvm.aarch64.sve.uzp1.b16(<vscale x 16 x i1> [[OP1:%.]], <vscale x 16 x i1> [[OP2:%.*]])
	// CHECK-NEXT: [[TMP1:%.]] = tail call <vscale x 8 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv8i1(<vscale x 16 x i1> [[OP2:%.]])			// CHECK-NEXT: ret <vscale x 16 x i1> [[TMP0]]
	// CHECK-NEXT: [[TMP2:%.*]] = tail call <vscale x 8 x i1> @llvm.aarch64.sve.uzp1.nxv8i1(<vscale x 8 x i1> [[TMP0]], <vscale x 8 x i1> [[TMP1]])
	// CHECK-NEXT: [[TMP3:%.*]] = tail call <vscale x 16 x i1> @llvm.aarch64.sve.convert.to.svbool.nxv8i1(<vscale x 8 x i1> [[TMP2]])
	// CHECK-NEXT: ret <vscale x 16 x i1> [[TMP3]]
	//			//
	// CPP-CHECK-LABEL: @_Z15test_svuzp1_b16u10__SVBool_tu10__SVBool_t(			// CPP-CHECK-LABEL: @_Z15test_svuzp1_b16u10__SVBool_tu10__SVBool_t(
	// CPP-CHECK-NEXT: entry:			// CPP-CHECK-NEXT: entry:
	// CPP-CHECK-NEXT: [[TMP0:%.]] = tail call <vscale x 8 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv8i1(<vscale x 16 x i1> [[OP1:%.]])			// CPP-CHECK-NEXT: [[TMP0:%.]] = tail call <vscale x 16 x i1> @llvm.aarch64.sve.uzp1.b16(<vscale x 16 x i1> [[OP1:%.]], <vscale x 16 x i1> [[OP2:%.*]])
	// CPP-CHECK-NEXT: [[TMP1:%.]] = tail call <vscale x 8 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv8i1(<vscale x 16 x i1> [[OP2:%.]])			// CPP-CHECK-NEXT: ret <vscale x 16 x i1> [[TMP0]]
	// CPP-CHECK-NEXT: [[TMP2:%.*]] = tail call <vscale x 8 x i1> @llvm.aarch64.sve.uzp1.nxv8i1(<vscale x 8 x i1> [[TMP0]], <vscale x 8 x i1> [[TMP1]])
	// CPP-CHECK-NEXT: [[TMP3:%.*]] = tail call <vscale x 16 x i1> @llvm.aarch64.sve.convert.to.svbool.nxv8i1(<vscale x 8 x i1> [[TMP2]])
	// CPP-CHECK-NEXT: ret <vscale x 16 x i1> [[TMP3]]
	//			//
	svbool_t test_svuzp1_b16(svbool_t op1, svbool_t op2)			svbool_t test_svuzp1_b16(svbool_t op1, svbool_t op2)
	{			{
	return svuzp1_b16(op1, op2);			return svuzp1_b16(op1, op2);
	}			}

	// CHECK-LABEL: @test_svuzp1_b32(			// CHECK-LABEL: @test_svuzp1_b32(
	// CHECK-NEXT: entry:			// CHECK-NEXT: entry:
	// CHECK-NEXT: [[TMP0:%.]] = tail call <vscale x 4 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv4i1(<vscale x 16 x i1> [[OP1:%.]])			// CHECK-NEXT: [[TMP0:%.]] = tail call <vscale x 16 x i1> @llvm.aarch64.sve.uzp1.b32(<vscale x 16 x i1> [[OP1:%.]], <vscale x 16 x i1> [[OP2:%.*]])
	// CHECK-NEXT: [[TMP1:%.]] = tail call <vscale x 4 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv4i1(<vscale x 16 x i1> [[OP2:%.]])			// CHECK-NEXT: ret <vscale x 16 x i1> [[TMP0]]
	// CHECK-NEXT: [[TMP2:%.*]] = tail call <vscale x 4 x i1> @llvm.aarch64.sve.uzp1.nxv4i1(<vscale x 4 x i1> [[TMP0]], <vscale x 4 x i1> [[TMP1]])
	// CHECK-NEXT: [[TMP3:%.*]] = tail call <vscale x 16 x i1> @llvm.aarch64.sve.convert.to.svbool.nxv4i1(<vscale x 4 x i1> [[TMP2]])
	// CHECK-NEXT: ret <vscale x 16 x i1> [[TMP3]]
	//			//
	// CPP-CHECK-LABEL: @_Z15test_svuzp1_b32u10__SVBool_tu10__SVBool_t(			// CPP-CHECK-LABEL: @_Z15test_svuzp1_b32u10__SVBool_tu10__SVBool_t(
	// CPP-CHECK-NEXT: entry:			// CPP-CHECK-NEXT: entry:
	// CPP-CHECK-NEXT: [[TMP0:%.]] = tail call <vscale x 4 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv4i1(<vscale x 16 x i1> [[OP1:%.]])			// CPP-CHECK-NEXT: [[TMP0:%.]] = tail call <vscale x 16 x i1> @llvm.aarch64.sve.uzp1.b32(<vscale x 16 x i1> [[OP1:%.]], <vscale x 16 x i1> [[OP2:%.*]])
	// CPP-CHECK-NEXT: [[TMP1:%.]] = tail call <vscale x 4 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv4i1(<vscale x 16 x i1> [[OP2:%.]])			// CPP-CHECK-NEXT: ret <vscale x 16 x i1> [[TMP0]]
	// CPP-CHECK-NEXT: [[TMP2:%.*]] = tail call <vscale x 4 x i1> @llvm.aarch64.sve.uzp1.nxv4i1(<vscale x 4 x i1> [[TMP0]], <vscale x 4 x i1> [[TMP1]])
	// CPP-CHECK-NEXT: [[TMP3:%.*]] = tail call <vscale x 16 x i1> @llvm.aarch64.sve.convert.to.svbool.nxv4i1(<vscale x 4 x i1> [[TMP2]])
	// CPP-CHECK-NEXT: ret <vscale x 16 x i1> [[TMP3]]
	//			//
	svbool_t test_svuzp1_b32(svbool_t op1, svbool_t op2)			svbool_t test_svuzp1_b32(svbool_t op1, svbool_t op2)
	{			{
	return svuzp1_b32(op1, op2);			return svuzp1_b32(op1, op2);
	}			}

	// CHECK-LABEL: @test_svuzp1_b64(			// CHECK-LABEL: @test_svuzp1_b64(
	// CHECK-NEXT: entry:			// CHECK-NEXT: entry:
	// CHECK-NEXT: [[TMP0:%.]] = tail call <vscale x 2 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv2i1(<vscale x 16 x i1> [[OP1:%.]])			// CHECK-NEXT: [[TMP0:%.]] = tail call <vscale x 16 x i1> @llvm.aarch64.sve.uzp1.b64(<vscale x 16 x i1> [[OP1:%.]], <vscale x 16 x i1> [[OP2:%.*]])
	// CHECK-NEXT: [[TMP1:%.]] = tail call <vscale x 2 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv2i1(<vscale x 16 x i1> [[OP2:%.]])			// CHECK-NEXT: ret <vscale x 16 x i1> [[TMP0]]
	// CHECK-NEXT: [[TMP2:%.*]] = tail call <vscale x 2 x i1> @llvm.aarch64.sve.uzp1.nxv2i1(<vscale x 2 x i1> [[TMP0]], <vscale x 2 x i1> [[TMP1]])
	// CHECK-NEXT: [[TMP3:%.*]] = tail call <vscale x 16 x i1> @llvm.aarch64.sve.convert.to.svbool.nxv2i1(<vscale x 2 x i1> [[TMP2]])
	// CHECK-NEXT: ret <vscale x 16 x i1> [[TMP3]]
	//			//
	// CPP-CHECK-LABEL: @_Z15test_svuzp1_b64u10__SVBool_tu10__SVBool_t(			// CPP-CHECK-LABEL: @_Z15test_svuzp1_b64u10__SVBool_tu10__SVBool_t(
	// CPP-CHECK-NEXT: entry:			// CPP-CHECK-NEXT: entry:
	// CPP-CHECK-NEXT: [[TMP0:%.]] = tail call <vscale x 2 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv2i1(<vscale x 16 x i1> [[OP1:%.]])			// CPP-CHECK-NEXT: [[TMP0:%.]] = tail call <vscale x 16 x i1> @llvm.aarch64.sve.uzp1.b64(<vscale x 16 x i1> [[OP1:%.]], <vscale x 16 x i1> [[OP2:%.*]])
	// CPP-CHECK-NEXT: [[TMP1:%.]] = tail call <vscale x 2 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv2i1(<vscale x 16 x i1> [[OP2:%.]])			// CPP-CHECK-NEXT: ret <vscale x 16 x i1> [[TMP0]]
	// CPP-CHECK-NEXT: [[TMP2:%.*]] = tail call <vscale x 2 x i1> @llvm.aarch64.sve.uzp1.nxv2i1(<vscale x 2 x i1> [[TMP0]], <vscale x 2 x i1> [[TMP1]])
	// CPP-CHECK-NEXT: [[TMP3:%.*]] = tail call <vscale x 16 x i1> @llvm.aarch64.sve.convert.to.svbool.nxv2i1(<vscale x 2 x i1> [[TMP2]])
	// CPP-CHECK-NEXT: ret <vscale x 16 x i1> [[TMP3]]
	//			//
	svbool_t test_svuzp1_b64(svbool_t op1, svbool_t op2)			svbool_t test_svuzp1_b64(svbool_t op1, svbool_t op2)
	{			{
	return svuzp1_b64(op1, op2);			return svuzp1_b64(op1, op2);
	}			}

clang/test/CodeGen/aarch64-sve-intrinsics/acle_sve_uzp2.c

	Show First 20 Lines • Show All 190 Lines • ▼ Show 20 Lines
	//			//
	svbool_t test_svuzp2_b8(svbool_t op1, svbool_t op2)			svbool_t test_svuzp2_b8(svbool_t op1, svbool_t op2)
	{			{
	return svuzp2_b8(op1, op2);			return svuzp2_b8(op1, op2);
	}			}

	// CHECK-LABEL: @test_svuzp2_b16(			// CHECK-LABEL: @test_svuzp2_b16(
	// CHECK-NEXT: entry:			// CHECK-NEXT: entry:
	// CHECK-NEXT: [[TMP0:%.]] = tail call <vscale x 8 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv8i1(<vscale x 16 x i1> [[OP1:%.]])			// CHECK-NEXT: [[TMP0:%.]] = tail call <vscale x 16 x i1> @llvm.aarch64.sve.uzp2.b16(<vscale x 16 x i1> [[OP1:%.]], <vscale x 16 x i1> [[OP2:%.*]])
	// CHECK-NEXT: [[TMP1:%.]] = tail call <vscale x 8 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv8i1(<vscale x 16 x i1> [[OP2:%.]])			// CHECK-NEXT: ret <vscale x 16 x i1> [[TMP0]]
	// CHECK-NEXT: [[TMP2:%.*]] = tail call <vscale x 8 x i1> @llvm.aarch64.sve.uzp2.nxv8i1(<vscale x 8 x i1> [[TMP0]], <vscale x 8 x i1> [[TMP1]])
	// CHECK-NEXT: [[TMP3:%.*]] = tail call <vscale x 16 x i1> @llvm.aarch64.sve.convert.to.svbool.nxv8i1(<vscale x 8 x i1> [[TMP2]])
	// CHECK-NEXT: ret <vscale x 16 x i1> [[TMP3]]
	//			//
	// CPP-CHECK-LABEL: @_Z15test_svuzp2_b16u10__SVBool_tu10__SVBool_t(			// CPP-CHECK-LABEL: @_Z15test_svuzp2_b16u10__SVBool_tu10__SVBool_t(
	// CPP-CHECK-NEXT: entry:			// CPP-CHECK-NEXT: entry:
	// CPP-CHECK-NEXT: [[TMP0:%.]] = tail call <vscale x 8 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv8i1(<vscale x 16 x i1> [[OP1:%.]])			// CPP-CHECK-NEXT: [[TMP0:%.]] = tail call <vscale x 16 x i1> @llvm.aarch64.sve.uzp2.b16(<vscale x 16 x i1> [[OP1:%.]], <vscale x 16 x i1> [[OP2:%.*]])
	// CPP-CHECK-NEXT: [[TMP1:%.]] = tail call <vscale x 8 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv8i1(<vscale x 16 x i1> [[OP2:%.]])			// CPP-CHECK-NEXT: ret <vscale x 16 x i1> [[TMP0]]
	// CPP-CHECK-NEXT: [[TMP2:%.*]] = tail call <vscale x 8 x i1> @llvm.aarch64.sve.uzp2.nxv8i1(<vscale x 8 x i1> [[TMP0]], <vscale x 8 x i1> [[TMP1]])
	// CPP-CHECK-NEXT: [[TMP3:%.*]] = tail call <vscale x 16 x i1> @llvm.aarch64.sve.convert.to.svbool.nxv8i1(<vscale x 8 x i1> [[TMP2]])
	// CPP-CHECK-NEXT: ret <vscale x 16 x i1> [[TMP3]]
	//			//
	svbool_t test_svuzp2_b16(svbool_t op1, svbool_t op2)			svbool_t test_svuzp2_b16(svbool_t op1, svbool_t op2)
	{			{
	return svuzp2_b16(op1, op2);			return svuzp2_b16(op1, op2);
	}			}

	// CHECK-LABEL: @test_svuzp2_b32(			// CHECK-LABEL: @test_svuzp2_b32(
	// CHECK-NEXT: entry:			// CHECK-NEXT: entry:
	// CHECK-NEXT: [[TMP0:%.]] = tail call <vscale x 4 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv4i1(<vscale x 16 x i1> [[OP1:%.]])			// CHECK-NEXT: [[TMP0:%.]] = tail call <vscale x 16 x i1> @llvm.aarch64.sve.uzp2.b32(<vscale x 16 x i1> [[OP1:%.]], <vscale x 16 x i1> [[OP2:%.*]])
	// CHECK-NEXT: [[TMP1:%.]] = tail call <vscale x 4 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv4i1(<vscale x 16 x i1> [[OP2:%.]])			// CHECK-NEXT: ret <vscale x 16 x i1> [[TMP0]]
	// CHECK-NEXT: [[TMP2:%.*]] = tail call <vscale x 4 x i1> @llvm.aarch64.sve.uzp2.nxv4i1(<vscale x 4 x i1> [[TMP0]], <vscale x 4 x i1> [[TMP1]])
	// CHECK-NEXT: [[TMP3:%.*]] = tail call <vscale x 16 x i1> @llvm.aarch64.sve.convert.to.svbool.nxv4i1(<vscale x 4 x i1> [[TMP2]])
	// CHECK-NEXT: ret <vscale x 16 x i1> [[TMP3]]
	//			//
	// CPP-CHECK-LABEL: @_Z15test_svuzp2_b32u10__SVBool_tu10__SVBool_t(			// CPP-CHECK-LABEL: @_Z15test_svuzp2_b32u10__SVBool_tu10__SVBool_t(
	// CPP-CHECK-NEXT: entry:			// CPP-CHECK-NEXT: entry:
	// CPP-CHECK-NEXT: [[TMP0:%.]] = tail call <vscale x 4 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv4i1(<vscale x 16 x i1> [[OP1:%.]])			// CPP-CHECK-NEXT: [[TMP0:%.]] = tail call <vscale x 16 x i1> @llvm.aarch64.sve.uzp2.b32(<vscale x 16 x i1> [[OP1:%.]], <vscale x 16 x i1> [[OP2:%.*]])
	// CPP-CHECK-NEXT: [[TMP1:%.]] = tail call <vscale x 4 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv4i1(<vscale x 16 x i1> [[OP2:%.]])			// CPP-CHECK-NEXT: ret <vscale x 16 x i1> [[TMP0]]
	// CPP-CHECK-NEXT: [[TMP2:%.*]] = tail call <vscale x 4 x i1> @llvm.aarch64.sve.uzp2.nxv4i1(<vscale x 4 x i1> [[TMP0]], <vscale x 4 x i1> [[TMP1]])
	// CPP-CHECK-NEXT: [[TMP3:%.*]] = tail call <vscale x 16 x i1> @llvm.aarch64.sve.convert.to.svbool.nxv4i1(<vscale x 4 x i1> [[TMP2]])
	// CPP-CHECK-NEXT: ret <vscale x 16 x i1> [[TMP3]]
	//			//
	svbool_t test_svuzp2_b32(svbool_t op1, svbool_t op2)			svbool_t test_svuzp2_b32(svbool_t op1, svbool_t op2)
	{			{
	return svuzp2_b32(op1, op2);			return svuzp2_b32(op1, op2);
	}			}

	// CHECK-LABEL: @test_svuzp2_b64(			// CHECK-LABEL: @test_svuzp2_b64(
	// CHECK-NEXT: entry:			// CHECK-NEXT: entry:
	// CHECK-NEXT: [[TMP0:%.]] = tail call <vscale x 2 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv2i1(<vscale x 16 x i1> [[OP1:%.]])			// CHECK-NEXT: [[TMP0:%.]] = tail call <vscale x 16 x i1> @llvm.aarch64.sve.uzp2.b64(<vscale x 16 x i1> [[OP1:%.]], <vscale x 16 x i1> [[OP2:%.*]])
	// CHECK-NEXT: [[TMP1:%.]] = tail call <vscale x 2 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv2i1(<vscale x 16 x i1> [[OP2:%.]])			// CHECK-NEXT: ret <vscale x 16 x i1> [[TMP0]]
	// CHECK-NEXT: [[TMP2:%.*]] = tail call <vscale x 2 x i1> @llvm.aarch64.sve.uzp2.nxv2i1(<vscale x 2 x i1> [[TMP0]], <vscale x 2 x i1> [[TMP1]])
	// CHECK-NEXT: [[TMP3:%.*]] = tail call <vscale x 16 x i1> @llvm.aarch64.sve.convert.to.svbool.nxv2i1(<vscale x 2 x i1> [[TMP2]])
	// CHECK-NEXT: ret <vscale x 16 x i1> [[TMP3]]
	//			//
	// CPP-CHECK-LABEL: @_Z15test_svuzp2_b64u10__SVBool_tu10__SVBool_t(			// CPP-CHECK-LABEL: @_Z15test_svuzp2_b64u10__SVBool_tu10__SVBool_t(
	// CPP-CHECK-NEXT: entry:			// CPP-CHECK-NEXT: entry:
	// CPP-CHECK-NEXT: [[TMP0:%.]] = tail call <vscale x 2 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv2i1(<vscale x 16 x i1> [[OP1:%.]])			// CPP-CHECK-NEXT: [[TMP0:%.]] = tail call <vscale x 16 x i1> @llvm.aarch64.sve.uzp2.b64(<vscale x 16 x i1> [[OP1:%.]], <vscale x 16 x i1> [[OP2:%.*]])
	// CPP-CHECK-NEXT: [[TMP1:%.]] = tail call <vscale x 2 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv2i1(<vscale x 16 x i1> [[OP2:%.]])			// CPP-CHECK-NEXT: ret <vscale x 16 x i1> [[TMP0]]
	// CPP-CHECK-NEXT: [[TMP2:%.*]] = tail call <vscale x 2 x i1> @llvm.aarch64.sve.uzp2.nxv2i1(<vscale x 2 x i1> [[TMP0]], <vscale x 2 x i1> [[TMP1]])
	// CPP-CHECK-NEXT: [[TMP3:%.*]] = tail call <vscale x 16 x i1> @llvm.aarch64.sve.convert.to.svbool.nxv2i1(<vscale x 2 x i1> [[TMP2]])
	// CPP-CHECK-NEXT: ret <vscale x 16 x i1> [[TMP3]]
	//			//
	svbool_t test_svuzp2_b64(svbool_t op1, svbool_t op2)			svbool_t test_svuzp2_b64(svbool_t op1, svbool_t op2)
	{			{
	return svuzp2_b64(op1, op2);			return svuzp2_b64(op1, op2);
	}			}

clang/test/CodeGen/aarch64-sve-intrinsics/acle_sve_zip1.c

	Show First 20 Lines • Show All 190 Lines • ▼ Show 20 Lines
	//			//
	svbool_t test_svzip1_b8(svbool_t op1, svbool_t op2)			svbool_t test_svzip1_b8(svbool_t op1, svbool_t op2)
	{			{
	return svzip1_b8(op1, op2);			return svzip1_b8(op1, op2);
	}			}

	// CHECK-LABEL: @test_svzip1_b16(			// CHECK-LABEL: @test_svzip1_b16(
	// CHECK-NEXT: entry:			// CHECK-NEXT: entry:
	// CHECK-NEXT: [[TMP0:%.]] = tail call <vscale x 8 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv8i1(<vscale x 16 x i1> [[OP1:%.]])			// CHECK-NEXT: [[TMP0:%.]] = tail call <vscale x 16 x i1> @llvm.aarch64.sve.zip1.b16(<vscale x 16 x i1> [[OP1:%.]], <vscale x 16 x i1> [[OP2:%.*]])
	// CHECK-NEXT: [[TMP1:%.]] = tail call <vscale x 8 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv8i1(<vscale x 16 x i1> [[OP2:%.]])			// CHECK-NEXT: ret <vscale x 16 x i1> [[TMP0]]
	// CHECK-NEXT: [[TMP2:%.*]] = tail call <vscale x 8 x i1> @llvm.aarch64.sve.zip1.nxv8i1(<vscale x 8 x i1> [[TMP0]], <vscale x 8 x i1> [[TMP1]])
	// CHECK-NEXT: [[TMP3:%.*]] = tail call <vscale x 16 x i1> @llvm.aarch64.sve.convert.to.svbool.nxv8i1(<vscale x 8 x i1> [[TMP2]])
	// CHECK-NEXT: ret <vscale x 16 x i1> [[TMP3]]
	//			//
	// CPP-CHECK-LABEL: @_Z15test_svzip1_b16u10__SVBool_tu10__SVBool_t(			// CPP-CHECK-LABEL: @_Z15test_svzip1_b16u10__SVBool_tu10__SVBool_t(
	// CPP-CHECK-NEXT: entry:			// CPP-CHECK-NEXT: entry:
	// CPP-CHECK-NEXT: [[TMP0:%.]] = tail call <vscale x 8 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv8i1(<vscale x 16 x i1> [[OP1:%.]])			// CPP-CHECK-NEXT: [[TMP0:%.]] = tail call <vscale x 16 x i1> @llvm.aarch64.sve.zip1.b16(<vscale x 16 x i1> [[OP1:%.]], <vscale x 16 x i1> [[OP2:%.*]])
	// CPP-CHECK-NEXT: [[TMP1:%.]] = tail call <vscale x 8 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv8i1(<vscale x 16 x i1> [[OP2:%.]])			// CPP-CHECK-NEXT: ret <vscale x 16 x i1> [[TMP0]]
	// CPP-CHECK-NEXT: [[TMP2:%.*]] = tail call <vscale x 8 x i1> @llvm.aarch64.sve.zip1.nxv8i1(<vscale x 8 x i1> [[TMP0]], <vscale x 8 x i1> [[TMP1]])
	// CPP-CHECK-NEXT: [[TMP3:%.*]] = tail call <vscale x 16 x i1> @llvm.aarch64.sve.convert.to.svbool.nxv8i1(<vscale x 8 x i1> [[TMP2]])
	// CPP-CHECK-NEXT: ret <vscale x 16 x i1> [[TMP3]]
	//			//
	svbool_t test_svzip1_b16(svbool_t op1, svbool_t op2)			svbool_t test_svzip1_b16(svbool_t op1, svbool_t op2)
	{			{
	return svzip1_b16(op1, op2);			return svzip1_b16(op1, op2);
	}			}

	// CHECK-LABEL: @test_svzip1_b32(			// CHECK-LABEL: @test_svzip1_b32(
	// CHECK-NEXT: entry:			// CHECK-NEXT: entry:
	// CHECK-NEXT: [[TMP0:%.]] = tail call <vscale x 4 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv4i1(<vscale x 16 x i1> [[OP1:%.]])			// CHECK-NEXT: [[TMP0:%.]] = tail call <vscale x 16 x i1> @llvm.aarch64.sve.zip1.b32(<vscale x 16 x i1> [[OP1:%.]], <vscale x 16 x i1> [[OP2:%.*]])
	// CHECK-NEXT: [[TMP1:%.]] = tail call <vscale x 4 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv4i1(<vscale x 16 x i1> [[OP2:%.]])			// CHECK-NEXT: ret <vscale x 16 x i1> [[TMP0]]
	// CHECK-NEXT: [[TMP2:%.*]] = tail call <vscale x 4 x i1> @llvm.aarch64.sve.zip1.nxv4i1(<vscale x 4 x i1> [[TMP0]], <vscale x 4 x i1> [[TMP1]])
	// CHECK-NEXT: [[TMP3:%.*]] = tail call <vscale x 16 x i1> @llvm.aarch64.sve.convert.to.svbool.nxv4i1(<vscale x 4 x i1> [[TMP2]])
	// CHECK-NEXT: ret <vscale x 16 x i1> [[TMP3]]
	//			//
	// CPP-CHECK-LABEL: @_Z15test_svzip1_b32u10__SVBool_tu10__SVBool_t(			// CPP-CHECK-LABEL: @_Z15test_svzip1_b32u10__SVBool_tu10__SVBool_t(
	// CPP-CHECK-NEXT: entry:			// CPP-CHECK-NEXT: entry:
	// CPP-CHECK-NEXT: [[TMP0:%.]] = tail call <vscale x 4 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv4i1(<vscale x 16 x i1> [[OP1:%.]])			// CPP-CHECK-NEXT: [[TMP0:%.]] = tail call <vscale x 16 x i1> @llvm.aarch64.sve.zip1.b32(<vscale x 16 x i1> [[OP1:%.]], <vscale x 16 x i1> [[OP2:%.*]])
	// CPP-CHECK-NEXT: [[TMP1:%.]] = tail call <vscale x 4 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv4i1(<vscale x 16 x i1> [[OP2:%.]])			// CPP-CHECK-NEXT: ret <vscale x 16 x i1> [[TMP0]]
	// CPP-CHECK-NEXT: [[TMP2:%.*]] = tail call <vscale x 4 x i1> @llvm.aarch64.sve.zip1.nxv4i1(<vscale x 4 x i1> [[TMP0]], <vscale x 4 x i1> [[TMP1]])
	// CPP-CHECK-NEXT: [[TMP3:%.*]] = tail call <vscale x 16 x i1> @llvm.aarch64.sve.convert.to.svbool.nxv4i1(<vscale x 4 x i1> [[TMP2]])
	// CPP-CHECK-NEXT: ret <vscale x 16 x i1> [[TMP3]]
	//			//
	svbool_t test_svzip1_b32(svbool_t op1, svbool_t op2)			svbool_t test_svzip1_b32(svbool_t op1, svbool_t op2)
	{			{
	return svzip1_b32(op1, op2);			return svzip1_b32(op1, op2);
	}			}

	// CHECK-LABEL: @test_svzip1_b64(			// CHECK-LABEL: @test_svzip1_b64(
	// CHECK-NEXT: entry:			// CHECK-NEXT: entry:
	// CHECK-NEXT: [[TMP0:%.]] = tail call <vscale x 2 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv2i1(<vscale x 16 x i1> [[OP1:%.]])			// CHECK-NEXT: [[TMP0:%.]] = tail call <vscale x 16 x i1> @llvm.aarch64.sve.zip1.b64(<vscale x 16 x i1> [[OP1:%.]], <vscale x 16 x i1> [[OP2:%.*]])
	// CHECK-NEXT: [[TMP1:%.]] = tail call <vscale x 2 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv2i1(<vscale x 16 x i1> [[OP2:%.]])			// CHECK-NEXT: ret <vscale x 16 x i1> [[TMP0]]
	// CHECK-NEXT: [[TMP2:%.*]] = tail call <vscale x 2 x i1> @llvm.aarch64.sve.zip1.nxv2i1(<vscale x 2 x i1> [[TMP0]], <vscale x 2 x i1> [[TMP1]])
	// CHECK-NEXT: [[TMP3:%.*]] = tail call <vscale x 16 x i1> @llvm.aarch64.sve.convert.to.svbool.nxv2i1(<vscale x 2 x i1> [[TMP2]])
	// CHECK-NEXT: ret <vscale x 16 x i1> [[TMP3]]
	//			//
	// CPP-CHECK-LABEL: @_Z15test_svzip1_b64u10__SVBool_tu10__SVBool_t(			// CPP-CHECK-LABEL: @_Z15test_svzip1_b64u10__SVBool_tu10__SVBool_t(
	// CPP-CHECK-NEXT: entry:			// CPP-CHECK-NEXT: entry:
	// CPP-CHECK-NEXT: [[TMP0:%.]] = tail call <vscale x 2 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv2i1(<vscale x 16 x i1> [[OP1:%.]])			// CPP-CHECK-NEXT: [[TMP0:%.]] = tail call <vscale x 16 x i1> @llvm.aarch64.sve.zip1.b64(<vscale x 16 x i1> [[OP1:%.]], <vscale x 16 x i1> [[OP2:%.*]])
	// CPP-CHECK-NEXT: [[TMP1:%.]] = tail call <vscale x 2 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv2i1(<vscale x 16 x i1> [[OP2:%.]])			// CPP-CHECK-NEXT: ret <vscale x 16 x i1> [[TMP0]]
	// CPP-CHECK-NEXT: [[TMP2:%.*]] = tail call <vscale x 2 x i1> @llvm.aarch64.sve.zip1.nxv2i1(<vscale x 2 x i1> [[TMP0]], <vscale x 2 x i1> [[TMP1]])
	// CPP-CHECK-NEXT: [[TMP3:%.*]] = tail call <vscale x 16 x i1> @llvm.aarch64.sve.convert.to.svbool.nxv2i1(<vscale x 2 x i1> [[TMP2]])
	// CPP-CHECK-NEXT: ret <vscale x 16 x i1> [[TMP3]]
	//			//
	svbool_t test_svzip1_b64(svbool_t op1, svbool_t op2)			svbool_t test_svzip1_b64(svbool_t op1, svbool_t op2)
	{			{
	return svzip1_b64(op1, op2);			return svzip1_b64(op1, op2);
	}			}

clang/test/CodeGen/aarch64-sve-intrinsics/acle_sve_zip2.c

	Show First 20 Lines • Show All 190 Lines • ▼ Show 20 Lines
	//			//
	svbool_t test_svzip2_b8(svbool_t op1, svbool_t op2)			svbool_t test_svzip2_b8(svbool_t op1, svbool_t op2)
	{			{
	return svzip2_b8(op1, op2);			return svzip2_b8(op1, op2);
	}			}

	// CHECK-LABEL: @test_svzip2_b16(			// CHECK-LABEL: @test_svzip2_b16(
	// CHECK-NEXT: entry:			// CHECK-NEXT: entry:
	// CHECK-NEXT: [[TMP0:%.]] = tail call <vscale x 8 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv8i1(<vscale x 16 x i1> [[OP1:%.]])			// CHECK-NEXT: [[TMP0:%.]] = tail call <vscale x 16 x i1> @llvm.aarch64.sve.zip2.b16(<vscale x 16 x i1> [[OP1:%.]], <vscale x 16 x i1> [[OP2:%.*]])
	// CHECK-NEXT: [[TMP1:%.]] = tail call <vscale x 8 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv8i1(<vscale x 16 x i1> [[OP2:%.]])			// CHECK-NEXT: ret <vscale x 16 x i1> [[TMP0]]
	// CHECK-NEXT: [[TMP2:%.*]] = tail call <vscale x 8 x i1> @llvm.aarch64.sve.zip2.nxv8i1(<vscale x 8 x i1> [[TMP0]], <vscale x 8 x i1> [[TMP1]])
	// CHECK-NEXT: [[TMP3:%.*]] = tail call <vscale x 16 x i1> @llvm.aarch64.sve.convert.to.svbool.nxv8i1(<vscale x 8 x i1> [[TMP2]])
	// CHECK-NEXT: ret <vscale x 16 x i1> [[TMP3]]
	//			//
	// CPP-CHECK-LABEL: @_Z15test_svzip2_b16u10__SVBool_tu10__SVBool_t(			// CPP-CHECK-LABEL: @_Z15test_svzip2_b16u10__SVBool_tu10__SVBool_t(
	// CPP-CHECK-NEXT: entry:			// CPP-CHECK-NEXT: entry:
	// CPP-CHECK-NEXT: [[TMP0:%.]] = tail call <vscale x 8 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv8i1(<vscale x 16 x i1> [[OP1:%.]])			// CPP-CHECK-NEXT: [[TMP0:%.]] = tail call <vscale x 16 x i1> @llvm.aarch64.sve.zip2.b16(<vscale x 16 x i1> [[OP1:%.]], <vscale x 16 x i1> [[OP2:%.*]])
	// CPP-CHECK-NEXT: [[TMP1:%.]] = tail call <vscale x 8 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv8i1(<vscale x 16 x i1> [[OP2:%.]])			// CPP-CHECK-NEXT: ret <vscale x 16 x i1> [[TMP0]]
	// CPP-CHECK-NEXT: [[TMP2:%.*]] = tail call <vscale x 8 x i1> @llvm.aarch64.sve.zip2.nxv8i1(<vscale x 8 x i1> [[TMP0]], <vscale x 8 x i1> [[TMP1]])
	// CPP-CHECK-NEXT: [[TMP3:%.*]] = tail call <vscale x 16 x i1> @llvm.aarch64.sve.convert.to.svbool.nxv8i1(<vscale x 8 x i1> [[TMP2]])
	// CPP-CHECK-NEXT: ret <vscale x 16 x i1> [[TMP3]]
	//			//
	svbool_t test_svzip2_b16(svbool_t op1, svbool_t op2)			svbool_t test_svzip2_b16(svbool_t op1, svbool_t op2)
	{			{
	return svzip2_b16(op1, op2);			return svzip2_b16(op1, op2);
	}			}

	// CHECK-LABEL: @test_svzip2_b32(			// CHECK-LABEL: @test_svzip2_b32(
	// CHECK-NEXT: entry:			// CHECK-NEXT: entry:
	// CHECK-NEXT: [[TMP0:%.]] = tail call <vscale x 4 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv4i1(<vscale x 16 x i1> [[OP1:%.]])			// CHECK-NEXT: [[TMP0:%.]] = tail call <vscale x 16 x i1> @llvm.aarch64.sve.zip2.b32(<vscale x 16 x i1> [[OP1:%.]], <vscale x 16 x i1> [[OP2:%.*]])
	// CHECK-NEXT: [[TMP1:%.]] = tail call <vscale x 4 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv4i1(<vscale x 16 x i1> [[OP2:%.]])			// CHECK-NEXT: ret <vscale x 16 x i1> [[TMP0]]
	// CHECK-NEXT: [[TMP2:%.*]] = tail call <vscale x 4 x i1> @llvm.aarch64.sve.zip2.nxv4i1(<vscale x 4 x i1> [[TMP0]], <vscale x 4 x i1> [[TMP1]])
	// CHECK-NEXT: [[TMP3:%.*]] = tail call <vscale x 16 x i1> @llvm.aarch64.sve.convert.to.svbool.nxv4i1(<vscale x 4 x i1> [[TMP2]])
	// CHECK-NEXT: ret <vscale x 16 x i1> [[TMP3]]
	//			//
	// CPP-CHECK-LABEL: @_Z15test_svzip2_b32u10__SVBool_tu10__SVBool_t(			// CPP-CHECK-LABEL: @_Z15test_svzip2_b32u10__SVBool_tu10__SVBool_t(
	// CPP-CHECK-NEXT: entry:			// CPP-CHECK-NEXT: entry:
	// CPP-CHECK-NEXT: [[TMP0:%.]] = tail call <vscale x 4 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv4i1(<vscale x 16 x i1> [[OP1:%.]])			// CPP-CHECK-NEXT: [[TMP0:%.]] = tail call <vscale x 16 x i1> @llvm.aarch64.sve.zip2.b32(<vscale x 16 x i1> [[OP1:%.]], <vscale x 16 x i1> [[OP2:%.*]])
	// CPP-CHECK-NEXT: [[TMP1:%.]] = tail call <vscale x 4 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv4i1(<vscale x 16 x i1> [[OP2:%.]])			// CPP-CHECK-NEXT: ret <vscale x 16 x i1> [[TMP0]]
	// CPP-CHECK-NEXT: [[TMP2:%.*]] = tail call <vscale x 4 x i1> @llvm.aarch64.sve.zip2.nxv4i1(<vscale x 4 x i1> [[TMP0]], <vscale x 4 x i1> [[TMP1]])
	// CPP-CHECK-NEXT: [[TMP3:%.*]] = tail call <vscale x 16 x i1> @llvm.aarch64.sve.convert.to.svbool.nxv4i1(<vscale x 4 x i1> [[TMP2]])
	// CPP-CHECK-NEXT: ret <vscale x 16 x i1> [[TMP3]]
	//			//
	svbool_t test_svzip2_b32(svbool_t op1, svbool_t op2)			svbool_t test_svzip2_b32(svbool_t op1, svbool_t op2)
	{			{
	return svzip2_b32(op1, op2);			return svzip2_b32(op1, op2);
	}			}

	// CHECK-LABEL: @test_svzip2_b64(			// CHECK-LABEL: @test_svzip2_b64(
	// CHECK-NEXT: entry:			// CHECK-NEXT: entry:
	// CHECK-NEXT: [[TMP0:%.]] = tail call <vscale x 2 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv2i1(<vscale x 16 x i1> [[OP1:%.]])			// CHECK-NEXT: [[TMP0:%.]] = tail call <vscale x 16 x i1> @llvm.aarch64.sve.zip2.b64(<vscale x 16 x i1> [[OP1:%.]], <vscale x 16 x i1> [[OP2:%.*]])
	// CHECK-NEXT: [[TMP1:%.]] = tail call <vscale x 2 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv2i1(<vscale x 16 x i1> [[OP2:%.]])			// CHECK-NEXT: ret <vscale x 16 x i1> [[TMP0]]
	// CHECK-NEXT: [[TMP2:%.*]] = tail call <vscale x 2 x i1> @llvm.aarch64.sve.zip2.nxv2i1(<vscale x 2 x i1> [[TMP0]], <vscale x 2 x i1> [[TMP1]])
	// CHECK-NEXT: [[TMP3:%.*]] = tail call <vscale x 16 x i1> @llvm.aarch64.sve.convert.to.svbool.nxv2i1(<vscale x 2 x i1> [[TMP2]])
	// CHECK-NEXT: ret <vscale x 16 x i1> [[TMP3]]
	//			//
	// CPP-CHECK-LABEL: @_Z15test_svzip2_b64u10__SVBool_tu10__SVBool_t(			// CPP-CHECK-LABEL: @_Z15test_svzip2_b64u10__SVBool_tu10__SVBool_t(
	// CPP-CHECK-NEXT: entry:			// CPP-CHECK-NEXT: entry:
	// CPP-CHECK-NEXT: [[TMP0:%.]] = tail call <vscale x 2 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv2i1(<vscale x 16 x i1> [[OP1:%.]])			// CPP-CHECK-NEXT: [[TMP0:%.]] = tail call <vscale x 16 x i1> @llvm.aarch64.sve.zip2.b64(<vscale x 16 x i1> [[OP1:%.]], <vscale x 16 x i1> [[OP2:%.*]])
	// CPP-CHECK-NEXT: [[TMP1:%.]] = tail call <vscale x 2 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv2i1(<vscale x 16 x i1> [[OP2:%.]])			// CPP-CHECK-NEXT: ret <vscale x 16 x i1> [[TMP0]]
	// CPP-CHECK-NEXT: [[TMP2:%.*]] = tail call <vscale x 2 x i1> @llvm.aarch64.sve.zip2.nxv2i1(<vscale x 2 x i1> [[TMP0]], <vscale x 2 x i1> [[TMP1]])
	// CPP-CHECK-NEXT: [[TMP3:%.*]] = tail call <vscale x 16 x i1> @llvm.aarch64.sve.convert.to.svbool.nxv2i1(<vscale x 2 x i1> [[TMP2]])
	// CPP-CHECK-NEXT: ret <vscale x 16 x i1> [[TMP3]]
	//			//
	svbool_t test_svzip2_b64(svbool_t op1, svbool_t op2)			svbool_t test_svzip2_b64(svbool_t op1, svbool_t op2)
	{			{
	return svzip2_b64(op1, op2);			return svzip2_b64(op1, op2);
	}			}

llvm/include/llvm/IR/IntrinsicsAArch64.td

Show First 20 Lines • Show All 1,386 Lines • ▼ Show 20 Lines	class Builtin_SVCVT<LLVMType OUT, LLVMType PRED, LLVMType IN>
: DefaultAttrsIntrinsic<[OUT], [OUT, PRED, IN], [IntrNoMem]>;		: DefaultAttrsIntrinsic<[OUT], [OUT, PRED, IN], [IntrNoMem]>;
}		}

//===----------------------------------------------------------------------===//		//===----------------------------------------------------------------------===//
// SVE		// SVE

let TargetPrefix = "aarch64" in { // All intrinsics start with "llvm.aarch64.".		let TargetPrefix = "aarch64" in { // All intrinsics start with "llvm.aarch64.".

		class AdvSIMD_SVE_2SVBoolArg_Intrinsic
		: DefaultAttrsIntrinsic<[llvm_nxv16i1_ty],
		[llvm_nxv16i1_ty],
		[IntrNoMem]>;

		class AdvSIMD_SVE_3SVBoolArg_Intrinsic
		: DefaultAttrsIntrinsic<[llvm_nxv16i1_ty],
		[llvm_nxv16i1_ty, llvm_nxv16i1_ty],
		[IntrNoMem]>;

class AdvSIMD_SVE_Reduce_Intrinsic		class AdvSIMD_SVE_Reduce_Intrinsic
: DefaultAttrsIntrinsic<[LLVMVectorElementType<0>],		: DefaultAttrsIntrinsic<[LLVMVectorElementType<0>],
[LLVMScalarOrSameVectorWidth<0, llvm_i1_ty>,		[LLVMScalarOrSameVectorWidth<0, llvm_i1_ty>,
llvm_anyvector_ty],		llvm_anyvector_ty],
[IntrNoMem]>;		[IntrNoMem]>;

class AdvSIMD_SVE_SADDV_Reduce_Intrinsic		class AdvSIMD_SVE_SADDV_Reduce_Intrinsic
: DefaultAttrsIntrinsic<[llvm_i64_ty],		: DefaultAttrsIntrinsic<[llvm_i64_ty],
▲ Show 20 Lines • Show All 429 Lines • ▼ Show 20 Lines
def int_aarch64_sve_clastb_n : AdvSIMD_SVE_ReduceWithInit_Intrinsic;		def int_aarch64_sve_clastb_n : AdvSIMD_SVE_ReduceWithInit_Intrinsic;
def int_aarch64_sve_compact : AdvSIMD_Pred1VectorArg_Intrinsic;		def int_aarch64_sve_compact : AdvSIMD_Pred1VectorArg_Intrinsic;
def int_aarch64_sve_dupq_lane : AdvSIMD_SVE_DUPQ_Intrinsic;		def int_aarch64_sve_dupq_lane : AdvSIMD_SVE_DUPQ_Intrinsic;
def int_aarch64_sve_ext : AdvSIMD_2VectorArgIndexed_Intrinsic;		def int_aarch64_sve_ext : AdvSIMD_2VectorArgIndexed_Intrinsic;
def int_aarch64_sve_sel : AdvSIMD_Pred2VectorArg_Intrinsic;		def int_aarch64_sve_sel : AdvSIMD_Pred2VectorArg_Intrinsic;
def int_aarch64_sve_lasta : AdvSIMD_SVE_Reduce_Intrinsic;		def int_aarch64_sve_lasta : AdvSIMD_SVE_Reduce_Intrinsic;
def int_aarch64_sve_lastb : AdvSIMD_SVE_Reduce_Intrinsic;		def int_aarch64_sve_lastb : AdvSIMD_SVE_Reduce_Intrinsic;
def int_aarch64_sve_rev : AdvSIMD_1VectorArg_Intrinsic;		def int_aarch64_sve_rev : AdvSIMD_1VectorArg_Intrinsic;
		def int_aarch64_sve_rev_b16 : AdvSIMD_SVE_2SVBoolArg_Intrinsic;
		def int_aarch64_sve_rev_b32 : AdvSIMD_SVE_2SVBoolArg_Intrinsic;
		def int_aarch64_sve_rev_b64 : AdvSIMD_SVE_2SVBoolArg_Intrinsic;
def int_aarch64_sve_splice : AdvSIMD_Pred2VectorArg_Intrinsic;		def int_aarch64_sve_splice : AdvSIMD_Pred2VectorArg_Intrinsic;
def int_aarch64_sve_sunpkhi : AdvSIMD_SVE_Unpack_Intrinsic;		def int_aarch64_sve_sunpkhi : AdvSIMD_SVE_Unpack_Intrinsic;
def int_aarch64_sve_sunpklo : AdvSIMD_SVE_Unpack_Intrinsic;		def int_aarch64_sve_sunpklo : AdvSIMD_SVE_Unpack_Intrinsic;
def int_aarch64_sve_tbl : AdvSIMD_SVE_TBL_Intrinsic;		def int_aarch64_sve_tbl : AdvSIMD_SVE_TBL_Intrinsic;
def int_aarch64_sve_trn1 : AdvSIMD_2VectorArg_Intrinsic;		def int_aarch64_sve_trn1 : AdvSIMD_2VectorArg_Intrinsic;
		def int_aarch64_sve_trn1_b16 : AdvSIMD_SVE_3SVBoolArg_Intrinsic;
		def int_aarch64_sve_trn1_b32 : AdvSIMD_SVE_3SVBoolArg_Intrinsic;
		def int_aarch64_sve_trn1_b64 : AdvSIMD_SVE_3SVBoolArg_Intrinsic;
def int_aarch64_sve_trn2 : AdvSIMD_2VectorArg_Intrinsic;		def int_aarch64_sve_trn2 : AdvSIMD_2VectorArg_Intrinsic;
		def int_aarch64_sve_trn2_b16 : AdvSIMD_SVE_3SVBoolArg_Intrinsic;
		def int_aarch64_sve_trn2_b32 : AdvSIMD_SVE_3SVBoolArg_Intrinsic;
		def int_aarch64_sve_trn2_b64 : AdvSIMD_SVE_3SVBoolArg_Intrinsic;
def int_aarch64_sve_trn1q : AdvSIMD_2VectorArg_Intrinsic;		def int_aarch64_sve_trn1q : AdvSIMD_2VectorArg_Intrinsic;
def int_aarch64_sve_trn2q : AdvSIMD_2VectorArg_Intrinsic;		def int_aarch64_sve_trn2q : AdvSIMD_2VectorArg_Intrinsic;
def int_aarch64_sve_uunpkhi : AdvSIMD_SVE_Unpack_Intrinsic;		def int_aarch64_sve_uunpkhi : AdvSIMD_SVE_Unpack_Intrinsic;
def int_aarch64_sve_uunpklo : AdvSIMD_SVE_Unpack_Intrinsic;		def int_aarch64_sve_uunpklo : AdvSIMD_SVE_Unpack_Intrinsic;
def int_aarch64_sve_uzp1 : AdvSIMD_2VectorArg_Intrinsic;		def int_aarch64_sve_uzp1 : AdvSIMD_2VectorArg_Intrinsic;
		def int_aarch64_sve_uzp1_b16 : AdvSIMD_SVE_3SVBoolArg_Intrinsic;
		def int_aarch64_sve_uzp1_b32 : AdvSIMD_SVE_3SVBoolArg_Intrinsic;
		def int_aarch64_sve_uzp1_b64 : AdvSIMD_SVE_3SVBoolArg_Intrinsic;
def int_aarch64_sve_uzp2 : AdvSIMD_2VectorArg_Intrinsic;		def int_aarch64_sve_uzp2 : AdvSIMD_2VectorArg_Intrinsic;
		def int_aarch64_sve_uzp2_b16 : AdvSIMD_SVE_3SVBoolArg_Intrinsic;
		def int_aarch64_sve_uzp2_b32 : AdvSIMD_SVE_3SVBoolArg_Intrinsic;
		def int_aarch64_sve_uzp2_b64 : AdvSIMD_SVE_3SVBoolArg_Intrinsic;
def int_aarch64_sve_uzp1q : AdvSIMD_2VectorArg_Intrinsic;		def int_aarch64_sve_uzp1q : AdvSIMD_2VectorArg_Intrinsic;
def int_aarch64_sve_uzp2q : AdvSIMD_2VectorArg_Intrinsic;		def int_aarch64_sve_uzp2q : AdvSIMD_2VectorArg_Intrinsic;
def int_aarch64_sve_zip1 : AdvSIMD_2VectorArg_Intrinsic;		def int_aarch64_sve_zip1 : AdvSIMD_2VectorArg_Intrinsic;
		def int_aarch64_sve_zip1_b16 : AdvSIMD_SVE_3SVBoolArg_Intrinsic;
		def int_aarch64_sve_zip1_b32 : AdvSIMD_SVE_3SVBoolArg_Intrinsic;
		def int_aarch64_sve_zip1_b64 : AdvSIMD_SVE_3SVBoolArg_Intrinsic;
def int_aarch64_sve_zip2 : AdvSIMD_2VectorArg_Intrinsic;		def int_aarch64_sve_zip2 : AdvSIMD_2VectorArg_Intrinsic;
		def int_aarch64_sve_zip2_b16 : AdvSIMD_SVE_3SVBoolArg_Intrinsic;
		def int_aarch64_sve_zip2_b32 : AdvSIMD_SVE_3SVBoolArg_Intrinsic;
		def int_aarch64_sve_zip2_b64 : AdvSIMD_SVE_3SVBoolArg_Intrinsic;
def int_aarch64_sve_zip1q : AdvSIMD_2VectorArg_Intrinsic;		def int_aarch64_sve_zip1q : AdvSIMD_2VectorArg_Intrinsic;
def int_aarch64_sve_zip2q : AdvSIMD_2VectorArg_Intrinsic;		def int_aarch64_sve_zip2q : AdvSIMD_2VectorArg_Intrinsic;

//		//
// Logical operations		// Logical operations
//		//

def int_aarch64_sve_and : AdvSIMD_Pred2VectorArg_Intrinsic;		def int_aarch64_sve_and : AdvSIMD_Pred2VectorArg_Intrinsic;
▲ Show 20 Lines • Show All 1,241 Lines • Show Last 20 Lines

llvm/lib/Target/AArch64/AArch64SVEInstrInfo.td

Show First 20 Lines • Show All 833 Lines • ▼ Show 20 Lines	let Predicates = [HasSVEorSME] in {
defm INSR_ZV : sve_int_perm_insrv<"insr", AArch64insr>;		defm INSR_ZV : sve_int_perm_insrv<"insr", AArch64insr>;
defm EXT_ZZI : sve_int_perm_extract_i<"ext", AArch64ext>;		defm EXT_ZZI : sve_int_perm_extract_i<"ext", AArch64ext>;

defm RBIT_ZPmZ : sve_int_perm_rev_rbit<"rbit", AArch64rbit_mt>;		defm RBIT_ZPmZ : sve_int_perm_rev_rbit<"rbit", AArch64rbit_mt>;
defm REVB_ZPmZ : sve_int_perm_rev_revb<"revb", AArch64revb_mt>;		defm REVB_ZPmZ : sve_int_perm_rev_revb<"revb", AArch64revb_mt>;
defm REVH_ZPmZ : sve_int_perm_rev_revh<"revh", AArch64revh_mt>;		defm REVH_ZPmZ : sve_int_perm_rev_revh<"revh", AArch64revh_mt>;
defm REVW_ZPmZ : sve_int_perm_rev_revw<"revw", AArch64revw_mt>;		defm REVW_ZPmZ : sve_int_perm_rev_revw<"revw", AArch64revw_mt>;

defm REV_PP : sve_int_perm_reverse_p<"rev", vector_reverse>;		defm REV_PP : sve_int_perm_reverse_p<"rev", vector_reverse, int_aarch64_sve_rev_b16, int_aarch64_sve_rev_b32, int_aarch64_sve_rev_b64>;
defm REV_ZZ : sve_int_perm_reverse_z<"rev", vector_reverse>;		defm REV_ZZ : sve_int_perm_reverse_z<"rev", vector_reverse>;

defm SUNPKLO_ZZ : sve_int_perm_unpk<0b00, "sunpklo", AArch64sunpklo>;		defm SUNPKLO_ZZ : sve_int_perm_unpk<0b00, "sunpklo", AArch64sunpklo>;
defm SUNPKHI_ZZ : sve_int_perm_unpk<0b01, "sunpkhi", AArch64sunpkhi>;		defm SUNPKHI_ZZ : sve_int_perm_unpk<0b01, "sunpkhi", AArch64sunpkhi>;
defm UUNPKLO_ZZ : sve_int_perm_unpk<0b10, "uunpklo", AArch64uunpklo>;		defm UUNPKLO_ZZ : sve_int_perm_unpk<0b10, "uunpklo", AArch64uunpklo>;
defm UUNPKHI_ZZ : sve_int_perm_unpk<0b11, "uunpkhi", AArch64uunpkhi>;		defm UUNPKHI_ZZ : sve_int_perm_unpk<0b11, "uunpkhi", AArch64uunpkhi>;

defm PUNPKLO_PP : sve_int_perm_punpk<0b0, "punpklo", int_aarch64_sve_punpklo>;		defm PUNPKLO_PP : sve_int_perm_punpk<0b0, "punpklo", int_aarch64_sve_punpklo>;
▲ Show 20 Lines • Show All 816 Lines • ▼ Show 20 Lines	let Predicates = [HasSVEorSME] in {

defm ZIP1_ZZZ : sve_int_perm_bin_perm_zz<0b000, "zip1", AArch64zip1>;		defm ZIP1_ZZZ : sve_int_perm_bin_perm_zz<0b000, "zip1", AArch64zip1>;
defm ZIP2_ZZZ : sve_int_perm_bin_perm_zz<0b001, "zip2", AArch64zip2>;		defm ZIP2_ZZZ : sve_int_perm_bin_perm_zz<0b001, "zip2", AArch64zip2>;
defm UZP1_ZZZ : sve_int_perm_bin_perm_zz<0b010, "uzp1", AArch64uzp1>;		defm UZP1_ZZZ : sve_int_perm_bin_perm_zz<0b010, "uzp1", AArch64uzp1>;
defm UZP2_ZZZ : sve_int_perm_bin_perm_zz<0b011, "uzp2", AArch64uzp2>;		defm UZP2_ZZZ : sve_int_perm_bin_perm_zz<0b011, "uzp2", AArch64uzp2>;
defm TRN1_ZZZ : sve_int_perm_bin_perm_zz<0b100, "trn1", AArch64trn1>;		defm TRN1_ZZZ : sve_int_perm_bin_perm_zz<0b100, "trn1", AArch64trn1>;
defm TRN2_ZZZ : sve_int_perm_bin_perm_zz<0b101, "trn2", AArch64trn2>;		defm TRN2_ZZZ : sve_int_perm_bin_perm_zz<0b101, "trn2", AArch64trn2>;

defm ZIP1_PPP : sve_int_perm_bin_perm_pp<0b000, "zip1", AArch64zip1>;		defm ZIP1_PPP : sve_int_perm_bin_perm_pp<0b000, "zip1", AArch64zip1, int_aarch64_sve_zip1_b16, int_aarch64_sve_zip1_b32, int_aarch64_sve_zip1_b64>;
defm ZIP2_PPP : sve_int_perm_bin_perm_pp<0b001, "zip2", AArch64zip2>;		defm ZIP2_PPP : sve_int_perm_bin_perm_pp<0b001, "zip2", AArch64zip2, int_aarch64_sve_zip2_b16, int_aarch64_sve_zip2_b32, int_aarch64_sve_zip2_b64>;
defm UZP1_PPP : sve_int_perm_bin_perm_pp<0b010, "uzp1", AArch64uzp1>;		defm UZP1_PPP : sve_int_perm_bin_perm_pp<0b010, "uzp1", AArch64uzp1, int_aarch64_sve_uzp1_b16, int_aarch64_sve_uzp1_b32, int_aarch64_sve_uzp1_b64>;
defm UZP2_PPP : sve_int_perm_bin_perm_pp<0b011, "uzp2", AArch64uzp2>;		defm UZP2_PPP : sve_int_perm_bin_perm_pp<0b011, "uzp2", AArch64uzp2, int_aarch64_sve_uzp2_b16, int_aarch64_sve_uzp2_b32, int_aarch64_sve_uzp2_b64>;
defm TRN1_PPP : sve_int_perm_bin_perm_pp<0b100, "trn1", AArch64trn1>;		defm TRN1_PPP : sve_int_perm_bin_perm_pp<0b100, "trn1", AArch64trn1, int_aarch64_sve_trn1_b16, int_aarch64_sve_trn1_b32, int_aarch64_sve_trn1_b64>;
defm TRN2_PPP : sve_int_perm_bin_perm_pp<0b101, "trn2", AArch64trn2>;		defm TRN2_PPP : sve_int_perm_bin_perm_pp<0b101, "trn2", AArch64trn2, int_aarch64_sve_trn2_b16, int_aarch64_sve_trn2_b32, int_aarch64_sve_trn2_b64>;

// Extract lo/hi halves of legal predicate types.		// Extract lo/hi halves of legal predicate types.
def : Pat<(nxv1i1 (extract_subvector (nxv2i1 PPR:$Ps), (i64 0))),		def : Pat<(nxv1i1 (extract_subvector (nxv2i1 PPR:$Ps), (i64 0))),
(PUNPKLO_PP PPR:$Ps)>;		(PUNPKLO_PP PPR:$Ps)>;
def : Pat<(nxv1i1 (extract_subvector (nxv2i1 PPR:$Ps), (i64 1))),		def : Pat<(nxv1i1 (extract_subvector (nxv2i1 PPR:$Ps), (i64 1))),
(PUNPKHI_PP PPR:$Ps)>;		(PUNPKHI_PP PPR:$Ps)>;
def : Pat<(nxv2i1 (extract_subvector (nxv4i1 PPR:$Ps), (i64 0))),		def : Pat<(nxv2i1 (extract_subvector (nxv4i1 PPR:$Ps), (i64 0))),
(PUNPKLO_PP PPR:$Ps)>;		(PUNPKLO_PP PPR:$Ps)>;
▲ Show 20 Lines • Show All 2,163 Lines • Show Last 20 Lines

llvm/lib/Target/AArch64/SVEInstrFormats.td

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 1,467 Lines • ▼ Show 20 Lines	multiclass sve_int_perm_reverse_z<string asm, SDPatternOperator op> {
def : SVE_1_Op_Pat<nxv4f32, op, nxv4f32, !cast<Instruction>(NAME # _S)>;		def : SVE_1_Op_Pat<nxv4f32, op, nxv4f32, !cast<Instruction>(NAME # _S)>;
def : SVE_1_Op_Pat<nxv2f64, op, nxv2f64, !cast<Instruction>(NAME # _D)>;		def : SVE_1_Op_Pat<nxv2f64, op, nxv2f64, !cast<Instruction>(NAME # _D)>;

def : SVE_1_Op_Pat<nxv2bf16, op, nxv2bf16, !cast<Instruction>(NAME # _D)>;		def : SVE_1_Op_Pat<nxv2bf16, op, nxv2bf16, !cast<Instruction>(NAME # _D)>;
def : SVE_1_Op_Pat<nxv4bf16, op, nxv4bf16, !cast<Instruction>(NAME # _S)>;		def : SVE_1_Op_Pat<nxv4bf16, op, nxv4bf16, !cast<Instruction>(NAME # _S)>;
def : SVE_1_Op_Pat<nxv8bf16, op, nxv8bf16, !cast<Instruction>(NAME # _H)>;		def : SVE_1_Op_Pat<nxv8bf16, op, nxv8bf16, !cast<Instruction>(NAME # _H)>;
}		}

class sve_int_perm_reverse_p<bits<2> sz8_64, string asm, PPRRegOp pprty>		class sve_int_perm_reverse_p<bits<2> sz8_64, string asm, PPRRegOp pprty,
		SDPatternOperator op>
: I<(outs pprty:$Pd), (ins pprty:$Pn),		: I<(outs pprty:$Pd), (ins pprty:$Pn),
asm, "\t$Pd, $Pn",		asm, "\t$Pd, $Pn",
"",		"",
[]>, Sched<[]> {		[(set nxv16i1:$Pd, (op nxv16i1:$Pn))]>, Sched<[]> {
bits<4> Pd;		bits<4> Pd;
bits<4> Pn;		bits<4> Pn;
let Inst{31-24} = 0b00000101;		let Inst{31-24} = 0b00000101;
let Inst{23-22} = sz8_64;		let Inst{23-22} = sz8_64;
let Inst{21-9} = 0b1101000100000;		let Inst{21-9} = 0b1101000100000;
let Inst{8-5} = Pn;		let Inst{8-5} = Pn;
let Inst{4} = 0b0;		let Inst{4} = 0b0;
let Inst{3-0} = Pd;		let Inst{3-0} = Pd;

let hasSideEffects = 0;		let hasSideEffects = 0;
}		}

multiclass sve_int_perm_reverse_p<string asm, SDPatternOperator op> {		multiclass sve_int_perm_reverse_p<string asm, SDPatternOperator ir_op,
def _B : sve_int_perm_reverse_p<0b00, asm, PPR8>;		SDPatternOperator op_b16,
def _H : sve_int_perm_reverse_p<0b01, asm, PPR16>;		SDPatternOperator op_b32,
def _S : sve_int_perm_reverse_p<0b10, asm, PPR32>;		SDPatternOperator op_b64> {
def _D : sve_int_perm_reverse_p<0b11, asm, PPR64>;		def _B : sve_int_perm_reverse_p<0b00, asm, PPR8, ir_op>;
		def _H : sve_int_perm_reverse_p<0b01, asm, PPR16, op_b16>;
def : SVE_1_Op_Pat<nxv16i1, op, nxv16i1, !cast<Instruction>(NAME # _B)>;		def _S : sve_int_perm_reverse_p<0b10, asm, PPR32, op_b32>;
def : SVE_1_Op_Pat<nxv8i1, op, nxv8i1, !cast<Instruction>(NAME # _H)>;		def _D : sve_int_perm_reverse_p<0b11, asm, PPR64, op_b64>;
def : SVE_1_Op_Pat<nxv4i1, op, nxv4i1, !cast<Instruction>(NAME # _S)>;
def : SVE_1_Op_Pat<nxv2i1, op, nxv2i1, !cast<Instruction>(NAME # _D)>;		def : SVE_1_Op_Pat<nxv8i1, ir_op, nxv8i1, !cast<Instruction>(NAME # _H)>;
		def : SVE_1_Op_Pat<nxv4i1, ir_op, nxv4i1, !cast<Instruction>(NAME # _S)>;
		def : SVE_1_Op_Pat<nxv2i1, ir_op, nxv2i1, !cast<Instruction>(NAME # _D)>;
}		}

class sve_int_perm_unpk<bits<2> sz16_64, bits<2> opc, string asm,		class sve_int_perm_unpk<bits<2> sz16_64, bits<2> opc, string asm,
ZPRRegOp zprty1, ZPRRegOp zprty2>		ZPRRegOp zprty1, ZPRRegOp zprty2>
: I<(outs zprty1:$Zd), (ins zprty2:$Zn),		: I<(outs zprty1:$Zd), (ins zprty2:$Zn),
asm, "\t$Zd, $Zn",		asm, "\t$Zd, $Zn",
"", []>, Sched<[]> {		"", []>, Sched<[]> {
bits<5> Zd;		bits<5> Zd;
▲ Show 20 Lines • Show All 4,984 Lines • ▼ Show 20 Lines	def : InstAlias<asm # "\t$Pt, [$Rn]",
(!cast<Instruction>(NAME) PPRAny:$Pt, GPR64sp:$Rn, 0), 1>;		(!cast<Instruction>(NAME) PPRAny:$Pt, GPR64sp:$Rn, 0), 1>;
}		}

//===----------------------------------------------------------------------===//		//===----------------------------------------------------------------------===//
// SVE Permute - Predicates Group		// SVE Permute - Predicates Group
//===----------------------------------------------------------------------===//		//===----------------------------------------------------------------------===//

class sve_int_perm_bin_perm_pp<bits<3> opc, bits<2> sz8_64, string asm,		class sve_int_perm_bin_perm_pp<bits<3> opc, bits<2> sz8_64, string asm,
PPRRegOp pprty>		PPRRegOp pprty, SDPatternOperator op>
: I<(outs pprty:$Pd), (ins pprty:$Pn, pprty:$Pm),		: I<(outs pprty:$Pd), (ins pprty:$Pn, pprty:$Pm),
asm, "\t$Pd, $Pn, $Pm",		asm, "\t$Pd, $Pn, $Pm",
"", []>, Sched<[]> {		"",
		[(set nxv16i1:$Pd, (op nxv16i1:$Pn, nxv16i1:$Pm))]>, Sched<[]> {
bits<4> Pd;		bits<4> Pd;
bits<4> Pm;		bits<4> Pm;
bits<4> Pn;		bits<4> Pn;
let Inst{31-24} = 0b00000101;		let Inst{31-24} = 0b00000101;
let Inst{23-22} = sz8_64;		let Inst{23-22} = sz8_64;
let Inst{21-20} = 0b10;		let Inst{21-20} = 0b10;
let Inst{19-16} = Pm;		let Inst{19-16} = Pm;
let Inst{15-13} = 0b010;		let Inst{15-13} = 0b010;
let Inst{12-10} = opc;		let Inst{12-10} = opc;
let Inst{9} = 0b0;		let Inst{9} = 0b0;
let Inst{8-5} = Pn;		let Inst{8-5} = Pn;
let Inst{4} = 0b0;		let Inst{4} = 0b0;
let Inst{3-0} = Pd;		let Inst{3-0} = Pd;

let hasSideEffects = 0;		let hasSideEffects = 0;
}		}

multiclass sve_int_perm_bin_perm_pp<bits<3> opc, string asm,		multiclass sve_int_perm_bin_perm_pp<bits<3> opc, string asm,
SDPatternOperator op> {		SDPatternOperator ir_op,
def _B : sve_int_perm_bin_perm_pp<opc, 0b00, asm, PPR8>;		SDPatternOperator op_b16,
def _H : sve_int_perm_bin_perm_pp<opc, 0b01, asm, PPR16>;		SDPatternOperator op_b32,
def _S : sve_int_perm_bin_perm_pp<opc, 0b10, asm, PPR32>;		SDPatternOperator op_b64> {
def _D : sve_int_perm_bin_perm_pp<opc, 0b11, asm, PPR64>;		def _B : sve_int_perm_bin_perm_pp<opc, 0b00, asm, PPR8, ir_op>;
		def _H : sve_int_perm_bin_perm_pp<opc, 0b01, asm, PPR16, op_b16>;
def : SVE_2_Op_Pat<nxv16i1, op, nxv16i1, nxv16i1, !cast<Instruction>(NAME # _B)>;		def _S : sve_int_perm_bin_perm_pp<opc, 0b10, asm, PPR32, op_b32>;
def : SVE_2_Op_Pat<nxv8i1, op, nxv8i1, nxv8i1, !cast<Instruction>(NAME # _H)>;		def _D : sve_int_perm_bin_perm_pp<opc, 0b11, asm, PPR64, op_b64>;
def : SVE_2_Op_Pat<nxv4i1, op, nxv4i1, nxv4i1, !cast<Instruction>(NAME # _S)>;
def : SVE_2_Op_Pat<nxv2i1, op, nxv2i1, nxv2i1, !cast<Instruction>(NAME # _D)>;		def : SVE_2_Op_Pat<nxv8i1, ir_op, nxv8i1, nxv8i1, !cast<Instruction>(NAME # _H)>;
		def : SVE_2_Op_Pat<nxv4i1, ir_op, nxv4i1, nxv4i1, !cast<Instruction>(NAME # _S)>;
		def : SVE_2_Op_Pat<nxv2i1, ir_op, nxv2i1, nxv2i1, !cast<Instruction>(NAME # _D)>;
		peterwaller-armUnsubmitted Not Done Reply Inline Actions Out of interest, is there a good reason to handle the nxv16 pattern case differently in the `I` multiclass args? Written this way at a glance it looks like it is missing. peterwaller-arm: Out of interest, is there a good reason to handle the nxv16 pattern case differently in the `I`…
		paulwalker-armAuthorUnsubmitted Done Reply Inline Actions My reasoning was the pattern within the instruction class is mandatory for the correct clang builtin support so I figured that should take priority. That means extra patterns are only required for the unpacked cases, which are optional based on them having value during code generation. paulwalker-arm: My reasoning was the pattern within the instruction class is mandatory for the correct clang…
}		}

class sve_int_perm_punpk<bit opc, string asm>		class sve_int_perm_punpk<bit opc, string asm>
: I<(outs PPR16:$Pd), (ins PPR8:$Pn),		: I<(outs PPR16:$Pd), (ins PPR8:$Pn),
asm, "\t$Pd, $Pn",		asm, "\t$Pd, $Pn",
"",		"",
[]>, Sched<[]> {		[]>, Sched<[]> {
bits<4> Pd;		bits<4> Pd;
▲ Show 20 Lines • Show All 3,302 Lines • Show Last 20 Lines

llvm/test/CodeGen/AArch64/sve-intrinsics-perm-select.ll

Show First 20 Lines • Show All 936 Lines • ▼ Show 20 Lines	%out = call <vscale x 2 x double> @llvm.aarch64.sve.compact.nxv2f64(<vscale x 2 x i1> %pg,
<vscale x 2 x double> %a)		<vscale x 2 x double> %a)
ret <vscale x 2 x double> %out		ret <vscale x 2 x double> %out
}		}

;		;
; REV		; REV
;		;

define <vscale x 16 x i1> @rev_b8( <vscale x 16 x i1> %a) {		define <vscale x 16 x i1> @rev_nxv16i1(<vscale x 16 x i1> %a) {
; CHECK-LABEL: rev_b8:		; CHECK-LABEL: rev_nxv16i1:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: rev p0.b, p0.b		; CHECK-NEXT: rev p0.b, p0.b
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%res = call <vscale x 16 x i1> @llvm.aarch64.sve.rev.nxv16i1(<vscale x 16 x i1> %a)		%res = call <vscale x 16 x i1> @llvm.aarch64.sve.rev.nxv16i1(<vscale x 16 x i1> %a)
ret <vscale x 16 x i1> %res		ret <vscale x 16 x i1> %res
}		}

define <vscale x 8 x i1> @rev_b16(<vscale x 8 x i1> %a) {		define <vscale x 8 x i1> @rev_nxv8i1(<vscale x 8 x i1> %a) {
; CHECK-LABEL: rev_b16:		; CHECK-LABEL: rev_nxv8i1:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: rev p0.h, p0.h		; CHECK-NEXT: rev p0.h, p0.h
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%res = call <vscale x 8 x i1> @llvm.aarch64.sve.rev.nxv8i1(<vscale x 8 x i1> %a)		%res = call <vscale x 8 x i1> @llvm.aarch64.sve.rev.nxv8i1(<vscale x 8 x i1> %a)
ret <vscale x 8 x i1> %res		ret <vscale x 8 x i1> %res
}		}

define <vscale x 4 x i1> @rev_b32(<vscale x 4 x i1> %a) {		define <vscale x 4 x i1> @rev_nxv4i1(<vscale x 4 x i1> %a) {
; CHECK-LABEL: rev_b32:		; CHECK-LABEL: rev_nxv4i1:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: rev p0.s, p0.s		; CHECK-NEXT: rev p0.s, p0.s
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%res = call <vscale x 4 x i1> @llvm.aarch64.sve.rev.nxv4i1(<vscale x 4 x i1> %a)		%res = call <vscale x 4 x i1> @llvm.aarch64.sve.rev.nxv4i1(<vscale x 4 x i1> %a)
ret <vscale x 4 x i1> %res		ret <vscale x 4 x i1> %res
}		}

define <vscale x 2 x i1> @rev_b64(<vscale x 2 x i1> %a) {		define <vscale x 2 x i1> @rev_nxv2i1(<vscale x 2 x i1> %a) {
; CHECK-LABEL: rev_b64:		; CHECK-LABEL: rev_nxv2i1:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: rev p0.d, p0.d		; CHECK-NEXT: rev p0.d, p0.d
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%res = call <vscale x 2 x i1> @llvm.aarch64.sve.rev.nxv2i1(<vscale x 2 x i1> %a)		%res = call <vscale x 2 x i1> @llvm.aarch64.sve.rev.nxv2i1(<vscale x 2 x i1> %a)
ret <vscale x 2 x i1> %res		ret <vscale x 2 x i1> %res
}		}

		define <vscale x 16 x i1> @rev_b16(<vscale x 16 x i1> %a) {
		; CHECK-LABEL: rev_b16:
		; CHECK: // %bb.0:
		; CHECK-NEXT: rev p0.h, p0.h
		; CHECK-NEXT: ret
		%res = call <vscale x 16 x i1> @llvm.aarch64.sve.rev.b16(<vscale x 16 x i1> %a)
		ret <vscale x 16 x i1> %res
		}

		define <vscale x 16 x i1> @rev_b32(<vscale x 16 x i1> %a) {
		; CHECK-LABEL: rev_b32:
		; CHECK: // %bb.0:
		; CHECK-NEXT: rev p0.s, p0.s
		; CHECK-NEXT: ret
		%res = call <vscale x 16 x i1> @llvm.aarch64.sve.rev.b32(<vscale x 16 x i1> %a)
		ret <vscale x 16 x i1> %res
		}

		define <vscale x 16 x i1> @rev_b64(<vscale x 16 x i1> %a) {
		; CHECK-LABEL: rev_b64:
		; CHECK: // %bb.0:
		; CHECK-NEXT: rev p0.d, p0.d
		; CHECK-NEXT: ret
		%res = call <vscale x 16 x i1> @llvm.aarch64.sve.rev.b64(<vscale x 16 x i1> %a)
		ret <vscale x 16 x i1> %res
		}

define <vscale x 16 x i8> @rev_i8( <vscale x 16 x i8> %a) {		define <vscale x 16 x i8> @rev_i8(<vscale x 16 x i8> %a) {
; CHECK-LABEL: rev_i8:		; CHECK-LABEL: rev_i8:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: rev z0.b, z0.b		; CHECK-NEXT: rev z0.b, z0.b
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%res = call <vscale x 16 x i8> @llvm.aarch64.sve.rev.nxv16i8(<vscale x 16 x i8> %a)		%res = call <vscale x 16 x i8> @llvm.aarch64.sve.rev.nxv16i8(<vscale x 16 x i8> %a)
ret <vscale x 16 x i8> %res		ret <vscale x 16 x i8> %res
}		}

▲ Show 20 Lines • Show All 359 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%res = call <vscale x 2 x i64> @llvm.aarch64.sve.uunpklo.nxv2i64(<vscale x 4 x i32> %a)		%res = call <vscale x 2 x i64> @llvm.aarch64.sve.uunpklo.nxv2i64(<vscale x 4 x i32> %a)
ret <vscale x 2 x i64> %res		ret <vscale x 2 x i64> %res
}		}

;		;
; TRN1		; TRN1
;		;

define <vscale x 16 x i1> @trn1_b8(<vscale x 16 x i1> %a, <vscale x 16 x i1> %b) {		define <vscale x 16 x i1> @trn1_nxv16i1(<vscale x 16 x i1> %a, <vscale x 16 x i1> %b) {
; CHECK-LABEL: trn1_b8:		; CHECK-LABEL: trn1_nxv16i1:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: trn1 p0.b, p0.b, p1.b		; CHECK-NEXT: trn1 p0.b, p0.b, p1.b
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%out = call <vscale x 16 x i1> @llvm.aarch64.sve.trn1.nxv16i1(<vscale x 16 x i1> %a,		%out = call <vscale x 16 x i1> @llvm.aarch64.sve.trn1.nxv16i1(<vscale x 16 x i1> %a,
<vscale x 16 x i1> %b)		<vscale x 16 x i1> %b)
ret <vscale x 16 x i1> %out		ret <vscale x 16 x i1> %out
}		}

define <vscale x 8 x i1> @trn1_b16(<vscale x 8 x i1> %a, <vscale x 8 x i1> %b) {		define <vscale x 8 x i1> @trn1_nxv8i1(<vscale x 8 x i1> %a, <vscale x 8 x i1> %b) {
; CHECK-LABEL: trn1_b16:		; CHECK-LABEL: trn1_nxv8i1:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: trn1 p0.h, p0.h, p1.h		; CHECK-NEXT: trn1 p0.h, p0.h, p1.h
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%out = call <vscale x 8 x i1> @llvm.aarch64.sve.trn1.nxv8i1(<vscale x 8 x i1> %a,		%out = call <vscale x 8 x i1> @llvm.aarch64.sve.trn1.nxv8i1(<vscale x 8 x i1> %a,
<vscale x 8 x i1> %b)		<vscale x 8 x i1> %b)
ret <vscale x 8 x i1> %out		ret <vscale x 8 x i1> %out
}		}

define <vscale x 4 x i1> @trn1_b32(<vscale x 4 x i1> %a, <vscale x 4 x i1> %b) {		define <vscale x 4 x i1> @trn1_nxv4i1(<vscale x 4 x i1> %a, <vscale x 4 x i1> %b) {
; CHECK-LABEL: trn1_b32:		; CHECK-LABEL: trn1_nxv4i1:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: trn1 p0.s, p0.s, p1.s		; CHECK-NEXT: trn1 p0.s, p0.s, p1.s
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%out = call <vscale x 4 x i1> @llvm.aarch64.sve.trn1.nxv4i1(<vscale x 4 x i1> %a,		%out = call <vscale x 4 x i1> @llvm.aarch64.sve.trn1.nxv4i1(<vscale x 4 x i1> %a,
<vscale x 4 x i1> %b)		<vscale x 4 x i1> %b)
ret <vscale x 4 x i1> %out		ret <vscale x 4 x i1> %out
}		}

define <vscale x 2 x i1> @trn1_b64(<vscale x 2 x i1> %a, <vscale x 2 x i1> %b) {		define <vscale x 2 x i1> @trn1_nxv2i1(<vscale x 2 x i1> %a, <vscale x 2 x i1> %b) {
; CHECK-LABEL: trn1_b64:		; CHECK-LABEL: trn1_nxv2i1:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: trn1 p0.d, p0.d, p1.d		; CHECK-NEXT: trn1 p0.d, p0.d, p1.d
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%out = call <vscale x 2 x i1> @llvm.aarch64.sve.trn1.nxv2i1(<vscale x 2 x i1> %a,		%out = call <vscale x 2 x i1> @llvm.aarch64.sve.trn1.nxv2i1(<vscale x 2 x i1> %a,
<vscale x 2 x i1> %b)		<vscale x 2 x i1> %b)
ret <vscale x 2 x i1> %out		ret <vscale x 2 x i1> %out
}		}

		define <vscale x 16 x i1> @trn1_b16(<vscale x 16 x i1> %a, <vscale x 16 x i1> %b) {
		; CHECK-LABEL: trn1_b16:
		; CHECK: // %bb.0:
		; CHECK-NEXT: trn1 p0.h, p0.h, p1.h
		; CHECK-NEXT: ret
		%out = call <vscale x 16 x i1> @llvm.aarch64.sve.trn1.b16(<vscale x 16 x i1> %a,
		<vscale x 16 x i1> %b)
		ret <vscale x 16 x i1> %out
		}

		define <vscale x 16 x i1> @trn1_b32(<vscale x 16 x i1> %a, <vscale x 16 x i1> %b) {
		; CHECK-LABEL: trn1_b32:
		; CHECK: // %bb.0:
		; CHECK-NEXT: trn1 p0.s, p0.s, p1.s
		; CHECK-NEXT: ret
		%out = call <vscale x 16 x i1> @llvm.aarch64.sve.trn1.b32(<vscale x 16 x i1> %a,
		<vscale x 16 x i1> %b)
		ret <vscale x 16 x i1> %out
		}

		define <vscale x 16 x i1> @trn1_b64(<vscale x 16 x i1> %a, <vscale x 16 x i1> %b) {
		; CHECK-LABEL: trn1_b64:
		; CHECK: // %bb.0:
		; CHECK-NEXT: trn1 p0.d, p0.d, p1.d
		; CHECK-NEXT: ret
		%out = call <vscale x 16 x i1> @llvm.aarch64.sve.trn1.b64(<vscale x 16 x i1> %a,
		<vscale x 16 x i1> %b)
		ret <vscale x 16 x i1> %out
		}

define <vscale x 16 x i8> @trn1_i8(<vscale x 16 x i8> %a, <vscale x 16 x i8> %b) {		define <vscale x 16 x i8> @trn1_i8(<vscale x 16 x i8> %a, <vscale x 16 x i8> %b) {
; CHECK-LABEL: trn1_i8:		; CHECK-LABEL: trn1_i8:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: trn1 z0.b, z0.b, z1.b		; CHECK-NEXT: trn1 z0.b, z0.b, z1.b
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%out = call <vscale x 16 x i8> @llvm.aarch64.sve.trn1.nxv16i8(<vscale x 16 x i8> %a,		%out = call <vscale x 16 x i8> @llvm.aarch64.sve.trn1.nxv16i8(<vscale x 16 x i8> %a,
<vscale x 16 x i8> %b)		<vscale x 16 x i8> %b)
ret <vscale x 16 x i8> %out		ret <vscale x 16 x i8> %out
▲ Show 20 Lines • Show All 98 Lines • ▼ Show 20 Lines	%out = call <vscale x 2 x double> @llvm.aarch64.sve.trn1.nxv2f64(<vscale x 2 x double> %a,
<vscale x 2 x double> %b)		<vscale x 2 x double> %b)
ret <vscale x 2 x double> %out		ret <vscale x 2 x double> %out
}		}

;		;
; TRN2		; TRN2
;		;

define <vscale x 16 x i1> @trn2_b8(<vscale x 16 x i1> %a, <vscale x 16 x i1> %b) {		define <vscale x 16 x i1> @trn2_nxv16i1(<vscale x 16 x i1> %a, <vscale x 16 x i1> %b) {
; CHECK-LABEL: trn2_b8:		; CHECK-LABEL: trn2_nxv16i1:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: trn2 p0.b, p0.b, p1.b		; CHECK-NEXT: trn2 p0.b, p0.b, p1.b
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%out = call <vscale x 16 x i1> @llvm.aarch64.sve.trn2.nxv16i1(<vscale x 16 x i1> %a,		%out = call <vscale x 16 x i1> @llvm.aarch64.sve.trn2.nxv16i1(<vscale x 16 x i1> %a,
<vscale x 16 x i1> %b)		<vscale x 16 x i1> %b)
ret <vscale x 16 x i1> %out		ret <vscale x 16 x i1> %out
}		}

define <vscale x 8 x i1> @trn2_b16(<vscale x 8 x i1> %a, <vscale x 8 x i1> %b) {		define <vscale x 8 x i1> @trn2_nxv8i1(<vscale x 8 x i1> %a, <vscale x 8 x i1> %b) {
; CHECK-LABEL: trn2_b16:		; CHECK-LABEL: trn2_nxv8i1:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: trn2 p0.h, p0.h, p1.h		; CHECK-NEXT: trn2 p0.h, p0.h, p1.h
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%out = call <vscale x 8 x i1> @llvm.aarch64.sve.trn2.nxv8i1(<vscale x 8 x i1> %a,		%out = call <vscale x 8 x i1> @llvm.aarch64.sve.trn2.nxv8i1(<vscale x 8 x i1> %a,
<vscale x 8 x i1> %b)		<vscale x 8 x i1> %b)
ret <vscale x 8 x i1> %out		ret <vscale x 8 x i1> %out
}		}

define <vscale x 4 x i1> @trn2_b32(<vscale x 4 x i1> %a, <vscale x 4 x i1> %b) {		define <vscale x 4 x i1> @trn2_nxv4i1(<vscale x 4 x i1> %a, <vscale x 4 x i1> %b) {
; CHECK-LABEL: trn2_b32:		; CHECK-LABEL: trn2_nxv4i1:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: trn2 p0.s, p0.s, p1.s		; CHECK-NEXT: trn2 p0.s, p0.s, p1.s
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%out = call <vscale x 4 x i1> @llvm.aarch64.sve.trn2.nxv4i1(<vscale x 4 x i1> %a,		%out = call <vscale x 4 x i1> @llvm.aarch64.sve.trn2.nxv4i1(<vscale x 4 x i1> %a,
<vscale x 4 x i1> %b)		<vscale x 4 x i1> %b)
ret <vscale x 4 x i1> %out		ret <vscale x 4 x i1> %out
}		}

define <vscale x 2 x i1> @trn2_b64(<vscale x 2 x i1> %a, <vscale x 2 x i1> %b) {		define <vscale x 2 x i1> @trn2_nxv2i1(<vscale x 2 x i1> %a, <vscale x 2 x i1> %b) {
; CHECK-LABEL: trn2_b64:		; CHECK-LABEL: trn2_nxv2i1:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: trn2 p0.d, p0.d, p1.d		; CHECK-NEXT: trn2 p0.d, p0.d, p1.d
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%out = call <vscale x 2 x i1> @llvm.aarch64.sve.trn2.nxv2i1(<vscale x 2 x i1> %a,		%out = call <vscale x 2 x i1> @llvm.aarch64.sve.trn2.nxv2i1(<vscale x 2 x i1> %a,
<vscale x 2 x i1> %b)		<vscale x 2 x i1> %b)
ret <vscale x 2 x i1> %out		ret <vscale x 2 x i1> %out
}		}

		define <vscale x 16 x i1> @trn2_b16(<vscale x 16 x i1> %a, <vscale x 16 x i1> %b) {
		; CHECK-LABEL: trn2_b16:
		; CHECK: // %bb.0:
		; CHECK-NEXT: trn2 p0.h, p0.h, p1.h
		; CHECK-NEXT: ret
		%out = call <vscale x 16 x i1> @llvm.aarch64.sve.trn2.b16(<vscale x 16 x i1> %a,
		<vscale x 16 x i1> %b)
		ret <vscale x 16 x i1> %out
		}

		define <vscale x 16 x i1> @trn2_b32(<vscale x 16 x i1> %a, <vscale x 16 x i1> %b) {
		; CHECK-LABEL: trn2_b32:
		; CHECK: // %bb.0:
		; CHECK-NEXT: trn2 p0.s, p0.s, p1.s
		; CHECK-NEXT: ret
		%out = call <vscale x 16 x i1> @llvm.aarch64.sve.trn2.b32(<vscale x 16 x i1> %a,
		<vscale x 16 x i1> %b)
		ret <vscale x 16 x i1> %out
		}

		define <vscale x 16 x i1> @trn2_b64(<vscale x 16 x i1> %a, <vscale x 16 x i1> %b) {
		; CHECK-LABEL: trn2_b64:
		; CHECK: // %bb.0:
		; CHECK-NEXT: trn2 p0.d, p0.d, p1.d
		; CHECK-NEXT: ret
		%out = call <vscale x 16 x i1> @llvm.aarch64.sve.trn2.b64(<vscale x 16 x i1> %a,
		<vscale x 16 x i1> %b)
		ret <vscale x 16 x i1> %out
		}

define <vscale x 16 x i8> @trn2_i8(<vscale x 16 x i8> %a, <vscale x 16 x i8> %b) {		define <vscale x 16 x i8> @trn2_i8(<vscale x 16 x i8> %a, <vscale x 16 x i8> %b) {
; CHECK-LABEL: trn2_i8:		; CHECK-LABEL: trn2_i8:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: trn2 z0.b, z0.b, z1.b		; CHECK-NEXT: trn2 z0.b, z0.b, z1.b
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%out = call <vscale x 16 x i8> @llvm.aarch64.sve.trn2.nxv16i8(<vscale x 16 x i8> %a,		%out = call <vscale x 16 x i8> @llvm.aarch64.sve.trn2.nxv16i8(<vscale x 16 x i8> %a,
<vscale x 16 x i8> %b)		<vscale x 16 x i8> %b)
ret <vscale x 16 x i8> %out		ret <vscale x 16 x i8> %out
▲ Show 20 Lines • Show All 98 Lines • ▼ Show 20 Lines	%out = call <vscale x 2 x double> @llvm.aarch64.sve.trn2.nxv2f64(<vscale x 2 x double> %a,
<vscale x 2 x double> %b)		<vscale x 2 x double> %b)
ret <vscale x 2 x double> %out		ret <vscale x 2 x double> %out
}		}

;		;
; UZP1		; UZP1
;		;

define <vscale x 16 x i1> @uzp1_b8(<vscale x 16 x i1> %a, <vscale x 16 x i1> %b) {		define <vscale x 16 x i1> @uzp1_nxv16i1(<vscale x 16 x i1> %a, <vscale x 16 x i1> %b) {
; CHECK-LABEL: uzp1_b8:		; CHECK-LABEL: uzp1_nxv16i1:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: uzp1 p0.b, p0.b, p1.b		; CHECK-NEXT: uzp1 p0.b, p0.b, p1.b
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%out = call <vscale x 16 x i1> @llvm.aarch64.sve.uzp1.nxv16i1(<vscale x 16 x i1> %a,		%out = call <vscale x 16 x i1> @llvm.aarch64.sve.uzp1.nxv16i1(<vscale x 16 x i1> %a,
<vscale x 16 x i1> %b)		<vscale x 16 x i1> %b)
ret <vscale x 16 x i1> %out		ret <vscale x 16 x i1> %out
}		}

define <vscale x 8 x i1> @uzp1_b16(<vscale x 8 x i1> %a, <vscale x 8 x i1> %b) {		define <vscale x 8 x i1> @uzp1_nxv8i1(<vscale x 8 x i1> %a, <vscale x 8 x i1> %b) {
; CHECK-LABEL: uzp1_b16:		; CHECK-LABEL: uzp1_nxv8i1:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: uzp1 p0.h, p0.h, p1.h		; CHECK-NEXT: uzp1 p0.h, p0.h, p1.h
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%out = call <vscale x 8 x i1> @llvm.aarch64.sve.uzp1.nxv8i1(<vscale x 8 x i1> %a,		%out = call <vscale x 8 x i1> @llvm.aarch64.sve.uzp1.nxv8i1(<vscale x 8 x i1> %a,
<vscale x 8 x i1> %b)		<vscale x 8 x i1> %b)
ret <vscale x 8 x i1> %out		ret <vscale x 8 x i1> %out
}		}

define <vscale x 4 x i1> @uzp1_b32(<vscale x 4 x i1> %a, <vscale x 4 x i1> %b) {		define <vscale x 4 x i1> @uzp1_nxv4i1(<vscale x 4 x i1> %a, <vscale x 4 x i1> %b) {
; CHECK-LABEL: uzp1_b32:		; CHECK-LABEL: uzp1_nxv4i1:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: uzp1 p0.s, p0.s, p1.s		; CHECK-NEXT: uzp1 p0.s, p0.s, p1.s
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%out = call <vscale x 4 x i1> @llvm.aarch64.sve.uzp1.nxv4i1(<vscale x 4 x i1> %a,		%out = call <vscale x 4 x i1> @llvm.aarch64.sve.uzp1.nxv4i1(<vscale x 4 x i1> %a,
<vscale x 4 x i1> %b)		<vscale x 4 x i1> %b)
ret <vscale x 4 x i1> %out		ret <vscale x 4 x i1> %out
}		}

define <vscale x 2 x i1> @uzp1_b64(<vscale x 2 x i1> %a, <vscale x 2 x i1> %b) {		define <vscale x 2 x i1> @uzp1_nxv2i1(<vscale x 2 x i1> %a, <vscale x 2 x i1> %b) {
; CHECK-LABEL: uzp1_b64:		; CHECK-LABEL: uzp1_nxv2i1:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: uzp1 p0.d, p0.d, p1.d		; CHECK-NEXT: uzp1 p0.d, p0.d, p1.d
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%out = call <vscale x 2 x i1> @llvm.aarch64.sve.uzp1.nxv2i1(<vscale x 2 x i1> %a,		%out = call <vscale x 2 x i1> @llvm.aarch64.sve.uzp1.nxv2i1(<vscale x 2 x i1> %a,
<vscale x 2 x i1> %b)		<vscale x 2 x i1> %b)
ret <vscale x 2 x i1> %out		ret <vscale x 2 x i1> %out
}		}

		define <vscale x 16 x i1> @uzp1_b16(<vscale x 16 x i1> %a, <vscale x 16 x i1> %b) {
		; CHECK-LABEL: uzp1_b16:
		; CHECK: // %bb.0:
		; CHECK-NEXT: uzp1 p0.h, p0.h, p1.h
		; CHECK-NEXT: ret
		%out = call <vscale x 16 x i1> @llvm.aarch64.sve.uzp1.b16(<vscale x 16 x i1> %a,
		<vscale x 16 x i1> %b)
		ret <vscale x 16 x i1> %out
		}

		define <vscale x 16 x i1> @uzp1_b32(<vscale x 16 x i1> %a, <vscale x 16 x i1> %b) {
		; CHECK-LABEL: uzp1_b32:
		; CHECK: // %bb.0:
		; CHECK-NEXT: uzp1 p0.s, p0.s, p1.s
		; CHECK-NEXT: ret
		%out = call <vscale x 16 x i1> @llvm.aarch64.sve.uzp1.b32(<vscale x 16 x i1> %a,
		<vscale x 16 x i1> %b)
		ret <vscale x 16 x i1> %out
		}

		define <vscale x 16 x i1> @uzp1_b64(<vscale x 16 x i1> %a, <vscale x 16 x i1> %b) {
		; CHECK-LABEL: uzp1_b64:
		; CHECK: // %bb.0:
		; CHECK-NEXT: uzp1 p0.d, p0.d, p1.d
		; CHECK-NEXT: ret
		%out = call <vscale x 16 x i1> @llvm.aarch64.sve.uzp1.b64(<vscale x 16 x i1> %a,
		<vscale x 16 x i1> %b)
		ret <vscale x 16 x i1> %out
		}

define <vscale x 16 x i8> @uzp1_i8(<vscale x 16 x i8> %a, <vscale x 16 x i8> %b) {		define <vscale x 16 x i8> @uzp1_i8(<vscale x 16 x i8> %a, <vscale x 16 x i8> %b) {
; CHECK-LABEL: uzp1_i8:		; CHECK-LABEL: uzp1_i8:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: uzp1 z0.b, z0.b, z1.b		; CHECK-NEXT: uzp1 z0.b, z0.b, z1.b
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%out = call <vscale x 16 x i8> @llvm.aarch64.sve.uzp1.nxv16i8(<vscale x 16 x i8> %a,		%out = call <vscale x 16 x i8> @llvm.aarch64.sve.uzp1.nxv16i8(<vscale x 16 x i8> %a,
<vscale x 16 x i8> %b)		<vscale x 16 x i8> %b)
ret <vscale x 16 x i8> %out		ret <vscale x 16 x i8> %out
▲ Show 20 Lines • Show All 98 Lines • ▼ Show 20 Lines	%out = call <vscale x 2 x double> @llvm.aarch64.sve.uzp1.nxv2f64(<vscale x 2 x double> %a,
<vscale x 2 x double> %b)		<vscale x 2 x double> %b)
ret <vscale x 2 x double> %out		ret <vscale x 2 x double> %out
}		}

;		;
; UZP2		; UZP2
;		;

define <vscale x 16 x i1> @uzp2_b8(<vscale x 16 x i1> %a, <vscale x 16 x i1> %b) {		define <vscale x 16 x i1> @uzp2_nxv16i1(<vscale x 16 x i1> %a, <vscale x 16 x i1> %b) {
; CHECK-LABEL: uzp2_b8:		; CHECK-LABEL: uzp2_nxv16i1:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: uzp2 p0.b, p0.b, p1.b		; CHECK-NEXT: uzp2 p0.b, p0.b, p1.b
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%out = call <vscale x 16 x i1> @llvm.aarch64.sve.uzp2.nxv16i1(<vscale x 16 x i1> %a,		%out = call <vscale x 16 x i1> @llvm.aarch64.sve.uzp2.nxv16i1(<vscale x 16 x i1> %a,
<vscale x 16 x i1> %b)		<vscale x 16 x i1> %b)
ret <vscale x 16 x i1> %out		ret <vscale x 16 x i1> %out
}		}

define <vscale x 8 x i1> @uzp2_b16(<vscale x 8 x i1> %a, <vscale x 8 x i1> %b) {		define <vscale x 8 x i1> @uzp2_nxv8i1(<vscale x 8 x i1> %a, <vscale x 8 x i1> %b) {
; CHECK-LABEL: uzp2_b16:		; CHECK-LABEL: uzp2_nxv8i1:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: uzp2 p0.h, p0.h, p1.h		; CHECK-NEXT: uzp2 p0.h, p0.h, p1.h
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%out = call <vscale x 8 x i1> @llvm.aarch64.sve.uzp2.nxv8i1(<vscale x 8 x i1> %a,		%out = call <vscale x 8 x i1> @llvm.aarch64.sve.uzp2.nxv8i1(<vscale x 8 x i1> %a,
<vscale x 8 x i1> %b)		<vscale x 8 x i1> %b)
ret <vscale x 8 x i1> %out		ret <vscale x 8 x i1> %out
}		}

define <vscale x 4 x i1> @uzp2_b32(<vscale x 4 x i1> %a, <vscale x 4 x i1> %b) {		define <vscale x 4 x i1> @uzp2_nxv4i1(<vscale x 4 x i1> %a, <vscale x 4 x i1> %b) {
; CHECK-LABEL: uzp2_b32:		; CHECK-LABEL: uzp2_nxv4i1:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: uzp2 p0.s, p0.s, p1.s		; CHECK-NEXT: uzp2 p0.s, p0.s, p1.s
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%out = call <vscale x 4 x i1> @llvm.aarch64.sve.uzp2.nxv4i1(<vscale x 4 x i1> %a,		%out = call <vscale x 4 x i1> @llvm.aarch64.sve.uzp2.nxv4i1(<vscale x 4 x i1> %a,
<vscale x 4 x i1> %b)		<vscale x 4 x i1> %b)
ret <vscale x 4 x i1> %out		ret <vscale x 4 x i1> %out
}		}

define <vscale x 2 x i1> @uzp2_b64(<vscale x 2 x i1> %a, <vscale x 2 x i1> %b) {		define <vscale x 2 x i1> @uzp2_nxv2i1(<vscale x 2 x i1> %a, <vscale x 2 x i1> %b) {
; CHECK-LABEL: uzp2_b64:		; CHECK-LABEL: uzp2_nxv2i1:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: uzp2 p0.d, p0.d, p1.d		; CHECK-NEXT: uzp2 p0.d, p0.d, p1.d
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%out = call <vscale x 2 x i1> @llvm.aarch64.sve.uzp2.nxv2i1(<vscale x 2 x i1> %a,		%out = call <vscale x 2 x i1> @llvm.aarch64.sve.uzp2.nxv2i1(<vscale x 2 x i1> %a,
<vscale x 2 x i1> %b)		<vscale x 2 x i1> %b)
ret <vscale x 2 x i1> %out		ret <vscale x 2 x i1> %out
}		}

		define <vscale x 16 x i1> @uzp2_b16(<vscale x 16 x i1> %a, <vscale x 16 x i1> %b) {
		; CHECK-LABEL: uzp2_b16:
		; CHECK: // %bb.0:
		; CHECK-NEXT: uzp2 p0.h, p0.h, p1.h
		; CHECK-NEXT: ret
		%out = call <vscale x 16 x i1> @llvm.aarch64.sve.uzp2.b16(<vscale x 16 x i1> %a,
		<vscale x 16 x i1> %b)
		ret <vscale x 16 x i1> %out
		}

		define <vscale x 16 x i1> @uzp2_b32(<vscale x 16 x i1> %a, <vscale x 16 x i1> %b) {
		; CHECK-LABEL: uzp2_b32:
		; CHECK: // %bb.0:
		; CHECK-NEXT: uzp2 p0.s, p0.s, p1.s
		; CHECK-NEXT: ret
		%out = call <vscale x 16 x i1> @llvm.aarch64.sve.uzp2.b32(<vscale x 16 x i1> %a,
		<vscale x 16 x i1> %b)
		ret <vscale x 16 x i1> %out
		}

		define <vscale x 16 x i1> @uzp2_b64(<vscale x 16 x i1> %a, <vscale x 16 x i1> %b) {
		; CHECK-LABEL: uzp2_b64:
		; CHECK: // %bb.0:
		; CHECK-NEXT: uzp2 p0.d, p0.d, p1.d
		; CHECK-NEXT: ret
		%out = call <vscale x 16 x i1> @llvm.aarch64.sve.uzp2.b64(<vscale x 16 x i1> %a,
		<vscale x 16 x i1> %b)
		ret <vscale x 16 x i1> %out
		}

define <vscale x 16 x i8> @uzp2_i8(<vscale x 16 x i8> %a, <vscale x 16 x i8> %b) {		define <vscale x 16 x i8> @uzp2_i8(<vscale x 16 x i8> %a, <vscale x 16 x i8> %b) {
; CHECK-LABEL: uzp2_i8:		; CHECK-LABEL: uzp2_i8:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: uzp2 z0.b, z0.b, z1.b		; CHECK-NEXT: uzp2 z0.b, z0.b, z1.b
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%out = call <vscale x 16 x i8> @llvm.aarch64.sve.uzp2.nxv16i8(<vscale x 16 x i8> %a,		%out = call <vscale x 16 x i8> @llvm.aarch64.sve.uzp2.nxv16i8(<vscale x 16 x i8> %a,
<vscale x 16 x i8> %b)		<vscale x 16 x i8> %b)
ret <vscale x 16 x i8> %out		ret <vscale x 16 x i8> %out
▲ Show 20 Lines • Show All 98 Lines • ▼ Show 20 Lines	%out = call <vscale x 2 x double> @llvm.aarch64.sve.uzp2.nxv2f64(<vscale x 2 x double> %a,
<vscale x 2 x double> %b)		<vscale x 2 x double> %b)
ret <vscale x 2 x double> %out		ret <vscale x 2 x double> %out
}		}

;		;
; ZIP1		; ZIP1
;		;

define <vscale x 16 x i1> @zip1_b8(<vscale x 16 x i1> %a, <vscale x 16 x i1> %b) {		define <vscale x 16 x i1> @zip1_nxv16i1(<vscale x 16 x i1> %a, <vscale x 16 x i1> %b) {
; CHECK-LABEL: zip1_b8:		; CHECK-LABEL: zip1_nxv16i1:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: zip1 p0.b, p0.b, p1.b		; CHECK-NEXT: zip1 p0.b, p0.b, p1.b
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%out = call <vscale x 16 x i1> @llvm.aarch64.sve.zip1.nxv16i1(<vscale x 16 x i1> %a,		%out = call <vscale x 16 x i1> @llvm.aarch64.sve.zip1.nxv16i1(<vscale x 16 x i1> %a,
<vscale x 16 x i1> %b)		<vscale x 16 x i1> %b)
ret <vscale x 16 x i1> %out		ret <vscale x 16 x i1> %out
}		}

define <vscale x 8 x i1> @zip1_b16(<vscale x 8 x i1> %a, <vscale x 8 x i1> %b) {		define <vscale x 8 x i1> @zip1_nxv8i1(<vscale x 8 x i1> %a, <vscale x 8 x i1> %b) {
; CHECK-LABEL: zip1_b16:		; CHECK-LABEL: zip1_nxv8i1:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: zip1 p0.h, p0.h, p1.h		; CHECK-NEXT: zip1 p0.h, p0.h, p1.h
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%out = call <vscale x 8 x i1> @llvm.aarch64.sve.zip1.nxv8i1(<vscale x 8 x i1> %a,		%out = call <vscale x 8 x i1> @llvm.aarch64.sve.zip1.nxv8i1(<vscale x 8 x i1> %a,
<vscale x 8 x i1> %b)		<vscale x 8 x i1> %b)
ret <vscale x 8 x i1> %out		ret <vscale x 8 x i1> %out
}		}

define <vscale x 4 x i1> @zip1_b32(<vscale x 4 x i1> %a, <vscale x 4 x i1> %b) {		define <vscale x 4 x i1> @zip1_nxv4i1(<vscale x 4 x i1> %a, <vscale x 4 x i1> %b) {
; CHECK-LABEL: zip1_b32:		; CHECK-LABEL: zip1_nxv4i1:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: zip1 p0.s, p0.s, p1.s		; CHECK-NEXT: zip1 p0.s, p0.s, p1.s
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%out = call <vscale x 4 x i1> @llvm.aarch64.sve.zip1.nxv4i1(<vscale x 4 x i1> %a,		%out = call <vscale x 4 x i1> @llvm.aarch64.sve.zip1.nxv4i1(<vscale x 4 x i1> %a,
<vscale x 4 x i1> %b)		<vscale x 4 x i1> %b)
ret <vscale x 4 x i1> %out		ret <vscale x 4 x i1> %out
}		}

define <vscale x 2 x i1> @zip1_b64(<vscale x 2 x i1> %a, <vscale x 2 x i1> %b) {		define <vscale x 2 x i1> @zip1_nxv2i1(<vscale x 2 x i1> %a, <vscale x 2 x i1> %b) {
; CHECK-LABEL: zip1_b64:		; CHECK-LABEL: zip1_nxv2i1:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: zip1 p0.d, p0.d, p1.d		; CHECK-NEXT: zip1 p0.d, p0.d, p1.d
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%out = call <vscale x 2 x i1> @llvm.aarch64.sve.zip1.nxv2i1(<vscale x 2 x i1> %a,		%out = call <vscale x 2 x i1> @llvm.aarch64.sve.zip1.nxv2i1(<vscale x 2 x i1> %a,
<vscale x 2 x i1> %b)		<vscale x 2 x i1> %b)
ret <vscale x 2 x i1> %out		ret <vscale x 2 x i1> %out
}		}

		define <vscale x 16 x i1> @zip1_b16(<vscale x 16 x i1> %a, <vscale x 16 x i1> %b) {
		; CHECK-LABEL: zip1_b16:
		; CHECK: // %bb.0:
		; CHECK-NEXT: zip1 p0.h, p0.h, p1.h
		; CHECK-NEXT: ret
		%out = call <vscale x 16 x i1> @llvm.aarch64.sve.zip1.b16(<vscale x 16 x i1> %a,
		<vscale x 16 x i1> %b)
		ret <vscale x 16 x i1> %out
		}

		define <vscale x 16 x i1> @zip1_b32(<vscale x 16 x i1> %a, <vscale x 16 x i1> %b) {
		; CHECK-LABEL: zip1_b32:
		; CHECK: // %bb.0:
		; CHECK-NEXT: zip1 p0.s, p0.s, p1.s
		; CHECK-NEXT: ret
		%out = call <vscale x 16 x i1> @llvm.aarch64.sve.zip1.b32(<vscale x 16 x i1> %a,
		<vscale x 16 x i1> %b)
		ret <vscale x 16 x i1> %out
		}

		define <vscale x 16 x i1> @zip1_b64(<vscale x 16 x i1> %a, <vscale x 16 x i1> %b) {
		; CHECK-LABEL: zip1_b64:
		; CHECK: // %bb.0:
		; CHECK-NEXT: zip1 p0.d, p0.d, p1.d
		; CHECK-NEXT: ret
		%out = call <vscale x 16 x i1> @llvm.aarch64.sve.zip1.b64(<vscale x 16 x i1> %a,
		<vscale x 16 x i1> %b)
		ret <vscale x 16 x i1> %out
		}

define <vscale x 16 x i8> @zip1_i8(<vscale x 16 x i8> %a, <vscale x 16 x i8> %b) {		define <vscale x 16 x i8> @zip1_i8(<vscale x 16 x i8> %a, <vscale x 16 x i8> %b) {
; CHECK-LABEL: zip1_i8:		; CHECK-LABEL: zip1_i8:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: zip1 z0.b, z0.b, z1.b		; CHECK-NEXT: zip1 z0.b, z0.b, z1.b
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%out = call <vscale x 16 x i8> @llvm.aarch64.sve.zip1.nxv16i8(<vscale x 16 x i8> %a,		%out = call <vscale x 16 x i8> @llvm.aarch64.sve.zip1.nxv16i8(<vscale x 16 x i8> %a,
<vscale x 16 x i8> %b)		<vscale x 16 x i8> %b)
ret <vscale x 16 x i8> %out		ret <vscale x 16 x i8> %out
▲ Show 20 Lines • Show All 98 Lines • ▼ Show 20 Lines	%out = call <vscale x 2 x double> @llvm.aarch64.sve.zip1.nxv2f64(<vscale x 2 x double> %a,
<vscale x 2 x double> %b)		<vscale x 2 x double> %b)
ret <vscale x 2 x double> %out		ret <vscale x 2 x double> %out
}		}

;		;
; ZIP2		; ZIP2
;		;

define <vscale x 16 x i1> @zip2_b8(<vscale x 16 x i1> %a, <vscale x 16 x i1> %b) {		define <vscale x 16 x i1> @zip2_nxv16i1(<vscale x 16 x i1> %a, <vscale x 16 x i1> %b) {
; CHECK-LABEL: zip2_b8:		; CHECK-LABEL: zip2_nxv16i1:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: zip2 p0.b, p0.b, p1.b		; CHECK-NEXT: zip2 p0.b, p0.b, p1.b
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%out = call <vscale x 16 x i1> @llvm.aarch64.sve.zip2.nxv16i1(<vscale x 16 x i1> %a,		%out = call <vscale x 16 x i1> @llvm.aarch64.sve.zip2.nxv16i1(<vscale x 16 x i1> %a,
<vscale x 16 x i1> %b)		<vscale x 16 x i1> %b)
ret <vscale x 16 x i1> %out		ret <vscale x 16 x i1> %out
}		}

define <vscale x 8 x i1> @zip2_b16(<vscale x 8 x i1> %a, <vscale x 8 x i1> %b) {		define <vscale x 8 x i1> @zip2_nxv8i1(<vscale x 8 x i1> %a, <vscale x 8 x i1> %b) {
; CHECK-LABEL: zip2_b16:		; CHECK-LABEL: zip2_nxv8i1:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: zip2 p0.h, p0.h, p1.h		; CHECK-NEXT: zip2 p0.h, p0.h, p1.h
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%out = call <vscale x 8 x i1> @llvm.aarch64.sve.zip2.nxv8i1(<vscale x 8 x i1> %a,		%out = call <vscale x 8 x i1> @llvm.aarch64.sve.zip2.nxv8i1(<vscale x 8 x i1> %a,
<vscale x 8 x i1> %b)		<vscale x 8 x i1> %b)
ret <vscale x 8 x i1> %out		ret <vscale x 8 x i1> %out
}		}

define <vscale x 4 x i1> @zip2_b32(<vscale x 4 x i1> %a, <vscale x 4 x i1> %b) {		define <vscale x 4 x i1> @zip2_nxv4i1(<vscale x 4 x i1> %a, <vscale x 4 x i1> %b) {
; CHECK-LABEL: zip2_b32:		; CHECK-LABEL: zip2_nxv4i1:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: zip2 p0.s, p0.s, p1.s		; CHECK-NEXT: zip2 p0.s, p0.s, p1.s
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%out = call <vscale x 4 x i1> @llvm.aarch64.sve.zip2.nxv4i1(<vscale x 4 x i1> %a,		%out = call <vscale x 4 x i1> @llvm.aarch64.sve.zip2.nxv4i1(<vscale x 4 x i1> %a,
<vscale x 4 x i1> %b)		<vscale x 4 x i1> %b)
ret <vscale x 4 x i1> %out		ret <vscale x 4 x i1> %out
}		}

define <vscale x 2 x i1> @zip2_b64(<vscale x 2 x i1> %a, <vscale x 2 x i1> %b) {		define <vscale x 2 x i1> @zip2_nxv2i1(<vscale x 2 x i1> %a, <vscale x 2 x i1> %b) {
; CHECK-LABEL: zip2_b64:		; CHECK-LABEL: zip2_nxv2i1:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: zip2 p0.d, p0.d, p1.d		; CHECK-NEXT: zip2 p0.d, p0.d, p1.d
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%out = call <vscale x 2 x i1> @llvm.aarch64.sve.zip2.nxv2i1(<vscale x 2 x i1> %a,		%out = call <vscale x 2 x i1> @llvm.aarch64.sve.zip2.nxv2i1(<vscale x 2 x i1> %a,
<vscale x 2 x i1> %b)		<vscale x 2 x i1> %b)
ret <vscale x 2 x i1> %out		ret <vscale x 2 x i1> %out
}		}

		define <vscale x 16 x i1> @zip2_b16(<vscale x 16 x i1> %a, <vscale x 16 x i1> %b) {
		; CHECK-LABEL: zip2_b16:
		; CHECK: // %bb.0:
		; CHECK-NEXT: zip2 p0.h, p0.h, p1.h
		; CHECK-NEXT: ret
		%out = call <vscale x 16 x i1> @llvm.aarch64.sve.zip2.b16(<vscale x 16 x i1> %a,
		<vscale x 16 x i1> %b)
		ret <vscale x 16 x i1> %out
		}

		define <vscale x 16 x i1> @zip2_b32(<vscale x 16 x i1> %a, <vscale x 16 x i1> %b) {
		; CHECK-LABEL: zip2_b32:
		; CHECK: // %bb.0:
		; CHECK-NEXT: zip2 p0.s, p0.s, p1.s
		; CHECK-NEXT: ret
		%out = call <vscale x 16 x i1> @llvm.aarch64.sve.zip2.b32(<vscale x 16 x i1> %a,
		<vscale x 16 x i1> %b)
		ret <vscale x 16 x i1> %out
		}

		define <vscale x 16 x i1> @zip2_b64(<vscale x 16 x i1> %a, <vscale x 16 x i1> %b) {
		; CHECK-LABEL: zip2_b64:
		; CHECK: // %bb.0:
		; CHECK-NEXT: zip2 p0.d, p0.d, p1.d
		; CHECK-NEXT: ret
		%out = call <vscale x 16 x i1> @llvm.aarch64.sve.zip2.b64(<vscale x 16 x i1> %a,
		<vscale x 16 x i1> %b)
		ret <vscale x 16 x i1> %out
		}

define <vscale x 16 x i8> @zip2_i8(<vscale x 16 x i8> %a, <vscale x 16 x i8> %b) {		define <vscale x 16 x i8> @zip2_i8(<vscale x 16 x i8> %a, <vscale x 16 x i8> %b) {
; CHECK-LABEL: zip2_i8:		; CHECK-LABEL: zip2_i8:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: zip2 z0.b, z0.b, z1.b		; CHECK-NEXT: zip2 z0.b, z0.b, z1.b
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%out = call <vscale x 16 x i8> @llvm.aarch64.sve.zip2.nxv16i8(<vscale x 16 x i8> %a,		%out = call <vscale x 16 x i8> @llvm.aarch64.sve.zip2.nxv16i8(<vscale x 16 x i8> %a,
<vscale x 16 x i8> %b)		<vscale x 16 x i8> %b)
ret <vscale x 16 x i8> %out		ret <vscale x 16 x i8> %out
▲ Show 20 Lines • Show All 186 Lines • ▼ Show 20 Lines
declare <vscale x 8 x i16> @llvm.aarch64.sve.rev.nxv8i16(<vscale x 8 x i16>)		declare <vscale x 8 x i16> @llvm.aarch64.sve.rev.nxv8i16(<vscale x 8 x i16>)
declare <vscale x 4 x i32> @llvm.aarch64.sve.rev.nxv4i32(<vscale x 4 x i32>)		declare <vscale x 4 x i32> @llvm.aarch64.sve.rev.nxv4i32(<vscale x 4 x i32>)
declare <vscale x 2 x i64> @llvm.aarch64.sve.rev.nxv2i64(<vscale x 2 x i64>)		declare <vscale x 2 x i64> @llvm.aarch64.sve.rev.nxv2i64(<vscale x 2 x i64>)
declare <vscale x 8 x bfloat> @llvm.aarch64.sve.rev.nxv8bf16(<vscale x 8 x bfloat>)		declare <vscale x 8 x bfloat> @llvm.aarch64.sve.rev.nxv8bf16(<vscale x 8 x bfloat>)
declare <vscale x 8 x half> @llvm.aarch64.sve.rev.nxv8f16(<vscale x 8 x half>)		declare <vscale x 8 x half> @llvm.aarch64.sve.rev.nxv8f16(<vscale x 8 x half>)
declare <vscale x 4 x float> @llvm.aarch64.sve.rev.nxv4f32(<vscale x 4 x float>)		declare <vscale x 4 x float> @llvm.aarch64.sve.rev.nxv4f32(<vscale x 4 x float>)
declare <vscale x 2 x double> @llvm.aarch64.sve.rev.nxv2f64(<vscale x 2 x double>)		declare <vscale x 2 x double> @llvm.aarch64.sve.rev.nxv2f64(<vscale x 2 x double>)

		declare <vscale x 16 x i1> @llvm.aarch64.sve.rev.b16(<vscale x 16 x i1>)
		declare <vscale x 16 x i1> @llvm.aarch64.sve.rev.b32(<vscale x 16 x i1>)
		declare <vscale x 16 x i1> @llvm.aarch64.sve.rev.b64(<vscale x 16 x i1>)

declare <vscale x 16 x i8> @llvm.aarch64.sve.splice.nxv16i8(<vscale x 16 x i1>, <vscale x 16 x i8>, <vscale x 16 x i8>)		declare <vscale x 16 x i8> @llvm.aarch64.sve.splice.nxv16i8(<vscale x 16 x i1>, <vscale x 16 x i8>, <vscale x 16 x i8>)
declare <vscale x 8 x i16> @llvm.aarch64.sve.splice.nxv8i16(<vscale x 8 x i1>, <vscale x 8 x i16>, <vscale x 8 x i16>)		declare <vscale x 8 x i16> @llvm.aarch64.sve.splice.nxv8i16(<vscale x 8 x i1>, <vscale x 8 x i16>, <vscale x 8 x i16>)
declare <vscale x 4 x i32> @llvm.aarch64.sve.splice.nxv4i32(<vscale x 4 x i1>, <vscale x 4 x i32>, <vscale x 4 x i32>)		declare <vscale x 4 x i32> @llvm.aarch64.sve.splice.nxv4i32(<vscale x 4 x i1>, <vscale x 4 x i32>, <vscale x 4 x i32>)
declare <vscale x 2 x i64> @llvm.aarch64.sve.splice.nxv2i64(<vscale x 2 x i1>, <vscale x 2 x i64>, <vscale x 2 x i64>)		declare <vscale x 2 x i64> @llvm.aarch64.sve.splice.nxv2i64(<vscale x 2 x i1>, <vscale x 2 x i64>, <vscale x 2 x i64>)
declare <vscale x 8 x bfloat> @llvm.aarch64.sve.splice.nxv8bf16(<vscale x 8 x i1>, <vscale x 8 x bfloat>, <vscale x 8 x bfloat>)		declare <vscale x 8 x bfloat> @llvm.aarch64.sve.splice.nxv8bf16(<vscale x 8 x i1>, <vscale x 8 x bfloat>, <vscale x 8 x bfloat>)
declare <vscale x 8 x half> @llvm.aarch64.sve.splice.nxv8f16(<vscale x 8 x i1>, <vscale x 8 x half>, <vscale x 8 x half>)		declare <vscale x 8 x half> @llvm.aarch64.sve.splice.nxv8f16(<vscale x 8 x i1>, <vscale x 8 x half>, <vscale x 8 x half>)
declare <vscale x 4 x float> @llvm.aarch64.sve.splice.nxv4f32(<vscale x 4 x i1>, <vscale x 4 x float>, <vscale x 4 x float>)		declare <vscale x 4 x float> @llvm.aarch64.sve.splice.nxv4f32(<vscale x 4 x i1>, <vscale x 4 x float>, <vscale x 4 x float>)
declare <vscale x 2 x double> @llvm.aarch64.sve.splice.nxv2f64(<vscale x 2 x i1>, <vscale x 2 x double>, <vscale x 2 x double>)		declare <vscale x 2 x double> @llvm.aarch64.sve.splice.nxv2f64(<vscale x 2 x i1>, <vscale x 2 x double>, <vscale x 2 x double>)
Show All 34 Lines
declare <vscale x 2 x half> @llvm.aarch64.sve.trn1.nxv2f16(<vscale x 2 x half>, <vscale x 2 x half>)		declare <vscale x 2 x half> @llvm.aarch64.sve.trn1.nxv2f16(<vscale x 2 x half>, <vscale x 2 x half>)
declare <vscale x 4 x half> @llvm.aarch64.sve.trn1.nxv4f16(<vscale x 4 x half>, <vscale x 4 x half>)		declare <vscale x 4 x half> @llvm.aarch64.sve.trn1.nxv4f16(<vscale x 4 x half>, <vscale x 4 x half>)
declare <vscale x 8 x bfloat> @llvm.aarch64.sve.trn1.nxv8bf16(<vscale x 8 x bfloat>, <vscale x 8 x bfloat>)		declare <vscale x 8 x bfloat> @llvm.aarch64.sve.trn1.nxv8bf16(<vscale x 8 x bfloat>, <vscale x 8 x bfloat>)
declare <vscale x 8 x half> @llvm.aarch64.sve.trn1.nxv8f16(<vscale x 8 x half>, <vscale x 8 x half>)		declare <vscale x 8 x half> @llvm.aarch64.sve.trn1.nxv8f16(<vscale x 8 x half>, <vscale x 8 x half>)
declare <vscale x 2 x float> @llvm.aarch64.sve.trn1.nxv2f32(<vscale x 2 x float>, <vscale x 2 x float>)		declare <vscale x 2 x float> @llvm.aarch64.sve.trn1.nxv2f32(<vscale x 2 x float>, <vscale x 2 x float>)
declare <vscale x 4 x float> @llvm.aarch64.sve.trn1.nxv4f32(<vscale x 4 x float>, <vscale x 4 x float>)		declare <vscale x 4 x float> @llvm.aarch64.sve.trn1.nxv4f32(<vscale x 4 x float>, <vscale x 4 x float>)
declare <vscale x 2 x double> @llvm.aarch64.sve.trn1.nxv2f64(<vscale x 2 x double>, <vscale x 2 x double>)		declare <vscale x 2 x double> @llvm.aarch64.sve.trn1.nxv2f64(<vscale x 2 x double>, <vscale x 2 x double>)

		declare <vscale x 16 x i1> @llvm.aarch64.sve.trn1.b16(<vscale x 16 x i1>, <vscale x 16 x i1>)
		declare <vscale x 16 x i1> @llvm.aarch64.sve.trn1.b32(<vscale x 16 x i1>, <vscale x 16 x i1>)
		declare <vscale x 16 x i1> @llvm.aarch64.sve.trn1.b64(<vscale x 16 x i1>, <vscale x 16 x i1>)

declare <vscale x 16 x i1> @llvm.aarch64.sve.trn2.nxv16i1(<vscale x 16 x i1>, <vscale x 16 x i1>)		declare <vscale x 16 x i1> @llvm.aarch64.sve.trn2.nxv16i1(<vscale x 16 x i1>, <vscale x 16 x i1>)
declare <vscale x 8 x i1> @llvm.aarch64.sve.trn2.nxv8i1(<vscale x 8 x i1>, <vscale x 8 x i1>)		declare <vscale x 8 x i1> @llvm.aarch64.sve.trn2.nxv8i1(<vscale x 8 x i1>, <vscale x 8 x i1>)
declare <vscale x 4 x i1> @llvm.aarch64.sve.trn2.nxv4i1(<vscale x 4 x i1>, <vscale x 4 x i1>)		declare <vscale x 4 x i1> @llvm.aarch64.sve.trn2.nxv4i1(<vscale x 4 x i1>, <vscale x 4 x i1>)
declare <vscale x 2 x i1> @llvm.aarch64.sve.trn2.nxv2i1(<vscale x 2 x i1>, <vscale x 2 x i1>)		declare <vscale x 2 x i1> @llvm.aarch64.sve.trn2.nxv2i1(<vscale x 2 x i1>, <vscale x 2 x i1>)
declare <vscale x 16 x i8> @llvm.aarch64.sve.trn2.nxv16i8(<vscale x 16 x i8>, <vscale x 16 x i8>)		declare <vscale x 16 x i8> @llvm.aarch64.sve.trn2.nxv16i8(<vscale x 16 x i8>, <vscale x 16 x i8>)
declare <vscale x 8 x i16> @llvm.aarch64.sve.trn2.nxv8i16(<vscale x 8 x i16>, <vscale x 8 x i16>)		declare <vscale x 8 x i16> @llvm.aarch64.sve.trn2.nxv8i16(<vscale x 8 x i16>, <vscale x 8 x i16>)
declare <vscale x 4 x i32> @llvm.aarch64.sve.trn2.nxv4i32(<vscale x 4 x i32>, <vscale x 4 x i32>)		declare <vscale x 4 x i32> @llvm.aarch64.sve.trn2.nxv4i32(<vscale x 4 x i32>, <vscale x 4 x i32>)
declare <vscale x 2 x i64> @llvm.aarch64.sve.trn2.nxv2i64(<vscale x 2 x i64>, <vscale x 2 x i64>)		declare <vscale x 2 x i64> @llvm.aarch64.sve.trn2.nxv2i64(<vscale x 2 x i64>, <vscale x 2 x i64>)
declare <vscale x 2 x half> @llvm.aarch64.sve.trn2.nxv2f16(<vscale x 2 x half>, <vscale x 2 x half>)		declare <vscale x 2 x half> @llvm.aarch64.sve.trn2.nxv2f16(<vscale x 2 x half>, <vscale x 2 x half>)
declare <vscale x 4 x half> @llvm.aarch64.sve.trn2.nxv4f16(<vscale x 4 x half>, <vscale x 4 x half>)		declare <vscale x 4 x half> @llvm.aarch64.sve.trn2.nxv4f16(<vscale x 4 x half>, <vscale x 4 x half>)
declare <vscale x 8 x bfloat> @llvm.aarch64.sve.trn2.nxv8bf16(<vscale x 8 x bfloat>, <vscale x 8 x bfloat>)		declare <vscale x 8 x bfloat> @llvm.aarch64.sve.trn2.nxv8bf16(<vscale x 8 x bfloat>, <vscale x 8 x bfloat>)
declare <vscale x 8 x half> @llvm.aarch64.sve.trn2.nxv8f16(<vscale x 8 x half>, <vscale x 8 x half>)		declare <vscale x 8 x half> @llvm.aarch64.sve.trn2.nxv8f16(<vscale x 8 x half>, <vscale x 8 x half>)
declare <vscale x 2 x float> @llvm.aarch64.sve.trn2.nxv2f32(<vscale x 2 x float>, <vscale x 2 x float>)		declare <vscale x 2 x float> @llvm.aarch64.sve.trn2.nxv2f32(<vscale x 2 x float>, <vscale x 2 x float>)
declare <vscale x 4 x float> @llvm.aarch64.sve.trn2.nxv4f32(<vscale x 4 x float>, <vscale x 4 x float>)		declare <vscale x 4 x float> @llvm.aarch64.sve.trn2.nxv4f32(<vscale x 4 x float>, <vscale x 4 x float>)
declare <vscale x 2 x double> @llvm.aarch64.sve.trn2.nxv2f64(<vscale x 2 x double>, <vscale x 2 x double>)		declare <vscale x 2 x double> @llvm.aarch64.sve.trn2.nxv2f64(<vscale x 2 x double>, <vscale x 2 x double>)

		declare <vscale x 16 x i1> @llvm.aarch64.sve.trn2.b16(<vscale x 16 x i1>, <vscale x 16 x i1>)
		declare <vscale x 16 x i1> @llvm.aarch64.sve.trn2.b32(<vscale x 16 x i1>, <vscale x 16 x i1>)
		declare <vscale x 16 x i1> @llvm.aarch64.sve.trn2.b64(<vscale x 16 x i1>, <vscale x 16 x i1>)

declare <vscale x 16 x i1> @llvm.aarch64.sve.uzp1.nxv16i1(<vscale x 16 x i1>, <vscale x 16 x i1>)		declare <vscale x 16 x i1> @llvm.aarch64.sve.uzp1.nxv16i1(<vscale x 16 x i1>, <vscale x 16 x i1>)
declare <vscale x 8 x i1> @llvm.aarch64.sve.uzp1.nxv8i1(<vscale x 8 x i1>, <vscale x 8 x i1>)		declare <vscale x 8 x i1> @llvm.aarch64.sve.uzp1.nxv8i1(<vscale x 8 x i1>, <vscale x 8 x i1>)
declare <vscale x 4 x i1> @llvm.aarch64.sve.uzp1.nxv4i1(<vscale x 4 x i1>, <vscale x 4 x i1>)		declare <vscale x 4 x i1> @llvm.aarch64.sve.uzp1.nxv4i1(<vscale x 4 x i1>, <vscale x 4 x i1>)
declare <vscale x 2 x i1> @llvm.aarch64.sve.uzp1.nxv2i1(<vscale x 2 x i1>, <vscale x 2 x i1>)		declare <vscale x 2 x i1> @llvm.aarch64.sve.uzp1.nxv2i1(<vscale x 2 x i1>, <vscale x 2 x i1>)
declare <vscale x 16 x i8> @llvm.aarch64.sve.uzp1.nxv16i8(<vscale x 16 x i8>, <vscale x 16 x i8>)		declare <vscale x 16 x i8> @llvm.aarch64.sve.uzp1.nxv16i8(<vscale x 16 x i8>, <vscale x 16 x i8>)
declare <vscale x 8 x i16> @llvm.aarch64.sve.uzp1.nxv8i16(<vscale x 8 x i16>, <vscale x 8 x i16>)		declare <vscale x 8 x i16> @llvm.aarch64.sve.uzp1.nxv8i16(<vscale x 8 x i16>, <vscale x 8 x i16>)
declare <vscale x 4 x i32> @llvm.aarch64.sve.uzp1.nxv4i32(<vscale x 4 x i32>, <vscale x 4 x i32>)		declare <vscale x 4 x i32> @llvm.aarch64.sve.uzp1.nxv4i32(<vscale x 4 x i32>, <vscale x 4 x i32>)
declare <vscale x 2 x i64> @llvm.aarch64.sve.uzp1.nxv2i64(<vscale x 2 x i64>, <vscale x 2 x i64>)		declare <vscale x 2 x i64> @llvm.aarch64.sve.uzp1.nxv2i64(<vscale x 2 x i64>, <vscale x 2 x i64>)
declare <vscale x 2 x half> @llvm.aarch64.sve.uzp1.nxv2f16(<vscale x 2 x half>, <vscale x 2 x half>)		declare <vscale x 2 x half> @llvm.aarch64.sve.uzp1.nxv2f16(<vscale x 2 x half>, <vscale x 2 x half>)
declare <vscale x 4 x half> @llvm.aarch64.sve.uzp1.nxv4f16(<vscale x 4 x half>, <vscale x 4 x half>)		declare <vscale x 4 x half> @llvm.aarch64.sve.uzp1.nxv4f16(<vscale x 4 x half>, <vscale x 4 x half>)
declare <vscale x 8 x bfloat> @llvm.aarch64.sve.uzp1.nxv8bf16(<vscale x 8 x bfloat>, <vscale x 8 x bfloat>)		declare <vscale x 8 x bfloat> @llvm.aarch64.sve.uzp1.nxv8bf16(<vscale x 8 x bfloat>, <vscale x 8 x bfloat>)
declare <vscale x 8 x half> @llvm.aarch64.sve.uzp1.nxv8f16(<vscale x 8 x half>, <vscale x 8 x half>)		declare <vscale x 8 x half> @llvm.aarch64.sve.uzp1.nxv8f16(<vscale x 8 x half>, <vscale x 8 x half>)
declare <vscale x 2 x float> @llvm.aarch64.sve.uzp1.nxv2f32(<vscale x 2 x float>, <vscale x 2 x float>)		declare <vscale x 2 x float> @llvm.aarch64.sve.uzp1.nxv2f32(<vscale x 2 x float>, <vscale x 2 x float>)
declare <vscale x 4 x float> @llvm.aarch64.sve.uzp1.nxv4f32(<vscale x 4 x float>, <vscale x 4 x float>)		declare <vscale x 4 x float> @llvm.aarch64.sve.uzp1.nxv4f32(<vscale x 4 x float>, <vscale x 4 x float>)
declare <vscale x 2 x double> @llvm.aarch64.sve.uzp1.nxv2f64(<vscale x 2 x double>, <vscale x 2 x double>)		declare <vscale x 2 x double> @llvm.aarch64.sve.uzp1.nxv2f64(<vscale x 2 x double>, <vscale x 2 x double>)

		declare <vscale x 16 x i1> @llvm.aarch64.sve.uzp1.b16(<vscale x 16 x i1>, <vscale x 16 x i1>)
		declare <vscale x 16 x i1> @llvm.aarch64.sve.uzp1.b32(<vscale x 16 x i1>, <vscale x 16 x i1>)
		declare <vscale x 16 x i1> @llvm.aarch64.sve.uzp1.b64(<vscale x 16 x i1>, <vscale x 16 x i1>)

declare <vscale x 16 x i1> @llvm.aarch64.sve.uzp2.nxv16i1(<vscale x 16 x i1>, <vscale x 16 x i1>)		declare <vscale x 16 x i1> @llvm.aarch64.sve.uzp2.nxv16i1(<vscale x 16 x i1>, <vscale x 16 x i1>)
declare <vscale x 8 x i1> @llvm.aarch64.sve.uzp2.nxv8i1(<vscale x 8 x i1>, <vscale x 8 x i1>)		declare <vscale x 8 x i1> @llvm.aarch64.sve.uzp2.nxv8i1(<vscale x 8 x i1>, <vscale x 8 x i1>)
declare <vscale x 4 x i1> @llvm.aarch64.sve.uzp2.nxv4i1(<vscale x 4 x i1>, <vscale x 4 x i1>)		declare <vscale x 4 x i1> @llvm.aarch64.sve.uzp2.nxv4i1(<vscale x 4 x i1>, <vscale x 4 x i1>)
declare <vscale x 2 x i1> @llvm.aarch64.sve.uzp2.nxv2i1(<vscale x 2 x i1>, <vscale x 2 x i1>)		declare <vscale x 2 x i1> @llvm.aarch64.sve.uzp2.nxv2i1(<vscale x 2 x i1>, <vscale x 2 x i1>)
declare <vscale x 16 x i8> @llvm.aarch64.sve.uzp2.nxv16i8(<vscale x 16 x i8>, <vscale x 16 x i8>)		declare <vscale x 16 x i8> @llvm.aarch64.sve.uzp2.nxv16i8(<vscale x 16 x i8>, <vscale x 16 x i8>)
declare <vscale x 8 x i16> @llvm.aarch64.sve.uzp2.nxv8i16(<vscale x 8 x i16>, <vscale x 8 x i16>)		declare <vscale x 8 x i16> @llvm.aarch64.sve.uzp2.nxv8i16(<vscale x 8 x i16>, <vscale x 8 x i16>)
declare <vscale x 4 x i32> @llvm.aarch64.sve.uzp2.nxv4i32(<vscale x 4 x i32>, <vscale x 4 x i32>)		declare <vscale x 4 x i32> @llvm.aarch64.sve.uzp2.nxv4i32(<vscale x 4 x i32>, <vscale x 4 x i32>)
declare <vscale x 2 x i64> @llvm.aarch64.sve.uzp2.nxv2i64(<vscale x 2 x i64>, <vscale x 2 x i64>)		declare <vscale x 2 x i64> @llvm.aarch64.sve.uzp2.nxv2i64(<vscale x 2 x i64>, <vscale x 2 x i64>)
declare <vscale x 2 x half> @llvm.aarch64.sve.uzp2.nxv2f16(<vscale x 2 x half>, <vscale x 2 x half>)		declare <vscale x 2 x half> @llvm.aarch64.sve.uzp2.nxv2f16(<vscale x 2 x half>, <vscale x 2 x half>)
declare <vscale x 4 x half> @llvm.aarch64.sve.uzp2.nxv4f16(<vscale x 4 x half>, <vscale x 4 x half>)		declare <vscale x 4 x half> @llvm.aarch64.sve.uzp2.nxv4f16(<vscale x 4 x half>, <vscale x 4 x half>)
declare <vscale x 8 x bfloat> @llvm.aarch64.sve.uzp2.nxv8bf16(<vscale x 8 x bfloat>, <vscale x 8 x bfloat>)		declare <vscale x 8 x bfloat> @llvm.aarch64.sve.uzp2.nxv8bf16(<vscale x 8 x bfloat>, <vscale x 8 x bfloat>)
declare <vscale x 8 x half> @llvm.aarch64.sve.uzp2.nxv8f16(<vscale x 8 x half>, <vscale x 8 x half>)		declare <vscale x 8 x half> @llvm.aarch64.sve.uzp2.nxv8f16(<vscale x 8 x half>, <vscale x 8 x half>)
declare <vscale x 2 x float> @llvm.aarch64.sve.uzp2.nxv2f32(<vscale x 2 x float>, <vscale x 2 x float>)		declare <vscale x 2 x float> @llvm.aarch64.sve.uzp2.nxv2f32(<vscale x 2 x float>, <vscale x 2 x float>)
declare <vscale x 4 x float> @llvm.aarch64.sve.uzp2.nxv4f32(<vscale x 4 x float>, <vscale x 4 x float>)		declare <vscale x 4 x float> @llvm.aarch64.sve.uzp2.nxv4f32(<vscale x 4 x float>, <vscale x 4 x float>)
declare <vscale x 2 x double> @llvm.aarch64.sve.uzp2.nxv2f64(<vscale x 2 x double>, <vscale x 2 x double>)		declare <vscale x 2 x double> @llvm.aarch64.sve.uzp2.nxv2f64(<vscale x 2 x double>, <vscale x 2 x double>)

		declare <vscale x 16 x i1> @llvm.aarch64.sve.uzp2.b16(<vscale x 16 x i1>, <vscale x 16 x i1>)
		declare <vscale x 16 x i1> @llvm.aarch64.sve.uzp2.b32(<vscale x 16 x i1>, <vscale x 16 x i1>)
		declare <vscale x 16 x i1> @llvm.aarch64.sve.uzp2.b64(<vscale x 16 x i1>, <vscale x 16 x i1>)

declare <vscale x 16 x i1> @llvm.aarch64.sve.zip1.nxv16i1(<vscale x 16 x i1>, <vscale x 16 x i1>)		declare <vscale x 16 x i1> @llvm.aarch64.sve.zip1.nxv16i1(<vscale x 16 x i1>, <vscale x 16 x i1>)
declare <vscale x 8 x i1> @llvm.aarch64.sve.zip1.nxv8i1(<vscale x 8 x i1>, <vscale x 8 x i1>)		declare <vscale x 8 x i1> @llvm.aarch64.sve.zip1.nxv8i1(<vscale x 8 x i1>, <vscale x 8 x i1>)
declare <vscale x 4 x i1> @llvm.aarch64.sve.zip1.nxv4i1(<vscale x 4 x i1>, <vscale x 4 x i1>)		declare <vscale x 4 x i1> @llvm.aarch64.sve.zip1.nxv4i1(<vscale x 4 x i1>, <vscale x 4 x i1>)
declare <vscale x 2 x i1> @llvm.aarch64.sve.zip1.nxv2i1(<vscale x 2 x i1>, <vscale x 2 x i1>)		declare <vscale x 2 x i1> @llvm.aarch64.sve.zip1.nxv2i1(<vscale x 2 x i1>, <vscale x 2 x i1>)
declare <vscale x 16 x i8> @llvm.aarch64.sve.zip1.nxv16i8(<vscale x 16 x i8>, <vscale x 16 x i8>)		declare <vscale x 16 x i8> @llvm.aarch64.sve.zip1.nxv16i8(<vscale x 16 x i8>, <vscale x 16 x i8>)
declare <vscale x 8 x i16> @llvm.aarch64.sve.zip1.nxv8i16(<vscale x 8 x i16>, <vscale x 8 x i16>)		declare <vscale x 8 x i16> @llvm.aarch64.sve.zip1.nxv8i16(<vscale x 8 x i16>, <vscale x 8 x i16>)
declare <vscale x 4 x i32> @llvm.aarch64.sve.zip1.nxv4i32(<vscale x 4 x i32>, <vscale x 4 x i32>)		declare <vscale x 4 x i32> @llvm.aarch64.sve.zip1.nxv4i32(<vscale x 4 x i32>, <vscale x 4 x i32>)
declare <vscale x 2 x i64> @llvm.aarch64.sve.zip1.nxv2i64(<vscale x 2 x i64>, <vscale x 2 x i64>)		declare <vscale x 2 x i64> @llvm.aarch64.sve.zip1.nxv2i64(<vscale x 2 x i64>, <vscale x 2 x i64>)
declare <vscale x 2 x half> @llvm.aarch64.sve.zip1.nxv2f16(<vscale x 2 x half>, <vscale x 2 x half>)		declare <vscale x 2 x half> @llvm.aarch64.sve.zip1.nxv2f16(<vscale x 2 x half>, <vscale x 2 x half>)
declare <vscale x 4 x half> @llvm.aarch64.sve.zip1.nxv4f16(<vscale x 4 x half>, <vscale x 4 x half>)		declare <vscale x 4 x half> @llvm.aarch64.sve.zip1.nxv4f16(<vscale x 4 x half>, <vscale x 4 x half>)
declare <vscale x 8 x bfloat> @llvm.aarch64.sve.zip1.nxv8bf16(<vscale x 8 x bfloat>, <vscale x 8 x bfloat>)		declare <vscale x 8 x bfloat> @llvm.aarch64.sve.zip1.nxv8bf16(<vscale x 8 x bfloat>, <vscale x 8 x bfloat>)
declare <vscale x 8 x half> @llvm.aarch64.sve.zip1.nxv8f16(<vscale x 8 x half>, <vscale x 8 x half>)		declare <vscale x 8 x half> @llvm.aarch64.sve.zip1.nxv8f16(<vscale x 8 x half>, <vscale x 8 x half>)
declare <vscale x 2 x float> @llvm.aarch64.sve.zip1.nxv2f32(<vscale x 2 x float>, <vscale x 2 x float>)		declare <vscale x 2 x float> @llvm.aarch64.sve.zip1.nxv2f32(<vscale x 2 x float>, <vscale x 2 x float>)
declare <vscale x 4 x float> @llvm.aarch64.sve.zip1.nxv4f32(<vscale x 4 x float>, <vscale x 4 x float>)		declare <vscale x 4 x float> @llvm.aarch64.sve.zip1.nxv4f32(<vscale x 4 x float>, <vscale x 4 x float>)
declare <vscale x 2 x double> @llvm.aarch64.sve.zip1.nxv2f64(<vscale x 2 x double>, <vscale x 2 x double>)		declare <vscale x 2 x double> @llvm.aarch64.sve.zip1.nxv2f64(<vscale x 2 x double>, <vscale x 2 x double>)

		declare <vscale x 16 x i1> @llvm.aarch64.sve.zip1.b16(<vscale x 16 x i1>, <vscale x 16 x i1>)
		declare <vscale x 16 x i1> @llvm.aarch64.sve.zip1.b32(<vscale x 16 x i1>, <vscale x 16 x i1>)
		declare <vscale x 16 x i1> @llvm.aarch64.sve.zip1.b64(<vscale x 16 x i1>, <vscale x 16 x i1>)

declare <vscale x 16 x i1> @llvm.aarch64.sve.zip2.nxv16i1(<vscale x 16 x i1>, <vscale x 16 x i1>)		declare <vscale x 16 x i1> @llvm.aarch64.sve.zip2.nxv16i1(<vscale x 16 x i1>, <vscale x 16 x i1>)
declare <vscale x 8 x i1> @llvm.aarch64.sve.zip2.nxv8i1(<vscale x 8 x i1>, <vscale x 8 x i1>)		declare <vscale x 8 x i1> @llvm.aarch64.sve.zip2.nxv8i1(<vscale x 8 x i1>, <vscale x 8 x i1>)
declare <vscale x 4 x i1> @llvm.aarch64.sve.zip2.nxv4i1(<vscale x 4 x i1>, <vscale x 4 x i1>)		declare <vscale x 4 x i1> @llvm.aarch64.sve.zip2.nxv4i1(<vscale x 4 x i1>, <vscale x 4 x i1>)
declare <vscale x 2 x i1> @llvm.aarch64.sve.zip2.nxv2i1(<vscale x 2 x i1>, <vscale x 2 x i1>)		declare <vscale x 2 x i1> @llvm.aarch64.sve.zip2.nxv2i1(<vscale x 2 x i1>, <vscale x 2 x i1>)
declare <vscale x 16 x i8> @llvm.aarch64.sve.zip2.nxv16i8(<vscale x 16 x i8>, <vscale x 16 x i8>)		declare <vscale x 16 x i8> @llvm.aarch64.sve.zip2.nxv16i8(<vscale x 16 x i8>, <vscale x 16 x i8>)
declare <vscale x 8 x i16> @llvm.aarch64.sve.zip2.nxv8i16(<vscale x 8 x i16>, <vscale x 8 x i16>)		declare <vscale x 8 x i16> @llvm.aarch64.sve.zip2.nxv8i16(<vscale x 8 x i16>, <vscale x 8 x i16>)
declare <vscale x 4 x i32> @llvm.aarch64.sve.zip2.nxv4i32(<vscale x 4 x i32>, <vscale x 4 x i32>)		declare <vscale x 4 x i32> @llvm.aarch64.sve.zip2.nxv4i32(<vscale x 4 x i32>, <vscale x 4 x i32>)
declare <vscale x 2 x i64> @llvm.aarch64.sve.zip2.nxv2i64(<vscale x 2 x i64>, <vscale x 2 x i64>)		declare <vscale x 2 x i64> @llvm.aarch64.sve.zip2.nxv2i64(<vscale x 2 x i64>, <vscale x 2 x i64>)
declare <vscale x 2 x half> @llvm.aarch64.sve.zip2.nxv2f16(<vscale x 2 x half>, <vscale x 2 x half>)		declare <vscale x 2 x half> @llvm.aarch64.sve.zip2.nxv2f16(<vscale x 2 x half>, <vscale x 2 x half>)
declare <vscale x 4 x half> @llvm.aarch64.sve.zip2.nxv4f16(<vscale x 4 x half>, <vscale x 4 x half>)		declare <vscale x 4 x half> @llvm.aarch64.sve.zip2.nxv4f16(<vscale x 4 x half>, <vscale x 4 x half>)
declare <vscale x 8 x bfloat> @llvm.aarch64.sve.zip2.nxv8bf16(<vscale x 8 x bfloat>, <vscale x 8 x bfloat>)		declare <vscale x 8 x bfloat> @llvm.aarch64.sve.zip2.nxv8bf16(<vscale x 8 x bfloat>, <vscale x 8 x bfloat>)
declare <vscale x 8 x half> @llvm.aarch64.sve.zip2.nxv8f16(<vscale x 8 x half>, <vscale x 8 x half>)		declare <vscale x 8 x half> @llvm.aarch64.sve.zip2.nxv8f16(<vscale x 8 x half>, <vscale x 8 x half>)
declare <vscale x 2 x float> @llvm.aarch64.sve.zip2.nxv2f32(<vscale x 2 x float>, <vscale x 2 x float>)		declare <vscale x 2 x float> @llvm.aarch64.sve.zip2.nxv2f32(<vscale x 2 x float>, <vscale x 2 x float>)
declare <vscale x 4 x float> @llvm.aarch64.sve.zip2.nxv4f32(<vscale x 4 x float>, <vscale x 4 x float>)		declare <vscale x 4 x float> @llvm.aarch64.sve.zip2.nxv4f32(<vscale x 4 x float>, <vscale x 4 x float>)
declare <vscale x 2 x double> @llvm.aarch64.sve.zip2.nxv2f64(<vscale x 2 x double>, <vscale x 2 x double>)		declare <vscale x 2 x double> @llvm.aarch64.sve.zip2.nxv2f64(<vscale x 2 x double>, <vscale x 2 x double>)

		declare <vscale x 16 x i1> @llvm.aarch64.sve.zip2.b16(<vscale x 16 x i1>, <vscale x 16 x i1>)
		declare <vscale x 16 x i1> @llvm.aarch64.sve.zip2.b32(<vscale x 16 x i1>, <vscale x 16 x i1>)
		declare <vscale x 16 x i1> @llvm.aarch64.sve.zip2.b64(<vscale x 16 x i1>, <vscale x 16 x i1>)

declare <vscale x 2 x double> @llvm.vector.insert.nxv2f64.v2f64(<vscale x 2 x double>, <2 x double>, i64)		declare <vscale x 2 x double> @llvm.vector.insert.nxv2f64.v2f64(<vscale x 2 x double>, <2 x double>, i64)
declare <vscale x 4 x float> @llvm.vector.insert.nxv4f32.v4f32(<vscale x 4 x float>, <4 x float>, i64)		declare <vscale x 4 x float> @llvm.vector.insert.nxv4f32.v4f32(<vscale x 4 x float>, <4 x float>, i64)
declare <vscale x 8 x half> @llvm.vector.insert.nxv8f16.v8f16(<vscale x 8 x half>, <8 x half>, i64)		declare <vscale x 8 x half> @llvm.vector.insert.nxv8f16.v8f16(<vscale x 8 x half>, <8 x half>, i64)
declare <vscale x 2 x i64> @llvm.vector.insert.nxv2i64.v2i64(<vscale x 2 x i64>, <2 x i64>, i64)		declare <vscale x 2 x i64> @llvm.vector.insert.nxv2i64.v2i64(<vscale x 2 x i64>, <2 x i64>, i64)
declare <vscale x 4 x i32> @llvm.vector.insert.nxv4i32.v4i32(<vscale x 4 x i32>, <4 x i32>, i64)		declare <vscale x 4 x i32> @llvm.vector.insert.nxv4i32.v4i32(<vscale x 4 x i32>, <4 x i32>, i64)
declare <vscale x 8 x i16> @llvm.vector.insert.nxv8i16.v8i16(<vscale x 8 x i16>, <8 x i16>, i64)		declare <vscale x 8 x i16> @llvm.vector.insert.nxv8i16.v8i16(<vscale x 8 x i16>, <8 x i16>, i64)
declare <vscale x 16 x i8> @llvm.vector.insert.nxv16i8.v16i8(<vscale x 16 x i8>, <16 x i8>, i64)		declare <vscale x 16 x i8> @llvm.vector.insert.nxv16i8.v16i8(<vscale x 16 x i8>, <16 x i8>, i64)
declare <vscale x 8 x bfloat> @llvm.vector.insert.nxv8bf16.v8bf16(<vscale x 8 x bfloat>, <8 x bfloat>, i64)		declare <vscale x 8 x bfloat> @llvm.vector.insert.nxv8bf16.v8bf16(<vscale x 8 x bfloat>, <8 x bfloat>, i64)

; +bf16 is required for the bfloat version.		; +bf16 is required for the bfloat version.
attributes #0 = { "target-features"="+sve,+bf16" }		attributes #0 = { "target-features"="+sve,+bf16" }

This is an archive of the discontinued LLVM Phabricator instance.

[SVE] Fix incorrect lowering of predicate permute builtins.ClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 492387

clang/include/clang/Basic/arm_sve.td

clang/test/CodeGen/aarch64-sve-intrinsics/acle_sve_rev.c

clang/test/CodeGen/aarch64-sve-intrinsics/acle_sve_trn1.c

clang/test/CodeGen/aarch64-sve-intrinsics/acle_sve_trn2.c

clang/test/CodeGen/aarch64-sve-intrinsics/acle_sve_uzp1.c

clang/test/CodeGen/aarch64-sve-intrinsics/acle_sve_uzp2.c

clang/test/CodeGen/aarch64-sve-intrinsics/acle_sve_zip1.c

clang/test/CodeGen/aarch64-sve-intrinsics/acle_sve_zip2.c

llvm/include/llvm/IR/IntrinsicsAArch64.td

llvm/lib/Target/AArch64/AArch64SVEInstrInfo.td

llvm/lib/Target/AArch64/SVEInstrFormats.td

llvm/test/CodeGen/AArch64/sve-intrinsics-perm-select.ll

[SVE] Fix incorrect lowering of predicate permute builtins.
ClosedPublic