Diff 272593

clang/include/clang/Basic/arm_sve.td

	Show First 20 Lines • Show All 672 Lines • ▼ Show 20 Lines
	def SVADRW : SInst<"svadrw[_{0}base]_[{2}]index", "uud", "ilUiUl", MergeNone, "aarch64_sve_adrw">;			def SVADRW : SInst<"svadrw[_{0}base]_[{2}]index", "uud", "ilUiUl", MergeNone, "aarch64_sve_adrw">;
	def SVADRD : SInst<"svadrd[_{0}base]_[{2}]index", "uud", "ilUiUl", MergeNone, "aarch64_sve_adrd">;			def SVADRD : SInst<"svadrd[_{0}base]_[{2}]index", "uud", "ilUiUl", MergeNone, "aarch64_sve_adrd">;

	////////////////////////////////////////////////////////////////////////////////			////////////////////////////////////////////////////////////////////////////////
	// Scalar to vector			// Scalar to vector

	def SVDUPQ_8 : SInst<"svdupq[_n]_{d}", "dssssssssssssssss", "cUc", MergeNone>;			def SVDUPQ_8 : SInst<"svdupq[_n]_{d}", "dssssssssssssssss", "cUc", MergeNone>;
	def SVDUPQ_16 : SInst<"svdupq[_n]_{d}", "dssssssss", "sUsh", MergeNone>;			def SVDUPQ_16 : SInst<"svdupq[_n]_{d}", "dssssssss", "sUsh", MergeNone>;
				let ArchGuard = "defined(__ARM_FEATURE_SVE_BF16) && defined(__ARM_FEATURE_BF16_SCALAR_ARITHMETIC) " in {
				c-rhodesUnsubmitted Done Reply Inline Actions `__ARM_FEATURE_SVE_BF16` will imply `__ARM_FEATURE_BF16_SCALAR_ARITHMETIC` so guarding only on the former should be sufficient. Same applies below c-rhodes: `__ARM_FEATURE_SVE_BF16` will imply `__ARM_FEATURE_BF16_SCALAR_ARITHMETIC` so guarding only on…
				def SVDUPQ_BF16 : SInst<"svdupq[_n]_{d}", "dssssssss", "b", MergeNone>;
				}
	def SVDUPQ_32 : SInst<"svdupq[_n]_{d}", "dssss", "iUif", MergeNone>;			def SVDUPQ_32 : SInst<"svdupq[_n]_{d}", "dssss", "iUif", MergeNone>;
	def SVDUPQ_64 : SInst<"svdupq[_n]_{d}", "dss", "lUld", MergeNone>;			def SVDUPQ_64 : SInst<"svdupq[_n]_{d}", "dss", "lUld", MergeNone>;

	def SVDUP : SInst<"svdup[_n]_{d}", "ds", "csilUcUsUiUlhfd", MergeNone, "aarch64_sve_dup_x">;			multiclass svdup_base<string n, string p, MergeType mt, string i> {
	def SVDUP_M : SInst<"svdup[_n]_{d}", "ddPs", "csilUcUsUiUlhfd", MergeOp1, "aarch64_sve_dup">;			def NAME : SInst<n, p, "csilUcUsUiUlhfd", mt, i>;
	def SVDUP_X : SInst<"svdup[_n]_{d}", "dPs", "csilUcUsUiUlhfd", MergeAnyExp, "aarch64_sve_dup">;			let ArchGuard = "defined(__ARM_FEATURE_SVE_BF16) && defined(__ARM_FEATURE_BF16_SCALAR_ARITHMETIC) " in {
	def SVDUP_Z : SInst<"svdup[_n]_{d}", "dPs", "csilUcUsUiUlhfd", MergeZeroExp, "aarch64_sve_dup">;			def _BF16: SInst<n, p, "b", mt, i>;
				c-rhodesUnsubmitted Done Reply Inline Actions nit: could you fix the spacing? I don't think it's worth trying to keep the two defs inline, single spaces everywhere would do c-rhodes: nit: could you fix the spacing? I don't think it's worth trying to keep the two defs inline…
				}
				}

				defm SVDUP : svdup_base<"svdup[_n]_{d}", "ds", MergeNone, "aarch64_sve_dup_x">;
				defm SVDUP_M : svdup_base<"svdup[_n]_{d}", "ddPs", MergeOp1, "aarch64_sve_dup">;
				defm SVDUP_X : svdup_base<"svdup[_n]_{d}", "dPs", MergeAnyExp, "aarch64_sve_dup">;
				defm SVDUP_Z : svdup_base<"svdup[_n]_{d}", "dPs", MergeZeroExp, "aarch64_sve_dup">;

	def SVINDEX : SInst<"svindex_{d}", "dss", "csilUcUsUiUl", MergeNone, "aarch64_sve_index">;			def SVINDEX : SInst<"svindex_{d}", "dss", "csilUcUsUiUl", MergeNone, "aarch64_sve_index">;

	// Integer arithmetic			// Integer arithmetic

	multiclass SInstZPZ<string name, string types, string intrinsic, list<FlagType> flags=[]> {			multiclass SInstZPZ<string name, string types, string intrinsic, list<FlagType> flags=[]> {
	def _M : SInst<name # "[_{d}]", "ddPd", types, MergeOp1, intrinsic, flags>;			def _M : SInst<name # "[_{d}]", "ddPd", types, MergeOp1, intrinsic, flags>;
	def _X : SInst<name # "[_{d}]", "dPd", types, MergeAnyExp, intrinsic, flags>;			def _X : SInst<name # "[_{d}]", "dPd", types, MergeAnyExp, intrinsic, flags>;
	▲ Show 20 Lines • Show All 102 Lines • ▼ Show 20 Lines

	defm SVASR : SInst_SHIFT<"svasr", "aarch64_sve_asr", "csil", "csi">;			defm SVASR : SInst_SHIFT<"svasr", "aarch64_sve_asr", "csil", "csi">;
	defm SVLSL : SInst_SHIFT<"svlsl", "aarch64_sve_lsl", "csilUcUsUiUl", "csiUcUsUi">;			defm SVLSL : SInst_SHIFT<"svlsl", "aarch64_sve_lsl", "csilUcUsUiUl", "csiUcUsUi">;
	defm SVLSR : SInst_SHIFT<"svlsr", "aarch64_sve_lsr", "UcUsUiUl", "UcUsUi">;			defm SVLSR : SInst_SHIFT<"svlsr", "aarch64_sve_lsr", "UcUsUiUl", "UcUsUi">;

	def SVASRD_M : SInst<"svasrd[_n_{d}]", "dPdi", "csil", MergeOp1, "aarch64_sve_asrd", [], [ImmCheck<2, ImmCheckShiftRight, 1>]>;			def SVASRD_M : SInst<"svasrd[_n_{d}]", "dPdi", "csil", MergeOp1, "aarch64_sve_asrd", [], [ImmCheck<2, ImmCheckShiftRight, 1>]>;
	def SVASRD_X : SInst<"svasrd[_n_{d}]", "dPdi", "csil", MergeAny, "aarch64_sve_asrd", [], [ImmCheck<2, ImmCheckShiftRight, 1>]>;			def SVASRD_X : SInst<"svasrd[_n_{d}]", "dPdi", "csil", MergeAny, "aarch64_sve_asrd", [], [ImmCheck<2, ImmCheckShiftRight, 1>]>;
	def SVASRD_Z : SInst<"svasrd[_n_{d}]", "dPdi", "csil", MergeZero, "aarch64_sve_asrd", [], [ImmCheck<2, ImmCheckShiftRight, 1>]>;			def SVASRD_Z : SInst<"svasrd[_n_{d}]", "dPdi", "csil", MergeZero, "aarch64_sve_asrd", [], [ImmCheck<2, ImmCheckShiftRight, 1>]>;
	def SVINSR : SInst<"svinsr[_n_{d}]", "dds", "csilUcUsUiUlhfd", MergeNone, "aarch64_sve_insr">;

				def SVINSR : SInst<"svinsr[_n_{d}]", "dds", "csilUcUsUiUlhfd", MergeNone, "aarch64_sve_insr">;
				c-rhodesUnsubmitted Done Reply Inline Actions nit: remove double spaces c-rhodes: nit: remove double spaces
				let ArchGuard = "defined(__ARM_FEATURE_SVE_BF16) && defined(__ARM_FEATURE_BF16_SCALAR_ARITHMETIC) " in {
				def SVINSR_BF16 : SInst<"svinsr[_n_{d}]", "dds", "b", MergeNone, "aarch64_sve_insr">;
				}

	////////////////////////////////////////////////////////////////////////////////			////////////////////////////////////////////////////////////////////////////////
	// Integer reductions			// Integer reductions

	def SVADDV_S : SInst<"svaddv[_{d}]", "lPd", "csil", MergeNone, "aarch64_sve_saddv">;			def SVADDV_S : SInst<"svaddv[_{d}]", "lPd", "csil", MergeNone, "aarch64_sve_saddv">;
	def SVADDV_U : SInst<"svaddv[_{d}]", "nPd", "UcUsUiUl", MergeNone, "aarch64_sve_uaddv">;			def SVADDV_U : SInst<"svaddv[_{d}]", "nPd", "UcUsUiUl", MergeNone, "aarch64_sve_uaddv">;
	def SVANDV : SInst<"svandv[_{d}]", "sPd", "csilUcUsUiUl", MergeNone, "aarch64_sve_andv">;			def SVANDV : SInst<"svandv[_{d}]", "sPd", "csilUcUsUiUl", MergeNone, "aarch64_sve_andv">;
	def SVEORV : SInst<"sveorv[_{d}]", "sPd", "csilUcUsUiUl", MergeNone, "aarch64_sve_eorv">;			def SVEORV : SInst<"sveorv[_{d}]", "sPd", "csilUcUsUiUl", MergeNone, "aarch64_sve_eorv">;
	▲ Show 20 Lines • Show All 312 Lines • ▼ Show 20 Lines
	def SVCLASTB_N : SInst<"svclastb[_n_{d}]", "sPsd", "csilUcUsUiUlhfd", MergeNone, "aarch64_sve_clastb_n">;			def SVCLASTB_N : SInst<"svclastb[_n_{d}]", "sPsd", "csilUcUsUiUlhfd", MergeNone, "aarch64_sve_clastb_n">;
	def SVCOMPACT : SInst<"svcompact[_{d}]", "dPd", "ilUiUlfd", MergeNone, "aarch64_sve_compact">;			def SVCOMPACT : SInst<"svcompact[_{d}]", "dPd", "ilUiUlfd", MergeNone, "aarch64_sve_compact">;
	// Note: svdup_lane is implemented using the intrinsic for TBL to represent a			// Note: svdup_lane is implemented using the intrinsic for TBL to represent a
	// splat of any possible lane. It is upto LLVM to pick a more efficient			// splat of any possible lane. It is upto LLVM to pick a more efficient
	// instruction such as DUP (indexed) if the lane index fits the range of the			// instruction such as DUP (indexed) if the lane index fits the range of the
	// instruction's immediate.			// instruction's immediate.
	def SVDUP_LANE : SInst<"svdup_lane[_{d}]", "ddL", "csilUcUsUiUlhfd", MergeNone, "aarch64_sve_tbl">;			def SVDUP_LANE : SInst<"svdup_lane[_{d}]", "ddL", "csilUcUsUiUlhfd", MergeNone, "aarch64_sve_tbl">;
	def SVDUPQ_LANE : SInst<"svdupq_lane[_{d}]", "ddn", "csilUcUsUiUlhfd", MergeNone, "aarch64_sve_dupq_lane">;			def SVDUPQ_LANE : SInst<"svdupq_lane[_{d}]", "ddn", "csilUcUsUiUlhfd", MergeNone, "aarch64_sve_dupq_lane">;
				let ArchGuard = "defined(__ARM_FEATURE_SVE_BF16) && defined(__ARM_FEATURE_BF16_SCALAR_ARITHMETIC) " in {
				c-rhodesUnsubmitted Done Reply Inline Actions `__ARM_FEATURE_BF16_SCALAR_ARITHMETIC` can be removed c-rhodes: `__ARM_FEATURE_BF16_SCALAR_ARITHMETIC` can be removed
				def SVDUPQ_LANE_BF16 : SInst<"svdupq_lane[_{d}]", "ddn", "b", MergeNone, "aarch64_sve_dupq_lane">;
				}
	def SVEXT : SInst<"svext[_{d}]", "dddi", "csilUcUsUiUlhfd", MergeNone, "aarch64_sve_ext", [], [ImmCheck<2, ImmCheckExtract, 1>]>;			def SVEXT : SInst<"svext[_{d}]", "dddi", "csilUcUsUiUlhfd", MergeNone, "aarch64_sve_ext", [], [ImmCheck<2, ImmCheckExtract, 1>]>;
	def SVLASTA : SInst<"svlasta[_{d}]", "sPd", "csilUcUsUiUlhfd", MergeNone, "aarch64_sve_lasta">;			def SVLASTA : SInst<"svlasta[_{d}]", "sPd", "csilUcUsUiUlhfd", MergeNone, "aarch64_sve_lasta">;
	def SVLASTB : SInst<"svlastb[_{d}]", "sPd", "csilUcUsUiUlhfd", MergeNone, "aarch64_sve_lastb">;			def SVLASTB : SInst<"svlastb[_{d}]", "sPd", "csilUcUsUiUlhfd", MergeNone, "aarch64_sve_lastb">;
	def SVREV : SInst<"svrev[_{d}]", "dd", "csilUcUsUiUlhfd", MergeNone, "aarch64_sve_rev">;			def SVREV : SInst<"svrev[_{d}]", "dd", "csilUcUsUiUlhfd", MergeNone, "aarch64_sve_rev">;
	def SVSEL : SInst<"svsel[_{d}]", "dPdd", "csilUcUsUiUlhfd", MergeNone, "aarch64_sve_sel">;			def SVSEL : SInst<"svsel[_{d}]", "dPdd", "csilUcUsUiUlhfd", MergeNone, "aarch64_sve_sel">;
	def SVSPLICE : SInst<"svsplice[_{d}]", "dPdd", "csilUcUsUiUlhfd", MergeNone, "aarch64_sve_splice">;			def SVSPLICE : SInst<"svsplice[_{d}]", "dPdd", "csilUcUsUiUlhfd", MergeNone, "aarch64_sve_splice">;
	def SVTBL : SInst<"svtbl[_{d}]", "ddu", "csilUcUsUiUlhfd", MergeNone, "aarch64_sve_tbl">;			def SVTBL : SInst<"svtbl[_{d}]", "ddu", "csilUcUsUiUlhfd", MergeNone, "aarch64_sve_tbl">;
	def SVTRN1 : SInst<"svtrn1[_{d}]", "ddd", "csilUcUsUiUlhfd", MergeNone, "aarch64_sve_trn1">;			def SVTRN1 : SInst<"svtrn1[_{d}]", "ddd", "csilUcUsUiUlhfd", MergeNone, "aarch64_sve_trn1">;
	▲ Show 20 Lines • Show All 799 Lines • Show Last 20 Lines

clang/lib/CodeGen/CGBuiltin.cpp

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 7,714 Lines • ▼ Show 20 Lines	CodeGenFunction::getSVEPredType(SVETypeFlags TypeFlags) {
case SVETypeFlags::EltTyBool8:		case SVETypeFlags::EltTyBool8:
return llvm::ScalableVectorType::get(Builder.getInt1Ty(), 16);		return llvm::ScalableVectorType::get(Builder.getInt1Ty(), 16);
case SVETypeFlags::EltTyBool16:		case SVETypeFlags::EltTyBool16:
return llvm::ScalableVectorType::get(Builder.getInt1Ty(), 8);		return llvm::ScalableVectorType::get(Builder.getInt1Ty(), 8);
case SVETypeFlags::EltTyBool32:		case SVETypeFlags::EltTyBool32:
return llvm::ScalableVectorType::get(Builder.getInt1Ty(), 4);		return llvm::ScalableVectorType::get(Builder.getInt1Ty(), 4);
case SVETypeFlags::EltTyBool64:		case SVETypeFlags::EltTyBool64:
return llvm::ScalableVectorType::get(Builder.getInt1Ty(), 2);		return llvm::ScalableVectorType::get(Builder.getInt1Ty(), 2);

		case SVETypeFlags::EltTyBFloat16:
		return llvm::ScalableVectorType::get(Builder.getInt1Ty(), 8);
		c-rhodesUnsubmitted Done Reply Inline Actions already added in D82399, you should see it when rebasing c-rhodes: already added in D82399, you should see it when rebasing
}		}
}		}

// Return the llvm vector type corresponding to the specified element TypeFlags.		// Return the llvm vector type corresponding to the specified element TypeFlags.
llvm::ScalableVectorType *		llvm::ScalableVectorType *
CodeGenFunction::getSVEType(const SVETypeFlags &TypeFlags) {		CodeGenFunction::getSVEType(const SVETypeFlags &TypeFlags) {
switch (TypeFlags.getEltType()) {		switch (TypeFlags.getEltType()) {
default:		default:
▲ Show 20 Lines • Show All 627 Lines • ▼ Show 20 Lines	Value *CodeGenFunction::EmitAArch64SVEBuiltinExpr(unsigned BuiltinID,
case SVE::BI__builtin_sve_svdupq_n_b64:		case SVE::BI__builtin_sve_svdupq_n_b64:
case SVE::BI__builtin_sve_svdupq_n_u8:		case SVE::BI__builtin_sve_svdupq_n_u8:
case SVE::BI__builtin_sve_svdupq_n_s8:		case SVE::BI__builtin_sve_svdupq_n_s8:
case SVE::BI__builtin_sve_svdupq_n_u64:		case SVE::BI__builtin_sve_svdupq_n_u64:
case SVE::BI__builtin_sve_svdupq_n_f64:		case SVE::BI__builtin_sve_svdupq_n_f64:
case SVE::BI__builtin_sve_svdupq_n_s64:		case SVE::BI__builtin_sve_svdupq_n_s64:
case SVE::BI__builtin_sve_svdupq_n_u16:		case SVE::BI__builtin_sve_svdupq_n_u16:
case SVE::BI__builtin_sve_svdupq_n_f16:		case SVE::BI__builtin_sve_svdupq_n_f16:
		case SVE::BI__builtin_sve_svdupq_n_bf16:
case SVE::BI__builtin_sve_svdupq_n_s16:		case SVE::BI__builtin_sve_svdupq_n_s16:
case SVE::BI__builtin_sve_svdupq_n_u32:		case SVE::BI__builtin_sve_svdupq_n_u32:
case SVE::BI__builtin_sve_svdupq_n_f32:		case SVE::BI__builtin_sve_svdupq_n_f32:
case SVE::BI__builtin_sve_svdupq_n_s32: {		case SVE::BI__builtin_sve_svdupq_n_s32: {
// These builtins are implemented by storing each element to an array and using		// These builtins are implemented by storing each element to an array and using
// ld1rq to materialize a vector.		// ld1rq to materialize a vector.
unsigned NumOpnds = Ops.size();		unsigned NumOpnds = Ops.size();

▲ Show 20 Lines • Show All 8,403 Lines • Show Last 20 Lines

clang/test/CodeGen/aarch64-sve-intrinsics/acle_sve_dup.c

	// RUN: %clang_cc1 -D__ARM_FEATURE_SVE -triple aarch64-none-linux-gnu -target-feature +sve -fallow-half-arguments-and-returns -S -O1 -Werror -Wall -emit-llvm -o - %s \| FileCheck %s			// RUN: %clang_cc1 -D__ARM_FEATURE_SVE -triple aarch64-none-linux-gnu -target-feature +sve -fallow-half-arguments-and-returns -S -O1 -Werror -Wall -emit-llvm -o - %s \| FileCheck %s
	// RUN: %clang_cc1 -D__ARM_FEATURE_SVE -DSVE_OVERLOADED_FORMS -triple aarch64-none-linux-gnu -target-feature +sve -fallow-half-arguments-and-returns -S -O1 -Werror -Wall -emit-llvm -o - %s \| FileCheck %s			// RUN: %clang_cc1 -D__ARM_FEATURE_SVE -DSVE_OVERLOADED_FORMS -triple aarch64-none-linux-gnu -target-feature +sve -fallow-half-arguments-and-returns -S -O1 -Werror -Wall -emit-llvm -o - %s \| FileCheck %s

				// RUN: %clang_cc1 -DENABLE_BF16_TESTS -D__ARM_FEATURE_SVE -D__ARM_FEATURE_SVE_BF16 -D__ARM_FEATURE_BF16_SCALAR_ARITHMETIC -triple aarch64-none-linux-gnu -target-feature +sve -target-feature +bf16 -fallow-half-arguments-and-returns -S -O1 -Werror -Wall -emit-llvm -o - %s \| FileCheck %s --check-prefixes=CHECK,CHECKBF16
				// RUN: %clang_cc1 -DENABLE_BF16_TESTS -D__ARM_FEATURE_SVE -D__ARM_FEATURE_SVE_BF16 -D__ARM_FEATURE_BF16_SCALAR_ARITHMETIC -DSVE_OVERLOADED_FORMS -triple aarch64-none-linux-gnu -target-feature +sve -target-feature +bf16 -fallow-half-arguments-and-returns -S -O1 -Werror -Wall -emit-llvm -o - %s \| FileCheck %s --check-prefixes=CHECK,CHECKBF16

	#include <arm_sve.h>			#include <arm_sve.h>

	#ifdef SVE_OVERLOADED_FORMS			#ifdef SVE_OVERLOADED_FORMS
	// A simple used,unused... macro, long enough to represent any SVE builtin.			// A simple used,unused... macro, long enough to represent any SVE builtin.
	#define SVE_ACLE_FUNC(A1,A2_UNUSED,A3,A4_UNUSED) A1##A3			#define SVE_ACLE_FUNC(A1,A2_UNUSED,A3,A4_UNUSED) A1##A3
	#else			#else
	#define SVE_ACLE_FUNC(A1,A2,A3,A4) A1##A2##A3##A4			#define SVE_ACLE_FUNC(A1,A2,A3,A4) A1##A2##A3##A4
	#endif			#endif
	▲ Show 20 Lines • Show All 65 Lines • ▼ Show 20 Lines
	svfloat16_t test_svdup_n_f16(float16_t op)			svfloat16_t test_svdup_n_f16(float16_t op)
	{			{
	// CHECK-LABEL: test_svdup_n_f16			// CHECK-LABEL: test_svdup_n_f16
	// CHECK: %[[INTRINSIC:.*]] = call <vscale x 8 x half> @llvm.aarch64.sve.dup.x.nxv8f16(half %op)			// CHECK: %[[INTRINSIC:.*]] = call <vscale x 8 x half> @llvm.aarch64.sve.dup.x.nxv8f16(half %op)
	// CHECK: ret <vscale x 8 x half> %[[INTRINSIC]]			// CHECK: ret <vscale x 8 x half> %[[INTRINSIC]]
	return SVE_ACLE_FUNC(svdup,_n,_f16,)(op);			return SVE_ACLE_FUNC(svdup,_n,_f16,)(op);
	}			}

				#ifdef ENABLE_BF16_TESTS
				svbfloat16_t test_svdup_n_bf16(bfloat16_t op)
				Lint: Pre-merge checks Inline Actions clang-format: please reformat the code -svbfloat16_t test_svdup_n_bf16(bfloat16_t op) -{ +svbfloat16_t test_svdup_n_bf16(bfloat16_t op) { Lint: Pre-merge checks: clang-format: please reformat the code ``` -svbfloat16_t test_svdup_n_bf16(bfloat16_t op) -{…
				{
				// CHECKBF16-LABEL: test_svdup_n_bf16
				// CHECKBF16: %[[INTRINSIC:.*]] = call <vscale x 8 x bfloat> @llvm.aarch64.sve.dup.x.nxv8bf16(bfloat %op)
				// CHECKBF16: ret <vscale x 8 x bfloat> %[[INTRINSIC]]
				return SVE_ACLE_FUNC(svdup,_n,_bf16,)(op);
				Lint: Pre-merge checks Inline Actions clang-format: please reformat the code - return SVE_ACLE_FUNC(svdup,_n,_bf16,)(op); + return SVE_ACLE_FUNC(svdup, _n, _bf16, )(op); Lint: Pre-merge checks: clang-format: please reformat the code ``` - return SVE_ACLE_FUNC(svdup,_n,_bf16,)(op); +…
				}
				#endif

	svfloat32_t test_svdup_n_f32(float32_t op)			svfloat32_t test_svdup_n_f32(float32_t op)
	{			{
	// CHECK-LABEL: test_svdup_n_f32			// CHECK-LABEL: test_svdup_n_f32
	// CHECK: %[[INTRINSIC:.*]] = call <vscale x 4 x float> @llvm.aarch64.sve.dup.x.nxv4f32(float %op)			// CHECK: %[[INTRINSIC:.*]] = call <vscale x 4 x float> @llvm.aarch64.sve.dup.x.nxv4f32(float %op)
	// CHECK: ret <vscale x 4 x float> %[[INTRINSIC]]			// CHECK: ret <vscale x 4 x float> %[[INTRINSIC]]
	return SVE_ACLE_FUNC(svdup,_n,_f32,)(op);			return SVE_ACLE_FUNC(svdup,_n,_f32,)(op);
	}			}

	▲ Show 20 Lines • Show All 79 Lines • ▼ Show 20 Lines
	{			{
	// CHECK-LABEL: test_svdup_n_f16_z			// CHECK-LABEL: test_svdup_n_f16_z
	// CHECK: %[[PG:.*]] = call <vscale x 8 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv8i1(<vscale x 16 x i1> %pg)			// CHECK: %[[PG:.*]] = call <vscale x 8 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv8i1(<vscale x 16 x i1> %pg)
	// CHECK: %[[INTRINSIC:.*]] = call <vscale x 8 x half> @llvm.aarch64.sve.dup.nxv8f16(<vscale x 8 x half> zeroinitializer, <vscale x 8 x i1> %[[PG]], half %op)			// CHECK: %[[INTRINSIC:.*]] = call <vscale x 8 x half> @llvm.aarch64.sve.dup.nxv8f16(<vscale x 8 x half> zeroinitializer, <vscale x 8 x i1> %[[PG]], half %op)
	// CHECK: ret <vscale x 8 x half> %[[INTRINSIC]]			// CHECK: ret <vscale x 8 x half> %[[INTRINSIC]]
	return SVE_ACLE_FUNC(svdup,_n,_f16_z,)(pg, op);			return SVE_ACLE_FUNC(svdup,_n,_f16_z,)(pg, op);
	}			}

				#ifdef ENABLE_BF16_TESTS
				svbfloat16_t test_svdup_n_bf16_z(svbool_t pg, bfloat16_t op)
				Lint: Pre-merge checks Inline Actions clang-format: please reformat the code -svbfloat16_t test_svdup_n_bf16_z(svbool_t pg, bfloat16_t op) -{ +svbfloat16_t test_svdup_n_bf16_z(svbool_t pg, bfloat16_t op) { Lint: Pre-merge checks: clang-format: please reformat the code ``` -svbfloat16_t test_svdup_n_bf16_z(svbool_t pg…
				{
				// CHECKBF16-LABEL: test_svdup_n_bf16_z
				// CHECKBF16: %[[PG:.*]] = call <vscale x 8 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv8i1(<vscale x 16 x i1> %pg)
				// CHECKBF16: %[[INTRINSIC:.*]] = call <vscale x 8 x bfloat> @llvm.aarch64.sve.dup.nxv8bf16(<vscale x 8 x bfloat> zeroinitializer, <vscale x 8 x i1> %[[PG]], bfloat %op)
				// CHECKBF16: ret <vscale x 8 x bfloat> %[[INTRINSIC]]
				return SVE_ACLE_FUNC(svdup,_n,_bf16_z,)(pg, op);
				Lint: Pre-merge checks Inline Actions clang-format: please reformat the code - return SVE_ACLE_FUNC(svdup,_n,_bf16_z,)(pg, op); + return SVE_ACLE_FUNC(svdup, _n, _bf16_z, )(pg, op); Lint: Pre-merge checks: clang-format: please reformat the code ``` - return SVE_ACLE_FUNC(svdup,_n,_bf16_z,)(pg, op)…
				}
				#endif

	svfloat32_t test_svdup_n_f32_z(svbool_t pg, float32_t op)			svfloat32_t test_svdup_n_f32_z(svbool_t pg, float32_t op)
	{			{
	// CHECK-LABEL: test_svdup_n_f32_z			// CHECK-LABEL: test_svdup_n_f32_z
	// CHECK: %[[PG:.*]] = call <vscale x 4 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv4i1(<vscale x 16 x i1> %pg)			// CHECK: %[[PG:.*]] = call <vscale x 4 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv4i1(<vscale x 16 x i1> %pg)
	// CHECK: %[[INTRINSIC:.*]] = call <vscale x 4 x float> @llvm.aarch64.sve.dup.nxv4f32(<vscale x 4 x float> zeroinitializer, <vscale x 4 x i1> %[[PG]], float %op)			// CHECK: %[[INTRINSIC:.*]] = call <vscale x 4 x float> @llvm.aarch64.sve.dup.nxv4f32(<vscale x 4 x float> zeroinitializer, <vscale x 4 x i1> %[[PG]], float %op)
	// CHECK: ret <vscale x 4 x float> %[[INTRINSIC]]			// CHECK: ret <vscale x 4 x float> %[[INTRINSIC]]
	return SVE_ACLE_FUNC(svdup,_n,_f32_z,)(pg, op);			return SVE_ACLE_FUNC(svdup,_n,_f32_z,)(pg, op);
	}			}
	▲ Show 20 Lines • Show All 81 Lines • ▼ Show 20 Lines
	{			{
	// CHECK-LABEL: test_svdup_n_f16_m			// CHECK-LABEL: test_svdup_n_f16_m
	// CHECK: %[[PG:.*]] = call <vscale x 8 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv8i1(<vscale x 16 x i1> %pg)			// CHECK: %[[PG:.*]] = call <vscale x 8 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv8i1(<vscale x 16 x i1> %pg)
	// CHECK: %[[INTRINSIC:.*]] = call <vscale x 8 x half> @llvm.aarch64.sve.dup.nxv8f16(<vscale x 8 x half> %inactive, <vscale x 8 x i1> %[[PG]], half %op)			// CHECK: %[[INTRINSIC:.*]] = call <vscale x 8 x half> @llvm.aarch64.sve.dup.nxv8f16(<vscale x 8 x half> %inactive, <vscale x 8 x i1> %[[PG]], half %op)
	// CHECK: ret <vscale x 8 x half> %[[INTRINSIC]]			// CHECK: ret <vscale x 8 x half> %[[INTRINSIC]]
	return SVE_ACLE_FUNC(svdup,_n,_f16_m,)(inactive, pg, op);			return SVE_ACLE_FUNC(svdup,_n,_f16_m,)(inactive, pg, op);
	}			}

				#ifdef ENABLE_BF16_TESTS
				svbfloat16_t test_svdup_n_bf16_m(svbfloat16_t inactive, svbool_t pg, bfloat16_t op)
				Lint: Pre-merge checks Inline Actions clang-format: please reformat the code -svbfloat16_t test_svdup_n_bf16_m(svbfloat16_t inactive, svbool_t pg, bfloat16_t op) -{ +svbfloat16_t test_svdup_n_bf16_m(svbfloat16_t inactive, svbool_t pg, bfloat16_t op) { Lint: Pre-merge checks: clang-format: please reformat the code ``` -svbfloat16_t test_svdup_n_bf16_m(svbfloat16_t…
				{
				// CHECKBF16-LABEL: test_svdup_n_bf16_m
				// CHECKBF16: %[[PG:.*]] = call <vscale x 8 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv8i1(<vscale x 16 x i1> %pg)
				// CHECKBF16: %[[INTRINSIC:.*]] = call <vscale x 8 x bfloat> @llvm.aarch64.sve.dup.nxv8bf16(<vscale x 8 x bfloat> %inactive, <vscale x 8 x i1> %[[PG]], bfloat %op)
				// CHECKBF16: ret <vscale x 8 x bfloat> %[[INTRINSIC]]
				return SVE_ACLE_FUNC(svdup,_n,_bf16_m,)(inactive, pg, op);
				Lint: Pre-merge checks Inline Actions clang-format: please reformat the code - return SVE_ACLE_FUNC(svdup,_n,_bf16_m,)(inactive, pg, op); + return SVE_ACLE_FUNC(svdup, _n, _bf16_m, )(inactive, pg, op); Lint: Pre-merge checks: clang-format: please reformat the code ``` - return SVE_ACLE_FUNC(svdup,_n,_bf16_m,)(inactive…
				}
				#endif

	svfloat32_t test_svdup_n_f32_m(svfloat32_t inactive, svbool_t pg, float32_t op)			svfloat32_t test_svdup_n_f32_m(svfloat32_t inactive, svbool_t pg, float32_t op)
	{			{
	// CHECK-LABEL: test_svdup_n_f32_m			// CHECK-LABEL: test_svdup_n_f32_m
	// CHECK: %[[PG:.*]] = call <vscale x 4 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv4i1(<vscale x 16 x i1> %pg)			// CHECK: %[[PG:.*]] = call <vscale x 4 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv4i1(<vscale x 16 x i1> %pg)
	// CHECK: %[[INTRINSIC:.*]] = call <vscale x 4 x float> @llvm.aarch64.sve.dup.nxv4f32(<vscale x 4 x float> %inactive, <vscale x 4 x i1> %[[PG]], float %op)			// CHECK: %[[INTRINSIC:.*]] = call <vscale x 4 x float> @llvm.aarch64.sve.dup.nxv4f32(<vscale x 4 x float> %inactive, <vscale x 4 x i1> %[[PG]], float %op)
	// CHECK: ret <vscale x 4 x float> %[[INTRINSIC]]			// CHECK: ret <vscale x 4 x float> %[[INTRINSIC]]
	return SVE_ACLE_FUNC(svdup,_n,_f32_m,)(inactive, pg, op);			return SVE_ACLE_FUNC(svdup,_n,_f32_m,)(inactive, pg, op);
	}			}
	▲ Show 20 Lines • Show All 81 Lines • ▼ Show 20 Lines
	{			{
	// CHECK-LABEL: test_svdup_n_f16_x			// CHECK-LABEL: test_svdup_n_f16_x
	// CHECK: %[[PG:.*]] = call <vscale x 8 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv8i1(<vscale x 16 x i1> %pg)			// CHECK: %[[PG:.*]] = call <vscale x 8 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv8i1(<vscale x 16 x i1> %pg)
	// CHECK: %[[INTRINSIC:.*]] = call <vscale x 8 x half> @llvm.aarch64.sve.dup.nxv8f16(<vscale x 8 x half> undef, <vscale x 8 x i1> %[[PG]], half %op)			// CHECK: %[[INTRINSIC:.*]] = call <vscale x 8 x half> @llvm.aarch64.sve.dup.nxv8f16(<vscale x 8 x half> undef, <vscale x 8 x i1> %[[PG]], half %op)
	// CHECK: ret <vscale x 8 x half> %[[INTRINSIC]]			// CHECK: ret <vscale x 8 x half> %[[INTRINSIC]]
	return SVE_ACLE_FUNC(svdup,_n,_f16_x,)(pg, op);			return SVE_ACLE_FUNC(svdup,_n,_f16_x,)(pg, op);
	}			}

				#ifdef ENABLE_BF16_TESTS
				svbfloat16_t test_svdup_n_bf16_x(svbool_t pg, bfloat16_t op)
				Lint: Pre-merge checks Inline Actions clang-format: please reformat the code -svbfloat16_t test_svdup_n_bf16_x(svbool_t pg, bfloat16_t op) -{ +svbfloat16_t test_svdup_n_bf16_x(svbool_t pg, bfloat16_t op) { Lint: Pre-merge checks: clang-format: please reformat the code ``` -svbfloat16_t test_svdup_n_bf16_x(svbool_t pg…
				{
				// CHECKBF16-LABEL: test_svdup_n_bf16_x
				// CHECKBF16: %[[PG:.*]] = call <vscale x 8 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv8i1(<vscale x 16 x i1> %pg)
				// CHECKBF16: %[[INTRINSIC:.*]] = call <vscale x 8 x bfloat> @llvm.aarch64.sve.dup.nxv8bf16(<vscale x 8 x bfloat> undef, <vscale x 8 x i1> %[[PG]], bfloat %op)
				// CHECKBF16: ret <vscale x 8 x bfloat> %[[INTRINSIC]]
				return SVE_ACLE_FUNC(svdup,_n,_bf16_x,)(pg, op);
				Lint: Pre-merge checks Inline Actions clang-format: please reformat the code - return SVE_ACLE_FUNC(svdup,_n,_bf16_x,)(pg, op); + return SVE_ACLE_FUNC(svdup, _n, _bf16_x, )(pg, op); Lint: Pre-merge checks: clang-format: please reformat the code ``` - return SVE_ACLE_FUNC(svdup,_n,_bf16_x,)(pg, op)…
				}
				#endif

	svfloat32_t test_svdup_n_f32_x(svbool_t pg, float32_t op)			svfloat32_t test_svdup_n_f32_x(svbool_t pg, float32_t op)
	{			{
	// CHECK-LABEL: test_svdup_n_f32_x			// CHECK-LABEL: test_svdup_n_f32_x
	// CHECK: %[[PG:.*]] = call <vscale x 4 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv4i1(<vscale x 16 x i1> %pg)			// CHECK: %[[PG:.*]] = call <vscale x 4 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv4i1(<vscale x 16 x i1> %pg)
	// CHECK: %[[INTRINSIC:.*]] = call <vscale x 4 x float> @llvm.aarch64.sve.dup.nxv4f32(<vscale x 4 x float> undef, <vscale x 4 x i1> %[[PG]], float %op)			// CHECK: %[[INTRINSIC:.*]] = call <vscale x 4 x float> @llvm.aarch64.sve.dup.nxv4f32(<vscale x 4 x float> undef, <vscale x 4 x i1> %[[PG]], float %op)
	// CHECK: ret <vscale x 4 x float> %[[INTRINSIC]]			// CHECK: ret <vscale x 4 x float> %[[INTRINSIC]]
	return SVE_ACLE_FUNC(svdup,_n,_f32_x,)(pg, op);			return SVE_ACLE_FUNC(svdup,_n,_f32_x,)(pg, op);
	}			}
	▲ Show 20 Lines • Show All 143 Lines • Show Last 20 Lines

clang/test/CodeGen/aarch64-sve-intrinsics/acle_sve_dupq.c

// RUN: %clang_cc1 -D__ARM_FEATURE_SVE -triple aarch64-none-linux-gnu -target-feature +sve -fallow-half-arguments-and-returns -S -O1 -Werror -Wall -emit-llvm -o - %s \| FileCheck %s		// RUN: %clang_cc1 -D__ARM_FEATURE_SVE -triple aarch64-none-linux-gnu -target-feature +sve -fallow-half-arguments-and-returns -S -O1 -Werror -Wall -emit-llvm -o - %s \| FileCheck %s
// RUN: %clang_cc1 -D__ARM_FEATURE_SVE -DSVE_OVERLOADED_FORMS -triple aarch64-none-linux-gnu -target-feature +sve -fallow-half-arguments-and-returns -S -O1 -Werror -Wall -emit-llvm -o - %s \| FileCheck %s		// RUN: %clang_cc1 -D__ARM_FEATURE_SVE -DSVE_OVERLOADED_FORMS -triple aarch64-none-linux-gnu -target-feature +sve -fallow-half-arguments-and-returns -S -O1 -Werror -Wall -emit-llvm -o - %s \| FileCheck %s

		// RUN: %clang_cc1 -DENABLE_BF16_TESTS -D__ARM_FEATURE_SVE -D__ARM_FEATURE_SVE_BF16 -D__ARM_FEATURE_BF16_SCALAR_ARITHMETIC -triple aarch64-none-linux-gnu -target-feature +sve -target-feature +bf16 -fallow-half-arguments-and-returns -S -O1 -Werror -Wall -emit-llvm -o - %s \| FileCheck %s --check-prefixes=CHECK,CHECKBF16
		// RUN: %clang_cc1 -DENABLE_BF16_TESTS -D__ARM_FEATURE_SVE -D__ARM_FEATURE_SVE_BF16 -D__ARM_FEATURE_BF16_SCALAR_ARITHMETIC -DSVE_OVERLOADED_FORMS -triple aarch64-none-linux-gnu -target-feature +sve -target-feature +bf16 -fallow-half-arguments-and-returns -S -O1 -Werror -Wall -emit-llvm -o - %s \| FileCheck %s --check-prefixes=CHECK,CHECKBF16


		Lint: Pre-merge checks Inline Actions clang-format: please reformat the code - Lint: Pre-merge checks: clang-format: please reformat the code ``` - ```
#include <arm_sve.h>		#include <arm_sve.h>

#ifdef SVE_OVERLOADED_FORMS		#ifdef SVE_OVERLOADED_FORMS
// A simple used,unused... macro, long enough to represent any SVE builtin.		// A simple used,unused... macro, long enough to represent any SVE builtin.
#define SVE_ACLE_FUNC(A1,A2_UNUSED,A3,A4_UNUSED) A1##A3		#define SVE_ACLE_FUNC(A1,A2_UNUSED,A3,A4_UNUSED) A1##A3
#else		#else
#define SVE_ACLE_FUNC(A1,A2,A3,A4) A1##A2##A3##A4		#define SVE_ACLE_FUNC(A1,A2,A3,A4) A1##A2##A3##A4
#endif		#endif
▲ Show 20 Lines • Show All 65 Lines • ▼ Show 20 Lines
svfloat16_t test_svdupq_lane_f16(svfloat16_t data, uint64_t index)		svfloat16_t test_svdupq_lane_f16(svfloat16_t data, uint64_t index)
{		{
// CHECK-LABEL: test_svdupq_lane_f16		// CHECK-LABEL: test_svdupq_lane_f16
// CHECK: %[[INTRINSIC:.*]] = call <vscale x 8 x half> @llvm.aarch64.sve.dupq.lane.nxv8f16(<vscale x 8 x half> %data, i64 %index)		// CHECK: %[[INTRINSIC:.*]] = call <vscale x 8 x half> @llvm.aarch64.sve.dupq.lane.nxv8f16(<vscale x 8 x half> %data, i64 %index)
// CHECK: ret <vscale x 8 x half> %[[INTRINSIC]]		// CHECK: ret <vscale x 8 x half> %[[INTRINSIC]]
return SVE_ACLE_FUNC(svdupq_lane,_f16,,)(data, index);		return SVE_ACLE_FUNC(svdupq_lane,_f16,,)(data, index);
}		}

		#ifdef ENABLE_BF16_TESTS
		svbfloat16_t test_svdupq_lane_bf16(svbfloat16_t data, uint64_t index)
		Lint: Pre-merge checks Inline Actions clang-format: please reformat the code -svbfloat16_t test_svdupq_lane_bf16(svbfloat16_t data, uint64_t index) -{ +svbfloat16_t test_svdupq_lane_bf16(svbfloat16_t data, uint64_t index) { Lint: Pre-merge checks: clang-format: please reformat the code ``` -svbfloat16_t test_svdupq_lane_bf16(svbfloat16_t…
		{
		// CHECKBF16-LABEL: test_svdupq_lane_bf16
		// CHECKBF16: %[[INTRINSIC:.*]] = call <vscale x 8 x bfloat> @llvm.aarch64.sve.dupq.lane.nxv8bf16(<vscale x 8 x bfloat> %data, i64 %index)
		// CHECKBF16: ret <vscale x 8 x bfloat> %[[INTRINSIC]]
		return SVE_ACLE_FUNC(svdupq_lane,_bf16,,)(data, index);
		Lint: Pre-merge checks Inline Actions clang-format: please reformat the code - return SVE_ACLE_FUNC(svdupq_lane,_bf16,,)(data, index); + return SVE_ACLE_FUNC(svdupq_lane, _bf16, , )(data, index); Lint: Pre-merge checks: clang-format: please reformat the code ``` - return SVE_ACLE_FUNC(svdupq_lane,_bf16,,)(data…
		}
		#endif

svfloat32_t test_svdupq_lane_f32(svfloat32_t data, uint64_t index)		svfloat32_t test_svdupq_lane_f32(svfloat32_t data, uint64_t index)
{		{
// CHECK-LABEL: test_svdupq_lane_f32		// CHECK-LABEL: test_svdupq_lane_f32
// CHECK: %[[INTRINSIC:.*]] = call <vscale x 4 x float> @llvm.aarch64.sve.dupq.lane.nxv4f32(<vscale x 4 x float> %data, i64 %index)		// CHECK: %[[INTRINSIC:.*]] = call <vscale x 4 x float> @llvm.aarch64.sve.dupq.lane.nxv4f32(<vscale x 4 x float> %data, i64 %index)
// CHECK: ret <vscale x 4 x float> %[[INTRINSIC]]		// CHECK: ret <vscale x 4 x float> %[[INTRINSIC]]
return SVE_ACLE_FUNC(svdupq_lane,_f32,,)(data, index);		return SVE_ACLE_FUNC(svdupq_lane,_f32,,)(data, index);
}		}

▲ Show 20 Lines • Show All 151 Lines • ▼ Show 20 Lines	svfloat16_t test_svdupq_n_f16(float16_t x0, float16_t x1, float16_t x2, float16_t x3,
// CHECK: store half %x7, half* %[[GEP]], align 2		// CHECK: store half %x7, half* %[[GEP]], align 2
// CHECK-NOT: store		// CHECK-NOT: store
// CHECK: call <vscale x 8 x i1> @llvm.aarch64.sve.ptrue.nxv8i1(i32 31)		// CHECK: call <vscale x 8 x i1> @llvm.aarch64.sve.ptrue.nxv8i1(i32 31)
// CHECK: %[[LOAD:.]] = call <vscale x 8 x half> @llvm.aarch64.sve.ld1rq.nxv8f16(<vscale x 8 x i1> %{{.}}, half* nonnull %[[BASE]])		// CHECK: %[[LOAD:.]] = call <vscale x 8 x half> @llvm.aarch64.sve.ld1rq.nxv8f16(<vscale x 8 x i1> %{{.}}, half* nonnull %[[BASE]])
// CHECK: ret <vscale x 8 x half> %[[LOAD]]		// CHECK: ret <vscale x 8 x half> %[[LOAD]]
return SVE_ACLE_FUNC(svdupq,_n,_f16,)(x0, x1, x2, x3, x4, x5, x6, x7);		return SVE_ACLE_FUNC(svdupq,_n,_f16,)(x0, x1, x2, x3, x4, x5, x6, x7);
}		}

		#ifdef ENABLE_BF16_TESTS
		svbfloat16_t test_svdupq_n_bf16(bfloat16_t x0, bfloat16_t x1, bfloat16_t x2, bfloat16_t x3,
		bfloat16_t x4, bfloat16_t x5, bfloat16_t x6, bfloat16_t x7)
		Lint: Pre-merge checks Inline Actions clang-format: please reformat the code - bfloat16_t x4, bfloat16_t x5, bfloat16_t x6, bfloat16_t x7) -{ + bfloat16_t x4, bfloat16_t x5, bfloat16_t x6, bfloat16_t x7) { Lint: Pre-merge checks: clang-format: please reformat the code ``` - bfloat16_t x4…
		{
		// CHECKBF16-LABEL: test_svdupq_n_bf16
		// CHECKBF16: %[[ALLOCA:.*]] = alloca [8 x bfloat], align 16
		// CHECKBF16-DAG: %[[BASE:.]] = getelementptr inbounds [8 x bfloat], [8 x bfloat] %[[ALLOCA]], i64 0, i64 0
		// CHECKBF16-DAG: store bfloat %x0, bfloat* %[[BASE]], align 16
		// <assume other stores>
		// CHECKBF16-DAG: %[[GEP:.]] = getelementptr inbounds [8 x bfloat], [8 x bfloat] %[[ALLOCA]], i64 0, i64 7
		// CHECKBF16: store bfloat %x7, bfloat* %[[GEP]], align 2
		// CHECKBF16-NOT: store
		// CHECKBF16: call <vscale x 8 x i1> @llvm.aarch64.sve.ptrue.nxv8i1(i32 31)
		// CHECKBF16: %[[LOAD:.]] = call <vscale x 8 x bfloat> @llvm.aarch64.sve.ld1rq.nxv8bf16(<vscale x 8 x i1> %{{.}}, bfloat* nonnull %[[BASE]])
		// CHECKBF16: ret <vscale x 8 x bfloat> %[[LOAD]]
		return SVE_ACLE_FUNC(svdupq,_n,_bf16,)(x0, x1, x2, x3, x4, x5, x6, x7);
		Lint: Pre-merge checks Inline Actions clang-format: please reformat the code - return SVE_ACLE_FUNC(svdupq,_n,_bf16,)(x0, x1, x2, x3, x4, x5, x6, x7); + return SVE_ACLE_FUNC(svdupq, _n, _bf16, )(x0, x1, x2, x3, x4, x5, x6, x7); Lint: Pre-merge checks: clang-format: please reformat the code ``` - return SVE_ACLE_FUNC(svdupq,_n,_bf16,)(x0, x1, x2…
		}
		#endif

svfloat32_t test_svdupq_n_f32(float32_t x0, float32_t x1, float32_t x2, float32_t x3)		svfloat32_t test_svdupq_n_f32(float32_t x0, float32_t x1, float32_t x2, float32_t x3)
{		{
// CHECK-LABEL: test_svdupq_n_f32		// CHECK-LABEL: test_svdupq_n_f32
// CHECK: %[[ALLOCA:.*]] = alloca [4 x float], align 16		// CHECK: %[[ALLOCA:.*]] = alloca [4 x float], align 16
// CHECK-DAG: %[[BASE:.]] = getelementptr inbounds [4 x float], [4 x float] %[[ALLOCA]], i64 0, i64 0		// CHECK-DAG: %[[BASE:.]] = getelementptr inbounds [4 x float], [4 x float] %[[ALLOCA]], i64 0, i64 0
// CHECK-DAG: store float %x0, float* %[[BASE]], align 16		// CHECK-DAG: store float %x0, float* %[[BASE]], align 16
// <assume other stores>		// <assume other stores>
// CHECK-DAG: %[[GEP:.]] = getelementptr inbounds [4 x float], [4 x float] %[[ALLOCA]], i64 0, i64 3		// CHECK-DAG: %[[GEP:.]] = getelementptr inbounds [4 x float], [4 x float] %[[ALLOCA]], i64 0, i64 3
▲ Show 20 Lines • Show All 130 Lines • Show Last 20 Lines

clang/test/CodeGen/aarch64-sve-intrinsics/acle_sve_insr.c

	// REQUIRES: aarch64-registered-target			// REQUIRES: aarch64-registered-target
	// RUN: %clang_cc1 -D__ARM_FEATURE_SVE -triple aarch64-none-linux-gnu -target-feature +sve -fallow-half-arguments-and-returns -S -O1 -Werror -Wall -emit-llvm -o - %s \| FileCheck %s			// RUN: %clang_cc1 -D__ARM_FEATURE_SVE -triple aarch64-none-linux-gnu -target-feature +sve -fallow-half-arguments-and-returns -S -O1 -Werror -Wall -emit-llvm -o - %s \| FileCheck %s
	// RUN: %clang_cc1 -D__ARM_FEATURE_SVE -DSVE_OVERLOADED_FORMS -triple aarch64-none-linux-gnu -target-feature +sve -fallow-half-arguments-and-returns -S -O1 -Werror -Wall -emit-llvm -o - %s \| FileCheck %s			// RUN: %clang_cc1 -D__ARM_FEATURE_SVE -DSVE_OVERLOADED_FORMS -triple aarch64-none-linux-gnu -target-feature +sve -fallow-half-arguments-and-returns -S -O1 -Werror -Wall -emit-llvm -o - %s \| FileCheck %s
	// RUN: %clang_cc1 -D__ARM_FEATURE_SVE -triple aarch64-none-linux-gnu -target-feature +sve -fallow-half-arguments-and-returns -S -O1 -Werror -Wall -o - %s >/dev/null 2>%t			// RUN: %clang_cc1 -D__ARM_FEATURE_SVE -triple aarch64-none-linux-gnu -target-feature +sve -fallow-half-arguments-and-returns -S -O1 -Werror -Wall -o - %s >/dev/null 2>%t
	// RUN: FileCheck --check-prefix=ASM --allow-empty %s <%t			// RUN: FileCheck --check-prefix=ASM --allow-empty %s <%t

				// RUN: %clang_cc1 -DENABLE_BFLOAT_TESTS -D__ARM_FEATURE_SVE -D__ARM_FEATURE_SVE_BF16 -D__ARM_FEATURE_BF16_SCALAR_ARITHMETIC -triple aarch64-none-linux-gnu -target-feature +sve -target-feature +bf16 -fallow-half-arguments-and-returns -S -O1 -Werror -Wall -emit-llvm -o - %s \| FileCheck %s --check-prefixes=CHECK,CHECKBF16
				// RUN: %clang_cc1 -DENABLE_BFLOAT_TESTS -D__ARM_FEATURE_SVE -D__ARM_FEATURE_SVE_BF16 -D__ARM_FEATURE_BF16_SCALAR_ARITHMETIC -DSVE_OVERLOADED_FORMS -triple aarch64-none-linux-gnu -target-feature +sve -target-feature +bf16 -fallow-half-arguments-and-returns -S -O1 -Werror -Wall -emit-llvm -o - %s \| FileCheck %s --check-prefixes=CHECK,CHECKBF16

	// If this check fails please read test/CodeGen/aarch64-sve-intrinsics/README for instructions on how to resolve it.			// If this check fails please read test/CodeGen/aarch64-sve-intrinsics/README for instructions on how to resolve it.
	// ASM-NOT: warning			// ASM-NOT: warning
	#include <arm_sve.h>			#include <arm_sve.h>

	#ifdef SVE_OVERLOADED_FORMS			#ifdef SVE_OVERLOADED_FORMS
	// A simple used,unused... macro, long enough to represent any SVE builtin.			// A simple used,unused... macro, long enough to represent any SVE builtin.
	#define SVE_ACLE_FUNC(A1,A2_UNUSED,A3,A4_UNUSED) A1##A3			#define SVE_ACLE_FUNC(A1,A2_UNUSED,A3,A4_UNUSED) A1##A3
	#else			#else
	▲ Show 20 Lines • Show All 67 Lines • ▼ Show 20 Lines
	svfloat16_t test_svinsr_n_f16(svfloat16_t op1, float16_t op2)			svfloat16_t test_svinsr_n_f16(svfloat16_t op1, float16_t op2)
	{			{
	// CHECK-LABEL: test_svinsr_n_f16			// CHECK-LABEL: test_svinsr_n_f16
	// CHECK: %[[INTRINSIC:.*]] = call <vscale x 8 x half> @llvm.aarch64.sve.insr.nxv8f16(<vscale x 8 x half> %op1, half %op2)			// CHECK: %[[INTRINSIC:.*]] = call <vscale x 8 x half> @llvm.aarch64.sve.insr.nxv8f16(<vscale x 8 x half> %op1, half %op2)
	// CHECK: ret <vscale x 8 x half> %[[INTRINSIC]]			// CHECK: ret <vscale x 8 x half> %[[INTRINSIC]]
	return SVE_ACLE_FUNC(svinsr,_n_f16,,)(op1, op2);			return SVE_ACLE_FUNC(svinsr,_n_f16,,)(op1, op2);
	}			}

				#ifdef ENABLE_BF16_TESTS
				svbfloat16_t test_svinsr_n_bf16(svbfloat16_t op1, bfloat16_t op2)
				Lint: Pre-merge checks Inline Actions clang-format: please reformat the code -svbfloat16_t test_svinsr_n_bf16(svbfloat16_t op1, bfloat16_t op2) -{ +svbfloat16_t test_svinsr_n_bf16(svbfloat16_t op1, bfloat16_t op2) { Lint: Pre-merge checks: clang-format: please reformat the code ``` -svbfloat16_t test_svinsr_n_bf16(svbfloat16_t op1…
				{
				// CHECK16-LABEL: test_svinsr_n_bf16
				// CHECK16: %[[INTRINSIC:.*]] = call <vscale x 8 x bfloat> @llvm.aarch64.sve.insr.nxv8bf16(<vscale x 8 x bfloat> %op1, bfloat %op2)
				// CHECK16: ret <vscale x 8 x bfloat> %[[INTRINSIC]]
				return SVE_ACLE_FUNC(svinsr,_n_bf16,,)(op1, op2);
				Lint: Pre-merge checks Inline Actions clang-format: please reformat the code - return SVE_ACLE_FUNC(svinsr,_n_bf16,,)(op1, op2); + return SVE_ACLE_FUNC(svinsr, _n_bf16, , )(op1, op2); Lint: Pre-merge checks: clang-format: please reformat the code ``` - return SVE_ACLE_FUNC(svinsr,_n_bf16,,)(op1, op2)…
				}
				#endif

	svfloat32_t test_svinsr_n_f32(svfloat32_t op1, float32_t op2)			svfloat32_t test_svinsr_n_f32(svfloat32_t op1, float32_t op2)
	{			{
	// CHECK-LABEL: test_svinsr_n_f32			// CHECK-LABEL: test_svinsr_n_f32
	// CHECK: %[[INTRINSIC:.*]] = call <vscale x 4 x float> @llvm.aarch64.sve.insr.nxv4f32(<vscale x 4 x float> %op1, float %op2)			// CHECK: %[[INTRINSIC:.*]] = call <vscale x 4 x float> @llvm.aarch64.sve.insr.nxv4f32(<vscale x 4 x float> %op1, float %op2)
	// CHECK: ret <vscale x 4 x float> %[[INTRINSIC]]			// CHECK: ret <vscale x 4 x float> %[[INTRINSIC]]
	return SVE_ACLE_FUNC(svinsr,_n_f32,,)(op1, op2);			return SVE_ACLE_FUNC(svinsr,_n_f32,,)(op1, op2);
	}			}

	svfloat64_t test_svinsr_n_f64(svfloat64_t op1, float64_t op2)			svfloat64_t test_svinsr_n_f64(svfloat64_t op1, float64_t op2)
	{			{
	// CHECK-LABEL: test_svinsr_n_f64			// CHECK-LABEL: test_svinsr_n_f64
	// CHECK: %[[INTRINSIC:.*]] = call <vscale x 2 x double> @llvm.aarch64.sve.insr.nxv2f64(<vscale x 2 x double> %op1, double %op2)			// CHECK: %[[INTRINSIC:.*]] = call <vscale x 2 x double> @llvm.aarch64.sve.insr.nxv2f64(<vscale x 2 x double> %op1, double %op2)
	// CHECK: ret <vscale x 2 x double> %[[INTRINSIC]]			// CHECK: ret <vscale x 2 x double> %[[INTRINSIC]]
	return SVE_ACLE_FUNC(svinsr,_n_f64,,)(op1, op2);			return SVE_ACLE_FUNC(svinsr,_n_f64,,)(op1, op2);
	}			}

llvm/lib/Target/AArch64/AArch64SVEInstrInfo.td

Show First 20 Lines • Show All 397 Lines • ▼ Show 20 Lines	let Predicates = [HasSVE] in {

// Splat scalar register (predicated)		// Splat scalar register (predicated)
defm CPY_ZPmR : sve_int_perm_cpy_r<"cpy", AArch64dup_pred>;		defm CPY_ZPmR : sve_int_perm_cpy_r<"cpy", AArch64dup_pred>;
defm CPY_ZPmV : sve_int_perm_cpy_v<"cpy", AArch64dup_pred>;		defm CPY_ZPmV : sve_int_perm_cpy_v<"cpy", AArch64dup_pred>;

// Duplicate FP scalar into all vector elements		// Duplicate FP scalar into all vector elements
def : Pat<(nxv8f16 (AArch64dup (f16 FPR16:$src))),		def : Pat<(nxv8f16 (AArch64dup (f16 FPR16:$src))),
(DUP_ZZI_H (INSERT_SUBREG (IMPLICIT_DEF), FPR16:$src, hsub), 0)>;		(DUP_ZZI_H (INSERT_SUBREG (IMPLICIT_DEF), FPR16:$src, hsub), 0)>;
		def : Pat<(nxv8bf16 (AArch64dup (bf16 FPR16:$src))),
		(DUP_ZZI_H (INSERT_SUBREG (IMPLICIT_DEF), FPR16:$src, hsub), 0)>;
def : Pat<(nxv4f16 (AArch64dup (f16 FPR16:$src))),		def : Pat<(nxv4f16 (AArch64dup (f16 FPR16:$src))),
(DUP_ZZI_H (INSERT_SUBREG (IMPLICIT_DEF), FPR16:$src, hsub), 0)>;		(DUP_ZZI_H (INSERT_SUBREG (IMPLICIT_DEF), FPR16:$src, hsub), 0)>;
def : Pat<(nxv2f16 (AArch64dup (f16 FPR16:$src))),		def : Pat<(nxv2f16 (AArch64dup (f16 FPR16:$src))),
(DUP_ZZI_H (INSERT_SUBREG (IMPLICIT_DEF), FPR16:$src, hsub), 0)>;		(DUP_ZZI_H (INSERT_SUBREG (IMPLICIT_DEF), FPR16:$src, hsub), 0)>;
def : Pat<(nxv4f32 (AArch64dup (f32 FPR32:$src))),		def : Pat<(nxv4f32 (AArch64dup (f32 FPR32:$src))),
(DUP_ZZI_S (INSERT_SUBREG (IMPLICIT_DEF), FPR32:$src, ssub), 0)>;		(DUP_ZZI_S (INSERT_SUBREG (IMPLICIT_DEF), FPR32:$src, ssub), 0)>;
def : Pat<(nxv2f32 (AArch64dup (f32 FPR32:$src))),		def : Pat<(nxv2f32 (AArch64dup (f32 FPR32:$src))),
(DUP_ZZI_S (INSERT_SUBREG (IMPLICIT_DEF), FPR32:$src, ssub), 0)>;		(DUP_ZZI_S (INSERT_SUBREG (IMPLICIT_DEF), FPR32:$src, ssub), 0)>;
def : Pat<(nxv2f64 (AArch64dup (f64 FPR64:$src))),		def : Pat<(nxv2f64 (AArch64dup (f64 FPR64:$src))),
(DUP_ZZI_D (INSERT_SUBREG (IMPLICIT_DEF), FPR64:$src, dsub), 0)>;		(DUP_ZZI_D (INSERT_SUBREG (IMPLICIT_DEF), FPR64:$src, dsub), 0)>;

// Duplicate +0.0 into all vector elements		// Duplicate +0.0 into all vector elements
def : Pat<(nxv8f16 (AArch64dup (f16 fpimm0))), (DUP_ZI_H 0, 0)>;		def : Pat<(nxv8f16 (AArch64dup (f16 fpimm0))), (DUP_ZI_H 0, 0)>;
		c-rhodesUnsubmitted Done Reply Inline Actions I think we're missing a test for this pattern in `llvm/test/CodeGen/AArch64/sve-vector-splat.ll`? Same applies to dup 0 patterns below. c-rhodes: I think we're missing a test for this pattern in `llvm/test/CodeGen/AArch64/sve-vector-splat.
		fpetrogalliAuthorUnsubmitted Done Reply Inline Actions I have added these patters to allow adding the regression tests in this patch, so they are somehow guarded by the tests. I tried to add the test cases anyway in sve-vector-splat.ll, but the following one crashes the compiler, so the whole "splatting a bfloat constant" deserve a separate patch. define <vscale x 8 x bfloat> @splat_nxv8bf16_imm() #0 { ; CHECK-LABEL: splat_nxv8bf16_imm: ; CHECK: mov z0.h, #1.0 ; CHECK-NEXT: ret %1 = insertelement <vscale x 8 x bfloat> undef, bfloat 1.0, i32 0 %2 = shufflevector <vscale x 8 x bfloat> %1, <vscale x 8 x bfloat> undef, <vscale x 8 x i32> zeroinitializer ret <vscale x 8 x bfloat> %2 } I will create a new revision and make it a parent of this one. fpetrogalli: I have added these patters to allow adding the regression tests in this patch, so they are…
		fpetrogalliAuthorUnsubmitted Done Reply Inline Actions (facepalm) There is no "dup" instruction for bfloat immediates... that's why this is not working. I guess a separate patch is not needed, this one is enough... fpetrogalli: (facepalm) There is no "dup" instruction for bfloat immediates... that's why this is not…
		def : Pat<(nxv8bf16 (AArch64dup (bf16 fpimm0))), (DUP_ZI_H 0, 0)>;
def : Pat<(nxv4f16 (AArch64dup (f16 fpimm0))), (DUP_ZI_H 0, 0)>;		def : Pat<(nxv4f16 (AArch64dup (f16 fpimm0))), (DUP_ZI_H 0, 0)>;
def : Pat<(nxv2f16 (AArch64dup (f16 fpimm0))), (DUP_ZI_H 0, 0)>;		def : Pat<(nxv2f16 (AArch64dup (f16 fpimm0))), (DUP_ZI_H 0, 0)>;
def : Pat<(nxv4f32 (AArch64dup (f32 fpimm0))), (DUP_ZI_S 0, 0)>;		def : Pat<(nxv4f32 (AArch64dup (f32 fpimm0))), (DUP_ZI_S 0, 0)>;
def : Pat<(nxv2f32 (AArch64dup (f32 fpimm0))), (DUP_ZI_S 0, 0)>;		def : Pat<(nxv2f32 (AArch64dup (f32 fpimm0))), (DUP_ZI_S 0, 0)>;
def : Pat<(nxv2f64 (AArch64dup (f64 fpimm0))), (DUP_ZI_D 0, 0)>;		def : Pat<(nxv2f64 (AArch64dup (f64 fpimm0))), (DUP_ZI_D 0, 0)>;

		c-rhodesUnsubmitted Done Reply Inline Actions formatting changes can be reverted c-rhodes: formatting changes can be reverted
// Duplicate Int immediate into all vector elements		// Duplicate Int immediate into all vector elements
def : Pat<(nxv16i8 (AArch64dup (i32 (SVE8BitLslImm i32:$a, i32:$b)))),		def : Pat<(nxv16i8 (AArch64dup (i32 (SVE8BitLslImm i32:$a, i32:$b)))),
(DUP_ZI_B $a, $b)>;		(DUP_ZI_B $a, $b)>;
def : Pat<(nxv8i16 (AArch64dup (i32 (SVE8BitLslImm i32:$a, i32:$b)))),		def : Pat<(nxv8i16 (AArch64dup (i32 (SVE8BitLslImm i32:$a, i32:$b)))),
(DUP_ZI_H $a, $b)>;		(DUP_ZI_H $a, $b)>;
def : Pat<(nxv4i32 (AArch64dup (i32 (SVE8BitLslImm i32:$a, i32:$b)))),		def : Pat<(nxv4i32 (AArch64dup (i32 (SVE8BitLslImm i32:$a, i32:$b)))),
(DUP_ZI_S $a, $b)>;		(DUP_ZI_S $a, $b)>;
def : Pat<(nxv2i64 (AArch64dup (i64 (SVE8BitLslImm i32:$a, i32:$b)))),		def : Pat<(nxv2i64 (AArch64dup (i64 (SVE8BitLslImm i32:$a, i32:$b)))),
▲ Show 20 Lines • Show All 992 Lines • ▼ Show 20 Lines	let Predicates = [IsLE] in {
def : Pat<(nxv4i32 (bitconvert (nxv8f16 ZPR:$src))), (nxv4i32 ZPR:$src)>;		def : Pat<(nxv4i32 (bitconvert (nxv8f16 ZPR:$src))), (nxv4i32 ZPR:$src)>;
def : Pat<(nxv4i32 (bitconvert (nxv4f32 ZPR:$src))), (nxv4i32 ZPR:$src)>;		def : Pat<(nxv4i32 (bitconvert (nxv4f32 ZPR:$src))), (nxv4i32 ZPR:$src)>;
def : Pat<(nxv4i32 (bitconvert (nxv2f64 ZPR:$src))), (nxv4i32 ZPR:$src)>;		def : Pat<(nxv4i32 (bitconvert (nxv2f64 ZPR:$src))), (nxv4i32 ZPR:$src)>;

def : Pat<(nxv2i64 (bitconvert (nxv16i8 ZPR:$src))), (nxv2i64 ZPR:$src)>;		def : Pat<(nxv2i64 (bitconvert (nxv16i8 ZPR:$src))), (nxv2i64 ZPR:$src)>;
def : Pat<(nxv2i64 (bitconvert (nxv8i16 ZPR:$src))), (nxv2i64 ZPR:$src)>;		def : Pat<(nxv2i64 (bitconvert (nxv8i16 ZPR:$src))), (nxv2i64 ZPR:$src)>;
def : Pat<(nxv2i64 (bitconvert (nxv4i32 ZPR:$src))), (nxv2i64 ZPR:$src)>;		def : Pat<(nxv2i64 (bitconvert (nxv4i32 ZPR:$src))), (nxv2i64 ZPR:$src)>;
def : Pat<(nxv2i64 (bitconvert (nxv8f16 ZPR:$src))), (nxv2i64 ZPR:$src)>;		def : Pat<(nxv2i64 (bitconvert (nxv8f16 ZPR:$src))), (nxv2i64 ZPR:$src)>;
		def : Pat<(nxv2i64 (bitconvert (nxv8bf16 ZPR:$src))), (nxv2i64 ZPR:$src)>;
def : Pat<(nxv2i64 (bitconvert (nxv4f32 ZPR:$src))), (nxv2i64 ZPR:$src)>;		def : Pat<(nxv2i64 (bitconvert (nxv4f32 ZPR:$src))), (nxv2i64 ZPR:$src)>;
def : Pat<(nxv2i64 (bitconvert (nxv2f64 ZPR:$src))), (nxv2i64 ZPR:$src)>;		def : Pat<(nxv2i64 (bitconvert (nxv2f64 ZPR:$src))), (nxv2i64 ZPR:$src)>;

def : Pat<(nxv8f16 (bitconvert (nxv16i8 ZPR:$src))), (nxv8f16 ZPR:$src)>;		def : Pat<(nxv8f16 (bitconvert (nxv16i8 ZPR:$src))), (nxv8f16 ZPR:$src)>;
def : Pat<(nxv8f16 (bitconvert (nxv8i16 ZPR:$src))), (nxv8f16 ZPR:$src)>;		def : Pat<(nxv8f16 (bitconvert (nxv8i16 ZPR:$src))), (nxv8f16 ZPR:$src)>;
def : Pat<(nxv8bf16 (bitconvert (nxv8i16 ZPR:$src))), (nxv8bf16 ZPR:$src)>;
def : Pat<(nxv8f16 (bitconvert (nxv4i32 ZPR:$src))), (nxv8f16 ZPR:$src)>;		def : Pat<(nxv8f16 (bitconvert (nxv4i32 ZPR:$src))), (nxv8f16 ZPR:$src)>;
def : Pat<(nxv8f16 (bitconvert (nxv2i64 ZPR:$src))), (nxv8f16 ZPR:$src)>;		def : Pat<(nxv8f16 (bitconvert (nxv2i64 ZPR:$src))), (nxv8f16 ZPR:$src)>;
def : Pat<(nxv8f16 (bitconvert (nxv4f32 ZPR:$src))), (nxv8f16 ZPR:$src)>;		def : Pat<(nxv8f16 (bitconvert (nxv4f32 ZPR:$src))), (nxv8f16 ZPR:$src)>;
def : Pat<(nxv8f16 (bitconvert (nxv2f64 ZPR:$src))), (nxv8f16 ZPR:$src)>;		def : Pat<(nxv8f16 (bitconvert (nxv2f64 ZPR:$src))), (nxv8f16 ZPR:$src)>;

def : Pat<(nxv4f32 (bitconvert (nxv16i8 ZPR:$src))), (nxv4f32 ZPR:$src)>;		def : Pat<(nxv4f32 (bitconvert (nxv16i8 ZPR:$src))), (nxv4f32 ZPR:$src)>;
def : Pat<(nxv4f32 (bitconvert (nxv8i16 ZPR:$src))), (nxv4f32 ZPR:$src)>;		def : Pat<(nxv4f32 (bitconvert (nxv8i16 ZPR:$src))), (nxv4f32 ZPR:$src)>;
def : Pat<(nxv4f32 (bitconvert (nxv4i32 ZPR:$src))), (nxv4f32 ZPR:$src)>;		def : Pat<(nxv4f32 (bitconvert (nxv4i32 ZPR:$src))), (nxv4f32 ZPR:$src)>;
def : Pat<(nxv4f32 (bitconvert (nxv2i64 ZPR:$src))), (nxv4f32 ZPR:$src)>;		def : Pat<(nxv4f32 (bitconvert (nxv2i64 ZPR:$src))), (nxv4f32 ZPR:$src)>;
def : Pat<(nxv4f32 (bitconvert (nxv8f16 ZPR:$src))), (nxv4f32 ZPR:$src)>;		def : Pat<(nxv4f32 (bitconvert (nxv8f16 ZPR:$src))), (nxv4f32 ZPR:$src)>;
def : Pat<(nxv4f32 (bitconvert (nxv2f64 ZPR:$src))), (nxv4f32 ZPR:$src)>;		def : Pat<(nxv4f32 (bitconvert (nxv2f64 ZPR:$src))), (nxv4f32 ZPR:$src)>;

def : Pat<(nxv2f64 (bitconvert (nxv16i8 ZPR:$src))), (nxv2f64 ZPR:$src)>;		def : Pat<(nxv2f64 (bitconvert (nxv16i8 ZPR:$src))), (nxv2f64 ZPR:$src)>;
def : Pat<(nxv2f64 (bitconvert (nxv8i16 ZPR:$src))), (nxv2f64 ZPR:$src)>;		def : Pat<(nxv2f64 (bitconvert (nxv8i16 ZPR:$src))), (nxv2f64 ZPR:$src)>;
def : Pat<(nxv2f64 (bitconvert (nxv4i32 ZPR:$src))), (nxv2f64 ZPR:$src)>;		def : Pat<(nxv2f64 (bitconvert (nxv4i32 ZPR:$src))), (nxv2f64 ZPR:$src)>;
def : Pat<(nxv2f64 (bitconvert (nxv2i64 ZPR:$src))), (nxv2f64 ZPR:$src)>;		def : Pat<(nxv2f64 (bitconvert (nxv2i64 ZPR:$src))), (nxv2f64 ZPR:$src)>;
def : Pat<(nxv2f64 (bitconvert (nxv8f16 ZPR:$src))), (nxv2f64 ZPR:$src)>;		def : Pat<(nxv2f64 (bitconvert (nxv8f16 ZPR:$src))), (nxv2f64 ZPR:$src)>;
def : Pat<(nxv2f64 (bitconvert (nxv4f32 ZPR:$src))), (nxv2f64 ZPR:$src)>;		def : Pat<(nxv2f64 (bitconvert (nxv4f32 ZPR:$src))), (nxv2f64 ZPR:$src)>;

		def : Pat<(nxv8bf16 (bitconvert (nxv2i64 ZPR:$src))), (nxv8bf16 ZPR:$src)>;
		def : Pat<(nxv8bf16 (bitconvert (nxv8i16 ZPR:$src))), (nxv8bf16 ZPR:$src)>;
}		}

def : Pat<(nxv16i1 (reinterpret_cast (nxv16i1 PPR:$src))), (COPY_TO_REGCLASS PPR:$src, PPR)>;		def : Pat<(nxv16i1 (reinterpret_cast (nxv16i1 PPR:$src))), (COPY_TO_REGCLASS PPR:$src, PPR)>;
def : Pat<(nxv16i1 (reinterpret_cast (nxv8i1 PPR:$src))), (COPY_TO_REGCLASS PPR:$src, PPR)>;		def : Pat<(nxv16i1 (reinterpret_cast (nxv8i1 PPR:$src))), (COPY_TO_REGCLASS PPR:$src, PPR)>;
		c-rhodesUnsubmitted Done Reply Inline Actions missing tests in `llvm/test/CodeGen/AArch64/sve-bitcast.ll` c-rhodes: missing tests in `llvm/test/CodeGen/AArch64/sve-bitcast.ll`
		fpetrogalliAuthorUnsubmitted Done Reply Inline Actions The bitconvert patterns went in via D82501. This code is not present anymore in this patch. fpetrogalli: The bitconvert patterns went in via D82501. This code is not present anymore in this patch.
def : Pat<(nxv16i1 (reinterpret_cast (nxv4i1 PPR:$src))), (COPY_TO_REGCLASS PPR:$src, PPR)>;		def : Pat<(nxv16i1 (reinterpret_cast (nxv4i1 PPR:$src))), (COPY_TO_REGCLASS PPR:$src, PPR)>;
def : Pat<(nxv16i1 (reinterpret_cast (nxv2i1 PPR:$src))), (COPY_TO_REGCLASS PPR:$src, PPR)>;		def : Pat<(nxv16i1 (reinterpret_cast (nxv2i1 PPR:$src))), (COPY_TO_REGCLASS PPR:$src, PPR)>;
def : Pat<(nxv8i1 (reinterpret_cast (nxv16i1 PPR:$src))), (COPY_TO_REGCLASS PPR:$src, PPR)>;		def : Pat<(nxv8i1 (reinterpret_cast (nxv16i1 PPR:$src))), (COPY_TO_REGCLASS PPR:$src, PPR)>;
def : Pat<(nxv8i1 (reinterpret_cast (nxv4i1 PPR:$src))), (COPY_TO_REGCLASS PPR:$src, PPR)>;		def : Pat<(nxv8i1 (reinterpret_cast (nxv4i1 PPR:$src))), (COPY_TO_REGCLASS PPR:$src, PPR)>;
def : Pat<(nxv8i1 (reinterpret_cast (nxv2i1 PPR:$src))), (COPY_TO_REGCLASS PPR:$src, PPR)>;		def : Pat<(nxv8i1 (reinterpret_cast (nxv2i1 PPR:$src))), (COPY_TO_REGCLASS PPR:$src, PPR)>;
def : Pat<(nxv4i1 (reinterpret_cast (nxv16i1 PPR:$src))), (COPY_TO_REGCLASS PPR:$src, PPR)>;		def : Pat<(nxv4i1 (reinterpret_cast (nxv16i1 PPR:$src))), (COPY_TO_REGCLASS PPR:$src, PPR)>;
def : Pat<(nxv4i1 (reinterpret_cast (nxv8i1 PPR:$src))), (COPY_TO_REGCLASS PPR:$src, PPR)>;		def : Pat<(nxv4i1 (reinterpret_cast (nxv8i1 PPR:$src))), (COPY_TO_REGCLASS PPR:$src, PPR)>;
def : Pat<(nxv4i1 (reinterpret_cast (nxv2i1 PPR:$src))), (COPY_TO_REGCLASS PPR:$src, PPR)>;		def : Pat<(nxv4i1 (reinterpret_cast (nxv2i1 PPR:$src))), (COPY_TO_REGCLASS PPR:$src, PPR)>;
▲ Show 20 Lines • Show All 927 Lines • Show Last 20 Lines

llvm/lib/Target/AArch64/SVEInstrFormats.td

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 1,231 Lines • ▼ Show 20 Lines

multiclass sve_int_perm_insrv<string asm, SDPatternOperator op> {		multiclass sve_int_perm_insrv<string asm, SDPatternOperator op> {
def _B : sve_int_perm_insrv<0b00, asm, ZPR8, FPR8>;		def _B : sve_int_perm_insrv<0b00, asm, ZPR8, FPR8>;
def _H : sve_int_perm_insrv<0b01, asm, ZPR16, FPR16>;		def _H : sve_int_perm_insrv<0b01, asm, ZPR16, FPR16>;
def _S : sve_int_perm_insrv<0b10, asm, ZPR32, FPR32>;		def _S : sve_int_perm_insrv<0b10, asm, ZPR32, FPR32>;
def _D : sve_int_perm_insrv<0b11, asm, ZPR64, FPR64>;		def _D : sve_int_perm_insrv<0b11, asm, ZPR64, FPR64>;

def : SVE_2_Op_Pat<nxv8f16, op, nxv8f16, f16, !cast<Instruction>(NAME # _H)>;		def : SVE_2_Op_Pat<nxv8f16, op, nxv8f16, f16, !cast<Instruction>(NAME # _H)>;
		def : SVE_2_Op_Pat<nxv8bf16, op, nxv8bf16, bf16, !cast<Instruction>(NAME # _H)>;
def : SVE_2_Op_Pat<nxv4f32, op, nxv4f32, f32, !cast<Instruction>(NAME # _S)>;		def : SVE_2_Op_Pat<nxv4f32, op, nxv4f32, f32, !cast<Instruction>(NAME # _S)>;
def : SVE_2_Op_Pat<nxv2f64, op, nxv2f64, f64, !cast<Instruction>(NAME # _D)>;		def : SVE_2_Op_Pat<nxv2f64, op, nxv2f64, f64, !cast<Instruction>(NAME # _D)>;
}		}

//===----------------------------------------------------------------------===//		//===----------------------------------------------------------------------===//
// SVE Permute - Extract Group		// SVE Permute - Extract Group
//===----------------------------------------------------------------------===//		//===----------------------------------------------------------------------===//

▲ Show 20 Lines • Show All 4,416 Lines • ▼ Show 20 Lines
}		}

multiclass sve_int_perm_clast_vz<bit ab, string asm, SDPatternOperator op> {		multiclass sve_int_perm_clast_vz<bit ab, string asm, SDPatternOperator op> {
def _B : sve_int_perm_clast_vz<0b00, ab, asm, ZPR8, FPR8>;		def _B : sve_int_perm_clast_vz<0b00, ab, asm, ZPR8, FPR8>;
def _H : sve_int_perm_clast_vz<0b01, ab, asm, ZPR16, FPR16>;		def _H : sve_int_perm_clast_vz<0b01, ab, asm, ZPR16, FPR16>;
def _S : sve_int_perm_clast_vz<0b10, ab, asm, ZPR32, FPR32>;		def _S : sve_int_perm_clast_vz<0b10, ab, asm, ZPR32, FPR32>;
def _D : sve_int_perm_clast_vz<0b11, ab, asm, ZPR64, FPR64>;		def _D : sve_int_perm_clast_vz<0b11, ab, asm, ZPR64, FPR64>;

def : SVE_3_Op_Pat<f16, op, nxv8i1, f16, nxv8f16, !cast<Instruction>(NAME # _H)>;		def : SVE_3_Op_Pat<f16, op, nxv8i1, f16, nxv8f16, !cast<Instruction>(NAME # _H)>;
		def : SVE_3_Op_Pat<bf16, op, nxv8i1, bf16, nxv8bf16, !cast<Instruction>(NAME # _H)>;
def : SVE_3_Op_Pat<f32, op, nxv4i1, f32, nxv4f32, !cast<Instruction>(NAME # _S)>;		def : SVE_3_Op_Pat<f32, op, nxv4i1, f32, nxv4f32, !cast<Instruction>(NAME # _S)>;
def : SVE_3_Op_Pat<f64, op, nxv2i1, f64, nxv2f64, !cast<Instruction>(NAME # _D)>;		def : SVE_3_Op_Pat<f64, op, nxv2i1, f64, nxv2f64, !cast<Instruction>(NAME # _D)>;
}		}

class sve_int_perm_clast_zz<bits<2> sz8_64, bit ab, string asm,		class sve_int_perm_clast_zz<bits<2> sz8_64, bit ab, string asm,
ZPRRegOp zprty>		ZPRRegOp zprty>
: I<(outs zprty:$Zdn), (ins PPR3bAny:$Pg, zprty:$_Zdn, zprty:$Zm),		: I<(outs zprty:$Zdn), (ins PPR3bAny:$Pg, zprty:$_Zdn, zprty:$Zm),
asm, "\t$Zdn, $Pg, $_Zdn, $Zm",		asm, "\t$Zdn, $Pg, $_Zdn, $Zm",
"",		"",
[]>, Sched<[]> {		[]>, Sched<[]> {
Show All 20 Lines	multiclass sve_int_perm_clast_zz<bit ab, string asm, SDPatternOperator op> {
def _S : sve_int_perm_clast_zz<0b10, ab, asm, ZPR32>;		def _S : sve_int_perm_clast_zz<0b10, ab, asm, ZPR32>;
def _D : sve_int_perm_clast_zz<0b11, ab, asm, ZPR64>;		def _D : sve_int_perm_clast_zz<0b11, ab, asm, ZPR64>;

def : SVE_3_Op_Pat<nxv16i8, op, nxv16i1, nxv16i8, nxv16i8, !cast<Instruction>(NAME # _B)>;		def : SVE_3_Op_Pat<nxv16i8, op, nxv16i1, nxv16i8, nxv16i8, !cast<Instruction>(NAME # _B)>;
def : SVE_3_Op_Pat<nxv8i16, op, nxv8i1, nxv8i16, nxv8i16, !cast<Instruction>(NAME # _H)>;		def : SVE_3_Op_Pat<nxv8i16, op, nxv8i1, nxv8i16, nxv8i16, !cast<Instruction>(NAME # _H)>;
def : SVE_3_Op_Pat<nxv4i32, op, nxv4i1, nxv4i32, nxv4i32, !cast<Instruction>(NAME # _S)>;		def : SVE_3_Op_Pat<nxv4i32, op, nxv4i1, nxv4i32, nxv4i32, !cast<Instruction>(NAME # _S)>;
def : SVE_3_Op_Pat<nxv2i64, op, nxv2i1, nxv2i64, nxv2i64, !cast<Instruction>(NAME # _D)>;		def : SVE_3_Op_Pat<nxv2i64, op, nxv2i1, nxv2i64, nxv2i64, !cast<Instruction>(NAME # _D)>;

def : SVE_3_Op_Pat<nxv8f16, op, nxv8i1, nxv8f16, nxv8f16, !cast<Instruction>(NAME # _H)>;		def : SVE_3_Op_Pat<nxv8f16, op, nxv8i1, nxv8f16, nxv8f16, !cast<Instruction>(NAME # _H)>;
		def : SVE_3_Op_Pat<nxv8bf16, op, nxv8i1, nxv8bf16, nxv8bf16, !cast<Instruction>(NAME # _H)>;
def : SVE_3_Op_Pat<nxv4f32, op, nxv4i1, nxv4f32, nxv4f32, !cast<Instruction>(NAME # _S)>;		def : SVE_3_Op_Pat<nxv4f32, op, nxv4i1, nxv4f32, nxv4f32, !cast<Instruction>(NAME # _S)>;
def : SVE_3_Op_Pat<nxv2f64, op, nxv2i1, nxv2f64, nxv2f64, !cast<Instruction>(NAME # _D)>;		def : SVE_3_Op_Pat<nxv2f64, op, nxv2i1, nxv2f64, nxv2f64, !cast<Instruction>(NAME # _D)>;
}		}

class sve_int_perm_last_r<bits<2> sz8_64, bit ab, string asm,		class sve_int_perm_last_r<bits<2> sz8_64, bit ab, string asm,
ZPRRegOp zprty, RegisterClass resultRegType>		ZPRRegOp zprty, RegisterClass resultRegType>
: I<(outs resultRegType:$Rd), (ins PPR3bAny:$Pg, zprty:$Zn),		: I<(outs resultRegType:$Rd), (ins PPR3bAny:$Pg, zprty:$Zn),
asm, "\t$Rd, $Pg, $Zn",		asm, "\t$Rd, $Pg, $Zn",
"",		"",
[]>, Sched<[]> {		[]>, Sched<[]> {
▲ Show 20 Lines • Show All 42 Lines • ▼ Show 20 Lines
}		}

multiclass sve_int_perm_last_v<bit ab, string asm, SDPatternOperator op> {		multiclass sve_int_perm_last_v<bit ab, string asm, SDPatternOperator op> {
def _B : sve_int_perm_last_v<0b00, ab, asm, ZPR8, FPR8>;		def _B : sve_int_perm_last_v<0b00, ab, asm, ZPR8, FPR8>;
def _H : sve_int_perm_last_v<0b01, ab, asm, ZPR16, FPR16>;		def _H : sve_int_perm_last_v<0b01, ab, asm, ZPR16, FPR16>;
def _S : sve_int_perm_last_v<0b10, ab, asm, ZPR32, FPR32>;		def _S : sve_int_perm_last_v<0b10, ab, asm, ZPR32, FPR32>;
def _D : sve_int_perm_last_v<0b11, ab, asm, ZPR64, FPR64>;		def _D : sve_int_perm_last_v<0b11, ab, asm, ZPR64, FPR64>;

def : SVE_2_Op_Pat<f16, op, nxv8i1, nxv8f16, !cast<Instruction>(NAME # _H)>;		def : SVE_2_Op_Pat<f16, op, nxv8i1, nxv8f16, !cast<Instruction>(NAME # _H)>;
		def : SVE_2_Op_Pat<bf16, op, nxv8i1, nxv8bf16, !cast<Instruction>(NAME # _H)>;
def : SVE_2_Op_Pat<f32, op, nxv4i1, nxv4f32, !cast<Instruction>(NAME # _S)>;		def : SVE_2_Op_Pat<f32, op, nxv4i1, nxv4f32, !cast<Instruction>(NAME # _S)>;
def : SVE_2_Op_Pat<f32, op, nxv2i1, nxv2f32, !cast<Instruction>(NAME # _S)>;		def : SVE_2_Op_Pat<f32, op, nxv2i1, nxv2f32, !cast<Instruction>(NAME # _S)>;
def : SVE_2_Op_Pat<f64, op, nxv2i1, nxv2f64, !cast<Instruction>(NAME # _D)>;		def : SVE_2_Op_Pat<f64, op, nxv2i1, nxv2f64, !cast<Instruction>(NAME # _D)>;
}		}

class sve_int_perm_splice<bits<2> sz8_64, string asm, ZPRRegOp zprty>		class sve_int_perm_splice<bits<2> sz8_64, string asm, ZPRRegOp zprty>
: I<(outs zprty:$Zdn), (ins PPR3bAny:$Pg, zprty:$_Zdn, zprty:$Zm),		: I<(outs zprty:$Zdn), (ins PPR3bAny:$Pg, zprty:$_Zdn, zprty:$Zm),
asm, "\t$Zdn, $Pg, $_Zdn, $Zm",		asm, "\t$Zdn, $Pg, $_Zdn, $Zm",
"",		"",
[]>, Sched<[]> {		[]>, Sched<[]> {
bits<3> Pg;		bits<3> Pg;
▲ Show 20 Lines • Show All 190 Lines • ▼ Show 20 Lines	multiclass sve_int_perm_cpy_v<string asm, SDPatternOperator op> {
def : InstAlias<"mov $Zd, $Pg/m, $Vn",		def : InstAlias<"mov $Zd, $Pg/m, $Vn",
(!cast<Instruction>(NAME # _H) ZPR16:$Zd, PPR3bAny:$Pg, FPR16:$Vn), 1>;		(!cast<Instruction>(NAME # _H) ZPR16:$Zd, PPR3bAny:$Pg, FPR16:$Vn), 1>;
def : InstAlias<"mov $Zd, $Pg/m, $Vn",		def : InstAlias<"mov $Zd, $Pg/m, $Vn",
(!cast<Instruction>(NAME # _S) ZPR32:$Zd, PPR3bAny:$Pg, FPR32:$Vn), 1>;		(!cast<Instruction>(NAME # _S) ZPR32:$Zd, PPR3bAny:$Pg, FPR32:$Vn), 1>;
def : InstAlias<"mov $Zd, $Pg/m, $Vn",		def : InstAlias<"mov $Zd, $Pg/m, $Vn",
(!cast<Instruction>(NAME # _D) ZPR64:$Zd, PPR3bAny:$Pg, FPR64:$Vn), 1>;		(!cast<Instruction>(NAME # _D) ZPR64:$Zd, PPR3bAny:$Pg, FPR64:$Vn), 1>;

def : SVE_3_Op_Pat<nxv8f16, op, nxv8f16, nxv8i1, f16, !cast<Instruction>(NAME # _H)>;		def : SVE_3_Op_Pat<nxv8f16, op, nxv8f16, nxv8i1, f16, !cast<Instruction>(NAME # _H)>;
		def : SVE_3_Op_Pat<nxv8bf16, op, nxv8bf16, nxv8i1, bf16, !cast<Instruction>(NAME # _H)>;
def : SVE_3_Op_Pat<nxv4f32, op, nxv4f32, nxv4i1, f32, !cast<Instruction>(NAME # _S)>;		def : SVE_3_Op_Pat<nxv4f32, op, nxv4f32, nxv4i1, f32, !cast<Instruction>(NAME # _S)>;
def : SVE_3_Op_Pat<nxv2f32, op, nxv2f32, nxv2i1, f32, !cast<Instruction>(NAME # _S)>;		def : SVE_3_Op_Pat<nxv2f32, op, nxv2f32, nxv2i1, f32, !cast<Instruction>(NAME # _S)>;
def : SVE_3_Op_Pat<nxv2f64, op, nxv2f64, nxv2i1, f64, !cast<Instruction>(NAME # _D)>;		def : SVE_3_Op_Pat<nxv2f64, op, nxv2f64, nxv2i1, f64, !cast<Instruction>(NAME # _D)>;
}		}

class sve_int_perm_compact<bit sz, string asm, ZPRRegOp zprty>		class sve_int_perm_compact<bit sz, string asm, ZPRRegOp zprty>
: I<(outs zprty:$Zd), (ins PPR3bAny:$Pg, zprty:$Zn),		: I<(outs zprty:$Zd), (ins PPR3bAny:$Pg, zprty:$Zn),
asm, "\t$Zd, $Pg, $Zn",		asm, "\t$Zd, $Pg, $Zn",
▲ Show 20 Lines • Show All 1,795 Lines • Show Last 20 Lines

llvm/test/CodeGen/AArch64/sve-intrinsics-dup-bfloat.ll

This file was added.

				; RUN: llc -mtriple=aarch64-linux-gnu -mattr=+sve,+bf16 < %s 2>%t \| FileCheck %s

				define <vscale x 8 x bfloat> @test_svdup_n_bf16_z(<vscale x 16 x i1> %pg, bfloat %op) local_unnamed_addr #0 {
				; CHECK-LABEL: test_svdup_n_bf16_z:
				entry:
				%0 = call <vscale x 8 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv8i1(<vscale x 16 x i1> %pg)
				%1 = call <vscale x 8 x bfloat> @llvm.aarch64.sve.dup.nxv8bf16(<vscale x 8 x bfloat> zeroinitializer, <vscale x 8 x i1> %0, bfloat %op)
				ret <vscale x 8 x bfloat> %1
				}

				; Function Attrs: nounwind readnone
				declare <vscale x 8 x bfloat> @llvm.aarch64.sve.dup.nxv8bf16(<vscale x 8 x bfloat>, <vscale x 8 x i1>, bfloat) #1


				define <vscale x 8 x bfloat> @test_svdup_n_bf16_m(<vscale x 8 x bfloat> %inactive, <vscale x 16 x i1> %pg, bfloat %op) local_unnamed_addr #0 {
				; CHECK-LABEL: test_svdup_n_bf16_m:
				entry:
				%0 = call <vscale x 8 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv8i1(<vscale x 16 x i1> %pg)
				%1 = call <vscale x 8 x bfloat> @llvm.aarch64.sve.dup.nxv8bf16(<vscale x 8 x bfloat> %inactive, <vscale x 8 x i1> %0, bfloat %op)
				ret <vscale x 8 x bfloat> %1
				}


				define <vscale x 8 x bfloat> @test_svdup_n_bf16_x(<vscale x 16 x i1> %pg, bfloat %op) local_unnamed_addr #0 {
				; CHECK-LABEL: test_svdup_n_bf16_x:
				entry:
				%0 = call <vscale x 8 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv8i1(<vscale x 16 x i1> %pg)
				%1 = call <vscale x 8 x bfloat> @llvm.aarch64.sve.dup.nxv8bf16(<vscale x 8 x bfloat> undef, <vscale x 8 x i1> %0, bfloat %op)
				ret <vscale x 8 x bfloat> %1
				}

				declare <vscale x 8 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv8i1(<vscale x 16 x i1>)

llvm/test/CodeGen/AArch64/sve-intrinsics-dup-x.ll

; RUN: llc -mtriple=aarch64-linux-gnu -verify-machineinstrs -mattr=+sve -asm-verbose=0 < %s 2>%t \| FileCheck %s		; RUN: llc -mtriple=aarch64-linux-gnu -verify-machineinstrs -mattr=+sve -mattr=+bf16 -asm-verbose=0 < %s 2>%t \| FileCheck %s
; RUN: FileCheck --check-prefix=WARN --allow-empty %s <%t		; RUN: FileCheck --check-prefix=WARN --allow-empty %s <%t

; WARN-NOT: warning		; WARN-NOT: warning

;		;
; Unpredicated dup instruction (which is an alias for mov):		; Unpredicated dup instruction (which is an alias for mov):
; * register + register,		; * register + register,
; * register + immediate		; * register + immediate
▲ Show 20 Lines • Show All 66 Lines • ▼ Show 20 Lines
define <vscale x 8 x half> @dup_f16(half %b) {		define <vscale x 8 x half> @dup_f16(half %b) {
; CHECK-LABEL: dup_f16:		; CHECK-LABEL: dup_f16:
; CHECK: mov z0.h, h0		; CHECK: mov z0.h, h0
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%out = call <vscale x 8 x half> @llvm.aarch64.sve.dup.x.nxv8f16(half %b)		%out = call <vscale x 8 x half> @llvm.aarch64.sve.dup.x.nxv8f16(half %b)
ret <vscale x 8 x half> %out		ret <vscale x 8 x half> %out
}		}

		define <vscale x 8 x bfloat> @dup_bf16(bfloat %b) {
		; CHECK-LABEL: dup_bf16:
		; CHECK: mov z0.h, h0
		; CHECK-NEXT: ret
		%out = call <vscale x 8 x bfloat> @llvm.aarch64.sve.dup.x.nxv8bf16(bfloat %b)
		ret <vscale x 8 x bfloat> %out
		}

define <vscale x 8 x half> @dup_imm_f16(half %b) {		define <vscale x 8 x half> @dup_imm_f16(half %b) {
; CHECK-LABEL: dup_imm_f16:		; CHECK-LABEL: dup_imm_f16:
; CHECK: mov z0.h, #16.00000000		; CHECK: mov z0.h, #16.00000000
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%out = call <vscale x 8 x half> @llvm.aarch64.sve.dup.x.nxv8f16(half 16.)		%out = call <vscale x 8 x half> @llvm.aarch64.sve.dup.x.nxv8f16(half 16.)
ret <vscale x 8 x half> %out		ret <vscale x 8 x half> %out
}		}

Show All 29 Lines	; CHECK-NEXT: ret
ret <vscale x 2 x double> %out		ret <vscale x 2 x double> %out
}		}

declare <vscale x 16 x i8> @llvm.aarch64.sve.dup.x.nxv16i8( i8)		declare <vscale x 16 x i8> @llvm.aarch64.sve.dup.x.nxv16i8( i8)
declare <vscale x 8 x i16> @llvm.aarch64.sve.dup.x.nxv8i16(i16)		declare <vscale x 8 x i16> @llvm.aarch64.sve.dup.x.nxv8i16(i16)
declare <vscale x 4 x i32> @llvm.aarch64.sve.dup.x.nxv4i32(i32)		declare <vscale x 4 x i32> @llvm.aarch64.sve.dup.x.nxv4i32(i32)
declare <vscale x 2 x i64> @llvm.aarch64.sve.dup.x.nxv2i64(i64)		declare <vscale x 2 x i64> @llvm.aarch64.sve.dup.x.nxv2i64(i64)
declare <vscale x 8 x half> @llvm.aarch64.sve.dup.x.nxv8f16(half)		declare <vscale x 8 x half> @llvm.aarch64.sve.dup.x.nxv8f16(half)
		declare <vscale x 8 x bfloat> @llvm.aarch64.sve.dup.x.nxv8bf16(bfloat)
declare <vscale x 4 x float> @llvm.aarch64.sve.dup.x.nxv4f32(float)		declare <vscale x 4 x float> @llvm.aarch64.sve.dup.x.nxv4f32(float)
declare <vscale x 2 x double> @llvm.aarch64.sve.dup.x.nxv2f64(double)		declare <vscale x 2 x double> @llvm.aarch64.sve.dup.x.nxv2f64(double)

llvm/test/CodeGen/AArch64/sve-intrinsics-perm-select.ll

; RUN: llc -mtriple=aarch64-linux-gnu -mattr=+sve < %s 2>%t \| FileCheck %s		; RUN: llc -mtriple=aarch64-linux-gnu -mattr=+sve,+bf16 < %s 2>%t \| FileCheck %s
; RUN: FileCheck --check-prefix=WARN --allow-empty %s <%t		; RUN: FileCheck --check-prefix=WARN --allow-empty %s <%t

; WARN-NOT: warning		; WARN-NOT: warning

;		;
; CLASTA (Vectors)		; CLASTA (Vectors)
;		;

▲ Show 20 Lines • Show All 42 Lines • ▼ Show 20 Lines
; CHECK: clasta z0.h, p0, z0.h, z1.h		; CHECK: clasta z0.h, p0, z0.h, z1.h
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%out = call <vscale x 8 x half> @llvm.aarch64.sve.clasta.nxv8f16(<vscale x 8 x i1> %pg,		%out = call <vscale x 8 x half> @llvm.aarch64.sve.clasta.nxv8f16(<vscale x 8 x i1> %pg,
<vscale x 8 x half> %a,		<vscale x 8 x half> %a,
<vscale x 8 x half> %b)		<vscale x 8 x half> %b)
ret <vscale x 8 x half> %out		ret <vscale x 8 x half> %out
}		}

		define <vscale x 8 x bfloat> @clasta_bf16(<vscale x 8 x i1> %pg, <vscale x 8 x bfloat> %a, <vscale x 8 x bfloat> %b) {
		; CHECK-LABEL: clasta_bf16:
		; CHECK: clasta z0.h, p0, z0.h, z1.h
		; CHECK-NEXT: ret
		%out = call <vscale x 8 x bfloat> @llvm.aarch64.sve.clasta.nxv8bf16(<vscale x 8 x i1> %pg,
		<vscale x 8 x bfloat> %a,
		<vscale x 8 x bfloat> %b)
		ret <vscale x 8 x bfloat> %out
		}

define <vscale x 4 x float> @clasta_f32(<vscale x 4 x i1> %pg, <vscale x 4 x float> %a, <vscale x 4 x float> %b) {		define <vscale x 4 x float> @clasta_f32(<vscale x 4 x i1> %pg, <vscale x 4 x float> %a, <vscale x 4 x float> %b) {
; CHECK-LABEL: clasta_f32:		; CHECK-LABEL: clasta_f32:
; CHECK: clasta z0.s, p0, z0.s, z1.s		; CHECK: clasta z0.s, p0, z0.s, z1.s
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%out = call <vscale x 4 x float> @llvm.aarch64.sve.clasta.nxv4f32(<vscale x 4 x i1> %pg,		%out = call <vscale x 4 x float> @llvm.aarch64.sve.clasta.nxv4f32(<vscale x 4 x i1> %pg,
<vscale x 4 x float> %a,		<vscale x 4 x float> %a,
<vscale x 4 x float> %b)		<vscale x 4 x float> %b)
ret <vscale x 4 x float> %out		ret <vscale x 4 x float> %out
▲ Show 20 Lines • Show All 58 Lines • ▼ Show 20 Lines
; CHECK: clasta h0, p0, h0, z1.h		; CHECK: clasta h0, p0, h0, z1.h
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%out = call half @llvm.aarch64.sve.clasta.n.nxv8f16(<vscale x 8 x i1> %pg,		%out = call half @llvm.aarch64.sve.clasta.n.nxv8f16(<vscale x 8 x i1> %pg,
half %a,		half %a,
<vscale x 8 x half> %b)		<vscale x 8 x half> %b)
ret half %out		ret half %out
}		}

		define bfloat @clasta_n_bf16(<vscale x 8 x i1> %pg, bfloat %a, <vscale x 8 x bfloat> %b) {
		; CHECK-LABEL: clasta_n_bf16:
		; CHECK: clasta h0, p0, h0, z1.h
		; CHECK-NEXT: ret
		%out = call bfloat @llvm.aarch64.sve.clasta.n.nxv8bf16(<vscale x 8 x i1> %pg,
		bfloat %a,
		<vscale x 8 x bfloat> %b)
		ret bfloat %out
		}

define float @clasta_n_f32(<vscale x 4 x i1> %pg, float %a, <vscale x 4 x float> %b) {		define float @clasta_n_f32(<vscale x 4 x i1> %pg, float %a, <vscale x 4 x float> %b) {
; CHECK-LABEL: clasta_n_f32:		; CHECK-LABEL: clasta_n_f32:
; CHECK: clasta s0, p0, s0, z1.s		; CHECK: clasta s0, p0, s0, z1.s
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%out = call float @llvm.aarch64.sve.clasta.n.nxv4f32(<vscale x 4 x i1> %pg,		%out = call float @llvm.aarch64.sve.clasta.n.nxv4f32(<vscale x 4 x i1> %pg,
float %a,		float %a,
<vscale x 4 x float> %b)		<vscale x 4 x float> %b)
ret float %out		ret float %out
▲ Show 20 Lines • Show All 58 Lines • ▼ Show 20 Lines
; CHECK: clastb z0.h, p0, z0.h, z1.h		; CHECK: clastb z0.h, p0, z0.h, z1.h
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%out = call <vscale x 8 x half> @llvm.aarch64.sve.clastb.nxv8f16(<vscale x 8 x i1> %pg,		%out = call <vscale x 8 x half> @llvm.aarch64.sve.clastb.nxv8f16(<vscale x 8 x i1> %pg,
<vscale x 8 x half> %a,		<vscale x 8 x half> %a,
<vscale x 8 x half> %b)		<vscale x 8 x half> %b)
ret <vscale x 8 x half> %out		ret <vscale x 8 x half> %out
}		}

		define <vscale x 8 x bfloat> @clastb_bf16(<vscale x 8 x i1> %pg, <vscale x 8 x bfloat> %a, <vscale x 8 x bfloat> %b) {
		; CHECK-LABEL: clastb_bf16:
		; CHECK: clastb z0.h, p0, z0.h, z1.h
		; CHECK-NEXT: ret
		%out = call <vscale x 8 x bfloat> @llvm.aarch64.sve.clastb.nxv8bf16(<vscale x 8 x i1> %pg,
		<vscale x 8 x bfloat> %a,
		<vscale x 8 x bfloat> %b)
		ret <vscale x 8 x bfloat> %out
		}

define <vscale x 4 x float> @clastb_f32(<vscale x 4 x i1> %pg, <vscale x 4 x float> %a, <vscale x 4 x float> %b) {		define <vscale x 4 x float> @clastb_f32(<vscale x 4 x i1> %pg, <vscale x 4 x float> %a, <vscale x 4 x float> %b) {
; CHECK-LABEL: clastb_f32:		; CHECK-LABEL: clastb_f32:
; CHECK: clastb z0.s, p0, z0.s, z1.s		; CHECK: clastb z0.s, p0, z0.s, z1.s
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%out = call <vscale x 4 x float> @llvm.aarch64.sve.clastb.nxv4f32(<vscale x 4 x i1> %pg,		%out = call <vscale x 4 x float> @llvm.aarch64.sve.clastb.nxv4f32(<vscale x 4 x i1> %pg,
<vscale x 4 x float> %a,		<vscale x 4 x float> %a,
<vscale x 4 x float> %b)		<vscale x 4 x float> %b)
ret <vscale x 4 x float> %out		ret <vscale x 4 x float> %out
▲ Show 20 Lines • Show All 58 Lines • ▼ Show 20 Lines
; CHECK: clastb h0, p0, h0, z1.h		; CHECK: clastb h0, p0, h0, z1.h
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%out = call half @llvm.aarch64.sve.clastb.n.nxv8f16(<vscale x 8 x i1> %pg,		%out = call half @llvm.aarch64.sve.clastb.n.nxv8f16(<vscale x 8 x i1> %pg,
half %a,		half %a,
<vscale x 8 x half> %b)		<vscale x 8 x half> %b)
ret half %out		ret half %out
}		}

		define bfloat @clastb_n_bf16(<vscale x 8 x i1> %pg, bfloat %a, <vscale x 8 x bfloat> %b) {
		; CHECK-LABEL: clastb_n_bf16:
		; CHECK: clastb h0, p0, h0, z1.h
		; CHECK-NEXT: ret
		%out = call bfloat @llvm.aarch64.sve.clastb.n.nxv8bf16(<vscale x 8 x i1> %pg,
		bfloat %a,
		<vscale x 8 x bfloat> %b)
		c-rhodesUnsubmitted Done Reply Inline Actions nit: alignment c-rhodes: nit: alignment
		ret bfloat %out
		}

define float @clastb_n_f32(<vscale x 4 x i1> %pg, float %a, <vscale x 4 x float> %b) {		define float @clastb_n_f32(<vscale x 4 x i1> %pg, float %a, <vscale x 4 x float> %b) {
; CHECK-LABEL: clastb_n_f32:		; CHECK-LABEL: clastb_n_f32:
; CHECK: clastb s0, p0, s0, z1.s		; CHECK: clastb s0, p0, s0, z1.s
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%out = call float @llvm.aarch64.sve.clastb.n.nxv4f32(<vscale x 4 x i1> %pg,		%out = call float @llvm.aarch64.sve.clastb.n.nxv4f32(<vscale x 4 x i1> %pg,
float %a,		float %a,
<vscale x 4 x float> %b)		<vscale x 4 x float> %b)
ret float %out		ret float %out
▲ Show 20 Lines • Show All 48 Lines • ▼ Show 20 Lines
define <vscale x 8 x half> @dupq_f16(<vscale x 8 x half> %a) {		define <vscale x 8 x half> @dupq_f16(<vscale x 8 x half> %a) {
; CHECK-LABEL: dupq_f16:		; CHECK-LABEL: dupq_f16:
; CHECK: mov z0.q, q0		; CHECK: mov z0.q, q0
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%out = call <vscale x 8 x half> @llvm.aarch64.sve.dupq.lane.nxv8f16(<vscale x 8 x half> %a, i64 0)		%out = call <vscale x 8 x half> @llvm.aarch64.sve.dupq.lane.nxv8f16(<vscale x 8 x half> %a, i64 0)
ret <vscale x 8 x half> %out		ret <vscale x 8 x half> %out
}		}

		define <vscale x 8 x bfloat> @dupq_bf16(<vscale x 8 x bfloat> %a) {
		; CHECK-LABEL: dupq_bf16:
		; CHECK: mov z0.q, q0
		; CHECK-NEXT: ret
		%out = call <vscale x 8 x bfloat> @llvm.aarch64.sve.dupq.lane.nxv8bf16(<vscale x 8 x bfloat> %a, i64 0)
		ret <vscale x 8 x bfloat> %out
		}

define <vscale x 4 x float> @dupq_f32(<vscale x 4 x float> %a) {		define <vscale x 4 x float> @dupq_f32(<vscale x 4 x float> %a) {
; CHECK-LABEL: dupq_f32:		; CHECK-LABEL: dupq_f32:
; CHECK: mov z0.q, z0.q[1]		; CHECK: mov z0.q, z0.q[1]
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%out = call <vscale x 4 x float> @llvm.aarch64.sve.dupq.lane.nxv4f32(<vscale x 4 x float> %a, i64 1)		%out = call <vscale x 4 x float> @llvm.aarch64.sve.dupq.lane.nxv4f32(<vscale x 4 x float> %a, i64 1)
ret <vscale x 4 x float> %out		ret <vscale x 4 x float> %out
}		}

▲ Show 20 Lines • Show All 74 Lines • ▼ Show 20 Lines
; CHECK: add [[Z4:z[0-9]+]].d, [[Z2]].d, [[Z3]].d		; CHECK: add [[Z4:z[0-9]+]].d, [[Z2]].d, [[Z3]].d
; CHECK: tbl z0.d, { z0.d }, [[Z4]].d		; CHECK: tbl z0.d, { z0.d }, [[Z4]].d
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%out = call <vscale x 8 x half> @llvm.aarch64.sve.dupq.lane.nxv8f16(<vscale x 8 x half> %a, i64 %idx)		%out = call <vscale x 8 x half> @llvm.aarch64.sve.dupq.lane.nxv8f16(<vscale x 8 x half> %a, i64 %idx)
ret <vscale x 8 x half> %out		ret <vscale x 8 x half> %out
}		}

; NOTE: Identical operation to dupq_lane_i8 (i.e. element type is irrelevant).		; NOTE: Identical operation to dupq_lane_i8 (i.e. element type is irrelevant).
		define <vscale x 8 x bfloat> @dupq_lane_bf16(<vscale x 8 x bfloat> %a, i64 %idx) {
		; CHECK-LABEL: dupq_lane_bf16:
		; CHECK-DAG: index [[Z1:z[0-9]+]].d, #0, #1
		; CHECK-DAG: and [[Z2:z[0-9]+]].d, [[Z1]].d, #0x1
		; CHECK-DAG: add [[X1:x[0-9]+]], x0, x0
		; CHECK-DAG: mov [[Z3:z[0-9]+]].d, [[X1]]
		; CHECK: add [[Z4:z[0-9]+]].d, [[Z2]].d, [[Z3]].d
		; CHECK: tbl z0.d, { z0.d }, [[Z4]].d
		; CHECK-NEXT: ret
		%out = call <vscale x 8 x bfloat> @llvm.aarch64.sve.dupq.lane.nxv8bf16(<vscale x 8 x bfloat> %a, i64 %idx)
		ret <vscale x 8 x bfloat> %out
		}

		; NOTE: Identical operation to dupq_lane_i8 (i.e. element type is irrelevant).
define <vscale x 4 x float> @dupq_lane_f32(<vscale x 4 x float> %a, i64 %idx) {		define <vscale x 4 x float> @dupq_lane_f32(<vscale x 4 x float> %a, i64 %idx) {
; CHECK-LABEL: dupq_lane_f32:		; CHECK-LABEL: dupq_lane_f32:
; CHECK-DAG: index [[Z1:z[0-9]+]].d, #0, #1		; CHECK-DAG: index [[Z1:z[0-9]+]].d, #0, #1
; CHECK-DAG: and [[Z2:z[0-9]+]].d, [[Z1]].d, #0x1		; CHECK-DAG: and [[Z2:z[0-9]+]].d, [[Z1]].d, #0x1
; CHECK-DAG: add [[X1:x[0-9]+]], x0, x0		; CHECK-DAG: add [[X1:x[0-9]+]], x0, x0
; CHECK-DAG: mov [[Z3:z[0-9]+]].d, [[X1]]		; CHECK-DAG: mov [[Z3:z[0-9]+]].d, [[X1]]
; CHECK: add [[Z4:z[0-9]+]].d, [[Z2]].d, [[Z3]].d		; CHECK: add [[Z4:z[0-9]+]].d, [[Z2]].d, [[Z3]].d
; CHECK: tbl z0.d, { z0.d }, [[Z4]].d		; CHECK: tbl z0.d, { z0.d }, [[Z4]].d
▲ Show 20 Lines • Show All 146 Lines • ▼ Show 20 Lines
; CHECK-LABEL: lasta_f16		; CHECK-LABEL: lasta_f16
; CHECK: lasta h0, p0, z0.h		; CHECK: lasta h0, p0, z0.h
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%res = call half @llvm.aarch64.sve.lasta.nxv8f16(<vscale x 8 x i1> %pg,		%res = call half @llvm.aarch64.sve.lasta.nxv8f16(<vscale x 8 x i1> %pg,
<vscale x 8 x half> %a)		<vscale x 8 x half> %a)
ret half %res		ret half %res
}		}

		define bfloat @lasta_bf16(<vscale x 8 x i1> %pg, <vscale x 8 x bfloat> %a) {
		; CHECK-LABEL: lasta_bf16
		; CHECK: lasta h0, p0, z0.h
		; CHECK-NEXT: ret
		%res = call bfloat @llvm.aarch64.sve.lasta.nxv8bf16(<vscale x 8 x i1> %pg,
		<vscale x 8 x bfloat> %a)
		c-rhodesUnsubmitted Done Reply Inline Actions nit: alignment c-rhodes: nit: alignment
		ret bfloat %res
		}

define float @lasta_f32(<vscale x 4 x i1> %pg, <vscale x 4 x float> %a) {		define float @lasta_f32(<vscale x 4 x i1> %pg, <vscale x 4 x float> %a) {
; CHECK-LABEL: lasta_f32		; CHECK-LABEL: lasta_f32
; CHECK: lasta s0, p0, z0.s		; CHECK: lasta s0, p0, z0.s
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%res = call float @llvm.aarch64.sve.lasta.nxv4f32(<vscale x 4 x i1> %pg,		%res = call float @llvm.aarch64.sve.lasta.nxv4f32(<vscale x 4 x i1> %pg,
<vscale x 4 x float> %a)		<vscale x 4 x float> %a)
ret float %res		ret float %res
}		}
▲ Show 20 Lines • Show All 60 Lines • ▼ Show 20 Lines
; CHECK-LABEL: lastb_f16		; CHECK-LABEL: lastb_f16
; CHECK: lastb h0, p0, z0.h		; CHECK: lastb h0, p0, z0.h
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%res = call half @llvm.aarch64.sve.lastb.nxv8f16(<vscale x 8 x i1> %pg,		%res = call half @llvm.aarch64.sve.lastb.nxv8f16(<vscale x 8 x i1> %pg,
<vscale x 8 x half> %a)		<vscale x 8 x half> %a)
ret half %res		ret half %res
}		}

		define bfloat @lastb_bf16(<vscale x 8 x i1> %pg, <vscale x 8 x bfloat> %a) {
		; CHECK-LABEL: lastb_bf16
		; CHECK: lastb h0, p0, z0.h
		; CHECK-NEXT: ret
		%res = call bfloat @llvm.aarch64.sve.lastb.nxv8bf16(<vscale x 8 x i1> %pg,
		<vscale x 8 x bfloat> %a)
		ret bfloat %res
		}

define float @lastb_f32(<vscale x 4 x i1> %pg, <vscale x 4 x float> %a) {		define float @lastb_f32(<vscale x 4 x i1> %pg, <vscale x 4 x float> %a) {
; CHECK-LABEL: lastb_f32		; CHECK-LABEL: lastb_f32
; CHECK: lastb s0, p0, z0.s		; CHECK: lastb s0, p0, z0.s
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%res = call float @llvm.aarch64.sve.lastb.nxv4f32(<vscale x 4 x i1> %pg,		%res = call float @llvm.aarch64.sve.lastb.nxv4f32(<vscale x 4 x i1> %pg,
<vscale x 4 x float> %a)		<vscale x 4 x float> %a)
ret float %res		ret float %res
}		}
▲ Show 20 Lines • Show All 1,073 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
ret <vscale x 2 x double> %out		ret <vscale x 2 x double> %out
}		}

declare <vscale x 16 x i8> @llvm.aarch64.sve.clasta.nxv16i8(<vscale x 16 x i1>, <vscale x 16 x i8>, <vscale x 16 x i8>)		declare <vscale x 16 x i8> @llvm.aarch64.sve.clasta.nxv16i8(<vscale x 16 x i1>, <vscale x 16 x i8>, <vscale x 16 x i8>)
declare <vscale x 8 x i16> @llvm.aarch64.sve.clasta.nxv8i16(<vscale x 8 x i1>, <vscale x 8 x i16>, <vscale x 8 x i16>)		declare <vscale x 8 x i16> @llvm.aarch64.sve.clasta.nxv8i16(<vscale x 8 x i1>, <vscale x 8 x i16>, <vscale x 8 x i16>)
declare <vscale x 4 x i32> @llvm.aarch64.sve.clasta.nxv4i32(<vscale x 4 x i1>, <vscale x 4 x i32>, <vscale x 4 x i32>)		declare <vscale x 4 x i32> @llvm.aarch64.sve.clasta.nxv4i32(<vscale x 4 x i1>, <vscale x 4 x i32>, <vscale x 4 x i32>)
declare <vscale x 2 x i64> @llvm.aarch64.sve.clasta.nxv2i64(<vscale x 2 x i1>, <vscale x 2 x i64>, <vscale x 2 x i64>)		declare <vscale x 2 x i64> @llvm.aarch64.sve.clasta.nxv2i64(<vscale x 2 x i1>, <vscale x 2 x i64>, <vscale x 2 x i64>)
declare <vscale x 8 x half> @llvm.aarch64.sve.clasta.nxv8f16(<vscale x 8 x i1>, <vscale x 8 x half>, <vscale x 8 x half>)		declare <vscale x 8 x half> @llvm.aarch64.sve.clasta.nxv8f16(<vscale x 8 x i1>, <vscale x 8 x half>, <vscale x 8 x half>)
		declare <vscale x 8 x bfloat> @llvm.aarch64.sve.clasta.nxv8bf16(<vscale x 8 x i1>, <vscale x 8 x bfloat>, <vscale x 8 x bfloat>)
declare <vscale x 4 x float> @llvm.aarch64.sve.clasta.nxv4f32(<vscale x 4 x i1>, <vscale x 4 x float>, <vscale x 4 x float>)		declare <vscale x 4 x float> @llvm.aarch64.sve.clasta.nxv4f32(<vscale x 4 x i1>, <vscale x 4 x float>, <vscale x 4 x float>)
declare <vscale x 2 x double> @llvm.aarch64.sve.clasta.nxv2f64(<vscale x 2 x i1>, <vscale x 2 x double>, <vscale x 2 x double>)		declare <vscale x 2 x double> @llvm.aarch64.sve.clasta.nxv2f64(<vscale x 2 x i1>, <vscale x 2 x double>, <vscale x 2 x double>)

declare i8 @llvm.aarch64.sve.clasta.n.nxv16i8(<vscale x 16 x i1>, i8, <vscale x 16 x i8>)		declare i8 @llvm.aarch64.sve.clasta.n.nxv16i8(<vscale x 16 x i1>, i8, <vscale x 16 x i8>)
declare i16 @llvm.aarch64.sve.clasta.n.nxv8i16(<vscale x 8 x i1>, i16, <vscale x 8 x i16>)		declare i16 @llvm.aarch64.sve.clasta.n.nxv8i16(<vscale x 8 x i1>, i16, <vscale x 8 x i16>)
declare i32 @llvm.aarch64.sve.clasta.n.nxv4i32(<vscale x 4 x i1>, i32, <vscale x 4 x i32>)		declare i32 @llvm.aarch64.sve.clasta.n.nxv4i32(<vscale x 4 x i1>, i32, <vscale x 4 x i32>)
declare i64 @llvm.aarch64.sve.clasta.n.nxv2i64(<vscale x 2 x i1>, i64, <vscale x 2 x i64>)		declare i64 @llvm.aarch64.sve.clasta.n.nxv2i64(<vscale x 2 x i1>, i64, <vscale x 2 x i64>)
declare half @llvm.aarch64.sve.clasta.n.nxv8f16(<vscale x 8 x i1>, half, <vscale x 8 x half>)		declare half @llvm.aarch64.sve.clasta.n.nxv8f16(<vscale x 8 x i1>, half, <vscale x 8 x half>)
		declare bfloat @llvm.aarch64.sve.clasta.n.nxv8bf16(<vscale x 8 x i1>, bfloat, <vscale x 8 x bfloat>)
declare float @llvm.aarch64.sve.clasta.n.nxv4f32(<vscale x 4 x i1>, float, <vscale x 4 x float>)		declare float @llvm.aarch64.sve.clasta.n.nxv4f32(<vscale x 4 x i1>, float, <vscale x 4 x float>)
declare double @llvm.aarch64.sve.clasta.n.nxv2f64(<vscale x 2 x i1>, double, <vscale x 2 x double>)		declare double @llvm.aarch64.sve.clasta.n.nxv2f64(<vscale x 2 x i1>, double, <vscale x 2 x double>)

declare <vscale x 16 x i8> @llvm.aarch64.sve.clastb.nxv16i8(<vscale x 16 x i1>, <vscale x 16 x i8>, <vscale x 16 x i8>)		declare <vscale x 16 x i8> @llvm.aarch64.sve.clastb.nxv16i8(<vscale x 16 x i1>, <vscale x 16 x i8>, <vscale x 16 x i8>)
declare <vscale x 8 x i16> @llvm.aarch64.sve.clastb.nxv8i16(<vscale x 8 x i1>, <vscale x 8 x i16>, <vscale x 8 x i16>)		declare <vscale x 8 x i16> @llvm.aarch64.sve.clastb.nxv8i16(<vscale x 8 x i1>, <vscale x 8 x i16>, <vscale x 8 x i16>)
declare <vscale x 4 x i32> @llvm.aarch64.sve.clastb.nxv4i32(<vscale x 4 x i1>, <vscale x 4 x i32>, <vscale x 4 x i32>)		declare <vscale x 4 x i32> @llvm.aarch64.sve.clastb.nxv4i32(<vscale x 4 x i1>, <vscale x 4 x i32>, <vscale x 4 x i32>)
declare <vscale x 2 x i64> @llvm.aarch64.sve.clastb.nxv2i64(<vscale x 2 x i1>, <vscale x 2 x i64>, <vscale x 2 x i64>)		declare <vscale x 2 x i64> @llvm.aarch64.sve.clastb.nxv2i64(<vscale x 2 x i1>, <vscale x 2 x i64>, <vscale x 2 x i64>)
declare <vscale x 8 x half> @llvm.aarch64.sve.clastb.nxv8f16(<vscale x 8 x i1>, <vscale x 8 x half>, <vscale x 8 x half>)		declare <vscale x 8 x half> @llvm.aarch64.sve.clastb.nxv8f16(<vscale x 8 x i1>, <vscale x 8 x half>, <vscale x 8 x half>)
		declare <vscale x 8 x bfloat> @llvm.aarch64.sve.clastb.nxv8bf16(<vscale x 8 x i1>, <vscale x 8 x bfloat>, <vscale x 8 x bfloat>)
declare <vscale x 4 x float> @llvm.aarch64.sve.clastb.nxv4f32(<vscale x 4 x i1>, <vscale x 4 x float>, <vscale x 4 x float>)		declare <vscale x 4 x float> @llvm.aarch64.sve.clastb.nxv4f32(<vscale x 4 x i1>, <vscale x 4 x float>, <vscale x 4 x float>)
declare <vscale x 2 x double> @llvm.aarch64.sve.clastb.nxv2f64(<vscale x 2 x i1>, <vscale x 2 x double>, <vscale x 2 x double>)		declare <vscale x 2 x double> @llvm.aarch64.sve.clastb.nxv2f64(<vscale x 2 x i1>, <vscale x 2 x double>, <vscale x 2 x double>)

declare i8 @llvm.aarch64.sve.clastb.n.nxv16i8(<vscale x 16 x i1>, i8, <vscale x 16 x i8>)		declare i8 @llvm.aarch64.sve.clastb.n.nxv16i8(<vscale x 16 x i1>, i8, <vscale x 16 x i8>)
declare i16 @llvm.aarch64.sve.clastb.n.nxv8i16(<vscale x 8 x i1>, i16, <vscale x 8 x i16>)		declare i16 @llvm.aarch64.sve.clastb.n.nxv8i16(<vscale x 8 x i1>, i16, <vscale x 8 x i16>)
declare i32 @llvm.aarch64.sve.clastb.n.nxv4i32(<vscale x 4 x i1>, i32, <vscale x 4 x i32>)		declare i32 @llvm.aarch64.sve.clastb.n.nxv4i32(<vscale x 4 x i1>, i32, <vscale x 4 x i32>)
declare i64 @llvm.aarch64.sve.clastb.n.nxv2i64(<vscale x 2 x i1>, i64, <vscale x 2 x i64>)		declare i64 @llvm.aarch64.sve.clastb.n.nxv2i64(<vscale x 2 x i1>, i64, <vscale x 2 x i64>)
declare half @llvm.aarch64.sve.clastb.n.nxv8f16(<vscale x 8 x i1>, half, <vscale x 8 x half>)		declare half @llvm.aarch64.sve.clastb.n.nxv8f16(<vscale x 8 x i1>, half, <vscale x 8 x half>)
		declare bfloat @llvm.aarch64.sve.clastb.n.nxv8bf16(<vscale x 8 x i1>, bfloat, <vscale x 8 x bfloat>)
declare float @llvm.aarch64.sve.clastb.n.nxv4f32(<vscale x 4 x i1>, float, <vscale x 4 x float>)		declare float @llvm.aarch64.sve.clastb.n.nxv4f32(<vscale x 4 x i1>, float, <vscale x 4 x float>)
declare double @llvm.aarch64.sve.clastb.n.nxv2f64(<vscale x 2 x i1>, double, <vscale x 2 x double>)		declare double @llvm.aarch64.sve.clastb.n.nxv2f64(<vscale x 2 x i1>, double, <vscale x 2 x double>)

declare <vscale x 4 x i32> @llvm.aarch64.sve.compact.nxv4i32(<vscale x 4 x i1>, <vscale x 4 x i32>)		declare <vscale x 4 x i32> @llvm.aarch64.sve.compact.nxv4i32(<vscale x 4 x i1>, <vscale x 4 x i32>)
declare <vscale x 2 x i64> @llvm.aarch64.sve.compact.nxv2i64(<vscale x 2 x i1>, <vscale x 2 x i64>)		declare <vscale x 2 x i64> @llvm.aarch64.sve.compact.nxv2i64(<vscale x 2 x i1>, <vscale x 2 x i64>)
declare <vscale x 4 x float> @llvm.aarch64.sve.compact.nxv4f32(<vscale x 4 x i1>, <vscale x 4 x float>)		declare <vscale x 4 x float> @llvm.aarch64.sve.compact.nxv4f32(<vscale x 4 x i1>, <vscale x 4 x float>)
declare <vscale x 2 x double> @llvm.aarch64.sve.compact.nxv2f64(<vscale x 2 x i1>, <vscale x 2 x double>)		declare <vscale x 2 x double> @llvm.aarch64.sve.compact.nxv2f64(<vscale x 2 x i1>, <vscale x 2 x double>)

declare <vscale x 16 x i8> @llvm.aarch64.sve.dupq.lane.nxv16i8(<vscale x 16 x i8>, i64)		declare <vscale x 16 x i8> @llvm.aarch64.sve.dupq.lane.nxv16i8(<vscale x 16 x i8>, i64)
declare <vscale x 8 x i16> @llvm.aarch64.sve.dupq.lane.nxv8i16(<vscale x 8 x i16>, i64)		declare <vscale x 8 x i16> @llvm.aarch64.sve.dupq.lane.nxv8i16(<vscale x 8 x i16>, i64)
declare <vscale x 4 x i32> @llvm.aarch64.sve.dupq.lane.nxv4i32(<vscale x 4 x i32>, i64)		declare <vscale x 4 x i32> @llvm.aarch64.sve.dupq.lane.nxv4i32(<vscale x 4 x i32>, i64)
declare <vscale x 2 x i64> @llvm.aarch64.sve.dupq.lane.nxv2i64(<vscale x 2 x i64>, i64)		declare <vscale x 2 x i64> @llvm.aarch64.sve.dupq.lane.nxv2i64(<vscale x 2 x i64>, i64)
declare <vscale x 8 x half> @llvm.aarch64.sve.dupq.lane.nxv8f16(<vscale x 8 x half>, i64)		declare <vscale x 8 x half> @llvm.aarch64.sve.dupq.lane.nxv8f16(<vscale x 8 x half>, i64)
		declare <vscale x 8 x bfloat> @llvm.aarch64.sve.dupq.lane.nxv8bf16(<vscale x 8 x bfloat>, i64)
declare <vscale x 4 x float> @llvm.aarch64.sve.dupq.lane.nxv4f32(<vscale x 4 x float>, i64)		declare <vscale x 4 x float> @llvm.aarch64.sve.dupq.lane.nxv4f32(<vscale x 4 x float>, i64)
declare <vscale x 2 x double> @llvm.aarch64.sve.dupq.lane.nxv2f64(<vscale x 2 x double>, i64)		declare <vscale x 2 x double> @llvm.aarch64.sve.dupq.lane.nxv2f64(<vscale x 2 x double>, i64)

declare <vscale x 16 x i8> @llvm.aarch64.sve.ext.nxv16i8(<vscale x 16 x i8>, <vscale x 16 x i8>, i32)		declare <vscale x 16 x i8> @llvm.aarch64.sve.ext.nxv16i8(<vscale x 16 x i8>, <vscale x 16 x i8>, i32)
declare <vscale x 8 x i16> @llvm.aarch64.sve.ext.nxv8i16(<vscale x 8 x i16>, <vscale x 8 x i16>, i32)		declare <vscale x 8 x i16> @llvm.aarch64.sve.ext.nxv8i16(<vscale x 8 x i16>, <vscale x 8 x i16>, i32)
declare <vscale x 4 x i32> @llvm.aarch64.sve.ext.nxv4i32(<vscale x 4 x i32>, <vscale x 4 x i32>, i32)		declare <vscale x 4 x i32> @llvm.aarch64.sve.ext.nxv4i32(<vscale x 4 x i32>, <vscale x 4 x i32>, i32)
declare <vscale x 2 x i64> @llvm.aarch64.sve.ext.nxv2i64(<vscale x 2 x i64>, <vscale x 2 x i64>, i32)		declare <vscale x 2 x i64> @llvm.aarch64.sve.ext.nxv2i64(<vscale x 2 x i64>, <vscale x 2 x i64>, i32)
declare <vscale x 8 x half> @llvm.aarch64.sve.ext.nxv8f16(<vscale x 8 x half>, <vscale x 8 x half>, i32)		declare <vscale x 8 x half> @llvm.aarch64.sve.ext.nxv8f16(<vscale x 8 x half>, <vscale x 8 x half>, i32)
declare <vscale x 4 x float> @llvm.aarch64.sve.ext.nxv4f32(<vscale x 4 x float>, <vscale x 4 x float>, i32)		declare <vscale x 4 x float> @llvm.aarch64.sve.ext.nxv4f32(<vscale x 4 x float>, <vscale x 4 x float>, i32)
declare <vscale x 2 x double> @llvm.aarch64.sve.ext.nxv2f64(<vscale x 2 x double>, <vscale x 2 x double>, i32)		declare <vscale x 2 x double> @llvm.aarch64.sve.ext.nxv2f64(<vscale x 2 x double>, <vscale x 2 x double>, i32)

declare i8 @llvm.aarch64.sve.lasta.nxv16i8(<vscale x 16 x i1>, <vscale x 16 x i8>)		declare i8 @llvm.aarch64.sve.lasta.nxv16i8(<vscale x 16 x i1>, <vscale x 16 x i8>)
declare i16 @llvm.aarch64.sve.lasta.nxv8i16(<vscale x 8 x i1>, <vscale x 8 x i16>)		declare i16 @llvm.aarch64.sve.lasta.nxv8i16(<vscale x 8 x i1>, <vscale x 8 x i16>)
declare i32 @llvm.aarch64.sve.lasta.nxv4i32(<vscale x 4 x i1>, <vscale x 4 x i32>)		declare i32 @llvm.aarch64.sve.lasta.nxv4i32(<vscale x 4 x i1>, <vscale x 4 x i32>)
declare i64 @llvm.aarch64.sve.lasta.nxv2i64(<vscale x 2 x i1>, <vscale x 2 x i64>)		declare i64 @llvm.aarch64.sve.lasta.nxv2i64(<vscale x 2 x i1>, <vscale x 2 x i64>)
declare half @llvm.aarch64.sve.lasta.nxv8f16(<vscale x 8 x i1>, <vscale x 8 x half>)		declare half @llvm.aarch64.sve.lasta.nxv8f16(<vscale x 8 x i1>, <vscale x 8 x half>)
		declare bfloat @llvm.aarch64.sve.lasta.nxv8bf16(<vscale x 8 x i1>, <vscale x 8 x bfloat>)
declare float @llvm.aarch64.sve.lasta.nxv2f32(<vscale x 2 x i1>, <vscale x 2 x float>)		declare float @llvm.aarch64.sve.lasta.nxv2f32(<vscale x 2 x i1>, <vscale x 2 x float>)
declare float @llvm.aarch64.sve.lasta.nxv4f32(<vscale x 4 x i1>, <vscale x 4 x float>)		declare float @llvm.aarch64.sve.lasta.nxv4f32(<vscale x 4 x i1>, <vscale x 4 x float>)
declare double @llvm.aarch64.sve.lasta.nxv2f64(<vscale x 2 x i1>, <vscale x 2 x double>)		declare double @llvm.aarch64.sve.lasta.nxv2f64(<vscale x 2 x i1>, <vscale x 2 x double>)

declare i8 @llvm.aarch64.sve.lastb.nxv16i8(<vscale x 16 x i1>, <vscale x 16 x i8>)		declare i8 @llvm.aarch64.sve.lastb.nxv16i8(<vscale x 16 x i1>, <vscale x 16 x i8>)
declare i16 @llvm.aarch64.sve.lastb.nxv8i16(<vscale x 8 x i1>, <vscale x 8 x i16>)		declare i16 @llvm.aarch64.sve.lastb.nxv8i16(<vscale x 8 x i1>, <vscale x 8 x i16>)
declare i32 @llvm.aarch64.sve.lastb.nxv4i32(<vscale x 4 x i1>, <vscale x 4 x i32>)		declare i32 @llvm.aarch64.sve.lastb.nxv4i32(<vscale x 4 x i1>, <vscale x 4 x i32>)
declare i64 @llvm.aarch64.sve.lastb.nxv2i64(<vscale x 2 x i1>, <vscale x 2 x i64>)		declare i64 @llvm.aarch64.sve.lastb.nxv2i64(<vscale x 2 x i1>, <vscale x 2 x i64>)
declare half @llvm.aarch64.sve.lastb.nxv8f16(<vscale x 8 x i1>, <vscale x 8 x half>)		declare half @llvm.aarch64.sve.lastb.nxv8f16(<vscale x 8 x i1>, <vscale x 8 x half>)
		declare bfloat @llvm.aarch64.sve.lastb.nxv8bf16(<vscale x 8 x i1>, <vscale x 8 x bfloat>)
declare float @llvm.aarch64.sve.lastb.nxv2f32(<vscale x 2 x i1>, <vscale x 2 x float>)		declare float @llvm.aarch64.sve.lastb.nxv2f32(<vscale x 2 x i1>, <vscale x 2 x float>)
declare float @llvm.aarch64.sve.lastb.nxv4f32(<vscale x 4 x i1>, <vscale x 4 x float>)		declare float @llvm.aarch64.sve.lastb.nxv4f32(<vscale x 4 x i1>, <vscale x 4 x float>)
declare double @llvm.aarch64.sve.lastb.nxv2f64(<vscale x 2 x i1>, <vscale x 2 x double>)		declare double @llvm.aarch64.sve.lastb.nxv2f64(<vscale x 2 x i1>, <vscale x 2 x double>)

declare <vscale x 16 x i1> @llvm.aarch64.sve.rev.nxv16i1(<vscale x 16 x i1>)		declare <vscale x 16 x i1> @llvm.aarch64.sve.rev.nxv16i1(<vscale x 16 x i1>)
declare <vscale x 8 x i1> @llvm.aarch64.sve.rev.nxv8i1(<vscale x 8 x i1>)		declare <vscale x 8 x i1> @llvm.aarch64.sve.rev.nxv8i1(<vscale x 8 x i1>)
declare <vscale x 4 x i1> @llvm.aarch64.sve.rev.nxv4i1(<vscale x 4 x i1>)		declare <vscale x 4 x i1> @llvm.aarch64.sve.rev.nxv4i1(<vscale x 4 x i1>)
declare <vscale x 2 x i1> @llvm.aarch64.sve.rev.nxv2i1(<vscale x 2 x i1>)		declare <vscale x 2 x i1> @llvm.aarch64.sve.rev.nxv2i1(<vscale x 2 x i1>)
▲ Show 20 Lines • Show All 117 Lines • Show Last 20 Lines

llvm/test/CodeGen/AArch64/sve-intrinsics-scalar-to-vec.ll

; RUN: llc -mtriple=aarch64-linux-gnu -mattr=+sve < %s 2>%t \| FileCheck %s		; RUN: llc -mtriple=aarch64-linux-gnu -mattr=+sve,+bf16 < %s 2>%t \| FileCheck %s
; RUN: FileCheck --check-prefix=WARN --allow-empty %s <%t		; RUN: FileCheck --check-prefix=WARN --allow-empty %s <%t

; WARN-NOT: warning		; WARN-NOT: warning

;		;
; DUP		; DUP
;		;

▲ Show 20 Lines • Show All 42 Lines • ▼ Show 20 Lines
; CHECK: mov z0.h, p0/m, h1		; CHECK: mov z0.h, p0/m, h1
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%out = call <vscale x 8 x half> @llvm.aarch64.sve.dup.nxv8f16(<vscale x 8 x half> %a,		%out = call <vscale x 8 x half> @llvm.aarch64.sve.dup.nxv8f16(<vscale x 8 x half> %a,
<vscale x 8 x i1> %pg,		<vscale x 8 x i1> %pg,
half %b)		half %b)
ret <vscale x 8 x half> %out		ret <vscale x 8 x half> %out
}		}

		define <vscale x 8 x bfloat> @dup_bf16(<vscale x 8 x bfloat> %a, <vscale x 8 x i1> %pg, bfloat %b) {
		; CHECK-LABEL: dup_bf16:
		; CHECK: mov z0.h, p0/m, h1
		; CHECK-NEXT: ret
		%out = call <vscale x 8 x bfloat> @llvm.aarch64.sve.dup.nxv8bf16(<vscale x 8 x bfloat> %a,
		<vscale x 8 x i1> %pg,
		bfloat %b)
		c-rhodesUnsubmitted Done Reply Inline Actions nit: alignment c-rhodes: nit: alignment
		ret <vscale x 8 x bfloat> %out
		}

define <vscale x 4 x float> @dup_f32(<vscale x 4 x float> %a, <vscale x 4 x i1> %pg, float %b) {		define <vscale x 4 x float> @dup_f32(<vscale x 4 x float> %a, <vscale x 4 x i1> %pg, float %b) {
; CHECK-LABEL: dup_f32:		; CHECK-LABEL: dup_f32:
; CHECK: mov z0.s, p0/m, s1		; CHECK: mov z0.s, p0/m, s1
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%out = call <vscale x 4 x float> @llvm.aarch64.sve.dup.nxv4f32(<vscale x 4 x float> %a,		%out = call <vscale x 4 x float> @llvm.aarch64.sve.dup.nxv4f32(<vscale x 4 x float> %a,
<vscale x 4 x i1> %pg,		<vscale x 4 x i1> %pg,
float %b)		float %b)
ret <vscale x 4 x float> %out		ret <vscale x 4 x float> %out
Show All 9 Lines	; CHECK-NEXT: ret
ret <vscale x 2 x double> %out		ret <vscale x 2 x double> %out
}		}

declare <vscale x 16 x i8> @llvm.aarch64.sve.dup.nxv16i8(<vscale x 16 x i8>, <vscale x 16 x i1>, i8)		declare <vscale x 16 x i8> @llvm.aarch64.sve.dup.nxv16i8(<vscale x 16 x i8>, <vscale x 16 x i1>, i8)
declare <vscale x 8 x i16> @llvm.aarch64.sve.dup.nxv8i16(<vscale x 8 x i16>, <vscale x 8 x i1>, i16)		declare <vscale x 8 x i16> @llvm.aarch64.sve.dup.nxv8i16(<vscale x 8 x i16>, <vscale x 8 x i1>, i16)
declare <vscale x 4 x i32> @llvm.aarch64.sve.dup.nxv4i32(<vscale x 4 x i32>, <vscale x 4 x i1>, i32)		declare <vscale x 4 x i32> @llvm.aarch64.sve.dup.nxv4i32(<vscale x 4 x i32>, <vscale x 4 x i1>, i32)
declare <vscale x 2 x i64> @llvm.aarch64.sve.dup.nxv2i64(<vscale x 2 x i64>, <vscale x 2 x i1>, i64)		declare <vscale x 2 x i64> @llvm.aarch64.sve.dup.nxv2i64(<vscale x 2 x i64>, <vscale x 2 x i1>, i64)
declare <vscale x 8 x half> @llvm.aarch64.sve.dup.nxv8f16(<vscale x 8 x half>, <vscale x 8 x i1>, half)		declare <vscale x 8 x half> @llvm.aarch64.sve.dup.nxv8f16(<vscale x 8 x half>, <vscale x 8 x i1>, half)
		declare <vscale x 8 x bfloat> @llvm.aarch64.sve.dup.nxv8bf16(<vscale x 8 x bfloat>, <vscale x 8 x i1>, bfloat)
declare <vscale x 4 x float> @llvm.aarch64.sve.dup.nxv4f32(<vscale x 4 x float>, <vscale x 4 x i1>, float)		declare <vscale x 4 x float> @llvm.aarch64.sve.dup.nxv4f32(<vscale x 4 x float>, <vscale x 4 x i1>, float)
declare <vscale x 2 x double> @llvm.aarch64.sve.dup.nxv2f64(<vscale x 2 x double>, <vscale x 2 x i1>, double)		declare <vscale x 2 x double> @llvm.aarch64.sve.dup.nxv2f64(<vscale x 2 x double>, <vscale x 2 x i1>, double)

llvm/test/CodeGen/AArch64/sve-intrinsics-shifts.ll

	; RUN: llc -mtriple=aarch64-linux-gnu -mattr=+sve < %s 2>%t \| FileCheck %s			; RUN: llc -mtriple=aarch64-linux-gnu -mattr=+sve,+bf16 < %s 2>%t \| FileCheck %s
	; RUN: FileCheck --check-prefix=WARN --allow-empty %s <%t			; RUN: FileCheck --check-prefix=WARN --allow-empty %s <%t

	; WARN-NOT: warning			; WARN-NOT: warning

	;			;
	; ASR			; ASR
	;			;

	▲ Show 20 Lines • Show All 150 Lines • ▼ Show 20 Lines
	define <vscale x 8 x half> @insr_f16(<vscale x 8 x half> %a, half %b) {			define <vscale x 8 x half> @insr_f16(<vscale x 8 x half> %a, half %b) {
	; CHECK-LABEL: insr_f16:			; CHECK-LABEL: insr_f16:
	; CHECK: insr z0.h, h1			; CHECK: insr z0.h, h1
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%out = call <vscale x 8 x half> @llvm.aarch64.sve.insr.nxv8f16(<vscale x 8 x half> %a, half %b)			%out = call <vscale x 8 x half> @llvm.aarch64.sve.insr.nxv8f16(<vscale x 8 x half> %a, half %b)
	ret <vscale x 8 x half> %out			ret <vscale x 8 x half> %out
	}			}

				define <vscale x 8 x bfloat> @insr_bf16(<vscale x 8 x bfloat> %a, bfloat %b) {
				; CHECK-LABEL: insr_bf16:
				; CHECK: insr z0.h, h1
				; CHECK-NEXT: ret
				%out = call <vscale x 8 x bfloat> @llvm.aarch64.sve.insr.nxv8bf16(<vscale x 8 x bfloat> %a, bfloat %b)
				ret <vscale x 8 x bfloat> %out
				}

	define <vscale x 4 x float> @insr_f32(<vscale x 4 x float> %a, float %b) {			define <vscale x 4 x float> @insr_f32(<vscale x 4 x float> %a, float %b) {
	; CHECK-LABEL: insr_f32:			; CHECK-LABEL: insr_f32:
	; CHECK: insr z0.s, s1			; CHECK: insr z0.s, s1
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%out = call <vscale x 4 x float> @llvm.aarch64.sve.insr.nxv4f32(<vscale x 4 x float> %a, float %b)			%out = call <vscale x 4 x float> @llvm.aarch64.sve.insr.nxv4f32(<vscale x 4 x float> %a, float %b)
	ret <vscale x 4 x float> %out			ret <vscale x 4 x float> %out
	}			}

	▲ Show 20 Lines • Show All 167 Lines • ▼ Show 20 Lines
	declare <vscale x 4 x i32> @llvm.aarch64.sve.asrd.nxv4i32(<vscale x 4 x i1>, <vscale x 4 x i32>, i32)			declare <vscale x 4 x i32> @llvm.aarch64.sve.asrd.nxv4i32(<vscale x 4 x i1>, <vscale x 4 x i32>, i32)
	declare <vscale x 2 x i64> @llvm.aarch64.sve.asrd.nxv2i64(<vscale x 2 x i1>, <vscale x 2 x i64>, i32)			declare <vscale x 2 x i64> @llvm.aarch64.sve.asrd.nxv2i64(<vscale x 2 x i1>, <vscale x 2 x i64>, i32)

	declare <vscale x 16 x i8> @llvm.aarch64.sve.insr.nxv16i8(<vscale x 16 x i8>, i8)			declare <vscale x 16 x i8> @llvm.aarch64.sve.insr.nxv16i8(<vscale x 16 x i8>, i8)
	declare <vscale x 8 x i16> @llvm.aarch64.sve.insr.nxv8i16(<vscale x 8 x i16>, i16)			declare <vscale x 8 x i16> @llvm.aarch64.sve.insr.nxv8i16(<vscale x 8 x i16>, i16)
	declare <vscale x 4 x i32> @llvm.aarch64.sve.insr.nxv4i32(<vscale x 4 x i32>, i32)			declare <vscale x 4 x i32> @llvm.aarch64.sve.insr.nxv4i32(<vscale x 4 x i32>, i32)
	declare <vscale x 2 x i64> @llvm.aarch64.sve.insr.nxv2i64(<vscale x 2 x i64>, i64)			declare <vscale x 2 x i64> @llvm.aarch64.sve.insr.nxv2i64(<vscale x 2 x i64>, i64)
	declare <vscale x 8 x half> @llvm.aarch64.sve.insr.nxv8f16(<vscale x 8 x half>, half)			declare <vscale x 8 x half> @llvm.aarch64.sve.insr.nxv8f16(<vscale x 8 x half>, half)
				declare <vscale x 8 x bfloat> @llvm.aarch64.sve.insr.nxv8bf16(<vscale x 8 x bfloat>, bfloat)
	declare <vscale x 4 x float> @llvm.aarch64.sve.insr.nxv4f32(<vscale x 4 x float>, float)			declare <vscale x 4 x float> @llvm.aarch64.sve.insr.nxv4f32(<vscale x 4 x float>, float)
	declare <vscale x 2 x double> @llvm.aarch64.sve.insr.nxv2f64(<vscale x 2 x double>, double)			declare <vscale x 2 x double> @llvm.aarch64.sve.insr.nxv2f64(<vscale x 2 x double>, double)

	declare <vscale x 16 x i8> @llvm.aarch64.sve.lsl.nxv16i8(<vscale x 16 x i1>, <vscale x 16 x i8>, <vscale x 16 x i8>)			declare <vscale x 16 x i8> @llvm.aarch64.sve.lsl.nxv16i8(<vscale x 16 x i1>, <vscale x 16 x i8>, <vscale x 16 x i8>)
	declare <vscale x 8 x i16> @llvm.aarch64.sve.lsl.nxv8i16(<vscale x 8 x i1>, <vscale x 8 x i16>, <vscale x 8 x i16>)			declare <vscale x 8 x i16> @llvm.aarch64.sve.lsl.nxv8i16(<vscale x 8 x i1>, <vscale x 8 x i16>, <vscale x 8 x i16>)
	declare <vscale x 4 x i32> @llvm.aarch64.sve.lsl.nxv4i32(<vscale x 4 x i1>, <vscale x 4 x i32>, <vscale x 4 x i32>)			declare <vscale x 4 x i32> @llvm.aarch64.sve.lsl.nxv4i32(<vscale x 4 x i1>, <vscale x 4 x i32>, <vscale x 4 x i32>)
	declare <vscale x 2 x i64> @llvm.aarch64.sve.lsl.nxv2i64(<vscale x 2 x i1>, <vscale x 2 x i64>, <vscale x 2 x i64>)			declare <vscale x 2 x i64> @llvm.aarch64.sve.lsl.nxv2i64(<vscale x 2 x i1>, <vscale x 2 x i64>, <vscale x 2 x i64>)

	Show All 12 Lines

This is an archive of the discontinued LLVM Phabricator instance.

[sve][acle] Implement some of the C intrinsics for brain float.
ClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 272593

clang/include/clang/Basic/arm_sve.td

clang/lib/CodeGen/CGBuiltin.cpp

clang/test/CodeGen/aarch64-sve-intrinsics/acle_sve_dup.c

clang/test/CodeGen/aarch64-sve-intrinsics/acle_sve_dupq.c

clang/test/CodeGen/aarch64-sve-intrinsics/acle_sve_insr.c

llvm/lib/Target/AArch64/AArch64SVEInstrInfo.td

llvm/lib/Target/AArch64/SVEInstrFormats.td

llvm/test/CodeGen/AArch64/sve-intrinsics-dup-bfloat.ll

llvm/test/CodeGen/AArch64/sve-intrinsics-dup-x.ll

llvm/test/CodeGen/AArch64/sve-intrinsics-perm-select.ll

llvm/test/CodeGen/AArch64/sve-intrinsics-scalar-to-vec.ll

llvm/test/CodeGen/AArch64/sve-intrinsics-shifts.ll

This is an archive of the discontinued LLVM Phabricator instance.

[sve][acle] Implement some of the C intrinsics for brain float.ClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 272593

clang/include/clang/Basic/arm_sve.td

clang/lib/CodeGen/CGBuiltin.cpp

clang/test/CodeGen/aarch64-sve-intrinsics/acle_sve_dup.c

clang/test/CodeGen/aarch64-sve-intrinsics/acle_sve_dupq.c

clang/test/CodeGen/aarch64-sve-intrinsics/acle_sve_insr.c

llvm/lib/Target/AArch64/AArch64SVEInstrInfo.td

llvm/lib/Target/AArch64/SVEInstrFormats.td

llvm/test/CodeGen/AArch64/sve-intrinsics-dup-bfloat.ll

llvm/test/CodeGen/AArch64/sve-intrinsics-dup-x.ll

llvm/test/CodeGen/AArch64/sve-intrinsics-perm-select.ll

llvm/test/CodeGen/AArch64/sve-intrinsics-scalar-to-vec.ll

llvm/test/CodeGen/AArch64/sve-intrinsics-shifts.ll

[sve][acle] Implement some of the C intrinsics for brain float.
ClosedPublic