This is an archive of the discontinued LLVM Phabricator instance.

[ARM] Armv8.6-a Matrix Mul cmd line support
ClosedPublic

Authored by LukeGeeson on Apr 10 2020, 6:47 AM.

Download Raw Diff

Details

Reviewers

t.p.northover
DavidSpickett

Commits

rG740a1dd050ee: [ARM] Armv8.6-a Matrix Mul cmd line support

Summary

This patch upstreams support for the Armv8.6-a Matrix Multiplication
Extension. A summary of the features can be found here:

https://community.arm.com/developer/ip-products/processors/b/processors-ip-blog/posts/arm-architecture-developments-armv8-6-a

This patch includes:

Command line options to enable these features with +i8mm, +f32mm, or f64mm

Note: +f32mm and +f64mm are optional and so are not enabled by default

This is part of a patch series, starting with BFloat16 support and
the other components in the armv8.6a extension (in previous patches
linked in phabricator)

Based on work by:

Luke Geeson
Oliver Stannard
Luke Cheeseman

Diff Detail

Event Timeline

LukeGeeson created this revision.Apr 10 2020, 6:47 AM

Herald added a project: Restricted Project. · View Herald TranscriptApr 10 2020, 6:47 AM

Herald added subscribers: cfe-commits, danielkiss, kristof.beyls. · View Herald Transcript

LukeGeeson added a parent revision: D77874: [AArch32] Armv8.6a Matrix Mul Assembly Parser Support.Apr 10 2020, 6:47 AM

LukeGeeson added a subscriber: ostannard.Apr 10 2020, 6:54 AM

Harbormaster failed remote builds in B52671: Diff 256567!Apr 10 2020, 6:58 AM

harbour master builds, unit tests passing, failures down to linting

Note: +f32mm and +f64mm are optional and so have to be enabled by default

I think I know what you mean, but "and so are not enabled by default" would be clearer.

Also to double check, does f64mm imply f32mm? (not sure if there's an updated ARMARM yet that would tell me that)

Or in other words, does amrv8.6-a+sve imply +f32mm *and* +f64mm?

In D77875#1979980, @DavidSpickett wrote:

Note: +f32mm and +f64mm are optional and so have to be enabled by default

I think I know what you mean, but "and so are not enabled by default" would be clearer.

Also to double check, does f64mm imply f32mm? (not sure if there's an updated ARMARM yet that would tell me that)

Since these options can be enabled independently pre-8.6a in general the answer is no. I'll add a comment noting why we only only imply f32mm in AArch64.cpp

In D77875#1980488, @DavidSpickett wrote:

Or in other words, does amrv8.6-a+sve imply +f32mm *and* +f64mm?

Also no here, as an example the xml has different checks for fmmla https://developer.arm.com/docs/ddi0596/latest/a64-sve-instructions-alphabetic-order/fmmla-floating-point-matrix-multiply-accumulate

updated commit message to reflect sve=>f32/64 implication
added comment in AArch64.cpp to that effect

LukeGeeson edited the summary of this revision. (Show Details)Apr 14 2020, 8:56 AM

DavidSpickett accepted this revision.Apr 15 2020, 12:39 AM

This revision is now accepted and ready to land.Apr 15 2020, 12:39 AM

Closed by commit rG740a1dd050ee: [ARM] Armv8.6-a Matrix Mul cmd line support (authored by LukeGeeson). · Explain WhyApr 24 2020, 8:06 AM

This revision was automatically updated to reflect the committed changes.

Revision Contents

Path

Size

clang/

lib/

Driver/

ToolChains/

Arch/

AArch64.cpp

21 lines

test/

Driver/

aarch64-cpus.c

28 lines

arm-matrix-multiply.c

14 lines

llvm/

include/

llvm/

Support/

AArch64TargetParser.h

4 lines

AArch64TargetParser.def

2 lines

ARMTargetParser.h

17 lines

ARMTargetParser.def

4 lines

unittests/

Support/

TargetParserTest.cpp

6 lines

Diff 257362

clang/lib/Driver/ToolChains/Arch/AArch64.cpp

Show First 20 Lines • Show All 48 Lines • ▼ Show 20 Lines	if (Args.getLastArg(options::OPT_arch) \|\| Triple.isOSDarwin())
return Triple.getArch() == llvm::Triple::aarch64_32 ? "apple-s4"		return Triple.getArch() == llvm::Triple::aarch64_32 ? "apple-s4"
: "apple-a7";		: "apple-a7";

return "generic";		return "generic";
}		}

// Decode AArch64 features from string like +[no]featureA+[no]featureB+...		// Decode AArch64 features from string like +[no]featureA+[no]featureB+...
static bool DecodeAArch64Features(const Driver &D, StringRef text,		static bool DecodeAArch64Features(const Driver &D, StringRef text,
std::vector<StringRef> &Features) {		std::vector<StringRef> &Features,
		llvm::AArch64::ArchKind ArchKind) {
SmallVector<StringRef, 8> Split;		SmallVector<StringRef, 8> Split;
text.split(Split, StringRef("+"), -1, false);		text.split(Split, StringRef("+"), -1, false);

for (StringRef Feature : Split) {		for (StringRef Feature : Split) {
StringRef FeatureName = llvm::AArch64::getArchExtFeature(Feature);		StringRef FeatureName = llvm::AArch64::getArchExtFeature(Feature);
if (!FeatureName.empty())		if (!FeatureName.empty())
Features.push_back(FeatureName);		Features.push_back(FeatureName);
else if (Feature == "neon" \|\| Feature == "noneon")		else if (Feature == "neon" \|\| Feature == "noneon")
D.Diag(clang::diag::err_drv_no_neon_modifier);		D.Diag(clang::diag::err_drv_no_neon_modifier);
else		else
return false;		return false;

		// +sve implies +f32mm if the base architecture is v8.6A
		// it isn't the case in general that sve implies both f64mm and f32mm
		if ((ArchKind == llvm::AArch64::ArchKind::ARMV8_6A) && Feature == "sve")
		Features.push_back("+f32mm");
}		}
return true;		return true;
}		}

// Check if the CPU name and feature modifiers in -mcpu are legal. If yes,		// Check if the CPU name and feature modifiers in -mcpu are legal. If yes,
// decode CPU and feature.		// decode CPU and feature.
static bool DecodeAArch64Mcpu(const Driver &D, StringRef Mcpu, StringRef &CPU,		static bool DecodeAArch64Mcpu(const Driver &D, StringRef Mcpu, StringRef &CPU,
std::vector<StringRef> &Features) {		std::vector<StringRef> &Features) {
std::pair<StringRef, StringRef> Split = Mcpu.split("+");		std::pair<StringRef, StringRef> Split = Mcpu.split("+");
CPU = Split.first;		CPU = Split.first;
		llvm::AArch64::ArchKind ArchKind = llvm::AArch64::ArchKind::ARMV8A;

if (CPU == "native")		if (CPU == "native")
CPU = llvm::sys::getHostCPUName();		CPU = llvm::sys::getHostCPUName();

if (CPU == "generic") {		if (CPU == "generic") {
Features.push_back("+neon");		Features.push_back("+neon");
} else {		} else {
llvm::AArch64::ArchKind ArchKind = llvm::AArch64::parseCPUArch(CPU);		ArchKind = llvm::AArch64::parseCPUArch(CPU);
if (!llvm::AArch64::getArchFeatures(ArchKind, Features))		if (!llvm::AArch64::getArchFeatures(ArchKind, Features))
return false;		return false;

unsigned Extension = llvm::AArch64::getDefaultExtensions(CPU, ArchKind);		unsigned Extension = llvm::AArch64::getDefaultExtensions(CPU, ArchKind);
if (!llvm::AArch64::getExtensionFeatures(Extension, Features))		if (!llvm::AArch64::getExtensionFeatures(Extension, Features))
return false;		return false;
}		}

if (Split.second.size() && !DecodeAArch64Features(D, Split.second, Features))		if (Split.second.size() &&
		!DecodeAArch64Features(D, Split.second, Features, ArchKind))
return false;		return false;

return true;		return true;
}		}

static bool		static bool
getAArch64ArchFeaturesFromMarch(const Driver &D, StringRef March,		getAArch64ArchFeaturesFromMarch(const Driver &D, StringRef March,
const ArgList &Args,		const ArgList &Args,
std::vector<StringRef> &Features) {		std::vector<StringRef> &Features) {
std::string MarchLowerCase = March.lower();		std::string MarchLowerCase = March.lower();
std::pair<StringRef, StringRef> Split = StringRef(MarchLowerCase).split("+");		std::pair<StringRef, StringRef> Split = StringRef(MarchLowerCase).split("+");

llvm::AArch64::ArchKind ArchKind = llvm::AArch64::parseArch(Split.first);		llvm::AArch64::ArchKind ArchKind = llvm::AArch64::parseArch(Split.first);
if (ArchKind == llvm::AArch64::ArchKind::INVALID \|\|		if (ArchKind == llvm::AArch64::ArchKind::INVALID \|\|
!llvm::AArch64::getArchFeatures(ArchKind, Features) \|\|		!llvm::AArch64::getArchFeatures(ArchKind, Features) \|\|
(Split.second.size() && !DecodeAArch64Features(D, Split.second, Features)))		(Split.second.size() &&
		!DecodeAArch64Features(D, Split.second, Features, ArchKind)))
return false;		return false;

return true;		return true;
}		}

static bool		static bool
getAArch64ArchFeaturesFromMcpu(const Driver &D, StringRef Mcpu,		getAArch64ArchFeaturesFromMcpu(const Driver &D, StringRef Mcpu,
const ArgList &Args,		const ArgList &Args,
▲ Show 20 Lines • Show All 313 Lines • Show Last 20 Lines

clang/test/Driver/aarch64-cpus.c

	Show First 20 Lines • Show All 630 Lines • ▼ Show 20 Lines
	// optional feature for any implementation of Armv8.2-A to Armv8.5-A (inclusive)			// optional feature for any implementation of Armv8.2-A to Armv8.5-A (inclusive)
	// RUN: %clang -target aarch64 -march=armv8.5a+bf16 -### -c %s 2>&1 \| FileCheck -check-prefix=GENERICV85A-BF16 %s			// RUN: %clang -target aarch64 -march=armv8.5a+bf16 -### -c %s 2>&1 \| FileCheck -check-prefix=GENERICV85A-BF16 %s
	// GENERICV85A-BF16: "-target-feature" "+bf16"			// GENERICV85A-BF16: "-target-feature" "+bf16"
	// RUN: %clang -target aarch64 -march=armv8.5a+bf16+nobf16 -### -c %s 2>&1 \| FileCheck -check-prefix=GENERICV85A-BF16-NO-BF16 %s			// RUN: %clang -target aarch64 -march=armv8.5a+bf16+nobf16 -### -c %s 2>&1 \| FileCheck -check-prefix=GENERICV85A-BF16-NO-BF16 %s
	// GENERICV85A-BF16-NO-BF16: "-target-feature" "-bf16"			// GENERICV85A-BF16-NO-BF16: "-target-feature" "-bf16"
	// RUN: %clang -target aarch64 -march=armv8.5a+bf16+sve -### -c %s 2>&1 \| FileCheck -check-prefixes=GENERICV85A-BF16-SVE %s			// RUN: %clang -target aarch64 -march=armv8.5a+bf16+sve -### -c %s 2>&1 \| FileCheck -check-prefixes=GENERICV85A-BF16-SVE %s
	// GENERICV85A-BF16-SVE: "-target-feature" "+bf16" "-target-feature" "+sve"			// GENERICV85A-BF16-SVE: "-target-feature" "+bf16" "-target-feature" "+sve"

				// The 8-bit integer matrix multiply extension is a mandatory component of the
				// Armv8.6-A extensions, but is permitted as an optional feature for any
				// implementation of Armv8.2-A to Armv8.5-A (inclusive)
				// RUN: %clang -target aarch64 -march=armv8.5a -### -c %s 2>&1 \| FileCheck -check-prefix=NO-I8MM %s
				// RUN: %clang -target aarch64 -march=armv8.5a+i8mm -### -c %s 2>&1 \| FileCheck -check-prefix=I8MM %s
				// NO-I8MM-NOT: "-target-feature" "+i8mm"
				// I8MM: "-target-feature" "+i8mm"

				// The 32-bit floating point matrix multiply extension is enabled by default
				// for armv8.6-a targets (or later) with SVE, and can optionally be enabled for
				// any target from armv8.2a onwards (we don't enforce not using it with earlier
				// targets).
				// RUN: %clang -target aarch64 -march=armv8.6a -### -c %s 2>&1 \| FileCheck -check-prefix=NO-F32MM %s
				// RUN: %clang -target aarch64 -march=armv8.6a+sve -### -c %s 2>&1 \| FileCheck -check-prefix=F32MM %s
				// RUN: %clang -target aarch64 -march=armv8.5a+f32mm -### -c %s 2>&1 \| FileCheck -check-prefix=F32MM %s
				// NO-F32MM-NOT: "-target-feature" "+f32mm"
				// F32MM: "-target-feature" "+f32mm"

				// The 64-bit floating point matrix multiply extension is not currently enabled
				// by default for any targets, because it requires an SVE vector length >= 256
				// bits. When we add a CPU which has that, then it can be enabled by default,
				// but for now it can only be used by adding the +f64mm feature.
				// RUN: %clang -target aarch64 -march=armv8.6a -### -c %s 2>&1 \| FileCheck -check-prefix=NO-F64MM %s
				// RUN: %clang -target aarch64 -march=armv8.6a+sve -### -c %s 2>&1 \| FileCheck -check-prefix=NO-F64MM %s
				// RUN: %clang -target aarch64 -march=armv8.6a+f64mm -### -c %s 2>&1 \| FileCheck -check-prefix=F64MM %s
				// NO-F64MM-NOT: "-target-feature" "+f64mm"
				// F64MM: "-target-feature" "+f64mm"

	// fullfp16 is off by default for v8a, feature must not be mentioned			// fullfp16 is off by default for v8a, feature must not be mentioned
	// RUN: %clang -target aarch64 -march=armv8a -### -c %s 2>&1 \| FileCheck -check-prefix=V82ANOFP16 -check-prefix=GENERIC %s			// RUN: %clang -target aarch64 -march=armv8a -### -c %s 2>&1 \| FileCheck -check-prefix=V82ANOFP16 -check-prefix=GENERIC %s
	// RUN: %clang -target aarch64 -march=armv8-a -### -c %s 2>&1 \| FileCheck -check-prefix=V82ANOFP16 -check-prefix=GENERIC %s			// RUN: %clang -target aarch64 -march=armv8-a -### -c %s 2>&1 \| FileCheck -check-prefix=V82ANOFP16 -check-prefix=GENERIC %s
	// V82ANOFP16-NOT: "-target-feature" "{{[+-]}}fp16fml"			// V82ANOFP16-NOT: "-target-feature" "{{[+-]}}fp16fml"
	// V82ANOFP16-NOT: "-target-feature" "{{[+-]}}fullfp16"			// V82ANOFP16-NOT: "-target-feature" "{{[+-]}}fullfp16"

	// RAS is on by default for v8.2a, but can be disabled by +noras			// RAS is on by default for v8.2a, but can be disabled by +noras
	// RUN: %clang -target aarch64 -march=armv8.2a -### -c %s 2>&1 \| FileCheck -check-prefix=V82ARAS -check-prefix=GENERICV82A %s			// RUN: %clang -target aarch64 -march=armv8.2a -### -c %s 2>&1 \| FileCheck -check-prefix=V82ARAS -check-prefix=GENERICV82A %s
	▲ Show 20 Lines • Show All 41 Lines • Show Last 20 Lines

clang/test/Driver/arm-matrix-multiply.c

This file was added.

				// RUN: %clang -### -target arm-none-none-eabi -march=armv8.5a+i8mm %s 2>&1 \| FileCheck %s
				// RUN: %clang -### -target aarch64-none-none-eabi -march=armv8.5a+i8mm %s 2>&1 \| FileCheck %s
				// CHECK: "-target-feature" "+i8mm"
				// CHECK-NOT: "-target-feature" "-i8mm"

				// RUN: %clang -### -target arm-none-none-eabi -march=armv8.6a+noi8mm %s 2>&1 \| FileCheck %s --check-prefix=NOI8MM
				// RUN: %clang -### -target aarch64-none-none-eabi -march=armv8.6a+noi8mm %s 2>&1 \| FileCheck %s --check-prefix=NOI8MM
				// NOI8MM: "-target-feature" "-i8mm"
				// NOI8MM-NOT: "-target-feature" "+i8mm"

				// RUN: %clang -### -target arm-none-none-eabi %s 2>&1 \| FileCheck %s --check-prefix=ABSENT
				// RUN: %clang -### -target aarch64-none-none-eabi %s 2>&1 \| FileCheck %s --check-prefix=ABSENT
				// ABSENT-NOT: "-target-feature" "+i8mm"
				// ABSENT-NOT: "-target-feature" "-i8mm"

llvm/include/llvm/Support/AArch64TargetParser.h

Show All 18 Lines
#include "llvm/Support/ARMTargetParser.h"		#include "llvm/Support/ARMTargetParser.h"
#include <vector>		#include <vector>

// FIXME:This should be made into class design,to avoid dupplication.		// FIXME:This should be made into class design,to avoid dupplication.
namespace llvm {		namespace llvm {
namespace AArch64 {		namespace AArch64 {

// Arch extension modifiers for CPUs.		// Arch extension modifiers for CPUs.
enum ArchExtKind : unsigned {		enum ArchExtKind : uint64_t {
AEK_INVALID = 0,		AEK_INVALID = 0,
AEK_NONE = 1,		AEK_NONE = 1,
AEK_CRC = 1 << 1,		AEK_CRC = 1 << 1,
AEK_CRYPTO = 1 << 2,		AEK_CRYPTO = 1 << 2,
AEK_FP = 1 << 3,		AEK_FP = 1 << 3,
AEK_SIMD = 1 << 4,		AEK_SIMD = 1 << 4,
AEK_FP16 = 1 << 5,		AEK_FP16 = 1 << 5,
AEK_PROFILE = 1 << 6,		AEK_PROFILE = 1 << 6,
Show All 16 Lines	enum ArchExtKind : uint64_t {
AEK_SVE2 = 1 << 23,		AEK_SVE2 = 1 << 23,
AEK_SVE2AES = 1 << 24,		AEK_SVE2AES = 1 << 24,
AEK_SVE2SM4 = 1 << 25,		AEK_SVE2SM4 = 1 << 25,
AEK_SVE2SHA3 = 1 << 26,		AEK_SVE2SHA3 = 1 << 26,
AEK_SVE2BITPERM = 1 << 27,		AEK_SVE2BITPERM = 1 << 27,
AEK_TME = 1 << 28,		AEK_TME = 1 << 28,
AEK_BF16 = 1 << 29,		AEK_BF16 = 1 << 29,
AEK_I8MM = 1 << 30,		AEK_I8MM = 1 << 30,
		AEK_F32MM = 1ULL << 31,
		AEK_F64MM = 1ULL << 32,
};		};

enum class ArchKind {		enum class ArchKind {
#define AARCH64_ARCH(NAME, ID, CPU_ATTR, SUB_ARCH, ARCH_ATTR, ARCH_FPU, ARCH_BASE_EXT) ID,		#define AARCH64_ARCH(NAME, ID, CPU_ATTR, SUB_ARCH, ARCH_ATTR, ARCH_FPU, ARCH_BASE_EXT) ID,
#include "AArch64TargetParser.def"		#include "AArch64TargetParser.def"
};		};

const ARM::ArchNames<ArchKind> AArch64ARCHNames[] = {		const ARM::ArchNames<ArchKind> AArch64ARCHNames[] = {
▲ Show 20 Lines • Show All 73 Lines • Show Last 20 Lines

llvm/include/llvm/Support/AArch64TargetParser.def

	Show First 20 Lines • Show All 82 Lines • ▼ Show 20 Lines
	AARCH64_ARCH_EXT_NAME("rcpc", AArch64::AEK_RCPC, "+rcpc", "-rcpc")			AARCH64_ARCH_EXT_NAME("rcpc", AArch64::AEK_RCPC, "+rcpc", "-rcpc")
	AARCH64_ARCH_EXT_NAME("rng", AArch64::AEK_RAND, "+rand", "-rand")			AARCH64_ARCH_EXT_NAME("rng", AArch64::AEK_RAND, "+rand", "-rand")
	AARCH64_ARCH_EXT_NAME("memtag", AArch64::AEK_MTE, "+mte", "-mte")			AARCH64_ARCH_EXT_NAME("memtag", AArch64::AEK_MTE, "+mte", "-mte")
	AARCH64_ARCH_EXT_NAME("ssbs", AArch64::AEK_SSBS, "+ssbs", "-ssbs")			AARCH64_ARCH_EXT_NAME("ssbs", AArch64::AEK_SSBS, "+ssbs", "-ssbs")
	AARCH64_ARCH_EXT_NAME("sb", AArch64::AEK_SB, "+sb", "-sb")			AARCH64_ARCH_EXT_NAME("sb", AArch64::AEK_SB, "+sb", "-sb")
	AARCH64_ARCH_EXT_NAME("predres", AArch64::AEK_PREDRES, "+predres", "-predres")			AARCH64_ARCH_EXT_NAME("predres", AArch64::AEK_PREDRES, "+predres", "-predres")
	AARCH64_ARCH_EXT_NAME("bf16", AArch64::AEK_BF16, "+bf16", "-bf16")			AARCH64_ARCH_EXT_NAME("bf16", AArch64::AEK_BF16, "+bf16", "-bf16")
	AARCH64_ARCH_EXT_NAME("i8mm", AArch64::AEK_I8MM, "+i8mm", "-i8mm")			AARCH64_ARCH_EXT_NAME("i8mm", AArch64::AEK_I8MM, "+i8mm", "-i8mm")
				AARCH64_ARCH_EXT_NAME("f32mm", AArch64::AEK_F32MM, "+f32mm", "-f32mm")
				AARCH64_ARCH_EXT_NAME("f64mm", AArch64::AEK_F64MM, "+f64mm", "-f64mm")
	AARCH64_ARCH_EXT_NAME("tme", AArch64::AEK_TME, "+tme", "-tme")			AARCH64_ARCH_EXT_NAME("tme", AArch64::AEK_TME, "+tme", "-tme")
	#undef AARCH64_ARCH_EXT_NAME			#undef AARCH64_ARCH_EXT_NAME

	#ifndef AARCH64_CPU_NAME			#ifndef AARCH64_CPU_NAME
	#define AARCH64_CPU_NAME(NAME, ID, DEFAULT_FPU, IS_DEFAULT, DEFAULT_EXT)			#define AARCH64_CPU_NAME(NAME, ID, DEFAULT_FPU, IS_DEFAULT, DEFAULT_EXT)
	#endif			#endif
	AARCH64_CPU_NAME("cortex-a34", ARMV8A, FK_CRYPTO_NEON_FP_ARMV8, false,			AARCH64_CPU_NAME("cortex-a34", ARMV8A, FK_CRYPTO_NEON_FP_ARMV8, false,
	(AArch64::AEK_CRC))			(AArch64::AEK_CRC))
	▲ Show 20 Lines • Show All 84 Lines • Show Last 20 Lines

llvm/include/llvm/Support/ARMTargetParser.h

Show First 20 Lines • Show All 41 Lines • ▼ Show 20 Lines	enum ArchExtKind : uint64_t {
AEK_DOTPROD = 1 << 13,		AEK_DOTPROD = 1 << 13,
AEK_SHA2 = 1 << 14,		AEK_SHA2 = 1 << 14,
AEK_AES = 1 << 15,		AEK_AES = 1 << 15,
AEK_FP16FML = 1 << 16,		AEK_FP16FML = 1 << 16,
AEK_SB = 1 << 17,		AEK_SB = 1 << 17,
AEK_FP_DP = 1 << 18,		AEK_FP_DP = 1 << 18,
AEK_LOB = 1 << 19,		AEK_LOB = 1 << 19,
AEK_BF16 = 1 << 20,		AEK_BF16 = 1 << 20,
AEK_CDECP0 = 1 << 21,		AEK_I8MM = 1 << 21,
AEK_CDECP1 = 1 << 22,		AEK_CDECP0 = 1 << 22,
AEK_CDECP2 = 1 << 23,		AEK_CDECP1 = 1 << 23,
AEK_CDECP3 = 1 << 24,		AEK_CDECP2 = 1 << 24,
AEK_CDECP4 = 1 << 25,		AEK_CDECP3 = 1 << 25,
AEK_CDECP5 = 1 << 26,		AEK_CDECP4 = 1 << 26,
AEK_CDECP6 = 1 << 27,		AEK_CDECP5 = 1 << 27,
AEK_CDECP7 = 1 << 28,		AEK_CDECP6 = 1 << 28,
		AEK_CDECP7 = 1 << 29,

// Unsupported extensions.		// Unsupported extensions.
AEK_OS = 1ULL << 59,		AEK_OS = 1ULL << 59,
AEK_IWMMXT = 1ULL << 60,		AEK_IWMMXT = 1ULL << 60,
AEK_IWMMXT2 = 1ULL << 61,		AEK_IWMMXT2 = 1ULL << 61,
AEK_MAVERICK = 1ULL << 62,		AEK_MAVERICK = 1ULL << 62,
AEK_XSCALE = 1ULL << 63,		AEK_XSCALE = 1ULL << 63,
};		};
▲ Show 20 Lines • Show All 212 Lines • Show Last 20 Lines

llvm/include/llvm/Support/ARMTargetParser.def

Show First 20 Lines • Show All 110 Lines • ▼ Show 20 Lines	ARM_ARCH("armv8.5-a", ARMV8_5A, "8.5-A", "v8.5a",
ARMBuildAttrs::CPUArch::v8_A, FK_CRYPTO_NEON_FP_ARMV8,		ARMBuildAttrs::CPUArch::v8_A, FK_CRYPTO_NEON_FP_ARMV8,
(ARM::AEK_SEC \| ARM::AEK_MP \| ARM::AEK_VIRT \| ARM::AEK_HWDIVARM \|		(ARM::AEK_SEC \| ARM::AEK_MP \| ARM::AEK_VIRT \| ARM::AEK_HWDIVARM \|
ARM::AEK_HWDIVTHUMB \| ARM::AEK_DSP \| ARM::AEK_CRC \| ARM::AEK_RAS \|		ARM::AEK_HWDIVTHUMB \| ARM::AEK_DSP \| ARM::AEK_CRC \| ARM::AEK_RAS \|
ARM::AEK_DOTPROD))		ARM::AEK_DOTPROD))
ARM_ARCH("armv8.6-a", ARMV8_6A, "8.6-A", "v8.6a",		ARM_ARCH("armv8.6-a", ARMV8_6A, "8.6-A", "v8.6a",
ARMBuildAttrs::CPUArch::v8_A, FK_CRYPTO_NEON_FP_ARMV8,		ARMBuildAttrs::CPUArch::v8_A, FK_CRYPTO_NEON_FP_ARMV8,
(ARM::AEK_SEC \| ARM::AEK_MP \| ARM::AEK_VIRT \| ARM::AEK_HWDIVARM \|		(ARM::AEK_SEC \| ARM::AEK_MP \| ARM::AEK_VIRT \| ARM::AEK_HWDIVARM \|
ARM::AEK_HWDIVTHUMB \| ARM::AEK_DSP \| ARM::AEK_CRC \| ARM::AEK_RAS \|		ARM::AEK_HWDIVTHUMB \| ARM::AEK_DSP \| ARM::AEK_CRC \| ARM::AEK_RAS \|
ARM::AEK_DOTPROD \| ARM::AEK_BF16 \| ARM::AEK_SHA2 \| ARM::AEK_AES))		ARM::AEK_DOTPROD \| ARM::AEK_BF16 \| ARM::AEK_SHA2 \| ARM::AEK_AES \|
		ARM::AEK_I8MM))
ARM_ARCH("armv8-r", ARMV8R, "8-R", "v8r", ARMBuildAttrs::CPUArch::v8_R,		ARM_ARCH("armv8-r", ARMV8R, "8-R", "v8r", ARMBuildAttrs::CPUArch::v8_R,
FK_NEON_FP_ARMV8,		FK_NEON_FP_ARMV8,
(ARM::AEK_MP \| ARM::AEK_VIRT \| ARM::AEK_HWDIVARM \| ARM::AEK_HWDIVTHUMB \|		(ARM::AEK_MP \| ARM::AEK_VIRT \| ARM::AEK_HWDIVARM \| ARM::AEK_HWDIVTHUMB \|
ARM::AEK_DSP \| ARM::AEK_CRC))		ARM::AEK_DSP \| ARM::AEK_CRC))
ARM_ARCH("armv8-m.base", ARMV8MBaseline, "8-M.Baseline", "v8m.base",		ARM_ARCH("armv8-m.base", ARMV8MBaseline, "8-M.Baseline", "v8m.base",
ARMBuildAttrs::CPUArch::v8_M_Base, FK_NONE, ARM::AEK_HWDIVTHUMB)		ARMBuildAttrs::CPUArch::v8_M_Base, FK_NONE, ARM::AEK_HWDIVTHUMB)
ARM_ARCH("armv8-m.main", ARMV8MMainline, "8-M.Mainline", "v8m.main",		ARM_ARCH("armv8-m.main", ARMV8MMainline, "8-M.Mainline", "v8m.main",
ARMBuildAttrs::CPUArch::v8_M_Main, FK_FPV5_D16, ARM::AEK_HWDIVTHUMB)		ARMBuildAttrs::CPUArch::v8_M_Main, FK_FPV5_D16, ARM::AEK_HWDIVTHUMB)
Show All 38 Lines
ARM_ARCH_EXT_NAME("os", ARM::AEK_OS, nullptr, nullptr)		ARM_ARCH_EXT_NAME("os", ARM::AEK_OS, nullptr, nullptr)
ARM_ARCH_EXT_NAME("iwmmxt", ARM::AEK_IWMMXT, nullptr, nullptr)		ARM_ARCH_EXT_NAME("iwmmxt", ARM::AEK_IWMMXT, nullptr, nullptr)
ARM_ARCH_EXT_NAME("iwmmxt2", ARM::AEK_IWMMXT2, nullptr, nullptr)		ARM_ARCH_EXT_NAME("iwmmxt2", ARM::AEK_IWMMXT2, nullptr, nullptr)
ARM_ARCH_EXT_NAME("maverick", ARM::AEK_MAVERICK, nullptr, nullptr)		ARM_ARCH_EXT_NAME("maverick", ARM::AEK_MAVERICK, nullptr, nullptr)
ARM_ARCH_EXT_NAME("xscale", ARM::AEK_XSCALE, nullptr, nullptr)		ARM_ARCH_EXT_NAME("xscale", ARM::AEK_XSCALE, nullptr, nullptr)
ARM_ARCH_EXT_NAME("fp16fml", ARM::AEK_FP16FML, "+fp16fml", "-fp16fml")		ARM_ARCH_EXT_NAME("fp16fml", ARM::AEK_FP16FML, "+fp16fml", "-fp16fml")
ARM_ARCH_EXT_NAME("bf16", ARM::AEK_BF16, "+bf16", "-bf16")		ARM_ARCH_EXT_NAME("bf16", ARM::AEK_BF16, "+bf16", "-bf16")
ARM_ARCH_EXT_NAME("sb", ARM::AEK_SB, "+sb", "-sb")		ARM_ARCH_EXT_NAME("sb", ARM::AEK_SB, "+sb", "-sb")
		ARM_ARCH_EXT_NAME("i8mm", ARM::AEK_I8MM, "+i8mm", "-i8mm")
ARM_ARCH_EXT_NAME("lob", ARM::AEK_LOB, "+lob", "-lob")		ARM_ARCH_EXT_NAME("lob", ARM::AEK_LOB, "+lob", "-lob")
ARM_ARCH_EXT_NAME("cdecp0", ARM::AEK_CDECP0, "+cdecp0", "-cdecp0")		ARM_ARCH_EXT_NAME("cdecp0", ARM::AEK_CDECP0, "+cdecp0", "-cdecp0")
ARM_ARCH_EXT_NAME("cdecp1", ARM::AEK_CDECP1, "+cdecp1", "-cdecp1")		ARM_ARCH_EXT_NAME("cdecp1", ARM::AEK_CDECP1, "+cdecp1", "-cdecp1")
ARM_ARCH_EXT_NAME("cdecp2", ARM::AEK_CDECP2, "+cdecp2", "-cdecp2")		ARM_ARCH_EXT_NAME("cdecp2", ARM::AEK_CDECP2, "+cdecp2", "-cdecp2")
ARM_ARCH_EXT_NAME("cdecp3", ARM::AEK_CDECP3, "+cdecp3", "-cdecp3")		ARM_ARCH_EXT_NAME("cdecp3", ARM::AEK_CDECP3, "+cdecp3", "-cdecp3")
ARM_ARCH_EXT_NAME("cdecp4", ARM::AEK_CDECP4, "+cdecp4", "-cdecp4")		ARM_ARCH_EXT_NAME("cdecp4", ARM::AEK_CDECP4, "+cdecp4", "-cdecp4")
ARM_ARCH_EXT_NAME("cdecp5", ARM::AEK_CDECP5, "+cdecp5", "-cdecp5")		ARM_ARCH_EXT_NAME("cdecp5", ARM::AEK_CDECP5, "+cdecp5", "-cdecp5")
ARM_ARCH_EXT_NAME("cdecp6", ARM::AEK_CDECP6, "+cdecp6", "-cdecp6")		ARM_ARCH_EXT_NAME("cdecp6", ARM::AEK_CDECP6, "+cdecp6", "-cdecp6")
▲ Show 20 Lines • Show All 128 Lines • Show Last 20 Lines

llvm/unittests/Support/TargetParserTest.cpp

Show First 20 Lines • Show All 630 Lines • ▼ Show 20 Lines	const char *ArchExt[][4] = {{"crc", "nocrc", "+crc", "-crc"},
{"ras", "noras", "+ras", "-ras"},		{"ras", "noras", "+ras", "-ras"},
{"dotprod", "nodotprod", "+dotprod", "-dotprod"},		{"dotprod", "nodotprod", "+dotprod", "-dotprod"},
{"os", "noos", nullptr, nullptr},		{"os", "noos", nullptr, nullptr},
{"iwmmxt", "noiwmmxt", nullptr, nullptr},		{"iwmmxt", "noiwmmxt", nullptr, nullptr},
{"iwmmxt2", "noiwmmxt2", nullptr, nullptr},		{"iwmmxt2", "noiwmmxt2", nullptr, nullptr},
{"maverick", "maverick", nullptr, nullptr},		{"maverick", "maverick", nullptr, nullptr},
{"xscale", "noxscale", nullptr, nullptr},		{"xscale", "noxscale", nullptr, nullptr},
{"sb", "nosb", "+sb", "-sb"},		{"sb", "nosb", "+sb", "-sb"},
		{"i8mm", "noi8mm", "+i8mm", "-i8mm"},
{"mve", "nomve", "+mve", "-mve"},		{"mve", "nomve", "+mve", "-mve"},
{"mve.fp", "nomve.fp", "+mve.fp", "-mve.fp"}};		{"mve.fp", "nomve.fp", "+mve.fp", "-mve.fp"}};

for (unsigned i = 0; i < array_lengthof(ArchExt); i++) {		for (unsigned i = 0; i < array_lengthof(ArchExt); i++) {
EXPECT_EQ(StringRef(ArchExt[i][2]), ARM::getArchExtFeature(ArchExt[i][0]));		EXPECT_EQ(StringRef(ArchExt[i][2]), ARM::getArchExtFeature(ArchExt[i][0]));
EXPECT_EQ(StringRef(ArchExt[i][3]), ARM::getArchExtFeature(ArchExt[i][1]));		EXPECT_EQ(StringRef(ArchExt[i][3]), ARM::getArchExtFeature(ArchExt[i][1]));
}		}
}		}
▲ Show 20 Lines • Show All 578 Lines • ▼ Show 20 Lines	const char *ArchExt[][4] = {{"crc", "nocrc", "+crc", "-crc"},
"+sve2-bitperm", "-sve2-bitperm"},		"+sve2-bitperm", "-sve2-bitperm"},
{"dotprod", "nodotprod", "+dotprod", "-dotprod"},		{"dotprod", "nodotprod", "+dotprod", "-dotprod"},
{"rcpc", "norcpc", "+rcpc", "-rcpc" },		{"rcpc", "norcpc", "+rcpc", "-rcpc" },
{"rng", "norng", "+rand", "-rand"},		{"rng", "norng", "+rand", "-rand"},
{"memtag", "nomemtag", "+mte", "-mte"},		{"memtag", "nomemtag", "+mte", "-mte"},
{"tme", "notme", "+tme", "-tme"},		{"tme", "notme", "+tme", "-tme"},
{"ssbs", "nossbs", "+ssbs", "-ssbs"},		{"ssbs", "nossbs", "+ssbs", "-ssbs"},
{"sb", "nosb", "+sb", "-sb"},		{"sb", "nosb", "+sb", "-sb"},
{"predres", "nopredres", "+predres", "-predres"}		{"predres", "nopredres", "+predres", "-predres"},
		{"i8mm", "noi8mm", "+i8mm", "-i8mm"},
		{"f32mm", "nof32mm", "+f32mm", "-f32mm"},
		{"f64mm", "nof64mm", "+f64mm", "-f64mm"},
};		};

for (unsigned i = 0; i < array_lengthof(ArchExt); i++) {		for (unsigned i = 0; i < array_lengthof(ArchExt); i++) {
EXPECT_EQ(StringRef(ArchExt[i][2]),		EXPECT_EQ(StringRef(ArchExt[i][2]),
AArch64::getArchExtFeature(ArchExt[i][0]));		AArch64::getArchExtFeature(ArchExt[i][0]));
EXPECT_EQ(StringRef(ArchExt[i][3]),		EXPECT_EQ(StringRef(ArchExt[i][3]),
AArch64::getArchExtFeature(ArchExt[i][1]));		AArch64::getArchExtFeature(ArchExt[i][1]));
}		}
}		}
}		}