This is an archive of the discontinued LLVM Phabricator instance.

Paths

Table of Contentst

-
clang/
-
lib/Basic/Targets/
-
Basic/
-
Targets/
-
AArch64.h
1/2
AArch64.cpp
-
ARM.cpp
-
test/
-
Driver/
1/2
aarch64-cpus.c
-
arm-cortex-cpus.c
-
Preprocessor/
-
arm-target-features.c
-
llvm/
-
include/llvm/
-
llvm/
-
ADT/
-
Triple.h
-
Support/
-
AArch64TargetParser.h
2/4
AArch64TargetParser.def
-
ARMTargetParser.h
-
ARMTargetParser.def
-
lib/
-
Support/
-
AArch64TargetParser.cpp
-
ARMTargetParser.cpp
-
Triple.cpp
-
Target/
-
AArch64/
-
AArch64.td
6/6
AArch64InstrFormats.td
-
AArch64InstrInfo.td
-
AArch64SVEInstrInfo.td
-
AArch64Subtarget.h
-
AsmParser/
-
AArch64AsmParser.cpp
-
SVEInstrFormats.td
-
ARM/
1/1
ARM.td
2/2
ARMInstrNEON.td
-
ARMInstrVFP.td
-
ARMPredicates.td
1/1
ARMSubtarget.h
-
AsmParser/
-
ARMAsmParser.cpp
-
MCTargetDesc/
-
ARMELFStreamer.cpp
-
test/MC/
-
MC/
-
AArch64/
-
SVE/
-
bfcvt-diagnostics.s
-
bfcvt.s
-
bfcvtnt-diagnostics.s
-
bfcvtnt.s
-
bfdot-diagnostics.s
-
bfdot.s
-
bfmlal-diagnostics.s
-
bfmlal.s
-
bfmmla-diagnostics.s
-
bfmmla.s
-
armv8.6a-bf16.s
-
ARM/
-
bfloat16-a32-errors.s
-
bfloat16-a32-errors2.s
-
bfloat16-a32.s
-
bfloat16-t32-errors.s
-
bfloat16-t32.s
-
Disassembler/
-
AArch64/
-
armv8.6a-bf16.txt
-
ARM/
-
bfloat16-a32_1.txt
-
bfloat16-a32_2.txt
-
bfloat16-t32.txt
-
bfloat16-t32_errors.txt
-
unittests/Support/
-
Support/
-
TargetParserTest.cpp

Differential D76062

[PATCH] [ARM] ARMv8.6-a command-line + BFloat16 Asm Support
ClosedPublic

Authored by stuij on Mar 12 2020, 6:41 AM.

Download Raw Diff

Details

Reviewers

SjoerdMeijer
craig.topper
rjmccall
jfb
LukeGeeson
eli.friedman
fhahn
aemerson

Commits

rG71ae267d1f41: [PATCH] [ARM] ARMv8.6-a command-line + BFloat16 Asm Support

Summary

This patch introduces command-line support for the Armv8.6-a architecture and assembly support for BFloat16. Details can be found
https://community.arm.com/developer/ip-products/processors/b/processors-ip-blog/posts/arm-architecture-developments-armv8-6-a

in addition to the GCC patch for the 8..6-a CLI:
https://gcc.gnu.org/legacy-ml/gcc-patches/2019-11/msg02647.html

In detail this patch

march options for armv8.6-a
BFloat16 assembly

This is part of a patch series, starting with command-line and Bfloat16
assembly support. The subsequent patches will upstream intrinsics
support for BFloat16, followed by Matrix Multiplication and the
remaining Virtualization features of the armv8.6-a architecture.

Based on work by:

labrinea
MarkMurrayARM
Luke Cheeseman
Javed Asbar
Mikhail Maltsev
Luke Geeson

Diff Detail

Repository: rG LLVM Github Monorepo

Event Timeline

LukeGeeson created this revision.Mar 12 2020, 6:41 AM

Herald added projects: Restricted Project, Restricted Project. · View Herald TranscriptMar 12 2020, 6:41 AM

Herald added subscribers: llvm-commits, cfe-commits, danielkiss and 3 others. · View Herald Transcript

LukeGeeson edited the summary of this revision. (Show Details)Mar 12 2020, 6:42 AM

LukeGeeson edited the summary of this revision. (Show Details)Mar 12 2020, 6:59 AM

LukeGeeson edited the summary of this revision. (Show Details)Mar 12 2020, 7:38 AM

Harbormaster failed remote builds in B48981: Diff 249918!Mar 12 2020, 8:08 AM

LukeGeeson added a child revision: D76077: [ARM] Add __bf16 as new Bfloat16 C Type.Mar 12 2020, 10:01 AM

jfb added a reviewer: jfb.Mar 12 2020, 11:22 AM

Harbormaster completed remote builds in B48981: Diff 249918.Mar 14 2020, 8:01 AM

stuij added a subscriber: stuij.Mar 16 2020, 10:30 AM

Commandeered because Luke is on vacation.

Updating D76062: [PATCH] [ARM] ARMv8.6-a command-line + BFloat16 Asm Support

follow changes in patch: [TableGen] Support combining AssemblerPredicates with ORs

stuij edited the summary of this revision. (Show Details)Mar 16 2020, 2:21 PM

Harbormaster failed remote builds in B49362: Diff 250630!Mar 16 2020, 3:52 PM

The failing test is not related to this ticket. It is caused by https://reviews.llvm.org/D70720/new/#1925184, Oliver Stannard is looking into it.

SjoerdMeijer added inline comments.Mar 18 2020, 3:54 AM

clang/lib/Basic/Targets/AArch64.cpp
189	Can you be more specific, what are we missing here? Hmm, now I see the same above: "FIXME: Armv8.5 makes some extensions mandatory. Handle them here." While you're at it, can you also change that?
llvm/include/llvm/Support/AArch64TargetParser.def
52	just double checking (because I can't remember): BF16 is a mandatory extension?
llvm/lib/Target/ARM/ARM.td
532	it's implied here, so looks mandatory.
llvm/lib/Target/ARM/ARMSubtarget.h
260	nit: BFloat16 floating point -> BFloat16 floating point operations

addressing Sjoerd's comments on mandatory defines and rewording

stuij marked an inline comment as done.Mar 19 2020, 4:06 AM

stuij added inline comments.

clang/lib/Basic/Targets/AArch64.cpp
189	Those comments were somewhat of a drive-by nature, made by a GCC contributor. I went through the v8.x extensions and tried to match them with both GCC and LLVM feature defines. Neither LLVM or GCC has defines for all extensions, and after talking to the contributer (Kyrylo Tkachov), it turns out he had at most parity with GCC in mind. As an aside GCC seems to have about 14 feature defines that are not present in LLVM, and one feature is spelled ARM_FEATURE_FP16_FML in GCC and ARM_FEATURE_FP16FML in LLVM. After surveying the list, I found a few defines that could be placed here. I've added them as inline comments. I think they deserve their own patch, as this involves multiple revisions and you'd like to make sure that it's all handled sensibly. I believe we have plans to overhaul this general area. I've removed the fixme's in revisions that didn't actually need them.
llvm/include/llvm/Support/AArch64TargetParser.def
52	for 8.2 it isn't, for 8.6 it is

Besides the irrelevant formatting nits, one minor question about the clang test.

clang/test/Driver/aarch64-cpus.c
622	Do we need 2 additional tests here? one for v8.6, and another with SVE?
llvm/lib/Target/AArch64/AArch64InstrFormats.td
7806	nit: indentation is a bit off here
7808	here too
7812	and here
7820	and this can be on the same line as above?
7867	and perhaps this one. But looks intentional, perhaps it's fine then, I don't know.
llvm/lib/Target/ARM/ARMInstrNEON.td
8936	on the same line as above?
8937	no newline?

Harbormaster failed remote builds in B49728: Diff 251336!Mar 19 2020, 5:21 AM

reindenting a few lines

clang/test/Driver/aarch64-cpus.c
622	I think we're ok here. for v8.6 the driver doesn't pass bfloat as an argument SVE: from a cmdline perspective, there's no special interaction between bfloat and SVE. either can be active without the other.
llvm/lib/Target/AArch64/AArch64InstrFormats.td
7867	Yes, the square brackets will be filled in in a next patch. I'll just leave them as is.

Harbormaster failed remote builds in B50045: Diff 251916!Mar 22 2020, 3:34 PM

adding sve and bf16+sve driver tests

after back-and-forth with Sjoerd, added sve and bf16+sve driver tests

Harbormaster failed remote builds in B50323: Diff 252443!Mar 24 2020, 4:12 PM

Thanks, LGTM

This revision is now accepted and ready to land.Mar 25 2020, 1:38 AM

Closed by commit rG71ae267d1f41: [PATCH] [ARM] ARMv8.6-a command-line + BFloat16 Asm Support (authored by stuij). · Explain WhyMar 26 2020, 2:40 AM

This revision was automatically updated to reflect the committed changes.

apologies please ignore adding here, added reviewers to the wrong diff

ab added a subscriber: ab.Sep 21 2022, 10:53 AM

ab added inline comments.

llvm/include/llvm/Support/AArch64TargetParser.def
52	Belated question: what's the rationale for replacing `AEK_CRYPTO` with SM4+SHA3+SHA2(+AES)? I'm not aware of the required crypto bits changing, but maybe I missed something. There's a related question around how we should deal with crypto here in the first place (remove FK, remove the crypto exts?), but that seems orthogonal to v8.6a+ vs. v8.5a- implying different crypto extensions. For context, this comes up in D134351 where specifying `V8_6A` would enable SM4, which we don't support.

Herald added a project: Restricted Project. · View Herald TranscriptSep 21 2022, 10:53 AM

Herald added a subscriber: StephenFan. · View Herald Transcript

ab mentioned this in D134351: AArch64: add definitions for recent Apple CPUs.Sep 21 2022, 10:55 AM

stuij added inline comments.Jan 20 2023, 3:34 AM

llvm/include/llvm/Support/AArch64TargetParser.def
52	Belated (initial) answer: yes unfortunately our crypto story is a bit of a mess (mostly related to it mandatory yes or no). we have a catch-all ticket on our backlog to deal with crypto inconsistencies, which will hopefully be picked up soon. I've added your point, and so again hopefully soon we can provide clarity and smooth things out.

Revision Contents

Path

Size

clang/

lib/

Basic/

Targets/

AArch64.h

2 lines

AArch64.cpp

19 lines

ARM.cpp

3 lines

test/

Driver/

aarch64-cpus.c

33 lines

arm-cortex-cpus.c

20 lines

Preprocessor/

arm-target-features.c

5 lines

llvm/

include/

llvm/

ADT/

Triple.h

1 line

Support/

AArch64TargetParser.h

2 lines

AArch64TargetParser.def

9 lines

ARMTargetParser.h

17 lines

ARMTargetParser.def

6 lines

lib/

Support/

AArch64TargetParser.cpp

2 lines

ARMTargetParser.cpp

3 lines

Triple.cpp

2 lines

Target/

AArch64/

AArch64.td

10 lines

AArch64InstrFormats.td

104 lines

AArch64InstrInfo.td

18 lines

AArch64SVEInstrInfo.td

12 lines

AArch64Subtarget.h

7 lines

AsmParser/

AArch64AsmParser.cpp

4 lines

SVEInstrFormats.td

90 lines

ARM/

21 lines

90 lines

29 lines

4 lines

6 lines

AsmParser/

ARMAsmParser.cpp

3 lines

MCTargetDesc/

ARMELFStreamer.cpp

1 line

test/

MC/

AArch64/

SVE/

bfcvt-diagnostics.s

27 lines

bfcvt.s

29 lines

bfcvtnt-diagnostics.s

27 lines

29 lines

53 lines

52 lines

42 lines

157 lines

22 lines

22 lines

115 lines

ARM/

bfloat16-a32-errors.s

57 lines

bfloat16-a32-errors2.s

134 lines

bfloat16-a32.s

55 lines

bfloat16-t32-errors.s

32 lines

bfloat16-t32.s

15 lines

Disassembler/

AArch64/

armv8.6a-bf16.txt

74 lines

ARM/

bfloat16-a32_1.txt

102 lines

bfloat16-a32_2.txt

20 lines

bfloat16-t32.txt

25 lines

bfloat16-t32_errors.txt

40 lines

unittests/

Support/

TargetParserTest.cpp

14 lines

Diff 252776

clang/lib/Basic/Targets/AArch64.h

Show First 20 Lines • Show All 64 Lines • ▼ Show 20 Lines	public:
void getTargetDefinesARMV82A(const LangOptions &Opts,		void getTargetDefinesARMV82A(const LangOptions &Opts,
MacroBuilder &Builder) const;		MacroBuilder &Builder) const;
void getTargetDefinesARMV83A(const LangOptions &Opts,		void getTargetDefinesARMV83A(const LangOptions &Opts,
MacroBuilder &Builder) const;		MacroBuilder &Builder) const;
void getTargetDefinesARMV84A(const LangOptions &Opts,		void getTargetDefinesARMV84A(const LangOptions &Opts,
MacroBuilder &Builder) const;		MacroBuilder &Builder) const;
void getTargetDefinesARMV85A(const LangOptions &Opts,		void getTargetDefinesARMV85A(const LangOptions &Opts,
MacroBuilder &Builder) const;		MacroBuilder &Builder) const;
		void getTargetDefinesARMV86A(const LangOptions &Opts,
		MacroBuilder &Builder) const;
void getTargetDefines(const LangOptions &Opts,		void getTargetDefines(const LangOptions &Opts,
MacroBuilder &Builder) const override;		MacroBuilder &Builder) const override;

ArrayRef<Builtin::Info> getTargetBuiltins() const override;		ArrayRef<Builtin::Info> getTargetBuiltins() const override;

bool hasFeature(StringRef Feature) const override;		bool hasFeature(StringRef Feature) const override;
bool handleTargetFeatures(std::vector<std::string> &Features,		bool handleTargetFeatures(std::vector<std::string> &Features,
DiagnosticsEngine &Diags) override;		DiagnosticsEngine &Diags) override;
▲ Show 20 Lines • Show All 125 Lines • Show Last 20 Lines

clang/lib/Basic/Targets/AArch64.cpp

Show First 20 Lines • Show All 145 Lines • ▼ Show 20 Lines

void AArch64TargetInfo::fillValidCPUList(		void AArch64TargetInfo::fillValidCPUList(
SmallVectorImpl<StringRef> &Values) const {		SmallVectorImpl<StringRef> &Values) const {
llvm::AArch64::fillValidCPUArchList(Values);		llvm::AArch64::fillValidCPUArchList(Values);
}		}

void AArch64TargetInfo::getTargetDefinesARMV81A(const LangOptions &Opts,		void AArch64TargetInfo::getTargetDefinesARMV81A(const LangOptions &Opts,
MacroBuilder &Builder) const {		MacroBuilder &Builder) const {
		// FIXME: Armv8.1 makes __ARM_FEATURE_CRC32 mandatory. Handle it here.
Builder.defineMacro("__ARM_FEATURE_QRDMX", "1");		Builder.defineMacro("__ARM_FEATURE_QRDMX", "1");
}		}

void AArch64TargetInfo::getTargetDefinesARMV82A(const LangOptions &Opts,		void AArch64TargetInfo::getTargetDefinesARMV82A(const LangOptions &Opts,
MacroBuilder &Builder) const {		MacroBuilder &Builder) const {
// Also include the ARMv8.1 defines		// Also include the ARMv8.1 defines
getTargetDefinesARMV81A(Opts, Builder);		getTargetDefinesARMV81A(Opts, Builder);
}		}

void AArch64TargetInfo::getTargetDefinesARMV83A(const LangOptions &Opts,		void AArch64TargetInfo::getTargetDefinesARMV83A(const LangOptions &Opts,
MacroBuilder &Builder) const {		MacroBuilder &Builder) const {
Builder.defineMacro("__ARM_FEATURE_COMPLEX", "1");		Builder.defineMacro("__ARM_FEATURE_COMPLEX", "1");
Builder.defineMacro("__ARM_FEATURE_JCVT", "1");		Builder.defineMacro("__ARM_FEATURE_JCVT", "1");
// Also include the Armv8.2 defines		// Also include the Armv8.2 defines
getTargetDefinesARMV82A(Opts, Builder);		getTargetDefinesARMV82A(Opts, Builder);
}		}

void AArch64TargetInfo::getTargetDefinesARMV84A(const LangOptions &Opts,		void AArch64TargetInfo::getTargetDefinesARMV84A(const LangOptions &Opts,
MacroBuilder &Builder) const {		MacroBuilder &Builder) const {
// Also include the Armv8.3 defines		// Also include the Armv8.3 defines
// FIXME: Armv8.4 makes some extensions mandatory. Handle them here.		// FIXME: Armv8.4 makes __ARM_FEATURE_ATOMICS, defined in GCC, mandatory.
		// Add and handle it here.
getTargetDefinesARMV83A(Opts, Builder);		getTargetDefinesARMV83A(Opts, Builder);
}		}

void AArch64TargetInfo::getTargetDefinesARMV85A(const LangOptions &Opts,		void AArch64TargetInfo::getTargetDefinesARMV85A(const LangOptions &Opts,
MacroBuilder &Builder) const {		MacroBuilder &Builder) const {
// Also include the Armv8.4 defines		// Also include the Armv8.4 defines
// FIXME: Armv8.5 makes some extensions mandatory. Handle them here.
getTargetDefinesARMV84A(Opts, Builder);		getTargetDefinesARMV84A(Opts, Builder);
}		}

		void AArch64TargetInfo::getTargetDefinesARMV86A(const LangOptions &Opts,
		MacroBuilder &Builder) const {
		// Also include the Armv8.5 defines
		// FIXME: Armv8.6 makes the following extensions mandatory:
		SjoerdMeijerUnsubmitted Not Done Reply Inline Actions Can you be more specific, what are we missing here? Hmm, now I see the same above: "FIXME: Armv8.5 makes some extensions mandatory. Handle them here." While you're at it, can you also change that? SjoerdMeijer: Can you be more specific, what are we missing here? Hmm, now I see the same above: "FIXME…
		stuijAuthorUnsubmitted Done Reply Inline Actions Those comments were somewhat of a drive-by nature, made by a GCC contributor. I went through the v8.x extensions and tried to match them with both GCC and LLVM feature defines. Neither LLVM or GCC has defines for all extensions, and after talking to the contributer (Kyrylo Tkachov), it turns out he had at most parity with GCC in mind. As an aside GCC seems to have about 14 feature defines that are not present in LLVM, and one feature is spelled ARM_FEATURE_FP16_FML in GCC and ARM_FEATURE_FP16FML in LLVM. After surveying the list, I found a few defines that could be placed here. I've added them as inline comments. I think they deserve their own patch, as this involves multiple revisions and you'd like to make sure that it's all handled sensibly. I believe we have plans to overhaul this general area. I've removed the fixme's in revisions that didn't actually need them. stuij: Those comments were somewhat of a drive-by nature, made by a GCC contributor. I went through…
		// - __ARM_FEATURE_BF16
		// - __ARM_FEATURE_MATMUL_INT8
		// Handle them here.
		getTargetDefinesARMV85A(Opts, Builder);
		}

void AArch64TargetInfo::getTargetDefines(const LangOptions &Opts,		void AArch64TargetInfo::getTargetDefines(const LangOptions &Opts,
MacroBuilder &Builder) const {		MacroBuilder &Builder) const {
// Target identification.		// Target identification.
Builder.defineMacro("__aarch64__");		Builder.defineMacro("__aarch64__");
// For bare-metal.		// For bare-metal.
if (getTriple().getOS() == llvm::Triple::UnknownOS &&		if (getTriple().getOS() == llvm::Triple::UnknownOS &&
getTriple().isOSBinFormatELF())		getTriple().isOSBinFormatELF())
▲ Show 20 Lines • Show All 92 Lines • ▼ Show 20 Lines	case llvm::AArch64::ArchKind::ARMV8_3A:
getTargetDefinesARMV83A(Opts, Builder);		getTargetDefinesARMV83A(Opts, Builder);
break;		break;
case llvm::AArch64::ArchKind::ARMV8_4A:		case llvm::AArch64::ArchKind::ARMV8_4A:
getTargetDefinesARMV84A(Opts, Builder);		getTargetDefinesARMV84A(Opts, Builder);
break;		break;
case llvm::AArch64::ArchKind::ARMV8_5A:		case llvm::AArch64::ArchKind::ARMV8_5A:
getTargetDefinesARMV85A(Opts, Builder);		getTargetDefinesARMV85A(Opts, Builder);
break;		break;
		case llvm::AArch64::ArchKind::ARMV8_6A:
		getTargetDefinesARMV86A(Opts, Builder);
		break;
}		}

// All of the __sync_(bool\|val)_compare_and_swap_(1\|2\|4\|8) builtins work.		// All of the __sync_(bool\|val)_compare_and_swap_(1\|2\|4\|8) builtins work.
Builder.defineMacro("__GCC_HAVE_SYNC_COMPARE_AND_SWAP_1");		Builder.defineMacro("__GCC_HAVE_SYNC_COMPARE_AND_SWAP_1");
Builder.defineMacro("__GCC_HAVE_SYNC_COMPARE_AND_SWAP_2");		Builder.defineMacro("__GCC_HAVE_SYNC_COMPARE_AND_SWAP_2");
Builder.defineMacro("__GCC_HAVE_SYNC_COMPARE_AND_SWAP_4");		Builder.defineMacro("__GCC_HAVE_SYNC_COMPARE_AND_SWAP_4");
Builder.defineMacro("__GCC_HAVE_SYNC_COMPARE_AND_SWAP_8");		Builder.defineMacro("__GCC_HAVE_SYNC_COMPARE_AND_SWAP_8");
}		}
Show All 38 Lines	for (const auto &Feature : Features) {
if (Feature == "+v8.2a")		if (Feature == "+v8.2a")
ArchKind = llvm::AArch64::ArchKind::ARMV8_2A;		ArchKind = llvm::AArch64::ArchKind::ARMV8_2A;
if (Feature == "+v8.3a")		if (Feature == "+v8.3a")
ArchKind = llvm::AArch64::ArchKind::ARMV8_3A;		ArchKind = llvm::AArch64::ArchKind::ARMV8_3A;
if (Feature == "+v8.4a")		if (Feature == "+v8.4a")
ArchKind = llvm::AArch64::ArchKind::ARMV8_4A;		ArchKind = llvm::AArch64::ArchKind::ARMV8_4A;
if (Feature == "+v8.5a")		if (Feature == "+v8.5a")
ArchKind = llvm::AArch64::ArchKind::ARMV8_5A;		ArchKind = llvm::AArch64::ArchKind::ARMV8_5A;
		if (Feature == "+v8.6a")
		ArchKind = llvm::AArch64::ArchKind::ARMV8_6A;
if (Feature == "+fullfp16")		if (Feature == "+fullfp16")
HasFullFP16 = true;		HasFullFP16 = true;
if (Feature == "+dotprod")		if (Feature == "+dotprod")
HasDotProd = true;		HasDotProd = true;
if (Feature == "+fp16fml")		if (Feature == "+fp16fml")
HasFP16FML = true;		HasFP16FML = true;
if (Feature == "+mte")		if (Feature == "+mte")
HasMTE = true;		HasMTE = true;
▲ Show 20 Lines • Show All 393 Lines • Show Last 20 Lines

clang/lib/Basic/Targets/ARM.cpp

Show First 20 Lines • Show All 195 Lines • ▼ Show 20 Lines	StringRef ARMTargetInfo::getCPUAttr() const {
case llvm::ARM::ArchKind::ARMV8_2A:		case llvm::ARM::ArchKind::ARMV8_2A:
return "8_2A";		return "8_2A";
case llvm::ARM::ArchKind::ARMV8_3A:		case llvm::ARM::ArchKind::ARMV8_3A:
return "8_3A";		return "8_3A";
case llvm::ARM::ArchKind::ARMV8_4A:		case llvm::ARM::ArchKind::ARMV8_4A:
return "8_4A";		return "8_4A";
case llvm::ARM::ArchKind::ARMV8_5A:		case llvm::ARM::ArchKind::ARMV8_5A:
return "8_5A";		return "8_5A";
		case llvm::ARM::ArchKind::ARMV8_6A:
		return "8_6A";
case llvm::ARM::ArchKind::ARMV8MBaseline:		case llvm::ARM::ArchKind::ARMV8MBaseline:
return "8M_BASE";		return "8M_BASE";
case llvm::ARM::ArchKind::ARMV8MMainline:		case llvm::ARM::ArchKind::ARMV8MMainline:
return "8M_MAIN";		return "8M_MAIN";
case llvm::ARM::ArchKind::ARMV8R:		case llvm::ARM::ArchKind::ARMV8R:
return "8R";		return "8R";
case llvm::ARM::ArchKind::ARMV8_1MMainline:		case llvm::ARM::ArchKind::ARMV8_1MMainline:
return "8_1M_MAIN";		return "8_1M_MAIN";
▲ Show 20 Lines • Show All 613 Lines • ▼ Show 20 Lines	case llvm::ARM::ArchKind::ARMV8_1A:
getTargetDefinesARMV81A(Opts, Builder);		getTargetDefinesARMV81A(Opts, Builder);
break;		break;
case llvm::ARM::ArchKind::ARMV8_2A:		case llvm::ARM::ArchKind::ARMV8_2A:
getTargetDefinesARMV82A(Opts, Builder);		getTargetDefinesARMV82A(Opts, Builder);
break;		break;
case llvm::ARM::ArchKind::ARMV8_3A:		case llvm::ARM::ArchKind::ARMV8_3A:
case llvm::ARM::ArchKind::ARMV8_4A:		case llvm::ARM::ArchKind::ARMV8_4A:
case llvm::ARM::ArchKind::ARMV8_5A:		case llvm::ARM::ArchKind::ARMV8_5A:
		case llvm::ARM::ArchKind::ARMV8_6A:
getTargetDefinesARMV83A(Opts, Builder);		getTargetDefinesARMV83A(Opts, Builder);
break;		break;
}		}
}		}

const Builtin::Info ARMTargetInfo::BuiltinInfo[] = {		const Builtin::Info ARMTargetInfo::BuiltinInfo[] = {
#define BUILTIN(ID, TYPE, ATTRS) \		#define BUILTIN(ID, TYPE, ATTRS) \
{#ID, TYPE, ATTRS, nullptr, ALL_LANGUAGES, nullptr},		{#ID, TYPE, ATTRS, nullptr, ALL_LANGUAGES, nullptr},
▲ Show 20 Lines • Show All 438 Lines • Show Last 20 Lines

clang/test/Driver/aarch64-cpus.c

	Show First 20 Lines • Show All 597 Lines • ▼ Show 20 Lines
	// RUN: %clang -target aarch64 -mbig-endian -march=armv8.5-a -### -c %s 2>&1 \| FileCheck -check-prefix=GENERICV85A-BE %s			// RUN: %clang -target aarch64 -mbig-endian -march=armv8.5-a -### -c %s 2>&1 \| FileCheck -check-prefix=GENERICV85A-BE %s
	// RUN: %clang -target aarch64_be -mbig-endian -march=armv8.5a -### -c %s 2>&1 \| FileCheck -check-prefix=GENERICV85A-BE %s			// RUN: %clang -target aarch64_be -mbig-endian -march=armv8.5a -### -c %s 2>&1 \| FileCheck -check-prefix=GENERICV85A-BE %s
	// RUN: %clang -target aarch64_be -mbig-endian -march=armv8.5-a -### -c %s 2>&1 \| FileCheck -check-prefix=GENERICV85A-BE %s			// RUN: %clang -target aarch64_be -mbig-endian -march=armv8.5-a -### -c %s 2>&1 \| FileCheck -check-prefix=GENERICV85A-BE %s
	// GENERICV85A-BE: "-cc1"{{.}} "-triple" "aarch64_be{{.}}" "-target-cpu" "generic" "-target-feature" "+neon" "-target-feature" "+v8.5a"			// GENERICV85A-BE: "-cc1"{{.}} "-triple" "aarch64_be{{.}}" "-target-cpu" "generic" "-target-feature" "+neon" "-target-feature" "+v8.5a"

	// RUN: %clang -target aarch64 -march=armv8.5-a+fp16 -### -c %s 2>&1 \| FileCheck -check-prefix=GENERICV85A-FP16 %s			// RUN: %clang -target aarch64 -march=armv8.5-a+fp16 -### -c %s 2>&1 \| FileCheck -check-prefix=GENERICV85A-FP16 %s
	// GENERICV85A-FP16: "-cc1"{{.}} "-triple" "aarch64{{.}}" "-target-cpu" "generic" "-target-feature" "+neon" "-target-feature" "+v8.5a" "-target-feature" "+fullfp16"			// GENERICV85A-FP16: "-cc1"{{.}} "-triple" "aarch64{{.}}" "-target-cpu" "generic" "-target-feature" "+neon" "-target-feature" "+v8.5a" "-target-feature" "+fullfp16"

				// RUN: %clang -target aarch64 -march=armv8.6a -### -c %s 2>&1 \| FileCheck -check-prefix=GENERICV86A %s
				// RUN: %clang -target aarch64 -march=armv8.6-a -### -c %s 2>&1 \| FileCheck -check-prefix=GENERICV86A %s
				// RUN: %clang -target aarch64 -mlittle-endian -march=armv8.6a -### -c %s 2>&1 \| FileCheck -check-prefix=GENERICV86A %s
				// RUN: %clang -target aarch64 -mlittle-endian -march=armv8.6-a -### -c %s 2>&1 \| FileCheck -check-prefix=GENERICV86A %s
				// RUN: %clang -target aarch64_be -mlittle-endian -march=armv8.6a -### -c %s 2>&1 \| FileCheck -check-prefix=GENERICV86A %s
				// RUN: %clang -target aarch64_be -mlittle-endian -march=armv8.6-a -### -c %s 2>&1 \| FileCheck -check-prefix=GENERICV86A %s
				// GENERICV86A: "-cc1"{{.}} "-triple" "aarch64{{.}}" "-target-cpu" "generic" "-target-feature" "+neon" "-target-feature" "+v8.6a"

				// RUN: %clang -target aarch64_be -march=armv8.6a -### -c %s 2>&1 \| FileCheck -check-prefix=GENERICV86A-BE %s
				// RUN: %clang -target aarch64_be -march=armv8.6-a -### -c %s 2>&1 \| FileCheck -check-prefix=GENERICV86A-BE %s
				// RUN: %clang -target aarch64 -mbig-endian -march=armv8.6a -### -c %s 2>&1 \| FileCheck -check-prefix=GENERICV86A-BE %s
				// RUN: %clang -target aarch64 -mbig-endian -march=armv8.6-a -### -c %s 2>&1 \| FileCheck -check-prefix=GENERICV86A-BE %s
				// RUN: %clang -target aarch64_be -mbig-endian -march=armv8.6a -### -c %s 2>&1 \| FileCheck -check-prefix=GENERICV86A-BE %s
				// RUN: %clang -target aarch64_be -mbig-endian -march=armv8.6-a -### -c %s 2>&1 \| FileCheck -check-prefix=GENERICV86A-BE %s
				// GENERICV86A-BE: "-cc1"{{.}} "-triple" "aarch64_be{{.}}" "-target-cpu" "generic" "-target-feature" "+neon" "-target-feature" "+v8.6a"

				// The SVE extension is an optional extension for Armv8-A.
				SjoerdMeijerUnsubmitted Not Done Reply Inline Actions Do we need 2 additional tests here? one for v8.6, and another with SVE? SjoerdMeijer: Do we need 2 additional tests here? - one for v8.6, - and another with SVE?
				stuijAuthorUnsubmitted Done Reply Inline Actions I think we're ok here. for v8.6 the driver doesn't pass bfloat as an argument SVE: from a cmdline perspective, there's no special interaction between bfloat and SVE. either can be active without the other. stuij: I think we're ok here. - for v8.6 the driver doesn't pass bfloat as an argument - SVE: from a…
				// RUN: %clang -target aarch64 -march=armv8a+sve -### -c %s 2>&1 \| FileCheck -check-prefix=GENERICV8A-SVE %s
				// RUN: %clang -target aarch64 -march=armv8.6a+sve -### -c %s 2>&1 \| FileCheck -check-prefix=GENERICV8A-SVE %s
				// GENERICV8A-SVE: "-target-feature" "+sve"
				// RUN: %clang -target aarch64 -march=armv8a -### -c %s 2>&1 \| FileCheck -check-prefix=GENERICV8A-NOSVE %s
				// RUN: %clang -target aarch64 -march=armv8.6a -### -c %s 2>&1 \| FileCheck -check-prefix=GENERICV8A-NOSVE %s
				// GENERICV8A-NOSVE-NOT: "-target-feature" "+sve"

				// The BFloat16 extension is a mandatory component of the Armv8.6-A extensions, but is permitted as an
				// optional feature for any implementation of Armv8.2-A to Armv8.5-A (inclusive)
				// RUN: %clang -target aarch64 -march=armv8.5a+bf16 -### -c %s 2>&1 \| FileCheck -check-prefix=GENERICV85A-BF16 %s
				// GENERICV85A-BF16: "-target-feature" "+bf16"
				// RUN: %clang -target aarch64 -march=armv8.5a+bf16+nobf16 -### -c %s 2>&1 \| FileCheck -check-prefix=GENERICV85A-BF16-NO-BF16 %s
				// GENERICV85A-BF16-NO-BF16: "-target-feature" "-bf16"
				// RUN: %clang -target aarch64 -march=armv8.5a+bf16+sve -### -c %s 2>&1 \| FileCheck -check-prefixes=GENERICV85A-BF16-SVE %s
				// GENERICV85A-BF16-SVE: "-target-feature" "+bf16" "-target-feature" "+sve"

	// fullfp16 is off by default for v8a, feature must not be mentioned			// fullfp16 is off by default for v8a, feature must not be mentioned
	// RUN: %clang -target aarch64 -march=armv8a -### -c %s 2>&1 \| FileCheck -check-prefix=V82ANOFP16 -check-prefix=GENERIC %s			// RUN: %clang -target aarch64 -march=armv8a -### -c %s 2>&1 \| FileCheck -check-prefix=V82ANOFP16 -check-prefix=GENERIC %s
	// RUN: %clang -target aarch64 -march=armv8-a -### -c %s 2>&1 \| FileCheck -check-prefix=V82ANOFP16 -check-prefix=GENERIC %s			// RUN: %clang -target aarch64 -march=armv8-a -### -c %s 2>&1 \| FileCheck -check-prefix=V82ANOFP16 -check-prefix=GENERIC %s
	// V82ANOFP16-NOT: "-target-feature" "{{[+-]}}fp16fml"			// V82ANOFP16-NOT: "-target-feature" "{{[+-]}}fp16fml"
	// V82ANOFP16-NOT: "-target-feature" "{{[+-]}}fullfp16"			// V82ANOFP16-NOT: "-target-feature" "{{[+-]}}fullfp16"

	// RAS is on by default for v8.2a, but can be disabled by +noras			// RAS is on by default for v8.2a, but can be disabled by +noras
	// RUN: %clang -target aarch64 -march=armv8.2a -### -c %s 2>&1 \| FileCheck -check-prefix=V82ARAS -check-prefix=GENERICV82A %s			// RUN: %clang -target aarch64 -march=armv8.2a -### -c %s 2>&1 \| FileCheck -check-prefix=V82ARAS -check-prefix=GENERICV82A %s
	▲ Show 20 Lines • Show All 41 Lines • Show Last 20 Lines

clang/test/Driver/arm-cortex-cpus.c

	Show First 20 Lines • Show All 329 Lines • ▼ Show 20 Lines
	// RUN: %clang -target armebv8.5a -### -c %s 2>&1 \| FileCheck -check-prefix=CHECK-BE-V85A %s			// RUN: %clang -target armebv8.5a -### -c %s 2>&1 \| FileCheck -check-prefix=CHECK-BE-V85A %s
	// RUN: %clang -target armv8.5a -mbig-endian -### -c %s 2>&1 \| FileCheck -check-prefix=CHECK-BE-V85A %s			// RUN: %clang -target armv8.5a -mbig-endian -### -c %s 2>&1 \| FileCheck -check-prefix=CHECK-BE-V85A %s
	// RUN: %clang -target armeb -march=armebv8.5a -### -c %s 2>&1 \| FileCheck -check-prefix=CHECK-BE-V85A %s			// RUN: %clang -target armeb -march=armebv8.5a -### -c %s 2>&1 \| FileCheck -check-prefix=CHECK-BE-V85A %s
	// RUN: %clang -target armeb -march=armebv8.5-a -### -c %s 2>&1 \| FileCheck -check-prefix=CHECK-BE-V85A %s			// RUN: %clang -target armeb -march=armebv8.5-a -### -c %s 2>&1 \| FileCheck -check-prefix=CHECK-BE-V85A %s
	// RUN: %clang -target arm -march=armebv8.5a -mbig-endian -### -c %s 2>&1 \| FileCheck -check-prefix=CHECK-BE-V85A %s			// RUN: %clang -target arm -march=armebv8.5a -mbig-endian -### -c %s 2>&1 \| FileCheck -check-prefix=CHECK-BE-V85A %s
	// RUN: %clang -target arm -march=armebv8.5-a -mbig-endian -### -c %s 2>&1 \| FileCheck -check-prefix=CHECK-BE-V85A %s			// RUN: %clang -target arm -march=armebv8.5-a -mbig-endian -### -c %s 2>&1 \| FileCheck -check-prefix=CHECK-BE-V85A %s
	// CHECK-BE-V85A: "-cc1"{{.}} "-triple" "armebv8.5{{.}}" "-target-cpu" "generic"			// CHECK-BE-V85A: "-cc1"{{.}} "-triple" "armebv8.5{{.}}" "-target-cpu" "generic"

				// RUN: %clang -target armv8.6a -### -c %s 2>&1 \| FileCheck -check-prefix=CHECK-V86A %s
				// RUN: %clang -target arm -march=armv8.6a -### -c %s 2>&1 \| FileCheck -check-prefix=CHECK-V86A %s
				// RUN: %clang -target arm -march=armv8.6-a -### -c %s 2>&1 \| FileCheck -check-prefix=CHECK-V86A %s
				// RUN: %clang -target arm -march=armv8.6a -mlittle-endian -### -c %s 2>&1 \| FileCheck -check-prefix=CHECK-V86A %s
				// RUN: %clang -target armv8.6a -mlittle-endian -### -c %s 2>&1 \| FileCheck -check-prefix=CHECK-V86A %s
				// RUN: %clang -target arm -march=armv8.6a -mlittle-endian -### -c %s 2>&1 \| FileCheck -check-prefix=CHECK-V86A %s
				// RUN: %clang -target arm -mlittle-endian -march=armv8.6-a -mlittle-endian -### -c %s 2>&1 \| FileCheck -check-prefix=CHECK-V86A %s
				// CHECK-V86A: "-cc1"{{.}} "-triple" "armv8.6{{.}}" "-target-cpu" "generic"

				// RUN: %clang -target armebv8.6a -### -c %s 2>&1 \| FileCheck -check-prefix=CHECK-BE-V86A %s
				// RUN: %clang -target armv8.6a -mbig-endian -### -c %s 2>&1 \| FileCheck -check-prefix=CHECK-BE-V86A %s
				// RUN: %clang -target armeb -march=armebv8.6a -### -c %s 2>&1 \| FileCheck -check-prefix=CHECK-BE-V86A %s
				// RUN: %clang -target armeb -march=armebv8.6-a -### -c %s 2>&1 \| FileCheck -check-prefix=CHECK-BE-V86A %s
				// RUN: %clang -target arm -march=armebv8.6a -mbig-endian -### -c %s 2>&1 \| FileCheck -check-prefix=CHECK-BE-V86A %s
				// RUN: %clang -target arm -march=armebv8.6-a -mbig-endian -### -c %s 2>&1 \| FileCheck -check-prefix=CHECK-BE-V86A %s
				// CHECK-BE-V86A: "-cc1"{{.}} "-triple" "armebv8.6{{.}}" "-target-cpu" "generic"

	// Once we have CPUs with optional v8.2-A FP16, we will need a way to turn it			// Once we have CPUs with optional v8.2-A FP16, we will need a way to turn it
	// on and off. Cortex-A53 is a placeholder for now.			// on and off. Cortex-A53 is a placeholder for now.
	// RUN: %clang -target armv8a-linux-eabi -mcpu=cortex-a53+fp16 -### -c %s 2>&1 \| FileCheck --check-prefix CHECK-CORTEX-A53-FP16 %s			// RUN: %clang -target armv8a-linux-eabi -mcpu=cortex-a53+fp16 -### -c %s 2>&1 \| FileCheck --check-prefix CHECK-CORTEX-A53-FP16 %s
	// RUN: %clang -target armv8a-linux-eabi -mcpu=cortex-a53+nofp16 -### -c %s 2>&1 \| FileCheck --check-prefix CHECK-CORTEX-A53-NOFP16 %s			// RUN: %clang -target armv8a-linux-eabi -mcpu=cortex-a53+nofp16 -### -c %s 2>&1 \| FileCheck --check-prefix CHECK-CORTEX-A53-NOFP16 %s
	// CHECK-CORTEX-A53-FP16: "-cc1" {{.}}"-target-cpu" "cortex-a53" {{.}}"-target-feature" "+fullfp16"			// CHECK-CORTEX-A53-FP16: "-cc1" {{.}}"-target-cpu" "cortex-a53" {{.}}"-target-feature" "+fullfp16"
	// CHECK-CORTEX-A53-FP16-NOT: "-target-feature" "+fp16fml"			// CHECK-CORTEX-A53-FP16-NOT: "-target-feature" "+fp16fml"
	// CHECK-CORTEX-A53-NOFP16-NOT: "+fullfp16"			// CHECK-CORTEX-A53-NOFP16-NOT: "+fullfp16"
	// CHECK-CORTEX-A53-NOFP16-NOT: "+fp16fml"			// CHECK-CORTEX-A53-NOFP16-NOT: "+fp16fml"
	▲ Show 20 Lines • Show All 81 Lines • ▼ Show 20 Lines
	// CHECK-V84A-FP16FML-NOFP16: "-target-feature" "-fullfp16" "-target-feature" "-fp16fml"			// CHECK-V84A-FP16FML-NOFP16: "-target-feature" "-fullfp16" "-target-feature" "-fp16fml"

	// RUN: %clang -target armv8a-linux-eabi -march=armv8.4-a+nofp16+fp16fml -### -c %s 2>&1 \| FileCheck -check-prefix=CHECK-V84A-NOFP16-FP16FML %s			// RUN: %clang -target armv8a-linux-eabi -march=armv8.4-a+nofp16+fp16fml -### -c %s 2>&1 \| FileCheck -check-prefix=CHECK-V84A-NOFP16-FP16FML %s
	// CHECK-V84A-NOFP16-FP16FML: "-target-feature" "+fp16fml" "-target-feature" "+fullfp16"			// CHECK-V84A-NOFP16-FP16FML: "-target-feature" "+fp16fml" "-target-feature" "+fullfp16"

	// RUN: %clang -target armv8a-linux-eabi -march=armv8.5-a+fp16 -### -c %s 2>&1 \| FileCheck --check-prefix CHECK-V85A-FP16 %s			// RUN: %clang -target armv8a-linux-eabi -march=armv8.5-a+fp16 -### -c %s 2>&1 \| FileCheck --check-prefix CHECK-V85A-FP16 %s
	// CHECK-V85A-FP16: "-cc1"{{.}} "-triple" "armv8.5{{.}}" "-target-cpu" "generic" {{.*}}"-target-feature" "+fullfp16"			// CHECK-V85A-FP16: "-cc1"{{.}} "-triple" "armv8.5{{.}}" "-target-cpu" "generic" {{.*}}"-target-feature" "+fullfp16"

				// RUN: %clang -target armv8a-linux-eabi -march=armv8.6-a+bf16 -### -c %s 2>&1 \| FileCheck --check-prefix CHECK-V86A-BF16 %s
				// CHECK-V86A-BF16: "-cc1"{{.}} "-triple" "armv8.6{{.}}" "-target-cpu" "generic" {{.*}}"-target-feature" "+bf16"

	// RUN: %clang -target arm -march=armv8.2-a+fp16 -### -c %s 2>&1 \| FileCheck -check-prefix=CHECK-FULLFP16-SOFT %s			// RUN: %clang -target arm -march=armv8.2-a+fp16 -### -c %s 2>&1 \| FileCheck -check-prefix=CHECK-FULLFP16-SOFT %s
	// RUN: %clang -target arm -march=armv8.2-a+fp16fml -### -c %s 2>&1 \| FileCheck -check-prefix=CHECK-FULLFP16-SOFT %s			// RUN: %clang -target arm -march=armv8.2-a+fp16fml -### -c %s 2>&1 \| FileCheck -check-prefix=CHECK-FULLFP16-SOFT %s
	// RUN: %clang -target arm -march=armv8.2-a+fp16+fp16fml -### -c %s 2>&1 \| FileCheck -check-prefix=CHECK-FULLFP16-SOFT %s			// RUN: %clang -target arm -march=armv8.2-a+fp16+fp16fml -### -c %s 2>&1 \| FileCheck -check-prefix=CHECK-FULLFP16-SOFT %s
	// RUN: %clang -target arm -march=armv8.2-a+fp16fml+fp16 -### -c %s 2>&1 \| FileCheck -check-prefix=CHECK-FULLFP16-SOFT %s			// RUN: %clang -target arm -march=armv8.2-a+fp16fml+fp16 -### -c %s 2>&1 \| FileCheck -check-prefix=CHECK-FULLFP16-SOFT %s
	// RUN: %clang -target arm -march=armv8.4-a+fp16 -### -c %s 2>&1 \| FileCheck -check-prefix=CHECK-FULLFP16-SOFT %s			// RUN: %clang -target arm -march=armv8.4-a+fp16 -### -c %s 2>&1 \| FileCheck -check-prefix=CHECK-FULLFP16-SOFT %s
	// RUN: %clang -target arm -march=armv8.4-a+fp16fml -### -c %s 2>&1 \| FileCheck -check-prefix=CHECK-FULLFP16-SOFT %s			// RUN: %clang -target arm -march=armv8.4-a+fp16fml -### -c %s 2>&1 \| FileCheck -check-prefix=CHECK-FULLFP16-SOFT %s
	// RUN: %clang -target arm -march=armv8.4-a+fp16+fp16fml -### -c %s 2>&1 \| FileCheck -check-prefix=CHECK-FULLFP16-SOFT %s			// RUN: %clang -target arm -march=armv8.4-a+fp16+fp16fml -### -c %s 2>&1 \| FileCheck -check-prefix=CHECK-FULLFP16-SOFT %s
	// RUN: %clang -target arm -march=armv8.4-a+fp16fml+fp16 -### -c %s 2>&1 \| FileCheck -check-prefix=CHECK-FULLFP16-SOFT %s			// RUN: %clang -target arm -march=armv8.4-a+fp16fml+fp16 -### -c %s 2>&1 \| FileCheck -check-prefix=CHECK-FULLFP16-SOFT %s
	▲ Show 20 Lines • Show All 405 Lines • Show Last 20 Lines

clang/test/Preprocessor/arm-target-features.c

	Show First 20 Lines • Show All 835 Lines • ▼ Show 20 Lines
	// CHECK-V84A: #define __ARM_ARCH_8_4A__ 1			// CHECK-V84A: #define __ARM_ARCH_8_4A__ 1
	// CHECK-V84A: #define __ARM_ARCH_PROFILE 'A'			// CHECK-V84A: #define __ARM_ARCH_PROFILE 'A'

	// RUN: %clang -target armv8.5a-none-none-eabi -x c -E -dM %s -o - \| FileCheck -match-full-lines --check-prefix=CHECK-V85A %s			// RUN: %clang -target armv8.5a-none-none-eabi -x c -E -dM %s -o - \| FileCheck -match-full-lines --check-prefix=CHECK-V85A %s
	// CHECK-V85A: #define __ARM_ARCH 8			// CHECK-V85A: #define __ARM_ARCH 8
	// CHECK-V85A: #define __ARM_ARCH_8_5A__ 1			// CHECK-V85A: #define __ARM_ARCH_8_5A__ 1
	// CHECK-V85A: #define __ARM_ARCH_PROFILE 'A'			// CHECK-V85A: #define __ARM_ARCH_PROFILE 'A'

				// RUN: %clang -target armv8.6a-none-none-eabi -x c -E -dM %s -o - \| FileCheck -match-full-lines --check-prefix=CHECK-V86A %s
				// CHECK-V86A: #define __ARM_ARCH 8
				// CHECK-V86A: #define __ARM_ARCH_8_6A__ 1
				// CHECK-V86A: #define __ARM_ARCH_PROFILE 'A'

	// RUN: %clang -target arm-none-none-eabi -march=armv7-m -mfpu=softvfp -x c -E -dM %s -o - \| FileCheck --check-prefix=CHECK-SOFTVFP %s			// RUN: %clang -target arm-none-none-eabi -march=armv7-m -mfpu=softvfp -x c -E -dM %s -o - \| FileCheck --check-prefix=CHECK-SOFTVFP %s
	// CHECK-SOFTVFP-NOT: #define __ARM_FP 0x			// CHECK-SOFTVFP-NOT: #define __ARM_FP 0x

llvm/include/llvm/ADT/Triple.h

Show First 20 Lines • Show All 95 Lines • ▼ Show 20 Lines	enum ArchType {
renderscript32, // 32-bit RenderScript		renderscript32, // 32-bit RenderScript
renderscript64, // 64-bit RenderScript		renderscript64, // 64-bit RenderScript
ve, // NEC SX-Aurora Vector Engine		ve, // NEC SX-Aurora Vector Engine
LastArchType = ve		LastArchType = ve
};		};
enum SubArchType {		enum SubArchType {
NoSubArch,		NoSubArch,

		ARMSubArch_v8_6a,
ARMSubArch_v8_5a,		ARMSubArch_v8_5a,
ARMSubArch_v8_4a,		ARMSubArch_v8_4a,
ARMSubArch_v8_3a,		ARMSubArch_v8_3a,
ARMSubArch_v8_2a,		ARMSubArch_v8_2a,
ARMSubArch_v8_1a,		ARMSubArch_v8_1a,
ARMSubArch_v8,		ARMSubArch_v8,
ARMSubArch_v8r,		ARMSubArch_v8r,
ARMSubArch_v8m_baseline,		ARMSubArch_v8m_baseline,
▲ Show 20 Lines • Show All 790 Lines • Show Last 20 Lines

llvm/include/llvm/Support/AArch64TargetParser.h

Show First 20 Lines • Show All 49 Lines • ▼ Show 20 Lines	enum ArchExtKind : unsigned {
AEK_SB = 1 << 21,		AEK_SB = 1 << 21,
AEK_PREDRES = 1 << 22,		AEK_PREDRES = 1 << 22,
AEK_SVE2 = 1 << 23,		AEK_SVE2 = 1 << 23,
AEK_SVE2AES = 1 << 24,		AEK_SVE2AES = 1 << 24,
AEK_SVE2SM4 = 1 << 25,		AEK_SVE2SM4 = 1 << 25,
AEK_SVE2SHA3 = 1 << 26,		AEK_SVE2SHA3 = 1 << 26,
AEK_SVE2BITPERM = 1 << 27,		AEK_SVE2BITPERM = 1 << 27,
AEK_TME = 1 << 28,		AEK_TME = 1 << 28,
		AEK_BF16 = 1 << 29,
		AEK_I8MM = 1 << 30,
};		};

enum class ArchKind {		enum class ArchKind {
#define AARCH64_ARCH(NAME, ID, CPU_ATTR, SUB_ARCH, ARCH_ATTR, ARCH_FPU, ARCH_BASE_EXT) ID,		#define AARCH64_ARCH(NAME, ID, CPU_ATTR, SUB_ARCH, ARCH_ATTR, ARCH_FPU, ARCH_BASE_EXT) ID,
#include "AArch64TargetParser.def"		#include "AArch64TargetParser.def"
};		};

const ARM::ArchNames<ArchKind> AArch64ARCHNames[] = {		const ARM::ArchNames<ArchKind> AArch64ARCHNames[] = {
▲ Show 20 Lines • Show All 73 Lines • Show Last 20 Lines

llvm/include/llvm/Support/AArch64TargetParser.def

Show All 38 Lines	AARCH64_ARCH("armv8.4-a", ARMV8_4A, "8.4-A", "v8.4a",
(AArch64::AEK_CRC \| AArch64::AEK_CRYPTO \| AArch64::AEK_FP \|		(AArch64::AEK_CRC \| AArch64::AEK_CRYPTO \| AArch64::AEK_FP \|
AArch64::AEK_SIMD \| AArch64::AEK_RAS \| AArch64::AEK_LSE \|		AArch64::AEK_SIMD \| AArch64::AEK_RAS \| AArch64::AEK_LSE \|
AArch64::AEK_RDM \| AArch64::AEK_RCPC \| AArch64::AEK_DOTPROD))		AArch64::AEK_RDM \| AArch64::AEK_RCPC \| AArch64::AEK_DOTPROD))
AARCH64_ARCH("armv8.5-a", ARMV8_5A, "8.5-A", "v8.5a",		AARCH64_ARCH("armv8.5-a", ARMV8_5A, "8.5-A", "v8.5a",
ARMBuildAttrs::CPUArch::v8_A, FK_CRYPTO_NEON_FP_ARMV8,		ARMBuildAttrs::CPUArch::v8_A, FK_CRYPTO_NEON_FP_ARMV8,
(AArch64::AEK_CRC \| AArch64::AEK_CRYPTO \| AArch64::AEK_FP \|		(AArch64::AEK_CRC \| AArch64::AEK_CRYPTO \| AArch64::AEK_FP \|
AArch64::AEK_SIMD \| AArch64::AEK_RAS \| AArch64::AEK_LSE \|		AArch64::AEK_SIMD \| AArch64::AEK_RAS \| AArch64::AEK_LSE \|
AArch64::AEK_RDM \| AArch64::AEK_RCPC \| AArch64::AEK_DOTPROD))		AArch64::AEK_RDM \| AArch64::AEK_RCPC \| AArch64::AEK_DOTPROD))
		AARCH64_ARCH("armv8.6-a", ARMV8_6A, "8.6-A", "v8.6a",
		ARMBuildAttrs::CPUArch::v8_A, FK_CRYPTO_NEON_FP_ARMV8,
		(AArch64::AEK_CRC \| AArch64::AEK_FP \|
		AArch64::AEK_SIMD \| AArch64::AEK_RAS \| AArch64::AEK_LSE \|
		AArch64::AEK_RDM \| AArch64::AEK_RCPC \| AArch64::AEK_DOTPROD \|
		AArch64::AEK_SM4 \| AArch64::AEK_SHA3 \| AArch64::AEK_BF16 \|
		SjoerdMeijerUnsubmitted Not Done Reply Inline Actions just double checking (because I can't remember): BF16 is a mandatory extension? SjoerdMeijer: just double checking (because I can't remember): BF16 is a mandatory extension?
		stuijAuthorUnsubmitted Done Reply Inline Actions for 8.2 it isn't, for 8.6 it is stuij: for 8.2 it isn't, for 8.6 it is
		abUnsubmitted Not Done Reply Inline Actions Belated question: what's the rationale for replacing `AEK_CRYPTO` with SM4+SHA3+SHA2(+AES)? I'm not aware of the required crypto bits changing, but maybe I missed something. There's a related question around how we should deal with crypto here in the first place (remove FK, remove the crypto exts?), but that seems orthogonal to v8.6a+ vs. v8.5a- implying different crypto extensions. For context, this comes up in D134351 where specifying `V8_6A` would enable SM4, which we don't support. ab: Belated question: what's the rationale for replacing `AEK_CRYPTO` with SM4+SHA3+SHA2(+AES)?
		stuijAuthorUnsubmitted Done Reply Inline Actions Belated (initial) answer: yes unfortunately our crypto story is a bit of a mess (mostly related to it mandatory yes or no). we have a catch-all ticket on our backlog to deal with crypto inconsistencies, which will hopefully be picked up soon. I've added your point, and so again hopefully soon we can provide clarity and smooth things out. stuij: Belated (initial) answer: yes unfortunately our crypto story is a bit of a mess (mostly related…
		AArch64::AEK_SHA2 \| AArch64::AEK_AES \| AArch64::AEK_I8MM))
#undef AARCH64_ARCH		#undef AARCH64_ARCH

#ifndef AARCH64_ARCH_EXT_NAME		#ifndef AARCH64_ARCH_EXT_NAME
#define AARCH64_ARCH_EXT_NAME(NAME, ID, FEATURE, NEGFEATURE)		#define AARCH64_ARCH_EXT_NAME(NAME, ID, FEATURE, NEGFEATURE)
#endif		#endif
// FIXME: This would be nicer were it tablegen		// FIXME: This would be nicer were it tablegen
AARCH64_ARCH_EXT_NAME("invalid", AArch64::AEK_INVALID, nullptr, nullptr)		AARCH64_ARCH_EXT_NAME("invalid", AArch64::AEK_INVALID, nullptr, nullptr)
AARCH64_ARCH_EXT_NAME("none", AArch64::AEK_NONE, nullptr, nullptr)		AARCH64_ARCH_EXT_NAME("none", AArch64::AEK_NONE, nullptr, nullptr)
Show All 19 Lines
AARCH64_ARCH_EXT_NAME("sve2-sha3", AArch64::AEK_SVE2SHA3, "+sve2-sha3", "-sve2-sha3")		AARCH64_ARCH_EXT_NAME("sve2-sha3", AArch64::AEK_SVE2SHA3, "+sve2-sha3", "-sve2-sha3")
AARCH64_ARCH_EXT_NAME("sve2-bitperm", AArch64::AEK_SVE2BITPERM, "+sve2-bitperm", "-sve2-bitperm")		AARCH64_ARCH_EXT_NAME("sve2-bitperm", AArch64::AEK_SVE2BITPERM, "+sve2-bitperm", "-sve2-bitperm")
AARCH64_ARCH_EXT_NAME("rcpc", AArch64::AEK_RCPC, "+rcpc", "-rcpc")		AARCH64_ARCH_EXT_NAME("rcpc", AArch64::AEK_RCPC, "+rcpc", "-rcpc")
AARCH64_ARCH_EXT_NAME("rng", AArch64::AEK_RAND, "+rand", "-rand")		AARCH64_ARCH_EXT_NAME("rng", AArch64::AEK_RAND, "+rand", "-rand")
AARCH64_ARCH_EXT_NAME("memtag", AArch64::AEK_MTE, "+mte", "-mte")		AARCH64_ARCH_EXT_NAME("memtag", AArch64::AEK_MTE, "+mte", "-mte")
AARCH64_ARCH_EXT_NAME("ssbs", AArch64::AEK_SSBS, "+ssbs", "-ssbs")		AARCH64_ARCH_EXT_NAME("ssbs", AArch64::AEK_SSBS, "+ssbs", "-ssbs")
AARCH64_ARCH_EXT_NAME("sb", AArch64::AEK_SB, "+sb", "-sb")		AARCH64_ARCH_EXT_NAME("sb", AArch64::AEK_SB, "+sb", "-sb")
AARCH64_ARCH_EXT_NAME("predres", AArch64::AEK_PREDRES, "+predres", "-predres")		AARCH64_ARCH_EXT_NAME("predres", AArch64::AEK_PREDRES, "+predres", "-predres")
		AARCH64_ARCH_EXT_NAME("bf16", AArch64::AEK_BF16, "+bf16", "-bf16")
		AARCH64_ARCH_EXT_NAME("i8mm", AArch64::AEK_I8MM, "+i8mm", "-i8mm")
AARCH64_ARCH_EXT_NAME("tme", AArch64::AEK_TME, "+tme", "-tme")		AARCH64_ARCH_EXT_NAME("tme", AArch64::AEK_TME, "+tme", "-tme")
#undef AARCH64_ARCH_EXT_NAME		#undef AARCH64_ARCH_EXT_NAME

#ifndef AARCH64_CPU_NAME		#ifndef AARCH64_CPU_NAME
#define AARCH64_CPU_NAME(NAME, ID, DEFAULT_FPU, IS_DEFAULT, DEFAULT_EXT)		#define AARCH64_CPU_NAME(NAME, ID, DEFAULT_FPU, IS_DEFAULT, DEFAULT_EXT)
#endif		#endif
AARCH64_CPU_NAME("cortex-a34", ARMV8A, FK_CRYPTO_NEON_FP_ARMV8, false,		AARCH64_CPU_NAME("cortex-a34", ARMV8A, FK_CRYPTO_NEON_FP_ARMV8, false,
(AArch64::AEK_CRC))		(AArch64::AEK_CRC))
▲ Show 20 Lines • Show All 84 Lines • Show Last 20 Lines

llvm/include/llvm/Support/ARMTargetParser.h

Show All 40 Lines	enum ArchExtKind : uint64_t {
AEK_RAS = 1 << 12,		AEK_RAS = 1 << 12,
AEK_DOTPROD = 1 << 13,		AEK_DOTPROD = 1 << 13,
AEK_SHA2 = 1 << 14,		AEK_SHA2 = 1 << 14,
AEK_AES = 1 << 15,		AEK_AES = 1 << 15,
AEK_FP16FML = 1 << 16,		AEK_FP16FML = 1 << 16,
AEK_SB = 1 << 17,		AEK_SB = 1 << 17,
AEK_FP_DP = 1 << 18,		AEK_FP_DP = 1 << 18,
AEK_LOB = 1 << 19,		AEK_LOB = 1 << 19,
AEK_CDECP0 = 1 << 20,		AEK_BF16 = 1 << 20,
AEK_CDECP1 = 1 << 21,		AEK_CDECP0 = 1 << 21,
AEK_CDECP2 = 1 << 22,		AEK_CDECP1 = 1 << 22,
AEK_CDECP3 = 1 << 23,		AEK_CDECP2 = 1 << 23,
AEK_CDECP4 = 1 << 24,		AEK_CDECP3 = 1 << 24,
AEK_CDECP5 = 1 << 25,		AEK_CDECP4 = 1 << 25,
AEK_CDECP6 = 1 << 26,		AEK_CDECP5 = 1 << 26,
AEK_CDECP7 = 1 << 27,		AEK_CDECP6 = 1 << 27,
		AEK_CDECP7 = 1 << 28,

// Unsupported extensions.		// Unsupported extensions.
AEK_OS = 1ULL << 59,		AEK_OS = 1ULL << 59,
AEK_IWMMXT = 1ULL << 60,		AEK_IWMMXT = 1ULL << 60,
AEK_IWMMXT2 = 1ULL << 61,		AEK_IWMMXT2 = 1ULL << 61,
AEK_MAVERICK = 1ULL << 62,		AEK_MAVERICK = 1ULL << 62,
AEK_XSCALE = 1ULL << 63,		AEK_XSCALE = 1ULL << 63,
};		};
▲ Show 20 Lines • Show All 212 Lines • Show Last 20 Lines

llvm/include/llvm/Support/ARMTargetParser.def

Show First 20 Lines • Show All 106 Lines • ▼ Show 20 Lines	ARM_ARCH("armv8.4-a", ARMV8_4A, "8.4-A", "v8.4a",
(ARM::AEK_SEC \| ARM::AEK_MP \| ARM::AEK_VIRT \| ARM::AEK_HWDIVARM \|		(ARM::AEK_SEC \| ARM::AEK_MP \| ARM::AEK_VIRT \| ARM::AEK_HWDIVARM \|
ARM::AEK_HWDIVTHUMB \| ARM::AEK_DSP \| ARM::AEK_CRC \| ARM::AEK_RAS \|		ARM::AEK_HWDIVTHUMB \| ARM::AEK_DSP \| ARM::AEK_CRC \| ARM::AEK_RAS \|
ARM::AEK_DOTPROD))		ARM::AEK_DOTPROD))
ARM_ARCH("armv8.5-a", ARMV8_5A, "8.5-A", "v8.5a",		ARM_ARCH("armv8.5-a", ARMV8_5A, "8.5-A", "v8.5a",
ARMBuildAttrs::CPUArch::v8_A, FK_CRYPTO_NEON_FP_ARMV8,		ARMBuildAttrs::CPUArch::v8_A, FK_CRYPTO_NEON_FP_ARMV8,
(ARM::AEK_SEC \| ARM::AEK_MP \| ARM::AEK_VIRT \| ARM::AEK_HWDIVARM \|		(ARM::AEK_SEC \| ARM::AEK_MP \| ARM::AEK_VIRT \| ARM::AEK_HWDIVARM \|
ARM::AEK_HWDIVTHUMB \| ARM::AEK_DSP \| ARM::AEK_CRC \| ARM::AEK_RAS \|		ARM::AEK_HWDIVTHUMB \| ARM::AEK_DSP \| ARM::AEK_CRC \| ARM::AEK_RAS \|
ARM::AEK_DOTPROD))		ARM::AEK_DOTPROD))
		ARM_ARCH("armv8.6-a", ARMV8_6A, "8.6-A", "v8.6a",
		ARMBuildAttrs::CPUArch::v8_A, FK_CRYPTO_NEON_FP_ARMV8,
		(ARM::AEK_SEC \| ARM::AEK_MP \| ARM::AEK_VIRT \| ARM::AEK_HWDIVARM \|
		ARM::AEK_HWDIVTHUMB \| ARM::AEK_DSP \| ARM::AEK_CRC \| ARM::AEK_RAS \|
		ARM::AEK_DOTPROD \| ARM::AEK_BF16 \| ARM::AEK_SHA2 \| ARM::AEK_AES))
ARM_ARCH("armv8-r", ARMV8R, "8-R", "v8r", ARMBuildAttrs::CPUArch::v8_R,		ARM_ARCH("armv8-r", ARMV8R, "8-R", "v8r", ARMBuildAttrs::CPUArch::v8_R,
FK_NEON_FP_ARMV8,		FK_NEON_FP_ARMV8,
(ARM::AEK_MP \| ARM::AEK_VIRT \| ARM::AEK_HWDIVARM \| ARM::AEK_HWDIVTHUMB \|		(ARM::AEK_MP \| ARM::AEK_VIRT \| ARM::AEK_HWDIVARM \| ARM::AEK_HWDIVTHUMB \|
ARM::AEK_DSP \| ARM::AEK_CRC))		ARM::AEK_DSP \| ARM::AEK_CRC))
ARM_ARCH("armv8-m.base", ARMV8MBaseline, "8-M.Baseline", "v8m.base",		ARM_ARCH("armv8-m.base", ARMV8MBaseline, "8-M.Baseline", "v8m.base",
ARMBuildAttrs::CPUArch::v8_M_Base, FK_NONE, ARM::AEK_HWDIVTHUMB)		ARMBuildAttrs::CPUArch::v8_M_Base, FK_NONE, ARM::AEK_HWDIVTHUMB)
ARM_ARCH("armv8-m.main", ARMV8MMainline, "8-M.Mainline", "v8m.main",		ARM_ARCH("armv8-m.main", ARMV8MMainline, "8-M.Mainline", "v8m.main",
ARMBuildAttrs::CPUArch::v8_M_Main, FK_FPV5_D16, ARM::AEK_HWDIVTHUMB)		ARMBuildAttrs::CPUArch::v8_M_Main, FK_FPV5_D16, ARM::AEK_HWDIVTHUMB)
Show All 36 Lines
ARM_ARCH_EXT_NAME("fp16", ARM::AEK_FP16, "+fullfp16", "-fullfp16")		ARM_ARCH_EXT_NAME("fp16", ARM::AEK_FP16, "+fullfp16", "-fullfp16")
ARM_ARCH_EXT_NAME("ras", ARM::AEK_RAS, "+ras", "-ras")		ARM_ARCH_EXT_NAME("ras", ARM::AEK_RAS, "+ras", "-ras")
ARM_ARCH_EXT_NAME("os", ARM::AEK_OS, nullptr, nullptr)		ARM_ARCH_EXT_NAME("os", ARM::AEK_OS, nullptr, nullptr)
ARM_ARCH_EXT_NAME("iwmmxt", ARM::AEK_IWMMXT, nullptr, nullptr)		ARM_ARCH_EXT_NAME("iwmmxt", ARM::AEK_IWMMXT, nullptr, nullptr)
ARM_ARCH_EXT_NAME("iwmmxt2", ARM::AEK_IWMMXT2, nullptr, nullptr)		ARM_ARCH_EXT_NAME("iwmmxt2", ARM::AEK_IWMMXT2, nullptr, nullptr)
ARM_ARCH_EXT_NAME("maverick", ARM::AEK_MAVERICK, nullptr, nullptr)		ARM_ARCH_EXT_NAME("maverick", ARM::AEK_MAVERICK, nullptr, nullptr)
ARM_ARCH_EXT_NAME("xscale", ARM::AEK_XSCALE, nullptr, nullptr)		ARM_ARCH_EXT_NAME("xscale", ARM::AEK_XSCALE, nullptr, nullptr)
ARM_ARCH_EXT_NAME("fp16fml", ARM::AEK_FP16FML, "+fp16fml", "-fp16fml")		ARM_ARCH_EXT_NAME("fp16fml", ARM::AEK_FP16FML, "+fp16fml", "-fp16fml")
		ARM_ARCH_EXT_NAME("bf16", ARM::AEK_BF16, "+bf16", "-bf16")
ARM_ARCH_EXT_NAME("sb", ARM::AEK_SB, "+sb", "-sb")		ARM_ARCH_EXT_NAME("sb", ARM::AEK_SB, "+sb", "-sb")
ARM_ARCH_EXT_NAME("lob", ARM::AEK_LOB, "+lob", "-lob")		ARM_ARCH_EXT_NAME("lob", ARM::AEK_LOB, "+lob", "-lob")
ARM_ARCH_EXT_NAME("cdecp0", ARM::AEK_CDECP0, "+cdecp0", "-cdecp0")		ARM_ARCH_EXT_NAME("cdecp0", ARM::AEK_CDECP0, "+cdecp0", "-cdecp0")
ARM_ARCH_EXT_NAME("cdecp1", ARM::AEK_CDECP1, "+cdecp1", "-cdecp1")		ARM_ARCH_EXT_NAME("cdecp1", ARM::AEK_CDECP1, "+cdecp1", "-cdecp1")
ARM_ARCH_EXT_NAME("cdecp2", ARM::AEK_CDECP2, "+cdecp2", "-cdecp2")		ARM_ARCH_EXT_NAME("cdecp2", ARM::AEK_CDECP2, "+cdecp2", "-cdecp2")
ARM_ARCH_EXT_NAME("cdecp3", ARM::AEK_CDECP3, "+cdecp3", "-cdecp3")		ARM_ARCH_EXT_NAME("cdecp3", ARM::AEK_CDECP3, "+cdecp3", "-cdecp3")
ARM_ARCH_EXT_NAME("cdecp4", ARM::AEK_CDECP4, "+cdecp4", "-cdecp4")		ARM_ARCH_EXT_NAME("cdecp4", ARM::AEK_CDECP4, "+cdecp4", "-cdecp4")
ARM_ARCH_EXT_NAME("cdecp5", ARM::AEK_CDECP5, "+cdecp5", "-cdecp5")		ARM_ARCH_EXT_NAME("cdecp5", ARM::AEK_CDECP5, "+cdecp5", "-cdecp5")
▲ Show 20 Lines • Show All 129 Lines • Show Last 20 Lines

llvm/lib/Support/AArch64TargetParser.cpp

Show First 20 Lines • Show All 110 Lines • ▼ Show 20 Lines	bool AArch64::getArchFeatures(AArch64::ArchKind AK,
if (AK == ArchKind::ARMV8_2A)		if (AK == ArchKind::ARMV8_2A)
Features.push_back("+v8.2a");		Features.push_back("+v8.2a");
if (AK == ArchKind::ARMV8_3A)		if (AK == ArchKind::ARMV8_3A)
Features.push_back("+v8.3a");		Features.push_back("+v8.3a");
if (AK == ArchKind::ARMV8_4A)		if (AK == ArchKind::ARMV8_4A)
Features.push_back("+v8.4a");		Features.push_back("+v8.4a");
if (AK == ArchKind::ARMV8_5A)		if (AK == ArchKind::ARMV8_5A)
Features.push_back("+v8.5a");		Features.push_back("+v8.5a");
		if (AK == AArch64::ArchKind::ARMV8_6A)
		Features.push_back("+v8.6a");

return AK != ArchKind::INVALID;		return AK != ArchKind::INVALID;
}		}

StringRef AArch64::getArchName(AArch64::ArchKind AK) {		StringRef AArch64::getArchName(AArch64::ArchKind AK) {
return AArch64ARCHNames[static_cast<unsigned>(AK)].getName();		return AArch64ARCHNames[static_cast<unsigned>(AK)].getName();
}		}

▲ Show 20 Lines • Show All 137 Lines • Show Last 20 Lines

llvm/lib/Support/ARMTargetParser.cpp

Show First 20 Lines • Show All 68 Lines • ▼ Show 20 Lines	unsigned ARM::parseArchVersion(StringRef Arch) {
case ArchKind::ARMV7K:		case ArchKind::ARMV7K:
return 7;		return 7;
case ArchKind::ARMV8A:		case ArchKind::ARMV8A:
case ArchKind::ARMV8_1A:		case ArchKind::ARMV8_1A:
case ArchKind::ARMV8_2A:		case ArchKind::ARMV8_2A:
case ArchKind::ARMV8_3A:		case ArchKind::ARMV8_3A:
case ArchKind::ARMV8_4A:		case ArchKind::ARMV8_4A:
case ArchKind::ARMV8_5A:		case ArchKind::ARMV8_5A:
		case ArchKind::ARMV8_6A:
case ArchKind::ARMV8R:		case ArchKind::ARMV8R:
case ArchKind::ARMV8MBaseline:		case ArchKind::ARMV8MBaseline:
case ArchKind::ARMV8MMainline:		case ArchKind::ARMV8MMainline:
case ArchKind::ARMV8_1MMainline:		case ArchKind::ARMV8_1MMainline:
return 8;		return 8;
case ArchKind::INVALID:		case ArchKind::INVALID:
return 0;		return 0;
}		}
Show All 18 Lines	ARM::ProfileKind ARM::parseArchProfile(StringRef Arch) {
case ArchKind::ARMV7VE:		case ArchKind::ARMV7VE:
case ArchKind::ARMV7K:		case ArchKind::ARMV7K:
case ArchKind::ARMV8A:		case ArchKind::ARMV8A:
case ArchKind::ARMV8_1A:		case ArchKind::ARMV8_1A:
case ArchKind::ARMV8_2A:		case ArchKind::ARMV8_2A:
case ArchKind::ARMV8_3A:		case ArchKind::ARMV8_3A:
case ArchKind::ARMV8_4A:		case ArchKind::ARMV8_4A:
case ArchKind::ARMV8_5A:		case ArchKind::ARMV8_5A:
		case ArchKind::ARMV8_6A:
return ProfileKind::A;		return ProfileKind::A;
case ArchKind::ARMV2:		case ArchKind::ARMV2:
case ArchKind::ARMV2A:		case ArchKind::ARMV2A:
case ArchKind::ARMV3:		case ArchKind::ARMV3:
case ArchKind::ARMV3M:		case ArchKind::ARMV3M:
case ArchKind::ARMV4:		case ArchKind::ARMV4:
case ArchKind::ARMV4T:		case ArchKind::ARMV4T:
case ArchKind::ARMV5T:		case ArchKind::ARMV5T:
Show All 26 Lines	return StringSwitch<StringRef>(Arch)
.Case("v7m", "v7-m")		.Case("v7m", "v7-m")
.Case("v7em", "v7e-m")		.Case("v7em", "v7e-m")
.Cases("v8", "v8a", "v8l", "aarch64", "arm64", "v8-a")		.Cases("v8", "v8a", "v8l", "aarch64", "arm64", "v8-a")
.Case("v8.1a", "v8.1-a")		.Case("v8.1a", "v8.1-a")
.Case("v8.2a", "v8.2-a")		.Case("v8.2a", "v8.2-a")
.Case("v8.3a", "v8.3-a")		.Case("v8.3a", "v8.3-a")
.Case("v8.4a", "v8.4-a")		.Case("v8.4a", "v8.4-a")
.Case("v8.5a", "v8.5-a")		.Case("v8.5a", "v8.5-a")
		.Case("v8.6a", "v8.6-a")
.Case("v8r", "v8-r")		.Case("v8r", "v8-r")
.Case("v8m.base", "v8-m.base")		.Case("v8m.base", "v8-m.base")
.Case("v8m.main", "v8-m.main")		.Case("v8m.main", "v8-m.main")
.Case("v8.1m.main", "v8.1-m.main")		.Case("v8.1m.main", "v8.1-m.main")
.Default(Arch);		.Default(Arch);
}		}

bool ARM::getFPUFeatures(unsigned FPUKind, std::vector<StringRef> &Features) {		bool ARM::getFPUFeatures(unsigned FPUKind, std::vector<StringRef> &Features) {
▲ Show 20 Lines • Show All 460 Lines • Show Last 20 Lines

llvm/lib/Support/Triple.cpp

Show First 20 Lines • Show All 621 Lines • ▼ Show 20 Lines	static Triple::SubArchType parseSubArch(StringRef SubArchName) {
case ARM::ArchKind::ARMV8_2A:		case ARM::ArchKind::ARMV8_2A:
return Triple::ARMSubArch_v8_2a;		return Triple::ARMSubArch_v8_2a;
case ARM::ArchKind::ARMV8_3A:		case ARM::ArchKind::ARMV8_3A:
return Triple::ARMSubArch_v8_3a;		return Triple::ARMSubArch_v8_3a;
case ARM::ArchKind::ARMV8_4A:		case ARM::ArchKind::ARMV8_4A:
return Triple::ARMSubArch_v8_4a;		return Triple::ARMSubArch_v8_4a;
case ARM::ArchKind::ARMV8_5A:		case ARM::ArchKind::ARMV8_5A:
return Triple::ARMSubArch_v8_5a;		return Triple::ARMSubArch_v8_5a;
		case ARM::ArchKind::ARMV8_6A:
		return Triple::ARMSubArch_v8_6a;
case ARM::ArchKind::ARMV8R:		case ARM::ArchKind::ARMV8R:
return Triple::ARMSubArch_v8r;		return Triple::ARMSubArch_v8r;
case ARM::ArchKind::ARMV8MBaseline:		case ARM::ArchKind::ARMV8MBaseline:
return Triple::ARMSubArch_v8m_baseline;		return Triple::ARMSubArch_v8m_baseline;
case ARM::ArchKind::ARMV8MMainline:		case ARM::ArchKind::ARMV8MMainline:
return Triple::ARMSubArch_v8m_mainline;		return Triple::ARMSubArch_v8m_mainline;
case ARM::ArchKind::ARMV8_1MMainline:		case ARM::ArchKind::ARMV8_1MMainline:
return Triple::ARMSubArch_v8_1m_mainline;		return Triple::ARMSubArch_v8_1m_mainline;
▲ Show 20 Lines • Show All 1,029 Lines • Show Last 20 Lines

llvm/lib/Target/AArch64/AArch64.td

Show First 20 Lines • Show All 359 Lines • ▼ Show 20 Lines
def FeatureTME : SubtargetFeature<"tme", "HasTME",		def FeatureTME : SubtargetFeature<"tme", "HasTME",
"true", "Enable Transactional Memory Extension" >;		"true", "Enable Transactional Memory Extension" >;

def FeatureTaggedGlobals : SubtargetFeature<"tagged-globals",		def FeatureTaggedGlobals : SubtargetFeature<"tagged-globals",
"AllowTaggedGlobals",		"AllowTaggedGlobals",
"true", "Use an instruction sequence for taking the address of a global "		"true", "Use an instruction sequence for taking the address of a global "
"that allows a memory tag in the upper address bits">;		"that allows a memory tag in the upper address bits">;

		def FeatureBF16 : SubtargetFeature<"bf16", "HasBF16",
		"true", "Enable BFloat16 Extension" >;

//===----------------------------------------------------------------------===//		//===----------------------------------------------------------------------===//
// Architectures.		// Architectures.
//		//

def HasV8_1aOps : SubtargetFeature<"v8.1a", "HasV8_1aOps", "true",		def HasV8_1aOps : SubtargetFeature<"v8.1a", "HasV8_1aOps", "true",
"Support ARM v8.1a instructions", [FeatureCRC, FeatureLSE, FeatureRDM,		"Support ARM v8.1a instructions", [FeatureCRC, FeatureLSE, FeatureRDM,
FeaturePAN, FeatureLOR, FeatureVH]>;		FeaturePAN, FeatureLOR, FeatureVH]>;

Show All 10 Lines	def HasV8_4aOps : SubtargetFeature<"v8.4a", "HasV8_4aOps", "true",
FeatureNV, FeatureRASv8_4, FeatureMPAM, FeatureDIT,		FeatureNV, FeatureRASv8_4, FeatureMPAM, FeatureDIT,
FeatureTRACEV8_4, FeatureAM, FeatureSEL2, FeaturePMU, FeatureTLB_RMI,		FeatureTRACEV8_4, FeatureAM, FeatureSEL2, FeaturePMU, FeatureTLB_RMI,
FeatureFMI, FeatureRCPC_IMMO]>;		FeatureFMI, FeatureRCPC_IMMO]>;

def HasV8_5aOps : SubtargetFeature<		def HasV8_5aOps : SubtargetFeature<
"v8.5a", "HasV8_5aOps", "true", "Support ARM v8.5a instructions",		"v8.5a", "HasV8_5aOps", "true", "Support ARM v8.5a instructions",
[HasV8_4aOps, FeatureAltFPCmp, FeatureFRInt3264, FeatureSpecRestrict,		[HasV8_4aOps, FeatureAltFPCmp, FeatureFRInt3264, FeatureSpecRestrict,
FeatureSSBS, FeatureSB, FeaturePredRes, FeatureCacheDeepPersist,		FeatureSSBS, FeatureSB, FeaturePredRes, FeatureCacheDeepPersist,
FeatureBranchTargetId]		FeatureBranchTargetId]>;
>;
		def HasV8_6aOps : SubtargetFeature<
		"v8.6a", "HasV8_6aOps", "true", "Support ARM v8.6a instructions",
		[HasV8_5aOps, FeatureBF16]>;

//===----------------------------------------------------------------------===//		//===----------------------------------------------------------------------===//
// Register File Description		// Register File Description
//===----------------------------------------------------------------------===//		//===----------------------------------------------------------------------===//

include "AArch64RegisterInfo.td"		include "AArch64RegisterInfo.td"
include "AArch64RegisterBanks.td"		include "AArch64RegisterBanks.td"
include "AArch64CallingConvention.td"		include "AArch64CallingConvention.td"
▲ Show 20 Lines • Show All 570 Lines • Show Last 20 Lines

llvm/lib/Target/AArch64/AArch64InstrFormats.td

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 7,780 Lines • ▼ Show 20 Lines	class BaseSIMDIndexedTied<bit Q, bit U, bit Scalar, bits<2> size, bits<4> opc,
let Inst{20-16} = Rm;		let Inst{20-16} = Rm;
let Inst{15-12} = opc;		let Inst{15-12} = opc;
// Bit 11 must be set by the derived class.		// Bit 11 must be set by the derived class.
let Inst{10} = 0;		let Inst{10} = 0;
let Inst{9-5} = Rn;		let Inst{9-5} = Rn;
let Inst{4-0} = Rd;		let Inst{4-0} = Rd;
}		}


		//----------------------------------------------------------------------------
		// Armv8.6 BFloat16 Extension
		//----------------------------------------------------------------------------
		let mayStore = 0, mayLoad = 0, hasSideEffects = 0 in {

		class BaseSIMDThreeSameVectorBFDot<bit Q, bit U, string asm, string kind1,
		string kind2, RegisterOperand RegType,
		ValueType AccumType, ValueType InputType>
		: BaseSIMDThreeSameVectorTied<Q, U, 0b010, 0b11111, RegType, asm, kind1, []> {
		let AsmString = !strconcat(asm,
		"{\t$Rd" # kind1 # ", $Rn" # kind2 #
		", $Rm" # kind2 # "}");
		}

		multiclass SIMDThreeSameVectorBFDot<bit U, string asm> {
		def v4f16 : BaseSIMDThreeSameVectorBFDot<0, U, asm, ".2s", ".4h", V64,
		v2f32, v8i8>;
		SjoerdMeijerUnsubmitted Done Reply Inline Actions nit: indentation is a bit off here SjoerdMeijer: nit: indentation is a bit off here
		def v8f16 : BaseSIMDThreeSameVectorBFDot<1, U, asm, ".4s", ".8h", V128,
		v4f32, v16i8>;
		SjoerdMeijerUnsubmitted Done Reply Inline Actions here too SjoerdMeijer: here too
		}

		class BaseSIMDThreeSameVectorBF16DotI<bit Q, bit U, string asm,
		string dst_kind, string lhs_kind,
		SjoerdMeijerUnsubmitted Done Reply Inline Actions and here SjoerdMeijer: and here
		string rhs_kind,
		RegisterOperand RegType,
		ValueType AccumType,
		ValueType InputType>
		: BaseSIMDIndexedTied<Q, U, 0b0, 0b01, 0b1111,
		RegType, RegType, V128, VectorIndexS,
		asm, "", dst_kind, lhs_kind, rhs_kind,
		[]> {
		SjoerdMeijerUnsubmitted Done Reply Inline Actions and this can be on the same line as above? SjoerdMeijer: and this can be on the same line as above?

		bits<2> idx;
		let Inst{21} = idx{0}; // L
		let Inst{11} = idx{1}; // H
		}

		multiclass SIMDThreeSameVectorBF16DotI<bit U, string asm> {

		def v4f16 : BaseSIMDThreeSameVectorBF16DotI<0, U, asm, ".2s", ".4h",
		".2h", V64, v2f32, v8i8>;
		def v8f16 : BaseSIMDThreeSameVectorBF16DotI<1, U, asm, ".4s", ".8h",
		".2h", V128, v4f32, v16i8>;
		}

		class SIMDBF16MLAL<bit Q, string asm>
		: BaseSIMDThreeSameVectorTied<Q, 0b1, 0b110, 0b11111, V128, asm, ".4s",
		[]> { // TODO: Add intrinsics
		let AsmString = !strconcat(asm, "{\t$Rd.4s, $Rn.8h, $Rm.8h}");
		}

		class SIMDBF16MLALIndex<bit Q, string asm>
		: I<(outs V128:$dst),
		(ins V128:$Rd, V128:$Rn, V128_lo:$Rm, VectorIndexH:$idx), asm,
		"{\t$Rd.4s, $Rn.8h, $Rm.h$idx}", "$Rd = $dst",
		[]>, // TODO: Add intrinsics
		Sched<[WriteV]> {
		bits<5> Rd;
		bits<5> Rn;
		bits<4> Rm;
		bits<3> idx;

		let Inst{31} = 0;
		let Inst{30} = Q;
		let Inst{29-22} = 0b00111111;
		let Inst{21-20} = idx{1-0};
		let Inst{19-16} = Rm;
		let Inst{15-12} = 0b1111;
		let Inst{11} = idx{2}; // H
		let Inst{10} = 0;
		let Inst{9-5} = Rn;
		let Inst{4-0} = Rd;
		}

		class SIMDThreeSameVectorBF16MatrixMul<string asm>
		: BaseSIMDThreeSameVectorTied<1, 1, 0b010, 0b11101,
		V128, asm, ".4s",
		[]> {
		SjoerdMeijerUnsubmitted Done Reply Inline Actions and perhaps this one. But looks intentional, perhaps it's fine then, I don't know. SjoerdMeijer: and perhaps this one. But looks intentional, perhaps it's fine then, I don't know.
		stuijAuthorUnsubmitted Done Reply Inline Actions Yes, the square brackets will be filled in in a next patch. I'll just leave them as is. stuij: Yes, the square brackets will be filled in in a next patch. I'll just leave them as is.
		let AsmString = !strconcat(asm, "{\t$Rd", ".4s", ", $Rn", ".8h",
		", $Rm", ".8h", "}");
		}

		class SIMD_BFCVTN
		: BaseSIMDMixedTwoVector<0, 0, 0b10, 0b10110, V128, V128,
		"bfcvtn", ".4h", ".4s",
		[]>;

		class SIMD_BFCVTN2
		: BaseSIMDMixedTwoVectorTied<1, 0, 0b10, 0b10110, V128, V128,
		"bfcvtn2", ".8h", ".4s",
		[]>;

		class BF16ToSinglePrecision<string asm>
		: I<(outs FPR16:$Rd), (ins FPR32:$Rn), asm, "\t$Rd, $Rn", "", []>,
		Sched<[WriteFCvt]> {
		bits<5> Rd;
		bits<5> Rn;
		let Inst{31-10} = 0b0001111001100011010000;
		let Inst{9-5} = Rn;
		let Inst{4-0} = Rd;
		}
		} // End of let mayStore = 0, mayLoad = 0, hasSideEffects = 0

// ARMv8.2-A Dot Product Instructions (Indexed)		// ARMv8.2-A Dot Product Instructions (Indexed)
class BaseSIMDThreeSameVectorDotIndex<bit Q, bit U, string asm, string dst_kind,		class BaseSIMDThreeSameVectorDotIndex<bit Q, bit U, string asm, string dst_kind,
string lhs_kind, string rhs_kind,		string lhs_kind, string rhs_kind,
RegisterOperand RegType,		RegisterOperand RegType,
ValueType AccumType, ValueType InputType,		ValueType AccumType, ValueType InputType,
SDPatternOperator OpNode> :		SDPatternOperator OpNode> :
BaseSIMDIndexedTied<Q, U, 0b0, 0b10, 0b1110, RegType, RegType, V128,		BaseSIMDIndexedTied<Q, U, 0b0, 0b10, 0b1110, RegType, RegType, V128,
VectorIndexS, asm, "", dst_kind, lhs_kind, rhs_kind,		VectorIndexS, asm, "", dst_kind, lhs_kind, rhs_kind,
▲ Show 20 Lines • Show All 3,252 Lines • Show Last 20 Lines

llvm/lib/Target/AArch64/AArch64InstrInfo.td

This file is larger than 256 KB, so syntax highlighting is disabled by default.

	Show All 17 Lines
	def HasV8_2a : Predicate<"Subtarget->hasV8_2aOps()">,			def HasV8_2a : Predicate<"Subtarget->hasV8_2aOps()">,
	AssemblerPredicate<(all_of HasV8_2aOps), "armv8.2a">;			AssemblerPredicate<(all_of HasV8_2aOps), "armv8.2a">;
	def HasV8_3a : Predicate<"Subtarget->hasV8_3aOps()">,			def HasV8_3a : Predicate<"Subtarget->hasV8_3aOps()">,
	AssemblerPredicate<(all_of HasV8_3aOps), "armv8.3a">;			AssemblerPredicate<(all_of HasV8_3aOps), "armv8.3a">;
	def HasV8_4a : Predicate<"Subtarget->hasV8_4aOps()">,			def HasV8_4a : Predicate<"Subtarget->hasV8_4aOps()">,
	AssemblerPredicate<(all_of HasV8_4aOps), "armv8.4a">;			AssemblerPredicate<(all_of HasV8_4aOps), "armv8.4a">;
	def HasV8_5a : Predicate<"Subtarget->hasV8_5aOps()">,			def HasV8_5a : Predicate<"Subtarget->hasV8_5aOps()">,
	AssemblerPredicate<(all_of HasV8_5aOps), "armv8.5a">;			AssemblerPredicate<(all_of HasV8_5aOps), "armv8.5a">;
				def HasV8_6a : Predicate<"Subtarget->hasV8_6aOps()">,
				AssemblerPredicate<(all_of HasV8_6aOps), "armv8.6a">;
	def HasVH : Predicate<"Subtarget->hasVH()">,			def HasVH : Predicate<"Subtarget->hasVH()">,
	AssemblerPredicate<(all_of FeatureVH), "vh">;			AssemblerPredicate<(all_of FeatureVH), "vh">;

	def HasLOR : Predicate<"Subtarget->hasLOR()">,			def HasLOR : Predicate<"Subtarget->hasLOR()">,
	AssemblerPredicate<(all_of FeatureLOR), "lor">;			AssemblerPredicate<(all_of FeatureLOR), "lor">;

	def HasPA : Predicate<"Subtarget->hasPA()">,			def HasPA : Predicate<"Subtarget->hasPA()">,
	AssemblerPredicate<(all_of FeaturePA), "pa">;			AssemblerPredicate<(all_of FeaturePA), "pa">;
	▲ Show 20 Lines • Show All 103 Lines • ▼ Show 20 Lines
	def HasMTE : Predicate<"Subtarget->hasMTE()">,			def HasMTE : Predicate<"Subtarget->hasMTE()">,
	AssemblerPredicate<(all_of FeatureMTE), "mte">;			AssemblerPredicate<(all_of FeatureMTE), "mte">;
	def HasTME : Predicate<"Subtarget->hasTME()">,			def HasTME : Predicate<"Subtarget->hasTME()">,
	AssemblerPredicate<(all_of FeatureTME), "tme">;			AssemblerPredicate<(all_of FeatureTME), "tme">;
	def HasETE : Predicate<"Subtarget->hasETE()">,			def HasETE : Predicate<"Subtarget->hasETE()">,
	AssemblerPredicate<(all_of FeatureETE), "ete">;			AssemblerPredicate<(all_of FeatureETE), "ete">;
	def HasTRBE : Predicate<"Subtarget->hasTRBE()">,			def HasTRBE : Predicate<"Subtarget->hasTRBE()">,
	AssemblerPredicate<(all_of FeatureTRBE), "trbe">;			AssemblerPredicate<(all_of FeatureTRBE), "trbe">;
				def HasBF16 : Predicate<"Subtarget->hasBF16()">,
				AssemblerPredicate<(all_of FeatureBF16), "bf16">;
	def IsLE : Predicate<"Subtarget->isLittleEndian()">;			def IsLE : Predicate<"Subtarget->isLittleEndian()">;
	def IsBE : Predicate<"!Subtarget->isLittleEndian()">;			def IsBE : Predicate<"!Subtarget->isLittleEndian()">;
	def IsWindows : Predicate<"Subtarget->isTargetWindows()">;			def IsWindows : Predicate<"Subtarget->isTargetWindows()">;
	def UseAlternateSExtLoadCVTF32			def UseAlternateSExtLoadCVTF32
	: Predicate<"Subtarget->useAlternateSExtLoadCVTF32Pattern()">;			: Predicate<"Subtarget->useAlternateSExtLoadCVTF32Pattern()">;

	def UseNegativeImmediates			def UseNegativeImmediates
	: Predicate<"false">, AssemblerPredicate<(all_of (not FeatureNoNegativeImmediates)),			: Predicate<"false">, AssemblerPredicate<(all_of (not FeatureNoNegativeImmediates)),
	▲ Show 20 Lines • Show All 588 Lines • ▼ Show 20 Lines
	// ARMv8.2-A Dot Product			// ARMv8.2-A Dot Product
	let Predicates = [HasDotProd] in {			let Predicates = [HasDotProd] in {
	defm SDOT : SIMDThreeSameVectorDot<0, "sdot", int_aarch64_neon_sdot>;			defm SDOT : SIMDThreeSameVectorDot<0, "sdot", int_aarch64_neon_sdot>;
	defm UDOT : SIMDThreeSameVectorDot<1, "udot", int_aarch64_neon_udot>;			defm UDOT : SIMDThreeSameVectorDot<1, "udot", int_aarch64_neon_udot>;
	defm SDOTlane : SIMDThreeSameVectorDotIndex<0, "sdot", int_aarch64_neon_sdot>;			defm SDOTlane : SIMDThreeSameVectorDotIndex<0, "sdot", int_aarch64_neon_sdot>;
	defm UDOTlane : SIMDThreeSameVectorDotIndex<1, "udot", int_aarch64_neon_udot>;			defm UDOTlane : SIMDThreeSameVectorDotIndex<1, "udot", int_aarch64_neon_udot>;
	}			}

				// ARMv8.6-A BFloat
				let Predicates = [HasBF16] in {
				defm BFDOT : SIMDThreeSameVectorBFDot<1, "bfdot">;
				defm BF16DOTlane : SIMDThreeSameVectorBF16DotI<0, "bfdot">;
				def BFMMLA : SIMDThreeSameVectorBF16MatrixMul<"bfmmla">;
				def BFMLALB : SIMDBF16MLAL<0, "bfmlalb">;
				def BFMLALT : SIMDBF16MLAL<1, "bfmlalt">;
				def BFMLALBIdx : SIMDBF16MLALIndex<0, "bfmlalb">;
				def BFMLALTIdx : SIMDBF16MLALIndex<1, "bfmlalt">;
				def BFCVTN : SIMD_BFCVTN;
				def BFCVTN2 : SIMD_BFCVTN2;
				def BFCVT : BF16ToSinglePrecision<"bfcvt">;
				}

	// ARMv8.2-A FP16 Fused Multiply-Add Long			// ARMv8.2-A FP16 Fused Multiply-Add Long
	let Predicates = [HasNEON, HasFP16FML] in {			let Predicates = [HasNEON, HasFP16FML] in {
	defm FMLAL : SIMDThreeSameVectorFML<0, 1, 0b001, "fmlal", int_aarch64_neon_fmlal>;			defm FMLAL : SIMDThreeSameVectorFML<0, 1, 0b001, "fmlal", int_aarch64_neon_fmlal>;
	defm FMLSL : SIMDThreeSameVectorFML<0, 1, 0b101, "fmlsl", int_aarch64_neon_fmlsl>;			defm FMLSL : SIMDThreeSameVectorFML<0, 1, 0b101, "fmlsl", int_aarch64_neon_fmlsl>;
	defm FMLAL2 : SIMDThreeSameVectorFML<1, 0, 0b001, "fmlal2", int_aarch64_neon_fmlal2>;			defm FMLAL2 : SIMDThreeSameVectorFML<1, 0, 0b001, "fmlal2", int_aarch64_neon_fmlal2>;
	defm FMLSL2 : SIMDThreeSameVectorFML<1, 0, 0b101, "fmlsl2", int_aarch64_neon_fmlsl2>;			defm FMLSL2 : SIMDThreeSameVectorFML<1, 0, 0b101, "fmlsl2", int_aarch64_neon_fmlsl2>;
	defm FMLALlane : SIMDThreeSameVectorFMLIndex<0, 0b0000, "fmlal", int_aarch64_neon_fmlal>;			defm FMLALlane : SIMDThreeSameVectorFMLIndex<0, 0b0000, "fmlal", int_aarch64_neon_fmlal>;
	defm FMLSLlane : SIMDThreeSameVectorFMLIndex<0, 0b0100, "fmlsl", int_aarch64_neon_fmlsl>;			defm FMLSLlane : SIMDThreeSameVectorFMLIndex<0, 0b0100, "fmlsl", int_aarch64_neon_fmlsl>;
	▲ Show 20 Lines • Show All 6,592 Lines • Show Last 20 Lines

llvm/lib/Target/AArch64/AArch64SVEInstrInfo.td

Show First 20 Lines • Show All 1,191 Lines • ▼ Show 20 Lines	multiclass sve_prefetch<SDPatternOperator prefetch, ValueType PredTy, Instruction RegImmInst, Instruction RegRegInst, int scale, ComplexPattern AddrCP> {
defm FRINTM_ZPmZ : sve_fp_2op_p_zd_HSD<0b00010, "frintm", int_aarch64_sve_frintm>;		defm FRINTM_ZPmZ : sve_fp_2op_p_zd_HSD<0b00010, "frintm", int_aarch64_sve_frintm>;
defm FRINTZ_ZPmZ : sve_fp_2op_p_zd_HSD<0b00011, "frintz", int_aarch64_sve_frintz>;		defm FRINTZ_ZPmZ : sve_fp_2op_p_zd_HSD<0b00011, "frintz", int_aarch64_sve_frintz>;
defm FRINTA_ZPmZ : sve_fp_2op_p_zd_HSD<0b00100, "frinta", int_aarch64_sve_frinta>;		defm FRINTA_ZPmZ : sve_fp_2op_p_zd_HSD<0b00100, "frinta", int_aarch64_sve_frinta>;
defm FRINTX_ZPmZ : sve_fp_2op_p_zd_HSD<0b00110, "frintx", int_aarch64_sve_frintx>;		defm FRINTX_ZPmZ : sve_fp_2op_p_zd_HSD<0b00110, "frintx", int_aarch64_sve_frintx>;
defm FRINTI_ZPmZ : sve_fp_2op_p_zd_HSD<0b00111, "frinti", int_aarch64_sve_frinti>;		defm FRINTI_ZPmZ : sve_fp_2op_p_zd_HSD<0b00111, "frinti", int_aarch64_sve_frinti>;
defm FRECPX_ZPmZ : sve_fp_2op_p_zd_HSD<0b01100, "frecpx", int_aarch64_sve_frecpx>;		defm FRECPX_ZPmZ : sve_fp_2op_p_zd_HSD<0b01100, "frecpx", int_aarch64_sve_frecpx>;
defm FSQRT_ZPmZ : sve_fp_2op_p_zd_HSD<0b01101, "fsqrt", int_aarch64_sve_fsqrt>;		defm FSQRT_ZPmZ : sve_fp_2op_p_zd_HSD<0b01101, "fsqrt", int_aarch64_sve_fsqrt>;

		let Predicates = [HasBF16, HasSVE] in {
		def BFDOT_ZZZ : sve_bfloat_dot<"bfdot">;
		def BFDOT_ZZI : sve_bfloat_dot_indexed<"bfdot">;
		def BFMMLA_ZZZ : sve_bfloat_matmul<"bfmmla">;
		def BFMMLA_B_ZZZ : sve_bfloat_matmul_longvecl<0b0, "bfmlalb">;
		def BFMMLA_T_ZZZ : sve_bfloat_matmul_longvecl<0b1, "bfmlalt">;
		def BFMMLA_B_ZZI : sve_bfloat_matmul_longvecl_idx<0b0, "bfmlalb">;
		def BFMMLA_T_ZZI : sve_bfloat_matmul_longvecl_idx<0b1, "bfmlalt">;
		def BFCVT_ZPmZ : sve_bfloat_convert<0b1, "bfcvt">;
		def BFCVTNT_ZPmZ : sve_bfloat_convert<0b0, "bfcvtnt">;
		}

// InstAliases		// InstAliases
def : InstAlias<"mov $Zd, $Zn",		def : InstAlias<"mov $Zd, $Zn",
(ORR_ZZZ ZPR64:$Zd, ZPR64:$Zn, ZPR64:$Zn), 1>;		(ORR_ZZZ ZPR64:$Zd, ZPR64:$Zn, ZPR64:$Zn), 1>;
def : InstAlias<"mov $Pd, $Pg/m, $Pn",		def : InstAlias<"mov $Pd, $Pg/m, $Pn",
(SEL_PPPP PPR8:$Pd, PPRAny:$Pg, PPR8:$Pn, PPR8:$Pd), 1>;		(SEL_PPPP PPR8:$Pd, PPRAny:$Pg, PPR8:$Pn, PPR8:$Pd), 1>;
def : InstAlias<"mov $Pd, $Pn",		def : InstAlias<"mov $Pd, $Pn",
(ORR_PPzPP PPR8:$Pd, PPR8:$Pn, PPR8:$Pn, PPR8:$Pn), 1>;		(ORR_PPzPP PPR8:$Pd, PPR8:$Pn, PPR8:$Pn, PPR8:$Pn), 1>;
def : InstAlias<"mov $Pd, $Pg/z, $Pn",		def : InstAlias<"mov $Pd, $Pg/z, $Pn",
▲ Show 20 Lines • Show All 838 Lines • Show Last 20 Lines

llvm/lib/Target/AArch64/AArch64Subtarget.h

Show First 20 Lines • Show All 70 Lines • ▼ Show 20 Lines	protected:
/// ARMProcFamily - ARM processor family: Cortex-A53, Cortex-A57, and others.		/// ARMProcFamily - ARM processor family: Cortex-A53, Cortex-A57, and others.
ARMProcFamilyEnum ARMProcFamily = Others;		ARMProcFamilyEnum ARMProcFamily = Others;

bool HasV8_1aOps = false;		bool HasV8_1aOps = false;
bool HasV8_2aOps = false;		bool HasV8_2aOps = false;
bool HasV8_3aOps = false;		bool HasV8_3aOps = false;
bool HasV8_4aOps = false;		bool HasV8_4aOps = false;
bool HasV8_5aOps = false;		bool HasV8_5aOps = false;
		bool HasV8_6aOps = false;

bool HasFPARMv8 = false;		bool HasFPARMv8 = false;
bool HasNEON = false;		bool HasNEON = false;
bool HasCrypto = false;		bool HasCrypto = false;
bool HasDotProd = false;		bool HasDotProd = false;
bool HasCRC = false;		bool HasCRC = false;
bool HasLSE = false;		bool HasLSE = false;
bool HasRAS = false;		bool HasRAS = false;
▲ Show 20 Lines • Show All 52 Lines • ▼ Show 20 Lines	protected:
bool HasSB = false;		bool HasSB = false;
bool HasPredRes = false;		bool HasPredRes = false;
bool HasCCDP = false;		bool HasCCDP = false;
bool HasBTI = false;		bool HasBTI = false;
bool HasRandGen = false;		bool HasRandGen = false;
bool HasMTE = false;		bool HasMTE = false;
bool HasTME = false;		bool HasTME = false;

		// Armv8.6-A Extensions
		bool HasBF16 = false;

// Arm SVE2 extensions		// Arm SVE2 extensions
bool HasSVE2AES = false;		bool HasSVE2AES = false;
bool HasSVE2SM4 = false;		bool HasSVE2SM4 = false;
bool HasSVE2SHA3 = false;		bool HasSVE2SHA3 = false;
bool HasSVE2BitPerm = false;		bool HasSVE2BitPerm = false;

// Future architecture extensions.		// Future architecture extensions.
bool HasETE = false;		bool HasETE = false;
▲ Show 20 Lines • Show All 243 Lines • ▼ Show 20 Lines	public:
bool hasMTE() const { return HasMTE; }		bool hasMTE() const { return HasMTE; }
bool hasTME() const { return HasTME; }		bool hasTME() const { return HasTME; }
// Arm SVE2 extensions		// Arm SVE2 extensions
bool hasSVE2AES() const { return HasSVE2AES; }		bool hasSVE2AES() const { return HasSVE2AES; }
bool hasSVE2SM4() const { return HasSVE2SM4; }		bool hasSVE2SM4() const { return HasSVE2SM4; }
bool hasSVE2SHA3() const { return HasSVE2SHA3; }		bool hasSVE2SHA3() const { return HasSVE2SHA3; }
bool hasSVE2BitPerm() const { return HasSVE2BitPerm; }		bool hasSVE2BitPerm() const { return HasSVE2BitPerm; }

		// Armv8.6-A Extensions
		bool hasBF16() const { return HasBF16; }

bool isLittleEndian() const { return IsLittle; }		bool isLittleEndian() const { return IsLittle; }

bool isTargetDarwin() const { return TargetTriple.isOSDarwin(); }		bool isTargetDarwin() const { return TargetTriple.isOSDarwin(); }
bool isTargetIOS() const { return TargetTriple.isiOS(); }		bool isTargetIOS() const { return TargetTriple.isiOS(); }
bool isTargetLinux() const { return TargetTriple.isOSLinux(); }		bool isTargetLinux() const { return TargetTriple.isOSLinux(); }
bool isTargetWindows() const { return TargetTriple.isOSWindows(); }		bool isTargetWindows() const { return TargetTriple.isOSWindows(); }
bool isTargetAndroid() const { return TargetTriple.isAndroid(); }		bool isTargetAndroid() const { return TargetTriple.isAndroid(); }
bool isTargetFuchsia() const { return TargetTriple.isOSFuchsia(); }		bool isTargetFuchsia() const { return TargetTriple.isOSFuchsia(); }
▲ Show 20 Lines • Show All 91 Lines • Show Last 20 Lines

llvm/lib/Target/AArch64/AsmParser/AArch64AsmParser.cpp

Show First 20 Lines • Show All 2,853 Lines • ▼ Show 20 Lines	static void setRequiredFeatureString(FeatureBitset FBS, std::string &Str) {
else if (FBS[AArch64::HasV8_2aOps])		else if (FBS[AArch64::HasV8_2aOps])
Str += "ARMv8.2a";		Str += "ARMv8.2a";
else if (FBS[AArch64::HasV8_3aOps])		else if (FBS[AArch64::HasV8_3aOps])
Str += "ARMv8.3a";		Str += "ARMv8.3a";
else if (FBS[AArch64::HasV8_4aOps])		else if (FBS[AArch64::HasV8_4aOps])
Str += "ARMv8.4a";		Str += "ARMv8.4a";
else if (FBS[AArch64::HasV8_5aOps])		else if (FBS[AArch64::HasV8_5aOps])
Str += "ARMv8.5a";		Str += "ARMv8.5a";
		else if (FBS[AArch64::HasV8_6aOps])
		Str += "ARMv8.6a";
else {		else {
auto ext = std::find_if(std::begin(ExtensionMap),		auto ext = std::find_if(std::begin(ExtensionMap),
std::end(ExtensionMap),		std::end(ExtensionMap),
[&](const Extension& e)		[&](const Extension& e)
// Use & in case multiple features are enabled		// Use & in case multiple features are enabled
{ return (FBS & e.Features) != FeatureBitset(); }		{ return (FBS & e.Features) != FeatureBitset(); }
);		);

▲ Show 20 Lines • Show All 2,219 Lines • ▼ Show 20 Lines	if (!NoCrypto && Crypto) {
case AArch64::ArchKind::ARMV8_1A:		case AArch64::ArchKind::ARMV8_1A:
case AArch64::ArchKind::ARMV8_2A:		case AArch64::ArchKind::ARMV8_2A:
case AArch64::ArchKind::ARMV8_3A:		case AArch64::ArchKind::ARMV8_3A:
RequestedExtensions.push_back("sha2");		RequestedExtensions.push_back("sha2");
RequestedExtensions.push_back("aes");		RequestedExtensions.push_back("aes");
break;		break;
case AArch64::ArchKind::ARMV8_4A:		case AArch64::ArchKind::ARMV8_4A:
case AArch64::ArchKind::ARMV8_5A:		case AArch64::ArchKind::ARMV8_5A:
		case AArch64::ArchKind::ARMV8_6A:
RequestedExtensions.push_back("sm4");		RequestedExtensions.push_back("sm4");
RequestedExtensions.push_back("sha3");		RequestedExtensions.push_back("sha3");
RequestedExtensions.push_back("sha2");		RequestedExtensions.push_back("sha2");
RequestedExtensions.push_back("aes");		RequestedExtensions.push_back("aes");
break;		break;
}		}
} else if (NoCrypto) {		} else if (NoCrypto) {
switch (ArchKind) {		switch (ArchKind) {
default:		default:
// Map 'generic' (and others) to sha2 and aes, because		// Map 'generic' (and others) to sha2 and aes, because
// that was the traditional meaning of crypto.		// that was the traditional meaning of crypto.
case AArch64::ArchKind::ARMV8_1A:		case AArch64::ArchKind::ARMV8_1A:
case AArch64::ArchKind::ARMV8_2A:		case AArch64::ArchKind::ARMV8_2A:
case AArch64::ArchKind::ARMV8_3A:		case AArch64::ArchKind::ARMV8_3A:
RequestedExtensions.push_back("nosha2");		RequestedExtensions.push_back("nosha2");
RequestedExtensions.push_back("noaes");		RequestedExtensions.push_back("noaes");
break;		break;
case AArch64::ArchKind::ARMV8_4A:		case AArch64::ArchKind::ARMV8_4A:
case AArch64::ArchKind::ARMV8_5A:		case AArch64::ArchKind::ARMV8_5A:
		case AArch64::ArchKind::ARMV8_6A:
RequestedExtensions.push_back("nosm4");		RequestedExtensions.push_back("nosm4");
RequestedExtensions.push_back("nosha3");		RequestedExtensions.push_back("nosha3");
RequestedExtensions.push_back("nosha2");		RequestedExtensions.push_back("nosha2");
RequestedExtensions.push_back("noaes");		RequestedExtensions.push_back("noaes");
break;		break;
}		}
}		}
}		}
▲ Show 20 Lines • Show All 656 Lines • Show Last 20 Lines

llvm/lib/Target/AArch64/SVEInstrFormats.td

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 7,388 Lines • ▼ Show 20 Lines	: I<(outs zprty:$Zdn), (ins zprty:$_Zdn),
let Constraints = "$Zdn = $_Zdn";		let Constraints = "$Zdn = $_Zdn";
}		}

multiclass sve2_crypto_unary_op<bit opc, string asm, SDPatternOperator op> {		multiclass sve2_crypto_unary_op<bit opc, string asm, SDPatternOperator op> {
def NAME : sve2_crypto_unary_op<opc, asm, ZPR8>;		def NAME : sve2_crypto_unary_op<opc, asm, ZPR8>;
def : SVE_1_Op_Pat<nxv16i8, op, nxv16i8, !cast<Instruction>(NAME)>;		def : SVE_1_Op_Pat<nxv16i8, op, nxv16i8, !cast<Instruction>(NAME)>;
}		}

		//===----------------------------------------------------------------------===//
		// SVE BFloat16 Group
		//===----------------------------------------------------------------------===//

		class sve_bfloat_dot_base<bits<2> opc, string asm, string ops, dag iops>
		: I<(outs ZPR32:$Zda), iops, asm, ops, "", []>, Sched<[]> {
		bits<5> Zda;
		bits<5> Zn;
		let Inst{31-21} = 0b01100100011;
		let Inst{15-14} = opc;
		let Inst{13-10} = 0b0000;
		let Inst{9-5} = Zn;
		let Inst{4-0} = Zda;

		let Constraints = "$Zda = $_Zda";
		let DestructiveInstType = DestructiveOther;
		let ElementSize = ElementSizeH;
		}

		class sve_bfloat_dot<string asm>
		: sve_bfloat_dot_base<0b10, asm, "\t$Zda, $Zn, $Zm",
		(ins ZPR32:$_Zda, ZPR16:$Zn, ZPR16:$Zm)> {
		bits<5> Zm;
		let Inst{20-16} = Zm;
		}

		class sve_bfloat_dot_indexed<string asm>
		: sve_bfloat_dot_base<0b01, asm, "\t$Zda, $Zn, $Zm$iop",
		(ins ZPR32:$_Zda, ZPR16:$Zn, ZPR3b16:$Zm, VectorIndexS:$iop)> {
		bits<2> iop;
		bits<3> Zm;
		let Inst{20-19} = iop;
		let Inst{18-16} = Zm;
		}

		class sve_bfloat_matmul<string asm>
		: I<(outs ZPR32:$Zda), (ins ZPR32:$_Zda, ZPR16:$Zn, ZPR16:$Zm),
		asm, "\t$Zda, $Zn, $Zm", "", []>, Sched<[]> {
		bits<5> Zm;
		bits<5> Zda;
		bits<5> Zn;
		let Inst{31-21} = 0b01100100011;
		let Inst{20-16} = Zm;
		let Inst{15-10} = 0b111001;
		let Inst{9-5} = Zn;
		let Inst{4-0} = Zda;

		let Constraints = "$Zda = $_Zda";
		let DestructiveInstType = DestructiveOther;
		let ElementSize = ElementSizeH;
		}

		class sve_bfloat_matmul_longvecl<bit BT, string asm>
		: sve_bfloat_matmul<asm> {
		let Inst{23} = 0b1;
		let Inst{14-13} = 0b00;
		let Inst{10} = BT;
		}

		class sve_bfloat_matmul_longvecl_idx<bit BT, string asm>
		: sve_bfloat_dot_base<0b01, asm, "\t$Zda, $Zn, $Zm$iop",
		(ins ZPR32:$_Zda, ZPR16:$Zn, ZPR3b16:$Zm, VectorIndexH:$iop)> {
		bits<3> iop;
		bits<3> Zm;
		let Inst{23} = 0b1;
		let Inst{20-19} = iop{2-1};
		let Inst{18-16} = Zm;
		let Inst{11} = iop{0};
		let Inst{10} = BT;
		}

		class sve_bfloat_convert<bit N, string asm>
		: I<(outs ZPR16:$Zd), (ins ZPR16:$_Zd, PPR3bAny:$Pg, ZPR32:$Zn),
		asm, "\t$Zd, $Pg/m, $Zn", "", []>, Sched<[]> {
		bits<5> Zd;
		bits<3> Pg;
		bits<5> Zn;
		let Inst{31-25} = 0b0110010;
		let Inst{24} = N;
		let Inst{23-13} = 0b10001010101;
		let Inst{12-10} = Pg;
		let Inst{9-5} = Zn;
		let Inst{4-0} = Zd;

		let Constraints = "$Zd = $_Zd";
		let DestructiveInstType = DestructiveOther;
		let hasSideEffects = 1;
		let ElementSize = ElementSizeS;
		}

/// Addressing modes		/// Addressing modes
def am_sve_indexed_s4 :ComplexPattern<i64, 2, "SelectAddrModeIndexedSVE<-8,7>", [], [SDNPWantRoot]>;		def am_sve_indexed_s4 :ComplexPattern<i64, 2, "SelectAddrModeIndexedSVE<-8,7>", [], [SDNPWantRoot]>;
def am_sve_indexed_s6 :ComplexPattern<i64, 2, "SelectAddrModeIndexedSVE<-32,31>", [], [SDNPWantRoot]>;		def am_sve_indexed_s6 :ComplexPattern<i64, 2, "SelectAddrModeIndexedSVE<-32,31>", [], [SDNPWantRoot]>;

def am_sve_regreg_lsl0 : ComplexPattern<i64, 2, "SelectSVERegRegAddrMode<0>", []>;		def am_sve_regreg_lsl0 : ComplexPattern<i64, 2, "SelectSVERegRegAddrMode<0>", []>;
def am_sve_regreg_lsl1 : ComplexPattern<i64, 2, "SelectSVERegRegAddrMode<1>", []>;		def am_sve_regreg_lsl1 : ComplexPattern<i64, 2, "SelectSVERegRegAddrMode<1>", []>;
def am_sve_regreg_lsl2 : ComplexPattern<i64, 2, "SelectSVERegRegAddrMode<2>", []>;		def am_sve_regreg_lsl2 : ComplexPattern<i64, 2, "SelectSVERegRegAddrMode<2>", []>;
def am_sve_regreg_lsl3 : ComplexPattern<i64, 2, "SelectSVERegRegAddrMode<3>", []>;		def am_sve_regreg_lsl3 : ComplexPattern<i64, 2, "SelectSVERegRegAddrMode<3>", []>;

llvm/lib/Target/ARM/ARM.td

Show First 20 Lines • Show All 418 Lines • ▼ Show 20 Lines	def FeatureNoPostRASched : SubtargetFeature<"disable-postra-scheduler",
"DisablePostRAScheduler", "true",		"DisablePostRAScheduler", "true",
"Don't schedule again after register allocation">;		"Don't schedule again after register allocation">;

// Armv8.5-A extensions		// Armv8.5-A extensions

def FeatureSB : SubtargetFeature<"sb", "HasSB", "true",		def FeatureSB : SubtargetFeature<"sb", "HasSB", "true",
"Enable v8.5a Speculation Barrier" >;		"Enable v8.5a Speculation Barrier" >;

		// Armv8.6-A extensions
		def FeatureBF16 : SubtargetFeature<"bf16", "HasBF16", "true",
		"Enable support for BFloat16 instructions", [FeatureNEON]>;

// Armv8.1-M extensions		// Armv8.1-M extensions

def FeatureLOB : SubtargetFeature<"lob", "HasLOB", "true",		def FeatureLOB : SubtargetFeature<"lob", "HasLOB", "true",
"Enable Low Overhead Branch "		"Enable Low Overhead Branch "
"extensions">;		"extensions">;

//===----------------------------------------------------------------------===//		//===----------------------------------------------------------------------===//
// ARM architecture class		// ARM architecture class
▲ Show 20 Lines • Show All 83 Lines • ▼ Show 20 Lines
def HasV8_4aOps : SubtargetFeature<"v8.4a", "HasV8_4aOps", "true",		def HasV8_4aOps : SubtargetFeature<"v8.4a", "HasV8_4aOps", "true",
"Support ARM v8.4a instructions",		"Support ARM v8.4a instructions",
[HasV8_3aOps, FeatureDotProd]>;		[HasV8_3aOps, FeatureDotProd]>;

def HasV8_5aOps : SubtargetFeature<"v8.5a", "HasV8_5aOps", "true",		def HasV8_5aOps : SubtargetFeature<"v8.5a", "HasV8_5aOps", "true",
"Support ARM v8.5a instructions",		"Support ARM v8.5a instructions",
[HasV8_4aOps, FeatureSB]>;		[HasV8_4aOps, FeatureSB]>;

		def HasV8_6aOps : SubtargetFeature<"v8.6a", "HasV8_6aOps", "true",
		"Support ARM v8.6a instructions",
		[HasV8_5aOps, FeatureBF16]>;
		SjoerdMeijerUnsubmitted Done Reply Inline Actions it's implied here, so looks mandatory. SjoerdMeijer: it's implied here, so looks mandatory.

def HasV8_1MMainlineOps : SubtargetFeature<		def HasV8_1MMainlineOps : SubtargetFeature<
"v8.1m.main", "HasV8_1MMainlineOps", "true",		"v8.1m.main", "HasV8_1MMainlineOps", "true",
"Support ARM v8-1M Mainline instructions",		"Support ARM v8-1M Mainline instructions",
[HasV8MMainlineOps]>;		[HasV8MMainlineOps]>;
def HasMVEIntegerOps : SubtargetFeature<		def HasMVEIntegerOps : SubtargetFeature<
"mve", "HasMVEIntegerOps", "true",		"mve", "HasMVEIntegerOps", "true",
"Support M-Class Vector Extension with integer ops",		"Support M-Class Vector Extension with integer ops",
[HasV8_1MMainlineOps, FeatureDSP, FeatureFPRegs16, FeatureFPRegs64]>;		[HasV8_1MMainlineOps, FeatureDSP, FeatureFPRegs16, FeatureFPRegs64]>;
▲ Show 20 Lines • Show All 258 Lines • ▼ Show 20 Lines	def ARMv85a : Architecture<"armv8.5-a", "ARMv85a", [HasV8_5aOps,
FeatureDSP,		FeatureDSP,
FeatureTrustZone,		FeatureTrustZone,
FeatureMP,		FeatureMP,
FeatureVirtualization,		FeatureVirtualization,
FeatureCrypto,		FeatureCrypto,
FeatureCRC,		FeatureCRC,
FeatureRAS,		FeatureRAS,
FeatureDotProd]>;		FeatureDotProd]>;
		def ARMv86a : Architecture<"armv8.6-a", "ARMv86a", [HasV8_6aOps,
		FeatureAClass,
		FeatureDB,
		FeatureFPARMv8,
		FeatureNEON,
		FeatureDSP,
		FeatureTrustZone,
		FeatureMP,
		FeatureVirtualization,
		FeatureCrypto,
		FeatureCRC,
		FeatureRAS,
		FeatureDotProd]>;

def ARMv8r : Architecture<"armv8-r", "ARMv8r", [HasV8Ops,		def ARMv8r : Architecture<"armv8-r", "ARMv8r", [HasV8Ops,
FeatureRClass,		FeatureRClass,
FeatureDB,		FeatureDB,
FeatureDFB,		FeatureDFB,
FeatureDSP,		FeatureDSP,
FeatureCRC,		FeatureCRC,
FeatureMP,		FeatureMP,
▲ Show 20 Lines • Show All 479 Lines • Show Last 20 Lines

llvm/lib/Target/ARM/ARMInstrNEON.td

This file is larger than 256 KB, so syntax highlighting is disabled by default.

	Show First 20 Lines • Show All 8,920 Lines • ▼ Show 20 Lines

	// Alias for loading floating point immediates that aren't representable			// Alias for loading floating point immediates that aren't representable
	// using the vmov.f32 encoding but the bitpattern is representable using			// using the vmov.f32 encoding but the bitpattern is representable using
	// the .i32 encoding.			// the .i32 encoding.
	def : NEONInstAlias<"vmov${p}.f32 $Vd, $imm",			def : NEONInstAlias<"vmov${p}.f32 $Vd, $imm",
	(VMOVv4i32 QPR:$Vd, nImmVMOVI32:$imm, pred:$p)>;			(VMOVv4i32 QPR:$Vd, nImmVMOVI32:$imm, pred:$p)>;
	def : NEONInstAlias<"vmov${p}.f32 $Vd, $imm",			def : NEONInstAlias<"vmov${p}.f32 $Vd, $imm",
	(VMOVv2i32 DPR:$Vd, nImmVMOVI32:$imm, pred:$p)>;			(VMOVv2i32 DPR:$Vd, nImmVMOVI32:$imm, pred:$p)>;

				// ARMv8.6a BFloat16 instructions.
				let Predicates = [HasBF16, HasNEON] in {
				class BF16VDOT<bits<5> op27_23, bits<2> op21_20, bit op6,
				dag oops, dag iops>
				: N3Vnp<op27_23, op21_20, 0b1101, op6, 0, oops, iops,
				N3RegFrm, IIC_VDOTPROD, "", "", []> {
				let hasNoSchedulingInfo = 1;
				SjoerdMeijerUnsubmitted Done Reply Inline Actions on the same line as above? SjoerdMeijer: on the same line as above?
				let DecoderNamespace = "VFPV8";
				SjoerdMeijerUnsubmitted Done Reply Inline Actions no newline? SjoerdMeijer: no newline?
				}

				class BF16VDOTS<bit Q, RegisterClass RegTy, string opc, ValueType AccumTy, ValueType InputTy>
				: BF16VDOT<0b11000, 0b00, Q, (outs RegTy:$dst),
				(ins RegTy:$Vd, RegTy:$Vn, RegTy:$Vm)> {
				let Constraints = "$dst = $Vd";
				let AsmString = !strconcat(opc, ".bf16", "\t$Vd, $Vn, $Vm");
				let DecoderNamespace = "VFPV8";
				}

				multiclass BF16VDOTI<bit Q, RegisterClass RegTy, string opc, ValueType AccumTy,
				ValueType InputTy, dag RHS> {

				def "" : BF16VDOT<0b11100, 0b00, Q, (outs RegTy:$dst),
				(ins RegTy:$Vd, RegTy:$Vn,
				DPR_VFP2:$Vm, VectorIndex32:$lane)> {
				bit lane;
				let Inst{5} = lane;
				let Constraints = "$dst = $Vd";
				let AsmString = !strconcat(opc, ".bf16", "\t$Vd, $Vn, $Vm$lane");
				let DecoderNamespace = "VFPV8";
				}

				}

				def BF16VDOTS_VDOTD : BF16VDOTS<0, DPR, "vdot", v2f32, v8i8>;
				def BF16VDOTS_VDOTQ : BF16VDOTS<1, QPR, "vdot", v4f32, v16i8>;

				defm BF16VDOTI_VDOTD : BF16VDOTI<0, DPR, "vdot", v2f32, v8i8, (v2f32 DPR_VFP2:$Vm)>;
				defm BF16VDOTI_VDOTQ : BF16VDOTI<1, QPR, "vdot", v4f32, v16i8, (EXTRACT_SUBREG QPR:$Vm, dsub_0)>;

				class BF16MM<bit Q, RegisterClass RegTy,
				string opc>
				: N3Vnp<0b11000, 0b00, 0b1100, Q, 0,
				(outs RegTy:$dst), (ins RegTy:$Vd, RegTy:$Vn, RegTy:$Vm),
				N3RegFrm, IIC_VDOTPROD, "", "", []> {
				let Constraints = "$dst = $Vd";
				let AsmString = !strconcat(opc, ".bf16", "\t$Vd, $Vn, $Vm");
				let DecoderNamespace = "VFPV8";
				let hasNoSchedulingInfo = 1;
				}

				def VMMLA : BF16MM<1, QPR, "vmmla">;

				class VBF16MALQ<bit T, string suffix>
				: N3VCP8<0b00, 0b11, T, 1,
				(outs QPR:$dst), (ins QPR:$Vd, QPR:$Vn, QPR:$Vm),
				NoItinerary, "vfma" # suffix, "bf16", "$Vd, $Vn, $Vm", "",
				[]> { // TODO: Add intrinsics
				let Constraints = "$dst = $Vd";
				let DecoderNamespace = "VFPV8";
				let hasNoSchedulingInfo = 1;
				}

				def VBF16MALTQ: VBF16MALQ<1, "t">;
				def VBF16MALBQ: VBF16MALQ<0, "b">;

				multiclass VBF16MALQI<bit T, string suffix> {
				def "" : N3VLaneCP8<0, 0b11, T, 1, (outs QPR:$dst),
				(ins QPR:$Vd, QPR:$Vn, DPR_8:$Vm, VectorIndex16:$idx),
				IIC_VMACD, "vfma" # suffix, "bf16", "$Vd, $Vn, $Vm$idx", "", []> {
				bits<2> idx;
				let Inst{5} = idx{1};
				let Inst{3} = idx{0};
				let Constraints = "$dst = $Vd";
				let DecoderNamespace = "VFPV8";
				let hasNoSchedulingInfo = 1;
				}

				}

				defm VBF16MALTQI: VBF16MALQI<1, "t">;
				defm VBF16MALBQI: VBF16MALQI<0, "b">;

				let hasNoSchedulingInfo = 1 in {
				def BF16_VCVT : N2V<0b11, 0b11, 0b01, 0b10, 0b01100, 1, 0,
				(outs DPR:$Vd), (ins QPR:$Vm),
				NoItinerary, "vcvt", "bf16.f32", "$Vd, $Vm", "", []>;
				}
				}
				// End of BFloat16 instructions

llvm/lib/Target/ARM/ARMInstrVFP.td

	Show First 20 Lines • Show All 1,861 Lines • ▼ Show 20 Lines

	def VULTOD : AVConv1XInsD_Encode<0b11101, 0b11, 0b1011, 0b1011, 1,			def VULTOD : AVConv1XInsD_Encode<0b11101, 0b11, 0b1011, 0b1011, 1,
	(outs DPR:$dst), (ins DPR:$a, fbits32:$fbits),			(outs DPR:$dst), (ins DPR:$a, fbits32:$fbits),
	IIC_fpCVTID, "vcvt", ".f64.u32\t$dst, $a, $fbits", []>,			IIC_fpCVTID, "vcvt", ".f64.u32\t$dst, $a, $fbits", []>,
	Sched<[WriteFPCVT]>;			Sched<[WriteFPCVT]>;

	} // End of 'let Constraints = "$a = $dst" in'			} // End of 'let Constraints = "$a = $dst" in'

				// BFloat16 - Single precision, unary, predicated
				class BF16_VCVT<string opc, bits<2> op7_6>
				: VFPAI<(outs SPR:$Sd), (ins SPR:$dst, SPR:$Sm),
				VFPUnaryFrm, NoItinerary,
				opc, ".bf16.f32\t$Sd, $Sm", []>,
				RegConstraint<"$dst = $Sd">,
				Requires<[HasBF16]>,
				Sched<[]> {
				bits<5> Sd;
				bits<5> Sm;

				// Encode instruction operands.
				let Inst{3-0} = Sm{4-1};
				let Inst{5} = Sm{0};
				let Inst{15-12} = Sd{4-1};
				let Inst{22} = Sd{0};

				let Inst{27-23} = 0b11101; // opcode1
				let Inst{21-20} = 0b11; // opcode2
				let Inst{19-16} = 0b0011; // opcode3
				let Inst{11-8} = 0b1001;
				let Inst{7-6} = op7_6;
				let Inst{4} = 0;
				let DecoderNamespace = "VFPV8";
				}

				def BF16_VCVTB : BF16_VCVT<"vcvtb", 0b01>;
				def BF16_VCVTT : BF16_VCVT<"vcvtt", 0b11>;

	//===----------------------------------------------------------------------===//			//===----------------------------------------------------------------------===//
	// FP Multiply-Accumulate Operations.			// FP Multiply-Accumulate Operations.
	//			//

	def VMLAD : ADbI<0b11100, 0b00, 0, 0,			def VMLAD : ADbI<0b11100, 0b00, 0, 0,
	(outs DPR:$Dd), (ins DPR:$Ddin, DPR:$Dn, DPR:$Dm),			(outs DPR:$Dd), (ins DPR:$Ddin, DPR:$Dn, DPR:$Dm),
	IIC_fpMAC64, "vmla", ".f64\t$Dd, $Dn, $Dm",			IIC_fpMAC64, "vmla", ".f64\t$Dd, $Dn, $Dm",
	[(set DPR:$Dd, (fadd_mlx (fmul_su DPR:$Dn, DPR:$Dm),			[(set DPR:$Dd, (fadd_mlx (fmul_su DPR:$Dn, DPR:$Dm),
	▲ Show 20 Lines • Show All 889 Lines • Show Last 20 Lines

llvm/lib/Target/ARM/ARMPredicates.td

	Show First 20 Lines • Show All 66 Lines • ▼ Show 20 Lines
	def HasV8_2a : Predicate<"Subtarget->hasV8_2aOps()">,			def HasV8_2a : Predicate<"Subtarget->hasV8_2aOps()">,
	AssemblerPredicate<(all_of HasV8_2aOps), "armv8.2a">;			AssemblerPredicate<(all_of HasV8_2aOps), "armv8.2a">;
	def HasV8_3a : Predicate<"Subtarget->hasV8_3aOps()">,			def HasV8_3a : Predicate<"Subtarget->hasV8_3aOps()">,
	AssemblerPredicate<(all_of HasV8_3aOps), "armv8.3a">;			AssemblerPredicate<(all_of HasV8_3aOps), "armv8.3a">;
	def HasV8_4a : Predicate<"Subtarget->hasV8_4aOps()">,			def HasV8_4a : Predicate<"Subtarget->hasV8_4aOps()">,
	AssemblerPredicate<(all_of HasV8_4aOps), "armv8.4a">;			AssemblerPredicate<(all_of HasV8_4aOps), "armv8.4a">;
	def HasV8_5a : Predicate<"Subtarget->hasV8_5aOps()">,			def HasV8_5a : Predicate<"Subtarget->hasV8_5aOps()">,
	AssemblerPredicate<(all_of HasV8_5aOps), "armv8.5a">;			AssemblerPredicate<(all_of HasV8_5aOps), "armv8.5a">;
				def HasV8_6a : Predicate<"Subtarget->hasV8_6aOps()">,
				AssemblerPredicate<(all_of HasV8_6aOps), "armv8.6a">;
	def NoVFP : Predicate<"!Subtarget->hasVFP2Base()">;			def NoVFP : Predicate<"!Subtarget->hasVFP2Base()">;
	def HasVFP2 : Predicate<"Subtarget->hasVFP2Base()">,			def HasVFP2 : Predicate<"Subtarget->hasVFP2Base()">,
	AssemblerPredicate<(all_of FeatureVFP2_SP), "VFP2">;			AssemblerPredicate<(all_of FeatureVFP2_SP), "VFP2">;
	def HasVFP3 : Predicate<"Subtarget->hasVFP3Base()">,			def HasVFP3 : Predicate<"Subtarget->hasVFP3Base()">,
	AssemblerPredicate<(all_of FeatureVFP3_D16_SP), "VFP3">;			AssemblerPredicate<(all_of FeatureVFP3_D16_SP), "VFP3">;
	def HasVFP4 : Predicate<"Subtarget->hasVFP4Base()">,			def HasVFP4 : Predicate<"Subtarget->hasVFP4Base()">,
	AssemblerPredicate<(all_of FeatureVFP4_D16_SP), "VFP4">;			AssemblerPredicate<(all_of FeatureVFP4_D16_SP), "VFP4">;
	def HasDPVFP : Predicate<"Subtarget->hasFP64()">,			def HasDPVFP : Predicate<"Subtarget->hasFP64()">,
	Show All 18 Lines
	def HasLOB : Predicate<"Subtarget->hasLOB()">,			def HasLOB : Predicate<"Subtarget->hasLOB()">,
	AssemblerPredicate<(all_of FeatureLOB), "lob">;			AssemblerPredicate<(all_of FeatureLOB), "lob">;
	def HasFP16 : Predicate<"Subtarget->hasFP16()">,			def HasFP16 : Predicate<"Subtarget->hasFP16()">,
	AssemblerPredicate<(all_of FeatureFP16),"half-float conversions">;			AssemblerPredicate<(all_of FeatureFP16),"half-float conversions">;
	def HasFullFP16 : Predicate<"Subtarget->hasFullFP16()">,			def HasFullFP16 : Predicate<"Subtarget->hasFullFP16()">,
	AssemblerPredicate<(all_of FeatureFullFP16),"full half-float">;			AssemblerPredicate<(all_of FeatureFullFP16),"full half-float">;
	def HasFP16FML : Predicate<"Subtarget->hasFP16FML()">,			def HasFP16FML : Predicate<"Subtarget->hasFP16FML()">,
	AssemblerPredicate<(all_of FeatureFP16FML),"full half-float fml">;			AssemblerPredicate<(all_of FeatureFP16FML),"full half-float fml">;
				def HasBF16 : Predicate<"Subtarget->hasBF16()">,
				AssemblerPredicate<(all_of FeatureBF16),"BFloat16 floating point extension">;
	def HasDivideInThumb : Predicate<"Subtarget->hasDivideInThumbMode()">,			def HasDivideInThumb : Predicate<"Subtarget->hasDivideInThumbMode()">,
	AssemblerPredicate<(all_of FeatureHWDivThumb), "divide in THUMB">;			AssemblerPredicate<(all_of FeatureHWDivThumb), "divide in THUMB">;
	def HasDivideInARM : Predicate<"Subtarget->hasDivideInARMMode()">,			def HasDivideInARM : Predicate<"Subtarget->hasDivideInARMMode()">,
	AssemblerPredicate<(all_of FeatureHWDivARM), "divide in ARM">;			AssemblerPredicate<(all_of FeatureHWDivARM), "divide in ARM">;
	def HasDSP : Predicate<"Subtarget->hasDSP()">,			def HasDSP : Predicate<"Subtarget->hasDSP()">,
	AssemblerPredicate<(all_of FeatureDSP), "dsp">;			AssemblerPredicate<(all_of FeatureDSP), "dsp">;
	def HasDB : Predicate<"Subtarget->hasDataBarrier()">,			def HasDB : Predicate<"Subtarget->hasDataBarrier()">,
	AssemblerPredicate<(all_of FeatureDB),			AssemblerPredicate<(all_of FeatureDB),
	▲ Show 20 Lines • Show All 96 Lines • Show Last 20 Lines

llvm/lib/Target/ARM/ARMSubtarget.h

Show First 20 Lines • Show All 102 Lines • ▼ Show 20 Lines	enum ARMArchEnum {
ARMv7m,		ARMv7m,
ARMv7r,		ARMv7r,
ARMv7ve,		ARMv7ve,
ARMv81a,		ARMv81a,
ARMv82a,		ARMv82a,
ARMv83a,		ARMv83a,
ARMv84a,		ARMv84a,
ARMv85a,		ARMv85a,
		ARMv86a,
ARMv8a,		ARMv8a,
ARMv8mBaseline,		ARMv8mBaseline,
ARMv8mMainline,		ARMv8mMainline,
ARMv8r,		ARMv8r,
ARMv81mMainline,		ARMv81mMainline,
};		};

public:		public:
Show All 33 Lines	protected:
bool HasV6T2Ops = false;		bool HasV6T2Ops = false;
bool HasV7Ops = false;		bool HasV7Ops = false;
bool HasV8Ops = false;		bool HasV8Ops = false;
bool HasV8_1aOps = false;		bool HasV8_1aOps = false;
bool HasV8_2aOps = false;		bool HasV8_2aOps = false;
bool HasV8_3aOps = false;		bool HasV8_3aOps = false;
bool HasV8_4aOps = false;		bool HasV8_4aOps = false;
bool HasV8_5aOps = false;		bool HasV8_5aOps = false;
		bool HasV8_6aOps = false;
bool HasV8MBaselineOps = false;		bool HasV8MBaselineOps = false;
bool HasV8MMainlineOps = false;		bool HasV8MMainlineOps = false;
bool HasV8_1MMainlineOps = false;		bool HasV8_1MMainlineOps = false;
bool HasMVEIntegerOps = false;		bool HasMVEIntegerOps = false;
bool HasMVEFloatOps = false;		bool HasMVEFloatOps = false;
bool HasCDEOps = false;		bool HasCDEOps = false;

/// HasVFPv2, HasVFPv3, HasVFPv4, HasFPARMv8, HasNEON - Specify what		/// HasVFPv2, HasVFPv3, HasVFPv4, HasFPARMv8, HasNEON - Specify what
▲ Show 20 Lines • Show All 82 Lines • ▼ Show 20 Lines	protected:
bool HasFP16 = false;		bool HasFP16 = false;

/// HasFullFP16 - True if subtarget supports half-precision FP operations		/// HasFullFP16 - True if subtarget supports half-precision FP operations
bool HasFullFP16 = false;		bool HasFullFP16 = false;

/// HasFP16FML - True if subtarget supports half-precision FP fml operations		/// HasFP16FML - True if subtarget supports half-precision FP fml operations
bool HasFP16FML = false;		bool HasFP16FML = false;

		/// HasBF16 - True if subtarget supports BFloat16 floating point operations
		SjoerdMeijerUnsubmitted Done Reply Inline Actions nit: BFloat16 floating point -> BFloat16 floating point operations SjoerdMeijer: nit: BFloat16 floating point -> BFloat16 floating point operations
		bool HasBF16 = false;

/// HasD32 - True if subtarget has the full 32 double precision		/// HasD32 - True if subtarget has the full 32 double precision
/// FP registers for VFPv3.		/// FP registers for VFPv3.
bool HasD32 = false;		bool HasD32 = false;

/// HasHardwareDivide - True if subtarget supports [su]div in Thumb mode		/// HasHardwareDivide - True if subtarget supports [su]div in Thumb mode
bool HasHardwareDivideInThumb = false;		bool HasHardwareDivideInThumb = false;

/// HasHardwareDivideInARM - True if subtarget supports [su]div in ARM mode		/// HasHardwareDivideInARM - True if subtarget supports [su]div in ARM mode
▲ Show 20 Lines • Show All 310 Lines • ▼ Show 20 Lines	public:
bool hasV6T2Ops() const { return HasV6T2Ops; }		bool hasV6T2Ops() const { return HasV6T2Ops; }
bool hasV7Ops() const { return HasV7Ops; }		bool hasV7Ops() const { return HasV7Ops; }
bool hasV8Ops() const { return HasV8Ops; }		bool hasV8Ops() const { return HasV8Ops; }
bool hasV8_1aOps() const { return HasV8_1aOps; }		bool hasV8_1aOps() const { return HasV8_1aOps; }
bool hasV8_2aOps() const { return HasV8_2aOps; }		bool hasV8_2aOps() const { return HasV8_2aOps; }
bool hasV8_3aOps() const { return HasV8_3aOps; }		bool hasV8_3aOps() const { return HasV8_3aOps; }
bool hasV8_4aOps() const { return HasV8_4aOps; }		bool hasV8_4aOps() const { return HasV8_4aOps; }
bool hasV8_5aOps() const { return HasV8_5aOps; }		bool hasV8_5aOps() const { return HasV8_5aOps; }
		bool hasV8_6aOps() const { return HasV8_6aOps; }
bool hasV8MBaselineOps() const { return HasV8MBaselineOps; }		bool hasV8MBaselineOps() const { return HasV8MBaselineOps; }
bool hasV8MMainlineOps() const { return HasV8MMainlineOps; }		bool hasV8MMainlineOps() const { return HasV8MMainlineOps; }
bool hasV8_1MMainlineOps() const { return HasV8_1MMainlineOps; }		bool hasV8_1MMainlineOps() const { return HasV8_1MMainlineOps; }
bool hasMVEIntegerOps() const { return HasMVEIntegerOps; }		bool hasMVEIntegerOps() const { return HasMVEIntegerOps; }
bool hasMVEFloatOps() const { return HasMVEFloatOps; }		bool hasMVEFloatOps() const { return HasMVEFloatOps; }
bool hasCDEOps() const { return HasCDEOps; }		bool hasCDEOps() const { return HasCDEOps; }
bool hasFPRegs() const { return HasFPRegs; }		bool hasFPRegs() const { return HasFPRegs; }
bool hasFPRegs16() const { return HasFPRegs16; }		bool hasFPRegs16() const { return HasFPRegs16; }
▲ Show 20 Lines • Show All 301 Lines • Show Last 20 Lines

llvm/lib/Target/ARM/AsmParser/ARMAsmParser.cpp

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 6,316 Lines • ▼ Show 20 Lines	if ((Mnemonic == "movs" && isThumb()) \|\|
Mnemonic == "umaal" \|\| Mnemonic == "umlal" \|\| Mnemonic == "vabal" \|\|		Mnemonic == "umaal" \|\| Mnemonic == "umlal" \|\| Mnemonic == "vabal" \|\|
Mnemonic == "vmlal" \|\| Mnemonic == "vpadal" \|\| Mnemonic == "vqdmlal" \|\|		Mnemonic == "vmlal" \|\| Mnemonic == "vpadal" \|\| Mnemonic == "vqdmlal" \|\|
Mnemonic == "fmuls" \|\| Mnemonic == "vmaxnm" \|\| Mnemonic == "vminnm" \|\|		Mnemonic == "fmuls" \|\| Mnemonic == "vmaxnm" \|\| Mnemonic == "vminnm" \|\|
Mnemonic == "vcvta" \|\| Mnemonic == "vcvtn" \|\| Mnemonic == "vcvtp" \|\|		Mnemonic == "vcvta" \|\| Mnemonic == "vcvtn" \|\| Mnemonic == "vcvtp" \|\|
Mnemonic == "vcvtm" \|\| Mnemonic == "vrinta" \|\| Mnemonic == "vrintn" \|\|		Mnemonic == "vcvtm" \|\| Mnemonic == "vrinta" \|\| Mnemonic == "vrintn" \|\|
Mnemonic == "vrintp" \|\| Mnemonic == "vrintm" \|\| Mnemonic == "hvc" \|\|		Mnemonic == "vrintp" \|\| Mnemonic == "vrintm" \|\| Mnemonic == "hvc" \|\|
Mnemonic.startswith("vsel") \|\| Mnemonic == "vins" \|\| Mnemonic == "vmovx" \|\|		Mnemonic.startswith("vsel") \|\| Mnemonic == "vins" \|\| Mnemonic == "vmovx" \|\|
Mnemonic == "bxns" \|\| Mnemonic == "blxns" \|\|		Mnemonic == "bxns" \|\| Mnemonic == "blxns" \|\|
		Mnemonic == "vdot" \|\| Mnemonic == "vmmla" \|\|
Mnemonic == "vudot" \|\| Mnemonic == "vsdot" \|\|		Mnemonic == "vudot" \|\| Mnemonic == "vsdot" \|\|
Mnemonic == "vcmla" \|\| Mnemonic == "vcadd" \|\|		Mnemonic == "vcmla" \|\| Mnemonic == "vcadd" \|\|
Mnemonic == "vfmal" \|\| Mnemonic == "vfmsl" \|\|		Mnemonic == "vfmal" \|\| Mnemonic == "vfmsl" \|\|
Mnemonic == "wls" \|\| Mnemonic == "le" \|\| Mnemonic == "dls" \|\|		Mnemonic == "wls" \|\| Mnemonic == "le" \|\| Mnemonic == "dls" \|\|
Mnemonic == "csel" \|\| Mnemonic == "csinc" \|\|		Mnemonic == "csel" \|\| Mnemonic == "csinc" \|\|
Mnemonic == "csinv" \|\| Mnemonic == "csneg" \|\| Mnemonic == "cinc" \|\|		Mnemonic == "csinv" \|\| Mnemonic == "csneg" \|\| Mnemonic == "cinc" \|\|
Mnemonic == "cinv" \|\| Mnemonic == "cneg" \|\| Mnemonic == "cset" \|\|		Mnemonic == "cinv" \|\| Mnemonic == "cneg" \|\| Mnemonic == "cset" \|\|
Mnemonic == "csetm")		Mnemonic == "csetm")
▲ Show 20 Lines • Show All 124 Lines • ▼ Show 20 Lines	if (Mnemonic == "bkpt" \|\| Mnemonic == "cbnz" \|\| Mnemonic == "setend" \|\|
Mnemonic == "vrintn" \|\| Mnemonic == "vrintp" \|\| Mnemonic == "vrintm" \|\|		Mnemonic == "vrintn" \|\| Mnemonic == "vrintp" \|\| Mnemonic == "vrintm" \|\|
Mnemonic.startswith("aes") \|\| Mnemonic == "hvc" \|\| Mnemonic == "setpan" \|\|		Mnemonic.startswith("aes") \|\| Mnemonic == "hvc" \|\| Mnemonic == "setpan" \|\|
Mnemonic.startswith("sha1") \|\| Mnemonic.startswith("sha256") \|\|		Mnemonic.startswith("sha1") \|\| Mnemonic.startswith("sha256") \|\|
(FullInst.startswith("vmull") && FullInst.endswith(".p64")) \|\|		(FullInst.startswith("vmull") && FullInst.endswith(".p64")) \|\|
Mnemonic == "vmovx" \|\| Mnemonic == "vins" \|\|		Mnemonic == "vmovx" \|\| Mnemonic == "vins" \|\|
Mnemonic == "vudot" \|\| Mnemonic == "vsdot" \|\|		Mnemonic == "vudot" \|\| Mnemonic == "vsdot" \|\|
Mnemonic == "vcmla" \|\| Mnemonic == "vcadd" \|\|		Mnemonic == "vcmla" \|\| Mnemonic == "vcadd" \|\|
Mnemonic == "vfmal" \|\| Mnemonic == "vfmsl" \|\|		Mnemonic == "vfmal" \|\| Mnemonic == "vfmsl" \|\|
		Mnemonic == "vfmat" \|\| Mnemonic == "vfmab" \|\|
		Mnemonic == "vdot" \|\| Mnemonic == "vmmla" \|\|
Mnemonic == "sb" \|\| Mnemonic == "ssbb" \|\|		Mnemonic == "sb" \|\| Mnemonic == "ssbb" \|\|
Mnemonic == "pssbb" \|\|		Mnemonic == "pssbb" \|\|
Mnemonic == "bfcsel" \|\| Mnemonic == "wls" \|\|		Mnemonic == "bfcsel" \|\| Mnemonic == "wls" \|\|
Mnemonic == "dls" \|\| Mnemonic == "le" \|\| Mnemonic == "csel" \|\|		Mnemonic == "dls" \|\| Mnemonic == "le" \|\| Mnemonic == "csel" \|\|
Mnemonic == "csinc" \|\| Mnemonic == "csinv" \|\| Mnemonic == "csneg" \|\|		Mnemonic == "csinc" \|\| Mnemonic == "csinv" \|\| Mnemonic == "csneg" \|\|
Mnemonic == "cinc" \|\| Mnemonic == "cinv" \|\| Mnemonic == "cneg" \|\|		Mnemonic == "cinc" \|\| Mnemonic == "cinv" \|\| Mnemonic == "cneg" \|\|
Mnemonic == "cset" \|\| Mnemonic == "csetm" \|\|		Mnemonic == "cset" \|\| Mnemonic == "csetm" \|\|
Mnemonic.startswith("vpt") \|\| Mnemonic.startswith("vpst") \|\|		Mnemonic.startswith("vpt") \|\| Mnemonic.startswith("vpst") \|\|
▲ Show 20 Lines • Show All 5,785 Lines • Show Last 20 Lines

llvm/lib/Target/ARM/MCTargetDesc/ARMELFStreamer.cpp

Show First 20 Lines • Show All 850 Lines • ▼ Show 20 Lines	case ARM::ArchKind::ARMV7M:
break;		break;

case ARM::ArchKind::ARMV8A:		case ARM::ArchKind::ARMV8A:
case ARM::ArchKind::ARMV8_1A:		case ARM::ArchKind::ARMV8_1A:
case ARM::ArchKind::ARMV8_2A:		case ARM::ArchKind::ARMV8_2A:
case ARM::ArchKind::ARMV8_3A:		case ARM::ArchKind::ARMV8_3A:
case ARM::ArchKind::ARMV8_4A:		case ARM::ArchKind::ARMV8_4A:
case ARM::ArchKind::ARMV8_5A:		case ARM::ArchKind::ARMV8_5A:
		case ARM::ArchKind::ARMV8_6A:
setAttributeItem(CPU_arch_profile, ApplicationProfile, false);		setAttributeItem(CPU_arch_profile, ApplicationProfile, false);
setAttributeItem(ARM_ISA_use, Allowed, false);		setAttributeItem(ARM_ISA_use, Allowed, false);
setAttributeItem(THUMB_ISA_use, AllowThumb32, false);		setAttributeItem(THUMB_ISA_use, AllowThumb32, false);
setAttributeItem(MPextension_use, Allowed, false);		setAttributeItem(MPextension_use, Allowed, false);
setAttributeItem(Virtualization_use, AllowTZVirtualization, false);		setAttributeItem(Virtualization_use, AllowTZVirtualization, false);
break;		break;

case ARM::ArchKind::ARMV8MBaseline:		case ARM::ArchKind::ARMV8MBaseline:
▲ Show 20 Lines • Show All 651 Lines • Show Last 20 Lines

llvm/test/MC/AArch64/SVE/bfcvt-diagnostics.s

This file was added.

				// RUN: not llvm-mc -triple=aarch64 -mattr=+sve,bf16 2>&1 < %s\| FileCheck %s

				bfcvt z0.s, p0/m, z1.s
				// CHECK: [[@LINE-1]]:{{[0-9]+}}: error: invalid element width
				// CHECK-NEXT: bfcvt z0.s, p0/m, z1.s
				// CHECK-NOT: [[@LINE-1]]:{{[0-9]+}}:

				bfcvt z0.h, p0/m, z1.h
				// CHECK: [[@LINE-1]]:{{[0-9]+}}: error: invalid element width
				// CHECK-NEXT: bfcvt z0.h, p0/m, z1.h
				// CHECK-NOT: [[@LINE-1]]:{{[0-9]+}}:

				bfcvt z0.h, p0/z, z1.s
				// CHECK: [[@LINE-1]]:{{[0-9]+}}: error: invalid operand for instruction
				// CHECK-NEXT: bfcvt z0.h, p0/z, z1.s
				// CHECK-NOT: [[@LINE-1]]:{{[0-9]+}}:

				bfcvt z0.h, p8/m, z1.s
				// CHECK: [[@LINE-1]]:{{[0-9]+}}: error: invalid restricted predicate register, expected p0..p7 (without element suffix)
				// CHECK-NEXT: bfcvt z0.h, p8/m, z1.s
				// CHECK-NOT: [[@LINE-1]]:{{[0-9]+}}:

				movprfx z0.h, p0/m, z7.h
				bfcvt z0.h, p0/m, z1.s
				// CHECK: [[@LINE-1]]:{{[0-9]+}}: error: instruction is unpredictable when following a predicated movprfx with a different element size
				// CHECK-NEXT: bfcvt z0.h, p0/m, z1.s
				// CHECK-NOT: [[@LINE-1]]:{{[0-9]+}}:

llvm/test/MC/AArch64/SVE/bfcvt.s

This file was added.

				// RUN: llvm-mc -triple=aarch64 -show-encoding -mattr=+sve,+bf16 < %s \
				// RUN: \| FileCheck %s --check-prefixes=CHECK-ENCODING,CHECK-INST
				// RUN: not llvm-mc -triple=aarch64 -show-encoding < %s 2>&1 \
				// RUN: \| FileCheck %s --check-prefix=CHECK-ERROR

				bfcvt z0.H, p0/m, z1.S
				// CHECK-INST: bfcvt z0.h, p0/m, z1.s
				// CHECK-ENCODING: [0x20,0xa0,0x8a,0x65]
				// CHECK-ERROR: instruction requires: bf16 sve

				movprfx z0.S, p0/m, z2.S
				// CHECK-INST: movprfx z0.s, p0/m, z2.s
				// CHECK-ENCODING: [0x40,0x20,0x91,0x04]
				// CHECK-ERROR: instruction requires: sve

				bfcvt z0.H, p0/m, z1.S
				// CHECK-INST: bfcvt z0.h, p0/m, z1.s
				// CHECK-ENCODING: [0x20,0xa0,0x8a,0x65]
				// CHECK-ERROR: instruction requires: bf16 sve

				movprfx z0, z2
				// CHECK-INST: movprfx z0, z2
				// CHECK-ENCODING: [0x40,0xbc,0x20,0x04]
				// CHECK-ERROR: instruction requires: sve

				bfcvt z0.H, p0/m, z1.S
				// CHECK-INST: bfcvt z0.h, p0/m, z1.s
				// CHECK-ENCODING: [0x20,0xa0,0x8a,0x65]
				// CHECK-ERROR: instruction requires: bf16 sve

llvm/test/MC/AArch64/SVE/bfcvtnt-diagnostics.s

This file was added.

				// RUN: not llvm-mc -triple=aarch64 -mattr=+sve,bf16 2>&1 < %s\| FileCheck %s

				bfcvtnt z0.s, p0/m, z1.s
				// CHECK: [[@LINE-1]]:{{[0-9]+}}: error: invalid element width
				// CHECK-NEXT: bfcvtnt z0.s, p0/m, z1.s
				// CHECK-NOT: [[@LINE-1]]:{{[0-9]+}}:

				bfcvtnt z0.h, p0/m, z1.h
				// CHECK: [[@LINE-1]]:{{[0-9]+}}: error: invalid element width
				// CHECK-NEXT: bfcvtnt z0.h, p0/m, z1.h
				// CHECK-NOT: [[@LINE-1]]:{{[0-9]+}}:

				bfcvtnt z0.h, p0/z, z1.s
				// CHECK: [[@LINE-1]]:{{[0-9]+}}: error: invalid operand for instruction
				// CHECK-NEXT: bfcvtnt z0.h, p0/z, z1.s
				// CHECK-NOT: [[@LINE-1]]:{{[0-9]+}}:

				bfcvtnt z0.h, p8/m, z1.s
				// CHECK: [[@LINE-1]]:{{[0-9]+}}: error: invalid restricted predicate register, expected p0..p7 (without element suffix)
				// CHECK-NEXT: bfcvtnt z0.h, p8/m, z1.s
				// CHECK-NOT: [[@LINE-1]]:{{[0-9]+}}:

				movprfx z0.h, p0/m, z7.h
				bfcvtnt z0.h, p0/m, z1.s
				// CHECK: [[@LINE-1]]:{{[0-9]+}}: error: instruction is unpredictable when following a predicated movprfx with a different element size
				// CHECK-NEXT: bfcvtnt z0.h, p0/m, z1.s
				// CHECK-NOT: [[@LINE-1]]:{{[0-9]+}}:

llvm/test/MC/AArch64/SVE/bfcvtnt.s

This file was added.

				// RUN: llvm-mc -triple=aarch64 -show-encoding -mattr=+sve,+bf16 < %s \
				// RUN: \| FileCheck %s --check-prefixes=CHECK-ENCODING,CHECK-INST
				// RUN: not llvm-mc -triple=aarch64 -show-encoding < %s 2>&1 \
				// RUN: \| FileCheck %s --check-prefix=CHECK-ERROR

				bfcvtnt z0.H, p0/m, z1.S
				// CHECK-INST: bfcvtnt z0.h, p0/m, z1.s
				// CHECK-ENCODING: [0x20,0xa0,0x8a,0x64]
				// CHECK-ERROR: instruction requires: bf16 sve

				movprfx z0.S, p0/m, z2.S
				// CHECK-INST: movprfx z0.s, p0/m, z2.s
				// CHECK-ENCODING: [0x40,0x20,0x91,0x04]
				// CHECK-ERROR: instruction requires: sve

				bfcvtnt z0.H, p0/m, z1.S
				// CHECK-INST: bfcvtnt z0.h, p0/m, z1.s
				// CHECK-ENCODING: [0x20,0xa0,0x8a,0x64]
				// CHECK-ERROR: instruction requires: bf16 sve

				movprfx z0, z2
				// CHECK-INST: movprfx z0, z2
				// CHECK-ENCODING: [0x40,0xbc,0x20,0x04]
				// CHECK-ERROR: instruction requires: sve

				bfcvtnt z0.H, p0/m, z1.S
				// CHECK-INST: bfcvtnt z0.h, p0/m, z1.s
				// CHECK-ENCODING: [0x20,0xa0,0x8a,0x64]
				// CHECK-ERROR: instruction requires: bf16 sve

llvm/test/MC/AArch64/SVE/bfdot-diagnostics.s

This file was added.

				// RUN: not llvm-mc -triple=aarch64 -mattr=+sve,bf16 2>&1 < %s\| FileCheck %s

				bfdot z0.s, z1.s, z2.h
				// CHECK: [[@LINE-1]]:{{[0-9]+}}: error: invalid element width
				// CHECK-NEXT: bfdot z0.s, z1.s, z2.h
				// CHECK-NOT: [[@LINE-1]]:{{[0-9]+}}:

				bfdot z0.h, z1.h, z2.h
				// CHECK: [[@LINE-1]]:{{[0-9]+}}: error: invalid element width
				// CHECK-NEXT: bfdot z0.h, z1.h, z2.h
				// CHECK-NOT: [[@LINE-1]]:{{[0-9]+}}:

				bfdot z0.s, z1.h, z2.s
				// CHECK: [[@LINE-1]]:{{[0-9]+}}: error: Invalid restricted vector register, expected z0.h..z7.h
				// CHECK-NEXT: bfdot z0.s, z1.h, z2.s
				// CHECK-NOT: [[@LINE-1]]:{{[0-9]+}}:

				movprfx z0.s, p0/m, z7.s
				bfdot z0.s, z1.h, z2.h
				// CHECK: [[@LINE-1]]:{{[0-9]+}}: error: instruction is unpredictable when following a predicated movprfx, suggest using unpredicated movprfx
				// CHECK-NEXT: bfdot z0.s, z1.h, z2.h
				// CHECK-NOT: [[@LINE-1]]:{{[0-9]+}}:

				bfdot z0.s, z1.s, z2.h[0]
				// CHECK: [[@LINE-1]]:{{[0-9]+}}: error: invalid element width
				// CHECK-NEXT: bfdot z0.s, z1.s, z2.h[0]
				// CHECK-NOT: [[@LINE-1]]:{{[0-9]+}}:

				bfdot z0.h, z1.h, z2.h[0]
				// CHECK: [[@LINE-1]]:{{[0-9]+}}: error: invalid element width
				// CHECK-NEXT: bfdot z0.h, z1.h, z2.h[0]
				// CHECK-NOT: [[@LINE-1]]:{{[0-9]+}}:

				bfdot z0.s, z1.h, z2.s[0]
				// CHECK: [[@LINE-1]]:{{[0-9]+}}: error: Invalid restricted vector register, expected z0.h..z7.h
				// CHECK-NEXT: bfdot z0.s, z1.h, z2.s[0]
				// CHECK-NOT: [[@LINE-1]]:{{[0-9]+}}:

				bfdot z0.s, z1.h, z8.h[0]
				// CHECK: [[@LINE-1]]:{{[0-9]+}}: error: invalid operand for instruction
				// CHECK-NEXT: bfdot z0.s, z1.h, z8.h[0]
				// CHECK-NOT: [[@LINE-1]]:{{[0-9]+}}:

				bfdot z0.s, z1.h, z2.h[4]
				// CHECK: [[@LINE-1]]:{{[0-9]+}}: error: vector lane must be an integer in range [0, 3].
				// CHECK-NEXT: bfdot z0.s, z1.h, z2.h[4]
				// CHECK-NOT: [[@LINE-1]]:{{[0-9]+}}:

				movprfx z0.s, p0/m, z7.s
				bfdot z0.s, z1.h, z2.h[0]
				// CHECK: [[@LINE-1]]:{{[0-9]+}}: error: instruction is unpredictable when following a predicated movprfx, suggest using unpredicated movprfx
				// CHECK-NEXT: bfdot z0.s, z1.h, z2.h[0]
				// CHECK-NOT: [[@LINE-1]]:{{[0-9]+}}:

llvm/test/MC/AArch64/SVE/bfdot.s

This file was added.

				// RUN: llvm-mc -triple=aarch64 -show-encoding -mattr=+sve,+bf16 < %s \
				// RUN: \| FileCheck %s --check-prefixes=CHECK-ENCODING,CHECK-INST
				// RUN: not llvm-mc -triple=aarch64 -show-encoding < %s 2>&1 \
				// RUN: \| FileCheck %s --check-prefix=CHECK-ERROR

				bfdot z0.S, z1.H, z2.H
				// CHECK-INST: bfdot z0.s, z1.h, z2.h
				// CHECK-ENCODING: [0x20,0x80,0x62,0x64]
				// CHECK-ERROR: instruction requires: bf16 sve

				bfdot z0.S, z1.H, z2.H[0]
				// CHECK-INST: bfdot z0.s, z1.h, z2.h[0]
				// CHECK-ENCODING: [0x20,0x40,0x62,0x64]
				// CHECK-ERROR: instruction requires: bf16 sve

				bfdot z0.S, z1.H, z2.H[3]
				// CHECK-INST: bfdot z0.s, z1.h, z2.h[3]
				// CHECK-ENCODING: [0x20,0x40,0x7a,0x64]
				// CHECK-ERROR: instruction requires: bf16 sve

				// --------------------------------------------------------------------------//
				// Test compatibility with MOVPRFX instruction.

				movprfx z0, z7
				// CHECK-INST: movprfx z0, z7
				// CHECK-ENCODING: [0xe0,0xbc,0x20,0x04]
				// CHECK-ERROR: instruction requires: sve

				bfdot z0.S, z1.H, z2.H
				// CHECK-INST: bfdot z0.s, z1.h, z2.h
				// CHECK-ENCODING: [0x20,0x80,0x62,0x64]
				// CHECK-ERROR: instruction requires: bf16 sve

				movprfx z0, z7
				// CHECK-INST: movprfx z0, z7
				// CHECK-ENCODING: [0xe0,0xbc,0x20,0x04]
				// CHECK-ERROR: instruction requires: sve

				bfdot z0.S, z1.H, z2.H[0]
				// CHECK-INST: bfdot z0.s, z1.h, z2.h[0]
				// CHECK-ENCODING: [0x20,0x40,0x62,0x64]
				// CHECK-ERROR: instruction requires: bf16 sve

				movprfx z0, z7
				// CHECK-INST: movprfx z0, z7
				// CHECK-ENCODING: [0xe0,0xbc,0x20,0x04]
				// CHECK-ERROR: instruction requires: sve

				bfdot z0.S, z1.H, z2.H[3]
				// CHECK-INST: bfdot z0.s, z1.h, z2.h[3]
				// CHECK-ENCODING: [0x20,0x40,0x7a,0x64]
				// CHECK-ERROR: instruction requires: bf16 sve

llvm/test/MC/AArch64/SVE/bfmlal-diagnostics.s

This file was added.

				// RUN: not llvm-mc -o - -triple=aarch64 -mattr=+sve,bf16 2>&1 %s \| FileCheck %s

				bfmlalb z0.S, z1.H, z7.H[8]
				// CHECK: [[@LINE-1]]:{{[0-9]+}}: error: vector lane must be an integer in range [0, 7].
				// CHECK-NEXT: bfmlalb z0.S, z1.H, z7.H[8]
				// CHECK-NEXT: ^

				bfmlalb z0.S, z1.H, z8.H[7]
				// CHECK: [[@LINE-1]]:{{[0-9]+}}: error: invalid operand for instruction
				// CHECK-NEXT: bfmlalb z0.S, z1.H, z8.H[7]
				// CHECK-NEXT: ^

				bfmlalt z0.S, z1.H, z7.H[8]
				// CHECK: [[@LINE-1]]:{{[0-9]+}}: error: vector lane must be an integer in range [0, 7].
				// CHECK-NEXT: bfmlalt z0.S, z1.H, z7.H[8]
				// CHECK-NEXT: ^

				bfmlalt z0.S, z1.H, z8.H[7]
				// CHECK: [[@LINE-1]]:{{[0-9]+}}: error: invalid operand for instruction
				// CHECK-NEXT: bfmlalt z0.S, z1.H, z8.H[7]
				// CHECK-NEXT: ^

				bfmlalt z0.S, z1.H, z7.2h[2]
				// CHECK: error: invalid vector kind qualifier
				// CHECK-NEXT: bfmlalt z0.S, z1.H, z7.2h[2]
				// CHECK-NEXT: ^

				bfmlalt z0.S, z1.H, z2.s[2]
				// CHECK: error: Invalid restricted vector register, expected z0.h..z7.h
				// CHECK-NEXT: bfmlalt z0.S, z1.H, z2.s[2]
				// CHECK-NEXT: ^

				bfmlalt z0.S, z1.s, z2.h[2]
				// CHECK: error: invalid element width
				// CHECK-NEXT: bfmlalt z0.S, z1.s, z2.h[2]
				// CHECK-NEXT: ^

				movprfx z0.s, p0/m, z7.s
				bfmlalt z0.s, z1.h, z2.h
				// CHECK: [[@LINE-1]]:{{[0-9]+}}: error: instruction is unpredictable when following a predicated movprfx
				// CHECK-NEXT: bfmlalt z0.s, z1.h, z2.h
				// CHECK-NEXT: ^

llvm/test/MC/AArch64/SVE/bfmlal.s

This file was added.

				// RUN: llvm-mc -o - -triple=aarch64 -show-encoding -mattr=+sve,+bf16 %s \
				// RUN: \| FileCheck %s --check-prefixes=CHECK-ENCODING,CHECK-INST
				// RUN: not llvm-mc -o - -triple=aarch64 -show-encoding %s 2>&1 \
				// RUN: \| FileCheck %s --check-prefix=CHECK-ERROR

				bfmlalb z0.S, z1.H, z2.H
				// CHECK-INST: bfmlalb z0.s, z1.h, z2.h
				// CHECK-ENCODING: [0x20,0x80,0xe2,0x64]
				// CHECK-ERROR: instruction requires: bf16 sve

				bfmlalt z0.S, z1.H, z2.H
				// CHECK-INST: bfmlalt z0.s, z1.h, z2.h
				// CHECK-ENCODING: [0x20,0x84,0xe2,0x64]
				// CHECK-ERROR: instruction requires: bf16 sve

				bfmlalb z0.S, z1.H, z2.H[0]
				// CHECK-INST: bfmlalb z0.s, z1.h, z2.h[0]
				// CHECK-ENCODING: [0x20,0x40,0xe2,0x64]
				// CHECK-ERROR: instruction requires: bf16 sve

				bfmlalt z0.S, z1.H, z2.H[0]
				// CHECK-INST: bfmlalt z0.s, z1.h, z2.h[0]
				// CHECK-ENCODING: [0x20,0x44,0xe2,0x64]
				// CHECK-ERROR: instruction requires: bf16 sve

				bfmlalb z0.S, z1.H, z2.H[7]
				// CHECK-INST: bfmlalb z0.s, z1.h, z2.h[7]
				// CHECK-ENCODING: [0x20,0x48,0xfa,0x64]
				// CHECK-ERROR: instruction requires: bf16 sve

				bfmlalt z0.S, z1.H, z2.H[7]
				// CHECK-INST: bfmlalt z0.s, z1.h, z2.h[7]
				// CHECK-ENCODING: [0x20,0x4c,0xfa,0x64]
				// CHECK-ERROR: instruction requires: bf16 sve

				bfmlalt z0.S, z1.H, z7.H[7]
				// CHECK-INST: bfmlalt z0.s, z1.h, z7.h[7]
				// CHECK-ENCODING: [0x20,0x4c,0xff,0x64]
				// CHECK-ERROR: instruction requires: bf16 sve

				bfmlalb z10.S, z21.H, z14.H
				// CHECK-INST: bfmlalb z10.s, z21.h, z14.h
				// CHECK-ENCODING: [0xaa,0x82,0xee,0x64]
				// CHECK-ERROR: instruction requires: bf16 sve

				bfmlalt z14.S, z10.H, z21.H
				// CHECK-INST: bfmlalt z14.s, z10.h, z21.h
				// CHECK-ENCODING: [0x4e,0x85,0xf5,0x64]
				// CHECK-ERROR: instruction requires: bf16 sve

				bfmlalb z21.s, z14.h, z3.h[2]
				// CHECK-INST: bfmlalb z21.s, z14.h, z3.h[2]
				// CHECK-ENCODING: [0xd5,0x41,0xeb,0x64]
				// CHECK-ERROR: instruction requires: bf16 sve

				// --------------------------------------------------------------------------//
				// Test compatibility with MOVPRFX instruction.

				movprfx z0, z7
				// CHECK-INST: movprfx z0, z7
				// CHECK-ENCODING: [0xe0,0xbc,0x20,0x04]
				// CHECK-ERROR: instruction requires: sve

				bfmlalb z0.S, z1.H, z2.H
				// CHECK-INST: bfmlalb z0.s, z1.h, z2.h
				// CHECK-ENCODING: [0x20,0x80,0xe2,0x64]
				// CHECK-ERROR: instruction requires: bf16 sve

				movprfx z0, z7
				// CHECK-INST: movprfx z0, z7
				// CHECK-ENCODING: [0xe0,0xbc,0x20,0x04]
				// CHECK-ERROR: instruction requires: sve

				bfmlalt z0.S, z1.H, z2.H
				// CHECK-INST: bfmlalt z0.s, z1.h, z2.h
				// CHECK-ENCODING: [0x20,0x84,0xe2,0x64]
				// CHECK-ERROR: instruction requires: bf16 sve

				movprfx z0, z7
				// CHECK-INST: movprfx z0, z7
				// CHECK-ENCODING: [0xe0,0xbc,0x20,0x04]
				// CHECK-ERROR: instruction requires: sve

				bfmlalb z0.S, z1.H, z2.H[0]
				// CHECK-INST: bfmlalb z0.s, z1.h, z2.h[0]
				// CHECK-ENCODING: [0x20,0x40,0xe2,0x64]
				// CHECK-ERROR: instruction requires: bf16 sve

				movprfx z0, z7
				// CHECK-INST: movprfx z0, z7
				// CHECK-ENCODING: [0xe0,0xbc,0x20,0x04]
				// CHECK-ERROR: instruction requires: sve

				bfmlalt z0.S, z1.H, z2.H[0]
				// CHECK-INST: bfmlalt z0.s, z1.h, z2.h[0]
				// CHECK-ENCODING: [0x20,0x44,0xe2,0x64]
				// CHECK-ERROR: instruction requires: bf16 sve

				movprfx z0, z7
				// CHECK-INST: movprfx z0, z7
				// CHECK-ENCODING: [0xe0,0xbc,0x20,0x04]
				// CHECK-ERROR: instruction requires: sve

				bfmlalb z0.S, z1.H, z2.H[7]
				// CHECK-INST: bfmlalb z0.s, z1.h, z2.h[7]
				// CHECK-ENCODING: [0x20,0x48,0xfa,0x64]
				// CHECK-ERROR: instruction requires: bf16 sve

				movprfx z0, z7
				// CHECK-INST: movprfx z0, z7
				// CHECK-ENCODING: [0xe0,0xbc,0x20,0x04]
				// CHECK-ERROR: instruction requires: sve

				bfmlalt z0.S, z1.H, z2.H[7]
				// CHECK-INST: bfmlalt z0.s, z1.h, z2.h[7]
				// CHECK-ENCODING: [0x20,0x4c,0xfa,0x64]
				// CHECK-ERROR: instruction requires: bf16 sve

				movprfx z0, z7
				// CHECK-INST: movprfx z0, z7
				// CHECK-ENCODING: [0xe0,0xbc,0x20,0x04]
				// CHECK-ERROR: instruction requires: sve

				bfmlalt z0.S, z1.H, z7.H[7]
				// CHECK-INST: bfmlalt z0.s, z1.h, z7.h[7]
				// CHECK-ENCODING: [0x20,0x4c,0xff,0x64]
				// CHECK-ERROR: instruction requires: bf16 sve

				movprfx z10, z7
				// CHECK-INST: movprfx z10, z7
				// CHECK-ENCODING: [0xea,0xbc,0x20,0x04]
				// CHECK-ERROR: instruction requires: sve

				bfmlalb z10.S, z21.H, z14.H
				// CHECK-INST: bfmlalb z10.s, z21.h, z14.h
				// CHECK-ENCODING: [0xaa,0x82,0xee,0x64]
				// CHECK-ERROR: instruction requires: bf16 sve

				movprfx z14, z7
				// CHECK-INST: movprfx z14, z7
				// CHECK-ENCODING: [0xee,0xbc,0x20,0x04]
				// CHECK-ERROR: instruction requires: sve

				bfmlalt z14.S, z10.H, z21.H
				// CHECK-INST: bfmlalt z14.s, z10.h, z21.h
				// CHECK-ENCODING: [0x4e,0x85,0xf5,0x64]
				// CHECK-ERROR: instruction requires: bf16 sve

				movprfx z21, z7
				// CHECK-INST: movprfx z21, z7
				// CHECK-ENCODING: [0xf5,0xbc,0x20,0x04]
				// CHECK-ERROR: instruction requires: sve

				bfmlalb z21.s, z14.h, z3.h[2]
				// CHECK-INST: bfmlalb z21.s, z14.h, z3.h[2]
				// CHECK-ENCODING: [0xd5,0x41,0xeb,0x64]
				// CHECK-ERROR: instruction requires: bf16 sve

llvm/test/MC/AArch64/SVE/bfmmla-diagnostics.s

This file was added.

				// RUN: not llvm-mc -triple=aarch64 -mattr=+sve,bf16 2>&1 < %s\| FileCheck %s

				bfmmla z0.s, z1.s, z2.h
				// CHECK: [[@LINE-1]]:{{[0-9]+}}: error: invalid element width
				// CHECK-NEXT: bfmmla z0.s, z1.s, z2.h
				// CHECK-NOT: [[@LINE-1]]:{{[0-9]+}}:

				bfmmla z0.h, z1.h, z2.h
				// CHECK: [[@LINE-1]]:{{[0-9]+}}: error: invalid element width
				// CHECK-NEXT: bfmmla z0.h, z1.h, z2.h
				// CHECK-NOT: [[@LINE-1]]:{{[0-9]+}}:

				bfmmla z0.s, z1.h, z2.s
				// CHECK: [[@LINE-1]]:{{[0-9]+}}: error: invalid element width
				// CHECK-NEXT: bfmmla z0.s, z1.h, z2.s
				// CHECK-NOT: [[@LINE-1]]:{{[0-9]+}}:

				movprfx z0.s, p0/m, z7.s
				bfmmla z0.s, z1.h, z2.h
				// CHECK: [[@LINE-1]]:{{[0-9]+}}: error: instruction is unpredictable when following a predicated movprfx, suggest using unpredicated movprfx
				// CHECK-NEXT: bfmmla z0.s, z1.h, z2.h
				// CHECK-NOT: [[@LINE-1]]:{{[0-9]+}}:

llvm/test/MC/AArch64/SVE/bfmmla.s

This file was added.

				// RUN: llvm-mc -triple=aarch64 -show-encoding -mattr=+sve,+bf16 < %s \
				// RUN: \| FileCheck %s --check-prefixes=CHECK-ENCODING,CHECK-INST
				// RUN: not llvm-mc -triple=aarch64 -show-encoding < %s 2>&1 \
				// RUN: \| FileCheck %s --check-prefix=CHECK-ERROR

				bfmmla z0.S, z1.H, z2.H
				// CHECK-INST: bfmmla z0.s, z1.h, z2.h
				// CHECK-ENCODING: [0x20,0xe4,0x62,0x64]
				// CHECK-ERROR: instruction requires: bf16 sve

				// --------------------------------------------------------------------------//
				// Test compatibility with MOVPRFX instruction.

				movprfx z0, z7
				// CHECK-INST: movprfx z0, z7
				// CHECK-ENCODING: [0xe0,0xbc,0x20,0x04]
				// CHECK-ERROR: instruction requires: sve

				bfmmla z0.S, z1.H, z2.H
				// CHECK-INST: bfmmla z0.s, z1.h, z2.h
				// CHECK-ENCODING: [0x20,0xe4,0x62,0x64]
				// CHECK-ERROR: instruction requires: bf16 sve

llvm/test/MC/AArch64/armv8.6a-bf16.s

This file was added.

				// RUN: llvm-mc -triple aarch64 -show-encoding -mattr=+bf16 < %s \| FileCheck %s
				// RUN: llvm-mc -triple aarch64 -show-encoding -mattr=+v8.6a < %s \| FileCheck %s
				// RUN: not llvm-mc -triple aarch64 -show-encoding -mattr=-bf16 < %s 2>&1 \| FileCheck %s --check-prefix=NOBF16
				// RUN: not llvm-mc -triple aarch64 -show-encoding < %s 2>&1 \| FileCheck %s --check-prefix=NOBF16


				bfdot v2.2s, v3.4h, v4.4h
				bfdot v2.4s, v3.8h, v4.8h
				// CHECK: bfdot v2.2s, v3.4h, v4.4h // encoding: [0x62,0xfc,0x44,0x2e]
				// CHECK: bfdot v2.4s, v3.8h, v4.8h // encoding: [0x62,0xfc,0x44,0x6e]
				// NOBF16: instruction requires: bf16
				// NOBF16-NEXT: bfdot v2.2s, v3.4h, v4.4h
				// NOBF16: instruction requires: bf16
				// NOBF16-NEXT: bfdot v2.4s, v3.8h, v4.8h

				bfdot v2.2s, v3.4h, v4.2h[0]
				bfdot v2.2s, v3.4h, v4.2h[1]
				bfdot v2.2s, v3.4h, v4.2h[2]
				bfdot v2.2s, v3.4h, v4.2h[3]
				// CHECK: bfdot v2.2s, v3.4h, v4.2h[0] // encoding: [0x62,0xf0,0x44,0x0f]
				// CHECK: bfdot v2.2s, v3.4h, v4.2h[1] // encoding: [0x62,0xf0,0x64,0x0f]
				// CHECK: bfdot v2.2s, v3.4h, v4.2h[2] // encoding: [0x62,0xf8,0x44,0x0f]
				// CHECK: bfdot v2.2s, v3.4h, v4.2h[3] // encoding: [0x62,0xf8,0x64,0x0f]
				// NOBF16: instruction requires: bf16
				// NOBF16-NEXT: bfdot v2.2s, v3.4h, v4.2h[0]
				// NOBF16: instruction requires: bf16
				// NOBF16-NEXT: bfdot v2.2s, v3.4h, v4.2h[1]
				// NOBF16: instruction requires: bf16
				// NOBF16-NEXT: bfdot v2.2s, v3.4h, v4.2h[2]
				// NOBF16: instruction requires: bf16
				// NOBF16-NEXT: bfdot v2.2s, v3.4h, v4.2h[3]


				bfdot v2.4s, v3.8h, v4.2h[0]
				bfdot v2.4s, v3.8h, v4.2h[1]
				bfdot v2.4s, v3.8h, v4.2h[2]
				bfdot v2.4s, v3.8h, v4.2h[3]
				// CHECK: bfdot v2.4s, v3.8h, v4.2h[0] // encoding: [0x62,0xf0,0x44,0x4f]
				// CHECK: bfdot v2.4s, v3.8h, v4.2h[1] // encoding: [0x62,0xf0,0x64,0x4f]
				// CHECK: bfdot v2.4s, v3.8h, v4.2h[2] // encoding: [0x62,0xf8,0x44,0x4f]
				// CHECK: bfdot v2.4s, v3.8h, v4.2h[3] // encoding: [0x62,0xf8,0x64,0x4f]
				// NOBF16: instruction requires: bf16
				// NOBF16-NEXT: bfdot v2.4s, v3.8h, v4.2h[0]
				// NOBF16: instruction requires: bf16
				// NOBF16-NEXT: bfdot v2.4s, v3.8h, v4.2h[1]
				// NOBF16: instruction requires: bf16
				// NOBF16-NEXT: bfdot v2.4s, v3.8h, v4.2h[2]
				// NOBF16: instruction requires: bf16
				// NOBF16-NEXT: bfdot v2.4s, v3.8h, v4.2h[3]


				bfmmla v2.4s, v3.8h, v4.8h
				bfmmla v3.4s, v4.8h, v5.8h
				// CHECK: bfmmla v2.4s, v3.8h, v4.8h // encoding: [0x62,0xec,0x44,0x6e]
				// CHECK: bfmmla v3.4s, v4.8h, v5.8h // encoding: [0x83,0xec,0x45,0x6e]
				// NOBF16: instruction requires: bf16
				// NOBF16-NEXT: bfmmla v2.4s, v3.8h, v4.8h
				// NOBF16: instruction requires: bf16
				// NOBF16-NEXT: bfmmla v3.4s, v4.8h, v5.8h

				bfcvtn v5.4h, v5.4s
				bfcvtn2 v5.8h, v5.4s
				// CHECK: bfcvtn v5.4h, v5.4s // encoding: [0xa5,0x68,0xa1,0x0e]
				// CHECK: bfcvtn2 v5.8h, v5.4s // encoding: [0xa5,0x68,0xa1,0x4e]
				// NOBF16: instruction requires: bf16
				// NOBF16-NEXT: bfcvtn v5.4h, v5.4s
				// NOBF16: instruction requires: bf16
				// NOBF16-NEXT: bfcvtn2 v5.8h, v5.4s

				bfcvt h5, s3
				// CHECK: bfcvt h5, s3 // encoding: [0x65,0x40,0x63,0x1e]
				// NOBF16: instruction requires: bf16
				// NOBF16-NEXT: bfcvt h5, s3

				bfmlalb V10.4S, V21.8h, V14.8H
				bfmlalt V21.4S, V14.8h, V10.8H
				// CHECK: bfmlalb v10.4s, v21.8h, v14.8h // encoding: [0xaa,0xfe,0xce,0x2e]
				// CHECK-NEXT: bfmlalt v21.4s, v14.8h, v10.8h // encoding: [0xd5,0xfd,0xca,0x6e]
				// NOBF16: error: instruction requires: bf16
				// NOBF16-NEXT: bfmlalb V10.4S, V21.8h, V14.8H
				// NOBF16-NEXT: ^
				// NOBF16: instruction requires: bf16
				// NOBF16-NEXT: bfmlalt V21.4S, V14.8h, V10.8H
				// NOBF16-NEXT: ^

				bfmlalb V14.4S, V21.8H, V10.H[1]
				bfmlalb V14.4S, V21.8H, V10.H[2]
				bfmlalb V14.4S, V21.8H, V10.H[7]
				bfmlalt V21.4S, V10.8H, V14.H[1]
				bfmlalt V21.4S, V10.8H, V14.H[2]
				bfmlalt V21.4S, V10.8H, V14.H[7]
				// CHECK: bfmlalb v14.4s, v21.8h, v10.h[1] // encoding: [0xae,0xf2,0xda,0x0f]
				// CHECK-NEXT: bfmlalb v14.4s, v21.8h, v10.h[2] // encoding: [0xae,0xf2,0xea,0x0f]
				// CHECK-NEXT: bfmlalb v14.4s, v21.8h, v10.h[7] // encoding: [0xae,0xfa,0xfa,0x0f]
				// CHECK-NEXT: bfmlalt v21.4s, v10.8h, v14.h[1] // encoding: [0x55,0xf1,0xde,0x4f]
				// CHECK-NEXT: bfmlalt v21.4s, v10.8h, v14.h[2] // encoding: [0x55,0xf1,0xee,0x4f]
				// CHECK-NEXT: bfmlalt v21.4s, v10.8h, v14.h[7] // encoding: [0x55,0xf9,0xfe,0x4f]
				// NOBF16: error: instruction requires: bf16
				// NOBF16-NEXT: bfmlalb V14.4S, V21.8H, V10.H[1]
				// NOBF16-NEXT: ^
				// NOBF16: error: instruction requires: bf16
				// NOBF16-NEXT: bfmlalb V14.4S, V21.8H, V10.H[2]
				// NOBF16-NEXT: ^
				// NOBF16: error: instruction requires: bf16
				// NOBF16-NEXT: bfmlalb V14.4S, V21.8H, V10.H[7]
				// NOBF16-NEXT: ^
				// NOBF16: instruction requires: bf16
				// NOBF16-NEXT: bfmlalt V21.4S, V10.8H, V14.H[1]
				// NOBF16-NEXT: ^
				// NOBF16: instruction requires: bf16
				// NOBF16-NEXT: bfmlalt V21.4S, V10.8H, V14.H[2]
				// NOBF16-NEXT: ^
				// NOBF16: instruction requires: bf16
				// NOBF16-NEXT: bfmlalt V21.4S, V10.8H, V14.H[7]
				// NOBF16-NEXT: ^

llvm/test/MC/ARM/bfloat16-a32-errors.s

This file was added.

				// RUN: not llvm-mc -triple arm -mattr=+bf16,-neon %s -o /dev/null 2>&1 \| FileCheck %s --check-prefixes=NONEON,ALL
				// RUN: not llvm-mc -triple arm -mattr=-bf16 %s -o /dev/null 2>&1 \| FileCheck %s --check-prefixes=NOBF16,ALL
				// RUN: not llvm-mc -triple arm %s -o /dev/null 2>&1 \| FileCheck %s --check-prefixes=NONEON,ALL
				//
				vdot.bf16 d3, d4, d5
				vdot.bf16 q0, q1, q2
				vdot.bf16 d3, d4, d5[1]
				vdot.bf16 q0, q1, d5[1]
				vmmla.bf16 q0, q1, q2
				vcvt.bf16.f32 d1, q3
				vcvtbeq.bf16.f32 s1, s3
				vcvttne.bf16.f32 s1, s3
				// NOBF16: error: instruction requires: BFloat16 floating point extension
				// NOBF16-NEXT: vdot.bf16 d3, d4, d5
				// NOBF16-NEXT: ^
				// NOBF16-NEXT: error: instruction requires: BFloat16 floating point extension
				// NOBF16-NEXT: vdot.bf16 q0, q1, q2
				// NOBF16-NEXT: ^
				// NOBF16-NEXT: error: instruction requires: BFloat16 floating point extension
				// NOBF16-NEXT: vdot.bf16 d3, d4, d5[1]
				// NOBF16-NEXT: ^
				// NOBF16-NEXT: error: instruction requires: BFloat16 floating point extension
				// NOBF16-NEXT: vdot.bf16 q0, q1, d5[1]
				// NOBF16-NEXT: ^
				// NOBF16-NEXT: error: instruction requires: BFloat16 floating point extension
				// NOBF16-NEXT: vmmla.bf16 q0, q1, q2
				// NOBF16-NEXT: ^
				// NOBF16-NEXT: error: instruction requires: BFloat16 floating point extension
				// NOBF16-NEXT: vcvt.bf16.f32 d1, q3
				// NOBF16-NEXT: ^

				// NONEON: error: instruction requires: BFloat16 floating point extension NEON
				// NONEON-NEXT: vdot.bf16 d3, d4, d5
				// NONEON-NEXT: ^
				// NONEON-NEXT: error: instruction requires: BFloat16 floating point extension NEON
				// NONEON-NEXT: vdot.bf16 q0, q1, q2
				// NONEON-NEXT: ^
				// NONEON-NEXT: error: instruction requires: BFloat16 floating point extension NEON
				// NONEON-NEXT: vdot.bf16 d3, d4, d5[1]
				// NONEON-NEXT: ^
				// NONEON-NEXT: error: instruction requires: BFloat16 floating point extension NEON
				// NONEON-NEXT: vdot.bf16 q0, q1, d5[1]
				// NONEON-NEXT: ^
				// NONEON-NEXT: error: instruction requires: BFloat16 floating point extension NEON
				// NONEON-NEXT: vmmla.bf16 q0, q1, q2
				// NONEON-NEXT: ^
				// NONEON-NEXT: error: instruction requires: BFloat16 floating point extension NEON
				// NONEON-NEXT: vcvt.bf16.f32 d1, q3
				// NONEON-NEXT: ^


				// ALL-NEXT: error: instruction requires: BFloat16 floating point extension
				// ALL-NEXT: vcvtbeq.bf16.f32 s1, s3
				// ALL-NEXT: ^
				// ALL-NEXT: error: instruction requires: BFloat16 floating point extension
				// ALL-NEXT: vcvttne.bf16.f32 s1, s3
				// ALL-NEXT: ^

llvm/test/MC/ARM/bfloat16-a32-errors2.s

This file was added.

				// RUN: not llvm-mc -o - -triple arm -mattr=+v8.6a -show-encoding %s 2>&1 \| FileCheck %s
				vfmat.bf16 d0, d0, d0
				vfmat.bf16 d0, d0, q0
				vfmat.bf16 d0, q0, d0
				vfmat.bf16 q0, d0, d0
				vfmat.bf16 q0, q0, d0
				vfmat.bf16 q0, d0, q0
				vfmat.bf16 d0, q0, q0
				vfmat.bf16 q0, q0, q0[3]
				vfmat.bf16 q0, q0, q0[3]
				vfmat.bf16 q0, d0, d0[0]
				vfmat.bf16 d0, q0, d0[0]
				vfmat.bf16 q0, d0, d0[9]

				vfmab.bf16 d0, d0, d0
				vfmab.bf16 d0, d0, q0
				vfmab.bf16 d0, q0, d0
				vfmab.bf16 q0, d0, d0
				vfmab.bf16 q0, q0, d0
				vfmab.bf16 q0, d0, q0
				vfmab.bf16 d0, q0, q0
				vfmab.bf16 q0, q0, q0[3]
				vfmab.bf16 q0, q0, q0[3]
				vfmab.bf16 q0, d0, d0[0]
				vfmab.bf16 d0, q0, d0[0]
				vfmab.bf16 q0, d0, d0[9]

				//CHECK:error: invalid instruction
				//CHECK-NEXT:vfmat.bf16 d0, d0, d0
				//CHECK-NEXT:^
				//CHECK-NEXT:error: invalid instruction
				//CHECK-NEXT:vfmat.bf16 d0, d0, q0
				//CHECK-NEXT:^
				//CHECK-NEXT:error: invalid instruction
				//CHECK-NEXT:vfmat.bf16 d0, q0, d0
				//CHECK-NEXT:^
				//CHECK-NEXT:error: invalid instruction
				//CHECK-NEXT:vfmat.bf16 q0, d0, d0
				//CHECK-NEXT:^
				//CHECK-NEXT:error: invalid instruction, any one of the following would fix this:
				//CHECK-NEXT:vfmat.bf16 q0, q0, d0
				//CHECK-NEXT:^
				//CHECK-NEXT:note: too few operands for instruction
				//CHECK-NEXT:vfmat.bf16 q0, q0, d0
				//CHECK-NEXT: ^
				//CHECK-NEXT:note: operand must be a register in range [q0, q15]
				//CHECK-NEXT:vfmat.bf16 q0, q0, d0
				//CHECK-NEXT: ^
				//CHECK-NEXT:error: operand must be a register in range [q0, q15]
				//CHECK-NEXT:vfmat.bf16 q0, d0, q0
				//CHECK-NEXT: ^
				//CHECK-NEXT:error: operand must be a register in range [q0, q15]
				//CHECK-NEXT:vfmat.bf16 d0, q0, q0
				//CHECK-NEXT: ^
				//CHECK-NEXT:error: invalid instruction, any one of the following would fix this:
				//CHECK-NEXT:vfmat.bf16 q0, q0, q0[3]
				//CHECK-NEXT:^
				//CHECK-NEXT:note: operand must be a register in range [d0, d7]
				//CHECK-NEXT:vfmat.bf16 q0, q0, q0[3]
				//CHECK-NEXT: ^
				//CHECK-NEXT:note: too many operands for instruction
				//CHECK-NEXT:vfmat.bf16 q0, q0, q0[3]
				//CHECK-NEXT: ^
				//CHECK-NEXT:error: invalid instruction, any one of the following would fix this:
				//CHECK-NEXT:vfmat.bf16 q0, q0, q0[3]
				//CHECK-NEXT:^
				//CHECK-NEXT:note: operand must be a register in range [d0, d7]
				//CHECK-NEXT:vfmat.bf16 q0, q0, q0[3]
				//CHECK-NEXT: ^
				//CHECK-NEXT:note: too many operands for instruction
				//CHECK-NEXT:vfmat.bf16 q0, q0, q0[3]
				//CHECK-NEXT: ^
				//CHECK-NEXT:error: operand must be a register in range [q0, q15]
				//CHECK-NEXT:vfmat.bf16 q0, d0, d0[0]
				//CHECK-NEXT: ^
				//CHECK-NEXT:error: operand must be a register in range [q0, q15]
				//CHECK-NEXT:vfmat.bf16 d0, q0, d0[0]
				//CHECK-NEXT: ^
				//CHECK-NEXT:error: invalid instruction
				//CHECK-NEXT:vfmat.bf16 q0, d0, d0[9]
				//CHECK-NEXT:^
				//CHECK-NEXT:error: invalid instruction
				//CHECK-NEXT:vfmab.bf16 d0, d0, d0
				//CHECK-NEXT:^
				//CHECK-NEXT:error: invalid instruction
				//CHECK-NEXT:vfmab.bf16 d0, d0, q0
				//CHECK-NEXT:^
				//CHECK-NEXT:error: invalid instruction
				//CHECK-NEXT:vfmab.bf16 d0, q0, d0
				//CHECK-NEXT:^
				//CHECK-NEXT:error: invalid instruction
				//CHECK-NEXT:vfmab.bf16 q0, d0, d0
				//CHECK-NEXT:^
				//CHECK-NEXT:error: invalid instruction, any one of the following would fix this:
				//CHECK-NEXT:vfmab.bf16 q0, q0, d0
				//CHECK-NEXT:^
				//CHECK-NEXT:note: too few operands for instruction
				//CHECK-NEXT:vfmab.bf16 q0, q0, d0
				//CHECK-NEXT: ^
				//CHECK-NEXT:note: operand must be a register in range [q0, q15]
				//CHECK-NEXT:vfmab.bf16 q0, q0, d0
				//CHECK-NEXT: ^
				//CHECK-NEXT:error: operand must be a register in range [q0, q15]
				//CHECK-NEXT:vfmab.bf16 q0, d0, q0
				//CHECK-NEXT: ^
				//CHECK-NEXT:error: operand must be a register in range [q0, q15]
				//CHECK-NEXT:vfmab.bf16 d0, q0, q0
				//CHECK-NEXT: ^
				//CHECK-NEXT:error: invalid instruction, any one of the following would fix this:
				//CHECK-NEXT:vfmab.bf16 q0, q0, q0[3]
				//CHECK-NEXT:^
				//CHECK-NEXT:note: operand must be a register in range [d0, d7]
				//CHECK-NEXT:vfmab.bf16 q0, q0, q0[3]
				//CHECK-NEXT: ^
				//CHECK-NEXT:note: too many operands for instruction
				//CHECK-NEXT:vfmab.bf16 q0, q0, q0[3]
				//CHECK-NEXT: ^
				//CHECK-NEXT:error: invalid instruction, any one of the following would fix this:
				//CHECK-NEXT:vfmab.bf16 q0, q0, q0[3]
				//CHECK-NEXT:^
				//CHECK-NEXT:note: operand must be a register in range [d0, d7]
				//CHECK-NEXT:vfmab.bf16 q0, q0, q0[3]
				//CHECK-NEXT: ^
				//CHECK-NEXT:note: too many operands for instruction
				//CHECK-NEXT:vfmab.bf16 q0, q0, q0[3]
				//CHECK-NEXT: ^
				//CHECK-NEXT:error: operand must be a register in range [q0, q15]
				//CHECK-NEXT:vfmab.bf16 q0, d0, d0[0]
				//CHECK-NEXT: ^
				//CHECK-NEXT:error: operand must be a register in range [q0, q15]
				//CHECK-NEXT:vfmab.bf16 d0, q0, d0[0]
				//CHECK-NEXT: ^
				//CHECK-NEXT:error: invalid instruction
				//CHECK-NEXT:vfmab.bf16 q0, d0, d0[9]

llvm/test/MC/ARM/bfloat16-a32.s

This file was added.

				// RUN: llvm-mc -triple arm -mattr=+bf16,+neon -show-encoding < %s \| FileCheck %s --check-prefix=CHECK
				// RUN: llvm-mc -triple arm -mattr=+v8.6a -show-encoding < %s \| FileCheck %s --check-prefix=CHECK

				vdot.bf16 d3, d4, d5
				// CHECK: vdot.bf16 d3, d4, d5 @ encoding: [0x05,0x3d,0x04,0xfc]
				vdot.bf16 q0, q1, q2
				// CHECK-NEXT: vdot.bf16 q0, q1, q2 @ encoding: [0x44,0x0d,0x02,0xfc]
				vdot.bf16 d3, d4, d5[1]
				// CHECK-NEXT: vdot.bf16 d3, d4, d5[1] @ encoding: [0x25,0x3d,0x04,0xfe]
				vdot.bf16 q0, q1, d5[1]
				// CHECK-NEXT: vdot.bf16 q0, q1, d5[1] @ encoding: [0x65,0x0d,0x02,0xfe]
				vmmla.bf16 q0, q1, q2
				// CHECK-NEXT: vmmla.bf16 q0, q1, q2 @ encoding: [0x44,0x0c,0x02,0xfc]
				vcvt.bf16.f32 d1, q3
				// CHECK-NEXT: vcvt.bf16.f32 d1, q3 @ encoding: [0x46,0x16,0xb6,0xf3]
				vcvtbeq.bf16.f32 s1, s3
				// CHECK-NEXT: vcvtbeq.bf16.f32 s1, s3 @ encoding: [0x61,0x09,0xf3,0x0e]
				vcvttne.bf16.f32 s1, s3
				// CHECK-NEXT: vcvttne.bf16.f32 s1, s3 @ encoding: [0xe1,0x09,0xf3,0x1e]
				vfmat.bf16 q0, q0, q0
				//CHECK-NEXT: vfmat.bf16 q0, q0, q0 @ encoding: [0x50,0x08,0x30,0xfc]
				vfmat.bf16 q0, q0, q15
				//CHECK-NEXT: vfmat.bf16 q0, q0, q15 @ encoding: [0x7e,0x08,0x30,0xfc]
				vfmat.bf16 q0, q15, q0
				//CHECK-NEXT: vfmat.bf16 q0, q15, q0 @ encoding: [0xd0,0x08,0x3e,0xfc]
				vfmat.bf16 q0, q15, q15
				//CHECK-NEXT: vfmat.bf16 q0, q15, q15 @ encoding: [0xfe,0x08,0x3e,0xfc]
				vfmat.bf16 q7, q0, q0
				//CHECK-NEXT: vfmat.bf16 q7, q0, q0 @ encoding: [0x50,0xe8,0x30,0xfc]
				vfmat.bf16 q8, q0, q0
				//CHECK-NEXT: vfmat.bf16 q8, q0, q0 @ encoding: [0x50,0x08,0x70,0xfc]
				vfmab.bf16 q0, q0, q0
				//CHECK-NEXT: vfmab.bf16 q0, q0, q0 @ encoding: [0x10,0x08,0x30,0xfc]
				vfmab.bf16 q0, q0, q15
				//CHECK-NEXT: vfmab.bf16 q0, q0, q15 @ encoding: [0x3e,0x08,0x30,0xfc]
				vfmab.bf16 q0, q15, q0
				//CHECK-NEXT: vfmab.bf16 q0, q15, q0 @ encoding: [0x90,0x08,0x3e,0xfc]
				vfmab.bf16 q0, q15, q15
				//CHECK-NEXT: vfmab.bf16 q0, q15, q15 @ encoding: [0xbe,0x08,0x3e,0xfc]
				vfmab.bf16 q7, q0, q0
				//CHECK-NEXT: vfmab.bf16 q7, q0, q0 @ encoding: [0x10,0xe8,0x30,0xfc]
				vfmab.bf16 q8, q0, q0
				//CHECK-NEXT: vfmab.bf16 q8, q0, q0 @ encoding: [0x10,0x08,0x70,0xfc]
				vfmat.bf16 q0, q0, d0[0]
				//CHECK-NEXT: vfmat.bf16 q0, q0, d0[0] @ encoding: [0x50,0x08,0x30,0xfe]
				vfmat.bf16 q0, q0, d0[3]
				//CHECK-NEXT: vfmat.bf16 q0, q0, d0[3] @ encoding: [0x78,0x08,0x30,0xfe]
				vfmat.bf16 q0, q0, d7[0]
				//CHECK-NEXT: vfmat.bf16 q0, q0, d7[0] @ encoding: [0x57,0x08,0x30,0xfe]
				vfmab.bf16 q0, q0, d0[0]
				//CHECK-NEXT: vfmab.bf16 q0, q0, d0[0] @ encoding: [0x10,0x08,0x30,0xfe]
				vfmab.bf16 q0, q0, d0[3]
				//CHECK-NEXT: vfmab.bf16 q0, q0, d0[3] @ encoding: [0x38,0x08,0x30,0xfe]
				vfmab.bf16 q0, q0, d7[0]
				//CHECK-NEXT: vfmab.bf16 q0, q0, d7[0] @ encoding: [0x17,0x08,0x30,0xfe]

llvm/test/MC/ARM/bfloat16-t32-errors.s

This file was added.

				// RUN: not llvm-mc -triple thumbv8 -mattr=-bf16 < %s 2>&1 \| FileCheck %s

				vdot.bf16 d3, d4, d5
				// CHECK: instruction requires: BFloat16 floating point extension
				// CHECK-NEXT: vdot.bf16 d3, d4, d5

				vdot.bf16 q0, q1, q2
				// CHECK: instruction requires: BFloat16 floating point extension
				// CHECK-NEXT: vdot.bf16 q0, q1, q2

				vdot.bf16 d3, d4, d5[1]
				// CHECK: instruction requires: BFloat16 floating point extension
				// CHECK-NEXT: vdot.bf16 d3, d4, d5[1]

				vdot.bf16 q0, q1, d5[1]
				// CHECK: instruction requires: BFloat16 floating point extension
				// CHECK-NEXT: vdot.bf16 q0, q1, d5[1]

				vmmla.bf16 q0, q1, q2
				// CHECK: instruction requires: BFloat16 floating point extension
				// CHECK-NEXT: vmmla.bf16 q0, q1, q2

				vcvt.bf16.f32 d1, q3
				// CHECK: instruction requires: BFloat16 floating point extension
				// CHECK-NEXT: vcvt.bf16.f32 d1, q3

				vcvtbeq.bf16.f32 s1, s3
				// CHECK: note: instruction requires: BFloat16 floating point extension
				// CHECK-NEXT: vcvtbeq.bf16.f32 s1, s3
				vcvttne.bf16.f32 s1, s3
				// CHECK: note: instruction requires: BFloat16 floating point extension
				// CHECK-NEXT: vcvttne.bf16.f32 s1, s3

llvm/test/MC/ARM/bfloat16-t32.s

This file was added.

				// RUN: llvm-mc -triple thumbv8 -mattr=+bf16,+neon -show-encoding < %s \| FileCheck %s --check-prefix=CHECK
				// RUN: llvm-mc -triple thumbv8 -mattr=+v8.6a -show-encoding < %s \| FileCheck %s --check-prefix=CHECK

				vcvt.bf16.f32 d1, q3
				// CHECK: vcvt.bf16.f32 d1, q3 @ encoding: [0xb6,0xff,0x46,0x16]

				it eq
				vcvtbeq.bf16.f32 s1, s3
				// CHECK: it eq @ encoding: [0x08,0xbf]
				// CHECK-NEXT: vcvtbeq.bf16.f32 s1, s3 @ encoding: [0xf3,0xee,0x61,0x09]

				it ne
				vcvttne.bf16.f32 s1, s3
				// CHECK: it ne @ encoding: [0x18,0xbf]
				// CHECK: vcvttne.bf16.f32 s1, s3 @ encoding: [0xf3,0xee,0xe1,0x09]

llvm/test/MC/Disassembler/AArch64/armv8.6a-bf16.txt

This file was added.

				# RUN: llvm-mc -triple=aarch64 -mattr=+bf16 -disassemble < %s \| FileCheck %s
				# RUN: llvm-mc -triple=aarch64 -mattr=+v8.6a -disassemble < %s \| FileCheck %s
				# RUN: not llvm-mc -triple=aarch64 -mattr=-bf16 -disassemble < %s 2>&1 \| FileCheck %s --check-prefix=NOBF16
				# RUN: not llvm-mc -triple=aarch64 -disassemble < %s 2>&1 \| FileCheck %s --check-prefix=NOBF16


				[0x62,0xfc,0x44,0x2e]
				[0x62,0xfc,0x44,0x6e]
				# CHECK: bfdot v2.2s, v3.4h, v4.4h
				# CHECK: bfdot v2.4s, v3.8h, v4.8h
				# NOBF16: warning: invalid instruction encoding
				# NOBF16-NEXT: [0x62,0xfc,0x44,0x2e]
				# NOBF16: warning: invalid instruction encoding
				# NOBF16-NEXT: [0x62,0xfc,0x44,0x6e]

				[0x62,0xf0,0x44,0x4f]
				[0x62,0xf0,0x64,0x4f]
				[0x62,0xf8,0x44,0x4f]
				[0x62,0xf8,0x64,0x4f]
				# CHECK: bfdot v2.4s, v3.8h, v4.2h[0]
				# CHECK: bfdot v2.4s, v3.8h, v4.2h[1]
				# CHECK: bfdot v2.4s, v3.8h, v4.2h[2]
				# CHECK: bfdot v2.4s, v3.8h, v4.2h[3]
				# NOBF16: warning: invalid instruction encoding
				# NOBF-NEXT: [0x62,0xf0,0x44,0x4f]
				# NOBF16: warning: invalid instruction encoding
				# NOBF6-NEXT: [0x62,0xf0,0x64,0x4f]
				# NOBF16: warning: invalid instruction encoding
				# NOBF6-NEXT: [0x62,0xf8,0x44,0x4f]
				# NOBF16: warning: invalid instruction encoding
				# NOBF6-NEXT: [0x62,0xf8,0x64,0x4f]


				[0x62,0xf0,0x44,0x0f]
				[0x62,0xf0,0x64,0x0f]
				[0x62,0xf8,0x44,0x0f]
				[0x62,0xf8,0x64,0x0f]
				# CHECK: bfdot v2.2s, v3.4h, v4.2h[0]
				# CHECK: bfdot v2.2s, v3.4h, v4.2h[1]
				# CHECK: bfdot v2.2s, v3.4h, v4.2h[2]
				# CHECK: bfdot v2.2s, v3.4h, v4.2h[3]
				# NOBF16: warning: invalid instruction encoding
				# NOBF-NEXT: [0x62,0xf0,0x44,0x0f]
				# NOBF16: warning: invalid instruction encoding
				# NOBF6-NEXT: [0x62,0xf0,0x64,0x0f]
				# NOBF16: warning: invalid instruction encoding
				# NOBF6-NEXT: [0x62,0xf8,0x44,0x0f]
				# NOBF16: warning: invalid instruction encoding
				# NOBF6-NEXT: [0x62,0xf8,0x64,0x0f]


				[0x62,0xec,0x44,0x6e]
				[0x83,0xec,0x45,0x6e]
				# CHECK: bfmmla v2.4s, v3.8h, v4.8h
				# CHECK: bfmmla v3.4s, v4.8h, v5.8h
				# NOBF16: warning: invalid instruction encoding
				NOBF16-NEXT: [0x62,0xec,0x44,0x6e]
				# NOBF16: warning: invalid instruction encoding
				# NOBF16-NEXT: [0x83,0xec,0x45,0x6e]


				[0xa5,0x68,0xa1,0x0e]
				[0xa5,0x68,0xa1,0x4e]
				# CHECK: bfcvtn v5.4h, v5.4s
				# CHECK: bfcvtn2 v5.8h, v5.4s
				# NOBF16: warning: invalid instruction encoding
				# NOBF16-NEXT: [0xa5,0x68,0xa1,0x0e]
				# NOBF16: warning: invalid instruction encoding
				# NOBF16-NEXT: [0xa5,0x68,0xa1,0x4e]

				[0x65, 0x40, 0x63, 0x1e]
				# CHECK: bfcvt h5, s3
				# NOBF16: warning: invalid instruction encoding
				# NOBF16-NEXT: [0x65, 0x40, 0x63, 0x1e]

llvm/test/MC/Disassembler/ARM/bfloat16-a32_1.txt

This file was added.

				# RUN: llvm-mc -triple arm-none-linux-gnu -mattr=+bf16,+neon --disassemble < %s \| FileCheck %s
				# RUN: llvm-mc -triple arm-none-linux-gnu -mattr=+v8.6a --disassemble < %s \| FileCheck %s
				# RUN: llvm-mc -triple arm-none-linux-gnu -mattr=-bf16 --disassemble < %s 2>&1 \| FileCheck %s --check-prefix=NOBF16
				# RUN: llvm-mc -triple arm-none-linux-gnu --disassemble < %s 2>&1 \| FileCheck %s --check-prefix=NOBF16
				#
				# Tests BFloat16 instruction decodings.
				# Without BFloat16 enabled, some of these get disassembled to coprocessor instructions.
				[0x25,0x3d,0x04,0xfe]
				# CHECK: vdot.bf16 d3, d4, d5[1]
				# NOBF16: cdp2 p13, #0, c3, c4, c5, #1
				#
				[0x65,0x0d,0x02,0xfe]
				# CHECK-NEXT: vdot.bf16 q0, q1, d5[1]
				# NOBF16-NEXT: cdp2 p13, #0, c0, c2, c5, #3
				#
				[0x61,0x09,0xf3,0x0e]
				# CHECK-NEXT: vcvtbeq.bf16.f32 s1, s3
				# NOBF16-NEXT: cdpeq p9, #15, c0, c3, c1, #3
				#
				[0xe1,0x09,0xf3,0x1e]
				# CHECK-NEXT: vcvttne.bf16.f32 s1, s3
				# NOBF16-NEXT: cdpne p9, #15, c0, c3, c1, #7
				#
				[0x50,0x08,0x30,0xfc]
				# CHECK-NEXT: vfmat.bf16 q0, q0, q0
				# NOBF16-NEXT: ldc2 p8, c0, [r0], #-320
				#
				[0x7e,0x08,0x30,0xfc]
				# CHECK-NEXT: vfmat.bf16 q0, q0, q15
				# NOBF16-NEXT: ldc2 p8, c0, [r0], #-504
				#
				[0xd0,0x08,0x3e,0xfc]
				# CHECK-NEXT: vfmat.bf16 q0, q15, q0
				# NOBF16-NEXT: ldc2 p8, c0, [lr], #-832
				#
				[0xfe,0x08,0x3e,0xfc]
				# CHECK-NEXT: vfmat.bf16 q0, q15, q15
				# NOBF16-NEXT: ldc2 p8, c0, [lr], #-1016
				#
				[0xd0,0x08,0x30,0xfc]
				# CHECK-NEXT: vfmat.bf16 q0, q8, q0
				# NOBF16-NEXT: ldc2 p8, c0, [r0], #-832
				#
				[0x50,0xe8,0x30,0xfc]
				# CHECK-NEXT: vfmat.bf16 q7, q0, q0
				# NOBF16-NEXT: ldc2 p8, c14, [r0], #-320
				#
				[0x50,0x08,0x70,0xfc]
				# CHECK-NEXT: vfmat.bf16 q8, q0, q0
				# NOBF16-NEXT: ldc2l p8, c0, [r0], #-320
				#
				[0x10,0x08,0x30,0xfc]
				# CHECK-NEXT: vfmab.bf16 q0, q0, q0
				# NOBF16-NEXT: ldc2 p8, c0, [r0], #-64
				#
				[0x3e,0x08,0x30,0xfc]
				# CHECK-NEXT: vfmab.bf16 q0, q0, q15
				# NOBF16-NEXT: ldc2 p8, c0, [r0], #-248
				#
				[0x90,0x08,0x3e,0xfc]
				# CHECK-NEXT: vfmab.bf16 q0, q15, q0
				# NOBF16-NEXT: ldc2 p8, c0, [lr], #-576
				#
				[0xbe,0x08,0x3e,0xfc]
				# CHECK-NEXT: vfmab.bf16 q0, q15, q15
				# NOBF16-NEXT: ldc2 p8, c0, [lr], #-760
				#
				[0x90,0x08,0x30,0xfc]
				# CHECK-NEXT: vfmab.bf16 q0, q8, q0
				# NOBF16-NEXT: ldc2 p8, c0, [r0], #-576
				#
				[0x10,0xe8,0x30,0xfc]
				# CHECK-NEXT: vfmab.bf16 q7, q0, q0
				# NOBF16-NEXT: ldc2 p8, c14, [r0], #-64
				#
				[0x10,0x08,0x70,0xfc]
				# CHECK-NEXT: vfmab.bf16 q8, q0, q0
				# NOBF16-NEXT: ldc2l p8, c0, [r0], #-64
				#
				[0x50,0x08,0x30,0xfe]
				# CHECK-NEXT: vfmat.bf16 q0, q0, d0[0]
				# NOBF16-NEXT: mrc2 p8, #1, r0, c0, c0, #2
				#
				[0x78,0x08,0x30,0xfe]
				# CHECK-NEXT: vfmat.bf16 q0, q0, d0[3]
				# NOBF16-NEXT: mrc2 p8, #1, r0, c0, c8, #3
				[0x57,0x08,0x30,0xfe]
				#
				# CHECK-NEXT: vfmat.bf16 q0, q0, d7[0]
				# NOBF16-NEXT: mrc2 p8, #1, r0, c0, c7, #2
				[0x10,0x08,0x30,0xfe]
				#
				# CHECK-NEXT: vfmab.bf16 q0, q0, d0[0]
				# NOBF16-NEXT: mrc2 p8, #1, r0, c0, c0, #0
				[0x38,0x08,0x30,0xfe]
				#
				# CHECK-NEXT: vfmab.bf16 q0, q0, d0[3]
				# NOBF16-NEXT: mrc2 p8, #1, r0, c0, c8, #1
				#
				[0x17,0x08,0x30,0xfe]
				# CHECK-NEXT: vfmab.bf16 q0, q0, d7[0]
				# NOBF16-NEXT: mrc2 p8, #1, r0, c0, c7, #0

llvm/test/MC/Disassembler/ARM/bfloat16-a32_2.txt

This file was added.

				# RUN: llvm-mc -triple arm-none-linux-gnu -mattr=+bf16,+neon --disassemble < %s \| FileCheck %s
				# RUN: llvm-mc -triple arm-none-linux-gnu -mattr=+v8.6a --disassemble < %s \| FileCheck %s
				# RUN: not llvm-mc -triple arm-none-linux-gnu -mattr=-bf16 --disassemble < %s 2>&1 \| FileCheck %s --check-prefix=CHECK-NOBF16
				# RUN: not llvm-mc -triple arm-none-linux-gnu --disassemble < %s 2>&1 \| FileCheck %s --check-prefix=CHECK-NOBF16

				[0x05,0x3d,0x04,0xfc]
				# CHECK: vdot.bf16 d3, d4, d5
				# CHECK-NOBF16: warning: invalid instruction encoding

				[0x44,0x0d,0x02,0xfc]
				# CHECK: vdot.bf16 q0, q1, q2
				# CHECK-NOBF16: warning: invalid instruction encoding

				[0x44,0x0c,0x02,0xfc]
				# CHECK: vmmla.bf16 q0, q1, q2
				# CHECK-NOBF16: warning: invalid instruction encoding

				[0x46,0x16,0xb6,0xf3]
				# CHECK: vcvt.bf16.f32 d1, q3
				# CHECK-ERROR: warning: invalid instruction encoding

llvm/test/MC/Disassembler/ARM/bfloat16-t32.txt

This file was added.

				# RUN: llvm-mc -triple thumbv8-none-linux-gnu -mattr=+bf16,+neon --disassemble < %s \| FileCheck %s
				# RUN: llvm-mc -triple thumbv8-none-linux-gnu -mattr=+v8.6a --disassemble < %s \| FileCheck %s

				[0x04,0xfc,0x05,0x3d]
				[0x02,0xfc,0x44,0x0d]
				# CHECK: vdot.bf16 d3, d4, d5
				# CHECK: vdot.bf16 q0, q1, q2

				[0x04,0xfe,0x25,0x3d]
				# CHECK: vdot.bf16 d3, d4, d5[1]

				[0x02,0xfe,0x65,0x0d]
				# CHECK: vdot.bf16 q0, q1, d5[1]

				[0x02,0xfc,0x44,0x0c]
				# CHECK: vmmla.bf16 q0, q1, q2

				[0xb6,0xff,0x46,0x16]
				# CHECK: vcvt.bf16.f32 d1, q3

				[0xf3,0xee,0x61,0x09]
				# CHECK: vcvtb.bf16.f32 s1, s3

				[0xf3,0xee,0xe1,0x09]
				# CHECK: vcvtt.bf16.f32 s1, s3

llvm/test/MC/Disassembler/ARM/bfloat16-t32_errors.txt

This file was added.

				# RUN: not llvm-mc -triple thumbv8-none-linux-gnu -mattr=-bf16 --disassemble < %s 2>&1 \| FileCheck %s
				# RUN: not llvm-mc -triple thumbv8-none-linux-gnu --disassemble < %s 2>&1 \| FileCheck %s

				[0x04,0xfc,0x05,0x3d]
				# CHECK: warning: invalid instruction encoding
				# CHECK-NEXT: [0x04,0xfc,0x05,0x3d]

				[0x02,0xfc,0x44,0x0d]
				# CHECK: warning: invalid instruction encoding
				# CHECK-NEXT: [0x02,0xfc,0x44,0x0d]


				[0x04,0xfe,0x25,0x3d]
				# CHECK: warning: invalid instruction encoding
				# CHECK-NEXT: [0x04,0xfe,0x25,0x3d]


				[0x02,0xfe,0x65,0x0d]
				# CHECK: warning: invalid instruction encoding
				# CHECK-NEXT: [0x02,0xfe,0x65,0x0d]


				[0x02,0xfc,0x44,0x0c]
				# CHECK: warning: invalid instruction encoding
				# CHECK-NEXT: [0x02,0xfc,0x44,0x0c]


				[0xb6,0xff,0x46,0x16]
				# CHECK: warning: invalid instruction encoding
				# CHECK-NEXT: [0xb6,0xff,0x46,0x16]


				[0xf3,0xee,0x61,0x09]
				# CHECK: warning: invalid instruction encoding
				# CHECK-NEXT: [0xf3,0xee,0x61,0x09]


				[0xf3,0xee,0xe1,0x09]
				# CHECK: warning: invalid instruction encoding
				# CHECK-NEXT: [0xf3,0xee,0xe1,0x09]

llvm/unittests/Support/TargetParserTest.cpp

Show All 20 Lines	const char *ARMArch[] = {
"armv5tej", "armv6", "armv6j", "armv6k", "armv6hl",		"armv5tej", "armv6", "armv6j", "armv6k", "armv6hl",
"armv6t2", "armv6kz", "armv6z", "armv6zk", "armv6-m",		"armv6t2", "armv6kz", "armv6z", "armv6zk", "armv6-m",
"armv6m", "armv6sm", "armv6s-m", "armv7-a", "armv7",		"armv6m", "armv6sm", "armv6s-m", "armv7-a", "armv7",
"armv7a", "armv7ve", "armv7hl", "armv7l", "armv7-r",		"armv7a", "armv7ve", "armv7hl", "armv7l", "armv7-r",
"armv7r", "armv7-m", "armv7m", "armv7k", "armv7s",		"armv7r", "armv7-m", "armv7m", "armv7k", "armv7s",
"armv7e-m", "armv7em", "armv8-a", "armv8", "armv8a",		"armv7e-m", "armv7em", "armv8-a", "armv8", "armv8a",
"armv8l", "armv8.1-a", "armv8.1a", "armv8.2-a", "armv8.2a",		"armv8l", "armv8.1-a", "armv8.1a", "armv8.2-a", "armv8.2a",
"armv8.3-a", "armv8.3a", "armv8.4-a", "armv8.4a", "armv8.5-a",		"armv8.3-a", "armv8.3a", "armv8.4-a", "armv8.4a", "armv8.5-a",
"armv8.5a", "armv8-r", "armv8r", "armv8-m.base", "armv8m.base",		"armv8.5a", "armv8.6-a", "armv8.6a", "armv8-r", "armv8r",
"armv8-m.main", "armv8m.main", "iwmmxt", "iwmmxt2", "xscale",		"armv8-m.base", "armv8m.base", "armv8-m.main", "armv8m.main", "iwmmxt",
"armv8.1-m.main",		"iwmmxt2", "xscale", "armv8.1-m.main",
};		};

bool testARMCPU(StringRef CPUName, StringRef ExpectedArch,		bool testARMCPU(StringRef CPUName, StringRef ExpectedArch,
StringRef ExpectedFPU, uint64_t ExpectedFlags,		StringRef ExpectedFPU, uint64_t ExpectedFlags,
StringRef CPUAttr) {		StringRef CPUAttr) {
ARM::ArchKind AK = ARM::parseCPUArch(CPUName);		ARM::ArchKind AK = ARM::parseCPUArch(CPUName);
bool pass = ARM::getArchName(AK).equals(ExpectedArch);		bool pass = ARM::getArchName(AK).equals(ExpectedArch);
unsigned FPUKind = ARM::getDefaultFPU(CPUName, AK);		unsigned FPUKind = ARM::getDefaultFPU(CPUName, AK);
▲ Show 20 Lines • Show All 366 Lines • ▼ Show 20 Lines	EXPECT_TRUE(
ARMBuildAttrs::CPUArch::v8_A));		ARMBuildAttrs::CPUArch::v8_A));
EXPECT_TRUE(		EXPECT_TRUE(
testARMArch("armv8.4-a", "generic", "v8.4a",		testARMArch("armv8.4-a", "generic", "v8.4a",
ARMBuildAttrs::CPUArch::v8_A));		ARMBuildAttrs::CPUArch::v8_A));
EXPECT_TRUE(		EXPECT_TRUE(
testARMArch("armv8.5-a", "generic", "v8.5a",		testARMArch("armv8.5-a", "generic", "v8.5a",
ARMBuildAttrs::CPUArch::v8_A));		ARMBuildAttrs::CPUArch::v8_A));
EXPECT_TRUE(		EXPECT_TRUE(
		testARMArch("armv8.6-a", "generic", "v8.6a",
		ARMBuildAttrs::CPUArch::v8_A));
		EXPECT_TRUE(
testARMArch("armv8-r", "cortex-r52", "v8r",		testARMArch("armv8-r", "cortex-r52", "v8r",
ARMBuildAttrs::CPUArch::v8_R));		ARMBuildAttrs::CPUArch::v8_R));
EXPECT_TRUE(		EXPECT_TRUE(
testARMArch("armv8-m.base", "generic", "v8m.base",		testARMArch("armv8-m.base", "generic", "v8m.base",
ARMBuildAttrs::CPUArch::v8_M_Base));		ARMBuildAttrs::CPUArch::v8_M_Base));
EXPECT_TRUE(		EXPECT_TRUE(
testARMArch("armv8-m.main", "generic", "v8m.main",		testARMArch("armv8-m.main", "generic", "v8m.main",
ARMBuildAttrs::CPUArch::v8_M_Main));		ARMBuildAttrs::CPUArch::v8_M_Main));
▲ Show 20 Lines • Show All 251 Lines • ▼ Show 20 Lines
TEST(TargetParserTest, ARMparseArchEndianAndISA) {		TEST(TargetParserTest, ARMparseArchEndianAndISA) {
const char *Arch[] = {		const char *Arch[] = {
"v2", "v2a", "v3", "v3m", "v4", "v4t", "v5", "v5t",		"v2", "v2a", "v3", "v3m", "v4", "v4t", "v5", "v5t",
"v5e", "v5te", "v5tej", "v6", "v6j", "v6k", "v6hl", "v6t2",		"v5e", "v5te", "v5tej", "v6", "v6j", "v6k", "v6hl", "v6t2",
"v6kz", "v6z", "v6zk", "v6-m", "v6m", "v6sm", "v6s-m", "v7-a",		"v6kz", "v6z", "v6zk", "v6-m", "v6m", "v6sm", "v6s-m", "v7-a",
"v7", "v7a", "v7ve", "v7hl", "v7l", "v7-r", "v7r", "v7-m",		"v7", "v7a", "v7ve", "v7hl", "v7l", "v7-r", "v7r", "v7-m",
"v7m", "v7k", "v7s", "v7e-m", "v7em", "v8-a", "v8", "v8a",		"v7m", "v7k", "v7s", "v7e-m", "v7em", "v8-a", "v8", "v8a",
"v8l", "v8.1-a", "v8.1a", "v8.2-a", "v8.2a", "v8.3-a", "v8.3a", "v8.4-a",		"v8l", "v8.1-a", "v8.1a", "v8.2-a", "v8.2a", "v8.3-a", "v8.3a", "v8.4-a",
"v8.4a", "v8.5-a","v8.5a", "v8-r", "v8m.base", "v8m.main", "v8.1m.main"		"v8.4a", "v8.5-a","v8.5a", "v8.6-a", "v8.6a", "v8-r", "v8m.base", "v8m.main", "v8.1m.main"
};		};

for (unsigned i = 0; i < array_lengthof(Arch); i++) {		for (unsigned i = 0; i < array_lengthof(Arch); i++) {
std::string arm_1 = "armeb" + (std::string)(Arch[i]);		std::string arm_1 = "armeb" + (std::string)(Arch[i]);
std::string arm_2 = "arm" + (std::string)(Arch[i]) + "eb";		std::string arm_2 = "arm" + (std::string)(Arch[i]) + "eb";
std::string arm_3 = "arm" + (std::string)(Arch[i]);		std::string arm_3 = "arm" + (std::string)(Arch[i]);
std::string thumb_1 = "thumbeb" + (std::string)(Arch[i]);		std::string thumb_1 = "thumbeb" + (std::string)(Arch[i]);
std::string thumb_2 = "thumb" + (std::string)(Arch[i]) + "eb";		std::string thumb_2 = "thumb" + (std::string)(Arch[i]) + "eb";
▲ Show 20 Lines • Show All 48 Lines • ▼ Show 20 Lines	for (unsigned i = 0; i < array_lengthof(ARMArch); i++) {
case ARM::ArchKind::ARMV7VE:		case ARM::ArchKind::ARMV7VE:
case ARM::ArchKind::ARMV7K:		case ARM::ArchKind::ARMV7K:
case ARM::ArchKind::ARMV8A:		case ARM::ArchKind::ARMV8A:
case ARM::ArchKind::ARMV8_1A:		case ARM::ArchKind::ARMV8_1A:
case ARM::ArchKind::ARMV8_2A:		case ARM::ArchKind::ARMV8_2A:
case ARM::ArchKind::ARMV8_3A:		case ARM::ArchKind::ARMV8_3A:
case ARM::ArchKind::ARMV8_4A:		case ARM::ArchKind::ARMV8_4A:
case ARM::ArchKind::ARMV8_5A:		case ARM::ArchKind::ARMV8_5A:
		case ARM::ArchKind::ARMV8_6A:
EXPECT_EQ(ARM::ProfileKind::A, ARM::parseArchProfile(ARMArch[i]));		EXPECT_EQ(ARM::ProfileKind::A, ARM::parseArchProfile(ARMArch[i]));
break;		break;
default:		default:
EXPECT_EQ(ARM::ProfileKind::INVALID, ARM::parseArchProfile(ARMArch[i]));		EXPECT_EQ(ARM::ProfileKind::INVALID, ARM::parseArchProfile(ARMArch[i]));
break;		break;
}		}
}		}
}		}
▲ Show 20 Lines • Show All 249 Lines • ▼ Show 20 Lines	TEST(TargetParserTest, testAArch64Arch) {
EXPECT_TRUE(testAArch64Arch("armv8.2-a", "generic", "v8.2a",		EXPECT_TRUE(testAArch64Arch("armv8.2-a", "generic", "v8.2a",
ARMBuildAttrs::CPUArch::v8_A));		ARMBuildAttrs::CPUArch::v8_A));
EXPECT_TRUE(testAArch64Arch("armv8.3-a", "generic", "v8.3a",		EXPECT_TRUE(testAArch64Arch("armv8.3-a", "generic", "v8.3a",
ARMBuildAttrs::CPUArch::v8_A));		ARMBuildAttrs::CPUArch::v8_A));
EXPECT_TRUE(testAArch64Arch("armv8.4-a", "generic", "v8.4a",		EXPECT_TRUE(testAArch64Arch("armv8.4-a", "generic", "v8.4a",
ARMBuildAttrs::CPUArch::v8_A));		ARMBuildAttrs::CPUArch::v8_A));
EXPECT_TRUE(testAArch64Arch("armv8.5-a", "generic", "v8.5a",		EXPECT_TRUE(testAArch64Arch("armv8.5-a", "generic", "v8.5a",
ARMBuildAttrs::CPUArch::v8_A));		ARMBuildAttrs::CPUArch::v8_A));
		EXPECT_TRUE(testAArch64Arch("armv8.6-a", "generic", "v8.6a",
		ARMBuildAttrs::CPUArch::v8_A));
}		}

bool testAArch64Extension(StringRef CPUName, AArch64::ArchKind AK,		bool testAArch64Extension(StringRef CPUName, AArch64::ArchKind AK,
StringRef ArchExt) {		StringRef ArchExt) {
return AArch64::getDefaultExtensions(CPUName, AK) &		return AArch64::getDefaultExtensions(CPUName, AK) &
AArch64::parseArchExt(ArchExt);		AArch64::parseArchExt(ArchExt);
}		}

▲ Show 20 Lines • Show All 219 Lines • Show Last 20 Lines

This is an archive of the discontinued LLVM Phabricator instance.

[PATCH] [ARM] ARMv8.6-a command-line + BFloat16 Asm SupportClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 252776

clang/lib/Basic/Targets/AArch64.h

clang/lib/Basic/Targets/AArch64.cpp

clang/lib/Basic/Targets/ARM.cpp

clang/test/Driver/aarch64-cpus.c

clang/test/Driver/arm-cortex-cpus.c

clang/test/Preprocessor/arm-target-features.c

llvm/include/llvm/ADT/Triple.h

llvm/include/llvm/Support/AArch64TargetParser.h

llvm/include/llvm/Support/AArch64TargetParser.def

llvm/include/llvm/Support/ARMTargetParser.h

llvm/include/llvm/Support/ARMTargetParser.def

llvm/lib/Support/AArch64TargetParser.cpp

llvm/lib/Support/ARMTargetParser.cpp

llvm/lib/Support/Triple.cpp

llvm/lib/Target/AArch64/AArch64.td

llvm/lib/Target/AArch64/AArch64InstrFormats.td

llvm/lib/Target/AArch64/AArch64InstrInfo.td

llvm/lib/Target/AArch64/AArch64SVEInstrInfo.td

llvm/lib/Target/AArch64/AArch64Subtarget.h

llvm/lib/Target/AArch64/AsmParser/AArch64AsmParser.cpp

llvm/lib/Target/AArch64/SVEInstrFormats.td

llvm/lib/Target/ARM/ARM.td

llvm/lib/Target/ARM/ARMInstrNEON.td

llvm/lib/Target/ARM/ARMInstrVFP.td

llvm/lib/Target/ARM/ARMPredicates.td

llvm/lib/Target/ARM/ARMSubtarget.h

llvm/lib/Target/ARM/AsmParser/ARMAsmParser.cpp

llvm/lib/Target/ARM/MCTargetDesc/ARMELFStreamer.cpp

llvm/test/MC/AArch64/SVE/bfcvt-diagnostics.s

llvm/test/MC/AArch64/SVE/bfcvt.s

llvm/test/MC/AArch64/SVE/bfcvtnt-diagnostics.s

llvm/test/MC/AArch64/SVE/bfcvtnt.s

llvm/test/MC/AArch64/SVE/bfdot-diagnostics.s

llvm/test/MC/AArch64/SVE/bfdot.s

llvm/test/MC/AArch64/SVE/bfmlal-diagnostics.s

llvm/test/MC/AArch64/SVE/bfmlal.s

llvm/test/MC/AArch64/SVE/bfmmla-diagnostics.s

llvm/test/MC/AArch64/SVE/bfmmla.s

llvm/test/MC/AArch64/armv8.6a-bf16.s

llvm/test/MC/ARM/bfloat16-a32-errors.s

llvm/test/MC/ARM/bfloat16-a32-errors2.s

llvm/test/MC/ARM/bfloat16-a32.s

llvm/test/MC/ARM/bfloat16-t32-errors.s

llvm/test/MC/ARM/bfloat16-t32.s

llvm/test/MC/Disassembler/AArch64/armv8.6a-bf16.txt

llvm/test/MC/Disassembler/ARM/bfloat16-a32_1.txt

llvm/test/MC/Disassembler/ARM/bfloat16-a32_2.txt

llvm/test/MC/Disassembler/ARM/bfloat16-t32.txt

llvm/test/MC/Disassembler/ARM/bfloat16-t32_errors.txt

llvm/unittests/Support/TargetParserTest.cpp

[PATCH] [ARM] ARMv8.6-a command-line + BFloat16 Asm Support
ClosedPublic