This is an archive of the discontinued LLVM Phabricator instance.

Paths

Table of Contentst

-
llvm/
-
docs/
6/6
AMDGPUUsage.rst
-
include/llvm/BinaryFormat/
-
llvm/
-
BinaryFormat/
5/5
ELF.h
-
lib/
-
ObjectYAML/
-
ELFYAML.cpp
-
Target/AMDGPU/
-
AMDGPU/
1
AMDGPUAsmPrinter.cpp
-
AMDGPUHSAMetadataStreamer.h
-
AMDGPUHSAMetadataStreamer.cpp
-
AMDGPUMachineModuleInfo.h
2/3
AMDGPUMachineModuleInfo.cpp
-
AsmParser/
1
AMDGPUAsmParser.cpp
-
MCTargetDesc/
-
AMDGPUAsmBackend.cpp
-
AMDGPUTargetStreamer.h
2/3
AMDGPUTargetStreamer.cpp
-
Utils/
-
AMDGPUBaseInfo.h
-
AMDGPUBaseInfo.cpp
-
test/
-
CodeGen/AMDGPU/
-
AMDGPU/
-
tid-incompatible-sti-1.ll
-
tid-incompatible-sti-2.ll
-
tid-none.ll
-
tid-xnack-default-sramecc-default.ll
-
tid-xnack-default-sramecc-off.ll
-
tid-xnack-default-sramecc-on.ll
-
tid-xnack-off-sramecc-default.ll
-
tid-xnack-off-sramecc-off.ll
-
tid-xnack-off-sramecc-on.ll
-
tid-xnack-on-sramecc-default.ll
-
tid-xnack-on-sramecc-off.ll
-
tid-xnack-on-sramecc-on.ll
-
MC/AMDGPU/
-
AMDGPU/
-
tid-incompatible-sti-1.s
-
tid-incompatible-sti-2.s
-
tid-none.s
-
tid-xnack-default-sramecc-default.s
-
tid-xnack-default-sramecc-off.s
-
tid-xnack-default-sramecc-on.s
-
tid-xnack-off-sramecc-default.s
-
tid-xnack-off-sramecc-off.s
-
tid-xnack-off-sramecc-on.s
-
tid-xnack-on-sramecc-default.s
-
tid-xnack-on-sramecc-off.s
-
tid-xnack-on-sramecc-on.s
-
tools/llvm-readobj/
-
llvm-readobj/
-
ELFDumper.cpp

Differential D81780

AMDGPU/AMDHSA: Implement new target ID support in AMDGPU backend
AbandonedPublic

Authored by kzhuravl on Jun 12 2020, 6:25 PM.

Download Raw Diff

Details

Reviewers

yaxunl
t-tye
scott.linder
jhenderson
kerbowa

Summary

Target ID format is a list of strings delimited by ':', e.g.
amdgcn-amd-amdhsa--gfx908:xnack+:sramecc-. The first string
is an id string which could be triple-cpu but may not be
necessarily so. The other strings are called feature string
which may or may not be target features. Except for the id
string, all feature strings end with '+' or '-'.

  - Add --amdgcn-new-target-id option that enables new
    target ID in the backend (off by default)
  - ELF Header changes
    - Per code object features are now recorded in e_flags
      - xnack, values: default, off, on
        - EF_AMDGPU_FEATURE_XNACK (mask)
        - EF_AMDGPU_FEATURE_XNACK_DEFAULT (1)
        - EF_AMDGPU_FEATURE_XNACK_OFF (2)
        - EF_AMDGPU_FEATURE_XNACK_ON (3)
      - sramecc, values: default, off, on
        - EF_AMDGPU_FEATURE_SRAMECC (mask)
        - EF_AMDGPU_FEATURE_SRAMECC_DEFAULT (1)
        - EF_AMDGPU_FEATURE_SRAMECC_OFF (2)
        - EF_AMDGPU_FEATURE_SRAMECC_ON (3)
    - e_ident[EI_ABIVERSION] is bumped up to 2
  - Metadata
    - Add root metadata with key "amdhsa.target" and value
      being new target id
  - Assembler
    - Parse and emit new target id
  - Tools
    - Relevant update to elf tools

Diff Detail

Event Timeline

kzhuravl created this revision.Jun 12 2020, 6:25 PM

Herald added a reviewer: jhenderson. · View Herald TranscriptJun 12 2020, 6:25 PM

Herald added a project: Restricted Project. · View Herald Transcript

Herald added subscribers: kerbowa, rupprecht, MaskRay and 7 others. · View Herald Transcript

Changes to AMDGPUUsage are WIP.

lib/ObjectYAML/ELFYAML.cpp and tools/llvm-readobj/ELFDumper.cpp changes can be made to a separate patch. They are not tightly coupled with the MC/CodeGen changes. A group of binary format focused people will be interested to review that part.

In D81780#2091280, @MaskRay wrote:

lib/ObjectYAML/ELFYAML.cpp and tools/llvm-readobj/ELFDumper.cpp changes can be made to a separate patch. They are not tightly coupled with the MC/CodeGen changes. A group of binary format focused people will be interested to review that part.

Sure, I will move that part to a different change.

In D81780#2091213, @kzhuravl wrote:

Changes to AMDGPUUsage are WIP.

Since Sam is updating the docs with the overall target id concept, I think these docs are sufficient for this review.

scott.linder added inline comments.Jun 22 2020, 11:42 AM

llvm/docs/AMDGPUUsage.rst
657	Why do we enumerate `ELFABIVERSION_` if they can have multiple actual values? It seems like the only other place we mention these is to say that they describe the version of their corresponding `ELFOSABI_`. Could we just replace those places with the literal values that are possible for each `ELFOSABI_*`?
726	Are these shared between all `ELFOSABI_*`? Other places seem to also mention the `EI_OSABI` field when specifying where these values are legal.
778	Nit: I would prefer the value in parenthesis be written in hex to be consistent with the `Value` column.
llvm/include/llvm/BinaryFormat/ELF.h
718	Can you update these comments to explicitly state they are applicable to EI_ABIVERSION<2 ?
726	Same question as above; are these really only under the specified `EI_OSABI` and if so can that be reflected in AMDGPUUsage?
729	Is there a reason for this to be non-zero? Maybe it would make sense to have four values: 0b00: Not an applicable feature for the given `MACH` 0b01: Default 0b10: Off 0b11: On But from my original reading of the proposal my understanding was we would instead use: 0b00: If applicable, Default. Otherwise, the only legal value for a non-applicable target feature. 0b01: Off 0b10: On In effect the context of the `ARCH` tells you if you even need to consider the feature bits for a given feature, so differentiating the case isn't useful. I guess we don't save any bits this way though? The original proposal also mentions "makes using a mask to check for a match easier as value & test will be 0 if exact match or matching against default", although I'm not actually clear what it means to say.
llvm/lib/Target/AMDGPU/AMDGPUAsmPrinter.cpp
136	I think I need some help to understand what case this intends to diagnose. Is the GlobalSTI a property of the module? Where is it derived from if the subtarget is a per-function concept?
llvm/lib/Target/AMDGPU/AMDGPUMachineModuleInfo.cpp
46	It seems like the condition/assertion here should be flipped. We should identify the metadata by the key, then assert it has the required merge behavior. Is it just inverted to avoid repeated string comparisons, and because we can be certain there won't be other uses of the merge behavior for AMDGPU IR?
53	Do we really want to have this "fallback"? It seems like we should just define the "target-id" metadata entry as required, and fail here instead. I can't remember exactly, but my understanding is that the Target you get from MMI is essentially incorrect, and is only there for legacy purposes. We have had bugs in the past, some of which led us to the whole TargetID proposal in the first place, when we used the MMI instead of per-function Subtargets. Not AMDGPU, but see http://lists.llvm.org/pipermail/llvm-commits/Week-of-Mon-20150316/266041.html for an example. I am worried that this behavior will just lead to more bugs. Is it here to avoid updating tests or something similar?
llvm/lib/Target/AMDGPU/AsmParser/AMDGPUAsmParser.cpp
3764	Nit: Can this condition be inverted, i.e. the new case first.
llvm/lib/Target/AMDGPU/MCTargetDesc/AMDGPUTargetStreamer.cpp
181	Why is `TargetID` ignored, but passed in by `AMDGPUAsmParser::ParseDirectiveAMDGCNTarget` for this case, and constructed in the same way?
432	Same question as above about the bit-pattern for the Default case; is there a need to differentiate the non-supported-feature case from the supported-and-Default case? If not, can we just change the bitpatterns of the three values and delete these bitwise-ORs?

kzhuravl marked 8 inline comments as done.Aug 11 2020, 8:11 AM

kzhuravl added inline comments.

llvm/docs/AMDGPUUsage.rst
657	doc update in separate review.
726	doc update in separate review.
778	doc update in separate review.
llvm/include/llvm/BinaryFormat/ELF.h
726	yes.
729	discussed offline. docs have been updated to match this implementation.
llvm/lib/Target/AMDGPU/AMDGPUMachineModuleInfo.cpp
46	yes, avoiding string comparisons. also implementation of MergeTargetID implies there won't be other uses of the merge behavior.
llvm/lib/Target/AMDGPU/MCTargetDesc/AMDGPUTargetStreamer.cpp
432	no, according to latest docs.

kzhuravl edited parent revisions, added: D85882: [AMDGPU] Update subtarget features for new target ID support; removed: D80750: llvm-link: Add module flag behavior MergeTargetID.Dec 15 2020, 7:49 AM

kzhuravl abandoned this revision.May 5 2023, 12:30 PM

kzhuravl marked 7 inline comments as done.

Herald added a project: Restricted Project. · View Herald TranscriptMay 5 2023, 12:30 PM

Herald added subscribers: kosarev, foad. · View Herald Transcript

Revision Contents

Path

Size

llvm/

docs/

AMDGPUUsage.rst

43 lines

include/

llvm/

BinaryFormat/

ELF.h

20 lines

lib/

ObjectYAML/

ELFYAML.cpp

19 lines

Target/

AMDGPU/

AMDGPUAsmPrinter.cpp

16 lines

AMDGPUHSAMetadataStreamer.h

8 lines

AMDGPUHSAMetadataStreamer.cpp

11 lines

AMDGPUMachineModuleInfo.h

11 lines

AMDGPUMachineModuleInfo.cpp

35 lines

AsmParser/

AMDGPUAsmParser.cpp

24 lines

MCTargetDesc/

AMDGPUAsmBackend.cpp

8 lines

AMDGPUTargetStreamer.h

11 lines

AMDGPUTargetStreamer.cpp

76 lines

Utils/

AMDGPUBaseInfo.h

17 lines

AMDGPUBaseInfo.cpp

73 lines

test/

CodeGen/

AMDGPU/

tid-incompatible-sti-1.ll

11 lines

tid-incompatible-sti-2.ll

11 lines

tid-none.ll

15 lines

tid-xnack-default-sramecc-default.ll

18 lines

tid-xnack-default-sramecc-off.ll

18 lines

tid-xnack-default-sramecc-on.ll

18 lines

tid-xnack-off-sramecc-default.ll

18 lines

tid-xnack-off-sramecc-off.ll

18 lines

tid-xnack-off-sramecc-on.ll

18 lines

tid-xnack-on-sramecc-default.ll

18 lines

tid-xnack-on-sramecc-off.ll

18 lines

tid-xnack-on-sramecc-on.ll

18 lines

MC/

AMDGPU/

tid-incompatible-sti-1.s

6 lines

tid-incompatible-sti-2.s

6 lines

tid-none.s

11 lines

tid-xnack-default-sramecc-default.s

12 lines

tid-xnack-default-sramecc-off.s

12 lines

tid-xnack-default-sramecc-on.s

12 lines

tid-xnack-off-sramecc-default.s

12 lines

tid-xnack-off-sramecc-off.s

12 lines

tid-xnack-off-sramecc-on.s

12 lines

tid-xnack-on-sramecc-default.s

12 lines

tid-xnack-on-sramecc-off.s

12 lines

tid-xnack-on-sramecc-on.s

12 lines

tools/

llvm-readobj/

ELFDumper.cpp

64 lines

Diff 270557

llvm/docs/AMDGPUUsage.rst

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 631 Lines • ▼ Show 20 Lines	``e_ident[EI_OSABI]`` - ``ELFOSABI_NONE``
- ``ELFOSABI_AMDGPU_MESA3D``		- ``ELFOSABI_AMDGPU_MESA3D``
``e_ident[EI_ABIVERSION]`` - ``ELFABIVERSION_AMDGPU_HSA``		``e_ident[EI_ABIVERSION]`` - ``ELFABIVERSION_AMDGPU_HSA``
- ``ELFABIVERSION_AMDGPU_PAL``		- ``ELFABIVERSION_AMDGPU_PAL``
- ``ELFABIVERSION_AMDGPU_MESA3D``		- ``ELFABIVERSION_AMDGPU_MESA3D``
``e_type`` - ``ET_REL``		``e_type`` - ``ET_REL``
- ``ET_DYN``		- ``ET_DYN``
``e_machine`` ``EM_AMDGPU``		``e_machine`` ``EM_AMDGPU``
``e_entry`` 0		``e_entry`` 0
``e_flags`` See :ref:`amdgpu-elf-header-e_flags-table`		``e_flags`` See :ref:`amdgpu-elf-header-e_flags-table-01`
		and :ref:`amdgpu-elf-header-e_flags-table-2`
========================== ===============================		========================== ===============================

..		..

.. table:: AMDGPU ELF Header Enumeration Values		.. table:: AMDGPU ELF Header Enumeration Values
:name: amdgpu-elf-header-enumeration-values-table		:name: amdgpu-elf-header-enumeration-values-table

=============================== =====		=============================== ======
Name Value		Name Value
=============================== =====		=============================== ======
``EM_AMDGPU`` 224		``EM_AMDGPU`` 224
``ELFOSABI_NONE`` 0		``ELFOSABI_NONE`` 0
``ELFOSABI_AMDGPU_HSA`` 64		``ELFOSABI_AMDGPU_HSA`` 64
``ELFOSABI_AMDGPU_PAL`` 65		``ELFOSABI_AMDGPU_PAL`` 65
``ELFOSABI_AMDGPU_MESA3D`` 66		``ELFOSABI_AMDGPU_MESA3D`` 66
``ELFABIVERSION_AMDGPU_HSA`` 1		``ELFABIVERSION_AMDGPU_HSA`` 1 or 2
		scott.linderUnsubmitted Done Reply Inline Actions Why do we enumerate `ELFABIVERSION_` if they can have multiple actual values? It seems like the only other place we mention these is to say that they describe the version of their corresponding `ELFOSABI_`. Could we just replace those places with the literal values that are possible for each `ELFOSABI_`? scott.linder:* Why do we enumerate `ELFABIVERSION_*` if they can have multiple actual values? It seems like…
		kzhuravlAuthorUnsubmitted Done Reply Inline Actions doc update in separate review. kzhuravl: doc update in separate review.
``ELFABIVERSION_AMDGPU_PAL`` 0		``ELFABIVERSION_AMDGPU_PAL`` 0
``ELFABIVERSION_AMDGPU_MESA3D`` 0		``ELFABIVERSION_AMDGPU_MESA3D`` 0
=============================== =====		=============================== ======

``e_ident[EI_CLASS]``		``e_ident[EI_CLASS]``
The ELF class is:		The ELF class is:

* ``ELFCLASS32`` for ``r600`` architecture.		* ``ELFCLASS32`` for ``r600`` architecture.

* ``ELFCLASS64`` for ``amdgcn`` architecture which only supports 64-bit		* ``ELFCLASS64`` for ``amdgcn`` architecture which only supports 64-bit
process address space applications.		process address space applications.
Show All 39 Lines	``e_type``

The AMD HSA runtime loader requires a ``ET_DYN`` code object.		The AMD HSA runtime loader requires a ``ET_DYN`` code object.

``e_machine``		``e_machine``
The value ``EM_AMDGPU`` is used for the machine for all processors supported		The value ``EM_AMDGPU`` is used for the machine for all processors supported
by the ``r600`` and ``amdgcn`` architectures (see		by the ``r600`` and ``amdgcn`` architectures (see
:ref:`amdgpu-processor-table`). The specific processor is specified in the		:ref:`amdgpu-processor-table`). The specific processor is specified in the
``EF_AMDGPU_MACH`` bit field of the ``e_flags`` (see		``EF_AMDGPU_MACH`` bit field of the ``e_flags`` (see
:ref:`amdgpu-elf-header-e_flags-table`).		:ref:`amdgpu-elf-header-e_flags-table-01` and
		:ref:`amdgpu-elf-header-e_flags-table-2`).

``e_entry``		``e_entry``
The entry point is 0 as the entry points for individual kernels must be		The entry point is 0 as the entry points for individual kernels must be
selected in order to invoke them through AQL packets.		selected in order to invoke them through AQL packets.

``e_flags``		``e_flags``
The AMDGPU backend uses the following ELF header flags:		The AMDGPU backend uses the following ELF header flags:

.. table:: AMDGPU ELF Header ``e_flags``		.. table:: AMDGPU ELF Header ``e_flags`` (``EI_ABIVERSION=0`` and ``EI_ABIVERSION=1``)
		scott.linderUnsubmitted Done Reply Inline Actions Are these shared between all `ELFOSABI_`? Other places seem to also mention the `EI_OSABI` field when specifying where these values are legal. scott.linder:* Are these shared between all `ELFOSABI_*`? Other places seem to also mention the `EI_OSABI`…
		kzhuravlAuthorUnsubmitted Done Reply Inline Actions doc update in separate review. kzhuravl: doc update in separate review.
:name: amdgpu-elf-header-e_flags-table		:name: amdgpu-elf-header-e_flags-table-01

================================= ========== =============================		================================= ========== =============================
Name Value Description		Name Value Description
================================= ========== =============================		================================= ========== =============================
AMDGPU Processor Flag See :ref:`amdgpu-processor-table`.		AMDGPU Processor Flag See :ref:`amdgpu-processor-table`.
-------------------------------------------- -----------------------------		-------------------------------------------- -----------------------------
``EF_AMDGPU_MACH`` 0x000000ff AMDGPU processor selection		``EF_AMDGPU_MACH`` 0x000000ff AMDGPU processor selection
mask for		mask for
Show All 19 Lines	``EF_AMDGPU_SRAM_ECC`` 0x00000200 Indicates if the ``sram-ecc``
does not support the		does not support the
``sram-ecc`` target		``sram-ecc`` target
feature then must		feature then must
be 0.		be 0.
See		See
:ref:`amdgpu-target-features`.		:ref:`amdgpu-target-features`.
================================= ========== =============================		================================= ========== =============================

		.. table:: AMDGPU ELF Header ``e_flags`` (``EI_ABIVERSION=2``)
		:name: amdgpu-elf-header-e_flags-table-2

		================================= ========== ==========================================
		Name Value Description
		================================= ========== ==========================================
		AMDGPU Processor Flag See :ref:`amdgpu-processor-table`.
		-------------------------------------------- ------------------------------------------
		``EF_AMDGPU_MACH`` 0x000000ff AMDGPU processor selection
		mask for
		``EF_AMDGPU_MACH_xxx`` values
		defined in
		:ref:`amdgpu-ef-amdgpu-mach-table`.
		``EF_AMDGPU_FEATURE_XNACK`` 0x00000300 XNACK selection mask for
		representing 3 values:
		``EF_AMDGPU_FEATURE_XNACK_DEFAULT`` (1),
		scott.linderUnsubmitted Done Reply Inline Actions Nit: I would prefer the value in parenthesis be written in hex to be consistent with the `Value` column. scott.linder: Nit: I would prefer the value in parenthesis be written in hex to be consistent with the…
		kzhuravlAuthorUnsubmitted Done Reply Inline Actions doc update in separate review. kzhuravl: doc update in separate review.
		``EF_AMDGPU_FEATURE_XNACK_OFF`` (2),
		``EF_AMDGPU_FEATURE_XNACK_ON`` (3).
		``EF_AMDGPU_FEATURE_SRAMECC`` 0x00000c00 SRAMECC selection mask for
		representing 3 values:
		``EF_AMDGPU_FEATURE_SRAMECC_DEFAULT`` (1),
		``EF_AMDGPU_FEATURE_SRAMECC_OFF`` (2),
		``EF_AMDGPU_FEATURE_SRAMECC_ON`` (3).
		================================= ========== ==========================================

.. table:: AMDGPU ``EF_AMDGPU_MACH`` Values		.. table:: AMDGPU ``EF_AMDGPU_MACH`` Values
:name: amdgpu-ef-amdgpu-mach-table		:name: amdgpu-ef-amdgpu-mach-table

================================= ========== =============================		================================= ========== =============================
Name Value Description (see		Name Value Description (see
:ref:`amdgpu-processor-table`)		:ref:`amdgpu-processor-table`)
================================= ========== =============================		================================= ========== =============================
``EF_AMDGPU_MACH_NONE`` 0x000 not specified		``EF_AMDGPU_MACH_NONE`` 0x000 not specified
▲ Show 20 Lines • Show All 7,064 Lines • Show Last 20 Lines

llvm/include/llvm/BinaryFormat/ELF.h

Show First 20 Lines • Show All 709 Lines • ▼ Show 20 Lines	enum : unsigned {
// Reserved for AMDGCN-based processors.		// Reserved for AMDGCN-based processors.
EF_AMDGPU_MACH_AMDGCN_RESERVED0 = 0x027,		EF_AMDGPU_MACH_AMDGCN_RESERVED0 = 0x027,
EF_AMDGPU_MACH_AMDGCN_RESERVED1 = 0x032,		EF_AMDGPU_MACH_AMDGCN_RESERVED1 = 0x032,

// First/last AMDGCN-based processors.		// First/last AMDGCN-based processors.
EF_AMDGPU_MACH_AMDGCN_FIRST = EF_AMDGPU_MACH_AMDGCN_GFX600,		EF_AMDGPU_MACH_AMDGCN_FIRST = EF_AMDGPU_MACH_AMDGCN_GFX600,
EF_AMDGPU_MACH_AMDGCN_LAST = EF_AMDGPU_MACH_AMDGCN_GFX1012,		EF_AMDGPU_MACH_AMDGCN_LAST = EF_AMDGPU_MACH_AMDGCN_GFX1012,

// Indicates if the "xnack" target feature is enabled for all code contained		// Indicates if the "xnack" target feature is enabled for all code contained
		scott.linderUnsubmitted Done Reply Inline Actions Can you update these comments to explicitly state they are applicable to EI_ABIVERSION<2 ? scott.linder: Can you update these comments to explicitly state they are applicable to EI_ABIVERSION<2 ?
// in the object.		// in the object.
EF_AMDGPU_XNACK = 0x100,		EF_AMDGPU_XNACK = 0x100,
// Indicates if the "sram-ecc" target feature is enabled for all code		// Indicates if the "sram-ecc" target feature is enabled for all code
// contained in the object.		// contained in the object.
EF_AMDGPU_SRAM_ECC = 0x200,		EF_AMDGPU_SRAM_ECC = 0x200,

		// XNACK selection mask for EF_AMDGPU_FEATURE_XNACK_* values. Applicable
		// to EI_OSABI=ELFOSABI_AMDGPU_HSA and EI_ABIVERSION=2.
		scott.linderUnsubmitted Done Reply Inline Actions Same question as above; are these really only under the specified `EI_OSABI` and if so can that be reflected in AMDGPUUsage? scott.linder: Same question as above; are these really only under the specified `EI_OSABI` and if so can that…
		kzhuravlAuthorUnsubmitted Done Reply Inline Actions yes. kzhuravl: yes.
		EF_AMDGPU_FEATURE_XNACK = 0x300,
		// XNACK is any/default.
		EF_AMDGPU_FEATURE_XNACK_DEFAULT=0x100,
		scott.linderUnsubmitted Done Reply Inline Actions Is there a reason for this to be non-zero? Maybe it would make sense to have four values: 0b00: Not an applicable feature for the given `MACH` 0b01: Default 0b10: Off 0b11: On But from my original reading of the proposal my understanding was we would instead use: 0b00: If applicable, Default. Otherwise, the only legal value for a non-applicable target feature. 0b01: Off 0b10: On In effect the context of the `ARCH` tells you if you even need to consider the feature bits for a given feature, so differentiating the case isn't useful. I guess we don't save any bits this way though? The original proposal also mentions "makes using a mask to check for a match easier as value & test will be 0 if exact match or matching against default", although I'm not actually clear what it means to say. scott.linder: Is there a reason for this to be non-zero? Maybe it would make sense to have four values: *…
		kzhuravlAuthorUnsubmitted Done Reply Inline Actions discussed offline. docs have been updated to match this implementation. kzhuravl: discussed offline. docs have been updated to match this implementation.
		// XNACK is off.
		EF_AMDGPU_FEATURE_XNACK_OFF=0x200,
		// XNACK is on.
		EF_AMDGPU_FEATURE_XNACK_ON=0x300,

		// SRAMECC selection mask for EF_AMDGPU_FEATURE_SRAMECC_* values. Applicable
		// to EI_OSABI=ELFOSABI_AMDGPU_HSA and EI_ABIVERSION=2.
		EF_AMDGPU_FEATURE_SRAMECC = 0xc00,
		// SRAMECC is any/default.
		EF_AMDGPU_FEATURE_SRAMECC_DEFAULT = 0x400,
		// SRAMECC is off.
		EF_AMDGPU_FEATURE_SRAMECC_OFF = 0x800,
		// SRAMECC is on.
		EF_AMDGPU_FEATURE_SRAMECC_ON = 0xc00,
};		};

// ELF Relocation types for AMDGPU		// ELF Relocation types for AMDGPU
enum {		enum {
#include "ELFRelocs/AMDGPU.def"		#include "ELFRelocs/AMDGPU.def"
};		};

// ELF Relocation types for BPF		// ELF Relocation types for BPF
▲ Show 20 Lines • Show All 850 Lines • Show Last 20 Lines

llvm/lib/ObjectYAML/ELFYAML.cpp

Show First 20 Lines • Show All 423 Lines • ▼ Show 20 Lines	case ELF::EM_AMDGPU:
BCaseMask(EF_AMDGPU_MACH_AMDGCN_GFX902, EF_AMDGPU_MACH);		BCaseMask(EF_AMDGPU_MACH_AMDGCN_GFX902, EF_AMDGPU_MACH);
BCaseMask(EF_AMDGPU_MACH_AMDGCN_GFX904, EF_AMDGPU_MACH);		BCaseMask(EF_AMDGPU_MACH_AMDGCN_GFX904, EF_AMDGPU_MACH);
BCaseMask(EF_AMDGPU_MACH_AMDGCN_GFX906, EF_AMDGPU_MACH);		BCaseMask(EF_AMDGPU_MACH_AMDGCN_GFX906, EF_AMDGPU_MACH);
BCaseMask(EF_AMDGPU_MACH_AMDGCN_GFX908, EF_AMDGPU_MACH);		BCaseMask(EF_AMDGPU_MACH_AMDGCN_GFX908, EF_AMDGPU_MACH);
BCaseMask(EF_AMDGPU_MACH_AMDGCN_GFX909, EF_AMDGPU_MACH);		BCaseMask(EF_AMDGPU_MACH_AMDGCN_GFX909, EF_AMDGPU_MACH);
BCaseMask(EF_AMDGPU_MACH_AMDGCN_GFX1010, EF_AMDGPU_MACH);		BCaseMask(EF_AMDGPU_MACH_AMDGCN_GFX1010, EF_AMDGPU_MACH);
BCaseMask(EF_AMDGPU_MACH_AMDGCN_GFX1011, EF_AMDGPU_MACH);		BCaseMask(EF_AMDGPU_MACH_AMDGCN_GFX1011, EF_AMDGPU_MACH);
BCaseMask(EF_AMDGPU_MACH_AMDGCN_GFX1012, EF_AMDGPU_MACH);		BCaseMask(EF_AMDGPU_MACH_AMDGCN_GFX1012, EF_AMDGPU_MACH);
		switch (Object->Header.ABIVersion) {
		case 0:
		case 1:
BCase(EF_AMDGPU_XNACK);		BCase(EF_AMDGPU_XNACK);
BCase(EF_AMDGPU_SRAM_ECC);		BCase(EF_AMDGPU_SRAM_ECC);
break;		break;
		case 2:
		BCaseMask(EF_AMDGPU_FEATURE_XNACK_DEFAULT, EF_AMDGPU_FEATURE_XNACK);
		BCaseMask(EF_AMDGPU_FEATURE_XNACK_OFF, EF_AMDGPU_FEATURE_XNACK);
		BCaseMask(EF_AMDGPU_FEATURE_XNACK_ON, EF_AMDGPU_FEATURE_XNACK);
		BCaseMask(EF_AMDGPU_FEATURE_SRAMECC_DEFAULT, EF_AMDGPU_FEATURE_SRAMECC);
		BCaseMask(EF_AMDGPU_FEATURE_SRAMECC_OFF, EF_AMDGPU_FEATURE_SRAMECC);
		BCaseMask(EF_AMDGPU_FEATURE_SRAMECC_ON, EF_AMDGPU_FEATURE_SRAMECC);
		break;
		default:
		llvm_unreachable("Unsupported ABI Version");
		}
		break;
case ELF::EM_X86_64:		case ELF::EM_X86_64:
break;		break;
default:		default:
llvm_unreachable("Unsupported architecture");		llvm_unreachable("Unsupported architecture");
}		}
#undef BCase		#undef BCase
#undef BCaseMask		#undef BCaseMask
}		}
▲ Show 20 Lines • Show All 1,245 Lines • Show Last 20 Lines

llvm/lib/Target/AMDGPU/AMDGPUAsmPrinter.cpp

	Show All 11 Lines
	/// code. When passed an MCAsmStreamer it prints assembly and when passed			/// code. When passed an MCAsmStreamer it prints assembly and when passed
	/// an MCObjectStreamer it outputs binary code.			/// an MCObjectStreamer it outputs binary code.
	//			//
	//===----------------------------------------------------------------------===//			//===----------------------------------------------------------------------===//
	//			//

	#include "AMDGPUAsmPrinter.h"			#include "AMDGPUAsmPrinter.h"
	#include "AMDGPU.h"			#include "AMDGPU.h"
				#include "AMDGPUMachineModuleInfo.h"
	#include "AMDGPUSubtarget.h"			#include "AMDGPUSubtarget.h"
	#include "AMDGPUTargetMachine.h"			#include "AMDGPUTargetMachine.h"
	#include "MCTargetDesc/AMDGPUInstPrinter.h"			#include "MCTargetDesc/AMDGPUInstPrinter.h"
	#include "MCTargetDesc/AMDGPUMCTargetDesc.h"			#include "MCTargetDesc/AMDGPUMCTargetDesc.h"
	#include "MCTargetDesc/AMDGPUTargetStreamer.h"			#include "MCTargetDesc/AMDGPUTargetStreamer.h"
	#include "R600AsmPrinter.h"			#include "R600AsmPrinter.h"
	#include "R600Defines.h"			#include "R600Defines.h"
	#include "R600MachineFunctionInfo.h"			#include "R600MachineFunctionInfo.h"
	▲ Show 20 Lines • Show All 96 Lines • ▼ Show 20 Lines

	AMDGPUTargetStreamer* AMDGPUAsmPrinter::getTargetStreamer() const {			AMDGPUTargetStreamer* AMDGPUAsmPrinter::getTargetStreamer() const {
	if (!OutStreamer)			if (!OutStreamer)
	return nullptr;			return nullptr;
	return static_cast<AMDGPUTargetStreamer*>(OutStreamer->getTargetStreamer());			return static_cast<AMDGPUTargetStreamer*>(OutStreamer->getTargetStreamer());
	}			}

	void AMDGPUAsmPrinter::emitStartOfAsmFile(Module &M) {			void AMDGPUAsmPrinter::emitStartOfAsmFile(Module &M) {
	if (IsaInfo::hasCodeObjectV3(getGlobalSTI())) {			StringRef TargetID =
	std::string ExpectedTarget;			MMI->getObjFileInfo<AMDGPUMachineModuleInfo>().getTargetID();
	raw_string_ostream ExpectedTargetOS(ExpectedTarget);			if (enableNewTargetID()) {
	IsaInfo::streamIsaVersion(getGlobalSTI(), ExpectedTargetOS);			if (!isSubtargetInfoEquivalentToTargetID(getGlobalSTI(), TargetID)) {
				scott.linderUnsubmitted Not Done Reply Inline Actions I think I need some help to understand what case this intends to diagnose. Is the GlobalSTI a property of the module? Where is it derived from if the subtarget is a per-function concept? scott.linder: I think I need some help to understand what case this intends to diagnose. Is the GlobalSTI a…
				report_fatal_error("Subtarget info does not match TargetID");
	getTargetStreamer()->EmitDirectiveAMDGCNTarget(ExpectedTarget);			}
	}			}
				getTargetStreamer()->EmitDirectiveAMDGCNTarget(*getGlobalSTI(), TargetID);

	if (TM.getTargetTriple().getOS() != Triple::AMDHSA &&			if (TM.getTargetTriple().getOS() != Triple::AMDHSA &&
	TM.getTargetTriple().getOS() != Triple::AMDPAL)			TM.getTargetTriple().getOS() != Triple::AMDPAL)
	return;			return;

	if (TM.getTargetTriple().getOS() == Triple::AMDHSA)			if (TM.getTargetTriple().getOS() == Triple::AMDHSA)
	HSAMetadataStream->begin(M);			HSAMetadataStream->begin(M, TargetID);

	if (TM.getTargetTriple().getOS() == Triple::AMDPAL)			if (TM.getTargetTriple().getOS() == Triple::AMDPAL)
	getTargetStreamer()->getPALMetadata()->readFromIR(M);			getTargetStreamer()->getPALMetadata()->readFromIR(M);

	if (IsaInfo::hasCodeObjectV3(getGlobalSTI()))			if (IsaInfo::hasCodeObjectV3(getGlobalSTI()))
	return;			return;

	// HSA emits NT_AMDGPU_HSA_CODE_OBJECT_VERSION for code objects v2.			// HSA emits NT_AMDGPU_HSA_CODE_OBJECT_VERSION for code objects v2.
	▲ Show 20 Lines • Show All 1,226 Lines • Show Last 20 Lines

llvm/lib/Target/AMDGPU/AMDGPUHSAMetadataStreamer.h

Show All 36 Lines
namespace HSAMD {		namespace HSAMD {

class MetadataStreamer {		class MetadataStreamer {
public:		public:
virtual ~MetadataStreamer(){};		virtual ~MetadataStreamer(){};

virtual bool emitTo(AMDGPUTargetStreamer &TargetStreamer) = 0;		virtual bool emitTo(AMDGPUTargetStreamer &TargetStreamer) = 0;

virtual void begin(const Module &Mod) = 0;		virtual void begin(const Module &Mod, StringRef TargetID) = 0;

virtual void end() = 0;		virtual void end() = 0;

virtual void emitKernel(const MachineFunction &MF,		virtual void emitKernel(const MachineFunction &MF,
const SIProgramInfo &ProgramInfo) = 0;		const SIProgramInfo &ProgramInfo) = 0;
};		};

class MetadataStreamerV3 final : public MetadataStreamer {		class MetadataStreamerV3 final : public MetadataStreamer {
Show All 18 Lines	private:

msgpack::ArrayDocNode getWorkGroupDimensions(MDNode *Node) const;		msgpack::ArrayDocNode getWorkGroupDimensions(MDNode *Node) const;

msgpack::MapDocNode getHSAKernelProps(const MachineFunction &MF,		msgpack::MapDocNode getHSAKernelProps(const MachineFunction &MF,
const SIProgramInfo &ProgramInfo) const;		const SIProgramInfo &ProgramInfo) const;

void emitVersion();		void emitVersion();

		void emitTargetID(StringRef TargetID);

void emitPrintf(const Module &Mod);		void emitPrintf(const Module &Mod);

void emitKernelLanguage(const Function &Func, msgpack::MapDocNode Kern);		void emitKernelLanguage(const Function &Func, msgpack::MapDocNode Kern);

void emitKernelAttrs(const Function &Func, msgpack::MapDocNode Kern);		void emitKernelAttrs(const Function &Func, msgpack::MapDocNode Kern);

void emitKernelArgs(const Function &Func, msgpack::MapDocNode Kern);		void emitKernelArgs(const Function &Func, msgpack::MapDocNode Kern);

Show All 18 Lines	private:
}		}

public:		public:
MetadataStreamerV3() = default;		MetadataStreamerV3() = default;
~MetadataStreamerV3() = default;		~MetadataStreamerV3() = default;

bool emitTo(AMDGPUTargetStreamer &TargetStreamer) override;		bool emitTo(AMDGPUTargetStreamer &TargetStreamer) override;

void begin(const Module &Mod) override;		void begin(const Module &Mod, StringRef TargetID) override;

void end() override;		void end() override;

void emitKernel(const MachineFunction &MF,		void emitKernel(const MachineFunction &MF,
const SIProgramInfo &ProgramInfo) override;		const SIProgramInfo &ProgramInfo) override;
};		};

class MetadataStreamerV2 final : public MetadataStreamer {		class MetadataStreamerV2 final : public MetadataStreamer {
▲ Show 20 Lines • Show All 49 Lines • ▼ Show 20 Lines	private:
}		}

public:		public:
MetadataStreamerV2() = default;		MetadataStreamerV2() = default;
~MetadataStreamerV2() = default;		~MetadataStreamerV2() = default;

bool emitTo(AMDGPUTargetStreamer &TargetStreamer) override;		bool emitTo(AMDGPUTargetStreamer &TargetStreamer) override;

void begin(const Module &Mod) override;		void begin(const Module &Mod, StringRef TargetID) override;

void end() override;		void end() override;

void emitKernel(const MachineFunction &MF,		void emitKernel(const MachineFunction &MF,
const SIProgramInfo &ProgramInfo) override;		const SIProgramInfo &ProgramInfo) override;
};		};

} // end namespace HSAMD		} // end namespace HSAMD
} // end namespace AMDGPU		} // end namespace AMDGPU
} // end namespace llvm		} // end namespace llvm

#endif // LLVM_LIB_TARGET_AMDGPU_MCTARGETDESC_AMDGPUHSAMETADATASTREAMER_H		#endif // LLVM_LIB_TARGET_AMDGPU_MCTARGETDESC_AMDGPUHSAMETADATASTREAMER_H

llvm/lib/Target/AMDGPU/AMDGPUHSAMetadataStreamer.cpp

Show First 20 Lines • Show All 446 Lines • ▼ Show 20 Lines	void MetadataStreamerV2::emitHiddenKernelArgs(const Function &Func) {
if (HiddenArgNumBytes >= 56)		if (HiddenArgNumBytes >= 56)
emitKernelArg(DL, Int8PtrTy, ValueKind::HiddenMultiGridSyncArg);		emitKernelArg(DL, Int8PtrTy, ValueKind::HiddenMultiGridSyncArg);
}		}

bool MetadataStreamerV2::emitTo(AMDGPUTargetStreamer &TargetStreamer) {		bool MetadataStreamerV2::emitTo(AMDGPUTargetStreamer &TargetStreamer) {
return TargetStreamer.EmitHSAMetadata(getHSAMetadata());		return TargetStreamer.EmitHSAMetadata(getHSAMetadata());
}		}

void MetadataStreamerV2::begin(const Module &Mod) {		void MetadataStreamerV2::begin(const Module &Mod, StringRef TargetID) {
emitVersion();		emitVersion();
emitPrintf(Mod);		emitPrintf(Mod);
}		}

void MetadataStreamerV2::end() {		void MetadataStreamerV2::end() {
std::string HSAMetadataString;		std::string HSAMetadataString;
if (toString(HSAMetadata, HSAMetadataString))		if (toString(HSAMetadata, HSAMetadataString))
return;		return;
▲ Show 20 Lines • Show All 193 Lines • ▼ Show 20 Lines

void MetadataStreamerV3::emitVersion() {		void MetadataStreamerV3::emitVersion() {
auto Version = HSAMetadataDoc->getArrayNode();		auto Version = HSAMetadataDoc->getArrayNode();
Version.push_back(Version.getDocument()->getNode(VersionMajor));		Version.push_back(Version.getDocument()->getNode(VersionMajor));
Version.push_back(Version.getDocument()->getNode(VersionMinor));		Version.push_back(Version.getDocument()->getNode(VersionMinor));
getRootMetadata("amdhsa.version") = Version;		getRootMetadata("amdhsa.version") = Version;
}		}

		void MetadataStreamerV3::emitTargetID(StringRef TargetID) {
		getRootMetadata("amdhsa.target") =
		HSAMetadataDoc->getNode(TargetID, /Copy=/true);
		}

void MetadataStreamerV3::emitPrintf(const Module &Mod) {		void MetadataStreamerV3::emitPrintf(const Module &Mod) {
auto Node = Mod.getNamedMetadata("llvm.printf.fmts");		auto Node = Mod.getNamedMetadata("llvm.printf.fmts");
if (!Node)		if (!Node)
return;		return;

auto Printf = HSAMetadataDoc->getArrayNode();		auto Printf = HSAMetadataDoc->getArrayNode();
for (auto Op : Node->operands())		for (auto Op : Node->operands())
if (Op->getNumOperands())		if (Op->getNumOperands())
▲ Show 20 Lines • Show All 244 Lines • ▼ Show 20 Lines	MetadataStreamerV3::getHSAKernelProps(const MachineFunction &MF,

return Kern;		return Kern;
}		}

bool MetadataStreamerV3::emitTo(AMDGPUTargetStreamer &TargetStreamer) {		bool MetadataStreamerV3::emitTo(AMDGPUTargetStreamer &TargetStreamer) {
return TargetStreamer.EmitHSAMetadata(*HSAMetadataDoc, true);		return TargetStreamer.EmitHSAMetadata(*HSAMetadataDoc, true);
}		}

void MetadataStreamerV3::begin(const Module &Mod) {		void MetadataStreamerV3::begin(const Module &Mod, StringRef TargetID) {
emitVersion();		emitVersion();
		if (enableNewTargetID())
		emitTargetID(TargetID);
emitPrintf(Mod);		emitPrintf(Mod);
getRootMetadata("amdhsa.kernels") = HSAMetadataDoc->getArrayNode();		getRootMetadata("amdhsa.kernels") = HSAMetadataDoc->getArrayNode();
}		}

void MetadataStreamerV3::end() {		void MetadataStreamerV3::end() {
std::string HSAMetadataString;		std::string HSAMetadataString;
raw_string_ostream StrOS(HSAMetadataString);		raw_string_ostream StrOS(HSAMetadataString);
HSAMetadataDoc->toYAML(StrOS);		HSAMetadataDoc->toYAML(StrOS);
Show All 33 Lines

llvm/lib/Target/AMDGPU/AMDGPUMachineModuleInfo.h

Show All 40 Lines	private:
SyncScope::ID AgentOneAddressSpaceSSID;		SyncScope::ID AgentOneAddressSpaceSSID;
/// Workgroup synchronization scope ID (single address space).		/// Workgroup synchronization scope ID (single address space).
SyncScope::ID WorkgroupOneAddressSpaceSSID;		SyncScope::ID WorkgroupOneAddressSpaceSSID;
/// Wavefront synchronization scope ID (single address space).		/// Wavefront synchronization scope ID (single address space).
SyncScope::ID WavefrontOneAddressSpaceSSID;		SyncScope::ID WavefrontOneAddressSpaceSSID;
/// Single thread synchronization scope ID (single address space).		/// Single thread synchronization scope ID (single address space).
SyncScope::ID SingleThreadOneAddressSpaceSSID;		SyncScope::ID SingleThreadOneAddressSpaceSSID;

		// Target identification string syntax can be found here:
		// https://llvm.org/docs/AMDGPUUsage.html#code-object-target-identification

		/// Target identification string.
		std::string TargetID;

/// In AMDGPU target synchronization scopes are inclusive, meaning a		/// In AMDGPU target synchronization scopes are inclusive, meaning a
/// larger synchronization scope is inclusive of a smaller synchronization		/// larger synchronization scope is inclusive of a smaller synchronization
/// scope.		/// scope.
///		///
/// \returns \p SSID's inclusion ordering, or "None" if \p SSID is not		/// \returns \p SSID's inclusion ordering, or "None" if \p SSID is not
/// supported by the AMDGPU target.		/// supported by the AMDGPU target.
Optional<uint8_t> getSyncScopeInclusionOrdering(SyncScope::ID SSID) const {		Optional<uint8_t> getSyncScopeInclusionOrdering(SyncScope::ID SSID) const {
if (SSID == SyncScope::SingleThread \|\|		if (SSID == SyncScope::SingleThread \|\|
▲ Show 20 Lines • Show All 76 Lines • ▼ Show 20 Lines	if (!AIO \|\| !BIO)
return None;		return None;

bool IsAOneAddressSpace = isOneAddressSpace(A);		bool IsAOneAddressSpace = isOneAddressSpace(A);
bool IsBOneAddressSpace = isOneAddressSpace(B);		bool IsBOneAddressSpace = isOneAddressSpace(B);

return AIO.getValue() >= BIO.getValue() &&		return AIO.getValue() >= BIO.getValue() &&
(IsAOneAddressSpace == IsBOneAddressSpace \|\| !IsAOneAddressSpace);		(IsAOneAddressSpace == IsBOneAddressSpace \|\| !IsAOneAddressSpace);
}		}

		/// \returns Target identification string.
		StringRef getTargetID() const {
		return TargetID;
		}
};		};

} // end namespace llvm		} // end namespace llvm

#endif // LLVM_LIB_TARGET_AMDGPU_AMDGPUMACHINEMODULEINFO_H		#endif // LLVM_LIB_TARGET_AMDGPU_AMDGPUMACHINEMODULEINFO_H

llvm/lib/Target/AMDGPU/AMDGPUMachineModuleInfo.cpp

	//===--- AMDGPUMachineModuleInfo.cpp ----------------------------- C++ --===//			//===--- AMDGPUMachineModuleInfo.cpp ----------------------------- C++ --===//
	//			//
	// Part of the LLVM Project, under the Apache License v2.0 with LLVM Exceptions.			// Part of the LLVM Project, under the Apache License v2.0 with LLVM Exceptions.
	// See https://llvm.org/LICENSE.txt for license information.			// See https://llvm.org/LICENSE.txt for license information.
	// SPDX-License-Identifier: Apache-2.0 WITH LLVM-exception			// SPDX-License-Identifier: Apache-2.0 WITH LLVM-exception
	//			//
	//===----------------------------------------------------------------------===//			//===----------------------------------------------------------------------===//
	//			//
	/// \file			/// \file
	/// AMDGPU Machine Module Info.			/// AMDGPU Machine Module Info.
	///			///
	//			//
	//===----------------------------------------------------------------------===//			//===----------------------------------------------------------------------===//

	#include "AMDGPUMachineModuleInfo.h"			#include "AMDGPUMachineModuleInfo.h"
	#include "llvm/IR/Module.h"			#include "llvm/IR/Module.h"
				#include "llvm/Target/TargetMachine.h"
				#include "llvm/Support/TargetParser.h"

	namespace llvm {			namespace llvm {

	AMDGPUMachineModuleInfo::AMDGPUMachineModuleInfo(const MachineModuleInfo &MMI)			AMDGPUMachineModuleInfo::AMDGPUMachineModuleInfo(const MachineModuleInfo &MMI)
	: MachineModuleInfoELF(MMI) {			: MachineModuleInfoELF(MMI) {
	LLVMContext &CTX = MMI.getModule()->getContext();			LLVMContext &CTX = MMI.getModule()->getContext();
	AgentSSID = CTX.getOrInsertSyncScopeID("agent");			AgentSSID = CTX.getOrInsertSyncScopeID("agent");
	WorkgroupSSID = CTX.getOrInsertSyncScopeID("workgroup");			WorkgroupSSID = CTX.getOrInsertSyncScopeID("workgroup");
	WavefrontSSID = CTX.getOrInsertSyncScopeID("wavefront");			WavefrontSSID = CTX.getOrInsertSyncScopeID("wavefront");
	SystemOneAddressSpaceSSID =			SystemOneAddressSpaceSSID =
	CTX.getOrInsertSyncScopeID("one-as");			CTX.getOrInsertSyncScopeID("one-as");
	AgentOneAddressSpaceSSID =			AgentOneAddressSpaceSSID =
	CTX.getOrInsertSyncScopeID("agent-one-as");			CTX.getOrInsertSyncScopeID("agent-one-as");
	WorkgroupOneAddressSpaceSSID =			WorkgroupOneAddressSpaceSSID =
	CTX.getOrInsertSyncScopeID("workgroup-one-as");			CTX.getOrInsertSyncScopeID("workgroup-one-as");
	WavefrontOneAddressSpaceSSID =			WavefrontOneAddressSpaceSSID =
	CTX.getOrInsertSyncScopeID("wavefront-one-as");			CTX.getOrInsertSyncScopeID("wavefront-one-as");
	SingleThreadOneAddressSpaceSSID =			SingleThreadOneAddressSpaceSSID =
	CTX.getOrInsertSyncScopeID("singlethread-one-as");			CTX.getOrInsertSyncScopeID("singlethread-one-as");

				if (MMI.getTarget().getTargetTriple().getArch() != Triple::amdgcn) {
				return;
				}

				SmallVector<Module::ModuleFlagEntry, 8> ModuleFlags;
				MMI.getModule()->getModuleFlagsMetadata(ModuleFlags);
				for (const auto &MFE : ModuleFlags) {
				if (MFE.Behavior != Module::MergeTargetId) {
				scott.linderUnsubmitted Done Reply Inline Actions It seems like the condition/assertion here should be flipped. We should identify the metadata by the key, then assert it has the required merge behavior. Is it just inverted to avoid repeated string comparisons, and because we can be certain there won't be other uses of the merge behavior for AMDGPU IR? scott.linder: It seems like the condition/assertion here should be flipped. We should identify the metadata…
				kzhuravlAuthorUnsubmitted Done Reply Inline Actions yes, avoiding string comparisons. also implementation of MergeTargetID implies there won't be other uses of the merge behavior. kzhuravl: yes, avoiding string comparisons. also implementation of MergeTargetID implies there won't be…
				continue;
				}

				assert(MFE.Key->getString().equals("target-id"));
				TargetID = cast<MDString>(MFE.Val)->getString().str();
				}
				if (TargetID.empty()) {
				scott.linderUnsubmitted Not Done Reply Inline Actions Do we really want to have this "fallback"? It seems like we should just define the "target-id" metadata entry as required, and fail here instead. I can't remember exactly, but my understanding is that the Target you get from MMI is essentially incorrect, and is only there for legacy purposes. We have had bugs in the past, some of which led us to the whole TargetID proposal in the first place, when we used the MMI instead of per-function Subtargets. Not AMDGPU, but see http://lists.llvm.org/pipermail/llvm-commits/Week-of-Mon-20150316/266041.html for an example. I am worried that this behavior will just lead to more bugs. Is it here to avoid updating tests or something similar? scott.linder: Do we really want to have this "fallback"? It seems like we should just define the "target-id"…
				auto TargetTriple = MMI.getTarget().getTargetTriple();
				auto CPU = MMI.getTarget().getTargetCPU();
				auto Version = AMDGPU::getIsaVersion(CPU);

				raw_string_ostream ConstructedTargetIDOStr(TargetID);
				ConstructedTargetIDOStr << TargetTriple.getArchName() << '-'
				<< TargetTriple.getVendorName() << '-'
				<< TargetTriple.getOSName() << '-'
				<< TargetTriple.getEnvironmentName() << '-';
				if (Version.Major >= 9) {
				ConstructedTargetIDOStr << CPU;
				} else {
				ConstructedTargetIDOStr << "gfx" << Version.Major << Version.Minor
				<< Version.Stepping;
				}
				ConstructedTargetIDOStr.flush();
				}
	}			}

	} // end namespace llvm			} // end namespace llvm

llvm/lib/Target/AMDGPU/AsmParser/AMDGPUAsmParser.cpp

Show First 20 Lines • Show All 3,748 Lines • ▼ Show 20 Lines	bool AMDGPUAsmParser::ParseDirectiveMajorMinor(uint32_t &Major,

return false;		return false;
}		}

bool AMDGPUAsmParser::ParseDirectiveAMDGCNTarget() {		bool AMDGPUAsmParser::ParseDirectiveAMDGCNTarget() {
if (getSTI().getTargetTriple().getArch() != Triple::amdgcn)		if (getSTI().getTargetTriple().getArch() != Triple::amdgcn)
return TokError("directive only supported for amdgcn architecture");		return TokError("directive only supported for amdgcn architecture");

std::string Target;		std::string TargetID;

SMLoc TargetStart = getTok().getLoc();		SMLoc TargetStart = getTok().getLoc();
if (getParser().parseEscapedString(Target))		if (getParser().parseEscapedString(TargetID))
return true;		return true;
SMRange TargetRange = SMRange(TargetStart, getTok().getLoc());		SMRange TargetRange = SMRange(TargetStart, getTok().getLoc());

std::string ExpectedTarget;		if (!enableNewTargetID()) {
		scott.linderUnsubmitted Not Done Reply Inline Actions Nit: Can this condition be inverted, i.e. the new case first. scott.linder: Nit: Can this condition be inverted, i.e. the new case first.
raw_string_ostream ExpectedTargetOS(ExpectedTarget);		std::string ExpectedTargetIDStr;
IsaInfo::streamIsaVersion(&getSTI(), ExpectedTargetOS);		raw_string_ostream ExpectedTargetIDOStr(ExpectedTargetIDStr);
		IsaInfo::streamIsaVersion(&getSTI(), ExpectedTargetIDOStr);

if (Target != ExpectedTargetOS.str())		if (TargetID != ExpectedTargetIDOStr.str())
return getParser().Error(TargetRange.Start, "target must match options",		return getParser().Error(TargetRange.Start, "target must match options",
TargetRange);		TargetRange);
		} else {
		if (!isSubtargetInfoEquivalentToTargetID(&getSTI(), TargetID))
		return getParser().Error(TargetRange.Start, "target must match options",
		TargetRange);
		}

getTargetStreamer().EmitDirectiveAMDGCNTarget(Target);		getTargetStreamer().EmitDirectiveAMDGCNTarget(getSTI(), TargetID);
return false;		return false;
}		}

bool AMDGPUAsmParser::OutOfRangeError(SMRange Range) {		bool AMDGPUAsmParser::OutOfRangeError(SMRange Range) {
return getParser().Error(Range.Start, "value out of range", Range);		return getParser().Error(Range.Start, "value out of range", Range);
}		}

bool AMDGPUAsmParser::calculateGPRBlocks(		bool AMDGPUAsmParser::calculateGPRBlocks(
▲ Show 20 Lines • Show All 3,431 Lines • Show Last 20 Lines

llvm/lib/Target/AMDGPU/MCTargetDesc/AMDGPUAsmBackend.cpp

	Show First 20 Lines • Show All 231 Lines • ▼ Show 20 Lines
	};			};

	} // end anonymous namespace			} // end anonymous namespace

	MCAsmBackend *llvm::createAMDGPUAsmBackend(const Target &T,			MCAsmBackend *llvm::createAMDGPUAsmBackend(const Target &T,
	const MCSubtargetInfo &STI,			const MCSubtargetInfo &STI,
	const MCRegisterInfo &MRI,			const MCRegisterInfo &MRI,
	const MCTargetOptions &Options) {			const MCTargetOptions &Options) {
				uint8_t ABIVersion = 0;
				if (IsaInfo::hasCodeObjectV3(&STI)) {
				ABIVersion = enableNewTargetID() ? 2 : 1;
				}

	// Use 64-bit ELF for amdgcn			// Use 64-bit ELF for amdgcn
	return new ELFAMDGPUAsmBackend(T, STI.getTargetTriple(),			return new ELFAMDGPUAsmBackend(T, STI.getTargetTriple(), ABIVersion);
	IsaInfo::hasCodeObjectV3(&STI) ? 1 : 0);
	}			}

llvm/lib/Target/AMDGPU/MCTargetDesc/AMDGPUTargetStreamer.h

Show All 33 Lines
protected:		protected:
MCContext &getContext() const { return Streamer.getContext(); }		MCContext &getContext() const { return Streamer.getContext(); }

public:		public:
AMDGPUTargetStreamer(MCStreamer &S) : MCTargetStreamer(S) {}		AMDGPUTargetStreamer(MCStreamer &S) : MCTargetStreamer(S) {}

AMDGPUPALMetadata *getPALMetadata() { return &PALMetadata; }		AMDGPUPALMetadata *getPALMetadata() { return &PALMetadata; }

virtual void EmitDirectiveAMDGCNTarget(StringRef Target) = 0;		virtual void EmitDirectiveAMDGCNTarget(const MCSubtargetInfo &STI,
		StringRef TargetID = "") = 0;

virtual void EmitDirectiveHSACodeObjectVersion(uint32_t Major,		virtual void EmitDirectiveHSACodeObjectVersion(uint32_t Major,
uint32_t Minor) = 0;		uint32_t Minor) = 0;

virtual void EmitDirectiveHSACodeObjectISA(uint32_t Major, uint32_t Minor,		virtual void EmitDirectiveHSACodeObjectISA(uint32_t Major, uint32_t Minor,
uint32_t Stepping,		uint32_t Stepping,
StringRef VendorName,		StringRef VendorName,
StringRef ArchName) = 0;		StringRef ArchName) = 0;
▲ Show 20 Lines • Show All 41 Lines • ▼ Show 20 Lines

class AMDGPUTargetAsmStreamer final : public AMDGPUTargetStreamer {		class AMDGPUTargetAsmStreamer final : public AMDGPUTargetStreamer {
formatted_raw_ostream &OS;		formatted_raw_ostream &OS;
public:		public:
AMDGPUTargetAsmStreamer(MCStreamer &S, formatted_raw_ostream &OS);		AMDGPUTargetAsmStreamer(MCStreamer &S, formatted_raw_ostream &OS);

void finish() override;		void finish() override;

void EmitDirectiveAMDGCNTarget(StringRef Target) override;		void EmitDirectiveAMDGCNTarget(const MCSubtargetInfo &STI,
		StringRef TargetID = "") override;

void EmitDirectiveHSACodeObjectVersion(uint32_t Major,		void EmitDirectiveHSACodeObjectVersion(uint32_t Major,
uint32_t Minor) override;		uint32_t Minor) override;

void EmitDirectiveHSACodeObjectISA(uint32_t Major, uint32_t Minor,		void EmitDirectiveHSACodeObjectISA(uint32_t Major, uint32_t Minor,
uint32_t Stepping, StringRef VendorName,		uint32_t Stepping, StringRef VendorName,
StringRef ArchName) override;		StringRef ArchName) override;

Show All 19 Lines	void EmitAmdhsaKernelDescriptor(
const MCSubtargetInfo &STI, StringRef KernelName,		const MCSubtargetInfo &STI, StringRef KernelName,
const amdhsa::kernel_descriptor_t &KernelDescriptor, uint64_t NextVGPR,		const amdhsa::kernel_descriptor_t &KernelDescriptor, uint64_t NextVGPR,
uint64_t NextSGPR, bool ReserveVCC, bool ReserveFlatScr,		uint64_t NextSGPR, bool ReserveVCC, bool ReserveFlatScr,
bool ReserveXNACK) override;		bool ReserveXNACK) override;
};		};

class AMDGPUTargetELFStreamer final : public AMDGPUTargetStreamer {		class AMDGPUTargetELFStreamer final : public AMDGPUTargetStreamer {
MCStreamer &Streamer;		MCStreamer &Streamer;
Triple::OSType Os;		const MCSubtargetInfo &STI;

void EmitNote(StringRef Name, const MCExpr *DescSize, unsigned NoteType,		void EmitNote(StringRef Name, const MCExpr *DescSize, unsigned NoteType,
function_ref<void(MCELFStreamer &)> EmitDesc);		function_ref<void(MCELFStreamer &)> EmitDesc);

public:		public:
AMDGPUTargetELFStreamer(MCStreamer &S, const MCSubtargetInfo &STI);		AMDGPUTargetELFStreamer(MCStreamer &S, const MCSubtargetInfo &STI);

MCELFStreamer &getStreamer();		MCELFStreamer &getStreamer();

void finish() override;		void finish() override;

void EmitDirectiveAMDGCNTarget(StringRef Target) override;		void EmitDirectiveAMDGCNTarget(const MCSubtargetInfo &STI,
		StringRef TargetID = "") override;

void EmitDirectiveHSACodeObjectVersion(uint32_t Major,		void EmitDirectiveHSACodeObjectVersion(uint32_t Major,
uint32_t Minor) override;		uint32_t Minor) override;

void EmitDirectiveHSACodeObjectISA(uint32_t Major, uint32_t Minor,		void EmitDirectiveHSACodeObjectISA(uint32_t Major, uint32_t Minor,
uint32_t Stepping, StringRef VendorName,		uint32_t Stepping, StringRef VendorName,
StringRef ArchName) override;		StringRef ArchName) override;

Show All 27 Lines

llvm/lib/Target/AMDGPU/MCTargetDesc/AMDGPUTargetStreamer.cpp

Show First 20 Lines • Show All 164 Lines • ▼ Show 20 Lines
// A hook for emitting stuff at the end.		// A hook for emitting stuff at the end.
// We use it for emitting the accumulated PAL metadata as directives.		// We use it for emitting the accumulated PAL metadata as directives.
void AMDGPUTargetAsmStreamer::finish() {		void AMDGPUTargetAsmStreamer::finish() {
std::string S;		std::string S;
getPALMetadata()->toString(S);		getPALMetadata()->toString(S);
OS << S;		OS << S;
}		}

void AMDGPUTargetAsmStreamer::EmitDirectiveAMDGCNTarget(StringRef Target) {		void AMDGPUTargetAsmStreamer::EmitDirectiveAMDGCNTarget(
OS << "\t.amdgcn_target \"" << Target << "\"\n";		const MCSubtargetInfo &STI, StringRef TargetID) {
		if (!IsaInfo::hasCodeObjectV3(&STI)) {
		// V2 does not have TargetID concept.
		return;
		}
		if (!enableNewTargetID()) {
		// V3 + Original TargetID.
		std::string ConstructedTargetIDStr;
		scott.linderUnsubmitted Not Done Reply Inline Actions Why is `TargetID` ignored, but passed in by `AMDGPUAsmParser::ParseDirectiveAMDGCNTarget` for this case, and constructed in the same way? scott.linder: Why is `TargetID` ignored, but passed in by `AMDGPUAsmParser::ParseDirectiveAMDGCNTarget` for…
		raw_string_ostream ConstructedTargetIDOStr(ConstructedTargetIDStr);
		IsaInfo::streamIsaVersion(&STI, ConstructedTargetIDOStr);
		OS << "\t.amdgcn_target \"" << ConstructedTargetIDStr << "\"\n";
		return;
		}

		// V3 + New TargetID.
		OS << "\t.amdgcn_target \"" << TargetID << "\"\n";
}		}

void AMDGPUTargetAsmStreamer::EmitDirectiveHSACodeObjectVersion(		void AMDGPUTargetAsmStreamer::EmitDirectiveHSACodeObjectVersion(
uint32_t Major, uint32_t Minor) {		uint32_t Major, uint32_t Minor) {
OS << "\t.hsa_code_object_version " <<		OS << "\t.hsa_code_object_version " <<
Twine(Major) << "," << Twine(Minor) << '\n';		Twine(Major) << "," << Twine(Minor) << '\n';
}		}

▲ Show 20 Lines • Show All 207 Lines • ▼ Show 20 Lines
}		}

//===----------------------------------------------------------------------===//		//===----------------------------------------------------------------------===//
// AMDGPUTargetELFStreamer		// AMDGPUTargetELFStreamer
//===----------------------------------------------------------------------===//		//===----------------------------------------------------------------------===//

AMDGPUTargetELFStreamer::AMDGPUTargetELFStreamer(MCStreamer &S,		AMDGPUTargetELFStreamer::AMDGPUTargetELFStreamer(MCStreamer &S,
const MCSubtargetInfo &STI)		const MCSubtargetInfo &STI)
: AMDGPUTargetStreamer(S), Streamer(S), Os(STI.getTargetTriple().getOS()) {		: AMDGPUTargetStreamer(S), Streamer(S), STI(STI) {
MCAssembler &MCA = getStreamer().getAssembler();		MCAssembler &MCA = getStreamer().getAssembler();
unsigned EFlags = MCA.getELFHeaderEFlags();		unsigned EFlags = MCA.getELFHeaderEFlags();

EFlags &= ~ELF::EF_AMDGPU_MACH;		EFlags &= ~ELF::EF_AMDGPU_MACH;
EFlags \|= getElfMach(STI.getCPU());		EFlags \|= getElfMach(STI.getCPU());

		if (!enableNewTargetID()) {
		// V2, V3 + Original TargetID.
EFlags &= ~ELF::EF_AMDGPU_XNACK;		EFlags &= ~ELF::EF_AMDGPU_XNACK;
if (AMDGPU::hasXNACK(STI))		if (AMDGPU::hasXNACK(STI))
EFlags \|= ELF::EF_AMDGPU_XNACK;		EFlags \|= ELF::EF_AMDGPU_XNACK;

EFlags &= ~ELF::EF_AMDGPU_SRAM_ECC;		EFlags &= ~ELF::EF_AMDGPU_SRAM_ECC;
if (AMDGPU::hasSRAMECC(STI))		if (AMDGPU::hasSRAMECC(STI))
EFlags \|= ELF::EF_AMDGPU_SRAM_ECC;		EFlags \|= ELF::EF_AMDGPU_SRAM_ECC;
		} else {
		// V3 + New TargetID.
		EFlags &= ~ELF::EF_AMDGPU_FEATURE_XNACK;
		EFlags \|= ELF::EF_AMDGPU_FEATURE_XNACK_DEFAULT;
		scott.linderUnsubmitted Done Reply Inline Actions Same question as above about the bit-pattern for the Default case; is there a need to differentiate the non-supported-feature case from the supported-and-Default case? If not, can we just change the bitpatterns of the three values and delete these bitwise-ORs? scott.linder: Same question as above about the bit-pattern for the Default case; is there a need to…
		kzhuravlAuthorUnsubmitted Done Reply Inline Actions no, according to latest docs. kzhuravl: no, according to latest docs.

		EFlags &= ~ELF::EF_AMDGPU_FEATURE_SRAMECC;
		EFlags \|= ELF::EF_AMDGPU_FEATURE_SRAMECC_DEFAULT;
		}

MCA.setELFHeaderEFlags(EFlags);		MCA.setELFHeaderEFlags(EFlags);
}		}

MCELFStreamer &AMDGPUTargetELFStreamer::getStreamer() {		MCELFStreamer &AMDGPUTargetELFStreamer::getStreamer() {
return static_cast<MCELFStreamer &>(Streamer);		return static_cast<MCELFStreamer &>(Streamer);
}		}

Show All 16 Lines	void AMDGPUTargetELFStreamer::EmitNote(
auto &S = getStreamer();		auto &S = getStreamer();
auto &Context = S.getContext();		auto &Context = S.getContext();

auto NameSZ = Name.size() + 1;		auto NameSZ = Name.size() + 1;

unsigned NoteFlags = 0;		unsigned NoteFlags = 0;
// TODO Apparently, this is currently needed for OpenCL as mentioned in		// TODO Apparently, this is currently needed for OpenCL as mentioned in
// https://reviews.llvm.org/D74995		// https://reviews.llvm.org/D74995
if (Os == Triple::AMDHSA)		if (STI.getTargetTriple().getOS() == Triple::AMDHSA)
NoteFlags = ELF::SHF_ALLOC;		NoteFlags = ELF::SHF_ALLOC;

S.PushSection();		S.PushSection();
S.SwitchSection(		S.SwitchSection(
Context.getELFSection(ElfNote::SectionName, ELF::SHT_NOTE, NoteFlags));		Context.getELFSection(ElfNote::SectionName, ELF::SHT_NOTE, NoteFlags));
S.emitInt32(NameSZ); // namesz		S.emitInt32(NameSZ); // namesz
S.emitValue(DescSZ, 4); // descz		S.emitValue(DescSZ, 4); // descz
S.emitInt32(NoteType); // type		S.emitInt32(NoteType); // type
S.emitBytes(Name); // name		S.emitBytes(Name); // name
S.emitValueToAlignment(4, 0, 1, 0); // padding 0		S.emitValueToAlignment(4, 0, 1, 0); // padding 0
EmitDesc(S); // desc		EmitDesc(S); // desc
S.emitValueToAlignment(4, 0, 1, 0); // padding 0		S.emitValueToAlignment(4, 0, 1, 0); // padding 0
S.PopSection();		S.PopSection();
}		}

void AMDGPUTargetELFStreamer::EmitDirectiveAMDGCNTarget(StringRef Target) {}		void AMDGPUTargetELFStreamer::EmitDirectiveAMDGCNTarget(
		const MCSubtargetInfo &STI, StringRef TargetID) {
		if (!IsaInfo::hasCodeObjectV3(&STI)) {
		// V2 is setup in the constructor.
		return;
		}
		if (!enableNewTargetID()) {
		// V3 + Original TargetID is setup in the constructor.
		return;
		}

		MCAssembler &MCA = getStreamer().getAssembler();
		unsigned EFlags = MCA.getELFHeaderEFlags();

		// V3 + New TargetID (default is already setup in the constructor).
		if (auto XNACK = getXnackFromTargetID(TargetID)) {
		EFlags &= ~ELF::EF_AMDGPU_FEATURE_XNACK;
		EFlags \|= XNACK.getValue() ? ELF::EF_AMDGPU_FEATURE_XNACK_ON
		: ELF::EF_AMDGPU_FEATURE_XNACK_OFF;
		}
		if (auto SRAMECC = getSramEccFromTargetID(TargetID)) {
		EFlags &= ~ELF::EF_AMDGPU_FEATURE_SRAMECC;
		EFlags \|= SRAMECC.getValue() ? ELF::EF_AMDGPU_FEATURE_SRAMECC_ON
		: ELF::EF_AMDGPU_FEATURE_SRAMECC_OFF;
		}

		MCA.setELFHeaderEFlags(EFlags);
		}

void AMDGPUTargetELFStreamer::EmitDirectiveHSACodeObjectVersion(		void AMDGPUTargetELFStreamer::EmitDirectiveHSACodeObjectVersion(
uint32_t Major, uint32_t Minor) {		uint32_t Major, uint32_t Minor) {

EmitNote(ElfNote::NoteNameV2, MCConstantExpr::create(8, getContext()),		EmitNote(ElfNote::NoteNameV2, MCConstantExpr::create(8, getContext()),
ElfNote::NT_AMDGPU_HSA_CODE_OBJECT_VERSION, [&](MCELFStreamer &OS) {		ElfNote::NT_AMDGPU_HSA_CODE_OBJECT_VERSION, [&](MCELFStreamer &OS) {
OS.emitInt32(Major);		OS.emitInt32(Major);
OS.emitInt32(Minor);		OS.emitInt32(Minor);
▲ Show 20 Lines • Show All 200 Lines • Show Last 20 Lines

llvm/lib/Target/AMDGPU/Utils/AMDGPUBaseInfo.h

	Show All 30 Lines
	class MCRegisterClass;			class MCRegisterClass;
	class MCRegisterInfo;			class MCRegisterInfo;
	class MCSubtargetInfo;			class MCSubtargetInfo;
	class StringRef;			class StringRef;
	class Triple;			class Triple;

	namespace AMDGPU {			namespace AMDGPU {

				/// \returns True if new target identification string is enabled, false
				/// otherwise.
				bool enableNewTargetID();

				/// \returns None for "default", false for "off", true for "on".
				Optional<bool> getFeatureFromTargetID(StringRef TargetID, StringRef Feature);

				/// \returns None for "default", false for "off", true for "on".
				Optional<bool> getXnackFromTargetID(StringRef TargetID);

				/// \returns None for "default", false for "off", true for "on".
				Optional<bool> getSramEccFromTargetID(StringRef TargetID);

				/// \returns True if \p STI is equivalent to \p TargetID, false otherwise.
				bool isSubtargetInfoEquivalentToTargetID(const MCSubtargetInfo *STI,
				StringRef TargetID);

	struct GcnBufferFormatInfo {			struct GcnBufferFormatInfo {
	unsigned Format;			unsigned Format;
	unsigned BitsPerComp;			unsigned BitsPerComp;
	unsigned NumComponents;			unsigned NumComponents;
	unsigned NumFormat;			unsigned NumFormat;
	unsigned DataFormat;			unsigned DataFormat;
	};			};

	▲ Show 20 Lines • Show All 739 Lines • Show Last 20 Lines

llvm/lib/Target/AMDGPU/Utils/AMDGPUBaseInfo.cpp

	Show All 26 Lines
	#include "llvm/MC/MCContext.h"			#include "llvm/MC/MCContext.h"
	#include "llvm/MC/MCInstrDesc.h"			#include "llvm/MC/MCInstrDesc.h"
	#include "llvm/MC/MCInstrInfo.h"			#include "llvm/MC/MCInstrInfo.h"
	#include "llvm/MC/MCRegisterInfo.h"			#include "llvm/MC/MCRegisterInfo.h"
	#include "llvm/MC/MCSectionELF.h"			#include "llvm/MC/MCSectionELF.h"
	#include "llvm/MC/MCSubtargetInfo.h"			#include "llvm/MC/MCSubtargetInfo.h"
	#include "llvm/MC/SubtargetFeature.h"			#include "llvm/MC/SubtargetFeature.h"
	#include "llvm/Support/Casting.h"			#include "llvm/Support/Casting.h"
				#include "llvm/Support/CommandLine.h"
	#include "llvm/Support/ErrorHandling.h"			#include "llvm/Support/ErrorHandling.h"
	#include "llvm/Support/MathExtras.h"			#include "llvm/Support/MathExtras.h"
	#include <algorithm>			#include <algorithm>
	#include <cassert>			#include <cassert>
	#include <cstdint>			#include <cstdint>
	#include <cstring>			#include <cstring>
	#include <utility>			#include <utility>

	#include "MCTargetDesc/AMDGPUMCTargetDesc.h"			#include "MCTargetDesc/AMDGPUMCTargetDesc.h"

	#define GET_INSTRINFO_NAMED_OPS			#define GET_INSTRINFO_NAMED_OPS
	#define GET_INSTRMAP_INFO			#define GET_INSTRMAP_INFO
	#include "AMDGPUGenInstrInfo.inc"			#include "AMDGPUGenInstrInfo.inc"
	#undef GET_INSTRMAP_INFO			#undef GET_INSTRMAP_INFO
	#undef GET_INSTRINFO_NAMED_OPS			#undef GET_INSTRINFO_NAMED_OPS

				static llvm::cl::opt<bool> EnableNewTargetID(
				"amdgcn-new-target-id",
				llvm::cl::desc("Use New Target ID"),
				llvm::cl::init(false));

	namespace {			namespace {

	/// \returns Bit mask for given bit \p Shift and bit \p Width.			/// \returns Bit mask for given bit \p Shift and bit \p Width.
	unsigned getBitMask(unsigned Shift, unsigned Width) {			unsigned getBitMask(unsigned Shift, unsigned Width) {
	return ((1 << Width) - 1) << Shift;			return ((1 << Width) - 1) << Shift;
	}			}

	/// Packs \p Src into \p Dst for given bit \p Shift and bit \p Width.			/// Packs \p Src into \p Dst for given bit \p Shift and bit \p Width.
	Show All 39 Lines
	unsigned getVmcntBitWidthHi() { return 2; }			unsigned getVmcntBitWidthHi() { return 2; }

	} // end namespace anonymous			} // end namespace anonymous

	namespace llvm {			namespace llvm {

	namespace AMDGPU {			namespace AMDGPU {

				bool enableNewTargetID() {
				return EnableNewTargetID;
				}

				Optional<bool> getFeatureFromTargetID(StringRef TargetID, StringRef Feature) {
				SmallVector<StringRef, 3> TargetIDSplit;
				TargetID.split(TargetIDSplit, ':');

				Optional<bool> FeatureStatus;
				for (const auto &FeatureString : TargetIDSplit) {
				if (FeatureString.startswith(Feature)) {
				if (FeatureString.endswith("+")) {
				FeatureStatus = true;
				} else if (FeatureString.endswith("-")) {
				FeatureStatus = false;
				} else {
				llvm_unreachable("Malformed feature string");
				}
				}
				}
				return FeatureStatus;
				}

				Optional<bool> getXnackFromTargetID(StringRef TargetID) {
				return getFeatureFromTargetID(TargetID, "xnack");
				}

				Optional<bool> getSramEccFromTargetID(StringRef TargetID) {
				return getFeatureFromTargetID(TargetID, "sramecc");
				}

				bool isSubtargetInfoEquivalentToTargetID(const MCSubtargetInfo *STI,
				StringRef TargetID) {
				auto TargetTriple = STI->getTargetTriple();
				auto CPU = STI->getCPU();
				auto Version = AMDGPU::getIsaVersion(CPU);

				std::string ConstructedTargetIDStr;
				raw_string_ostream ConstructedTargetIDOStr(ConstructedTargetIDStr);
				ConstructedTargetIDOStr << TargetTriple.getArchName() << '-'
				<< TargetTriple.getVendorName() << '-'
				<< TargetTriple.getOSName() << '-'
				<< TargetTriple.getEnvironmentName() << '-';
				if (Version.Major >= 9) {
				ConstructedTargetIDOStr << CPU;
				} else {
				ConstructedTargetIDOStr << "gfx" << Version.Major << Version.Minor
				<< Version.Stepping;
				}
				ConstructedTargetIDOStr.flush();

				if (!TargetID.startswith(ConstructedTargetIDStr)) {
				return false;
				}
				if (auto XNACK = getXnackFromTargetID(TargetID)) {
				if (XNACK.getValue() != hasXNACK(*STI)) {
				return false;
				}
				}
				if (auto SRAMECC = getSramEccFromTargetID(TargetID)) {
				if (SRAMECC.getValue() != hasSRAMECC(*STI)) {
				return false;
				}
				}
				return true;
				}

	#define GET_MIMGBaseOpcodesTable_IMPL			#define GET_MIMGBaseOpcodesTable_IMPL
	#define GET_MIMGDimInfoTable_IMPL			#define GET_MIMGDimInfoTable_IMPL
	#define GET_MIMGInfoTable_IMPL			#define GET_MIMGInfoTable_IMPL
	#define GET_MIMGLZMappingTable_IMPL			#define GET_MIMGLZMappingTable_IMPL
	#define GET_MIMGMIPMappingTable_IMPL			#define GET_MIMGMIPMappingTable_IMPL
	#include "AMDGPUGenSearchableTables.inc"			#include "AMDGPUGenSearchableTables.inc"

	int getMIMGOpcode(unsigned BaseOpcode, unsigned MIMGEncoding,			int getMIMGOpcode(unsigned BaseOpcode, unsigned MIMGEncoding,
	▲ Show 20 Lines • Show All 1,341 Lines • Show Last 20 Lines

llvm/test/CodeGen/AMDGPU/tid-incompatible-sti-1.ll

This file was added.

				; RUN: not --crash llc -mtriple=amdgcn-amd-amdhsa -mcpu=gfx900 --amdgcn-new-target-id < %s 2>&1 \| FileCheck %s

				; CHECK: Subtarget info does not match TargetID

				define amdgpu_kernel void @empty() {
				entry:
				ret void
				}

				!0 = !{ i32 8, !"target-id", !"amdgcn-amd-amdhsa--gfx803" }
				!llvm.module.flags = !{ !0 }

llvm/test/CodeGen/AMDGPU/tid-incompatible-sti-2.ll

This file was added.

				; RUN: not --crash llc -mtriple=amdgcn-amd-amdhsa -mcpu=gfx900 --amdgcn-new-target-id < %s 2>&1 \| FileCheck %s

				; CHECK: Subtarget info does not match TargetID

				define amdgpu_kernel void @empty() {
				entry:
				ret void
				}

				!0 = !{ i32 8, !"target-id", !"amdgcn-amd-amdhsa--gfx900:xnack+:sramecc+" }
				!llvm.module.flags = !{ !0 }

llvm/test/CodeGen/AMDGPU/tid-none.ll

This file was added.

				; RUN: llc -mtriple=amdgcn-amd-amdhsa -mcpu=gfx900 --amdgcn-new-target-id < %s \| FileCheck --check-prefixes=ASM %s
				; RUN: llc -mtriple=amdgcn-amd-amdhsa -mcpu=gfx900 --amdgcn-new-target-id -filetype=obj < %s \| llvm-readobj --file-headers - \| FileCheck --check-prefixes=ELF %s

				; ASM: .amdgcn_target "amdgcn-amd-amdhsa--gfx900"
				; ASM: amdhsa.target: amdgcn-amd-amdhsa--gfx900
				; ELF: Flags [ (0x52C)
				; ELF: EF_AMDGPU_FEATURE_SRAMECC_DEFAULT (0x400)
				; ELF: EF_AMDGPU_FEATURE_XNACK_DEFAULT (0x100)
				; ELF: EF_AMDGPU_MACH_AMDGCN_GFX900 (0x2C)
				; ELF: ]

				define amdgpu_kernel void @empty() {
				entry:
				ret void
				}

llvm/test/CodeGen/AMDGPU/tid-xnack-default-sramecc-default.ll

This file was added.

				; RUN: llc -mtriple=amdgcn-amd-amdhsa -mcpu=gfx900 --amdgcn-new-target-id < %s \| FileCheck --check-prefixes=ASM %s
				; RUN: llc -mtriple=amdgcn-amd-amdhsa -mcpu=gfx900 --amdgcn-new-target-id -filetype=obj < %s \| llvm-readobj --file-headers - \| FileCheck --check-prefixes=ELF %s

				; ASM: .amdgcn_target "amdgcn-amd-amdhsa--gfx900"
				; ASM: amdhsa.target: amdgcn-amd-amdhsa--gfx900
				; ELF: Flags [ (0x52C)
				; ELF: EF_AMDGPU_FEATURE_SRAMECC_DEFAULT (0x400)
				; ELF: EF_AMDGPU_FEATURE_XNACK_DEFAULT (0x100)
				; ELF: EF_AMDGPU_MACH_AMDGCN_GFX900 (0x2C)
				; ELF: ]

				define amdgpu_kernel void @empty() {
				entry:
				ret void
				}

				!0 = !{ i32 8, !"target-id", !"amdgcn-amd-amdhsa--gfx900" }
				!llvm.module.flags = !{ !0 }

llvm/test/CodeGen/AMDGPU/tid-xnack-default-sramecc-off.ll

This file was added.

				; RUN: llc -mtriple=amdgcn-amd-amdhsa -mcpu=gfx900 -mattr=-sram-ecc --amdgcn-new-target-id < %s \| FileCheck --check-prefixes=ASM %s
				; RUN: llc -mtriple=amdgcn-amd-amdhsa -mcpu=gfx900 -mattr=-sram-ecc --amdgcn-new-target-id -filetype=obj < %s \| llvm-readobj --file-headers - \| FileCheck --check-prefixes=ELF %s

				; ASM: .amdgcn_target "amdgcn-amd-amdhsa--gfx900:sramecc-"
				; ASM: amdhsa.target: 'amdgcn-amd-amdhsa--gfx900:sramecc-'
				; ELF: Flags [ (0x92C)
				; ELF: EF_AMDGPU_FEATURE_SRAMECC_OFF (0x800)
				; ELF: EF_AMDGPU_FEATURE_XNACK_DEFAULT (0x100)
				; ELF: EF_AMDGPU_MACH_AMDGCN_GFX900 (0x2C)
				; ELF: ]

				define amdgpu_kernel void @empty() {
				entry:
				ret void
				}

				!0 = !{ i32 8, !"target-id", !"amdgcn-amd-amdhsa--gfx900:sramecc-" }
				!llvm.module.flags = !{ !0 }

llvm/test/CodeGen/AMDGPU/tid-xnack-default-sramecc-on.ll

This file was added.

				; RUN: llc -mtriple=amdgcn-amd-amdhsa -mcpu=gfx900 -mattr=+sram-ecc --amdgcn-new-target-id < %s \| FileCheck --check-prefixes=ASM %s
				; RUN: llc -mtriple=amdgcn-amd-amdhsa -mcpu=gfx900 -mattr=+sram-ecc --amdgcn-new-target-id -filetype=obj < %s \| llvm-readobj --file-headers - \| FileCheck --check-prefixes=ELF %s

				; ASM: .amdgcn_target "amdgcn-amd-amdhsa--gfx900:sramecc+"
				; ASM: amdhsa.target: 'amdgcn-amd-amdhsa--gfx900:sramecc+'
				; ELF: Flags [ (0xD2C)
				; ELF: EF_AMDGPU_FEATURE_SRAMECC_ON (0xC00)
				; ELF: EF_AMDGPU_FEATURE_XNACK_DEFAULT (0x100)
				; ELF: EF_AMDGPU_MACH_AMDGCN_GFX900 (0x2C)
				; ELF: ]

				define amdgpu_kernel void @empty() {
				entry:
				ret void
				}

				!0 = !{ i32 8, !"target-id", !"amdgcn-amd-amdhsa--gfx900:sramecc+" }
				!llvm.module.flags = !{ !0 }

llvm/test/CodeGen/AMDGPU/tid-xnack-off-sramecc-default.ll

This file was added.

				; RUN: llc -mtriple=amdgcn-amd-amdhsa -mcpu=gfx900 -mattr=-xnack --amdgcn-new-target-id < %s \| FileCheck --check-prefixes=ASM %s
				; RUN: llc -mtriple=amdgcn-amd-amdhsa -mcpu=gfx900 -mattr=-xnack --amdgcn-new-target-id -filetype=obj < %s \| llvm-readobj --file-headers - \| FileCheck --check-prefixes=ELF %s

				; ASM: .amdgcn_target "amdgcn-amd-amdhsa--gfx900:xnack-"
				; ASM: amdhsa.target: 'amdgcn-amd-amdhsa--gfx900:xnack-'
				; ELF: Flags [ (0x62C)
				; ELF: EF_AMDGPU_FEATURE_SRAMECC_DEFAULT (0x400)
				; ELF: EF_AMDGPU_FEATURE_XNACK_OFF (0x200)
				; ELF: EF_AMDGPU_MACH_AMDGCN_GFX900 (0x2C)
				; ELF: ]

				define amdgpu_kernel void @empty() {
				entry:
				ret void
				}

				!0 = !{ i32 8, !"target-id", !"amdgcn-amd-amdhsa--gfx900:xnack-" }
				!llvm.module.flags = !{ !0 }

llvm/test/CodeGen/AMDGPU/tid-xnack-off-sramecc-off.ll

This file was added.

				; RUN: llc -mtriple=amdgcn-amd-amdhsa -mcpu=gfx900 -mattr=-xnack,-sram-ecc --amdgcn-new-target-id < %s \| FileCheck --check-prefixes=ASM %s
				; RUN: llc -mtriple=amdgcn-amd-amdhsa -mcpu=gfx900 -mattr=-xnack,-sram-ecc --amdgcn-new-target-id -filetype=obj < %s \| llvm-readobj --file-headers - \| FileCheck --check-prefixes=ELF %s

				; ASM: .amdgcn_target "amdgcn-amd-amdhsa--gfx900:xnack-:sramecc-"
				; ASM: amdhsa.target: 'amdgcn-amd-amdhsa--gfx900:xnack-:sramecc-'
				; ELF: Flags [ (0xA2C)
				; ELF: EF_AMDGPU_FEATURE_SRAMECC_OFF (0x800)
				; ELF: EF_AMDGPU_FEATURE_XNACK_OFF (0x200)
				; ELF: EF_AMDGPU_MACH_AMDGCN_GFX900 (0x2C)
				; ELF: ]

				define amdgpu_kernel void @empty() {
				entry:
				ret void
				}

				!0 = !{ i32 8, !"target-id", !"amdgcn-amd-amdhsa--gfx900:xnack-:sramecc-" }
				!llvm.module.flags = !{ !0 }

llvm/test/CodeGen/AMDGPU/tid-xnack-off-sramecc-on.ll

This file was added.

				; RUN: llc -mtriple=amdgcn-amd-amdhsa -mcpu=gfx900 -mattr=-xnack,+sram-ecc --amdgcn-new-target-id < %s \| FileCheck --check-prefixes=ASM %s
				; RUN: llc -mtriple=amdgcn-amd-amdhsa -mcpu=gfx900 -mattr=-xnack,+sram-ecc --amdgcn-new-target-id -filetype=obj < %s \| llvm-readobj --file-headers - \| FileCheck --check-prefixes=ELF %s

				; ASM: .amdgcn_target "amdgcn-amd-amdhsa--gfx900:xnack-:sramecc+"
				; ASM: amdhsa.target: 'amdgcn-amd-amdhsa--gfx900:xnack-:sramecc+'
				; ELF: Flags [ (0xE2C)
				; ELF: EF_AMDGPU_FEATURE_SRAMECC_ON (0xC00)
				; ELF: EF_AMDGPU_FEATURE_XNACK_OFF (0x200)
				; ELF: EF_AMDGPU_MACH_AMDGCN_GFX900 (0x2C)
				; ELF: ]

				define amdgpu_kernel void @empty() {
				entry:
				ret void
				}

				!0 = !{ i32 8, !"target-id", !"amdgcn-amd-amdhsa--gfx900:xnack-:sramecc+" }
				!llvm.module.flags = !{ !0 }

llvm/test/CodeGen/AMDGPU/tid-xnack-on-sramecc-default.ll

This file was added.

				; RUN: llc -mtriple=amdgcn-amd-amdhsa -mcpu=gfx900 -mattr=+xnack --amdgcn-new-target-id < %s \| FileCheck --check-prefixes=ASM %s
				; RUN: llc -mtriple=amdgcn-amd-amdhsa -mcpu=gfx900 -mattr=+xnack --amdgcn-new-target-id -filetype=obj < %s \| llvm-readobj --file-headers - \| FileCheck --check-prefixes=ELF %s

				; ASM: .amdgcn_target "amdgcn-amd-amdhsa--gfx900:xnack+"
				; ASM: amdhsa.target: 'amdgcn-amd-amdhsa--gfx900:xnack+'
				; ELF: Flags [ (0x72C)
				; ELF: EF_AMDGPU_FEATURE_SRAMECC_DEFAULT (0x400)
				; ELF: EF_AMDGPU_FEATURE_XNACK_ON (0x300)
				; ELF: EF_AMDGPU_MACH_AMDGCN_GFX900 (0x2C)
				; ELF: ]

				define amdgpu_kernel void @empty() {
				entry:
				ret void
				}

				!0 = !{ i32 8, !"target-id", !"amdgcn-amd-amdhsa--gfx900:xnack+" }
				!llvm.module.flags = !{ !0 }

llvm/test/CodeGen/AMDGPU/tid-xnack-on-sramecc-off.ll

This file was added.

				; RUN: llc -mtriple=amdgcn-amd-amdhsa -mcpu=gfx900 -mattr=+xnack,-sram-ecc --amdgcn-new-target-id < %s \| FileCheck --check-prefixes=ASM %s
				; RUN: llc -mtriple=amdgcn-amd-amdhsa -mcpu=gfx900 -mattr=+xnack,-sram-ecc --amdgcn-new-target-id -filetype=obj < %s \| llvm-readobj --file-headers - \| FileCheck --check-prefixes=ELF %s

				; ASM: .amdgcn_target "amdgcn-amd-amdhsa--gfx900:xnack+:sramecc-"
				; ASM: amdhsa.target: 'amdgcn-amd-amdhsa--gfx900:xnack+:sramecc-'
				; ELF: Flags [ (0xB2C)
				; ELF: EF_AMDGPU_FEATURE_SRAMECC_OFF (0x800)
				; ELF: EF_AMDGPU_FEATURE_XNACK_ON (0x300)
				; ELF: EF_AMDGPU_MACH_AMDGCN_GFX900 (0x2C)
				; ELF: ]

				define amdgpu_kernel void @empty() {
				entry:
				ret void
				}

				!0 = !{ i32 8, !"target-id", !"amdgcn-amd-amdhsa--gfx900:xnack+:sramecc-" }
				!llvm.module.flags = !{ !0 }

llvm/test/CodeGen/AMDGPU/tid-xnack-on-sramecc-on.ll

This file was added.

				; RUN: llc -mtriple=amdgcn-amd-amdhsa -mcpu=gfx900 -mattr=+xnack,+sram-ecc --amdgcn-new-target-id < %s \| FileCheck --check-prefixes=ASM %s
				; RUN: llc -mtriple=amdgcn-amd-amdhsa -mcpu=gfx900 -mattr=+xnack,+sram-ecc --amdgcn-new-target-id -filetype=obj < %s \| llvm-readobj --file-headers - \| FileCheck --check-prefixes=ELF %s

				; ASM: .amdgcn_target "amdgcn-amd-amdhsa--gfx900:xnack+:sramecc+"
				; ASM: amdhsa.target: 'amdgcn-amd-amdhsa--gfx900:xnack+:sramecc+'
				; ELF: Flags [ (0xF2C)
				; ELF: EF_AMDGPU_FEATURE_SRAMECC_ON (0xC00)
				; ELF: EF_AMDGPU_FEATURE_XNACK_ON (0x300)
				; ELF: EF_AMDGPU_MACH_AMDGCN_GFX900 (0x2C)
				; ELF: ]

				define amdgpu_kernel void @empty() {
				entry:
				ret void
				}

				!0 = !{ i32 8, !"target-id", !"amdgcn-amd-amdhsa--gfx900:xnack+:sramecc+" }
				!llvm.module.flags = !{ !0 }

llvm/test/MC/AMDGPU/tid-incompatible-sti-1.s

This file was added.

				// RUN: not llvm-mc --triple=amdgcn-amd-amdhsa -mcpu=gfx900 --amdgcn-new-target-id %s 2>&1 \| FileCheck %s

				// CHECK: error: target must match options

				.amdgcn_target "amdgcn-amd-amdhsa--gfx803"
				.text

llvm/test/MC/AMDGPU/tid-incompatible-sti-2.s

This file was added.

				// RUN: not llvm-mc --triple=amdgcn-amd-amdhsa -mcpu=gfx900 --amdgcn-new-target-id %s 2>&1 \| FileCheck %s

				// CHECK: error: target must match options

				.amdgcn_target "amdgcn-amd-amdhsa--gfx900:xnack+:sramecc+"
				.text

llvm/test/MC/AMDGPU/tid-none.s

This file was added.

				// RUN: llvm-mc --triple=amdgcn-amd-amdhsa -mcpu=gfx900 --amdgcn-new-target-id %s \| FileCheck --check-prefixes=ASM %s
				// RUN: llvm-mc --triple=amdgcn-amd-amdhsa -mcpu=gfx900 --amdgcn-new-target-id -filetype=obj %s \| llvm-readobj --file-headers - \|FileCheck --check-prefixes=ELF %s

				// ASM-NOT: .amdgcn_target
				// ELF: Flags [ (0x52C)
				// ELF: EF_AMDGPU_FEATURE_SRAMECC_DEFAULT (0x400)
				// ELF: EF_AMDGPU_FEATURE_XNACK_DEFAULT (0x100)
				// ELF: EF_AMDGPU_MACH_AMDGCN_GFX900 (0x2C)
				// ELF: ]

				.text

llvm/test/MC/AMDGPU/tid-xnack-default-sramecc-default.s

This file was added.

				// RUN: llvm-mc --triple=amdgcn-amd-amdhsa -mcpu=gfx900 --amdgcn-new-target-id %s \| FileCheck --check-prefixes=ASM %s
				// RUN: llvm-mc --triple=amdgcn-amd-amdhsa -mcpu=gfx900 --amdgcn-new-target-id -filetype=obj %s \| llvm-readobj --file-headers - \|FileCheck --check-prefixes=ELF %s

				// ASM: .amdgcn_target "amdgcn-amd-amdhsa--gfx900"
				// ELF: Flags [ (0x52C)
				// ELF: EF_AMDGPU_FEATURE_SRAMECC_DEFAULT (0x400)
				// ELF: EF_AMDGPU_FEATURE_XNACK_DEFAULT (0x100)
				// ELF: EF_AMDGPU_MACH_AMDGCN_GFX900 (0x2C)
				// ELF: ]

				.amdgcn_target "amdgcn-amd-amdhsa--gfx900"
				.text

llvm/test/MC/AMDGPU/tid-xnack-default-sramecc-off.s

This file was added.

				// RUN: llvm-mc --triple=amdgcn-amd-amdhsa -mcpu=gfx900 --mattr=-sram-ecc --amdgcn-new-target-id %s \| FileCheck --check-prefixes=ASM %s
				// RUN: llvm-mc --triple=amdgcn-amd-amdhsa -mcpu=gfx900 --mattr=-sram-ecc --amdgcn-new-target-id -filetype=obj %s \| llvm-readobj --file-headers - \|FileCheck --check-prefixes=ELF %s

				// ASM: .amdgcn_target "amdgcn-amd-amdhsa--gfx900:sramecc-"
				// ELF: Flags [ (0x92C)
				// ELF: EF_AMDGPU_FEATURE_SRAMECC_OFF (0x800)
				// ELF: EF_AMDGPU_FEATURE_XNACK_DEFAULT (0x100)
				// ELF: EF_AMDGPU_MACH_AMDGCN_GFX900 (0x2C)
				// ELF: ]

				.amdgcn_target "amdgcn-amd-amdhsa--gfx900:sramecc-"
				.text

llvm/test/MC/AMDGPU/tid-xnack-default-sramecc-on.s

This file was added.

				// RUN: llvm-mc --triple=amdgcn-amd-amdhsa -mcpu=gfx900 --mattr=+sram-ecc --amdgcn-new-target-id %s \| FileCheck --check-prefixes=ASM %s
				// RUN: llvm-mc --triple=amdgcn-amd-amdhsa -mcpu=gfx900 --mattr=+sram-ecc --amdgcn-new-target-id -filetype=obj %s \| llvm-readobj --file-headers - \|FileCheck --check-prefixes=ELF %s

				// ASM: .amdgcn_target "amdgcn-amd-amdhsa--gfx900:sramecc+"
				// ELF: Flags [ (0xD2C)
				// ELF: EF_AMDGPU_FEATURE_SRAMECC_ON (0xC00)
				// ELF: EF_AMDGPU_FEATURE_XNACK_DEFAULT (0x100)
				// ELF: EF_AMDGPU_MACH_AMDGCN_GFX900 (0x2C)
				// ELF: ]

				.amdgcn_target "amdgcn-amd-amdhsa--gfx900:sramecc+"
				.text

llvm/test/MC/AMDGPU/tid-xnack-off-sramecc-default.s

This file was added.

				// RUN: llvm-mc --triple=amdgcn-amd-amdhsa -mcpu=gfx900 --mattr=-xnack --amdgcn-new-target-id %s \| FileCheck --check-prefixes=ASM %s
				// RUN: llvm-mc --triple=amdgcn-amd-amdhsa -mcpu=gfx900 --mattr=-xnack --amdgcn-new-target-id -filetype=obj %s \| llvm-readobj --file-headers - \|FileCheck --check-prefixes=ELF %s

				// ASM: .amdgcn_target "amdgcn-amd-amdhsa--gfx900:xnack-"
				// ELF: Flags [ (0x62C)
				// ELF: EF_AMDGPU_FEATURE_SRAMECC_DEFAULT (0x400)
				// ELF: EF_AMDGPU_FEATURE_XNACK_OFF (0x200)
				// ELF: EF_AMDGPU_MACH_AMDGCN_GFX900 (0x2C)
				// ELF: ]

				.amdgcn_target "amdgcn-amd-amdhsa--gfx900:xnack-"
				.text

llvm/test/MC/AMDGPU/tid-xnack-off-sramecc-off.s

This file was added.

				// RUN: llvm-mc --triple=amdgcn-amd-amdhsa -mcpu=gfx900 --mattr=-xnack,-sram-ecc --amdgcn-new-target-id %s \| FileCheck --check-prefixes=ASM %s
				// RUN: llvm-mc --triple=amdgcn-amd-amdhsa -mcpu=gfx900 --mattr=-xnack,-sram-ecc --amdgcn-new-target-id -filetype=obj %s \| llvm-readobj --file-headers - \|FileCheck --check-prefixes=ELF %s

				// ASM: .amdgcn_target "amdgcn-amd-amdhsa--gfx900:xnack-:sramecc-"
				// ELF: Flags [ (0xA2C)
				// ELF: EF_AMDGPU_FEATURE_SRAMECC_OFF (0x800)
				// ELF: EF_AMDGPU_FEATURE_XNACK_OFF (0x200)
				// ELF: EF_AMDGPU_MACH_AMDGCN_GFX900 (0x2C)
				// ELF: ]

				.amdgcn_target "amdgcn-amd-amdhsa--gfx900:xnack-:sramecc-"
				.text

llvm/test/MC/AMDGPU/tid-xnack-off-sramecc-on.s

This file was added.

				// RUN: llvm-mc --triple=amdgcn-amd-amdhsa -mcpu=gfx900 --mattr=-xnack,+sram-ecc --amdgcn-new-target-id %s \| FileCheck --check-prefixes=ASM %s
				// RUN: llvm-mc --triple=amdgcn-amd-amdhsa -mcpu=gfx900 --mattr=-xnack,+sram-ecc --amdgcn-new-target-id -filetype=obj %s \| llvm-readobj --file-headers - \|FileCheck --check-prefixes=ELF %s

				// ASM: .amdgcn_target "amdgcn-amd-amdhsa--gfx900:xnack-:sramecc+"
				// ELF: Flags [ (0xE2C)
				// ELF: EF_AMDGPU_FEATURE_SRAMECC_ON (0xC00)
				// ELF: EF_AMDGPU_FEATURE_XNACK_OFF (0x200)
				// ELF: EF_AMDGPU_MACH_AMDGCN_GFX900 (0x2C)
				// ELF: ]

				.amdgcn_target "amdgcn-amd-amdhsa--gfx900:xnack-:sramecc+"
				.text

llvm/test/MC/AMDGPU/tid-xnack-on-sramecc-default.s

This file was added.

				// RUN: llvm-mc --triple=amdgcn-amd-amdhsa -mcpu=gfx900 --mattr=+xnack --amdgcn-new-target-id %s \| FileCheck --check-prefixes=ASM %s
				// RUN: llvm-mc --triple=amdgcn-amd-amdhsa -mcpu=gfx900 --mattr=+xnack --amdgcn-new-target-id -filetype=obj %s \| llvm-readobj --file-headers - \|FileCheck --check-prefixes=ELF %s

				// ASM: .amdgcn_target "amdgcn-amd-amdhsa--gfx900:xnack+"
				// ELF: Flags [ (0x72C)
				// ELF: EF_AMDGPU_FEATURE_SRAMECC_DEFAULT (0x400)
				// ELF: EF_AMDGPU_FEATURE_XNACK_ON (0x300)
				// ELF: EF_AMDGPU_MACH_AMDGCN_GFX900 (0x2C)
				// ELF: ]

				.amdgcn_target "amdgcn-amd-amdhsa--gfx900:xnack+"
				.text

llvm/test/MC/AMDGPU/tid-xnack-on-sramecc-off.s

This file was added.

				// RUN: llvm-mc --triple=amdgcn-amd-amdhsa -mcpu=gfx900 --mattr=+xnack,-sram-ecc --amdgcn-new-target-id %s \| FileCheck --check-prefixes=ASM %s
				// RUN: llvm-mc --triple=amdgcn-amd-amdhsa -mcpu=gfx900 --mattr=+xnack,-sram-ecc --amdgcn-new-target-id -filetype=obj %s \| llvm-readobj --file-headers - \|FileCheck --check-prefixes=ELF %s

				// ASM: .amdgcn_target "amdgcn-amd-amdhsa--gfx900:xnack+:sramecc-"
				// ELF: Flags [ (0xB2C)
				// ELF: EF_AMDGPU_FEATURE_SRAMECC_OFF (0x800)
				// ELF: EF_AMDGPU_FEATURE_XNACK_ON (0x300)
				// ELF: EF_AMDGPU_MACH_AMDGCN_GFX900 (0x2C)
				// ELF: ]

				.amdgcn_target "amdgcn-amd-amdhsa--gfx900:xnack+:sramecc-"
				.text

llvm/test/MC/AMDGPU/tid-xnack-on-sramecc-on.s

This file was added.

				// RUN: llvm-mc --triple=amdgcn-amd-amdhsa -mcpu=gfx900 --mattr=+xnack,+sram-ecc --amdgcn-new-target-id %s \| FileCheck --check-prefixes=ASM %s
				// RUN: llvm-mc --triple=amdgcn-amd-amdhsa -mcpu=gfx900 --mattr=+xnack,+sram-ecc --amdgcn-new-target-id -filetype=obj %s \| llvm-readobj --file-headers - \|FileCheck --check-prefixes=ELF %s

				// ASM: .amdgcn_target "amdgcn-amd-amdhsa--gfx900:xnack+:sramecc+"
				// ELF: Flags [ (0xF2C)
				// ELF: EF_AMDGPU_FEATURE_SRAMECC_ON (0xC00)
				// ELF: EF_AMDGPU_FEATURE_XNACK_ON (0x300)
				// ELF: EF_AMDGPU_MACH_AMDGCN_GFX900 (0x2C)
				// ELF: ]

				.amdgcn_target "amdgcn-amd-amdhsa--gfx900:xnack+:sramecc+"
				.text

llvm/tools/llvm-readobj/ELFDumper.cpp

Show First 20 Lines • Show All 1,753 Lines • ▼ Show 20 Lines	static const EnumEntry<unsigned> ElfHeaderMipsFlags[] = {
ENUM_ENT(EF_MIPS_ARCH_32, "mips32"),		ENUM_ENT(EF_MIPS_ARCH_32, "mips32"),
ENUM_ENT(EF_MIPS_ARCH_64, "mips64"),		ENUM_ENT(EF_MIPS_ARCH_64, "mips64"),
ENUM_ENT(EF_MIPS_ARCH_32R2, "mips32r2"),		ENUM_ENT(EF_MIPS_ARCH_32R2, "mips32r2"),
ENUM_ENT(EF_MIPS_ARCH_64R2, "mips64r2"),		ENUM_ENT(EF_MIPS_ARCH_64R2, "mips64r2"),
ENUM_ENT(EF_MIPS_ARCH_32R6, "mips32r6"),		ENUM_ENT(EF_MIPS_ARCH_32R6, "mips32r6"),
ENUM_ENT(EF_MIPS_ARCH_64R6, "mips64r6")		ENUM_ENT(EF_MIPS_ARCH_64R6, "mips64r6")
};		};

static const EnumEntry<unsigned> ElfHeaderAMDGPUFlags[] = {		static const EnumEntry<unsigned> ElfHeaderAMDGPUFlagsABIVersion01[] = {
LLVM_READOBJ_ENUM_ENT(ELF, EF_AMDGPU_MACH_NONE),		LLVM_READOBJ_ENUM_ENT(ELF, EF_AMDGPU_MACH_NONE),
LLVM_READOBJ_ENUM_ENT(ELF, EF_AMDGPU_MACH_R600_R600),		LLVM_READOBJ_ENUM_ENT(ELF, EF_AMDGPU_MACH_R600_R600),
LLVM_READOBJ_ENUM_ENT(ELF, EF_AMDGPU_MACH_R600_R630),		LLVM_READOBJ_ENUM_ENT(ELF, EF_AMDGPU_MACH_R600_R630),
LLVM_READOBJ_ENUM_ENT(ELF, EF_AMDGPU_MACH_R600_RS880),		LLVM_READOBJ_ENUM_ENT(ELF, EF_AMDGPU_MACH_R600_RS880),
LLVM_READOBJ_ENUM_ENT(ELF, EF_AMDGPU_MACH_R600_RV670),		LLVM_READOBJ_ENUM_ENT(ELF, EF_AMDGPU_MACH_R600_RV670),
LLVM_READOBJ_ENUM_ENT(ELF, EF_AMDGPU_MACH_R600_RV710),		LLVM_READOBJ_ENUM_ENT(ELF, EF_AMDGPU_MACH_R600_RV710),
LLVM_READOBJ_ENUM_ENT(ELF, EF_AMDGPU_MACH_R600_RV730),		LLVM_READOBJ_ENUM_ENT(ELF, EF_AMDGPU_MACH_R600_RV730),
LLVM_READOBJ_ENUM_ENT(ELF, EF_AMDGPU_MACH_R600_RV770),		LLVM_READOBJ_ENUM_ENT(ELF, EF_AMDGPU_MACH_R600_RV770),
Show All 25 Lines	static const EnumEntry<unsigned> ElfHeaderAMDGPUFlagsABIVersion01[] = {
LLVM_READOBJ_ENUM_ENT(ELF, EF_AMDGPU_MACH_AMDGCN_GFX909),		LLVM_READOBJ_ENUM_ENT(ELF, EF_AMDGPU_MACH_AMDGCN_GFX909),
LLVM_READOBJ_ENUM_ENT(ELF, EF_AMDGPU_MACH_AMDGCN_GFX1010),		LLVM_READOBJ_ENUM_ENT(ELF, EF_AMDGPU_MACH_AMDGCN_GFX1010),
LLVM_READOBJ_ENUM_ENT(ELF, EF_AMDGPU_MACH_AMDGCN_GFX1011),		LLVM_READOBJ_ENUM_ENT(ELF, EF_AMDGPU_MACH_AMDGCN_GFX1011),
LLVM_READOBJ_ENUM_ENT(ELF, EF_AMDGPU_MACH_AMDGCN_GFX1012),		LLVM_READOBJ_ENUM_ENT(ELF, EF_AMDGPU_MACH_AMDGCN_GFX1012),
LLVM_READOBJ_ENUM_ENT(ELF, EF_AMDGPU_XNACK),		LLVM_READOBJ_ENUM_ENT(ELF, EF_AMDGPU_XNACK),
LLVM_READOBJ_ENUM_ENT(ELF, EF_AMDGPU_SRAM_ECC)		LLVM_READOBJ_ENUM_ENT(ELF, EF_AMDGPU_SRAM_ECC)
};		};

		static const EnumEntry<unsigned> ElfHeaderAMDGPUFlagsABIVersion2[] = {
		LLVM_READOBJ_ENUM_ENT(ELF, EF_AMDGPU_MACH_NONE),
		LLVM_READOBJ_ENUM_ENT(ELF, EF_AMDGPU_MACH_R600_R600),
		LLVM_READOBJ_ENUM_ENT(ELF, EF_AMDGPU_MACH_R600_R630),
		LLVM_READOBJ_ENUM_ENT(ELF, EF_AMDGPU_MACH_R600_RS880),
		LLVM_READOBJ_ENUM_ENT(ELF, EF_AMDGPU_MACH_R600_RV670),
		LLVM_READOBJ_ENUM_ENT(ELF, EF_AMDGPU_MACH_R600_RV710),
		LLVM_READOBJ_ENUM_ENT(ELF, EF_AMDGPU_MACH_R600_RV730),
		LLVM_READOBJ_ENUM_ENT(ELF, EF_AMDGPU_MACH_R600_RV770),
		LLVM_READOBJ_ENUM_ENT(ELF, EF_AMDGPU_MACH_R600_CEDAR),
		LLVM_READOBJ_ENUM_ENT(ELF, EF_AMDGPU_MACH_R600_CYPRESS),
		LLVM_READOBJ_ENUM_ENT(ELF, EF_AMDGPU_MACH_R600_JUNIPER),
		LLVM_READOBJ_ENUM_ENT(ELF, EF_AMDGPU_MACH_R600_REDWOOD),
		LLVM_READOBJ_ENUM_ENT(ELF, EF_AMDGPU_MACH_R600_SUMO),
		LLVM_READOBJ_ENUM_ENT(ELF, EF_AMDGPU_MACH_R600_BARTS),
		LLVM_READOBJ_ENUM_ENT(ELF, EF_AMDGPU_MACH_R600_CAICOS),
		LLVM_READOBJ_ENUM_ENT(ELF, EF_AMDGPU_MACH_R600_CAYMAN),
		LLVM_READOBJ_ENUM_ENT(ELF, EF_AMDGPU_MACH_R600_TURKS),
		LLVM_READOBJ_ENUM_ENT(ELF, EF_AMDGPU_MACH_AMDGCN_GFX600),
		LLVM_READOBJ_ENUM_ENT(ELF, EF_AMDGPU_MACH_AMDGCN_GFX601),
		LLVM_READOBJ_ENUM_ENT(ELF, EF_AMDGPU_MACH_AMDGCN_GFX700),
		LLVM_READOBJ_ENUM_ENT(ELF, EF_AMDGPU_MACH_AMDGCN_GFX701),
		LLVM_READOBJ_ENUM_ENT(ELF, EF_AMDGPU_MACH_AMDGCN_GFX702),
		LLVM_READOBJ_ENUM_ENT(ELF, EF_AMDGPU_MACH_AMDGCN_GFX703),
		LLVM_READOBJ_ENUM_ENT(ELF, EF_AMDGPU_MACH_AMDGCN_GFX704),
		LLVM_READOBJ_ENUM_ENT(ELF, EF_AMDGPU_MACH_AMDGCN_GFX801),
		LLVM_READOBJ_ENUM_ENT(ELF, EF_AMDGPU_MACH_AMDGCN_GFX802),
		LLVM_READOBJ_ENUM_ENT(ELF, EF_AMDGPU_MACH_AMDGCN_GFX803),
		LLVM_READOBJ_ENUM_ENT(ELF, EF_AMDGPU_MACH_AMDGCN_GFX810),
		LLVM_READOBJ_ENUM_ENT(ELF, EF_AMDGPU_MACH_AMDGCN_GFX900),
		LLVM_READOBJ_ENUM_ENT(ELF, EF_AMDGPU_MACH_AMDGCN_GFX902),
		LLVM_READOBJ_ENUM_ENT(ELF, EF_AMDGPU_MACH_AMDGCN_GFX904),
		LLVM_READOBJ_ENUM_ENT(ELF, EF_AMDGPU_MACH_AMDGCN_GFX906),
		LLVM_READOBJ_ENUM_ENT(ELF, EF_AMDGPU_MACH_AMDGCN_GFX908),
		LLVM_READOBJ_ENUM_ENT(ELF, EF_AMDGPU_MACH_AMDGCN_GFX909),
		LLVM_READOBJ_ENUM_ENT(ELF, EF_AMDGPU_MACH_AMDGCN_GFX1010),
		LLVM_READOBJ_ENUM_ENT(ELF, EF_AMDGPU_MACH_AMDGCN_GFX1011),
		LLVM_READOBJ_ENUM_ENT(ELF, EF_AMDGPU_MACH_AMDGCN_GFX1012),
		LLVM_READOBJ_ENUM_ENT(ELF, EF_AMDGPU_FEATURE_XNACK_DEFAULT),
		LLVM_READOBJ_ENUM_ENT(ELF, EF_AMDGPU_FEATURE_XNACK_OFF),
		LLVM_READOBJ_ENUM_ENT(ELF, EF_AMDGPU_FEATURE_XNACK_ON),
		LLVM_READOBJ_ENUM_ENT(ELF, EF_AMDGPU_FEATURE_SRAMECC_DEFAULT),
		LLVM_READOBJ_ENUM_ENT(ELF, EF_AMDGPU_FEATURE_SRAMECC_OFF),
		LLVM_READOBJ_ENUM_ENT(ELF, EF_AMDGPU_FEATURE_SRAMECC_ON),
		};

static const EnumEntry<unsigned> ElfHeaderRISCVFlags[] = {		static const EnumEntry<unsigned> ElfHeaderRISCVFlags[] = {
ENUM_ENT(EF_RISCV_RVC, "RVC"),		ENUM_ENT(EF_RISCV_RVC, "RVC"),
ENUM_ENT(EF_RISCV_FLOAT_ABI_SINGLE, "single-float ABI"),		ENUM_ENT(EF_RISCV_FLOAT_ABI_SINGLE, "single-float ABI"),
ENUM_ENT(EF_RISCV_FLOAT_ABI_DOUBLE, "double-float ABI"),		ENUM_ENT(EF_RISCV_FLOAT_ABI_DOUBLE, "double-float ABI"),
ENUM_ENT(EF_RISCV_FLOAT_ABI_QUAD, "quad-float ABI"),		ENUM_ENT(EF_RISCV_FLOAT_ABI_QUAD, "quad-float ABI"),
ENUM_ENT(EF_RISCV_RVE, "RVE")		ENUM_ENT(EF_RISCV_RVE, "RVE")
};		};

▲ Show 20 Lines • Show All 4,125 Lines • ▼ Show 20 Lines	const Elf_Ehdr *E = Obj->getHeader();
W.printNumber("Version", E->e_version);		W.printNumber("Version", E->e_version);
W.printHex("Entry", E->e_entry);		W.printHex("Entry", E->e_entry);
W.printHex("ProgramHeaderOffset", E->e_phoff);		W.printHex("ProgramHeaderOffset", E->e_phoff);
W.printHex("SectionHeaderOffset", E->e_shoff);		W.printHex("SectionHeaderOffset", E->e_shoff);
if (E->e_machine == EM_MIPS)		if (E->e_machine == EM_MIPS)
W.printFlags("Flags", E->e_flags, makeArrayRef(ElfHeaderMipsFlags),		W.printFlags("Flags", E->e_flags, makeArrayRef(ElfHeaderMipsFlags),
unsigned(ELF::EF_MIPS_ARCH), unsigned(ELF::EF_MIPS_ABI),		unsigned(ELF::EF_MIPS_ARCH), unsigned(ELF::EF_MIPS_ABI),
unsigned(ELF::EF_MIPS_MACH));		unsigned(ELF::EF_MIPS_MACH));
else if (E->e_machine == EM_AMDGPU)		else if (E->e_machine == EM_AMDGPU) {
W.printFlags("Flags", E->e_flags, makeArrayRef(ElfHeaderAMDGPUFlags),		if (E->e_ident[EI_ABIVERSION] == 0 \|\| E->e_ident[EI_ABIVERSION] == 1) {
		W.printFlags("Flags", E->e_flags,
		makeArrayRef(ElfHeaderAMDGPUFlagsABIVersion01),
unsigned(ELF::EF_AMDGPU_MACH));		unsigned(ELF::EF_AMDGPU_MACH));
		} else if (E->e_ident[EI_ABIVERSION] == 2) {
		W.printFlags("Flags", E->e_flags,
		makeArrayRef(ElfHeaderAMDGPUFlagsABIVersion2),
		unsigned(ELF::EF_AMDGPU_MACH),
		unsigned(ELF::EF_AMDGPU_FEATURE_XNACK),
		unsigned(ELF::EF_AMDGPU_FEATURE_SRAMECC));
		}
		}
else if (E->e_machine == EM_RISCV)		else if (E->e_machine == EM_RISCV)
W.printFlags("Flags", E->e_flags, makeArrayRef(ElfHeaderRISCVFlags));		W.printFlags("Flags", E->e_flags, makeArrayRef(ElfHeaderRISCVFlags));
else		else
W.printFlags("Flags", E->e_flags);		W.printFlags("Flags", E->e_flags);
W.printNumber("HeaderSize", E->e_ehsize);		W.printNumber("HeaderSize", E->e_ehsize);
W.printNumber("ProgramHeaderEntrySize", E->e_phentsize);		W.printNumber("ProgramHeaderEntrySize", E->e_phentsize);
W.printNumber("ProgramHeaderCount", E->e_phnum);		W.printNumber("ProgramHeaderCount", E->e_phnum);
W.printNumber("SectionHeaderEntrySize", E->e_shentsize);		W.printNumber("SectionHeaderEntrySize", E->e_shentsize);
▲ Show 20 Lines • Show All 917 Lines • Show Last 20 Lines

This is an archive of the discontinued LLVM Phabricator instance.

AMDGPU/AMDHSA: Implement new target ID support in AMDGPU backendAbandonedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 270557

llvm/docs/AMDGPUUsage.rst

llvm/include/llvm/BinaryFormat/ELF.h

llvm/lib/ObjectYAML/ELFYAML.cpp

llvm/lib/Target/AMDGPU/AMDGPUAsmPrinter.cpp

llvm/lib/Target/AMDGPU/AMDGPUHSAMetadataStreamer.h

llvm/lib/Target/AMDGPU/AMDGPUHSAMetadataStreamer.cpp

llvm/lib/Target/AMDGPU/AMDGPUMachineModuleInfo.h

llvm/lib/Target/AMDGPU/AMDGPUMachineModuleInfo.cpp

llvm/lib/Target/AMDGPU/AsmParser/AMDGPUAsmParser.cpp

llvm/lib/Target/AMDGPU/MCTargetDesc/AMDGPUAsmBackend.cpp

llvm/lib/Target/AMDGPU/MCTargetDesc/AMDGPUTargetStreamer.h

llvm/lib/Target/AMDGPU/MCTargetDesc/AMDGPUTargetStreamer.cpp

llvm/lib/Target/AMDGPU/Utils/AMDGPUBaseInfo.h

llvm/lib/Target/AMDGPU/Utils/AMDGPUBaseInfo.cpp

llvm/test/CodeGen/AMDGPU/tid-incompatible-sti-1.ll

llvm/test/CodeGen/AMDGPU/tid-incompatible-sti-2.ll

llvm/test/CodeGen/AMDGPU/tid-none.ll

llvm/test/CodeGen/AMDGPU/tid-xnack-default-sramecc-default.ll

llvm/test/CodeGen/AMDGPU/tid-xnack-default-sramecc-off.ll

llvm/test/CodeGen/AMDGPU/tid-xnack-default-sramecc-on.ll

llvm/test/CodeGen/AMDGPU/tid-xnack-off-sramecc-default.ll

llvm/test/CodeGen/AMDGPU/tid-xnack-off-sramecc-off.ll

llvm/test/CodeGen/AMDGPU/tid-xnack-off-sramecc-on.ll

llvm/test/CodeGen/AMDGPU/tid-xnack-on-sramecc-default.ll

llvm/test/CodeGen/AMDGPU/tid-xnack-on-sramecc-off.ll

llvm/test/CodeGen/AMDGPU/tid-xnack-on-sramecc-on.ll

llvm/test/MC/AMDGPU/tid-incompatible-sti-1.s

llvm/test/MC/AMDGPU/tid-incompatible-sti-2.s

llvm/test/MC/AMDGPU/tid-none.s

llvm/test/MC/AMDGPU/tid-xnack-default-sramecc-default.s

llvm/test/MC/AMDGPU/tid-xnack-default-sramecc-off.s

llvm/test/MC/AMDGPU/tid-xnack-default-sramecc-on.s

llvm/test/MC/AMDGPU/tid-xnack-off-sramecc-default.s

llvm/test/MC/AMDGPU/tid-xnack-off-sramecc-off.s

llvm/test/MC/AMDGPU/tid-xnack-off-sramecc-on.s

llvm/test/MC/AMDGPU/tid-xnack-on-sramecc-default.s

llvm/test/MC/AMDGPU/tid-xnack-on-sramecc-off.s

llvm/test/MC/AMDGPU/tid-xnack-on-sramecc-on.s

llvm/tools/llvm-readobj/ELFDumper.cpp

AMDGPU/AMDHSA: Implement new target ID support in AMDGPU backend
AbandonedPublic