This is an archive of the discontinued LLVM Phabricator instance.

[AMDGPU][MC][GFX9] Corrected encoding of ttmp registers, disabled tba/tma
ClosedPublic

Authored by dp on Dec 8 2017, 6:58 AM.

Download Raw Diff

Details

Reviewers

vpykhtin
artem.tamazov
arsenm

Commits

rGac2b02643b2d: [AMDGPU][MC][GFX9] Corrected encoding of ttmp registers, disabled tba/tma
rL320375: [AMDGPU][MC][GFX9] Corrected encoding of ttmp registers, disabled tba/tma

Summary

See bugs 35494 and 35559:

https://bugs.llvm.org/show_bug.cgi?id=35494
https://bugs.llvm.org/show_bug.cgi?id=35559

There is a related issue: 256- and 512-bit ttmp tuples are not supported (bug 35561).
This issue will be addressed separately.

Diff Detail

Repository: rL LLVM

Event Timeline

dp created this revision.Dec 8 2017, 6:58 AM

Herald added subscribers: t-tye, tpr, dstuttard and 4 others. · View Herald TranscriptDec 8 2017, 6:58 AM

Very good, but looks like some minor fixes are needed.

lib/Target/AMDGPU/Disassembler/AMDGPUDisassembler.cpp
636 ↗	(On Diff #126138)	I do not think we should assert here for Gfx9. Just "break" looks enough.
662 ↗	(On Diff #126138)	Ditto.

This revision now requires changes to proceed.Dec 8 2017, 7:35 AM

dp added inline comments.Dec 8 2017, 7:46 AM

lib/Target/AMDGPU/Disassembler/AMDGPUDisassembler.cpp
636 ↗	(On Diff #126138)	I assert'ed these lines because they are not reachable in the current implementation (ttmp registers are handled first). An assert will be helpful to make sure future changes take into account this assumption. Do you suggest to replace asserts with breaks? case 108: if (isGFX9()) break; else return createRegOperand(TBA_LO); I do not see why this code is better. It will hide real problem.

artem.tamazov added inline comments.Dec 8 2017, 7:50 AM

lib/Target/AMDGPU/Disassembler/AMDGPUDisassembler.cpp
636 ↗	(On Diff #126138)	Is it so that disassembler shall never hit this place with Gfx9 target?

dp added inline comments.Dec 8 2017, 7:51 AM

lib/Target/AMDGPU/Disassembler/AMDGPUDisassembler.cpp
636 ↗	(On Diff #126138)	Should we just delete assert's? This looks acceptable.
636 ↗	(On Diff #126138)	Exactly

artem.tamazov added inline comments.Dec 8 2017, 7:57 AM

lib/Target/AMDGPU/Disassembler/AMDGPUDisassembler.cpp
636 ↗	(On Diff #126138)	I would even say this is valid. Otherwise the reader (like me) may get that false impression that dasm may hit this place of code for Gfx9. BTW how Gfx9 dasm handles this? s_add_u32 ttmp4, tba_lo, 4

dp added inline comments.Dec 8 2017, 8:11 AM

lib/Target/AMDGPU/Disassembler/AMDGPUDisassembler.cpp
636 ↗	(On Diff #126138)	tba/tma went away in gfx9; the freed sgpr range is now occupied by ttmp registers. So if ttmp registers are handled first, we never hit tba/tma. Regarding the code s_add_u32 ttmp4, tba_lo, 4 This code will be rejected by the parser. If you compile this for gfx8 and then disassemble for gfx9, the result will be: s_add_u32 ttmp8, ttmp0, 4

artem.tamazov added inline comments.Dec 8 2017, 8:35 AM

lib/Target/AMDGPU/Disassembler/AMDGPUDisassembler.cpp
636 ↗	(On Diff #126138)	I think that cases 108..111 shall be handled for Gfx9 just like "unknown operand", e.g. case 252.

artem.tamazov accepted this revision.Dec 8 2017, 8:37 AM

This revision is now accepted and ready to land.Dec 8 2017, 8:37 AM

Closed by commit rL320375: [AMDGPU][MC][GFX9] Corrected encoding of ttmp registers, disabled tba/tma (authored by dpreobra). · Explain WhyDec 11 2017, 7:24 AM

This revision was automatically updated to reflect the committed changes.

Revision Contents

Path

Size

llvm/

trunk/

lib/

Target/

AMDGPU/

AsmParser/

AMDGPUAsmParser.cpp

19 lines

Disassembler/

AMDGPUDisassembler.h

7 lines

AMDGPUDisassembler.cpp

56 lines

InstPrinter/

AMDGPUInstPrinter.cpp

10 lines

SIDefines.h

8 lines

SIRegisterInfo.cpp

2 lines

SIRegisterInfo.td

49 lines

Utils/

AMDGPUBaseInfo.cpp

88 lines

test/

MC/

AMDGPU/

2 lines

83 lines

2 lines

35 lines

Disassembler/

AMDGPU/

sdwa_gfx9.txt

9 lines

trap_gfx9.txt

109 lines

Diff 126360

llvm/trunk/lib/Target/AMDGPU/AsmParser/AMDGPUAsmParser.cpp

Show First 20 Lines • Show All 2,572 Lines • ▼ Show 20 Lines	bool AMDGPUAsmParser::ParseDirective(AsmToken DirectiveID) {
if (IDVal == PALMD::AssemblerDirective)		if (IDVal == PALMD::AssemblerDirective)
return ParseDirectivePALMetadata();		return ParseDirectivePALMetadata();

return true;		return true;
}		}

bool AMDGPUAsmParser::subtargetHasRegister(const MCRegisterInfo &MRI,		bool AMDGPUAsmParser::subtargetHasRegister(const MCRegisterInfo &MRI,
unsigned RegNo) const {		unsigned RegNo) const {

		for (MCRegAliasIterator R(AMDGPU::TTMP12_TTMP13_TTMP14_TTMP15, &MRI, true);
		R.isValid(); ++R) {
		if (*R == RegNo)
		return isGFX9();
		}

		switch (RegNo) {
		case AMDGPU::TBA:
		case AMDGPU::TBA_LO:
		case AMDGPU::TBA_HI:
		case AMDGPU::TMA:
		case AMDGPU::TMA_LO:
		case AMDGPU::TMA_HI:
		return !isGFX9();
		default:
		break;
		}

if (isCI())		if (isCI())
return true;		return true;

if (isSI()) {		if (isSI()) {
// No flat_scr		// No flat_scr
switch (RegNo) {		switch (RegNo) {
case AMDGPU::FLAT_SCR:		case AMDGPU::FLAT_SCR:
case AMDGPU::FLAT_SCR_LO:		case AMDGPU::FLAT_SCR_LO:
▲ Show 20 Lines • Show All 2,227 Lines • Show Last 20 Lines

llvm/trunk/lib/Target/AMDGPU/Disassembler/AMDGPUDisassembler.h

Show First 20 Lines • Show All 105 Lines • ▼ Show 20 Lines	public:
MCOperand decodeSrcOp(const OpWidthTy Width, unsigned Val) const;		MCOperand decodeSrcOp(const OpWidthTy Width, unsigned Val) const;
MCOperand decodeSpecialReg32(unsigned Val) const;		MCOperand decodeSpecialReg32(unsigned Val) const;
MCOperand decodeSpecialReg64(unsigned Val) const;		MCOperand decodeSpecialReg64(unsigned Val) const;

MCOperand decodeSDWASrc(const OpWidthTy Width, unsigned Val) const;		MCOperand decodeSDWASrc(const OpWidthTy Width, unsigned Val) const;
MCOperand decodeSDWASrc16(unsigned Val) const;		MCOperand decodeSDWASrc16(unsigned Val) const;
MCOperand decodeSDWASrc32(unsigned Val) const;		MCOperand decodeSDWASrc32(unsigned Val) const;
MCOperand decodeSDWAVopcDst(unsigned Val) const;		MCOperand decodeSDWAVopcDst(unsigned Val) const;

		int getTTmpIdx(unsigned Val) const;

		bool isVI() const;
		bool isGFX9() const;
};		};

//===----------------------------------------------------------------------===//		//===----------------------------------------------------------------------===//
// AMDGPUSymbolizer		// AMDGPUSymbolizer
//===----------------------------------------------------------------------===//		//===----------------------------------------------------------------------===//

class AMDGPUSymbolizer : public MCSymbolizer {		class AMDGPUSymbolizer : public MCSymbolizer {
private:		private:
void *DisInfo;		void *DisInfo;
Show All 19 Lines

llvm/trunk/lib/Target/AMDGPU/Disassembler/AMDGPUDisassembler.cpp

Show First 20 Lines • Show All 244 Lines • ▼ Show 20 Lines	DecodeStatus AMDGPUDisassembler::convertSDWAInst(MCInst &MI) const {
if (STI.getFeatureBits()[AMDGPU::FeatureGFX9]) {		if (STI.getFeatureBits()[AMDGPU::FeatureGFX9]) {
if (AMDGPU::getNamedOperandIdx(MI.getOpcode(), AMDGPU::OpName::sdst) != -1)		if (AMDGPU::getNamedOperandIdx(MI.getOpcode(), AMDGPU::OpName::sdst) != -1)
// VOPC - insert clamp		// VOPC - insert clamp
insertNamedMCOperand(MI, MCOperand::createImm(0), AMDGPU::OpName::clamp);		insertNamedMCOperand(MI, MCOperand::createImm(0), AMDGPU::OpName::clamp);
} else if (STI.getFeatureBits()[AMDGPU::FeatureVolcanicIslands]) {		} else if (STI.getFeatureBits()[AMDGPU::FeatureVolcanicIslands]) {
int SDst = AMDGPU::getNamedOperandIdx(MI.getOpcode(), AMDGPU::OpName::sdst);		int SDst = AMDGPU::getNamedOperandIdx(MI.getOpcode(), AMDGPU::OpName::sdst);
if (SDst != -1) {		if (SDst != -1) {
// VOPC - insert VCC register as sdst		// VOPC - insert VCC register as sdst
insertNamedMCOperand(MI, MCOperand::createReg(AMDGPU::VCC),		insertNamedMCOperand(MI, createRegOperand(AMDGPU::VCC),
AMDGPU::OpName::sdst);		AMDGPU::OpName::sdst);
} else {		} else {
// VOP1/2 - insert omod if present in instruction		// VOP1/2 - insert omod if present in instruction
insertNamedMCOperand(MI, MCOperand::createImm(0), AMDGPU::OpName::omod);		insertNamedMCOperand(MI, MCOperand::createImm(0), AMDGPU::OpName::omod);
}		}
}		}
return MCDisassembler::Success;		return MCDisassembler::Success;
}		}
Show All 10 Lines	MCOperand AMDGPUDisassembler::errOperand(unsigned V,

// ToDo: add support for error operands to MCInst.h		// ToDo: add support for error operands to MCInst.h
// return MCOperand::createError(V);		// return MCOperand::createError(V);
return MCOperand();		return MCOperand();
}		}

inline		inline
MCOperand AMDGPUDisassembler::createRegOperand(unsigned int RegId) const {		MCOperand AMDGPUDisassembler::createRegOperand(unsigned int RegId) const {
return MCOperand::createReg(RegId);		return MCOperand::createReg(AMDGPU::getMCReg(RegId, STI));
}		}

inline		inline
MCOperand AMDGPUDisassembler::createRegOperand(unsigned RegClassID,		MCOperand AMDGPUDisassembler::createRegOperand(unsigned RegClassID,
unsigned Val) const {		unsigned Val) const {
const auto& RegCl = AMDGPUMCRegisterClasses[RegClassID];		const auto& RegCl = AMDGPUMCRegisterClasses[RegClassID];
if (Val >= RegCl.getNumRegs())		if (Val >= RegCl.getNumRegs())
return errOperand(Val, Twine(getRegClassName(RegClassID)) +		return errOperand(Val, Twine(getRegClassName(RegClassID)) +
▲ Show 20 Lines • Show All 277 Lines • ▼ Show 20 Lines	unsigned AMDGPUDisassembler::getTtmpClassId(const OpWidthTy Width) const {
case OPW16:		case OPW16:
case OPWV216:		case OPWV216:
return TTMP_32RegClassID;		return TTMP_32RegClassID;
case OPW64: return TTMP_64RegClassID;		case OPW64: return TTMP_64RegClassID;
case OPW128: return TTMP_128RegClassID;		case OPW128: return TTMP_128RegClassID;
}		}
}		}

		int AMDGPUDisassembler::getTTmpIdx(unsigned Val) const {
		using namespace AMDGPU::EncValues;

		unsigned TTmpMin = isGFX9() ? TTMP_GFX9_MIN : TTMP_VI_MIN;
		unsigned TTmpMax = isGFX9() ? TTMP_GFX9_MAX : TTMP_VI_MAX;

		return (TTmpMin <= Val && Val <= TTmpMax)? Val - TTmpMin : -1;
		}

MCOperand AMDGPUDisassembler::decodeSrcOp(const OpWidthTy Width, unsigned Val) const {		MCOperand AMDGPUDisassembler::decodeSrcOp(const OpWidthTy Width, unsigned Val) const {
using namespace AMDGPU::EncValues;		using namespace AMDGPU::EncValues;

assert(Val < 512); // enum9		assert(Val < 512); // enum9

if (VGPR_MIN <= Val && Val <= VGPR_MAX) {		if (VGPR_MIN <= Val && Val <= VGPR_MAX) {
return createRegOperand(getVgprClassId(Width), Val - VGPR_MIN);		return createRegOperand(getVgprClassId(Width), Val - VGPR_MIN);
}		}
if (Val <= SGPR_MAX) {		if (Val <= SGPR_MAX) {
assert(SGPR_MIN == 0); // "SGPR_MIN <= Val" is always true and causes compilation warning.		assert(SGPR_MIN == 0); // "SGPR_MIN <= Val" is always true and causes compilation warning.
return createSRegOperand(getSgprClassId(Width), Val - SGPR_MIN);		return createSRegOperand(getSgprClassId(Width), Val - SGPR_MIN);
}		}
if (TTMP_MIN <= Val && Val <= TTMP_MAX) {
return createSRegOperand(getTtmpClassId(Width), Val - TTMP_MIN);		int TTmpIdx = getTTmpIdx(Val);
		if (TTmpIdx >= 0) {
		return createSRegOperand(getTtmpClassId(Width), TTmpIdx);
}		}

if (INLINE_INTEGER_C_MIN <= Val && Val <= INLINE_INTEGER_C_MAX)		if (INLINE_INTEGER_C_MIN <= Val && Val <= INLINE_INTEGER_C_MAX)
return decodeIntImmed(Val);		return decodeIntImmed(Val);

if (INLINE_FLOATING_C_MIN <= Val && Val <= INLINE_FLOATING_C_MAX)		if (INLINE_FLOATING_C_MIN <= Val && Val <= INLINE_FLOATING_C_MAX)
return decodeFPImmed(Width, Val);		return decodeFPImmed(Width, Val);

Show All 11 Lines	default:
llvm_unreachable("unexpected immediate type");		llvm_unreachable("unexpected immediate type");
}		}
}		}

MCOperand AMDGPUDisassembler::decodeSpecialReg32(unsigned Val) const {		MCOperand AMDGPUDisassembler::decodeSpecialReg32(unsigned Val) const {
using namespace AMDGPU;		using namespace AMDGPU;

switch (Val) {		switch (Val) {
case 102: return createRegOperand(getMCReg(FLAT_SCR_LO, STI));		case 102: return createRegOperand(FLAT_SCR_LO);
case 103: return createRegOperand(getMCReg(FLAT_SCR_HI, STI));		case 103: return createRegOperand(FLAT_SCR_HI);
// ToDo: no support for xnack_mask_lo/_hi register		// ToDo: no support for xnack_mask_lo/_hi register
case 104:		case 104:
case 105: break;		case 105: break;
case 106: return createRegOperand(VCC_LO);		case 106: return createRegOperand(VCC_LO);
case 107: return createRegOperand(VCC_HI);		case 107: return createRegOperand(VCC_HI);
case 108: return createRegOperand(TBA_LO);		case 108: assert(!isGFX9()); return createRegOperand(TBA_LO);
case 109: return createRegOperand(TBA_HI);		case 109: assert(!isGFX9()); return createRegOperand(TBA_HI);
case 110: return createRegOperand(TMA_LO);		case 110: assert(!isGFX9()); return createRegOperand(TMA_LO);
case 111: return createRegOperand(TMA_HI);		case 111: assert(!isGFX9()); return createRegOperand(TMA_HI);
case 124: return createRegOperand(M0);		case 124: return createRegOperand(M0);
case 126: return createRegOperand(EXEC_LO);		case 126: return createRegOperand(EXEC_LO);
case 127: return createRegOperand(EXEC_HI);		case 127: return createRegOperand(EXEC_HI);
case 235: return createRegOperand(SRC_SHARED_BASE);		case 235: return createRegOperand(SRC_SHARED_BASE);
case 236: return createRegOperand(SRC_SHARED_LIMIT);		case 236: return createRegOperand(SRC_SHARED_LIMIT);
case 237: return createRegOperand(SRC_PRIVATE_BASE);		case 237: return createRegOperand(SRC_PRIVATE_BASE);
case 238: return createRegOperand(SRC_PRIVATE_LIMIT);		case 238: return createRegOperand(SRC_PRIVATE_LIMIT);
// TODO: SRC_POPS_EXITING_WAVE_ID		// TODO: SRC_POPS_EXITING_WAVE_ID
// ToDo: no support for vccz register		// ToDo: no support for vccz register
case 251: break;		case 251: break;
// ToDo: no support for execz register		// ToDo: no support for execz register
case 252: break;		case 252: break;
case 253: return createRegOperand(SCC);		case 253: return createRegOperand(SCC);
default: break;		default: break;
}		}
return errOperand(Val, "unknown operand encoding " + Twine(Val));		return errOperand(Val, "unknown operand encoding " + Twine(Val));
}		}

MCOperand AMDGPUDisassembler::decodeSpecialReg64(unsigned Val) const {		MCOperand AMDGPUDisassembler::decodeSpecialReg64(unsigned Val) const {
using namespace AMDGPU;		using namespace AMDGPU;

switch (Val) {		switch (Val) {
case 102: return createRegOperand(getMCReg(FLAT_SCR, STI));		case 102: return createRegOperand(FLAT_SCR);
case 106: return createRegOperand(VCC);		case 106: return createRegOperand(VCC);
case 108: return createRegOperand(TBA);		case 108: assert(!isGFX9()); return createRegOperand(TBA);
case 110: return createRegOperand(TMA);		case 110: assert(!isGFX9()); return createRegOperand(TMA);
case 126: return createRegOperand(EXEC);		case 126: return createRegOperand(EXEC);
default: break;		default: break;
}		}
return errOperand(Val, "unknown operand encoding " + Twine(Val));		return errOperand(Val, "unknown operand encoding " + Twine(Val));
}		}

MCOperand AMDGPUDisassembler::decodeSDWASrc(const OpWidthTy Width,		MCOperand AMDGPUDisassembler::decodeSDWASrc(const OpWidthTy Width,
unsigned Val) const {		unsigned Val) const {
using namespace AMDGPU::SDWA;		using namespace AMDGPU::SDWA;

if (STI.getFeatureBits()[AMDGPU::FeatureGFX9]) {		if (STI.getFeatureBits()[AMDGPU::FeatureGFX9]) {
// XXX: static_cast<int> is needed to avoid stupid warning:		// XXX: static_cast<int> is needed to avoid stupid warning:
// compare with unsigned is always true		// compare with unsigned is always true
if (SDWA9EncValues::SRC_VGPR_MIN <= static_cast<int>(Val) &&		if (SDWA9EncValues::SRC_VGPR_MIN <= static_cast<int>(Val) &&
Val <= SDWA9EncValues::SRC_VGPR_MAX) {		Val <= SDWA9EncValues::SRC_VGPR_MAX) {
return createRegOperand(getVgprClassId(Width),		return createRegOperand(getVgprClassId(Width),
Val - SDWA9EncValues::SRC_VGPR_MIN);		Val - SDWA9EncValues::SRC_VGPR_MIN);
}		}
if (SDWA9EncValues::SRC_SGPR_MIN <= Val &&		if (SDWA9EncValues::SRC_SGPR_MIN <= Val &&
Val <= SDWA9EncValues::SRC_SGPR_MAX) {		Val <= SDWA9EncValues::SRC_SGPR_MAX) {
return createSRegOperand(getSgprClassId(Width),		return createSRegOperand(getSgprClassId(Width),
Val - SDWA9EncValues::SRC_SGPR_MIN);		Val - SDWA9EncValues::SRC_SGPR_MIN);
}		}
		if (SDWA9EncValues::SRC_TTMP_MIN <= Val &&
		Val <= SDWA9EncValues::SRC_TTMP_MAX) {
		return createSRegOperand(getTtmpClassId(Width),
		Val - SDWA9EncValues::SRC_TTMP_MIN);
		}

return decodeSpecialReg32(Val - SDWA9EncValues::SRC_SGPR_MIN);		return decodeSpecialReg32(Val - SDWA9EncValues::SRC_SGPR_MIN);
} else if (STI.getFeatureBits()[AMDGPU::FeatureVolcanicIslands]) {		} else if (STI.getFeatureBits()[AMDGPU::FeatureVolcanicIslands]) {
return createRegOperand(getVgprClassId(Width), Val);		return createRegOperand(getVgprClassId(Width), Val);
}		}
llvm_unreachable("unsupported target");		llvm_unreachable("unsupported target");
}		}

MCOperand AMDGPUDisassembler::decodeSDWASrc16(unsigned Val) const {		MCOperand AMDGPUDisassembler::decodeSDWASrc16(unsigned Val) const {
return decodeSDWASrc(OPW16, Val);		return decodeSDWASrc(OPW16, Val);
}		}

MCOperand AMDGPUDisassembler::decodeSDWASrc32(unsigned Val) const {		MCOperand AMDGPUDisassembler::decodeSDWASrc32(unsigned Val) const {
return decodeSDWASrc(OPW32, Val);		return decodeSDWASrc(OPW32, Val);
}		}

MCOperand AMDGPUDisassembler::decodeSDWAVopcDst(unsigned Val) const {		MCOperand AMDGPUDisassembler::decodeSDWAVopcDst(unsigned Val) const {
using namespace AMDGPU::SDWA;		using namespace AMDGPU::SDWA;

assert(STI.getFeatureBits()[AMDGPU::FeatureGFX9] &&		assert(STI.getFeatureBits()[AMDGPU::FeatureGFX9] &&
"SDWAVopcDst should be present only on GFX9");		"SDWAVopcDst should be present only on GFX9");
if (Val & SDWA9EncValues::VOPC_DST_VCC_MASK) {		if (Val & SDWA9EncValues::VOPC_DST_VCC_MASK) {
Val &= SDWA9EncValues::VOPC_DST_SGPR_MASK;		Val &= SDWA9EncValues::VOPC_DST_SGPR_MASK;
if (Val > AMDGPU::EncValues::SGPR_MAX) {
		int TTmpIdx = getTTmpIdx(Val);
		if (TTmpIdx >= 0) {
		return createSRegOperand(getTtmpClassId(OPW64), TTmpIdx);
		} else if (Val > AMDGPU::EncValues::SGPR_MAX) {
return decodeSpecialReg64(Val);		return decodeSpecialReg64(Val);
} else {		} else {
return createSRegOperand(getSgprClassId(OPW64), Val);		return createSRegOperand(getSgprClassId(OPW64), Val);
}		}
} else {		} else {
return createRegOperand(AMDGPU::VCC);		return createRegOperand(AMDGPU::VCC);
}		}
}		}

		bool AMDGPUDisassembler::isVI() const {
		return STI.getFeatureBits()[AMDGPU::FeatureVolcanicIslands];
		}

		bool AMDGPUDisassembler::isGFX9() const {
		return STI.getFeatureBits()[AMDGPU::FeatureGFX9];
		}

//===----------------------------------------------------------------------===//		//===----------------------------------------------------------------------===//
// AMDGPUSymbolizer		// AMDGPUSymbolizer
//===----------------------------------------------------------------------===//		//===----------------------------------------------------------------------===//

// Try to find symbol name for specified label		// Try to find symbol name for specified label
bool AMDGPUSymbolizer::tryAddingSymbolicOperand(MCInst &Inst,		bool AMDGPUSymbolizer::tryAddingSymbolicOperand(MCInst &Inst,
raw_ostream &/cStream/, int64_t Value,		raw_ostream &/cStream/, int64_t Value,
uint64_t /Address/, bool IsBranch,		uint64_t /Address/, bool IsBranch,
▲ Show 20 Lines • Show All 54 Lines • Show Last 20 Lines

llvm/trunk/lib/Target/AMDGPU/InstPrinter/AMDGPUInstPrinter.cpp

Show First 20 Lines • Show All 338 Lines • ▼ Show 20 Lines	if (MRI.getRegClass(AMDGPU::VGPR_32RegClassID).contains(RegNo)) {
O << 's';		O << 's';
NumRegs = 8;		NumRegs = 8;
} else if (MRI.getRegClass(AMDGPU::VReg_512RegClassID).contains(RegNo)) {		} else if (MRI.getRegClass(AMDGPU::VReg_512RegClassID).contains(RegNo)) {
O << 'v';		O << 'v';
NumRegs = 16;		NumRegs = 16;
} else if (MRI.getRegClass(AMDGPU::SReg_512RegClassID).contains(RegNo)) {		} else if (MRI.getRegClass(AMDGPU::SReg_512RegClassID).contains(RegNo)) {
O << 's';		O << 's';
NumRegs = 16;		NumRegs = 16;
} else if (MRI.getRegClass(AMDGPU::TTMP_64RegClassID).contains(RegNo)) {
O << "ttmp";
NumRegs = 2;
// Trap temps start at offset 112. TODO: Get this from tablegen.
RegIdx -= 112;
} else if (MRI.getRegClass(AMDGPU::TTMP_128RegClassID).contains(RegNo)) {
O << "ttmp";
NumRegs = 4;
// Trap temps start at offset 112. TODO: Get this from tablegen.
RegIdx -= 112;
} else {		} else {
O << getRegisterName(RegNo);		O << getRegisterName(RegNo);
return;		return;
}		}

if (NumRegs == 1) {		if (NumRegs == 1) {
O << RegIdx;		O << RegIdx;
return;		return;
▲ Show 20 Lines • Show All 1,109 Lines • Show Last 20 Lines

llvm/trunk/lib/Target/AMDGPU/SIDefines.h

Show First 20 Lines • Show All 188 Lines • ▼ Show 20 Lines
}		}

namespace AMDGPU {		namespace AMDGPU {
namespace EncValues { // Encoding values of enum9/8/7 operands		namespace EncValues { // Encoding values of enum9/8/7 operands

enum {		enum {
SGPR_MIN = 0,		SGPR_MIN = 0,
SGPR_MAX = 101,		SGPR_MAX = 101,
TTMP_MIN = 112,		TTMP_VI_MIN = 112,
TTMP_MAX = 123,		TTMP_VI_MAX = 123,
		TTMP_GFX9_MIN = 108,
		TTMP_GFX9_MAX = 123,
INLINE_INTEGER_C_MIN = 128,		INLINE_INTEGER_C_MIN = 128,
INLINE_INTEGER_C_POSITIVE_MAX = 192, // 64		INLINE_INTEGER_C_POSITIVE_MAX = 192, // 64
INLINE_INTEGER_C_MAX = 208,		INLINE_INTEGER_C_MAX = 208,
INLINE_FLOATING_C_MIN = 240,		INLINE_FLOATING_C_MIN = 240,
INLINE_FLOATING_C_MAX = 248,		INLINE_FLOATING_C_MAX = 248,
LITERAL_CONST = 255,		LITERAL_CONST = 255,
VGPR_MIN = 256,		VGPR_MIN = 256,
VGPR_MAX = 511		VGPR_MAX = 511
▲ Show 20 Lines • Show All 156 Lines • ▼ Show 20 Lines	enum SDWA9EncValues{
SRC_VGPR_MASK = 0xFF,		SRC_VGPR_MASK = 0xFF,
VOPC_DST_VCC_MASK = 0x80,		VOPC_DST_VCC_MASK = 0x80,
VOPC_DST_SGPR_MASK = 0x7F,		VOPC_DST_SGPR_MASK = 0x7F,

SRC_VGPR_MIN = 0,		SRC_VGPR_MIN = 0,
SRC_VGPR_MAX = 255,		SRC_VGPR_MAX = 255,
SRC_SGPR_MIN = 256,		SRC_SGPR_MIN = 256,
SRC_SGPR_MAX = 357,		SRC_SGPR_MAX = 357,
		SRC_TTMP_MIN = 364,
		SRC_TTMP_MAX = 379,
};		};

} // namespace SDWA		} // namespace SDWA
} // namespace AMDGPU		} // namespace AMDGPU

#define R_00B028_SPI_SHADER_PGM_RSRC1_PS 0x00B028		#define R_00B028_SPI_SHADER_PGM_RSRC1_PS 0x00B028
#define R_00B02C_SPI_SHADER_PGM_RSRC2_PS 0x00B02C		#define R_00B02C_SPI_SHADER_PGM_RSRC2_PS 0x00B02C
#define S_00B02C_EXTRA_LDS_SIZE(x) (((x) & 0xFF) << 8)		#define S_00B02C_EXTRA_LDS_SIZE(x) (((x) & 0xFF) << 8)
▲ Show 20 Lines • Show All 109 Lines • Show Last 20 Lines

llvm/trunk/lib/Target/AMDGPU/SIRegisterInfo.cpp

Show First 20 Lines • Show All 166 Lines • ▼ Show 20 Lines	BitVector SIRegisterInfo::getReservedRegs(const MachineFunction &MF) const {
reserveRegisterTuples(Reserved, AMDGPU::TBA);		reserveRegisterTuples(Reserved, AMDGPU::TBA);
reserveRegisterTuples(Reserved, AMDGPU::TMA);		reserveRegisterTuples(Reserved, AMDGPU::TMA);
reserveRegisterTuples(Reserved, AMDGPU::TTMP0_TTMP1);		reserveRegisterTuples(Reserved, AMDGPU::TTMP0_TTMP1);
reserveRegisterTuples(Reserved, AMDGPU::TTMP2_TTMP3);		reserveRegisterTuples(Reserved, AMDGPU::TTMP2_TTMP3);
reserveRegisterTuples(Reserved, AMDGPU::TTMP4_TTMP5);		reserveRegisterTuples(Reserved, AMDGPU::TTMP4_TTMP5);
reserveRegisterTuples(Reserved, AMDGPU::TTMP6_TTMP7);		reserveRegisterTuples(Reserved, AMDGPU::TTMP6_TTMP7);
reserveRegisterTuples(Reserved, AMDGPU::TTMP8_TTMP9);		reserveRegisterTuples(Reserved, AMDGPU::TTMP8_TTMP9);
reserveRegisterTuples(Reserved, AMDGPU::TTMP10_TTMP11);		reserveRegisterTuples(Reserved, AMDGPU::TTMP10_TTMP11);
		reserveRegisterTuples(Reserved, AMDGPU::TTMP12_TTMP13);
		reserveRegisterTuples(Reserved, AMDGPU::TTMP14_TTMP15);

const SISubtarget &ST = MF.getSubtarget<SISubtarget>();		const SISubtarget &ST = MF.getSubtarget<SISubtarget>();

unsigned MaxNumSGPRs = ST.getMaxNumSGPRs(MF);		unsigned MaxNumSGPRs = ST.getMaxNumSGPRs(MF);
unsigned TotalNumSGPRs = AMDGPU::SGPR_32RegClass.getNumRegs();		unsigned TotalNumSGPRs = AMDGPU::SGPR_32RegClass.getNumRegs();
for (unsigned i = MaxNumSGPRs; i < TotalNumSGPRs; ++i) {		for (unsigned i = MaxNumSGPRs; i < TotalNumSGPRs; ++i) {
unsigned Reg = AMDGPU::SGPR_32RegClass.getRegister(i);		unsigned Reg = AMDGPU::SGPR_32RegClass.getRegister(i);
reserveRegisterTuples(Reserved, Reg);		reserveRegisterTuples(Reserved, Reg);
▲ Show 20 Lines • Show All 1,363 Lines • Show Last 20 Lines

llvm/trunk/lib/Target/AMDGPU/SIRegisterInfo.td

Show First 20 Lines • Show All 71 Lines • ▼ Show 20 Lines

def TMA : RegisterWithSubRegs<"tma", [TMA_LO, TMA_HI]>,		def TMA : RegisterWithSubRegs<"tma", [TMA_LO, TMA_HI]>,
DwarfRegAlias<TMA_LO> {		DwarfRegAlias<TMA_LO> {
let Namespace = "AMDGPU";		let Namespace = "AMDGPU";
let SubRegIndices = [sub0, sub1];		let SubRegIndices = [sub0, sub1];
let HWEncoding = 110;		let HWEncoding = 110;
}		}

def TTMP0 : SIReg <"ttmp0", 112>;		foreach Index = 0-15 in {
def TTMP1 : SIReg <"ttmp1", 113>;		def TTMP#Index#_vi : SIReg<"ttmp"#Index, !add(112, Index)>;
def TTMP2 : SIReg <"ttmp2", 114>;		def TTMP#Index#_gfx9 : SIReg<"ttmp"#Index, !add(108, Index)>;
def TTMP3 : SIReg <"ttmp3", 115>;		def TTMP#Index : SIReg<"", 0>;
def TTMP4 : SIReg <"ttmp4", 116>;		}
def TTMP5 : SIReg <"ttmp5", 117>;
def TTMP6 : SIReg <"ttmp6", 118>;
def TTMP7 : SIReg <"ttmp7", 119>;
def TTMP8 : SIReg <"ttmp8", 120>;
def TTMP9 : SIReg <"ttmp9", 121>;
def TTMP10 : SIReg <"ttmp10", 122>;
def TTMP11 : SIReg <"ttmp11", 123>;

multiclass FLAT_SCR_LOHI_m <string n, bits<16> ci_e, bits<16> vi_e> {		multiclass FLAT_SCR_LOHI_m <string n, bits<16> ci_e, bits<16> vi_e> {
def _ci : SIReg<n, ci_e>;		def _ci : SIReg<n, ci_e>;
def _vi : SIReg<n, vi_e>;		def _vi : SIReg<n, vi_e>;
def "" : SIReg<"", 0>;		def "" : SIReg<"", 0>;
}		}

class FlatReg <Register lo, Register hi, bits<16> encoding> :		class FlatReg <Register lo, Register hi, bits<16> encoding> :
▲ Show 20 Lines • Show All 87 Lines • ▼ Show 20 Lines	def SGPR_512 : RegisterTuples<[sub0, sub1, sub2, sub3, sub4, sub5, sub6, sub7,
(add (decimate (shl SGPR_32, 11), 4)),		(add (decimate (shl SGPR_32, 11), 4)),
(add (decimate (shl SGPR_32, 12), 4)),		(add (decimate (shl SGPR_32, 12), 4)),
(add (decimate (shl SGPR_32, 13), 4)),		(add (decimate (shl SGPR_32, 13), 4)),
(add (decimate (shl SGPR_32, 14), 4)),		(add (decimate (shl SGPR_32, 14), 4)),
(add (decimate (shl SGPR_32, 15), 4))]>;		(add (decimate (shl SGPR_32, 15), 4))]>;

// Trap handler TMP 32-bit registers		// Trap handler TMP 32-bit registers
def TTMP_32 : RegisterClass<"AMDGPU", [i32, f32, v2i16, v2f16], 32,		def TTMP_32 : RegisterClass<"AMDGPU", [i32, f32, v2i16, v2f16], 32,
(add (sequence "TTMP%u", 0, 11))> {		(add (sequence "TTMP%u", 0, 15))> {
let isAllocatable = 0;		let isAllocatable = 0;
}		}

// Trap handler TMP 64-bit registers		// Trap handler TMP 64-bit registers
def TTMP_64Regs : RegisterTuples<[sub0, sub1],		def TTMP_64Regs : RegisterTuples<[sub0, sub1],
[(add (decimate TTMP_32, 2)),		[(add (decimate TTMP_32, 2)),
(add (decimate (shl TTMP_32, 1), 2))]>;		(add (decimate (shl TTMP_32, 1), 2))]>;

// Trap handler TMP 128-bit registers		// Trap handler TMP 128-bit registers
def TTMP_128Regs : RegisterTuples<[sub0, sub1, sub2, sub3],		def TTMP_128Regs : RegisterTuples<[sub0, sub1, sub2, sub3],
[(add (decimate TTMP_32, 4)),		[(add (decimate TTMP_32, 4)),
(add (decimate (shl TTMP_32, 1), 4)),		(add (decimate (shl TTMP_32, 1), 4)),
(add (decimate (shl TTMP_32, 2), 4)),		(add (decimate (shl TTMP_32, 2), 4)),
(add (decimate (shl TTMP_32, 3), 4))]>;		(add (decimate (shl TTMP_32, 3), 4))]>;

		class TmpRegTuples <string tgt,
		bit Is64Bit,
		int Index0,
		int Index1 = !add(Index0, 1),
		int Index2 = !add(Index0, !if(Is64Bit, 1, 2)),
		int Index3 = !add(Index0, !if(Is64Bit, 1, 3)),
		string name = "ttmp["#Index0#":"#Index3#"]",
		Register r0 = !cast<Register>("TTMP"#Index0#tgt),
		Register r1 = !cast<Register>("TTMP"#Index1#tgt),
		Register r2 = !cast<Register>("TTMP"#Index2#tgt),
		Register r3 = !cast<Register>("TTMP"#Index3#tgt)> :
		RegisterWithSubRegs<name, !if(Is64Bit, [r0, r1], [r0, r1, r2, r3])> {
		let SubRegIndices = !if(Is64Bit, [sub0, sub1], [sub0, sub1, sub2, sub3]);
		let HWEncoding = r0.HWEncoding;
		}

		foreach Index = {0, 2, 4, 6, 8, 10, 12, 14} in {
		def TTMP#Index#_TTMP#!add(Index,1)#_vi : TmpRegTuples<"_vi", 1, Index>;
		def TTMP#Index#_TTMP#!add(Index,1)#_gfx9 : TmpRegTuples<"_gfx9", 1, Index>;
		}

		foreach Index = {0, 4, 8, 12} in {
		def TTMP#Index#_TTMP#!add(Index,1)#
		_TTMP#!add(Index,2)#
		_TTMP#!add(Index,3)#_vi : TmpRegTuples<"_vi", 0, Index>;
		def TTMP#Index#_TTMP#!add(Index,1)#
		_TTMP#!add(Index,2)#
		_TTMP#!add(Index,3)#_gfx9 : TmpRegTuples<"_gfx9", 0, Index>;
		}

// VGPR 32-bit registers		// VGPR 32-bit registers
// i16/f16 only on VI+		// i16/f16 only on VI+
def VGPR_32 : RegisterClass<"AMDGPU", [i32, f32, i16, f16, v2i16, v2f16], 32,		def VGPR_32 : RegisterClass<"AMDGPU", [i32, f32, i16, f16, v2i16, v2f16], 32,
(add (sequence "VGPR%u", 0, 255))> {		(add (sequence "VGPR%u", 0, 255))> {
let AllocationPriority = 1;		let AllocationPriority = 1;
let Size = 32;		let Size = 32;
}		}

▲ Show 20 Lines • Show All 295 Lines • Show Last 20 Lines

llvm/trunk/lib/Target/AMDGPU/Utils/AMDGPUBaseInfo.cpp

	Show First 20 Lines • Show All 563 Lines • ▼ Show 20 Lines

	bool isRegIntersect(unsigned Reg0, unsigned Reg1, const MCRegisterInfo* TRI) {			bool isRegIntersect(unsigned Reg0, unsigned Reg1, const MCRegisterInfo* TRI) {
	for (MCRegAliasIterator R(Reg0, TRI, true); R.isValid(); ++R) {			for (MCRegAliasIterator R(Reg0, TRI, true); R.isValid(); ++R) {
	if (*R == Reg1) return true;			if (*R == Reg1) return true;
	}			}
	return false;			return false;
	}			}

	unsigned getMCReg(unsigned Reg, const MCSubtargetInfo &STI) {			#define MAP_REG2REG \
				using namespace AMDGPU; \
				switch(Reg) { \
				default: return Reg; \
				CASE_CI_VI(FLAT_SCR) \
				CASE_CI_VI(FLAT_SCR_LO) \
				CASE_CI_VI(FLAT_SCR_HI) \
				CASE_VI_GFX9(TTMP0) \
				CASE_VI_GFX9(TTMP1) \
				CASE_VI_GFX9(TTMP2) \
				CASE_VI_GFX9(TTMP3) \
				CASE_VI_GFX9(TTMP4) \
				CASE_VI_GFX9(TTMP5) \
				CASE_VI_GFX9(TTMP6) \
				CASE_VI_GFX9(TTMP7) \
				CASE_VI_GFX9(TTMP8) \
				CASE_VI_GFX9(TTMP9) \
				CASE_VI_GFX9(TTMP10) \
				CASE_VI_GFX9(TTMP11) \
				CASE_VI_GFX9(TTMP12) \
				CASE_VI_GFX9(TTMP13) \
				CASE_VI_GFX9(TTMP14) \
				CASE_VI_GFX9(TTMP15) \
				CASE_VI_GFX9(TTMP0_TTMP1) \
				CASE_VI_GFX9(TTMP2_TTMP3) \
				CASE_VI_GFX9(TTMP4_TTMP5) \
				CASE_VI_GFX9(TTMP6_TTMP7) \
				CASE_VI_GFX9(TTMP8_TTMP9) \
				CASE_VI_GFX9(TTMP10_TTMP11) \
				CASE_VI_GFX9(TTMP12_TTMP13) \
				CASE_VI_GFX9(TTMP14_TTMP15) \
				CASE_VI_GFX9(TTMP0_TTMP1_TTMP2_TTMP3) \
				CASE_VI_GFX9(TTMP4_TTMP5_TTMP6_TTMP7) \
				CASE_VI_GFX9(TTMP8_TTMP9_TTMP10_TTMP11) \
				CASE_VI_GFX9(TTMP12_TTMP13_TTMP14_TTMP15) \
				}

				#define CASE_CI_VI(node) \
				assert(!isSI(STI)); \
				case node: return isCI(STI) ? node##_ci : node##_vi;

	switch(Reg) {			#define CASE_VI_GFX9(node) \
	default: break;			case node: return isGFX9(STI) ? node##_gfx9 : node##_vi;
	case AMDGPU::FLAT_SCR:
	assert(!isSI(STI));			unsigned getMCReg(unsigned Reg, const MCSubtargetInfo &STI) {
	return isCI(STI) ? AMDGPU::FLAT_SCR_ci : AMDGPU::FLAT_SCR_vi;			MAP_REG2REG

	case AMDGPU::FLAT_SCR_LO:
	assert(!isSI(STI));
	return isCI(STI) ? AMDGPU::FLAT_SCR_LO_ci : AMDGPU::FLAT_SCR_LO_vi;

	case AMDGPU::FLAT_SCR_HI:
	assert(!isSI(STI));
	return isCI(STI) ? AMDGPU::FLAT_SCR_HI_ci : AMDGPU::FLAT_SCR_HI_vi;
	}
	return Reg;
	}			}

	unsigned mc2PseudoReg(unsigned Reg) {			#undef CASE_CI_VI
	switch (Reg) {			#undef CASE_VI_GFX9
	case AMDGPU::FLAT_SCR_ci:
	case AMDGPU::FLAT_SCR_vi:
	return FLAT_SCR;

	case AMDGPU::FLAT_SCR_LO_ci:
	case AMDGPU::FLAT_SCR_LO_vi:
	return AMDGPU::FLAT_SCR_LO;

	case AMDGPU::FLAT_SCR_HI_ci:
	case AMDGPU::FLAT_SCR_HI_vi:
	return AMDGPU::FLAT_SCR_HI;

	default:			#define CASE_CI_VI(node) case node##_ci: case node##_vi: return node;
	return Reg;			#define CASE_VI_GFX9(node) case node##_vi: case node##_gfx9: return node;
	}
				unsigned mc2PseudoReg(unsigned Reg) {
				MAP_REG2REG
	}			}

				#undef CASE_CI_VI
				#undef CASE_VI_GFX9
				#undef MAP_REG2REG

	bool isSISrcOperand(const MCInstrDesc &Desc, unsigned OpNo) {			bool isSISrcOperand(const MCInstrDesc &Desc, unsigned OpNo) {
	assert(OpNo < Desc.NumOperands);			assert(OpNo < Desc.NumOperands);
	unsigned OpType = Desc.OpInfo[OpNo].OperandType;			unsigned OpType = Desc.OpInfo[OpNo].OperandType;
	return OpType >= AMDGPU::OPERAND_SRC_FIRST &&			return OpType >= AMDGPU::OPERAND_SRC_FIRST &&
	OpType <= AMDGPU::OPERAND_SRC_LAST;			OpType <= AMDGPU::OPERAND_SRC_LAST;
	}			}

	bool isSISrcFPOperand(const MCInstrDesc &Desc, unsigned OpNo) {			bool isSISrcFPOperand(const MCInstrDesc &Desc, unsigned OpNo) {
	▲ Show 20 Lines • Show All 226 Lines • Show Last 20 Lines

llvm/trunk/test/MC/AMDGPU/literalv216-err.s

	// RUN: not llvm-mc -arch=amdgcn -mcpu=gfx901 -show-encoding %s 2>&1 \| FileCheck -check-prefix=GFX9 %s			// RUN: not llvm-mc -arch=amdgcn -mcpu=gfx900 -show-encoding %s 2>&1 \| FileCheck -check-prefix=GFX9 %s

	v_pk_add_f16 v1, -17, v2			v_pk_add_f16 v1, -17, v2
	// GFX9: :19: error: invalid operand for instruction			// GFX9: :19: error: invalid operand for instruction

	v_pk_add_f16 v1, 65, v2			v_pk_add_f16 v1, 65, v2
	// GFX9: :18: error: invalid operand for instruction			// GFX9: :18: error: invalid operand for instruction

	v_pk_add_f16 v1, 64.0, v2			v_pk_add_f16 v1, 64.0, v2
	Show All 13 Lines

llvm/trunk/test/MC/AMDGPU/trap.s

	// RUN: llvm-mc -arch=amdgcn -show-encoding %s \| FileCheck %s --check-prefix=SICI			// RUN: not llvm-mc -arch=amdgcn -show-encoding %s \| FileCheck %s --check-prefix=SICI
	// RUN: llvm-mc -arch=amdgcn -mcpu=tahiti -show-encoding %s \| FileCheck %s --check-prefix=SICI			// RUN: not llvm-mc -arch=amdgcn -mcpu=tahiti -show-encoding %s \| FileCheck %s --check-prefix=SICI
	// RUN: llvm-mc -arch=amdgcn -mcpu=fiji -show-encoding %s \| FileCheck %s --check-prefix=VI			// RUN: not llvm-mc -arch=amdgcn -mcpu=fiji -show-encoding %s \| FileCheck %s --check-prefix=VI
				// RUN: not llvm-mc -arch=amdgcn -mcpu=gfx900 -show-encoding %s \| FileCheck %s --check-prefix=GFX9

				// RUN: not llvm-mc -arch=amdgcn -show-encoding %s 2>&1 \| FileCheck %s --check-prefix=NOSICIVI
				// RUN: not llvm-mc -arch=amdgcn -mcpu=tahiti -show-encoding %s 2>&1 \| FileCheck %s --check-prefix=NOSICIVI
				// RUN: not llvm-mc -arch=amdgcn -mcpu=fiji -show-encoding %s 2>&1 \| FileCheck %s --check-prefix=NOSICIVI
				// RUN: not llvm-mc -arch=amdgcn -mcpu=gfx900 -show-encoding %s 2>&1 \| FileCheck %s --check-prefix=NOGFX9

	//===----------------------------------------------------------------------===//			//===----------------------------------------------------------------------===//
	// Trap Handler related - 32 bit registers			// Trap Handler related - 32 bit registers
	//===----------------------------------------------------------------------===//			//===----------------------------------------------------------------------===//

	s_add_u32 ttmp0, ttmp0, 4			s_add_u32 ttmp0, ttmp0, 4
	// SICI: s_add_u32 ttmp0, ttmp0, 4 ; encoding: [0x70,0x84,0x70,0x80]			// SICI: s_add_u32 ttmp0, ttmp0, 4 ; encoding: [0x70,0x84,0x70,0x80]
	// VI: s_add_u32 ttmp0, ttmp0, 4 ; encoding: [0x70,0x84,0x70,0x80]			// VI: s_add_u32 ttmp0, ttmp0, 4 ; encoding: [0x70,0x84,0x70,0x80]
				// GFX9: s_add_u32 ttmp0, ttmp0, 4 ; encoding: [0x6c,0x84,0x6c,0x80]

	s_add_u32 ttmp4, 8, ttmp4			s_add_u32 ttmp4, 8, ttmp4
	// SICI: s_add_u32 ttmp4, 8, ttmp4 ; encoding: [0x88,0x74,0x74,0x80]			// SICI: s_add_u32 ttmp4, 8, ttmp4 ; encoding: [0x88,0x74,0x74,0x80]
	// VI: s_add_u32 ttmp4, 8, ttmp4 ; encoding: [0x88,0x74,0x74,0x80]			// VI: s_add_u32 ttmp4, 8, ttmp4 ; encoding: [0x88,0x74,0x74,0x80]
				// GXF9: s_add_u32 ttmp4, 8, ttmp4 ; encoding: [0x88,0x70,0x70,0x80]

	s_add_u32 ttmp4, ttmp4, 0x00000100			s_add_u32 ttmp4, ttmp4, 0x00000100
	// SICI: s_add_u32 ttmp4, ttmp4, 0x100 ; encoding: [0x74,0xff,0x74,0x80,0x00,0x01,0x00,0x00]			// SICI: s_add_u32 ttmp4, ttmp4, 0x100 ; encoding: [0x74,0xff,0x74,0x80,0x00,0x01,0x00,0x00]
	// VI: s_add_u32 ttmp4, ttmp4, 0x100 ; encoding: [0x74,0xff,0x74,0x80,0x00,0x01,0x00,0x00]			// VI: s_add_u32 ttmp4, ttmp4, 0x100 ; encoding: [0x74,0xff,0x74,0x80,0x00,0x01,0x00,0x00]
				// GXF9: s_add_u32 ttmp4, ttmp4, 0x100 ; encoding: [0x70,0xff,0x70,0x80,0x00,0x01,0x00,0x00]

	s_add_u32 ttmp4, ttmp4, 4			s_add_u32 ttmp4, ttmp4, 4
	// SICI: s_add_u32 ttmp4, ttmp4, 4 ; encoding: [0x74,0x84,0x74,0x80]			// SICI: s_add_u32 ttmp4, ttmp4, 4 ; encoding: [0x74,0x84,0x74,0x80]
	// VI: s_add_u32 ttmp4, ttmp4, 4 ; encoding: [0x74,0x84,0x74,0x80]			// VI: s_add_u32 ttmp4, ttmp4, 4 ; encoding: [0x74,0x84,0x74,0x80]
				// GXF9: s_add_u32 ttmp4, ttmp4, 4 ; encoding: [0x70,0x84,0x70,0x80]

	s_add_u32 ttmp4, ttmp8, ttmp4			s_add_u32 ttmp4, ttmp8, ttmp4
	// SICI: s_add_u32 ttmp4, ttmp8, ttmp4 ; encoding: [0x78,0x74,0x74,0x80]			// SICI: s_add_u32 ttmp4, ttmp8, ttmp4 ; encoding: [0x78,0x74,0x74,0x80]
	// VI: s_add_u32 ttmp4, ttmp8, ttmp4 ; encoding: [0x78,0x74,0x74,0x80]			// VI: s_add_u32 ttmp4, ttmp8, ttmp4 ; encoding: [0x78,0x74,0x74,0x80]
				// GXF9: s_add_u32 ttmp4, ttmp8, ttmp4 ; encoding: [0x74,0x70,0x70,0x80]

	s_and_b32 ttmp10, ttmp8, 0x00000080			s_and_b32 ttmp10, ttmp8, 0x00000080
	// SICI: s_and_b32 ttmp10, ttmp8, 0x80 ; encoding: [0x78,0xff,0x7a,0x87,0x80,0x00,0x00,0x00]			// SICI: s_and_b32 ttmp10, ttmp8, 0x80 ; encoding: [0x78,0xff,0x7a,0x87,0x80,0x00,0x00,0x00]
	// VI: s_and_b32 ttmp10, ttmp8, 0x80 ; encoding: [0x78,0xff,0x7a,0x86,0x80,0x00,0x00,0x00]			// VI: s_and_b32 ttmp10, ttmp8, 0x80 ; encoding: [0x78,0xff,0x7a,0x86,0x80,0x00,0x00,0x00]
				// GXF9: s_and_b32 ttmp10, ttmp8, 0x80 ; encoding: [0x74,0xff,0x74,0x86,0x80,0x00,0x00,0x00]

	s_and_b32 ttmp9, tma_hi, 0x0000ffff			s_and_b32 ttmp9, tma_hi, 0x0000ffff
	// SICI: s_and_b32 ttmp9, tma_hi, 0xffff ; encoding: [0x6f,0xff,0x79,0x87,0xff,0xff,0x00,0x00]			// SICI: s_and_b32 ttmp9, tma_hi, 0xffff ; encoding: [0x6f,0xff,0x79,0x87,0xff,0xff,0x00,0x00]
	// VI: s_and_b32 ttmp9, tma_hi, 0xffff ; encoding: [0x6f,0xff,0x79,0x86,0xff,0xff,0x00,0x00]			// VI: s_and_b32 ttmp9, tma_hi, 0xffff ; encoding: [0x6f,0xff,0x79,0x86,0xff,0xff,0x00,0x00]
				// NOGFX9: error: not a valid operand

	s_and_b32 ttmp9, ttmp9, 0x000001ff			s_and_b32 ttmp9, ttmp9, 0x000001ff
	// SICI: s_and_b32 ttmp9, ttmp9, 0x1ff ; encoding: [0x79,0xff,0x79,0x87,0xff,0x01,0x00,0x00]			// SICI: s_and_b32 ttmp9, ttmp9, 0x1ff ; encoding: [0x79,0xff,0x79,0x87,0xff,0x01,0x00,0x00]
	// VI: s_and_b32 ttmp9, ttmp9, 0x1ff ; encoding: [0x79,0xff,0x79,0x86,0xff,0x01,0x00,0x00]			// VI: s_and_b32 ttmp9, ttmp9, 0x1ff ; encoding: [0x79,0xff,0x79,0x86,0xff,0x01,0x00,0x00]
				// GXF9: s_and_b32 ttmp9, ttmp9, 0x1ff ; encoding: [0x75,0xff,0x75,0x86,0xff,0x01,0x00,0x00]

	s_and_b32 ttmp9, tma_lo, 0xffff0000			s_and_b32 ttmp9, tma_lo, 0xffff0000
	// SICI: s_and_b32 ttmp9, tma_lo, 0xffff0000 ; encoding: [0x6e,0xff,0x79,0x87,0x00,0x00,0xff,0xff]			// SICI: s_and_b32 ttmp9, tma_lo, 0xffff0000 ; encoding: [0x6e,0xff,0x79,0x87,0x00,0x00,0xff,0xff]
	// VI: s_and_b32 ttmp9, tma_lo, 0xffff0000 ; encoding: [0x6e,0xff,0x79,0x86,0x00,0x00,0xff,0xff]			// VI: s_and_b32 ttmp9, tma_lo, 0xffff0000 ; encoding: [0x6e,0xff,0x79,0x86,0x00,0x00,0xff,0xff]
				// NOGFX9: error: not a valid operand

	s_and_b32 ttmp9, ttmp9, ttmp8			s_and_b32 ttmp9, ttmp9, ttmp8
	// SICI: s_and_b32 ttmp9, ttmp9, ttmp8 ; encoding: [0x79,0x78,0x79,0x87]			// SICI: s_and_b32 ttmp9, ttmp9, ttmp8 ; encoding: [0x79,0x78,0x79,0x87]
	// VI: s_and_b32 ttmp9, ttmp9, ttmp8 ; encoding: [0x79,0x78,0x79,0x86]			// VI: s_and_b32 ttmp9, ttmp9, ttmp8 ; encoding: [0x79,0x78,0x79,0x86]
				// GXF9: s_and_b32 ttmp9, ttmp9, ttmp8 ; encoding: [0x75,0x78,0x75,0x86]

	s_and_b32 ttmp8, ttmp1, 0x01000000			s_and_b32 ttmp8, ttmp1, 0x01000000
	// SICI: s_and_b32 ttmp8, ttmp1, 0x1000000 ; encoding: [0x71,0xff,0x78,0x87,0x00,0x00,0x00,0x01]			// SICI: s_and_b32 ttmp8, ttmp1, 0x1000000 ; encoding: [0x71,0xff,0x78,0x87,0x00,0x00,0x00,0x01]
	// VI: s_and_b32 ttmp8, ttmp1, 0x1000000 ; encoding: [0x71,0xff,0x78,0x86,0x00,0x00,0x00,0x01]			// VI: s_and_b32 ttmp8, ttmp1, 0x1000000 ; encoding: [0x71,0xff,0x78,0x86,0x00,0x00,0x00,0x01]
				// GXF9: s_and_b32 ttmp8, ttmp1, 0x1000000 ; encoding: [0x6d,0xff,0x74,0x86,0x00,0x00,0x00,0x01]

	s_cmp_eq_i32 ttmp8, 0			s_cmp_eq_i32 ttmp8, 0
	// SICI: s_cmp_eq_i32 ttmp8, 0 ; encoding: [0x78,0x80,0x00,0xbf]			// SICI: s_cmp_eq_i32 ttmp8, 0 ; encoding: [0x78,0x80,0x00,0xbf]
	// VI: s_cmp_eq_i32 ttmp8, 0 ; encoding: [0x78,0x80,0x00,0xbf]			// VI: s_cmp_eq_i32 ttmp8, 0 ; encoding: [0x78,0x80,0x00,0xbf]
				// GXF9: s_cmp_eq_i32 ttmp8, 0 ; encoding: [0x74,0x80,0x00,0xbf]

	s_cmp_eq_i32 ttmp8, 0x000000fe			s_cmp_eq_i32 ttmp8, 0x000000fe
	// SICI: s_cmp_eq_i32 ttmp8, 0xfe ; encoding: [0x78,0xff,0x00,0xbf,0xfe,0x00,0x00,0x00]			// SICI: s_cmp_eq_i32 ttmp8, 0xfe ; encoding: [0x78,0xff,0x00,0xbf,0xfe,0x00,0x00,0x00]
	// VI: s_cmp_eq_i32 ttmp8, 0xfe ; encoding: [0x78,0xff,0x00,0xbf,0xfe,0x00,0x00,0x00]			// VI: s_cmp_eq_i32 ttmp8, 0xfe ; encoding: [0x78,0xff,0x00,0xbf,0xfe,0x00,0x00,0x00]
				// GXF9: s_cmp_eq_i32 ttmp8, 0xfe ; encoding: [0x74,0xff,0x00,0xbf,0xfe,0x00,0x00,0x00]

	s_lshr_b32 ttmp8, ttmp8, 12			s_lshr_b32 ttmp8, ttmp8, 12
	// SICI: s_lshr_b32 ttmp8, ttmp8, 12 ; encoding: [0x78,0x8c,0x78,0x90]			// SICI: s_lshr_b32 ttmp8, ttmp8, 12 ; encoding: [0x78,0x8c,0x78,0x90]
	// VI: s_lshr_b32 ttmp8, ttmp8, 12 ; encoding: [0x78,0x8c,0x78,0x8f]			// VI: s_lshr_b32 ttmp8, ttmp8, 12 ; encoding: [0x78,0x8c,0x78,0x8f]
				// GXF9: s_lshr_b32 ttmp8, ttmp8, 12 ; encoding: [0x74,0x8c,0x74,0x8f]

	v_mov_b32_e32 v1, ttmp8			v_mov_b32_e32 v1, ttmp8
	// SICI: v_mov_b32_e32 v1, ttmp8 ; encoding: [0x78,0x02,0x02,0x7e]			// SICI: v_mov_b32_e32 v1, ttmp8 ; encoding: [0x78,0x02,0x02,0x7e]
	// VI: v_mov_b32_e32 v1, ttmp8 ; encoding: [0x78,0x02,0x02,0x7e]			// VI: v_mov_b32_e32 v1, ttmp8 ; encoding: [0x78,0x02,0x02,0x7e]
				// GXF9: v_mov_b32_e32 v1, ttmp8 ; encoding: [0x74,0x02,0x02,0x7e]

	s_mov_b32 m0, ttmp8			s_mov_b32 m0, ttmp8
	// SICI: s_mov_b32 m0, ttmp8 ; encoding: [0x78,0x03,0xfc,0xbe]			// SICI: s_mov_b32 m0, ttmp8 ; encoding: [0x78,0x03,0xfc,0xbe]
	// VI: s_mov_b32 m0, ttmp8 ; encoding: [0x78,0x00,0xfc,0xbe]			// VI: s_mov_b32 m0, ttmp8 ; encoding: [0x78,0x00,0xfc,0xbe]
				// GXF9: s_mov_b32 m0, ttmp8 ; encoding: [0x74,0x00,0xfc,0xbe]

	s_mov_b32 ttmp10, 0			s_mov_b32 ttmp10, 0
	// SICI: s_mov_b32 ttmp10, 0 ; encoding: [0x80,0x03,0xfa,0xbe]			// SICI: s_mov_b32 ttmp10, 0 ; encoding: [0x80,0x03,0xfa,0xbe]
	// VI: s_mov_b32 ttmp10, 0 ; encoding: [0x80,0x00,0xfa,0xbe]			// VI: s_mov_b32 ttmp10, 0 ; encoding: [0x80,0x00,0xfa,0xbe]
				// GXF9: s_mov_b32 ttmp10, 0 ; encoding: [0x80,0x00,0xf6,0xbe]

	s_mov_b32 ttmp11, 0x01024fac			s_mov_b32 ttmp11, 0x01024fac
	// SICI: s_mov_b32 ttmp11, 0x1024fac ; encoding: [0xff,0x03,0xfb,0xbe,0xac,0x4f,0x02,0x01]			// SICI: s_mov_b32 ttmp11, 0x1024fac ; encoding: [0xff,0x03,0xfb,0xbe,0xac,0x4f,0x02,0x01]
	// VI: s_mov_b32 ttmp11, 0x1024fac ; encoding: [0xff,0x00,0xfb,0xbe,0xac,0x4f,0x02,0x01]			// VI: s_mov_b32 ttmp11, 0x1024fac ; encoding: [0xff,0x00,0xfb,0xbe,0xac,0x4f,0x02,0x01]
				// GXF9: s_mov_b32 ttmp11, 0x1024fac ; encoding: [0xff,0x00,0xf7,0xbe,0xac,0x4f,0x02,0x01]

	s_mov_b32 ttmp8, m0			s_mov_b32 ttmp8, m0
	// SICI: s_mov_b32 ttmp8, m0 ; encoding: [0x7c,0x03,0xf8,0xbe]			// SICI: s_mov_b32 ttmp8, m0 ; encoding: [0x7c,0x03,0xf8,0xbe]
	// VI: s_mov_b32 ttmp8, m0 ; encoding: [0x7c,0x00,0xf8,0xbe]			// VI: s_mov_b32 ttmp8, m0 ; encoding: [0x7c,0x00,0xf8,0xbe]
				// GXF9: s_mov_b32 ttmp8, m0 ; encoding: [0x7c,0x00,0xf4,0xbe]

	s_mov_b32 ttmp8, tma_lo			s_mov_b32 ttmp8, tma_lo
	// SICI: s_mov_b32 ttmp8, tma_lo ; encoding: [0x6e,0x03,0xf8,0xbe]			// SICI: s_mov_b32 ttmp8, tma_lo ; encoding: [0x6e,0x03,0xf8,0xbe]
	// VI: s_mov_b32 ttmp8, tma_lo ; encoding: [0x6e,0x00,0xf8,0xbe]			// VI: s_mov_b32 ttmp8, tma_lo ; encoding: [0x6e,0x00,0xf8,0xbe]
				// NOGFX9: error: not a valid operand

	s_mul_i32 ttmp8, 0x00000324, ttmp8			s_mul_i32 ttmp8, 0x00000324, ttmp8
	// SICI: s_mul_i32 ttmp8, 0x324, ttmp8 ; encoding: [0xff,0x78,0x78,0x93,0x24,0x03,0x00,0x00]			// SICI: s_mul_i32 ttmp8, 0x324, ttmp8 ; encoding: [0xff,0x78,0x78,0x93,0x24,0x03,0x00,0x00]
	// VI: s_mul_i32 ttmp8, 0x324, ttmp8 ; encoding: [0xff,0x78,0x78,0x92,0x24,0x03,0x00,0x00]			// VI: s_mul_i32 ttmp8, 0x324, ttmp8 ; encoding: [0xff,0x78,0x78,0x92,0x24,0x03,0x00,0x00]
				// GXF9: s_mul_i32 ttmp8, 0x324, ttmp8 ; encoding: [0xff,0x74,0x74,0x92,0x24,0x03,0x00,0x00]

	s_or_b32 ttmp9, ttmp9, 0x00280000			s_or_b32 ttmp9, ttmp9, 0x00280000
	// SICI: s_or_b32 ttmp9, ttmp9, 0x280000 ; encoding: [0x79,0xff,0x79,0x88,0x00,0x00,0x28,0x00]			// SICI: s_or_b32 ttmp9, ttmp9, 0x280000 ; encoding: [0x79,0xff,0x79,0x88,0x00,0x00,0x28,0x00]
	// VI: s_or_b32 ttmp9, ttmp9, 0x280000 ; encoding: [0x79,0xff,0x79,0x87,0x00,0x00,0x28,0x00]			// VI: s_or_b32 ttmp9, ttmp9, 0x280000 ; encoding: [0x79,0xff,0x79,0x87,0x00,0x00,0x28,0x00]
				// GXF9: s_or_b32 ttmp9, ttmp9, 0x280000 ; encoding: [0x75,0xff,0x75,0x87,0x00,0x00,0x28,0x00]

				// ttmp12..ttmp15 (GFX9 only)

				s_add_u32 ttmp0, ttmp12, 4
				// NOSICIVI: error: not a valid operand
				// GFX9: s_add_u32 ttmp0, ttmp12, 4 ; encoding: [0x78,0x84,0x6c,0x80]

				s_add_u32 ttmp0, ttmp13, 4
				// NOSICIVI: error: not a valid operand
				// GFX9: s_add_u32 ttmp0, ttmp13, 4 ; encoding: [0x79,0x84,0x6c,0x80]

				s_add_u32 ttmp0, ttmp14, 4
				// NOSICIVI: error: not a valid operand
				// GFX9: s_add_u32 ttmp0, ttmp14, 4 ; encoding: [0x7a,0x84,0x6c,0x80]

				s_add_u32 ttmp0, ttmp15, 4
				// NOSICIVI: error: not a valid operand
				// GFX9: s_add_u32 ttmp0, ttmp15, 4 ; encoding: [0x7b,0x84,0x6c,0x80]

	//===----------------------------------------------------------------------===//			//===----------------------------------------------------------------------===//
	// Trap Handler related - Pairs and quadruples of registers			// Trap Handler related - Pairs and quadruples of registers
	//===----------------------------------------------------------------------===//			//===----------------------------------------------------------------------===//

	s_mov_b64 ttmp[4:5], exec			s_mov_b64 ttmp[4:5], exec
	// SICI: s_mov_b64 ttmp[4:5], exec ; encoding: [0x7e,0x04,0xf4,0xbe]			// SICI: s_mov_b64 ttmp[4:5], exec ; encoding: [0x7e,0x04,0xf4,0xbe]
	// VI: s_mov_b64 ttmp[4:5], exec ; encoding: [0x7e,0x01,0xf4,0xbe]			// VI: s_mov_b64 ttmp[4:5], exec ; encoding: [0x7e,0x01,0xf4,0xbe]
				// GFX9: s_mov_b64 ttmp[4:5], exec ; encoding: [0x7e,0x01,0xf0,0xbe]

	s_mov_b64 [ttmp4,ttmp5], exec			s_mov_b64 [ttmp4,ttmp5], exec
	// SICI: s_mov_b64 ttmp[4:5], exec ; encoding: [0x7e,0x04,0xf4,0xbe]			// SICI: s_mov_b64 ttmp[4:5], exec ; encoding: [0x7e,0x04,0xf4,0xbe]
	// VI: s_mov_b64 ttmp[4:5], exec ; encoding: [0x7e,0x01,0xf4,0xbe]			// VI: s_mov_b64 ttmp[4:5], exec ; encoding: [0x7e,0x01,0xf4,0xbe]
				// GFX9: s_mov_b64 ttmp[4:5], exec ; encoding: [0x7e,0x01,0xf0,0xbe]

	s_mov_b64 exec, [ttmp4,ttmp5]			s_mov_b64 exec, [ttmp4,ttmp5]
	// SICI: s_mov_b64 exec, ttmp[4:5] ; encoding: [0x74,0x04,0xfe,0xbe]			// SICI: s_mov_b64 exec, ttmp[4:5] ; encoding: [0x74,0x04,0xfe,0xbe]
	// VI: s_mov_b64 exec, ttmp[4:5] ; encoding: [0x74,0x01,0xfe,0xbe]			// VI: s_mov_b64 exec, ttmp[4:5] ; encoding: [0x74,0x01,0xfe,0xbe]
				// GFX9: s_mov_b64 exec, ttmp[4:5] ; encoding: [0x70,0x01,0xfe,0xbe]

	s_mov_b64 tba, ttmp[4:5]			s_mov_b64 tba, ttmp[4:5]
	// SICI: s_mov_b64 tba, ttmp[4:5] ; encoding: [0x74,0x04,0xec,0xbe]			// SICI: s_mov_b64 tba, ttmp[4:5] ; encoding: [0x74,0x04,0xec,0xbe]
	// VI: s_mov_b64 tba, ttmp[4:5] ; encoding: [0x74,0x01,0xec,0xbe]			// VI: s_mov_b64 tba, ttmp[4:5] ; encoding: [0x74,0x01,0xec,0xbe]
				// NOGFX9: error: not a valid operand

	s_mov_b64 ttmp[4:5], tba			s_mov_b64 ttmp[4:5], tba
	// SICI: s_mov_b64 ttmp[4:5], tba ; encoding: [0x6c,0x04,0xf4,0xbe]			// SICI: s_mov_b64 ttmp[4:5], tba ; encoding: [0x6c,0x04,0xf4,0xbe]
	// VI: s_mov_b64 ttmp[4:5], tba ; encoding: [0x6c,0x01,0xf4,0xbe]			// VI: s_mov_b64 ttmp[4:5], tba ; encoding: [0x6c,0x01,0xf4,0xbe]
				// NOGFX9: error: not a valid operand

	s_mov_b64 tma, ttmp[4:5]			s_mov_b64 tma, ttmp[4:5]
	// SICI: s_mov_b64 tma, ttmp[4:5] ; encoding: [0x74,0x04,0xee,0xbe]			// SICI: s_mov_b64 tma, ttmp[4:5] ; encoding: [0x74,0x04,0xee,0xbe]
	// VI: s_mov_b64 tma, ttmp[4:5] ; encoding: [0x74,0x01,0xee,0xbe]			// VI: s_mov_b64 tma, ttmp[4:5] ; encoding: [0x74,0x01,0xee,0xbe]
				// NOGFX9: error: not a valid operand

	s_mov_b64 ttmp[4:5], tma			s_mov_b64 ttmp[4:5], tma
	// SICI: s_mov_b64 ttmp[4:5], tma ; encoding: [0x6e,0x04,0xf4,0xbe]			// SICI: s_mov_b64 ttmp[4:5], tma ; encoding: [0x6e,0x04,0xf4,0xbe]
	// VI: s_mov_b64 ttmp[4:5], tma ; encoding: [0x6e,0x01,0xf4,0xbe]			// VI: s_mov_b64 ttmp[4:5], tma ; encoding: [0x6e,0x01,0xf4,0xbe]
				// NOGFX9: error: not a valid operand

				// ttmp12..ttmp15 (GFX9 only)

				s_mov_b64 ttmp[12:13], exec
				// NOSICIVI: error: not a valid operand
				// GFX9: s_mov_b64 ttmp[12:13], exec ; encoding: [0x7e,0x01,0xf8,0xbe]

				s_mov_b64 ttmp[14:15], exec
				// NOSICIVI: error: not a valid operand
				// GFX9: s_mov_b64 ttmp[14:15], exec ; encoding: [0x7e,0x01,0xfa,0xbe]

	//===----------------------------------------------------------------------===//			//===----------------------------------------------------------------------===//
	// Trap Handler related - Some specific instructions			// Trap Handler related - Some specific instructions
	//===----------------------------------------------------------------------===//			//===----------------------------------------------------------------------===//

	s_setpc_b64 [ttmp2,ttmp3]			s_setpc_b64 [ttmp2,ttmp3]
	// SICI: s_setpc_b64 ttmp[2:3] ; encoding: [0x72,0x20,0x80,0xbe]			// SICI: s_setpc_b64 ttmp[2:3] ; encoding: [0x72,0x20,0x80,0xbe]
	// VI: s_setpc_b64 ttmp[2:3] ; encoding: [0x72,0x1d,0x80,0xbe]			// VI: s_setpc_b64 ttmp[2:3] ; encoding: [0x72,0x1d,0x80,0xbe]
				// GFX9: s_setpc_b64 ttmp[2:3] ; encoding: [0x6e,0x1d,0x80,0xbe]

	v_readfirstlane_b32 ttmp8, v1			v_readfirstlane_b32 ttmp8, v1
	// SICI: v_readfirstlane_b32 ttmp8, v1 ; encoding: [0x01,0x05,0xf0,0x7e]			// SICI: v_readfirstlane_b32 ttmp8, v1 ; encoding: [0x01,0x05,0xf0,0x7e]
	// VI: v_readfirstlane_b32 ttmp8, v1 ; encoding: [0x01,0x05,0xf0,0x7e]			// VI: v_readfirstlane_b32 ttmp8, v1 ; encoding: [0x01,0x05,0xf0,0x7e]
				// GFX9: v_readfirstlane_b32 ttmp8, v1 ; encoding: [0x01,0x05,0xe8,0x7e]

	buffer_atomic_inc v1, off, ttmp[8:11], 56 glc			buffer_atomic_inc v1, off, ttmp[8:11], 56 glc
	// SICI: buffer_atomic_inc v1, off, ttmp[8:11], 56 glc ; encoding: [0x00,0x40,0xf0,0xe0,0x00,0x01,0x1e,0xb8]			// SICI: buffer_atomic_inc v1, off, ttmp[8:11], 56 glc ; encoding: [0x00,0x40,0xf0,0xe0,0x00,0x01,0x1e,0xb8]
	// VI: buffer_atomic_inc v1, off, ttmp[8:11], 56 glc ; encoding: [0x00,0x40,0x2c,0xe1,0x00,0x01,0x1e,0xb8]			// VI: buffer_atomic_inc v1, off, ttmp[8:11], 56 glc ; encoding: [0x00,0x40,0x2c,0xe1,0x00,0x01,0x1e,0xb8]
				// GFX9: buffer_atomic_inc v1, off, ttmp[8:11], 56 glc ; encoding: [0x00,0x40,0x2c,0xe1,0x00,0x01,0x1d,0xb8]

				// ttmp12..ttmp15 (GFX9 only)

				buffer_atomic_inc v1, off, ttmp[12:15], 56 glc
				// NOSICIVI: error: not a valid operand
				// GFX9: buffer_atomic_inc v1, off, ttmp[12:15], 56 glc ; encoding: [0x00,0x40,0x2c,0xe1,0x00,0x01,0x1e,0xb8]

llvm/trunk/test/MC/AMDGPU/vop1-gfx9-err.s

	// RUN: not llvm-mc -arch=amdgcn -mcpu=gfx901 -show-encoding %s 2>&1 \| FileCheck -check-prefix=GCN %s			// RUN: not llvm-mc -arch=amdgcn -mcpu=gfx900 -show-encoding %s 2>&1 \| FileCheck -check-prefix=GCN %s
	// RUN: not llvm-mc -arch=amdgcn -mcpu=tonga -show-encoding %s 2>&1 \| FileCheck -check-prefix=GCN %s			// RUN: not llvm-mc -arch=amdgcn -mcpu=tonga -show-encoding %s 2>&1 \| FileCheck -check-prefix=GCN %s
	// RUN: not llvm-mc -arch=amdgcn -mcpu=hawaii -show-encoding %s 2>&1 \| FileCheck -check-prefix=GCN %s			// RUN: not llvm-mc -arch=amdgcn -mcpu=hawaii -show-encoding %s 2>&1 \| FileCheck -check-prefix=GCN %s

	v_swap_b32 v1, 1			v_swap_b32 v1, 1
	// GCN: :16: error: invalid operand for instruction			// GCN: :16: error: invalid operand for instruction

	v_swap_b32 v1, s0			v_swap_b32 v1, s0
	// GCN: :16: error: invalid operand for instruction			// GCN: :16: error: invalid operand for instruction
	Show All 16 Lines

llvm/trunk/test/MC/AMDGPU/vop_sdwa.s

	Show First 20 Lines • Show All 688 Lines • ▼ Show 20 Lines

	// NOSICI: error:			// NOSICI: error:
	// NOVI: error:			// NOVI: error:
	// GFX9: v_mov_b32_sdwa v1, exec dst_sel:BYTE_0 dst_unused:UNUSED_PRESERVE src0_sel:DWORD ; encoding: [0xf9,0x02,0x02,0x7e,0x7e,0x10,0x86,0x06]			// GFX9: v_mov_b32_sdwa v1, exec dst_sel:BYTE_0 dst_unused:UNUSED_PRESERVE src0_sel:DWORD ; encoding: [0xf9,0x02,0x02,0x7e,0x7e,0x10,0x86,0x06]
	v_mov_b32 v1, exec dst_sel:BYTE_0 dst_unused:UNUSED_PRESERVE src0_sel:DWORD			v_mov_b32 v1, exec dst_sel:BYTE_0 dst_unused:UNUSED_PRESERVE src0_sel:DWORD

	// NOSICI: error:			// NOSICI: error:
	// NOVI: error:			// NOVI: error:
				// GFX9: v_mov_b32_sdwa v1, ttmp12 dst_sel:BYTE_0 dst_unused:UNUSED_PRESERVE src0_sel:DWORD ; encoding: [0xf9,0x02,0x02,0x7e,0x78,0x10,0x86,0x06]
				v_mov_b32_sdwa v1, ttmp12 dst_sel:BYTE_0 dst_unused:UNUSED_PRESERVE src0_sel:DWORD

				// NOSICI: error:
				// NOVI: error:
	// GFX9: v_add_f32_sdwa v0, s0, v0 dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:WORD_1 src1_sel:BYTE_2 ; encoding: [0xf9,0x00,0x00,0x02,0x00,0x06,0x85,0x02]			// GFX9: v_add_f32_sdwa v0, s0, v0 dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:WORD_1 src1_sel:BYTE_2 ; encoding: [0xf9,0x00,0x00,0x02,0x00,0x06,0x85,0x02]
	v_add_f32 v0, s0, v0 dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:WORD_1 src1_sel:BYTE_2			v_add_f32 v0, s0, v0 dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:WORD_1 src1_sel:BYTE_2

	// NOSICI: error:			// NOSICI: error:
	// NOVI: error:			// NOVI: error:
	// GFX9: v_add_f32_sdwa v0, v0, s22 dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:WORD_1 src1_sel:BYTE_2 ; encoding: [0xf9,0x2c,0x00,0x02,0x00,0x06,0x05,0x82]			// GFX9: v_add_f32_sdwa v0, v0, s22 dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:WORD_1 src1_sel:BYTE_2 ; encoding: [0xf9,0x2c,0x00,0x02,0x00,0x06,0x05,0x82]
	v_add_f32 v0, v0, s22 dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:WORD_1 src1_sel:BYTE_2			v_add_f32 v0, v0, s22 dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:WORD_1 src1_sel:BYTE_2

	// NOSICI: error:			// NOSICI: error:
	// NOVI: error:			// NOVI: error:
	// NO: invalid operand (violates constant bus restrictions)			// NO: invalid operand (violates constant bus restrictions)
	v_add_f32 v0, exec, vcc dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:WORD_1 src1_sel:BYTE_2			v_add_f32 v0, exec, vcc dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:WORD_1 src1_sel:BYTE_2

	// NOSICI: error:			// NOSICI: error:
	// NOVI: error:			// NOVI: error:
				// NO: error: not a valid operand
				v_add_f32 v0, v1, tba_lo dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:WORD_1 src1_sel:BYTE_2

				// NOSICI: error:
				// NOVI: error:
				// NO: error: not a valid operand
				v_add_f32 v0, v1, tma_hi dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:WORD_1 src1_sel:BYTE_2

				// NOSICI: error:
				// NOVI: error:
	// GFX9: v_cmp_eq_f32_sdwa vcc, s1, v2 src0_sel:WORD_1 src1_sel:BYTE_2 ; encoding: [0xf9,0x04,0x84,0x7c,0x01,0x00,0x85,0x02]			// GFX9: v_cmp_eq_f32_sdwa vcc, s1, v2 src0_sel:WORD_1 src1_sel:BYTE_2 ; encoding: [0xf9,0x04,0x84,0x7c,0x01,0x00,0x85,0x02]
	v_cmp_eq_f32_sdwa vcc, s1, v2 src0_sel:WORD_1 src1_sel:BYTE_2			v_cmp_eq_f32_sdwa vcc, s1, v2 src0_sel:WORD_1 src1_sel:BYTE_2

	// NOSICI: error:			// NOSICI: error:
	// NOVI: error:			// NOVI: error:
	// GFX9: v_cmp_eq_f32_sdwa vcc, v1, s22 src0_sel:WORD_1 src1_sel:BYTE_2 ; encoding: [0xf9,0x2c,0x84,0x7c,0x01,0x00,0x05,0x82]			// GFX9: v_cmp_eq_f32_sdwa vcc, v1, s22 src0_sel:WORD_1 src1_sel:BYTE_2 ; encoding: [0xf9,0x2c,0x84,0x7c,0x01,0x00,0x05,0x82]
	v_cmp_eq_f32_sdwa vcc, v1, s22 src0_sel:WORD_1 src1_sel:BYTE_2			v_cmp_eq_f32_sdwa vcc, v1, s22 src0_sel:WORD_1 src1_sel:BYTE_2

	// NOSICI: error:			// NOSICI: error:
	// NOVI: error:			// NOVI: error:
				// GFX9: v_cmp_eq_f32_sdwa ttmp[12:13], v1, v2 src0_sel:WORD_1 src1_sel:BYTE_2 ; encoding: [0xf9,0x04,0x84,0x7c,0x01,0xf8,0x05,0x02]
				v_cmp_eq_f32_sdwa ttmp[12:13], v1, v2 src0_sel:WORD_1 src1_sel:BYTE_2

				// NOSICI: error:
				// NOVI: error:
				// NO: error: not a valid operand
				v_cmp_eq_f32_sdwa tba, v1, v2 src0_sel:WORD_1 src1_sel:BYTE_2

				// NOSICI: error:
				// NOVI: error:
				// NO: error: not a valid operand
				v_cmp_eq_f32_sdwa tma, v1, v2 src0_sel:WORD_1 src1_sel:BYTE_2

				// NOSICI: error:
				// NOVI: error:
				// GFX9: v_cmp_eq_f32_sdwa vcc, v1, ttmp15 src0_sel:WORD_1 src1_sel:BYTE_2 ; encoding: [0xf9,0xf6,0x84,0x7c,0x01,0x00,0x05,0x82]
				v_cmp_eq_f32_sdwa vcc, v1, ttmp15 src0_sel:WORD_1 src1_sel:BYTE_2

				// NOSICI: error:
				// NOVI: error:
	// NOGFX9: error: invalid operand (violates constant bus restrictions)			// NOGFX9: error: invalid operand (violates constant bus restrictions)
	v_cmp_eq_f32_sdwa vcc, exec, vcc src0_sel:WORD_1 src1_sel:BYTE_2			v_cmp_eq_f32_sdwa vcc, exec, vcc src0_sel:WORD_1 src1_sel:BYTE_2

	// NOSICI: error:			// NOSICI: error:
	// NOVI: error:			// NOVI: error:
	// GFX9: v_ceil_f16_sdwa v5, flat_scratch_lo dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:DWORD ; encoding: [0xf9,0x8a,0x0a,0x7e,0x66,0x06,0x86,0x06]			// GFX9: v_ceil_f16_sdwa v5, flat_scratch_lo dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:DWORD ; encoding: [0xf9,0x8a,0x0a,0x7e,0x66,0x06,0x86,0x06]
	v_ceil_f16_sdwa v5, flat_scratch_lo dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:DWORD			v_ceil_f16_sdwa v5, flat_scratch_lo dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:DWORD

	Show All 34 Lines
	// NOVI: error:			// NOVI: error:
	// GFX9: v_add_f32_sdwa v0, v0, v0 mul:2 dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:WORD_1 src1_sel:BYTE_2 ; encoding: [0xf9,0x00,0x00,0x02,0x00,0x46,0x05,0x02]			// GFX9: v_add_f32_sdwa v0, v0, v0 mul:2 dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:WORD_1 src1_sel:BYTE_2 ; encoding: [0xf9,0x00,0x00,0x02,0x00,0x46,0x05,0x02]
	v_add_f32 v0, v0, v0 mul:2 dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:WORD_1 src1_sel:BYTE_2			v_add_f32 v0, v0, v0 mul:2 dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:WORD_1 src1_sel:BYTE_2

	// NOSICI: error:			// NOSICI: error:
	// NOVI: error:			// NOVI: error:
	// GFX9: v_add_f32_sdwa v0, v0, v0 clamp div:2 dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:WORD_1 src1_sel:BYTE_2 ; encoding: [0xf9,0x00,0x00,0x02,0x00,0xe6,0x05,0x02]			// GFX9: v_add_f32_sdwa v0, v0, v0 clamp div:2 dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:WORD_1 src1_sel:BYTE_2 ; encoding: [0xf9,0x00,0x00,0x02,0x00,0xe6,0x05,0x02]
	v_add_f32 v0, v0, v0 clamp div:2 dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:WORD_1 src1_sel:BYTE_2			v_add_f32 v0, v0, v0 clamp div:2 dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:WORD_1 src1_sel:BYTE_2
	No newline at end of file			No newline at end of file

llvm/trunk/test/MC/Disassembler/AMDGPU/sdwa_gfx9.txt

	Show First 20 Lines • Show All 444 Lines • ▼ Show 20 Lines

	#===------------------------------------------------------------------------===#			#===------------------------------------------------------------------------===#
	# Scalar registers are allowed			# Scalar registers are allowed
	#===------------------------------------------------------------------------===#			#===------------------------------------------------------------------------===#

	# GFX9: v_mov_b32_sdwa v1, s2 dst_sel:BYTE_0 dst_unused:UNUSED_PRESERVE src0_sel:DWORD ; encoding: [0xf9,0x02,0x02,0x7e,0x02,0x10,0x86,0x06]			# GFX9: v_mov_b32_sdwa v1, s2 dst_sel:BYTE_0 dst_unused:UNUSED_PRESERVE src0_sel:DWORD ; encoding: [0xf9,0x02,0x02,0x7e,0x02,0x10,0x86,0x06]
	0xf9 0x02 0x02 0x7e 0x02 0x10 0x86 0x06			0xf9 0x02 0x02 0x7e 0x02 0x10 0x86 0x06

				# GFX9: v_mov_b32_sdwa v1, ttmp12 dst_sel:BYTE_0 dst_unused:UNUSED_PRESERVE src0_sel:DWORD ; encoding: [0xf9,0x02,0x02,0x7e,0x78,0x10,0x86,0x06]
				0xf9,0x02,0x02,0x7e,0x78,0x10,0x86,0x06

	# GFX9: v_mov_b32_sdwa v1, exec_lo dst_sel:BYTE_0 dst_unused:UNUSED_PRESERVE src0_sel:DWORD ; encoding: [0xf9,0x02,0x02,0x7e,0x7e,0x10,0x86,0x06]			# GFX9: v_mov_b32_sdwa v1, exec_lo dst_sel:BYTE_0 dst_unused:UNUSED_PRESERVE src0_sel:DWORD ; encoding: [0xf9,0x02,0x02,0x7e,0x7e,0x10,0x86,0x06]
	0xf9 0x02 0x02 0x7e 0x7e 0x10 0x86 0x06			0xf9 0x02 0x02 0x7e 0x7e 0x10 0x86 0x06

	# GFX9: v_add_f32_sdwa v0, s0, v0 dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:WORD_1 src1_sel:BYTE_2 ; encoding: [0xf9,0x00,0x00,0x02,0x00,0x06,0x85,0x02]			# GFX9: v_add_f32_sdwa v0, s0, v0 dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:WORD_1 src1_sel:BYTE_2 ; encoding: [0xf9,0x00,0x00,0x02,0x00,0x06,0x85,0x02]
	0xf9 0x00 0x00 0x02 0x00 0x06 0x85 0x02			0xf9 0x00 0x00 0x02 0x00 0x06 0x85 0x02

	# GFX9: v_add_f32_sdwa v0, v0, s22 dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:WORD_1 src1_sel:BYTE_2 ; encoding: [0xf9,0x2c,0x00,0x02,0x00,0x06,0x05,0x82]			# GFX9: v_add_f32_sdwa v0, v0, s22 dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:WORD_1 src1_sel:BYTE_2 ; encoding: [0xf9,0x2c,0x00,0x02,0x00,0x06,0x05,0x82]
	0xf9 0x2c 0x00 0x02 0x00 0x06 0x05 0x82			0xf9 0x2c 0x00 0x02 0x00 0x06 0x05 0x82

	# GFX9: v_cmp_eq_f32_sdwa vcc, s1, v2 src0_sel:WORD_1 src1_sel:BYTE_2 ; encoding: [0xf9,0x04,0x84,0x7c,0x01,0x00,0x85,0x02]			# GFX9: v_cmp_eq_f32_sdwa vcc, s1, v2 src0_sel:WORD_1 src1_sel:BYTE_2 ; encoding: [0xf9,0x04,0x84,0x7c,0x01,0x00,0x85,0x02]
	0xf9 0x04 0x84 0x7c 0x01 0x00 0x85 0x02			0xf9 0x04 0x84 0x7c 0x01 0x00 0x85 0x02

	# GFX9: v_cmp_eq_f32_sdwa vcc, v1, s22 src0_sel:WORD_1 src1_sel:BYTE_2 ; encoding: [0xf9,0x2c,0x84,0x7c,0x01,0x00,0x05,0x82]			# GFX9: v_cmp_eq_f32_sdwa vcc, v1, s22 src0_sel:WORD_1 src1_sel:BYTE_2 ; encoding: [0xf9,0x2c,0x84,0x7c,0x01,0x00,0x05,0x82]
	0xf9 0x2c 0x84 0x7c 0x01 0x00 0x05 0x82			0xf9 0x2c 0x84 0x7c 0x01 0x00 0x05 0x82

				# GFX9: v_cmp_eq_f32_sdwa vcc, v1, ttmp15 src0_sel:WORD_1 src1_sel:BYTE_2 ; encoding: [0xf9,0xf6,0x84,0x7c,0x01,0x00,0x05,0x82]
				0xf9,0xf6,0x84,0x7c,0x01,0x00,0x05,0x82

	#===------------------------------------------------------------------------===#			#===------------------------------------------------------------------------===#
	# VOPC with arbitrary SGPR destination			# VOPC with arbitrary SGPR destination
	#===------------------------------------------------------------------------===#			#===------------------------------------------------------------------------===#

	# GFX9: v_cmp_eq_f32_sdwa s[2:3], v1, v2 src0_sel:WORD_1 src1_sel:BYTE_2 ; encoding: [0xf9,0x04,0x84,0x7c,0x01,0x82,0x05,0x02]			# GFX9: v_cmp_eq_f32_sdwa s[2:3], v1, v2 src0_sel:WORD_1 src1_sel:BYTE_2 ; encoding: [0xf9,0x04,0x84,0x7c,0x01,0x82,0x05,0x02]
	0xf9 0x04 0x84 0x7c 0x01 0x82 0x05 0x02			0xf9 0x04 0x84 0x7c 0x01 0x82 0x05 0x02

				# GFX9: v_cmp_eq_f32_sdwa ttmp[12:13], v1, v2 src0_sel:WORD_1 src1_sel:BYTE_2 ; encoding: [0xf9,0x04,0x84,0x7c,0x01,0xf8,0x05,0x02]
				0xf9,0x04,0x84,0x7c,0x01,0xf8,0x05,0x02

	# GFX9: v_cmp_eq_f32_sdwa exec, v1, v2 src0_sel:WORD_1 src1_sel:BYTE_2 ; encoding: [0xf9,0x04,0x84,0x7c,0x01,0xfe,0x05,0x02]			# GFX9: v_cmp_eq_f32_sdwa exec, v1, v2 src0_sel:WORD_1 src1_sel:BYTE_2 ; encoding: [0xf9,0x04,0x84,0x7c,0x01,0xfe,0x05,0x02]
	0xf9 0x04 0x84 0x7c 0x01 0xfe 0x05 0x02			0xf9 0x04 0x84 0x7c 0x01 0xfe 0x05 0x02

	# GFX9: v_cmp_eq_f32_sdwa exec, s2, v2 src0_sel:WORD_1 src1_sel:BYTE_2 ; encoding: [0xf9,0x04,0x84,0x7c,0x02,0xfe,0x85,0x02]			# GFX9: v_cmp_eq_f32_sdwa exec, s2, v2 src0_sel:WORD_1 src1_sel:BYTE_2 ; encoding: [0xf9,0x04,0x84,0x7c,0x02,0xfe,0x85,0x02]
	0xf9 0x04 0x84 0x7c 0x02 0xfe 0x85 0x02			0xf9 0x04 0x84 0x7c 0x02 0xfe 0x85 0x02

	#===------------------------------------------------------------------------===#			#===------------------------------------------------------------------------===#
	# OMod output modifier allowed			# OMod output modifier allowed
	Show All 13 Lines

llvm/trunk/test/MC/Disassembler/AMDGPU/trap_gfx9.txt

				# RUN: llvm-mc -arch=amdgcn -mcpu=gfx900 -disassemble -show-encoding < %s \| FileCheck %s -check-prefix=GFX9

				#===----------------------------------------------------------------------===#
				# Trap Handler related - 32 bit registers
				#===----------------------------------------------------------------------===#

				# GFX9: s_add_u32 ttmp0, ttmp0, 4 ; encoding: [0x6c,0x84,0x6c,0x80]
				0x6c,0x84,0x6c,0x80

				# GFX9: s_add_u32 ttmp4, 8, ttmp4 ; encoding: [0x88,0x70,0x70,0x80]
				0x88,0x70,0x70,0x80

				# GFX9: s_add_u32 ttmp4, ttmp4, 0x100 ; encoding: [0x70,0xff,0x70,0x80,0x00,0x01,0x00,0x00]
				0x70,0xff,0x70,0x80,0x00,0x01,0x00,0x00

				# GFX9: s_add_u32 ttmp4, ttmp4, 4 ; encoding: [0x70,0x84,0x70,0x80]
				0x70,0x84,0x70,0x80

				# GFX9: s_add_u32 ttmp4, ttmp8, ttmp4 ; encoding: [0x74,0x70,0x70,0x80]
				0x74,0x70,0x70,0x80

				# GFX9: s_and_b32 ttmp10, ttmp8, 0x80 ; encoding: [0x74,0xff,0x76,0x86,0x80,0x00,0x00,0x00]
				0x74,0xff,0x76,0x86,0x80,0x00,0x00,0x00

				# GFX9: s_and_b32 ttmp9, ttmp9, 0x1ff ; encoding: [0x75,0xff,0x75,0x86,0xff,0x01,0x00,0x00]
				0x75,0xff,0x75,0x86,0xff,0x01,0x00,0x00

				# GFX9: s_and_b32 ttmp9, ttmp9, ttmp8 ; encoding: [0x75,0x74,0x75,0x86]
				0x75,0x74,0x75,0x86

				# GFX9: s_and_b32 ttmp8, ttmp1, 0x1000000 ; encoding: [0x6d,0xff,0x74,0x86,0x00,0x00,0x00,0x01]
				0x6d,0xff,0x74,0x86,0x00,0x00,0x00,0x01

				# GFX9: s_cmp_eq_i32 ttmp8, 0 ; encoding: [0x74,0x80,0x00,0xbf]
				0x74,0x80,0x00,0xbf

				# GFX9: s_cmp_eq_i32 ttmp8, 0xfe ; encoding: [0x74,0xff,0x00,0xbf,0xfe,0x00,0x00,0x00]
				0x74,0xff,0x00,0xbf,0xfe,0x00,0x00,0x00

				# GFX9: s_lshr_b32 ttmp8, ttmp8, 12 ; encoding: [0x74,0x8c,0x74,0x8f]
				0x74,0x8c,0x74,0x8f

				# GFX9: v_mov_b32_e32 v1, ttmp8 ; encoding: [0x74,0x02,0x02,0x7e]
				0x74,0x02,0x02,0x7e

				# GFX9: s_mov_b32 m0, ttmp8 ; encoding: [0x74,0x00,0xfc,0xbe]
				0x74,0x00,0xfc,0xbe

				# GFX9: s_mov_b32 ttmp10, 0 ; encoding: [0x80,0x00,0xf6,0xbe]
				0x80,0x00,0xf6,0xbe

				# GFX9: s_mov_b32 ttmp11, 0x1024fac ; encoding: [0xff,0x00,0xf7,0xbe,0xac,0x4f,0x02,0x01]
				0xff,0x00,0xf7,0xbe,0xac,0x4f,0x02,0x01

				# GFX9: s_mov_b32 ttmp8, m0 ; encoding: [0x7c,0x00,0xf4,0xbe]
				0x7c,0x00,0xf4,0xbe

				# GFX9: s_mul_i32 ttmp8, 0x324, ttmp8 ; encoding: [0xff,0x74,0x74,0x92,0x24,0x03,0x00,0x00]
				0xff,0x74,0x74,0x92,0x24,0x03,0x00,0x00

				# GFX9: s_or_b32 ttmp9, ttmp9, 0x280000 ; encoding: [0x75,0xff,0x75,0x87,0x00,0x00,0x28,0x00]
				0x75,0xff,0x75,0x87,0x00,0x00,0x28,0x00

				# GFX9: s_add_u32 ttmp0, ttmp12, 4 ; encoding: [0x78,0x84,0x6c,0x80]
				0x78,0x84,0x6c,0x80

				# GFX9: s_add_u32 ttmp0, ttmp13, 4 ; encoding: [0x79,0x84,0x6c,0x80]
				0x79,0x84,0x6c,0x80

				# GFX9: s_add_u32 ttmp0, ttmp14, 4 ; encoding: [0x7a,0x84,0x6c,0x80]
				0x7a,0x84,0x6c,0x80

				# GFX9: s_add_u32 ttmp0, ttmp15, 4 ; encoding: [0x7b,0x84,0x6c,0x80]
				0x7b,0x84,0x6c,0x80

				#===----------------------------------------------------------------------===#
				# Trap Handler related - Pairs of registers
				#===----------------------------------------------------------------------===#

				# GFX9: s_mov_b64 ttmp[4:5], exec ; encoding: [0x7e,0x01,0xf0,0xbe]
				0x7e,0x01,0xf0,0xbe

				# GFX9: s_mov_b64 ttmp[4:5], exec ; encoding: [0x7e,0x01,0xf0,0xbe]
				0x7e,0x01,0xf0,0xbe

				# GFX9: s_mov_b64 exec, ttmp[4:5] ; encoding: [0x70,0x01,0xfe,0xbe]
				0x70,0x01,0xfe,0xbe

				# GFX9: s_mov_b64 ttmp[12:13], exec ; encoding: [0x7e,0x01,0xf8,0xbe]
				0x7e,0x01,0xf8,0xbe

				# GFX9: s_mov_b64 ttmp[14:15], exec ; encoding: [0x7e,0x01,0xfa,0xbe]
				0x7e,0x01,0xfa,0xbe

				#===----------------------------------------------------------------------===#
				# Trap Handler related - Some specific instructions and quadruples of registers
				#===----------------------------------------------------------------------===#

				# GFX9: s_setpc_b64 ttmp[2:3] ; encoding: [0x6e,0x1d,0x80,0xbe]
				0x6e,0x1d,0x80,0xbe

				# GFX9: v_readfirstlane_b32 ttmp8, v1 ; encoding: [0x01,0x05,0xe8,0x7e]
				0x01,0x05,0xe8,0x7e

				# GFX9: buffer_atomic_inc v1, off, ttmp[8:11], 56 glc ; encoding: [0x00,0x40,0x2c,0xe1,0x00,0x01,0x1d,0xb8]
				0x00,0x40,0x2c,0xe1,0x00,0x01,0x1d,0xb8

				# GFX9: buffer_atomic_inc v1, off, ttmp[12:15], 56 glc ; encoding: [0x00,0x40,0x2c,0xe1,0x00,0x01,0x1e,0xb8]
				0x00,0x40,0x2c,0xe1,0x00,0x01,0x1e,0xb8

This is an archive of the discontinued LLVM Phabricator instance.

[AMDGPU][MC][GFX9] Corrected encoding of ttmp registers, disabled tba/tmaClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 126360

llvm/trunk/lib/Target/AMDGPU/AsmParser/AMDGPUAsmParser.cpp

llvm/trunk/lib/Target/AMDGPU/Disassembler/AMDGPUDisassembler.h

llvm/trunk/lib/Target/AMDGPU/Disassembler/AMDGPUDisassembler.cpp

llvm/trunk/lib/Target/AMDGPU/InstPrinter/AMDGPUInstPrinter.cpp

llvm/trunk/lib/Target/AMDGPU/SIDefines.h

llvm/trunk/lib/Target/AMDGPU/SIRegisterInfo.cpp

llvm/trunk/lib/Target/AMDGPU/SIRegisterInfo.td

llvm/trunk/lib/Target/AMDGPU/Utils/AMDGPUBaseInfo.cpp

llvm/trunk/test/MC/AMDGPU/literalv216-err.s

llvm/trunk/test/MC/AMDGPU/trap.s

llvm/trunk/test/MC/AMDGPU/vop1-gfx9-err.s

llvm/trunk/test/MC/AMDGPU/vop_sdwa.s

llvm/trunk/test/MC/Disassembler/AMDGPU/sdwa_gfx9.txt

llvm/trunk/test/MC/Disassembler/AMDGPU/trap_gfx9.txt

[AMDGPU][MC][GFX9] Corrected encoding of ttmp registers, disabled tba/tma
ClosedPublic