This is an archive of the discontinued LLVM Phabricator instance.

Paths

Table of Contentst

-
llvm/
-
lib/Target/NVPTX/
-
Target/
-
NVPTX/
-
NVPTXISelDAGToDAG.cpp
-
NVPTXIntrinsics.td
-
NVPTXReplaceImageHandles.cpp
-
test/CodeGen/NVPTX/
-
CodeGen/
-
NVPTX/
-
surf-read-cuda.ll
-
surf-read.ll
-
surf-write-cuda.ll
-
surf-write.ll
-
tex-read-cuda.ll
-
tex-read.ll
-
texsurf-queries.ll

Differential D112232

[NVPTX] Add imm variants for surface and texture instructions
ClosedPublic

Authored by asavonic on Oct 21 2021, 9:44 AM.

Download Raw Diff

Details

Reviewers

tra
jlebar
jholewinski
a.sidorin

Commits

rG00aa0aeb067b: [NVPTX] Add imm variants for surface and texture instructions

Summary

Texture/sampler/surface target operands can be either a register or
an immediate (an index of .texref, .samplerref or .surfref).

TableGen declarations for these instructions used to have only
Int64Regs operands, so this caused issues when machine verifier
is turned on:

*** Bad machine code: Expected a register operand. ***
- function:    bar
- basic block: %bb.0  (0x55b144d99ab8)
- instruction: %4:int32regs = SULD_1D_I32_TRAP 0, killed %2:int32regs
- operand 1:   0

The solution is to duplicate these instructions for all possible
operand types (i16imm and Int64Regs). Since this would
essentially double the amount code in TableGen, the patch also
does some refactoring for the original instructions to keep
things manageable.

Diff Detail

Repository: rG LLVM Github Monorepo

Event Timeline

asavonic created this revision.Oct 21 2021, 9:44 AM

Herald added a reviewer: a.sidorin. · View Herald TranscriptOct 21 2021, 9:44 AM

Herald added a subscriber: hiraditya. · View Herald Transcript

asavonic requested review of this revision.Oct 21 2021, 9:44 AM

Herald added a project: Restricted Project. · View Herald TranscriptOct 21 2021, 9:44 AM

Herald added subscribers: llvm-commits, jdoerfert. · View Herald Transcript

LGTM in general.

I wonder if we could find a less verbose way to translate _R ->_I enums. E.g figure out if we can define _I variants as _R + fixed offset.

Harbormaster completed remote builds in B129969: Diff 381297.Oct 21 2021, 10:20 AM

In D112232#3078458, @tra wrote:

LGTM in general.

I wonder if we could find a less verbose way to translate _R ->_I enums. E.g figure out if we can define _I variants as _R + fixed offset.

It is possible, but we have to rename opcodes to make it work. GRAD and LEVEL variants break the ordering.

TEX_1D_F32_F32_GRAD_II	= 2995,     // <---- these 4 are ordered correctly
TEX_1D_F32_F32_GRAD_IR	= 2996,
TEX_1D_F32_F32_GRAD_RI	= 2997,
TEX_1D_F32_F32_GRAD_RR	= 2998,
TEX_1D_F32_F32_II	= 2999,             // <---- these are not ordered
TEX_1D_F32_F32_IR	= 3000,
TEX_1D_F32_F32_LEVEL_II	= 3001,
TEX_1D_F32_F32_LEVEL_IR	= 3002,
TEX_1D_F32_F32_LEVEL_RI	= 3003,
TEX_1D_F32_F32_LEVEL_RR	= 3004,
TEX_1D_F32_F32_RI	= 3005,
TEX_1D_F32_F32_RR	= 3006,

Although I think that this can make this code a bit more fragile. If someone changes the tablegen file and accidentally breaks the ordering, this pass will silently break.

Please let me know if the patch is acceptable, or we need to change anything.

The changes look good in general. Thank you for cleaning this up.

I'm still a bit concerned about all the boilerplate changes that we don't have good test coverage for. Granted, that's been the way since the initial implementation of texture/surface instructions and this patch is clearly an improvement.
We may need to eventually autogenerate the tests for all instruction variants, similarly to what we do for *MMA instructions. https://github.com/llvm/llvm-project/blob/main/llvm/test/CodeGen/NVPTX/wmma.py

This revision is now accepted and ready to land.Nov 9 2021, 11:28 AM

In D112232#3119329, @tra wrote:

The changes look good in general. Thank you for cleaning this up.

I'm still a bit concerned about all the boilerplate changes that we don't have good test coverage for. Granted, that's been the way since the initial implementation of texture/surface instructions and this patch is clearly an improvement.
We may need to eventually autogenerate the tests for all instruction variants, similarly to what we do for *MMA instructions. https://github.com/llvm/llvm-project/blob/main/llvm/test/CodeGen/NVPTX/wmma.py

Agree. Independent test suite based on the PTX spec would be a really nice thing to have. I checked the patch several times and it seems there are no more errors, but it is really hard to verify without the tests.

Closed by commit rG00aa0aeb067b: [NVPTX] Add imm variants for surface and texture instructions (authored by asavonic). · Explain WhyNov 10 2021, 8:06 AM

This revision was automatically updated to reflect the committed changes.

asavonic added a commit: rG00aa0aeb067b: [NVPTX] Add imm variants for surface and texture instructions.

asavonic mentioned this in D114367: [NVPTX] Auto-generate tests for sufrace and texture instructions.Nov 22 2021, 6:46 AM

asavonic mentioned this in rGe29ba97d236c: [NVPTX] Auto-generate tests for sufrace and texture instructions.Dec 7 2021, 4:29 AM

Revision Contents

Path

Size

llvm/

lib/

Target/

NVPTX/

NVPTXISelDAGToDAG.cpp

666 lines

NVPTXIntrinsics.td

6029 lines

NVPTXReplaceImageHandles.cpp

1677 lines

test/

CodeGen/

NVPTX/

4 lines

2 lines

4 lines

2 lines

4 lines

2 lines

4 lines

Diff 386175

llvm/lib/Target/NVPTX/NVPTXISelDAGToDAG.cpp

	Show First 20 Lines • Show All 2,342 Lines • ▼ Show 20 Lines
	}			}

	bool NVPTXDAGToDAGISel::tryTextureIntrinsic(SDNode *N) {			bool NVPTXDAGToDAGISel::tryTextureIntrinsic(SDNode *N) {
	unsigned Opc = 0;			unsigned Opc = 0;

	switch (N->getOpcode()) {			switch (N->getOpcode()) {
	default: return false;			default: return false;
	case NVPTXISD::Tex1DFloatS32:			case NVPTXISD::Tex1DFloatS32:
	Opc = NVPTX::TEX_1D_F32_S32;			Opc = NVPTX::TEX_1D_F32_S32_RR;
	break;			break;
	case NVPTXISD::Tex1DFloatFloat:			case NVPTXISD::Tex1DFloatFloat:
	Opc = NVPTX::TEX_1D_F32_F32;			Opc = NVPTX::TEX_1D_F32_F32_RR;
	break;			break;
	case NVPTXISD::Tex1DFloatFloatLevel:			case NVPTXISD::Tex1DFloatFloatLevel:
	Opc = NVPTX::TEX_1D_F32_F32_LEVEL;			Opc = NVPTX::TEX_1D_F32_F32_LEVEL_RR;
	break;			break;
	case NVPTXISD::Tex1DFloatFloatGrad:			case NVPTXISD::Tex1DFloatFloatGrad:
	Opc = NVPTX::TEX_1D_F32_F32_GRAD;			Opc = NVPTX::TEX_1D_F32_F32_GRAD_RR;
	break;			break;
	case NVPTXISD::Tex1DS32S32:			case NVPTXISD::Tex1DS32S32:
	Opc = NVPTX::TEX_1D_S32_S32;			Opc = NVPTX::TEX_1D_S32_S32_RR;
	break;			break;
	case NVPTXISD::Tex1DS32Float:			case NVPTXISD::Tex1DS32Float:
	Opc = NVPTX::TEX_1D_S32_F32;			Opc = NVPTX::TEX_1D_S32_F32_RR;
	break;			break;
	case NVPTXISD::Tex1DS32FloatLevel:			case NVPTXISD::Tex1DS32FloatLevel:
	Opc = NVPTX::TEX_1D_S32_F32_LEVEL;			Opc = NVPTX::TEX_1D_S32_F32_LEVEL_RR;
	break;			break;
	case NVPTXISD::Tex1DS32FloatGrad:			case NVPTXISD::Tex1DS32FloatGrad:
	Opc = NVPTX::TEX_1D_S32_F32_GRAD;			Opc = NVPTX::TEX_1D_S32_F32_GRAD_RR;
	break;			break;
	case NVPTXISD::Tex1DU32S32:			case NVPTXISD::Tex1DU32S32:
	Opc = NVPTX::TEX_1D_U32_S32;			Opc = NVPTX::TEX_1D_U32_S32_RR;
	break;			break;
	case NVPTXISD::Tex1DU32Float:			case NVPTXISD::Tex1DU32Float:
	Opc = NVPTX::TEX_1D_U32_F32;			Opc = NVPTX::TEX_1D_U32_F32_RR;
	break;			break;
	case NVPTXISD::Tex1DU32FloatLevel:			case NVPTXISD::Tex1DU32FloatLevel:
	Opc = NVPTX::TEX_1D_U32_F32_LEVEL;			Opc = NVPTX::TEX_1D_U32_F32_LEVEL_RR;
	break;			break;
	case NVPTXISD::Tex1DU32FloatGrad:			case NVPTXISD::Tex1DU32FloatGrad:
	Opc = NVPTX::TEX_1D_U32_F32_GRAD;			Opc = NVPTX::TEX_1D_U32_F32_GRAD_RR;
	break;			break;
	case NVPTXISD::Tex1DArrayFloatS32:			case NVPTXISD::Tex1DArrayFloatS32:
	Opc = NVPTX::TEX_1D_ARRAY_F32_S32;			Opc = NVPTX::TEX_1D_ARRAY_F32_S32_RR;
	break;			break;
	case NVPTXISD::Tex1DArrayFloatFloat:			case NVPTXISD::Tex1DArrayFloatFloat:
	Opc = NVPTX::TEX_1D_ARRAY_F32_F32;			Opc = NVPTX::TEX_1D_ARRAY_F32_F32_RR;
	break;			break;
	case NVPTXISD::Tex1DArrayFloatFloatLevel:			case NVPTXISD::Tex1DArrayFloatFloatLevel:
	Opc = NVPTX::TEX_1D_ARRAY_F32_F32_LEVEL;			Opc = NVPTX::TEX_1D_ARRAY_F32_F32_LEVEL_RR;
	break;			break;
	case NVPTXISD::Tex1DArrayFloatFloatGrad:			case NVPTXISD::Tex1DArrayFloatFloatGrad:
	Opc = NVPTX::TEX_1D_ARRAY_F32_F32_GRAD;			Opc = NVPTX::TEX_1D_ARRAY_F32_F32_GRAD_RR;
	break;			break;
	case NVPTXISD::Tex1DArrayS32S32:			case NVPTXISD::Tex1DArrayS32S32:
	Opc = NVPTX::TEX_1D_ARRAY_S32_S32;			Opc = NVPTX::TEX_1D_ARRAY_S32_S32_RR;
	break;			break;
	case NVPTXISD::Tex1DArrayS32Float:			case NVPTXISD::Tex1DArrayS32Float:
	Opc = NVPTX::TEX_1D_ARRAY_S32_F32;			Opc = NVPTX::TEX_1D_ARRAY_S32_F32_RR;
	break;			break;
	case NVPTXISD::Tex1DArrayS32FloatLevel:			case NVPTXISD::Tex1DArrayS32FloatLevel:
	Opc = NVPTX::TEX_1D_ARRAY_S32_F32_LEVEL;			Opc = NVPTX::TEX_1D_ARRAY_S32_F32_LEVEL_RR;
	break;			break;
	case NVPTXISD::Tex1DArrayS32FloatGrad:			case NVPTXISD::Tex1DArrayS32FloatGrad:
	Opc = NVPTX::TEX_1D_ARRAY_S32_F32_GRAD;			Opc = NVPTX::TEX_1D_ARRAY_S32_F32_GRAD_RR;
	break;			break;
	case NVPTXISD::Tex1DArrayU32S32:			case NVPTXISD::Tex1DArrayU32S32:
	Opc = NVPTX::TEX_1D_ARRAY_U32_S32;			Opc = NVPTX::TEX_1D_ARRAY_U32_S32_RR;
	break;			break;
	case NVPTXISD::Tex1DArrayU32Float:			case NVPTXISD::Tex1DArrayU32Float:
	Opc = NVPTX::TEX_1D_ARRAY_U32_F32;			Opc = NVPTX::TEX_1D_ARRAY_U32_F32_RR;
	break;			break;
	case NVPTXISD::Tex1DArrayU32FloatLevel:			case NVPTXISD::Tex1DArrayU32FloatLevel:
	Opc = NVPTX::TEX_1D_ARRAY_U32_F32_LEVEL;			Opc = NVPTX::TEX_1D_ARRAY_U32_F32_LEVEL_RR;
	break;			break;
	case NVPTXISD::Tex1DArrayU32FloatGrad:			case NVPTXISD::Tex1DArrayU32FloatGrad:
	Opc = NVPTX::TEX_1D_ARRAY_U32_F32_GRAD;			Opc = NVPTX::TEX_1D_ARRAY_U32_F32_GRAD_RR;
	break;			break;
	case NVPTXISD::Tex2DFloatS32:			case NVPTXISD::Tex2DFloatS32:
	Opc = NVPTX::TEX_2D_F32_S32;			Opc = NVPTX::TEX_2D_F32_S32_RR;
	break;			break;
	case NVPTXISD::Tex2DFloatFloat:			case NVPTXISD::Tex2DFloatFloat:
	Opc = NVPTX::TEX_2D_F32_F32;			Opc = NVPTX::TEX_2D_F32_F32_RR;
	break;			break;
	case NVPTXISD::Tex2DFloatFloatLevel:			case NVPTXISD::Tex2DFloatFloatLevel:
	Opc = NVPTX::TEX_2D_F32_F32_LEVEL;			Opc = NVPTX::TEX_2D_F32_F32_LEVEL_RR;
	break;			break;
	case NVPTXISD::Tex2DFloatFloatGrad:			case NVPTXISD::Tex2DFloatFloatGrad:
	Opc = NVPTX::TEX_2D_F32_F32_GRAD;			Opc = NVPTX::TEX_2D_F32_F32_GRAD_RR;
	break;			break;
	case NVPTXISD::Tex2DS32S32:			case NVPTXISD::Tex2DS32S32:
	Opc = NVPTX::TEX_2D_S32_S32;			Opc = NVPTX::TEX_2D_S32_S32_RR;
	break;			break;
	case NVPTXISD::Tex2DS32Float:			case NVPTXISD::Tex2DS32Float:
	Opc = NVPTX::TEX_2D_S32_F32;			Opc = NVPTX::TEX_2D_S32_F32_RR;
	break;			break;
	case NVPTXISD::Tex2DS32FloatLevel:			case NVPTXISD::Tex2DS32FloatLevel:
	Opc = NVPTX::TEX_2D_S32_F32_LEVEL;			Opc = NVPTX::TEX_2D_S32_F32_LEVEL_RR;
	break;			break;
	case NVPTXISD::Tex2DS32FloatGrad:			case NVPTXISD::Tex2DS32FloatGrad:
	Opc = NVPTX::TEX_2D_S32_F32_GRAD;			Opc = NVPTX::TEX_2D_S32_F32_GRAD_RR;
	break;			break;
	case NVPTXISD::Tex2DU32S32:			case NVPTXISD::Tex2DU32S32:
	Opc = NVPTX::TEX_2D_U32_S32;			Opc = NVPTX::TEX_2D_U32_S32_RR;
	break;			break;
	case NVPTXISD::Tex2DU32Float:			case NVPTXISD::Tex2DU32Float:
	Opc = NVPTX::TEX_2D_U32_F32;			Opc = NVPTX::TEX_2D_U32_F32_RR;
	break;			break;
	case NVPTXISD::Tex2DU32FloatLevel:			case NVPTXISD::Tex2DU32FloatLevel:
	Opc = NVPTX::TEX_2D_U32_F32_LEVEL;			Opc = NVPTX::TEX_2D_U32_F32_LEVEL_RR;
	break;			break;
	case NVPTXISD::Tex2DU32FloatGrad:			case NVPTXISD::Tex2DU32FloatGrad:
	Opc = NVPTX::TEX_2D_U32_F32_GRAD;			Opc = NVPTX::TEX_2D_U32_F32_GRAD_RR;
	break;			break;
	case NVPTXISD::Tex2DArrayFloatS32:			case NVPTXISD::Tex2DArrayFloatS32:
	Opc = NVPTX::TEX_2D_ARRAY_F32_S32;			Opc = NVPTX::TEX_2D_ARRAY_F32_S32_RR;
	break;			break;
	case NVPTXISD::Tex2DArrayFloatFloat:			case NVPTXISD::Tex2DArrayFloatFloat:
	Opc = NVPTX::TEX_2D_ARRAY_F32_F32;			Opc = NVPTX::TEX_2D_ARRAY_F32_F32_RR;
	break;			break;
	case NVPTXISD::Tex2DArrayFloatFloatLevel:			case NVPTXISD::Tex2DArrayFloatFloatLevel:
	Opc = NVPTX::TEX_2D_ARRAY_F32_F32_LEVEL;			Opc = NVPTX::TEX_2D_ARRAY_F32_F32_LEVEL_RR;
	break;			break;
	case NVPTXISD::Tex2DArrayFloatFloatGrad:			case NVPTXISD::Tex2DArrayFloatFloatGrad:
	Opc = NVPTX::TEX_2D_ARRAY_F32_F32_GRAD;			Opc = NVPTX::TEX_2D_ARRAY_F32_F32_GRAD_RR;
	break;			break;
	case NVPTXISD::Tex2DArrayS32S32:			case NVPTXISD::Tex2DArrayS32S32:
	Opc = NVPTX::TEX_2D_ARRAY_S32_S32;			Opc = NVPTX::TEX_2D_ARRAY_S32_S32_RR;
	break;			break;
	case NVPTXISD::Tex2DArrayS32Float:			case NVPTXISD::Tex2DArrayS32Float:
	Opc = NVPTX::TEX_2D_ARRAY_S32_F32;			Opc = NVPTX::TEX_2D_ARRAY_S32_F32_RR;
	break;			break;
	case NVPTXISD::Tex2DArrayS32FloatLevel:			case NVPTXISD::Tex2DArrayS32FloatLevel:
	Opc = NVPTX::TEX_2D_ARRAY_S32_F32_LEVEL;			Opc = NVPTX::TEX_2D_ARRAY_S32_F32_LEVEL_RR;
	break;			break;
	case NVPTXISD::Tex2DArrayS32FloatGrad:			case NVPTXISD::Tex2DArrayS32FloatGrad:
	Opc = NVPTX::TEX_2D_ARRAY_S32_F32_GRAD;			Opc = NVPTX::TEX_2D_ARRAY_S32_F32_GRAD_RR;
	break;			break;
	case NVPTXISD::Tex2DArrayU32S32:			case NVPTXISD::Tex2DArrayU32S32:
	Opc = NVPTX::TEX_2D_ARRAY_U32_S32;			Opc = NVPTX::TEX_2D_ARRAY_U32_S32_RR;
	break;			break;
	case NVPTXISD::Tex2DArrayU32Float:			case NVPTXISD::Tex2DArrayU32Float:
	Opc = NVPTX::TEX_2D_ARRAY_U32_F32;			Opc = NVPTX::TEX_2D_ARRAY_U32_F32_RR;
	break;			break;
	case NVPTXISD::Tex2DArrayU32FloatLevel:			case NVPTXISD::Tex2DArrayU32FloatLevel:
	Opc = NVPTX::TEX_2D_ARRAY_U32_F32_LEVEL;			Opc = NVPTX::TEX_2D_ARRAY_U32_F32_LEVEL_RR;
	break;			break;
	case NVPTXISD::Tex2DArrayU32FloatGrad:			case NVPTXISD::Tex2DArrayU32FloatGrad:
	Opc = NVPTX::TEX_2D_ARRAY_U32_F32_GRAD;			Opc = NVPTX::TEX_2D_ARRAY_U32_F32_GRAD_RR;
	break;			break;
	case NVPTXISD::Tex3DFloatS32:			case NVPTXISD::Tex3DFloatS32:
	Opc = NVPTX::TEX_3D_F32_S32;			Opc = NVPTX::TEX_3D_F32_S32_RR;
	break;			break;
	case NVPTXISD::Tex3DFloatFloat:			case NVPTXISD::Tex3DFloatFloat:
	Opc = NVPTX::TEX_3D_F32_F32;			Opc = NVPTX::TEX_3D_F32_F32_RR;
	break;			break;
	case NVPTXISD::Tex3DFloatFloatLevel:			case NVPTXISD::Tex3DFloatFloatLevel:
	Opc = NVPTX::TEX_3D_F32_F32_LEVEL;			Opc = NVPTX::TEX_3D_F32_F32_LEVEL_RR;
	break;			break;
	case NVPTXISD::Tex3DFloatFloatGrad:			case NVPTXISD::Tex3DFloatFloatGrad:
	Opc = NVPTX::TEX_3D_F32_F32_GRAD;			Opc = NVPTX::TEX_3D_F32_F32_GRAD_RR;
	break;			break;
	case NVPTXISD::Tex3DS32S32:			case NVPTXISD::Tex3DS32S32:
	Opc = NVPTX::TEX_3D_S32_S32;			Opc = NVPTX::TEX_3D_S32_S32_RR;
	break;			break;
	case NVPTXISD::Tex3DS32Float:			case NVPTXISD::Tex3DS32Float:
	Opc = NVPTX::TEX_3D_S32_F32;			Opc = NVPTX::TEX_3D_S32_F32_RR;
	break;			break;
	case NVPTXISD::Tex3DS32FloatLevel:			case NVPTXISD::Tex3DS32FloatLevel:
	Opc = NVPTX::TEX_3D_S32_F32_LEVEL;			Opc = NVPTX::TEX_3D_S32_F32_LEVEL_RR;
	break;			break;
	case NVPTXISD::Tex3DS32FloatGrad:			case NVPTXISD::Tex3DS32FloatGrad:
	Opc = NVPTX::TEX_3D_S32_F32_GRAD;			Opc = NVPTX::TEX_3D_S32_F32_GRAD_RR;
	break;			break;
	case NVPTXISD::Tex3DU32S32:			case NVPTXISD::Tex3DU32S32:
	Opc = NVPTX::TEX_3D_U32_S32;			Opc = NVPTX::TEX_3D_U32_S32_RR;
	break;			break;
	case NVPTXISD::Tex3DU32Float:			case NVPTXISD::Tex3DU32Float:
	Opc = NVPTX::TEX_3D_U32_F32;			Opc = NVPTX::TEX_3D_U32_F32_RR;
	break;			break;
	case NVPTXISD::Tex3DU32FloatLevel:			case NVPTXISD::Tex3DU32FloatLevel:
	Opc = NVPTX::TEX_3D_U32_F32_LEVEL;			Opc = NVPTX::TEX_3D_U32_F32_LEVEL_RR;
	break;			break;
	case NVPTXISD::Tex3DU32FloatGrad:			case NVPTXISD::Tex3DU32FloatGrad:
	Opc = NVPTX::TEX_3D_U32_F32_GRAD;			Opc = NVPTX::TEX_3D_U32_F32_GRAD_RR;
	break;			break;
	case NVPTXISD::TexCubeFloatFloat:			case NVPTXISD::TexCubeFloatFloat:
	Opc = NVPTX::TEX_CUBE_F32_F32;			Opc = NVPTX::TEX_CUBE_F32_F32_RR;
	break;			break;
	case NVPTXISD::TexCubeFloatFloatLevel:			case NVPTXISD::TexCubeFloatFloatLevel:
	Opc = NVPTX::TEX_CUBE_F32_F32_LEVEL;			Opc = NVPTX::TEX_CUBE_F32_F32_LEVEL_RR;
	break;			break;
	case NVPTXISD::TexCubeS32Float:			case NVPTXISD::TexCubeS32Float:
	Opc = NVPTX::TEX_CUBE_S32_F32;			Opc = NVPTX::TEX_CUBE_S32_F32_RR;
	break;			break;
	case NVPTXISD::TexCubeS32FloatLevel:			case NVPTXISD::TexCubeS32FloatLevel:
	Opc = NVPTX::TEX_CUBE_S32_F32_LEVEL;			Opc = NVPTX::TEX_CUBE_S32_F32_LEVEL_RR;
	break;			break;
	case NVPTXISD::TexCubeU32Float:			case NVPTXISD::TexCubeU32Float:
	Opc = NVPTX::TEX_CUBE_U32_F32;			Opc = NVPTX::TEX_CUBE_U32_F32_RR;
	break;			break;
	case NVPTXISD::TexCubeU32FloatLevel:			case NVPTXISD::TexCubeU32FloatLevel:
	Opc = NVPTX::TEX_CUBE_U32_F32_LEVEL;			Opc = NVPTX::TEX_CUBE_U32_F32_LEVEL_RR;
	break;			break;
	case NVPTXISD::TexCubeArrayFloatFloat:			case NVPTXISD::TexCubeArrayFloatFloat:
	Opc = NVPTX::TEX_CUBE_ARRAY_F32_F32;			Opc = NVPTX::TEX_CUBE_ARRAY_F32_F32_RR;
	break;			break;
	case NVPTXISD::TexCubeArrayFloatFloatLevel:			case NVPTXISD::TexCubeArrayFloatFloatLevel:
	Opc = NVPTX::TEX_CUBE_ARRAY_F32_F32_LEVEL;			Opc = NVPTX::TEX_CUBE_ARRAY_F32_F32_LEVEL_RR;
	break;			break;
	case NVPTXISD::TexCubeArrayS32Float:			case NVPTXISD::TexCubeArrayS32Float:
	Opc = NVPTX::TEX_CUBE_ARRAY_S32_F32;			Opc = NVPTX::TEX_CUBE_ARRAY_S32_F32_RR;
	break;			break;
	case NVPTXISD::TexCubeArrayS32FloatLevel:			case NVPTXISD::TexCubeArrayS32FloatLevel:
	Opc = NVPTX::TEX_CUBE_ARRAY_S32_F32_LEVEL;			Opc = NVPTX::TEX_CUBE_ARRAY_S32_F32_LEVEL_RR;
	break;			break;
	case NVPTXISD::TexCubeArrayU32Float:			case NVPTXISD::TexCubeArrayU32Float:
	Opc = NVPTX::TEX_CUBE_ARRAY_U32_F32;			Opc = NVPTX::TEX_CUBE_ARRAY_U32_F32_RR;
	break;			break;
	case NVPTXISD::TexCubeArrayU32FloatLevel:			case NVPTXISD::TexCubeArrayU32FloatLevel:
	Opc = NVPTX::TEX_CUBE_ARRAY_U32_F32_LEVEL;			Opc = NVPTX::TEX_CUBE_ARRAY_U32_F32_LEVEL_RR;
	break;			break;
	case NVPTXISD::Tld4R2DFloatFloat:			case NVPTXISD::Tld4R2DFloatFloat:
	Opc = NVPTX::TLD4_R_2D_F32_F32;			Opc = NVPTX::TLD4_R_2D_F32_F32_RR;
	break;			break;
	case NVPTXISD::Tld4G2DFloatFloat:			case NVPTXISD::Tld4G2DFloatFloat:
	Opc = NVPTX::TLD4_G_2D_F32_F32;			Opc = NVPTX::TLD4_G_2D_F32_F32_RR;
	break;			break;
	case NVPTXISD::Tld4B2DFloatFloat:			case NVPTXISD::Tld4B2DFloatFloat:
	Opc = NVPTX::TLD4_B_2D_F32_F32;			Opc = NVPTX::TLD4_B_2D_F32_F32_RR;
	break;			break;
	case NVPTXISD::Tld4A2DFloatFloat:			case NVPTXISD::Tld4A2DFloatFloat:
	Opc = NVPTX::TLD4_A_2D_F32_F32;			Opc = NVPTX::TLD4_A_2D_F32_F32_RR;
	break;			break;
	case NVPTXISD::Tld4R2DS64Float:			case NVPTXISD::Tld4R2DS64Float:
	Opc = NVPTX::TLD4_R_2D_S32_F32;			Opc = NVPTX::TLD4_R_2D_S32_F32_RR;
	break;			break;
	case NVPTXISD::Tld4G2DS64Float:			case NVPTXISD::Tld4G2DS64Float:
	Opc = NVPTX::TLD4_G_2D_S32_F32;			Opc = NVPTX::TLD4_G_2D_S32_F32_RR;
	break;			break;
	case NVPTXISD::Tld4B2DS64Float:			case NVPTXISD::Tld4B2DS64Float:
	Opc = NVPTX::TLD4_B_2D_S32_F32;			Opc = NVPTX::TLD4_B_2D_S32_F32_RR;
	break;			break;
	case NVPTXISD::Tld4A2DS64Float:			case NVPTXISD::Tld4A2DS64Float:
	Opc = NVPTX::TLD4_A_2D_S32_F32;			Opc = NVPTX::TLD4_A_2D_S32_F32_RR;
	break;			break;
	case NVPTXISD::Tld4R2DU64Float:			case NVPTXISD::Tld4R2DU64Float:
	Opc = NVPTX::TLD4_R_2D_U32_F32;			Opc = NVPTX::TLD4_R_2D_U32_F32_RR;
	break;			break;
	case NVPTXISD::Tld4G2DU64Float:			case NVPTXISD::Tld4G2DU64Float:
	Opc = NVPTX::TLD4_G_2D_U32_F32;			Opc = NVPTX::TLD4_G_2D_U32_F32_RR;
	break;			break;
	case NVPTXISD::Tld4B2DU64Float:			case NVPTXISD::Tld4B2DU64Float:
	Opc = NVPTX::TLD4_B_2D_U32_F32;			Opc = NVPTX::TLD4_B_2D_U32_F32_RR;
	break;			break;
	case NVPTXISD::Tld4A2DU64Float:			case NVPTXISD::Tld4A2DU64Float:
	Opc = NVPTX::TLD4_A_2D_U32_F32;			Opc = NVPTX::TLD4_A_2D_U32_F32_RR;
	break;			break;
	case NVPTXISD::TexUnified1DFloatS32:			case NVPTXISD::TexUnified1DFloatS32:
	Opc = NVPTX::TEX_UNIFIED_1D_F32_S32;			Opc = NVPTX::TEX_UNIFIED_1D_F32_S32_R;
	break;			break;
	case NVPTXISD::TexUnified1DFloatFloat:			case NVPTXISD::TexUnified1DFloatFloat:
	Opc = NVPTX::TEX_UNIFIED_1D_F32_F32;			Opc = NVPTX::TEX_UNIFIED_1D_F32_F32_R;
	break;			break;
	case NVPTXISD::TexUnified1DFloatFloatLevel:			case NVPTXISD::TexUnified1DFloatFloatLevel:
	Opc = NVPTX::TEX_UNIFIED_1D_F32_F32_LEVEL;			Opc = NVPTX::TEX_UNIFIED_1D_F32_F32_LEVEL_R;
	break;			break;
	case NVPTXISD::TexUnified1DFloatFloatGrad:			case NVPTXISD::TexUnified1DFloatFloatGrad:
	Opc = NVPTX::TEX_UNIFIED_1D_F32_F32_GRAD;			Opc = NVPTX::TEX_UNIFIED_1D_F32_F32_GRAD_R;
	break;			break;
	case NVPTXISD::TexUnified1DS32S32:			case NVPTXISD::TexUnified1DS32S32:
	Opc = NVPTX::TEX_UNIFIED_1D_S32_S32;			Opc = NVPTX::TEX_UNIFIED_1D_S32_S32_R;
	break;			break;
	case NVPTXISD::TexUnified1DS32Float:			case NVPTXISD::TexUnified1DS32Float:
	Opc = NVPTX::TEX_UNIFIED_1D_S32_F32;			Opc = NVPTX::TEX_UNIFIED_1D_S32_F32_R;
	break;			break;
	case NVPTXISD::TexUnified1DS32FloatLevel:			case NVPTXISD::TexUnified1DS32FloatLevel:
	Opc = NVPTX::TEX_UNIFIED_1D_S32_F32_LEVEL;			Opc = NVPTX::TEX_UNIFIED_1D_S32_F32_LEVEL_R;
	break;			break;
	case NVPTXISD::TexUnified1DS32FloatGrad:			case NVPTXISD::TexUnified1DS32FloatGrad:
	Opc = NVPTX::TEX_UNIFIED_1D_S32_F32_GRAD;			Opc = NVPTX::TEX_UNIFIED_1D_S32_F32_GRAD_R;
	break;			break;
	case NVPTXISD::TexUnified1DU32S32:			case NVPTXISD::TexUnified1DU32S32:
	Opc = NVPTX::TEX_UNIFIED_1D_U32_S32;			Opc = NVPTX::TEX_UNIFIED_1D_U32_S32_R;
	break;			break;
	case NVPTXISD::TexUnified1DU32Float:			case NVPTXISD::TexUnified1DU32Float:
	Opc = NVPTX::TEX_UNIFIED_1D_U32_F32;			Opc = NVPTX::TEX_UNIFIED_1D_U32_F32_R;
	break;			break;
	case NVPTXISD::TexUnified1DU32FloatLevel:			case NVPTXISD::TexUnified1DU32FloatLevel:
	Opc = NVPTX::TEX_UNIFIED_1D_U32_F32_LEVEL;			Opc = NVPTX::TEX_UNIFIED_1D_U32_F32_LEVEL_R;
	break;			break;
	case NVPTXISD::TexUnified1DU32FloatGrad:			case NVPTXISD::TexUnified1DU32FloatGrad:
	Opc = NVPTX::TEX_UNIFIED_1D_U32_F32_GRAD;			Opc = NVPTX::TEX_UNIFIED_1D_U32_F32_GRAD_R;
	break;			break;
	case NVPTXISD::TexUnified1DArrayFloatS32:			case NVPTXISD::TexUnified1DArrayFloatS32:
	Opc = NVPTX::TEX_UNIFIED_1D_ARRAY_F32_S32;			Opc = NVPTX::TEX_UNIFIED_1D_ARRAY_F32_S32_R;
	break;			break;
	case NVPTXISD::TexUnified1DArrayFloatFloat:			case NVPTXISD::TexUnified1DArrayFloatFloat:
	Opc = NVPTX::TEX_UNIFIED_1D_ARRAY_F32_F32;			Opc = NVPTX::TEX_UNIFIED_1D_ARRAY_F32_F32_R;
	break;			break;
	case NVPTXISD::TexUnified1DArrayFloatFloatLevel:			case NVPTXISD::TexUnified1DArrayFloatFloatLevel:
	Opc = NVPTX::TEX_UNIFIED_1D_ARRAY_F32_F32_LEVEL;			Opc = NVPTX::TEX_UNIFIED_1D_ARRAY_F32_F32_LEVEL_R;
	break;			break;
	case NVPTXISD::TexUnified1DArrayFloatFloatGrad:			case NVPTXISD::TexUnified1DArrayFloatFloatGrad:
	Opc = NVPTX::TEX_UNIFIED_1D_ARRAY_F32_F32_GRAD;			Opc = NVPTX::TEX_UNIFIED_1D_ARRAY_F32_F32_GRAD_R;
	break;			break;
	case NVPTXISD::TexUnified1DArrayS32S32:			case NVPTXISD::TexUnified1DArrayS32S32:
	Opc = NVPTX::TEX_UNIFIED_1D_ARRAY_S32_S32;			Opc = NVPTX::TEX_UNIFIED_1D_ARRAY_S32_S32_R;
	break;			break;
	case NVPTXISD::TexUnified1DArrayS32Float:			case NVPTXISD::TexUnified1DArrayS32Float:
	Opc = NVPTX::TEX_UNIFIED_1D_ARRAY_S32_F32;			Opc = NVPTX::TEX_UNIFIED_1D_ARRAY_S32_F32_R;
	break;			break;
	case NVPTXISD::TexUnified1DArrayS32FloatLevel:			case NVPTXISD::TexUnified1DArrayS32FloatLevel:
	Opc = NVPTX::TEX_UNIFIED_1D_ARRAY_S32_F32_LEVEL;			Opc = NVPTX::TEX_UNIFIED_1D_ARRAY_S32_F32_LEVEL_R;
	break;			break;
	case NVPTXISD::TexUnified1DArrayS32FloatGrad:			case NVPTXISD::TexUnified1DArrayS32FloatGrad:
	Opc = NVPTX::TEX_UNIFIED_1D_ARRAY_S32_F32_GRAD;			Opc = NVPTX::TEX_UNIFIED_1D_ARRAY_S32_F32_GRAD_R;
	break;			break;
	case NVPTXISD::TexUnified1DArrayU32S32:			case NVPTXISD::TexUnified1DArrayU32S32:
	Opc = NVPTX::TEX_UNIFIED_1D_ARRAY_U32_S32;			Opc = NVPTX::TEX_UNIFIED_1D_ARRAY_U32_S32_R;
	break;			break;
	case NVPTXISD::TexUnified1DArrayU32Float:			case NVPTXISD::TexUnified1DArrayU32Float:
	Opc = NVPTX::TEX_UNIFIED_1D_ARRAY_U32_F32;			Opc = NVPTX::TEX_UNIFIED_1D_ARRAY_U32_F32_R;
	break;			break;
	case NVPTXISD::TexUnified1DArrayU32FloatLevel:			case NVPTXISD::TexUnified1DArrayU32FloatLevel:
	Opc = NVPTX::TEX_UNIFIED_1D_ARRAY_U32_F32_LEVEL;			Opc = NVPTX::TEX_UNIFIED_1D_ARRAY_U32_F32_LEVEL_R;
	break;			break;
	case NVPTXISD::TexUnified1DArrayU32FloatGrad:			case NVPTXISD::TexUnified1DArrayU32FloatGrad:
	Opc = NVPTX::TEX_UNIFIED_1D_ARRAY_U32_F32_GRAD;			Opc = NVPTX::TEX_UNIFIED_1D_ARRAY_U32_F32_GRAD_R;
	break;			break;
	case NVPTXISD::TexUnified2DFloatS32:			case NVPTXISD::TexUnified2DFloatS32:
	Opc = NVPTX::TEX_UNIFIED_2D_F32_S32;			Opc = NVPTX::TEX_UNIFIED_2D_F32_S32_R;
	break;			break;
	case NVPTXISD::TexUnified2DFloatFloat:			case NVPTXISD::TexUnified2DFloatFloat:
	Opc = NVPTX::TEX_UNIFIED_2D_F32_F32;			Opc = NVPTX::TEX_UNIFIED_2D_F32_F32_R;
	break;			break;
	case NVPTXISD::TexUnified2DFloatFloatLevel:			case NVPTXISD::TexUnified2DFloatFloatLevel:
	Opc = NVPTX::TEX_UNIFIED_2D_F32_F32_LEVEL;			Opc = NVPTX::TEX_UNIFIED_2D_F32_F32_LEVEL_R;
	break;			break;
	case NVPTXISD::TexUnified2DFloatFloatGrad:			case NVPTXISD::TexUnified2DFloatFloatGrad:
	Opc = NVPTX::TEX_UNIFIED_2D_F32_F32_GRAD;			Opc = NVPTX::TEX_UNIFIED_2D_F32_F32_GRAD_R;
	break;			break;
	case NVPTXISD::TexUnified2DS32S32:			case NVPTXISD::TexUnified2DS32S32:
	Opc = NVPTX::TEX_UNIFIED_2D_S32_S32;			Opc = NVPTX::TEX_UNIFIED_2D_S32_S32_R;
	break;			break;
	case NVPTXISD::TexUnified2DS32Float:			case NVPTXISD::TexUnified2DS32Float:
	Opc = NVPTX::TEX_UNIFIED_2D_S32_F32;			Opc = NVPTX::TEX_UNIFIED_2D_S32_F32_R;
	break;			break;
	case NVPTXISD::TexUnified2DS32FloatLevel:			case NVPTXISD::TexUnified2DS32FloatLevel:
	Opc = NVPTX::TEX_UNIFIED_2D_S32_F32_LEVEL;			Opc = NVPTX::TEX_UNIFIED_2D_S32_F32_LEVEL_R;
	break;			break;
	case NVPTXISD::TexUnified2DS32FloatGrad:			case NVPTXISD::TexUnified2DS32FloatGrad:
	Opc = NVPTX::TEX_UNIFIED_2D_S32_F32_GRAD;			Opc = NVPTX::TEX_UNIFIED_2D_S32_F32_GRAD_R;
	break;			break;
	case NVPTXISD::TexUnified2DU32S32:			case NVPTXISD::TexUnified2DU32S32:
	Opc = NVPTX::TEX_UNIFIED_2D_U32_S32;			Opc = NVPTX::TEX_UNIFIED_2D_U32_S32_R;
	break;			break;
	case NVPTXISD::TexUnified2DU32Float:			case NVPTXISD::TexUnified2DU32Float:
	Opc = NVPTX::TEX_UNIFIED_2D_U32_F32;			Opc = NVPTX::TEX_UNIFIED_2D_U32_F32_R;
	break;			break;
	case NVPTXISD::TexUnified2DU32FloatLevel:			case NVPTXISD::TexUnified2DU32FloatLevel:
	Opc = NVPTX::TEX_UNIFIED_2D_U32_F32_LEVEL;			Opc = NVPTX::TEX_UNIFIED_2D_U32_F32_LEVEL_R;
	break;			break;
	case NVPTXISD::TexUnified2DU32FloatGrad:			case NVPTXISD::TexUnified2DU32FloatGrad:
	Opc = NVPTX::TEX_UNIFIED_2D_U32_F32_GRAD;			Opc = NVPTX::TEX_UNIFIED_2D_U32_F32_GRAD_R;
	break;			break;
	case NVPTXISD::TexUnified2DArrayFloatS32:			case NVPTXISD::TexUnified2DArrayFloatS32:
	Opc = NVPTX::TEX_UNIFIED_2D_ARRAY_F32_S32;			Opc = NVPTX::TEX_UNIFIED_2D_ARRAY_F32_S32_R;
	break;			break;
	case NVPTXISD::TexUnified2DArrayFloatFloat:			case NVPTXISD::TexUnified2DArrayFloatFloat:
	Opc = NVPTX::TEX_UNIFIED_2D_ARRAY_F32_F32;			Opc = NVPTX::TEX_UNIFIED_2D_ARRAY_F32_F32_R;
	break;			break;
	case NVPTXISD::TexUnified2DArrayFloatFloatLevel:			case NVPTXISD::TexUnified2DArrayFloatFloatLevel:
	Opc = NVPTX::TEX_UNIFIED_2D_ARRAY_F32_F32_LEVEL;			Opc = NVPTX::TEX_UNIFIED_2D_ARRAY_F32_F32_LEVEL_R;
	break;			break;
	case NVPTXISD::TexUnified2DArrayFloatFloatGrad:			case NVPTXISD::TexUnified2DArrayFloatFloatGrad:
	Opc = NVPTX::TEX_UNIFIED_2D_ARRAY_F32_F32_GRAD;			Opc = NVPTX::TEX_UNIFIED_2D_ARRAY_F32_F32_GRAD_R;
	break;			break;
	case NVPTXISD::TexUnified2DArrayS32S32:			case NVPTXISD::TexUnified2DArrayS32S32:
	Opc = NVPTX::TEX_UNIFIED_2D_ARRAY_S32_S32;			Opc = NVPTX::TEX_UNIFIED_2D_ARRAY_S32_S32_R;
	break;			break;
	case NVPTXISD::TexUnified2DArrayS32Float:			case NVPTXISD::TexUnified2DArrayS32Float:
	Opc = NVPTX::TEX_UNIFIED_2D_ARRAY_S32_F32;			Opc = NVPTX::TEX_UNIFIED_2D_ARRAY_S32_F32_R;
	break;			break;
	case NVPTXISD::TexUnified2DArrayS32FloatLevel:			case NVPTXISD::TexUnified2DArrayS32FloatLevel:
	Opc = NVPTX::TEX_UNIFIED_2D_ARRAY_S32_F32_LEVEL;			Opc = NVPTX::TEX_UNIFIED_2D_ARRAY_S32_F32_LEVEL_R;
	break;			break;
	case NVPTXISD::TexUnified2DArrayS32FloatGrad:			case NVPTXISD::TexUnified2DArrayS32FloatGrad:
	Opc = NVPTX::TEX_UNIFIED_2D_ARRAY_S32_F32_GRAD;			Opc = NVPTX::TEX_UNIFIED_2D_ARRAY_S32_F32_GRAD_R;
	break;			break;
	case NVPTXISD::TexUnified2DArrayU32S32:			case NVPTXISD::TexUnified2DArrayU32S32:
	Opc = NVPTX::TEX_UNIFIED_2D_ARRAY_U32_S32;			Opc = NVPTX::TEX_UNIFIED_2D_ARRAY_U32_S32_R;
	break;			break;
	case NVPTXISD::TexUnified2DArrayU32Float:			case NVPTXISD::TexUnified2DArrayU32Float:
	Opc = NVPTX::TEX_UNIFIED_2D_ARRAY_U32_F32;			Opc = NVPTX::TEX_UNIFIED_2D_ARRAY_U32_F32_R;
	break;			break;
	case NVPTXISD::TexUnified2DArrayU32FloatLevel:			case NVPTXISD::TexUnified2DArrayU32FloatLevel:
	Opc = NVPTX::TEX_UNIFIED_2D_ARRAY_U32_F32_LEVEL;			Opc = NVPTX::TEX_UNIFIED_2D_ARRAY_U32_F32_LEVEL_R;
	break;			break;
	case NVPTXISD::TexUnified2DArrayU32FloatGrad:			case NVPTXISD::TexUnified2DArrayU32FloatGrad:
	Opc = NVPTX::TEX_UNIFIED_2D_ARRAY_U32_F32_GRAD;			Opc = NVPTX::TEX_UNIFIED_2D_ARRAY_U32_F32_GRAD_R;
	break;			break;
	case NVPTXISD::TexUnified3DFloatS32:			case NVPTXISD::TexUnified3DFloatS32:
	Opc = NVPTX::TEX_UNIFIED_3D_F32_S32;			Opc = NVPTX::TEX_UNIFIED_3D_F32_S32_R;
	break;			break;
	case NVPTXISD::TexUnified3DFloatFloat:			case NVPTXISD::TexUnified3DFloatFloat:
	Opc = NVPTX::TEX_UNIFIED_3D_F32_F32;			Opc = NVPTX::TEX_UNIFIED_3D_F32_F32_R;
	break;			break;
	case NVPTXISD::TexUnified3DFloatFloatLevel:			case NVPTXISD::TexUnified3DFloatFloatLevel:
	Opc = NVPTX::TEX_UNIFIED_3D_F32_F32_LEVEL;			Opc = NVPTX::TEX_UNIFIED_3D_F32_F32_LEVEL_R;
	break;			break;
	case NVPTXISD::TexUnified3DFloatFloatGrad:			case NVPTXISD::TexUnified3DFloatFloatGrad:
	Opc = NVPTX::TEX_UNIFIED_3D_F32_F32_GRAD;			Opc = NVPTX::TEX_UNIFIED_3D_F32_F32_GRAD_R;
	break;			break;
	case NVPTXISD::TexUnified3DS32S32:			case NVPTXISD::TexUnified3DS32S32:
	Opc = NVPTX::TEX_UNIFIED_3D_S32_S32;			Opc = NVPTX::TEX_UNIFIED_3D_S32_S32_R;
	break;			break;
	case NVPTXISD::TexUnified3DS32Float:			case NVPTXISD::TexUnified3DS32Float:
	Opc = NVPTX::TEX_UNIFIED_3D_S32_F32;			Opc = NVPTX::TEX_UNIFIED_3D_S32_F32_R;
	break;			break;
	case NVPTXISD::TexUnified3DS32FloatLevel:			case NVPTXISD::TexUnified3DS32FloatLevel:
	Opc = NVPTX::TEX_UNIFIED_3D_S32_F32_LEVEL;			Opc = NVPTX::TEX_UNIFIED_3D_S32_F32_LEVEL_R;
	break;			break;
	case NVPTXISD::TexUnified3DS32FloatGrad:			case NVPTXISD::TexUnified3DS32FloatGrad:
	Opc = NVPTX::TEX_UNIFIED_3D_S32_F32_GRAD;			Opc = NVPTX::TEX_UNIFIED_3D_S32_F32_GRAD_R;
	break;			break;
	case NVPTXISD::TexUnified3DU32S32:			case NVPTXISD::TexUnified3DU32S32:
	Opc = NVPTX::TEX_UNIFIED_3D_U32_S32;			Opc = NVPTX::TEX_UNIFIED_3D_U32_S32_R;
	break;			break;
	case NVPTXISD::TexUnified3DU32Float:			case NVPTXISD::TexUnified3DU32Float:
	Opc = NVPTX::TEX_UNIFIED_3D_U32_F32;			Opc = NVPTX::TEX_UNIFIED_3D_U32_F32_R;
	break;			break;
	case NVPTXISD::TexUnified3DU32FloatLevel:			case NVPTXISD::TexUnified3DU32FloatLevel:
	Opc = NVPTX::TEX_UNIFIED_3D_U32_F32_LEVEL;			Opc = NVPTX::TEX_UNIFIED_3D_U32_F32_LEVEL_R;
	break;			break;
	case NVPTXISD::TexUnified3DU32FloatGrad:			case NVPTXISD::TexUnified3DU32FloatGrad:
	Opc = NVPTX::TEX_UNIFIED_3D_U32_F32_GRAD;			Opc = NVPTX::TEX_UNIFIED_3D_U32_F32_GRAD_R;
	break;			break;
	case NVPTXISD::TexUnifiedCubeFloatFloat:			case NVPTXISD::TexUnifiedCubeFloatFloat:
	Opc = NVPTX::TEX_UNIFIED_CUBE_F32_F32;			Opc = NVPTX::TEX_UNIFIED_CUBE_F32_F32_R;
	break;			break;
	case NVPTXISD::TexUnifiedCubeFloatFloatLevel:			case NVPTXISD::TexUnifiedCubeFloatFloatLevel:
	Opc = NVPTX::TEX_UNIFIED_CUBE_F32_F32_LEVEL;			Opc = NVPTX::TEX_UNIFIED_CUBE_F32_F32_LEVEL_R;
	break;			break;
	case NVPTXISD::TexUnifiedCubeS32Float:			case NVPTXISD::TexUnifiedCubeS32Float:
	Opc = NVPTX::TEX_UNIFIED_CUBE_S32_F32;			Opc = NVPTX::TEX_UNIFIED_CUBE_S32_F32_R;
	break;			break;
	case NVPTXISD::TexUnifiedCubeS32FloatLevel:			case NVPTXISD::TexUnifiedCubeS32FloatLevel:
	Opc = NVPTX::TEX_UNIFIED_CUBE_S32_F32_LEVEL;			Opc = NVPTX::TEX_UNIFIED_CUBE_S32_F32_LEVEL_R;
	break;			break;
	case NVPTXISD::TexUnifiedCubeU32Float:			case NVPTXISD::TexUnifiedCubeU32Float:
	Opc = NVPTX::TEX_UNIFIED_CUBE_U32_F32;			Opc = NVPTX::TEX_UNIFIED_CUBE_U32_F32_R;
	break;			break;
	case NVPTXISD::TexUnifiedCubeU32FloatLevel:			case NVPTXISD::TexUnifiedCubeU32FloatLevel:
	Opc = NVPTX::TEX_UNIFIED_CUBE_U32_F32_LEVEL;			Opc = NVPTX::TEX_UNIFIED_CUBE_U32_F32_LEVEL_R;
	break;			break;
	case NVPTXISD::TexUnifiedCubeArrayFloatFloat:			case NVPTXISD::TexUnifiedCubeArrayFloatFloat:
	Opc = NVPTX::TEX_UNIFIED_CUBE_ARRAY_F32_F32;			Opc = NVPTX::TEX_UNIFIED_CUBE_ARRAY_F32_F32_R;
	break;			break;
	case NVPTXISD::TexUnifiedCubeArrayFloatFloatLevel:			case NVPTXISD::TexUnifiedCubeArrayFloatFloatLevel:
	Opc = NVPTX::TEX_UNIFIED_CUBE_ARRAY_F32_F32_LEVEL;			Opc = NVPTX::TEX_UNIFIED_CUBE_ARRAY_F32_F32_LEVEL_R;
	break;			break;
	case NVPTXISD::TexUnifiedCubeArrayS32Float:			case NVPTXISD::TexUnifiedCubeArrayS32Float:
	Opc = NVPTX::TEX_UNIFIED_CUBE_ARRAY_S32_F32;			Opc = NVPTX::TEX_UNIFIED_CUBE_ARRAY_S32_F32_R;
	break;			break;
	case NVPTXISD::TexUnifiedCubeArrayS32FloatLevel:			case NVPTXISD::TexUnifiedCubeArrayS32FloatLevel:
	Opc = NVPTX::TEX_UNIFIED_CUBE_ARRAY_S32_F32_LEVEL;			Opc = NVPTX::TEX_UNIFIED_CUBE_ARRAY_S32_F32_LEVEL_R;
	break;			break;
	case NVPTXISD::TexUnifiedCubeArrayU32Float:			case NVPTXISD::TexUnifiedCubeArrayU32Float:
	Opc = NVPTX::TEX_UNIFIED_CUBE_ARRAY_U32_F32;			Opc = NVPTX::TEX_UNIFIED_CUBE_ARRAY_U32_F32_R;
	break;			break;
	case NVPTXISD::TexUnifiedCubeArrayU32FloatLevel:			case NVPTXISD::TexUnifiedCubeArrayU32FloatLevel:
	Opc = NVPTX::TEX_UNIFIED_CUBE_ARRAY_U32_F32_LEVEL;			Opc = NVPTX::TEX_UNIFIED_CUBE_ARRAY_U32_F32_LEVEL_R;
	break;			break;
	case NVPTXISD::Tld4UnifiedR2DFloatFloat:			case NVPTXISD::Tld4UnifiedR2DFloatFloat:
	Opc = NVPTX::TLD4_UNIFIED_R_2D_F32_F32;			Opc = NVPTX::TLD4_UNIFIED_R_2D_F32_F32_R;
	break;			break;
	case NVPTXISD::Tld4UnifiedG2DFloatFloat:			case NVPTXISD::Tld4UnifiedG2DFloatFloat:
	Opc = NVPTX::TLD4_UNIFIED_G_2D_F32_F32;			Opc = NVPTX::TLD4_UNIFIED_G_2D_F32_F32_R;
	break;			break;
	case NVPTXISD::Tld4UnifiedB2DFloatFloat:			case NVPTXISD::Tld4UnifiedB2DFloatFloat:
	Opc = NVPTX::TLD4_UNIFIED_B_2D_F32_F32;			Opc = NVPTX::TLD4_UNIFIED_B_2D_F32_F32_R;
	break;			break;
	case NVPTXISD::Tld4UnifiedA2DFloatFloat:			case NVPTXISD::Tld4UnifiedA2DFloatFloat:
	Opc = NVPTX::TLD4_UNIFIED_A_2D_F32_F32;			Opc = NVPTX::TLD4_UNIFIED_A_2D_F32_F32_R;
	break;			break;
	case NVPTXISD::Tld4UnifiedR2DS64Float:			case NVPTXISD::Tld4UnifiedR2DS64Float:
	Opc = NVPTX::TLD4_UNIFIED_R_2D_S32_F32;			Opc = NVPTX::TLD4_UNIFIED_R_2D_S32_F32_R;
	break;			break;
	case NVPTXISD::Tld4UnifiedG2DS64Float:			case NVPTXISD::Tld4UnifiedG2DS64Float:
	Opc = NVPTX::TLD4_UNIFIED_G_2D_S32_F32;			Opc = NVPTX::TLD4_UNIFIED_G_2D_S32_F32_R;
	break;			break;
	case NVPTXISD::Tld4UnifiedB2DS64Float:			case NVPTXISD::Tld4UnifiedB2DS64Float:
	Opc = NVPTX::TLD4_UNIFIED_B_2D_S32_F32;			Opc = NVPTX::TLD4_UNIFIED_B_2D_S32_F32_R;
	break;			break;
	case NVPTXISD::Tld4UnifiedA2DS64Float:			case NVPTXISD::Tld4UnifiedA2DS64Float:
	Opc = NVPTX::TLD4_UNIFIED_A_2D_S32_F32;			Opc = NVPTX::TLD4_UNIFIED_A_2D_S32_F32_R;
	break;			break;
	case NVPTXISD::Tld4UnifiedR2DU64Float:			case NVPTXISD::Tld4UnifiedR2DU64Float:
	Opc = NVPTX::TLD4_UNIFIED_R_2D_U32_F32;			Opc = NVPTX::TLD4_UNIFIED_R_2D_U32_F32_R;
	break;			break;
	case NVPTXISD::Tld4UnifiedG2DU64Float:			case NVPTXISD::Tld4UnifiedG2DU64Float:
	Opc = NVPTX::TLD4_UNIFIED_G_2D_U32_F32;			Opc = NVPTX::TLD4_UNIFIED_G_2D_U32_F32_R;
	break;			break;
	case NVPTXISD::Tld4UnifiedB2DU64Float:			case NVPTXISD::Tld4UnifiedB2DU64Float:
	Opc = NVPTX::TLD4_UNIFIED_B_2D_U32_F32;			Opc = NVPTX::TLD4_UNIFIED_B_2D_U32_F32_R;
	break;			break;
	case NVPTXISD::Tld4UnifiedA2DU64Float:			case NVPTXISD::Tld4UnifiedA2DU64Float:
	Opc = NVPTX::TLD4_UNIFIED_A_2D_U32_F32;			Opc = NVPTX::TLD4_UNIFIED_A_2D_U32_F32_R;
	break;			break;
	}			}

	// Copy over operands			// Copy over operands
	SmallVector<SDValue, 8> Ops(drop_begin(N->ops()));			SmallVector<SDValue, 8> Ops(drop_begin(N->ops()));
	Ops.push_back(N->getOperand(0)); // Move chain to the back.			Ops.push_back(N->getOperand(0)); // Move chain to the back.

	ReplaceNode(N, CurDAG->getMachineNode(Opc, SDLoc(N), N->getVTList(), Ops));			ReplaceNode(N, CurDAG->getMachineNode(Opc, SDLoc(N), N->getVTList(), Ops));
	return true;			return true;
	}			}

	bool NVPTXDAGToDAGISel::trySurfaceIntrinsic(SDNode *N) {			bool NVPTXDAGToDAGISel::trySurfaceIntrinsic(SDNode *N) {
	unsigned Opc = 0;			unsigned Opc = 0;
	switch (N->getOpcode()) {			switch (N->getOpcode()) {
	default: return false;			default: return false;
	case NVPTXISD::Suld1DI8Clamp:			case NVPTXISD::Suld1DI8Clamp:
	Opc = NVPTX::SULD_1D_I8_CLAMP;			Opc = NVPTX::SULD_1D_I8_CLAMP_R;
	break;			break;
	case NVPTXISD::Suld1DI16Clamp:			case NVPTXISD::Suld1DI16Clamp:
	Opc = NVPTX::SULD_1D_I16_CLAMP;			Opc = NVPTX::SULD_1D_I16_CLAMP_R;
	break;			break;
	case NVPTXISD::Suld1DI32Clamp:			case NVPTXISD::Suld1DI32Clamp:
	Opc = NVPTX::SULD_1D_I32_CLAMP;			Opc = NVPTX::SULD_1D_I32_CLAMP_R;
	break;			break;
	case NVPTXISD::Suld1DI64Clamp:			case NVPTXISD::Suld1DI64Clamp:
	Opc = NVPTX::SULD_1D_I64_CLAMP;			Opc = NVPTX::SULD_1D_I64_CLAMP_R;
	break;			break;
	case NVPTXISD::Suld1DV2I8Clamp:			case NVPTXISD::Suld1DV2I8Clamp:
	Opc = NVPTX::SULD_1D_V2I8_CLAMP;			Opc = NVPTX::SULD_1D_V2I8_CLAMP_R;
	break;			break;
	case NVPTXISD::Suld1DV2I16Clamp:			case NVPTXISD::Suld1DV2I16Clamp:
	Opc = NVPTX::SULD_1D_V2I16_CLAMP;			Opc = NVPTX::SULD_1D_V2I16_CLAMP_R;
	break;			break;
	case NVPTXISD::Suld1DV2I32Clamp:			case NVPTXISD::Suld1DV2I32Clamp:
	Opc = NVPTX::SULD_1D_V2I32_CLAMP;			Opc = NVPTX::SULD_1D_V2I32_CLAMP_R;
	break;			break;
	case NVPTXISD::Suld1DV2I64Clamp:			case NVPTXISD::Suld1DV2I64Clamp:
	Opc = NVPTX::SULD_1D_V2I64_CLAMP;			Opc = NVPTX::SULD_1D_V2I64_CLAMP_R;
	break;			break;
	case NVPTXISD::Suld1DV4I8Clamp:			case NVPTXISD::Suld1DV4I8Clamp:
	Opc = NVPTX::SULD_1D_V4I8_CLAMP;			Opc = NVPTX::SULD_1D_V4I8_CLAMP_R;
	break;			break;
	case NVPTXISD::Suld1DV4I16Clamp:			case NVPTXISD::Suld1DV4I16Clamp:
	Opc = NVPTX::SULD_1D_V4I16_CLAMP;			Opc = NVPTX::SULD_1D_V4I16_CLAMP_R;
	break;			break;
	case NVPTXISD::Suld1DV4I32Clamp:			case NVPTXISD::Suld1DV4I32Clamp:
	Opc = NVPTX::SULD_1D_V4I32_CLAMP;			Opc = NVPTX::SULD_1D_V4I32_CLAMP_R;
	break;			break;
	case NVPTXISD::Suld1DArrayI8Clamp:			case NVPTXISD::Suld1DArrayI8Clamp:
	Opc = NVPTX::SULD_1D_ARRAY_I8_CLAMP;			Opc = NVPTX::SULD_1D_ARRAY_I8_CLAMP_R;
	break;			break;
	case NVPTXISD::Suld1DArrayI16Clamp:			case NVPTXISD::Suld1DArrayI16Clamp:
	Opc = NVPTX::SULD_1D_ARRAY_I16_CLAMP;			Opc = NVPTX::SULD_1D_ARRAY_I16_CLAMP_R;
	break;			break;
	case NVPTXISD::Suld1DArrayI32Clamp:			case NVPTXISD::Suld1DArrayI32Clamp:
	Opc = NVPTX::SULD_1D_ARRAY_I32_CLAMP;			Opc = NVPTX::SULD_1D_ARRAY_I32_CLAMP_R;
	break;			break;
	case NVPTXISD::Suld1DArrayI64Clamp:			case NVPTXISD::Suld1DArrayI64Clamp:
	Opc = NVPTX::SULD_1D_ARRAY_I64_CLAMP;			Opc = NVPTX::SULD_1D_ARRAY_I64_CLAMP_R;
	break;			break;
	case NVPTXISD::Suld1DArrayV2I8Clamp:			case NVPTXISD::Suld1DArrayV2I8Clamp:
	Opc = NVPTX::SULD_1D_ARRAY_V2I8_CLAMP;			Opc = NVPTX::SULD_1D_ARRAY_V2I8_CLAMP_R;
	break;			break;
	case NVPTXISD::Suld1DArrayV2I16Clamp:			case NVPTXISD::Suld1DArrayV2I16Clamp:
	Opc = NVPTX::SULD_1D_ARRAY_V2I16_CLAMP;			Opc = NVPTX::SULD_1D_ARRAY_V2I16_CLAMP_R;
	break;			break;
	case NVPTXISD::Suld1DArrayV2I32Clamp:			case NVPTXISD::Suld1DArrayV2I32Clamp:
	Opc = NVPTX::SULD_1D_ARRAY_V2I32_CLAMP;			Opc = NVPTX::SULD_1D_ARRAY_V2I32_CLAMP_R;
	break;			break;
	case NVPTXISD::Suld1DArrayV2I64Clamp:			case NVPTXISD::Suld1DArrayV2I64Clamp:
	Opc = NVPTX::SULD_1D_ARRAY_V2I64_CLAMP;			Opc = NVPTX::SULD_1D_ARRAY_V2I64_CLAMP_R;
	break;			break;
	case NVPTXISD::Suld1DArrayV4I8Clamp:			case NVPTXISD::Suld1DArrayV4I8Clamp:
	Opc = NVPTX::SULD_1D_ARRAY_V4I8_CLAMP;			Opc = NVPTX::SULD_1D_ARRAY_V4I8_CLAMP_R;
	break;			break;
	case NVPTXISD::Suld1DArrayV4I16Clamp:			case NVPTXISD::Suld1DArrayV4I16Clamp:
	Opc = NVPTX::SULD_1D_ARRAY_V4I16_CLAMP;			Opc = NVPTX::SULD_1D_ARRAY_V4I16_CLAMP_R;
	break;			break;
	case NVPTXISD::Suld1DArrayV4I32Clamp:			case NVPTXISD::Suld1DArrayV4I32Clamp:
	Opc = NVPTX::SULD_1D_ARRAY_V4I32_CLAMP;			Opc = NVPTX::SULD_1D_ARRAY_V4I32_CLAMP_R;
	break;			break;
	case NVPTXISD::Suld2DI8Clamp:			case NVPTXISD::Suld2DI8Clamp:
	Opc = NVPTX::SULD_2D_I8_CLAMP;			Opc = NVPTX::SULD_2D_I8_CLAMP_R;
	break;			break;
	case NVPTXISD::Suld2DI16Clamp:			case NVPTXISD::Suld2DI16Clamp:
	Opc = NVPTX::SULD_2D_I16_CLAMP;			Opc = NVPTX::SULD_2D_I16_CLAMP_R;
	break;			break;
	case NVPTXISD::Suld2DI32Clamp:			case NVPTXISD::Suld2DI32Clamp:
	Opc = NVPTX::SULD_2D_I32_CLAMP;			Opc = NVPTX::SULD_2D_I32_CLAMP_R;
	break;			break;
	case NVPTXISD::Suld2DI64Clamp:			case NVPTXISD::Suld2DI64Clamp:
	Opc = NVPTX::SULD_2D_I64_CLAMP;			Opc = NVPTX::SULD_2D_I64_CLAMP_R;
	break;			break;
	case NVPTXISD::Suld2DV2I8Clamp:			case NVPTXISD::Suld2DV2I8Clamp:
	Opc = NVPTX::SULD_2D_V2I8_CLAMP;			Opc = NVPTX::SULD_2D_V2I8_CLAMP_R;
	break;			break;
	case NVPTXISD::Suld2DV2I16Clamp:			case NVPTXISD::Suld2DV2I16Clamp:
	Opc = NVPTX::SULD_2D_V2I16_CLAMP;			Opc = NVPTX::SULD_2D_V2I16_CLAMP_R;
	break;			break;
	case NVPTXISD::Suld2DV2I32Clamp:			case NVPTXISD::Suld2DV2I32Clamp:
	Opc = NVPTX::SULD_2D_V2I32_CLAMP;			Opc = NVPTX::SULD_2D_V2I32_CLAMP_R;
	break;			break;
	case NVPTXISD::Suld2DV2I64Clamp:			case NVPTXISD::Suld2DV2I64Clamp:
	Opc = NVPTX::SULD_2D_V2I64_CLAMP;			Opc = NVPTX::SULD_2D_V2I64_CLAMP_R;
	break;			break;
	case NVPTXISD::Suld2DV4I8Clamp:			case NVPTXISD::Suld2DV4I8Clamp:
	Opc = NVPTX::SULD_2D_V4I8_CLAMP;			Opc = NVPTX::SULD_2D_V4I8_CLAMP_R;
	break;			break;
	case NVPTXISD::Suld2DV4I16Clamp:			case NVPTXISD::Suld2DV4I16Clamp:
	Opc = NVPTX::SULD_2D_V4I16_CLAMP;			Opc = NVPTX::SULD_2D_V4I16_CLAMP_R;
	break;			break;
	case NVPTXISD::Suld2DV4I32Clamp:			case NVPTXISD::Suld2DV4I32Clamp:
	Opc = NVPTX::SULD_2D_V4I32_CLAMP;			Opc = NVPTX::SULD_2D_V4I32_CLAMP_R;
	break;			break;
	case NVPTXISD::Suld2DArrayI8Clamp:			case NVPTXISD::Suld2DArrayI8Clamp:
	Opc = NVPTX::SULD_2D_ARRAY_I8_CLAMP;			Opc = NVPTX::SULD_2D_ARRAY_I8_CLAMP_R;
	break;			break;
	case NVPTXISD::Suld2DArrayI16Clamp:			case NVPTXISD::Suld2DArrayI16Clamp:
	Opc = NVPTX::SULD_2D_ARRAY_I16_CLAMP;			Opc = NVPTX::SULD_2D_ARRAY_I16_CLAMP_R;
	break;			break;
	case NVPTXISD::Suld2DArrayI32Clamp:			case NVPTXISD::Suld2DArrayI32Clamp:
	Opc = NVPTX::SULD_2D_ARRAY_I32_CLAMP;			Opc = NVPTX::SULD_2D_ARRAY_I32_CLAMP_R;
	break;			break;
	case NVPTXISD::Suld2DArrayI64Clamp:			case NVPTXISD::Suld2DArrayI64Clamp:
	Opc = NVPTX::SULD_2D_ARRAY_I64_CLAMP;			Opc = NVPTX::SULD_2D_ARRAY_I64_CLAMP_R;
	break;			break;
	case NVPTXISD::Suld2DArrayV2I8Clamp:			case NVPTXISD::Suld2DArrayV2I8Clamp:
	Opc = NVPTX::SULD_2D_ARRAY_V2I8_CLAMP;			Opc = NVPTX::SULD_2D_ARRAY_V2I8_CLAMP_R;
	break;			break;
	case NVPTXISD::Suld2DArrayV2I16Clamp:			case NVPTXISD::Suld2DArrayV2I16Clamp:
	Opc = NVPTX::SULD_2D_ARRAY_V2I16_CLAMP;			Opc = NVPTX::SULD_2D_ARRAY_V2I16_CLAMP_R;
	break;			break;
	case NVPTXISD::Suld2DArrayV2I32Clamp:			case NVPTXISD::Suld2DArrayV2I32Clamp:
	Opc = NVPTX::SULD_2D_ARRAY_V2I32_CLAMP;			Opc = NVPTX::SULD_2D_ARRAY_V2I32_CLAMP_R;
	break;			break;
	case NVPTXISD::Suld2DArrayV2I64Clamp:			case NVPTXISD::Suld2DArrayV2I64Clamp:
	Opc = NVPTX::SULD_2D_ARRAY_V2I64_CLAMP;			Opc = NVPTX::SULD_2D_ARRAY_V2I64_CLAMP_R;
	break;			break;
	case NVPTXISD::Suld2DArrayV4I8Clamp:			case NVPTXISD::Suld2DArrayV4I8Clamp:
	Opc = NVPTX::SULD_2D_ARRAY_V4I8_CLAMP;			Opc = NVPTX::SULD_2D_ARRAY_V4I8_CLAMP_R;
	break;			break;
	case NVPTXISD::Suld2DArrayV4I16Clamp:			case NVPTXISD::Suld2DArrayV4I16Clamp:
	Opc = NVPTX::SULD_2D_ARRAY_V4I16_CLAMP;			Opc = NVPTX::SULD_2D_ARRAY_V4I16_CLAMP_R;
	break;			break;
	case NVPTXISD::Suld2DArrayV4I32Clamp:			case NVPTXISD::Suld2DArrayV4I32Clamp:
	Opc = NVPTX::SULD_2D_ARRAY_V4I32_CLAMP;			Opc = NVPTX::SULD_2D_ARRAY_V4I32_CLAMP_R;
	break;			break;
	case NVPTXISD::Suld3DI8Clamp:			case NVPTXISD::Suld3DI8Clamp:
	Opc = NVPTX::SULD_3D_I8_CLAMP;			Opc = NVPTX::SULD_3D_I8_CLAMP_R;
	break;			break;
	case NVPTXISD::Suld3DI16Clamp:			case NVPTXISD::Suld3DI16Clamp:
	Opc = NVPTX::SULD_3D_I16_CLAMP;			Opc = NVPTX::SULD_3D_I16_CLAMP_R;
	break;			break;
	case NVPTXISD::Suld3DI32Clamp:			case NVPTXISD::Suld3DI32Clamp:
	Opc = NVPTX::SULD_3D_I32_CLAMP;			Opc = NVPTX::SULD_3D_I32_CLAMP_R;
	break;			break;
	case NVPTXISD::Suld3DI64Clamp:			case NVPTXISD::Suld3DI64Clamp:
	Opc = NVPTX::SULD_3D_I64_CLAMP;			Opc = NVPTX::SULD_3D_I64_CLAMP_R;
	break;			break;
	case NVPTXISD::Suld3DV2I8Clamp:			case NVPTXISD::Suld3DV2I8Clamp:
	Opc = NVPTX::SULD_3D_V2I8_CLAMP;			Opc = NVPTX::SULD_3D_V2I8_CLAMP_R;
	break;			break;
	case NVPTXISD::Suld3DV2I16Clamp:			case NVPTXISD::Suld3DV2I16Clamp:
	Opc = NVPTX::SULD_3D_V2I16_CLAMP;			Opc = NVPTX::SULD_3D_V2I16_CLAMP_R;
	break;			break;
	case NVPTXISD::Suld3DV2I32Clamp:			case NVPTXISD::Suld3DV2I32Clamp:
	Opc = NVPTX::SULD_3D_V2I32_CLAMP;			Opc = NVPTX::SULD_3D_V2I32_CLAMP_R;
	break;			break;
	case NVPTXISD::Suld3DV2I64Clamp:			case NVPTXISD::Suld3DV2I64Clamp:
	Opc = NVPTX::SULD_3D_V2I64_CLAMP;			Opc = NVPTX::SULD_3D_V2I64_CLAMP_R;
	break;			break;
	case NVPTXISD::Suld3DV4I8Clamp:			case NVPTXISD::Suld3DV4I8Clamp:
	Opc = NVPTX::SULD_3D_V4I8_CLAMP;			Opc = NVPTX::SULD_3D_V4I8_CLAMP_R;
	break;			break;
	case NVPTXISD::Suld3DV4I16Clamp:			case NVPTXISD::Suld3DV4I16Clamp:
	Opc = NVPTX::SULD_3D_V4I16_CLAMP;			Opc = NVPTX::SULD_3D_V4I16_CLAMP_R;
	break;			break;
	case NVPTXISD::Suld3DV4I32Clamp:			case NVPTXISD::Suld3DV4I32Clamp:
	Opc = NVPTX::SULD_3D_V4I32_CLAMP;			Opc = NVPTX::SULD_3D_V4I32_CLAMP_R;
	break;			break;
	case NVPTXISD::Suld1DI8Trap:			case NVPTXISD::Suld1DI8Trap:
	Opc = NVPTX::SULD_1D_I8_TRAP;			Opc = NVPTX::SULD_1D_I8_TRAP_R;
	break;			break;
	case NVPTXISD::Suld1DI16Trap:			case NVPTXISD::Suld1DI16Trap:
	Opc = NVPTX::SULD_1D_I16_TRAP;			Opc = NVPTX::SULD_1D_I16_TRAP_R;
	break;			break;
	case NVPTXISD::Suld1DI32Trap:			case NVPTXISD::Suld1DI32Trap:
	Opc = NVPTX::SULD_1D_I32_TRAP;			Opc = NVPTX::SULD_1D_I32_TRAP_R;
	break;			break;
	case NVPTXISD::Suld1DI64Trap:			case NVPTXISD::Suld1DI64Trap:
	Opc = NVPTX::SULD_1D_I64_TRAP;			Opc = NVPTX::SULD_1D_I64_TRAP_R;
	break;			break;
	case NVPTXISD::Suld1DV2I8Trap:			case NVPTXISD::Suld1DV2I8Trap:
	Opc = NVPTX::SULD_1D_V2I8_TRAP;			Opc = NVPTX::SULD_1D_V2I8_TRAP_R;
	break;			break;
	case NVPTXISD::Suld1DV2I16Trap:			case NVPTXISD::Suld1DV2I16Trap:
	Opc = NVPTX::SULD_1D_V2I16_TRAP;			Opc = NVPTX::SULD_1D_V2I16_TRAP_R;
	break;			break;
	case NVPTXISD::Suld1DV2I32Trap:			case NVPTXISD::Suld1DV2I32Trap:
	Opc = NVPTX::SULD_1D_V2I32_TRAP;			Opc = NVPTX::SULD_1D_V2I32_TRAP_R;
	break;			break;
	case NVPTXISD::Suld1DV2I64Trap:			case NVPTXISD::Suld1DV2I64Trap:
	Opc = NVPTX::SULD_1D_V2I64_TRAP;			Opc = NVPTX::SULD_1D_V2I64_TRAP_R;
	break;			break;
	case NVPTXISD::Suld1DV4I8Trap:			case NVPTXISD::Suld1DV4I8Trap:
	Opc = NVPTX::SULD_1D_V4I8_TRAP;			Opc = NVPTX::SULD_1D_V4I8_TRAP_R;
	break;			break;
	case NVPTXISD::Suld1DV4I16Trap:			case NVPTXISD::Suld1DV4I16Trap:
	Opc = NVPTX::SULD_1D_V4I16_TRAP;			Opc = NVPTX::SULD_1D_V4I16_TRAP_R;
	break;			break;
	case NVPTXISD::Suld1DV4I32Trap:			case NVPTXISD::Suld1DV4I32Trap:
	Opc = NVPTX::SULD_1D_V4I32_TRAP;			Opc = NVPTX::SULD_1D_V4I32_TRAP_R;
	break;			break;
	case NVPTXISD::Suld1DArrayI8Trap:			case NVPTXISD::Suld1DArrayI8Trap:
	Opc = NVPTX::SULD_1D_ARRAY_I8_TRAP;			Opc = NVPTX::SULD_1D_ARRAY_I8_TRAP_R;
	break;			break;
	case NVPTXISD::Suld1DArrayI16Trap:			case NVPTXISD::Suld1DArrayI16Trap:
	Opc = NVPTX::SULD_1D_ARRAY_I16_TRAP;			Opc = NVPTX::SULD_1D_ARRAY_I16_TRAP_R;
	break;			break;
	case NVPTXISD::Suld1DArrayI32Trap:			case NVPTXISD::Suld1DArrayI32Trap:
	Opc = NVPTX::SULD_1D_ARRAY_I32_TRAP;			Opc = NVPTX::SULD_1D_ARRAY_I32_TRAP_R;
	break;			break;
	case NVPTXISD::Suld1DArrayI64Trap:			case NVPTXISD::Suld1DArrayI64Trap:
	Opc = NVPTX::SULD_1D_ARRAY_I64_TRAP;			Opc = NVPTX::SULD_1D_ARRAY_I64_TRAP_R;
	break;			break;
	case NVPTXISD::Suld1DArrayV2I8Trap:			case NVPTXISD::Suld1DArrayV2I8Trap:
	Opc = NVPTX::SULD_1D_ARRAY_V2I8_TRAP;			Opc = NVPTX::SULD_1D_ARRAY_V2I8_TRAP_R;
	break;			break;
	case NVPTXISD::Suld1DArrayV2I16Trap:			case NVPTXISD::Suld1DArrayV2I16Trap:
	Opc = NVPTX::SULD_1D_ARRAY_V2I16_TRAP;			Opc = NVPTX::SULD_1D_ARRAY_V2I16_TRAP_R;
	break;			break;
	case NVPTXISD::Suld1DArrayV2I32Trap:			case NVPTXISD::Suld1DArrayV2I32Trap:
	Opc = NVPTX::SULD_1D_ARRAY_V2I32_TRAP;			Opc = NVPTX::SULD_1D_ARRAY_V2I32_TRAP_R;
	break;			break;
	case NVPTXISD::Suld1DArrayV2I64Trap:			case NVPTXISD::Suld1DArrayV2I64Trap:
	Opc = NVPTX::SULD_1D_ARRAY_V2I64_TRAP;			Opc = NVPTX::SULD_1D_ARRAY_V2I64_TRAP_R;
	break;			break;
	case NVPTXISD::Suld1DArrayV4I8Trap:			case NVPTXISD::Suld1DArrayV4I8Trap:
	Opc = NVPTX::SULD_1D_ARRAY_V4I8_TRAP;			Opc = NVPTX::SULD_1D_ARRAY_V4I8_TRAP_R;
	break;			break;
	case NVPTXISD::Suld1DArrayV4I16Trap:			case NVPTXISD::Suld1DArrayV4I16Trap:
	Opc = NVPTX::SULD_1D_ARRAY_V4I16_TRAP;			Opc = NVPTX::SULD_1D_ARRAY_V4I16_TRAP_R;
	break;			break;
	case NVPTXISD::Suld1DArrayV4I32Trap:			case NVPTXISD::Suld1DArrayV4I32Trap:
	Opc = NVPTX::SULD_1D_ARRAY_V4I32_TRAP;			Opc = NVPTX::SULD_1D_ARRAY_V4I32_TRAP_R;
	break;			break;
	case NVPTXISD::Suld2DI8Trap:			case NVPTXISD::Suld2DI8Trap:
	Opc = NVPTX::SULD_2D_I8_TRAP;			Opc = NVPTX::SULD_2D_I8_TRAP_R;
	break;			break;
	case NVPTXISD::Suld2DI16Trap:			case NVPTXISD::Suld2DI16Trap:
	Opc = NVPTX::SULD_2D_I16_TRAP;			Opc = NVPTX::SULD_2D_I16_TRAP_R;
	break;			break;
	case NVPTXISD::Suld2DI32Trap:			case NVPTXISD::Suld2DI32Trap:
	Opc = NVPTX::SULD_2D_I32_TRAP;			Opc = NVPTX::SULD_2D_I32_TRAP_R;
	break;			break;
	case NVPTXISD::Suld2DI64Trap:			case NVPTXISD::Suld2DI64Trap:
	Opc = NVPTX::SULD_2D_I64_TRAP;			Opc = NVPTX::SULD_2D_I64_TRAP_R;
	break;			break;
	case NVPTXISD::Suld2DV2I8Trap:			case NVPTXISD::Suld2DV2I8Trap:
	Opc = NVPTX::SULD_2D_V2I8_TRAP;			Opc = NVPTX::SULD_2D_V2I8_TRAP_R;
	break;			break;
	case NVPTXISD::Suld2DV2I16Trap:			case NVPTXISD::Suld2DV2I16Trap:
	Opc = NVPTX::SULD_2D_V2I16_TRAP;			Opc = NVPTX::SULD_2D_V2I16_TRAP_R;
	break;			break;
	case NVPTXISD::Suld2DV2I32Trap:			case NVPTXISD::Suld2DV2I32Trap:
	Opc = NVPTX::SULD_2D_V2I32_TRAP;			Opc = NVPTX::SULD_2D_V2I32_TRAP_R;
	break;			break;
	case NVPTXISD::Suld2DV2I64Trap:			case NVPTXISD::Suld2DV2I64Trap:
	Opc = NVPTX::SULD_2D_V2I64_TRAP;			Opc = NVPTX::SULD_2D_V2I64_TRAP_R;
	break;			break;
	case NVPTXISD::Suld2DV4I8Trap:			case NVPTXISD::Suld2DV4I8Trap:
	Opc = NVPTX::SULD_2D_V4I8_TRAP;			Opc = NVPTX::SULD_2D_V4I8_TRAP_R;
	break;			break;
	case NVPTXISD::Suld2DV4I16Trap:			case NVPTXISD::Suld2DV4I16Trap:
	Opc = NVPTX::SULD_2D_V4I16_TRAP;			Opc = NVPTX::SULD_2D_V4I16_TRAP_R;
	break;			break;
	case NVPTXISD::Suld2DV4I32Trap:			case NVPTXISD::Suld2DV4I32Trap:
	Opc = NVPTX::SULD_2D_V4I32_TRAP;			Opc = NVPTX::SULD_2D_V4I32_TRAP_R;
	break;			break;
	case NVPTXISD::Suld2DArrayI8Trap:			case NVPTXISD::Suld2DArrayI8Trap:
	Opc = NVPTX::SULD_2D_ARRAY_I8_TRAP;			Opc = NVPTX::SULD_2D_ARRAY_I8_TRAP_R;
	break;			break;
	case NVPTXISD::Suld2DArrayI16Trap:			case NVPTXISD::Suld2DArrayI16Trap:
	Opc = NVPTX::SULD_2D_ARRAY_I16_TRAP;			Opc = NVPTX::SULD_2D_ARRAY_I16_TRAP_R;
	break;			break;
	case NVPTXISD::Suld2DArrayI32Trap:			case NVPTXISD::Suld2DArrayI32Trap:
	Opc = NVPTX::SULD_2D_ARRAY_I32_TRAP;			Opc = NVPTX::SULD_2D_ARRAY_I32_TRAP_R;
	break;			break;
	case NVPTXISD::Suld2DArrayI64Trap:			case NVPTXISD::Suld2DArrayI64Trap:
	Opc = NVPTX::SULD_2D_ARRAY_I64_TRAP;			Opc = NVPTX::SULD_2D_ARRAY_I64_TRAP_R;
	break;			break;
	case NVPTXISD::Suld2DArrayV2I8Trap:			case NVPTXISD::Suld2DArrayV2I8Trap:
	Opc = NVPTX::SULD_2D_ARRAY_V2I8_TRAP;			Opc = NVPTX::SULD_2D_ARRAY_V2I8_TRAP_R;
	break;			break;
	case NVPTXISD::Suld2DArrayV2I16Trap:			case NVPTXISD::Suld2DArrayV2I16Trap:
	Opc = NVPTX::SULD_2D_ARRAY_V2I16_TRAP;			Opc = NVPTX::SULD_2D_ARRAY_V2I16_TRAP_R;
	break;			break;
	case NVPTXISD::Suld2DArrayV2I32Trap:			case NVPTXISD::Suld2DArrayV2I32Trap:
	Opc = NVPTX::SULD_2D_ARRAY_V2I32_TRAP;			Opc = NVPTX::SULD_2D_ARRAY_V2I32_TRAP_R;
	break;			break;
	case NVPTXISD::Suld2DArrayV2I64Trap:			case NVPTXISD::Suld2DArrayV2I64Trap:
	Opc = NVPTX::SULD_2D_ARRAY_V2I64_TRAP;			Opc = NVPTX::SULD_2D_ARRAY_V2I64_TRAP_R;
	break;			break;
	case NVPTXISD::Suld2DArrayV4I8Trap:			case NVPTXISD::Suld2DArrayV4I8Trap:
	Opc = NVPTX::SULD_2D_ARRAY_V4I8_TRAP;			Opc = NVPTX::SULD_2D_ARRAY_V4I8_TRAP_R;
	break;			break;
	case NVPTXISD::Suld2DArrayV4I16Trap:			case NVPTXISD::Suld2DArrayV4I16Trap:
	Opc = NVPTX::SULD_2D_ARRAY_V4I16_TRAP;			Opc = NVPTX::SULD_2D_ARRAY_V4I16_TRAP_R;
	break;			break;
	case NVPTXISD::Suld2DArrayV4I32Trap:			case NVPTXISD::Suld2DArrayV4I32Trap:
	Opc = NVPTX::SULD_2D_ARRAY_V4I32_TRAP;			Opc = NVPTX::SULD_2D_ARRAY_V4I32_TRAP_R;
	break;			break;
	case NVPTXISD::Suld3DI8Trap:			case NVPTXISD::Suld3DI8Trap:
	Opc = NVPTX::SULD_3D_I8_TRAP;			Opc = NVPTX::SULD_3D_I8_TRAP_R;
	break;			break;
	case NVPTXISD::Suld3DI16Trap:			case NVPTXISD::Suld3DI16Trap:
	Opc = NVPTX::SULD_3D_I16_TRAP;			Opc = NVPTX::SULD_3D_I16_TRAP_R;
	break;			break;
	case NVPTXISD::Suld3DI32Trap:			case NVPTXISD::Suld3DI32Trap:
	Opc = NVPTX::SULD_3D_I32_TRAP;			Opc = NVPTX::SULD_3D_I32_TRAP_R;
	break;			break;
	case NVPTXISD::Suld3DI64Trap:			case NVPTXISD::Suld3DI64Trap:
	Opc = NVPTX::SULD_3D_I64_TRAP;			Opc = NVPTX::SULD_3D_I64_TRAP_R;
	break;			break;
	case NVPTXISD::Suld3DV2I8Trap:			case NVPTXISD::Suld3DV2I8Trap:
	Opc = NVPTX::SULD_3D_V2I8_TRAP;			Opc = NVPTX::SULD_3D_V2I8_TRAP_R;
	break;			break;
	case NVPTXISD::Suld3DV2I16Trap:			case NVPTXISD::Suld3DV2I16Trap:
	Opc = NVPTX::SULD_3D_V2I16_TRAP;			Opc = NVPTX::SULD_3D_V2I16_TRAP_R;
	break;			break;
	case NVPTXISD::Suld3DV2I32Trap:			case NVPTXISD::Suld3DV2I32Trap:
	Opc = NVPTX::SULD_3D_V2I32_TRAP;			Opc = NVPTX::SULD_3D_V2I32_TRAP_R;
	break;			break;
	case NVPTXISD::Suld3DV2I64Trap:			case NVPTXISD::Suld3DV2I64Trap:
	Opc = NVPTX::SULD_3D_V2I64_TRAP;			Opc = NVPTX::SULD_3D_V2I64_TRAP_R;
	break;			break;
	case NVPTXISD::Suld3DV4I8Trap:			case NVPTXISD::Suld3DV4I8Trap:
	Opc = NVPTX::SULD_3D_V4I8_TRAP;			Opc = NVPTX::SULD_3D_V4I8_TRAP_R;
	break;			break;
	case NVPTXISD::Suld3DV4I16Trap:			case NVPTXISD::Suld3DV4I16Trap:
	Opc = NVPTX::SULD_3D_V4I16_TRAP;			Opc = NVPTX::SULD_3D_V4I16_TRAP_R;
	break;			break;
	case NVPTXISD::Suld3DV4I32Trap:			case NVPTXISD::Suld3DV4I32Trap:
	Opc = NVPTX::SULD_3D_V4I32_TRAP;			Opc = NVPTX::SULD_3D_V4I32_TRAP_R;
	break;			break;
	case NVPTXISD::Suld1DI8Zero:			case NVPTXISD::Suld1DI8Zero:
	Opc = NVPTX::SULD_1D_I8_ZERO;			Opc = NVPTX::SULD_1D_I8_ZERO_R;
	break;			break;
	case NVPTXISD::Suld1DI16Zero:			case NVPTXISD::Suld1DI16Zero:
	Opc = NVPTX::SULD_1D_I16_ZERO;			Opc = NVPTX::SULD_1D_I16_ZERO_R;
	break;			break;
	case NVPTXISD::Suld1DI32Zero:			case NVPTXISD::Suld1DI32Zero:
	Opc = NVPTX::SULD_1D_I32_ZERO;			Opc = NVPTX::SULD_1D_I32_ZERO_R;
	break;			break;
	case NVPTXISD::Suld1DI64Zero:			case NVPTXISD::Suld1DI64Zero:
	Opc = NVPTX::SULD_1D_I64_ZERO;			Opc = NVPTX::SULD_1D_I64_ZERO_R;
	break;			break;
	case NVPTXISD::Suld1DV2I8Zero:			case NVPTXISD::Suld1DV2I8Zero:
	Opc = NVPTX::SULD_1D_V2I8_ZERO;			Opc = NVPTX::SULD_1D_V2I8_ZERO_R;
	break;			break;
	case NVPTXISD::Suld1DV2I16Zero:			case NVPTXISD::Suld1DV2I16Zero:
	Opc = NVPTX::SULD_1D_V2I16_ZERO;			Opc = NVPTX::SULD_1D_V2I16_ZERO_R;
	break;			break;
	case NVPTXISD::Suld1DV2I32Zero:			case NVPTXISD::Suld1DV2I32Zero:
	Opc = NVPTX::SULD_1D_V2I32_ZERO;			Opc = NVPTX::SULD_1D_V2I32_ZERO_R;
	break;			break;
	case NVPTXISD::Suld1DV2I64Zero:			case NVPTXISD::Suld1DV2I64Zero:
	Opc = NVPTX::SULD_1D_V2I64_ZERO;			Opc = NVPTX::SULD_1D_V2I64_ZERO_R;
	break;			break;
	case NVPTXISD::Suld1DV4I8Zero:			case NVPTXISD::Suld1DV4I8Zero:
	Opc = NVPTX::SULD_1D_V4I8_ZERO;			Opc = NVPTX::SULD_1D_V4I8_ZERO_R;
	break;			break;
	case NVPTXISD::Suld1DV4I16Zero:			case NVPTXISD::Suld1DV4I16Zero:
	Opc = NVPTX::SULD_1D_V4I16_ZERO;			Opc = NVPTX::SULD_1D_V4I16_ZERO_R;
	break;			break;
	case NVPTXISD::Suld1DV4I32Zero:			case NVPTXISD::Suld1DV4I32Zero:
	Opc = NVPTX::SULD_1D_V4I32_ZERO;			Opc = NVPTX::SULD_1D_V4I32_ZERO_R;
	break;			break;
	case NVPTXISD::Suld1DArrayI8Zero:			case NVPTXISD::Suld1DArrayI8Zero:
	Opc = NVPTX::SULD_1D_ARRAY_I8_ZERO;			Opc = NVPTX::SULD_1D_ARRAY_I8_ZERO_R;
	break;			break;
	case NVPTXISD::Suld1DArrayI16Zero:			case NVPTXISD::Suld1DArrayI16Zero:
	Opc = NVPTX::SULD_1D_ARRAY_I16_ZERO;			Opc = NVPTX::SULD_1D_ARRAY_I16_ZERO_R;
	break;			break;
	case NVPTXISD::Suld1DArrayI32Zero:			case NVPTXISD::Suld1DArrayI32Zero:
	Opc = NVPTX::SULD_1D_ARRAY_I32_ZERO;			Opc = NVPTX::SULD_1D_ARRAY_I32_ZERO_R;
	break;			break;
	case NVPTXISD::Suld1DArrayI64Zero:			case NVPTXISD::Suld1DArrayI64Zero:
	Opc = NVPTX::SULD_1D_ARRAY_I64_ZERO;			Opc = NVPTX::SULD_1D_ARRAY_I64_ZERO_R;
	break;			break;
	case NVPTXISD::Suld1DArrayV2I8Zero:			case NVPTXISD::Suld1DArrayV2I8Zero:
	Opc = NVPTX::SULD_1D_ARRAY_V2I8_ZERO;			Opc = NVPTX::SULD_1D_ARRAY_V2I8_ZERO_R;
	break;			break;
	case NVPTXISD::Suld1DArrayV2I16Zero:			case NVPTXISD::Suld1DArrayV2I16Zero:
	Opc = NVPTX::SULD_1D_ARRAY_V2I16_ZERO;			Opc = NVPTX::SULD_1D_ARRAY_V2I16_ZERO_R;
	break;			break;
	case NVPTXISD::Suld1DArrayV2I32Zero:			case NVPTXISD::Suld1DArrayV2I32Zero:
	Opc = NVPTX::SULD_1D_ARRAY_V2I32_ZERO;			Opc = NVPTX::SULD_1D_ARRAY_V2I32_ZERO_R;
	break;			break;
	case NVPTXISD::Suld1DArrayV2I64Zero:			case NVPTXISD::Suld1DArrayV2I64Zero:
	Opc = NVPTX::SULD_1D_ARRAY_V2I64_ZERO;			Opc = NVPTX::SULD_1D_ARRAY_V2I64_ZERO_R;
	break;			break;
	case NVPTXISD::Suld1DArrayV4I8Zero:			case NVPTXISD::Suld1DArrayV4I8Zero:
	Opc = NVPTX::SULD_1D_ARRAY_V4I8_ZERO;			Opc = NVPTX::SULD_1D_ARRAY_V4I8_ZERO_R;
	break;			break;
	case NVPTXISD::Suld1DArrayV4I16Zero:			case NVPTXISD::Suld1DArrayV4I16Zero:
	Opc = NVPTX::SULD_1D_ARRAY_V4I16_ZERO;			Opc = NVPTX::SULD_1D_ARRAY_V4I16_ZERO_R;
	break;			break;
	case NVPTXISD::Suld1DArrayV4I32Zero:			case NVPTXISD::Suld1DArrayV4I32Zero:
	Opc = NVPTX::SULD_1D_ARRAY_V4I32_ZERO;			Opc = NVPTX::SULD_1D_ARRAY_V4I32_ZERO_R;
	break;			break;
	case NVPTXISD::Suld2DI8Zero:			case NVPTXISD::Suld2DI8Zero:
	Opc = NVPTX::SULD_2D_I8_ZERO;			Opc = NVPTX::SULD_2D_I8_ZERO_R;
	break;			break;
	case NVPTXISD::Suld2DI16Zero:			case NVPTXISD::Suld2DI16Zero:
	Opc = NVPTX::SULD_2D_I16_ZERO;			Opc = NVPTX::SULD_2D_I16_ZERO_R;
	break;			break;
	case NVPTXISD::Suld2DI32Zero:			case NVPTXISD::Suld2DI32Zero:
	Opc = NVPTX::SULD_2D_I32_ZERO;			Opc = NVPTX::SULD_2D_I32_ZERO_R;
	break;			break;
	case NVPTXISD::Suld2DI64Zero:			case NVPTXISD::Suld2DI64Zero:
	Opc = NVPTX::SULD_2D_I64_ZERO;			Opc = NVPTX::SULD_2D_I64_ZERO_R;
	break;			break;
	case NVPTXISD::Suld2DV2I8Zero:			case NVPTXISD::Suld2DV2I8Zero:
	Opc = NVPTX::SULD_2D_V2I8_ZERO;			Opc = NVPTX::SULD_2D_V2I8_ZERO_R;
	break;			break;
	case NVPTXISD::Suld2DV2I16Zero:			case NVPTXISD::Suld2DV2I16Zero:
	Opc = NVPTX::SULD_2D_V2I16_ZERO;			Opc = NVPTX::SULD_2D_V2I16_ZERO_R;
	break;			break;
	case NVPTXISD::Suld2DV2I32Zero:			case NVPTXISD::Suld2DV2I32Zero:
	Opc = NVPTX::SULD_2D_V2I32_ZERO;			Opc = NVPTX::SULD_2D_V2I32_ZERO_R;
	break;			break;
	case NVPTXISD::Suld2DV2I64Zero:			case NVPTXISD::Suld2DV2I64Zero:
	Opc = NVPTX::SULD_2D_V2I64_ZERO;			Opc = NVPTX::SULD_2D_V2I64_ZERO_R;
	break;			break;
	case NVPTXISD::Suld2DV4I8Zero:			case NVPTXISD::Suld2DV4I8Zero:
	Opc = NVPTX::SULD_2D_V4I8_ZERO;			Opc = NVPTX::SULD_2D_V4I8_ZERO_R;
	break;			break;
	case NVPTXISD::Suld2DV4I16Zero:			case NVPTXISD::Suld2DV4I16Zero:
	Opc = NVPTX::SULD_2D_V4I16_ZERO;			Opc = NVPTX::SULD_2D_V4I16_ZERO_R;
	break;			break;
	case NVPTXISD::Suld2DV4I32Zero:			case NVPTXISD::Suld2DV4I32Zero:
	Opc = NVPTX::SULD_2D_V4I32_ZERO;			Opc = NVPTX::SULD_2D_V4I32_ZERO_R;
	break;			break;
	case NVPTXISD::Suld2DArrayI8Zero:			case NVPTXISD::Suld2DArrayI8Zero:
	Opc = NVPTX::SULD_2D_ARRAY_I8_ZERO;			Opc = NVPTX::SULD_2D_ARRAY_I8_ZERO_R;
	break;			break;
	case NVPTXISD::Suld2DArrayI16Zero:			case NVPTXISD::Suld2DArrayI16Zero:
	Opc = NVPTX::SULD_2D_ARRAY_I16_ZERO;			Opc = NVPTX::SULD_2D_ARRAY_I16_ZERO_R;
	break;			break;
	case NVPTXISD::Suld2DArrayI32Zero:			case NVPTXISD::Suld2DArrayI32Zero:
	Opc = NVPTX::SULD_2D_ARRAY_I32_ZERO;			Opc = NVPTX::SULD_2D_ARRAY_I32_ZERO_R;
	break;			break;
	case NVPTXISD::Suld2DArrayI64Zero:			case NVPTXISD::Suld2DArrayI64Zero:
	Opc = NVPTX::SULD_2D_ARRAY_I64_ZERO;			Opc = NVPTX::SULD_2D_ARRAY_I64_ZERO_R;
	break;			break;
	case NVPTXISD::Suld2DArrayV2I8Zero:			case NVPTXISD::Suld2DArrayV2I8Zero:
	Opc = NVPTX::SULD_2D_ARRAY_V2I8_ZERO;			Opc = NVPTX::SULD_2D_ARRAY_V2I8_ZERO_R;
	break;			break;
	case NVPTXISD::Suld2DArrayV2I16Zero:			case NVPTXISD::Suld2DArrayV2I16Zero:
	Opc = NVPTX::SULD_2D_ARRAY_V2I16_ZERO;			Opc = NVPTX::SULD_2D_ARRAY_V2I16_ZERO_R;
	break;			break;
	case NVPTXISD::Suld2DArrayV2I32Zero:			case NVPTXISD::Suld2DArrayV2I32Zero:
	Opc = NVPTX::SULD_2D_ARRAY_V2I32_ZERO;			Opc = NVPTX::SULD_2D_ARRAY_V2I32_ZERO_R;
	break;			break;
	case NVPTXISD::Suld2DArrayV2I64Zero:			case NVPTXISD::Suld2DArrayV2I64Zero:
	Opc = NVPTX::SULD_2D_ARRAY_V2I64_ZERO;			Opc = NVPTX::SULD_2D_ARRAY_V2I64_ZERO_R;
	break;			break;
	case NVPTXISD::Suld2DArrayV4I8Zero:			case NVPTXISD::Suld2DArrayV4I8Zero:
	Opc = NVPTX::SULD_2D_ARRAY_V4I8_ZERO;			Opc = NVPTX::SULD_2D_ARRAY_V4I8_ZERO_R;
	break;			break;
	case NVPTXISD::Suld2DArrayV4I16Zero:			case NVPTXISD::Suld2DArrayV4I16Zero:
	Opc = NVPTX::SULD_2D_ARRAY_V4I16_ZERO;			Opc = NVPTX::SULD_2D_ARRAY_V4I16_ZERO_R;
	break;			break;
	case NVPTXISD::Suld2DArrayV4I32Zero:			case NVPTXISD::Suld2DArrayV4I32Zero:
	Opc = NVPTX::SULD_2D_ARRAY_V4I32_ZERO;			Opc = NVPTX::SULD_2D_ARRAY_V4I32_ZERO_R;
	break;			break;
	case NVPTXISD::Suld3DI8Zero:			case NVPTXISD::Suld3DI8Zero:
	Opc = NVPTX::SULD_3D_I8_ZERO;			Opc = NVPTX::SULD_3D_I8_ZERO_R;
	break;			break;
	case NVPTXISD::Suld3DI16Zero:			case NVPTXISD::Suld3DI16Zero:
	Opc = NVPTX::SULD_3D_I16_ZERO;			Opc = NVPTX::SULD_3D_I16_ZERO_R;
	break;			break;
	case NVPTXISD::Suld3DI32Zero:			case NVPTXISD::Suld3DI32Zero:
	Opc = NVPTX::SULD_3D_I32_ZERO;			Opc = NVPTX::SULD_3D_I32_ZERO_R;
	break;			break;
	case NVPTXISD::Suld3DI64Zero:			case NVPTXISD::Suld3DI64Zero:
	Opc = NVPTX::SULD_3D_I64_ZERO;			Opc = NVPTX::SULD_3D_I64_ZERO_R;
	break;			break;
	case NVPTXISD::Suld3DV2I8Zero:			case NVPTXISD::Suld3DV2I8Zero:
	Opc = NVPTX::SULD_3D_V2I8_ZERO;			Opc = NVPTX::SULD_3D_V2I8_ZERO_R;
	break;			break;
	case NVPTXISD::Suld3DV2I16Zero:			case NVPTXISD::Suld3DV2I16Zero:
	Opc = NVPTX::SULD_3D_V2I16_ZERO;			Opc = NVPTX::SULD_3D_V2I16_ZERO_R;
	break;			break;
	case NVPTXISD::Suld3DV2I32Zero:			case NVPTXISD::Suld3DV2I32Zero:
	Opc = NVPTX::SULD_3D_V2I32_ZERO;			Opc = NVPTX::SULD_3D_V2I32_ZERO_R;
	break;			break;
	case NVPTXISD::Suld3DV2I64Zero:			case NVPTXISD::Suld3DV2I64Zero:
	Opc = NVPTX::SULD_3D_V2I64_ZERO;			Opc = NVPTX::SULD_3D_V2I64_ZERO_R;
	break;			break;
	case NVPTXISD::Suld3DV4I8Zero:			case NVPTXISD::Suld3DV4I8Zero:
	Opc = NVPTX::SULD_3D_V4I8_ZERO;			Opc = NVPTX::SULD_3D_V4I8_ZERO_R;
	break;			break;
	case NVPTXISD::Suld3DV4I16Zero:			case NVPTXISD::Suld3DV4I16Zero:
	Opc = NVPTX::SULD_3D_V4I16_ZERO;			Opc = NVPTX::SULD_3D_V4I16_ZERO_R;
	break;			break;
	case NVPTXISD::Suld3DV4I32Zero:			case NVPTXISD::Suld3DV4I32Zero:
	Opc = NVPTX::SULD_3D_V4I32_ZERO;			Opc = NVPTX::SULD_3D_V4I32_ZERO_R;
	break;			break;
	}			}

	// Copy over operands			// Copy over operands
	SmallVector<SDValue, 8> Ops(drop_begin(N->ops()));			SmallVector<SDValue, 8> Ops(drop_begin(N->ops()));
	Ops.push_back(N->getOperand(0)); // Move chain to the back.			Ops.push_back(N->getOperand(0)); // Move chain to the back.

	ReplaceNode(N, CurDAG->getMachineNode(Opc, SDLoc(N), N->getVTList(), Ops));			ReplaceNode(N, CurDAG->getMachineNode(Opc, SDLoc(N), N->getVTList(), Ops));
	▲ Show 20 Lines • Show All 396 Lines • Show Last 20 Lines

llvm/lib/Target/NVPTX/NVPTXIntrinsics.td

This file is larger than 256 KB, so syntax highlighting is disabled by default.

	Show First 20 Lines • Show All 2,458 Lines • ▼ Show 20 Lines
	//-----------------------------------			//-----------------------------------

	// NOTE: For Fermi support, any new texture/surface/sampler intrinsics must be			// NOTE: For Fermi support, any new texture/surface/sampler intrinsics must be
	// also defined in NVPTXReplaceImageHandles.cpp			// also defined in NVPTXReplaceImageHandles.cpp

	// texmode_independent			// texmode_independent
	let IsTex = true, IsTexModeUnified = false in {			let IsTex = true, IsTexModeUnified = false in {
	// Texture fetch instructions using handles			// Texture fetch instructions using handles
	def TEX_1D_F32_S32
	: NVPTXInst<(outs Float32Regs:$r, Float32Regs:$g,			class TEX_1D_base<string inst, NVPTXRegClass outtype,
	Float32Regs:$b, Float32Regs:$a),			NVPTXRegClass intype, dag texsamp>
	(ins Int64Regs:$t, Int64Regs:$s, Int32Regs:$x),			: NVPTXInst<(outs outtype:$r, outtype:$g,
	"tex.1d.v4.f32.s32 \t\\{$r, $g, $b, $a\\}, [$t, $s, \\{$x\\}];",			outtype:$b, outtype:$a),
	[]>;			!con(texsamp, (ins intype:$x)),
	def TEX_1D_F32_F32			inst # " \t\\{$r, $g, $b, $a\\}, [$t, $s, \\{$x\\}];",
	: NVPTXInst<(outs Float32Regs:$r, Float32Regs:$g,			[]>;
	Float32Regs:$b, Float32Regs:$a),
	(ins Int64Regs:$t, Int64Regs:$s, Float32Regs:$x),			multiclass TEX_1D<string inst, NVPTXRegClass outtype, NVPTXRegClass intype> {
	"tex.1d.v4.f32.f32 \t\\{$r, $g, $b, $a\\}, [$t, $s, \\{$x\\}];",			def _RR : TEX_1D_base<inst, outtype, intype,
	[]>;			(ins Int64Regs:$t, Int64Regs:$s)>;
	def TEX_1D_F32_F32_LEVEL			def _RI : TEX_1D_base<inst, outtype, intype,
	: NVPTXInst<(outs Float32Regs:$r, Float32Regs:$g,			(ins Int64Regs:$t, i64imm:$s)>;
	Float32Regs:$b, Float32Regs:$a),			def _IR : TEX_1D_base<inst, outtype, intype,
	(ins Int64Regs:$t, Int64Regs:$s, Float32Regs:$x, Float32Regs:$lod),			(ins i64imm:$t, Int64Regs:$s)>;
	"tex.level.1d.v4.f32.f32 \t\\{$r, $g, $b, $a\\}, "			def _II : TEX_1D_base<inst, outtype, intype,
	"[$t, $s, \\{$x\\}], $lod;",			(ins i64imm:$t, i64imm:$s)>;
	[]>;			}
	def TEX_1D_F32_F32_GRAD
	: NVPTXInst<(outs Float32Regs:$r, Float32Regs:$g,			defm TEX_1D_F32_S32 : TEX_1D<"tex.1d.v4.f32.s32", Float32Regs, Int32Regs>;
	Float32Regs:$b, Float32Regs:$a),			defm TEX_1D_F32_F32 : TEX_1D<"tex.1d.v4.f32.f32", Float32Regs, Float32Regs>;
	(ins Int64Regs:$t, Int64Regs:$s, Float32Regs:$x,			defm TEX_1D_S32_S32 : TEX_1D<"tex.1d.v4.s32.s32", Int32Regs, Int32Regs>;
	Float32Regs:$gradx, Float32Regs:$grady),			defm TEX_1D_S32_F32 : TEX_1D<"tex.1d.v4.s32.f32", Int32Regs, Float32Regs>;
	"tex.grad.1d.v4.f32.f32 \t\\{$r, $g, $b, $a\\}, "			defm TEX_1D_U32_S32 : TEX_1D<"tex.1d.v4.u32.s32", Int32Regs, Int32Regs>;
	"[$t, $s, \\{$x\\}], \\{$gradx\\}, \\{$grady\\};",			defm TEX_1D_U32_F32 : TEX_1D<"tex.1d.v4.u32.f32", Int32Regs, Float32Regs>;
	[]>;
	def TEX_1D_S32_S32			class TEX_1D_LEVEL_base<string inst, NVPTXRegClass outtype,
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g,			NVPTXRegClass intype, dag texsamp>
	Int32Regs:$b, Int32Regs:$a),			: NVPTXInst<(outs outtype:$r, outtype:$g,
	(ins Int64Regs:$t, Int64Regs:$s, Int32Regs:$x),			outtype:$b, outtype:$a),
	"tex.1d.v4.s32.s32 \t\\{$r, $g, $b, $a\\}, [$t, $s, \\{$x\\}];",			!con(texsamp, (ins intype:$x, intype:$lod)),
	[]>;			inst # " \t\\{$r, $g, $b, $a\\}, [$t, $s, \\{$x\\}], $lod;",
	def TEX_1D_S32_F32			[]>;
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g,
	Int32Regs:$b, Int32Regs:$a),			multiclass TEX_1D_LEVEL<string inst, NVPTXRegClass outtype,
	(ins Int64Regs:$t, Int64Regs:$s, Float32Regs:$x),			NVPTXRegClass intype> {
	"tex.1d.v4.s32.f32 \t\\{$r, $g, $b, $a\\}, [$t, $s, \\{$x\\}];",			def _RR : TEX_1D_LEVEL_base<inst, outtype, intype,
	[]>;			(ins Int64Regs:$t, Int64Regs:$s)>;
	def TEX_1D_S32_F32_LEVEL			def _RI : TEX_1D_LEVEL_base<inst, outtype, intype,
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g,			(ins Int64Regs:$t, i64imm:$s)>;
	Int32Regs:$b, Int32Regs:$a),			def _IR : TEX_1D_LEVEL_base<inst, outtype, intype,
	(ins Int64Regs:$t, Int64Regs:$s, Float32Regs:$x,			(ins i64imm:$t, Int64Regs:$s)>;
	Float32Regs:$lod),			def _II : TEX_1D_LEVEL_base<inst, outtype, intype,
	"tex.level.1d.v4.s32.f32 \t\\{$r, $g, $b, $a\\}, "			(ins i64imm:$t, i64imm:$s)>;
	"[$t, $s, \\{$x\\}], $lod;",			}
	[]>;
	def TEX_1D_S32_F32_GRAD			defm TEX_1D_F32_F32_LEVEL :
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g,			TEX_1D_LEVEL<"tex.level.1d.v4.f32.f32", Float32Regs, Float32Regs>;
	Int32Regs:$b, Int32Regs:$a),			defm TEX_1D_S32_F32_LEVEL :
	(ins Int64Regs:$t, Int64Regs:$s, Float32Regs:$x,			TEX_1D_LEVEL<"tex.level.1d.v4.s32.f32", Int32Regs, Float32Regs>;
	Float32Regs:$gradx, Float32Regs:$grady),			defm TEX_1D_U32_F32_LEVEL :
	"tex.grad.1d.v4.s32.f32 \t\\{$r, $g, $b, $a\\}, "			TEX_1D_LEVEL<"tex.level.1d.v4.u32.f32", Int32Regs, Float32Regs>;
	"[$t, $s, \\{$x\\}], \\{$gradx\\}, \\{$grady\\};",
	[]>;			class TEX_1D_GRAD_base<string inst, NVPTXRegClass outtype,
	def TEX_1D_U32_S32			NVPTXRegClass intype, dag texsamp>
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g,			: NVPTXInst<(outs outtype:$r, outtype:$g,
	Int32Regs:$b, Int32Regs:$a),			outtype:$b, outtype:$a),
	(ins Int64Regs:$t, Int64Regs:$s, Int32Regs:$x),			!con(texsamp, (ins intype:$x, intype:$gradx, intype:$grady)),
	"tex.1d.v4.u32.s32 \t\\{$r, $g, $b, $a\\}, [$t, $s, \\{$x\\}];",			inst # " \t\\{$r, $g, $b, $a\\}, [$t, $s, \\{$x\\}],"
	[]>;			" \\{$gradx\\}, \\{$grady\\};",
	def TEX_1D_U32_F32			[]>;
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g,
	Int32Regs:$b, Int32Regs:$a),			multiclass TEX_1D_GRAD<string inst, NVPTXRegClass outtype,
	(ins Int64Regs:$t, Int64Regs:$s, Float32Regs:$x),			NVPTXRegClass intype> {
	"tex.1d.v4.u32.f32 \t\\{$r, $g, $b, $a\\}, [$t, $s, \\{$x\\}];",			def _RR : TEX_1D_GRAD_base<inst, outtype, intype,
	[]>;			(ins Int64Regs:$t, Int64Regs:$s)>;
	def TEX_1D_U32_F32_LEVEL			def _RI : TEX_1D_GRAD_base<inst, outtype, intype,
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g,			(ins Int64Regs:$t, i64imm:$s)>;
	Int32Regs:$b, Int32Regs:$a),			def _IR : TEX_1D_GRAD_base<inst, outtype, intype,
	(ins Int64Regs:$t, Int64Regs:$s, Float32Regs:$x,			(ins i64imm:$t, Int64Regs:$s)>;
	Float32Regs:$lod),			def _II : TEX_1D_GRAD_base<inst, outtype, intype,
	"tex.level.1d.v4.u32.f32 \t\\{$r, $g, $b, $a\\}, "			(ins i64imm:$t, i64imm:$s)>;
	"[$t, $s, \\{$x\\}], $lod;",			}
	[]>;
	def TEX_1D_U32_F32_GRAD			defm TEX_1D_F32_F32_GRAD
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g,			: TEX_1D_GRAD<"tex.grad.1d.v4.f32.f32", Float32Regs, Float32Regs>;
	Int32Regs:$b, Int32Regs:$a),			defm TEX_1D_S32_F32_GRAD
	(ins Int64Regs:$t, Int64Regs:$s, Float32Regs:$x,			: TEX_1D_GRAD<"tex.grad.1d.v4.s32.f32", Int32Regs, Float32Regs>;
	Float32Regs:$gradx, Float32Regs:$grady),			defm TEX_1D_U32_F32_GRAD
	"tex.grad.1d.v4.u32.f32 \t\\{$r, $g, $b, $a\\}, "			: TEX_1D_GRAD<"tex.grad.1d.v4.u32.f32", Int32Regs, Float32Regs>;
	"[$t, $s, \\{$x\\}], \\{$gradx\\}, \\{$grady\\};",
	[]>;			class TEX_1D_ARRAY_base<string inst, NVPTXRegClass outtype,
				NVPTXRegClass intype, dag texsamp>
	def TEX_1D_ARRAY_F32_S32			: NVPTXInst<(outs outtype:$r, outtype:$g,
	: NVPTXInst<(outs Float32Regs:$r, Float32Regs:$g,			outtype:$b, outtype:$a),
	Float32Regs:$b, Float32Regs:$a),			!con(texsamp, (ins Int32Regs:$l, intype:$x)),
	(ins Int64Regs:$t, Int64Regs:$s, Int32Regs:$l, Int32Regs:$x),			inst # " \t\\{$r, $g, $b, $a\\}, [$t, $s, \\{$l, $x\\}];",
	"tex.a1d.v4.f32.s32 \t\\{$r, $g, $b, $a\\}, "			[]>;
	"[$t, $s, \\{$l, $x\\}];",
	[]>;			multiclass TEX_1D_ARRAY<string inst, NVPTXRegClass outtype,
	def TEX_1D_ARRAY_F32_F32			NVPTXRegClass intype> {
	: NVPTXInst<(outs Float32Regs:$r, Float32Regs:$g,			def _RR : TEX_1D_ARRAY_base<inst, outtype, intype,
	Float32Regs:$b, Float32Regs:$a),			(ins Int64Regs:$t, Int64Regs:$s)>;
	(ins Int64Regs:$t, Int64Regs:$s, Int32Regs:$l, Float32Regs:$x),			def _RI : TEX_1D_ARRAY_base<inst, outtype, intype,
	"tex.a1d.v4.f32.f32 \t\\{$r, $g, $b, $a\\}, "			(ins Int64Regs:$t, i64imm:$s)>;
	"[$t, $s, \\{$l, $x\\}];",			def _IR : TEX_1D_ARRAY_base<inst, outtype, intype,
	[]>;			(ins i64imm:$t, Int64Regs:$s)>;
	def TEX_1D_ARRAY_F32_F32_LEVEL			def _II : TEX_1D_ARRAY_base<inst, outtype, intype,
	: NVPTXInst<(outs Float32Regs:$r, Float32Regs:$g,			(ins i64imm:$t, i64imm:$s)>;
	Float32Regs:$b, Float32Regs:$a),			}
	(ins Int64Regs:$t, Int64Regs:$s, Int32Regs:$l, Float32Regs:$x,
	Float32Regs:$lod),			defm TEX_1D_ARRAY_F32_F32
	"tex.level.a1d.v4.f32.f32 \t\\{$r, $g, $b, $a\\}, "			: TEX_1D_ARRAY<"tex.a1d.v4.f32.f32", Float32Regs, Float32Regs>;
	"[$t, $s, \\{$l, $x\\}], $lod;",			defm TEX_1D_ARRAY_F32_S32
	[]>;			: TEX_1D_ARRAY<"tex.a1d.v4.f32.s32", Float32Regs, Int32Regs>;
	def TEX_1D_ARRAY_F32_F32_GRAD			defm TEX_1D_ARRAY_S32_S32
	: NVPTXInst<(outs Float32Regs:$r, Float32Regs:$g,			: TEX_1D_ARRAY<"tex.a1d.v4.s32.s32", Int32Regs, Int32Regs>;
	Float32Regs:$b, Float32Regs:$a),			defm TEX_1D_ARRAY_S32_F32
	(ins Int64Regs:$t, Int64Regs:$s, Int32Regs:$l, Float32Regs:$x,			: TEX_1D_ARRAY<"tex.a1d.v4.s32.f32", Int32Regs, Float32Regs>;
	Float32Regs:$gradx, Float32Regs:$grady),			defm TEX_1D_ARRAY_U32_S32
	"tex.grad.a1d.v4.f32.f32 \t\\{$r, $g, $b, $a\\}, "			: TEX_1D_ARRAY<"tex.a1d.v4.u32.s32", Int32Regs, Int32Regs>;
	"[$t, $s, \\{$l, $x\\}], \\{$gradx\\}, \\{$grady\\};",			defm TEX_1D_ARRAY_U32_F32
	[]>;			: TEX_1D_ARRAY<"tex.a1d.v4.u32.f32", Int32Regs, Float32Regs>;
	def TEX_1D_ARRAY_S32_S32
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g,			class TEX_1D_ARRAY_LEVEL_base<string inst, NVPTXRegClass outtype,
	Int32Regs:$b, Int32Regs:$a),			NVPTXRegClass intype, dag texsamp>
	(ins Int64Regs:$t, Int64Regs:$s, Int32Regs:$l, Int32Regs:$x),			: NVPTXInst<(outs outtype:$r, outtype:$g,
	"tex.a1d.v4.s32.s32 \t\\{$r, $g, $b, $a\\}, "			outtype:$b, outtype:$a),
	"[$t, $s, \\{$l, $x\\}];",			!con(texsamp, (ins Int32Regs:$l, intype:$x, intype:$lod)),
	[]>;			inst # " \t\\{$r, $g, $b, $a\\},"
	def TEX_1D_ARRAY_S32_F32
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g,
	Int32Regs:$b, Int32Regs:$a),
	(ins Int64Regs:$t, Int64Regs:$s, Int32Regs:$l, Float32Regs:$x),
	"tex.a1d.v4.s32.f32 \t\\{$r, $g, $b, $a\\}, "
	"[$t, $s, \\{$l, $x\\}];",
	[]>;
	def TEX_1D_ARRAY_S32_F32_LEVEL
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g,
	Int32Regs:$b, Int32Regs:$a),
	(ins Int64Regs:$t, Int64Regs:$s, Int32Regs:$l, Float32Regs:$x,
	Float32Regs:$lod),
	"tex.level.a1d.v4.s32.f32 \t\\{$r, $g, $b, $a\\}, "
	"[$t, $s, \\{$l, $x\\}], $lod;",
	[]>;
	def TEX_1D_ARRAY_S32_F32_GRAD
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g,
	Int32Regs:$b, Int32Regs:$a),
	(ins Int64Regs:$t, Int64Regs:$s, Int32Regs:$l, Float32Regs:$x,
	Float32Regs:$gradx, Float32Regs:$grady),
	"tex.grad.a1d.v4.s32.f32 \t\\{$r, $g, $b, $a\\}, "
	"[$t, $s, \\{$l, $x\\}], \\{$gradx\\}, \\{$grady\\};",
	[]>;
	def TEX_1D_ARRAY_U32_S32
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g,
	Int32Regs:$b, Int32Regs:$a),
	(ins Int64Regs:$t, Int64Regs:$s, Int32Regs:$l, Int32Regs:$x),
	"tex.a1d.v4.u32.s32 \t\\{$r, $g, $b, $a\\}, "
	"[$t, $s, \\{$l, $x\\}];",
	[]>;
	def TEX_1D_ARRAY_U32_F32
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g,
	Int32Regs:$b, Int32Regs:$a),
	(ins Int64Regs:$t, Int64Regs:$s, Int32Regs:$l, Float32Regs:$x),
	"tex.a1d.v4.u32.f32 \t\\{$r, $g, $b, $a\\}, "
	"[$t, $s, \\{$l, $x\\}];",
	[]>;
	def TEX_1D_ARRAY_U32_F32_LEVEL
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g,
	Int32Regs:$b, Int32Regs:$a),
	(ins Int64Regs:$t, Int64Regs:$s, Int32Regs:$l, Float32Regs:$x,
	Float32Regs:$lod),
	"tex.level.a1d.v4.u32.f32 \t\\{$r, $g, $b, $a\\}, "
	"[$t, $s, \\{$l, $x\\}], $lod;",			" [$t, $s, \\{$l, $x\\}], $lod;",
	[]>;			[]>;
	def TEX_1D_ARRAY_U32_F32_GRAD
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g,			multiclass TEX_1D_ARRAY_LEVEL<string inst, NVPTXRegClass outtype,
	Int32Regs:$b, Int32Regs:$a),			NVPTXRegClass intype> {
	(ins Int64Regs:$t, Int64Regs:$s, Int32Regs:$l, Float32Regs:$x,			def _RR : TEX_1D_ARRAY_LEVEL_base<inst, outtype, intype,
	Float32Regs:$gradx, Float32Regs:$grady),			(ins Int64Regs:$t, Int64Regs:$s)>;
	"tex.grad.a1d.v4.u32.f32 \t\\{$r, $g, $b, $a\\}, "			def _RI : TEX_1D_ARRAY_LEVEL_base<inst, outtype, intype,
	"[$t, $s, \\{$l, $x\\}], \\{$gradx\\}, \\{$grady\\};",			(ins Int64Regs:$t, i64imm:$s)>;
	[]>;			def _IR : TEX_1D_ARRAY_LEVEL_base<inst, outtype, intype,
				(ins i64imm:$t, Int64Regs:$s)>;
	def TEX_2D_F32_S32			def _II : TEX_1D_ARRAY_LEVEL_base<inst, outtype, intype,
	: NVPTXInst<(outs Float32Regs:$r, Float32Regs:$g,			(ins i64imm:$t, i64imm:$s)>;
	Float32Regs:$b, Float32Regs:$a),			}
	(ins Int64Regs:$t, Int64Regs:$s, Int32Regs:$x, Int32Regs:$y),
	"tex.2d.v4.f32.s32 \t\\{$r, $g, $b, $a\\}, "			defm TEX_1D_ARRAY_F32_F32_LEVEL
	"[$t, $s, \\{$x, $y\\}];",			: TEX_1D_ARRAY_LEVEL<"tex.level.a1d.v4.f32.f32", Float32Regs, Float32Regs>;
	[]>;			defm TEX_1D_ARRAY_S32_F32_LEVEL
	def TEX_2D_F32_F32			: TEX_1D_ARRAY_LEVEL<"tex.level.a1d.v4.s32.f32", Int32Regs, Float32Regs>;
	: NVPTXInst<(outs Float32Regs:$r, Float32Regs:$g,			defm TEX_1D_ARRAY_U32_F32_LEVEL
	Float32Regs:$b, Float32Regs:$a),			: TEX_1D_ARRAY_LEVEL<"tex.level.a1d.v4.u32.f32", Int32Regs, Float32Regs>;
	(ins Int64Regs:$t, Int64Regs:$s, Float32Regs:$x, Float32Regs:$y),
	"tex.2d.v4.f32.f32 \t\\{$r, $g, $b, $a\\}, "			class TEX_1D_ARRAY_GRAD_base<string inst, NVPTXRegClass outtype,
	"[$t, $s, \\{$x, $y\\}];",			NVPTXRegClass intype, dag texsamp>
	[]>;			: NVPTXInst<(outs outtype:$r, outtype:$g,
	def TEX_2D_F32_F32_LEVEL			outtype:$b, outtype:$a),
	: NVPTXInst<(outs Float32Regs:$r, Float32Regs:$g,			!con(texsamp, (ins Int32Regs:$l, intype:$x,
	Float32Regs:$b, Float32Regs:$a),			intype:$gradx, intype:$grady)),
	(ins Int64Regs:$t, Int64Regs:$s, Float32Regs:$x, Float32Regs:$y,			inst # " \t\\{$r, $g, $b, $a\\}, [$t, $s, \\{$l, $x\\}],"
	Float32Regs:$lod),			" \\{$gradx\\}, \\{$grady\\};",
	"tex.level.2d.v4.f32.f32 \t\\{$r, $g, $b, $a\\}, "			[]>;
	"[$t, $s, \\{$x, $y\\}], $lod;",
	[]>;			multiclass TEX_1D_ARRAY_GRAD<string inst, NVPTXRegClass outtype,
	def TEX_2D_F32_F32_GRAD			NVPTXRegClass intype> {
	: NVPTXInst<(outs Float32Regs:$r, Float32Regs:$g,			def _RR : TEX_1D_ARRAY_GRAD_base<inst, outtype, intype,
	Float32Regs:$b, Float32Regs:$a),			(ins Int64Regs:$t, Int64Regs:$s)>;
	(ins Int64Regs:$t, Int64Regs:$s, Float32Regs:$x, Float32Regs:$y,			def _RI : TEX_1D_ARRAY_GRAD_base<inst, outtype, intype,
	Float32Regs:$gradx0, Float32Regs:$gradx1,			(ins Int64Regs:$t, i64imm:$s)>;
	Float32Regs:$grady0, Float32Regs:$grady1),			def _IR : TEX_1D_ARRAY_GRAD_base<inst, outtype, intype,
	"tex.grad.2d.v4.f32.f32 \t\\{$r, $g, $b, $a\\}, "			(ins i64imm:$t, Int64Regs:$s)>;
	"[$t, $s, \\{$x, $y\\}], \\{$gradx0, $gradx1\\}, "			def _II : TEX_1D_ARRAY_GRAD_base<inst, outtype, intype,
	"\\{$grady0, $grady1\\};",			(ins i64imm:$t, i64imm:$s)>;
	[]>;			}
	def TEX_2D_S32_S32
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g,			defm TEX_1D_ARRAY_F32_F32_GRAD
	Int32Regs:$b, Int32Regs:$a),			: TEX_1D_ARRAY_GRAD<"tex.grad.a1d.v4.f32.f32", Float32Regs, Float32Regs>;
	(ins Int64Regs:$t, Int64Regs:$s, Int32Regs:$x, Int32Regs:$y),			defm TEX_1D_ARRAY_S32_F32_GRAD
	"tex.2d.v4.s32.s32 \t\\{$r, $g, $b, $a\\}, "			: TEX_1D_ARRAY_GRAD<"tex.grad.a1d.v4.s32.f32", Int32Regs, Float32Regs>;
	"[$t, $s, \\{$x, $y\\}];",			defm TEX_1D_ARRAY_U32_F32_GRAD
	[]>;			: TEX_1D_ARRAY_GRAD<"tex.grad.a1d.v4.u32.f32", Int32Regs, Float32Regs>;
	def TEX_2D_S32_F32
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g,			class TEX_2D_base<string inst, NVPTXRegClass outtype,
	Int32Regs:$b, Int32Regs:$a),			NVPTXRegClass intype, dag texsamp>
	(ins Int64Regs:$t, Int64Regs:$s, Float32Regs:$x, Float32Regs:$y),			: NVPTXInst<(outs outtype:$r, outtype:$g,
	"tex.2d.v4.s32.f32 \t\\{$r, $g, $b, $a\\}, "			outtype:$b, outtype:$a),
	"[$t, $s, \\{$x, $y\\}];",			!con(texsamp, (ins intype:$x, intype:$y)),
	[]>;			inst # " \t\\{$r, $g, $b, $a\\}, [$t, $s, \\{$x, $y\\}];",
	def TEX_2D_S32_F32_LEVEL			[]>;
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g,
	Int32Regs:$b, Int32Regs:$a),			multiclass TEX_2D<string inst, NVPTXRegClass outtype, NVPTXRegClass intype> {
	(ins Int64Regs:$t, Int64Regs:$s, Float32Regs:$x, Float32Regs:$y,			def _RR : TEX_2D_base<inst, outtype, intype,
	Float32Regs:$lod),			(ins Int64Regs:$t, Int64Regs:$s)>;
	"tex.level.2d.v4.s32.f32 \t\\{$r, $g, $b, $a\\}, "			def _RI : TEX_2D_base<inst, outtype, intype, (ins Int64Regs:$t, i64imm:$s)>;
	"[$t, $s, \\{$x, $y\\}], $lod;",			def _IR : TEX_2D_base<inst, outtype, intype, (ins i64imm:$t, Int64Regs:$s)>;
	[]>;			def _II : TEX_2D_base<inst, outtype, intype, (ins i64imm:$t, i64imm:$s)>;
	def TEX_2D_S32_F32_GRAD			}
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g,
	Int32Regs:$b, Int32Regs:$a),			defm TEX_2D_F32_F32 : TEX_2D<"tex.2d.v4.f32.f32", Float32Regs, Float32Regs>;
	(ins Int64Regs:$t, Int64Regs:$s, Float32Regs:$x, Float32Regs:$y,			defm TEX_2D_F32_S32 : TEX_2D<"tex.2d.v4.f32.s32", Float32Regs, Int32Regs>;
	Float32Regs:$gradx0, Float32Regs:$gradx1,			defm TEX_2D_S32_S32 : TEX_2D<"tex.2d.v4.s32.s32", Int32Regs, Int32Regs>;
	Float32Regs:$grady0, Float32Regs:$grady1),			defm TEX_2D_S32_F32 : TEX_2D<"tex.2d.v4.s32.f32", Int32Regs, Float32Regs>;
	"tex.grad.2d.v4.s32.f32 \t\\{$r, $g, $b, $a\\}, "			defm TEX_2D_U32_S32 : TEX_2D<"tex.2d.v4.u32.s32", Int32Regs, Int32Regs>;
	"[$t, $s, \\{$x, $y\\}], \\{$gradx0, $gradx1\\}, "			defm TEX_2D_U32_F32 : TEX_2D<"tex.2d.v4.u32.f32", Int32Regs, Float32Regs>;
	"\\{$grady0, $grady1\\};",
	[]>;			class TEX_2D_LEVEL_base<string inst, NVPTXRegClass outtype,
	def TEX_2D_U32_S32			NVPTXRegClass intype, dag texsamp>
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g,			: NVPTXInst<(outs outtype:$r, outtype:$g,
	Int32Regs:$b, Int32Regs:$a),			outtype:$b, outtype:$a),
	(ins Int64Regs:$t, Int64Regs:$s, Int32Regs:$x, Int32Regs:$y),			!con(texsamp, (ins intype:$x, intype:$y, intype:$lod)),
	"tex.2d.v4.u32.s32 \t\\{$r, $g, $b, $a\\}, "			inst # " \t\\{$r, $g, $b, $a\\},"
	"[$t, $s, \\{$x, $y\\}];",
	[]>;
	def TEX_2D_U32_F32
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g,
	Int32Regs:$b, Int32Regs:$a),
	(ins Int64Regs:$t, Int64Regs:$s, Float32Regs:$x, Float32Regs:$y),
	"tex.2d.v4.u32.f32 \t\\{$r, $g, $b, $a\\}, "
	"[$t, $s, \\{$x, $y\\}];",
	[]>;
	def TEX_2D_U32_F32_LEVEL
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g,
	Int32Regs:$b, Int32Regs:$a),
	(ins Int64Regs:$t, Int64Regs:$s, Float32Regs:$x, Float32Regs:$y,
	Float32Regs:$lod),
	"tex.level.2d.v4.u32.f32 \t\\{$r, $g, $b, $a\\}, "
	"[$t, $s, \\{$x, $y\\}], $lod;",			" [$t, $s, \\{$x, $y\\}], $lod;",
	[]>;			[]>;
	def TEX_2D_U32_F32_GRAD
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g,			multiclass TEX_2D_LEVEL<string inst, NVPTXRegClass outtype,
	Int32Regs:$b, Int32Regs:$a),			NVPTXRegClass intype> {
	(ins Int64Regs:$t, Int64Regs:$s, Float32Regs:$x, Float32Regs:$y,			def _RR : TEX_2D_LEVEL_base<inst, outtype, intype,
	Float32Regs:$gradx0, Float32Regs:$gradx1,			(ins Int64Regs:$t, Int64Regs:$s)>;
	Float32Regs:$grady0, Float32Regs:$grady1),			def _RI : TEX_2D_LEVEL_base<inst, outtype, intype,
	"tex.grad.2d.v4.u32.f32 \t\\{$r, $g, $b, $a\\}, "			(ins Int64Regs:$t, i64imm:$s)>;
	"[$t, $s, \\{$x, $y\\}], \\{$gradx0, $gradx1\\}, "			def _IR : TEX_2D_LEVEL_base<inst, outtype, intype,
	"\\{$grady0, $grady1\\};",			(ins i64imm:$t, Int64Regs:$s)>;
	[]>;			def _II : TEX_2D_LEVEL_base<inst, outtype, intype,
				(ins i64imm:$t, i64imm:$s)>;
	def TEX_2D_ARRAY_F32_S32			}
	: NVPTXInst<(outs Float32Regs:$r, Float32Regs:$g,
	Float32Regs:$b, Float32Regs:$a),			defm TEX_2D_F32_F32_LEVEL :
	(ins Int64Regs:$t, Int64Regs:$s, Int32Regs:$l, Int32Regs:$x,			TEX_2D_LEVEL<"tex.level.2d.v4.f32.f32", Float32Regs, Float32Regs>;
	Int32Regs:$y),			defm TEX_2D_S32_F32_LEVEL :
	"tex.a2d.v4.f32.s32 \t\\{$r, $g, $b, $a\\}, "			TEX_2D_LEVEL<"tex.level.2d.v4.s32.f32", Int32Regs, Float32Regs>;
	"[$t, $s, \\{$l, $x, $y, $y\\}];",			defm TEX_2D_U32_F32_LEVEL :
	[]>;			TEX_2D_LEVEL<"tex.level.2d.v4.u32.f32", Int32Regs, Float32Regs>;
	def TEX_2D_ARRAY_F32_F32
	: NVPTXInst<(outs Float32Regs:$r, Float32Regs:$g,			class TEX_2D_GRAD_base<string inst, NVPTXRegClass outtype,
	Float32Regs:$b, Float32Regs:$a),			NVPTXRegClass intype, dag texsamp>
	(ins Int64Regs:$t, Int64Regs:$s, Int32Regs:$l, Float32Regs:$x,			: NVPTXInst<(outs outtype:$r, outtype:$g,
	Float32Regs:$y),			outtype:$b, outtype:$a),
	"tex.a2d.v4.f32.f32 \t\\{$r, $g, $b, $a\\}, "			!con(texsamp, (ins intype:$x, intype:$y,
	"[$t, $s, \\{$l, $x, $y, $y\\}];",			intype:$gradx0, intype:$gradx1,
	[]>;			intype:$grady0, intype:$grady1)),
	def TEX_2D_ARRAY_F32_F32_LEVEL			inst # " \t\\{$r, $g, $b, $a\\}, [$t, $s, \\{$x, $y\\}],"
	: NVPTXInst<(outs Float32Regs:$r, Float32Regs:$g,			" \\{$gradx0, $gradx1\\}, \\{$grady0, $grady1\\};",
	Float32Regs:$b, Float32Regs:$a),			[]>;
	(ins Int64Regs:$t, Int64Regs:$s, Int32Regs:$l, Float32Regs:$x,
	Float32Regs:$y, Float32Regs:$lod),			multiclass TEX_2D_GRAD<string inst, NVPTXRegClass outtype,
	"tex.level.a2d.v4.f32.f32 \t\\{$r, $g, $b, $a\\}, "			NVPTXRegClass intype> {
	"[$t, $s, \\{$l, $x, $y, $y\\}], $lod;",			def _RR : TEX_2D_GRAD_base<inst, outtype, intype,
	[]>;			(ins Int64Regs:$t, Int64Regs:$s)>;
	def TEX_2D_ARRAY_F32_F32_GRAD			def _RI : TEX_2D_GRAD_base<inst, outtype, intype,
	: NVPTXInst<(outs Float32Regs:$r, Float32Regs:$g,			(ins Int64Regs:$t, i64imm:$s)>;
	Float32Regs:$b, Float32Regs:$a),			def _IR : TEX_2D_GRAD_base<inst, outtype, intype,
	(ins Int64Regs:$t, Int64Regs:$s, Int32Regs:$l, Float32Regs:$x,			(ins i64imm:$t, Int64Regs:$s)>;
	Float32Regs:$y, Float32Regs:$gradx0, Float32Regs:$gradx1,			def _II : TEX_2D_GRAD_base<inst, outtype, intype,
	Float32Regs:$grady0, Float32Regs:$grady1),			(ins i64imm:$t, i64imm:$s)>;
	"tex.grad.a2d.v4.f32.f32 \t\\{$r, $g, $b, $a\\}, "			}
	"[$t, $s, \\{$l, $x, $y, $y\\}], \\{$gradx0, $gradx1\\}, "
	"\\{$grady0, $grady1\\};",			defm TEX_2D_F32_F32_GRAD :
	[]>;			TEX_2D_GRAD<"tex.grad.2d.v4.f32.f32", Float32Regs, Float32Regs>;
	def TEX_2D_ARRAY_S32_S32			defm TEX_2D_S32_F32_GRAD :
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g,			TEX_2D_GRAD<"tex.grad.2d.v4.s32.f32", Int32Regs, Float32Regs>;
	Int32Regs:$b, Int32Regs:$a),			defm TEX_2D_U32_F32_GRAD :
	(ins Int64Regs:$t, Int64Regs:$s, Int32Regs:$l, Int32Regs:$x,			TEX_2D_GRAD<"tex.grad.2d.v4.u32.f32", Int32Regs, Float32Regs>;
	Int32Regs:$y),
	"tex.a2d.v4.s32.s32 \t\\{$r, $g, $b, $a\\}, "			class TEX_2D_ARRAY_base<string inst, NVPTXRegClass outtype,
	"[$t, $s, \\{$l, $x, $y, $y\\}];",			NVPTXRegClass intype, dag texsamp>
	[]>;			: NVPTXInst<(outs outtype:$r, outtype:$g,
	def TEX_2D_ARRAY_S32_F32			outtype:$b, outtype:$a),
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g,			!con(texsamp, (ins Int32Regs:$l, intype:$x, intype:$y)),
	Int32Regs:$b, Int32Regs:$a),			inst # " \t\\{$r, $g, $b, $a\\},"
	(ins Int64Regs:$t, Int64Regs:$s, Int32Regs:$l, Float32Regs:$x,
	Float32Regs:$y),
	"tex.a2d.v4.s32.f32 \t\\{$r, $g, $b, $a\\}, "
	"[$t, $s, \\{$l, $x, $y, $y\\}];",
	[]>;
	def TEX_2D_ARRAY_S32_F32_LEVEL
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g,
	Int32Regs:$b, Int32Regs:$a),
	(ins Int64Regs:$t, Int64Regs:$s, Int32Regs:$l, Float32Regs:$x,
	Float32Regs:$y, Float32Regs:$lod),
	"tex.level.a2d.v4.s32.f32 \t\\{$r, $g, $b, $a\\}, "
	"[$t, $s, \\{$l, $x, $y, $y\\}], $lod;",
	[]>;
	def TEX_2D_ARRAY_S32_F32_GRAD
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g,
	Int32Regs:$b, Int32Regs:$a),
	(ins Int64Regs:$t, Int64Regs:$s, Int32Regs:$l, Float32Regs:$x,
	Float32Regs:$y,
	Float32Regs:$gradx0, Float32Regs:$gradx1,
	Float32Regs:$grady0, Float32Regs:$grady1),
	"tex.grad.a2d.v4.s32.f32 \t\\{$r, $g, $b, $a\\}, "
	"[$t, $s, \\{$l, $x, $y, $y\\}], \\{$gradx0, $gradx1\\}, "
	"\\{$grady0, $grady1\\};",
	[]>;
	def TEX_2D_ARRAY_U32_S32
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g,
	Int32Regs:$b, Int32Regs:$a),
	(ins Int64Regs:$t, Int64Regs:$s, Int32Regs:$l, Int32Regs:$x,
	Int32Regs:$y),
	"tex.a2d.v4.u32.s32 \t\\{$r, $g, $b, $a\\}, "
	"[$t, $s, \\{$l, $x, $y, $y\\}];",
	[]>;
	def TEX_2D_ARRAY_U32_F32
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g,
	Int32Regs:$b, Int32Regs:$a),
	(ins Int64Regs:$t, Int64Regs:$s, Int32Regs:$l, Float32Regs:$x,
	Float32Regs:$y),
	"tex.a2d.v4.u32.f32 \t\\{$r, $g, $b, $a\\}, "
	"[$t, $s, \\{$l, $x, $y, $y\\}];",			" [$t, $s, \\{$l, $x, $y, $y\\}];",
	[]>;			[]>;
	def TEX_2D_ARRAY_U32_F32_LEVEL
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g,			multiclass TEX_2D_ARRAY<string inst, NVPTXRegClass outtype,
	Int32Regs:$b, Int32Regs:$a),			NVPTXRegClass intype> {
	(ins Int64Regs:$t, Int64Regs:$s, Int32Regs:$l, Float32Regs:$x,			def _RR : TEX_2D_ARRAY_base<inst, outtype, intype,
	Float32Regs:$y, Float32Regs:$lod),			(ins Int64Regs:$t, Int64Regs:$s)>;
	"tex.level.a2d.v4.u32.f32 \t\\{$r, $g, $b, $a\\}, "			def _RI : TEX_2D_ARRAY_base<inst, outtype, intype,
				(ins Int64Regs:$t, i64imm:$s)>;
				def _IR : TEX_2D_ARRAY_base<inst, outtype, intype,
				(ins i64imm:$t, Int64Regs:$s)>;
				def _II : TEX_2D_ARRAY_base<inst, outtype, intype,
				(ins i64imm:$t, i64imm:$s)>;
				}

				defm TEX_2D_ARRAY_F32_F32
				: TEX_2D_ARRAY<"tex.a2d.v4.f32.f32", Float32Regs, Float32Regs>;
				defm TEX_2D_ARRAY_F32_S32
				: TEX_2D_ARRAY<"tex.a2d.v4.f32.s32", Float32Regs, Int32Regs>;
				defm TEX_2D_ARRAY_S32_S32
				: TEX_2D_ARRAY<"tex.a2d.v4.s32.s32", Int32Regs, Int32Regs>;
				defm TEX_2D_ARRAY_S32_F32
				: TEX_2D_ARRAY<"tex.a2d.v4.s32.f32", Int32Regs, Float32Regs>;
				defm TEX_2D_ARRAY_U32_S32
				: TEX_2D_ARRAY<"tex.a2d.v4.u32.s32", Int32Regs, Int32Regs>;
				defm TEX_2D_ARRAY_U32_F32
				: TEX_2D_ARRAY<"tex.a2d.v4.u32.f32", Int32Regs, Float32Regs>;

				class TEX_2D_ARRAY_LEVEL_base<string inst, NVPTXRegClass outtype,
				NVPTXRegClass intype, dag texsamp>
				: NVPTXInst<(outs outtype:$r, outtype:$g,
				outtype:$b, outtype:$a),
				!con(texsamp, (ins Int32Regs:$l, intype:$x, intype:$y,
				intype:$lod)),
				inst # " \t\\{$r, $g, $b, $a\\},"
	"[$t, $s, \\{$l, $x, $y, $y\\}], $lod;",			" [$t, $s, \\{$l, $x, $y, $y\\}], $lod;",
	[]>;			[]>;
	def TEX_2D_ARRAY_U32_F32_GRAD
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g,			multiclass TEX_2D_ARRAY_LEVEL<string inst, NVPTXRegClass outtype,
	Int32Regs:$b, Int32Regs:$a),			NVPTXRegClass intype> {
	(ins Int64Regs:$t, Int64Regs:$s, Int32Regs:$l, Float32Regs:$x,			def _RR : TEX_2D_ARRAY_LEVEL_base<inst, outtype, intype,
	Float32Regs:$y,			(ins Int64Regs:$t, Int64Regs:$s)>;
	Float32Regs:$gradx0, Float32Regs:$gradx1,			def _RI : TEX_2D_ARRAY_LEVEL_base<inst, outtype, intype,
	Float32Regs:$grady0, Float32Regs:$grady1),			(ins Int64Regs:$t, i64imm:$s)>;
	"tex.grad.a2d.v4.u32.f32 \t\\{$r, $g, $b, $a\\}, "			def _IR : TEX_2D_ARRAY_LEVEL_base<inst, outtype, intype,
	"[$t, $s, \\{$l, $x, $y, $y\\}], \\{$gradx0, $gradx1\\}, "			(ins i64imm:$t, Int64Regs:$s)>;
	"\\{$grady0, $grady1\\};",			def _II : TEX_2D_ARRAY_LEVEL_base<inst, outtype, intype,
	[]>;			(ins i64imm:$t, i64imm:$s)>;
				}
	def TEX_3D_F32_S32
	: NVPTXInst<(outs Float32Regs:$r, Float32Regs:$g,			defm TEX_2D_ARRAY_F32_F32_LEVEL
	Float32Regs:$b, Float32Regs:$a),			: TEX_2D_ARRAY_LEVEL<"tex.level.a2d.v4.f32.f32", Float32Regs, Float32Regs>;
	(ins Int64Regs:$t, Int64Regs:$s, Int32Regs:$x, Int32Regs:$y,			defm TEX_2D_ARRAY_S32_F32_LEVEL
	Int32Regs:$z),			: TEX_2D_ARRAY_LEVEL<"tex.level.a2d.v4.s32.f32", Int32Regs, Float32Regs>;
	"tex.3d.v4.f32.s32 \t\\{$r, $g, $b, $a\\}, "			defm TEX_2D_ARRAY_U32_F32_LEVEL
	"[$t, $s, \\{$x, $y, $z, $z\\}];",			: TEX_2D_ARRAY_LEVEL<"tex.level.a2d.v4.u32.f32", Int32Regs, Float32Regs>;
	[]>;
	def TEX_3D_F32_F32			class TEX_2D_ARRAY_GRAD_base<string inst, NVPTXRegClass outtype,
	: NVPTXInst<(outs Float32Regs:$r, Float32Regs:$g,			NVPTXRegClass intype, dag texsamp>
	Float32Regs:$b, Float32Regs:$a),			: NVPTXInst<(outs outtype:$r, outtype:$g,
	(ins Int64Regs:$t, Int64Regs:$s, Float32Regs:$x, Float32Regs:$y,			outtype:$b, outtype:$a),
	Float32Regs:$z),			!con(texsamp, (ins Int32Regs:$l, intype:$x, intype:$y,
	"tex.3d.v4.f32.f32 \t\\{$r, $g, $b, $a\\}, "			intype:$gradx0, intype:$gradx1,
	"[$t, $s, \\{$x, $y, $z, $z\\}];",			intype:$grady0, intype:$grady1)),
	[]>;			inst # " \t\\{$r, $g, $b, $a\\},"
	def TEX_3D_F32_F32_LEVEL			" [$t, $s, \\{$l, $x, $y, $y\\}],"
	: NVPTXInst<(outs Float32Regs:$r, Float32Regs:$g,			" \\{$gradx0, $gradx1\\}, \\{$grady0, $grady1\\};",
	Float32Regs:$b, Float32Regs:$a),			[]>;
	(ins Int64Regs:$t, Int64Regs:$s, Float32Regs:$x, Float32Regs:$y,
	Float32Regs:$z, Float32Regs:$lod),			multiclass TEX_2D_ARRAY_GRAD<string inst, NVPTXRegClass outtype,
	"tex.level.3d.v4.f32.f32 \t\\{$r, $g, $b, $a\\}, "			NVPTXRegClass intype> {
	"[$t, $s, \\{$x, $y, $z, $z\\}], $lod;",			def _RR : TEX_2D_ARRAY_GRAD_base<inst, outtype, intype,
	[]>;			(ins Int64Regs:$t, Int64Regs:$s)>;
	def TEX_3D_F32_F32_GRAD			def _RI : TEX_2D_ARRAY_GRAD_base<inst, outtype, intype,
	: NVPTXInst<(outs Float32Regs:$r, Float32Regs:$g,			(ins Int64Regs:$t, i64imm:$s)>;
	Float32Regs:$b, Float32Regs:$a),			def _IR : TEX_2D_ARRAY_GRAD_base<inst, outtype, intype,
	(ins Int64Regs:$t, Int64Regs:$s, Float32Regs:$x, Float32Regs:$y,			(ins i64imm:$t, Int64Regs:$s)>;
	Float32Regs:$z,			def _II : TEX_2D_ARRAY_GRAD_base<inst, outtype, intype,
	Float32Regs:$gradx0, Float32Regs:$gradx1,			(ins i64imm:$t, i64imm:$s)>;
	Float32Regs:$gradx2, Float32Regs:$grady0,			}
	Float32Regs:$grady1, Float32Regs:$grady2),
	"tex.grad.3d.v4.f32.f32 \t\\{$r, $g, $b, $a\\}, "			defm TEX_2D_ARRAY_F32_F32_GRAD
	"[$t, $s, \\{$x, $y, $z, $z\\}], "			: TEX_2D_ARRAY_GRAD<"tex.grad.a2d.v4.f32.f32", Float32Regs, Float32Regs>;
	"\\{$gradx0, $gradx1, $gradx2, $gradx2\\}, "			defm TEX_2D_ARRAY_S32_F32_GRAD
	"\\{$grady0, $grady1, $grady2, $grady2\\};",			: TEX_2D_ARRAY_GRAD<"tex.grad.a2d.v4.s32.f32", Int32Regs, Float32Regs>;
	[]>;			defm TEX_2D_ARRAY_U32_F32_GRAD
	def TEX_3D_S32_S32			: TEX_2D_ARRAY_GRAD<"tex.grad.a2d.v4.u32.f32", Int32Regs, Float32Regs>;
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g,
	Int32Regs:$b, Int32Regs:$a),			class TEX_3D_base<string inst, NVPTXRegClass outtype,
	(ins Int64Regs:$t, Int64Regs:$s, Int32Regs:$x, Int32Regs:$y,			NVPTXRegClass intype, dag texsamp>
	Int32Regs:$z),			: NVPTXInst<(outs outtype:$r, outtype:$g,
	"tex.3d.v4.s32.s32 \t\\{$r, $g, $b, $a\\}, "			outtype:$b, outtype:$a),
	"[$t, $s, \\{$x, $y, $z, $z\\}];",			!con(texsamp, (ins intype:$x, intype:$y, intype:$z)),
	[]>;			inst # " \t\\{$r, $g, $b, $a\\},"
	def TEX_3D_S32_F32
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g,
	Int32Regs:$b, Int32Regs:$a),
	(ins Int64Regs:$t, Int64Regs:$s, Float32Regs:$x, Float32Regs:$y,
	Float32Regs:$z),
	"tex.3d.v4.s32.f32 \t\\{$r, $g, $b, $a\\}, "
	"[$t, $s, \\{$x, $y, $z, $z\\}];",
	[]>;
	def TEX_3D_S32_F32_LEVEL
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g,
	Int32Regs:$b, Int32Regs:$a),
	(ins Int64Regs:$t, Int64Regs:$s, Float32Regs:$x, Float32Regs:$y,
	Float32Regs:$z, Float32Regs:$lod),
	"tex.level.3d.v4.s32.f32 \t\\{$r, $g, $b, $a\\}, "
	"[$t, $s, \\{$x, $y, $z, $z\\}], $lod;",
	[]>;
	def TEX_3D_S32_F32_GRAD
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g,
	Int32Regs:$b, Int32Regs:$a),
	(ins Int64Regs:$t, Int64Regs:$s, Float32Regs:$x, Float32Regs:$y,
	Float32Regs:$z,
	Float32Regs:$gradx0, Float32Regs:$gradx1,
	Float32Regs:$gradx2, Float32Regs:$grady0,
	Float32Regs:$grady1, Float32Regs:$grady2),
	"tex.grad.3d.v4.s32.f32 \t\\{$r, $g, $b, $a\\}, "
	"[$t, $s, \\{$x, $y, $z, $z\\}], "
	"\\{$gradx0, $gradx1, $gradx2, $gradx2\\}, "
	"\\{$grady0, $grady1, $grady2, $grady2\\};",
	[]>;
	def TEX_3D_U32_S32
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g,
	Int32Regs:$b, Int32Regs:$a),
	(ins Int64Regs:$t, Int64Regs:$s, Int32Regs:$x, Int32Regs:$y,
	Int32Regs:$z),
	"tex.3d.v4.u32.s32 \t\\{$r, $g, $b, $a\\}, "
	"[$t, $s, \\{$x, $y, $z, $z\\}];",
	[]>;
	def TEX_3D_U32_F32
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g,
	Int32Regs:$b, Int32Regs:$a),
	(ins Int64Regs:$t, Int64Regs:$s, Float32Regs:$x, Float32Regs:$y,
	Float32Regs:$z),
	"tex.3d.v4.u32.f32 \t\\{$r, $g, $b, $a\\}, "
	"[$t, $s, \\{$x, $y, $z, $z\\}];",			" [$t, $s, \\{$x, $y, $z, $z\\}];",
	[]>;			[]>;
	def TEX_3D_U32_F32_LEVEL
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g,			multiclass TEX_3D<string inst, NVPTXRegClass outtype, NVPTXRegClass intype> {
	Int32Regs:$b, Int32Regs:$a),			def _RR : TEX_3D_base<inst, outtype, intype,
	(ins Int64Regs:$t, Int64Regs:$s, Float32Regs:$x, Float32Regs:$y,			(ins Int64Regs:$t, Int64Regs:$s)>;
	Float32Regs:$z, Float32Regs:$lod),			def _RI : TEX_3D_base<inst, outtype, intype,
	"tex.level.3d.v4.u32.f32 \t\\{$r, $g, $b, $a\\}, "			(ins Int64Regs:$t, i64imm:$s)>;
				def _IR : TEX_3D_base<inst, outtype, intype,
				(ins i64imm:$t, Int64Regs:$s)>;
				def _II : TEX_3D_base<inst, outtype, intype,
				(ins i64imm:$t, i64imm:$s)>;
				}

				defm TEX_3D_F32_F32 : TEX_3D<"tex.3d.v4.f32.f32", Float32Regs, Float32Regs>;
				defm TEX_3D_F32_S32 : TEX_3D<"tex.3d.v4.f32.s32", Float32Regs, Int32Regs>;
				defm TEX_3D_S32_S32 : TEX_3D<"tex.3d.v4.s32.s32", Int32Regs, Int32Regs>;
				defm TEX_3D_S32_F32 : TEX_3D<"tex.3d.v4.s32.f32", Int32Regs, Float32Regs>;
				defm TEX_3D_U32_S32 : TEX_3D<"tex.3d.v4.u32.s32", Int32Regs, Int32Regs>;
				defm TEX_3D_U32_F32 : TEX_3D<"tex.3d.v4.u32.f32", Int32Regs, Float32Regs>;

				class TEX_3D_LEVEL_base<string inst, NVPTXRegClass outtype,
				NVPTXRegClass intype, dag texsamp>
				: NVPTXInst<(outs outtype:$r, outtype:$g,
				outtype:$b, outtype:$a),
				!con(texsamp, (ins intype:$x, intype:$y, intype:$z,
				intype:$lod)),
				inst # " \t\\{$r, $g, $b, $a\\},"
	"[$t, $s, \\{$x, $y, $z, $z\\}], $lod;",			" [$t, $s, \\{$x, $y, $z, $z\\}], $lod;",
	[]>;			[]>;
	def TEX_3D_U32_F32_GRAD
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g,			multiclass TEX_3D_LEVEL<string inst, NVPTXRegClass outtype,
	Int32Regs:$b, Int32Regs:$a),			NVPTXRegClass intype> {
	(ins Int64Regs:$t, Int64Regs:$s, Float32Regs:$x, Float32Regs:$y,			def _RR : TEX_3D_LEVEL_base<inst, outtype, intype,
	Float32Regs:$z,			(ins Int64Regs:$t, Int64Regs:$s)>;
	Float32Regs:$gradx0, Float32Regs:$gradx1,			def _RI : TEX_3D_LEVEL_base<inst, outtype, intype,
	Float32Regs:$gradx2, Float32Regs:$grady0,			(ins Int64Regs:$t, i64imm:$s)>;
	Float32Regs:$grady1, Float32Regs:$grady2),			def _IR : TEX_3D_LEVEL_base<inst, outtype, intype,
	"tex.grad.3d.v4.u32.f32 \t\\{$r, $g, $b, $a\\}, "			(ins i64imm:$t, Int64Regs:$s)>;
				def _II : TEX_3D_LEVEL_base<inst, outtype, intype,
				(ins i64imm:$t, i64imm:$s)>;
				}

				defm TEX_3D_F32_F32_LEVEL
				: TEX_3D_LEVEL<"tex.level.3d.v4.f32.f32", Float32Regs, Float32Regs>;
				defm TEX_3D_S32_F32_LEVEL
				: TEX_3D_LEVEL<"tex.level.3d.v4.s32.f32", Int32Regs, Float32Regs>;
				defm TEX_3D_U32_F32_LEVEL
				: TEX_3D_LEVEL<"tex.level.3d.v4.u32.f32", Int32Regs, Float32Regs>;

				class TEX_3D_GRAD_base<string inst, NVPTXRegClass outtype,
				NVPTXRegClass intype, dag texsamp>
				: NVPTXInst<(outs outtype:$r, outtype:$g,
				outtype:$b, outtype:$a),
				!con(texsamp, (ins intype:$x, intype:$y, intype:$z,
				intype :$gradx0, intype:$gradx1,
				intype:$gradx2, intype:$grady0,
				intype:$grady1, intype:$grady2)),
				inst # " \t\\{$r, $g, $b, $a\\},"
	"[$t, $s, \\{$x, $y, $z, $z\\}], "			" [$t, $s, \\{$x, $y, $z, $z\\}],"
	"\\{$gradx0, $gradx1, $gradx2, $gradx2\\}, "			" \\{$gradx0, $gradx1, $gradx2, $gradx2\\},"
	"\\{$grady0, $grady1, $grady2, $grady2\\};",			" \\{$grady0, $grady1, $grady2, $grady2\\};",
	[]>;			[]>;

	def TEX_CUBE_F32_F32			multiclass TEX_3D_GRAD<string inst, NVPTXRegClass outtype,
	: NVPTXInst<(outs Float32Regs:$r, Float32Regs:$g,			NVPTXRegClass intype> {
	Float32Regs:$b, Float32Regs:$a),			def _RR : TEX_3D_GRAD_base<inst, outtype, intype,
	(ins Int64Regs:$t, Int64Regs:$s,			(ins Int64Regs:$t, Int64Regs:$s)>;
	Float32Regs:$x, Float32Regs:$y, Float32Regs:$z),			def _RI : TEX_3D_GRAD_base<inst, outtype, intype,
	"tex.cube.v4.f32.f32 \t\\{$r, $g, $b, $a\\}, "			(ins Int64Regs:$t, i64imm:$s)>;
				def _IR : TEX_3D_GRAD_base<inst, outtype, intype,
				(ins i64imm:$t, Int64Regs:$s)>;
				def _II : TEX_3D_GRAD_base<inst, outtype, intype,
				(ins i64imm:$t, i64imm:$s)>;
				}

				defm TEX_3D_F32_F32_GRAD
				: TEX_3D_GRAD<"tex.grad.3d.v4.f32.f32", Float32Regs, Float32Regs>;
				defm TEX_3D_S32_F32_GRAD
				: TEX_3D_GRAD<"tex.grad.3d.v4.s32.f32", Int32Regs, Float32Regs>;
				defm TEX_3D_U32_F32_GRAD
				: TEX_3D_GRAD<"tex.grad.3d.v4.u32.f32", Int32Regs, Float32Regs>;

				class TEX_CUBE_base<string inst, NVPTXRegClass outtype,
				NVPTXRegClass intype, dag texsamp>
				: NVPTXInst<(outs outtype:$r, outtype:$g,
				outtype:$b, outtype:$a),
				!con(texsamp, (ins intype:$x, intype:$y, intype:$z)),
				inst # " \t\\{$r, $g, $b, $a\\},"
	"[$t, $s, \\{$x, $y, $z, $z\\}];",			" [$t, $s, \\{$x, $y, $z, $z\\}];",
	[]>;			[]>;
	def TEX_CUBE_F32_F32_LEVEL
	: NVPTXInst<(outs Float32Regs:$r, Float32Regs:$g,			multiclass TEX_CUBE<string inst, NVPTXRegClass outtype, NVPTXRegClass intype> {
	Float32Regs:$b, Float32Regs:$a),			def _RR : TEX_CUBE_base<inst, outtype, intype,
	(ins Int64Regs:$t, Int64Regs:$s,			(ins Int64Regs:$t, Int64Regs:$s)>;
	Float32Regs:$x, Float32Regs:$y, Float32Regs:$z,			def _RI : TEX_CUBE_base<inst, outtype, intype,
	Float32Regs:$lod),			(ins Int64Regs:$t, i64imm:$s)>;
	"tex.level.cube.v4.f32.f32 \t\\{$r, $g, $b, $a\\}, "			def _IR : TEX_CUBE_base<inst, outtype, intype,
	"[$t, $s, \\{$x, $y, $z, $z\\}], $lod;",			(ins i64imm:$t, Int64Regs:$s)>;
	[]>;			def _II : TEX_CUBE_base<inst, outtype, intype,
	def TEX_CUBE_S32_F32			(ins i64imm:$t, i64imm:$s)>;
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g,			}
	Int32Regs:$b, Int32Regs:$a),
	(ins Int64Regs:$t, Int64Regs:$s,			defm TEX_CUBE_F32_F32
	Float32Regs:$x, Float32Regs:$y, Float32Regs:$z),			: TEX_CUBE<"tex.cube.v4.f32.f32", Float32Regs, Float32Regs>;
	"tex.cube.v4.s32.f32 \t\\{$r, $g, $b, $a\\}, "			defm TEX_CUBE_S32_F32
	"[$t, $s, \\{$x, $y, $z, $z\\}];",			: TEX_CUBE<"tex.cube.v4.s32.f32", Int32Regs, Float32Regs>;
	[]>;			defm TEX_CUBE_U32_F32
	def TEX_CUBE_S32_F32_LEVEL			: TEX_CUBE<"tex.cube.v4.u32.f32", Int32Regs, Float32Regs>;
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g,
	Int32Regs:$b, Int32Regs:$a),			class TEX_CUBE_LEVEL_base<string inst, NVPTXRegClass outtype,
	(ins Int64Regs:$t, Int64Regs:$s,			NVPTXRegClass intype, dag texsamp>
	Float32Regs:$x, Float32Regs:$y, Float32Regs:$z,			: NVPTXInst<(outs outtype:$r, outtype:$g,
	Float32Regs:$lod),			outtype:$b, outtype:$a),
	"tex.level.cube.v4.s32.f32 \t\\{$r, $g, $b, $a\\}, "			!con(texsamp, (ins intype:$x, intype:$y, intype:$z,
	"[$t, $s, \\{$x, $y, $z, $z\\}], $lod;",			intype:$lod)),
	[]>;			inst # " \t\\{$r, $g, $b, $a\\},"
	def TEX_CUBE_U32_F32
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g,
	Int32Regs:$b, Int32Regs:$a),
	(ins Int64Regs:$t, Int64Regs:$s,
	Float32Regs:$x, Float32Regs:$y, Float32Regs:$z),
	"tex.cube.v4.u32.f32 \t\\{$r, $g, $b, $a\\}, "
	"[$t, $s, \\{$x, $y, $z, $z\\}];",
	[]>;
	def TEX_CUBE_U32_F32_LEVEL
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g,
	Int32Regs:$b, Int32Regs:$a),
	(ins Int64Regs:$t, Int64Regs:$s,
	Float32Regs:$x, Float32Regs:$y, Float32Regs:$z,
	Float32Regs:$lod),
	"tex.level.cube.v4.u32.f32 \t\\{$r, $g, $b, $a\\}, "
	"[$t, $s, \\{$x, $y, $z, $z\\}], $lod;",			" [$t, $s, \\{$x, $y, $z, $z\\}], $lod;",
	[]>;			[]>;

	def TEX_CUBE_ARRAY_F32_F32			multiclass TEX_CUBE_LEVEL<string inst, NVPTXRegClass outtype,
	: NVPTXInst<(outs Float32Regs:$r, Float32Regs:$g,			NVPTXRegClass intype> {
	Float32Regs:$b, Float32Regs:$a),			def _RR : TEX_CUBE_LEVEL_base<inst, outtype, intype,
	(ins Int64Regs:$t, Int64Regs:$s, Int32Regs:$l,			(ins Int64Regs:$t, Int64Regs:$s)>;
	Float32Regs:$x, Float32Regs:$y, Float32Regs:$z),			def _RI : TEX_CUBE_LEVEL_base<inst, outtype, intype,
	"tex.acube.v4.f32.f32 \t\\{$r, $g, $b, $a\\}, "			(ins Int64Regs:$t, i64imm:$s)>;
	"[$t, $s, \\{$l, $x, $y, $z\\}];",			def _IR : TEX_CUBE_LEVEL_base<inst, outtype, intype,
	[]>;			(ins i64imm:$t, Int64Regs:$s)>;
	def TEX_CUBE_ARRAY_F32_F32_LEVEL			def _II : TEX_CUBE_LEVEL_base<inst, outtype, intype,
	: NVPTXInst<(outs Float32Regs:$r, Float32Regs:$g,			(ins i64imm:$t, i64imm:$s)>;
	Float32Regs:$b, Float32Regs:$a),			}
	(ins Int64Regs:$t, Int64Regs:$s, Int32Regs:$l,
	Float32Regs:$x, Float32Regs:$y, Float32Regs:$z,			defm TEX_CUBE_F32_F32_LEVEL
	Float32Regs:$lod),			: TEX_CUBE_LEVEL<"tex.level.cube.v4.f32.f32", Float32Regs, Float32Regs>;
	"tex.level.acube.v4.f32.f32 \t\\{$r, $g, $b, $a\\}, "			defm TEX_CUBE_S32_F32_LEVEL
	"[$t, $s, \\{$l, $x, $y, $z\\}], $lod;",			: TEX_CUBE_LEVEL<"tex.level.cube.v4.s32.f32", Int32Regs, Float32Regs>;
	[]>;			defm TEX_CUBE_U32_F32_LEVEL
	def TEX_CUBE_ARRAY_S32_F32			: TEX_CUBE_LEVEL<"tex.level.cube.v4.u32.f32", Int32Regs, Float32Regs>;
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g,
	Int32Regs:$b, Int32Regs:$a),			class TEX_CUBE_ARRAY_base<string inst, NVPTXRegClass outtype,
	(ins Int64Regs:$t, Int64Regs:$s, Int32Regs:$l,			NVPTXRegClass intype, dag texsamp>
	Float32Regs:$x, Float32Regs:$y, Float32Regs:$z),			: NVPTXInst<(outs outtype:$r, outtype:$g,
	"tex.acube.v4.s32.f32 \t\\{$r, $g, $b, $a\\}, "			outtype:$b, outtype:$a),
	"[$t, $s, \\{$l, $x, $y, $z\\}];",			!con(texsamp, (ins Int32Regs:$l, intype:$x, intype:$y,
	[]>;			intype:$z)),
	def TEX_CUBE_ARRAY_S32_F32_LEVEL			inst # " \t\\{$r, $g, $b, $a\\},"
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g,
	Int32Regs:$b, Int32Regs:$a),
	(ins Int64Regs:$t, Int64Regs:$s, Int32Regs:$l,
	Float32Regs:$x, Float32Regs:$y, Float32Regs:$z,
	Float32Regs:$lod),
	"tex.level.acube.v4.s32.f32 \t\\{$r, $g, $b, $a\\}, "
	"[$t, $s, \\{$l, $x, $y, $z\\}], $lod;",
	[]>;
	def TEX_CUBE_ARRAY_U32_F32
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g,
	Int32Regs:$b, Int32Regs:$a),
	(ins Int64Regs:$t, Int64Regs:$s, Int32Regs:$l,
	Float32Regs:$x, Float32Regs:$y, Float32Regs:$z),
	"tex.acube.v4.u32.f32 \t\\{$r, $g, $b, $a\\}, "
	"[$t, $s, \\{$l, $x, $y, $z\\}];",			" [$t, $s, \\{$l, $x, $y, $z\\}];",
	[]>;			[]>;
	def TEX_CUBE_ARRAY_U32_F32_LEVEL
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g,			multiclass TEX_CUBE_ARRAY<string inst, NVPTXRegClass outtype,
	Int32Regs:$b, Int32Regs:$a),			NVPTXRegClass intype> {
	(ins Int64Regs:$t, Int64Regs:$s, Int32Regs:$l,			def _RR : TEX_CUBE_ARRAY_base<inst, outtype, intype,
	Float32Regs:$x, Float32Regs:$y, Float32Regs:$z,			(ins Int64Regs:$t, Int64Regs:$s)>;
	Float32Regs:$lod),			def _RI : TEX_CUBE_ARRAY_base<inst, outtype, intype,
	"tex.level.acube.v4.u32.f32 \t\\{$r, $g, $b, $a\\}, "			(ins Int64Regs:$t, i64imm:$s)>;
				def _IR : TEX_CUBE_ARRAY_base<inst, outtype, intype,
				(ins i64imm:$t, Int64Regs:$s)>;
				def _II : TEX_CUBE_ARRAY_base<inst, outtype, intype,
				(ins i64imm:$t, i64imm:$s)>;
				}

				defm TEX_CUBE_ARRAY_F32_F32
				: TEX_CUBE_ARRAY<"tex.acube.v4.f32.f32", Float32Regs, Float32Regs>;
				defm TEX_CUBE_ARRAY_S32_F32
				: TEX_CUBE_ARRAY<"tex.acube.v4.s32.f32", Int32Regs, Float32Regs>;
				defm TEX_CUBE_ARRAY_U32_F32
				: TEX_CUBE_ARRAY<"tex.acube.v4.u32.f32", Int32Regs, Float32Regs>;

				class TEX_CUBE_ARRAY_LEVEL_base<string inst, NVPTXRegClass outtype,
				NVPTXRegClass intype, dag texsamp>
				: NVPTXInst<(outs outtype:$r, outtype:$g,
				outtype:$b, outtype:$a),
				!con(texsamp, (ins Int32Regs:$l, intype:$x, intype:$y,
				intype:$z, intype:$lod)),
				inst # " \t\\{$r, $g, $b, $a\\},"
	"[$t, $s, \\{$l, $x, $y, $z\\}], $lod;",			" [$t, $s, \\{$l, $x, $y, $z\\}], $lod;",
	[]>;			[]>;

	def TLD4_R_2D_F32_F32			multiclass TEX_CUBE_ARRAY_LEVEL<string inst, NVPTXRegClass outtype,
	: NVPTXInst<(outs Float32Regs:$v0, Float32Regs:$v1,			NVPTXRegClass intype> {
	Float32Regs:$v2, Float32Regs:$v3),			def _RR : TEX_CUBE_ARRAY_LEVEL_base<inst, outtype, intype,
	(ins Int64Regs:$t, Int64Regs:$s, Float32Regs:$x, Float32Regs:$y),			(ins Int64Regs:$t, Int64Regs:$s)>;
	"tld4.r.2d.v4.f32.f32 \t\\{$v0, $v1, $v2, $v3\\}, "			def _RI : TEX_CUBE_ARRAY_LEVEL_base<inst, outtype, intype,
	"[$t, $s, \\{$x, $y\\}];",			(ins Int64Regs:$t, i64imm:$s)>;
	[]>;			def _IR : TEX_CUBE_ARRAY_LEVEL_base<inst, outtype, intype,
	def TLD4_G_2D_F32_F32			(ins i64imm:$t, Int64Regs:$s)>;
	: NVPTXInst<(outs Float32Regs:$v0, Float32Regs:$v1,			def _II : TEX_CUBE_ARRAY_LEVEL_base<inst, outtype, intype,
	Float32Regs:$v2, Float32Regs:$v3),			(ins i64imm:$t, i64imm:$s)>;
	(ins Int64Regs:$t, Int64Regs:$s, Float32Regs:$x, Float32Regs:$y),			}
	"tld4.g.2d.v4.f32.f32 \t\\{$v0, $v1, $v2, $v3\\}, "
	"[$t, $s, \\{$x, $y\\}];",			defm TEX_CUBE_ARRAY_F32_F32_LEVEL
	[]>;			: TEX_CUBE_ARRAY_LEVEL<"tex.level.acube.v4.f32.f32",
	def TLD4_B_2D_F32_F32			Float32Regs, Float32Regs>;
	: NVPTXInst<(outs Float32Regs:$v0, Float32Regs:$v1,			defm TEX_CUBE_ARRAY_S32_F32_LEVEL
	Float32Regs:$v2, Float32Regs:$v3),			: TEX_CUBE_ARRAY_LEVEL<"tex.level.acube.v4.s32.f32",
	(ins Int64Regs:$t, Int64Regs:$s, Float32Regs:$x, Float32Regs:$y),			Int32Regs, Float32Regs>;
	"tld4.b.2d.v4.f32.f32 \t\\{$v0, $v1, $v2, $v3\\}, "			defm TEX_CUBE_ARRAY_U32_F32_LEVEL
	"[$t, $s, \\{$x, $y\\}];",			: TEX_CUBE_ARRAY_LEVEL<"tex.level.acube.v4.u32.f32",
	[]>;			Int32Regs, Float32Regs>;
	def TLD4_A_2D_F32_F32
	: NVPTXInst<(outs Float32Regs:$v0, Float32Regs:$v1,			class TLD4_2D_base<string inst, NVPTXRegClass outtype,
	Float32Regs:$v2, Float32Regs:$v3),			NVPTXRegClass intype, dag texsamp>
	(ins Int64Regs:$t, Int64Regs:$s, Float32Regs:$x, Float32Regs:$y),			: NVPTXInst<(outs outtype:$v0, outtype:$v1,
	"tld4.a.2d.v4.f32.f32 \t\\{$v0, $v1, $v2, $v3\\}, "			outtype:$v2, outtype:$v3),
	"[$t, $s, \\{$x, $y\\}];",			!con(texsamp, (ins intype:$x, intype:$y)),
	[]>;			inst # " \t\\{$v0, $v1, $v2, $v3\\}, [$t, $s, \\{$x, $y\\}];",
	def TLD4_R_2D_S32_F32			[]>;
	: NVPTXInst<(outs Int32Regs:$v0, Int32Regs:$v1,
	Int32Regs:$v2, Int32Regs:$v3),			multiclass TLD4_2D<string inst, NVPTXRegClass outtype, NVPTXRegClass intype> {
	(ins Int64Regs:$t, Int64Regs:$s, Float32Regs:$x, Float32Regs:$y),			def _RR : TLD4_2D_base<inst, outtype, intype,
	"tld4.r.2d.v4.s32.f32 \t\\{$v0, $v1, $v2, $v3\\}, "			(ins Int64Regs:$t, Int64Regs:$s)>;
	"[$t, $s, \\{$x, $y\\}];",			def _RI : TLD4_2D_base<inst, outtype, intype,
	[]>;			(ins Int64Regs:$t, i64imm:$s)>;
	def TLD4_G_2D_S32_F32			def _IR : TLD4_2D_base<inst, outtype, intype,
	: NVPTXInst<(outs Int32Regs:$v0, Int32Regs:$v1,			(ins i64imm:$t, Int64Regs:$s)>;
	Int32Regs:$v2, Int32Regs:$v3),			def _II : TLD4_2D_base<inst, outtype, intype,
	(ins Int64Regs:$t, Int64Regs:$s, Float32Regs:$x, Float32Regs:$y),			(ins i64imm:$t, i64imm:$s)>;
	"tld4.g.2d.v4.s32.f32 \t\\{$v0, $v1, $v2, $v3\\}, "			}
	"[$t, $s, \\{$x, $y\\}];",
	[]>;			defm TLD4_R_2D_F32_F32
	def TLD4_B_2D_S32_F32			: TLD4_2D<"tld4.r.2d.v4.f32.f32", Float32Regs, Float32Regs>;
	: NVPTXInst<(outs Int32Regs:$v0, Int32Regs:$v1,			defm TLD4_G_2D_F32_F32
	Int32Regs:$v2, Int32Regs:$v3),			: TLD4_2D<"tld4.g.2d.v4.f32.f32", Float32Regs, Float32Regs>;
	(ins Int64Regs:$t, Int64Regs:$s, Float32Regs:$x, Float32Regs:$y),			defm TLD4_B_2D_F32_F32
	"tld4.b.2d.v4.s32.f32 \t\\{$v0, $v1, $v2, $v3\\}, "			: TLD4_2D<"tld4.b.2d.v4.f32.f32", Float32Regs, Float32Regs>;
	"[$t, $s, \\{$x, $y\\}];",			defm TLD4_A_2D_F32_F32
	[]>;			: TLD4_2D<"tld4.a.2d.v4.f32.f32", Float32Regs, Float32Regs>;
	def TLD4_A_2D_S32_F32
	: NVPTXInst<(outs Int32Regs:$v0, Int32Regs:$v1,			defm TLD4_R_2D_S32_F32
	Int32Regs:$v2, Int32Regs:$v3),			: TLD4_2D<"tld4.r.2d.v4.s32.f32", Int32Regs, Float32Regs>;
	(ins Int64Regs:$t, Int64Regs:$s, Float32Regs:$x, Float32Regs:$y),			defm TLD4_G_2D_S32_F32
	"tld4.a.2d.v4.s32.f32 \t\\{$v0, $v1, $v2, $v3\\}, "			: TLD4_2D<"tld4.g.2d.v4.s32.f32", Int32Regs, Float32Regs>;
	"[$t, $s, \\{$x, $y\\}];",			defm TLD4_B_2D_S32_F32
	[]>;			: TLD4_2D<"tld4.b.2d.v4.s32.f32", Int32Regs, Float32Regs>;
	def TLD4_R_2D_U32_F32			defm TLD4_A_2D_S32_F32
	: NVPTXInst<(outs Int32Regs:$v0, Int32Regs:$v1,			: TLD4_2D<"tld4.a.2d.v4.s32.f32", Int32Regs, Float32Regs>;
	Int32Regs:$v2, Int32Regs:$v3),
	(ins Int64Regs:$t, Int64Regs:$s, Float32Regs:$x, Float32Regs:$y),			defm TLD4_R_2D_U32_F32
	"tld4.r.2d.v4.u32.f32 \t\\{$v0, $v1, $v2, $v3\\}, "			: TLD4_2D<"tld4.r.2d.v4.u32.f32", Int32Regs, Float32Regs>;
	"[$t, $s, \\{$x, $y\\}];",			defm TLD4_G_2D_U32_F32
	[]>;			: TLD4_2D<"tld4.g.2d.v4.u32.f32", Int32Regs, Float32Regs>;
	def TLD4_G_2D_U32_F32			defm TLD4_B_2D_U32_F32
	: NVPTXInst<(outs Int32Regs:$v0, Int32Regs:$v1,			: TLD4_2D<"tld4.b.2d.v4.u32.f32", Int32Regs, Float32Regs>;
	Int32Regs:$v2, Int32Regs:$v3),			defm TLD4_A_2D_U32_F32
	(ins Int64Regs:$t, Int64Regs:$s, Float32Regs:$x, Float32Regs:$y),			: TLD4_2D<"tld4.a.2d.v4.u32.f32", Int32Regs, Float32Regs>;
	"tld4.g.2d.v4.u32.f32 \t\\{$v0, $v1, $v2, $v3\\}, "
	"[$t, $s, \\{$x, $y\\}];",
	[]>;
	def TLD4_B_2D_U32_F32
	: NVPTXInst<(outs Int32Regs:$v0, Int32Regs:$v1,
	Int32Regs:$v2, Int32Regs:$v3),
	(ins Int64Regs:$t, Int64Regs:$s, Float32Regs:$x, Float32Regs:$y),
	"tld4.b.2d.v4.u32.f32 \t\\{$v0, $v1, $v2, $v3\\}, "
	"[$t, $s, \\{$x, $y\\}];",
	[]>;
	def TLD4_A_2D_U32_F32
	: NVPTXInst<(outs Int32Regs:$v0, Int32Regs:$v1,
	Int32Regs:$v2, Int32Regs:$v3),
	(ins Int64Regs:$t, Int64Regs:$s, Float32Regs:$x, Float32Regs:$y),
	"tld4.a.2d.v4.u32.f32 \t\\{$v0, $v1, $v2, $v3\\}, "
	"[$t, $s, \\{$x, $y\\}];",
	[]>;
	}			}


	// texmode_unified			// texmode_unified
	let IsTex = true, IsTexModeUnified = true in {			let IsTex = true, IsTexModeUnified = true in {
	// Texture fetch instructions using handles			// Texture fetch instructions using handles
	def TEX_UNIFIED_1D_F32_S32
	: NVPTXInst<(outs Float32Regs:$r, Float32Regs:$g,			class TEX_UNIFIED_1D_base<string inst, NVPTXRegClass outtype,
	Float32Regs:$b, Float32Regs:$a),			NVPTXRegClass intype, dag tex>
	(ins Int64Regs:$t, Int32Regs:$x),			: NVPTXInst<(outs outtype:$r, outtype:$g,
	"tex.1d.v4.f32.s32 \t\\{$r, $g, $b, $a\\}, [$t, \\{$x\\}];",			outtype:$b, outtype:$a),
	[]>;			!con(tex, (ins intype:$x)),
	def TEX_UNIFIED_1D_F32_F32			inst # " \t\\{$r, $g, $b, $a\\}, [$t, \\{$x\\}];",
	: NVPTXInst<(outs Float32Regs:$r, Float32Regs:$g,			[]>;
	Float32Regs:$b, Float32Regs:$a),
	(ins Int64Regs:$t, Float32Regs:$x),			multiclass TEX_UNIFIED_1D<string inst, NVPTXRegClass outtype,
	"tex.1d.v4.f32.f32 \t\\{$r, $g, $b, $a\\}, [$t, \\{$x\\}];",			NVPTXRegClass intype> {
	[]>;			def _R : TEX_UNIFIED_1D_base<inst, outtype, intype, (ins Int64Regs:$t)>;
	def TEX_UNIFIED_1D_F32_F32_LEVEL			def _I : TEX_UNIFIED_1D_base<inst, outtype, intype, (ins i64imm:$t)>;
	: NVPTXInst<(outs Float32Regs:$r, Float32Regs:$g,			}
	Float32Regs:$b, Float32Regs:$a),
	(ins Int64Regs:$t, Float32Regs:$x, Float32Regs:$lod),			defm TEX_UNIFIED_1D_F32_S32
	"tex.level.1d.v4.f32.f32 \t\\{$r, $g, $b, $a\\}, "			: TEX_UNIFIED_1D<"tex.1d.v4.f32.s32", Float32Regs, Int32Regs>;
	"[$t, \\{$x\\}], $lod;",			defm TEX_UNIFIED_1D_F32_F32
	[]>;			: TEX_UNIFIED_1D<"tex.1d.v4.f32.f32", Float32Regs, Float32Regs>;
	def TEX_UNIFIED_1D_F32_F32_GRAD			defm TEX_UNIFIED_1D_S32_S32
	: NVPTXInst<(outs Float32Regs:$r, Float32Regs:$g,			: TEX_UNIFIED_1D<"tex.1d.v4.s32.s32", Int32Regs, Int32Regs>;
	Float32Regs:$b, Float32Regs:$a),			defm TEX_UNIFIED_1D_S32_F32
	(ins Int64Regs:$t, Float32Regs:$x,			: TEX_UNIFIED_1D<"tex.1d.v4.s32.f32", Int32Regs, Float32Regs>;
	Float32Regs:$gradx, Float32Regs:$grady),			defm TEX_UNIFIED_1D_U32_S32
	"tex.grad.1d.v4.f32.f32 \t\\{$r, $g, $b, $a\\}, "			: TEX_UNIFIED_1D<"tex.1d.v4.u32.s32", Int32Regs, Int32Regs>;
	"[$t, \\{$x\\}], \\{$gradx\\}, \\{$grady\\};",			defm TEX_UNIFIED_1D_U32_F32
	[]>;			: TEX_UNIFIED_1D<"tex.1d.v4.u32.f32", Int32Regs, Float32Regs>;
	def TEX_UNIFIED_1D_S32_S32
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g,			class TEX_UNIFIED_1D_LEVEL_base<string inst, NVPTXRegClass outtype,
	Int32Regs:$b, Int32Regs:$a),			NVPTXRegClass intype, dag tex>
	(ins Int64Regs:$t, Int32Regs:$x),			: NVPTXInst<(outs outtype:$r, outtype:$g,
	"tex.1d.v4.s32.s32 \t\\{$r, $g, $b, $a\\}, [$t, \\{$x\\}];",			outtype:$b, outtype:$a),
	[]>;			!con(tex, (ins intype:$x, intype:$lod)),
	def TEX_UNIFIED_1D_S32_F32			inst # " \t\\{$r, $g, $b, $a\\}, [$t, \\{$x\\}], $lod;",
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g,			[]>;
	Int32Regs:$b, Int32Regs:$a),
	(ins Int64Regs:$t, Float32Regs:$x),			multiclass TEX_UNIFIED_1D_LEVEL<string inst, NVPTXRegClass outtype,
	"tex.1d.v4.s32.f32 \t\\{$r, $g, $b, $a\\}, [$t, \\{$x\\}];",			NVPTXRegClass intype> {
	[]>;			def _R : TEX_UNIFIED_1D_LEVEL_base<inst, outtype, intype, (ins Int64Regs:$t)>;
	def TEX_UNIFIED_1D_S32_F32_LEVEL			def _I : TEX_UNIFIED_1D_LEVEL_base<inst, outtype, intype, (ins i64imm:$t)>;
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g,			}
	Int32Regs:$b, Int32Regs:$a),
	(ins Int64Regs:$t, Float32Regs:$x,			defm TEX_UNIFIED_1D_F32_F32_LEVEL
	Float32Regs:$lod),			: TEX_UNIFIED_1D_LEVEL<"tex.level.1d.v4.f32.f32", Float32Regs, Float32Regs>;
	"tex.level.1d.v4.s32.f32 \t\\{$r, $g, $b, $a\\}, "			defm TEX_UNIFIED_1D_S32_F32_LEVEL
	"[$t, \\{$x\\}], $lod;",			: TEX_UNIFIED_1D_LEVEL<"tex.level.1d.v4.s32.f32", Int32Regs, Float32Regs>;
	[]>;			defm TEX_UNIFIED_1D_U32_F32_LEVEL
	def TEX_UNIFIED_1D_S32_F32_GRAD			: TEX_UNIFIED_1D_LEVEL<"tex.level.1d.v4.u32.f32", Int32Regs, Float32Regs>;
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g,
	Int32Regs:$b, Int32Regs:$a),			class TEX_UNIFIED_1D_GRAD_base<string inst, NVPTXRegClass outtype,
	(ins Int64Regs:$t, Float32Regs:$x,			NVPTXRegClass intype, dag tex>
	Float32Regs:$gradx, Float32Regs:$grady),			: NVPTXInst<(outs outtype:$r, outtype:$g,
	"tex.grad.1d.v4.s32.f32 \t\\{$r, $g, $b, $a\\}, "			outtype:$b, outtype:$a),
	"[$t, \\{$x\\}], \\{$gradx\\}, \\{$grady\\};",			!con(tex, (ins intype:$x, intype:$gradx, intype:$grady)),
	[]>;			inst # " \t\\{$r, $g, $b, $a\\},"
	def TEX_UNIFIED_1D_U32_S32
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g,
	Int32Regs:$b, Int32Regs:$a),
	(ins Int64Regs:$t, Int32Regs:$x),
	"tex.1d.v4.u32.s32 \t\\{$r, $g, $b, $a\\}, [$t, \\{$x\\}];",
	[]>;
	def TEX_UNIFIED_1D_U32_F32
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g,
	Int32Regs:$b, Int32Regs:$a),
	(ins Int64Regs:$t, Float32Regs:$x),
	"tex.1d.v4.u32.f32 \t\\{$r, $g, $b, $a\\}, [$t, \\{$x\\}];",
	[]>;
	def TEX_UNIFIED_1D_U32_F32_LEVEL
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g,
	Int32Regs:$b, Int32Regs:$a),
	(ins Int64Regs:$t, Float32Regs:$x,
	Float32Regs:$lod),
	"tex.level.1d.v4.u32.f32 \t\\{$r, $g, $b, $a\\}, "
	"[$t, \\{$x\\}], $lod;",
	[]>;
	def TEX_UNIFIED_1D_U32_F32_GRAD
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g,
	Int32Regs:$b, Int32Regs:$a),
	(ins Int64Regs:$t, Float32Regs:$x,
	Float32Regs:$gradx, Float32Regs:$grady),
	"tex.grad.1d.v4.u32.f32 \t\\{$r, $g, $b, $a\\}, "
	"[$t, \\{$x\\}], \\{$gradx\\}, \\{$grady\\};",			" [$t, \\{$x\\}], \\{$gradx\\}, \\{$grady\\};",
	[]>;			[]>;

	def TEX_UNIFIED_1D_ARRAY_F32_S32			multiclass TEX_UNIFIED_1D_GRAD<string inst, NVPTXRegClass outtype,
	: NVPTXInst<(outs Float32Regs:$r, Float32Regs:$g,			NVPTXRegClass intype> {
	Float32Regs:$b, Float32Regs:$a),			def _R : TEX_UNIFIED_1D_GRAD_base<inst, outtype, intype, (ins Int64Regs:$t)>;
	(ins Int64Regs:$t, Int32Regs:$l, Int32Regs:$x),			def _I : TEX_UNIFIED_1D_GRAD_base<inst, outtype, intype, (ins i64imm:$t)>;
	"tex.a1d.v4.f32.s32 \t\\{$r, $g, $b, $a\\}, "			}
	"[$t, \\{$l, $x\\}];",
	[]>;			defm TEX_UNIFIED_1D_F32_F32_GRAD
	def TEX_UNIFIED_1D_ARRAY_F32_F32			: TEX_UNIFIED_1D_GRAD<"tex.grad.1d.v4.f32.f32", Float32Regs, Float32Regs>;
	: NVPTXInst<(outs Float32Regs:$r, Float32Regs:$g,			defm TEX_UNIFIED_1D_S32_F32_GRAD
	Float32Regs:$b, Float32Regs:$a),			: TEX_UNIFIED_1D_GRAD<"tex.grad.1d.v4.s32.f32", Int32Regs, Float32Regs>;
	(ins Int64Regs:$t, Int32Regs:$l, Float32Regs:$x),			defm TEX_UNIFIED_1D_U32_F32_GRAD
	"tex.a1d.v4.f32.f32 \t\\{$r, $g, $b, $a\\}, "			: TEX_UNIFIED_1D_GRAD<"tex.grad.1d.v4.u32.f32", Int32Regs, Float32Regs>;
	"[$t, \\{$l, $x\\}];",
	[]>;			class TEX_UNIFIED_1D_ARRAY_base<string inst, NVPTXRegClass outtype,
	def TEX_UNIFIED_1D_ARRAY_F32_F32_LEVEL			NVPTXRegClass intype, dag tex>
	: NVPTXInst<(outs Float32Regs:$r, Float32Regs:$g,			: NVPTXInst<(outs outtype:$r, outtype:$g,
	Float32Regs:$b, Float32Regs:$a),			outtype:$b, outtype:$a),
	(ins Int64Regs:$t, Int32Regs:$l, Float32Regs:$x,			!con(tex, (ins Int32Regs:$l, intype:$x)),
	Float32Regs:$lod),			inst # " \t\\{$r, $g, $b, $a\\}, [$t, \\{$l, $x\\}];",
	"tex.level.a1d.v4.f32.f32 \t\\{$r, $g, $b, $a\\}, "			[]>;
	"[$t, \\{$l, $x\\}], $lod;",
	[]>;			multiclass TEX_UNIFIED_1D_ARRAY<string inst, NVPTXRegClass outtype,
	def TEX_UNIFIED_1D_ARRAY_F32_F32_GRAD			NVPTXRegClass intype> {
	: NVPTXInst<(outs Float32Regs:$r, Float32Regs:$g,			def _R : TEX_UNIFIED_1D_ARRAY_base<inst, outtype, intype, (ins Int64Regs:$t)>;
	Float32Regs:$b, Float32Regs:$a),			def _I : TEX_UNIFIED_1D_ARRAY_base<inst, outtype, intype, (ins i64imm:$t)>;
	(ins Int64Regs:$t, Int32Regs:$l, Float32Regs:$x,			}
	Float32Regs:$gradx, Float32Regs:$grady),
	"tex.grad.a1d.v4.f32.f32 \t\\{$r, $g, $b, $a\\}, "			defm TEX_UNIFIED_1D_ARRAY_F32_S32
	"[$t, \\{$l, $x\\}], \\{$gradx\\}, \\{$grady\\};",			: TEX_UNIFIED_1D_ARRAY<"tex.a1d.v4.f32.s32", Float32Regs, Int32Regs>;
	[]>;			defm TEX_UNIFIED_1D_ARRAY_F32_F32
	def TEX_UNIFIED_1D_ARRAY_S32_S32			: TEX_UNIFIED_1D_ARRAY<"tex.a1d.v4.f32.f32", Float32Regs, Float32Regs>;
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g,			defm TEX_UNIFIED_1D_ARRAY_S32_S32
	Int32Regs:$b, Int32Regs:$a),			: TEX_UNIFIED_1D_ARRAY<"tex.a1d.v4.s32.s32", Int32Regs, Int32Regs>;
	(ins Int64Regs:$t, Int32Regs:$l, Int32Regs:$x),			defm TEX_UNIFIED_1D_ARRAY_S32_F32
	"tex.a1d.v4.s32.s32 \t\\{$r, $g, $b, $a\\}, "			: TEX_UNIFIED_1D_ARRAY<"tex.a1d.v4.s32.f32", Int32Regs, Float32Regs>;
	"[$t, \\{$l, $x\\}];",			defm TEX_UNIFIED_1D_ARRAY_U32_S32
	[]>;			: TEX_UNIFIED_1D_ARRAY<"tex.a1d.v4.u32.s32", Int32Regs, Int32Regs>;
	def TEX_UNIFIED_1D_ARRAY_S32_F32			defm TEX_UNIFIED_1D_ARRAY_U32_F32
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g,			: TEX_UNIFIED_1D_ARRAY<"tex.a1d.v4.u32.f32", Int32Regs, Float32Regs>;
	Int32Regs:$b, Int32Regs:$a),
	(ins Int64Regs:$t, Int32Regs:$l, Float32Regs:$x),			class TEX_UNIFIED_1D_ARRAY_LEVEL_base<string inst, NVPTXRegClass outtype,
	"tex.a1d.v4.s32.f32 \t\\{$r, $g, $b, $a\\}, "			NVPTXRegClass intype, dag tex>
	"[$t, \\{$l, $x\\}];",			: NVPTXInst<(outs outtype:$r, outtype:$g,
	[]>;			outtype:$b, outtype:$a),
	def TEX_UNIFIED_1D_ARRAY_S32_F32_LEVEL			!con(tex, (ins Int32Regs:$l, intype:$x, intype:$lod)),
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g,			inst # " \t\\{$r, $g, $b, $a\\}, [$t, \\{$l, $x\\}], $lod;",
	Int32Regs:$b, Int32Regs:$a),			[]>;
	(ins Int64Regs:$t, Int32Regs:$l, Float32Regs:$x,
	Float32Regs:$lod),			multiclass TEX_UNIFIED_1D_ARRAY_LEVEL<string inst, NVPTXRegClass outtype,
	"tex.level.a1d.v4.s32.f32 \t\\{$r, $g, $b, $a\\}, "			NVPTXRegClass intype> {
	"[$t, \\{$l, $x\\}], $lod;",			def _R : TEX_UNIFIED_1D_ARRAY_LEVEL_base<inst, outtype, intype,
	[]>;			(ins Int64Regs:$t)>;
	def TEX_UNIFIED_1D_ARRAY_S32_F32_GRAD			def _I : TEX_UNIFIED_1D_ARRAY_LEVEL_base<inst, outtype, intype,
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g,			(ins i64imm:$t)>;
	Int32Regs:$b, Int32Regs:$a),			}
	(ins Int64Regs:$t, Int32Regs:$l, Float32Regs:$x,
	Float32Regs:$gradx, Float32Regs:$grady),			defm TEX_UNIFIED_1D_ARRAY_F32_F32_LEVEL
	"tex.grad.a1d.v4.s32.f32 \t\\{$r, $g, $b, $a\\}, "			: TEX_UNIFIED_1D_ARRAY_LEVEL<"tex.level.a1d.v4.f32.f32",
	"[$t, \\{$l, $x\\}], \\{$gradx\\}, \\{$grady\\};",			Float32Regs, Float32Regs>;
	[]>;			defm TEX_UNIFIED_1D_ARRAY_S32_F32_LEVEL
	def TEX_UNIFIED_1D_ARRAY_U32_S32			: TEX_UNIFIED_1D_ARRAY_LEVEL<"tex.level.a1d.v4.s32.f32",
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g,			Int32Regs, Float32Regs>;
	Int32Regs:$b, Int32Regs:$a),			defm TEX_UNIFIED_1D_ARRAY_U32_F32_LEVEL
	(ins Int64Regs:$t, Int32Regs:$l, Int32Regs:$x),			: TEX_UNIFIED_1D_ARRAY_LEVEL<"tex.level.a1d.v4.u32.f32",
	"tex.a1d.v4.u32.s32 \t\\{$r, $g, $b, $a\\}, "			Int32Regs, Float32Regs>;
	"[$t, \\{$l, $x\\}];",
	[]>;			class TEX_UNIFIED_1D_ARRAY_GRAD_base<string inst, NVPTXRegClass outtype,
	def TEX_UNIFIED_1D_ARRAY_U32_F32			NVPTXRegClass intype, dag tex>
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g,			: NVPTXInst<(outs outtype:$r, outtype:$g,
	Int32Regs:$b, Int32Regs:$a),			outtype:$b, outtype:$a),
	(ins Int64Regs:$t, Int32Regs:$l, Float32Regs:$x),			!con(tex, (ins Int32Regs:$l, intype:$x,
	"tex.a1d.v4.u32.f32 \t\\{$r, $g, $b, $a\\}, "			intype:$gradx, intype:$grady)),
	"[$t, \\{$l, $x\\}];",			inst # " \t\\{$r, $g, $b, $a\\},"
	[]>;
	def TEX_UNIFIED_1D_ARRAY_U32_F32_LEVEL
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g,
	Int32Regs:$b, Int32Regs:$a),
	(ins Int64Regs:$t, Int32Regs:$l, Float32Regs:$x,
	Float32Regs:$lod),
	"tex.level.a1d.v4.u32.f32 \t\\{$r, $g, $b, $a\\}, "
	"[$t, \\{$l, $x\\}], $lod;",
	[]>;
	def TEX_UNIFIED_1D_ARRAY_U32_F32_GRAD
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g,
	Int32Regs:$b, Int32Regs:$a),
	(ins Int64Regs:$t, Int32Regs:$l, Float32Regs:$x,
	Float32Regs:$gradx, Float32Regs:$grady),
	"tex.grad.a1d.v4.u32.f32 \t\\{$r, $g, $b, $a\\}, "
	"[$t, \\{$l, $x\\}], \\{$gradx\\}, \\{$grady\\};",			" [$t, \\{$l, $x\\}], \\{$gradx\\}, \\{$grady\\};",
	[]>;			[]>;

	def TEX_UNIFIED_2D_F32_S32			multiclass TEX_UNIFIED_1D_ARRAY_GRAD<string inst, NVPTXRegClass outtype,
	: NVPTXInst<(outs Float32Regs:$r, Float32Regs:$g,			NVPTXRegClass intype> {
	Float32Regs:$b, Float32Regs:$a),			def _R : TEX_UNIFIED_1D_ARRAY_GRAD_base<inst, outtype, intype,
	(ins Int64Regs:$t, Int32Regs:$x, Int32Regs:$y),			(ins Int64Regs:$t)>;
	"tex.2d.v4.f32.s32 \t\\{$r, $g, $b, $a\\}, "			def _I : TEX_UNIFIED_1D_ARRAY_GRAD_base<inst, outtype, intype,
	"[$t, \\{$x, $y\\}];",			(ins i64imm:$t)>;
	[]>;			}
	def TEX_UNIFIED_2D_F32_F32
	: NVPTXInst<(outs Float32Regs:$r, Float32Regs:$g,			defm TEX_UNIFIED_1D_ARRAY_F32_F32_GRAD
	Float32Regs:$b, Float32Regs:$a),			: TEX_UNIFIED_1D_ARRAY_GRAD<"tex.grad.a1d.v4.f32.f32",
	(ins Int64Regs:$t, Float32Regs:$x, Float32Regs:$y),			Float32Regs, Float32Regs>;
	"tex.2d.v4.f32.f32 \t\\{$r, $g, $b, $a\\}, "			defm TEX_UNIFIED_1D_ARRAY_S32_F32_GRAD
	"[$t, \\{$x, $y\\}];",			: TEX_UNIFIED_1D_ARRAY_GRAD<"tex.grad.a1d.v4.s32.f32",
	[]>;			Int32Regs, Float32Regs>;
	def TEX_UNIFIED_2D_F32_F32_LEVEL			defm TEX_UNIFIED_1D_ARRAY_U32_F32_GRAD
	: NVPTXInst<(outs Float32Regs:$r, Float32Regs:$g,			: TEX_UNIFIED_1D_ARRAY_GRAD<"tex.grad.a1d.v4.u32.f32",
	Float32Regs:$b, Float32Regs:$a),			Int32Regs, Float32Regs>;
	(ins Int64Regs:$t, Float32Regs:$x, Float32Regs:$y,
	Float32Regs:$lod),			class TEX_UNIFIED_2D_base<string inst, NVPTXRegClass outtype,
	"tex.level.2d.v4.f32.f32 \t\\{$r, $g, $b, $a\\}, "			NVPTXRegClass intype, dag tex>
	"[$t, \\{$x, $y\\}], $lod;",			: NVPTXInst<(outs outtype:$r, outtype:$g,
	[]>;			outtype:$b, outtype:$a),
	def TEX_UNIFIED_2D_F32_F32_GRAD			!con(tex, (ins intype:$x, intype:$y)),
	: NVPTXInst<(outs Float32Regs:$r, Float32Regs:$g,			inst # " \t\\{$r, $g, $b, $a\\}, [$t, \\{$x, $y\\}];",
	Float32Regs:$b, Float32Regs:$a),			[]>;
	(ins Int64Regs:$t, Float32Regs:$x, Float32Regs:$y,
	Float32Regs:$gradx0, Float32Regs:$gradx1,			multiclass TEX_UNIFIED_2D<string inst, NVPTXRegClass outtype,
	Float32Regs:$grady0, Float32Regs:$grady1),			NVPTXRegClass intype> {
	"tex.grad.2d.v4.f32.f32 \t\\{$r, $g, $b, $a\\}, "			def _R : TEX_UNIFIED_2D_base<inst, outtype, intype, (ins Int64Regs:$t)>;
	"[$t, \\{$x, $y\\}], \\{$gradx0, $gradx1\\}, "			def _I : TEX_UNIFIED_2D_base<inst, outtype, intype, (ins i64imm:$t)>;
	"\\{$grady0, $grady1\\};",			}
	[]>;
	def TEX_UNIFIED_2D_S32_S32			defm TEX_UNIFIED_2D_F32_S32
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g,			: TEX_UNIFIED_2D<"tex.2d.v4.f32.s32", Float32Regs, Int32Regs>;
	Int32Regs:$b, Int32Regs:$a),			defm TEX_UNIFIED_2D_F32_F32
	(ins Int64Regs:$t, Int32Regs:$x, Int32Regs:$y),			: TEX_UNIFIED_2D<"tex.2d.v4.f32.f32", Float32Regs, Float32Regs>;
	"tex.2d.v4.s32.s32 \t\\{$r, $g, $b, $a\\}, "			defm TEX_UNIFIED_2D_S32_S32
	"[$t, \\{$x, $y\\}];",			: TEX_UNIFIED_2D<"tex.2d.v4.s32.s32", Int32Regs, Int32Regs>;
	[]>;			defm TEX_UNIFIED_2D_S32_F32
	def TEX_UNIFIED_2D_S32_F32			: TEX_UNIFIED_2D<"tex.2d.v4.s32.f32", Int32Regs, Float32Regs>;
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g,			defm TEX_UNIFIED_2D_U32_S32
	Int32Regs:$b, Int32Regs:$a),			: TEX_UNIFIED_2D<"tex.2d.v4.u32.s32", Int32Regs, Int32Regs>;
	(ins Int64Regs:$t, Float32Regs:$x, Float32Regs:$y),			defm TEX_UNIFIED_2D_U32_F32
	"tex.2d.v4.s32.f32 \t\\{$r, $g, $b, $a\\}, "			: TEX_UNIFIED_2D<"tex.2d.v4.u32.f32", Int32Regs, Float32Regs>;
	"[$t, \\{$x, $y\\}];",
	[]>;			class TEX_UNIFIED_2D_LEVEL_base<string inst, NVPTXRegClass outtype,
	def TEX_UNIFIED_2D_S32_F32_LEVEL			NVPTXRegClass intype, dag tex>
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g,			: NVPTXInst<(outs outtype:$r, outtype:$g,
	Int32Regs:$b, Int32Regs:$a),			outtype:$b, outtype:$a),
	(ins Int64Regs:$t, Float32Regs:$x, Float32Regs:$y,			!con(tex, (ins intype:$x, intype:$y, intype:$lod)),
	Float32Regs:$lod),			inst # " \t\\{$r, $g, $b, $a\\}, [$t, \\{$x, $y\\}], $lod;",
	"tex.level.2d.v4.s32.f32 \t\\{$r, $g, $b, $a\\}, "			[]>;
	"[$t, \\{$x, $y\\}], $lod;",
	[]>;			multiclass TEX_UNIFIED_2D_LEVEL<string inst, NVPTXRegClass outtype,
	def TEX_UNIFIED_2D_S32_F32_GRAD			NVPTXRegClass intype> {
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g,			def _R : TEX_UNIFIED_2D_LEVEL_base<inst, outtype, intype, (ins Int64Regs:$t)>;
	Int32Regs:$b, Int32Regs:$a),			def _I : TEX_UNIFIED_2D_LEVEL_base<inst, outtype, intype, (ins i64imm:$t)>;
	(ins Int64Regs:$t, Float32Regs:$x, Float32Regs:$y,			}
	Float32Regs:$gradx0, Float32Regs:$gradx1,
	Float32Regs:$grady0, Float32Regs:$grady1),			defm TEX_UNIFIED_2D_F32_F32_LEVEL
	"tex.grad.2d.v4.s32.f32 \t\\{$r, $g, $b, $a\\}, "			: TEX_UNIFIED_2D_LEVEL<"tex.level.2d.v4.f32.f32", Float32Regs, Float32Regs>;
	"[$t, \\{$x, $y\\}], \\{$gradx0, $gradx1\\}, "			defm TEX_UNIFIED_2D_S32_F32_LEVEL
	"\\{$grady0, $grady1\\};",			: TEX_UNIFIED_2D_LEVEL<"tex.level.2d.v4.s32.f32", Int32Regs, Float32Regs>;
	[]>;			defm TEX_UNIFIED_2D_U32_F32_LEVEL
	def TEX_UNIFIED_2D_U32_S32			: TEX_UNIFIED_2D_LEVEL<"tex.level.2d.v4.u32.f32", Int32Regs, Float32Regs>;
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g,
	Int32Regs:$b, Int32Regs:$a),			class TEX_UNIFIED_2D_GRAD_base<string inst, NVPTXRegClass outtype,
	(ins Int64Regs:$t, Int32Regs:$x, Int32Regs:$y),			NVPTXRegClass intype, dag tex>
	"tex.2d.v4.u32.s32 \t\\{$r, $g, $b, $a\\}, "			: NVPTXInst<(outs outtype:$r, outtype:$g,
	"[$t, \\{$x, $y\\}];",			outtype:$b, outtype:$a),
	[]>;			!con(tex, (ins intype:$x, intype:$y,
	def TEX_UNIFIED_2D_U32_F32			intype:$gradx0, intype:$gradx1,
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g,			intype:$grady0, intype:$grady1)),
	Int32Regs:$b, Int32Regs:$a),			inst # " \t\\{$r, $g, $b, $a\\}, [$t, \\{$x, $y\\}],"
	(ins Int64Regs:$t, Float32Regs:$x, Float32Regs:$y),			" \\{$gradx0, $gradx1\\}, \\{$grady0, $grady1\\};",
	"tex.2d.v4.u32.f32 \t\\{$r, $g, $b, $a\\}, "			[]>;
	"[$t, \\{$x, $y\\}];",			multiclass TEX_UNIFIED_2D_GRAD<string inst, NVPTXRegClass outtype,
	[]>;			NVPTXRegClass intype> {
	def TEX_UNIFIED_2D_U32_F32_LEVEL			def _R : TEX_UNIFIED_2D_GRAD_base<inst, outtype, intype, (ins Int64Regs:$t)>;
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g,			def _I : TEX_UNIFIED_2D_GRAD_base<inst, outtype, intype, (ins i64imm:$t)>;
	Int32Regs:$b, Int32Regs:$a),			}
	(ins Int64Regs:$t, Float32Regs:$x, Float32Regs:$y,
	Float32Regs:$lod),			defm TEX_UNIFIED_2D_F32_F32_GRAD
	"tex.level.2d.v4.u32.f32 \t\\{$r, $g, $b, $a\\}, "			: TEX_UNIFIED_2D_GRAD<"tex.grad.2d.v4.f32.f32", Float32Regs, Float32Regs>;
	"[$t, \\{$x, $y\\}], $lod;",			defm TEX_UNIFIED_2D_S32_F32_GRAD
	[]>;			: TEX_UNIFIED_2D_GRAD<"tex.grad.2d.v4.s32.f32", Int32Regs, Float32Regs>;
	def TEX_UNIFIED_2D_U32_F32_GRAD			defm TEX_UNIFIED_2D_U32_F32_GRAD
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g,			: TEX_UNIFIED_2D_GRAD<"tex.grad.2d.v4.u32.f32", Int32Regs, Float32Regs>;
	Int32Regs:$b, Int32Regs:$a),
	(ins Int64Regs:$t, Float32Regs:$x, Float32Regs:$y,			class TEX_UNIFIED_2D_ARRAY_base<string inst, NVPTXRegClass outtype,
	Float32Regs:$gradx0, Float32Regs:$gradx1,			NVPTXRegClass intype, dag tex>
	Float32Regs:$grady0, Float32Regs:$grady1),			: NVPTXInst<(outs outtype:$r, outtype:$g,
	"tex.grad.2d.v4.u32.f32 \t\\{$r, $g, $b, $a\\}, "			outtype:$b, outtype:$a),
	"[$t, \\{$x, $y\\}], \\{$gradx0, $gradx1\\}, "			!con(tex, (ins Int32Regs:$l, intype:$x, intype:$y)),
	"\\{$grady0, $grady1\\};",			inst # " \t\\{$r, $g, $b, $a\\}, [$t, \\{$l, $x, $y, $y\\}];",
	[]>;			[]>;
				multiclass TEX_UNIFIED_2D_ARRAY<string inst, NVPTXRegClass outtype,
	def TEX_UNIFIED_2D_ARRAY_F32_S32			NVPTXRegClass intype> {
	: NVPTXInst<(outs Float32Regs:$r, Float32Regs:$g,			def _R : TEX_UNIFIED_2D_ARRAY_base<inst, outtype, intype, (ins Int64Regs:$t)>;
	Float32Regs:$b, Float32Regs:$a),			def _I : TEX_UNIFIED_2D_ARRAY_base<inst, outtype, intype, (ins i64imm:$t)>;
	(ins Int64Regs:$t, Int32Regs:$l, Int32Regs:$x,			}
	Int32Regs:$y),
	"tex.a2d.v4.f32.s32 \t\\{$r, $g, $b, $a\\}, "			defm TEX_UNIFIED_2D_ARRAY_F32_S32
	"[$t, \\{$l, $x, $y, $y\\}];",			: TEX_UNIFIED_2D_ARRAY<"tex.a2d.v4.f32.s32", Float32Regs, Int32Regs>;
	[]>;			defm TEX_UNIFIED_2D_ARRAY_F32_F32
	def TEX_UNIFIED_2D_ARRAY_F32_F32			: TEX_UNIFIED_2D_ARRAY<"tex.a2d.v4.f32.f32", Float32Regs, Float32Regs>;
	: NVPTXInst<(outs Float32Regs:$r, Float32Regs:$g,			defm TEX_UNIFIED_2D_ARRAY_S32_S32
	Float32Regs:$b, Float32Regs:$a),			: TEX_UNIFIED_2D_ARRAY<"tex.a2d.v4.s32.s32", Int32Regs, Int32Regs>;
	(ins Int64Regs:$t, Int32Regs:$l, Float32Regs:$x,			defm TEX_UNIFIED_2D_ARRAY_S32_F32
	Float32Regs:$y),			: TEX_UNIFIED_2D_ARRAY<"tex.a2d.v4.s32.f32", Int32Regs, Float32Regs>;
	"tex.a2d.v4.f32.f32 \t\\{$r, $g, $b, $a\\}, "			defm TEX_UNIFIED_2D_ARRAY_U32_S32
	"[$t, \\{$l, $x, $y, $y\\}];",			: TEX_UNIFIED_2D_ARRAY<"tex.a2d.v4.u32.s32", Int32Regs, Int32Regs>;
	[]>;			defm TEX_UNIFIED_2D_ARRAY_U32_F32
	def TEX_UNIFIED_2D_ARRAY_F32_F32_LEVEL			: TEX_UNIFIED_2D_ARRAY<"tex.a2d.v4.u32.f32", Int32Regs, Float32Regs>;
	: NVPTXInst<(outs Float32Regs:$r, Float32Regs:$g,
	Float32Regs:$b, Float32Regs:$a),			class TEX_UNIFIED_2D_ARRAY_LEVEL_base<string inst, NVPTXRegClass outtype,
	(ins Int64Regs:$t, Int32Regs:$l, Float32Regs:$x,			NVPTXRegClass intype, dag tex>
	Float32Regs:$y, Float32Regs:$lod),			: NVPTXInst<(outs outtype:$r, outtype:$g,
	"tex.level.a2d.v4.f32.f32 \t\\{$r, $g, $b, $a\\}, "			outtype:$b, outtype:$a),
	"[$t, \\{$l, $x, $y, $y\\}], $lod;",			!con(tex, (ins Int32Regs:$l, intype:$x, intype:$y,
	[]>;			intype:$lod)),
	def TEX_UNIFIED_2D_ARRAY_F32_F32_GRAD			inst # " \t\\{$r, $g, $b, $a\\},"
	: NVPTXInst<(outs Float32Regs:$r, Float32Regs:$g,
	Float32Regs:$b, Float32Regs:$a),
	(ins Int64Regs:$t, Int32Regs:$l, Float32Regs:$x,
	Float32Regs:$y, Float32Regs:$gradx0, Float32Regs:$gradx1,
	Float32Regs:$grady0, Float32Regs:$grady1),
	"tex.grad.a2d.v4.f32.f32 \t\\{$r, $g, $b, $a\\}, "
	"[$t, \\{$l, $x, $y, $y\\}], \\{$gradx0, $gradx1\\}, "
	"\\{$grady0, $grady1\\};",
	[]>;
	def TEX_UNIFIED_2D_ARRAY_S32_S32
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g,
	Int32Regs:$b, Int32Regs:$a),
	(ins Int64Regs:$t, Int32Regs:$l, Int32Regs:$x,
	Int32Regs:$y),
	"tex.a2d.v4.s32.s32 \t\\{$r, $g, $b, $a\\}, "
	"[$t, \\{$l, $x, $y, $y\\}];",
	[]>;
	def TEX_UNIFIED_2D_ARRAY_S32_F32
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g,
	Int32Regs:$b, Int32Regs:$a),
	(ins Int64Regs:$t, Int32Regs:$l, Float32Regs:$x,
	Float32Regs:$y),
	"tex.a2d.v4.s32.f32 \t\\{$r, $g, $b, $a\\}, "
	"[$t, \\{$l, $x, $y, $y\\}];",
	[]>;
	def TEX_UNIFIED_2D_ARRAY_S32_F32_LEVEL
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g,
	Int32Regs:$b, Int32Regs:$a),
	(ins Int64Regs:$t, Int32Regs:$l, Float32Regs:$x,
	Float32Regs:$y, Float32Regs:$lod),
	"tex.level.a2d.v4.s32.f32 \t\\{$r, $g, $b, $a\\}, "
	"[$t, \\{$l, $x, $y, $y\\}], $lod;",			" [$t, \\{$l, $x, $y, $y\\}], $lod;",
	[]>;			[]>;
	def TEX_UNIFIED_2D_ARRAY_S32_F32_GRAD			multiclass TEX_UNIFIED_2D_ARRAY_LEVEL<string inst, NVPTXRegClass outtype,
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g,			NVPTXRegClass intype> {
	Int32Regs:$b, Int32Regs:$a),			def _R : TEX_UNIFIED_2D_ARRAY_LEVEL_base<inst, outtype, intype,
	(ins Int64Regs:$t, Int32Regs:$l, Float32Regs:$x,			(ins Int64Regs:$t)>;
	Float32Regs:$y,			def _I : TEX_UNIFIED_2D_ARRAY_LEVEL_base<inst, outtype, intype,
	Float32Regs:$gradx0, Float32Regs:$gradx1,			(ins i64imm:$t)>;
	Float32Regs:$grady0, Float32Regs:$grady1),			}
	"tex.grad.a2d.v4.s32.f32 \t\\{$r, $g, $b, $a\\}, "
	"[$t, \\{$l, $x, $y, $y\\}], \\{$gradx0, $gradx1\\}, "			defm TEX_UNIFIED_2D_ARRAY_F32_F32_LEVEL
	"\\{$grady0, $grady1\\};",			: TEX_UNIFIED_2D_ARRAY_LEVEL<"tex.level.a2d.v4.f32.f32",
	[]>;			Float32Regs, Float32Regs>;
	def TEX_UNIFIED_2D_ARRAY_U32_S32			defm TEX_UNIFIED_2D_ARRAY_S32_F32_LEVEL
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g,			: TEX_UNIFIED_2D_ARRAY_LEVEL<"tex.level.a2d.v4.s32.f32",
	Int32Regs:$b, Int32Regs:$a),			Int32Regs, Float32Regs>;
	(ins Int64Regs:$t, Int32Regs:$l, Int32Regs:$x,			defm TEX_UNIFIED_2D_ARRAY_U32_F32_LEVEL
	Int32Regs:$y),			: TEX_UNIFIED_2D_ARRAY_LEVEL<"tex.level.a2d.v4.u32.f32",
	"tex.a2d.v4.u32.s32 \t\\{$r, $g, $b, $a\\}, "			Int32Regs, Float32Regs>;
	"[$t, \\{$l, $x, $y, $y\\}];",
	[]>;			class TEX_UNIFIED_2D_ARRAY_GRAD_base<string inst, NVPTXRegClass outtype,
	def TEX_UNIFIED_2D_ARRAY_U32_F32			NVPTXRegClass intype, dag tex>
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g,			: NVPTXInst<(outs outtype:$r, outtype:$g,
	Int32Regs:$b, Int32Regs:$a),			outtype:$b, outtype:$a),
	(ins Int64Regs:$t, Int32Regs:$l, Float32Regs:$x,			!con(tex, (ins Int32Regs:$l, intype:$x, intype:$y,
	Float32Regs:$y),			intype:$gradx0, intype:$gradx1,
	"tex.a2d.v4.u32.f32 \t\\{$r, $g, $b, $a\\}, "			intype:$grady0, intype:$grady1)),
	"[$t, \\{$l, $x, $y, $y\\}];",			inst # " \t\\{$r, $g, $b, $a\\}, [$t, \\{$l, $x, $y, $y\\}],"
	[]>;			" \\{$gradx0, $gradx1\\}, \\{$grady0, $grady1\\};",
	def TEX_UNIFIED_2D_ARRAY_U32_F32_LEVEL			[]>;
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g,			multiclass TEX_UNIFIED_2D_ARRAY_GRAD<string inst, NVPTXRegClass outtype,
	Int32Regs:$b, Int32Regs:$a),			NVPTXRegClass intype> {
	(ins Int64Regs:$t, Int32Regs:$l, Float32Regs:$x,			def _R : TEX_UNIFIED_2D_ARRAY_GRAD_base<inst, outtype, intype,
	Float32Regs:$y, Float32Regs:$lod),			(ins Int64Regs:$t)>;
	"tex.level.a2d.v4.u32.f32 \t\\{$r, $g, $b, $a\\}, "			def _I : TEX_UNIFIED_2D_ARRAY_GRAD_base<inst, outtype, intype,
	"[$t, \\{$l, $x, $y, $y\\}], $lod;",			(ins i64imm:$t)>;
	[]>;			}
	def TEX_UNIFIED_2D_ARRAY_U32_F32_GRAD
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g,			defm TEX_UNIFIED_2D_ARRAY_F32_F32_GRAD
	Int32Regs:$b, Int32Regs:$a),			: TEX_UNIFIED_2D_ARRAY_GRAD<"tex.grad.a2d.v4.f32.f32",
	(ins Int64Regs:$t, Int32Regs:$l, Float32Regs:$x,			Float32Regs, Float32Regs>;
	Float32Regs:$y,			defm TEX_UNIFIED_2D_ARRAY_S32_F32_GRAD
	Float32Regs:$gradx0, Float32Regs:$gradx1,			: TEX_UNIFIED_2D_ARRAY_GRAD<"tex.grad.a2d.v4.s32.f32",
	Float32Regs:$grady0, Float32Regs:$grady1),			Int32Regs, Float32Regs>;
	"tex.grad.a2d.v4.u32.f32 \t\\{$r, $g, $b, $a\\}, "			defm TEX_UNIFIED_2D_ARRAY_U32_F32_GRAD
	"[$t, \\{$l, $x, $y, $y\\}], \\{$gradx0, $gradx1\\}, "			: TEX_UNIFIED_2D_ARRAY_GRAD<"tex.grad.a2d.v4.u32.f32",
	"\\{$grady0, $grady1\\};",			Int32Regs, Float32Regs>;
	[]>;
				class TEX_UNIFIED_3D_base<string inst, NVPTXRegClass outtype,
	def TEX_UNIFIED_3D_F32_S32			NVPTXRegClass intype, dag tex>
	: NVPTXInst<(outs Float32Regs:$r, Float32Regs:$g,			: NVPTXInst<(outs outtype:$r, outtype:$g,
	Float32Regs:$b, Float32Regs:$a),			outtype:$b, outtype:$a),
	(ins Int64Regs:$t, Int32Regs:$x, Int32Regs:$y,			!con(tex, (ins intype:$x, intype:$y, intype:$z)),
	Int32Regs:$z),			inst # " \t\\{$r, $g, $b, $a\\}, [$t, \\{$x, $y, $z, $z\\}];",
	"tex.3d.v4.f32.s32 \t\\{$r, $g, $b, $a\\}, "			[]>;
	"[$t, \\{$x, $y, $z, $z\\}];",			multiclass TEX_UNIFIED_3D<string inst, NVPTXRegClass outtype,
	[]>;			NVPTXRegClass intype> {
	def TEX_UNIFIED_3D_F32_F32			def _R : TEX_UNIFIED_3D_base<inst, outtype, intype, (ins Int64Regs:$t)>;
	: NVPTXInst<(outs Float32Regs:$r, Float32Regs:$g,			def _I : TEX_UNIFIED_3D_base<inst, outtype, intype, (ins i64imm:$t)>;
	Float32Regs:$b, Float32Regs:$a),			}
	(ins Int64Regs:$t, Float32Regs:$x, Float32Regs:$y,
	Float32Regs:$z),			defm TEX_UNIFIED_3D_F32_S32
	"tex.3d.v4.f32.f32 \t\\{$r, $g, $b, $a\\}, "			: TEX_UNIFIED_3D<"tex.3d.v4.f32.s32", Float32Regs, Int32Regs>;
	"[$t, \\{$x, $y, $z, $z\\}];",			defm TEX_UNIFIED_3D_F32_F32
	[]>;			: TEX_UNIFIED_3D<"tex.3d.v4.f32.f32", Float32Regs, Float32Regs>;
	def TEX_UNIFIED_3D_F32_F32_LEVEL			defm TEX_UNIFIED_3D_S32_S32
	: NVPTXInst<(outs Float32Regs:$r, Float32Regs:$g,			: TEX_UNIFIED_3D<"tex.3d.v4.s32.s32", Int32Regs, Int32Regs>;
	Float32Regs:$b, Float32Regs:$a),			defm TEX_UNIFIED_3D_S32_F32
	(ins Int64Regs:$t, Float32Regs:$x, Float32Regs:$y,			: TEX_UNIFIED_3D<"tex.3d.v4.s32.f32", Int32Regs, Float32Regs>;
	Float32Regs:$z, Float32Regs:$lod),			defm TEX_UNIFIED_3D_U32_S32
	"tex.level.3d.v4.f32.f32 \t\\{$r, $g, $b, $a\\}, "			: TEX_UNIFIED_3D<"tex.3d.v4.u32.s32", Int32Regs, Int32Regs>;
	"[$t, \\{$x, $y, $z, $z\\}], $lod;",			defm TEX_UNIFIED_3D_U32_F32
	[]>;			: TEX_UNIFIED_3D<"tex.3d.v4.u32.f32", Int32Regs, Float32Regs>;
	def TEX_UNIFIED_3D_F32_F32_GRAD
	: NVPTXInst<(outs Float32Regs:$r, Float32Regs:$g,			class TEX_UNIFIED_3D_LEVEL_base<string inst, NVPTXRegClass outtype,
	Float32Regs:$b, Float32Regs:$a),			NVPTXRegClass intype, dag tex>
	(ins Int64Regs:$t, Float32Regs:$x, Float32Regs:$y,			: NVPTXInst<(outs outtype:$r, outtype:$g,
	Float32Regs:$z,			outtype:$b, outtype:$a),
	Float32Regs:$gradx0, Float32Regs:$gradx1,			!con(tex, (ins intype:$x, intype:$y, intype:$z, intype:$lod)),
	Float32Regs:$gradx2, Float32Regs:$grady0,			inst # " \t\\{$r, $g, $b, $a\\},"
	Float32Regs:$grady1, Float32Regs:$grady2),
	"tex.grad.3d.v4.f32.f32 \t\\{$r, $g, $b, $a\\}, "
	"[$t, \\{$x, $y, $z, $z\\}], "
	"\\{$gradx0, $gradx1, $gradx2, $gradx2\\}, "
	"\\{$grady0, $grady1, $grady2, $grady2\\};",
	[]>;
	def TEX_UNIFIED_3D_S32_S32
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g,
	Int32Regs:$b, Int32Regs:$a),
	(ins Int64Regs:$t, Int32Regs:$x, Int32Regs:$y,
	Int32Regs:$z),
	"tex.3d.v4.s32.s32 \t\\{$r, $g, $b, $a\\}, "
	"[$t, \\{$x, $y, $z, $z\\}];",
	[]>;
	def TEX_UNIFIED_3D_S32_F32
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g,
	Int32Regs:$b, Int32Regs:$a),
	(ins Int64Regs:$t, Float32Regs:$x, Float32Regs:$y,
	Float32Regs:$z),
	"tex.3d.v4.s32.f32 \t\\{$r, $g, $b, $a\\}, "
	"[$t, \\{$x, $y, $z, $z\\}];",
	[]>;
	def TEX_UNIFIED_3D_S32_F32_LEVEL
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g,
	Int32Regs:$b, Int32Regs:$a),
	(ins Int64Regs:$t, Float32Regs:$x, Float32Regs:$y,
	Float32Regs:$z, Float32Regs:$lod),
	"tex.level.3d.v4.s32.f32 \t\\{$r, $g, $b, $a\\}, "
	"[$t, \\{$x, $y, $z, $z\\}], $lod;",
	[]>;
	def TEX_UNIFIED_3D_S32_F32_GRAD
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g,
	Int32Regs:$b, Int32Regs:$a),
	(ins Int64Regs:$t, Float32Regs:$x, Float32Regs:$y,
	Float32Regs:$z,
	Float32Regs:$gradx0, Float32Regs:$gradx1,
	Float32Regs:$gradx2, Float32Regs:$grady0,
	Float32Regs:$grady1, Float32Regs:$grady2),
	"tex.grad.3d.v4.s32.f32 \t\\{$r, $g, $b, $a\\}, "
	"[$t, \\{$x, $y, $z, $z\\}], "
	"\\{$gradx0, $gradx1, $gradx2, $gradx2\\}, "
	"\\{$grady0, $grady1, $grady2, $grady2\\};",
	[]>;
	def TEX_UNIFIED_3D_U32_S32
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g,
	Int32Regs:$b, Int32Regs:$a),
	(ins Int64Regs:$t, Int32Regs:$x, Int32Regs:$y,
	Int32Regs:$z),
	"tex.3d.v4.u32.s32 \t\\{$r, $g, $b, $a\\}, "
	"[$t, \\{$x, $y, $z, $z\\}];",
	[]>;
	def TEX_UNIFIED_3D_U32_F32
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g,
	Int32Regs:$b, Int32Regs:$a),
	(ins Int64Regs:$t, Float32Regs:$x, Float32Regs:$y,
	Float32Regs:$z),
	"tex.3d.v4.u32.f32 \t\\{$r, $g, $b, $a\\}, "
	"[$t, \\{$x, $y, $z, $z\\}];",
	[]>;
	def TEX_UNIFIED_3D_U32_F32_LEVEL
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g,
	Int32Regs:$b, Int32Regs:$a),
	(ins Int64Regs:$t, Float32Regs:$x, Float32Regs:$y,
	Float32Regs:$z, Float32Regs:$lod),
	"tex.level.3d.v4.u32.f32 \t\\{$r, $g, $b, $a\\}, "
	"[$t, \\{$x, $y, $z, $z\\}], $lod;",			" [$t, \\{$x, $y, $z, $z\\}], $lod;",
	[]>;			[]>;
	def TEX_UNIFIED_3D_U32_F32_GRAD			multiclass TEX_UNIFIED_3D_LEVEL<string inst, NVPTXRegClass outtype,
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g,			NVPTXRegClass intype> {
	Int32Regs:$b, Int32Regs:$a),			def _R : TEX_UNIFIED_3D_LEVEL_base<inst, outtype, intype, (ins Int64Regs:$t)>;
	(ins Int64Regs:$t, Float32Regs:$x, Float32Regs:$y,			def _I : TEX_UNIFIED_3D_LEVEL_base<inst, outtype, intype, (ins i64imm:$t)>;
	Float32Regs:$z,			}
	Float32Regs:$gradx0, Float32Regs:$gradx1,
	Float32Regs:$gradx2, Float32Regs:$grady0,			defm TEX_UNIFIED_3D_F32_F32_LEVEL
	Float32Regs:$grady1, Float32Regs:$grady2),			: TEX_UNIFIED_3D_LEVEL<"tex.level.3d.v4.f32.f32", Float32Regs, Float32Regs>;
	"tex.grad.3d.v4.u32.f32 \t\\{$r, $g, $b, $a\\}, "			defm TEX_UNIFIED_3D_S32_F32_LEVEL
	"[$t, \\{$x, $y, $z, $z\\}], "			: TEX_UNIFIED_3D_LEVEL<"tex.level.3d.v4.s32.f32", Int32Regs, Float32Regs>;
				defm TEX_UNIFIED_3D_U32_F32_LEVEL
				: TEX_UNIFIED_3D_LEVEL<"tex.level.3d.v4.u32.f32", Int32Regs, Float32Regs>;

				class TEX_UNIFIED_3D_GRAD_base<string inst, NVPTXRegClass outtype,
				NVPTXRegClass intype, dag tex>
				: NVPTXInst<(outs outtype:$r, outtype:$g,
				outtype:$b, outtype:$a),
				!con(tex, (ins intype:$x, intype:$y, intype:$z,
				intype:$gradx0, intype:$gradx1,
				intype:$gradx2, intype:$grady0,
				intype:$grady1, intype:$grady2)),
				inst # " \t\\{$r, $g, $b, $a\\}, [$t, \\{$x, $y, $z, $z\\}],"
	"\\{$gradx0, $gradx1, $gradx2, $gradx2\\}, "			" \\{$gradx0, $gradx1, $gradx2, $gradx2\\},"
	"\\{$grady0, $grady1, $grady2, $grady2\\};",			" \\{$grady0, $grady1, $grady2, $grady2\\};",
	[]>;			[]>;
				multiclass TEX_UNIFIED_3D_GRAD<string inst, NVPTXRegClass outtype,
	def TEX_UNIFIED_CUBE_F32_F32			NVPTXRegClass intype> {
	: NVPTXInst<(outs Float32Regs:$r, Float32Regs:$g,			def _R : TEX_UNIFIED_3D_GRAD_base<inst, outtype, intype, (ins Int64Regs:$t)>;
	Float32Regs:$b, Float32Regs:$a),			def _I : TEX_UNIFIED_3D_GRAD_base<inst, outtype, intype, (ins i64imm:$t)>;
	(ins Int64Regs:$t,			}
	Float32Regs:$x, Float32Regs:$y, Float32Regs:$z),
	"tex.cube.v4.f32.f32 \t\\{$r, $g, $b, $a\\}, "			defm TEX_UNIFIED_3D_F32_F32_GRAD
	"[$t, \\{$x, $y, $z, $z\\}];",			: TEX_UNIFIED_3D_GRAD<"tex.grad.3d.v4.f32.f32", Float32Regs, Float32Regs>;
	[]>;			defm TEX_UNIFIED_3D_S32_F32_GRAD
	def TEX_UNIFIED_CUBE_F32_F32_LEVEL			: TEX_UNIFIED_3D_GRAD<"tex.grad.3d.v4.s32.f32", Int32Regs, Float32Regs>;
	: NVPTXInst<(outs Float32Regs:$r, Float32Regs:$g,			defm TEX_UNIFIED_3D_U32_F32_GRAD
	Float32Regs:$b, Float32Regs:$a),			: TEX_UNIFIED_3D_GRAD<"tex.grad.3d.v4.u32.f32", Int32Regs, Float32Regs>;
	(ins Int64Regs:$t,
	Float32Regs:$x, Float32Regs:$y, Float32Regs:$z,			class TEX_UNIFIED_CUBE_base<string inst, NVPTXRegClass outtype,
	Float32Regs:$lod),			NVPTXRegClass intype, dag tex>
	"tex.level.cube.v4.f32.f32 \t\\{$r, $g, $b, $a\\}, "			: NVPTXInst<(outs outtype:$r, outtype:$g,
	"[$t, \\{$x, $y, $z, $z\\}], $lod;",			outtype:$b, outtype:$a),
	[]>;			!con(tex, (ins intype:$x, intype:$y, intype:$z)),
	def TEX_UNIFIED_CUBE_S32_F32			inst # " \t\\{$r, $g, $b, $a\\}, [$t, \\{$x, $y, $z, $z\\}];",
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g,			[]>;
	Int32Regs:$b, Int32Regs:$a),			multiclass TEX_UNIFIED_CUBE<string inst, NVPTXRegClass outtype,
	(ins Int64Regs:$t,			NVPTXRegClass intype> {
	Float32Regs:$x, Float32Regs:$y, Float32Regs:$z),			def _R : TEX_UNIFIED_CUBE_base<inst, outtype, intype, (ins Int64Regs:$t)>;
	"tex.cube.v4.s32.f32 \t\\{$r, $g, $b, $a\\}, "			def _I : TEX_UNIFIED_CUBE_base<inst, outtype, intype, (ins i64imm:$t)>;
	"[$t, \\{$x, $y, $z, $z\\}];",			}
	[]>;
	def TEX_UNIFIED_CUBE_S32_F32_LEVEL			defm TEX_UNIFIED_CUBE_F32_F32
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g,			: TEX_UNIFIED_CUBE<"tex.cube.v4.f32.f32", Float32Regs, Float32Regs>;
	Int32Regs:$b, Int32Regs:$a),			defm TEX_UNIFIED_CUBE_S32_F32
	(ins Int64Regs:$t,			: TEX_UNIFIED_CUBE<"tex.cube.v4.s32.f32", Int32Regs, Float32Regs>;
	Float32Regs:$x, Float32Regs:$y, Float32Regs:$z,			defm TEX_UNIFIED_CUBE_U32_F32
	Float32Regs:$lod),			: TEX_UNIFIED_CUBE<"tex.cube.v4.u32.f32", Int32Regs, Float32Regs>;
	"tex.level.cube.v4.s32.f32 \t\\{$r, $g, $b, $a\\}, "
	"[$t, \\{$x, $y, $z, $z\\}], $lod;",			class TEX_UNIFIED_CUBE_LEVEL_base<string inst, NVPTXRegClass outtype,
	[]>;			NVPTXRegClass intype, dag tex>
	def TEX_UNIFIED_CUBE_U32_F32			: NVPTXInst<(outs outtype:$r, outtype:$g,
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g,			outtype:$b, outtype:$a),
	Int32Regs:$b, Int32Regs:$a),			!con(tex, (ins intype:$x, intype:$y, intype:$z, intype:$lod)),
	(ins Int64Regs:$t,			inst # " \t\\{$r, $g, $b, $a\\},"
	Float32Regs:$x, Float32Regs:$y, Float32Regs:$z),
	"tex.cube.v4.u32.f32 \t\\{$r, $g, $b, $a\\}, "
	"[$t, \\{$x, $y, $z, $z\\}];",
	[]>;
	def TEX_UNIFIED_CUBE_U32_F32_LEVEL
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g,
	Int32Regs:$b, Int32Regs:$a),
	(ins Int64Regs:$t,
	Float32Regs:$x, Float32Regs:$y, Float32Regs:$z,
	Float32Regs:$lod),
	"tex.level.cube.v4.u32.f32 \t\\{$r, $g, $b, $a\\}, "
	"[$t, \\{$x, $y, $z, $z\\}], $lod;",			" [$t, \\{$x, $y, $z, $z\\}], $lod;",
	[]>;			[]>;
				multiclass TEX_UNIFIED_CUBE_LEVEL<string inst, NVPTXRegClass outtype,
	def TEX_UNIFIED_CUBE_ARRAY_F32_F32			NVPTXRegClass intype> {
	: NVPTXInst<(outs Float32Regs:$r, Float32Regs:$g,			def _R : TEX_UNIFIED_CUBE_LEVEL_base<inst, outtype, intype,
	Float32Regs:$b, Float32Regs:$a),			(ins Int64Regs:$t)>;
	(ins Int64Regs:$t, Int32Regs:$l,			def _I : TEX_UNIFIED_CUBE_LEVEL_base<inst, outtype, intype,
	Float32Regs:$x, Float32Regs:$y, Float32Regs:$z),			(ins i64imm:$t)>;
	"tex.acube.v4.f32.f32 \t\\{$r, $g, $b, $a\\}, "			}
	"[$t, \\{$l, $x, $y, $z\\}];",
	[]>;			defm TEX_UNIFIED_CUBE_F32_F32_LEVEL
	def TEX_UNIFIED_CUBE_ARRAY_F32_F32_LEVEL			: TEX_UNIFIED_CUBE_LEVEL<"tex.level.cube.v4.f32.f32",
	: NVPTXInst<(outs Float32Regs:$r, Float32Regs:$g,			Float32Regs, Float32Regs>;
	Float32Regs:$b, Float32Regs:$a),			defm TEX_UNIFIED_CUBE_S32_F32_LEVEL
	(ins Int64Regs:$t, Int32Regs:$l,			: TEX_UNIFIED_CUBE_LEVEL<"tex.level.cube.v4.s32.f32",
	Float32Regs:$x, Float32Regs:$y, Float32Regs:$z,			Int32Regs, Float32Regs>;
	Float32Regs:$lod),			defm TEX_UNIFIED_CUBE_U32_F32_LEVEL
	"tex.level.acube.v4.f32.f32 \t\\{$r, $g, $b, $a\\}, "			: TEX_UNIFIED_CUBE_LEVEL<"tex.level.cube.v4.u32.f32",
	"[$t, \\{$l, $x, $y, $z\\}], $lod;",			Int32Regs, Float32Regs>;
	[]>;
	def TEX_UNIFIED_CUBE_ARRAY_S32_F32			class TEX_UNIFIED_CUBE_ARRAY_base<string inst, NVPTXRegClass outtype,
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g,			NVPTXRegClass intype, dag tex>
	Int32Regs:$b, Int32Regs:$a),			: NVPTXInst<(outs outtype:$r, outtype:$g,
	(ins Int64Regs:$t, Int32Regs:$l,			outtype:$b, outtype:$a),
	Float32Regs:$x, Float32Regs:$y, Float32Regs:$z),			!con(tex, (ins Int32Regs:$l, intype:$x, intype:$y, intype:$z)),
	"tex.acube.v4.s32.f32 \t\\{$r, $g, $b, $a\\}, "			inst # " \t\\{$r, $g, $b, $a\\}, [$t, \\{$l, $x, $y, $z\\}];",
	"[$t, \\{$l, $x, $y, $z\\}];",			[]>;
	[]>;			multiclass TEX_UNIFIED_CUBE_ARRAY<string inst, NVPTXRegClass outtype,
	def TEX_UNIFIED_CUBE_ARRAY_S32_F32_LEVEL			NVPTXRegClass intype> {
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g,			def _R : TEX_UNIFIED_CUBE_ARRAY_base<inst, outtype, intype,
	Int32Regs:$b, Int32Regs:$a),			(ins Int64Regs:$t)>;
	(ins Int64Regs:$t, Int32Regs:$l,			def _I : TEX_UNIFIED_CUBE_ARRAY_base<inst, outtype, intype,
	Float32Regs:$x, Float32Regs:$y, Float32Regs:$z,			(ins i64imm:$t)>;
	Float32Regs:$lod),			}
	"tex.level.acube.v4.s32.f32 \t\\{$r, $g, $b, $a\\}, "
	"[$t, \\{$l, $x, $y, $z\\}], $lod;",			defm TEX_UNIFIED_CUBE_ARRAY_F32_F32
	[]>;			: TEX_UNIFIED_CUBE_ARRAY<"tex.acube.v4.f32.f32", Float32Regs, Float32Regs>;
	def TEX_UNIFIED_CUBE_ARRAY_U32_F32			defm TEX_UNIFIED_CUBE_ARRAY_S32_F32
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g,			: TEX_UNIFIED_CUBE_ARRAY<"tex.acube.v4.s32.f32", Int32Regs, Float32Regs>;
	Int32Regs:$b, Int32Regs:$a),			defm TEX_UNIFIED_CUBE_ARRAY_U32_F32
	(ins Int64Regs:$t, Int32Regs:$l,			: TEX_UNIFIED_CUBE_ARRAY<"tex.acube.v4.u32.f32", Int32Regs, Float32Regs>;
	Float32Regs:$x, Float32Regs:$y, Float32Regs:$z),
	"tex.acube.v4.u32.f32 \t\\{$r, $g, $b, $a\\}, "			class TEX_UNIFIED_CUBE_ARRAY_LEVEL_base<string inst, NVPTXRegClass outtype,
	"[$t, \\{$l, $x, $y, $z\\}];",			NVPTXRegClass intype, dag tex>
	[]>;			: NVPTXInst<(outs outtype:$r, outtype:$g,
	def TEX_UNIFIED_CUBE_ARRAY_U32_F32_LEVEL			outtype:$b, outtype:$a),
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g,			!con(tex, (ins Int32Regs:$l, intype:$x, intype:$y, intype:$z,
	Int32Regs:$b, Int32Regs:$a),			intype:$lod)),
	(ins Int64Regs:$t, Int32Regs:$l,			inst # " \t\\{$r, $g, $b, $a\\},"
	Float32Regs:$x, Float32Regs:$y, Float32Regs:$z,
	Float32Regs:$lod),
	"tex.level.acube.v4.u32.f32 \t\\{$r, $g, $b, $a\\}, "
	"[$t, \\{$l, $x, $y, $z\\}], $lod;",			" [$t, \\{$l, $x, $y, $z\\}], $lod;",
	[]>;			[]>;
				multiclass TEX_UNIFIED_CUBE_ARRAY_LEVEL<string inst, NVPTXRegClass outtype,
				NVPTXRegClass intype> {
				def _R : TEX_UNIFIED_CUBE_ARRAY_LEVEL_base<inst, outtype, intype,
				(ins Int64Regs:$t)>;
				def _I : TEX_UNIFIED_CUBE_ARRAY_LEVEL_base<inst, outtype, intype,
				(ins i64imm:$t)>;
				}

				defm TEX_UNIFIED_CUBE_ARRAY_F32_F32_LEVEL
				: TEX_UNIFIED_CUBE_ARRAY_LEVEL<"tex.level.acube.v4.f32.f32",
				Float32Regs, Float32Regs>;
				defm TEX_UNIFIED_CUBE_ARRAY_S32_F32_LEVEL
				: TEX_UNIFIED_CUBE_ARRAY_LEVEL<"tex.level.acube.v4.s32.f32",
				Int32Regs, Float32Regs>;
				defm TEX_UNIFIED_CUBE_ARRAY_U32_F32_LEVEL
				: TEX_UNIFIED_CUBE_ARRAY_LEVEL<"tex.level.acube.v4.u32.f32",
				Int32Regs, Float32Regs>;

				class TLD4_UNIFIED_2D_base<string inst, NVPTXRegClass outtype,
				NVPTXRegClass intype, dag tex>
				: NVPTXInst<(outs outtype:$v0, outtype:$v1,
				outtype:$v2, outtype:$v3),
				!con(tex, (ins intype:$x, intype:$y)),
				inst # " \t\\{$v0, $v1, $v2, $v3\\}, [$t, \\{$x, $y\\}];",
				[]>;
				multiclass TLD4_UNIFIED_2D<string inst, NVPTXRegClass outtype,
				NVPTXRegClass intype> {
				def _R : TLD4_UNIFIED_2D_base<inst, outtype, intype, (ins Int64Regs:$t)>;
				def _I : TLD4_UNIFIED_2D_base<inst, outtype, intype, (ins i64imm:$t)>;
				}

				defm TLD4_UNIFIED_R_2D_F32_F32
				: TLD4_UNIFIED_2D<"tld4.r.2d.v4.f32.f32", Float32Regs, Float32Regs>;
				defm TLD4_UNIFIED_G_2D_F32_F32
				: TLD4_UNIFIED_2D<"tld4.g.2d.v4.f32.f32", Float32Regs, Float32Regs>;
				defm TLD4_UNIFIED_B_2D_F32_F32
				: TLD4_UNIFIED_2D<"tld4.b.2d.v4.f32.f32", Float32Regs, Float32Regs>;
				defm TLD4_UNIFIED_A_2D_F32_F32
				: TLD4_UNIFIED_2D<"tld4.a.2d.v4.f32.f32", Float32Regs, Float32Regs>;

				defm TLD4_UNIFIED_R_2D_S32_F32
				: TLD4_UNIFIED_2D<"tld4.r.2d.v4.s32.f32", Int32Regs, Float32Regs>;
				defm TLD4_UNIFIED_G_2D_S32_F32
				: TLD4_UNIFIED_2D<"tld4.g.2d.v4.s32.f32", Int32Regs, Float32Regs>;
				defm TLD4_UNIFIED_B_2D_S32_F32
				: TLD4_UNIFIED_2D<"tld4.b.2d.v4.s32.f32", Int32Regs, Float32Regs>;
				defm TLD4_UNIFIED_A_2D_S32_F32
				: TLD4_UNIFIED_2D<"tld4.a.2d.v4.s32.f32", Int32Regs, Float32Regs>;

				defm TLD4_UNIFIED_R_2D_U32_F32
				: TLD4_UNIFIED_2D<"tld4.r.2d.v4.u32.f32", Int32Regs, Float32Regs>;
				defm TLD4_UNIFIED_G_2D_U32_F32
				: TLD4_UNIFIED_2D<"tld4.g.2d.v4.u32.f32", Int32Regs, Float32Regs>;
				defm TLD4_UNIFIED_B_2D_U32_F32
				: TLD4_UNIFIED_2D<"tld4.b.2d.v4.u32.f32", Int32Regs, Float32Regs>;
				defm TLD4_UNIFIED_A_2D_U32_F32
				: TLD4_UNIFIED_2D<"tld4.a.2d.v4.u32.f32", Int32Regs, Float32Regs>;

	def TLD4_UNIFIED_R_2D_F32_F32
	: NVPTXInst<(outs Float32Regs:$v0, Float32Regs:$v1,
	Float32Regs:$v2, Float32Regs:$v3),
	(ins Int64Regs:$t, Float32Regs:$x, Float32Regs:$y),
	"tld4.r.2d.v4.f32.f32 \t\\{$v0, $v1, $v2, $v3\\}, "
	"[$t, \\{$x, $y\\}];",
	[]>;
	def TLD4_UNIFIED_G_2D_F32_F32
	: NVPTXInst<(outs Float32Regs:$v0, Float32Regs:$v1,
	Float32Regs:$v2, Float32Regs:$v3),
	(ins Int64Regs:$t, Float32Regs:$x, Float32Regs:$y),
	"tld4.g.2d.v4.f32.f32 \t\\{$v0, $v1, $v2, $v3\\}, "
	"[$t, \\{$x, $y\\}];",
	[]>;
	def TLD4_UNIFIED_B_2D_F32_F32
	: NVPTXInst<(outs Float32Regs:$v0, Float32Regs:$v1,
	Float32Regs:$v2, Float32Regs:$v3),
	(ins Int64Regs:$t, Float32Regs:$x, Float32Regs:$y),
	"tld4.b.2d.v4.f32.f32 \t\\{$v0, $v1, $v2, $v3\\}, "
	"[$t, \\{$x, $y\\}];",
	[]>;
	def TLD4_UNIFIED_A_2D_F32_F32
	: NVPTXInst<(outs Float32Regs:$v0, Float32Regs:$v1,
	Float32Regs:$v2, Float32Regs:$v3),
	(ins Int64Regs:$t, Float32Regs:$x, Float32Regs:$y),
	"tld4.a.2d.v4.f32.f32 \t\\{$v0, $v1, $v2, $v3\\}, "
	"[$t, \\{$x, $y\\}];",
	[]>;
	def TLD4_UNIFIED_R_2D_S32_F32
	: NVPTXInst<(outs Int32Regs:$v0, Int32Regs:$v1,
	Int32Regs:$v2, Int32Regs:$v3),
	(ins Int64Regs:$t, Float32Regs:$x, Float32Regs:$y),
	"tld4.r.2d.v4.s32.f32 \t\\{$v0, $v1, $v2, $v3\\}, "
	"[$t, \\{$x, $y\\}];",
	[]>;
	def TLD4_UNIFIED_G_2D_S32_F32
	: NVPTXInst<(outs Int32Regs:$v0, Int32Regs:$v1,
	Int32Regs:$v2, Int32Regs:$v3),
	(ins Int64Regs:$t, Float32Regs:$x, Float32Regs:$y),
	"tld4.g.2d.v4.s32.f32 \t\\{$v0, $v1, $v2, $v3\\}, "
	"[$t, \\{$x, $y\\}];",
	[]>;
	def TLD4_UNIFIED_B_2D_S32_F32
	: NVPTXInst<(outs Int32Regs:$v0, Int32Regs:$v1,
	Int32Regs:$v2, Int32Regs:$v3),
	(ins Int64Regs:$t, Float32Regs:$x, Float32Regs:$y),
	"tld4.b.2d.v4.s32.f32 \t\\{$v0, $v1, $v2, $v3\\}, "
	"[$t, \\{$x, $y\\}];",
	[]>;
	def TLD4_UNIFIED_A_2D_S32_F32
	: NVPTXInst<(outs Int32Regs:$v0, Int32Regs:$v1,
	Int32Regs:$v2, Int32Regs:$v3),
	(ins Int64Regs:$t, Float32Regs:$x, Float32Regs:$y),
	"tld4.a.2d.v4.s32.f32 \t\\{$v0, $v1, $v2, $v3\\}, "
	"[$t, \\{$x, $y\\}];",
	[]>;
	def TLD4_UNIFIED_R_2D_U32_F32
	: NVPTXInst<(outs Int32Regs:$v0, Int32Regs:$v1,
	Int32Regs:$v2, Int32Regs:$v3),
	(ins Int64Regs:$t, Float32Regs:$x, Float32Regs:$y),
	"tld4.r.2d.v4.u32.f32 \t\\{$v0, $v1, $v2, $v3\\}, "
	"[$t, \\{$x, $y\\}];",
	[]>;
	def TLD4_UNIFIED_G_2D_U32_F32
	: NVPTXInst<(outs Int32Regs:$v0, Int32Regs:$v1,
	Int32Regs:$v2, Int32Regs:$v3),
	(ins Int64Regs:$t, Float32Regs:$x, Float32Regs:$y),
	"tld4.g.2d.v4.u32.f32 \t\\{$v0, $v1, $v2, $v3\\}, "
	"[$t, \\{$x, $y\\}];",
	[]>;
	def TLD4_UNIFIED_B_2D_U32_F32
	: NVPTXInst<(outs Int32Regs:$v0, Int32Regs:$v1,
	Int32Regs:$v2, Int32Regs:$v3),
	(ins Int64Regs:$t, Float32Regs:$x, Float32Regs:$y),
	"tld4.b.2d.v4.u32.f32 \t\\{$v0, $v1, $v2, $v3\\}, "
	"[$t, \\{$x, $y\\}];",
	[]>;
	def TLD4_UNIFIED_A_2D_U32_F32
	: NVPTXInst<(outs Int32Regs:$v0, Int32Regs:$v1,
	Int32Regs:$v2, Int32Regs:$v3),
	(ins Int64Regs:$t, Float32Regs:$x, Float32Regs:$y),
	"tld4.a.2d.v4.u32.f32 \t\\{$v0, $v1, $v2, $v3\\}, "
	"[$t, \\{$x, $y\\}];",
	[]>;
	}			}



	//=== Surface load instructions			//=== Surface load instructions
	// .clamp variant
	let IsSuld = true in {			let IsSuld = true in {
	def SULD_1D_I8_CLAMP
	: NVPTXInst<(outs Int16Regs:$r),
	(ins Int64Regs:$s, Int32Regs:$x),
	"suld.b.1d.b8.clamp \\{$r\\}, [$s, \\{$x\\}];",
	[]>;
	def SULD_1D_I16_CLAMP
	: NVPTXInst<(outs Int16Regs:$r),
	(ins Int64Regs:$s, Int32Regs:$x),
	"suld.b.1d.b16.clamp \\{$r\\}, [$s, \\{$x\\}];",
	[]>;
	def SULD_1D_I32_CLAMP
	: NVPTXInst<(outs Int32Regs:$r),
	(ins Int64Regs:$s, Int32Regs:$x),
	"suld.b.1d.b32.clamp \\{$r\\}, [$s, \\{$x\\}];",
	[]>;
	def SULD_1D_I64_CLAMP
	: NVPTXInst<(outs Int64Regs:$r),
	(ins Int64Regs:$s, Int32Regs:$x),
	"suld.b.1d.b64.clamp \\{$r\\}, [$s, \\{$x\\}];",
	[]>;

	def SULD_1D_ARRAY_I8_CLAMP
	: NVPTXInst<(outs Int16Regs:$r),
	(ins Int64Regs:$s, Int32Regs:$l, Int32Regs:$x),
	"suld.b.a1d.b8.clamp \\{$r\\}, [$s, \\{$l, $x\\}];",
	[]>;
	def SULD_1D_ARRAY_I16_CLAMP
	: NVPTXInst<(outs Int16Regs:$r),
	(ins Int64Regs:$s, Int32Regs:$l, Int32Regs:$x),
	"suld.b.a1d.b16.clamp \\{$r\\}, [$s, \\{$l, $x\\}];",
	[]>;
	def SULD_1D_ARRAY_I32_CLAMP
	: NVPTXInst<(outs Int32Regs:$r),
	(ins Int64Regs:$s, Int32Regs:$l, Int32Regs:$x),
	"suld.b.a1d.b32.clamp \\{$r\\}, [$s, \\{$l, $x\\}];",
	[]>;
	def SULD_1D_ARRAY_I64_CLAMP
	: NVPTXInst<(outs Int64Regs:$r),
	(ins Int64Regs:$s, Int32Regs:$l, Int32Regs:$x),
	"suld.b.a1d.b64.clamp \\{$r\\}, [$s, \\{$l, $x\\}];",
	[]>;

	def SULD_2D_I8_CLAMP
	: NVPTXInst<(outs Int16Regs:$r),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y),
	"suld.b.2d.b8.clamp \\{$r\\}, [$s, \\{$x, $y\\}];",
	[]>;
	def SULD_2D_I16_CLAMP
	: NVPTXInst<(outs Int16Regs:$r),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y),
	"suld.b.2d.b16.clamp \\{$r\\}, [$s, \\{$x, $y\\}];",
	[]>;
	def SULD_2D_I32_CLAMP
	: NVPTXInst<(outs Int32Regs:$r),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y),
	"suld.b.2d.b32.clamp \\{$r\\}, [$s, \\{$x, $y\\}];",
	[]>;
	def SULD_2D_I64_CLAMP
	: NVPTXInst<(outs Int64Regs:$r),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y),
	"suld.b.2d.b64.clamp \\{$r\\}, [$s, \\{$x, $y\\}];",
	[]>;

	def SULD_2D_ARRAY_I8_CLAMP
	: NVPTXInst<(outs Int16Regs:$r),
	(ins Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y),
	"suld.b.a2d.b8.clamp \\{$r\\}, [$s, \\{$l, $x, $y, $y\\}];",
	[]>;
	def SULD_2D_ARRAY_I16_CLAMP
	: NVPTXInst<(outs Int16Regs:$r),
	(ins Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y),
	"suld.b.a2d.b16.clamp \\{$r\\}, [$s, \\{$l, $x, $y, $y\\}];",
	[]>;
	def SULD_2D_ARRAY_I32_CLAMP
	: NVPTXInst<(outs Int32Regs:$r),
	(ins Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y),
	"suld.b.a2d.b32.clamp \\{$r\\}, [$s, \\{$l, $x, $y, $y\\}];",
	[]>;
	def SULD_2D_ARRAY_I64_CLAMP
	: NVPTXInst<(outs Int64Regs:$r),
	(ins Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y),
	"suld.b.a2d.b64.clamp \\{$r\\}, [$s, \\{$l, $x, $y, $y\\}];",
	[]>;

	def SULD_3D_I8_CLAMP
	: NVPTXInst<(outs Int16Regs:$r),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z),
	"suld.b.3d.b8.clamp \\{$r\\}, [$s, \\{$x, $y, $z, $z\\}];",
	[]>;
	def SULD_3D_I16_CLAMP
	: NVPTXInst<(outs Int16Regs:$r),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z),
	"suld.b.3d.b16.clamp \\{$r\\}, [$s, \\{$x, $y, $z, $z\\}];",
	[]>;
	def SULD_3D_I32_CLAMP
	: NVPTXInst<(outs Int32Regs:$r),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z),
	"suld.b.3d.b32.clamp \\{$r\\}, [$s, \\{$x, $y, $z, $z\\}];",
	[]>;
	def SULD_3D_I64_CLAMP
	: NVPTXInst<(outs Int64Regs:$r),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z),
	"suld.b.3d.b64.clamp \\{$r\\}, [$s, \\{$x, $y, $z, $z\\}];",
	[]>;
	}

	let IsSuld = 2 in {			class SULD_1D_base<string inst, NVPTXRegClass outtype, dag surf>
	def SULD_1D_V2I8_CLAMP			: NVPTXInst<(outs outtype:$r),
	: NVPTXInst<(outs Int16Regs:$r, Int16Regs:$g),			!con(surf, (ins Int32Regs:$x)),
	(ins Int64Regs:$s, Int32Regs:$x),			inst # " \\{$r\\}, [$s, \\{$x\\}];",
	"suld.b.1d.v2.b8.clamp \\{$r, $g\\}, [$s, \\{$x\\}];",			[]>;
	[]>;			multiclass SULD_1D<string inst, NVPTXRegClass outtype> {
	def SULD_1D_V2I16_CLAMP			def _R : SULD_1D_base<inst, outtype, (ins Int64Regs:$s)>;
	: NVPTXInst<(outs Int16Regs:$r, Int16Regs:$g),			def _I : SULD_1D_base<inst, outtype, (ins i64imm:$s)>;
	(ins Int64Regs:$s, Int32Regs:$x),			}
	"suld.b.1d.v2.b16.clamp \\{$r, $g\\}, [$s, \\{$x\\}];",
	[]>;			defm SULD_1D_I8_CLAMP : SULD_1D<"suld.b.1d.b8.clamp", Int16Regs>;
	def SULD_1D_V2I32_CLAMP			defm SULD_1D_I16_CLAMP : SULD_1D<"suld.b.1d.b16.clamp", Int16Regs>;
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g),			defm SULD_1D_I32_CLAMP : SULD_1D<"suld.b.1d.b32.clamp", Int32Regs>;
	(ins Int64Regs:$s, Int32Regs:$x),			defm SULD_1D_I64_CLAMP : SULD_1D<"suld.b.1d.b64.clamp", Int64Regs>;
	"suld.b.1d.v2.b32.clamp \\{$r, $g\\}, [$s, \\{$x\\}];",
	[]>;			defm SULD_1D_I8_TRAP : SULD_1D<"suld.b.1d.b8.trap", Int16Regs>;
	def SULD_1D_V2I64_CLAMP			defm SULD_1D_I16_TRAP : SULD_1D<"suld.b.1d.b16.trap", Int16Regs>;
	: NVPTXInst<(outs Int64Regs:$r, Int64Regs:$g),			defm SULD_1D_I32_TRAP : SULD_1D<"suld.b.1d.b32.trap", Int32Regs>;
	(ins Int64Regs:$s, Int32Regs:$x),			defm SULD_1D_I64_TRAP : SULD_1D<"suld.b.1d.b64.trap", Int64Regs>;
	"suld.b.1d.v2.b64.clamp \\{$r, $g\\}, [$s, \\{$x\\}];",
	[]>;			defm SULD_1D_I8_ZERO : SULD_1D<"suld.b.1d.b8.zero", Int16Regs>;
				defm SULD_1D_I16_ZERO : SULD_1D<"suld.b.1d.b16.zero", Int16Regs>;
	def SULD_1D_ARRAY_V2I8_CLAMP			defm SULD_1D_I32_ZERO : SULD_1D<"suld.b.1d.b32.zero", Int32Regs>;
	: NVPTXInst<(outs Int16Regs:$r, Int16Regs:$g),			defm SULD_1D_I64_ZERO : SULD_1D<"suld.b.1d.b64.zero", Int64Regs>;
	(ins Int64Regs:$s, Int32Regs:$l, Int32Regs:$x),
	"suld.b.a1d.v2.b8.clamp \\{$r, $g\\}, [$s, \\{$l, $x\\}];",			class SULD_1D_ARRAY_base<string inst, NVPTXRegClass outtype, dag surf>
	[]>;			: NVPTXInst<(outs outtype:$r),
	def SULD_1D_ARRAY_V2I16_CLAMP			!con(surf, (ins Int32Regs:$l, Int32Regs:$x)),
	: NVPTXInst<(outs Int16Regs:$r, Int16Regs:$g),			inst # " \\{$r\\}, [$s, \\{$l, $x\\}];",
	(ins Int64Regs:$s, Int32Regs:$l, Int32Regs:$x),			[]>;
	"suld.b.a1d.v2.b16.clamp \\{$r, $g\\}, [$s, \\{$l, $x\\}];",			multiclass SULD_1D_ARRAY<string inst, NVPTXRegClass outtype> {
	[]>;			def _R : SULD_1D_ARRAY_base<inst, outtype, (ins Int64Regs:$s)>;
	def SULD_1D_ARRAY_V2I32_CLAMP			def _I : SULD_1D_ARRAY_base<inst, outtype, (ins i64imm:$s)>;
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g),			}
	(ins Int64Regs:$s, Int32Regs:$l, Int32Regs:$x),
	"suld.b.a1d.v2.b32.clamp \\{$r, $g\\}, [$s, \\{$l, $x\\}];",			defm SULD_1D_ARRAY_I8_CLAMP
	[]>;			: SULD_1D_ARRAY<"suld.b.a1d.b8.clamp", Int16Regs>;
	def SULD_1D_ARRAY_V2I64_CLAMP			defm SULD_1D_ARRAY_I16_CLAMP
	: NVPTXInst<(outs Int64Regs:$r, Int64Regs:$g),			: SULD_1D_ARRAY<"suld.b.a1d.b16.clamp", Int16Regs>;
	(ins Int64Regs:$s, Int32Regs:$l, Int32Regs:$x),			defm SULD_1D_ARRAY_I32_CLAMP
	"suld.b.a1d.v2.b64.clamp \\{$r, $g\\}, [$s, \\{$l, $x\\}];",			: SULD_1D_ARRAY<"suld.b.a1d.b32.clamp", Int32Regs>;
	[]>;			defm SULD_1D_ARRAY_I64_CLAMP
				: SULD_1D_ARRAY<"suld.b.a1d.b64.clamp", Int64Regs>;
	def SULD_2D_V2I8_CLAMP
	: NVPTXInst<(outs Int16Regs:$r, Int16Regs:$g),			defm SULD_1D_ARRAY_I8_TRAP
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y),			: SULD_1D_ARRAY<"suld.b.a1d.b8.trap", Int16Regs>;
	"suld.b.2d.v2.b8.clamp \\{$r, $g\\}, [$s, \\{$x, $y\\}];",			defm SULD_1D_ARRAY_I16_TRAP
	[]>;			: SULD_1D_ARRAY<"suld.b.a1d.b16.trap", Int16Regs>;
	def SULD_2D_V2I16_CLAMP			defm SULD_1D_ARRAY_I32_TRAP
	: NVPTXInst<(outs Int16Regs:$r, Int16Regs:$g),			: SULD_1D_ARRAY<"suld.b.a1d.b32.trap", Int32Regs>;
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y),			defm SULD_1D_ARRAY_I64_TRAP
	"suld.b.2d.v2.b16.clamp \\{$r, $g\\}, [$s, \\{$x, $y\\}];",			: SULD_1D_ARRAY<"suld.b.a1d.b64.trap", Int64Regs>;
	[]>;
	def SULD_2D_V2I32_CLAMP			defm SULD_1D_ARRAY_I8_ZERO
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g),			: SULD_1D_ARRAY<"suld.b.a1d.b8.zero", Int16Regs>;
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y),			defm SULD_1D_ARRAY_I16_ZERO
	"suld.b.2d.v2.b32.clamp \\{$r, $g\\}, [$s, \\{$x, $y\\}];",			: SULD_1D_ARRAY<"suld.b.a1d.b16.zero", Int16Regs>;
	[]>;			defm SULD_1D_ARRAY_I32_ZERO
	def SULD_2D_V2I64_CLAMP			: SULD_1D_ARRAY<"suld.b.a1d.b32.zero", Int32Regs>;
	: NVPTXInst<(outs Int64Regs:$r, Int64Regs:$g),			defm SULD_1D_ARRAY_I64_ZERO
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y),			: SULD_1D_ARRAY<"suld.b.a1d.b64.zero", Int64Regs>;
	"suld.b.2d.v2.b64.clamp \\{$r, $g\\}, [$s, \\{$x, $y\\}];",
	[]>;			class SULD_2D_base<string inst, NVPTXRegClass outtype, dag surf>
				: NVPTXInst<(outs outtype:$r),
	def SULD_2D_ARRAY_V2I8_CLAMP			!con(surf, (ins Int32Regs:$x, Int32Regs:$y)),
	: NVPTXInst<(outs Int16Regs:$r, Int16Regs:$g),			inst # " \\{$r\\}, [$s, \\{$x, $y\\}];",
	(ins Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y),			[]>;
	"suld.b.a2d.v2.b8.clamp \\{$r, $g\\}, "			multiclass SULD_2D<string inst, NVPTXRegClass outtype> {
	"[$s, \\{$l, $x, $y, $y\\}];",			def _R : SULD_2D_base<inst, outtype, (ins Int64Regs:$s)>;
	[]>;			def _I : SULD_2D_base<inst, outtype, (ins i64imm:$s)>;
	def SULD_2D_ARRAY_V2I16_CLAMP			}
	: NVPTXInst<(outs Int16Regs:$r, Int16Regs:$g),
	(ins Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y),			defm SULD_2D_I8_CLAMP : SULD_2D<"suld.b.2d.b8.clamp", Int16Regs>;
	"suld.b.a2d.v2.b16.clamp \\{$r, $g\\}, "			defm SULD_2D_I16_CLAMP : SULD_2D<"suld.b.2d.b16.clamp", Int16Regs>;
	"[$s, \\{$l, $x, $y, $y\\}];",			defm SULD_2D_I32_CLAMP : SULD_2D<"suld.b.2d.b32.clamp", Int32Regs>;
	[]>;			defm SULD_2D_I64_CLAMP : SULD_2D<"suld.b.2d.b64.clamp", Int64Regs>;
	def SULD_2D_ARRAY_V2I32_CLAMP
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g),			defm SULD_2D_I8_TRAP : SULD_2D<"suld.b.2d.b8.trap", Int16Regs>;
	(ins Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y),			defm SULD_2D_I16_TRAP : SULD_2D<"suld.b.2d.b16.trap", Int16Regs>;
	"suld.b.a2d.v2.b32.clamp \\{$r, $g\\}, "			defm SULD_2D_I32_TRAP : SULD_2D<"suld.b.2d.b32.trap", Int32Regs>;
	"[$s, \\{$l, $x, $y, $y\\}];",			defm SULD_2D_I64_TRAP : SULD_2D<"suld.b.2d.b64.trap", Int64Regs>;
	[]>;
	def SULD_2D_ARRAY_V2I64_CLAMP			defm SULD_2D_I8_ZERO : SULD_2D<"suld.b.2d.b8.zero", Int16Regs>;
	: NVPTXInst<(outs Int64Regs:$r, Int64Regs:$g),			defm SULD_2D_I16_ZERO : SULD_2D<"suld.b.2d.b16.zero", Int16Regs>;
	(ins Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y),			defm SULD_2D_I32_ZERO : SULD_2D<"suld.b.2d.b32.zero", Int32Regs>;
	"suld.b.a2d.v2.b64.clamp \\{$r, $g\\}, "			defm SULD_2D_I64_ZERO : SULD_2D<"suld.b.2d.b64.zero", Int64Regs>;
	"[$s, \\{$l, $x, $y, $y\\}];",
	[]>;			class SULD_2D_ARRAY_base<string inst, NVPTXRegClass outtype, dag surf>
				: NVPTXInst<(outs outtype:$r),
	def SULD_3D_V2I8_CLAMP			!con(surf, (ins Int32Regs:$l, Int32Regs:$x, Int32Regs:$y)),
	: NVPTXInst<(outs Int16Regs:$r, Int16Regs:$g),			inst # " \\{$r\\}, [$s, \\{$l, $x, $y, $y\\}];",
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z),			[]>;
	"suld.b.3d.v2.b8.clamp \\{$r, $g\\}, [$s, \\{$x, $y, $z, $z\\}];",			multiclass SULD_2D_ARRAY<string inst, NVPTXRegClass outtype> {
	[]>;			def _R : SULD_2D_ARRAY_base<inst, outtype, (ins Int64Regs:$s)>;
	def SULD_3D_V2I16_CLAMP			def _I : SULD_2D_ARRAY_base<inst, outtype, (ins i64imm:$s)>;
	: NVPTXInst<(outs Int16Regs:$r, Int16Regs:$g),			}
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z),
	"suld.b.3d.v2.b16.clamp \\{$r, $g\\}, [$s, \\{$x, $y, $z, $z\\}];",			defm SULD_2D_ARRAY_I8_CLAMP : SULD_2D_ARRAY<"suld.b.a2d.b8.clamp", Int16Regs>;
	[]>;			defm SULD_2D_ARRAY_I16_CLAMP : SULD_2D_ARRAY<"suld.b.a2d.b16.clamp", Int16Regs>;
	def SULD_3D_V2I32_CLAMP			defm SULD_2D_ARRAY_I32_CLAMP : SULD_2D_ARRAY<"suld.b.a2d.b32.clamp", Int32Regs>;
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g),			defm SULD_2D_ARRAY_I64_CLAMP : SULD_2D_ARRAY<"suld.b.a2d.b64.clamp", Int64Regs>;
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z),
	"suld.b.3d.v2.b32.clamp \\{$r, $g\\}, [$s, \\{$x, $y, $z, $z\\}];",			defm SULD_2D_ARRAY_I8_TRAP : SULD_2D_ARRAY<"suld.b.a2d.b8.trap", Int16Regs>;
	[]>;			defm SULD_2D_ARRAY_I16_TRAP : SULD_2D_ARRAY<"suld.b.a2d.b16.trap", Int16Regs>;
	def SULD_3D_V2I64_CLAMP			defm SULD_2D_ARRAY_I32_TRAP : SULD_2D_ARRAY<"suld.b.a2d.b32.trap", Int32Regs>;
	: NVPTXInst<(outs Int64Regs:$r, Int64Regs:$g),			defm SULD_2D_ARRAY_I64_TRAP : SULD_2D_ARRAY<"suld.b.a2d.b64.trap", Int64Regs>;
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z),
	"suld.b.3d.v2.b64.clamp \\{$r, $g\\}, [$s, \\{$x, $y, $z, $z\\}];",			defm SULD_2D_ARRAY_I8_ZERO : SULD_2D_ARRAY<"suld.b.a2d.b8.zero", Int16Regs>;
	[]>;			defm SULD_2D_ARRAY_I16_ZERO : SULD_2D_ARRAY<"suld.b.a2d.b16.zero", Int16Regs>;
				defm SULD_2D_ARRAY_I32_ZERO : SULD_2D_ARRAY<"suld.b.a2d.b32.zero", Int32Regs>;
				defm SULD_2D_ARRAY_I64_ZERO : SULD_2D_ARRAY<"suld.b.a2d.b64.zero", Int64Regs>;

				class SULD_3D_base<string inst, NVPTXRegClass outtype, dag surf>
				: NVPTXInst<(outs outtype:$r),
				!con(surf, (ins Int32Regs:$x, Int32Regs:$y, Int32Regs:$z)),
				inst # " \\{$r\\}, [$s, \\{$x, $y, $z, $z\\}];",
				[]>;
				multiclass SULD_3D<string inst, NVPTXRegClass outtype> {
				def _R : SULD_3D_base<inst, outtype, (ins Int64Regs:$s)>;
				def _I : SULD_3D_base<inst, outtype, (ins i64imm:$s)>;
				}

				defm SULD_3D_I8_CLAMP : SULD_3D<"suld.b.3d.b8.clamp", Int16Regs>;
				defm SULD_3D_I16_CLAMP : SULD_3D<"suld.b.3d.b16.clamp", Int16Regs>;
				defm SULD_3D_I32_CLAMP : SULD_3D<"suld.b.3d.b32.clamp", Int32Regs>;
				defm SULD_3D_I64_CLAMP : SULD_3D<"suld.b.3d.b64.clamp", Int64Regs>;

				defm SULD_3D_I8_TRAP : SULD_3D<"suld.b.3d.b8.trap", Int16Regs>;
				defm SULD_3D_I16_TRAP : SULD_3D<"suld.b.3d.b16.trap", Int16Regs>;
				defm SULD_3D_I32_TRAP : SULD_3D<"suld.b.3d.b32.trap", Int32Regs>;
				defm SULD_3D_I64_TRAP : SULD_3D<"suld.b.3d.b64.trap", Int64Regs>;

				defm SULD_3D_I8_ZERO : SULD_3D<"suld.b.3d.b8.zero", Int16Regs>;
				defm SULD_3D_I16_ZERO : SULD_3D<"suld.b.3d.b16.zero", Int16Regs>;
				defm SULD_3D_I32_ZERO : SULD_3D<"suld.b.3d.b32.zero", Int32Regs>;
				defm SULD_3D_I64_ZERO : SULD_3D<"suld.b.3d.b64.zero", Int64Regs>;
	}			}

	let IsSuld = 3 in {			let IsSuld = 2 in {
	def SULD_1D_V4I8_CLAMP
	: NVPTXInst<(outs Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),
	(ins Int64Regs:$s, Int32Regs:$x),
	"suld.b.1d.v4.b8.clamp \\{$r, $g, $b, $a\\}, [$s, \\{$x\\}];",
	[]>;
	def SULD_1D_V4I16_CLAMP
	: NVPTXInst<(outs Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),
	(ins Int64Regs:$s, Int32Regs:$x),
	"suld.b.1d.v4.b16.clamp \\{$r, $g, $b, $a\\}, [$s, \\{$x\\}];",
	[]>;
	def SULD_1D_V4I32_CLAMP
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g, Int32Regs:$b, Int32Regs:$a),
	(ins Int64Regs:$s, Int32Regs:$x),
	"suld.b.1d.v4.b32.clamp \\{$r, $g, $b, $a\\}, [$s, \\{$x\\}];",
	[]>;

	def SULD_1D_ARRAY_V4I8_CLAMP
	: NVPTXInst<(outs Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),
	(ins Int64Regs:$s, Int32Regs:$l, Int32Regs:$x),
	"suld.b.a1d.v4.b8.clamp \\{$r, $g, $b, $a\\}, "
	"[$s, \\{$l, $x\\}];",
	[]>;
	def SULD_1D_ARRAY_V4I16_CLAMP
	: NVPTXInst<(outs Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),
	(ins Int64Regs:$s, Int32Regs:$l, Int32Regs:$x),
	"suld.b.a1d.v4.b16.clamp \\{$r, $g, $b, $a\\}, "
	"[$s, \\{$l, $x\\}];",
	[]>;
	def SULD_1D_ARRAY_V4I32_CLAMP
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g, Int32Regs:$b, Int32Regs:$a),
	(ins Int64Regs:$s, Int32Regs:$l, Int32Regs:$x),
	"suld.b.a1d.v4.b32.clamp \\{$r, $g, $b, $a\\}, "
	"[$s, \\{$l, $x\\}];",
	[]>;

	def SULD_2D_V4I8_CLAMP
	: NVPTXInst<(outs Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y),
	"suld.b.2d.v4.b8.clamp \\{$r, $g, $b, $a\\}, [$s, \\{$x, $y\\}];",
	[]>;
	def SULD_2D_V4I16_CLAMP
	: NVPTXInst<(outs Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y),
	"suld.b.2d.v4.b16.clamp \\{$r, $g, $b, $a\\}, [$s, \\{$x, $y\\}];",
	[]>;
	def SULD_2D_V4I32_CLAMP
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g, Int32Regs:$b, Int32Regs:$a),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y),
	"suld.b.2d.v4.b32.clamp \\{$r, $g, $b, $a\\}, [$s, \\{$x, $y\\}];",
	[]>;

	def SULD_2D_ARRAY_V4I8_CLAMP
	: NVPTXInst<(outs Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),
	(ins Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y),
	"suld.b.a2d.v4.b8.clamp \\{$r, $g, $b, $a\\}, "
	"[$s, \\{$l, $x, $y, $y\\}];",
	[]>;
	def SULD_2D_ARRAY_V4I16_CLAMP
	: NVPTXInst<(outs Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),
	(ins Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y),
	"suld.b.a2d.v4.b16.clamp \\{$r, $g, $b, $a\\}, "
	"[$s, \\{$l, $x, $y, $y\\}];",
	[]>;
	def SULD_2D_ARRAY_V4I32_CLAMP
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g, Int32Regs:$b, Int32Regs:$a),
	(ins Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y),
	"suld.b.a2d.v4.b32.clamp \\{$r, $g, $b, $a\\}, "
	"[$s, \\{$l, $x, $y, $y\\}];",
	[]>;


	def SULD_3D_V4I8_CLAMP
	: NVPTXInst<(outs Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z),
	"suld.b.3d.v4.b8.clamp \\{$r, $g, $b, $a\\}, "
	"[$s, \\{$x, $y, $z, $z\\}];",
	[]>;
	def SULD_3D_V4I16_CLAMP
	: NVPTXInst<(outs Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z),
	"suld.b.3d.v4.b16.clamp \\{$r, $g, $b, $a\\}, "
	"[$s, \\{$x, $y, $z, $z\\}];",
	[]>;
	def SULD_3D_V4I32_CLAMP
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g, Int32Regs:$b, Int32Regs:$a),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z),
	"suld.b.3d.v4.b32.clamp \\{$r, $g, $b, $a\\}, "
	"[$s, \\{$x, $y, $z, $z\\}];",
	[]>;
	}

				class SULD_1D_V2_base<string inst, NVPTXRegClass outtype, dag surf>
				: NVPTXInst<(outs outtype:$r, outtype:$g),
				!con(surf, (ins Int32Regs:$x)),
				inst # " \\{$r, $g\\}, [$s, \\{$x\\}];",
				[]>;
				multiclass SULD_1D_V2<string inst, NVPTXRegClass outtype> {
				def _R : SULD_1D_V2_base<inst, outtype, (ins Int64Regs:$s)>;
				def _I : SULD_1D_V2_base<inst, outtype, (ins i64imm:$s)>;
				}

				defm SULD_1D_V2I8_CLAMP : SULD_1D_V2<"suld.b.1d.v2.b8.clamp", Int16Regs>;
				defm SULD_1D_V2I16_CLAMP : SULD_1D_V2<"suld.b.1d.v2.b16.clamp", Int16Regs>;
				defm SULD_1D_V2I32_CLAMP : SULD_1D_V2<"suld.b.1d.v2.b32.clamp", Int32Regs>;
				defm SULD_1D_V2I64_CLAMP : SULD_1D_V2<"suld.b.1d.v2.b64.clamp", Int64Regs>;

				defm SULD_1D_V2I8_TRAP : SULD_1D_V2<"suld.b.1d.v2.b8.trap", Int16Regs>;
				defm SULD_1D_V2I16_TRAP : SULD_1D_V2<"suld.b.1d.v2.b16.trap", Int16Regs>;
				defm SULD_1D_V2I32_TRAP : SULD_1D_V2<"suld.b.1d.v2.b32.trap", Int32Regs>;
				defm SULD_1D_V2I64_TRAP : SULD_1D_V2<"suld.b.1d.v2.b64.trap", Int64Regs>;

				defm SULD_1D_V2I8_ZERO : SULD_1D_V2<"suld.b.1d.v2.b8.zero", Int16Regs>;
				defm SULD_1D_V2I16_ZERO : SULD_1D_V2<"suld.b.1d.v2.b16.zero", Int16Regs>;
				defm SULD_1D_V2I32_ZERO : SULD_1D_V2<"suld.b.1d.v2.b32.zero", Int32Regs>;
				defm SULD_1D_V2I64_ZERO : SULD_1D_V2<"suld.b.1d.v2.b64.zero", Int64Regs>;

				class SULD_1D_ARRAY_V2_base<string inst, NVPTXRegClass outtype, dag surf>
				: NVPTXInst<(outs outtype:$r, outtype:$g),
				!con(surf, (ins Int32Regs:$l, Int32Regs:$x)),
				inst # " \\{$r, $g\\}, [$s, \\{$l, $x\\}];",
				[]>;
				multiclass SULD_1D_ARRAY_V2<string inst, NVPTXRegClass outtype> {
				def _R : SULD_1D_ARRAY_V2_base<inst, outtype, (ins Int64Regs:$s)>;
				def _I : SULD_1D_ARRAY_V2_base<inst, outtype, (ins i64imm:$s)>;
				}

				defm SULD_1D_ARRAY_V2I8_CLAMP
				: SULD_1D_ARRAY_V2<"suld.b.a1d.v2.b8.clamp", Int16Regs>;
				defm SULD_1D_ARRAY_V2I16_CLAMP
				: SULD_1D_ARRAY_V2<"suld.b.a1d.v2.b16.clamp", Int16Regs>;
				defm SULD_1D_ARRAY_V2I32_CLAMP
				: SULD_1D_ARRAY_V2<"suld.b.a1d.v2.b32.clamp", Int32Regs>;
				defm SULD_1D_ARRAY_V2I64_CLAMP
				: SULD_1D_ARRAY_V2<"suld.b.a1d.v2.b64.clamp", Int64Regs>;

				defm SULD_1D_ARRAY_V2I8_TRAP
				: SULD_1D_ARRAY_V2<"suld.b.a1d.v2.b8.trap", Int16Regs>;
				defm SULD_1D_ARRAY_V2I16_TRAP
				: SULD_1D_ARRAY_V2<"suld.b.a1d.v2.b16.trap", Int16Regs>;
				defm SULD_1D_ARRAY_V2I32_TRAP
				: SULD_1D_ARRAY_V2<"suld.b.a1d.v2.b32.trap", Int32Regs>;
				defm SULD_1D_ARRAY_V2I64_TRAP
				: SULD_1D_ARRAY_V2<"suld.b.a1d.v2.b64.trap", Int64Regs>;

				defm SULD_1D_ARRAY_V2I8_ZERO
				: SULD_1D_ARRAY_V2<"suld.b.a1d.v2.b8.zero", Int16Regs>;
				defm SULD_1D_ARRAY_V2I16_ZERO
				: SULD_1D_ARRAY_V2<"suld.b.a1d.v2.b16.zero", Int16Regs>;
				defm SULD_1D_ARRAY_V2I32_ZERO
				: SULD_1D_ARRAY_V2<"suld.b.a1d.v2.b32.zero", Int32Regs>;
				defm SULD_1D_ARRAY_V2I64_ZERO
				: SULD_1D_ARRAY_V2<"suld.b.a1d.v2.b64.zero", Int64Regs>;

				class SULD_2D_V2_base<string inst, NVPTXRegClass outtype, dag surf>
				: NVPTXInst<(outs outtype:$r, outtype:$g),
				!con(surf, (ins Int32Regs:$x, Int32Regs:$y)),
				inst # " \\{$r, $g\\}, [$s, \\{$x, $y\\}];",
				[]>;
				multiclass SULD_2D_V2<string inst, NVPTXRegClass outtype> {
				def _R : SULD_2D_V2_base<inst, outtype, (ins Int64Regs:$s)>;
				def _I : SULD_2D_V2_base<inst, outtype, (ins i64imm:$s)>;
				}

				defm SULD_2D_V2I8_CLAMP
				: SULD_2D_V2<"suld.b.2d.v2.b8.clamp", Int16Regs>;
				defm SULD_2D_V2I16_CLAMP
				: SULD_2D_V2<"suld.b.2d.v2.b16.clamp", Int16Regs>;
				defm SULD_2D_V2I32_CLAMP
				: SULD_2D_V2<"suld.b.2d.v2.b32.clamp", Int32Regs>;
				defm SULD_2D_V2I64_CLAMP
				: SULD_2D_V2<"suld.b.2d.v2.b64.clamp", Int64Regs>;

				defm SULD_2D_V2I8_TRAP
				: SULD_2D_V2<"suld.b.2d.v2.b8.trap", Int16Regs>;
				defm SULD_2D_V2I16_TRAP
				: SULD_2D_V2<"suld.b.2d.v2.b16.trap", Int16Regs>;
				defm SULD_2D_V2I32_TRAP
				: SULD_2D_V2<"suld.b.2d.v2.b32.trap", Int32Regs>;
				defm SULD_2D_V2I64_TRAP
				: SULD_2D_V2<"suld.b.2d.v2.b64.trap", Int64Regs>;

				defm SULD_2D_V2I8_ZERO
				: SULD_2D_V2<"suld.b.2d.v2.b8.zero", Int16Regs>;
				defm SULD_2D_V2I16_ZERO
				: SULD_2D_V2<"suld.b.2d.v2.b16.zero", Int16Regs>;
				defm SULD_2D_V2I32_ZERO
				: SULD_2D_V2<"suld.b.2d.v2.b32.zero", Int32Regs>;
				defm SULD_2D_V2I64_ZERO
				: SULD_2D_V2<"suld.b.2d.v2.b64.zero", Int64Regs>;

				class SULD_2D_ARRAY_V2_base<string inst, NVPTXRegClass outtype, dag surf>
				: NVPTXInst<(outs outtype:$r, outtype:$g),
				!con(surf, (ins Int32Regs:$l, Int32Regs:$x, Int32Regs:$y)),
				inst # " \\{$r, $g\\}, [$s, \\{$l, $x, $y, $y\\}];",
				[]>;
				multiclass SULD_2D_ARRAY_V2<string inst, NVPTXRegClass outtype> {
				def _R : SULD_2D_ARRAY_V2_base<inst, outtype, (ins Int64Regs:$s)>;
				def _I : SULD_2D_ARRAY_V2_base<inst, outtype, (ins i64imm:$s)>;
				}

				defm SULD_2D_ARRAY_V2I8_CLAMP
				: SULD_2D_ARRAY_V2<"suld.b.a2d.v2.b8.clamp", Int16Regs>;
				defm SULD_2D_ARRAY_V2I16_CLAMP
				: SULD_2D_ARRAY_V2<"suld.b.a2d.v2.b16.clamp", Int16Regs>;
				defm SULD_2D_ARRAY_V2I32_CLAMP
				: SULD_2D_ARRAY_V2<"suld.b.a2d.v2.b32.clamp", Int32Regs>;
				defm SULD_2D_ARRAY_V2I64_CLAMP
				: SULD_2D_ARRAY_V2<"suld.b.a2d.v2.b64.clamp", Int64Regs>;

				defm SULD_2D_ARRAY_V2I8_TRAP
				: SULD_2D_ARRAY_V2<"suld.b.a2d.v2.b8.trap", Int16Regs>;
				defm SULD_2D_ARRAY_V2I16_TRAP
				: SULD_2D_ARRAY_V2<"suld.b.a2d.v2.b16.trap", Int16Regs>;
				defm SULD_2D_ARRAY_V2I32_TRAP
				: SULD_2D_ARRAY_V2<"suld.b.a2d.v2.b32.trap", Int32Regs>;
				defm SULD_2D_ARRAY_V2I64_TRAP
				: SULD_2D_ARRAY_V2<"suld.b.a2d.v2.b64.trap", Int64Regs>;

				defm SULD_2D_ARRAY_V2I8_ZERO
				: SULD_2D_ARRAY_V2<"suld.b.a2d.v2.b8.zero", Int16Regs>;
				defm SULD_2D_ARRAY_V2I16_ZERO
				: SULD_2D_ARRAY_V2<"suld.b.a2d.v2.b16.zero", Int16Regs>;
				defm SULD_2D_ARRAY_V2I32_ZERO
				: SULD_2D_ARRAY_V2<"suld.b.a2d.v2.b32.zero", Int32Regs>;
				defm SULD_2D_ARRAY_V2I64_ZERO
				: SULD_2D_ARRAY_V2<"suld.b.a2d.v2.b64.zero", Int64Regs>;

				class SULD_3D_V2_base<string inst, NVPTXRegClass outtype, dag surf>
				: NVPTXInst<(outs outtype:$r, outtype:$g),
				!con(surf, (ins Int32Regs:$x, Int32Regs:$y, Int32Regs:$z)),
				inst # " \\{$r, $g\\}, [$s, \\{$x, $y, $z, $z\\}];",
				[]>;
				multiclass SULD_3D_V2<string inst, NVPTXRegClass outtype> {
				def _R : SULD_3D_V2_base<inst, outtype, (ins Int64Regs:$s)>;
				def _I : SULD_3D_V2_base<inst, outtype, (ins i64imm:$s)>;
				}

				defm SULD_3D_V2I8_CLAMP : SULD_3D_V2<"suld.b.3d.v2.b8.clamp", Int16Regs>;
				defm SULD_3D_V2I16_CLAMP : SULD_3D_V2<"suld.b.3d.v2.b16.clamp", Int16Regs>;
				defm SULD_3D_V2I32_CLAMP : SULD_3D_V2<"suld.b.3d.v2.b32.clamp", Int32Regs>;
				defm SULD_3D_V2I64_CLAMP : SULD_3D_V2<"suld.b.3d.v2.b64.clamp", Int64Regs>;

				defm SULD_3D_V2I8_TRAP : SULD_3D_V2<"suld.b.3d.v2.b8.trap", Int16Regs>;
				defm SULD_3D_V2I16_TRAP : SULD_3D_V2<"suld.b.3d.v2.b16.trap", Int16Regs>;
				defm SULD_3D_V2I32_TRAP : SULD_3D_V2<"suld.b.3d.v2.b32.trap", Int32Regs>;
				defm SULD_3D_V2I64_TRAP : SULD_3D_V2<"suld.b.3d.v2.b64.trap", Int64Regs>;

				defm SULD_3D_V2I8_ZERO : SULD_3D_V2<"suld.b.3d.v2.b8.zero", Int16Regs>;
				defm SULD_3D_V2I16_ZERO : SULD_3D_V2<"suld.b.3d.v2.b16.zero", Int16Regs>;
				defm SULD_3D_V2I32_ZERO : SULD_3D_V2<"suld.b.3d.v2.b32.zero", Int32Regs>;
				defm SULD_3D_V2I64_ZERO : SULD_3D_V2<"suld.b.3d.v2.b64.zero", Int64Regs>;

	// .trap variant
	let IsSuld = true in {
	def SULD_1D_I8_TRAP
	: NVPTXInst<(outs Int16Regs:$r),
	(ins Int64Regs:$s, Int32Regs:$x),
	"suld.b.1d.b8.trap \\{$r\\}, [$s, \\{$x\\}];",
	[]>;
	def SULD_1D_I16_TRAP
	: NVPTXInst<(outs Int16Regs:$r),
	(ins Int64Regs:$s, Int32Regs:$x),
	"suld.b.1d.b16.trap \\{$r\\}, [$s, \\{$x\\}];",
	[]>;
	def SULD_1D_I32_TRAP
	: NVPTXInst<(outs Int32Regs:$r),
	(ins Int64Regs:$s, Int32Regs:$x),
	"suld.b.1d.b32.trap \\{$r\\}, [$s, \\{$x\\}];",
	[]>;
	def SULD_1D_I64_TRAP
	: NVPTXInst<(outs Int64Regs:$r),
	(ins Int64Regs:$s, Int32Regs:$x),
	"suld.b.1d.b64.trap \\{$r\\}, [$s, \\{$x\\}];",
	[]>;

	def SULD_1D_ARRAY_I8_TRAP
	: NVPTXInst<(outs Int16Regs:$r),
	(ins Int64Regs:$s, Int32Regs:$l, Int32Regs:$x),
	"suld.b.a1d.b8.trap \\{$r\\}, [$s, \\{$l, $x\\}];",
	[]>;
	def SULD_1D_ARRAY_I16_TRAP
	: NVPTXInst<(outs Int16Regs:$r),
	(ins Int64Regs:$s, Int32Regs:$l, Int32Regs:$x),
	"suld.b.a1d.b16.trap \\{$r\\}, [$s, \\{$l, $x\\}];",
	[]>;
	def SULD_1D_ARRAY_I32_TRAP
	: NVPTXInst<(outs Int32Regs:$r),
	(ins Int64Regs:$s, Int32Regs:$l, Int32Regs:$x),
	"suld.b.a1d.b32.trap \\{$r\\}, [$s, \\{$l, $x\\}];",
	[]>;
	def SULD_1D_ARRAY_I64_TRAP
	: NVPTXInst<(outs Int64Regs:$r),
	(ins Int64Regs:$s, Int32Regs:$l, Int32Regs:$x),
	"suld.b.a1d.b64.trap \\{$r\\}, [$s, \\{$l, $x\\}];",
	[]>;

	def SULD_2D_I8_TRAP
	: NVPTXInst<(outs Int16Regs:$r),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y),
	"suld.b.2d.b8.trap \\{$r\\}, [$s, \\{$x, $y\\}];",
	[]>;
	def SULD_2D_I16_TRAP
	: NVPTXInst<(outs Int16Regs:$r),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y),
	"suld.b.2d.b16.trap \\{$r\\}, [$s, \\{$x, $y\\}];",
	[]>;
	def SULD_2D_I32_TRAP
	: NVPTXInst<(outs Int32Regs:$r),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y),
	"suld.b.2d.b32.trap \\{$r\\}, [$s, \\{$x, $y\\}];",
	[]>;
	def SULD_2D_I64_TRAP
	: NVPTXInst<(outs Int64Regs:$r),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y),
	"suld.b.2d.b64.trap \\{$r\\}, [$s, \\{$x, $y\\}];",
	[]>;

	def SULD_2D_ARRAY_I8_TRAP
	: NVPTXInst<(outs Int16Regs:$r),
	(ins Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y),
	"suld.b.a2d.b8.trap \\{$r\\}, [$s, \\{$l, $x, $y, $y\\}];",
	[]>;
	def SULD_2D_ARRAY_I16_TRAP
	: NVPTXInst<(outs Int16Regs:$r),
	(ins Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y),
	"suld.b.a2d.b16.trap \\{$r\\}, [$s, \\{$l, $x, $y, $y\\}];",
	[]>;
	def SULD_2D_ARRAY_I32_TRAP
	: NVPTXInst<(outs Int32Regs:$r),
	(ins Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y),
	"suld.b.a2d.b32.trap \\{$r\\}, [$s, \\{$l, $x, $y, $y\\}];",
	[]>;
	def SULD_2D_ARRAY_I64_TRAP
	: NVPTXInst<(outs Int64Regs:$r),
	(ins Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y),
	"suld.b.a2d.b64.trap \\{$r\\}, [$s, \\{$l, $x, $y, $y\\}];",
	[]>;

	def SULD_3D_I8_TRAP
	: NVPTXInst<(outs Int16Regs:$r),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z),
	"suld.b.3d.b8.trap \\{$r\\}, [$s, \\{$x, $y, $z, $z\\}];",
	[]>;
	def SULD_3D_I16_TRAP
	: NVPTXInst<(outs Int16Regs:$r),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z),
	"suld.b.3d.b16.trap \\{$r\\}, [$s, \\{$x, $y, $z, $z\\}];",
	[]>;
	def SULD_3D_I32_TRAP
	: NVPTXInst<(outs Int32Regs:$r),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z),
	"suld.b.3d.b32.trap \\{$r\\}, [$s, \\{$x, $y, $z, $z\\}];",
	[]>;
	def SULD_3D_I64_TRAP
	: NVPTXInst<(outs Int64Regs:$r),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z),
	"suld.b.3d.b64.trap \\{$r\\}, [$s, \\{$x, $y, $z, $z\\}];",
	[]>;
	}

	let IsSuld = 2 in {
	def SULD_1D_V2I8_TRAP
	: NVPTXInst<(outs Int16Regs:$r, Int16Regs:$g),
	(ins Int64Regs:$s, Int32Regs:$x),
	"suld.b.1d.v2.b8.trap \\{$r, $g\\}, [$s, \\{$x\\}];",
	[]>;
	def SULD_1D_V2I16_TRAP
	: NVPTXInst<(outs Int16Regs:$r, Int16Regs:$g),
	(ins Int64Regs:$s, Int32Regs:$x),
	"suld.b.1d.v2.b16.trap \\{$r, $g\\}, [$s, \\{$x\\}];",
	[]>;
	def SULD_1D_V2I32_TRAP
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g),
	(ins Int64Regs:$s, Int32Regs:$x),
	"suld.b.1d.v2.b32.trap \\{$r, $g\\}, [$s, \\{$x\\}];",
	[]>;
	def SULD_1D_V2I64_TRAP
	: NVPTXInst<(outs Int64Regs:$r, Int64Regs:$g),
	(ins Int64Regs:$s, Int32Regs:$x),
	"suld.b.1d.v2.b64.trap \\{$r, $g\\}, [$s, \\{$x\\}];",
	[]>;

	def SULD_1D_ARRAY_V2I8_TRAP
	: NVPTXInst<(outs Int16Regs:$r, Int16Regs:$g),
	(ins Int64Regs:$s, Int32Regs:$l, Int32Regs:$x),
	"suld.b.a1d.v2.b8.trap \\{$r, $g\\}, [$s, \\{$l, $x\\}];",
	[]>;
	def SULD_1D_ARRAY_V2I16_TRAP
	: NVPTXInst<(outs Int16Regs:$r, Int16Regs:$g),
	(ins Int64Regs:$s, Int32Regs:$l, Int32Regs:$x),
	"suld.b.a1d.v2.b16.trap \\{$r, $g\\}, [$s, \\{$l, $x\\}];",
	[]>;
	def SULD_1D_ARRAY_V2I32_TRAP
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g),
	(ins Int64Regs:$s, Int32Regs:$l, Int32Regs:$x),
	"suld.b.a1d.v2.b32.trap \\{$r, $g\\}, [$s, \\{$l, $x\\}];",
	[]>;
	def SULD_1D_ARRAY_V2I64_TRAP
	: NVPTXInst<(outs Int64Regs:$r, Int64Regs:$g),
	(ins Int64Regs:$s, Int32Regs:$l, Int32Regs:$x),
	"suld.b.a1d.v2.b64.trap \\{$r, $g\\}, [$s, \\{$l, $x\\}];",
	[]>;

	def SULD_2D_V2I8_TRAP
	: NVPTXInst<(outs Int16Regs:$r, Int16Regs:$g),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y),
	"suld.b.2d.v2.b8.trap \\{$r, $g\\}, [$s, \\{$x, $y\\}];",
	[]>;
	def SULD_2D_V2I16_TRAP
	: NVPTXInst<(outs Int16Regs:$r, Int16Regs:$g),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y),
	"suld.b.2d.v2.b16.trap \\{$r, $g\\}, [$s, \\{$x, $y\\}];",
	[]>;
	def SULD_2D_V2I32_TRAP
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y),
	"suld.b.2d.v2.b32.trap \\{$r, $g\\}, [$s, \\{$x, $y\\}];",
	[]>;
	def SULD_2D_V2I64_TRAP
	: NVPTXInst<(outs Int64Regs:$r, Int64Regs:$g),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y),
	"suld.b.2d.v2.b64.trap \\{$r, $g\\}, [$s, \\{$x, $y\\}];",
	[]>;

	def SULD_2D_ARRAY_V2I8_TRAP
	: NVPTXInst<(outs Int16Regs:$r, Int16Regs:$g),
	(ins Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y),
	"suld.b.a2d.v2.b8.trap \\{$r, $g\\}, "
	"[$s, \\{$l, $x, $y, $y\\}];",
	[]>;
	def SULD_2D_ARRAY_V2I16_TRAP
	: NVPTXInst<(outs Int16Regs:$r, Int16Regs:$g),
	(ins Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y),
	"suld.b.a2d.v2.b16.trap \\{$r, $g\\}, "
	"[$s, \\{$l, $x, $y, $y\\}];",
	[]>;
	def SULD_2D_ARRAY_V2I32_TRAP
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g),
	(ins Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y),
	"suld.b.a2d.v2.b32.trap \\{$r, $g\\}, "
	"[$s, \\{$l, $x, $y, $y\\}];",
	[]>;
	def SULD_2D_ARRAY_V2I64_TRAP
	: NVPTXInst<(outs Int64Regs:$r, Int64Regs:$g),
	(ins Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y),
	"suld.b.a2d.v2.b64.trap \\{$r, $g\\}, "
	"[$s, \\{$l, $x, $y, $y\\}];",
	[]>;

	def SULD_3D_V2I8_TRAP
	: NVPTXInst<(outs Int16Regs:$r, Int16Regs:$g),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z),
	"suld.b.3d.v2.b8.trap \\{$r, $g\\}, [$s, \\{$x, $y, $z, $z\\}];",
	[]>;
	def SULD_3D_V2I16_TRAP
	: NVPTXInst<(outs Int16Regs:$r, Int16Regs:$g),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z),
	"suld.b.3d.v2.b16.trap \\{$r, $g\\}, [$s, \\{$x, $y, $z, $z\\}];",
	[]>;
	def SULD_3D_V2I32_TRAP
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z),
	"suld.b.3d.v2.b32.trap \\{$r, $g\\}, [$s, \\{$x, $y, $z, $z\\}];",
	[]>;
	def SULD_3D_V2I64_TRAP
	: NVPTXInst<(outs Int64Regs:$r, Int64Regs:$g),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z),
	"suld.b.3d.v2.b64.trap \\{$r, $g\\}, [$s, \\{$x, $y, $z, $z\\}];",
	[]>;
	}			}

	let IsSuld = 3 in {			let IsSuld = 3 in {
	def SULD_1D_V4I8_TRAP
	: NVPTXInst<(outs Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),
	(ins Int64Regs:$s, Int32Regs:$x),
	"suld.b.1d.v4.b8.trap \\{$r, $g, $b, $a\\}, [$s, \\{$x\\}];",
	[]>;
	def SULD_1D_V4I16_TRAP
	: NVPTXInst<(outs Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),
	(ins Int64Regs:$s, Int32Regs:$x),
	"suld.b.1d.v4.b16.trap \\{$r, $g, $b, $a\\}, [$s, \\{$x\\}];",
	[]>;
	def SULD_1D_V4I32_TRAP
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g, Int32Regs:$b, Int32Regs:$a),
	(ins Int64Regs:$s, Int32Regs:$x),
	"suld.b.1d.v4.b32.trap \\{$r, $g, $b, $a\\}, [$s, \\{$x\\}];",
	[]>;

	def SULD_1D_ARRAY_V4I8_TRAP
	: NVPTXInst<(outs Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),
	(ins Int64Regs:$s, Int32Regs:$l, Int32Regs:$x),
	"suld.b.a1d.v4.b8.trap \\{$r, $g, $b, $a\\}, "
	"[$s, \\{$l, $x\\}];",
	[]>;
	def SULD_1D_ARRAY_V4I16_TRAP
	: NVPTXInst<(outs Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),
	(ins Int64Regs:$s, Int32Regs:$l, Int32Regs:$x),
	"suld.b.a1d.v4.b16.trap \\{$r, $g, $b, $a\\}, "
	"[$s, \\{$l, $x\\}];",
	[]>;
	def SULD_1D_ARRAY_V4I32_TRAP
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g, Int32Regs:$b, Int32Regs:$a),
	(ins Int64Regs:$s, Int32Regs:$l, Int32Regs:$x),
	"suld.b.a1d.v4.b32.trap \\{$r, $g, $b, $a\\}, "
	"[$s, \\{$l, $x\\}];",
	[]>;

	def SULD_2D_V4I8_TRAP
	: NVPTXInst<(outs Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y),
	"suld.b.2d.v4.b8.trap \\{$r, $g, $b, $a\\}, [$s, \\{$x, $y\\}];",
	[]>;
	def SULD_2D_V4I16_TRAP
	: NVPTXInst<(outs Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y),
	"suld.b.2d.v4.b16.trap \\{$r, $g, $b, $a\\}, [$s, \\{$x, $y\\}];",
	[]>;
	def SULD_2D_V4I32_TRAP
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g, Int32Regs:$b, Int32Regs:$a),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y),
	"suld.b.2d.v4.b32.trap \\{$r, $g, $b, $a\\}, [$s, \\{$x, $y\\}];",
	[]>;

	def SULD_2D_ARRAY_V4I8_TRAP
	: NVPTXInst<(outs Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),
	(ins Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y),
	"suld.b.a2d.v4.b8.trap \\{$r, $g, $b, $a\\}, "
	"[$s, \\{$l, $x, $y, $y\\}];",
	[]>;
	def SULD_2D_ARRAY_V4I16_TRAP
	: NVPTXInst<(outs Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),
	(ins Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y),
	"suld.b.a2d.v4.b16.trap \\{$r, $g, $b, $a\\}, "
	"[$s, \\{$l, $x, $y, $y\\}];",
	[]>;
	def SULD_2D_ARRAY_V4I32_TRAP
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g, Int32Regs:$b, Int32Regs:$a),
	(ins Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y),
	"suld.b.a2d.v4.b32.trap \\{$r, $g, $b, $a\\}, "
	"[$s, \\{$l, $x, $y, $y\\}];",
	[]>;


	def SULD_3D_V4I8_TRAP
	: NVPTXInst<(outs Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z),
	"suld.b.3d.v4.b8.trap \\{$r, $g, $b, $a\\}, "
	"[$s, \\{$x, $y, $z, $z\\}];",
	[]>;
	def SULD_3D_V4I16_TRAP
	: NVPTXInst<(outs Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z),
	"suld.b.3d.v4.b16.trap \\{$r, $g, $b, $a\\}, "
	"[$s, \\{$x, $y, $z, $z\\}];",
	[]>;
	def SULD_3D_V4I32_TRAP
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g, Int32Regs:$b, Int32Regs:$a),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z),
	"suld.b.3d.v4.b32.trap \\{$r, $g, $b, $a\\}, "
	"[$s, \\{$x, $y, $z, $z\\}];",
	[]>;
	}

	// .zero variant			class SULD_1D_V4_base<string inst, NVPTXRegClass outtype, dag surf>
	let IsSuld = true in {			: NVPTXInst<(outs outtype:$r, outtype:$g, outtype:$b, outtype:$a),
	def SULD_1D_I8_ZERO			!con(surf, (ins Int32Regs:$x)),
	: NVPTXInst<(outs Int16Regs:$r),			inst # " \\{$r, $g, $b, $a\\}, [$s, \\{$x\\}];",
	(ins Int64Regs:$s, Int32Regs:$x),			[]>;
	"suld.b.1d.b8.zero \\{$r\\}, [$s, \\{$x\\}];",			multiclass SULD_1D_V4<string inst, NVPTXRegClass outtype> {
	[]>;			def _R : SULD_1D_V4_base<inst, outtype, (ins Int64Regs:$s)>;
	def SULD_1D_I16_ZERO			def _I : SULD_1D_V4_base<inst, outtype, (ins i64imm:$s)>;
	: NVPTXInst<(outs Int16Regs:$r),			}
	(ins Int64Regs:$s, Int32Regs:$x),
	"suld.b.1d.b16.zero \\{$r\\}, [$s, \\{$x\\}];",			defm SULD_1D_V4I8_CLAMP : SULD_1D_V4<"suld.b.1d.v4.b8.clamp", Int16Regs>;
	[]>;			defm SULD_1D_V4I16_CLAMP : SULD_1D_V4<"suld.b.1d.v4.b16.clamp", Int16Regs>;
	def SULD_1D_I32_ZERO			defm SULD_1D_V4I32_CLAMP : SULD_1D_V4<"suld.b.1d.v4.b32.clamp", Int32Regs>;
	: NVPTXInst<(outs Int32Regs:$r),
	(ins Int64Regs:$s, Int32Regs:$x),			defm SULD_1D_V4I8_TRAP : SULD_1D_V4<"suld.b.1d.v4.b8.trap", Int16Regs>;
	"suld.b.1d.b32.zero \\{$r\\}, [$s, \\{$x\\}];",			defm SULD_1D_V4I16_TRAP : SULD_1D_V4<"suld.b.1d.v4.b16.trap", Int16Regs>;
	[]>;			defm SULD_1D_V4I32_TRAP : SULD_1D_V4<"suld.b.1d.v4.b32.trap", Int32Regs>;
	def SULD_1D_I64_ZERO
	: NVPTXInst<(outs Int64Regs:$r),			defm SULD_1D_V4I8_ZERO : SULD_1D_V4<"suld.b.1d.v4.b8.zero", Int16Regs>;
	(ins Int64Regs:$s, Int32Regs:$x),			defm SULD_1D_V4I16_ZERO : SULD_1D_V4<"suld.b.1d.v4.b16.zero", Int16Regs>;
	"suld.b.1d.b64.zero \\{$r\\}, [$s, \\{$x\\}];",			defm SULD_1D_V4I32_ZERO : SULD_1D_V4<"suld.b.1d.v4.b32.zero", Int32Regs>;
	[]>;
				class SULD_1D_ARRAY_V4_base<string inst, NVPTXRegClass outtype, dag surf>
	def SULD_1D_ARRAY_I8_ZERO			: NVPTXInst<(outs outtype:$r, outtype:$g, outtype:$b, outtype:$a),
	: NVPTXInst<(outs Int16Regs:$r),			!con(surf, (ins Int32Regs:$l, Int32Regs:$x)),
	(ins Int64Regs:$s, Int32Regs:$l, Int32Regs:$x),			inst # " \\{$r, $g, $b, $a\\}, [$s, \\{$l, $x\\}];",
	"suld.b.a1d.b8.zero \\{$r\\}, [$s, \\{$l, $x\\}];",			[]>;
	[]>;			multiclass SULD_1D_ARRAY_V4<string inst, NVPTXRegClass outtype> {
	def SULD_1D_ARRAY_I16_ZERO			def _R : SULD_1D_ARRAY_V4_base<inst, outtype, (ins Int64Regs:$s)>;
	: NVPTXInst<(outs Int16Regs:$r),			def _I : SULD_1D_ARRAY_V4_base<inst, outtype, (ins i64imm:$s)>;
	(ins Int64Regs:$s, Int32Regs:$l, Int32Regs:$x),			}
	"suld.b.a1d.b16.zero \\{$r\\}, [$s, \\{$l, $x\\}];",
	[]>;			defm SULD_1D_ARRAY_V4I8_CLAMP
	def SULD_1D_ARRAY_I32_ZERO			: SULD_1D_ARRAY_V4<"suld.b.a1d.v4.b8.clamp", Int16Regs>;
	: NVPTXInst<(outs Int32Regs:$r),			defm SULD_1D_ARRAY_V4I16_CLAMP
	(ins Int64Regs:$s, Int32Regs:$l, Int32Regs:$x),			: SULD_1D_ARRAY_V4<"suld.b.a1d.v4.b16.clamp", Int16Regs>;
	"suld.b.a1d.b32.zero \\{$r\\}, [$s, \\{$l, $x\\}];",			defm SULD_1D_ARRAY_V4I32_CLAMP
	[]>;			: SULD_1D_ARRAY_V4<"suld.b.a1d.v4.b32.clamp", Int32Regs>;
	def SULD_1D_ARRAY_I64_ZERO
	: NVPTXInst<(outs Int64Regs:$r),			defm SULD_1D_ARRAY_V4I8_TRAP
	(ins Int64Regs:$s, Int32Regs:$l, Int32Regs:$x),			: SULD_1D_ARRAY_V4<"suld.b.a1d.v4.b8.trap", Int16Regs>;
	"suld.b.a1d.b64.zero \\{$r\\}, [$s, \\{$l, $x\\}];",			defm SULD_1D_ARRAY_V4I16_TRAP
	[]>;			: SULD_1D_ARRAY_V4<"suld.b.a1d.v4.b16.trap", Int16Regs>;
				defm SULD_1D_ARRAY_V4I32_TRAP
	def SULD_2D_I8_ZERO			: SULD_1D_ARRAY_V4<"suld.b.a1d.v4.b32.trap", Int32Regs>;
	: NVPTXInst<(outs Int16Regs:$r),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y),			defm SULD_1D_ARRAY_V4I8_ZERO
	"suld.b.2d.b8.zero \\{$r\\}, [$s, \\{$x, $y\\}];",			: SULD_1D_ARRAY_V4<"suld.b.a1d.v4.b8.zero", Int16Regs>;
	[]>;			defm SULD_1D_ARRAY_V4I16_ZERO
	def SULD_2D_I16_ZERO			: SULD_1D_ARRAY_V4<"suld.b.a1d.v4.b16.zero", Int16Regs>;
	: NVPTXInst<(outs Int16Regs:$r),			defm SULD_1D_ARRAY_V4I32_ZERO
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y),			: SULD_1D_ARRAY_V4<"suld.b.a1d.v4.b32.zero", Int32Regs>;
	"suld.b.2d.b16.zero \\{$r\\}, [$s, \\{$x, $y\\}];",
	[]>;			class SULD_2D_V4_base<string inst, NVPTXRegClass outtype, dag surf>
	def SULD_2D_I32_ZERO			: NVPTXInst<(outs outtype:$r, outtype:$g, outtype:$b, outtype:$a),
	: NVPTXInst<(outs Int32Regs:$r),			!con(surf, (ins Int32Regs:$x, Int32Regs:$y)),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y),			inst # " \\{$r, $g, $b, $a\\}, [$s, \\{$x, $y\\}];",
	"suld.b.2d.b32.zero \\{$r\\}, [$s, \\{$x, $y\\}];",			[]>;
	[]>;			multiclass SULD_2D_V4<string inst, NVPTXRegClass outtype> {
	def SULD_2D_I64_ZERO			def _R : SULD_2D_V4_base<inst, outtype, (ins Int64Regs:$s)>;
	: NVPTXInst<(outs Int64Regs:$r),			def _I : SULD_2D_V4_base<inst, outtype, (ins i64imm:$s)>;
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y),			}
	"suld.b.2d.b64.zero \\{$r\\}, [$s, \\{$x, $y\\}];",
	[]>;			defm SULD_2D_V4I8_CLAMP : SULD_2D_V4<"suld.b.2d.v4.b8.clamp", Int16Regs>;
				defm SULD_2D_V4I16_CLAMP : SULD_2D_V4<"suld.b.2d.v4.b16.clamp", Int16Regs>;
	def SULD_2D_ARRAY_I8_ZERO			defm SULD_2D_V4I32_CLAMP : SULD_2D_V4<"suld.b.2d.v4.b32.clamp", Int32Regs>;
	: NVPTXInst<(outs Int16Regs:$r),
	(ins Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y),			defm SULD_2D_V4I8_TRAP : SULD_2D_V4<"suld.b.2d.v4.b8.trap", Int16Regs>;
	"suld.b.a2d.b8.zero \\{$r\\}, [$s, \\{$l, $x, $y, $y\\}];",			defm SULD_2D_V4I16_TRAP : SULD_2D_V4<"suld.b.2d.v4.b16.trap", Int16Regs>;
	[]>;			defm SULD_2D_V4I32_TRAP : SULD_2D_V4<"suld.b.2d.v4.b32.trap", Int32Regs>;
	def SULD_2D_ARRAY_I16_ZERO
	: NVPTXInst<(outs Int16Regs:$r),			defm SULD_2D_V4I8_ZERO : SULD_2D_V4<"suld.b.2d.v4.b8.zero", Int16Regs>;
	(ins Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y),			defm SULD_2D_V4I16_ZERO : SULD_2D_V4<"suld.b.2d.v4.b16.zero", Int16Regs>;
	"suld.b.a2d.b16.zero \\{$r\\}, [$s, \\{$l, $x, $y, $y\\}];",			defm SULD_2D_V4I32_ZERO : SULD_2D_V4<"suld.b.2d.v4.b32.zero", Int32Regs>;
	[]>;
	def SULD_2D_ARRAY_I32_ZERO			class SULD_2D_ARRAY_V4_base<string inst, NVPTXRegClass outtype, dag surf>
	: NVPTXInst<(outs Int32Regs:$r),			: NVPTXInst<(outs outtype:$r, outtype:$g, outtype:$b, outtype:$a),
	(ins Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y),			!con(surf, (ins Int32Regs:$l, Int32Regs:$x, Int32Regs:$y)),
	"suld.b.a2d.b32.zero \\{$r\\}, [$s, \\{$l, $x, $y, $y\\}];",			inst # " \\{$r, $g, $b, $a\\}, [$s, \\{$l, $x, $y, $y\\}];",
	[]>;			[]>;
	def SULD_2D_ARRAY_I64_ZERO			multiclass SULD_2D_ARRAY_V4<string inst, NVPTXRegClass outtype> {
	: NVPTXInst<(outs Int64Regs:$r),			def _R : SULD_2D_ARRAY_V4_base<inst, outtype, (ins Int64Regs:$s)>;
	(ins Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y),			def _I : SULD_2D_ARRAY_V4_base<inst, outtype, (ins i64imm:$s)>;
	"suld.b.a2d.b64.zero \\{$r\\}, [$s, \\{$l, $x, $y, $y\\}];",			}
	[]>;
				defm SULD_2D_ARRAY_V4I8_CLAMP
	def SULD_3D_I8_ZERO			: SULD_2D_ARRAY_V4<"suld.b.a2d.v4.b8.clamp", Int16Regs>;
	: NVPTXInst<(outs Int16Regs:$r),			defm SULD_2D_ARRAY_V4I16_CLAMP
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z),			: SULD_2D_ARRAY_V4<"suld.b.a2d.v4.b16.clamp", Int16Regs>;
	"suld.b.3d.b8.zero \\{$r\\}, [$s, \\{$x, $y, $z, $z\\}];",			defm SULD_2D_ARRAY_V4I32_CLAMP
	[]>;			: SULD_2D_ARRAY_V4<"suld.b.a2d.v4.b32.clamp", Int32Regs>;
	def SULD_3D_I16_ZERO
	: NVPTXInst<(outs Int16Regs:$r),			defm SULD_2D_ARRAY_V4I8_TRAP
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z),			: SULD_2D_ARRAY_V4<"suld.b.a2d.v4.b8.trap", Int16Regs>;
	"suld.b.3d.b16.zero \\{$r\\}, [$s, \\{$x, $y, $z, $z\\}];",			defm SULD_2D_ARRAY_V4I16_TRAP
	[]>;			: SULD_2D_ARRAY_V4<"suld.b.a2d.v4.b16.trap", Int16Regs>;
	def SULD_3D_I32_ZERO			defm SULD_2D_ARRAY_V4I32_TRAP
	: NVPTXInst<(outs Int32Regs:$r),			: SULD_2D_ARRAY_V4<"suld.b.a2d.v4.b32.trap", Int32Regs>;
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z),
	"suld.b.3d.b32.zero \\{$r\\}, [$s, \\{$x, $y, $z, $z\\}];",			defm SULD_2D_ARRAY_V4I8_ZERO
	[]>;			: SULD_2D_ARRAY_V4<"suld.b.a2d.v4.b8.zero", Int16Regs>;
	def SULD_3D_I64_ZERO			defm SULD_2D_ARRAY_V4I16_ZERO
	: NVPTXInst<(outs Int64Regs:$r),			: SULD_2D_ARRAY_V4<"suld.b.a2d.v4.b16.zero", Int16Regs>;
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z),			defm SULD_2D_ARRAY_V4I32_ZERO
	"suld.b.3d.b64.zero \\{$r\\}, [$s, \\{$x, $y, $z, $z\\}];",			: SULD_2D_ARRAY_V4<"suld.b.a2d.v4.b32.zero", Int32Regs>;
	[]>;
	}			class SULD_3D_V4_base<string inst, NVPTXRegClass outtype, dag surf>
				: NVPTXInst<(outs outtype:$r, outtype:$g, outtype:$b, outtype:$a),
				!con(surf, (ins Int32Regs:$x, Int32Regs:$y, Int32Regs:$z)),
				inst # " \\{$r, $g, $b, $a\\}, [$s, \\{$x, $y, $z, $z\\}];",
				[]>;
				multiclass SULD_3D_V4<string inst, NVPTXRegClass outtype> {
				def _R : SULD_3D_V4_base<inst, outtype, (ins Int64Regs:$s)>;
				def _I : SULD_3D_V4_base<inst, outtype, (ins i64imm:$s)>;
				}

				defm SULD_3D_V4I8_CLAMP : SULD_3D_V4<"suld.b.3d.v4.b8.clamp", Int16Regs>;
				defm SULD_3D_V4I16_CLAMP : SULD_3D_V4<"suld.b.3d.v4.b16.clamp", Int16Regs>;
				defm SULD_3D_V4I32_CLAMP : SULD_3D_V4<"suld.b.3d.v4.b32.clamp", Int32Regs>;

				defm SULD_3D_V4I8_TRAP : SULD_3D_V4<"suld.b.3d.v4.b8.trap", Int16Regs>;
				defm SULD_3D_V4I16_TRAP : SULD_3D_V4<"suld.b.3d.v4.b16.trap", Int16Regs>;
				defm SULD_3D_V4I32_TRAP : SULD_3D_V4<"suld.b.3d.v4.b32.trap", Int32Regs>;

				defm SULD_3D_V4I8_ZERO : SULD_3D_V4<"suld.b.3d.v4.b8.zero", Int16Regs>;
				defm SULD_3D_V4I16_ZERO : SULD_3D_V4<"suld.b.3d.v4.b16.zero", Int16Regs>;
				defm SULD_3D_V4I32_ZERO : SULD_3D_V4<"suld.b.3d.v4.b32.zero", Int32Regs>;

	let IsSuld = 2 in {
	def SULD_1D_V2I8_ZERO
	: NVPTXInst<(outs Int16Regs:$r, Int16Regs:$g),
	(ins Int64Regs:$s, Int32Regs:$x),
	"suld.b.1d.v2.b8.zero \\{$r, $g\\}, [$s, \\{$x\\}];",
	[]>;
	def SULD_1D_V2I16_ZERO
	: NVPTXInst<(outs Int16Regs:$r, Int16Regs:$g),
	(ins Int64Regs:$s, Int32Regs:$x),
	"suld.b.1d.v2.b16.zero \\{$r, $g\\}, [$s, \\{$x\\}];",
	[]>;
	def SULD_1D_V2I32_ZERO
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g),
	(ins Int64Regs:$s, Int32Regs:$x),
	"suld.b.1d.v2.b32.zero \\{$r, $g\\}, [$s, \\{$x\\}];",
	[]>;
	def SULD_1D_V2I64_ZERO
	: NVPTXInst<(outs Int64Regs:$r, Int64Regs:$g),
	(ins Int64Regs:$s, Int32Regs:$x),
	"suld.b.1d.v2.b64.zero \\{$r, $g\\}, [$s, \\{$x\\}];",
	[]>;

	def SULD_1D_ARRAY_V2I8_ZERO
	: NVPTXInst<(outs Int16Regs:$r, Int16Regs:$g),
	(ins Int64Regs:$s, Int32Regs:$l, Int32Regs:$x),
	"suld.b.a1d.v2.b8.zero \\{$r, $g\\}, [$s, \\{$l, $x\\}];",
	[]>;
	def SULD_1D_ARRAY_V2I16_ZERO
	: NVPTXInst<(outs Int16Regs:$r, Int16Regs:$g),
	(ins Int64Regs:$s, Int32Regs:$l, Int32Regs:$x),
	"suld.b.a1d.v2.b16.zero \\{$r, $g\\}, [$s, \\{$l, $x\\}];",
	[]>;
	def SULD_1D_ARRAY_V2I32_ZERO
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g),
	(ins Int64Regs:$s, Int32Regs:$l, Int32Regs:$x),
	"suld.b.a1d.v2.b32.zero \\{$r, $g\\}, [$s, \\{$l, $x\\}];",
	[]>;
	def SULD_1D_ARRAY_V2I64_ZERO
	: NVPTXInst<(outs Int64Regs:$r, Int64Regs:$g),
	(ins Int64Regs:$s, Int32Regs:$l, Int32Regs:$x),
	"suld.b.a1d.v2.b64.zero \\{$r, $g\\}, [$s, \\{$l, $x\\}];",
	[]>;

	def SULD_2D_V2I8_ZERO
	: NVPTXInst<(outs Int16Regs:$r, Int16Regs:$g),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y),
	"suld.b.2d.v2.b8.zero \\{$r, $g\\}, [$s, \\{$x, $y\\}];",
	[]>;
	def SULD_2D_V2I16_ZERO
	: NVPTXInst<(outs Int16Regs:$r, Int16Regs:$g),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y),
	"suld.b.2d.v2.b16.zero \\{$r, $g\\}, [$s, \\{$x, $y\\}];",
	[]>;
	def SULD_2D_V2I32_ZERO
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y),
	"suld.b.2d.v2.b32.zero \\{$r, $g\\}, [$s, \\{$x, $y\\}];",
	[]>;
	def SULD_2D_V2I64_ZERO
	: NVPTXInst<(outs Int64Regs:$r, Int64Regs:$g),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y),
	"suld.b.2d.v2.b64.zero \\{$r, $g\\}, [$s, \\{$x, $y\\}];",
	[]>;

	def SULD_2D_ARRAY_V2I8_ZERO
	: NVPTXInst<(outs Int16Regs:$r, Int16Regs:$g),
	(ins Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y),
	"suld.b.a2d.v2.b8.zero \\{$r, $g\\}, "
	"[$s, \\{$l, $x, $y, $y\\}];",
	[]>;
	def SULD_2D_ARRAY_V2I16_ZERO
	: NVPTXInst<(outs Int16Regs:$r, Int16Regs:$g),
	(ins Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y),
	"suld.b.a2d.v2.b16.zero \\{$r, $g\\}, "
	"[$s, \\{$l, $x, $y, $y\\}];",
	[]>;
	def SULD_2D_ARRAY_V2I32_ZERO
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g),
	(ins Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y),
	"suld.b.a2d.v2.b32.zero \\{$r, $g\\}, "
	"[$s, \\{$l, $x, $y, $y\\}];",
	[]>;
	def SULD_2D_ARRAY_V2I64_ZERO
	: NVPTXInst<(outs Int64Regs:$r, Int64Regs:$g),
	(ins Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y),
	"suld.b.a2d.v2.b64.zero \\{$r, $g\\}, "
	"[$s, \\{$l, $x, $y, $y\\}];",
	[]>;

	def SULD_3D_V2I8_ZERO
	: NVPTXInst<(outs Int16Regs:$r, Int16Regs:$g),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z),
	"suld.b.3d.v2.b8.zero \\{$r, $g\\}, [$s, \\{$x, $y, $z, $z\\}];",
	[]>;
	def SULD_3D_V2I16_ZERO
	: NVPTXInst<(outs Int16Regs:$r, Int16Regs:$g),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z),
	"suld.b.3d.v2.b16.zero \\{$r, $g\\}, [$s, \\{$x, $y, $z, $z\\}];",
	[]>;
	def SULD_3D_V2I32_ZERO
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z),
	"suld.b.3d.v2.b32.zero \\{$r, $g\\}, [$s, \\{$x, $y, $z, $z\\}];",
	[]>;
	def SULD_3D_V2I64_ZERO
	: NVPTXInst<(outs Int64Regs:$r, Int64Regs:$g),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z),
	"suld.b.3d.v2.b64.zero \\{$r, $g\\}, [$s, \\{$x, $y, $z, $z\\}];",
	[]>;
	}

	let IsSuld = 3 in {
	def SULD_1D_V4I8_ZERO
	: NVPTXInst<(outs Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),
	(ins Int64Regs:$s, Int32Regs:$x),
	"suld.b.1d.v4.b8.zero \\{$r, $g, $b, $a\\}, [$s, \\{$x\\}];",
	[]>;
	def SULD_1D_V4I16_ZERO
	: NVPTXInst<(outs Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),
	(ins Int64Regs:$s, Int32Regs:$x),
	"suld.b.1d.v4.b16.zero \\{$r, $g, $b, $a\\}, [$s, \\{$x\\}];",
	[]>;
	def SULD_1D_V4I32_ZERO
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g, Int32Regs:$b, Int32Regs:$a),
	(ins Int64Regs:$s, Int32Regs:$x),
	"suld.b.1d.v4.b32.zero \\{$r, $g, $b, $a\\}, [$s, \\{$x\\}];",
	[]>;

	def SULD_1D_ARRAY_V4I8_ZERO
	: NVPTXInst<(outs Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),
	(ins Int64Regs:$s, Int32Regs:$l, Int32Regs:$x),
	"suld.b.a1d.v4.b8.zero \\{$r, $g, $b, $a\\}, "
	"[$s, \\{$l, $x\\}];",
	[]>;
	def SULD_1D_ARRAY_V4I16_ZERO
	: NVPTXInst<(outs Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),
	(ins Int64Regs:$s, Int32Regs:$l, Int32Regs:$x),
	"suld.b.a1d.v4.b16.zero \\{$r, $g, $b, $a\\}, "
	"[$s, \\{$l, $x\\}];",
	[]>;
	def SULD_1D_ARRAY_V4I32_ZERO
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g, Int32Regs:$b, Int32Regs:$a),
	(ins Int64Regs:$s, Int32Regs:$l, Int32Regs:$x),
	"suld.b.a1d.v4.b32.zero \\{$r, $g, $b, $a\\}, "
	"[$s, \\{$l, $x\\}];",
	[]>;

	def SULD_2D_V4I8_ZERO
	: NVPTXInst<(outs Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y),
	"suld.b.2d.v4.b8.zero \\{$r, $g, $b, $a\\}, [$s, \\{$x, $y\\}];",
	[]>;
	def SULD_2D_V4I16_ZERO
	: NVPTXInst<(outs Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y),
	"suld.b.2d.v4.b16.zero \\{$r, $g, $b, $a\\}, [$s, \\{$x, $y\\}];",
	[]>;
	def SULD_2D_V4I32_ZERO
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g, Int32Regs:$b, Int32Regs:$a),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y),
	"suld.b.2d.v4.b32.zero \\{$r, $g, $b, $a\\}, [$s, \\{$x, $y\\}];",
	[]>;

	def SULD_2D_ARRAY_V4I8_ZERO
	: NVPTXInst<(outs Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),
	(ins Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y),
	"suld.b.a2d.v4.b8.zero \\{$r, $g, $b, $a\\}, "
	"[$s, \\{$l, $x, $y, $y\\}];",
	[]>;
	def SULD_2D_ARRAY_V4I16_ZERO
	: NVPTXInst<(outs Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),
	(ins Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y),
	"suld.b.a2d.v4.b16.zero \\{$r, $g, $b, $a\\}, "
	"[$s, \\{$l, $x, $y, $y\\}];",
	[]>;
	def SULD_2D_ARRAY_V4I32_ZERO
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g, Int32Regs:$b, Int32Regs:$a),
	(ins Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y),
	"suld.b.a2d.v4.b32.zero \\{$r, $g, $b, $a\\}, "
	"[$s, \\{$l, $x, $y, $y\\}];",
	[]>;


	def SULD_3D_V4I8_ZERO
	: NVPTXInst<(outs Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z),
	"suld.b.3d.v4.b8.zero \\{$r, $g, $b, $a\\}, "
	"[$s, \\{$x, $y, $z, $z\\}];",
	[]>;
	def SULD_3D_V4I16_ZERO
	: NVPTXInst<(outs Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z),
	"suld.b.3d.v4.b16.zero \\{$r, $g, $b, $a\\}, "
	"[$s, \\{$x, $y, $z, $z\\}];",
	[]>;
	def SULD_3D_V4I32_ZERO
	: NVPTXInst<(outs Int32Regs:$r, Int32Regs:$g, Int32Regs:$b, Int32Regs:$a),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z),
	"suld.b.3d.v4.b32.zero \\{$r, $g, $b, $a\\}, "
	"[$s, \\{$x, $y, $z, $z\\}];",
	[]>;
	}			}

	//-----------------------------------			//-----------------------------------
	// Texture Query Intrinsics			// Texture Query Intrinsics
	//-----------------------------------			//-----------------------------------

	let IsSurfTexQuery = true in {			let IsSurfTexQuery = true in {
	def TXQ_CHANNEL_ORDER			def TXQ_CHANNEL_ORDER_R
	: NVPTXInst<(outs Int32Regs:$d), (ins Int64Regs:$a),			: NVPTXInst<(outs Int32Regs:$d), (ins Int64Regs:$a),
	"txq.channel_order.b32 \t$d, [$a];",			"txq.channel_order.b32 \t$d, [$a];",
	[]>;			[]>;
	def TXQ_CHANNEL_DATA_TYPE			def TXQ_CHANNEL_ORDER_I
				: NVPTXInst<(outs Int32Regs:$d), (ins i64imm:$a),
				"txq.channel_order.b32 \t$d, [$a];",
				[]>;
				def TXQ_CHANNEL_DATA_TYPE_R
	: NVPTXInst<(outs Int32Regs:$d), (ins Int64Regs:$a),			: NVPTXInst<(outs Int32Regs:$d), (ins Int64Regs:$a),
	"txq.channel_data_type.b32 \t$d, [$a];",			"txq.channel_data_type.b32 \t$d, [$a];",
	[]>;			[]>;
	def TXQ_WIDTH			def TXQ_CHANNEL_DATA_TYPE_I
				: NVPTXInst<(outs Int32Regs:$d), (ins i64imm:$a),
				"txq.channel_data_type.b32 \t$d, [$a];",
				[]>;
				def TXQ_WIDTH_R
	: NVPTXInst<(outs Int32Regs:$d), (ins Int64Regs:$a),			: NVPTXInst<(outs Int32Regs:$d), (ins Int64Regs:$a),
	"txq.width.b32 \t$d, [$a];",			"txq.width.b32 \t$d, [$a];",
	[]>;			[]>;
	def TXQ_HEIGHT			def TXQ_WIDTH_I
				: NVPTXInst<(outs Int32Regs:$d), (ins i64imm:$a),
				"txq.width.b32 \t$d, [$a];",
				[]>;
				def TXQ_HEIGHT_R
	: NVPTXInst<(outs Int32Regs:$d), (ins Int64Regs:$a),			: NVPTXInst<(outs Int32Regs:$d), (ins Int64Regs:$a),
	"txq.height.b32 \t$d, [$a];",			"txq.height.b32 \t$d, [$a];",
	[]>;			[]>;
	def TXQ_DEPTH			def TXQ_HEIGHT_I
				: NVPTXInst<(outs Int32Regs:$d), (ins i64imm:$a),
				"txq.height.b32 \t$d, [$a];",
				[]>;
				def TXQ_DEPTH_R
	: NVPTXInst<(outs Int32Regs:$d), (ins Int64Regs:$a),			: NVPTXInst<(outs Int32Regs:$d), (ins Int64Regs:$a),
	"txq.depth.b32 \t$d, [$a];",			"txq.depth.b32 \t$d, [$a];",
	[]>;			[]>;
	def TXQ_ARRAY_SIZE			def TXQ_DEPTH_I
				: NVPTXInst<(outs Int32Regs:$d), (ins i64imm:$a),
				"txq.depth.b32 \t$d, [$a];",
				[]>;
				def TXQ_ARRAY_SIZE_R
	: NVPTXInst<(outs Int32Regs:$d), (ins Int64Regs:$a),			: NVPTXInst<(outs Int32Regs:$d), (ins Int64Regs:$a),
	"txq.array_size.b32 \t$d, [$a];",			"txq.array_size.b32 \t$d, [$a];",
	[]>;			[]>;
	def TXQ_NUM_SAMPLES			def TXQ_ARRAY_SIZE_I
				: NVPTXInst<(outs Int32Regs:$d), (ins i64imm:$a),
				"txq.array_size.b32 \t$d, [$a];",
				[]>;
				def TXQ_NUM_SAMPLES_R
	: NVPTXInst<(outs Int32Regs:$d), (ins Int64Regs:$a),			: NVPTXInst<(outs Int32Regs:$d), (ins Int64Regs:$a),
	"txq.num_samples.b32 \t$d, [$a];",			"txq.num_samples.b32 \t$d, [$a];",
	[]>;			[]>;
	def TXQ_NUM_MIPMAP_LEVELS			def TXQ_NUM_SAMPLES_I
				: NVPTXInst<(outs Int32Regs:$d), (ins i64imm:$a),
				"txq.num_samples.b32 \t$d, [$a];",
				[]>;
				def TXQ_NUM_MIPMAP_LEVELS_R
	: NVPTXInst<(outs Int32Regs:$d), (ins Int64Regs:$a),			: NVPTXInst<(outs Int32Regs:$d), (ins Int64Regs:$a),
	"txq.num_mipmap_levels.b32 \t$d, [$a];",			"txq.num_mipmap_levels.b32 \t$d, [$a];",
	[]>;			[]>;
				def TXQ_NUM_MIPMAP_LEVELS_I
				: NVPTXInst<(outs Int32Regs:$d), (ins i64imm:$a),
				"txq.num_mipmap_levels.b32 \t$d, [$a];",
				[]>;
	}			}

	def : Pat<(int_nvvm_txq_channel_order Int64Regs:$a),			def : Pat<(int_nvvm_txq_channel_order Int64Regs:$a),
	(TXQ_CHANNEL_ORDER Int64Regs:$a)>;			(TXQ_CHANNEL_ORDER_R Int64Regs:$a)>;
	def : Pat<(int_nvvm_txq_channel_data_type Int64Regs:$a),			def : Pat<(int_nvvm_txq_channel_data_type Int64Regs:$a),
	(TXQ_CHANNEL_DATA_TYPE Int64Regs:$a)>;			(TXQ_CHANNEL_DATA_TYPE_R Int64Regs:$a)>;
	def : Pat<(int_nvvm_txq_width Int64Regs:$a),			def : Pat<(int_nvvm_txq_width Int64Regs:$a),
	(TXQ_WIDTH Int64Regs:$a)>;			(TXQ_WIDTH_R Int64Regs:$a)>;
	def : Pat<(int_nvvm_txq_height Int64Regs:$a),			def : Pat<(int_nvvm_txq_height Int64Regs:$a),
	(TXQ_HEIGHT Int64Regs:$a)>;			(TXQ_HEIGHT_R Int64Regs:$a)>;
	def : Pat<(int_nvvm_txq_depth Int64Regs:$a),			def : Pat<(int_nvvm_txq_depth Int64Regs:$a),
	(TXQ_DEPTH Int64Regs:$a)>;			(TXQ_DEPTH_R Int64Regs:$a)>;
	def : Pat<(int_nvvm_txq_array_size Int64Regs:$a),			def : Pat<(int_nvvm_txq_array_size Int64Regs:$a),
	(TXQ_ARRAY_SIZE Int64Regs:$a)>;			(TXQ_ARRAY_SIZE_R Int64Regs:$a)>;
	def : Pat<(int_nvvm_txq_num_samples Int64Regs:$a),			def : Pat<(int_nvvm_txq_num_samples Int64Regs:$a),
	(TXQ_NUM_SAMPLES Int64Regs:$a)>;			(TXQ_NUM_SAMPLES_R Int64Regs:$a)>;
	def : Pat<(int_nvvm_txq_num_mipmap_levels Int64Regs:$a),			def : Pat<(int_nvvm_txq_num_mipmap_levels Int64Regs:$a),
	(TXQ_NUM_MIPMAP_LEVELS Int64Regs:$a)>;			(TXQ_NUM_MIPMAP_LEVELS_R Int64Regs:$a)>;


	//-----------------------------------			//-----------------------------------
	// Surface Query Intrinsics			// Surface Query Intrinsics
	//-----------------------------------			//-----------------------------------

	let IsSurfTexQuery = true in {			let IsSurfTexQuery = true in {
	def SUQ_CHANNEL_ORDER			def SUQ_CHANNEL_ORDER_R
	: NVPTXInst<(outs Int32Regs:$d), (ins Int64Regs:$a),			: NVPTXInst<(outs Int32Regs:$d), (ins Int64Regs:$a),
	"suq.channel_order.b32 \t$d, [$a];",			"suq.channel_order.b32 \t$d, [$a];",
	[]>;			[]>;
	def SUQ_CHANNEL_DATA_TYPE			def SUQ_CHANNEL_ORDER_I
				: NVPTXInst<(outs Int32Regs:$d), (ins i64imm:$a),
				"suq.channel_order.b32 \t$d, [$a];",
				[]>;
				def SUQ_CHANNEL_DATA_TYPE_R
	: NVPTXInst<(outs Int32Regs:$d), (ins Int64Regs:$a),			: NVPTXInst<(outs Int32Regs:$d), (ins Int64Regs:$a),
	"suq.channel_data_type.b32 \t$d, [$a];",			"suq.channel_data_type.b32 \t$d, [$a];",
	[]>;			[]>;
	def SUQ_WIDTH			def SUQ_CHANNEL_DATA_TYPE_I
				: NVPTXInst<(outs Int32Regs:$d), (ins i64imm:$a),
				"suq.channel_data_type.b32 \t$d, [$a];",
				[]>;
				def SUQ_WIDTH_R
	: NVPTXInst<(outs Int32Regs:$d), (ins Int64Regs:$a),			: NVPTXInst<(outs Int32Regs:$d), (ins Int64Regs:$a),
	"suq.width.b32 \t$d, [$a];",			"suq.width.b32 \t$d, [$a];",
	[]>;			[]>;
	def SUQ_HEIGHT			def SUQ_WIDTH_I
				: NVPTXInst<(outs Int32Regs:$d), (ins i64imm:$a),
				"suq.width.b32 \t$d, [$a];",
				[]>;
				def SUQ_HEIGHT_R
	: NVPTXInst<(outs Int32Regs:$d), (ins Int64Regs:$a),			: NVPTXInst<(outs Int32Regs:$d), (ins Int64Regs:$a),
	"suq.height.b32 \t$d, [$a];",			"suq.height.b32 \t$d, [$a];",
	[]>;			[]>;
	def SUQ_DEPTH			def SUQ_HEIGHT_I
				: NVPTXInst<(outs Int32Regs:$d), (ins i64imm:$a),
				"suq.height.b32 \t$d, [$a];",
				[]>;
				def SUQ_DEPTH_R
	: NVPTXInst<(outs Int32Regs:$d), (ins Int64Regs:$a),			: NVPTXInst<(outs Int32Regs:$d), (ins Int64Regs:$a),
	"suq.depth.b32 \t$d, [$a];",			"suq.depth.b32 \t$d, [$a];",
	[]>;			[]>;
	def SUQ_ARRAY_SIZE			def SUQ_DEPTH_I
				: NVPTXInst<(outs Int32Regs:$d), (ins i64imm:$a),
				"suq.depth.b32 \t$d, [$a];",
				[]>;
				def SUQ_ARRAY_SIZE_R
	: NVPTXInst<(outs Int32Regs:$d), (ins Int64Regs:$a),			: NVPTXInst<(outs Int32Regs:$d), (ins Int64Regs:$a),
	"suq.array_size.b32 \t$d, [$a];",			"suq.array_size.b32 \t$d, [$a];",
	[]>;			[]>;
				def SUQ_ARRAY_SIZE_I
				: NVPTXInst<(outs Int32Regs:$d), (ins i64imm:$a),
				"suq.array_size.b32 \t$d, [$a];",
				[]>;
	}			}

	def : Pat<(int_nvvm_suq_channel_order Int64Regs:$a),			def : Pat<(int_nvvm_suq_channel_order Int64Regs:$a),
	(SUQ_CHANNEL_ORDER Int64Regs:$a)>;			(SUQ_CHANNEL_ORDER_R Int64Regs:$a)>;
	def : Pat<(int_nvvm_suq_channel_data_type Int64Regs:$a),			def : Pat<(int_nvvm_suq_channel_data_type Int64Regs:$a),
	(SUQ_CHANNEL_DATA_TYPE Int64Regs:$a)>;			(SUQ_CHANNEL_DATA_TYPE_R Int64Regs:$a)>;
	def : Pat<(int_nvvm_suq_width Int64Regs:$a),			def : Pat<(int_nvvm_suq_width Int64Regs:$a),
	(SUQ_WIDTH Int64Regs:$a)>;			(SUQ_WIDTH_R Int64Regs:$a)>;
	def : Pat<(int_nvvm_suq_height Int64Regs:$a),			def : Pat<(int_nvvm_suq_height Int64Regs:$a),
	(SUQ_HEIGHT Int64Regs:$a)>;			(SUQ_HEIGHT_R Int64Regs:$a)>;
	def : Pat<(int_nvvm_suq_depth Int64Regs:$a),			def : Pat<(int_nvvm_suq_depth Int64Regs:$a),
	(SUQ_DEPTH Int64Regs:$a)>;			(SUQ_DEPTH_R Int64Regs:$a)>;
	def : Pat<(int_nvvm_suq_array_size Int64Regs:$a),			def : Pat<(int_nvvm_suq_array_size Int64Regs:$a),
	(SUQ_ARRAY_SIZE Int64Regs:$a)>;			(SUQ_ARRAY_SIZE_R Int64Regs:$a)>;


	//===- Handle Query -------------------------------------------------------===//			//===- Handle Query -------------------------------------------------------===//

	// TODO: These intrinsics are not yet finalized, pending PTX ISA design work			// TODO: These intrinsics are not yet finalized, pending PTX ISA design work
	def ISTYPEP_SAMPLER			def ISTYPEP_SAMPLER
	: NVPTXInst<(outs Int1Regs:$d), (ins Int64Regs:$a),			: NVPTXInst<(outs Int1Regs:$d), (ins Int64Regs:$a),
	"istypep.samplerref \t$d, $a;",			"istypep.samplerref \t$d, $a;",
	[(set Int1Regs:$d, (int_nvvm_istypep_sampler Int64Regs:$a))]>;			[(set Int1Regs:$d, (int_nvvm_istypep_sampler Int64Regs:$a))]>;
	def ISTYPEP_SURFACE			def ISTYPEP_SURFACE
	: NVPTXInst<(outs Int1Regs:$d), (ins Int64Regs:$a),			: NVPTXInst<(outs Int1Regs:$d), (ins Int64Regs:$a),
	"istypep.surfref \t$d, $a;",			"istypep.surfref \t$d, $a;",
	[(set Int1Regs:$d, (int_nvvm_istypep_surface Int64Regs:$a))]>;			[(set Int1Regs:$d, (int_nvvm_istypep_surface Int64Regs:$a))]>;
	def ISTYPEP_TEXTURE			def ISTYPEP_TEXTURE
	: NVPTXInst<(outs Int1Regs:$d), (ins Int64Regs:$a),			: NVPTXInst<(outs Int1Regs:$d), (ins Int64Regs:$a),
	"istypep.texref \t$d, $a;",			"istypep.texref \t$d, $a;",
	[(set Int1Regs:$d, (int_nvvm_istypep_texture Int64Regs:$a))]>;			[(set Int1Regs:$d, (int_nvvm_istypep_texture Int64Regs:$a))]>;

	//===- Surface Stores -----------------------------------------------------===//			//===- Surface Stores -----------------------------------------------------===//

	let IsSust = true in {			let IsSust = true in {
	// Unformatted
	// .clamp variant
	def SUST_B_1D_B8_CLAMP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int16Regs:$r),
	"sust.b.1d.b8.clamp \t[$s, \\{$x\\}], \\{$r\\};",
	[]>;
	def SUST_B_1D_B16_CLAMP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int16Regs:$r),
	"sust.b.1d.b16.clamp \t[$s, \\{$x\\}], \\{$r\\};",
	[]>;
	def SUST_B_1D_B32_CLAMP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$r),
	"sust.b.1d.b32.clamp \t[$s, \\{$x\\}], \\{$r\\};",
	[]>;
	def SUST_B_1D_B64_CLAMP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int64Regs:$r),
	"sust.b.1d.b64.clamp \t[$s, \\{$x\\}], \\{$r\\};",
	[]>;
	def SUST_B_1D_V2B8_CLAMP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int16Regs:$r, Int16Regs:$g),
	"sust.b.1d.v2.b8.clamp \t[$s, \\{$x\\}], \\{$r, $g\\};",
	[]>;
	def SUST_B_1D_V2B16_CLAMP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int16Regs:$r, Int16Regs:$g),
	"sust.b.1d.v2.b16.clamp \t[$s, \\{$x\\}], \\{$r, $g\\};",
	[]>;
	def SUST_B_1D_V2B32_CLAMP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$r, Int32Regs:$g),
	"sust.b.1d.v2.b32.clamp \t[$s, \\{$x\\}], \\{$r, $g\\};",
	[]>;
	def SUST_B_1D_V2B64_CLAMP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int64Regs:$r, Int64Regs:$g),
	"sust.b.1d.v2.b64.clamp \t[$s, \\{$x\\}], \\{$r, $g\\};",
	[]>;
	def SUST_B_1D_V4B8_CLAMP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int16Regs:$r, Int16Regs:$g,
	Int16Regs:$b, Int16Regs:$a),
	"sust.b.1d.v4.b8.clamp \t[$s, \\{$x\\}], \\{$r, $g, $b, $a\\};",
	[]>;
	def SUST_B_1D_V4B16_CLAMP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int16Regs:$r, Int16Regs:$g,
	Int16Regs:$b, Int16Regs:$a),
	"sust.b.1d.v4.b16.clamp \t[$s, \\{$x\\}], \\{$r, $g, $b, $a\\};",
	[]>;
	def SUST_B_1D_V4B32_CLAMP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$r, Int32Regs:$g,
	Int32Regs:$b, Int32Regs:$a),
	"sust.b.1d.v4.b32.clamp \t[$s, \\{$x\\}], \\{$r, $g, $b, $a\\};",
	[]>;


	def SUST_B_1D_ARRAY_B8_CLAMP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$idx, Int32Regs:$x, Int16Regs:$r),
	"sust.b.a1d.b8.clamp \t[$s, \\{$idx, $x\\}], \\{$r\\};",
	[]>;
	def SUST_B_1D_ARRAY_B16_CLAMP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$idx, Int32Regs:$x, Int16Regs:$r),
	"sust.b.a1d.b16.clamp \t[$s, \\{$idx, $x\\}], \\{$r\\};",
	[]>;
	def SUST_B_1D_ARRAY_B32_CLAMP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$idx, Int32Regs:$x, Int32Regs:$r),
	"sust.b.a1d.b32.clamp \t[$s, \\{$idx, $x\\}], \\{$r\\};",
	[]>;
	def SUST_B_1D_ARRAY_B64_CLAMP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$idx, Int32Regs:$x, Int64Regs:$r),
	"sust.b.a1d.b64.clamp \t[$s, \\{$idx, $x\\}], \\{$r\\};",
	[]>;
	def SUST_B_1D_ARRAY_V2B8_CLAMP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$idx, Int32Regs:$x, Int16Regs:$r,
	Int16Regs:$g),
	"sust.b.a1d.v2.b8.clamp \t[$s, \\{$idx, $x\\}], \\{$r, $g\\};",
	[]>;
	def SUST_B_1D_ARRAY_V2B16_CLAMP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$idx, Int32Regs:$x, Int16Regs:$r,
	Int16Regs:$g),
	"sust.b.a1d.v2.b16.clamp \t[$s, \\{$idx, $x\\}], \\{$r, $g\\};",
	[]>;
	def SUST_B_1D_ARRAY_V2B32_CLAMP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$idx, Int32Regs:$x, Int32Regs:$r,
	Int32Regs:$g),
	"sust.b.a1d.v2.b32.clamp \t[$s, \\{$idx, $x\\}], \\{$r, $g\\};",
	[]>;
	def SUST_B_1D_ARRAY_V2B64_CLAMP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$idx, Int32Regs:$x, Int64Regs:$r,
	Int64Regs:$g),
	"sust.b.a1d.v2.b64.clamp \t[$s, \\{$idx, $x\\}], \\{$r, $g\\};",
	[]>;
	def SUST_B_1D_ARRAY_V4B8_CLAMP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$idx, Int32Regs:$x, Int16Regs:$r,
	Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),
	"sust.b.a1d.v4.b8.clamp \t[$s, \\{$idx, $x\\}], "
	"\\{$r, $g, $b, $a\\};",
	[]>;
	def SUST_B_1D_ARRAY_V4B16_CLAMP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$idx, Int32Regs:$x, Int16Regs:$r,
	Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),
	"sust.b.a1d.v4.b16.clamp \t[$s, \\{$idx, $x\\}], "
	"\\{$r, $g, $b, $a\\};",
	[]>;
	def SUST_B_1D_ARRAY_V4B32_CLAMP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$idx, Int32Regs:$x, Int32Regs:$r,
	Int32Regs:$g, Int32Regs:$b, Int32Regs:$a),
	"sust.b.a1d.v4.b32.clamp \t[$s, \\{$idx, $x\\}], "
	"\\{$r, $g, $b, $a\\};",
	[]>;


	def SUST_B_2D_B8_CLAMP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int16Regs:$r),
	"sust.b.2d.b8.clamp \t[$s, \\{$x, $y\\}], \\{$r\\};",
	[]>;
	def SUST_B_2D_B16_CLAMP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int16Regs:$r),
	"sust.b.2d.b16.clamp \t[$s, \\{$x, $y\\}], \\{$r\\};",
	[]>;
	def SUST_B_2D_B32_CLAMP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$r),
	"sust.b.2d.b32.clamp \t[$s, \\{$x, $y\\}], \\{$r\\};",
	[]>;
	def SUST_B_2D_B64_CLAMP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int64Regs:$r),
	"sust.b.2d.b64.clamp \t[$s, \\{$x, $y\\}], \\{$r\\};",
	[]>;
	def SUST_B_2D_V2B8_CLAMP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int16Regs:$r,
	Int16Regs:$g),
	"sust.b.2d.v2.b8.clamp \t[$s, \\{$x, $y\\}], \\{$r, $g\\};",
	[]>;
	def SUST_B_2D_V2B16_CLAMP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int16Regs:$r,
	Int16Regs:$g),
	"sust.b.2d.v2.b16.clamp \t[$s, \\{$x, $y\\}], \\{$r, $g\\};",
	[]>;
	def SUST_B_2D_V2B32_CLAMP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$r,
	Int32Regs:$g),
	"sust.b.2d.v2.b32.clamp \t[$s, \\{$x, $y\\}], \\{$r, $g\\};",
	[]>;
	def SUST_B_2D_V2B64_CLAMP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int64Regs:$r,
	Int64Regs:$g),
	"sust.b.2d.v2.b64.clamp \t[$s, \\{$x, $y\\}], \\{$r, $g\\};",
	[]>;
	def SUST_B_2D_V4B8_CLAMP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int16Regs:$r,
	Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),
	"sust.b.2d.v4.b8.clamp \t[$s, \\{$x, $y\\}], "
	"\\{$r, $g, $b, $a\\};",
	[]>;
	def SUST_B_2D_V4B16_CLAMP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int16Regs:$r,
	Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),
	"sust.b.2d.v4.b16.clamp \t[$s, \\{$x, $y\\}], "
	"\\{$r, $g, $b, $a\\};",
	[]>;
	def SUST_B_2D_V4B32_CLAMP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$r,
	Int32Regs:$g, Int32Regs:$b, Int32Regs:$a),
	"sust.b.2d.v4.b32.clamp \t[$s, \\{$x, $y\\}], "
	"\\{$r, $g, $b, $a\\};",
	[]>;


	def SUST_B_2D_ARRAY_B8_CLAMP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$idx, Int32Regs:$x, Int32Regs:$y,
	Int16Regs:$r),
	"sust.b.a2d.b8.clamp \t[$s, \\{$idx, $x, $y, $y\\}], \\{$r\\};",
	[]>;
	def SUST_B_2D_ARRAY_B16_CLAMP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$idx, Int32Regs:$x, Int32Regs:$y,
	Int16Regs:$r),
	"sust.b.a2d.b16.clamp \t[$s, \\{$idx, $x, $y, $y\\}], \\{$r\\};",
	[]>;
	def SUST_B_2D_ARRAY_B32_CLAMP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$idx, Int32Regs:$x, Int32Regs:$y,
	Int32Regs:$r),
	"sust.b.a2d.b32.clamp \t[$s, \\{$idx, $x, $y, $y\\}], \\{$r\\};",
	[]>;
	def SUST_B_2D_ARRAY_B64_CLAMP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$idx, Int32Regs:$x, Int32Regs:$y,
	Int64Regs:$r),
	"sust.b.a2d.b64.clamp \t[$s, \\{$idx, $x, $y, $y\\}], \\{$r\\};",
	[]>;
	def SUST_B_2D_ARRAY_V2B8_CLAMP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$idx, Int32Regs:$x, Int32Regs:$y,
	Int16Regs:$r, Int16Regs:$g),
	"sust.b.a2d.v2.b8.clamp \t[$s, \\{$idx, $x, $y, $y\\}], "
	"\\{$r, $g\\};",
	[]>;
	def SUST_B_2D_ARRAY_V2B16_CLAMP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$idx, Int32Regs:$x, Int32Regs:$y,
	Int16Regs:$r, Int16Regs:$g),
	"sust.b.a2d.v2.b16.clamp \t[$s, \\{$idx, $x, $y, $y\\}], "
	"\\{$r, $g\\};",
	[]>;
	def SUST_B_2D_ARRAY_V2B32_CLAMP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$idx, Int32Regs:$x, Int32Regs:$y,
	Int32Regs:$r, Int32Regs:$g),
	"sust.b.a2d.v2.b32.clamp \t[$s, \\{$idx, $x, $y, $y\\}], "
	"\\{$r, $g\\};",
	[]>;
	def SUST_B_2D_ARRAY_V2B64_CLAMP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$idx, Int32Regs:$x, Int32Regs:$y,
	Int64Regs:$r, Int64Regs:$g),
	"sust.b.a2d.v2.b64.clamp \t[$s, \\{$idx, $x, $y, $y\\}], "
	"\\{$r, $g\\};",
	[]>;
	def SUST_B_2D_ARRAY_V4B8_CLAMP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$idx, Int32Regs:$x, Int32Regs:$y,
	Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),
	"sust.b.a2d.v4.b8.clamp \t[$s, \\{$idx, $x, $y, $y\\}], "
	"\\{$r, $g, $b, $a\\};",
	[]>;
	def SUST_B_2D_ARRAY_V4B16_CLAMP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$idx, Int32Regs:$x, Int32Regs:$y,
	Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),
	"sust.b.a2d.v4.b16.clamp \t[$s, \\{$idx, $x, $y, $y\\}], "
	"\\{$r, $g, $b, $a\\};",
	[]>;
	def SUST_B_2D_ARRAY_V4B32_CLAMP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$idx, Int32Regs:$x, Int32Regs:$y,
	Int32Regs:$r, Int32Regs:$g, Int32Regs:$b, Int32Regs:$a),
	"sust.b.a2d.v4.b32.clamp \t[$s, \\{$idx, $x, $y, $y\\}], "
	"\\{$r, $g, $b, $a\\};",
	[]>;


	def SUST_B_3D_B8_CLAMP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int16Regs:$r),
	"sust.b.3d.b8.clamp \t[$s, \\{$x, $y, $z, $z\\}], \\{$r\\};",
	[]>;
	def SUST_B_3D_B16_CLAMP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int16Regs:$r),
	"sust.b.3d.b16.clamp \t[$s, \\{$x, $y, $z, $z\\}], \\{$r\\};",
	[]>;
	def SUST_B_3D_B32_CLAMP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int32Regs:$r),
	"sust.b.3d.b32.clamp \t[$s, \\{$x, $y, $z, $z\\}], \\{$r\\};",
	[]>;
	def SUST_B_3D_B64_CLAMP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int64Regs:$r),
	"sust.b.3d.b64.clamp \t[$s, \\{$x, $y, $z, $z\\}], \\{$r\\};",
	[]>;
	def SUST_B_3D_V2B8_CLAMP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int16Regs:$r, Int16Regs:$g),
	"sust.b.3d.v2.b8.clamp \t[$s, \\{$x, $y, $z, $z\\}], "
	"\\{$r, $g\\};",
	[]>;
	def SUST_B_3D_V2B16_CLAMP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int16Regs:$r, Int16Regs:$g),
	"sust.b.3d.v2.b16.clamp \t[$s, \\{$x, $y, $z, $z\\}], "
	"\\{$r, $g\\};",
	[]>;
	def SUST_B_3D_V2B32_CLAMP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int32Regs:$r, Int32Regs:$g),
	"sust.b.3d.v2.b32.clamp \t[$s, \\{$x, $y, $z, $z\\}], "
	"\\{$r, $g\\};",
	[]>;
	def SUST_B_3D_V2B64_CLAMP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int64Regs:$r, Int64Regs:$g),
	"sust.b.3d.v2.b64.clamp \t[$s, \\{$x, $y, $z, $z\\}], "
	"\\{$r, $g\\};",
	[]>;
	def SUST_B_3D_V4B8_CLAMP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),
	"sust.b.3d.v4.b8.clamp \t[$s, \\{$x, $y, $z, $z\\}], "
	"\\{$r, $g, $b, $a\\};",
	[]>;
	def SUST_B_3D_V4B16_CLAMP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),
	"sust.b.3d.v4.b16.clamp \t[$s, \\{$x, $y, $z, $z\\}], "
	"\\{$r, $g, $b, $a\\};",
	[]>;
	def SUST_B_3D_V4B32_CLAMP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int32Regs:$r, Int32Regs:$g, Int32Regs:$b, Int32Regs:$a),
	"sust.b.3d.v4.b32.clamp \t[$s, \\{$x, $y, $z, $z\\}], "
	"\\{$r, $g, $b, $a\\};",
	[]>;


	// .trap variant
	def SUST_B_1D_B8_TRAP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int16Regs:$r),
	"sust.b.1d.b8.trap \t[$s, \\{$x\\}], \\{$r\\};",
	[]>;
	def SUST_B_1D_B16_TRAP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int16Regs:$r),
	"sust.b.1d.b16.trap \t[$s, \\{$x\\}], \\{$r\\};",
	[]>;
	def SUST_B_1D_B32_TRAP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$r),
	"sust.b.1d.b32.trap \t[$s, \\{$x\\}], \\{$r\\};",
	[]>;
	def SUST_B_1D_B64_TRAP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int64Regs:$r),
	"sust.b.1d.b64.trap \t[$s, \\{$x\\}], \\{$r\\};",
	[]>;
	def SUST_B_1D_V2B8_TRAP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int16Regs:$r, Int16Regs:$g),
	"sust.b.1d.v2.b8.trap \t[$s, \\{$x\\}], \\{$r, $g\\};",
	[]>;
	def SUST_B_1D_V2B16_TRAP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int16Regs:$r, Int16Regs:$g),
	"sust.b.1d.v2.b16.trap \t[$s, \\{$x\\}], \\{$r, $g\\};",
	[]>;
	def SUST_B_1D_V2B32_TRAP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$r, Int32Regs:$g),
	"sust.b.1d.v2.b32.trap \t[$s, \\{$x\\}], \\{$r, $g\\};",
	[]>;
	def SUST_B_1D_V2B64_TRAP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int64Regs:$r, Int64Regs:$g),
	"sust.b.1d.v2.b64.trap \t[$s, \\{$x\\}], \\{$r, $g\\};",
	[]>;
	def SUST_B_1D_V4B8_TRAP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int16Regs:$r, Int16Regs:$g,
	Int16Regs:$b, Int16Regs:$a),
	"sust.b.1d.v4.b8.trap \t[$s, \\{$x\\}], \\{$r, $g, $b, $a\\};",
	[]>;
	def SUST_B_1D_V4B16_TRAP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int16Regs:$r, Int16Regs:$g,
	Int16Regs:$b, Int16Regs:$a),
	"sust.b.1d.v4.b16.trap \t[$s, \\{$x\\}], \\{$r, $g, $b, $a\\};",
	[]>;
	def SUST_B_1D_V4B32_TRAP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$r, Int32Regs:$g,
	Int32Regs:$b, Int32Regs:$a),
	"sust.b.1d.v4.b32.trap \t[$s, \\{$x\\}], \\{$r, $g, $b, $a\\};",
	[]>;


	def SUST_B_1D_ARRAY_B8_TRAP			class SUST_1D_base<string inst, NVPTXRegClass intype, dag surf>
	: NVPTXInst<(outs),			: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$idx, Int32Regs:$x, Int16Regs:$r),			!con(surf, (ins Int32Regs:$x, intype:$r)),
	"sust.b.a1d.b8.trap \t[$s, \\{$idx, $x\\}], \\{$r\\};",			inst # " \t[$s, \\{$x\\}], \\{$r\\};",
	[]>;
	def SUST_B_1D_ARRAY_B16_TRAP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$idx, Int32Regs:$x, Int16Regs:$r),
	"sust.b.a1d.b16.trap \t[$s, \\{$idx, $x\\}], \\{$r\\};",
	[]>;
	def SUST_B_1D_ARRAY_B32_TRAP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$idx, Int32Regs:$x, Int32Regs:$r),
	"sust.b.a1d.b32.trap \t[$s, \\{$idx, $x\\}], \\{$r\\};",
	[]>;
	def SUST_B_1D_ARRAY_B64_TRAP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$idx, Int32Regs:$x, Int64Regs:$r),
	"sust.b.a1d.b64.trap \t[$s, \\{$idx, $x\\}], \\{$r\\};",
	[]>;
	def SUST_B_1D_ARRAY_V2B8_TRAP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$idx, Int32Regs:$x, Int16Regs:$r,
	Int16Regs:$g),
	"sust.b.a1d.v2.b8.trap \t[$s, \\{$idx, $x\\}], \\{$r, $g\\};",
	[]>;
	def SUST_B_1D_ARRAY_V2B16_TRAP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$idx, Int32Regs:$x, Int16Regs:$r,
	Int16Regs:$g),
	"sust.b.a1d.v2.b16.trap \t[$s, \\{$idx, $x\\}], \\{$r, $g\\};",
	[]>;
	def SUST_B_1D_ARRAY_V2B32_TRAP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$idx, Int32Regs:$x, Int32Regs:$r,
	Int32Regs:$g),
	"sust.b.a1d.v2.b32.trap \t[$s, \\{$idx, $x\\}], \\{$r, $g\\};",
	[]>;
	def SUST_B_1D_ARRAY_V2B64_TRAP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$idx, Int32Regs:$x, Int64Regs:$r,
	Int64Regs:$g),
	"sust.b.a1d.v2.b64.trap \t[$s, \\{$idx, $x\\}], \\{$r, $g\\};",
	[]>;
	def SUST_B_1D_ARRAY_V4B8_TRAP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$idx, Int32Regs:$x, Int16Regs:$r,
	Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),
	"sust.b.a1d.v4.b8.trap \t[$s, \\{$idx, $x\\}], "
	"\\{$r, $g, $b, $a\\};",
	[]>;
	def SUST_B_1D_ARRAY_V4B16_TRAP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$idx, Int32Regs:$x, Int16Regs:$r,
	Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),
	"sust.b.a1d.v4.b16.trap \t[$s, \\{$idx, $x\\}], "
	"\\{$r, $g, $b, $a\\};",
	[]>;
	def SUST_B_1D_ARRAY_V4B32_TRAP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$idx, Int32Regs:$x, Int32Regs:$r,
	Int32Regs:$g, Int32Regs:$b, Int32Regs:$a),
	"sust.b.a1d.v4.b32.trap \t[$s, \\{$idx, $x\\}], "
	"\\{$r, $g, $b, $a\\};",
	[]>;			[]>;
				multiclass SUST_1D<string inst, NVPTXRegClass intype> {
				def _R : SUST_1D_base<inst, intype, (ins Int64Regs:$s)>;
				def _I : SUST_1D_base<inst, intype, (ins i64imm:$s)>;
				}

				defm SUST_B_1D_B8_CLAMP : SUST_1D<"sust.b.1d.b8.clamp", Int16Regs>;
				defm SUST_B_1D_B16_CLAMP : SUST_1D<"sust.b.1d.b16.clamp", Int16Regs>;
				defm SUST_B_1D_B32_CLAMP : SUST_1D<"sust.b.1d.b32.clamp", Int32Regs>;
				defm SUST_B_1D_B64_CLAMP : SUST_1D<"sust.b.1d.b64.clamp", Int64Regs>;

				defm SUST_B_1D_B8_TRAP : SUST_1D<"sust.b.1d.b8.trap", Int16Regs>;
				defm SUST_B_1D_B16_TRAP : SUST_1D<"sust.b.1d.b16.trap", Int16Regs>;
				defm SUST_B_1D_B32_TRAP : SUST_1D<"sust.b.1d.b32.trap", Int32Regs>;
				defm SUST_B_1D_B64_TRAP : SUST_1D<"sust.b.1d.b64.trap", Int64Regs>;

				defm SUST_B_1D_B8_ZERO : SUST_1D<"sust.b.1d.b8.zero", Int16Regs>;
				defm SUST_B_1D_B16_ZERO : SUST_1D<"sust.b.1d.b16.zero", Int16Regs>;
				defm SUST_B_1D_B32_ZERO : SUST_1D<"sust.b.1d.b32.zero", Int32Regs>;
				defm SUST_B_1D_B64_ZERO : SUST_1D<"sust.b.1d.b64.zero", Int64Regs>;

				defm SUST_P_1D_B8_TRAP : SUST_1D<"sust.p.1d.b8.trap", Int16Regs>;
				defm SUST_P_1D_B16_TRAP : SUST_1D<"sust.p.1d.b16.trap", Int16Regs>;
				defm SUST_P_1D_B32_TRAP : SUST_1D<"sust.p.1d.b32.trap", Int32Regs>;

				class SUST_1D_V2_base<string inst, NVPTXRegClass intype, dag surf>
				: NVPTXInst<(outs),
				!con(surf, (ins Int32Regs:$x, intype:$r, intype:$g)),
				inst # " \t[$s, \\{$x\\}], \\{$r, $g\\};",
				[]>;
				multiclass SUST_1D_V2<string inst, NVPTXRegClass intype> {
				def _R : SUST_1D_V2_base<inst, intype, (ins Int64Regs:$s)>;
				def _I : SUST_1D_V2_base<inst, intype, (ins i64imm:$s)>;
				}

				defm SUST_B_1D_V2B8_CLAMP : SUST_1D_V2<"sust.b.1d.v2.b8.clamp", Int16Regs>;
				defm SUST_B_1D_V2B16_CLAMP : SUST_1D_V2<"sust.b.1d.v2.b16.clamp", Int16Regs>;
				defm SUST_B_1D_V2B32_CLAMP : SUST_1D_V2<"sust.b.1d.v2.b32.clamp", Int32Regs>;
				defm SUST_B_1D_V2B64_CLAMP : SUST_1D_V2<"sust.b.1d.v2.b64.clamp", Int64Regs>;

				defm SUST_B_1D_V2B8_TRAP : SUST_1D_V2<"sust.b.1d.v2.b8.trap", Int16Regs>;
				defm SUST_B_1D_V2B16_TRAP : SUST_1D_V2<"sust.b.1d.v2.b16.trap", Int16Regs>;
				defm SUST_B_1D_V2B32_TRAP : SUST_1D_V2<"sust.b.1d.v2.b32.trap", Int32Regs>;
				defm SUST_B_1D_V2B64_TRAP : SUST_1D_V2<"sust.b.1d.v2.b64.trap", Int64Regs>;

				defm SUST_B_1D_V2B8_ZERO : SUST_1D_V2<"sust.b.1d.v2.b8.zero", Int16Regs>;
				defm SUST_B_1D_V2B16_ZERO : SUST_1D_V2<"sust.b.1d.v2.b16.zero", Int16Regs>;
				defm SUST_B_1D_V2B32_ZERO : SUST_1D_V2<"sust.b.1d.v2.b32.zero", Int32Regs>;
				defm SUST_B_1D_V2B64_ZERO : SUST_1D_V2<"sust.b.1d.v2.b64.zero", Int64Regs>;

				defm SUST_P_1D_V2B8_TRAP : SUST_1D_V2<"sust.p.1d.v2.b8.trap", Int16Regs>;
				defm SUST_P_1D_V2B16_TRAP : SUST_1D_V2<"sust.p.1d.v2.b16.trap", Int16Regs>;
				defm SUST_P_1D_V2B32_TRAP : SUST_1D_V2<"sust.p.1d.v2.b32.trap", Int32Regs>;

				class SUST_1D_V4_base<string inst, NVPTXRegClass intype, dag surf>
				: NVPTXInst<(outs),
				!con(surf, (ins Int32Regs:$x, intype:$r, intype:$g,
				intype:$b, intype:$a)),
				inst # " \t[$s, \\{$x\\}], \\{$r, $g, $b, $a\\};",
				[]>;
				multiclass SUST_1D_V4<string inst, NVPTXRegClass intype> {
				def _R : SUST_1D_V4_base<inst, intype, (ins Int64Regs:$s)>;
				def _I : SUST_1D_V4_base<inst, intype, (ins i64imm:$s)>;
				}

				defm SUST_B_1D_V4B8_CLAMP : SUST_1D_V4<"sust.b.1d.v4.b8.clamp", Int16Regs>;
				defm SUST_B_1D_V4B16_CLAMP : SUST_1D_V4<"sust.b.1d.v4.b16.clamp", Int16Regs>;
				defm SUST_B_1D_V4B32_CLAMP : SUST_1D_V4<"sust.b.1d.v4.b32.clamp", Int32Regs>;

				defm SUST_B_1D_V4B8_TRAP : SUST_1D_V4<"sust.b.1d.v4.b8.trap", Int16Regs>;
				defm SUST_B_1D_V4B16_TRAP : SUST_1D_V4<"sust.b.1d.v4.b16.trap", Int16Regs>;
				defm SUST_B_1D_V4B32_TRAP : SUST_1D_V4<"sust.b.1d.v4.b32.trap", Int32Regs>;

				defm SUST_B_1D_V4B8_ZERO : SUST_1D_V4<"sust.b.1d.v4.b8.zero", Int16Regs>;
				defm SUST_B_1D_V4B16_ZERO : SUST_1D_V4<"sust.b.1d.v4.b16.zero", Int16Regs>;
				defm SUST_B_1D_V4B32_ZERO : SUST_1D_V4<"sust.b.1d.v4.b32.zero", Int32Regs>;

				defm SUST_P_1D_V4B8_TRAP : SUST_1D_V4<"sust.p.1d.v4.b8.trap", Int16Regs>;
				defm SUST_P_1D_V4B16_TRAP : SUST_1D_V4<"sust.p.1d.v4.b16.trap", Int16Regs>;
				defm SUST_P_1D_V4B32_TRAP : SUST_1D_V4<"sust.p.1d.v4.b32.trap", Int32Regs>;

				class SUST_1D_ARRAY_base<string inst, NVPTXRegClass intype, dag surf>
				: NVPTXInst<(outs),
				!con(surf, (ins Int32Regs:$idx, Int32Regs:$x, intype:$r)),
				inst # " \t[$s, \\{$idx, $x\\}], \\{$r\\};",
				[]>;
				multiclass SUST_1D_ARRAY<string inst, NVPTXRegClass intype> {
				def _R : SUST_1D_ARRAY_base<inst, intype, (ins Int64Regs:$s)>;
				def _I : SUST_1D_ARRAY_base<inst, intype, (ins i64imm:$s)>;
				}

				defm SUST_B_1D_ARRAY_B8_CLAMP
				: SUST_1D_ARRAY<"sust.b.a1d.b8.clamp", Int16Regs>;
				defm SUST_B_1D_ARRAY_B16_CLAMP
				: SUST_1D_ARRAY<"sust.b.a1d.b16.clamp", Int16Regs>;
				defm SUST_B_1D_ARRAY_B32_CLAMP
				: SUST_1D_ARRAY<"sust.b.a1d.b32.clamp", Int32Regs>;
				defm SUST_B_1D_ARRAY_B64_CLAMP
				: SUST_1D_ARRAY<"sust.b.a1d.b64.clamp", Int64Regs>;

				defm SUST_B_1D_ARRAY_B8_TRAP
				: SUST_1D_ARRAY<"sust.b.a1d.b8.trap", Int16Regs>;
				defm SUST_B_1D_ARRAY_B16_TRAP
				: SUST_1D_ARRAY<"sust.b.a1d.b16.trap", Int16Regs>;
				defm SUST_B_1D_ARRAY_B32_TRAP
				: SUST_1D_ARRAY<"sust.b.a1d.b32.trap", Int32Regs>;
				defm SUST_B_1D_ARRAY_B64_TRAP
				: SUST_1D_ARRAY<"sust.b.a1d.b64.trap", Int64Regs>;

				defm SUST_B_1D_ARRAY_B8_ZERO
				: SUST_1D_ARRAY<"sust.b.a1d.b8.zero", Int16Regs>;
				defm SUST_B_1D_ARRAY_B16_ZERO
				: SUST_1D_ARRAY<"sust.b.a1d.b16.zero", Int16Regs>;
				defm SUST_B_1D_ARRAY_B32_ZERO
				: SUST_1D_ARRAY<"sust.b.a1d.b32.zero", Int32Regs>;
				defm SUST_B_1D_ARRAY_B64_ZERO
				: SUST_1D_ARRAY<"sust.b.a1d.b64.zero", Int64Regs>;

				defm SUST_P_1D_ARRAY_B8_TRAP
				: SUST_1D_ARRAY<"sust.p.a1d.b8.trap", Int16Regs>;
				defm SUST_P_1D_ARRAY_B16_TRAP
				: SUST_1D_ARRAY<"sust.p.a1d.b16.trap", Int16Regs>;
				defm SUST_P_1D_ARRAY_B32_TRAP
				: SUST_1D_ARRAY<"sust.p.a1d.b32.trap", Int32Regs>;

				class SUST_1D_ARRAY_V2_base<string inst, NVPTXRegClass intype, dag surf>
				: NVPTXInst<(outs),
				!con(surf, (ins Int32Regs:$idx, Int32Regs:$x,
				intype:$r, intype:$g)),
				inst # " \t[$s, \\{$idx, $x\\}], \\{$r, $g\\};",
				[]>;
				multiclass SUST_1D_ARRAY_V2<string inst, NVPTXRegClass intype> {
				def _R : SUST_1D_ARRAY_V2_base<inst, intype, (ins Int64Regs:$s)>;
				def _I : SUST_1D_ARRAY_V2_base<inst, intype, (ins i64imm:$s)>;
				}

				defm SUST_B_1D_ARRAY_V2B8_CLAMP
				: SUST_1D_ARRAY_V2<"sust.b.a1d.v2.b8.clamp", Int16Regs>;
				defm SUST_B_1D_ARRAY_V2B16_CLAMP
				: SUST_1D_ARRAY_V2<"sust.b.a1d.v2.b16.clamp", Int16Regs>;
				defm SUST_B_1D_ARRAY_V2B32_CLAMP
				: SUST_1D_ARRAY_V2<"sust.b.a1d.v2.b32.clamp", Int32Regs>;
				defm SUST_B_1D_ARRAY_V2B64_CLAMP
				: SUST_1D_ARRAY_V2<"sust.b.a1d.v2.b64.clamp", Int64Regs>;

				defm SUST_B_1D_ARRAY_V2B8_TRAP
				: SUST_1D_ARRAY_V2<"sust.b.a1d.v2.b8.trap", Int16Regs>;
				defm SUST_B_1D_ARRAY_V2B16_TRAP
				: SUST_1D_ARRAY_V2<"sust.b.a1d.v2.b16.trap", Int16Regs>;
				defm SUST_B_1D_ARRAY_V2B32_TRAP
				: SUST_1D_ARRAY_V2<"sust.b.a1d.v2.b32.trap", Int32Regs>;
				defm SUST_B_1D_ARRAY_V2B64_TRAP
				: SUST_1D_ARRAY_V2<"sust.b.a1d.v2.b64.trap", Int64Regs>;

				defm SUST_B_1D_ARRAY_V2B8_ZERO
				: SUST_1D_ARRAY_V2<"sust.b.a1d.v2.b8.zero", Int16Regs>;
				defm SUST_B_1D_ARRAY_V2B16_ZERO
				: SUST_1D_ARRAY_V2<"sust.b.a1d.v2.b16.zero", Int16Regs>;
				defm SUST_B_1D_ARRAY_V2B32_ZERO
				: SUST_1D_ARRAY_V2<"sust.b.a1d.v2.b32.zero", Int32Regs>;
				defm SUST_B_1D_ARRAY_V2B64_ZERO
				: SUST_1D_ARRAY_V2<"sust.b.a1d.v2.b64.zero", Int64Regs>;

				defm SUST_P_1D_ARRAY_V2B8_TRAP
				: SUST_1D_ARRAY_V2<"sust.p.a1d.v2.b8.trap", Int16Regs>;
				defm SUST_P_1D_ARRAY_V2B16_TRAP
				: SUST_1D_ARRAY_V2<"sust.p.a1d.v2.b16.trap", Int16Regs>;
				defm SUST_P_1D_ARRAY_V2B32_TRAP
				: SUST_1D_ARRAY_V2<"sust.p.a1d.v2.b32.trap", Int32Regs>;

				class SUST_1D_ARRAY_V4_base<string inst, NVPTXRegClass intype, dag surf>
				: NVPTXInst<(outs),
				!con(surf, (ins Int32Regs:$idx, Int32Regs:$x,
				intype:$r, intype:$g, intype:$b, intype:$a)),
				inst # " \t[$s, \\{$idx, $x\\}], \\{$r, $g, $b, $a\\};",
				[]>;
				multiclass SUST_1D_ARRAY_V4<string inst, NVPTXRegClass intype> {
				def _R : SUST_1D_ARRAY_V4_base<inst, intype, (ins Int64Regs:$s)>;
				def _I : SUST_1D_ARRAY_V4_base<inst, intype, (ins i64imm:$s)>;
				}

				defm SUST_B_1D_ARRAY_V4B8_CLAMP
				: SUST_1D_ARRAY_V4<"sust.b.a1d.v4.b8.clamp", Int16Regs>;
				defm SUST_B_1D_ARRAY_V4B16_CLAMP
				: SUST_1D_ARRAY_V4<"sust.b.a1d.v4.b16.clamp", Int16Regs>;
				defm SUST_B_1D_ARRAY_V4B32_CLAMP
				: SUST_1D_ARRAY_V4<"sust.b.a1d.v4.b32.clamp", Int32Regs>;

				defm SUST_B_1D_ARRAY_V4B8_TRAP
				: SUST_1D_ARRAY_V4<"sust.b.a1d.v4.b8.trap", Int16Regs>;
				defm SUST_B_1D_ARRAY_V4B16_TRAP
				: SUST_1D_ARRAY_V4<"sust.b.a1d.v4.b16.trap", Int16Regs>;
				defm SUST_B_1D_ARRAY_V4B32_TRAP
				: SUST_1D_ARRAY_V4<"sust.b.a1d.v4.b32.trap", Int32Regs>;

				defm SUST_B_1D_ARRAY_V4B8_ZERO
				: SUST_1D_ARRAY_V4<"sust.b.a1d.v4.b8.zero", Int16Regs>;
				defm SUST_B_1D_ARRAY_V4B16_ZERO
				: SUST_1D_ARRAY_V4<"sust.b.a1d.v4.b16.zero", Int16Regs>;
				defm SUST_B_1D_ARRAY_V4B32_ZERO
				: SUST_1D_ARRAY_V4<"sust.b.a1d.v4.b32.zero", Int32Regs>;

				defm SUST_P_1D_ARRAY_V4B8_TRAP
				: SUST_1D_ARRAY_V4<"sust.p.a1d.v4.b8.trap", Int16Regs>;
				defm SUST_P_1D_ARRAY_V4B16_TRAP
				: SUST_1D_ARRAY_V4<"sust.p.a1d.v4.b16.trap", Int16Regs>;
				defm SUST_P_1D_ARRAY_V4B32_TRAP
				: SUST_1D_ARRAY_V4<"sust.p.a1d.v4.b32.trap", Int32Regs>;

				class SUST_2D_base<string inst, NVPTXRegClass intype, dag surf>
				: NVPTXInst<(outs),
				!con(surf, (ins Int32Regs:$x, Int32Regs:$y, intype:$r)),
				inst # " \t[$s, \\{$x, $y\\}], \\{$r\\};",
				[]>;
				multiclass SUST_2D<string inst, NVPTXRegClass intype> {
				def _R : SUST_2D_base<inst, intype, (ins Int64Regs:$s)>;
				def _I : SUST_2D_base<inst, intype, (ins i64imm:$s)>;
				}

				defm SUST_B_2D_B8_CLAMP : SUST_2D<"sust.b.2d.b8.clamp", Int16Regs>;
				defm SUST_B_2D_B16_CLAMP : SUST_2D<"sust.b.2d.b16.clamp", Int16Regs>;
				defm SUST_B_2D_B32_CLAMP : SUST_2D<"sust.b.2d.b32.clamp", Int32Regs>;
				defm SUST_B_2D_B64_CLAMP : SUST_2D<"sust.b.2d.b64.clamp", Int64Regs>;

				defm SUST_B_2D_B8_TRAP : SUST_2D<"sust.b.2d.b8.trap", Int16Regs>;
				defm SUST_B_2D_B16_TRAP : SUST_2D<"sust.b.2d.b16.trap", Int16Regs>;
				defm SUST_B_2D_B32_TRAP : SUST_2D<"sust.b.2d.b32.trap", Int32Regs>;
				defm SUST_B_2D_B64_TRAP : SUST_2D<"sust.b.2d.b64.trap", Int64Regs>;

				defm SUST_B_2D_B8_ZERO : SUST_2D<"sust.b.2d.b8.zero", Int16Regs>;
				defm SUST_B_2D_B16_ZERO : SUST_2D<"sust.b.2d.b16.zero", Int16Regs>;
				defm SUST_B_2D_B32_ZERO : SUST_2D<"sust.b.2d.b32.zero", Int32Regs>;
				defm SUST_B_2D_B64_ZERO : SUST_2D<"sust.b.2d.b64.zero", Int64Regs>;

				defm SUST_P_2D_B8_TRAP : SUST_2D<"sust.p.2d.b8.trap", Int16Regs>;
				defm SUST_P_2D_B16_TRAP : SUST_2D<"sust.p.2d.b16.trap", Int16Regs>;
				defm SUST_P_2D_B32_TRAP : SUST_2D<"sust.p.2d.b32.trap", Int32Regs>;

				class SUST_2D_V2_base<string inst, NVPTXRegClass intype, dag surf>
				: NVPTXInst<(outs),
				!con(surf, (ins Int32Regs:$x, Int32Regs:$y,
				intype:$r, intype:$g)),
				inst # " \t[$s, \\{$x, $y\\}], \\{$r, $g\\};",
				[]>;
				multiclass SUST_2D_V2<string inst, NVPTXRegClass intype> {
				def _R : SUST_2D_V2_base<inst, intype, (ins Int64Regs:$s)>;
				def _I : SUST_2D_V2_base<inst, intype, (ins i64imm:$s)>;
				}

				defm SUST_B_2D_V2B8_CLAMP : SUST_2D_V2<"sust.b.2d.v2.b8.clamp", Int16Regs>;
				defm SUST_B_2D_V2B16_CLAMP : SUST_2D_V2<"sust.b.2d.v2.b16.clamp", Int16Regs>;
				defm SUST_B_2D_V2B32_CLAMP : SUST_2D_V2<"sust.b.2d.v2.b32.clamp", Int32Regs>;
				defm SUST_B_2D_V2B64_CLAMP : SUST_2D_V2<"sust.b.2d.v2.b64.clamp", Int64Regs>;

				defm SUST_B_2D_V2B8_TRAP : SUST_2D_V2<"sust.b.2d.v2.b8.trap", Int16Regs>;
				defm SUST_B_2D_V2B16_TRAP : SUST_2D_V2<"sust.b.2d.v2.b16.trap", Int16Regs>;
				defm SUST_B_2D_V2B32_TRAP : SUST_2D_V2<"sust.b.2d.v2.b32.trap", Int32Regs>;
				defm SUST_B_2D_V2B64_TRAP : SUST_2D_V2<"sust.b.2d.v2.b64.trap", Int64Regs>;

				defm SUST_B_2D_V2B8_ZERO : SUST_2D_V2<"sust.b.2d.v2.b8.zero", Int16Regs>;
				defm SUST_B_2D_V2B16_ZERO : SUST_2D_V2<"sust.b.2d.v2.b16.zero", Int16Regs>;
				defm SUST_B_2D_V2B32_ZERO : SUST_2D_V2<"sust.b.2d.v2.b32.zero", Int32Regs>;
				defm SUST_B_2D_V2B64_ZERO : SUST_2D_V2<"sust.b.2d.v2.b64.zero", Int64Regs>;

				defm SUST_P_2D_V2B8_TRAP : SUST_2D_V2<"sust.p.2d.v2.b8.trap", Int16Regs>;
				defm SUST_P_2D_V2B16_TRAP : SUST_2D_V2<"sust.p.2d.v2.b16.trap", Int16Regs>;
				defm SUST_P_2D_V2B32_TRAP : SUST_2D_V2<"sust.p.2d.v2.b32.trap", Int32Regs>;

				class SUST_2D_V4_base<string inst, NVPTXRegClass intype, dag surf>
				: NVPTXInst<(outs),
				!con(surf, (ins Int32Regs:$x, Int32Regs:$y,
				intype:$r, intype:$g, intype:$b, intype:$a)),
				inst # " \t[$s, \\{$x, $y\\}], \\{$r, $g, $b, $a\\};",
				[]>;
				multiclass SUST_2D_V4<string inst, NVPTXRegClass intype> {
				def _R : SUST_2D_V4_base<inst, intype, (ins Int64Regs:$s)>;
				def _I : SUST_2D_V4_base<inst, intype, (ins i64imm:$s)>;
				}

				defm SUST_B_2D_V4B8_CLAMP : SUST_2D_V4<"sust.b.2d.v4.b8.clamp", Int16Regs>;
				defm SUST_B_2D_V4B16_CLAMP : SUST_2D_V4<"sust.b.2d.v4.b16.clamp", Int16Regs>;
				defm SUST_B_2D_V4B32_CLAMP : SUST_2D_V4<"sust.b.2d.v4.b32.clamp", Int32Regs>;

				defm SUST_B_2D_V4B8_TRAP : SUST_2D_V4<"sust.b.2d.v4.b8.trap", Int16Regs>;
				defm SUST_B_2D_V4B16_TRAP : SUST_2D_V4<"sust.b.2d.v4.b16.trap", Int16Regs>;
				defm SUST_B_2D_V4B32_TRAP : SUST_2D_V4<"sust.b.2d.v4.b32.trap", Int32Regs>;

				defm SUST_B_2D_V4B8_ZERO : SUST_2D_V4<"sust.b.2d.v4.b8.zero", Int16Regs>;
				defm SUST_B_2D_V4B16_ZERO : SUST_2D_V4<"sust.b.2d.v4.b16.zero", Int16Regs>;
				defm SUST_B_2D_V4B32_ZERO : SUST_2D_V4<"sust.b.2d.v4.b32.zero", Int32Regs>;

				defm SUST_P_2D_V4B8_TRAP : SUST_2D_V4<"sust.p.2d.v4.b8.trap", Int16Regs>;
				defm SUST_P_2D_V4B16_TRAP : SUST_2D_V4<"sust.p.2d.v4.b16.trap", Int16Regs>;
				defm SUST_P_2D_V4B32_TRAP : SUST_2D_V4<"sust.p.2d.v4.b32.trap", Int32Regs>;

				class SUST_2D_ARRAY_base<string inst, NVPTXRegClass intype, dag surf>
				: NVPTXInst<(outs),
				!con(surf, (ins Int32Regs:$idx, Int32Regs:$x, Int32Regs:$y,
				intype:$r)),
				inst # " \t[$s, \\{$idx, $x, $y, $y\\}], \\{$r\\};",
				[]>;
				multiclass SUST_2D_ARRAY<string inst, NVPTXRegClass intype> {
				def _R : SUST_2D_ARRAY_base<inst, intype, (ins Int64Regs:$s)>;
				def _I : SUST_2D_ARRAY_base<inst, intype, (ins i64imm:$s)>;
				}

				defm SUST_B_2D_ARRAY_B8_CLAMP
				: SUST_2D_ARRAY<"sust.b.a2d.b8.clamp", Int16Regs>;
				defm SUST_B_2D_ARRAY_B16_CLAMP
				: SUST_2D_ARRAY<"sust.b.a2d.b16.clamp", Int16Regs>;
				defm SUST_B_2D_ARRAY_B32_CLAMP
				: SUST_2D_ARRAY<"sust.b.a2d.b32.clamp", Int32Regs>;
				defm SUST_B_2D_ARRAY_B64_CLAMP
				: SUST_2D_ARRAY<"sust.b.a2d.b64.clamp", Int64Regs>;

				defm SUST_B_2D_ARRAY_B8_TRAP
				: SUST_2D_ARRAY<"sust.b.a2d.b8.trap", Int16Regs>;
				defm SUST_B_2D_ARRAY_B16_TRAP
				: SUST_2D_ARRAY<"sust.b.a2d.b16.trap", Int16Regs>;
				defm SUST_B_2D_ARRAY_B32_TRAP
				: SUST_2D_ARRAY<"sust.b.a2d.b32.trap", Int32Regs>;
				defm SUST_B_2D_ARRAY_B64_TRAP
				: SUST_2D_ARRAY<"sust.b.a2d.b64.trap", Int64Regs>;

				defm SUST_B_2D_ARRAY_B8_ZERO
				: SUST_2D_ARRAY<"sust.b.a2d.b8.zero", Int16Regs>;
				defm SUST_B_2D_ARRAY_B16_ZERO
				: SUST_2D_ARRAY<"sust.b.a2d.b16.zero", Int16Regs>;
				defm SUST_B_2D_ARRAY_B32_ZERO
				: SUST_2D_ARRAY<"sust.b.a2d.b32.zero", Int32Regs>;
				defm SUST_B_2D_ARRAY_B64_ZERO
				: SUST_2D_ARRAY<"sust.b.a2d.b64.zero", Int64Regs>;

				defm SUST_P_2D_ARRAY_B8_TRAP
				: SUST_2D_ARRAY<"sust.p.a2d.b8.trap", Int16Regs>;
				defm SUST_P_2D_ARRAY_B16_TRAP
				: SUST_2D_ARRAY<"sust.p.a2d.b16.trap", Int16Regs>;
				defm SUST_P_2D_ARRAY_B32_TRAP
				: SUST_2D_ARRAY<"sust.p.a2d.b32.trap", Int32Regs>;

				class SUST_2D_ARRAY_V2_base<string inst, NVPTXRegClass intype, dag surf>
				: NVPTXInst<(outs),
				!con(surf, (ins Int32Regs:$idx, Int32Regs:$x, Int32Regs:$y,
				intype:$r, intype:$g)),
				inst # " \t[$s, \\{$idx, $x, $y, $y\\}], \\{$r, $g\\};",
				[]>;
				multiclass SUST_2D_ARRAY_V2<string inst, NVPTXRegClass intype> {
				def _R : SUST_2D_ARRAY_V2_base<inst, intype, (ins Int64Regs:$s)>;
				def _I : SUST_2D_ARRAY_V2_base<inst, intype, (ins i64imm:$s)>;
				}

				defm SUST_B_2D_ARRAY_V2B8_CLAMP
				: SUST_2D_ARRAY_V2<"sust.b.a2d.v2.b8.clamp", Int16Regs>;
				defm SUST_B_2D_ARRAY_V2B16_CLAMP
				: SUST_2D_ARRAY_V2<"sust.b.a2d.v2.b16.clamp", Int16Regs>;
				defm SUST_B_2D_ARRAY_V2B32_CLAMP
				: SUST_2D_ARRAY_V2<"sust.b.a2d.v2.b32.clamp", Int32Regs>;
				defm SUST_B_2D_ARRAY_V2B64_CLAMP
				: SUST_2D_ARRAY_V2<"sust.b.a2d.v2.b64.clamp", Int64Regs>;

				defm SUST_B_2D_ARRAY_V2B8_TRAP
				: SUST_2D_ARRAY_V2<"sust.b.a2d.v2.b8.trap", Int16Regs>;
				defm SUST_B_2D_ARRAY_V2B16_TRAP
				: SUST_2D_ARRAY_V2<"sust.b.a2d.v2.b16.trap", Int16Regs>;
				defm SUST_B_2D_ARRAY_V2B32_TRAP
				: SUST_2D_ARRAY_V2<"sust.b.a2d.v2.b32.trap", Int32Regs>;
				defm SUST_B_2D_ARRAY_V2B64_TRAP
				: SUST_2D_ARRAY_V2<"sust.b.a2d.v2.b64.trap", Int64Regs>;

				defm SUST_B_2D_ARRAY_V2B8_ZERO
				: SUST_2D_ARRAY_V2<"sust.b.a2d.v2.b8.zero", Int16Regs>;
				defm SUST_B_2D_ARRAY_V2B16_ZERO
				: SUST_2D_ARRAY_V2<"sust.b.a2d.v2.b16.zero", Int16Regs>;
				defm SUST_B_2D_ARRAY_V2B32_ZERO
				: SUST_2D_ARRAY_V2<"sust.b.a2d.v2.b32.zero", Int32Regs>;
				defm SUST_B_2D_ARRAY_V2B64_ZERO
				: SUST_2D_ARRAY_V2<"sust.b.a2d.v2.b64.zero", Int64Regs>;

				defm SUST_P_2D_ARRAY_V2B8_TRAP
				: SUST_2D_ARRAY_V2<"sust.p.a2d.v2.b8.trap", Int16Regs>;
				defm SUST_P_2D_ARRAY_V2B16_TRAP
				: SUST_2D_ARRAY_V2<"sust.p.a2d.v2.b16.trap", Int16Regs>;
				defm SUST_P_2D_ARRAY_V2B32_TRAP
				: SUST_2D_ARRAY_V2<"sust.p.a2d.v2.b32.trap", Int32Regs>;

				class SUST_2D_ARRAY_V4_base<string inst, NVPTXRegClass intype, dag surf>
				: NVPTXInst<(outs),
				!con(surf, (ins Int32Regs:$idx, Int32Regs:$x, Int32Regs:$y,
				intype:$r, intype:$g, intype:$b, intype:$a)),
				inst # " \t[$s, \\{$idx, $x, $y, $y\\}], \\{$r, $g, $b, $a\\};",
				[]>;
				multiclass SUST_2D_ARRAY_V4<string inst, NVPTXRegClass intype> {
				def _R : SUST_2D_ARRAY_V4_base<inst, intype, (ins Int64Regs:$s)>;
				def _I : SUST_2D_ARRAY_V4_base<inst, intype, (ins i64imm:$s)>;
				}

				defm SUST_B_2D_ARRAY_V4B8_CLAMP
				: SUST_2D_ARRAY_V4<"sust.b.a2d.v4.b8.clamp", Int16Regs>;
				defm SUST_B_2D_ARRAY_V4B16_CLAMP
				: SUST_2D_ARRAY_V4<"sust.b.a2d.v4.b16.clamp", Int16Regs>;
				defm SUST_B_2D_ARRAY_V4B32_CLAMP
				: SUST_2D_ARRAY_V4<"sust.b.a2d.v4.b32.clamp", Int32Regs>;

				defm SUST_B_2D_ARRAY_V4B8_TRAP
				: SUST_2D_ARRAY_V4<"sust.b.a2d.v4.b8.trap", Int16Regs>;
				defm SUST_B_2D_ARRAY_V4B16_TRAP
				: SUST_2D_ARRAY_V4<"sust.b.a2d.v4.b16.trap", Int16Regs>;
				defm SUST_B_2D_ARRAY_V4B32_TRAP
				: SUST_2D_ARRAY_V4<"sust.b.a2d.v4.b32.trap", Int32Regs>;

				defm SUST_B_2D_ARRAY_V4B8_ZERO
				: SUST_2D_ARRAY_V4<"sust.b.a2d.v4.b8.zero", Int16Regs>;
				defm SUST_B_2D_ARRAY_V4B16_ZERO
				: SUST_2D_ARRAY_V4<"sust.b.a2d.v4.b16.zero", Int16Regs>;
				defm SUST_B_2D_ARRAY_V4B32_ZERO
				: SUST_2D_ARRAY_V4<"sust.b.a2d.v4.b32.zero", Int32Regs>;

				defm SUST_P_2D_ARRAY_V4B8_TRAP
				: SUST_2D_ARRAY_V4<"sust.p.a2d.v4.b8.trap", Int16Regs>;
				defm SUST_P_2D_ARRAY_V4B16_TRAP
				: SUST_2D_ARRAY_V4<"sust.p.a2d.v4.b16.trap", Int16Regs>;
				defm SUST_P_2D_ARRAY_V4B32_TRAP
				: SUST_2D_ARRAY_V4<"sust.p.a2d.v4.b32.trap", Int32Regs>;

				class SUST_3D_base<string inst, NVPTXRegClass intype, dag surf>
				: NVPTXInst<(outs),
				!con(surf, (ins Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
				intype:$r)),
				inst # " \t[$s, \\{$x, $y, $z, $z\\}], \\{$r\\};",
				[]>;
				multiclass SUST_3D<string inst, NVPTXRegClass intype> {
				def _R : SUST_3D_base<inst, intype, (ins Int64Regs:$s)>;
				def _I : SUST_3D_base<inst, intype, (ins i64imm:$s)>;
				}

				defm SUST_B_3D_B8_CLAMP : SUST_3D<"sust.b.3d.b8.clamp", Int16Regs>;
				defm SUST_B_3D_B16_CLAMP : SUST_3D<"sust.b.3d.b16.clamp", Int16Regs>;
				defm SUST_B_3D_B32_CLAMP : SUST_3D<"sust.b.3d.b32.clamp", Int32Regs>;
				defm SUST_B_3D_B64_CLAMP : SUST_3D<"sust.b.3d.b64.clamp", Int64Regs>;

				defm SUST_B_3D_B8_TRAP : SUST_3D<"sust.b.3d.b8.trap", Int16Regs>;
				defm SUST_B_3D_B16_TRAP : SUST_3D<"sust.b.3d.b16.trap", Int16Regs>;
				defm SUST_B_3D_B32_TRAP : SUST_3D<"sust.b.3d.b32.trap", Int32Regs>;
				defm SUST_B_3D_B64_TRAP : SUST_3D<"sust.b.3d.b64.trap", Int64Regs>;

				defm SUST_B_3D_B8_ZERO : SUST_3D<"sust.b.3d.b8.zero", Int16Regs>;
				defm SUST_B_3D_B16_ZERO : SUST_3D<"sust.b.3d.b16.zero", Int16Regs>;
				defm SUST_B_3D_B32_ZERO : SUST_3D<"sust.b.3d.b32.zero", Int32Regs>;
				defm SUST_B_3D_B64_ZERO : SUST_3D<"sust.b.3d.b64.zero", Int64Regs>;

				defm SUST_P_3D_B8_TRAP : SUST_3D<"sust.p.3d.b8.trap", Int16Regs>;
				defm SUST_P_3D_B16_TRAP : SUST_3D<"sust.p.3d.b16.trap", Int16Regs>;
				defm SUST_P_3D_B32_TRAP : SUST_3D<"sust.p.3d.b32.trap", Int32Regs>;

				class SUST_3D_V2_base<string inst, NVPTXRegClass intype, dag surf>
				: NVPTXInst<(outs),
				!con(surf, (ins Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
				intype:$r, intype:$g)),
				inst # " \t[$s, \\{$x, $y, $z, $z\\}], \\{$r, $g\\};",
				[]>;
				multiclass SUST_3D_V2<string inst, NVPTXRegClass intype> {
				def _R : SUST_3D_V2_base<inst, intype, (ins Int64Regs:$s)>;
				def _I : SUST_3D_V2_base<inst, intype, (ins i64imm:$s)>;
				}

				defm SUST_B_3D_V2B8_CLAMP : SUST_3D_V2<"sust.b.3d.v2.b8.clamp", Int16Regs>;
				defm SUST_B_3D_V2B16_CLAMP : SUST_3D_V2<"sust.b.3d.v2.b16.clamp", Int16Regs>;
				defm SUST_B_3D_V2B32_CLAMP : SUST_3D_V2<"sust.b.3d.v2.b32.clamp", Int32Regs>;
				defm SUST_B_3D_V2B64_CLAMP : SUST_3D_V2<"sust.b.3d.v2.b64.clamp", Int64Regs>;

				defm SUST_B_3D_V2B8_TRAP : SUST_3D_V2<"sust.b.3d.v2.b8.trap", Int16Regs>;
				defm SUST_B_3D_V2B16_TRAP : SUST_3D_V2<"sust.b.3d.v2.b16.trap", Int16Regs>;
				defm SUST_B_3D_V2B32_TRAP : SUST_3D_V2<"sust.b.3d.v2.b32.trap", Int32Regs>;
				defm SUST_B_3D_V2B64_TRAP : SUST_3D_V2<"sust.b.3d.v2.b64.trap", Int64Regs>;

				defm SUST_B_3D_V2B8_ZERO : SUST_3D_V2<"sust.b.3d.v2.b8.zero", Int16Regs>;
				defm SUST_B_3D_V2B16_ZERO : SUST_3D_V2<"sust.b.3d.v2.b16.zero", Int16Regs>;
				defm SUST_B_3D_V2B32_ZERO : SUST_3D_V2<"sust.b.3d.v2.b32.zero", Int32Regs>;
				defm SUST_B_3D_V2B64_ZERO : SUST_3D_V2<"sust.b.3d.v2.b64.zero", Int64Regs>;

				defm SUST_P_3D_V2B8_TRAP : SUST_3D_V2<"sust.p.3d.v2.b8.trap", Int16Regs>;
				defm SUST_P_3D_V2B16_TRAP : SUST_3D_V2<"sust.p.3d.v2.b16.trap", Int16Regs>;
				defm SUST_P_3D_V2B32_TRAP : SUST_3D_V2<"sust.p.3d.v2.b32.trap", Int32Regs>;

				class SUST_3D_V4_base<string inst, NVPTXRegClass intype, dag surf>
				: NVPTXInst<(outs),
				!con(surf, (ins Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
				intype:$r, intype:$g, intype:$b, intype:$a)),
				inst # " \t[$s, \\{$x, $y, $z, $z\\}], \\{$r, $g, $b, $a\\};",
				[]>;
				multiclass SUST_3D_V4<string inst, NVPTXRegClass intype> {
				def _R : SUST_3D_V4_base<inst, intype, (ins Int64Regs:$s)>;
				def _I : SUST_3D_V4_base<inst, intype, (ins i64imm:$s)>;
				}

				defm SUST_B_3D_V4B8_CLAMP : SUST_3D_V4<"sust.b.3d.v4.b8.clamp", Int16Regs>;
				defm SUST_B_3D_V4B16_CLAMP : SUST_3D_V4<"sust.b.3d.v4.b16.clamp", Int16Regs>;
				defm SUST_B_3D_V4B32_CLAMP : SUST_3D_V4<"sust.b.3d.v4.b32.clamp", Int32Regs>;

				defm SUST_B_3D_V4B8_TRAP : SUST_3D_V4<"sust.b.3d.v4.b8.trap", Int16Regs>;
				defm SUST_B_3D_V4B16_TRAP : SUST_3D_V4<"sust.b.3d.v4.b16.trap", Int16Regs>;
				defm SUST_B_3D_V4B32_TRAP : SUST_3D_V4<"sust.b.3d.v4.b32.trap", Int32Regs>;

				defm SUST_B_3D_V4B8_ZERO : SUST_3D_V4<"sust.b.3d.v4.b8.zero", Int16Regs>;
				defm SUST_B_3D_V4B16_ZERO : SUST_3D_V4<"sust.b.3d.v4.b16.zero", Int16Regs>;
				defm SUST_B_3D_V4B32_ZERO : SUST_3D_V4<"sust.b.3d.v4.b32.zero", Int32Regs>;

				defm SUST_P_3D_V4B8_TRAP : SUST_3D_V4<"sust.p.3d.v4.b8.trap", Int16Regs>;
				defm SUST_P_3D_V4B16_TRAP : SUST_3D_V4<"sust.p.3d.v4.b16.trap", Int16Regs>;
				defm SUST_P_3D_V4B32_TRAP : SUST_3D_V4<"sust.p.3d.v4.b32.trap", Int32Regs>;


	def SUST_B_2D_B8_TRAP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int16Regs:$r),
	"sust.b.2d.b8.trap \t[$s, \\{$x, $y\\}], \\{$r\\};",
	[]>;
	def SUST_B_2D_B16_TRAP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int16Regs:$r),
	"sust.b.2d.b16.trap \t[$s, \\{$x, $y\\}], \\{$r\\};",
	[]>;
	def SUST_B_2D_B32_TRAP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$r),
	"sust.b.2d.b32.trap \t[$s, \\{$x, $y\\}], \\{$r\\};",
	[]>;
	def SUST_B_2D_B64_TRAP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int64Regs:$r),
	"sust.b.2d.b64.trap \t[$s, \\{$x, $y\\}], \\{$r\\};",
	[]>;
	def SUST_B_2D_V2B8_TRAP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int16Regs:$r,
	Int16Regs:$g),
	"sust.b.2d.v2.b8.trap \t[$s, \\{$x, $y\\}], \\{$r, $g\\};",
	[]>;
	def SUST_B_2D_V2B16_TRAP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int16Regs:$r,
	Int16Regs:$g),
	"sust.b.2d.v2.b16.trap \t[$s, \\{$x, $y\\}], \\{$r, $g\\};",
	[]>;
	def SUST_B_2D_V2B32_TRAP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$r,
	Int32Regs:$g),
	"sust.b.2d.v2.b32.trap \t[$s, \\{$x, $y\\}], \\{$r, $g\\};",
	[]>;
	def SUST_B_2D_V2B64_TRAP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int64Regs:$r,
	Int64Regs:$g),
	"sust.b.2d.v2.b64.trap \t[$s, \\{$x, $y\\}], \\{$r, $g\\};",
	[]>;
	def SUST_B_2D_V4B8_TRAP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int16Regs:$r,
	Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),
	"sust.b.2d.v4.b8.trap \t[$s, \\{$x, $y\\}], "
	"\\{$r, $g, $b, $a\\};",
	[]>;
	def SUST_B_2D_V4B16_TRAP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int16Regs:$r,
	Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),
	"sust.b.2d.v4.b16.trap \t[$s, \\{$x, $y\\}], "
	"\\{$r, $g, $b, $a\\};",
	[]>;
	def SUST_B_2D_V4B32_TRAP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$r,
	Int32Regs:$g, Int32Regs:$b, Int32Regs:$a),
	"sust.b.2d.v4.b32.trap \t[$s, \\{$x, $y\\}], "
	"\\{$r, $g, $b, $a\\};",
	[]>;


	def SUST_B_2D_ARRAY_B8_TRAP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$idx, Int32Regs:$x, Int32Regs:$y,
	Int16Regs:$r),
	"sust.b.a2d.b8.trap \t[$s, \\{$idx, $x, $y, $y\\}], \\{$r\\};",
	[]>;
	def SUST_B_2D_ARRAY_B16_TRAP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$idx, Int32Regs:$x, Int32Regs:$y,
	Int16Regs:$r),
	"sust.b.a2d.b16.trap \t[$s, \\{$idx, $x, $y, $y\\}], \\{$r\\};",
	[]>;
	def SUST_B_2D_ARRAY_B32_TRAP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$idx, Int32Regs:$x, Int32Regs:$y,
	Int32Regs:$r),
	"sust.b.a2d.b32.trap \t[$s, \\{$idx, $x, $y, $y\\}], \\{$r\\};",
	[]>;
	def SUST_B_2D_ARRAY_B64_TRAP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$idx, Int32Regs:$x, Int32Regs:$y,
	Int64Regs:$r),
	"sust.b.a2d.b64.trap \t[$s, \\{$idx, $x, $y, $y\\}], \\{$r\\};",
	[]>;
	def SUST_B_2D_ARRAY_V2B8_TRAP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$idx, Int32Regs:$x, Int32Regs:$y,
	Int16Regs:$r, Int16Regs:$g),
	"sust.b.a2d.v2.b8.trap \t[$s, \\{$idx, $x, $y, $y\\}], "
	"\\{$r, $g\\};",
	[]>;
	def SUST_B_2D_ARRAY_V2B16_TRAP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$idx, Int32Regs:$x, Int32Regs:$y,
	Int16Regs:$r, Int16Regs:$g),
	"sust.b.a2d.v2.b16.trap \t[$s, \\{$idx, $x, $y, $y\\}], "
	"\\{$r, $g\\};",
	[]>;
	def SUST_B_2D_ARRAY_V2B32_TRAP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$idx, Int32Regs:$x, Int32Regs:$y,
	Int32Regs:$r, Int32Regs:$g),
	"sust.b.a2d.v2.b32.trap \t[$s, \\{$idx, $x, $y, $y\\}], "
	"\\{$r, $g\\};",
	[]>;
	def SUST_B_2D_ARRAY_V2B64_TRAP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$idx, Int32Regs:$x, Int32Regs:$y,
	Int64Regs:$r, Int64Regs:$g),
	"sust.b.a2d.v2.b64.trap \t[$s, \\{$idx, $x, $y, $y\\}], "
	"\\{$r, $g\\};",
	[]>;
	def SUST_B_2D_ARRAY_V4B8_TRAP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$idx, Int32Regs:$x, Int32Regs:$y,
	Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),
	"sust.b.a2d.v4.b8.trap \t[$s, \\{$idx, $x, $y, $y\\}], "
	"\\{$r, $g, $b, $a\\};",
	[]>;
	def SUST_B_2D_ARRAY_V4B16_TRAP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$idx, Int32Regs:$x, Int32Regs:$y,
	Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),
	"sust.b.a2d.v4.b16.trap \t[$s, \\{$idx, $x, $y, $y\\}], "
	"\\{$r, $g, $b, $a\\};",
	[]>;
	def SUST_B_2D_ARRAY_V4B32_TRAP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$idx, Int32Regs:$x, Int32Regs:$y,
	Int32Regs:$r, Int32Regs:$g, Int32Regs:$b, Int32Regs:$a),
	"sust.b.a2d.v4.b32.trap \t[$s, \\{$idx, $x, $y, $y\\}], "
	"\\{$r, $g, $b, $a\\};",
	[]>;


	def SUST_B_3D_B8_TRAP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int16Regs:$r),
	"sust.b.3d.b8.trap \t[$s, \\{$x, $y, $z, $z\\}], \\{$r\\};",
	[]>;
	def SUST_B_3D_B16_TRAP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int16Regs:$r),
	"sust.b.3d.b16.trap \t[$s, \\{$x, $y, $z, $z\\}], \\{$r\\};",
	[]>;
	def SUST_B_3D_B32_TRAP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int32Regs:$r),
	"sust.b.3d.b32.trap \t[$s, \\{$x, $y, $z, $z\\}], \\{$r\\};",
	[]>;
	def SUST_B_3D_B64_TRAP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int64Regs:$r),
	"sust.b.3d.b64.trap \t[$s, \\{$x, $y, $z, $z\\}], \\{$r\\};",
	[]>;
	def SUST_B_3D_V2B8_TRAP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int16Regs:$r, Int16Regs:$g),
	"sust.b.3d.v2.b8.trap \t[$s, \\{$x, $y, $z, $z\\}], "
	"\\{$r, $g\\};",
	[]>;
	def SUST_B_3D_V2B16_TRAP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int16Regs:$r, Int16Regs:$g),
	"sust.b.3d.v2.b16.trap \t[$s, \\{$x, $y, $z, $z\\}], "
	"\\{$r, $g\\};",
	[]>;
	def SUST_B_3D_V2B32_TRAP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int32Regs:$r, Int32Regs:$g),
	"sust.b.3d.v2.b32.trap \t[$s, \\{$x, $y, $z, $z\\}], "
	"\\{$r, $g\\};",
	[]>;
	def SUST_B_3D_V2B64_TRAP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int64Regs:$r, Int64Regs:$g),
	"sust.b.3d.v2.b64.trap \t[$s, \\{$x, $y, $z, $z\\}], "
	"\\{$r, $g\\};",
	[]>;
	def SUST_B_3D_V4B8_TRAP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),
	"sust.b.3d.v4.b8.trap \t[$s, \\{$x, $y, $z, $z\\}], "
	"\\{$r, $g, $b, $a\\};",
	[]>;
	def SUST_B_3D_V4B16_TRAP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),
	"sust.b.3d.v4.b16.trap \t[$s, \\{$x, $y, $z, $z\\}], "
	"\\{$r, $g, $b, $a\\};",
	[]>;
	def SUST_B_3D_V4B32_TRAP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int32Regs:$r, Int32Regs:$g, Int32Regs:$b, Int32Regs:$a),
	"sust.b.3d.v4.b32.trap \t[$s, \\{$x, $y, $z, $z\\}], "
	"\\{$r, $g, $b, $a\\};",
	[]>;


	// .zero variant
	def SUST_B_1D_B8_ZERO
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int16Regs:$r),
	"sust.b.1d.b8.zero \t[$s, \\{$x\\}], \\{$r\\};",
	[]>;
	def SUST_B_1D_B16_ZERO
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int16Regs:$r),
	"sust.b.1d.b16.zero \t[$s, \\{$x\\}], \\{$r\\};",
	[]>;
	def SUST_B_1D_B32_ZERO
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$r),
	"sust.b.1d.b32.zero \t[$s, \\{$x\\}], \\{$r\\};",
	[]>;
	def SUST_B_1D_B64_ZERO
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int64Regs:$r),
	"sust.b.1d.b64.zero \t[$s, \\{$x\\}], \\{$r\\};",
	[]>;
	def SUST_B_1D_V2B8_ZERO
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int16Regs:$r, Int16Regs:$g),
	"sust.b.1d.v2.b8.zero \t[$s, \\{$x\\}], \\{$r, $g\\};",
	[]>;
	def SUST_B_1D_V2B16_ZERO
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int16Regs:$r, Int16Regs:$g),
	"sust.b.1d.v2.b16.zero \t[$s, \\{$x\\}], \\{$r, $g\\};",
	[]>;
	def SUST_B_1D_V2B32_ZERO
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$r, Int32Regs:$g),
	"sust.b.1d.v2.b32.zero \t[$s, \\{$x\\}], \\{$r, $g\\};",
	[]>;
	def SUST_B_1D_V2B64_ZERO
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int64Regs:$r, Int64Regs:$g),
	"sust.b.1d.v2.b64.zero \t[$s, \\{$x\\}], \\{$r, $g\\};",
	[]>;
	def SUST_B_1D_V4B8_ZERO
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int16Regs:$r, Int16Regs:$g,
	Int16Regs:$b, Int16Regs:$a),
	"sust.b.1d.v4.b8.zero \t[$s, \\{$x\\}], \\{$r, $g, $b, $a\\};",
	[]>;
	def SUST_B_1D_V4B16_ZERO
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int16Regs:$r, Int16Regs:$g,
	Int16Regs:$b, Int16Regs:$a),
	"sust.b.1d.v4.b16.zero \t[$s, \\{$x\\}], \\{$r, $g, $b, $a\\};",
	[]>;
	def SUST_B_1D_V4B32_ZERO
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$r, Int32Regs:$g,
	Int32Regs:$b, Int32Regs:$a),
	"sust.b.1d.v4.b32.zero \t[$s, \\{$x\\}], \\{$r, $g, $b, $a\\};",
	[]>;


	def SUST_B_1D_ARRAY_B8_ZERO
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$idx, Int32Regs:$x, Int16Regs:$r),
	"sust.b.a1d.b8.zero \t[$s, \\{$idx, $x\\}], \\{$r\\};",
	[]>;
	def SUST_B_1D_ARRAY_B16_ZERO
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$idx, Int32Regs:$x, Int16Regs:$r),
	"sust.b.a1d.b16.zero \t[$s, \\{$idx, $x\\}], \\{$r\\};",
	[]>;
	def SUST_B_1D_ARRAY_B32_ZERO
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$idx, Int32Regs:$x, Int32Regs:$r),
	"sust.b.a1d.b32.zero \t[$s, \\{$idx, $x\\}], \\{$r\\};",
	[]>;
	def SUST_B_1D_ARRAY_B64_ZERO
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$idx, Int32Regs:$x, Int64Regs:$r),
	"sust.b.a1d.b64.zero \t[$s, \\{$idx, $x\\}], \\{$r\\};",
	[]>;
	def SUST_B_1D_ARRAY_V2B8_ZERO
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$idx, Int32Regs:$x, Int16Regs:$r,
	Int16Regs:$g),
	"sust.b.a1d.v2.b8.zero \t[$s, \\{$idx, $x\\}], \\{$r, $g\\};",
	[]>;
	def SUST_B_1D_ARRAY_V2B16_ZERO
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$idx, Int32Regs:$x, Int16Regs:$r,
	Int16Regs:$g),
	"sust.b.a1d.v2.b16.zero \t[$s, \\{$idx, $x\\}], \\{$r, $g\\};",
	[]>;
	def SUST_B_1D_ARRAY_V2B32_ZERO
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$idx, Int32Regs:$x, Int32Regs:$r,
	Int32Regs:$g),
	"sust.b.a1d.v2.b32.zero \t[$s, \\{$idx, $x\\}], \\{$r, $g\\};",
	[]>;
	def SUST_B_1D_ARRAY_V2B64_ZERO
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$idx, Int32Regs:$x, Int64Regs:$r,
	Int64Regs:$g),
	"sust.b.a1d.v2.b64.zero \t[$s, \\{$idx, $x\\}], \\{$r, $g\\};",
	[]>;
	def SUST_B_1D_ARRAY_V4B8_ZERO
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$idx, Int32Regs:$x, Int16Regs:$r,
	Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),
	"sust.b.a1d.v4.b8.zero \t[$s, \\{$idx, $x\\}], "
	"\\{$r, $g, $b, $a\\};",
	[]>;
	def SUST_B_1D_ARRAY_V4B16_ZERO
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$idx, Int32Regs:$x, Int16Regs:$r,
	Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),
	"sust.b.a1d.v4.b16.zero \t[$s, \\{$idx, $x\\}], "
	"\\{$r, $g, $b, $a\\};",
	[]>;
	def SUST_B_1D_ARRAY_V4B32_ZERO
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$idx, Int32Regs:$x, Int32Regs:$r,
	Int32Regs:$g, Int32Regs:$b, Int32Regs:$a),
	"sust.b.a1d.v4.b32.zero \t[$s, \\{$idx, $x\\}], "
	"\\{$r, $g, $b, $a\\};",
	[]>;


	def SUST_B_2D_B8_ZERO
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int16Regs:$r),
	"sust.b.2d.b8.zero \t[$s, \\{$x, $y\\}], \\{$r\\};",
	[]>;
	def SUST_B_2D_B16_ZERO
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int16Regs:$r),
	"sust.b.2d.b16.zero \t[$s, \\{$x, $y\\}], \\{$r\\};",
	[]>;
	def SUST_B_2D_B32_ZERO
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$r),
	"sust.b.2d.b32.zero \t[$s, \\{$x, $y\\}], \\{$r\\};",
	[]>;
	def SUST_B_2D_B64_ZERO
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int64Regs:$r),
	"sust.b.2d.b64.zero \t[$s, \\{$x, $y\\}], \\{$r\\};",
	[]>;
	def SUST_B_2D_V2B8_ZERO
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int16Regs:$r,
	Int16Regs:$g),
	"sust.b.2d.v2.b8.zero \t[$s, \\{$x, $y\\}], \\{$r, $g\\};",
	[]>;
	def SUST_B_2D_V2B16_ZERO
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int16Regs:$r,
	Int16Regs:$g),
	"sust.b.2d.v2.b16.zero \t[$s, \\{$x, $y\\}], \\{$r, $g\\};",
	[]>;
	def SUST_B_2D_V2B32_ZERO
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$r,
	Int32Regs:$g),
	"sust.b.2d.v2.b32.zero \t[$s, \\{$x, $y\\}], \\{$r, $g\\};",
	[]>;
	def SUST_B_2D_V2B64_ZERO
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int64Regs:$r,
	Int64Regs:$g),
	"sust.b.2d.v2.b64.zero \t[$s, \\{$x, $y\\}], \\{$r, $g\\};",
	[]>;
	def SUST_B_2D_V4B8_ZERO
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int16Regs:$r,
	Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),
	"sust.b.2d.v4.b8.zero \t[$s, \\{$x, $y\\}], "
	"\\{$r, $g, $b, $a\\};",
	[]>;
	def SUST_B_2D_V4B16_ZERO
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int16Regs:$r,
	Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),
	"sust.b.2d.v4.b16.zero \t[$s, \\{$x, $y\\}], "
	"\\{$r, $g, $b, $a\\};",
	[]>;
	def SUST_B_2D_V4B32_ZERO
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$r,
	Int32Regs:$g, Int32Regs:$b, Int32Regs:$a),
	"sust.b.2d.v4.b32.zero \t[$s, \\{$x, $y\\}], "
	"\\{$r, $g, $b, $a\\};",
	[]>;


	def SUST_B_2D_ARRAY_B8_ZERO
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$idx, Int32Regs:$x, Int32Regs:$y,
	Int16Regs:$r),
	"sust.b.a2d.b8.zero \t[$s, \\{$idx, $x, $y, $y\\}], \\{$r\\};",
	[]>;
	def SUST_B_2D_ARRAY_B16_ZERO
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$idx, Int32Regs:$x, Int32Regs:$y,
	Int16Regs:$r),
	"sust.b.a2d.b16.zero \t[$s, \\{$idx, $x, $y, $y\\}], \\{$r\\};",
	[]>;
	def SUST_B_2D_ARRAY_B32_ZERO
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$idx, Int32Regs:$x, Int32Regs:$y,
	Int32Regs:$r),
	"sust.b.a2d.b32.zero \t[$s, \\{$idx, $x, $y, $y\\}], \\{$r\\};",
	[]>;
	def SUST_B_2D_ARRAY_B64_ZERO
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$idx, Int32Regs:$x, Int32Regs:$y,
	Int64Regs:$r),
	"sust.b.a2d.b64.zero \t[$s, \\{$idx, $x, $y, $y\\}], \\{$r\\};",
	[]>;
	def SUST_B_2D_ARRAY_V2B8_ZERO
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$idx, Int32Regs:$x, Int32Regs:$y,
	Int16Regs:$r, Int16Regs:$g),
	"sust.b.a2d.v2.b8.zero \t[$s, \\{$idx, $x, $y, $y\\}], "
	"\\{$r, $g\\};",
	[]>;
	def SUST_B_2D_ARRAY_V2B16_ZERO
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$idx, Int32Regs:$x, Int32Regs:$y,
	Int16Regs:$r, Int16Regs:$g),
	"sust.b.a2d.v2.b16.zero \t[$s, \\{$idx, $x, $y, $y\\}], "
	"\\{$r, $g\\};",
	[]>;
	def SUST_B_2D_ARRAY_V2B32_ZERO
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$idx, Int32Regs:$x, Int32Regs:$y,
	Int32Regs:$r, Int32Regs:$g),
	"sust.b.a2d.v2.b32.zero \t[$s, \\{$idx, $x, $y, $y\\}], "
	"\\{$r, $g\\};",
	[]>;
	def SUST_B_2D_ARRAY_V2B64_ZERO
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$idx, Int32Regs:$x, Int32Regs:$y,
	Int64Regs:$r, Int64Regs:$g),
	"sust.b.a2d.v2.b64.zero \t[$s, \\{$idx, $x, $y, $y\\}], "
	"\\{$r, $g\\};",
	[]>;
	def SUST_B_2D_ARRAY_V4B8_ZERO
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$idx, Int32Regs:$x, Int32Regs:$y,
	Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),
	"sust.b.a2d.v4.b8.zero \t[$s, \\{$idx, $x, $y, $y\\}], "
	"\\{$r, $g, $b, $a\\};",
	[]>;
	def SUST_B_2D_ARRAY_V4B16_ZERO
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$idx, Int32Regs:$x, Int32Regs:$y,
	Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),
	"sust.b.a2d.v4.b16.zero \t[$s, \\{$idx, $x, $y, $y\\}], "
	"\\{$r, $g, $b, $a\\};",
	[]>;
	def SUST_B_2D_ARRAY_V4B32_ZERO
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$idx, Int32Regs:$x, Int32Regs:$y,
	Int32Regs:$r, Int32Regs:$g, Int32Regs:$b, Int32Regs:$a),
	"sust.b.a2d.v4.b32.zero \t[$s, \\{$idx, $x, $y, $y\\}], "
	"\\{$r, $g, $b, $a\\};",
	[]>;


	def SUST_B_3D_B8_ZERO
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int16Regs:$r),
	"sust.b.3d.b8.zero \t[$s, \\{$x, $y, $z, $z\\}], \\{$r\\};",
	[]>;
	def SUST_B_3D_B16_ZERO
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int16Regs:$r),
	"sust.b.3d.b16.zero \t[$s, \\{$x, $y, $z, $z\\}], \\{$r\\};",
	[]>;
	def SUST_B_3D_B32_ZERO
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int32Regs:$r),
	"sust.b.3d.b32.zero \t[$s, \\{$x, $y, $z, $z\\}], \\{$r\\};",
	[]>;
	def SUST_B_3D_B64_ZERO
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int64Regs:$r),
	"sust.b.3d.b64.zero \t[$s, \\{$x, $y, $z, $z\\}], \\{$r\\};",
	[]>;
	def SUST_B_3D_V2B8_ZERO
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int16Regs:$r, Int16Regs:$g),
	"sust.b.3d.v2.b8.zero \t[$s, \\{$x, $y, $z, $z\\}], "
	"\\{$r, $g\\};",
	[]>;
	def SUST_B_3D_V2B16_ZERO
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int16Regs:$r, Int16Regs:$g),
	"sust.b.3d.v2.b16.zero \t[$s, \\{$x, $y, $z, $z\\}], "
	"\\{$r, $g\\};",
	[]>;
	def SUST_B_3D_V2B32_ZERO
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int32Regs:$r, Int32Regs:$g),
	"sust.b.3d.v2.b32.zero \t[$s, \\{$x, $y, $z, $z\\}], "
	"\\{$r, $g\\};",
	[]>;
	def SUST_B_3D_V2B64_ZERO
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int64Regs:$r, Int64Regs:$g),
	"sust.b.3d.v2.b64.zero \t[$s, \\{$x, $y, $z, $z\\}], "
	"\\{$r, $g\\};",
	[]>;
	def SUST_B_3D_V4B8_ZERO
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),
	"sust.b.3d.v4.b8.zero \t[$s, \\{$x, $y, $z, $z\\}], "
	"\\{$r, $g, $b, $a\\};",
	[]>;
	def SUST_B_3D_V4B16_ZERO
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),
	"sust.b.3d.v4.b16.zero \t[$s, \\{$x, $y, $z, $z\\}], "
	"\\{$r, $g, $b, $a\\};",
	[]>;
	def SUST_B_3D_V4B32_ZERO
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int32Regs:$r, Int32Regs:$g, Int32Regs:$b, Int32Regs:$a),
	"sust.b.3d.v4.b32.zero \t[$s, \\{$x, $y, $z, $z\\}], "
	"\\{$r, $g, $b, $a\\};",
	[]>;



	// Formatted

	def SUST_P_1D_B8_TRAP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int16Regs:$r),
	"sust.p.1d.b8.trap \t[$s, \\{$x\\}], \\{$r\\};",
	[]>;
	def SUST_P_1D_B16_TRAP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int16Regs:$r),
	"sust.p.1d.b16.trap \t[$s, \\{$x\\}], \\{$r\\};",
	[]>;
	def SUST_P_1D_B32_TRAP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$r),
	"sust.p.1d.b32.trap \t[$s, \\{$x\\}], \\{$r\\};",
	[]>;
	def SUST_P_1D_V2B8_TRAP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int16Regs:$r, Int16Regs:$g),
	"sust.p.1d.v2.b8.trap \t[$s, \\{$x\\}], \\{$r, $g\\};",
	[]>;
	def SUST_P_1D_V2B16_TRAP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int16Regs:$r, Int16Regs:$g),
	"sust.p.1d.v2.b16.trap \t[$s, \\{$x\\}], \\{$r, $g\\};",
	[]>;
	def SUST_P_1D_V2B32_TRAP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$r, Int32Regs:$g),
	"sust.p.1d.v2.b32.trap \t[$s, \\{$x\\}], \\{$r, $g\\};",
	[]>;
	def SUST_P_1D_V4B8_TRAP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int16Regs:$r, Int16Regs:$g,
	Int16Regs:$b, Int16Regs:$a),
	"sust.p.1d.v4.b8.trap \t[$s, \\{$x\\}], \\{$r, $g, $b, $a\\};",
	[]>;
	def SUST_P_1D_V4B16_TRAP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int16Regs:$r, Int16Regs:$g,
	Int16Regs:$b, Int16Regs:$a),
	"sust.p.1d.v4.b16.trap \t[$s, \\{$x\\}], \\{$r, $g, $b, $a\\};",
	[]>;
	def SUST_P_1D_V4B32_TRAP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$r, Int32Regs:$g,
	Int32Regs:$b, Int32Regs:$a),
	"sust.p.1d.v4.b32.trap \t[$s, \\{$x\\}], \\{$r, $g, $b, $a\\};",
	[]>;


	def SUST_P_1D_ARRAY_B8_TRAP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$idx, Int32Regs:$x, Int16Regs:$r),
	"sust.p.a1d.b8.trap \t[$s, \\{$idx, $x\\}], \\{$r\\};",
	[]>;
	def SUST_P_1D_ARRAY_B16_TRAP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$idx, Int32Regs:$x, Int16Regs:$r),
	"sust.p.a1d.b16.trap \t[$s, \\{$idx, $x\\}], \\{$r\\};",
	[]>;
	def SUST_P_1D_ARRAY_B32_TRAP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$idx, Int32Regs:$x, Int32Regs:$r),
	"sust.p.a1d.b32.trap \t[$s, \\{$idx, $x\\}], \\{$r\\};",
	[]>;
	def SUST_P_1D_ARRAY_V2B8_TRAP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$idx, Int32Regs:$x, Int16Regs:$r,
	Int16Regs:$g),
	"sust.p.a1d.v2.b8.trap \t[$s, \\{$idx, $x\\}], \\{$r, $g\\};",
	[]>;
	def SUST_P_1D_ARRAY_V2B16_TRAP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$idx, Int32Regs:$x, Int16Regs:$r,
	Int16Regs:$g),
	"sust.p.a1d.v2.b16.trap \t[$s, \\{$idx, $x\\}], \\{$r, $g\\};",
	[]>;
	def SUST_P_1D_ARRAY_V2B32_TRAP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$idx, Int32Regs:$x, Int32Regs:$r,
	Int32Regs:$g),
	"sust.p.a1d.v2.b32.trap \t[$s, \\{$idx, $x\\}], \\{$r, $g\\};",
	[]>;
	def SUST_P_1D_ARRAY_V4B8_TRAP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$idx, Int32Regs:$x, Int16Regs:$r,
	Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),
	"sust.p.a1d.v4.b8.trap \t[$s, \\{$idx, $x\\}], "
	"\\{$r, $g, $b, $a\\};",
	[]>;
	def SUST_P_1D_ARRAY_V4B16_TRAP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$idx, Int32Regs:$x, Int16Regs:$r,
	Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),
	"sust.p.a1d.v4.b16.trap \t[$s, \\{$idx, $x\\}], "
	"\\{$r, $g, $b, $a\\};",
	[]>;
	def SUST_P_1D_ARRAY_V4B32_TRAP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$idx, Int32Regs:$x, Int32Regs:$r,
	Int32Regs:$g, Int32Regs:$b, Int32Regs:$a),
	"sust.p.a1d.v4.b32.trap \t[$s, \\{$idx, $x\\}], "
	"\\{$r, $g, $b, $a\\};",
	[]>;


	def SUST_P_2D_B8_TRAP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int16Regs:$r),
	"sust.p.2d.b8.trap \t[$s, \\{$x, $y\\}], \\{$r\\};",
	[]>;
	def SUST_P_2D_B16_TRAP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int16Regs:$r),
	"sust.p.2d.b16.trap \t[$s, \\{$x, $y\\}], \\{$r\\};",
	[]>;
	def SUST_P_2D_B32_TRAP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$r),
	"sust.p.2d.b32.trap \t[$s, \\{$x, $y\\}], \\{$r\\};",
	[]>;
	def SUST_P_2D_V2B8_TRAP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int16Regs:$r,
	Int16Regs:$g),
	"sust.p.2d.v2.b8.trap \t[$s, \\{$x, $y\\}], \\{$r, $g\\};",
	[]>;
	def SUST_P_2D_V2B16_TRAP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int16Regs:$r,
	Int16Regs:$g),
	"sust.p.2d.v2.b16.trap \t[$s, \\{$x, $y\\}], \\{$r, $g\\};",
	[]>;
	def SUST_P_2D_V2B32_TRAP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$r,
	Int32Regs:$g),
	"sust.p.2d.v2.b32.trap \t[$s, \\{$x, $y\\}], \\{$r, $g\\};",
	[]>;
	def SUST_P_2D_V4B8_TRAP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int16Regs:$r,
	Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),
	"sust.p.2d.v4.b8.trap \t[$s, \\{$x, $y\\}], "
	"\\{$r, $g, $b, $a\\};",
	[]>;
	def SUST_P_2D_V4B16_TRAP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int16Regs:$r,
	Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),
	"sust.p.2d.v4.b16.trap \t[$s, \\{$x, $y\\}], "
	"\\{$r, $g, $b, $a\\};",
	[]>;
	def SUST_P_2D_V4B32_TRAP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$r,
	Int32Regs:$g, Int32Regs:$b, Int32Regs:$a),
	"sust.p.2d.v4.b32.trap \t[$s, \\{$x, $y\\}], "
	"\\{$r, $g, $b, $a\\};",
	[]>;


	def SUST_P_2D_ARRAY_B8_TRAP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$idx, Int32Regs:$x, Int32Regs:$y,
	Int16Regs:$r),
	"sust.p.a2d.b8.trap \t[$s, \\{$idx, $x, $y, $y\\}], \\{$r\\};",
	[]>;
	def SUST_P_2D_ARRAY_B16_TRAP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$idx, Int32Regs:$x, Int32Regs:$y,
	Int16Regs:$r),
	"sust.p.a2d.b16.trap \t[$s, \\{$idx, $x, $y, $y\\}], \\{$r\\};",
	[]>;
	def SUST_P_2D_ARRAY_B32_TRAP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$idx, Int32Regs:$x, Int32Regs:$y,
	Int32Regs:$r),
	"sust.p.a2d.b32.trap \t[$s, \\{$idx, $x, $y, $y\\}], \\{$r\\};",
	[]>;
	def SUST_P_2D_ARRAY_V2B8_TRAP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$idx, Int32Regs:$x, Int32Regs:$y,
	Int16Regs:$r, Int16Regs:$g),
	"sust.p.a2d.v2.b8.trap \t[$s, \\{$idx, $x, $y, $y\\}], "
	"\\{$r, $g\\};",
	[]>;
	def SUST_P_2D_ARRAY_V2B16_TRAP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$idx, Int32Regs:$x, Int32Regs:$y,
	Int16Regs:$r, Int16Regs:$g),
	"sust.p.a2d.v2.b16.trap \t[$s, \\{$idx, $x, $y, $y\\}], "
	"\\{$r, $g\\};",
	[]>;
	def SUST_P_2D_ARRAY_V2B32_TRAP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$idx, Int32Regs:$x, Int32Regs:$y,
	Int32Regs:$r, Int32Regs:$g),
	"sust.p.a2d.v2.b32.trap \t[$s, \\{$idx, $x, $y, $y\\}], "
	"\\{$r, $g\\};",
	[]>;
	def SUST_P_2D_ARRAY_V4B8_TRAP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$idx, Int32Regs:$x, Int32Regs:$y,
	Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),
	"sust.p.a2d.v4.b8.trap \t[$s, \\{$idx, $x, $y, $y\\}], "
	"\\{$r, $g, $b, $a\\};",
	[]>;
	def SUST_P_2D_ARRAY_V4B16_TRAP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$idx, Int32Regs:$x, Int32Regs:$y,
	Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),
	"sust.p.a2d.v4.b16.trap \t[$s, \\{$idx, $x, $y, $y\\}], "
	"\\{$r, $g, $b, $a\\};",
	[]>;
	def SUST_P_2D_ARRAY_V4B32_TRAP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$idx, Int32Regs:$x, Int32Regs:$y,
	Int32Regs:$r, Int32Regs:$g, Int32Regs:$b, Int32Regs:$a),
	"sust.p.a2d.v4.b32.trap \t[$s, \\{$idx, $x, $y, $y\\}], "
	"\\{$r, $g, $b, $a\\};",
	[]>;


	def SUST_P_3D_B8_TRAP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int16Regs:$r),
	"sust.p.3d.b8.trap \t[$s, \\{$x, $y, $z, $z\\}], \\{$r\\};",
	[]>;
	def SUST_P_3D_B16_TRAP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int16Regs:$r),
	"sust.p.3d.b16.trap \t[$s, \\{$x, $y, $z, $z\\}], \\{$r\\};",
	[]>;
	def SUST_P_3D_B32_TRAP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int32Regs:$r),
	"sust.p.3d.b32.trap \t[$s, \\{$x, $y, $z, $z\\}], \\{$r\\};",
	[]>;
	def SUST_P_3D_V2B8_TRAP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int16Regs:$r, Int16Regs:$g),
	"sust.p.3d.v2.b8.trap \t[$s, \\{$x, $y, $z, $z\\}], "
	"\\{$r, $g\\};",
	[]>;
	def SUST_P_3D_V2B16_TRAP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int16Regs:$r, Int16Regs:$g),
	"sust.p.3d.v2.b16.trap \t[$s, \\{$x, $y, $z, $z\\}], "
	"\\{$r, $g\\};",
	[]>;
	def SUST_P_3D_V2B32_TRAP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int32Regs:$r, Int32Regs:$g),
	"sust.p.3d.v2.b32.trap \t[$s, \\{$x, $y, $z, $z\\}], "
	"\\{$r, $g\\};",
	[]>;
	def SUST_P_3D_V4B8_TRAP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),
	"sust.p.3d.v4.b8.trap \t[$s, \\{$x, $y, $z, $z\\}], "
	"\\{$r, $g, $b, $a\\};",
	[]>;
	def SUST_P_3D_V4B16_TRAP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),
	"sust.p.3d.v4.b16.trap \t[$s, \\{$x, $y, $z, $z\\}], "
	"\\{$r, $g, $b, $a\\};",
	[]>;
	def SUST_P_3D_V4B32_TRAP
	: NVPTXInst<(outs),
	(ins Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int32Regs:$r, Int32Regs:$g, Int32Regs:$b, Int32Regs:$a),
	"sust.p.3d.v4.b32.trap \t[$s, \\{$x, $y, $z, $z\\}], "
	"\\{$r, $g, $b, $a\\};",
	[]>;
	}			}

	// Surface store instruction patterns			// Surface store instruction patterns
	// I'm not sure why we can't just include these in the instruction definitions,			// I'm not sure why we can't just include these in the instruction definitions,
	// but TableGen complains of type errors :(			// but TableGen complains of type errors :(

	// .clamp variant			// .clamp variant
	def : Pat<(int_nvvm_sust_b_1d_i8_clamp			def : Pat<(int_nvvm_sust_b_1d_i8_clamp
	Int64Regs:$s, Int32Regs:$x, Int16Regs:$r),			Int64Regs:$s, Int32Regs:$x, Int16Regs:$r),
	(SUST_B_1D_B8_CLAMP Int64Regs:$s, Int32Regs:$x, Int16Regs:$r)>;			(SUST_B_1D_B8_CLAMP_R Int64Regs:$s, Int32Regs:$x, Int16Regs:$r)>;

	def : Pat<(int_nvvm_sust_b_1d_i16_clamp			def : Pat<(int_nvvm_sust_b_1d_i16_clamp
	Int64Regs:$s, Int32Regs:$x, Int16Regs:$r),			Int64Regs:$s, Int32Regs:$x, Int16Regs:$r),
	(SUST_B_1D_B16_CLAMP Int64Regs:$s, Int32Regs:$x, Int16Regs:$r)>;			(SUST_B_1D_B16_CLAMP_R Int64Regs:$s, Int32Regs:$x, Int16Regs:$r)>;

	def : Pat<(int_nvvm_sust_b_1d_i32_clamp			def : Pat<(int_nvvm_sust_b_1d_i32_clamp
	Int64Regs:$s, Int32Regs:$x, Int32Regs:$r),			Int64Regs:$s, Int32Regs:$x, Int32Regs:$r),
	(SUST_B_1D_B32_CLAMP Int64Regs:$s, Int32Regs:$x, Int32Regs:$r)>;			(SUST_B_1D_B32_CLAMP_R Int64Regs:$s, Int32Regs:$x, Int32Regs:$r)>;

	def : Pat<(int_nvvm_sust_b_1d_i64_clamp			def : Pat<(int_nvvm_sust_b_1d_i64_clamp
	Int64Regs:$s, Int32Regs:$x, Int64Regs:$r),			Int64Regs:$s, Int32Regs:$x, Int64Regs:$r),
	(SUST_B_1D_B64_CLAMP Int64Regs:$s, Int32Regs:$x, Int64Regs:$r)>;			(SUST_B_1D_B64_CLAMP_R Int64Regs:$s, Int32Regs:$x, Int64Regs:$r)>;

	def : Pat<(int_nvvm_sust_b_1d_v2i8_clamp			def : Pat<(int_nvvm_sust_b_1d_v2i8_clamp
	Int64Regs:$s, Int32Regs:$x, Int16Regs:$r, Int16Regs:$g),			Int64Regs:$s, Int32Regs:$x, Int16Regs:$r, Int16Regs:$g),
	(SUST_B_1D_V2B8_CLAMP Int64Regs:$s, Int32Regs:$x,			(SUST_B_1D_V2B8_CLAMP_R Int64Regs:$s, Int32Regs:$x,
	Int16Regs:$r, Int16Regs:$g)>;			Int16Regs:$r, Int16Regs:$g)>;

	def : Pat<(int_nvvm_sust_b_1d_v2i16_clamp			def : Pat<(int_nvvm_sust_b_1d_v2i16_clamp
	Int64Regs:$s, Int32Regs:$x, Int16Regs:$r, Int16Regs:$g),			Int64Regs:$s, Int32Regs:$x, Int16Regs:$r, Int16Regs:$g),
	(SUST_B_1D_V2B16_CLAMP Int64Regs:$s, Int32Regs:$x,			(SUST_B_1D_V2B16_CLAMP_R Int64Regs:$s, Int32Regs:$x,
	Int16Regs:$r, Int16Regs:$g)>;			Int16Regs:$r, Int16Regs:$g)>;

	def : Pat<(int_nvvm_sust_b_1d_v2i32_clamp			def : Pat<(int_nvvm_sust_b_1d_v2i32_clamp
	Int64Regs:$s, Int32Regs:$x, Int32Regs:$r, Int32Regs:$g),			Int64Regs:$s, Int32Regs:$x, Int32Regs:$r, Int32Regs:$g),
	(SUST_B_1D_V2B32_CLAMP Int64Regs:$s, Int32Regs:$x,			(SUST_B_1D_V2B32_CLAMP_R Int64Regs:$s, Int32Regs:$x,
	Int32Regs:$r, Int32Regs:$g)>;			Int32Regs:$r, Int32Regs:$g)>;

	def : Pat<(int_nvvm_sust_b_1d_v2i64_clamp			def : Pat<(int_nvvm_sust_b_1d_v2i64_clamp
	Int64Regs:$s, Int32Regs:$x, Int64Regs:$r, Int64Regs:$g),			Int64Regs:$s, Int32Regs:$x, Int64Regs:$r, Int64Regs:$g),
	(SUST_B_1D_V2B64_CLAMP Int64Regs:$s, Int32Regs:$x,			(SUST_B_1D_V2B64_CLAMP_R Int64Regs:$s, Int32Regs:$x,
	Int64Regs:$r, Int64Regs:$g)>;			Int64Regs:$r, Int64Regs:$g)>;

	def : Pat<(int_nvvm_sust_b_1d_v4i8_clamp			def : Pat<(int_nvvm_sust_b_1d_v4i8_clamp
	Int64Regs:$s, Int32Regs:$x,			Int64Regs:$s, Int32Regs:$x,
	Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),			Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),
	(SUST_B_1D_V4B8_CLAMP Int64Regs:$s, Int32Regs:$x,			(SUST_B_1D_V4B8_CLAMP_R Int64Regs:$s, Int32Regs:$x,
	Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a)>;			Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a)>;

	def : Pat<(int_nvvm_sust_b_1d_v4i16_clamp			def : Pat<(int_nvvm_sust_b_1d_v4i16_clamp
	Int64Regs:$s, Int32Regs:$x,			Int64Regs:$s, Int32Regs:$x,
	Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),			Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),
	(SUST_B_1D_V4B16_CLAMP Int64Regs:$s, Int32Regs:$x,			(SUST_B_1D_V4B16_CLAMP_R Int64Regs:$s, Int32Regs:$x,
	Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a)>;			Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a)>;

	def : Pat<(int_nvvm_sust_b_1d_v4i32_clamp			def : Pat<(int_nvvm_sust_b_1d_v4i32_clamp
	Int64Regs:$s, Int32Regs:$x,			Int64Regs:$s, Int32Regs:$x,
	Int32Regs:$r, Int32Regs:$g, Int32Regs:$b, Int32Regs:$a),			Int32Regs:$r, Int32Regs:$g, Int32Regs:$b, Int32Regs:$a),
	(SUST_B_1D_V4B32_CLAMP Int64Regs:$s, Int32Regs:$x,			(SUST_B_1D_V4B32_CLAMP_R Int64Regs:$s, Int32Regs:$x,
	Int32Regs:$r, Int32Regs:$g, Int32Regs:$b, Int32Regs:$a)>;			Int32Regs:$r, Int32Regs:$g, Int32Regs:$b, Int32Regs:$a)>;



	def : Pat<(int_nvvm_sust_b_1d_array_i8_clamp			def : Pat<(int_nvvm_sust_b_1d_array_i8_clamp
	Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int16Regs:$r),			Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int16Regs:$r),
	(SUST_B_1D_ARRAY_B8_CLAMP Int64Regs:$s, Int32Regs:$l, Int32Regs:$x,			(SUST_B_1D_ARRAY_B8_CLAMP_R Int64Regs:$s, Int32Regs:$l, Int32Regs:$x,
	Int16Regs:$r)>;			Int16Regs:$r)>;

	def : Pat<(int_nvvm_sust_b_1d_array_i16_clamp			def : Pat<(int_nvvm_sust_b_1d_array_i16_clamp
	Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int16Regs:$r),			Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int16Regs:$r),
	(SUST_B_1D_ARRAY_B16_CLAMP Int64Regs:$s, Int32Regs:$l, Int32Regs:$x,			(SUST_B_1D_ARRAY_B16_CLAMP_R Int64Regs:$s, Int32Regs:$l, Int32Regs:$x,
	Int16Regs:$r)>;			Int16Regs:$r)>;

	def : Pat<(int_nvvm_sust_b_1d_array_i32_clamp			def : Pat<(int_nvvm_sust_b_1d_array_i32_clamp
	Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$r),			Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$r),
	(SUST_B_1D_ARRAY_B32_CLAMP Int64Regs:$s, Int32Regs:$l, Int32Regs:$x,			(SUST_B_1D_ARRAY_B32_CLAMP_R Int64Regs:$s, Int32Regs:$l, Int32Regs:$x,
	Int32Regs:$r)>;			Int32Regs:$r)>;

	def : Pat<(int_nvvm_sust_b_1d_array_i64_clamp			def : Pat<(int_nvvm_sust_b_1d_array_i64_clamp
	Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int64Regs:$r),			Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int64Regs:$r),
	(SUST_B_1D_ARRAY_B64_CLAMP Int64Regs:$s, Int32Regs:$l, Int32Regs:$x,			(SUST_B_1D_ARRAY_B64_CLAMP_R Int64Regs:$s, Int32Regs:$l, Int32Regs:$x,
	Int64Regs:$r)>;			Int64Regs:$r)>;

	def : Pat<(int_nvvm_sust_b_1d_array_v2i8_clamp			def : Pat<(int_nvvm_sust_b_1d_array_v2i8_clamp
	Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int16Regs:$r, Int16Regs:$g),			Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int16Regs:$r, Int16Regs:$g),
	(SUST_B_1D_ARRAY_V2B8_CLAMP Int64Regs:$s, Int32Regs:$l, Int32Regs:$x,			(SUST_B_1D_ARRAY_V2B8_CLAMP_R Int64Regs:$s, Int32Regs:$l, Int32Regs:$x,
	Int16Regs:$r, Int16Regs:$g)>;			Int16Regs:$r, Int16Regs:$g)>;

	def : Pat<(int_nvvm_sust_b_1d_array_v2i16_clamp			def : Pat<(int_nvvm_sust_b_1d_array_v2i16_clamp
	Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int16Regs:$r, Int16Regs:$g),			Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int16Regs:$r, Int16Regs:$g),
	(SUST_B_1D_ARRAY_V2B16_CLAMP Int64Regs:$s, Int32Regs:$l, Int32Regs:$x,			(SUST_B_1D_ARRAY_V2B16_CLAMP_R Int64Regs:$s, Int32Regs:$l, Int32Regs:$x,
	Int16Regs:$r, Int16Regs:$g)>;			Int16Regs:$r, Int16Regs:$g)>;

	def : Pat<(int_nvvm_sust_b_1d_array_v2i32_clamp			def : Pat<(int_nvvm_sust_b_1d_array_v2i32_clamp
	Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$r, Int32Regs:$g),			Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$r, Int32Regs:$g),
	(SUST_B_1D_ARRAY_V2B32_CLAMP Int64Regs:$s, Int32Regs:$l, Int32Regs:$x,			(SUST_B_1D_ARRAY_V2B32_CLAMP_R Int64Regs:$s, Int32Regs:$l, Int32Regs:$x,
	Int32Regs:$r, Int32Regs:$g)>;			Int32Regs:$r, Int32Regs:$g)>;

	def : Pat<(int_nvvm_sust_b_1d_array_v2i64_clamp			def : Pat<(int_nvvm_sust_b_1d_array_v2i64_clamp
	Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int64Regs:$r, Int64Regs:$g),			Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int64Regs:$r, Int64Regs:$g),
	(SUST_B_1D_ARRAY_V2B64_CLAMP Int64Regs:$s, Int32Regs:$l, Int32Regs:$x,			(SUST_B_1D_ARRAY_V2B64_CLAMP_R Int64Regs:$s, Int32Regs:$l, Int32Regs:$x,
	Int64Regs:$r, Int64Regs:$g)>;			Int64Regs:$r, Int64Regs:$g)>;

	def : Pat<(int_nvvm_sust_b_1d_array_v4i8_clamp			def : Pat<(int_nvvm_sust_b_1d_array_v4i8_clamp
	Int64Regs:$s, Int32Regs:$l, Int32Regs:$x,			Int64Regs:$s, Int32Regs:$l, Int32Regs:$x,
	Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),			Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),
	(SUST_B_1D_ARRAY_V4B8_CLAMP Int64Regs:$s, Int32Regs:$l, Int32Regs:$x,			(SUST_B_1D_ARRAY_V4B8_CLAMP_R Int64Regs:$s, Int32Regs:$l, Int32Regs:$x,
	Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a)>;			Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a)>;

	def : Pat<(int_nvvm_sust_b_1d_array_v4i16_clamp			def : Pat<(int_nvvm_sust_b_1d_array_v4i16_clamp
	Int64Regs:$s, Int32Regs:$l, Int32Regs:$x,			Int64Regs:$s, Int32Regs:$l, Int32Regs:$x,
	Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),			Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),
	(SUST_B_1D_ARRAY_V4B16_CLAMP Int64Regs:$s, Int32Regs:$l, Int32Regs:$x,			(SUST_B_1D_ARRAY_V4B16_CLAMP_R Int64Regs:$s, Int32Regs:$l, Int32Regs:$x,
	Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a)>;			Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a)>;

	def : Pat<(int_nvvm_sust_b_1d_array_v4i32_clamp			def : Pat<(int_nvvm_sust_b_1d_array_v4i32_clamp
	Int64Regs:$s, Int32Regs:$l, Int32Regs:$x,			Int64Regs:$s, Int32Regs:$l, Int32Regs:$x,
	Int32Regs:$r, Int32Regs:$g, Int32Regs:$b, Int32Regs:$a),			Int32Regs:$r, Int32Regs:$g, Int32Regs:$b, Int32Regs:$a),
	(SUST_B_1D_ARRAY_V4B32_CLAMP Int64Regs:$s, Int32Regs:$l, Int32Regs:$x,			(SUST_B_1D_ARRAY_V4B32_CLAMP_R Int64Regs:$s, Int32Regs:$l, Int32Regs:$x,
	Int32Regs:$r, Int32Regs:$g, Int32Regs:$b, Int32Regs:$a)>;			Int32Regs:$r, Int32Regs:$g, Int32Regs:$b, Int32Regs:$a)>;



	def : Pat<(int_nvvm_sust_b_2d_i8_clamp			def : Pat<(int_nvvm_sust_b_2d_i8_clamp
	Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int16Regs:$r),			Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int16Regs:$r),
	(SUST_B_2D_B8_CLAMP Int64Regs:$s, Int32Regs:$x, Int32Regs:$y,			(SUST_B_2D_B8_CLAMP_R Int64Regs:$s, Int32Regs:$x, Int32Regs:$y,
	Int16Regs:$r)>;			Int16Regs:$r)>;

	def : Pat<(int_nvvm_sust_b_2d_i16_clamp			def : Pat<(int_nvvm_sust_b_2d_i16_clamp
	Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int16Regs:$r),			Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int16Regs:$r),
	(SUST_B_2D_B16_CLAMP Int64Regs:$s, Int32Regs:$x, Int32Regs:$y,			(SUST_B_2D_B16_CLAMP_R Int64Regs:$s, Int32Regs:$x, Int32Regs:$y,
	Int16Regs:$r)>;			Int16Regs:$r)>;

	def : Pat<(int_nvvm_sust_b_2d_i32_clamp			def : Pat<(int_nvvm_sust_b_2d_i32_clamp
	Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$r),			Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$r),
	(SUST_B_2D_B32_CLAMP Int64Regs:$s, Int32Regs:$x, Int32Regs:$y,			(SUST_B_2D_B32_CLAMP_R Int64Regs:$s, Int32Regs:$x, Int32Regs:$y,
	Int32Regs:$r)>;			Int32Regs:$r)>;

	def : Pat<(int_nvvm_sust_b_2d_i64_clamp			def : Pat<(int_nvvm_sust_b_2d_i64_clamp
	Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int64Regs:$r),			Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int64Regs:$r),
	(SUST_B_2D_B64_CLAMP Int64Regs:$s, Int32Regs:$x, Int32Regs:$y,			(SUST_B_2D_B64_CLAMP_R Int64Regs:$s, Int32Regs:$x, Int32Regs:$y,
	Int64Regs:$r)>;			Int64Regs:$r)>;

	def : Pat<(int_nvvm_sust_b_2d_v2i8_clamp			def : Pat<(int_nvvm_sust_b_2d_v2i8_clamp
	Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int16Regs:$r, Int16Regs:$g),			Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int16Regs:$r, Int16Regs:$g),
	(SUST_B_2D_V2B8_CLAMP Int64Regs:$s, Int32Regs:$x, Int32Regs:$y,			(SUST_B_2D_V2B8_CLAMP_R Int64Regs:$s, Int32Regs:$x, Int32Regs:$y,
	Int16Regs:$r, Int16Regs:$g)>;			Int16Regs:$r, Int16Regs:$g)>;

	def : Pat<(int_nvvm_sust_b_2d_v2i16_clamp			def : Pat<(int_nvvm_sust_b_2d_v2i16_clamp
	Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int16Regs:$r, Int16Regs:$g),			Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int16Regs:$r, Int16Regs:$g),
	(SUST_B_2D_V2B16_CLAMP Int64Regs:$s, Int32Regs:$x, Int32Regs:$y,			(SUST_B_2D_V2B16_CLAMP_R Int64Regs:$s, Int32Regs:$x, Int32Regs:$y,
	Int16Regs:$r, Int16Regs:$g)>;			Int16Regs:$r, Int16Regs:$g)>;

	def : Pat<(int_nvvm_sust_b_2d_v2i32_clamp			def : Pat<(int_nvvm_sust_b_2d_v2i32_clamp
	Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$r, Int32Regs:$g),			Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$r, Int32Regs:$g),
	(SUST_B_2D_V2B32_CLAMP Int64Regs:$s, Int32Regs:$x, Int32Regs:$y,			(SUST_B_2D_V2B32_CLAMP_R Int64Regs:$s, Int32Regs:$x, Int32Regs:$y,
	Int32Regs:$r, Int32Regs:$g)>;			Int32Regs:$r, Int32Regs:$g)>;

	def : Pat<(int_nvvm_sust_b_2d_v2i64_clamp			def : Pat<(int_nvvm_sust_b_2d_v2i64_clamp
	Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int64Regs:$r, Int64Regs:$g),			Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int64Regs:$r, Int64Regs:$g),
	(SUST_B_2D_V2B64_CLAMP Int64Regs:$s, Int32Regs:$x, Int32Regs:$y,			(SUST_B_2D_V2B64_CLAMP_R Int64Regs:$s, Int32Regs:$x, Int32Regs:$y,
	Int64Regs:$r, Int64Regs:$g)>;			Int64Regs:$r, Int64Regs:$g)>;

	def : Pat<(int_nvvm_sust_b_2d_v4i8_clamp			def : Pat<(int_nvvm_sust_b_2d_v4i8_clamp
	Int64Regs:$s, Int32Regs:$x, Int32Regs:$y,			Int64Regs:$s, Int32Regs:$x, Int32Regs:$y,
	Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),			Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),
	(SUST_B_2D_V4B8_CLAMP Int64Regs:$s, Int32Regs:$x, Int32Regs:$y,			(SUST_B_2D_V4B8_CLAMP_R Int64Regs:$s, Int32Regs:$x, Int32Regs:$y,
	Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a)>;			Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a)>;

	def : Pat<(int_nvvm_sust_b_2d_v4i16_clamp			def : Pat<(int_nvvm_sust_b_2d_v4i16_clamp
	Int64Regs:$s, Int32Regs:$x, Int32Regs:$y,			Int64Regs:$s, Int32Regs:$x, Int32Regs:$y,
	Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),			Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),
	(SUST_B_2D_V4B16_CLAMP Int64Regs:$s, Int32Regs:$x, Int32Regs:$y,			(SUST_B_2D_V4B16_CLAMP_R Int64Regs:$s, Int32Regs:$x, Int32Regs:$y,
	Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a)>;			Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a)>;

	def : Pat<(int_nvvm_sust_b_2d_v4i32_clamp			def : Pat<(int_nvvm_sust_b_2d_v4i32_clamp
	Int64Regs:$s, Int32Regs:$x, Int32Regs:$y,			Int64Regs:$s, Int32Regs:$x, Int32Regs:$y,
	Int32Regs:$r, Int32Regs:$g, Int32Regs:$b, Int32Regs:$a),			Int32Regs:$r, Int32Regs:$g, Int32Regs:$b, Int32Regs:$a),
	(SUST_B_2D_V4B32_CLAMP Int64Regs:$s, Int32Regs:$x, Int32Regs:$y,			(SUST_B_2D_V4B32_CLAMP_R Int64Regs:$s, Int32Regs:$x, Int32Regs:$y,
	Int32Regs:$r, Int32Regs:$g, Int32Regs:$b, Int32Regs:$a)>;			Int32Regs:$r, Int32Regs:$g, Int32Regs:$b, Int32Regs:$a)>;



	def : Pat<(int_nvvm_sust_b_2d_array_i8_clamp			def : Pat<(int_nvvm_sust_b_2d_array_i8_clamp
	Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y, Int16Regs:$r),			Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y, Int16Regs:$r),
	(SUST_B_2D_ARRAY_B8_CLAMP Int64Regs:$s,			(SUST_B_2D_ARRAY_B8_CLAMP_R Int64Regs:$s,
	Int32Regs:$l, Int32Regs:$x, Int32Regs:$y,			Int32Regs:$l, Int32Regs:$x, Int32Regs:$y,
	Int16Regs:$r)>;			Int16Regs:$r)>;

	def : Pat<(int_nvvm_sust_b_2d_array_i16_clamp			def : Pat<(int_nvvm_sust_b_2d_array_i16_clamp
	Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y, Int16Regs:$r),			Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y, Int16Regs:$r),
	(SUST_B_2D_ARRAY_B16_CLAMP Int64Regs:$s,			(SUST_B_2D_ARRAY_B16_CLAMP_R Int64Regs:$s,
	Int32Regs:$l, Int32Regs:$x, Int32Regs:$y,			Int32Regs:$l, Int32Regs:$x, Int32Regs:$y,
	Int16Regs:$r)>;			Int16Regs:$r)>;

	def : Pat<(int_nvvm_sust_b_2d_array_i32_clamp			def : Pat<(int_nvvm_sust_b_2d_array_i32_clamp
	Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y, Int32Regs:$r),			Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y, Int32Regs:$r),
	(SUST_B_2D_ARRAY_B32_CLAMP Int64Regs:$s,			(SUST_B_2D_ARRAY_B32_CLAMP_R Int64Regs:$s,
	Int32Regs:$l, Int32Regs:$x, Int32Regs:$y,			Int32Regs:$l, Int32Regs:$x, Int32Regs:$y,
	Int32Regs:$r)>;			Int32Regs:$r)>;

	def : Pat<(int_nvvm_sust_b_2d_array_i64_clamp			def : Pat<(int_nvvm_sust_b_2d_array_i64_clamp
	Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y, Int64Regs:$r),			Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y, Int64Regs:$r),
	(SUST_B_2D_ARRAY_B64_CLAMP Int64Regs:$s,			(SUST_B_2D_ARRAY_B64_CLAMP_R Int64Regs:$s,
	Int32Regs:$l, Int32Regs:$x, Int32Regs:$y,			Int32Regs:$l, Int32Regs:$x, Int32Regs:$y,
	Int64Regs:$r)>;			Int64Regs:$r)>;

	def : Pat<(int_nvvm_sust_b_2d_array_v2i8_clamp			def : Pat<(int_nvvm_sust_b_2d_array_v2i8_clamp
	Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y,			Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y,
	Int16Regs:$r, Int16Regs:$g),			Int16Regs:$r, Int16Regs:$g),
	(SUST_B_2D_ARRAY_V2B8_CLAMP Int64Regs:$s, Int32Regs:$l,			(SUST_B_2D_ARRAY_V2B8_CLAMP_R Int64Regs:$s, Int32Regs:$l,
	Int32Regs:$x, Int32Regs:$y,			Int32Regs:$x, Int32Regs:$y,
	Int16Regs:$r, Int16Regs:$g)>;			Int16Regs:$r, Int16Regs:$g)>;

	def : Pat<(int_nvvm_sust_b_2d_array_v2i16_clamp			def : Pat<(int_nvvm_sust_b_2d_array_v2i16_clamp
	Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y,			Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y,
	Int16Regs:$r, Int16Regs:$g),			Int16Regs:$r, Int16Regs:$g),
	(SUST_B_2D_ARRAY_V2B16_CLAMP Int64Regs:$s, Int32Regs:$l,			(SUST_B_2D_ARRAY_V2B16_CLAMP_R Int64Regs:$s, Int32Regs:$l,
	Int32Regs:$x, Int32Regs:$y,			Int32Regs:$x, Int32Regs:$y,
	Int16Regs:$r, Int16Regs:$g)>;			Int16Regs:$r, Int16Regs:$g)>;

	def : Pat<(int_nvvm_sust_b_2d_array_v2i32_clamp			def : Pat<(int_nvvm_sust_b_2d_array_v2i32_clamp
	Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y, Int32Regs:$r,			Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y, Int32Regs:$r,
	Int32Regs:$g),			Int32Regs:$g),
	(SUST_B_2D_ARRAY_V2B32_CLAMP Int64Regs:$s, Int32Regs:$l,			(SUST_B_2D_ARRAY_V2B32_CLAMP_R Int64Regs:$s, Int32Regs:$l,
	Int32Regs:$x, Int32Regs:$y, Int32Regs:$r, Int32Regs:$g)>;			Int32Regs:$x, Int32Regs:$y, Int32Regs:$r, Int32Regs:$g)>;

	def : Pat<(int_nvvm_sust_b_2d_array_v2i64_clamp			def : Pat<(int_nvvm_sust_b_2d_array_v2i64_clamp
	Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y, Int64Regs:$r,			Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y, Int64Regs:$r,
	Int64Regs:$g),			Int64Regs:$g),
	(SUST_B_2D_ARRAY_V2B64_CLAMP Int64Regs:$s, Int32Regs:$l,			(SUST_B_2D_ARRAY_V2B64_CLAMP_R Int64Regs:$s, Int32Regs:$l,
	Int32Regs:$x, Int32Regs:$y, Int64Regs:$r, Int64Regs:$g)>;			Int32Regs:$x, Int32Regs:$y, Int64Regs:$r, Int64Regs:$g)>;

	def : Pat<(int_nvvm_sust_b_2d_array_v4i8_clamp			def : Pat<(int_nvvm_sust_b_2d_array_v4i8_clamp
	Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y,			Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y,
	Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),			Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),
	(SUST_B_2D_ARRAY_V4B8_CLAMP Int64Regs:$s,			(SUST_B_2D_ARRAY_V4B8_CLAMP_R Int64Regs:$s,
	Int32Regs:$l, Int32Regs:$x, Int32Regs:$y,			Int32Regs:$l, Int32Regs:$x, Int32Regs:$y,
	Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a)>;			Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a)>;

	def : Pat<(int_nvvm_sust_b_2d_array_v4i16_clamp			def : Pat<(int_nvvm_sust_b_2d_array_v4i16_clamp
	Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y,			Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y,
	Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),			Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),
	(SUST_B_2D_ARRAY_V4B16_CLAMP Int64Regs:$s,			(SUST_B_2D_ARRAY_V4B16_CLAMP_R Int64Regs:$s,
	Int32Regs:$l, Int32Regs:$x, Int32Regs:$y,			Int32Regs:$l, Int32Regs:$x, Int32Regs:$y,
	Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a)>;			Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a)>;

	def : Pat<(int_nvvm_sust_b_2d_array_v4i32_clamp			def : Pat<(int_nvvm_sust_b_2d_array_v4i32_clamp
	Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y,			Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y,
	Int32Regs:$r, Int32Regs:$g, Int32Regs:$b, Int32Regs:$a),			Int32Regs:$r, Int32Regs:$g, Int32Regs:$b, Int32Regs:$a),
	(SUST_B_2D_ARRAY_V4B32_CLAMP Int64Regs:$s, Int32Regs:$l,			(SUST_B_2D_ARRAY_V4B32_CLAMP_R Int64Regs:$s, Int32Regs:$l,
	Int32Regs:$x, Int32Regs:$y,			Int32Regs:$x, Int32Regs:$y,
	Int32Regs:$r, Int32Regs:$g, Int32Regs:$b, Int32Regs:$a)>;			Int32Regs:$r, Int32Regs:$g, Int32Regs:$b, Int32Regs:$a)>;



	def : Pat<(int_nvvm_sust_b_3d_i8_clamp			def : Pat<(int_nvvm_sust_b_3d_i8_clamp
	Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,			Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int16Regs:$r),			Int16Regs:$r),
	(SUST_B_3D_B8_CLAMP Int64Regs:$s,			(SUST_B_3D_B8_CLAMP_R Int64Regs:$s,
	Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,			Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int16Regs:$r)>;			Int16Regs:$r)>;

	def : Pat<(int_nvvm_sust_b_3d_i16_clamp			def : Pat<(int_nvvm_sust_b_3d_i16_clamp
	Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,			Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int16Regs:$r),			Int16Regs:$r),
	(SUST_B_3D_B16_CLAMP Int64Regs:$s,			(SUST_B_3D_B16_CLAMP_R Int64Regs:$s,
	Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,			Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int16Regs:$r)>;			Int16Regs:$r)>;

	def : Pat<(int_nvvm_sust_b_3d_i32_clamp			def : Pat<(int_nvvm_sust_b_3d_i32_clamp
	Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,			Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int32Regs:$r),			Int32Regs:$r),
	(SUST_B_3D_B32_CLAMP Int64Regs:$s,			(SUST_B_3D_B32_CLAMP_R Int64Regs:$s,
	Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,			Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int32Regs:$r)>;			Int32Regs:$r)>;

	def : Pat<(int_nvvm_sust_b_3d_i64_clamp			def : Pat<(int_nvvm_sust_b_3d_i64_clamp
	Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,			Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int64Regs:$r),			Int64Regs:$r),
	(SUST_B_3D_B64_CLAMP Int64Regs:$s,			(SUST_B_3D_B64_CLAMP_R Int64Regs:$s,
	Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,			Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int64Regs:$r)>;			Int64Regs:$r)>;

	def : Pat<(int_nvvm_sust_b_3d_v2i8_clamp			def : Pat<(int_nvvm_sust_b_3d_v2i8_clamp
	Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,			Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int16Regs:$r, Int16Regs:$g),			Int16Regs:$r, Int16Regs:$g),
	(SUST_B_3D_V2B8_CLAMP Int64Regs:$s,			(SUST_B_3D_V2B8_CLAMP_R Int64Regs:$s,
	Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,			Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int16Regs:$r, Int16Regs:$g)>;			Int16Regs:$r, Int16Regs:$g)>;

	def : Pat<(int_nvvm_sust_b_3d_v2i16_clamp			def : Pat<(int_nvvm_sust_b_3d_v2i16_clamp
	Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,			Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int16Regs:$r, Int16Regs:$g),			Int16Regs:$r, Int16Regs:$g),
	(SUST_B_3D_V2B16_CLAMP Int64Regs:$s,			(SUST_B_3D_V2B16_CLAMP_R Int64Regs:$s,
	Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,			Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int16Regs:$r, Int16Regs:$g)>;			Int16Regs:$r, Int16Regs:$g)>;

	def : Pat<(int_nvvm_sust_b_3d_v2i32_clamp			def : Pat<(int_nvvm_sust_b_3d_v2i32_clamp
	Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,			Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int32Regs:$r, Int32Regs:$g),			Int32Regs:$r, Int32Regs:$g),
	(SUST_B_3D_V2B32_CLAMP Int64Regs:$s,			(SUST_B_3D_V2B32_CLAMP_R Int64Regs:$s,
	Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,			Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int32Regs:$r, Int32Regs:$g)>;			Int32Regs:$r, Int32Regs:$g)>;

	def : Pat<(int_nvvm_sust_b_3d_v2i64_clamp			def : Pat<(int_nvvm_sust_b_3d_v2i64_clamp
	Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,			Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int64Regs:$r, Int64Regs:$g),			Int64Regs:$r, Int64Regs:$g),
	(SUST_B_3D_V2B64_CLAMP Int64Regs:$s,			(SUST_B_3D_V2B64_CLAMP_R Int64Regs:$s,
	Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,			Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int64Regs:$r, Int64Regs:$g)>;			Int64Regs:$r, Int64Regs:$g)>;

	def : Pat<(int_nvvm_sust_b_3d_v4i8_clamp			def : Pat<(int_nvvm_sust_b_3d_v4i8_clamp
	Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,			Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),			Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),
	(SUST_B_3D_V4B8_CLAMP Int64Regs:$s,			(SUST_B_3D_V4B8_CLAMP_R Int64Regs:$s,
	Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,			Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a)>;			Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a)>;

	def : Pat<(int_nvvm_sust_b_3d_v4i16_clamp			def : Pat<(int_nvvm_sust_b_3d_v4i16_clamp
	Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,			Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),			Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),
	(SUST_B_3D_V4B16_CLAMP Int64Regs:$s,			(SUST_B_3D_V4B16_CLAMP_R Int64Regs:$s,
	Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,			Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a)>;			Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a)>;

	def : Pat<(int_nvvm_sust_b_3d_v4i32_clamp			def : Pat<(int_nvvm_sust_b_3d_v4i32_clamp
	Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,			Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int32Regs:$r, Int32Regs:$g, Int32Regs:$b, Int32Regs:$a),			Int32Regs:$r, Int32Regs:$g, Int32Regs:$b, Int32Regs:$a),
	(SUST_B_3D_V4B32_CLAMP Int64Regs:$s,			(SUST_B_3D_V4B32_CLAMP_R Int64Regs:$s,
	Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,			Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int32Regs:$r, Int32Regs:$g, Int32Regs:$b, Int32Regs:$a)>;			Int32Regs:$r, Int32Regs:$g, Int32Regs:$b, Int32Regs:$a)>;


	// .trap variant			// .trap variant
	def : Pat<(int_nvvm_sust_b_1d_i8_trap			def : Pat<(int_nvvm_sust_b_1d_i8_trap
	Int64Regs:$s, Int32Regs:$x, Int16Regs:$r),			Int64Regs:$s, Int32Regs:$x, Int16Regs:$r),
	(SUST_B_1D_B8_TRAP Int64Regs:$s, Int32Regs:$x, Int16Regs:$r)>;			(SUST_B_1D_B8_TRAP_R Int64Regs:$s, Int32Regs:$x, Int16Regs:$r)>;

	def : Pat<(int_nvvm_sust_b_1d_i16_trap			def : Pat<(int_nvvm_sust_b_1d_i16_trap
	Int64Regs:$s, Int32Regs:$x, Int16Regs:$r),			Int64Regs:$s, Int32Regs:$x, Int16Regs:$r),
	(SUST_B_1D_B16_TRAP Int64Regs:$s, Int32Regs:$x, Int16Regs:$r)>;			(SUST_B_1D_B16_TRAP_R Int64Regs:$s, Int32Regs:$x, Int16Regs:$r)>;

	def : Pat<(int_nvvm_sust_b_1d_i32_trap			def : Pat<(int_nvvm_sust_b_1d_i32_trap
	Int64Regs:$s, Int32Regs:$x, Int32Regs:$r),			Int64Regs:$s, Int32Regs:$x, Int32Regs:$r),
	(SUST_B_1D_B32_TRAP Int64Regs:$s, Int32Regs:$x, Int32Regs:$r)>;			(SUST_B_1D_B32_TRAP_R Int64Regs:$s, Int32Regs:$x, Int32Regs:$r)>;

	def : Pat<(int_nvvm_sust_b_1d_i64_trap			def : Pat<(int_nvvm_sust_b_1d_i64_trap
	Int64Regs:$s, Int32Regs:$x, Int64Regs:$r),			Int64Regs:$s, Int32Regs:$x, Int64Regs:$r),
	(SUST_B_1D_B64_TRAP Int64Regs:$s, Int32Regs:$x, Int64Regs:$r)>;			(SUST_B_1D_B64_TRAP_R Int64Regs:$s, Int32Regs:$x, Int64Regs:$r)>;

	def : Pat<(int_nvvm_sust_b_1d_v2i8_trap			def : Pat<(int_nvvm_sust_b_1d_v2i8_trap
	Int64Regs:$s, Int32Regs:$x, Int16Regs:$r, Int16Regs:$g),			Int64Regs:$s, Int32Regs:$x, Int16Regs:$r, Int16Regs:$g),
	(SUST_B_1D_V2B8_TRAP Int64Regs:$s, Int32Regs:$x,			(SUST_B_1D_V2B8_TRAP_R Int64Regs:$s, Int32Regs:$x,
	Int16Regs:$r, Int16Regs:$g)>;			Int16Regs:$r, Int16Regs:$g)>;

	def : Pat<(int_nvvm_sust_b_1d_v2i16_trap			def : Pat<(int_nvvm_sust_b_1d_v2i16_trap
	Int64Regs:$s, Int32Regs:$x, Int16Regs:$r, Int16Regs:$g),			Int64Regs:$s, Int32Regs:$x, Int16Regs:$r, Int16Regs:$g),
	(SUST_B_1D_V2B16_TRAP Int64Regs:$s, Int32Regs:$x,			(SUST_B_1D_V2B16_TRAP_R Int64Regs:$s, Int32Regs:$x,
	Int16Regs:$r, Int16Regs:$g)>;			Int16Regs:$r, Int16Regs:$g)>;

	def : Pat<(int_nvvm_sust_b_1d_v2i32_trap			def : Pat<(int_nvvm_sust_b_1d_v2i32_trap
	Int64Regs:$s, Int32Regs:$x, Int32Regs:$r, Int32Regs:$g),			Int64Regs:$s, Int32Regs:$x, Int32Regs:$r, Int32Regs:$g),
	(SUST_B_1D_V2B32_TRAP Int64Regs:$s, Int32Regs:$x,			(SUST_B_1D_V2B32_TRAP_R Int64Regs:$s, Int32Regs:$x,
	Int32Regs:$r, Int32Regs:$g)>;			Int32Regs:$r, Int32Regs:$g)>;

	def : Pat<(int_nvvm_sust_b_1d_v2i64_trap			def : Pat<(int_nvvm_sust_b_1d_v2i64_trap
	Int64Regs:$s, Int32Regs:$x, Int64Regs:$r, Int64Regs:$g),			Int64Regs:$s, Int32Regs:$x, Int64Regs:$r, Int64Regs:$g),
	(SUST_B_1D_V2B64_TRAP Int64Regs:$s, Int32Regs:$x,			(SUST_B_1D_V2B64_TRAP_R Int64Regs:$s, Int32Regs:$x,
	Int64Regs:$r, Int64Regs:$g)>;			Int64Regs:$r, Int64Regs:$g)>;

	def : Pat<(int_nvvm_sust_b_1d_v4i8_trap			def : Pat<(int_nvvm_sust_b_1d_v4i8_trap
	Int64Regs:$s, Int32Regs:$x,			Int64Regs:$s, Int32Regs:$x,
	Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),			Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),
	(SUST_B_1D_V4B8_TRAP Int64Regs:$s, Int32Regs:$x,			(SUST_B_1D_V4B8_TRAP_R Int64Regs:$s, Int32Regs:$x,
	Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a)>;			Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a)>;

	def : Pat<(int_nvvm_sust_b_1d_v4i16_trap			def : Pat<(int_nvvm_sust_b_1d_v4i16_trap
	Int64Regs:$s, Int32Regs:$x,			Int64Regs:$s, Int32Regs:$x,
	Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),			Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),
	(SUST_B_1D_V4B16_TRAP Int64Regs:$s, Int32Regs:$x,			(SUST_B_1D_V4B16_TRAP_R Int64Regs:$s, Int32Regs:$x,
	Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a)>;			Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a)>;

	def : Pat<(int_nvvm_sust_b_1d_v4i32_trap			def : Pat<(int_nvvm_sust_b_1d_v4i32_trap
	Int64Regs:$s, Int32Regs:$x,			Int64Regs:$s, Int32Regs:$x,
	Int32Regs:$r, Int32Regs:$g, Int32Regs:$b, Int32Regs:$a),			Int32Regs:$r, Int32Regs:$g, Int32Regs:$b, Int32Regs:$a),
	(SUST_B_1D_V4B32_TRAP Int64Regs:$s, Int32Regs:$x,			(SUST_B_1D_V4B32_TRAP_R Int64Regs:$s, Int32Regs:$x,
	Int32Regs:$r, Int32Regs:$g, Int32Regs:$b, Int32Regs:$a)>;			Int32Regs:$r, Int32Regs:$g, Int32Regs:$b, Int32Regs:$a)>;



	def : Pat<(int_nvvm_sust_b_1d_array_i8_trap			def : Pat<(int_nvvm_sust_b_1d_array_i8_trap
	Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int16Regs:$r),			Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int16Regs:$r),
	(SUST_B_1D_ARRAY_B8_TRAP Int64Regs:$s, Int32Regs:$l, Int32Regs:$x,			(SUST_B_1D_ARRAY_B8_TRAP_R Int64Regs:$s, Int32Regs:$l, Int32Regs:$x,
	Int16Regs:$r)>;			Int16Regs:$r)>;

	def : Pat<(int_nvvm_sust_b_1d_array_i16_trap			def : Pat<(int_nvvm_sust_b_1d_array_i16_trap
	Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int16Regs:$r),			Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int16Regs:$r),
	(SUST_B_1D_ARRAY_B16_TRAP Int64Regs:$s, Int32Regs:$l, Int32Regs:$x,			(SUST_B_1D_ARRAY_B16_TRAP_R Int64Regs:$s, Int32Regs:$l, Int32Regs:$x,
	Int16Regs:$r)>;			Int16Regs:$r)>;

	def : Pat<(int_nvvm_sust_b_1d_array_i32_trap			def : Pat<(int_nvvm_sust_b_1d_array_i32_trap
	Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$r),			Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$r),
	(SUST_B_1D_ARRAY_B32_TRAP Int64Regs:$s, Int32Regs:$l, Int32Regs:$x,			(SUST_B_1D_ARRAY_B32_TRAP_R Int64Regs:$s, Int32Regs:$l, Int32Regs:$x,
	Int32Regs:$r)>;			Int32Regs:$r)>;

	def : Pat<(int_nvvm_sust_b_1d_array_i64_trap			def : Pat<(int_nvvm_sust_b_1d_array_i64_trap
	Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int64Regs:$r),			Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int64Regs:$r),
	(SUST_B_1D_ARRAY_B64_TRAP Int64Regs:$s, Int32Regs:$l, Int32Regs:$x,			(SUST_B_1D_ARRAY_B64_TRAP_R Int64Regs:$s, Int32Regs:$l, Int32Regs:$x,
	Int64Regs:$r)>;			Int64Regs:$r)>;

	def : Pat<(int_nvvm_sust_b_1d_array_v2i8_trap			def : Pat<(int_nvvm_sust_b_1d_array_v2i8_trap
	Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int16Regs:$r, Int16Regs:$g),			Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int16Regs:$r, Int16Regs:$g),
	(SUST_B_1D_ARRAY_V2B8_TRAP Int64Regs:$s, Int32Regs:$l, Int32Regs:$x,			(SUST_B_1D_ARRAY_V2B8_TRAP_R Int64Regs:$s, Int32Regs:$l, Int32Regs:$x,
	Int16Regs:$r, Int16Regs:$g)>;			Int16Regs:$r, Int16Regs:$g)>;

	def : Pat<(int_nvvm_sust_b_1d_array_v2i16_trap			def : Pat<(int_nvvm_sust_b_1d_array_v2i16_trap
	Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int16Regs:$r, Int16Regs:$g),			Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int16Regs:$r, Int16Regs:$g),
	(SUST_B_1D_ARRAY_V2B16_TRAP Int64Regs:$s, Int32Regs:$l, Int32Regs:$x,			(SUST_B_1D_ARRAY_V2B16_TRAP_R Int64Regs:$s, Int32Regs:$l, Int32Regs:$x,
	Int16Regs:$r, Int16Regs:$g)>;			Int16Regs:$r, Int16Regs:$g)>;

	def : Pat<(int_nvvm_sust_b_1d_array_v2i32_trap			def : Pat<(int_nvvm_sust_b_1d_array_v2i32_trap
	Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$r, Int32Regs:$g),			Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$r, Int32Regs:$g),
	(SUST_B_1D_ARRAY_V2B32_TRAP Int64Regs:$s, Int32Regs:$l, Int32Regs:$x,			(SUST_B_1D_ARRAY_V2B32_TRAP_R Int64Regs:$s, Int32Regs:$l, Int32Regs:$x,
	Int32Regs:$r, Int32Regs:$g)>;			Int32Regs:$r, Int32Regs:$g)>;

	def : Pat<(int_nvvm_sust_b_1d_array_v2i64_trap			def : Pat<(int_nvvm_sust_b_1d_array_v2i64_trap
	Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int64Regs:$r, Int64Regs:$g),			Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int64Regs:$r, Int64Regs:$g),
	(SUST_B_1D_ARRAY_V2B64_TRAP Int64Regs:$s, Int32Regs:$l, Int32Regs:$x,			(SUST_B_1D_ARRAY_V2B64_TRAP_R Int64Regs:$s, Int32Regs:$l, Int32Regs:$x,
	Int64Regs:$r, Int64Regs:$g)>;			Int64Regs:$r, Int64Regs:$g)>;

	def : Pat<(int_nvvm_sust_b_1d_array_v4i8_trap			def : Pat<(int_nvvm_sust_b_1d_array_v4i8_trap
	Int64Regs:$s, Int32Regs:$l, Int32Regs:$x,			Int64Regs:$s, Int32Regs:$l, Int32Regs:$x,
	Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),			Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),
	(SUST_B_1D_ARRAY_V4B8_TRAP Int64Regs:$s, Int32Regs:$l, Int32Regs:$x,			(SUST_B_1D_ARRAY_V4B8_TRAP_R Int64Regs:$s, Int32Regs:$l, Int32Regs:$x,
	Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a)>;			Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a)>;

	def : Pat<(int_nvvm_sust_b_1d_array_v4i16_trap			def : Pat<(int_nvvm_sust_b_1d_array_v4i16_trap
	Int64Regs:$s, Int32Regs:$l, Int32Regs:$x,			Int64Regs:$s, Int32Regs:$l, Int32Regs:$x,
	Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),			Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),
	(SUST_B_1D_ARRAY_V4B16_TRAP Int64Regs:$s, Int32Regs:$l, Int32Regs:$x,			(SUST_B_1D_ARRAY_V4B16_TRAP_R Int64Regs:$s, Int32Regs:$l, Int32Regs:$x,
	Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a)>;			Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a)>;

	def : Pat<(int_nvvm_sust_b_1d_array_v4i32_trap			def : Pat<(int_nvvm_sust_b_1d_array_v4i32_trap
	Int64Regs:$s, Int32Regs:$l, Int32Regs:$x,			Int64Regs:$s, Int32Regs:$l, Int32Regs:$x,
	Int32Regs:$r, Int32Regs:$g, Int32Regs:$b, Int32Regs:$a),			Int32Regs:$r, Int32Regs:$g, Int32Regs:$b, Int32Regs:$a),
	(SUST_B_1D_ARRAY_V4B32_TRAP Int64Regs:$s, Int32Regs:$l, Int32Regs:$x,			(SUST_B_1D_ARRAY_V4B32_TRAP_R Int64Regs:$s, Int32Regs:$l, Int32Regs:$x,
	Int32Regs:$r, Int32Regs:$g, Int32Regs:$b, Int32Regs:$a)>;			Int32Regs:$r, Int32Regs:$g, Int32Regs:$b, Int32Regs:$a)>;



	def : Pat<(int_nvvm_sust_b_2d_i8_trap			def : Pat<(int_nvvm_sust_b_2d_i8_trap
	Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int16Regs:$r),			Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int16Regs:$r),
	(SUST_B_2D_B8_TRAP Int64Regs:$s, Int32Regs:$x, Int32Regs:$y,			(SUST_B_2D_B8_TRAP_R Int64Regs:$s, Int32Regs:$x, Int32Regs:$y,
	Int16Regs:$r)>;			Int16Regs:$r)>;

	def : Pat<(int_nvvm_sust_b_2d_i16_trap			def : Pat<(int_nvvm_sust_b_2d_i16_trap
	Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int16Regs:$r),			Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int16Regs:$r),
	(SUST_B_2D_B16_TRAP Int64Regs:$s, Int32Regs:$x, Int32Regs:$y,			(SUST_B_2D_B16_TRAP_R Int64Regs:$s, Int32Regs:$x, Int32Regs:$y,
	Int16Regs:$r)>;			Int16Regs:$r)>;

	def : Pat<(int_nvvm_sust_b_2d_i32_trap			def : Pat<(int_nvvm_sust_b_2d_i32_trap
	Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$r),			Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$r),
	(SUST_B_2D_B32_TRAP Int64Regs:$s, Int32Regs:$x, Int32Regs:$y,			(SUST_B_2D_B32_TRAP_R Int64Regs:$s, Int32Regs:$x, Int32Regs:$y,
	Int32Regs:$r)>;			Int32Regs:$r)>;

	def : Pat<(int_nvvm_sust_b_2d_i64_trap			def : Pat<(int_nvvm_sust_b_2d_i64_trap
	Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int64Regs:$r),			Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int64Regs:$r),
	(SUST_B_2D_B64_TRAP Int64Regs:$s, Int32Regs:$x, Int32Regs:$y,			(SUST_B_2D_B64_TRAP_R Int64Regs:$s, Int32Regs:$x, Int32Regs:$y,
	Int64Regs:$r)>;			Int64Regs:$r)>;

	def : Pat<(int_nvvm_sust_b_2d_v2i8_trap			def : Pat<(int_nvvm_sust_b_2d_v2i8_trap
	Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int16Regs:$r, Int16Regs:$g),			Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int16Regs:$r, Int16Regs:$g),
	(SUST_B_2D_V2B8_TRAP Int64Regs:$s, Int32Regs:$x, Int32Regs:$y,			(SUST_B_2D_V2B8_TRAP_R Int64Regs:$s, Int32Regs:$x, Int32Regs:$y,
	Int16Regs:$r, Int16Regs:$g)>;			Int16Regs:$r, Int16Regs:$g)>;

	def : Pat<(int_nvvm_sust_b_2d_v2i16_trap			def : Pat<(int_nvvm_sust_b_2d_v2i16_trap
	Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int16Regs:$r, Int16Regs:$g),			Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int16Regs:$r, Int16Regs:$g),
	(SUST_B_2D_V2B16_TRAP Int64Regs:$s, Int32Regs:$x, Int32Regs:$y,			(SUST_B_2D_V2B16_TRAP_R Int64Regs:$s, Int32Regs:$x, Int32Regs:$y,
	Int16Regs:$r, Int16Regs:$g)>;			Int16Regs:$r, Int16Regs:$g)>;

	def : Pat<(int_nvvm_sust_b_2d_v2i32_trap			def : Pat<(int_nvvm_sust_b_2d_v2i32_trap
	Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$r, Int32Regs:$g),			Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$r, Int32Regs:$g),
	(SUST_B_2D_V2B32_TRAP Int64Regs:$s, Int32Regs:$x, Int32Regs:$y,			(SUST_B_2D_V2B32_TRAP_R Int64Regs:$s, Int32Regs:$x, Int32Regs:$y,
	Int32Regs:$r, Int32Regs:$g)>;			Int32Regs:$r, Int32Regs:$g)>;

	def : Pat<(int_nvvm_sust_b_2d_v2i64_trap			def : Pat<(int_nvvm_sust_b_2d_v2i64_trap
	Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int64Regs:$r, Int64Regs:$g),			Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int64Regs:$r, Int64Regs:$g),
	(SUST_B_2D_V2B64_TRAP Int64Regs:$s, Int32Regs:$x, Int32Regs:$y,			(SUST_B_2D_V2B64_TRAP_R Int64Regs:$s, Int32Regs:$x, Int32Regs:$y,
	Int64Regs:$r, Int64Regs:$g)>;			Int64Regs:$r, Int64Regs:$g)>;

	def : Pat<(int_nvvm_sust_b_2d_v4i8_trap			def : Pat<(int_nvvm_sust_b_2d_v4i8_trap
	Int64Regs:$s, Int32Regs:$x, Int32Regs:$y,			Int64Regs:$s, Int32Regs:$x, Int32Regs:$y,
	Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),			Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),
	(SUST_B_2D_V4B8_TRAP Int64Regs:$s, Int32Regs:$x, Int32Regs:$y,			(SUST_B_2D_V4B8_TRAP_R Int64Regs:$s, Int32Regs:$x, Int32Regs:$y,
	Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a)>;			Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a)>;

	def : Pat<(int_nvvm_sust_b_2d_v4i16_trap			def : Pat<(int_nvvm_sust_b_2d_v4i16_trap
	Int64Regs:$s, Int32Regs:$x, Int32Regs:$y,			Int64Regs:$s, Int32Regs:$x, Int32Regs:$y,
	Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),			Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),
	(SUST_B_2D_V4B16_TRAP Int64Regs:$s, Int32Regs:$x, Int32Regs:$y,			(SUST_B_2D_V4B16_TRAP_R Int64Regs:$s, Int32Regs:$x, Int32Regs:$y,
	Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a)>;			Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a)>;

	def : Pat<(int_nvvm_sust_b_2d_v4i32_trap			def : Pat<(int_nvvm_sust_b_2d_v4i32_trap
	Int64Regs:$s, Int32Regs:$x, Int32Regs:$y,			Int64Regs:$s, Int32Regs:$x, Int32Regs:$y,
	Int32Regs:$r, Int32Regs:$g, Int32Regs:$b, Int32Regs:$a),			Int32Regs:$r, Int32Regs:$g, Int32Regs:$b, Int32Regs:$a),
	(SUST_B_2D_V4B32_TRAP Int64Regs:$s, Int32Regs:$x, Int32Regs:$y,			(SUST_B_2D_V4B32_TRAP_R Int64Regs:$s, Int32Regs:$x, Int32Regs:$y,
	Int32Regs:$r, Int32Regs:$g, Int32Regs:$b, Int32Regs:$a)>;			Int32Regs:$r, Int32Regs:$g, Int32Regs:$b, Int32Regs:$a)>;



	def : Pat<(int_nvvm_sust_b_2d_array_i8_trap			def : Pat<(int_nvvm_sust_b_2d_array_i8_trap
	Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y, Int16Regs:$r),			Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y, Int16Regs:$r),
	(SUST_B_2D_ARRAY_B8_TRAP Int64Regs:$s,			(SUST_B_2D_ARRAY_B8_TRAP_R Int64Regs:$s,
	Int32Regs:$l, Int32Regs:$x, Int32Regs:$y,			Int32Regs:$l, Int32Regs:$x, Int32Regs:$y,
	Int16Regs:$r)>;			Int16Regs:$r)>;

	def : Pat<(int_nvvm_sust_b_2d_array_i16_trap			def : Pat<(int_nvvm_sust_b_2d_array_i16_trap
	Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y, Int16Regs:$r),			Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y, Int16Regs:$r),
	(SUST_B_2D_ARRAY_B16_TRAP Int64Regs:$s,			(SUST_B_2D_ARRAY_B16_TRAP_R Int64Regs:$s,
	Int32Regs:$l, Int32Regs:$x, Int32Regs:$y,			Int32Regs:$l, Int32Regs:$x, Int32Regs:$y,
	Int16Regs:$r)>;			Int16Regs:$r)>;

	def : Pat<(int_nvvm_sust_b_2d_array_i32_trap			def : Pat<(int_nvvm_sust_b_2d_array_i32_trap
	Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y, Int32Regs:$r),			Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y, Int32Regs:$r),
	(SUST_B_2D_ARRAY_B32_TRAP Int64Regs:$s,			(SUST_B_2D_ARRAY_B32_TRAP_R Int64Regs:$s,
	Int32Regs:$l, Int32Regs:$x, Int32Regs:$y,			Int32Regs:$l, Int32Regs:$x, Int32Regs:$y,
	Int32Regs:$r)>;			Int32Regs:$r)>;

	def : Pat<(int_nvvm_sust_b_2d_array_i64_trap			def : Pat<(int_nvvm_sust_b_2d_array_i64_trap
	Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y, Int64Regs:$r),			Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y, Int64Regs:$r),
	(SUST_B_2D_ARRAY_B64_TRAP Int64Regs:$s,			(SUST_B_2D_ARRAY_B64_TRAP_R Int64Regs:$s,
	Int32Regs:$l, Int32Regs:$x, Int32Regs:$y,			Int32Regs:$l, Int32Regs:$x, Int32Regs:$y,
	Int64Regs:$r)>;			Int64Regs:$r)>;

	def : Pat<(int_nvvm_sust_b_2d_array_v2i8_trap			def : Pat<(int_nvvm_sust_b_2d_array_v2i8_trap
	Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y,			Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y,
	Int16Regs:$r, Int16Regs:$g),			Int16Regs:$r, Int16Regs:$g),
	(SUST_B_2D_ARRAY_V2B8_TRAP Int64Regs:$s, Int32Regs:$l,			(SUST_B_2D_ARRAY_V2B8_TRAP_R Int64Regs:$s, Int32Regs:$l,
	Int32Regs:$x, Int32Regs:$y,			Int32Regs:$x, Int32Regs:$y,
	Int16Regs:$r, Int16Regs:$g)>;			Int16Regs:$r, Int16Regs:$g)>;

	def : Pat<(int_nvvm_sust_b_2d_array_v2i16_trap			def : Pat<(int_nvvm_sust_b_2d_array_v2i16_trap
	Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y,			Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y,
	Int16Regs:$r, Int16Regs:$g),			Int16Regs:$r, Int16Regs:$g),
	(SUST_B_2D_ARRAY_V2B16_TRAP Int64Regs:$s, Int32Regs:$l,			(SUST_B_2D_ARRAY_V2B16_TRAP_R Int64Regs:$s, Int32Regs:$l,
	Int32Regs:$x, Int32Regs:$y,			Int32Regs:$x, Int32Regs:$y,
	Int16Regs:$r, Int16Regs:$g)>;			Int16Regs:$r, Int16Regs:$g)>;

	def : Pat<(int_nvvm_sust_b_2d_array_v2i32_trap			def : Pat<(int_nvvm_sust_b_2d_array_v2i32_trap
	Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y, Int32Regs:$r,			Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y, Int32Regs:$r,
	Int32Regs:$g),			Int32Regs:$g),
	(SUST_B_2D_ARRAY_V2B32_TRAP Int64Regs:$s, Int32Regs:$l,			(SUST_B_2D_ARRAY_V2B32_TRAP_R Int64Regs:$s, Int32Regs:$l,
	Int32Regs:$x, Int32Regs:$y, Int32Regs:$r, Int32Regs:$g)>;			Int32Regs:$x, Int32Regs:$y, Int32Regs:$r, Int32Regs:$g)>;

	def : Pat<(int_nvvm_sust_b_2d_array_v2i64_trap			def : Pat<(int_nvvm_sust_b_2d_array_v2i64_trap
	Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y, Int64Regs:$r,			Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y, Int64Regs:$r,
	Int64Regs:$g),			Int64Regs:$g),
	(SUST_B_2D_ARRAY_V2B64_TRAP Int64Regs:$s, Int32Regs:$l,			(SUST_B_2D_ARRAY_V2B64_TRAP_R Int64Regs:$s, Int32Regs:$l,
	Int32Regs:$x, Int32Regs:$y, Int64Regs:$r, Int64Regs:$g)>;			Int32Regs:$x, Int32Regs:$y, Int64Regs:$r, Int64Regs:$g)>;

	def : Pat<(int_nvvm_sust_b_2d_array_v4i8_trap			def : Pat<(int_nvvm_sust_b_2d_array_v4i8_trap
	Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y,			Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y,
	Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),			Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),
	(SUST_B_2D_ARRAY_V4B8_TRAP Int64Regs:$s,			(SUST_B_2D_ARRAY_V4B8_TRAP_R Int64Regs:$s,
	Int32Regs:$l, Int32Regs:$x, Int32Regs:$y,			Int32Regs:$l, Int32Regs:$x, Int32Regs:$y,
	Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a)>;			Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a)>;

	def : Pat<(int_nvvm_sust_b_2d_array_v4i16_trap			def : Pat<(int_nvvm_sust_b_2d_array_v4i16_trap
	Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y,			Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y,
	Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),			Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),
	(SUST_B_2D_ARRAY_V4B16_TRAP Int64Regs:$s,			(SUST_B_2D_ARRAY_V4B16_TRAP_R Int64Regs:$s,
	Int32Regs:$l, Int32Regs:$x, Int32Regs:$y,			Int32Regs:$l, Int32Regs:$x, Int32Regs:$y,
	Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a)>;			Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a)>;

	def : Pat<(int_nvvm_sust_b_2d_array_v4i32_trap			def : Pat<(int_nvvm_sust_b_2d_array_v4i32_trap
	Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y,			Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y,
	Int32Regs:$r, Int32Regs:$g, Int32Regs:$b, Int32Regs:$a),			Int32Regs:$r, Int32Regs:$g, Int32Regs:$b, Int32Regs:$a),
	(SUST_B_2D_ARRAY_V4B32_TRAP Int64Regs:$s, Int32Regs:$l,			(SUST_B_2D_ARRAY_V4B32_TRAP_R Int64Regs:$s, Int32Regs:$l,
	Int32Regs:$x, Int32Regs:$y,			Int32Regs:$x, Int32Regs:$y,
	Int32Regs:$r, Int32Regs:$g, Int32Regs:$b, Int32Regs:$a)>;			Int32Regs:$r, Int32Regs:$g, Int32Regs:$b, Int32Regs:$a)>;



	def : Pat<(int_nvvm_sust_b_3d_i8_trap			def : Pat<(int_nvvm_sust_b_3d_i8_trap
	Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,			Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int16Regs:$r),			Int16Regs:$r),
	(SUST_B_3D_B8_TRAP Int64Regs:$s,			(SUST_B_3D_B8_TRAP_R Int64Regs:$s,
	Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,			Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int16Regs:$r)>;			Int16Regs:$r)>;

	def : Pat<(int_nvvm_sust_b_3d_i16_trap			def : Pat<(int_nvvm_sust_b_3d_i16_trap
	Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,			Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int16Regs:$r),			Int16Regs:$r),
	(SUST_B_3D_B16_TRAP Int64Regs:$s,			(SUST_B_3D_B16_TRAP_R Int64Regs:$s,
	Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,			Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int16Regs:$r)>;			Int16Regs:$r)>;

	def : Pat<(int_nvvm_sust_b_3d_i32_trap			def : Pat<(int_nvvm_sust_b_3d_i32_trap
	Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,			Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int32Regs:$r),			Int32Regs:$r),
	(SUST_B_3D_B32_TRAP Int64Regs:$s,			(SUST_B_3D_B32_TRAP_R Int64Regs:$s,
	Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,			Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int32Regs:$r)>;			Int32Regs:$r)>;

	def : Pat<(int_nvvm_sust_b_3d_i64_trap			def : Pat<(int_nvvm_sust_b_3d_i64_trap
	Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,			Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int64Regs:$r),			Int64Regs:$r),
	(SUST_B_3D_B64_TRAP Int64Regs:$s,			(SUST_B_3D_B64_TRAP_R Int64Regs:$s,
	Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,			Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int64Regs:$r)>;			Int64Regs:$r)>;

	def : Pat<(int_nvvm_sust_b_3d_v2i8_trap			def : Pat<(int_nvvm_sust_b_3d_v2i8_trap
	Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,			Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int16Regs:$r, Int16Regs:$g),			Int16Regs:$r, Int16Regs:$g),
	(SUST_B_3D_V2B8_TRAP Int64Regs:$s,			(SUST_B_3D_V2B8_TRAP_R Int64Regs:$s,
	Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,			Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int16Regs:$r, Int16Regs:$g)>;			Int16Regs:$r, Int16Regs:$g)>;

	def : Pat<(int_nvvm_sust_b_3d_v2i16_trap			def : Pat<(int_nvvm_sust_b_3d_v2i16_trap
	Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,			Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int16Regs:$r, Int16Regs:$g),			Int16Regs:$r, Int16Regs:$g),
	(SUST_B_3D_V2B16_TRAP Int64Regs:$s,			(SUST_B_3D_V2B16_TRAP_R Int64Regs:$s,
	Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,			Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int16Regs:$r, Int16Regs:$g)>;			Int16Regs:$r, Int16Regs:$g)>;

	def : Pat<(int_nvvm_sust_b_3d_v2i32_trap			def : Pat<(int_nvvm_sust_b_3d_v2i32_trap
	Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,			Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int32Regs:$r, Int32Regs:$g),			Int32Regs:$r, Int32Regs:$g),
	(SUST_B_3D_V2B32_TRAP Int64Regs:$s,			(SUST_B_3D_V2B32_TRAP_R Int64Regs:$s,
	Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,			Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int32Regs:$r, Int32Regs:$g)>;			Int32Regs:$r, Int32Regs:$g)>;

	def : Pat<(int_nvvm_sust_b_3d_v2i64_trap			def : Pat<(int_nvvm_sust_b_3d_v2i64_trap
	Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,			Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int64Regs:$r, Int64Regs:$g),			Int64Regs:$r, Int64Regs:$g),
	(SUST_B_3D_V2B64_TRAP Int64Regs:$s,			(SUST_B_3D_V2B64_TRAP_R Int64Regs:$s,
	Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,			Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int64Regs:$r, Int64Regs:$g)>;			Int64Regs:$r, Int64Regs:$g)>;

	def : Pat<(int_nvvm_sust_b_3d_v4i8_trap			def : Pat<(int_nvvm_sust_b_3d_v4i8_trap
	Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,			Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),			Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),
	(SUST_B_3D_V4B8_TRAP Int64Regs:$s,			(SUST_B_3D_V4B8_TRAP_R Int64Regs:$s,
	Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,			Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a)>;			Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a)>;

	def : Pat<(int_nvvm_sust_b_3d_v4i16_trap			def : Pat<(int_nvvm_sust_b_3d_v4i16_trap
	Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,			Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),			Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),
	(SUST_B_3D_V4B16_TRAP Int64Regs:$s,			(SUST_B_3D_V4B16_TRAP_R Int64Regs:$s,
	Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,			Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a)>;			Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a)>;

	def : Pat<(int_nvvm_sust_b_3d_v4i32_trap			def : Pat<(int_nvvm_sust_b_3d_v4i32_trap
	Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,			Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int32Regs:$r, Int32Regs:$g, Int32Regs:$b, Int32Regs:$a),			Int32Regs:$r, Int32Regs:$g, Int32Regs:$b, Int32Regs:$a),
	(SUST_B_3D_V4B32_TRAP Int64Regs:$s,			(SUST_B_3D_V4B32_TRAP_R Int64Regs:$s,
	Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,			Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int32Regs:$r, Int32Regs:$g, Int32Regs:$b, Int32Regs:$a)>;			Int32Regs:$r, Int32Regs:$g, Int32Regs:$b, Int32Regs:$a)>;


	// .zero variant			// .zero variant
	def : Pat<(int_nvvm_sust_b_1d_i8_zero			def : Pat<(int_nvvm_sust_b_1d_i8_zero
	Int64Regs:$s, Int32Regs:$x, Int16Regs:$r),			Int64Regs:$s, Int32Regs:$x, Int16Regs:$r),
	(SUST_B_1D_B8_ZERO Int64Regs:$s, Int32Regs:$x, Int16Regs:$r)>;			(SUST_B_1D_B8_ZERO_R Int64Regs:$s, Int32Regs:$x, Int16Regs:$r)>;

	def : Pat<(int_nvvm_sust_b_1d_i16_zero			def : Pat<(int_nvvm_sust_b_1d_i16_zero
	Int64Regs:$s, Int32Regs:$x, Int16Regs:$r),			Int64Regs:$s, Int32Regs:$x, Int16Regs:$r),
	(SUST_B_1D_B16_ZERO Int64Regs:$s, Int32Regs:$x, Int16Regs:$r)>;			(SUST_B_1D_B16_ZERO_R Int64Regs:$s, Int32Regs:$x, Int16Regs:$r)>;

	def : Pat<(int_nvvm_sust_b_1d_i32_zero			def : Pat<(int_nvvm_sust_b_1d_i32_zero
	Int64Regs:$s, Int32Regs:$x, Int32Regs:$r),			Int64Regs:$s, Int32Regs:$x, Int32Regs:$r),
	(SUST_B_1D_B32_ZERO Int64Regs:$s, Int32Regs:$x, Int32Regs:$r)>;			(SUST_B_1D_B32_ZERO_R Int64Regs:$s, Int32Regs:$x, Int32Regs:$r)>;

	def : Pat<(int_nvvm_sust_b_1d_i64_zero			def : Pat<(int_nvvm_sust_b_1d_i64_zero
	Int64Regs:$s, Int32Regs:$x, Int64Regs:$r),			Int64Regs:$s, Int32Regs:$x, Int64Regs:$r),
	(SUST_B_1D_B64_ZERO Int64Regs:$s, Int32Regs:$x, Int64Regs:$r)>;			(SUST_B_1D_B64_ZERO_R Int64Regs:$s, Int32Regs:$x, Int64Regs:$r)>;

	def : Pat<(int_nvvm_sust_b_1d_v2i8_zero			def : Pat<(int_nvvm_sust_b_1d_v2i8_zero
	Int64Regs:$s, Int32Regs:$x, Int16Regs:$r, Int16Regs:$g),			Int64Regs:$s, Int32Regs:$x, Int16Regs:$r, Int16Regs:$g),
	(SUST_B_1D_V2B8_ZERO Int64Regs:$s, Int32Regs:$x,			(SUST_B_1D_V2B8_ZERO_R Int64Regs:$s, Int32Regs:$x,
	Int16Regs:$r, Int16Regs:$g)>;			Int16Regs:$r, Int16Regs:$g)>;

	def : Pat<(int_nvvm_sust_b_1d_v2i16_zero			def : Pat<(int_nvvm_sust_b_1d_v2i16_zero
	Int64Regs:$s, Int32Regs:$x, Int16Regs:$r, Int16Regs:$g),			Int64Regs:$s, Int32Regs:$x, Int16Regs:$r, Int16Regs:$g),
	(SUST_B_1D_V2B16_ZERO Int64Regs:$s, Int32Regs:$x,			(SUST_B_1D_V2B16_ZERO_R Int64Regs:$s, Int32Regs:$x,
	Int16Regs:$r, Int16Regs:$g)>;			Int16Regs:$r, Int16Regs:$g)>;

	def : Pat<(int_nvvm_sust_b_1d_v2i32_zero			def : Pat<(int_nvvm_sust_b_1d_v2i32_zero
	Int64Regs:$s, Int32Regs:$x, Int32Regs:$r, Int32Regs:$g),			Int64Regs:$s, Int32Regs:$x, Int32Regs:$r, Int32Regs:$g),
	(SUST_B_1D_V2B32_ZERO Int64Regs:$s, Int32Regs:$x,			(SUST_B_1D_V2B32_ZERO_R Int64Regs:$s, Int32Regs:$x,
	Int32Regs:$r, Int32Regs:$g)>;			Int32Regs:$r, Int32Regs:$g)>;

	def : Pat<(int_nvvm_sust_b_1d_v2i64_zero			def : Pat<(int_nvvm_sust_b_1d_v2i64_zero
	Int64Regs:$s, Int32Regs:$x, Int64Regs:$r, Int64Regs:$g),			Int64Regs:$s, Int32Regs:$x, Int64Regs:$r, Int64Regs:$g),
	(SUST_B_1D_V2B64_ZERO Int64Regs:$s, Int32Regs:$x,			(SUST_B_1D_V2B64_ZERO_R Int64Regs:$s, Int32Regs:$x,
	Int64Regs:$r, Int64Regs:$g)>;			Int64Regs:$r, Int64Regs:$g)>;

	def : Pat<(int_nvvm_sust_b_1d_v4i8_zero			def : Pat<(int_nvvm_sust_b_1d_v4i8_zero
	Int64Regs:$s, Int32Regs:$x,			Int64Regs:$s, Int32Regs:$x,
	Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),			Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),
	(SUST_B_1D_V4B8_ZERO Int64Regs:$s, Int32Regs:$x,			(SUST_B_1D_V4B8_ZERO_R Int64Regs:$s, Int32Regs:$x,
	Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a)>;			Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a)>;

	def : Pat<(int_nvvm_sust_b_1d_v4i16_zero			def : Pat<(int_nvvm_sust_b_1d_v4i16_zero
	Int64Regs:$s, Int32Regs:$x,			Int64Regs:$s, Int32Regs:$x,
	Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),			Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),
	(SUST_B_1D_V4B16_ZERO Int64Regs:$s, Int32Regs:$x,			(SUST_B_1D_V4B16_ZERO_R Int64Regs:$s, Int32Regs:$x,
	Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a)>;			Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a)>;

	def : Pat<(int_nvvm_sust_b_1d_v4i32_zero			def : Pat<(int_nvvm_sust_b_1d_v4i32_zero
	Int64Regs:$s, Int32Regs:$x,			Int64Regs:$s, Int32Regs:$x,
	Int32Regs:$r, Int32Regs:$g, Int32Regs:$b, Int32Regs:$a),			Int32Regs:$r, Int32Regs:$g, Int32Regs:$b, Int32Regs:$a),
	(SUST_B_1D_V4B32_ZERO Int64Regs:$s, Int32Regs:$x,			(SUST_B_1D_V4B32_ZERO_R Int64Regs:$s, Int32Regs:$x,
	Int32Regs:$r, Int32Regs:$g, Int32Regs:$b, Int32Regs:$a)>;			Int32Regs:$r, Int32Regs:$g, Int32Regs:$b, Int32Regs:$a)>;



	def : Pat<(int_nvvm_sust_b_1d_array_i8_zero			def : Pat<(int_nvvm_sust_b_1d_array_i8_zero
	Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int16Regs:$r),			Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int16Regs:$r),
	(SUST_B_1D_ARRAY_B8_ZERO Int64Regs:$s, Int32Regs:$l, Int32Regs:$x,			(SUST_B_1D_ARRAY_B8_ZERO_R Int64Regs:$s, Int32Regs:$l, Int32Regs:$x,
	Int16Regs:$r)>;			Int16Regs:$r)>;

	def : Pat<(int_nvvm_sust_b_1d_array_i16_zero			def : Pat<(int_nvvm_sust_b_1d_array_i16_zero
	Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int16Regs:$r),			Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int16Regs:$r),
	(SUST_B_1D_ARRAY_B16_ZERO Int64Regs:$s, Int32Regs:$l, Int32Regs:$x,			(SUST_B_1D_ARRAY_B16_ZERO_R Int64Regs:$s, Int32Regs:$l, Int32Regs:$x,
	Int16Regs:$r)>;			Int16Regs:$r)>;

	def : Pat<(int_nvvm_sust_b_1d_array_i32_zero			def : Pat<(int_nvvm_sust_b_1d_array_i32_zero
	Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$r),			Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$r),
	(SUST_B_1D_ARRAY_B32_ZERO Int64Regs:$s, Int32Regs:$l, Int32Regs:$x,			(SUST_B_1D_ARRAY_B32_ZERO_R Int64Regs:$s, Int32Regs:$l, Int32Regs:$x,
	Int32Regs:$r)>;			Int32Regs:$r)>;

	def : Pat<(int_nvvm_sust_b_1d_array_i64_zero			def : Pat<(int_nvvm_sust_b_1d_array_i64_zero
	Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int64Regs:$r),			Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int64Regs:$r),
	(SUST_B_1D_ARRAY_B64_ZERO Int64Regs:$s, Int32Regs:$l, Int32Regs:$x,			(SUST_B_1D_ARRAY_B64_ZERO_R Int64Regs:$s, Int32Regs:$l, Int32Regs:$x,
	Int64Regs:$r)>;			Int64Regs:$r)>;

	def : Pat<(int_nvvm_sust_b_1d_array_v2i8_zero			def : Pat<(int_nvvm_sust_b_1d_array_v2i8_zero
	Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int16Regs:$r, Int16Regs:$g),			Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int16Regs:$r, Int16Regs:$g),
	(SUST_B_1D_ARRAY_V2B8_ZERO Int64Regs:$s, Int32Regs:$l, Int32Regs:$x,			(SUST_B_1D_ARRAY_V2B8_ZERO_R Int64Regs:$s, Int32Regs:$l, Int32Regs:$x,
	Int16Regs:$r, Int16Regs:$g)>;			Int16Regs:$r, Int16Regs:$g)>;

	def : Pat<(int_nvvm_sust_b_1d_array_v2i16_zero			def : Pat<(int_nvvm_sust_b_1d_array_v2i16_zero
	Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int16Regs:$r, Int16Regs:$g),			Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int16Regs:$r, Int16Regs:$g),
	(SUST_B_1D_ARRAY_V2B16_ZERO Int64Regs:$s, Int32Regs:$l, Int32Regs:$x,			(SUST_B_1D_ARRAY_V2B16_ZERO_R Int64Regs:$s, Int32Regs:$l, Int32Regs:$x,
	Int16Regs:$r, Int16Regs:$g)>;			Int16Regs:$r, Int16Regs:$g)>;

	def : Pat<(int_nvvm_sust_b_1d_array_v2i32_zero			def : Pat<(int_nvvm_sust_b_1d_array_v2i32_zero
	Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$r, Int32Regs:$g),			Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$r, Int32Regs:$g),
	(SUST_B_1D_ARRAY_V2B32_ZERO Int64Regs:$s, Int32Regs:$l, Int32Regs:$x,			(SUST_B_1D_ARRAY_V2B32_ZERO_R Int64Regs:$s, Int32Regs:$l, Int32Regs:$x,
	Int32Regs:$r, Int32Regs:$g)>;			Int32Regs:$r, Int32Regs:$g)>;

	def : Pat<(int_nvvm_sust_b_1d_array_v2i64_zero			def : Pat<(int_nvvm_sust_b_1d_array_v2i64_zero
	Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int64Regs:$r, Int64Regs:$g),			Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int64Regs:$r, Int64Regs:$g),
	(SUST_B_1D_ARRAY_V2B64_ZERO Int64Regs:$s, Int32Regs:$l, Int32Regs:$x,			(SUST_B_1D_ARRAY_V2B64_ZERO_R Int64Regs:$s, Int32Regs:$l, Int32Regs:$x,
	Int64Regs:$r, Int64Regs:$g)>;			Int64Regs:$r, Int64Regs:$g)>;

	def : Pat<(int_nvvm_sust_b_1d_array_v4i8_zero			def : Pat<(int_nvvm_sust_b_1d_array_v4i8_zero
	Int64Regs:$s, Int32Regs:$l, Int32Regs:$x,			Int64Regs:$s, Int32Regs:$l, Int32Regs:$x,
	Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),			Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),
	(SUST_B_1D_ARRAY_V4B8_ZERO Int64Regs:$s, Int32Regs:$l, Int32Regs:$x,			(SUST_B_1D_ARRAY_V4B8_ZERO_R Int64Regs:$s, Int32Regs:$l, Int32Regs:$x,
	Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a)>;			Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a)>;

	def : Pat<(int_nvvm_sust_b_1d_array_v4i16_zero			def : Pat<(int_nvvm_sust_b_1d_array_v4i16_zero
	Int64Regs:$s, Int32Regs:$l, Int32Regs:$x,			Int64Regs:$s, Int32Regs:$l, Int32Regs:$x,
	Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),			Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),
	(SUST_B_1D_ARRAY_V4B16_ZERO Int64Regs:$s, Int32Regs:$l, Int32Regs:$x,			(SUST_B_1D_ARRAY_V4B16_ZERO_R Int64Regs:$s, Int32Regs:$l, Int32Regs:$x,
	Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a)>;			Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a)>;

	def : Pat<(int_nvvm_sust_b_1d_array_v4i32_zero			def : Pat<(int_nvvm_sust_b_1d_array_v4i32_zero
	Int64Regs:$s, Int32Regs:$l, Int32Regs:$x,			Int64Regs:$s, Int32Regs:$l, Int32Regs:$x,
	Int32Regs:$r, Int32Regs:$g, Int32Regs:$b, Int32Regs:$a),			Int32Regs:$r, Int32Regs:$g, Int32Regs:$b, Int32Regs:$a),
	(SUST_B_1D_ARRAY_V4B32_ZERO Int64Regs:$s, Int32Regs:$l, Int32Regs:$x,			(SUST_B_1D_ARRAY_V4B32_ZERO_R Int64Regs:$s, Int32Regs:$l, Int32Regs:$x,
	Int32Regs:$r, Int32Regs:$g, Int32Regs:$b, Int32Regs:$a)>;			Int32Regs:$r, Int32Regs:$g, Int32Regs:$b, Int32Regs:$a)>;



	def : Pat<(int_nvvm_sust_b_2d_i8_zero			def : Pat<(int_nvvm_sust_b_2d_i8_zero
	Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int16Regs:$r),			Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int16Regs:$r),
	(SUST_B_2D_B8_ZERO Int64Regs:$s, Int32Regs:$x, Int32Regs:$y,			(SUST_B_2D_B8_ZERO_R Int64Regs:$s, Int32Regs:$x, Int32Regs:$y,
	Int16Regs:$r)>;			Int16Regs:$r)>;

	def : Pat<(int_nvvm_sust_b_2d_i16_zero			def : Pat<(int_nvvm_sust_b_2d_i16_zero
	Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int16Regs:$r),			Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int16Regs:$r),
	(SUST_B_2D_B16_ZERO Int64Regs:$s, Int32Regs:$x, Int32Regs:$y,			(SUST_B_2D_B16_ZERO_R Int64Regs:$s, Int32Regs:$x, Int32Regs:$y,
	Int16Regs:$r)>;			Int16Regs:$r)>;

	def : Pat<(int_nvvm_sust_b_2d_i32_zero			def : Pat<(int_nvvm_sust_b_2d_i32_zero
	Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$r),			Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$r),
	(SUST_B_2D_B32_ZERO Int64Regs:$s, Int32Regs:$x, Int32Regs:$y,			(SUST_B_2D_B32_ZERO_R Int64Regs:$s, Int32Regs:$x, Int32Regs:$y,
	Int32Regs:$r)>;			Int32Regs:$r)>;

	def : Pat<(int_nvvm_sust_b_2d_i64_zero			def : Pat<(int_nvvm_sust_b_2d_i64_zero
	Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int64Regs:$r),			Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int64Regs:$r),
	(SUST_B_2D_B64_ZERO Int64Regs:$s, Int32Regs:$x, Int32Regs:$y,			(SUST_B_2D_B64_ZERO_R Int64Regs:$s, Int32Regs:$x, Int32Regs:$y,
	Int64Regs:$r)>;			Int64Regs:$r)>;

	def : Pat<(int_nvvm_sust_b_2d_v2i8_zero			def : Pat<(int_nvvm_sust_b_2d_v2i8_zero
	Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int16Regs:$r, Int16Regs:$g),			Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int16Regs:$r, Int16Regs:$g),
	(SUST_B_2D_V2B8_ZERO Int64Regs:$s, Int32Regs:$x, Int32Regs:$y,			(SUST_B_2D_V2B8_ZERO_R Int64Regs:$s, Int32Regs:$x, Int32Regs:$y,
	Int16Regs:$r, Int16Regs:$g)>;			Int16Regs:$r, Int16Regs:$g)>;

	def : Pat<(int_nvvm_sust_b_2d_v2i16_zero			def : Pat<(int_nvvm_sust_b_2d_v2i16_zero
	Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int16Regs:$r, Int16Regs:$g),			Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int16Regs:$r, Int16Regs:$g),
	(SUST_B_2D_V2B16_ZERO Int64Regs:$s, Int32Regs:$x, Int32Regs:$y,			(SUST_B_2D_V2B16_ZERO_R Int64Regs:$s, Int32Regs:$x, Int32Regs:$y,
	Int16Regs:$r, Int16Regs:$g)>;			Int16Regs:$r, Int16Regs:$g)>;

	def : Pat<(int_nvvm_sust_b_2d_v2i32_zero			def : Pat<(int_nvvm_sust_b_2d_v2i32_zero
	Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$r, Int32Regs:$g),			Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$r, Int32Regs:$g),
	(SUST_B_2D_V2B32_ZERO Int64Regs:$s, Int32Regs:$x, Int32Regs:$y,			(SUST_B_2D_V2B32_ZERO_R Int64Regs:$s, Int32Regs:$x, Int32Regs:$y,
	Int32Regs:$r, Int32Regs:$g)>;			Int32Regs:$r, Int32Regs:$g)>;

	def : Pat<(int_nvvm_sust_b_2d_v2i64_zero			def : Pat<(int_nvvm_sust_b_2d_v2i64_zero
	Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int64Regs:$r, Int64Regs:$g),			Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int64Regs:$r, Int64Regs:$g),
	(SUST_B_2D_V2B64_ZERO Int64Regs:$s, Int32Regs:$x, Int32Regs:$y,			(SUST_B_2D_V2B64_ZERO_R Int64Regs:$s, Int32Regs:$x, Int32Regs:$y,
	Int64Regs:$r, Int64Regs:$g)>;			Int64Regs:$r, Int64Regs:$g)>;

	def : Pat<(int_nvvm_sust_b_2d_v4i8_zero			def : Pat<(int_nvvm_sust_b_2d_v4i8_zero
	Int64Regs:$s, Int32Regs:$x, Int32Regs:$y,			Int64Regs:$s, Int32Regs:$x, Int32Regs:$y,
	Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),			Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),
	(SUST_B_2D_V4B8_ZERO Int64Regs:$s, Int32Regs:$x, Int32Regs:$y,			(SUST_B_2D_V4B8_ZERO_R Int64Regs:$s, Int32Regs:$x, Int32Regs:$y,
	Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a)>;			Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a)>;

	def : Pat<(int_nvvm_sust_b_2d_v4i16_zero			def : Pat<(int_nvvm_sust_b_2d_v4i16_zero
	Int64Regs:$s, Int32Regs:$x, Int32Regs:$y,			Int64Regs:$s, Int32Regs:$x, Int32Regs:$y,
	Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),			Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),
	(SUST_B_2D_V4B16_ZERO Int64Regs:$s, Int32Regs:$x, Int32Regs:$y,			(SUST_B_2D_V4B16_ZERO_R Int64Regs:$s, Int32Regs:$x, Int32Regs:$y,
	Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a)>;			Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a)>;

	def : Pat<(int_nvvm_sust_b_2d_v4i32_zero			def : Pat<(int_nvvm_sust_b_2d_v4i32_zero
	Int64Regs:$s, Int32Regs:$x, Int32Regs:$y,			Int64Regs:$s, Int32Regs:$x, Int32Regs:$y,
	Int32Regs:$r, Int32Regs:$g, Int32Regs:$b, Int32Regs:$a),			Int32Regs:$r, Int32Regs:$g, Int32Regs:$b, Int32Regs:$a),
	(SUST_B_2D_V4B32_ZERO Int64Regs:$s, Int32Regs:$x, Int32Regs:$y,			(SUST_B_2D_V4B32_ZERO_R Int64Regs:$s, Int32Regs:$x, Int32Regs:$y,
	Int32Regs:$r, Int32Regs:$g, Int32Regs:$b, Int32Regs:$a)>;			Int32Regs:$r, Int32Regs:$g, Int32Regs:$b, Int32Regs:$a)>;



	def : Pat<(int_nvvm_sust_b_2d_array_i8_zero			def : Pat<(int_nvvm_sust_b_2d_array_i8_zero
	Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y, Int16Regs:$r),			Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y, Int16Regs:$r),
	(SUST_B_2D_ARRAY_B8_ZERO Int64Regs:$s,			(SUST_B_2D_ARRAY_B8_ZERO_R Int64Regs:$s,
	Int32Regs:$l, Int32Regs:$x, Int32Regs:$y,			Int32Regs:$l, Int32Regs:$x, Int32Regs:$y,
	Int16Regs:$r)>;			Int16Regs:$r)>;

	def : Pat<(int_nvvm_sust_b_2d_array_i16_zero			def : Pat<(int_nvvm_sust_b_2d_array_i16_zero
	Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y, Int16Regs:$r),			Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y, Int16Regs:$r),
	(SUST_B_2D_ARRAY_B16_ZERO Int64Regs:$s,			(SUST_B_2D_ARRAY_B16_ZERO_R Int64Regs:$s,
	Int32Regs:$l, Int32Regs:$x, Int32Regs:$y,			Int32Regs:$l, Int32Regs:$x, Int32Regs:$y,
	Int16Regs:$r)>;			Int16Regs:$r)>;

	def : Pat<(int_nvvm_sust_b_2d_array_i32_zero			def : Pat<(int_nvvm_sust_b_2d_array_i32_zero
	Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y, Int32Regs:$r),			Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y, Int32Regs:$r),
	(SUST_B_2D_ARRAY_B32_ZERO Int64Regs:$s,			(SUST_B_2D_ARRAY_B32_ZERO_R Int64Regs:$s,
	Int32Regs:$l, Int32Regs:$x, Int32Regs:$y,			Int32Regs:$l, Int32Regs:$x, Int32Regs:$y,
	Int32Regs:$r)>;			Int32Regs:$r)>;

	def : Pat<(int_nvvm_sust_b_2d_array_i64_zero			def : Pat<(int_nvvm_sust_b_2d_array_i64_zero
	Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y, Int64Regs:$r),			Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y, Int64Regs:$r),
	(SUST_B_2D_ARRAY_B64_ZERO Int64Regs:$s,			(SUST_B_2D_ARRAY_B64_ZERO_R Int64Regs:$s,
	Int32Regs:$l, Int32Regs:$x, Int32Regs:$y,			Int32Regs:$l, Int32Regs:$x, Int32Regs:$y,
	Int64Regs:$r)>;			Int64Regs:$r)>;

	def : Pat<(int_nvvm_sust_b_2d_array_v2i8_zero			def : Pat<(int_nvvm_sust_b_2d_array_v2i8_zero
	Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y,			Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y,
	Int16Regs:$r, Int16Regs:$g),			Int16Regs:$r, Int16Regs:$g),
	(SUST_B_2D_ARRAY_V2B8_ZERO Int64Regs:$s, Int32Regs:$l,			(SUST_B_2D_ARRAY_V2B8_ZERO_R Int64Regs:$s, Int32Regs:$l,
	Int32Regs:$x, Int32Regs:$y,			Int32Regs:$x, Int32Regs:$y,
	Int16Regs:$r, Int16Regs:$g)>;			Int16Regs:$r, Int16Regs:$g)>;

	def : Pat<(int_nvvm_sust_b_2d_array_v2i16_zero			def : Pat<(int_nvvm_sust_b_2d_array_v2i16_zero
	Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y,			Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y,
	Int16Regs:$r, Int16Regs:$g),			Int16Regs:$r, Int16Regs:$g),
	(SUST_B_2D_ARRAY_V2B16_ZERO Int64Regs:$s, Int32Regs:$l,			(SUST_B_2D_ARRAY_V2B16_ZERO_R Int64Regs:$s, Int32Regs:$l,
	Int32Regs:$x, Int32Regs:$y,			Int32Regs:$x, Int32Regs:$y,
	Int16Regs:$r, Int16Regs:$g)>;			Int16Regs:$r, Int16Regs:$g)>;

	def : Pat<(int_nvvm_sust_b_2d_array_v2i32_zero			def : Pat<(int_nvvm_sust_b_2d_array_v2i32_zero
	Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y, Int32Regs:$r,			Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y, Int32Regs:$r,
	Int32Regs:$g),			Int32Regs:$g),
	(SUST_B_2D_ARRAY_V2B32_ZERO Int64Regs:$s, Int32Regs:$l,			(SUST_B_2D_ARRAY_V2B32_ZERO_R Int64Regs:$s, Int32Regs:$l,
	Int32Regs:$x, Int32Regs:$y, Int32Regs:$r, Int32Regs:$g)>;			Int32Regs:$x, Int32Regs:$y, Int32Regs:$r, Int32Regs:$g)>;

	def : Pat<(int_nvvm_sust_b_2d_array_v2i64_zero			def : Pat<(int_nvvm_sust_b_2d_array_v2i64_zero
	Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y, Int64Regs:$r,			Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y, Int64Regs:$r,
	Int64Regs:$g),			Int64Regs:$g),
	(SUST_B_2D_ARRAY_V2B64_ZERO Int64Regs:$s, Int32Regs:$l,			(SUST_B_2D_ARRAY_V2B64_ZERO_R Int64Regs:$s, Int32Regs:$l,
	Int32Regs:$x, Int32Regs:$y, Int64Regs:$r, Int64Regs:$g)>;			Int32Regs:$x, Int32Regs:$y, Int64Regs:$r, Int64Regs:$g)>;

	def : Pat<(int_nvvm_sust_b_2d_array_v4i8_zero			def : Pat<(int_nvvm_sust_b_2d_array_v4i8_zero
	Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y,			Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y,
	Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),			Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),
	(SUST_B_2D_ARRAY_V4B8_ZERO Int64Regs:$s,			(SUST_B_2D_ARRAY_V4B8_ZERO_R Int64Regs:$s,
	Int32Regs:$l, Int32Regs:$x, Int32Regs:$y,			Int32Regs:$l, Int32Regs:$x, Int32Regs:$y,
	Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a)>;			Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a)>;

	def : Pat<(int_nvvm_sust_b_2d_array_v4i16_zero			def : Pat<(int_nvvm_sust_b_2d_array_v4i16_zero
	Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y,			Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y,
	Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),			Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),
	(SUST_B_2D_ARRAY_V4B16_ZERO Int64Regs:$s,			(SUST_B_2D_ARRAY_V4B16_ZERO_R Int64Regs:$s,
	Int32Regs:$l, Int32Regs:$x, Int32Regs:$y,			Int32Regs:$l, Int32Regs:$x, Int32Regs:$y,
	Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a)>;			Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a)>;

	def : Pat<(int_nvvm_sust_b_2d_array_v4i32_zero			def : Pat<(int_nvvm_sust_b_2d_array_v4i32_zero
	Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y,			Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y,
	Int32Regs:$r, Int32Regs:$g, Int32Regs:$b, Int32Regs:$a),			Int32Regs:$r, Int32Regs:$g, Int32Regs:$b, Int32Regs:$a),
	(SUST_B_2D_ARRAY_V4B32_ZERO Int64Regs:$s, Int32Regs:$l,			(SUST_B_2D_ARRAY_V4B32_ZERO_R Int64Regs:$s, Int32Regs:$l,
	Int32Regs:$x, Int32Regs:$y,			Int32Regs:$x, Int32Regs:$y,
	Int32Regs:$r, Int32Regs:$g, Int32Regs:$b, Int32Regs:$a)>;			Int32Regs:$r, Int32Regs:$g, Int32Regs:$b, Int32Regs:$a)>;



	def : Pat<(int_nvvm_sust_b_3d_i8_zero			def : Pat<(int_nvvm_sust_b_3d_i8_zero
	Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,			Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int16Regs:$r),			Int16Regs:$r),
	(SUST_B_3D_B8_ZERO Int64Regs:$s,			(SUST_B_3D_B8_ZERO_R Int64Regs:$s,
	Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,			Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int16Regs:$r)>;			Int16Regs:$r)>;

	def : Pat<(int_nvvm_sust_b_3d_i16_zero			def : Pat<(int_nvvm_sust_b_3d_i16_zero
	Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,			Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int16Regs:$r),			Int16Regs:$r),
	(SUST_B_3D_B16_ZERO Int64Regs:$s,			(SUST_B_3D_B16_ZERO_R Int64Regs:$s,
	Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,			Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int16Regs:$r)>;			Int16Regs:$r)>;

	def : Pat<(int_nvvm_sust_b_3d_i32_zero			def : Pat<(int_nvvm_sust_b_3d_i32_zero
	Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,			Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int32Regs:$r),			Int32Regs:$r),
	(SUST_B_3D_B32_ZERO Int64Regs:$s,			(SUST_B_3D_B32_ZERO_R Int64Regs:$s,
	Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,			Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int32Regs:$r)>;			Int32Regs:$r)>;

	def : Pat<(int_nvvm_sust_b_3d_i64_zero			def : Pat<(int_nvvm_sust_b_3d_i64_zero
	Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,			Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int64Regs:$r),			Int64Regs:$r),
	(SUST_B_3D_B64_ZERO Int64Regs:$s,			(SUST_B_3D_B64_ZERO_R Int64Regs:$s,
	Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,			Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int64Regs:$r)>;			Int64Regs:$r)>;

	def : Pat<(int_nvvm_sust_b_3d_v2i8_zero			def : Pat<(int_nvvm_sust_b_3d_v2i8_zero
	Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,			Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int16Regs:$r, Int16Regs:$g),			Int16Regs:$r, Int16Regs:$g),
	(SUST_B_3D_V2B8_ZERO Int64Regs:$s,			(SUST_B_3D_V2B8_ZERO_R Int64Regs:$s,
	Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,			Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int16Regs:$r, Int16Regs:$g)>;			Int16Regs:$r, Int16Regs:$g)>;

	def : Pat<(int_nvvm_sust_b_3d_v2i16_zero			def : Pat<(int_nvvm_sust_b_3d_v2i16_zero
	Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,			Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int16Regs:$r, Int16Regs:$g),			Int16Regs:$r, Int16Regs:$g),
	(SUST_B_3D_V2B16_ZERO Int64Regs:$s,			(SUST_B_3D_V2B16_ZERO_R Int64Regs:$s,
	Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,			Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int16Regs:$r, Int16Regs:$g)>;			Int16Regs:$r, Int16Regs:$g)>;

	def : Pat<(int_nvvm_sust_b_3d_v2i32_zero			def : Pat<(int_nvvm_sust_b_3d_v2i32_zero
	Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,			Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int32Regs:$r, Int32Regs:$g),			Int32Regs:$r, Int32Regs:$g),
	(SUST_B_3D_V2B32_ZERO Int64Regs:$s,			(SUST_B_3D_V2B32_ZERO_R Int64Regs:$s,
	Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,			Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int32Regs:$r, Int32Regs:$g)>;			Int32Regs:$r, Int32Regs:$g)>;

	def : Pat<(int_nvvm_sust_b_3d_v2i64_zero			def : Pat<(int_nvvm_sust_b_3d_v2i64_zero
	Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,			Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int64Regs:$r, Int64Regs:$g),			Int64Regs:$r, Int64Regs:$g),
	(SUST_B_3D_V2B64_ZERO Int64Regs:$s,			(SUST_B_3D_V2B64_ZERO_R Int64Regs:$s,
	Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,			Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int64Regs:$r, Int64Regs:$g)>;			Int64Regs:$r, Int64Regs:$g)>;

	def : Pat<(int_nvvm_sust_b_3d_v4i8_zero			def : Pat<(int_nvvm_sust_b_3d_v4i8_zero
	Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,			Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),			Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),
	(SUST_B_3D_V4B8_ZERO Int64Regs:$s,			(SUST_B_3D_V4B8_ZERO_R Int64Regs:$s,
	Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,			Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a)>;			Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a)>;

	def : Pat<(int_nvvm_sust_b_3d_v4i16_zero			def : Pat<(int_nvvm_sust_b_3d_v4i16_zero
	Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,			Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),			Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),
	(SUST_B_3D_V4B16_ZERO Int64Regs:$s,			(SUST_B_3D_V4B16_ZERO_R Int64Regs:$s,
	Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,			Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a)>;			Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a)>;

	def : Pat<(int_nvvm_sust_b_3d_v4i32_zero			def : Pat<(int_nvvm_sust_b_3d_v4i32_zero
	Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,			Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int32Regs:$r, Int32Regs:$g, Int32Regs:$b, Int32Regs:$a),			Int32Regs:$r, Int32Regs:$g, Int32Regs:$b, Int32Regs:$a),
	(SUST_B_3D_V4B32_ZERO Int64Regs:$s,			(SUST_B_3D_V4B32_ZERO_R Int64Regs:$s,
	Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,			Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int32Regs:$r, Int32Regs:$g, Int32Regs:$b, Int32Regs:$a)>;			Int32Regs:$r, Int32Regs:$g, Int32Regs:$b, Int32Regs:$a)>;




	def : Pat<(int_nvvm_sust_p_1d_i8_trap			def : Pat<(int_nvvm_sust_p_1d_i8_trap
	Int64Regs:$s, Int32Regs:$x, Int16Regs:$r),			Int64Regs:$s, Int32Regs:$x, Int16Regs:$r),
	(SUST_P_1D_B8_TRAP Int64Regs:$s, Int32Regs:$x, Int16Regs:$r)>;			(SUST_P_1D_B8_TRAP_R Int64Regs:$s, Int32Regs:$x, Int16Regs:$r)>;

	def : Pat<(int_nvvm_sust_p_1d_i16_trap			def : Pat<(int_nvvm_sust_p_1d_i16_trap
	Int64Regs:$s, Int32Regs:$x, Int16Regs:$r),			Int64Regs:$s, Int32Regs:$x, Int16Regs:$r),
	(SUST_P_1D_B16_TRAP Int64Regs:$s, Int32Regs:$x, Int16Regs:$r)>;			(SUST_P_1D_B16_TRAP_R Int64Regs:$s, Int32Regs:$x, Int16Regs:$r)>;

	def : Pat<(int_nvvm_sust_p_1d_i32_trap			def : Pat<(int_nvvm_sust_p_1d_i32_trap
	Int64Regs:$s, Int32Regs:$x, Int32Regs:$r),			Int64Regs:$s, Int32Regs:$x, Int32Regs:$r),
	(SUST_P_1D_B32_TRAP Int64Regs:$s, Int32Regs:$x, Int32Regs:$r)>;			(SUST_P_1D_B32_TRAP_R Int64Regs:$s, Int32Regs:$x, Int32Regs:$r)>;

	def : Pat<(int_nvvm_sust_p_1d_v2i8_trap			def : Pat<(int_nvvm_sust_p_1d_v2i8_trap
	Int64Regs:$s, Int32Regs:$x, Int16Regs:$r, Int16Regs:$g),			Int64Regs:$s, Int32Regs:$x, Int16Regs:$r, Int16Regs:$g),
	(SUST_P_1D_V2B8_TRAP Int64Regs:$s, Int32Regs:$x,			(SUST_P_1D_V2B8_TRAP_R Int64Regs:$s, Int32Regs:$x,
	Int16Regs:$r, Int16Regs:$g)>;			Int16Regs:$r, Int16Regs:$g)>;

	def : Pat<(int_nvvm_sust_p_1d_v2i16_trap			def : Pat<(int_nvvm_sust_p_1d_v2i16_trap
	Int64Regs:$s, Int32Regs:$x, Int16Regs:$r, Int16Regs:$g),			Int64Regs:$s, Int32Regs:$x, Int16Regs:$r, Int16Regs:$g),
	(SUST_P_1D_V2B16_TRAP Int64Regs:$s, Int32Regs:$x,			(SUST_P_1D_V2B16_TRAP_R Int64Regs:$s, Int32Regs:$x,
	Int16Regs:$r, Int16Regs:$g)>;			Int16Regs:$r, Int16Regs:$g)>;

	def : Pat<(int_nvvm_sust_p_1d_v2i32_trap			def : Pat<(int_nvvm_sust_p_1d_v2i32_trap
	Int64Regs:$s, Int32Regs:$x, Int32Regs:$r, Int32Regs:$g),			Int64Regs:$s, Int32Regs:$x, Int32Regs:$r, Int32Regs:$g),
	(SUST_P_1D_V2B32_TRAP Int64Regs:$s, Int32Regs:$x,			(SUST_P_1D_V2B32_TRAP_R Int64Regs:$s, Int32Regs:$x,
	Int32Regs:$r, Int32Regs:$g)>;			Int32Regs:$r, Int32Regs:$g)>;

	def : Pat<(int_nvvm_sust_p_1d_v4i8_trap			def : Pat<(int_nvvm_sust_p_1d_v4i8_trap
	Int64Regs:$s, Int32Regs:$x,			Int64Regs:$s, Int32Regs:$x,
	Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),			Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),
	(SUST_P_1D_V4B8_TRAP Int64Regs:$s, Int32Regs:$x,			(SUST_P_1D_V4B8_TRAP_R Int64Regs:$s, Int32Regs:$x,
	Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a)>;			Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a)>;

	def : Pat<(int_nvvm_sust_p_1d_v4i16_trap			def : Pat<(int_nvvm_sust_p_1d_v4i16_trap
	Int64Regs:$s, Int32Regs:$x,			Int64Regs:$s, Int32Regs:$x,
	Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),			Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),
	(SUST_P_1D_V4B16_TRAP Int64Regs:$s, Int32Regs:$x,			(SUST_P_1D_V4B16_TRAP_R Int64Regs:$s, Int32Regs:$x,
	Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a)>;			Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a)>;

	def : Pat<(int_nvvm_sust_p_1d_v4i32_trap			def : Pat<(int_nvvm_sust_p_1d_v4i32_trap
	Int64Regs:$s, Int32Regs:$x,			Int64Regs:$s, Int32Regs:$x,
	Int32Regs:$r, Int32Regs:$g, Int32Regs:$b, Int32Regs:$a),			Int32Regs:$r, Int32Regs:$g, Int32Regs:$b, Int32Regs:$a),
	(SUST_P_1D_V4B32_TRAP Int64Regs:$s, Int32Regs:$x,			(SUST_P_1D_V4B32_TRAP_R Int64Regs:$s, Int32Regs:$x,
	Int32Regs:$r, Int32Regs:$g, Int32Regs:$b, Int32Regs:$a)>;			Int32Regs:$r, Int32Regs:$g, Int32Regs:$b, Int32Regs:$a)>;



	def : Pat<(int_nvvm_sust_p_1d_array_i8_trap			def : Pat<(int_nvvm_sust_p_1d_array_i8_trap
	Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int16Regs:$r),			Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int16Regs:$r),
	(SUST_P_1D_ARRAY_B8_TRAP Int64Regs:$s, Int32Regs:$l, Int32Regs:$x,			(SUST_P_1D_ARRAY_B8_TRAP_R Int64Regs:$s, Int32Regs:$l, Int32Regs:$x,
	Int16Regs:$r)>;			Int16Regs:$r)>;

	def : Pat<(int_nvvm_sust_p_1d_array_i16_trap			def : Pat<(int_nvvm_sust_p_1d_array_i16_trap
	Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int16Regs:$r),			Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int16Regs:$r),
	(SUST_P_1D_ARRAY_B16_TRAP Int64Regs:$s, Int32Regs:$l, Int32Regs:$x,			(SUST_P_1D_ARRAY_B16_TRAP_R Int64Regs:$s, Int32Regs:$l, Int32Regs:$x,
	Int16Regs:$r)>;			Int16Regs:$r)>;

	def : Pat<(int_nvvm_sust_p_1d_array_i32_trap			def : Pat<(int_nvvm_sust_p_1d_array_i32_trap
	Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$r),			Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$r),
	(SUST_P_1D_ARRAY_B32_TRAP Int64Regs:$s, Int32Regs:$l, Int32Regs:$x,			(SUST_P_1D_ARRAY_B32_TRAP_R Int64Regs:$s, Int32Regs:$l, Int32Regs:$x,
	Int32Regs:$r)>;			Int32Regs:$r)>;

	def : Pat<(int_nvvm_sust_p_1d_array_v2i8_trap			def : Pat<(int_nvvm_sust_p_1d_array_v2i8_trap
	Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int16Regs:$r, Int16Regs:$g),			Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int16Regs:$r, Int16Regs:$g),
	(SUST_P_1D_ARRAY_V2B8_TRAP Int64Regs:$s, Int32Regs:$l, Int32Regs:$x,			(SUST_P_1D_ARRAY_V2B8_TRAP_R Int64Regs:$s, Int32Regs:$l, Int32Regs:$x,
	Int16Regs:$r, Int16Regs:$g)>;			Int16Regs:$r, Int16Regs:$g)>;

	def : Pat<(int_nvvm_sust_p_1d_array_v2i16_trap			def : Pat<(int_nvvm_sust_p_1d_array_v2i16_trap
	Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int16Regs:$r, Int16Regs:$g),			Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int16Regs:$r, Int16Regs:$g),
	(SUST_P_1D_ARRAY_V2B16_TRAP Int64Regs:$s, Int32Regs:$l, Int32Regs:$x,			(SUST_P_1D_ARRAY_V2B16_TRAP_R Int64Regs:$s, Int32Regs:$l, Int32Regs:$x,
	Int16Regs:$r, Int16Regs:$g)>;			Int16Regs:$r, Int16Regs:$g)>;

	def : Pat<(int_nvvm_sust_p_1d_array_v2i32_trap			def : Pat<(int_nvvm_sust_p_1d_array_v2i32_trap
	Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$r, Int32Regs:$g),			Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$r, Int32Regs:$g),
	(SUST_P_1D_ARRAY_V2B32_TRAP Int64Regs:$s, Int32Regs:$l, Int32Regs:$x,			(SUST_P_1D_ARRAY_V2B32_TRAP_R Int64Regs:$s, Int32Regs:$l, Int32Regs:$x,
	Int32Regs:$r, Int32Regs:$g)>;			Int32Regs:$r, Int32Regs:$g)>;

	def : Pat<(int_nvvm_sust_p_1d_array_v4i8_trap			def : Pat<(int_nvvm_sust_p_1d_array_v4i8_trap
	Int64Regs:$s, Int32Regs:$l, Int32Regs:$x,			Int64Regs:$s, Int32Regs:$l, Int32Regs:$x,
	Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),			Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),
	(SUST_P_1D_ARRAY_V4B8_TRAP Int64Regs:$s, Int32Regs:$l, Int32Regs:$x,			(SUST_P_1D_ARRAY_V4B8_TRAP_R Int64Regs:$s, Int32Regs:$l, Int32Regs:$x,
	Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a)>;			Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a)>;

	def : Pat<(int_nvvm_sust_p_1d_array_v4i16_trap			def : Pat<(int_nvvm_sust_p_1d_array_v4i16_trap
	Int64Regs:$s, Int32Regs:$l, Int32Regs:$x,			Int64Regs:$s, Int32Regs:$l, Int32Regs:$x,
	Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),			Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),
	(SUST_P_1D_ARRAY_V4B16_TRAP Int64Regs:$s, Int32Regs:$l, Int32Regs:$x,			(SUST_P_1D_ARRAY_V4B16_TRAP_R Int64Regs:$s, Int32Regs:$l, Int32Regs:$x,
	Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a)>;			Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a)>;

	def : Pat<(int_nvvm_sust_p_1d_array_v4i32_trap			def : Pat<(int_nvvm_sust_p_1d_array_v4i32_trap
	Int64Regs:$s, Int32Regs:$l, Int32Regs:$x,			Int64Regs:$s, Int32Regs:$l, Int32Regs:$x,
	Int32Regs:$r, Int32Regs:$g, Int32Regs:$b, Int32Regs:$a),			Int32Regs:$r, Int32Regs:$g, Int32Regs:$b, Int32Regs:$a),
	(SUST_P_1D_ARRAY_V4B32_TRAP Int64Regs:$s, Int32Regs:$l, Int32Regs:$x,			(SUST_P_1D_ARRAY_V4B32_TRAP_R Int64Regs:$s, Int32Regs:$l, Int32Regs:$x,
	Int32Regs:$r, Int32Regs:$g, Int32Regs:$b, Int32Regs:$a)>;			Int32Regs:$r, Int32Regs:$g, Int32Regs:$b, Int32Regs:$a)>;



	def : Pat<(int_nvvm_sust_p_2d_i8_trap			def : Pat<(int_nvvm_sust_p_2d_i8_trap
	Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int16Regs:$r),			Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int16Regs:$r),
	(SUST_P_2D_B8_TRAP Int64Regs:$s, Int32Regs:$x, Int32Regs:$y,			(SUST_P_2D_B8_TRAP_R Int64Regs:$s, Int32Regs:$x, Int32Regs:$y,
	Int16Regs:$r)>;			Int16Regs:$r)>;

	def : Pat<(int_nvvm_sust_p_2d_i16_trap			def : Pat<(int_nvvm_sust_p_2d_i16_trap
	Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int16Regs:$r),			Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int16Regs:$r),
	(SUST_P_2D_B16_TRAP Int64Regs:$s, Int32Regs:$x, Int32Regs:$y,			(SUST_P_2D_B16_TRAP_R Int64Regs:$s, Int32Regs:$x, Int32Regs:$y,
	Int16Regs:$r)>;			Int16Regs:$r)>;

	def : Pat<(int_nvvm_sust_p_2d_i32_trap			def : Pat<(int_nvvm_sust_p_2d_i32_trap
	Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$r),			Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$r),
	(SUST_P_2D_B32_TRAP Int64Regs:$s, Int32Regs:$x, Int32Regs:$y,			(SUST_P_2D_B32_TRAP_R Int64Regs:$s, Int32Regs:$x, Int32Regs:$y,
	Int32Regs:$r)>;			Int32Regs:$r)>;

	def : Pat<(int_nvvm_sust_p_2d_v2i8_trap			def : Pat<(int_nvvm_sust_p_2d_v2i8_trap
	Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int16Regs:$r, Int16Regs:$g),			Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int16Regs:$r, Int16Regs:$g),
	(SUST_P_2D_V2B8_TRAP Int64Regs:$s, Int32Regs:$x, Int32Regs:$y,			(SUST_P_2D_V2B8_TRAP_R Int64Regs:$s, Int32Regs:$x, Int32Regs:$y,
	Int16Regs:$r, Int16Regs:$g)>;			Int16Regs:$r, Int16Regs:$g)>;

	def : Pat<(int_nvvm_sust_p_2d_v2i16_trap			def : Pat<(int_nvvm_sust_p_2d_v2i16_trap
	Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int16Regs:$r, Int16Regs:$g),			Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int16Regs:$r, Int16Regs:$g),
	(SUST_P_2D_V2B16_TRAP Int64Regs:$s, Int32Regs:$x, Int32Regs:$y,			(SUST_P_2D_V2B16_TRAP_R Int64Regs:$s, Int32Regs:$x, Int32Regs:$y,
	Int16Regs:$r, Int16Regs:$g)>;			Int16Regs:$r, Int16Regs:$g)>;

	def : Pat<(int_nvvm_sust_p_2d_v2i32_trap			def : Pat<(int_nvvm_sust_p_2d_v2i32_trap
	Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$r, Int32Regs:$g),			Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$r, Int32Regs:$g),
	(SUST_P_2D_V2B32_TRAP Int64Regs:$s, Int32Regs:$x, Int32Regs:$y,			(SUST_P_2D_V2B32_TRAP_R Int64Regs:$s, Int32Regs:$x, Int32Regs:$y,
	Int32Regs:$r, Int32Regs:$g)>;			Int32Regs:$r, Int32Regs:$g)>;

	def : Pat<(int_nvvm_sust_p_2d_v4i8_trap			def : Pat<(int_nvvm_sust_p_2d_v4i8_trap
	Int64Regs:$s, Int32Regs:$x, Int32Regs:$y,			Int64Regs:$s, Int32Regs:$x, Int32Regs:$y,
	Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),			Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),
	(SUST_P_2D_V4B8_TRAP Int64Regs:$s, Int32Regs:$x, Int32Regs:$y,			(SUST_P_2D_V4B8_TRAP_R Int64Regs:$s, Int32Regs:$x, Int32Regs:$y,
	Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a)>;			Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a)>;

	def : Pat<(int_nvvm_sust_p_2d_v4i16_trap			def : Pat<(int_nvvm_sust_p_2d_v4i16_trap
	Int64Regs:$s, Int32Regs:$x, Int32Regs:$y,			Int64Regs:$s, Int32Regs:$x, Int32Regs:$y,
	Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),			Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),
	(SUST_P_2D_V4B16_TRAP Int64Regs:$s, Int32Regs:$x, Int32Regs:$y,			(SUST_P_2D_V4B16_TRAP_R Int64Regs:$s, Int32Regs:$x, Int32Regs:$y,
	Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a)>;			Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a)>;

	def : Pat<(int_nvvm_sust_p_2d_v4i32_trap			def : Pat<(int_nvvm_sust_p_2d_v4i32_trap
	Int64Regs:$s, Int32Regs:$x, Int32Regs:$y,			Int64Regs:$s, Int32Regs:$x, Int32Regs:$y,
	Int32Regs:$r, Int32Regs:$g, Int32Regs:$b, Int32Regs:$a),			Int32Regs:$r, Int32Regs:$g, Int32Regs:$b, Int32Regs:$a),
	(SUST_P_2D_V4B32_TRAP Int64Regs:$s, Int32Regs:$x, Int32Regs:$y,			(SUST_P_2D_V4B32_TRAP_R Int64Regs:$s, Int32Regs:$x, Int32Regs:$y,
	Int32Regs:$r, Int32Regs:$g, Int32Regs:$b, Int32Regs:$a)>;			Int32Regs:$r, Int32Regs:$g, Int32Regs:$b, Int32Regs:$a)>;



	def : Pat<(int_nvvm_sust_p_2d_array_i8_trap			def : Pat<(int_nvvm_sust_p_2d_array_i8_trap
	Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y, Int16Regs:$r),			Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y, Int16Regs:$r),
	(SUST_P_2D_ARRAY_B8_TRAP Int64Regs:$s,			(SUST_P_2D_ARRAY_B8_TRAP_R Int64Regs:$s,
	Int32Regs:$l, Int32Regs:$x, Int32Regs:$y,			Int32Regs:$l, Int32Regs:$x, Int32Regs:$y,
	Int16Regs:$r)>;			Int16Regs:$r)>;

	def : Pat<(int_nvvm_sust_p_2d_array_i16_trap			def : Pat<(int_nvvm_sust_p_2d_array_i16_trap
	Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y, Int16Regs:$r),			Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y, Int16Regs:$r),
	(SUST_P_2D_ARRAY_B16_TRAP Int64Regs:$s,			(SUST_P_2D_ARRAY_B16_TRAP_R Int64Regs:$s,
	Int32Regs:$l, Int32Regs:$x, Int32Regs:$y,			Int32Regs:$l, Int32Regs:$x, Int32Regs:$y,
	Int16Regs:$r)>;			Int16Regs:$r)>;

	def : Pat<(int_nvvm_sust_p_2d_array_i32_trap			def : Pat<(int_nvvm_sust_p_2d_array_i32_trap
	Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y, Int32Regs:$r),			Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y, Int32Regs:$r),
	(SUST_P_2D_ARRAY_B32_TRAP Int64Regs:$s,			(SUST_P_2D_ARRAY_B32_TRAP_R Int64Regs:$s,
	Int32Regs:$l, Int32Regs:$x, Int32Regs:$y,			Int32Regs:$l, Int32Regs:$x, Int32Regs:$y,
	Int32Regs:$r)>;			Int32Regs:$r)>;

	def : Pat<(int_nvvm_sust_p_2d_array_v2i8_trap			def : Pat<(int_nvvm_sust_p_2d_array_v2i8_trap
	Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y,			Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y,
	Int16Regs:$r, Int16Regs:$g),			Int16Regs:$r, Int16Regs:$g),
	(SUST_P_2D_ARRAY_V2B8_TRAP Int64Regs:$s, Int32Regs:$l,			(SUST_P_2D_ARRAY_V2B8_TRAP_R Int64Regs:$s, Int32Regs:$l,
	Int32Regs:$x, Int32Regs:$y,			Int32Regs:$x, Int32Regs:$y,
	Int16Regs:$r, Int16Regs:$g)>;			Int16Regs:$r, Int16Regs:$g)>;

	def : Pat<(int_nvvm_sust_p_2d_array_v2i16_trap			def : Pat<(int_nvvm_sust_p_2d_array_v2i16_trap
	Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y,			Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y,
	Int16Regs:$r, Int16Regs:$g),			Int16Regs:$r, Int16Regs:$g),
	(SUST_P_2D_ARRAY_V2B16_TRAP Int64Regs:$s, Int32Regs:$l,			(SUST_P_2D_ARRAY_V2B16_TRAP_R Int64Regs:$s, Int32Regs:$l,
	Int32Regs:$x, Int32Regs:$y,			Int32Regs:$x, Int32Regs:$y,
	Int16Regs:$r, Int16Regs:$g)>;			Int16Regs:$r, Int16Regs:$g)>;

	def : Pat<(int_nvvm_sust_p_2d_array_v2i32_trap			def : Pat<(int_nvvm_sust_p_2d_array_v2i32_trap
	Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y, Int32Regs:$r,			Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y, Int32Regs:$r,
	Int32Regs:$g),			Int32Regs:$g),
	(SUST_P_2D_ARRAY_V2B32_TRAP Int64Regs:$s, Int32Regs:$l,			(SUST_P_2D_ARRAY_V2B32_TRAP_R Int64Regs:$s, Int32Regs:$l,
	Int32Regs:$x, Int32Regs:$y, Int32Regs:$r, Int32Regs:$g)>;			Int32Regs:$x, Int32Regs:$y, Int32Regs:$r, Int32Regs:$g)>;

	def : Pat<(int_nvvm_sust_p_2d_array_v4i8_trap			def : Pat<(int_nvvm_sust_p_2d_array_v4i8_trap
	Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y,			Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y,
	Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),			Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),
	(SUST_P_2D_ARRAY_V4B8_TRAP Int64Regs:$s,			(SUST_P_2D_ARRAY_V4B8_TRAP_R Int64Regs:$s,
	Int32Regs:$l, Int32Regs:$x, Int32Regs:$y,			Int32Regs:$l, Int32Regs:$x, Int32Regs:$y,
	Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a)>;			Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a)>;

	def : Pat<(int_nvvm_sust_p_2d_array_v4i16_trap			def : Pat<(int_nvvm_sust_p_2d_array_v4i16_trap
	Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y,			Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y,
	Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),			Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),
	(SUST_P_2D_ARRAY_V4B16_TRAP Int64Regs:$s,			(SUST_P_2D_ARRAY_V4B16_TRAP_R Int64Regs:$s,
	Int32Regs:$l, Int32Regs:$x, Int32Regs:$y,			Int32Regs:$l, Int32Regs:$x, Int32Regs:$y,
	Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a)>;			Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a)>;

	def : Pat<(int_nvvm_sust_p_2d_array_v4i32_trap			def : Pat<(int_nvvm_sust_p_2d_array_v4i32_trap
	Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y,			Int64Regs:$s, Int32Regs:$l, Int32Regs:$x, Int32Regs:$y,
	Int32Regs:$r, Int32Regs:$g, Int32Regs:$b, Int32Regs:$a),			Int32Regs:$r, Int32Regs:$g, Int32Regs:$b, Int32Regs:$a),
	(SUST_P_2D_ARRAY_V4B32_TRAP Int64Regs:$s, Int32Regs:$l,			(SUST_P_2D_ARRAY_V4B32_TRAP_R Int64Regs:$s, Int32Regs:$l,
	Int32Regs:$x, Int32Regs:$y,			Int32Regs:$x, Int32Regs:$y,
	Int32Regs:$r, Int32Regs:$g, Int32Regs:$b, Int32Regs:$a)>;			Int32Regs:$r, Int32Regs:$g, Int32Regs:$b, Int32Regs:$a)>;



	def : Pat<(int_nvvm_sust_p_3d_i8_trap			def : Pat<(int_nvvm_sust_p_3d_i8_trap
	Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,			Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int16Regs:$r),			Int16Regs:$r),
	(SUST_P_3D_B8_TRAP Int64Regs:$s,			(SUST_P_3D_B8_TRAP_R Int64Regs:$s,
	Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,			Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int16Regs:$r)>;			Int16Regs:$r)>;

	def : Pat<(int_nvvm_sust_p_3d_i16_trap			def : Pat<(int_nvvm_sust_p_3d_i16_trap
	Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,			Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int16Regs:$r),			Int16Regs:$r),
	(SUST_P_3D_B16_TRAP Int64Regs:$s,			(SUST_P_3D_B16_TRAP_R Int64Regs:$s,
	Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,			Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int16Regs:$r)>;			Int16Regs:$r)>;

	def : Pat<(int_nvvm_sust_p_3d_i32_trap			def : Pat<(int_nvvm_sust_p_3d_i32_trap
	Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,			Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int32Regs:$r),			Int32Regs:$r),
	(SUST_P_3D_B32_TRAP Int64Regs:$s,			(SUST_P_3D_B32_TRAP_R Int64Regs:$s,
	Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,			Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int32Regs:$r)>;			Int32Regs:$r)>;

	def : Pat<(int_nvvm_sust_p_3d_v2i8_trap			def : Pat<(int_nvvm_sust_p_3d_v2i8_trap
	Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,			Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int16Regs:$r, Int16Regs:$g),			Int16Regs:$r, Int16Regs:$g),
	(SUST_P_3D_V2B8_TRAP Int64Regs:$s,			(SUST_P_3D_V2B8_TRAP_R Int64Regs:$s,
	Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,			Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int16Regs:$r, Int16Regs:$g)>;			Int16Regs:$r, Int16Regs:$g)>;

	def : Pat<(int_nvvm_sust_p_3d_v2i16_trap			def : Pat<(int_nvvm_sust_p_3d_v2i16_trap
	Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,			Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int16Regs:$r, Int16Regs:$g),			Int16Regs:$r, Int16Regs:$g),
	(SUST_P_3D_V2B16_TRAP Int64Regs:$s,			(SUST_P_3D_V2B16_TRAP_R Int64Regs:$s,
	Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,			Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int16Regs:$r, Int16Regs:$g)>;			Int16Regs:$r, Int16Regs:$g)>;

	def : Pat<(int_nvvm_sust_p_3d_v2i32_trap			def : Pat<(int_nvvm_sust_p_3d_v2i32_trap
	Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,			Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int32Regs:$r, Int32Regs:$g),			Int32Regs:$r, Int32Regs:$g),
	(SUST_P_3D_V2B32_TRAP Int64Regs:$s,			(SUST_P_3D_V2B32_TRAP_R Int64Regs:$s,
	Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,			Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int32Regs:$r, Int32Regs:$g)>;			Int32Regs:$r, Int32Regs:$g)>;

	def : Pat<(int_nvvm_sust_p_3d_v4i8_trap			def : Pat<(int_nvvm_sust_p_3d_v4i8_trap
	Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,			Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),			Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),
	(SUST_P_3D_V4B8_TRAP Int64Regs:$s,			(SUST_P_3D_V4B8_TRAP_R Int64Regs:$s,
	Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,			Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a)>;			Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a)>;

	def : Pat<(int_nvvm_sust_p_3d_v4i16_trap			def : Pat<(int_nvvm_sust_p_3d_v4i16_trap
	Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,			Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),			Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a),
	(SUST_P_3D_V4B16_TRAP Int64Regs:$s,			(SUST_P_3D_V4B16_TRAP_R Int64Regs:$s,
	Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,			Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a)>;			Int16Regs:$r, Int16Regs:$g, Int16Regs:$b, Int16Regs:$a)>;

	def : Pat<(int_nvvm_sust_p_3d_v4i32_trap			def : Pat<(int_nvvm_sust_p_3d_v4i32_trap
	Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,			Int64Regs:$s, Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int32Regs:$r, Int32Regs:$g, Int32Regs:$b, Int32Regs:$a),			Int32Regs:$r, Int32Regs:$g, Int32Regs:$b, Int32Regs:$a),
	(SUST_P_3D_V4B32_TRAP Int64Regs:$s,			(SUST_P_3D_V4B32_TRAP_R Int64Regs:$s,
	Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,			Int32Regs:$x, Int32Regs:$y, Int32Regs:$z,
	Int32Regs:$r, Int32Regs:$g, Int32Regs:$b, Int32Regs:$a)>;			Int32Regs:$r, Int32Regs:$g, Int32Regs:$b, Int32Regs:$a)>;

	//-----------------------------------			//-----------------------------------
	// Read Special Registers			// Read Special Registers
	//-----------------------------------			//-----------------------------------

	class PTX_READ_SREG_R64<string regname, Intrinsic intop>			class PTX_READ_SREG_R64<string regname, Intrinsic intop>
	▲ Show 20 Lines • Show All 490 Lines • Show Last 20 Lines

llvm/lib/Target/NVPTX/NVPTXReplaceImageHandles.cpp

Show All 35 Lines	public:

bool runOnMachineFunction(MachineFunction &MF) override;		bool runOnMachineFunction(MachineFunction &MF) override;

StringRef getPassName() const override {		StringRef getPassName() const override {
return "NVPTX Replace Image Handles";		return "NVPTX Replace Image Handles";
}		}
private:		private:
bool processInstr(MachineInstr &MI);		bool processInstr(MachineInstr &MI);
void replaceImageHandle(MachineOperand &Op, MachineFunction &MF);		bool replaceImageHandle(MachineOperand &Op, MachineFunction &MF);
bool findIndexForHandle(MachineOperand &Op, MachineFunction &MF,		bool findIndexForHandle(MachineOperand &Op, MachineFunction &MF,
unsigned &Idx);		unsigned &Idx);
};		};
}		}

char NVPTXReplaceImageHandles::ID = 0;		char NVPTXReplaceImageHandles::ID = 0;

NVPTXReplaceImageHandles::NVPTXReplaceImageHandles()		NVPTXReplaceImageHandles::NVPTXReplaceImageHandles()
Show All 18 Lines	bool NVPTXReplaceImageHandles::runOnMachineFunction(MachineFunction &MF) {
// valid instructions when image handles are disabled.		// valid instructions when image handles are disabled.
for (DenseSet<MachineInstr *>::iterator I = InstrsToRemove.begin(),		for (DenseSet<MachineInstr *>::iterator I = InstrsToRemove.begin(),
E = InstrsToRemove.end(); I != E; ++I) {		E = InstrsToRemove.end(); I != E; ++I) {
(*I)->eraseFromParent();		(*I)->eraseFromParent();
}		}
return Changed;		return Changed;
}		}

		static unsigned suldRegisterToIndexOpcode(unsigned RegOC) {
		switch (RegOC) {
		case NVPTX::SULD_1D_I8_CLAMP_R:
		return NVPTX::SULD_1D_I8_CLAMP_I;
		case NVPTX::SULD_1D_I16_CLAMP_R:
		return NVPTX::SULD_1D_I16_CLAMP_I;
		case NVPTX::SULD_1D_I32_CLAMP_R:
		return NVPTX::SULD_1D_I32_CLAMP_I;
		case NVPTX::SULD_1D_I64_CLAMP_R:
		return NVPTX::SULD_1D_I64_CLAMP_I;
		case NVPTX::SULD_1D_ARRAY_I8_CLAMP_R:
		return NVPTX::SULD_1D_ARRAY_I8_CLAMP_I;
		case NVPTX::SULD_1D_ARRAY_I16_CLAMP_R:
		return NVPTX::SULD_1D_ARRAY_I16_CLAMP_I;
		case NVPTX::SULD_1D_ARRAY_I32_CLAMP_R:
		return NVPTX::SULD_1D_ARRAY_I32_CLAMP_I;
		case NVPTX::SULD_1D_ARRAY_I64_CLAMP_R:
		return NVPTX::SULD_1D_ARRAY_I64_CLAMP_I;
		case NVPTX::SULD_2D_I8_CLAMP_R:
		return NVPTX::SULD_2D_I8_CLAMP_I;
		case NVPTX::SULD_2D_I16_CLAMP_R:
		return NVPTX::SULD_2D_I16_CLAMP_I;
		case NVPTX::SULD_2D_I32_CLAMP_R:
		return NVPTX::SULD_2D_I32_CLAMP_I;
		case NVPTX::SULD_2D_I64_CLAMP_R:
		return NVPTX::SULD_2D_I64_CLAMP_I;
		case NVPTX::SULD_2D_ARRAY_I8_CLAMP_R:
		return NVPTX::SULD_2D_ARRAY_I8_CLAMP_I;
		case NVPTX::SULD_2D_ARRAY_I16_CLAMP_R:
		return NVPTX::SULD_2D_ARRAY_I16_CLAMP_I;
		case NVPTX::SULD_2D_ARRAY_I32_CLAMP_R:
		return NVPTX::SULD_2D_ARRAY_I32_CLAMP_I;
		case NVPTX::SULD_2D_ARRAY_I64_CLAMP_R:
		return NVPTX::SULD_2D_ARRAY_I64_CLAMP_I;
		case NVPTX::SULD_3D_I8_CLAMP_R:
		return NVPTX::SULD_3D_I8_CLAMP_I;
		case NVPTX::SULD_3D_I16_CLAMP_R:
		return NVPTX::SULD_3D_I16_CLAMP_I;
		case NVPTX::SULD_3D_I32_CLAMP_R:
		return NVPTX::SULD_3D_I32_CLAMP_I;
		case NVPTX::SULD_3D_I64_CLAMP_R:
		return NVPTX::SULD_3D_I64_CLAMP_I;
		case NVPTX::SULD_1D_V2I8_CLAMP_R:
		return NVPTX::SULD_1D_V2I8_CLAMP_I;
		case NVPTX::SULD_1D_V2I16_CLAMP_R:
		return NVPTX::SULD_1D_V2I16_CLAMP_I;
		case NVPTX::SULD_1D_V2I32_CLAMP_R:
		return NVPTX::SULD_1D_V2I32_CLAMP_I;
		case NVPTX::SULD_1D_V2I64_CLAMP_R:
		return NVPTX::SULD_1D_V2I64_CLAMP_I;
		case NVPTX::SULD_1D_ARRAY_V2I8_CLAMP_R:
		return NVPTX::SULD_1D_ARRAY_V2I8_CLAMP_I;
		case NVPTX::SULD_1D_ARRAY_V2I16_CLAMP_R:
		return NVPTX::SULD_1D_ARRAY_V2I16_CLAMP_I;
		case NVPTX::SULD_1D_ARRAY_V2I32_CLAMP_R:
		return NVPTX::SULD_1D_ARRAY_V2I32_CLAMP_I;
		case NVPTX::SULD_1D_ARRAY_V2I64_CLAMP_R:
		return NVPTX::SULD_1D_ARRAY_V2I64_CLAMP_I;
		case NVPTX::SULD_2D_V2I8_CLAMP_R:
		return NVPTX::SULD_2D_V2I8_CLAMP_I;
		case NVPTX::SULD_2D_V2I16_CLAMP_R:
		return NVPTX::SULD_2D_V2I16_CLAMP_I;
		case NVPTX::SULD_2D_V2I32_CLAMP_R:
		return NVPTX::SULD_2D_V2I32_CLAMP_I;
		case NVPTX::SULD_2D_V2I64_CLAMP_R:
		return NVPTX::SULD_2D_V2I64_CLAMP_I;
		case NVPTX::SULD_2D_ARRAY_V2I8_CLAMP_R:
		return NVPTX::SULD_2D_ARRAY_V2I8_CLAMP_I;
		case NVPTX::SULD_2D_ARRAY_V2I16_CLAMP_R:
		return NVPTX::SULD_2D_ARRAY_V2I16_CLAMP_I;
		case NVPTX::SULD_2D_ARRAY_V2I32_CLAMP_R:
		return NVPTX::SULD_2D_ARRAY_V2I32_CLAMP_I;
		case NVPTX::SULD_2D_ARRAY_V2I64_CLAMP_R:
		return NVPTX::SULD_2D_ARRAY_V2I64_CLAMP_I;
		case NVPTX::SULD_3D_V2I8_CLAMP_R:
		return NVPTX::SULD_3D_V2I8_CLAMP_I;
		case NVPTX::SULD_3D_V2I16_CLAMP_R:
		return NVPTX::SULD_3D_V2I16_CLAMP_I;
		case NVPTX::SULD_3D_V2I32_CLAMP_R:
		return NVPTX::SULD_3D_V2I32_CLAMP_I;
		case NVPTX::SULD_3D_V2I64_CLAMP_R:
		return NVPTX::SULD_3D_V2I64_CLAMP_I;
		case NVPTX::SULD_1D_V4I8_CLAMP_R:
		return NVPTX::SULD_1D_V4I8_CLAMP_I;
		case NVPTX::SULD_1D_V4I16_CLAMP_R:
		return NVPTX::SULD_1D_V4I16_CLAMP_I;
		case NVPTX::SULD_1D_V4I32_CLAMP_R:
		return NVPTX::SULD_1D_V4I32_CLAMP_I;
		case NVPTX::SULD_1D_ARRAY_V4I8_CLAMP_R:
		return NVPTX::SULD_1D_ARRAY_V4I8_CLAMP_I;
		case NVPTX::SULD_1D_ARRAY_V4I16_CLAMP_R:
		return NVPTX::SULD_1D_ARRAY_V4I16_CLAMP_I;
		case NVPTX::SULD_1D_ARRAY_V4I32_CLAMP_R:
		return NVPTX::SULD_1D_ARRAY_V4I32_CLAMP_I;
		case NVPTX::SULD_2D_V4I8_CLAMP_R:
		return NVPTX::SULD_2D_V4I8_CLAMP_I;
		case NVPTX::SULD_2D_V4I16_CLAMP_R:
		return NVPTX::SULD_2D_V4I16_CLAMP_I;
		case NVPTX::SULD_2D_V4I32_CLAMP_R:
		return NVPTX::SULD_2D_V4I32_CLAMP_I;
		case NVPTX::SULD_2D_ARRAY_V4I8_CLAMP_R:
		return NVPTX::SULD_2D_ARRAY_V4I8_CLAMP_I;
		case NVPTX::SULD_2D_ARRAY_V4I16_CLAMP_R:
		return NVPTX::SULD_2D_ARRAY_V4I16_CLAMP_I;
		case NVPTX::SULD_2D_ARRAY_V4I32_CLAMP_R:
		return NVPTX::SULD_2D_ARRAY_V4I32_CLAMP_I;
		case NVPTX::SULD_3D_V4I8_CLAMP_R:
		return NVPTX::SULD_3D_V4I8_CLAMP_I;
		case NVPTX::SULD_3D_V4I16_CLAMP_R:
		return NVPTX::SULD_3D_V4I16_CLAMP_I;
		case NVPTX::SULD_3D_V4I32_CLAMP_R:
		return NVPTX::SULD_3D_V4I32_CLAMP_I;
		case NVPTX::SULD_1D_I8_TRAP_R:
		return NVPTX::SULD_1D_I8_TRAP_I;
		case NVPTX::SULD_1D_I16_TRAP_R:
		return NVPTX::SULD_1D_I16_TRAP_I;
		case NVPTX::SULD_1D_I32_TRAP_R:
		return NVPTX::SULD_1D_I32_TRAP_I;
		case NVPTX::SULD_1D_I64_TRAP_R:
		return NVPTX::SULD_1D_I64_TRAP_I;
		case NVPTX::SULD_1D_ARRAY_I8_TRAP_R:
		return NVPTX::SULD_1D_ARRAY_I8_TRAP_I;
		case NVPTX::SULD_1D_ARRAY_I16_TRAP_R:
		return NVPTX::SULD_1D_ARRAY_I16_TRAP_I;
		case NVPTX::SULD_1D_ARRAY_I32_TRAP_R:
		return NVPTX::SULD_1D_ARRAY_I32_TRAP_I;
		case NVPTX::SULD_1D_ARRAY_I64_TRAP_R:
		return NVPTX::SULD_1D_ARRAY_I64_TRAP_I;
		case NVPTX::SULD_2D_I8_TRAP_R:
		return NVPTX::SULD_2D_I8_TRAP_I;
		case NVPTX::SULD_2D_I16_TRAP_R:
		return NVPTX::SULD_2D_I16_TRAP_I;
		case NVPTX::SULD_2D_I32_TRAP_R:
		return NVPTX::SULD_2D_I32_TRAP_I;
		case NVPTX::SULD_2D_I64_TRAP_R:
		return NVPTX::SULD_2D_I64_TRAP_I;
		case NVPTX::SULD_2D_ARRAY_I8_TRAP_R:
		return NVPTX::SULD_2D_ARRAY_I8_TRAP_I;
		case NVPTX::SULD_2D_ARRAY_I16_TRAP_R:
		return NVPTX::SULD_2D_ARRAY_I16_TRAP_I;
		case NVPTX::SULD_2D_ARRAY_I32_TRAP_R:
		return NVPTX::SULD_2D_ARRAY_I32_TRAP_I;
		case NVPTX::SULD_2D_ARRAY_I64_TRAP_R:
		return NVPTX::SULD_2D_ARRAY_I64_TRAP_I;
		case NVPTX::SULD_3D_I8_TRAP_R:
		return NVPTX::SULD_3D_I8_TRAP_I;
		case NVPTX::SULD_3D_I16_TRAP_R:
		return NVPTX::SULD_3D_I16_TRAP_I;
		case NVPTX::SULD_3D_I32_TRAP_R:
		return NVPTX::SULD_3D_I32_TRAP_I;
		case NVPTX::SULD_3D_I64_TRAP_R:
		return NVPTX::SULD_3D_I64_TRAP_I;
		case NVPTX::SULD_1D_V2I8_TRAP_R:
		return NVPTX::SULD_1D_V2I8_TRAP_I;
		case NVPTX::SULD_1D_V2I16_TRAP_R:
		return NVPTX::SULD_1D_V2I16_TRAP_I;
		case NVPTX::SULD_1D_V2I32_TRAP_R:
		return NVPTX::SULD_1D_V2I32_TRAP_I;
		case NVPTX::SULD_1D_V2I64_TRAP_R:
		return NVPTX::SULD_1D_V2I64_TRAP_I;
		case NVPTX::SULD_1D_ARRAY_V2I8_TRAP_R:
		return NVPTX::SULD_1D_ARRAY_V2I8_TRAP_I;
		case NVPTX::SULD_1D_ARRAY_V2I16_TRAP_R:
		return NVPTX::SULD_1D_ARRAY_V2I16_TRAP_I;
		case NVPTX::SULD_1D_ARRAY_V2I32_TRAP_R:
		return NVPTX::SULD_1D_ARRAY_V2I32_TRAP_I;
		case NVPTX::SULD_1D_ARRAY_V2I64_TRAP_R:
		return NVPTX::SULD_1D_ARRAY_V2I64_TRAP_I;
		case NVPTX::SULD_2D_V2I8_TRAP_R:
		return NVPTX::SULD_2D_V2I8_TRAP_I;
		case NVPTX::SULD_2D_V2I16_TRAP_R:
		return NVPTX::SULD_2D_V2I16_TRAP_I;
		case NVPTX::SULD_2D_V2I32_TRAP_R:
		return NVPTX::SULD_2D_V2I32_TRAP_I;
		case NVPTX::SULD_2D_V2I64_TRAP_R:
		return NVPTX::SULD_2D_V2I64_TRAP_I;
		case NVPTX::SULD_2D_ARRAY_V2I8_TRAP_R:
		return NVPTX::SULD_2D_ARRAY_V2I8_TRAP_I;
		case NVPTX::SULD_2D_ARRAY_V2I16_TRAP_R:
		return NVPTX::SULD_2D_ARRAY_V2I16_TRAP_I;
		case NVPTX::SULD_2D_ARRAY_V2I32_TRAP_R:
		return NVPTX::SULD_2D_ARRAY_V2I32_TRAP_I;
		case NVPTX::SULD_2D_ARRAY_V2I64_TRAP_R:
		return NVPTX::SULD_2D_ARRAY_V2I64_TRAP_I;
		case NVPTX::SULD_3D_V2I8_TRAP_R:
		return NVPTX::SULD_3D_V2I8_TRAP_I;
		case NVPTX::SULD_3D_V2I16_TRAP_R:
		return NVPTX::SULD_3D_V2I16_TRAP_I;
		case NVPTX::SULD_3D_V2I32_TRAP_R:
		return NVPTX::SULD_3D_V2I32_TRAP_I;
		case NVPTX::SULD_3D_V2I64_TRAP_R:
		return NVPTX::SULD_3D_V2I64_TRAP_I;
		case NVPTX::SULD_1D_V4I8_TRAP_R:
		return NVPTX::SULD_1D_V4I8_TRAP_I;
		case NVPTX::SULD_1D_V4I16_TRAP_R:
		return NVPTX::SULD_1D_V4I16_TRAP_I;
		case NVPTX::SULD_1D_V4I32_TRAP_R:
		return NVPTX::SULD_1D_V4I32_TRAP_I;
		case NVPTX::SULD_1D_ARRAY_V4I8_TRAP_R:
		return NVPTX::SULD_1D_ARRAY_V4I8_TRAP_I;
		case NVPTX::SULD_1D_ARRAY_V4I16_TRAP_R:
		return NVPTX::SULD_1D_ARRAY_V4I16_TRAP_I;
		case NVPTX::SULD_1D_ARRAY_V4I32_TRAP_R:
		return NVPTX::SULD_1D_ARRAY_V4I32_TRAP_I;
		case NVPTX::SULD_2D_V4I8_TRAP_R:
		return NVPTX::SULD_2D_V4I8_TRAP_I;
		case NVPTX::SULD_2D_V4I16_TRAP_R:
		return NVPTX::SULD_2D_V4I16_TRAP_I;
		case NVPTX::SULD_2D_V4I32_TRAP_R:
		return NVPTX::SULD_2D_V4I32_TRAP_I;
		case NVPTX::SULD_2D_ARRAY_V4I8_TRAP_R:
		return NVPTX::SULD_2D_ARRAY_V4I8_TRAP_I;
		case NVPTX::SULD_2D_ARRAY_V4I16_TRAP_R:
		return NVPTX::SULD_2D_ARRAY_V4I16_TRAP_I;
		case NVPTX::SULD_2D_ARRAY_V4I32_TRAP_R:
		return NVPTX::SULD_2D_ARRAY_V4I32_TRAP_I;
		case NVPTX::SULD_3D_V4I8_TRAP_R:
		return NVPTX::SULD_3D_V4I8_TRAP_I;
		case NVPTX::SULD_3D_V4I16_TRAP_R:
		return NVPTX::SULD_3D_V4I16_TRAP_I;
		case NVPTX::SULD_3D_V4I32_TRAP_R:
		return NVPTX::SULD_3D_V4I32_TRAP_I;
		case NVPTX::SULD_1D_I8_ZERO_R:
		return NVPTX::SULD_1D_I8_ZERO_I;
		case NVPTX::SULD_1D_I16_ZERO_R:
		return NVPTX::SULD_1D_I16_ZERO_I;
		case NVPTX::SULD_1D_I32_ZERO_R:
		return NVPTX::SULD_1D_I32_ZERO_I;
		case NVPTX::SULD_1D_I64_ZERO_R:
		return NVPTX::SULD_1D_I64_ZERO_I;
		case NVPTX::SULD_1D_ARRAY_I8_ZERO_R:
		return NVPTX::SULD_1D_ARRAY_I8_ZERO_I;
		case NVPTX::SULD_1D_ARRAY_I16_ZERO_R:
		return NVPTX::SULD_1D_ARRAY_I16_ZERO_I;
		case NVPTX::SULD_1D_ARRAY_I32_ZERO_R:
		return NVPTX::SULD_1D_ARRAY_I32_ZERO_I;
		case NVPTX::SULD_1D_ARRAY_I64_ZERO_R:
		return NVPTX::SULD_1D_ARRAY_I64_ZERO_I;
		case NVPTX::SULD_2D_I8_ZERO_R:
		return NVPTX::SULD_2D_I8_ZERO_I;
		case NVPTX::SULD_2D_I16_ZERO_R:
		return NVPTX::SULD_2D_I16_ZERO_I;
		case NVPTX::SULD_2D_I32_ZERO_R:
		return NVPTX::SULD_2D_I32_ZERO_I;
		case NVPTX::SULD_2D_I64_ZERO_R:
		return NVPTX::SULD_2D_I64_ZERO_I;
		case NVPTX::SULD_2D_ARRAY_I8_ZERO_R:
		return NVPTX::SULD_2D_ARRAY_I8_ZERO_I;
		case NVPTX::SULD_2D_ARRAY_I16_ZERO_R:
		return NVPTX::SULD_2D_ARRAY_I16_ZERO_I;
		case NVPTX::SULD_2D_ARRAY_I32_ZERO_R:
		return NVPTX::SULD_2D_ARRAY_I32_ZERO_I;
		case NVPTX::SULD_2D_ARRAY_I64_ZERO_R:
		return NVPTX::SULD_2D_ARRAY_I64_ZERO_I;
		case NVPTX::SULD_3D_I8_ZERO_R:
		return NVPTX::SULD_3D_I8_ZERO_I;
		case NVPTX::SULD_3D_I16_ZERO_R:
		return NVPTX::SULD_3D_I16_ZERO_I;
		case NVPTX::SULD_3D_I32_ZERO_R:
		return NVPTX::SULD_3D_I32_ZERO_I;
		case NVPTX::SULD_3D_I64_ZERO_R:
		return NVPTX::SULD_3D_I64_ZERO_I;
		case NVPTX::SULD_1D_V2I8_ZERO_R:
		return NVPTX::SULD_1D_V2I8_ZERO_I;
		case NVPTX::SULD_1D_V2I16_ZERO_R:
		return NVPTX::SULD_1D_V2I16_ZERO_I;
		case NVPTX::SULD_1D_V2I32_ZERO_R:
		return NVPTX::SULD_1D_V2I32_ZERO_I;
		case NVPTX::SULD_1D_V2I64_ZERO_R:
		return NVPTX::SULD_1D_V2I64_ZERO_I;
		case NVPTX::SULD_1D_ARRAY_V2I8_ZERO_R:
		return NVPTX::SULD_1D_ARRAY_V2I8_ZERO_I;
		case NVPTX::SULD_1D_ARRAY_V2I16_ZERO_R:
		return NVPTX::SULD_1D_ARRAY_V2I16_ZERO_I;
		case NVPTX::SULD_1D_ARRAY_V2I32_ZERO_R:
		return NVPTX::SULD_1D_ARRAY_V2I32_ZERO_I;
		case NVPTX::SULD_1D_ARRAY_V2I64_ZERO_R:
		return NVPTX::SULD_1D_ARRAY_V2I64_ZERO_I;
		case NVPTX::SULD_2D_V2I8_ZERO_R:
		return NVPTX::SULD_2D_V2I8_ZERO_I;
		case NVPTX::SULD_2D_V2I16_ZERO_R:
		return NVPTX::SULD_2D_V2I16_ZERO_I;
		case NVPTX::SULD_2D_V2I32_ZERO_R:
		return NVPTX::SULD_2D_V2I32_ZERO_I;
		case NVPTX::SULD_2D_V2I64_ZERO_R:
		return NVPTX::SULD_2D_V2I64_ZERO_I;
		case NVPTX::SULD_2D_ARRAY_V2I8_ZERO_R:
		return NVPTX::SULD_2D_ARRAY_V2I8_ZERO_I;
		case NVPTX::SULD_2D_ARRAY_V2I16_ZERO_R:
		return NVPTX::SULD_2D_ARRAY_V2I16_ZERO_I;
		case NVPTX::SULD_2D_ARRAY_V2I32_ZERO_R:
		return NVPTX::SULD_2D_ARRAY_V2I32_ZERO_I;
		case NVPTX::SULD_2D_ARRAY_V2I64_ZERO_R:
		return NVPTX::SULD_2D_ARRAY_V2I64_ZERO_I;
		case NVPTX::SULD_3D_V2I8_ZERO_R:
		return NVPTX::SULD_3D_V2I8_ZERO_I;
		case NVPTX::SULD_3D_V2I16_ZERO_R:
		return NVPTX::SULD_3D_V2I16_ZERO_I;
		case NVPTX::SULD_3D_V2I32_ZERO_R:
		return NVPTX::SULD_3D_V2I32_ZERO_I;
		case NVPTX::SULD_3D_V2I64_ZERO_R:
		return NVPTX::SULD_3D_V2I64_ZERO_I;
		case NVPTX::SULD_1D_V4I8_ZERO_R:
		return NVPTX::SULD_1D_V4I8_ZERO_I;
		case NVPTX::SULD_1D_V4I16_ZERO_R:
		return NVPTX::SULD_1D_V4I16_ZERO_I;
		case NVPTX::SULD_1D_V4I32_ZERO_R:
		return NVPTX::SULD_1D_V4I32_ZERO_I;
		case NVPTX::SULD_1D_ARRAY_V4I8_ZERO_R:
		return NVPTX::SULD_1D_ARRAY_V4I8_ZERO_I;
		case NVPTX::SULD_1D_ARRAY_V4I16_ZERO_R:
		return NVPTX::SULD_1D_ARRAY_V4I16_ZERO_I;
		case NVPTX::SULD_1D_ARRAY_V4I32_ZERO_R:
		return NVPTX::SULD_1D_ARRAY_V4I32_ZERO_I;
		case NVPTX::SULD_2D_V4I8_ZERO_R:
		return NVPTX::SULD_2D_V4I8_ZERO_I;
		case NVPTX::SULD_2D_V4I16_ZERO_R:
		return NVPTX::SULD_2D_V4I16_ZERO_I;
		case NVPTX::SULD_2D_V4I32_ZERO_R:
		return NVPTX::SULD_2D_V4I32_ZERO_I;
		case NVPTX::SULD_2D_ARRAY_V4I8_ZERO_R:
		return NVPTX::SULD_2D_ARRAY_V4I8_ZERO_I;
		case NVPTX::SULD_2D_ARRAY_V4I16_ZERO_R:
		return NVPTX::SULD_2D_ARRAY_V4I16_ZERO_I;
		case NVPTX::SULD_2D_ARRAY_V4I32_ZERO_R:
		return NVPTX::SULD_2D_ARRAY_V4I32_ZERO_I;
		case NVPTX::SULD_3D_V4I8_ZERO_R:
		return NVPTX::SULD_3D_V4I8_ZERO_I;
		case NVPTX::SULD_3D_V4I16_ZERO_R:
		return NVPTX::SULD_3D_V4I16_ZERO_I;
		case NVPTX::SULD_3D_V4I32_ZERO_R:
		return NVPTX::SULD_3D_V4I32_ZERO_I;
		default:
		llvm_unreachable("Unhandled SULD opcode");
		}
		}

		static unsigned sustRegisterToIndexOpcode(unsigned RegOC) {
		switch (RegOC) {
		case NVPTX::SUST_B_1D_B8_CLAMP_R:
		return NVPTX::SUST_B_1D_B8_CLAMP_I;
		case NVPTX::SUST_B_1D_B16_CLAMP_R:
		return NVPTX::SUST_B_1D_B16_CLAMP_I;
		case NVPTX::SUST_B_1D_B32_CLAMP_R:
		return NVPTX::SUST_B_1D_B32_CLAMP_I;
		case NVPTX::SUST_B_1D_B64_CLAMP_R:
		return NVPTX::SUST_B_1D_B64_CLAMP_I;
		case NVPTX::SUST_B_1D_V2B8_CLAMP_R:
		return NVPTX::SUST_B_1D_V2B8_CLAMP_I;
		case NVPTX::SUST_B_1D_V2B16_CLAMP_R:
		return NVPTX::SUST_B_1D_V2B16_CLAMP_I;
		case NVPTX::SUST_B_1D_V2B32_CLAMP_R:
		return NVPTX::SUST_B_1D_V2B32_CLAMP_I;
		case NVPTX::SUST_B_1D_V2B64_CLAMP_R:
		return NVPTX::SUST_B_1D_V2B64_CLAMP_I;
		case NVPTX::SUST_B_1D_V4B8_CLAMP_R:
		return NVPTX::SUST_B_1D_V4B8_CLAMP_I;
		case NVPTX::SUST_B_1D_V4B16_CLAMP_R:
		return NVPTX::SUST_B_1D_V4B16_CLAMP_I;
		case NVPTX::SUST_B_1D_V4B32_CLAMP_R:
		return NVPTX::SUST_B_1D_V4B32_CLAMP_I;
		case NVPTX::SUST_B_1D_ARRAY_B8_CLAMP_R:
		return NVPTX::SUST_B_1D_ARRAY_B8_CLAMP_I;
		case NVPTX::SUST_B_1D_ARRAY_B16_CLAMP_R:
		return NVPTX::SUST_B_1D_ARRAY_B16_CLAMP_I;
		case NVPTX::SUST_B_1D_ARRAY_B32_CLAMP_R:
		return NVPTX::SUST_B_1D_ARRAY_B32_CLAMP_I;
		case NVPTX::SUST_B_1D_ARRAY_B64_CLAMP_R:
		return NVPTX::SUST_B_1D_ARRAY_B64_CLAMP_I;
		case NVPTX::SUST_B_1D_ARRAY_V2B8_CLAMP_R:
		return NVPTX::SUST_B_1D_ARRAY_V2B8_CLAMP_I;
		case NVPTX::SUST_B_1D_ARRAY_V2B16_CLAMP_R:
		return NVPTX::SUST_B_1D_ARRAY_V2B16_CLAMP_I;
		case NVPTX::SUST_B_1D_ARRAY_V2B32_CLAMP_R:
		return NVPTX::SUST_B_1D_ARRAY_V2B32_CLAMP_I;
		case NVPTX::SUST_B_1D_ARRAY_V2B64_CLAMP_R:
		return NVPTX::SUST_B_1D_ARRAY_V2B64_CLAMP_I;
		case NVPTX::SUST_B_1D_ARRAY_V4B8_CLAMP_R:
		return NVPTX::SUST_B_1D_ARRAY_V4B8_CLAMP_I;
		case NVPTX::SUST_B_1D_ARRAY_V4B16_CLAMP_R:
		return NVPTX::SUST_B_1D_ARRAY_V4B16_CLAMP_I;
		case NVPTX::SUST_B_1D_ARRAY_V4B32_CLAMP_R:
		return NVPTX::SUST_B_1D_ARRAY_V4B32_CLAMP_I;
		case NVPTX::SUST_B_2D_B8_CLAMP_R:
		return NVPTX::SUST_B_2D_B8_CLAMP_I;
		case NVPTX::SUST_B_2D_B16_CLAMP_R:
		return NVPTX::SUST_B_2D_B16_CLAMP_I;
		case NVPTX::SUST_B_2D_B32_CLAMP_R:
		return NVPTX::SUST_B_2D_B32_CLAMP_I;
		case NVPTX::SUST_B_2D_B64_CLAMP_R:
		return NVPTX::SUST_B_2D_B64_CLAMP_I;
		case NVPTX::SUST_B_2D_V2B8_CLAMP_R:
		return NVPTX::SUST_B_2D_V2B8_CLAMP_I;
		case NVPTX::SUST_B_2D_V2B16_CLAMP_R:
		return NVPTX::SUST_B_2D_V2B16_CLAMP_I;
		case NVPTX::SUST_B_2D_V2B32_CLAMP_R:
		return NVPTX::SUST_B_2D_V2B32_CLAMP_I;
		case NVPTX::SUST_B_2D_V2B64_CLAMP_R:
		return NVPTX::SUST_B_2D_V2B64_CLAMP_I;
		case NVPTX::SUST_B_2D_V4B8_CLAMP_R:
		return NVPTX::SUST_B_2D_V4B8_CLAMP_I;
		case NVPTX::SUST_B_2D_V4B16_CLAMP_R:
		return NVPTX::SUST_B_2D_V4B16_CLAMP_I;
		case NVPTX::SUST_B_2D_V4B32_CLAMP_R:
		return NVPTX::SUST_B_2D_V4B32_CLAMP_I;
		case NVPTX::SUST_B_2D_ARRAY_B8_CLAMP_R:
		return NVPTX::SUST_B_2D_ARRAY_B8_CLAMP_I;
		case NVPTX::SUST_B_2D_ARRAY_B16_CLAMP_R:
		return NVPTX::SUST_B_2D_ARRAY_B16_CLAMP_I;
		case NVPTX::SUST_B_2D_ARRAY_B32_CLAMP_R:
		return NVPTX::SUST_B_2D_ARRAY_B32_CLAMP_I;
		case NVPTX::SUST_B_2D_ARRAY_B64_CLAMP_R:
		return NVPTX::SUST_B_2D_ARRAY_B64_CLAMP_I;
		case NVPTX::SUST_B_2D_ARRAY_V2B8_CLAMP_R:
		return NVPTX::SUST_B_2D_ARRAY_V2B8_CLAMP_I;
		case NVPTX::SUST_B_2D_ARRAY_V2B16_CLAMP_R:
		return NVPTX::SUST_B_2D_ARRAY_V2B16_CLAMP_I;
		case NVPTX::SUST_B_2D_ARRAY_V2B32_CLAMP_R:
		return NVPTX::SUST_B_2D_ARRAY_V2B32_CLAMP_I;
		case NVPTX::SUST_B_2D_ARRAY_V2B64_CLAMP_R:
		return NVPTX::SUST_B_2D_ARRAY_V2B64_CLAMP_I;
		case NVPTX::SUST_B_2D_ARRAY_V4B8_CLAMP_R:
		return NVPTX::SUST_B_2D_ARRAY_V4B8_CLAMP_I;
		case NVPTX::SUST_B_2D_ARRAY_V4B16_CLAMP_R:
		return NVPTX::SUST_B_2D_ARRAY_V4B16_CLAMP_I;
		case NVPTX::SUST_B_2D_ARRAY_V4B32_CLAMP_R:
		return NVPTX::SUST_B_2D_ARRAY_V4B32_CLAMP_I;
		case NVPTX::SUST_B_3D_B8_CLAMP_R:
		return NVPTX::SUST_B_3D_B8_CLAMP_I;
		case NVPTX::SUST_B_3D_B16_CLAMP_R:
		return NVPTX::SUST_B_3D_B16_CLAMP_I;
		case NVPTX::SUST_B_3D_B32_CLAMP_R:
		return NVPTX::SUST_B_3D_B32_CLAMP_I;
		case NVPTX::SUST_B_3D_B64_CLAMP_R:
		return NVPTX::SUST_B_3D_B64_CLAMP_I;
		case NVPTX::SUST_B_3D_V2B8_CLAMP_R:
		return NVPTX::SUST_B_3D_V2B8_CLAMP_I;
		case NVPTX::SUST_B_3D_V2B16_CLAMP_R:
		return NVPTX::SUST_B_3D_V2B16_CLAMP_I;
		case NVPTX::SUST_B_3D_V2B32_CLAMP_R:
		return NVPTX::SUST_B_3D_V2B32_CLAMP_I;
		case NVPTX::SUST_B_3D_V2B64_CLAMP_R:
		return NVPTX::SUST_B_3D_V2B64_CLAMP_I;
		case NVPTX::SUST_B_3D_V4B8_CLAMP_R:
		return NVPTX::SUST_B_3D_V4B8_CLAMP_I;
		case NVPTX::SUST_B_3D_V4B16_CLAMP_R:
		return NVPTX::SUST_B_3D_V4B16_CLAMP_I;
		case NVPTX::SUST_B_3D_V4B32_CLAMP_R:
		return NVPTX::SUST_B_3D_V4B32_CLAMP_I;
		case NVPTX::SUST_B_1D_B8_TRAP_R:
		return NVPTX::SUST_B_1D_B8_TRAP_I;
		case NVPTX::SUST_B_1D_B16_TRAP_R:
		return NVPTX::SUST_B_1D_B16_TRAP_I;
		case NVPTX::SUST_B_1D_B32_TRAP_R:
		return NVPTX::SUST_B_1D_B32_TRAP_I;
		case NVPTX::SUST_B_1D_B64_TRAP_R:
		return NVPTX::SUST_B_1D_B64_TRAP_I;
		case NVPTX::SUST_B_1D_V2B8_TRAP_R:
		return NVPTX::SUST_B_1D_V2B8_TRAP_I;
		case NVPTX::SUST_B_1D_V2B16_TRAP_R:
		return NVPTX::SUST_B_1D_V2B16_TRAP_I;
		case NVPTX::SUST_B_1D_V2B32_TRAP_R:
		return NVPTX::SUST_B_1D_V2B32_TRAP_I;
		case NVPTX::SUST_B_1D_V2B64_TRAP_R:
		return NVPTX::SUST_B_1D_V2B64_TRAP_I;
		case NVPTX::SUST_B_1D_V4B8_TRAP_R:
		return NVPTX::SUST_B_1D_V4B8_TRAP_I;
		case NVPTX::SUST_B_1D_V4B16_TRAP_R:
		return NVPTX::SUST_B_1D_V4B16_TRAP_I;
		case NVPTX::SUST_B_1D_V4B32_TRAP_R:
		return NVPTX::SUST_B_1D_V4B32_TRAP_I;
		case NVPTX::SUST_B_1D_ARRAY_B8_TRAP_R:
		return NVPTX::SUST_B_1D_ARRAY_B8_TRAP_I;
		case NVPTX::SUST_B_1D_ARRAY_B16_TRAP_R:
		return NVPTX::SUST_B_1D_ARRAY_B16_TRAP_I;
		case NVPTX::SUST_B_1D_ARRAY_B32_TRAP_R:
		return NVPTX::SUST_B_1D_ARRAY_B32_TRAP_I;
		case NVPTX::SUST_B_1D_ARRAY_B64_TRAP_R:
		return NVPTX::SUST_B_1D_ARRAY_B64_TRAP_I;
		case NVPTX::SUST_B_1D_ARRAY_V2B8_TRAP_R:
		return NVPTX::SUST_B_1D_ARRAY_V2B8_TRAP_I;
		case NVPTX::SUST_B_1D_ARRAY_V2B16_TRAP_R:
		return NVPTX::SUST_B_1D_ARRAY_V2B16_TRAP_I;
		case NVPTX::SUST_B_1D_ARRAY_V2B32_TRAP_R:
		return NVPTX::SUST_B_1D_ARRAY_V2B32_TRAP_I;
		case NVPTX::SUST_B_1D_ARRAY_V2B64_TRAP_R:
		return NVPTX::SUST_B_1D_ARRAY_V2B64_TRAP_I;
		case NVPTX::SUST_B_1D_ARRAY_V4B8_TRAP_R:
		return NVPTX::SUST_B_1D_ARRAY_V4B8_TRAP_I;
		case NVPTX::SUST_B_1D_ARRAY_V4B16_TRAP_R:
		return NVPTX::SUST_B_1D_ARRAY_V4B16_TRAP_I;
		case NVPTX::SUST_B_1D_ARRAY_V4B32_TRAP_R:
		return NVPTX::SUST_B_1D_ARRAY_V4B32_TRAP_I;
		case NVPTX::SUST_B_2D_B8_TRAP_R:
		return NVPTX::SUST_B_2D_B8_TRAP_I;
		case NVPTX::SUST_B_2D_B16_TRAP_R:
		return NVPTX::SUST_B_2D_B16_TRAP_I;
		case NVPTX::SUST_B_2D_B32_TRAP_R:
		return NVPTX::SUST_B_2D_B32_TRAP_I;
		case NVPTX::SUST_B_2D_B64_TRAP_R:
		return NVPTX::SUST_B_2D_B64_TRAP_I;
		case NVPTX::SUST_B_2D_V2B8_TRAP_R:
		return NVPTX::SUST_B_2D_V2B8_TRAP_I;
		case NVPTX::SUST_B_2D_V2B16_TRAP_R:
		return NVPTX::SUST_B_2D_V2B16_TRAP_I;
		case NVPTX::SUST_B_2D_V2B32_TRAP_R:
		return NVPTX::SUST_B_2D_V2B32_TRAP_I;
		case NVPTX::SUST_B_2D_V2B64_TRAP_R:
		return NVPTX::SUST_B_2D_V2B64_TRAP_I;
		case NVPTX::SUST_B_2D_V4B8_TRAP_R:
		return NVPTX::SUST_B_2D_V4B8_TRAP_I;
		case NVPTX::SUST_B_2D_V4B16_TRAP_R:
		return NVPTX::SUST_B_2D_V4B16_TRAP_I;
		case NVPTX::SUST_B_2D_V4B32_TRAP_R:
		return NVPTX::SUST_B_2D_V4B32_TRAP_I;
		case NVPTX::SUST_B_2D_ARRAY_B8_TRAP_R:
		return NVPTX::SUST_B_2D_ARRAY_B8_TRAP_I;
		case NVPTX::SUST_B_2D_ARRAY_B16_TRAP_R:
		return NVPTX::SUST_B_2D_ARRAY_B16_TRAP_I;
		case NVPTX::SUST_B_2D_ARRAY_B32_TRAP_R:
		return NVPTX::SUST_B_2D_ARRAY_B32_TRAP_I;
		case NVPTX::SUST_B_2D_ARRAY_B64_TRAP_R:
		return NVPTX::SUST_B_2D_ARRAY_B64_TRAP_I;
		case NVPTX::SUST_B_2D_ARRAY_V2B8_TRAP_R:
		return NVPTX::SUST_B_2D_ARRAY_V2B8_TRAP_I;
		case NVPTX::SUST_B_2D_ARRAY_V2B16_TRAP_R:
		return NVPTX::SUST_B_2D_ARRAY_V2B16_TRAP_I;
		case NVPTX::SUST_B_2D_ARRAY_V2B32_TRAP_R:
		return NVPTX::SUST_B_2D_ARRAY_V2B32_TRAP_I;
		case NVPTX::SUST_B_2D_ARRAY_V2B64_TRAP_R:
		return NVPTX::SUST_B_2D_ARRAY_V2B64_TRAP_I;
		case NVPTX::SUST_B_2D_ARRAY_V4B8_TRAP_R:
		return NVPTX::SUST_B_2D_ARRAY_V4B8_TRAP_I;
		case NVPTX::SUST_B_2D_ARRAY_V4B16_TRAP_R:
		return NVPTX::SUST_B_2D_ARRAY_V4B16_TRAP_I;
		case NVPTX::SUST_B_2D_ARRAY_V4B32_TRAP_R:
		return NVPTX::SUST_B_2D_ARRAY_V4B32_TRAP_I;
		case NVPTX::SUST_B_3D_B8_TRAP_R:
		return NVPTX::SUST_B_3D_B8_TRAP_I;
		case NVPTX::SUST_B_3D_B16_TRAP_R:
		return NVPTX::SUST_B_3D_B16_TRAP_I;
		case NVPTX::SUST_B_3D_B32_TRAP_R:
		return NVPTX::SUST_B_3D_B32_TRAP_I;
		case NVPTX::SUST_B_3D_B64_TRAP_R:
		return NVPTX::SUST_B_3D_B64_TRAP_I;
		case NVPTX::SUST_B_3D_V2B8_TRAP_R:
		return NVPTX::SUST_B_3D_V2B8_TRAP_I;
		case NVPTX::SUST_B_3D_V2B16_TRAP_R:
		return NVPTX::SUST_B_3D_V2B16_TRAP_I;
		case NVPTX::SUST_B_3D_V2B32_TRAP_R:
		return NVPTX::SUST_B_3D_V2B32_TRAP_I;
		case NVPTX::SUST_B_3D_V2B64_TRAP_R:
		return NVPTX::SUST_B_3D_V2B64_TRAP_I;
		case NVPTX::SUST_B_3D_V4B8_TRAP_R:
		return NVPTX::SUST_B_3D_V4B8_TRAP_I;
		case NVPTX::SUST_B_3D_V4B16_TRAP_R:
		return NVPTX::SUST_B_3D_V4B16_TRAP_I;
		case NVPTX::SUST_B_3D_V4B32_TRAP_R:
		return NVPTX::SUST_B_3D_V4B32_TRAP_I;
		case NVPTX::SUST_B_1D_B8_ZERO_R:
		return NVPTX::SUST_B_1D_B8_ZERO_I;
		case NVPTX::SUST_B_1D_B16_ZERO_R:
		return NVPTX::SUST_B_1D_B16_ZERO_I;
		case NVPTX::SUST_B_1D_B32_ZERO_R:
		return NVPTX::SUST_B_1D_B32_ZERO_I;
		case NVPTX::SUST_B_1D_B64_ZERO_R:
		return NVPTX::SUST_B_1D_B64_ZERO_I;
		case NVPTX::SUST_B_1D_V2B8_ZERO_R:
		return NVPTX::SUST_B_1D_V2B8_ZERO_I;
		case NVPTX::SUST_B_1D_V2B16_ZERO_R:
		return NVPTX::SUST_B_1D_V2B16_ZERO_I;
		case NVPTX::SUST_B_1D_V2B32_ZERO_R:
		return NVPTX::SUST_B_1D_V2B32_ZERO_I;
		case NVPTX::SUST_B_1D_V2B64_ZERO_R:
		return NVPTX::SUST_B_1D_V2B64_ZERO_I;
		case NVPTX::SUST_B_1D_V4B8_ZERO_R:
		return NVPTX::SUST_B_1D_V4B8_ZERO_I;
		case NVPTX::SUST_B_1D_V4B16_ZERO_R:
		return NVPTX::SUST_B_1D_V4B16_ZERO_I;
		case NVPTX::SUST_B_1D_V4B32_ZERO_R:
		return NVPTX::SUST_B_1D_V4B32_ZERO_I;
		case NVPTX::SUST_B_1D_ARRAY_B8_ZERO_R:
		return NVPTX::SUST_B_1D_ARRAY_B8_ZERO_I;
		case NVPTX::SUST_B_1D_ARRAY_B16_ZERO_R:
		return NVPTX::SUST_B_1D_ARRAY_B16_ZERO_I;
		case NVPTX::SUST_B_1D_ARRAY_B32_ZERO_R:
		return NVPTX::SUST_B_1D_ARRAY_B32_ZERO_I;
		case NVPTX::SUST_B_1D_ARRAY_B64_ZERO_R:
		return NVPTX::SUST_B_1D_ARRAY_B64_ZERO_I;
		case NVPTX::SUST_B_1D_ARRAY_V2B8_ZERO_R:
		return NVPTX::SUST_B_1D_ARRAY_V2B8_ZERO_I;
		case NVPTX::SUST_B_1D_ARRAY_V2B16_ZERO_R:
		return NVPTX::SUST_B_1D_ARRAY_V2B16_ZERO_I;
		case NVPTX::SUST_B_1D_ARRAY_V2B32_ZERO_R:
		return NVPTX::SUST_B_1D_ARRAY_V2B32_ZERO_I;
		case NVPTX::SUST_B_1D_ARRAY_V2B64_ZERO_R:
		return NVPTX::SUST_B_1D_ARRAY_V2B64_ZERO_I;
		case NVPTX::SUST_B_1D_ARRAY_V4B8_ZERO_R:
		return NVPTX::SUST_B_1D_ARRAY_V4B8_ZERO_I;
		case NVPTX::SUST_B_1D_ARRAY_V4B16_ZERO_R:
		return NVPTX::SUST_B_1D_ARRAY_V4B16_ZERO_I;
		case NVPTX::SUST_B_1D_ARRAY_V4B32_ZERO_R:
		return NVPTX::SUST_B_1D_ARRAY_V4B32_ZERO_I;
		case NVPTX::SUST_B_2D_B8_ZERO_R:
		return NVPTX::SUST_B_2D_B8_ZERO_I;
		case NVPTX::SUST_B_2D_B16_ZERO_R:
		return NVPTX::SUST_B_2D_B16_ZERO_I;
		case NVPTX::SUST_B_2D_B32_ZERO_R:
		return NVPTX::SUST_B_2D_B32_ZERO_I;
		case NVPTX::SUST_B_2D_B64_ZERO_R:
		return NVPTX::SUST_B_2D_B64_ZERO_I;
		case NVPTX::SUST_B_2D_V2B8_ZERO_R:
		return NVPTX::SUST_B_2D_V2B8_ZERO_I;
		case NVPTX::SUST_B_2D_V2B16_ZERO_R:
		return NVPTX::SUST_B_2D_V2B16_ZERO_I;
		case NVPTX::SUST_B_2D_V2B32_ZERO_R:
		return NVPTX::SUST_B_2D_V2B32_ZERO_I;
		case NVPTX::SUST_B_2D_V2B64_ZERO_R:
		return NVPTX::SUST_B_2D_V2B64_ZERO_I;
		case NVPTX::SUST_B_2D_V4B8_ZERO_R:
		return NVPTX::SUST_B_2D_V4B8_ZERO_I;
		case NVPTX::SUST_B_2D_V4B16_ZERO_R:
		return NVPTX::SUST_B_2D_V4B16_ZERO_I;
		case NVPTX::SUST_B_2D_V4B32_ZERO_R:
		return NVPTX::SUST_B_2D_V4B32_ZERO_I;
		case NVPTX::SUST_B_2D_ARRAY_B8_ZERO_R:
		return NVPTX::SUST_B_2D_ARRAY_B8_ZERO_I;
		case NVPTX::SUST_B_2D_ARRAY_B16_ZERO_R:
		return NVPTX::SUST_B_2D_ARRAY_B16_ZERO_I;
		case NVPTX::SUST_B_2D_ARRAY_B32_ZERO_R:
		return NVPTX::SUST_B_2D_ARRAY_B32_ZERO_I;
		case NVPTX::SUST_B_2D_ARRAY_B64_ZERO_R:
		return NVPTX::SUST_B_2D_ARRAY_B64_ZERO_I;
		case NVPTX::SUST_B_2D_ARRAY_V2B8_ZERO_R:
		return NVPTX::SUST_B_2D_ARRAY_V2B8_ZERO_I;
		case NVPTX::SUST_B_2D_ARRAY_V2B16_ZERO_R:
		return NVPTX::SUST_B_2D_ARRAY_V2B16_ZERO_I;
		case NVPTX::SUST_B_2D_ARRAY_V2B32_ZERO_R:
		return NVPTX::SUST_B_2D_ARRAY_V2B32_ZERO_I;
		case NVPTX::SUST_B_2D_ARRAY_V2B64_ZERO_R:
		return NVPTX::SUST_B_2D_ARRAY_V2B64_ZERO_I;
		case NVPTX::SUST_B_2D_ARRAY_V4B8_ZERO_R:
		return NVPTX::SUST_B_2D_ARRAY_V4B8_ZERO_I;
		case NVPTX::SUST_B_2D_ARRAY_V4B16_ZERO_R:
		return NVPTX::SUST_B_2D_ARRAY_V4B16_ZERO_I;
		case NVPTX::SUST_B_2D_ARRAY_V4B32_ZERO_R:
		return NVPTX::SUST_B_2D_ARRAY_V4B32_ZERO_I;
		case NVPTX::SUST_B_3D_B8_ZERO_R:
		return NVPTX::SUST_B_3D_B8_ZERO_I;
		case NVPTX::SUST_B_3D_B16_ZERO_R:
		return NVPTX::SUST_B_3D_B16_ZERO_I;
		case NVPTX::SUST_B_3D_B32_ZERO_R:
		return NVPTX::SUST_B_3D_B32_ZERO_I;
		case NVPTX::SUST_B_3D_B64_ZERO_R:
		return NVPTX::SUST_B_3D_B64_ZERO_I;
		case NVPTX::SUST_B_3D_V2B8_ZERO_R:
		return NVPTX::SUST_B_3D_V2B8_ZERO_I;
		case NVPTX::SUST_B_3D_V2B16_ZERO_R:
		return NVPTX::SUST_B_3D_V2B16_ZERO_I;
		case NVPTX::SUST_B_3D_V2B32_ZERO_R:
		return NVPTX::SUST_B_3D_V2B32_ZERO_I;
		case NVPTX::SUST_B_3D_V2B64_ZERO_R:
		return NVPTX::SUST_B_3D_V2B64_ZERO_I;
		case NVPTX::SUST_B_3D_V4B8_ZERO_R:
		return NVPTX::SUST_B_3D_V4B8_ZERO_I;
		case NVPTX::SUST_B_3D_V4B16_ZERO_R:
		return NVPTX::SUST_B_3D_V4B16_ZERO_I;
		case NVPTX::SUST_B_3D_V4B32_ZERO_R:
		return NVPTX::SUST_B_3D_V4B32_ZERO_I;
		case NVPTX::SUST_P_1D_B8_TRAP_R:
		return NVPTX::SUST_P_1D_B8_TRAP_I;
		case NVPTX::SUST_P_1D_B16_TRAP_R:
		return NVPTX::SUST_P_1D_B16_TRAP_I;
		case NVPTX::SUST_P_1D_B32_TRAP_R:
		return NVPTX::SUST_P_1D_B32_TRAP_I;
		case NVPTX::SUST_P_1D_V2B8_TRAP_R:
		return NVPTX::SUST_P_1D_V2B8_TRAP_I;
		case NVPTX::SUST_P_1D_V2B16_TRAP_R:
		return NVPTX::SUST_P_1D_V2B16_TRAP_I;
		case NVPTX::SUST_P_1D_V2B32_TRAP_R:
		return NVPTX::SUST_P_1D_V2B32_TRAP_I;
		case NVPTX::SUST_P_1D_V4B8_TRAP_R:
		return NVPTX::SUST_P_1D_V4B8_TRAP_I;
		case NVPTX::SUST_P_1D_V4B16_TRAP_R:
		return NVPTX::SUST_P_1D_V4B16_TRAP_I;
		case NVPTX::SUST_P_1D_V4B32_TRAP_R:
		return NVPTX::SUST_P_1D_V4B32_TRAP_I;
		case NVPTX::SUST_P_1D_ARRAY_B8_TRAP_R:
		return NVPTX::SUST_P_1D_ARRAY_B8_TRAP_I;
		case NVPTX::SUST_P_1D_ARRAY_B16_TRAP_R:
		return NVPTX::SUST_P_1D_ARRAY_B16_TRAP_I;
		case NVPTX::SUST_P_1D_ARRAY_B32_TRAP_R:
		return NVPTX::SUST_P_1D_ARRAY_B32_TRAP_I;
		case NVPTX::SUST_P_1D_ARRAY_V2B8_TRAP_R:
		return NVPTX::SUST_P_1D_ARRAY_V2B8_TRAP_I;
		case NVPTX::SUST_P_1D_ARRAY_V2B16_TRAP_R:
		return NVPTX::SUST_P_1D_ARRAY_V2B16_TRAP_I;
		case NVPTX::SUST_P_1D_ARRAY_V2B32_TRAP_R:
		return NVPTX::SUST_P_1D_ARRAY_V2B32_TRAP_I;
		case NVPTX::SUST_P_1D_ARRAY_V4B8_TRAP_R:
		return NVPTX::SUST_P_1D_ARRAY_V4B8_TRAP_I;
		case NVPTX::SUST_P_1D_ARRAY_V4B16_TRAP_R:
		return NVPTX::SUST_P_1D_ARRAY_V4B16_TRAP_I;
		case NVPTX::SUST_P_1D_ARRAY_V4B32_TRAP_R:
		return NVPTX::SUST_P_1D_ARRAY_V4B32_TRAP_I;
		case NVPTX::SUST_P_2D_B8_TRAP_R:
		return NVPTX::SUST_P_2D_B8_TRAP_I;
		case NVPTX::SUST_P_2D_B16_TRAP_R:
		return NVPTX::SUST_P_2D_B16_TRAP_I;
		case NVPTX::SUST_P_2D_B32_TRAP_R:
		return NVPTX::SUST_P_2D_B32_TRAP_I;
		case NVPTX::SUST_P_2D_V2B8_TRAP_R:
		return NVPTX::SUST_P_2D_V2B8_TRAP_I;
		case NVPTX::SUST_P_2D_V2B16_TRAP_R:
		return NVPTX::SUST_P_2D_V2B16_TRAP_I;
		case NVPTX::SUST_P_2D_V2B32_TRAP_R:
		return NVPTX::SUST_P_2D_V2B32_TRAP_I;
		case NVPTX::SUST_P_2D_V4B8_TRAP_R:
		return NVPTX::SUST_P_2D_V4B8_TRAP_I;
		case NVPTX::SUST_P_2D_V4B16_TRAP_R:
		return NVPTX::SUST_P_2D_V4B16_TRAP_I;
		case NVPTX::SUST_P_2D_V4B32_TRAP_R:
		return NVPTX::SUST_P_2D_V4B32_TRAP_I;
		case NVPTX::SUST_P_2D_ARRAY_B8_TRAP_R:
		return NVPTX::SUST_P_2D_ARRAY_B8_TRAP_I;
		case NVPTX::SUST_P_2D_ARRAY_B16_TRAP_R:
		return NVPTX::SUST_P_2D_ARRAY_B16_TRAP_I;
		case NVPTX::SUST_P_2D_ARRAY_B32_TRAP_R:
		return NVPTX::SUST_P_2D_ARRAY_B32_TRAP_I;
		case NVPTX::SUST_P_2D_ARRAY_V2B8_TRAP_R:
		return NVPTX::SUST_P_2D_ARRAY_V2B8_TRAP_I;
		case NVPTX::SUST_P_2D_ARRAY_V2B16_TRAP_R:
		return NVPTX::SUST_P_2D_ARRAY_V2B16_TRAP_I;
		case NVPTX::SUST_P_2D_ARRAY_V2B32_TRAP_R:
		return NVPTX::SUST_P_2D_ARRAY_V2B32_TRAP_I;
		case NVPTX::SUST_P_2D_ARRAY_V4B8_TRAP_R:
		return NVPTX::SUST_P_2D_ARRAY_V4B8_TRAP_I;
		case NVPTX::SUST_P_2D_ARRAY_V4B16_TRAP_R:
		return NVPTX::SUST_P_2D_ARRAY_V4B16_TRAP_I;
		case NVPTX::SUST_P_2D_ARRAY_V4B32_TRAP_R:
		return NVPTX::SUST_P_2D_ARRAY_V4B32_TRAP_I;
		case NVPTX::SUST_P_3D_B8_TRAP_R:
		return NVPTX::SUST_P_3D_B8_TRAP_I;
		case NVPTX::SUST_P_3D_B16_TRAP_R:
		return NVPTX::SUST_P_3D_B16_TRAP_I;
		case NVPTX::SUST_P_3D_B32_TRAP_R:
		return NVPTX::SUST_P_3D_B32_TRAP_I;
		case NVPTX::SUST_P_3D_V2B8_TRAP_R:
		return NVPTX::SUST_P_3D_V2B8_TRAP_I;
		case NVPTX::SUST_P_3D_V2B16_TRAP_R:
		return NVPTX::SUST_P_3D_V2B16_TRAP_I;
		case NVPTX::SUST_P_3D_V2B32_TRAP_R:
		return NVPTX::SUST_P_3D_V2B32_TRAP_I;
		case NVPTX::SUST_P_3D_V4B8_TRAP_R:
		return NVPTX::SUST_P_3D_V4B8_TRAP_I;
		case NVPTX::SUST_P_3D_V4B16_TRAP_R:
		return NVPTX::SUST_P_3D_V4B16_TRAP_I;
		case NVPTX::SUST_P_3D_V4B32_TRAP_R:
		return NVPTX::SUST_P_3D_V4B32_TRAP_I;
		default:
		llvm_unreachable("Unhandled SUST opcode");
		}
		}

		static unsigned texRegisterToIndexOpcode(unsigned RegOC) {
		switch (RegOC) {
		case NVPTX::TEX_1D_F32_S32_RR:
		return NVPTX::TEX_1D_F32_S32_IR;
		case NVPTX::TEX_1D_F32_S32_RI:
		return NVPTX::TEX_1D_F32_S32_II;
		case NVPTX::TEX_1D_F32_F32_RR:
		return NVPTX::TEX_1D_F32_F32_IR;
		case NVPTX::TEX_1D_F32_F32_RI:
		return NVPTX::TEX_1D_F32_F32_II;
		case NVPTX::TEX_1D_F32_F32_LEVEL_RR:
		return NVPTX::TEX_1D_F32_F32_LEVEL_IR;
		case NVPTX::TEX_1D_F32_F32_LEVEL_RI:
		return NVPTX::TEX_1D_F32_F32_LEVEL_II;
		case NVPTX::TEX_1D_F32_F32_GRAD_RR:
		return NVPTX::TEX_1D_F32_F32_GRAD_IR;
		case NVPTX::TEX_1D_F32_F32_GRAD_RI:
		return NVPTX::TEX_1D_F32_F32_GRAD_II;
		case NVPTX::TEX_1D_S32_S32_RR:
		return NVPTX::TEX_1D_S32_S32_IR;
		case NVPTX::TEX_1D_S32_S32_RI:
		return NVPTX::TEX_1D_S32_S32_II;
		case NVPTX::TEX_1D_S32_F32_RR:
		return NVPTX::TEX_1D_S32_F32_IR;
		case NVPTX::TEX_1D_S32_F32_RI:
		return NVPTX::TEX_1D_S32_F32_II;
		case NVPTX::TEX_1D_S32_F32_LEVEL_RR:
		return NVPTX::TEX_1D_S32_F32_LEVEL_IR;
		case NVPTX::TEX_1D_S32_F32_LEVEL_RI:
		return NVPTX::TEX_1D_S32_F32_LEVEL_II;
		case NVPTX::TEX_1D_S32_F32_GRAD_RR:
		return NVPTX::TEX_1D_S32_F32_GRAD_IR;
		case NVPTX::TEX_1D_S32_F32_GRAD_RI:
		return NVPTX::TEX_1D_S32_F32_GRAD_II;
		case NVPTX::TEX_1D_U32_S32_RR:
		return NVPTX::TEX_1D_U32_S32_IR;
		case NVPTX::TEX_1D_U32_S32_RI:
		return NVPTX::TEX_1D_U32_S32_II;
		case NVPTX::TEX_1D_U32_F32_RR:
		return NVPTX::TEX_1D_U32_F32_IR;
		case NVPTX::TEX_1D_U32_F32_RI:
		return NVPTX::TEX_1D_U32_F32_II;
		case NVPTX::TEX_1D_U32_F32_LEVEL_RR:
		return NVPTX::TEX_1D_U32_F32_LEVEL_IR;
		case NVPTX::TEX_1D_U32_F32_LEVEL_RI:
		return NVPTX::TEX_1D_U32_F32_LEVEL_II;
		case NVPTX::TEX_1D_U32_F32_GRAD_RR:
		return NVPTX::TEX_1D_U32_F32_GRAD_IR;
		case NVPTX::TEX_1D_U32_F32_GRAD_RI:
		return NVPTX::TEX_1D_U32_F32_GRAD_II;
		case NVPTX::TEX_1D_ARRAY_F32_S32_RR:
		return NVPTX::TEX_1D_ARRAY_F32_S32_IR;
		case NVPTX::TEX_1D_ARRAY_F32_S32_RI:
		return NVPTX::TEX_1D_ARRAY_F32_S32_II;
		case NVPTX::TEX_1D_ARRAY_F32_F32_RR:
		return NVPTX::TEX_1D_ARRAY_F32_F32_IR;
		case NVPTX::TEX_1D_ARRAY_F32_F32_RI:
		return NVPTX::TEX_1D_ARRAY_F32_F32_II;
		case NVPTX::TEX_1D_ARRAY_F32_F32_LEVEL_RR:
		return NVPTX::TEX_1D_ARRAY_F32_F32_LEVEL_IR;
		case NVPTX::TEX_1D_ARRAY_F32_F32_LEVEL_RI:
		return NVPTX::TEX_1D_ARRAY_F32_F32_LEVEL_II;
		case NVPTX::TEX_1D_ARRAY_F32_F32_GRAD_RR:
		return NVPTX::TEX_1D_ARRAY_F32_F32_GRAD_IR;
		case NVPTX::TEX_1D_ARRAY_F32_F32_GRAD_RI:
		return NVPTX::TEX_1D_ARRAY_F32_F32_GRAD_II;
		case NVPTX::TEX_1D_ARRAY_S32_S32_RR:
		return NVPTX::TEX_1D_ARRAY_S32_S32_IR;
		case NVPTX::TEX_1D_ARRAY_S32_S32_RI:
		return NVPTX::TEX_1D_ARRAY_S32_S32_II;
		case NVPTX::TEX_1D_ARRAY_S32_F32_RR:
		return NVPTX::TEX_1D_ARRAY_S32_F32_IR;
		case NVPTX::TEX_1D_ARRAY_S32_F32_RI:
		return NVPTX::TEX_1D_ARRAY_S32_F32_II;
		case NVPTX::TEX_1D_ARRAY_S32_F32_LEVEL_RR:
		return NVPTX::TEX_1D_ARRAY_S32_F32_LEVEL_IR;
		case NVPTX::TEX_1D_ARRAY_S32_F32_LEVEL_RI:
		return NVPTX::TEX_1D_ARRAY_S32_F32_LEVEL_II;
		case NVPTX::TEX_1D_ARRAY_S32_F32_GRAD_RR:
		return NVPTX::TEX_1D_ARRAY_S32_F32_GRAD_IR;
		case NVPTX::TEX_1D_ARRAY_S32_F32_GRAD_RI:
		return NVPTX::TEX_1D_ARRAY_S32_F32_GRAD_II;
		case NVPTX::TEX_1D_ARRAY_U32_S32_RR:
		return NVPTX::TEX_1D_ARRAY_U32_S32_IR;
		case NVPTX::TEX_1D_ARRAY_U32_S32_RI:
		return NVPTX::TEX_1D_ARRAY_U32_S32_II;
		case NVPTX::TEX_1D_ARRAY_U32_F32_RR:
		return NVPTX::TEX_1D_ARRAY_U32_F32_IR;
		case NVPTX::TEX_1D_ARRAY_U32_F32_RI:
		return NVPTX::TEX_1D_ARRAY_U32_F32_II;
		case NVPTX::TEX_1D_ARRAY_U32_F32_LEVEL_RR:
		return NVPTX::TEX_1D_ARRAY_U32_F32_LEVEL_IR;
		case NVPTX::TEX_1D_ARRAY_U32_F32_LEVEL_RI:
		return NVPTX::TEX_1D_ARRAY_U32_F32_LEVEL_II;
		case NVPTX::TEX_1D_ARRAY_U32_F32_GRAD_RR:
		return NVPTX::TEX_1D_ARRAY_U32_F32_GRAD_IR;
		case NVPTX::TEX_1D_ARRAY_U32_F32_GRAD_RI:
		return NVPTX::TEX_1D_ARRAY_U32_F32_GRAD_II;
		case NVPTX::TEX_2D_F32_S32_RR:
		return NVPTX::TEX_2D_F32_S32_IR;
		case NVPTX::TEX_2D_F32_S32_RI:
		return NVPTX::TEX_2D_F32_S32_II;
		case NVPTX::TEX_2D_F32_F32_RR:
		return NVPTX::TEX_2D_F32_F32_IR;
		case NVPTX::TEX_2D_F32_F32_RI:
		return NVPTX::TEX_2D_F32_F32_II;
		case NVPTX::TEX_2D_F32_F32_LEVEL_RR:
		return NVPTX::TEX_2D_F32_F32_LEVEL_IR;
		case NVPTX::TEX_2D_F32_F32_LEVEL_RI:
		return NVPTX::TEX_2D_F32_F32_LEVEL_II;
		case NVPTX::TEX_2D_F32_F32_GRAD_RR:
		return NVPTX::TEX_2D_F32_F32_GRAD_IR;
		case NVPTX::TEX_2D_F32_F32_GRAD_RI:
		return NVPTX::TEX_2D_F32_F32_GRAD_II;
		case NVPTX::TEX_2D_S32_S32_RR:
		return NVPTX::TEX_2D_S32_S32_IR;
		case NVPTX::TEX_2D_S32_S32_RI:
		return NVPTX::TEX_2D_S32_S32_II;
		case NVPTX::TEX_2D_S32_F32_RR:
		return NVPTX::TEX_2D_S32_F32_IR;
		case NVPTX::TEX_2D_S32_F32_RI:
		return NVPTX::TEX_2D_S32_F32_II;
		case NVPTX::TEX_2D_S32_F32_LEVEL_RR:
		return NVPTX::TEX_2D_S32_F32_LEVEL_IR;
		case NVPTX::TEX_2D_S32_F32_LEVEL_RI:
		return NVPTX::TEX_2D_S32_F32_LEVEL_II;
		case NVPTX::TEX_2D_S32_F32_GRAD_RR:
		return NVPTX::TEX_2D_S32_F32_GRAD_IR;
		case NVPTX::TEX_2D_S32_F32_GRAD_RI:
		return NVPTX::TEX_2D_S32_F32_GRAD_II;
		case NVPTX::TEX_2D_U32_S32_RR:
		return NVPTX::TEX_2D_U32_S32_IR;
		case NVPTX::TEX_2D_U32_S32_RI:
		return NVPTX::TEX_2D_U32_S32_II;
		case NVPTX::TEX_2D_U32_F32_RR:
		return NVPTX::TEX_2D_U32_F32_IR;
		case NVPTX::TEX_2D_U32_F32_RI:
		return NVPTX::TEX_2D_U32_F32_II;
		case NVPTX::TEX_2D_U32_F32_LEVEL_RR:
		return NVPTX::TEX_2D_U32_F32_LEVEL_IR;
		case NVPTX::TEX_2D_U32_F32_LEVEL_RI:
		return NVPTX::TEX_2D_U32_F32_LEVEL_II;
		case NVPTX::TEX_2D_U32_F32_GRAD_RR:
		return NVPTX::TEX_2D_U32_F32_GRAD_IR;
		case NVPTX::TEX_2D_U32_F32_GRAD_RI:
		return NVPTX::TEX_2D_U32_F32_GRAD_II;
		case NVPTX::TEX_2D_ARRAY_F32_S32_RR:
		return NVPTX::TEX_2D_ARRAY_F32_S32_IR;
		case NVPTX::TEX_2D_ARRAY_F32_S32_RI:
		return NVPTX::TEX_2D_ARRAY_F32_S32_II;
		case NVPTX::TEX_2D_ARRAY_F32_F32_RR:
		return NVPTX::TEX_2D_ARRAY_F32_F32_IR;
		case NVPTX::TEX_2D_ARRAY_F32_F32_RI:
		return NVPTX::TEX_2D_ARRAY_F32_F32_II;
		case NVPTX::TEX_2D_ARRAY_F32_F32_LEVEL_RR:
		return NVPTX::TEX_2D_ARRAY_F32_F32_LEVEL_IR;
		case NVPTX::TEX_2D_ARRAY_F32_F32_LEVEL_RI:
		return NVPTX::TEX_2D_ARRAY_F32_F32_LEVEL_II;
		case NVPTX::TEX_2D_ARRAY_F32_F32_GRAD_RR:
		return NVPTX::TEX_2D_ARRAY_F32_F32_GRAD_IR;
		case NVPTX::TEX_2D_ARRAY_F32_F32_GRAD_RI:
		return NVPTX::TEX_2D_ARRAY_F32_F32_GRAD_II;
		case NVPTX::TEX_2D_ARRAY_S32_S32_RR:
		return NVPTX::TEX_2D_ARRAY_S32_S32_IR;
		case NVPTX::TEX_2D_ARRAY_S32_S32_RI:
		return NVPTX::TEX_2D_ARRAY_S32_S32_II;
		case NVPTX::TEX_2D_ARRAY_S32_F32_RR:
		return NVPTX::TEX_2D_ARRAY_S32_F32_IR;
		case NVPTX::TEX_2D_ARRAY_S32_F32_RI:
		return NVPTX::TEX_2D_ARRAY_S32_F32_II;
		case NVPTX::TEX_2D_ARRAY_S32_F32_LEVEL_RR:
		return NVPTX::TEX_2D_ARRAY_S32_F32_LEVEL_IR;
		case NVPTX::TEX_2D_ARRAY_S32_F32_LEVEL_RI:
		return NVPTX::TEX_2D_ARRAY_S32_F32_LEVEL_II;
		case NVPTX::TEX_2D_ARRAY_S32_F32_GRAD_RR:
		return NVPTX::TEX_2D_ARRAY_S32_F32_GRAD_IR;
		case NVPTX::TEX_2D_ARRAY_S32_F32_GRAD_RI:
		return NVPTX::TEX_2D_ARRAY_S32_F32_GRAD_II;
		case NVPTX::TEX_2D_ARRAY_U32_S32_RR:
		return NVPTX::TEX_2D_ARRAY_U32_S32_IR;
		case NVPTX::TEX_2D_ARRAY_U32_S32_RI:
		return NVPTX::TEX_2D_ARRAY_U32_S32_II;
		case NVPTX::TEX_2D_ARRAY_U32_F32_RR:
		return NVPTX::TEX_2D_ARRAY_U32_F32_IR;
		case NVPTX::TEX_2D_ARRAY_U32_F32_RI:
		return NVPTX::TEX_2D_ARRAY_U32_F32_II;
		case NVPTX::TEX_2D_ARRAY_U32_F32_LEVEL_RR:
		return NVPTX::TEX_2D_ARRAY_U32_F32_LEVEL_IR;
		case NVPTX::TEX_2D_ARRAY_U32_F32_LEVEL_RI:
		return NVPTX::TEX_2D_ARRAY_U32_F32_LEVEL_II;
		case NVPTX::TEX_2D_ARRAY_U32_F32_GRAD_RR:
		return NVPTX::TEX_2D_ARRAY_U32_F32_GRAD_IR;
		case NVPTX::TEX_2D_ARRAY_U32_F32_GRAD_RI:
		return NVPTX::TEX_2D_ARRAY_U32_F32_GRAD_II;
		case NVPTX::TEX_3D_F32_S32_RR:
		return NVPTX::TEX_3D_F32_S32_IR;
		case NVPTX::TEX_3D_F32_S32_RI:
		return NVPTX::TEX_3D_F32_S32_II;
		case NVPTX::TEX_3D_F32_F32_RR:
		return NVPTX::TEX_3D_F32_F32_IR;
		case NVPTX::TEX_3D_F32_F32_RI:
		return NVPTX::TEX_3D_F32_F32_II;
		case NVPTX::TEX_3D_F32_F32_LEVEL_RR:
		return NVPTX::TEX_3D_F32_F32_LEVEL_IR;
		case NVPTX::TEX_3D_F32_F32_LEVEL_RI:
		return NVPTX::TEX_3D_F32_F32_LEVEL_II;
		case NVPTX::TEX_3D_F32_F32_GRAD_RR:
		return NVPTX::TEX_3D_F32_F32_GRAD_IR;
		case NVPTX::TEX_3D_F32_F32_GRAD_RI:
		return NVPTX::TEX_3D_F32_F32_GRAD_II;
		case NVPTX::TEX_3D_S32_S32_RR:
		return NVPTX::TEX_3D_S32_S32_IR;
		case NVPTX::TEX_3D_S32_S32_RI:
		return NVPTX::TEX_3D_S32_S32_II;
		case NVPTX::TEX_3D_S32_F32_RR:
		return NVPTX::TEX_3D_S32_F32_IR;
		case NVPTX::TEX_3D_S32_F32_RI:
		return NVPTX::TEX_3D_S32_F32_II;
		case NVPTX::TEX_3D_S32_F32_LEVEL_RR:
		return NVPTX::TEX_3D_S32_F32_LEVEL_IR;
		case NVPTX::TEX_3D_S32_F32_LEVEL_RI:
		return NVPTX::TEX_3D_S32_F32_LEVEL_II;
		case NVPTX::TEX_3D_S32_F32_GRAD_RR:
		return NVPTX::TEX_3D_S32_F32_GRAD_IR;
		case NVPTX::TEX_3D_S32_F32_GRAD_RI:
		return NVPTX::TEX_3D_S32_F32_GRAD_II;
		case NVPTX::TEX_3D_U32_S32_RR:
		return NVPTX::TEX_3D_U32_S32_IR;
		case NVPTX::TEX_3D_U32_S32_RI:
		return NVPTX::TEX_3D_U32_S32_II;
		case NVPTX::TEX_3D_U32_F32_RR:
		return NVPTX::TEX_3D_U32_F32_IR;
		case NVPTX::TEX_3D_U32_F32_RI:
		return NVPTX::TEX_3D_U32_F32_II;
		case NVPTX::TEX_3D_U32_F32_LEVEL_RR:
		return NVPTX::TEX_3D_U32_F32_LEVEL_IR;
		case NVPTX::TEX_3D_U32_F32_LEVEL_RI:
		return NVPTX::TEX_3D_U32_F32_LEVEL_II;
		case NVPTX::TEX_3D_U32_F32_GRAD_RR:
		return NVPTX::TEX_3D_U32_F32_GRAD_IR;
		case NVPTX::TEX_3D_U32_F32_GRAD_RI:
		return NVPTX::TEX_3D_U32_F32_GRAD_II;
		case NVPTX::TEX_CUBE_F32_F32_RR:
		return NVPTX::TEX_CUBE_F32_F32_IR;
		case NVPTX::TEX_CUBE_F32_F32_RI:
		return NVPTX::TEX_CUBE_F32_F32_II;
		case NVPTX::TEX_CUBE_F32_F32_LEVEL_RR:
		return NVPTX::TEX_CUBE_F32_F32_LEVEL_IR;
		case NVPTX::TEX_CUBE_F32_F32_LEVEL_RI:
		return NVPTX::TEX_CUBE_F32_F32_LEVEL_II;
		case NVPTX::TEX_CUBE_S32_F32_RR:
		return NVPTX::TEX_CUBE_S32_F32_IR;
		case NVPTX::TEX_CUBE_S32_F32_RI:
		return NVPTX::TEX_CUBE_S32_F32_II;
		case NVPTX::TEX_CUBE_S32_F32_LEVEL_RR:
		return NVPTX::TEX_CUBE_S32_F32_LEVEL_IR;
		case NVPTX::TEX_CUBE_S32_F32_LEVEL_RI:
		return NVPTX::TEX_CUBE_S32_F32_LEVEL_II;
		case NVPTX::TEX_CUBE_U32_F32_RR:
		return NVPTX::TEX_CUBE_U32_F32_IR;
		case NVPTX::TEX_CUBE_U32_F32_RI:
		return NVPTX::TEX_CUBE_U32_F32_II;
		case NVPTX::TEX_CUBE_U32_F32_LEVEL_RR:
		return NVPTX::TEX_CUBE_U32_F32_LEVEL_IR;
		case NVPTX::TEX_CUBE_U32_F32_LEVEL_RI:
		return NVPTX::TEX_CUBE_U32_F32_LEVEL_II;
		case NVPTX::TEX_CUBE_ARRAY_F32_F32_RR:
		return NVPTX::TEX_CUBE_ARRAY_F32_F32_IR;
		case NVPTX::TEX_CUBE_ARRAY_F32_F32_RI:
		return NVPTX::TEX_CUBE_ARRAY_F32_F32_II;
		case NVPTX::TEX_CUBE_ARRAY_F32_F32_LEVEL_RR:
		return NVPTX::TEX_CUBE_ARRAY_F32_F32_LEVEL_IR;
		case NVPTX::TEX_CUBE_ARRAY_F32_F32_LEVEL_RI:
		return NVPTX::TEX_CUBE_ARRAY_F32_F32_LEVEL_II;
		case NVPTX::TEX_CUBE_ARRAY_S32_F32_RR:
		return NVPTX::TEX_CUBE_ARRAY_S32_F32_IR;
		case NVPTX::TEX_CUBE_ARRAY_S32_F32_RI:
		return NVPTX::TEX_CUBE_ARRAY_S32_F32_II;
		case NVPTX::TEX_CUBE_ARRAY_S32_F32_LEVEL_RR:
		return NVPTX::TEX_CUBE_ARRAY_S32_F32_LEVEL_IR;
		case NVPTX::TEX_CUBE_ARRAY_S32_F32_LEVEL_RI:
		return NVPTX::TEX_CUBE_ARRAY_S32_F32_LEVEL_II;
		case NVPTX::TEX_CUBE_ARRAY_U32_F32_RR:
		return NVPTX::TEX_CUBE_ARRAY_U32_F32_IR;
		case NVPTX::TEX_CUBE_ARRAY_U32_F32_RI:
		return NVPTX::TEX_CUBE_ARRAY_U32_F32_II;
		case NVPTX::TEX_CUBE_ARRAY_U32_F32_LEVEL_RR:
		return NVPTX::TEX_CUBE_ARRAY_U32_F32_LEVEL_IR;
		case NVPTX::TEX_CUBE_ARRAY_U32_F32_LEVEL_RI:
		return NVPTX::TEX_CUBE_ARRAY_U32_F32_LEVEL_II;
		case NVPTX::TLD4_R_2D_F32_F32_RR:
		return NVPTX::TLD4_R_2D_F32_F32_IR;
		case NVPTX::TLD4_R_2D_F32_F32_RI:
		return NVPTX::TLD4_R_2D_F32_F32_II;
		case NVPTX::TLD4_G_2D_F32_F32_RR:
		return NVPTX::TLD4_G_2D_F32_F32_IR;
		case NVPTX::TLD4_G_2D_F32_F32_RI:
		return NVPTX::TLD4_G_2D_F32_F32_II;
		case NVPTX::TLD4_B_2D_F32_F32_RR:
		return NVPTX::TLD4_B_2D_F32_F32_IR;
		case NVPTX::TLD4_B_2D_F32_F32_RI:
		return NVPTX::TLD4_B_2D_F32_F32_II;
		case NVPTX::TLD4_A_2D_F32_F32_RR:
		return NVPTX::TLD4_A_2D_F32_F32_IR;
		case NVPTX::TLD4_A_2D_F32_F32_RI:
		return NVPTX::TLD4_A_2D_F32_F32_II;
		case NVPTX::TLD4_R_2D_S32_F32_RR:
		return NVPTX::TLD4_R_2D_S32_F32_IR;
		case NVPTX::TLD4_R_2D_S32_F32_RI:
		return NVPTX::TLD4_R_2D_S32_F32_II;
		case NVPTX::TLD4_G_2D_S32_F32_RR:
		return NVPTX::TLD4_G_2D_S32_F32_IR;
		case NVPTX::TLD4_G_2D_S32_F32_RI:
		return NVPTX::TLD4_G_2D_S32_F32_II;
		case NVPTX::TLD4_B_2D_S32_F32_RR:
		return NVPTX::TLD4_B_2D_S32_F32_IR;
		case NVPTX::TLD4_B_2D_S32_F32_RI:
		return NVPTX::TLD4_B_2D_S32_F32_II;
		case NVPTX::TLD4_A_2D_S32_F32_RR:
		return NVPTX::TLD4_A_2D_S32_F32_IR;
		case NVPTX::TLD4_A_2D_S32_F32_RI:
		return NVPTX::TLD4_A_2D_S32_F32_II;
		case NVPTX::TLD4_R_2D_U32_F32_RR:
		return NVPTX::TLD4_R_2D_U32_F32_IR;
		case NVPTX::TLD4_R_2D_U32_F32_RI:
		return NVPTX::TLD4_R_2D_U32_F32_II;
		case NVPTX::TLD4_G_2D_U32_F32_RR:
		return NVPTX::TLD4_G_2D_U32_F32_IR;
		case NVPTX::TLD4_G_2D_U32_F32_RI:
		return NVPTX::TLD4_G_2D_U32_F32_II;
		case NVPTX::TLD4_B_2D_U32_F32_RR:
		return NVPTX::TLD4_B_2D_U32_F32_IR;
		case NVPTX::TLD4_B_2D_U32_F32_RI:
		return NVPTX::TLD4_B_2D_U32_F32_II;
		case NVPTX::TLD4_A_2D_U32_F32_RR:
		return NVPTX::TLD4_A_2D_U32_F32_IR;
		case NVPTX::TLD4_A_2D_U32_F32_RI:
		return NVPTX::TLD4_A_2D_U32_F32_II;
		case NVPTX::TEX_UNIFIED_1D_F32_S32_R:
		return NVPTX::TEX_UNIFIED_1D_F32_S32_I;
		case NVPTX::TEX_UNIFIED_1D_F32_F32_R:
		return NVPTX::TEX_UNIFIED_1D_F32_F32_I;
		case NVPTX::TEX_UNIFIED_1D_F32_F32_LEVEL_R:
		return NVPTX::TEX_UNIFIED_1D_F32_F32_LEVEL_I;
		case NVPTX::TEX_UNIFIED_1D_F32_F32_GRAD_R:
		return NVPTX::TEX_UNIFIED_1D_F32_F32_GRAD_I;
		case NVPTX::TEX_UNIFIED_1D_S32_S32_R:
		return NVPTX::TEX_UNIFIED_1D_S32_S32_I;
		case NVPTX::TEX_UNIFIED_1D_S32_F32_R:
		return NVPTX::TEX_UNIFIED_1D_S32_F32_I;
		case NVPTX::TEX_UNIFIED_1D_S32_F32_LEVEL_R:
		return NVPTX::TEX_UNIFIED_1D_S32_F32_LEVEL_I;
		case NVPTX::TEX_UNIFIED_1D_S32_F32_GRAD_R:
		return NVPTX::TEX_UNIFIED_1D_S32_F32_GRAD_I;
		case NVPTX::TEX_UNIFIED_1D_U32_S32_R:
		return NVPTX::TEX_UNIFIED_1D_U32_S32_I;
		case NVPTX::TEX_UNIFIED_1D_U32_F32_R:
		return NVPTX::TEX_UNIFIED_1D_U32_F32_I;
		case NVPTX::TEX_UNIFIED_1D_U32_F32_LEVEL_R:
		return NVPTX::TEX_UNIFIED_1D_U32_F32_LEVEL_I;
		case NVPTX::TEX_UNIFIED_1D_U32_F32_GRAD_R:
		return NVPTX::TEX_UNIFIED_1D_U32_F32_GRAD_I;
		case NVPTX::TEX_UNIFIED_1D_ARRAY_F32_S32_R:
		return NVPTX::TEX_UNIFIED_1D_ARRAY_F32_S32_I;
		case NVPTX::TEX_UNIFIED_1D_ARRAY_F32_F32_R:
		return NVPTX::TEX_UNIFIED_1D_ARRAY_F32_F32_I;
		case NVPTX::TEX_UNIFIED_1D_ARRAY_F32_F32_LEVEL_R:
		return NVPTX::TEX_UNIFIED_1D_ARRAY_F32_F32_LEVEL_I;
		case NVPTX::TEX_UNIFIED_1D_ARRAY_F32_F32_GRAD_R:
		return NVPTX::TEX_UNIFIED_1D_ARRAY_F32_F32_GRAD_I;
		case NVPTX::TEX_UNIFIED_1D_ARRAY_S32_S32_R:
		return NVPTX::TEX_UNIFIED_1D_ARRAY_S32_S32_I;
		case NVPTX::TEX_UNIFIED_1D_ARRAY_S32_F32_R:
		return NVPTX::TEX_UNIFIED_1D_ARRAY_S32_F32_I;
		case NVPTX::TEX_UNIFIED_1D_ARRAY_S32_F32_LEVEL_R:
		return NVPTX::TEX_UNIFIED_1D_ARRAY_S32_F32_LEVEL_I;
		case NVPTX::TEX_UNIFIED_1D_ARRAY_S32_F32_GRAD_R:
		return NVPTX::TEX_UNIFIED_1D_ARRAY_S32_F32_GRAD_I;
		case NVPTX::TEX_UNIFIED_1D_ARRAY_U32_S32_R:
		return NVPTX::TEX_UNIFIED_1D_ARRAY_U32_S32_I;
		case NVPTX::TEX_UNIFIED_1D_ARRAY_U32_F32_R:
		return NVPTX::TEX_UNIFIED_1D_ARRAY_U32_F32_I;
		case NVPTX::TEX_UNIFIED_1D_ARRAY_U32_F32_LEVEL_R:
		return NVPTX::TEX_UNIFIED_1D_ARRAY_U32_F32_LEVEL_I;
		case NVPTX::TEX_UNIFIED_1D_ARRAY_U32_F32_GRAD_R:
		return NVPTX::TEX_UNIFIED_1D_ARRAY_U32_F32_GRAD_I;
		case NVPTX::TEX_UNIFIED_2D_F32_S32_R:
		return NVPTX::TEX_UNIFIED_2D_F32_S32_I;
		case NVPTX::TEX_UNIFIED_2D_F32_F32_R:
		return NVPTX::TEX_UNIFIED_2D_F32_F32_I;
		case NVPTX::TEX_UNIFIED_2D_F32_F32_LEVEL_R:
		return NVPTX::TEX_UNIFIED_2D_F32_F32_LEVEL_I;
		case NVPTX::TEX_UNIFIED_2D_F32_F32_GRAD_R:
		return NVPTX::TEX_UNIFIED_2D_F32_F32_GRAD_I;
		case NVPTX::TEX_UNIFIED_2D_S32_S32_R:
		return NVPTX::TEX_UNIFIED_2D_S32_S32_I;
		case NVPTX::TEX_UNIFIED_2D_S32_F32_R:
		return NVPTX::TEX_UNIFIED_2D_S32_F32_I;
		case NVPTX::TEX_UNIFIED_2D_S32_F32_LEVEL_R:
		return NVPTX::TEX_UNIFIED_2D_S32_F32_LEVEL_I;
		case NVPTX::TEX_UNIFIED_2D_S32_F32_GRAD_R:
		return NVPTX::TEX_UNIFIED_2D_S32_F32_GRAD_I;
		case NVPTX::TEX_UNIFIED_2D_U32_S32_R:
		return NVPTX::TEX_UNIFIED_2D_U32_S32_I;
		case NVPTX::TEX_UNIFIED_2D_U32_F32_R:
		return NVPTX::TEX_UNIFIED_2D_U32_F32_I;
		case NVPTX::TEX_UNIFIED_2D_U32_F32_LEVEL_R:
		return NVPTX::TEX_UNIFIED_2D_U32_F32_LEVEL_I;
		case NVPTX::TEX_UNIFIED_2D_U32_F32_GRAD_R:
		return NVPTX::TEX_UNIFIED_2D_U32_F32_GRAD_I;
		case NVPTX::TEX_UNIFIED_2D_ARRAY_F32_S32_R:
		return NVPTX::TEX_UNIFIED_2D_ARRAY_F32_S32_I;
		case NVPTX::TEX_UNIFIED_2D_ARRAY_F32_F32_R:
		return NVPTX::TEX_UNIFIED_2D_ARRAY_F32_F32_I;
		case NVPTX::TEX_UNIFIED_2D_ARRAY_F32_F32_LEVEL_R:
		return NVPTX::TEX_UNIFIED_2D_ARRAY_F32_F32_LEVEL_I;
		case NVPTX::TEX_UNIFIED_2D_ARRAY_F32_F32_GRAD_R:
		return NVPTX::TEX_UNIFIED_2D_ARRAY_F32_F32_GRAD_I;
		case NVPTX::TEX_UNIFIED_2D_ARRAY_S32_S32_R:
		return NVPTX::TEX_UNIFIED_2D_ARRAY_S32_S32_I;
		case NVPTX::TEX_UNIFIED_2D_ARRAY_S32_F32_R:
		return NVPTX::TEX_UNIFIED_2D_ARRAY_S32_F32_I;
		case NVPTX::TEX_UNIFIED_2D_ARRAY_S32_F32_LEVEL_R:
		return NVPTX::TEX_UNIFIED_2D_ARRAY_S32_F32_LEVEL_I;
		case NVPTX::TEX_UNIFIED_2D_ARRAY_S32_F32_GRAD_R:
		return NVPTX::TEX_UNIFIED_2D_ARRAY_S32_F32_GRAD_I;
		case NVPTX::TEX_UNIFIED_2D_ARRAY_U32_S32_R:
		return NVPTX::TEX_UNIFIED_2D_ARRAY_U32_S32_I;
		case NVPTX::TEX_UNIFIED_2D_ARRAY_U32_F32_R:
		return NVPTX::TEX_UNIFIED_2D_ARRAY_U32_F32_I;
		case NVPTX::TEX_UNIFIED_2D_ARRAY_U32_F32_LEVEL_R:
		return NVPTX::TEX_UNIFIED_2D_ARRAY_U32_F32_LEVEL_I;
		case NVPTX::TEX_UNIFIED_2D_ARRAY_U32_F32_GRAD_R:
		return NVPTX::TEX_UNIFIED_2D_ARRAY_U32_F32_GRAD_I;
		case NVPTX::TEX_UNIFIED_3D_F32_S32_R:
		return NVPTX::TEX_UNIFIED_3D_F32_S32_I;
		case NVPTX::TEX_UNIFIED_3D_F32_F32_R:
		return NVPTX::TEX_UNIFIED_3D_F32_F32_I;
		case NVPTX::TEX_UNIFIED_3D_F32_F32_LEVEL_R:
		return NVPTX::TEX_UNIFIED_3D_F32_F32_LEVEL_I;
		case NVPTX::TEX_UNIFIED_3D_F32_F32_GRAD_R:
		return NVPTX::TEX_UNIFIED_3D_F32_F32_GRAD_I;
		case NVPTX::TEX_UNIFIED_3D_S32_S32_R:
		return NVPTX::TEX_UNIFIED_3D_S32_S32_I;
		case NVPTX::TEX_UNIFIED_3D_S32_F32_R:
		return NVPTX::TEX_UNIFIED_3D_S32_F32_I;
		case NVPTX::TEX_UNIFIED_3D_S32_F32_LEVEL_R:
		return NVPTX::TEX_UNIFIED_3D_S32_F32_LEVEL_I;
		case NVPTX::TEX_UNIFIED_3D_S32_F32_GRAD_R:
		return NVPTX::TEX_UNIFIED_3D_S32_F32_GRAD_I;
		case NVPTX::TEX_UNIFIED_3D_U32_S32_R:
		return NVPTX::TEX_UNIFIED_3D_U32_S32_I;
		case NVPTX::TEX_UNIFIED_3D_U32_F32_R:
		return NVPTX::TEX_UNIFIED_3D_U32_F32_I;
		case NVPTX::TEX_UNIFIED_3D_U32_F32_LEVEL_R:
		return NVPTX::TEX_UNIFIED_3D_U32_F32_LEVEL_I;
		case NVPTX::TEX_UNIFIED_3D_U32_F32_GRAD_R:
		return NVPTX::TEX_UNIFIED_3D_U32_F32_GRAD_I;
		case NVPTX::TEX_UNIFIED_CUBE_F32_F32_R:
		return NVPTX::TEX_UNIFIED_CUBE_F32_F32_I;
		case NVPTX::TEX_UNIFIED_CUBE_F32_F32_LEVEL_R:
		return NVPTX::TEX_UNIFIED_CUBE_F32_F32_LEVEL_I;
		case NVPTX::TEX_UNIFIED_CUBE_S32_F32_R:
		return NVPTX::TEX_UNIFIED_CUBE_S32_F32_I;
		case NVPTX::TEX_UNIFIED_CUBE_S32_F32_LEVEL_R:
		return NVPTX::TEX_UNIFIED_CUBE_S32_F32_LEVEL_I;
		case NVPTX::TEX_UNIFIED_CUBE_U32_F32_R:
		return NVPTX::TEX_UNIFIED_CUBE_U32_F32_I;
		case NVPTX::TEX_UNIFIED_CUBE_U32_F32_LEVEL_R:
		return NVPTX::TEX_UNIFIED_CUBE_U32_F32_LEVEL_I;
		case NVPTX::TEX_UNIFIED_CUBE_ARRAY_F32_F32_R:
		return NVPTX::TEX_UNIFIED_CUBE_ARRAY_F32_F32_I;
		case NVPTX::TEX_UNIFIED_CUBE_ARRAY_F32_F32_LEVEL_R:
		return NVPTX::TEX_UNIFIED_CUBE_ARRAY_F32_F32_LEVEL_I;
		case NVPTX::TEX_UNIFIED_CUBE_ARRAY_S32_F32_R:
		return NVPTX::TEX_UNIFIED_CUBE_ARRAY_S32_F32_I;
		case NVPTX::TEX_UNIFIED_CUBE_ARRAY_S32_F32_LEVEL_R:
		return NVPTX::TEX_UNIFIED_CUBE_ARRAY_S32_F32_LEVEL_I;
		case NVPTX::TEX_UNIFIED_CUBE_ARRAY_U32_F32_R:
		return NVPTX::TEX_UNIFIED_CUBE_ARRAY_U32_F32_I;
		case NVPTX::TEX_UNIFIED_CUBE_ARRAY_U32_F32_LEVEL_R:
		return NVPTX::TEX_UNIFIED_CUBE_ARRAY_U32_F32_LEVEL_I;
		case NVPTX::TLD4_UNIFIED_R_2D_F32_F32_R:
		return NVPTX::TLD4_UNIFIED_R_2D_F32_F32_I;
		case NVPTX::TLD4_UNIFIED_G_2D_F32_F32_R:
		return NVPTX::TLD4_UNIFIED_G_2D_F32_F32_I;
		case NVPTX::TLD4_UNIFIED_B_2D_F32_F32_R:
		return NVPTX::TLD4_UNIFIED_B_2D_F32_F32_I;
		case NVPTX::TLD4_UNIFIED_A_2D_F32_F32_R:
		return NVPTX::TLD4_UNIFIED_A_2D_F32_F32_I;
		case NVPTX::TLD4_UNIFIED_R_2D_S32_F32_R:
		return NVPTX::TLD4_UNIFIED_R_2D_S32_F32_I;
		case NVPTX::TLD4_UNIFIED_G_2D_S32_F32_R:
		return NVPTX::TLD4_UNIFIED_G_2D_S32_F32_I;
		case NVPTX::TLD4_UNIFIED_B_2D_S32_F32_R:
		return NVPTX::TLD4_UNIFIED_B_2D_S32_F32_I;
		case NVPTX::TLD4_UNIFIED_A_2D_S32_F32_R:
		return NVPTX::TLD4_UNIFIED_A_2D_S32_F32_I;
		case NVPTX::TLD4_UNIFIED_R_2D_U32_F32_R:
		return NVPTX::TLD4_UNIFIED_R_2D_U32_F32_I;
		case NVPTX::TLD4_UNIFIED_G_2D_U32_F32_R:
		return NVPTX::TLD4_UNIFIED_G_2D_U32_F32_I;
		case NVPTX::TLD4_UNIFIED_B_2D_U32_F32_R:
		return NVPTX::TLD4_UNIFIED_B_2D_U32_F32_I;
		case NVPTX::TLD4_UNIFIED_A_2D_U32_F32_R:
		return NVPTX::TLD4_UNIFIED_A_2D_U32_F32_I;
		default:
		llvm_unreachable("Unhandled TEX opcode");
		};
		}

		static unsigned samplerRegisterToIndexOpcode(unsigned RegOC) {
		switch (RegOC) {
		case NVPTX::TEX_1D_F32_S32_RR:
		return NVPTX::TEX_1D_F32_S32_RI;
		case NVPTX::TEX_1D_F32_S32_IR:
		return NVPTX::TEX_1D_F32_S32_II;
		case NVPTX::TEX_1D_F32_F32_RR:
		return NVPTX::TEX_1D_F32_F32_RI;
		case NVPTX::TEX_1D_F32_F32_IR:
		return NVPTX::TEX_1D_F32_F32_II;
		case NVPTX::TEX_1D_F32_F32_LEVEL_RR:
		return NVPTX::TEX_1D_F32_F32_LEVEL_RI;
		case NVPTX::TEX_1D_F32_F32_LEVEL_IR:
		return NVPTX::TEX_1D_F32_F32_LEVEL_II;
		case NVPTX::TEX_1D_F32_F32_GRAD_RR:
		return NVPTX::TEX_1D_F32_F32_GRAD_RI;
		case NVPTX::TEX_1D_F32_F32_GRAD_IR:
		return NVPTX::TEX_1D_F32_F32_GRAD_II;
		case NVPTX::TEX_1D_S32_S32_RR:
		return NVPTX::TEX_1D_S32_S32_RI;
		case NVPTX::TEX_1D_S32_S32_IR:
		return NVPTX::TEX_1D_S32_S32_II;
		case NVPTX::TEX_1D_S32_F32_RR:
		return NVPTX::TEX_1D_S32_F32_RI;
		case NVPTX::TEX_1D_S32_F32_IR:
		return NVPTX::TEX_1D_S32_F32_II;
		case NVPTX::TEX_1D_S32_F32_LEVEL_RR:
		return NVPTX::TEX_1D_S32_F32_LEVEL_RI;
		case NVPTX::TEX_1D_S32_F32_LEVEL_IR:
		return NVPTX::TEX_1D_S32_F32_LEVEL_II;
		case NVPTX::TEX_1D_S32_F32_GRAD_RR:
		return NVPTX::TEX_1D_S32_F32_GRAD_RI;
		case NVPTX::TEX_1D_S32_F32_GRAD_IR:
		return NVPTX::TEX_1D_S32_F32_GRAD_II;
		case NVPTX::TEX_1D_U32_S32_RR:
		return NVPTX::TEX_1D_U32_S32_RI;
		case NVPTX::TEX_1D_U32_S32_IR:
		return NVPTX::TEX_1D_U32_S32_II;
		case NVPTX::TEX_1D_U32_F32_RR:
		return NVPTX::TEX_1D_U32_F32_RI;
		case NVPTX::TEX_1D_U32_F32_IR:
		return NVPTX::TEX_1D_U32_F32_II;
		case NVPTX::TEX_1D_U32_F32_LEVEL_RR:
		return NVPTX::TEX_1D_U32_F32_LEVEL_RI;
		case NVPTX::TEX_1D_U32_F32_LEVEL_IR:
		return NVPTX::TEX_1D_U32_F32_LEVEL_II;
		case NVPTX::TEX_1D_U32_F32_GRAD_RR:
		return NVPTX::TEX_1D_U32_F32_GRAD_RI;
		case NVPTX::TEX_1D_U32_F32_GRAD_IR:
		return NVPTX::TEX_1D_U32_F32_GRAD_II;
		case NVPTX::TEX_1D_ARRAY_F32_S32_RR:
		return NVPTX::TEX_1D_ARRAY_F32_S32_RI;
		case NVPTX::TEX_1D_ARRAY_F32_S32_IR:
		return NVPTX::TEX_1D_ARRAY_F32_S32_II;
		case NVPTX::TEX_1D_ARRAY_F32_F32_RR:
		return NVPTX::TEX_1D_ARRAY_F32_F32_RI;
		case NVPTX::TEX_1D_ARRAY_F32_F32_IR:
		return NVPTX::TEX_1D_ARRAY_F32_F32_II;
		case NVPTX::TEX_1D_ARRAY_F32_F32_LEVEL_RR:
		return NVPTX::TEX_1D_ARRAY_F32_F32_LEVEL_RI;
		case NVPTX::TEX_1D_ARRAY_F32_F32_LEVEL_IR:
		return NVPTX::TEX_1D_ARRAY_F32_F32_LEVEL_II;
		case NVPTX::TEX_1D_ARRAY_F32_F32_GRAD_RR:
		return NVPTX::TEX_1D_ARRAY_F32_F32_GRAD_RI;
		case NVPTX::TEX_1D_ARRAY_F32_F32_GRAD_IR:
		return NVPTX::TEX_1D_ARRAY_F32_F32_GRAD_II;
		case NVPTX::TEX_1D_ARRAY_S32_S32_RR:
		return NVPTX::TEX_1D_ARRAY_S32_S32_RI;
		case NVPTX::TEX_1D_ARRAY_S32_S32_IR:
		return NVPTX::TEX_1D_ARRAY_S32_S32_II;
		case NVPTX::TEX_1D_ARRAY_S32_F32_RR:
		return NVPTX::TEX_1D_ARRAY_S32_F32_RI;
		case NVPTX::TEX_1D_ARRAY_S32_F32_IR:
		return NVPTX::TEX_1D_ARRAY_S32_F32_II;
		case NVPTX::TEX_1D_ARRAY_S32_F32_LEVEL_RR:
		return NVPTX::TEX_1D_ARRAY_S32_F32_LEVEL_RI;
		case NVPTX::TEX_1D_ARRAY_S32_F32_LEVEL_IR:
		return NVPTX::TEX_1D_ARRAY_S32_F32_LEVEL_II;
		case NVPTX::TEX_1D_ARRAY_S32_F32_GRAD_RR:
		return NVPTX::TEX_1D_ARRAY_S32_F32_GRAD_RI;
		case NVPTX::TEX_1D_ARRAY_S32_F32_GRAD_IR:
		return NVPTX::TEX_1D_ARRAY_S32_F32_GRAD_II;
		case NVPTX::TEX_1D_ARRAY_U32_S32_RR:
		return NVPTX::TEX_1D_ARRAY_U32_S32_RI;
		case NVPTX::TEX_1D_ARRAY_U32_S32_IR:
		return NVPTX::TEX_1D_ARRAY_U32_S32_II;
		case NVPTX::TEX_1D_ARRAY_U32_F32_RR:
		return NVPTX::TEX_1D_ARRAY_U32_F32_RI;
		case NVPTX::TEX_1D_ARRAY_U32_F32_IR:
		return NVPTX::TEX_1D_ARRAY_U32_F32_II;
		case NVPTX::TEX_1D_ARRAY_U32_F32_LEVEL_RR:
		return NVPTX::TEX_1D_ARRAY_U32_F32_LEVEL_RI;
		case NVPTX::TEX_1D_ARRAY_U32_F32_LEVEL_IR:
		return NVPTX::TEX_1D_ARRAY_U32_F32_LEVEL_II;
		case NVPTX::TEX_1D_ARRAY_U32_F32_GRAD_RR:
		return NVPTX::TEX_1D_ARRAY_U32_F32_GRAD_RI;
		case NVPTX::TEX_1D_ARRAY_U32_F32_GRAD_IR:
		return NVPTX::TEX_1D_ARRAY_U32_F32_GRAD_II;
		case NVPTX::TEX_2D_F32_S32_RR:
		return NVPTX::TEX_2D_F32_S32_RI;
		case NVPTX::TEX_2D_F32_S32_IR:
		return NVPTX::TEX_2D_F32_S32_II;
		case NVPTX::TEX_2D_F32_F32_RR:
		return NVPTX::TEX_2D_F32_F32_RI;
		case NVPTX::TEX_2D_F32_F32_IR:
		return NVPTX::TEX_2D_F32_F32_II;
		case NVPTX::TEX_2D_F32_F32_LEVEL_RR:
		return NVPTX::TEX_2D_F32_F32_LEVEL_RI;
		case NVPTX::TEX_2D_F32_F32_LEVEL_IR:
		return NVPTX::TEX_2D_F32_F32_LEVEL_II;
		case NVPTX::TEX_2D_F32_F32_GRAD_RR:
		return NVPTX::TEX_2D_F32_F32_GRAD_RI;
		case NVPTX::TEX_2D_F32_F32_GRAD_IR:
		return NVPTX::TEX_2D_F32_F32_GRAD_II;
		case NVPTX::TEX_2D_S32_S32_RR:
		return NVPTX::TEX_2D_S32_S32_RI;
		case NVPTX::TEX_2D_S32_S32_IR:
		return NVPTX::TEX_2D_S32_S32_II;
		case NVPTX::TEX_2D_S32_F32_RR:
		return NVPTX::TEX_2D_S32_F32_RI;
		case NVPTX::TEX_2D_S32_F32_IR:
		return NVPTX::TEX_2D_S32_F32_II;
		case NVPTX::TEX_2D_S32_F32_LEVEL_RR:
		return NVPTX::TEX_2D_S32_F32_LEVEL_RI;
		case NVPTX::TEX_2D_S32_F32_LEVEL_IR:
		return NVPTX::TEX_2D_S32_F32_LEVEL_II;
		case NVPTX::TEX_2D_S32_F32_GRAD_RR:
		return NVPTX::TEX_2D_S32_F32_GRAD_RI;
		case NVPTX::TEX_2D_S32_F32_GRAD_IR:
		return NVPTX::TEX_2D_S32_F32_GRAD_II;
		case NVPTX::TEX_2D_U32_S32_RR:
		return NVPTX::TEX_2D_U32_S32_RI;
		case NVPTX::TEX_2D_U32_S32_IR:
		return NVPTX::TEX_2D_U32_S32_II;
		case NVPTX::TEX_2D_U32_F32_RR:
		return NVPTX::TEX_2D_U32_F32_RI;
		case NVPTX::TEX_2D_U32_F32_IR:
		return NVPTX::TEX_2D_U32_F32_II;
		case NVPTX::TEX_2D_U32_F32_LEVEL_RR:
		return NVPTX::TEX_2D_U32_F32_LEVEL_RI;
		case NVPTX::TEX_2D_U32_F32_LEVEL_IR:
		return NVPTX::TEX_2D_U32_F32_LEVEL_II;
		case NVPTX::TEX_2D_U32_F32_GRAD_RR:
		return NVPTX::TEX_2D_U32_F32_GRAD_RI;
		case NVPTX::TEX_2D_U32_F32_GRAD_IR:
		return NVPTX::TEX_2D_U32_F32_GRAD_II;
		case NVPTX::TEX_2D_ARRAY_F32_S32_RR:
		return NVPTX::TEX_2D_ARRAY_F32_S32_RI;
		case NVPTX::TEX_2D_ARRAY_F32_S32_IR:
		return NVPTX::TEX_2D_ARRAY_F32_S32_II;
		case NVPTX::TEX_2D_ARRAY_F32_F32_RR:
		return NVPTX::TEX_2D_ARRAY_F32_F32_RI;
		case NVPTX::TEX_2D_ARRAY_F32_F32_IR:
		return NVPTX::TEX_2D_ARRAY_F32_F32_II;
		case NVPTX::TEX_2D_ARRAY_F32_F32_LEVEL_RR:
		return NVPTX::TEX_2D_ARRAY_F32_F32_LEVEL_RI;
		case NVPTX::TEX_2D_ARRAY_F32_F32_LEVEL_IR:
		return NVPTX::TEX_2D_ARRAY_F32_F32_LEVEL_II;
		case NVPTX::TEX_2D_ARRAY_F32_F32_GRAD_RR:
		return NVPTX::TEX_2D_ARRAY_F32_F32_GRAD_RI;
		case NVPTX::TEX_2D_ARRAY_F32_F32_GRAD_IR:
		return NVPTX::TEX_2D_ARRAY_F32_F32_GRAD_II;
		case NVPTX::TEX_2D_ARRAY_S32_S32_RR:
		return NVPTX::TEX_2D_ARRAY_S32_S32_RI;
		case NVPTX::TEX_2D_ARRAY_S32_S32_IR:
		return NVPTX::TEX_2D_ARRAY_S32_S32_II;
		case NVPTX::TEX_2D_ARRAY_S32_F32_RR:
		return NVPTX::TEX_2D_ARRAY_S32_F32_RI;
		case NVPTX::TEX_2D_ARRAY_S32_F32_IR:
		return NVPTX::TEX_2D_ARRAY_S32_F32_II;
		case NVPTX::TEX_2D_ARRAY_S32_F32_LEVEL_RR:
		return NVPTX::TEX_2D_ARRAY_S32_F32_LEVEL_RI;
		case NVPTX::TEX_2D_ARRAY_S32_F32_LEVEL_IR:
		return NVPTX::TEX_2D_ARRAY_S32_F32_LEVEL_II;
		case NVPTX::TEX_2D_ARRAY_S32_F32_GRAD_RR:
		return NVPTX::TEX_2D_ARRAY_S32_F32_GRAD_RI;
		case NVPTX::TEX_2D_ARRAY_S32_F32_GRAD_IR:
		return NVPTX::TEX_2D_ARRAY_S32_F32_GRAD_II;
		case NVPTX::TEX_2D_ARRAY_U32_S32_RR:
		return NVPTX::TEX_2D_ARRAY_U32_S32_RI;
		case NVPTX::TEX_2D_ARRAY_U32_S32_IR:
		return NVPTX::TEX_2D_ARRAY_U32_S32_II;
		case NVPTX::TEX_2D_ARRAY_U32_F32_RR:
		return NVPTX::TEX_2D_ARRAY_U32_F32_RI;
		case NVPTX::TEX_2D_ARRAY_U32_F32_IR:
		return NVPTX::TEX_2D_ARRAY_U32_F32_II;
		case NVPTX::TEX_2D_ARRAY_U32_F32_LEVEL_RR:
		return NVPTX::TEX_2D_ARRAY_U32_F32_LEVEL_RI;
		case NVPTX::TEX_2D_ARRAY_U32_F32_LEVEL_IR:
		return NVPTX::TEX_2D_ARRAY_U32_F32_LEVEL_II;
		case NVPTX::TEX_2D_ARRAY_U32_F32_GRAD_RR:
		return NVPTX::TEX_2D_ARRAY_U32_F32_GRAD_RI;
		case NVPTX::TEX_2D_ARRAY_U32_F32_GRAD_IR:
		return NVPTX::TEX_2D_ARRAY_U32_F32_GRAD_II;
		case NVPTX::TEX_3D_F32_S32_RR:
		return NVPTX::TEX_3D_F32_S32_RI;
		case NVPTX::TEX_3D_F32_S32_IR:
		return NVPTX::TEX_3D_F32_S32_II;
		case NVPTX::TEX_3D_F32_F32_RR:
		return NVPTX::TEX_3D_F32_F32_RI;
		case NVPTX::TEX_3D_F32_F32_IR:
		return NVPTX::TEX_3D_F32_F32_II;
		case NVPTX::TEX_3D_F32_F32_LEVEL_RR:
		return NVPTX::TEX_3D_F32_F32_LEVEL_RI;
		case NVPTX::TEX_3D_F32_F32_LEVEL_IR:
		return NVPTX::TEX_3D_F32_F32_LEVEL_II;
		case NVPTX::TEX_3D_F32_F32_GRAD_RR:
		return NVPTX::TEX_3D_F32_F32_GRAD_RI;
		case NVPTX::TEX_3D_F32_F32_GRAD_IR:
		return NVPTX::TEX_3D_F32_F32_GRAD_II;
		case NVPTX::TEX_3D_S32_S32_RR:
		return NVPTX::TEX_3D_S32_S32_RI;
		case NVPTX::TEX_3D_S32_S32_IR:
		return NVPTX::TEX_3D_S32_S32_II;
		case NVPTX::TEX_3D_S32_F32_RR:
		return NVPTX::TEX_3D_S32_F32_RI;
		case NVPTX::TEX_3D_S32_F32_IR:
		return NVPTX::TEX_3D_S32_F32_II;
		case NVPTX::TEX_3D_S32_F32_LEVEL_RR:
		return NVPTX::TEX_3D_S32_F32_LEVEL_RI;
		case NVPTX::TEX_3D_S32_F32_LEVEL_IR:
		return NVPTX::TEX_3D_S32_F32_LEVEL_II;
		case NVPTX::TEX_3D_S32_F32_GRAD_RR:
		return NVPTX::TEX_3D_S32_F32_GRAD_RI;
		case NVPTX::TEX_3D_S32_F32_GRAD_IR:
		return NVPTX::TEX_3D_S32_F32_GRAD_II;
		case NVPTX::TEX_3D_U32_S32_RR:
		return NVPTX::TEX_3D_U32_S32_RI;
		case NVPTX::TEX_3D_U32_S32_IR:
		return NVPTX::TEX_3D_U32_S32_II;
		case NVPTX::TEX_3D_U32_F32_RR:
		return NVPTX::TEX_3D_U32_F32_RI;
		case NVPTX::TEX_3D_U32_F32_IR:
		return NVPTX::TEX_3D_U32_F32_II;
		case NVPTX::TEX_3D_U32_F32_LEVEL_RR:
		return NVPTX::TEX_3D_U32_F32_LEVEL_RI;
		case NVPTX::TEX_3D_U32_F32_LEVEL_IR:
		return NVPTX::TEX_3D_U32_F32_LEVEL_II;
		case NVPTX::TEX_3D_U32_F32_GRAD_RR:
		return NVPTX::TEX_3D_U32_F32_GRAD_RI;
		case NVPTX::TEX_3D_U32_F32_GRAD_IR:
		return NVPTX::TEX_3D_U32_F32_GRAD_II;
		case NVPTX::TEX_CUBE_F32_F32_RR:
		return NVPTX::TEX_CUBE_F32_F32_RI;
		case NVPTX::TEX_CUBE_F32_F32_IR:
		return NVPTX::TEX_CUBE_F32_F32_II;
		case NVPTX::TEX_CUBE_F32_F32_LEVEL_RR:
		return NVPTX::TEX_CUBE_F32_F32_LEVEL_RI;
		case NVPTX::TEX_CUBE_F32_F32_LEVEL_IR:
		return NVPTX::TEX_CUBE_F32_F32_LEVEL_II;
		case NVPTX::TEX_CUBE_S32_F32_RR:
		return NVPTX::TEX_CUBE_S32_F32_RI;
		case NVPTX::TEX_CUBE_S32_F32_IR:
		return NVPTX::TEX_CUBE_S32_F32_II;
		case NVPTX::TEX_CUBE_S32_F32_LEVEL_RR:
		return NVPTX::TEX_CUBE_S32_F32_LEVEL_RI;
		case NVPTX::TEX_CUBE_S32_F32_LEVEL_IR:
		return NVPTX::TEX_CUBE_S32_F32_LEVEL_II;
		case NVPTX::TEX_CUBE_U32_F32_RR:
		return NVPTX::TEX_CUBE_U32_F32_RI;
		case NVPTX::TEX_CUBE_U32_F32_IR:
		return NVPTX::TEX_CUBE_U32_F32_II;
		case NVPTX::TEX_CUBE_U32_F32_LEVEL_RR:
		return NVPTX::TEX_CUBE_U32_F32_LEVEL_RI;
		case NVPTX::TEX_CUBE_U32_F32_LEVEL_IR:
		return NVPTX::TEX_CUBE_U32_F32_LEVEL_II;
		case NVPTX::TEX_CUBE_ARRAY_F32_F32_RR:
		return NVPTX::TEX_CUBE_ARRAY_F32_F32_RI;
		case NVPTX::TEX_CUBE_ARRAY_F32_F32_IR:
		return NVPTX::TEX_CUBE_ARRAY_F32_F32_II;
		case NVPTX::TEX_CUBE_ARRAY_F32_F32_LEVEL_RR:
		return NVPTX::TEX_CUBE_ARRAY_F32_F32_LEVEL_RI;
		case NVPTX::TEX_CUBE_ARRAY_F32_F32_LEVEL_IR:
		return NVPTX::TEX_CUBE_ARRAY_F32_F32_LEVEL_II;
		case NVPTX::TEX_CUBE_ARRAY_S32_F32_RR:
		return NVPTX::TEX_CUBE_ARRAY_S32_F32_RI;
		case NVPTX::TEX_CUBE_ARRAY_S32_F32_IR:
		return NVPTX::TEX_CUBE_ARRAY_S32_F32_II;
		case NVPTX::TEX_CUBE_ARRAY_S32_F32_LEVEL_RR:
		return NVPTX::TEX_CUBE_ARRAY_S32_F32_LEVEL_RI;
		case NVPTX::TEX_CUBE_ARRAY_S32_F32_LEVEL_IR:
		return NVPTX::TEX_CUBE_ARRAY_S32_F32_LEVEL_II;
		case NVPTX::TEX_CUBE_ARRAY_U32_F32_RR:
		return NVPTX::TEX_CUBE_ARRAY_U32_F32_RI;
		case NVPTX::TEX_CUBE_ARRAY_U32_F32_IR:
		return NVPTX::TEX_CUBE_ARRAY_U32_F32_II;
		case NVPTX::TEX_CUBE_ARRAY_U32_F32_LEVEL_RR:
		return NVPTX::TEX_CUBE_ARRAY_U32_F32_LEVEL_RI;
		case NVPTX::TEX_CUBE_ARRAY_U32_F32_LEVEL_IR:
		return NVPTX::TEX_CUBE_ARRAY_U32_F32_LEVEL_II;
		case NVPTX::TLD4_R_2D_F32_F32_RR:
		return NVPTX::TLD4_R_2D_F32_F32_RI;
		case NVPTX::TLD4_R_2D_F32_F32_IR:
		return NVPTX::TLD4_R_2D_F32_F32_II;
		case NVPTX::TLD4_G_2D_F32_F32_RR:
		return NVPTX::TLD4_G_2D_F32_F32_RI;
		case NVPTX::TLD4_G_2D_F32_F32_IR:
		return NVPTX::TLD4_G_2D_F32_F32_II;
		case NVPTX::TLD4_B_2D_F32_F32_RR:
		return NVPTX::TLD4_B_2D_F32_F32_RI;
		case NVPTX::TLD4_B_2D_F32_F32_IR:
		return NVPTX::TLD4_B_2D_F32_F32_II;
		case NVPTX::TLD4_A_2D_F32_F32_RR:
		return NVPTX::TLD4_A_2D_F32_F32_RI;
		case NVPTX::TLD4_A_2D_F32_F32_IR:
		return NVPTX::TLD4_A_2D_F32_F32_II;
		case NVPTX::TLD4_R_2D_S32_F32_RR:
		return NVPTX::TLD4_R_2D_S32_F32_RI;
		case NVPTX::TLD4_R_2D_S32_F32_IR:
		return NVPTX::TLD4_R_2D_S32_F32_II;
		case NVPTX::TLD4_G_2D_S32_F32_RR:
		return NVPTX::TLD4_G_2D_S32_F32_RI;
		case NVPTX::TLD4_G_2D_S32_F32_IR:
		return NVPTX::TLD4_G_2D_S32_F32_II;
		case NVPTX::TLD4_B_2D_S32_F32_RR:
		return NVPTX::TLD4_B_2D_S32_F32_RI;
		case NVPTX::TLD4_B_2D_S32_F32_IR:
		return NVPTX::TLD4_B_2D_S32_F32_II;
		case NVPTX::TLD4_A_2D_S32_F32_RR:
		return NVPTX::TLD4_A_2D_S32_F32_RI;
		case NVPTX::TLD4_A_2D_S32_F32_IR:
		return NVPTX::TLD4_A_2D_S32_F32_II;
		case NVPTX::TLD4_R_2D_U32_F32_RR:
		return NVPTX::TLD4_R_2D_U32_F32_RI;
		case NVPTX::TLD4_R_2D_U32_F32_IR:
		return NVPTX::TLD4_R_2D_U32_F32_II;
		case NVPTX::TLD4_G_2D_U32_F32_RR:
		return NVPTX::TLD4_G_2D_U32_F32_RI;
		case NVPTX::TLD4_G_2D_U32_F32_IR:
		return NVPTX::TLD4_G_2D_U32_F32_II;
		case NVPTX::TLD4_B_2D_U32_F32_RR:
		return NVPTX::TLD4_B_2D_U32_F32_RI;
		case NVPTX::TLD4_B_2D_U32_F32_IR:
		return NVPTX::TLD4_B_2D_U32_F32_II;
		case NVPTX::TLD4_A_2D_U32_F32_RR:
		return NVPTX::TLD4_A_2D_U32_F32_RI;
		case NVPTX::TLD4_A_2D_U32_F32_IR:
		return NVPTX::TLD4_A_2D_U32_F32_II;
		default:
		llvm_unreachable("Unhandled TEX opcode");
		};
		}

		static unsigned queryRegisterToIndexOpcode(unsigned RegOC) {
		switch (RegOC) {
		case NVPTX::TXQ_CHANNEL_ORDER_R:
		return NVPTX::TXQ_CHANNEL_ORDER_I;
		case NVPTX::TXQ_CHANNEL_DATA_TYPE_R:
		return NVPTX::TXQ_CHANNEL_DATA_TYPE_I;
		case NVPTX::TXQ_WIDTH_R:
		return NVPTX::TXQ_WIDTH_I;
		case NVPTX::TXQ_HEIGHT_R:
		return NVPTX::TXQ_HEIGHT_I;
		case NVPTX::TXQ_DEPTH_R:
		return NVPTX::TXQ_DEPTH_I;
		case NVPTX::TXQ_ARRAY_SIZE_R:
		return NVPTX::TXQ_ARRAY_SIZE_I;
		case NVPTX::TXQ_NUM_SAMPLES_R:
		return NVPTX::TXQ_NUM_SAMPLES_I;
		case NVPTX::TXQ_NUM_MIPMAP_LEVELS_R:
		return NVPTX::TXQ_NUM_MIPMAP_LEVELS_I;
		case NVPTX::SUQ_CHANNEL_ORDER_R:
		return NVPTX::SUQ_CHANNEL_ORDER_I;
		case NVPTX::SUQ_CHANNEL_DATA_TYPE_R:
		return NVPTX::SUQ_CHANNEL_DATA_TYPE_I;
		case NVPTX::SUQ_WIDTH_R:
		return NVPTX::SUQ_WIDTH_I;
		case NVPTX::SUQ_HEIGHT_R:
		return NVPTX::SUQ_HEIGHT_I;
		case NVPTX::SUQ_DEPTH_R:
		return NVPTX::SUQ_DEPTH_I;
		case NVPTX::SUQ_ARRAY_SIZE_R:
		return NVPTX::SUQ_ARRAY_SIZE_I;
		default:
		llvm_unreachable("Unhandled TXQ/SUQ opcode");
		};
		}

bool NVPTXReplaceImageHandles::processInstr(MachineInstr &MI) {		bool NVPTXReplaceImageHandles::processInstr(MachineInstr &MI) {
MachineFunction &MF = *MI.getParent()->getParent();		MachineFunction &MF = *MI.getParent()->getParent();
const MCInstrDesc &MCID = MI.getDesc();		const MCInstrDesc &MCID = MI.getDesc();
		const NVPTXInstrInfo *TII = MF.getSubtarget<NVPTXSubtarget>().getInstrInfo();

if (MCID.TSFlags & NVPTXII::IsTexFlag) {		if (MCID.TSFlags & NVPTXII::IsTexFlag) {
// This is a texture fetch, so operand 4 is a texref and operand 5 is		// This is a texture fetch, so operand 4 is a texref and operand 5 is
// a samplerref		// a samplerref
MachineOperand &TexHandle = MI.getOperand(4);		MachineOperand &TexHandle = MI.getOperand(4);
replaceImageHandle(TexHandle, MF);		if (replaceImageHandle(TexHandle, MF))
		MI.setDesc(TII->get(texRegisterToIndexOpcode(MI.getOpcode())));

if (!(MCID.TSFlags & NVPTXII::IsTexModeUnifiedFlag)) {		if (!(MCID.TSFlags & NVPTXII::IsTexModeUnifiedFlag)) {
MachineOperand &SampHandle = MI.getOperand(5);		MachineOperand &SampHandle = MI.getOperand(5);
replaceImageHandle(SampHandle, MF);		if (replaceImageHandle(SampHandle, MF))
		MI.setDesc(TII->get(samplerRegisterToIndexOpcode(MI.getOpcode())));
}		}

return true;		return true;
} else if (MCID.TSFlags & NVPTXII::IsSuldMask) {		} else if (MCID.TSFlags & NVPTXII::IsSuldMask) {
unsigned VecSize =		unsigned VecSize =
1 << (((MCID.TSFlags & NVPTXII::IsSuldMask) >> NVPTXII::IsSuldShift) - 1);		1 << (((MCID.TSFlags & NVPTXII::IsSuldMask) >> NVPTXII::IsSuldShift) - 1);

// For a surface load of vector size N, the Nth operand will be the surfref		// For a surface load of vector size N, the Nth operand will be the surfref
MachineOperand &SurfHandle = MI.getOperand(VecSize);		MachineOperand &SurfHandle = MI.getOperand(VecSize);

replaceImageHandle(SurfHandle, MF);		if (replaceImageHandle(SurfHandle, MF))
		MI.setDesc(TII->get(suldRegisterToIndexOpcode(MI.getOpcode())));

return true;		return true;
} else if (MCID.TSFlags & NVPTXII::IsSustFlag) {		} else if (MCID.TSFlags & NVPTXII::IsSustFlag) {
// This is a surface store, so operand 0 is a surfref		// This is a surface store, so operand 0 is a surfref
MachineOperand &SurfHandle = MI.getOperand(0);		MachineOperand &SurfHandle = MI.getOperand(0);

replaceImageHandle(SurfHandle, MF);		if (replaceImageHandle(SurfHandle, MF))
		MI.setDesc(TII->get(sustRegisterToIndexOpcode(MI.getOpcode())));

return true;		return true;
} else if (MCID.TSFlags & NVPTXII::IsSurfTexQueryFlag) {		} else if (MCID.TSFlags & NVPTXII::IsSurfTexQueryFlag) {
// This is a query, so operand 1 is a surfref/texref		// This is a query, so operand 1 is a surfref/texref
MachineOperand &Handle = MI.getOperand(1);		MachineOperand &Handle = MI.getOperand(1);

replaceImageHandle(Handle, MF);		if (replaceImageHandle(Handle, MF))
		MI.setDesc(TII->get(queryRegisterToIndexOpcode(MI.getOpcode())));

return true;		return true;
}		}

return false;		return false;
}		}

void NVPTXReplaceImageHandles::		bool NVPTXReplaceImageHandles::replaceImageHandle(MachineOperand &Op,
replaceImageHandle(MachineOperand &Op, MachineFunction &MF) {		MachineFunction &MF) {
unsigned Idx;		unsigned Idx;
if (findIndexForHandle(Op, MF, Idx)) {		if (findIndexForHandle(Op, MF, Idx)) {
Op.ChangeToImmediate(Idx);		Op.ChangeToImmediate(Idx);
		return true;
}		}
		return false;
}		}

bool NVPTXReplaceImageHandles::		bool NVPTXReplaceImageHandles::
findIndexForHandle(MachineOperand &Op, MachineFunction &MF, unsigned &Idx) {		findIndexForHandle(MachineOperand &Op, MachineFunction &MF, unsigned &Idx) {
const MachineRegisterInfo &MRI = MF.getRegInfo();		const MachineRegisterInfo &MRI = MF.getRegInfo();
NVPTXMachineFunctionInfo *MFI = MF.getInfo<NVPTXMachineFunctionInfo>();		NVPTXMachineFunctionInfo *MFI = MF.getInfo<NVPTXMachineFunctionInfo>();

assert(Op.isReg() && "Handle is not in a reg?");		assert(Op.isReg() && "Handle is not in a reg?");
▲ Show 20 Lines • Show All 54 Lines • Show Last 20 Lines

llvm/test/CodeGen/NVPTX/surf-read-cuda.ll

	; RUN: llc < %s -march=nvptx -mcpu=sm_20 \| FileCheck %s --check-prefix=SM20			; RUN: llc < %s -march=nvptx -mcpu=sm_20 -verify-machineinstrs \| FileCheck %s --check-prefix=SM20
	; RUN: llc < %s -march=nvptx -mcpu=sm_30 \| FileCheck %s --check-prefix=SM30			; RUN: llc < %s -march=nvptx -mcpu=sm_30 -verify-machineinstrs \| FileCheck %s --check-prefix=SM30

	target triple = "nvptx-unknown-cuda"			target triple = "nvptx-unknown-cuda"

	declare i32 @llvm.nvvm.suld.1d.i32.trap(i64, i32)			declare i32 @llvm.nvvm.suld.1d.i32.trap(i64, i32)
	declare i64 @llvm.nvvm.texsurf.handle.internal.p1i64(i64 addrspace(1)*)			declare i64 @llvm.nvvm.texsurf.handle.internal.p1i64(i64 addrspace(1)*)


	; SM20-LABEL: .entry foo			; SM20-LABEL: .entry foo
	▲ Show 20 Lines • Show All 43 Lines • Show Last 20 Lines

llvm/test/CodeGen/NVPTX/surf-read.ll

	; RUN: llc < %s -march=nvptx -mcpu=sm_20 \| FileCheck %s			; RUN: llc < %s -march=nvptx -mcpu=sm_20 -verify-machineinstrs \| FileCheck %s

	target triple = "nvptx-unknown-nvcl"			target triple = "nvptx-unknown-nvcl"

	declare i32 @llvm.nvvm.suld.1d.i32.trap(i64, i32)			declare i32 @llvm.nvvm.suld.1d.i32.trap(i64, i32)

	; CHECK: .entry foo			; CHECK: .entry foo
	define void @foo(i64 %img, float* %red, i32 %idx) {			define void @foo(i64 %img, float* %red, i32 %idx) {
	; CHECK: suld.b.1d.b32.trap {%r[[RED:[0-9]+]]}, [foo_param_0, {%r{{[0-9]+}}}]			; CHECK: suld.b.1d.b32.trap {%r[[RED:[0-9]+]]}, [foo_param_0, {%r{{[0-9]+}}}]
	Show All 11 Lines

llvm/test/CodeGen/NVPTX/surf-write-cuda.ll

	; RUN: llc < %s -march=nvptx -mcpu=sm_20 \| FileCheck %s --check-prefix=SM20			; RUN: llc < %s -march=nvptx -mcpu=sm_20 -verify-machineinstrs \| FileCheck %s --check-prefix=SM20
	; RUN: llc < %s -march=nvptx -mcpu=sm_30 \| FileCheck %s --check-prefix=SM30			; RUN: llc < %s -march=nvptx -mcpu=sm_30 -verify-machineinstrs \| FileCheck %s --check-prefix=SM30

	target triple = "nvptx-unknown-cuda"			target triple = "nvptx-unknown-cuda"

	declare void @llvm.nvvm.sust.b.1d.i32.trap(i64, i32, i32)			declare void @llvm.nvvm.sust.b.1d.i32.trap(i64, i32, i32)
	declare i64 @llvm.nvvm.texsurf.handle.internal.p1i64(i64 addrspace(1)*)			declare i64 @llvm.nvvm.texsurf.handle.internal.p1i64(i64 addrspace(1)*)


	; SM20-LABEL: .entry foo			; SM20-LABEL: .entry foo
	Show All 32 Lines

llvm/test/CodeGen/NVPTX/surf-write.ll

	; RUN: llc < %s -march=nvptx -mcpu=sm_20 \| FileCheck %s			; RUN: llc < %s -march=nvptx -mcpu=sm_20 -verify-machineinstrs \| FileCheck %s

	target triple = "nvptx-unknown-nvcl"			target triple = "nvptx-unknown-nvcl"

	declare void @llvm.nvvm.sust.b.1d.i32.trap(i64, i32, i32)			declare void @llvm.nvvm.sust.b.1d.i32.trap(i64, i32, i32)

	; CHECK: .entry foo			; CHECK: .entry foo
	define void @foo(i64 %img, i32 %val, i32 %idx) {			define void @foo(i64 %img, i32 %val, i32 %idx) {
	; CHECK: sust.b.1d.b32.trap [foo_param_0, {%r{{[0-9]+}}}], {%r{{[0-9]+}}}			; CHECK: sust.b.1d.b32.trap [foo_param_0, {%r{{[0-9]+}}}], {%r{{[0-9]+}}}
	tail call void @llvm.nvvm.sust.b.1d.i32.trap(i64 %img, i32 %idx, i32 %val)			tail call void @llvm.nvvm.sust.b.1d.i32.trap(i64 %img, i32 %idx, i32 %val)
	ret void			ret void
	}			}

	!nvvm.annotations = !{!1, !2}			!nvvm.annotations = !{!1, !2}
	!1 = !{void (i64, i32, i32)* @foo, !"kernel", i32 1}			!1 = !{void (i64, i32, i32)* @foo, !"kernel", i32 1}
	!2 = !{void (i64, i32, i32)* @foo, !"wroimage", i32 0}			!2 = !{void (i64, i32, i32)* @foo, !"wroimage", i32 0}

llvm/test/CodeGen/NVPTX/tex-read-cuda.ll

	; RUN: llc < %s -march=nvptx -mcpu=sm_20 \| FileCheck %s --check-prefix=SM20			; RUN: llc < %s -march=nvptx -mcpu=sm_20 -verify-machineinstrs \| FileCheck %s --check-prefix=SM20
	; RUN: llc < %s -march=nvptx -mcpu=sm_30 \| FileCheck %s --check-prefix=SM30			; RUN: llc < %s -march=nvptx -mcpu=sm_30 -verify-machineinstrs \| FileCheck %s --check-prefix=SM30


	target triple = "nvptx-unknown-cuda"			target triple = "nvptx-unknown-cuda"

	declare { float, float, float, float } @llvm.nvvm.tex.unified.1d.v4f32.s32(i64, i32)			declare { float, float, float, float } @llvm.nvvm.tex.unified.1d.v4f32.s32(i64, i32)
	declare i64 @llvm.nvvm.texsurf.handle.internal.p1i64(i64 addrspace(1)*)			declare i64 @llvm.nvvm.texsurf.handle.internal.p1i64(i64 addrspace(1)*)

	; SM20-LABEL: .entry foo			; SM20-LABEL: .entry foo
	Show All 36 Lines

llvm/test/CodeGen/NVPTX/tex-read.ll

	; RUN: llc < %s -march=nvptx -mcpu=sm_20 \| FileCheck %s			; RUN: llc < %s -march=nvptx -mcpu=sm_20 -verify-machineinstrs \| FileCheck %s

	target triple = "nvptx-unknown-nvcl"			target triple = "nvptx-unknown-nvcl"

	declare { float, float, float, float } @llvm.nvvm.tex.1d.v4f32.s32(i64, i64, i32)			declare { float, float, float, float } @llvm.nvvm.tex.1d.v4f32.s32(i64, i64, i32)

	; CHECK: .entry foo			; CHECK: .entry foo
	define void @foo(i64 %img, i64 %sampler, float* %red, i32 %idx) {			define void @foo(i64 %img, i64 %sampler, float* %red, i32 %idx) {
	; CHECK: tex.1d.v4.f32.s32 {%f[[RED:[0-9]+]], %f[[GREEN:[0-9]+]], %f[[BLUE:[0-9]+]], %f[[ALPHA:[0-9]+]]}, [foo_param_0, foo_param_1, {%r{{[0-9]+}}}]			; CHECK: tex.1d.v4.f32.s32 {%f[[RED:[0-9]+]], %f[[GREEN:[0-9]+]], %f[[BLUE:[0-9]+]], %f[[ALPHA:[0-9]+]]}, [foo_param_0, foo_param_1, {%r{{[0-9]+}}}]
	Show All 11 Lines

llvm/test/CodeGen/NVPTX/texsurf-queries.ll

	; RUN: llc < %s -march=nvptx -mcpu=sm_20 \| FileCheck %s --check-prefix=SM20			; RUN: llc < %s -march=nvptx -mcpu=sm_20 -verify-machineinstrs \| FileCheck %s --check-prefix=SM20
	; RUN: llc < %s -march=nvptx -mcpu=sm_30 \| FileCheck %s --check-prefix=SM30			; RUN: llc < %s -march=nvptx -mcpu=sm_30 -verify-machineinstrs \| FileCheck %s --check-prefix=SM30

	target triple = "nvptx-unknown-cuda"			target triple = "nvptx-unknown-cuda"

	@tex0 = internal addrspace(1) global i64 0, align 8			@tex0 = internal addrspace(1) global i64 0, align 8
	@surf0 = internal addrspace(1) global i64 0, align 8			@surf0 = internal addrspace(1) global i64 0, align 8

	declare i32 @llvm.nvvm.txq.width(i64)			declare i32 @llvm.nvvm.txq.width(i64)
	declare i32 @llvm.nvvm.txq.height(i64)			declare i32 @llvm.nvvm.txq.height(i64)
	▲ Show 20 Lines • Show All 93 Lines • Show Last 20 Lines

This is an archive of the discontinued LLVM Phabricator instance.

[NVPTX] Add imm variants for surface and texture instructionsClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 386175

llvm/lib/Target/NVPTX/NVPTXISelDAGToDAG.cpp

llvm/lib/Target/NVPTX/NVPTXIntrinsics.td

llvm/lib/Target/NVPTX/NVPTXReplaceImageHandles.cpp

llvm/test/CodeGen/NVPTX/surf-read-cuda.ll

llvm/test/CodeGen/NVPTX/surf-read.ll

llvm/test/CodeGen/NVPTX/surf-write-cuda.ll

llvm/test/CodeGen/NVPTX/surf-write.ll

llvm/test/CodeGen/NVPTX/tex-read-cuda.ll

llvm/test/CodeGen/NVPTX/tex-read.ll

llvm/test/CodeGen/NVPTX/texsurf-queries.ll

[NVPTX] Add imm variants for surface and texture instructions
ClosedPublic