This is an archive of the discontinued LLVM Phabricator instance.

lib/Target/AMDGPU/R600ISelLowering.cpp
1182 ↗	(On Diff #82051)	Using MERGE_VALUES does not work (I tried using TOKEN_FACTOR as well, and it did not work either). I think that the 1<->1 chain dummy node that I create gets eliminated before lowerPrivateTruncStore can use it. Dumping StoreNode on line 1213 confirms that after using MERGE_VALUES it still uses EntryToken as chain.

Why are all the test changes for local memory read/write, when the code changes behavior for private memory stores?

In D27964#629386, @tstellarAMD wrote:

Why are all the test changes for local memory read/write, when the code changes behavior for private memory stores?

similar changes were necessary for constant/global tests but D24746, made the checks a bit more loose so they pass without changes.
The tests cast vectors with elements of sub-i32 types. The conversion results in stack slot stores/loads (Redundant MOVs mentioned in constant/global tests' TODOs ).
I don't remember exactly whether the stack loads/stores come directly from expandUnalignedStores, or ExpandOp_BITCAST (I looked into it for D24745).

hopefully, providing better machinePointerInfo will help eliminate all of those stack accesses.

For some reason, tests in store-private.ll did not see the issue when storing to generic private AS pointer, and already test for correct sequence of RMWs.

ping

arsenm added inline comments.Jan 9 2017, 11:00 AM

lib/Target/AMDGPU/R600ISelLowering.cpp
1182 ↗	(On Diff #82051)	Can you post the version of the patch that uses that? DUMMY_CHAIN is a big hack

jvesely added inline comments.Jan 9 2017, 11:16 AM

lib/Target/AMDGPU/R600ISelLowering.cpp
1182 ↗	(On Diff #82051)	it does not work. both MERGE_VALUES and TOKEN_FACTOR using single chain input are removed before the individual vector stores are expanded.

jvesely added inline comments.Jan 10 2017, 5:26 PM

lib/Target/AMDGPU/R600ISelLowering.cpp
1182 ↗	(On Diff #82051)	to be more specific. Those nodes won't even be created. SelectionDAG::getNode(SelectionDAG.cpp:3322), returns just the operand for MERGE_VALUES and TokenFactor if there is only one operand. Moreover, given that inputs are legalized before the Node, I need a chain Node that is guaranteed to survive legalization process.

ping.
should I be looking into alternative approaches?
of the 3 I considered (D24745, this one, and using results of AA), this one seems to be the least ugly.

LGTM. I think there's a better solution but I'm not sure if it's worth investing in the effort

lib/Target/AMDGPU/R600Instructions.td
731 ↗	(On Diff #82051)	Typo: tog et

This revision is now accepted and ready to land.Jan 20 2017, 12:02 PM

Closed by commit rL292651: AMDGPU/R600: Serialize vector trunc stores to private AS (authored by jvesely). · Explain WhyJan 20 2017, 1:35 PM

This revision was automatically updated to reflect the committed changes.

Revision Contents

Path

Size

llvm/

trunk/

lib/

Target/

AMDGPU/

AMDGPUISelLowering.h

1 line

AMDGPUISelLowering.cpp

1 line

AMDGPUInstrInfo.td

3 lines

R600ISelLowering.cpp

28 lines

R600Instructions.td

14 lines

test/

CodeGen/

AMDGPU/

load-local-i8.ll

30 lines

Diff 85183

llvm/trunk/lib/Target/AMDGPU/AMDGPUISelLowering.h

Show First 20 Lines • Show All 324 Lines • ▼ Show 20 Lines	enum NodeType : unsigned {
CONST_DATA_PTR,		CONST_DATA_PTR,
SENDMSG,		SENDMSG,
SENDMSGHALT,		SENDMSGHALT,
INTERP_MOV,		INTERP_MOV,
INTERP_P1,		INTERP_P1,
INTERP_P2,		INTERP_P2,
PC_ADD_REL_OFFSET,		PC_ADD_REL_OFFSET,
KILL,		KILL,
		DUMMY_CHAIN,
FIRST_MEM_OPCODE_NUMBER = ISD::FIRST_TARGET_MEMORY_OPCODE,		FIRST_MEM_OPCODE_NUMBER = ISD::FIRST_TARGET_MEMORY_OPCODE,
STORE_MSKOR,		STORE_MSKOR,
LOAD_CONSTANT,		LOAD_CONSTANT,
TBUFFER_STORE_FORMAT,		TBUFFER_STORE_FORMAT,
ATOMIC_CMP_SWAP,		ATOMIC_CMP_SWAP,
ATOMIC_INC,		ATOMIC_INC,
ATOMIC_DEC,		ATOMIC_DEC,
BUFFER_LOAD,		BUFFER_LOAD,
Show All 10 Lines

llvm/trunk/lib/Target/AMDGPU/AMDGPUISelLowering.cpp

Show First 20 Lines • Show All 3,272 Lines • ▼ Show 20 Lines	const char* AMDGPUTargetLowering::getTargetNodeName(unsigned Opcode) const {
NODE_NAME_CASE(CVT_F32_UBYTE0)		NODE_NAME_CASE(CVT_F32_UBYTE0)
NODE_NAME_CASE(CVT_F32_UBYTE1)		NODE_NAME_CASE(CVT_F32_UBYTE1)
NODE_NAME_CASE(CVT_F32_UBYTE2)		NODE_NAME_CASE(CVT_F32_UBYTE2)
NODE_NAME_CASE(CVT_F32_UBYTE3)		NODE_NAME_CASE(CVT_F32_UBYTE3)
NODE_NAME_CASE(BUILD_VERTICAL_VECTOR)		NODE_NAME_CASE(BUILD_VERTICAL_VECTOR)
NODE_NAME_CASE(CONST_DATA_PTR)		NODE_NAME_CASE(CONST_DATA_PTR)
NODE_NAME_CASE(PC_ADD_REL_OFFSET)		NODE_NAME_CASE(PC_ADD_REL_OFFSET)
NODE_NAME_CASE(KILL)		NODE_NAME_CASE(KILL)
		NODE_NAME_CASE(DUMMY_CHAIN)
case AMDGPUISD::FIRST_MEM_OPCODE_NUMBER: break;		case AMDGPUISD::FIRST_MEM_OPCODE_NUMBER: break;
NODE_NAME_CASE(SENDMSG)		NODE_NAME_CASE(SENDMSG)
NODE_NAME_CASE(SENDMSGHALT)		NODE_NAME_CASE(SENDMSGHALT)
NODE_NAME_CASE(INTERP_MOV)		NODE_NAME_CASE(INTERP_MOV)
NODE_NAME_CASE(INTERP_P1)		NODE_NAME_CASE(INTERP_P1)
NODE_NAME_CASE(INTERP_P2)		NODE_NAME_CASE(INTERP_P2)
NODE_NAME_CASE(STORE_MSKOR)		NODE_NAME_CASE(STORE_MSKOR)
NODE_NAME_CASE(LOAD_CONSTANT)		NODE_NAME_CASE(LOAD_CONSTANT)
▲ Show 20 Lines • Show All 121 Lines • Show Last 20 Lines

llvm/trunk/lib/Target/AMDGPU/AMDGPUInstrInfo.td

	Show First 20 Lines • Show All 48 Lines • ▼ Show 20 Lines
	def AMDGPUconstdata_ptr : SDNode<			def AMDGPUconstdata_ptr : SDNode<
	"AMDGPUISD::CONST_DATA_PTR", SDTypeProfile <1, 1, [SDTCisVT<0, iPTR>,			"AMDGPUISD::CONST_DATA_PTR", SDTypeProfile <1, 1, [SDTCisVT<0, iPTR>,
	SDTCisVT<0, iPTR>]>			SDTCisVT<0, iPTR>]>
	>;			>;

	// This argument to this node is a dword address.			// This argument to this node is a dword address.
	def AMDGPUdwordaddr : SDNode<"AMDGPUISD::DWORDADDR", SDTIntUnaryOp>;			def AMDGPUdwordaddr : SDNode<"AMDGPUISD::DWORDADDR", SDTIntUnaryOp>;

				// Force dependencies for vector trunc stores
				def R600dummy_chain : SDNode<"AMDGPUISD::DUMMY_CHAIN", SDTNone, [SDNPHasChain]>;

	def AMDGPUcos : SDNode<"AMDGPUISD::COS_HW", SDTFPUnaryOp>;			def AMDGPUcos : SDNode<"AMDGPUISD::COS_HW", SDTFPUnaryOp>;
	def AMDGPUsin : SDNode<"AMDGPUISD::SIN_HW", SDTFPUnaryOp>;			def AMDGPUsin : SDNode<"AMDGPUISD::SIN_HW", SDTFPUnaryOp>;

	// out = a - floor(a)			// out = a - floor(a)
	def AMDGPUfract : SDNode<"AMDGPUISD::FRACT", SDTFPUnaryOp>;			def AMDGPUfract : SDNode<"AMDGPUISD::FRACT", SDTFPUnaryOp>;

	// out = 1.0 / a			// out = 1.0 / a
	def AMDGPUrcp : SDNode<"AMDGPUISD::RCP", SDTFPUnaryOp>;			def AMDGPUrcp : SDNode<"AMDGPUISD::RCP", SDTFPUnaryOp>;
	▲ Show 20 Lines • Show All 271 Lines • Show Last 20 Lines

llvm/trunk/lib/Target/AMDGPU/R600ISelLowering.cpp

Show First 20 Lines • Show All 1,114 Lines • ▼ Show 20 Lines	if (Store->getMemoryVT() == MVT::i8) {
Mask = DAG.getConstant(0xff, DL, MVT::i32);		Mask = DAG.getConstant(0xff, DL, MVT::i32);
} else if (Store->getMemoryVT() == MVT::i16) {		} else if (Store->getMemoryVT() == MVT::i16) {
assert(Store->getAlignment() >= 2);		assert(Store->getAlignment() >= 2);
Mask = DAG.getConstant(0xffff, DL, MVT::i32);;		Mask = DAG.getConstant(0xffff, DL, MVT::i32);;
} else {		} else {
llvm_unreachable("Unsupported private trunc store");		llvm_unreachable("Unsupported private trunc store");
}		}

SDValue Chain = Store->getChain();		SDValue OldChain = Store->getChain();
		bool VectorTrunc = (OldChain.getOpcode() == AMDGPUISD::DUMMY_CHAIN);
		// Skip dummy
		SDValue Chain = VectorTrunc ? OldChain->getOperand(0) : OldChain;
SDValue BasePtr = Store->getBasePtr();		SDValue BasePtr = Store->getBasePtr();
SDValue Offset = Store->getOffset();		SDValue Offset = Store->getOffset();
EVT MemVT = Store->getMemoryVT();		EVT MemVT = Store->getMemoryVT();

SDValue LoadPtr = BasePtr;		SDValue LoadPtr = BasePtr;
if (!Offset.isUndef()) {		if (!Offset.isUndef()) {
LoadPtr = DAG.getNode(ISD::ADD, DL, MVT::i32, BasePtr, Offset);		LoadPtr = DAG.getNode(ISD::ADD, DL, MVT::i32, BasePtr, Offset);
}		}
Show All 39 Lines	SDValue R600TargetLowering::lowerPrivateTruncStore(StoreSDNode *Store,
// Cleanup the target bits		// Cleanup the target bits
Dst = DAG.getNode(ISD::AND, DL, MVT::i32, Dst, DstMask);		Dst = DAG.getNode(ISD::AND, DL, MVT::i32, Dst, DstMask);

// Add the new bits		// Add the new bits
SDValue Value = DAG.getNode(ISD::OR, DL, MVT::i32, Dst, ShiftedValue);		SDValue Value = DAG.getNode(ISD::OR, DL, MVT::i32, Dst, ShiftedValue);

// Store dword		// Store dword
// TODO: Can we be smarter about MachinePointerInfo?		// TODO: Can we be smarter about MachinePointerInfo?
return DAG.getStore(Chain, DL, Value, Ptr, MachinePointerInfo());		SDValue NewStore = DAG.getStore(Chain, DL, Value, Ptr, MachinePointerInfo());

		// If we are part of expanded vector, make our neighbors depend on this store
		if (VectorTrunc) {
		// Make all other vector elements depend on this store
		Chain = DAG.getNode(AMDGPUISD::DUMMY_CHAIN, DL, MVT::Other, NewStore);
		DAG.ReplaceAllUsesOfValueWith(OldChain, Chain);
		}
		return NewStore;
}		}

SDValue R600TargetLowering::LowerSTORE(SDValue Op, SelectionDAG &DAG) const {		SDValue R600TargetLowering::LowerSTORE(SDValue Op, SelectionDAG &DAG) const {
StoreSDNode *StoreNode = cast<StoreSDNode>(Op);		StoreSDNode *StoreNode = cast<StoreSDNode>(Op);
unsigned AS = StoreNode->getAddressSpace();		unsigned AS = StoreNode->getAddressSpace();

SDValue Chain = StoreNode->getChain();		SDValue Chain = StoreNode->getChain();
SDValue Ptr = StoreNode->getBasePtr();		SDValue Ptr = StoreNode->getBasePtr();
SDValue Value = StoreNode->getValue();		SDValue Value = StoreNode->getValue();

EVT VT = Value.getValueType();		EVT VT = Value.getValueType();
EVT MemVT = StoreNode->getMemoryVT();		EVT MemVT = StoreNode->getMemoryVT();
EVT PtrVT = Ptr.getValueType();		EVT PtrVT = Ptr.getValueType();

SDLoc DL(Op);		SDLoc DL(Op);

// Neither LOCAL nor PRIVATE can do vectors at the moment		// Neither LOCAL nor PRIVATE can do vectors at the moment
if ((AS == AMDGPUAS::LOCAL_ADDRESS \|\| AS == AMDGPUAS::PRIVATE_ADDRESS) &&		if ((AS == AMDGPUAS::LOCAL_ADDRESS \|\| AS == AMDGPUAS::PRIVATE_ADDRESS) &&
VT.isVector()) {		VT.isVector()) {
		if ((AS == AMDGPUAS::PRIVATE_ADDRESS) && StoreNode->isTruncatingStore()) {
		// Add an extra level of chain to isolate this vector
		SDValue NewChain = DAG.getNode(AMDGPUISD::DUMMY_CHAIN, DL, MVT::Other, Chain);
		// TODO: can the chain be replaced without creating a new store?
		SDValue NewStore = DAG.getTruncStore(
		NewChain, DL, Value, Ptr, StoreNode->getPointerInfo(),
		MemVT, StoreNode->getAlignment(),
		StoreNode->getMemOperand()->getFlags(), StoreNode->getAAInfo());
		StoreNode = cast<StoreSDNode>(NewStore);
		}

return scalarizeVectorStore(StoreNode, DAG);		return scalarizeVectorStore(StoreNode, DAG);
}		}

unsigned Align = StoreNode->getAlignment();		unsigned Align = StoreNode->getAlignment();
if (Align < MemVT.getStoreSize() &&		if (Align < MemVT.getStoreSize() &&
!allowsMisalignedMemoryAccesses(MemVT, AS, Align, nullptr)) {		!allowsMisalignedMemoryAccesses(MemVT, AS, Align, nullptr)) {
return expandUnalignedStore(StoreNode, DAG);		return expandUnalignedStore(StoreNode, DAG);
}		}
Show All 18 Lines	if (StoreNode->isTruncatingStore()) {
SDValue ByteIndex = DAG.getNode(ISD::AND, DL, PtrVT, Ptr,		SDValue ByteIndex = DAG.getNode(ISD::AND, DL, PtrVT, Ptr,
DAG.getConstant(0x00000003, DL, PtrVT));		DAG.getConstant(0x00000003, DL, PtrVT));
SDValue BitShift = DAG.getNode(ISD::SHL, DL, VT, ByteIndex,		SDValue BitShift = DAG.getNode(ISD::SHL, DL, VT, ByteIndex,
DAG.getConstant(3, DL, VT));		DAG.getConstant(3, DL, VT));

// Put the mask in correct place		// Put the mask in correct place
SDValue Mask = DAG.getNode(ISD::SHL, DL, VT, MaskConstant, BitShift);		SDValue Mask = DAG.getNode(ISD::SHL, DL, VT, MaskConstant, BitShift);

// Put the mask in correct place		// Put the value bits in correct place
SDValue TruncValue = DAG.getNode(ISD::AND, DL, VT, Value, MaskConstant);		SDValue TruncValue = DAG.getNode(ISD::AND, DL, VT, Value, MaskConstant);
SDValue ShiftedValue = DAG.getNode(ISD::SHL, DL, VT, TruncValue, BitShift);		SDValue ShiftedValue = DAG.getNode(ISD::SHL, DL, VT, TruncValue, BitShift);

// XXX: If we add a 64-bit ZW register class, then we could use a 2 x i32		// XXX: If we add a 64-bit ZW register class, then we could use a 2 x i32
// vector instead.		// vector instead.
SDValue Src[4] = {		SDValue Src[4] = {
ShiftedValue,		ShiftedValue,
DAG.getConstant(0, DL, MVT::i32),		DAG.getConstant(0, DL, MVT::i32),
▲ Show 20 Lines • Show All 949 Lines • Show Last 20 Lines

llvm/trunk/lib/Target/AMDGPU/R600Instructions.td

	Show First 20 Lines • Show All 721 Lines • ▼ Show 20 Lines
	def FRACT : R600_1OP_Helper <0x10, "FRACT", AMDGPUfract>;			def FRACT : R600_1OP_Helper <0x10, "FRACT", AMDGPUfract>;
	def TRUNC : R600_1OP_Helper <0x11, "TRUNC", ftrunc>;			def TRUNC : R600_1OP_Helper <0x11, "TRUNC", ftrunc>;
	def CEIL : R600_1OP_Helper <0x12, "CEIL", fceil>;			def CEIL : R600_1OP_Helper <0x12, "CEIL", fceil>;
	def RNDNE : R600_1OP_Helper <0x13, "RNDNE", frint>;			def RNDNE : R600_1OP_Helper <0x13, "RNDNE", frint>;
	def FLOOR : R600_1OP_Helper <0x14, "FLOOR", ffloor>;			def FLOOR : R600_1OP_Helper <0x14, "FLOOR", ffloor>;

	def MOV : R600_1OP <0x19, "MOV", []>;			def MOV : R600_1OP <0x19, "MOV", []>;


				// This is a hack to get rid of DUMMY_CHAIN nodes.
				// Most DUMMY_CHAINs should be eliminated during legalization, but undef
				// values can sneak in some to selection.
				let isPseudo = 1, isCodeGenOnly = 1 in {
				def DUMMY_CHAIN : AMDGPUInst <
				(outs),
				(ins),
				"DUMMY_CHAIN",
				[(R600dummy_chain)]
				>;
				} // end let isPseudo = 1, isCodeGenOnly = 1


	let isPseudo = 1, isCodeGenOnly = 1, usesCustomInserter = 1 in {			let isPseudo = 1, isCodeGenOnly = 1, usesCustomInserter = 1 in {

	class MOV_IMM <ValueType vt, Operand immType> : AMDGPUInst <			class MOV_IMM <ValueType vt, Operand immType> : AMDGPUInst <
	(outs R600_Reg32:$dst),			(outs R600_Reg32:$dst),
	(ins immType:$imm),			(ins immType:$imm),
	"",			"",
	[]			[]
	>;			>;
	▲ Show 20 Lines • Show All 996 Lines • Show Last 20 Lines

llvm/trunk/test/CodeGen/AMDGPU/load-local-i8.ll

Show First 20 Lines • Show All 702 Lines • ▼ Show 20 Lines	define void @local_zextload_v4i8_to_v4i16(<4 x i16> addrspace(3)* %out, <4 x i8> addrspace(3)* %in) #0 {
%ext = zext <4 x i8> %load to <4 x i16>		%ext = zext <4 x i8> %load to <4 x i16>
store <4 x i16> %ext, <4 x i16> addrspace(3)* %out		store <4 x i16> %ext, <4 x i16> addrspace(3)* %out
ret void		ret void
}		}

; FUNC-LABEL: {{^}}local_sextload_v4i8_to_v4i16:		; FUNC-LABEL: {{^}}local_sextload_v4i8_to_v4i16:

; EG: LDS_READ_RET		; EG: LDS_READ_RET
		; TODO: these do LSHR + BFE_INT, instead of just BFE_INT/ASHR
		; EG-DAG: BFE_INT
; EG-DAG: BFE_INT		; EG-DAG: BFE_INT
; EG-DAG: BFE_INT		; EG-DAG: BFE_INT
; EG-DAG: BFE_INT		; EG-DAG: BFE_INT
; EG-DAG: ASHR
; EG: LDS_WRITE		; EG: LDS_WRITE
; EG: LDS_WRITE		; EG: LDS_WRITE
define void @local_sextload_v4i8_to_v4i16(<4 x i16> addrspace(3)* %out, <4 x i8> addrspace(3)* %in) #0 {		define void @local_sextload_v4i8_to_v4i16(<4 x i16> addrspace(3)* %out, <4 x i8> addrspace(3)* %in) #0 {
%load = load <4 x i8>, <4 x i8> addrspace(3)* %in		%load = load <4 x i8>, <4 x i8> addrspace(3)* %in
%ext = sext <4 x i8> %load to <4 x i16>		%ext = sext <4 x i8> %load to <4 x i16>
store <4 x i16> %ext, <4 x i16> addrspace(3)* %out		store <4 x i16> %ext, <4 x i16> addrspace(3)* %out
ret void		ret void
}		}
Show All 12 Lines	define void @local_zextload_v8i8_to_v8i16(<8 x i16> addrspace(3)* %out, <8 x i8> addrspace(3)* %in) #0 {
store <8 x i16> %ext, <8 x i16> addrspace(3)* %out		store <8 x i16> %ext, <8 x i16> addrspace(3)* %out
ret void		ret void
}		}

; FUNC-LABEL: {{^}}local_sextload_v8i8_to_v8i16:		; FUNC-LABEL: {{^}}local_sextload_v8i8_to_v8i16:

; EG: LDS_READ_RET		; EG: LDS_READ_RET
; EG: LDS_READ_RET		; EG: LDS_READ_RET
		; TODO: these do LSHR + BFE_INT, instead of just BFE_INT/ASHR
		; EG-DAG: BFE_INT
		; EG-DAG: BFE_INT
; EG-DAG: BFE_INT		; EG-DAG: BFE_INT
; EG-DAG: BFE_INT		; EG-DAG: BFE_INT
; EG-DAG: BFE_INT		; EG-DAG: BFE_INT
; EG-DAG: BFE_INT		; EG-DAG: BFE_INT
; EG-DAG: BFE_INT		; EG-DAG: BFE_INT
; EG-DAG: BFE_INT		; EG-DAG: BFE_INT
; EG-DAG: ASHR
; EG-DAG: ASHR
; EG: LDS_WRITE		; EG: LDS_WRITE
; EG: LDS_WRITE		; EG: LDS_WRITE
; EG: LDS_WRITE		; EG: LDS_WRITE
; EG: LDS_WRITE		; EG: LDS_WRITE
define void @local_sextload_v8i8_to_v8i16(<8 x i16> addrspace(3)* %out, <8 x i8> addrspace(3)* %in) #0 {		define void @local_sextload_v8i8_to_v8i16(<8 x i16> addrspace(3)* %out, <8 x i8> addrspace(3)* %in) #0 {
%load = load <8 x i8>, <8 x i8> addrspace(3)* %in		%load = load <8 x i8>, <8 x i8> addrspace(3)* %in
%ext = sext <8 x i8> %load to <8 x i16>		%ext = sext <8 x i8> %load to <8 x i16>
store <8 x i16> %ext, <8 x i16> addrspace(3)* %out		store <8 x i16> %ext, <8 x i16> addrspace(3)* %out
Show All 22 Lines
}		}

; FUNC-LABEL: {{^}}local_sextload_v16i8_to_v16i16:		; FUNC-LABEL: {{^}}local_sextload_v16i8_to_v16i16:

; EG: LDS_READ_RET		; EG: LDS_READ_RET
; EG: LDS_READ_RET		; EG: LDS_READ_RET
; EG: LDS_READ_RET		; EG: LDS_READ_RET
; EG: LDS_READ_RET		; EG: LDS_READ_RET
		; TODO: these do LSHR + BFE_INT, instead of just BFE_INT/ASHR
		; EG-DAG: BFE_INT
		; EG-DAG: BFE_INT
		; EG-DAG: BFE_INT
		; EG-DAG: BFE_INT
; EG-DAG: BFE_INT		; EG-DAG: BFE_INT
; EG-DAG: BFE_INT		; EG-DAG: BFE_INT
; EG-DAG: BFE_INT		; EG-DAG: BFE_INT
; EG-DAG: BFE_INT		; EG-DAG: BFE_INT
; EG-DAG: BFE_INT		; EG-DAG: BFE_INT
; EG-DAG: BFE_INT		; EG-DAG: BFE_INT
; EG-DAG: BFE_INT		; EG-DAG: BFE_INT
; EG-DAG: BFE_INT		; EG-DAG: BFE_INT
; EG-DAG: BFE_INT		; EG-DAG: BFE_INT
; EG-DAG: BFE_INT		; EG-DAG: BFE_INT
; EG-DAG: BFE_INT		; EG-DAG: BFE_INT
; EG-DAG: BFE_INT		; EG-DAG: BFE_INT
; EG-DAG: ASHR
; EG-DAG: ASHR
; EG-DAG: ASHR
; EG-DAG: ASHR
; EG: LDS_WRITE		; EG: LDS_WRITE
; EG: LDS_WRITE		; EG: LDS_WRITE
; EG: LDS_WRITE		; EG: LDS_WRITE
; EG: LDS_WRITE		; EG: LDS_WRITE
; EG: LDS_WRITE		; EG: LDS_WRITE
; EG: LDS_WRITE		; EG: LDS_WRITE
; EG: LDS_WRITE		; EG: LDS_WRITE
; EG: LDS_WRITE		; EG: LDS_WRITE
▲ Show 20 Lines • Show All 42 Lines • ▼ Show 20 Lines
; EG: LDS_READ_RET		; EG: LDS_READ_RET
; EG: LDS_READ_RET		; EG: LDS_READ_RET
; EG: LDS_READ_RET		; EG: LDS_READ_RET
; EG: LDS_READ_RET		; EG: LDS_READ_RET
; EG: LDS_READ_RET		; EG: LDS_READ_RET
; EG: LDS_READ_RET		; EG: LDS_READ_RET
; EG: LDS_READ_RET		; EG: LDS_READ_RET
; EG: LDS_READ_RET		; EG: LDS_READ_RET
		; TODO: these do LSHR + BFE_INT, instead of just BFE_INT/ASHR
		; EG-DAG: BFE_INT
		; EG-DAG: BFE_INT
		; EG-DAG: BFE_INT
		; EG-DAG: BFE_INT
; EG-DAG: BFE_INT		; EG-DAG: BFE_INT
; EG-DAG: BFE_INT		; EG-DAG: BFE_INT
; EG-DAG: BFE_INT		; EG-DAG: BFE_INT
; EG-DAG: BFE_INT		; EG-DAG: BFE_INT
; EG-DAG: BFE_INT		; EG-DAG: BFE_INT
; EG-DAG: BFE_INT		; EG-DAG: BFE_INT
; EG-DAG: BFE_INT		; EG-DAG: BFE_INT
; EG-DAG: BFE_INT		; EG-DAG: BFE_INT
; EG-DAG: BFE_INT		; EG-DAG: BFE_INT
; EG-DAG: BFE_INT		; EG-DAG: BFE_INT
; EG-DAG: BFE_INT		; EG-DAG: BFE_INT
; EG-DAG: BFE_INT		; EG-DAG: BFE_INT
; EG-DAG: BFE_INT		; EG-DAG: BFE_INT
; EG-DAG: BFE_INT		; EG-DAG: BFE_INT
; EG-DAG: BFE_INT		; EG-DAG: BFE_INT
; EG-DAG: BFE_INT		; EG-DAG: BFE_INT
; EG-DAG: BFE_INT		; EG-DAG: BFE_INT
; EG-DAG: BFE_INT		; EG-DAG: BFE_INT
; EG-DAG: BFE_INT		; EG-DAG: BFE_INT
; EG-DAG: BFE_INT		; EG-DAG: BFE_INT
; EG-DAG: BFE_INT		; EG-DAG: BFE_INT
; EG-DAG: BFE_INT		; EG-DAG: BFE_INT
; EG-DAG: BFE_INT		; EG-DAG: BFE_INT
; EG-DAG: BFE_INT		; EG-DAG: BFE_INT
; EG-DAG: ASHR
; EG-DAG: ASHR
; EG-DAG: ASHR
; EG-DAG: ASHR
; EG-DAG: ASHR
; EG-DAG: ASHR
; EG-DAG: ASHR
; EG-DAG: ASHR
; EG: LDS_WRITE		; EG: LDS_WRITE
; EG: LDS_WRITE		; EG: LDS_WRITE
; EG: LDS_WRITE		; EG: LDS_WRITE
; EG: LDS_WRITE		; EG: LDS_WRITE
; EG: LDS_WRITE		; EG: LDS_WRITE
; EG: LDS_WRITE		; EG: LDS_WRITE
; EG: LDS_WRITE		; EG: LDS_WRITE
; EG: LDS_WRITE		; EG: LDS_WRITE
Show All 32 Lines

This is an archive of the discontinued LLVM Phabricator instance.

AMDGPU/R600: Serialize vector trunc stores to private ASClosedPublic

Details

Diff Detail

Event Timeline