Diff 302524

mlir/include/mlir/Conversion/StandardToLLVM/ConvertStandardToLLVM.h

Show First 20 Lines • Show All 393 Lines • ▼ Show 20 Lines	public:
static unsigned getNumUnpackedValues() { return 2; }		static unsigned getNumUnpackedValues() { return 2; }

/// Builds IR computing the sizes in bytes (suitable for opaque allocation)		/// Builds IR computing the sizes in bytes (suitable for opaque allocation)
/// and appends the corresponding values into `sizes`.		/// and appends the corresponding values into `sizes`.
static void computeSizes(OpBuilder &builder, Location loc,		static void computeSizes(OpBuilder &builder, Location loc,
LLVMTypeConverter &typeConverter,		LLVMTypeConverter &typeConverter,
ArrayRef<UnrankedMemRefDescriptor> values,		ArrayRef<UnrankedMemRefDescriptor> values,
SmallVectorImpl<Value> &sizes);		SmallVectorImpl<Value> &sizes);

		/// TODO: The following accessors don't take alignment rules between elements
		/// of the descriptor struct into account. For some architectures, it might be
		/// necessary to extend them and to use `llvm::DataLayout` contained in
		/// `LLVMTypeConverter`.

		/// Builds IR extracting the allocated pointer from the descriptor.
		static Value allocatedPtr(OpBuilder &builder, Location loc,
		Value memRefDescPtr, LLVM::LLVMType elemPtrPtrType);
		/// Builds IR inserting the allocated pointer into the descriptor.
		static void setAllocatedPtr(OpBuilder &builder, Location loc,
		Value memRefDescPtr,
		LLVM::LLVMType elemPtrPtrType,
		Value allocatedPtr);

		/// Builds IR extracting the aligned pointer from the descriptor.
		static Value alignedPtr(OpBuilder &builder, Location loc,
		LLVMTypeConverter &typeConverter, Value memRefDescPtr,
		LLVM::LLVMType elemPtrPtrType);
		/// Builds IR inserting the aligned pointer into the descriptor.
		static void setAlignedPtr(OpBuilder &builder, Location loc,
		LLVMTypeConverter &typeConverter,
		Value memRefDescPtr, LLVM::LLVMType elemPtrPtrType,
		Value alignedPtr);

		/// Builds IR extracting the offset from the descriptor.
		static Value offset(OpBuilder &builder, Location loc,
		LLVMTypeConverter &typeConverter, Value memRefDescPtr,
		LLVM::LLVMType elemPtrPtrType);
		/// Builds IR inserting the offset into the descriptor.
		static void setOffset(OpBuilder &builder, Location loc,
		LLVMTypeConverter &typeConverter, Value memRefDescPtr,
		LLVM::LLVMType elemPtrPtrType, Value offset);

		/// Builds IR extracting the pointer to the first element of the size array.
		static Value sizeBasePtr(OpBuilder &builder, Location loc,
		LLVMTypeConverter &typeConverter,
		Value memRefDescPtr, LLVM::LLVMType elemPtrPtrType);
		/// Builds IR extracting the size[index] from the descriptor.
		static Value size(OpBuilder &builder, Location loc,
		LLVMTypeConverter typeConverter, Value sizeBasePtr,
		Value index);
		/// Builds IR inserting the size[index] into the descriptor.
		static void setSize(OpBuilder &builder, Location loc,
		LLVMTypeConverter typeConverter, Value sizeBasePtr,
		Value index, Value size);

		/// Builds IR extracting the pointer to the first element of the stride array.
		static Value strideBasePtr(OpBuilder &builder, Location loc,
		LLVMTypeConverter &typeConverter,
		Value sizeBasePtr, Value rank);
		/// Builds IR extracting the stride[index] from the descriptor.
		static Value stride(OpBuilder &builder, Location loc,
		LLVMTypeConverter typeConverter, Value strideBasePtr,
		Value index, Value stride);
		/// Builds IR inserting the stride[index] into the descriptor.
		static void setStride(OpBuilder &builder, Location loc,
		LLVMTypeConverter typeConverter, Value strideBasePtr,
		Value index, Value stride);
};		};

/// Base class for operation conversions targeting the LLVM IR dialect. It		/// Base class for operation conversions targeting the LLVM IR dialect. It
/// provides the conversion patterns with access to the LLVMTypeConverter and		/// provides the conversion patterns with access to the LLVMTypeConverter and
/// the LowerToLLVMOptions. The class captures the LLVMTypeConverter and the		/// the LowerToLLVMOptions. The class captures the LLVMTypeConverter and the
/// LowerToLLVMOptions by reference meaning the references have to remain alive		/// LowerToLLVMOptions by reference meaning the references have to remain alive
/// during the entire pattern lifetime.		/// during the entire pattern lifetime.
class ConvertToLLVMPattern : public ConversionPattern {		class ConvertToLLVMPattern : public ConversionPattern {
▲ Show 20 Lines • Show All 169 Lines • Show Last 20 Lines

mlir/lib/Conversion/StandardToLLVM/StandardToLLVM.cpp

Show First 20 Lines • Show All 859 Lines • ▼ Show 20 Lines	for (UnrankedMemRefDescriptor desc : values) {

// Total allocation size.		// Total allocation size.
Value allocationSize = builder.create<LLVM::AddOp>(		Value allocationSize = builder.create<LLVM::AddOp>(
loc, indexType, doublePointerSize, rankIndexSize);		loc, indexType, doublePointerSize, rankIndexSize);
sizes.push_back(allocationSize);		sizes.push_back(allocationSize);
}		}
}		}

		Value UnrankedMemRefDescriptor::allocatedPtr(OpBuilder &builder, Location loc,
		Value memRefDescPtr,
		LLVM::LLVMType elemPtrPtrType) {

		Value elementPtrPtr =
		builder.create<LLVM::BitcastOp>(loc, elemPtrPtrType, memRefDescPtr);
		return builder.create<LLVM::LoadOp>(loc, elementPtrPtr);
		}

		void UnrankedMemRefDescriptor::setAllocatedPtr(OpBuilder &builder, Location loc,
		Value memRefDescPtr,
		LLVM::LLVMType elemPtrPtrType,
		Value allocatedPtr) {
		Value elementPtrPtr =
		builder.create<LLVM::BitcastOp>(loc, elemPtrPtrType, memRefDescPtr);
		builder.create<LLVM::StoreOp>(loc, allocatedPtr, elementPtrPtr);
		}

		Value UnrankedMemRefDescriptor::alignedPtr(OpBuilder &builder, Location loc,
		LLVMTypeConverter &typeConverter,
		Value memRefDescPtr,
		LLVM::LLVMType elemPtrPtrType) {
		Value elementPtrPtr =
		builder.create<LLVM::BitcastOp>(loc, elemPtrPtrType, memRefDescPtr);

		Value one =
		createIndexAttrConstant(builder, loc, typeConverter.getIndexType(), 1);
		Value alignedGep = builder.create<LLVM::GEPOp>(
		loc, elemPtrPtrType, elementPtrPtr, ValueRange({one}));
		return builder.create<LLVM::LoadOp>(loc, alignedGep);
		}

		void UnrankedMemRefDescriptor::setAlignedPtr(OpBuilder &builder, Location loc,
		LLVMTypeConverter &typeConverter,
		Value memRefDescPtr,
		LLVM::LLVMType elemPtrPtrType,
		Value alignedPtr) {
		Value elementPtrPtr =
		builder.create<LLVM::BitcastOp>(loc, elemPtrPtrType, memRefDescPtr);

		Value one =
		createIndexAttrConstant(builder, loc, typeConverter.getIndexType(), 1);
		Value alignedGep = builder.create<LLVM::GEPOp>(
		loc, elemPtrPtrType, elementPtrPtr, ValueRange({one}));
		builder.create<LLVM::StoreOp>(loc, alignedPtr, alignedGep);
		}

		Value UnrankedMemRefDescriptor::offset(OpBuilder &builder, Location loc,
		LLVMTypeConverter &typeConverter,
		Value memRefDescPtr,
		LLVM::LLVMType elemPtrPtrType) {
		Value elementPtrPtr =
		builder.create<LLVM::BitcastOp>(loc, elemPtrPtrType, memRefDescPtr);

		Value two =
		createIndexAttrConstant(builder, loc, typeConverter.getIndexType(), 2);
		Value offsetGep = builder.create<LLVM::GEPOp>(
		loc, elemPtrPtrType, elementPtrPtr, ValueRange({two}));
		offsetGep = builder.create<LLVM::BitcastOp>(
		loc, typeConverter.getIndexType().getPointerTo(), offsetGep);
		return builder.create<LLVM::LoadOp>(loc, offsetGep);
		}

		void UnrankedMemRefDescriptor::setOffset(OpBuilder &builder, Location loc,
		LLVMTypeConverter &typeConverter,
		Value memRefDescPtr,
		LLVM::LLVMType elemPtrPtrType,
		Value offset) {
		Value elementPtrPtr =
		builder.create<LLVM::BitcastOp>(loc, elemPtrPtrType, memRefDescPtr);

		Value two =
		createIndexAttrConstant(builder, loc, typeConverter.getIndexType(), 2);
		Value offsetGep = builder.create<LLVM::GEPOp>(
		loc, elemPtrPtrType, elementPtrPtr, ValueRange({two}));
		offsetGep = builder.create<LLVM::BitcastOp>(
		loc, typeConverter.getIndexType().getPointerTo(), offsetGep);
		builder.create<LLVM::StoreOp>(loc, offset, offsetGep);
		}

		Value UnrankedMemRefDescriptor::sizeBasePtr(OpBuilder &builder, Location loc,
		LLVMTypeConverter &typeConverter,
		Value memRefDescPtr,
		LLVM::LLVMType elemPtrPtrType) {
		LLVM::LLVMType elemPtrTy = elemPtrPtrType.getPointerElementTy();
		LLVM::LLVMType indexTy = typeConverter.getIndexType();
		LLVM::LLVMType structPtrTy =
		LLVM::LLVMType::getStructTy(elemPtrTy, elemPtrTy, indexTy, indexTy)
		.getPointerTo();
		Value structPtr =
		builder.create<LLVM::BitcastOp>(loc, structPtrTy, memRefDescPtr);

		LLVM::LLVMType int32_type =
		unwrap(typeConverter.convertType(builder.getI32Type()));
		Value zero =
		createIndexAttrConstant(builder, loc, typeConverter.getIndexType(), 0);
		Value three = builder.create<LLVM::ConstantOp>(loc, int32_type,
		builder.getI32IntegerAttr(3));
		return builder.create<LLVM::GEPOp>(loc, indexTy.getPointerTo(), structPtr,
		ValueRange({zero, three}));
		}

		Value UnrankedMemRefDescriptor::size(OpBuilder &builder, Location loc,
		LLVMTypeConverter typeConverter,
		Value sizeBasePtr, Value index) {
		LLVM::LLVMType indexPtrTy = typeConverter.getIndexType().getPointerTo();
		Value sizeStoreGep = builder.create<LLVM::GEPOp>(loc, indexPtrTy, sizeBasePtr,
		ValueRange({index}));
		return builder.create<LLVM::LoadOp>(loc, sizeStoreGep);
		}

		void UnrankedMemRefDescriptor::setSize(OpBuilder &builder, Location loc,
		LLVMTypeConverter typeConverter,
		Value sizeBasePtr, Value index,
		Value size) {
		LLVM::LLVMType indexPtrTy = typeConverter.getIndexType().getPointerTo();
		Value sizeStoreGep = builder.create<LLVM::GEPOp>(loc, indexPtrTy, sizeBasePtr,
		ValueRange({index}));
		builder.create<LLVM::StoreOp>(loc, size, sizeStoreGep);
		}

		Value UnrankedMemRefDescriptor::strideBasePtr(OpBuilder &builder, Location loc,
		LLVMTypeConverter &typeConverter,
		Value sizeBasePtr, Value rank) {
		LLVM::LLVMType indexPtrTy = typeConverter.getIndexType().getPointerTo();
		return builder.create<LLVM::GEPOp>(loc, indexPtrTy, sizeBasePtr,
		ValueRange({rank}));
		}

		Value UnrankedMemRefDescriptor::stride(OpBuilder &builder, Location loc,
		LLVMTypeConverter typeConverter,
		Value strideBasePtr, Value index,
		Value stride) {
		LLVM::LLVMType indexPtrTy = typeConverter.getIndexType().getPointerTo();
		Value strideStoreGep = builder.create<LLVM::GEPOp>(
		loc, indexPtrTy, strideBasePtr, ValueRange({index}));
		return builder.create<LLVM::LoadOp>(loc, strideStoreGep);
		}

		void UnrankedMemRefDescriptor::setStride(OpBuilder &builder, Location loc,
		LLVMTypeConverter typeConverter,
		Value strideBasePtr, Value index,
		Value stride) {
		LLVM::LLVMType indexPtrTy = typeConverter.getIndexType().getPointerTo();
		Value strideStoreGep = builder.create<LLVM::GEPOp>(
		loc, indexPtrTy, strideBasePtr, ValueRange({index}));
		builder.create<LLVM::StoreOp>(loc, stride, strideStoreGep);
		}

LLVM::LLVMDialect &ConvertToLLVMPattern::getDialect() const {		LLVM::LLVMDialect &ConvertToLLVMPattern::getDialect() const {
return *typeConverter.getDialect();		return *typeConverter.getDialect();
}		}

LLVM::LLVMType ConvertToLLVMPattern::getIndexType() const {		LLVM::LLVMType ConvertToLLVMPattern::getIndexType() const {
return typeConverter.getIndexType();		return typeConverter.getIndexType();
}		}

▲ Show 20 Lines • Show All 1,536 Lines • ▼ Show 20 Lines	if (srcType.isa<MemRefType>() && dstType.isa<UnrankedMemRefType>()) {
auto loadOp = rewriter.create<LLVM::LoadOp>(loc, castPtr);		auto loadOp = rewriter.create<LLVM::LoadOp>(loc, castPtr);
rewriter.replaceOp(op, loadOp.getResult());		rewriter.replaceOp(op, loadOp.getResult());
} else {		} else {
llvm_unreachable("Unsupported unranked memref to unranked memref cast");		llvm_unreachable("Unsupported unranked memref to unranked memref cast");
}		}
}		}
};		};

		/// Extracts allocated, aligned pointers and offset from a ranked or unranked
		ftynseUnsubmitted Done Reply Inline Actions Nit: could we have a doc for this function? ftynse: Nit: could we have a doc for this function?
		/// memref type. In unranked case, the fields are extracted from the underlying
		/// ranked descriptor.
		static void extractPointersAndOffset(Location loc,
		ConversionPatternRewriter &rewriter,
		LLVMTypeConverter &typeConverter,
		Value originalOperand,
		Value convertedOperand,
		Value allocatedPtr, Value alignedPtr,
		Value *offset = nullptr) {
		Type operandType = originalOperand.getType();
		if (operandType.isa<MemRefType>()) {
		MemRefDescriptor desc(convertedOperand);
		*allocatedPtr = desc.allocatedPtr(rewriter, loc);
		*alignedPtr = desc.alignedPtr(rewriter, loc);
		if (offset != nullptr)
		*offset = desc.offset(rewriter, loc);
		return;
		}

		unsigned memorySpace =
		operandType.cast<UnrankedMemRefType>().getMemorySpace();
		Type elementType = operandType.cast<UnrankedMemRefType>().getElementType();
		LLVM::LLVMType llvmElementType =
		unwrap(typeConverter.convertType(elementType));
		LLVM::LLVMType elementPtrPtrType =
		llvmElementType.getPointerTo(memorySpace).getPointerTo();

		// Extract pointer to the underlying ranked memref descriptor and cast it to
		// ElemType**.
		UnrankedMemRefDescriptor unrankedDesc(convertedOperand);
		Value underlyingDescPtr = unrankedDesc.memRefDescPtr(rewriter, loc);

		*allocatedPtr = UnrankedMemRefDescriptor::allocatedPtr(
		rewriter, loc, underlyingDescPtr, elementPtrPtrType);
		*alignedPtr = UnrankedMemRefDescriptor::alignedPtr(
		rewriter, loc, typeConverter, underlyingDescPtr, elementPtrPtrType);
		ftynseUnsubmitted Done Reply Inline Actions Nit: would it be reasonable to have these things as additional accessors on `UnrankedMemRefDescriptor`? ftynse: Nit: would it be reasonable to have these things as additional accessors on…
		if (offset != nullptr) {
		*offset = UnrankedMemRefDescriptor::offset(
		rewriter, loc, typeConverter, underlyingDescPtr, elementPtrPtrType);
		}
		}

struct MemRefReinterpretCastOpLowering		struct MemRefReinterpretCastOpLowering
: public ConvertOpToLLVMPattern<MemRefReinterpretCastOp> {		: public ConvertOpToLLVMPattern<MemRefReinterpretCastOp> {
using ConvertOpToLLVMPattern<MemRefReinterpretCastOp>::ConvertOpToLLVMPattern;		using ConvertOpToLLVMPattern<MemRefReinterpretCastOp>::ConvertOpToLLVMPattern;

LogicalResult		LogicalResult
matchAndRewrite(Operation *op, ArrayRef<Value> operands,		matchAndRewrite(Operation *op, ArrayRef<Value> operands,
ConversionPatternRewriter &rewriter) const override {		ConversionPatternRewriter &rewriter) const override {
auto castOp = cast<MemRefReinterpretCastOp>(op);		auto castOp = cast<MemRefReinterpretCastOp>(op);
MemRefReinterpretCastOp::Adaptor adaptor(operands, op->getAttrDictionary());		MemRefReinterpretCastOp::Adaptor adaptor(operands, op->getAttrDictionary());
		ftynseUnsubmitted Done Reply Inline Actions I wonder if we cannot run into issues because of alignment properties on some weird architectures. The descriptor structure is not packed, so it is subject to alignment rules between elements as defined by LLVM's data layout. I don't have an example offhand, so it may be always fine, so I'd appreciate an argument why it is a safe thing to do in a comment. Otherwise, `LLVMTypeConverter` contains the `llvm::DataLayout` that we are targeting, which can be used to get proper offsets of elements in bytes and do all indexing arithmetic after bitcasting to `i8`. ftynse:* I wonder if we cannot run into issues because of alignment properties on some weird…
		pifon2aAuthorUnsubmitted Done Reply Inline Actions I am not sure how many architectures, not to mention weird ones, are using unranked code generation. I would leave it like that for now and use `llvm::DataLayout` later if needed. pifon2a: I am not sure how many architectures, not to mention weird ones, are using unranked code…
		ftynseUnsubmitted Done Reply Inline Actions Let's keep a TODO comment then. If we ever run into a problem, will be easier to debug. ftynse: Let's keep a TODO comment then. If we ever run into a problem, will be easier to debug.
Type srcType = castOp.source().getType();		Type srcType = castOp.source().getType();

Value descriptor;		Value descriptor;
if (failed(convertSourceMemRefToDescriptor(rewriter, srcType, castOp,		if (failed(convertSourceMemRefToDescriptor(rewriter, srcType, castOp,
adaptor, &descriptor)))		adaptor, &descriptor)))
return failure();		return failure();
rewriter.replaceOp(op, {descriptor});		rewriter.replaceOp(op, {descriptor});
return success();		return success();
Show All 13 Lines	if (!llvmTargetDescriptorTy \|\| !llvmTargetDescriptorTy.isStructTy())
return failure();		return failure();

// Create descriptor.		// Create descriptor.
Location loc = castOp.getLoc();		Location loc = castOp.getLoc();
auto desc = MemRefDescriptor::undef(rewriter, loc, llvmTargetDescriptorTy);		auto desc = MemRefDescriptor::undef(rewriter, loc, llvmTargetDescriptorTy);

// Set allocated and aligned pointers.		// Set allocated and aligned pointers.
Value allocatedPtr, alignedPtr;		Value allocatedPtr, alignedPtr;
extractPointers(loc, rewriter, castOp.source(), adaptor.source(),		extractPointersAndOffset(loc, rewriter, typeConverter, castOp.source(),
&allocatedPtr, &alignedPtr);		adaptor.source(), &allocatedPtr, &alignedPtr);
desc.setAllocatedPtr(rewriter, loc, allocatedPtr);		desc.setAllocatedPtr(rewriter, loc, allocatedPtr);
desc.setAlignedPtr(rewriter, loc, alignedPtr);		desc.setAlignedPtr(rewriter, loc, alignedPtr);

// Set offset.		// Set offset.
if (castOp.isDynamicOffset(0))		if (castOp.isDynamicOffset(0))
desc.setOffset(rewriter, loc, adaptor.offsets()[0]);		desc.setOffset(rewriter, loc, adaptor.offsets()[0]);
else		else
desc.setConstantOffset(rewriter, loc, castOp.getStaticOffset(0));		desc.setConstantOffset(rewriter, loc, castOp.getStaticOffset(0));
Show All 10 Lines	for (unsigned i = 0, e = targetMemRefType.getRank(); i < e; ++i) {
if (castOp.isDynamicStride(i))		if (castOp.isDynamicStride(i))
desc.setStride(rewriter, loc, i, adaptor.strides()[dynStrideId++]);		desc.setStride(rewriter, loc, i, adaptor.strides()[dynStrideId++]);
else		else
desc.setConstantStride(rewriter, loc, i, castOp.getStaticStride(i));		desc.setConstantStride(rewriter, loc, i, castOp.getStaticStride(i));
}		}
*descriptor = desc;		*descriptor = desc;
return success();		return success();
}		}
		};

void extractPointers(Location loc, ConversionPatternRewriter &rewriter,		struct MemRefReshapeOpLowering
Value originalOperand, Value convertedOperand,		: public ConvertOpToLLVMPattern<MemRefReshapeOp> {
Value allocatedPtr, Value alignedPtr) const {		using ConvertOpToLLVMPattern<MemRefReshapeOp>::ConvertOpToLLVMPattern;
Type operandType = originalOperand.getType();
if (operandType.isa<MemRefType>()) {		LogicalResult
MemRefDescriptor desc(convertedOperand);		matchAndRewrite(Operation *op, ArrayRef<Value> operands,
*allocatedPtr = desc.allocatedPtr(rewriter, loc);		ConversionPatternRewriter &rewriter) const override {
*alignedPtr = desc.alignedPtr(rewriter, loc);		auto reshapeOp = cast<MemRefReshapeOp>(op);
return;
		MemRefReshapeOp::Adaptor adaptor(operands, op->getAttrDictionary());
		ftynseUnsubmitted Done Reply Inline Actions Nit: LLVM::LLVMType was fine here ftynse: Nit: LLVM::LLVMType was fine here
		Type srcType = reshapeOp.source().getType();

		ftynseUnsubmitted Done Reply Inline Actions Please fix ftynse: Please fix
		Value descriptor;
		if (failed(convertSourceMemRefToDescriptor(rewriter, srcType, reshapeOp,
		adaptor, &descriptor)))
		return failure();
		rewriter.replaceOp(op, {descriptor});
		return success();
}		}

unsigned memorySpace =		private:
operandType.cast<UnrankedMemRefType>().getMemorySpace();		LogicalResult
Type elementType = operandType.cast<UnrankedMemRefType>().getElementType();		convertSourceMemRefToDescriptor(ConversionPatternRewriter &rewriter,
		Type srcType, MemRefReshapeOp reshapeOp,
		MemRefReshapeOp::Adaptor adaptor,
		Value *descriptor) const {
		// Conversion for statically-known shape args is performed via
		// `memref_reinterpret_cast`.
		auto shapeMemRefType = reshapeOp.shape().getType().cast<MemRefType>();
		if (shapeMemRefType.hasStaticShape())
		return failure();

		// The shape is a rank-1 tensor with unknown length.
		Location loc = reshapeOp.getLoc();
		MemRefDescriptor shapeDesc(adaptor.shape());
		Value resultRank = shapeDesc.size(rewriter, loc, 0);

		// Extract address space and element type.
		ftynseUnsubmitted Done Reply Inline Actions Can't we use createIndexConstant instead here? Or at least not hardcode i32, I think there was some option controlling the bit size of the address arithmetic ftynse: Can't we use createIndexConstant instead here? Or at least not hardcode i32, I think there was…
		auto targetType =
		reshapeOp.getResult().getType().cast<UnrankedMemRefType>();
		unsigned addressSpace = targetType.getMemorySpace();
		Type elementType = targetType.getElementType();

		// Create the unranked memref descriptor that holds the ranked one. The
		// inner descriptor is allocated on stack.
		auto targetDesc = UnrankedMemRefDescriptor::undef(
		rewriter, loc, unwrap(typeConverter.convertType(targetType)));
		ftynseUnsubmitted Done Reply Inline Actions Putting these addressing tricks (which are cool, I must admit!) into the `UnrankedMemRefDescriptor` sounds even more appealing to me. Since we seem to always need the triple allocated/aligned/store, we can have a function for those. ftynse: Putting these addressing tricks (which are cool, I must admit!) into the…
		pifon2aAuthorUnsubmitted Done Reply Inline Actions I added setters/getters to `UnrankedMemRefDescriptor`. At first I intended to have a separate PR that adds them, but it looks like the current PR is the best way to actually test them. pifon2a: I added setters/getters to `UnrankedMemRefDescriptor`. At first I intended to have a separate…
		targetDesc.setRank(rewriter, loc, resultRank);
		SmallVector<Value, 4> sizes;
		UnrankedMemRefDescriptor::computeSizes(rewriter, loc, typeConverter,
		targetDesc, sizes);
		Value underlyingDescPtr = rewriter.create<LLVM::AllocaOp>(
		loc, getVoidPtrType(), sizes.front(), llvm::None);
		targetDesc.setMemRefDescPtr(rewriter, loc, underlyingDescPtr);

		// Extract pointers and offset from the source memref.
		Value allocatedPtr, alignedPtr, offset;
		extractPointersAndOffset(loc, rewriter, typeConverter, reshapeOp.source(),
		adaptor.source(), &allocatedPtr, &alignedPtr,
		&offset);

		// Set pointers and offset.
LLVM::LLVMType llvmElementType =		LLVM::LLVMType llvmElementType =
typeConverter.convertType(elementType).cast<LLVM::LLVMType>();		unwrap(typeConverter.convertType(elementType));
LLVM::LLVMType elementPtrPtrType =		LLVM::LLVMType elementPtrPtrType =
llvmElementType.getPointerTo(memorySpace).getPointerTo();		llvmElementType.getPointerTo(addressSpace).getPointerTo();
		UnrankedMemRefDescriptor::setAllocatedPtr(rewriter, loc, underlyingDescPtr,
		elementPtrPtrType, allocatedPtr);
		UnrankedMemRefDescriptor::setAlignedPtr(rewriter, loc, typeConverter,
		ftynseUnsubmitted Done Reply Inline Actions `addArgument` is invalid in conversion patterns, similarly to other in-place updates. `rewriter.createBlock` creates block with arguments, but you'd need to clone the remaining operations in there. Maybe `splitBlock` can be extended to also add arguments to the newly created block. (I suspect the addArgument will most likely just work even if we rollback the change, but it may run into some bad use-def loop) ftynse: `addArgument` is invalid in conversion patterns, similarly to other in-place updates. `rewriter.
		pifon2aAuthorUnsubmitted Done Reply Inline Actions extending `splitBlock` looks much harder than just using `createBlock` and cloning the remaining ops. I ll do that tomorrow. pifon2a: extending `splitBlock` looks much harder than just using `createBlock` and cloning the…
		underlyingDescPtr,
		elementPtrPtrType, alignedPtr);
		UnrankedMemRefDescriptor::setOffset(rewriter, loc, typeConverter,
		underlyingDescPtr, elementPtrPtrType,
		offset);

		// Use the offset pointer as base for further addressing. Copy over the new
		// shape and compute strides. For this, we create a loop from rank-1 to 0.
		Value targetSizesBase = UnrankedMemRefDescriptor::sizeBasePtr(
		rewriter, loc, typeConverter, underlyingDescPtr, elementPtrPtrType);
		Value targetStridesBase = UnrankedMemRefDescriptor::strideBasePtr(
		rewriter, loc, typeConverter, targetSizesBase, resultRank);
		Value shapeOperandPtr = shapeDesc.alignedPtr(rewriter, loc);
		Value oneIndex = createIndexConstant(rewriter, loc, 1);
		Value resultRankMinusOne =
		rewriter.create<LLVM::SubOp>(loc, resultRank, oneIndex);

// Extract pointer to the underlying ranked memref descriptor and cast it to		Block *initBlock = rewriter.getInsertionBlock();
// ElemType**.		LLVM::LLVMType indexType = typeConverter.getIndexType();
UnrankedMemRefDescriptor unrankedDesc(convertedOperand);		Block::iterator remainingOpsIt = std::next(rewriter.getInsertionPoint());
Value underlyingDescPtr = unrankedDesc.memRefDescPtr(rewriter, loc);
Value elementPtrPtr = rewriter.create<LLVM::BitcastOp>(		Block *condBlock = rewriter.createBlock(initBlock->getParent(), {},
loc, elementPtrPtrType, underlyingDescPtr);		{indexType, indexType});
		ftynseUnsubmitted Done Reply Inline Actions (Beyond the scope): I wonder if we could later refactor this and the SCF-to-std lowering in a `createLoop(function_ref bodyBuilder, function_ref conditionBuilder)` that produces std control flow; the pattern infra will then lower the std ops into LLVM automatically. ftynse: (Beyond the scope): I wonder if we could later refactor this and the SCF-to-std lowering in a…
		pifon2aAuthorUnsubmitted Done Reply Inline Actions Yes, that would be much more readable. pifon2a: Yes, that would be much more readable.

		// Iterate over the remaining ops in initBlock and move them to condBlock.
		BlockAndValueMapping map;
		for (auto it = remainingOpsIt, e = initBlock->end(); it != e; ++it) {
		rewriter.clone(*it, map);
		rewriter.eraseOp(&*it);
		}

LLVM::LLVMType int32Type =		rewriter.setInsertionPointToEnd(initBlock);
typeConverter.convertType(rewriter.getI32Type()).cast<LLVM::LLVMType>();		rewriter.create<LLVM::BrOp>(loc, ValueRange({resultRankMinusOne, oneIndex}),
		condBlock);
		rewriter.setInsertionPointToStart(condBlock);
		Value indexArg = condBlock->getArgument(0);
		Value strideArg = condBlock->getArgument(1);

		Value zeroIndex = createIndexConstant(rewriter, loc, 0);
		Value pred = rewriter.create<LLVM::ICmpOp>(
		loc, LLVM::LLVMType::getInt1Ty(rewriter.getContext()),
		LLVM::ICmpPredicate::sge, indexArg, zeroIndex);

		Block *bodyBlock =
		rewriter.splitBlock(condBlock, rewriter.getInsertionPoint());
		rewriter.setInsertionPointToStart(bodyBlock);

		// Copy size from shape to descriptor.
		LLVM::LLVMType llvmIndexPtrType = indexType.getPointerTo();
		Value sizeLoadGep = rewriter.create<LLVM::GEPOp>(
		loc, llvmIndexPtrType, shapeOperandPtr, ValueRange{indexArg});
		Value size = rewriter.create<LLVM::LoadOp>(loc, sizeLoadGep);
		UnrankedMemRefDescriptor::setSize(rewriter, loc, typeConverter,
		targetSizesBase, indexArg, size);

		// Write stride value and compute next one.
		UnrankedMemRefDescriptor::setStride(rewriter, loc, typeConverter,
		targetStridesBase, indexArg, strideArg);
		Value nextStride = rewriter.create<LLVM::MulOp>(loc, strideArg, size);

		// Decrement loop counter and branch back.
		Value decrement = rewriter.create<LLVM::SubOp>(loc, indexArg, oneIndex);
		rewriter.create<LLVM::BrOp>(loc, ValueRange({decrement, nextStride}),
		condBlock);

		Block *remainder =
		rewriter.splitBlock(bodyBlock, rewriter.getInsertionPoint());

		// Hook up the cond exit to the remainder.
		rewriter.setInsertionPointToEnd(condBlock);
		rewriter.create<LLVM::CondBrOp>(loc, pred, bodyBlock, llvm::None, remainder,
		llvm::None);

// Extract and set allocated pointer.		// Reset position to beginning of new remainder block.
*allocatedPtr = rewriter.create<LLVM::LoadOp>(loc, elementPtrPtr);		rewriter.setInsertionPointToStart(remainder);

// Extract and set aligned pointer.		*descriptor = targetDesc;
Value one = rewriter.create<LLVM::ConstantOp>(		return success();
loc, int32Type, rewriter.getI32IntegerAttr(1));
Value alignedGep = rewriter.create<LLVM::GEPOp>(
loc, elementPtrPtrType, elementPtrPtr, ValueRange({one}));
*alignedPtr = rewriter.create<LLVM::LoadOp>(loc, alignedGep);
}		}
};		};

struct DialectCastOpLowering		struct DialectCastOpLowering
: public ConvertOpToLLVMPattern<LLVM::DialectCastOp> {		: public ConvertOpToLLVMPattern<LLVM::DialectCastOp> {
using ConvertOpToLLVMPattern<LLVM::DialectCastOp>::ConvertOpToLLVMPattern;		using ConvertOpToLLVMPattern<LLVM::DialectCastOp>::ConvertOpToLLVMPattern;

LogicalResult		LogicalResult
▲ Show 20 Lines • Show All 1,104 Lines • ▼ Show 20 Lines	void mlir::populateStdToLLVMMemoryConversionPatterns(
// clang-format off		// clang-format off
patterns.insert<		patterns.insert<
AssumeAlignmentOpLowering,		AssumeAlignmentOpLowering,
DeallocOpLowering,		DeallocOpLowering,
DimOpLowering,		DimOpLowering,
LoadOpLowering,		LoadOpLowering,
MemRefCastOpLowering,		MemRefCastOpLowering,
MemRefReinterpretCastOpLowering,		MemRefReinterpretCastOpLowering,
		MemRefReshapeOpLowering,
RankOpLowering,		RankOpLowering,
StoreOpLowering,		StoreOpLowering,
SubViewOpLowering,		SubViewOpLowering,
TransposeOpLowering,		TransposeOpLowering,
ViewOpLowering>(converter);		ViewOpLowering>(converter);
// clang-format on		// clang-format on
if (converter.getOptions().useAlignedAlloc)		if (converter.getOptions().useAlignedAlloc)
patterns.insert<AlignedAllocOpLowering>(converter);		patterns.insert<AlignedAllocOpLowering>(converter);
▲ Show 20 Lines • Show All 161 Lines • Show Last 20 Lines

mlir/test/Conversion/StandardToLLVM/convert-dynamic-memref-ops.mlir

	Show First 20 Lines • Show All 472 Lines • ▼ Show 20 Lines
	// CHECK-SAME: ([[OFFSET:%[a-z,0-9]+]]: !llvm.i64,			// CHECK-SAME: ([[OFFSET:%[a-z,0-9]+]]: !llvm.i64,
	// CHECK-SAME: [[SIZE_0:%[a-z,0-9]+]]: !llvm.i64, [[SIZE_1:%[a-z,0-9]+]]: !llvm.i64,			// CHECK-SAME: [[SIZE_0:%[a-z,0-9]+]]: !llvm.i64, [[SIZE_1:%[a-z,0-9]+]]: !llvm.i64,
	// CHECK-SAME: [[STRIDE_0:%[a-z,0-9]+]]: !llvm.i64, [[STRIDE_1:%[a-z,0-9]+]]: !llvm.i64,			// CHECK-SAME: [[STRIDE_0:%[a-z,0-9]+]]: !llvm.i64, [[STRIDE_1:%[a-z,0-9]+]]: !llvm.i64,
	// CHECK: [[INPUT:%.]] = llvm.insertvalue {{.}}[1] : !llvm.struct<(i64, ptr<i8>)>			// CHECK: [[INPUT:%.]] = llvm.insertvalue {{.}}[1] : !llvm.struct<(i64, ptr<i8>)>
	// CHECK: [[OUT_0:%.]] = llvm.mlir.undef : [[TY:!.]]			// CHECK: [[OUT_0:%.]] = llvm.mlir.undef : [[TY:!.]]
	// CHECK: [[DESCRIPTOR:%.*]] = llvm.extractvalue [[INPUT]][1] : !llvm.struct<(i64, ptr<i8>)>			// CHECK: [[DESCRIPTOR:%.*]] = llvm.extractvalue [[INPUT]][1] : !llvm.struct<(i64, ptr<i8>)>
	// CHECK: [[BASE_PTR_PTR:%.*]] = llvm.bitcast [[DESCRIPTOR]] : !llvm.ptr<i8> to !llvm.ptr<ptr<float>>			// CHECK: [[BASE_PTR_PTR:%.*]] = llvm.bitcast [[DESCRIPTOR]] : !llvm.ptr<i8> to !llvm.ptr<ptr<float>>
	// CHECK: [[BASE_PTR:%.*]] = llvm.load [[BASE_PTR_PTR]] : !llvm.ptr<ptr<float>>			// CHECK: [[BASE_PTR:%.*]] = llvm.load [[BASE_PTR_PTR]] : !llvm.ptr<ptr<float>>
	// CHECK: [[C1:%.*]] = llvm.mlir.constant(1 : i32) : !llvm.i32			// CHECK: [[BASE_PTR_PTR_:%.*]] = llvm.bitcast [[DESCRIPTOR]] : !llvm.ptr<i8> to !llvm.ptr<ptr<float>>
	// CHECK: [[ALIGNED_PTR_PTR:%.*]] = llvm.getelementptr [[BASE_PTR_PTR]]{{\[}}[[C1]]]			// CHECK: [[C1:%.*]] = llvm.mlir.constant(1 : index) : !llvm.i64
	// CHECK-SAME: : (!llvm.ptr<ptr<float>>, !llvm.i32) -> !llvm.ptr<ptr<float>>			// CHECK: [[ALIGNED_PTR_PTR:%.*]] = llvm.getelementptr [[BASE_PTR_PTR_]]{{\[}}[[C1]]]
				// CHECK-SAME: : (!llvm.ptr<ptr<float>>, !llvm.i64) -> !llvm.ptr<ptr<float>>
	// CHECK: [[ALIGNED_PTR:%.*]] = llvm.load [[ALIGNED_PTR_PTR]] : !llvm.ptr<ptr<float>>			// CHECK: [[ALIGNED_PTR:%.*]] = llvm.load [[ALIGNED_PTR_PTR]] : !llvm.ptr<ptr<float>>
	// CHECK: [[OUT_1:%.*]] = llvm.insertvalue [[BASE_PTR]], [[OUT_0]][0] : [[TY]]			// CHECK: [[OUT_1:%.*]] = llvm.insertvalue [[BASE_PTR]], [[OUT_0]][0] : [[TY]]
	// CHECK: [[OUT_2:%.*]] = llvm.insertvalue [[ALIGNED_PTR]], [[OUT_1]][1] : [[TY]]			// CHECK: [[OUT_2:%.*]] = llvm.insertvalue [[ALIGNED_PTR]], [[OUT_1]][1] : [[TY]]
	// CHECK: [[OUT_3:%.*]] = llvm.insertvalue [[OFFSET]], [[OUT_2]][2] : [[TY]]			// CHECK: [[OUT_3:%.*]] = llvm.insertvalue [[OFFSET]], [[OUT_2]][2] : [[TY]]
	// CHECK: [[OUT_4:%.*]] = llvm.insertvalue [[SIZE_0]], [[OUT_3]][3, 0] : [[TY]]			// CHECK: [[OUT_4:%.*]] = llvm.insertvalue [[SIZE_0]], [[OUT_3]][3, 0] : [[TY]]
	// CHECK: [[OUT_5:%.*]] = llvm.insertvalue [[STRIDE_0]], [[OUT_4]][4, 0] : [[TY]]			// CHECK: [[OUT_5:%.*]] = llvm.insertvalue [[STRIDE_0]], [[OUT_4]][4, 0] : [[TY]]
	// CHECK: [[OUT_6:%.*]] = llvm.insertvalue [[SIZE_1]], [[OUT_5]][3, 1] : [[TY]]			// CHECK: [[OUT_6:%.*]] = llvm.insertvalue [[SIZE_1]], [[OUT_5]][3, 1] : [[TY]]
	// CHECK: [[OUT_7:%.*]] = llvm.insertvalue [[STRIDE_1]], [[OUT_6]][4, 1] : [[TY]]			// CHECK: [[OUT_7:%.*]] = llvm.insertvalue [[STRIDE_1]], [[OUT_6]][4, 1] : [[TY]]

				// CHECK-LABEL: @memref_reshape
				func @memref_reshape(%input : memref<2x3xf32>, %shape : memref<?xindex>) {
				%output = memref_reshape %input(%shape)
				: (memref<2x3xf32>, memref<?xindex>) -> memref<*xf32>
				return
				}
				// CHECK: [[INPUT:%.]] = llvm.insertvalue %{{.}}, %{{.}}[4, 1] : [[INPUT_TY:!.]]
				// CHECK: [[SHAPE:%.]] = llvm.insertvalue %{{.}}, %{{.}}[4, 0] : [[SHAPE_TY:!.]]
				// CHECK: [[RANK:%.*]] = llvm.extractvalue [[SHAPE]][3, 0] : [[SHAPE_TY]]
				// CHECK: [[UNRANKED_OUT_O:%.*]] = llvm.mlir.undef : !llvm.struct<(i64, ptr<i8>)>
				// CHECK: [[UNRANKED_OUT_1:%.*]] = llvm.insertvalue [[RANK]], [[UNRANKED_OUT_O]][0] : !llvm.struct<(i64, ptr<i8>)>

				// Compute size in bytes to allocate result ranked descriptor
				// CHECK: [[C1:%.*]] = llvm.mlir.constant(1 : index) : !llvm.i64
				// CHECK: [[C2:%.*]] = llvm.mlir.constant(2 : index) : !llvm.i64
				// CHECK: [[PTR_SIZE:%.*]] = llvm.mlir.constant(8 : index) : !llvm.i64
				// CHECK: [[INDEX_SIZE:%.*]] = llvm.mlir.constant(8 : index) : !llvm.i64
				// CHECK: [[DOUBLE_PTR_SIZE:%.*]] = llvm.mul [[C2]], [[PTR_SIZE]] : !llvm.i64
				// CHECK: [[DESC_ALLOC_SIZE:%.]] = llvm.add [[DOUBLE_PTR_SIZE]], %{{.}}
				// CHECK: [[UNDERLYING_DESC:%.*]] = llvm.alloca [[DESC_ALLOC_SIZE]] x !llvm.i8
				// CHECK: llvm.insertvalue [[UNDERLYING_DESC]], [[UNRANKED_OUT_1]][1]

				// Set allocated, aligned pointers and offset.
				// CHECK: [[ALLOC_PTR:%.*]] = llvm.extractvalue [[INPUT]][0] : [[INPUT_TY]]
				// CHECK: [[ALIGN_PTR:%.*]] = llvm.extractvalue [[INPUT]][1] : [[INPUT_TY]]
				// CHECK: [[OFFSET:%.*]] = llvm.extractvalue [[INPUT]][2] : [[INPUT_TY]]
				// CHECK: [[BASE_PTR_PTR:%.*]] = llvm.bitcast [[UNDERLYING_DESC]]
				// CHECK-SAME: !llvm.ptr<i8> to !llvm.ptr<ptr<float>>
				// CHECK: llvm.store [[ALLOC_PTR]], [[BASE_PTR_PTR]] : !llvm.ptr<ptr<float>>
				// CHECK: [[BASE_PTR_PTR_:%.*]] = llvm.bitcast [[UNDERLYING_DESC]] : !llvm.ptr<i8> to !llvm.ptr<ptr<float>>
				// CHECK: [[C1:%.*]] = llvm.mlir.constant(1 : index) : !llvm.i64
				// CHECK: [[ALIGNED_PTR_PTR:%.*]] = llvm.getelementptr [[BASE_PTR_PTR_]]{{\[}}[[C1]]]
				// CHECK: llvm.store [[ALIGN_PTR]], [[ALIGNED_PTR_PTR]] : !llvm.ptr<ptr<float>>
				// CHECK: [[BASE_PTR_PTR__:%.*]] = llvm.bitcast [[UNDERLYING_DESC]] : !llvm.ptr<i8> to !llvm.ptr<ptr<float>>
				// CHECK: [[C2:%.*]] = llvm.mlir.constant(2 : index) : !llvm.i64
				// CHECK: [[OFFSET_PTR_:%.*]] = llvm.getelementptr [[BASE_PTR_PTR__]]{{\[}}[[C2]]]
				// CHECK: [[OFFSET_PTR:%.*]] = llvm.bitcast [[OFFSET_PTR_]]
				// CHECK: llvm.store [[OFFSET]], [[OFFSET_PTR]] : !llvm.ptr<i64>

				// Iterate over shape operand in reverse order and set sizes and strides.
				// CHECK: [[STRUCT_PTR:%.*]] = llvm.bitcast [[UNDERLYING_DESC]]
				// CHECK-SAME: !llvm.ptr<i8> to !llvm.ptr<struct<(ptr<float>, ptr<float>, i64, i64)>>
				// CHECK: [[C0:%.*]] = llvm.mlir.constant(0 : index) : !llvm.i64
				// CHECK: [[C3_I32:%.*]] = llvm.mlir.constant(3 : i32) : !llvm.i32
				// CHECK: [[SIZES_PTR:%.*]] = llvm.getelementptr [[STRUCT_PTR]]{{\[}}[[C0]], [[C3_I32]]]
				// CHECK: [[STRIDES_PTR:%.*]] = llvm.getelementptr [[SIZES_PTR]]{{\[}}[[RANK]]]
				// CHECK: [[SHAPE_IN_PTR:%.*]] = llvm.extractvalue [[SHAPE]][1] : [[SHAPE_TY]]
				// CHECK: [[C1_:%.*]] = llvm.mlir.constant(1 : index) : !llvm.i64
				// CHECK: [[RANK_MIN_1:%.*]] = llvm.sub [[RANK]], [[C1_]] : !llvm.i64
				// CHECK: llvm.br ^bb1([[RANK_MIN_1]], [[C1_]] : !llvm.i64, !llvm.i64)

				// CHECK: ^bb1([[DIM:%.]]: !llvm.i64, [[CUR_STRIDE:%.]]: !llvm.i64):
				// CHECK: [[C0_:%.*]] = llvm.mlir.constant(0 : index) : !llvm.i64
				// CHECK: [[COND:%.*]] = llvm.icmp "sge" [[DIM]], [[C0_]] : !llvm.i64
				// CHECK: llvm.cond_br [[COND]], ^bb2, ^bb3

				// CHECK: ^bb2:
				// CHECK: [[SIZE_PTR:%.*]] = llvm.getelementptr [[SHAPE_IN_PTR]]{{\[}}[[DIM]]]
				// CHECK: [[SIZE:%.*]] = llvm.load [[SIZE_PTR]] : !llvm.ptr<i64>
				// CHECK: [[TARGET_SIZE_PTR:%.*]] = llvm.getelementptr [[SIZES_PTR]]{{\[}}[[DIM]]]
				// CHECK: llvm.store [[SIZE]], [[TARGET_SIZE_PTR]] : !llvm.ptr<i64>
				// CHECK: [[TARGET_STRIDE_PTR:%.*]] = llvm.getelementptr [[STRIDES_PTR]]{{\[}}[[DIM]]]
				// CHECK: llvm.store [[CUR_STRIDE]], [[TARGET_STRIDE_PTR]] : !llvm.ptr<i64>
				// CHECK: [[UPDATE_STRIDE:%.*]] = llvm.mul [[CUR_STRIDE]], [[SIZE]] : !llvm.i64
				// CHECK: [[STRIDE_COND:%.*]] = llvm.sub [[DIM]], [[C1_]] : !llvm.i64
				// CHECK: llvm.br ^bb1([[STRIDE_COND]], [[UPDATE_STRIDE]] : !llvm.i64, !llvm.i64)

				// CHECK: ^bb3:
				// CHECK: llvm.return

mlir/test/mlir-cpu-runner/memref_reshape.mlir

// RUN: mlir-opt %s -convert-scf-to-std -convert-std-to-llvm --print-ir-after-all \		// RUN: mlir-opt %s -convert-scf-to-std -convert-std-to-llvm \
// RUN: \| mlir-cpu-runner -e main -entry-point-result=void \		// RUN: \| mlir-cpu-runner -e main -entry-point-result=void \
// RUN: -shared-libs=%mlir_runner_utils_dir/libmlir_runner_utils%shlibext,%mlir_runner_utils_dir/libmlir_c_runner_utils%shlibext \		// RUN: -shared-libs=%mlir_runner_utils_dir/libmlir_runner_utils%shlibext,%mlir_runner_utils_dir/libmlir_c_runner_utils%shlibext \
// RUN: \| FileCheck %s		// RUN: \| FileCheck %s


func @print_memref_f32(memref<*xf32>) attributes { llvm.emit_c_interface }		func @print_memref_f32(memref<*xf32>) attributes { llvm.emit_c_interface }

func @main() -> () {		func @main() -> () {
Show All 24 Lines	func @main() -> () {
store %c3, %shape[%c0] : memref<2xindex>		store %c3, %shape[%c0] : memref<2xindex>
store %c2, %shape[%c1] : memref<2xindex>		store %c2, %shape[%c1] : memref<2xindex>

// Test cases.		// Test cases.
call @reshape_ranked_memref_to_ranked(%input, %shape)		call @reshape_ranked_memref_to_ranked(%input, %shape)
: (memref<2x3xf32>, memref<2xindex>) -> ()		: (memref<2x3xf32>, memref<2xindex>) -> ()
call @reshape_unranked_memref_to_ranked(%input, %shape)		call @reshape_unranked_memref_to_ranked(%input, %shape)
: (memref<2x3xf32>, memref<2xindex>) -> ()		: (memref<2x3xf32>, memref<2xindex>) -> ()
		call @reshape_ranked_memref_to_unranked(%input, %shape)
		: (memref<2x3xf32>, memref<2xindex>) -> ()
		call @reshape_unranked_memref_to_unranked(%input, %shape)
		: (memref<2x3xf32>, memref<2xindex>) -> ()
return		return
}		}

func @reshape_ranked_memref_to_ranked(%input : memref<2x3xf32>,		func @reshape_ranked_memref_to_ranked(%input : memref<2x3xf32>,
%shape : memref<2xindex>) {		%shape : memref<2xindex>) {
%output = memref_reshape %input(%shape)		%output = memref_reshape %input(%shape)
: (memref<2x3xf32>, memref<2xindex>) -> memref<?x?xf32>		: (memref<2x3xf32>, memref<2xindex>) -> memref<?x?xf32>

%unranked_output = memref_cast %output : memref<?x?xf32> to memref<*xf32>		%unranked_output = memref_cast %output : memref<?x?xf32> to memref<*xf32>
call @print_memref_f32(%unranked_output) : (memref<*xf32>) -> ()		call @print_memref_f32(%unranked_output) : (memref<*xf32>) -> ()
// CHECK: rank = 2 offset = 0 sizes = [3, 2] strides = [2, 1] data =		// CHECK: rank = 2 offset = 0 sizes = [3, 2] strides = [2, 1] data =
// CHECK: [0, 1],		// CHECK: [0, 1],
// CHECK: [2, 3],		// CHECK: [2, 3],
// CHECK: [4, 5]		// CHECK: [4, 5]
return		return
}		}

func @reshape_unranked_memref_to_ranked(%input : memref<2x3xf32>,		func @reshape_unranked_memref_to_ranked(%input : memref<2x3xf32>,
%shape : memref<2xindex>) {		%shape : memref<2xindex>) {
%unranked_input = memref_cast %input : memref<2x3xf32> to memref<*xf32>		%unranked_input = memref_cast %input : memref<2x3xf32> to memref<*xf32>
%output = memref_reshape %input(%shape)		%output = memref_reshape %input(%shape)
: (memref<2x3xf32>, memref<2xindex>) -> memref<?x?xf32>		: (memref<2x3xf32>, memref<2xindex>) -> memref<?x?xf32>

%unranked_output = memref_cast %output : memref<?x?xf32> to memref<*xf32>		%unranked_output = memref_cast %output : memref<?x?xf32> to memref<*xf32>
call @print_memref_f32(%unranked_output) : (memref<*xf32>) -> ()		call @print_memref_f32(%unranked_output) : (memref<*xf32>) -> ()
// CHECK: rank = 2 offset = 0 sizes = [3, 2] strides = [2, 1] data =		// CHECK: rank = 2 offset = 0 sizes = [3, 2] strides = [2, 1] data =
// CHECK: [0, 1],		// CHECK: [0, 1],
// CHECK: [2, 3],		// CHECK: [2, 3],
// CHECK: [4, 5]		// CHECK: [4, 5]
return		return
}		}

		func @reshape_ranked_memref_to_unranked(%input : memref<2x3xf32>,
		%shape : memref<2xindex>) {
		%dyn_size_shape = memref_cast %shape : memref<2xindex> to memref<?xindex>
		%output = memref_reshape %input(%dyn_size_shape)
		: (memref<2x3xf32>, memref<?xindex>) -> memref<*xf32>

		call @print_memref_f32(%output) : (memref<*xf32>) -> ()
		// CHECK: rank = 2 offset = 0 sizes = [3, 2] strides = [2, 1] data =
		// CHECK: [0, 1],
		// CHECK: [2, 3],
		// CHECK: [4, 5]
		return
		}

		func @reshape_unranked_memref_to_unranked(%input : memref<2x3xf32>,
		%shape : memref<2xindex>) {
		%unranked_input = memref_cast %input : memref<2x3xf32> to memref<*xf32>
		%dyn_size_shape = memref_cast %shape : memref<2xindex> to memref<?xindex>
		%output = memref_reshape %input(%dyn_size_shape)
		: (memref<2x3xf32>, memref<?xindex>) -> memref<*xf32>

		call @print_memref_f32(%output) : (memref<*xf32>) -> ()
		// CHECK: rank = 2 offset = 0 sizes = [3, 2] strides = [2, 1] data =
		// CHECK: [0, 1],
		// CHECK: [2, 3],
		// CHECK: [4, 5]
		return
		}

This is an archive of the discontinued LLVM Phabricator instance.

[mlir] Convert `memref_reshape` to LLVM.
ClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 302524

mlir/include/mlir/Conversion/StandardToLLVM/ConvertStandardToLLVM.h

mlir/lib/Conversion/StandardToLLVM/StandardToLLVM.cpp

mlir/test/Conversion/StandardToLLVM/convert-dynamic-memref-ops.mlir

mlir/test/mlir-cpu-runner/memref_reshape.mlir

This is an archive of the discontinued LLVM Phabricator instance.

[mlir] Convert `memref_reshape` to LLVM.ClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 302524

mlir/include/mlir/Conversion/StandardToLLVM/ConvertStandardToLLVM.h

mlir/lib/Conversion/StandardToLLVM/StandardToLLVM.cpp

mlir/test/Conversion/StandardToLLVM/convert-dynamic-memref-ops.mlir

mlir/test/mlir-cpu-runner/memref_reshape.mlir

[mlir] Convert `memref_reshape` to LLVM.
ClosedPublic