This is an archive of the discontinued LLVM Phabricator instance.

Paths

Table of Contentst

-
mlir/
-
include/mlir/Dialect/Linalg/Utils/
-
mlir/
-
Dialect/
-
Linalg/
-
Utils/
-
Utils.h
-
lib/Dialect/Linalg/
-
Dialect/
-
Linalg/
-
Transforms/
-
Fusion.cpp
-
Tiling.cpp
-
Utils/
-
Utils.cpp
-
test/Dialect/Linalg/
-
Dialect/
-
Linalg/
-
fusion-pattern.mlir
-
fusion-sequence.mlir
-
fusion-tensor-pattern.mlir
-
fusion.mlir
-
tile-and-fuse-tensors.mlir
-
tile-conv-padding.mlir
-
tile-conv.mlir
-
tile-simple-conv.mlir
-
tile.mlir

Differential D109267

[mlir][linalg] Tiling: Use loop ub in extract_slice size computation if possible
ClosedPublic

Authored by springerm on Sep 4 2021, 12:46 AM.

Download Raw Diff

Details

Reviewers

nicolasvasilache

Commits

rGc95a7246a38a: [mlir][linalg] Tiling: Use loop ub in extract_slice size computation if possible

Summary

When tiling a LinalgOp, extract_slice/insert_slice pairs are inserted. To avoid going out-of-bounds when the tile size does not divide the shape size evenly (at the boundary), AffineMin ops are inserted. Some ops have assumptions regarding the dimensions of inputs/outputs. E.g., in a A * B matmul, dim(A, 1) == dim(B, 0). However, loop bounds use either dim(A, 1) or dim(B, 0).

With this change, AffineMin ops are expressed in terms of loop bounds instead of tensor sizes. (Both have the same runtime value.) This simplifies canonicalizations.

Depends On D108270

Diff Detail

Repository: rG LLVM Github Monorepo

Event Timeline

springerm created this revision.Sep 4 2021, 12:46 AM

Herald added subscribers: wrengr, Chia-hungDuan, dcaballe and 19 others. · View Herald TranscriptSep 4 2021, 12:46 AM

springerm requested review of this revision.Sep 4 2021, 12:46 AM

Herald added a project: Restricted Project. · View Herald TranscriptSep 4 2021, 12:46 AM

Herald added subscribers: limo1996, stephenneuendorffer. · View Herald Transcript

Harbormaster completed remote builds in B122609: Diff 370706.Sep 4 2021, 12:47 AM

no change

springerm added a child revision: D109268: [mlir][linalg] New tiling option: Scalarize dynamic dims.Sep 4 2021, 1:33 AM

Harbormaster completed remote builds in B122611: Diff 370711.Sep 4 2021, 1:33 AM

• hafixo added a commit: rCRT373035: hwasan: Compatibility fixes for short granules..Sep 6 2021, 12:44 AM

• hafixo added a commit: rGc336557f0238: hwasan: Compatibility fixes for short granules..Sep 6 2021, 12:47 AM

thopre removed a commit: rGc336557f0238: hwasan: Compatibility fixes for short granules..Sep 7 2021, 2:47 AM

thopre removed a commit: rCRT373035: hwasan: Compatibility fixes for short granules..Sep 7 2021, 2:51 AM

rebase

Herald added a subscriber: wenzhicui. · View Herald TranscriptSep 7 2021, 8:28 PM

Harbormaster completed remote builds in B122988: Diff 371249.Sep 7 2021, 8:29 PM

springerm edited the summary of this revision. (Show Details)Sep 7 2021, 8:33 PM

springerm added a parent revision: D108270: [mlir][linalg] linalg.tiled_loop peeling.

springerm removed a parent revision: D109043: [mlir][linalg] Add scf.for loop peeling to codegen strategy.

springerm added a child revision: D109043: [mlir][linalg] Add scf.for loop peeling to codegen strategy.

springerm removed a child revision: D109268: [mlir][linalg] New tiling option: Scalarize dynamic dims.Sep 7 2021, 8:36 PM

Thanks!

This revision is now accepted and ready to land.Sep 8 2021, 4:24 AM

This revision was landed with ongoing or failed builds.Sep 8 2021, 7:11 PM

Closed by commit rGc95a7246a38a: [mlir][linalg] Tiling: Use loop ub in extract_slice size computation if possible (authored by springerm). · Explain Why

This revision was automatically updated to reflect the committed changes.

springerm added a commit: rGc95a7246a38a: [mlir][linalg] Tiling: Use loop ub in extract_slice size computation if possible.

antiagainst mentioned this in D110849: [mlir][linalg] Fix incorrect bound calculation for tiling conv.Sep 30 2021, 9:40 AM

antiagainst mentioned this in rGcb2e6518000c: [mlir][linalg] Fix incorrect bound calculation for tiling conv.Sep 30 2021, 10:54 AM

Revision Contents

Path

Size

mlir/

include/

mlir/

Dialect/

Linalg/

Utils/

Utils.h

2 lines

lib/

Dialect/

Linalg/

Transforms/

Fusion.cpp

7 lines

Tiling.cpp

10 lines

Utils/

Utils.cpp

8 lines

test/

Dialect/

Linalg/

fusion-pattern.mlir

53 lines

fusion-sequence.mlir

28 lines

fusion-tensor-pattern.mlir

20 lines

fusion.mlir

10 lines

tile-and-fuse-tensors.mlir

24 lines

tile-conv-padding.mlir

6 lines

tile-conv.mlir

13 lines

tile-simple-conv.mlir

22 lines

tile.mlir

72 lines

Diff 371249

mlir/include/mlir/Dialect/Linalg/Utils/Utils.h

Show First 20 Lines • Show All 85 Lines • ▼ Show 20 Lines	SmallVector<Value> computeTileSizes(OpBuilder &b, Location loc, ValueRange ivs,
ValueRange tileSizes,		ValueRange tileSizes,
ArrayRef<Value> sizeBounds);		ArrayRef<Value> sizeBounds);

/// Creates an extract_slice/subview op for a single `valueToTile` with		/// Creates an extract_slice/subview op for a single `valueToTile` with
/// `builder`. This new operation extracts a tile of `valueToTile`, starting		/// `builder`. This new operation extracts a tile of `valueToTile`, starting
/// at offsets `lbs` and with sizes `subShapeSizes`.		/// at offsets `lbs` and with sizes `subShapeSizes`.
Value makeTiledShape(OpBuilder &builder, Location loc, Value valueToTile,		Value makeTiledShape(OpBuilder &builder, Location loc, Value valueToTile,
ValueRange tileSizes, AffineMap map, ValueRange lbs,		ValueRange tileSizes, AffineMap map, ValueRange lbs,
ValueRange subShapeSizes);		ValueRange ubs, ValueRange subShapeSizes);

/// Creates extract_slice/subview ops for all `valuesToTile` of the given		/// Creates extract_slice/subview ops for all `valuesToTile` of the given
/// `linalgOp` with `builder`, assuming `linalgOp` is being fused into a loop		/// `linalgOp` with `builder`, assuming `linalgOp` is being fused into a loop
/// nest for tiling with the given induction variables `ivs` and tile sizes		/// nest for tiling with the given induction variables `ivs` and tile sizes
/// `tileSizes`. `sizeBounds` are the iteration space bounds for all the		/// `tileSizes`. `sizeBounds` are the iteration space bounds for all the
/// implicit loops in `linalgOp`.		/// implicit loops in `linalgOp`.
///		///
/// Note that a constant zero in `tileSizes` means no tiling at that implicit		/// Note that a constant zero in `tileSizes` means no tiling at that implicit
▲ Show 20 Lines • Show All 179 Lines • Show Last 20 Lines

mlir/lib/Dialect/Linalg/Transforms/Fusion.cpp

Show First 20 Lines • Show All 171 Lines • ▼ Show 20 Lines	static LinalgOp fuse(OpBuilder &b, LinalgOp producer,
const DenseMap<unsigned, Range> &fusedLoopsAndRanges) {		const DenseMap<unsigned, Range> &fusedLoopsAndRanges) {
SmallVector<Value, 8> ivs, tileSizes, sizeBounds;		SmallVector<Value, 8> ivs, tileSizes, sizeBounds;
SmallVector<Range, 8> loopRanges;		SmallVector<Range, 8> loopRanges;
Location loc = producer.getLoc();		Location loc = producer.getLoc();
auto zero = b.create<ConstantIndexOp>(loc, 0);		auto zero = b.create<ConstantIndexOp>(loc, 0);
auto one = b.create<ConstantIndexOp>(loc, 1);		auto one = b.create<ConstantIndexOp>(loc, 1);

for (unsigned i = 0, e = producer.getNumLoops(); i < e; ++i) {		for (unsigned i = 0, e = producer.getNumLoops(); i < e; ++i) {
		auto shapeDim = getShapeDefiningLoopRange(producer, i);
		Value dim = createOrFoldDimOp(b, loc, shapeDim.shape, shapeDim.dimension);
		sizeBounds.push_back(dim);
auto it = fusedLoopsAndRanges.find(i);		auto it = fusedLoopsAndRanges.find(i);
if (it != fusedLoopsAndRanges.end()) {		if (it != fusedLoopsAndRanges.end()) {
ivs.push_back(it->second.offset);		ivs.push_back(it->second.offset);
tileSizes.push_back(it->second.size);		tileSizes.push_back(it->second.size);
sizeBounds.push_back(nullptr);
loopRanges.push_back(it->second);		loopRanges.push_back(it->second);
LLVM_DEBUG(llvm::dbgs() << "tiled loop#" << i << " with LoopRange "		LLVM_DEBUG(llvm::dbgs() << "tiled loop#" << i << " with LoopRange "
<< loopRanges.back() << "\n");		<< loopRanges.back() << "\n");
} else {		} else {
auto shapeDim = getShapeDefiningLoopRange(producer, i);
Value dim = createOrFoldDimOp(b, loc, shapeDim.shape, shapeDim.dimension);
tileSizes.push_back(zero);		tileSizes.push_back(zero);
sizeBounds.push_back(dim);
loopRanges.push_back(Range{zero, dim, one});		loopRanges.push_back(Range{zero, dim, one});
LLVM_DEBUG(llvm::dbgs() << "full loop#" << i << " with LoopRange "		LLVM_DEBUG(llvm::dbgs() << "full loop#" << i << " with LoopRange "
<< loopRanges.back() << "\n");		<< loopRanges.back() << "\n");
}		}
}		}

SmallVector<Value, 8> clonedShapes;		SmallVector<Value, 8> clonedShapes;
clonedShapes.reserve(producer.getNumInputsAndOutputs());		clonedShapes.reserve(producer.getNumInputsAndOutputs());
▲ Show 20 Lines • Show All 778 Lines • Show Last 20 Lines

mlir/lib/Dialect/Linalg/Transforms/Tiling.cpp

Show First 20 Lines • Show All 364 Lines • ▼ Show 20 Lines	static LogicalResult tilePadTensorOp(OpBuilder &builder, PadTensorOp op,
newPadOp = cast<PadTensorOp>(builder.clone(*op.getOperation()));		newPadOp = cast<PadTensorOp>(builder.clone(*op.getOperation()));
// Get rank and tile sizes.		// Get rank and tile sizes.
int64_t rank = op.getResultType().getRank();		int64_t rank = op.getResultType().getRank();
SmallVector<Value> tileSizes =		SmallVector<Value> tileSizes =
options.tileSizeComputationFunction(builder, op);		options.tileSizeComputationFunction(builder, op);
assert(static_cast<int64_t>(tileSizes.size()) == rank);		assert(static_cast<int64_t>(tileSizes.size()) == rank);
// Compute lower and upper bounds of the loop nest.		// Compute lower and upper bounds of the loop nest.
SmallVector<Range> ranges = op.getLoopBounds(builder);		SmallVector<Range> ranges = op.getLoopBounds(builder);
SmallVector<Value> lbs, dims, steps;		SmallVector<Value> lbs, dims, allDims, steps;
for (int64_t i = 0; i < rank; ++i) {		for (int64_t i = 0; i < rank; ++i) {
		allDims.push_back(ranges[i].size);
if (!isZero(tileSizes[i])) {		if (!isZero(tileSizes[i])) {
lbs.push_back(ranges[i].offset);		lbs.push_back(ranges[i].offset);
dims.push_back(ranges[i].size);		dims.push_back(ranges[i].size);
steps.push_back(tileSizes[i]);		steps.push_back(tileSizes[i]);
}		}
}		}
// Generate loop nest: One loop per dimension.		// Generate loop nest: One loop per dimension.
SmallVector<Value> destOperand = op.getDestinationOperands(builder);		SmallVector<Value> destOperand = op.getDestinationOperands(builder);
loopNest = mlir::scf::buildLoopNest(		loopNest = mlir::scf::buildLoopNest(
builder, loc, lbs, /ubs=/dims, steps, ValueRange(destOperand),		builder, loc, lbs, /ubs=/dims, steps, ValueRange(destOperand),
[&](OpBuilder &b, Location loc, ValueRange localIvs,		[&](OpBuilder &b, Location loc, ValueRange localIvs,
ValueRange iterArgs) -> scf::ValueVector {		ValueRange iterArgs) -> scf::ValueVector {
// Compute offsets and sizes of ExtractSliceOp.		// Compute offsets and sizes of ExtractSliceOp.
SmallVector<Value> offsets =		SmallVector<Value> offsets =
computeTileOffsets(b, loc, localIvs, tileSizes);		computeTileOffsets(b, loc, localIvs, tileSizes);
SmallVector<Value> sizes =		SmallVector<Value> sizes =
computeTileSizes(b, loc, localIvs, tileSizes, dims);		computeTileSizes(b, loc, localIvs, tileSizes, allDims);
// Create ExtractSliceOp: Extract a tile from the PadTensorOp.		// Create ExtractSliceOp: Extract a tile from the PadTensorOp.
// Note: The PadTensorOp is located outside of the loop nest. It is		// Note: The PadTensorOp is located outside of the loop nest. It is
// later moved inside by ExtractSliceOfPadTensorSwapPattern.		// later moved inside by ExtractSliceOfPadTensorSwapPattern.
auto map = AffineMap::getMultiDimIdentityMap(rank, b.getContext());		auto map = AffineMap::getMultiDimIdentityMap(rank, b.getContext());
Value tiledOutput = makeTiledShape(b, loc, newPadOp->getResult(0),		Value tiledOutput =
tileSizes, map, offsets, sizes);		makeTiledShape(b, loc, newPadOp->getResult(0), tileSizes, map,
		offsets, allDims, sizes);
auto sliceOp = tiledOutput.getDefiningOp<tensor::ExtractSliceOp>();		auto sliceOp = tiledOutput.getDefiningOp<tensor::ExtractSliceOp>();
assert(sliceOp && "expected ExtractSliceOp");		assert(sliceOp && "expected ExtractSliceOp");
// Insert the tile into the output tensor.		// Insert the tile into the output tensor.
Value yieldValue =		Value yieldValue =
insertSliceIntoTensor(b, loc, sliceOp, sliceOp, iterArgs[0]);		insertSliceIntoTensor(b, loc, sliceOp, sliceOp, iterArgs[0]);
return scf::ValueVector({yieldValue});		return scf::ValueVector({yieldValue});
});		});
return success();		return success();
▲ Show 20 Lines • Show All 207 Lines • Show Last 20 Lines

mlir/lib/Dialect/Linalg/Utils/Utils.cpp

Show First 20 Lines • Show All 508 Lines • ▼ Show 20 Lines	generateParallelLoopNest(
},		},
ivs, distributionMethod);		ivs, distributionMethod);

assert(ivs.size() == iteratorTypes.size() && "did not generate enough loops");		assert(ivs.size() == iteratorTypes.size() && "did not generate enough loops");
}		}

Value makeTiledShape(OpBuilder &builder, Location loc, Value valueToTile,		Value makeTiledShape(OpBuilder &builder, Location loc, Value valueToTile,
ValueRange tileSizes, AffineMap map, ValueRange lbs,		ValueRange tileSizes, AffineMap map, ValueRange lbs,
ValueRange subShapeSizes) {		ValueRange ubs, ValueRange subShapeSizes) {
auto shapedType = valueToTile.getType().dyn_cast<ShapedType>();		auto shapedType = valueToTile.getType().dyn_cast<ShapedType>();
assert(shapedType && "only shaped types can be tiled");		assert(shapedType && "only shaped types can be tiled");
ArrayRef<int64_t> shape = shapedType.getShape();		ArrayRef<int64_t> shape = shapedType.getShape();
int64_t rank = shapedType.getRank();		int64_t rank = shapedType.getRank();

// Construct a new subview / extract_slice for the tile.		// Construct a new subview / extract_slice for the tile.
SmallVector<OpFoldResult, 4> offsets, sizes, strides;		SmallVector<OpFoldResult, 4> offsets, sizes, strides;
offsets.reserve(rank);		offsets.reserve(rank);
Show All 36 Lines	if (ShapedType::isDynamic(shapeSize) \|\| !sizeCst \|\|
<< ": make sure in bound with affine.min\n");		<< ": make sure in bound with affine.min\n");
AffineExpr dim0, dim1, dim2;		AffineExpr dim0, dim1, dim2;
bindDims(builder.getContext(), dim0, dim1, dim2);		bindDims(builder.getContext(), dim0, dim1, dim2);
// Compute min(size, dim - offset) to avoid out-of-bounds accesses.		// Compute min(size, dim - offset) to avoid out-of-bounds accesses.
AffineMap minMap =		AffineMap minMap =
AffineMap::inferFromExprList(		AffineMap::inferFromExprList(
ArrayRef<ArrayRef<AffineExpr>>{{dim0, dim1 - dim2}})		ArrayRef<ArrayRef<AffineExpr>>{{dim0, dim1 - dim2}})
.front();		.front();
Value d = createOrFoldDimOp(builder, loc, valueToTile, r);		Value d = applyMapToValues(builder, loc, m, ubs).front();
SmallVector<Value, 4> operands{size, d, offset};		SmallVector<Value, 4> operands{size, d, offset};
fullyComposeAffineMapAndOperands(&minMap, &operands);		fullyComposeAffineMapAndOperands(&minMap, &operands);
size = builder.create<AffineMinOp>(loc, builder.getIndexType(), minMap,		size = builder.create<AffineMinOp>(loc, builder.getIndexType(), minMap,
operands);		operands);
}		}

sizes.push_back(size);		sizes.push_back(size);
LLVM_DEBUG(llvm::dbgs()		LLVM_DEBUG(llvm::dbgs()
▲ Show 20 Lines • Show All 72 Lines • ▼ Show 20 Lines	for (OpOperand *opOperand : linalgOp.getInputAndOutputOperands()) {
if (!isTiled(map, tileSizes)) {		if (!isTiled(map, tileSizes)) {
tiledShapes.push_back(shapedOp);		tiledShapes.push_back(shapedOp);
LLVM_DEBUG(llvm::dbgs() << ": not tiled: use shape: "		LLVM_DEBUG(llvm::dbgs() << ": not tiled: use shape: "
<< opOperand->get().getType() << "\n");		<< opOperand->get().getType() << "\n");
continue;		continue;
}		}
LLVM_DEBUG(llvm::dbgs() << ": tiled: figure out subshape...\n");		LLVM_DEBUG(llvm::dbgs() << ": tiled: figure out subshape...\n");

tiledShapes.push_back(		tiledShapes.push_back(makeTiledShape(b, loc, shapedOp, tileSizes, map, lbs,
makeTiledShape(b, loc, shapedOp, tileSizes, map, lbs, subShapeSizes));		sizeBounds, subShapeSizes));
}		}

return tiledShapes;		return tiledShapes;
}		}

} // namespace linalg		} // namespace linalg
} // namespace mlir		} // namespace mlir

mlir/test/Dialect/Linalg/fusion-pattern.mlir

	Show All 37 Lines
	// CHECK: %[[TILE_M:.+]] = affine.min #[[MAP0]](%[[IV0]])[%[[M]]]			// CHECK: %[[TILE_M:.+]] = affine.min #[[MAP0]](%[[IV0]])[%[[M]]]
	// CHECK: %[[K:.+]] = memref.dim %[[ARG0]], %[[C1]]			// CHECK: %[[K:.+]] = memref.dim %[[ARG0]], %[[C1]]
	// CHECK: %[[SV1:.+]] = memref.subview %[[ARG0]][%[[IV0]], 0]			// CHECK: %[[SV1:.+]] = memref.subview %[[ARG0]][%[[IV0]], 0]
	// CHECK-SAME: [%[[TILE_M]], %[[K]]]			// CHECK-SAME: [%[[TILE_M]], %[[K]]]
	// CHECK: %[[K_2:.+]] = memref.dim %[[ARG1]], %[[C0]]			// CHECK: %[[K_2:.+]] = memref.dim %[[ARG1]], %[[C0]]
	// CHECK: %[[TILE_N:.+]] = affine.min #[[MAP2]](%[[IV1]])[%[[N]]]			// CHECK: %[[TILE_N:.+]] = affine.min #[[MAP2]](%[[IV1]])[%[[N]]]
	// CHECK: %[[SV2:.+]] = memref.subview %[[ARG1]][0, %[[IV1]]]			// CHECK: %[[SV2:.+]] = memref.subview %[[ARG1]][0, %[[IV1]]]
	// CHECK-SAME: %[[K_2]], %[[TILE_N]]			// CHECK-SAME: %[[K_2]], %[[TILE_N]]
				// CHECK: %[[SV3:.+]] = memref.subview %[[ARG2]][%[[IV0]], %[[IV1]]]
				// CHECK-SAME: [%[[TILE_M]], %[[TILE_N]]]
	// CHECK: %[[M_2:.+]] = memref.dim %[[ARG2]], %[[C0]]			// CHECK: %[[M_2:.+]] = memref.dim %[[ARG2]], %[[C0]]
	// CHECK: %[[TILE_M_2:.+]] = affine.min #[[MAP0]](%[[IV0]])[%[[M_2]]]
	// CHECK: %[[N_2:.+]] = memref.dim %[[ARG2]], %[[C1]]			// CHECK: %[[N_2:.+]] = memref.dim %[[ARG2]], %[[C1]]
	// CHECK: %[[TILE_N_2:.+]] = affine.min #[[MAP2]](%[[IV1]])[%[[N_2]]]
	// CHECK: %[[SV3:.+]] = memref.subview %[[ARG2]][%[[IV0]], %[[IV1]]]
	// CHECK-SAME: [%[[TILE_M_2]], %[[TILE_N_2]]]
	// CHECK: %[[TILE_M_3:.+]] = affine.min #[[MAP4]](%[[IV0]])[%[[M_2]], %[[M]]]			// CHECK: %[[TILE_M_3:.+]] = affine.min #[[MAP4]](%[[IV0]])[%[[M_2]], %[[M]]]
	// CHECK: %[[TILE_N_3:.+]] = affine.min #[[MAP5]](%[[IV1]])[%[[N_2]], %[[N]]]			// CHECK: %[[TILE_N_3:.+]] = affine.min #[[MAP5]](%[[IV1]])[%[[N_2]], %[[N]]]
	// CHECK: %[[SV3_2:.+]] = memref.subview %[[ARG2]][%[[IV0]], %[[IV1]]]			// CHECK: %[[SV3_2:.+]] = memref.subview %[[ARG2]][%[[IV0]], %[[IV1]]]
	// CHECK-SAME: [%[[TILE_M_3]], %[[TILE_N_3]]]			// CHECK-SAME: [%[[TILE_M_3]], %[[TILE_N_3]]]
	// CHECK: linalg.fill(%[[CST]], %[[SV3_2]])			// CHECK: linalg.fill(%[[CST]], %[[SV3_2]])
	// CHECK-SAME: __internal_linalg_transform__ = "after_basic_fusion_producer"			// CHECK-SAME: __internal_linalg_transform__ = "after_basic_fusion_producer"
	// CHECK: scf.for %[[IV2:.+]] = %[[C0]] to %[[K]] step %[[C16]] {			// CHECK: scf.for %[[IV2:.+]] = %[[C0]] to %[[K]] step %[[C16]] {
	// CHECK: %[[TILE_K:.+]] = affine.min #[[MAP3]](%[[IV2]])[%[[K]]]			// CHECK: %[[TILE_K:.+]] = affine.min #[[MAP3]](%[[IV2]])[%[[K]]]
	// CHECK: %[[SV4:.+]] = memref.subview %[[SV1]][0, %[[IV2]]]			// CHECK: %[[SV4:.+]] = memref.subview %[[SV1]][0, %[[IV2]]]
	// CHECK-SAME: [%[[TILE_M]], %[[TILE_K]]]			// CHECK-SAME: [%[[TILE_M]], %[[TILE_K]]]
	// CHECK: %[[TILE_K_2:.+]] = affine.min #[[MAP3]](%[[IV2]])[%[[K_2]]]
	// CHECK: %[[SV5:.+]] = memref.subview %[[SV2]][%[[IV2]], 0]			// CHECK: %[[SV5:.+]] = memref.subview %[[SV2]][%[[IV2]], 0]
	// CHECK-SAME: [%[[TILE_K_2]], %[[TILE_N]]]			// CHECK-SAME: [%[[TILE_K]], %[[TILE_N]]]
	// CHECK: linalg.matmul			// CHECK: linalg.matmul
	// CHECK-SAME: __internal_linalg_transform__ = "after_basic_fusion"			// CHECK-SAME: __internal_linalg_transform__ = "after_basic_fusion"
	// CHECK-SAME: ins(%[[SV4]], %[[SV5]]			// CHECK-SAME: ins(%[[SV4]], %[[SV5]]
	// CHECK-SAME: : memref<?x?xf32, #[[MAP1]]>, memref<?x?xf32, #[[MAP1]]>)			// CHECK-SAME: : memref<?x?xf32, #[[MAP1]]>, memref<?x?xf32, #[[MAP1]]>)
	// CHECK-SAME: outs(%[[SV3]] : memref<?x?xf32, #[[MAP1]]>)			// CHECK-SAME: outs(%[[SV3]] : memref<?x?xf32, #[[MAP1]]>)
	// CHECK: }			// CHECK: }
	// CHECK: }			// CHECK: }
	// CHECK: linalg.matmul			// CHECK: linalg.matmul
	Show All 34 Lines
	// CHECK-DAG: %[[N:.+]] = memref.dim %[[ARG2]], %[[C1]]			// CHECK-DAG: %[[N:.+]] = memref.dim %[[ARG2]], %[[C1]]
	// CHECK: scf.parallel (%[[IV0:.+]]) =			// CHECK: scf.parallel (%[[IV0:.+]]) =
	// CHECK-SAME: (%[[C0]]) to (%[[N]]) step (%[[C64]]) {			// CHECK-SAME: (%[[C0]]) to (%[[N]]) step (%[[C64]]) {
	// CHECK: %[[K:.+]] = memref.dim %[[ARG2]], %[[C0]]			// CHECK: %[[K:.+]] = memref.dim %[[ARG2]], %[[C0]]
	// CHECK: %[[TILE_N:.+]] = affine.min #[[MAP0]](%[[IV0]])[%[[N]]]			// CHECK: %[[TILE_N:.+]] = affine.min #[[MAP0]](%[[IV0]])[%[[N]]]
	// CHECK: %[[SV1:.+]] = memref.subview %[[ARG2]][0, %[[IV0]]]			// CHECK: %[[SV1:.+]] = memref.subview %[[ARG2]][0, %[[IV0]]]
	// CHECK-SAME: [%[[K]], %[[TILE_N]]]			// CHECK-SAME: [%[[K]], %[[TILE_N]]]
	// CHECK: %[[M:.+]] = memref.dim %[[ARG3]], %[[C0]]			// CHECK: %[[M:.+]] = memref.dim %[[ARG3]], %[[C0]]
	// CHECK: %[[N_2:.+]] = memref.dim %[[ARG3]], %[[C1]]
	// CHECK: %[[TILE_N_2:.+]] = affine.min #[[MAP0]](%[[IV0]])[%[[N_2]]]
	// CHECK: %[[SV2:.+]] = memref.subview %[[ARG3]][0, %[[IV0]]]			// CHECK: %[[SV2:.+]] = memref.subview %[[ARG3]][0, %[[IV0]]]
	// CHECK-SAME: [%[[M]], %[[TILE_N_2]]]			// CHECK-SAME: [%[[M]], %[[TILE_N]]
	// CHECK: %[[K_2:.+]] = memref.dim %[[ARG1]], %[[C0]]
	// CHECK: %[[N_3:.+]] = memref.dim %[[ARG1]], %[[C1]]			// CHECK: %[[N_3:.+]] = memref.dim %[[ARG1]], %[[C1]]
				// CHECK: %[[K_2:.+]] = memref.dim %[[ARG1]], %[[C0]]
	// CHECK: %[[TILE_N_3:.+]] = affine.min #[[MAP4]](%[[IV0]])[%[[N_3]], %[[N]]]			// CHECK: %[[TILE_N_3:.+]] = affine.min #[[MAP4]](%[[IV0]])[%[[N_3]], %[[N]]]
	// CHECK: %[[SV3:.+]] = memref.subview %[[ARG1]][0, %[[IV0]]]			// CHECK: %[[SV3:.+]] = memref.subview %[[ARG1]][0, %[[IV0]]]
	// CHECK-SAME: [%[[K_2]], %[[TILE_N_3]]]			// CHECK-SAME: [%[[K_2]], %[[TILE_N_3]]]
	// CHECK: %[[TILE_N_4:.+]] = affine.min #[[MAP4]](%[[IV0]])[%[[N]], %[[N]]]
	// CHECK: %[[SV3_2:.+]] = memref.subview %[[ARG2]][0, %[[IV0]]]			// CHECK: %[[SV3_2:.+]] = memref.subview %[[ARG2]][0, %[[IV0]]]
	// CHECK-SAME: [%[[K]], %[[TILE_N_4]]]			// CHECK-SAME: [%[[K]], %[[TILE_N_3]]]
	// CHECK: linalg.copy(%[[SV3]], %[[SV3_2]])			// CHECK: linalg.copy(%[[SV3]], %[[SV3_2]])
	// CHECK-SAME: __internal_linalg_transform__ = "after_rhs_fusion_producer"			// CHECK-SAME: __internal_linalg_transform__ = "after_rhs_fusion_producer"
	// CHECK-NOT: linalg.fill			// CHECK-NOT: linalg.fill
	// CHECK-DAG: %[[M_2:.+]] = memref.dim %[[ARG0]], %[[C0]]			// CHECK-DAG: %[[M_2:.+]] = memref.dim %[[ARG0]], %[[C0]]
	// CHECK-DAG: %[[K_2:.+]] = memref.dim %[[ARG0]], %[[C1]]			// CHECK-DAG: %[[K_2:.+]] = memref.dim %[[ARG0]], %[[C1]]
	// CHECK: scf.parallel (%[[IV1:.+]]) =			// CHECK: scf.parallel (%[[IV1:.+]]) =
	// CHECK-SAME: (%[[C0]]) to (%[[M_2]]) step (%[[C32]]) {			// CHECK-SAME: (%[[C0]]) to (%[[M_2]]) step (%[[C32]]) {
	// CHECK-NEXT: scf.for %[[IV2:.+]] = %[[C0]] to %[[K_2]] step %[[C16]] {			// CHECK-NEXT: scf.for %[[IV2:.+]] = %[[C0]] to %[[K_2]] step %[[C16]] {
	// CHECK: %[[TILE_M:.+]] = affine.min #[[MAP2]](%[[IV1]])[%[[M_2]]]			// CHECK: %[[TILE_M:.+]] = affine.min #[[MAP2]](%[[IV1]])[%[[M_2]]]
	// CHECK: %[[TILE_K:.+]] = affine.min #[[MAP3]](%[[IV2]])[%[[K_2]]]			// CHECK: %[[TILE_K:.+]] = affine.min #[[MAP3]](%[[IV2]])[%[[K_2]]]
	// CHECK: %[[SV4:.+]] = memref.subview %[[ARG0]][%[[IV1]], %[[IV2]]]			// CHECK: %[[SV4:.+]] = memref.subview %[[ARG0]][%[[IV1]], %[[IV2]]]
	// CHECK-SAME: [%[[TILE_M]], %[[TILE_K]]]			// CHECK-SAME: [%[[TILE_M]], %[[TILE_K]]]
	// CHECK: %[[TILE_K_2:.+]] = affine.min #[[MAP3]](%[[IV2]])[%[[K]]]
	// CHECK: %[[SV5:.+]] = memref.subview %[[SV1]][%[[IV2]], 0]			// CHECK: %[[SV5:.+]] = memref.subview %[[SV1]][%[[IV2]], 0]
	// CHECK-SAME: [%[[TILE_K_2]], %[[TILE_N]]]			// CHECK-SAME: [%[[TILE_K]], %[[TILE_N]]]
	// CHECK: %[[TILE_M_2:.+]] = affine.min #[[MAP2]](%[[IV1]])[%[[M]]]
	// CHECK: %[[SV6:.+]] = memref.subview %[[SV2]][%[[IV1]], 0]			// CHECK: %[[SV6:.+]] = memref.subview %[[SV2]][%[[IV1]], 0]
	// CHECK-SAME: [%[[TILE_M_2]], %[[TILE_N_2]]]			// CHECK-SAME: [%[[TILE_M]], %[[TILE_N]]]
	// CHECK: linalg.matmul			// CHECK: linalg.matmul
	// CHECK-SAME: __internal_linalg_transform__ = "after_rhs_fusion"			// CHECK-SAME: __internal_linalg_transform__ = "after_rhs_fusion"
	// CHECK-SAME: ins(%[[SV4]], %[[SV5]]			// CHECK-SAME: ins(%[[SV4]], %[[SV5]]
	// CHECK-SAME: : memref<?x?xf32, #[[MAP1]]>, memref<?x?xf32, #[[MAP1]]>)			// CHECK-SAME: : memref<?x?xf32, #[[MAP1]]>, memref<?x?xf32, #[[MAP1]]>)
	// CHECK-SAME: outs(%[[SV6]] : memref<?x?xf32, #[[MAP1]]>)			// CHECK-SAME: outs(%[[SV6]] : memref<?x?xf32, #[[MAP1]]>)
	// CHECK: }			// CHECK: }
	// CHECK: }			// CHECK: }
	// CHECK: }			// CHECK: }
	Show All 37 Lines
	// CHECK-SAME: __internal_linalg_transform__ = "after_two_operand_fusion_original"			// CHECK-SAME: __internal_linalg_transform__ = "after_two_operand_fusion_original"
	// CHECK-DAG: %[[M:.+]] = memref.dim %[[ARG1]], %[[C0]]			// CHECK-DAG: %[[M:.+]] = memref.dim %[[ARG1]], %[[C0]]
	// CHECK: scf.parallel (%[[IV0:.+]]) =			// CHECK: scf.parallel (%[[IV0:.+]]) =
	// CHECK-SAME: (%[[C0]]) to (%[[M]]) step (%[[C32]]) {			// CHECK-SAME: (%[[C0]]) to (%[[M]]) step (%[[C32]]) {
	// CHECK: %[[TILE_M:.+]] = affine.min #[[MAP0]](%[[IV0]])[%[[M]]]			// CHECK: %[[TILE_M:.+]] = affine.min #[[MAP0]](%[[IV0]])[%[[M]]]
	// CHECK: %[[K:.+]] = memref.dim %[[ARG1]], %[[C1]]			// CHECK: %[[K:.+]] = memref.dim %[[ARG1]], %[[C1]]
	// CHECK: %[[SV1:.+]] = memref.subview %[[ARG1]][%[[IV0]], 0]			// CHECK: %[[SV1:.+]] = memref.subview %[[ARG1]][%[[IV0]], 0]
	// CHECK-SAME: [%[[TILE_M]], %[[K]]]			// CHECK-SAME: [%[[TILE_M]], %[[K]]]
	// CHECK: %[[M_2:.+]] = memref.dim %[[ARG3]], %[[C0]]
	// CHECK: %[[TILE_M_2:.+]] = affine.min #[[MAP0]](%[[IV0]])[%[[M_2]]]
	// CHECK: %[[N:.+]] = memref.dim %[[ARG3]], %[[C1]]			// CHECK: %[[N:.+]] = memref.dim %[[ARG3]], %[[C1]]
	// CHECK: %[[SV2:.+]] = memref.subview %[[ARG3]][%[[IV0]], 0]			// CHECK: %[[SV2:.+]] = memref.subview %[[ARG3]][%[[IV0]], 0]
	// CHECK-SAME: [%[[TILE_M_2]], %[[N]]]			// CHECK-SAME: [%[[TILE_M]], %[[N]]]
				// CHECK: %[[M_2:.+]] = memref.dim %[[ARG3]], %[[C0]]
	// CHECK: %[[TILE_M_3:.+]] = affine.min #[[MAP4]](%[[IV0]])[%[[M_2]], %[[M]]]			// CHECK: %[[TILE_M_3:.+]] = affine.min #[[MAP4]](%[[IV0]])[%[[M_2]], %[[M]]]
	// CHECK: %[[SV2_2:.+]] = memref.subview %[[ARG3]][%[[IV0]], 0]			// CHECK: %[[SV2_2:.+]] = memref.subview %[[ARG3]][%[[IV0]], 0]
	// CHECK-SAME: [%[[TILE_M_3]], %[[N]]]			// CHECK-SAME: [%[[TILE_M_3]], %[[N]]]
	// CHECK: %[[M_3:.+]] = memref.dim %[[ARG0]], %[[C0]]			// CHECK: %[[M_3:.+]] = memref.dim %[[ARG0]], %[[C0]]
	// CHECK: %[[TILE_M_4:.+]] = affine.min #[[MAP4]](%[[IV0]])[%[[M_3]], %[[M]]]			// CHECK: %[[TILE_M_4:.+]] = affine.min #[[MAP4]](%[[IV0]])[%[[M_3]], %[[M]]]
	// CHECK: %[[K_3:.+]] = memref.dim %[[ARG0]], %[[C1]]			// CHECK: %[[K_3:.+]] = memref.dim %[[ARG0]], %[[C1]]
	// CHECK: %[[SV3:.+]] = memref.subview %[[ARG0]][%[[IV0]], 0]			// CHECK: %[[SV3:.+]] = memref.subview %[[ARG0]][%[[IV0]], 0]
	// CHECK-SAME: [%[[TILE_M_4]], %[[K_3]]]			// CHECK-SAME: [%[[TILE_M_4]], %[[K_3]]]
	// CHECK: %[[TILE_M_5:.+]] = affine.min #[[MAP4]](%[[IV0]])[%[[M]], %[[M]]]
	// CHECK: %[[SV3_2:.+]] = memref.subview %[[ARG1]][%[[IV0]], 0]			// CHECK: %[[SV3_2:.+]] = memref.subview %[[ARG1]][%[[IV0]], 0]
	// CHECK-SAME: [%[[TILE_M_5]], %[[K]]]			// CHECK-SAME: [%[[TILE_M_4]], %[[K]]]
	// CHECK: linalg.copy(%[[SV3]], %[[SV3_2]])			// CHECK: linalg.copy(%[[SV3]], %[[SV3_2]])
	// CHECK-SAME: __internal_linalg_transform__ = "after_two_operand_fusion_producer"			// CHECK-SAME: __internal_linalg_transform__ = "after_two_operand_fusion_producer"
	// CHECK: linalg.fill(%[[CST]], %[[SV2_2]])			// CHECK: linalg.fill(%[[CST]], %[[SV2_2]])
	// CHECK-SAME: __internal_linalg_transform__ = "after_two_operand_fusion_producer"			// CHECK-SAME: __internal_linalg_transform__ = "after_two_operand_fusion_producer"
	// CHECK-DAG: %[[N_2:.+]] = memref.dim %[[ARG2]], %[[C1]]			// CHECK-DAG: %[[N_2:.+]] = memref.dim %[[ARG2]], %[[C1]]
	// CHECK: scf.parallel (%[[IV1:.+]]) =			// CHECK: scf.parallel (%[[IV1:.+]]) =
	// CHECK-SAME: (%[[C0]]) to (%[[N_2]]) step (%[[C64]]) {			// CHECK-SAME: (%[[C0]]) to (%[[N_2]]) step (%[[C64]]) {
	// CHECK-NEXT: scf.for %[[IV2:.+]] = %[[C0]] to %[[K]] step %[[C16]] {			// CHECK-NEXT: scf.for %[[IV2:.+]] = %[[C0]] to %[[K]] step %[[C16]] {
	// CHECK: %[[TILE_K:.+]] = affine.min #[[MAP2]](%[[IV2]])[%[[K]]]			// CHECK: %[[TILE_K:.+]] = affine.min #[[MAP2]](%[[IV2]])[%[[K]]]
	// CHECK: %[[SV4:.+]] = memref.subview %[[SV1]][0, %[[IV2]]]			// CHECK: %[[SV4:.+]] = memref.subview %[[SV1]][0, %[[IV2]]]
	// CHECK-SAME: [%[[TILE_M]], %[[TILE_K]]]			// CHECK-SAME: [%[[TILE_M]], %[[TILE_K]]]
	// CHECK: %[[K_2:.+]] = memref.dim %[[ARG2]], %[[C0]]
	// CHECK: %[[TILE_K_2:.+]] = affine.min #[[MAP2]](%[[IV2]])[%[[K_2]]]
	// CHECK: %[[TILE_N:.+]] = affine.min #[[MAP3]](%[[IV1]])[%[[N_2]]]			// CHECK: %[[TILE_N:.+]] = affine.min #[[MAP3]](%[[IV1]])[%[[N_2]]]
	// CHECK: %[[SV5:.+]] = memref.subview %[[ARG2]][%[[IV2]], %[[IV1]]]			// CHECK: %[[SV5:.+]] = memref.subview %[[ARG2]][%[[IV2]], %[[IV1]]]
	// CHECK-SAME: [%[[TILE_K_2]], %[[TILE_N]]]			// CHECK-SAME: [%[[TILE_K]], %[[TILE_N]]]
	// CHECK: %[[TILE_N_2:.+]] = affine.min #[[MAP3]](%[[IV1]])[%[[N]]]
	// CHECK: %[[SV6:.+]] = memref.subview %[[SV2]][0, %[[IV1]]]			// CHECK: %[[SV6:.+]] = memref.subview %[[SV2]][0, %[[IV1]]]
	// CHECK-SAME: [%[[TILE_M_2]], %[[TILE_N_2]]]			// CHECK-SAME: [%[[TILE_M]], %[[TILE_N]]]
	// CHECK: linalg.matmul			// CHECK: linalg.matmul
	// CHECK-SAME: __internal_linalg_transform__ = "after_two_operand_fusion"			// CHECK-SAME: __internal_linalg_transform__ = "after_two_operand_fusion"
	// CHECK-SAME: ins(%[[SV4]], %[[SV5]]			// CHECK-SAME: ins(%[[SV4]], %[[SV5]]
	// CHECK-SAME: : memref<?x?xf32, #[[MAP1]]>, memref<?x?xf32, #[[MAP1]]>)			// CHECK-SAME: : memref<?x?xf32, #[[MAP1]]>, memref<?x?xf32, #[[MAP1]]>)
	// CHECK-SAME: outs(%[[SV6]] : memref<?x?xf32, #[[MAP1]]>)			// CHECK-SAME: outs(%[[SV6]] : memref<?x?xf32, #[[MAP1]]>)
	// CHECK: }			// CHECK: }
	// CHECK: }			// CHECK: }
	// CHECK: }			// CHECK: }
	Show All 34 Lines
	// CHECK-SAME: __internal_linalg_transform__ = "after_lhs_fusion_original"			// CHECK-SAME: __internal_linalg_transform__ = "after_lhs_fusion_original"
	// CHECK-DAG: %[[M:.+]] = memref.dim %[[ARG2]], %[[C0]]			// CHECK-DAG: %[[M:.+]] = memref.dim %[[ARG2]], %[[C0]]
	// CHECK: scf.parallel (%[[IV0:.+]]) =			// CHECK: scf.parallel (%[[IV0:.+]]) =
	// CHECK-SAME: (%[[C0]]) to (%[[M]]) step (%[[C32]]) {			// CHECK-SAME: (%[[C0]]) to (%[[M]]) step (%[[C32]]) {
	// CHECK: %[[TILE_M:.+]] = affine.min #[[MAP0]](%[[IV0]])[%[[M]]]			// CHECK: %[[TILE_M:.+]] = affine.min #[[MAP0]](%[[IV0]])[%[[M]]]
	// CHECK: %[[K2:.+]] = memref.dim %[[ARG2]], %[[C1]]			// CHECK: %[[K2:.+]] = memref.dim %[[ARG2]], %[[C1]]
	// CHECK: %[[SV1:.+]] = memref.subview %[[ARG2]][%[[IV0]], 0]			// CHECK: %[[SV1:.+]] = memref.subview %[[ARG2]][%[[IV0]], 0]
	// CHECK-SAME: [%[[TILE_M]], %[[K2]]]			// CHECK-SAME: [%[[TILE_M]], %[[K2]]]
	// CHECK: %[[M_2:.+]] = memref.dim %[[ARG4]], %[[C0]]
	// CHECK: %[[TILE_M_2:.+]] = affine.min #[[MAP0]](%[[IV0]])[%[[M_2]]]
	// CHECK: %[[N:.+]] = memref.dim %[[ARG4]], %[[C1]]			// CHECK: %[[N:.+]] = memref.dim %[[ARG4]], %[[C1]]
	// CHECK: %[[SV2:.+]] = memref.subview %[[ARG4]][%[[IV0]], 0]			// CHECK: %[[SV2:.+]] = memref.subview %[[ARG4]][%[[IV0]], 0]
	// CHECK-SAME: [%[[TILE_M_2]], %[[N]]]			// CHECK-SAME: [%[[TILE_M]], %[[N]]]
	// CHECK: %[[M_3:.+]] = memref.dim %[[ARG0]], %[[C0]]			// CHECK: %[[M_3:.+]] = memref.dim %[[ARG0]], %[[C0]]
	// CHECK: %[[TILE_M_3:.+]] = affine.min #[[MAP4]](%[[IV0]])[%[[M_3]], %[[M]]]			// CHECK: %[[TILE_M_3:.+]] = affine.min #[[MAP4]](%[[IV0]])[%[[M_3]], %[[M]]]
	// CHECK: %[[K1:.+]] = memref.dim %[[ARG0]], %[[C1]]			// CHECK: %[[K1:.+]] = memref.dim %[[ARG0]], %[[C1]]
	// CHECK: %[[SV3:.+]] = memref.subview %[[ARG0]][%[[IV0]], 0]			// CHECK: %[[SV3:.+]] = memref.subview %[[ARG0]][%[[IV0]], 0]
	// CHECK-SAME: [%[[TILE_M_3]], %[[K1]]]			// CHECK-SAME: [%[[TILE_M_3]], %[[K1]]]
	// CHECK: %[[TILE_M_4:.+]] = affine.min #[[MAP4]](%[[IV0]])[%[[M]], %[[M]]]
	// CHECK: %[[SV1_2:.+]] = memref.subview %[[ARG2]][%[[IV0]], 0]			// CHECK: %[[SV1_2:.+]] = memref.subview %[[ARG2]][%[[IV0]], 0]
	// CHECK-SAME: [%[[TILE_M_4]], %[[K2]]]			// CHECK-SAME: [%[[TILE_M_3]], %[[K2]]]
	// CHECK: linalg.matmul			// CHECK: linalg.matmul
	// CHECK-SAME: __internal_linalg_transform__ = "after_lhs_fusion_producer"			// CHECK-SAME: __internal_linalg_transform__ = "after_lhs_fusion_producer"
	// CHECK-SAME: ins(%[[SV3]], %[[ARG1]]			// CHECK-SAME: ins(%[[SV3]], %[[ARG1]]
	// CHECK-SAME: : memref<?x?xf32, #[[MAP1]]>, memref<?x?xf32>)			// CHECK-SAME: : memref<?x?xf32, #[[MAP1]]>, memref<?x?xf32>)
	// CHECK-SAME: outs(%[[SV1_2]] : memref<?x?xf32, #[[MAP1]]>)			// CHECK-SAME: outs(%[[SV1_2]] : memref<?x?xf32, #[[MAP1]]>)
	// CHECK: %[[N_2:.+]] = memref.dim %[[ARG3]], %[[C1]]			// CHECK: %[[N_2:.+]] = memref.dim %[[ARG3]], %[[C1]]
	// CHECK: scf.parallel (%[[IV1:.+]]) =			// CHECK: scf.parallel (%[[IV1:.+]]) =
	// CHECK-SAME: (%[[C0]]) to (%[[N_2]]) step (%[[C64]]) {			// CHECK-SAME: (%[[C0]]) to (%[[N_2]]) step (%[[C64]]) {
	// CHECK-NEXT: scf.for %[[IV2:.+]] = %[[C0]] to %[[K2]] step %[[C16]] {			// CHECK-NEXT: scf.for %[[IV2:.+]] = %[[C0]] to %[[K2]] step %[[C16]] {
	// CHECK: %[[TILE_K:.+]] = affine.min #[[MAP2]](%[[IV2]])[%[[K2]]]			// CHECK: %[[TILE_K:.+]] = affine.min #[[MAP2]](%[[IV2]])[%[[K2]]]
	// CHECK: %[[SV6:.+]] = memref.subview %[[SV1]][0, %[[IV2]]]			// CHECK: %[[SV6:.+]] = memref.subview %[[SV1]][0, %[[IV2]]]
	// CHECK-SAME: [%[[TILE_M]], %[[TILE_K]]]			// CHECK-SAME: [%[[TILE_M]], %[[TILE_K]]]
	// CHECK: %[[K_2:.+]] = memref.dim %[[ARG3]], %[[C0]]
	// CHECK: %[[TILE_K_2:.+]] = affine.min #[[MAP2]](%[[IV2]])[%[[K_2]]]
	// CHECK: %[[TILE_N:.+]] = affine.min #[[MAP3]](%[[IV1]])[%[[N_2]]]			// CHECK: %[[TILE_N:.+]] = affine.min #[[MAP3]](%[[IV1]])[%[[N_2]]]
	// CHECK: %[[SV7:.+]] = memref.subview %[[ARG3]][%[[IV2]], %[[IV1]]]			// CHECK: %[[SV7:.+]] = memref.subview %[[ARG3]][%[[IV2]], %[[IV1]]]
	// CHECK-SAME: [%[[TILE_K_2]], %[[TILE_N]]]			// CHECK-SAME: [%[[TILE_K]], %[[TILE_N]]]
	// CHECK: %[[TILE_N_2:.+]] = affine.min #[[MAP3]](%[[IV1]])[%[[N]]]
	// CHECK: %[[SV8:.+]] = memref.subview %[[SV2]][0, %[[IV1]]]			// CHECK: %[[SV8:.+]] = memref.subview %[[SV2]][0, %[[IV1]]]
	// CHECK-SAME: [%[[TILE_M_2]], %[[TILE_N_2]]]			// CHECK-SAME: [%[[TILE_M]], %[[TILE_N]]]
	// CHECK: linalg.matmul			// CHECK: linalg.matmul
	// CHECK-SAME: __internal_linalg_transform__ = "after_lhs_fusion"			// CHECK-SAME: __internal_linalg_transform__ = "after_lhs_fusion"
	// CHECK-SAME: ins(%[[SV6]], %[[SV7]]			// CHECK-SAME: ins(%[[SV6]], %[[SV7]]
	// CHECK-SAME: : memref<?x?xf32, #[[MAP1]]>, memref<?x?xf32, #[[MAP1]]>)			// CHECK-SAME: : memref<?x?xf32, #[[MAP1]]>, memref<?x?xf32, #[[MAP1]]>)
	// CHECK-SAME: outs(%[[SV8]] : memref<?x?xf32, #[[MAP1]]>)			// CHECK-SAME: outs(%[[SV8]] : memref<?x?xf32, #[[MAP1]]>)
	// CHECK: }			// CHECK: }
	// CHECK: }			// CHECK: }
	// CHECK: }			// CHECK: }
	▲ Show 20 Lines • Show All 162 Lines • Show Last 20 Lines

mlir/test/Dialect/Linalg/fusion-sequence.mlir

Show All 36 Lines
// CHECK: %[[TEMP:.+]] = memref.alloc(%{{.}}, %{{.}}) : memref<?x?xf32>		// CHECK: %[[TEMP:.+]] = memref.alloc(%{{.}}, %{{.}}) : memref<?x?xf32>
// CHECK: scf.parallel (%[[IV0:.+]], %[[IV1:.+]]) = {{.*}} {		// CHECK: scf.parallel (%[[IV0:.+]], %[[IV1:.+]]) = {{.*}} {
// CHECK: %[[SV_TEMP_1:.+]] = memref.subview %[[TEMP]][%[[IV0]], %[[IV1]]]		// CHECK: %[[SV_TEMP_1:.+]] = memref.subview %[[TEMP]][%[[IV0]], %[[IV1]]]
// CHECK-DAG: %[[SV_ARG2:.+]] = memref.subview %[[ARG2]][%[[IV1]]]		// CHECK-DAG: %[[SV_ARG2:.+]] = memref.subview %[[ARG2]][%[[IV1]]]
// CHECK-DAG: %[[SV_ARG3:.+]] = memref.subview %[[ARG3]][%[[IV0]], %[[IV1]]]		// CHECK-DAG: %[[SV_ARG3:.+]] = memref.subview %[[ARG3]][%[[IV0]], %[[IV1]]]
// CHECK-DAG: %[[SV_ARG0:.+]] = memref.subview %[[ARG0]][%[[IV0]], 0]		// CHECK-DAG: %[[SV_ARG0:.+]] = memref.subview %[[ARG0]][%[[IV0]], 0]
// CHECK-DAG: %[[SV_ARG1:.+]] = memref.subview %[[ARG1]][0, %[[IV1]]]		// CHECK-DAG: %[[SV_ARG1:.+]] = memref.subview %[[ARG1]][0, %[[IV1]]]
// CHECK: %[[SV_TEMP_2:.+]] = memref.subview %[[TEMP]][%[[IV0]], %[[IV1]]]		// CHECK: %[[SV_TEMP_2:.+]] = memref.subview %[[TEMP]][%[[IV0]], %[[IV1]]]
// CHECK: linalg.fill(%{{.+}}, %[[SV_TEMP_2]])		// CHECK: %[[SV_TEMP_3:.+]] = memref.subview %[[TEMP]][%[[IV0]], %[[IV1]]]
		// CHECK: linalg.fill(%{{.+}}, %[[SV_TEMP_3]])
// CHECK: linalg.matmul		// CHECK: linalg.matmul
// CHECK-SAME: ins(%[[SV_ARG0]], %[[SV_ARG1]]		// CHECK-SAME: ins(%[[SV_ARG0]], %[[SV_ARG1]]
// CHECK-SAME: : memref<?x?xf32, #[[MAP2]]>, memref<?x?xf32, #[[MAP2]]>)		// CHECK-SAME: : memref<?x?xf32, #[[MAP2]]>, memref<?x?xf32, #[[MAP2]]>)
// CHECK-SAME: outs(%[[SV_TEMP_2]] : memref<?x?xf32, #[[MAP2]]>)		// CHECK-SAME: outs(%[[SV_TEMP_2]] : memref<?x?xf32, #[[MAP2]]>)
// CHECK: linalg.generic		// CHECK: linalg.generic
// CHECK-SAME: ins(%[[SV_TEMP_1]], %[[SV_ARG2]]		// CHECK-SAME: ins(%[[SV_TEMP_1]], %[[SV_ARG2]]
// CHECK-SAME: : memref<?x?xf32, #[[MAP2]]>, memref<?xf32, #[[MAP3]]>)		// CHECK-SAME: : memref<?x?xf32, #[[MAP2]]>, memref<?xf32, #[[MAP3]]>)
// CHECK-SAME: outs(%[[SV_ARG3]] : memref<?x?xf32, #[[MAP2]]>)		// CHECK-SAME: outs(%[[SV_ARG3]] : memref<?x?xf32, #[[MAP2]]>)
▲ Show 20 Lines • Show All 48 Lines • ▼ Show 20 Lines
// CHECK-DAG: %[[N2:.+]] = memref.dim %[[ARG2]], %[[C1]]		// CHECK-DAG: %[[N2:.+]] = memref.dim %[[ARG2]], %[[C1]]
// CHECK: %[[ALLOC1:.+]] = memref.alloc(%[[M]], %[[N1]])		// CHECK: %[[ALLOC1:.+]] = memref.alloc(%[[M]], %[[N1]])
// CHECK: %[[ALLOC2:.+]] = memref.alloc(%[[M]], %[[N2]])		// CHECK: %[[ALLOC2:.+]] = memref.alloc(%[[M]], %[[N2]])
// CHECK: scf.parallel (%[[IV0:.+]]) = (%[[C0]]) to (%[[M]])		// CHECK: scf.parallel (%[[IV0:.+]]) = (%[[C0]]) to (%[[M]])
// CHECK-SAME: step (%[[C16]]) {		// CHECK-SAME: step (%[[C16]]) {
// CHECK: %[[TILE_M:.+]] = affine.min #[[MAP0]](%[[IV0]])[%[[M]]]		// CHECK: %[[TILE_M:.+]] = affine.min #[[MAP0]](%[[IV0]])[%[[M]]]
// CHECK: %[[SV_ALLOC3:.+]] = memref.subview %[[ALLOC2]][%[[IV0]], 0]		// CHECK: %[[SV_ALLOC3:.+]] = memref.subview %[[ALLOC2]][%[[IV0]], 0]
// CHECK-SAME: [%[[TILE_M]], %[[N2]]]		// CHECK-SAME: [%[[TILE_M]], %[[N2]]]
// CHECK: %[[M_2:.+]] = memref.dim %[[ARG4]], %[[C0]]
// CHECK: %[[TILE_M_2:.+]] = affine.min #[[MAP0]](%[[IV0]])[%[[M_2]]]
// CHECK: %[[N3:.+]] = memref.dim %[[ARG4]], %[[C1]]		// CHECK: %[[N3:.+]] = memref.dim %[[ARG4]], %[[C1]]
// CHECK: %[[SV_ARG4:.+]] = memref.subview %[[ARG4]][%[[IV0]], 0]		// CHECK: %[[SV_ARG4:.+]] = memref.subview %[[ARG4]][%[[IV0]], 0]
// CHECK-SAME: [%[[TILE_M_2]], %[[N3]]]		// CHECK-SAME: [%[[TILE_M]], %[[N3]]]
		// CHECK: %[[M_2:.+]] = memref.dim %[[ARG4]], %[[C0]]
// CHECK: %[[TILE_M_3:.+]] = affine.min #[[MAP2]](%[[IV0]])[%[[M_2]], %[[M]]]		// CHECK: %[[TILE_M_3:.+]] = affine.min #[[MAP2]](%[[IV0]])[%[[M_2]], %[[M]]]
// CHECK: %[[SV_ARG4_2:.+]] = memref.subview %[[ARG4]][%[[IV0]], 0]		// CHECK: %[[SV_ARG4_2:.+]] = memref.subview %[[ARG4]][%[[IV0]], 0]
// CHECK-SAME: [%[[TILE_M_3]], %[[N3]]]		// CHECK-SAME: [%[[TILE_M_3]], %[[N3]]]
// CHECK: %[[TILE_M_4:.+]] = affine.min #[[MAP3]](%[[IV0]])[%[[M]]]		// CHECK: %[[TILE_M_4:.+]] = affine.min #[[MAP3]](%[[IV0]])[%[[M]]]
// CHECK: %[[SV_ALLOC1:.+]] = memref.subview %[[ALLOC1]][%[[IV0]], 0]		// CHECK: %[[SV_ALLOC1:.+]] = memref.subview %[[ALLOC1]][%[[IV0]], 0]
// CHECK-SAME: [%[[TILE_M_4]], %[[N1]]]		// CHECK-SAME: [%[[TILE_M_4]], %[[N1]]]
// CHECK: %[[SV_ALLOC2:.+]] = memref.subview %[[ALLOC2]][%[[IV0]], 0]		// CHECK: %[[SV_ALLOC2:.+]] = memref.subview %[[ALLOC2]][%[[IV0]], 0]
// CHECK-SAME: [%[[TILE_M_4]], %[[N2]]]		// CHECK-SAME: [%[[TILE_M_4]], %[[N2]]]
// CHECK: %[[TILE_M_5:.+]] = affine.min #[[MAP2]](%[[IV0]])[%[[M]], %[[M]]]		// CHECK: %[[TILE_M_5:.+]] = affine.min #[[MAP2]](%[[IV0]])[%[[M]], %[[M]]]
// CHECK: %[[N0:.+]] = memref.dim %[[ARG0]], %[[C1]]		// CHECK: %[[N0:.+]] = memref.dim %[[ARG0]], %[[C1]]
// CHECK: %[[SV_ARG0:.+]] = memref.subview %[[ARG0]][%[[IV0]], 0]		// CHECK: %[[SV_ARG0:.+]] = memref.subview %[[ARG0]][%[[IV0]], 0]
// CHECK-SAME: [%[[TILE_M_5]], %[[N0]]]		// CHECK-SAME: [%[[TILE_M_5]], %[[N0]]]
		// CHECK: %[[SV_ALLOC4:.+]] = memref.subview %[[ALLOC1]][%[[IV0]], 0]
		// CHECK-SAME: [%[[TILE_M_5]], %[[N1]]]
// CHECK: linalg.fill(%{{.+}}, %[[SV_ALLOC1]])		// CHECK: linalg.fill(%{{.+}}, %[[SV_ALLOC1]])
// CHECK: linalg.matmul ins(%[[SV_ARG0]], %[[ARG1]]		// CHECK: linalg.matmul ins(%[[SV_ARG0]], %[[ARG1]]
// CHECK-SAME: : memref<?x?xf32, #[[MAP1]]>, memref<?x?xf32>)		// CHECK-SAME: : memref<?x?xf32, #[[MAP1]]>, memref<?x?xf32>)
// CHECK-SAME: outs(%[[SV_ALLOC1]] : memref<?x?xf32, #[[MAP1]]>)		// CHECK-SAME: outs(%[[SV_ALLOC4]] : memref<?x?xf32, #[[MAP1]]>)
// CHECK: linalg.fill(%{{.+}}, %[[SV_ALLOC2]])		// CHECK: linalg.fill(%{{.+}}, %[[SV_ALLOC2]])
// CHECK: linalg.matmul ins(%[[SV_ALLOC1]], %[[ARG2]]		// CHECK: linalg.matmul ins(%[[SV_ALLOC1]], %[[ARG2]]
// CHECK-SAME: : memref<?x?xf32, #[[MAP1]]>, memref<?x?xf32>)		// CHECK-SAME: : memref<?x?xf32, #[[MAP1]]>, memref<?x?xf32>)
// CHECK-SAME: outs(%[[SV_ALLOC2]] : memref<?x?xf32, #[[MAP1]]>)		// CHECK-SAME: outs(%[[SV_ALLOC2]] : memref<?x?xf32, #[[MAP1]]>)
// CHECK: linalg.fill(%{{.+}}, %[[SV_ARG4_2]])		// CHECK: linalg.fill(%{{.+}}, %[[SV_ARG4_2]])
// CHECK: linalg.matmul ins(%[[SV_ALLOC3]], %[[ARG3]]		// CHECK: linalg.matmul ins(%[[SV_ALLOC3]], %[[ARG3]]
// CHECK-SAME: : memref<?x?xf32, #[[MAP1]]>, memref<?x?xf32>)		// CHECK-SAME: : memref<?x?xf32, #[[MAP1]]>, memref<?x?xf32>)
// CHECK-SAME: outs(%[[SV_ARG4]] : memref<?x?xf32, #[[MAP1]]>)		// CHECK-SAME: outs(%[[SV_ARG4]] : memref<?x?xf32, #[[MAP1]]>)
▲ Show 20 Lines • Show All 66 Lines • ▼ Show 20 Lines	func @tensor_matmul_fusion(%arg0: tensor<?x?xf32>, %arg1: tensor<?x?xf32>,
%1 = linalg.matmul ins(%0, %arg3 : tensor<?x?xf32>, tensor<?x?xf32>)		%1 = linalg.matmul ins(%0, %arg3 : tensor<?x?xf32>, tensor<?x?xf32>)
outs(%arg4 : tensor<?x?xf32>) -> tensor<?x?xf32> // [M, N1] * [N1, N2]		outs(%arg4 : tensor<?x?xf32>) -> tensor<?x?xf32> // [M, N1] * [N1, N2]
%2 = linalg.matmul ins(%1, %arg5 : tensor<?x?xf32>, tensor<?x?xf32>)		%2 = linalg.matmul ins(%1, %arg5 : tensor<?x?xf32>, tensor<?x?xf32>)
outs(%arg6 : tensor<?x?xf32>) -> tensor<?x?xf32> // [M, N2] * [N2, N3]		outs(%arg6 : tensor<?x?xf32>) -> tensor<?x?xf32> // [M, N2] * [N2, N3]
return %2 : tensor<?x?xf32>		return %2 : tensor<?x?xf32>
}		}
}		}

// CHECK: #[[MAP0:.+]] = affine_map<(d0, d1) -> (16, d0 - d1)>		// CHaECK: #[[MAP0:.+]] = affine_map<(d0, d1) -> (16, d0 - d1)>
		// CHECK: #[[MAP0:.+]] = affine_map<(d0)[s0] -> (16, -d0 + s0)>
// CHECK: #[[MAP1:.+]] = affine_map<(d0)[s0, s1] -> (-d0 + s0, 16, -d0 + s1)>		// CHECK: #[[MAP1:.+]] = affine_map<(d0)[s0, s1] -> (-d0 + s0, 16, -d0 + s1)>

// CHECK: func @tensor_matmul_fusion(		// CHECK: func @tensor_matmul_fusion(
// CHECK-SAME: %[[ARG0:[a-zA-Z0-9_]+]]: tensor<?x?xf32>		// CHECK-SAME: %[[ARG0:[a-zA-Z0-9_]+]]: tensor<?x?xf32>
// CHECK-SAME: %[[ARG1:[a-zA-Z0-9_]+]]: tensor<?x?xf32>		// CHECK-SAME: %[[ARG1:[a-zA-Z0-9_]+]]: tensor<?x?xf32>
// CHECK-SAME: %[[ARG2:[a-zA-Z0-9_]+]]: tensor<?x?xf32>		// CHECK-SAME: %[[ARG2:[a-zA-Z0-9_]+]]: tensor<?x?xf32>
// CHECK-SAME: %[[ARG3:[a-zA-Z0-9_]+]]: tensor<?x?xf32>		// CHECK-SAME: %[[ARG3:[a-zA-Z0-9_]+]]: tensor<?x?xf32>
// CHECK-SAME: %[[ARG4:[a-zA-Z0-9_]+]]: tensor<?x?xf32>		// CHECK-SAME: %[[ARG4:[a-zA-Z0-9_]+]]: tensor<?x?xf32>
// CHECK-SAME: %[[ARG5:[a-zA-Z0-9_]+]]: tensor<?x?xf32>		// CHECK-SAME: %[[ARG5:[a-zA-Z0-9_]+]]: tensor<?x?xf32>
// CHECK-SAME: %[[ARG6:[a-zA-Z0-9_]+]]: tensor<?x?xf32>) -> tensor<?x?xf32> {		// CHECK-SAME: %[[ARG6:[a-zA-Z0-9_]+]]: tensor<?x?xf32>) -> tensor<?x?xf32> {
// CHECK-DAG: %[[C0:.+]] = constant 0 : index		// CHECK-DAG: %[[C0:.+]] = constant 0 : index
// CHECK-DAG: %[[C1:.+]] = constant 1 : index		// CHECK-DAG: %[[C1:.+]] = constant 1 : index
// CHECK: %[[M:.+]] = tensor.dim %[[ARG0]], %c0 : tensor<?x?xf32>		// CHECK: %[[M:.+]] = tensor.dim %[[ARG0]], %c0 : tensor<?x?xf32>
// CHECK: %[[R0:.+]] = scf.for %[[IV0:[a-zA-Z0-9_]+]] =		// CHECK: %[[R0:.+]] = scf.for %[[IV0:[a-zA-Z0-9_]+]] =
// CHECK-SAME: iter_args(%[[ARG8:.+]] = %[[ARG6]]) -> (tensor<?x?xf32>) {		// CHECK-SAME: iter_args(%[[ARG8:.+]] = %[[ARG6]]) -> (tensor<?x?xf32>) {
// CHECK: %[[M_1:.+]] = tensor.dim %[[ARG8]], %[[C0]]		// CHECK: %[[TILE_M_1:.+]] = affine.min #[[MAP0]](%[[IV0]])[%[[M]]]
// CHECK: %[[TILE_M_1:.+]] = affine.min #[[MAP0]](%[[M_1]], %[[IV0]])
// CHECK: %[[N3:.+]] = tensor.dim %[[ARG8]], %[[C1]]		// CHECK: %[[N3:.+]] = tensor.dim %[[ARG8]], %[[C1]]
// CHECK: %[[STARG6:.+]] = tensor.extract_slice %[[ARG8]][%[[IV0]], 0]		// CHECK: %[[STARG6:.+]] = tensor.extract_slice %[[ARG8]][%[[IV0]], 0]
// CHECK-SAME: [%[[TILE_M_1]], %[[N3]]]		// CHECK-SAME: [%[[TILE_M_1]], %[[N3]]]
// CHECK: %[[M_2:.+]] = tensor.dim %[[ARG4]], %[[C0]]		// CHECK: %[[TILE_M_2:.+]] = affine.min #[[MAP1]](%[[IV0]])[%[[M]], %[[M]]]
// CHECK: %[[TILE_M_2:.+]] = affine.min #[[MAP1]](%[[IV0]])[%[[M_2]], %[[M]]]
// CHECK: %[[N2:.+]] = tensor.dim %[[ARG4]], %[[C1]]		// CHECK: %[[N2:.+]] = tensor.dim %[[ARG4]], %[[C1]]
// CHECK: %[[STARG4:.+]] = tensor.extract_slice %[[ARG4]][%[[IV0]], 0]		// CHECK: %[[STARG4:.+]] = tensor.extract_slice %[[ARG4]][%[[IV0]], 0]
// CHECK-SAME: [%[[TILE_M_2]], %[[N2]]]		// CHECK-SAME: [%[[TILE_M_2]], %[[N2]]]
// CHECK: %[[TILE_M_3:.+]] = affine.min #[[MAP1]](%[[IV0]])[%[[M]], %[[M]]]
// CHECK: %[[N0:.+]] = tensor.dim %[[ARG0]], %[[C1]]		// CHECK: %[[N0:.+]] = tensor.dim %[[ARG0]], %[[C1]]
// CHECK: %[[STARG0:.+]] = tensor.extract_slice %[[ARG0]][%[[IV0]], 0]		// CHECK: %[[STARG0:.+]] = tensor.extract_slice %[[ARG0]][%[[IV0]], 0]
// CHECK-SAME: [%[[TILE_M_3]], %[[N0]]]		// CHECK-SAME: [%[[TILE_M_2]], %[[N0]]]
// CHECK: %[[M_3:.+]] = tensor.dim %[[ARG2]], %[[C0]]
// CHECK: %[[TILE_M_4:.+]] = affine.min #[[MAP1]](%[[IV0]])[%[[M_3]], %[[M]]]
// CHECK: %[[N1:.+]] = tensor.dim %[[ARG2]], %[[C1]]		// CHECK: %[[N1:.+]] = tensor.dim %[[ARG2]], %[[C1]]
// CHECK: %[[STARG2:.+]] = tensor.extract_slice %[[ARG2]][%[[IV0]], 0]		// CHECK: %[[STARG2:.+]] = tensor.extract_slice %[[ARG2]][%[[IV0]], 0]
// CHECK-SAME: [%[[TILE_M_4]], %[[N1]]]		// CHECK-SAME: [%[[TILE_M_2]], %[[N1]]]
// CHECK: %[[T0:.+]] = linalg.matmul		// CHECK: %[[T0:.+]] = linalg.matmul
// CHECK-SAME: ins(%[[STARG0]], %[[ARG1]] : tensor<?x?xf32>, tensor<?x?xf32>		// CHECK-SAME: ins(%[[STARG0]], %[[ARG1]] : tensor<?x?xf32>, tensor<?x?xf32>
// CHECK-SAME: ) outs(%[[STARG2]] : tensor<?x?xf32>)		// CHECK-SAME: ) outs(%[[STARG2]] : tensor<?x?xf32>)
// CHECK: %[[T1:.+]] = linalg.matmul		// CHECK: %[[T1:.+]] = linalg.matmul
// CHECK-SAME: ins(%[[T0]], %arg3 : tensor<?x?xf32>, tensor<?x?xf32>		// CHECK-SAME: ins(%[[T0]], %arg3 : tensor<?x?xf32>, tensor<?x?xf32>
// CHECK-SAME: ) outs(%[[STARG4]] : tensor<?x?xf32>)		// CHECK-SAME: ) outs(%[[STARG4]] : tensor<?x?xf32>)
// CHECK: %[[T2:.+]] = linalg.matmul		// CHECK: %[[T2:.+]] = linalg.matmul
// CHECK-SAME: ins(%[[T1]], %arg5 : tensor<?x?xf32>, tensor<?x?xf32>		// CHECK-SAME: ins(%[[T1]], %arg5 : tensor<?x?xf32>, tensor<?x?xf32>
// CHECK-SAME: ) outs(%[[STARG6]] : tensor<?x?xf32>)		// CHECK-SAME: ) outs(%[[STARG6]] : tensor<?x?xf32>)
// CHECK: %[[R1:.+]] = tensor.insert_slice %[[T2]]		// CHECK: %[[R1:.+]] = tensor.insert_slice %[[T2]]
// CHECK-SAME: into %[[ARG8]][%[[IV0]], 0] [%[[TILE_M_1]], %[[N3]]]		// CHECK-SAME: into %[[ARG8]][%[[IV0]], 0] [%[[TILE_M_1]], %[[N3]]]
// CHECK: scf.yield %[[R1]] : tensor<?x?xf32>		// CHECK: scf.yield %[[R1]] : tensor<?x?xf32>
// CHECK: }		// CHECK: }

mlir/test/Dialect/Linalg/fusion-tensor-pattern.mlir

	// RUN: mlir-opt %s -test-linalg-tensor-fusion-transform-patterns -resolve-shaped-type-result-dims -canonicalize -cse --split-input-file \| FileCheck %s			// RUN: mlir-opt %s -test-linalg-tensor-fusion-transform-patterns -resolve-shaped-type-result-dims -canonicalize -cse --split-input-file \| FileCheck %s
	// RUN: mlir-opt %s -test-linalg-tiled-loop-fusion-transform-patterns -resolve-shaped-type-result-dims -canonicalize -cse --split-input-file \| FileCheck %s --check-prefix=TLOOP			// RUN: mlir-opt %s -test-linalg-tiled-loop-fusion-transform-patterns -resolve-shaped-type-result-dims -canonicalize -cse --split-input-file \| FileCheck %s --check-prefix=TLOOP

	module {			module {
	func @matmul_fusion(%A: tensor<?x?xf32>, %B: tensor<?x?xf32>,			func @matmul_fusion(%A: tensor<?x?xf32>, %B: tensor<?x?xf32>,
	%AB_init: tensor<?x?xf32>, %C: tensor<?x?xf32>,			%AB_init: tensor<?x?xf32>, %C: tensor<?x?xf32>,
	%ABC_init: tensor<?x?xf32>) -> tensor<?x?xf32> {			%ABC_init: tensor<?x?xf32>) -> tensor<?x?xf32> {
	%AB = linalg.matmul ins(%A, %B : tensor<?x?xf32>, tensor<?x?xf32>)			%AB = linalg.matmul ins(%A, %B : tensor<?x?xf32>, tensor<?x?xf32>)
	outs(%AB_init : tensor<?x?xf32>) -> tensor<?x?xf32> // <MxN1> <N1xN2>			outs(%AB_init : tensor<?x?xf32>) -> tensor<?x?xf32> // <MxN1> <N1xN2>
	%ABC = linalg.matmul {__internal_linalg_transform__ = "lhs_fusion"}			%ABC = linalg.matmul {__internal_linalg_transform__ = "lhs_fusion"}
	ins(%AB, %C : tensor<?x?xf32>, tensor<?x?xf32>)			ins(%AB, %C : tensor<?x?xf32>, tensor<?x?xf32>)
	outs(%ABC_init : tensor<?x?xf32>) -> tensor<?x?xf32> // <MxN2> <N2xN3>			outs(%ABC_init : tensor<?x?xf32>) -> tensor<?x?xf32> // <MxN2> <N2xN3>
	return %ABC : tensor<?x?xf32>			return %ABC : tensor<?x?xf32>
	}			}
	}			}
	// CHECK-DAG: #[[MAP1:.+]] = affine_map<(d0, d1) -> (32, d0 - d1)>			// CHECK-DAG: #[[MAP1:.+]] = affine_map<(d0)[s0] -> (32, -d0 + s0)>
	// CHECK-DAG: #[[MAP2:.+]] = affine_map<(d0)[s0] -> (16, -d0 + s0)>			// CHECK-DAG: #[[MAP2:.+]] = affine_map<(d0)[s0] -> (16, -d0 + s0)>
	// CHECK-DAG: #[[MAP3:.+]] = affine_map<(d0)[s0] -> (64, -d0 + s0)>			// CHECK-DAG: #[[MAP3:.+]] = affine_map<(d0)[s0] -> (64, -d0 + s0)>
	// CHECK-DAG: #[[MAP4:.+]] = affine_map<(d0, d1) -> (64, d0 - d1)>
	// CHECK-DAG: #[[MAP5:.+]] = affine_map<(d0)[s0, s1] -> (-d0 + s0, 32, -d0 + s1)>			// CHECK-DAG: #[[MAP5:.+]] = affine_map<(d0)[s0, s1] -> (-d0 + s0, 32, -d0 + s1)>

	// CHECK: func @matmul_fusion			// CHECK: func @matmul_fusion
	// CHECK-SAME: %[[ARG0:[a-zA-Z0-9_]+]]: tensor<?x?xf32>			// CHECK-SAME: %[[ARG0:[a-zA-Z0-9_]+]]: tensor<?x?xf32>
	// CHECK-SAME: %[[ARG1:[a-zA-Z0-9_]+]]: tensor<?x?xf32>			// CHECK-SAME: %[[ARG1:[a-zA-Z0-9_]+]]: tensor<?x?xf32>
	// CHECK-SAME: %[[ARG2:[a-zA-Z0-9_]+]]: tensor<?x?xf32>			// CHECK-SAME: %[[ARG2:[a-zA-Z0-9_]+]]: tensor<?x?xf32>
	// CHECK-SAME: %[[ARG3:[a-zA-Z0-9_]+]]: tensor<?x?xf32>			// CHECK-SAME: %[[ARG3:[a-zA-Z0-9_]+]]: tensor<?x?xf32>
	// CHECK-SAME: %[[ARG4:[a-zA-Z0-9_]+]]: tensor<?x?xf32>			// CHECK-SAME: %[[ARG4:[a-zA-Z0-9_]+]]: tensor<?x?xf32>

	// CHECK-DAG: %[[C0:.+]] = constant 0 : index			// CHECK-DAG: %[[C0:.+]] = constant 0 : index
	// CHECK-DAG: %[[C1:.+]] = constant 1 : index			// CHECK-DAG: %[[C1:.+]] = constant 1 : index
	// CHECK-DAG: %[[C32:.+]] = constant 32 : index			// CHECK-DAG: %[[C32:.+]] = constant 32 : index
	// CHECK-DAG: %[[C64:.+]] = constant 64 : index			// CHECK-DAG: %[[C64:.+]] = constant 64 : index
	// CHECK-DAG: %[[C16:.+]] = constant 16 : index			// CHECK-DAG: %[[C16:.+]] = constant 16 : index
	// CHECK-DAG: %[[M:.+]] = tensor.dim %[[ARG0]], %[[C0]]			// CHECK-DAG: %[[M:.+]] = tensor.dim %[[ARG0]], %[[C0]]
	// CHECK: %[[RESULT:.+]] = scf.for %[[IV0:[a-zA-Z0-9]+]] =			// CHECK: %[[RESULT:.+]] = scf.for %[[IV0:[a-zA-Z0-9]+]] =
	// CHECK-SAME: %[[C0]] to %[[M]] step %[[C32]]			// CHECK-SAME: %[[C0]] to %[[M]] step %[[C32]]
	// CHECK-SAME: iter_args(%[[ARG6:.+]] = %[[ARG4]]) -> (tensor<?x?xf32>) {			// CHECK-SAME: iter_args(%[[ARG6:.+]] = %[[ARG4]]) -> (tensor<?x?xf32>) {
	// CHECK: %[[M_2:.+]] = tensor.dim %[[ARG6]], %[[C0]]			// CHECK: %[[TILE_M_2:.+]] = affine.min #[[MAP1]](%[[IV0]])[%[[M]]]
	// CHECK: %[[TILE_M_2:.+]] = affine.min #[[MAP1]](%[[M_2]], %[[IV0]])
	// CHECK: %[[N3:.+]] = tensor.dim %[[ARG6]], %[[C1]]			// CHECK: %[[N3:.+]] = tensor.dim %[[ARG6]], %[[C1]]
	// CHECK: %[[ST_ARG6:.+]] = tensor.extract_slice %[[ARG6]][%[[IV0]], 0]			// CHECK: %[[ST_ARG6:.+]] = tensor.extract_slice %[[ARG6]][%[[IV0]], 0]
	// CHECK-SAME: [%[[TILE_M_2]], %[[N3]]]			// CHECK-SAME: [%[[TILE_M_2]], %[[N3]]]
	// CHECK: %[[TILE_M_3:.+]] = affine.min #[[MAP5]](%[[IV0]])[%[[M]], %[[M]]]			// CHECK: %[[TILE_M_3:.+]] = affine.min #[[MAP5]](%[[IV0]])[%[[M]], %[[M]]]
	// CHECK: %[[N1:.+]] = tensor.dim %[[ARG0]], %[[C1]]			// CHECK: %[[N1:.+]] = tensor.dim %[[ARG0]], %[[C1]]
	// CHECK: %[[ST_ARG0:.+]] = tensor.extract_slice %[[ARG0]][%[[IV0]], 0]			// CHECK: %[[ST_ARG0:.+]] = tensor.extract_slice %[[ARG0]][%[[IV0]], 0]
	// CHECK-SAME: [%[[TILE_M_3]], %[[N1]]]			// CHECK-SAME: [%[[TILE_M_3]], %[[N1]]]
	// CHECK: %[[M_3:.+]] = tensor.dim %[[ARG2]], %[[C0]]
	// CHECK: %[[TILE_M_4:.+]] = affine.min #[[MAP5]](%[[IV0]])[%[[M_3]], %[[M]]]
	// CHECK: %[[N2_2:.+]] = tensor.dim %[[ARG2]], %[[C1]]			// CHECK: %[[N2_2:.+]] = tensor.dim %[[ARG2]], %[[C1]]
	// CHECK: %[[ST_ARG2:.+]] = tensor.extract_slice %[[ARG2]][%[[IV0]], 0]			// CHECK: %[[ST_ARG2:.+]] = tensor.extract_slice %[[ARG2]][%[[IV0]], 0]
	// CHECK-SAME: [%[[TILE_M_4]], %[[N2_2]]]			// CHECK-SAME: [%[[TILE_M_3]], %[[N2_2]]]
	// CHECK: %[[LHS:.+]] = linalg.matmul			// CHECK: %[[LHS:.+]] = linalg.matmul
	// CHECK-SAME: __internal_linalg_transform__ = "after_lhs_fusion_producer"			// CHECK-SAME: __internal_linalg_transform__ = "after_lhs_fusion_producer"
	// CHECK-SAME: ins(%[[ST_ARG0]], %[[ARG1]] : tensor<?x?xf32>, tensor<?x?xf32>)			// CHECK-SAME: ins(%[[ST_ARG0]], %[[ARG1]] : tensor<?x?xf32>, tensor<?x?xf32>)
	// CHECK-SAME: outs(%[[ST_ARG2]] : tensor<?x?xf32>)			// CHECK-SAME: outs(%[[ST_ARG2]] : tensor<?x?xf32>)
	// CHECK: %[[N2:.+]] = tensor.dim %[[ARG1]], %[[C1]]			// CHECK: %[[N2:.+]] = tensor.dim %[[ARG1]], %[[C1]]
	// CHECK: %[[N3_2:.+]] = tensor.dim %[[ARG3]], %[[C1]]			// CHECK: %[[N3_2:.+]] = tensor.dim %[[ARG3]], %[[C1]]
	// CHECK: %[[YIELD0:.+]] = scf.for %[[IV1:[a-zA-Z0-9]+]] =			// CHECK: %[[YIELD0:.+]] = scf.for %[[IV1:[a-zA-Z0-9]+]] =
	// CHECK-SAME: %[[C0]] to %[[N3_2]] step %[[C64]]			// CHECK-SAME: %[[C0]] to %[[N3_2]] step %[[C64]]
	// CHECK-SAME: iter_args(%[[ARG8:.+]] = %[[ST_ARG6]]) -> (tensor<?x?xf32>) {			// CHECK-SAME: iter_args(%[[ARG8:.+]] = %[[ST_ARG6]]) -> (tensor<?x?xf32>) {
	// CHECK: %[[YIELD1:.+]] = scf.for %[[IV2:[a-zA-Z0-9]+]] =			// CHECK: %[[YIELD1:.+]] = scf.for %[[IV2:[a-zA-Z0-9]+]] =
	// CHECK-SAME: %[[C0]] to %[[N2]] step %[[C16]]			// CHECK-SAME: %[[C0]] to %[[N2]] step %[[C16]]
	// CHECK-SAME: iter_args(%[[ARG10:.+]] = %[[ARG8]]) -> (tensor<?x?xf32>) {			// CHECK-SAME: iter_args(%[[ARG10:.+]] = %[[ARG8]]) -> (tensor<?x?xf32>) {
	// CHECK: %[[TILE_N2:.+]] = affine.min #[[MAP2]](%[[IV2]])[%[[N2]]]			// CHECK: %[[TILE_N2:.+]] = affine.min #[[MAP2]](%[[IV2]])[%[[N2]]]
	// CHECK: %[[ST_LHS:.+]] = tensor.extract_slice %[[LHS]][0, %[[IV2]]]			// CHECK: %[[ST_LHS:.+]] = tensor.extract_slice %[[LHS]][0, %[[IV2]]]
	// CHECK-SAME: [%[[TILE_M_3]], %[[TILE_N2]]]			// CHECK-SAME: [%[[TILE_M_3]], %[[TILE_N2]]]
	// CHECK: %[[N2_3:.+]] = tensor.dim %[[ARG3]], %[[C0]]
	// CHECK: %[[TILE_N2_2:.+]] = affine.min #[[MAP2]](%[[IV2]])[%[[N2_3]]]
	// CHECK: %[[TILE_N3:.+]] = affine.min #[[MAP3]](%[[IV1]])[%[[N3_2]]]			// CHECK: %[[TILE_N3:.+]] = affine.min #[[MAP3]](%[[IV1]])[%[[N3_2]]]
	// CHECK: %[[ST_ARG3:.+]] = tensor.extract_slice %[[ARG3]][%[[IV2]], %[[IV1]]]			// CHECK: %[[ST_ARG3:.+]] = tensor.extract_slice %[[ARG3]][%[[IV2]], %[[IV1]]]
	// CHECK-SAME: [%[[TILE_N2_2]], %[[TILE_N3]]]			// CHECK-SAME: [%[[TILE_N2]], %[[TILE_N3]]]
	// CHECK: %[[M_4:.+]] = tensor.dim %[[ARG10]], %[[C0]]			// CHECK: %[[M_4:.+]] = tensor.dim %[[ARG10]], %[[C0]]
	// CHECK: %[[N3_3:.+]] = tensor.dim %[[ARG10]], %[[C1]]
	// CHECK: %[[TILE_N3_2:.+]] = affine.min #[[MAP4]](%[[N3_3]], %[[IV1]])
	// CHECK: %[[ST_ARG4:.+]] = tensor.extract_slice %[[ARG10]][0, %[[IV1]]]			// CHECK: %[[ST_ARG4:.+]] = tensor.extract_slice %[[ARG10]][0, %[[IV1]]]
	// CHECK-SAME: [%[[M_4]], %[[TILE_N3_2]]]			// CHECK-SAME: [%[[M_4]], %[[TILE_N3]]]
	// CHECK: %[[ST_RESULT:.+]] = linalg.matmul			// CHECK: %[[ST_RESULT:.+]] = linalg.matmul
	// CHECK-SAME: __internal_linalg_transform__ = "after_lhs_fusion"			// CHECK-SAME: __internal_linalg_transform__ = "after_lhs_fusion"
	// CHECK-SAME: ins(%[[ST_LHS]], %[[ST_ARG3]]			// CHECK-SAME: ins(%[[ST_LHS]], %[[ST_ARG3]]
	// CHECK-SAME: : tensor<?x?xf32>, tensor<?x?xf32>)			// CHECK-SAME: : tensor<?x?xf32>, tensor<?x?xf32>)
	// CHECK-SAME: outs(%[[ST_ARG4]] : tensor<?x?xf32>)			// CHECK-SAME: outs(%[[ST_ARG4]] : tensor<?x?xf32>)
	// CHECK: %[[UPDATE1:.+]] = tensor.insert_slice %[[ST_RESULT]]			// CHECK: %[[UPDATE1:.+]] = tensor.insert_slice %[[ST_RESULT]]
	// CHECK-SAME: into %[[ARG10]][0, %[[IV1]]] [%[[M_4]], %[[TILE_N3_2]]]			// CHECK-SAME: into %[[ARG10]][0, %[[IV1]]] [%[[M_4]], %[[TILE_N3]]]
	// CHECK: scf.yield %[[UPDATE1]]			// CHECK: scf.yield %[[UPDATE1]]
	// CHECK: }			// CHECK: }
	// CHECK: scf.yield %[[YIELD1]]			// CHECK: scf.yield %[[YIELD1]]
	// CHECK: }			// CHECK: }
	// CHECK: %[[UPDATE0:.+]] = tensor.insert_slice %[[YIELD0]] into			// CHECK: %[[UPDATE0:.+]] = tensor.insert_slice %[[YIELD0]] into
	// CHECK-SAME: %[[ARG6]][%[[IV0]], 0] [%[[TILE_M_2]], %[[N3]]]			// CHECK-SAME: %[[ARG6]][%[[IV0]], 0] [%[[TILE_M_2]], %[[N3]]]
	// CHECK: scf.yield %[[UPDATE0]]			// CHECK: scf.yield %[[UPDATE0]]
	// CHECK: }			// CHECK: }
	▲ Show 20 Lines • Show All 311 Lines • Show Last 20 Lines

mlir/test/Dialect/Linalg/fusion.mlir

Show First 20 Lines • Show All 251 Lines • ▼ Show 20 Lines	func @f5(%A: memref<?x?xf32, offset: 0, strides: [?, ?]>,
}		}
return %E : memref<?x?xf32, offset: 0, strides: [?, ?]>		return %E : memref<?x?xf32, offset: 0, strides: [?, ?]>
}		}

// CHECK-DAG: #[[BOUND_2_MAP:.+]] = affine_map<(d0)[s0] -> (2, -d0 + s0)>		// CHECK-DAG: #[[BOUND_2_MAP:.+]] = affine_map<(d0)[s0] -> (2, -d0 + s0)>
// CHECK-DAG: #[[BOUND_2_MAP_2:.+]] = affine_map<(d0)[s0, s1] -> (-d0 + s0, 2, -d0 + s1)>		// CHECK-DAG: #[[BOUND_2_MAP_2:.+]] = affine_map<(d0)[s0, s1] -> (-d0 + s0, 2, -d0 + s1)>
// CHECK-DAG: #[[BOUND_4_MAP:.+]] = affine_map<(d0)[s0] -> (4, -d0 + s0)>		// CHECK-DAG: #[[BOUND_4_MAP:.+]] = affine_map<(d0)[s0] -> (4, -d0 + s0)>
// CHECK: func @f5		// CHECK: func @f5
// HECK-SAME: (%[[A:.]]:{{.}}, %[[B:.]]:{{.}}, %[[C:.]]:{{.}}, %[[D:.]]:{{.}}, %[[E:.]]:{{.}})		// CHECK-SAME: (%[[A:.]]:{{.}}, %[[B:.]]:{{.}}, %[[C:.]]:{{.}}, %[[D:.]]:{{.}}, %[[E:.]]:{{.}})
// CHECK-DAG: %[[C0:.*]] = constant 0 : index		// CHECK-DAG: %[[C0:.*]] = constant 0 : index
// CHECK-DAG: %[[C1:.*]] = constant 1 : index		// CHECK-DAG: %[[C1:.*]] = constant 1 : index
		// CHECK-DAG: %[[A_0:.*]] = memref.dim %[[A]], %[[C0]] : memref<?x?xf32, #[[$strided2D]]>
// CHECK-DAG: %[[B_1:.*]] = memref.dim %[[B]], %[[C1]] : memref<?x?xf32, #[[$strided2D]]>		// CHECK-DAG: %[[B_1:.*]] = memref.dim %[[B]], %[[C1]] : memref<?x?xf32, #[[$strided2D]]>
// CHECK-DAG: %[[C_0:.*]] = memref.dim %[[C]], %[[C0]] : memref<?x?xf32, #[[$strided2D]]>		// CHECK-DAG: %[[C_0:.*]] = memref.dim %[[C]], %[[C0]] : memref<?x?xf32, #[[$strided2D]]>
// CHECK-DAG: %[[D_0:.*]] = memref.dim %[[D]], %[[C0]] : memref<?x?xf32, #[[$strided2D]]>		// CHECK-DAG: %[[D_0:.*]] = memref.dim %[[D]], %[[C0]] : memref<?x?xf32, #[[$strided2D]]>
// CHECK-DAG: %[[D_1:.*]] = memref.dim %[[D]], %[[C1]] : memref<?x?xf32, #[[$strided2D]]>		// CHECK-DAG: %[[D_1:.*]] = memref.dim %[[D]], %[[C1]] : memref<?x?xf32, #[[$strided2D]]>
// CHECK-DAG: %[[B_00:.]] = memref.subview %[[B]][0, 0]{{.}}		// CHECK-DAG: %[[B_00:.]] = memref.subview %[[B]][0, 0]{{.}}
// CHECK: scf.for %[[I:.]] = %{{.}} to %[[D_0]] step %{{.*}} {		// CHECK: scf.for %[[I:.]] = %{{.}} to %[[D_0]] step %{{.*}} {
// CHECK: %[[BOUND_2_C0:.+]] = affine.min #[[BOUND_2_MAP]](%[[I]])[%[[C_0]]]		// CHECK: %[[BOUND_2_C0:.+]] = affine.min #[[BOUND_2_MAP]](%[[I]])[%[[C_0]]]
// CHECK: %[[C_I0:.*]] = memref.subview %[[C]][%[[I]], 0] [%[[BOUND_2_C0]]		// CHECK: %[[C_I0:.*]] = memref.subview %[[C]][%[[I]], 0] [%[[BOUND_2_C0]]
// CHECK: %[[BOUND_2_D0:.+]] = affine.min #[[BOUND_2_MAP]](%[[I]])[%[[D_0]]]		// CHECK: %[[BOUND_ID_C0:.+]] = affine.min #[[BOUND_2_MAP_2]](%[[I]])[%[[A_0]], %[[C_0]]]
// CHECK: %[[A_I0:.*]] = memref.subview %[[A]][%[[I]], 0]		// CHECK: %[[A_I0:.*]] = memref.subview %[[A]][%[[I]], 0]
// CHECK: %[[BOUND_ID_C0:.+]] = affine.min #[[BOUND_2_MAP_2]](%[[I]])[%[[C_0]], %[[C_0]]]
// CHECK: %[[C_I0_OUT:.*]] = memref.subview %[[C]][%[[I]], 0] [%[[BOUND_ID_C0]]		// CHECK: %[[C_I0_OUT:.*]] = memref.subview %[[C]][%[[I]], 0] [%[[BOUND_ID_C0]]
// CHECK: scf.for %[[J:.]] = %{{.}} to %[[B_1]] step %{{.*}} {		// CHECK: scf.for %[[J:.]] = %{{.}} to %[[B_1]] step %{{.*}} {
// CHECK: %[[E_IJ:.*]] = memref.subview %[[E]][%[[I]], %[[J]]]		// CHECK: %[[E_IJ:.*]] = memref.subview %[[E]][%[[I]], %[[J]]]
// CHECK: scf.for %[[K:.]] = %{{.}} to %[[D_1]] step %{{.*}} {		// CHECK: scf.for %[[K:.]] = %{{.}} to %[[D_1]] step %{{.*}} {
// CHECK: %[[D_IK:.*]] = memref.subview %[[D]][%[[I]], %[[K]]] [2, 4]		// CHECK: %[[D_IK:.*]] = memref.subview %[[D]][%[[I]], %[[K]]] [2, 4]
// CHECK: %[[B_KJ:.*]] = memref.subview %[[B]][%[[K]], %[[J]]]		// CHECK: %[[B_KJ:.*]] = memref.subview %[[B]][%[[K]], %[[J]]]
		// CHECK: %[[BOUND_4_B1:.*]] = affine.min #[[BOUND_4_MAP]](%[[K]])[%[[B_1]]]
// CHECK: %[[B_0K:.*]] = memref.subview %[[B]][0, %[[K]]]		// CHECK: %[[B_0K:.*]] = memref.subview %[[B]][0, %[[K]]]
// CHECK: %[[BOUND_4_D1:.+]] = affine.min #[[BOUND_4_MAP]](%[[K]])[%[[D_1]]]		// CHECK: %[[D_IK_OUT:.+]] = memref.subview %[[D]][%[[I]], %[[K]]] [%[[BOUND_2_C0]], %[[BOUND_4_B1]]]
// CHECK: %[[D_IK_OUT:.+]] = memref.subview %[[D]][%[[I]], %[[K]]] [%[[BOUND_2_D0]], %[[BOUND_4_D1]]]
// CHECK: linalg.matmul ins(%[[A_I0]], %[[B_00]]{{.*}} outs(%[[C_I0_OUT]]		// CHECK: linalg.matmul ins(%[[A_I0]], %[[B_00]]{{.*}} outs(%[[C_I0_OUT]]
// CHECK: linalg.matmul ins(%[[C_I0]], %[[B_0K]]{{.*}} outs(%[[D_IK_OUT]]		// CHECK: linalg.matmul ins(%[[C_I0]], %[[B_0K]]{{.*}} outs(%[[D_IK_OUT]]
// CHECK: linalg.matmul ins(%[[D_IK]], %[[B_KJ]]{{.*}} outs(%[[E_IJ]]		// CHECK: linalg.matmul ins(%[[D_IK]], %[[B_KJ]]{{.*}} outs(%[[E_IJ]]

// -----		// -----

#map0 = affine_map<(d0) -> (d0 + 2)>		#map0 = affine_map<(d0) -> (d0 + 2)>
#map1 = affine_map<(d0) -> (d0 + 4)>		#map1 = affine_map<(d0) -> (d0 + 4)>
▲ Show 20 Lines • Show All 474 Lines • Show Last 20 Lines

mlir/test/Dialect/Linalg/tile-and-fuse-tensors.mlir

Show All 38 Lines
// CHECK-SAME: %[[C:[0-9a-z]*]]: tensor<?x?xf32>		// CHECK-SAME: %[[C:[0-9a-z]*]]: tensor<?x?xf32>

// CHECK-DAG: %[[C0:.*]] = constant 0 : index		// CHECK-DAG: %[[C0:.*]] = constant 0 : index
// CHECK-DAG: %[[C1:.*]] = constant 1 : index		// CHECK-DAG: %[[C1:.*]] = constant 1 : index
// CHECK-DAG: %[[dA0:.*]] = tensor.dim %[[A]], %[[C0]] : tensor<?x?xf32>		// CHECK-DAG: %[[dA0:.*]] = tensor.dim %[[A]], %[[C0]] : tensor<?x?xf32>
// CHECK-DAG: %[[dA1:.*]] = tensor.dim %[[A]], %[[C1]] : tensor<?x?xf32>		// CHECK-DAG: %[[dA1:.*]] = tensor.dim %[[A]], %[[C1]] : tensor<?x?xf32>
// CHECK-DAG: %[[dB0:.*]] = tensor.dim %[[B]], %[[C0]] : tensor<?x?xf32>		// CHECK-DAG: %[[dB0:.*]] = tensor.dim %[[B]], %[[C0]] : tensor<?x?xf32>
// CHECK-DAG: %[[dB1:.*]] = tensor.dim %[[B]], %[[C1]] : tensor<?x?xf32>		// CHECK-DAG: %[[dB1:.*]] = tensor.dim %[[B]], %[[C1]] : tensor<?x?xf32>
// CHECK-DAG: %[[dC0:.*]] = tensor.dim %[[C]], %[[C0]] : tensor<?x?xf32>
// CHECK-DAG: %[[dC1:.*]] = tensor.dim %[[C]], %[[C1]] : tensor<?x?xf32>
// CHECK: scf.for %[[I:[0-9a-z]*]]		// CHECK: scf.for %[[I:[0-9a-z]*]]
// CHECK: %[[sizeA0:.*]] = affine.min #[[BOUND2_MAP]](%[[I]])[%[[dA0]]]		// CHECK: %[[sizeA0:.*]] = affine.min #[[BOUND2_MAP]](%[[I]])[%[[dA0]]]
// CHECK: %[[stA:.*]] = tensor.extract_slice %[[A]][%[[I]], 0] [%[[sizeA0]], %[[dA1]]] [1, 1] : tensor<?x?xf32> to tensor<?x?xf32>		// CHECK: %[[stA:.*]] = tensor.extract_slice %[[A]][%[[I]], 0] [%[[sizeA0]], %[[dA1]]] [1, 1] : tensor<?x?xf32> to tensor<?x?xf32>
// CHECK: %[[sizeC0:.*]] = affine.min #[[BOUND2_MAP]](%[[I]])[%[[dC0]]]
// CHECK-NEXT: scf.for %[[J:[0-9a-z]*]]		// CHECK-NEXT: scf.for %[[J:[0-9a-z]*]]
// CHECK-NEXT: scf.for %[[K:[0-9a-z]]] {{.}} iter_args(%[[RES:[0-9a-z]*]]		// CHECK-NEXT: scf.for %[[K:[0-9a-z]]] {{.}} iter_args(%[[RES:[0-9a-z]*]]
// CHECK-DAG: %[[stB1:.*]] = tensor.extract_slice %[[B]][%[[K]], %[[J]]] [4, 3] [1, 1] : tensor<?x?xf32> to tensor<4x3xf32>		// CHECK-DAG: %[[stB1:.*]] = tensor.extract_slice %[[B]][%[[K]], %[[J]]] [4, 3] [1, 1] : tensor<?x?xf32> to tensor<4x3xf32>
// CHECK-DAG: %[[stF:.*]] = tensor.extract_slice %[[RES]][%[[I]], %[[J]]] [2, 3] [1, 1] : tensor<?x?xf32> to tensor<2x3xf32>		// CHECK-DAG: %[[stF:.*]] = tensor.extract_slice %[[RES]][%[[I]], %[[J]]] [2, 3] [1, 1] : tensor<?x?xf32> to tensor<2x3xf32>
//		//
// slices of the producing matmul.		// slices of the producing matmul.
// CHECK: %[[sizeB1:.*]] = affine.min #[[BOUND4_MAP]](%[[K]])[%[[dB1]]]		// CHECK: %[[sizeB1:.*]] = affine.min #[[BOUND4_MAP]](%[[K]])[%[[dB1]]]
// CHECK: %[[stB2:.*]] = tensor.extract_slice %[[B]][0, %[[K]]] [%[[dB0]], %[[sizeB1]]] [1, 1] : tensor<?x?xf32> to tensor<?x?xf32>		// CHECK: %[[stB2:.*]] = tensor.extract_slice %[[B]][0, %[[K]]] [%[[dB0]], %[[sizeB1]]] [1, 1] : tensor<?x?xf32> to tensor<?x?xf32>
// CHECK: %[[sizeC1:.*]] = affine.min #[[BOUND4_MAP]](%[[K]])[%[[dC1]]]		// CHECK: %[[stC:.*]] = tensor.extract_slice %[[C]][%[[I]], %[[K]]] [%[[sizeA0]], %[[sizeB1]]] [1, 1] : tensor<?x?xf32> to tensor<?x?xf32>
// CHECK: %[[stC:.*]] = tensor.extract_slice %[[C]][%[[I]], %[[K]]] [%[[sizeC0]], %[[sizeC1]]] [1, 1] : tensor<?x?xf32> to tensor<?x?xf32>
// CHECK: %[[stD:.*]] = linalg.matmul ins(%[[stA]], %[[stB2]] : tensor<?x?xf32>, tensor<?x?xf32>) outs(%[[stC]] : tensor<?x?xf32>) -> tensor<?x?xf32>		// CHECK: %[[stD:.*]] = linalg.matmul ins(%[[stA]], %[[stB2]] : tensor<?x?xf32>, tensor<?x?xf32>) outs(%[[stC]] : tensor<?x?xf32>) -> tensor<?x?xf32>
// CHECK: %[[CAST:.*]] = tensor.cast %[[stD]] : tensor<?x?xf32> to tensor<2x4xf32>		// CHECK: %[[CAST:.*]] = tensor.cast %[[stD]] : tensor<?x?xf32> to tensor<2x4xf32>
// CHECK-NEXT: %[[stG:.*]] = linalg.matmul ins(%[[CAST]], %[[stB1]] : tensor<2x4xf32>, tensor<4x3xf32>) outs(%[[stF]] : tensor<2x3xf32>) -> tensor<2x3xf32>		// CHECK-NEXT: %[[stG:.*]] = linalg.matmul ins(%[[CAST]], %[[stB1]] : tensor<2x4xf32>, tensor<4x3xf32>) outs(%[[stF]] : tensor<2x3xf32>) -> tensor<2x3xf32>
// CHECK-NEXT: tensor.insert_slice %[[stG]] into %[[RES]][%[[I]], %[[J]]]		// CHECK-NEXT: tensor.insert_slice %[[stG]] into %[[RES]][%[[I]], %[[J]]]

// -----		// -----

func @conv_tensors_static(%input: tensor<1x225x225x3xf32>, %filter: tensor<3x3x3x32xf32>, %elementwise: tensor<1x112x112x32xf32>) -> tensor<1x112x112x32xf32> {		func @conv_tensors_static(%input: tensor<1x225x225x3xf32>, %filter: tensor<3x3x3x32xf32>, %elementwise: tensor<1x112x112x32xf32>) -> tensor<1x112x112x32xf32> {
▲ Show 20 Lines • Show All 131 Lines • ▼ Show 20 Lines	func @conv_tensors_dynamic(%input: tensor<?x?x?x?xf32>, %filter: tensor<?x?x?x?xf32>, %elementwise: tensor<?x?x?x?xf32>) -> tensor<?x?x?x?xf32> {
}		}
return %for0 : tensor<?x?x?x?xf32>		return %for0 : tensor<?x?x?x?xf32>
}		}

// CHECK: #[[BOUND8_MAP:.+]] = affine_map<(d0)[s0] -> (8, -d0 + s0)>		// CHECK: #[[BOUND8_MAP:.+]] = affine_map<(d0)[s0] -> (8, -d0 + s0)>
// CHECK: #[[BOUND8_MAP_2:.+]] = affine_map<(d0)[s0, s1] -> (-d0 + s0, 8, -d0 + s1)>		// CHECK: #[[BOUND8_MAP_2:.+]] = affine_map<(d0)[s0, s1] -> (-d0 + s0, 8, -d0 + s1)>
// CHECK: #[[BOUND16_MAP:.+]] = affine_map<(d0)[s0] -> (16, -d0 + s0)>		// CHECK: #[[BOUND16_MAP:.+]] = affine_map<(d0)[s0] -> (16, -d0 + s0)>
// CHECK: #[[X2_MAP:.+]] = affine_map<(d0) -> (d0 * 2)>		// CHECK: #[[X2_MAP:.+]] = affine_map<(d0) -> (d0 * 2)>
// CHECK: #[[INPUT_BOUND:.+]] = affine_map<(d0, d1)[s0, s1] -> (d0 * 2 + s0 - 2, d1 * -2 + s1)>		// CHECK: #[[INPUT_BOUND:.+]] = affine_map<(d0, d1)[s0, s1] -> (d0 * 2 + s0 - 2, d1 * -2 + s0 + s1 * 2)>
// CHECK: #[[BOUND16_MAP_2:.+]] = affine_map<(d0)[s0, s1] -> (-d0 + s0, 16, -d0 + s1)>		// CHECK: #[[BOUND16_MAP_2:.+]] = affine_map<(d0)[s0, s1] -> (-d0 + s0, 16, -d0 + s1)>
// CHECK: #[[BOUND4_MAP:.+]] = affine_map<(d0)[s0] -> (4, -d0 + s0)>		// CHECK: #[[BOUND4_MAP:.+]] = affine_map<(d0)[s0] -> (4, -d0 + s0)>
// CHECK: #[[BOUND2_MAP:.+]] = affine_map<(d0)[s0] -> (2, -d0 + s0)>		// CHECK: #[[BOUND2_MAP:.+]] = affine_map<(d0)[s0] -> (2, -d0 + s0)>
// CHECK: #[[BOUND4_MAP_2:.+]] = affine_map<(d0)[s0, s1] -> (-d0 + s0, 4, -d0 + s1)>		// CHECK: #[[BOUND4_MAP_2:.+]] = affine_map<(d0)[s0, s1] -> (-d0 + s0, 4, -d0 + s1)>
// CHECK: #[[BOUND2_MAP_2:.+]] = affine_map<(d0, d1)[s0, s1] -> (-d0 + s0, 2, -d1 + s1)>		// CHECK: #[[BOUND2_MAP_2:.+]] = affine_map<(d0, d1)[s0, s1] -> (-d0 + s0, 2, -d1 + s1)>

// CHECK: func @conv_tensors_dynamic		// CHECK: func @conv_tensors_dynamic
// CHECK-SAME: (%[[INPUT]]: tensor<?x?x?x?xf32>, %[[FILTER]]: tensor<?x?x?x?xf32>, %[[ELEM]]: tensor<?x?x?x?xf32>)		// CHECK-SAME: (%[[INPUT]]: tensor<?x?x?x?xf32>, %[[FILTER]]: tensor<?x?x?x?xf32>, %[[ELEM]]: tensor<?x?x?x?xf32>)

// CHECK-DAG: %[[C0:.+]] = constant 0 : index		// CHECK-DAG: %[[C0:.+]] = constant 0 : index
// CHECK-DAG: %[[C1:.+]] = constant 1 : index		// CHECK-DAG: %[[C1:.+]] = constant 1 : index
// CHECK-DAG: %[[C2:.+]] = constant 2 : index		// CHECK-DAG: %[[C2:.+]] = constant 2 : index
// CHECK-DAG: %[[C3:.+]] = constant 3 : index		// CHECK-DAG: %[[C3:.+]] = constant 3 : index

// CHECK-DAG: %[[ELEM_N:.+]] = tensor.dim %[[ELEM]], %[[C0]] : tensor<?x?x?x?xf32>		// CHECK-DAG: %[[ELEM_N:.+]] = tensor.dim %[[ELEM]], %[[C0]] : tensor<?x?x?x?xf32>
// CHECK-DAG: %[[ELEM_OH:.+]] = tensor.dim %[[ELEM]], %[[C1]] : tensor<?x?x?x?xf32>		// CHECK-DAG: %[[ELEM_OH:.+]] = tensor.dim %[[ELEM]], %[[C1]] : tensor<?x?x?x?xf32>
// CHECK-DAG: %[[ELEM_OW:.+]] = tensor.dim %[[ELEM]], %[[C2]] : tensor<?x?x?x?xf32>		// CHECK-DAG: %[[ELEM_OW:.+]] = tensor.dim %[[ELEM]], %[[C2]] : tensor<?x?x?x?xf32>
// CHECK-DAG: %[[ELEM_OC:.+]] = tensor.dim %[[ELEM]], %[[C3]] : tensor<?x?x?x?xf32>		// CHECK-DAG: %[[ELEM_OC:.+]] = tensor.dim %[[ELEM]], %[[C3]] : tensor<?x?x?x?xf32>

// CHECK: %[[INIT:.+]] = linalg.init_tensor [%[[ELEM_N]], %[[ELEM_OH]], %[[ELEM_OW]], %[[ELEM_OC]]] : tensor<?x?x?x?xf32>		// CHECK: %[[INIT:.+]] = linalg.init_tensor [%[[ELEM_N]], %[[ELEM_OH]], %[[ELEM_OW]], %[[ELEM_OC]]] : tensor<?x?x?x?xf32>
// CHECK: %[[FILL:.+]] = linalg.fill(%cst, %[[INIT]]) : f32, tensor<?x?x?x?xf32> -> tensor<?x?x?x?xf32>		// CHECK: %[[FILL:.+]] = linalg.fill(%cst, %[[INIT]]) : f32, tensor<?x?x?x?xf32> -> tensor<?x?x?x?xf32>

// CHECK-DAG: %[[FILTER_H:.+]] = tensor.dim %[[FILTER]], %[[C0]] : tensor<?x?x?x?xf32>		// CHECK-DAG: %[[FILTER_H:.+]] = tensor.dim %[[FILTER]], %[[C0]] : tensor<?x?x?x?xf32>
// CHECK-DAG: %[[FILTER_W:.+]] = tensor.dim %[[FILTER]], %[[C1]] : tensor<?x?x?x?xf32>		// CHECK-DAG: %[[FILTER_W:.+]] = tensor.dim %[[FILTER]], %[[C1]] : tensor<?x?x?x?xf32>
// CHECK-DAG: %[[INPUT_N:.+]] = tensor.dim %[[INPUT]], %[[C0]] : tensor<?x?x?x?xf32>
// CHECK-DAG: %[[INPUT_H:.+]] = tensor.dim %[[INPUT]], %[[C1]] : tensor<?x?x?x?xf32>
// CHECK-DAG: %[[INPUT_W:.+]] = tensor.dim %[[INPUT]], %[[C2]] : tensor<?x?x?x?xf32>
// CHECK-DAG: %[[INPUT_C:.+]] = tensor.dim %[[INPUT]], %[[C3]] : tensor<?x?x?x?xf32>
// CHECK-DAG: %[[FILTER_IC:.+]] = tensor.dim %[[FILTER]], %[[C2]] : tensor<?x?x?x?xf32>		// CHECK-DAG: %[[FILTER_IC:.+]] = tensor.dim %[[FILTER]], %[[C2]] : tensor<?x?x?x?xf32>
// CHECK-DAG: %[[FILTER_OC:.+]] = tensor.dim %[[FILTER]], %[[C3]] : tensor<?x?x?x?xf32>		// CHECK-DAG: %[[FILTER_OC:.+]] = tensor.dim %[[FILTER]], %[[C3]] : tensor<?x?x?x?xf32>
// CHECK-DAG: %[[FILL_N:.+]] = tensor.dim %[[FILL]], %[[C0]] : tensor<?x?x?x?xf32>		// CHECK-DAG: %[[INPUT_N:.+]] = tensor.dim %[[INPUT]], %[[C0]] : tensor<?x?x?x?xf32>
		// CHECK-DAG: %[[INPUT_C:.+]] = tensor.dim %[[INPUT]], %[[C3]] : tensor<?x?x?x?xf32>
// CHECK-DAG: %[[FILL_H:.+]] = tensor.dim %[[FILL]], %[[C1]] : tensor<?x?x?x?xf32>		// CHECK-DAG: %[[FILL_H:.+]] = tensor.dim %[[FILL]], %[[C1]] : tensor<?x?x?x?xf32>
// CHECK-DAG: %[[FILL_W:.+]] = tensor.dim %[[FILL]], %[[C2]] : tensor<?x?x?x?xf32>		// CHECK-DAG: %[[FILL_W:.+]] = tensor.dim %[[FILL]], %[[C2]] : tensor<?x?x?x?xf32>
// CHECK-DAG: %[[FILL_C:.+]] = tensor.dim %[[FILL]], %[[C3]] : tensor<?x?x?x?xf32>

// CHECK: scf.for %[[IV0:.+]] = %{{.+}} to %[[ELEM_N]] step %{{.+}} iter_args(%{{.+}} = %[[FILL]])		// CHECK: scf.for %[[IV0:.+]] = %{{.+}} to %[[ELEM_N]] step %{{.+}} iter_args(%{{.+}} = %[[FILL]])
// CHECK-NEXT: %[[SIZE_ELEM_N:.+]] = affine.min #[[BOUND8_MAP]](%[[IV0]])[%[[ELEM_N]]]		// CHECK-NEXT: %[[SIZE_ELEM_N:.+]] = affine.min #[[BOUND8_MAP]](%[[IV0]])[%[[ELEM_N]]]
// CHECK-NEXT: %[[SIZE_INPUT_N:.+]] = affine.min #[[BOUND8_MAP_2]](%[[IV0]])[%[[INPUT_N]], %[[ELEM_N]]]		// CHECK-NEXT: %[[SIZE_INPUT_N:.+]] = affine.min #[[BOUND8_MAP_2]](%[[IV0]])[%[[INPUT_N]], %[[ELEM_N]]]
// CHECK-NEXT: %[[SIZE_ELEM_N_2:.+]] = affine.min #[[BOUND8_MAP_2]](%[[IV0]])[%[[FILL_N]], %[[ELEM_N]]]
// CHECK-NEXT: scf.for %[[IV1:.+]] = %{{.+}} to %[[ELEM_OH]]		// CHECK-NEXT: scf.for %[[IV1:.+]] = %{{.+}} to %[[ELEM_OH]]
// CHECK-NEXT: %[[SIZE_ELEM_OH:.+]] = affine.min #[[BOUND16_MAP]](%[[IV1]])[%[[ELEM_OH]]]		// CHECK-NEXT: %[[SIZE_ELEM_OH:.+]] = affine.min #[[BOUND16_MAP]](%[[IV1]])[%[[ELEM_OH]]]
// CHECK-NEXT: %[[OFFSET_OH:.+]] = affine.apply #[[X2_MAP]](%[[IV1]])		// CHECK-NEXT: %[[OFFSET_OH:.+]] = affine.apply #[[X2_MAP]](%[[IV1]])
// CHECK-NEXT: %[[SIZE_INPUT_H:.+]] = affine.min #[[INPUT_BOUND]](%[[SIZE_ELEM_OH]], %[[IV1]])[%[[FILTER_H]], %[[INPUT_H]]]		// CHECK-NEXT: %[[SIZE_INPUT_H:.+]] = affine.min #[[INPUT_BOUND]](%[[SIZE_ELEM_OH]], %[[IV1]])[%[[FILTER_H]], %[[FILL_H]]]
// CHECK-NEXT: %[[SIZE_ELEM_OH_2:.+]] = affine.min #[[BOUND16_MAP_2]](%[[IV1]])[%[[FILL_H]], %[[ELEM_OH]]]		// CHECK-NEXT: %[[SIZE_ELEM_OH_2:.+]] = affine.min #[[BOUND16_MAP_2]](%[[IV1]])[%[[FILL_H]], %[[ELEM_OH]]]
// CHECK-NEXT: scf.for %[[IV2:.+]] = %{{.+}} to %[[ELEM_OW]]		// CHECK-NEXT: scf.for %[[IV2:.+]] = %{{.+}} to %[[ELEM_OW]]
// CHECK-NEXT: %[[SIZE_ELEM_OW:.+]] = affine.min #[[BOUND4_MAP]](%[[IV2]])[%[[ELEM_OW]]]		// CHECK-NEXT: %[[SIZE_ELEM_OW:.+]] = affine.min #[[BOUND4_MAP]](%[[IV2]])[%[[ELEM_OW]]]
// CHECK-NEXT: %[[SIZE_ELEM_OC:.+]] = affine.min #[[BOUND2_MAP]](%[[IV2]])[%[[ELEM_OC]]]		// CHECK-NEXT: %[[SIZE_ELEM_OC:.+]] = affine.min #[[BOUND2_MAP]](%[[IV2]])[%[[ELEM_OC]]]
// CHECK-NEXT: %[[OFFSET_OW:.+]] = affine.apply #[[X2_MAP]](%[[IV2]])		// CHECK-NEXT: %[[OFFSET_OW:.+]] = affine.apply #[[X2_MAP]](%[[IV2]])
// CHECK-NEXT: %[[SIZE_INPUT_W:.+]] = affine.min #[[INPUT_BOUND]](%[[SIZE_ELEM_OW]], %[[IV2]])[%[[FILTER_W]], %[[INPUT_W]]]		// CHECK-NEXT: %[[SIZE_INPUT_W:.+]] = affine.min #[[INPUT_BOUND]](%[[SIZE_ELEM_OW]], %[[IV2]])[%[[FILTER_W]], %[[FILL_W]]]
// CHECK-NEXT: %[[ST_INPUT:.+]] = tensor.extract_slice %[[INPUT]][%[[IV0]], %[[OFFSET_OH]], %[[OFFSET_OW]], 0]		// CHECK-NEXT: %[[ST_INPUT:.+]] = tensor.extract_slice %[[INPUT]][%[[IV0]], %[[OFFSET_OH]], %[[OFFSET_OW]], 0]
// CHECK-SAME: [%[[SIZE_INPUT_N]], %[[SIZE_INPUT_H]], %[[SIZE_INPUT_W]], %[[INPUT_C]]]		// CHECK-SAME: [%[[SIZE_INPUT_N]], %[[SIZE_INPUT_H]], %[[SIZE_INPUT_W]], %[[INPUT_C]]]
// CHECK-NEXT: %[[SIZE_ELEM_OW_2:.+]] = affine.min #[[BOUND4_MAP_2]](%[[IV2]])[%[[FILL_W]], %[[ELEM_OW]]]		// CHECK-NEXT: %[[SIZE_ELEM_OW_2:.+]] = affine.min #[[BOUND4_MAP_2]](%[[IV2]])[%[[FILL_W]], %[[ELEM_OW]]]
// CHECK-NEXT: scf.for %[[IV3:.+]] = %{{.+}} to %[[ELEM_OC]] step %{{.+}} iter_args(%[[ARG:[a-z0-9]+]]		// CHECK-NEXT: scf.for %[[IV3:.+]] = %{{.+}} to %[[ELEM_OC]] step %{{.+}} iter_args(%[[ARG:[a-z0-9]+]]
// CHECK-NEXT: %[[ST_ELEM:.+]] = tensor.extract_slice %[[ELEM]][%[[IV0]], %[[IV1]], %[[IV2]], %[[IV3]]]		// CHECK-NEXT: %[[ST_ELEM:.+]] = tensor.extract_slice %[[ELEM]][%[[IV0]], %[[IV1]], %[[IV2]], %[[IV3]]]
// CHECK-SAME: [%[[SIZE_ELEM_N]], %[[SIZE_ELEM_OH]], %[[SIZE_ELEM_OW]], %[[SIZE_ELEM_OC]]]		// CHECK-SAME: [%[[SIZE_ELEM_N]], %[[SIZE_ELEM_OH]], %[[SIZE_ELEM_OW]], %[[SIZE_ELEM_OC]]]
// CHECK-NEXT: %[[ST_ARG:.+]] = tensor.extract_slice %[[ARG]][%[[IV0]], %[[IV1]], %[[IV2]], %[[IV3]]]		// CHECK-NEXT: %[[ST_ARG:.+]] = tensor.extract_slice %[[ARG]][%[[IV0]], %[[IV1]], %[[IV2]], %[[IV3]]]
// CHECK-SAME: [%[[SIZE_ELEM_N]], %[[SIZE_ELEM_OH]], %[[SIZE_ELEM_OW]], %[[SIZE_ELEM_OC]]]		// CHECK-SAME: [%[[SIZE_ELEM_N]], %[[SIZE_ELEM_OH]], %[[SIZE_ELEM_OW]], %[[SIZE_ELEM_OC]]]
// CHECK-NEXT: %[[SIZE_ELEM_OC_2:.+]] = affine.min #[[BOUND2_MAP_2]](%[[IV3]], %[[IV2]])[%[[FILTER_OC]], %[[ELEM_OC]]]		// CHECK-NEXT: %[[SIZE_ELEM_OC_2:.+]] = affine.min #[[BOUND2_MAP_2]](%[[IV3]], %[[IV2]])[%[[FILTER_OC]], %[[ELEM_OC]]]
// CHECK-NEXT: %[[ST_FILTER:.+]] = tensor.extract_slice %[[FILTER]][0, 0, 0, %[[IV3]]]		// CHECK-NEXT: %[[ST_FILTER:.+]] = tensor.extract_slice %[[FILTER]][0, 0, 0, %[[IV3]]]
// CHECK-SAME: [%[[FILTER_H]], %[[FILTER_W]], %[[FILTER_IC]], %[[SIZE_ELEM_OC_2]]]		// CHECK-SAME: [%[[FILTER_H]], %[[FILTER_W]], %[[FILTER_IC]], %[[SIZE_ELEM_OC_2]]]
// CHECK-NEXT: %[[SIZE_ELEM_OC_3:.+]] = affine.min #[[BOUND2_MAP_2]](%[[IV3]], %[[IV2]])[%[[FILL_C]], %[[ELEM_OC]]]
// CHECK-NEXT: %[[ST_FILL:.+]] = tensor.extract_slice %[[FILL]][%[[IV0]], %[[IV1]], %[[IV2]], %[[IV3]]]		// CHECK-NEXT: %[[ST_FILL:.+]] = tensor.extract_slice %[[FILL]][%[[IV0]], %[[IV1]], %[[IV2]], %[[IV3]]]
// CHECK-SAME: [%[[SIZE_ELEM_N_2]], %[[SIZE_ELEM_OH_2]], %[[SIZE_ELEM_OW_2]], %[[SIZE_ELEM_OC_3]]]		// CHECK-SAME: [%[[SIZE_INPUT_N]], %[[SIZE_ELEM_OH_2]], %[[SIZE_ELEM_OW_2]], %[[SIZE_ELEM_OC_2]]]
// CHECK-NEXT: %[[ST_CONV:.+]] = linalg.conv_2d_nhwc_hwcf		// CHECK-NEXT: %[[ST_CONV:.+]] = linalg.conv_2d_nhwc_hwcf
// CHECK-SAME: ins(%[[ST_INPUT]], %[[ST_FILTER]] : tensor<?x?x?x?xf32>, tensor<?x?x?x?xf32>)		// CHECK-SAME: ins(%[[ST_INPUT]], %[[ST_FILTER]] : tensor<?x?x?x?xf32>, tensor<?x?x?x?xf32>)
// CHECK-SAME: outs(%[[ST_FILL]] : tensor<?x?x?x?xf32>) -> tensor<?x?x?x?xf32>		// CHECK-SAME: outs(%[[ST_FILL]] : tensor<?x?x?x?xf32>) -> tensor<?x?x?x?xf32>
// CHECK-NEXT: %[[ST_ADD:.+]] = linalg.generic		// CHECK-NEXT: %[[ST_ADD:.+]] = linalg.generic
// CHECK-SAME: ins(%[[ST_CONV]], %[[ST_ELEM]] : tensor<?x?x?x?xf32>, tensor<?x?x?x?xf32>)		// CHECK-SAME: ins(%[[ST_CONV]], %[[ST_ELEM]] : tensor<?x?x?x?xf32>, tensor<?x?x?x?xf32>)
// CHECK-SAME: outs(%[[ST_ARG]] : tensor<?x?x?x?xf32>)		// CHECK-SAME: outs(%[[ST_ARG]] : tensor<?x?x?x?xf32>)
// CHECK: tensor.insert_slice %[[ST_ADD]] into %[[ARG]][%[[IV0]], %[[IV1]], %[[IV2]], %[[IV3]]]		// CHECK: tensor.insert_slice %[[ST_ADD]] into %[[ARG]][%[[IV0]], %[[IV1]], %[[IV2]], %[[IV3]]]
// CHECK-SAME: [%[[SIZE_ELEM_N]], %[[SIZE_ELEM_OH]], %[[SIZE_ELEM_OW]], %[[SIZE_ELEM_OC]]]		// CHECK-SAME: [%[[SIZE_ELEM_N]], %[[SIZE_ELEM_OH]], %[[SIZE_ELEM_OW]], %[[SIZE_ELEM_OC]]]
▲ Show 20 Lines • Show All 63 Lines • Show Last 20 Lines

mlir/test/Dialect/Linalg/tile-conv-padding.mlir

	Show All 17 Lines
	// TILE-20000-LABEL: func @conv_padding(			// TILE-20000-LABEL: func @conv_padding(
	// TILE-20000-SAME: %[[ARG0:[a-zA-Z0-9_]*]]: memref<?x?x?x?xf32, #[[$strided4D]]>			// TILE-20000-SAME: %[[ARG0:[a-zA-Z0-9_]*]]: memref<?x?x?x?xf32, #[[$strided4D]]>
	// TILE-20000-SAME: %[[ARG1:[a-zA-Z0-9_]*]]: memref<?x?x?x?xf32, #[[$strided4D]]>			// TILE-20000-SAME: %[[ARG1:[a-zA-Z0-9_]*]]: memref<?x?x?x?xf32, #[[$strided4D]]>
	// TILE-20000-SAME: %[[ARG2:[a-zA-Z0-9_]*]]: memref<?x?x?x?xf32, #[[$strided4D]]>)			// TILE-20000-SAME: %[[ARG2:[a-zA-Z0-9_]*]]: memref<?x?x?x?xf32, #[[$strided4D]]>)
	// TILE-20000-DAG: %[[C0:.*]] = constant 0 : index			// TILE-20000-DAG: %[[C0:.*]] = constant 0 : index
	// TILE-20000-DAG: %[[C2:.*]] = constant 2 : index			// TILE-20000-DAG: %[[C2:.*]] = constant 2 : index
	// TILE-20000: %[[B:.*]] = memref.dim %[[ARG1]], %c0			// TILE-20000: %[[B:.*]] = memref.dim %[[ARG1]], %c0
	// TILE-20000: scf.for %[[ivI:.*]] = %[[C0]] to %[[B]] step %[[C2]] {			// TILE-20000: scf.for %[[ivI:.*]] = %[[C0]] to %[[B]] step %[[C2]] {
	// TILE-20000: %[[DIM10:.*]] = memref.dim %[[ARG1]], %c0			// TILE-20000: %[[EXTENT:.*]] = affine.min #[[$minmap]](%[[ivI]])[%[[B]]]
	// TILE-20000: %[[EXTENT:.*]] = affine.min #[[$minmap]](%[[ivI]])[%[[DIM10]]]
	// TILE-20000: %[[DIM11:.*]] = memref.dim %[[ARG1]], %c1			// TILE-20000: %[[DIM11:.*]] = memref.dim %[[ARG1]], %c1
	// TILE-20000: %[[DIM12:.*]] = memref.dim %[[ARG1]], %c2			// TILE-20000: %[[DIM12:.*]] = memref.dim %[[ARG1]], %c2
	// TILE-20000: %[[DIM13:.*]] = memref.dim %[[ARG1]], %c3			// TILE-20000: %[[DIM13:.*]] = memref.dim %[[ARG1]], %c3
	// TILE-20000: %[[SUBVIEW1:.*]] = memref.subview %[[ARG1]][%[[ivI]], 0, 0, 0] [%[[EXTENT]], %[[DIM11]], %[[DIM12]], %[[DIM13]]]			// TILE-20000: %[[SUBVIEW1:.*]] = memref.subview %[[ARG1]][%[[ivI]], 0, 0, 0] [%[[EXTENT]], %[[DIM11]], %[[DIM12]], %[[DIM13]]]
	// TILE-20000: %[[DIM20:.*]] = memref.dim %[[ARG2]], %c0			// TILE-20000: %[[EXTENT:.*]] = affine.min #[[$minmap]](%[[ivI]])[%[[B]]]
	// TILE-20000: %[[EXTENT:.*]] = affine.min #[[$minmap]](%[[ivI]])[%[[DIM20]]]
	// TILE-20000: %[[DIM21:.*]] = memref.dim %[[ARG2]], %c1			// TILE-20000: %[[DIM21:.*]] = memref.dim %[[ARG2]], %c1
	// TILE-20000: %[[DIM22:.*]] = memref.dim %[[ARG2]], %c2			// TILE-20000: %[[DIM22:.*]] = memref.dim %[[ARG2]], %c2
	// TILE-20000: %[[DIM23:.*]] = memref.dim %[[ARG2]], %c3			// TILE-20000: %[[DIM23:.*]] = memref.dim %[[ARG2]], %c3
	// TILE-20000: %[[SUBVIEW2:.*]] = memref.subview %[[ARG2]][%[[ivI]], 0, 0, 0] [%[[EXTENT]], %[[DIM21]], %[[DIM22]], %[[DIM23]]]			// TILE-20000: %[[SUBVIEW2:.*]] = memref.subview %[[ARG2]][%[[ivI]], 0, 0, 0] [%[[EXTENT]], %[[DIM21]], %[[DIM22]], %[[DIM23]]]
	// TILE-20000: linalg.conv(%[[ARG0]], %[[SUBVIEW1]], %[[SUBVIEW2]])			// TILE-20000: linalg.conv(%[[ARG0]], %[[SUBVIEW1]], %[[SUBVIEW2]])

mlir/test/Dialect/Linalg/tile-conv.mlir

	// RUN: mlir-opt %s -linalg-tile="linalg-tile-sizes=2,3,0,0,4" \| FileCheck %s -check-prefix=TILE-23004			// RUN: mlir-opt %s -linalg-tile="linalg-tile-sizes=2,3,0,0,4" \| FileCheck %s -check-prefix=TILE-23004

	// TILE-23004-DAG: #[[$D0x30pS0x10:.]] = affine_map<(d0) -> (d0 30)>			// TILE-23004-DAG: #[[$D0x30pS0x10:.]] = affine_map<(d0) -> (d0 30)>
	// TILE-23004-DAG: #[[$S0x10p90D0x30pS1:.]] = affine_map<(d0)[s0, s1] -> (s0 10 + 51, d0 * -30 + s1)>			// TILE-23004-DAG: #[[$S0x10p90D0x30pS1:.]] = affine_map<(d0)[s0, s1] -> (s0 10 + 51, d0 * -30 + s0 * 10 + s1 * 30)>
	// TILE-23004-DAG: #[[$strided4D:.]] = affine_map<(d0, d1, d2, d3)[s0, s1, s2, s3] -> (d0 s1 + s0 + d1 * s2 + d2 * s3 + d3)>			// TILE-23004-DAG: #[[$strided4D:.]] = affine_map<(d0, d1, d2, d3)[s0, s1, s2, s3] -> (d0 s1 + s0 + d1 * s2 + d2 * s3 + d3)>
				// TILE-23004-DAG: #[[$bound_map_2:.*]] = affine_map<(d0)[s0] -> (2, -d0 + s0)>
				// TILE-23004-DAG: #[[$bound_map_3:.*]] = affine_map<(d0)[s0] -> (3, -d0 + s0)>
	// TILE-23004-DAG: #[[$bound_map_4:.*]] = affine_map<(d0)[s0] -> (4, -d0 + s0)>			// TILE-23004-DAG: #[[$bound_map_4:.*]] = affine_map<(d0)[s0] -> (4, -d0 + s0)>

	func @conv(%arg0: memref<?x?x?x?xf32, offset: ?, strides: [?, ?, ?, 1]>, %arg1: memref<?x?x?x?xf32, offset: ?, strides: [?, ?, ?, 1]>, %arg2: memref<?x?x?x?xf32, offset: ?, strides: [?, ?, ?, 1]>) {			func @conv(%arg0: memref<?x?x?x?xf32, offset: ?, strides: [?, ?, ?, 1]>, %arg1: memref<?x?x?x?xf32, offset: ?, strides: [?, ?, ?, 1]>, %arg2: memref<?x?x?x?xf32, offset: ?, strides: [?, ?, ?, 1]>) {
	linalg.conv(%arg0, %arg1, %arg2) {dilations = [10, 20], strides = [30, 40]} : memref<?x?x?x?xf32, offset: ?, strides: [?, ?, ?, 1]>, memref<?x?x?x?xf32, offset: ?, strides: [?, ?, ?, 1]>, memref<?x?x?x?xf32, offset: ?, strides: [?, ?, ?, 1]>			linalg.conv(%arg0, %arg1, %arg2) {dilations = [10, 20], strides = [30, 40]} : memref<?x?x?x?xf32, offset: ?, strides: [?, ?, ?, 1]>, memref<?x?x?x?xf32, offset: ?, strides: [?, ?, ?, 1]>, memref<?x?x?x?xf32, offset: ?, strides: [?, ?, ?, 1]>
	return			return
	}			}
	// TILE-23004: func @conv(			// TILE-23004: func @conv(
	// TILE-23004-SAME: %[[ARG0:[a-zA-Z0-9_]*]]: memref<?x?x?x?xf32, #[[$strided4D]]>			// TILE-23004-SAME: %[[ARG0:[a-zA-Z0-9_]*]]: memref<?x?x?x?xf32, #[[$strided4D]]>
	// TILE-23004-SAME: %[[ARG1:[a-zA-Z0-9_]*]]: memref<?x?x?x?xf32, #[[$strided4D]]>			// TILE-23004-SAME: %[[ARG1:[a-zA-Z0-9_]*]]: memref<?x?x?x?xf32, #[[$strided4D]]>
	// TILE-23004-SAME: %[[ARG2:[a-zA-Z0-9_]*]]: memref<?x?x?x?xf32, #[[$strided4D]]>)			// TILE-23004-SAME: %[[ARG2:[a-zA-Z0-9_]*]]: memref<?x?x?x?xf32, #[[$strided4D]]>)
	// TILE-23004-DAG: %[[C0:.*]] = constant 0 : index			// TILE-23004-DAG: %[[C0:.*]] = constant 0 : index
	// TILE-23004-DAG: %[[C2:.*]] = constant 2 : index			// TILE-23004-DAG: %[[C2:.*]] = constant 2 : index
	// TILE-23004-DAG: %[[C3:.*]] = constant 3 : index			// TILE-23004-DAG: %[[C3:.*]] = constant 3 : index
	// TILE-23004-DAG: %[[C4:.*]] = constant 4 : index			// TILE-23004-DAG: %[[C4:.*]] = constant 4 : index
	// TILE-23004: %[[Z0:.*]] = memref.dim %[[ARG0]], %c0 : memref<?x?x?x?xf32, #[[$strided4D]]>			// TILE-23004: %[[Z0:.*]] = memref.dim %[[ARG0]], %c0 : memref<?x?x?x?xf32, #[[$strided4D]]>
	// TILE-23004: %[[Q:.*]] = memref.dim %[[ARG0]], %c2 : memref<?x?x?x?xf32, #[[$strided4D]]>			// TILE-23004: %[[Q:.*]] = memref.dim %[[ARG0]], %c2 : memref<?x?x?x?xf32, #[[$strided4D]]>
	// TILE-23004: %[[B:.*]] = memref.dim %[[ARG1]], %c0 : memref<?x?x?x?xf32, #[[$strided4D]]>			// TILE-23004: %[[B:.*]] = memref.dim %[[ARG1]], %c0 : memref<?x?x?x?xf32, #[[$strided4D]]>
	// TILE-23004: %[[X0:.*]] = memref.dim %[[ARG2]], %c1 : memref<?x?x?x?xf32, #[[$strided4D]]>			// TILE-23004: %[[X0:.*]] = memref.dim %[[ARG2]], %c1 : memref<?x?x?x?xf32, #[[$strided4D]]>
	// TILE-23004: scf.for %[[ivI:.]] = %{{.}} to %[[B]] step %{{.*}} {			// TILE-23004: scf.for %[[ivI:.]] = %{{.}} to %[[B]] step %{{.*}} {
	// TILE-23004: scf.for %[[ivJ:.]] = %{{.}} to %[[X0]] step %{{.*}} {			// TILE-23004: scf.for %[[ivJ:.]] = %{{.}} to %[[X0]] step %{{.*}} {
	// TILE-23004: scf.for %[[ivK:.]] = %{{.}} to %[[Q]] step %{{.*}} {			// TILE-23004: scf.for %[[ivK:.]] = %{{.}} to %[[Q]] step %{{.*}} {
	// TILE-23004: %[[Z0_1:.*]] = memref.dim %[[ARG0]], %c0 : memref<?x?x?x?xf32, #[[$strided4D]]>			// TILE-23004: %[[Z0_1:.*]] = memref.dim %[[ARG0]], %c0 : memref<?x?x?x?xf32, #[[$strided4D]]>
	// TILE-23004: %[[Z1:.*]] = memref.dim %[[ARG0]], %c1 : memref<?x?x?x?xf32, #[[$strided4D]]>			// TILE-23004: %[[Z1:.*]] = memref.dim %[[ARG0]], %c1 : memref<?x?x?x?xf32, #[[$strided4D]]>
	// TILE-23004: %[[Z2:.*]] = memref.dim %[[ARG0]], %c2 : memref<?x?x?x?xf32, #[[$strided4D]]>			// TILE-23004: %[[szK:.*]] = affine.min #[[$bound_map_4]](%[[ivK]])[%[[Q]]]
	// TILE-23004: %[[szK:.*]] = affine.min #[[$bound_map_4]](%[[ivK]])[%[[Z2]]]
	// TILE-23004: %[[K:.*]] = memref.dim %[[ARG0]], %c3 : memref<?x?x?x?xf32, #[[$strided4D]]>			// TILE-23004: %[[K:.*]] = memref.dim %[[ARG0]], %c3 : memref<?x?x?x?xf32, #[[$strided4D]]>
	// TILE-23004: %[[FilterView:.]] = memref.subview %{{.}}[0, 0, %[[ivK]], 0] [%[[Z0_1]], %[[Z1]], %[[szK]], %[[K]]] [1, 1, 1, 1] : memref<?x?x?x?xf32, #[[$strided4D]]> to memref<?x?x?x?xf32, #[[$strided4D]]>			// TILE-23004: %[[FilterView:.]] = memref.subview %{{.}}[0, 0, %[[ivK]], 0] [%[[Z0_1]], %[[Z1]], %[[szK]], %[[K]]] [1, 1, 1, 1] : memref<?x?x?x?xf32, #[[$strided4D]]> to memref<?x?x?x?xf32, #[[$strided4D]]>
	//			//
	// TILE-23004: %[[J1:.*]] = affine.apply #[[$D0x30pS0x10]](%[[ivJ]])			// TILE-23004: %[[J1:.*]] = affine.apply #[[$D0x30pS0x10]](%[[ivJ]])
	// TILE-23004: %[[PaddedInput0b:.*]] = memref.dim %[[ARG1]], %c1 : memref<?x?x?x?xf32, #[[$strided4D]]>			// TILE-23004: %[[I1pStep:.*]] = affine.min #[[$S0x10p90D0x30pS1]](%[[ivJ]])[%[[Z0]], %[[X0]]]
	// TILE-23004: %[[I1pStep:.*]] = affine.min #[[$S0x10p90D0x30pS1]](%[[ivJ]])[%[[Z0]], %[[PaddedInput0b]]]
	// TILE-23004: %[[SZ2:.*]] = memref.dim %[[ARG1]], %c2 : memref<?x?x?x?xf32, #[[$strided4D]]>			// TILE-23004: %[[SZ2:.*]] = memref.dim %[[ARG1]], %c2 : memref<?x?x?x?xf32, #[[$strided4D]]>
	// TILE-23004: %[[dim3:.*]] = memref.dim %[[ARG1]], %c3			// TILE-23004: %[[sz3:.*]] = affine.min #[[$bound_map_4]](%[[ivK]])[%[[Q]]]
	// TILE-23004: %[[sz3:.*]] = affine.min #[[$bound_map_4]](%[[ivK]])[%[[dim3]]]
	// TILE-23004: %[[InputView:.]] = memref.subview %{{.}}[%[[ivI]], %[[J1]], 0, %[[ivK]]] [%{{.}}, %{{.}}, %[[SZ2]], %[[sz3]]] [1, 1, 1, 1] : memref<?x?x?x?xf32, #[[$strided4D]]> to memref<?x?x?x?xf32, #[[$strided4D]]>			// TILE-23004: %[[InputView:.]] = memref.subview %{{.}}[%[[ivI]], %[[J1]], 0, %[[ivK]]] [%{{.}}, %{{.}}, %[[SZ2]], %[[sz3]]] [1, 1, 1, 1] : memref<?x?x?x?xf32, #[[$strided4D]]> to memref<?x?x?x?xf32, #[[$strided4D]]>
	//			//
	// TILE-23004: %[[X0:.*]] = memref.dim %[[ARG2]], %c2 : memref<?x?x?x?xf32, #[[$strided4D]]>			// TILE-23004: %[[X0:.*]] = memref.dim %[[ARG2]], %c2 : memref<?x?x?x?xf32, #[[$strided4D]]>
	// TILE-23004: %[[X1:.*]] = memref.dim %[[ARG2]], %c3 : memref<?x?x?x?xf32, #[[$strided4D]]>			// TILE-23004: %[[X1:.*]] = memref.dim %[[ARG2]], %c3 : memref<?x?x?x?xf32, #[[$strided4D]]>
	// TILE-23004: %[[OutputView:.]] = memref.subview %{{.}}[%[[ivI]], %[[ivJ]], 0, 0] [%{{.}}, %{{.}}, %[[X0]], %[[X1]]] [1, 1, 1, 1] : memref<?x?x?x?xf32, #[[$strided4D]]> to memref<?x?x?x?xf32, #[[$strided4D]]>			// TILE-23004: %[[OutputView:.]] = memref.subview %{{.}}[%[[ivI]], %[[ivJ]], 0, 0] [%{{.}}, %{{.}}, %[[X0]], %[[X1]]] [1, 1, 1, 1] : memref<?x?x?x?xf32, #[[$strided4D]]> to memref<?x?x?x?xf32, #[[$strided4D]]>
	//			//
	// TILE-23004: linalg.conv(%[[FilterView]], %[[InputView]], %[[OutputView]]) {dilations = [10, 20], strides = [30, 40]} : memref<?x?x?x?xf32, #[[$strided4D]]>, memref<?x?x?x?xf32, #[[$strided4D]]>, memref<?x?x?x?xf32, #[[$strided4D]]>			// TILE-23004: linalg.conv(%[[FilterView]], %[[InputView]], %[[OutputView]]) {dilations = [10, 20], strides = [30, 40]} : memref<?x?x?x?xf32, #[[$strided4D]]>, memref<?x?x?x?xf32, #[[$strided4D]]>, memref<?x?x?x?xf32, #[[$strided4D]]>

mlir/test/Dialect/Linalg/tile-simple-conv.mlir

	// RUN: mlir-opt %s -linalg-tile="linalg-tile-sizes=2,3,4" \| FileCheck %s			// RUN: mlir-opt %s -linalg-tile="linalg-tile-sizes=2,3,4" \| FileCheck %s

	// CHECK-DAG: #[[MAP0:.*]] = affine_map<(d0)[s0] -> (2, -d0 + s0)>			// CHECK-DAG: #[[MAP0:.*]] = affine_map<(d0)[s0] -> (2, -d0 + s0)>
	// CHECK-DAG: #[[MAP1:.*]] = affine_map<(d0)[s0, s1] -> (s0 + 2, -d0 + s1)>			// CHECK-DAG: #[[MAP1:.*]] = affine_map<(d0)[s0, s1] -> (s0 + 2, -d0 + s0 + s1)>
	// CHECK-DAG: #[[MAP2:.*]] = affine_map<(d0)[s0, s1] -> (s0 + 3, -d0 + s1)>			// CHECK-DAG: #[[MAP2:.*]] = affine_map<(d0)[s0, s1] -> (s0 + 3, -d0 + s0 + s1)>
	// CHECK-DAG: #[[MAP4:.*]] = affine_map<(d0)[s0] -> (3, -d0 + s0)>			// CHECK-DAG: #[[MAP4:.*]] = affine_map<(d0)[s0] -> (3, -d0 + s0)>
	// CHECK-DAG: #[[MAP5:.*]] = affine_map<(d0)[s0] -> (4, -d0 + s0)>			// CHECK-DAG: #[[MAP5:.*]] = affine_map<(d0)[s0] -> (4, -d0 + s0)>

	func @conv(%arg0 : memref<?x?x?x?xf32>, %arg1 : memref<?x?x?x?xf32>, %arg2 : memref<?x?x?x?xf32>) {			func @conv(%arg0 : memref<?x?x?x?xf32>, %arg1 : memref<?x?x?x?xf32>, %arg2 : memref<?x?x?x?xf32>) {
	linalg.conv(%arg0, %arg1, %arg2) : memref<?x?x?x?xf32>, memref<?x?x?x?xf32>, memref<?x?x?x?xf32>			linalg.conv(%arg0, %arg1, %arg2) : memref<?x?x?x?xf32>, memref<?x?x?x?xf32>, memref<?x?x?x?xf32>
	return			return
	}			}

	Show All 9 Lines
	// CHECK: %[[T0:.*]] = memref.dim %[[ARG0]], %[[C0]]			// CHECK: %[[T0:.*]] = memref.dim %[[ARG0]], %[[C0]]
	// CHECK: %[[T1:.*]] = memref.dim %[[ARG0]], %[[C1]]			// CHECK: %[[T1:.*]] = memref.dim %[[ARG0]], %[[C1]]
	// CHECK: %[[T2:.*]] = memref.dim %[[ARG1]], %[[C0]]			// CHECK: %[[T2:.*]] = memref.dim %[[ARG1]], %[[C0]]
	// CHECK: %[[T3:.*]] = memref.dim %[[ARG2]], %[[C1]]			// CHECK: %[[T3:.*]] = memref.dim %[[ARG2]], %[[C1]]
	// CHECK: %[[T4:.*]] = memref.dim %[[ARG2]], %[[C2]]			// CHECK: %[[T4:.*]] = memref.dim %[[ARG2]], %[[C2]]
	// CHECK: scf.for %[[ARG3:.*]] = %[[C0]] to %[[T2]] step %[[C2]]			// CHECK: scf.for %[[ARG3:.*]] = %[[C0]] to %[[T2]] step %[[C2]]
	// CHECK: scf.for %[[ARG4:.*]] = %[[C0]] to %[[T3]] step %[[C3]]			// CHECK: scf.for %[[ARG4:.*]] = %[[C0]] to %[[T3]] step %[[C3]]
	// CHECK: scf.for %[[ARG5:.*]] = %[[C0]] to %[[T4]] step %[[C4]]			// CHECK: scf.for %[[ARG5:.*]] = %[[C0]] to %[[T4]] step %[[C4]]
	// CHECK: %[[T5:.*]] = memref.dim %[[ARG1]], %[[C0]]			// CHECK: %[[T6:.*]] = affine.min #[[MAP0]](%[[ARG3]])[%[[T2]]]
	// CHECK: %[[T6:.*]] = affine.min #[[MAP0]](%[[ARG3]])[%[[T5]]]			// CHECK: %[[T8:.*]] = affine.min #[[MAP1]](%[[ARG4]])[%[[T0]], %[[T3]]]
	// CHECK: %[[T7:.*]] = memref.dim %[[ARG1]], %[[C1]]			// CHECK: %[[T10:.*]] = affine.min #[[MAP2]](%[[ARG5]])[%[[T1]], %[[T4]]]
	// CHECK: %[[T8:.*]] = affine.min #[[MAP1]](%[[ARG4]])[%[[T0]], %[[T7]]]
	// CHECK: %[[T9:.*]] = memref.dim %[[ARG1]], %[[C2]]
	// CHECK: %[[T10:.*]] = affine.min #[[MAP2]](%[[ARG5]])[%[[T1]], %[[T9]]]
	// CHECK: %[[T11:.*]] = memref.dim %[[ARG1]], %[[C3]]			// CHECK: %[[T11:.*]] = memref.dim %[[ARG1]], %[[C3]]
	// CHECK: %[[SV1:.*]] = memref.subview %[[ARG1]][%[[ARG3]], %[[ARG4]], %[[ARG5]], 0]			// CHECK: %[[SV1:.*]] = memref.subview %[[ARG1]][%[[ARG3]], %[[ARG4]], %[[ARG5]], 0]
	// CHECK-SAME: [%[[T6]], %[[T8]], %[[T10]], %[[T11]]]			// CHECK-SAME: [%[[T6]], %[[T8]], %[[T10]], %[[T11]]]
	// CHECK: %[[T13:.*]] = memref.dim %[[ARG2]], %[[C0]]			// CHECK: %[[T14:.*]] = affine.min #[[MAP0]](%[[ARG3]])[%[[T2]]
	// CHECK: %[[T14:.*]] = affine.min #[[MAP0]](%[[ARG3]])[%[[T13]]]			// CHECK: %[[T16:.*]] = affine.min #[[MAP4]](%[[ARG4]])[%[[T3]]]
	// CHECK: %[[T15:.*]] = memref.dim %[[ARG2]], %[[C1]]			// CHECK: %[[T18:.*]] = affine.min #[[MAP5]](%[[ARG5]])[%[[T4]]
	// CHECK: %[[T16:.*]] = affine.min #[[MAP4]](%[[ARG4]])[%[[T15]]]
	// CHECK: %[[T17:.*]] = memref.dim %[[ARG2]], %[[C2]]
	// CHECK: %[[T18:.*]] = affine.min #[[MAP5]](%[[ARG5]])[%[[T17]]]
	// CHECK: %[[T19:.*]] = memref.dim %[[ARG2]], %[[C3]]			// CHECK: %[[T19:.*]] = memref.dim %[[ARG2]], %[[C3]]
	// CHECK: %[[SV2:.*]] = memref.subview %[[ARG2]][%[[ARG3]], %[[ARG4]], %[[ARG5]], 0]			// CHECK: %[[SV2:.*]] = memref.subview %[[ARG2]][%[[ARG3]], %[[ARG4]], %[[ARG5]], 0]
	// CHECK-SAME: [%[[T14]], %[[T16]], %[[T18]], %[[T19]]]			// CHECK-SAME: [%[[T14]], %[[T16]], %[[T18]], %[[T19]]]
	// CHECK: linalg.conv(%[[ARG0]], %[[SV1]], %[[SV2]])			// CHECK: linalg.conv(%[[ARG0]], %[[SV1]], %[[SV2]])

mlir/test/Dialect/Linalg/tile.mlir

Show All 32 Lines	func @matmul(%arg0: memref<?x?xf32, offset: ?, strides: [?, 1]>,
outs(%arg2: memref<?x?xf32, offset: ?, strides: [?, 1]>)		outs(%arg2: memref<?x?xf32, offset: ?, strides: [?, 1]>)
return		return
}		}
// TILE-2-LABEL: func @matmul(		// TILE-2-LABEL: func @matmul(
// TILE-2-DAG: %[[C0:.*]] = constant 0 : index		// TILE-2-DAG: %[[C0:.*]] = constant 0 : index
// TILE-2-DAG: %[[C2:.*]] = constant 2 : index		// TILE-2-DAG: %[[C2:.*]] = constant 2 : index
// TILE-2: %[[M:.]] = memref.dim %{{.}}, %c0 : memref<?x?xf32, #[[$strided2D]]>		// TILE-2: %[[M:.]] = memref.dim %{{.}}, %c0 : memref<?x?xf32, #[[$strided2D]]>
// TILE-2: scf.for %[[I:.]] = %{{.}}{{.}} to %[[M]] step %{{.}} {		// TILE-2: scf.for %[[I:.]] = %{{.}}{{.}} to %[[M]] step %{{.}} {
// TILE-2: %[[localM:.]] = memref.dim %{{.}}, %c0		// TILE-2: %[[szM:.*]] = affine.min #[[$bound_map]](%[[I]])[%[[M]]]
// TILE-2: %[[szM:.*]] = affine.min #[[$bound_map]](%[[I]])[%[[localM]]]
// TILE-2: %[[K:.]] = memref.dim %{{.}}, %c1 : memref<?x?xf32, #[[$strided2D]]>		// TILE-2: %[[K:.]] = memref.dim %{{.}}, %c1 : memref<?x?xf32, #[[$strided2D]]>
// TILE-2: %[[sAi:.]] = memref.subview %{{.}}[%[[I]], 0] [%[[szM]], %[[K]]] [1, 1] : memref<?x?xf32, #[[$strided2D]]> to memref<?x?xf32, #[[$strided2D]]>		// TILE-2: %[[sAi:.]] = memref.subview %{{.}}[%[[I]], 0] [%[[szM]], %[[K]]] [1, 1] : memref<?x?xf32, #[[$strided2D]]> to memref<?x?xf32, #[[$strided2D]]>
// TILE-2: %[[localK:.]] = memref.dim %{{.}}, %c0		// TILE-2: %[[szK:.*]] = affine.min #[[$bound_map]](%[[I]])[%[[M]]]
// TILE-2: %[[szK:.*]] = affine.min #[[$bound_map]](%[[I]])[%[[localK]]]
// TILE-2: %[[N:.]] = memref.dim %{{.}}, %c1 : memref<?x?xf32, #[[$strided2D]]>		// TILE-2: %[[N:.]] = memref.dim %{{.}}, %c1 : memref<?x?xf32, #[[$strided2D]]>
// TILE-2: %[[sCi:.]] = memref.subview %{{.}}[%[[I]], 0] [%[[szK]], %[[N]]] [1, 1] : memref<?x?xf32, #[[$strided2D]]> to memref<?x?xf32, #[[$strided2D]]>		// TILE-2: %[[sCi:.]] = memref.subview %{{.}}[%[[I]], 0] [%[[szK]], %[[N]]] [1, 1] : memref<?x?xf32, #[[$strided2D]]> to memref<?x?xf32, #[[$strided2D]]>
// TILE-2: linalg.matmul ins(%[[sAi]]{{.*}} outs(%[[sCi]]		// TILE-2: linalg.matmul ins(%[[sAi]]{{.*}} outs(%[[sCi]]

// TILE-02-LABEL: func @matmul(		// TILE-02-LABEL: func @matmul(
// TILE-02-DAG: %[[C0:.*]] = constant 0 : index		// TILE-02-DAG: %[[C0:.*]] = constant 0 : index
// TILE-02-DAG: %[[C2:.*]] = constant 2 : index		// TILE-02-DAG: %[[C2:.*]] = constant 2 : index
// TILE-02: %[[N:.*]] = memref.dim %arg1, %c1 : memref<?x?xf32, #[[$strided2D]]>		// TILE-02: %[[N:.*]] = memref.dim %arg1, %c1 : memref<?x?xf32, #[[$strided2D]]>
// TILE-02: scf.for %[[J:.]] = %{{.}} to %[[N]] step %{{.*}} {		// TILE-02: scf.for %[[J:.]] = %{{.}} to %[[N]] step %{{.*}} {
// TILE-02: %[[K:.]] = memref.dim %{{.}}, %c0 : memref<?x?xf32, #[[$strided2D]]>		// TILE-02: %[[K:.]] = memref.dim %{{.}}, %c0 : memref<?x?xf32, #[[$strided2D]]>
// TILE-02: %[[localN:.]] = memref.dim %{{.}}, %c1		// TILE-02: %[[szN:.*]] = affine.min #[[$bound_map]](%[[J]])[%[[N]]]
// TILE-02: %[[szN:.*]] = affine.min #[[$bound_map]](%[[J]])[%[[localN]]]
// TILE-02: %[[sBj:.]] = memref.subview %{{.}}[0, %[[J]]] [%[[K]], %[[szN]]] [1, 1] : memref<?x?xf32, #[[$strided2D]]> to memref<?x?xf32, #[[$strided2D]]>		// TILE-02: %[[sBj:.]] = memref.subview %{{.}}[0, %[[J]]] [%[[K]], %[[szN]]] [1, 1] : memref<?x?xf32, #[[$strided2D]]> to memref<?x?xf32, #[[$strided2D]]>
// TILE-02: %[[M:.]] = memref.dim %{{.}}, %c0 : memref<?x?xf32, #[[$strided2D]]>		// TILE-02: %[[M:.]] = memref.dim %{{.}}, %c0 : memref<?x?xf32, #[[$strided2D]]>
// TILE-02: %[[localK:.]] = memref.dim %{{.}}, %c1		// TILE-02: %[[szK:.*]] = affine.min #[[$bound_map]](%[[J]])[%[[N]]]
// TILE-02: %[[szK:.*]] = affine.min #[[$bound_map]](%[[J]])[%[[localK]]]
// TILE-02: %[[sCj:.]] = memref.subview %{{.}}[0, %[[J]]] [%[[M]], %[[szK]]] [1, 1] : memref<?x?xf32, #[[$strided2D]]> to memref<?x?xf32, #[[$strided2D]]>		// TILE-02: %[[sCj:.]] = memref.subview %{{.}}[0, %[[J]]] [%[[M]], %[[szK]]] [1, 1] : memref<?x?xf32, #[[$strided2D]]> to memref<?x?xf32, #[[$strided2D]]>
// TILE-02: linalg.matmul ins(%{{.}}, %[[sBj]]{{.}} outs(%[[sCj]]		// TILE-02: linalg.matmul ins(%{{.}}, %[[sBj]]{{.}} outs(%[[sCj]]

// TILE-002-LABEL: func @matmul(		// TILE-002-LABEL: func @matmul(
// TILE-002-DAG: %[[C0:.*]] = constant 0 : index		// TILE-002-DAG: %[[C0:.*]] = constant 0 : index
// TILE-002-DAG: %[[C2:.*]] = constant 2 : index		// TILE-002-DAG: %[[C2:.*]] = constant 2 : index
// TILE-002: %[[ubK:.]] = memref.dim %{{.}}, %c1 : memref<?x?xf32, #[[$strided2D]]>		// TILE-002: %[[ubK:.]] = memref.dim %{{.}}, %c1 : memref<?x?xf32, #[[$strided2D]]>
// TILE-002: scf.for %[[K:.]] = %{{.}}{{.}} to %[[ubK]] step %{{.}} {		// TILE-002: scf.for %[[K:.]] = %{{.}}{{.}} to %[[ubK]] step %{{.}} {
// TILE-002: %[[M:.]] = memref.dim %{{.}}, %c0 : memref<?x?xf32, #[[$strided2D]]>		// TILE-002: %[[M:.]] = memref.dim %{{.}}, %c0 : memref<?x?xf32, #[[$strided2D]]>
// TILE-002: %[[localK:.]] = memref.dim %{{.}}, %c1		// TILE-002: %[[szK:.*]] = affine.min #[[$bound_map]](%[[K]])[%[[ubK]]]
// TILE-002: %[[szK:.*]] = affine.min #[[$bound_map]](%[[K]])[%[[localK]]]
// TILE-002: %[[sAj:.]] = memref.subview %{{.}}[0, %[[K]]] [%[[M]], %[[szK]]] [1, 1] : memref<?x?xf32, #[[$strided2D]]> to memref<?x?xf32, #[[$strided2D]]>		// TILE-002: %[[sAj:.]] = memref.subview %{{.}}[0, %[[K]]] [%[[M]], %[[szK]]] [1, 1] : memref<?x?xf32, #[[$strided2D]]> to memref<?x?xf32, #[[$strided2D]]>
// TILE-002: %[[localK:.]] = memref.dim %{{.}}, %c0		// TILE-002: %[[szK:.*]] = affine.min #[[$bound_map]](%[[K]])[%[[ubK]]]
// TILE-002: %[[szK:.*]] = affine.min #[[$bound_map]](%[[K]])[%[[localK]]]
// TILE-002: %[[N:.]] = memref.dim %{{.}}, %c1 : memref<?x?xf32, #[[$strided2D]]>		// TILE-002: %[[N:.]] = memref.dim %{{.}}, %c1 : memref<?x?xf32, #[[$strided2D]]>
// TILE-002: %[[sBj:.]] = memref.subview %{{.}}[%[[K]], 0] [%[[szK]], %[[N]]] [1, 1] : memref<?x?xf32, #[[$strided2D]]> to memref<?x?xf32, #[[$strided2D]]>		// TILE-002: %[[sBj:.]] = memref.subview %{{.}}[%[[K]], 0] [%[[szK]], %[[N]]] [1, 1] : memref<?x?xf32, #[[$strided2D]]> to memref<?x?xf32, #[[$strided2D]]>
// TILE-002: linalg.matmul ins(%[[sAj]], %[[sBj]]{{.}} outs(%{{.}}		// TILE-002: linalg.matmul ins(%[[sAj]], %[[sBj]]{{.}} outs(%{{.}}

// TILE-234-LABEL: func @matmul(		// TILE-234-LABEL: func @matmul(
// TILE-234-DAG: %[[C0:.*]] = constant 0 : index		// TILE-234-DAG: %[[C0:.*]] = constant 0 : index
// TILE-234-DAG: %[[C2:.*]] = constant 2 : index		// TILE-234-DAG: %[[C2:.*]] = constant 2 : index
// TILE-234-DAG: %[[C3:.*]] = constant 3 : index		// TILE-234-DAG: %[[C3:.*]] = constant 3 : index
// TILE-234-DAG: %[[C4:.*]] = constant 4 : index		// TILE-234-DAG: %[[C4:.*]] = constant 4 : index
// TILE-234: %[[ubM:.]] = memref.dim %{{.}}, %c0 : memref<?x?xf32, #[[$strided2D]]>		// TILE-234: %[[ubM:.]] = memref.dim %{{.}}, %c0 : memref<?x?xf32, #[[$strided2D]]>
// TILE-234: %[[ubK:.]] = memref.dim %{{.}}, %c1 : memref<?x?xf32, #[[$strided2D]]>		// TILE-234: %[[ubK:.]] = memref.dim %{{.}}, %c1 : memref<?x?xf32, #[[$strided2D]]>
// TILE-234: %[[ubN:.]] = memref.dim %{{.}}, %c1 : memref<?x?xf32, #[[$strided2D]]>		// TILE-234: %[[ubN:.]] = memref.dim %{{.}}, %c1 : memref<?x?xf32, #[[$strided2D]]>
// TILE-234: scf.for %[[I:.]] = %{{.}}{{.}} to %[[ubM]] step %{{.}} {		// TILE-234: scf.for %[[I:.]] = %{{.}}{{.}} to %[[ubM]] step %{{.}} {
// TILE-234: scf.for %[[J:.]] = %{{.}}{{.}} to %[[ubN]] step %{{.}} {		// TILE-234: scf.for %[[J:.]] = %{{.}}{{.}} to %[[ubN]] step %{{.}} {
// TILE-234: scf.for %[[K:.]] = %{{.}}{{.}} to %[[ubK]] step %{{.}} {		// TILE-234: scf.for %[[K:.]] = %{{.}}{{.}} to %[[ubK]] step %{{.}} {
// TILE-234: %[[localM:.]] = memref.dim %{{.}}, %c0		// TILE-234: %[[szM:.*]] = affine.min #[[$bound_map_2]](%[[I]])[%[[ubM]]]
// TILE-234: %[[szM:.*]] = affine.min #[[$bound_map_2]](%[[I]])[%[[localM]]]		// TILE-234: %[[szK:.*]] = affine.min #[[$bound_map_4]](%[[K]])[%[[ubK]]]
// TILE-234: %[[localK:.]] = memref.dim %{{.}}, %c1
// TILE-234: %[[szK:.*]] = affine.min #[[$bound_map_4]](%[[K]])[%[[localK]]]
// TILE-234: %[[sAik:.]] = memref.subview %{{.}}[%[[I]], %[[K]]] [%[[szM]], %[[szK]]] [1, 1] : memref<?x?xf32, #[[$strided2D]]> to memref<?x?xf32, #[[$strided2D]]>		// TILE-234: %[[sAik:.]] = memref.subview %{{.}}[%[[I]], %[[K]]] [%[[szM]], %[[szK]]] [1, 1] : memref<?x?xf32, #[[$strided2D]]> to memref<?x?xf32, #[[$strided2D]]>
// TILE-234: %[[localK:.]] = memref.dim %{{.}}, %c0		// TILE-234: %[[szK:.*]] = affine.min #[[$bound_map_4]](%[[K]])[%[[ubK]]]
// TILE-234: %[[szK:.*]] = affine.min #[[$bound_map_4]](%[[K]])[%[[localK]]]		// TILE-234: %[[szN:.*]] = affine.min #[[$bound_map_3]](%[[J]])[%[[ubN]]]
// TILE-234: %[[localN:.]] = memref.dim %{{.}}, %c1
// TILE-234: %[[szN:.*]] = affine.min #[[$bound_map_3]](%[[J]])[%[[localN]]]
// TILE-234: %[[sBkj:.]] = memref.subview %{{.}}[%[[K]], %[[J]]] [%[[szK]], %[[szN]]] [1, 1] : memref<?x?xf32, #[[$strided2D]]> to memref<?x?xf32, #[[$strided2D]]>		// TILE-234: %[[sBkj:.]] = memref.subview %{{.}}[%[[K]], %[[J]]] [%[[szK]], %[[szN]]] [1, 1] : memref<?x?xf32, #[[$strided2D]]> to memref<?x?xf32, #[[$strided2D]]>
// TILE-234: %[[localM:.]] = memref.dim %{{.}}, %c0		// TILE-234: %[[szM:.*]] = affine.min #[[$bound_map_2]](%[[I]])[%[[ubM]]]
// TILE-234: %[[szM:.*]] = affine.min #[[$bound_map_2]](%[[I]])[%[[localM]]]		// TILE-234: %[[szN:.*]] = affine.min #[[$bound_map_3]](%[[J]])[%[[ubN]]]
// TILE-234: %[[localN:.]] = memref.dim %{{.}}, %c1
// TILE-234: %[[szN:.*]] = affine.min #[[$bound_map_3]](%[[J]])[%[[localN]]]
// TILE-234: %[[sCij:.]] = memref.subview %{{.}}[%[[I]], %[[J]]] [%[[szM]], %[[szN]]] [1, 1] : memref<?x?xf32, #[[$strided2D]]> to memref<?x?xf32, #[[$strided2D]]>		// TILE-234: %[[sCij:.]] = memref.subview %{{.}}[%[[I]], %[[J]]] [%[[szM]], %[[szN]]] [1, 1] : memref<?x?xf32, #[[$strided2D]]> to memref<?x?xf32, #[[$strided2D]]>
//		//
// TILE-234: linalg.matmul ins(%[[sAik]], %[[sBkj]]{{.*}} outs(%[[sCij]]		// TILE-234: linalg.matmul ins(%[[sAik]], %[[sBkj]]{{.*}} outs(%[[sCij]]

// When the buffer shapes are known at compile time, it is possible to avoid		// When the buffer shapes are known at compile time, it is possible to avoid
// the "min" in subview size computation. This test uses buffer sizes divisible		// the "min" in subview size computation. This test uses buffer sizes divisible
// by respective tile sizes (M=10 divisble by 2, N=12 divisible by 2 and 3,		// by respective tile sizes (M=10 divisble by 2, N=12 divisible by 2 and 3,
// K=16 divisble by 2 and 4).		// K=16 divisble by 2 and 4).
▲ Show 20 Lines • Show All 63 Lines • ▼ Show 20 Lines
// TILE-2-LABEL: func @matvec(		// TILE-2-LABEL: func @matvec(
// TILE-2-SAME: %[[ARG0:[0-9a-zA-Z]*]]: memref		// TILE-2-SAME: %[[ARG0:[0-9a-zA-Z]*]]: memref
// TILE-2-SAME: %[[ARG1:[0-9a-zA-Z]*]]: memref		// TILE-2-SAME: %[[ARG1:[0-9a-zA-Z]*]]: memref
// TILE-2-SAME: %[[ARG2:[0-9a-zA-Z]*]]: memref		// TILE-2-SAME: %[[ARG2:[0-9a-zA-Z]*]]: memref
// TILE-2-DAG: %[[C0:.*]] = constant 0 : index		// TILE-2-DAG: %[[C0:.*]] = constant 0 : index
// TILE-2-DAG: %[[C2:.*]] = constant 2 : index		// TILE-2-DAG: %[[C2:.*]] = constant 2 : index
// TILE-2: %[[M:.]] = memref.dim %{{.}}, %c0 : memref<?x?xf32, #[[$strided2D]]>		// TILE-2: %[[M:.]] = memref.dim %{{.}}, %c0 : memref<?x?xf32, #[[$strided2D]]>
// TILE-2: scf.for %[[I:.]] = %{{.}}{{.}} to %[[M]] step %{{.}} {		// TILE-2: scf.for %[[I:.]] = %{{.}}{{.}} to %[[M]] step %{{.}} {
// TILE-2: %[[localM:.*]] = memref.dim %[[ARG0]], %c0		// TILE-2: %[[szM:.*]] = affine.min #[[$bound_map]](%[[I]])[%[[M]]]
// TILE-2: %[[szM:.*]] = affine.min #[[$bound_map]](%[[I]])[%[[localM]]]
// TILE-2: %[[N:.]] = memref.dim %{{.}}, %c1 : memref<?x?xf32, #[[$strided2D]]>		// TILE-2: %[[N:.]] = memref.dim %{{.}}, %c1 : memref<?x?xf32, #[[$strided2D]]>
// TILE-2: %[[sAi:.]] = memref.subview %{{.}}[%[[I]], 0] [%[[szM]], %[[N]]] [1, 1] : memref<?x?xf32, #[[$strided2D]]> to memref<?x?xf32, #[[$strided2D]]>		// TILE-2: %[[sAi:.]] = memref.subview %{{.}}[%[[I]], 0] [%[[szM]], %[[N]]] [1, 1] : memref<?x?xf32, #[[$strided2D]]> to memref<?x?xf32, #[[$strided2D]]>
// TILE-2: %[[localN:.]] = memref.dim %{{.}}, %c0		// TILE-2: %[[szN:.*]] = affine.min #[[$bound_map]](%[[I]])[%[[M]]]
// TILE-2: %[[szN:.*]] = affine.min #[[$bound_map]](%[[I]])[%[[localN]]]
// TILE-2: %[[sCi:.]] = memref.subview %{{.}}[%[[I]]] [%[[szN]]] [1] : memref<?xf32, #[[$strided1D]]> to memref<?xf32, #[[$strided1D]]>		// TILE-2: %[[sCi:.]] = memref.subview %{{.}}[%[[I]]] [%[[szN]]] [1] : memref<?xf32, #[[$strided1D]]> to memref<?xf32, #[[$strided1D]]>
// TILE-2: linalg.matvec ins(%[[sAi]], %{{.*}} outs(%[[sCi]]		// TILE-2: linalg.matvec ins(%[[sAi]], %{{.*}} outs(%[[sCi]]

// TILE-02-LABEL: func @matvec(		// TILE-02-LABEL: func @matvec(
// TILE-02-SAME: %[[ARG0:[0-9a-zA-Z]*]]: memref		// TILE-02-SAME: %[[ARG0:[0-9a-zA-Z]*]]: memref
// TILE-02-SAME: %[[ARG1:[0-9a-zA-Z]*]]: memref		// TILE-02-SAME: %[[ARG1:[0-9a-zA-Z]*]]: memref
// TILE-02-SAME: %[[ARG2:[0-9a-zA-Z]*]]: memref		// TILE-02-SAME: %[[ARG2:[0-9a-zA-Z]*]]: memref
// TILE-02-DAG: %[[C0:.*]] = constant 0 : index		// TILE-02-DAG: %[[C0:.*]] = constant 0 : index
// TILE-02-DAG: %[[C2:.*]] = constant 2 : index		// TILE-02-DAG: %[[C2:.*]] = constant 2 : index
// TILE-02: %[[K:.]] = memref.dim %{{.}}, %c1 : memref<?x?xf32, #[[$strided2D]]>		// TILE-02: %[[K:.]] = memref.dim %{{.}}, %c1 : memref<?x?xf32, #[[$strided2D]]>
// TILE-02: scf.for %[[J:.]] = %{{.}}{{.}} to %[[K]] step %{{.}} {		// TILE-02: scf.for %[[J:.]] = %{{.}}{{.}} to %[[K]] step %{{.}} {
// TILE-02: %[[M:.]] = memref.dim %{{.}}, %c0 : memref<?x?xf32, #[[$strided2D]]>		// TILE-02: %[[M:.]] = memref.dim %{{.}}, %c0 : memref<?x?xf32, #[[$strided2D]]>
// TILE-02: %[[localN:.]] = memref.dim %{{.}}, %c1		// TILE-02: %[[szN:.*]] = affine.min #[[$bound_map]](%[[J]])[%[[K]]]
// TILE-02: %[[szN:.*]] = affine.min #[[$bound_map]](%[[J]])[%[[localN]]]
// TILE-02: %[[sAj:.]] = memref.subview %{{.}}[0, %[[J]]] [%[[M]], %[[szN]]] [1, 1] : memref<?x?xf32, #[[$strided2D]]> to memref<?x?xf32, #[[$strided2D]]>		// TILE-02: %[[sAj:.]] = memref.subview %{{.}}[0, %[[J]]] [%[[M]], %[[szN]]] [1, 1] : memref<?x?xf32, #[[$strided2D]]> to memref<?x?xf32, #[[$strided2D]]>
// TILE-02: %[[localN:.]] = memref.dim %{{.}}, %c0		// TILE-02: %[[szN:.*]] = affine.min #[[$bound_map]](%[[J]])[%[[K]]]
// TILE-02: %[[szN:.*]] = affine.min #[[$bound_map]](%[[J]])[%[[localN]]]
// TILE-02: %[[sBj:.]] = memref.subview %{{.}}[%[[J]]] [%[[szN]]] [1] : memref<?xf32, #[[$strided1D]]> to memref<?xf32, #[[$strided1D]]>		// TILE-02: %[[sBj:.]] = memref.subview %{{.}}[%[[J]]] [%[[szN]]] [1] : memref<?xf32, #[[$strided1D]]> to memref<?xf32, #[[$strided1D]]>
// TILE-02: linalg.matvec ins(%[[sAj]], %[[sBj]]{{.}} outs(%{{.}}		// TILE-02: linalg.matvec ins(%[[sAj]], %[[sBj]]{{.}} outs(%{{.}}

// TILE-002-LABEL: func @matvec(		// TILE-002-LABEL: func @matvec(
// TILE-002-SAME: %[[ARG0:[0-9a-zA-Z]*]]: memref		// TILE-002-SAME: %[[ARG0:[0-9a-zA-Z]*]]: memref
// TILE-002-SAME: %[[ARG1:[0-9a-zA-Z]*]]: memref		// TILE-002-SAME: %[[ARG1:[0-9a-zA-Z]*]]: memref
// TILE-002-SAME: %[[ARG2:[0-9a-zA-Z]*]]: memref		// TILE-002-SAME: %[[ARG2:[0-9a-zA-Z]*]]: memref
// TILE-002-NOT: scf.for		// TILE-002-NOT: scf.for

// TILE-234-LABEL: func @matvec(		// TILE-234-LABEL: func @matvec(
// TILE-234-SAME: %[[ARG0:[0-9a-zA-Z]*]]: memref		// TILE-234-SAME: %[[ARG0:[0-9a-zA-Z]*]]: memref
// TILE-234-SAME: %[[ARG1:[0-9a-zA-Z]*]]: memref		// TILE-234-SAME: %[[ARG1:[0-9a-zA-Z]*]]: memref
// TILE-234-SAME: %[[ARG2:[0-9a-zA-Z]*]]: memref		// TILE-234-SAME: %[[ARG2:[0-9a-zA-Z]*]]: memref
// TILE-234-DAG: %[[C0:.*]] = constant 0 : index		// TILE-234-DAG: %[[C0:.*]] = constant 0 : index
// TILE-234-DAG: %[[C2:.*]] = constant 2 : index		// TILE-234-DAG: %[[C2:.*]] = constant 2 : index
// TILE-234-DAG: %[[C3:.*]] = constant 3 : index		// TILE-234-DAG: %[[C3:.*]] = constant 3 : index
// TILE-234: %[[M:.]] = memref.dim %{{.}}, %c0 : memref<?x?xf32, #[[$strided2D]]>		// TILE-234: %[[M:.]] = memref.dim %{{.}}, %c0 : memref<?x?xf32, #[[$strided2D]]>
// TILE-234: %[[K:.]] = memref.dim %{{.}}, %c1 : memref<?x?xf32, #[[$strided2D]]>		// TILE-234: %[[K:.]] = memref.dim %{{.}}, %c1 : memref<?x?xf32, #[[$strided2D]]>
// TILE-234: scf.for %[[I:.]] = %{{.}}{{.}} to %[[M]] step %{{.}} {		// TILE-234: scf.for %[[I:.]] = %{{.}}{{.}} to %[[M]] step %{{.}} {
// TILE-234: scf.for %[[J:.]] = %{{.}}{{.}} to %[[K]] step %{{.}} {		// TILE-234: scf.for %[[J:.]] = %{{.}}{{.}} to %[[K]] step %{{.}} {
// TILE-234: %[[localM:.]] = memref.dim %{{.}}, %c0		// TILE-234: %[[szM:.*]] = affine.min #[[$bound_map_2]](%[[I]])[%[[M]]]
// TILE-234: %[[szM:.*]] = affine.min #[[$bound_map_2]](%[[I]])[%[[localM]]]		// TILE-234: %[[szN:.*]] = affine.min #[[$bound_map_3]](%[[J]])[%[[K]]]
// TILE-234: %[[localN:.]] = memref.dim %{{.}}, %c1
// TILE-234: %[[szN:.*]] = affine.min #[[$bound_map_3]](%[[J]])[%[[localN]]]
// TILE-234: %[[sAij:.]] = memref.subview %{{.}}[%[[I]], %[[J]]] [%[[szM]], %[[szN]]] [1, 1] : memref<?x?xf32, #[[$strided2D]]> to memref<?x?xf32, #[[$strided2D]]>		// TILE-234: %[[sAij:.]] = memref.subview %{{.}}[%[[I]], %[[J]]] [%[[szM]], %[[szN]]] [1, 1] : memref<?x?xf32, #[[$strided2D]]> to memref<?x?xf32, #[[$strided2D]]>
// TILE-234: %[[localN:.]] = memref.dim %{{.}}, %c0		// TILE-234: %[[szN:.*]] = affine.min #[[$bound_map_3]](%[[J]])[%[[K]]]
// TILE-234: %[[szN:.*]] = affine.min #[[$bound_map_3]](%[[J]])[%[[localN]]]
// TILE-234: %[[sBj:.]] = memref.subview %{{.}}[%[[J]]] [%[[szN]]] [1] : memref<?xf32, #[[$strided1D]]> to memref<?xf32, #[[$strided1D]]>		// TILE-234: %[[sBj:.]] = memref.subview %{{.}}[%[[J]]] [%[[szN]]] [1] : memref<?xf32, #[[$strided1D]]> to memref<?xf32, #[[$strided1D]]>
// TILE-234: %[[localM:.]] = memref.dim %{{.}}, %c0		// TILE-234: %[[szM:.*]] = affine.min #[[$bound_map_2]](%[[I]])[%[[M]]]
// TILE-234: %[[szM:.*]] = affine.min #[[$bound_map_2]](%[[I]])[%[[localM]]]
// TILE-234: %[[sCi:.]] = memref.subview %{{.}}[%[[I]]] [%[[szM]]] [1] : memref<?xf32, #[[$strided1D]]> to memref<?xf32, #[[$strided1D]]>		// TILE-234: %[[sCi:.]] = memref.subview %{{.}}[%[[I]]] [%[[szM]]] [1] : memref<?xf32, #[[$strided1D]]> to memref<?xf32, #[[$strided1D]]>
//		//
// TILE-234: linalg.matvec ins(%[[sAij]], %[[sBj]]{{.*}} outs(%[[sCi]]		// TILE-234: linalg.matvec ins(%[[sAij]], %[[sBj]]{{.*}} outs(%[[sCi]]

func @dot(%arg0: memref<?xf32, offset: ?, strides: [1]>, %arg1: memref<?xf32, offset: ?, strides: [1]>, %arg2: memref<f32>) {		func @dot(%arg0: memref<?xf32, offset: ?, strides: [1]>, %arg1: memref<?xf32, offset: ?, strides: [1]>, %arg2: memref<f32>) {
linalg.dot		linalg.dot
ins(%arg0, %arg1: memref<?xf32, offset: ?, strides: [1]>, memref<?xf32, offset: ?, strides: [1]>)		ins(%arg0, %arg1: memref<?xf32, offset: ?, strides: [1]>, memref<?xf32, offset: ?, strides: [1]>)
outs(%arg2: memref<f32>)		outs(%arg2: memref<f32>)
return		return
}		}
// TILE-2-LABEL: func @dot(		// TILE-2-LABEL: func @dot(
// TILE-2-DAG: %[[C0:.*]] = constant 0 : index		// TILE-2-DAG: %[[C0:.*]] = constant 0 : index
// TILE-2-DAG: %[[C2:.*]] = constant 2 : index		// TILE-2-DAG: %[[C2:.*]] = constant 2 : index
// TILE-2: %[[M:.]] = memref.dim %{{.}}, %c0 : memref<?xf32, #[[$strided1D]]>		// TILE-2: %[[M:.]] = memref.dim %{{.}}, %c0 : memref<?xf32, #[[$strided1D]]>
// TILE-2: scf.for %[[I:.]] = %{{.}}{{.}} to %[[M]] step %{{.}} {		// TILE-2: scf.for %[[I:.]] = %{{.}}{{.}} to %[[M]] step %{{.}} {
// TILE-2: %[[localM:.]] = memref.dim %{{.}}, %c0		// TILE-2: %[[szM:.*]] = affine.min #[[$bound_map]](%[[I]])[%[[M]]]
// TILE-2: %[[szM:.*]] = affine.min #[[$bound_map]](%[[I]])[%[[localM]]]
// TILE-2: %[[sAi:.]] = memref.subview %{{.}}[%[[I]]] [%[[szM]]] [1] : memref<?xf32, #[[$strided1D]]> to memref<?xf32, #[[$strided1D]]>		// TILE-2: %[[sAi:.]] = memref.subview %{{.}}[%[[I]]] [%[[szM]]] [1] : memref<?xf32, #[[$strided1D]]> to memref<?xf32, #[[$strided1D]]>
// TILE-2: %[[localM:.]] = memref.dim %{{.}}, %c0		// TILE-2: %[[szM:.*]] = affine.min #[[$bound_map]](%[[I]])[%[[M]]]
// TILE-2: %[[szM:.*]] = affine.min #[[$bound_map]](%[[I]])[%[[localM]]]
// TILE-2: %[[sBi:.]] = memref.subview %{{.}}[%[[I]]] [%[[szM]]] [1] : memref<?xf32, #[[$strided1D]]> to memref<?xf32, #[[$strided1D]]>		// TILE-2: %[[sBi:.]] = memref.subview %{{.}}[%[[I]]] [%[[szM]]] [1] : memref<?xf32, #[[$strided1D]]> to memref<?xf32, #[[$strided1D]]>
// TILE-2: linalg.dot ins(%[[sAi]], %[[sBi]]{{.*}} outs(		// TILE-2: linalg.dot ins(%[[sAi]], %[[sBi]]{{.*}} outs(

// TILE-02-LABEL: func @dot(		// TILE-02-LABEL: func @dot(
// TILE-02-NOT: scf.for		// TILE-02-NOT: scf.for

// TILE-002-LABEL: func @dot(		// TILE-002-LABEL: func @dot(
// TILE-002-NOT: scf.for		// TILE-002-NOT: scf.for

// TILE-234-LABEL: func @dot(		// TILE-234-LABEL: func @dot(
// TILE-234-DAG: %[[C0:.*]] = constant 0 : index		// TILE-234-DAG: %[[C0:.*]] = constant 0 : index
// TILE-234-DAG: %[[C2:.*]] = constant 2 : index		// TILE-234-DAG: %[[C2:.*]] = constant 2 : index
// TILE-234: %[[ubK:.]] = memref.dim %{{.}}, %c0 : memref<?xf32, #[[$strided1D]]>		// TILE-234: %[[ubK:.]] = memref.dim %{{.}}, %c0 : memref<?xf32, #[[$strided1D]]>
// TILE-234: scf.for %[[I:.]] = %{{.}} to %[[ubK]] step %{{.*}} {		// TILE-234: scf.for %[[I:.]] = %{{.}} to %[[ubK]] step %{{.*}} {
// TILE-234: %[[localM:.]] = memref.dim %{{.}}, %c0		// TILE-234: %[[szM:.*]] = affine.min #[[$bound_map_2]](%[[I]])[%[[ubK]]]
// TILE-234: %[[szM:.*]] = affine.min #[[$bound_map_2]](%[[I]])[%[[localM]]]
// TILE-234: %[[sAi:.]] = memref.subview %{{.}}[%[[I]]] [%[[szM]]] [1] : memref<?xf32, #[[$strided1D]]> to memref<?xf32, #[[$strided1D]]>		// TILE-234: %[[sAi:.]] = memref.subview %{{.}}[%[[I]]] [%[[szM]]] [1] : memref<?xf32, #[[$strided1D]]> to memref<?xf32, #[[$strided1D]]>
// TILE-234: %[[localM:.]] = memref.dim %{{.}}, %c0		// TILE-234: %[[szM:.*]] = affine.min #[[$bound_map_2]](%[[I]])[%[[ubK]]]
// TILE-234: %[[szM:.*]] = affine.min #[[$bound_map_2]](%[[I]])[%[[localM]]]
// TILE-234: %[[sBi:.]] = memref.subview %{{.}}[%[[I]]] [%[[szM]]] [1] : memref<?xf32, #[[$strided1D]]> to memref<?xf32, #[[$strided1D]]>		// TILE-234: %[[sBi:.]] = memref.subview %{{.}}[%[[I]]] [%[[szM]]] [1] : memref<?xf32, #[[$strided1D]]> to memref<?xf32, #[[$strided1D]]>
// TILE-234: linalg.dot ins(%[[sAi]], %[[sBi]]{{.*}} outs(		// TILE-234: linalg.dot ins(%[[sAi]], %[[sBi]]{{.*}} outs(

func @fill_static(%arg0: memref<127x99xf32>, %arg1: f32) {		func @fill_static(%arg0: memref<127x99xf32>, %arg1: f32) {
linalg.fill(%arg1, %arg0) : f32, memref<127x99xf32>		linalg.fill(%arg1, %arg0) : f32, memref<127x99xf32>
return		return
}		}
// TILE-2-LABEL: func @fill_static		// TILE-2-LABEL: func @fill_static
▲ Show 20 Lines • Show All 85 Lines • Show Last 20 Lines

This is an archive of the discontinued LLVM Phabricator instance.

[mlir][linalg] Tiling: Use loop ub in extract_slice size computation if possibleClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 371249

mlir/include/mlir/Dialect/Linalg/Utils/Utils.h

mlir/lib/Dialect/Linalg/Transforms/Fusion.cpp

mlir/lib/Dialect/Linalg/Transforms/Tiling.cpp

mlir/lib/Dialect/Linalg/Utils/Utils.cpp

mlir/test/Dialect/Linalg/fusion-pattern.mlir

mlir/test/Dialect/Linalg/fusion-sequence.mlir

mlir/test/Dialect/Linalg/fusion-tensor-pattern.mlir

mlir/test/Dialect/Linalg/fusion.mlir

mlir/test/Dialect/Linalg/tile-and-fuse-tensors.mlir

mlir/test/Dialect/Linalg/tile-conv-padding.mlir

mlir/test/Dialect/Linalg/tile-conv.mlir

mlir/test/Dialect/Linalg/tile-simple-conv.mlir

mlir/test/Dialect/Linalg/tile.mlir

[mlir][linalg] Tiling: Use loop ub in extract_slice size computation if possible
ClosedPublic